Workflow
腾讯元宝AI助手
icon
搜索文档
腾讯研究院AI速递 20251212
腾讯研究院· 2025-12-11 16:25
Meta的战略调整与重大投资 - Meta神秘AI项目“牛油果”(Avocado)发布计划从2025年底推迟至2026年第一季度,其训练使用了Google Gemma、OpenAI gpt-oss和Qwen模型,并可能采取闭源方式 [1] - 在Llama 4发布后效果未达预期,Meta重新思考开源战略,成立MSL超级智能实验室,并以143亿美元引入28岁的AI负责人Alexandr Wang [1] - MSL部门裁员600人,但不涉及核心的TBD Lab团队,同时公司宣布投资270亿美元建设Hyperion数据中心 [1] 大模型应用生态集成 - Adobe将其Photoshop、Express和Acrobat工具集成至ChatGPT,用户可通过文字描述直接使用图片美化、设计信函和编辑PDF等功能,目标面向ChatGPT超8亿的周活跃用户 [2] - 这些集成工具在ChatGPT中可免费使用,但不包含Generative Fill等高级功能,这是OpenAI将更多第三方应用引入ChatGPT的举措之一 [2] - 今年10月首批加入ChatGPT的第三方应用包括Spotify、Zillow和Figma等 [2] AI模型与技术的开源发布 - 智谱发布工业级语音合成系统GLM-TTS,仅用10万小时数据训练便实现“3秒”音色复刻,在字错误率和情感表达上达到开源SOTA水平 [3] - GLM-TTS采用两阶段生成范式,并基于GRPO算法融合了CER、相似度、情感、笑声四维度的正则化奖励机制 [3] - 模型已在Hugging Face和ModelScope开源,用户可通过Z.ai、智谱清言及BigModel平台体验和调用API [3] AI视频与内容创作工具进展 - 商汤Seko 2.0发布多剧集创作功能,支持最高100集连续创作,声称一个人30分钟即可完成一集短剧,实现从剧本到成片全流程自动化 [4] - 该工具核心优势在于保持资产库的主体和场景一致性,并能自动关联前后剧情,其数据采集成本仅为真机遥操方案的10% [4] - 工具集成了Vdiu、海螺、可灵等主流视频大模型,并推出限时活动,商汤自研生图模型限免一周,月高级会员提供65折优惠 [4] AI助手功能拓展 - 腾讯元宝AI助手推出QQ群智能未读消息总结功能,能将群聊记录提炼成结构清晰的总结报告 [5] - 功能具体包括热聊话题归类、精准信息追踪(筛选@提及消息)、群文件整合和原文直达索引 [6] - 元宝已支持添加为QQ好友进行一对一对话,其电脑版、浏览器插件及移动APP均已上线 [6] 太空计算与AI前沿 - 初创公司Starcloud发射的Starcloud-1卫星搭载H100芯片,其算力比以往太空GPU强100倍,并成功在轨运行谷歌Gemma,训练出首个太空大型语言模型 [6] - 该模型基于Karpathy的nanoGPT用莎士比亚语料训练,可用文艺复兴时期语言风格回答问题,并能进行实时情报分析 [6] - Starcloud计划打造5GW的轨道数据中心并配备4公里太阳能板,预计成本仅为地面数据中心的1/10,SpaceX和谷歌等巨头均已布局该领域 [6] 具身智能与数据采集技术 - 灵初智能发布全球首个具身原生人类数据采集方案Psi-SynEngine,包含便携式外骨骼触觉手套数采套装、大规模in the wild数采数据管线等 [7] - 该方案数据获取成本仅为真机遥操方案的10%,定位精度达亚毫米级,可完整采集手部手臂全部自由度和全手触觉信息 [7] - 公司同步发布Psi-SynNet-v0大规模真实世界多模态数据集,覆盖视觉、语言、触觉、动作,已构建上万小时规模并计划明年突破百万小时量级 [7] AI行业趋势与投资观点 - a16z预测到2026年,AI将彻底重塑各行业,Agent-native基础设施将成为必需品,系统核心瓶颈在于多Agent协调能力而非算力存储 [8] - 消费级AI产品重心正从“提高效率”转向“增进连接”,更“懂我内心”的产品比“帮我做事”的产品有更好的用户留存 [8] - AI绝大部分市场机会在传统垂直行业而非硅谷,视频将成为可“进入”的仿真环境,CRM将变成基础设施,Agent将成为交互核心 [8] 中国AI公司的发展与竞争力 - MiniMax创始人闫俊杰强调全模态发展是AGI的必由之路,公司在语言模型、视频、音频赛道均做到全球领先,音频全球第一、视频第二,未来将探索多模态融合 [9] - MiniMax-M2以61总分位居全球大语言模型第五、开源第一,其采用10B激活参数(总参数230B)的MoE架构,算力成本仅为Claude4.5的8%,上线一个多月tokens调用量突破1万亿次 [9] - AI时代核心竞争力是想象力而非技能,中国公司需要本土创新而非“拿来主义”,关键人才均为本土培养,真正的技术天才将在两三年内出现 [10]
腾讯会议推出AI托管功能 元宝助手可替代用户参会记录
凤凰网· 2025-09-11 12:38
产品功能创新 - 腾讯会议推出AI托管功能 通过腾讯元宝AI助手提供智能参会和会议记录服务 [1] - 功能支持自动实时记录会议并输出完整会议纪要 解决多会议并行和紧急事务场景痛点 [1] - 支持同时托管多个会议 突破单一账号无法同时参与多场会议的技术限制 [1] 技术实现路径 - 腾讯元宝承担语音识别 内容理解和文档生成三大核心功能 [2] - 用户可通过元宝进行深度交互 包括询问会议重点和任务分配等内容 [2] - 实现从被动记录到主动服务的功能延伸 [2] 行业发展趋势 - 企业级视频会议产品向智能化转型趋势显著 [2] - 远程办公和混合办公模式普及推动会议效率提升需求 [2] - AI技术深度集成为减少重复性工作提供新解决方案 [2] 应用场景拓展 - 支持商务人士提前设置托管参数 确保会议开场关键信息不遗漏 [1] - 用户可实时切换至AI托管模式处理临时事务 保证会议信息连续记录 [1] - 通过会议列表选择AI托管选项解决时间冲突问题 [1]
腾讯研究院AI速递 20250702
腾讯研究院· 2025-07-01 16:38
中国芯片行业IPO热潮 - 近10家国产GPU企业如摩尔线程、沐曦等进入上市流程 呈现营收增长但持续亏损状态 [1] - 中国AI芯片市场规模预计达3500亿人民币 理论可容纳35家年营收百亿级企业 [1] - 行业面临代工产能受限、生态构建不足等挑战 需在B端AI或C端图形领域寻求差异化竞争 [1] Meta AI战略升级 - 成立"超级智能实验室"整合基础研究、大模型开发和产品团队 由Alexandr Wang领导 [2] - 从OpenAI等挖角11位顶尖人才 华人占比超半数 含GPT-4o和Gemini核心成员 [2] - 计划投入数千亿美元 目标一年内推出超越Llama系列的下一代领先模型 [2] 微软AI编程工具开源 - GitHub Copilot Chat开源 支持Agent编程模式和多步骤任务自动化 [3] - 具备代码补全、自然语言交互功能 开源后迅速获1200颗GitHub星标 [3] - 支持MCP协议扩展第三方集成 用户保留对智能体的控制权 [3] 腾讯元宝AI功能升级 - 新增图文并茂文档总结功能 基于DeepSeek模型智能匹配原文图表 [4][5] - 支持行业报告重点提炼、外文资料翻译解读等场景 可一键导出至腾讯文档 [5] 上交大AI竞赛突破 - ML-Master智能体以29.3%奖牌率登顶OpenAI MLE-bench 达Kaggle特级大师水平 [6] - 采用"探索-推理深度融合"机制 在75个任务中实现93.3%有效提交且计算效率翻倍 [6] 华为与阿里技术开源 - 华为开源Omni-Infer框架 支持昇腾平台 实现PD分离部署和系统级QPM优化 [8] - 阿里开源ThinkSound音频模型 采用三阶思维链架构 精确捕捉视频动态细节 [7] 亚马逊AI业务布局 - AWS AI业务已创收数十亿美元 推理工作负载占比将达80-90% [11] - 建设史上最大AI训练集群Project Rainier 部署性能提升5倍的Tranium Two处理器 [11] 彼得·蒂尔技术观点 - 认为1970年代以来仅数字技术有突破 物理世界进步停滞威胁社会稳定 [12] - 主张在生物科技、核能等领域承担风险 突破过度监管文化 [12] - 指出AI价值在于解决物理世界问题 当前进展可能不足以终结技术停滞 [12]