Workflow
SAM 3D家族
icon
搜索文档
腾讯研究院AI速递 20251121
腾讯研究院· 2025-11-20 16:02
生成式AI模型重大升级 - OpenAI同日推出GPT-5.1 Pro和GPT-5.1-Codex-Max两大模型,前者主打情商智商双强,后者是首个原生支持“压缩”机制的编码模型 [1] - GPT-5.1-Codex-Max能连续自主工作超24小时处理数百万token,思考token相比前代减少约30%,在SWE-bench Verified上达77.9%高分 [1] - 内部测试显示OpenAI工程师95%每周使用Codex,引入后团队Pull Request数量提升约70% [1] - 谷歌正式推出Gemini 3 Pro Image预览版,这是一款在生成图像前进行内部推理的“推理模型” [2] - Gemini 3 Pro Image支持64K输入token、32K输出token,可输出1K至4K分辨率图像,最多将14张输入图像组合为1张输出 [2] 计算机视觉与3D技术突破 - Meta发布SAM 3D家族包括SAM 3D Objects和SAM 3D Body,可将2D图像分割结果直接转换成3D模型,即使存在遮挡也能重建 [3] - SAM 3支持可提示概念分割功能,在LVIS零样本分割任务中准确率达47.0,超越SOTA 38.5 [3] - SAM 3D Objects采用12亿参数流匹配Transformer,在与人类用户直接对比测试中胜率至少达其他领先模型的5倍 [3] AI应用产品创新 - QQ浏览器电脑端v19.8.5版本将标签智能分组和较真AI功能加入AI+小窗,支持多任务同时处理互不干扰 [4] - 新增网页播客功能,支持AI播客和原生朗读双模式智能切换,15秒精准进退和5档倍速调节 [4] - Second Me产品让每个人在数字世界拥有独立ID和域名的“AI身份证”,可代表用户去表达和交谈的数字分身 [5] - 产品通过AI破冰精准匹配兴趣同好,降低行业社交沟通成本,用户可通过记录功能沉淀碎片化笔记和想法 [5] 智能硬件与可穿戴设备 - Lumia公司推出全球首款智能耳环Lumia 2,重量不到1克比AirPods小五倍,能实时监测头部血流 [7] - 产品新增睡眠、体温、月经周期和身体状态追踪等功能,采用专利SwitchBack技术可与任何耳环搭配使用 [7] - Lumia获得700万美元额外投资和510万美元政府资助,总融资达1720万美元 [7] 行业领袖动向与研究前沿 - 图灵奖得主Yann LeCun宣布在Meta工作12年后离职创业,65岁高龄仍选择推动高级机器智能(AMI)研究 [8] - 新公司目标是推动下一场AI重大革命,让系统理解物理世界、拥有持久记忆、具备推理能力并规划复杂行动序列 [8] 太空计算与AI基础设施竞赛 - 英伟达首次将H100 GPU送入太空,谷歌宣布2027年发射81颗搭载TPU的卫星 [9] - 中国中科天算启动“天算计划”,计划在太阳同步轨道部署万卡级太空超算中心 [9] - 2026年中科天算将实现首个GPU超算节点上天,目标总算力达10 EOPS,通过柔性光伏阵列实现超100MW零碳供能 [9] 市场需求与行业拐点 - 英伟达Q3营收达创纪录570亿美元,数据中心业务同比狂涨66%达512亿美元,并给出650亿美元下季度营收指引 [10] - 全球超算TOP500榜单显示GPU加速计算占比从六年前10%飙升至90% [10] - 英伟达毛利率约70%,预计到2030年全球AI基础设施投资达3-4万亿美元 [10]