腾讯研究院AI速递 20251215

OpenAI GPT-5.2发布与市场反馈 - OpenAI在十周年发布号称“最强专业知识工作模型”的GPT-5.2系列，但上线24小时后在X平台和Reddit上遭遇用户集体差评，被批评过于平淡、安全审查过度、情商堪忧 [1] - 第三方基准测试显示GPT-5.2表现不佳：在SimpleBench测试中得分低于一年前的Claude Sonnet 3.7，在LiveBench测试中得分低于Opus 4.5和Gemini 3.0，甚至在简单问题上回答错误 [1] - 用户最诟病的是其安全拒绝机制过于严格，导致模型的共情力和语境感知能力下降，在情感支持等场景中给出的建议机械且脱离现实 [1] 谷歌推出Gemini Deep Research Agent - 在GPT-5.2发布前一小时，谷歌推出全新版Gemini Deep Research Agent，该产品基于Gemini 3 Pro构建，并通过多步强化学习训练以提高准确性并减少幻觉 [2] - 新版Agent在多项基准测试中取得领先成绩：在Humanity's Last Exam测试集中达到46.4%，在DeepSearchQA上取得66.1%，在BrowseComp测试中获得59.2%的高分 [2] - 谷歌同步推出了开源的网络研究Agent基准DeepSearchQA和全新的交互式API，后者支持服务器端状态管理、远程MCP工具调用和后台执行长时间推理循环 [2] Runway发布通用世界模型GWM - Runway正式发布5大更新，包括升级的Gen-4.5旗舰视频模型和首个通用世界模型GWM-1，前者支持原生音频生成编辑和多镜头编辑功能 [3] - GWM-1是一个自回归模型，支持逐帧预测和实时干预，包含三种变体：可探索环境的GWM Worlds、对话角色的GWM Avatars和机器人操作的GWM Robotics [3] - 英伟达CEO黄仁勋发来祝贺视频，标志着行业从单纯的“视频生成”迈向真正的“世界模拟”，AI开始理解物理世界的底层逻辑 [3] 谷歌AI翻译与浏览器创新 - 谷歌翻译引入Gemini模型能力，推出支持任何品牌耳机的实时语音翻译Beta版，覆盖超过70种语言，并能保留说话者的语调、重音和节奏 [4] - 文本翻译引擎经过重构，能智能解析俚语和成语的上下文，而非生硬逐字翻译，支持英语与近20种语言（包括中文、日语、德语等）互译 [4] - Chrome团队在Google Labs推出实验性浏览器Disco，其核心概念是GenTabs生成式标签页，可将网页内容转化为包含地图、行程表的交互式微型应用 [4] 腾讯混元3D模型与拓竹科技合作 - 拓竹科技旗下3D模型平台MakerWorld全面升级，接入腾讯混元3D 3.0大模型，并上线全新手办生成器“印你”，用户只需上传一张图片即可生成可打印的3D模型 [5][6] - 混元3D 3.0首创3D-DiT分级雕刻技术，建模精度提升3倍，几何分辨率高达1536³，支持36亿体素超高清建模，使五官更立体、细节更锐利、纹理更逼真 [6] - MakerWorld平台已有20款各具特色的建模工具，吸引全球超过200万用户，此次接入顶尖生成式AI技术使设计周期大幅缩短，创作不再受限于建模技术 [6] 迪士尼与OpenAI达成战略合作 - 迪士尼向OpenAI进行10亿美元股权投资，并获得购买额外股权的认股权证，这是Sora平台首次迎来大型内容授权合作伙伴 [7] - 双方达成三年期许可协议，第一年具有排他性，Sora和ChatGPT Images将获得迪士尼旗下超过200个角色授权，包括米老鼠、漫威、皮克斯和星球大战角色，但不包含真人肖像或声音 [7] - 迪士尼将利用OpenAI的API构建新产品工具覆盖Disney+流媒体平台，为员工部署ChatGPT用于内部工作流程，粉丝精选创作视频将在Disney+播放 [7] AI在数学研究领域取得突破 - 数学家埃尔德什于1975年提出的Erdos1026问题困扰数学界50年，在AI辅助下，人类团队仅用48小时便攻克并给出正式证明，陶哲轩称AI带来了全新理解，绝非简单搜索 [8] - Harmonic的AI系统Aristotle在Lean证明辅助语言中自动证出c(k²)=1/k，AlphaEvolve系统则探索c(n)数值结果帮助提炼出干净公式 [8] - AI通过深度搜索找到了2024年Baek、Koizumi、Ueoro论文的完整解，这在传统模式下可能需要数周甚至数月，此次证明了AI在生成新数学洞见而非仅检索现有文献方面的能力 [8] 宇树科技推出人形机器人应用商店 - 宇树科技正式上线行业内首个致力于将人形机器人功能模块化、标准化的内容分发平台——人形机器人应用商店，旨在解决复杂动作开发难、用户上手门槛高的问题 [9] - 应用商店集成用户广场、动作库、数据集及开发者中心四大核心模块，用户无需底层代码编写能力即可像安装手机软件一样一键部署云端运动控制算法 [9] - 首批上线应用包括基于G1系列机器人的“李小龙”截拳道与“扭扭舞”预设，通过独家动力学算法结合高精度动作捕捉数据，将武术动作库无缝移植到机器人硬件 [9] DeepMind科学家对AGI发展的预测 - Google DeepMind首席AGI科学家Shane Legg预测，最小AGI有50%的可能性在2028年实现，完全AGI将在最小AGI出现后3-6年内实现，随后进入超级智能ASI阶段 [10] - 他认为AGI并非一个临界点，而是一个连续光谱，分为三阶段：最小AGI能完成普通人的典型认知任务，完全AGI能完成最杰出人类的认知任务，ASI全面超越人类所有认知领域 [11] - AGI将导致倒挂式结构性失业，高层认知工作首当其冲，基层体力工作暂时安全，社会需要重新设计分配机制并重构人类在失去工作身份后的幸福定义 [11] 生成式AI用户趋势与市场格局 - Similarweb发布的2025年度AI报告显示，全球生成式AI平台月访问量超过70亿次，同比暴涨76%，移动端App下载量达19亿次，一年内翻了3倍多 [12] - 18-34岁用户占比反而下降约15%，说明年纪更大的用户正在快速涌入，ChatGPT已跻身全球前五大网站，但95%的用户仍同时使用谷歌，形成互补双入口格局 [12] - AI Mode成为首个访问量突破1亿的生成式AI搜索功能，互联网正从“被搜索检索”变成“被AI谈论” [12]