腾讯研究院AI速递 20251125

生成式AI技术进展 - 谷歌发布嵌套学习新机器学习范式，将模型视为一组嵌套的优化问题以减轻灾难性遗忘 [1] - 该方法通过关联记忆、更新频率分层和优化器即记忆模块实现早期层高频刷新、后期层低频整合的新训练框架 [1] - 基于此推出的HOPE模型在语言建模困惑度和常识推理准确率上表现最优，在长上下文任务中展现卓越内存管理能力 [1] OpenAI竞争动态 - OpenAI内部备忘录显示奥特曼承认谷歌近期AI进展可能给公司带来暂时经济阻力 [2] - OpenAI研究员已知晓谷歌开发了超越Gemini 3的模型，奥特曼间接承认开始落后谷歌 [2] - OpenAI或将在未来几个月推出代号"Shallotpeat"的新模型，专门修复预训练过程中的错误以追赶谷歌 [2] AI应用产品更新 - 设计Agent Lovart正式接入Nano Banana Pro，支持一次性处理14张图片元素并生成专业级设计成品和视频 [3] - Lovart推出Touch Edit功能，通过简单点击即可精准修改细节，还支持"编辑元素"功能将图片分层可编辑 [3] - 北大哲学博士刘耕创办Elser.AI，这款AI短剧生成Agent在无宣传情况下积累了20万全球活跃用户 [5] - Elser.AI支持从剧本到分镜到成片的全流程创作，用户可控制角色形象、构图景深、运镜动作等所有细节 [5] 行业标准与交互范式 - MCP社区由OpenAI和Anthropic核心维护者联手推出MCP Apps提案，规范对交互式用户界面的支持 [4] - 该提案引入拼接轨迹图、状态转移场和预先声明的资源技术，使MCP服务器能直接提供可视化操作界面 [4] - MCP Apps基于MCP-UI和OpenAI Apps SDK，已被Postman、Shopify、Hugging Face等公司采用 [4] AI科研突破 - 陶哲轩使用Gemini Deep Think十分钟完成了Erdős 367号问题的证明补全，该问题涉及连续整数结构的乘法数论 [7] - 近期Erdős问题网站上陆续有6个困扰数学界多年的难题通过AI辅助方法得以解决 [7] 跨平台兼容与技术落地 - Google宣布Pixel 10系列正式支持原生AirDrop能力，可直接向iPhone隔空投送照片及文件 [8] - 香港科技大学团队实现全球首个能在真实场景中完成篮球动作的机器人demo，使用宇树G1完成三步上篮等技能 [9] - 该成果基于SkillMimic-V2技术，通过拼接轨迹图、状态转移场等创新在低质量数据条件下训练出复杂交互策略 [9] 行业领袖观点 - DeepMind CEO表示谷歌AI叙事正从"奋力追赶"转变为"处于领先地位"，Gemini 3在"人类终极考试"得分从21.6%飙升至37.5% [10] - 预测通往AGI还需5-10年及一两个重大突破，目前扩展定律仍有效但存在边际效用递减 [10] - 认为种子轮投资可能存在泡沫，但在应用层和前沿科技领域蕴含巨大真实价值 [10]