腾讯研究院 - 财报，业绩电话会，研报，新闻

腾讯研究院

搜索文档

腾讯研究院AI速递 20250506

腾讯研究院· 2025-05-05 10:05

生成式AI - DeepSeek-Prover-V2推出671B和7B模型，采用递归+强化学习提升数学推理能力，创造多项新纪录 [1] - 采用DeepSeek-V3分解定理+GRPO算法优化，结合冷启动训练实现非形式化与形式化推理统一 [1] - 7B模型在本科级测试表现优异，展现独特基数处理能力 [1] - Anthropic发布Claude整合功能(Integrations)，基于MCP协议实现与Jira等10个热门服务的无缝连接 [1] - Claude新增研究能力，可在5-45分钟内完成复杂调研，支持多数据源查询并标明出处 [1] - 新功能目前在Max、Team和Enterprise计划测试，全球付费用户已可使用Web搜索 [1] AI语音与播客 - Google NotebookLM支持50种语言生成播客，语音地道，擅长模拟京腔等本地口音 [2] - 产品将文本转化为轻松对谈，摆脱AI语音生硬感，由Google产品经理Martin和编辑Johnson主导 [2] - 具备资料溯源功能，可处理2500万字内容，标注引用来源并加入音频水印 [2] 社交与AI整合 - Meta推出独立AI应用对标ChatGPT，可通过用户社交数据实现个性化服务，包含发现信息流功能 [3] - 应用与Meta社交产品矩阵打通，支持语音交互和图像生成，在美加等地区首批开放 [3] - 软件与Meta AI眼镜深度整合，扎克伯格预测未来眼镜将全面智能化，全息影像将取代实体屏幕 [3] AI编程与开发 - 苹果与Anthropic合作开发"氛围编程"软件平台，基于Claude Sonnet模型，用于代码编写和测试 [4] - 该平台为Xcode新版本，目前仅计划内部使用，此前苹果自研AI编程工具因精度不足未发布 [4] - 苹果正构建AI合作网络，此前已与OpenAI合作整合ChatGPT，并考虑引入谷歌Gemini作为备选 [4] 图像生成与一致性 - Midjourney推出Omni-Reference全向参考功能，通过--oref和--ow参数实现人物、物体、场景的超高一致性 [5] - 相比4o和Lora模型，Omni-Reference只需一张参考图即可保持细节迁移和风格统一 [5] - 新功能支持真人写实、动漫风格，还能实现机械体、装置物等复杂物体的多角度一致性呈现 [5] - Runway参考功能支持多角色参考、风格迁移等广泛应用，无需反复调参即可实现角色一致性生成 [5] - Gen-4模型支持类ChatGPT的自然语言提示，能理解复杂语义，可用于黑白照片着色、室内设计等12种创意应用 [5] AI科研与智能体 - FutureHouse推出四个AI科研智能体(Crow、Falcon、Owl、Phoenix)，在文献搜索精度和准确性方面超越GPT-4.5及人类博士 [6] - 这些AI智能体可访问完整科学文献全文，具备信息质量评估能力，能透明展示推理过程，提供API集成 [6] - AI科学家团队已应用于疾病机制研究、文献矛盾梳理、实验方法分析等领域，可显著提升科研效率 [6] AGI与失控风险 - MIT研究显示：即使采用最理想的监督机制，人类成功控制超级智能的概率仅为52%，AI失控风险可能超过90% [6] - 研究提出"康普顿常数"概念，通过四种博弈场景验证了嵌套可扩展监督机制的有效性与局限性 [6] - 随着AI智能水平提升，监督难度增大，Guard获胜概率持续下降，人类最终可能难以控制超级智能AI系统 [6] 具身智能与机器人 - Physical Intelligence创始人强调收集多样化机器人数据的重要性，认为机器人需具备适应不同环境的能力 [7] - 专家低估了运动控制中蕴含的智能，机器人需要从自身物理体验中学习，而不仅仅依靠观察数据 [7] - 未来机器人形态可能呈现"寒武纪大爆发"式的多样化，针对不同场景可能出现专门的机器人设计 [7]