国泰海通|计算机:谷歌Gemini 3实现断层式领先,大模型竞争格局加速重构
国泰海通证券研究·2025-11-20 12:46

核心观点 - 谷歌Gemini 3的发布标志着大模型技术进入新一轮跃迁期,在推理、多模态、代码生成等核心能力上实现断层式领先 [1] - 模型创新性地推出生成式UI与智能体平台Antigravity,验证了Scaling Law的持续有效性,将加速AI应用生态成熟 [1][3] 核心能力突破 - 推理能力显著进步,在Humanity's Last Exam中得分从2.5 Pro的21.6%跃升至37.5%(无工具)[1] - 在ARC-AGI-2测试中以31.1%的成绩超越GPT-5.1(17.6%)近一倍,展现出接近人类的抽象推理能力 [1] - 多模态理解方面,在复杂科学图表解析和动态视频理解测试中均创下新高,具备卓越的屏幕理解能力 [1] - 数学推理能力从前代仅能处理基础运算提升至可解决复杂建模与逻辑推演问题 [1] 代码生成与架构创新 - 在LiveCodeBench上取得显著领先优势,在Design Arena的网站、游戏开发等四大赛区均位列第一 [2] - 不仅能够生成功能代码,更具备"审美智能",能自动生成符合现代设计规范的交互界面,催生"生成式UI"新范式 [2] - 采用稀疏MoE的全新设计,支持百万级token上下文长度,在长文档理解和事实回忆测试中表现优异 [2] - API定价处于行业高端,但通过提升token效率和首答准确率,实际任务完成成本增幅有限 [2] 智能体能力与平台发展 - 工具使用能力较前代提升30%,在终端环境测试和长时间跨度的商业模拟中表现卓越 [3] - 成为首个在消费级产品中深度融合通用Agent能力的基础模型,能够自主规划并执行复杂的端到端任务 [3] - 配合全新推出的Antigravity智能体开发平台,开发者可在更高抽象层级进行任务导向编程 [3] - 推动AI从辅助工具升级为"积极合作伙伴",加速AI应用生态成熟 [3]