Workflow
Google AI 今年最大王炸,测试曝光直接复刻 macOS,比GPT-5更值得期待
36氪·2025-10-15 09:29

产品发布与测试状态 - 更强大的Gemini 3 0已在Google AI Studio的测试中提前上线[1] - 目前关于Gemini 3 0的爆料测试均通过Google AI Studio网页端的随机A B测试完成 用户需平均重复查询50次才有可能触发[46][47] - Google AI Studio首页近期进行了更新 添加了API数据统计等功能 被推测是在为Gemini 3 0的正式上线做准备[50] - 根据泄露的内部项目追踪文件 Gemini 3 0的发布日期可能与2025年10月22日的营销里程碑对齐[52] 核心能力表现 - Gemini 3 0在编程能力上展现出显著提升 能根据简单提示词直接生成功能完整的网页版操作系统 如macOS和Windows 且生成的应用可交互[1][6][7] - 在相同的智能体编程任务测试中 Gemini 3 0的表现被指有超越Claude Sonnet 4 5和GPT 5的趋势[3] - Gemini 3 0生成的代码不仅能直接运行 其前端设计也更成熟 摆脱了AI模型中常见的渐变紫风格 审美获得提升[1][9][21] - 该模型具备工具调用能力 即智能体功能 已得到Google AI Studio负责人的确认[3] - 在处理复杂编程任务时 Gemini 3 0的推理速度约为1至2分钟[8] 具体应用案例 - 模型能够生成单一HTML文件的网页视频编辑器 并且可以正常工作[24] - 可生成无限流刷视频的抖音App网页版[24] - 能够生成原创音乐以及带有原创配乐的小游戏[44] - 通过了如生成骑自行车鹈鹕的SVG动画 六指测试 手写文档内容准确提取等多种基准能力测试[25][32][35][37] 行业竞争格局 - 大语言模型在基础能力上仍有提升空间 行业竞争焦点持续集中在编程等核心能力的突破上[1][3][53] - OpenAI凭借庞大的用户基础和ChatGPT收集的海量数据 近期持续推出多项应用以巩固用户群体[53] - Claude在编程领域保持领先地位 并按其计划推进基础模型更新 同时注重安全方面的研究[53] - Google通过此前nano banana在图像编辑领域的成功 为Gemini系列赢得了市场关注 目前正试图在编程等领域实现追赶和超越[53]