Alphabet-Google and Anthropic Drop AI Prices and Release New Models

产品发布与战略定位 - 谷歌于11月18日推出Gemini 3，标志着其在AI领域方法论的深刻转变，旨在重获行业领导地位[1] - Anthropic在六天后发布Claude Opus 4.5，该模型在公司内部工程评估中表现超越所有人类候选人[3] - 两家公司均通过系统重新设计以提升效率，从而降低了最新模型的运行成本[4] 定价策略与行业经济演变 - Anthropic将Claude Opus 4.5的文本处理成本从每百万token 15美元大幅降低至5美元，降幅达67%[4] - 谷歌为Gemini 3 Pro设定了读取每百万token 2美元和生成每百万token 12美元的定价结构[4] - 此定价策略被描述为前沿模型中最激进的成本定位策略之一，反映了高端AI经济性的快速变化，使得曾经需要昂贵算力的任务如今可在日常规模运行[5] 模型核心能力与技术差异 - Gemini 3专注于多模态智能，能在单一工作流中处理文本、图表、图像、视频和代码，并在测试博士级科学推理的GPQA Diamond基准上获得90%以上的分数[6] - Claude Opus 4.5强化了编码能力、长视野推理和多步骤工作流执行，在SWE-bench Verified基准上得分超过80%，在真实工程任务中表现优于Gemini 3 Pro[7] - Gemini模型擅长跨格式任务及视觉或空间推理，而Opus模型则在结构化逻辑、准确性和多步骤执行方面表现更佳[7][10] 产品集成与应用场景 - Anthropic为Opus 4.5推出了新的产品集成，包括为Excel提供支持的Claude for Excel，可实现数据透视表分析、图表生成和多表格工作流，并推出了可在浏览器标签页间操作信息的Chrome扩展[8] - 谷歌将Gemini 3整合到其更广泛的技术栈中，为搜索中的AI模式、Gemini应用和Vertex AI提供支持，并作为其新的代理驱动开发平台Antigravity的核心[9] - Gemini 3在前端编码方面的优势使其位居WebDev Arena排行榜首位，强化了其在界面驱动任务中的能力范围[9] 生产级执行与复杂任务处理 - 两款模型的发布均指向行业向处理多步骤工作的模型转变，而不仅仅是生成单一响应[11] - Claude Opus 4.5在一次客户服务测试中以意外但有效的方式解决问题，展示了其无需逐步指导即可解读问题并交付解决方案的能力[11] - 谷歌在一个要求模型运营虚拟自动售货机一整年的商业模拟基准中评估Gemini 3，该模型在定价、库存和需求变化方面做出决策，最终获得的净资产是竞争模型的两倍以上[12]