Workflow
OpenAI深夜放出GPT-5狙击谷歌!基准测试碾压前代模型,价格比Claude更便宜
AI前线·2025-08-07 20:24

GPT-5发布核心信息 - OpenAI正式推出GPT-5模型,CEO山姆·奥尔特曼称其为"具备通用智能的模型",是迈向AGI的重要一步,但尚未达到完全通用人工智能水平[3] - 模型特点包括:更智能、更快、更准确、幻觉率降低26%(相比GPT-4o),并经过5000小时安全测试[3][17] - 上下文窗口扩展至256,000 tokens(前代200,000 tokens),显著提升长文本处理能力[10] 产品版本与定价 - 推出三款模型:旗舰版GPT-5、轻量版GPT-5-mini和低成本版GPT-5-nano(仅API)[6] - API定价:GPT-5输入125美元/百万tokens,输出10美元/百万tokens;GPT-5-mini输入0.25美元/百万tokens;GPT-5-nano输入0.05美元/百万tokens[9] - 订阅方案:免费用户可用GPT-5和mini版,Plus用户享更高限额,Pro套餐(200美元/月)提供无限访问和GPT-5-pro版本[8] 技术性能突破 - 编程能力:在SWE-Bench Verified测试得分74.9%,SWE-Lancer(GPT-5-thinking)得分55%,Aider Polyglot得分88%[11] - 健康领域表现:GPT-5-thinking在HealthBench Hard测试得分25.5%(前代31.6%),三项健康基准测试均大幅超越前代[16] - 演示案例:1分钟内生成交互式法语学习网页应用,包含进度跟踪、闪卡和测验功能[14] 商业化与生态整合 - 用户规模:周活跃用户近7亿,付费企业用户500万,API开发者400万[18] - 微软全平台接入:包括Microsoft 365 Copilot、GitHub Copilot和Azure AI Foundry[21] - 新功能:Pro用户可连接Gmail/谷歌日历,聊天界面支持4种预设人格(愤世嫉俗者/机器人/倾听者/书呆子)[9] 行业反响 - Box CEO评价GPT-5为"彻底突破",解决复杂文档理解难题[24] - 用户反馈:社交平台热议模型价格优势(相比Claude Opus 4.1输入15美元/MTok)[29][30] - 开发者关注:智能代理任务执行能力提升,包括长链条任务处理和工具调用优化[13]