产品发布与核心特性 - OpenAI正式推出GPT-5,该模型在智能水平、速度和准确性上均有显著提升,但未达到人工通用智能(AGI)[1] - 公司推出了GPT-5-mini和GPT-5-nano两个变体,分别面向不同用户群体[1] - GPT-5的上下文窗口为256,000个token,相比前代o3模型的200,000个token有所增加,能更好地理解长对话、文档或代码[3] - 公司CEO将GPT-5的改进比作iPhone从像素化到视网膜显示屏的转变,并称其为"首次真正感觉像是与任何主题的专家交谈"[1] 性能与能力提升 - GPT-5在编码基准测试中表现优异,在SWE-Bench Verified得分74.9%,在SWE-Lancer得分55%,在Aider Polyglot得分88%[5] - 模型被评价为出色的编程协作伙伴,擅长执行长链条任务和工具调用,能精准遵循复杂指令[5] - 在健康相关问题上表现优秀,在HealthBench Hard测试中,GPT-5-thinking得分25.5%,相比o3的31.6%有所进步[5][6] - 模型幻觉率显著降低,在关闭网页浏览功能的测试中,GPT-5的虚构率比GPT-4o低26%,GPT-5-thinking较o3的虚构率下降达65%[7] 用户访问与订阅模式 - 免费用户将获得GPT-5和GPT-5-mini的访问权限[2] - 每月20美元的Plus订阅用户使用限制大幅提高[2] - 每月200美元的Pro级别提供无限制的GPT-5访问权限,以及更强大的GPT-5-pro和GPT-5-thinking版本[2] - 从下周开始,Pro用户将能够连接Gmail、谷歌联系人和谷歌日历,其他订阅级别将在未指定日期获得该权限[3] 安全性与稳健性 - 公司已大幅降低GPT-5的欺骗倾向,并采取措施减少其在任务中出现欺骗、投机或取巧的倾向[7] - 对于可能具备双重用途的提示,GPT-5会采用"安全完成"策略,在确保安全的前提下尽可能给出有用回答[7] - 为确保系统稳健性,公司已投入超过5000小时的红队测试,并与外部机构合作验证[7] 市场与用户基础 - ChatGPT的周活跃用户已接近7亿,其中付费企业用户500万,使用API的开发者400万[7]
GPT-5来了!免费用户也能用的“博士级”对话体验
金十数据·2025-08-08 02:42