AI动态跟踪系列(八):GPT-5降幻觉、强编码,全面提升大模型实际应用效果
平安证券·2025-08-13 07:46
行业投资评级 - 强于大市(维持)[1][3] 核心观点 - GPT-5实现全方位性能提升,包括数学(AIME 2025 without tools 94.6%)、真实世界编码(SWE-bench Verify 74.9%,Aider Polyglot 88%)、多模态理解(MMMU 84.2%)和健康(HealthBench Hard 46.2%)[4][6] - 思考更高效,幻觉显著降低,输出tokens减少50-80%,幻觉率为o3的六分之一[4][11][13] - API定价更具竞争力,GPT-5定价为1.25美元/1M输入tokens、10美元/1M输出tokens,低于同业可比模型[32][33] 模型性能提升 - 编码能力:GPT-5是OpenAI最强大的编码模型,可创建美观且响应迅速的网站、应用程序和游戏[4][17] - 写作能力:更可靠处理结构歧义,保持表达清晰[20] - 健康领域:HealthBench得分显著提升,幻觉率下降[21] 代理编码与智能体任务 - 前端工程:GPT-5在70%的时间更受测试人员青睐[28] - 编码协作:在Cursor、Windsurf等产品中表现更积极主动[29] - 代理任务:在指令遵循(Scale MultiChallenge 69.6%)和工具调用(τ2-bench telecom 96.7%)基准测试中创纪录[30] 投资建议 - 关注AI算法和应用:强烈推荐恒生电子、中科创达、盛视科技等[35] - 关注AI算力:推荐海光信息、龙芯中科、工业富联等[35] - 全球AI大模型竞争白热化,推动AI算力需求持续高景气[35]