AI动态跟踪系列（八）：GPT-5降幻觉、强编码，全面提升大模型实际应用效果

行业投资评级 - 强于大市（维持）[1][3] 核心观点 - GPT-5实现全方位性能提升，包括数学（AIME 2025 without tools 94.6%）、真实世界编码（SWE-bench Verify 74.9%，Aider Polyglot 88%）、多模态理解（MMMU 84.2%）和健康（HealthBench Hard 46.2%）[4][6] - 思考更高效，幻觉显著降低，输出tokens减少50-80%，幻觉率为o3的六分之一[4][11][13] - API定价更具竞争力，GPT-5定价为1.25美元/1M输入tokens、10美元/1M输出tokens，低于同业可比模型[32][33] 模型性能提升 - 编码能力：GPT-5是OpenAI最强大的编码模型，可创建美观且响应迅速的网站、应用程序和游戏[4][17] - 写作能力：更可靠处理结构歧义，保持表达清晰[20] - 健康领域：HealthBench得分显著提升，幻觉率下降[21] 代理编码与智能体任务 - 前端工程：GPT-5在70%的时间更受测试人员青睐[28] - 编码协作：在Cursor、Windsurf等产品中表现更积极主动[29] - 代理任务：在指令遵循（Scale MultiChallenge 69.6%）和工具调用（τ2-bench telecom 96.7%）基准测试中创纪录[30] 投资建议 - 关注AI算法和应用：强烈推荐恒生电子、中科创达、盛视科技等[35] - 关注AI算力：推荐海光信息、龙芯中科、工业富联等[35] - 全球AI大模型竞争白热化，推动AI算力需求持续高景气[35]