Workflow
GPT-5内测抢先公布:日常推理首次击败人类,编程数学科学问题能力都很强
量子位·2025-08-07 04:15

GPT-5性能表现 - 推理能力首次超越人类,在10道逻辑题测试中仅错1题,正确率90%,高于人类平均水平[2][4][5] - 编程、数学及解决科学问题的能力显著提升,被调侃可能取代博士[7][8][30] - 多模态能力飞跃式进步,可直接生成高质量独角兽SVG,效果远超GPT-4[26][28] 技术突破与挑战 - 参数规模比GPT-4大幅增加,但数据缺乏成为主要瓶颈[31][33] - 预训练周期长达数月,因模型规模导致调试难度指数级上升[35] - OpenAI雇佣科学家专门编写优质训练数据以弥补数据缺口[32] 行业竞争动态 - 谷歌和Anthropic在GPT-5预热期间密集发布新模型抢夺热度[36][37] - 谷歌计划推出开源大模型直接对标OpenAI[38] - 创始人Sam Altman通过《星球大战》死星图片隐喻GPT-5将主宰竞争对手[41][42] 发布信息 - OpenAI通过将官网直播链接"livestream"改为"live5tream"暗示GPT-5发布[10] - 发布会定于北京时间8月8日凌晨1点,内测用户反馈性能提升幅度可能不及GPT-3到GPT-4的跨越[30][39]