Workflow
GDPval评估体系
icon
搜索文档
OpenAI 3万亿美元测试,AI首战44个行业人类专家
36氪· 2025-09-26 09:47
AI下半场,AGI已成过去式,ASI正引领新智能革命!OpenAI推出的GDPval评估体系,通过真实工作任务审视大模型潜力,揭示AI如何从实验 室走向3万亿经济战场,助力人类从日常琐事中解放,拥抱创造性未来。 AI下半场真来了! AGI都过时了,现在AI业内讨论的是超级人工智能ASI: AGI能把人类从80%的日常工作中解放出来; 而ASI则全面超越人类智能的系统。 刚刚,在a16z访谈中,OpenAI首席科学家Jakub Pachocki,透露OpenAI的研究路线图的下一步是推理,下一个5年的重点目标是打造自动化研究人员: AI自动发现新想法,自动化研究人员的工作,自动化机器学习研究。 但理解AI潜力最清晰的方式,并不是预测未来,而是看看模型现在已经能做什么。 历史经验告诉我们,从互联网到智能手机,每一项重大技术从诞生到普及都需要十年以上。 OpenAI希望以更透明的方式,展示大模型如何真正服务于现实世界。 因此,他们推出了一项全新的评估体系GDPval,在有据可依的基础上审视AI进步轨迹,而不是凭空臆测。 论文地址:https://cdn.openai.com/pdf/d5eb7428-c4e9-4a ...