174名北大学生能否考过AI? 结果很意外
新浪财经·2025-12-28 17:21

在北京大学化学与分子工程学院,期中考前突如其来的一条通知,却让这场考试的气氛变得不同寻常: 考场里迎来的一批"特殊考生"。它们不需要落座,也无需纸笔。它们是GPT、Gemini、DeepSeek……这 些当下世界上最聪明的AI,正在云端与174位北大化学与分子工程学院的大二学生同场竞技。 晶体结构的精细解析、反应机理的深度推演、物化性质的定量计算……这500道题目并非来自网络上随 手可得的公开题库,而是源于对高难度试题和前沿专业文献的深度改编。 为什么要费尽周折重新出题? "因为大模型太会'背书'了。"团队成员解释道。互联网可及的测试题大多已被博闻强识的AI在训练阶段 熟读。而化学,恰恰是一门不能只靠死记硬背的学科。它既有严密的逻辑推演,又充满了对微观世界的 空间想象。"我们非常好奇,大语言模型的一维 next token prediction,能否解决二维、甚至三维空间中 的复杂推理问题。" 要设计一套让AI"没见过"、必须靠硬实力推理的题目,难度极高。然而,这正是北大化院的独特优势所 在。近百名师生——其中不乏奥赛金牌得主——集结起来,决定给AI出一套高门槛、重推理、防作弊 的试卷。 这是一场精心设计的" ...