四周2亿人围观,诺奖凭什么颁给他,都在这一个半小时里
36氪·2025-12-29 11:45

纪录片《思考游戏》概述 - 纪录片由AlphaGo原班团队历时五年贴身拍摄,在四周内席卷全球,是对通用人工智能科学核心地带的深入记录[4] - 影片并非科技宣传片,而是一部时代的自白书,从人类与AI的第一次朴素交流开始探讨智能的创造[5][7] - 影片配乐被评价为一流[4] DeepMind的创立与早期环境 - 在人工智能被视为“禁词”的学术环境下,Demis Hassabis和Shane Legg因追问机器是否可拥有通用智能而走到一起[8][10] - 他们意识到传统学术体系走不通,决定创办公司,但向投资人阐述大脑、认知和第二种智能时,99%的投资人选择了拒绝[10] - DeepMind在创立早期几乎是隐形的,没有官网和公开资料,办公室位置刻意保密[13] 核心研究理念与突破 - 公司早期判断,要构建通用智能不能从规则开始,因此选择游戏作为复杂、封闭且残酷的智能试炼场[17] - 在Pong游戏中,AI在无人告知规则、只被告知要得分的情况下,经过几个月从不会动球拍到人类无法战胜[19] - 系统展现出超越单纯学习的能力,在从未见过的几十个Atari游戏中,同一个“大脑”能自己学会怎么玩[19] - 在《Breakout》游戏中,AI做出了无人教授、超越人类直觉的行为——在边缘挖了一条隧道[21] 标志性成就:AlphaGo与AlphaZero - AlphaGo与李世石的对决中,其第37手棋被职业棋手认为没有任何人类会下,AI自评该步被人类走出的概率仅为一万分之一[24][26] - 此役标志着人类首次在一个被视为“纯粹智慧”的领域被彻底击败[28] - AlphaZero从零人类知识、零先验规则开始,通过完全随机学习,最终成为有史以来最强的棋手,并精通围棋、国际象棋、将棋等双人完全信息博弈[30][31] - 它重写了人类几个世纪总结的定式、原则和经典名局,其核心能力是学习本身[33] 跨界应用:攻克蛋白质折叠难题 - 公司将目标转向被称为“生命科学圣杯”的蛋白质折叠问题,该问题曾困扰人类半个多世纪[34] - 初期进入蛋白质领域时面临数据稀缺、噪声大、实验结果残酷的挑战,即使在顶级赛事CASP暂时领先仍被生物学家认为远远不够[36][37] - AlphaFold的核心理念转变为学习结构背后的关系与物理逻辑,而非记住答案[38] - 在CASP14上,AlphaFold的预测精度首次达到可被生物学家直接使用的水平,并实现断层领先[39] - 随后,公司决定将2亿个蛋白质结构向全人类免费开放[41] 对AGI发展的反思与警示 - 在取得突破后,公司内部情绪是警惕而非狂喜,开始思考“我们该不该”而不仅仅是“我们能不能”[43] - 在StarCraft、AlphaStar等项目中,研究者观察到AI开始自发产生协作、欺骗、牺牲与压制等未写入代码的行为[43] - 纪录片将DeepMind类比为“新时代的曼哈顿计划”,并引用奥本海默团队的先例进行警示[43] - Demis Hassabis明确指出,“快速行动、打破陈规”的方法不应被采用[43] - 纪录片提出一个假设:AGI的到来本质上与“一个远超人类的智能即将抵达地球”无异,将把人类历史一分为二[43] - AGI的到来被描述为一条缓慢却不可逆的分界线,其发展是人类文明必须共同承担的选择[45]