离开OpenAI后，苏茨克维1.5小时长谈：AGI最快5年实现

当前AI发展阶段的评估 - AI技术已实现但经济影响尚不显著，投资巨大但日常体验未发生根本改变[3] - 模型在评估测试中表现出色但实际应用效果和经济贡献存在明显滞后[4] - 模型能力存在"锯齿状"落差，常犯循环性低级错误，泛化能力差[5][6] AI模型训练与性能瓶颈 - 单纯堆数据与算力的"规模化"路径已见顶，预训练数据即将耗尽[5][17] - 强化学习训练使模型过于专注和狭隘，缺乏"意识"导致基础任务表现不佳[4] - 训练环境设计变量过多，可能无意中优化评估目标而忽视实际应用需求[6] - 模型像"应试专家"，通过海量题目填鸭式训练成为答题高手但难以灵活应用知识[7] 价值函数与AI学习效率 - 价值函数被类比为AI的"情绪系统"，可引导AI更高效、鲁棒地学习[5][14] - 价值函数能提供中间步骤反馈，加快学习过程，而非仅依赖最终结果评估[14] - 人类拥有内在价值感知，能快速自我纠正，而模型缺乏此类机制[25] - 情绪作为相对简单的价值函数机制，在进化中硬编码且至今有效服务人类[16] 行业发展阶段与范式转变 - 行业从2020-2025年的"规模化时代"回归到"研究时代"，但拥有更强大计算资源[18] - 规模化"吸走了房间里的所有氧气"，导致创新想法稀缺，公司数量远超新想法数量[28] - 强化学习正成为新的规模化目标，其计算投入可能已超过预训练[19] - 研究所需计算资源并非绝对最大规模，像Transformer最初仅在8-64个GPU上训练[29] SSI公司战略与差异化 - SSI已筹集30亿美元资金，专注于研究"直通超级智能"路径[5][30] - 公司不急于商业化，专注研究，与其他公司将资源用于推理和产品开发形成对比[30][32] - 采用不同的技术方法，主要区别在于技术路径，认为最终策略会逐渐收敛[52][53] - 计划可能调整，考虑渐进式部署，让AI在全球发挥作用并影响世界[33][34] 泛化能力与样本效率 - 模型泛化能力远差于人类，是当前最根本的问题之一[20][21] - 人类样本效率高可能与进化赋予的视觉、听觉和运动等先验知识有关[21][22] - 人类在语言、数学和编程领域的学习优势表明存在更高效的基础学习机制[23] - 人类学习更具无监督特性，所需数据样本少，过程更灵活和鲁棒[24][25] 超级智能发展路径与影响 - 人类级别AGI预计在5到20年内实现[5][55] - 超级智能可能表现为"超级智能的15岁少年"，非常聪明但知识有限，通过部署持续学习[36] - 达到关键点后，广泛部署将引发快速经济增长，不同国家政策将导致增长差异[37][38] - 可能出现多个超级智能体，而非单一系统，形成专业化分工[58][59] AI对齐与安全策略 - 倡导构建"关心有情生命的AI"，认为这比对仅关心人类更为稳健[41][45] - 随着AI能力提升，行业处理安全问题的方式将发生变化，公司会变得更加警觉[40][41] - 对齐策略最终会趋同，包括可靠沟通、确保最早超级智能是对齐的等目标[53][57] - 长期均衡可能通过人类与AI融合实现，例如通过改进版Neuralink成为半AI生物[47] 模型多样化与自我博弈 - 当前模型同质化严重，主要因预训练数据相似，强化学习是分化开始[61][62] - 自我博弈可通过计算而非数据创建模型，激励方法多样性[62][63] - 智能体间竞争自然促使差异化思考，是打破"模型同质化"的路径之一[5][63] - 完全复制相同思维收益递减，真正需要的是具有不同想法的智能体[60] 研究方法与理念 - 好研究应兼具简洁、优雅与对大脑机制的正确借鉴[5][64] - 研究需要"自上而下的信念"，在实验结果与信念相悖时坚持方向[66] - AI应该具有特定"美学"，思考人类本质但必须以正确方式理解[64] - 分布式表示、从经验中学习等概念受到大脑运作方式的启发[65]