Workflow
推理(Reasoning)
icon
搜索文档
OpenAI首席研究员Mark Chen长访谈:小扎亲手端汤来公司挖人,气得我们端着汤去了Meta
36氪· 2025-12-04 02:58
公司战略与文化 - 公司本质上仍然是一家纯AI研究公司,核心目标是构建AGI,产品是研究自然流出的结果 [5][21][124] - 公司拥有约500名核心研究人员,内部同时进行约300个项目,通过每1-2个月梳理项目并分配算力来明确优先级 [5][14][15] - 公司采用自上而下押注方向与自下而上文化并存的研究模式,鼓励来自意想不到地方的好点子,并积极放大有前景的研究线索 [79][97] - 公司坚持开放文化,研究人员之间自由分享想法,认为通过速度压制对手比建立信息隔离更有效 [84] - 公司非常重视人才密度,并有意控制研究团队规模,认为甚至可能少于500人,同时通过管理实验确保高门槛 [129][130][131] - 公司在项目署名上持开放态度,被认为是行业内单位人数上对外部署名与个人功劳最大方的地方之一,旨在认可并打造AI超级明星 [133][134][136] 研究重点与进展 - 过去半年,公司研究重心重新聚焦于预训练,认为预训练领域仍有巨大潜力可挖掘,并对此非常有信心 [5][31][88][89] - 公司在“思考”(Reasoning)方向的研究已取得突破,并投入了巨量资源,该能力现已被广泛认为是不可或缺的 [20][86] - 公司内部已有性能达到Gemini 3的模型,并确定很快会发布,且能发布表现更好的下一代模型 [5][27] - 公司认为扩展定律(Scaling Law)并未失效,将继续扩大模型规模,并已有算法突破支持继续扩展 [89][114][116] - 公司设定了明确的研究目标:一年内让AI成为能提高效率的研究实习生;2.5年内实现AI端到端执行研究流程 [112][113] - 公司观察到AI在数学与科学领域产出实打实的新发现,标志着科研前沿推进发生了剧烈的阶段转变 [100][106] 竞争态势与人才争夺 - AI行业人才竞争激烈,Meta等公司采用激进的招聘策略(如高管亲自送汤),但公司在保护核心人才方面做得相当不错 [5][9] - 公司不会与竞争对手进行报价对标,即使面对远高于自身的报价倍数,许多人才仍因相信公司的研究路线和未来而选择留下 [11] - 公司也从竞争对手处学习激进的招聘方法,并积极争取明星人才,目标是为使命组建最强团队 [80] - 面对竞争对手发布新模型(如Gemini 3),公司会建立内部共识并进行试探,但强调不被竞争动态困住,坚持长期可持续的研究方式 [19][27] - 公司对DeepSeek等开源模型的崛起持冷静态度,认为应坚持自己的研究节奏持续创新,而非被外界叙事干扰 [128] 技术细节与算力需求 - 公司在“探索下一代范式”上投入的算力,比训练最终产物本身还要多 [16] - 公司的算力需求极为旺盛,如果今天多10倍算力,可能几周内就能全部用满,看不到需求放缓的迹象 [5][115] - 构建大型模型深度依赖工程能力,如优化内核速度、确保数值计算稳定等,没有这些则无法扩展到当前使用的GPU数量 [24][25] - 公司在数据效率相关算法上非常强,认为这是相对于竞争对手的一个优势 [116] - 公司在模型对齐与安全研究上投入巨大,特别关注随着模型能力增强可能出现的“谋划”(scheming)倾向,并设计了如不监督思考过程等重要工具来保持观察窗口 [137][140] 产品与未来展望 - 公司正在与Jony Ive合作开发硬件设备,旨在重新思考与AI的交互方式,使其具备更强记忆和持续学习能力 [117][118][119] - 未来的ChatGPT应具备更强的记忆和持续学习能力,能根据历史交互变得更聪明,而非每次重新思考 [118] - 公司推动“OpenAI for Science”计划,目标是打造工具与框架赋能全球科学家,加速诺贝尔奖级别的科学发现,而非仅让公司自身获奖 [101][102] - 公司认为AGI是一个过程而非某个具体完成点,更看重是否在持续产出新的科学知识和推进科学前沿 [99][100] - 公司认为当前正处于下一次工业革命的黄金时刻,变化将非常剧烈 [109][126]
还是谷歌懂程序员?Demis 采访首提“氛围编程”,Gemini 3 彻底戒掉“爹味”说教
AI科技大本营· 2025-11-21 10:03
文章核心观点 - 谷歌通过Gemini 3展示了其在AI模型性能与成本效率上的重大突破,标志着公司从防御姿态转向积极进攻[12] - 模型的核心优势体现在极致的推理成本控制、工具化定位以及推理能力等关键技术的显著进步[4][15] - 公司对AGI的实现路径保持清晰认知,认为仍需5-10年并依赖推理、记忆等领域的根本性突破[11][17][22] 模型性能与效率突破 - 通过极致的“蒸馏技术”将顶尖模型的运行成本大幅降低,使其能处理数十亿次日均搜索请求而不破产[4] - 公司在成本与性能的帕累托前沿保持领先,实现了“比我聪明的没我便宜,比我便宜的没我聪明”的竞争优势[5][6] - 模型效率的提升使得其能应用于“AI概览”等极端场景,服务数十亿用户,并为云客户和企业客户带来成本效益[22] 模型能力与交互体验 - 模型在推理能力上表现出色,能够同时思考多个步骤,避免了以往模型思绪断片或跑偏的问题[15] - 提供了全新的生成式界面,能真正给用户提供定制化的设计和答案,是创建新型交互界面方面最强的模型[15] - 模型风格更简洁、切中要点、更具表现力,采用“去人格化”设计,专注于成为高效的信息处理器和逻辑推理机[7][9][10][16] 技术发展方向与AGI路径 - 实现AGI预计仍需5到10年,并且可能需要一两个本质上的研究突破,而非仅靠堆算力和数据[11][17] - 下一阶段AI战争的主战场将围绕推理、记忆以及世界模型这三个关键领域展开[11] - 公司认为当前处于规模化基础模型持续进步的阶段,但要通往AGI仍需研究突破[22] 产品整合与市场战略 - 公司正将AI能力深度整合到现有产品矩阵中,包括地图、YouTube、安卓、搜索等,并以AI为先的视角重新构想这些产品[19] - 新产品如Gemini App、NotebookLM等AI原生产品,旨在让AI成为用户工具箱里的超能力工具,专注于任务完成[18] - 公司关注用户满意度等产品体验指标,并将基准测试的进步转化为有意义的产品体验[23] 行业竞争与市场定位 - AI领域处于极其惨烈的竞争环境,公司关注自身进步速度,并对其进展感到满意[19] - 公司不仅是AI研究的先驱,更致力于将研究成果转化到下游所有产品中,并认为在这场进化中才走到一半[19] - 行业部分领域存在泡沫迹象,但公司同时在投资未来蓝海领域如机器人、游戏、药物研发,并看好其长期潜力[25][26]