Workflow
Llama系列
icon
搜索文档
Meta版“甄嬛传”,28岁天才上位,掌管6千亿命脉,AI教父愤然出走
36氪· 2025-12-12 00:44
公司战略与内部冲突 - 公司内部存在严重的战略与理念分歧,以Alexandr Wang为首的TBD Lab团队致力于开发具备“神性”的超级人工智能(ASI),而首席产品官Chris Cox和首席技术官Andrew Bosworth等老将则希望将AI用于优化现有社交媒体推荐算法和广告业务[12][13][16] - 为支持TBD Lab的AI研发野心,公司正在重新配置资源,将部分原投向虚拟现实和元宇宙的预算转投AI硬件,并削减Reality Labs部门明年预算20亿美元以支持Alexandr Wang的团队[7][17] - 公司内部在算力资源分配上存在激烈争论,社交媒体推荐算法团队认为新增算力应优先用于增强现有业务,而非全部用于训练AI模型[18] AI研发模式与文化冲突 - 以Alexandr Wang和Friedman为代表的AI新领导层推崇“速度优先、快速试错”的创业公司式研发模式,这与公司过去“流程驱动”、需要跨部门协调评审的传统文化形成鲜明对比,成为内部摩擦的主要来源[19][23] - 新的开发模式试图绕过公司早年构建的大量内部开发工具和层层反馈流程,认为这些传统流程已对基础大模型的快速研发构成障碍[19][23] - 整个AI组织处于高压模式,加班成为常态,一周70小时工时是普遍现象,团队频繁经历裁员和重组[26] 关键人物与团队动态 - 28岁的“天才少年”Alexandr Wang被寄予厚望,他带领的TBD Lab团队由从OpenAI、谷歌等竞争对手跳槽而来的顶级研究人员组成,团队被物理隔离安置以远离公司官僚程序[7][9] - 公司首席AI科学家、图灵奖得主Yann LeCun因内部冲突及涉及基础人工智能研究部门FAIR的裁员影响,已决定离职并创办新公司[1][26] - AI产品负责人Friedman被要求推出“破圈”产品,但其主导开发的AI短视频内容流“Vibes”被指仓促上线且功能不如竞争对手OpenAI的Sora 2强大[24] 开源策略的潜在转变 - 公司年初在AI开源领域占据领先地位,其最大优势是Llama系列的开源定位,但面临中国开源AI(如DeepSeek)的竞争以及Llama 4表现不及预期的压力[4][6] - 公司创始人扎克伯格对开源的态度发生转变,从强调开放转向表示需“谨慎评估开源风险”,并暗示策略可能调整[6] - 公司最新的AI模型“Avocado”(牛油果)可能将不再遵循开源策略,其模型参数和代码或将对外保密[6] 财务投入与业务重点 - 公司承诺未来三年将在美国基础设施项目上投入6000亿美元,其中大部分将用于AI相关建设[7] - 公司计划通过将AI融入旗下产品(如在Instagram中加入AI聊天角色,在智能眼镜中嵌入AI助手)来实现变现,核心逻辑是延长用户使用时间以提升广告收入[14][15] - 公司首席财务官在投资者会议上表示,2026年的一个重点方向是利用AI模型增强社交媒体算法[18]
Meta闭源转向:巨头的求生与AI行业的范式重构
36氪· 2025-12-11 10:05
Meta的战略转型:从开源到闭源 - 公司核心战略发生根本性转变,从开源先锋转向押注闭源模型Avocado [2] - 此次转型由商业现实驱动,公司每年AI投入超700亿美元,但企业授权收入不足10亿美元,开源模式盈利困难 [2] - 为支持转型,公司进行了一系列激进动作,包括以143亿美元收购Scale AI股权并任命其创始人为首席AI官 [2][5] - 内部伴随剧烈动荡,首席AI科学家杨立昆因理念不合离职,FAIR实验室大规模裁员 [3][6] 闭源模型Avocado的技术与商业路径 - 新模型Avocado计划融合谷歌Gemma、OpenAI gpt-oss与阿里通义千问的技术亮点,采取“博采众长”策略 [2][3] - 模型主打复杂推理与长视频分析,目标对标GPT-5与Gemini 3 Ultra,计划于2026年第一季度发布 [3][9] - 发布后将仅开放API与托管服务,旨在构建“模型-硬件-广告”的商业闭环,预计带动广告收入提升10-15% [8][10] - 为保障算力,公司官宣了270亿美元的Hyperion数据中心计划 [7] 开源模式的商业化困境与行业格局演变 - 尽管Llama系列曾构建全球最繁荣的开源AI生态,下载量超3000万次,但开发者成果多流向竞争对手云平台 [2] - 与闭源模式的商业成功形成强烈反差,例如OpenAI仅凭闭源API服务在2025年就斩获约120亿美元收入 [2] - 行业进入“二元共存”新阶段,开源模型主导学术与中小场景,闭源模型凭借性能与合规抢占企业核心市场 [3] - 市场洗牌加速,头部企业倾向于通过闭源构建护城河,而DeepSeek、Mistral等玩家有望承接Meta留下的开源生态空白 [4] 中美AI巨头战略路径差异 - 美国巨头以闭源为主,商业闭环清晰,如OpenAI的订阅制与企业API,谷歌的闭源API与云服务融合 [11] - 中国玩家采取开源与闭源并行策略,如阿里通义千问采取“开源引流+闭源变现”模式 [11] - 技术路径差异:美国以闭源保护壁垒并推动前沿能力,中国通过开源弥补单点短板并加速行业落地 [11] - 迭代节奏差异:美国以半年或年为单位更新一代,中国则以周或双周为单位进行高频小版本迭代,开源社区驱动更快 [13]
Meta大转向:下一代模型“牛油果”推迟,开源时代或将终结
36氪· 2025-12-11 10:00
核心观点 - Meta公司的人工智能战略正经历全面转向,从强调开源与开放生态转向更具防御性和商业导向的闭源策略,其下一代前沿模型“牛油果”(Avocado)的发布从原计划的2025年底推迟至2026年第一季度,并更倾向以闭源形式推出 [2] 战略与研发调整 - 下一代前沿模型“牛油果”(Avocado)因在训练稳定性与推理泛化方面尚未达到商用层级,发布时间从2025年底推迟至2026年第一季度 [2] - 公司AI战略正从过去两年强调的“开源与开放生态”转向更具防御性和商业导向的策略,内部对“开源是否已完成使命”存在争议 [2][8] - 此次战略调整范围广泛,涉及研发文化、组织架构、硬件规划与资本投入,是继2012年拥抱移动互联网、2020年押注元宇宙后,公司十多年来的第三次战略大迁徙 [12] 组织架构与人员变动 - 随着Llama 4反响平淡,公司AI领导层经历剧烈更替,FAIR与GenAI的主导权被削弱,传统学术导向的研发体系让位于强调产品落地与闭环速度的Meta超级智能实验室(MSL) [6] - 通过143亿美元的交易引入Scale AI创始人汪滔(Alexandr Wang)领导MSL,其带来的“工程先行、商业优先”的闭环管理与高压工作节奏,与公司原有的开放式研究文化产生强烈冲撞 [6] - AI相关团队出现多轮重组与裁撤,FAIR的部分研究方向被缩减,超过600名与基础研究相关的人员被裁撤,直接促使首席AI科学家杨立昆宣布将离职创业 [8] 资本支出与基础设施 - 为支撑闭源模型的算力需求,公司将2025年资本支出上调至700–720亿美元,重点投向训练集群与数据中心扩建 [3] - 基础设施从“自建为主”转向更务实的混合模式,与CoreWeave、甲骨文和Blue Owl Capital进一步扩大合作规模,并推动一项270亿美元的“Hyperion”数据中心计划 [11] - 正在为MSL打造名为“普罗米修斯”(Prometheus)的超大规模数据中心,内部认为这项投入相当于重建公司的AI地基 [3] 硬件与产品路线图 - AI战略重排波及硬件路线图,公司对Reality Labs启动全面审查,多个增强现实XR原型项目被降级或暂停,Quest系列迭代节奏明显放缓 [11] - 计划在未来两年逐步削减元宇宙预算,将资源重心转向与AI模型直接协同的智能眼镜、语音助手和本地推理设备 [11] - 下一代自研ASIC推理芯片可能提前量产,其目标转为加速闭源前沿模型的终端推理效率,而非服务虚拟世界 [11]
扎克伯格“挥刀斩元老”,Meta倒向闭源
虎嗅APP· 2025-12-11 09:35
核心观点 - Meta公司的人工智能战略正发生根本性转向,从过去强调“开源与开放生态”转向更具防御性和商业导向的闭源策略,这是一次涉及技术、组织、资本和硬件路线的全面战略迁徙 [2][10][11] 下一代前沿模型“牛油果”(Avocado)延期与战略转向 - 原计划于2025年底发布的下一代前沿模型“牛油果”(Avocado)已被推迟至2026年第一季度,且更倾向以闭源形式推出,这标志着公司自2023年推出Llama系列以来的开源路线面临逆转 [2] - 模型延期的主要原因是其在训练稳定性与推理泛化方面尚未达到商用层级,内部对发布时间窗口做出了更保守的重新评估 [2] - 随着Llama架构在外部被复刻、Llama 4反响平淡,以及竞争对手抬升前沿模型门槛,公司在开源体系中越来越难保持竞争优势 [2] - 公司首席执行官马克·扎克伯格在2025年夏天曾暗示必须“严格减轻风险”,这被内部视为关闭开源窗口的前兆 [2] 资本支出与基础设施投入 - 为支撑闭源模型的算力需求,公司在最新财报中将2025年资本支出上调至700~720亿美元,重点投向训练集群与数据中心扩建 [3] - 公司正在为Meta超级智能实验室(MSL)打造“普罗米修斯”(Prometheus)超大规模数据中心,内部人士称这项投入“相当于重建公司的AI地基” [3] - 在基础设施层面,公司从“自建为主”转向更务实的混合模式,已同CoreWeave、甲骨文和Blue Owl Capital进一步扩大合作规模,并推动270亿美元的“Hyperion”数据中心计划 [8] 内部组织与文化震荡 - 随着Llama 4未能达到预期,公司AI领导层经历了剧烈更替,传统学术导向的研发体系(如FAIR)让位于强调产品落地与闭环速度的Meta超级智能实验室(MSL) [5] - 公司通过143亿美元的交易将Scale AI创始人汪滔(Alexandr Wang)纳入核心决策链,由其领导MSL,并带来了强调“先做Demo,别写报告”的工程风格,这与公司原有的开放式研究文化冲撞强烈 [5] - 在组织调整中,AI相关团队出现多轮重组与裁撤,FAIR的部分研究方向被缩减,600多名与基础研究相关的人员被裁撤,直接促使首席AI科学家杨立昆宣布将离职创业 [5] - 新的AI领导层将重点放在模型能力的产品化、推理优化和安全控制,而非追求开源影响力,“开源是否已完成使命”成为内部常被提及的冲突话题 [6] 硬件路线图调整 - AI战略重排迅速波及硬件路线图,公司2025年启动了对硬件部门Reality Labs的全面审查,多个增强现实(XR)原型项目被降级或暂停,Quest系列的未来迭代节奏明显放缓 [8] - 公司计划在未来两年逐步削减元宇宙预算,把资源重心转向与AI模型直接协同的智能眼镜、语音助手和本地推理设备 [8] - 下一代自研ASIC推理芯片可能提前量产,其目标转为加速闭源前沿模型的终端推理效率,工程团队被要求围绕Avocado和后续模型构建定制加速路径 [8] - 多位员工形容这一轮调整“意味着元宇宙时代的终结”,曾经作为战略核心的Reality Labs不得不把更多资源和带宽让位给AI [9] 全面战略转向的性质 - 此次调整是继2012年全面拥抱移动互联网、2020年押注元宇宙之后,公司十多年来的第三次战略大迁徙 [11] - 与之前由外部趋势驱动的转向不同,此次是公司在激烈竞争环境中不得不做出的生存式选择,其范围之广与牵涉层级之深已远超以往 [11] - 一名参与Avocado项目的工程师总结称,公司已经从“讨论未来”转向“争取领先”,正在用全部资源确保不会被时代甩下 [11]
新加坡国家AI计划转向阿里千问,硅谷模型正在失去全球市场?
新浪科技· 2025-11-26 00:55
全球大模型市场格局转变 - 新加坡国家人工智能计划采用阿里巴巴通义千问开源模型,替代此前长期使用的美国开源模型,被视为全球AI开源生态风向转变的缩影[3] - 中国开源模型凭借性能与成本的双重优势,逐步侵蚀原本由美国公司主导的市场份额[3] - 全球开源大模型格局已从Meta一家独大,演变为中美双强对峙的局面[9] 通义千问的技术与市场优势 - 通义千问在预训练阶段涵盖119种语言,并针对多语言混合输入进行专项优化,支持32k token长上下文[5] - 模型提供4位和8位量化版本,仅需32GB内存的消费级笔记本即可运行,大幅降低中小企业使用AI的门槛[5] - 该模型在东南亚语言模型全面评估基准榜单中登顶,显示其技术领先性[5] - 通义千问下载量突破6亿次,衍生模型超过17万个,市场影响力显著[9] 国际市场采纳与行业认可 - Airbnb CEO公开表示在生产环境中大量依赖Qwen,认为其比OpenAI更好且更便宜[7] - 英伟达CEO黄仁勋指出通义千问已占据全球开源模型大部分市场份额,并将其与DeepSeek并列为世界顶尖开源大模型[7] - 在日本,通义千问已成为AI开发的基础设施,被软银系初创公司和漫画APP开发商大量采用[9] - 在韩国,基于Qwen 2.5开发的AX 4.0模型在韩语基准测试中得分超过GPT-4o[9] 性能表现与成本效益 - 在AI实时投资比赛Alpha Arena中,Qwen以22.32%的收益率击败GPT-5和Gemini夺得冠军[8] - 李飞飞团队基于Qwen2.5,以不到50美元的算力成本训练出推理能力比肩OpenAI o1的模型[7] - 前OpenAI CTO创立的Thinking Machines Lab的核心实验基于Qwen进行,显示学术界的高度认可[7]
新加坡国家AI计划:放弃Meta模型,转向阿里千问
21世纪经济报道· 2025-11-25 12:27
战略调整 - 新加坡国家人工智能计划在其东南亚语言大模型项目中放弃Meta模型,转向阿里巴巴的通义千问Qwen开源架构[1] - 这一转变标志着中国开源AI模型在全球影响力版图中的一次关键扩张[1] 项目成果 - AISG于11月25日宣布推出"Qwen-SEA-LION-v4"模型[1] - 该模型在一项衡量东南亚语言能力的开源榜单上迅速占据首位[1] 技术痛点与目标 - 此前以Meta的Llama系列为代表的开源模型在处理印尼语、泰语和马来语等区域性语言时表现不佳[1] - 此前的表现问题严重制约了本地化AI应用的开发效率与性能[1]
新加坡国家AI计划:转向阿里千问
财联社· 2025-11-25 09:15
新加坡国家人工智能计划战略调整 - 新加坡国家人工智能计划(AISG)进行重大战略调整,在其东南亚语言大模型项目中放弃Meta模型,转向阿里巴巴的通义千问Qwen开源架构 [1] - 这一转变标志着中国开源AI模型在全球影响力版图中的一次关键扩张 [1] 新模型性能与影响 - AISG于11月25日宣布推出的"Qwen-SEA-LION-v4"模型,在一项衡量东南亚语言能力的开源榜单上迅速占据首位 [1] - 新模型旨在解决长期痛点:此前以Meta的Llama系列为代表的开源模型在处理印尼语、泰语和马来语等区域性语言时表现不佳,严重制约了本地化AI应用的开发效率与性能 [1]
杭州AI产业放大招,用“开源”建生态
经济观察网· 2025-11-24 11:29
杭州AI开源产业政策核心目标 - 建设“AI开源之都”并建设国际领先的人工智能开源社区 [2][4] - 将推进开源生态建设作为建设人工智能创新高地的核心任务之一 [4] - 以城市产业政策培育开源技术生态,进而推动“AI+”的发展,追求长期的生态位势 [5][6] 资金与算力支持政策 - 对在开放原子开源基金会托管的孵化期开源项目给予一次性100万元奖励 [3] - 每年安排一定额度智能券和算力券,支持魔搭社区面向开发者提供免费算力 [3] - 西湖区政府对购买或租用智能算力服务的企业给予每家企业每年最高1000万元支持 [3] 应用场景与市场支持 - 发布新一批AI+场景“两张清单”,包括292项场景机会清单和362项场景能力清单 [4] - 场景覆盖城市治理、社会民生、产业升级三大核心领域,例如高速公路AI智能养管、隐患排查AI大模型等 [4][6] - 鼓励政府、国企、事业单位优先使用基于开源大模型的AI解决方案 [3] 政策模式与预期影响 - 政策模式区别于“给钱建实验室”或“建设算力中心”,通过提供开源福利和落地场景吸引开发者 [6] - 短期预期吸引大量AI开源团队将注册地、服务器及团队驻地迁至杭州 [6] - 中长期预期形成开发者落地做强的良性循环,使杭州成为开源应用及AI生态中心 [6]
忍无可忍,LeCun离职,Meta市值应声蒸发1400亿
36氪· 2025-11-12 01:35
公司核心人事变动 - 首席AI科学家Yann LeCun计划从Meta离职,下一步打算创业 [1] - 该消息导致公司市值在盘前交易中蒸发1.5%,约200多亿美元(约1400多亿人民币),开盘后持续下跌 [2] 公司AI战略调整 - 公司正在调整AI战略以追赶谷歌和OpenAI,将战略性放弃由LeCun领导了十多年的基础人工智能研究实验室 [5] - 战略调整表现为AI部门在6个月内进行了4次重组,导致研究无法推进 [6] - 公司任命OpenAI前高级研究员赵晟佳为MSL超级智能实验室首席科学家,此举被视为对LeCun地位的降级 [8] - 公司AI部门重组后形成四个主要部分:TBD实验室(负责人Alexandr Wang)、产品与应用研究(负责人Nat Friedman)、基础设施(负责人Aparna Ramani)、基础人工智能研究FAIR(负责人Robert Fergus) [7] 内部权力结构与冲突 - LeCun在组织权力结构中的分量已与昔日有明显不同,需向28岁、高中学历的TBD实验室负责人Alexandr Wang汇报工作 [8] - Alexandr Wang要求FAIR发表研究成果前必须接受TBD实验室的额外审核,限制了LeCun团队的学术自由 [8] - 上个月,在Alexandr Wang主导下,FAIR的核心骨干田渊栋及其团队被成建制裁撤,该团队专攻的强化学习与规划是LeCun实现"世界模型"愿景的关键技术路径之一 [5][10] 技术路线分歧 - LeCun是著名的"LLM怀疑论者",认为大语言模型不理解物理世界,其创业公司将推进需要"十年"开发的"世界模型"架构 [11] - 公司CEO的战略是全部资源押注LLM,在产品层面快速追赶对手,这与LeCun的长期基础研究路线存在根本分歧 [11] - 与LeCun支持开源形成对比,由Alexandr Wang领导的TBD实验室正严肃讨论将未来Llama版本转为闭源模式 [11] 公司资源投入与战略决心 - 公司CEO在财报会议上明确表态目标是构建超级智能,并要"积极地提前建设能力" [12] - 公司将2025年资本支出预期提高到700亿至720亿美元,远超市场预期,以支持其AI战略 [12] - 公司不惜代价从竞争对手处挖人,为TBD实验室的天价挖角和GPU采购支付账单,导致不直接产出产品的FAIR成为资源再分配的牺牲品 [12] 历史背景与影响 - LeCun于2013年受CEO邀请加入公司,创建了拥有"大学式"特权和高独立性的FAIR实验室 [13] - 在LeCun领导下,FAIR的核心任务是发表高水平论文、推动基础科学并向全球开源成果,为公司赢得了在AI基础研究领域的崇高声望 [14][16] - LeCun的离开标志着公司以FAIR为代表的、长达十年的"学院派"研究黄金时代的结束 [16]
突发!忍无可忍,首席人工智能科学家离职!Meta市值应声蒸发1400亿
是说芯语· 2025-11-11 23:52
核心事件与市场反应 - 图灵奖得主、Meta首席AI科学家Yann LeCun计划离职,下一步打算创业[1][2] - 受此消息影响,Meta公司市值在盘前交易中蒸发1.5%,约200多亿美元(约1400多亿人民币),且开盘后持续下跌[4] Meta公司AI战略调整 - Meta公司AI战略频繁摇摆,6个月内对内部AI部门进行了4次重组[8] - 公司调整AI战略以追赶谷歌和OpenAI,将战略性放弃由LeCun领导了十多年的基础人工智能研究实验室[6] - 公司任命OpenAI前高级研究员赵晟佳为MSL超级智能实验室首席科学家,此举几乎等同于将LeCun从内部AI组织领导核心地位降级[12] - 由Alexandr Wang领导的TBD实验室权力上升,LeCun需向年仅28岁、仅有高中学历的Alexandr Wang汇报工作[12] - TBD实验室要求FAIR在发表研究成果前必须接受其额外审核,LeCun本人发表论文也需经其同意[13] 组织架构与人员变动 - FAIR实验室遭遇大裁员,包括科学家总监田渊栋及其团队在内的600多人被裁撤[6][16] - 田渊栋团队专攻的强化学习与规划是LeCun实现“世界模型”愿景的关键技术路径之一,其被裁对LeCun路线是重大打击[18] - Meta公司AI部门重组后主要架构为:TBD实验室(负责人Alexandr Wang,专注高风险创新与大模型开发)、产品与应用研究(负责人Nat Friedman,推动技术产品化)、基础设施(负责人Aparna Ramani,负责硬件与平台支持)、基础人工智能研究FAIR(负责人Robert Fergus,专注长期基础研究)[10] 核心路线分歧 - LeCun是著名的“LLM怀疑论者”,认为大语言模型只是文本数据库,不理解物理世界,其创业公司将推进其倡导的“世界模型”架构[19] - “世界模型”路线被LeCun承认是需要“十年”开发的长期架构,与扎克伯格追求在产品层面快速追赶对手的战略需求不符[20] - 理念上存在开源与闭源冲突,LeCun是AI开源运动旗帜人物,而TBD实验室已在内部严肃讨论将Llama未来版本转为闭源模式[21] 公司战略与资源投入 - 在OpenAI和谷歌压力下,公司选择激进狂奔的“快车道”战略,彻底抛弃“学院派”耐心[22] - 公司目标构建超级智能,并“积极地提前建设能力”,2025年资本支出预期提高到惊人的700亿至720亿美元,远超市场预期[22] - 公司不惜代价用高薪从竞争对手处挖人,为TBD Lab的投入支付巨额账单,不直接产出产品的FAIR实验室成为资源再分配的牺牲品[22] LeCun在Meta的历程与影响 - LeCun于2013年受扎克伯格邀请加入,一手创建FAIR实验室,该实验室被赋予“大学式”特权,拥有极高独立性,核心任务是发表高水平论文、推动基础科学并开源成果[23][24] - 2018年,LeCun与Hinton、Bengio共同获得图灵奖,标志着Meta在AI基础研究领域的声望达到顶峰[25] - LeCun的离开标志着Meta以FAIR为代表的、长达十年的“学院派”研究黄金时代的彻底结束[27]