Workflow
开源
icon
搜索文档
听LLaMA Factory、vLLM、RAGFlow作者亲述顶级开源项目的增长法则|GOBI 2025
AI科技大本营· 2025-12-17 09:42
大会核心信息 - 会议名称为GOBI 2025全球开源商业创新大会,由Upstream Labs、AI原点社区、CSDN联合主办 [14] - 会议将于12月21日10:00-17:15在北京海淀东升万丽酒店举行 [5][19] - 会议定位为首届开源商业化主题大会,旨在汇聚生态伙伴,站在全球开源与AI交汇的最前沿,共同解锁未来三年的创新机会 [14][19] 参会嘉宾与规模 - 大会汇聚了500+位开源基金会掌舵者、独角兽创始人、头部VC合伙人与顶级开发者 [14] - 参会嘉宾包括来自GitHub 60,000+ Star项目LLaMA Factory的郑耀威、vLLM社区核心贡献者张家驹、RAGFlow创始人张颖峰、Apache软件基金会成员及Datastrato创始人堵俊平等实战派专家 [2][6] - 其他重要嘉宾包括创新工场联合创始人汪华、CSDN创始人蒋涛、涛思数据创始人陶建辉、LVS创始人章文嵩、PingCAP副总裁刘松、月之暗面副总裁黄震昕等超过30位专家 [20][21] 大会议程与核心议题 - 大会包含三大顶层Keynote,系统洞察开源、AI与商业的前沿思辨 [17] - 核心议题围绕“AI浪潮三部曲:变局·聚力·创生”展开,包含四场深度圆桌讨论 [6][19] - 具体议程包括“破局·企业软件的‘巨硬’时刻”、“变局·AI带来的软件和SaaS变革”、“聚力·开源社区的进化与未来”以及“创生·AI催生的文艺复兴式创业者”等圆桌论坛 [20][21] - 圆桌论坛将探讨如何借助社区力量实现个人能力跃迁、如何让围观者变为共创者、以及如何构建社区精神部落等核心问题 [3] - 会议最后将进行“源起之道”开源商业创新营优胜项目路演及颁奖典礼 [22] 现场活动与体验 - 现场将展示10大“源起之道”开源商业创新营项目 [10][22] - 现场将提供10大具身智能应用场景及体验 [10][22] - 参会者可近距离体验前沿开源应用成果与优秀项目 [10][22] - 大会设有入场好礼及终极神秘大奖等互动环节 [10][22]
金句媲美雷军,罗福莉首次站台小米演讲,揭秘MiMo大模型和背后团队
36氪· 2025-12-17 04:17
公司战略与财务表现 - 小米集团2025年被定义为“大发展”之年,2024年前三季度收入同比增长32.5%至超过3400亿元,经调整利润同比增长73.5% [7] - 公司未来五年研发投入预计将超过2000亿元,其中2026年预计研发投入约400亿元 [7] - “AI与现实世界深度融合”被列为小米未来十年的核心战略,公司已准备All in AI [31] - 公司业务聚焦于“人车家全生态”,涵盖个人设备、出行设备、家庭设备三大产品线,核心技术为芯片、OS、AI,并拥有手机、汽车、大家电的智能制造能力 [10] 人工智能与大模型战略 - 小米自研MiMo系列大模型家族,包括推理大模型、视觉推理大模型、原生端到端音频生成模型、端侧视觉语言大模型、具身大模型 [12] - 公司打造Agent语言基座模型的三个核心方向是:超强的代码和工具调用能力作为高效“语言”、围绕极致推理效率设计的模型结构作为“高带宽”协作关键、全新后训练范式以保证高效稳定的扩展强化学习训练 [16][18] - 小米认为下一代智能体系统不是“语言模拟器”,而是能理解世界并与之共存的“智能体”,强调AI需与物理世界交互 [5][27] - 公司认为算力和数据并非最终护城河,真正的护城河是科学的研究文化与方法,以及将未知问题结合模型优化转化为可用产品的能力 [5][28] 技术进展与产品发布 - 小米最新发布的MiMo-V2-Flash模型性能媲美DeepSeek-V3.2,是其核心成员罗福莉加入后团队亮出的首个成果 [14] - MiMo-V2-Flash模型在代码和Agent测评基准测试中达到全球开源模型TOP2水平,其突出优势是推理效率,实现了低成本和高速度 [17][20] - 该模型采用Hybrid SWA架构、固定KV Cache以增强长文推理,并通过3层MTP推理加速并行Token验证,实现推理速度2-2.6倍的提升 [20] - MiMo-V2-Flash已初步具备模拟世界的能力,例如通过HTML写操作系统、模拟太阳系 [22] - 该模型发布即开源,模型权重、技术报告均开源,API限时免费 [25] 行业观点与研发理念 - AI正以非线性方式重演人类大脑6亿年的进化史,语言被视为人类思维和物理世界在符号空间的“投影” [5][15] - 行业对AGI路径存在不同观点,有观点认为语言即可实现最终AGI,但小米团队认为AI进化的下一个起点必须是能与物理世界交互的模型 [27][28] - 开源被视为实现AGI普惠化和确保全人类智慧共同进化的唯一路径,其价值被定义为一种分布式的技术加速主义 [5][30] - 顶尖开源模型与顶尖闭源模型的性能差距已从三年前缩短至“数月” [30] - 小米大模型Core团队定位为研究、产品与工程深度耦合的“小而美”团队,强调创业精神和追求真理 [28]
英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离不开它
量子位· 2025-12-17 03:38
英伟达收购SchedMD的战略意义 - 公司收购了高性能计算与AI领域的“资源调度王牌管家”SchedMD,其核心资产是开源工作负载管理系统Slurm [1][2] - Slurm系统在全球超半数TOP500超级计算机、科技巨头Meta以及Mistral和Thinking Machines等AI创企中得到广泛应用,行业地位不可替代 [3][9][10] - 该收购被业界评价为“悄悄把自家的护城河拓宽了”,因为即使客户使用AMD或Intel芯片,只要依赖Slurm调度算力,就绕不开英伟达生态的辐射 [3][15] SchedMD公司业务与商业模式 - SchedMD成立于2010年,专注于大规模计算任务调度技术 [5] - 其核心产品Slurm能高效分配成千上百台设备的算力资源,服务于大模型训练、数据预处理、天气预报及基因测序等任务 [6] - 公司商业模式清晰:Slurm免费开源,通过提供专业工程支持、系统维护和定制化开发等增值服务盈利 [8] 英伟达的收购动因 - 整合成本低:双方已有十年合作基础,技术衔接与团队整合成本较低,便于英伟达快速将SchedMD能力融入自身生态 [12][13] - 战略价值高:收购使英伟达的影响力从硬件层延伸至调度层,有助于锁定超算中心、云厂商和AI企业等核心客户群体 [14][15][16] 收购后的承诺与外界关切 - 英伟达官宣收购时承诺,将继续保持Slurm的开源和供应商中立属性,确保全球用户正常使用 [18] - 外界担忧英伟达可能不会持续投入开发支撑新云厂商服务的Slinky项目关键仓库,若后续开发断档可能影响相关业务稳定性 [19][21] 英伟达同期推出的Nemotron 3系列开源模型 - 公司推出了采用MoE架构、支持百万token上下文窗口的Nemotron 3系列开源模型,包括Nano、Super和Ultra三种规模 [22] - Nano模型总参数30B,单次任务激活3B参数;Super总参数100B,每token激活10B参数;Ultra总参数500B,每token激活50B参数 [22] - 该设计通过精准控制活跃参数量,在保留大模型核心能力的同时大幅减少算力消耗 [23] - Nano模型现已推出,相比前代Nemotron 2 Nano,吞吐量提高4倍,推理成本更低,并被Artificial Analysis评为同类型中最开放高效的模型 [25][26][27] - Super和Ultra模型预计于2026年上半年推出 [25]
王忠民:AI算力的尽头是电力,电力尽头是绿电
中国新闻网· 2025-12-16 08:59
中新网北京12月16日电 (记者 王梦瑶)12月16日,中国新闻社以"新格局·新动能"为主题在北京主 办"国是论坛:2025年会"。全国社保基金理事会原副理事长、中国责任投资论坛名誉理事长王忠民在论 坛上表示,AI(人工智能)算力的尽头是电力,电力的尽头是绿电。绿电不仅是风光水发电,其自身 的生产流程和产业链过程也需要少用能量少用自然资源。 12月16日,在中国新闻社举办的"国是论坛:2025年会"上,全国社保基金理事会原副理事长、中国责任 投资论坛名誉理事长王忠民发表主旨演讲。中新社记者 蒋启明 摄 王忠民表示,AI的尽头是ESG(环境、社会和公司治理)。零碳园区、零碳城市、零碳产业首先要有算 力中心,算力中心是当前全球竞争的制高点。算力产业链前端受电力约束,如果电力不够,人工智能的 算力就没有办法有效地服务前端,如果所有的电都来自化石能源,ESG目标就会延缓。 中新网北京12月16日电 (记者 王梦瑶)12月16日,中国新闻社以"新格局·新动能"为主题在北京主 办"国是论坛:2025年会"。全国社保基金理事会原副理事长、中国责任投资论坛名誉理事长王忠民在论 坛上表示,AI(人工智能)算力的尽头是电力,电力 ...
2026中国信通院深度观察报告会
新浪财经· 2025-12-15 18:23
0:00 【2026中国信通院深度观察报告 会】中兴通讯李响:开源是一个事实的标准,也是技术创新重要的驱动力#AI #人工智能#开源 ...
Meta公开抄阿里Qwen作业,还闭源了...
猿大侠· 2025-12-12 04:11
文章核心观点 - Meta公司计划于明年春季发布一款代号为“Avocado(牛油果)”的闭源AI模型 这标志着其长期坚持的开源战略发生重大转向 [1][2][3][10][11] - 该闭源模型在训练过程中使用了包括阿里巴巴Qwen在内的第三方开源模型进行优化 此消息引发市场关注并带动阿里巴巴股价上涨 [4][5][6][13][16] - Meta的战略转向伴随着内部AI团队的重大重组 包括关键人物离职、新团队组建以及公司资源向闭源路线倾斜 [20][22][28][29][31] Meta的战略转向与“牛油果”模型 - Meta预计在明年春季发布代号“Avocado(牛油果)”的新AI模型 [2][10] - 新模型将是闭源的 这与Meta过去以“开源”为核心叙事的战略形成180度转变 [3][10][11] - 该闭源模型在训练过程中使用了多款第三方模型进行优化 其中包括阿里巴巴的Qwen [4][5][13][16] - 消息曝光后 阿里巴巴美股盘前一度上涨4% 收盘涨幅2.53% [6] Meta内部AI团队重组与权力更迭 - 2025年4月 Llama 4的发布未能达到预期且陷入争议 导致扎克伯格对团队进行重组并启动“梦之队”招聘计划 [22][23] - 公司以高额薪酬吸引人才 年薪一度飙到数亿美元 并通过一笔高达143亿美元的交易从Scale AI引入亚历山大王 [23] - 公司高层指令“少谈开源 少提Llama” FAIR实验室遭遇裁员 包括研究科学家总监田渊栋在内的员工离职 [28] - 2025年11月 知名AI科学家LeCun因公司不再提供足够资源而离职 其开源理念在内部被“雪藏” [29][30] - 随着田渊栋、LeCun等人离职 新任首席AI官亚历山大王(闭源模型拥护者)彻底掌控了Meta的AI话语权 [21][31] 新团队“TBD Lab”与公司资源倾斜 - 由扎克伯格亲自组建的明星研究员团队组成了“TBD Lab” 该实验室是Meta战略转向的重要操盘手 [20][26] - 扎克伯格极为看重该团队 投入大量时间 并将公司最重要、最烧钱的产品项目之一交由其负责 [27][32] - TBD Lab成员被安排在扎克伯格办公桌附近办公 方便其随时了解进展 [33] - 该实验室旗下的团队曾对Qwen和Gemma等模型进行微调 [18]
Meta大转向:下一代模型“牛油果”推迟,开源时代或将终结
36氪· 2025-12-11 10:00
核心观点 - Meta公司的人工智能战略正经历全面转向,从强调开源与开放生态转向更具防御性和商业导向的闭源策略,其下一代前沿模型“牛油果”(Avocado)的发布从原计划的2025年底推迟至2026年第一季度,并更倾向以闭源形式推出 [2] 战略与研发调整 - 下一代前沿模型“牛油果”(Avocado)因在训练稳定性与推理泛化方面尚未达到商用层级,发布时间从2025年底推迟至2026年第一季度 [2] - 公司AI战略正从过去两年强调的“开源与开放生态”转向更具防御性和商业导向的策略,内部对“开源是否已完成使命”存在争议 [2][8] - 此次战略调整范围广泛,涉及研发文化、组织架构、硬件规划与资本投入,是继2012年拥抱移动互联网、2020年押注元宇宙后,公司十多年来的第三次战略大迁徙 [12] 组织架构与人员变动 - 随着Llama 4反响平淡,公司AI领导层经历剧烈更替,FAIR与GenAI的主导权被削弱,传统学术导向的研发体系让位于强调产品落地与闭环速度的Meta超级智能实验室(MSL) [6] - 通过143亿美元的交易引入Scale AI创始人汪滔(Alexandr Wang)领导MSL,其带来的“工程先行、商业优先”的闭环管理与高压工作节奏,与公司原有的开放式研究文化产生强烈冲撞 [6] - AI相关团队出现多轮重组与裁撤,FAIR的部分研究方向被缩减,超过600名与基础研究相关的人员被裁撤,直接促使首席AI科学家杨立昆宣布将离职创业 [8] 资本支出与基础设施 - 为支撑闭源模型的算力需求,公司将2025年资本支出上调至700–720亿美元,重点投向训练集群与数据中心扩建 [3] - 基础设施从“自建为主”转向更务实的混合模式,与CoreWeave、甲骨文和Blue Owl Capital进一步扩大合作规模,并推动一项270亿美元的“Hyperion”数据中心计划 [11] - 正在为MSL打造名为“普罗米修斯”(Prometheus)的超大规模数据中心,内部认为这项投入相当于重建公司的AI地基 [3] 硬件与产品路线图 - AI战略重排波及硬件路线图,公司对Reality Labs启动全面审查,多个增强现实XR原型项目被降级或暂停,Quest系列迭代节奏明显放缓 [11] - 计划在未来两年逐步削减元宇宙预算,将资源重心转向与AI模型直接协同的智能眼镜、语音助手和本地推理设备 [11] - 下一代自研ASIC推理芯片可能提前量产,其目标转为加速闭源前沿模型的终端推理效率,而非服务虚拟世界 [11]
28岁外来人“手撕”近 20 年元老?Meta全面内战:算力争夺、“开源”祭旗,每周工作70小时,亚历山大王真“压力山大”
AI前线· 2025-12-11 09:00
公司AI战略调整与团队重组 - 公司对人工智能体系进行大规模调整,聘请28岁创业者Alexandr Wang担任新负责人,并组建名为TBD Lab的新团队,该团队被安置在硅谷总部扎克伯格办公室旁的独立区域,旨在远离公司内部层级和官僚结构[2] - 新团队成立五个月后,与公司元老团队之间的冲突已经难以遮掩,形成了“我们对抗他们”的心态[2][8] - 公司为打造“行业内最精英、人才最密集的团队”投入巨额资金,人工智能战略转型已近六个月,但新团队尚未有太多公开成果[4] 新老团队的核心冲突 - **研发优先级冲突**:新团队负责人Wang与首席产品官Chris Cox、首席技术官Andrew Bosworth等老臣在关键问题上意见不合,冲突焦点在于优先开发通用人工智能还是优化现有产品[3][4] - **资源分配冲突**:在计算资源分配上出现严重分歧,负责社交媒体排序算法的团队认为新增算力应优先用于能直接赚钱的业务算法,而非训练AI模型[6] - **盈利理念分歧**:Cox和Bosworth认为通用人工智能应为社交网络业务服务,而TBD实验室的研究人员目标是打造超强能力的“通用人工智能”[6][7] - **预算争夺**:有知情人士表示,Bosworth主管的Reality Labs明年预算被要求削减20亿美元,这笔钱被划给了Wang的团队,但公司发言人否认此说法[8] 开发流程与文化冲突 - 新领导层将硅谷前沿的现代AI开发方法带入公司,彻底颠覆了公司长期沿用的传统软件开发流程[9] - 公司过去的流程需征求多个团队意见以确保产品体验一致性,但新AI领导层认为这些内部工具和流程拖慢了AI软件的快速迭代[9] - 新团队倡导“Demo,不要 memo”的文化,即少写文档、多做原型,并使用如Lovable等新工具更快构建内部应用[10] - 整个AI组织现在面临巨大压力,每周工作70小时几乎成为常态,并经历持续的裁员与重组[11] 团队稳定性与人员变动 - 新团队TBD Lab在夏季曾出现短暂人员离职潮,但目前已趋稳定,在约100名员工中,近期仅2人选择在股票授予到期日离职[5] - 公司人工智能部门出现负面人员变动:Meta超级智能实验室部分新员工入职几周后便离职;10月,公司裁减人工智能部门600个岗位,侧重学术研究的FAIR实验室被大幅削减;一个月后,Yann LeCun离职[4] - LeCun离职的部分原因是对无法获得足够资源感到不满,且在其离职前,公司已鼓励部分员工让他淡出公众视野[14] 产品开发压力与市场表现 - 新团队负责人Wang面临巨大压力,需要交付顶级AI模型以帮助公司重新获得对抗OpenAI、Anthropic和谷歌的动力[4] - 内部对Llama 4之后的“巨兽”模型发展方向感到失望,已将其搁置,转而研发新产品[4] - 由新领导层成员Nat Friedman负责、在9月发布的AI生成短视频应用Vibes,内部普遍认为远不如OpenAI的Sora 2,且产品被匆忙推向市场,缺乏关键功能[10][11] - Vibes应用的下载量落后于Sora应用[11] 开源战略的重大转向 - 公司一款代号为“牛油果”的新模型预计于明年春天亮相,并可能以“闭源”模型形式推出,这标志着公司自多年来大力推崇开源战略以来最大的战略转向[12] - 新团队负责人Wang是闭源模型的支持者[12] - 在“牛油果”模型的训练过程中,TBD团队正使用多款第三方模型,包括从谷歌的Gemma、OpenAI的gpt-oss以及阿里的Qwen等竞争对手的模型中提炼技术[12] - 借助中国技术训练新模型标志着扎克伯格态度的转变,他此前曾担忧中国AI模型受审查制度影响,并呼吁美国政府支持本土科技公司[12] - Llama 4发布后,公司领导层指示部分员工停止公开谈论开源及Llama系列产品,重新评估这些业务未来的意义[13] 巨额投资与高层意图 - 为了通用人工智能,扎克伯格已承诺投资6000亿美元建设数据中心[6] - 扎克伯格对AI竞赛抱有雄心,已投入数十亿美元,包括对Wang创业公司143亿美元的投资[15] - 公司计划通过将AI技术融入旗下热门产品实现盈利,核心思路是延长用户平台停留时间以通过广告赚取更多收入[6]
硅谷风向变了?Meta被指用阿里千问模型蒸馏优化,扎克伯格或转战闭源
凤凰网· 2025-12-11 03:09
Meta的AI模型研发与技术路径 - 美国科技巨头Meta在研发代号为"牛油果"的全新AI模型时 采用了阿里巴巴开源的Qwen模型进行蒸馏优化 [1] - 这一技术路径的选择 正值马克·扎克伯格在硅谷重金组建顶尖团队 试图扭转此前大模型研发颓势的关键时期 [1] 行业技术格局与模式猜测 - Meta作为曾经的开源领军者 此番借力Qwen模型 侧面印证了中国开源大模型在技术底层已具备比肩甚至反哺硅谷巨头的实力 成为行业重要的参考坐标 [1] - 这也引发了业界对于Meta可能放弃纯开源路线 转而寻求闭源盈利模式的广泛猜测 [1] 阿里巴巴AI应用的市场表现 - 阿里在C端市场的应用落地呈现出爆发态势 自11月17日启动公测以来 通义千问App在短短23天内 全端月活跃用户数已突破3000万 [1] - 这一数据刷新了同类产品的增长纪录 表明国产大模型正在加速完成从技术积累到用户规模化普及的跨越 [1]
Meta公开抄阿里Qwen作业,还闭源了...
量子位· 2025-12-11 01:33
文章核心观点 - Meta公司计划于明年春季发布一款代号为“Avocado(牛油果)”的闭源AI模型,标志着其从长期坚持的开源战略向闭源模式进行重大转变 [1][2][3][10][11] - 这款闭源模型在训练过程中使用了包括阿里巴巴Qwen在内的第三方开源模型进行优化,此消息刺激阿里巴巴美股盘前一度上涨4%,收盘涨幅2.53% [4][5][6] - Meta的战略转向源于其开源路线的挫折(如Llama 4的失败)以及内部权力结构的重组,以新任首席AI官亚历山大王为代表的闭源拥护者掌握了AI话语权 [11][22][31] Meta的战略转向与“牛油果”模型 - Meta预计在明年春季发布代号为“牛油果”的新AI模型,该模型将是闭源的 [2][10] - 此举意味着Meta进行了一百八十度的战略转向,放弃了其长期以“开源”为核心叙事、并自比“AI时代的安卓系统”的发展路线 [11][12][14] - 新模型在训练过程中使用了多款第三方模型进行优化,其中包括阿里巴巴的Qwen、谷歌的Gemma以及OpenAI的gpt-oss [13][16] - 计划走向闭源的Meta,通过使用开源模型来训练自己的闭源模型,这一做法被解读为印证了当前开源阵营的崛起 [13] 市场反应与行业影响 - 彭博社关于Meta使用阿里巴巴AI训练闭源模型的消息引发市场强烈反应,阿里巴巴美股盘前一度上涨4%,收盘涨幅2.53% [6] - 市场观点认为,此事件凸显了阿里巴巴等公司在开源AI领域的领先地位和影响力 [9][15] Meta内部重组与权力更迭 - 2025年4月,Llama 4的发布未能达到预期,且陷入榜单排名“作弊嫌疑”的争议,成为一次重大挫折 [22] - Llama 4失败后,Meta公司高层开始下达“少谈开源,少提Llama”的指令,并逐步边缘化相关团队成员 [22][28] - 公司进行了大规模重组和裁员,FAIR实验室整组被裁,包括研究科学家总监田渊栋在内的开源路线支持者离职 [28] - AI领域的知名人物LeCun于11月离职,原因之一是Meta不再为其提供足够资源,离职前内部甚至要求员工“雪藏”他及其开源理念 [29][30] - 随着田渊栋、LeCun等人的离开,新任首席AI官亚历山大王彻底掌控了Meta的AI话语权,他是闭源模型的坚定拥护者 [21][31] - 亚历山大王通过一笔高达143亿美元的交易从Scale AI加入Meta [23] - 扎克伯格如今将自己定位为“王的导师”,并将公司最重要、最烧钱的产品项目之一亲自交到亚历山大王手上 [32] “梦之队”的组建与TBD实验室 - Llama 4失败后,扎克伯格亲自挂帅开启“梦之队”招聘计划,为顶尖AI人才提供高额薪酬,年薪一度飙到数亿美元 [23] - 扎克伯格求贤若渴,甚至亲自带着自己煮的南瓜汤上门游说OpenAI的核心研究员 [25] - 这批招募来的明星研究员组成了Meta的“超级智能实验室”旗下的TBD Lab,该实验室是此次战略转折的重要操盘手 [20][26] - 扎克伯格对TBD Lab极为看重,投入大量时间,并将该团队成员安排在自己办公桌附近以便随时了解进展 [27][33]