Kimi K2
搜索文档
Mamba作者团队提出SonicMoE:一个Token舍入,让MoE训练速度提升近2倍
机器之心· 2025-12-19 06:38
混合专家模型架构发展趋势 - 混合专家模型已成为实现语言模型规模化扩展的事实标准架构,其核心优势在于不显著增加计算成本[1] - 近期MoE模型呈现出高专家粒度和高稀疏性的明显趋势,即采用更小的专家中间层维度和在专家总数增加时保持激活专家数不变,这提升了单位FLOPs的模型质量[1] - 这一趋势在近期开源模型中表现突出,例如DeepSeek V3、Kimi K2以及Qwen3 MoE等,它们通过更细粒度设计和更高稀疏度,在保持激活参数量不变的同时大幅增加了总参数量[1] 代表性MoE模型参数对比 - 模型参数规模与稀疏度持续提升,例如Kimi K2总参数量达1.04万亿,专家激活比例仅为2.08%[2] - 专家粒度指标持续提高,例如Owen3-Next-80B-A3B-Instruct的专家粒度达到4.00[2] - 近期模型如DeepSeek-V3.2-Exp总参数量达6850亿,专家激活比例保持在3.13%[2] 细粒度MoE架构的硬件效率挑战 - 细粒度MoE设计导致严重的硬件效率下降问题,包括内存墙瓶颈、IO瓶颈和计算浪费[3] - 激活内存占用量随激活专家数量线性增长,导致前向和反向传播中内存压力剧增[4] - 由于专家更小更分散,算术强度显著降低,IO访问变得动态频繁,模型训练进入内存受限区间[4] - 高稀疏性场景下,Grouped GEMM内核中的Tile量化效应导致输入数据需填充以对齐硬件Tile大小,直接造成计算资源浪费[4] SonicMoE系统性解决方案 - 普林斯顿大学团队提出名为SonicMoE的系统性解决方案,专为NVIDIA Hopper和Blackwell架构GPU定制[3] - 核心贡献包括内存高效算法、计算与IO重叠技术以及Token舍入路由策略[3] - 在细粒度7B MoE模型测试中,前向传播相比高度优化的DeepGEMM基线速度提升43%[3] - 反向传播相比最先进的ScatterMoE和MoMoE基线,速度分别提升83%和115%[3] - 端到端训练仅依靠内核优化即可将训练吞吐量提升50%,配合Token舍入路由在扩展专家数量时可进一步获得16%的额外吞吐量提升[3] SonicMoE关键技术细节 - 内存高效算法通过重新设计MoE计算图,在计算路由梯度时不缓存激活值,对于细粒度7B MoE模型每层激活内存占用减少45%[4] - 随着专家粒度增加,其内存占用保持恒定,效率比现有基线高出0.20-1.59倍[4] - 利用Hopper架构GPU的WGMMA指令与生产者-消费者异步范式,设计新型GPU内核,将GEMM计算与从HBM加载数据的IO操作并行执行[4] - Token舍入策略将分发给每个专家的Token数量四舍五入为Grouped GEMM Tile大小的倍数,有效减少因填充导致的算力浪费[4] SonicMoE性能表现 - 仅使用64台H100运行SonicMoE,实现了每日2130亿token的训练吞吐量,与使用96台H100运行ScatterMoE的效率相媲美[6] - 在高稀疏性场景下,Tile感知的Token舍入算法在验证不损失下游任务精度的同时,显著提升了内核执行速度[6] - SonicMoE的前向计算吞吐量平均达到理论上限的88%,最高91%,最低86%[7] - 尽管采用高度模块化设计,SonicMoE仍展现出业界领先的训练吞吐量和最低的激活内存使用量[15] SonicMoE系统架构特点 - SonicMoE中的MoE计算启动8个内核,包括前向传播的up-proj、down-proj和专家聚合内核,以及反向传播的激活梯度内核[11] - 系统提供高效的基于Tensor Core的top-K路由,以及与任意路由逻辑兼容的接口[13] - 实现具有高度模块化特性,仅由经过优化的分组GEMM内核和专家聚合内核两部分组成[14][22] - 通过融合减少IO访问,将IO延迟与计算重叠,利用cp.async指令从HBM gather激活值[23] Token舍入路由算法 - 为消除稀疏MoE训练中因填充产生的GEMM tile计算浪费,提出路由方法token rounding[21] - 算法首先计算基础的TC路由结果,对每个expert对应的token按路由分数排序,在第二步排序中选择丢弃或补齐token[24] - 对路由权重矩阵进行处理,使得TC选中的token始终优先于EC token,确保丢弃或填充只影响每个expert的最后一个输入tile[25] - 实验表明该方法在实现更高训练吞吐量的同时,不会影响模型质量[26]
AGI为什么不会到来?这位研究员把AI的“物理极限”讲透了
36氪· 2025-12-17 11:43
这意味着,智能的提升并不是"想象空间"问题,而是绕不开能量、带宽、存储、制造和成本的物理限 制。 AGI 会不会到来? 这是AI 行业里反复被讨论、却一直始终缺乏清晰论证的问题。 最近,西雅图艾伦人工智能研究所(AI2)的研究员蒂姆·德特默斯(Tim Dettmers)在一篇文章,题目很 直接——《为什么 AGI 不会实现?》。 蒂姆·德特默斯 在这篇文章中,他提出了一个被长期忽视、却至关重要的前提: 计算并不是抽象概念,而是一件彻底受物理规律约束的事情。 德特默斯认为,当下市场对AGI 的判断普遍偏乐观,一个关键原因在于: 很多讨论只停留在模型、参数和算法层面,却忽视了支撑这些能力的物理基础正在逼近极限。 在文章中,德特默斯第一次从物理约束的角度,系统性地解释了为什么AGI 面临一系列难以回避的现 实。这些判断,也有助于我们更好地理解当前的AI行业。 他在文章中总结了几条关键判断: 1)Transformer 的成功并非偶然,而是在当前物理约束下接近最优的工程选择,继续通过架构改进获得 的边际收益正在快速下降。 2)当下大量所谓"创新",本质仍是既有框架上的渐进改进,很难带来结构性跃迁。 3)AI 过去的 ...
跨越科技奇点,布局AI新机
平安证券· 2025-12-15 02:09
核心观点 - 报告维持计算机行业“强于大市”评级,坚定看好我国人工智能产业的未来发展,认为随着国产AI算力产业链成熟和国产大模型持续迭代,大模型在千行百业的应用落地将加快,大模型和智能驾驶等主题将在二级市场获得更好的投资机会 [4][5] 行业回顾与展望 - **基本面**:2025年前三季度,计算机行业上市公司营业总收入合计9393.4亿元,同比增长9.4%;归母净利润合计233.0亿元,同比大幅增长35.8%;扣非归母净利润合计143.2亿元,同比大幅增长41.3% [11] - **子行业表现**:计算机设备子行业营收同比增长13.7%,归母净利润同比增长14.6%;软件开发子行业营收同比增长1.4%,归母净利润减亏86.3%;IT服务子行业营收同比增长11.3%,归母净利润增长27.4% [11] - **市场行情**:年初至2025年11月28日,申万计算机指数上涨18.54%,跑赢沪深300指数3.50个百分点,在31个申万一级行业中排名第10位 [18] - **基金持仓**:2025年三季度,计算机行业的基金重仓持股比例为1.24%,环比微降0.02个百分点,在31个申万一级行业中排名第11位 [20] - **行业估值**:截至2025年11月28日,计算机行业市盈率(TTM,剔除负值)为54.2倍,处于历史68%分位,在31个申万一级行业中排名第3位 [23] - **政策与展望**:国家层面高度重视人工智能发展,随着国产AI算力产业链成熟和国产大模型持续迭代升级,大模型在我国千行百业的应用落地将加快 [25][26] 算法及应用 - **全球竞争格局**:2025年下半年以来,全球大模型领域竞争加剧,海外闭源模型性能角逐提速;当前全球前十的前沿模型以谷歌、Anthropic、OpenAI、xAI的闭源模型为主;开源国产大模型如Kimi K2 Thinking、MiniMax-M2性能持续处于全球第一梯队 [27][30] - **技术迭代方向**:跨模态与智能体正在成为大模型市场竞争焦点;多模态大模型加速迭代,应用场景向图像、语音、视频、代码等拓展;智能体(AI Agent)通过任务分解、自主决策、工具调用与环境交互,显著拓宽模型任务边界 [32][34] - **生态构建**:以谷歌、阿里为代表的全球领先大模型厂商致力于搭建“芯模云端”的全栈AI生态,以构筑更高的商业壁垒、释放更大的商业势能 [36][40][41] - **应用落地趋势**:根据OpenAI万亿Token消耗Top 30客户名单,头部AI产品赛道开始收敛,主要集中于AI编程工具、企业级服务以及生产力工具三个赛道 [42][43] - **重点关注赛道**:报告建议关注编程、企服、办公三个AI应用赛道 [4][42] - **AI+编程**:全球AI编程工具流量持续增长,Cursor母公司Anysphere投后估值达293亿美元;国内AI编程使用频率(31%)相较全球整体(82%)仍有较大提升空间 [45][47] - **AI+企服**:Agent的自主执行与跨系统编排能力攻克企服场景痛点;国内企服公司AI相关收入及订单快速增长,商业化落地进程加快 [53][59][60] - **AI+办公**:大语言模型适配传统办公文字类场景,多模态能力助力传统办公软件进化为生产力工具;AI+办公产品形态从单点应用向集成化平台演进 [61][62] 算力 - **市场高景气度**:大模型的迭代升级与应用落地将拉动全球AI算力市场持续高景气;IDC预计,2024-2028年全球AI服务器市场规模CAGR为15.5%,中国AI服务器市场规模CAGR为30.6% [67] - **全球资本开支支撑**:2025年第三季度,微软、谷歌、Meta、亚马逊资本开支合计1125亿美元,同比增长76.9%,为全球AI算力产业发展提供强力支撑 [70] - **芯片市场格局**:GPU芯片是AI算力芯片市场主流,英伟达占据主导地位,其2026财年第三季度数据中心业务收入512亿美元,同比增长66%;ASIC芯片市场规模也在高速增长,预计2023-2028年CAGR高达53% [72][73][75] - **国产算力发展机遇**:AI算力芯片的自主可控已成为确定性发展趋势;在政策推动、下游需求强劲增长、替代空间大等多重因素推动下,国产AI算力芯片产业链迎来发展机遇 [4][84] - **国产芯片进展**:以华为昇腾910B为代表的国产AI算力芯片在性能上已可对标英伟达H20;2024年,中国本土人工智能芯片品牌的出货量市场份额约30%,未来有超过两倍的出货量替代空间;国产AI算力芯片已呈现百花齐放态势,并逐步取得规模化落地 [85][88][89][90] 智能驾驶 - **全球产业蓬勃发展**:特斯拉FSD已更新至v14.2.1版本,累计行驶里程数已超过67亿英里;小鹏汽车发布第二代VLA、小鹏Robotaxi等,并将城市NOA功能引入15万价位的MONA M03车型;华为发布乾崑智驾ADS4,其解决方案在我国城市NOA新车销量中市场份额第一 [4] - **NOA成为主流方案**:具备城市NOA功能的L2++预计将成为智能驾驶未来的主流方案;我国高速NOA和城市NOA智驾功能的装配率呈现上升态势 [4] - **市场前景广阔**:亿欧智库数据显示,我国NOA的市场规模未来将高速增长,2030年有望超3000亿元;随着NOA功能普及,我国智能驾驶产业的商业化将提速,相关产业链厂商将深度受益 [4] 投资建议与个股 - **整体建议**:报告认为大模型和智能驾驶等主题将在二级市场获得更好的投资机会,维持对计算机行业“强于大市”的评级 [5] - **个股推荐**: - **AI算力**:推荐海光信息、龙芯中科、工业富联、浪潮信息、紫光股份、中科曙光、神州数码;建议关注寒武纪、华勤技术、景嘉微、软通动力、拓维信息 [5] - **AI算法及应用**:推荐道通科技、金山办公、科大讯飞、同花顺;建议关注合合信息、鼎捷数智、汉得信息、赛意信息、普联软件、泛微网络、致远互联、锐明技术、迈富时、百融云-W [5] - **智能驾驶**:强烈推荐中科创达,推荐德赛西威 [5]
China narrows AI gap with US 3 years after initial ChatGPT shock
Yahoo Finance· 2025-12-13 09:30
The report attributed this year's surge in open LLM usage around the world to the growing adoption of Chinese-developed systems, including Alibaba Cloud 's Qwen family of models, DeepSeek 's V3 and Moonshot AI 's Kimi K2 . Alibaba Cloud is the AI and cloud computing services unit of Alibaba Group Holding , owner of the Post.ChatGPT was released by OpenAI on November 30, 2022. Photo: Shutterstock alt=ChatGPT was released by OpenAI on November 30, 2022. Photo: Shutterstock>Fast-forward to the second half of 2 ...
「AI新世代」张予彤出任总裁,月之暗面商业化“短板”待补
华夏时报· 2025-12-11 22:53
公司核心人事变动 - 前金沙江创投主管合伙人张予彤出任月之暗面总裁,将主要负责公司整体战略与商业化 [2][3] - 张予彤此前作为资深投资人在月之暗面多轮融资中起到重要作用,于2023年受邀作为联合创始人加入,股份按多年条件兑现 [3] - 此次人事变动旨在加强公司商业化能力,为未来可能的IPO铺路,并有助于修复公司声誉、缓解此前仲裁事件的负面影响 [2][5] 公司历史与争议 - 张予彤在月之暗面获得巨大免费股份(900万股,相当于初始股份的14%)曾引发争议,导致其被前雇主金沙江创投解雇,并被循环智能投资方提起仲裁 [4] - 仲裁原因为被指隐瞒股份信息,违反受托责任,其股份份额远超孵化月之暗面2年的母公司循环智能所获的9.5% [4] - 目前工商信息中未见张予彤为股东,此前有传闻其股份由创始人杨植麟代持,但未获公开回应 [4] 商业化进展与挑战 - 月之暗面为技术导向型公司,商业化进程相对滞后,迄今未公布乐观的商业化数据,此前公司表示商业化并非最优先事项 [2][6] - 相比同行(如百川智能、零一万物、智谱、阶跃星辰、MiniMax)已明显向商业化倾斜,月之暗面商业化是短板 [6] - 公司去年5月曾测试“打赏”功能,类似订阅模式,但暂未发展成良性商业化路径 [8] - 公司核心挑战在于缺乏规模化营收及持续盈利能力的证明,需打消市场对“烧钱”模式的疑虑 [7] 融资与估值情况 - 月之暗面最新一轮融资已进入收尾阶段,估值有望提升至约40亿美元(约合284.7亿元人民币),整体融资规模可能达数亿美元,潜在投资方包括现有股东腾讯 [6] - 融资仍是支撑公司生存的重要手段,为吸引人才和培育商业场景提供助力 [6][8] - 分析师建议公司应加强与阿里、腾讯等产业资本深度绑定,以降低获客成本、加速场景落地 [8] 技术发展与战略 - 公司近期发布Kimi K2模型,并称首次在万亿参数模型上验证二阶优化器Muon,实现了至少两倍的token效率提升,训练成本下降两倍 [7] - 公司还开源了Kimi K2模型,并强化代码与Agent能力,致力于构建“技术+生态”的差异化壁垒 [7][8] - 公司战略正从纯技术导向转向聚焦AI体验和生产力工具的差异化路线,以推动商业化落地 [5] - 公司一方面在降本,另一方面吸引专业用户,并强调算力资源不是唯一叙事 [7] 市场环境与IPO传闻 - 有消息称月之暗面或将于2026年(或明年)启动IPO,但公司未予回应 [2][7] - 在AI大模型创业公司中,若无法形成稳定收入,生存将面临挑战,商业化是获得投资回声的关键 [6][7] - 分析师建议公司后续发展关键在于产品与技术,并应聚焦C端科研与职场专业人士,在B端与头部企业建立长期服务关系,以实现可持续商业化 [8]
智能体市场全景剖析
2025-12-08 15:36
行业与公司 * 行业:人工智能,特别是大模型驱动的智能体(Agent)领域 [1] * 涉及公司: * 大模型厂商:谷歌(Gemini)、Deepseek、月之暗面(Kimi)、智谱(AutoGLM)、OpenAI、Anthropic、科大讯飞、字节跳动 [1][3][5][6][8][15] * 产品与平台:豆包手机助手、MindSpore、Anti Gravity、Jenna、Cloud Code、ChatGPT、GMAT Cloud、Cursor [2][6][11][12][21][24] * 其他:James Park(获超2亿美元融资)、一家丹麦AI客服公司 [8][14] 核心观点与论据 1. 大模型与智能体技术进展与差距 * 近期发布的大模型(Gemini、Deepseek V3.2、Kimi K2)在智能体能力上各有侧重 [1] * Gemini在人机交互方面表现最佳,能快速生成UI并接受键盘输入 [1][4] * 国产大模型在基础要素上已具备能力,但与国际领先水平仍有差距,尤其在前端性能和空间推理方面 [5] * 国产大模型执行时间普遍较长,导致用户使用成本较高 [1][5] * 在复杂任务(如生成电影知识图表、3D动画模拟)中,各模型表现不一,存在失败或不足 [3][4][5] 2. 智能体产品化与落地的挑战 * 开发完整智能体产品极度依赖强大的软件工程能力,大模型仅提供10%至20%的能力,80%的工作依赖传统软件工程 [9] * 复杂稳定的智能体产品无法由单个人完成,声称零部署或一键上线的应用需警惕 [1][9] * 智能体与操作系统整合拥有最高权限,可实现跨应用操作,但面临应用开发商的反制(如阿里系封杀豆包手机助手的转账、抢红包功能) [1][7] * 从技术演示到稳定运行存在巨大鸿沟,实现完全可靠需指数级增加算力和成本 [11] * 当前大模型在真实客服任务中成功率仅约40%,失败率超60%,在语义理解、场景上下文和常识推理上仍显著不足 [10] 3. 市场发展、风险与投资视角 * 智能体概念于2024年兴起,2025年被称为智能体元年,各类厂商纷纷投入 [8] * 市场初期对其价值存疑,但随着James Park获得超过2亿美元融资等案例,其重要性被逐渐认可 [8] * 市场上存在鱼龙混杂和劣质产品,需仔细甄别 [1][2][8] * 最看好的落地场景是专注于垂直领域的小点,如有明确好坏判定标准的税务审核、合同审查等 [19] * 相对通用但无明确标准的应用(如AI for PPT优化视觉呈现)也有一定市场 [19] * 开放性较强、缺乏明确边界的问题(如设计最优路径)实现难度大,成功案例少 [19] 4. 企业级应用与平台局限性 * 企业级智能体平台难以满足所有部门需求,统一的大系统无法覆盖所有流程,各部门在流程、合规、领域知识上需求不同 [3][16] * Memory技术需谨慎评估,过高Memory会影响系统效率,且模型可能因错误数据偏离方向 [3][17] * 数字员工/AI陪伴难以完全替代人工,需要大量调教且成本可能超过雇佣人工,更应视为协作与增强工具 [18] * 需警惕弱化数据隐私保护的行为,大模型对数据理解粗暴且难以控制,不应轻易将敏感数据交给第三方 [19] 5. 编程与开发工具现状 * 目前没有一家智能体平台被专业程序员广泛使用 [20] * 专业编程领域,Cloud Code表现最佳,其次是Gemini,ChatGPT因价格昂贵和特定场景语义理解不足而靠后 [21] * Web Coding平台主要面向非专业用户,通过拖拽降低实现简单逻辑的门槛,但无法承载复杂任务 [3][20] * 当前90%的智能体仍依赖预定义工作流 [3][20] * Web Coding的成功源于流程标准化和可复制性,确保了稳定性和复用性 [22] * Cursor产品面临较大风险,自Cloud Code推出后流量大幅下降,若不能摆脱对底层大模型的依赖则前景堪忧 [24][25] * UI设计工具可能成为重要发展方向 [3][21] 其他重要内容 1. 安全、权限与可靠性评估 * 评估智能体需考虑出错后果的可承受性 [1][11] * 在开源社区中,用户曾因给予Anti Gravity过高权限导致其删除整个代码库 [13] * 一家丹麦公司的AI客服系统被授权在无人监督下代表公司转移资金,存在极大风险 [14] * 在涉及金钱或关键事实确认时,让智能体完全代替人工操作非常危险 [14] 2. 行业实践与规则探索 * 行业内对AI介入程度有基本规则:通常让AI处理前端70%-80%的杂活累活(如文档规整、非结构化数据转换),最终关键决策由人类完成 [26] * 在生命攸关或影响力大的领域(如制药厂管线审核),最终决定权必须由人类掌握 [26] * 在错误影响较小的领域(如教育辅助),则允许AI更多参与 [26] * 不同行业根据AI可能带来的风险反向推导其介入程度,目前尚无统一标准,各方仍在探索边界 [26] 3. 工具定位与价值衡量 * 工具本身无好坏,关键在于用户如何使用 [23] * 若用户缺乏编程经验却指望通过Web Coding直接生成成熟产品,是错误定位 [23] * 若目标是提升资深开发人员效率(如提升200%),则Web Coding可以胜任 [23] * 工具价值取决于公司如何看待工具与人的关系,以及如何衡量生成代码的准确性和执行成功率等指标 [23]
China's open-source models make up 30% of global AI usage, led by Qwen and DeepSeek
Yahoo Finance· 2025-12-08 09:30
全球AI模型使用格局 - 全球AI模型使用中,开源模型占比近30%,其中中国开发的开源模型贡献了主要增长动力 [1] - 西方专有模型(如OpenAI的GPT-4o和GPT-5)在全球市场中仍占据主导地位,份额为70% [3] 中国开源AI模型的增长与表现 - 中国开源大语言模型的全球份额从2024年底的1.2%的低基数起步,在2025年的几个月内增长至近30% [4] - 2025年以来,中国开源大语言模型平均每周处理令牌量占比达到13%,在下半年增长加速,几乎与世界其他地区AI模型13.7%的平均占比持平 [5] - 报告指出,中国开源AI模型的崛起不仅反映了其具有竞争力的质量,也体现了快速的迭代和密集的发布周期 [7] 主要中国AI模型与公司 - 中国开发的开源大语言模型推动了全球使用量的激增,代表性系统包括阿里巴巴集团的Qwen系列模型、深度求索的DeepSeek V3以及月之暗面的Kimi K2 [2] - 阿里巴巴云(阿里巴巴集团的AI与云计算服务部门)的Qwen和深度求索的DeepSeek积极的发布计划使用户能够快速适应不断增长的发展工作量 [8] 中国在AI领域的地位与影响 - 报告认为,中国已成为一股主要力量,不仅通过国内消费,还通过产出具有全球竞争力的模型 [6] - 报告提供了新的证据,表明尽管美国限制中国企业获取英伟达和AMD等公司的高级图形处理器,中国在AI模型开发领域已成为美国的紧密同行 [6]
观察| 100万亿Tokens的:AI正在发生你看不见的巨变
未可知人工智能研究院· 2025-12-07 03:02
文章核心观点 - 基于OpenRouter平台超过100万亿tokens的真实使用数据,AI行业正在经历一场深刻的范式转变,其核心是从“工具”进化为“伙伴” [1][2][3] - 这场转变由两大技术革命驱动:“推理革命”使AI具备多步骤思考能力,“代理式AI”使AI能够自主规划并执行任务 [11][27] - 真实的用户行为和市场数据揭示了与实验室基准测试不同的竞争格局,开源模型(特别是中国的DeepSeek和Kimi)凭借成本、灵活性等综合优势正在强势崛起 [44][47] - 用户选择模型的标准日益多元化,模型“人设”(个性)和突破性能力对用户留存的影响,可能超过传统的性能基准分数 [88][96][100] - AI的应用场景已进入爆发期,正从创意写作和编程两大引擎,扩展到角色扮演等满足情感需求的领域,并深刻重塑普通人的工作、学习和娱乐方式 [69][71][80][121] 数据来源与重要性 - 报告数据来源于硅谷风投A16Z与OpenRouter联合发布的《State of AI: An Empirical 100 Trillion Token Study》,这是基于真实战场数据的首次大规模研究 [2] - 数据覆盖了OpenRouter平台上过去一年产生的超过100万亿tokens,涉及500万开发者、300多个AI模型及60多家提供商 [2] - OpenRouter被比喻为“AI世界的美团外卖”,连接了几乎所有主流AI模型,其数据的核心价值在于多样性,能够反映用户在公平平台上的真实选择 [5][7][8] - 从2024年初到2025年中,OpenRouter的年处理流量从约10万亿tokens增长至超过100万亿tokens,增幅达10倍,标志着AI应用从“尝鲜期”进入“爆发期” [8] - 作为对比,OpenAI官方API在2024年10月的日均处理量为8.6万亿tokens,而OpenRouter的日处理量已突破1万亿tokens [6] 推理革命 - 核心转变是AI从“接话机器”(一次性输出)进化为“思考机器”(多步骤思考),能够像人类一样分解问题、搜索信息并迭代优化 [13][16] - 标志性事件是OpenAI于2024年12月5日发布的o1推理模型,其特点是会进行内部推理,开启了“代理式推理”的新模式 [17][18] - 市场数据支持这一趋势:用户提示词长度显著增加、对话轮次增多,且专业推理模型的市场份额快速上升 [20][21][22] - 用户正用更复杂的任务“训练”AI,而能够胜任复杂任务的推理模型正在赢得市场 [23] - 这喻示着AI的角色从“计算器”(工具)进化为“工程师”(同事),实现了从工具到同事的跨越 [25][26] 代理式AI - 代理式AI改变了AI的“手脚”,使其从被动、单次、静态的问答,转变为主动、多步、动态的任务执行者 [27][29][30] - 例如,在分析财报时,代理式AI能主动搜索最新信息、下载文件、提取数据并生成分析报告,突破了传统模型数据过时的局限 [31][32][33] - A16Z报告指出,代理式推理是OpenRouter上增长最快的行为模式,表明开发者正在大规模构建能自主完成任务的AI代理应用 [34][35] - 这意味着用户期待从“给我一个答案”变为“帮我完成这件事”,AI的价值从“信息检索”升级到“任务执行” [35][36] - 竞争前沿随之改变,重点转向模型的编排能力、控制力和可靠性,而不仅仅是准确率,这要求AI公司构建全新的“模型调度系统”技术栈 [42][43] 开源模型的崛起与中国力量 - 真实使用数据挑战了“闭源模型碾压开源”的常识,显示开源模型,尤其是推理型开源模型正在快速抢占市场份额 [46][47] - 中国的DeepSeek R1和Kimi K2在报告中表现突出,成为开源逆袭的代表 [47] - DeepSeek R1凭借巨大的成本优势(调用成本可能低至GPT-4的十分之一)、不输闭源模型的推理能力以及开源可自部署的灵活性,获得开发者青睐 [51][52][53][54] - Kimi K2是一个万亿参数级的开源MoE模型,在长文本处理和推理任务上表现优异,发布后短时间内即获得显著市场份额 [56][57] - 开源逆袭的关键在于真实世界的“好用”不等于基准测试的“高分”,用户选择是成本、延迟、定制性、隐私及“人设”匹配度等综合权衡的结果 [59][65] - 这对中国AI产业意味着,在推理能力等新方向上与国际顶尖水平的差距正在缩小,开源路线结合成本优势和特定能力可以形成强大的市场竞争力 [67][75] 真实应用场景与用户行为 - 驱动token使用量的两大核心场景是创意写作和编程 [71] - 在编程场景中,代码生成、解释和debug是高频需求,AI的价值不仅在于“生产力”,更在于“理解力” [73][74] - 在创意写作中,AI主要作为“创意合伙人”与人类共创,而非完全替代 [77][78] - 角色扮演占据了相当大比例的使用量,这揭示了人类与AI交互中存在“情感连接”的维度,满足了陪伴、娱乐等需求 [80][81][82] - 全球使用模式存在地区差异,例如北美多用于专业工作,亚洲多用于学习和创意,欧洲更偏好隐私和开源模型,体现了AI应用的本地化特征 [84][88] 模型“人设”与用户选择 - 用户能感知到不同AI模型的独特“性格”,如GPT-4的博学严谨、Claude的细腻谨慎、Gemini的快速直接、DeepSeek的专注深入,这些构成了模型的“人设” [89][94] - 报告发现,某些在学术基准测试中表现一般的模型,却因“人设”受欢迎而拥有出色的用户留存率 [96][97] - 用户体验到的“突破性能力”(如卓越的代码、长文本、多模态或推理能力)能建立用户忠诚度,促使用户迁移并不再返回 [100][102] - 这对AI公司的启示是:不应只追求基准分数,而需打造差异化“人设”并在细分场景做到极致,同时突破性创新是建立护城河的关键 [103][104][105] 对中国AI产业的启示 - 积极信号:DeepSeek R1和Kimi K2在全球真实市场中站稳脚跟,证明中国开源推理模型已具备全球竞争力 [108][109][110] - 现存挑战:在开发者工具、生态集成及海外品牌认知方面,与国际领先者仍有差距 [112][116] - 重大机遇:“推理革命”和“代理式AI”是新赛道,中国公司在工程能力和丰富应用场景方面具有优势,存在弯道超车的机会窗口 [113][114][116] - 发展建议:聚焦推理和代理能力;采用“开源+商业”双轮驱动;重视开发者体验等软实力;打造差异化“人设”而非简单模仿 [115][117][118][119] 对普通人日常的影响 - 工作方式重构:AI正成为各行业从业者的必备技能,其价值在于将人从重复劳动中解放,聚焦于更高价值的洞察、创新与决策 [122][126] - 学习方式升级:AI能提供个性化、沉浸式的学习辅导,如实时答疑、语言对话、知识讲解,有助于消解教育资源不平等的问题 [127][131] - 娱乐方式扩展:AI创造了如角色扮演、互动小说等“主动共创”的新娱乐形态,超越了传统的被动观看 [132][134][135] - 需警惕的风险:包括对AI的依赖性可能导致独立思考能力退化、数据隐私问题、信息茧房效应以及AI生成内容的真假难辨 [136]
MiniMax和月之暗面:中国AI创业公司的两种路径和共同难题
创业邦· 2025-11-28 10:14
公司核心发展历程与战略演变 - 月之暗面与MiniMax是中国大模型领域的明星创业公司,创始人杨植麟和闫俊杰被称为“双子星”,均以追求AGI为目标 [9] - 两家公司起步方式不同:MiniMax由闫俊杰于2021年底创立,首轮融资获高瓴领投2000万美元,投后估值达2亿美元 [12][13];月之暗面由杨植麟于2023年初推动团队独立成立,起步融资遇挫后由红杉、真格等机构投资 [13][17] - 公司均通过C端产品实现早期爆发:MiniMax的Glow上线4个月注册用户超500万 [17];月之暗面的Kimi连续数月月活用户环比增长超100% [19] - 2024年初两家公司获得大额融资:月之暗面获阿里投资近8亿美元,估值达23.4亿美元 [19];MiniMax获阿里投资6亿美元,估值超月之暗面 [20],两笔融资合计超14亿美元(100亿元人民币) [20] 技术路线与产品策略 - MiniMax技术路线选择多模态模型,是中国最早推出MoE模型的团队之一,闫俊杰将AGI视为“普通人每天都会用的一个产品、一个服务” [9][12] - 月之暗面更执着于无损的语言模型本身的力量,一度不怎么在意MoE,杨植麟提出“Lossless long context is everything” [9][35] - 2024年面临竞争压力时两家公司曾扩张产品线:MiniMax同时推进多条产品线,员工增至400人 [22];月之暗面定下覆盖多个方向的目标,员工翻一番 [22] - DeepSeek爆火后两家公司重新聚焦模型研发:月之暗面发布并开源万亿参数MoE模型Kimi K2,宣称部分维度超过DeepSeek-V3和阿里Qwen3 [28];MiniMax将重点从“模型与产品并重”收缩到“模型优先”,10月开源语言模型M2在OpenRouter使用量进入前五 [29][31] 创始人管理风格与组织能力 - 闫俊杰崇尚“系统理性”,将公司视作可设计和优化的函数,管理核心是找到“梯度下降最快的方向”,决策如不做3D、选择MoE属于“算出来的结果” [9][34] - 杨植麟相信人才的力量和“共识驱动”,倾向于先达成共识再迅速行动,愿意为招揽技术人才投入大量时间 [9][34] - MiniMax组织经历密集流动:早期一百名员工已走一半,对齐团队两年内换三任负责人 [31];闫俊杰明确表示“不是同路人的同事会请他们离开” [32] - 月之暗面精英策略在视频模型和出海产品上未达预期,视频模型仅联合创始人在朋友圈发布几条视频,出海产品Ohai和Noisee几个月后停止运营 [25] 行业竞争格局与资本环境 - 大模型是资本密集游戏,OpenAI估值达5000亿美元,xAI和Anthropic估值逼近2000亿美元,而MiniMax和月之暗面估值均在40亿美元左右 [36] - 中国巨头公司成为主要竞争对手:字节跳动发动饱和式进攻,产品线覆盖一切,并严格控制外部AI产品在抖音上的投放 [26] - 资本意志深度介入公司经营,投资人频繁提供增长建议,部分美元基金退潮后,拥有大规模资金的巨头不愿为创业公司持续输血 [26][36] - 创业公司面临根本挑战:在巨头林立、算力稀缺、资本收缩的市场中,是否还有空间容纳既做基础研究又不属于任何巨头的AI公司 [38]
月之暗面目标明年下半年IPO,接近达成新一轮融资,估值或达40亿美元
搜狐财经· 2025-11-24 09:49
融资与资本规划 - 公司最新一轮融资已进入收尾阶段,估值有望提升至约40亿美元(约合284.7亿元人民币)[2] - 公司正与IDG资本等多家全球机构洽谈,整体融资规模可能达到数亿美元,潜在投资方包括现有股东腾讯[2] - 公司希望在今年年底前完成本轮融资,并已向部分潜在出资方表示目标在明年下半年启动IPO[2] - 公司此前于去年8月从腾讯、高榕资本等投资方获得逾3亿美元的B轮融资,并已吸引阿里巴巴集团、红杉中国等重量级投资者[7] 技术与产品进展 - 公司核心技术团队聚集了Transformer-XL、RoPE、Group Normalization、ShuffleNet、MuonClip、Mooncake等多项关键AI技术的发明者[3] - 凭借万亿参数基础模型Kimi K2,公司为全球开源技术社区带来先进的代码和Agentic能力,其AI助手产品Kimi每月有数千万专业用户[3] - 公司发布并开源思考模型Kimi K2 Thinking,具备边思考边使用工具的能力,可自主实现300轮工具调用和多轮思考能力[4] - Kimi K2 Thinking在HLE测试中取得44.9%的成绩,超过GPT-5、Claude-4.5、Grok-4等美国顶尖闭源模型[4] - 在智能体工具调用测试中,Kimi K2 Thinking得分达到93%,为第三方机构测量到的最高分;在智能指数中以67分排名第三[4] - Kimi K2 Thinking训练成本为460万美元,在Hugging Face上线两天下载量即超过5万次[5] 行业定位与未来规划 - 公司作为中国AI产业快速崛起的代表之一,持续推动技术研发与商业化进程[7] - 行业内多家技术公司亦在加速推进上市计划,过去数月多家中国AI企业推出更具竞争力的模型产品,定价低于美国头部模型或以开源形式免费发布[7] - 公司已着手筹备下一代模型研发,创始人表示会在奥尔特曼那座万亿美元数据中心建好之前发布K3模型[7]