Kimi
搜索文档
豆包DAU破亿,成字节史上推广费用最少的破亿产品
36氪· 2025-12-24 11:23
最新数据显示豆包的日均活跃用户数(DAU)已突破1亿大关。豆包的UG、市场推广费用,是字节历史上,所有破亿DAU产品中花费最低的,并且产品留 存表现不错。 值得注意的是,在过去两年的AI产品推广中,豆包其实是相对低调的那一个,没有做大规模的市场投放。 据AppGrowing数据,2024年,国内十款大模型产品合计投放超625万条广告,投放金额达15亿元。其中投放最激进的是月之暗面的Kimi,累计投放5.4亿 元,单是10月就超2亿元。 据最新召开的火山引擎Force原动力大会披露,截至今年12月,豆包大模型日均使用量已突破50万亿tokens,排名中国第一、全球第三,仅次于OpenAI和 Google Cloud。根据IDC统计,火山引擎的公有云大模型服务已占据中国市场近半数份额,比例达到49.2%,大幅领先于其他云厂商。 本文来自"智通财经",作者:宋佳楠,36氪经授权发布。 2025年上半年,腾讯元宝持续发力推广。AppGrowing数据显示,自今年2月开始,元宝的投放金额一路走高,截止到7月的累计投放额近60亿元。元宝也一 度登顶中国区App Store免费App下载排行榜。 | 2 | | | | - ...
月之暗面Kimi:昔日明星独角兽已陷战略困局
新浪财经· 2025-12-23 16:07
行业竞争格局 - 根据QuestMobile报告,在最新统计周期(12月8日至12月14日)内,周活跃用户规模Top 10的AI APP中,有6个通用AI和4个垂类AI,形成分庭抗礼格局 [4][23] - 字节系有3个应用上榜,蚂蚁集团有2个应用上榜 [4][23] - 通用AI在用户规模上领先优势明显,其中豆包的周活跃用户规模达1.55亿,DeepSeek为8156万,元宝为2084万 [4][23] - 全市场AI原生App最新周活跃用户排名前四为豆包、DeepSeek、元宝、蚂蚁阿福,阿里千问位列第五,蚂蚁集团11月发布的通用AI助手灵光进入前十 [2][21] - 月之暗面旗下的Kimi已跌出周活跃用户排名前五 [4][23] 月之暗面(Kimi)发展轨迹与现状 - 2023年至2024年初,公司凭借“长文本处理”技术迅速崛起,估值在一年内飙升至超30亿美元,创始人杨植麟被誉为“中国大模型第一人” [4][23] - 进入2025年,行业格局剧变,DeepSeek异军突起,豆包、腾讯元宝依托生态强势碾压 [6][25] - Kimi的月活跃用户(MAU)从高峰时的超3600万滑落至1830万左右,不到头部竞品DeepSeek(约1.94亿)的十分之一,排名从行业第二跌至第四 [6][25] - 2025年第三季度,Kimi的月活跃用户数从2024年底高峰时的约2100万滑落至约967万,排名跌至第五位左右 [13][33] 公司治理问题 - 2024年底,因香港仲裁案被推至风口浪尖,以金沙江创投朱啸虎为代表的循环智能老股东指控创始人杨植麟及其联合创始人在未获全部投资人书面豁免的情况下便“另起炉灶”创立月之暗面并融资 [6][26] - 争议焦点涉及利益分配失衡,前金沙江创投合伙人张予彤在推动阿里投资后加入公司并获得大量股权(据称相当于初始股份的14%),远超作为“孵化母体”的循环智能所获补偿(9.5%),且被指存在隐瞒利益冲突、违背“受托责任”之嫌 [6][26] - 公开的仲裁与纠纷严重动摇了资本市场对公司治理结构的信心,成为后续融资尽职调查中的巨大“负面清单” [8][28] 激进商业化与增长模式 - 2024年,公司采取激进的“烧钱换增长”模式,单月广告投放金额最高时接近2亿元人民币,一度在B站等平台形成“刷屏”之势 [8][28] - 该模式在短期内将月活推至行业第二,但用户留存率极低,2024年6-8月用户平均使用天数仅为4天,平均时长不足两分钟,头部AI应用的3日留存率普遍低于50% [10][30] - 当腾讯、字节等巨头入场后,营销战升级为资源消耗战,2025年第一季度腾讯元宝单季投流金额高达14亿元,作为独立创业公司的Kimi难以企及 [10][30] - 在用户粘性未建立时过早尝试商业化,推出会员订阅及引入“打赏”功能(付费换取高峰期优先使用权),被用户吐槽为“花钱买罪受”,加速了用户体验恶化和流失 [11][31] 恶性循环与战略收缩 - 运营数据下滑叠加公司治理负面舆情,导致公司在资本市场融资困难,最近一轮融资为2024年8月,2025年新增融资停滞 [11][31] - 大约从2025年2月开始,公司进行“战略急刹车”,营销投入出现断崖式下降,大幅削减并几乎全面暂停在各大渠道的付费广告投放 [12][32] - 战略从“扩张”转向“收缩”与“聚焦”,被市场解读为资金压力巨大,意味着公司已无力继续参与由巨头主导的营销消耗战 [12][32][36] - 公司内部反思认为,靠巨额营销费用买来的用户留存率低,难以形成健康的产品生态,削减营销预算也是对增长模式的一次修正 [15][35] 战略转向与垂直领域挑战 - 公司放弃在图像、音视频等多模态领域与巨头赛跑,转而聚焦金融、医疗、法律、科研等垂直专业领域 [16][36] - 具体举措包括与财新传媒合作增强财经内容信源、布局AI医疗产品、探索智能体(Agent)和社区功能 [16][36] - 但在垂直赛道面临挑战:DeepSeek等对手同样在垂直领域密集布局,且凭借开源生态和更低成本已接入大量机构,公司先发优势微弱 [17][37] - 垂直领域专业壁垒高,有评测显示在金融财报分析等任务中,Kimi出现过基础数据错误,与财新的合作被反馈为“金融术语堆砌,结论缺乏洞察” [17][37] - 公司作为应用层产品,缺乏像微信、抖音那样的原生生态和数据闭环,在争夺行业客户时难以与拥有云服务、全套解决方案的科技巨头抗衡 [17][37] 核心观点总结 - 公司衰落根源是系统性的战略困境,始于公司治理的先天瑕疵,误判形势选择了不可持续的“烧钱换增长”和过早商业化,在数据下滑和融资窗口关闭后被迫战略收缩,而仓促转向的垂直领域又面临高壁垒和激烈竞争 [18][38] - 在AI这场综合竞赛中,单一的技术亮点如同流星,真正的护城河是稳健的公司治理、清晰的战略节奏、健康的商业模式以及与生态共生的能力 [18][38]
警惕“语料投毒”,守住AI问答法治底线丨法经兵言
第一财经· 2025-12-23 12:26
生成式引擎优化(GEO)的定义与兴起 - 生成式引擎优化是一项随着生成式AI问答兴起的新型数字营销技术 其核心是通过优化内容使其适配大语言模型的检索偏好 从而提升特定品牌或产品在AI回答中的引用率和优先展示度[1][2] - 该技术的具体操作包括围绕目标品牌关键词撰写结构严谨、数据丰富的文章 并发布在AI模型常抓取的第三方高权重平台上 通过关键词挖掘、内容生成和平台投放等步骤训练AI理解并推荐特定品牌[2] - 生成式AI问答平台正成为新的流量入口 截至2024年12月 中国生成式AI产品用户规模达2.49亿人 占整体人口的17.7% 其中利用AI回答问题的用户使用率高达77.6% 吸引了品牌方的高度关注[3] GEO市场规模与灰色产业化 - 中国GEO市场规模预计将从2025年的21亿元人民币 暴涨至2027年的242亿元人民币 显示出极高的增长潜力[1] - 围绕GEO的广告投放已形成灰色产业链 个别服务商提供从品牌付费、软文铺稿到优化数据抓取的完整服务 广告中介设置付费包月服务以实现品牌稳定植入AI回答[1] - 相关服务在电商平台有售 包括批量发布软文的工具 服务报价根据关键词数量、平台数量和时长等因素 从每年数千元到数十万元人民币不等[1][4] GEO技术滥用的表现与危害 - 滥用GEO技术的主要手段包括“语料投毒”、“提示词注入”、“流量劫持”和“伪造虚假信源”等恶意操作 其本质是通过影响用户选择来干扰他人网络服务的正常运行[1][2] - 技术滥用导致客观中立的AI回答异化为暗中付费的广告 批量生成的虚假软文污染AI训练语料 使得虚假内容压制了优质信息 破坏了内容供给结构[5][6] - 滥用行为干扰了算法的公正性和透明度 由于大模型的“黑箱”工作机制 平台难以精准识别并剔除所有恶意植入内容 这破坏了算法结果的客观性和准确性 损害用户信任并扰乱平台运营秩序[6] - 黑帽GEO行为演变为扭曲市场公平竞争秩序的不正当手段 形成了虚假宣传、混淆行为等不正当竞争 妨碍了其他合法经营者获得流量的机会 并侵害了消费者获取客观信息的权益[2][6] 针对GEO的治理框架与平台责任 - 在法律规范层面 需加快建立健全生成式人工智能内容治理法律体系 明确GEO行为的法律定性 细化黑帽与白帽GEO的合规边界 并细化AI平台在治理中的责任义务与法律后果[7] - 平台应压实主体责任 构建全流程监管 具体措施包括建立广告识别机制 对回答中的显著商业推广信息进行标记提示 并对异常高频出现特定品牌的回答进行评估处理[8] - 平台应构建可信语料库 建立信息可信度分级体系 设立监控机制 并在模型训练和联网抓取环节过滤明显的垃圾营销信息 剔除含异常广告倾向的内容来源[8] - 平台应强化模型输出可控性 履行信息内容管理主体责任 通过引入人工或第三方审查 定期抽检模型输出以发现并清理营销内容 将治理技术融入模型设计和运营全流程[9] 行业共治与消费者权益保护 - 应健全行业自律与第三方参与的共治机制 各大平台可联合制定自律标准 明确禁止数据投毒等GEO行为 行业协会可对落实情况进行监督检查[9] - 可引入独立的内容监管机构、行业组织或消费者权益保护机构作为第三方 定期抽查AI问答内容合规性 发现隐性广告和虚假信息后及时反馈平台整改[9] - 需完善消费者权益保护渠道 平台层面应设立专门的投诉入口 便于用户提交涉及AI生成内容中虚假广告的投诉 并由平台迅速核查处置[10] - 监管层面应明确受理此类投诉的主管机关 建立跨部门协作处理流程 对经查属实的GEO虚假广告行为依法处罚 并督促相关平台整改[10]
观察 | AI圈IPO大战打响!MiniMax/智谱,谁是真王者?普通人该怎么选?
未可知人工智能研究院· 2025-12-23 09:02
文章核心观点 - MiniMax与智谱AI虽同处AI行业并寻求上市,但代表了两种截然不同的商业模式和生存逻辑[5][11] - MiniMax是一家生而全球化的C端应用公司,依靠产品口碑和订阅模式实现高效增长,而智谱AI是一家本土化的B端服务公司,依靠资源背景和价格战抢占市场份额[7][8][9] - 从投资角度看,智谱AI在短期内因政策与客户资源具有确定性优势,而MiniMax在中长期因全球化市场和商业模式更具增长潜力[25][31][37] - AI行业的竞争格局显示,拥有清晰商业模式和高效执行力的公司更可能穿越周期,而单纯依赖流量或烧钱模式的公司面临挑战[24][39] 公司对比分析:MiniMax vs. 智谱AI - **商业模式差异**:MiniMax收入71%来自C端产品(如海螺AI、星野),且其中超70%来自海外市场,本质是全球化C端订阅模式[6][7][10];智谱AI收入主要来自国内企业客户,是典型的B端模式[8] - **财务表现对比**:MiniMax累计研发投入约5亿美元,不到OpenAI的1%,但已拥有2亿用户、近3000万月活,覆盖200多国,毛利率从2023年的-25%转为2024年前三季度的+23%[14][15];智谱AI三年半累计亏损超60亿人民币,仅2024年就亏损近30亿,且亏损在加速[16] - **市场与客户**:MiniMax市场分布全球化,2025年前九个月收入中,中国大陆占26.9%,新加坡占24.3%,美国占20.4%,其他地区占28.4%[12];智谱AI客户集中度高,前五大客户贡献40%收入,主要依赖国内市场和政策红利[26][28] - **增长逻辑**:MiniMax依靠产品驱动和自然增长,在海外市场基本不投广告,DAU稳定增长,付费用户从2023年的12万暴涨至2024年的近70万[22][23];智谱AI通过价格战争夺市场份额,其云端部署毛利率从2022年的76%暴跌至2024年上半年的负数[9][30] AI行业竞争格局洞察 - **头部应用市场地位**:根据2025年9月数据,豆包月活1.6亿位居第一,DeepSeek月活1.4亿位居第二,Kimi月活已跌至不足1000万,仅为豆包的5%[21] - **创业公司生存策略**:面对字节(豆包)、阿里、腾讯等大厂的巨额投入围剿,创业公司需选择差异化路径,如MiniMax选择出海,智谱AI选择绑定国资[23] - **商业化能力是关键**:能上市的AI公司通常是商业模式最清晰的,而非用户最常用的[24];DeepSeek虽有流量但商业化模式不清晰,Kimi需尽快找到稳定盈利模式以支撑至IPO[22][39] 从招股书衍生的行业机会 - **垂直化AI工具**:MiniMax证明在视频生成、AI社交等垂直领域打造工具比做通用大模型更容易变现,在细分领域解决具体问题是重要方向[40][41] - **出海战略**:海外市场对AI工具付费意愿更高,MiniMax超70%收入来自海外,从业务起始就考虑国际化是有效策略[42] - **AI基础设施服务**:算力成本仍是行业大头,提供算力租赁、模型训练优化、推理加速等基础设施服务的公司将拥有巨大价值[43][44]
月活暴跌70%背后,Kimi走在钢索之上
36氪· 2025-12-19 13:19
文章核心观点 - AI行业正从技术叙事转向结果叙事,市场开始要求清晰的商业落地与资本路径,商业化压力凸显[7] - 月之暗面公司旗下产品Kimi面临增长放缓、竞争加剧和商业化挑战,公司通过人事调整将张予彤推向台前,以总裁身份全面负责战略与商业化,应对行业变局[7][10][11] - Kimi的战略方向从依赖营销和流量刺激,转向聚焦底层技术迭代与智能体落地,寻求在有限资源下将技术优势转化为用户价值与商业回报[27][28][32] 行业背景与转向 - AI行业整体已进入商业兑现期,市场不再持续为“参数”、“算力”买单,更关注应用落地与不可替代的价值[7][15][34] - 投资重心向应用层倾斜,资本更青睐能将技术落地到核心业务、形成可量化经济价值的项目,垂直化、深度绑定业务流程的解决方案更受关注[35] - 行业竞争标准改变,早期涌入的创业团队完成初步验证后,用户注意力和流量逐渐向大厂生态集中,独立AI应用的生存空间被压缩[34][35] Kimi的现状与挑战 - 用户增长大幅下滑:截至2025年9月,Kimi的月活跃用户数下滑至967.23万,相比去年底一度突破的3600万,出现显著下降[16][18] - 面临激烈竞争:在AI原生App月活榜单上,豆包、DeepSeek的月活已破亿,腾讯元宝也达到3285.66万,Kimi仅排名第五[16][18] - 商业化模式单一:收入仍以订阅模式为主,整体付费率较低,尚未形成多元化、可复制的收入结构[19] - 产品与技术迭代滞后:在资源过度倾向营销时,多模态能力、视频理解等关键方向未能及时跟进,早期技术护城河被侵蚀[26][27] 人事调整与战略应对 - 张予彤以Kimi总裁身份走向台前,将全面负责Kimi的整体战略与商业化,包括融资决策,并直接参与部分新产品开发[10][11] - 此次履新发生在行业要求明确商业化路径及公司IPO预期形成的窗口期,旨在回应市场对公司治理结构、管理层稳定性及商业化能力的要求[15] - 张予彤与月之暗面深度绑定,自2023年起参与Kimi多轮融资,包括2024年帮助公司完成阿里超10亿美金融资[12] 未来战略方向 - 战略收敛,聚焦技术与产品深度融合:将精力放回模型迭代和Agent落地,强调通过底层算法与基础设施协同优化,实现“单位算力产出最高的智能价值”[28][32] - 展示技术进展:Kimi K2模型在基准测试中超越GPT-5、Sonnet 4.5等顶尖闭源模型,支持长链路、多步骤任务执行[28] - 推出Agent模式“OK Computer”:支持包括图片生成、音频生成在内的20多种工具,提供从设计、产品定义到开发部署的全流程能力[30] - 在有限资源下做出差异化选择:公司资金不到海外顶尖模型的1%,人员投入只有对手的10%,致力于将模型能力转化为用户可感知的实际价值[28][31]
国产大模型叩响资本市场大门
北京商报· 2025-12-18 16:00
从12月17日晚间到12月18日,大模型赛道的热门话题围绕MiniMax和智谱展开。有消息称,国内大模型 领军企业MiniMax(稀宇科技)与智谱AI均已获得中国证监会境外发行上市备案,并于本周先后通过港 交所上市聆讯,进入港股上市前的最后阶段。尽管双方暂未公开置评,港交所也还未披露招股书,但知 情人士向北京商报记者透露,面向公众层面的信息确认只是时间问题。这场IPO冲刺进入收官阶段,国 产大模型的上市竞速将迎来终局,行业淘汰赛是否同时开启? "双雄"抢跑 "智谱AI于12月17日在港参与并通过了聆讯",12月18日,知情人士向北京商报记者透露。 MiniMax亦被曝于12月17日通过了港交所聆讯,计划于2026年1月在港挂牌上市。截至北京商报记者发 稿,MiniMax和智谱对此保持沉默,港交所也尚未公布两家公司聆讯后资料集。上述知情人士表示,港 交所将在近期发布公开信息。不出意外的话,这两家公司可能成为中国内地企业赴港上市"报备制"以 来,在港过聆讯最快的案例。 同日通过聆讯,目标均为港交所,这与不久前实现美股+港股双重主要上市的小马智行和文远知行的轨 迹相重叠。 当下同频的MiniMax和智谱,上市路径略 ...
月活暴跌70%背后,Kimi走在钢索之上
钛媒体APP· 2025-12-18 08:26
文 | 听潮TI,作者 | 郭佳哿,编辑 | 张晓 最近,《时代》刚发布的年度人物封面选择复刻那张诞生于经济大萧条时期的经典照片《摩天大楼上的 午餐》。 不同的是,这一次坐在高空钢梁上的,不再是工人,而是八位被视作"推动人类进入AI时代"的关键人 物。 图/时代周刊 这个位置本身,也正是当下整个AI行业所处的现状。在一个尚未完工、规则仍在快速变动的系统中, 没有人真正处在安全地带。脚下是技术红利逐渐收敛的现实,身后是尚未被验证的商业模式,而市场已 经开始要求答案。 谁来负责商业化?谁来回应增长与现金流?这些问题开始从幕后,被推到台前。对于那些尚未背靠大厂 生态、主要依靠单一产品形态生存的AI公司而言,这种转向带来的并不是机会,而是压力。 也正是在这样的压力之下,张予彤首次以"Kimi 总裁"的身份走向台前,正式承担对外核心职责。这一 人事变化本身并不高调,只是在外界持续质疑Kimi融资节奏、算力成本与长期现金流模型的当下,行 业需要看到一条更清晰的商业落地与资本路径。 曾经,Kimi因技术稀缺性站上聚光灯;如今,当聚光灯转向"落地与回报",它也被推到了必须作答的位 置。 01从幕后到台前:当张予彤有了确定性新 ...
张予彤入主月之暗面,kimi该去哪“爆金币”?
36氪· 2025-12-18 03:54
公司管理层变动 - 张予彤已正式出任月之暗面Kimi总裁,负责公司整体战略与商业化 [1] - 市场猜测其出任总裁意味着与金沙江创投的股权纠纷已得到妥善解决 [1] 行业技术竞争格局 - 大模型初创企业的技术领先优势窗口期极短,遵循“开放-复制-追赶”路径 [2][3] - 国内开源生态盛行及技术壁垒不高,导致任何有效突破会迅速被行业消化和集成 [3] - 领先的闭源模型相比同性能开源模型的优势窗口期可能仅约6个月 [3] - 行业竞争激烈,各家巨头在拥有巨量算力的情况下差距不大,最强模型通常是最新发布的模型 [4] - 除了少数致力于底层架构革新的公司,多数玩家陷入功能混战,难以维持“人无我有”的技术压制 [5] 公司竞争地位与挑战 - 月之暗面Kimi在2024年凭借长文本处理能力(如20万、50万甚至200万Token上下文窗口)获得技术红利和用户体验优势 [2] - 至2025年,其长文本处理能力已成为行业基线,技术光环不再耀眼 [1][5] - 公司面临的最大挑战已从技术突破转变为在技术快速普及的时代重新定义生存价值和实现商业化 [5] 行业商业化压力 - 独立的AI初创公司普遍面临将高昂算力成本转化为实际营收的生存挑战 [6] - 背靠互联网或通讯巨头的团队拥有资金和现成场景优势,而独立AI独角兽需从零开始寻找资金和应用场景 [7] - 商业化能力已成为决定AI创企生死的必选项,而非加分项 [9][10] - 即便是全球领跑者OpenAI(估值5000亿美元)也面临持续的商业化压力,并需通过披露业务预测来获取融资 [9] 公司商业化路径与举措 - 对于像Kimi这样的独立大模型公司,商业化路径有限,面向终端用户的订阅制几乎是关键的“救命稻草” [11] - 公司已推出一系列举措,包括上线高级功能、提供更稳定的API服务以及尝试“AI砍价”等创新营销,旨在将高频用户转化为付费用户 [11] - 张予彤的核心任务是在技术优势消退的背景下,为公司重新锚定生存价值并找到可持续的商业模式 [11] - 公司必须在算力投入与产出回报之间找到可持续的平衡点 [11]
月活不足豆包5%,Kimi跌下神坛
36氪· 2025-12-18 01:21
文章核心观点 - 月之暗面及其产品Kimi在2024年凭借超长文本处理能力迅速崛起,成为明星AI独角兽,但在2025年因产品创新不足、资源分散及竞争对手冲击,用户规模大幅下滑,从行业领先地位跌落 [1][6][12] 公司发展历程与早期成功 - 公司于2023年4月由杨植麟创立,初始团队仅5人,资源远逊于行业巨头及其他“AI六小龙” [2] - 创立6个月后推出AI助手Kimi,成为全球首个能处理20万字超长文本的AI产品,当时能力远超ChatGPT-4(2.5万字)和Claude-100k(8万字) [2] - 2024年4月,Kimi文本处理能力提升至200万字,较最初提升10倍 [2] - 凭借卓越性能,Kimi在法律等领域测试中表现优异,分析百万字合同仅需8分钟,错误率比资深律师低60% [4] - 多家券商曾高度看好Kimi,认为其文字能力全面达到GPT-4水平,生成速度甚至更快,有望成为国内C端爆款应用 [4] 用户增长与资本表现 - 2024年2月,Kimi月访问量仅为300万次;至2024年12月,月活跃用户规模达2101万,十个月内增长700% [5] - 2024年2月,公司获得由阿里巴巴等参与的10亿美元融资,估值达25亿美元,成为当年国内大模型赛道估值最高的独角兽 [5] 竞争格局变化与用户下滑 - 2025年春节前后,DeepSeek横空出世并迅速席卷市场 [6] - 2025年1月10日至2月8日期间,DeepSeek全端日活规模达11979万,同期Kimi日活仅688万,为DeepSeek的5.7% [6] - 至2025年9月,Kimi月活跃用户降至967万,仅为九个月前(2025年2月)规模的46% [6] - 2025年9月,Kimi在原生AI应用中排名第五,月活规模仅为豆包的5.6%、DeepSeek的6.7% [6][7] - 2025年第三季度,Kimi月活规模量级降至500-1000万,季度复合增长率为-4.3%,排名下降1位,量级下降1档 [7] 产品创新不足与功能对比 - Kimi在2025年的核心功能(如OK Computer、深度研究、PPT助手)缺乏独特性和创新,部分功能体验不佳或与其他产品同质化 [8] - 竞争对手如豆包、腾讯元宝等持续推出创新功能,包括音乐生成、视频生成、实时视频通话、AI播客、读Excel、文生图、高考志愿咨询、图片AI编辑等,快速进入多模态和深度应用阶段 [9] - 当行业进入生活工作应用阶段时,Kimi仍主要专注于文本分析,不支持图片生成等流行功能,导致用户吸引力下降 [9] 公司战略与资源分配问题 - 公司在2024年将精力和资源分散至商业化尝试和员工激励,而非持续聚焦于底层技术创新 [10][12] - 2024年5月推出“打赏功能”,9月推出会员订阅(49元/月、99元/月、199元/月三档),而同期多数主流大模型对C端用户采用免费模式 [10] - 2024年4月,市场传闻创始人通过售股套现数千万美元,创始人及相关人员套现金额达4000万美元,公司随后公布员工激励计划 [11] - 公司早期联合创始人张予彤的入职传闻及后续确认,也反映了内部注意力可能被分散 [11][12] - 过早的商业化和内部事务导致公司在产品创新和迭代速度上弱于竞争对手 [12]
深度| 大模型年终观察,如何定义2025年的"好模型"?
Z Potentials· 2025-12-17 12:00
文章核心观点 - 2025年AI行业正经历从追求“跑分”到建立“信任”的深刻范式转变,行业共识是开源模型正从“可选项”成为“默认使用的必选项”[1] - 衡量模型的标准正从“选秀式逐冠军”转向“基建式找伙伴”,模型的基础能力是入场券,而由评测、部署、交付三个维度构成的“信任”是AI融入业务流程的通行证[2][3] - 行业已出现从“技术玩具”到“生产工具”的拐点,驱动力量从“新奇”变为“信任”,未来竞争核心将是业务可靠性、卓越运营、可控性、安全性与可观测性[12][31] 行业趋势:从尝鲜到留存,生产力拐点已现 - 开源模型调用量在关键发布后,首次实现了“峰值后高位平稳”,而非断崖式下跌,标志着真实使用和留存的开始[5][15] - 开源权重模型的token份额在2025年底稳定突破了平台总量的三分之一[5] - 用于复杂推理、规划和代理任务的“推理类模型”调用量爆炸式增长,其token消耗份额从2024年底几乎可忽略不计飙升至超过50%[8] - API调用的平均任务长度显著上升,从2023年后期不足2000 tokens增长到2025年后期超过5400 tokens,表明真实世界的复杂任务正稳定交给AI完成[8][9][12] 评测体系:从分数游戏到多维共识 - 模型发布初期,赢得关键榜单头筹仍是获取关注的“入场券”[13] - Kimi K2 Thinking是2025年典型代表,在Artificial Analysis的Intelligence Index上获得开源模型最高分,并在LMSYS Chatbot Arena开源模型中排名第一,从而获得全球关注[14][18] - 行业正形成多维评测体系,主要包括两类: - **数据驱动型**:以Artificial Analysis为代表,采用“智能指数+成本指数”双轴框架评估“性价比”,涵盖智能度、成本、可控性、生态适配度[20] - **使用实证型**:以OpenRouter为代表,基于其积累的100T tokens真实调用数据,评测模型在生产中的成功率、序列长度、调用失败率等,峰值后的高位调用量是产品力最直接证明[22] - 资深从业者的实际选择成为新维度,如前OpenAI CTO创办的公司在其产品中集成Kimi K2 Thinking以支持复杂推理[18] 部署能力:产业化与成本透明化 - 可部署性是建立信任的第二地基,企业关注“跑得起、跑得稳、跑得久”[24] - 硬件支持取得突破,NVIDIA数据显示Kimi K2 Thinking、Qwen2等MoE模型在GB200 NVL72架构上实现了10倍推理加速,同时每token成本降低90%,证明其大规模产业化部署潜力[24] - 云端推理平台推动部署成本透明化,如Fireworks、Together、OpenRouter公开每百万tokens的精确报价,使模型调用像云计算资源一样“明码标价”[24] 交付保障:治理、观测与复现 - 交付是确保模型在企业环境中“跑得稳”的最后一公里,关乎可治理、可观测、可复现[25] - **可治理**:2025年Q4,AWS、Azure、Google Cloud三大云厂商几乎同时将Claude、Kimi、Mistral等顶级模型纳入其企业级托管服务,使模型可通过统一API调用并享受平台的安全、权限管理和SLA保证,正式进入企业IT治理框架[26] - **可观测**:行业在工具调用可观测性上取得进展,OpenRouter推出的exacto系统能量化和监控模型在工具调用任务上的表现方差,通过遥测数据确保稳定性和一致性[27] - **可复现**:行业迈出关键一步,例如Hugging Face展示的Kimi K2 Thinking应用示例清晰记录了模型执行多步工具链的全过程trace,使模型能力进入“流程可复现、任务可交付”阶段[30] 未来展望:业务可靠性与卓越运营 - 2026年的关键词是“卓越运营”,未来焦点将是任务完成率、生产稳定性以及与真实工作负载的对齐[31] - 未来竞争的核心不再是智能度,而是可控性、安全性与可观测性[31] - 赢得信任的模型才可能成为真正的生产力,信任的建立是工程化的结果[32]