报告核心观点 - 基于对OpenRouter平台自2024年11月至2025年11月超过100万亿Token使用量的分析,报告揭示了AI行业的发展趋势,核心观点包括开源模型与闭源模型形成互补、中国开源模型影响力显著提升、模型使用范式向推理与工具调用转变、编程与角色扮演成为主要应用场景以及用户留存呈现“水晶鞋效应”等 [3][5][6][70] 开源与闭源模型格局演变 - 开源模型使用量持续增长,预计到2025年底将达到总使用量的约三分之一,与闭源模型形成互补关系,而非简单的替代关系 [5][6][71] - 开源模型已找到独特定位,成为特定场景的首选,开发者倾向于同时使用开源和闭源两类模型 [6][71] - 中国开源模型成为增长主要引擎,其每周Token使用量占比从2024年底的1.2%最高激增至30%,平均占比为13%,而其他地区开源模型的平均份额为13.7% [2][7][10][74] - 开源模型市场格局从高度集中转向多元化,2025年上半年DeepSeek V3和R1占据一半以上份额,但下半年随着MiniMax M2、Kimi K2、GPT-OSS等模型发布,市场趋于分散,预计年底没有单一模型能持续占据超过25%的Token用量,市场将由5到7个模型均分 [13][77] 模型形态与架构趋势 - 开源模型形态发生变化,中型模型(参数在150亿到700亿之间)更受市场青睐,小模型(参数少于150亿)正在失宠,市场分化为强大的中型模型类别或整合到最强大的单个大型模型(参数为700亿或更多)上 [16][20][80][85] - 语言模型正从“语言生成系统”转变为“推理执行系统”,使用推理功能的Token用量从年初可忽略不计增长至超过50% [7][18][83] - 在所有推理模型中,马斯克xAI旗下的Grok Code Fast 1使用的推理流量份额最大,领先于Gemini 2.5 Pro和Gemini 2.5 Flash,而几周前Gemini 2.5 Pro还是主力 [21][86] - 模型调用工具的功能使用占比上升,年初该功能集中于GPT-4o-mini和Claude 3.5/3.7系列,年中后更多模型开始支持,生态系统更具竞争性,9月底后Claude 4.5 Sonnet、Grok Code Fast和GLM 4.5等新玩家取得进展 [24][89] 主要应用场景与使用方式 - 编程和角色扮演是AI模型的两大主要使用方式 [7][32][70] - 编程类查询的用量从年初的11%上涨至最近的超过50%,增长最为稳定 [32][97] - 在编程模型领域,Claude系列长期占据主导地位,大部分时间占比超过60%,但到2025年11月其市场份额首次跌破60% [35][100] - 同期,OpenAI在编程领域的市场份额从2025年7月的约2%增长至近几周的约8%,谷歌市场份额稳定在约15%,开源模型如Qwen、Mistral份额稳步提升,其中MiniMax被特别提及为快速崛起的新秀 [35][100] - 在开源模型中,角色扮演的使用量占比达到52%,几乎与编程持平,中国开源模型与西方开源模型在该领域平分秋色 [38][103] - DeepSeek的流量中有超过三分之二是角色扮演和闲聊,显示了其在消费者端的高粘性 [38][103] 主流模型的使用偏好 - Anthropic(Claude)超过80%的流量用于编程和技术任务,是主要的程序员工具 [41][106] - 谷歌模型用途相对宽泛,涵盖法律、科学、技术和常识性查询 [44][109] - 马斯克旗下的xAI同样专注于编程,其技术应用、角色扮演及学术用途在2025年11月下旬显著增长 [47][112] - OpenAI的使用重点随时间从娱乐休闲活动逐渐转向编程和技术类任务 [50][115] - Qwen模型同样发力编程端,角色扮演和科学类任务的使用量随时间有所波动 [52][117] 用户行为与市场动态 - 用户留存呈现“水晶鞋效应”,即新模型发布时若能完美解决特定痛点,就能锁定一批高粘性用户,例如Claude 4 Sonnet和Gemini 2.5 Pro发布5个月后用户留存率仍保持40% [7][55][120] - “水晶鞋效应”的窗口期很短,仅在模型刚发布被视为最前沿时有效,一旦竞品发布、能力差距被抹平,则难以再吸引新用户 [58][59][122][123] - 模型任务复杂度提升,从“写短文”变为“解难题”,用户平均每次提示词长度增加了约4倍,且由于推理消耗更多Token,完成任务所需的总Token用量增加了近3倍 [27][29][92][94] - 模型正演变为“自动Agent”,用户给出复杂目标后,模型能自行规划步骤、调用工具并维持对话状态以完成任务,从“聊天机器人”转变为“智能Agent” [32][97] - 模型价格下降对使用量的影响有限,价格下降10%仅带来使用量0.5%至0.7%的增长 [65][129] - 存在“杰文斯悖论”,即模型降价后,因使用更频繁、上下文更长,总Token消耗可能飙升,总支出未必降低 [60][124][125] 区域与语言市场变化 - AI使用不再是硅谷独角戏,亚洲地区的付费使用量占比从13%翻倍至31% [65][129] - 北美仍是最大市场,但份额已不足50%,地位相对下降 [65][129] - 英语以82%的份额占据绝对主导,简体中文以近5%的份额位居第二 [65][129]
100万亿Token揭示今年AI趋势!硅谷的这份报告火了
新浪财经·2025-12-08 12:28