Workflow
开放权重AI
icon
搜索文档
斯坦福报告揭秘中国开源AI全景:本土模型能否领跑全球?
搜狐财经· 2026-01-03 13:19
报告核心观点 - 斯坦福大学HAI与DigiChina项目联合发布的政策简报指出,中国开放权重AI模型已从全球追赶者变为领跑者,并形成了一个庞大且多元的生态系统,DeepSeek仅是其中一员 [1][3][42] 行业地位与市场数据 - 在开源大模型领域,中国已从追赶者变为领跑者 [4][30][43] - 阿里巴巴旗下的Qwen模型系列于2025年9月超越Meta的Llama,成为Hugging Face平台下载量最高的大语言模型家族 [4][17][44] - 截至2025年12月中旬,Qwen累计下载量达约3.85亿次,Llama约为3.46亿次 [4][17][44] - 2024年8月至2025年8月间,中国开发者的模型下载量占Hugging Face总下载量的17.1%,首次超过美国的15.8% [4][17][44] - 2025年9月,基于中国模型的衍生版本占Hugging Face当月新增衍生模型的63% [6][19][46] 主要参与者与模型特点 - 报告重点剖析了四个具有代表性的中国模型家族 [7][20][33] - **Qwen(阿里巴巴)**:定位于多语言和多模态能力最强的通用模型,支持119种语言,采用Apache 2.0许可证开源 [7][20][33] - **DeepSeek-R1(DeepSeek)**:以推理能力见长,在数学和复杂问题求解方面表现突出,提供多个蒸馏版本 [7][20][33] - **Kimi K2(月之暗面)**:聚焦于代码生成和智能体任务,强调快速推理 [7][20][33] - **GLM-4.5(智谱AI/Z.ai)**:走均衡路线,通过多专家训练整合推理、编程和视觉能力 [7][20][33] - 性能榜单显示,中国模型(如GLM-4.6、Kimi-K2-Thinking、Qwen3-VL-235B等)在Elo、Coding等多项评分中位居前列 [8][21][34] 技术架构与驱动因素 - 中国模型普遍采用混合专家(MoE)架构,核心优势在于效率,能在有限计算资源下获得更好性能 [9][22][35] - 采用MoE架构是应对美国自2022年起对先进AI芯片实施出口管制的策略 [9][22][35] - 以DeepSeek-V3为例,总参数量高达6,710亿,但单次推理仅激活370亿参数,在保证性能的同时大幅降低运行成本 [9][22][35] - 2025年,主要模型的开源许可证策略趋向宽松,如Qwen3采用Apache 2.0,DeepSeek R1采用MIT License,以吸引全球开发者并建立学术信誉 [10][23][36] - 开放潮流影响了此前坚持闭源的玩家,百度于2025年6月将其旗舰产品文心一言(ERNIE)4.5以开放权重形式发布 [10][23][36] 政策环境与商业模式 - 中国官方在顶层设计上支持开源AI发展,2017年的《新一代人工智能发展规划》已将“开源”和“开放”列为关键词汇 [10][23][36] - 2023年10月的《全球人工智能治理倡议》和2025年7月的《全球人工智能治理行动计划》将开源AI提升至国际话语权争夺的高度 [11][24][37] - 中国开放权重AI的繁荣更多是市场竞争、人才积累和工程文化共同作用的结果,而非纯粹自上而下的规划产物 [11][24][37] - 地方政府为参与开源社区的AI组织和项目提供定向财政支持,学术机构被鼓励将开源贡献纳入科研考核 [12][25][38] - 已有不少地方公共服务部门将DeepSeek模型的本地化版本集成到相关系统中 [12][25][38] - **阿里巴巴**的商业模式是将Qwen定位为“AI操作系统”,通过企业和政府客户采用模型来带动云计算业务增长,客户包括HP、阿斯利康,新加坡国家AI计划也基于Qwen3构建旗舰模型 [12][25][38] - **DeepSeek和智谱**走轻资产路线,采取协作部署策略,为不同云和算力提供商的客户提供本地化服务 [12][25][38] - 行业目前仍依赖间接变现:通过广泛采用的开放模型培育用户基础,再将其引导至付费产品和服务 [12][25][38] 全球影响与竞争态势 - 高性能中国模型的广泛可用,为资源有限的低收入和中等收入国家提供了获取先进AI能力的新路径 [13][26][39] - 中国模型因“够好用”、许可证宽松、使用成本低而受到青睐,例如Airbnb CEO透露公司使用Qwen而非ChatGPT为客服机器人供电,原因是“又快又便宜” [13][26][39] - DeepSeek R1的发布直接改变了美国对开放权重AI的政策态度,被特朗普总统称为“警醒时刻” [14][27][40] - 2025年7月,白宫发布《美国AI行动计划》,将开放权重模型提升为战略资产,同时强调加强对中国等对手的出口管制 [14][27][40] - 2025年8月,OpenAI时隔近六年首次发布开放权重模型,Sam Altman承认中国开源模型的竞争是促使该决定的重要因素 [14][27][40] - 真正的行业竞争已演变为生态竞争、工程竞争、成本竞争与合规竞争叠加的系统战 [15][28][41]