Qwen(通义千问)
搜索文档
斯坦福报告揭秘中国开源AI全景:本土模型能否领跑全球?
搜狐财经· 2026-01-03 13:19
报告核心观点 - 斯坦福大学HAI与DigiChina项目联合发布的政策简报指出,中国开放权重AI模型已从全球追赶者变为领跑者,并形成了一个庞大且多元的生态系统,DeepSeek仅是其中一员 [1][3][42] 行业地位与市场数据 - 在开源大模型领域,中国已从追赶者变为领跑者 [4][30][43] - 阿里巴巴旗下的Qwen模型系列于2025年9月超越Meta的Llama,成为Hugging Face平台下载量最高的大语言模型家族 [4][17][44] - 截至2025年12月中旬,Qwen累计下载量达约3.85亿次,Llama约为3.46亿次 [4][17][44] - 2024年8月至2025年8月间,中国开发者的模型下载量占Hugging Face总下载量的17.1%,首次超过美国的15.8% [4][17][44] - 2025年9月,基于中国模型的衍生版本占Hugging Face当月新增衍生模型的63% [6][19][46] 主要参与者与模型特点 - 报告重点剖析了四个具有代表性的中国模型家族 [7][20][33] - **Qwen(阿里巴巴)**:定位于多语言和多模态能力最强的通用模型,支持119种语言,采用Apache 2.0许可证开源 [7][20][33] - **DeepSeek-R1(DeepSeek)**:以推理能力见长,在数学和复杂问题求解方面表现突出,提供多个蒸馏版本 [7][20][33] - **Kimi K2(月之暗面)**:聚焦于代码生成和智能体任务,强调快速推理 [7][20][33] - **GLM-4.5(智谱AI/Z.ai)**:走均衡路线,通过多专家训练整合推理、编程和视觉能力 [7][20][33] - 性能榜单显示,中国模型(如GLM-4.6、Kimi-K2-Thinking、Qwen3-VL-235B等)在Elo、Coding等多项评分中位居前列 [8][21][34] 技术架构与驱动因素 - 中国模型普遍采用混合专家(MoE)架构,核心优势在于效率,能在有限计算资源下获得更好性能 [9][22][35] - 采用MoE架构是应对美国自2022年起对先进AI芯片实施出口管制的策略 [9][22][35] - 以DeepSeek-V3为例,总参数量高达6,710亿,但单次推理仅激活370亿参数,在保证性能的同时大幅降低运行成本 [9][22][35] - 2025年,主要模型的开源许可证策略趋向宽松,如Qwen3采用Apache 2.0,DeepSeek R1采用MIT License,以吸引全球开发者并建立学术信誉 [10][23][36] - 开放潮流影响了此前坚持闭源的玩家,百度于2025年6月将其旗舰产品文心一言(ERNIE)4.5以开放权重形式发布 [10][23][36] 政策环境与商业模式 - 中国官方在顶层设计上支持开源AI发展,2017年的《新一代人工智能发展规划》已将“开源”和“开放”列为关键词汇 [10][23][36] - 2023年10月的《全球人工智能治理倡议》和2025年7月的《全球人工智能治理行动计划》将开源AI提升至国际话语权争夺的高度 [11][24][37] - 中国开放权重AI的繁荣更多是市场竞争、人才积累和工程文化共同作用的结果,而非纯粹自上而下的规划产物 [11][24][37] - 地方政府为参与开源社区的AI组织和项目提供定向财政支持,学术机构被鼓励将开源贡献纳入科研考核 [12][25][38] - 已有不少地方公共服务部门将DeepSeek模型的本地化版本集成到相关系统中 [12][25][38] - **阿里巴巴**的商业模式是将Qwen定位为“AI操作系统”,通过企业和政府客户采用模型来带动云计算业务增长,客户包括HP、阿斯利康,新加坡国家AI计划也基于Qwen3构建旗舰模型 [12][25][38] - **DeepSeek和智谱**走轻资产路线,采取协作部署策略,为不同云和算力提供商的客户提供本地化服务 [12][25][38] - 行业目前仍依赖间接变现:通过广泛采用的开放模型培育用户基础,再将其引导至付费产品和服务 [12][25][38] 全球影响与竞争态势 - 高性能中国模型的广泛可用,为资源有限的低收入和中等收入国家提供了获取先进AI能力的新路径 [13][26][39] - 中国模型因“够好用”、许可证宽松、使用成本低而受到青睐,例如Airbnb CEO透露公司使用Qwen而非ChatGPT为客服机器人供电,原因是“又快又便宜” [13][26][39] - DeepSeek R1的发布直接改变了美国对开放权重AI的政策态度,被特朗普总统称为“警醒时刻” [14][27][40] - 2025年7月,白宫发布《美国AI行动计划》,将开放权重模型提升为战略资产,同时强调加强对中国等对手的出口管制 [14][27][40] - 2025年8月,OpenAI时隔近六年首次发布开放权重模型,Sam Altman承认中国开源模型的竞争是促使该决定的重要因素 [14][27][40] - 真正的行业竞争已演变为生态竞争、工程竞争、成本竞争与合规竞争叠加的系统战 [15][28][41]
“人工智能+”:中国AI开源破局,烟火落地
新华社· 2025-12-31 08:41
文章核心观点 中国人工智能产业在2025年通过“开源创新”模式实现了技术突破与生态构建,推动AI技术从实验室广泛渗透至日常生活与各行各业,展现出强大的商业价值与社会温度,并正在全球舞台上形成差异化竞争力 [1][2][3] 技术突破与开源生态 - 中国AI产业走出了一条不同于美国硅谷的“开源创新”之路,实现了广泛的技术落地 [3] - 深度求索(DeepSeek)通过开源大模型DeepSeek-R1实现了强化学习技术范式的重大突破,其性能直逼全球最先进闭源模型,在Artificial Analysis榜单评分达66分,与Gemini、GPT的73分差距大幅缩小 [3] - DeepSeek在2025年2月启动“开源周”,9月在《自然》杂志封面文章中公开模型复现的核心信息,被业内称为“教科书式的透明” [4] - DeepSeek-V3.2-Speciale在国际数学奥林匹克等四大赛事夺金,进一步缩小了开源与闭源模型的差距 [4] - 在Chatbot Arena开源大模型榜单中,智谱、月之暗面Kimi、Qwen等中国模型均在前列 [5] - 美国斯坦福大学《2025年人工智能指数报告》指出,中国高性能人工智能模型的数量和质量不断提升,中美人工智能模型性能已近乎持平 [5] - 通义千问(Qwen)累计开源模型超300个,全球下载量突破6亿次,衍生模型数量逾17万个 [6] - 开源模型MiniMax M2发布后冲上全球最大模型调用平台OpenRouter趋势榜第一、调用量第三名 [6] - 截至2025年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍 [6] - 硅谷风险投资机构a16z合伙人透露,当前美国AI初创企业中约八成在融资路演时采用的是中国开源模型,而非美国主流产品 [6] - 开源大模型成为帮助全球南方国家跟上全球技术进步的珍贵礼物,因其可负担、能够本地化和自由部署 [7] 产业应用与商业化落地 - AI已渗透创意创作、文化娱乐、软件开发、教育音频等多个领域,进入“由点及面”的深度应用阶段 [8] - 以AI视频技术为突破口,中国产业界开启了从“跟跑”到“并跑”再到“阶段性领跑”的跨越式追赶 [9] - 2024年6月,可灵AI推出DiT视频生成大模型,其中可灵2.6成为业内首批实现AI视频音画同步生成的模型之一,一年半迭代30余次 [10] - MiniMax在2025年发布了新一代视频生成模型海螺2.3和语音模型Speech 2.6,海螺2.3强化物理表现与指令遵循能力,Speech 2.6降低音频生成端到端延迟 [10] - 在影视制作领域,AI工具大幅缩短特效制作周期、降低资金投入,亚马逊Prime Video的《大卫王朝》中70多个特效镜头通过AI生成工具制作 [11] - 短剧行业借AI之力实现“弯道超车”,将单集制作周期从数天压缩至数小时 [11] - AI助力文化传播,电视剧《国色芳华》借助AI语音大模型完成多语种配音,发行覆盖73个国家和地区 [12][13] - 在软件开发行业,AI引发“生产力革命”,用户用自然语言描述需求,AI约20小时即可输出成品,极大解放了中小微企业及个人的创造力 [13] - 合肥工业大学团队将北斗导航与AI融合用于降雨量预测,可直接节约千亿元财政投入 [14] - 施耐德电气无锡工厂的AI热处理数字仿真系统,使单台设备能耗降低25%,氮气消耗减少36% [14] - 铜陵有色金属集团的AI智能巡检系统保障设备稳定运行,年增经济效益130多万元 [14] 用户普及与日常生活融合 - 2025年,AI已化身贴近需求的“生活伙伴”,渗透到健康守护、教育辅导、饮食休闲等日常场景 [1][15] - 截至2025年6月,我国生成式人工智能用户规模达5.15亿人,较2024年12月增长2.66亿人,实现半年翻番 [15] - 中国科学技术大学附属第一医院发布“智医随行”大模型,为医护人员打造覆盖患者全周期的AI助手,已在六大专科、9类专病中应用 [16] - AI在教育领域可作为家庭教师,同步课本知识点、生成练习题、实时讲解错题并引导思考,并辅助英语口语学习 [17] - AI在健身领域可作为私人教练,快速生成个性化训练计划,通过姿态识别纠正动作,并联动智能设备生成训练报告 [18] 行业影响与生态爆发 - DeepSeek的开源举措带来惊人的生态爆发力,其App上线21天日活跃用户数突破3000万,登顶苹果美国地区应用商店免费App下载排行榜 [5] - 阿里等多个互联网平台、微信等“国民级”应用、新能源汽车等产业端口纷纷宣布接入DeepSeek,AI芯片厂商、算力产业链企业完成适配,算力需求大幅提升 [5] - 从政府部门、投资机构到产业链上下游,各界信心受到DeepSeek的积极影响 [5] - 中国AI的发展路径被类比为开放且可定制的谷歌安卓操作系统,以技术开放撬动更广阔的市场与应用场景 [22][23]
非客观人工智能使用指南
36氪· 2025-11-18 23:15
全球AI使用现状 - 全球约10%人口每周使用AI工具,其中绝大多数使用免费版本 [1] 主要AI系统提供商 - 四大最先进AI系统包括Anthropic的Claude、谷歌的Gemini、OpenAI的ChatGPT和埃隆·马斯克xAI旗下的Grok [3] - 第二梯队开放权重AI包括中国的Deepseek、Kimi、Z和Qwen,以及法国的Mistral,这些模型变体占据AI评级系统前35名 [3] - Microsoft Copilot和Perplexity等服务基于上述九个核心AI系统构建 [3] 付费AI服务定价策略 - 高级AI服务月费分为20美元和200美元两档,20美元档满足绝大多数需求,200美元档针对复杂技术和编码需求用户 [6] - 公司正在全球某些地区试验其他定价模式 [6] 付费AI系统功能对比 - 主要付费系统(Claude、Gemini、ChatGPT)均提供智能体能力、语音模式、图像文档处理、代码执行、移动应用和多模态创作功能 [7] - Claude目前缺少图像生成能力,Gemini和ChatGPT具备图像视频生成功能 [7][20] - Grok适合X平台重度用户,但产品安全透明度较低 [7] - Microsoft Copilot通过Windows系统提供ChatGPT功能,但用户对模型控制力较弱 [7] AI模型技术分级 - 聊天模型适合对话场景,响应迅速且具人情味 [9] - 智能体模型可自主执行多步骤复杂任务(网页搜索、代码使用、文档制作),出错概率更低 [9] - 巫师模型用于处理非常复杂的学术任务 [9] 各厂商模型选择策略 - ChatGPT提供从GPT-5 mini到GPT-5 Pro的多层级模型,付费用户可手动选择GPT-5 Thinking Extended(20美元套餐)或GPT-5 Thinking Heavy(200美元套餐) [11] - Gemini提供Gemini 2.5 Flash和Gemini 2.5 Pro两个选项,Ultra套餐用户可使用Gemini Deep Think [13] - Claude采用简化模型选择策略,主要使用Sonnet 4.5处理任务,提供"扩展思考"选项用于难题处理 [14] 数据隐私与功能权衡 - 关闭ChatGPT和Claude的训练功能不会损失功用,但Gemini会牺牲部分功能 [15] AI深度研究能力 - 深度研究模式可进行10-15分钟广泛网络研究,生成高质量报告 [16] - GPT-5 Thinking具备自主研究能力,Claude提供"中度研究"选项 [16] 数据整合能力 - AI系统支持连接Gmail到SharePoint等多种应用,Claude在整合搜索电子邮件、日历和云盘方面表现突出 [18] 多模态输入功能 - Gemini和ChatGPT在语音模式方面表现最佳,Claude语音功能相对较弱 [19] - 所有模型支持PDF、图片和视频上传,ChatGPT和Gemini的App版本支持屏幕共享和摄像头实时交互 [19] 内容创作能力 - Claude和ChatGPT可生成高质量PowerPoint和Excel文件,Claude目前在文档格式处理方面领先 [20] - Gemini拥有最强AI图像生成模型,Gemini和OpenAI具备视频生成能力(Veo 3.1和Sora 2) [20] - Sora 2定位社交媒体应用,Veo 3.1用途更广泛,生成视频均带声音 [20] 技术发展轨迹 - AI图像生成能力显著提升,从2021年生成扭曲图像发展到目前可制作多种风格的高质量视频 [21][23] 行业应用趋势 - AI系统正从基础对话向复杂任务执行演进,用户逐渐探索AI在报告撰写、问题解决和项目管理等方面的应用场景 [24] - 建立对AI系统能力和局限的直觉比掌握具体操作技巧更为重要 [24]
产品未发,7个月估值80亿美金,这家“美国DeepSeek”凭什么?
36氪· 2025-10-13 13:05
公司概况与融资表现 - 公司于2024年3月正式走出隐身模式,在7个月内估值从5.45亿美元飙升15倍至80亿美元 [3] - 最新一轮融资高达20亿美元,吸引了Nvidia、红杉资本、Lightspeed等顶级资本以及LinkedIn联合创始人Reid Hoffman作为天使投资人 [3] - 创始团队来自Google DeepMind,包括曾领导Gemini项目奖励模型核心团队的Misha Laskin和AlphaGo的共同创造者Ioannis Antonoglou [3] 战略定位与市场洞察 - 公司战略定位为成为“西方的DeepSeek”,旨在在高质量的开放模型领域与东方开源力量抗衡 [5][12] - 战略制定的重要背景是来自中国公司如DeepSeek和Qwen的压力,这些公司率先在开源领域打破了大规模混合专家模型的技术垄断 [8][10] - 公司瞄准的市场真空是西方大型企业和主权国家在“闭源不自由,开源不放心”困境下对“安全感”和“控制权”的需求 [13][14] 技术优势与平台能力 - 公司宣称构建了一个能够以最前沿规模训练大规模混合专家模型的大型语言模型和强化学习平台,而不仅仅是一个模型 [16] - 混合专家架构通过将模型分解为多个“专家”子网络,能以更低的计算成本实现更高的性能,被视为通往更强AI能力的关键路径 [8] - 掌握大规模训练MoE模型的能力意味着公司在通往通用人工智能的最被看好的技术路线上与顶级实验室站在同一起跑线 [16] 商业模式与盈利策略 - 公司采用策略性的“开放权重”模式,开放模型权重供下载、使用和修改,但保留完整的数据集、训练代码和基础设施堆栈 [18] - 商业模式构建了清晰的双层客户盈利结构,主要瞄准大型企业和主权AI两类高价值付费客户 [21][28] - 收入模型是金字塔结构:塔基为免费的学术界、开发者和初创公司;塔身为付费的大型企业客户;塔尖为最高价值的主权AI客户 [31][32][33] 目标市场与客户痛点 - 针对大型企业客户,解决其依赖闭源API导致的高昂成本、控制力缺失、数据安全风险和供应商锁定等痛点 [22][23][24][25] - 为主权AI客户提供构建国家级AI战略的基石,使其能够训练国家语言模型、赋能关键领域并培养本土AI生态,确保技术独立 [15][30] - 公司向企业出售的不再是按需取用的API,而是建造“水厂”的能力,即模型的所有权与控制权,实现成本可控和绝对的数据安全 [26][27] 行业竞争格局 - 公司选择的赛道是竞争激烈的红海,需直接面对来自中国的DeepSeek、Qwen,欧洲的Mistral AI以及Meta的Llama系列等开放模型的竞争 [34] - 尽管商业模式不同,公司仍需从OpenAI、Anthropic和Google等闭源模型巨头手中争夺客户,这些闭源模型在性能极限探索和产品易用性上拥有优势 [35]
深度|硅谷百亿大佬弃用美国AI,带头“倒戈”中国模型
Z Potentials· 2025-10-12 06:32
文章核心观点 - 硅谷顶级投资人查马斯·帕里哈皮蒂亚公开将其公司部分AI工作负载从亚马逊Bedrock转向中国模型Kimi K2,标志着全球AI应用进入商业理性主导阶段 [1][4] - 中国AI产业在2025年完成从"追赶者"到"平行竞争者"的转变,以Kimi和DeepSeek为代表的中国模型在开源能力和商业化部署方面设定新节奏 [13][23] - 全球AI格局正形成"技术攻顶"与"应用共荣"双轨并行的发展范式,中国在应用生态构建方面展现出独特优势 [16][23] 硅谷大佬的行业信号 - 查马斯·帕里哈皮蒂亚作为身价超百亿美元的投资人,其职业经历包括将Facebook用户从4500万增长至7亿,对产品增长和商业本质有深刻理解 [3] - 他选择Kimi K2的原因是"性能足够强"且比OpenAI和Anthropic"便宜太多了",体现其务实投资哲学 [1] - 这一选择被视为强烈的市场领先指标,预示AI行业从不计成本探索转向商业理性主导 [4] 全球开发者生态采纳 - 估值93亿美元的云端开发平台Vercel已集成Kimi K2 API,使全球数百万开发者可直接调用其能力 [4] - AI原生代码编辑器Cursor、AI搜索应用Perplexity等关键开发者工具均已集成Kimi,证明其已从关注对象转变为实际生产工具 [12][5] - 开发者用代码进行的"投票"是比任何排行榜都更有力的市场证明 [5] 市场转折点与竞争格局 - 2025年9月5日Anthropic调整API服务政策限制部分地区访问,意外创造市场真空 [7] - 月之暗面在同一天发布K2-0905更新版本,专注代码和智能体能力,在Roo Code平台取得超过94%的评分,成为首个突破90%的开源模型 [8] - 这次精准卡位将Kimi从"长文本专家"推向"全球编程高手"的新高度 [9] 权威报告佐证行业变革 - 《State of AI Report 2025》首次将中国AI体系提升为"平行竞争者",指出中国在开源AI和商业化部署方面设定节奏 [13] - 报告在年度最重要技术进展中仅列出三个大语言模型:OpenAI的o1、中国的DeepSeek-v3系列和Kimi-K2系列,中国模型占据三分之二席位 [14] - 报告评价DeepSeek在复杂推理任务上超越o1-preview,Kimi K2被誉为"全网最强的开源文本模型"并在LMSys Chatbot Arena登顶开源第一 [21] 中美AI发展范式对比 - 美国采用"技术攻顶"范式:以OpenAI、Anthropic为代表,追求AGI终极目标,走精英技术路线 [16] - 中国采用"应用共荣"范式:以字节跳动、月之暗面等为代表,通过高性价比开源模型构建繁荣应用生态 [16] - Kimi战略聚焦AI编程这一高价值企业级赛道,提供性能、成本与可靠性的最佳结合,类似Anthropic的成功路径但更开放和具性价比 [20][22] 中国AI产业里程碑 - DeepSeek的技术突破代表中国AI的第一次"技术破局",证明核心模型能力达到世界水平 [23] - Kimi在全球的商业渗透代表第二次"生态突围",展示引领潮流的价值创造路径 [23] - 中国AI已走完追赶阶段,开始自信探索并引领自己的发展范式 [23]