Workflow
开源大模型
icon
搜索文档
从开源最强到挑战全球最强:DeepSeek新模型给出了解法
观察者网· 2025-12-02 11:38
模型发布核心信息 - 12月1日,公司发布两个正式版模型:面向日常使用的DeepSeek-V3.2和面向极致探索的DeepSeek-V3.2-Speciale [1] - DeepSeek-V3.2是9月底实验版V3.2-Exp的正式版,平衡推理能力与输出长度,适合问答场景并强化了Agent能力,官方网页端、App和API均已更新 [1][4] - Speciale版本是V3.2的长思考增强版,结合了DeepSeek-Math-V2的定理证明能力,目标是将开源模型推理能力推向极致,目前仅以临时API服务形式开放 [1] 模型性能表现 - 在公开推理测试中,V3.2已达到GPT-5水平,仅略低于Google Gemini 3 Pro,相比Kimi-K2-Thinking输出长度大幅降低,减少计算开销与用户等待时间 [6] - Speciale在多个推理基准测试中超越Gemini 3 Pro,包括美国数学邀请赛(96.0分)、哈佛MIT数学竞赛(99.2分)和IMO(84.5分) [7] - 在编程与理工科博士生测试中,Speciale仍略逊于Google顶级模型,如LiveCodeBench(88.7分)和GPQA Diamond(85.7分)低于Gemini 3 Pro的90.7分和91.9分 [7] 技术架构创新 - 公司设计了DSA(DeepSeek稀疏注意力)机制应对长文本计算量爆炸,该机制像图书管理员通过“闪电索引器”只检索关键信息,大幅降低计算复杂度 [8] - V3.2的核心亮点是“Thinking in Tool-Use”(思考型工具调用),这是AI Agent领域的“Interleaved Thinking”(交错思维链)技术的重要背书 [8][9] - 该技术将冗长、重度依赖工具的任务转化为稳定的“计划→行动→反思”循环,通过复用假设与部分结论减少多轮任务中的“状态漂移”与重复性错误 [9] 战略方向与行业定位 - 公司将“Agent能力”提升到与“推理能力”同等重要的战略位置,试图通过Agent能力将模型从“聊天机器人”进化为真正的“数字劳动力” [13] - 从经济维度看,企业真正愿意付费的是“降本增效的行动”而非“更优美的回答”,Agent使LLM从“对话式AI”进化为“动作式AI”以产生商业闭环 [13] - 公司思路已从工具转变为基础设施提供商,大模型正演变成调度工具的通用操作系统,模型是内核,Agent是用户态程序,插件则是工具 [14] 行业竞争格局 - 过去一年开源大模型生态集体爆发,阿里云Qwen系列、月之暗面Kimi、智谱GLM和MiniMax M系列均取得超越当时顶级闭源模型的成果 [1] - Google Gemini 3.0 Pro的发布重新定义了“全球最强”,其强劲性能让开源和闭源的差距瞬间又变成了一道新的天花板 [2] - 开源模型存在三个关键缺陷:对标准注意力机制的过度依赖、后训练阶段计算投入不足、Agent领域泛化能力和指令遵循能力存在明显差距 [15] 未来发展路径 - 公司计划通过增加预训练计算量填补知识空白,并优化模型推理链的“智能密度”提高效率,让模型学会“少说话、多办事” [16] - 研究员Zhibin Gou表示,训练后的瓶颈需通过优化方法和数据解决,而非仅等待更好的基础模型,持续扩大模型规模、数据量、上下文和强化学习 [17] - 公司用实打实的模型证明Scaling没死只是换了战场,当行业讨论Scaling Law是否撞墙时,公司想证明持续扩展的可能性 [19]
第三届全国工业和信息化技术技能大赛举办,首设生成式AI应用赛
新京报· 2025-11-28 04:55
赛事概况 - 第三届全国工业和信息化技术技能大赛决赛于11月26日至28日在重庆举办,共有408支队伍、834名选手参赛 [1] - 大赛由工业和信息化部、人力资源和社会保障部、教育部、中华全国总工会、共青团中央共同主办 [1] - 大赛以"产才融合,技能报国"为主题 [1] 赛项设置与前沿技术 - 本届大赛设置六大赛项,包括智能硬件装调员、生成式人工智能系统应用员、混合集成电路装调工等,赛项数目比前两届提升近一倍 [2] - 首次设置生成式人工智能系统应用员(智能工业机器人领域)赛项,学生组创新场引入自然语言处理和开源大模型等前沿技术 [1] - 混合集成电路装调工(RISC-V等架构芯片开发与系统应用领域)赛项是上届赛项的升级,也是首次在国家级大赛中设置RISC-V架构主题 [2] 聚焦产业方向与人才目标 - 大赛聚焦新能源汽车、工业机器人、智能芯片、工业大数据、制造业数字化转型和工业互联网等六大制造强国重点方向 [1] - 旨在以赛促学、以赛促训、以赛促建,为产业高质量发展选拔和储备高素质技术技能人才 [1] - 赛事被视为深化教育科技人才一体改革发展,加快构建需求导向、标准衔接、产才融合的产业人才培养体系的新起点 [2] 赛事历史与影响 - 全国工业和信息化技术技能大赛是工信领域唯一的国家一类赛事,自2021年创办以来已成功举办三届 [3] - 累计957名选手获奖,涌现出42名全国技术能手、13名全国青年岗位能手及7名全国"五一"劳动奖章获得者 [3] - 赛事品牌效应持续凸显,已成为发现人才的"试金石"、锤炼实战能力的"练兵场"和促进产才融合的"加速器" [3]
AI产业跟踪:阿里首款AI眼镜塞满硬核技术,我国已经成为全球开源AI大模型的最大提供者
国泰海通证券· 2025-11-24 08:15
报告行业投资评级 - 报告未明确给出具体的行业投资评级 [1] 报告核心观点 - 中国AI产业在全球影响力显著提升,已成为全球开源AI大模型的最大提供者 [16] - 中国AI企业在基础模型领域已具备与国际巨头同台竞技的实力,中美顶级AI大模型性能差距大幅缩小至0.3% [15] - AI技术商业化应用加速落地,覆盖金融、教育、工业、内容创作等多个垂直领域 [6][7][10][14][23][24] AI行业动态 - 浙商银行与阿里巴巴达成战略合作,双方将依托金融与"云+AI"优势推动金融服务智能化升级 [6] - 宝马集团在华推出自研AI智能体平台"盖亚",推动AI从"专家专属"到全员化赋能,并在研发、生产、供应链及客户服务等领域应用 [7] - 月之暗面Kimi K2 Thinking模型被AI搜索应用Perplexity接入,成为其接入的唯一国产模型,Perplexity拥有3000万月活跃用户,估值突破200亿美元 [8] - 2025"人工智能+"大会在北京举行,北京市人工智能协会成立,旨在整合产业资源、搭建交流平台 [9] AI应用资讯 - 上海钢联应用AIGC技术开发"小钢"数字智能助手,基于自研垂类大模型"钢联宗师",DeepSeek版已服务超万名正式会员 [10] - 有道音视频翻译升级一站式AI工作台,上线自主研发的"VF原声翻译系统",优化多模态AI翻译体验 [11][12] - 香港推出智能对话应用"港话通",整合全方位生活服务 [13] - 斑马推出首个AI外教一对一产品"斑马口语",面向6-12岁儿童提供全英文沉浸式口语学习体验 [14] AI大模型资讯 - 阿里巴巴推出千问App公测版,其Qwen系列模型全球开源社区下载量已突破6亿,衍生模型超过17万个 [15] - 在"全球AI投资大赛"中,Qwen模型以超20%的收益率夺冠,力压GPT-5等美国头部模型 [15] - 中国工程院院士倪光南表示中国已成为全球开源AI大模型最大提供者,Qwen、DeepSeek、Kimi等模型在评估平台排名靠前 [16] - Gartner报告显示,火山引擎领跑AI应用开发平台挑战者象限,名列全球第五、中国第一,阿里云、腾讯云亦入围 [17] - 字节Seed团队推出在《原神》世界中训练的通用AI智能体Lumine,能够实时感知、思考并行动 [18] 科技前沿 - 阿里巴巴首款自研AI眼镜夸克S1预售超6000台,具备合像距可调节技术、SuperRaw暗光算法及可拆卸换电技术 [20][21] - 蚂蚁集团开源万亿参数强化学习高性能权重交换框架Awex,可在秒级完成TB级大规模参数交换 [22] - 翼菲科技发布首款人形机器人"鸿钧",采用升降+轮式复合底盘,移动速度2m/s,宣称可覆盖95%以上工业场景需求 [23] - 潜行创新发布全球首款融合"激光雷达+AI视觉"的泳池机器人L1 Ultra,标志着行业进入全自主智能新时代 [24]
阿里千问公测一周下载量突破1000万,新一轮中国AI冲击波来袭?
凤凰网· 2025-11-24 06:27
用户增长与市场表现 - 千问App公测一周下载量突破1000万次,成为史上增长最快的AI应用 [1] - 千问App上线三天即冲入苹果App Store免费总榜前三 [1] - Qwen系列模型全球累计下载量已突破6亿次 [1] 产品与技术实力 - Qwen3-Max模型性能跻身全球前三,超越GPT5和Claude Opus 4等国际竞争对手 [1] - 阿里Qwen模型已超越Llama,成为全球性能强劲、应用范围最广的开源大模型之一 [1] - 千问App定位为“会聊天能办事的个人AI助手”,注重Agentic AI能力 [2] 市场战略与生态整合 - 公司将千问视为“AI时代未来之战”,旨在打造C端AI入口 [2] - 计划将千问App与电商、地图、本地生活等业务生态深度整合以强化其Agentic能力 [2] - 模型能力已进入“辅助人”的Agentic AI时代,公司认为这是打造C端入口的绝佳时机 [2] 行业影响与客户认可 - 硅谷市场被快速攻占,Airbnb CEO表示公司正“大量依赖Qwen”,因其比OpenAI模型更快速出色 [1] - 英伟达CEO指出Qwen已占据全球开源模型市场大部分份额并持续增长 [1] - “千问恐慌”成为海外社交媒体热词,公司再度向全球投下中国AI冲击波 [1]
阿里千问App公测一周下载破1000万,成为增长最快的AI应用
观察者网· 2025-11-24 04:08
千问App市场表现 - 公测一周下载量突破1000万次,成为史上增长最快的AI应用 [1] - 上线仅三天即冲入苹果App Store免费总榜前三 [1] - 增长速度超越Sora(首周62.7万次iOS下载量)和ChatGPT(首周60.6万次iOS下载量) [1] 阿里Qwen模型基础 - 千问App基于阿里Qwen模型打造,该模型自2023年全面开源 [1] - Qwen系列模型全球累计下载量已突破6亿次,超越Llama、Deepseek等竞争者 [1] - 旗舰模型Qwen3-Max性能跻身全球前三,超越GPT5和Claude Opus 4 [1] 公司战略与产品定位 - 公司将千问App定位为“会聊天能办事的个人AI助手”,视为“AI时代未来之战” [2] - 产品将深度整合电商、地图、本地生活等业务生态,强化其Agentic能力 [2] - 目标是让AI不仅能理解生成,更能跨场景协同、直接执行任务 [2] 行业影响与前景 - “千问恐慌”成为海外社交媒体讨论热词,显示其广泛影响力 [1] - 行业认为随着开源模型演进和Agent能力迭代,千问App有望成为中国在AI全球竞赛中的“王牌” [2]
中国AI冲击波!刚刚,阿里重大发布!
券商中国· 2025-11-24 03:57
千问APP市场表现 - 千问APP于11月17日开启公开测试后,7天内下载量突破1000万次 [1][2] - 应用上线三天内进入苹果App Store中国区免费总榜前三 [5] - 此增长数据超过了ChatGPT、Sora、DeepSeek等多款知名AI应用 [4] 市场与资本反应 - 受千问APP下载量消息影响,阿里巴巴股价直线拉升,一度涨超5% [2] - 市场反应强烈,可能意味着国内乃至全球AI应用市场竞争格局将迎来重大变化 [4] 技术与战略背景 - 千问APP的底层技术是阿里千问大模型,该系列模型自2023年起采取积极开源策略 [5] - Qwen系列模型在Hugging Face等全球开发者社区获得广泛认可,全球累计下载量已超过6亿次 [5] - 英伟达CEO黄仁勋指出Qwen已占据全球开源模型市场大部分份额 [5] - 爱彼迎CEO布莱恩·切斯基公开表示公司正"大量依赖Qwen",因其比OpenAI模型更快速、更出色 [5] 产品定位与未来规划 - 千问APP定位为"会聊天能办事的个人AI助手",未来将着力发展"Agentic AI"能力 [6] - 公司计划将千问APP与电商、地图、本地生活等庞大业务生态进行深度整合 [6] - 业内分析认为,凭借领先的模型技术和商业生态,应用在将初期热度转化为长期活跃用户上具备独特优势 [6] - Agent能力与阿里生态加速融合,有望重塑用户与数字服务的交互方式 [6]
阿里千问App公测一周下载量破千万 成为增长最快的AI应用
格隆汇· 2025-11-24 02:32
核心观点 - 阿里巴巴旗下AI助手千问App公测一周下载量突破1000万次,成为史上增长最快的AI应用,标志着公司在C端AI市场取得重大突破 [1][2] - 千问App的爆发式增长源于其底层Qwen系列开源大模型长期积累的技术实力与行业影响力,该模型系列全球累计下载量已突破6亿次,性能跻身全球前三 [1] - 公司战略将千问App定位为“AI时代未来之战”的关键,旨在打造一个能深度整合电商、地图等生态的“会聊天能办事”的个人AI助手,推动AI进入“辅助人”的Agentic时代 [2] 市场表现与增长数据 - 千问App公测一周下载量突破1000万次,超越ChatGPT、Sora、DeepSeek等应用的增长速度 [1] - 上线仅三天即冲入苹果App Store免费总榜前三 [2] - 其底层Qwen系列模型的全球累计下载量已突破6亿次 [1] - Qwen系列模型已占据全球开源模型市场的大部分份额,且份额持续增长 [1] 技术实力与行业地位 - 阿里Qwen模型自2023年全面开源后,已超越Llama、Deepseek等竞争者,成为全球性能强劲、应用范围最广的开源大模型之一 [1] - 近期发布的旗舰模型Qwen3-Max性能表现已跻身全球前三,超越国际竞争对手如GPT5和Claude Opus 4 [1] - 硅谷企业如爱彼迎(Airbnb)公开表示“大量依赖Qwen”,认为其比OpenAI的模型更快速、更出色 [1] - 英伟达(NVIDIA)CEO指出Qwen已占据全球开源模型市场的大部分份额 [1] 公司战略与产品定位 - 阿里巴巴管理层将千问视为“AI时代未来之战”,认为大模型能力进入“辅助人”的Agentic AI时代,是打造C端AI入口的绝佳时机 [2] - 千问App定位为“会聊天能办事的个人AI助手”,计划与公司电商、地图、本地生活等业务生态深度整合 [2] - 战略目标是持续强化其Agentic能力,让AI不仅能理解、生成,更能跨场景协同并直接执行任务 [2] 行业影响与未来展望 - 千问App的公测爆火在海外社交媒体引发“千问恐慌”讨论,被视为继2025年年初DeepSeek之后,中国AI对全球市场的又一次冲击 [2] - 行业观点认为,随着开源模型演进、Agent能力迭代及生态融合加速,千问App有望成为AI时代的国民级应用 [2] - 千问App承载着中国AI赢得全球顶级竞争的使命 [2]
阿里千问App公测一周用户破千万 成为增长最快的AI应用
格隆汇· 2025-11-24 02:17
公司技术实力与市场地位 - Qwen系列模型自2023年全面开源后,已超越Llama、Deepseek等竞争者,成为全球性能强劲、应用范围最广的开源大模型[3] - Qwen系列模型全球累计下载量突破6亿次,在行业内积累了极高声誉[3] - 旗舰模型Qwen3-Max性能表现跻身全球前三甲,超越国际竞争对手如GPT5和Claude Opus 4[3] - 英伟达CEO指出Qwen已占据全球开源模型市场大部分份额,并呈现持续增长之势[3] 千问APP市场表现 - 千问APP于11月17日启动公测,上线仅三天就冲入苹果App Store免费总榜前三,一周便突破1000万下载量[3] - APP的爆发引发“千问恐慌”成为海外社交媒体热词,迅速引爆大众用户市场[3] 行业应用与生态整合 - 爱彼迎CEO公开表示公司正“大量依赖Qwen”,因其比OpenAI的模型更快速、更出色[3] - 千问APP定位为“会聊天能办事的个人AI助手”,将与电商、地图、本地生活等业务生态深度整合[4] - 公司旨在强化Agentic能力,让AI不仅能理解生成,更能跨场景协同直接办事[4] 公司战略与行业展望 - 阿里管理层将千问视为“AI时代未来之战”,认为当前是打造C端AI入口的绝佳时机[4] - 业内人士认为千问APP公测爆火只是开端,其有望成为AI时代的国民级应用[4] - 千问APP承载着中国AI赢得全球顶级竞争的使命[4]
开源鸿蒙、开源欧拉“毕业” 中国数字生态崛起
证券日报· 2025-11-21 16:15
开源项目毕业里程碑 - 开源鸿蒙与开源欧拉正式成为中国首批从开放原子开源基金会毕业的开源项目,标志着项目在技术、社区治理和生态发展上走向成熟 [1] - 项目毕业意味着已通过基金会技术监督委员会的严格评审,具备强大生命力和可持续发展能力,将为全球开发者和用户创造更大价值 [2] - 首批项目的毕业向业界展示中国开源生态正加速从规模扩张走向质量跃升 [1] 开源鸿蒙项目进展 - 开源鸿蒙自2020年9月贡献至基金会后,大版本已迭代10次,技术体系日趋完善 [2] - 项目累积超9700名核心代码贡献者,产出超过1.3亿行代码,构建了极具活力的开放终端生态 [2] - 社区已有500多家合作伙伴,累计1400多款产品通过社区兼容性测评,应用覆盖金融、超高清、航天、教育等多个关键行业 [2] 开源欧拉项目进展 - 开源欧拉社区成员单位超2100家,全球贡献者突破2.3万人,用户数超550万 [2] - 项目在互联网、通信、能源等多个行业实现规模化应用,成为中国行业数智化的首选操作系统之一 [2] 中国开源生态整体发展 - 截至2024年底,中国活跃开源项目已突破300万个,活跃开源开发者达227万人,形成规模宏大、结构多元的开源人才队伍 [1] - 中国在开源大模型领域已处于全球领先位置,以RISC-V为代表的开源架构快速崛起,2025年全球市场渗透率已达25% [3] - 开源模式将继续推动中国在AI算力、芯片架构和产业生态上的协同创新 [3] 开源生态扩容与产业集聚 - 开放原子开源基金会与五岳纪元量子计算操作系统、TOMs、M-Robots等项目签约,涵盖人工智能、量子计算、机器人等关键技术方向,标志其在AI等领域的开源生态布局进入新阶段 [3] - 北京亦庄已汇聚超10万家经营主体,形成六个千亿元级产业集群,通过专项政策系统性支持开源项目和企业发展 [4] - 建设国内首个AI开源社区模力方舟,已上线超1.6万个开源模型、超1万项数据集 [4] 上市公司参与与行业趋势 - 浪潮软件、软通动力、润和软件、诚迈科技等众多上市公司深度参与开源生态 [5] - 上市公司在开源生态中的布局呈现技术投入聚焦基础软件、生态建设体系化推进、人才培养与产业应用深度融合三大特点 [5] - 227万活跃开源开发者的集体发力及市场主体的深度参与,预示中国数字经济发展进入新阶段 [5]
阿里千问APP上线一天即冲入总榜前五
扬子晚报网· 2025-11-18 06:32
市场表现与用户反响 - 千问APP于公测上线次日冲入苹果App Store免费应用总榜第五位,排名超越DeepSeek [1] - 应用火爆导致服务器拥堵,相关话题登上微博热搜 [1] 公司战略与市场定位 - 此次发布标志着公司正全力进军AI to C市场,被视为“AI时代的未来之战” [4] - 应用主打免费,目标是与ChatGPT展开全面竞争,并计划与阿里生态内生活场景深度结合 [4] - 面向海外市场的国际版千问APP也将在近期上线 [4] - 战略目标是打造未来的“AI生活入口”,成为“会聊天能办事”的个人AI助手 [5] 技术基础与竞争优势 - 应用底气源于Qwen系列开源大模型的强大性能,该模型全球下载量已突破6亿次 [4] - 旗舰模型Qwen3-Max性能已超过GPT-4、Claude 3 Opus等国际顶尖模型 [4] - Qwen模型被指已占据全球开源模型大部分市场,并正成为硅谷初创公司的技术基石 [4] - Airbnb CEO公开称公司正“大量依赖Qwen”,因其比OpenAI模型更快更好 [4] 产品功能与发展规划 - “能办事”是核心发力点,目前已能实现一句指令生成PPT等复杂任务,并在实盘投资大赛中战胜全球顶级模型 [5] - 公司计划将地图、外卖、订票、办公等各类生活场景全面接入千问,以构建更强大的办事能力 [5]