Workflow
Qwen系列大模型
icon
搜索文档
艾瑞观察:语言模型的价值重构与生态突围
艾瑞咨询· 2025-12-18 00:05
人工智能大行业:规模扩容与技术迭代双轨并行 宏观视角下, 2025 年人工智能行业呈现规模极速扩容与技术深度迭代的双轨并行特征。语言模型 作为核心引擎,正驱动整个 AI 版图重构。当前, AI 行业正沿多模态融合、具身智能、智能体实 用化三大方向加速演进,语言模型在其中扮演不可替代的 " 中枢神经 " 角色,已超越单纯技术组件 范畴,成为连接上层应用与底层算力的 " 价值枢纽 " 。 推动多模态融合的深度深化。单一文本模态已难以满足复杂现实需求。以大厂为代表的头部模型, 已实现从文本到图像、语音、视频的 " 全模态 " 覆盖。这种跨模态理解与生成能力,使 AI 具备类 人感知能力,为教育、办公、创作等场景带来质的飞跃。 加速具身智能的实体化落地。语言模型的大脑正接入物理世界躯体。亚马逊利用语言模型训练人形 机器人,英伟达基于语言模型的多个开源模型基座,均表明语言模型已成为具身智能决策控制的核 心。 引领智能体的实用化爆发。 AI 正从被动问答机器进化为具备自主规划与执行能力的智能体。从旅 游规划到办公 AI 助理,智能体正接管复杂任务流,实现从 " 想 " 到 " 做 " 的闭环。 语言模型子行业:深层痛点与 ...
周靖人成为阿里合伙人,通义实验室持续调整应对激烈竞争
新浪财经· 2025-12-10 07:48
核心观点 - 阿里巴巴集团正通过组织架构调整、核心人才更迭与战略聚焦,全力推进其人工智能战略,其核心AI研发机构通义实验室在年轻化的人才梯队建设、模型开源竞争及面向消费端的超级应用打造等方面展现出明确的战略意图与执行力 [1][3][8][9][10] 组织架构与人事变动 - 阿里云CTO、通义实验室负责人周靖人近期当选为阿里巴巴合伙人,成为公司最高集体决策机构成员,其当选关键因素之一是过去一年保证了Qwen模型的领先地位 [1][3] - 阿里巴巴合伙人团队于2024年6月经历大幅缩编,人数降至上市以来最低的17人,候选人需在阿里工作5年以上并获得至少13位(四分之三以上)现任合伙人赞同方可当选 [1] - 2023年,在集团“1+6+N”变革与大模型浪潮背景下,阿里将达摩院多个AI团队重组为隶属于阿里云的通义实验室,由周靖人负责 [3] - 通义实验室在组建年轻化组织过程中出现关键人才变动:2024年7月,基础语言模型千问研发团队原负责人周畅离职加入字节;近期,自然语言处理方向负责人黄非离职;此外,语音团队负责人鄢志杰(2024年2月离职)和应用视觉团队负责人薄列峰(2024年4月底离职)也已离场 [4][6][7] - 为应对外部人才竞争并激励团队,阿里在周畅离职后,为千问大模型研发团队全体成员提高一个职级并同步上涨薪水,新任团队负责人由更年轻的校招生林俊旸(阿里最年轻P10)接任 [5] - 通义实验室亦从外部引入技术负责人,包括接替鄢志杰负责语音团队的李先刚,以及负责多模态大模型研发的许主洪 [11] 人才战略与研发团队构成 - 阿里自主培养的校招生已成为通义实验室研发主力,例如千问模型团队中超80%为校招生 [5] - 公司管理层倾向年轻化,通义实验室多个核心研发团队由年轻校招生领导:基础语言模型千问团队先后由1990年出生的周畅(2017年北大博士毕业以校招生加入)和2019年北大硕士毕业以校招生加入的林俊旸负责;图像、视频生成模型“万相”团队由2015年清华硕士毕业以校招生加入的刘宇负责 [4][5] - 公司承认面临激烈的人才竞争,内部薪酬线性增长赶不上字节及大模型创业公司为争抢人才给出的溢价 [5] 技术进展与竞争态势 - 阿里开源的Qwen系列大模型全球影响力提升,至2024年10月,其衍生模型数量达到8万多个,超过了更早开源的Meta Llama系列 [4] - 通义实验室面临来自国内大模型创业公司的激烈竞争,如DeepSeek走红后,智谱、月之暗面、MiniMax、阶跃星辰等公司普遍开源参与竞争 [9] - 通义实验室2024年三大工作目标为:守住模型排名领先位置(性能、下载量、衍生模型数量领先);渗透更多商业应用场景;在2025年实现整个通义模型日均调用量数十倍的增长 [8] - 研发团队在宽松管理风格下靠自驱力工作,并积极探索新方向,如千问模型团队新组建了具身智能小组,同时也有小组在研究语音、文生图等模型 [10] 产品战略与业务整合 - 阿里将AI提升至集团战略高度,千问app被明确对标ChatGPT,成为继AI基建、淘宝闪购后,公司2024年宣布的又一个集团战略项目 [9] - 2024年12月9日,公司将智能信息与智能互联两个事业群重组为“千问C端事业群”,首要目标是将千问打造成为AI时代的超级app和用户第一入口 [10] - 千问app目前正以天为单位更新功能,几百名工程师进行封闭开发,加速接入淘宝、高德等阿里体系内应用,预计春节前有一次大迭代 [10] - 通义实验室需要持续为千问app提供强大底层模型支持,其模型研发与产品需求之间保持频繁反馈 [10]
阿里千问APP首发遭遇流量洪峰,官方回应“状态良好,欢迎来问”
金十数据· 2025-11-17 06:08
产品发布与定位 - 阿里巴巴于1月17日正式开启个人AI助手千问APP的公测,并向用户免费开放 [1] - 千问APP基于全球性能第一的开源模型Qwen3,定位为兼具“对话”与“办事”能力的个人AI助手 [1] - 公司计划将地图、外卖、订票、办公、学习、购物、健康等生活场景接入应用,实现通过一款应用处理多项日常事务 [1] - 应用设计极简,默认开启联网搜索以降低大模型“幻觉”风险,并集成图像生成、AI修图、视频通话、实时翻译等功能 [4] 市场反响与技术基础 - 公测首日千问APP遭遇流量高峰,导致部分服务出现拥堵和中断,相关话题登上微博热搜 [3] - 千问APP依托Qwen系列大模型打造,该系列自2023年全面开源后,全球下载量已突破6亿次 [3] - Qwen性能超越Llama、Deepseek等国际开源模型,获得Airbnb首席执行官认可,认为其比OpenAI模型更快更高效 [3] - 英伟达首席执行官指出Qwen在全球开源模型市场占据重要份额且仍在扩张 [3] 公司战略与行业合作 - 阿里巴巴今年早前宣布投入3800亿元用于AI基础设施建设,并计划追加更大投入 [3] - 公司在9月24日云栖大会上发布通义旗舰模型Qwen3-Max和下一代基础模型架构Qwen3-Next [3] - Qwen3-Max-Instruct预览版在LMArena文本排行榜上位列第三,超过GPT-5-Chat [3] - 阿里巴巴宣布与英伟达在PhysicalAI领域展开合作,旨在为企业用户提供全链路平台服务 [3] 开发团队与未来规划 - 千问APP由阿里智能信息事业群主导开发,阿里云、通义实验室、淘天、高德等多部门参与 [4] - 公测版为初级版本,未来将逐步增加代理式AI功能,重点提升在淘宝等电商平台的购物体验 [4]
超越GPT-4o!华人团队新框架让Qwen跨领域推理提升10%,刷新12项基准测试
量子位· 2025-06-04 00:17
技术突破 - 提出全新训练框架General-Reasoner,显著提升Qwen系列大模型的跨领域推理准确率近10% [1][2] - 在多个基准测试中超越GPT-4o,如General-Reasoner-Qwen3-14B在GPQA任务准确率达56.1%,TheoremQA达54.4% [15] - 强化学习(RL)被视为提升模型推理能力的关键手段,但现有方法如Zero-RL局限于数据丰富、答案结构清晰的领域 [3] 方法创新 - 构建全领域推理数据集WebInstruct-verified,覆盖物理、化学、金融等领域约23万个高质量可验证推理问题 [5][9] - 开发生成式答案验证器General-Verifier,以1.5B参数小型模型取代传统规则式验证,显著提高跨领域答案验证准确率 [13] - 数据筛选过程严格,剔除模糊或过于简单的问题,确保数据集质量 [12] 数据集构建 - 初始数据来源于WebInstruct,包含约500万个从StackExchange和教育门户网站爬取的自然指令 [6] - 通过Gemini-1.5-Pro筛选出100万个候选问题,再经Gemini-2.0-Flash标注元数据并平衡数据 [7] - 最终数据集涵盖23万道具有不同答案格式和主题的推理问题 [9] 性能表现 - General-Reasoner在12个基准测试中表现优异,Qwen2.5-7B-Base在MMLU-Pro准确率达58.9%,高于基础模型的47.7% [15] - 在数学推理任务中略优于专业框架SimpleRL [15] - 生成式验证器与Gemini-2.0-Flash高度一致,鲁棒性与泛化能力显著超越传统方法 [13] 未来方向 - 研究团队计划优化模型性能,扩展更多领域的高质量推理数据,提升验证器鲁棒性 [17] - 推动大语言模型在复杂现实任务中的广泛应用 [17]