Workflow
神龙计算架构
icon
搜索文档
硅谷认证!Meta新模型暗含Qwen血统,周靖人带飞团队成阿里新晋合伙人
AI前线· 2025-12-11 07:28
核心人事变动与战略信号 - 阿里云CTO、通义实验室负责人周靖人正式成为阿里巴巴合伙人,这是阿里合伙人团队在今年6月从26人收缩至17人后的首次增补 [2][3][5] - 此次人事变动发生在关键的技术换挡窗口期,大模型从“能用”走向“要落地”,云厂商从“拼算力”转向“拼体系化AI” [6] - 周靖人晋升为合伙人,是因为其领导的通义实验室在过去一年保证了千问(Qwen)模型的领先地位,获得了管理层的高度评价,被视为集团强化AI核心战略的信号 [6][20] 阿里巴巴合伙人制度与AI战略升级 - 阿里巴巴合伙人团队是公司的最高集体决策机构,选拔门槛极高,需在阿里工作5年以上、高度认同公司文化、对公司发展有积极贡献,并获得75%以上(即至少13位)现任合伙人赞同 [9] - 2025年,阿里巴巴将AI战略从“技术叙事”升级为“生死线”,并宣布未来三年将投入至少3800亿元用于云计算与AI基础设施建设,该金额超过公司过去十年在相关领域的投入总和 [7] - 马云亲自督战AI,频繁点名周靖人要求汇报Qwen3进展,认为AI将成为阿里未来十年的主要增量,而模型是整个体系的第一变量 [7] 周靖人的职业履历与技术贡献 - 周靖人于2015年加入阿里出任阿里云首席科学家,历经阿里云、电商、蚂蚁等多个关键岗位,于2020年底回到阿里云担任CTO兼达摩院副院长,十年后成为合伙人 [8][11] - 在技术层面,其为阿里云打造了飞天系统和神龙计算架构,主导构建了iDST(阿里数据科学研究院)和全球领先的MaxCompute大数据引擎,在2018年双十一带领团队每秒处理17亿条日志 [11] - 在业务层面,其重构了淘宝搜索,打造新一代语义理解引擎,参与推动阿里妈妈整合实现搜广推一体化,并参与个性化算法设计,成为阿里算法领域核心负责人之一 [11] - 其带领达摩院期间,成立智能计算实验室,推动前沿技术研发,培养数百名AI顶尖人才,产出50+顶会论文和16项专利 [12] - 负责阿里云后,推动“飞天+神龙+磐久AI服务器”三位一体架构,使AI算力利用率达90%,训练成本降低30% [12] - 在大模型浪潮中,其率先提出“模型即服务”理念,并发起国内最大AI开源社区魔搭ModelScope,开源了达摩院近400个模型 [12] 通义实验室与Qwen大模型体系 - 通义实验室起源于阿里达摩院内部的大模型与多模态AI团队,于2023年重组后归属阿里云系统,由阿里云CTO统筹管理 [22] - 实验室定位兼顾“研究+工业化+商业落地”,既关注前沿AI技术,也强调模型能服务于阿里生态内外并落地到业务和产品 [22] - 通义大模型系列主要涉及四大方向:自然语言、视觉、视频和语音,包括通义千问系列、通义万相-图像生成系列、通义万相-视频生成系列、语音合成与识别系列 [24] - Qwen系列大模型从原有的多模态大模型M6进化而来,是一个大规模开源的大语言模型家族矩阵,目前已更新至第三代Qwen3 [26][27] - Qwen3系列实现了从0.5B到480B的全尺寸技术布局,并建立了覆盖文本、图像、语音、视频的全模态开源矩阵 [17] - 规模最大、能力最强的Qwen3-Max参数量超万亿,预训练数据达到36万亿tokens [29] - Qwen3引入了“混合推理”机制,支持更强推理能力、长上下文、多语言和多模态能力,覆盖从基础通用语言到专业任务的多种能力矩阵 [34] Qwen模型的技术成就与市场影响 - Qwen在开源生态中已成为全球最具影响力的模型族之一,实现下载量7亿+,衍生模型18万+ [18] - Qwen3-Max-Thinking(思考模式)在极具挑战性的数学推理基准测试AIME 25和HMMT上均取得满分,是国产大模型首次在这两个榜单拿下满分 [30] - 在考察Agent工具调用能力的Tau2 Bench测试中,Qwen3-Max-Instruct打败了Claude Opus4和DeepSeek V3.1 [32] - 2025年11月17日,阿里宣布千问项目全力进军“AI to C”市场,通义千问App公测版上线,正式与ChatGPT展开全面竞争,并免费开放 [34] - 公测23天后,通义千问App月活跃用户突破3000万 [38] - 据彭博社消息,Meta计划在明年春季发布的闭源模型“Avocado”(牛油果),在训练过程中参考或使用了Qwen作为蒸馏源来进行优化 [40] 阿里云的竞争策略与未来方向 - 阿里云是全球四大“超级AI云”之一,其广告口号宣称“AI云市场份额领先,超过第2–4名总和” [20] - 公司强调其是全球极少数能在大模型与云计算两端同时做到全栈自研的公司,并将此能力视为长期竞争中的真正护城河 [20] - 未来的发展思路围绕模型与云的协同展开,认为大模型的每一次突破,背后是整个云计算和数据、工程平台的全面配合和升级 [20] - 在模型方向上,将继续推进推理模型的演化,并视多模态为迈向通用智能的关键路径,同时探索新的在线、持续、自主学习机制 [20] - 在基础设施层面,正强化云与模型的深度融合,认为工程能力、整个云系统结合AI的性能和效率会变成核心竞争力 [21] - 公司认为全球AI已进入加速期,比拼的是迭代速度和创新能力,阿里快节奏发布是通义大模型体系化演进的表现 [21]