Workflow
大模型即服务
icon
搜索文档
迈向 ASI,阿里云以全栈 AI 服务能力开拓智能新版图
钛媒体APP· 2025-12-02 03:45
阿里云在AI时代的全栈战略定位 - 公司认为AI时代大模型与云计算的结合是行业重要趋势和技术创新的核心驱动力 [2] - 公司已转型为全球少数大模型与云计算全栈自研且技术领先的全栈人工智能提供商 [3] - 公司的技术创新围绕模型、基础设施和AI应用开发三个维度展开 [3] 通义大模型家族的发展与成就 - 通义模型家族已成为全球最大的模型家族,并成为全球第一开源模型及中国企业选择最多的模型 [3][6] - 截至2025年9月,通义大模型开源300余个模型,全球下载量突破6亿次,衍生模型达17万个,稳居全球第一 [6] - 超100万家客户接入通义大模型,2025年上半年在中国企业级大模型调用市场中占比第一 [6] - 在云栖大会上“七连发”,发布6款新模型及1个新品牌,覆盖全场景并在多维度实现突破 [9] 核心模型的技术突破与性能 - 旗舰模型Qwen3-Max预训练数据量达36T tokens,总参数超万亿,在全球权威评测中性能超越GPT-5、Claude Opus 4等,跻身世界前三 [10] - Qwen3-Max在代表Agent核心能力的工具调用和Coding能力评测中位列全球第一梯队 [10] - 下一代基础模型架构Qwen3-Next系列总参数80B,仅激活3B参数性能便可媲美235B旗舰模型,训练成本相较Qwen3-32B锐减超90%,长文本推理吞吐量提升10倍以上 [11] - 编程模型Qwen3-Coder开源后在OpenRouter平台调用量激增1474%,位列全球第二 [11] 多模态与专项模型的升级 - 视觉理解模型Qwen3-VL增强了复杂空间理解能力,实现3D基础训练,为具身智能奠定基础 [12] - 全模态模型Qwen3-Omni首次实现音、视、文多模态混合训练而各项能力不降反升 [12] - 多模态生成模型通义万相Wan2.5实现原生音画同步的10秒视频生成 [12] - 全新语音大模型家族通义百聆,包括基于数千万小时真实语音数据训练的Fun-ASR及可提供上百种预制音色的Fun-CosyVoice [12] AI基础设施的全栈升级 - 推出新一代磐久超节点服务器,单机柜可容纳高达128颗AI芯片,单柜功率达350千瓦 [14] - 推出HPN 8.0高性能网络架构,是全球首批实现“训推一体”设计的AI网络,支持从万卡规模跃升至数十万卡互联 [15] - CPFS面向AI训练与推理深度优化,单客户端吞吐量高达40GB/s,性能相比传统方案提升60%,并实现百万级IOPS [15] - 引入智能分层存储机制,热数据驻留CPFS,冷数据自动转移至OSS以优化成本 [16] - OSS全面升级支持向量化数据存储与索引,通过Vector Bucket机制实现多模态数据高效查询 [16] - 灵骏智算集群支持容器、虚机、裸金属等多种算力形态,智能化监测系统故障发现率超98% [16] 多模态智能数据底座的构建 - 瑶池发布基于“湖仓库一体化”的多模数据智能管理平台,融合OLTP和OLAP能力 [18] - 多模数据管理平台DMS: OneMeta+OneOps,支持40多种数据源,已服务超10万家企业客户 [19] - DMS助力客户将多模开发效率提高2倍以上,数据交付效率最高提升5倍,同时降低90%安全合规风险 [20] - 大数据平台MaxCompute、Hologres等产品数据处理全面支持AI Function,实现数据处理与AI推理无缝融合 [22] 数据库与大数据平台的性能突破 - Hologres发布全新向量索引HGraph,登顶Vector DB Bench性价比榜单QPS、Recall、Latency、Load四项第一 [24] - Milvus相比同类型产品性价比提升4倍 [24] - 云原生数据库PolarDB全球首创基于CXL Switch的分布式内存池技术,网络时延从微秒级降低至纳秒级,内存单价降低30% [24] - 开源大数据平台EMR在TPC-H10T starrocks测试中性能相比前榜首提升111%,在TPCDS 100T Spark测试中性价比相比前榜首提升500% [24] 训练与推理全流程优化 - 人工智能平台PAI创新推出专用训练引擎paiMoE,在Qwen3训练中实现端到端加速比提效3倍,训练MFU超过61% [26] - 针对DiT架构推出训练推理一体化加速引擎paiFuser,在8卡并行推理场景下视频生成耗时最高减少80%以上 [27] - 通过全链路优化,实现推理吞吐TPS增加71%,时延TPOT降低70.6%,扩容时长降低97.6% [27] - PAI-EAS推出企业级EP解决方案,使千亿参数MoE模型首Token生成响应时间降低92%,端到端服务吞吐提升超5倍 [28] - 大规模强化学习训练框架PAI-Chatlearn在相同硬件下,训练吞吐比开源框架提升2倍以上 [29] AI应用开发与Agent生态 - 阿里云百炼平台形成“1+2+7”企业级Agent体系:一套模型服务、两种开发模式、七大关键能力 [32] - 发布全新Agent开发框架ModelStudio-ADK,让专业开发者1小时就能开发一个能生成深度报告的Deep Research项目 [33] - 低代码平台ModelStudio-ADP已广泛应用于金融、教育和电商等领域,网商银行基于其开发的贷款审核应用任务处理时间从3小时优化至5分钟内,准确率超95% [33] - 阿里云百炼平台已有超20万开发者开发了80多万个Agent [33] - 过去12个月里,百炼模型服务调用量增加了15倍 [36] - 在金融领域,通义大模型已覆盖九成国家级及大型国有银行、全部12家股份制银行和排名前十的财险公司 [36]