Workflow
阶跃星辰发布新一代基模 Step 3,原生多模态推理模型,性能达到开源 SOTA
Founder Park·2025-07-26 04:53

新一代基模Step 3发布 - 阶跃星辰在WAIC 2025期间发布新一代基础大模型Step 3,该模型兼顾智能与效率,旨在面向推理时代打造最适合应用的模型 [3] - Step 3将于7月31日面向全球企业和开发者开源,为开源世界贡献最强多模态推理模型 [3][20] - Step 3是阶跃星辰首个全尺寸、原生多模态推理模型,采用MoE架构,总参数量321B,激活参数量38B [9] Step 3技术特性 - Step 3具备强智能、低成本、可开源和多模态四个特征,专为追求性能与成本极致均衡的企业和开发者设计 [8] - 模型拥有强大的视觉感知和复杂推理能力,可准确完成跨领域的复杂知识理解、数学与视觉信息的交叉分析 [9] - 在MMMU、MathVision、SimpleVQA、AIME 2025、LiveCodeBench等榜单上取得开源多模态推理模型的SOTA成绩 [16] 推理效率与成本优化 - Step 3通过系统架构创新实现行业领先的推理解码效率,在国产芯片上的推理效率最高可达DeepSeek-R1的300% [18] - 在NVIDIA Hopper架构芯片上进行分布式推理时,实测Step 3相较于DeepSeek-R1的吞吐量提升超70% [18] - 模型已授权国内多家芯片公司并完成适配,同时将通过开源技术报告分享降低推理成本的系统架构创新 [20] 模芯生态创新联盟 - 阶跃星辰联合近10家芯片及基础设施厂商发起"模芯生态创新联盟",首批成员包括华为昇腾、沐曦、壁仞科技等 [22] - 联盟致力于打通芯片、模型和平台全链路技术,提升大模型适配性和算力效率 [22] - 华为昇腾芯片已实现Step 3的搭载和运行,沐曦、天数智芯和燧原等也已初步实现运行Step 3 [22] 战略合作与应用落地 - 阶跃星辰与上海国有资本投资有限公司达成深度战略合作,将围绕资本链接、生态建设等方面进行全面合作 [6][22] - 公司战略性聚焦智能终端Agent方向,已覆盖国内超过一半头部国产手机厂商,并与吉利联合推出AI智能座舱 [23] - 积极拓展金融财经、内容创作、零售等垂直行业应用,与行业头部公司深度合作打造面向C端的场景化应用体验 [23] 1+N模型矩阵 - 阶跃星辰构建"1+N"的Step系列大模型矩阵,"1"指Step 3基础大模型,"N"为多模态大模型矩阵 [20] - 在WAIC期间升级多模态模型,包括多模理解生成一体化模型Step 3o Vision和第二代端到端语音大模型Step-Audio 2 [21] - 所有模型可在"阶跃AI"官网和App进行体验 [21]