阶跃星辰端到端语音大模型

搜索文档
什么是真正好用的推理模型?阶跃Step 3:开源的,多模态的,低成本的,国产芯片适配的
量子位· 2025-07-27 11:57
行业趋势与市场现状 - 推理模型和具身智能成为2024年WAIC最受关注的领域,分别代表当前AI话语权和下一代有形技术[1] - 行业进入推理时代后,多模态模型涌现,推理能力成为焦点,开源成为厂商和用户首选考量[10] - 模型评估标准从单一性能指标转向综合考察效率、成本、部署友好性等维度[11] Step 3核心特性 - 总参数321B的MoE架构,视觉编码器5B参数+语言模型316B参数,激活参数38B[5][17] - 多模态能力突出:在MMMU等榜单取得开源多模态推理模型新SOTA,支持跨领域复杂知识理解与视觉信息交叉分析[6][19] - 成本效率优势:推理解码成本为DeepSeek的1/3,国产芯片推理效率达DeepSeek-R1的300%[8] - 开源策略:7月31日开源,打破"强模型不开源"局面,GitHub未发布已获107星[24][25][26] 技术创新与架构设计 - AFD分布式推理系统:将Attention与FNN拆解至独立子系统,解码效率优于DeepSeek EP方案[32][34] - MFA注意力机制:硬件感知低秩设计,KV缓存小于DeepSeek-V3,算术强度128平衡内存与算力[36][37][39] - 系统协同优化:32张Hopper GPU实现4039 tokens/GPU/s吞吐量,对比DeepSeek-V3(128张GPU)的2324 tokens/GPU/s[41] 商业化落地进展 - 终端智能Agent覆盖汽车、手机、IoT等领域: - 智能座舱实现人机共驾,吉利银河M9首发搭载端到端语音大模型[64][66] - 国内Top10手机厂商过半接入多模态能力,OPPO/荣耀/中兴旗舰机型已部署[69] - 2025年预计收入近10亿人民币,形成清晰商业化路径[74] 产业链协同生态 - 国产芯片适配:完整支持华为昇腾、沐曦、天数智芯等国产芯片运行[51][52] - 发起"模芯生态创新联盟":联合10家芯片及Infra厂商构建技术链路,成员包括华为昇腾、寒武纪等[54][55] - 模型-硬件协同设计:通过架构创新降低API依赖,推动可持续成本优化[50][58] 产品定位与市场策略 - "多开好省"四字诀:多模态、开源、高性能、低成本,重新定义推理模型价值标准[13][45] - 差异化竞争:避开参数竞赛,聚焦终端部署与产业落地,形成收入规模[73][76] - 长期主义定位:通过技术工程化能力构建产业线长跑优势,区别于短期SOTA追逐者[77][79]