Workflow
国产AI重磅!DeepSeek-V3.2发布!寒武纪、昇腾均已适配!国产芯片深度协同有望受益

9月29日晚间,DeepSeek宣布,正式发布 DeepSeek-V3.2-Exp模型。模型引入稀疏 Attention 架构,这种 架构能够降低计算资源消耗并提升模型推理效率。在新的价格政策下,开发者调用DeepSeek API的成本 将降低50%以上。 仅4分钟后,寒武纪表示,已同步实现对DeepSeek-V3.2-Exp的适配,并开源大模型推理引擎vLLM- MLU源代码。在业内人士看来,此种同步发布适配的动作,表明中国AI产业链头部公司正在进行深度 协同。 市场分析人士指出,DeepSeek-V3.2发布当天,寒武纪与昇腾均已实现适配。DeepSeek-V3.2最大的意义 在于软硬协同设计支持国产算力,全新DeepSeek Sparse Attention机制,叠加国产芯片的计算效率,可大 幅降低长序列场景下的训推成本,共同为客户提供极具竞争力的软硬件解决方案。day 0适配和优化彰 显了国产芯片的生态建设和技术积累成果,芯片和算法的联合创新,软硬件协同方式将进一步加速国内 AI产业发展。 申港证券认为,随着算力基础设施的持续投入,国产算力在模型侧和算力芯片方面或将持续突破,有望 维持较好景气度,展望 ...