Workflow
强强联手!深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

目前, DeepSeek 官方 App、网页端、小程序均已同步更新为 DeepSeek-V3.2-Exp,同时 API 大幅度降价 , 欢迎广大用户体验测试并提供反馈意见。 同时,寒武纪已同步实现对深度求索公司最新模型 DeepSeek-V3.2-Exp 的适配,并开源大模型推 理引擎 vLLM-MLU 源代码。代码地址和测试步骤见文末,开发者可以在寒武纪软硬件平台上第一 时间体验 DeepSeek-V3.2-Exp 的亮点。 这一同步发布适配的 "高能"操作,在业内专家看来,背后蕴含着中国顶尖科技企业深度协同的重要信 号。 从技术层面来看,这款新大模型的体量相当可观,达到了 671GB 。据行业测算,在带宽充足的理想条 件下,仅完成该大模型的下载,就需要耗费约 8-10 个小时。而芯片与大模型的适配,涉及底层架构优 化、算力资源匹配、兼容性调试等一系列复杂工作,绝非短时间内能够完成。 有 AI 行业资深专家分析指出: "如此快速的适配响应,充分说明寒武纪 早在 DeepSeek-V3.2 发布 前就已启动适配研发,双方在技术层面的沟通与协作早已悄然展开。双方都是低调务实的公司,前期秘 而不宣,估计早就已经 ...