Workflow
适配寒武纪、摩尔线程芯片!智谱新模型发布

同时,基于vLLM推理框架部署,摩尔线程新一代GPU可基于原生FP8精度稳定运行GLM-4.6,印证了MUSA架构和全功能GPU在生态兼容与快速支持方面 的优势。 国产AI软硬件协同再提速。 9月30日,智谱宣布发布新一代大模型GLM-4.6。作为GLM系列的最新版本,GLM-4.6在真实编程、长上下文处理、推理能力、信息搜索、写作能力与智 能体应用等多个方面实现全面提升。 GLM-4.6已经适配寒武纪、摩尔线程芯片,这是本次发布背后的一大重要信号。据记者了解,GLM-4.6已在寒武纪国产芯片上实现FP8+Int4混合量化部 署,这是在国产芯片投产的FP8+Int4模型芯片一体解决方案。在保持精度不变的前提下,推理成本迎来大幅降低,为国产芯片在大模型本地化运行上开创 了可行路径。 回看模型能力方面,GLM-4.6此次主要有以下五方面的升级: 一是高级编码能力,在公开基准与真实编程任务中,GLM-4.6的代码能力对齐Claude Sonnet 4。 二是上下文长度,上下文窗口由128K提升至200K,适应更长的代码和智能体任务。 三是推理能力提升,并支持在推理过程中调用工具。 四是搜索能力,增强模型的工具调用和 ...