智谱上线并开源GLM-4.6V系列多模态大模型 构建原生多模态工具调用能力
证券日报网·2025-12-09 10:46

本报讯 (记者梁傲男)12月8日,北京智谱华章科技股份有限公司(以下简称"智谱")正式上线并开源 GLM-4.6V系列多模态大模型,包括面向云端与高性能集群场景的基础版GLM-4.6V(106B-A12B)和面 向本地部署与低延迟应用的轻量版GLM-4.6V-Flash(9B)。 智谱方面表示:"智谱多模态开源周开启,我们将持续开源更多前沿模型。拥抱多模态交互新范式,从 GLM-4.6V开始。" 传统工具调用大多基于纯文本,在面对图像、视频、复杂文档等多模态内容时,需要多次中间转换,带 来信息损失和工程复杂度。 据了解,GLM-4.6V从设计之初就围绕"图像即参数,结果即上下文",构建了原生多模态工具调用能 力:图像、截图、文档页面等可以直接作为工具参数,无需先转为文字描述再解析,减少链路损耗。对 于工具返回的统计图表、渲染后网页截图、检索到的商品图片等结果,模型能够再次进行视觉理解,将 其纳入后续推理链路。 模型原生支持基于视觉输入的工具调用,完整打通从感知到理解到执行的闭环。这使得GLM-4.6V能够 应对图文混排输出、商品识别与好价推荐以及辅助型Agent场景等更复杂的视觉任务。 据介绍,GLM-4.6 ...