多能力融合

搜索文档
赛道Hyper | 智谱GLM-4.5:技术突破成因与行业价值
华尔街见闻· 2025-08-01 00:41
核心观点 - 智谱AI发布旗舰模型GLM-4 5并开源 该模型专为智能体应用研发 在性能 成本控制与多能力融合等方面表现突出 [1] - GLM-4 5的突破是技术积累 路径选择与生态协同的综合结果 标志大模型竞争从单点参数规模转向系统效率与生态活力 [10] 技术迭代与架构优化 - GLM系列从GLM-1到GLM-4 5经历四年多迭代 早期GLM模型探索Transformer架构优化 GLM-130B采用DeepNorm和RoPE等技术 [2][3] - GLM-3采用多阶段增强预训练方法 推理速度提升2-3倍 成本降低1倍 为后续参数效率提升奠定基础 [4] - GLM-4 5坚持"高效参数"路线 总参数3550亿中激活参数占比9% 通过优化专家模块协同机制提升效率 [4][5] - GLM-4 5-Air总参数1060亿 激活参数占比11% 部分团队因担心架构复杂度仍选择密集型架构 [6] 性能与成本优势 - GLM-4 5激活参数占比较高 实现参数效率翻倍 API价格仅为Claude的1/10 速度超100tokens/秒 [7] - 训练数据采用"通用+垂直"双层结构 通用文本15万亿token 垂直领域数据8万亿token 按任务单独标注 [7] 多能力融合与生态协同 - GLM-4 5首次实现推理 代码 Agent等多能力原生融合 采用统一底层架构规划参数共享机制 [8] - 智谱AI是国内首批推进大模型开源的企业 GLM-2开源后积累庞大开发者社区 社区贡献轻量化部署方案 [8] - 公司经历11轮融资 资金压力较小 有耐心进行多能力协同专项优化 [9] 团队背景 - 核心团队主要来自清华大学KEG实验室 包括董事长刘德兵 CEO张鹏 总裁王绍兰 首席科学家唐杰曾任清华教授 [1]