智谱上市首日,唐杰发内部信:即将推出GLM-5、已设立新部门

公司发展历程与战略回顾 - 公司于2019年正式成立,致力于探索AGI,愿景是“让机器像人一样思考” [6] - 2020年推出大模型算法架构GLM,并成功训练100亿参数基座模型,获得美团等企业试用 [7] - 2022年中训练出GLM-130B模型引发全球关注,同时MaaS平台上线并拥有第一批API用户 [8] - 2023至2024年,公司反思在追逐AGI过程中的迷失,被短期收益所迷惑,随后DeepSeek的出现带来警醒与思考 [9][10] - 2024年,公司通过“强化学习”提升了对AGI、公司治理和商业竞争的认知,并确立了“定力”与“成就”的口号 [10] - 2024年初面临模型效果未达预期及全国价格战的困境,最终以Coding作为突破口杀出重围 [2][10] - 2024年4月发布GLM-4.1被视为象征性试探,7月底GLM-4.5的发布被视作一场决战,随后GLM-4.6和GLM-4.7使模型能力与国际顶尖模型并驾齐驱 [2][11] - 公司在模型侧如期完成2024年初战略:4月发布“稳住阵脚”的模型,年中发布“上牌桌”的模型,年底发布Top 1的模型 [3][11] - 公司“主权AI”取得新进展:马来西亚国家级MaaS平台基于Z.ai开源模型构建,GLM成为马来西亚的国民级模型 [3][11] - 公司已成为“全球大模型第一股”,标志着市场对其技术与商业价值的认可 [12] 公司经营与财务表现 - GLM-4.7发布后,公司MaaS平台ARR年化收入超过5亿元,其中海外收入超过2亿元 [11] - 公司MaaS平台收入从2000万元增长至5亿元,增幅达25倍,仅用时10个月 [11] - 业务方面,公司再次完成了年度超一倍的营收增长目标 [11] - GLM-4.7在多项评测中获得开源模型、国产模型的SOTA评级 [11] - 全球184个国家的15万开发者使用GLM Coding Plan [11] 技术研发与产品路线 - 公司很快将推出新一代模型GLM-5 [2][13] - 2026年技术聚焦四大方向:推出GLM-5、研发全新的模型架构设计、探索具有更强泛化能力的强化学习、对在线学习或持续学习进行前瞻性布局 [3][13] - 认为Transformer架构已使用近10年并显露出不足,需探索全新架构以发现新的Scaling范式,并通过芯片-算法协同设计提高计算效率 [13] - 指出当前主流的RLVR范式依赖人工构造可验证环境,局限性凸显,需探索更通用的RL范式以支持AI执行长时程任务 [13] - 认为当前AI模型智能在部署后基本是静态的,与人脑持续学习方式不同,因此需布局在线学习或持续学习,以实现模型的持续学习与自主进化 [13] 公司组织与未来战略 - 公司内部新设立X-Lab部门,旨在以开放方式聚集年轻人进行前沿探索,包括新模型架构、新认知范式,并孵化不限软硬件的新项目 [4][14] - X-Lab部门的使命是进行完全颠覆式的创新,并最终回归AGI主线 [4][14] - 公司将扩大对外投资,不仅战略联合已有被投企业,也将开辟新版图以贯通行业、繁荣生态 [4][14] - 公司目标是成为国际领跑的大模型企业 [12] - 公司认为真正决定大模型下一阶段格局的是底层的模型架构与学习范式 [3][12] - 公司判断应用侧将出现清晰方向:2026年将成为AI替代不同工种/任务的爆发年 [3][12] - 公司希望成为一家AI原生公司,打造不断提升智能上界的下一代模型,并利用AI参与公司治理以降本增效 [14]