GLM
搜索文档
从开源最强到挑战全球最强:DeepSeek新模型给出了解法
观察者网· 2025-12-02 11:38
模型发布核心信息 - 12月1日,公司发布两个正式版模型:面向日常使用的DeepSeek-V3.2和面向极致探索的DeepSeek-V3.2-Speciale [1] - DeepSeek-V3.2是9月底实验版V3.2-Exp的正式版,平衡推理能力与输出长度,适合问答场景并强化了Agent能力,官方网页端、App和API均已更新 [1][4] - Speciale版本是V3.2的长思考增强版,结合了DeepSeek-Math-V2的定理证明能力,目标是将开源模型推理能力推向极致,目前仅以临时API服务形式开放 [1] 模型性能表现 - 在公开推理测试中,V3.2已达到GPT-5水平,仅略低于Google Gemini 3 Pro,相比Kimi-K2-Thinking输出长度大幅降低,减少计算开销与用户等待时间 [6] - Speciale在多个推理基准测试中超越Gemini 3 Pro,包括美国数学邀请赛(96.0分)、哈佛MIT数学竞赛(99.2分)和IMO(84.5分) [7] - 在编程与理工科博士生测试中,Speciale仍略逊于Google顶级模型,如LiveCodeBench(88.7分)和GPQA Diamond(85.7分)低于Gemini 3 Pro的90.7分和91.9分 [7] 技术架构创新 - 公司设计了DSA(DeepSeek稀疏注意力)机制应对长文本计算量爆炸,该机制像图书管理员通过“闪电索引器”只检索关键信息,大幅降低计算复杂度 [8] - V3.2的核心亮点是“Thinking in Tool-Use”(思考型工具调用),这是AI Agent领域的“Interleaved Thinking”(交错思维链)技术的重要背书 [8][9] - 该技术将冗长、重度依赖工具的任务转化为稳定的“计划→行动→反思”循环,通过复用假设与部分结论减少多轮任务中的“状态漂移”与重复性错误 [9] 战略方向与行业定位 - 公司将“Agent能力”提升到与“推理能力”同等重要的战略位置,试图通过Agent能力将模型从“聊天机器人”进化为真正的“数字劳动力” [13] - 从经济维度看,企业真正愿意付费的是“降本增效的行动”而非“更优美的回答”,Agent使LLM从“对话式AI”进化为“动作式AI”以产生商业闭环 [13] - 公司思路已从工具转变为基础设施提供商,大模型正演变成调度工具的通用操作系统,模型是内核,Agent是用户态程序,插件则是工具 [14] 行业竞争格局 - 过去一年开源大模型生态集体爆发,阿里云Qwen系列、月之暗面Kimi、智谱GLM和MiniMax M系列均取得超越当时顶级闭源模型的成果 [1] - Google Gemini 3.0 Pro的发布重新定义了“全球最强”,其强劲性能让开源和闭源的差距瞬间又变成了一道新的天花板 [2] - 开源模型存在三个关键缺陷:对标准注意力机制的过度依赖、后训练阶段计算投入不足、Agent领域泛化能力和指令遵循能力存在明显差距 [15] 未来发展路径 - 公司计划通过增加预训练计算量填补知识空白,并优化模型推理链的“智能密度”提高效率,让模型学会“少说话、多办事” [16] - 研究员Zhibin Gou表示,训练后的瓶颈需通过优化方法和数据解决,而非仅等待更好的基础模型,持续扩大模型规模、数据量、上下文和强化学习 [17] - 公司用实打实的模型证明Scaling没死只是换了战场,当行业讨论Scaling Law是否撞墙时,公司想证明持续扩展的可能性 [19]
北京市AI产业规模有望超4500亿元
北京日报客户端· 2025-11-30 07:40
产业规模与增长 - 2024年上半年北京人工智能核心产业规模达2152.2亿元,同比增长25.3% [1] - 初步估算2024年全年北京人工智能产业规模有望超过4500亿元 [1] - 北京AI企业数量超过2500家,已备案大模型183款,持续保持全国第一 [1] 产业生态与商业化 - 产业链日趋完整,形成具有全球竞争力的产业生态 [1] - 商业化路径逐渐清晰,百度、抖音等公司的营收和产品活跃用户数均创新高 [1] - 豆包、文心一言、GLM、Kimi等模型在权威测评中表现优异,部分成果达国际顶尖水平 [2] 技术创新与前沿成果 - 高校院所取得重大原创性突破,包括清华大学戴琼海院士团队、北京邮电大学徐坤教授团队、中国科学院自动化所李国齐教授团队等 [2] - 新型研发机构加速创新,北京智源人工智能研究院发布FlagOS,实现"模芯协同"纵向贯通 [2] - 北京通用人工智能研究院推出"通通2.0",完成从理论创新到能力验证的重大跨越 [2] - 北京科学智能研究院发布全球首个覆盖"读文献—做计算—做实验—多学科协同"的AI科研平台玻尔科研空间站 [2] 全球发展趋势与未来规划 - 全球人工智能发展正从单点技术突破向生态协同创新加速演进,形成"战略主导、技术竞速、规模扩张、应用拓展、生态竞合"的发展格局 [2] - 北京将持续推动科技创新和产业创新深度融合,从强化策源能力、拓展应用范围、打造产业集群、营造良好环境等方面巩固和提升引领地位 [3]
本市AI产业规模有望超4500亿元
北京晚报· 2025-11-30 06:42
产业规模与增长 - 上半年北京人工智能核心产业规模达2152.2亿元,同比增长25.3% [1] - 初步估算全年产业规模有望超过4500亿元 [1] - 北京AI企业数量超过2500家,已备案大模型183款,数量保持全国第一 [1] 产业生态与商业化 - 产业链日趋完整,形成具有全球竞争力的产业生态 [1] - 商业化路径逐渐清晰,百度、抖音等公司营收和产品活跃用户数创新高 [1] 前沿创新成果 - 高校院所取得重大原创性突破,如清华大学戴琼海院士团队、北京邮电大学徐坤教授团队等 [2] - 新型研发机构加速创新,北京智源人工智能研究院发布FlagOS,北京通用人工智能研究院推出“通通2.0” [2] - 北京科学智能研究院发布全球首个覆盖多环节的AI科研平台玻尔科研空间站 [2] - 核心企业带动作用显著,豆包、文心一言、GLM、Kimi等模型在权威测评中表现优异,部分达国际顶尖水平 [2] 全球发展趋势 - 全球人工智能发展正从单点技术突破向生态协同创新加速演进 [2] - 逐渐形成“战略主导、技术竞速、规模扩张、应用拓展、生态竞合”的发展格局 [2] 未来发展方向 - 推动科技创新和产业创新深度融合,从强化策源能力、拓展应用范围、打造产业集群等方面发力 [3] - 目标是建设具有全球影响力的创新策源地和产业高地,巩固“人工智能第一城”的引领地位 [3]
北京AI产业规模有望超4500亿元
北京日报客户端· 2025-11-29 22:12
产业规模与增长 - 2025年上半年北京人工智能核心产业规模达到2152.2亿元,同比增长25.3% [1] - 初步估算2025年全年北京人工智能产业规模有望超过4500亿元 [1] 产业生态与企业表现 - 北京AI企业数量超过2500家,已备案大模型达183款,持续保持全国第一 [1] - 产业链日趋完整,形成具有全球竞争力的产业生态 [1] - 百度、抖音等公司营收和产品活跃用户数均创新高,商业化路径逐渐清晰 [1] 创新成果与前沿突破 - 清华大学戴琼海院士团队、北京邮电大学徐坤教授团队、中国科学院自动化所李国齐教授团队等陆续取得重大原创性突破 [2] - 北京智源人工智能研究院发布FlagOS,实现“模芯协同”的纵向贯通 [2] - 北京通用人工智能研究院推出“通通2.0”,完成从理论创新到能力验证的重大跨越 [2] - 北京科学智能研究院发布全球首个覆盖“读文献—做计算—做实验—多学科协同”的AI科研平台玻尔科研空间站 [2] - 豆包、文心一言、GLM、Kimi等模型在权威测评中表现优异,部分成果已达国际顶尖水平 [2] 全球发展趋势 - 全球人工智能发展正从单点技术突破向生态协同创新加速演进 [2] - 逐渐形成“战略主导、技术竞速、规模扩张、应用拓展、生态竞合”的发展格局 [2] 未来政策方向 - 北京将持续坚持一体推进教育科技人才发展,建设具有全球影响力的人工智能创新策源地和产业高地 [3] - 推动科技创新和产业创新深度融合,从强化策源能力、拓展应用范围、打造产业集群、营造良好环境等方面加快补齐短板、锻造长板 [3] - 全面巩固和提升北京作为“人工智能第一城”的引领地位 [3]
已备案大模型183款,保持全国第一!北京AI产业规模有望超4500亿元
北京日报客户端· 2025-11-29 09:28
产业规模与增长 - 2025年上半年北京人工智能核心产业规模达到2152.2亿元,同比增长25.3% [1] - 初步估算2025年全年北京人工智能产业规模有望超过4500亿元 [1] - 北京AI企业数量超过2500家,已备案大模型183款,持续保持全国第一 [1] 产业生态与商业化 - 产业链日趋完整,形成具有全球竞争力的产业生态 [1] - 商业化路径逐渐清晰,百度、抖音等公司的营收和产品活跃用户数均创新高 [1] - 豆包、文心一言、GLM、Kimi等模型在权威测评中表现优异,部分成果已达国际顶尖水平 [2] 创新成果与研发进展 - 高校院所取得重大原创性突破,如清华大学戴琼海院士团队、北京邮电大学徐坤教授团队、中国科学院自动化所李国齐教授团队等 [2] - 新型研发机构加速创新,北京智源人工智能研究院发布FlagOS,实现“模芯协同”的纵向贯通 [2] - 北京通用人工智能研究院推出“通通2.0”,完成从理论创新到能力验证的重大跨越 [2] - 北京科学智能院发布全球首个覆盖“读文献-做计算-做实验-多学科协同”的AI科研平台玻尔科研空间站 [2] 全球发展趋势 - 全球人工智能发展正从单点技术突破向生态协同创新加速演进 [2] - 形成“战略主导、技术竞速、规模扩张、应用拓展、生态竞合”的发展格局 [2] 未来发展方向 - 立足于建设具有全球影响力的人工智能创新策源地和产业高地 [3] - 推动科技创新和产业创新深度融合,从强化策源能力、拓展应用范围、打造产业集群、营造良好环境等方面着手 [3]
北京人工智能产业白皮书:各类AI Agent将迎来爆发式增长
新京报· 2025-11-29 07:55
北京人工智能产业现状 - 2025年上半年全市人工智能核心产业规模达2152.2亿元,同比增长25.3% [2] - 初步估算2025年全年产业规模有望超过4500亿元 [2] - AI企业数量超过2500家,已备案大模型183款,持续保持全国第一 [2] 产业生态与商业化进展 - 人工智能产业链日趋完整,形成具有全球竞争力的产业生态 [2] - 商业化路径逐渐清晰,百度、抖音等公司营收和产品活跃用户数均创新高 [2] - 豆包、文心一言、GLM、Kimi等模型在权威测评中表现优异,部分成果达国际顶尖水平 [3] 前沿技术成果 - 北京智源人工智能研究院发布FlagOS,实现"模芯协同"的纵向贯通 [3] - 北京通用人工智能研究院推出"通通2.0",完成从理论创新到能力验证的重大跨越 [3] - 北京科学智能院发布全球首个覆盖"读文献-做计算-做实验-多学科协同"的AI科研平台玻尔科研空间站 [3] 未来发展趋势 - 能胜任个人助理、企业流程自动化、科学研究助手等角色的各类AI Agent将迎来爆发式增长 [1][3] - 具身智能发展将实现从信息处理到物理作业的跨越 [1][3] - 人工智能将拓展认知能力边界,世界模型将显著提升AI系统的泛化能力和可靠性 [3]
智谱董事长刘德兵:AI+金融未来可期 愿共探AI原生新范式
21世纪经济报道· 2025-11-26 12:16
公司战略与产品服务 - 公司提供基于MaaS模式的部署方案,以满足大型金融机构对数据隐私和安全合规的刚性需求,将技术能力与其核心业务系统深度融合 [1] - 公司通过MaaS平台为中小金融机构提供轻量级、高性价比的API服务,使其能以极低成本获得与国际顶尖模型媲美的能力,实现技术普惠化 [1] - 公司可提供从预训练模型、有监督指令微调,到推理、智能体开发的全链条技术支持,旨在打造能深度改变金融业的AI原生应用 [2] - 公司认为通过原生训练打造金融垂直领域大模型,能更深入地适配行业需求,解决仅靠通用开源模型无法应对的核心问题 [2] AI在金融行业的应用与价值 - 金融行业凭借资金、人才、数据、技术等多维度优势及丰富的应用场景,成为AI+浪潮中的领跑者 [1] - AI已成为金融行业提升效率与优化体验的重要抓手,在流程处理、信息处理、决策辅助及服务体验上均实现显著效率提升 [1] - 公司期待AI与金融的结合能进一步深化,尤其在普惠金融领域实现应用体验的更大突破,创造更好的社会价值 [1] - 目前AI作为效率工具已在金融行业实现良好应用,期待未来能加速发展,涌现更多深度融合的标杆应用 [3] 安全、合规与治理 - 公司在基础能力建设中高度重视风险防控,其GLM模型在国际大语言模型幻觉评测榜单的低幻觉指标上排名全球领先 [2] - 公司认为可通过应用层优化实现模型的可信可控,并通过附加流程管控、人机协同机制确保AI在手机银行等业务场景中的安全应用 [2] - 公司较早参与国际AI安全治理工作,已与谷歌、微软等企业联合签署前沿人工智能安全承诺 [3] - 公司计划先推动AI智能体水平提升,再将治理水平与行业应用深度结合,通过应用反哺治理能力升级 [3]
美国AI公司们,开始青睐Made in China的大模型
36氪· 2025-10-29 08:55
文章核心观点 - 美国AI公司正越来越多地部署和使用中国的大模型,这一趋势已从个别案例发展为行业现象 [5][8][9] - 中国大模型因性能出色、性价比高而受到青睐,推动AI产业从技术炫技迈向务实应用阶段 [17][19][22] - 中国AI厂商通过提供大量免费token和优惠套餐等策略,在价格方面具备显著竞争优势 [19] 美国公司采用中国模型的案例 - Windsurf的AI编程产品中被发现使用了智谱的GLM模型 [1][5] - 美国云服务平台Together AI在7月份官宣部署Qwen-3-Coder模型 [8] - 估值93亿美元的公司Vercel与智谱合作,提供GLM-4.6的API服务 [9] - 无服务器AI推理平台Featherless在Kimi K2发布之际表示支持其新模型 [14] - Social Capital公司创始人表示在Groq上已经开始使用Kimi-K2模型 [17] 中国模型的性能与认可度 - Vercel公司老板称赞GLM-4.6在http://nextjs.org/evals上排名第三,是前五名中唯一开源的模型 [11] - 从DeepSeek、Qwen、K2等模型在海外爆火的情况来看,国产大模型性能已得到国内外AI玩家认可 [17] - GLM 4.6在Cerebras上运行,后者是推出全球最大AI芯片并进军推理市场的公司 [7] 性价比优势与市场策略 - OpenAI和Anthropic的模型被评价为"太贵了",而中国模型提供了更具成本效益的选择 [17][19] - 中国AI厂商积极开展促销活动:快手AT-Coder-Air-V1注册即给2000万token,智谱推出GLM Coding Plan包月套餐折上折,新人享5折优惠 [19] - MiniMax M2宣布限时免费日期推迟至11月7日,快手也将免费日期推至11月10日 [19] 行业趋势与影响 - AI产业正在加速从技术炫技阶段迈向务实应用阶段,成本、速度和可扩展性成为关键考量因素 [22] - 高性价比的适用技术被证明是商业落地的硬道理,打破了"唯最强模型论"的行业观念 [22] - 这标志着全球AI竞争进入更加多元化和激烈的新时代,大模型圈的"中国制造"含金量持续上升 [22][24]
美国AI公司们,开始青睐Made in China的大模型
量子位· 2025-10-29 08:00
文章核心观点 - 美国AI公司正越来越多地采用中国大模型,这一趋势由模型的强大性能和高性价比共同驱动 [14][16][26][34][44] 美国公司采用中国模型的案例 - AI编程产品Windsurf被发现其“神秘模型”实为中国智谱的GLM模型 [2][3][7] - 估值93亿美元的公司Vercel宣布与智谱合作,提供GLM-4.6的API服务,其老板称赞该模型在评测中排名第三且是前五名中唯一开源的 [17][19] - 无服务器AI推理平台Featherless在Kimi K2发布时表示支持其新模型 [22] - Social Capital公司创始人表示已在Groq上开始使用Kimi-K2,并指出OpenAI和Anthropic的模型“太贵了” [30][31][33] 中国模型的优势 - 性能得到认可,例如GLM-4.6在特定评测中排名靠前,以及DeepSeek、Qwen等模型在海外频受关注 [19][27][28] - 性价比高,美国公司因成本考虑转向中国模型,中国厂商在价格竞争上具有优势 [26][31][34][35] - 中国厂商积极推出优惠活动,如快手提供2000万免费token,智谱推出包月折扣,MiniMax和快手延长免费期限等 [36] 行业趋势分析 - AI产业正从技术炫技阶段加速迈向务实应用阶段,成本、速度和可扩展性成为企业大规模部署时的关键考量 [40][41] - 企业的选择表明高性价比的适用技术是商业落地的硬道理,打破了“唯最强模型论” [42] - 全球AI竞争格局正变得更加多元化和激烈,标志着新竞争时代的到来 [43][44]
推动教育科技人才一体化发展,首都一线科技人才走进北京师范大学
新京报· 2025-09-25 14:10
人工智能与科学仪器行业动态 - 智谱华章公司开源对标GPT的基座大模型GLM并发布千亿参数模型GLM-130B 成为中国首批通过工信部备案的大模型企业之一 [2] - 基座大模型被视为国家级底座 决定未来工业革命话语权 涉及算力、算法、语料、平台、应用全链条重构 [2] - 中科科仪公司于2014年研制出中国第一台场发射枪扫描电子显微镜 分辨率优于1.5纳米 打破国外技术市场垄断并实现产业化 [3] - 多场低温科技公司研发的极端环境下纳米级运动控制样机性能比德国同类产品高出50% [4] 企业研发与技术突破 - 中科科仪电子光学研发团队为拍摄1纳米分辨率图像 在夜间工作以排除干扰 历时两个月成功实现验收指标 [3] - 多场低温科技公司创始团队在缺乏资金和资源背景下 通过逐一测试数据和打磨零件实现技术突破 [4] - 智谱华章公司强调技术突破非等来、买来或抄来 而是通过实干掌握全链条环节以避免被卡脖子 [2]