中国类脑脉冲大模型问世:数据量仅为主流模型2%,运行提速100倍
观察者网·2025-09-10 07:37
核心技术突破 - 成功研发类脑脉冲大模型"瞬悉1.0" 模仿人类大脑仅激活所需神经元的运作模式 实现选择性响应输入信息 [1] - 模型以主流大模型2%的预训练数据量实现与开源Transformer模型在多任务语言理解 中文多任务语言理解 常识推理任务上相媲美的性能 [1] - 运行速度比传统模型快100倍 超长序列处理能力在法律/医学文档分析 DNA序列分析等场景具显著效率优势 [1][2] 技术架构创新 - 首次提出大规模类脑脉冲基础模型架构 在国产GPU算力集群构建训练和推理框架 [2] - 解决脉冲驱动限制下大规模类脑模型性能退化问题 提供非Transformer架构新技术路线 [2] - 采用事件驱动方式使系统大部分时间处于静默状态 能耗显著低于传统AI模型 [4] 战略与产业意义 - 模型完全脱离对英伟达芯片依赖 在美国收紧AI芯片出口管制背景下具重要战略价值 [2] - 为国产算力平台大模型研发提供实践经验 推动更低功耗神经形态计算理论和芯片设计 [2][4] - 当前主流AI模型依赖高端芯片大型数据中心 消耗大量电力与冷却水资源 [3] 应用与开源进展 - 研究团队开源SpikingBrain-1.0-7B模型并开放SpikingBrain-1.0-76B测试网址 [2] - 系统深度融合人脑信息处理机制与脉冲计算范式 提供高效节能国产化类脑推理服务 [2] - 传统模型处理长输入时因并行处理每个词汇而变慢 推高运行成本并加剧环境影响 [3]