Workflow
可验证超级智能
icon
搜索文档
陶哲轩团队1年半项目,被他3周搞定,曾与LeCun吵翻天,如今AI大佬创业用智能体震惊整个学界?
36氪· 2025-09-12 09:01
公司核心业务与技术 - 公司致力于通过自动形式化技术打造可验证超级智能 [1] - 公司开发了自动形式化智能体Gauss 专为协助数学专家开展形式化验证工作打造 [2] - 基于Morph Labs开发的强大RL基础设施 公司通过Gauss完成了强素数定理的形式化并取得突破性成果 [1] - 公司借助Gauss智能体仅用三周时间完成了陶哲轩团队18个月未完成的项目 [3] - 通过Gauss生成了约2.5万行Lean代码 包含1000余个定理与定义 [4] - 系统可自主处理各个模块 每次能自主运行10小时以上且持续推进工作 [6] - 在每次迭代中能自主完成95%的命题形式化与证明工作 剩余部分需人工参与 [6] - 公司采用与Morph Labs合作开发的Trinity环境基础设施 支持数千个并发智能体且需占用数TB集群内存 [6] 技术突破与行业地位 - 完成了2024年1月由菲尔兹奖得主陶哲轩与Alex Kontorovich提出的挑战 即在Lean定理证明器中完成强素数定理的形式化工作 [2] - 完成了复分析领域关键缺失成果的形式化 为以往被认为难以触及的未来研究方向扫清了障碍 [3] - 生成2.5万行代码的规模在历史上属于重要里程碑 历史上最大单个形式化项目代码量约50万行 [4] - Lean标准数学库Mathlib规模约200万行代码 含35万个定理与定义 由600余名研究者耗时8年开发完成 [4] - 目标在未来12个月内将形式化代码总量提升2-3个数量级 [7] 市场反应与学术认可 - 数论家Jared Duker Lichtman认为这开启了人机协作新范式 可能开启人类与计算机之间数学的黄金时代 [7] - 物理学家Jose Ali Vivas称赞Gauss智能体令人惊叹 [7] - 威斯康星大学计算机科学教授Pedro Domingos表示人工智能天生就会做数学 [7] - 业界评价形式验证与人工智能是绝配组合 表明人工智能既能创新又严谨正确 [7] - 公司已启动技术部署工作 正与部分数学家群体接洽推进beta测试 [7] 创始人背景与行业影响 - 创始人Christian Szegedy是xAI前联合创始人 曾领导Google N2Formal团队专注于深度学习与计算机视觉研究 [8][9] - 2015年与Sergey Ioffe共同提出批归一化技术 彻底改变了深度学习训练方式并获得ICML 2025时间检验奖 [10] - 学术成果在对抗性样本领域具有里程碑意义 曾改变深度学习历史 [9] - 在xAI期间曾因LLM推理能力与LeCun公开争论 认为模型能力可进行极其深入的数学研究 [8]
陶哲轩团队1年半项目,被他3周搞定!曾与LeCun吵翻天,如今AI大佬创业用智能体震惊整个学界?
AI前线· 2025-09-12 07:13
公司业务与技术突破 - 新公司Math Inc致力于通过自动形式化技术打造可验证超级智能 专注于将人类数学成果转化为机器可验证代码[2][4] - 核心产品Gauss智能体实现超10小时自主运行 在三周内完成强素数定理形式化 而人类专家团队此前投入18个月仅取得阶段性进展[4][5] - 生成约2.5万行Lean代码 包含1000余个定理与定义 单次迭代可自主完成95%命题形式化与证明工作[5][6][8] 技术实现与基础设施 - 基于Morph Labs开发的RL基础设施与Trinity环境 支持数千个并发智能体 每个智能体拥有独立Lean运行时 占用数TB集群内存[8] - 采用Morph Cloud的Infinibranch技术解决大规模Lean验证环境的系统工程挑战[8] 行业影响与学术认可 - 完成复分析领域关键缺失成果的形式化 为以往"难以触及"的研究方向扫清障碍[5] - 数论专家Jared Duker Lichtman评价其开创"人机协作新范式" 物理学家Jose Ali Vivas与计算机教授Pedro Domingos均高度认可其技术突破[10] - 形式验证与人工智能结合被视为绝配组合 预计未来12个月内将形式化代码总量提升2-3个数量级[10] 创始人背景与历史成就 - 创始人Christian Szegedy为xAI前联合创始人 Morph Labs前首席科学家 曾领导谷歌N2Formal团队[12] - 2015年与Sergey Ioffe共同提出批归一化(BatchNorm)技术 彻底改变深度学习训练方式 获ICML 2025时间检验奖[13] - 在xAI期间曾就LLM推理能力与LeCun展开公开辩论 强调强化学习反馈循环对数学推理的重要性[12]