Gauss

搜索文档
腾讯研究院AI速递 20250915
腾讯研究院· 2025-09-14 16:01
OpenAI与微软合作及发展前景 - OpenAI与微软发布非约束性合作备忘录 涉及云服务托管 知识产权归属和AGI控制权等核心问题 但最终合作条约仍未确定[1] - OpenAI预计成立估值超1000亿美元的公益公司(PBC) 非营利机构将持有股权并保持控制权 成为全球资源最充足的慈善组织之一[1] - OpenAI面临巨大成本压力 预计2029年前烧掉1150亿美元 仅2030年就需花费1000亿美元租赁服务器 未来几年几乎没有容错空间[1] AI影视内容创作突破 - 前谷歌X团队创立全球首家AI原生影视工作室Utopai 两部电影项目已带来1.1亿美元收入 锁定戛纳电影节[2] - Utopai突破AI视频生成三大难题:一致性 可控性和叙事延续性 实现毫秒级精准对口型 模型内置物理规律的3D数据训练[2] - 公司定位为内容+AI而非纯工具供应商 已获好莱坞顶级资源支持 为电影《科尔特斯》邀请奥斯卡提名编剧 八集科幻剧《太空计划》成功预售欧洲市场[2] 音乐生成技术进展 - MiniMax发布新一代音乐生成模型Music 1.5 支持长达4分钟的完整歌曲创作 具备强控制力 人声自然饱满 编曲层次丰富和歌曲结构清晰四大突破[3] - 模型支持"16种风格×11种情绪×10个场景"自定义音乐特征 能生成不同声线唱腔 并支持中国民族乐器生成 真正实现Intro/Verse/Chorus段落分明[3] - 基于MiniMax多模态自研能力积累 同步面向全球开发者提供API 适用于专业音乐创作 影视游戏配乐 虚拟偶像单曲和企业品牌专属音频内容多种场景[3] 本地生活AI应用发展 - 美团首个AI Agent产品"小美"开启公测 通过自然语言指令点咖啡 找餐厅 规划早餐菜单 大幅简化点餐流程[4] - 小美基于美团自研Longcat模型(5600亿总参数) 能根据用户口味偏好和地理位置实现从选品到支付的全自动操作 并记忆用户习惯[4] - 与Agent热潮相呼应 但目前仍有局限性:无法处理复杂模糊需求 无法进行语音回复 未来将在个性化和主动服务能力上进一步优化[4] 语音合成技术创新 - 小红书智创音频技术团队发布新一代对话合成模型FireRedTTS-2 解决现有方案灵活性差 发音错误多 说话人切换不稳定和韵律不自然等问题[5] - 模型在数百万小时语音数据上训练 支持逐句生成与多说话人音色切换 能够通过一句语音样本模仿音色和说话习惯 流式解码可实时输出音频[6] - 在主客观评测中均达行业领先水平 开箱即用支持中文 英语 日语等多语言 是AI播客等对话合成应用的工业级解决方案 已开源代码与模型权重[6] 开源语音合成技术突破 - 哔哩哔哩开源新一代零样本语音合成模型IndexTTS2 实现毫秒级精准时长控制 让AI配音能严丝合缝对上口型[7] - 模型采用"通用且兼容自回归架构的语音时长控制方法" 达到0.02%的时长误差率 同时通过两阶段训练策略实现情感和说话人身份的"解耦"[7] - 系统由T2S(文本到语义) S2M(语义到梅尔频谱)及BigVGANv2声码器三大核心模块组成 支持用大白话控制情绪 在跨语言产业应用上具有重大意义[7] 小型高效模型发展 - Meta AI发布MobileLLM-R1系列小参数高效模型 包括140M/360M/950M三种规模 专为数学 编程和科学问题优化[8] - 最大的950M模型仅使用约2T高质量token预训练(总训练量不足5T) 性能却与使用36T token训练的Qwen3 0.6B相当或更佳[8] - 在MATH基准上比Olmo 1.24B高五倍 比SmolLM2 1.7B高两倍 Token效率和性价比极高 完全开源模型中创造新标杆[8] AI数学研究突破 - 名为"Gauss"的AI Agent仅用三周时间完成了陶哲轩团队18个月未能完成的数学挑战——在Lean中形式化强素数定理(PNT)[9] - 该Agent由Math公司开发 生成约25000行Lean代码包含上千个定理和定义[9] - Gauss能协助顶级数学家进行形式验证 突破了复分析核心难题 团队计划在未来12个月让形式化代码总量提升100到1000倍[9] AI产业格局演变 - OpenAI推出GPT-5 首次真正让人感觉与博士级专家对话 内置"思考"能力 统一模型取代复杂选择界面 显著减少幻觉[10] - 发布前其他玩家也纷纷推出战略性新品:Anthropic推出Claude Opus 4.1瞄准高风险企业场景 Google推出Gemini 2.5 Deep Think和Genie 3分别强化推理和模拟能力[10] - 新AI版图已重新排布:OpenAI同时占据开放与封闭AI生态主导地位 Anthropic专注企业级精准稳定 Google专注基础研究长期布局 Agentic AI 先进推理和端侧能力已成顶尖模型核心特性[11] 科研AI战略布局 - DeepMind科学团队只瞄准三类问题:具有变革性 公认5-10年内无人能解 但DeepMind有信心快速攻克的"不可能任务"[12] - 团队从专用模型到通用智能的进化:将AlphaProof等专用数学模型的能力成功转移到Gemini通用模型 使DeepThink实现IMO金牌水平[12] - 未来目标是打造"科学API" 让全球科学家共享AI能力 从AlphaFold数据库到AI Co-scientist 降低科研门槛 使普通人也能做出诺贝尔奖级贡献[12]
陶哲轩18个月没搞定的数学挑战,被这个“AI高斯”三周完成了
36氪· 2025-09-14 05:16
核心观点 - 人工智能公司Math开发的AI智能体Gauss在数学形式化验证领域取得重大突破 仅用三周时间完成陶哲轩等数学家18个月未能解决的强素数定理形式化挑战 展示出AI在复杂数学问题求解上的巨大潜力 [1][2][4][6] 技术突破 - Gauss作为首个协助顶级数学家进行形式验证的自动形式化Agent 能够将人类数学内容转换为机器可读的形式语言并验证正确性 [4][5] - 该智能体生成约25000行Lean代码 包含上千个定理和定义 这种规模的形式化证明传统上需要多年时间完成 [7] - 项目突破复分析核心难题 Gauss作为硅基生命可持续工作 极大压缩顶尖形式化专家的工作量 [6] 性能表现 - 相比历史上最大的单个形式化项目(最多50万行代码) Gauss的产出规模达到同数量级 [7] - Lean标准数学库Mathlib包含200万行代码和35万个定理 由600多位贡献者耗时8年完成 而Gauss三周的产出效率显著超越人类团队 [7] - 团队计划在未来12个月内将形式化代码总量提升100到1000倍 目标实现"可验证的超级智能"和"通才型机器数学家" [9] 基础设施 - 为支撑Gauss运行 团队与Morph Labs合作开发Trinity环境基础设施 [8] - 系统涉及数千个并发Agent 每个Agent拥有独立Lean运行环境 消耗数TB集群内存 属于复杂系统工程挑战 [8] 团队背景 - Math公司创始人Christian Szegedy为ICML'25时间检验奖得主 其2015年提出的Batch Normalization技术引用量超过6万次 是深度学习领域的里程碑突破 [13][15][17] 行业影响 - AI工具采用与人类截然不同的方法 可能专注于明确目标而忽略隐含目标 这要求项目组织者需要更明确阐述所有目标 [10][11] - 陶哲轩指出随着强大AI工具出现 需要重新评估形式化项目的多重目标 包括知识传承、社区建设等隐含价值 [10][11]
啥?陶哲轩18个月没搞定的数学挑战,被这个“AI高斯”三周完成了
量子位· 2025-09-14 05:05
核心观点 - Gauss AI Agent在数学形式化领域取得突破性进展 仅用三周时间完成陶哲轩等人18个月未完成的强素数定理形式化挑战 展现AI在复杂数学验证任务中的巨大潜力 [1][2][8] 技术突破 - 生成约25000行Lean代码 包含上千个定理和定义 此类规模的形式化证明传统需多年完成 [10][11] - 项目规模达历史最大单个形式化项目的十分之一级别(历史最大项目为50万行代码) [12] - 对比Lean标准数学库Mathlib的200万行代码(35万个定理)由600多位贡献者耗时8年完成 Gauss效率显著提升 [13] 基础设施要求 - 与Morph Labs合作开发Trinity环境基础设施 支持数千个并发Agent运行 [14] - 每个Agent需独立Lean运行环境 集群内存消耗达数TB级别 属于复杂系统工程挑战 [14] 发展目标 - 计划未来12个月内将形式化代码总量提升100到1000倍 [16] - 致力于构建"可验证的超级智能"和"通才型机器数学家"新范式 [17] 团队背景 - 母公司Math由Christian Szegedy创立 其为2015年Batch Normalization技术共同发明人 [22][24] - Batch Normalization是深度学习从实验走向大规模实用化的关键技术之一 [26] 行业影响 - AI工具可能改变传统形式化项目中明确目标与隐含目标的实现方式 需重新定义项目目标体系 [18][19] - 陶哲轩指出AI优化算法可能专注于名义目标而忽略隐含目标(如社区建设、知识传承等) [19]
陶哲轩团队1年半项目,被他3周搞定,曾与LeCun吵翻天,如今AI大佬创业用智能体震惊整个学界?
36氪· 2025-09-12 09:01
公司核心业务与技术 - 公司致力于通过自动形式化技术打造可验证超级智能 [1] - 公司开发了自动形式化智能体Gauss 专为协助数学专家开展形式化验证工作打造 [2] - 基于Morph Labs开发的强大RL基础设施 公司通过Gauss完成了强素数定理的形式化并取得突破性成果 [1] - 公司借助Gauss智能体仅用三周时间完成了陶哲轩团队18个月未完成的项目 [3] - 通过Gauss生成了约2.5万行Lean代码 包含1000余个定理与定义 [4] - 系统可自主处理各个模块 每次能自主运行10小时以上且持续推进工作 [6] - 在每次迭代中能自主完成95%的命题形式化与证明工作 剩余部分需人工参与 [6] - 公司采用与Morph Labs合作开发的Trinity环境基础设施 支持数千个并发智能体且需占用数TB集群内存 [6] 技术突破与行业地位 - 完成了2024年1月由菲尔兹奖得主陶哲轩与Alex Kontorovich提出的挑战 即在Lean定理证明器中完成强素数定理的形式化工作 [2] - 完成了复分析领域关键缺失成果的形式化 为以往被认为难以触及的未来研究方向扫清了障碍 [3] - 生成2.5万行代码的规模在历史上属于重要里程碑 历史上最大单个形式化项目代码量约50万行 [4] - Lean标准数学库Mathlib规模约200万行代码 含35万个定理与定义 由600余名研究者耗时8年开发完成 [4] - 目标在未来12个月内将形式化代码总量提升2-3个数量级 [7] 市场反应与学术认可 - 数论家Jared Duker Lichtman认为这开启了人机协作新范式 可能开启人类与计算机之间数学的黄金时代 [7] - 物理学家Jose Ali Vivas称赞Gauss智能体令人惊叹 [7] - 威斯康星大学计算机科学教授Pedro Domingos表示人工智能天生就会做数学 [7] - 业界评价形式验证与人工智能是绝配组合 表明人工智能既能创新又严谨正确 [7] - 公司已启动技术部署工作 正与部分数学家群体接洽推进beta测试 [7] 创始人背景与行业影响 - 创始人Christian Szegedy是xAI前联合创始人 曾领导Google N2Formal团队专注于深度学习与计算机视觉研究 [8][9] - 2015年与Sergey Ioffe共同提出批归一化技术 彻底改变了深度学习训练方式并获得ICML 2025时间检验奖 [10] - 学术成果在对抗性样本领域具有里程碑意义 曾改变深度学习历史 [9] - 在xAI期间曾因LLM推理能力与LeCun公开争论 认为模型能力可进行极其深入的数学研究 [8]
陶哲轩团队1年半项目,被他3周搞定!曾与LeCun吵翻天,如今AI大佬创业用智能体震惊整个学界?
AI前线· 2025-09-12 07:13
公司业务与技术突破 - 新公司Math Inc致力于通过自动形式化技术打造可验证超级智能 专注于将人类数学成果转化为机器可验证代码[2][4] - 核心产品Gauss智能体实现超10小时自主运行 在三周内完成强素数定理形式化 而人类专家团队此前投入18个月仅取得阶段性进展[4][5] - 生成约2.5万行Lean代码 包含1000余个定理与定义 单次迭代可自主完成95%命题形式化与证明工作[5][6][8] 技术实现与基础设施 - 基于Morph Labs开发的RL基础设施与Trinity环境 支持数千个并发智能体 每个智能体拥有独立Lean运行时 占用数TB集群内存[8] - 采用Morph Cloud的Infinibranch技术解决大规模Lean验证环境的系统工程挑战[8] 行业影响与学术认可 - 完成复分析领域关键缺失成果的形式化 为以往"难以触及"的研究方向扫清障碍[5] - 数论专家Jared Duker Lichtman评价其开创"人机协作新范式" 物理学家Jose Ali Vivas与计算机教授Pedro Domingos均高度认可其技术突破[10] - 形式验证与人工智能结合被视为绝配组合 预计未来12个月内将形式化代码总量提升2-3个数量级[10] 创始人背景与历史成就 - 创始人Christian Szegedy为xAI前联合创始人 Morph Labs前首席科学家 曾领导谷歌N2Formal团队[12] - 2015年与Sergey Ioffe共同提出批归一化(BatchNorm)技术 彻底改变深度学习训练方式 获ICML 2025时间检验奖[13] - 在xAI期间曾就LLM推理能力与LeCun展开公开辩论 强调强化学习反馈循环对数学推理的重要性[12]