Workflow
神经符号AI
icon
搜索文档
腾讯研究院AI速递 20251128
腾讯研究院· 2025-11-27 16:21
谷歌TPU自研芯片进展 - 谷歌TPU从2015年发展至2025年第七代TPU(代号Ironwood),成为可能撼动英伟达霸权的战略级武器[1] - TPU v7单芯片FP8算力达4.6 petaFLOPS,一个Pod集成9216颗芯片性能超42.5 exaFLOPS,采用2D/3D环面拓扑结合光路交换网络,年可用性达99.999%[1] - 谷歌垂直整合策略使其避免了昂贵的CUDA税,推理成本较GPU系统低30%-40%[1] - Meta考虑2027年在数据中心部署TPU并通过谷歌云租用算力[1] Anthropic长程Agent技术突破 - Anthropic发布针对长程Agent的双Agent架构解决方案,包括初始化Agent负责搭建环境和编码Agent负责增量进展,解决Agent跨会话工作的记忆难题[2] - 环境管理包含功能列表(200+功能点标记状态)、增量进展(Git提交和进度文件)和端到端测试(使用Puppeteer浏览器自动化)三大支柱[2] - 该方案基于Claude Agent SDK,通过让Agent像人类工程师一样在会话间保持一致进度,成功实现跨数小时甚至数天的复杂任务[2] DeepSeek数学模型创新 - DeepSeek发布基于DeepSeek-V3.2-Exp-Base的DeepSeek-Math-V2,实现IMO金牌级水平,性能优于Gemini DeepThink[3] - 创新引入自我验证数学推理框架,包含证明验证器(分0/0.5/1三档评分)、元验证(检查评语合理性)和诚实奖励机制(奖励诚实指错的模型)[3] - 在IMO-ProofBench基准的Basic子集上达到近99%高分,Putnam 2024中以扩展测试实现118/120接近满分,突破传统强化学习限制[3] AI音乐行业正版化进程 - AI音乐平台Suno与华纳音乐集团达成全球首个"正版授权AI音乐"合作框架,结束所有法律纠纷,标志AI音乐正版化里程碑[4] - Suno将在2026年推出基于高品质授权音乐训练的新模型,承诺超越现有v5模型,华纳旗下艺术家可自主选择是否授权并获得收入[4] - 免费用户未来无法下载创作音频仅能播放分享,付费用户下载功能保留但有月度额度限制[4] - Suno同时收购华纳旗下演唱会服务Songkick布局线下生态[4] 马斯克Grok 5游戏AI挑战 - 马斯克宣布Grok 5将在2026年挑战《英雄联盟》最强战队T1(由传奇选手Faker领衔),为AI戴上"纯视觉感知"和"人类级反应延迟"双重镣铐[5][6] - Grok 5或将拥有6万亿参数,作为多模态LLM通过"阅读"游戏说明和"观看"比赛视频构建世界模型,依靠逻辑推理而非暴力手速取胜[6] - 马斯克将把Grok 5的视觉-动作模型直接应用于特斯拉Optimus人形机器人,游戏团战作为现实世界的练兵场验证具身智能能力[6] 阿里开源图像生成模型 - 阿里开源6B参数图像生成模型Z-Image,包含Z-Image-Turbo(8步达到主流竞品性能)、Z-Image-Base(非蒸馏基础模型)和Z-Image-Edit(图像编辑专用版本)三个版本[7] - Z-Image-Turbo在企业级H800 GPU上实现亚秒级推理速度,可轻松运行于16G显存消费级设备,在照片级写实生成和中英双语文字渲染方面表现突出[7] - 采用可扩展单流DiT(S3-DiT)架构,将文本、视觉语义token与图像VAE token在序列维度拼接为统一输入流,最大化参数利用效率[7] 无问芯穹融资与AI基建进展 - 清华AI Infra企业无问芯穹完成近5亿元A+轮融资,由珠海科技集团、孚腾资本领投,成立2年半累计获得近15亿元融资[8] - 无穹AI云首次实现六种不同品牌芯片间交叉混合训练,算力利用率最高达97.6%,已在全国完成超25000P算力纳管,覆盖26城市53个数据中心[8] - 推出端侧全模态理解模型无穹天权(3B成本、7B内存需求达21B级智能水平)和终端推理加速引擎无穹开阳(3倍时延降低、40%能耗节省),打造Agentic Infra[8] 清华大学AI教育指导原则 - 清华大学正式发布《人工智能教育应用指导原则》,提出"主体责任""合规诚信""数据安全""审慎思辨""公平包容"五大核心原则[9] - 指导原则明确禁止将AI生成内容直接作为学业成果提交,严禁用AI代替学术训练、代写论文等行为,要求教师对AI生成教学内容负责[9] - 清华已有超390门课程融入AI教学实践,自主研发"三层解耦架构"和全功能智能体学伴"清小搭",历时两年调研全球25所高校70份指南完成制定[9] 美国创世纪AI科研计划 - 美国启动"创世纪计划"(US Genesis Mission)作为AI曼哈顿计划,目标是训练科学基础模型、打造科研智能体,让AI深度嵌入科研全流程[10] - 能源部科学事务副部长Darío Gil在《科学》杂志发表社论,强调AI价值在于生成可验证结果而非仅写摘要,需动员国家实验室、企业和顶尖大学[11] - 《自然》同期发表社论提出"神经符号AI"路径,将大模型统计学习与符号推理、规划模块组合,可能是迈向接近人类水平智能的关键[11]
美国宣战,AI曼哈顿计划打响第一枪,“AI科学家”成最新核武器
36氪· 2025-11-27 12:13
美国“创世纪计划”战略目标 - 白宫启动“美国创世纪计划”,核心目标是让AI直接参与提出科学假设、设计实验、分析数据,以加速科研创新 [1] - 计划被类比为“AI曼哈顿计划”,旨在动员全美科研与工业体系,包括国家实验室、创新企业、顶尖大学及国家安全体系的算力与数据资源 [3] - 白宫明确目标为训练“科学基础模型”、打造科研智能体,让AI深度嵌入科研流程,旨在实现科学突破率的数量级提升 [5] AI赋能科研的具体路径与模式 - 计划路线图是将AI嵌入“提出假设→设计实验→采集数据→分析结果”的全流程,以迎来科研生产力的数量级跃迁 [5] - 重点是利用AI攻克前沿领域难题,例如在核聚变能源领域实现等离子体的毫秒级实时控制,在分子材料科学领域开发预测模型 [8] - AI与科学的融合不止于大语言模型,关键在于发展混合模型,结合神经网络的学习能力和传统物理模拟的精确预测,并设置检查点进行校验 [18] 数据与计算基础设施需求 - 研究的成功依赖于为AI模型提供高质量数据,例如蛋白质数据库成就了蛋白质结构预测的辉煌 [9] - 当前科研数据存在分散、格式不一、元数据缺失等问题,形成数据孤岛,需建立统一标准使数据具备“AI就绪”基因 [16][17] - 下一代计算基础设施需打通E级高性能计算、专用AI、量子超级计算机,并融合安全网络、云算力及海量数据存储 [17] AI技术发展趋势 - 《自然》社论提出,将大模型的统计学习与符号推理、规划模块组合,可能是迈向“接近人类水平智能”的关键路径之一 [22] - “神经符号AI”概念热度激增,旨在融合神经网络与符号AI的优势,以解决神经网络的“黑箱”问题,并可能通向通用人工智能 [25][28] - 谷歌DeepMind的AlphaGeometry是神经符号AI的成功先例,但如何最佳地结合两者成为一个通用系统仍是待解难题 [28] 预期影响与行业动员 - 该战略的价值将辐射至整个经济体,研发投入占美国GDP的3.5%,AI赋能科研将提升生产力、引爆创新并驱动经济增长 [32] - 实现目标需要公私资金的合力注入,联合投资算力基建、搭建数据共享框架、并针对能催生AI新范式的难题展开协同攻关 [31] - 所有AI产出需具备可验证性,要求研究人员、机构、期刊等共同推动开源模型、标准化工具及“开箱即用”数据的普及 [21]
观察| 杨立昆离职:我们不在AI泡沫中,但在LLM泡沫中
文章核心观点 - 当前人工智能领域存在严重的大语言模型泡沫,将LLM等同于AI是片面和危险的[1] - LLM只是人工智能发展长河中的一朵浪花,而非整个AI领域的源头或终点[8] - 过度聚焦LLM导致资源分配失衡,挤占了其他重要AI研究方向的发展空间[16] - 中国AI发展存在隐忧,高校人才培养过度窄化于LLM赛道,可能错失下一代AI技术布局机会[17][19] AI发展历史与现状 - 人工智能本质是让机器学会像人一样思考做事的大工程,并非某类技术的专属冠名权[5] - AI发展70年历程是机器视觉、语音识别、强化学习、生成模型等多领域共同进步的结果[6][8] - 从1956年达特茅斯会议定名AI开始,经历了感知机、专家系统、深蓝、AlexNet、AlphaGo等多个里程碑[6] - 在自然语言处理领域,LLM只是晚来的晚辈,1966年ELIZA聊天机器人已能模拟真人对话[8] - 杨立昆批评当前LLM为"统计鹦鹉",只会模仿人类说话腔调,却不理解语义内涵[9] 创新规律与LLM泡沫 - 真正改变世界的创新往往在冷门角落诞生,而非聚光灯下[10] - 科技史上交流电战胜直流电、触屏手机取代功能机等案例证明冷门技术可能成为主流[11] - LLM热潮已陷入"比规模大"的死循环,从百亿参数卷到千亿再到万亿参数[14] - 研究者过度聚焦微调技术,如同在同一个馒头上面雕花,缺乏根本性创新[14] - 真正机会存在于LLM的阴影区:智能体AI、大模型压缩技术、神经符号AI等方向[15] 中国AI发展问题 - 近五年超过150所高校建立人工智能学院,但多数存在师资不足问题[17] - 高校课程设置严重偏向LLM,机器视觉、强化学习等传统优势领域被边缘化[17] - 人才培养同质化导致LLM领域人才过剩,而边缘AI、AI安全等方向人才稀缺[18] - 单一化研究导向正在削弱中国AI的创新根基,可能失去技术备选方案[19] - 需要培养敢闯冷门赛道的叛逆者,而非千篇一律的LLM跟风者[21] 未来发展建议 - LLM是AI发展的重要里程碑,但需要与App生态、5G网络等配合才能发挥真正价值[23] - 企业应结合自身真实需求,制造业可重点发展机器视觉,医疗领域可专注CT影像识别[23] - 研究者应跳出LLM舒适区,关注AI自主解决问题、移动端部署等前沿方向[23] - 高校需进行差异化培养,发挥各自在机器视觉、工业质检等领域的特色优势[21] - AI的未来属于多元智能共生,需要打破"LLM=AI"的片面认知[25]
具身智能革命:Pre-家庭人形,扫地机器人如何重塑家庭服务未来
机器人大讲堂· 2025-05-24 06:29
行业变革驱动力 - 具身智能技术正推动扫地机器人从清洁工具进化为具备感知、决策与执行能力的家庭智能体[1] - 英伟达创始人黄仁勋预言具身智能将成为人工智能下一波浪潮[1] - 科沃斯、石头、追觅、云鲸四巨头占据全球75%市场份额,成为具身智能技术落地先锋[1] 技术落地路径优势 - 扫地机器人年销量2000多万台,是消费市场最成熟、应用最广泛的机器人载体[2] - 硬件BOM成本以每年10%速率下降,加速具身智能产品普及临界点到来[2] - 家庭结构化环境更易完成感知层、决策层、执行层的逻辑重构[2] 技术架构突破 - 具身智能系统突破传统SLAM线性导航模式,实现从功能工具向自主智能体的范式迁移[3] - 采用强化学习模型模拟数十万次抓取场景,形成直觉式决策能力[3] - 双目视觉系统构建3D语义地图,物体标注为可移动、易碎或需避让类别[5] - 动态避障模式响应速度达1秒内,较传统SLAM算法提升数倍[5] 多模态感知能力 - 通过麦克风阵列识别宠物叫声,结合视觉数据启动避让模式[6] - 将激光雷达点云算法压缩到处理器,实现厘米级环境建模[6] - 多模态融合实现视觉-触觉-空间协同,机械臂可调整刚性程度适应不同场景[10] 产品功能演进 - 机械手搭载微型3D结构光相机,以每秒数百帧速度扫描地面[10] - 从单纯地面清洁升级为具备环境整理能力的智能助手[10] - 机械手夹取重量达400g,电机扭矩要求6Nm,追觅自主研发18mm超薄关节模组电机[11] 商业模式创新 - 具身智能带来场景化订阅服务可能性,如宠物毛发专清、婴幼儿安全模式等[11] - 用户每月支付99元可解锁家庭空间管理解决方案场景包[11] - 硬件+服务模式有望在红海市场中开辟利润缺口[11] 生态化发展战略 - 与宜家等企业合作开发配件仓,支持更换夹爪、吸头等工具[13] - 开放API接口允许第三方开发擦窗、浇花等扩展功能[13] - 分布式学习网络使A用户机器人经验可帮助B用户识别类似织物[13] 产业协同效应 - 微软Azure机器人事业部预测未来五年90%机器人创新能力来自软硬协同[13] - 科技巨头AI算法与传统厂商机械know-how结合加速家庭机器人进化[13] - 通过极致场景深耕反哺通用能力,借助成熟品类势能突破创新瓶颈[13]