Helios全液冷机架平台
搜索文档
腾讯研究院AI速递 20260107
腾讯研究院· 2026-01-06 16:05
生成式AI硬件与平台重大进展 - 英伟达正式发布Vera Rubin超算架构,推理性能比Blackwell提升5倍、训练性能提升3.5倍、成本降低10倍,已大规模投产并将于2026下半年面世 [1] - Rubin平台由6个关键组件构成,包括Rubin GPU(50 PFLOPS算力)、Vera CPU(88核Olympus)、BlueField-4 DPU、NVLink 6等 [1] - AMD发布Helios全液冷机架平台,配备MI455X GPU(3200亿晶体管、432GB HBM4内存),性能比MI355X提升10倍,2027年推出2nm制程MI500 [2] - Helios机架拥有2.9 exaflops算力、31TB HBM4显存、43TB/s带宽,EPYC Venice CPU性能提升70%以上、线程密度提高30%以上 [2] 端侧与PC AI芯片竞争加剧 - 英特尔发布全球首款基于Intel 18A制程(1.8nm级)的第三代酷睿Ultra处理器,端侧AI算力达180TOPS,多线程性能提升60%、游戏性能提升77% [3] - 采用Foveros-S封装技术整合多种制程模块,配备Arc B390集成GPU支持AI多帧生成(每渲染1帧生成3帧),续航最长可达27小时 [3] - 首批搭载Ryzen AI 400系列处理器的AI PC将于2026年Q1出货,全年推出超120款产品,迷你PC AMD Ryzen AI Halo预计Q2上市 [2] AI模型与算法创新 - MiroMind发布MiroThinker 1.5旗舰版模型,仅30B和235B参数却在BrowseComp测试中刷新ChatGPT-Agent纪录,单条调用成本仅0.07美元 [5][6] - 核心创新在于将Interactive Scaling内化为训练机制,构建“推理-验证-修正”循环路径,通过主动求证、多轮校验和反幻觉过滤实现证据驱动推理 [6] - 采用时序敏感训练沙盒严格约束信息可见性,让模型杜绝复述结果、学会真实预测,突破传统Scaling Law的“做题家模式”转向“科学家模式” [6] 具身智能与机器人产业化提速 - 波士顿动力在CES 2026发布新一代全电动人形机器人Atlas产品版,身高1.9米、重90kg、56个自由度,最大工作半径2.3米、可搬运50kg负载 [8] - 与Google DeepMind建立长期AI合作,将Gemini Robotics(VLA)引入Atlas平台,2026年交付名额已锁定,首批进入现代汽车RMAC和DeepMind [8] - 现代集团宣布2028年在美国建设年产3万台机器人新工厂,未来几年向机器人与AI领域投入超260亿美元 [8] - 智元具身研究中心提出SOP框架,业界首次在物理世界后训练中深度整合在线、分布式和多任务机制 [9] - 实验显示四机并行学习3小时成功率达92.5%,训练速度达单机2.4倍,3小时在轨经验带来约30%性能提升,超越80小时到160小时预训练数据的边际收益 [9] AI应用与行业影响 - 英伟达同步发布端到端自动驾驶AI AlphaMayo和物理AI全家桶开源,包括Cosmos、Isaac GR00T等模型,可实现全程0接管自主驾驶 [1] - 香港科技大学教授团队让搭载GPT-5.2的乐奇AI眼镜参加《计算机网络原理》期末考试,30分钟获92.5分超越95%学生,多项选择题和单页短答题满分 [7] - Anthropic社区与代码负责人发布31天连载博客,核心技巧包括/init自动生成入职文档、Plan Mode先规划再动手、Subagents并行处理、Hooks生命周期插手、LSP语义级代码理解等31条实战经验 [10][11] 行业人才与组织动态 - OpenAI研发副总裁Jerry Tworek正式宣布离职,这位七年老兵是o1/o3推理模型之父和Codex编程模型核心研究员,离职理由是“想做在OpenAI做不了的研究” [4] - 这是OpenAI继Dario Amodei、Ilya Sutskever、John Schulman、Jan Leike等核心人才流失后的又一重磅离职 [4]