腾讯研究院AI速递 20260104
腾讯研究院·2026-01-03 16:01

大模型技术进展 - DeepSeek团队提出mHC方案,通过将残差映射矩阵投影到双随机矩阵流形空间,将信号放大倍数从3000控制在1.6,稳定训练并提升可扩展性 [1] - 在27B模型实验中,mHC方案在BBH、DROP等任务上全面超越传统HC,最高提升达2.3个百分点,仅引入6.7%的训练时间开销 [1] - OpenAI正开发全新音频模型架构,计划于2026年第一季度推出,旨在带来更自然情感的声音、更准确深入的回答和更好的打断处理能力 [4] - 图灵奖得主LeCun创办AMI Labs,专注世界模型,预计12个月内推出具备初步物理直觉的“婴儿级”模型,强调模型需理解物理世界运作方式 [9] AI应用与商业化 - Claude Code项目上线6个月创造近10亿美元年化营收,其项目负责人承认过去30天100%的代码由Claude Code完成 [2] - Claude Code的核心配置包括终端并行运行5个Claude、网页同时运行5-10个Claude、使用Opus 4.5模型,并通过团队共享CLAUDE.md文件及GitHub action集成 [2] - 关键应用技巧包括Plan模式规划、斜杠命令封装工作流、使用子代理处理重复任务,以及通过PostToolUse hook格式化代码和建立反馈闭环 [2] - OpenAI正在开发首款AI硬件,内部代号“Gumdrop”,可能是一支集成麦克风和摄像头的笔形设备,可将手写笔记实时转化为文本并上传至ChatGPT [4] - 该设备尺寸与iPod Shuffle相仿,目标成为继iPhone和MacBook后的“第三核心设备”,最初计划由立讯精密生产后转向富士康,预计在越南或美国工厂制造 [4] 自动驾驶技术 - 特斯拉FSD V14.2实现首次横穿美国,一辆2025款Model 3历时2天20小时行驶2732.4英里实现零干预,包括停车和充电全程无人接管 [3] - FSD v14.2在驾驶表现、感知能力和决策逻辑上明显强化,处理复杂路口、无保护左转和车道博弈更果断,整体驾驶节奏更连贯像人类 [3] - 特斯拉端到端架构与Waymo模块化路线形成对比,旧金山停电事件显示Waymo因依赖高清地图和多传感器融合而大面积中断,而特斯拉FSD基本未受影响 [3] 半导体制造 - 台积电N2(2nm)技术已于2025年第四季度投入量产,采用第一代纳米片晶体管(GAA)技术 [5][6] - 相比N3E工艺,N2在同样功耗下性能提升10%-15%,在同样速度下功耗降低25%-30% [6] - N2工艺采用环栅纳米片晶体管四面包裹电流通道,配合SHPMIM电容器,晶体管密度相对N3E提升约20%,电容容量密度提升逾2倍 [6] - 台积电在高雄和新竹两座晶圆厂同时扩产,服务手机芯片和AI/HPC芯片,N2P和A16工艺计划于2026年下半年量产 [6] 机器人技术 - 智元机器人公布“启元Q1”小尺寸全身力控人形机器人,站立高度约0.8米,可装进30-35L双肩包 [7] - 通过材料和控制算法创新,其QDD关节缩小到“比鸡蛋还小”且保持全尺寸力控性能,体积和重量仅为全尺寸机器人的1/8 [7] - 启元Q1采用复合材料工艺实现耐摔耐炸,SDK与HDK全部开源,支持3D打印自定义外观,内置“智元灵心”AI平台支持自然对话和百科问答 [7] - 通过“智元灵创”平台可像搭积木一样编排动作和逻辑,定位为个人创作者的桌面机器人 [7] 脑机接口技术 - Neuralink宣布将于2026年开始大规模生产脑机接口设备,转向精简、几乎完全自动化的手术流程,脑芯片电极线将直接穿过硬脑膜而无需切除 [8] - 新技术的微创方式旨在降低成本、减小风险、缩短恢复周期,使标准化门槛更低 [8] - 截至2025年9月Neuralink累计服务患者仅12人,到12月已达20人,其首位患者术后仅凭脑芯片可发帖和玩游戏 [8] 行业动态与争议 - 图灵奖得主LeCun离职Meta后实锤Llama 4造假传闻,称团队在不同基准上用不同模型“篡改”测试结果以获得更好成绩,直接导致扎克伯格对原AI团队失去信心 [9] - LeCun炮轰其28岁上司Alexandr Wang“没有研究经验不知道如何进行研究”,认为Meta招来的人“完全被大语言模型洗脑”,并坚持LLM是通往超级智能的“死路” [9]