腾讯研究院AI速递 20260104

大模型技术进展 - DeepSeek团队提出mHC方案，通过将残差映射矩阵投影到双随机矩阵流形空间，将信号放大倍数从3000控制在1.6，稳定训练并提升可扩展性 [1] - 在27B模型实验中，mHC方案在BBH、DROP等任务上全面超越传统HC，最高提升达2.3个百分点，仅引入6.7%的训练时间开销 [1] - OpenAI正开发全新音频模型架构，计划于2026年第一季度推出，旨在带来更自然情感的声音、更准确深入的回答和更好的打断处理能力 [4] - 图灵奖得主LeCun创办AMI Labs，专注世界模型，预计12个月内推出具备初步物理直觉的“婴儿级”模型，强调模型需理解物理世界运作方式 [9] AI应用与商业化 - Claude Code项目上线6个月创造近10亿美元年化营收，其项目负责人承认过去30天100%的代码由Claude Code完成 [2] - Claude Code的核心配置包括终端并行运行5个Claude、网页同时运行5-10个Claude、使用Opus 4.5模型，并通过团队共享CLAUDE.md文件及GitHub action集成 [2] - 关键应用技巧包括Plan模式规划、斜杠命令封装工作流、使用子代理处理重复任务，以及通过PostToolUse hook格式化代码和建立反馈闭环 [2] - OpenAI正在开发首款AI硬件，内部代号“Gumdrop”，可能是一支集成麦克风和摄像头的笔形设备，可将手写笔记实时转化为文本并上传至ChatGPT [4] - 该设备尺寸与iPod Shuffle相仿，目标成为继iPhone和MacBook后的“第三核心设备”，最初计划由立讯精密生产后转向富士康，预计在越南或美国工厂制造 [4] 自动驾驶技术 - 特斯拉FSD V14.2实现首次横穿美国，一辆2025款Model 3历时2天20小时行驶2732.4英里实现零干预，包括停车和充电全程无人接管 [3] - FSD v14.2在驾驶表现、感知能力和决策逻辑上明显强化，处理复杂路口、无保护左转和车道博弈更果断，整体驾驶节奏更连贯像人类 [3] - 特斯拉端到端架构与Waymo模块化路线形成对比，旧金山停电事件显示Waymo因依赖高清地图和多传感器融合而大面积中断，而特斯拉FSD基本未受影响 [3] 半导体制造 - 台积电N2（2nm）技术已于2025年第四季度投入量产，采用第一代纳米片晶体管（GAA）技术 [5][6] - 相比N3E工艺，N2在同样功耗下性能提升10%-15%，在同样速度下功耗降低25%-30% [6] - N2工艺采用环栅纳米片晶体管四面包裹电流通道，配合SHPMIM电容器，晶体管密度相对N3E提升约20%，电容容量密度提升逾2倍 [6] - 台积电在高雄和新竹两座晶圆厂同时扩产，服务手机芯片和AI/HPC芯片，N2P和A16工艺计划于2026年下半年量产 [6] 机器人技术 - 智元机器人公布“启元Q1”小尺寸全身力控人形机器人，站立高度约0.8米，可装进30-35L双肩包 [7] - 通过材料和控制算法创新，其QDD关节缩小到“比鸡蛋还小”且保持全尺寸力控性能，体积和重量仅为全尺寸机器人的1/8 [7] - 启元Q1采用复合材料工艺实现耐摔耐炸，SDK与HDK全部开源，支持3D打印自定义外观，内置“智元灵心”AI平台支持自然对话和百科问答 [7] - 通过“智元灵创”平台可像搭积木一样编排动作和逻辑，定位为个人创作者的桌面机器人 [7] 脑机接口技术 - Neuralink宣布将于2026年开始大规模生产脑机接口设备，转向精简、几乎完全自动化的手术流程，脑芯片电极线将直接穿过硬脑膜而无需切除 [8] - 新技术的微创方式旨在降低成本、减小风险、缩短恢复周期，使标准化门槛更低 [8] - 截至2025年9月Neuralink累计服务患者仅12人，到12月已达20人，其首位患者术后仅凭脑芯片可发帖和玩游戏 [8] 行业动态与争议 - 图灵奖得主LeCun离职Meta后实锤Llama 4造假传闻，称团队在不同基准上用不同模型“篡改”测试结果以获得更好成绩，直接导致扎克伯格对原AI团队失去信心 [9] - LeCun炮轰其28岁上司Alexandr Wang“没有研究经验不知道如何进行研究”，认为Meta招来的人“完全被大语言模型洗脑”，并坚持LLM是通往超级智能的“死路” [9]