信仰与突围:2026人工智能趋势前瞻
36氪·2025-12-22 09:32

文章核心观点 - 人工智能行业在ChatGPT发布三周年之际,竞争白热化,模型性能差距缩小,发展面临天花板质疑,但产业对AGI的到来仍充满信仰与探索 [1] - 行业展望2026年,将面临智能瓶颈与投资回报焦虑,同时也在规模法则、多模态、研究探索、物理AI仿真数据、AI for Science、模型应用一体化、个性化软件、行业落地ROI验证、AI眼镜及AI安全等多个方向寻求突围 [1] Scaling Law与AGI进化路径 - 行业主流信仰通过增加算力、数据、参数的Scaling Law可驱动智能持续增长直至AGI,但近期模型智能升级放缓及数据枯竭论引发质疑 [2] - 反对观点认为大模型仅是拟合语言相关性,而非真正理解世界,智能需包含抽象、因果推理等,且规模法则正接近极限,未来突破需更好的学习方式而非简单扩展规模 [2] - 在底层架构与训练方法无颠覆性变革背景下,Scaling Law仍是目前最可靠、实用的增长路径,因其能力提升可预测、产业投入可评估、人才与工程体系可延续迭代 [3] - 近期Gemini 3的表现与DeepSeek V3.2研究印证了规模法则现阶段依然有效 [3] - 美国AI新基建规划大型数据中心总装机容量超45吉瓦(GW),预计吸引超2.5万亿美元投资,黄仁勋提出在预训练、后训练强化学习及推理过程中均存在规模法则,支撑算力持续增长 [3] - 数据是当前大模型进化最迫切难题,高质量可用数据稀缺,行业正探索通过合成数据、推理过程数据、强化学习数据、多模态数据等构建可工程化、可规模化的数据生成体系 [4] - 未来将是New Scaling Law时代,不仅堆砌算力,更注重数量与质量扩展,结合算力资源充沛,有望通过算法与架构优化带来底层突破,AGI可能来自规模与结构性创新(如世界模型、具身智能等)的结合 [4] 多模态技术的突破与意义 - 谷歌Gemini、OpenAI Sora等多模态模型实现了对内容的深度理解与生成,迎来了多模态的ChatGPT时刻 [5] - 多模态技术从感知(如视觉)方向探索智能进化,类比生物进化中视觉的出现触发了认知能力的阶段性跃迁,有望推动AI智能出现非线性跃升 [5][7] - 大语言模型仅通过文本学习经过人类加工的“二手世界”,多模态模型通过图像、视频等对世界状态的直接投射,包含空间、时间及物理约束信息,为形成更稳健的世界模型提供可能 [9] - 多模态为人工智能打开了“感知-决策-行动”闭环的可能性,与工具使用、机器人控制结合,可通过环境反馈持续优化,实现智能跃升 [10] 研究探索与创新方向 - 研究驱动是大模型行业核心范式,以小团队多方向并进的赛马机制有效,预计2026年在底层架构、训练范式、评测方法、长期记忆、Agent等领域有望诞生更多突破 [11] - 全球涌现一批非共识的技术实验室:伊利亚的SSI聚焦安全超智能,融资30亿美金 [12];Mira的Thinking Machines Lab推出产品Tinker帮助微调模型 [12];李飞飞的World Labs专注空间智能 [12];杨立昆的AMI目标构建理解物理世界的系统 [12];欧洲的H Company研发能解决复杂现实问题的超级Agent [12] - 底层架构与训练范式出现创新研究:日本的Sakana AI站在Scaling Law对立面,探索演化式模型与群体智能协作以降低算力依赖 [13];Liquid AI开发可连续演化的液体神经网络架构 [14];谷歌提出嵌套学习(Nested Learning)概念,设计快慢系统协同解决灾难性遗忘问题 [14] - 评测牵引成为重要研发范式,行业正探索应对静态刷榜数据污染等挑战的新方法,包括构建面向Agent与长期任务的跨步、跨工具评测体系(如SWE-bench、AgentBench),以及基于游戏、模拟世界的动态交互式仿真环境评测 [15] 仿真数据在物理AI中的应用 - 机器人物理世界数据采集成本高(真机采集一条数据成本1-10美元)、速度慢,仿真生成数据边际成本趋近于零且可并行,在早中期研发中将成为主流,Sim-to-Real鸿沟正被生成式AI填平 [17] - 仿真数据在规模覆盖、可控可复现、跨本体迁移方面具有优势,能低成本覆盖长尾场景,支持多机器人多任务训练统一对齐 [18] - 产学研界已有实践:上海人工智能实验室的合成数据集InternData-A1包含超63万条轨迹、7433小时数据,覆盖4种具身形态、70项任务,基于其预训练的模型在仿真与真实任务上表现与官方模型相当 [18];银河通用发布灵巧手合成数据集DexonomySi,包含超950万条抓取姿态,覆盖超1万个物体,并基于此开发了具身大模型GroceryVila实现机器人双手自主取物 [18];谷歌的Genie 3为机器人训练提供无限可能的模拟环境 [18] - 仿真存在建模误差(如接触、材料、传感器噪声)及难以覆盖真实世界无穷意外组合的局限,尤其在软体物体、长周期可靠性、高风险人机共处等场景 [19][20] - 在物理AI早中期研发中,仿真预计承担90%以上的数据与验证工作,真机数据用于物理锚定与校准,仿真正成为物理AI的数据基础设施 [21] AI for Science (AI4S)的进展 - AI4S最具象征意义的成果是AlphaFold,但普遍质疑其离产业应用仍远,未能根本改变药物研发等领域的周期与成本 [22] - 2026年可能成为转折点,AI4S正从模型驱动的学术突破转向系统工程化的科研生产力 [22] - 核心障碍在于验证太贵太慢且难复制,当前积极变化是AI正被直接嵌入实验系统:谷歌DeepMind计划2026年在英国建立基于AI的自动化科研实验室,形成假设生成、机器人执行、数据回流的闭环,首次让AI4S从建议者变成执行者 [23] - 国家层面推动:美国通过《启动创世纪任务》行政令,将AI4S上升为国家战略,由能源部牵头建立全国性AI科学平台,整合联邦科研数据、超算资源和AI模型,聚焦先进制造、生物技术等关键领域,有望解决高质量科学数据匮乏的痛点 [25] - 2026年可能在某些领域出现研发周期数量级压缩,自动化实验与AI workflow成为头部机构标准配置,科研组织开始围绕AI agents重构分工 [26] 模型应用一体化与网络效应 - 大模型目前能力虽强但平台效应弱,未形成类似移动互联网的网络效应,ChatGPT周活接近10亿,但模型不会因用户增多自动变强,用户间连接弱 [27] - “裸模型”阶段因交互是一次性、私有的,难以直接回流训练与复用,且创造的价值源于对个体能力提升而非用户间关系密度,因此AI更多是生产力工具而非平台 [28] - 模型与应用一体化是破局点,当模型拥有稳定身份、长期记忆并持续参与用户工作流时,AI才具备成为平台的能力 [28] - 一个方向是模型接入更多应用(+AI),如GPT推出智能购物、群聊功能,Sora2推出Cameo个人数字形象功能以建立社交关系链 [29] - 更具颠覆性的方向是构建智联网新形态(AI+),即个人、团队、组织拥有自己的Agent并彼此协作,形成AI原生的网络效应 [31] - 未来Agent网络效应可能出现多种形式:交易型网络(形成服务型Agent与用户Agent的双边市场)[32];知识型网络(用户打磨的隐性技能库使模型越用越聪明)[32];工作流型网络(复杂任务流程被模块化、标准化并广泛复用)[32];社交型网络(AI成为组织内的超级连接器促进协作)[32] - 模型应用一体化的真正意义在于构建以模型为认知核心、应用为关系容器、Agent为基本节点的智能网络 [33] 个性化软件与AI编程 - AI Coding逼近普适生产力,软件正从工业化产品变为高度个性化、情境化、即时化的工具,进入软件3.0时代 [35] - Anthropic首席执行官预测未来3-6个月AI将编写90%的代码,12个月内几乎所有代码可能由AI编写 [35] - 美团内部已有52%的代码由AI生成,90%的工程师频繁使用AI工具,部分团队依赖AI完成90%以上代码编写 [35] - 腾讯月均新增代码3.25亿行,超90%工程师使用AI编程助手CodeBuddy,50%的新增代码由AI辅助生成 [35] - 软件生产核心瓶颈从编码能力转向问题定义能力,自然语言等成为主要编程接口,出现“vibe coder”称谓 [38] - 编程供给充裕将激活需求侧长尾市场,软件可千人千面,实现从人适应软件到软件适应人的范式转移,满足曾因市场规模小而被忽略的个性化需求 [39] - 部分解决通用问题的微软件将被分享复用,形成小规模生态(如Hugging Face Spaces上的小应用、Chrome插件)[39] - 软件平权时代来临,编写软件像写文章一样简单,核心竞争力转向共情、问题定义与想象力 [40] 行业落地与ROI验证 - AI行业落地从早期概念验证(PoC)进入核心业务流程,企业关注点从技术先进性转向可衡量的业务价值,ROI与性价比成为第一性问题 [41] - 麦肯锡报告显示,至少在一个职能中常态化使用AI的企业比例从78%升至88%,但多数仍处探索或试点阶段,企业层面规模化部署稀少,AI高绩效企业仅6% [41] - OpenAI企业调研显示,ChatGPT Enterprise周消息量增约8倍,员工人均消息量提升30%,组织平均推理token消耗增长约320倍,75%员工认为AI提升工作速度或质量,平均每日节省40-60分钟,重度用户每周节省超10小时 [42] - 早期AI应用多以Copilot形态承担边缘任务,对组织整体效率影响有限,当前积极变化是AI开始深入行业流程中后段 [43] - 下一步可验证收益将来自生产效率、客户响应、营销指标、研发生产力提升,未来深度收益将来自流程再造、智能体协同、供应链智能化等领域 [44] - 工作模式向“一个人+N个智能体”转变,企业管理逻辑将重构为以结果交付、质量稳定性和风险控制为中心的新范式 [44] AI眼镜的发展前景 - AI眼镜销量达1000万台是成为大众消费品的临界点,预测Meta Ray-Ban等产品2026年单品牌有望冲击此目标,巴克莱研究预测2035年销量将达6000万副 [45] - 雷朋制造商依视路将提前实施年产能1000万件可穿戴设备计划以满足需求 [45] - 硬件做减法是成功关键,Meta放弃高成本显示模组,将重量控制在50克以内,结合大模型多模态能力,首先成为合格穿戴与拍照设备,降低制造难度与用户门槛 [47] - AI眼镜将改变软件生态,操作逻辑从以应用为中心转向以意图为中心,自然语言交互主导,技能商店(Skill)可能取代应用商店 [48] - 眼镜摄像头产生的第一视角海量数据可为机器人训练提供数据,并可能催生基于视觉关注度的全新推荐与广告模式 [48] - 个人隐私、数据脱敏及相关法律伦理规范在AI眼镜领域尤为重要 [48] AI安全与治理 - AI能力提升与AGI逼近使安全关注度提升,调研显示66%受访者经常使用AI,但超半数(58%)认为其不可信赖,公众信任度呈下降趋势 [50][51] - 安全算力成为重点,预计超10%的算力将投入安全领域(涵盖安全评估、对齐实验、红队测试等)[54] - OpenAI曾承诺将20%算力用于超级智能对齐研究但未兑现,伊利亚成立的SSI公司专注超人工智能安全,融资30亿美金,估值320亿美元 [54] - 美欧法规提案将高风险模型的系统测试、评估、监控列为强制义务,安全算力将形成刚性成本,且随着模型能力增长,安全评估对算力需求指数级放大 [54] - AI治理委员会成为趋势,越来越多企业建立深度嵌入研发全流程的安全伦理机构 [55] - 例如:Google DeepMind有Responsibility & Safety团队参与全过程 [55];微软有Aether委员会其结论纳入工程必选流程 [55];Anthropic设立长期利益信托(LTBT)机制并推动宪法AI(Constitutional AI)将安全嵌入训练 [55] - AI安全与负责任正演变为与算力、算法、数据同等重要的基础性要素,缺乏可信安全机制的模型将难以进入关键行业与主流市场 [56]