信仰与突围：2026人工智能趋势前瞻

文章核心观点 - 人工智能行业在ChatGPT发布三周年之际，竞争白热化，模型性能差距缩小，发展面临天花板质疑，但产业对AGI的到来仍充满信仰与探索 [1] - 行业展望2026年，将面临智能瓶颈与投资回报焦虑，同时也在规模法则、多模态、研究探索、物理AI仿真数据、AI for Science、模型应用一体化、个性化软件、行业落地ROI验证、AI眼镜及AI安全等多个方向寻求突围 [1] Scaling Law与AGI进化路径 - 行业主流信仰通过增加算力、数据、参数的Scaling Law可驱动智能持续增长直至AGI，但近期模型智能升级放缓及数据枯竭论引发质疑 [2] - 反对观点认为大模型仅是拟合语言相关性，而非真正理解世界，智能需包含抽象、因果推理等，且规模法则正接近极限，未来突破需更好的学习方式而非简单扩展规模 [2] - 在底层架构与训练方法无颠覆性变革背景下，Scaling Law仍是目前最可靠、实用的增长路径，因其能力提升可预测、产业投入可评估、人才与工程体系可延续迭代 [3] - 近期Gemini 3的表现与DeepSeek V3.2研究印证了规模法则现阶段依然有效 [3] - 美国AI新基建规划大型数据中心总装机容量超45吉瓦(GW)，预计吸引超2.5万亿美元投资，黄仁勋提出在预训练、后训练强化学习及推理过程中均存在规模法则，支撑算力持续增长 [3] - 数据是当前大模型进化最迫切难题，高质量可用数据稀缺，行业正探索通过合成数据、推理过程数据、强化学习数据、多模态数据等构建可工程化、可规模化的数据生成体系 [4] - 未来将是New Scaling Law时代，不仅堆砌算力，更注重数量与质量扩展，结合算力资源充沛，有望通过算法与架构优化带来底层突破，AGI可能来自规模与结构性创新（如世界模型、具身智能等）的结合 [4] 多模态技术的突破与意义 - 谷歌Gemini、OpenAI Sora等多模态模型实现了对内容的深度理解与生成，迎来了多模态的ChatGPT时刻 [5] - 多模态技术从感知（如视觉）方向探索智能进化，类比生物进化中视觉的出现触发了认知能力的阶段性跃迁，有望推动AI智能出现非线性跃升 [5][7] - 大语言模型仅通过文本学习经过人类加工的“二手世界”，多模态模型通过图像、视频等对世界状态的直接投射，包含空间、时间及物理约束信息，为形成更稳健的世界模型提供可能 [9] - 多模态为人工智能打开了“感知-决策-行动”闭环的可能性，与工具使用、机器人控制结合，可通过环境反馈持续优化，实现智能跃升 [10] 研究探索与创新方向 - 研究驱动是大模型行业核心范式，以小团队多方向并进的赛马机制有效，预计2026年在底层架构、训练范式、评测方法、长期记忆、Agent等领域有望诞生更多突破 [11] - 全球涌现一批非共识的技术实验室：伊利亚的SSI聚焦安全超智能，融资30亿美金 [12]；Mira的Thinking Machines Lab推出产品Tinker帮助微调模型 [12]；李飞飞的World Labs专注空间智能 [12]；杨立昆的AMI目标构建理解物理世界的系统 [12]；欧洲的H Company研发能解决复杂现实问题的超级Agent [12] - 底层架构与训练范式出现创新研究：日本的Sakana AI站在Scaling Law对立面，探索演化式模型与群体智能协作以降低算力依赖 [13]；Liquid AI开发可连续演化的液体神经网络架构 [14]；谷歌提出嵌套学习(Nested Learning)概念，设计快慢系统协同解决灾难性遗忘问题 [14] - 评测牵引成为重要研发范式，行业正探索应对静态刷榜数据污染等挑战的新方法，包括构建面向Agent与长期任务的跨步、跨工具评测体系（如SWE-bench、AgentBench），以及基于游戏、模拟世界的动态交互式仿真环境评测 [15] 仿真数据在物理AI中的应用 - 机器人物理世界数据采集成本高（真机采集一条数据成本1-10美元）、速度慢，仿真生成数据边际成本趋近于零且可并行，在早中期研发中将成为主流，Sim-to-Real鸿沟正被生成式AI填平 [17] - 仿真数据在规模覆盖、可控可复现、跨本体迁移方面具有优势，能低成本覆盖长尾场景，支持多机器人多任务训练统一对齐 [18] - 产学研界已有实践：上海人工智能实验室的合成数据集InternData-A1包含超63万条轨迹、7433小时数据，覆盖4种具身形态、70项任务，基于其预训练的模型在仿真与真实任务上表现与官方模型相当 [18]；银河通用发布灵巧手合成数据集DexonomySi，包含超950万条抓取姿态，覆盖超1万个物体，并基于此开发了具身大模型GroceryVila实现机器人双手自主取物 [18]；谷歌的Genie 3为机器人训练提供无限可能的模拟环境 [18] - 仿真存在建模误差（如接触、材料、传感器噪声）及难以覆盖真实世界无穷意外组合的局限，尤其在软体物体、长周期可靠性、高风险人机共处等场景 [19][20] - 在物理AI早中期研发中，仿真预计承担90%以上的数据与验证工作，真机数据用于物理锚定与校准，仿真正成为物理AI的数据基础设施 [21] AI for Science (AI4S)的进展 - AI4S最具象征意义的成果是AlphaFold，但普遍质疑其离产业应用仍远，未能根本改变药物研发等领域的周期与成本 [22] - 2026年可能成为转折点，AI4S正从模型驱动的学术突破转向系统工程化的科研生产力 [22] - 核心障碍在于验证太贵太慢且难复制，当前积极变化是AI正被直接嵌入实验系统：谷歌DeepMind计划2026年在英国建立基于AI的自动化科研实验室，形成假设生成、机器人执行、数据回流的闭环，首次让AI4S从建议者变成执行者 [23] - 国家层面推动：美国通过《启动创世纪任务》行政令，将AI4S上升为国家战略，由能源部牵头建立全国性AI科学平台，整合联邦科研数据、超算资源和AI模型，聚焦先进制造、生物技术等关键领域，有望解决高质量科学数据匮乏的痛点 [25] - 2026年可能在某些领域出现研发周期数量级压缩，自动化实验与AI workflow成为头部机构标准配置，科研组织开始围绕AI agents重构分工 [26] 模型应用一体化与网络效应 - 大模型目前能力虽强但平台效应弱，未形成类似移动互联网的网络效应，ChatGPT周活接近10亿，但模型不会因用户增多自动变强，用户间连接弱 [27] - “裸模型”阶段因交互是一次性、私有的，难以直接回流训练与复用，且创造的价值源于对个体能力提升而非用户间关系密度，因此AI更多是生产力工具而非平台 [28] - 模型与应用一体化是破局点，当模型拥有稳定身份、长期记忆并持续参与用户工作流时，AI才具备成为平台的能力 [28] - 一个方向是模型接入更多应用（+AI），如GPT推出智能购物、群聊功能，Sora2推出Cameo个人数字形象功能以建立社交关系链 [29] - 更具颠覆性的方向是构建智联网新形态（AI+），即个人、团队、组织拥有自己的Agent并彼此协作，形成AI原生的网络效应 [31] - 未来Agent网络效应可能出现多种形式：交易型网络（形成服务型Agent与用户Agent的双边市场）[32]；知识型网络（用户打磨的隐性技能库使模型越用越聪明）[32]；工作流型网络（复杂任务流程被模块化、标准化并广泛复用）[32]；社交型网络（AI成为组织内的超级连接器促进协作）[32] - 模型应用一体化的真正意义在于构建以模型为认知核心、应用为关系容器、Agent为基本节点的智能网络 [33] 个性化软件与AI编程 - AI Coding逼近普适生产力，软件正从工业化产品变为高度个性化、情境化、即时化的工具，进入软件3.0时代 [35] - Anthropic首席执行官预测未来3-6个月AI将编写90%的代码，12个月内几乎所有代码可能由AI编写 [35] - 美团内部已有52%的代码由AI生成，90%的工程师频繁使用AI工具，部分团队依赖AI完成90%以上代码编写 [35] - 腾讯月均新增代码3.25亿行，超90%工程师使用AI编程助手CodeBuddy，50%的新增代码由AI辅助生成 [35] - 软件生产核心瓶颈从编码能力转向问题定义能力，自然语言等成为主要编程接口，出现“vibe coder”称谓 [38] - 编程供给充裕将激活需求侧长尾市场，软件可千人千面，实现从人适应软件到软件适应人的范式转移，满足曾因市场规模小而被忽略的个性化需求 [39] - 部分解决通用问题的微软件将被分享复用，形成小规模生态（如Hugging Face Spaces上的小应用、Chrome插件）[39] - 软件平权时代来临，编写软件像写文章一样简单，核心竞争力转向共情、问题定义与想象力 [40] 行业落地与ROI验证 - AI行业落地从早期概念验证(PoC)进入核心业务流程，企业关注点从技术先进性转向可衡量的业务价值，ROI与性价比成为第一性问题 [41] - 麦肯锡报告显示，至少在一个职能中常态化使用AI的企业比例从78%升至88%，但多数仍处探索或试点阶段，企业层面规模化部署稀少，AI高绩效企业仅6% [41] - OpenAI企业调研显示，ChatGPT Enterprise周消息量增约8倍，员工人均消息量提升30%，组织平均推理token消耗增长约320倍，75%员工认为AI提升工作速度或质量，平均每日节省40-60分钟，重度用户每周节省超10小时 [42] - 早期AI应用多以Copilot形态承担边缘任务，对组织整体效率影响有限，当前积极变化是AI开始深入行业流程中后段 [43] - 下一步可验证收益将来自生产效率、客户响应、营销指标、研发生产力提升，未来深度收益将来自流程再造、智能体协同、供应链智能化等领域 [44] - 工作模式向“一个人+N个智能体”转变，企业管理逻辑将重构为以结果交付、质量稳定性和风险控制为中心的新范式 [44] AI眼镜的发展前景 - AI眼镜销量达1000万台是成为大众消费品的临界点，预测Meta Ray-Ban等产品2026年单品牌有望冲击此目标，巴克莱研究预测2035年销量将达6000万副 [45] - 雷朋制造商依视路将提前实施年产能1000万件可穿戴设备计划以满足需求 [45] - 硬件做减法是成功关键，Meta放弃高成本显示模组，将重量控制在50克以内，结合大模型多模态能力，首先成为合格穿戴与拍照设备，降低制造难度与用户门槛 [47] - AI眼镜将改变软件生态，操作逻辑从以应用为中心转向以意图为中心，自然语言交互主导，技能商店(Skill)可能取代应用商店 [48] - 眼镜摄像头产生的第一视角海量数据可为机器人训练提供数据，并可能催生基于视觉关注度的全新推荐与广告模式 [48] - 个人隐私、数据脱敏及相关法律伦理规范在AI眼镜领域尤为重要 [48] AI安全与治理 - AI能力提升与AGI逼近使安全关注度提升，调研显示66%受访者经常使用AI，但超半数(58%)认为其不可信赖，公众信任度呈下降趋势 [50][51] - 安全算力成为重点，预计超10%的算力将投入安全领域（涵盖安全评估、对齐实验、红队测试等）[54] - OpenAI曾承诺将20%算力用于超级智能对齐研究但未兑现，伊利亚成立的SSI公司专注超人工智能安全，融资30亿美金，估值320亿美元 [54] - 美欧法规提案将高风险模型的系统测试、评估、监控列为强制义务，安全算力将形成刚性成本，且随着模型能力增长，安全评估对算力需求指数级放大 [54] - AI治理委员会成为趋势，越来越多企业建立深度嵌入研发全流程的安全伦理机构 [55] - 例如：Google DeepMind有Responsibility & Safety团队参与全过程 [55]；微软有Aether委员会其结论纳入工程必选流程 [55]；Anthropic设立长期利益信托(LTBT)机制并推动宪法AI(Constitutional AI)将安全嵌入训练 [55] - AI安全与负责任正演变为与算力、算法、数据同等重要的基础性要素，缺乏可信安全机制的模型将难以进入关键行业与主流市场 [56]