Workflow
模型分化
icon
搜索文档
唐杰、姚顺雨、杨植麟、林俊旸同台对话背后:5个2026年最重要的AI趋势观察
新浪财经· 2026-01-11 06:47
会议背景与核心观点 - 2025年1月10日,一场由中国大模型领域顶尖人物参与的对话在北京举行,核心议题是寻找中国AGI的突围路径[1][16] - 与会者平均年龄不到35岁,代表了中国AGI赛道的主要力量,包括智谱AI(唐杰)、腾讯(姚顺雨)、阿里巴巴(林俊旸)、月之暗面(杨植麟)等公司[1][2][15][16] - 会议核心共识是,“Chat(对话)范式”的竞争已结束,大模型的未来将向解决问题与自主学习的“深水区”演进[3][17] 下一代AGI范式:自主学习 - 阿里巴巴林俊旸认为,2026年最关键的赌注在于AI的主动性,未来范式应是环境直接Prompt模型,让AI自主思考决策,而非被动响应指令[3][17] - 腾讯姚顺雨同样认为AGI接下来最重要的点是自主学习,这是一个由数据和任务驱动的渐变过程[4][18] - 姚顺雨举例,目前Claude 95%的代码已由Claude自己编写,ChatGPT利用用户数据更新风格也是自主学习的早期信号[4][18] - 林俊旸指出主动学习范式存在风险,需为AI注入正确方向指引,类似培养小孩[3][17] - 姚顺雨认为,尽管OpenAI内部创新受损,但其仍是全球最可能引领下一代范式创新的公司[4][18] Scaling Law(规模法则)的演进与效率 - 智谱AI唐杰指出Scaling Law面临效率困境,从2025年初的10T数据到现在的30T甚至未来100T,单纯增加数据量的收益正在递减[5][19] - 唐杰提出新衡量标准“智能效率”,即用更少算力、更小规模获得同等或更高智能提升,并预判在持续学习、记忆及多模态领域会发生效率范式变革[5][19] - 月之暗面杨植麟认为Scaling Law远未到终点,但内涵已变,Scaling意味着在架构、优化器、数据层面做技术改进,以让模型拥有更好的“品味”,形成护城河[6][20] - 杨植麟指出,Token效率与长文本将是决定AI智力水平的核心因素[6][20] - 阿里巴巴林俊旸提出“测试时扩展”思路,认为o1系列证明可在推理时投入更多计算资源让模型变强,而非仅在训练阶段死磕数据量[6][20] 模型分化趋势 - 模型分化指大模型不再追求样样精通的通用工具,而是根据场景、产品形态和技术特性裂变成不同方向[7][21] - 腾讯姚顺雨认为,模型分化首先发生在商业逻辑上:在B端,智能直接等同于收益,美国用户愿为强模型支付数倍溢价,因其能将任务正确率从60%提升到90%[8][22] - 在C端,分化不在于模型变大,而在于上下文厚度,产品应通过垂直整合让模型感知用户实时环境,走“模型与产品强耦合”路线[8][22] - 阿里巴巴林俊旸认为,公司基因对生态位影响不大,To B和To C本质都是服务人类,他以Anthropic为例,指出其成功源于发现B端客户巨大的Token消耗场景[8][22] - 杨强院士提出,大模型进入稳态后,学术界应研究智能上限和幻觉的平衡,即投入资源与降低错误率之间的风险收益平衡,并建议借鉴人类睡眠机制清理学习噪音[9][23] AI Agent的发展前景与挑战 - 2026年市场对Agent价值爆发充满信心,但对其能否自动化1-2周工作存在不同看法[11][25] - 腾讯姚顺雨认为,To B的Agent正处在上升曲线,但在To C场景,DAU和模型智能常不相关甚至相反,瓶颈在于环境部署和用户教育[11][25] - 阿里巴巴林俊旸认为,通用Agent的魅力在于解决长尾问题,其未来应不止于电脑,需与真实物理世界交互,未来三到五年可能与具身智能结合[11][25] - 杨强院士将Agent发展分为四阶段,认为当前处于最初级阶段(人定义目标与规划),未来大模型将能利用人的过程数据,自行定义目标与规划[12][26] - 智谱AI唐杰认为Agent未来取决于三方面:真正帮助人的价值、成本、以及应用开发速度,行业目前更多在拼速度和时间[12][26] 中美AI竞争与中国的机会 - 智谱AI唐杰对中美差距持保守态度,认为中国模型在快速迭代,但差距可能未缩小,因美国有大量未开源闭源模型[12][26] - 腾讯姚顺雨认为,中国要成为引领者关键在算力突破、发展更成熟的To B市场、以及参与国际商业竞争[13][27] - 姚顺雨指出,美国在To B模型和应用上领先,因其支付意愿更强、文化更鼓励冒险和创新精神[13][27] - 姚顺雨强调,中国需解决能否引领新范式的问题,并走出“榜单的束缚”[13][27] - 阿里巴巴林俊旸同样强调了冒险和创新的重要性[14][28] - 唐杰指出中国市场的赶超机会在于:一群敢冒险的聪明人、更好的营商环境(包括政策)、以及个人的坚持精神[14][28]
唐杰、杨植麟、姚顺雨、林俊旸罕见同台分享,这3个小时的信息密度实在太高了。
创业邦· 2026-01-11 03:22
以下文章来源于数字生命卡兹克 ,作者数字生命卡兹克 数字生命卡兹克 . 希望能激发你对AI的好奇。 来源丨数字生命卡兹克 (ID: Rockhazix ) 作者丨 卡兹克 昨日受邀,参加了一个非常有趣的活动,现场人真的爆满了,很多人都是从外地特意赶过来的。 这个活动,叫AGI-NEXT。 主要是几个演讲的嘉宾,过于重磅了。 开源四巨头除了DeepSeek没来,智谱的唐杰老师、Kimi的杨植麟、Qwen的林俊旸,齐聚一堂。 甚至腾讯最近最有话题度的姚顺雨,都以远程"巨头"的方式,远程参加了这场会议。 这个巨头,真的是非常的AI巨头。 这场活动因为没有座位了,我站着听了3个小时,收货非常的多。 包括唐老师说,随着DeepSeek这类模型的横空出世,Chat聊天这种范式,其实已经没有仗可打了。 下一仗是什么?是 Action ,是 Doing things 。 杨植麟说,Agent的本质,其实是一个搜索问题。 还有,智能和电力不一样,它不是等价交换品。 你在深圳用的一度电,和在北京用的一度电,完全一样,但一个CEO产生的智能,和一个设计师产生的智能,截然不同。 未来的模型竞争,比的就是谁更有Taste,谁更有品味, ...
唐杰/杨植麟/林俊旸/姚顺雨罕见同台,“基模四杰”开聊中国AGI
新浪财经· 2026-01-10 14:44
文章核心观点 - 中国大模型行业的核心参与者(智谱、腾讯、阿里、月之暗面)在AGI-Next峰会上探讨了行业未来发展方向,共识在于基础模型能力是竞争关键,但发展路径出现分化,重点关注To B与To C的分化、新的技术范式(如自主学习)以及衡量模型智能的新标准[4][5][6][7] 行业竞争格局与公司动态 - 智谱AI于2026年1月8日登陆港股,其创始人唐杰认为对话(Chat)范式探索随DeepSeek出现已基本结束,公司已押注(bet)于Coding和Reasoning,成果为GLM-4.5模型[4][5][6][23] - 前OpenAI研究员姚顺雨加入腾讯,出任CEO办公室首席科学家,腾讯近期完成了关键的模型团队重组[4] - 阿里通义实验室技术负责人林俊旸为阿里最年轻P10,其开源模型的衍生数量和下载量位列全球第一[4] - 月之暗面CEO杨植麟近期官宣了新一轮5亿美元的融资[5] 中美大模型差距与行业共识 - 唐杰指出,美国与中国大模型之间的差距可能并未缩小,因为美国有大量闭源模型未开源[5] - 2025年行业形成的最大共识是:基础模型的能力高低决定着未来多场竞争的输赢,包括能否成为下一个超级入口或伟大公司[5] - 四位嘉宾共同看好AI的自主学习作为下一阶段的方向[6] 下一代AGI范式与智能衡量标准 - 智谱唐杰定义了衡量智力水平的新范式“Intelligence Efficiency”,用于衡量模型投入和智力收益的ROI,他认为当前疯狂的RL和Scaling收益已大不如前[7][41] - 月之暗面杨植麟认为下一阶段Scaling仍是重点,但需在架构、优化器、数据层面做技术改进,目的是让模型拥有更好的“Taste”以避免趋同[6] - 杨植麟定义的AI智力水平是Token效率(Token Efficiency)和长文本(Long Context)的结合[7] - 学术界代表杨强提出,需研究智能上限、资源分配以及如何用资源换取幻觉降低的平衡点,类比经济学中的“无免费午餐定理”[20][93] To B与To C市场分化 - 姚顺雨与林俊旸共识:To C和To B的分化会越来越明显,AGI的本质是服务真实的人类场景[7] - To C场景下,垂直整合成立,模型与产品需强耦合迭代以优化用户体验,如ChatGPT和豆包[7][13] - To B场景下,趋势相反:模型公司专注做强模型,应用公司则追求用最强模型提升生产力,两者分化[7][12] - To B市场用户愿意为最强模型支付高溢价,例如一个模型200美元/月,次强的50美元/月,因为智能越高代表生产力越高,能赚的钱越多[11][83] - 姚顺雨指出,在To B市场,强模型与弱模型的分化会越来越明显,因为最强模型(如OpenAI 4.5)可能10个任务做对八九个,而差一点的只做对五六个,后者需要额外监控成本[11][84] 公司发展战略与押注(Bet) - 腾讯(姚顺雨)作为To C基因更强的公司,关注如何通过额外上下文和环境给用户提供更多价值,例如利用微信聊天记录作为模型输入[13][14][15] - 阿里(林俊旸)认为分化是自然发生的,公司没有绝对的基因之分,成功关键在于与客户交流发现真实需求,他举例美国API消耗量中Coding占据绝对主导,而中国尚未达到此水平[8][17][89] - 智谱(唐杰)在2025年初决定全力押注Coding,并将所有精力投入其中[23] - 大公司在To B和Coding方面的优势在于其庞大的内部场景可提供多样化数据,例如10万人的公司可比创业公司或数据标注商捕捉更真实、多样的场景数据[16][88] 自主学习(Self-Learning)范式 - 自主学习是硅谷热议的下一个范式,但定义多样,可体现在个性化聊天、熟悉公司代码环境、探索科学问题等不同场景[25][26][98] - 姚顺雨认为自主学习已是进行时,例如Cursor每几小时用最新用户数据学习,Claude项目95%的代码已由Claude自己编写,但这更像是渐变而非突变[27][28][99][101] - 实现自主学习的挑战在于想象力,需要明确何种任务和效果能证明其实现,例如赚钱的交易系统或解决未解科学问题[30][101] - 林俊旸提出,除了自主学习,AI的主动性(即环境能prompt其自主思考做事)可能是2026年关键押注,但需警惕由此引发的安全问题[32][103][104] Agent(智能体)发展前景 - 行业对2026年Agent的预期是能自动化人类一周到两周的工作量,成为创造经济价值的关键一年[42][112] - To B领域的Agent发展曲线仍在上升,未显放缓趋势,模型智能与收入增长目标一致,如Anthropic的案例[42][112] - 发展Agent的瓶颈除了模型本身,还包括环境部署和教育普及;即使模型不变,广泛部署也可能带来10倍或100倍收益,对GDP产生5%-10%的影响,但目前影响远不到1%[44][114][115] - 林俊旸认为,真正的Agent需能与真实物理世界交互(如指挥机器人做实验),而不仅限于电脑环境,这可能需要三到五年与具身智能结合[47] - 通用Agent的机会在于解决长尾问题,但若创业者不具备比模型公司更强的“套壳”能力,该问题可能仍由模型公司自身解决[48][49] 中国AI公司的未来机遇与挑战 - 姚顺雨对三年到五年后全球最领先的AI公司来自中国团队持乐观态度,概率较高,关键条件包括突破算力瓶颈(如光刻机)、发展成熟的To B市场或国际商业环境竞争,以及培养更多具有冒险精神的人才进行前沿范式探索[56][57] - 林俊旸对此概率的估计约为20%,认为挑战包括美国算力投入比中国大1-2个数量级且更多用于下一代研究,而中国算力大量用于交付;机遇在于“穷则生变”,可能在软硬结合(如定制芯片与模型协同设计)中创新[62][67] - 唐杰指出中国AI Lab与美国有差距,但90后、00后一代更愿冒险,改善营商环境让聪明人有时间创新,以及从业者坚持是成功关键[71][73] - 杨强类比互联网发展,看好中国在To C市场百花齐放,并认为To B解决方案也会很快跟上[69][70]
唐杰、杨植麟、林俊旸、姚顺雨罕见同台,「基模四杰」开聊中国AGI
36氪· 2026-01-10 14:14
文章核心观点 - 2025年中国AI行业形成的最大共识是基础模型的能力高低决定未来多场竞争的输赢 闭门会四位主角的共同主题是稳固基模第一梯队地位同时让模型驱动业务发展 [5] - 中国大模型靠快节奏迭代和持续开源在国际上获得声量 但中美大模型差距可能并未缩小 因为美国有大量闭源模型未开源 [6] - 随着AGI探索范式变化 制定衡量模型智力的新标准非常重要 嘉宾共同看好的下一阶段方向是AI的自主学习 [6][7] AGI下一代路线与范式探索 - 后DeepSeek时代 对话范式探索基本结束 智谱押注了集推理、Agentic、Coding能力于一体的新范式 其GLM-4.5是成功成果 [6] - 对Scaling Law信徒而言 下一阶段Scaling仍是重点 但新变化是在架构、优化器、数据层面做技术改进 目的是让模型拥有更好的“Taste”以避免趋同 [6] - 驱动不同AI探索范式的核心是目标选择 追求智力顶峰还是注重落地 这决定训练策略是垂直整合还是分化训练 [7] - 未来To C和To B的分化会越来越明显 AGI的本质是服务真实的人类场景 [7] - To C场景下垂直整合成立 模型和产品必须强耦合迭代才能做出好体验 To B场景则相反 模型公司专注做强模型 应用公司追求用最强模型提升生产力 两者分化 [8][11][13] - 这种分化是自然发生的 公司没有基因之分 服务真实需求是关键 例如美国API消耗量中Coding占据绝对主导 [8][17] 模型智力衡量新标准 - 定义的AI智力水平是Token效率和长文本的结合 即在不同Context长度下模型优势有多大 [7] - 定义了衡量智力水平的新范式“智能效率” 用于衡量模型投入和智力收益的ROI 因为当前疯狂的RL和Scaling收益已大不如前 [7] - 在To B市场 强模型和弱模型的分化会越来越明显 用户愿意为最强模型支付溢价 例如一个模型200美元/月 次强的50美元/月 因为强模型能显著提升工作效率 [10][11] 大模型公司的战略选择与瓶颈 - 腾讯作为To C基因更强的公司 思考如何让大模型给用户提供更多价值 认为To C的瓶颈常在于额外的上下文和环境 而非更强的模型 [13][14][15] - 在中国做To B很难 很多做Coding Agent的公司选择出海 大公司的优势在于自身拥有多样化应用场景和生产力需求 能利用真实世界数据训练模型 而创业公司依赖数据厂商 多样性受限 [16] - 智谱经过思考 认为Chat的竞争自DeepSeek出现后已结束 因此决定将所有精力押注在Coding上 [23] - 预训练已过去三年 RL成为共识 硅谷正在讨论下一个新范式“自主学习” [24] 对“自主学习”范式的展望 - 自主学习是非常热门的词 但每个人定义不同 它并非方法论 而是数据或任务 其挑战因场景而异 [25][26] - 自主学习已在发生 例如ChatGPT利用用户数据弥合聊天风格 Claude项目95%的代码由Claude自己编写 [27] - 自主学习更像是渐变而非突变 2025年已看到信号 例如Cursor每几小时用最新用户数据学习 [28][30] - 实现自主学习的最大问题之一是想象力 即需要先构想出它实现后的具体形态和效果 [30] - OpenAI仍是全球最有可能诞生新范式的地方 尽管其创新基因可能因商业化被削弱 [30] - 另一个值得思考的方向是“测试时扩展” 即通过吐出更多Token变得更强 以及AI实现更强的主动性 由环境触发而非人类提示 但这引发了安全问题 [32] - 自动化AI研究员甚至不需要自主学习 未来AI训练AI可能很快实现 更大的技术挑战在于如何评估个性化等指标 [33][34] 对Agent发展的预期 - 2026年对Agent的一大预期是它能自动化人类一周到两周的工作量 而不再仅是工具 这可能是Agent创造经济价值的关键一年 [44] - 在To B方面 Agent正处在不断上升的曲线上 目前没有变慢趋势 模型智能越高 解决任务越多 带来的收入越大 [44] - 当前除了模型本身 还有两个瓶颈 一是环境和部署问题 现有模型若广泛部署可能带来10倍或100倍收益 对GDP产生5%-10%的影响 但目前影响远不到1% 二是教育问题 会用AI工具的人与不会用的人差距在拉大 [46][47] - Agent未来需要与真实物理世界交互 而不仅限于电脑环境 这需要三到五年时间与具身智能结合 [54][56] - 通用Agent的魅力在于解决长尾问题 头部问题易解 但解决用户寻遍各处都找不到的问题才是AI最大魅力 [57] - Agent发展有四个阶段 目前处于最初级阶段 目标和规划均由人定义 未来应由大模型内生定义 [60][61] - Agent未来的走势取决于其解决的事情是否有价值、成本有多大以及开发应用的速度 [63] 中国AI公司的机遇与挑战 - 中国团队在三年和五年后成为全球最领先AI公司的概率较高 因为一旦技术被证明可行 中国能快速复现并在局部做得更好 如制造业和电动车先例 [65] - 关键条件包括 能否突破光刻机等算力瓶颈 中国有电力优势和基础设施优势 但产能和软件生态是问题 以及能否发展出更成熟或更好的To B市场或参与国际商业竞争 因为美国支付意愿更强 文化更成熟 [65][66][67] - 主观上需要更多有创业或冒险精神的人去做前沿探索和范式突破 中国在商业、产业设计和工程上已比美国做得更好 但引领新范式是唯一待解决的问题 [68][69][70][71] - 中国研究文化更倾向于做安全、已被证明可行的事情 对刷榜或数字看得更重 需要时间积累文化底蕴并走出榜单束缚 坚持做正确且体验好的事情 [71][72][73] - 中美算力差距有1-2个数量级 美国将大量算力投入下一代研究 中国则捉襟见肘 大部分算力用于交付 这是历史遗留问题 [75] - 从软硬结合角度 中国有机会做出下一代模型和芯片 但需要更紧密的跨领域协作 [76] - 中国年轻一代冒险精神在变强 营商环境在改善 这有利于创新 但历史积淀原因导致中国公司成为最领先者的概率约为20% [77][78][80] - 回顾互联网发展 中国很快赶上并诞生了世界第一的应用 看好AI技术在To C领域百花齐放 To B领域也会很快跟上 [81][82] - 中国需要敢于冒险的聪明人、更好的创新环境以及从业者自身的坚持 [86][87]
唐杰、杨植麟、姚顺雨、林俊旸罕见同台分享,这3个小时的信息密度实在太高了。
数字生命卡兹克· 2026-01-10 12:37
文章核心观点 - 多位中国AI行业领军人物在AGI-NEXT会议上探讨了行业发展趋势,核心观点认为Chat聊天范式竞争已结束,下一阶段竞争焦点转向Action(执行任务)和Agent(智能体)[6] - 行业将出现明显分化,包括To C与To B市场的分化,以及垂直整合与模型应用分层路径的分化[12] - 对下一代技术范式(如自主学习)持乐观态度,并认为2025-2026年可能出现关键信号[21][23][28] - 智能体(Agent)在2026年有望创造显著经济价值,能够处理更长时间跨度的任务[32] - 中国AI公司在未来3-5年有成为全球领先者的机会,但需克服算力、市场环境和文化等挑战[39][40][41][45][46] 行业分化趋势 - **To C与To B市场分化明显**:To C产品(如ChatGPT)对大部分用户而言是搜索引擎的加强版,用户感受变化不大;而To B市场对智能水平高度敏感,智能越高代表生产力越高,用户愿意为最强模型支付溢价(例如200美元/月 vs 50或20美元/月的次优模型)[13][14] - **To B市场呈现“赢家通吃”趋势**:最强的模型与稍弱模型之间的分化会越来越明显,因为用户无法预知次优模型在哪些任务上会出错,需要额外精力监控[15] - **技术路径出现分化**:垂直整合路线(模型与产品强耦合)在To C领域(如ChatGPT、豆包)依然成立;但在To B领域,趋势似乎是模型层与应用层分离,强大的模型被不同的应用用于各种生产力环节[15] 下一代技术范式展望 - **自主学习是热门方向但定义多样**:硅谷已形成共识,但具体指代的任务场景各异,例如聊天个性化、代码环境适应、探索新科学领域等[21] - **自主学习已在发生**:例如ChatGPT利用用户数据优化聊天风格,Claude Code项目95%的代码由Claude自身编写以帮助其变得更好[22] - **范式突破可能发生在2025-2026年**:例如Cursor等公司已开始每几小时用最新用户数据训练模型,被视为早期信号[23] - **学术界与工业界将协同创新**:随着学校算力资源增加(尽管与工业界仍有10倍差距),学术界具备创新基因,将研究工业界未及解决的问题,如智能上界、资源分配、幻觉与资源的平衡(类似经济学中的风险收益平衡)等[18][19][28] - **效率瓶颈驱动创新**:大模型投入巨大但效率不高,继续Scaling的收益递减。未来需要定义“智能效率”,即用更少投入获得同等智能增量,这将成为范式创新的驱动力[29][30] 智能体(Agent)发展战略 - **To B Agent价值明确且处于上升曲线**:其价值与模型智能水平直接正相关,模型越智能,解决任务越多,带来的收益越大[32][33] - **当前瓶颈在于部署与教育**:即使模型停止进步,将现有模型更好部署到各公司也能带来10倍或100倍的收益,对GDP产生5%-10%的影响(目前影响不足1%)。同时,教育用户使用工具至关重要[34] - **Agent进化方向是更长的任务时长与主动性**:期待2026年Agent能处理人类1-2周工作量的任务流。更高级的Agent应具备自主进化和主动思考能力,但这引发了安全问题[25][32][35] - **通用Agent的机会存在于长尾需求**:解决广泛、分散的长尾问题是AI的魅力所在,也是挑战。模型公司凭借算力和数据可能快速解决部分问题,但套壳应用若做得更好也有机会[36][37] - **Agent发展有四个阶段**:从目标与规划皆由人定义,最终发展到目标与规划皆由大模型内生定义[37] 中国AI公司的机遇与挑战 - **成为全球领先者的概率与条件**:有嘉宾认为概率很高,也有嘉宾给出20%的乐观估计[39][47]。关键条件包括:突破算力瓶颈(如光刻机)、发展更成熟的To B市场或参与国际竞争、以及培养更多具有冒险精神和前沿探索意愿的人才[40][41][46] - **中美研究文化差异**:中国团队更倾向于做已被证明可行的、确定性高的事情(如预训练),对刷榜和数字指标看得较重。需要积累文化底蕴,并敢于坚持自己认为正确的方向,而非仅受榜单束缚[43][44] - **算力分配制约创新**:美国公司将大量计算资源投入下一代研究,而中国公司的大量算力被交付任务占据,用于前沿探索的资源相对捉襟见肘[45] - **软硬结合与冒险精神**:存在通过模型与芯片协同设计实现创新的机会。年轻一代(90后、00后)冒险精神增强,营商环境的改善有助于创新[46][49] - **历史借鉴与未来信心**:回顾互联网发展,中国在应用层面实现了赶超。在AI领域,To C应用可能百花齐放,To B解决方案也将跟进,关键在于创造让聪明人敢于冒险的环境并坚持到底[48][49][50]