AGI(通用人工智能)
搜索文档
被OpenAI开除的天才少年:联手谷歌,围剿英伟达
36氪· 2025-12-09 04:17
文章核心观点 - 谷歌正通过扶持云服务商Fluidstack分发其自研TPU芯片,以挑战英伟达在AI算力市场的垄断地位,此举涉及一笔潜在的7亿美元巨额融资,并由前OpenAI研究员阿申布伦纳的基金领投,标志着资本、产业战略与个人抱负在AI算力竞赛中的复杂交织 [1] 公司与融资动态 - Fluidstack正在洽谈一轮超过7亿美元的新融资,潜在领投方为前OpenAI研究员利奥波德·阿申布伦纳创立仅一年的基金「Situational Awareness」 [1] - 本轮融资旨在帮助Fluidstack在专用服务器租赁市场中竞争,融资规模表明其目标估值达数十亿美元,老牌投行摩根士丹利正在协助此次融资 [4] - Fluidstack此前并未进行大规模股权融资,主要依靠激进的债务融资,今年早些时候获得了超过100亿美元的信贷额度,抵押品为包括英伟达芯片在内的硬件资产 [6][8] 业务战略与客户 - Fluidstack过去主要出租英伟达GPU,但战略重心已转向成为谷歌向客户分发自家TPU的重要渠道,此前TPU几乎只能通过谷歌云获取 [4] - 公司已与谷歌达成合作,谷歌为其正在开发的三个数据中心的租赁协议提供担保,作为交换,Fluidstack承诺至少在一个纽约数据中心托管谷歌TPU [4] - Fluidstack的客户包括顶级AI开发商Mistral AI和Anthropic,Anthropic计划使用多达100万个TPU,并与Fluidstack联手在美国本土数据中心投入500亿美元 [4][5] - 据The Information报道,Fluidstack预计本年度销售额将超过4亿美元,而去年的销售额仅为6500多万美元,增长迅速 [6] 行业竞争格局 - 行业领头羊CoreWeave预计2025年收入将超过50亿美元,估值达400亿美元,主要出租英伟达GPU给微软、OpenAI、Meta和英伟达等公司 [7] - 其他私营AI云服务商竞争激烈,Crusoe和Lambda在过去两个月内合计融资29亿美元以扩充服务器租赁业务,Crusoe预计2025年收入5.4亿美元估值100亿美元,Lambda预计收入超过5亿美元估值超过25亿美元 [7][8] - 整个赛道面临市场审视,外界对通过巨额举债囤积芯片的商业模式(如甲骨文)的盈利能力存在质疑 [8] 关键人物与资本 - 潜在领投人利奥波德·阿申布伦纳是前OpenAI研究员,在2024年因“不当泄露信息”被解雇,他声称泄露的文件暴露了OpenAI计划在2027或2028年实现AGI的野心 [9][11] - 阿申布伦纳离开OpenAI后创立了投资基金「Situational Awareness」,该基金获得了GitHub前CEO Nat Friedman、Stripe创始人科里森兄弟等支持,目前管理规模已超过15亿美元,并已投资AI云服务商CoreWeave和AI开发巨头Anthropic [1][11][13]
梁文锋,Nature全球年度十大科学人物!
量子位· 2025-12-09 01:21
梁文锋与DeepSeek入选《自然》年度人物 - 权威科学期刊《自然》公布2025年度十大科学人物榜单,DeepSeek创始人梁文锋因模型对AI领域的重要贡献与变革性影响成功当选[1][3] - 《自然》给予梁文锋的形容词为“Tech disruptor”(科技颠覆者),并提及他金融从业者的身份[4] - 梁文锋为人低调,拒绝了《自然》的采访请求,其模型开放程度与其个人神秘程度形成对比[5] DeepSeek的技术与行业影响 - DeepSeek模型凭借出色的“性价比”策略,将模型成本降至行业难以置信的水平,并提升了国产大模型在全球社区的技术声量[8][9] - DeepSeek的出现证明,大模型不一定要堆数据、堆参数、堆服务器,也能达到一线水准的能力[10] - DeepSeek近期发布并开源了V3.2系列模型,在Agent评测中达到了当前开源模型的最高水平[11][12] 梁文锋的个人背景与职业历程 - 梁文锋1985年出生于广东湛江,17岁以“高考状元”成绩考入浙江大学电子信息工程专业,后攻读同专业研究生,师从项志宇教授研究机器视觉[14][16] - 2008年毕业后投身量化投资创业,其团队在2010年沪深300股指期货推出后乘势发展,自营资金很快超过5亿元[17] - 2015年,梁文锋与校友共同创立幻方量化,一年后推出首个AI模型,使用GPU进行深度学习生成交易仓位[18] - 2021年,幻方量化成为国内首家突破千亿规模的量化私募,被称为国内量化私募“四大天王”之一[19] - 2023年5月,瞄准通用人工智能,幻方量化成立独立新组织“深度求索”,即DeepSeek[21] 另一位中国入选者杜梦然 - 中国科学院深海科学与工程研究所研究员杜梦然同样入选《自然》2025年度十大科学人物,其形容词为“Deep diver”(深潜者)[6][22][23] - 2024年,杜梦然团队在日本东北部的千岛—堪察加海沟底部,使用载人潜水器“奋斗者号”发现了地球上已知最深的基于化学合成的生命群落,挑战了现有深海极端生命和碳循环模型[25] - 杜梦然1987年出生于安徽亳州,拥有中国海洋大学学士学位、硕士学位,后赴美国Texas A & M University攻读博士学位[28][29][31] - 她曾跟随载人潜水器“蛟龙”号、“深海勇士”号、“奋斗者”号下潜20余次,研究成果发表在《Science》等顶级期刊[33] 《自然》年度其他入选者概览 - Susan Monarez:美国疾病控制与预防中心前主任,因坚守科学底线被解职,引发对科学独立性与公共卫生政策的反思[35] - Achal Agrawal:印度自由数据科学家,通过揭露学术不端推动印度国家院校排名体系将论文撤稿纳入考核指标[36] - Tony Tyson:薇拉·鲁宾天文台的构想者与推动者,该望远镜将以前所未有的规模透视暗物质与宇宙演化[37] - Precious Matsoso:成功引导世界卫生组织近200个成员国就首份《全球大流行病条约》草案达成一致[38] - Sarah Tabrizi:亨廷顿病研究领军人物,其团队在基因疗法临床试验中取得了延缓疾病进程的关键证据[39] - Luciano Moreira:在巴西建造全球最大“蚊子工厂”,通过释放携带沃尔巴克氏体的蚊子有效降低登革热发病率[40] - Yifat Merbl:从蛋白酶体中发现一个由数千种潜在抗菌肽构成的全新免疫防御系统,颠覆了免疫机制认知[41] - KJ Muldoon:身患超罕见病,在六个月大时接受了首例高度个性化的CRISPR基因编辑疗法,标志着基因医学迈向“一人一药”的精准时代[42]
中国大模型打响全球广告!国联民生证券孔蓉:看好多模态、AI硬件与智能驾驶三大机遇
新浪财经· 2025-12-06 07:53
中国AI大模型突破的全球影响 - 以DeepSeek、Kimi、通义千问为代表的中国大模型取得突破,正深刻影响全球资本对中国科技资产的配置逻辑[1][7] - DeepSeek为整个中国资产做了一次强有力的“全球广告”,立竿见影地带动了国内互联网大厂的股价表现和市场预期[1][7] - 中国大模型能力的突破改变了全球投资者对中国科技公司的整体看法和关注度,从全球视角评估中国机会将在估值层面处于有利位置[1][7] 投资逻辑的双重维度:估值与基本面 - 看待中国科技板块投资机会需从“估值提升”和“基本面改善”两个维度综合考量[2][8] - 海外科技巨头通过AI已实现可观且持续的收入增长,若中国企业能证明AI技术带来持续稳健的收入增长,将实现基本面根本性改善[2][8] - 当“估值提升”与“基本面改善”形成共振时,对市场信心的提振将非常强劲[2][8] AI应用层投资机会:多模态内容生成 - AI领域一个显著趋势是多模态内容生成能力的飞跃,在图片、视频等领域带来肉眼可见的变化,预计明年能力还将进一步提升[2][8] - 多模态能力正推动影视、内容创作等传统行业变革,海外如Sora、Vthree,国内如可灵等产品正在推动内容产业进入新时代[2][8] - 多模态内容生成领域蕴含的投资机会值得密切关注[2][8] AI应用层投资机会:与硬件融合及端侧机遇 - 多模态能力与硬件载体深度融合将催生全新机遇,例如AI眼镜这类新型交互终端[3][9] - 随着多模态技术进步,端侧硬件(如AI眼镜)的体验将迎来质的飞跃,其中投资机会值得深入挖掘[3][9] - 多模态能力的价值绝不局限于内容产业本身[3][9] AI应用层投资机会:智能驾驶与机器人 - 从产业落地看,智能驾驶是已走在商业化前列的重大AI应用场景,国内外公司的智驾方案能力都在快速进化[3][9] - 例如,海外FSD系统已能实现超长距离的无人接管,说明AI在复杂场景下的落地应用正在加速变为现实[3][9] - 机器人领域承载着市场对未来的更高期待,是展望明年时非常看好的方向[4][10] 未来立体化的AI投资与应用图景 - 未来机会立体且丰富,包括持续拓展的代码生成等场景[4][10] - 机会还包括随多模态能力兴起的内容创作领域,以及与硬件结合的端侧机会[4][10] - 在更宏大场景中,智能驾驶正在逐步落地,机器人则是紧随其后的重要方向[4][10]
拉响紧急警报后,奥特曼再遭暗讽:孤注一掷,或将死无全尸
36氪· 2025-12-04 10:57
行业趋势与风险 - 人工智能行业竞赛持续升温且可能过热,科技巨头与初创公司投入巨大,例如Meta、Alphabet和微软今年在AI基础设施上投入了数百亿美元,且今年已有49家美国AI初创公司融资至少1亿美元 [7][8] - 行业共识认为AI发展将产生巨大分化,既会出现超级赢家,也会出现超级输家,未来可能出现占据头条的史诗级失败案例 [3][10][12] - 行业存在高风险,主要源于支撑AI运行的数据中心建设成本极高,且若行业参与者在时机判断上出现轻微偏差,后果可能非常严重 [13] 就业与社会影响 - 随着AI达到“博士级”智能,预计未来五年内多达50%的初级白领岗位将面临被永久取代的风险,可能导致失业率飙升至10%-20% [1][4][6] - 应对AI的就业冲击需要企业、政府和社会三层模型协同,再培训项目势在必行,且政府必须在某些节点主动介入 [4][6] - AI的长期发展可能推动社会价值观转型,未来社会可能不再以“工作”和“经济生存”为核心目标 [6] 公司战略:Anthropic - Anthropic采取稳健策略,专注于与企业客户合作,在算力投入上保持保守,并批评某些同行采取孤注一掷的高风险策略 [15][16] - 公司通过差异化竞争立足,主攻企业用户市场,将模型优化聚焦于商业需求,如代码能力、高强度智力活动和科研能力,而非消费者市场的用户参与感 [18][19] - 公司最新发布的Claude Opus 4.5模型在多项企业级能力测试中表现强劲,例如在Agentic coding SWE-bench Verified测试中达到80.9%,并计划向金融、生物医药、零售和能源领域扩张 [19][20] 技术发展与AGI路径 - 通往通用人工智能的道路很可能遵循Scaling Law,即通过持续扩大模型规模和数据来线性提升能力,而非出现突变的“魔法时刻” [22][23][24] - 模型能力持续进步,例如当前模型已能编写大部分代码供工程师修改,并开始在高校奥数竞赛中胜出甚至进行“前所未有的新数学”研究 [25] - 预计每一代新模型都将变得更聪明,其经济价值也将持续增长 [25] 行业竞争与市场动态 - 尽管谷歌、OpenAI等巨头拥有丰富资源并激烈竞争AI领导地位,但其疯狂烧钱的模式存在不确定性,即经济价值的增长可能无法跟上资本消耗的速度 [20][21] - 超大规模云服务商是维持AI运转的关键幕后金主,这些企业普遍反映算力供不应求 [12] - Anthropic正以3000-3500亿美元的估值进行新一轮融资谈判,并最早可能于2026年进行IPO,有望成为史上规模最大的IPO之一 [25][27]
企业级应用:AI加速在企业端应用落地:计算机行业2026年度投资策略
华创证券· 2025-12-04 03:25
核心观点 - 2026年AI发展将加速由“聊天”转向“行动”,推动AGI逐步走向现实,重点关注企业级应用、算力基建及以AI为核心的前沿科技三大产业方向[10][20] - 在企业级服务领域,大模型将“吞噬”缺乏数据和场景的伪应用,而与行业深度结合、能持续反哺数据的玩家将借助AI扩大市场空间,呈现“吞噬”与“繁荣”共进的局面[3][13][79] - 算力需求持续爆发,全球AI基础设施支出预计在2030年前达到3-4万亿美元,国产AI芯片将快速崛起并侵蚀NVIDIA等海外厂商份额[4] - 在量子计算、商业航天及鸿蒙产业等前沿科技领域,中国正成为全球主要玩家,开启新一轮产业革命[5][6] 竞逐未来,中美引领AI蓬勃发展 - 2025年全球AI大模型在推理、多模态和智能体方面取得爆炸式进步,2026年将加速推动AGI走向现实,应用由“聊天”推向“行动”[20] - 尽管顶级模型能力不断提升,但主流模型仍处于Emerging AGI阶段,缺乏对复杂物理现象的深层推理能力,2026年多模态、世界模型及自主AI Agent将成为核心发展方向[21] - 模型性能快速收敛,顶级模型与排名第十模型的Elo技能分差从一年前的11.9%降至5.4%,头部两名模型差距缩小至0.7%,未来竞争将更侧重成本、速度和领域专业化[24] - 全球科技领袖对AGI实现时间持乐观态度,预测中值持续缩短,Metaculus预测2033年左右实现“高水平机器智能”的概率为50%,部分产业领袖如Elon Musk预计2026年可实现[23][25] - AI Agent爆发式发展,从“回答”转向“执行”,能自主规划、调用工具、进行多步骤操作,如微软Analyst Copilot和Kimi的OK Computer可处理超100万行数据并生成交互式仪表盘[27] - 大模型Token消耗量呈现爆发式增长,2025H1中国大模型市场日均调用量超过10万亿tokens,较2024年下半年增长约363%,标志大模型进入规模化落地阶段[31] 千行百业,大模型赋能企业级服务 - AI+广告市场快速增长,预计从2025年的355.4亿美元增至2029年的1065.4亿美元,CAGR达31.6%,AI工具可优化广告创意、投放及方案,如Persado生成高点击率文案,AppLovin的AXON引擎精准匹配广告主与用户[80][84][85] - AI+编程工具市场处于高增长通道,规模预计从2024年约55亿美元增至2034年约473亿美元,CAGR达24%,AI将重构开发人力结构,提升高技能岗位占比,优化研发费用[86][87][93] - AI+决策市场支出规模2022年为532亿元,预计2027年增至2104亿元,CAGR约31.7%,AI通过数据驱动洞察、预测模拟及自动化,提升企业决策水平和效率[95][96] - AI+ERP系统与AI深度融合,从流程驱动升级为数据决策驱动,Gartner预测到2027年60%客户将选择具平台和业务流程编排能力的ERP系统,如SAP提供130余种AI场景,金蝶AI实现合同审查效率提升100%[102][106] - AI+办公软件市场持续扩容,2025年全球规模达516.3亿美元,预计2030年突破800亿美元,中国市场规模2025年达480亿元,预计2030年突破900亿元,CAGR为13.5%,微软365 Copilot已覆盖90%财富500强企业,金山办公WPS 365提供AI协同办公体验[108][109] 算力大基建 - 全球AI算力需求爆发,高盛测算2030年前AI基础设施支出将达到3-4万亿美元,NVIDIA仍扮演关键角色,但Google Gemini 3 Pro等将打破GPU独大格局,形成“一超多强”[4] - 中国AI算力市场快速成长,沙利文数据指出到2029年将增长至13367.92亿元,2025-2029年CAGR达53.7%,GPU份额从2024年69.9%提升至2029年77.3%[4] - 国产AI芯片崛起,华为、寒武纪、百度、海光信息等龙头在产能瓶颈突破和性能提升下,将侵蚀NVIDIA等海外厂商份额,在供给端占据一席之地[4] 前沿科技 - 量子计算进入加速发展期,2025年全球市场规模达61亿美元,中国以32%份额跃居全球第二,如“天衍-287”超导量子计算机在特定问题上较最快超算快4.5亿倍[5] - 商业航天作为新质生产力代表,连续两年写入政府工作报告,万亿市场蓄势待发,我国遥感、导航、算力卫星及卫星互联网协同发展,GW星座、千帆星座等万星星座建设提速[5] - 鸿蒙产业在政企与消费端全面落地,从终端系统升级为数字化转型核心支撑,开源鸿蒙应用于金融、电力等领域,HarmonyOS 5终端设备突破2700万台,为HarmonyOS 6奠定用户基础[6] 投资建议 - 企业级应用覆盖AI+广告、编程、决策、ERP、办公、客服等细分领域,推荐标的包括AppLovin、Microsoft、Palantir、SAP、金山办公等国内外龙头企业[14][15] - 垂直类场景涵盖工业、军用、医疗、财税、法律、教育、招聘、电力、驾驶、电商、安全等方向,推荐标的包括Siemens、Palantir、Tesla、Amazon、CrowdStrike等[16][17]
兵临OpenAI,谷歌集结2500人「复仇」,Gemini 3夺回AI王座
36氪· 2025-12-03 08:04
Gemini 3发布的意义与规模 - 谷歌通过Gemini 3的发布,试图夺回在生成式AI时代的主导地位,这是一次宣告与全球用户共建下一代智能系统的集体行动[1] - 此次发布是谷歌历史上参与人数最多的技术发布之一,参与规模可媲美NASA登月,凸显了工程协作的巨大力量[9] - 项目参与人员从早期论文的25人扩展到Gemini 3的2500人,体现了公司资源的大规模投入[23] 技术能力与基准测试表现 - 在Humanity‘s Last Exam测试中,Gemini 3 Pro达到37.5%(无工具)和45.8%(使用搜索和代码执行),显著高于Gemini 2.5 Pro的21.6%[21] - 在ARC-AGI-2视觉推理测试中取得31.1%的成绩,远超Gemini 2.5 Pro的4.9%和Claude Sonnet 4.5的13.6%[21] - 数学能力表现突出,AIME 2025测试中达到95.0%(无工具)和100%(使用代码执行)[21] - 在多模态理解方面,MMMU-Pro测试中获得81.0%的成绩,优于竞争对手[21] - 编程能力显著提升,LiveCodeBench Pro的Elo评分达到2,439,高于GPT-5.1的2,243[21] 技术发展策略与路线图 - 公司采用“全栈协作”模式,从芯片、数据中心到模型算法各层都有世界级专家参与,这是公司的核心优势[24] - 模型架构趋向统一,文本、图像、视频等多模态模型的架构正在自然融合,追求更高的效率与表现力[25] - 迭代速度加快,每六个月进行一次大版本迭代,每月或每六周更新一次,开发节奏显著提升[23] - 重点关注指令遵循和国际化两大领域,确保模型能理解用户请求并适用于全球用户[17][18] 产品化与用户共建策略 - 通过Anti-gravity、AI Studio、Gemini App等产品获取第一手用户反馈,实现模型与产品的深度整合[19][20] - 采用“与用户共创”模式,将AGI构建视为与全球用户共同进行的系统工程,而非闭门造车的研究[6][8] - 安全性被作为核心目标,安全团队和技术直接参与模型训练全过程,而非事后检测[8] - 代码能力被特别强调,因为代码是数字世界的底层语言,让更多人拥有“构建的能力”[18] 行业发展与竞争定位 - 公司承认在大语言模型崛起初期并不处于最前线,但通过快速学习和深度调整找到了独特的系统打法[31][32] - 技术进步不靠“挤压分数”,而是通过重新定义基准和边界来推动模型发展[14] - 图像生成被认为是难度极大的方向,需要满足像素级完美和概念连贯的双重要求[26][27] - 真正的进步衡量标准是用户在真实场景中的使用,包括科学家、学生、律师、工程师等各类用户群体[16]
Ilya辟谣Scaling Law终结论
AI前线· 2025-11-30 05:33
AI发展范式转变 - 单纯依靠算力规模扩张的"大力出奇迹"时代可能已经结束,即使资源增加100倍也未必能带来AI能力的质变[2] - AI发展正从"规模扩张时代"重新回到"研究驱动的时代",但这次研究建立在前期积累的超大算力基础之上[16][42][45] - 当前AI进展的瓶颈已从"算力"转向"想法本身",行业内公司数量远多于真正新颖的思路[16][60] 当前AI模型的局限性 - 现有大模型出现明显断层:在基准测试中成绩惊人,但在简单真实任务中经常翻车,智能表现脆弱[16][17] - 模型泛化能力远逊于人类,既体现在需要海量数据、样本效率极低,也体现在教授复杂任务非常困难[16][47] - 强化学习可能让模型变得过于单一目标驱动,过度聚焦评测分数反而削弱了向真实应用场景泛化的能力[16][19] 未来AI发展方向 - 实现通用人工智能可能还需要更多突破,持续学习和样本效率是常被提及的两个方向[5] - 价值函数被认为是重要发展方向,能让AI更高效地学习,预计未来会广泛应用[37][46] - 人类学习机制为AI发展提供重要启示,人类拥有强大的内部价值函数和鲁棒的学习机制[55][56] AI经济影响与部署策略 - 即使没有进一步研究突破,当前技术范式也足以产生巨大的经济和社会影响[5] - 最强大的AI部署关键在于能够把在整个经济体系中各个实例的学习结果合并起来,这种集体知识汇聚可能触发智能爆炸[16][81] - AI部署应该采用渐进式方式,让社会逐步接触和适应,而不是一次性推出完全成熟的超级智能[72][73][85] 行业竞争格局 - 行业内专家共识远多于分歧,普遍认为通用人工智能大概率会在20年内实现,而非需要100多年[5][111] - 当前AI行业公司数量多于真正新颖的思路,竞争格局呈现同质化趋势[60][113] - 随着AI能力提升,不同公司可能会在技术路径和对齐策略上逐渐收敛[115][116] 研究资源分配 - 用于研究的算力需求相对可控,AlexNet仅用2块GPU,Transformer初期实验使用8-64块GPU[61] - 大公司算力被分割到不同模态和产品线,真正用于纯研究的算力差距并不像表面数字那么大[63][66] - 研究时代需要的是思维多样性而非简单算力堆砌,思维多样性比同质化复制更重要[124]
中国智驾打响残酷突围战
华尔街见闻· 2025-11-27 12:17
行业核心观点 - 中国智能驾驶行业正经历激烈洗牌与权力版图重构 行业从百花齐放转向急速萎缩 市场不再相信PPT 唯有掌握百万级量产数据入口的玩家才有未来 [1] - 智能驾驶不再是锦上添花的配置 而是通往AGI(通用人工智能)时代的昂贵门票和船票 其终极目标是成为物理世界的大脑 [1][11][12] - 2025年是行业泡沫破裂的寒冬 也是价值回归的暖春 市场格局加速集中 最终可能仅剩两三家主要玩家 [14] 行业竞争格局与趋势 - 竞争维度已从比拼Demo转向比拼能否跨过“一百万辆”的物理门槛 达不到此量级的玩家将因数据单一而失去价值 [7] - 车企策略转变 不再盲目广撒网 而是整合内部资源或仅与极少数头部玩家深度绑定 [1] - 行业权力结构重塑 拥有“百万级”数据入口的玩家获得产业链绝对定价权 没有中间地带 要么做大成为平台 要么小而美后枯萎 [9][10] - 市场份额正加速向华为、Momenta、地平线等头部玩家集中 技术同质化、缺乏造血能力的腰部供应商正被出清 [14] - 未来格局将分为两类:掌握百万辆销量的自研派车企 以及服务于其余车企、通过联盟汇聚数据的超级Tier 1供应商 [15] 关键成功要素 - **数据规模是核心**:在端到端大模型时代 数据是算法进化的燃料 只有当车队规模达到百万级且日活足够高时 才能覆盖足够多长尾场景 驱动模型产生“智能涌现” [7] - **量产上车能力**:纯高速场景辅助驾驶难以形成有效数据闭环 商业模式存在问题 必须实现城市复杂场景的量产落地 [7] - **战略合作深度**:智驾供应商角色升级 从幕后零部件提供商转变为决定车型生死的战略合伙人 需要获得车企核心爆款车型订单 [8] 主要公司动态 毫末智行(负面案例) - 公司传出停工消息 其员工证实了该情况 [1] - 公司前身为长城汽车智驾系统前瞻部 2019年独立 曾获资本青睐 2021年一年内拿下两轮数亿元融资 [2] - 最新一笔融资为2024年上半年的超亿元B轮融资 但此轮融资已无长城汽车参与 [2] - 技术战略出现重大误判:硬件上押注重性价比的高通Snapdragon Ride芯片 而非行业主流的英伟达Orin 导致转向Transformer架构时适配困难 运行效率低下 [3];2023年7月行业风向转向“端到端大模型”时 公司技术高管仍公开持保留态度 错失技术代际升级时机 [3] - 客户开拓不力:除长城汽车外 对其他客户(如北京现代)的开拓不如人意 搭载其方案的车型屈指可数 [5] - 失去核心客户支持:因“PPT交付”等问题 长城汽车耗尽耐心 转而引入并独家投资了竞争对手元戎启行 [5] 元戎启行(正面案例) - 公司高调宣布拿下第三方辅助驾驶市场40%的份额 [1] - 从供应商焦灼战中胜出 拿下长城汽车核心车型订单 如魏牌蓝山、坦克500等 [7] - 为争取客户展现“狼性” 团队曾凌晨四点蹲守客户争取试驾机会 [8] - 搭载其方案的魏牌高山MPV月销量从年初的300台暴涨至2024年10月的近1万台 [8] - 技术路径上推出VLA(视觉-语言-动作)模型 使车辆具备思维链推理能力 以应对复杂路况 [11] - 推行“特斯拉路径” 利用量产乘用车数据和硬件升级实现L4 宣布使用成本仅20-30万的长城蓝山等量产车型落地Robotaxi 跑通其单位经济模型 [13] - 提出RoadAGI计划 目标是将智驾能力复用到人形机器人、物流机器人等更广阔的物理世界 [12] 卓驭科技(原大疆车载) - 公司获得一汽集团36亿元人民币的注资 拿到“国家队”背书 [1][8] - 交易核心价值在于保持独立运营的承诺 这使其能接入其他品牌数据 具备成为平台的价值 [9] - 一汽看中其性价比和开放性 在价格战惨烈的当下 这种能力是车企的救命稻草 [9] 地平线 - 公司副总裁称“每三台智能汽车中 就有一台搭载了地平线” [7] - 公司试图构建类似PC时代“Wintel”的芯片+算法生态联盟 [7] - 技术强调“直觉系统” 通过“一段式端到端”架构让车辆拥有类人的驾驶直觉 [11] - 与元戎启行类似 坚定选择“特斯拉路径” 利用量产车升级实现L4自动驾驶 [13] 技术演进与商业模式 - **技术范式转变**:行业从“高精地图+规则算法”时代 经“轻地图” 急速转向“端到端大模型”统治的下半场 [1][3] - **端到端大模型的核心价值**:让算法从僵硬执行代码 转变为能像生物一样流畅感知环境、博弈交互 甚至具备逻辑推理能力 [11] - **Robotaxi范式革新**:通过量产车数据和硬件实现L4的模式 打破了辅助驾驶与无人驾驶的界限 使Robotaxi从科研项目转变为消费级服务 粉碎了Waymo式重资产运营的壁垒 [13] - **“沿途下蛋”模式**:跑在路上的百万辆私家车既是出行工具 也是数据采集员 源源不断为高阶模型提供长尾场景数据 [13] - **智驾公司的终极愿景**:通过汽车训练端到端大模型和博弈策略 最终将能力复用到人形机器人等更广阔的物理世界 目标是成为物理世界的大脑 [12]
离开OpenAI后,苏茨克维1.5小时长谈:AGI最快5年实现
36氪· 2025-11-27 05:43
当前AI发展阶段的评估 - AI技术已实现但经济影响尚不显著,投资巨大但日常体验未发生根本改变[3] - 模型在评估测试中表现出色但实际应用效果和经济贡献存在明显滞后[4] - 模型能力存在"锯齿状"落差,常犯循环性低级错误,泛化能力差[5][6] AI模型训练与性能瓶颈 - 单纯堆数据与算力的"规模化"路径已见顶,预训练数据即将耗尽[5][17] - 强化学习训练使模型过于专注和狭隘,缺乏"意识"导致基础任务表现不佳[4] - 训练环境设计变量过多,可能无意中优化评估目标而忽视实际应用需求[6] - 模型像"应试专家",通过海量题目填鸭式训练成为答题高手但难以灵活应用知识[7] 价值函数与AI学习效率 - 价值函数被类比为AI的"情绪系统",可引导AI更高效、鲁棒地学习[5][14] - 价值函数能提供中间步骤反馈,加快学习过程,而非仅依赖最终结果评估[14] - 人类拥有内在价值感知,能快速自我纠正,而模型缺乏此类机制[25] - 情绪作为相对简单的价值函数机制,在进化中硬编码且至今有效服务人类[16] 行业发展阶段与范式转变 - 行业从2020-2025年的"规模化时代"回归到"研究时代",但拥有更强大计算资源[18] - 规模化"吸走了房间里的所有氧气",导致创新想法稀缺,公司数量远超新想法数量[28] - 强化学习正成为新的规模化目标,其计算投入可能已超过预训练[19] - 研究所需计算资源并非绝对最大规模,像Transformer最初仅在8-64个GPU上训练[29] SSI公司战略与差异化 - SSI已筹集30亿美元资金,专注于研究"直通超级智能"路径[5][30] - 公司不急于商业化,专注研究,与其他公司将资源用于推理和产品开发形成对比[30][32] - 采用不同的技术方法,主要区别在于技术路径,认为最终策略会逐渐收敛[52][53] - 计划可能调整,考虑渐进式部署,让AI在全球发挥作用并影响世界[33][34] 泛化能力与样本效率 - 模型泛化能力远差于人类,是当前最根本的问题之一[20][21] - 人类样本效率高可能与进化赋予的视觉、听觉和运动等先验知识有关[21][22] - 人类在语言、数学和编程领域的学习优势表明存在更高效的基础学习机制[23] - 人类学习更具无监督特性,所需数据样本少,过程更灵活和鲁棒[24][25] 超级智能发展路径与影响 - 人类级别AGI预计在5到20年内实现[5][55] - 超级智能可能表现为"超级智能的15岁少年",非常聪明但知识有限,通过部署持续学习[36] - 达到关键点后,广泛部署将引发快速经济增长,不同国家政策将导致增长差异[37][38] - 可能出现多个超级智能体,而非单一系统,形成专业化分工[58][59] AI对齐与安全策略 - 倡导构建"关心有情生命的AI",认为这比对仅关心人类更为稳健[41][45] - 随着AI能力提升,行业处理安全问题的方式将发生变化,公司会变得更加警觉[40][41] - 对齐策略最终会趋同,包括可靠沟通、确保最早超级智能是对齐的等目标[53][57] - 长期均衡可能通过人类与AI融合实现,例如通过改进版Neuralink成为半AI生物[47] 模型多样化与自我博弈 - 当前模型同质化严重,主要因预训练数据相似,强化学习是分化开始[61][62] - 自我博弈可通过计算而非数据创建模型,激励方法多样性[62][63] - 智能体间竞争自然促使差异化思考,是打破"模型同质化"的路径之一[5][63] - 完全复制相同思维收益递减,真正需要的是具有不同想法的智能体[60] 研究方法与理念 - 好研究应兼具简洁、优雅与对大脑机制的正确借鉴[5][64] - 研究需要"自上而下的信念",在实验结果与信念相悖时坚持方向[66] - AI应该具有特定"美学",思考人类本质但必须以正确方式理解[64] - 分布式表示、从经验中学习等概念受到大脑运作方式的启发[65]
Ilya重磅发声:Scaling时代终结,自曝不再感受AGI
36氪· 2025-11-26 06:54
当前AI技术路线评估 - 当前模型持续改进但无法实现AGI,现有技术路线后劲不足[3] - 真正可行的AGI系统架构至今尚未掌握构建方法[3] - 模型泛化能力远逊于人类,即使使用所有编程竞赛题目训练仍无法形成真正的解题直觉[3] - 评测结果与现实应用出现明显脱节,评估分数光鲜但实际性能滞后[5][8] - RL训练最终演变为对评估指标的过度优化,真正的奖励机制黑客是设计基准测试的科研人员[3][6] Scaling Law与预训练瓶颈 - 预训练时代已终结,行业正从Scaling时代走向研究时代[1][13][14] - 预训练最大突破是Scaling配方好用,但数据有限总有用光之时[12] - Scaling把行业创新空气吸干,导致公司数量远远多于点子数量[15] - 未来创新将回归小而美实验,类似AlexNet用两张GPU、Transformer用8-64块GPU的模式[16][18] - 已见证从预训练Scaling切换到RL Scaling,但RL非常烧算力且效率低[15] 模型泛化能力与学习机制 - 人类学习能力来自自进化硬编码的价值函数,情绪是决策系统一部分而非噪音[10] - 当前AI的价值函数训练方式脆弱粗糙,还不是内置的[11] - 预训练优势在于数据量大且无需刻意挑选,具有天然高度真实性[8] - RL训练让模型目标变得单一狭隘,削弱全局感知能力[5] - 模型在基础任务上表现不佳,如在修复bug时会反复犯同样错误[5] AGI/ASI发展路径与影响 - ASI可能在5-20年内降临,实现人类级别学习能力后变得超越人类[3][51] - 超级智能不是完成形态心智,而是能够学会做每一项工作的心智[29][30] - 部署将包含通过试错学习时期,是过程而非直接投放最终成品[29] - 一旦实现这种学习算法,可能会迎来一波快速的经济增长[32] - AGI与AI的本质区别在于力量,当力量很大时会发生难以想象的事情[38][40] 行业趋势与安全考量 - 随着AI变得更强大,政府和公众会产生做点什么的愿望,公司将更加充满危机感[43][44] - 竞争激烈的公司开始在AI安全方面合作,OpenAI和Anthropic已迈出第一步[44] - 构建稳健对齐、专门关爱有感知生命的AI比仅关爱人类生命的AI更容易[48][49] - 渐进主义将是任何AGI计划与生俱来的组成部分,逐步发布可分散冲击力[19]