Workflow
李世石时刻
icon
搜索文档
与真格戴雨森聊 Agent:各行业都会遭遇 “李世石时刻”,Attention is not all you need
晚点LatePost· 2025-03-28 12:12
AI技术突破与行业影响 - OpenAI的o1系列模型通过强化学习大幅提升模型推理能力,o3在GPQA测试中达到70多分,超越人类博士生水平[5][6] - DeepSeek R1开源模型以极低成本实现推理能力突破,引发全民讨论,其技术报告揭示强化学习路径的有效性[5][6] - o4-mini推理时间达数小时级别,模型能力提升呈现指数增长趋势[6] 开源生态与竞争格局 - DeepSeek开源策略促使腾讯元宝、百度文心等大厂接入其模型,微信搜索接入后DAU实现两位数增长[27][28] - 开源模型降低行业门槛,Monica等创业公司基于开源模型开发Agent产品Manus[3][20] - 闭源与开源路线并存,Kimi选择闭源但专注技术前沿,DeepSeek通过开源中立性获得生态合作优势[29][30] Agent产品形态演进 - 推理能力突破解锁Agent产品形态,包括只读型(如Deep Research)和读写型(如Operator)[9][17] - Agent核心能力包括推理、编程和工具使用,o3在SWE-Bench测试中达到70-80分,可处理70%-80%人类编程任务[10][12] - Manus展示自主工具使用能力,如调用邮件客户端与政府机构交互[18] 算力需求与芯片格局 - Agent普及将推动推理算力需求增长100-1000倍,当前ChatGPT Pro月费200美元仍亏损[33] - 英伟达GPU仍占90%以上市场份额,但国产芯片(如华为昇腾)开始针对特定模型优化[33][34] - 专用芯片(ASIC)发展取决于模型架构稳定性,若架构固化则ASIC效率优势将显现[35] 行业变革与社会影响 - AI能力超越人类的"李世石时刻"密集出现,如编程能力已超越99%人类[37] - Agent推动"Attention is not all you need"范式,实现资金向生产力的Scaling Law[13] - 技术普惠阶段尚未到来,当前仍处于精英为精英开发工具的阶段[38] 公司战略与技术路线 - DeepSeek专注模型基础能力,未跟风多模态或C端产品,团队以本土人才为主[7] - Kimi通过长文本处理与搜索结合实现差异化,近期砍掉视频生成等非核心业务[30][31] - 多模态技术当前对智能提升有限,语言仍是最高效的智能载体[22][39] 成本与商业化进展 - GPT-4 API成本较发布下降超90%,2025年预计再降90%[28] - Devin定价6-8美元/小时,低于美国加州16美元最低时薪,企业服务付费习惯促进商业化[25] - DeepSeek通过技术突破获得自然流量,数千万DAU零广告投入[7] 技术发展前沿 - 下一阶段突破需解决记忆机制(Memory)和持续学习(Online Learning)问题[18][19] - 科学发现成为新焦点,AI需具备假设生成与实验验证能力[26] - 语言模型可能超越人类语言形式,进化出更高效沟通方式[39]