智能体(Agentic AI)
搜索文档
观察| 杨立昆离职:我们不在AI泡沫中,但在LLM泡沫中
未可知人工智能研究院· 2025-11-21 03:02
文章核心观点 - 当前人工智能领域存在严重的大语言模型泡沫,将LLM等同于AI是片面和危险的[1] - LLM只是人工智能发展长河中的一朵浪花,而非整个AI领域的源头或终点[8] - 过度聚焦LLM导致资源分配失衡,挤占了其他重要AI研究方向的发展空间[16] - 中国AI发展存在隐忧,高校人才培养过度窄化于LLM赛道,可能错失下一代AI技术布局机会[17][19] AI发展历史与现状 - 人工智能本质是让机器学会像人一样思考做事的大工程,并非某类技术的专属冠名权[5] - AI发展70年历程是机器视觉、语音识别、强化学习、生成模型等多领域共同进步的结果[6][8] - 从1956年达特茅斯会议定名AI开始,经历了感知机、专家系统、深蓝、AlexNet、AlphaGo等多个里程碑[6] - 在自然语言处理领域,LLM只是晚来的晚辈,1966年ELIZA聊天机器人已能模拟真人对话[8] - 杨立昆批评当前LLM为"统计鹦鹉",只会模仿人类说话腔调,却不理解语义内涵[9] 创新规律与LLM泡沫 - 真正改变世界的创新往往在冷门角落诞生,而非聚光灯下[10] - 科技史上交流电战胜直流电、触屏手机取代功能机等案例证明冷门技术可能成为主流[11] - LLM热潮已陷入"比规模大"的死循环,从百亿参数卷到千亿再到万亿参数[14] - 研究者过度聚焦微调技术,如同在同一个馒头上面雕花,缺乏根本性创新[14] - 真正机会存在于LLM的阴影区:智能体AI、大模型压缩技术、神经符号AI等方向[15] 中国AI发展问题 - 近五年超过150所高校建立人工智能学院,但多数存在师资不足问题[17] - 高校课程设置严重偏向LLM,机器视觉、强化学习等传统优势领域被边缘化[17] - 人才培养同质化导致LLM领域人才过剩,而边缘AI、AI安全等方向人才稀缺[18] - 单一化研究导向正在削弱中国AI的创新根基,可能失去技术备选方案[19] - 需要培养敢闯冷门赛道的叛逆者,而非千篇一律的LLM跟风者[21] 未来发展建议 - LLM是AI发展的重要里程碑,但需要与App生态、5G网络等配合才能发挥真正价值[23] - 企业应结合自身真实需求,制造业可重点发展机器视觉,医疗领域可专注CT影像识别[23] - 研究者应跳出LLM舒适区,关注AI自主解决问题、移动端部署等前沿方向[23] - 高校需进行差异化培养,发挥各自在机器视觉、工业质检等领域的特色优势[21] - AI的未来属于多元智能共生,需要打破"LLM=AI"的片面认知[25]
终于发布的GPT-5,和它改变世界的982天
36氪· 2025-08-08 00:07
模型发布与性能 - GPT-5采用多层级架构整合o3系列推理能力 重点提升智能体能力 未公布具体参数规模 [9] - 上线后迅速屠榜LMArena竞技场 所有细分类目均位列第一 [10][12] - 提供四个版本:标准版GPT-5 轻量版GPT-5 mini 高速版GPT-5 nano 以及ChatGPT专用版GPT-5 Chat [18] - 系统由三部分组成:基础模型 深度推理模型GPT-5 thinking 实时路由器real-time router [20] 技术架构创新 - 统一模型架构整合GPT系列语言模型与o系列推理模型 具备调度子模型能力 [19] - 开源两款MoE模型gpt-oss-20b(21B参数)和gpt-oss-120b(117B参数) 采用Apache 2.0许可协议 [52][53] - 开源模型专门为智能体设计 120B版本可在高端笔记本运行 20B版本适配手机端 [54] - 词表超过20万 支持多语种与代码混合输入 直接对标DeepSeek与阿里Qwen3 [54] 商业化策略 - API价格显著降低 GPT-5输入1.25美元/M Tokens 仅为o1-pro价格的1/120 [24][25] - 美国联邦政府机构可1美元订阅企业版 同时GitHub Copilot提供免费预览版 [31] - 年化收入达120亿美元 70%来自C端订阅 20%来自API调用 [84][85] - 微软Azure AI与Copilot带动云收入同比增39% Meta广告转化率提升5个百分点 [90][91] 行业竞争格局 - 7月中国开源模型占据OpenRouter趋势榜前10名中的9席 [6] - 开源闭源差距缩小 阿里Qwen3 月之暗面K2等中国模型引发硅谷关注 [95][99] - Anthropic创始人公开质疑开源AI价值 Meta考虑将旗舰模型Behemoth转向闭源 [100] - 全球AI数据中心投入预计达3万亿美元 半数用于GPU等加速芯片 [74] 用户与市场表现 - ChatGPT周活跃用户达7亿 占全球人口近10% 去年同期的4倍 [76][77] - 成为最快达到10亿下载量与5亿月活的应用 周末使用频率趋近工作日 [80][81] - 推出人格模式包含四种输出风格 语音多模态能力显著提升教育医疗场景体验 [39][46] - 现场演示生成带关卡音效的小游戏仅需几分钟 代码量达一两百行 [36][38]
杨植麟摸着DeepSeek过河
36氪· 2025-07-19 04:30
模型性能与技术突破 - Kimi K2是一款万亿参数MoE模型,包含1T总参数和32B激活参数,推出Kimi-Base和Kimi-instruct两个版本[1] - 在编程、智能体任务上表现突出,测评显示其自主编程、工具调用和数学推理能力超越开源模型DeepSeek-V3和阿里Qwen3[1] - 采用新型优化器Muon替代AdamW,算力需求降低至52%,实现万亿参数规模训练突破[13] 市场反响与开发者生态 - 开源一周Hugging Face下载量超10万,LMSYS竞技场排名第四,OpenRouter趋势榜全球第二[1][4] - API定价显著低于竞品,输入/输出tokens成本较Claude 4 Sonnet下降75%,推动AI编程普及[10] - 社区运营策略创新,通过工程师直接互动引发"自来水"传播,获Hugging Face联合创始人公开赞赏[4][17] 战略定位与行业影响 - 明确聚焦Agentic AI赛道,优化工具调用速度和任务完成质量,支持PPT/Excel/3D建模等场景[7][8] - 被《Nature》评价为"又一个DeepSeek时刻",验证其技术路线影响力[6] - 国内大模型初创分化明显,公司选择类似Anthropic的技术路径,与Minimax多模态、智谱ToB路线形成差异[16] 产品商业化表现 - Web端访问量6月环比增长30%,显示技术突破对产品反哺效应[20] - Cursor等AI编程公司ARR两个月增长60%至5亿美元,显示赛道爆发潜力[10] - 放弃C端投流转向模型研发,反映行业从用户增长向技术突破的范式转变[15][16] 技术应用案例 - 可快速生成3D场景(如昼夜变化山脉)和专业数据分析报告(含箱线图、回归模型等)[9] - 支持接入Owl/Cline等框架实现自主编程,处理13万行数据生成可视化分析[8][9]