AGI

搜索文档
除了Ilya、Karpathy,离职OpenAI的大牛们,竟然创立了这么多公司
机器之心· 2025-04-28 04:32
机器之心报道 机器之心编辑部 聚是一团火,散是满天星。 硅谷新势力已经崛起,这些创业者来自 OpenAI。 作为 ChatGPT 的缔造者,OpenAI 堪称当今人工智能领域最耀眼的明星。这家公司正以惊人的速度飙升至 3000 亿美元估值的同时,也催生了一批离职创业的成 员。 OpenAI 的光环效应如此强大,以至于 Ilya Sutskever 的 AI 初创公司 Safe Superintelligence (SSI) 和 Mira Murati 的 Thinking Machines Lab 等企业尚未推出产品就获得 数十亿美元融资。 这个新兴生态圈还包括诸多明星项目,以下是离职 OpenAI 的研究者打造的最受瞩目企业盘点。 Dario Amodei, Daniela Amodei, John Schulman — Anthropic Dario Amodei 和 Daniela Amodei 兄妹二人于 2021 年离开 OpenAI,联合其他 OpenAI 高管共同创立了 Anthropic,专注于开发安全、可解释、对齐人类价值观的 AI 系统。 随后,OpenAI 联合创始人 John Schu ...
重押AI后,昆仑万维去年由盈转亏了
华尔街见闻· 2025-04-26 12:04
文章核心观点 - ChatGPT掀起AI大模型浪潮后竞争焦点从底层技术转移到AI应用,昆仑万维战略重心转向AIGC但仍未盈利,公司将采取措施改善盈利状况并预计2027年开始AI大模型业务盈利,需平衡大模型技术和AI应用发展 [3][4][10] 行业情况 - ChatGPT掀起AI大模型浪潮两年后,竞争焦点从底层大模型技术转移到AI应用 [3] - 2023 - 24年是AI大模型初始投资期,全球科技公司投资数百亿美金处于巨亏状态;25 - 26年是应用落地和收入增长期,行业收入快速增长但仍亏损;2027年以后开始盈利 [10] 公司战略 - 昆仑万维将战略重心更多放在AIGC,认为这是更容易实现商业变现的路径 [3] - 为改善未来盈利状况,公司将在业务端提升研发成果商业化效率,投资端优化资产配置策略,拓展多元化收入来源并降本 [8] 公司财务 - 2024年度财报显示,公司去年净亏损15.9亿元,较2023年转盈为亏,原因是研发投入加大和投资收益不及同期 [5] - 去年研发费用15.4亿元,同比增长59.5%,投资相关损失8.2亿元 [5] - 去年营业总收入56.6亿元,同比增长15.2%,海外营收占比提升至91%,同比提升5个百分点 [7] 公司业务进展 - 自2023年发布“天工1.0”大模型后多次迭代,在复杂任务处理、多模态等方面有多项突破 [11] - AI社交应用Linky单月最高收入突破100万美元,AI音乐年化流水收入ARR约1200万美金,短剧平台DramaWave年化流水收入ARR约1.2亿美金 [12] 公司未来展望 - 预计2027年开始AI大模型业务实现盈利,会坚定投入保持在第一梯队 [10] - 要在熟悉的应用赛道发力,同时平衡大模型技术和AI应用 [12][13]
o3 深度解读:OpenAI 终于发力 tool use,agent 产品危险了吗?
海外独角兽· 2025-04-25 11:52
OpenAI新模型发布 - OpenAI发布o3和o4-mini模型,其中o3是目前最先进的推理模型,具有全面的推理能力、丰富的tool use方式和全新的多模态CoT能力 [5] - o4-mini是专为高效推理优化的小模型,在某些benchmark上表现优于o3,但实际使用中思考时间明显更短 [5] - 两个模型实现了agentic浏览网络、Python代码执行与可视化、图片推理与增强、文件读取等能力 [5] - 模型定价方面,o3比其他一线模型更贵,o4-mini定价是o3的1/10 [59][60] Agent能力突破 - o3的agentic能力接近理想agent,任务完成方式与Deep Research类似,能在3分钟内给出不错结果 [6] - o3的tool use体验无缝,比Devin、Manus等产品更快更自然,思考推理过程更长不截断 [6] - 测试显示o3能完成YC官网企业信息整理和Amazon销售数据分析等复杂任务,表现优于Manus [7][8][11][12] - 用户案例显示o3能自主定位Youtube视频内容并进行分析搜索,类似完整agent的工作方式 [28] 多模态能力进展 - o3和o4-mini首次实现将图像直接融入CoT,能"看懂"图像并用图像思考,在多模态理解benchmark领先 [33] - 测试显示模型能处理模糊、反转或低质量图像,理解内容并进行裁剪、旋转等操作 [34] - 模型通过地貌、文字等线索成功识别埃及尼罗河和马来西亚婆罗洲等地理位置 [37][39] - 但视觉推理能力仍不稳定,在数手指、判断时钟时间等任务上存在系统性错误 [53][55][56] 技术路线与商业化 - agent产品分化为两类技术路线:OpenAI的黑盒端到端训练和Manus的白盒工作流外置 [4][6] - OpenAI将agent产品作为未来商业化收入重点,可能覆盖通用agent产品市场 [3] - 开源Codex CLI旨在普及竞品功能,具有多模态推理和本地代码环境集成两大特性 [47][51] - RL Scaling依然有效,算力投入与性能提升成正比,o3比o1表现更好 [61][62] 强化学习发展方向 - RL教父提出"体验时代"概念,强调agent需从自主经验中学习达到超人类水平 [65][68] - 未来agent将形成长期连续experience stream,能自我修正实现长期目标 [68] - 需转向基于真实环境信号的奖励机制,如健康数据、考试成绩等 [70] - agent可能发展出非人类思维方式,结合世界模型实现更有效规划 [71]
李建忠:大模型技术创新驱动的 AI 生态和应用演进
AI科技大本营· 2025-04-24 03:39
AI发展阶段与生物智能演化对比 - AI发展分为五个阶段:1940年代符号主义起步[4]、2012-2018年感知AI(如AlexNet突破)[4]、2018-2024年生成式AI(如GPT-1.0和ChatGPT)[4]、2024-2030年AI智能体(强化学习驱动)[4]、2030年后物理AI(具身智能)[4] - 生物智能演化对应:5.5亿年前线虫大脑诞生[7]、5.4亿年前三叶虫视觉出现[8]、5000年前人类文字发明[8]、16-17世纪科学革命[9] - 两者均呈现"大脑→视觉→语言→推理"的加速发展路径,语言是智能跃迁核心[9][10] 自然语言在智能中的核心地位 - 人类文明因文字出现而腾飞,AI领域OpenAI押注自然语言路线,通过大模型实现智能突破[12] - Anthropic研究反驳统计学派:大模型内部存在规划逻辑(非简单概率输出)、跨语言泛化能力、语言映射共享概念区域(如"苹果"的抽象概念)[13][14][15] - OpenAI首席科学家Ilya Sutskever认为"语言是对人类智能的压缩",与维特根斯坦哲学观点一致[19] 大模型技术范式演进 - 三阶段划分:预训练(知识灌输)、后训练(价值观对齐)构成"快思考",推理(逻辑思维)构成"慢思考"[21] - Scaling Law持续有效:预训练受限于语料瓶颈,但强化学习(如OpenAI o1和DeepSeek-R1)通过合成数据推动新增长曲线[23] - 推理模型成为主流范式,DeepSeek-R1开源方案推动行业转向强化学习[19][21] AI应用生态与模态演进 - 生成式AI(AIGC)与AI智能体并行发展:前者提供情绪价值(toC娱乐),后者提供成就价值(toB效率)[25] - 内容模态遵循"文字→图片→音频→视频"路径,AI降低创作门槛(博客时代作者比例1%,短视频时代37.5%)[27] - 智能体五大能力:规划(推理驱动)、工具调用(MCP协议)、协作(A2A协议)、记忆、行动[28][31][33] Agent平台与协议生态 - MCP协议连接大模型与传统软件(结构化数据/中心化架构),A2A协议实现Agent间协作(自然语言/去中心化)[33][34] - Agent平台将成为大模型厂商竞争焦点,需整合MCP和A2A协议以链接传统服务与多Agent协作[35][37][38] - 传统软件需重构为"面向智能体+自然语言交互+消除割裂"的三要素,否则面临淘汰[42] AGI发展路径与组织协作 - OpenAI定义AGI五阶段:聊天机器人→推理者→智能体→创新者→组织者[45][50] - 强化学习推动AI从"人类数据时代"(知识回声)到"经验数据时代"(突破边界)[47][49] - 高阶智能体现为组织协作,未来或出现大规模Agent协作网络(如软件开发中需求分析、编码等角色Agent化)[53][55]
从AI原生看AI转型:企业和个人的必选项
36氪· 2025-04-23 11:41
AI原生企业定义与标准 - AI原生企业核心判断标准为人均效益 1000万美金是行业门槛指标 去年Midjourney公司11人实现营收超过1亿美金 [3] - 不同行业需差异化评估 传统制造业或零售业人力依赖度高 需与行业历史数据对比排名 [5] - AI原生本质是实现无人工干预的自主运营 终极目标是通用人工智能AGI驱动的无人企业 [7][9] AI对社会经济的影响 - AI将导致服务行业劳动力供应趋于无限 美国第三产业占GDP 80% 律师等脑力工作将被大规模替代 [14][16] - 行业收入两极分化加剧 脑力工作领域若AI达到人类80%-90%水平 顶级人才与普通从业者回报差距扩大 [19] - 社会需重构财富分配机制 可能通过全民基本收入UBI等方式解决生存资本问题 [20] 企业AI转型实施路径 - 转型需自下而上推动 优先激活内部对AI热心的种子用户 通过非核心场景如会议室预订切入 [55][61][64] - 关键步骤包括提供稳定AI工具入口 组织内部研讨会 并定义测试数据集验证模型效果 [39][59] - 避免过早投入核心业务系统 2023年AI因概率模型输出不可控 无法替代ERP等需100%精准的系统 [41] AI技术应用实践案例 - 会议室预订场景通过API打通会议系统 2024年10月实现100%准确率 关键靠工具调用与模型优化 [48][54] - 金融风控场景用AI连接企业微信与Excel云桌面 半天完成原需3个月开发量的系统 且保障数据安全 [71][75][76] - 内部图片生成功能通过微调小模型 使效果评分从40-50分提升至80-90分 大幅提升使用意愿 [56] 软件开发模式变革 - AI将大幅降低软件开发成本 需求可能增长100-1000倍 过去软件是奢侈品 定制化成本达数十万元 [86] - 未来可通过群聊沟通快速构建原型 减少客户IT团队-乙方项目经理-技术人员等多层沟通损耗 [84] - 开发人员角色转向专业架构设计 AI处理常规编码 提升工作专注度与满意度 [91] 大模型技术发展趋势 - 大模型本质是对世界知识的有损压缩 无法完全还原信息 需区分无损压缩(如数学公式)与有损压缩 [49][50] - 最领先的大模型将趋向开源 因知识本身具有开放性 且模型输出内容易被其他模型蒸馏学习 [95][99][101] - 需融合视觉/听觉等多模态能力 并构建世界模型理解物理规则 目前模型缺乏真实环境反馈闭环 [35][36][37] 组织与个人适应策略 - 个人需建立数字化能力镜像 通过脑机接口或行为记录训练AI分身 实现决策模拟与能力扩展 [31][34] - 企业应聚焦部门内闭环应用 跨组织共识达成仍依赖人工 AI暂难替代利益博弈流程 [114][116] - 一人企业将成为趋势 但需解决信任建立与商业模式细化问题 依赖流量分发与信息交互平台 [118][123]
The Second Half:一位 OpenAI 科学家的 AI 下半场启示录
海外独角兽· 2025-04-17 06:26
AI发展阶段的划分 - AI发展已进入下半场,从单纯解决问题转向定义问题和评估模型效果 [6][7] - 上半场核心在于训练方法创新,如Transformer、AlexNet、GPT-3等模型突破 [9] - 上半场训练方法论文引用量远超benchmark论文,如Transformer引用16万次vs WMT'14的1300次 [9][11] 强化学习(RL)的突破 - RL获得泛化能力,能同时处理软件工程、创意写作、数学问题等多样化任务 [8] - RL三大要素中,先验知识(priors)重要性超过算法和环境 [13][14][15] - 语言模型pre-training为RL提供了关键先验知识,但直接应用于控制领域效果不佳 [20][21] AI有效配方 - 核心配方包含:大规模语言预训练、算力数据扩展、推理与行动理念 [12] - 语言通过agent reasoning实现泛化,如ReAct框架结合推理与行动 [25][26] - 环境设计重要性凸显,OpenAI曾开发Gym、World of Bits等标准化RL环境 [18][19] 评估方法的转变 - 传统i.i.d评估假设与现实不符,需开发考虑长期记忆和连续任务的评估方式 [30] - 自动评估假设被质疑,真实人机交互评估如Chatbot Arena更具现实意义 [28][30] - 效用问题成为关键,AI需从攻克benchmark转向创造实际经济价值 [28][30] 行业影响与趋势 - 通用配方使渐进式改进价值降低,5%专项优化可能不如30%的通用模型提升 [26][28] - 下半场将催生万亿级公司,通过智能产品化实现商业价值 [30] - 行业需重新思考问题定义,产品经理类技能将更受重视 [7][28]
科技龙珠雷达系列 - 上海篇-系统梳理中国科技龙珠
2025-04-15 14:30
纪要涉及的行业和公司 - **AI大模型及语调服务行业**:库拉斯 - **机器人行业**:智源机器人、达塔科技、飞西科技 - **国产GPU行业**:沐锡、碧人科技、四元科技 纪要提到的核心观点和论据 库拉斯 - **核心观点**:在AI领域有重要地位,发展态势良好 [3] - **论据**:2024年3月成立,背靠国资,为大模型企业提供语调服务;语调服务规模达260T,合作伙伴超100家,签署几十家战略协议;正在建设大模型语调超级工厂,预计2025年底语调库总容量提升到2PB,每天语调加速加工速度达1000P [2][3] 智源机器人 - **核心观点**:具备AI加本体的全站技术,产品和技术有创新突破 [4][6] - **论据**:有远征精灵、灵犀等三大机器人系列家族,已量产下线超一千台通用巨神机器人;灵犀X2全身有28个自由度,能做高难度动作;3月10日发布智源起源大模型,提出VLM + MOE混合架构;3月11日推出新一代人形机器人零星XR,在四个痛点方面有改进,实现三大技术创新 [4][5][6][7] 达塔科技 - **核心观点**:创新性提出云端机器人架构并实现商业化 [8] - **论据**:通过人工智能、多模态融合AI、数字软生论等先进技术,实现机器人自我学习、进化和成长 [8] 飞西科技 - **核心观点**:专注工业化机械臂生产,产品应用场景广泛 [9] - **论据**:核心创业团队来自斯坦福大学机器人和人工智能实验室;飞西玄辉系列凭借多自由度力矩传感器,可在工业、医疗、科研教育、农业等领域应用 [9][10] 沐锡 - **核心观点**:在高性能通用GPU研发有成果和突破 [11] - **论据**:核心团队有近20年高性能GPU产品开发经验;有N、C、G三个系列GPU产品;联合联想发布首个国产Digifig一体机解决方案;实现中国首个四种以上异构芯片混训技术落地;2022年8月发布的BR100芯片创造全球算力纪录,16位浮点算力达1000T以上,8位定点算力达2000T以上 [11][12] 碧人科技 - **核心观点**:针对Queen32B推理模型有部署成果 [13] - **论据**:推出全面支持Queen32B大模型推理的TM106全系列一体机,该大模型接近DeepSea R1的推理能力水平 [13] 四元科技 - **核心观点**:在人工智能云端算力产品有优势 [14] - **论据**:计算集群布局领先,能为企业提供开箱即用的快速部署效果;依托智能加速卡和计算集群,为大型计算中心提供加速产品,降低客户成本;有预算和建算两个软件开发平台,还有内容生成服务产品;2025年率先完成对deepseq全量模型高效适配,一体机已在多地智能计算中心完成1万张卡部署 [14][15] 其他重要但是可能被忽略的内容 - 科技龙珠企业不仅在各自领域领先,在国际上有影响力,能突破国际巨头垄断,引领中国技术发展潮流,有望引发国家对科技企业的关注热潮 [16] - 建议加大对计算机等科技类资产配置,为未上市但有突破的科技企业提供资金支持 [16]
大厂AI应用三国杀,BAT新共识瞄准平台生态
新财富· 2025-04-14 07:10
中美AI产业的叙事分歧 - 美国AI科技公司坚持"One For All"单一大模型愿景,认为通用大模型将覆盖垂类场景,如GPT-4o的图像生成能力是里程碑事件[3] - 中国AI产业主流叙事转向字节、阿里、腾讯的"三国演义",大厂主导AI应用及开发生态之争[3] - 中美分野体现"技术理想主义vs商业现实主义"的对抗,两条路线无明确优劣之分[4] 早期中美AI技术差距与中国初创公司选择 - 中国"AI六小虎"(智谱、月之暗面等)专注自研基座大模型,但与美国OpenAI技术差距显著[6] - 商业化压力迫使"六小虎"转向应用层突围,仅Kimi凭借长文本差异化成功获得C端流量[8] - 2024年美国AI风险投资额808亿美元,是中国的十倍,中国一级市场融资困难[9] 从"六小虎"到"三国杀"的巨头竞争 - 字节跳动all in AGI,成立Seed AI部门并投入800亿Capex,豆包成为2024年下载量1.8亿、MAU断层领先的C端应用[12][13][14] - 阿里、腾讯调整组织架构:阿里拆分通义团队,腾讯分拆元宝与混元模型[15] - DeepSeek开源模型R1拉平技术差距,腾讯全产品线接入获得流量增长,阿里加强自研Qwen模型并提升夸克战略地位[16][17] 技术突破对行业格局的冲击 - DeepSeek超低成本开源模型超越豆包登顶下载榜,Monica团队Agent产品思路受认可,OpenAI GPT-4o文生图功能颠覆市场[22] - 技术变革加速:DeepSeek R2、GPT-5整合o3、MCP协议等可能重塑行业[23] - 大厂难以复制移动互联网推广路径,需警惕技术突破摧毁产品围城[23] 巨头战略调整与技术生态共生 - 字节将"追求智能上限"定为首要目标,阿里腾讯加速自研:阿里冲刺AGI,腾讯发力Mamba架构混元T1模型[25] - 阿里云推出全周期MCP服务,50余款服务可拖拽式集成,200多款大模型实现5分钟应用搭建[29] - 腾讯云支持DeepSeek与混元双引擎,字节扣子平台提供60余种插件,大厂推动开发生态繁荣[30]
“机器人领域,谁敢赚黑心钱?” | 科创100人
新浪科技· 2025-04-10 01:17
行业趋势 - 2025年全球人形机器人产业迎来爆发临界点,宇树科技和特斯拉擎天柱机器人推高行业热度 [2] - 行业存在"过热"质疑,但需在机器人未完全实现AGI时植入商业场景以实现早期商业闭环 [2][5] - 中国在人形机器人技术领域全球领先,海外团队效率低于国内,人才密度和投入时间不足 [6] 公司动态 - 数字华夏研发国内首款面部29个主动自由度的仿人机器人"夏澜",男性版"夏起"和女性版"夏澜"于2024年3月18日亮相 [2][4] - 公司由前华为天才少年彭志辉创立的智元机器人注资,供应链依赖智元,聚焦运动控制、灵巧手等核心技术 [4] - 团队来自华为、富士康、大疆,兼具to B和to C经验,成立一年已获头部银行、运营商、电网等客户 [4][5] 商业化路径 - 优先解决客户场景闭环问题,专注展厅讲解、导览导购、文旅互动、康养陪护等交互场景 [4] - 现阶段机器人未达真正智能,客户购买目的均为业务增值而非纯消费,例如零售行业效率提升案例 [5] - 商业模式由技术和市场双轮驱动,未来侧重本体关键部件和软硬件整体应用能力 [7][8] 行业挑战与标准化 - 当前行业亟需统一数据标准和机器人本体标准(如1.7米成人型/1.3米小型),以提升数据通用性和减少资源浪费 [6] - 供应链成本结构相近,厂商价格差异源于商业策略而非核心技术,行业不存在暴利现象 [6] - 三年后机器人硬件将无门槛,产业链可能出现ODM/OEM分工,应用层公司将百花齐放 [7] 竞争格局 - 大公司具备资金和场景优势,但小公司在单点技术突破和组织效率上更具竞争力 [7] - 全球12亿家庭需求场景无限,市场足以容纳多参与者,竞争者增多验证方向正确性 [7]
对话智元首席科学家:把具身智能过度类比大模型,是对它最大的误读
36氪· 2025-04-05 11:41
文章核心观点 - 具身智能赛道存在泡沫但也有发展前景,软硬件一体的全栈路线是未来趋势,当下是入局和突破的最佳时间点 [10][23][44] 行业现状 - 具身智能赛道一边有投资人逃离泡沫,一边被高额融资激活,腾讯首次押注具身智能领域的智元机器人,该公司成立仅1月完成3亿天使轮融资,几个月内估值达10亿美金,成为全球最快跻身独角兽的具身智能公司 [5] - 行业还未收敛到确定性技术方案,未出现引领型明星公司 [30] - 全球有500万台机器人被部署在真实世界,但都是盲的,靠绝对定位操作,做重复性编程和工作 [42] 泡沫看法 - 泡沫意味着关注度和资源,是提前下注,技术范式转移都会经历泡沫阶段,具身智能更复杂,需要更长时间技术积淀 [10] 大模型与具身智能关系 - 不能简单将具身智能与大模型范式划等号,大模型准确率在机器人身上不适用,用大模型周期类比具身智能低估了作业智能和行动智能的独特挑战 [12][13] 软硬件重要性及卡点 - 软件和硬件同等重要,目前软件和硬件都未收敛到点,行业对两者集成也无共识 [14] - 软件方面,大模型缺乏长时间memory,跨任务尝试、分层控制和实时反馈是难题,仿真、数据使用及RL应用都存在挑战 [15] - 硬件方面,高性能硬件平台成本高,传感器反馈不够精细,可靠性有提升空间,未来可能根据不同行业有相对标准化本体和方案 [16][17] 数据问题 - 数据问题像蛋生鸡、鸡生蛋难题,可先从封闭、半封闭空间部署机器人获取数据来改进系统 [18][20] - 自动驾驶早期也有数据匮乏争论,现在数据过多,具身智能公司掌握产品和生态、有能力部署机器人将有先发优势 [21] 全栈路线必要性 - 自动驾驶和无人机行业发展表明,软硬件一起迭代的全栈路线会笑到最后 [22][23] 智元公司情况 - 智元是中国头部具身智能公司中最高举高打的一家,发布首个通用具身基座大模型,与Pi达成合作,首席科学家是罗剑岚 [6] - 公司内部是扁平、高度协作团队,稚晖君、姚卯青和罗剑岚是平行互补关系,分别负责系统工程、战略方向和算法路线推动及外部技术生态融合 [25][26] - 选择与Pi合作是因理念契合,Pi是国际上做具身智能最好的公司之一 [27][28] - 公司采用生态打法,强调开放协同,帮助外部公司迭代并引入其能力到自身生态体系 [29] 自主决策与任务定义 - 机器人自主决策关键在于对不确定性的分析和建模,换成可执行动作链,其感知、预测、生成机制的泛化能力是关键技术 [31] - 长周期任务关注任务先后复杂依赖关系和泛化能力,复杂任务在manipulation上有未解决问题,如机器手接触外界的物理现象和多模态视觉输入下完成灵巧任务 [32] 机器人AGI相关 - 实现manipulation就是AGI,是比LLM更高级的智能 [34] - 最感兴趣的是让系统有更强自主学习和泛化能力,智元新成立的具身智能研究中心希望打通从基础科学到技术落地的链路 [36] 强化学习与入局优势 - 受大模型影响,强化学习在具身智能领域成潮流,不同背景的人入局视角不同 [37][38] - 大厂和消费电子公司入局是积极信号,它们在用户体验、产品化等方面有积累,创业公司优势在于对行业底层逻辑理解更垂直、精致,擅长智能,最终两个方向会聚合 [39][40] 行业周期与入局时机 - 具身智能已走过约十年探索期,现在进入机器人应用窗口期,特定场景有使用价值且有持续学习能力的机器人会提前到来,是入局和突破的最佳时间点 [41][42][44]