Workflow
通用人工智能(AGI)
icon
搜索文档
当我们再说具身大小脑的时候究竟在说什么?
具身智能之心· 2025-09-11 05:53
具身智能行业概述 - 具身智能成为通用人工智能(AGI)探索的关键方向 强调智能体与物理环境的交互与适应 聚焦感知环境、理解任务、执行动作和反馈学习的能力 [1] - 大脑和小脑构成具身机器人核心模块 大脑负责思考感知和语义理解 小脑负责高精度运动执行 [1] 国内外产业布局 - 近2年具身明星团队创业活跃 星海图、银河通用、逐际动力等从实验室走向商业和工业界 [3] - 华为2024年底启动"全球具身智能产业创新中心" 与乐聚机器人、大族机器人合作建设大脑和小脑关键技术 [5] - 京东自2025年5月连续投资智元机器人、千寻智能、逐际动力 强化物流科技与家庭服务场景能力 [5] - 腾讯、蚂蚁集团、小米等科技巨头通过战略投资与合作布局 加快构建产业生态 [5] - 国外Tesla/Figure AI推进工业与物流机器人应用 Wayve和Apptronik获投资机构支持落地自动驾驶与仓储机器人 [5] - 国内企业以产业链投资与综合平台驱动落地 国外科技巨头侧重基础模型、模拟环境与类人机器人原型研发 [5] 技术演进阶段 - 第一阶段聚焦抓取位姿检测 通过点云或图像预测末端执行器姿态 但缺乏任务上下文和动作序列建模 [6] - 第二阶段进入行为克隆阶段 通过专家演示数据学习端到端映射 但存在泛化能力弱和误差累积问题 [6] - 第三阶段兴起Diffusion Policy方法 通过扩散模型生成动作轨迹提升策略稳定性与泛化能力 [6] - 2024年进入Vision-Language-Action模型阶段 融合视觉感知、语言理解与动作生成模块 支持零样本或小样本快速泛化 [7] - VLA模型实现从"感知+控制"向"感知+推理+行动"的范式跃迁 代表工作包括OpenVLA、RT-2、PI0等 [7] - 2025年探索VLA与强化学习、世界模型、触觉感知等模块融合 弥补"只能理解不能反馈"等局限 [9] 技术融合方向 - VLA+强化学习提升长时任务试错能力与自我改进能力 [11] - VLA+世界模型引入环境动态预测 使机器人具备"想象未来"能力 [11] - VLA+触觉信息拓展多模态融合感知边界 实现更精细安全的操作 [12] - 技术演进从低层感知向高层理解发展 逐步迈向通用任务和开放环境智能体时代 [14] 应用与人才需求 - 技术发展推动人形机器人、机械臂、四足机器人等产品落地 [14] - 应用覆盖工业、家居、餐饮、医疗康复等领域 相关产品和融资活跃 [14] - 岗位呈现爆发式增长 大量人员转入具身智能领域研究 [14] - 工程与系统能力需求激增 需掌握Mujoco/IsaacGym/Pybullet等平台策略训练与仿真测试 [17] - 需具备训练部署Diffusion Policy/VLA/力触融合模型的能力 [17] - 需实现强化学习在VLA后训练的应用 支持机器人反馈微调 [17] - 需掌握从世界建模预测到策略学习再到物理执行的一体化架构 [17]
奥特曼和硅谷投资大佬对话:2030年代,世界500强公司会加速消亡
36氪· 2025-09-11 00:05
奥特曼认为,AI可成为切实放大人类追求的强大倍增器,能使"单个人可完成的事务"达到当前需要庞大 团队才能实现的规模。他援引建造戴森球、部署纳米机器人等科幻概念为例,指出这些看似遥不可及的 文明级别项目,可能借助AI的扩展潜力变得具备可行性。这一观点颠覆了人们对生产力的传统认知: AI并非仅仅是实现自动化的工具,更是放大人类能力的重要载体。 奥特曼把这种变化与传统企业结构的消亡联系在一起。当科斯拉提出"21世纪30年代《财富》500强企业 将以更快速度消亡"的观点时,奥特曼表示虽然无法推测到精准的时间,但直觉认为速度会更快。 他特别指出,软件公司在这一趋势下尤其脆弱,并预测未来用户将通过"向聊天机器人输入指令" 的方 式,即时生成符合自身需求的定制软件,从而绕开当前的SaaS(软件即服务)巨头。这种"即时生成软 件"的模式,有可能对当前价值数十亿美元的软件企业帝国形成冲击。"过去我以为理解软件公司的运行 规律,但在一个任何软件都能'即时生成'的世界里,这些规律将被颠覆,"奥特曼说。他认为,OpenAI 自身的成长就是"新公司快速取代旧公司的加速效应"的典型案例。 9月10日消息,近日在硅谷的一场对话把人们的目光 ...
Altman描绘AI十年路线图:"智能即电力",任何软件秒生,10人公司也能年入10亿
美股IPO· 2025-09-10 16:06
Altman预计,十年后AI的成本会趋同于电力成本,算力与能源将成为价值核心;虽然AI将能胜任"几乎所有的智力工作",但那些需要深度情感连接和同 理心的职业——如教师、护士、长者照护——将变得更加珍贵,"生物程序设计是非常难以克服的。" 他建议投资者,不要花时间寻找下一个AI研究实验 室,要"把100%的时间用来投资于因AGI而成为可能的新物种"。 在与OpenAI早期投资人Vinod Khosla的最新对话中,OpenAI CEO Sam Altman勾勒了一幅未来十年人工智能(AI)发展的图景:到2035年,软件将 实现即时生成,10人公司年收入可达10亿美元,而AI的成本将趋同于电力成本。 这场与硅谷传奇风险投资人Vinod Khosla的深度对话揭示了AI技术将如何重塑商业格局,同时保持人类核心体验的不变性。 Altman预测,技术变革速度将"难以用现有框架去理解",但人类的生物性需求——社交、情感连接和家庭关怀——将保持恒定。这种矛盾将定义未来十 年的发展轨迹。 对话中最引人注目的观点是对传统软件行业的颠覆预测。Altman表示,"我们正走向一个世界,在那里你想要的任何软件都可以即时生成",这将彻底 ...
通用人工智能就在身边,为何我们感知却不明显?
虎嗅· 2025-09-08 01:51
AGI发展现状 - AGI并非3~5年后的技术 而是已经存在于当前环境中 其发展是一个递归过程 深度和范围将持续扩大[1] - AI已在特定角色(如编程)实现全功能覆盖 这本质上是AGI的体现 因为每个角色都需要综合判断能力[2] - 当前AGI感知不明显的原因类似于坦克初发明时被误认为不如狗拉爬犁 属于应用场景错配[3] 智能原生概念 - 智能原生并非单纯技术 而是技术与组织模式匹配的思维模式 旨在改造产品和服务生产过程[8] - 智能原生企业被列入国务院"人工智能+"行动意见 成为政策重点方向[5] - 智能原生是以AI为主体、智能优先的价值创造体系 AI成为价值创造主体 AI-AI协作取代传统组织流程[29][30] 技术应用案例 - 编程领域出现范式变革:传统需要产品经理、架构师、前后端工程师、测试工程师协同的流程 现在可通过自然语言与编码助手(如Claude Code)交互完成 效率提升显著[24][25] - 实际案例显示:算法工程师一天完成过去一个团队需数周的工作量 且一行代码未写[26] - 运维领域实现突破:借助AI编程 一周内完成k8s/日志ELK/监控Prometheus/数据库等全套服务部署 效率较传统方式提升数十倍[33][34] 组织变革趋势 - 业务组织呈现可折叠特性 随着智能水平提升而递归演进:从编程团队扩展到运维 再延伸到多个职能 最终覆盖整个公司[31] - OpenAI五级模型体现内置逻辑:Agent与Organization本质相同 仅面对范围和复杂度存在差异[36] - 最终演进方向是"无人公司"或AI Level5状态 实现完全智能原生运营[13] 行业影响分析 - AI进化速度超越人类进化速度 2022年至今的应用形态已发生根本性变化[17][18] - 传统工具开发面临生存危机:业务周期和商业化周期可能长于技术更迭周期 导致时间窗口大幅缩短[41][42] - 价值创造范式发生迁移:关键不再是AI技术使用 而是如何用AI封装业务 需要找到由数据和工具构成的AI现实边界[44][46][47] 竞争格局演变 - 纯粹经济世界将形成"智能高者胜"的基本竞争原则[59] - 若智能水平持平 反身性将导致待计算世界持续变化 大规模计算难以获得相应回报 体系可能进入热寂状态[60][61] - 技术推动商业形式走向既有形态终点 并开启新文明状态[63] 发展路径选择 - 自下而上路径:从各种细碎工具起步 但必须持续演进 否则将被大模型折叠力量淘汰[49] - 自上而下路径:直接瞄准无人公司 以智能原生方式处理最终业务 锁定销售额和现金流 但需补全AI在数据、知识、工具方面的不足[50]
马斯克值不值万亿美元薪酬 | 财经峰评 | 巴伦精选
搜狐财经· 2025-09-08 01:10
当A股最大公司还停留在3000亿美元市值规模时,美股已出现了有望冲击万亿美元薪酬的CEO。 9月5日,特斯拉董事会为CEO埃隆·马斯克提出了一份新的薪酬方案。若马斯克能在未来十年内实现一系列极具挑战性的业绩目标,他将获得价值约1万亿美 元的股票奖励。 获得1000万个FSD(Full Self-Driving)订阅。 如此天价薪酬,纵然是公认的商业奇才马斯克,也不禁让人探讨他是否值得。 要回答马斯克值不值万亿美元薪酬,需审视两个核心:特斯拉能否冲击8.5万亿美元的市值目标;马斯克拿走1万亿美元回报是否合理。 该薪酬方案计划授予马斯克约4.23亿股特斯拉股票,分12个批次解锁。每一批次的解锁都需同时达成市值和运营两类里程碑目标。 市值目标要求特斯拉市值从当前的约1.1万亿美元增长至最终的8.5万亿美元,接近10万亿美元这个量级。 我在此前的文章《》中提到过,"下一个物理AI时代,可见的大赛道智能驾驶,倒是有着更大的市场想象空间,10万亿美元巨头更有可能出自于此,硬件龙 头目前来看特斯拉最有希望。"看来特斯拉董事会所见略同。 运营目标则包括: 交付2000万辆特斯拉汽车。目前存续量800万辆;2024年交付量不足 ...
通用人工智能(AGI)已经来了
36氪· 2025-09-08 00:21
AGI发展现状 - AGI并非3~5年后的未来概念 而是已经存在于当前技术环境中 其发展是一个递归过程 深度和范围将持续扩展[1] - AI已在特定角色(如编程)实现全功能覆盖 这本质上是AGI的一种表现 因为任何角色均需综合判断能力[1] - 当前AGI感知不明显的原因类似于坦克初发明时被误判为不如狗拉爬犁 属于应用场景认知滞后[1] 智能原生概念与特征 - 智能原生是技术与组织模式匹配的思维模式 其核心是改造产品和服务生产过程[5] - 智能原生企业被置于政策显著位置 国务院文件明确提及该概念[3] - 智能原生体系以AI为价值创造主体 遵循智能优先原则 AI-AI协作取代传统复杂组织流程[16][17] - 智能原生模式下生产流程高度简化 例如软件开发从多角色协作的"交响乐"变为AI辅助的"独奏"[13] 技术演进与产业影响 - AI进化速度呈现指数级提升 2024年AI与2022年AI已本质不同[9] - AI推动"一切皆可重建" 传统价值模式被快速解构与重构[11] - 技术更迭周期缩短至低于业务商业化周期 导致产品存续时间窗口大幅收缩[25][26] - 编程领域效率提升显著 案例显示AI可在1天内完成传统团队需数周的工作量[13] - 运维领域实现突破 借助AI编程可在1周内完成k8s/日志监控/数据库等全套服务部署[20] 组织形态变革 - 无人公司是智能原生发展的终极形态 对应AI Level5水平[8] - 组织内化为智能体间关系 业务职能按智能水平提升递归折叠[18] - 可折叠组织随智能水平提升而演进 从编程团队递归至运维职能直至整个公司[18] 价值创造范式转变 - 核心竞争力从技术驾驭转变为价值创造模式驾驭[27] - 关键成功因素是如何用AI封装业务 而非单纯使用AI技术[29] - AI发展导致执行能力贬值 范式发生本质迁移[29] - 需持续打破AI应用障碍 为其力量发挥铺平道路[31] 实施路径与挑战 - 双向理解困难成为落地关键障碍 技术理解与组织运作存在认知鸿沟[8] - 实施路径存在两种方式:从细碎工具逐步扩展 或直接从无人公司智能原生模式切入[32] - 核心挑战在于构建人类知识与局部AGI的无缝衔接体系[8] 思维模式变革 - AI思维表现为数字和智能空间优先的思维模式[36] - 智能优先对应虚拟先行 规模化试错 算力对冲不确定性等具体思维[34] - 角色边界重新定义 AI辅助人与人类辅助AI存在本质差异[35] 行业生态影响 - 反身性可能导致智能持平状态下计算回报跟不上成本 体系进入热寂状态[37] - 技术推动商业形式趋向既有形态终点并开启新文明状态[37] - 依赖倒置世界逐渐形成 虚拟世界开始牵引物理世界运行[36]
从AI上下半场切换看后续产业投资机会
2025-09-07 16:19
行业与公司 * AI行业 正处于从深度学习向大语言模型转变的关键时期 核心是智能涌现 包括理解 生成 记忆和逻辑四大能力 推动从感知智能向认知智能转化[1] * 海外科技巨头如 Meta 持续加大资本开支 预计2025年同比2024年将有五六十以上的高增长 以支持算力需求[9] * 在基础设施方面 值得关注的公司包括阿里巴巴 深信服 第三范式等Infra公司 以及航迹和海光等算力相关公司[18] * 在典型应用层面 值得关注的公司包括有场景 有空间且未来具有壁垒保护业务落地的相关公司 如石油股份 美图等[18] 核心观点与论据 * AI产业发展的三要素是算力 算法和数据 这三个要素共同驱动整个AI产业的发展 通过飞轮效应实现不断提升[5] * AI技术发展分为上下半场 上半场主要探索模型智力水平极限 算力为王 下半场主要完善系统能力 推动AI现实场景融合落地变现 应用为王[6] * Transformer框架的大规模应用引发了质变 包括理解能力和逻辑推理能力等新能力涌现 推动通往AGI的路径[7] * 短期内大模型升级逐渐显现天花板 发展路径包括效率提升(数学及编程领域) 推理提升以及全模态模型 是后续重点发展方向[8] * AI对人工替代分为辅助 替代和超越三个阶段 目前已在编程和内容审核等领域批量替代中低级人员 并逐渐扩展至更多行业[10] * AI中长期发展的逻辑在于算力产业的显著增长和应用场景的多样化 AI产品基于概率分布 需要面对不确定性 商业化基点相对较晚[12] * AI Agent代表了一种原生应用范式变革 可以与SOP PDCA OKR等传统管理工具适配 通过AI赋能实现升级[13] * AGI是能够自主感知环境并采取行动实现目标的计算实体 基于大语言模型的AGI能够使用传感器感知环境 并利用LLM进行记忆检索 决策推理和行动顺序选择[15] * 以Minus为例 其工作流呈现出清晰分层协作架构 在文件处理 数据分析 代码编写到内容创作等多个任务上展现出强大的整合能力[16] * 2025年将是AI制片元年 AI原生APP用户规模持续走高 各类垂直领域APP涌现 其繁荣发展将显著提升对算力需求 云计算将成为产业投资核心[17] 其他重要内容 * AI产业经历了三次主要浪潮 第一次是20世纪50-70年代的起步阶段 第二次是20世纪80-90年代以专家系统为代表的实践阶段 第三次是2000年以后以机器学习和深度学习为代表的算法革命阶段[2] * 复盘2023年以来的大型事件显示 多轮行情由模组预测边际变化驱动 例如2023年ChatGPT发布引发普涨 2024年kimi实现超文本突破带动办公软件上涨 2025年AGI加速落地促使金蝶 鼎捷等公司涨幅明显[11]
OpenAI,开始对马斯克“猎巫”
搜狐财经· 2025-09-07 13:25
OpenAI法律行动 - OpenAI向支持马斯克立场的非营利组织发出传票 要求提供与马斯克相关的通信记录、文件 甚至包括Meta和扎克伯格的信息[2][3][5] - 被传唤组织包括AI伦理组织Encode和AI治理公益组织LASST 共同点是曾质疑OpenAI从非营利转型为商业公司[6][7] - OpenAI内部法律团队将名称含"Tesla"的实体视为马斯克关联方 尽管实际所有人为七旬老夫妻且命名源于街道历史[22][23] 马斯克与OpenAI法律争端 - 马斯克于2024年3月起诉OpenAI 指控其背叛"不为了盈利、AGI交给全人类"的初心 并让ChatGPT发展路线向微软商业利益倾斜[8] - OpenAI回应称马斯克当年投资时曾要求控制董事会席位、产品方向及推动与特斯拉合并 被拒后撤资并另起炉灶[9][10] - 争议核心涉及AGI控制权问题:开源非营利初心与数百亿美元算力成本及全球竞争压力的现实矛盾[14] OpenAI政治策略 - OpenAI于2025年成立政治行动委员会"Leading the Future" 可合法接收政治捐款、投放广告及游说国会议员[17][18] - 该组织任务从解释商业转型理由转变为在社交媒体、论坛及政策领域排查反对者 包括追踪转发马斯克内容及批评言论者[21] - OpenAI采用"反对即削弱美国AI优势"的话语策略 将马斯克、扎克伯格及eBay创始人奥米迪亚列为对手[25][26] 行业影响与争议 - 法律争端暴露AGI发展核心困境:非营利结构可能扼杀进化 完全市场化则存在科技新殖民风险[14] - 监管机构、非营利组织及科研团体作为社会监督体系的一部分 正面临被收编、冷处理及法务威胁的现象[29] - 争议从商业纠纷演变为权力话语权之争 焦点从"谁说了什么"转向"谁有权说话"[28][29]
23岁“神童”被OpenAI扫地出门后,募集15亿美元专投AI,半年收益率47%
新浪财经· 2025-09-07 09:23
基金业绩表现 - Situational Awareness基金由23岁德国投资者利奥波德·阿申布伦纳创立 目前管理资产规模超过15亿美元 [1] - 该基金2024年前两个季度实现47%的资产收益率 显著超越同期标普500指数6%的涨幅(含股息)及美国主要科技对冲基金7%的平均收益率 [1][4] - 基金采用"100% All In AI"投资策略 通过一级和二级市场布局人工智能相关公司 上半年业绩接近华尔街同业平均水平的7倍 [4][6] 创始人背景 - 阿申布伦纳2002年出生于德国 曾以第一名成绩毕业于哥伦比亚大学(时年19岁) 并参与牛津大学全球优先事项研究项目 [4] - 2023年加入OpenAI超级对齐项目 与首席科学家苏茨克维尔合作研究人工智能与人类价值观对齐问题 后因公司内部争议被解雇 [4] - 2024年发表165页专题报告《态势感知:未来十年》 预测通用人工智能(AGI)最迟将于2027年实现 并警告超级智能风险超越核武器 [5] 投资策略与客户构成 - 基金专注于AGI领域投资 基于对人工智能产业关键发展节点的判断进行资产配置 [6] - 投资者包括支付公司Stripe创始人科里森、Meta AI业务负责人丹尼尔·格罗斯等科技界知名人士 部分客户承诺长期锁定资金 [6] - 尽管获得业界认可 但市场存在对人工智能投资泡沫的担忧 美国AI企业估值自DeepSeek突破后已出现显著缩水 [6]
李飞飞的答案:大模型之后,Agent向何处去?
虎嗅APP· 2025-09-07 02:51
Agent AI核心框架 - 提出由环境与感知、认知、行动、学习、记忆五大模块构成的智能体认知闭环架构 这代表对未来通用人工智能发展路径的前瞻性思考[10][12][17] - 感知模块具备多模态信息接收能力和任务规划与技能观察功能 使智能体能主动从物理或虚拟世界获取信息[12] - 认知模块作为处理中枢 由大语言模型和视觉语言模型提供世界知识、逻辑推理和上下文理解能力[14] - 行动模块通过控制器生成物理世界交互指令或虚拟世界API调用[15] - 学习模块支持预训练、零样本/少样本学习、强化学习和模仿学习等机制 实现持续自我进化[16] - 记忆模块采用持久化结构化系统存储知识、逻辑和推理结果 支持长期经验积累[17] 大模型驱动机制 - 大型基础模型特别是LLM和VLM的成熟是Agent AI框架的根本驱动力 为智能体提供零样本规划能力[20] - 大模型存在的"幻觉"问题可通过环境交互机制解决 环境反馈能迫使模型内部知识与外部现实对齐[21] - 基础模型存在社会偏见风险 需通过多元化数据训练和偏见检测机制确保包容性[22] - 个人数据隐私保护需建立明确法规框架 通过提示工程和人类监督层确保安全可控[22] 游戏领域应用 - 彻底改变传统NPC由固定脚本驱动的模式 实现基于记忆、目标和情感的动态行为调整[25] - 支持玩家用自然语言与游戏世界互动 为开放世界游戏带来前所未有的沉浸感和自由度[25] - 可作为创作者副驾驶 根据指令自动生成游戏关卡、道具和完整3D场景 大幅提升开发效率[25] 机器人领域应用 - 用户可用日常语言下达指令 机器人自主规划执行复杂物理操作 如GPT-4V可将人类演示视频转化为可执行任务序列[27] - 通过领域随机化技术在模拟训练中引入变化 增强对真实世界差异的鲁棒性[27] - 融合视觉、语言、触觉等多模态信息理解环境 实现更精准的物理交互[27] 医疗健康应用 - 作为医疗聊天机器人进行初步问诊和病史收集 基于医学知识库提供诊断建议 提升初级诊疗覆盖率[29] - 连接实时更新的医学数据库 在生成诊断时同步进行事实核查和来源引用 抑制模型幻觉[29] - 处理分流患者信息并监控慢性病患者生命体征 实现高效个性化健康管理[31] 发展挑战与方向 - 需解决视觉、语言、听觉、动作等多模态深度融合问题 而非浅层拼接[32] - 需训练能跨游戏、机器人和医疗等不同领域工作的通用智能体 而非定制化模型[32] - 建立科学评测体系至关重要 研究团队已提出CuisineWorld多智能体协作基准和VideoAnalytica视频理解基准[32]