通用人工智能(AGI)

搜索文档
天工称冠机器人百米赛;与辉同行否认董宇辉年入20亿
21世纪经济报道· 2025-08-18 02:34
人形机器人技术突破 - 北京人形机器人创新中心研发的"具身天工Ultra"机器人以21.50秒成绩获世界人形机器人运动会100米短跑冠军 采用全自主导航系统无需人工遥控 [2] - 宇树科技因舆论压力参与比赛 作为硬件厂商原避免与客户同台竞争 筹备时间约一个月 [5] 人工智能技术进展 - 谷歌DeepMind发布Genie 3世界模型 凭文本实时生成互动虚拟世界 保留一分钟空间记忆 被视为通向AGI的关键突破 [4] - OpenAI高管承认GPT-5仍存在幻觉问题 建议用户核对答案 强调可靠性与完全可靠性存在不连续性 [5] - 清华大学团队实现量子计算架构突破 首次支持任意两比特量子门直接编程的指令集架构AshN 成果发表于《自然·物理》 [11] 半导体行业格局变动 - SK海力士2025年上半年以36.3%市占率超越三星成为全球最大DRAM制造商 终结三星33年霸主地位 三星市占率降至32.7% [10] - SK海力士HBM业务贡献DRAM营业利润54% 自2024年3月起保持英伟达HBM3E主要供应商地位 美国子公司销售额同比增长103% [10] 操作系统生态建设 - 华为鸿蒙操作系统用户突破千万 目标推动全球终端运行鸿蒙 年底生态力争与安卓iOS看齐 鸿蒙5终端数量超1000万 [7] - 鸿蒙采用"一次开发 多端部署"理念提升开发效率 框架将推动中国应用出海 [7] 新能源基础设施 - 蔚来G318川藏换电路线全线贯通 全长2950公里部署15座换电站 实现全程换电至珠峰 [8] - 我国首个搭载气象雷达的海上升压站完成安装 监测半径230公里 为三峡江苏大丰800兆瓦海上风电项目提供气象监测与灾害预警 [9] 智能硬件产品发布 - 智元机器人推出OmniHand 2025灵巧手系列 包含灵动款与专业款 灵动款指导价1.48万元 首发限时降至9800元 [12] - 西北首条城市无人机医药配送航线在西安启用 航线长度10.5公里 配送时间11分钟 效率为地面运输3倍 未来将拓展至疫苗与血液运输场景 [13][14] 行业热点事件 - 罗永浩称董宇辉年收入达20-30亿元 与辉同行官方否认该信息 董宇辉曾以28.541亿元登顶网络主播收入排行榜后辟谣 [3] - Meta为扎克伯格支付2700万美元(约1.9亿元)安保费 超苹果等五家科技巨头CEO安保支出总和的26% [5] - 机场拦截充电宝通过二手平台回流市场 每吨回收价约9000元(单个成本2-3元) 转卖利润达8000-12000元/吨 某回收企业月处理量超20吨 [6]
「我怕活不到毕业」,AI引爆美国退学潮,18岁PPT式创业震惊YC之父
36氪· 2025-08-18 00:40
美国顶尖大学辍学潮 - 哈佛和MIT等顶尖学府出现学生因AGI焦虑主动辍学的现象,2025年趋势加剧,学生担忧AGI实现后将全面超越人类并带来灾难性后果 [1][2] - 仅2024年就有数十名哈佛和MIT学生退学,投身AI安全领域初创公司或研究实验室,推动AI与人类价值观对齐 [3][6] - 辍学生案例:麻省理工的Alice Blair因认为当前AGI发展路径可能导致人类灭绝而休学,加入AI安全中心 [6] AI发展的时间线与风险 - OpenAI CEO奥特曼预测AGI将在2029年前出现,DeepMind CEO Hassabis认为5-10年是合理时间线 [13] - 美国国务院2024年报告指出,不受控的AI发展存在「灭绝级」风险 [9][10] - 「深度学习教父」Hinton警告AI发展速度超预期,可能威胁人类生存 [8] 就业市场与AI替代效应 - 哈佛调查显示超半数学生担忧AGI影响就业前景,认为大学教育无法跟上AI技术迭代速度 [16] - Anthropic CEO Amodei预测AI将替代50%入门级白领岗位,未来失业率或飙升至20% [17] - JPMorgan经济学家指出,经济衰退期企业将加速采用AI工具,非重复性脑力职业首当其冲 [22] 行业争议与反对声音 - Meta首席AI科学家Yann LeCun认为当前大模型能力不及猫,AGI安全派代表Gary Marcus打赌2025年前不会出现超人类AGI [23] - 哈佛与MIT联合研究指出当前AI模型缺乏真正科学发现能力,质疑恐慌被夸大 [25] - Y Combinator联合创始人Paul Graham公开反对辍学创业,强调大学经历不可替代 [28][30] 高校应对措施 - 哈佛紧急上线AI伦理课程,MIT撤回鼓吹AI生产力的论文以缓解学生焦虑 [31] - 学生普遍认为世界变化过快,传统教育体系已无法应对AI时代的紧迫性 [32]
VLA/VLA+触觉/VLA+RL/具身世界模型等方向教程来啦!
具身智能之心· 2025-08-18 00:07
具身智能概述 - 具身智能强调智能体与物理环境的交互与适应 聚焦于感知环境 理解任务 执行动作并反馈学习的能力 [1] - 具身智能的核心模块分为大脑(语义理解与任务规划)和小脑(高精度运动执行) 类比人类神经系统结构 [1] 产业动态 - 近2年星海图 银河通用 逐际动力等明星团队从实验室走向商业化 推动本体与大小脑技术进步 [3] - 国内华为2024年启动"全球具身智能产业创新中心" 联合乐聚机器人 大族机器人攻关关键技术 [5] - 京东2025年起连续投资智元机器人 千寻智能 逐际动力 强化物流与家庭服务场景能力 [5] - 国际方面Tesla/Figure AI聚焦工业物流机器人 Wayve/Apptronik获资本支持发展自动驾驶与仓储机器人 [5] 技术演进路径 - **第一阶段**:抓取位姿检测(Grasp Pose Detection) 通过点云/图像预测末端执行器姿态 但缺乏任务上下文建模 [6] - **第二阶段**:行为克隆(Behavior Cloning) 通过专家数据学习端到端映射 存在泛化能力弱 误差累积问题 [6] - **第三阶段**:2023年Diffusion Policy引入序列建模 2024年VLA模型实现多模态协同 支持零样本泛化 [7] - **第四阶段**:2025年探索VLA与强化学习 世界模型 触觉感知融合 解决反馈 预测与触觉局限 [8] 应用与产品 - 技术演进推动人形机器人 机械臂 四足机器人在工业 家居 餐饮 医疗等场景落地 [9] - 行业岗位呈现爆发式增长 吸引大量从业者转入具身智能领域 [9] 技术体系与课程 - 课程系统梳理大脑+小脑技术路线 涵盖灵巧手 移动操作 人形机器人方法 [15] - 包含主流仿真框架配置 DP/VLA/VLA+RL/VLA+触觉等方法详解 以及世界模型下一代范式 [15] - 实践环节覆盖Sim2Real演进 IsaacGym/Mujoco仿真环境 Diffusion Policy代码实战 VLA模型训练等 [21] - 目标群体包括具身算法从业人员 研究方向学生 以及传统CV/自动驾驶转行者 [24][29]
硅谷画饼王「塌房」:奥特曼撒谎微表情被扒光,网友集体喊下台
36氪· 2025-08-17 23:50
AGI 即将到来 我们现在有信心知道如何构建传统意义上的 AGI GPT-5 是一次重大升级……是通往 AGI 的重要一步 其实 AGI 这个词没什么用 短短半年时间内,OpenAI CEO 山姆·奥特曼(Sam Altman)先后抛出了这个观点,第一句让全世界振奋,第二、三句让用户和投资人躁动,第四句却又几 乎否定了前面的一切。 关于 AGI 的定义,在他嘴里已经变成了薛定谔的猫,既存在又不存在,既重要又无关紧要。 奥特曼的人设,塌在 GPT-5 图片来自:@tsarnick 这些微妙的肢体语言,让人分不清他究竟是在仰望天花板寻找灵感,还是因为心虚而不敢直视镜头?当这些细节被网友翻出来反复解读,也成了压垮奥特 曼人设的最后一根稻草。 在 GPT-5 尚未发布之前,奥特曼的预热推文更是一条比一条神秘。直到现在,我们依然搞不明白为什么他看到 GPT-5 后会「眩晕无力、瘫倒在地」。那 张著名死星图片,原本想营造的神秘感,如今也成了网友们的笑料。 尤其是,他最近大半年来一直强调 AGI 多重要,上周末转头接受外媒 CNBC 采访表示:「我认为这(AGI)不是一个非常有用的术语。」对此,他解释 说 AGI 定义太多 ...
未来改变世界的不再是人?OpenAI 首席科学家直言:AI才是关键力量
36氪· 2025-08-17 23:47
8月16日消息,在最新一期OpenAI发布的播客节目中,主持人(OpenAI前工程师)安德鲁・梅恩和其公 司的黄金搭档——首席科学家雅库布・帕乔基(Jakub Pachocki)和研究员西蒙・西多尔(Szymon Sidor)作为嘉宾参与。 这对搭档回顾了从波兰高中同学到在OpenAI共事的渊源,还深入探讨了人工智能发展的关键议题,包 括通用人工智能(AGI)的定义与衡量标准、技术突破的标志性成果、基准测试面临的挑战,以及AI对 教育、科研和社会的实际影响等。核心观点有: ●AGI的定义与衡量演进:AGI已从抽象概念细化为多维能力集合。比如IMO金牌等里程碑虽有意义, 但点状突破已不足,未来应关注其在自动化科研和现实应用中的影响。 ●AI技术的突破轨迹:从早期情感分析的局限,到GPT系列模型的迭代,模型已能参与IMO、ICPC、日 本AtCoder等竞赛,展现出强大的推理与创造性思维能力。 ●基准测试的挑战与 "饱和":许多基准测试已出现"饱和",模型接近或超过人类水平,但难以全面反映 智能。衡量标准需转向实际效用与新见解的发现能力。 以下为此次播客节目的精华版内容: 安德鲁・梅恩:大家好,我是安德鲁・梅恩, ...
AI和互联网的旷世冲突
36氪· 2025-08-17 23:41
平台主导下的旧秩序 - 互联网底层权力结构体现为注意力权利不对称,用户是注意力的供给方,平台是垄断性代理和加工方,将注意力打包成广告位售卖[4] - 平台掌握三大核心权力:信息优先级设置权(算法决定用户看到的内容)、个人数据使用权(单向收集行为数据构建用户画像)、价值分配权(定义创作者/商家/用户的收益规则)[5][6] - 用户在该体系中处于被动地位,成为"被看见、被分析、被引导"的客体,权利与服务免费性形成对冲[7] 个人智能体引发的新范式 - 个人智能体(Personal Agent)作为用户数字世界的专属代理人,唯一效忠用户利益,颠覆平台中心主义[8][10] - 权力结构从不对称转向对称:广告模式面临终结(Agent自动过滤营销信息除非用户主动同意)、算法目标反转(从最大化粘性转向效率优先)、数据主权回归用户(Agent控制数据分享权限与定价)[10][11] - 技术本质是依赖倒置:平台需通过用户Agent获取许可,而非用户依赖平台访问信息,这一变革由AI算力成本下降驱动[11] AI思维与无人公司的应对策略 - 虚拟先行:商业Agent需在世界模型中与数百万模拟个人Agent预交互,验证价值主张与定价策略的算法适配性[13] - 规模化试错:通过生成数千种API接口和价值证明协议,快速测试主流个人Agent的接受度,试错成本趋近于零[13] - 算力对冲:企业投入算力模拟Agent集群行为,替代传统市场费用,未来护城河取决于对Agent生态的理解深度[14] 行业范式转移的核心结论 - AI驱动的冲突本质是市场主导权再分配,直接挑战平台中心化的数字经济秩序[3][15] - 未来竞争核心转为赢得用户Agent信任,商业交互频次与数据处理量级将推动智能组织和无人公司成为必然形态[15]
融资数千万美元,前B站副总裁创业:走出ICU,用户已超800万
搜狐财经· 2025-08-17 21:36
公司概况 - 心影随形由互联网资深人士Binson(刘斌新)于2023年4月创立,专注于AI陪伴型产品开发,创始人曾任职百度、360、B站等企业高管 [1] - 核心产品"逗逗游戏伙伴"定位为AI游戏陪玩桌宠,融合AI技术与二次元文化,测试阶段已获800万用户,入选2024年"全球50家最具潜力初创公司榜单" [1][3] - 公司累计完成四轮融资,总额达数千万美元 [1] 产品特性 - 产品实现跨场景智能陪伴,支持游戏攻略、情绪互动、工作学习等场景,采用VLM视觉大语言模型提升交互真实感 [9][31][33] - 游戏场景深度适配《英雄联盟》《原神》等热门游戏,提供BP建议、gank提醒、战后复盘等专业功能 [3][5][20] - 与老番茄、永雏塔菲等UP主合作开发虚拟角色,通过人格化设计增强用户情感连接,拒绝唤醒词以强化陪伴感 [7][25] 技术架构 - 基于开源模型进行多模态微调,针对游戏画面开发专用VLM模型,半年训练周期实现画面语义理解 [34][35] - 采用云端+本地混合数据处理架构,严格规避敏感信息,用户隐私数据仅以ID形式存储 [40][41] - 当前技术成熟度自评70分,目标实现AGI级陪伴体验,需突破长视频推理与环境感知能力 [30][37][38] 市场策略 - 优先垂直切入游戏场景,避免与通用AI产品直接竞争,通过"先做小再做深"构建壁垒 [47][71] - 日本市场表现突出,用户时长留存优于国内,归因于当地宅文化及社交压力差异 [42][43] - 商业化初期以角色皮肤、通话时长收费为主,未来规划B端广告分成占比超50% [44][45] 行业认知 - 判断AI陪伴需求将随社会孤独感加剧持续扩大,最终覆盖数亿用户规模 [39][67][68] - 行业竞争关键在于数据积累与情感连接,现有游戏内置AI助手难以实现跨场景支持 [47][49][50] - 多模态技术发展速度低于预期,但长期看好AI重构生产关系的变革潜力 [53][73] 创始人理念 - 坚持"工具是引子,情感是本质"的产品哲学,通过共同回忆建立用户与AI的情感纽带 [12][23][25] - 创业需把握技术信号提前布局,如2023年预判VLM价值并投入研发形成先发优势 [56][58][59] - 商业目标拒绝"小而美",认为优质产品必然走向规模化,参考中国游戏玩家6亿基数制定增长策略 [69][70][72]
“按需思考”的GPT-5引发争议,但这可能是AI的未来
财富FORTUNE· 2025-08-17 13:04
GPT-5发布引发的争议与挑战 - 用户强烈反对GPT-5的发布,认为其性能下降且失去原有模型的友好交互特性,演变为产品与信任危机 [1] - 核心问题在于GPT-5采用实时模型路由器调度多个子版本,而非单一模型,部分子模型性能较弱或成本更低,导致输出不一致 [1] - 行业评论家批评GPT-5"姗姗来迟、过度炒作、索然无味",开发者与用户对剥夺控制权表示愤怒 [1] OpenAI的应对措施 - 公司迅速为专业用户重新启用早期主力模型GPT-4o,并承诺修复路由故障、提高使用限额以重建信任 [2] - AI销售平台创始人评价路由技术"精准时像魔法,失灵时如系统崩溃" [2] 模型路由技术的现状与前景 - 路由技术面临固有挑战,如同一查询的不同部分可能被分发至多个模型,导致答案拼接时出现矛盾 [3] - 完善路由系统的难度堪比打造亚马逊级推荐系统,需多年时间与领域专家协作 [3] - 技术与经济双重因素推动路由技术成为常态:单体模型性能触及瓶颈,且路由可复用旧模型降低成本 [3][4] - 物理限制(如GPU内存瓶颈)阻碍模型规模扩大十倍,路由技术成为必要选择 [4] 行业对GPT-5及路由技术的评价 - 模型集成并非新概念,但GPT-5因公开路由系统且改进幅度微小引发用户不满 [5] - 官方文档显示GPT-5包含多个变体(标准版、高速版、思维版等),通过路由器自动调度 [5] - 行业认为从GPT-4到GPT-5的迭代缺乏跨越式提升,是用户不满的根源 [6] 关于AGI的讨论与争议 - GPT-5依赖多模型网络而非单体架构,引发对AGI过度炒作的批评 [6] - 专家指出全能型单体模型仍遥不可及,混合系统可逐步升级且降低成本 [6][7] - AI发展可能介于多模型组合与统一大模型之间,受工程成本、算力限制及商业压力影响 [7]
奥特曼的人设,塌在GPT-5
虎嗅APP· 2025-08-17 10:23
核心观点 - OpenAI CEO山姆·奥特曼关于AGI的表述前后矛盾,从强调重要性到否定术语价值,引发公众和投资人质疑 [7][8][15] - GPT-5发布过程中奥特曼的营销手法引发"狼来了"效应,Polymarket投票显示OpenAI支持率从75%暴跌至14% [9][10][14] - 奥特曼被曝存在系统性"撒谎信号"微表情,管理风格被前高管指控为"心理虐待"和资源操纵 [10][21][22] - OpenAI商业模式立场反复,从公开反对广告到探索广告收入,被类比为科技行业"Vaporware"现象 [16] - 行业竞争格局变化,Google、Anthropic、xAI等对手正在蚕食OpenAI技术领先优势 [25] 公司动态 领导层争议 - 董事会曾指控奥特曼未坦诚披露创业基金持股、提供不准确安全信息并在成员间制造矛盾 [21] - 前高管爆料其通过同一资源承诺制造团队内斗以巩固控制权,被描述为"心理虐待"式管理 [22] - 与马斯克决裂过程中展现政治手腕,通过关键人物站队促使马斯克退出 [22] 产品与技术 - ChatGPT用户数据表现亮眼:周活7亿(同比增4倍)、商业用户500万(6月为300万)、日均消息30亿条 [12] - GPT-5预热采用神秘主义营销但实际效果未达预期,被网友调侃"眩晕无力"宣传图 [11] - 技术路线从早期开源承诺转向封闭,内部讨论承认"不会纠正外界误解" [12] 商业模式 - 广告策略出现180度转变:从"最后手段"到探索"交易收入"可能性 [16] - 早期非营利定位吸引重量级支持,但实际运作偏离"反垄断"叙事 [12][16] 行业观察 竞争格局 - 注意力经济效应显著:即使Google模型更强,缺乏话题度仍难改变用户习惯 [13] - 多技术路线并存格局形成,Anthropic、DeepSeek等推动生态多元化 [25] 行业现象 - 高技术壁垒领域依赖创始人"人设背书",但信任坍缩速度远超技术迭代 [23] - "Vaporware"现象在AI行业重现,过度宣传与交付落差引发批评 [16] - 营销驱动创新模式受到质疑,行业呼吁回归技术本质 [25] 历史参照 - 对比乔布斯案例:奥特曼虽具"现实扭曲力场"但缺乏持续成功验证 [24] - 参照马斯克早期策略:技术领袖形象可帮助渡过产品验证期 [23]
谷歌内部揭秘Genie 3:Sora后最强AI爆款,开启世界模型新时代
36氪· 2025-08-17 08:44
Genie 3技术突破 - Genie 3是谷歌DeepMind开发的最先进世界模型,能够通过文本实时生成互动且高度一致的世界,分辨率为720p,帧率高达每秒24帧[1][6] - 该模型由Veo 2和Genie 2两个项目合作完成,具备长达一分钟的空间记忆能力,物理规律会随训练数据规模和深度提升[4][10][11] - 在生成视频时长、世界一致性、内容多样性和特殊记忆等方面实现突破,支持实时交互并提升真实感[6][8][12] 技术特性与比较 - 相比前代产品,Genie 3在分辨率(720p)、交互延迟(实时)、交互时长(多分钟)等关键指标上显著提升[7] - 特殊记忆功能表现突出,能保持场景元素的一致性,如角色刷墙后痕迹保留等超出预期的效果[10][11] - 采用逐帧生成方式而非显式表示法,增强了模型泛化能力和对多样世界的适应性[12][13] 应用前景 - 可用于创建游戏世界、训练强化学习智能体、机器人研究等领域[9] - 为机器人领域提供近乎无限的训练场景,突破现实数据采集限制[33] - 是世界模型通向通用人工智能(AGI)的关键一步,能让AI在丰富模拟环境中训练[6][25] 未来发展 - 未来将重点关注真实感和交互性的提升,计划开放Genie 3模型[26][31] - 当前与完全准确模拟现实世界仍有差距,特别是在场景自由度和真实感方面[27][28][29] - 量子计算机可能成为未来运行高级世界模拟的硬件平台[36]