Workflow
通用AI
icon
搜索文档
首款推理具身模型,谷歌DeepMind造!自主理解/规划/执行复杂任务,打破一机一训,还能互相0样本迁移技能
量子位· 2025-09-27 04:46
衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 谷歌DeepMind正式发布 新一代通用机器人基座模型 ——Gemini Robotics 1.5系列。 它不止于对语言、图像进行理解,还结合了视觉、语言与动作 (VLA) ,并通过具身推理 (Embodied Reasoning) 来实现"先思考,再行 动"。 全球首个具备模拟推理能力的具身模型来了! 这一系列由两大模型组成: 其中,ER代表"具身推理"。 这意味着GR-ER 1.5是全球首个具备模拟推理能力的具身模型。 不过, GR-ER 1.5并不执行任何实际操作 ,GR 1.5正是为执行层而生。 两者结合,能让机器人不仅完成"折纸、解袋子"这样的单一动作,还能解决"分拣深浅色衣物"甚至"根据某地天气自动打包行李"这种需要理解 外部信息、分解复杂流程的多步任务。 甚至,它能根据特定地点的特定要求 (比如北京和上海的不同垃圾分类标准) ,自己上网搜索,以帮助人们完成垃圾分类。 而且用上GR 1.5系列的模型,还能够在多种不同的机器人之间进行能力的零样本跨平台迁移。 Gemini Robotics 1.5 (GR 1.5) :负责动作执行的多模态大模型; ...
创世伙伴周炜:做VC还是要有点梦想,不敢投通用AI太“咸鱼了”
新浪科技· 2025-09-13 08:23
通用AI行业竞争格局 - 通用AI领域最终由大型科技公司主导 但仍是天花板最高的投资方向[1] - 创投企业因畏惧大厂竞争而回避大模型领域投资[1] 风险投资策略 - 仍会投资通用AI等高天花板领域 尽管风险极高[3] - 近期投资AI陪伴公司 认可该领域未来巨大发展潜力[3] - 必须参与通用AI方向投资 否则视为失职[3] - 同时投资具有高防火墙壁垒的领域[3] To B领域投资逻辑 - 偏好To B类AI创业公司 因其与复杂工作流深度结合[4] - 大模型升级虽具破坏性 但深度嵌入业务层的企业仍能存活[4] - 多层业务架构的商业模式更具投资价值[4]
2030年全球数据中心投资将达7万亿美元
搜狐财经· 2025-09-13 02:11
数据中心投资规模与增长趋势 - 2024年6月美国数据中心建设支出达400亿美元创历史新高 同比增长约30% [2] - 预计2028年数据中心支出总额超1万亿美元 其中大部分为AI数据中心投资 [2] - 2030年全球数据中心基础设施资本支出预计达7万亿美元 其中超4万亿美元用于计算硬件投资 [3] - 全球数据中心容量需求2030年前复合年增长率约22% 美国年增长率达20-25% [3] 科技巨头资本支出动态 - 苹果2024年前三季度数据中心支出95亿美元 同比增长50% [2] - 甲骨文2026财年资本支出预期350亿美元 同比增长65% [2] - 2030年超大规模企业将贡献70%数据中心需求 通用AI需求占比约40% [3] 经济效益与就业创造 - 北弗吉尼亚州2023年通过数据中心创造310亿美元经济产出 [3] - 大型数据中心建设期需1500名现场人员 部分岗位年薪达10万美元且无需大学学位 [4] - 数据中心稳定运营可创造50多个岗位 每岗位带动周边经济产生3.5个附加就业机会 [4] 基础设施与产业链影响 - 数据中心推动电力、电信、云端服务等相关产业发展 例如北弗吉尼亚州促使能源公司新建变电站和输电线路 [4] - 电力需求增长推动绿色能源创新 包括燃料电池、太阳能和小型模块化反应器 [4] 资源消耗挑战 - 2023-2030年美国数据中心电力需求将增加460太瓦时 达当前用电量三倍 [5] - 2030年美国数据中心用水量预计增长170% [5] - 数据中心建设需要大量土地、劳动力和专用设备 人才获取存在挑战 [5] 民生成本影响 - 美国现有超5000个数据中心 当地居民认为创造永久就业有限且消耗生存资源 [6] - 2030年美国电价预计平均上涨8% 弗吉尼亚州北部可能上涨25% [7] - 数据中心建设导致数字资源与权力向科技巨头集中 类比铁路时代产业集中现象 [7]
聚焦医疗健康AI深度服务:蚂蚁集团CEO韩歆毅外滩大会分享
贝壳财经· 2025-09-11 09:01
蚂蚁集团AI医疗战略定位 - 公司专注于AI医疗健康领域 致力于解决数据 幻觉 伦理三大核心问题 目标是将AI打造为医生的专业助手 [1][4] - 医疗健康领域具备"刚需+中高频"双重特性 医疗行为低频但健康管理高频 为AI深度服务提供发展土壤 [3] 垂类模型竞争优势 - 专业能力是垂类模型核心竞争力 通用模型短期难以替代医疗专业AI 专业性强构成护城河 [1][4] - AI医疗终极目标是提供个性化 精准且可信的建议 包括身体状况评估 用药推荐和持续健康管理 [4] - 公司明确AI在相当长时间内无法替代医生 核心战略是推进人机结合模式 [4] 技术实施挑战 - 高质量数据投入远超想象 单条医疗数据标注成本可达上百美元 需副主任/主任医师级别专家参与保障质量 [5] - 抑制幻觉需平衡"抑幻而不降能" 在减少错误同时保持模型服务能力 需反复打磨 [5] - 医疗伦理问题极为复杂 公司已成立医疗伦理顾问委员会 邀请顶级医疗专家共同探索规范 [5] 商业化与市场进展 - 尽管医疗健康是十万亿级市场 公司未来几年不急于推进商业化 优先聚焦专业数据积累 幻觉抑制和伦理建设 [5] - 公司自2023年加速AI医疗探索 2025年6月推出AI健康管家AQ 全端用户突破1.4亿 [6] - 已连接全国超5000家医院 近100万真实医生 并帮助超300个名医打造AI分身 [6] 应用场景拓展 - 通过AI帮助专科医生拓展能力边界 向全科医生方向靠拢 [4] - 成立医疗健康实验室 开展AI赋能MDT多学科会诊等前沿探索 [4] - 目标让名医专注科研和疑难杂症治疗 同时为基层医生提供优质助手 [4]
蚂蚁集团CEO韩歆毅:在医疗健康领域,专业AI做到极致能解决用户问题
环球网· 2025-09-11 08:32
公司战略与定位 - 蚂蚁集团CEO明确医疗健康领域具备"刚需+中高频"双重特性 为AI深度服务提供土壤[3] - 公司坚持专业垂类模型路线 认为通用大模型长期难以替代医疗专业模型[3] - AI医疗定位为医生助手而非替代者 通过赋能MDT多学科会诊帮助专科医生拓展能力边界[3] - 未来几年不急于商业化 聚焦解决数据积累、幻觉抑制与医学伦理三大核心问题[5] 技术实践与成果 - 已推出AI健康管家AQ 全端服务用户突破1.4亿[5] - 连接全国超5000家医院与近100万真实医生[5] - 协助超300个名医打造AI分身[5] - 成立医疗健康实验室进行前沿探索 并专门设立医疗伦理顾问委员会[3][5] 行业挑战与投入 - 医疗数据标注成本极高 单条数据成本达上百美元且需副主任级别以上专家参与[4] - 抑制幻觉需平衡"抑幻而不降能" 需反复打磨技术[4] - 医疗伦理问题需与顶级专家共同探索规范 属于行业未解难题[5] - 高质量数据投入远超想象 是模型训练的基础保障[4]
中国力量在自动驾驶与通用AI领域集体崛起
环球网· 2025-09-01 09:00
小马智行 - 公司首席执行官彭军入选《时代》2025全球AI百大影响力人物 成为唯一以自动驾驶行业代表身份登榜的领袖 [1] - 公司目标2025年实现千台规模无人出租车落地 推动L4级自动驾驶走向规模化运营 [1] - 被《时代》评价为"自动驾驶革命的引领者" 过去十年持续引领技术攻关与商业化实践 [1] 中国AI企业全球影响力 - 深度求索首席执行官梁文锋凭借开源大模型与通用AI领域突破入选 其DeepSeek-V3模型获全球开发者认可 [2] - 宇树科技首席执行官王兴兴以机器人方向登榜 公司占据全球三分之二机器狗市场份额 [2] - 多位中国科技领袖共同入选 展现中国在多元化AI赛道应用落地与前沿探索的全球影响力 [1][2]
王兴兴专访22问|保持开放的心态看待起伏,对未来抱有更大信心
机器人圈· 2025-08-13 10:33
公司发展现状与行业关注度 - 公司人形机器人因央视春晚表演获得远超预期的关注度,成为传统文化与高科技结合的文化符号[2] - 行业关注度提升带动公司及产业链企业上半年业绩显著增长,但同时也增加了管理层接待压力[3] - 公司认为当前舆论对行业的质疑属于正常现象,完全一致的好评反而不健康[4] 技术发展阶段与商业化路径 - 人形机器人进入家庭应用尚远,当前主要聚焦科研教育、服务展示、简单工业应用等细分场景[5] - 行业最大瓶颈在于AI技术未达临界点,但技术跃迁可能随时发生突破[6] - 预计3-5年内技术会有明显进步,但家庭场景落地还需解决伦理道德和安全性问题[7] - 机器人表演和比赛具有创造情绪价值的商业意义,是未来产业重要组成部分[9] 战略选择与竞争优势 - 公司从机器狗转向人形机器人主要基于多模态通用型AI技术的发展趋势[10] - 选择人形形态因市场偏好更广泛,符合商业理性[11] - 中国企业在全球具备生产制造和成本优势,但AI人才储备相对不足[12] - 行业竞争格局呈现多企业并存状态,良性竞争有利于整体发展[13] 关键技术挑战与解决方案 - 算力需求与电池负载存在矛盾,未来需依赖分布式算力中心解决延迟问题[14][15] - 行业面临全方位人才短缺,最核心缺口在AI领域[17][18] - 通过高校合作、技术开源(如四足机器人书籍)持续培养行业人才[19][20] 研发理念与行业愿景 - 研发关键在于方向选择,需保持技术敏锐度以减少试错成本[22] - 终极目标是推动生产力变革,使人摆脱繁重体力劳动[23] - 行业发展需要社会保持开放心态,容忍技术迭代周期中的波动[26] 区域经济与产业环境 - 杭州开放包容的营商环境与年轻人才聚集优势助力科技企业发展[25]
物理AI如何变革机器人产业?英伟达与宇树、银河通用创始人闭门会全实录
36氪· 2025-08-12 03:22
英伟达的物理AI战略 - 公司正积极布局物理AI 使机器人和自动驾驶汽车等自主机器具备运动技能 帮助它们理解并与现实世界互动 [1] - 物理AI将撬动万亿美元级的实体经济 制造、物流、医疗等物理产业总量达100万亿美元 是IT产业5万亿美元规模的20倍 [1][5] - 物理AI将计算力量从5万亿美元的信息市场带入100万亿美元的物理世界市场 机器人是连接两个世界的桥梁 [5] 中国市场优势 - 中国在物理AI和机器人领域具备独特的规模和人才优势 全球近一半的人工智能研究人员和开发者在国内 [2][6] - 中国拥有全球无可匹敌的电子制造产业和技术研发能力 为物理AI和机器人产业发展奠定坚实基础 [2][6] - 中国拥有大规模部署和测试机器人的真实场景 可快速收集数据、迭代算法 让机器人不断进化 [6] 英伟达技术平台 - 公司打造三台计算机:机器人本体计算机(如Jetson Thor)、AI工厂计算机(如DGX/HGX系统)、仿真计算机(如Isaac Sim) [6][12] - Jetson Thor专为物理世界智能推理代理打造 计算能力是上一代Jetson Orin的7.5倍 每瓦性能提升3.5倍 [7][12] - Isaac平台包括仿真框架Isaac Sim、强化学习平台Isaac Lab 以及世界基础模型框架NVIDIA Cosmos [12] 仿真技术核心作用 - 仿真是构建可靠机器人系统的唯一选择 可生成训练数据并测试安全性 避免现实世界测试的危险性 [28] - 公司通过提升仿真器精度、利用AI加速仿真、直接捕捉现实世界三种方式弥合仿真与现实差距 [32][33] - 合成数据占银河通用训练数据的99% 真实世界数据仅占1% 仿真技术是突破数据瓶颈的关键途径 [20][30] 机器人公司进展 - 宇树科技人形机器人售价从9.9万元降至3.9万元人民币 新版本具备强市场竞争力 预计年底前完成量产 [10][11] - 公司机器狗A2自重37千克 持续负载达30千克 空载续航20公里 具备防尘防水性能 [13] - 银河通用G1机器人采用轮式双臂双手形态 已实现自动充电和稳定运行 达到大规模自主商用标准 [19] 技术挑战与突破 - 当前限制机器人执行复杂动作的最大因素是硬件物理极限 而非算法 [14] - 多模态大模型发展受限于数据不足 文本-图像配对数据较少 动作数据更稀缺 [36] - 人形机器人规模化部署的核心瓶颈是完成任务能力不足 需突破目标识别与定位技术 [39] 商业化前景 - 人形机器人市场产值预计三年达1万台 六年达10万台 以每台数十万元计 总产值将突破1000亿元人民币 [43] - 银河通用在北京、上海、深圳等地签约超过100家药店 提供24小时无人药房解决方案 [21] - 公司预计到2024年底将有几十台机器人进入工厂车间实际应用 主要集中于搬运和分拣领域 [48] 行业发展趋势 - 机器人行业人员和出货量有望每年翻倍 未来十年市场规模可能超越汽车和手机产业 [43][46] - 双足设计提供更强通用性 能覆盖上半身所有可达空间 是未来发展方向 [40][41] - 硬件成本不再是商业化主要障碍 具身智能模型的泛用性和实用性成为关键挑战 [45]
黄仁勋像押注OpenAI一样押注中国机器人,英伟达首批Jetson Thor芯片给了他
量子位· 2025-08-11 08:32
英伟达在中国具身智能领域的布局 - 英伟达正在将押注OpenAI的成功经验复制到机器人领域,通过Jetson Thor芯片支持中国机器人公司发展[1][2] - 英伟达与中国多家机器人公司深度合作,包括银河通用、宇树科技、阿里云、北京人形机器人创新中心等[4][6] - Jetson Thor芯片性能显著提升:计算能力达上一代Jetson Orin的7.5倍,每瓦性能提升3.5倍,I/O吞吐量提升10倍[2][30][31] 银河通用的发展路径 - 采用轮式双臂双手形态,主打高续航和工业级安全性,G1机器人已实现大规模自主商用[19] - 率先在中国部署Jetson Thor芯片,机器人展示出丝滑运动性能和实时视觉处理能力[19] - 开发具身智能大模型VLA,实现自然语言交互和复杂环境导航,全球首发无需建图的TrackVLA和抓取基础大模型Grasp VLA[20] - 合成数据占比达99%,与英伟达合作生成百亿级抓取操作和柔性物体操作大数据集[21] - 商业化落地包括100多家无人药房和"太空舱"零售终端,已完成超20亿元人民币融资[23][24] 宇树科技的技术路线 - 认为人形机器人是通用AI的理想载体,未来组装机器人将像组装电脑一样简单[8][10] - 产品线包括售价3.9万元的人形机器人和A2机器狗,后者自重37千克可负载30千克[11] - 机器人登上央视春晚表演全自动编队跳舞,16台机器人实现毫秒级同步[12] - 使用NVIDIA Isaac Sim平台训练动作,已掌握舞蹈、跳跃、空翻等多种动作[13] - 开发20自由度灵巧手,目标实现自然交互如倒水等日常任务[13] 具身智能行业发展趋势 - 具身智能时代发展速度将快于AI大模型产业[7] - 人形机器人市场可能每三年产值增长10倍[6] - 通用机器人有望成为下一个数万亿人民币市场的革命性产品[15][17] - 行业呈现多元化发展路径,包括"运动优先"和"智能优先"不同路线[6] 英伟达的机器人技术架构 - 提出机器人领域需要三台计算机:机器人本体计算机、AI工厂计算机和仿真计算机[28] - Isaac平台整合硬件和软件栈,Jetson Thor是专为机器人设计的"实时推理机器"[29] - 仿真工具包括Isaac Sim、Isaac Lab和NVIDIA Cosmos,用于环境仿真和强化学习[34] - 世界基础模型虽处起步阶段,但已为机器人研发带来全新能力[33]
腾讯研究院AI速递 20250804
腾讯研究院· 2025-08-03 16:01
Anthropic与OpenAI竞争升级 - Anthropic切断OpenAI对Claude API的访问权限,指控其利用Claude工具开发GPT-5违反服务条款[1] - OpenAI回应称API评估竞品能力是行业惯例,对Anthropic决定表示失望[1] - 事件标志AI巨头竞争进入"数据与接口封锁"阶段,API成为战略资源[1] Grok推出短视频生成功能 - Grok Imagine功能向Grok Heavy用户开放,支持一键生成动画/写实风格短视频[2] - 生成速度极快,在X平台引发刷屏效应,被科技公司CEO评价"超出想象"[2] - 马斯克定位为AI版Vine,直接对标谷歌Veo 3产品[2] 谷歌发布IMO金牌模型 - Gemini 2.5 Deep Think模型达到IMO铜牌水平,Ultra订阅价249.99美元/月[3] - 性能超越OpenAI o3和Grok 4,通过扩展并行"思考时间"优化代码/科学/推理能力[3] - 原版模型曾获IMO金牌,新版本速度更快实用性更强[3] Manus推出多Agent并行功能 - Wide Research功能支持100个Agent同时工作,Pro版定价199美元/月[4] - 每个子Agent为完整Manus实例,可自主完成复杂调研并汇总结果[4] - 基于虚拟化基础设施和MapReduce范式,但用户反馈积分消耗过高[4] 开源图像模型技术突破 - FLUX.1-Krea模型专注解决"AI感"问题,通过两阶段训练提升自然细节[5] - 分析指出"AI风格"源于指标过度优化和美学评估偏见[5] - 采用监督微调+人类反馈强化学习针对性改善蜡质皮肤/过曝高光等问题[5] AI育种与数学研究进展 - 华中农大团队在Nature发表AI育种研究,整合组学技术和基因编辑实现精准改良[7] - OpenAI三人团队开发实验性模型,4.5小时完成IMO六题达金牌标准[7] - 模型采用通用强化学习技术,展现自我识别难题能力[7] AI建模与职业影响研究 - 哈萨比斯提出AI可建模所有进化系统,预测2030年AGI概率达50%[8] - 微软研究分析20万对话显示翻译/销售/程序员等职业受AI影响超80%[9] - AI适用性与薪资/学历弱相关,更取决于信息处理领域匹配度[9] 未来社会与AI关系展望 - 凯文·凯利主张将AI视为"异类智能",预测2049年"镜像世界"成为主流社交平台[10][11] - 强调人类价值将因稀缺上升,核心技能是"学会如何为自己学习"[11]