Workflow
NavFoM
icon
搜索文档
融资超3亿美元,估值超30亿美元!“北大系”人形机器人公司银河通用刷新具身智能单轮融资纪录
华尔街见闻· 2025-12-19 09:17
核心融资与估值 - 银河通用完成超3亿美元新一轮融资 刷新具身智能领域单轮融资纪录 [1] - 本轮融资由中国移动链长基金领投 中金资本、中科院基金、苏创投、央视融媒体基金、天奇股份等联合注资 并吸引新加坡及中东国际投资机构参与 [1][2] - 融资完成后公司估值达到30亿美元(约211.3亿人民币) 在短短半年内估值翻了三倍(此前一轮估值约10亿美元) [1][5] - 公司累计融资额已达约8亿美元 [1] 投资方背景与战略意义 - 投资方结构显示明显的“国家队”与产业链协同特征 产业资本的注资被视为对公司技术路径及规模化能力的背书 [2] - 宁德时代在2024年6月的领投 使公司成为目前唯一获得该动力电池巨头投资的具身智能大模型企业 [2] - 战略投资方将为公司产业化发展提供全场景赋能 加速在工业、商业及家庭场景的布局 [2] - 新加坡和中东资金的入局 被视为公司拓展全球市场的信号 [2] 技术路线与产品进展 - 公司采用仿真合成动作数据集预训练、真实数据后训练的范式 宣称已实现从“百亿数据集”到“具身大模型”再到“机器人本体”的全栈自研 [3] - 2025年1月推出基于十亿级仿真合成动作数据预训练的端到端抓取基础大模型GraspVLA 旨在实现零样本泛化能力 [3] - 后续发布了面向零售的GroceryVLA、导航大模型NavFoM以及灵巧手神经动力学模型DexNDM [3] - 在世界人形机器人运动会上 其Galbot机器人队在零遥操作情况下实现全自主运行并夺冠 [3] 商业化落地与订单 - 在工业制造领域 已与宁德时代、博世集团、丰田汽车、韩国现代、北汽集团、上汽集团、极氪汽车、长城汽车等企业达成合作 [3] - 公司累计订单规模已达数千台 并实现了人形机器人进厂真实自主干活 [3] - 在商业服务与即时零售领域 推出“银河太空舱”解决方案 已在北京颐和园、王府井等商圈落地 [4] - 2024年底与爱博医疗合作推出24小时智慧医疗门店 在北京地区近十家门店实现常态化运营 [4] - 在医疗康养方面 正与宣武医院等医疗机构合作 推动机器人在病房辅助和药房管理等场景应用 [4] 资本运作与上市计划 - 公司已于2024年11月28日完成股份制改革 目前正在筹备赴港上市 [1] - 最早可能在2025年首季向港交所递交申请 目标估值在30至40亿美元之间 [1] - 公司官方回应称股改是为完成后续正常融资需求 引入新的一级市场投资人 [6] - 行业趋势显示头部创企正在集体加速证券化进程 2024年以来已有宇树科技、乐聚机器人、云深处、智元机器人等五家企业完成股改 [6] - 宇树科技已于2024年11月完成上市辅导 进入正式申报阶段 [6]
人形机器人最大融资背后,还拿下7亿大单
36氪· 2025-12-19 06:11
银河通用机器人新一轮融资与行业动态 - 银河通用完成新一轮融资,规模超过3亿美元(约合超21亿元人民币),投后估值超过30亿美元(超200亿元人民币),刷新了国内人形机器人赛道的单笔最大融资额和估值天花板[1] - 本轮融资由中国移动链长基金领投,投资方包括中金资本、中科院基金、苏创投、央视融媒体基金、天奇股份等国内平台及产业巨头,以及新加坡和中东的国际投资机构,股东生态呈现多元化与国际化[1] - 公司累计融资金额已达约8亿美元(合56亿人民币),半年前该数字仅为24亿元,且另有未公布的大额融资[1] 大额订单与商业化进展 - 银河通用已与某单一产业方签订一笔G1机器人采购合同,规模达1000台,按约70万元单价计算,合同金额达7亿元[1] - 对比行业,宇树和智元两家头部企业2025年营收预计在10亿元左右级别,此7亿元订单是促成刷新纪录融资的直接原因之一[2] - 公司已获得包括宁德时代、博世集团、丰田汽车、韩国现代、北汽集团、上汽集团、极氪汽车、长城汽车等制造业龙头的千台级订单[3] 投资方背景与战略意图 - 领投方中国移动链长基金锚定AI+、人形机器人等核心赛道,近期投资的具身智能企业包括银河通用和戴盟机器人,更早前也为智元、宇树提供代工订单[4] - 中金资本近期领投松延动力近2亿元融资,其投资偏好显示被投公司可能是IPO种子选手;银河通用已完成股改,但公司否认了明年一季度以40亿美元估值赴港IPO的传闻[5] - 中科院基金可提供核心算法与本体设计支持;苏创投曾牵头发起100亿元具身智能基金,投资策略为“抓两头”,即头部公司与快速落地案例[5][6] - 央视融媒体基金投资了云深处、松延动力等公司;天奇股份与银河通用深度绑定,共同设立合资公司,并计划与富士康新能源合作在5年内部署不低于2000台具身智能机器人[6] 国际资本参与与行业红利 - 中东资本对中国机器人资产热情高涨,近期案例包括沙特阿美旗下基金投资地瓜机器人、迪拜磊石资本投资众擎机器人,以及阿布扎比背景机构为优必选提供10亿美元融资授信[7] - 中东国家的“2030愿景”等转型规划,通过设立百亿乃至千亿美元体量的基金在全球寻找优质科技资产,为中国机器人企业带来了红利[7] - 新加坡投资机构也出现在银河通用本轮新增股东名单中[7] 公司技术产品与市场地位 - 以超200亿元人民币估值计,银河通用成为目前国内估值最高的人形机器人公司[8] - 产品重点布局工业制造、即时零售、医疗康养等领域,已在部分场景实现7X24小时持续稳定运营1年[8] - 发布了行业首个面向零售的具身智能大模型GroceryVLA、导航大模型TrackVLA,以及全球首个跨本体、全域环视的导航基座大模型NavFoM,突破了复杂动态场景下的“小时级长程导航”[8] - 在灵巧操作方面,通过灵巧手神经动力学模型DexNDM,让机器人能应对极长、极小物品的精密操作[9] - 核心技术路径为“Sim-to-Real”(仿真到现实),通过虚拟环境训练机器人后迁移至现实,迭代速度快,但需应对现实物理世界的复杂性挑战[9] 行业融资趋势与投资逻辑演变 - 具身智能是过去一年多以来凝聚最多共识的赛道之一,但非共识依然存在,格局变得更加复杂[9] - 头部公司能占据行业全年融资额的四成,获得融资的企业数量和融资规模同比继续大涨[10] - 投资逻辑已从“看人、看技术、看路线”逐渐过渡到“看格局、看规模、看确定性”,资源向头部集中,投资人风险意识增强,倾向抱团投资[10] - 赛道依然亢奋,资源链接能力在增强,头部公司处于卖方市场,但“无脑”热钱已不多,公司需持续融资以留在牌桌上[11]
独家丨人形机器人最大融资背后,还拿下7亿大单
投中网· 2025-12-19 04:36
银河通用刷新融资与估值纪录 - 银河通用完成新一轮融资,规模超过3亿美元(约合超21亿元人民币),投后估值超过30亿美元(超200亿元人民币),刷新了国内人形机器人赛道的单笔最大融资额和估值天花板[3] - 截至目前,公司累计融资金额已达约8亿美元(合56亿人民币),半年前该数字仅为24亿元[3] - 公司已与某单一产业方签订一笔G1机器人采购合同,规模达1000台,按单价约70万元计算,合同金额达7亿元[3] 投资方阵容多元化与国际化 - 本轮融资由中国移动链长基金领投,投资方包括中金资本、中科院基金、苏创投、央视融媒体基金、天奇股份等投资平台及产业巨头,并获新加坡及中东国际投资机构注资[3] - 与上一轮由宁德时代和溥泉资本领投的融资相比,本轮投资方更多元化,引入了中东资本及中国移动等央企,旨在构建国际化股东生态[3] - 中国移动链长基金聚焦AI+、人形机器人等核心赛道,近期投资的具身智能企业包括银河通用和戴盟机器人[7] 大额订单推动商业化与市场信心 - 银河通用获得的7亿元订单,直接促成了刷新纪录的融资[4] - 近期人形机器人行业大额订单频现:优必选与广西防城港签订2.64亿元合同,宇树和智元联合中标中国移动1.24亿元代工合同[4] - 银河通用已拿下包括宁德时代、博世集团、丰田汽车、韩国现代、北汽集团等在内的千台级订单,其中宁德时代是其目前唯一投资的具身智能企业[5] 新晋投资方的战略意图 - 中金资本作为财务投资机构,其投资偏好暗示被投公司可能是IPO种子选手[7] - 中科院基金可为银河通用提供核心算法和本体设计支持,其“格物”与公司的仿真数据训练技术路线存在协同[8] - 苏创投作为苏州国资管理人,其入局与银河通用在苏州落地“3中心+1基地”合作体系相关,且苏创投牵头发起了100亿元的具身智能基金[8] - 央视融媒体基金投资了云深处、松延动力等机器人公司,推断马年央视春晚将少不了机器人[8] - 天奇股份与银河通用深度绑定,共同设立合资公司,并计划5年内与富士康新能源合作部署不低于2000台具身智能机器人[9] 国际资本特别是中东资本的涌入 - 中东资本对中国科技资产,尤其是机器人热情很高,本轮融资中传闻已久的中东资本终于落地[3][9] - 中东资金近期加码中国机器人:地瓜机器人获沙特阿美旗下风投基金投资;迪拜磊石资本投资众擎机器人;阿布扎比背景机构为优必选提供10亿美元融资授信[9] - 中东国家的“2030愿景”、“AI战略2031”等转型规划,通过设立百亿甚至千亿美金体量基金在全球寻找优质科技资产,为中国机器人企业带来红利[10] 公司的技术突破与产品布局 - 银河通用成为目前国内估值最高的人形机器人公司,估值超200亿元人民币[11] - 产品重点布局工业制造、即时零售、医疗康养等领域,已在一些场景实现7X24小时持续稳定运营1年[12] - 发布行业首个面向零售的具身智能大模型GroceryVLA和导航大模型TrackVLA,以及全球首个跨本体、全域环视的导航基座大模型NavFoM,突破了“小时级长程导航”以实现复杂动态场景下的自主导航[12] - 发布灵巧手神经动力学模型DexNDM,通过基于训练的控制算法让灵巧手能应对各种精密操作[12] - 公司核心逻辑是“Sim-to-Real”(仿真到现实),通过虚拟环境训练机器人后迁移到现实,优势是迭代极快[13] 行业融资趋势与头部集中化 - 具身智能是过去一年多以来凝聚了最多共识的赛道之一,但非共识依然存在且格局复杂[13] - 根据投中嘉川CVSource数据,头部公司能占据行业全年融资额的四成,行业整体创业活跃度不减,获融资企业数量和规模同比继续大涨[13] - 行业资源正加速向头部集中,投资方的风险意识增强,投资逻辑从看人、看技术过渡到看格局、看规模、看确定性[14] - 近期融资规模较大的机器人公司股东名单更长,显示赛道依然亢奋且资源链接能力增强,但“无脑”热钱已不多,头部公司仍是卖方市场[14]
如何构建通用具身导航大模型?
具身智能之心· 2025-11-20 00:03
通用导航大模型研究背景与行业痛点 - 当前具身智能的导航研究多受限于特定任务与特定机器人平台,阻碍了通用智能的发展[2][5] - 面对非结构化、高动态环境以及需要语言理解的复杂任务,传统导航系统已难以满足需求[2] - 导航大模型的出现将导航算法从专用能力拓展至通用智能移动能力,为具身智能落地开启新路径[2] 核心模型技术演进 - 跨任务导航大模型Uni-NaVid旨在突破任务局限性[2][5][6] - 跨本体导航大模型NavFoM进一步实现了跨机器人平台的通用性[2][5][6] - 技术演进路径从解决跨任务问题推进到解决跨本体问题[2][5] 实际应用场景 - 模型技术已成功应用于视觉避障、城区微出行与智能跟随等实际场景[2][5] - 具体落地应用案例包括TrackVLA++、UrbanVLA和MM-Nav[6] - 应用场景覆盖从室内避障到室外城区出行等多个领域[2][5][6]
银河通用全新模型统一机器人导航任务,7B参数模型支持实时部署
具身智能之心· 2025-11-10 00:02
文章核心观点 - 提出NavFoM模型,旨在构建一个跨任务和跨本体的具身导航基座大模型,实现导航能力从“专用”到“通用”的技术跃进 [1][3][29] - 该模型统一了不同机器人的导航范式,通过“视频流+自然语言指令”预测动作轨迹,支持多任务、全场景和跨本体的应用 [3][29] - 模型在多个公开基准测试中实现了SOTA或可比拟SOTA的效果,且无需针对特定任务或机器人进行微调 [16][29] 统一导航范式 - 将不同机器人的导航任务统一为“机器人采集的流式视频 + 自然语言导航指令 -> 动作轨迹”的范式 [3] - 使用文本指令描述导航目标,用视频流表达导航历史,模型预测未来运动轨迹 [3] - 支持多任务(视觉语言导航、目标搜索、目标跟随、自驾)、全场景(室内、室外)和跨本体(四足、轮式、人形、无人机、汽车) [3] 模型架构与技术特点 - 采用TVI Tokens,通过端到端学习得到时间和角度两个系数,以兼容不同本体的相机设置(单目、环视等) [5][8] - 支持基于图像的问答和基于视频的问答混合训练,使模型保留对开放世界的理解能力,避免过拟合到导航任务 [9] - 采用双分支结构:导航任务时通过规划头输出由路径点组成的轨迹;问答任务时通过语言模型头进行下一个词预测 [9] 实时部署优化 - 提出预算感知的令牌采样策略,在有限算力约束下自适应采样关键帧,以支持7B参数模型的实时部署 [6][10] - 该策略基于遗忘曲线,越靠近当前帧采样概率越大,能根据视频帧数和令牌上限自适应调整分布 [10][11] - 实现了稳定的运行效率,具备处理长程导航任务和在真实机器人上高效运行的潜力 [11] 训练数据规模 - 训练数据量达800万条,涵盖视觉语言导航、目标导航、目标跟踪、自动驾驶、网络导航数据,涉及轮式机器人、四足机器狗、无人机和汽车 [12] - 额外使用了400万条开放世界的问答数据 [12] - 训练数据量是以往工作的约两倍,并通过图像缓存技术减少训练硬件需求 [15] 算法性能表现 - 在多个公开基准测试(涵盖不同任务和不同本体)上实现了SOTA或可比拟SOTA的效果 [16][29] - 无需对特定任务或机器人进行微调,仅通过修改指令和相机布局即可适配 [16] - 能够用同一套模型实现机器狗、轮式机器人、无人机的跟随任务 [19] 扩展应用验证 - TrackVLA++:在复杂环境中实现30分钟以上的稳定长程跟随 [23] - UrbanVLA:支持第三方地图引导的机器人自主城市出行 [25] - MM-Nav:实现360度纯视觉精确避障 [27]
计算机行业周报:Kimi K2 Thinking引领国产基模新突破-20251109
国金证券· 2025-11-09 12:29
投资建议与核心观点 - 报告建议关注国内生成式大模型龙头科大讯飞 [3] - AI硬件作为应用落地新载体,建议关注海康威视、虹软科技、禾赛等 [3] - AI功能打磨有望提升付费率与Arpu值,建议关注迈富时等 [3] - 计算机板块处于主业回暖改善与AI应用落地加速的周期,基本面强度对市值贡献度提升 [12] - 2025年行业景气方向在出海与国产替代,板块行情预计分化 [4][12] 行业近期动态与技术进展 - 月之暗面于11月7日开源推理增强模型Kimi K2 Thinking,为1T总参数、32B激活参数的稀疏混合专家模型,采用量化感知训练与INT4权重量化以提升性能 [4][12] - 银河通用、北京大学及浙江大学等于11月5日提出跨本体导航大模型NavFoM,采用TVI Tokens与BATS策略统一机器人导航任务 [4][12] - 小鹏汽车于11月6日发布新一代人形机器人IRON,身高1.78米,体重70公斤,拥有65个自由度,由自研Xpeng VLA 2.0大模型驱动 [4][12] - 高德地图与小鹏汽车于11月6日达成合作,计划结合空间智能与自动驾驶技术共同提供全球Robotaxi服务 [4][12] 细分板块景气度分析 - 高景气维持赛道:AI算力、激光雷达(1-9月国内ADAS激光雷达装机量约190.9万颗,YoY +91.8%) [12][13] - 加速向上赛道:AI应用、金融IT [12][13] - 稳健向上赛道:软件外包、量子计算、数据要素、EDA、出海、信创 [12][13] - 拐点向上赛道:教育IT、网安、企业服务 [12][13] - 底部企稳赛道:智慧交通、政务IT、安防、建筑地产IT [12][13] - 略有承压赛道:工业软件、医疗IT [12][13] 市场表现与数据 - 2025年11月3日至7日,计算机行业指数(申万)下降2.54%,跑输沪深300指数2.56个百分点 [14] - 同期A股日均成交额为2.0万亿元,同比上升17.9%,环比下降13.5% [20] - 截至2025年11月6日,两融余额为2.5万亿元,同比上升36.4% [20] 未来重点事件 - 2025中国机器人产业发展大会将于11月10-12日在上海举行 [26] - 第二十七届中国国际高新技术成果交易会将于11月14日在深圳举办,预计展示面积40万平方米 [26]
银河通用全新模型统一机器人导航任务,7B参数模型支持实时部署
量子位· 2025-11-09 07:01
文章核心观点 - 北京大学、银河通用等机构合作提出NavFoM,旨在构建一个统一的多任务、全场景、跨本体的具身导航基座大模型,实现导航能力从“专用”到“通用”的技术跃进 [1][3] - 该模型通过统一“机器人流式视频+自然语言导航指令→动作轨迹”的范式,无需为特定任务或机器人进行微调,即可在多个公开基准测试中达到或接近最优性能 [3][16][21] - NavFoM标志着具身智能导航模型研发迈向通用化,是导航技术实现规模化落地的关键点 [20][21] 模型架构与技术创新 - 采用统一架构处理多任务(视觉语言导航、目标搜索、目标跟随、自驾)、全场景(室内、室外)及跨本体(四足、轮式、人形、无人机、汽车)的导航需求 [3] - 引入TVI Tokens,通过端到端学习得到的时间和角度系数来标记图像,兼容不同本体的相机设置(如单目、环视无人机、环视车辆) [5][8] - 采用Dual-Branch结构,规划头用于导航任务输出轨迹,语言模型头用于QA任务输出文字,使单一模型能最优处理两种任务 [9] 实时部署与效率优化 - 针对7B参数大模型在真实场景实时部署的挑战,提出BATS帧采样策略,在有限算力约束下自适应采样关键帧以保持性能与效率 [6] - BATS策略基于遗忘曲线,越靠近当前帧采样概率越大,能根据视频帧数和Token上限自适应调整分布,支持长程导航任务 [10][11] 训练数据与规模 - 在800万条跨任务、跨本体的导航数据(涵盖视觉语言导航、目标导航、目标跟踪、自动驾驶、网络数据)及400万条开放世界问答数据上训练 [12] - 训练数据量是以往工作的约两倍,并通过图像缓存技术减少训练硬件需求 [15] 算法性能与验证 - 在多个公开基准测试(不同任务和不同本体)上实现了SOTA或SOTA可比的效果,且无需针对特定任务或机器人进行微调 [16][21] - 团队进一步通过UrbanVLA(城市出行)、MM-Nav(精确避障)等项目验证了NavFoM作为基座模型在复杂任务下的潜力 [20]
软银与OpenAI成立合资公司;宇树科技王兴兴:当下具身机器人发展阶段类似于ChatGPT发布前的1-3年左右丨AIGC日报
创业邦· 2025-11-06 00:08
AI代理购物与行业竞争 - 亚马逊向AI公司Perplexity发出停止并终止律师函,指控其AI浏览器代理Comet在代理用户购物时未明确披露,构成计算机欺诈并违反亚马逊服务条款 [2] - 亚马逊方面称Perplexity的工具削弱了亚马逊购物体验并带来隐私风险 [2] - Perplexity回应称亚马逊正在用自家竞争产品打压规模较小的对手,用户应有权选择偏好的AI购物代理,并称此为恫吓战术 [2] 机器人导航与基座模型发展 - 银河通用联合多所大学团队推出全球首个跨本体全域环视的导航基座大模型NavFoM,可同时支持室内和室外场景 [2] - NavFoM模型可快速低成本适配机器狗、轮式人形、腿式人形、无人机及汽车等不同尺寸的异构本体 [2] - 宇树科技创始人王兴兴表示,具身机器人当下及未来最关键的核心要素是机器人大模型,目前发展阶段类似于ChatGPT发布前的1-3年左右 [2] 企业战略合作与市场布局 - 软银与OpenAI成立合资公司SB OAI Japan,将在日本独家推广Crystal Intelligence,并计划于2026年上市 [2]
多任务、全场景、跨本体通用移动:银河通用发布环视导航基座大模型
具身智能之心· 2025-11-06 00:03
核心观点 - 公司联合多所高校发布全球首个跨本体全域环视导航基座大模型NavFoM,实现导航技术从碎片化任务模型到统一智能基座的跨越 [3][8][9] - 该模型通过统一范式、多任务支持、跨本体适配等创新,使机器人具备自主感知与决策能力,推动具身智能规模化商业落地 [9][11][29] - 基于NavFoM衍生的应用模型矩阵已在复杂场景中验证实效,标志公司完成从单一功能创新到智能基础设施建设的升级 [27][28][30] 技术架构创新 - 提出TVI Tokens机制,为视觉数据添加时间与视角标记,使模型理解空间连续变化并兼容多类视觉输入方式 [14] - 采用BATS策略动态采样关键帧,在7B参数规模下实现毫秒级响应,兼顾算力限制与决策精度 [17] - 构建1,200万条跨任务数据集(800万条导航数据+400万条问答数据),训练量达以往工作的两倍,覆盖多机器人形态与场景 [21][23] 性能与泛化能力 - 在VLN-CE、HM3D-OVON、NavSim等国际基准中达到或刷新SOTA水平,展现零样本导航与跨任务泛化能力 [25] - 实测支持四足机器人长程自主跟随、轮式机器人室内外混合导航、无人机复杂地形规划等任务,无需微调即可直接部署 [25] 应用模型衍生 - TrackVLA++实现30分钟以上稳定长程跟随,适应室内外多地形复杂路况 [27] - MM-Nav突破360°厘米级纯视觉避障,解决玻璃、细线等传统方案难以处理的极限场景 [28] - UrbanVLA与第三方地图软件打通,实现街道、天桥等室外环境自主路径规划,复杂度超越汽车自动驾驶 [30]
腾讯研究院AI速递 20251106
腾讯研究院· 2025-11-05 16:01
生成式AI与太空计算 - 谷歌宣布Project Suncatcher计划,将于2027年初发射两颗搭载Trillium代TPU的原型卫星,利用太阳能驱动AI计算 [1] - 该计划构想由太阳能卫星星座通过光通信链路相连,太空太阳能效率比地球高8倍且几乎可持续发电 [1] - Trillium TPU已通过辐射测试可承受5年任务周期,预计到2030年代中期卫星发射成本可降至每千克200美元 [1] AI Agent效率优化 - Anthropic发布基于MCP的"代码执行"新范式,让模型编写代码调用工具,将Token消耗从15万降至2000,效率提升98.7% [2] - 新范式采用按需加载工具定义和数据本地流转设计,解决工具定义过载和中间结果消耗两大效率瓶颈 [2] - 该方案带来渐进式披露、上下文高效、强大控制流、隐私保护和状态持久化五大核心优势 [2] 多模态模型与图像编辑 - 兔展智能&北大推出UniWorld-V2图像编辑模型,在GEdit-Bench和ImgEdit基准测试中取得SOTA,综合表现超越OpenAI的GPT-Image-1 [3] - 模型基于首创的UniWorld-R1强化学习框架,采用多模态大语言模型作为免训练奖励模型,实现精准中文字体渲染和精细化空间可控 [3] - UniWorld-R1框架具有极强通用性,应用于其他基础模型时同样带来显著性能提升 [3] 产品集成与用户体验 - QQ浏览器电脑端推出"AI+"小窗功能,以无感悬浮小窗形式集成14种AI工具,从网页总结到订阅下载均可在小窗内完成 [4] - 新版本升级极简框架合并菜单与个人中心,地址栏右侧搜索框支持常驻或隐藏,提供更多自定义操作选项 [4] - 基于精准意图识别,"AI+"小窗能主动推荐可使用的AI功能,包括智能标签整理、AI翻译、订阅助理等多种生产力工具 [4] 地理空间AI应用 - 谷歌升级Earth AI,发布遥感、人口动力学和环境三大基础模型,并推出Gemini驱动的地理空间推理智能体 [5] - 遥感基础模型在文本图像检索任务提升超16%,零样本检测精度达基准线两倍,人口动力学模型覆盖17个国家提供按月更新的人类活动嵌入 [5] - 地理空间推理智能体在问答基准测试中准确率达0.82,显著优于Gemini基线,已为20亿人提供洪水预警服务 [6] 具身智能与机器人 - 小鹏发布第二代VLA大模型和全新IRON人形机器人,VLA模型实现视觉到车辆控制指令的端到端映射,接管里程提升13倍 [7] - IRON机器人拥有82个自由度和22个手部自由度,搭载3颗图灵AI芯片总算力达2250TOPS,为当前人形机器人最高水平 [7] - 小鹏计划2026年推出三款Robotaxi车型启动试运营,总算力3000TOPS,同时推出面向消费者的L4智驾版本 [7] 通用具身基础模型 - Generalist推出具身基础模型GEN-0,参数量达10B+,在27万小时真实世界操作数据上训练,数据量超现有最大机器人数据集数个数量级 [8] - GEN-0首创"和谐推理"训练方法,在异步连续时间的感知和行动token流之间建立和谐相互作用,实现跨机体部署能力 [8] - 研究发现7B参数出现"相变"现象,模型展现强大Scaling Law,证明具身智能可预测扩展 [8] 智能导航技术 - 银河通用联合多高校推出全球首个跨本体全域环视导航基座大模型NavFoM,统一不同导航任务 [9] - 模型训练数据包含800万条跨任务跨本体导航数据和400万条开放问答数据,通过TVI Tokens和BATS策略实现时空理解和实时响应 [9] - 基于NavFoM发布TrackVLA++、UrbanVLA和MM-Nav三个应用模型,构建从室内到城市的完整具身智能导航体系 [9] 创业与组织管理 - ElevenLabs现有350人分为20个产品小队,每个5-10人完全自治,6个月内必须完成PMF,成功继续否则解散 [10] - 公司砍掉Slack访问权强制注意力集中,让团队专注自己的6个月任务,避免信息过载导致的注意力分散 [10] - 提成规则明确落后于公司战略,禁止向竞品出售技术写入政策,销售行为符合长期利益可取消交易但业绩照算 [10]