Workflow
空间智能
icon
搜索文档
氪星晚报 |雀巢考虑出售表现欠佳的维生素品牌;特斯拉计划2026年在美国启动建设第三座储能超级工厂;
36氪· 2025-07-24 10:07
百度人事调整与业务布局 - 百度启动新一轮干部轮岗,原智能体业务负责人谢天轮岗至智能驾驶事业群组负责地图事业部[1] - 谢天此前负责百度搜索生态、行业搜索及智能体业务,主要推动AI在垂直领域应用落地[1] - 百度智能云宣布空间智能将覆盖游戏、电商、体育、智能设备等核心产业场景,预计撬动千亿至万亿级市场增量[2] - 百度智能云认为空间智能正从技术探索加速迈入产业规模化落地阶段[2] AI产品动态 - AI设计Agent Lovart全球上线,推出"ChatCanvas"功能可实现基于自然语言的图像区域智能修改[1] - 蚂蚁集团智能体平台"百宝箱"推出企业版,面向文旅、出行等服务业场景,计划2025年覆盖1000家以上客户[3] - 美图旗下Wink上线"全能修复"功能,采用MoE混合专家模型实现影片画质AI修复[6] - 人工智能法律科技企业"百律无忧"完成天使轮融资,资金将用于AI法律服务产品研发[5] 跨国企业战略调整 - 雀巢考虑出售表现欠佳的维生素品牌Nature's Bounty,计划将业务转向高端产品[4] - 特斯拉计划2026年在美国休斯顿附近建设第三座储能超级工厂[4] - 台积电美国亚利桑那州工厂芯片成本比台湾高5%-20%,AMD预计年底前获得首批芯片[4] 行业观点与趋势 - 马斯克称特斯拉Robotaxi服务年底可能覆盖美国一半人口,需等待监管批准[7] - 空间智能技术发展受多模态大模型、3DGC等技术演进推动[2] - 美国拟对逃避特朗普关税的企业和个人采取刑事手段,改变以往罚款为主的处理方式[7]
大疆扫地机器人将于8月发布 或向“空间智能探索者”迈进
南方都市报· 2025-07-23 15:00
大疆进军扫地机器人市场 - 公司首款扫地机器人"ROMO"将于8月6日发布 采用扫拖一体设计 slogan为"实力绝尘" [1] - 项目代号"Ground Space Intelligent Explorer"自2020年启动 体现长期技术储备 [1] 战略布局动因 - 无人机业务专业化程度高 扫地机器人可帮助技术下沉至日常消费场景 [3] - 无人机积累的视觉感知 避障传感器 路径规划 SLAM算法可直接迁移至扫地机器人 [3] - 公司战略定位为"空间智能探索者" 地面空间与空中空间并重 [3] - 瞄准智能家电扩张机遇 2024年全球扫地机器人出货量2060万台 年增11% 中国普及率仅5%-6% [3] 市场竞争格局 - 将直接与云鲸智能竞争 后者由大疆关联人物李泽湘担任副董事长 [4] - 云鲸2024年新品逍遥001已服务全球200万家庭 连续5年保持单品第一 [4] - 大疆创始人汪滔与云鲸创始人张峻彬存在师承同源关系 [4]
无线合成数据助力破解物理感知大模型数据瓶颈,SynCheck获顶会最佳论文奖
机器之心· 2025-07-23 08:57
无线感知与合成数据技术 - 无线感知技术通过捕捉无线信号的反射特性,突破传统感官限制,实现无感监测与精准解析,重塑人机交互边界 [1] - 无线感知使机器能够感知墙壁后的动静、数米外的动作及人类难以察觉的微妙变化 [1] 大模型与物理世界交互 - 构建能够理解物理原理(如电磁场、光学、声学)并与物理世界交互的大模型面临数据稀缺挑战 [2] - 语言和视觉大模型可从海量文字和视频数据中学习,但物理世界交互数据采集难度大,难以支持大模型训练需求 [2] SynCheck 合成数据解决方案 - 北京大学与匹兹堡大学团队提出 SynCheck,通过生成与真实数据质量相近的合成数据解决数据稀缺问题 [3] - 研究提出两个创新质量指标:亲和力(衡量与真实数据的相似度)和多样性(评估覆盖真实数据分布的范围) [5] - 现有无线合成数据普遍存在亲和力不足问题,导致标签错误和任务性能下降 [9] 合成数据质量评估方法 - 研究通过贝叶斯分析和性能指标建立理论支撑的通用评估框架,引入“边际”概念实现跨数据集公平比较 [7] - 动态校正合成数据分布偏差,使模型性能保持稳定提升,最佳情况下性能提升达12.9% [13][15] 合成数据应用与性能突破 - 采用半监督学习框架结合合成与真实数据,过滤低亲和力样本并分配伪标签,无需修改生成模型流程 [11] - SynCheck 在质量无关方法导致性能下降13.4%的最坏情况下仍能实现4.3%的性能提升 [13] 学术界观点与未来方向 - 学术界对合成数据存在分歧,部分学者警示“模型崩塌”风险,另一部分认为验证器机制可规避风险 [17] - 研究团队未来将推动无线大模型训练范式革新,探索多元数据源融合及通用预训练框架 [18]
具身智能前瞻系列深度一:从线虫转向复盘至行动导航,旗帜鲜明看好物理AI
国金证券· 2025-07-22 08:17
报告行业投资评级 未提及 报告的核心观点 报告认为具身智能发展处于早期,当前缺乏模拟学习能力,物理AI是构建模拟学习的核心;世界模型约等于空间智能加物理AI;建议重视3D数据资产和物理仿真引擎双主线,看好中国物理AI稀缺资产索辰科技 [4][37]。 根据相关目录分别进行总结 从生物智能五阶段映射具身智能,模拟、规划能力是当前缺失环节 - 阶段一(关联性学习):生物智能起源于早期两侧对称生物学会“行动导航”,如线虫学会“转向”,“行动导航”是扫地机器人落地前提;早期两侧对称生物具备两侧对称结构、效价神经元、大脑和“情感”雏形;“关联性学习”是对未来初步“预测”的前提 [10][11][13]。 - 阶段二(强化学习):早期脊椎动物学会“试错”,构成“强化学习”基础;“基于预期奖励的时序差分强化学习”有助于缩短试错时间、建立更长预测时间窗口;该机制形成涉及时间感知和空间感知 [15][17][18]。 - 阶段三(模拟学习):早期哺乳动物学会“规划”,即“模拟学习”;构建基于模型的强化学习困难,因真实世界动作连续、信息嘈杂不完整、奖励复杂;大鼠在“不确定性”情况下触发模拟 [22][24][29]。 - 阶段四(模仿学习):灵长类动物学会“模仿学习”,映射到具身智能,“模仿学习”分为“主动教学”与“逆向强化学习”两种策略 [32]。 - 阶段五(语义处理):人类掌握“语言”,形成大规模协作;具身智能产业中,模拟学习应用相对初级,未来拥有3D空间智能的机器人具备“仿真”能力后将进化为硅基生命 [35][36]。 复盘智能驾驶模型算法演绎历史,世界模型≈空间智能+物理AI - 智能驾驶VS具身智能:智能驾驶是具身智能现阶段落地可行性及商业闭环被验证的场景,众多人形机器人核心创始团队有智能驾驶从业经验;智能驾驶“反物理交互”,人形机器人需高频“物理交互” [37][41]。 - 从特斯拉FSD说起:特斯拉FSD智能驾驶算法经历“模块化”规则驱动算法、感知模块引入BEV+OCC架构实现“端到端”、追求“一段式端到端”三个阶段;VLM、VLA等慢思考模型逐渐发展成熟 [44][46][53]。 - 谈及世界模型、物理AI:世界模型约等于空间智能加物理AI,英伟达Cosmos侧重视频世界模型;空间智能核心是让模型理解3D空间信息,获取3D空间数据有真实数据采集与仿真合成数据两条路线;物理AI解决机器人与物理世界交互及“缺数据”难题 [66][71][77]。 重视3D数据资产+物理仿真引擎双主线,看好中国物理AI稀缺资产索辰科技 - 群核科技:推出空间智能平台Spatial Verse,为空间智能算法提供产业级工具;2024年前三季度营收5.53亿元,经调整亏损率收窄至17%;毛利率持续提升,业务以订阅收入为主 [80][84][86]。 - 索辰科技:发布索辰开物平台,将发布“机器人虚拟训练平台”;2024年营收3.79亿元,2020 - 2024年营收CAGR达23.7%;业务分工程仿真软件与仿真产品开发两部分,研发投入强度较高 [92][95][100]。
公司成立仅7个月!90后CMU博士融资1.05亿美元!
机器人大讲堂· 2025-07-19 03:40
公司概况 - Genesis AI是一家专注于通用机器人基础模型及横向机器人平台开发的初创公司,近期获得1.05亿美元种子轮融资[1] - 公司由卡内基梅隆大学机器人学博士周衔与前Mistral研究科学家Théophile Gervet于2024年12月联合创立,总部位于硅谷和巴黎[3] - 创始团队来自Mistral AI、英伟达、谷歌、CMU、MIT、斯坦福等知名企业和高校[21] 融资与投资方 - 种子轮融资1.05亿美元,投资方包括Khosla Ventures、Eclipse Ventures、埃里克·施密特、法国国家投资银行、HSG和泽维尔·尼尔[4] - Khosla Ventures由Sun Microsystems联合创始人维诺德·科斯拉创立,管理资产超过20亿美元[5][8] - Eclipse Ventures管理资产超过20亿美元,投资组合包括70家公司,合作伙伴来自特斯拉、苹果、英特尔等行业巨头[8] - 泽维尔·尼尔是法国电信大亨,2024年财富425亿元,2025年增至555亿元,近期加入TikTok母公司字节跳动董事会[13] 技术方向与产品规划 - 计划构建通用机器人框架模型,通过自有模拟堆栈生成合成数据,统一多模态生成建模与大规模真实机器人数据收集[14] - 开发可扩展数据引擎,结合现实世界机器人交互与模拟渲染,训练可控制任何机器人执行任何任务的通用模型[17] - 将开源数据引擎和基础模型的部分组件给开发者、研究人员和合作伙伴[17] - 提出物理人工智能概念,旨在将人类水平智能引入物理世界,解决75%全球公司面临的招聘困难问题[22] 行业背景 - 物理人工智能被认为是实现AGI的关键环节,Genesis AI并非唯一提出相关概念的公司[24] - 2024年4月智澄AI首次提出"物理智能"概念,旨在解决传统机器人预设规则依赖和泛化能力弱的问题[24] - 2024年5月李飞飞团队提出"空间智能"概念,聚焦空间理解和感知能力[26] - 机器人行业正加速迭代,通用模型研究成为重要发展方向[26] 创始人背景 - 周衔毕业于新加坡南洋理工大学机械工程系,CMU机器人研究所博士,师从Pham Quang Cuong和I-Ming Che,研究方向包括世界模型、模仿学习和强化学习[18] - 曾在Meta AI和MIT-IBM人工智能实验室从事研究工作[18] - Théophile Gervet是前Mistral AI研究科学家,Skild AI创始成员,在人工智能领域经验丰富[21]
AI 编程冲击来袭,程序员怎么办?IDEA研究院张磊:底层系统能力才是护城河
AI前线· 2025-07-13 04:12
多模态智能体的新时代 - 实现智能体"看懂、想透、做好"需整合视觉、语言推理与物理执行能力,是多模态过程的核心挑战 [2] - 视觉理解因输入维度高(如连续视频流)、三维结构建模复杂且需结合交互知识,成为技术突破难点 [3] - 生成模型依赖理解模型评估质量,理解与生成深度耦合,强化学习中的reward model本质是理解能力体现 [4] - 空间智能对机器人操作至关重要,当前VLA模型因缺乏物体精确定位,操作成功率远未达实用水平 [5] - 视觉领域三维表示方法未统一,斯坦福主张采用三维内部表示以提升模型预测能力 [7] 技术落地路径 - 制造业"AI+机器人"落地需平衡通用性与精准度,汽车生产线上下料等半结构化场景是可行突破口 [7] - 危险操作场景优先落地,通过遥操作结合智能逐步迭代,家庭等开放环境需5年以上技术积累 [8] - 从结构化到半结构化场景过渡(如产线灵活操作)是机器人技术渐进式商业化关键路径 [8] 工业界研究策略 - 工业界研究需构建"研究价值-应用价值"坐标系,右上角(双高价值)为理想目标,避免纯论文导向 [11] - 目标检测等基础问题仍有突破空间,需坚持解决实际难题而非追逐热点 [12] - 产品与研究节奏差异显著,研究人员需开放探索空间,管理者应协调两种模式避免强制同步 [13] - OpenAI案例显示技术成熟后需转向工程化集中攻关,但研究支撑仍是底层基础 [14] 人才能力建设 - 计算机基础能力(如分布式系统、GPU架构)比大模型调参经验更关键,系统级优化能带来2-3倍效率提升 [16][17] - 年轻从业者应专注底层能力(代码、并行计算),避免成为"调参侠",系统理解力是团队稀缺资源 [17][18] - 计算机专业仍具长期价值,AI冲击的是基础编码岗位,需通过AI协作提升编程深度与不可替代性 [19]
上海浦东:聚焦关键技术 推动减速器、灵巧手、控制器等一批重点零部件企业在浦东快速集聚
快讯· 2025-07-10 03:39
人工智能产业布局 - 上海浦东新区将紧盯创新技术、满足创新需求、集聚优质人才,优化人工智能产业生态并打造产业高地 [1] - 浦东聚焦具身智能、空间智能、机器人本体三大关键技术领域实现创新突破 [1] 具身智能赛道 - 国地人形机器人创新中心已发布生成式机器人运动大模型 [1] - 宝信工业大脑等主体正强化多模态交互能力和场景应用 [1] 空间智能赛道 - 浦东将攻克多模态感知、空间计算、融合孪生等前沿技术 [1] - 国内领先的视觉处理芯片、超大规规模动态时空数据融合分析平台、知名AR眼镜等技术集中在浦东 [1] 机器人本体领域 - 浦东已有十余家机器人本体企业 [1] - 将推动减速器、灵巧手、控制器等重点零部件企业在浦东快速集聚 [1]
两张图就能重构3D空间?清华&NTU利用生成模型解锁空间智能新范式
量子位· 2025-07-09 01:18
3D语言场景生成技术突破 - 提出LangScene-X生成式框架,仅需2张图像即可构建3D语言嵌入场景,相比传统NeRF方法所需的20个视角大幅降低输入要求 [2][4] - 攻克传统方法依赖密集视图的痛点,实现多模态信息统一建模,为空间智能领域开辟新路径 [3][5] - 模型能模拟人类认知方式,通过稀疏视觉输入建立融合语言理解的3D空间系统 [4] 传统3D语言场景生成痛点 - 密集视图依赖:传统方法如NeRF在仅2-3张输入时物体边界模糊率超40%,而真实场景获取密集视图成本高昂 [5] - 跨模态割裂:现有方法处理外观/几何/语义时模块独立,导致ScanNet测试中法线与RGB一致性误差达27.3° [6] - 语言特征压缩瓶颈:CLIP的512维特征直接嵌入导致内存占用高,场景切换时文本查询准确率下降58% [7] LangScene-X核心技术方案 - TriMap视频扩散模型:四阶段训练实现RGB/法线/语义协同生成,仅2张输入时法线-RGB误差降至8.1°,语义边界准确率提升63% [8] - 语言量化压缩器(LQC):通过向量量化将CLIP特征压缩为3维索引,重建误差仅0.0001,跨场景迁移无需微调 [10][11] - 语言嵌入表面场:渐进法线正则化使3D表面重建误差显著降低,"冰箱"查询中表面重合度达91.7% [12] 模型架构创新价值 - 单模型统合多模态生成,消除传统模块化流程低效问题,确保3D空间一致性 [14] - 语言量化压缩器实现高维特征跨场景泛化,内存占用减少90% [10][14] - 语言嵌入表面场技术实现文本与3D场景精准对齐,如"stuffed bear"可精确定位关联区域 [15] 实证性能表现 - LERF-OVS数据集上mAcc达80.85%(+31.18%),mIoU达50.52%(+10.58%) [16] - ScanNet数据集mIoU达66.54%,超越现有方法14.92%,分割掩码边界锐利度超越人工标注 [16] 应用前景 - 技术可应用于VR场景构建、人机交互、自动驾驶及具身智能等领域 [18] - 提供底层技术范式,具备成为空间智能核心驱动力的潜力 [18]
空间智能率先落地国民APP!实测:时空决策很顺滑,直达千人N面出行体验
量子位· 2025-07-07 06:13
空间智能技术落地 - 空间智能技术已具备实际应用条件,可围绕时间和空间进行预测推理,应用于世界模型、XR设备、自动驾驶及具身智能机器人等领域 [1] - 导航地图APP是空间智能最直接的落地场景,因其天然具备时空预测需求 [2] - 高德地图率先推出AI内测版,通过智能体"小高老师"实现时空动态决策,标志空间智能进入国民级应用阶段 [3][60][67] 小高老师智能体功能 - 实时响应复杂需求:根据用户时空状态提供出行/生活服务方案,整合多APP功能,如推荐避暑独处地点并直接调用导航 [3][5][6] - 多模态交互:支持语音/文字输入,输出包含路线规划、红绿灯数量、堵车预警等细节,并一键跳转导航 [15][47] - 场景化服务:覆盖旅游规划(如北京三天游)、特种兵行程(7天跨城)、本地探索(南锣鼓巷相邻景点推荐)及日常购物(童装/运动风店铺推荐) [9][27][31][33][40] - 深度细节支持:提供出片地点的最佳天气、穿搭色系、隐藏机位等专业建议,如青岛日落前2小时拍摄提示 [23][24] AI导航技术升级 - 超视距感知能力:通过视觉语言模型预测多路口红绿灯状态,计算最优车速实现连续绿灯通行,并预判事故/施工占道 [55] - 车道级动态优化:高速场景下实时感知车流变化、事故占道,推荐全局最优车道,提供变道决策支持 [57] - 安全预警系统:夜间或弯道等场景预判行车风险,如急刹车、大货车超车预警,通过语音/画面提醒 [57][59] 高德AI化底层逻辑 - 从工具型应用到时空决策智能体:基于实时位置、动态路况及用户意图输出唯一性方案,如安静看书到热闹商场的动态切换 [61][62] - 技术挑战突破:解决高维噪声数据实时处理(毫秒级决策)、多目标优化(权衡冲突目标)等难题 [63] - 生态优势:8亿月活用户提供海量交互数据,端侧场景天然适配实时空间决策需求 [65][66] 行业意义 - 空间智能价值验证:高德通过出行场景证明技术可落地性,推动数字与物理世界融合 [68][72] - 行业独特性:交通数据生态与AI技术结合形成壁垒,其他厂商难以复刻 [70] - 未来方向:从"怎么去"升级为"适合去哪里",实现千人千面甚至"一人N面"的个性化服务 [59][69][71]
前瞻全球产业早报:特朗普称各国将于8月1日开始支付新关税
前瞻网· 2025-07-07 05:19
极氪电驱技术 - 极氪将在7月9日推出全球首个基于纯电架构的豪华超级电混架构浩瀚-S(SEA-S)[2] - 浩瀚-S是全球首个全栈900伏高压混动架构[2] 淘宝补贴计划 - 淘宝启动500亿元补贴计划 为期12个月直补消费者及商家[3] - 补贴上线后餐饮连锁品牌和中小商家生意环比增长170%和140%[3] 人工智能与手机市场 - 李飞飞提出空间智能是AI下一个前沿领域[4] - 2025年5月国内市场手机出货量2371.6万部 同比下降21.8% 其中5G手机占比89.3%[4] 特斯拉香港调价 - 特斯拉下调香港Model 3售价 部分车型税后折扣最高达18%[5] - Model 3入门版配合"一换一"计划后售价低至24.9万港元[5] 腾讯产品升级 - 腾讯元宝搜索能力升级 支持呈现图片与视频号内容[6][7] - 微信优化聊天记录备份功能 支持自动备份至外部存储设备[9] 消费电子动态 - 苹果第二季度在华iPhone销量同比增长8% 为2023年以来首次增长[8] - 小鹏G7正式上市 三个版本售价19.58万-22.58万元[10] - 比亚迪汉家族全球交付累计超100万辆[11] 国际企业与政策 - 波音获得28亿美元美国卫星合同 涉及两颗卫星[14] - 特朗普称各国将于8月1日开始支付新关税 税率可能10%-70%[11] - 日本"春斗"工资整体涨幅5.25% 平均每月增加16356日元[12] 人工智能与芯片 - 微软推迟第三代AI专用芯片至2028年后 Maia 200芯片推迟至2026年[16] - CoreWeave成为首家部署英伟达Blackwell Ultra AI芯片的云服务商[18] - 马克·库班预测AI将造就全球首位万亿美元富豪[15][16] 融资与IPO动态 - 东链炬达完成500万元天使轮融资[18] - 山东华启教育完成1500万天使轮融资[19] - 江阴华新精密获证监会同意沪市主板IPO注册[20] - 深圳承泰科技向港交所提交上市申请[21] 企业运营调整 - UPS首次向美国全职司机提供自愿买断方案[17] - 英国试验显示四天工作制对企业盈利有利 17家机构保留该制度[13]