Workflow
空间智能
icon
搜索文档
即将量产全球首款“空间记忆模组”!「留形科技」完成Pre-A轮融资
机器人大讲堂· 2025-06-14 04:27
融资与公司背景 - 留形科技完成数千万元Pre-A轮融资 投资方包括弘毅投资等 资金将用于核心零部件定制生产 产品规模化交付及市场拓展 [1] - 公司成立于2022年 专注智能三维感知与重建技术 应用于机器人导航 数字孪生 建筑测绘 工业巡检等领域 [1] - 核心团队硕博占比达60% 来自香港大学 卡耐基梅隆大学等顶尖高校 创始人徐威为香港大学MaRS Lab博士 技术战略顾问张富教授曾任职大疆创新顾问科学家 [1] 核心产品与技术 - 留形Odin1为全球首款融合空间感知与记忆功能的模组产品 赋予机器人类似人类"海马体"的空间记忆能力 [3] - 产品采用自研全固态 多传感器深度融合架构及高性能算法 实现多传感器数据高效同步与精准匹配 [3] - 探测距离最达70米 搭载MindCloud平台可对真实环境数据进行高保真3D仿真还原 支持机器人智能决策与算法优化 [5] 市场规划与合作 - 已与多家头部机器人厂商展开合作 计划2025年7月实现Odin1量产 [7] - 未来将拓展建筑测绘 工业巡检 机器人导航等领域的海内外市场 推动空间智能产品全球化布局 [7] - 此前已获真格基金 俊盛投资等机构融资支持 [8]
烧钱一年,李飞飞的「空间智能」愿景有变化吗?
机器之心· 2025-06-13 12:02
创业一年后 World Labs 的愿景 - World Labs 在成立一年内完成两轮融资累计募资2 3亿美元 估值突破10亿美元 成为AI领域独角兽企业 [5] - 公司已发布「世界生成」模型和Forge渲染器等技术成果 其中「世界生成」技术仅需单张图片即可生成可交互3D物理世界 [5][6] - 空间智能被定位为理解重建生成物理世界的核心能力 超越语言模型局限 目标构建可创造无限虚拟宇宙的AI系统 [5][6] - 技术路径依赖跨学科整合(AI+计算机图形学) 当前算力数据工程能力提升使「世界模型」攻关具备可行性 [7] 空间智能对AI完整性的意义 - 语言模型存在三维物理世界描述的天然缺陷 空间智能作为更古老的智能形式可弥补这一关键缺口 [6][8] - 公司技术路线选择与主流LLM分野 专注让AI理解3D物理世界运作方式 涉及机器人设计社交等多领域应用 [5][8] - 空间智能被视为智能的核心组件之一 其突破将推动AI从单一现实向多元宇宙演进 [5][6] 空间智能与多元宇宙愿景 - 「多元宇宙」指通过AI创造无限虚拟宇宙 需依赖3D物理世界的理解与生成能力 [4][6] - 技术反直觉发展体现在:早期忽视3D表征 现通过数据驱动方法实现空间智能突破 [4][7] - Forge渲染器支持Web端实时渲染AI生成3D场景 标志技术落地取得实质性进展 [7] 世界模型的发展现状 - 前置技术如算力提升数据积累工程优化为世界模型创造发展时机 [7] - 公司方法论借鉴LLM的数据驱动和神经网络经验 但强调需结合计算机图形学等跨学科知识 [7] - 下一步重点攻关方向包括3D物理世界的理解重建及生成技术的场景化应用 [4][7]
亿道信息分析师会议-20250612
洞见研报· 2025-06-12 14:57
调研基本情况 - 调研对象为亿道信息,接待时间是2025-06-12,上市公司接待人员有副总经理、董事会秘书乔敏洋和投资者关系专员谢蝶 [17] 详细调研机构 - 接待对象包括国泰海通(证券公司)、创金合信(基金管理公司)、光大永明(其它) [18] 主要内容资料 - 亿道信息是以产品定义、研发设计为核心的智能电子产品及解决方案提供商,业务分加固智能终端和消费类智能终端 [24] - 加固智能终端形态有加固笔记本电脑、加固平板、加固类手持终端及加固类工控产品,应用于智能制造、交通运输等场景,旗下有一站式加固计算机品牌“ONERugged”,未来聚焦工业自动化等领域,线上线下多元化布局全球市场 [24][26] - 消费类产品包括PC、平板、AIoT及XR/AI穿戴类产品,服务品牌及企业客户,旗下亿道数字专注人工智能等领域,吸纳培养复合型创新人才 [25] - 三防加固类产品具备防水、防尘、防摔特性,为应对恶劣环境和复杂工况设计,能在极端条件下稳定运行 [26]
亿道信息(001314) - 2025年6月12日投资者关系活动记录表
2025-06-12 10:40
公司概况 - 公司是智能电子产品及解决方案提供商,核心为产品定义和研发设计 [2] - 业务分为加固智能终端和消费类智能终端 [2] 业务详情 加固智能终端 - 形态有加固笔记本电脑、平板、手持终端及工控产品 [2][3] - 应用于智能制造、交通运输、能源勘探、公共事业等场景 [2][3] - 旗下“ONERugged”品牌提供创新、高效、可靠产品与服务 [3] 消费类智能终端 - 产品包括 PC、平板、AIoT 及 XR/AI 穿戴类产品 [2] - 服务品牌及企业客户,为全球区域性龙头品牌提供产品与解决方案 [2] - 可提供从方案设计到整机服务的全流程服务 [2] 研发投入 - 旗下亿道数字(亿道研究院)专注人工智能、感知技术、空间智能领域 [2] 产品特性与市场策略 - 三防加固类产品具备防水、防尘、防摔特性,适用于恶劣环境 [3] - 未来聚焦工业自动化等重点领域,多元化布局线上线下渠道,布局全球市场 [3] 活动相关 - 活动类别为线上交流,参与人员有国泰海通等 [2] - 活动时间为 2025 年 6 月 12 日,地点是线上会议 [2] - 上市公司接待人员有副总经理、董事会秘书乔敏洋和投资者关系专员谢蝶 [2] - 活动不涉及应披露重大信息,未使用演示文稿和提供文档附件 [3]
比李飞飞提出“空间智能”更早!杭州这家企业正在打通机器人产业化落地最后一公里
机器人大讲堂· 2025-06-11 10:31
人工智能新概念 - 智澄AI创始人胡鲁辉首次提出"物理智能"概念,强调通过实时感知物理世界动态并构建可交互的世界模型,解决传统机器人泛化能力弱等问题,实现跨任务自主决策 [1] - 斯坦福李飞飞团队提出"空间智能"概念,侧重空间关系理解与视觉任务应用,但"物理智能"在覆盖范围和应用深度上更具前瞻性 [1] 行业融资动态 - 2024年中国新增70+具身智能企业,头部企业智元机器人完成超6亿元融资,宇树科技获数亿美元B2轮融资 [2] - 智澄AI成立于2024年3月,专注大模型通用人工智能机器人研发,目标打造理解物理世界的计算平台 [4] 公司技术实力 - 创始人胡鲁辉拥有微软、亚马逊等科技巨头高管经历,持有30余项美国专利,团队来自国际顶尖企业及高校 [6] - 自研TR系列机器人已迭代至第四代,TR4具备生化实验精准滴液能力,TR5双足人形机器人即将发布 [6][7][8] 产品形态策略 - 反对盲目追求双足形态,主张根据场景需求设计机器人结构,如TR2双臂机器人在家务操作中效率媲美人形机器人 [9][10] - 已开发TR2双臂、TR4复合人形等多形态产品,核心聚焦物理世界认知能力而非单一形态 [10] 技术突破方向 - 通过本体材料优化(如TR4稳定结构)、算法融合(强化学习+模仿学习)及数据平台构建,提升机器人泛化能力 [13] - 建立真实场景数据采集体系,支持机器人快速掌握新技能 [13] 商业化优势 - 全栈自研能力+工程化经验使公司能快速实现技术转化,已获客户订单进入小批量交付阶段 [14][17] - 相比学术机构的基础研究,公司更擅长"从1到N"的产业化落地,资金储备保障研发自主性 [17] 行业政策展望 - 2025年为人形机器人产业化关键年,政策目标包括建立创新体系及批量生产 [18] - 物理智能被视为推动落地的核心要素,需突破空间认知与泛化作业能力 [19]
o3绞尽脑汁仅答对40%的题目,开源模型基本乱猜?MMSI-Bench:多图空间智能试金石
量子位· 2025-06-11 05:13
空间智能与大模型发展 - 空间智能是大模型实现具身智能的关键能力 涉及理解物体位置和运动等空间关系 对自动驾驶 机器人导航等应用至关重要[1][2] - 当前多模态大模型(MLLM)在空间智能方面存在显著短板 面对1000道多图推理题 开源模型准确率普遍低于30% 最强的OpenAI o3仅41% 远低于人类97 2%的水平[1][16] - MMSI-Bench是首个专注多图像空间推理的评估基准 由多家顶尖机构联合开发 包含1000个高质量问答对 覆盖10种基础任务和1种多步推理类别[1][7][12] MMSI-Bench基准设计特点 - 采用人工主导构建模式 6位专家投入超300小时 从12万张图像中精选素材 每个问题均需整合多图像信息解答 并配有干扰项和标准推理流程[8] - 数据来源覆盖ScanNet Matterport3D nuScenes等真实场景数据集 包含室内3D场景 自动驾驶 机器人操作等多样化场景[13][14] - 任务设计围绕相机/智能体 物体 区域三大空间元素 涵盖位置关系 属性 运动状态等维度 多步推理任务需整合基础类型进行复杂顺序推理[12][13] 模型评估关键发现 - 商业模型表现优于开源模型 OpenAI o3准确率41% 最佳开源模型Qwen2 5-VL-72B仅30 7% 参数增加带来的性能提升有限(Qwen2 5-VL-72B比32B版仅高3%)[16][17][19] - 多步推理和相机运动理解是最大难点 多数模型在MSR任务上表现低于单步任务平均水平 开源模型对相机运动理解尤其薄弱[18] - 提示工程效果微弱 Zero-Shot CoT等策略对性能提升有限 甚至产生负面影响 表明模型基础空间理解能力存在本质缺陷[20] 错误分析与改进方向 - 主要错误类型包括定位错误(35%) 重叠匹配与场景重建错误(28%) 情境转换推理错误(22%) 空间逻辑错误(15%) 其中场景重建错误最为普遍[21] - 自动化错误分析流程结合GPT-4o评估器 与人类专家判断匹配度达71 8% 可系统性诊断模型失败原因 为改进指明方向[20][22] - 高质量人类标注至关重要 提供标准答案时自动化分析准确率降至53 6% 凸显标注质量对可靠评估的关键作用[23] 行业应用与未来展望 - MMSI-Bench填补了多图像空间智能评估空白 其真实场景数据和高难度任务设计使其成为当前模型-人类差距最大的基准(56个百分点)[16][24] - 基准已评测34个主流MLLM 涵盖闭源和开源模型 结果将推动开发更具空间感知能力的多模态AI系统 加速AGI发展[15][23] - 项目资源全面开放 包括论文 数据集和代码库 将成为社区推动空间智能研究的重要基础设施[23]
大模型发展面临“虚实鸿沟” 空间智能驱动生产力变革
新华财经· 2025-06-08 01:20
大模型发展现状与挑战 - 千亿参数级大模型在文本生成、图像理解和多模态推理等领域取得突破性进展 [1] - 大模型面临"虚实鸿沟"挑战,即如何将数字世界能力转化为物理世界实际价值 [1] 空间智能技术的价值与前景 - 空间智能技术是实现通用人工智能的关键一环,正在重塑AI与物理世界的互动模式 [1] - 空间智能推动行业从"数字想象"迈向"物理实效"的新阶段 [1] - 多模态大模型突破数字世界限制,空间智能赋予机器感知物理世界能力 [1] 公司技术布局与产品发布 - 上海码极客/考拉悠然联合发布悠然无界大模型和MAGX空间智能体产品家族 [2] - 公司依托多模态大模型技术优势,联合产业链上下游打造"多模态世界模型+智能体硬件+行业应用"全栈技术体系 [2] - 公司目标是通过大模型实现数字世界与物理世界的融合,使智能体具备感知、理解、执行能力 [2] 行业生态建设方向 - 公司致力于建设开放、协作、共生的空间智能生态 [2]
李飞飞的世界模型,大厂在反向操作?
虎嗅APP· 2025-06-06 13:56
公司概况 - 李飞飞创办的World Labs专注于开发具备"空间智能"的下一代AI系统,探索AI对三维世界的理解与重建能力[2] - 公司在短短三个月内完成两轮融资,累计筹集资金约2.3亿美元,估值突破10亿美元,成为AI领域新晋独角兽[2] - 投资方包括a16z、Radical Ventures、NEA、英伟达NVentures、AMD Ventures和Intel Capital等科技与风投界重量级机构[2] 技术方向 - 公司致力于从语言模型向世界建模转变,认为真正的智能需要能理解和构建三维世界[5][8] - 核心技术包括NeRF(从二维图像到三维重建)、高斯平面表示法(快速描绘三维场景)、扩散模型(提升三维内容精细度)以及多视角数据融合技术[17][19][20][21] - 物理仿真与动态建模是另一关键技术方向,使AI能预测物体运动变化[23] - 这些技术组合旨在让AI获得类似人类的空间感知能力[24] 应用场景 - 游戏行业:AI可根据照片或视频自动生成逼真三维世界,替代传统手工建模[25] - 建筑行业:几分钟内生成完整空间立体结构,模拟不同光照效果[26] - 机器人领域:赋予机器人三维视觉,解决二维视觉下的空间判断问题[26] - 数字孪生:为工厂、建筑或城市建立虚拟世界进行预测测试[27] - 创意产业:辅助艺术家、设计师进行空间理解和创作[28][29] 行业挑战 - 数据问题:获取足够多包含深度信息、空间结构的真实场景数据成本高[31] - 算力限制:NeRF等技术计算资源需求大,难以大规模落地应用[32] - 泛化能力:现有模型在陌生场景中表现不佳,需要更强适应性[33] - 需要硬件、软件、数据、应用场景的全链路打通,非单一公司能完成[33] 团队优势 - 团队汇聚计算机视觉、图形学、扩散模型、物理仿真和机器人控制等多领域专家[34] - 采用多学科融合的研究范式,探索AI理解三维世界的新路径[35] - 团队背景多元,能从技术、人文、社会等多角度思考AI发展[37] 未来愿景 - AI终极目标是成为人类在物理世界中的智能延伸,而非替代人类[43] - 医疗、建筑、教育等领域将受益于AI的空间理解和操作能力[44] - 世界模型被视为实现通用人工智能(AGI)的第一步,需具备空间感知、动态推理等能力[46] - 代表AI从语言到世界、从二维到三维的演进方向,重新定义人机关系[47]
“AI教母”李飞飞揭秘“世界模型”:要让AI像人类一样理解三维空间
36氪· 2025-06-06 12:31
公司概况 - World Labs由李飞飞创办,专注于研究前所未有的深度技术,目标是构建能够理解和推理三维物理世界的AI系统[4] - 公司寻找的投资者需具备计算机科学、人工智能、市场和产品等多方面专业知识,并能与创始人展开深度知识对话[4] - 李飞飞认为当前是集结行业资源(计算能力、数据、人才)实现"世界模型"理想的最佳时机[9] 技术方向 - World Labs致力于解决"空间智能"挑战,这是AI理解三维物理世界和虚拟数字宇宙的核心能力[2] - "世界模型"指能全面理解三维世界结构、形态和组成的AI系统,超越语言局限[4][6] - 技术突破点在于让AI具备类人的空间感知能力,这是实现"具身智能"的关键[11] 行业应用 - 创造力领域:将改变设计、电影、建筑和工业产品设计等视觉化和空间化的工作方式[12] - 机器人领域:赋能各类"具身智能机器"在三维环境中与人类协作[12] - 虚拟宇宙:结合生成模型和重建模型,创造"无限宇宙"的新体验[12][13] 技术比较 - 大语言模型存在局限性,无法完美捕捉三维世界的复杂性[6][7] - 3D计算机视觉相比2D具有显著优势,能解决机器人空间操作等实际问题[14] - 空间感知系统在进化史上早于语言系统出现,是更基础的智能组成部分[11] 发展前景 - "世界模型"将重新定义机器人、创意产业和计算本身[2] - 技术成熟后将推动人类突破二维思维框架,进入三维智能新时代[13] - 应用场景涵盖生产力、制造业、工程、社交、旅行等多个领域[12][13]
李飞飞的世界模型,大厂在反向操作?
虎嗅· 2025-06-06 06:26
公司概况 - 李飞飞创办的World Labs专注于开发具备"空间智能"的下一代AI系统,探索AI对三维世界的理解与建模能力[2] - 公司在2024年成立后三个月内完成两轮融资,累计筹集2.3亿美元,估值突破10亿美元成为AI领域独角兽[3] - 投资方包括a16z、英伟达NVentures、AMD Ventures、Intel Capital等科技与风投机构[4] 技术方向 - 核心研究方向为"世界模型",即AI对现实世界的三维理解能力,需结合视觉、空间感、动作等多维度信息[15][18] - 关键技术包括:NeRF(神经辐射场)实现二维图像到三维重建、高斯平面表示法提升实时渲染效率、扩散模型优化空间数据细节[30][33][38] - 需突破多视角数据融合与物理动态建模,使AI能预测物体运动(如风吹树叶、球体滚动)[41][46] 应用场景 - 游戏行业:AI根据照片或视频自动生成逼真三维场景,替代传统手工建模[51] - 建筑行业:几分钟内生成立体结构并模拟光照效果,大幅提升设计效率[53] - 机器人领域:赋予三维视觉能力,解决二维视觉导致的距离判断与导航问题[54] - 数字孪生:构建工厂/城市的虚拟副本用于灾害模拟与优化[56] - 创意产业:辅助艺术家进行空间化创作,成为"创作者伙伴"[59] 行业挑战 - 数据瓶颈:需大量带深度信息与空间结构的真实场景数据,目前获取成本高[63][64] - 算力限制:NeRF等技术计算资源需求大,难以大规模商业化落地[66] - 泛化能力:模型在陌生场景中易失效,需提升适应性[67] - 需跨学科协作整合硬件、软件、数据与应用生态[69] 团队与行业趋势 - World Labs团队涵盖计算机视觉、图形学、扩散模型、物理仿真与机器人控制等多领域专家[73][75] - AI研究范式从单一学科转向多学科融合,需集体智慧推动系统工程[77] - 空间智能被视为实现通用人工智能(AGI)的第一步,需具备空间感知与动态推理能力[94][95]