空间智能 - 财报，业绩电话会，研报，新闻 - Reportify

空间智能

搜索文档

创业一年后，李飞飞推出首款可商用世界模型 Marble，任意模态都可生成 3D 世界

Founder Park· 2025-11-13 14:06

Marble产品核心能力 - World Labs发布首款可商用生成式多模态世界模型Marble，相较于两个月前的预览版，支持更多模态输入且生成的3D世界更丰富细致[2] - 核心能力是通过文本、单张图片、多张图片或视频直接生成完整、可探索的3D世界，并能“脑补”出描述中未提及或图片中不可见的细节[5][6][10][13] - 提供多图像输入功能，可将不同角度拍摄的照片无缝拼接融合成统一3D空间，使生成场景更贴近创作者构想[13][14] - 内置AI编辑工具，支持局部微调（如移除物体）和全局调整（如改变艺术风格或场景结构）[18][20] - 提供实验性工具Chisel，允许高级用户将世界“结构”和“风格”分离，实现对空间布局的精细控制[21] - 通过“扩展”模式自动生成更多内容扩大世界边界，或通过“组合”模式将多个独立世界拼接成复杂宏大场景[22][26] - 支持以Gaussian Splats（最高保真度）、三角网格（兼容Unity、Unreal Engine等）及视频（可添加动态元素）多种格式导出[23][24] 目标市场与商业模式 - 针对普通用户和专业用户分别提供免费版和Pro版，Pro版主要面向游戏开发、电影特效、建筑设计及机器人研究等领域的专业人士[8] 空间智能行业前景 - 李飞飞提出空间智能是人工智能的下一个前沿方向，将重塑叙事、创意、机器人学及科学发现等领域[27][29] - 当前最先进的多模态模型在物理世界中能力笨拙，表现为估算距离/方向/大小任务表现略高于随机水平、缺乏空间想象力、生成视频内容缺乏连贯性[33][35][36][37] - 空间智能能大幅降低3D世界创造门槛，赋能普通人及专业人士快速创建迭代虚拟世界，是实现具身智能让机器人理解并与物理世界安全互动的前提[41] - 该技术能在科学研究、医疗、教育等领域处理超越人类直观感知的复杂空间问题，如模拟实验及探索人类难以到达的环境[42] - 构建空间智能比训练语言模型困难得多，需要新算法及处理更复杂数据[44]

Artificial Intelligence

Artificial Intelligence

李飞飞的世界模型来了，一句话生成3D世界，AI 真的开始理解现实了

36氪· 2025-11-13 11:42

产品发布与核心能力 - 斯坦福教授李飞飞的创业公司World Labs正式推出首款世界模型产品Marble，这是该方向首次以可用产品形式出现 [1] - Marble具备多模态生成能力，可根据一张图片、一段视频或一句文字提示，重建出结构完整、细节丰富的3D世界 [1] - 产品拥有AI原生的世界编辑能力，允许用户对生成的世界进行局部替换、材质变化、光照调整或布局重构 [1] - 支持将生成的世界导出为高斯溅射、三角网格或视频格式，可直接接入Unreal、Unity、Blender等主流创作工具 [1] 技术特点与工作流程 - 支持从文本提示生成3D世界，系统能自动提取关键元素并在几秒钟内生成可漫游的三维空间 [7] - 支持单图生成，能根据照片的透视关系、光线方向和物体摆放方式，将场景自动补齐成可漫游的3D世界 [9] - 提供Chisel工具，允许进阶创作者先搭建粗略的3D框架，再通过文本提示控制最终呈现的风格与氛围 [11] - 将空间逻辑与视觉风格明确区分，同一三维框架可衍生出完全不同的世界 [12] 编辑与扩展功能 - 产品允许用户像处理真实场景一样对生成的三维世界进行删除物体、替换材质、改变光线等调整 [13] - 用户可对初始世界的任意区域进行扩展，系统会根据已有场景逻辑推演并补全环境细节 [13] - 提供“组合模式”，允许将多个独立生成的世界像拼接地图一样组合，以构建规模庞大、层次丰富的虚拟环境 [14] 行业应用与集成 - 支持将场景导出为高斯粒子渲染和三角网格等通用格式，可无缝进入Blender、Maya、Unity、Unreal等主流制作工具 [15][17] - 导出的高质量网格适合用于游戏关卡、动画镜头或建筑展示，碰撞网格则用于物理模拟和机器人路径规划 [16][17] - 支持将整个世界直接渲染成视频，并可进行增强处理，自动补上细腻细节并加入动态效果 [18] 战略意义与未来展望 - Marble的发布象征着空间智能时代的正式开场，其意义远不止让3D创作更方便，而是迈向创造真正具有空间智能的世界模型的第一步 [1][2] - 产品让外界首次清晰感受到AI有可能从理解图像和语言，迈向理解并操控一个由结构、物理与动态规律构成的完整世界 [3] - 未来应用方向包括帮助机器人理解现实环境，以及在科学研究中用于虚拟实验和预测结果 [2][27] - 世界模型需具备生成性、多模态性和交互性三种核心能力，其技术门槛远高于语言模型 [22][23][24][25][26]

Artificial Intelligence

Artificial Intelligence

DeepSeek前骨干罗福莉C位亮相小米，曾网传雷军千万年薪挖她

程序员的那些事· 2025-11-13 11:24

罗福莉加入小米事件 - 罗福莉于11月12日首次官方宣布加入小米，担任MiMo团队负责人[1][3] - 罗福莉在X平台上高调宣布正式加入小米，出任MiMo团队负责人[3] - 此次任命标志着此前约一年的传闻最终落地[5] 小米的AI战略方向 - 小米在汽车业务步入正轨后，宣布将全力进军AI的深水区[9] - 小米AI的目标是推动智能从语言世界走向物理世界，解锁多模态的空间智能[4] - 空间智能被定义为具备感知、推理、生成与行动的能力，是实现通用人工智能（AGI）的关键一步[4][24] - 小米MiMo团队致力于推动空间智能发展，这与公司拥有的“人、车、家全生态”场景天然适配[24][26] 事件时间线与背景 - 2023年12月25日，DeepSeek-V3版本上线并宣布全面开源[6] - 2023年12月26日，媒体曝出小米正在组建GPU万卡集群[7] - 2023年12月31日，雷军在跨年直播中公开披露小米在AI方面的野心[8] - 坊间传闻雷军以千万年薪挖角DeepSeek核心开发者罗福莉[10] - 上个月，小米AI团队论文作者栏已出现罗福莉名字，但标注为“独立研究者”[11] 罗福莉的专业背景 - 罗福莉本科毕业于北京师范大学计算机专业，硕士就读于北京大学计算语言学[15] - 曾任职阿里巴巴达摩院机器智能实验室研究员，负责开发多语言预训练模型VECO并推动AliceMind项目开源[17] - 2022年加入DeepSeek母公司幻方量化，后担任DeepSeek的深度学习研究员，参与研发DeepSeek-V2等模型[17] - 学术论文总引用次数超过1.1万次，仅2024年就新增约八千次引用[18] - 在DeepSeek最新的Nature封面论文中，罗福莉名列作者之一[20] MiMo团队与空间智能 - 小米MiMo是公司推进大模型研发的核心招牌[24] - 空间智能概念旨在打通信息AI和物理AI，实现比特世界和原子世界的智能贯通[26] - AI教母李飞飞于11月10日发表万字长文，首次系统阐释“空间智能”概念及其对具身智能和AGI的意义[25] - 罗福莉作为独立研究员时，已在小米MiMo论文成果中起到承接作用，连接小米和北大团队[23]

小米集团(HK:01810)

通用人工智能（AGI）

Artificial Intelligence

通用人工智能（AGI）

Artificial Intelligence

罗福莉C位亮相小米，离职DeepSeek后首次官宣

36氪· 2025-11-13 10:26

公司核心人事任命 - 罗福莉于11月12日正式官宣加入小米，出任MiMo团队负责人[1] - 罗福莉此前为DeepSeek核心开发者，坊间传闻小米以千万年薪将其挖角[4][7] - 罗福莉学术背景深厚，论文总引用次数超过1.1万次，今年新增约八千次引用[13][17] 公司AI战略方向 - 小米MiMo团队明确剑指空间智能，旨在实现从语言世界到物理世界的智能进化[3][23] - 空间智能被定义为具备感知、推理、生成与行动的能力，是实现通用人工智能的关键一步[4][23] - 雷军在跨年直播中披露，汽车业务步入正轨后，公司将全力进军AI深水区[7] - 小米AI战略与公司人、车、家全生态场景天然适配[25] 公司技术布局时间线 - 2023年12月25日DeepSeek-V3上线并开源，次日媒体曝出小米正在组建GPU万卡集群[5][6] - 2023年底传闻雷军挖角罗福莉，上月小米AI论文作者栏已出现罗福莉以独立研究员身份署名[7][8] - 罗福莉在小米最新MiMo论文中起到承接作用，连接小米与北大团队，通讯作者为其北大恩师[21]

小米集团(HK:01810)

通用人工智能（AGI）

Artificial Intelligence

通用人工智能（AGI）

Artificial Intelligence

周末来造梦！李飞飞世界模型正式开放，能力升级，有免费版

机器之心· 2025-11-13 08:26

产品发布与定位 - 李飞飞“空间智能”团队正式向公众全面开放其先进的多模态生成式世界模型Marble [3] - 产品定位为实现“人人可用、随手造世界” [3] - 相较于两个月前的预览版，此次全面开放版本实现了能力跃升式升级 [4] 产品能力与技术特点 - 核心升级在于“重度多模态”输入能力，支持文本、单张图像、多图提示等多种输入方式，允许用户通过多源信息对世界进行精细约束与设计 [7] - 提供AI原生世界编辑工具，支持对象移除/替换、局部修饰、视觉风格调整、结构性重构等局部与大范围修改，使创作进入可迭代模式 [11][12] - 新能力Chisel实现了结构与风格的解耦，用户可通过基础3D形状或导入3D资产搭建粗略结构，再通过文本提示决定整体风格，为世界生成带来全新控制维度 [14][15][17][18][20][21] - 支持生成后对指定区域进行一键扩展，以填充缺失区域、修补边缘瑕疵并补充细节 [22][23][24] - 可通过“作曲模式”将多个世界按自定义关系拼接，构建大规模空间 [25] 输出格式与应用场景 - 创建的世界支持以多种格式导出，便于整合到下游项目或专业工具链中 [26] - Gaussian Splat是最高保真度的输出方式，能输出极细腻的空间细节，并可通过开源渲染器在浏览器中直接渲染 [27] - 支持导出为三角网格，可与游戏引擎、建模软件、影视制作工具等行业标准工具无缝兼容 [28] - 支持将世界直接渲染为视频，并可实现像素级的镜头控制 [31][32] - 支持对导出的视频进行AI增强 [33] - 产品更适用于游戏开发、影视特效、建筑设计、机器人仿真等专业场景 [4] 商业模式与生态建设 - 目前提供免费版与会员版，主要差异体现在可生成的世界数量、可使用的编辑功能范围与深度以及是否具备商用授权 [6] - 公司同步推出Marble Labs，旨在与艺术家、设计师、工程师合作探索更多可能性，提供创作范式与最佳实践参考 [35][36] 未来发展方向 - Marble被视为迈向“空间智能”的阶段性成果，未来将重点强化交互性，使人类与智能体能在生成世界中更自然地感知、行动与学习，拓展在模拟与机器人领域的应用边界 [37]

多模态生成式世界模型

多模态生成式世界模型

星源智T5域控制器亮相百度大会赋能智元精灵G2开启机器人新纪元

证券日报网· 2025-11-13 06:11

产品发布与性能 - 星源智公司在百度世界大会2025上展示了自主研发的机器人大小脑域控制器T5 [1] - T5域控制器集超大算力、低功耗与高性能于一体，搭载NVIDIA最新JetsonThor处理器，算力高达2070TFLOPS [1] - 该产品具备大型Transformer模型加速能力，广泛支持深度学习、计算机视觉等先进算法，可满足机器人在实时感知、智能决策与精准控制方面的需求 [1] 商业合作与应用 - 智元机器人与星源智公司已达成深度合作并联合参展 [1] - 搭载T5控制器的新一代工业级交互具身作业机器人智元精灵G2于今年10月份发布，并在展台同步亮相 [1] 公司背景与技术实力 - 星源智机器人公司由北京智源研究院孵化，致力于实现多模态空间智能，构建物理世界的通用具身大脑 [1] - 公司拥有世界领先的具身多模态大模型能力和空间智能能力，打造了内涵极为丰富的具身技术栈 [1] - 技术栈包括物理世界的多模态感知与数字化重建、多模态具身世界模型、机器人本体的运动控制、用于感知规划、决策、导航、操作的各类具身基础大模型、软硬一体的端侧具身系统等 [1]

机器人(SZ:300024)

具身多模态大模型

机器人大小脑域控制器T5

JetsonThor处理器

具身多模态大模型

机器人大小脑域控制器T5

JetsonThor处理器

李飞飞3D世界模型公测，网友已经玩疯了

量子位· 2025-11-13 05:38

产品发布与市场反响 - 李飞飞创立的World Lab公司发布全新3D世界生成模型Marble，并开启公测，人人可玩[1][3] - 该模型发布后迅速获得好评，用户使用简单，并在社交媒体引发刷屏现象[7][15] - 模型支持通过文本、照片甚至短视频轻松生成可编辑、可下载的专属3D世界，大幅降低使用门槛[4][35] 核心技术功能与特性 - Marble支持通过简短的文本提示、单图提示生成3D世界，并能通过多张图片、不同视角的图片拼接成统一世界[17] - 模型内置AI原生世界编辑工具，可进行局部编辑（如移除物体、修饰区域）或彻底编辑（如交换物体、改变视觉风格、重构大片区域）[21] - 对于专业用户，团队推出原生AI工具Chisel，可直接在3D中塑造Marble世界[23] - 模型支持对已生成世界进行扩展，为特定区域添加细节，并能将任意数量的世界组合起来构建更广阔空间[25][27] 输出格式与兼容性 - 创建的世界可选择两种方式导出：导出为高斯散点（最高保真度呈现形式）或导出为三角形网格（包含低保真碰撞器网格和高质量网格）[29] - 以网格形式导出能使3D世界与众多行业标准工具兼容，便于融入下游项目[29] - 3D世界可渲染成视频，导出后的视频可进行增强，添加细节、去除瑕疵并融入动态元素[31] 战略方向与行业定位 - 作为World Lab首款商业世界模型产品，Marble的核心在于多模态功能的深度落地，支持文本、图像、视频甚至粗略3D布局等多种输入方式[34][35] - 公司未来将重点发力交互性，目标是从静态创造发展到动态交互，实现与3D世界内元素的实时互动[36][37] - 该产品方向与李飞飞强调的空间智能是AI下一个前沿领域的观点一致，旨在打造具备生成、多模态处理和交互预测能力的真正空间智能世界模型[37]

3D世界生成模型

3D世界生成模型

“AI教母”李飞飞发布首款商用世界模型

第一财经· 2025-11-13 02:15

产品发布与特点 - World Labs公司正式推出首款产品Marble 由多模态世界模型提供支持能通过单张图片一段视频或一句文本提示创建高保真持久的3D世界 [2] - Marble正式版功能扩展支持大规模多模态输入同步推出名为Marble Labs的创意中心并开放免费增值与付费订阅服务 [5] - Marble提供四档订阅方案免费版支持4次生成标准版每月20美元旗舰版每月95美元包含75次生成 [5] - Marble的差异化优势在于生成持久化可下载的3D环境显著减少场景变形与不一致性支持导出为高斯泼溅网格或视频格式 [5] 技术理念与行业定位 - 空间智能被定位为人工智能的下一个前沿是机器实现真正智能的关键突破 [6] - 世界模型需具备生成性多模态性和交互性三种核心能力以构建环境内部表征 [8] - Marble是目前世界模型赛道中首个投入商用的产品行业评测认为其交互效果不错但细节精细度需提升 [8] - 竞争对手如谷歌Genie处于有限研究预览阶段 Decart与Odyssey仅推出免费演示版本 [8] 应用前景与发展规划 - 短期内空间智能将赋能电影游戏和建筑领域的创作者快速生成可探索的3D环境 [8] - 中期将推动具身智能机器人发展通过高仿真训练使其成为人类在家庭实验室中的协作伙伴 [8] - 长远看空间智能有望在科学医疗和教育领域引发革命通过模拟实验辅助诊断和沉浸式学习增强人类能力 [8] - 公司第一阶段专注于构建对三维性物理性及空间和时间概念有深入理解的模型随后将支持增强现实技术和机器人技术等领域 [9] 公司融资与市场地位 - World Labs在2024年创办短短几月内完成约2.3亿美元（约合人民币16亿元）融资估值迅速突破10亿美元（约合70亿元）成为AI领域最新独角兽企业 [9] - 公司投资方阵容包括a16z Radical Ventures 英伟达NVentures AMD Ventures和Intel Capital等科技与风投界重量级玩家 [9]

RTFM（Real - Time Foundation Model）

RTFM（Real - Time Foundation Model）

“AI教母”李飞飞发布首款商用世界模型空间智能更近了

第一财经· 2025-11-13 01:37

公司产品发布 - 李飞飞创立的World Labs公司于11月13日正式推出首款产品Marble，这是一个由多模态世界模型支持、能通过单张图片、视频或文本提示创建高保真持久3D世界的平台 [1] - 产品正式版功能扩展，支持大规模多模态输入，同步推出名为Marble Labs的创意中心，并开放免费增值与付费订阅服务 [4] - Marble提供四档订阅方案，免费版支持4次生成，标准版每月20美元，旗舰版每月95美元包含75次生成并可解锁全部功能 [4] - 与实时模型RTFM的差异在于，Marble生成的是持久化、可下载的3D环境，支持导出为高斯泼溅、网格或视频格式，显著减少场景变形与不一致性 [4] 技术理念与行业定位 - 李飞飞认为空间智能是人工智能的下一个前沿，是机器实现真正智能的关键突破，其核心是构建具备生成性、多模态性和交互性的世界模型 [5] - 相较于谷歌Genie仍处于有限研究预览阶段，以及竞争对手Decart与Odyssey仅推出免费演示版本，Marble是世界模型赛道中首个投入商用的产品 [5] - 行业评测认为Marble整体交互效果不错，但细节精细程度还需要提升 [5] 市场应用前景 - 短期内空间智能将赋能电影、游戏和建筑等领域的创造力，提供快速生成可探索3D环境的工具 [5] - 中期将推动具身智能机器人发展，使其成为家庭和实验室中的协作伙伴 [6] - 长期有望在科学、医疗和教育领域引发革命，通过模拟实验、辅助诊断和沉浸式学习增强人类专业能力 [6] 公司融资与发展规划 - World Labs在2024年创办后短短几月内完成约2.3亿美元（约合人民币16亿元）融资，估值迅速突破10亿美元（约合70亿元），成为AI领域最新独角兽 [6] - 公司投资方包括a16z、Radical Ventures、英伟达NVentures、AMD Ventures和Intel Capital等科技与风投界重量级玩家 [6] - 公司第一阶段专注于构建对三维性、物理性以及空间和时间概念有深入理解的模型，随后将支持增强现实技术和机器人技术等领域 [6]

RTFM（Real-Time Foundation Model）

RTFM（Real-Time Foundation Model）

“AI教母”李飞飞发布首款商用世界模型，空间智能更近了

第一财经· 2025-11-13 01:31

产品发布与核心功能 - World Labs公司于11月13日正式推出首款产品Marble，该产品由多模态世界模型提供支持，被官方称为“构建空间智能未来的基础”[1] - Marble模型能通过单张图片、一段视频或一句文本提示创建高保真、持久的3D世界[1] - 与实时模型RTFM的差异化在于，Marble生成的是持久化、可下载的3D环境，显著减少场景变形与不一致性，并支持导出为高斯泼溅、网格或视频格式[4] - 产品正式发布时功能得到扩展，支持大规模多模态输入，并同步推出了名为Marble Labs的创意中心[4] 商业模式与定价 - Marble采用免费增值与付费订阅服务模式，免费版支持4次生成，仅限文本和图像输入[4] - 标准版订阅价格为每月20美元，支持多图、视频输入及高级编辑功能[4] - 旗舰版订阅价格为每月95美元，包含75次生成，可解锁全部功能[4] - Marble是世界模型赛道中首个投入商用的产品，而竞争对手如谷歌的Genie仍处于有限研究预览阶段，Decart与Odyssey仅推出免费演示版本[5] 技术理念与行业前景 - 公司创始人李飞飞认为，空间智能是人工智能的下一个前沿，是实现机器真正智能的关键突破[5] - 空间智能即人类用以理解、导航并与三维世界交互的底层能力，构建的世界模型需具备生成性、多模态性和交互性三种核心能力[5] - 短期内，空间智能将赋能电影、游戏和建筑领域的创造力，提供快速生成可探索3D环境的工具[5] - 中期将推动具身智能机器人发展，长远看有望在科学、医疗和教育领域引发革命[6] 公司发展与融资 - World Labs由李飞飞在2024年创办，并在短短几月内完成约2.3亿美元（约合人民币16亿元）的融资[6] - 公司估值迅速突破10亿美元（约合70亿元），成为AI领域最新的独角兽企业[6] - 公司投资方阵容包括a16z、Radical Ventures、英伟达NVentures、AMD Ventures和Intel Capital等科技与风投界重量级玩家[6] - 公司第一阶段将专注于构建对三维性、物理性以及空间和时间概念有深入理解的模型，随后将支持增强现实技术和机器人技术等领域[6]

具身智能机器人

具身智能机器人