Workflow
空间智能
icon
搜索文档
刚刚,李飞飞空间智能最新成果!3D世界生成进入「无限探索」时代
自动驾驶之心· 2025-09-19 16:03
产品发布与核心功能 - 斯坦福大学教授李飞飞团队通过创业公司World Labs发布空间智能模型Marble限量测试预览版 [4][19] - 模型支持单张图片或文本提示作为输入生成持久存在、可自由导航探索的宏大3D世界 [5][8][18] - 生成内容具备永久性、零成本浏览器导航支持、高斯点云导出与多段拼接能力 [9][21][22] 技术特性与性能提升 - 生成场景规模较以往更大、风格更多样化、几何结构更干净 [21][23][26] - 支持通过组合多个生成结果构建更大世界 得益于模型在一致性和风格遵循上的进步 [22][31] - 生成场景具备丰富几何复杂度 支持从输入视角背后或更远处进行完整探索 [24] 应用生态与兼容性 - 导出高斯点云可在开源渲染库Spark支持下无缝集成Three.js [21] - 兼容桌面电脑、笔记本电脑、移动设备和VR头显运行 [21][12] - 用户测试反馈积极 有建议提及GUI界面连接世界功能优化 [14] 行业影响与定位 - 被行业人士评价为"真正的大规模3D生成" 与谷歌Genie形成差异化竞争 [9][10][11] - 正式将空间智能推向"无限探索"时代 突破房间尺度限制 [3][31] - 目前通过白名单地址开放试用 官方博客提供详细技术细节 [17][33]
北水动向|北水成交净买入62.88亿 北水继续抢筹美团-W(03690) 全天净买入额超14亿港元
智通财经· 2025-09-18 10:15
北水资金流向 - 9月18日港股市场北水成交净买入62.88亿港元 其中港股通(沪)净买入19.07亿港元 港股通(深)净买入43.82亿港元 [1] - 北水净买入前三个股为美团-W(14.12亿港元)、阿里巴巴-W(12.1亿港元)、泡泡玛特(12.07亿港元) [1][3][4] - 北水净卖出前三个股为华虹半导体(11.64亿港元)、腾讯(4.18亿港元)、中芯国际(2.77亿港元) [1][6][7] 个股投资动态 - 美团旗下国际外卖品牌Keeta在科威特启动运营 成为中东海湾地区第三个落点 并在当地iOS及Google Play美食饮品类下载榜首 [3] - 阿里巴巴获高盛看好AI基础设施/模型/应用层面多项进展 包括阿里云超预期表现及Qwen3-Next模型发布 [3] - 泡泡玛特被华源证券认为具备全产业链运营能力 海外业务扩大有望打开第二增长极 [4] - 香港宽频获中国移动香港完成要约收购 后者现持有78.08%股份成为绝对控股股东 [4] - 优必选与特斯联达成战略合作 围绕空间智能与具身智能技术推动智能体机器人落地 [5] - 地平线机器人与哈啰签署协议 合作打造L4级自动驾驶系统并完成L2到L4全域场景覆盖 [5] - 小米集团获净买入6.6亿港元 东方甄选获净买入7122万港元 [7] 行业趋势与ETF表现 - 芯片股遭北水抛售 因阿里巴巴、百度采用自研芯片训练AI大模型 国产模型训练逐渐脱钩海外 [6] - 食品饮料ETF(515170)近五日下跌3.91% 市盈率20.72倍 份额增加2.2亿份至83.3亿份 [9] - 游戏ETF(159869)近五日上涨6.33% 市盈率47.57倍 份额增加1.8亿份至55.6亿份 [9] - 科创半导体ETF(588170)近五日上涨9.10% 份额增加1.1亿份至6.3亿份 [9] - 云计算50ETF(516630)近五日下跌0.81% 市盈率122.71倍 份额增加200万份至3.6亿份 [10]
从 ChatGPT 到 Marble,李飞飞押注的下一个爆发点是 3D 世界生成?
锦秋集· 2025-09-18 07:33
文章核心观点 - 李飞飞创立的World Labs推出空间智能模型Marble 其核心突破在于通过一张图片或文本提示生成持久存在且可自由导航的3D世界 在几何一致性、风格多样性、世界规模和跨设备支持上显著优于同类产品[1][2] - Marble并非孤立产品 而是李飞飞"世界模型-空间智能-三维表征"思路的集中落地 代表从语言理解到世界理解再到AGI的演进路径[3][6] - 世界模型被视为AI发展的第三阶段范式 其核心在于三维表征与时空一致性 而不仅是多模态拼接 这将推动内容生产、机器人和AR/VR领域的变革[6][21][29] 大语言模型边界与空间智能必要性 - 大语言模型在写作、推理等任务中展现强大能力 但其基于一维序列的结构无法原生理解三维世界 语言作为有损编码方式难以传递几何、物理和时序因果信息[5][9][10] - 二维像素和视频输入不会自动生成三维结构 关键在模型内部表征需原生支持三维表达 满足可微渲染、视角一致性和物理一致性要求[11][14] - 空间智能是AGI的必要条件 因为世界本质是三维的 二维观测是不完备投影 且语言训练信号是纯生成的 无法替代对三维结构的直接建模[16] 世界模型的技术实现路径 - 数据策略采用混合路径:真实采集+重建生成+仿真合成 以解决三维数据匮乏问题 同时强调数据质量与一致性约束的重要性[20][26] - 算法层面注重"重建与生成合流" 同一套三维表示既能重建真实场景 也能生成虚拟世界 NeRF等方法让小规模算力也能实现原创突破[20][24] - 算力资源配置体现学术与产业分工:工业界侧重系统工程与产品化 学术界专注表示方法和跨模态原理研究[25] 产业发展与落地节奏 - 内容生产为首要落地场景 目标将3D内容生成成本从AAA游戏级降至创作者可及水平 应用覆盖游戏、虚拟摄影、工业设计和教育领域[6][29] - 机器人被视为天然应用场景 空间智能连接数字脑与物理界面 但需先打磨三维表示与交互能力 再承接高风险实体操作[30] - AR/VR作为后续发展阶段 需实现从静态场景到动态要素、可交互性和场景语义的逐步演进[29] 范式演进与投资逻辑 - AI发展遵循三要素共振规律:数据×算力×算法 ImageNet时代是二维标注数据驱动 世界模型时代是三维表示驱动[18][21][23] - 范式演进分为三阶段:监督学习(ImageNet)→生成式建模(扩散/GAN)→三维世界模型(重建×生成)[21][24] - 投资逻辑围绕"找到时代最被低估的数据形态" 三维表示被视为当前最具潜力的数据形态[21][23]
腾讯研究院AI速递 20250918
腾讯研究院· 2025-09-17 16:01
空间智能与3D生成技术 - 李飞飞公司World Labs发布空间智能模型Marble 仅用单张图片或文本提示即可生成持久存在的大规模3D世界 [1] - Marble相比前代产品支持浏览器自由视角导航 生成世界规模更大、风格更多样化且几何结构更干净 [1] - 用户可将生成内容导出为高斯点云并集成至Three.js 实现在桌面、移动设备和VR头显的高效运行 目前已开放白名单测试 [1] AI支付协议与金融科技 - 谷歌联合美国运通、PayPal、Mastercard等60多家机构推出代理支付协议AP2 旨在构建AI代理支付安全标准框架 [2] - AP2通过加密签名数字合同作为用户指令证明 允许预授权AI代理在特定条件下自动完成购买 支持实时交易与无人工委托任务 [2] - 加密版本A2A x402支持稳定币支付 目前协议已开放GitHub仓库供开发者探索 [2] 企业级AI应用开发 - Anthropic计划投资10亿美元创建企业应用克隆体 OpenAI预计2030年前在数据相关成本支出80亿美元 [3] - 两家公司使用强化学习环境模拟企业软件(如Salesforce、Zendesk、Cerner)训练AI模型操作专业系统 [3] - 通过聘请领域专家示范任务执行 训练AI成为虚拟同事以开辟新盈利渠道 [3] 智能体平台升级与开源 - 腾讯云智能体开发平台ADP3.0全面升级RAG、Multi-Agent及WorkFlow工具链 近3个月完成近600个功能上线 [4] - 平台完善知识库管理运维 支持多方式配置Agent协同 提供工作流全局Agent视野和即时指令技术 [4] - 优图实验室将开源Youtu-Agent智能体框架和Youtu-GraphRAG知识图谱框架 已推出智能质检等行业Agent解决方案 [4] AI版权争议与法律风险 - 迪士尼、华纳兄弟和环球影业联合起诉MiniMax 指控其海螺AI产品未经授权使用蜘蛛侠等IP进行AI训练 [5] - 三大公司要求返还侵权所得并索赔每项侵权最高15万美元 请求法院颁布永久禁令切断MiniMax使用相关IP的可能性 [5] - MiniMax此前在国内面临爱奇艺关于《苍兰诀》的类似指控 揭示AIGC在IP模仿领域的重大法律风险 [6] 音频处理与效率工具 - ima更新支持上传MP3、M4A、WAV、AAC格式音频文件 AI自动生成原文、速览和纪要 方便处理培训录音等内容 [7] - 新增电脑端快捷键截图功能 支持截图后直接提问、加入知识库或记笔记 [7] - 手机端笔记支持离线编辑与新建 无网络状态下可记录灵感 联网后自动同步 [7] 视频创作AI工具 - YouTube为Shorts创作者推出生成式AI工具 引入谷歌文本转视频模型Veo 3定制版"Veo 3 Fast" [8] - 新版以480p分辨率低延迟生成内容并同步添加声音 支持将动态效果应用到静态图片 [8] - 同步推出基于谷歌Lyria 2的语音转歌曲混音工具和AI编辑功能 可自动整理精彩片段并添加音乐与转场效果 [8] 具身智能与机器人融资 - 人形机器人公司Figure完成C轮融资 获超10亿美元承诺资本 投后估值达390亿美元创具身智能赛道纪录 [9] - 融资由Parkway Venture Capital领投 英伟达、英特尔资本等参与 资金用于扩大BotQ工厂生产规模及GPU基础设施搭建 [9] - Figure推出Helix端到端视觉-语言-动作模型 其机器人已实现叠衣服、分拣快递等复杂任务 [9] 未来技术趋势预测 - 华为发布《智能世界2035》报告 预测AGI将成为最具变革性驱动力量 AI智能体从执行工具演进为决策伙伴 [10] - 十大趋势包括人机协同编程成为主流、交互方式向多模态演进 2035年全社会算力总量将增长10万倍 [10] - AI存储容量需求较2025年增长500倍 可再生能源发电占比突破50% [10] AI系统架构实践 - Shopify分享AI助手Sidekick架构经验 建议保持架构简单、工具边界清晰并采用模块化设计如即时指令 [12] - 提出用反映真实生产环境的基准真相集替代黄金数据集 将大语言模型裁判与人类评估结果对齐 [12] - 警告奖励作弊问题(如退出式作弊、标签式作弊) 建议构建多层检测机制并结合程序化验证与语义评估 [12]
特斯联与优必选达成战略合作,将构建下一代智能体机器人|最前线
36氪· 2025-09-17 13:24
行业发展趋势 - 全球具身智能产业正从实验室演示阶段步入产业化初步应用阶段 技术持续迭代且资本关注度高 但大规模商业化仍面临技术瓶颈 算力成本及场景落地等挑战[1] - 具身智能被视为会思考的大脑与能行动的身体的结合 现实环境中复杂多变和非结构化的场景对其技术泛化能力提出严峻考验[1] - 空间智能是实现机器真正看到物理世界 看懂物理世界 并与物理世界实现自主交互的关键技术[1] 公司战略合作 - 特斯联与优必选宣布达成战略合作 双方将围绕空间智能+具身智能展开深度合作 彼此开放并共享创新技术 共同推动智能体机器人全面落地[1] - 合作将特斯联的空间大模型及高质量空间数据为机器人提供训练支持 优必选人形机器人生成的多模态交互数据反哺优化模型的空间推理能力 推动系统持续进化[4] - 双方合作旨在构建在物理世界具备高度自主化与交互能力的下一代智能体机器人[4] 技术架构与能力 - 特斯联将业务分拆为AIoT基础设施 AIoT领域模型 AIoT智能体 分别对应空间智能的三重能力[2] - AIoT领域模型层自研的空间大模型突破传统语言模型局限 具备多模态融合及推理能力 能深入理解重力 摩擦力和三维空间关系等物理规律[2] - AIoT基础设施层自研混合推理智算平台(HICP)实现对多元异构算力的统一调度管理 为具身智能提供高性能低延迟计算资源支持 已完成对十余种国产主流信创芯片兼容适配[2] - AIoT智能体层具备类人思考 长时记忆 高维感知与团队协作四大能力 与优必选群体智能系统协同 实现机器人从机械执行向智能协同跃迁[2] 技术协同价值 - 优必选认为机器人要演进为具备人机共融能力的智能体 必须深度融入对环境语义和动态规律的理解[4] - 特斯联智能体为机器人注入智慧大脑 显著增强其在复杂非结构化环境中的自主决策与协同作业能力[2]
氪星晚报|通义DeepResearch模型、框架、方案全开源;奇瑞汽车香港IPO据悉已获足额认购;诺和诺德:拟于明年年初在美国“全面”推出口服版司美格鲁肽
36氪· 2025-09-17 12:33
大公司动态 - 汉仪股份控股股东谢立群及一致行动人计划减持不超过294万股 占剔除回购账户后总股本3% [1] - Meta首席执行官扎克伯格称AI智能眼镜将成为超级智能融入日常生活的主要方式 [1] - 通义DeepResearch模型实现数据、Agent范式、训练、基础设施及Test Time Scaling系统性创新并全开源 [1] - 诺和诺德计划2025年初在美国全面推出口服版司美格鲁肽减肥药 强调其相对礼来药物的竞争优势 [2] - 华为发布"4+10+N"中小企业智能化方案 同步启动"百&万计划"发展100家钻石伙伴及10000家精英工程商 [2] - 特斯联与优必选达成战略合作 结合空间智能感知与全栈式人形机器人技术推进"空间智能+具身智能" [3] 资本市场活动 - 奇瑞汽车香港IPO获足额认购 计划募集资金规模达91.4亿港元 [4] - 清力技术完成数亿元人民币Pre-A轮融资 前海方舟领投 中科创星等跟投 [4] - 麦麦科技完成超1亿元人民币Pre-A轮融资 投后估值超10亿元 资金将用于AI农业大模型及智能传感设备研发 [5] 产品创新 - 飞猪AI"问一问"新增拍照讲解功能 支持博物馆及地标建筑的实时语音讲解服务 [6] - 佑驾创新正式发布无人物流品牌"小竹无人车" [7] 行业数据与趋势 - 2025年第二季度全球智能眼镜出货量255.5万台 同比增长54.9% 其中音频类设备增长256.8% AR/VR设备下滑21.6% [8] - 同期中国智能眼镜市场出货量66.4万台 同比增长145.5% [8] 政策与改革 - 国务院国资委主任表示国有企业改革深化提升行动进度符合预期 预计2024年底完成主体任务 [9]
刚刚,李飞飞发布世界模型新成果!一张图生成3D世界,现在就能玩
创业邦· 2025-09-17 10:18
公司技术发布 - 斯坦福大学教授李飞飞的创业公司World Labs正式上线空间智能研究成果Marble 这是一个限量访问的Beta测试版平台 用户可浏览和创建3D世界 [5][7] - Marble通过3D世界生成模型创建庞大世界 技术实现基于单张照片推断整个场景的几何结构 包括深度 光照 材质和纹理 并生成可探索的3D世界 [9][11][12] - 生成世界具有永久持续性 无变形和不一致 相比之前技术 生成世界更大 风格更多样 三维几何结构更清晰 [14] 技术特性与工具 - 创作者可将生成世界导出为Gaussian splats 应用于后续项目 World Labs提供开源渲染库Spark 可无缝整合Gaussian splats到Three.js 支持多设备高效运行 [14] - 平台提供多个演示场景 涵盖室内外环境 用户可通过网页端使用W A S D键移动和鼠标拖拽调整视角 进行自由探索 [16] - 立体感和细节还原度令人印象深刻 特别是光影效果和材质质感较为真实 [17] 当前局限与发展阶段 - Marble专注于生成3D环境 暂不支持人物或动物生成 且仅能生成房间大小世界 构建大型游戏场景需更多技术突破 [19] - 平台目前距离真正商业化应用还有段距离 但已实现风格统一性和几何一致性提升 用户可在大场景中导航和浏览 [19][21] 行业背景与战略方向 - 李飞飞认为文字AI存在局限性 真正的AI应能理解和创造三维空间 空间智能可生成重建无限宇宙 用于创造 旅行 叙事和社交 [21][24] - Marble的出现赶上AI游戏赛道集体发力期 马斯克的xAI宣布成立AI游戏工作室 预计真正意义上的AI视频游戏明年出现 [26] - Runway的AI游戏平台Game Worlds允许用户创建非线性叙事游戏 AI游戏生态链正在快速成型 方向指向让普通人轻松创建虚拟世界和游戏体验 [26][28] 市场影响与用户定位 - 该技术被视为AI领域的惊人飞跃 专业人士认为这是重大突破 用户可注册排队体验 成为在虚拟世界创业的AI原住民 [9][29]
特斯联与优必选强强联手,融合打造具身智能
第一财经· 2025-09-17 08:59
战略合作概述 - 特斯联与优必选宣布达成战略合作 围绕空间智能与具身智能展开深度合作 共同推动智能体机器人全面落地[1] - 双方将开放共享空间智能与具身智能创新技术 打造以空间智能为底层的多模态训练全新范式[1] - 合作源于对彼此技术实力与产业价值的高度认可 旨在构建通用AI的全新通路[3] 技术协同优势 - 优必选具备全栈式人形机器人技术能力 包括硬件与控制技术 人工智能技术 机器人与人工智能融合技术及操作系统应用框架[3] - 特斯联构建三层战略体系:AIoT基础设施层提供混合推理智算平台 支持多元异构算力统一调度 已完成对十余种国产主流信创芯片兼容适配[4] - 特斯联AIoT领域模型层具备多模态融合及推理能力 能处理重力 摩擦力 三维空间关系等物理规律[4] - 特斯联AIoT智能体层具备类人思考 长时记忆 高维感知与团队协作四大能力 与优必选群体智能系统高效协作[5] 产业应用价值 - 空间智能让机器人理解物理世界规律 解决具身智能在复杂非结构化场景中的泛化挑战[4] - 人形机器人作为实时感知与交互终端 在物理场景中持续验证增强空间推理模型性能[5] - 机器人运行生成的多模态交互数据反哺优化空间推理能力 推动系统持续进化[5] - 特斯联累计拥有近万空间智能项目案例 优必选为全球极少数具备人形机器人全栈式技术能力的公司[3] 资本市场动态 - 特斯联港股IPO正在进行中 此次合作对业务升级及全球化市场拓展构建更大想象空间[5]
刚刚,李飞飞发布世界模型新成果,一张图生成 3D 世界,现在就能玩
36氪· 2025-09-17 07:34
产品发布 - 斯坦福大学教授李飞飞的创业公司World Labs正式上线空间智能产品Marble 目前为限量访问的Beta测试版平台 用户可通过官网浏览和创建3D世界 [1] - Marble采用3D世界生成模型 能够根据单张照片推断整个场景的几何结构 包括平面凹凸关系 空间深度 光照材质和纹理等物理属性 [4] - 生成的世界具有永久持续性 不会变形或出现不一致 相比之前技术 当前版本生成世界更大 风格更多样 三维几何结构更清晰 [4] 技术特性 - 支持将生成的世界导出为Gaussian splats格式 可通过开源渲染库Spark无缝整合至Three.js框架 实现跨平台运行 包括台式机 笔记本 移动设备和VR头显 [4] - 采用高斯溅射(Gaussian Splatting)技术 被行业博主评价为当前生成3D世界的最佳工具 [4] - 提供网页端第一人称探索功能 用户可通过WASD键移动 鼠标拖拽调整视角 体验室内外多种环境类型的演示场景 [6] 行业定位 - 产品切入AI游戏赛道 与马斯克xAI游戏工作室 Runway的Game Worlds等形成生态链协同 指向让普通人轻松创建虚拟世界的行业趋势 [16] - 空间智能技术被定位为超越语言模型局限的关键 致力于理解和创造三维空间 实现多元宇宙级别的创造 旅行和社交体验 [11][13] 当前局限 - 专注于环境生成 暂不支持人物或动物建模 自拍和宠物场景应用受限 [6] - 虽能生成房间级世界 但构建大型游戏场景仍需技术突破 距离真正商业化应用尚有距离 [6]
特斯联与优必选达成战略合作:让机器人更容易“看懂”世界
证券时报网· 2025-09-17 05:10
战略合作内容 - 特斯联与优必选宣布围绕空间智能与具身智能展开深度合作 彼此开放并共享创新技术 打造以空间智能为底层的多模态训练全新范式 [1] - 合作依托特斯联空间智能感知 推理及行动技术闭环与优必选人形机器人全栈式自研能力 共同推动智能体机器人全面落地 [1] - 双方通过空间智能与具身智能深度融合 旨在打造物理世界中具备高度自主化与交互能力的下一代智能体机器人 [2] 技术协同价值 - 优必选具备行业领先的机器人硬件与控制技术 人工智能技术 机器人与人工智能融合技术及机器人操作系统应用框架 [1] - 特斯联空间大模型及高质量空间数据为机器人训练提供支持 与优必选机器人核心优势相互赋能 [1] - 人形机器人作为实时感知与交互的智能终端 在物理场景中持续验证并增强空间推理模型性能 [3] 企业技术布局 - 特斯联自2015年起深耕空间智能领域 累计拥有近万空间智能项目案例 [2] - 特斯联构建以AIoT基础设施 AIoT领域模型 AIoT智能体为核心的三层战略体系 [2][3] - 特斯联三层架构包括AIoT领域模型 AIoT基础设施层和AIoT智能体层 使机器人能够理解物理世界 [3] 行业技术意义 - 空间智能是机器人与物理世界交互的重要支撑 需融入对环境语义和动态规律的理解 [1] - 具身智能结合会思考的大脑与能感知行动的身体 但面临真实场景中光线变化 物体遮挡等泛化挑战 [2] - 人形机器人为空间智能打通落地最后一公里 其运行生成的多模态交互数据可反哺优化空间推理能力 [3] 战略发展影响 - 合作基于双方对彼此技术实力与产业价值的高度认可 超越简单技术互补 [2] - 特斯联港股IPO进程中进行 即将成为AIoT第一股 与优必选合作构建业务升级及全球化市场拓展空间 [3]