Workflow
空间智能
icon
搜索文档
首款商用世界模型Marble发布,空间智能再进一步
国投证券· 2025-11-17 07:53
报告行业投资评级 - 行业投资评级为“领先大市-A” [8] 报告核心观点 - 首款商用世界模型Marble正式发布,其生成的持久化、可下载3D环境显著减少了场景变形与不一致性 [1][12] - 世界模型是以3D维度表征真实世界运行规律的AI系统,具备生成性、多模态性和交互性三种核心能力 [2][13] - 全球科技巨头在世界模型技术层取得密集突破,包括腾讯的混元3D世界模型1.0、Google DeepMind的Genie 3以及特斯拉的“世界模拟器” [3][14] - 空间智能是AI从“读写”到“构建”的关键,短期赋能创造力工具,中期有望成为机器实现真正智能的底层能力 [4][15] - 国内世界模型/物理AI产业链正在形成,建议关注相关产业链标的 [5][16] 行业重要动态与技术进步 - World Labs推出的Marble模型支持通过文字、照片、视频、3D布局或全景图生成可编辑、可下载的3D虚拟场景 [1][12] - 腾讯混元3D世界模型1.0融合全景图像合成与分层3D重建技术,支持使用者在3D场景中“沉浸式漫游” [3][14] - Google DeepMind的Genie 3能基于文本提示实时生成交互式虚拟环境,以每秒24帧、720p分辨率保持数分钟高保真度,并能回溯长达一分钟的历史时序信息 [3][14] - 特斯拉“世界模拟器”利用端到端神经网络生成高度逼真驾驶场景,用于自动驾驶与人形机器人训练 [3][14] - 李飞飞团队在空间智能领域的ReKep成果使用了奥比中光的RGB-D相机FemtoBolt,为机器人交互提供3D视觉数据支撑 [5][16] - Meta首席AI科学家杨立昆因战略分歧离职,计划创立专注于世界模型研发的新公司 [24] - OpenAI发布GPT-5.1版本,包含Instant和Thinking两个核心模型,优化了对话与推理能力 [25] - IBM发布120量子比特处理器Nighthawk,并公布2026年实用化路线图 [26] - 我国成功搭建“天衍-287”超导量子计算机,处理特定问题速度比最快超算快4.5亿倍,并即将全球开放云服务 [27] 市场行情回顾 - 本周计算机板块指数下跌3.72%,相对上证综指跑输3.54% [17][18] - 计算机板块年初至今涨幅为26.74% [18] - 本周计算机行业指数在中信30个行业指数中排名第28,在TMT四大行业中排名第2 [20] - 本周计算机个股中,ST峡创周涨幅达33.10%,位列涨幅榜首;淳中科技周跌幅为17.43%,位列跌幅榜首 [22] 投资建议与关注标的 - 建议关注奥比中光(3D视觉感知龙头) [5][16] - 建议关注智微智能(机器人大小脑控制器) [5][16] - 建议关注索辰科技(发布物理AI产品) [5][16] - 建议关注阿尔特(布局机器人赛道) [5][16]
瑞幸咖啡拟重新在美上市;段永平回应为何不买特斯拉丨Going Global
创业邦· 2025-11-16 10:53
出海四小龙动态 - 速卖通海外双11开卖当天至少有200个品牌销售额远超亚马逊日均水平达到2倍以上,其中EDIFIER、70mai、iGPSPORT等品牌销售额达亚马逊日均6到10倍[5] - 速卖通启动"超级品牌出海计划"让品牌以亚马逊一半成本实现更高成交,被业内视为唯一可能在品牌赛道与亚马逊竞争的平台[5] - TikTok Shop东南亚双11大促总交易额同比增长2.3倍,11月11日单日GMV同比激增60%创峰值纪录,平台发起超22万场直播且短视频带动GMV实现175%增长[6] - Lazada旗下LazMall在双11首日销售额较平日增长约10至11倍[6] 大公司战略动向 - 前DeepSeek研究员罗福莉加入小米参与Xiaomi MiMo推理大模型研发,致力于构建AGI(通用人工智能)[8] - 瑞幸咖啡CEO透露公司正全力推进重回美国主板上市,目前已在纽约曼哈顿开设5家门店[11] - 瑞幸大股东大钲资本考虑竞购可口可乐旗下Costa咖啡,估值约10亿英镑(13亿美元),而可口可乐2018年收购价为39亿英镑(51亿美元)[12][13] - CPE源峰向汉堡王中国注入3.5亿美元初始资金,若交易成功将持有83%股权,资金用于门店扩张、营销及菜单创新[19][20][21] - 滴滴自动驾驶与阿布扎比投资办公室达成战略合作,加入SAVI产业集群,计划拓展中东市场,预计SAVI到2045年贡献440亿迪拉姆GDP和4万个就业岗位[21][23][24] 科技与AI前沿 - 李飞飞提出空间智能是AI下一个前沿,指AI系统通过理解三维空间和时间实现感知、推理和行动的能力,其团队开发的Marble平台可快速生成可探索3D环境[15][16][17] - 成立仅一年的机器人公司K-Scale Labs因融资失败倒闭,现金储备仅40万美元,其双足行走机器人售价1.5万美元,公司估值曾达5000万美元[26] - OpenAI在四地试点ChatGPT群聊功能,支持最多20人协作,周活跃用户达8亿,公司已调整ChatGPT社交行为使其根据语境判断应答时机[27][28] - 苹果推出小程序合作伙伴计划,将开发者收益抽成降至15%,与微信就小程序手续费达成一致[30] 航天与高端制造 - 蓝色起源新格伦火箭首次执行NASA发射任务,成功部署两艘火星探测器,火箭高约320英尺(97.5米),助推器成功着陆大西洋驳船[31][33] - 新格伦火箭是蓝色起源深空计划核心,研发历时约十年,此次成功有望挑战SpaceX在发射行业的主导地位[33]
AI周报 | OpenAI推出GPT-5.1;李彦宏回应AI泡沫争议
第一财经· 2025-11-16 02:08
大模型技术演进 - OpenAI推出GPT-5.1,新模型包含GPT-5.1Instant和GPT‑5.1Thinking,重点在于提升回答的“人味”和“情绪价值”,例如在回应压力或尴尬场景时提供更具同理心的反馈 [1] - 相比GPT-5直接提供建议,GPT-5.1会先表达理解再给出建议,此次更新的核心是让人工智能说“人话”,在智力水平大幅提升存在挑战的背景下,提升“情商”成为重要方向 [1] - 李飞飞团队推出首款商用世界模型Marble,该模型能通过单张图片、视频或文本提示创建高保真、持久的3D世界,并支持大规模多模态输入,被定位为构建空间智能未来的基础 [7] AI产业生态与价值分配 - 百度李彦宏提出AI产业结构正从“正金字塔”转向“倒金字塔”,认为芯片不直接产生价值,应用才产生价值,健康的生态应是模型产生芯片10倍的价值,应用创造100倍的价值 [2] - AI的价值在于场景深耕而非底层硬件堆砌,从技术到应用的价值跃迁是AI可持续发展的关键,只有解决真实需求的应用才能兑现AI的商业价值 [2] - AI编程初创公司Cursor完成23亿美元D轮融资,投后估值达293亿美元,公司年化收入突破10亿美元,自2025年初以来收入增长100倍,显示出AI应用层的巨大价值潜力 [5][6] 巨头战略调整与资源投入 - Meta首席AI科学家杨立昆计划离职创业,背景是扎克伯格将公司AI重点从长期基础研究转向快速推出模型和产品,反映出巨头在AI竞争中的战略调整 [3] - 腾讯最新季度资本开支为129.83亿元,环比和同比分别减少32%和24,公司表示目前GPU资源完全够用,这可能意味着其近期放缓了AI基础设施建设速度 [8] - Anthropic计划投资500亿美元在美国建设AI基础设施,首批设施将于2026年投入运营,其竞争对手OpenAI等也在进行数十亿美元级别的数据中心投资 [13] AI硬件与基础设施市场 - AMD首席执行官苏姿丰表示,目标是在数据中心AI芯片市场获得“两位数”份额,预计到2030年数据中心芯片与系统市场规模将扩大至1万亿美元 [10][11] - 存储产品价格在双十一期间未降价甚至反扑,京东电脑内存金榜前十名产品价格相比10月初普遍上涨,超40%涨幅的有9款,反映出AI计算消耗存储产能导致供不应求 [12] - OpenAI的Sora项目日均烧钱约1500万美元,年化成本或超50亿美元,其项目负责人坦言目前的经济状况完全不可持续,凸显AI大模型运营的高成本挑战 [9] AI硬件产品与交互入口竞争 - 百度重新杀回AI眼镜战场,推出售价2299元的小度AI眼镜Pro,以拍摄、AI翻译、识物、备忘、录音为主要卖点,搭载多模态AI助手,争夺未来人机交互入口权 [4] - 在生成式AI浪潮与硬件技术突破下,智能眼镜被视为随身的“AI助理”,科技巨头正积极布局这一硬件形态 [4]
美股“反转”背后:重磅经济数据发布时间确定,12月降息概率跌破50%;孙正义的“OpenAI 炼金术”;巴菲特首次买入谷歌,持仓市值达49亿美元 | 一...
每日经济新闻· 2025-11-15 05:40
美股市场动态 - 美股市场于11月14日出现“V型反转”,道指一度跌超500点,纳斯达克一度跌近2%,但随后纳指转涨,最终标普500跌0.05%,道指跌0.65%,纳指涨0.13% [8][9] - 半导体芯片股逆势拉升成为市场情绪回暖主因,闪迪一度涨近10%,美光科技一度涨超7%,英伟达一度跌超3%后转涨1%,主要受三星电子将部分内存芯片价格较9月上调30%-60%的消息推动 [8] - 本周美股三大指数涨跌不一,道指累涨0.34%,纳指累跌0.45%,标普500指数累涨0.08% [41] 宏观经济与美联储政策 - 关键经济数据发布日程确定,美国9月非农就业报告将于11月20日发布,第三季度GDP修正值将于11月26日发布,但10月份消费者物价指数等部分数据发布仍存不确定性 [4][9] - 多位美联储官员对12月降息持谨慎态度,叠加经济数据不确定性,市场对美联储12月降息的预期已降至50%以下 [4][9][11] - 美国国会预算办公室计算显示,政府“停摆”使美国第四季度年化GDP增速被拉低1.5个百分点,造成约70至150亿美元的不可逆经济损失 [9] 软银集团战略与财务状况 - 软银集团在2025财年第二财季清仓其全部3210万股英伟达股票,套现58.3亿美元,以追加投资OpenAI [4][13][14] - 该集团第二财季净利润高达166亿美元,同比翻倍,其中146亿美元收益源于OpenAI估值从2600亿美元增长至5000亿美元 [13][17] - 在146亿美元的OpenAI投资收益中,有80亿美元源于对“远期合约”的会计处理,软银承诺于12月以2600亿美元估值追加投资225亿美元,但资金尚未支付便计入了利润 [19][21][24] - 财报发布后三个交易日,软银股价累计下跌12.8%,市值蒸发4.16万亿日元(约合269亿美元),自11月以来股价累计下跌近27% [13][15] 知名投资机构持仓变动 - 巴菲特旗下伯克希尔·哈撒韦在第三季度首次建仓谷歌A股,买入近1785万股,持仓市值达49.3亿美元,使其成为伯克希尔第十大持仓 [4][31][32] - 伯克希尔同期减持苹果公司股票近4179万股,减持比例约15%,苹果持仓占比从50%以上降至22.69%,但仍是其第一大持仓,市值约606.6亿美元 [32] - 全球最大对冲基金桥水在第三季度大幅减持英伟达约65.3%(从723万股降至251万股),并减持谷歌A(超50%)、微软(超35%)、META(48%)和亚马逊(近10%) [33] - 桥水同期大规模增持标普500ETF-IVV,增持比例高达75%,显示出防御性策略倾向 [33] 科技行业与AI领域动态 - 甲骨文股价连续五周下跌,本周累跌6.86%,较9月历史高点跌超35%,市值蒸发3488亿美元,市场担忧其激进的资本支出导致长期债务从一年前的750亿美元激增至约960亿美元 [41] - AI需求以“非线性速度”增长,到2028年可能导致美国出现高达20%的电力缺口,潜在缺口达13至44吉瓦,相当于超过3300万美国家庭的用电量 [40] - 微软首席执行官表示,公司策略并非押注为单一AI模型公司提供低利润算力,而是通过放缓扩张节奏以配合英伟达技术迭代速度,避免被单代技术的4~5年折旧期“困住” [39] - AI初创公司World Labs推出生成式3D世界生成系统Marble,其首席执行官指出AI发展的下一步关键在于赋予其“空间智能”,而非追求更大的语言模型 [38] 大宗商品与加密货币市场 - 本周纽约期金累涨1.86%至4084.4美元/盎司,纽约期银累涨4.69%至50.6美元/盎司,全球实物黄金ETF在10月流入达82亿美元,已连续五个月实现流入 [43] - 花旗集团预测在概率为30%的牛市情景下,金价可能在2027年底达到6000美元/盎司,但也给予50%的概率认为金价在2026年将回落至3650美元/盎司 [43] - 比特币本周跌超9%,一度跌破95000美元,24小时内加密货币市场超22万人被爆仓,爆仓总金额达10.77亿美元,分析指出市场已进入“确认的熊市阶段” [43][44]
李飞飞「世界模型」正式开放,人人可用, Pro版首月仅7元
36氪· 2025-11-14 13:36
产品发布与定位 - World Labs公司推出的Marble世界模型正式上线,面向公众开放使用[3][4][21] - 该产品是首个能创建持久化、可下载3D环境的世界模型,区别于实时生成模型[21] - Marble提供AI原生编辑工具和混合3D编辑器,用户可先构建空间结构框架再由AI填充细节[23] 核心技术功能 - 模型支持通过单张2D图片或简短文字提示生成完整的3D世界[34] - 支持多图像提示技术,能将针对世界不同部分的多样化提示图像无缝融合成统一3D世界[39][40] - 具备多模态输入能力,可接收照片或短视频素材组合生成包含现实空间元素的3D世界[44] - 内置AI原生世界编辑工具Chisel,支持移除物体、修饰区域、改变视觉风格等精细操作[47][52] 产品体验与效果 - 生成内容可任意旋转镜头、放大缩小,效果逼真类似3A游戏大作[11] - 支持将生成的世界导出为高斯溅射点、三角网格模型及视频格式[56][58][62] - 通过集成THREE.js的渲染器Spark,可在浏览器中实时渲染高斯溅射点[57] 商业模式与定价 - 目前提供免费版、标准版(20美元/月)、专业版(95美元/月)三档付费计划[82][84] - 免费版本限生成4个世界且仅支持图片上传,专业版最多可生成75个世界[82][83] - 下载作品及部分高级功能(如高质量网格创建、视频增强)需充值或订阅高级计划[22][87]
数字科技产业观察 | 双周要闻(2025年10月28日—11月14日)
每日经济新闻· 2025-11-14 08:53
部委政策导向 - 国务院办公厅提出加快场景培育和开放以推动新技术、新产品、新业态产业化应用,强调场景是连接技术和产业的重要载体 [1] - 工信部部署制造业中试平台建设,目标到2027年底基本建立现代化中试平台体系并初步形成全国制造业中试服务网络 [1] - 工信部启动2025年人工智能产业及赋能新型工业化创新任务揭榜挂帅工作,聚焦人工智能产业发展底座及"人工智能+制造"等重点方向 [1] 教育科技融合 - 教育部等七部门鼓励在科技教育中探索"双师课堂"和基于元宇宙虚拟实验室的"未来课堂" [2] - 课程资源将紧密围绕人工智能及量子信息等科技前沿领域,并加强前沿科技成果向课程教学资源转化 [2] 数据基础设施与物流 - 国家发展改革委等十部门推动物流数据开放互联,发布我国首张物流公共数据共享开放清单,十大类物流数据将向社会共享开放 [3] 地方数字化实践 - 江苏省政府支持利用人工智能、大数据、数字孪生等技术为体育赛事活动提供全链条场景创新,并建立赛事经济与体育消费大数据平台 [4] - 广东省文化和旅游厅征集智慧旅游优质项目,范围涵盖元宇宙沉浸式体验新空间及5G+AR直播等新一代信息技术在文旅场所的创新应用 [5][6] 行业应用与赛事 - "人工智能未来设计大赛・2025文旅应用赛"全国总决赛有49个优秀作品晋级,展示AI在文旅领域的创意应用 [7] - 小象智合展示AI时代包装产业从设计到交付的一站式服务新模式、新业态 [8] - 零克云参与北京1ms城市算力网存算分离拉远推理现网试验,在50km全光链路上部署政务客服智能体 [8] 前沿技术突破 - Neuralink脑机接口技术已植入12人累计使用超2000天,患者能力显著提升并计划进行首次升级或双芯片植入 [9] - 中国医疗AI模型MedGPT在引入"安全性"与"有效性"双轨评价体系的测评中以总分0.895的成绩位列第一 [10] 技术融合与产业洞察 - 张荣院士指出AI深度赋能将推动Micro-LED技术发展与生产效率新突破,而Micro-LED成熟也将反哺AI技术 [11] - 焦李成院士认为下一代遥感系统将演化为具备理解、推理与生成能力的智能体,实现从数据到决策的协同学习建模 [12][13] - 李飞飞提出空间智能将定义AI下一个十年发展方向,需构建超越大模型的世界模型 [14] 技术应用案例 - DeepMind开发的AI模型以80%概率提前3天锁定5级飓风"梅利莎"的路径和强度,今年首次被美国国家飓风中心使用 [15] - 华为云推出Versatile智能体平台与CloudDevice云终端协同,致力于解决大模型行业落地面临的开发门槛高、场景碎片化等痛点 [16]
李飞飞长文火爆硅谷
投资界· 2025-11-14 08:01
文章核心观点 - 空间智能是人工智能发展的下一个前沿领域,将推动大语言模型实现下一次质的飞跃 [4][6] - 构建具备空间智能的“世界模型”是解锁AI在创造力、机器人、科学、医疗和教育等领域潜力的关键技术路径 [8][16][18] - 世界模型需具备生成性、多模态和交互性三大核心能力,其技术挑战远超以往,但应用前景将深刻重塑人类与物理及虚拟世界的交互方式 [4][18][21] 空间智能的定义与重要性 - 空间智能是人类认知的脚手架,支撑着从日常动作到科学发现等一系列与物理世界互动的基础能力 [11][14] - 当前AI(如多模态大语言模型)的空间能力远未接近人类水平,在估计距离、方向、大小及预测物理规律等任务上存在根本性局限 [14][15] - 缺乏空间智能导致AI与物理现实脱节,无法安全驾驶汽车、引导家庭与医院中的机器人,或创造全新的沉浸式学习与娱乐体验 [16] 世界模型的核心能力与技术挑战 - 生成性:模型需能生成遵守物理定律、空间一致的虚拟世界,并保持世界状态的连贯性 [4][18][19] - 多模态:模型需能处理从图像、视频、深度图到文本指令、手势、动作等多种形式的输入 [4][19][20] - 交互性:模型需能根据输入的动作或目标,预测并输出世界的下一个状态 [4][20] - 技术挑战规模超越以往,需克服在通用训练任务函数、大规模多模态训练数据以及新型模型架构与表征学习等方面的巨大壁垒 [21][22][23] 世界模型的应用潜力 - 创造力:赋能电影人、游戏设计师、建筑师等创作者快速构建、迭代和探索三维世界,变革叙事与沉浸体验 [26][28][29] - 机器人:通过生成高质量仿真数据,扩展机器人学习,实现具备空间感知能力的人机协作伙伴及多样化的具身形态 [30][31][32] - 科学、医疗与教育:在科学研究中模拟实验、在医疗领域加速药物研发与辅助诊断、在教育领域实现沉浸式学习,增强人类专长与发现能力 [33][34][35] 行业发展趋势与公司进展 - World Labs公司成立于2024年初,致力于世界模型的基础性突破,其开发的Marble平台是全球首个可通过多模态输入生成一致性3D环境的世界模型 [8][23][26] - 行业共识认为,下一代世界模型将使机器在空间智能上达到新层次,开启AI理解与创造世界的时代,需要整个AI生态系统的集体努力 [24][26][27]
罗福莉C位亮相小米,离职DeepSeek后首次官宣
猿大侠· 2025-11-14 04:11
罗福莉加入小米事件概述 - 罗福莉正式官宣加入小米,出任MiMo团队负责人 [1][4] - 罗福莉在X平台宣布将带领团队推动多模态空间智能发展,这是实现通用人工智能的关键一步 [4] 事件背景与时间线 - 2023年底已有传闻称雷军以千万年薪将罗福莉从DeepSeek挖至小米 [5][10] - 2023年12月25日DeepSeek-V3版本上线并宣布全面开源 [6] - 2023年12月26日媒体曝出小米正在组建GPU万卡集群 [7] - 2023年12月31日雷军在跨年直播中披露小米AI野心,汽车业务步入正轨后全力进军AI [8][9] - 上月小米AI团队论文作者栏已出现罗福莉名字,但标注为独立研究者 [11][13] 罗福莉专业背景 - 本科毕业于北京师范大学计算机专业,硕士就读于北京大学计算语言学 [15] - 曾任职阿里巴巴达摩院机器智能实验室研究员,负责开发多语言预训练模型VECO及AliceMind项目开源 [17] - 2022年加入DeepSeek母公司幻方量化,后担任DeepSeek深度学习研究员,参与研发DeepSeek-V2等模型 [17] - 学术论文总引用次数超过1.1万次,2024年新增约八千次引用 [18] - 在DeepSeek最新的Nature封面论文中列名,明确了对模型的工作贡献 [19] 小米AI战略方向 - MiMo是小米推进大模型研发的核心招牌,目标指向空间智能 [23][24] - 空间智能旨在从语言世界走向物理世界,具备感知、推理、生成与行动能力,实现比特世界与原子世界的智能贯通 [24][26] - 该技术愿景与小米人、车、家全生态战略天然适配 [26] - 罗福莉的官宣明确了小米MiMo团队的前沿方向 [24]
李飞飞3D世界模型公测,网友已经玩疯了
具身智能之心· 2025-11-14 01:02
Marble模型核心特点 - 李飞飞创立的World Lab推出全新3D世界生成模型Marble 开启公测 人人可玩[1][3] - 模型支持通过文本 照片 短视频轻松生成可编辑 可下载的专属3D世界 无需专业团队建模[5] - 生成的世界可长久保存 直接下载 支持多种输入方式包括文本 图像 视频 粗略3D布局等[35] 多模态生成与编辑能力 - 支持通过简短文本提示 单图提示生成3D世界 还能通过多张图片 不同视角图片拼接成统一世界[17] - 内置AI原生世界编辑工具 可进行局部编辑如移除物体 修饰区域 也可彻底改变视觉风格或重构大片区域[21] - 针对专业用户推出原生AI工具Chisel 可直接在3D中塑造Marble世界[23] 导出与兼容性 - 提供两种导出方式:导出为高斯散点(最高保真度呈现)和三角形网格(与行业标准工具兼容)[29] - 3D世界可渲染成视频 导出后视频可进行增强 添加细节 去除瑕疵并融入动态元素[31] - 组合模式能将任意数量世界组合起来 构建更广阔空间[27] 技术发展方向 - 未来重点发力交互性 从静态创造转向动态交互 实现与3D世界内元素的实时互动[36][37] - 模型发展方向与李飞飞提出的空间智能三大核心能力一致:生成 多模态 交互[37][40] - 作为World Lab首款商业世界模型产品 Marble代表了世界模型赛道的加速发展[3][34]
一句话,就能创造出随便乱逛的3D世界!
自动驾驶之心· 2025-11-14 00:04
产品发布与定位 - WorldLabs公司正式推出名为Marble的生成式世界模型产品,该产品面向全球用户开放使用[2][7] - Marble是新一代世界模型,能够通过单张图片或简短文字提示创建完整的3D世界[41] - 该产品与公司自家实时模型RTFM的区别在于能创建持久化、可下载的3D环境,而非实时生成世界[28] - 产品定位为AI原生编辑工具,提供混合3D编辑器功能,用户可先构建空间结构框架再由AI填充细节[31] 技术功能特点 - 模型支持多模态输入,包括2D图片、3D模型(需付费)、文本提示、多图像和短视频,可生成多种场景类型与艺术风格的3D世界[16][42][48] - 内置AI原生编辑工具,支持局部物体移除、区域修饰、风格替换和结构重构等精细操作[50] - 推出Chisel功能,允许用户在三维空间中直接雕琢世界布局,实现对物体尺寸和位置的精确控制[55] - 导出选项包括高斯溅射点(最高保真度)、三角网格模型(含低精度碰撞体网格)和视频格式,支持与THREE.js等行业标准工具集成[58][60][65] 产品发展历程 - 模型两个月前以限量测试版亮相,此次为正式上线[28] - 去年十二月公司展示的早期模型仅能通过单张图像生成交互式3D场景,且移动范围受限并存在渲染错误[32][33] - 当前版本实现重大突破,生成内容可任意旋转镜头、放大缩小,效果逼真度显著提升[14][34] 商业模式与定价 - 采用分级订阅制,免费版可生成4个世界,标准版月费20美元(首月1美元),专业版月费95美元可生成75个世界[83][84][85] - 付费功能包括3D模型上传、多图像/视频输入、世界编辑和高质量网格导出等[29][88] - 商业权利仅向标准版及以上用户开放,高阶版本提供更多积分和生成次数[88] 行业影响与愿景 - 产品发布契合李飞飞提出的"空间智能"概念,被视为AI下一个十年的关键发展方向[5][71] - 世界模型被定义为具备多模态能力,能整合视觉、听觉、触觉与语言信号构建三维世界[36][38] - 未来重点将聚焦交互性突破,为仿真、机器人技术等领域解锁新应用场景[69][70]