Workflow
空间智能
icon
搜索文档
AI无限生成《我的世界》,玩家动动键盘鼠标自主控制!国产交互式世界模型来了
量子位· 2025-05-13 03:01
核心观点 - 昆仑万维推出的Matrix-Game通过AI技术实现交互式虚拟世界生成,用户可通过简单键鼠指令自由探索和创作高保真虚拟内容[10] - 该技术突破传统手写代码和渲染方式,大幅降低创作门槛并提升效率[11] - Matrix-Game在视觉质量、时间一致性、交互可控性和物理规则理解四大维度全面领先现有开源模型[36] - 空间智能成为AI发展新方向,3D AIGC技术正在重塑虚拟内容创作和交互方式[43][48] 技术实现 数据集构建 - Matrix-Game-MC数据集包含无标签Minecraft视频和带控制信号的可控视频数据[14] - 采用三阶段过滤机制从6000小时数据中筛选出近千小时高质量内容[16][17] - 通过探索代理和程序化模拟生成数千小时可控监督数据[17] 主模型架构 - 基于扩散模型框架,包含图像到世界建模、自回归视频生成和可控交互设计[18][20] - 图像到世界建模以单张图像为起点,结合用户动作输入生成视频内容[20] - 自回归生成以前5帧为上下文确保时间连贯性,采用扰动和分类引导策略缓解误差[23][24][25] - 动作控制模块采用离散/连续token表达,结合多模态Diffusion Transformer架构[27] 性能表现 评测体系 - GameWorld Score首次实现感知质量+控制能力+物理合理性的综合评估[29][30] - 四大核心维度:视觉质量、时间一致性、交互可控性、物理规则理解[31][32][33][34] 对比结果 - 在8大Minecraft场景中全面超越Decart的Oasis和微软的MineWorld[36] - 用户偏好率达96.3%,视觉质量偏好率98.23%[37] - 键盘动作准确率90%+,鼠标视角控制精度达0.97-0.98[39][40] 行业应用 - 可应用于游戏世界搭建、影视/元宇宙内容生产、具身智能训练等领域[41] - 实现低成本高效率生成高保真可交互虚拟环境[42] - 3D AIGC技术成为大模型发展新方向,谷歌DeepMind、腾讯等巨头均已布局[45][46] - 空间智能将重塑人机交互方式,是下一代AI技术的重要赛道[48][49]
生成视频好看还不够,还要能自由探索!昆仑万维开源Matrix-Game,单图打造游戏世界
机器之心· 2025-05-13 02:37
世界模型技术进展 - 开源世界模型Oasis首次实现实时可交互虚拟环境,包含画面及物理规则理解[1] - 微软开源MineWorld提升视觉效果和动作生成一致性[2][3] - 创业公司开源"多元宇宙"支持多玩家在同一世界模型游戏[4] - 英伟达提出"物理图灵测试"作为具身智能新标准[4] Matrix-Game技术突破 - 昆仑万维开源17B参数世界基础模型Matrix-Game,实现完整可交互游戏世界生成[6][10] - 模型特点包括细粒度交互控制(键盘指令准确率超90%)、高保真视觉物理一致性、多场景泛化能力[17][20][25][26] - 建立GameWorld Score评估体系,在视觉质量(0.72)、时间一致性(0.97)、交互可控性(0.95)、物理规则(0.76)四大维度超越竞品[30][31][35] 技术实现路径 - 采用两阶段训练策略:无标签数据预训练+标注数据可控训练[41] - 构建Matrix-Game-MC数据集,包含2700小时中质量+870小时高质量无标签数据及1000小时有标签数据[41][42] - 模型架构基于图像到世界建模,通过DiT生成潜在表示并由3D VAE解码为视频序列[44][45] 应用场景与行业影响 - 应用领域涵盖游戏开发、具身智能训练、影视与元宇宙内容生产[7][51] - 可与公司其他AI产品(天工大模型、Mureka、SkyReels)联动构建完整创作生态[51][52] - 代表空间智能发展方向,推动国内在交互式视频生成领域的技术突破[50][51] 行业趋势 - 三维世界AI研究加速发展,计算平台可能从处理token转向处理原子级单位[4] - 空间智能被视为生成式AI下一个发展方向,将推动更高级的智能实现[48][49] - 行业呈现技术全面兴起态势,类似大模型爆发的局面可能重演[4]
群核科技(DY1479HK):一文看懂全球空间智能独角兽
华西证券· 2025-05-12 11:13
报告公司投资评级 未提及 报告的核心观点 - 空间智能设计行业规模可观且潜力巨大,国内市场正高速增长,预计2028年全球和中国市场规模将分别突破369亿元和达到68亿元,合成数据潜在市场空间大,预计2028年国内基础数据服务市场规模近200亿元 [3][4] - 群核科技卡位空间智能服务,在国内空间设计领域独占鳌头,技术优势显著,可延伸至多生态领域,提前布局合成数据赛道,打开新增长曲线 [4] - 公司产品裂变式增长,PLG模式的“飞轮效应”加速,盈利拐点已现,收入有望快速增长,利润端将逐步释放 [4] 根据相关目录分别进行总结 图解群核科技的概况 - 业务概况:拥有多元化产品矩阵,包括空间设计与可视化平台酷家乐、进军海外市场的核心抓手Coohom、合成数据服务群核空间智能平台、面向公装商装领域的群核酷空间、提供营销数字化服务的美间等,应用于多场景 [9] - 发展历程:经历创立与初期探索、产品迭代与市场拓展、技术深化与行业赋能、生态布局与全球化四个阶段,形成全链路数字化解决方案 [10] - 创始人与重要股东:创始人与核心管理层经验丰富,三位创始人合计持股30.72%,引入了IDG、GGV等知名投资机构 [12][14] - 研发投入与用户增长:收入持续增长,规模持续扩张,2023/2024Q1 - Q3收入分别同比增长10.5%/13.8%,经调整净亏损缩减;研发投入高,费率逐步回落,产品不断升级创新,用户周活攀升 [22][26][29] 如何理解群核的竞争壁垒 - 技术壁垒:自建GPU集群驱动多场景应用,启真引擎实现真实感渲染突破,矩阵引擎实现真正一体化,AI与AIGC协同赋能,打造空间设计新范式 [32][34][38] - 生态与数据壁垒:拥有3.6亿个3D商品素材模型,是全球最大的空间设计平台,净收益留存率稳定在100%以上,平台网络效应多维显现,形成正向生态闭环 [32][57] - 商业模式壁垒:以企业与大客户为核心,打造“高留存 + 低流失”平台型商业模式,订阅收入结构呈现“高集中、强粘性”特征 [63] - 与竞品对比:酷家乐渲染效果与效率双领先,性能优势显著,形成“设计 - 渲染 - 图纸 - 报价”一体化的高效闭环 [64][67] - 竞争格局:通过覆盖全流程的数字化设计平台,在空间设计软件行业中位居第一,形成上下游广泛客户基础 [74] 群核的商业模式如何落地 - 盈利模式:通过提供多级订阅满足客户需要,构建“个人订阅 + 企业定制”双轮驱动的盈利体系,企业客户占据订阅收入大部分,个人客户订阅收入呈高速增长态势 [79][80][85] - 销售模式:采用“直销为主、第三方代理为辅”的销售模式,全球化直销网络是核心收入来源,第三方代理是补充销售方式 [88] 未来空间展望 - 空间设计软件行业:赛道扩容趋势下,当前应用场景广阔,未来应用场景多样,包括家居设计、3D可视化市场、虚拟场景融合AI技术在电商领域的应用等 [90][92][109] - 合成数据:作为新衍生赛道,潜在市场空间巨大,群核科技属于第一梯队成员,合成数据较真实数据具有超高性价比 [115][120][123] - 海外发展:酷家乐海外版Coohom服务全球超200个国家和地区,获得多个权威软件评测网站高度评价,已在10多个国家设本地团队,未来有望进一步扩大海外市场 [127][130] 本次募集用途分析 - 扩大全球版图:以美国、韩国、日本及东南亚为重点进行国际扩张,加强客户支援,开设办事处,建立合作伙伴关系 [132] - 持续优化产品及开拓新业务场景:增强产品主要功能,拓展至新垂直领域及业务场景 [132] - 扩大客户群体:调整销售团队,针对不同规模企业提供不同服务,在多渠道推广品牌 [132] - 持续进行技术投资:投资核心技术与基础设施,升级技术,探索新人工智能用例 [132]
虞晶怡教授:大模型的潜力在空间智能,但我们对此还远没有共识
36氪· 2025-05-09 09:34
生成式AI与空间智能技术发展 - 大模型技术仍有潜力未被充分挖掘 跨模态整合是未来重点方向[10][11] - 空间智能从数字孪生向智能理解进化 生成式AI推动三维场景理解与创造[12][13] - 文生3D技术突破传统建模限制 单张图片即可生成高质量三维模型[14][15] - 3D数据严重不足是当前主要瓶颈 真实场景的物体交互数据尤其匮乏[18][26] - 感知系统将发生革命性变革 未来可能出现全视角成像技术[28][36] 空间智能应用场景与商业化路径 - 短期聚焦影视娱乐与艺术创作 中长期将成具身智能核心基础模型[41][42] - 低空经济是潜力应用领域 需厘米级精度空间智能支持[43][44] - 养老机器人需解决翻身与洗澡两大核心问题 预计15年内成熟[47] - AI陪伴机器人技术已趋成熟 情感交互能力显著提升[48] - 本地化计算解决同步问题 低功耗推理芯片是关键[45][46] 行业研究格局与技术创新方向 - 工业界主导技术研发 Meta OpenAI等公司在空间智能领域领先[31][33] - 感知-认知-行为需整体考量 多模态结合弥补数据不足[36][37] - 具身智能需重新定义设计标准 鲁棒性和安全性取代精度[39][40] - 三维数据表达尚未统一 NeRF SDF等技术各有优劣[26][29] - 国内产学合作不足 制约技术发展速度[34] 教育领域变革趋势 - 编程课程将提前至高中阶段 CS基础成为必修内容[50] - AI课程将成通识教育 所有专业需掌握基础知识[50] - 教学模式转向短课程快迭代 紧密对接工业需求[51] - 教师需持续更新知识 传统教学内容面临挑战[51]
虞晶怡教授:大模型的潜力在空间智能,但我们对此还远没有共识|Al&Society百人百问
腾讯研究院· 2025-05-09 08:20
大模型技术发展 - 当前技术发展尚未遇到极限 跨模态整合仍有巨大潜力未被挖掘 如DALL-E 3结合语言模型与扩散模型已实现惊人图像生成效果 [10] - GPT-4o采用语言模型的Next-Token-Prediction方式 展示出图像编辑和用户需求理解的突破性能力 [10] - Scaling law在多模态背景下讨论为时尚早 当前重点在于深度挖掘语言模型能力并探索与其他模态结合的上限 [11] 空间智能演进 - 发展历程从数字孪生/仿真平台起步 逐步扩展至VR/元宇宙 光场技术提升沉浸体验质量 [12] - 神经网络技术如NeRF推动空间智能从数字复刻转向智能理解 生成式AI进一步实现空间创造能力 [12] - 文生3D技术突破传统建模限制 通过单张图片实时生成三维结构 CLAY项目获SIGGRAPH最佳论文提名 [14] 关键技术瓶颈 - 3D场景数据严重不足 真实世界复杂物体交互数据尤其匮乏 如家庭环境物品分布变化案例 [18] - 三维表达方式未统一 NeRF/SDF/Mesh参数化等方案各有优劣 影响数据利用效率 [26] - 物理规则建模是核心难点 需解决物体间动态关系模拟 如堆叠物体操作中的连锁反应 [20] 行业应用前景 - 短期聚焦影视/游戏内容生成 大幅降低元宇宙构建成本 中长期成为具身智能基础模型 [42] - 低空经济是潜力场景 无人机配送需厘米级空间精度 相关研究年底将展示demo [45] - 养老机器人需突破翻身/洗澡等刚需功能 15年内有望成熟 需解决负重与安全平衡 [49] 研究方法论创新 - 引入"行动者网络理论" 认为三维物体具有潜在行动力 其变化会显著影响环境 [16] - 整体性方法强调感知-认知-行为协同 如NLOS成像技术可推断物体背面几何形态 [36][37] - 合成数据与真实数据互补 通过跨模态学习缓解3D数据不足 如文本描述辅助推断物体关系 [19] 教育范式变革 - 编程课程将提前至高中阶段 学生接受度与能力提升显著 AI课程将成为通识教育 [52] - 教学模式转向短课程快迭代 美国quarter system显示课时压缩有助于内容更新 [8][53] - 教师需对接工业界痛点 传统教材被教参取代 持续学习能力成为核心要求 [53]
特斯联发布2024年财报:在手订单金额达23亿元 升级“空间智能”三大战略
证券日报网· 2025-05-05 08:46
财务表现 - 2024年公司营收18.43亿元,同比增长83.2%,2022-2024年复合增长率58.0% [2] - 截至2024年底在手订单金额23亿元 [2] - 三费费用率从2023年76.9%降至45%,应收账款周转天数从2022年238天缩短至104天 [2] 客户与收入结构 - 总客户数量从2022年224个增至2024年342个,其中74.5%来自产业数智化业务 [2][3] - AI产业数智化业务收入16.4亿元,同比上涨162.9%,占总收入89% [3] - 客单价提升、行业战略聚焦、获客策略精准构建业绩增长基础 [4] 资本与融资 - 新增融资6.5亿元,投资方包括国有资本和产业基金 [3] 业务与技术布局 - 公司为空间全场景提供AIoT产品及解决方案,赋能企业及公共管理者 [5] - DeepSeek-R1模型发布推动技术变革,强化空间智能领域布局 [5] - 业务体系升级聚焦AIoT模型、基础设施、智能体三大方向 [5]
特斯联升级三大战略构建空间智能
和讯· 2025-05-03 10:00
文章核心观点 公司营收大幅上涨、客户数量持续增长、降本增效成果显著,业务聚焦发力空间智能,整体呈现积极发展势头,充足资金储备为冲刺 IPO 提供财力保障 [1][2] 公司业绩情况 - 2024 年营收 18.43 亿元,相较 2023 年同比大幅提升 83.2%,2022 - 2024 年营收年复合增长率达 58.0% [1] - 2024 年三费费用率由 2023 年的 76.9% 下降至 45.0%,应收账款周转天数从 2022 年的 238 天、2023 年的 180 天,2024 年进一步缩短至 104 天 [1] 收入结构与客户情况 - 2024 年 AI 产业数智化业务收入自 2023 年的 6.24 亿大幅上涨 162.9% 至 16.4 亿,占全年总收入的 89% [2] - 年度总客户数量由 2023 年的 330 个提升至 342 个,其中 255 个来自产业数智化业务,约占总客户数量的 74.5% [2] - 截至 2024 年 12 月 31 日,在手订单金额达 23 亿元 [2] 新增投资情况 - 特斯联 D++ 轮投资获得所得款项 6.55 亿元,新入股股东包含青岛汇铸、诺哲瑞英等 [1] 战略板块情况 - 招股书中更新三大战略板块:AIoT 领域模型、AIoT 基础设施及 AIoT 智能体,全面发力空间智能 [2] - 生成式 AI 与大模型的结合为空间智能发展带来全新机遇,AIoT 智算基础设施与领域模型组合叠加多模态大模型驱动的 AIoT 智能体,或成 AIoT 侧推动空间智能发展的高效路径 [2] - 以 AIoT 起家的公司天然具备软硬结合基因,贯通顶层模型、应用及底层基础设施的业务是独特优势 [2]
特斯联更新招股书:年营收超18亿、大涨83.2%,瞄准空间智能
36氪· 2025-04-30 15:32
行业趋势 - 2025年全球物联网设备连接数量预计突破300亿,AIoT作为人工智能与物理实体的超级连接器,正重塑产业格局 [1] - 5G、生成式AI、空间计算等技术交叉融合,推动AIoT迅猛发展 [1] - 中国AIoT企业展现出端侧AI算力突破、行业大模型沉淀、生态协同能力三大优势 [1] 公司业绩 - 公司2024年收入达18.43亿元,同比增长83.2%,2022-2024年复合增长率达58.0% [1] - AI产业数智化业务收入从2023年6.24亿大幅提升至2024年16.4亿,涨幅达162.9% [3] - 截至2024年底,公司订单金额已达23亿 [6] 业务布局 - 公司构建了覆盖AI产业数智化、AI城市、AI人居、AI能源等领域的AIoT场景矩阵 [3] - 形成AIoT领域模型、AIoT基础设施、AIoT智能体三大产品架构 [3] - AIoT领域模型基于DeepSeek融合基座,采用多模态技术路径,实现跨场景联动控制 [5] - AIoT基础设施以高效能绿色智算体为核心,适配DeepSeek系列模型 [5] - AIoT智能体依托具身智能机器人与穿戴设备,提升B、C端用户体验 [5] 市场拓展 - 产品覆盖全球160个城市,超800家客户端部署,拥有生态伙伴约1300个 [6] - 客户数量从2022年224个增长至2024年342个,客户结构优化 [6] - 应收账款周转天数从2022年238天降至2024年104天 [6] - 围绕"一带一路"加速全球业务扩张,拓展海外版图 [6] 技术验证 - 在2020年迪拜世博会中,公司泰坦系列机器人完成8.4万小时服务,对话超65万次,行程超32.2万公里,服务1250万名访客,无重大故障 [6]
特斯联更新招股书:2024年营收增速超83%,战略升级卡位空间智能万亿赛道
格隆汇· 2025-04-30 14:58
核心观点 - 特斯联2024年营收18.43亿元,同比增长83.2%,2022-2024年复合增长率达58.0%,成为AI行业增速最快的公司之一 [1][3] - 公司运营效率显著提升,费用率从2023年的76.9%下降至45.0%,应收账款周转天数从2022年的238天压缩至2024年的104天 [4] - 2025年D++轮融资获得6.5亿元,新股东包括青岛汇铸、诺哲瑞英等机构,上市前财力储备充足 [4] - AI产业数智化业务2024年同比增长162.9%至16.4亿,占总收入89%,客户数量从2022年224个增至2024年342个,在手订单约23亿 [5] 财务表现 - 2024年营收18.43亿元,同比增长83.2%,显著优于行业平均水平 [3] - 2022-2024年营收复合增长率达58.0%,展现强劲成长动能 [3] - 费用率从2023年76.9%优化至2024年45.0%,运营效率飞跃式提升 [4] - 应收账款周转天数从2022年238天压缩至2024年104天,资金周转效率显著改善 [4] 业务布局 - AI产业数智化业务2024年同比增长162.9%至16.4亿,占总收入89% [5] - 形成"AIoT领域模型+AIoT基础设施+AIoT智能体"三位一体空间智能战略布局 [7][8] - 全球160座城市落地近万个空间智能项目,覆盖中国、阿联酋等市场,积累800多个客户 [8] - 绿色智算体已在徐州智算中心及摩托车行业上市厂商落地应用 [8] - 迪拜世博会期间泰坦系列机器人服务超84000小时,进行65万次对话,行程32.2万公里无重大故障 [8] 行业机遇 - 全球空间计算市场规模2024年约1495.9亿美元,预计2034年达10661.3亿美元,年复合增长率21.7% [9] - 亚太市场空间计算年复合增长率22.2%,高于全球平均水平 [9] - 行业数智化需求爆发,特斯联凭借领先产品和解决方案持续转化客户订单 [4] - 大模型技术普及为空间智能创造巨大想象空间,将重塑各领域生产方式 [7]
“六小龙”中首家启动上市进程,群核科技赴港上市获反馈意见
南方都市报· 2025-04-25 08:16
公司上市进展 - 群核科技拟赴香港上市 已获证监会反馈意见要求补充材料 [2] - 证监会要求公司补充说明股权架构搭建及返程并购合规性 包括外汇登记 境外投资等程序履行情况 [2] - 需说明2022年收购境内运营实体股权的定价依据 支付合规性及纳税情况 [3] - 需披露增值电信业务是否涉及外商投资负面清单限制领域 [3] 公司业务与市场地位 - 公司主打产品为空间设计软件酷家乐及海外版Coohom 采用AI技术和GPU集群驱动的云平台 [2] - 按2023年平均月活跃用户计算 公司为全球最大空间设计平台 [4] - 商业模式采用订阅制 2022-2024年前三季度营收分别为6 01亿元 6 64亿元和5 52亿元 [4] - 同期经调整亏损净额持续收窄 分别为3 38亿元 2 42亿元和0 94亿元 [4] 公司发展背景 - 公司为"杭州六小龙"成员 是其中首家启动上市的企业 [2] - 创始人黄晓煌为英伟达前工程师 2011年与校友共同创立公司 [4] - 募集资金将重点投向营销及研发 通过规模效应降低经营开支占比 [4] 监管关注重点 - 需说明公司数字产品涉及的信息内容类型及数据安全保护措施 [3] - 需披露用户信息收集规模及上市前后数据安全安排 [3]