空间智能

搜索文档
拿下3D生成行业新标杆!昆仑万维Matrix-3D新模型鲨疯了,一张图建模游戏场景
量子位· 2025-08-12 02:27
3D生成技术突破 - Matrix-3D由昆仑万维推出,支持从单图像生成高质量、可自由探索的3D全景场景,几何关系准确且色彩自然[10][11][15] - 模型在主流评估指标上超越360DVD、Imagine360和GenEx,取得全景视频生成任务的SOTA成绩[11] - 支持360°自由视角浏览、大范围场景生成及自定义运动轨迹控制,泛化能力显著优于现有方法[21][25][28] 核心技术优势 - 采用全景图而非透视图作为中间表达,突破视角范围限制,提升沉浸感与下游应用兼容性[46][47][49] - 通过网格渲染策略增强几何一致性与色彩一致性,避免噪声条纹问题[54][55] - 提供双路径3D重建方案:前馈神经网络方案10秒完成生成,3DGS优化方案实现精细场景[40][68] 数据与训练创新 - 自建Matrix-Pano数据集包含116K条全景视频序列(22M帧),覆盖504个3D场景及多样天气光照条件[64][65] - 训练中引入LoRA微调与Cross Attention机制,提升生成精度与控制能力[53][60][62] - 采用自动化轨迹生成系统,确保视频物理合理性与工业级平滑效果[69][70] 公司战略布局 - 昆仑万维持续加码空间智能领域,Matrix系列已涵盖3D场景生成与可交互视频生成,形成技术矩阵[12][75][85] - 2024年研发费用达15.4亿元(同比+59.5%),研发团队1554人占比73.41%,资源投入行业领先[87][88] - 技术路径覆盖"AI基础研究-基座模型-产品应用"全链条,目标构建AGI关键能力[83][84][89] 行业应用前景 - 3D生成技术可赋能VR虚拟现实、游戏开发及影视制作,推动数字世界内容生产效率[77] - 空间智能被视为实现AGI的核心技术,自动驾驶与具身智能为物理世界重要落地方向[78][80] - 开源策略加速生态构建,Matrix-Game与Matrix-3D均为工业界首批10B+级空间智能开源模型[12][82]
滨江物业与宇泛智能达成深度合作 开启智慧物业新范式
证券时报网· 2025-08-11 13:34
合作概述 - 滨江服务与宇泛智能达成深度合作 启动覆盖近8000万平方米的"AI+物业"行业新范式 [1] - 合作聚焦AI智能化发展及机器人应用领域 包括方案研发 产品试用及市场商用推广 [1] - 目标包括运营效率提升 能耗管理与降低成本 服务体验升级以及机器人应用服务 [1] 行业背景 - 物业管理行业面临"不可能三角"困境 即人力成本刚性上涨 服务响应速度 收费控制难度和利润提升压力并存 [2] - 2021年至2024年间 TOP50物业企业均将降本增效列为数字化战略首要目标 96%的企业重视以客户需求为核心 [2] - 政府工作报告首次写入"好房子" 明确提出"安全 舒适 绿色 智慧"要求 [2] 技术应用与实施规划 - 通过AI替代人工重复流程提升服务响应效率 运用无人机与机器人自动巡检预警设施隐患 [3] - 对照明 空调等系统进行智能化改造实现能耗动态精准调节 引入无感通行 智能助理等技术升级业主体验 [3] - 合作分短 中 长期推进:短期聚焦智能巡检与空调照明节能 中期用AI替代人力实现公共区域自动化 长期在机器人能力成熟后进入家庭提供个性化服务 [3] 宇泛智能技术优势 - 采用AIoT平台和AI硬件服务全场景智慧城市建设 2020年12月完成近5亿元B2轮融资 2023年5月完成C1轮融资 [4] - 提出"空间智能"理念 通过AI技术赋能住宅 公共空间和城市空间 [4] - 创新"AI硬件即服务"模式 将工地场景安全管理模型迁移至社区应用使开发周期缩短80% [5] 市场定位与协同效应 - 滨江服务在杭州高端住宅市场占有率超50% 拥有高净值 高要求客户群 [5] - 宇泛智能早期聚焦房地产增量市场 后战略转向提升存量物业智能化水平 分为住宅型物业 商业物业和城市物业三大类 [4] - 双方计划为重点小区定制个性化智慧服务方案 探索未来社区可能性 [5] 未来发展方向 - 宇泛智能将从室外向室内拓展 重点研发幕墙清洁机器人和公共区域立体清洁技术 [5] - 未来3-5年物业服务重点在公区服务如巡逻 倒垃圾 送快递等 提升小区门口到家门口的服务体验 [6] - 未来5-10年可能将AI拓展至入户服务 实现更多家庭场景的AI赋能 [6]
AI 编程冲击来袭,程序员怎么办?IDEA研究院张磊:底层系统能力才是护城河
AI前线· 2025-08-10 05:33
多模态智能体的发展现状与挑战 - 实现智能体"看懂、想透、做好"需整合视觉理解、语言推理与物理执行能力,是多模态领域的核心挑战 [5] - 视觉输入维度极高且涉及三维结构理解,需结合交互知识(如物体操作判断),当前技术距离理想目标仍有差距 [6] - 空间智能对机器人操作至关重要,但现有视觉-语言-行动模型(VLA)因缺乏物体精确定位,实际成功率远低于实用水平 [7][8] 技术落地的可行路径 - 从"半结构化"场景(如产线灵活操作)切入是务实选择,介于高重复性结构化与全开放环境之间 [11] - 工业场景中,危险操作或遥操作结合智能的闭环迭代可驱动技术进步,但家庭等开放环境落地需超5年时间 [10][11] - 视觉与三维表征方法尚未统一,斯坦福团队主张三维内部表示是建模关键,但技术鸿沟仍需逐步填补 [9] 工业界研究的平衡之道 - 研究价值评估需兼顾学术与应用双维度,避免仅追求论文发表而忽视实际问题解决 [12] - 产品开发与研究探索节奏差异显著,需给予研究人员探索空间,同时确保方向与产品关联 [14] - 目标检测等基础问题仍存挑战,突破后将带来广泛价值,需坚持本质问题研究而非跟风热点 [13] 人才培养与底层能力 - 系统级能力(如分布式计算、GPU架构优化)比模型调参经验更关键,FlashAttention案例显示基础优化可推动领域进步 [17][18] - 计算机科学基础学科训练优于过早专攻应用方向,扎实的体系结构理解能适应技术迭代 [20] - AI时代程序员需超越基础编码,通过协作提升编程深度,聚焦AI无法替代的贡献 [19][20] 行业会议与趋势聚焦 - AICon大会聚焦Agent、多模态等方向,探讨大模型降本增效案例,反映企业级AI应用趋势 [3][21]
腾讯加码空间智能大模型,这一赛道正在成为下一个风口
首席商业评论· 2025-08-09 04:17
腾讯混元3D模型的技术突破 - 腾讯在2025世界人工智能大会上正式发布并开源「混元3D世界模型1.0」,支持通过文本或图像生成完整3D场景,具备360°沉浸式漫游、资产导出为标准mesh格式等功能,实现从"AI能画"到"人能用"的跃迁 [3] - 该模型在Hugging Face平台下载量已超过230万,成为最受欢迎的3D开源模型之一 [3] - 混元3D模型从"重建一个物体"升级到"生成一个场景"再到"理解一个世界",目标是生成创作者可直接使用的可交付资产 [5] - 在生成质量上全面超过SOTA开源模型,包括纹理细节、美学质量、指令遵循等评价维度 [7] - 采用创新的"2D+3D结合"混合路线,既保持空间结构稳定性又丰富交互动态效果,解决了纯3D生成多样性不足和纯2D视频生成空间不稳定的问题 [8] 混元3D模型的应用价值 - 对游戏开发者是生产力革命,可将场景搭建时间从数周/月缩短至一句指令生成原型,极大降低试错成本并提升资产生产效率 [9] - 对普通3D爱好者彻底降低创作门槛,无需专业建模软件即可创造虚拟世界并导入Vision Pro等设备体验 [9] - 支持基于文本/图像输入生成360度沉浸式三维场景,如输入"一个破旧的加油站,夜晚下着雨,远处有霓虹灯"即可构建完整空间环境 [8] - 生成的世界支持自由漫游交互,具有空间连续性,解决了同类模型视角丢失和缺乏连续性的痛点 [8] 空间智能与世界模型的发展 - 空间智能被认为是AI下一个创新重要节点,让机器理解三维物理世界,实现"我看、我动、我思"的融合 [11][12] - 世界模型是通用智能体的必要条件,能进行内部模拟、计划调整和跨模态推理,体现具身智能的高级阶段 [13] - 谷歌DeepMind研究证明,任何能完成复杂任务的通用AI体内部必然编码了世界模型,AI能力上限取决于世界模型的保真度 [13][14] - 行业巨头纷纷布局:英伟达推出Cosmos世界模型,谷歌DeepMind组建专门团队并发布Genie 3,李飞飞创立World Labs等 [14] 腾讯的AI战略布局 - 2024年腾讯AI相关资本开支达767亿元,同比增长221%,计划2025年进一步加大投入占收入十几个百分点 [24] - 混元大模型形成完整梯队,从0.5B-7B小模型到52B大模型和MoE架构模型,覆盖端侧到云端 [24] - 混元TurboS在全球权威评测中排名前八,理科推理提升超10%,代码能力提升24%,竞赛数学成绩提升39% [24] - 在B端升级"腾讯云智能体开发平台",整合RAG技术和Agent能力,帮助企业激活私域知识构建专属智能体 [26] - 通过乐享知识库等产品帮助企业实现知识管理数字化,案例显示科沃斯应用后营销效率显著提升并节省百万运营成本 [27]
赛道Hyper | 高德地图AI化:技术推动行业迭代
华尔街见闻· 2025-08-05 02:06
作者:周源/华尔街见闻 作为拥有二十年数据积累的地图服务平台,此次高德地图转型,标志着从传统导航工具向智能出行服务 体系的试探性跨越。 底层逻辑:突破瓶颈 当前,地图服务行业已进入存量竞争阶段,传统导航工具同质化严重,用户增长红利逐渐消退。 主流地图应用的核心功能,如路线规划、实时路况等已基本趋同,比如高德地图、腾讯地图和百度地 图,基本没差别,用户切换成本降低,单纯依靠功能叠加,也难以形成差异化优势。 高德地图此时全面押注AI,本质上是通过技术重构产品形态,从"工具属性"向"服务生态"转型,以突破 增长瓶颈。 用户需求的进一步升级,也迫使地图服务商转型,高德的选择是向智能化演进。 随着移动互联网的深度渗透,用户对地图的需求已从"到达目的地"延伸至"出行全场景服务",包括行前 决策、行中体验优化、行后消费衔接等。 比如,商务出行用户不仅想要导航至会议地点,还希望获得周边停车、餐饮、临时办公空间的一体化解 决方案;旅游用户则期待根据实时天气、人流密度动态调整游玩路线。 8月4日,阿里巴巴集团旗下高德地图宣布完成全面AI化改造,推出被其定义为"全球首个AI原生地图应 用"的高德地图2025版本。 即日起,用户可通 ...
吉利智驾大整合:极氪等三大团队并入新公司,规模3000人;大疆秘密孵化全景无人机:预计年底发布;途虎胜诉!京东养车停用「震虎价」
雷峰网· 2025-08-05 00:49
今日头条 - 吉利控股集团对内部智驾团队进行大整合,极氪智驾团队、吉利研究院及迈驰智行并入重庆千里智驾,涉及3000人,极氪团队1500人、吉利研究院1000人、迈驰500人,8月15日前完成转岗 [4][5] - 重庆千里智驾由重庆江河启兴、吉利和旷视各持股30%,路特斯持股5%,王军担任法人代表,吉利将统一使用"千里浩瀚"智驾方案覆盖所有品牌车型 [4][5] 国内资讯 - 哪吒汽车意向投资人增至53名,需缴纳5000万元报名保证金,产线设备运转正常,保留400余名员工,具备复产条件 [7][8] - 大疆秘密孵化全景无人机,预计年底发布,工程机基于Osmo 360全景相机与mini系列无人机改造,正面对拼影石 [8][9] - 盛大网络挖角清华大学代季峰筹建AGI公司,对标DeepSeek,探索神经科学与AI架构融合 [9][10] - 搜狐Q2总收入1.26亿美元,净亏损同比收窄超40%,营销服务收入1600万美元,在线游戏收入1.06亿美元 [13] - 途虎养车胜诉,京东养车停用"震虎价"并重奖征集新名称,此前途虎指控其商业诋毁 [15][16] - 高德地图推出全球首个AI原生地图应用"高德地图2025",具备自主推理能力的智能体"小高老师" [18] - 抖音生活服务处置6.2万资质造假商家和2.1万虚假门店,协同警方捣毁8个伪造团伙 [19] - 字节跳动启动2026校招,研发类岗位招聘量同比增23%,算法、前端、客户端增幅最大 [20] - 长安凯程新任总裁董晨睿上任,2025年上半年销量14万辆,新能源占比2.57万辆,同比增长160% [21] - 新款坦克500车型8月8日预售,提供Hi4-T和Hi4-Z两种动力版本,纯电续航分别为110km和201km [22] - 小马智行在上海浦东推出Robotaxi服务,覆盖金桥和花木地区核心商圈 [24] - 京东与宜家合作开设官方旗舰店,提供6500余种产品,配送覆盖全国301个城市 [24][25] 国际资讯 - 英伟达或因销量不佳计划月底降价RTX 50系列显卡,欧洲市场RTX 5090已降价4%至2229欧元 [27][28] - 丰田上调2025年全球产量计划至1000万台,逼近历史纪录,电动车产量计划缩减20万台至80万台 [28][29] - 谷歌被判14天内改革Play商店,需允许外部支付和下载链接,但上诉获暂缓执行 [29][30] - 英伟达新规禁止未成年人使用NVIDIA应用调整显卡设置,引发争议 [31][32] - 马斯克称需增持特斯拉股份至25%以确保控制权,否认用股票质押贷款 [33]
马斯克:多名Meta工程师正加入xAI;腾讯混元开源多个小尺寸模型,支持端侧部署丨AIGC日报
创业邦· 2025-08-05 00:08
马斯克xAI人才吸引 - 尽管xAI初始薪酬待遇未达"离谱"水平,但Meta旗下多名高级工程师正转投xAI [2] - 马斯克预测xAI长期估值有望超越Meta [2] - xAI有向顶尖人才提供大幅加薪的传统 [2] 高德地图AI化升级 - 高德地图推出全球首个AI原生地图应用"高德地图2025",具备深度时空理解和自主推理决策能力 [2] - 新版本基于空间智能架构,融合超20年物理世界数据和技术积累 [2] - 孵化出行生活智能体"小高老师",实现全旅程AI服务覆盖"行前-行中-行后"场景 [2] 小米声音理解大模型开源 - 小米开源MiDashengLM-7B模型,在22个公开评测集上刷新多模态大模型SOTA成绩 [3] - 该模型单样本推理的首Token延迟仅为业界先进模型的1/4 [3] - 同等显存下数据吞吐效率达业界先进模型的20倍以上,已启动终端设备离线部署优化 [3] 腾讯混元开源端侧模型 - 腾讯混元发布四款开源小尺寸模型(0.5B/1.8B/4B/7B),支持消费级显卡运行 [4] - 模型适用于笔记本、手机、智能座舱等低功耗场景,支持垂直领域低成本微调 [4] - 已上线Github和Huggingface,获Arm/高通/Intel/联发科技等终端芯片平台部署支持 [4] 行业数据服务 - 提供人形机器人、商业航天、AGI等热门赛道行业图谱和报告 [4] - 数据库覆盖3万+高新技术企业、2万+LP数据、10万+基金数据及1万+专精特新小巨人企业 [5]
高德地图2025正式发布
每日商报· 2025-08-04 23:18
产品发布 - 全球首个基于地图的10亿国民级AI Native原生应用高德地图2025正式发布,深度融合"感知-思考-行动-反馈"的空间智能架构 [1] - 用户升级至高德地图APP最新版后,搜索"空间智能"即可体验核心功能,主智能体"小高老师"支持自然语言交互,具备智能去噪和情感陪伴功能 [1] - "小高老师"依托高德与通义深度共建的大模型簇,可进行空间智能的推理、计划、反思和行动,并通过MCP协同调用出行服务、生活服务、空间服务等子智能体和工具链 [1] 功能升级 - 生活服务智能体推出"AI即刻"功能,基于"时间递进+空间演进"双轴排序模型,精准预判用户即时出行需求 [2] - "AI探索"功能在更广泛的时空维度内为用户推荐"超预期"的个性化潜在目的地,如新开放生态跑道、解压场所及季节性特色游玩路线 [2] - 出行服务智能体"AI领航"依托交通感知预测能力和超视距感知能力,实现从"单点观察"到"全局决策"的升级,在高速驾车场景中可感知车道级交通流变化 [2] 用户体验 - 空间服务智能体为用户提供AR打卡服务,通过AI空间融合技术将数字信息与真实世界无缝叠加 [3] - 用户可使用趣味AR装置道具、虚拟形象等一键开启AR打卡之旅 [3] - 高德地图CEO郭宁表示空间智能能让地图实现被动感知到主动预判的跨越,推动AI从"对话工具"蜕变为"行动伙伴" [3]
高德地图2025正式发布,全球首个基于地图的AI原生智能体
国际金融报· 2025-08-04 12:35
公司AI战略升级 - 高德地图宣布全面AI化 推出全球首个AI原生地图应用"高德地图2025" 用户可通过升级APP至最新版并搜索"空间智能"进行体验[1] - 新版本旨在融合AI技术将地图导航服务升级为具备深度时空理解和自主推理决策能力的出行生活智能体 实现空间智能在现实场景的普及[1] - CEO郭宁表示空间智能是在三维空间和时间中感知、推理和行动的能力 标志着公司从"连接真实世界"向"理解真实世界"的战略跃迁[1] 空间智能技术体系 - 空间智能被定义为构建虚拟世界并深度理解、推理决策的AI技术分支 是实现虚拟数字世界与真实物理世界无缝互联的关键技术[3] - 该技术通过感知视觉、音频、文本、定位等多模态信息 理解真实时空环境的三维几何结构及人车路店等要素的行为状态[3] - 基于超二十年的物理世界数据和技术积累 公司为三维虚拟世界一体化理解提供动能 实现从被动感知到主动预判的跨越[4] 智能体架构与应用 - 推出业内首个专精出行生活的智能体"小高老师" 采用统一智能体框架支持主动搜索对话和被动推荐引导[5] - 智能体运作包含四个阶段:需求感知(动态行为与静态状态分析)、思考决策(多轮推理与工具调用)、总结生成(个性化方案制定)、场景交付(多模态交互与反馈优化)[5] - 支持架构的大模型簇由多模态空间感知、行为认知、时空意图理解等专业模型构成 采用算力分级调度体系优化用户体验与成本[7] 具体功能实现 - AI领航应用提供超视距感知能力 包括北斗车道级安全预警、红绿灯AI领航、盲区会车预警等服务[11] - 生活服务智能体推出AI即刻(基于实时位置推荐特色餐饮)和AI探索(广域时空目的地推荐如周末亲子民宿)功能[11] - 空间服务智能体包含AR打卡技术 通过计算机视觉与空间定位实现数字信息与真实世界的叠加[11] 生态合作与战略扩展 - 空间智能将助力智能汽车、智能眼镜、具身智能、低空飞行等领域的升级 推进"AMAP-AI Inside"开放战略[4] - 智能眼镜、汽车、机器人、低空飞行领域已有多家合作伙伴接入高德空间智能系统[4] - 应用场景演示显示 用户可通过语音输入复杂需求(如带老人孩子的三天旅行计划) 系统可调用子智能体检索70个交通选项、41个景点、60个美食和70个酒店并生成完整解决方案[8][9]
全面转向空间智能 高德发布首个基于地图的AI原生智能体
证券日报网· 2025-08-04 09:44
核心产品发布 - 公司推出全球首个AI原生地图应用高德地图2025 旨在通过融合AI技术将导航服务升级为具备深度时空理解和自主推理决策能力的出行生活智能体 [1] - 该产品基于超二十年的数据、技术和场景研发经验积累 致力于推动空间智能在现实场景中的普及 [1] 技术战略定位 - 公司提出空间智能系统核心定位 强调在三维空间和时间中感知、推理和行动的能力 实现从"连接真实世界"到"理解真实世界"的使命跃迁 [1] - 基于超二十年物理世界数据生产和技术积累 为三维虚拟世界一体化理解和生成提供动能 实现从被动感知到主动预判的跨越 [2] - 通过"AMAP-AI Inside"开放战略 将空间智能能力输出至智能汽车、智能眼镜、具身智能和低空飞行等领域 已有多家合作伙伴接入 [2] 智能体架构 - 产品包含业内首个专精出行生活的智能体"小高老师" 通过主动搜索对话和被动推荐引导构建统一智能体框架 [2] - 智能体架构由多模态空间感知、行为认知、时空意图理解、总结输出交互和反馈观测评估等多个专业模型构成 基于高德和通义共建大模型簇 [2] 功能应用场景 - 重塑用户行前、行中、行后与物理世界的交互方式 例如通过语音输入复杂需求(如"带老人孩子三天杭州旅行计划") 智能体可解析需求并调用子智能体提供完整解决方案 [3] - 整合基于时空信息推荐目的地的生活服务智能体功能:AI即刻结合实时位置推荐周边服务(如傍晚推荐特色餐饮) AI探索在更广时空范围内推荐潜在目的地(如周末城郊亲子民宿) [3] 发展愿景 - 公司将继续推动空间智能服务演进 成为用户与真实世界交互的核心触点 通过深度理解实现"让出行和生活更美好"的愿景 [3]