空间智能
搜索文档
长城证券:维持阿里巴巴-W(09988)“买入”评级 高德推出“扫街榜”布局到店业务
智通财经网· 2025-09-12 08:04
核心财务预测 - 预计FY2026-FY2028营收达1.06/1.18/1.30万亿元 [1] - 同期经调整归母净利润为1256/1599/1903亿元 [1] - 对应PE倍数分别为19.9/15.6/13.1倍 [1] 业务战略布局 - 即时零售与电商主站协同效应显著 [1] - 加码"大消费平台"战略布局 [1] - 云业务持续受益于AI应用及AIAgent商业化放量 [1] 高德地图创新举措 - 推出全球首个基于用户行为的"高德扫街榜" 覆盖美食/酒店/景区三类 [1] - 榜单包含"本地人爱去""多次前往""烟火小店"等特色分类 [1] - 覆盖全国300多个地级市并开启"到店团购"业务 [1] 到店业务发展优势 - 到店业务与到家业务具备商家资源复用协同效应 [2] - 到店消费场景减少履约配送环节 利润空间更大 [2] - 高德地图2025年7月平均DAU达1.86亿 为大众点评同期6倍 [2] 产品生态整合 - 高德地图升级版本加入"空间智能"AI功能 [2] - 导航栏重组为首页/探索/对话/打车四大模块 [2] - 集成地图/打车/点评/团购/酒旅功能 对标谷歌地图超级应用模式 [2] 未来战略方向 - 淘宝闪购业务后续可能参考高德榜单进展 [2] - 公司计划切入交易环节完善大消费平台布局 [2] - 科技与消费双重属性协同发展 [1][2]
李飞飞一年前究竟说了啥?怎么又火了
量子位· 2025-09-11 01:58
大语言模型的局限性 - 语言信号基于人类输入生成,无法独立于人类存在 [2][4] - 语言模型底层表示为一维离散token序列,与三维物理世界存在本质差异 [12][14] - 物理世界具有客观存在的三维结构和物理定律,需要不同的信息处理方式 [5][19] 空间智能与语言模型的差异 - 三维世界信息提取需匹配任务类型,直接处理3D数据可改善表示效果 [15] - 空间智能需从真实世界提取、表示和生成信息,涉及物理约束和材料特性 [17][19] - 多模态模型将其他模态强行嵌入一维序列导致物理信息损失 [14] 模型在物理任务中的表现缺陷 - 多模态大模型在Animal-AI测试中仅能完成最简单任务,复杂任务失败率极高 [24][26] - 增加教学案例后模型表现仍无显著提升 [27] - 模型表现远逊于人类儿童及专用测试机器人 [28] 物理推理能力测试结果 - ABench-Physics测试中最佳模型Phy A正确率仅43% [32][34] - 修改题目数值后(Phy B)模型准确率下降22.5% [33][34] - 视觉感知任务中模型最高正确率51%,远低于人类95.7%的水平 [37][38] 行业技术发展方向 - 模型开发正向物理基础与多模态理解扩展 [44] - 人工智能可能创造独立于人类语言的新表征体系 [47] - 需探究语言训练取得成就的核心因素以突破现有局限 [48]
空间智能新高度:港科大谭平团队SAIL-Recon突破万帧级图像大规模3D场景重建Transformer
机器之心· 2025-09-08 01:21
技术突破 - 推出SAIL-Recon方法 通过锚点图建立全局隐式表征 突破VGGT基础模型对大规模视觉定位与3D重建的处理能力瓶颈 实现万帧级场景表征抽取与定位重建[2][7] - 采用统一Transformer架构同时处理场景表征抽取与定位重建任务 在TUM-RGBD、CO3Dv2、Tanks & Temples数据集上相机位姿估计与新视角合成精度显著超越现有方法[10][20] - 使用50-100张代表性锚点图像构建全局隐式场景表征 大幅降低计算复杂度和内存需求 支持处理数千帧规模图像[15][16] 性能表现 - 在Tanks and Temples数据集所有非优化方法中取得最强性能 RRA@5达70.4 RTA@5达74.7 ATE仅0.008 注册成功率100%[22] - 新视角合成PSNR指标达19.5 显著优于ACE0的16.9和DROID-SLAM的18.1 在Francis场景PSNR达21.8[25] - 处理时间仅需3-3.5分钟 远快于GLOMAP的1977秒和ACE0的2499秒 实现速度与精度的双重突破[22][25] 应用前景 - 作为3D场景表征与重建基础模型 可应用于任意场景的大规模3D重建和空间漫游[2] - 为机器人3D空间感知、自主空间定位与导航提供基础技术支撑 具备具身智能领域应用潜力[2][29] - 通过光影焕像公司推进技术在游戏、影视和具身智能等行业场景的商业化应用[2]
亿道信息(001314) - 2025年9月5日投资者关系活动记录表
2025-09-05 10:56
公司业务概览 - 亿道信息是一家以产品定义和研发设计为核心的智能电子产品及解决方案提供商,主要业务分为加固智能终端和消费类智能终端 [2] - 加固智能终端包括加固笔记本电脑、平板、手持终端及工控产品,应用于智能制造、交通运输、能源勘探、公共事业等领域 [2] - 消费类产品包括PC、平板、AIoT及XR/AI穿戴类产品,服务全球区域性龙头品牌客户,提供从方案设计到整机服务的全流程服务 [2] - 公司旗下亿道研究院专注于人工智能、感知技术、空间智能领域,旨在推动人机交互范式的进步,培养研究+产品复合型创新人才 [2] 2025年上半年财务表现 - 营业收入同比增长19.24% [3] - 加固智能终端业务同比增长24.71% [3] - 智能硬件业务同比增长16.27% [3] - XR及AIoT业务同比增长27.60% [3] - 研发费用投入同比增长2.71% [3] 毛利率与产品结构 - 毛利率波动主要受产品销售结构变化影响,因各类产品构成、出货形态、客供料定制化选择不同导致毛利率差异 [3] - 近年毛利率水平维持在14%-20%之间,相对平稳且高于同业平均水平 [3] 未来发展战略 - 持续深挖现有客户需求,丰富产品序列,深化下游客户领域,扩大生产经营规模 [3] - 亿道数字研究院专注于人工智能、感知技术、空间计算等领域,助力核心技术积累和未来产品探索 [3] - 发力人工智能在端侧的应用,培养研究+产品复合型创新人才 [3] - 加强XR及AIoT、自主可控国产化产品领域的适配研发,把握数字中国、新质生产力、人工智能、工业4.0等发展机遇 [3]
高德地图更新:地铁导航新增五大实用功能,覆盖51城乘车码
凤凰网· 2025-09-04 06:56
产品功能升级 - 上线实时地铁到站预测功能 支持查看当前及下一趟列车预计到站时间 并提供工作日与周末详细发车计划[1] - 新增下车智能提醒功能 在距离目的站点两站时通过弹窗和震动提醒 手机锁屏状态下依然有效[1] - 整合支付与导航环节 用户规划路线时可同步调出乘车码刷码过闸 已在北京深圳成都等51个城市开通[1] - 提供地铁站内指引功能 以文字配合图片形式提供清晰换乘或出站路线导航[1] - 标注强冷/冷车厢信息 乘客可依据温度偏好选择车厢 已覆盖北京上海广州等44个城市[2] - 提示最快换乘车厢及车门位置 帮助需要换乘的乘客节省站内步行时间[2] 技术实现方式 - 基于空间智能技术 通过对客流地铁运行状态用户位置等多维度数据分析与AI模型计算[1] - 为用户提供更精准和个性化的地铁出行方案[1] 服务优化方向 - 核心优化乘客在地铁出行中的信息确定性[1] - 简化乘车流程[1] - 提升通勤效率与舒适度[1]
视频生成告别“瞬移变形”,群核科技Hugging Face登顶背后:空间语言改写AI物理世界规则
钛媒体APP· 2025-09-01 03:18
空间智能技术突破 - AIGC技术从文本图像生成向3D空间与视频领域延伸 面临物理世界空间结构理解不足和视频时空一致性两大核心挑战 [2] - 空间智能是AI从数字世界走向物理世界的关键桥梁 核心是让AI理解物理世界的"空间语言" [2] - 群核科技开源新一代空间语言模型SpatialLM 1.5与空间生成模型SpatialGen 是中国企业首次面向全球开发者开放专注于3D室内场景认知与生成的大模型体系 [2] SpatialLM 1.5模型特性 - 通过"空间语言"实现3D场景的结构化生成与交互 生成富含物理正确结构化信息的场景 [3] - 基于通义千问3小模型训练 将空间关系编码为"语言" 输出可直接用于渲染仿真的"空间代码"而非自然语言描述 [4] - 支持用户通过对话交互系统SpatialLM-Chat进行可交互场景的端到端生成 例如输入"生成100平方米两居室"可输出包含墙线坐标家具尺寸的结构化脚本 [4] - 成为具身智能机器人训练的关键工具 演示显示机器人可基于生成场景自主规划"从卧室取药到客厅"路径并规避障碍物 [4][5] SpatialGen模型特性 - 依托3D高斯技术保障多视角图像的空间连贯性 专注于生成与呈现 [3] - 通过多视角扩散模型打破2D图像序列训练局限 以3D高斯场景为中间载体生成任意视角图像 [6] - 输入单张参考图和布局图即可生成物体形状位置在不同帧中一致的图像 演示显示12秒漫游视频首尾窗户摆件位置完全吻合 [6] - 采用"先造世界再拍视频"方式使视频生成效率成倍提升 支持非连续视角切换如"从厨房直接跳转到卧室" [7] 数据优势与行业应用 - 群核科技拥有超过4.41亿个3D模型及超过5亿个结构化3D空间场景 源自全球最大空间设计平台酷家乐 [5] - 3D数据稀缺性是空间智能发展核心瓶颈 互联网百亿级图像文本数据中高质量3D场景不足千万级且标注成本极高 [5] - 计划基于SpatialGen推出AI视频创作工具 可实现商品主体高保真还原下保持空间一致性 大幅降低广告和工业设计成本 [7] - 香水宣传视频案例显示在保持商品主体高保真前提下实现复杂运镜和动效 被评价为"比较重大的突破"且具备足够营销属性 [7][8] 开源战略与生态建设 - 开源策略包括开源全球最大空间认知数据集InteriorNet和3D高斯数据集InteriorGS 后者在Hugging Face数据集中排名第一 [9] - 开源目标是与全球创新者共同做大市场 从技术研发迈向生态共建 [9] - 技术路线聚焦"可交互的功能场景" 与World Labs的"3D场景生成"形成差异化 强调真实感全息漫游结构化可交互和复杂室内场景三大特点 [10] 工业软件领域影响 - 空间大模型为传统工业软件"卡脖子"问题提供新路径 通过自然语言生成场景可能绕过传统CAD复杂操作逻辑 [11] - 目标不是替代达索或Autodesk 而是创造"AI原生"设计工具实现弯道超车 [11] - 生成的场景不仅具备视觉真实感 还支持机器人开门取物等工业级交互应用 [10]
考拉悠然以空间智能硬核实力践行“人工智能 +”,CEO 解读 AI 生产力新阶段
搜狐财经· 2025-08-30 03:52
大会概况 - 2025AGIC深圳国际通用人工智能大会暨产业博览会于8月27日至29日在深圳国际会展中心召开 主题为"模驱具身 智启未来" 聚焦具身智能 大模型和机器人等创新领域 [1] - 展览面积超8万平方米 吸引全球1000余家企业参展 展示人工智能技术 产品和创新成果 [1] 公司参展表现 - 考拉悠然作为多模态世界模型与空间智能引领者参展 采用线下演示和线上直播双渠道呈现方式 [3] - 展区吸引海内外观众 行业专家 合作伙伴及媒体代表 现场互动热烈 直播间累计观看人数破万 [3] 空间智能产品展示 - 首次公开亮相空间智能新品 包括智能检测智能体 悠然智擎城市治理空间智能体和AI+行业解决方案 [4] - UranEngineX悠然智擎应急防灾协同空间智能体全球首次公开演示 聚焦森林防火和城市灾害应急场景 融合天基 空基和地基多源感知能力 [6][8] - UU Video Agent作为全球首个视频分析与应用通用智能体亮相 基于悠然无界大模型与空间智能架构 实现视频检索 解析 告警和报告自主完成 [8][10] - UU Holo实时空间多模态交互智能体重磅升级 具备看 听 说 记忆和推理能力 提供景区导览 展馆讲解和商场导购等服务 [12][14] 行业观点与战略 - 空间智能通过感知 理解与交互三维世界多模态数据 将AI从数据智能推向场景智能 成为驱动行业数字化转型核心引擎 [16] - 国务院发布《关于深入实施"人工智能+"行动的意见》 提出推动人工智能与各行业广泛深度融合 到2027年智能体和智能终端应用普及率超70% 到2030年超90% [21] 公司荣誉与未来规划 - 考拉悠然荣膺2025AGIC人工智能产业化示范企业TOP50 展示空间智能领先技术与创新产品 [19] - 公司将继续深耕空间智能技术 推动人工智能与各行业深度融合 赋能产业智能化升级和智能社会建设 [21]
高德地图董事长刘振飞:基于空间智能技术积累助力城市经济发展
证券时报网· 2025-08-29 07:42
泉州人工智能战略布局 - 泉州推进人工智能领域发展并打造示范区 作为历史文化名城和民营经济活跃城市[1] - 泉州在人工智能领域具有战略布局与发展潜力 政策、场景、营商环境良好[1] 高德地图AI技术发展 - 公司2025年宣布全面AI化 推出全球首个AI原生地图应用[1] - 将地图导航演进为具备深度时空理解和自主推理决策能力的出行生活智能体[1] - 空间智能技术实现虚拟数字世界与真实物理世界的无缝互联[1] 合作项目与解决方案 - 推出全域城市智慧交通解决方案"空中高德"项目 构建时空数字底座[2] - 通过产业平台汇聚数据和应用资源 赋能低空场景科技创新试点与商业化示范[2] - 探索形成可持续运营闭环 提供智能化一体化服务[2] 双方合作展望 - 公司希望与泉州在更多领域开展深度合作 探索人工智能发展新模式新路径[2] - 通过落地空间智能技术促进形成新质生产力 让发展成果惠及千家万户[1] - 共同把握重要契机 为高质量发展作出贡献[2]
群核科技发布空间大模型,旨在解决AI视频空间一致性难题
36氪· 2025-08-29 04:00
空间大模型技术发布 - 公司正式发布新一代空间语言模型SpatialLM 1.5和空间生成模型SpatialGen 并宣布延续开源战略逐步向全球开发者开放模型 [1] - 空间大模型技术体系专注于3D室内场景认知与生成 围绕真实感全息漫游 结构化可交互及复杂室内场景处理三个方向构建优势 [1] - SpatialLM 1.5基于大语言模型训练 让模型学会"空间语言" 能以数字文本精确描述场景物体的空间结构 几何信息 相互关系及物理参数 [1] 模型功能与应用 - SpatialLM通过对话系统SpatialLM-Chat实现文本指令生成结构化3D场景脚本 智能匹配家具布局 支持自然语言场景问答与编辑 [1] - 模型具备机器人场景应用潜力 例如输入"去客厅餐桌拿药"指令后 模型理解物体对象并调用工具自动规划行动路径 [1] - SpatialGen是基于扩散模型架构的多视角图像生成模型 可根据文字 参考图和3D空间布局生成时空一致性的多视角图像 [2] 技术突破与行业价值 - SpatialLM 1.5能快速批量生成多样化场景 解决机器人训练数据不足难题 直接用于路径规划 避障和任务执行训练 [2] - SpatialGen通过生成空间属性和物理关系一致的多视角图像 进一步生成3D高斯场景 渲染可自由漫游视频 解决AIGC视频时空一致性难题 [3] - 公司正在研发深度融合3D能力的AI视频生成产品 计划于年内发布 [3] 战略布局与数据基础 - 空间智能战略核心是"空间编辑工具-空间合成数据-空间大模型"构成的飞轮 通过工具沉淀数据 利用数据训练模型 再以模型反哺工具 [3] - 截至2025年6月30日 公司拥有超过4.41亿个3D模型及超过5亿个结构化3D空间场景 [3] - 自2018年起逐步开放数据和算法能力 当前通过开源与全球开发者共同推动空间大模型技术发展 [3] 开源计划 - 两款模型将陆续在Hugging Face GitHub和魔搭社区等平台开源 [4] - SpatialGen在技术开放日当天已开放下载 SpatialLM 1.5未来将以"SpatialLM-Chat"形式完成开源 [4]
AMD奥尼携手发布全球首款基于锐龙 AI MAX+395的液冷Mini AI 工作站SMART AI
金投网· 2025-08-28 05:20
产品发布与合作 - 奥尼电子与Abee及AMD合作发布基于AMD锐龙AI MAX+ 395处理器的SMART AI Hub 旨在打造空间智能中枢并推动多模态AI交互技术在家庭场景落地[1] - 新产品采用统一内存架构提供至高96G显存 兼容多模态模型如机器视觉和自动语音识别 为AI场景提供新选择[1] - 奥尼电子定位为"AI云边端一体化具身智能引领者" 凭借智能音视频领域经验全面拥抱AI[2] 技术特性与设计 - SMART AI Hub采用全铝工艺机身 体积7.5L且安装便捷 搭载创新液冷系统实现更好性能释放 GPU满载噪音仅35.1dB[2] - 寅谱计算为产品打造智控固件 通过实时进程调度和动态功耗管理提升计算任务性能 更好释放硬件潜能[2] - AMD锐龙AI Max系列采用最新CPU/GPU/NPU架构 提供强大异构算力 完美契合大尺寸MoE架构大语言模型[1] 应用场景与解决方案 - 元启智合基于浙江大学研究成果打造"智慧家"解决方案 支持本地基础大模型和多模态模型并发处理 实现多终端智能实时响应[2] - 产品功能包括统一智能管理家电机器人 居家安全监测老人看护和异常侵入 健康生活监测儿童睡眠心率和食材存量 家庭数仓本地智能检索文件照片[3] - 解决方案保障隐私数据不上云 通过本地知识库构建确保数据安全[3] 战略合作与行业影响 - 奥尼电子 Abee 寅谱计算和元启智合达成战略合作 将在空间智能和垂直行业赋能深度合作 共同推动端侧AI发展[3] - 生态共创实践打通硬件软件到服务应用全链路 为行业树立融合创新方向 推动空间智能场景向更高维度智能化与协同化发展[3]