Workflow
空间智能
icon
搜索文档
当空间开始“思考”:厘米级定位如何重构智能空间连接范式
36氪· 2025-06-23 06:11
高精度定位技术演进 - 全迹科技UWB车载监测系统实现量产上车,标志定位技术从"工具"进化为"有温度空间智能"基础设施[2] - 高精度定位解决室内外复杂场景中"最后一米"盲区,需具备三维坐标、Hz级刷新率和抗干扰能力[4][6] - 技术核心指标包括亚米级/厘米级精度、3D定位、实时响应(10-100Hz)、环境稳定性和成本可行性[7][8][9][11][12][13] 主流技术路线对比 - UWB技术:精度10-30cm,工业场景主导但成本高(基站¥2000-8000),功耗大(标签寿命3-6个月)[16][17] - 蓝牙AoA:精度1-3m,适合养老/零售场景,受人体遮挡影响精度下降40%[18][19] - 5G定位:理论亚米级,实际3-5m,依赖基站密度,毫米波穿墙衰减达30dB[20][21][22] - 融合方案:UWB+IMU组合精度达5-20cm,抖动降低60%,但终端成本极高(¥300+)[24][26] 国产化突破进展 - 国产UWB芯片出货量三年增长400%,单价从280元降至95元,但射频前端仍依赖进口(69%)[37][38] - 22nm双模SoC研发成功,功耗降低40%,动态环境算法将定位抖动从±35cm优化至±8cm[39][40] - 工业案例显示融合方案使建设成本降35%,焊接错误率下降52%,设备寻回效率提升70%[41][43] 市场空间与场景 - 中国市场规模2028年预计达1263亿元,CAGR35%,全球占比超25%[46][47] - 工业领域需求10-30cm精度,仓储物流需亚米级,消费领域1-3m精度即可[49][50] - 新兴场景包括地下空间导航(3-10m精度)、无人机室内定位、毫米级形变监测[53] 投融资动态 - 2023年行业融资超20笔,头部企业单笔融资金额达数千万至亿元级[56] - 产业资本占比45%,UWB与音频定位技术合计占70%融资份额[57][58] - 投资逻辑转向场景化能力,工业/车载场景溢价最高,生态绑定成估值核心[60][61] 竞争维度分析 - 技术窗口期缩短至12-18个月,场景绑定与生态独占性构成持久壁垒[63] - 标杆企业实现标签成本1.5美元(行业平均5美元),交付周期压缩至30天[62][64] - 差异化机会在于AIGC融合、低空经济衔接和医疗耗材化等垂直场景[65][66]
特斯联邵岭:空间智能是构建世界模型的必要前提,两者紧密相关
IPO早知道· 2025-06-23 04:59
空间智能与World Model的关系 - 空间智能和World Model不是同一概念但紧密相关 空间智能提供空间感知和理解能力 是构建准确全面World Model的必要前提 [2][4] - 空间智能是计算机视觉的高级呈现 需要机器具备感知、理解、推理并与三维物理世界交互的能力 重点在于理解物体间空间关系及环境上下文 [2] - World Model是对环境的内部表征 能预测未来状态并支持规划 需依赖空间智能感知的信息整合 [4] 空间智能的技术价值 - 空间智能是继语言智能后AI发展的关键步骤 能弥合"感知"与"行动"的差距 解决当前AI难以将感知转化为有效行动的问题 [3] - 通过空间智能 人工智能系统可感知环境、识别物体关系 并将信息整合到内部表征 World Model则帮助将空间信息转化为行动 [4] 空间智能的实现路径 - 实现路径多样化 包括LWM大世界模型、显式知识推理、多模态融合、具身智能探索等 不同技术路径在特定场景各有优势 [5] - 未来技术将趋向融合 如知识图谱融入大模型增强推理 或利用具身智能优化数据收集 特斯联采用空间数据知识、领域模型工具、AI智能体等多技术融合方案 [5] 特斯联的技术应用 - 特斯联通过构建知识库和系统工具 结合空间感知模型技术 增强模型的空间感知能力 推动空间智能在复杂环境中的应用 [5] - 公司研究成果聚焦3D场景理解 空间智能战略体系升级 并在阿联酋图书馆等场景实现具身智能全场景服务 [10]
特斯联邵岭:以多模态统一空间模型打造空间智能
中国基金报· 2025-06-20 08:05
空间智能技术发展 - 大模型技术通过架构革新与多模态融合重构空间智能底层逻辑,推动其从实验室走向产业化应用[2] - 空间智能旨在处理物理世界多样性、复杂性导致的细致空间推理,使机器以类人方式与3D环境互动[2] - 深度学习模型在计算机视觉任务表现突出,但集成多数据类型与执行复杂任务仍面临挑战[2] 特斯联技术布局 - 公司研发多模态融合空间智能大模型,结合预训练与强化学习技术,打造类人思考、长期记忆的AI智能体[4] - 技术实现依赖计算机视觉、三维表示学习、视觉-语言模型(VLMs)、强化学习及环境模拟等算法[4][6] - 已部署AIoT端侧设备采集数十种模态数据(文本、视觉、声音、环境参数等),解决数据不足问题[7] - 采用动态自适应时序同步技术实现多模态数据语义空间对齐[7] 应用场景与研发规划 - 短期目标为移动终端(智能可穿戴设备、机器人)开发具备个性化能力的AI智能体HALI[8] - 长期方向从专用智能体向通用智能体发展,探索高维空间智能、自主学习及多智能体技术[8] - 海外市场聚焦智慧建筑、智慧园区和智慧能源领域,增强中国技术全球竞争力[7] 行业竞争优势 - AIoT基因使公司在多模态数据采集、软硬件一体化及场景理解方面具备先发优势[6] - 覆盖多区域的设备网络可获取多样化实时数据,提升模型鲁棒性与泛化性[7] - 技术已应用于多个项目与产品,形成行业数据理解与处理经验壁垒[6]
特斯联邵岭:以多模态统一空间模型打造空间智能
中国基金报· 2025-06-20 07:55
空间智能技术发展 - 大模型技术通过架构革新与多模态融合重构空间智能底层逻辑,推动其从实验室走向产业化应用 [2] - 空间智能使机器以类人方式与3D环境互动,解决物理世界多样性、复杂性带来的空间推理挑战 [2] - 深度学习在计算机视觉表现突出,但集成多数据类型与执行复杂任务仍是关键挑战 [2] 特斯联技术布局 - 公司研发多模态融合空间智能大模型,统一模态数据至同一语义空间,结合预训练与强化学习技术 [4][7] - 技术覆盖计算机视觉、深度学习、视觉-语言模型、强化学习、3D仿真等领域,已应用于多个项目 [7] - 动态自适应时序同步技术实现多模态数据对齐,增强模型鲁棒性与泛化性 [8] 空间智能技术实现路径 - 感知能力依赖计算机视觉与深度学习,理解能力需三维表示学习处理几何拓扑结构 [4] - 推理能力通过视觉-语言模型与强化学习实现,执行能力依托具身智能与环境模拟 [4] - 部分技术已成熟,部分仍需学术界与产业界共同突破 [5] 数据与场景优势 - AIoT端侧设备采集数十种模态数据(文本、视觉、声音、环境参数等),解决数据不足问题 [8] - 多场景设备部署提供多样化数据,支撑空间智能模型开发 [8] - AIoT基因带来多模态数据采集、软硬件一体化、场景理解的先发优势 [7] 未来研发方向 - 短期目标:开发移动终端智能体HALI,赋予类人思考、长期记忆、个性化能力 [9] - 长期目标:从专用智能体向通用智能体演进,探索高维空间智能、自主学习技术 [9] - 聚焦中东及海外市场,提升中国技术在全球产业链的竞争力 [9]
友达数位总经理赵丽娜:“空间智能”将重构制造未来
中国经营报· 2025-06-19 16:55
公司背景与业务模式 - 友达数位科技服务(苏州)有限公司为友达光电旗下子公司,专注于智能制造和数字化转型解决方案,已为10余个国家的1000多家制造业企业提供服务,覆盖电子、医疗、汽车等34个行业 [1] - 公司核心策略包括输出友达光电的制造管理经验,并通过双循环模式反哺自身技术升级,同时践行ESG理念 [2] - 业务模式从咨询服务升级为"数字人"技术应用,结合大模型能力解决专家资源稀缺问题,并推出nuva女娲数字底座平台实现模块化解决方案 [3][4] 数字化转型方法论 - 提出"最小要素数字化"理念,将复杂场景解耦为通用模块(如员工训练、岗位管理),通过"数字积木"组合满足个性化需求并降低成本 [1][3][4] - 研发投入5年打造nuva女娲平台,支持客户按需选取功能模块,快速实现经验复制 [4] - 客户分层服务策略:0-10亿元营收企业采用托管模式,10-50亿元提供护航服务,50-200亿元补充升级,200亿元以上共创未来工厂 [5] 未来工厂技术架构 - 定义未来工厂需具备三大智能要素:自主智能(人机协同)、具身智能(AI赋能的机器对话)、空间智能(隐性能力显性化) [6] - 关键技术能力包括知识模型、数字模型和嵌入式模型,形成AI时代工厂的核心支撑 [6] - 目标客户需具备三大特质:海量专家资源、具身智能应用能力、流程改造能力,且需企业高层深度参与创新 [6] 行业应用与案例数据 - 服务覆盖全球34个行业,典型案例显示数字化改造可提升生产效率并降低人力成本 [1][2] - 通过"数字人"技术实现24小时无间断服务,突破物理和语言限制,已应用于多国企业 [3]
特斯联空间智能赋能阿联酋图书馆:具身智能全场景服务
IPO早知道· 2025-06-18 01:26
中国科技企业出海 - 特斯联与阿联酋穆罕默德·本·拉希德图书馆的合作成为中国科技企业出海的典型代表之一 [2] - 合作始于2022年,旨在将智能机器人投入图书馆日常运营,提供自动化储藏、图书检索、递送、巡控、火灾探测等服务 [2] 特斯联智能机器人技术 - 依托自研计算机视觉算法,机器人具有定位误差小、响应速度快的特点,能精准完成导引、检索、递送任务 [5] - 通过多模态交互系统串联电梯、书架等40余类设备,为读者提供多样化服务 [5] - 大语言模型能力的突破推动智能机器人从"知识提供者"向"自主行动者"进化,弥补大模型在空间智能中的局限性 [5] 特斯联过往合作案例 - 作为2020迪拜世博会官方首席合作伙伴,提供超150台智能机器人,打造机器人协作系统 [5] - 为约1250万名访客提升接待、出行和配送体验,累计服务超84,000小时,进行超650,000次对话,行程超322,000公里 [5] 大模型技术与空间智能 - 大模型技术通过多模态融合、生成式智能等能力重塑空间智能技术范式,推动从单一感知向多维度智能决策演进 [6] - 中国科技企业发挥场景、应用层优势,加速技术出海,搭建跨国协作平台,构建空间智能的中国路径 [6]
“空间即服务”,特斯联空间智能商业落地再加速
和讯· 2025-06-16 09:28
空间智能战略核心观点 - 公司正式发布完整空间智能战略 构建以空间智能大模型为核心驱动的空间智能体 以实现空间智能落地实践 升级大模型时代的全新空间智能体验 [1] 空间智能定义与核心要素 - 空间智能指在动态三维世界中理解 推理 生成和行动的统一能力 是第三代AI的核心方向 [2] - 空间智能能力通过三大核心要素实现 空间要素 空间模型 空间智能体 [2][3] - 基于对物理空间要素的感知和理解 以空间大模型作为核心计算与推理引擎 使空间智能体具备自主决策 执行及交互的智能能力 建立物理世界与数字世界的无缝链接和融合 [2] 空间智能体能力与作用 - 空间智能体是数实融合世界的主要执行者 可作为与人语言交互和行为交互的智能载体 理解并处理各类空间相关任务 [4] - 空间智能体具备五大核心能力 空间生成 空间感知 空间交互 空间执行和智能进化 [4] - 通过传感器和物联设备 空间智能体可快速生成智能互联的数字平行世界 感知空间物理参数 环境数据及人员动态变化 [4] - 空间智能体通过自然语言与人交互 理解意图 提供数据分析 操作物理设备 实现任务执行闭环 并通过周期性强化学习提高精准度和有效性 [4] 空间智能服务体系架构 - 公司构建"N+1+1+5"空间智能服务体系 N个多维空间要素支撑1个空间大模型推理决策 通过1个空间智能体统筹空间服务系统 赋能5大类型服务空间 [5] - 5大服务空间涵盖楼宇空间 社区空间 园区空间 城市空间以及多类场景空间 [5] 商业模式与行业影响 - 空间成为提供服务的主体 创造空间即服务(Space as a Service)的全新商业模式 [6] - 相较于传统智慧系统需用户精准指令操控专用系统 空间作为服务主体下用户仅需通过模糊自然语言提出需求 空间大模型即可给出超越人类经验的决策建议和执行方案 [6] - 空间智能体依据大模型计算结果完成规划和执行 极大提升执行和管理效率 彻底改变过去智能化场景的理解 让空间理解人 服务于人 创造更广阔的真实商业智慧场景和市场 革新在物理空间的生活工作方式 [6]
深度|李飞飞:创办World Labs的初衷,就是想无所畏惧地解决空间智能问题,没有空间智能,AI将是不完整的
Z Potentials· 2025-06-15 03:45
创业初心与空间智能 - 李飞飞创立World Labs的核心动机是开发具备空间智能的AI,认为3D世界建模是AI领域最困难的问题之一[5][6] - 空间智能定义为理解、推理、交互和生成3D世界的能力,对人类和动物进化至关重要[5][7] - 公司专注于构建3D生成基础模型,目标是解锁设计、创作、导航、AR/VR等领域的应用[6][17] 技术挑战与创新方向 - 3D领域面临数据获取与合成的挑战,缺乏像语言模型那样丰富的互联网数据源[20] - 触觉数据集成被低估,多模态系统对机器人操作至关重要[9][16] - 情感智能是未被解决的重大领域,可能需等待AGI实现[10] 机器人形态与未来应用 - 机器人形态将多样化,非人形设计更符合能源效率原则(如鱼形水下机器人)[16] - 近期商业应用聚焦创造力领域,包括3D艺术、游戏开发、元宇宙内容创作[17] - 世界模型是实现通用智能体的关键,强化学习适用于3D设计优化场景[19] 数据驱动的AI发展历程 - ImageNet包含1500万标注图像,推动深度学习革命(AlexNet突破)[25][26][27] - 早期Caltech-101数据集创建过程体现数据工程重要性,需手工清洗图像[23][24] - 语言与图像融合研究(如视觉描述生成)标志AI跨模态进步[28][29] 团队构建与行业展望 - 招聘策略强调思维多样性,需计算机图形学、优化、生成式AI等多领域人才[32][33] - 医疗保健是AI赋能重点领域,涵盖药物发现、精准医疗、心理健康等未解决问题[34][35] - 学术界应保持"无所畏惧"精神,平衡理性与野心以突破技术边界[30][31]
苹果AI真的落后吗?宫斗、错判与挣扎
虎嗅· 2025-06-15 00:54
设计语言演进 - 苹果推出系统级"液态玻璃"设计语言 统一应用于iPhone iPad Mac Vision Pro等全系设备 通过半透明和光影效果营造物理世界深度感[1] - 毛玻璃设计对系统功耗要求较高 是"拉动内需"的体现 如今苹果算力足以支撑更精致的毛玻璃效果[2] - 设计语言变革包括2D图片向视觉3D转换 利用重力感应和端侧AI算力解读图片前后景深关系 营造立体感[3] 功能体验优化 - 操作界面简化 应用按钮改为呼出式设计 非常用功能被隐藏在呼出菜单后 核心功能更加突出[3] - 电话助手功能增强 系统可根据语音信箱留言内容自动标注来电优先级 通话保留助理可将语音实时转为文字[4] - 实时翻译功能覆盖短信 通话等更多场景 致力于消除跨语言沟通障碍[5] - AI优化电池管理 根据用户使用习惯自动管理低电量模式触发条件 以期达到更优续航表现[6] 操作系统更新 - watchOS新增Workout Buddy功能 在用户运动过程中提供实时语音互动与鼓励[7] - 从WWDC25开始 苹果全线操作系统编号将统一以年份命名 反映跨平台开发一致性进步[7] - 苹果反复强调端侧处理与隐私保护 多次提及功能在设备端完成 断网可用[7] AI功能交付情况 - Apple Intelligence部分核心功能跳票和延迟交付 个性化Siri核心能力功能多数未能完全交付[12] - 已交付功能包括Writing Tools写作工具 Emoji生成 Image Playground卡通图片生成 基础图片消除 邮件总结 通知总结 屏幕内容识别等[13] - WWDC24上演示的Siri根据家人航班信息 午餐安排自动规划接送路线功能至今仍未实现[12] 开发者工具与框架 - Foundation Models Framework允许开发者仅需三行代码即可在应用中调用设备本地AI模型[15] - 本地模型调用免费 端侧处理保护隐私 无需联网 对应用复杂度相对友好[17] - 快捷方式与聚焦搜索及App Intents深度整合 赋予用户调用苹果本地模型 私有云计算模型及第三方API能力[17] AI战略挑战 - Siri团队员工对WWDC24演示的AI功能实际可运行性表示惊讶 暗示部分演示可能非基于稳定可用版本[25] - 苹果内部AI技术路线经历调整 从"一大一小"模型架构改为构建全新单一大型模型 后又回归"一大一小"架构[26] - 为弥补AI能力不足 苹果宣布与Anthropic合作开发vibe-coding AI编程平台 将Claude Sonnet大语言模型集成到Xcode中[26] 领导层与团队管理 - 原AI主管John Giannandrea及其副手被解除对Siri管理职权 软件工程主管Craig Federighi将直接接管Siri项目[28] - Siri底层代码被称为"屎山代码" 新旧代码整合困难 新功能开发和迭代缓慢[30] - 苹果在苏黎世设立新人工智能办公室 试图构建新软件架构取代Siri混乱混合体[30] 中国市场表现 - 2025年第一季度苹果在中国智能手机市场份额跌至第五 同比显著下滑 是TOP5厂商中唯一下滑品牌[35] - iPhone 16系列采取多次官方降价措施刺激销量 大中华区营收同比减少 低于市场预期[35] - Apple Intelligence在中国面临模型合规挑战 引入外部大模型需经过严格备案和合规审批[35] 硬件产品规划 - 折叠屏iPhone预计2026年秋季推出 若大规模推广可能标志创新驱动模式转变[41] - iPhone 17将重新设计背部摄像头布局 2026年将移除灵动岛 采用圆形挖孔前置摄像头[41] - 最终目标到2027年实现真正"全面屏"iPhone Face ID和自拍相机都集成到显示屏下方[39] 开发者关系与监管 - 美区应用商店关于外部购买链接佣金政策引发争议 法官裁定苹果不得对应用外部购买收取佣金[37] - 裁决要求苹果不得限制外部购买链接样式 格式和位置 也不能干预用户离开App进行外部购买[37] - 仅此一项裁决就可能让苹果损失可观佣金收入[37]
通用 Agent 之外,Agentic Age 流量赛还有哪些「隐藏副本」?
机器之心· 2025-06-14 12:45
通用 Agent 之外,Agentic Age 流量赛的隐藏副本 - Agentic AI 时代正在重塑流量入口逻辑,与传统互联网时代有根本性差异 [2] - 多模态大模型和 Agent 技术进步推动行业讨论焦点从 LLM 转向 Agent,2025 年或形成新流量入口 [2] - AI 助手将打破界面边界,跨平台自主执行任务,颠覆传统注意力分发模式 [2] - 自然语言交互有望替代图形界面操作,重构各类场景的交互形式 [3] Agentic 时代的用户行为变化 - 用户可通过指令让 AI 处理任务,减少主动浏览网页和应用的需求 [3] - 大模型强化记忆和多模态能力,如 Google Gemini 可记忆用户偏好,Anthropic 等展示跨设备操作能力 [3] - 多模态智能体支持语音对话、场景式查询等更自然交互形式 [3] - 硬件厂商如微软、苹果通过专用按键优化 AI 调用入口,入口定义转向语音指令或一键唤醒 [4] 新型用户特征与需求 - Agentic Age 催生创造性用户,模糊用户与开发者界限,通过简单指令构建定制化智能应用 [5] - 新用户群体包括大量非技术背景普通用户,依赖自然语言编程等技术快速部署智能体 [5] 非主流 Agentic 路线探索 - 行业正探索三大非通用 Agent 路线以切入流量入口,具体路径未展开 [6] 技术发展动态 - 本期通讯涵盖 31 项 AI & Robotics 赛道要事,含技术 12 项、国内 8 项、国外 11 项 [1]