端侧智能
搜索文档
从豆包手机谈起:端侧智能的愿景与路线图
AI前线· 2025-12-22 05:01
豆包手机助手的技术定位与核心突破 - 字节跳动发布的豆包手机助手被定义为行业首款系统级GUI Agent,标志着大模型应用从“对话”迈向“行动”的重要跃迁,它深度耦合于操作系统底层,具备跨应用感知与操作能力,是一个“超级中枢”[2] - 豆包手机助手是强化学习驱动的视觉语言模型技术路线的集大成者,其核心技术GUI Agent在2023至2025年间经历了从“外挂式框架”到“模型原生智能体”的根本性范式转变[4][5] - 该产品在工程侧实现了关键突破,凭借定制OS优势实现了“非侵入式”的系统级接管,核心要素包括GPU Buffer直读以降低延迟,以及构建虚拟屏幕后台进程以避免抢占用户焦点[7][10] - 在模型侧采用端云协同架构:端侧模型负责意图识别与任务路由,实现毫秒级响应;云侧模型处理多步骤、跨应用的复杂任务,并区分“思考”与“非思考”两种模式以平衡速度与成功率[8] - 其核心护城河在于建立了基于强化学习的数据闭环,通过高保真OS沙盒环境,模型经历了数百万次轨迹的探索与优化,使其泛化能力显著优于学术界开源模型[10] GUI Agent的技术演进路径 - 早期阶段(2023-2024)采用外挂式框架,通过提示工程将界面转化为文本或带数字标记的截图,模型能力受限于外部工具精度,并未真正“看见”GUI环境[4] - 后续阶段(2024)转向模仿学习驱动的视觉语言模型方案,如智谱的CogAgent等,直接基于像素输入理解界面,实现了感知层面的“原生化”[5] - 当前主流(2024-2025)是强化学习驱动的视觉语言模型,如伯克利的DigiRL、智谱的AutoGLM、字节的UI-TARS等,使得智能体能在与OS环境的持续交互中优化策略,具备自主执行任务的能力[5] 当前技术面临的挑战与局限性 - **生态覆盖有限**:面对微信、淘宝、小红书等高频应用,智能体常因无法精准调起原生应用,被迫降级为网页搜索或通用问答,“服务直达”退化为“内容检索”[10][11] - **复杂任务能力不足**:测评显示,豆包手机助手在59.86%的复杂任务上取得成功,失败案例集中在复杂指令解析精度不足、动态环境执行鲁棒性缺失、长程交互上下文管理混乱等方面[10][11] - **隐私安全风险**:当前架构严重依赖云侧GUI模型处理屏幕理解与操作,相当于将用户数字生活映射至云端,触及了应用厂商的数据红线,已导致对微信、淘宝等核心应用的支持被暂停[9] - **个性化与主动服务能力不足**:本质仍是“用户下令-智能体执行”的被动工具,缺乏对用户深度理解,无法提供基于个人习惯的主动服务[12] 端侧智能的未来演进方向 - **端侧智能(隐私安全)**:未来AI手机生态必须确立“端侧原生、端云协同”原则,涉及用户隐私、实时交互的私有数据必须在端侧形成闭环,云侧则处理通用逻辑与专业需求[12][14] - **全模态智能(环境感知)**:下一代感知需从“多模态”走向“全模态”,在统一架构下融合文本、图像、视频、音频等信息,并从“静态采样”走向“动态流式”处理,实现实时增量式理解与决策[18][19][20] - **自主智能(复杂决策)**:需在泛化性、自主性与长程性三个维度实现突破,让智能体具备零样本泛化能力、应对动态环境的反思与错误恢复机制,以及管理长程交互上下文的类人记忆架构[22][24][25][27] - **主动智能(个性化服务)**:需完成从“被动响应”到“主动智能”的范式跃迁,具备基于用户历史行为和环境状态的意图预测能力,并通过“预先填充确认”等方式大幅降低用户交互成本[29][30][31] 行业竞争格局与未来展望 - **短期(1年内)**:预计更多手机助手将上市,应用厂商与操作系统厂商之间的“软硬对抗”将加剧,可能引发类似Web端“爬虫与反爬虫”的GUI层面技术对抗[35] - **中期(2~3年)**:竞争焦点将转向“个性化”,端侧模型通过持续学习用户数据,将进化成“持续成长的个人专属助手”,形成用户无法迁移的体验壁垒[36] - **长期(3-5年)**:端云协同架构走向成熟,高隐私与高频任务由端侧闭环处理,超复杂任务路由至云侧,同时将催生以智能座舱、AI眼镜为代表的AGI时代新型端侧硬件形态[38][40] - 大模型能力密度遵循“每3.5个月翻倍”的法则,技术发展正从“尺度驱动”转向“能效驱动,通过稀疏模型架构、软硬协同加速等技术,让更小模型实现更强性能,是端侧智能普及的关键[15][16]
RockAI CMO 邹佳思:端侧智能如何通过「原生记忆」与「自主学习」,完成从工具迈向伙伴的人机关系丨GAIR 2025
雷峰网· 2025-12-19 04:55
" 当Transformer走到尽头,面对的是参数和规模的极限,端侧群 体智能或许是AI发展的另一条出路。 " 作者丨张夏宁 编辑丨胡敏 以下是邹佳思的现场演讲内容,雷峰网作了不改变原意的编辑及整理: 大家好,今天我想探讨一个与大家生活密切相关的主题——设备端的智能。 12月12日, 第八届 GAIR 全球人工智能与机器人大会 于深圳正式拉开帷幕。 本次大会为期两天,由GAIR研究院与雷峰网联合主办,高文院士任指导委员会主席,杨强院士与朱晓蕊教 授任大会主席。 作为AI产学研投界标杆盛会,GAIR自2016年创办以来,始终坚守"传承+创新"内核,是AI学界思想接力的 阵地、技术交流的平台,更是中国AI四十年发展的精神家园。过去四年大模型驱动AI产业加速变革,岁末 年初GAIR如约而至,以高质量观点碰撞,为行业与大众呈现AI时代的前沿洞见。 本次峰会之上,RockAI CMO邹佳思以"摆脱Transformer的束缚,让智能重新定义硬件"为主题,为参会 者们带来了一场精彩纷呈的演讲。 邹佳思通过提出一个生活场景的假设作为开场,描绘了一幅充分开发端侧智能后的日常生活图景。在设想 中,家庭场景中智能设备的联动无需云 ...
晶晨股份:当前端侧智能技术渗透率持续提升,正不断催生新的应用形态与场景
证券日报· 2025-12-17 12:16
公司与谷歌的合作关系 - 公司与谷歌拥有十余年的深度合作基础 [2] - 在人工智能领域,双方协同聚焦于谷歌端侧大模型Gemini的硬件生态落地 [2] - 相关合作成果已在2025年第三季度报告中披露 [2] 产品与业务进展 - 公司推出了适配谷歌Gemini大模型的多款新产品,包括智能音箱、智能可视化门铃、室内及室外智能摄像头 [2] - 新产品助力谷歌的智能家居产品整体向内嵌端侧大模型能力的新一代产品升级 [2] - 此举旨在进一步激活存量市场需求 [2] 行业趋势与技术前景 - 当前端侧智能技术渗透率持续提升 [2] - 该趋势正不断催生新的应用形态与场景 [2] - 公司将持续挖掘端侧智能的应用潜力 [2]
晶晨股份(688099.SH):与谷歌拥有十余年的深度合作基础
格隆汇· 2025-12-17 07:38
公司与谷歌的合作关系 - 公司与谷歌拥有超过十年的深度合作基础 [1] - 双方在人工智能领域的协同聚焦于谷歌端侧大模型Gemini的硬件生态落地 [1] 产品合作成果与进展 - 公司已推出适配谷歌Gemini大模型的多款新产品,包括智能音箱、智能可视化门铃、室内及室外智能摄像头 [1] - 相关合作成果已在2025年第三季度报告中披露 [1] - 新产品助力谷歌的智能家居产品整体向内嵌端侧大模型能力的新一代产品升级 [1] 市场影响与公司战略 - 新产品旨在进一步激活智能家居存量市场的需求 [1] - 当前端侧智能技术渗透率持续提升,正不断催生新的应用形态与场景 [1] - 公司将持续挖掘端侧智能的应用潜力 [1]
中科创达(300496):AI+汽车筑基,端侧智能广泛布局
东北证券· 2025-12-17 06:50
投资评级与核心观点 - 报告首次覆盖中科创达,给予“买入”评级 [3][5] - 核心观点认为,公司以AI原生整车操作系统滴水OS 1.0 Evo构建技术壁垒,并通过“芯片+OS+终端生态”协同体系,增强了在智能汽车产业的全栈式解决方案能力与市场竞争力 [1] - 核心观点认为,公司凭借操作系统+端侧智能技术,在注重软件系统核心价值的下游应用端侧拥有核心竞争力和护城河 [2] 财务预测与估值 - 预计2025-2027年营业收入分别为70.42亿元、85.37亿元、112.77亿元,同比增速分别为30.79%、21.22%、32.09% [3][4] - 预计2025-2027年归属母公司净利润分别为4.70亿元、5.72亿元、7.61亿元,同比增速分别为15.26%、21.90%、32.99% [3][4] - 基于盈利预测,对应2025-2027年市盈率(PE)分别为61.72倍、50.64倍、38.07倍 [3][4] - 报告发布日(2025年12月16日)公司收盘价为63.33元,总市值为291.57亿元 [5] AI+汽车业务布局 - 公司发布面向中央计算的AI原生整车操作系统滴水OS 1.0 Evo,深度融合AI大模型技术,实现舱驾融合与多域算力调度 [1] - 公司构建“IP+服务+解决方案”三位一体的业务模式,并与高通、AMD、火山引擎等头部企业建立战略合作,形成“芯片+OS+终端生态”协同体系 [1] - 在AIBox领域,公司推出的产品搭载NVIDIA Drive AGX芯片,可提供高达200TOPS的AI算力与205GB/s的传输带宽,支持多模型、多云AI自由组合,与滴水AIOS形成“软硬协同” [1] 端侧智能广泛布局 - 在机器人领域,公司拥有从硬件控制到感知识别、集群调度的自研技术和产品,当前主要面向工业领域提供移动机器人全系列产品 [2] - 在AI眼镜与MR领域,公司旗下创通联达推出轻量化AI眼镜Smart Glasses和混合现实MR HMD Pro,搭载高通骁龙AR1 Gen1芯片平台 [2] - 在AIPC和AI手机领域,公司旗下创通联达推出四款AI Mini PC参考设计,并将积极跟进AI手机发展新阶段 [2]
星宸科技:公司将在12月26日开发者大会发布五大产品线的最新成果
证券日报网· 2025-12-16 14:15
证券日报网讯12月16日,星宸科技(301536)在互动平台回答投资者提问时表示,公司12月26日开发者 大会上将集中发布涵盖智慧视觉、智慧车载、智能机器人、智能工业及3D感知等五大产品线的最新成 果,全面展示公司在端侧智能的布局与创新。 ...
北京AI产业规模有望超过4500亿元,促进技术普惠发展
环球网· 2025-12-01 01:13
北京人工智能产业发展预测与规划 - 北京市科委、中关村管委会发布的白皮书预测,各类AI Agent将迎来爆发式增长 [1] - 具身智能的发展将实现从信息处理到物理作业的跨越 [1] - 人工智能将促进技术普惠发展,端侧智能催生应用新蓝海,智能手机、个人电脑、智能汽车等端侧设备将具备更强的智能处理能力 [1] - 白皮书初步估算,2025年全年北京AI产业规模有望超过4500亿元 [1] 全球人工智能竞争格局 - 新加坡海峡时报发文称,中国的人工智能发展迅速,特别是在生成式AI领域,挑战了美国的领先地位 [1] - AI将增加下一个十年的生产力增长,推动经济增长,在最好的情况下,它将驱动人类经历类似于工业革命的转型 [1] - 美国越来越多的硅谷公司正在采纳中国生产的性能强大且可免费定制的开源人工智能模型,如DeepSeek的R1和阿里巴巴的Qwen,以降低成本和提高效率 [4] - 这些中国模型在技术上接近甚至超越美国封闭模型,引发了关于美国人工智能行业可能依赖外国技术以及本土封闭模型策略是否合理的讨论 [4] - 尽管美国公司仍保有在人工智能能力前沿的优势,但中国模型的崛起和对外开放策略正挑战着美国在开源领域的领导地位 [4]
中科创达(300496) - 2025年11月01日-30日投资者关系活动记录表
2025-11-30 12:48
AI与智能汽车业务 - AI Box搭载NVIDIA Drive AGX芯片,提供200TOPS AI算力与205GB/s传输带宽,支持7B大模型在端侧运行 [4] - 滴水OS具备端云协同AI架构、中央计算技术突破和超融合全球生态三大核心竞争力 [4] - 与火山引擎合作推出端云协同AI座舱解决方案,实现500ms级语音反馈和多模态识别功能 [5] - 与面壁智能战略合作打造下一代AI座舱交互体验 [5] - 滴水OS支持全球应用生态,已与数十家伙伴建立合作,助力中国车厂出海战略 [7] 物联网与AIoT平台 - 物联网业务涵盖行业手持终端、智能视觉、边缘计算、智能会议系统、机器人、AIPC和可穿戴设备等品类 [5] - AI眼镜采用Android+RTOS双系统架构,开机速度提升75%,拍照响应加快50%,支持脱离手机独立运行 [5][6] - AIoT平台整合软硬一体能力,提供一站式交钥匙解决方案,覆盖消费机器人、可穿戴、VR/AR及工业物联网等领域 [6] - 物联网发展依赖操作系统和AI技术,需结合通信、感知、连接、计算等全方位整合 [6] 机器人业务进展 - 机器人产品包括AMR和无人叉车,已在世界500强企业的汽车汽配、橡胶制造、酒水饮料等行业批量落地 [7] - 2025年10月参展CeMAT ASIA,展出户外平衡重叉车AMR、窄体叉车AMR、2T重载潜伏车和复合机器人等多款产品 [7] - 采用"软件定义+AI定义机器人"战略,实现高精度搬运和柔性制造新范式 [7] 全球化布局与商业模式 - 公司研发团队遍布16个国家和地区,通过"全球化+本地化"策略支持客户出海需求 [7][8] - 物联网销售采用"生态赋能"模式,与生态伙伴联合营销建立全球化体系 [7] - 滴水OS为车厂提供端侧智能开发、软件开发、IP授权及舱驾融合域控制器等全栈解决方案 [4][5]
北京人工智能产业白皮书:各类AI Agent将迎来爆发式增长
新京报· 2025-11-29 07:55
北京人工智能产业现状 - 2025年上半年全市人工智能核心产业规模达2152.2亿元,同比增长25.3% [2] - 初步估算2025年全年产业规模有望超过4500亿元 [2] - AI企业数量超过2500家,已备案大模型183款,持续保持全国第一 [2] 产业生态与商业化进展 - 人工智能产业链日趋完整,形成具有全球竞争力的产业生态 [2] - 商业化路径逐渐清晰,百度、抖音等公司营收和产品活跃用户数均创新高 [2] - 豆包、文心一言、GLM、Kimi等模型在权威测评中表现优异,部分成果达国际顶尖水平 [3] 前沿技术成果 - 北京智源人工智能研究院发布FlagOS,实现"模芯协同"的纵向贯通 [3] - 北京通用人工智能研究院推出"通通2.0",完成从理论创新到能力验证的重大跨越 [3] - 北京科学智能院发布全球首个覆盖"读文献-做计算-做实验-多学科协同"的AI科研平台玻尔科研空间站 [3] 未来发展趋势 - 能胜任个人助理、企业流程自动化、科学研究助手等角色的各类AI Agent将迎来爆发式增长 [1][3] - 具身智能发展将实现从信息处理到物理作业的跨越 [1][3] - 人工智能将拓展认知能力边界,世界模型将显著提升AI系统的泛化能力和可靠性 [3]
萌友智能联合创始人兼CEO何嘉斌:一场AI陪伴的“非共识”商业实验,在年轻人桌上放下一个“未来宠物”
每日经济新闻· 2025-11-25 15:49
公司核心产品与定位 - 产品Ropet是一款AI萌宠,主打“桌面陪伴”概念,通过身体晃动、眨眼、发出小动物般轻柔叫声等非语言互动提供“陪伴感” [1] - 产品主动放弃语音对话功能,通过触觉反馈、丰富身体语言和多模态环境互动构建情感连接,旨在避免对话“机械感”并提升沉浸式互动效果 [1][6] - 产品设计深度融合潮玩审美与宠物互动逻辑,具备柔软毛发质感、模拟体温及能做出丰富表情的眼睛,目标用户为20多岁和30多岁的办公人群 [2][7] 公司发展历程与市场策略 - 公司北京萌友智能科技有限公司成立近4年,已完成三轮融资,最新一轮为数千万元人民币A1轮融资,由北京市人工智能产业投资基金领投,峰瑞资本跟投 [1] - 市场策略采取“先海外,后国内”路径,产品首先登陆美国众筹平台Kickstarter,后在日本最大众筹平台Makuake创下一小时众筹金额突破2700万日元、最终7600万日元的成绩,成为日本机器人品类众筹历史第一名 [3] - 国内市场于2025年“双11”上线,采取“克制”上市策略,通过京东限量发售以收集用户数据打磨产品,国内闲鱼平台曾出现加价三倍转卖海外版的情况 [4] 行业背景与竞争格局 - 全球AI玩具市场规模2023年达100亿元以上,预计到2030年市场规模破千亿元量级,中国AI玩具市场2023年规模预计突破10亿元,2030年预计突破100亿元 [6] - 当前AI陪伴机器人赛道处于“非共识”的草莽生长初期,大厂品牌尚未大规模供应,创业公司有出货量的极少 [8] - 未来竞争可能来自两大势力:具身智能企业将情感陪伴作为技术分支应用,以及潮玩与传统玩具巨头凭借成熟IP矩阵和渠道能力入局 [8] 技术路径与隐私安全 - 公司强调“端侧模型”重要性,所有数据在本地设备处理不上传云端,并提供可佩戴眼罩作为摄像头物理遮蔽方案,以解决用户隐私担忧 [7] - 未来行业拐点依赖端侧智能成熟,即去中心化、低成本高性能本地智能的实现,端侧模型能力上升和端侧芯片成本下降是关键 [10][11] - 公司定位为“未来宠物公司”,专注于打造机器宠物,技术路径聚焦模拟宠物感官与成长性的AI模型,而非挑战通用人类智能的“具身智能”机器人 [10] 市场机遇与用户基础 - 产品试图叩开百亿元规模的情感陪伴市场,潮玩IP(如泡泡玛特Labubu)在2025年持续破圈,印证年轻人“情绪消费”旺盛需求,为AI宠物赛道打开想象空间 [2][9] - AI宠物处在潮玩与科技交汇处,用户已习惯为潮玩付费,这为定价千元以上的Ropet提供了天然消费心智基础 [9]