Workflow
端云协同
icon
搜索文档
“像把大象塞进冰箱一样困难”,端侧大模型是噱头还是未来?
36氪· 2025-10-14 08:30
端侧大模型的定义与范畴 - 端侧大模型指将大模型的推理过程直接部署在终端设备上,而非依赖云端数据中心 [2] - 端侧设备范围广泛,包括算力较弱的IoT设备、算力中等的智能手机、机器人和PC等 [2] - 大模型没有统一标准,通常指基于decoder-only的Transformer架构、参数规模超过百兆的自回归模型,能处理多种任务并适应不同下游任务 [2] 端侧部署的核心优势 - 隐私保护:模型可利用端上产生的所有数据(如录音、文本、屏幕点击),避免敏感数据上传云端 [3] - 低延迟与高可用性:端侧推理摆脱网络依赖,避免云端服务的网络往返延迟和批量调度时延,整体延迟显著降低 [3][6] - 成本优势:将计算分摊到用户终端,可减少企业维护超大GPU集群的成本 [3][6] 端侧部署面临的技术挑战 - 内存限制:终端设备内存配置多为8~12GB,需通过极致量化与压缩(如4bit甚至更低)来适配有限内存 [4][5][7] - 精度对齐:端侧必须将FP32模型高精度压缩,不同厂商对量化算法的支持差异带来精度对齐难题 [5] - 开发适配成本高:端侧部署几乎需从零开始开发高性能算子,构建推理能力,开发成本远高于云端 [5] - 模型部署与下发:APP安装包尺寸限制大,即便量化后模型仍可能达几百兆,内存压力显著 [11] 业界解决方案与技术进展 - 华为CANN工具链提供NPU友好的低比特量化算法,显著降低模型内存占用,使大模型能运行于手机等终端 [6][9] - 工具链支持Ascend C自定义算子开发,实现一次开发多端部署,并已适配业界主流开源模型(如通义、千问、LLaMA、ChatGLM) [6][9] - 采用量化策略如PTQ、QAT,针对2比特量化选用更小block size(如64或32)并引入二级量化来压缩scale,减少模型体积和加载内存 [16][17] - 利用模型稀疏性与存储分层结合,将频繁激活的参数常驻内存,不常用参数按需加载,以扩大端侧可运行模型规模 [12][13] - 针对Prefill阶段算力瓶颈,采用prompt缓存、混合低比特量化等技术;针对Decode阶段带宽瓶颈,采用更低比特量化、MoE、投机推理等方案 [14][15] 典型应用场景与商业化路径 - 隐私要求高的场景:如数字世界的Computer Use Agent(GUI Agent、Function Code Agent)、物理世界的具身智能(无人机、机器人) [21][26] - 实时性要求高的场景:如语音助手、流式识别、实时翻译、相机算法优化、离线ASR等 [6][21] - 商业模式上,终端侧运行已基本成熟,华为、vivo、荣耀、苹果等厂商新旗舰手机均具备端侧大模型能力 [21] - 更易取得商业化成果的路径是将大模型与具体应用场景结合,如应用开发、智能Agent、无人机或其他深度垂直领域 [29][30] 未来发展趋势与端云协同 - 未来3-5年,端云协同将成为必然趋势,端侧作为"神经末梢"负责部分token计算和隐私数据采集,云端作为"大脑"完成复杂推理决策 [23][24] - 端侧将更贴近生产力场景,处理与用户本地数据相关的个性化任务;云端则致力于拓展人类知识边界的复杂任务 [24][25] - 端的形态将不限于手机,扩展到车机、机器人、智能眼镜等设备,成为智能入口和重要计算节点 [25][26] - 操作系统需重新定义资源管理以适配大模型,如KV cache的管理、NPU的灵活调度机制等 [10][24]
vivo交出AI战略新答卷
华尔街见闻· 2025-10-11 07:09
AI手机行业竞争态势 - 发力AI手机已成为各大手机厂商的共识 但近两年多来尚未有赢家跑出 [2] - 行业共识是操作系统已向AIOS全面演进 这是用户体验要求更自然、更直觉的必然 [2] - 当前竞争焦点在于谁能更好地用AI重塑人机交互方式 让AI手机能更自主感知 [2] vivo的AI战略核心 - 公司在2025开发者大会上提出全新升级的蓝心智能战略 旨在从三方面促进AI与操作系统融合 [2] - 战略目标是将大模型技术与手机操作系统深度融合 打造个人化智能 [2] - 战略推进方向包括蓝心大模型矩阵、蓝心个人智能框架、蓝心智能开放平台 [2] 蓝心大模型矩阵进展 - 大模型是AIOS的能力底座 公司在2023年首次推出自研蓝心大模型矩阵 [3] - 新矩阵在语言、语音和图像方面实现进一步突破 并推出体量更轻、能力更全的3B端侧多模态推理大模型 [3] - 采用端云协同主流部署方案 端侧负责低算力AI工作 云端负责高算力情景 [3] - 过去两年公司实现了13B、7B、3B、1B多种模态的端侧化 在手机上累计实现18个功能的端侧化 [3] - 从去年开始重点选择3B模型的端侧化技术路径 [3] - 3B模型具备语言能力、多模态能力、逻辑推理能力、128K长上下文能力、UI Agent能力 [3] - 3B端侧多模态推理大模型是全球首个专为端侧Agent构建的3B模型 [4] 蓝心个人智能框架 - 全新框架允许大模型通过全域感知和多模态数据融合 更精准理解用户意图 [5] - 框架通过个人化数据沉淀不断加深对用户的理解 [5] - 该技术是公司做好AI眼镜和未来具身智能大脑的技术基础 [5] 蓝心智能开放平台与生态构建 - 公司全面升级蓝心智能开放平台 包括平台层、协议层和分发层 将个人化能力开放给更多开发者 [5] - 意图框架升级为2.0 全面兼容MCP协议 [6] - 公司推出适配智能体协议A2A 使开发者能基于Agent协议全流程线上化进行智能体创建和卡片配置 [6] - 智能语音助手蓝心小V可调用的手机和生态应用技能已超过千余个 [6] OriginOS 6操作系统特性 - OriginOS 6是基于端侧"个人专属模型"的新一代手机操作系统 提供千人千面的定制化服务 [6] - 系统升级"小V圈搜" 支持屏幕主体自动识别和意图理解 从"能搜会识"到"即刻执行" [6] - 搭载的小V记忆2.0可将收藏内容进行AI提炼、分类整理 并关联日程和地址等信息 [6] 蓝河操作系统发展 - 公司推出蓝河操作系统3 为原生AI设备而来 构建"立体感知体系" [7] - 蓝河操作系统3提升相机启动速度 支持视觉识别与空间算法 [7] - 蓝河操作系统是行业首个全栈由Rust语言编写的操作系统 首发搭载在手表上 [7] - 未来公司可能在智能眼镜等更多原生AI设备上搭载蓝河操作系统 [7]
首家AIOS落地来自vivo:个人化智能复刻人类思维,手机还能这样用
机器之心· 2025-10-11 04:18
核心观点 - vivo在2025年开发者大会上展示了其全新的端侧AI能力,标志着AI手机从概念走向实用化[6] - 公司战略核心是坚定不移地走“更懂用户的个人化智能”之路,而非单纯的参数竞赛[8] - 通过推出蓝心3B端侧多模态推理大模型及端云协同的模型矩阵,旨在打破API成本高墙,解决AI规模化落地难题[8][9] - 基于对脑科学的研究,vivo模拟人类思维架构构建AI操作系统,通过感知、记忆、规划、执行四大引擎让AI具备理解、思考和行动的能力[18][20] - 公司通过开放端侧AI能力、模型矩阵和统一框架,携手开发者共建生态,愿景是在未来三到五年让超过3亿设备拥有强大的本地AI能力[23][24][31] 模型战略与技术突破 - 提出全新的One Model:蓝心3B端侧多模态推理大模型,作为战略核心[8] - 打造端云协同、端侧部署优先的大模型核心引擎,包含语言、语音、图像、3B端侧多模态推理大模型和个人专属模型五大模型[9] - 蓝心3B模型以30亿参数实现优化,以60%的参数量效果比肩行业最优的4B级纯语言模型,推理速度达200 Token/s[9] - 该模型在多模态权威榜单OpenCompass上实现越级挑战,性能超越一众先进的8B模型[11] - 支持语言及多模态任务深度思考,通过混合推理架构自动切换思考/非思考模式,使复杂推理不再是云端独有技能[13] - 端侧能力提升使多智能体协同工作成为可能,如能看懂屏幕并模拟操作的UI Agent[14] 系统整合与个人化体验 - 大模型能力已融入OS系统底层各个模块,使AI成为无处不在的系统级智能[15] - AI操作系统基于对人类思维架构的模拟,通过感知、记忆、规划、执行四大引擎协同工作[18] - 实时感知涵盖图像、文本、声音等多模态内容识别,记忆是对用户数据行为的存储理解,执行包括调用工具与服务,自主规划可主动思考拆解复杂任务[20] - 通过多智能体协同形成“群体智能”,驱动手机中多个应用分工协作,动态调度规划以完成复杂通用任务[20][21] - 蓝心小V已与多家合作伙伴合作,打造覆盖健康、教育、出行、情感、办公等场景的智能体[21] 开放生态与合作伙伴 - 公司开放强大的端侧AI能力、端云协同模型矩阵、统一开放的Agent框架及与OS深度整合的系统级能力[24] - 开发者构建的新能力最短仅需10分钟即可上架vivo智能体生态,通过平台与蓝心小V的A2A协议发布上线[26] - 展示了与蚂蚁集团旗下AI健康应用AQ的合作成果,AQ升级后在蓝心小V健康流量占比提升三倍[28][29] - AQ具备“医学思维”,通过多轮对话、拍皮肤、识报告等方式分析身体状况,连接全国超5000家医院、近百万医生、超300位名医AI分身[29] - 生态已接入50多家合作伙伴,提供100多种非常识别能力及200多项服务及智能体[25]
高通组局,宇树王兴兴说了一堆大实话
量子位· 2025-09-26 09:12
文章核心观点 - 在2025骁龙峰会·中国上,行业核心玩家共同探讨了AI与Agent技术为终端设备(特别是具身智能机器人)带来的新想象,并剖析了当前行业面临的技术路线分歧、部署挑战及开放协作的必要性 [1][2][3] 具身智能机器人的发展路径与挑战 - 宇树科技CEO王兴兴提出了通用AI机器人发展的四阶段路线图:固定动作演示(已实现)、实时生成任意动作(预计最快2025年底/2026年初实现)、在陌生场景执行任务(预计2026年底左右实现)、高成功率与精细操作(目标成功率接近99.9%,需再数年) [11][12] - 机器人面临部署大规模算力的难题,包括空间限制导致高算力芯片难以安装、电池容量及散热问题难以解决 [20][21] - 机器人峰值功耗理想目标需控制在100W以内,平均正常功耗为20-30W,相当于几个手机的功耗,手机芯片应用于机器人领域具有想象空间 [23][24] - 工业机器人最常见的故障是线缆问题,可能占到故障总数的60%-70%,减少线缆数量对提升可靠性至关重要,目标是将每个手臂的线缆减少至仅一根 [16][17][19] 端侧AI与Agent系统的关键作用 - 端云协同已成为行业共识,端侧模型具备"永远在线"的优势,可持续感知世界、保障用户隐私,并作为核心编排者协同云端Agent完成复杂任务 [35][38] - 端侧模型需不断提升知识密度,面壁智能提出知识密度每三个月提升一倍的观点,以更好地适应各种硬件设备和用户场景 [39] - 在汽车座舱等具体终端场景,端侧模型能基于本地感知(如感知到后座小朋友哭闹)快速响应并协同云端模型提供服务,避免隐私暴露 [36] 行业协作与开放生态建设 - 当前行业处于黎明前夜,各家技术路线差异大导致整体进展缓慢,建议在模型尚无法直接部署的阶段保持开放态度,通过开源促进共同进步 [25][28][29] - 宇树科技已开源其基于视频生成的世界模型,包括模型、数据集、训练及部署源代码,旨在推动领域共同发展,类似OpenAI早期开源GPT-1/2的策略 [26][28] - 行业需共建基础设施以应对碎片化挑战,例如中科创达与高通、火山引擎等合作共建创新中心与联合实验室,推动混合AI方案优化 [48][51] Agent的服务本质与未来操作系统 - Agent的核心竞争力在于其能提供的服务能力,用户选择Agent的逻辑将类似于选择操作系统,关键在于其接入服务的广度与深度 [44][47] - 理想汽车的"理想同学"Agent已从车内服务扩展至生活场景,如点咖啡、交水电费、叫代驾等 [47] - 未来有望形成跨终端的操作系统,由Cloud OS与各终端Agent协同工作,AI将作为一种全新的UI催生新的AI OS [50]
苹果计划2026年推出Siri AI搜索 端云协同兼顾隐私与功能升级
环球网资讯· 2025-09-04 04:52
产品升级计划 - 苹果公司计划于2026年年初发布的iOS 26.4系统中为Siri搭载基于自研Apple Foundation Model的AI网页搜索功能 [1] - 新系统构建三大核心模块:规划器负责解析用户意图与处理设备端隐私数据 搜索执行器负责调用网络资源 总结功能依托私有云计算平台整合信息 [1] - 总结功能采用谷歌Gemini模型运行于苹果控制的服务器 所有用户查询均通过匿名标识符处理并剥离个人身份信息 [3] 技术架构特点 - 采用"端云协同"AI战略:设备端模型处理敏感数据确保隐私安全 云端引入第三方模型弥补设备端计算局限 [3] - 现有苹果与谷歌搜索合作协议将继续生效 Gemini模型仅作为工具链组成部分运行于苹果服务器 [3] - 私有云计算服务器采用可再生能源 符合公司环保承诺 [3] 战略方向 - 凸显苹果在AI领域坚持技术自主权的发展思路 通过自研基础模型作为核心支撑并整合第三方模型补充功能 [3] - 凭借垂直整合能力持续完善AI生态布局 优化用户智能交互体验 [1][3] - 彰显公司在AI领域的技术布局与战略方向 [1]
面壁智能成立汽车业务线,与吉利、长安等车企合作AI座舱
南方都市报· 2025-08-16 13:22
行业趋势 - 大模型商业化落地成为行业关注焦点 终端应用集中在汽车 手机 机器人等领域 [1] - 端侧模型优势及端云协同成为行业共识 越来越多厂商将注意力投向端侧 [2] - 汽车成为端侧智能主战场之一 多模态大模型重新定义智能座舱 实现从被动响应转向主动智能 [5] 公司战略 - 面壁智能成立一级组织汽车业务线 旨在实现压强式突破 让MiniCPM端侧模型应用到更多汽车 [1] - 公司2024年初定义并开拓端侧智能市场 推出MiniCPM系列端侧模型 形成基座 多模态 全模态的完整谱系 [1] - 2024年6月开源两款最快速MiniCPM 4.0模型 8月接力开源MiniCPM-V4.0 多模态能力可流畅运行于手机 [1] 技术产品 - MiniCPM端侧模型2.4B参数能力超越Mistral 7B模型 推出多模态代表作V2.5 o2.6等有世界级影响力的模型 [1] - 端侧模型上车使车辆在无网环境下也能体验完整功能 响应迅速且确保隐私安全 [5] - 下半年将有一批端侧模型陆续发布 [1] 商业合作 - 与吉利 大众 长安 长城 广汽等重量级车企开展合作 在AI座舱方面形成特色优势 [5] - 首款量产车型长安马自达MAZDA EZ-60将于本月底上市 搭载面壁MiniCPM端侧模型 [4][5] - 更多车企合作车型将陆续推向新阶段 [5] 竞争格局 - 越来越多创业公司和巨头涌入端侧赛道 市场加速成长 场景丰富分散容众多参与者 [5] - 阶跃星辰联合吉利推出AI智能座舱 实现行业端到端语音大模型首次量产上车 [5]
智驾芯片算法专家交流
2025-08-07 15:03
行业与公司 * 行业涉及自动驾驶芯片与算法领域 公司为华为及其汽车相关业务[1][2][3][4][5][6][7][8][9][10][11][12][13][14][15][16][17][18][19][20][21][22][23][24][25][26][27][28][29][30][31][32] 核心观点与论据 芯片硬件发展 * 华为新一代MDG1,000芯片提供500-800 TOPS算力版本 采用单芯片方案替代双芯片 解决特征层传输局限性 预计价格在一万多美元 低于双芯片方案的13000-14000美元[1][2][4] * 当前芯片为7纳米工艺 未来将精进至5纳米工艺 带宽从目前100 GB/s提升至200-280 GB/s NPU算力从200K DMUS升级到400K DMUS[2] * 车端芯片架构基于达芬奇架构 偏向整形运算(如INT8) 与云端服务器的浮点运算需求不同 成本差异显著(云端浮点计算卡需十几万美元)[5][6] * 华为未转向GPGPU方向 而是优化ASIC架构 推进存算一体化 提高数据吞吐效率[1][7] 算法架构演进 * 华为自动驾驶算法从IDS3.1/3.3的两段式结构向端云协同Vivo框架转变 通过云侧世界引擎模型生成训练数据 蒸馏出MOE多专家原生基模型 提高对复杂场景的泛化能力[1][13] * 当前多模态大语言模型参数量约1.几个B(十亿) 低于特斯拉(几十B)和理想(4B)[14] * 车端多模态大语言框架可实现100毫秒内出结果(相当于10帧) 全链路200毫秒 融合感知、后处理、预测、规划及控制 通过注意力机制提高效率[19] * 系统基于盘古大模型 并结合开源资源(如OpenAI或Lambda)进行自主创新[20] 自动驾驶级别与功能 * L3级自动驾驶功能预计2025年底或2026年初推出 但法规尚未完全支持 保险公司目前仍按L2标准赔付[28][31] * L4级别自动驾驶技术预计2026年底进行小范围试点 将优先应用于百万级别豪华车型(如尊界MPV) 再逐步推广至六七十万价位车型[11][32] * 自动驾驶版本接管率存在差异: 2.0版本城区每5公里一次接管 高速500公里以上 3.0版本城区提升至20公里一次 高速突破1000公里 4.0版本高速设计目标为10000公里一次[22] 传感器与融合方案 * 多传感器融合方案是主流方向 包括摄像头、毫米波雷达、超声波和激光雷达 尚未考虑纯视觉方案[22][23] * 激光雷达在算法架构中起到全融合定位作用 从目标级融合发展到数据级融合 提高学习效果和精度[22][23] * 华为推出单激光、双激光(前后固态补盲)、三激光(前主激光加侧面补盲)及四激光雷达方案[22] * 第五代激光雷达将在2025年推出 应用于VL4解决方案 已上市车型(如问界M9、S800)可通过OTA升级支持[29][30] 数据与训练 * 数据质量对训练效果至关重要 高质量数据标注和工程是提升体验的关键 通过仿真生成高质量场景训练端侧模型[16] * 特斯拉采用极简式一段式训练方法 优势在于快速数据闭环(如使用1000万个CLIP实现良好效果)[17] * 高质量基础模型结合垂直领域数据积累可显著提升整体表现[18] 车型与配置 * 2025年主要搭载500 TOPS算力芯片 800 TOPS芯片尚未上车 今年上车的大部分是810型号(400 TOPS左右) 真正达到500 TOPS要到2026年[12] * 2025年发布的SE、Pro、Max、Ultra类别中 只有Ultra使用下一代芯片平台 Max仍使用610型号(MDC810) 配置包括主激光雷达、侧面补光激光雷达、6只毫米波雷达及12只摄像头[12] * 摄像头加激光雷达融合模组用于DMS(驾驶员监测系统)和OMS(乘客监测系统)[26] 线控技术 * 当前转向技术属于半线控转向 保留机械部件 未来全线控转向将完全依赖电子控制 与L4级自动驾驶密切相关[27] * EMB(电子机械制动)已实现双冗余、互冗余制动控制 将在L4阶段更广泛应用 目前主流是EHB(电子液压制动)[27] 其他重要内容 * 车端硬件受限于算力和带宽 运行1.5B-2B模型需40GB/s带宽 运行77B模型需150GB/s带宽[14] * 晚上行车时视觉系统有效距离存在差异 有些公司只能看到50米 华为可达100米以上[24] * IDS3.0系统可升级到多个版本(如M5、M7、R47) 4.0版本也能升级到IDS Pro的M7车型 但硬件配置不同导致体验差异[25] * 英伟达客户群体广泛 需求多样化 华为更加专注特定领域 制程问题敏感 未来5纳米工艺可能限制高端车型使用最新技术[9][10]
萤石网络20250710
2025-07-11 01:05
纪要涉及的行业和公司 行业:智能家居行业 公司:萤石网络(银石网络) 纪要提到的核心观点和论据 1. **智能家居摄像机(SHC)业务** - 2024 年整体销售小幅下滑,因运营商采购减少和放弃部分竞标方案,不考虑运营商仍有约 2%增速,专业客户渠道年底收缩约 7 个百分点,2025 年预计继续收缩但幅度减小,对整体影响小[3] - 细分市场机会明显,4G 电池相机上半年增速和占比显著提升,带屏视频通话摄像机和宠物喷雾相机等创新产品获市场认可,增长潜力大[3] - 推出子品牌“金小豆”吸引 20 岁左右年轻人,“爱可图”针对户外运动系列产品,满足多样化需求[3][4] - C 端增值服务中 4G 流量是增长亮点,终身流量产品递延收入确认未来累积效果将显现,测试并上线 AI 增值服务[3] - 国补政策对线上业务有显著正向作用,公司推进线下终端化、零售化转型,实现 O2O 全域零售[3][14] - 海外市场需求差异大,新机会点不断涌现,2025 年预计保持稳健增长,是基本盘业务和现金流来源[2][4] 2. **智能入户业务** - 自 2024 年对该业务充满信心,Y3,000 人脸锁和视频锁系列在研发和用户体验反馈方面出色,与传统品牌相比在视频视觉能力、自研算法及成本优化上有优势,产品创新性价比领先,市占率不断上升[2][5] - 2025 年推出搭载南海大模型的 Y5,000 智能锁,预售量达 17 万把,618 期间成为主推产品,市场反响良好[2][7] - 国内市场前景好,计划将 Y5,000 投放到海外公寓居住环境多的国家和地区,已建立渠道基础,还销售别墅门铃猫眼等产品完善入户解决方案[2][8] 3. **第二增长曲线业务** - 2024 年收入增长迅速,2025 年希望保持快速收入增速并实现全年盈利,成为第二现金流业务,需产品事业部和营销端共同努力[2][9] 4. **第三增长曲线业务** - 包括孵化中的新兴业务如 AI 服务机器人、智能穿戴设备等,具备很大商业潜力,AI 服务机器人不断迭代技术和能力[10] - 2024 年布局的物联网云平台增速超过公司整体业务增速,占比不断提升[10] 5. **C 端增值服务** - 与 4G 产品关联紧密,4G 流量是增长点,终身流量产品递延收入确认将在财报体现,未来几年累积效果持续显现[3][11] - 测试并上线多个 AI 增值服务,优化视频内容处理能力[3][11] 6. **ToB PaaS 平台** - 整体增速较快,比 C 端增速更快,机会点分散且众多,2025 年对开放性全面升级,覆盖更多行业需求,积极布局新机会点[12] 7. **智能家居发展趋势** - 应注重端云协同模式,将实时性要求高且大多数用户需要的功能放端侧,个性化、复杂且对实时性要求不高的运算任务放云端,通过云服务订阅和续订模式实现预算平衡,推动技术良性循环[13] 8. **国补政策影响** - 对公司收入和利润有显著正向作用,促进国内消费水平提升,线上业务由电商平台承接,政策因平台、区域和时间段不同而变化,公司有专业团队对接,对线上业务拉动明显,公司推进线下终端化、零售化转型,实现 O2O 全域零售[14] 9. **地缘政治因素影响** - 公司在美国市场几乎可忽略不计,作为海康控股子公司在美国资源投放少,加之 FCC 认证问题,美国市场硬件收入占比微乎其微,海外业务受地缘政治影响有限[15] 10. **商用清洁机器人项目** - 已有少量落地,但占公司整体比例不高,B 端市场竞争激烈是红海市场,C 端相对蓝海,推广 B 端市场需教育企业和物业客户[16] 11. **品牌设计和 APP 端策略** - 采取差异化策略,针对年轻群体推出子品牌“金小豆”及其独立子 APP,设计风格偏向卡通、IP、情绪价值以及交互性,与主品牌 APP 有显著不同,虽可共用账户但调性、功能和内容覆盖差异大[17][18] 12. **海外市场销售情况** - 销售增速高于国内市场,整体占比不断提升,2024 年初步完成从单品类向多品类牵引,入户和清洁品类增长显著,2025 年逐步导入智能锁等新产品,第一增长曲线为 FHC,第二增长曲线为入户[19] 其他重要但是可能被忽略的内容 - 公司推出子品牌“金小豆”和“爱可图”,分别针对年轻用户群体和户外运动人群,通过独立设计和 APP 开发满足多样化需求[3][4] - 4G 流量在 C 端增值服务中是增长亮点,终身流量产品存在递延收入确认,未来几年累积效果将显现,同时测试并上线 AI 增值服务优化视频内容处理能力[3][11] - 国补政策对公司线上业务有显著正向作用,公司有专业团队负责对接,并积极推进线下终端化、零售化转型,实现 O2O 全域零售[3][14] - 公司在美国市场几乎可以忽略不计,海外业务受地缘政治影响有限[15] - 推出子品牌选择单独 APP 运营,是为了更好满足特定用户群体需求,提供个性化服务,增强品牌识别度,优化功能和用户体验,利于品牌长远发展[16]
零距离 人工智能手机到底是个啥
环球网资讯· 2025-06-30 00:36
核心观点 - AI手机正在成为手机行业的新趋势,多家厂商如OPPO、荣耀、vivo已推出具备AI功能的新机型,标志着手机从功能机到智能机再到AI手机的演进[1] - AI手机的核心能力包括多模态感知、个性化决策和自动化执行,能够通过自然语言交互完成复杂任务,重塑用户体验[2][3][4] - 行业预测显示AI手机市场将迎来爆发式增长,IDC预计到2028年GenAI智能手机出货量将达9.12亿部,2024-2028年CAGR为78.4%[5] - 国产厂商通过接入本土大模型快速赶超国际品牌,在智能助手等核心功能上展开激烈竞争[5][6] - AI手机生态仍处于早期阶段,关键技术突破如5G网络、大模型、端云协同等推动行业发展,但规则规范和隐私保护等问题有待探索[7][8][9] AI手机定义与能力 - 目前行业对AI手机尚未形成统一定义,各厂商有不同理解,但普遍认为需具备系统层级的AI智能体能力[2] - AI手机的核心差异化体验在于"懂人话"和"会做事",能够通过自然语言交互理解用户意图并自动执行任务[2][3] - 典型应用场景包括自动打卡、智能导航、餐厅预订等,展示从生成式AI向智能代理AI的过渡[3][6] - AI手机具备"屏幕理解"能力,可直接读取屏幕信息完成任务,无需用户手动操作[3] 市场发展与竞争格局 - 中国厂商通过集体接入本土大模型快速赶超国际品牌,市场竞争已进入白热化阶段[5] - 智能助手成为竞争焦点,OPPO的"小布"、荣耀的"YoYo"、vivo的"小V"等旨在成为用户的"AI代理"[5][6] - AI功能有向下渗透趋势,部分旗舰机功能可通过算法优化"下沉"到中端机型,提升产品竞争力[9] - 云手机技术使千元机用户也能享受旗舰机AI功能,有助于降低使用门槛[8] 技术演进与生态发展 - 5G网络提速、大模型发展、国产服务器等技术突破直接催生AI手机生态演进[7] - "端云协同"成为重要技术路径,既升级端侧算力也利用云端算力解决问题[8] - 行业正在探索隐私保护方案,如关键敏感信息"不上云"、提供私密化云端空间等[9] - 当前生态处于初期探索阶段,各类规则规范需厂商、平台、消费者共同塑造[9]
“大模型六小虎”多高管离职:商业化靠掘金B端,试水端侧
21世纪经济报道· 2025-06-23 08:52
核心观点 - 大模型行业面临商业化压力 高管离职频发 商业化路径尚在探索中 [1] - 行业分化出C端和B端两条商业化路径 但C端面临付费意愿低困境 B端更注重ROI [2][3] - 技术部署存在云侧与端侧之争 云侧API模式盈利压力大 定制化方案盈利能力更强 [4][5] 商业化现状 - 2025年行业面临商业化大考 "大模型六小虎"中已有十余位高管离职 包括多位商业化负责人 [1] - 主动披露收入的公司极少 智谱AI 2024年商业化收入同比增长超100% 平台日均Tokens消耗量增长150倍 [1] - MiniMax 2024年预测年化收入达7000万美元 全球300余个大模型中仅少数实现初步商业化探索 [1] 客户定位路径 - C端路径代表包括MiniMax(视频生成产品海螺AI/AI陪伴应用Talkie)/月之暗面(Kimi助手)/阶跃星辰(AI助手跃问/开放世界冒泡鸭) [2] - B端路径代表包括智谱AI(虽推C端产品智谱清言但偏B端)/零一万物(聚焦零售电商/AI2.0数字人)/百川智能(医疗核心场景) [2] - 零一万物战略从"坚决做ToC"转向2024年全面聚焦B端 收缩C端业务 [2] C端商业化挑战 - 超八成用户拒绝为对话功能付费 多数用户同时使用多个免费模型抵消体验限制 [2] - 主要通过订阅实现价值 但面临叫好不叫座的流量困局 [2] B端商业化特征 - 企业对于生成式AI投入预算增加 但越来越重视投入ROI [3] - 目前难以给出确切ROI中位数 因多数企业AI应用仍处价值发现和初期探索阶段 [3] - 已实现正向收益场景集中在快速提升内部运营效率领域 如AI辅助软件开发/自动化营销文案/知识管理与报告总结 [3] 技术部署模式 - 普遍采用云端训练+云端推理 依赖公有云厂商算力 [4] - 云侧核心盈利方式包括按API调用次数或Token量付费 以及定制化解决方案收费 [4] - 纯API调用模式因产品同质化/难以深度满足场景需求导致盈利压力大 规模效应较难达成 [4] - 定制化行业模型盈利能力较强 头部厂商通过"通用大模型+行业精调"模式向制造业客户收取单项目数百万元费用 [4] 端侧部署发展 - 智谱AI2025年与珠海市合作搭建"城市级GLM大模型"覆盖端侧 阶跃星辰将智能终端列为重点场景 [4] - 端侧部署需从硬件厂商手中竞争 且面临技术挑战加大研发成本 [5] - 大型AI模型计算存储需求与终端设备有限资源(算力/功耗/内存)存在天然矛盾 [5] - 业界通过模型压缩/知识蒸馏技术使模型"小而美" 芯片厂商推出集成NPU等专用硬件支持端侧AI [5] - "端云协同"成为务实路径 终端部署轻量级模型处理高频任务 复杂请求调用云端模型 [5] 产业化方向 - 深度垂直化是方向之一 通用大模型需与金融/医疗/法律/制造等行业专业知识深度融合形成专用AI [3] - 参照互联网发展历程 AI产业可能遵循从B端到C端再到B端深化的演进路径 [2]