Workflow
苹果沉默一年,终于亮出AI底牌
苹果苹果(US:AAPL) 虎嗅APP·2025-09-05 13:56

苹果端侧AI战略 - 苹果在HuggingFace上全面开源视觉语言模型FastVLM和MobileCLIP2 构成其端侧AI小模型战略核心[4][5] - FastVLM在生成第一个token的响应速度上比同类模型LLaVA-OneVision-0.5B快85倍 视觉编码器规模缩小3.4倍[7][9] - 7B版本性能优于Cambrian-1-8B模型 响应速度快7.9倍 通过混合视觉编码器FastViTHD实现速度与性能平衡[9] 技术实现特点 - FastVLM采用卷积网络和Transformer融合的混合视觉编码器 减少高分辨率图像处理产生的tokens数量[10] - 模型支持0.5B/1.5B/7B多个尺寸 可在iPhone等个人设备实现实时浏览器字幕功能[13][14] - 处理单帧画面仅需1-2秒 8帧关键帧分析在几秒内完成 在保证速度同时维持极高准确性[16][22] 行业背景与战略定位 - 苹果面对AI进展缓慢质疑 内部组建AKI团队瞄准ChatGPT 同时推进端侧小模型B计划[36] - 2024年7月开源DCLM-7B模型性能逼近Mistral-7B和Llama3 显示小模型技术积累[37] - WWDC 2024宣布Apple Intelligence由多个高度优化的AI小模型组成矩阵处理日常任务[37] 商业逻辑与竞争优势 - 端侧AI战略基于用户体验/软硬件生态/用户隐私三大基石 符合品牌承诺[39][44] - 本地设备处理避免敏感数据上传 与百度合作因隐私政策分歧受阻[42][44] - 利用A系列/M系列芯片边际性能 实现最经济可持续的商业模式[46][48] 行业趋势 - 英伟达认为小模型是Agent未来 初创公司通过小模型切入医疗/金融等垂直领域[48] - 行业对小模型兴趣升温 但苹果将其提升到生死存亡战略高度[49][51]