端侧AI

搜索文档
苹果端侧AI两连发,模型体积减半、首字延迟降85倍,iPhone离线秒用
36氪· 2025-09-08 02:42
核心观点 - 苹果发布两条多模态主线FastVLM和MobileCLIP2 主打快速响应和轻量化部署 模型和Demo已全面开放 支持Safari网页直接体验 实现大模型在手机端的高效运行 [1] 技术特性 - FastVLM采用自研FastViTHD编码器 通过动态缩放和混合设计处理高分辨率图像 首字延迟仅为竞品LLaVA-OneVision-0.5B的1/85 [2][4] - FastVLM在0.5B/1.5B/7B参数规模下均保持低延迟和高精度 在7项视觉语言任务中准确率与竞品相当但延迟显著更低 [6] - MobileCLIP2通过多模态蒸馏和数据增强技术 在ImageNet-1k上零样本精度与SigLIP-SO400M/14相当但参数量减半 iPhone 12 ProMax延迟比DFN ViT-L/14低2.5倍 [9][14] 应用场景 - FastVLM支持实时字幕生成 在无障碍场景中实现盲文输入与屏幕阅读器同步 [21][23] - MobileCLIP2支持离线图像检索和描述 无需云端算力 保障数据安全且响应即时 [14][17] - 两者组合可覆盖实时字幕 相机翻译 相册语义搜索等场景 通过Core ML+Swift Transformers工具链集成至iOS/macOS应用 [17][19][24] 开发者支持 - 提供Hugging Face模型卡和WebGPU Demo Safari授权摄像头即可体验实时功能 [8][15][17] - 配套Core ML工具链和WWDC文档 支持调用GPU与神经引擎 优化性能与能耗 [19][24] - 兼容性存在部分限制 WebGPU在不同浏览器和机型表现不一致 端侧模型需权衡算力与续航 [24]
政策加持、巨头引领、发布会催化临近,全面看好端侧AI | 投研报告
中国能源网· 2025-09-08 01:34
AI数据中心散热技术升级 - NVIDIA GB200服务器2025年大规模出货推动液冷技术规模化应用 渗透率预计超30% [1][7] - AI芯片功耗持续提升推动液对液(L2L)架构2027年起逐步取代当前主流L2A技术 成为AI机房主流散热方案 [1][7] - 液冷技术升级带动冷却模块 热交换系统及周边零部件需求增长 [1][7] 端侧AI发展机遇 - 苹果推进三年计划整合谷歌Gemini AI升级Siri 开发"世界知识问答"新系统及机械臂 安防摄像头 对话式桌面机器人 [2][4][5] - 苹果官宣9月10日发布会推出iPhone17系列等多款新品 配备高刷屏 均热板散热 八倍长焦等升级 [2][4][5] - 谷歌发布自研Tensor G5芯片(台积电3纳米制程)及Gemini Nano模型 构建端侧AI硬件生态 [2][4] 政策与市场环境支持 - 国务院8月26日印发《关于深入实施"人工智能+"行动的意见》 明确三步走发展目标及6大重点领域部署 [2][3] - 京东平台2025年上半年智能眼镜成交量同比增长超10倍 关键词搜索量增超30倍 均价降至1500元 [2][6] - Meta重组AI团队为四个小组 计划2025年9月推出千元级带屏眼镜Celeste等多款硬件并开放Horizon OS系统 [6] AI模型与技术突破 - DeepSeek推出混合推理模型DeepSeek-V3 1 具备671B参数(激活37B)和128k上下文 支持自主切换思考模式 [7] - 新模型显著提升智能体多步任务和工具调用能力 全面超越前代基准表现 [7] 消费电子产业链关注点 - 面板行业需求企稳 2025年8月电视 显示器及笔电面板价格整体持平 65吋电视面板均价173美元 [8] - 研究报告列出超50家产业链公司 覆盖零组件组装 材料 连接器 被动元件 面板 PCB及自动化设备等领域 [8]
中金:维持联想集团跑赢行业评级 升目标价至14.8港元
新浪财经· 2025-09-08 01:33
核心观点 - 中金维持联想集团跑赢行业评级 基于软硬件创新技术和AI端侧布局 上修目标价10.4%至14.8港元 对应34.6%上行空间 [1] - 联想通过"一体多端"战略深化AI智能设备布局 硬件创新包括卷轴屏和透明屏产品 软件层面强化本地大模型能力 [2] - 全球化产能布局提供应对关税等宏观不确定性的保障 [2][5] 财务与估值 - 当前股价对应2026/27财年10.4倍/8.9倍市盈率 基于FY2026年14.0倍P/E上修目标价 [1] - 基于non-HKFRS净利润口径维持盈利预测 [1] AI PC业务进展 - 2Q25全球PC出货量同比增长6.5% 联想增速15.2%跑赢行业 市占率达24.6% [3] - 2Q25联想中国市场AI PC占笔记本总出货量27% [3] - 端侧模型预计按每半年一代节奏迭代升级 [3] 智能手机业务表现 - 2Q25手机营收同比增长14% 连续第八个季度增速跑赢市场 [3] - Moto Razr折叠机和Edge等高端系列机型在海外市场实现有效突破 [3] 多端协同生态建设 - "天禧"个人超级智能体WAU平均值达40% [4] - 持续升级跨设备无缝体验 包括SmartConnect超级互联能力 [4] - 重点创新文件互传 APP流转和开放生态等维度 [4] 供应链优势 - 全球供应链位列Gartner 2025年度榜单第八位 [5] - 在11个市场设有超过30个自有或合作制造基地 采用"中国+N"战略布局 [5]
A股三大指数开盘涨跌不一,创业板指涨0.21%
凤凰网财经· 2025-09-08 01:32
市场开盘表现 - 沪指开盘跌0.02% 深成指涨0.33% 创业板指涨0.21% [1] - 电池和航天装备板块涨幅居前 免税和CPO板块跌幅居前 [1] 行业周期与配置 - A股中报业绩延续磨底特征 全局性补库力度回升但板块分化明显 [2] - 先进制造和TMT行业有望延续供需双向改善 基建链收入拐点渐近 [2] - 关注电网设备 工程机械 基础化工 钢铁等新增供需双向改善型行业 [2] - 锂电池 通信设备 小金属 包装印刷因高频景气数据韧性仍存可持续关注 [2] 锂电与储能行业 - 锂电行业旺季来临叠加储能超预期 电芯涨价在即且需求能见度高 [3] - 板块供需关系彻底扭转 业绩确定性强且估值处于低位 [3] - 储能行业受政策推动 国内招标数据高增 海外欧洲澳洲亚洲市场需求旺盛 [3] 端侧AI投资机遇 - 政策加持 巨头引领和发布会催化临近 全面看好端侧AI [4] - 苹果端侧AI产品创新决心强 可能超预期拉动使用体验和销量 [4] - 建议关注苹果产业链相关投资机会 [4]
天风证券:政策加持、巨头引领、发布会催化临近,全面看好端侧AI
新浪财经· 2025-09-08 00:08
行业前景 - 看好政策加持、巨头引领、发布会催化临近背景下的端侧AI相关投资机遇 [1] - 苹果近期动态彰显其在端侧AI方面产品创新决心 [1] - 对使用体验及销量的拉动有超预期的可能 [1] 投资建议 - 建议关注苹果产业链 [1]
兆易创新:“存储一哥”下南洋
北京商报· 2025-09-07 15:56
核心观点 - 存储行业呈现复苏态势 公司作为头部企业业绩率先修复 2025年上半年营收41.5亿元同比增长15% 归母净利润5.75亿元同比增长11.31% [1] - 公司通过全球化布局和全产品线优势巩固市场地位 是全球唯一在集成电路设计四大核心领域均跻身全球前十的企业 其中NOR Flash全球第二 MCU全球第八 [1] - 海外收入占比持续保持高位 2024年达77.51% 2025年上半年境外收入28.85亿元占比69.51% 车规级产品全球累计出货量破亿颗 [3] - 公司积极应对行业周期性波动 通过供应链布局和产品结构优化提升稳定性 但存储业务仍面临价格下行和外部环境风险 [9][10][11] 财务表现 - 2025年上半年营收41.5亿元同比增长15% 归母净利润5.75亿元同比增长11.31% [1] - 2022-2024年营收从81.3亿元降至57.61亿元后回升至73.56亿元 归母净利润从20.53亿元骤降至1.61亿元后反弹至11.03亿元 [10] - 存储芯片2024年营收51.94亿元占比70.6% MCU业务占比23% 两大业务共同支撑超90%收入来源 [6][10] - 专用存储芯片销量从2022年22.6亿颗增至2024年35.53亿颗 但平均售价从2.14元持续降至1.46元 [10] - MCU产品2024年销量4.1亿颗 平均售价从2022年8.22元降至4.13元 毛利率跌至36.7% [10] 业务优势 - NOR Flash全球排名第二 中国内地第一 SLC NAND Flash全球第六中国内地第一 利基型DRAM全球第七中国内地第二 MCU全球第八中国内地第一 [1] - 全球排名第一的无晶圆厂Flash供应商 车规级产品全球累计出货量2023年破亿颗 获海外主流车厂及Tier1供应商认可 [1][3] - 消费电子领域切入三星、华为、小米供应链 NOR Flash在TWS耳机市场2021年销量翻番市占率全球第三 [6] - 汽车电子领域成为国内第一32位Arm通用型MCU供应商 进入吉利汽车、比亚迪海豹供应链 车规NOR Flash前两年保持高两位数甚至100%以上增长 [6] - 工业控制领域覆盖工商业储能、光伏逆变器等应用 产品注重稳定性和长期供货能力 [7] 战略布局 - 销售网络覆盖亚洲、欧洲与北美三大洲 包括中国多个城市及韩国、日本、新加坡、英国、德国、美国等地 [3] - 2025年6月启动H股上市计划 同期启用新加坡国际总部 作为"全球化2.0阶段重要落子" [4] - 通过投资长鑫科技布局供应链产能 2024年3月增资15亿元持股约1.88% 2024年采购及代工关联交易达10.18亿元 [7] - 抓住三星、美光、SK海力士等海外大厂收缩利基型存储产能的市场机遇 聚焦DDR5、HBM等高端品类腾出的市场空间 [8] 行业环境 - DRAM业务受益于三大原厂加速退出利基市场 实现产品量价齐升 [1] - 消费电子、汽车电子需求回暖带动NOR Flash、MCU业务同比增长 [1] - 东南亚成为全球存储产业转移关键枢纽 具备人口红利、产业链集聚和关税优惠优势 但需应对本地化配套不足和地缘政治挑战 [4] - 2022-2023年全球半导体行业下行调整 2023年集成电路市场规模同比萎缩 利基型DRAM、NOR Flash价格持续低位运行 [9]
泰凌微拟收购上海磐启微 强化物联网芯片全场景布局
巨潮资讯· 2025-09-06 03:10
收购战略与协同效应 - 公司拟收购上海磐启微电子以实现低功耗无线物联网芯片领域的深度协同 构建覆盖近场与远场的超低功耗全场景物联网无线连接平台[1] - 收购将实现产品品类 客户资源 技术积累及供应链等多方面互补 融合上海磐启微在超低功耗 高射频灵敏度等射频技术[1] - 上海磐启微的Sub-1G及5G-A无源蜂窝物联网技术与公司现有技术路线高度互补 有助于快速拓展工业与消费类市场应用场景[1] 财务表现与经营数据 - 上海磐启微2023年销售额约1.2亿元 亏损4000余万元 2024年销售额升至1.3亿元 亏损减少至3000多万元 2025年上半年销售额超7500万元 亏损大幅降低至200余万元[2] - 公司2025年上半年营业收入5.03亿元 同比增长37.72% 归属于母公司股东的净利润1.01亿元 同比大幅增长274.58%[2] - 公司毛利率提升至50.61% 净利率达20.08% 主要因高毛利产品占比提高 产品结构优化和规模效应显现[2] 产品与技术布局 - 上海磐启微主要产品包括低功耗蓝牙类芯片和低功耗广域网产品 具备超低功耗 优良射频性能 远距离传输和高抗干扰特性[1] - 公司多模产品与音频产品增速显著 低功耗蓝牙产品线实现较大增长 端侧AI芯片已进入规模量产 2025年第二季度销售额达千万元级别[2][3] - 公司音频芯片全面支持BLE Audio协议和经典蓝牙音频 自主研发的2.4G音频技术可实现超低延迟传输[3] 市场拓展与战略前景 - 收购完成后公司将实现物联网室内外 短距长距 多协议的全场景覆盖 无需从零研发射频核心技术[2] - 上海磐启微客户覆盖电力 表计 工业控制 安防消防 智能家居等高价值领域 整合后有望实现消费级与工业级市场双向渗透[2] - 收购将加速公司全球化布局 进一步提高海外业务占比 综合技术实力与市场竞争力有望迈上新台阶[2][4]
端侧AI如何破解智能座舱的三大难题?| 创新场景
钛媒体APP· 2025-09-05 13:27
核心观点 - 面壁智能推出全球首个纯端侧智能助手cpmGO 通过端侧部署实现高准确性 低延迟和快速开发 在车载场景中解决云端模型的关键限制 并已与多家车企合作实现商业化落地[4][5][6] 准确性与专业性 - 端侧多模态交互动作执行准确率达91% 意图完成率89% 参数识别准确率97% 确保用户指令精准执行[4] - 专业场景关怀功能包括识别儿童安全座椅卡扣状态 误操作率低至1.3% 并能感知疲劳驾驶状态和前方障碍物[4] - 健康类信息在车内场景容错率几乎为零 需避免误导性建议和安全法律责任[1] 响应速度与算力 - 所有语音 视觉和车控推理在车规级SoC本地完成 实现毫秒级实时响应 数据100%不离车[4] - 弱网或断网环境下仍能稳定运行 支持行车记录仪拍照和播放预存视频等操作[4] - 车载算力 功耗和散热受限 需在准确性与性能间权衡 端侧推理是趋势但面临网络和成本挑战[2] 开发与商业化 - 从技术突破到长安马自达MAZDA EZ-60量产仅用10个月 较行业平均周期缩短40% 2025年4月实现全球首秀[5][6] - 提供货架级原子产品适配 包括泛化语音车控 GUI Agent和智能哨兵等功能 支持车企个性化选配共创[6] - AI特性导致测试 验证和上线复杂 汽车行业需满足功能安全和合规要求 研究性模型需成熟化流程工具链[3] 行业合作与落地 - 与长安汽车 上汽大众 长城汽车等顶级车企完成多款车型定点[5] - 与高通 英特尔 联发科技 梧桐车联 德赛西威 中科创达和安波福等企业深度合作[5] - 端侧大模型在汽车座舱领域商业化落地迈入新阶段 推动端侧原生智能座舱广泛落地[5]
0.3B,谷歌开源新模型,手机断网也能跑,0.2GB内存就够用
36氪· 2025-09-05 07:14
产品发布与核心特性 - 谷歌开源全新开放式嵌入模型EmbeddingGemma 拥有3.08亿个参数 专为端侧AI设计 支持在笔记本和手机等设备上部署检索增强生成(RAG)和语义搜索应用 [2] - 模型能生成隐私性良好的高质量嵌入向量 断网情况下可正常运行 性能接近尺寸翻倍的Qwen-Embedding-0.6B模型 [2] - 基于Gemma 3架构打造 针对100多种语言训练 量化后内存占用低于200MB [3] 技术性能与基准测试 - 在MTEB基准测试中 成为500MB以下开放式多语言文本嵌入模型中排名最高的模型 [3] - 在多项测试中全面超越同尺寸gte-multilingual-base模型:平均任务得分61.15(vs 58.24) 检索得分62.49(vs 56.50) 分类得分60.90(vs 57.17) 聚类得分51.17(vs 44.33) [10][11] - 性能接近595M参数的Qwen-Embedding-0.6B模型 后者平均任务得分64.34 检索得分64.65 分类得分66.83 聚类得分52.33 [10][11] 架构设计与优化技术 - 采用Matryoshka表征学习技术 支持输出768维、512维、256维和128维等多种嵌入尺寸 平衡质量与效率 [12] - 通过量化感知训练将RAM使用量降至200MB以下 在EdgeTPU上实现256个输入token的推理时间小于15毫秒 [12] - 模型参数包含约100M模型参数和200M嵌入参数 总参数量308M [12] 应用场景与集成生态 - 支持端侧RAG应用 能理解语言细微差别 提升检索相关文档的准确性 避免生成不准确答案 [6][8][9] - 与主流工具深度集成 包括sentence-transformers、llama.cpp、MLX、Ollama、LangChain等开发框架 [5] - 支持离线隐私保护应用:本地文件搜索、离线聊天机器人、移动智能体函数调用分类等 [13] 行业影响与发展前景 - 模型小巧高效 提供可自定义输出尺寸和2K令牌上下文窗口 为移动RAG管道和语义搜索解锁新用例 [5] - 标志着谷歌在小型化、多语言和端侧AI领域取得新突破 推动端侧智能普及 [15]
联想@IFA 2025:不止PC,端侧AI全面开花!
格隆汇· 2025-09-05 06:38
核心观点 - 联想在2025创新世界大会上推出全新AI产品组合 涵盖概念设备 高性能PC 智能平板 游戏设备和摩托罗拉智能手机 加速生成式AI和混合AI融入工作 创作和娱乐场景 [1] - 公司通过自适应形态产品 AI工作站 游戏掌机 创作者平板和moto ai智能手机展现科技价值 强调端侧AI已实现高度个性化 生产力提升 创意激发和数据保护 [1] - 联想致力于让更智能的AI技术为所有人享用和赋能 [1] 概念设备创新 - ThinkBook VertiFlex概念机为业内首款配备14英寸可旋转屏幕的笔记本电脑 厚度17.9毫米 重量1.39公斤 支持水平和垂直双模式切换 [3] - 垂直显示模式优化分屏多任务 代码显示和文档查看场景 并通过联想超级互联实现智能手机无缝连接 用于文件传输和手机镜像 [3] - 联想灵动AI底座为业界首款智能多向笔记本电脑支架概念产品 集成摄像头 麦克风和扬声器 提供自动面部跟踪 语音控制和健康功能 [5] - AI戒指配件支持手势控制支架旋转 [5] 商用解决方案 - 联想扩展AI商用工作站产品线 包括重新设计的ThinkPad P16和更新的ThinkPad P1 P16v P16s i及P14s i [7] - 移动工作站支持高性能配置选择 覆盖各级别AI开发和高性能创意工作需求 [7] - 推出月光白ThinkPad X9 Aura AI元启版 14英寸和15英寸型号限量供应 [9] - ThinkVision P40WD-40显示器为39.7英寸曲面超宽屏 分辨率5120x2160 支持Thunderbolt 4一线连接坞站 采用节能设计 [9] - 全新ThinkPad智能扩展坞系列增强显示体验 含Thunderbolt 5的7500扩展坞 支持高速性能 云端设备管理和多达四个高刷新率显示器 [9] - ThinkBook Magic Bay HUD以Tiko Pro概念亮相 即将在部分市场上市 [9] - 通过AI Fast Start服务计划结合英特尔AI Assistant Builder 试点开发设备端AI助手 帮助出版 医疗与金融等行业客户快速部署隐私优先的定制化AI解决方案 [11] 游戏设备升级 - Legion Go第二代掌上游戏机基于Windows 11系统 保留原有DNA并结合用户反馈优化 支持全面定制化体验 [12][14] - 新款Legion Go配备8.8英寸WUXGA 144Hz可变刷新率OLED显示屏 支持HDR TrueBlack 1000认证 [16] - 搭载AMD Ryzen Z2 Extreme处理器 最高32GB 8000MHz内存 2TB PCIe第4代存储 支持额外2TB microSD扩展 [16] - 电池容量升级至74Whr 比上一代高出50%以上 [16] - 同步发布Legion Pro 7第10代(16英寸) LOQ Tower 26ADR10 以及三款Legion Pro OLED游戏显示器(32UD-10 27UD-10和27Q-10) 结合高刷新率和PureSight视觉体验 [16] - 第二代拯救者AR智能眼镜提供免费3D模式软件更新 为部分Legion Go和笔记本电脑用户在超过20款游戏中解锁沉浸式体验 [16] 创作与平板产品 - 自研AI应用FlickLift"闪应"支持在当前应用中直接使用AI能力 实现去除背景 图片高清和分辨率放大等优化 并可插入Office文档 无需切换窗口 [16] - 应用预装在Yoga 部分Ideapad和Legion机型上 提供本地安全的高效创作体验 [16] - 新款Yoga Tab搭载3.2K PureSight Pro显示屏 具备混合AI能力 支持联想Tab Pen Pro手写笔 实现"涂鸦生图"等高级功能 [18] - Idea Tab Plus超轻薄设计 集成智能笔记 即圈即搜和大模型集成等AI工具 [18] 移动设备组合 - 摩托罗拉推出多价位段智能手机新品 包括edge 60 neo moto g06和moto g06 power [19] - edge 60 neo主打moto ai端侧AI套件 增强摄影 生产力和日常易用性 配备索尼LYTIA传感器和专用长焦镜头的三摄像头系统 [19] - moto g06和g06 power均配备6.88英寸显示屏 AI驱动的5000万像素摄像头系统 杜比全景声音频和即圈即搜功能 [19] - moto g06 power搭载7000mAh电池 支持2.5天不间断使用 两款型号均支持通过RAM Boost扩展至最高12GB内存和256GB存储 [19]