谷歌开源全栈平台Coral NPU,能让大模型在手表上全天候运行
机器之心·2025-10-16 04:51

产品定位与核心目标 - 谷歌推出Coral NPU,定位为全栈开源AI平台,旨在解决边缘AI面临的性能、碎片化和隐私三大核心挑战[4] - 该产品专为低功耗边缘设备和可穿戴设备设计,目标是在智能手表等设备上实现本地持续运行的AI,将智能嵌入用户个人环境[4] - 核心目标是支持下一代超低功耗、始终在线的边缘AI应用,尤其侧重于环境感知系统,在可穿戴设备、手机和物联网设备上实现全天候AI体验同时最大限度减少电池消耗[30] 技术架构与性能指标 - Coral NPU采用神经处理单元架构,为高能效、针对机器学习优化的片上系统提供构建模块,其基础设计在仅消耗几毫瓦功率的情况下可提供512 GOPS级别的性能[8][9] - 架构基于一套符合RISC-V指令集架构的IP模块,包含标量核心、向量执行单元和矩阵执行单元三个组件,其中矩阵执行单元仍在开发中将于今年晚些时候发布[9][22] - 该架构是简单可用C语言编程的目标平台,可与IREE和TFLM等现代编译器无缝集成,支持TensorFlow、JAX和PyTorch等机器学习框架[21] 生态系统构建与合作 - 谷歌宣布与Synaptics建立合作关系,Synaptics成为其第一个战略芯片合作伙伴,其新Astra SL2610系列AI原生物联网处理器采用了Torq NPU子系统,是业界首个Coral NPU架构的量产实现[35] - 谷歌正与Gemma团队紧密合作,针对小型Transformer模型优化Coral NPU,以确保该加速器架构能够支持下一代边缘生成式AI[33] - 公司旨在通过提供通用、开源、安全的平台催生充满活力的生态系统,为个人AI未来构建基础层[37] 应用场景与潜在用例 - 潜在应用场景包括情境感知如检测用户活动、距离或环境以启用免打扰模式,音频处理如语音检测、实时翻译,图像处理如人物检测、手势识别,以及通过传感器驱动的用户交互[34] - 该架构能高效加速当今设备端视觉和音频应用中领先的基于编码器的架构,并支持将大语言模型引入可穿戴设备[27][33] - 通过硬件强制安全性建立用户信任,架构设计支持CHERI等新兴技术提供细粒度内存级安全和可扩展软件分区,将敏感AI模型和个人数据隔离在硬件强制沙箱中[32]