Workflow
Mythic APU
icon
搜索文档
比GPU强100倍的芯片,挑战AI芯片霸主
半导体行业观察· 2025-12-18 01:02
公司核心技术与产品 - 公司开发了模拟处理单元(APU),这是一种将计算和内存融合于同一平面的新型芯片架构,旨在解决人工智能的能耗瓶颈 [1] - APU以模拟方式执行AI工作负载中最繁重的矩阵乘法运算,其架构比当今顶级GPU和所有竞争对手的AI ASIC的能效高出100倍 [1][4] - APU在能耗方面是硅芯片中最接近人脑的,一次乘加运算(MAC)仅消耗17飞焦耳的能量,比在现有GPU上执行相同运算的能效高出1000倍 [4] - 公司拥有全球首款量产的模拟计算芯片,其APU架构每瓦特每秒可执行120万亿次运算(TOPS)[1][4] - 公司的“神经元”由高度成熟的硅存储单元构成,迄今为止已出货1500亿个,并采用标准半导体材料在美国及其盟友国家生产 [6] 性能优势与基准测试 - 内部基准测试表明,在运行1T参数大型语言模型(LLM)时,APU的每瓦每秒令牌数(Tokens/s/W)比NVIDIA的高端GPU高出750倍 [5] - 下一代APU展现出巨大的成本优势,与最新的GPU相比,其每百万代币成本最多可降低80倍 [6] - 在1000亿参数LLM模型中,APU每百万代币的成本低至0.5美分,在1T参数模型中每百万代币的成本低至4美分 [6] - APU可以轻松扩展到1T参数模型,且无需像GPU那样通过NVLINK建立高速APU间连接 [5] 市场战略与目标行业 - 公司计划进军四个万亿美元产业:数据中心、汽车、机器人和国防 [5] - 公司的独特战略是成为AI领域每瓦性能的绝对领导者,并实现100%的研发杠杆 [5] - 公司凭借其突破性的节能架构,发明了一种名为Starlight的新型传感设备,该设备功耗低于1瓦,并将图像传感器的性能提升了50倍 [7] - 公司是唯一一家能够将强大而超低功耗的AI引擎集成到传感器中的公司 [7] 融资情况与投资者 - 公司在由DCVC领投的超额认购融资轮中筹集了1.25亿美元 [1] - 投资财团包括NEA、Atreides、Future Ventures、软银韩国(SBVA)、S3 Ventures、Linse Capital等众多机构 [2] - 战略投资者本田汽车和洛克希德·马丁公司也加入了投资行列,这两家公司分别位列各自行业(汽车和国防)的世界前十 [2] - 公司经历了密集的转型期,在新领导层的带领下彻底重建了其架构、路线图、软件和战略 [2] 行业背景与问题阐述 - 预计到本十年末,美国电网十分之一的电力将用于运行由GPU驱动的人工智能工作负载的数据中心 [3] - 传统的冯·诺依曼架构中,内存和计算在物理上分离,导致人工智能领域90%的能源被浪费在数据传输上 [3] - 现有的基于GPU的人工智能加速器试图通过高带宽内存(HBM)来弥补缺陷,但无法阻止当前人工智能系统最终因“能耗墙”而崩溃 [3] 软件生态与开发工具 - 公司的CAMP(内存模拟计算处理)SDK目前已支持在其第一代APU上流畅运行深度神经网络(DNN)应用程序 [8] - SDK原生支持ONNX、PyTorch和TensorFlow,同时还可通过NVIDIA的TensorRT在包括NVIDIA Jetson在内的多个CPU平台上运行 [8] - 一项德国研究报告显示,CAMP在同类内存计算处理器中成熟度最高 [8] - 公司专注于软件开发和SDK成熟度,以有效对抗NVIDIA根深蒂固的CUDA平台 [8] 公司领导与愿景 - 公司由前NVIDIA高管Taner Ozcelik领导,他创立了NVIDIA的汽车业务 [5] - 公司认为能效将决定人工智能计算的未来,其超高能效的APU将成为除GPU之外的首选加速计算机 [5] - 公司的技术路线图实力雄厚,其下一代技术有望使用户无需网络连接即可在口袋里使用ChatGPT3+级别的逻辑层模型,而成本仅为现有解决方案的百分之一左右 [9]