解耦的分布式AI计算架构
搜索文档
融资超5亿!梁军领航昉擎科技,以解耦架构开辟AI算力新赛道
机器人圈· 2025-12-17 09:19
公司融资与背景 - 上海昉擎科技近期连续完成多轮融资,累计融资金额超5亿元人民币 [2] - Pre-A轮由某互联网大厂领投,芯联资本、恒生电子产业基金(翌马资本)、广发信德、某头部VC机构跟投,老股东临港科创投、三七互娱持续超额加注;天使+++轮由达武创投独家投资 [2] - 所筹资金将全部用于核心技术研发、产品化落地及生态与市场拓展 [2] - 公司成立于2022年底,注册于上海自贸区临港片区 [2] - 2024年8月,行业顶尖技术领军者梁军正式加入并出任CEO [2] 核心团队与技术领导力 - CEO梁军拥有长达二十年的行业积淀,曾在华为海思任职17年,担任麒麟SoC芯片首席架构师,一手打造全球首款集成NPU的手机SoC麒麟970 [2] - 梁军于2017年加入寒武纪后,以CTO身份主导公司早期技术规划与产品研发,见证其从独角兽成长为科创板上市公司的完整周期 [2] - 梁军是中国芯片领域少有的兼具顶级通用SoC与高性能AI芯片操盘经验的架构师 [2] 核心技术架构与创新 - 公司核心聚焦解耦的分布式AI计算架构 [2] - 提出了颠覆性的技术方向:“上下文相关”与“上下文无关”解耦的分布式计算架构 [3] - 该架构将传统Transformer中串联的前馈神经网络(FNN)与注意力机制(Attention)解耦为独立模块,分配给最适配的硬件架构进行分布式处理 [3] - 该创新从根源上解决了传统架构的效率浪费问题 [3] - 当前芯片设计的第一优先级应从追求单一芯片的性能与集成度,转向优先构建可扩展的系统设计 [3] 技术架构解决的问题与市场机会 - 创新架构精准切中了当下AI算力市场的痛点 [3] - 随着大模型从云端训练向业务推理和端侧应用渗透,推理侧算力需求爆发式增长 [3] - 市场对多样化、低成本、低延迟、高稳定的模型部署需求日益迫切 [3] - 传统Transformer架构中,Attention与FNN绑定运行,导致简单逻辑推理时需携带沉重记忆模块,处理超长文本时又面临内存吞吐拥堵,严重影响计算效率 [4] - 昉擎的解耦架构通过系统层面的重构,实现了多维度扩展,不仅能提升计算效率,还能降低芯片与开发成本 [4] - 该架构可开拓出新的系统形态,例如让智能眼镜、耳机等边缘设备摆脱手机SoC的附属地位,成为对等的计算节点 [4] 技术路线选择与行业观点 - 对于GPGPU路线,梁军认为其面向高并发、高吞吐设计,追求低延迟需付出更高成本,且国内企业在供应链与制程管制下面临更大挑战 [4] - 以兼容CUDA为目标的研发模式虽简化了管理,却也限定了产品上限 [4] - 昉擎选择的分离式架构路线,聚焦于更高层面的计算架构与编程模型,原生支持异构计算,可基于现有系统构建,具备良好的兼容性 [4] - 该路线并非对现有系统的替代,而是通过组件解耦加速创新,创造新市场 [4] 资本方观点与股东阵容 - 资本方对昉擎的技术创新与团队实力高度认可 [5] - 芯联资本创始人合伙人袁锋表示,昉擎核心团队主导过国内多款主流AI芯片从设计到量产的全流程,其创新架构有望突破计算效率瓶颈,推动国产AI基础设施迭代 [5] - 广发信德投资人看好团队在大芯片领域的深厚积淀与差异化竞争力,认为其有望成长为AI算力领域的重要一极 [5] - 恒生电子产业基金(翌马资本)指出,昉擎的创新架构能解决传统算力在高并发场景下的效率损耗,为金融行业智能化转型提供新路径 [5] - 公司在短短半年内完成三轮融资,集结了包括互联网大厂、硬件巨头、车企、国资及头部VC在内的豪华股东阵容 [5] - 历史投资人涵盖小米战投、蔚来资本、明势创投、华业天成等知名机构 [5] 公司愿景与行业展望 - 梁军表示,创业公司无历史包袱、决策高效,且必须以创新产品立足,这种环境更适合实现昉擎的发展目标 [5] - 梁军希望昉擎能成为一家在底层科技上持续原创、兼具技术品味与市场成功的超级产品公司 [5] - 2025年被视为AI应用爆发的关键之年,国产大模型浪潮与巨头千亿级AI基建投入催生了强烈的算力需求 [6] - 资本逻辑也从寻找英伟达“平替”转向挖掘突破架构瓶颈的“新物种” [6] - 昉擎科技凭借其解耦式架构的创新突破、顶尖的技术团队与雄厚的资本支持,正有望重塑AI算力格局,在分布式计算新赛道上引领国产AI基础设施的迭代升级 [6]