Workflow
晶圆级芯片技术
icon
搜索文档
寒武纪股价“过山车”之际,有一家国产芯片企业正被人民日报点赞
是说芯语· 2025-09-06 04:58
寒武纪股价波动与AI芯片行业动态 - 寒武纪股价从历史高点1595.88元累计回撤超20%,单日蒸发市值逾700亿元 [1] - 英伟达H100/H200芯片库存充足,但专供中国市场的H20芯片因安全争议上半年出货量未达预期 [1] - 中国芯片产业面临效率墙、互联墙、存储墙三重技术挑战,本土企业通过原创架构创新寻找突破 [1] 可重构计算架构技术优势 - 可重构AI芯片RPU采用数据流架构,通过动态配置计算单元适配多种AI任务(如语音识别、图像分析) [2] - 该架构在算力效率、可扩展性、并发能力及性价比方面显著优于GPU,被国际半导体技术路线图列为未来最具前景的芯片架构技术 [2] - 可重构芯片被视为继CPU、FPGA和GPU后的第四类通用计算芯片,与AI并行计算需求高度契合 [2][3] 可重构芯片的商业化进展 - 清微智能云端算力芯片TX81在1000P算力规模下比GPU集群具更强互联性与能效优势,已落地多个千卡智算中心 [4] - 清微算力卡订单累计近20000张,市场反响热烈 [4] - 全球数据流派蓬勃发展:OpenAI租用谷歌TPU芯片,SambaNova成为AI芯片独角兽,Groq的LPU推理速度较英伟达GPU提高10倍且成本仅十分之一 [4] AI算力行业技术挑战与突破 - 大模型参数量激增导致算力需求指数级增长,摩尔定律逼近物理极限 [5] - 晶圆级芯片技术被视为打破空间约束的关键路径,可重构架构的C2C算力网格技术实现多芯片点对点直连,规避传统交换机带宽瓶颈与延迟 [6] - GPU受原始架构限制,在晶圆级集成中仍需依赖外部交换机,性能提升存在天花板 [6] 中国芯片产业战略布局 - 清微智能以可重构AI芯片RPU探索差异化路线,被《人民日报》点赞为清华AI双子星企业 [1][6] - 中国需在国际主流GPU派与数据流派两大技术路径上同时布局,实现算力产业自主可控 [6] - 技术发展需合纵连横,新兴流派(如谷歌TPU、清微RPU)有望推动全球AI产业可持续发展 [6]
清华大学研究团队在晶圆级芯片领域取得重要进展
半导体行业观察· 2025-07-20 04:06
晶圆级芯片技术突破 - 清华大学团队在晶圆级芯片领域取得三项关键研究成果,涵盖计算架构、集成架构和编译映射优化方法学,构建了完整的设计体系[1] - 团队联合产业界成功研制国内首台基于可重构AI芯粒的12寸晶圆级芯片验证样机,验证了技术可行性[1] - 晶圆级芯片采用整片晶圆(约40000平方毫米)制造超大芯片,通过高密度硅互连基板集成数十颗算力芯粒[4][8] 技术优势与性能表现 - 晶圆级芯片单机柜算力密度可达现有超节点方案的2倍以上,是目前算力节点集成密度最高的形态[8] - 计算架构优化方案在主流大模型训练中相比特斯拉Dojo实现2.39倍吞吐提升[13] - 集成架构设计方法使系统算力提升2.90倍,通信带宽提升2.11倍,内存带宽提升11.23倍[18] - 编译映射方案在大模型推理任务中相比GPU集群实现平均3.12倍性能提升[20] 国际发展现状 - 特斯拉Dojo晶圆级芯片集成25颗D1芯粒,单芯片拥有9PFlops算力和36TB/s带宽[24] - Cerebras WSE-3采用5nm制程集成4万亿晶体管,片上性能指标远超传统GPU[24] - 台积电推进晶圆级系统(SoW)技术布局,预计2027年实现量产[25] 技术特点与创新 - 提出"Tick-Tock"协同设计框架,实现物理拓扑与逻辑拓扑的优化耦合[12][16] - 建立纵向面积约束引导的跨物理层协同优化方法,解决异构资源集成难题[15][21] - 针对大模型推理设计分离式映射调度方法,优化KV cache管理策略[19][22] - 晶圆级芯片本质是"片上数据中心",涉及计算、存储、互连等多因素高度耦合[8]