Workflow
芯粒技术
icon
搜索文档
突发!美日韩澳新已签署协议建立芯片全产业链联盟,中国如何应对
搜狐财经· 2025-12-20 00:25
美日韩澳等9国签署稀土供应链协议,背后的目的是什么?又释放了怎样的信号?怎么来看我国外交部 的回应? 在稀土关键矿产领域,美国不想当老二,一场全面反华行动已经开始。 12月中旬的华盛顿被一种诡异的兴奋感笼罩。就在12日这天,白宫内举行了一场并不张扬但寒气逼人的 签约仪式。 在这场名为签署《硅和平宣言》的局里,美国不仅拉上了日本、韩国,还将澳大利亚、新加坡、以色列 等国乃至共计九个盟友悉数聚齐。 这看似文雅的拉丁语代号下,实则藏着一张精密编织的巨网——这是一场针对关键矿产、半导体材料以 及AI标准的全链条围堵。 与以往主要盯着EUV光刻机这种大块头设备不同,这次的西方联盟显露出了更加阴狠的战术转向:他 们不再仅仅试图"砸坏炉灶",而是要切断"面粉"的供应,甚至连这一级的基础矿产也要彻底重构。 就在华盛顿的签字笔墨未干之时,大洋彼岸的日本显然早已心领神会。 业界疯传的消息在这个寒冬里变得格外刺骨:日本方面正在悄然收紧光刻胶的出口审批,甚至有传言称 从12月中旬起就要对华全面断供。 虽然官方未正式发文,但具体的动作却很诚实——针对12类半导体核心材料的管制清单已经备好,原本 30天的出口审批流程被生生拖长到了90天 ...
Chiplet黑科技,全球首个货架芯粒市场发布
半导体芯闻· 2025-10-14 10:26
公司核心技术方案 - 推出“功能解耦、灵活集成”的货架芯粒方案,通过通用型HUB Chiplet与功能型Functional Chiplet组合,解决传统ASIC SoC大芯片研发周期长、成本高、风险大的痛点 [3] - 通用型HUB Chiplet搭载12核ARM Cortex A72 CPU,支持PCIe 5.0 8lane、78GB/s DDR带宽及256GB/s D2D高速互联,集成视频/图像处理等核心通用IP [3][19] - 功能型Chiplet覆盖GPU和NPU两大品类,其中GPU芯粒具备1.3TFLOPS@FP32算力与32GPix/s像素填充率,NPU芯粒INT8精度算力达50TOPS,支持多精度运算 [3][19] 芯粒互联与封装技术 - 自主研发PB-Link车规级芯粒接口,遵循国内ACC1.0标准,支持8通道×32Gbps传输带宽,误码率<10⁻¹⁵,适配2D/2.5D封装及不同工艺制程互联 [4][11] - 接口通过-40℃~125℃全温度范围测试与ASIL-D认证,搭配全国产化封装、基板、测试供应链 [4][11] - 多类封装方案已验证成熟,包括1拖6、4拖10、4×2×2等形式,HUB芯粒可灵活级联,实测跑大模型整体效率超90% [5][13] 原型验证平台与成本优势 - 预告全球唯一的HUB+FPGA原型验证平台,集成12核ARM Cortex A72处理器及80TOPS高性能可重构协加速器,预计12月正式推出 [5][14] - 依托货架芯粒的复用性与模块化设计,可将传统芯片研发的NRE费用降至五分之一到十分之一,大幅缩短产品上市周期 [5][19] 行业影响与生态构建 - 芯粒技术成为破解高端芯片发展瓶颈的关键,公司方案以开放架构构建“IC设计商-IP提供商-封装企业”协同生态 [6][18] - IC设计商可直接采购标准化IP裸片,灵活组合成定制化方案,无需重复投入大IP流片 [6][18] - 方案助力企业快速切入AI、汽车电子、工业控制等高端芯片领域 [6]
清华大学集成电路学院副院长唐建石:高算力芯片,如何突破瓶颈?
新浪财经· 2025-10-03 07:16
行业背景与挑战 - 人工智能领域算力需求爆发式增长,AI算力需求每不到六个月便实现翻倍,增速远超摩尔定律驱动的硬件算力提升速度 [2] - 中国智能算力规模2025年已突破数十万亿亿次,国家计算力指数与数字经济、GDP增长紧密相关 [2] - 行业面临双重硬件制约:摩尔定律放缓导致晶体管尺寸微缩难度加大,以及先进光刻机单次曝光尺寸固定为858平方毫米,限制了GPU等单芯片的最大面积 [2][4] - 美国长期主导计算芯片体系,其依赖指令集、工具链、操作系统构成的完整生态支撑 [2] 芯片算力提升路径 - 将芯片算力拆解为三个核心要素:晶体管集成密度 × 芯片面积 × 单个晶体管算力 [4] - 传统提升集成密度路径依赖晶体管尺寸微缩,当前已实现每平方毫米数亿个晶体管的集成,例如英伟达H200 GPU在800平方毫米面积内集成近1000亿个晶体管,但面临功耗、成本与良率挑战 [6] - 未来实现超万亿晶体管集成需依托以芯粒技术为代表的2.5D/3D集成技术,将集成维度从“面密度”拓展至“体密度” [6] 芯粒技术发展 - 芯粒技术是融合架构设计、互联设计、存储封装、电源散热及先进光刻的综合技术体系 [6] - 为推进自主生态建设,牵头组建“中国中关村高性能芯片互联技术联盟”,已制定12项团体标准、牵头编制5项国家标准 [6] - 依托国家重大项目建设“北京芯力技术创新中心”,打造芯粒技术一站式服务平台,目前该平台已完成通线并初步具备小批量量产能力 [6] 晶圆级芯片技术路线 - 国际上存在两类典型晶圆级芯片技术路线:Cerebras WSE采用的曝光厂拼接技术,以及Tesla Dojo采用的完好晶粒结合有机基板重塑晶圆路线 [7] - 学院团队提出“硅基基板 + 完好晶粒”技术路线,经测试能支撑芯片算力达到3-15 PFlops@FP8,性能超过4纳米工艺的英伟达GB200 GPU [7] 存算一体与忆阻器技术 - 忆阻器采用“两电极 + 中间氧化层组变层”结构,通过施加电源脉冲调节电导可实现多比特非易失存储,单个忆阻器可同时承担多比特乘法器、加法器与存储单元的功能 [9] - 相比传统数字电路,忆阻器的能效比CPU、GPU提升一个数量级,且在擦写速度、耐久性、多比特存储能力及成本方面优于闪存、MRAM、PCM等其他非易失存储器 [9] - 忆阻器存算一体技术从器件材料优化、交叉阵列功能演示,发展到2018年后与CMOS电路集成打造原型芯片,呈现指数级发展趋势 [9] 忆阻器工艺突破 - 团队与中芯国际合作研发出覆盖55纳米、40纳米、28纳米、22纳米至12纳米多个节点的忆阻器集成工艺,具备良好的工艺迁移能力 [10] - 忆阻器集成规模达上百兆,良率可达4个9至6个9,实现4比特编程,40纳米、28纳米节点的存储产品已实现一定规模量产,工艺水平进入国际第一梯队 [10][12] 忆阻器核心创新方案 - 为提升计算精度,研发“混合训练架构”,研制出国际首款多阵列忆阻器存算一体系统,成功演示多层卷积神经网络计算,能效达110+ TOPS/W [12] - 为实现片上训练,提出“Stellar片上学习框架”,研制出国际首款全系统集成的支持片上高效学习的忆阻器双算力芯片,在相同任务下能耗比先进工艺数字芯片低1-2个数量级 [12] 产业化进展 - 忆阻器存储技术已相对成熟,台积电也在推进12纳米及更先进节点的忆阻器存储工艺研发 [15] - 团队孵化的企业已实现1-16MB典型规格忆阻器存储产品的量产 [15] - 孵化“北京亿元科技”初创公司,推出面向科研的存算一体硬件平台,并联合咪咕、字节跳动研发存算一体计算加速卡,在内容推荐场景开展探索性应用 [15] 未来发展方向 - 实现高算力芯片突破需依托多层次协同创新:引入存算一体新计算范式,并推动其与进程计算、主流计算架构的融合 [15] - 通过芯粒堆叠、单片三维集成等技术构建异构集成层次化芯片,突破单芯片面积限制 [15] - 团队正关注硅光、光电子融合等技术,计划引入光模块加速数据传输,丰富高效芯片的技术探索路径 [15]
AI时代芯片设计复杂度大幅提升,Arm提出新解题思路
21世纪经济报道· 2025-04-30 08:25
芯片设计挑战与趋势 - 摩尔定律放缓导致高工艺制程芯片设计面临严峻挑战 AI大模型发展使芯片设计难度指数级攀升可能影响AI产业发展进程 [1] - AI工作负载增加使能效跃升为AI计算首要考量因素 芯片设计需整合优化内存结构 先进封装和电源管理技术以降低能耗同时保持高性能 [1] - 半导体缩放传统方法达物理经济极限 产业转向定制芯片 计算子系统(CSS)和芯粒(chiplet)以提升性能与能效 [1] 能效优化路径 - 需从晶体管层与晶圆代工厂合作优化功耗和性能 包括动态功耗和漏电功耗 [2] - 在架构层面对CPU及处理引擎指令集优化 再从SoC设计 封装到数据中心层级优化 关键要降低内存间数据传输耗电 [2] - 软件层实现智能负载均衡 针对AI不同方面处理优化 合理分配工作负载减少节点间数据传输 [2] AI推理与定制芯片 - AI芯片需求重点从训练转向推理 AI推理需要独特技术开发路径 从计算子系统到SoC专用架构设计再到软件体系 [2] - 几乎所有半导体从业者都在探索投资定制芯片 全球四大云服务提供商占2024年全球云服务器采购支出近半数份额 [3] - 定制芯片关键在于确保芯片与软件高度可复用 底层平台需具通用性以实现不同定制芯片间相互复用 应对成本与上市时间挑战 [3] 安全与软件生态 - AI驱动网络攻击带来新挑战 半导体产业构建多层次软硬件防护体系 从嵌入式芯片加密到AI强化安全监测系统 [3] - AI技术能基于网络监测与代码分析 以人类难以企及的速度规模识别可疑行为和潜在漏洞 [3] - 软件生态系统是释放新芯片架构潜力关键 需保障与AI框架无缝兼容并为定制芯片提供优化支持 [4] 芯粒技术与标准化 - 先进封装技术成为推动未来创新关键驱动力 芯粒技术允许通过添加或升级芯粒增加算力性能 提高良率并减少制造浪费 [4] - 芯粒发展需行业紧密合作制定新协作协议 当前技术范式最关键是对芯粒设计与接口方式标准化 [5] - Arm推出芯粒系统架构(CSA)旨在标准化芯粒间及系统内通信 推动AMBA CHI芯片到芯片互连协议确保不同供应商芯粒互操作性 [5] 技术融合与协同 - 海量AI计算需求推动多种技术加速融合 行业转向尺寸更易管控的芯粒技术 将功能模块隔离设计提升整体成本效益 [6] - 复杂SoC可拆分为计算子系统或内存子系统等独立模块 在封装层级集成 [6] - 3D封装等先进范式提升芯粒性能与能效 垂直堆叠晶粒缩短处理单元到内存接口距离 减少数据传输路径降低功耗提高性能 [6] - 先进封装与芯粒技术真正价值在于标准化 企业可快速组合配置芯粒打造不同性能定位芯片 缩短产品上市周期 [7]