TX81芯片

搜索文档
聚焦“新算力”,清微智能新架构助力AI科技“换道超车”
经济网· 2025-09-18 09:15
清微智能首款"新算力"芯片"TX81"推出仅短短半年,即实现了在全国多地落地千卡智算中心,累计订 单超过20000枚。但一条全新的路,要面临的困难和风险可以想象,没有成熟方案可以借鉴,几乎每一 行代码都要编写。 近年来,各级投资机构也越加清晰地看到了新算力的价值,大基金投资、国开基金纷纷入场投资。从市 场风向来看,ChatGPT宣布转向数据流架构,DeepSeek3.1宣布支持包括清微智能在内的下一代国产芯 片,都是算力产业实现自主可控的关键信号。 作为全球"新算力"浪潮的参与者,清微智能的先发优势和战略定力让它开了一个好头,实现新技术规模 化落地离不开充足的研发时间、技术迭代、资本注入及政策扶持。AI下半场,数据流架构推动的"国产 新算力"也需要行业和用户给予机遇和耐心。 目光回到我国,清微智能是一家源于清华大学、具有近20年技术积累的科技企业,在全球领先完成数据 流可重构芯片技术的工程化和量产落地。清微创始人、董事长兼CEO王博认为,芯片技术发展有一 个"类摩尔定律",即芯片架构20年一迭代。他表示,上世纪60-70年代是以CPU为主流,进入80年代, 随着技术发展有了FPGA去解决通信的问题,进入新世纪 ...
英伟达学徒遍地,他偏要另起炉灶
虎嗅APP· 2025-08-15 13:56
核心观点 - 可重构芯片技术正在挑战英伟达主导的GPU架构,成为AI算力芯片领域的潜在颠覆者 [5][6][20] - 清微智能通过动态配置计算单元的可重构架构,实现比传统GPU更高的灵活性和能效比 [6][7][24] - 公司采取"5倍性价比"战略,通过架构创新和3D存储技术突破英伟达生态壁垒 [18][19][31] 技术架构 - 可重构芯片采用无指令配置+数据流驱动范式,区别于GPU的指令驱动+共享存储模式 [7] - 动态重构能力使计算单元连接可像铁路道岔般切换,单次重构仅需十几纳秒 [23][24] - 架构天然适配3D堆叠技术,计算单元与存储的立体布局突破传统二维平面限制 [31] 商业化路径 - 从边缘端芯片切入,2022年推出云端TX8系列,半年内实现20000枚订单 [15] - TX81芯片支持千卡直连,单服务器算力达4 PFLOPS,节省交换机成本 [17][30] - 初期在消费电子领域试错后,聚焦AI算力占比超50%的高价值场景 [14][15] 竞争策略 - 通过三层兼容方案(CUDA API/Triton编译器/RISC-V指令集)降低用户迁移成本 [32][33] - 4000卡规模下无需交换机+HBM存储,采用DDR方案降低30%硬件成本 [30] - 下一代产品将3D存储能效提升5倍,预计2025年下半年交付 [19][31] 行业趋势 - 谷歌TPU/Groq/SambaNova等企业已形成GPU之外的"第二阵营" [20][34] - 2017-2025年全球可重构芯片市场规模年复合增长率预计达67% [20][25] - 摩尔定律放缓背景下,新架构芯片在AI算力需求驱动下加速渗透 [10][26]
英伟达学徒遍地,他偏要另起炉灶
虎嗅· 2025-08-15 09:21
公司技术路线 - 采用可重构芯片架构 与英伟达GPU的指令驱动+共享存储范式不同 属于无指令配置+数据流驱动架构 [2][3] - 通过动态配置计算单元实现多功能任务转换 类比铁路道岔切换机制 [2] - 脱离传统冯诺依曼架构 计算过程无需取指译码 直接通过通信接口实现芯片间数据传输 [3][5] 产品发展历程 - 2018年成立公司 2019年推出首枚量产可重构芯片(智能手机语音唤醒芯片) [6][9] - 2022年初立项云端TX8系列芯片 2023年底首枚AI算力芯片TX81开始批量出货 [11] - TX81芯片累计订单超20000枚 半年内实现全国多地千卡智算中心落地 [11] 性能与成本优势 - TX81芯片打造的REX1032服务器单机算力达4 PFLOPS 支持万亿参数大模型部署 [14] - 千卡直接互联无需交换机 采用DDR存储替代昂贵HBM存储 [14][25] - 下一代产品将应用3D存储技术 预计2026年下半年交付 [15][27] 市场竞争策略 - 要求产品具备5倍性价比优势(性能更优+成本更低)以应对生态劣势 [14][24] - 通过三层兼容方案对接生态:CUDA API兼容/Triton编译器兼容/RISC-V指令集兼容 [28][29] - 与谷歌TPU/Groq/SambaNova等同属可重构数据流新架构阵营 形成第二技术阵营 [16][30] 技术差异化 - 动态可重构特性:程序运行中每十几纳秒重构一次计算单元连接方式 [19][20] - 与FPGA重构门电路不同 重点重构计算单元之间的连接通路 [19] - 3D存储技术与可重构架构具备天然适配性 突破传统二维平面布局限制 [26]
这颗芯片点亮那一晚,中国工程师集体泪崩!
新浪财经· 2025-06-23 15:28
行业趋势与技术创新 - 摩尔定律面临物理极限,传统芯片算力增长难以满足AI爆炸式需求,架构创新成为破局关键[5] - 动态可重构芯片(RPU)通过无指令集直接计算和动态匹配计算单元实现高能效、高并发、高扩展性、高性价比四大优势[7][8] - 中国算力芯片采取"高阶国产替代"路径,从底层原创突破技术壁垒,类比电动车产业换道超车模式[9][14] 公司技术与产品 - TX81芯片采用800平方毫米极限尺寸裸片,结合C2C网格直连技术消除数据中转,提升算力利用率[35][36] - 全球首款规模化量产的可重构云端算力芯片,2025年已部署多个千卡集群算力中心[51] - 第二代TX82芯片研发中,计划2026年流片,持续强化自主可控技术路线[53] 创业历程与团队 - 创始人王博基于清华大学THINKER芯片技术,2018年联合尹首一教授创立清微智能,转型学术成果产业化[17][18][22] - 初创团队仅20余人,蜗居30平米办公室,自建研发流程与质量标准,完成全原创代码开发[29][32] - 核心成员包括华为、阿里背景的技术专家,攻克时钟器件定制等关键难题,承受千万美元级流片风险[39][40][41] 市场竞争与战略定位 - 避开GPU主导的存量市场,以可重构架构开辟AI算力新赛道,打破海外技术生态壁垒[28][49] - 与清华系企业智谱形成"AI原创双子星"协同,覆盖芯片与大模型软硬件全栈技术[53] - 复制中国电动车产业逆袭路径,通过原创技术+产业链整合实现高阶国产替代[12][14] 技术突破里程碑 - 首次流片遭遇电源匹配故障,经通宵调试后成功点亮芯片,标志架构可行性验证[42][43][44] - 独创3D存储堆叠等技术组合拳,解决多卡互联编程难题,释放澎湃算力[14][36] - 六年研发周期远超传统芯片12-18个月迭代节奏,体现原创技术攻坚难度[41][51]