Workflow
可重构芯片
icon
搜索文档
废墟中救出“婴儿”、看一下可完成支付、人造太阳......在2025外滩大会看到未来生活
证券时报网· 2025-09-10 10:10
救援机器人技术 - 机器狗通过多模态传感器扫描生命信号并清除石块 成功完成仿真婴儿救援任务 被救援队视为未来超级队友[1] 外滩大会科技展览 - 展会设置10000平方米科技展览和5000平方米科技集市 展示机器人做菜 看一下支付和人造太阳等未来生活场景[3] - 合肥星能玄光科技展示场反位型可控核聚变模型 该技术被视为人类终极能源 可为数据中心 AI算力平台和工业领域提供清洁能源[3] - 公司2024年成立 技术班底来自中科大 实验室已运行12年 目前正在进行pre-A轮融资[3] 核聚变技术路线 - 星能玄光采用场反位型技术路线 北美已有公司采用相同路线并宣布2028年向微软交付聚变电站[5] - 公司目标是在国内推广该路线并尽快实现商业化[5] 可重构计算芯片 - 清微智能展示国产原创可重构计算芯片 该技术架构不同于GPU 可面向智算中心 大模型和自动驾驶等场景提供算力支持[5] - 可重构芯片可实时调整电路结构和功能 适应不同计算需求 被称为芯片界变形金刚[5] - 公司已成功量产面向云计算场景的AI高算力芯片 累计订单超过20000枚[7] AI健康管理应用 - 智能体在健康管理领域大幅提升效率 毛洪亮医生智能体上线半年已服务超490万人次失眠患者 而医生本人一年最多看1万名病人[7] 智能翻译眼镜 - 亮亮视野翻译眼镜可翻译100多种语言包括方言 国内市场预计下月上市价格约4000元 韩国市场10月同步销售[7] - 眼镜续航6-8小时 眼镜盒充电仓可充12次 满足一周出国需求无需外接电源[7] - 此前在韩国中文发布会当天即预订10000台[7] 智能支付眼镜 - 智能眼镜已应用于支付领域 通过说出支付指令和确认支付即可完成付款 无需使用手机[8] - 支付宝已联合Rokid 小米 雷鸟和魅族等厂商上线"看一下支付"功能[8] 具身智能机器人 - 灵波科技R1机器人具备多模态识别能力 可自动识别食材和厨具 实现从取菜到清洁的全流程自动化烹饪[8]
清微智能亮相2025中国算力大会
证券日报之声· 2025-08-28 12:44
行业活动与趋势 - 2025中国算力大会在山西大同举办 主题为"算网筑基 智引未来" 由工业和信息化部主办 系中国规格最高算力大会 [1] - 大会汇聚国内三大运营商 华为 联想等行业巨头 各方专家学者企业高层齐聚 共同推进算力基础设施建设与产业科技创新能力 [1] 公司技术展示与合作 - 清微智能作为可重构计算芯片领军企业受邀参展 发表以可重构技术为主旨的演讲 [1] - 公司与中贝通信联合展台展示可重构芯片 推理服务器实物及C2C算力网格技术 产品解决方案具备"不依赖先进制程却能实现高性能"特点 [1] - 公司选择非GPU赛道 旨在让国产算力实现从落后到追赶再到超越的可能性 [1] - 可重构芯片已应用于国内多个省市智算中心项目 支撑政务云 工业互联网等多领域高算力需求 [2] - 中贝通信正将可重构计算技术融入算力网络建设 推动"芯片—服务器—算力集群"全链条国产化进程 [2] 项目进展与产业转化 - 清微智能与合作伙伴协同推进 在山西省同步规划两个"可重构智算中心" 加速前沿技术转化为实际产业动能 [2]
英伟达学徒遍地,他偏要另起炉灶
虎嗅APP· 2025-08-15 13:56
核心观点 - 可重构芯片技术正在挑战英伟达主导的GPU架构,成为AI算力芯片领域的潜在颠覆者 [5][6][20] - 清微智能通过动态配置计算单元的可重构架构,实现比传统GPU更高的灵活性和能效比 [6][7][24] - 公司采取"5倍性价比"战略,通过架构创新和3D存储技术突破英伟达生态壁垒 [18][19][31] 技术架构 - 可重构芯片采用无指令配置+数据流驱动范式,区别于GPU的指令驱动+共享存储模式 [7] - 动态重构能力使计算单元连接可像铁路道岔般切换,单次重构仅需十几纳秒 [23][24] - 架构天然适配3D堆叠技术,计算单元与存储的立体布局突破传统二维平面限制 [31] 商业化路径 - 从边缘端芯片切入,2022年推出云端TX8系列,半年内实现20000枚订单 [15] - TX81芯片支持千卡直连,单服务器算力达4 PFLOPS,节省交换机成本 [17][30] - 初期在消费电子领域试错后,聚焦AI算力占比超50%的高价值场景 [14][15] 竞争策略 - 通过三层兼容方案(CUDA API/Triton编译器/RISC-V指令集)降低用户迁移成本 [32][33] - 4000卡规模下无需交换机+HBM存储,采用DDR方案降低30%硬件成本 [30] - 下一代产品将3D存储能效提升5倍,预计2025年下半年交付 [19][31] 行业趋势 - 谷歌TPU/Groq/SambaNova等企业已形成GPU之外的"第二阵营" [20][34] - 2017-2025年全球可重构芯片市场规模年复合增长率预计达67% [20][25] - 摩尔定律放缓背景下,新架构芯片在AI算力需求驱动下加速渗透 [10][26]
英伟达学徒遍地,他偏要另起炉灶
虎嗅· 2025-08-15 09:21
公司技术路线 - 采用可重构芯片架构 与英伟达GPU的指令驱动+共享存储范式不同 属于无指令配置+数据流驱动架构 [2][3] - 通过动态配置计算单元实现多功能任务转换 类比铁路道岔切换机制 [2] - 脱离传统冯诺依曼架构 计算过程无需取指译码 直接通过通信接口实现芯片间数据传输 [3][5] 产品发展历程 - 2018年成立公司 2019年推出首枚量产可重构芯片(智能手机语音唤醒芯片) [6][9] - 2022年初立项云端TX8系列芯片 2023年底首枚AI算力芯片TX81开始批量出货 [11] - TX81芯片累计订单超20000枚 半年内实现全国多地千卡智算中心落地 [11] 性能与成本优势 - TX81芯片打造的REX1032服务器单机算力达4 PFLOPS 支持万亿参数大模型部署 [14] - 千卡直接互联无需交换机 采用DDR存储替代昂贵HBM存储 [14][25] - 下一代产品将应用3D存储技术 预计2026年下半年交付 [15][27] 市场竞争策略 - 要求产品具备5倍性价比优势(性能更优+成本更低)以应对生态劣势 [14][24] - 通过三层兼容方案对接生态:CUDA API兼容/Triton编译器兼容/RISC-V指令集兼容 [28][29] - 与谷歌TPU/Groq/SambaNova等同属可重构数据流新架构阵营 形成第二技术阵营 [16][30] 技术差异化 - 动态可重构特性:程序运行中每十几纳秒重构一次计算单元连接方式 [19][20] - 与FPGA重构门电路不同 重点重构计算单元之间的连接通路 [19] - 3D存储技术与可重构架构具备天然适配性 突破传统二维平面布局限制 [26]
从智谱华章到清微智能:清华“双子星”的高阶国产替代之路
环球网资讯· 2025-06-04 08:10
行业背景与趋势 - 全球AI产业在2025年因DeepSeek的出现而加速发展 算力和大模型被视为产业核心底座[1] - AI算力和大模型领域出现"百模大战"和"千芯大战" 同质化竞争使新兴产业成为红海[1] - 国务院在2017年将可重构类脑计算芯片列为新一代人工智能关键共性技术体系重点突破方向[2] - 2025年4月中共中央政治局会议强调需集中力量攻克高端芯片等核心技术 构建自主可控的人工智能基础软硬件系统[5] - 摩尔定律逐步逼近物理极限 算力需求对芯片底层提出严峻挑战 可重构芯片价值进一步凸显[7] 公司技术与产品 - 清微智能是国内AI领域唯一采用新一代可重构芯片架构实现高阶国产替代的企业[3] - 可重构芯片具有高能效比 高扩展性和高度灵活性 可纳秒级快速调整电路结构和功能适应不同计算需求[2] - 公司2019年完成全球第一颗可重构商用芯片的大规模量产 2024年发布采用可重构3.0架构的云端大算力芯片[4] - 芯片累计出货量突破2000万颗 算力卡订单累计近2万张 新一代服务器训练性能可与国外行业标杆产品并肩[6] - 公司拥有近200项相关专利 是国家集成电路产业投资基金投资的唯一新型架构算力芯片企业[4][6] 公司发展与商业化 - 清微智能2018年成立 核心团队源自清华大学集成电路学院可重构计算实验室[3][4] - 清华可重构计算实验室近20年潜心钻研 申请三百余项专利和论文 获国家技术发明二等奖及专利金奖[4] - 公司半年时间在国内多个省份落地千卡智算中心 商业化成功使其能持续押注尖端研发[1][6] - 同属清华系的智谱华章2025年4月启动上市 估值超200亿 成为国内最高估值创业大模型公司[1][4] 战略定位与行业影响 - 高阶国产替代被视为中国在人工智能领域实现换道超车的必由之路[2] - 可重构芯片技术有望帮助中国芯片技术摆脱跟随模仿实现跨越[2] - 公司通过原创架构有效规避技术依赖风险 在AI算力国产化从政策驱动转向技术驱动的2025年开辟新征途[6] - 可重构芯片成为国家算力主权博弈中的关键筹码 可能开启中国AI芯片的黄金时代[7]
架构革命与生态竞合:可重构芯片全球产业化演进
半导体行业观察· 2025-03-31 01:43
可重构芯片技术概述 - 可重构芯片(RPU)凭借高能耗利用率、灵活性和可扩展性成为突破摩尔定律限制的关键路径,在人工智能、边缘计算、数据中心等领域潜力显著 [2] - 核心技术原理为动态配置硬件资源,实现算法与硬件协同优化 [2] 国外产业化进展 - **赛灵思**:2018年推出Versal系列ACAP FPGA产品,集成CGRA可重构计算IP,DSP处理能力革命性提升,主要应用于数据中心和高端智能驾驶,兼具高性能与低功耗特性 [4] - **三星电子**:将可重构加速器集成至8K电视和Exynos SoC,实现视频解码和AI图像增强动态优化,覆盖消费电子、通信设备、汽车电子等领域 [5] - **Intel**:2022年启动Xeon处理器集成可重构计算单元项目,数据中心能效比提升,单位算力功耗降低40% [5] - **PACT公司**:DRP和DAPDNA处理器应用于卫星载荷和军事通信系统,DAPDNA-2芯片实现16Gbps吞吐率,重构时间缩短至毫秒级 [5] - **SambaNova**:SN40L芯片系统支持5万亿参数模型训练,8芯片配置推理性能为英伟达H100的3.1倍,总拥有成本仅1/10,提供全栈解决方案 [6] 国内产业化进展 - **清微智能**: - 技术优势:数据流驱动架构消除指令开销,80%硬件资源集中于核心运算,云端TX8系列能效比达传统GPU的3倍,支持4000卡无交换机直连扩展;边缘端TX5系列支持AI-ISP和Transformer优化,夜间场景算力分配效率提升,目标识别精度保持98.5%以上 [8] - 商业进展:2024年累计出货量突破2000万颗,客户包括阿里、中国移动、国家电网等,TX8部署于智算中心,TX5应用于安防、能源、工农业检测 [9] - 生态建设:提供全栈式加速工具和统一开发接口,推动可重构计算技术标准化 [9] 产业化趋势与挑战 - **技术演进**:数据流架构成为主流,清微智能TX8与SambaNova RDU采用Mesh网络实现算力线性扩展,突破存储墙限制 [10] - **生态建设**:行业从封闭转向开放模式,但编译工具碎片化问题突出,缺乏统一编程范式 [12] - **应用拓展**:边缘端(如海康威视安防设备)实现3倍能效提升;云端(如阿贡国家实验室)性能超越传统GPU [13] 未来展望 - 需构建开放编程标准、开发混合粒度架构、推动与存算一体/Chiplet等技术融合,突破生态壁垒实现算力跨越 [13]
一文读懂,可重构芯片为何是AI的完美搭档
半导体行业观察· 2025-03-24 01:23
AI算法演进与芯片设计挑战 - AI算法从早期简单机器学习发展到复杂深度学习和Transformer模型,应用场景从边缘端(如智能安防、家居)扩展到云端(如数据中心分析、语音交互)[1] - 边缘端需高能效处理实时图像识别等任务,云端需大算力支持海量数据处理,AI芯片性能直接决定应用效果[1] - 传统固定架构芯片难以满足AI算法多样化需求,存在硬件性能瓶颈[1] 神经网络模型特征 - **拓扑结构复杂性**:从简单卷积层发展到ResNet残差连接、注意力机制等动态结构,特斯拉2023年展示的神经网络模拟人脑连接[2] - **多维稀疏性**:从一维权重稀疏性(剪枝)发展到输入/权重/输出的三维稀疏性,跳过0值计算可减少30%-50%无效操作[3][6] - **动态精度需求**:推理阶段从统一INT8量化发展为分层/元素级混合精度;训练阶段FP32/FP16向FP8混合精度过渡,NVIDIA H100 GPU采用FP8+FP16混合加速Transformer训练[5] 硬件重构技术优势 - **对比软件编程**:硬件重构可动态适应不同拓扑/稀疏性/精度,处理稀疏矩阵时效率提升50%以上,而软件编程难以优化0值计算[8][11] - **芯片级重构**:通过BENES网络处理稀疏性,清微智能TX5-TX8系列硬件利用率提升50%+,乱序计算减少内存访问[9] - **PEA级重构**:整体重构支持顺序执行,交错重构支持多任务并行,硬件利用率达80%(GPU仅50%)[10][12] - **PE级重构**:位串行(低功耗)、位融合(高速度)、浮点融合(混合精度训练)等技术针对不同场景优化,如边缘端采用位串行,云端使用位融合[12] 可重构芯片应用前景 - 三级重构(芯片/阵列/PE)综合解决"存储墙"问题,提升能效和面积利用率,清微智能TX8系列实现中间数据直接传递,减少访存能耗[13][14] - 行业应用覆盖智能安防、机器人、智算中心及大模型市场,清微智能已量产TX5/TX8系列十余款芯片,斯坦福背景的SambaNova Systems成为2023年AI芯片估值最高独角兽[15]