异构计算
搜索文档
从芯片到超节点 国产算力合纵连横大时代开启
21世纪经济报道· 2025-08-27 12:33
国产算力生态协同发展 - 国产算力产业链通过芯片、服务器、智算集群的产业聚合寻求高效解法,大模型厂商和平台型厂商加速应用落地 [1] - 产业链从芯片架构创新、超节点高速互联到系统级能效重构形成高度耦合的生态格局,实现算力自主的体系性跃迁 [2] - 产业链拉通需底层芯片、软件生态、服务器整机、智算环节协同,开源开放成为破局关键路径 [3] 技术路线与生态建设 - DeepSeek应用UE8M0 FP8路线提升计算效率并减少存储传输开销,为国产芯片厂商指明趋势方向 [4] - 芯片厂商同时重视DeepSeek精益求精路线和OpenAI"大力出奇迹"路线,需提升基础设施能力以吸引生态开发 [4] - OISA 2.0协议支持AI芯片数量提升至1024张,带宽突破TB/s级别,互联时延缩短至数百纳秒 [5] - 中国移动推出全调度以太网(GSE)技术体系,支持千卡级组网能力,推进技术规范和大容量交换芯片发布 [6] - 服务器厂商与国产GPU芯片厂商深度合作进行软硬件适配,共同完善国产算力生态 [7] 异构计算与平台化解决方案 - 高性能计算与智算融合需解决硬件架构差异,联想通过"一横五纵"战略构建覆盖通用、科学、AI算力的异构智算平台 [8] - 智算中心建设需推进全流程标准体系、核心技术自主创新、政产学研协同生态及重点领域专项行动 [9] - 一体机通过"通用基座+垂直增强"模式实现行业适配,需结合具体业务场景进行模型调优和性能测试 [9] - 同泰怡构建覆盖轻量化至满血版大模型的全栈解决方案,在教育、能源、电网、政务、医疗等行业实现落地 [10] 液冷技术发展与能效优化 - 冷板式液冷改造速度快,浸没式液冷技术复杂度高,液冷部署受供电、散热、承重、运维条件限制 [11] - 液冷技术降低PUE值并提升算力密度,长周期TCO优势显著,芯片结温可降低15°C至25°C [11][12] - 冷板式液冷与风冷系统高度兼容,改造难度低周期短成本可控,联想开发双循环浸没式液冷技术实现PUE值1.035 [12][13] - 联想推动低成本冷板方案实现风液同价,研发相变冷板应对更高功耗芯片散热需求 [12]
全志科技上半年净利润同比增长35.36% 多领域智能化布局成效显著
巨潮资讯· 2025-08-21 12:33
财务业绩 - 2025年上半年营业收入13.37亿元,同比增长25.82% [1] - 归属于上市公司股东的净利润1.61亿元,同比增长35.36% [1] 增长驱动因素 - 市场需求回暖及扫地机器人、智能汽车电子、智能视觉等领域产品落地推动收入增长 [1] - 通过A527、A537、A733等量产平台优化系统调度算法提升产品竞争力 [1] 技术研发进展 - 启动下一代高性能SoC架构研发应对复杂计算需求 [2] - 在AI算法领域围绕视觉、语音、人机交互等场景强化软硬件协同创新 [2] - 基于NPU算力开发AI ISP智能成像、AI夜景人像等平板领域AI技术 [2] 产品应用拓展 - 智能视觉应用新增AI人车宠监测、婴儿看护等自研算法包 [2] - V821芯片适配低内存人形识别模型支撑安防产品 [2] - AI眼镜和玩具领域适配视频防抖算法及多语言大模型API [2] 产品线布局 - 智能平板领域形成A333/A133/A523/A537/A733全系列产品矩阵 [3] - A733平台通过Google Android16 GMS Express认证 [3] - 机器人领域MR536实现扫地机量产,MR153送样集成四核ARM+RISC-V处理器 [3] - 智慧视觉领域V861具备6M30高清处理与1T NPU算力,形成V821/V831/V851/V861序列 [3] - 解码显示领域H723试产、H135量产、TV323完成验证 [3] 战略发展方向 - 通过技术迭代在智能终端、机器视觉、车载电子等赛道实现突破 [4] - 依托AI与异构计算需求增长巩固全面智能化市场地位 [4]
麻省理工大学:《通往通用人工智能之路》的研究报告
欧米伽未来研究所2025· 2025-08-15 06:45
通用人工智能(AGI)发展现状 - AGI定义为实现经济价值领域超越人类的全自主系统 但专家认为需涵盖更广的智能维度如适应性重组能力[4] - 当前AI在专业领域(药物发现 代码编写)表现优异 但解决基础谜题能力远逊人类 显示认知鸿沟[2] - 最先进大型语言模型在ARC-AGI-2基准测试得分为0% 而人类接近满分 凸显适应性缺陷[4] AGI实现时间表加速 - GPT出现前AGI预测需80年 GPT-3发布后缩短至50年 2024年底预测进一步骤降至5年[3] - 行业领袖预测: Anthropic联合创始人认为"强大AI"可能2026年出现 具备跨界面自主推理能力[3] - 综合预测显示50%概率2028年前实现多项AGI里程碑 2047年机器全面超越人类概率达50%[4] 技术瓶颈与突破路径 - 计算能力需求: AGI可能需要超10^16 teraflops 2037年计算成本或超美国GDP[5] - 深度学习时代计算量翻倍时间从21个月缩短至5.7个月 需转向高效异构计算架构[5][6] - 硬件创新需结合CPU/GPU/NPU/TPU 配套软件工具实现跨平台代码运行[7] - 根本性障碍在于智能定义本身 需突破概率图谱技术基础 寻求类似Transformer的架构革命[7][8] 智能本质的重新定义 - 需建立超越人类成就的新框架 纳入流体智能/社交智能/具身智能等维度[8] - 智能被重新定义为"有效重组已知事物解决新问题的能力" 当前AI缺乏此核心特质[4] - 视觉感知/精细运动/创造力/情感互动等8项人类能力仍是AI显著短板[5] 行业生态发展趋势 - OpenAI CEO认为AGI将引发堪比电力/互联网的社会变革 创造超指数级社会经济价值[3] - 实现路径需硬件/软件/算法/定义的四重革命 形成统一生态系统[8][9] - 麦肯锡数据显示当前AI在色彩一致性/上下文理解/同理心等方面存在明显不足[5]
云工场与香农芯创订立合资协议
智通财经· 2025-08-12 13:39
合资公司成立 - 云工场与香农芯创于2025年8月12日订立合资协议 成立注册资本为人民币1.2亿元的合资公司以开拓智算服务市场 [1] - 云工场出资人民币9000万元(持股75%) 香农芯创出资人民币3000万元(持股25%) 合资公司作为云工场附属公司并入集团综合财务报表 [1] 战略协同与业务拓展 - 智算业务与公司现有业务形成协同效应 满足现有客户对计算资源及处理能力稳定增长的需求 [1] - 公司凭借技术专长、分布式运算投入、成熟供应链及自主研发资源调度平台 具备提供智算服务的能力 [1] - 合资整合云工场技术优势与香农芯创行业协调能力 提升智算领域整体竞争优势 [1] 具体战略举措 - 强化技术升级:通过合资公司获取先进计算芯片 丰富异构计算资源池 [1] - 加速业务拓展:为各类客户建立智算中心 提升无锡及长三角地区计算资源可用性 符合当地政策方向 [1] - 深化生态合作:通过与政府及行业主要参与者合作 接触大型国际本地企业 利用其技术资源优化边缘多模态大模型推理框架 [1] - 抢占先发优势:巩固在边缘计算、人工智能及异构计算领域领先地位 吸引互联网企业及金融能源行业客户 通过多元化设备建立竞争壁垒 [1]
云工场(02512)与香农芯创订立合资协议
智通财经网· 2025-08-12 13:29
合资公司成立 - 云工场与香农芯创成立合资公司,注册资本为人民币1.2亿元,云工场出资9000万元占比75%,香农芯创出资3000万元占比25% [1] - 合资公司将作为云工场附属公司入账,财务业绩并入集团综合财务报表 [1] - 合资公司旨在开拓智算服务市场,整合双方技术知识、行业协调能力和业务网络 [1] 业务协同与战略意义 - 智算业务与公司现有业务相辅相成,可产生协同效应,现有客户对计算资源和处理能力需求稳定增长 [1] - 公司凭借技术专长、分布式运算投入、成熟供应链和自主研发资源调度平台,具备提供智算服务能力 [1] - 合资公司将强化技术升级,获取先进计算芯片,丰富异构计算资源池 [1] 市场拓展计划 - 合资公司将加速智算业务拓展,包括为各类客户建立智算中心,提升无锡及长三角地区计算资源可用性 [1] - 公司可通过合资公司深化与当地政府及行业主要参与者合作,接触大型国际及本地企业客户 [1] - 合资公司将帮助公司抢占智算行业先发优势,巩固在边缘计算、人工智能及异构计算领域的领先地位 [1] 技术发展机遇 - 合资公司将使公司更容易获取大型企业的国际国内技术资源,优化边缘多模态大模型推理框架 [1] - 通过合资公司网络可获取多元化先进智算设备,建立市场竞争壁垒,提升品牌知名度 [1] - 合资公司将吸引尖端互联网企业及金融、能源等行业客户 [1]
云工场(02512.HK)拟成立合资以开拓智算服务市场
格隆汇· 2025-08-12 13:17
合资公司成立 - 云工场与香农芯创于2025年8月12日订立合资协议 成立注册资本为人民币120百万元的合资公司以开拓智算服务市场 [1] - 云工场出资人民币90百万元持有合资公司75%权益 香农芯创出资人民币30百万元持有25%权益 合资公司作为附属公司并入集团综合财务报表 [1] 战略协同效应 - 整合云工场智算技术知识及香农芯创行业协调能力 提升智算领域整体竞争优势 [1] - 合资公司提供先进计算芯片获取渠道 丰富异构计算资源池 [1] - 通过合资公司拓展智算中心建设业务 提升无锡及长三角地区计算资源可用性 符合当地政府政策方向 [2] 生态合作与业务发展 - 通过合资公司与当地政府及行业主要参与者合作 接触对智算服务有需求的大型国际及本地企业 [2] - 利用大型企业的国际国内技术资源 加速优化边缘多模态大模型推理框架 [2] - 吸引尖端互联网企业及金融能源行业客户 获取多元化智算设备建立市场竞争壁垒 [2] 市场地位提升 - 合资公司加速进军智算行业 巩固在边缘计算、人工智能及异构计算领域的领先地位 [2] - 积极参与政府政策倡议 强化作为智算行业区域关键参与者的地位 [2]
PCIe,狂飙20年
半导体行业观察· 2025-08-10 01:52
PCIe技术发展历程 - PCIe 8.0标准发布,数据传输速率达256GT/s,实现带宽翻倍,成为技术发展里程碑[1] - PCIe技术用20余年重构计算机数据传输格局,从串行总线革命到每秒256GT速度突破[1] - PCIe最初由Intel在2001年提出,旨在替代旧的PCI、PCI-X和AGP总线标准[3] - PCIe通过串行总线架构实现对传统PCI并行总线的全面革新[9] - PCIe技术历经8代迭代,从1.0的2.5GT/s到8.0的256GT/s,每代实现速率翻倍[13][43] PCIe核心技术特性 - 串行通信机制:以串行传输替代并行架构,减少信号干扰,提升传输效率[11] - 点对点连接设计:每个外设通过独立链路直接对接根复合体,消除总线竞争瓶颈[11] - 可扩展带宽能力:支持通过通道数量线性扩展带宽,匹配不同设备需求[11] - 采用PAM4调制技术替代传统NRZ编码,实现带宽翻倍[23] - 引入流量控制单元(FLIT)编码,提升传输效率[27] PCIe各代技术演进 - PCIe 1.0:2003年推出,单通道2.5GT/s,带宽250MB/s[14] - PCIe 2.0:2007年发布,速率翻倍至5GT/s,带宽500MB/s[15][17] - PCIe 3.0:2010年发布,速率8GT/s,带宽约1GB/s[17][18] - PCIe 4.0:2017年问世,速率16GT/s,带宽约2GB/s[19] - PCIe 5.0:2019年发布,速率32GT/s,带宽约4GB/s[22] - PCIe 6.0:2022年发布,速率64GT/s,带宽8GB/s[23] - PCIe 7.0:2024年公布,速率128GT/s,带宽16GB/s[27][31] - PCIe 8.0:2025年开发中,速率256GT/s,带宽32GB/s[38][42] PCIe市场应用 - 云计算领域占据最大份额(超过50%),主导数据中心和服务器应用[46] - 汽车行业采用率自2020年起稳步上升,满足AI和ADAS需求[46] - 移动设备市场份额稳定在10%-20%,用于智能设备和高效互联[46] - 消费类电子市场份额逐步扩大,应用于家庭设备和个人电脑[46] - 工业领域采用率缓慢增长,重要性随工业自动化和IoT发展日益凸显[46] PCIe技术挑战与竞争 - 面临NVLink、Infinity Fabric等专用互联技术的挑战[55] - UALink联盟成立,开发开放行业标准应对AI数据中心需求[56] - CXL协议推出,实现与PCIe兼容的同时满足异构计算需求[63] - 光互连技术有望突破电信号传输物理瓶颈[37][71] - 速率持续翻倍面临信号质量、走线设计和封装材料等挑战[43]
人工智能引领 生态优势显著 海光信息上半年业绩高增长
上海证券报· 2025-08-05 18:16
核心观点 - 海光信息2025年上半年实现营业收入54.64亿元,同比增长45.21%,净利润12.01亿元,同比增长40.78% [1] - 业绩高增长主要受益于人工智能引领和生态优势,高端处理器产品在产业生态中的版图不断扩张 [1][2] - "CPU+AI加速处理器"的异构计算新范式正重塑算力格局,公司独特优势将充分受益于国产AI集群时代全面开启 [3][5] - 公司具有兼容x86和CUDA的显著生态优势,CPU兼容x86指令集,DCU具有"类CUDA"计算环境 [6] - 2025年上半年研发投入17.11亿元,同比增长24.68%,占营收31.31%,累计取得多项知识产权 [8] - 公司正推进吸收合并中科曙光,旨在实现芯片与整机领域的优势互补和深度融合 [8][9][10] 财务表现 - 2025年上半年营业收入54.64亿元,同比增长45.21% [1] - 归属于上市公司股东的净利润12.01亿元,同比增长40.78% [1] - 一季度营收和净利润分别同比增长50.76%和75.33% [1] - 研发投入17.11亿元,同比增长24.68%,占营收31.31% [8] 产品与技术优势 - 主要产品包括高端通用处理器(CPU)和协处理器(DCU) [2] - CPU支持数据中心、云计算等高端服务器及政务、企业等中低端服务器 [2] - DCU实现"训推一体"AI场景全覆盖,适配不同API接口和编译器 [2] - CPU兼容x86指令集,能兼容数百万款基于x86的软件 [6] - DCU采用通用并行计算架构,适配国际主流商业计算和AI软件 [6] - 构建覆盖固件层到应用层的全栈安全防护,实现数据全生命周期隔离保护 [6] 市场与生态布局 - 高端处理器涉及的行业应用及新兴AI大模型产业逐渐增多 [1] - 联合国内主流服务器厂商打造万余项产品和联合解决方案 [7] - CPU已应用于电信、金融、互联网、教育、交通等行业 [7] - DCU主要面向大数据处理、商业计算等计算密集型领域 [7] - AI算力正迈入"系统级融合"时代,注重万卡级训练集群等全面能力 [5] 研发与知识产权 - 2025年上半年研发投入17.11亿元,同比增长24.68% [8] - 累计取得发明专利923项、实用新型专利118项、外观设计专利3项 [8] - 累计取得集成电路布图设计登记证书309项、软件著作权338项 [8] - 累计申请知识产权项目3011项 [8] 战略发展 - 推进吸收合并中科曙光,构建从芯片设计到算力服务的全栈能力 [8][9][10] - 交易旨在实现芯片与整机领域的优势互补和深度融合 [9] - 通过产业链垂直整合提升与国际龙头企业的竞争能力 [10]
AI芯片需求推动,联发科Q2营收1504亿新台币创新高,但汇率拖累净利润同比增长放缓至8.1% | 财报见闻
华尔街见闻· 2025-07-30 12:11
财务业绩摘要 - 第二季度营业收入为新台币150,369百万元,环比下降1.9%,同比增长18.1% [1][2][5] - 营业利润为新台币29,379百万元,环比下降2.2%,同比增长17.7% [1][5] - 本期净利为新台币28,064百万元,环比下降5.0%,同比增长8.1% [1][2] - 每股收益为新台币17.50元 [1][5] 营收增长驱动因素 - 同比增长主要受益于市场对边缘AI芯片和更高速网络芯片需求的提升 [1][2] - 环比下降主要归因于不利的汇率因素,平均汇率从第一季度的32.88降至30.88 [1][2] 盈利能力与成本 - 毛利率为49.1%,环比提升1个百分点,同比提升0.3个百分点,创近期新高 [2][5] - 营业毛利为新台币73,878百万元,环比增长0.1%,同比增长18.9% [1] - 毛利率提升包含1.9个百分点的一次性项目正面影响 [2] 费用结构 - 研究发展费用为新台币36,923百万元,占营收比重高达24.6%,同比增长19.7% [1][2] - 推销费用为新台币4,944百万元,同比增长45%,占营收比重从去年同期的2.7%提升至3.3% [1][3] - 管理费用为新台币2,632百万元 [1] 营运资金管理 - 应收账款周转天数从第一季度的37日延长至45日,同比也从36日延迟 [2] - 存货周转天数为66日,环比略增,但同比从72日明显缩短 [2] - 营业活动现金流大幅回升至新台币456亿元,远超前季的134亿元 [2] 财务状况 - 公司拥有新台币1,967亿元现金及流动金融资产,占总资产29.4% [3] 战略合作与行业动态 - 英伟达正与公司联合开发高性能APU(加速处理单元),计划最快于2026年初推向市场 [4][6] - 该合作将与戴尔旗下电竞品牌Alienware合作推出新机,旨在打破AMD在APU领域的垄断地位 [4] - 合作的APU将采用英伟达Blackwell架构GPU模块,并整合公司定制的Arm架构CPU核心,预计整体能效比提升约30% [6]
当前处理器架构,还有哪些提升机会?
半导体行业观察· 2025-07-20 04:06
处理器架构效率提升的挑战与机遇 核心观点 - 处理器设计从单纯追求性能转向性能与功耗平衡 性能的小幅提升若导致功耗不成比例增加 设计人员可能放弃改进转而采用更具能效的方案[3] - 当前架构在性能和功耗方面的持续改进变得越来越困难 行业正在通过微架构重新设计、工艺改进、3D-IC等技术寻求突破[3][4] - 架构层面的优化比实现层面更具潜力 但需权衡面积、功耗与性能的关系[6][8] 工艺与封装技术 - 工艺改进仍是降低功耗的首要方法 22纳米比28纳米能耗特性更好 12纳米是高效设计的流行节点[3] - 3D-IC的功耗介于单片芯片和PCB级组件之间 比传统多芯片方案功耗更低、速度更高[4] - 共封装光学器件(CPO)降低功耗的技术经济性正在改善 因高速数字通信需求增强[4] 架构优化技术 - 推测执行(分支预测)和乱序执行可提升性能但增加复杂度 分支预测性能提升可达30% 总开销在20%-30%之间[7][8] - 并行化是提高性能的关键机会 但受限于阿姆达尔定律和编程复杂性 数据中心服务器处理器核心数达约100个[9][10] - "杀戮法则"指出 若新增功能增加的面积大于性能提升 则不应添加该功能[8] 加速器与异构计算 - 定制NPU比通用NPU效率更高 Expedera数据显示定制NPU使处理器效率(TOPS/W)提升3-4倍 利用率提升2倍以上[14][15] - 加速器作为非阻塞卸载可有效处理特定任务 同时让CPU执行其他工作或休眠[12][14] - 异构计算结合处理核心和NPU 针对AI处理的优化可避免低效的CPU和GPU运算[14] 技术局限性 - 异步设计因性能不可预测和触发器复杂度高 未能成为主流设计方法[5] - 数据和时钟门控可抑制杂散功耗 但实现层面的节能机会有限[5][6] - 多核处理器商业失败主因是开发者拒绝显式并行编程 GPU/TPU是少数成功渗透的领域[11] 未来方向 - 大量简单CPU组成的阵列可能是可行之路 但需AI创建并行编译器来改变编程方法[12] - 新处理器架构可能成为最终解决方案 但受限于现有生态系统的转换难度[16]