算力生态

搜索文档
中国算力进入拐点
第一财经资讯· 2025-09-29 02:21
英伟达算力预期与生态战略 - 英伟达CEO黄仁勋预测AI推理将迎来十亿倍增长 由AI增强的经济活动将催生每年5万亿美元的AI基础设施资本支出市场[2] - 英伟达与OpenAI达成战略合作 计划建设高达10GW的AI数据中心 相当于部署400万-500万个GPU[2][3] - 合作模式被比喻为"梯云纵" 向OpenAI投资1000亿美元 资金以订单形式回流英伟达 提前锁定利润[2] 全球算力竞争格局 - 算力竞赛进入淘汰赛阶段 需求不断抬高[3] - 大模型迭代加速 新框架与算法多基于英伟达平台开发 生态结构固化将增加后来者兼容成本与技术负担[3] - 甲骨文、英特尔等厂商以订单、资金或股权方式与英伟达结盟 形成美国企业主导的AI新生态[2] 华为算力生态战略 - 华为宣布软件全面开源开放策略 包括开源CANN、Mind系列应用使能套件和openPangu[5] - 未来5年计划每年投入150亿人民币生态发展费用 1500P开源社区算力 15000人进行生态平台开发[5] - 明确变现依靠昇腾硬件 通过开源开放促进硬件规模使用 换取更广阔生态空间[5] 中国算力产业现状 - 从硬件突破向生态构建转型 昇腾处理器在算力密度、能效比等指标具国际竞争力[6] - 寒武纪、海光信息等国产企业在特定领域实现技术突破[6] - 缺乏"中国版CUDA"生态平台 现有CUDA生态将AI应用锁定在英伟达硬件平台[6] 华为生态建设具体措施 - 与Triton、PyTorch、vLLM等开源社区深度合作 贡献插件化架构降低生态维护成本[7] - 作为PyTorch基金会最高级别会员参与主流框架建设[7] - 昇腾主导开源60多个项目 累计6500多名核心贡献开发者 在50多个开源社区贡献37万行代码[7] 生态竞争核心观点 - 黄仁勋承认中国拥有最优秀企业家、最多AI工程师且行动迅速 但强调英伟达护城河比三年前更宽[6] - 华为选择不兼容CUDA生态 坚持开源生态和MindSpore 旨在构建不依赖西方供应链的软件生态[7] - 生态建设需要产业链同心协力 芯片供应问题曾阻碍发展 但"生态是用出来的"[8]
中国算力进入拐点:“用多了就有生态,用少了生态就跑了”
第一财经· 2025-09-29 01:49
对于国内算力市场,建立自己的生态系统也开始变得迫切。 尽管资本市场对算力泡沫发出的警告不断,但英伟达CEO黄仁勋依然对算力产业的发展调高了预期。在 近期一次访谈中,他预测AI推理即将迎来十亿倍的增长,并指出由AI增强的经济活动将催生一个每年5 万亿美元的AI基础设施资本支出市场。 值得注意的,就在访谈前的72小时,英伟达与OpenAI正式达成战略合作,黄仁勋称这笔交易为"能想象 到的最聪明的投资之一"。但也有券商分析师将这种交易模式比喻为金庸小说中的"梯云纵"——看似向 OpenAI投资1000亿美元,实则这些资金又以订单形式流回自家口袋。这种左脚踩右脚的模式,使英伟 达提前锁定利润。 面对这样的"算力激进者",比起泡沫更担心的是错过,近一个月以来,如甲骨文、英特尔等厂商开始以 订单、资金或股权方式与英伟达结盟,一个以美国企业主导的AI新生态正在酝酿。而在国内算力市场 上,随着单颗算力芯片的焦虑逐步缓解,建立一个具有同样生命力和吸引力的生态系统也开始变得迫 切。 生态竞争进入拐点 不断被抬高的需求正在驱动全球算力竞赛进入淘汰赛阶段。 这一决策也意味着华为主动斩断了一条可能的"利润路径",为了获得互联网等企业的 ...
中国算力,如何像水和电一样自然流动?
36氪· 2025-08-27 11:28
行业现状与问题 - 截至2024年9月中国算力规模达246 EFLOPS智能算力同比增长超65%各行业算力应用项目超1.3万个[1] - 智算中心平均机柜利用率仅20%~30%部分企业级中心低至10%[1] - 全国已上线智算中心算力整体利用率仅32%存在供需失衡和资源错配问题[2] - 优质算力供给不足大部分智算中心规模在1000P左右由分散社会资本建设难以匹配需求方[2] - 使用门槛过高创业公司面临找不到或用不起算力问题且缺乏使用裸金属算力的能力[3] - 国产芯片生态割裂多模型多芯片架构导致异构算力无法高效流动部分国产卡难以应用[3] 公司背景与定位 - 无问芯穹于2023年5月由清华大学电子工程系教授汪玉及博士生团队联合创立具备清华科研背景[4] - 公司成立不到两年完成近10亿元融资投资方包括红杉中国百度智谱AI等知名机构[4] - 公司定位为大模型时代"算力运营商"目标解决国产芯片生态割裂和算力使用门槛高问题[5] - 通过"M×N"技术将异构异域异属算力汇聚成云端算力网络实现智能感知和随需获取[5] - 技术路径包括统一中间层屏蔽硬件差异及优化国产芯片在大模型训练推理场景的性能[5] 产品与技术方案 - 公司推出三大核心产品覆盖万卡至十万卡无穹AI云百卡至千卡无界智算平台及单卡至十卡无垠终端智能[6] - 无穹AI云覆盖26省市53个数据中心整合超15种芯片架构异构算力池总算力规模超25000P[7] - 无界智算平台基于3000卡沐曦国产GPU集群支撑百亿参数模型训练600小时不间断利用2000张华为昇腾910B卡实现千亿参数模型推理[8] - 无垠终端智能推出端侧本征模型Infini-Megrez2.0实现21B参数智能水平内存占用控制在7B规模计算量控制在3B规模[9] - 公司通过底层算子通信调度容错技术创新提升算力利用率部分混合芯片算力利用率最高达97.6%[10] 生态合作与验证 - 公司与高校通过产学研协同机制缩短科研成果产业化周期如在研电赛中吸引25支高校团队参与[6] - 无穹AI云覆盖"东数西算"国家战略关键节点通过广域高性能专线实现算力资源实时切换与迁移[7] - 公司服务上海模速空间实现日均Token调用量突破100亿[10]
DeepSeek加速国产AI芯片的"算力突围战"
首席商业评论· 2025-08-24 04:27
文章核心观点 - 深度求索发布V3.1版本大模型 提出UE8M0 FP8浮点数格式 专为下一代国产芯片设计 体现国产AI生态从软件到硬件的深度协同变革 [6][11][13] - UE8M0 FP8采用范围优先策略 放宽小数精度 确保数值范围稳定 适配国产芯片硬件逻辑 虽损失细节但避免计算溢出风险 [11] - FP8标准竞争本质是算力生态争夺 国产阵营需从模型到芯片协同创新 大模型厂商主动调整技术路线 与国产硬件对齐 即便暂时性能妥协 [13][14] 技术背景与行业现状 - 模型参数通常以浮点数形式存储计算 传统FP32精度高但显存占用大 FP8通过牺牲部分精度 换取显存占用减半和计算速度大幅提升 [7] - 英伟达在H100等GPU上实现FP8高效支持 通过动态缩放策略和Tensor Core指令优化 成为训练千亿级大模型标配 但这些优化深度绑定英伟达硬件 [7] - 国产GPU若直接照搬英伟达方案 面临数值不稳定和训练难以收敛等问题 [7] UE8M0 FP8技术特点 - UE8M0 FP8是范围优先变体格式 大幅放宽小数精度 优先确保数值范围稳定 适配国产芯片硬件逻辑 [11] - 设计类似于用粗糙但足够长卷尺测量 虽损失细节但避免计算溢出风险 [11] - 调整背景是国产GPU在指令集和底层架构上与英伟达存在差异 [11] 国产芯片生态进展 - 沐曦曦云C600计划2025年推出 原生支持FP8 采用多精度混合算力架构 [13] - 燧原科技L600主打训推一体 优化FP8计算效率 [13] - 合作模式成为未来趋势 模型端优化低精度计算策略适配国产芯片特性 芯片端针对主流大模型需求定制计算单元和指令集 生态端建立国产FP8标准逐步摆脱对英伟达依赖 [18] 产业意义与展望 - UE8M0 FP8背后是国产AI行业从单点突破迈向全栈协同的关键一步 [16] - 在算力被卡脖子背景下 软硬件深度绑定探索比单纯模型规模增长更具长远价值 [16] - FP8标准竞争本质是算力生态争夺 国产阵营需从模型到芯片协同创新 [13]
恒扬数据与华为联袂发布新品,共探智能计算技术与产业融合新路径
搜狐财经· 2025-08-17 22:31
活动概述 - 华为与恒扬数据在深圳联合举办2025新品推介会 聚焦智能计算技术与产业深度融合 核心议题为鲲鹏昇腾赋能商业新生 [1] - 活动吸引众多行业精英参与 共同探讨智能计算为各行各业注入新活力 [1] - 双方携手发布恒扬数据K+A一体机与SempFusion智算平台两款重量级新品 [1] 战略合作 - 华为与恒扬数据建立深度合作关系 共同推动算力技术创新与应用 [1] - 合作标志双方从硬件协同迈向软硬一体新阶段 [6] - 华为通过鲲鹏昇腾两大核心技术构建开放协同算力生态 [3] 产品发布 - 恒扬数据K+A一体机是华南地区乃至全国首家正式发布的合作伙伴旗舰机型 具备强大AI训练推理能力 [4] - SempFusion智算平台提供全栈AI解决方案 旨在激活知识资产赋能业务活动 [6] - 恒扬数据创新构建多种异构融合算力解决方案 解决企业技术落地难题 [4] 技术能力 - 华为基于昇腾打造坚实算力底座 通过自主创新提供从训练到推理一体化解决方案 [3] - 以DeepSeek为代表的大模型显著降低AI部署和使用门槛 加快行业智能化步伐 [3] - 华为携手众多KPN伙伴共创多款高竞争力差异化产品 覆盖多个应用场景 [3] 行业应用 - 伊登软件依托华为算力底座推出eCopilot系列产品 提供端到端智慧办公能力 [6] - 明泰智能AI数字人一体机已在多地政务领域落地 分享AI在政务场景应用成果 [6] - 算力技术升级推动千行万业数智化升级 助力企业把握智能化转型关键机遇 [3] 生态建设 - 面对全球算力需求爆炸式增长 构建开放协同算力生态成为行业共识 [1] - 通过生态协同凝聚产业链上下游合力 满足行业发展多元化要求 [1] - 算力从可用向好用的转变 推动企业快速实现智能化转型和应用落地 [3][4]
共筑算力新生态 恒扬数据携手华为发布智能计算新品
搜狐财经· 2025-08-16 06:05
行业趋势与需求 - 全球算力需求正以指数级速度攀升 需通过生态协同凝聚产业链上下游合力构建共生的创新联合体[2] - 人工智能技术从实验室单点突破加速迈向行业全场景的深度赋能[2] - AI大模型参数规模突破万亿级 企业对算力需求从通用转向专用 从单一转向融合[6] 公司战略与合作 - 华为通过鲲鹏昇腾两大根技术构建开放协同的算力生态 推动算力从可用向好用升级[4] - 华为携手KPN伙伴共创70多款高竞争力差异化产品 覆盖网络安全工作站和工控等多个场景[6] - 恒扬数据与华为共同打造智算领域产品和方案 为构建企业智能化转型赋能[6] 产品发布与创新 - 联合发布恒扬数据K+A一体机及SempFusion智算平台 是华南地区乃至全国首家正式发布的合作伙伴旗舰机型[1][6][8] - 恒扬数据创新性构建多种异构融合算力解决方案 基于SK90智算一体机与昇腾加速卡结合打造[6] - SempFusion智算平台是为企业AI赋能及激活知识资产提供的全栈AI平台 标志合作从硬件协同迈向软硬一体新阶段[8] 生态应用与落地 - 伊登软件依托鲲鹏昇腾算力底座推出eCopilot系列产品 为企业提供AI Agent应用的端到端智慧办公能力[9] - 明泰AI数字人一体机依托鲲鹏昇腾技术 已在深圳重庆北京等地政务领域落地[9] - 通过展车体验SK90 DeepSeek一体机 多芯融合算力一体机 CMN0616计算板卡等高性能算力平台产品[9]
吴桂英调研新一代计算系统产业链并督办市人大代表建议办理情况
长沙晚报· 2025-08-15 03:39
产业发展规划 - 长沙正处于十四五规划收官和十五五谋划布局关键节点 需深入分析产业发展阶段性特征 [3] - 长沙产业结构呈现优化升级 新旧动能接续转换 高质量发展迈出坚实步伐的良好态势 [3] - 需找准产业链群主攻方向 科学编制产业规划 持续做优湖南特色并放大长沙优势 [3] 产业发展策略 - 坚持规划引领 突出系统思维和错位发展 保持定力增强韧劲 [3] - 强化项目支撑 树立全市一盘棋理念 开展精准招商和靶向招商 [3] - 优化产业生态 强化人才支撑 合力推动现代化产业体系建设 [3] 新一代计算系统产业 - 调研国家计算机网络应急技术处理协调中心湖南分中心 [6][11] - 走访国家级专精特新小巨人企业智慧眼科技和湖南博匠信息科技 [8][10][11] - 加强部门联动和技术协同 培育算力生态 加快数字融合赋能 [11] - 推动新一代计算系统产业聚能起势 为经济社会发展注入新动能 [11] 企业发展战略 - 企业需紧盯长沙产业优势和自身禀赋 加大关键核心技术攻关力度 [11] - 企业要抢占发展制高点 掌握行业话语权 [11] - 要求属地和园区营造良好生态 不断夯实产业根基 [11] 建议办理机制 - 高质量办理代表建议 确保统筹到位 办理到位 转化到位 [4] - 将代表金点子转化为促进产业发展的金钥匙 [1] - 为十五五规划编制聚智聚力 [4]
对话无问芯穹CEO夏立雪:模型和芯片是两条驱动路径,不可能分开发展|独家
钛媒体APP· 2025-07-30 04:42
公司产品发布 - 公司在2025世界人工智能大会期间发布全规模AI效能跃升方案 包括三大核心产品:无穹AI云(针对万卡至十万卡全局算力网络)、无界智算平台(针对百卡至千卡级大型智算集群)和无垠终端智能(针对单卡至十卡级有限算力终端)[2] - 该方案是一套面向未来智能基础设施的软硬协同系统 覆盖跨地域智算网络、智算集群与多形态智能终端等全规模场景 统一适配多种异构算力 提供从模型调度、性能优化到应用部署的全链路支持[2] - 无穹AI云大模型服务平台上线智谱最新开源模型GLM-4.5(3550亿参数)和GLM-4.5-air(1060亿参数)[2] 技术解决方案 - 公司打造产业链上的"世界通用语言" 实现不同芯片之间的无缝通信与协同 使算力资源即插即用且可自由挑选[3] - 通过算法和编译优化 国产芯片性能提升50%-200% 并实现多源异构国产AI芯片的统一调度和混合精度计算 综合性价比全面超越国际主流芯片[5] - 无界智算平台高效利用2000张华为昇腾910B智算加速卡 实现千亿参数模型的分布式部署与大规模推理[6] 商业合作与生态建设 - 公司提供全球首个跨地域全分布式联合强化学习服务 最小支持单张消费级显卡接入 与三大运营商及20余家AIDC机构联合启动"AIDC联合运营创新生态计划"[6] - 与上海创智院共同打造全球首款端侧本征模型无穹天权Infini-Megrez2.0 与联想合作开发智能终端推理加速引擎无穹开阳Infini-Mizar2.0(将AI PC本地模型尺寸上限从70亿提升到300亿参数) 与新华三合作大模型一体机 与苏州异格技术合作推出FPGA大模型推理一体机[7] - 服务的上海模速空间日均Tokens调用量突破100亿 累计服务10余个智慧场景 支撑100多个前沿AI创新应用 单应用月活高达数千万[6] 融资与发展历程 - 公司2024年完成近5亿元A轮融资 创下国内AI基础设施最大单笔融资记录 成立两年累计融资超过10亿元[5] - 成立于2023年5月 专注于为AI 2.0时代提供完整解决方案 致力于成为大模型落地过程中的"M×N"中间层[4] 行业观点与趋势 - 模型和算力芯片是两条驱动路径 需要融合及协同发展 国内算力产业需要多方配合解决资源限制问题[3] - AI应用落地价值空间=场景尺度×计算资源×智能效率 智能效率持续进化推动顶尖模型从大规模计算下放到中等算力和小算力场景[5] - 国产芯片在推理侧具备商业价值 公司帮助用户从国际芯片逐步迁移到国产卡 目前在一些国产卡上运行效率较好[8] - 需要打通算力、数据、模型、应用的全栈能力 教育科研领域应共同思考"最后一公里"问题[8]
推新大年,健康引领
国盛证券· 2025-06-11 00:38
核心观点 - 短期饮料行业旺季有望迎来密集催化,全年饮料企业推新加速,战略单品顺应健康化、质价比趋势,叠加变革有望强化大单品成功概率、实现积极增长,建议从优质龙头和高安全边际&改善标的两条主线布局饮料板块;影石创新作为智能影像设备领军者,技术体系完善,产品矩阵丰富,市场份额和业绩持续提升;雅迪控股受益于政策驱动,行业需求有望重回快速增长区间,公司销量和盈利能力有望快速修复;海光信息与中科曙光战略重组,建议关注算力生态产业链 [3][4][7][8] 各研报总结 食品饮料行业 - 短期饮料行业旺季有催化,全年企业推新加速,战略单品顺应健康化、质价比趋势,叠加变革有望强化大单品成功概率、实现积极增长 [3] - 建议两条主线布局饮料板块,优质龙头包括农夫山泉、东鹏饮料、统一企业中国,高安全边际&改善标的包括华润饮料、李子园、承德露露、欢乐家、均瑶健康、重庆啤酒等 [3] 电子行业 - 影石创新成立于2015年,专注于智能影像设备研发、生产与销售,形成了以全景技术、防抖技术等为核心的技术体系 [4] - 消费级领域重点布局全景相机及运动相机两大产品线,专业级业务以Pro系列及TITAN系列VR全景相机为主,应用于多个领域 [4] - 近年来公司持续推进新产品线开发等,市场份额持续提升,业绩快速增长,营收从2021年的13.28亿元增长到2024年的55.74亿元,CAGR达61.31%;扣非归母净利润从2021年的2.52亿元增长到2024年的9.46亿元,CAGR达55.42% [4] 汽车&海外行业 - 以旧换新叠加新国标落地,行业需求有望重回快速增长区间,头部车企优势明显,未来市场份额有望稳中有升 [7] - 雅迪控股经历前期激进扩张与2024年深度调整,销量、盈利能力均有望快速修复,预计2025 - 2027年归母净利润分别为29.3/35.5/41.1亿元,对应PE分别为12.1/10.0/8.6倍,首次覆盖,给予“买入”评级 [7] 计算机行业 - 2025年6月9日,海光信息与中科曙光发布关联交易预案,通过换股吸收合并方式进行战略重组,并于6月10日开市起复牌 [8] - 建议关注算力生态产业链,重点关注服务器领域如中科曙光、海光信息、浪潮信息等公司 [8] 行业表现情况 行业表现前五名 | 行业 | 1月 | 3月 | 1年 | | --- | --- | --- | --- | | 医药生物 | 9.7% | 7.4% | 10.8% | | 纺织服饰 | 4.7% | 5.1% | 12.4% | | 农林牧渔 | 4.6% | 9.1% | 0.8% | | 银行 | 4.3% | 10.7% | 27.7% | | 美容护理 | 4.3% | 13.1% | 12.3% | [1] 行业表现后五名 | 行业 | 1月 | 3月 | 1年 | | --- | --- | --- | --- | | 国防军工 | -4.6% | -1.6% | 17.1% | | 食品饮料 | -4.5% | -1.3% | -3.3% | | 机械设备 | -4.2% | -10.0% | 25.5% | | 家用电器 | -3.5% | -1.4% | 9.6% | | 电力设备 | -3.1% | -8.8% | 7.4% | [1]
“中科院系”两家科技巨头合并:国产算力格局要变天?
36氪· 2025-05-30 08:41
美国对华半导体技术限制 - 美国政府切断部分美国企业向中国出售半导体设计软件的渠道,涉及EDA三巨头Cadence、Synopsys、Siemens EDA,这三家占据中国电子设计自动化市场的80%以上[2] - 美国商务部撤销《AI扩散规则》,推出更严苛的AI芯片出口管制新规,将中国归入全面禁运GPU芯片的第三等级[8] - 英伟达CEO黄仁勋表示美国对华人工智能芯片出口管制"一败涂地",英伟达在中国市场份额从95%暴跌至50%[10][11] 中国半导体行业应对措施 - 海光信息通过换股吸收合并中科曙光,两家企业市值合计超4000亿,海光专攻高端CPU和AI芯片,中科曙光擅长服务器和云计算[5][22] - 华为昇腾芯片、寒武纪思元芯片等国产芯片崭露头角,抢占市场份额[13] - 国内三大运营商2024年采购的服务器中60%采用国产芯片(海光、华为为主),拉动海光DCU出货量增长50%[32] 算力生态竞争格局 - 英伟达CUDA平台拥有巨大开发者生态优势,全球AI模型和深度学习框架如PyTorch、TensorFlow都围绕CUDA优化[15] - 华为昇腾920单卡算力突破900 TFLOPS,性能超越英伟达H20,但生态短板限制竞争力[20] - 华为MindSpore国内开发者社区2024年增长50%,显示国产AI框架黏性初见成效[39] 海光与曙光合并的战略意义 - 合并实现"芯片设计-服务器制造"整合,海光深算三号DCU单卡算力与英伟达H20相近但价格更低[23][25] - 合并前存在技术适配问题,芯片性能因服务器散热和数据传输限制无法充分发挥[24] - 合并后可效仿华为"芯片设计-服务器制造-云计算服务"全链条布局,成本比国外方案低30%-40%[26][28] 中美算力战略差异 - 美国采取"以柔克刚"策略,通过市场渗透和技术锁定绑定全球算力生态[30] - 中国采取"高筑墙,广积粮"战略,整合产业链各环节确保自主可控[31] - 华为昇腾910B专为大模型优化,在国内推理市场份额达30%[33]