Workflow
算力集群
icon
搜索文档
全球算力竞争,是时候迎来“中国时刻”了
新浪财经· 2025-09-27 20:23
近日,在上海举办的华为全联接大会上,华为发布了由昇腾芯片组成的全球最强算力超节点和集群,为 破解我国算力基础设施"供给不足、成本高企、生态待建"三重挑战提供了关键技术路径,有望推动中国 AI产业从"跟跑"向"领跑"跨越。 算力"缺芯",可谓是我国科技产业发展面临的最紧迫挑战之一。 近年来,美国一再将芯片技术作为遏制中国发展的关键工具,不断将英伟达等公司研发的算力芯片列入 出口管制清单,企图在人工智能这一未来科技竞争的关键赛道"卡脖子",阻断中国AI产业的未来。 从世界第一台通用计算机"ENIAC",到如今的智能手机,网络数字世界的日新月异表面建立在芯片制程 的飞速进步上,本质则依赖于计算能力的飞速跃升。而大语言模型的技术特性决定了,算力就是人工智 能时代的"石油"和"电力"。因此对于我国而言,缺乏高水平的国产算力供给,很可能成为我们迈向科技 强国征程上的绊脚石。 (二) 然而,想要破解算力之困,何其难也。 首先,研发先进算力芯片前期投入惊人。一款高端AI芯片的研发流片费用本就是一笔巨资,背后还有 着数千名顶尖工程师夜以继日的研发积累。更要看到,仅仅是解决了"硬件"问题还不够,英伟达CUDA 平台经过多年积累, ...
英伟达计划逐步向OpenAI投资1000亿美元
36氪· 2025-09-23 03:39
通过与软银、Oracle、英伟达等巨头的新合作,OpenAI正在逐渐摆脱对微软的依赖,拥有更大的独立自主权 两家风口浪尖上的科技公司达成了战略合作。 美国东部时间9月22日晚,英伟达(NASDAQ: NVDA)、OpenAI宣布建立战略合作伙伴关系。根据双方在官网披露的信息,两家公司将达成以下合作内 容: 其一,OpenAI将使用数百万枚英伟达GPU(图形处理器),部署至少10GW(吉瓦,功率单位。1GW算力集群理想情况可容纳80万枚英伟达GB200旗舰芯 片)的AI算力集群。 其二,支持这一合作伙伴关系,英伟达计划随着每GW算力集群的部署,逐步向OpenAI投资1000亿美元。 其三,第一个GW的算力集群将于2026年下半年部署,这将使用英伟达最新Vera Rubin(英伟达下一代旗舰芯片Rubin系列,预计于2026年下半年上市)平 台部署。 英伟达创始人兼CEO(首席执行官)黄仁勋表示:"从第一台DGX超级计算机到ChatGPT 的突破,英伟达和OpenAI十年来一直相互推动。此次投资和基础 设施合作标志着我们迈出了新的一步——部署10GW算力,为下一个智能时代提供动力。" OpenAI联合创始人兼首席 ...
百融云20250903
2025-09-03 14:46
**百融云电话会议纪要关键要点总结** **涉及的行业与公司** * 公司为百融云 一家专注于金融科技领域的AI科技公司[2][3] * 核心业务服务于金融行业 包括银行 消费金融公司 互联网金融企业等 并正积极向非金融行业拓展 如法务 医疗 教育 零售等[3][8][16][19] **核心业务结构与财务表现** * 业务分为两大板块 MaaS(模型及服务)贡献约1/3收入 BaaS(业务及服务)贡献约2/3收入[2][3] * 2025年上半年净利润超2亿元 净利润率达12% 调整后净利润率达16%[2][3] * 过去几年收入增长稳定 每年增速保持在20%以上 2025年上半年收入同比增速为22%[12][14] * 公司拥有1400名员工 研发人员占比高达57% 人均年收入超200万元[2][3] * 累计服务超8000家机构 包括阿里巴巴 百度 字节跳动 京东 小米等大型互联网公司[2][3] **MaaS业务详情** * 利用决策式AI技术为金融机构提供信贷决策支持 日调用量超3亿次[2][4] * 运营高效且成本低 提供丰厚的运营现金流[3][4] * 截至2025年上半年有211家核心客户 每家平均贡献收入337万元 头部10家客户每家平均贡献两三千万元[20] * 长期市场空间对标FICO 预计可实现60亿元收入 利润率25%~30%[20] **BaaS业务详情** * 利用智能语音机器人协助机构进行销售 客户运营和情绪疏导 采用分润模式收费[2][3][5] * 依赖生成式AI技术和大模型 实现高度仿真人类对话 语音识别和理解准确度均达99%[3][7] * 智能语音机器人成本仅为人工的1/10到1/5 大大提高了效率[6][7] * 在信贷场景中通过VoiceGPT转化率提升20%~30%[21] * 市场空间巨大 信贷余额预计从2022年17万亿元增长至2030年45万亿元 公司BaaS业务增速为30%~40%[20] **新产品与技术布局** * 推出Cyber Star(百工)智能体平台 旨在提升企业内部效率 已通过网信办备案[2][9][16] * 平台支持C端和E端场景 可灵活调用各种大模型并组合AI组件 如Voice GPT和Text GPT[3][9] * 在法务领域应用效果显著 审合同时间从53分钟缩短至3-4分钟[16] * AI技术布局分为六层 从底层算力硬件到顶层人工参与系统 提供端到端解决方案[11] * 专注于垂直领域的小模型 参数为百亿级 成本更低且在特定领域准确度更高[8] **政策影响与应对策略** * 面临政策不确定性 包括保险业务的报行合一政策 利率下调带来的利差压力 以及9号文要求消费金融公司不能收取高利率[14][18] * 保险业务自2024年起已呈现负增长状态 但2025年上半年保费规模仍增长9%[14] * 电销管控新政策要求商业外呼进行健康分评估和投诉率考核 公司拥有强大的筛选能力以确保合规[14] * 公司采取保守态度看待下半年业绩 但坚持长期主义 对长期前景充满信心[13][14][22] * 积极拓展非金融领域业务以增强公司韧性和业务弹性[14][18][19] **研发投入与未来规划** * 2025年上半年研发投入增长超30% 主要投向AIGC 算力集群及智能体平台[19] * 全年计划增量投入约3亿元 上半年已投入1.6亿元[19] * 未来将继续拓展泛金融场景 BUS金融云业务2025年上半年同比收入增长45%[14] * 期望未来三年内非金融行业AI业务收入占比能逐步提升[19] * 公司现金储备充足(37亿元)且有运营现金流产生 每年进行约总股本10%的股票回购[20] **市场展望与公司韧性** * 2025年上半年信贷行业表现强劲 尤其是二线消费贷公司 但下半年受政策影响不确定性较大[15] * 公司是一家具有韧性的公司 即使面临短期波动(如2020年收入下滑) 只要公司本质不变 对长期前景依然充满信心[13][22]
电子行业周报(2025/7/28-8/1):WAIC2025,华为发布昇腾384超节点-20250806
爱建证券· 2025-08-06 05:02
行业投资评级 - 电子行业评级为"强于大市",一周内SW电子行业指数上涨0.28%,跑赢沪深300指数(-1.75%),涨幅排名4/31位 [1][34] 核心观点 1 WAIC 2025与华为昇腾技术突破 - 华为在WAIC 2025发布Atlas 900 A3 SuperPoD超节点架构,集成384颗NPU与192颗鲲鹏CPU,实现392GB/s单向带宽、1微秒时延、300 PFLOPs算力,LLaMA3模型训练性能提升2.5倍,Qwen/MOE模型提升3倍 [5][7][16] - 昇腾910C系统级性能领先:BF16算力300PFLOPS(英伟达GB200 NVL72的1.7倍)、HBM容量49.2TB(3.6倍)、带宽1229TB/s(2.1倍),但系统功耗达599.82KW(4.1倍于英伟达) [17][19] - 昇腾系列技术迭代:2018年7nm昇腾910(256TFLOPs)→2023年国产910B对标A100→2024年910C显存带宽超3TB/s→2025年CloudMatrix 384超节点 [6][11] 2 产业链投资机会 - **中芯国际**:2025年推进7nm工艺量产,14nm工艺自2019年量产,28nm及以上成熟制程产能持续扩张 [20] - **中际旭创**:2023年全球光模块市占率第一,800G/1.6T产品通过认证,受益算力基建需求 [21][22] 3 全球科技动态 - **苹果2025Q3财报**:营收940.36亿美元(同比+9.6%),iPhone收入445.8亿美元(+13%),Mac收入80.46亿美元(+15%),大中华区收入增长4% [23] - **光跃LightSphere X**:国内首款光互连GPU超节点,采用曦智科技分布式光交换技术,支持2000卡规模,获WAIC 2025 SAIL奖 [25][26] - **阿里通义万相2.2开源**:MoE架构视频生成模型(27B参数),22G显存可生成720P/24fps视频,计算资源消耗降低50% [28][29] - **燧原L600芯片**:存储带宽3.6TB/s,互联带宽800GB/s,性能对标英伟达H20,支持10万卡集群建设 [30][31] - **荣耀MagicGUI大模型**:70亿参数多模态模型,操作准确率91.5%(超行业16.4%),搭载于Magic V5旗舰机 [32][33] 市场表现 1 行业指数 - SW电子三级行业涨幅前三:印制电路板(+9.65%)、模拟芯片设计(+1.83%)、分立器件(+1.73%);跌幅前三:半导体设备(-3.32%)、集成电路制造(-2.57%) [34][38] - 费城半导体指数周跌2.09%,恒生科技指数跌4.94%,中国台湾电子零组件板块涨6.82% [45][47] 2 个股表现 - SW电子涨幅前十:东芯股份(+53.7%)、思泉新材(+50.7%)、方邦股份(+37.0%);跌幅前十:波长光电(-10.1%)、峰岹科技(-8.5%) [39][41]
华为首次展出“算力核弹”真机,获评镇馆之宝
观察者网· 2025-07-26 06:28
昇腾384超节点技术突破 - 公司首次展出昇腾384超节点真机并获评"WAIC镇馆之宝" 全方位展示昇腾算力底座创新能力和行业实践 [1] - 昇腾384超节点由12个计算柜和4个总线柜构成 实现业界最大规模384个NPU卡高速总线互联 [3] - 采用创新"全对等架构"突破传统冯诺依曼架构 通过高速互联总线将CPU/NPU/DPU/存储等资源池化 实现点对点互联 [3] - 算力总规模达300Pflops(英伟达NVL72的1.7倍) 网络互联总带宽269TB/s(提升107%) 内存总带宽1229TB/s(提升113%) [4] - 单卡推理吞吐量达2300 Tokens/s 可扩展为包含数万卡的Atlas 900 SuperCluster超节点集群 [4] 性能优势与行业应用 - 在LLaMA3等千亿稠密模型上性能提升2.5倍 Qwen/DeepSeek等多模态模型性能提升3倍 领先行业1.2倍 [4] - 通过系统工程优化提升芯片算力利用率 在硬件不变情况下弥补芯片工艺不足 [5] - 已适配开发超过80个大模型 包括讯飞星火/DeepSeek/Qwen/鹏城/LLaMA等 联合2700+合作伙伴孵化6000+行业解决方案 [7] - 展示11大行业解决方案实践 覆盖互联网/运营商/金融/政务/医疗/油气/交通等领域 [7] 生态建设与展会表现 - 2019年以来持续深耕芯片等根技术 扩展产业生态 提供易用软件工具平台 [7] - WAIC展会面积超800平方米 展示昇腾软硬件能力及开源生态 [7]
Manus撤离中国后谈经验教训;Kimi K2登顶;奈飞首次使用AIGC做特效
观察者网· 2025-07-21 01:07
Manus经验总结与AI智能体发展 - Manus联合创始人季逸超复盘创业经验,指出团队因前次创业教训选择"套壳"而非自研大模型,经历4次智能体框架调整才实现局部最优解 [1] - AI智能体的未来核心在于上下文设计而非单纯模型能力比拼,技术复盘未直接回应裁员及撤离中国市场等市场关注问题 [1] 中国开源模型全球领先 - Kimi K2、DeepSeek R1、Qwen3三个中国开源模型占据全球开源排行榜前三,领先谷歌Gemma3和Meta Llama4,Kimi K2登顶冠军 [1] - 榜单由数千开发者动态盲测投票生成,英伟达CEO黄仁勋多次认可DeepSeek、Qwen和Kimi为全球最领先开源模型 [1] 中国联通算力布局与业务进展 - 中国联通已建成上海临港、呼和浩特等万卡智算中心,正探索十万卡算力集群布局,年底智算规模将达45EFLOPS [2] - 50%用户选用"双千兆"服务,联通超清、云智手机等产品覆盖2.7亿用户 [2] 奈飞与达美航空AI应用 - 奈飞首次在电视剧《永航员》中使用生成式AI制作视觉特效,高管称技术可降本提质 [2] - 达美航空推进AI动态定价策略,计划全面取代固定票价模式,此前小范围测试成功 [2] 马斯克与SpaceX动态 - 马斯克宣布xAI将开发儿童版AI应用"Baby Grok",提供友好型内容但未披露具体功能 [3] - 特朗普政府审查SpaceX与联邦机构合同,因马斯克与特朗普关系破裂 [4][5] 链博会成果与供应链评价 - 第三届链博会达成超6000项合作意向,102家企业和机构已签署下届参展协议,签约量同比增50% [5] - 英伟达CEO黄仁勋称中国供应链体系规模、复杂性及多样性为"世界级奇迹" [6] 消费电子与汽车行业动态 - 折叠屏iPhone或定价超15000元,采用三星OLED面板,电池容量5000-5500mAh,物料成本预计759美元 [6] - 极氪澄清"0公里二手车"质疑,称涉及车辆为折扣销售的展车,享新车权益 [6] - 法拉第未来新车Super One被指抄袭长城汽车高山车型,官网删除"高山9"描述,发布会1小时下定量10034台 [7]
100亿美元!马斯克,融到了“续命钱”
证券时报网· 2025-07-02 13:14
融资规模与结构 - xAI完成总计100亿美元新一轮融资,包括50亿美元债务融资和50亿美元股权融资 [1] - 目前xAI总融资额已超200亿美元,是继去年12月60亿美元融资后的又一轮大额融资 [1] - 债务融资获得超额认购,吸引全球债务投资者参与,摩根士丹利担任债务融资顾问 [1] - 债务与股权组合设计有效降低综合资本成本,大幅拓展可融资渠道 [1] 融资过程与挑战 - 融资过程波折不断,初期需提高定价吸引投资者 [2] - 债务融资方案包括30亿美元债券(收益率12.5%)、10亿美元固定利率定期贷款(利率12.5%)和10亿美元B类定期贷款(基准利率上浮7.25个百分点,发行价96美分) [2] - 债券融资投资者认购规模仅为发行量的1.5倍,低于同类垃圾债2.5-3倍的认购情况 [3] - 融资进程受马斯克与特朗普关系破裂等外部因素干扰,原定6月17日截止的发行被迫延长 [3] 资金压力与支出 - 融资前xAI账面现金仅剩40亿美元,全年预计支出130亿美元,平均每月消耗超10亿美元,现有资金仅够支撑4个月运营 [4] - 高昂资本支出主要源于算力投入,田纳西州超级计算机项目初期配备20万个英伟达GPU,计划扩至100万个,已投入数亿美元 [4] - 采用合成数据训练AI的模式导致成本显著高于竞争对手 [4] 商业化与竞争对比 - xAI主要营收来自X Premium订阅服务,预计2025年营收仅5亿美元,2026年或达20亿美元以上 [5] - 竞争对手OpenAI年化经常性收入突破100亿美元,业务多元化且获美国国防部2亿美元合同 [5] - xAI商业化进程明显落后,资金压力加剧 [5] 行业与资本态势 - 市场对AI赛道前景看好,投资者最终参与融资既因行业前景也因马斯克个人影响力 [3] - 当前AI行业资本态势显示投资者更加谨慎,对企业财务和商业化能力要求更高 [5]
奥瑞德: 奥瑞德股票交易异常波动公告
证券之星· 2025-06-30 16:35
股票交易异常波动情况 - 公司股票在2025年6月26日、27日、30日连续三个交易日内收盘价格涨幅偏离值累计达20%,属于异常波动情形 [1] 公司经营与股东情况 - 公司及子公司生产经营正常,市场环境与行业政策未发生重大调整 [2] - 控股股东青岛智算确认不存在应披露而未披露的重大事项,包括资产重组、股权激励等 [2] - 未发现影响股价的媒体报道、市场传闻或热点概念事项 [2] 算力综合服务业务风险 - 算力集群建设需重资产投入,租赁服务价格可能受宏观经济、技术迭代、竞争加剧等因素波动,业绩不确定性高 [2] - 新业务技术及运营团队组建时间短,人才储备不足或经验缺乏可能导致业务不及预期 [3] 业绩补偿问题 - 公司拟以1元总价回购并注销业绩补偿股份,但补偿方左洪波、褚淑霞所持股份已全部质押且被司法冻结,股份及现金补偿追索存在重大不确定性 [3][4] 财务投资人减持情况 - 财务投资人自2024年2月17日至2025年6月20日已减持9.62亿股,占其受让股份的81.8%,占总股本的32.82%,后续可能继续减持 [4] 二级市场交易动态 - 股价近期波动幅度较大,剔除大盘因素后实际波动显著,提示交易风险 [4] 董事会声明 - 公司确认无应披露未披露事项,前期披露信息无需更正或补充 [4][5]
让算力航母稳健远航,华为首次披露昇腾算力基础设施的压舱石
21世纪经济报道· 2025-06-09 12:08
AI算力集群技术演进 - AI算力集群通过整合上万台计算机形成"算力航空母舰",以应对万亿参数大模型的计算需求,单机算力已无法满足复杂AI任务[1] - 集群需解决三大核心挑战:设备协同工作、故障时高效运行、训练中断快速修复,华为团队通过工程创新实现技术突破[1] 超节点高可用技术 - 采用"系统层-业务层-运维层"三级容错方案,将故障转为亚健康问题,通过超时代答欺骗OS和网络路由切换防止系统级故障[1] - 在CloudMatrix 384超节点中实现租户无感知的网络闪断重试,运维层通过亚健康感知技术主动消除故障影响[1] 集群线性度优化 - 提出TACO、NSF、NB、AICT四项关键技术,实现算力规模与性能的线性增长,PanGu Ultra 135B模型在4K卡集群实现96%线性度[1] - PanGu Ultra MoE 718B稀疏模型在8K卡集群线性度达95.05%,4K卡CloudMatrix集群线性度达96.48%[1] 万卡训练快速恢复 - 进程级重调度恢复技术将训练恢复时间缩短至3分钟内,在线恢复技术针对硬件UCE故障实现30秒内恢复[1] - 算子级在线恢复通过HCCL算子重试实现网络故障秒级恢复,训练任务不中断[1] MoE模型推理容错 - 三级容错方案实现实例间切换/重启/无损恢复,实例恢复时间从20分钟降至5分钟[1] - TOKEN级重试技术在CloudMatrix 384场景下实现30-60秒实例恢复,减卡弹性恢复技术实现秒级无感知恢复[1] 故障感知与诊断 - 构建全栈可观测能力,包含集群运行视图、网络链路监控等模块,实现硬件故障实时监测[1] - 建立全栈故障模式库,涵盖跨域诊断、计算节点诊断、网络诊断等技术,提升故障定位效率[1] 数字化仿真建模 - Sim2Train平台通过AdaptPack编排优化长序列PP空泡,吞吐提升4.5%-8.24%,AdaptS/R技术缩短单步时长3.25%[1][2] - Sim2Infer推理仿真平台实现硬件指令自动化映射,平均误差仅6.6%,Sim2Availability框架可模拟复杂系统故障场景[1][2] 框架迁移与生态兼容 - MindSpore构建MSAdapter工具覆盖90%以上PyTorch接口,通过多级流水线技术提升动态图执行效率[1] - 推理阶段兼容HuggingFace权重配置,vLLM-MindSpore插件支持大模型服务化,实现盘古72B模型快速部署[1] 未来技术演进方向 - 算法-算力-工程协同进化将形成"应用需求→硬件创新→工程反哺"闭环,光电混合架构释放性能潜力[1] - 智能化工程手段如AI运维将弥合系统复杂度,推动高效、弹性、自愈的下一代算力基础设施发展[1]
京源环保: 关于全资子公司签订日常经营重大合同的公告
证券之星· 2025-05-15 11:30
合同基本信息 - 合同类型为算力集群建设项目承包合同 [1] - 合同金额为364,724,568元(含税) [1][2] - 合同生效条件为双方代表签字(盖章)之日起生效 [1] - 项目建设周期为现场具备施工条件后30天,运维服务期限为交付后5年 [1][3] 财务影响 - 采用总额法确认收入,2025年项目交付验收后一次性确认收入约32,026万元 [1][5] - 运维服务部分按5年分摊确认收入约283万元 [5] - 项目毛利率预计为9%~10% [1][5] 交易细节 - 交易方为京源环保全资子公司南通京源云计算科技有限公司(京源云计算) [1][2] - 京源云计算成立于2024年5月,截至2024年底总资产未披露,员工18人 [3] - 合同标的包括算力集群硬件基础设施、集群管理软件平台、安全设备及服务 [3] 合同履行条款 - 京源云计算负责软硬件供货、安装、开发、培训及运维 [2] - 付款方式为分期支付,具体条款未披露 [4] - 合同包含违约责任、争议解决等标准条款 [4] 交易审批与披露 - 合同属于日常经营性合同,无需提交董事会或股东大会审议 [2] - 因涉及商业秘密,客户名称、产品规格等关键信息豁免披露 [3] - 交易对手方R公司与京源云计算无关联关系 [3]