Workflow
昇腾910B
icon
搜索文档
马云还有“狠招”!阿里备胎曝光,填补国内AI芯片空白!
搜狐财经· 2025-09-02 16:49
公司战略与投入 - 阿里巴巴宣布未来三年投入超过3800亿元用于建设云和AI硬件基础设施 [3] - 公司明确未来发展方向从互联网转向算力依赖AI芯片 [3] 技术研发突破 - 阿里巴巴自主研发新型AI推理芯片进入测试阶段完全采用国产供应链代工 [6][10] - 芯片兼容英伟达CUDA生态支持多模态推理实测ResNet50算力达125TOPS达到H20芯片约90%性能水平 [8] - 平头哥半导体已推出含光800倚天710镇岳510等多款芯片并在RISC-V架构领域形成三大系列处理器IP [8] 行业环境与政策背景 - 美国对中国高端芯片技术持续打压促使中国企业加速自主可控进程 [6][10] - 中国监管机构要求包括阿里巴巴腾讯等企业完全暂停采购NVIDIA芯片 [8] - 官方明确建议国内企业避免使用NVIDIA H20芯片因其存在性能限制和安全风险 [8] 市场竞争格局 - 中国AI芯片市场已涌现华为昇腾910B寒武纪MLU370等国产产品并在多个行业实现规模化应用 [10] - 阿里巴巴入局使国产AI芯片竞争力进一步提升推动行业自主创新进程加速 [12]
华为郭平:我们处在剧变的洪流中,不能靠情怀来占领市场
观察者网· 2025-09-01 03:39
鸿蒙系统战略定位 - 鸿蒙是公司不得不打的一场战争 必须打赢 目标不仅在国内 还要冲出国门走向世界 给客户提供另一个选择[1] - 鸿蒙系统开创源于2019年美国限制 最核心流行应用无法与华为连接 包括操作系统及各种应用服务均需自主解决[3] - 公司通过软硬芯云垂直化整合 以软补硬 非摩尔补摩尔等方式 在受限环境下构建持久竞争力[1][12] 生态系统建设挑战 - 构建生态系统是公司乃至中国均不擅长的领域 因历史上均嵌入别人系统 光刻机等商业价值不大领域被卡脖子[3][4] - 生态建设需调动伙伴积极性 伙伴90%精力不在华为 说服其投入开发已属成就 但需驱动5000家主力应用及50万-500万长尾支持[4] - 微信已支持鸿蒙版本 未来随客户增多伙伴投入力量将增加 公司坚持投入终端规模做大 改善合作利益格局[5] 研发投入与策略 - 2025年上半年研发费用达970亿元 同比增长9.1% 为营收增速两倍多 占营收比重22.7% 全年投入或超2024年1797亿元[1] - 科研分研究(用钱换知识)和开发(用知识换钱) 每年按研发投入20%-30%加强研究 多梯次多路径探索未知领域[6] - 在选定领域已处于领先地位 无跟随对象 需靠自身摸索 加强2012实验室和半导体器件研究 实现创新突破性发展[6] 人才战略与创新机制 - 公司10年前即关注顶级人才获取 战略研究院下设竞赛管理部追踪全球计算机大赛尖子 现有89名天才少年[7] - 技术岗位分突破性跳高型和蚂蚁雄兵型 重点培养突破能力人才 建立环境机制发挥其作用[7] - 主管100%具备基层成功实践经验 均从基层干上来 鼓励新员工以责任结果为导向 而非凭过往学历证明自己[17] 人工智能领域布局 - AI领域全球仅中美有资格竞争 美国算力及生态领先 中国数据算法应用场景领先 需将优势转为具体订单[9] - AI变现路径明确:成为世界算力第二选择 终端全面AI化 车业务成AI应用排头兵 电信网络AI化改造 ToB军团推动行业升级 内部运营AI化[13] - 大模型开源闭源需具体考量 闭源需绝对领先 开源需持续领先控制力 否则均难存活[16] 业务协同与客户导向 - 军团化模式旨在更贴近客户需求 尤其在矿山油田等非电信领域 需让产品理解应用场景 易集成使用[10] - 客户满意度是持续订单基础 本质靠有竞争力产品服务 技术突破 高质量解决方案 华为云等均需围绕此点[11] - 全球300多家主要电信运营商 但国内70%以上AI需求来自几家互联网公司 必须让客户满意才能获订单[11] 竞争优势与行业机遇 - 劣势为受约束无法获世界先进技术 优势为有中国大本营市场 目标在ICT和智能终端领域成为中国业务底座[12] - 动态行业是年轻人福利 有机会引领改变行业 但需付出额外努力[12] - 数字能源领域电动化智能化确定 需构建太阳能逆变器 光储发电机等核心能力 避免低门槛竞争[14] 知识管理与内部创新 - 公司设立CKO(首席知识官)负责全公司技术经验分享 建立体系及社区 鼓励内部知识复用和分享[15] - 信息安全保护与知识积累均重要 需平衡考量 建议员工以同理心思考 多辩论说服而非简单否定[16]
寒武纪捅破了天?
虎嗅· 2025-08-27 06:48
财务表现 - 2025年上半年营业收入28.81亿元,同比增长4347.82% [1][2] - 归属于母公司股东的净利润10.38亿元,去年同期亏损5.3亿元,实现扭亏为盈 [1][2] - 基本每股收益从-1.27元提升至2.5元 [1][2] - 第二季度营收17.69亿元,同比增长4425.01%,净利润6.83亿元,去年同期亏损3.03亿元 [2] - 总资产84.20亿元,同比增长25.34%,归属于上市公司股东的净资产67.55亿元,同比增长24.58% [2] - 经营活动产生的现金流量净额9.11亿元,去年同期为-6.31亿元 [2] - 加权平均净资产收益率17.31%,去年同期为-9.75% [2] 资本市场表现 - 8月22日总市值超4940亿元,首次超过中芯国际,跃居科创板市值第一 [6] - 8月27日股价突破1400元/股,最高达1438元/股,总市值超5700亿元 [8] - 五日内市值连续大幅攀升,股价直追茅台(1484元/股) [11] 技术实力与行业地位 - MLU590的FP16算力为314 TFLOPS,仅为英伟达GB200的6% [13] - 主力产品思元590采用7nm制程,英伟达已推出4nm制程芯片并计划采用3nm工艺 [13] - 显存技术依赖HBM2e,英伟达已采用HBM3e技术 [13] - 国内第一梯队,算力和显存带宽优于海光、摩尔线程,部分场景落后于华为昇腾910B [14] - 具备国产稀缺性,但与国际巨头存在代差 [15] 业务与客户结构 - 营收爆发主要来自云端AI芯片大单,押中国产算力需求爆发窗口 [18] - 2024年前五大客户贡献营收11.11亿元,占比94.63%,其中第一大客户占比79.15% [19] - 客户群体频繁波动,历史上曾依赖华为海思(2017-2018年占比97%),后转向国资平台等 [19] - 智能计算集群项目毛利率高达70.78%,但客户不稳定可能导致营收波动 [19] 战略与前景 - 公司处于技术追赶期,需在技术、生态和供应链上提升硬实力 [21] - 面临客户集中、生态短板、全球竞争等考验 [18][21] - 国产AI芯片领域的代表性企业,具备长期发展潜力但存在不确定性 [20][21]
DeepSeek一句话让国产芯片集体暴涨!背后的UE8M0 FP8到底是个啥
量子位· 2025-08-22 05:51
文章核心观点 - DeepSeek V3.1发布采用UE8M0 FP8参数精度 引发市场对国产芯片技术升级和生态协同的高度关注 带动相关企业股价显著上涨 [1][3][4] - UE8M0 FP8技术通过块级缩放和动态范围优化 显著降低带宽需求并提升计算效率 成为适配下一代国产芯片的关键创新 [10][11][19][20] - 国产AI芯片厂商如寒武纪、海光、沐曦等已布局FP8支持 软硬协同生态构建有望减少对国外算力依赖 提升行业竞争力 [23][24][33][34] 技术架构分析 - UE8M0 FP8由Open Compute Project定义 采用8位微缩块格式 通过分块缩放因子扩展动态范围数十倍 [8][10][11] - UE8M0格式无符号位和尾数位 全部分配8bit至指数位 处理器复原数据仅需移动指数位 无需浮点乘法或舍入逻辑 [14][19] - 相比传统FP32缩放 UE8M0使32个FP8数据仅追加8bit缩放因子 节省75%流量 显著优化带宽和功耗 [24] 国产芯片厂商动态 - 寒武纪早盘股价大涨近14% 总市值超4940亿元 跃居科创板首位 其MLU370-S4及思元590/690系列均支持FP8计算 [4][29] - 海光深算三号DCU、沐曦曦云C600、中昊芯英"刹那"TPU及摩尔线程MTT S5000均已支持FP8精度计算 [23][32] - 华为昇腾路线图显示2025Q4将支持原生FP8 预计2026年推出的新品可能成为"下一代芯片" [30] 产业生态影响 - 半导体ETF半日大涨5.89% 科创50指数涨3%创近三年半新高 芯片产业链集体走强 [4][31] - DeepSeek与15家厂商联合验证UE8M0格式 包括中国电信、昆仑芯等8家通过大模型适配 构建统一软硬协同生态 [23][27][34] - 技术升级提升国产芯片"性价比" 同等硬件可运行更大模型 实质性减少对英伟达、AMD等国外算力依赖 [33][34]
上半年:台积电营收4258亿元,中芯国际320亿元,差距扩大至12倍
搜狐财经· 2025-08-12 12:23
业绩表现与行业差距 - 中芯国际上半年营收达320亿元人民币[1] - 台积电同期营收为4258亿元人民币 两者差距达12倍[1][3] 技术瓶颈与设备限制 - 高端芯片制造依赖EUV光刻机 该设备仅荷兰ASML能生产[3] - 台积电凭借EUV设备获得全球90%高端芯片订单 其四分之三利润来自高端芯片[3] - 中国大陆企业受《瓦森纳条约》和美日荷协议限制 无法获取EUV设备及零件[5] - 中芯国际被迫专注于14纳米以上成熟工艺芯片 该领域价格较低且利润较薄[5] 光刻机技术复杂度 - EUV光刻机包含10万个精密零部件 涉及全球上千家供应商[7] - 核心技术由美国英特尔和AMD主导开发 ASML专利占比仅2.63%[7] - 全球EUV专利分布:日本45% 美国30% 德国9% 中国3.54%[7] 国产化突破进展 - 中国预计三五年内实现自主EUV光刻机突破[7] - 采用DUV光刻机结合芯片堆叠技术已实现7纳米芯片制造[10] - 华为麒麟9000S/9010芯片和昇腾910B处理器已实现商用[10] - 长江存储计划2023年下半年推出100%国产化芯片[12] 产业链本土化成果 - 设计软件由华大九天实现国产化[12] - 芯片设计由华为海思和阿里平头哥完成突破[12] - 芯片制造由中芯国际实现自主可控[12] - 封装技术达到3纳米水平(长电科技)[12] 战略布局与发展规划 - 中国正加速扩张成熟工艺产能 目标2030年成为全球最大成熟工艺制造基地[9] - 通过成熟工艺市场积累和技术迭代实现产业升级[9][10] - 完整国产芯片产业链已实现全线贯通[12]
老黄又又又把中国车企坑了,还是看看远处的自研芯片吧
36氪· 2025-07-30 12:30
英伟达Thor芯片跳票事件 - 英伟达Thor智驾芯片因设计问题导致良率低下而跳票 黄仁勋承认是公司问题[1] - 量产时间从2024年底推迟 目前未通过车规级认证 预计还需四个月才能上线[1] - 算力从承诺的2000 TOPS缩水至700 TOPS 实际测试仅500 TOPS 低于双Orin X的500 TOPS水平[3] 车企受影响情况 - 小鹏P7+和G7原计划搭载Thor 首次跳票后P7+改用双Orin X[5] - 小鹏G7为按时发布紧急切换自研图灵芯片 仅Ultra版本搭载三颗图灵芯片[7][8] - 理想因Thor缺失无法部署40亿参数体量的VLA模型 影响道路识别和可视化功能[9] - 理想转向自研"舒马赫"芯片 预计2026年第一季度上车[11] 自研芯片发展现状 - 蔚来2021年启动自研 2023年底发布5nm制程天玑NX9031 单颗算力1000 TOPS 已搭载2025款车型[17] - 小鹏自研图灵芯片采用7nm工艺 单颗算力750 TOPS G7 Ultra搭载三颗 支持300亿参数本地大模型[19] - 理想自研"舒马赫"芯片采用5nm制程 单颗算力1200 TOPS 因流片稳定性问题曾转投Thor[20] - 华为昇腾910B采用中芯国际等效7nm工艺 在MDC 1000平台实现1000 TOPS算力 支持L3级辅助驾驶[20] - 零跑 比亚迪 地平线 黑芝麻 Momenta等厂商均有自研芯片计划或产品[23] 行业影响与趋势 - 英伟达因跳票事件股价下跌超8% 市值蒸发2700多亿美元[13] - 自研芯片可增强车企垂直整合能力 优化模型分配算力 避免供应链风险[30] - 芯片设计制造能力需长期积累 涉及车规级标准制定权[32] - Thor延期为国产芯片厂商提供追赶窗口 避免技术倾销导致的市场挤压[32]
国产大模型与AI芯片联盟,意义有多重大?
观察者网· 2025-07-30 12:03
模芯生态创新联盟成立 - 10家国产大模型、AI芯片和算力加速企业联合成立联盟,探索从大模型开发阶段适配国产AI芯片[1] - 联盟首批成员包括华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程、硅基流动等近10家厂商[3] - 上海企业在联盟中占据半壁江山,体现上海高科技产业软硬结合与产业链一体化优势[1][23] 阶跃星辰Step 3模型突破 - 发布新一代多模态推理大模型Step 3,在国产芯片上推理效率最高达DeepSeek-R1的300%[3][8] - 基于NVIDIA Hopper架构芯片分布式推理时,实测吞吐量较DeepSeek-R1提升超70%[8] - 采用多矩阵分解注意力(MFA)架构,键值缓存用量较DeepSeek多头注意力机制降低93.7%[13] 国产芯片适配策略革新 - 颠覆传统开发顺序,在模型开发阶段主动适配国产芯片特性,避免硬件滞后于模型迭代[10] - 针对国产芯片制程工艺和HBM性能相对落后的现状,优化算法设计[10] - Step 3算术强度特性与昇腾910B高度匹配,解码效率超过华为盘古Pro MoE模型[11] 国产芯片训练挑战 - 国产芯片适配主要集中于推理环节,训练环节仍存在显著困难[15] - 国内最大全国产算力集群为科大讯飞与华为共建的"飞星二号",达万卡级别,总算力仍逊于英伟达集群[16] - 无问芯穹与上海算法创新研究院基于3000卡沐曦GPU集群,实现百亿参数模型600小时不间断训练[16] - 需重构底层工具链以适配不同芯片架构,工具链开发人才稀缺[17] 多模态技术商业化前景 - 多模态被视为下一代技术突破方向,基础架构创新空间较大[20] - 阶跃星辰预计2024年营收达10亿元,对比智谱同年收入约2-3亿元且亏损20亿元[22] - 已发布十余款多模态模型,覆盖语音、视觉、图像编辑、视频生成等垂直领域[22] - 智能终端Agent覆盖超一半头部国产手机厂商,与吉利合作实现端到端语音大模型首次量产上车[22] 上海AI产业生态优势 - 上海人工智能企业达24733家,较上年增长5.1%,新增注册资本超1000万企业104家[24] - 坐拥中芯国际、华虹等晶圆厂及长三角HBM先进封装产能,支撑GPU产业发展[24] - 上海模速空间孵化器日均Token调用量突破100亿[24] - 国有资本积极参与早期投资,如上海国投先导基金投资壁仞科技及阶跃星辰[24]
国产AI算力的“阶跃”时刻
观察者网· 2025-07-30 09:26
国产算力芯片生态发展 - 四家国产算力芯片领军企业创始人罕见同台对话 凸显行业协同趋势[1] - 阶跃星辰联合近10家芯片及基础设施厂商发起"模芯生态创新联盟" 首批成员包括华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯等[3] - 上海企业在模芯联盟中占据半壁江山 2024年上海人工智能企业达24733家 较上年增长5.1% 新增注册资本1000万及以上企业104家[17][18] 阶跃星辰Step 3模型突破 - Step 3在国产芯片上推理效率最高达DeepSeek-R1的300% 在NVIDIA Hopper架构芯片上吞吐量提升超70%[3][6] - 采用多矩阵分解注意力机制(MFA) 较DeepSeek的多头注意力机制(MLA)降低键值缓存用量93.7% 对国产芯片更友好[11] - 模型开发阶段主动适配国产芯片特性 在算术强度特性上与昇腾910B高度匹配[8] 多模态商业应用落地 - 阶跃星辰预计2024年全年营收达10亿元 对比智谱2024年收入约2-3亿元[13] - 多模态模型覆盖国内超一半头部手机厂商 与吉利合作实现端到端语音大模型首次量产上车[15] - 已发布十余款多模态模型 包括Step系列基础模型及语音、视觉理解、图像编辑等垂直模型[15] 硬件适配系统化创新 - 阶跃星辰将模型与硬件视为协同系统 在昇腾910B上解码效率超过华为盘古Pro MoE模型[9] - 模芯联盟旨在建立产品开发进度同步机制 未来可能提前获取芯片设计信息[12] - 国产芯片制程工艺和HBM性能相对落后 需在算法设计层面进行调整优化[8] 上海AI产业发展优势 - 上海坐拥中芯国际和华虹等主要晶圆厂 HBM所需先进封装产能多位于长三角[18] - 上海模速空间日均Token调用量突破100亿大关 基于3000卡沐曦GPU集群实现600小时不间断训练[18] - 上海国投先导人工智能产业母基金首投壁仞科技 生态体系将参与阶跃星辰最新融资[18]
H20芯片解禁,怎么看?
人民日报海外版· 2025-07-21 22:27
链博会创新展示 - 第三届中国国际供应链促进博览会以"链接世界、共创未来"为主题,首次设置创新链专区和"链博首发站"新品发布专区,展示全球供应链关键环节的新产品、新工艺、新场景、新生态 [2] - 数字科技链展区展示人形机器人表演太极拳等创新技术 [2] - 四川省遂宁经开区利普芯微电子生产的芯片广泛应用于工业控制、汽车电子、新能源等关键领域,为相关产业发展提供动力 [4] 英伟达H20芯片解禁 - 美国政府批准英伟达专为中国市场设计的H20芯片恢复对华出口,该芯片性能远低于国际市场主流H100 [4] - 禁令期间英伟达因H20滞销面临45亿美元库存损失,计提55亿美元减值,市值一度蒸发1600亿美元 [4] - 解禁后H20芯片单价约1.2万美元,将成为中国人工智能产业的"算力救急包" [10] 中美芯片产业竞争格局 - 中国国产芯片崛起,华为昇腾910B性能已在部分领域超过H20,百度、腾讯加速替代方案测试 [12] - 英伟达在中国市场份额从四年前的95%降至50%,腾出的空间被华为昇腾、百度昆仑芯、寒武纪等本土厂商占据 [12] - 摩根大通报告显示2024年中国芯片自给率达34%,预计2027年将提升至82% [13] - 中美芯片产业正走向"分层竞争":中低端产品在同一市场正面竞争,高端赛道各自形成独立标准与生态系统 [13] 中国芯片产业发展策略 - 短期策略聚焦与国产芯片厂商合作,减少单一来源依赖,通过模型压缩等技术提升"次高端"芯片性能 [14] - 中长期布局应全链条联合攻关,华为正在验证"兼容CUDA"的可行性,降低开发者迁移成本 [15] - 核心技术自主突破是摆脱"卡脖子"困境的基础,需在芯片架构、制造工艺及AI指令集上实现原创性突破 [16] - 产业生态构建是关键,需打造自主开发工具链与软件生态,增强市场黏性与技术扩散力 [16] 人工智能技术发展 - 中国AI模型Kimi K2发布后引发轰动,在编程方面表现出色,采用开源协议发布,定价显著低于主流闭源模型 [19][20] - Kimi K2总参数规模达万亿级别,采用混合专家架构,每次任务仅动态激活320亿参数,有助于控制所需算力 [20]
H20芯片对华解禁,是利好还是新陷阱?我们和NVIDIA前专家聊了2小时,答案全在这里
36氪· 2025-07-17 10:05
H20芯片技术分析 - H20芯片并非简单阉割版H100 而是通过外科手术式精准限制实现性能控制 [4] - 算力密度限制:FP16算力296 TFLOPS 仅为H100(1979 TFLOPS)的15% [6] - 互联带宽限制:NVLink带宽从900GB/s腰斩至400GB/s 严重影响大模型集群训练效率 [6] - 内存配置特点:96GB HBM3内存容量超过H100 但4.0TB/s带宽略低于H100的4.8TB/s [7][8] 地缘政治博弈 - 2022年10月美国首次禁售A100/H100 英伟达推出特供版A800/H800应对 [10] - 2023年10月禁令升级封杀A800/H800 催生H20系列设计 [11] - 2024年4月H20对华销售受阻导致英伟达季度损失超百亿美元 [12] - 2025年7月解禁体现美国政府转向"小院高墙"策略 在核心技术领域保持封锁 [13] 中国市场影响 - 对中小AI企业:H20提供稳定供应 降低推理和垂类模型训练成本 [14][15] - 对头部企业:400GB/s带宽限制大规模集群训练 迫使转向应用落地而非基础模型竞赛 [15] - 促进产业分化:应用层AI(医疗/教育/电商)迎发展 基建层加速国产芯片(如昇腾910B)替代 [15] - 刺激国产化进程:华为昇腾生态已覆盖4000+合作伙伴 涉及金融/制造等领域 [15] 战略定位分析 - H20设计目标:在遵守美国管制红线同时 性能略超国产旗舰保持商业竞争力 [8] - 英伟达战略考量:通过H20维持CUDA生态完整性 避免完全失去中国市场 [13] - 长期影响:可能推动中国AI转向软件栈优化和算法创新 形成差异化发展路径 [15]