软硬协同
搜索文档
“英伟达税”太贵?马斯克领衔,AI巨头们的“硅基叛逆”开始了
创业邦· 2025-09-11 03:09
文章核心观点 - AI巨头自研芯片的深层战略考量正改变产业估值逻辑和权力格局 远超解决芯片短缺和降低成本的表面动机 [9][10] - 推理成本将超越训练成本成为AI商业化最大瓶颈 自研芯片首先瞄准推理环节 [25] - 2026年晶圆产能争夺战将决定AI算力竞争胜负 考验供应链管理和资本实力 [27] 巨头自研芯片战略动机 - 摆脱性能枷锁:通过软硬协同实现极致性能功耗比 在数据中心节省数亿至数十亿美元电费和运营成本 [11][13] - 重构经济模型:将不可控运营成本转化为可控资本开支 改变长期成本结构并构建财务护城河 [14][16] - 构筑数据壁垒:芯片架构成为AI战略的物理化身 形成"数据-模型-芯片"正向飞轮固化竞争优势 [17] 半导体产业链格局变化 - 台积电成为AI时代产能分配核心:3nm工艺产能被苹果及Google Meta 亚马逊 微软等AI巨头瓜分 [19][21] - 英伟达面临围城之势:CUDA生态优势在封闭场景下被削弱 但迁移成本仍构成护城河 [22][24] - 博通成为隐形赢家:为巨头提供定制化ASIC芯片设计服务 深度绑定多家AI领军企业 [26] AI商业化趋势与产能竞争 - 推理成本占比将达80%-90%:AI应用生命周期总成本中推理成为持续性海量消耗 [25] - 2026年产能决战:台积电3nm/2nm产线将汇集苹果 英特尔 英伟达及AI巨头自研芯片 [27] - 供应链能力成为关键:产能绑定协议和预付款规模将决定算力落地能力 [27]
华为三折叠携麒麟9020亮相 折叠屏市场竞争迈向软硬协同阶段
21世纪经济报道· 2025-09-04 23:56
公司动态 - 华为于9月4日发布新款三折叠手机Mate XTs非凡大师 起售价17999元 搭载麒麟9020芯片 整机性能提升36% [1] - 新机展开屏幕尺寸10.2英寸 最薄处3.6毫米 采用天工铰链系统 配备复合超韧叠层结构和322cm² UTG玻璃提升耐用性 [4] - 搭载HarmonyOS 5.1系统 支持PC版WIND金融终端和WPS全量编辑功能 覆盖90%金融机构从业者 实现跨设备无缝切换 [5] - 支持应用窗口自由调节 多应用并行运行 文件跨应用拖拽 小艺知识库支持全局知识管理 [6] - 华为折叠屏累计出货量突破1000万台 成为首个达成该里程碑的中国品牌 [1] 市场表现 - 2025年上半年中国折叠屏手机出货量498万台 同比增长12.6% 华为以374万台出货量占据75%市场份额创新高 [1] - 华为第二季度重夺中国手机市场榜首位置 [3] - 全球首款三折叠产品上半年出货量逼近50万台 成为高端市场标杆产品 [6] 行业趋势 - 2025年全球折叠屏手机预计出货1983万台 同比增长6% 中国市场预计出货947万台 同比增长3.3% [7] - 中国自2023年起成为全球最大折叠屏市场 未来五年占比将稳定在40%以上 [7] - 硬件创新聚焦形态迭代 三折叠与阔折叠形态吸引更多厂商跟进 [1][6] - 行业竞争焦点转向软件生态和跨平台协同 大屏适配、办公场景拓展和AI融合成为新增长点 [8] - 折叠屏行业进入"形态创新与生态破壁"新阶段 未来将呈现"软件定义硬件"特征 [7][8]
华为三折叠携麒麟9020亮相,折叠屏市场竞争迈向软硬协同阶段
21世纪经济报道· 2025-09-04 12:33
公司动态 - 华为于9月4日发布新款三折叠手机Mate XTs非凡大师,起售价17999元,搭载麒麟9020芯片,整机性能提升36% [1][3] - 华为折叠屏产品在硬件设计上展开屏幕尺寸达10.2英寸,最薄处厚度仅3.6毫米,采用复合超韧叠层结构和322cm² UTG玻璃提升耐用性 [7] - 软件层面搭载HarmonyOS 5.1,支持PC级应用交互(如WIND金融终端、WPS)、多窗口自由调节及跨应用拖拽传输,并集成AI功能增强智能交互 [8] 市场表现 - 2025年上半年中国折叠屏手机出货量达498万台,同比增长12.6%,华为以374万台出货量占据75%市场份额 [3] - 华为自2019年以来累计折叠屏出货量突破1000万台,为国内首个达成该成就的品牌 [4] - 2025年全球折叠屏手机预计出货1983万台(同比增6.0%),中国市场预计出货947万台(同比增3.3%),华为以75%份额持续领先 [10] 行业趋势 - 折叠屏创新焦点从硬件轻薄化转向形态多元化,三折叠与阔折叠成为新方向,全球首款三折叠产品上半年出货量逼近50万台 [5][9] - 中国自2023年起成为全球最大折叠屏市场,未来五年占比将稳定在40%以上 [10] - 行业竞争从硬件迭代转向软件生态建设,大屏应用适配、AI融合及跨平台协同成为新增长点 [11] 技术演进 - 华为通过天工铰链系统实现铰链厚度优化,采用非牛顿流体材料提升屏幕可靠性 [7] - 鸿蒙系统通过分布式技术和AI驱动提升多端协同效率,支持金融、办公等生产力场景深度适配 [8][9] - 头部厂商聚焦铰链、屏幕、轻薄化及软件交互创新,推动行业进入"形态创新与生态破壁"阶段 [10][11]
量价齐升营收猛增67%,地平线机器人蝉联市占双冠奔赴“智驾世界杯”
每日经济新闻· 2025-08-28 11:00
财务业绩表现 - 2025年上半年营业收入15.67亿元,同比增长67.6%,创历史新高 [1] - 毛利润10.24亿元,综合毛利率65.4%,保持行业领先水平 [1] - 现金储备161亿元,为技术研发和市场拓展提供充足资金支持 [1] - 产品及解决方案业务收入7.78亿元,同比增长3.5倍 [3] - 软件及授权服务业务收入7.38亿元,同比增长6.9% [5] - 研发支出23亿元,同比增长62%,主要用于云服务资源和城区智能驾驶系统开发 [6] 业务运营数据 - 产品及解决方案出货量198万套,同比翻倍增长 [3] - 中高阶产品解决方案出货量98万套,激增6倍,占总出货量49.5% [3] - 中高阶产品贡献产品及解决方案业务超过80%的收入 [3] - 单车价值量大幅提升至去年同期1.7倍 [3] - 征程系列芯片累计出货量突破1000万套,成为国内首个跨过该里程碑的智能驾驶计算方案提供商 [9] - 产品解决方案已获得27家OEM(42个OEM品牌)采用,前十大中国OEM均为客户 [10] - 累计斩获近400项车型定点,其中具备高速公路辅助驾驶及以上功能的定点超过100款 [10] 市场地位与行业趋势 - 在中国自主品牌辅助驾驶计算方案市场份额攀升至32.4% [10] - ADAS前视一体机市场份额达到45.8%,蝉联双市场份额榜首 [10] - 2025年上半年中国乘用车市场辅助驾驶渗透率首次突破60% [1] - 自主品牌车企市场份额占据中国乘用车市场63%以上 [5] - 自主品牌辅助驾驶渗透率从2024年底51%上升至2025年上半年59% [5] - 搭载中高阶辅助驾驶功能的车辆占所有智能汽车销量比重从2024年底20%上升至2025年上半年32% [5] 技术发展与产品创新 - 新一代产品征程6系列量产推动中高阶产品解决方案出货量大幅增长 [3] - HSD系统以征程6P为硬件基座,算力高达560TOPS,采用一段式端到端架构 [7] - HSD系统实现从视觉感知到车辆控制的超低延时处理,提升实时响应能力与行车安全 [7] - 通过强化学习机制,HSD在复杂城区场景中表现出优秀决策能力和驾驶拟人性 [7] - HSD系统已确定全球首发搭载于星途E05车型,进入量产准备阶段 [9] - 获得多家车企10+款车型定点,进一步夯实智驾领域标杆地位 [9] 全球化进展与合作伙伴 - 与大众汽车集团、日本头部汽车集团等全球巨头达成深度合作,获得30个合资车型定点 [10] - 基于征程6B的解决方案获得两家国际车企海外车型定点,预计全生命周期交付量达750万辆 [10] - 与博世、电装、大陆等国际供应商巨头达成战略合作,构建面向全球的智驾产业生态 [12] - 中国智能驾驶技术正式获得全球主流市场认可 [10] 市场前景与增长预期 - 城市高阶智能驾驶(NOA)市场规模2025年有望接近550亿元,2027年或将破千亿元 [5] - 中国10万元以上乘用车市场占整体销量约80%,规模接近2000万辆,为智能驾驶系统提供广阔渗透空间 [9] - 未来2到3年内,HSD系统年出货量有望达到数百万套级别 [9] - 高阶智能驾驶系统将在未来2到3年内逐渐成为市场标配,10万至15万元价位主力车型将全面标配城市工况NOA [3]
股价逼近茅台,寒武纪还能走多远?
虎嗅· 2025-08-28 00:06
核心观点 - 寒武纪股价因DeepSeek发布适配国产芯片的FP8技术标准而暴涨 市值突破5800亿元并超越中芯国际 但公司基本面与估值存在显著落差 市盈率达4010倍 盈利可持续性及生态建设面临挑战 [1][3][5][15] 市场表现与估值 - 2025年8月22日寒武纪股价单日涨幅20%达1243.2元 总市值突破5200亿元 8月25日再度大涨11.4%至1384.93元 市值逼近5800亿元 [1] - 公司滚动市盈率达4010倍 远超行业平均水平 高盛采用2030年盈利预测的远期估值折现法将目标价上调至1835元 [5] - 国产算力概念股集体暴涨 包括海光信息和中科曙光 市场将事件解读为产业链结构性利好 [4] 技术突破与产业意义 - DeepSeek于2025年8月21日发布V3.1大模型 提出UE8M0 FP8参数精度技术 专为下一代国产芯片设计 [1] - FP8为8位浮点数格式 相比FP16或BF16可减半内存占用与带宽需求 提升计算速度与能效 [2] - UE8M0格式牺牲尾数精度以扩大数值表示范围 适配国产芯片硬件逻辑 是软硬协同的优化方案 [2] - 标志AI产业从硬件追赶软件转向软件定义硬件 上游算法厂商主动定义国产硬件标准 可能打破英伟达CUDA生态壁垒 [3][4] 财务基本面 - 2025年Q1营业收入11.11亿元 同比增长4230.22% 归母净利润3.55亿元 实现扭亏为盈 [7] - 净利润中约7600万元为政府补助 1.2亿元为信用减值损失转回 核心业务经营利润约2.76亿元 [7] - 2020至2023年公司持续净亏损 自我造血能力仍处构建阶段 [8] - 前五大客户收入占比达85%至92% 客户高度集中 [9] - 经营活动现金流量净额为负 存货27.55亿元 预付款项9.73亿元 现金流承压 [10] 行业竞争与生态挑战 - 国内AI芯片厂商分为GPGPU路线(海光信息、沐曦等追求CUDA兼容)和自研架构路线(寒武纪、华为昇腾构建自主生态) [12] - 寒武纪云端产品思元590性能对标英伟达A100 软件栈包括NeuWare、MagicMind和BANG C [12] - 英伟达CUDA生态拥有全球数百万开发者及超80%市场份额 软件工具链成熟度远超国产MLU生态 [13] - UE8M0 FP8标准仅为生态建设起点 全面抗衡CUDA仍需长期突破 [14]
DeepSeek催化下,芯片带领沪指突破3800点
虎嗅· 2025-08-22 12:19
芯片板块市场表现 - 寒武纪股价20cm涨停,市值突破5000亿,股价超过1200元 [1] - 科创板芯片股全数上涨,科创芯片指数涨10.05%,科创芯片ETF飙涨11.92% [2] - 半导体板块领涨市场,海光信息、寒武纪、盛美上海20cm涨停,芯源微、杰华特、恒烁股份、中芯国际等多股涨超10% [6] - 寒武纪从七月份低点算起股价涨超一倍,年内涨幅超过80% [18] 行业指数与板块表现 - 科创芯片指数自4月8日低点以来累计涨幅高达46.62%,科创芯片ETF同期上涨49.28% [25] - 半导体板块一路高开高走,领涨市场主要芯片指数 [5] - 芯片、证券、小金属、教育、软件、稀土永磁等板块涨幅居前 [4] 技术催化与产业趋势 - DeepSeek发布DeepSeek-V3.1,使用UE8M0FP8Scale参数精度,针对下一代国产芯片设计 [8][9] - UE8M0是真实存在且已被工程实现的技术,用于下一代AI芯片中FP8计算的缩放因子,实现更小带宽、更低功耗、更高吞吐 [11] - 摩尔线程MUSA3.1GPU、芯原VIP9000NPU等2025H2首发的新款国产芯片已在宣传资料里列出"原生FP8"或"BlockFP8"支持,并与DeepSeek、华为等15家厂商联合验证UE8M0格式 [14] - 国产AI正走向软硬协同阶段,减少对英伟达、AMD等国外算力的依赖 [16] 公司动态与市场传闻 - 寒武纪已向台湾载板大厂景硕电子预定了大量订单,2026年规划产能达50万颗,公司全年营收有望突破100亿元 [19] - 寒武纪定增落地,海光信息和中科曙光合并,沐曦股份及摩尔线程科创板IPO受理 [20] - 腾讯在推理芯片供应渠道侧具备多种选择,有望依托华为、寒武纪、海光等国产厂商的推理芯片满足算力需求 [33] 业绩与成长性 - 科创芯片指数归母净利同比从2024年底的-6.9%提升至83.2% [34] - 科创芯片成份股2025年预期营收同比增速达24.93% [37] - 科创芯片指数的成长指标显著优于同类指数 [37] 资金配置与IPO进程 - 截至202501,科创板配置比例达16% [43] - 摩尔线程、沐曦的科创板IPO于6月底获上交所受理,长鑫存储于7月7日完成IPO上市辅导备案 [40] - 科创板或汇聚更多AI芯片佼佼者,进一步吸引资金配置 [41] 国产算力生态 - 科创板覆盖了从芯片到AI应用各类主流公司,尤其以芯片"设计-代工-封测"的完整产业链 [22] - 国产大模型迭代提速,Token使用量规模快速增长,阿里夸克APP等国产AI产品在月活榜单上占领大部分席位 [29] - 国产芯片重估的叙事是当前半导体周期框架无法约束的 [28]
DeepSeek一句话让国产芯片集体暴涨!背后的UE8M0 FP8到底是个啥
量子位· 2025-08-22 05:51
文章核心观点 - DeepSeek V3.1发布采用UE8M0 FP8参数精度 引发市场对国产芯片技术升级和生态协同的高度关注 带动相关企业股价显著上涨 [1][3][4] - UE8M0 FP8技术通过块级缩放和动态范围优化 显著降低带宽需求并提升计算效率 成为适配下一代国产芯片的关键创新 [10][11][19][20] - 国产AI芯片厂商如寒武纪、海光、沐曦等已布局FP8支持 软硬协同生态构建有望减少对国外算力依赖 提升行业竞争力 [23][24][33][34] 技术架构分析 - UE8M0 FP8由Open Compute Project定义 采用8位微缩块格式 通过分块缩放因子扩展动态范围数十倍 [8][10][11] - UE8M0格式无符号位和尾数位 全部分配8bit至指数位 处理器复原数据仅需移动指数位 无需浮点乘法或舍入逻辑 [14][19] - 相比传统FP32缩放 UE8M0使32个FP8数据仅追加8bit缩放因子 节省75%流量 显著优化带宽和功耗 [24] 国产芯片厂商动态 - 寒武纪早盘股价大涨近14% 总市值超4940亿元 跃居科创板首位 其MLU370-S4及思元590/690系列均支持FP8计算 [4][29] - 海光深算三号DCU、沐曦曦云C600、中昊芯英"刹那"TPU及摩尔线程MTT S5000均已支持FP8精度计算 [23][32] - 华为昇腾路线图显示2025Q4将支持原生FP8 预计2026年推出的新品可能成为"下一代芯片" [30] 产业生态影响 - 半导体ETF半日大涨5.89% 科创50指数涨3%创近三年半新高 芯片产业链集体走强 [4][31] - DeepSeek与15家厂商联合验证UE8M0格式 包括中国电信、昆仑芯等8家通过大模型适配 构建统一软硬协同生态 [23][27][34] - 技术升级提升国产芯片"性价比" 同等硬件可运行更大模型 实质性减少对英伟达、AMD等国外算力依赖 [33][34]
高性能计算群星闪耀时
雷峰网· 2025-08-18 11:37
高性能计算(HPC)与大模型发展 - 高性能计算是大模型训练的核心基础设施 没有高性能计算就没有大模型[2] - HPC技术在大模型时代扮演降本增效的关键角色 通过软硬协同优化可显著提升训练效率[3][4] - 中国HPC发展经历了三个阶段 从自研计算机到采购工作站再到自研处理器构建超算[4] 清华高性能计算研究所 - 清华高性能所是中国HPC研究的先驱 率先采用工作站集群方案打破美日垄断[4] - 研究方向从硬件转向软件优化 在计算/存储/通信三大领域积累深厚经验[5] - 培养了大量顶尖人才 包括华为海思首席科学家/网易有道CEO等产业界精英[16] 存储技术创新 - 郑纬民团队突破大规模SAN存储技术 将产品价格大幅降低[13] - 提出云存储概念并开发国内首个云计算平台"清华云"[13] - 陆游游团队开发的SuperFS文件系统夺得IO500全球存储榜首[63] 大模型训练优化 - 开发"八卦炉"训练系统 支持174万亿参数MoE模型在国产超算上运行[37] - 推出全球首个开源MoE训练框架FastMoE 训练效率提升显著[41] - SmartMoE系统采用动态并行策略 进一步优化稀疏模型训练[42] 推理系统创新 - Mooncake系统实现KVCache共享 节省GPU算力消耗[55] - KTransformers系统实现CPU/GPU协同推理 降低显存需求[57] - "赤兔"推理引擎支持国产芯片 性能优于主流开源方案[44] 国产芯片生态建设 - 清程极智专注国产芯片编译优化 支持华为/沐曦等十余家厂商[86] - 开发九源智能基础软件栈 实现跨硬件平台适配[96] - 目标是用国产芯片训练国际一流大模型 突破算力瓶颈[85] 新兴计算方向 - 张悠慧研究类脑计算 提出类脑计算完备性理论[74] - 开发通用类脑编译器 解决软件碎片化问题[77] - 汪东升团队发现多个处理器安全漏洞 推动硬件安全防御[81]
软件ETF(515230)涨超2.0%,AI技术变革驱动行业估值重塑
每日经济新闻· 2025-08-11 07:08
华为AI战略与技术创新 - 公司正通过从大模型设计到基础设施的软硬协同构建全栈AI竞争力[1] - AI策略从对标业界SOTA模型转向为自研昇腾硬件定制模型架构[1] - Pangu Pro MoE采用分组专家混合(MoGE)架构解决负载不均衡问题[1] - Pangu Ultra MoE通过系统级优化适配昇腾硬件[1] - 新一代AI基础设施CloudMatrix通过统一总线网络构建分布式高速内存池[1] - 降低跨节点通信差异并支持PDC分离架构等软件创新[1] - 大模型转向混合专家(MoE)稀疏架构后聚焦解决专家负载不均衡系统性瓶颈[1] - 软硬协同路径已从单纯硬件或算法问题拓展至AI系统工程领域[1] 软件ETF产品信息 - 软件ETF(515230)跟踪软件指数(H30202)[1] - 指数从市场选取涉及软件开发、系统集成及互联网服务等业务的上市公司证券[1] - 反映软件行业相关上市公司证券的整体表现[1] - 指数成分涵盖应用软件、系统软件等信息技术领域细分行业[1] - 体现软件服务企业的技术创新能力和市场成长性[1] - 无股票账户投资者可关注国泰中证全指软件ETF联接A(012636)和C类(012637)[1]
大模型进入万亿参数时代,超节点是唯一“解”么?丨ToB产业观察
钛媒体APP· 2025-08-08 09:57
模型发展趋势 - 企业级应用侧小参数模型成为落地最佳选择 通用大模型参数进入万亿时代 [2] - MoE架构驱动大模型参数规模提升 如KIMI K2开源模型总参数量达1.2万亿 每个Token推理仅激活32B参数 [2] 算力系统挑战 - 万亿参数模型训练算力需求激增 GPT-3训练需2.5万张A100 GPU运行90-100天 万亿模型需求可能达数十倍 [3] - 模型并行和数据并行导致跨节点通信开销大 GPT-4训练算力利用率仅32%-36% 受显存带宽限制 [3] - MoE模型训练稳定性挑战大 梯度范数频繁突刺 KV cache存储需求呈指数级增长 [3] 显存与计算需求 - FP16格式下万亿参数模型权重需20TB显存 动态数据需求超50TB GPT-3需350GB显存 万亿模型需2.3TB [4] - 长序列训练使计算复杂度平方级增长 2000K Tokens训练加剧内存压力 [4] - MoE路由机制导致专家负载不均衡 部分专家过度使用成为瓶颈 [4] 解决方案与技术进展 - 阿里云提出全局负载均衡损失 使模型PPL降低1.5个点 [5] - AI技术方向从预训练转向推理 算力需求从训练侧转向推理侧 [5] - MoE架构分布式训练通信时间占比高达40% 需构建更大Scale Up高速互连域 [5] Scale Up系统优势 - Scale Out集群节点间通信瓶颈放大 InfiniBand时延达10微秒 Scale Up系统将数百颗AI芯片封装为统一计算实体 [6] - 并行计算技术如专家并行、张量并行可拆分模型权重与KV Cache到多芯片 [6] - 构建大规模Scale Up系统是解决万亿模型计算挑战的唯一可行路径 [6] 产品与架构创新 - 浪潮信息发布超节点AI服务器"元脑SD200" 支持64路本土GPU芯片 可单机运行1.2万亿参数Kimi K2模型 [7] - 元脑SD200采用多主机低延迟内存语义通信架构 支持多模型同时运行 [7] - 3D Mesh系统架构实现64卡P2P全互连 拓展跨域互连能力 [8][9] 软硬协同与未来方向 - 软硬协同是突破算力瓶颈核心路径 字节跳动COMET技术将MoE通信延迟从0.944秒降至0.053秒 [10] - 超节点功耗密度达兆瓦级 需软件适配动态功耗调节避免过热降频 [11] - Scale Up与Scale Out将同步发展 Scale Up成为大模型技术重点探索领域 [9]