Workflow
雷峰网
icon
搜索文档
昇腾+鲲鹏双核暴击!华为打通MoE训练任督二脉再加速20%,内存省70%
雷峰网· 2025-06-04 09:31
华为MoE训练技术突破 - 公司通过昇腾与鲲鹏算力深度协同,实现训练算子计算效率和内存利用率大幅提升,MoE训练吞吐提升20%,内存占用降低70% [6][7] - MoE架构凭借独特设计成为突破大规模模型训练算力瓶颈的关键路径,支持千亿至万亿参数规模 [3][4] - 行业面临单节点训练效率挑战,包括算子计算效率低、专家路由机制导致下发中断、NPU内存不足三大难题 [10][13][16] 昇腾算子计算加速方案 - 针对占计算耗时75%的FlashAttention/MatMul/Vector三大核心算子,采用"瘦身术/均衡术/搬运术"优化策略,整体训练吞吐提升15% [19][20][21] - FlashAttention算子通过消除冗余计算和优化流水线,前/反向性能分别提升50%/30% [23][25] - MatMul算子通过双级数据流水优化,Cube计算单元利用率提升10% [26][28] - Vector算子融合细粒度小算子并减少数据搬运,性能提升3倍以上 [30][32] 昇腾-鲲鹏协同优化 - 通过Host-Device协同实现算子下发"零等待"(free时间占比<2%),训练吞吐额外提升4% [34][44] - 采用重排下发序技术使单次Host-Bound时间从2.1ms降至0.6ms,降幅超70% [39] - 自定义粗粒度绑核策略(每NPU绑24核)完全消除系统型Host-Bound瓶颈 [43] 内存优化技术创新 - Selective R/S技术实现多维度内存解剖,节省70%激活值内存 [46] - 建立细粒度重计算与Swap策略库,涵盖MLA/RmsNorm/Permute等模块的定制化优化 [50][52] - 采用贪心算法和Swap带宽竞争分析实现自适应内存优化管理,平衡内存节省与额外耗时 [56] 行业影响与成果 - 该方案为Pangu Ultra MoE 718B模型训练扫清障碍,展现公司在AI算力领域的技术积累 [58] - 技术突破包括集群通信优化、算子加速、内存节省三大维度,形成完整解决方案 [17][21][46] - 成果为行业大规模MoE训练提供参考路径,推动AI模型参数规模持续扩展 [4][59]
独家丨微软云中国数字原生事业部负责人田灼将升任亚太区高管
雷峰网· 2025-06-04 09:31
微软云组织架构调整 - 微软云大中华区副总裁田灼晋升至70级并调任亚太 负责亚太数字原生行业线 [2] - 田灼原负责的大中华区DN业务在亚太DN总营收中占比最大 是贡献最大的板块 [2] - 田灼此前曾在AWS和谷歌云工作 后加入微软云并组建DN部门 主要服务互联网大客户和游戏客户 [2] 微软云人事变动 - 田灼升迁后 原下属李萌有望接任其大中华区DN部门总经理职位 [3] - 李萌后续可能仍向田灼汇报 因大中华区DN部门可能并入亚太DN行业线 [3] 微软全球管理趋势 - 近年来微软在全球范围内持续收权 中国区部分财权 产品线和市场团队已陆续并入亚太 [4] - 从去年开始 微软云陆续将部分亚太国家的DN业务上收到亚太 [4] 行业动态 - 华为云中国区总裁一职将迎来新掌舵人 张修征换岗 [6] - 独立云厂商面临智算业务发展挑战 [7] - 云大厂在销售DeepSeek服务时面临五大拷问 [8]
英伟达:美国禁令逼走大量人才,大多去了华为;雷军辟谣YU7低价传闻,称小米汽车业务将在今年内盈利;华为云中国区总裁换人丨雷峰早报
雷峰网· 2025-06-04 00:44
贾跃亭与FF - FF去年三四月份濒临倒闭 90%以上内部人员认为公司要倒闭 目前情况较去年同期显著改善 [4] - FF去年面临股价暴跌至几分钱 资金紧张濒临破产等危机 董事会多次紧急商讨对策 [4] - 贾跃亭表示散户在危急时刻伸出援手 称通过未来1-2年战略目标实现可挽回投资者损失 [4] 蔚来研发管理变革 - 蔚来推行精细化管理研发投入 非必要项目不予立项 2025年初提报500多个项目仅约一半能立项 [6] - 公司成立成本委员会推动降本 研发立项会频繁讨论成本 部门需先评估可行性和资源再提报 [6] - 产研部门实施工时制量化员工贡献 员工需获取项目代码(code)才能推进工作 [6] 小米汽车与芯片进展 - 雷军辟谣YU7售价23.59万元传闻 称智驾研发投入达35亿元 汽车业务预计Q3-Q4盈利 [7] - 小米五年前开始研发机器人技术 汽车芯片正在研发中 将坚持硬件利润率控制在5% [7] - 玄戒芯片持续迭代 将覆盖高端产品线 15S Pro手机销量较前次数据翻倍 [11] 华为相关动态 - 华为云中国区总裁换人 陈林接替张修征 后者曾负责中国电信业务 [11][12] - 英伟达称美国禁令使大量原为其工作的中国AI研究人员转投华为 中国AI研究人员占比近全球一半 [20] 短剧行业变革 - 抖音集团合并抖音短剧与红果短剧商务团队 成立统一版权中心 向张超汇报 [12][13] - 版权中心将统一管理短剧创作者合作 优化早期分散版权管理模式 推动行业精品化 [12][13] 英伟达与芯片行业 - 英伟达为中国市场研发B30特供芯片 支持多GPU扩展 售价为H20的六折(6500-8000美元) [22][23][24] - 英伟达市值达3.45万亿美元超越微软 一季度营收441亿美元 因对华出口管制损失约80亿美元收入 [27] - 台积电称AI芯片需求强劲 未来十年前景"非常好" 关税或导致晶圆价格小幅上涨 [15] 智能硬件竞争 - Meta调整战略聚焦开发"Puffin"超轻薄开放式头显 重量不足110克 取消Quest 4升级计划 [26] - 宝马研发iDrive X系统 计划在副驾驶位添加屏幕 可能在5系改款或下一代X5首发 [13] 跨境电商与AI应用 - 速卖通韩国市场份额达85% 支付总额4.2万亿韩元 月活超越Coupang居第二 [29][31] - 阶跃星辰停运C端产品"冒泡鸭" 重心转向终端Agent 合并至"阶跃AI"产品线 [14] - OpenAI计划将ChatGPT打造成"超级助手"挑战Siri 强调新一代模型和代理工具开发 [20][21]
某大厂商业手段激进:套机密、拖欠货款、上特殊手段;元鼎重启割草机器人项目;字节称自己也能做AI眼镜丨鲸犀情报局Vol.12
雷峰网· 2025-06-03 09:55
某扫地机大厂商业手段争议 - 被曝以合作为名套取供应链技术机密,套取信息后内部消化[1] - 拖欠供应链货款数万元,导致合作破裂[1] - 内部派系斗争严重,核心高管流失,对离职高管采取特殊手段[1] 石头科技营销战略调整 - 疫情后海外市场受挫,原营销负责人程飞及团队因失误被换血[2] - 提拔技术背景人才转岗营销,认为管理能力可跨领域适用[2] - 全球布局调整:在韩国、美国等地成立合资销售公司,德国、法国设子公司[3] - 采取本地化销售+技术优势+顶级供应链的三重战略[4] 元鼎割草机器人项目动态 - 重启割草机器人项目,与方案商洽谈合作[2] - 此前放弃收购正浩项目因战略不清晰[2] - 组建"黄金阵容"团队:吸纳保时得整机人才、杉川成员及拓邦猛将[3] - 完成新一轮融资并与Fluidra合作,资金渠道优势明显[3] 纵贯创新割草机业务进展 - 遥控割草机器人众筹超百万美元,已售2000多台,单价3000美元[4] - 单月实现盈亏平衡,下一代产品计划转向全自动导航[5] - 被外网评为最适合复杂地形的割草机器人[5] 云鲸系割草机公司A困境 - 因刀片设计问题导致雨天割草效果差,产品回炉重造[5] - 2023年零收入零交付,2024年重启众筹[5] - 研发闭门造车导致北美市场水土不服[6] - 产品优势:割草性能强、爬坡能力好、速度快符合北美需求[6] 激光雕刻行业动态 - Xtool 2024年营收20亿,净利率超30%,保持70%-100%增速[7] - 700名服务人员占员工总数70%,专注解决用户技术问题[7] - 计划通过境外红筹架构清理老股东,筹备美股上市[7] 擦窗机器人市场格局 - 欧洲、俄罗斯、韩国为主战场,德国法国瑞士波兰需求旺盛[7] - 北美市场表现惨淡,科沃斯BS排名最高仅50名[7] - 欧洲用工成本高(200欧/小时)推动机器替代[7] - 英国因多雨天气需求低,俄罗斯市场以低端产品为主[8] 云鲸销售战略转型 - 从4000元高端产品转向推出七八百元中低端机型[8] - 全面开启下沉市场模式[8] 字节与逸文投资动态 - 字节因估值过高(3亿美元)放弃投资逸文,转向自研AI眼镜[6] - 逸文转投腾讯,预计三四季度有新融资[6]
专家一半时间在摸鱼?Adaptive Pipe & EDPB让昇腾MoE训练效率提升70%
雷峰网· 2025-06-03 07:17
MoE模型训练效率挑战 - 混合专家(MoE)模型通过动态路由机制分配token给不同专家网络,实现参数规模化扩展和复杂任务处理优势[2] - 分布式训练中存在两大效率瓶颈:1)专家并行引入计算与通信等待,导致50%以上训练时间浪费在空闲等待[3][4];2)负载不均导致热专家过载而冷专家闲置[4] - 问题类比为城市交通拥堵:1)人车混行阻塞(计算等待通信);2)车道分配僵化(静态专家分配)[4] AutoDeploy仿真平台 - 基于昇腾硬件的数字孪生平台,通过三维建模和高精度硬件映射,1小时内模拟百万次训练场景,实现90%精度的最优并行策略自动选择[8] - 针对Pangu Ultra MoE 718B模型,自动求解出TP8/PP16/VPP2/EP32并行方案,平衡计算/通信/内存[8] Adaptive Pipe通信优化 - 采用层次化All-to-All通信:分机器间数据收集和机器内高速交换两步,相比传统All-to-All加速1倍[10] - 自适应细粒度调度将流水线并行内存占用减半,实现98%以上EP通信掩盖,计算几乎不受通信等待束缚[11] EDPB负载均衡技术 - 专家预测动态迁移(E):通过多目标优化实现专家跨设备智能流动,具备预测先行/双层优化/智能触发三大特性[17] - 数据重排(D)和虚拟流水线均衡(P)分别解决Attention计算不均和混合结构层间等待问题[19] - 整体在最优并行基础上带来25.5%吞吐提升[14] 系统综合收益 - 在Pangu Ultra MoE 718B模型8K序列训练中,Adaptive Pipe单独提升37.5%,EDPB再提升25.5%,端到端总吞吐提升达72.6%[22][23] - 方案类比为智慧交通系统:通信掩盖相当于行人地下通道,动态迁移相当于智能可变车道[22]
上市一小时大定破万,小鹏MONA M03 Max想延续爆款神话
雷峰网· 2025-06-03 07:17
小鹏MONA M03 Max车型上市 - 小鹏汽车推出MONA M03 Max顶配版本,分为502km续航版(12.98万元)和600km续航版(13.98万元),同时新增515长续航Plus版(11.98万元)和620超长续航Plus版(12.98万元)[3] - 上市1小时内大定订单达12566台,Max版订单占比83%,超过去年同期表现[3] - Max版本延续基础版外观设计,但辅助驾驶等配置大幅升级,定价控制在15万元区间,性价比提升[6] 年轻化市场策略 - MONA M03连续8个月交付过万台,216天完成10万台生产下线,创新势力纯电车型最快记录[7] - 购买群体中90后和00后占比高,女性用户接近50%,年轻人与女性市场是基本盘[8] - Max版新增三色车漆,提供50多种官方改色方案,升级无边框外后视镜和18/19寸轮毂,强化颜值吸引力[9] - 发布会采用脱口秀形式,年轻艺人互动贯穿全场,贴近年轻人内容偏好[10] 智能化配置升级 - Max版配备双Orin-X芯片(算力508TOPS),新增1颗毫米波雷达和4颗摄像头,支持城市/高速NGP及泊车辅助[9][10] - 全球首发人机共驾功能,实现NGP与驾驶员操作无缝配合[10] - 公司宣称该车型是"15万以内唯一高阶智能辅助驾驶",能力对标50万级别车型[9] 定价策略与规模效应 - Max版起售价12.98万元,较去年参考价15.58万元显著下调,仅比标准版高1万元[12] - 基础款热销提升供应链议价权,规模化生产摊薄研发成本,一季度单车毛利1.6万元,毛利率同比增长15%[12] - 公司通过15万元普及高阶智驾,在10-15万元"智驾平权"市场竞争中建立差异化优势[13] 战略意义 - MONA M03 Max是公司向"全球AI汽车公司"转型的关键试探,试图重塑消费者对智能价值的认知[1][13] - 该车型将50万元级智驾能力下放至13-15万元区间,延长爆款周期并为品牌调整赢得时间[13]
家电「八角笼」:小米IN,谁OUT
雷峰网· 2025-06-03 00:48
小米集团2025Q1业绩表现 - 2025年第一季度营收1113亿元,同比增长47.4%,连续两个季度破千亿 [3] - 经调整净利润107亿元,首次突破百亿,同比增幅64.5% [3] - 智能大家电收入同比增长113.8%,远超行业平均水平 [4] - 空调出货量超110万台,同比增速超65%;冰箱出货量超88万台,同比增速超65%;洗衣机出货量超74万台,同比增速超100% [4] 小米家电业务战略升级 - 家电业务升级为集团战略业务 [2] - 目标三年内成为中国大家电市场前三 [2] - 采用ODM模式驱动的轻资产运营策略,实现产品高速迭代与品类扩张 [4] - 投资智能家电工厂转向深度掌控,形成轻与重辩证统一的商业模式 [4] 小米竞争优势分析 - 互联网基因实现"与用户做朋友",通过爆品策略和精准营销建立品牌认同 [5] - 智能生态优势显著,平台连接设备数达9.44亿台,同比增长20.1% [5] - 生态协同形成自增强循环,为家电业务提供持续扩张势能 [5] 传统家电巨头应对策略 - 美的采取"战略藐视、战术重视"策略,累计完成十几万字小米研究报告 [8] - 美的通过华凌子品牌下沉市场、COLMO高端品牌提升附加值的"双线狙击"方式 [11] - 格力加速多元化布局,线下"董明珠健康家"转型 [11] - 美的与海信达成战略合作,在AI应用、全球先进制造等领域深度协同 [6] 市场竞争格局变化 - 线上空调市场TOP3(美的系、格力、海尔系)合计份额67.79% [9] - 小米线上空调销量已跻身前三,但线下份额仅0.08% [11] - 华凌空调价格持续下探,形成对小米的直接压制 [12] - 格力空调价格跌破2000元,主动放低身段应对竞争 [12] 行业洗牌趋势 - 线上市场TOP3品牌份额达61.8%,较2023年增加4个百分点 [15] - TOP10之外品牌份额萎缩至5.76%,二线品牌面临生存危机 [15] - 行业资深人士判断"死掉的永远是围观者",二线及以下品牌最可能出局 [15] - 2024年中国家用空调销量18977万台,同比增长20.9%,内销9652万台,同比增长6.6% [15]
「L4级智驾龙头」驭势科技赴港IPO:三年亏损6.75亿元,难掩失血焦虑
雷峰网· 2025-06-03 00:48
行业背景 - L4级智驾公司迎来IPO热潮 深层原因是行业普遍存在增长焦虑 [1][16] - 自动驾驶创业已持续十年 前期投入大且回报周期长 多家公司面临老股东退出压力和对赌协议压力 [16] 公司财务与业务概况 - 驭势科技2022-2024年收益分别为6548 3万元 1 61亿元 2 65亿元 同期亏损2 5亿元 2 13亿元 2 12亿元 三年累计亏损6 75亿元 [2] - 核心业务为向机场 厂区企业及车企提供L4级自动驾驶解决方案 包括商用车 套件 软件及租赁服务 [2] - 差异化布局机场场景 合作覆盖17个中国机场和3个海外机场 正探索与全球4个机场合作机会 [11][12] - 厂区场景实现室内外无人化物流交付 服务汽车 化工 光伏 锂电池等行业 [13] 技术路线与竞争格局 - 早期采取"两条腿走路"策略:乘用车L2/L3量产+L4垂直场景(微公交 机场物流等) [4] - L2+乘用车方案合作失利:大陆集团因价格性能比放弃驭势黑盒算法 转向辉羲 [5] - 宇通合作中断:因公开道路技术储备不足 硬件资源短缺 竞对挖角 最终宇通选择文远知行开发"小宇2 0" [7][9] - 文远知行凭借宇通订单(单车售价200万元 售出上百辆)拿下广州公交集团50辆招标 为美股上市奠定基础 [10] 资本运作 - 2021年1月完成超10亿元融资 获国开制造业转型升级基金战略注资 [15] - 2023年3月完成3亿元融资 投后估值达73亿元 [15] 商业模式与运营细节 - 机场场景优势:需求量大 采购量多 24小时运营人力成本高 客户付费能力强 [11] - 厂区项目收款周期参考AGV行业(3:3:4) 部分客户要求10%保证金压一年 对现金流形成压力 [14] - "小宇1 0"售价150万元 与智慧城市项目捆绑销售 非单车出售 [9]
蔚来李斌:乐道人少了40%,交付量却暴涨40%;TikTok Shop印尼狂裁2500人;新势力5月战报公布丨雷峰早报
雷峰网· 2025-06-03 00:48
蔚来汽车 - 蔚来组织调整效果显著,乐道品牌一线员工减少40%但5月交付量增长40%,整体5月交付新车23,231辆同比增长13.1%,其中乐道交付6,281辆环比增长42.75%,萤火虫品牌首月交付3,680辆 [4][10] - 蔚来调整乐道管理层架构,原能源业务负责人沈斐接任总裁,研发和供应链部门直接向CEO李斌汇报,营销体系向总裁秦力洪汇报,以加速销量增长和跨部门协同 [4] - 蔚来累计交付量已达760,789辆,5月蔚来品牌交付13,270辆,乐道累计交付25,462辆 [4][10] - 蔚来法务部辟谣总裁秦力洪减持股票传闻,声明其持股数量零变动 [22] TikTok与商汤集团 - TikTok Shop在印尼裁员数百人,涉及物流、运营等多部门,员工总数从5,000人缩减至2,500人,下一轮裁员或于7月启动 [6] - 商汤集团联合创始人徐冰卸任执行董事及董事会秘书,转任AI芯片业务负责人,其持有公司3.07%投票权对应市值约5.1亿港元,杨帆和王征接任执行董事 [6][7] 造车新势力交付数据 - 零跑汽车5月交付45,067辆同比增长148.1%,连续三个月居新势力榜首,2025年累计交付173,658辆同比增160.83% [10] - 理想汽车5月交付40,856辆同比增长16.67%,时隔四月重返4万+水平,累计交付167,479辆 [10] - 小鹏汽车5月交付33,525辆同比增长230.43%,但环比下降4.34%,连续七个月超3万辆 [10] - 小米汽车5月交付超28,000辆,正为第二款车型YU7量产做准备 [11] 人工智能与科技动态 - 英伟达CEO黄仁勋称中国DeepSeek和阿里通义千问为最佳开源AI模型,警告出口限制或推动人才流向竞争对手 [8] - 周鸿祎宣称360"纳米AI超级搜索"在旅行避坑指南等场景超越DeepSeek,可自动调用浏览器和小红书等工具 [12] - 三星拟投资Perplexity AI并整合其搜索技术至设备生态,以减少对谷歌依赖,Perplexity正以140亿美元估值融资5亿美元 [35] - Neuralink完成6.5亿美元融资,红杉资本等参投,资金将用于开发生物智能与AI连接设备 [35] - 马斯克xAI启动3亿美元股权交易,估值达1130亿美元,合并X公司后共享AI资源 [36] 消费电子与互联网 - 大疆首款360度全景相机"Osmo 360"预计7月发布,支持8K拍摄,设计对标Insta360 X5 [14][17] - 京东外卖全职骑手突破10万人,日订单量达2,500万单,计划扩招至15万人 [17] - 新款极氪007改款谍照曝光,前脸设计接近007GT,4月销量3,999辆 [19][21] 特斯拉与苹果 - 特斯拉欧洲5月销量暴跌,葡萄牙同比降68%,挪威逆势增213%,主因车型老化和马斯克政治争议 [25] - 特斯拉印度建厂计划搁浅,或依赖进口,印度政府考虑将电动车关税从100%降至10% [25] - 苹果上诉欧盟DMA要求,称共享用户数据威胁隐私安全,Meta和谷歌等企业索要通知内容引发担忧 [28][30] - 苹果否认iPhone 17将更名为iPhone 2025,称年份命名会加速产品过时感 [24] 其他科技公司 - Meta计划用AI系统自动化评估90%产品更新风险,已投入80亿美元隐私计划 [33] - 微软继上月裁员6,000人后再裁300人,称需动态调整组织架构 [37] - 马斯克推出加密通讯应用XChat,支持音视频通话和消息自毁功能 [26]
「车圈恒大」?未免杞人忧天
雷峰网· 2025-06-01 14:35
核心观点 - 反驳"车圈恒大论",认为将中国新能源汽车行业与恒大危机相提并论缺乏事实依据,制造业与地产的底层逻辑完全不同[10] - 通过财务数据对比,证明中国主流车企的资产负债情况优于国外车企,不存在所谓的"车圈恒大"[6] - 强调中国新能源汽车产业整体保持良性发展,车企通过加大研发投入及基础设施建设促进技术创新和产能提升[21] 财务数据对比 资产负债率 - 2025年一季度,福特资产负债率84.3%,通用76.5%,而比亚迪70.71%、上汽71.2%、吉利68%,中国车企低于苹果(约80%)[13] - 2023-2025年一季度,比亚迪资产负债率从65.96%降至61.64%,吉利从68%降至61.64%[7] 负债结构 - 比亚迪总负债5800多亿元,但有息负债仅286亿元,占比5%;吉利有息负债860亿元(占比17%),上汽945亿元(占比15%)[13] - 国际车企有息负债占比普遍较高:丰田68%(1.8万亿)、大众32%(1万亿)、福特66%(1.1万亿)[14] 应付账款 - 比亚迪应付账款2440亿元,占营收31%;上汽2411亿元(占营收38%),吉利1824亿元(占营收32%)[16] - 付款周期:比亚迪127天,吉利127天,长城163天,上汽164天[16] 企业经营表现 比亚迪业绩 - 2024年营收7771亿元,净利润403亿元,研发投入542亿元,国内纳税510亿,现金储备1549亿元[6] - 2024年销量427万辆,全球排名第五;吉利334万辆,全球第十[8] 研发投入 - 中国车企研发投入占比普遍超5%,部分接近7%;海外传统车企研发投入持续收缩,部分降至3%以下[25] - 大众计划在中国市场投资25亿欧元强化研发,与小鹏汽车、上汽集团合作研发电动车型[25] 行业发展 市场表现 - 中国汽车品牌国内市场份额已超60%,新能源渗透率超52%[6] - 中国汽车连续两年出口全球第一,比亚迪等品牌在海外市场全面爆发[6] - 预计2025年中国新能源汽车销量达1650万辆,同比增长30%,占比超50%[28] 竞争格局 - 国内新能源车企保持15%-18%毛利率,海外传统车企因转型滞后盈利能力持续下滑[27] - 中国车企通过技术创新压缩制造成本,打造高性价比产品,促进产业良性发展[21]