Workflow
雷峰网
icon
搜索文档
不用GPU,大模型每2秒吃透一道高数大题!这就是华为的实力
雷峰网· 2025-05-30 09:48
华为昇腾与Pangu Ultra MoE技术创新 - 公司通过"昇腾+Pangu Ultra MoE"组合实现国产算力与模型全流程自主可控训练闭环,集群训练系统性能达行业领先水平[4] - 预训练阶段昇腾Atlas 800T A2万卡集群MFU提升至41%,后训练阶段单CloudMatrix 384超节点吞吐达35K Tokens/s[5] - 首次披露高效打通大稀疏比MoE强化学习后训练框架的关键技术,推动RL后训练进入超节点集群时代[6][7] MoE模型训练技术痛点与解决方案 - 当前MoE训练存在六大挑战:并行策略配置困难、All-to-All通信瓶颈、系统负载不均、算子调度开销大、训练流程管理复杂、大规模扩展受限[10][11] - 公司提出三阶段解决方案: - 提升训练集群利用率:通过智能并行优化、分层All-to-All通信去冗余、EDP全局负载均衡策略,将专家并行通信开销降至<2%[14][18][19] - 释放昇腾单节点算力:采用昇腾亲和算子加速、Host-Device协同下发优化、Selective R/S内存手术方案,实现MBS翻倍和70%激活值内存节省[22][25][27] - RL后训练创新:RL Fusion训推共卡技术支持多维并行策略动态切换,准异步机制StaleSync使训练吞吐提升50%[28][30] Pangu Ultra MoE模型性能突破 - 模型架构:7180亿参数,61层Transformer(3稠密层+58 MoE层),256路由专家+1共享专家,隐层维度7680[35] - 预训练性能:6K-10K卡昇腾800T A2集群实现8K序列长度下41% MFU,预计CloudMatrix 384超节点可支撑MFU>50%[35] - 后训练性能:CloudMatrix 384超节点实现35K Tokens/s吞吐,支持4K卡集群扩展,等效每2秒完成高数大题级推理任务[36] 技术架构创新细节 - 并行策略:采用16路流水线并行+8路张量并行+32路专家并行+2路虚拟流水线并行的混合架构[15] - 通信优化:分层专家并行通信结合虚拟流水线并行掩盖策略,实现计算通信深度融合[18] - 内存管理:构建自适应内存优化框架,支持模块级到张量级的细粒度内存调配[26] - 训推协同:支持分离部署/训推共卡/全共卡三种模式,秒级完成状态转换[28][33]
拼多多CEO称反哺商家算长期投资,盈利能力或将持续受到影响
雷峰网· 2025-05-30 09:48
业绩表现 - 2025年Q1营业收入同比增长10%,低于市场预期6%,为过去两年最低季度同比增速[2] - 盘前股价跌幅一度超20%,开盘后盘中股价下跌17%[2] - 在线营销服务收入487.2亿元人民币(同比+15%),交易服务收入469.5亿元人民币(同比+6%)[5] - 销售及营销费用达334.0亿元人民币,超过2024年Q4的313.6亿元人民币[2] 业务挑战 - 国内主站增长模式从用户规模驱动转为购物频次驱动,受宏观消费情绪影响较大[5] - "优惠价格"优势不再独有,需追加平台直补(如100亿消费券)维持用户留存[6][8] - 竞争对手在618大促加码即时零售,威胁核心用户黏性[3] - 商家生态治理面临长期挑战,需为"低价"特点的商业生态现状买单[12] 成本压力 - 对商家补贴从2024年"百亿减免"升级至2025年4月"千亿扶持"计划[11] - 平台多数品类不收取类目佣金,保证金门槛低于竞争对手[10] - 供给侧成本压力大于消费侧,补贴措施显著挤压利润空间[2][10] 海外业务 - Temu收入增速降至个位数,仍处于早期亏损状态[5] - 2025年2月关税争端影响美国业务,5月起暂停全托管模式[15] - 转向半托管模式但商家留存率仅略高于10%[15] - 业务转型导致佣金收入减少,影响毛利润[16] 市场反应 - 市值约1390亿美元,较2021年峰值下降46.5%[12] - 股东难以接受牺牲利润空间补贴用户和商家的策略[11] - 与阿里巴巴、京东不同,公司明确表示不会回购股票[11]
独家丨华为云中国区总裁一职将迎新掌舵人,张修征换岗
雷峰网· 2025-05-30 09:48
" 华为云的变动或许还只是刚刚开始。 " 作者丨胡敏 编辑丨周蕾 雷峰网独家消息,华为云内部近期正在酝酿一波组织调整,华为云中国区总裁一职将迎来新的掌舵人,张 修征将会换岗。 据公开资料显示,在担任华为云中国区总裁之前,张修征曾在华为中国区电信系统部担任副部长,主要负 责国内的电信运营商,特别是中国电信,2020年,他调任华为云业务板块,成为华为中国计算业务总裁。 据知情人士透露,该调整还未完全落地,张修征对外职务仍然是华为云中国区总裁,只不过他已经在兼任 ICT相关岗位,而这种兼任,往往是换岗前奏。关于接任者,目前已有潜在人选,如想了解更多候选人信 息,欢迎添加微信 mindy1857 交流。 // 近期热门文章 智算业务能救「独立云厂商」吗? 增速18%背后:阿里云如何讲AI盈利故事? 分析师道破阿里股价下跌之谜:云业务增长不及买方预期 ...
传京东外卖百亿补贴减少力度:商家承担比例升至70-80%;要上市?宇树回应更名「股份有限公司」;北汽蓝谷严格执行末位考核淘汰制度
雷峰网· 2025-05-30 00:31
京东外卖补贴政策调整 - 京东外卖"百亿补贴"规则调整 商家承担比例从50%升至70%-80% 部分活动要求商家全额承担运费并提供低于日常折扣的供货价 [4] - 调整后"满11减10"活动中商家需承担7元补贴 平台仅承担3元 "满8减7""满6减5"等档位商家承担比例同样维持在70%-80%区间 [4] - 低价补贴带来短期"爆单"效应 但商家反映高比例成本转嫁侵蚀利润空间 连锁餐饮品牌负责人称长期超七成成本承担超出合理范围 [4] 字节跳动AI工具管理争议 - 字节计划自6月30日起分批次禁用Cursor、Windsurf等第三方AI开发工具 改用自研编程助手Trae 主要因员工通过个人账户使用导致数据沉淀风险 [7] - 内部通知引发研发人员强烈反对 部分员工表示若强制使用Trae宁愿放弃AI工具 公司随后致歉并补充说明符合条件的外部工具仍可申请使用 [7] - 禁用标准为第三方工具需符合法律法规且支持租户管理和数据管控 通过法务和信息安全评估后仍可继续使用 [7] 新能源汽车行业动态 - 北汽蓝谷一季度营收37.73亿元同比增长150.75% 净亏损收窄至9.53亿元 将降本增效定位为"一把手"工程 严格执行末位淘汰制度 [8] - 哪吒汽车上海总部logo被拆除 公司回应因场地到期搬迁 此前传闻logo花费5亿元遭前CEO澄清 实际设计费不足100万元 [14] - 理想汽车一季度营收259亿元居新势力首位 经调净利润10亿元 研发投入25亿元聚焦AI技术应用 现金储备达1107亿元 [15] 科技公司战略动向 - 宇树科技更名为股份有限公司 新增北京国有资本背景董事 创始人王兴兴曾表态考虑赴港上市 公司称变更为常规运营调整 [9] - Meta计划拓展实体零售网络挑战苹果 目前仅1家门店 去年测试快闪店效果 智能眼镜和AI投资成功推动硬件领域竞争 [19] - 小米汽车引入前一汽南京CTO陈光负责辅助驾驶感知 原负责人转岗机器人部门 陈光曾主导L4级Robotaxi研发 [16] 人工智能领域进展 - 英伟达Q1营收440亿美元同比增69% CEO黄仁勋称中国AI发展不受美国芯片限制影响 强调全球最大AI市场重要性 [19] - Anthropic推出Claude语音模式测试版 支持"Hey Claude"唤醒和文档图片讨论功能 免费用户月限20-30次对话 [21] - 影石创新三年研发投入超14亿元 累计获专利900项 其中发明专利189项 将自主研发设计作为核心竞争力 [17] 消费电子市场策略 - 荣耀新高管团队集体亮相 目标重返手机市场前三 400系列海外预售量超预期2-3倍 强调练好基本功而非设定具体KPI [10] - 京东与小红书深化"红京计划" 6月5日起开放"种草直达"功能 测试数据显示内容浏览转化率提升45% 加购转化率提升28% [15] - 大众中国CEO指出中欧电动车用户差异 中国车主平均年龄35岁以下偏好智能座舱 欧洲车主56岁更重实用性和实体按键 [21]
Pangu Ultra准万亿MoE模型:业界一流,源自昇腾原生的长稳训练
雷峰网· 2025-05-29 11:44
模型架构与训练方法 - 华为盘古团队发布Pangu Ultra MoE模型技术报告,披露准万亿MoE模型在昇腾NPU上的全流程训练细节 [1][4] - 模型采用256个路由专家,每个token激活8个专家,总参数量718B,激活量39B [5] - 引入Depth-Scaled Sandwich-Norm(DSSN)稳定架构和TinyInit小初始化方法,梯度突刺率下降51%,支撑10+T tokens数据长稳训练 [9][11][12][14] 硬件协同优化 - 模型隐藏维度设置为7680维,精准匹配DaVinci芯片的16×16 MatMul单元,充分发挥计算潜力 [7] - 采用61层Transformer结构并预留MTP层空间,优化流水线并行效率 [7] - 专家数量设为256(2^8),提升All-to-All通信效率,加速分布式训练 [7] 创新技术方案 - 提出MLA(Multi-head Latent Attention)注意力机制,压缩KV Cache空间,缓解推理内存瓶颈 [6] - 采用MTP(Multi-token Prediction)多头扩展策略,投机接受长度提升38% [23][25][27] - 使用Dropless训练策略避免Drop&Pad训推不一致问题,提升数据效率 [6] 负载均衡优化 - 提出EP-Group负载均衡方法,相比Micro-batch方案平均提升1.5个点 [16][18][19][20] - 该方法允许单个micro batch不均衡,但保证EP组内整体均衡,促进专家特化 [19][20] - 不同语言数据(阿拉伯语/德语/法语/俄语)对专家选择呈现显著差异 [22] 性能表现 - 在C-Eval、CLUEWSC、MMLU等多项基准测试中表现优于DeepSeek V3-0324等主流模型 [8] - 在AIME2024推理测试中得分81.3,优于DeepSeek R1的79.8 [8] - 数学能力测试MATH500得分97.4,表现突出 [8] 强化学习优化 - 采用迭代难例挖掘策略,从数据池筛选回复通过率(0,1)的数据保持训练效率 [29][32] - 设计多能力项奖励系统,数学/代码采用规则奖励,通用能力使用LLM-as-a-judge评分 [32] - 奖励函数进行归一化处理,确保模型在数学/代码/通用能力的协同提升 [32]
大卓智能将被整合,奇瑞智驾拥抱供应商
雷峰网· 2025-05-29 11:44
奇瑞自动驾驶业务调整 - 大卓智能将被整合进奇瑞研发总院,CEO谷俊丽或将离职,团队整体并入奇瑞上海研发中心,由张晓洪负责智能驾驶研发工作 [2] - 奇瑞自动驾驶业务将由高家兵统一管理,他现任奇瑞汽车总经理助理,此前与谷俊丽共同管理大卓智能 [2] - 大卓智能CTO曹光植继续负责奇瑞自动驾驶端到端技术研发,该方向被视为当前智驾战略核心重点 [2] 大卓智能发展历程与目标 - 大卓智能成立于2023年2月,专注于汽车自动驾驶领域,构建ADAS和高阶L4双线产品矩阵,目标打造百万辆级自驾解决方案 [2] - 2023年10月大卓智能首次对外亮相,奇瑞计划将其打造为内部自动驾驶技术品牌,与火星架构等并列成为5大技术基石 [3] - 成立半年后推出L2级辅助驾驶产品,并在星途瑶光、奇瑞瑞虎9两款车型上完成量产 [3] - 谷俊丽曾立下目标:2024年量产高速NOA,2025年量产全场景智驾,2025年大卓智驾装车量国内外市场各达100万辆 [3] 奇瑞智能化战略与挑战 - 奇瑞董事长尹同跃表示公司下一个20年要多吃智能化的"饭",2025年必须进入智能化头部 [4] - 奇瑞发布"猎鹰智驾"方案,计划2025年全品牌全系车型搭载,覆盖五大品牌30多款车型 [4] - 尹同跃曾点名批评大卓智能高管,表达对智驾量产进度不满 [4] - 内部研发进度不及预期,奇瑞转向依赖外部供应商方案 [5] 奇瑞与外部供应商合作 - 奇瑞与华为、阿里、科大讯飞、地平线、英伟达等共建协同创新生态 [5] - 轻舟智航获奇瑞与立讯精密1亿美元战略投资,负责中低阶智驾方案 [5] - 地平线与奇瑞达成HSD首个量产合作,HSD L2城区辅助驾驶系统将首发搭载于星途品牌,2025年9月量产 [5] - 其他智驾供应商还包括华为、博世、文远知行、卓驭、商汤绝影等 [6] 行业观察 - 传统主机厂孵化的智驾公司面临协同低效与行业淘汰赛加剧的双重压力,成长空间受限 [6]
618提前开打,一加选择押注「年轻人」
雷峰网· 2025-05-29 11:44
市场表现与销量 - 截至5月一加Ace系列累计销量突破1500万台 [2] - Q1季度一加13T开售10分钟销售额突破2亿元 两小时完成首销全天目标 [2] - 一加Ace5系列上市100天累计激活量突破160万台 [2] - 一加Ace5 Pro国补后降价400元至2599元区间 销量接近50万台 [6] - 一加13系列24GB+1TB高配版本占比达80% 首销半小时销量破10万台 [7] - 2025年Q1一加Ace5系列销量同比暴涨26% [7] 产品策略与技术 - 采用"高端旗舰+性能中端"双轨并行策略 [7] - 与联发科合作推出"电竞三芯"全链路芯片级解决方案 [2] - 天玑9400+单核性能提升35% GPU性能提升41% 功耗降低40% [3] - 引入PC级游戏评测标准"1% Low帧"优化游戏体验 [3] - 天玑9400e电竞处理器采用全大核设计 具备更大缓存和更强AI能力 [4] - 配备冰河散热系统和"风驰游戏内核"技术 [3][7] 价格与市场定位 - 一加Ace5至尊版定价2499元起 国补后2124.15元起 [4] - 一加Ace5竞速版售价1799元起 国补后1529.15元起 [4] - 产品覆盖1K-3K价格段形成互补 [4] - 在2000-4000元价格区间形成差异化竞争力 [7] 营销与社群建设 - 成为《和平精英》职业联赛官方比赛用机 [5] - 与《无畏契约手游》达成中国战略合作伙伴关系 [5] - 每周举办线下游戏活动 联合原神开启门店主题活动 [5] - 计划开展高考加油站活动和毕业Party原神专场 [5] - 邀请百位游戏主播带用户开黑并送出上百台手机 [5] - 售后体系并入OPPO以完善消费者体验 [7] 行业竞争 - iQOO频繁举办电竞大赛加强学生群体品牌宣传 [8] - 国补边际效益缩减背景下需探索新营销策略 [7][8]
华为发布L3商用方案后,嬴彻、智加们的日子还好不好过?
雷峰网· 2025-05-29 08:14
行业竞争格局 - 华为推出高速L3商用解决方案,获得11家车企支持,对干线物流自动驾驶公司形成竞争压力[10] - 理想汽车成立无人卡车项目组,由智驾感知负责人常黎领导[12] - 行业原已存在图森未来、小马智行、嬴彻科技、千挂科技等公司,但部分企业遭遇困境(图森转型游戏、千挂破产清算)[5] 智加科技发展现状 - 2024年处于净亏损状态,但控股方满帮集团持续追加投资[2] - 2024年底完成行业首个仓到仓全无人驾驶运营测试,路线覆盖复杂城区与多车道高速[2] - 2018年获全国首张营运货车自动驾驶路测牌照,2023年在苏台高速完成全球首次示范运营[2] - 中美团队分拆运营:美国团队30-40人,主要与亚马逊合作销售自动驾驶系统;中国团队由容力领导[4] 技术商业化难点 - 编队运输模式面临货物供应稳定性挑战,空载率影响成本效益[5] - L4级自动驾驶技术难度高且改造成本大,运输调度体系与人力资源配置问题尚未解决[5] - 嬴彻科技的L2+方案仅实现从4人减至3人,仍需补贴且未减少工作时间[6] 企业资本动态 - 智加科技2021年上市计划因滴滴事件暂停,2023年传出重启美股上市消息[2][5] - 嬴彻科技2025年考虑上市,2024年销售约2000台车辆,采用以租代售模式[6] - 九识智能2023年收入约1亿元,软件收费7000元/季度,正按15亿美元估值筹备港股IPO[7] 细分场景差异 - 矿山和末端物流是无人驾驶重卡发展较好的场景,九识智能的无人小车被定义为特种设备降低落地难度[6][7] - 货运平台布局自动驾驶具有防御性战略考量,满帮增持智加是为应对未来可能出现的无人化货运需求[9] 市场潜在变量 - 特斯拉FSD和华为ADS若进化至L4级别,将对市场格局产生重大影响[10]
AI的第二阵风,这两家企业迎上了
雷峰网· 2025-05-29 08:14
行业趋势与竞争格局 - AI行业进入艰难赛段,Chatbot类产品面临用户留存低和商业化困境,专精大模型的玩家开始战略收缩 [2] - "全家桶"式全栈布局的公司(如谷歌、百度)在行业洗牌中展现出更强势能,而单点突破的选手开始降速 [2][4] - 全球范围内采用"全家桶"思路布局AI生态的公司屈指可数,谷歌和百度是典型代表 [4] 公司战略与布局 - 谷歌通过I/O大会展示全栈能力,涵盖多模态大模型Gemini、AI Mode、智能体Project Mariner和Google Glass [2][3] - 百度推出文心4.5 Turbo和X1 Turbo,调用价格下降80%与50%,同时布局无代码工具、通用Agent、数字人等应用 [4] - 谷歌和百度均采用"高筑墙、广积粮、缓称王"的全栈战略,覆盖算力、模型、云平台和应用四层架构 [7][22][23] 技术优势与成本控制 - 谷歌第七代TPU单芯片峰值算力达4614TFLOPs,百度昆仑芯和百舸平台将AI推理训练成本大幅降低 [10][15] - 百度三万卡集群可同时承载多个千亿参数大模型训练,支持1000个客户进行百亿模型精调,训练效率超99.5% [15] - 百度文心千帆调用Deepseek模型比直接调用便宜50%-70%,成本优势显著 [15] 业务表现与市场反馈 - 百度云业务2025年Q1增速达42%,AI贡献三位数增长,经营利润率超10% [12][19] - 百度领跑大模型招投标市场,Q1中标19个项目、4.5亿元金额,位列通用大模型厂商第一 [20] - 资本市场看好全栈模式,"木头姐"Cathie Wood、桥水和富达等机构大幅增持百度 [14] 应用场景与商业化 - 百度文库AI月活用户达9700万,网盘AI月活超8000万,数字人慧播星在电商领域表现突出 [11] - 谷歌Waymo和百度萝卜快跑全球服务次数分别达1000万和1100万次,覆盖15个城市 [16] - Google Glass结合Gemini实现实时翻译和多模态交互,重现市场热度 [18] 行业启示 - 全栈布局的鲁棒性是穿越行业周期的关键,单一技术或产品难以在剧烈变化的市场中存活 [9][10][13] - 算力、模型、云平台和应用四层架构缺一不可,成熟AI生态需形成商业自闭环 [22][23] - 不偏科的全栈公司能在长跑中保持后劲,适应技术迭代和市场震荡 [24]
谁来为叶国富的IP梦买单?
雷峰网· 2025-05-29 00:20
名创优品Q1财报表现 - 公司Q1整体营收44.3亿元,同比增长18.9%,基本符合预期,但国内同店收入持续承压,海外门店和Toy Toy门店贡献主要增长 [2] - 受IP授权费用增加、海外直营店租金折旧等影响,利润率略有下滑,不及预期,财报公布后股价暴跌18%,多家券商下调目标价至40-45元区间 [3] 国内门店增长疲软 - 2024年起国内同店收入持续下滑,Q1下滑幅度为中个位数,较Q4有所收窄,疫情后线下消费恢复缓慢,电商产品重合度高导致竞争力不足 [5] - 加盟模式为主,加盟商抗风险能力弱,租金和人工压力下关店加速,Q1国内门店净减少111家至4275家,首次出现环比下滑 [5] 小店换大店战略 - 公司主动收缩小店规模,转向开设千万级大店,旗舰店和MINISO LAND等自营大店在一线城市落地,MINISO LAND以"超级IP+场景化集合店"为核心,年初至今新开5家至总数8家,另有15家在筹备 [6] - 大店面积达普通门店3-5倍,核心商业区房租成本高,海外直营大店模式推高销售费用,Q1海外门店量同比增长95%,销售费用同比增长50.7% [6][7] IP战略与潮玩业务 - 公司通过TOY TOY布局潮玩市场,Q1门店数280家(直营40家),收入3.4亿元(同比增长59%),但占总营收不足10%,客单价109.5元显著高于名创优品主品牌的38.1元 [13] - 主品牌IP联名产品溢价困难,客单价仅同比上涨0.5元,消费者仍以性价比为导向 [13][14] - 与泡泡玛特相比存在三大差距:IP设计精细度不足、搪胶公仔产能受限、缺乏出圈自营IP,但行业先发优势显著,Q1授权费用增加39.6%至营收占比约2% [15][16]