软硬件协同

搜索文档
国产AI重磅!DeepSeek-V3.2发布!寒武纪、昇腾均已适配!国产芯片深度协同有望受益
新浪基金· 2025-09-30 01:30
9月29日晚间,DeepSeek宣布,正式发布 DeepSeek-V3.2-Exp模型。模型引入稀疏 Attention 架构,这种 架构能够降低计算资源消耗并提升模型推理效率。在新的价格政策下,开发者调用DeepSeek API的成本 将降低50%以上。 仅4分钟后,寒武纪表示,已同步实现对DeepSeek-V3.2-Exp的适配,并开源大模型推理引擎vLLM- MLU源代码。在业内人士看来,此种同步发布适配的动作,表明中国AI产业链头部公司正在进行深度 协同。 市场分析人士指出,DeepSeek-V3.2发布当天,寒武纪与昇腾均已实现适配。DeepSeek-V3.2最大的意义 在于软硬协同设计支持国产算力,全新DeepSeek Sparse Attention机制,叠加国产芯片的计算效率,可大 幅降低长序列场景下的训推成本,共同为客户提供极具竞争力的软硬件解决方案。day 0适配和优化彰 显了国产芯片的生态建设和技术积累成果,芯片和算法的联合创新,软硬件协同方式将进一步加速国内 AI产业发展。 申港证券认为,随着算力基础设施的持续投入,国产算力在模型侧和算力芯片方面或将持续突破,有望 维持较好景气度,展望 ...
腾讯云:全面适配主流国产芯片
财联社· 2025-09-16 03:02
腾讯云技术战略 - 腾讯云已全面适配主流国产芯片 [1] - 公司积极参与和回馈开源社区 [1] - 软硬件协同全栈优化为长期战略投入方向 [2] 算力服务能力 - 通过异构计算平台软件能力整合不同类型芯片 [2] - 对外提供高性价比AI算力服务 [2]
Deepseek V3.1的UE8M0 FP8和英伟达的FP8格式有什么区别
傅里叶的猫· 2025-08-24 12:31
DeepSeek V3.1引入UE8M0 FP8的意义 - DeepSeek V3.1发布引入UE8M0 FP8格式,针对下一代国产芯片进行优化,提前适配硬件以缩短部署时间 [2][11] - UE8M0是一种无符号8位指数、0位尾数的FP8编码格式,由Open Compute Project(OCP)提出,属于MXFP8规范的一部分 [7][8] - 该格式核心目标是数据压缩,相比FP32内存占用减少75%,推理吞吐量达到BF16的2倍,提升训练和推理效率 [7][13] UE8M0与英伟达FP8标准的差异 - 英伟达采用E4M3(精度优先)和E5M2(动态范围优先)FP8格式,依赖Tensor Core和专有软件优化 [7][10] - UE8M0侧重范围优先和兼容性,通过通道级校准和高精度累加(如FP16)弥补精度损失,适配国产芯片硬件架构 [10][11] - 国产芯片(如摩尔线程MUSA、芯原VIP9000 NPU)支持原生FP8,但底层计算单元与英伟达不同,直接套用国外标准可能导致数值溢出或计算故障 [9][12] 国产AI生态的战略价值 - UE8M0推动软硬件协同设计,DeepSeek提前与国产芯片厂商合作,实现"向前兼容",加速国产芯片从实验室到实际应用的落地 [11][12] - 摆脱对英伟达标准的依赖,避免国产GPU针对E4M3/E5M2优化效率低下,探索适合本土硬件的技术路径 [12] - 该方案并非追求超越英伟达,而是补位国产生态,使国产芯片达到接近国外FP8的效率水平 [14] 技术性能与局限性 - UE8M0在内存节省和推理速度上优势显著:内存占用较FP32降75%,推理吞吐量达BF16的2倍(例如单卡请求处理从100/秒提升至200/秒) [13] - 局限性包括:梯度累加等计算仍需BF16/FP16支持,本质为混合方案(FP8存储+16位累加);依赖芯片厂商底层优化,否则性能无法充分发挥;需精细校准数据防止极端数值误差 [15] 行业技术对比背景 - 英伟达B200芯片支持FP4/FP6,性能大幅提升:FP4算力达17,000 TFLOPS,较H100提升254%;B200功耗1,000W,系统功耗1,788W/GPU,内存带宽8,000 GB/s(较H100提升139%) [6] - 国产芯片需通过UE8M0等自主标准实现技术追赶,而非直接对标英伟达高端芯片规格 [12][14]
营收净利双双狂飙九号公司凭电动两轮车突围
36氪· 2025-08-06 02:35
资本市场表现 - 股价自2024年22元/股底部启动累计涨幅逾160%持续超一年 [1] - 2025年上半年财报发布后首个交易日股价放量上涨3.99%盘中最高涨8.8%显著跑赢科创50指数 [1] 财务业绩表现 - 2024年营业收入同比增长38.87%归母净利润大幅增长81.29% [1] - 2025年上半年营收达117.42亿元同比增长76.14%归母净利润12.42亿元同比增长108.45% [1][2] - 归母扣非净利润达13.12亿元同比增长125.32%连续多期跑赢营收增速 [2] - 归母净利率达10.57%较去年同期提升1.63个百分点较2024全年提升2.93个百分点 [2] 业务板块表现 - 电动两轮车营收68.23亿元同比增长101.7%占总营收58.23% [2][5] - 智能平衡车及滑板车营收21.8亿元同比增长37.23% [2] - 配件及其他产品营收22.01亿元同比增长约85% [2] 运营效率优化 - 存货周转天数降至41.26天应收账款周转天数降至21.57天较往年明显下降 [3] - 2025年上半年经营活动净现金流达36.53亿元远超净利润水平 [3] - 销售费用率从2024年上半年8.1%下降至2025年上半年7.6% [2] 电动两轮车业务发展 - 销量从2020年11.4万辆增至2024年259.89万辆2025年上半年达239.25万辆同比增长99% [5] - 中国市场历年累计出货量突破800万台其中百万台增量仅用64天刷新行业纪录 [5] - 国内专卖门店超8700家市占率从2023年2.7%提升至2024年4.2%并进一步增长至2025年上半年7.2% [6] - 2025年上半年毛利率达23.71%较2024年22.26%进一步提升 [7] 产品竞争优势 - 4000元以上高端SKU占比68%显著高于同业10%水平 [7] - 2024年4000元以上高端车型销量超60万台规模领先同业 [7] - 自研RideyGO智能车机系统实现感应解锁/智能龙头锁等功能 [9] - RideyFUN智驾系统支持投屏导航/来电显示/娱乐功能 [9] - RideyLONG长续航系统通过自研优化实现续航提升超20% [10] 研发与技术创新 - 2022-2025年上半年研发费用分别为5.83/6.16/8.26/5.22亿元呈上升趋势 [11] - 2020年以来累计研发投入超35亿元 [11] - 深度参与电池/电机研发电池开发主导全流程电机联合头部企业优化工艺 [10][11] 行业政策与生态布局 - 新国标修订版2025年9月实施要求增加北斗定位/通信监测功能加速中小企业出清 [13] - 国家以旧换新政策第四批690亿元资金支持消费品更新 [13] - 推出凌波OS短途交通全域操作系统实现跨品类算力协同与生态统一 [13][14] 估值水平 - 动态市盈率约24倍处于上市以来较低分位 [15] - 当前估值水平与盈利能力和增速相比仍有提升空间 [15]
营收净利双双“狂飙”,九号公司凭电动两轮车突围
36氪· 2025-08-05 02:52
资本市场表现 - 股价自22元/股底部启动累计涨幅逾160% 上涨行情持续超过一年 [1] - 2025年上半年财报发布后首个交易日股价放量上涨3.99% 盘中最高涨幅达8.8% 显著跑赢科创50指数 [2] 财务业绩表现 - 2024年营业收入同比增长38.87% 归母净利润大幅增长81.29% [2] - 2025年上半年营收同比增长76.14%至117.42亿元 归母净利润飙升108.45%至12.42亿元 [2] - 归母扣非净利润达13.12亿元 同比增长125.32% 连续多个报告期大幅跑赢营收增速 [3] - 归母净利率为10.57% 较去年同期提升1.63个百分点 较2024全年提升2.93个百分点 [3] - 经营活动净现金流达36.53亿元 远超净利润水平 [3] 业务板块表现 - 电动两轮车营收68.23亿元同比增长101.7% 占总营收比重58.23% [2] - 智能平衡车及滑板车营收21.8亿元同比增长37.23% [2] - 配件及其他产品营收22.01亿元同比增长约85% [2] 运营效率优化 - 存货周转天数41.26天 应收账款周转天数21.57天 较以前年度明显下降 [3] - 销售费用率从2024年上半年8.1%下降至2025年上半年7.6% [3] 电动两轮车业务发展 - 2025年上半年销量同比增长99%至239.25万辆 [6] - 中国市场历年累计出货量突破800万台 从700万到800万增量仅用64天 [6] - 国内专卖门店超8700家 市占率从2023年2.7%提升至2024年4.2% 2025年上半年达7.2% [7] - 2025年上半年毛利率23.71% 2024年毛利率22.26% 显著高于行业水平 [8] 产品竞争优势 - 4000元以上高端在售SKU占比68% 明显高于爱玛的10% [7] - 2024年4000元以上电动两轮车销量超60万台 高端市场规模领先同业 [7] - 自研RideyGO智能车机系统实现感应解锁/智能龙头锁等功能 RideyFUN智驾系统支持投屏导航/来电显示等 [9] - RideyLONG长续航系统通过自研优化实现续航提升超20% [10] - 深度参与电池/电机研发 电池开发全流程主导 电机配备温度传感器/温控线等关键组件 [11] 研发投入与技术创新 - 2022-2025H1研发费用分别为5.83/6.16/8.26/5.22亿元 呈上升趋势 [11] - 2020年以来累计研发投入超35亿元 [11] - 即将推出凌波OS短途交通全域操作系统 实现跨品类通用生态 [12] 行业政策环境 - 新国标修订版2025年9月实施 对智能化水平/电池规格/整车制造能力提出更高要求 [12] - 国家发改委10月将下达第四批690亿元资金支持消费品以旧换新 [12] 估值水平 - 动态市盈率约24倍 处于上市以来估值较低分位 [14] - 当前估值水平与盈利能力和业绩增速相比仍有较大提升空间 [14]
抖音全新推荐大模型RankMixer,参数翻70倍,推理成本不涨
量子位· 2025-08-01 09:05
核心观点 - 字节跳动算法团队提出全新推荐排序模型架构RankMixer,通过软硬件协同设计实现模型效果与计算效率的最佳平衡 [2][40] - RankMixer-1B模型将抖音推荐精排模型的Dense参数量从16M扩大至1B量级,同时保持推理成本不变 [4][26] - 该模型在抖音主feed推荐场景全量生效,带来超过0.3%的LT30收益和超过1%的用户时长收益 [4][35] 模型架构创新 - 采用TokenMixing模块实现无参的跨特征信息交互,计算效率优于Self-Attention [17][19][20] - 引入Per-Token SparseMoE结构,通过门控机制动态激活专家网络,提升参数容量 [21][24] - 采用ReLU路由和DTSI训练策略解决MoE专家训练不均衡问题 [25] 性能优化 - 模型MFU从4.47%提升至44.57%,SM Activity从30%提升到80% [4][31] - 通过大矩阵乘法设计、算子融合、混合精度推理等手段实现FLOPs增加20倍下推理成本不变 [29][31] - 图外H2D优化降低3ms延迟,提升MFU [31] 业务效果 - 离线测试显示RankMixer-1B对比纯DNN累积AUC提升超过0.9%,UAUC超过1% [32] - 线上A/B测试显示用户日活跃天数提升0.3%,人均单日使用时长提升超过1% [35] - 低活用户群体效果提升更显著,日活跃天数最高提升1.74%,使用时长提升3.64% [37] 技术理念 - 验证推荐系统存在Scaling Law,通过扩大模型规模持续提升效果 [5][40] - 实现算法与基础设施的协同设计,充分释放GPU算力 [43] - 模型迭代从"雕花"式优化转向可扩展的架构升级 [42]
库克“发飙了”,iPhone16 Pro系列售价很给力,人人买得起了
搜狐财经· 2025-07-17 05:41
国产手机市场竞争格局 - 国产手机品牌华为、小米、OPPO、vivo集体发力,市场份额提升[1] - 苹果销量下滑,用户转向国产阵营,主要因创新不足和价格过高[1] - 苹果采取激进降价策略应对竞争,iPhone16 Pro Max降价2300元,iPhone16 Pro降价2100元[1][3][11] iPhone16 Pro系列产品策略 - iPhone16 Pro Max配备6.9英寸大屏,电池容量4676mAh,续航达一天半[4] - iPhone16 Pro屏幕升级至6.3英寸,电池容量3650mAh,适合轻度用户[7] - 两款机型差异主要在尺寸和续航,分别针对巨屏爱好者和单手操作用户[3] iPhone16 Pro系列技术升级 - A18 Pro处理器优化AI运算、能效控制和图像处理能力[6] - 超广角镜头从1200万像素升级至4800万像素,提升解析力和夜拍表现[6] - 新增独立相机控制按键,模拟传统相机快门反馈[9] - 侧边中框升级为磨砂钛金属材质,提升耐磨性和手感[9] 苹果价格策略调整 - iPhone16 Pro Max 256GB版本降价2300元,iPhone16 Pro 256GB版本降价2100元[11] - 降价幅度显著,使高端机型进入更具性价比区间[3][11] - 价格调整反映苹果应对市场竞争的战略转变[11]
首设工业软件喻家山论坛,第三届软件创新发展大会即将开幕
第一财经· 2025-06-05 05:37
武汉软件产业发展目标 - 到2030年武汉软件产业整体规模将突破8000亿元 [1][2] - 整体发展水平目标跃居全国城市第一梯队 [2] 第三届软件创新发展大会核心内容 - 大会聚焦"十五五"软件新趋势 围绕关键软件创新 AI赋能 开源生态培育 软硬件协同等热点领域 [1] - 中部六省省会城市将签署工业软件中试验证合作协议 重点覆盖航天 船舶 汽车等高端场景 [1] - 创新打造"软件市集" 采用市集化 场景化 沉浸式体验方式展示企业最新技术和产品 [1] 工业软件专项布局 - 首次设立工业软件喻家山论坛 以华中科技大学为底座构建产学研转化枢纽 [2] - 推动机器人 汽车 物联网操作系统 高性能数据库 三维CAD EDA等标志性技术突破 [2] - 强化"车谷"与"光谷"融合 加速建设智能汽车软件创新高地 [2] 行业应用拓展 - 面向医疗 教育 水务 汽车等领域推出行业专用版开源操作系统 [2] - 推动人工智能 区块链 元宇宙与实体经济深度融合 [2] 大会背景与规模 - 历年参会规模达800人左右 本届正值"十四五"收官向"十五五"过渡关键期 [2] - 重点研讨"十五五"期间软件产业机遇挑战 把握形势变化对行业的影响 [2]