Workflow
大模型生态
icon
搜索文档
中科创达:公司和火山引擎的合作始于2024年
证券日报网· 2025-08-29 12:11
公司与火山引擎合作进展 - 公司与火山引擎的合作始于2024年 [1] - 公司加入火山引擎汽车大模型生态联盟 [1] - 公司与火山引擎成立联合实验室并获得HiAgent交付授权 [1]
计算机行业周报:DeepSeek助力国产算力价值重估-20250824
华西证券· 2025-08-24 14:40
行业投资评级 - 计算机行业评级为推荐 [4] 核心观点 - DeepSeek-V3 1 实现多维度突破 采用创新混合推理架构 支持思考与非思考模式 结合混合专家架构与 UE8M0 FP8 精度 优化效率并降低部署成本 [1][14] - 智能体能力突出 编程与搜索能力卓越 上下文窗口扩展至 128K [1][14][27] - 生态建设上 模型开源且 API 价格下调至 0 5 元/百万 Tokens 优化功能 [1][28] - 该模型与 UE8M0 FP8 组合适配国产芯片 UE8M0 FP8 动态范围大 提升稳定性与效率 适配华为昇腾等芯片 实现低卡高能部署 带动全产业链发展 [1][15][33] - 在政策推动下 其与昇腾组合切入关键领域 打破垄断 根据中研网预测 2025 年中国 AI 算力市场达 1200 亿元 UE8M0 FP8 技术新增 240 亿元有效算力供给 [1][15][39] - 英伟达要求部分供应商暂停生产 H20 芯片 凸显海外 GPU 供应链不确定性 加剧国内算力企业对自主可控迫切需求 [2][16][40] - DeepSeek-V3 1 正式发布 首次引入 UE8M0 FP8 精度 专为国产芯片设计 推动华为昇腾 寒武纪等企业在硬件与软件栈上全面升级 [2][16][44] - DeepSeek-V3 1 通过技术迭代带动芯片 服务器和云服务联动优化 国产算力链条呈现外部受阻 内部加速格局 标志中国大模型生态进入自主化与规模化并进新阶段 [2][17][62] 技术架构与性能 - 采用创新混合推理架构 支持思考与非思考双模式 简单任务快速响应 复杂任务启动思维链分析 经训练后输出 token 数减少 20%-50%仍保持性能 降低推理成本 [14][21] - 延续混合专家架构 6710 亿总参数仅激活 370 亿 结合 UE8M0 FP8 精度 优化存储与计算效率 便于国产芯片部署 [14][24] - 编程智能体在 SWE-bench 代码修复评测中达 66 0 分 终端操作测试达 31 3 分 大幅领先前代模型 [25][27] - 搜索智能体凭借 128K 上下文窗口 长文档处理和复杂问题解答能力远超前代 [14][27] - UE8M0 FP8 动态范围达 2^127 为英伟达/AMD 主流 E4M3 标准动态范围的 32 倍 指数表能轻松容纳该跨度 为块缩放提供充足空间 [33] - 内存占用较 FP16 降低 50% 矩阵乘法速度提升 2-3 倍 并支持 128K 超长上下文处理 完美匹配国产芯片轻量化算力架构需求 [33] - 基于 UE8M0 的 DeepSeek-671B 模型在昇腾 910B 集群部署时 GPU 用量减少 50% 推理速度提升 3 15 倍 首次实现低卡高能国产化部署范式 [35] 产业链与生态影响 - 上游芯片领域 寒武纪 MLU370-X8 芯片 海光信息 DCU 产品通过 UE8M0 适配 算力密度提升 40% 2025 年 Q1 净利润分别同比激增 4230% 75 33% [38] - 中游模型层面 DeepSeek 开放 FlashMLA DeepGEMM 等自研工具链 支持国产芯片原生 FP8 数据流 将开发者适配成本降低 70% [38] - 下游应用端 科大讯飞教育场景 金山办公文档生成 千方科技交通优化等接入 V3 1 模型后 端侧推理延迟降至 50ms 以下 效率较传统方案提升超 2 倍 [38] - 华为麒麟 9020 芯片由中芯国际以 7 纳米制程制造 集成巴龙 6000 5G 调制解调器 成为华为首款集成 5G 调制解调器芯片 [45] - 中科曙光发布国内首个行业标准化超智融合算力平台 Nebula800 支持双精 单精 半精 整形及混合精度运算 可适配科学计算 AI 训推 AI4S 科学大模型等多元场景 [57] - 硅基流动联合华为云上线基于昇腾的 DeepSeek-R1 与 V3 推理服务 提供接近国际高端 GPU 性能 并通过 API 开放和低延迟调用方式 大幅降低企业接入门槛 [61] 市场表现与行业动态 - 本周沪深300指数上涨4 18% 申万计算机行业周涨幅7 93% 高于指数3 75个百分点 在申万一级行业中排名第4位 [66] - 2025年初至今申万计算机行业累计上涨28 86% 在申万一级31个行业中排名第6位 高于沪深300指数17 60个百分点 [70] - 从估值情况来看 SW计算机行业PE TTM 为99 30倍 高于2010-2025年历史均值58 84倍 行业估值高于历史中枢水平 [84][87] - 百度文库网盘发布全球首个全端通用智能体 GenFlow2 0 支持超100个专家智能体并行工作 3分钟完成超5项复杂任务 生成速度超主流产品10倍 [174] - 致远互联携手华为鸿蒙 阿里云等共同发布协同 AI 新生态 标志致远互联从协同软件服务商向协同 AI 服务商战略升级 [176] - 苹果正开发代号 Charismatic 的全新操作系统 可能为 homeOS 计划2026年用于智能家居中枢 2027年搭载于桌面机器人 [176] - OpenAI 升级 ChatGPT 语音功能 新增语速调节与自定义指令前缀 语音速度调节范围从0 5倍速到2 0倍速 [177] - 谷歌通过 AI 项目推进亚洲语言数字化 印度 Project Vaani 收集近21500小时语音数据 覆盖86种语言 东南亚 Aquarium 平台为1200种语言建数据库 [178]
中国最大AI开源社区用户破千万 公布开发者激励计划
北京日报客户端· 2025-06-30 14:20
魔搭社区发展现状 - 魔搭社区用户数量从2023年4月的100万增长至1600万,增长约16倍 [1] - 社区已汇聚超500家贡献机构,托管开源模型数量超7万个 [1] - 截至2025年6月,社区服务了36个国家超1600万开发者 [1] - 社区定位为开放、中立、非营利性组织,是中国最大的AI开源社区 [1] 魔搭社区功能与价值 - 通过汇聚先进开源模型,帮助开发者快速获取最新最好的模型 [1] - 为模型提供触及潜在用户及下游生态的桥梁,促进模型贡献者与使用者互动 [1] - 通过平台服务及开源工具链建设,推动中国大模型生态迭代发展 [1] 首届魔搭开发者大会概况 - 大会由国家信息中心指导、魔搭社区主办,覆盖七大论坛和65个主题 [2] - 参会机构包括谷歌、英伟达、英特尔、腾讯、蚂蚁等头部企业及中科院等科研机构 [2] - 全球200余位AI领域专家学者和数万名开发者参会 [2] 魔搭开发者勋章激励计划 - 为平台贡献开发者提供荣誉和奖励,包括免费GPU算力支持及AIGC专区高阶训练券等 [2] - 奖励可用于模型生成、训练、应用搭建等场景 [2] - 未来计划将激励范围扩展至代码搭子、布道搭子等开发者群体 [2]