核心观点 - DeepSeek是一家以极低成本实现高性能AI模型研发的公司 其训练成本仅为竞品的1/10 通过算法优化和开源策略成为AI界的"价格屠夫" [8][11][13] - 公司核心技术优势体现在采用混合专家模型(MoE)和高效训练方法 以557.6万美元成本训练出6710亿参数模型 性能比肩GPT-4o和Claude 3.5 [8][48] - 母公司幻方量化背景提供算力基础 创始团队年轻化且具备技术基因 坚持"普惠开放"理念推动技术革新 [45][47][48] 产业链分析 上游产业链 - 全球算力规模达910EFLOPS 其中智能算力从2021年113EFLOPS增长至2023年335EFLOPS 增速领先 [16] - AI芯片市场2023年规模652亿元 预计2026年达1611亿元 2024年上半年中国加速芯片市场规模超90万张 GPU占80%份额 [22][25] - AI服务器全球市场2023年突破500亿美元 增幅95.8% 中国市场规模从2020年149亿元增长至2023年692亿元 [28] - 云计算市场2023年规模6165亿元 同比增长35.5% 六大云服务商占据71.5%市场份额 [34] 中游产业链 - 全球AI市场2023年收入5381亿美元 同比增长18.5% 预计2026年达9000亿美元 [37] - 2024年Q1全球AI领域完成1779笔融资 总额216亿美元 [38] - 中国现有240多个大模型 头部产品包括文心一言/豆包/Kimi等 DeepSeek定位对标OpenAI o1和Claude 3.5 [41] 技术实现方式 - 采用数据优化和算法创新 通过20%核心数据训练实现80%性能提升 突破传统算力依赖模式 [13] - 训练与推理环节分离 参数量升级影响训练算力 推理算力取决于应用场景数据吞吐量 [20] 公司背景 - 团队规模139人 以名校年轻人才为主 创始人梁文锋为浙江大学信息与电子工程学系硕士 [45] - 母公司幻方量化曾管理超1000亿资金 2017年实现投资策略AI化 投入超10亿元建设"萤火虫"超级计算机 [47] - 2024年主动缩减资管规模至300亿以下 战略重心转向AI研发 2024年5月推出DeepSeek-V2引发行业价格战 [47] 产品与市场策略 - 定价策略极具颠覆性:DeepSeek-V2每百万tokens输入1元/输出2元 相当GPT-4 Turbo成本的1% [47] - 2024年12月发布DeepSeek-V3模型 采用6710亿参数MoE架构 总训练成本557.6万美元 不足GPT-4的1/10 [8][48] - 坚持开源路线 代码完全公开 技术透明度与低成本优势形成双重竞争力 [11][48]
一天吃透一条产业链:DeepSeek产业链
数说者·2025-03-03 23:47