豆包语音模型
搜索文档
盘点2025:模型服务,成为基础设施
第一财经· 2025-12-30 10:15
全球MaaS市场格局与火山引擎的崛起 - 截至2025年10月,全球MaaS市场前三名为OpenAI、谷歌云、火山引擎,市场份额分别为31%、19%、15%,三家合计占据全球市场65%的份额[1] - 火山引擎以30万亿日均Tokens调用量位居全球第三,仅次于OpenAI的70万亿和谷歌云的43万亿[3] - 火山引擎是前三名中唯一的中国厂商,正凭借MaaS服务在AI云市场快速突围[3] 火山引擎的增长与市场地位 - 2025年,火山引擎实现100%的同比增长,营收超过200亿人民币[6] - 由于MaaS商业化和模型迭代超预期,公司原计划于2030年实现的1000亿营收目标被上调了百分之几十[6] - 2025年上半年,火山引擎在中国公有云大模型服务市场份额扩大至49.2%,意味着中国公有云上每产生两个tokens就有一个由其生产[14] - 在Gartner 2025年度全球《AI应用开发平台魔力象限》中,火山引擎领跑“挑战者”象限,其“执行能力”位列全球第五、中国第一[14] 关键增长驱动与战略举措 - 2024年5月15日,火山引擎推出豆包大模型API服务,通过技术创新将主力模型定价从“分计价”拉入“厘计价”时代,降幅高达99.3%,引发了行业降价潮并推动了市场“从无到有”般的增长[6] - 2025年2月1日,DeepSeek-R1登陆火山方舟,模型推理服务全面爆发,火山引擎成为市场上吃到最多DeepSeek推理服务红利的云厂商[7] - 豆包大模型与DeepSeek的爆红,共同催生了中国MaaS市场,IDC报告显示2024年7月和2025年2月是中国公有云大模型调用量月度环比增长率最高的两个拐点[8][10] - 豆包大模型调用量呈指数增长,推出不到600天,其最新日均调用量已达63万亿Tokens[3][4] 产品迭代与调用量增长的正循环 - 2025年6月以来,豆包大模型家族密集发布了1.6、1.8版本以及视频生成、图像编辑、语音、图像创作等多个模型,每次模型能力提升都解锁了更多应用场景并带动调用量增长[10] - 伴随模型发布节奏,几乎每3个月模型调用就会迎来一次更陡峭的增长[11] - 公司认为,大的模型调用量能打磨出更好的模型和基础设施,来自B端场景的真实反馈可以指导下一代模型的训练路线图[15][16][18] - 大规模调用量能迭代出更极致的基础设施,优化推理成本,例如通过PD分离、xLLM推理框架等方式在2024年5月大幅降低模型推理价格[18] - MaaS服务已成为火山引擎增长最快、毛利最高的AI云计算产品,参照DeepSeek公布的推理服务最高成本利润率可达545%[18] 字节跳动的技术溢出与协同优势 - 火山引擎63万亿日均Tokens调用量的用户基础,部分来源于字节跳动的溢出效应[20] - 公司受益于B端和C端的极致协同,字节跳动的C端产品(如豆包App)拥有大量用户并大规模调用模型,这帮助火山引擎优化服务,同时豆包App也成为向企业客户展示能力的窗口[20][21] - 字节跳动内部50多个业务线在AI实践上走得更靠前,尝试了众多Agent,这为火山引擎提供了宝贵的认知和know-how[23] - 云计算是规模体系的比拼,火山引擎的崛起得益于字节跳动庞大的业务体系托举和技术外溢,这与AWS、谷歌、阿里等头部云厂商的路径类似[24] - 字节跳动通过火山引擎持续把新模型、新技术开放给企业客户,以在更大市场经受检验[24][25] 未来战略:从MaaS到AI云原生 - 在取得MaaS份额第一后,火山引擎的战略目标依旧是MaaS优先[27] - 公司致力于降低AI应用门槛,通过更高层次的封装和成本优化加速AI普惠[27] - 在基础MaaS层,追求模型效果更好、成本更低、易用性更高,并推出了Prompt Pilot、Model Router和Responses API等工具[27] - 在更底层,推出了模型的推理代工服务,客户可将自己的模型托管在火山方舟上,无需自建基础设施[27] - 随着应用迈向以Agent为技术主体,公司正构建以模型为中心的AI云原生架构,MaaS是使用模型的最佳方式,云平台和中间件进一步把Tokens组装成Agents[28] - 作为国内率先推出Agent开发、运营全套产品的云厂商,火山引擎已将豆包助手API、即梦API对外提供服务[30] - Agent的商业逻辑从tokens调用的IT预算,转向类似BPO(人力外包)的角度,市场天花板有望扩大很多倍[30]