Token调用量

搜索文档
MaaS将主导公有云市场 最后谁将争夺市场第一?
中国新闻网· 2025-09-28 11:41
MaaS将主导公有云市场 最后谁将争夺市场第一? "东西好不好,只有调用过的最有资格发言。"国内公有云市场风起云涌,如今比拼的不仅仅是市场占有 率这一数字,更是Token的调用量和AI赋能落地能力。 近日,国际数据公司(IDC)发布的报告指出,2025年上半年,中国公有云上大模型调用量达536.7万亿 Tokens。其中,火山引擎方舟(MaaS)平台的调用量同比增长3.98倍,市场份额达到49.2%。 2024年全年,火山引擎上述指标市场份额为46.4%,不难看出,今年上半年,该优势进一步扩大。 另外一家科技机构Omdia发布的报告显示,2025年上半年中国AI云市场规模达223亿元,火山引擎以 14.8%位列第二。 但值得注意的是,Omdia统计口径为"IaaS(算力、存储等基建)+PaaS(机器学习平台等工具)+MaaS(大模 型Tokens调用费用)"的全链条收入。 一家优秀的云服务厂商是以全链条收入还是MaaS的调用收入来衡量? 不过客户选择了"用脚投票":满足自己的云服务才是最好的。东西好不好,只有调用过的最有资格发 言。 从今年一些企业动向来看,全新上市的特斯拉Model Y L车型将搭载豆包大模 ...
从Token角度,测算AI算力需求
华泰证券· 2025-07-01 08:26
报告行业投资评级 - 科技行业投资评级为增持(维持)[5] - 计算机行业投资评级为增持(维持)[5] 报告的核心观点 - 推理算力需求增长速度快于单位算力成本的降低,持续看好推理端算力需求的加速增长[1][36] 根据相关目录分别进行总结 海内外大厂Token调用量增长迅速,推理算力需求加速放量 - 海外CSP厂商中,Google的Token月均调用量从24年4月的9.7万亿增长至25年4月的480万亿,增长50倍;Azure AI基础设施25年一季度处理超100万亿Token,较去年同期增长5倍,3月单月Token调用量达50万亿[2] - 国内互联网大厂中,25年5月字节火山引擎Token日均调用量为16.4万亿,是24年5月的137倍,AI工具类Token消耗快速增长,新场景实现日均百亿Token突破[12] 北美大厂Token调用量与算力需求测算 Google Token调用量与算力需求测算 - Google Token调用量增长主要源于AI搜索的拓展,25年5月和6月推理Token量将分别达到659/870万亿,环比增长37%/32%,二季度Token总量将达2009万亿,环比增长223%,较24Q2增长接近30倍[20] - Google推理Token主要包含AI搜索、Gemini 2C应用和其他推理需求三部分,AI搜索渗透率、AI Mode占比、Gemini Agent占比的增长将带动Token调用量快速增加[20][23] Google Token量快速增长有望带来资本开支持续高增 - 预计Google二季度推理算力需求环比+223%,总算力需求较一季度环比增长223%,推理算力资本开支环比+159%,主要因Token量大幅增长[24][25] - 单位算力成本呈下跌趋势,4/5/6月分别环比下降14%/13%/13%,影响因素主要有新款芯片迭代和算法迭代[26] 微软Token调用量与算力需求测算 - OpenAI Token调用量的提升主要源于ChatGPT网页访问量上升及Deep Research功能的渗透,预计25年第二季度微软总Token调用量有望达205万亿,环比增长约100%[29][32] 微软算力需求测算:年底等效H100芯片需求约为25年3月的两倍有余 - 预计微软二季度推理算力需求环比增长99%,2025年3月整体推理算力需求为15.3 Trillion TFLOPs,二季度总算力需求为65.6 Trillion TFLOPs[33] - 测算微软年底的推理算力卡需求量约为3月的两倍有余,2025年3月等效H100算力需求为4.3万张,未来月同比增速约为10%[33] 结论:推理算力需求增长速度快于单位算力成本的降低 - 算力支出受算力需求和算力成本影响,AI应用用户数量增长及Agent渗透驱动算力需求上升,硬件迭代与算法改进驱动推理成本下降,市场对整体算力支出存在分歧[35] - 测算推理算力需求增长速度快于单位算力成本的降低,未来算力支出将持续增长,看好推理端算力需求的加速增长[36]