核心观点 - AI行业普遍预期模型成本下降将改善盈利状况 但实际情况是最先进模型价格保持稳定 同时token消耗量激增 导致固定费率订阅模式面临严重挑战 商业模式需要根本性变革[4][5][40] 模型成本变化趋势 - 大语言模型成本每年下降10倍的说法仅适用于性能老旧的模型 而市场始终需求最先进的模型[4][18][19] - 最先进模型价格保持相对稳定 新模型发布时99%需求立即转移[12][19] - GPT-4价格从2023年3月60美元/百万tokens降至2024年3月1.5美元/百万tokens 但Claude 3 Opus等新模型仍定价75美元/百万tokens[15] - 当GPT-4定价60美元时 尽管GPT-3.5便宜26倍 用户仍选择更先进的模型[16] token消耗模式变化 - 模型消耗token数量爆炸式增长 AI处理任务长度每六个月翻倍[23][25] - 过去返回1000token的任务现在需要返回10万token[25] - 深度研究成本现约1美元 预计2027年24小时运行的AI Agent单次成本达72美元[29] - Claude Code用户单月最高消耗100亿token 相当于1.25万本《战争与和平》[36][37] 商业模式挑战 - 固定费率订阅模式面临流动性挤压 20美元月费无法覆盖每天1美元的使用成本[31][33] - Anthropic的Claude Code无限套餐定价200美元/月仍失败 采用自动模型切换和用户设备计算仍无法控制token消耗[34][35][39] - 行业陷入囚徒困境 所有公司都补贴重度用户 将盈利问题推迟[42][43] - 按量定价理论上可行但消费者偏好包月制 引入计量收费会导致增长停滞[46][47] 可行商业模式路径 - 采用按使用量计费模式 建立诚实的经济模式[46] - 建立高切换成本获取高利润率 如企业市场部署[48][49] - 客户切换成本高的软件利润率达80%-90%[51] - 垂直整合从基础设施盈利 将AI作为引流品推动其他服务[52][54] - Replit通过代码AI工具与应用托管、数据库管理等服务捆绑销售[52] - 企业市场方面 Devin与花旗银行和高盛合作 每家部署4万名工程师[48]
相信大模型成本会下降,才是业内最大的幻觉
虎嗅·2025-08-21 02:55