硅谷大佬带头弃用OpenAI、“倒戈”Kimi K2,直呼“太便宜了”,白宫首位AI主管也劝不住
36氪·2025-10-28 10:39

行业趋势:从闭源模型向开源模型迁移 - 硅谷正从昂贵的闭源模型转向更便宜的开源替代方案,这一结构性转变引发热议[1] - 知名企业家Chamath Palihapitiya证实其团队已将大量工作负载从亚马逊云科技Bedrock迁移至Groq平台上的中国模型Kimi K2,原因是性能更优且成本显著更低[1][5] - 行业观点认为性能和成本正在改写AI堆栈游戏,有评论称OpenAI可能未预见到这种情况的发生[2] 成本优势:中国开源模型的竞争力 - DeepSeek 3.2 EXP模型将API成本降低高达50%,收费标准为每百万次输入28美分,每百万次输出42美分[3] - Anthropic的Claude模型同类服务收费约3.15美元,价格是DeepSeek新模型的10到35倍[3] - 成本考量是切换到开源模型的核心原因,Palihapitiya表示既付不起3美元一个输出token的费用,也承担不起后续其他成本[2][11] - 多家初创公司正在测试或已投入使用DeepSeek模型,主要原因就是价格优势明显[3] 技术部署与运营模式 - Groq接入中国模型的做法是获取模型源代码,在美国本土数据中心进行部署和分支开发,由美国人操作[2][13] - 服务模式通过开放API实现"token进、token出",与OpenAI、ChatGPT等闭源模型模式相同但成本更低[2][14] - 企业可以选择在自有基础设施上运行模型,确保数据留在自己基础设施内,增强安全性[15] - 模型切换存在技术挑战,需要几周甚至几个月时间进行微调与工程适配,不同模型间的优化调整无法直接迁移[2][6] 中美AI产业竞争格局 - 当前所有领先的开源大模型都来自中国,包括DeepSeek、Kimi和阿里巴巴的通义千问Qwen[8] - 美国在闭源模型、芯片设计、芯片制造、半导体制造设备及数据中心环节领先,但开源模型领域落后于中国[8] - 高性能闭源模型都是美国的,高性能开源模型都是中国的,形成明显的地域技术路线分化[9][10] - Meta为Llama模型投入数十亿美元,但Llama 4发布后评价不尽如人意,有消息称Meta可能放弃开源转向闭源[8] 模型性能与技术特点 - Kimi K2是由月之暗面开发的混合专家大型语言模型,总参数量达1万亿,激活参数量为320亿[1] - DeepSeek 3.2 EXP模型搭载DSA功能,能加快大型任务的训练与推理速度[3] - 多家知名平台已接入Kimi K2模型,包括Vercel、AI编码助手Cline和Cursor、Perplexity和GensparkAI应用[1] 能源成本与未来发展 - 能源行业预测电价未来五年可能翻倍,这将使AI成本问题转化为能耗问题[10] - 未来架构革新可能让成本和能耗降低10倍到1万倍,对模型能耗需求和每token成本产生重大影响[4][5] - 提出交叉补贴方案,让科技公司按更高费率缴纳电费,由拥有数千亿现金流的科技巨头承担成本压力[11]