Kimi杨植麟称“训练成本很难量化” 仍将坚持开源策略

公司战略与模型进展 - 月之暗面Kimi公司CEO杨植麟回应称，媒体报道的Kimi K2 Thinking模型460万美元训练成本并非官方数字，因大部分投入用于研究与实验，实际成本难以量化[2] - 公司近期发布了最新版本的开源思考模型Kimi K2 Thinking，并计划长期坚持开源策略，重点推进该模型的应用与优化[2][5] - 针对用户关于模型推理长度过长、榜单成绩与实际体验不符的质疑，公司表示现阶段优先考虑模型绝对性能，token效率及榜单与实测脱节问题将在后续迭代中改善[2] - 公司战略为在优先发展文本模型的前提下兼顾多模态模型推进，避开与OpenAI等头部厂商在AI浏览器等具体赛道的直接竞争，尝试通过架构创新、开源策略与成本控制建立差异化优势[5] 行业竞争与市场地位 - 在国际模型调用平台OpenRouter的最新一周榜单前二十名中，中国开源模型产品占据五席，包括MiniMax M2、DeepSeek V3、GLM4.6、DeepSeek V3.1、DeepSeek V3.2 Exp[3] - 月之暗面Kimi因OpenRouter平台接口问题，目前仅能以API形式被使用，未进入该调用榜单[3] - 全球模型调用量排名显示，调用量最高的模型为x-ai的Grok Code Fast 1，达1.36T tokens，中国模型中排名最靠前的为DeepSeek V3 0324，位列第11位[5] 技术基础设施与成本 - Kimi团队在模型训练中使用的芯片是携带InfiniBand网络互连技术的H800 GPU，其性能虽不及美国高端芯片且数量处于劣势，但团队强调将每张卡的性能用到了极致[3] - 行业训练成本对比显示，媒体报道的Kimi K2 Thinking模型460万美元训练成本低于DeepSeek V3模型的560万美元，远低于OpenAI GPT-3模型的数十亿美元[2]