公司战略与模型进展 - 月之暗面Kimi公司CEO杨植麟回应称,媒体报道的Kimi K2 Thinking模型460万美元训练成本并非官方数字,因大部分投入用于研究与实验,实际成本难以量化[2] - 公司近期发布了最新版本的开源思考模型Kimi K2 Thinking,并计划长期坚持开源策略,重点推进该模型的应用与优化[2][5] - 针对用户关于模型推理长度过长、榜单成绩与实际体验不符的质疑,公司表示现阶段优先考虑模型绝对性能,token效率及榜单与实测脱节问题将在后续迭代中改善[2] - 公司战略为在优先发展文本模型的前提下兼顾多模态模型推进,避开与OpenAI等头部厂商在AI浏览器等具体赛道的直接竞争,尝试通过架构创新、开源策略与成本控制建立差异化优势[5] 行业竞争与市场地位 - 在国际模型调用平台OpenRouter的最新一周榜单前二十名中,中国开源模型产品占据五席,包括MiniMax M2、DeepSeek V3、GLM4.6、DeepSeek V3.1、DeepSeek V3.2 Exp[3] - 月之暗面Kimi因OpenRouter平台接口问题,目前仅能以API形式被使用,未进入该调用榜单[3] - 全球模型调用量排名显示,调用量最高的模型为x-ai的Grok Code Fast 1,达1.36T tokens,中国模型中排名最靠前的为DeepSeek V3 0324,位列第11位[5] 技术基础设施与成本 - Kimi团队在模型训练中使用的芯片是携带InfiniBand网络互连技术的H800 GPU,其性能虽不及美国高端芯片且数量处于劣势,但团队强调将每张卡的性能用到了极致[3] - 行业训练成本对比显示,媒体报道的Kimi K2 Thinking模型460万美元训练成本低于DeepSeek V3模型的560万美元,远低于OpenAI GPT-3模型的数十亿美元[2]
Kimi杨植麟称“训练成本很难量化” 仍将坚持开源策略
第一财经·2025-11-11 10:45