Workflow
GLM4.6
icon
搜索文档
Kimi杨植麟称“训练成本很难量化”,仍将坚持开源策略
第一财经· 2025-11-11 12:04
公司战略与产品发布 - 月之暗面Kimi公司近半年持续投入开源模型研发与更新,并于11月6日发布最新开源思考模型Kimi K2 Thinking [3][6] - 公司未来很长一段时间内将坚持开源策略,重点推进Kimi K2 Thinking模型的应用与优化 [6][8] - 公司在优先发展文本模型的前提下兼顾多模态模型推进,避开与OpenAI等头部厂商在AI浏览器等具体赛道的直接竞争 [8] - 公司尝试通过架构创新、开源策略与成本控制建立差异化优势 [8] 模型训练成本与性能 - 有消息称Kimi K2 Thinking模型的训练成本为460万美元,低于DeepSeek V3模型的560万美元和OpenAI GPT-3的数十亿美元 [3][6] - 公司CEO杨植麟回应称460万美元并非官方数字,由于大部分投入花在研究与实验上,训练成本很难量化 [4][6] - 针对模型推理长度过长、榜单成绩与实际体验不符的质疑,公司表示现阶段优先考虑绝对性能,token效率将在后续改善 [4][7] - 榜单高分与实测的脱节问题预计在模型通用能力补齐后被逐渐消解 [4][7] 行业竞争与市场表现 - 最新一周OpenRouter模型调用榜单前二十名中,中国开源模型产品占据五席,包括MiniMax M2、DeepSeek V3、GLM4.6、DeepSeek V3.1、DeepSeek V3.2 Exp [4][7] - Kimi模型因OpenRouter平台接口问题,目前只能以API形式被使用 [4][7] 技术资源与基础设施 - 公司团队使用携带InfiniBand网络互连技术的H800 GPU芯片支持持续的模型更新与庞大训练量 [4][7] - 公司承认所使用的GPU性能比不上美国的高端卡,数量也处于劣势,但强调每张卡都被用到了极致 [4][7]
Kimi杨植麟称“训练成本很难量化” 仍将坚持开源策略
第一财经· 2025-11-11 10:45
公司战略与模型进展 - 月之暗面Kimi公司CEO杨植麟回应称,媒体报道的Kimi K2 Thinking模型460万美元训练成本并非官方数字,因大部分投入用于研究与实验,实际成本难以量化[2] - 公司近期发布了最新版本的开源思考模型Kimi K2 Thinking,并计划长期坚持开源策略,重点推进该模型的应用与优化[2][5] - 针对用户关于模型推理长度过长、榜单成绩与实际体验不符的质疑,公司表示现阶段优先考虑模型绝对性能,token效率及榜单与实测脱节问题将在后续迭代中改善[2] - 公司战略为在优先发展文本模型的前提下兼顾多模态模型推进,避开与OpenAI等头部厂商在AI浏览器等具体赛道的直接竞争,尝试通过架构创新、开源策略与成本控制建立差异化优势[5] 行业竞争与市场地位 - 在国际模型调用平台OpenRouter的最新一周榜单前二十名中,中国开源模型产品占据五席,包括MiniMax M2、DeepSeek V3、GLM4.6、DeepSeek V3.1、DeepSeek V3.2 Exp[3] - 月之暗面Kimi因OpenRouter平台接口问题,目前仅能以API形式被使用,未进入该调用榜单[3] - 全球模型调用量排名显示,调用量最高的模型为x-ai的Grok Code Fast 1,达1.36T tokens,中国模型中排名最靠前的为DeepSeek V3 0324,位列第11位[5] 技术基础设施与成本 - Kimi团队在模型训练中使用的芯片是携带InfiniBand网络互连技术的H800 GPU,其性能虽不及美国高端芯片且数量处于劣势,但团队强调将每张卡的性能用到了极致[3] - 行业训练成本对比显示,媒体报道的Kimi K2 Thinking模型460万美元训练成本低于DeepSeek V3模型的560万美元,远低于OpenAI GPT-3模型的数十亿美元[2]
Kimi杨植麟称“训练成本很难量化”,仍将坚持开源策略
第一财经· 2025-11-11 10:35
公司战略与产品进展 - 公司近期发布最新版本开源思考模型Kimi K2 Thinking [1] - 公司CEO回应称模型训练成本460万美元并非官方数字 因大部分投入花在研究与实验上导致成本难以量化 [1] - 针对模型推理长度过长及榜单成绩与实际体验不符的质疑 公司表示现阶段优先考虑绝对性能 token效率与榜单脱节问题将在后续改善 [1] - 公司未来很长一段时间内仍将坚持开源策略 重点推进Kimi K2 Thinking模型的应用与优化 [4] - 公司在优先发展文本模型的前提下兼顾多模态模型推进 尝试通过架构创新 开源策略与成本控制建立差异化优势 [4] 行业竞争格局 - 中国开源大模型在国际市场调用量显著 OpenRouter榜单前二十名中中国开源模型占据五席 包括MiniMax M2 DeepSeek V3 GLM4.6等 [2] - 公司产品因OpenRouter平台接口问题 目前仅能以API形式被使用 [2] - 行业头部模型训练数据量庞大 榜单显示Grok Code Fast 1训练token达1.36T 而Claude Sonnet 4.5为649B tokens [4] 技术资源与基础设施 - 公司团队使用携带InfiniBand技术的H800 GPU进行模型训练 尽管其性能比不上美国高端卡且数量处于劣势 但每张卡均被极致利用 [2]
氪星晚报|光线传媒积极探索微短剧市场并筹划组建相关公司 ;DeepSeek V3.2、GLM4.6等大模型即将发布;工信部等六部门印发《机械行业稳增长工作方案(2025-2026年)》
36氪· 2025-09-29 11:43
消费电子与零售 - OPPO启动新形态影像产品系列,计划于2026年内发布,该系列基于公司超过17年的手机影像技术积累[1] - 安德玛户外中国首家旗舰店于上海新天地启幕,目前已进驻全国22个省份和直辖市的高端购物中心与核心商圈[1] - 名创优品旗下Top Toy International可能通过香港IPO筹集约3亿美元[8] 电池材料与能源 - 厦钨新能与中伟股份签署战略合作框架协议,协议期至2028年9月30日,预计四氧化三钴产品年供需量约40,000吨,三元前驱体产品年供需量约50,000吨,碳酸锂/磷酸锂年供需量约15,000吨,回收料年供需量约10,000吨[2] - 东华科技承建的西藏扎布耶盐湖绿色综合开发利用万吨电池级碳酸锂项目完成功能考核,标志着项目将正式投产[3] - 九丰能源拟投资不超过34.55亿元建设新疆庆华年产40亿方煤制天然气项目,公司将持有二期工程项目50%的权益,对应年产20亿方天然气,项目建设周期不超过36个月[8] 人工智能与科技 - DeepSeek V3.2大模型即将发布,智谱的GLM-4.6也即将发布[5] - 智策领航完成天使+轮战略融资,由徐汇资本领投,累计融资额已达数千万元,资金将用于人工智能技术研发、产品迭代和市场拓展[5] - 国家发改委表示将支持民营企业等深度参与"人工智能+"行动,指出今年一季度新设立人工智能软件研发类民营企业25.4万户[11] 工业自动化与机械 - 灵猴机器人完成超亿元A轮融资,资金将用于工业自动化及通用机器人等领域核心零部件的研发、实验室建设以及产能的扩充[6][7] - 迈科科技获亿元级A轮融资,资金将用于加大TGV工艺研发及生产[9] - 工信部等六部门印发《机械行业稳增长工作方案(2025-2026年)》,力争行业营业收入年均增速达到3.5%左右,营业收入突破10万亿元[12] 资本市场与宏观环境 - 富达国际指出全球投资者对中国资产兴趣明显增加,其投资组合经理在不断增持中国股票,认为重估由基本面改善驱动[10] - 高盛表示全球对冲基金上个月在中国境内股票市场的活跃度为近年来最高,中国市场今年境内股票市场涨势达2.7万亿美元[10] - 外交部宣布将增设青年科技人才签证即"K字签证",以促进中外青年科技人才交流与合作[10] 传媒与娱乐 - 光线传媒在互动平台表示,公司正结合自身资源优势积极探索微短剧市场并已筹划投资组建相关公司[4]
氪星晚报|光线传媒积极探索微短剧市场并筹划组建相关公司 ;DeepSeek V3.2、GLM4.6等大模型即将发布;工信部等六部门印发《机械行业稳增长工...
36氪· 2025-09-29 11:42
消费电子与品牌动态 - OPPO启动新形态影像产品系列,计划于2026年内发布,基于其在手机影像超过17年的技术积累[1] - 安德玛户外中国首家旗舰店于上海新天地启幕,目前已进驻全国22个省份和直辖市的高端购物中心与核心商圈[1] - 名创优品旗下Top Toy可能通过香港IPO筹集约3亿美元资金[7] 新能源电池材料合作与项目进展 - 厦钨新能与中伟股份签署战略合作框架协议,预计2025至2028年间四氧化三钴产品年供需量约40,000吨,三元前驱体产品年供需量约50,000吨,碳酸锂/磷酸锂年供需量约15,000吨,回收料年供需量约10,000吨[2] - 东华科技承建的西藏扎布耶盐湖绿色综合开发利用万吨电池级碳酸锂项目完成功能考核,标志着该项目将正式投产[3] - 九丰能源拟投资不超过34.55亿元建设新疆煤制天然气项目二期工程,将持有项目50%权益,对应年产20亿方天然气,项目建设周期不超过36个月[7] 人工智能与科技投融资 - DeepSeek V3.2和智谱GLM4.6等大模型即将发布[5] - 智策领航完成天使+轮战略融资,由徐汇资本领投,累计融资额已达数千万元,资金将用于人工智能技术研发、产品迭代和市场拓展[5] - 灵猴机器人完成超亿元A轮融资,资金将主要用于工业自动化及通用机器人等领域核心零部件的研发、实验室建设以及产能的扩充[6] - 迈科科技获亿元级A轮融资,资金将用于加大TGV工艺研发及生产[8] - 国家发改委表示将支持民营企业等深度参与"人工智能+"行动,指出今年一季度新设立人工智能软件研发类民营企业25.4万户[10] 传媒与娱乐行业动向 - 光线传媒积极探索微短剧市场并已筹划投资组建相关公司[4] 宏观与行业政策 - 工信部等六部门印发《机械行业稳增长工作方案(2025-2026年)》,力争行业营业收入年均增速达到3.5%左右,营业收入突破10万亿元[10] - 外交部宣布将增设青年科技人才签证即"K字签证"以促进中外青年科技人才交流与合作[9] 资本市场情绪 - 富达国际指出全球投资者对中国资产兴趣明显增加,其在不断增持中国股票,认为资产重估由基本面改善驱动[9] - 高盛表示全球对冲基金上个月在中国境内股票市场的活跃度为近年来最高,今年中国境内股票市场涨势达2.7万亿美元[9]