Workflow
开源
icon
搜索文档
Kimi 员工复盘 K2:为什么聚焦 Agent、为什么开源,为什么选择 DSV3 架构?
Founder Park· 2025-07-18 09:39
核心观点 - Kimi K2 作为月之暗面首个开源旗舰模型,凭借万亿参数 MoE 架构、Agent Tool Use 和 Coding 能力创新,成为 LMArena 竞技场排名第一的开源模型 [1][2] - 模型通过 RLVR 和自合成工具调用数据实现 Agent 能力突破,并首创「前端编程」交互范式,超越传统 ChatBot 体验 [7][10][11] - 开源策略推动技术生态共建,同时倒逼模型通用性提升,避免闭源服务的「workflow 粉饰」陷阱 [13][14][15] 模型性能与市场表现 - LMArena 竞技场排名显示 K2 以 1420 分位列开源模型第一,超越 DeepSeek-R1(1415 分)和 Claude Opus 4(1420 分)[2] - Cursor、Cline、VS Code 等主流开发工具快速接入,验证其 Coding 能力获行业认可 [1][3] - 采用 384 专家 MoE 架构,在保持激活参数量 32B 不变前提下,总参数量达 DSv3 的 1.5 倍,实现更低训练 loss [22][23] 技术创新 Agent 能力 - 通过 RLVR 训练和 MultiAgent 合成工具调用数据,激发预训练模型潜藏的 API 使用能力 [7][8] - 定义 Agentic Model 标准流程:动态生成 toolset、环境反馈、错误重试等交互轨迹 [9] - 首创「artifact-first」交互范式,将 AI 输出从 Markdown 升级为可交互前端应用 [10][11] 架构优化 - 继承 DSv3 结构基础,调整 attention head 数至 64,减少 QKVO projection 50% 访存量(5GB→2.5GB)[24][26] - 首层保留 dense 结构,后续全用 MoE,解决 router 负载均衡问题 [28] - 取消 expert 分组,采用动态重排方案提升路由自由度,组合空间扩大 1.5 倍 [29][30] 开源战略 - 开源 24 小时内涌现 MLX 实现、4bit 量化等社区贡献,加速技术生态建设 [13] - 倒逼模型通用性,避免闭源服务依赖「数十模型+数百 workflow」的取巧方案 [15] - 通过第三方复现验证模型真实能力,推动 AGI 技术标准统一 [14][15] 行业竞争 - 在 DeepSeek-R1 爆火后明确「硬实力优先」路线,停止市场投流仍保持自然增长 [17][18] - 指出当前 Agent 产品过度依赖 Claude 3.5 的局限性,强调基础模型决定智能上限 [19] - 模型结构设计兼顾成本控制,训练推理成本与 DSv3 持平但性能显著提升 [20][30]
黄仁勋对话王坚:开源不仅仅是开放研究,还要开放工程
每日经济新闻· 2025-07-18 05:32
链博会动态 - 第三届链博会在北京开幕 展会为期5天 [1] - 英伟达展台展出四款机器人产品 包括智平方Alpha Bot 2 加速进化的加速T1 天工2.0 银河通用Galbot(G1) 吸引大量观众围观 [1] - Galbot(G1)机器人具备实际服务功能 可完成从饮料柜取饮并递送给观众的动作 其他机器人具备人机交互能力 [1] 行业领袖观点 - 英伟达CEO黄仁勋强调AI研究开源化趋势 指出当前大部分AI研究论文已实现开源 [3][5] - 开源模式涵盖研究与工程双重维度 通过集体协作可加速创新 提升生态系统整体效益 [5] - 开源模型对全球AI发展具有普适价值 中国AI领域可从中受益 Kimi等先进大模型已验证开源可行性 [5] - 开源机制具备安全性优势 全球审查机制可提升工作质量 以DeepSeek论文为例说明开源成果的高水准 [5] 技术发展洞察 - 黄仁勋提出AI具有激发人类创造力 扩展智慧边界的特性 类比飞机拓展人类活动空间 [3] - AI运行机制与人类大脑存在相似性 但实现路径不同 [3] - 之江实验室主任王坚指出算力是基础性技术变革 其影响力超越传统计算机概念 [5][6] - AI将算力价值提升至新高度 算力重构世界运行方式的效应通过AI显现 [6]
英伟达创始人兼CEO黄仁勋答上证报 中国市场令人难以置信且独一无二
上海证券报· 2025-07-17 18:13
英伟达对中国市场的评价 - 中国是英伟达全球最大市场之一 被描述为"神奇且具有活力"的市场 [2] - 阿里巴巴等中国客户拥有雄厚计算机科学实力 能利用英伟达产品创造独特服务 [2] - 中国市场被CEO黄仁勋称为"令人难以置信且独一无二" [2] 人工智能发展趋势 - AI发展呈现加速态势 每3-5年就有重大突破 [2] - AI在问题解决能力方面即将超越人类水平 [2] - 下一阶段将发展物理型人工智能 将生成式AI能力应用于机器人等物理机械 [2] - 算力进步被视为近年最重大技术变革 是AI发展的基础 [2] 中国在AI领域的表现 - 中国在开源工程方面表现突出 DeepSeek-R1、通义千问、Kimi等模型全球领先 [3] - 中国研究人员在arXiv平台论文发表量全球第一 [3] - 开源模式被认为能提高研究质量与安全性 是推动发展的最安全方式 [3] 硅技术发展前景 - 硅技术将持续进步 主要体现在三方面:三维晶体管结构、面板级封装、高密度模块互联 [3] - 未来单个芯片尺寸可能达到桌子大小 [3] 对年轻人的建议 - 建议尽早接触和使用AI 培养与AI有效互动的能力 [4] - 当代年轻人将成为"AI原住民" 需要学会与AI共同成长 [4]
英伟达盘前涨超1% 黄仁勋定义AI新浪潮 物理AI时代即将到来?
新华财经· 2025-07-17 13:06
市场表现 - AI算力方向拉升走强,英伟达产业链、PCB、光模块CPO等概念领涨市场,机器人相关概念股异动 [2] - 全市场英伟达产业链概念股含量高的5G通信ETF(515050)涨4.63%,持仓股鹏鼎控股、东山精密涨停,沪电股份、新易盛、生益科技等走强 [2] - 英伟达盘前涨超1.2%,开盘势将再创历史新高 [3] - 智微智能涨停,索辰科技涨超12%,翰博高新、天准科技等大涨 [6] - 机器人50ETF(159559)收涨1.43%,录得5连阳 [7] AI技术发展 - 人工智能的下个浪潮是物理AI(Physic AI),AI将进入物理机器如机器人 [4] - AI已从意识AI(Perception AI)到生成式AI(Generative AI),再到代理式AI(Agentic AI),接下来是物理AI(Physical AI) [4] - 算力是AI的基础架构,AI将算力带到了新境界 [5] - 英伟达最先进的CPO(硅光子技术)方案还有五到十年的研发进程 [5] - 物理AI将AI的所有能力融入物理世界,表现形式包括机器人 [5] 机器人产业 - 中国发展机器人产业优势显著,拥有大量优秀AI人才和全球最大应用场景 [7] - 英伟达新推出RTX Pro适用于数字工厂、智能工厂及机器人领域,具有光线追踪功能 [7] - 英伟达正全力打造"AI工厂",结合机器人技术可显著降低生产成本 [7] - 全球制造业劳动力缺口达千万级,人形机器人与AI的技术突破恰逢其时 [8] - 中国在机电一体化领域实力雄厚,小米、宇树等公司未来将推出机器人产品 [8] 中国市场与合作 - 中国建立了极其完善的供应链体系,在大规模消费品制造领域具有不可替代的优势 [8] - 英伟达将为中国企业提供最优质的技术支持与服务 [8] - 黄仁勋对中国本土企业推出的CUDA兼容产品持开放态度 [9] - 英伟达的核心优势在于"全栈技术整合能力",从算法架构到硬件系统的全链条创新 [9] 行业展望 - 2025年是人形机器人量产突破的关键年,万台级别量产将带动下游产业链扩张 [8] - 商业化订单落地和政策支持将激发产业动能,助推板块估值提升 [8]
穿唐装、说中文!黄仁勋盛赞中国AI
新华网财经· 2025-07-16 08:29
英伟达CEO黄仁勋链博会演讲 - 黄仁勋首次用中文致辞 盛赞中国供应链为"奇迹" 并强调AI带来新工业革命机遇 [1] - 英伟达首次参展链博会 展台展示银河通用等四家公司的机器人及DIGITS迷你超算等产品 [3] - 公司1993年成立至今已成为驱动全球AI生态的计算平台 [4] 中国AI产业贡献 - 中国开源AI被评价为全球进步的催化剂 推动各国参与AI革命 [4] - 超过150万中国开发者在英伟达平台创新 孕育DeepSeek、阿里通义等世界级大模型 [4] - AI已渗透腾讯微信、阿里淘宝、小米汽车等标志性平台 并应用于推想医疗的全球诊断系统 [4] AI技术应用场景 - 数百个中国项目运用NVIDIA Omniverse模拟数字孪生 优化工厂仓储设计 [5] - 机器人在虚拟世界中训练 以实现与人类物理协作的安全性 [5] - AI重塑医疗、能源、物流等行业 成为类似电力的基础设施 [4] 未来产业趋势 - 下一波AI浪潮将是具备物理世界理解能力的机器人系统 [7] - 未来十年工厂将由AI软件驱动 协调人机团队生产智能产品 [7] - 开源技术被强调为保障AI安全及推动国际标准协作的关键 [4]
杨植麟被梁文锋叫醒了!Kimi新模型发布即开源,1T参数全线SOTA
量子位· 2025-07-12 04:57
Kimi K2模型发布 - 发布全新Kimi K2基础大模型,采用MoE架构,总参数1T,激活参数32B,能力领先性体现在代码、Agent、数学推理任务上[2] - 模型支持128K上下文,在SWE Bench Verified、Tau2、AceBench等基准测试中取得开源模型SOTA成绩[9][11] - 模型发布即开源,提供Kimi-K2-Base基础预训练模型和Kimi-K2-Instruct指令微调版本,遵循修改版MIT协议[4][25][26] 技术能力提升 - 代码能力显著提升,支持粒子系统、可视化和3D场景开发,可生成山川峡谷3D景观和3D粒子星系模拟[17][18][19] - Agent工具调用能力增强,具备复杂指令解析能力,可自动拆解需求为可执行的ToolCall结构[22] - 数学等科学能力得到优化,通过通用强化学习和自我评价机制解决不可验证任务的奖励稀缺问题[14][34] 技术创新细节 - 采用MuonClip优化器替代传统Adam优化器,提升训练稳定性和token使用效率,完成15.5T token平稳训练[29][30][31] - 构建大规模Agentic Tool Use数据合成pipeline,覆盖数百领域数千工具,由LLM评估筛选高质量样本[32] - 通过可验证任务持续优化critic,提升泛化任务表现[34] 市场格局变化 - 2024年AI智能助手Web端市场形成Kimi智能助手、豆包AI和文心一言TOP 3格局,占据70%市场份额[56] - APP端豆包和Kimi智能助手断崖式领先,市场份额占比80%[58] - DeepSeek R1发布后市场格局巨变,形成字节豆包、DeepSeek、Kimi、腾讯元宝(DDTK)新格局[60] 公司战略调整 - Kimi通过K2开源大模型回应市场质疑,明确不放弃自研大模型的战略方向[67] - 公司选择打造更强开源大模型,追求全维度SOTA,重新证明技术领先性[68] - 模型开源策略可能改变行业竞争格局,此前已有2家"六小龙"公司放弃大模型自研[66]
万字对话王成录:替代安卓,只是鸿蒙价值的不到5%
观察者网· 2025-07-10 13:07
鸿蒙操作系统的战略定位 - 操作系统是国家科技命脉与独立自主的核心技术,鸿蒙是中国向核心技术发起的一次战略冲锋,目标成为万物智联时代统一的数字底座而非简单替代安卓/iOS [1] - 鸿蒙价值的95%在于构建万物互联的数字底座,仅5%与替代安卓相关,其分布式软总线技术打破设备物理边界实现"软件定义硬件" [3][11][12] - 公司内部2015年启动战略规划,2016年5月正式立项,基于两大驱动:华为高端产品差异化需求及对未来智能设备爆发的判断 [4][5][6] 核心技术特征与创新路径 - 三大核心DNA:1)面向多设备的统一系统 2)分布式软总线能力 3)一次开发多端部署,UI组件化实现自动适配不同终端 [12][13][17] - 分布式软总线灵感来自2005年沙特电信MSC POOL方案,通过无线协议重构实现设备逻辑统一,通信延迟低于20ms [9][10][21] - 采用"抽屉式替换"策略,逐步将鸿蒙模块嵌入EMUI系统,2017年完成1.0版本开发,2019年制裁加速正式发布 [14][15][19] 生态建设与商业化落地 - 开源战略分两步走:2020-2021年将基础能力捐献给开放原子开源基金会,形成OpenHarmony开源项目,软总线框架层完全开源 [31][33] - 行业案例:河北高速隧道实现"车来灯亮"节能方案降低30-40%电费,福州大厦3000台设备互联,天津燃气场站智能化改造 [36][37][38] - 2023年推出机器人操作系统M-Robots OS,整合哈工大等机构资源,支持异构多机协同,预计2024年7月开源 [42][43][49] 教育体系与人才培养 - 北京理工大学成立全国首个开源鸿蒙学院,四年培养120名本硕生,20%毕业生加入生态企业,哈工大/西工大等高校跟进课程设置 [52][53] - 与深圳职院共建"协同交付中心",学生参与商业项目开发,计划2024年拓展至10所高校,形成产学研闭环 [54][55] - 中国980万软件开发人员中开源贡献不足,公司推动建立"集体大农场"式协作机制提升产业效率 [56][57] 未来发展规划 - To C领域由华为主导持续扩张,To B领域锁定交通/能源等10个行业,目标2030年前实现30-50%项目采用开源鸿蒙底座 [60][61] - 构建"Wintel"式产业联盟,与芯片厂商深度协同设计,已联合十几家机器人企业形成生态飞轮效应 [48][51] - 硬件设备量是生态关键指标,2023年深开鸿license发放量达数千万,覆盖行业设备加速生态裂变 [29][35]
不只发布国际开源合作倡议,世界人工智能大会将发人形机器人产业图谱
第一财经· 2025-07-10 08:28
上海市人工智能产业发展 - 一季度上海市规上人工智能产业规模超过1180亿元,同比增长29%,利润增长65% [1][3] - 上海将人工智能视为三大先导产业之一,通过"模塑申城"工程打造5个关键生产力工具和推进6大垂类应用 [3] - 上海正在加快大规模智算集群建设,提供普惠算力服务,并建设高质量公共语料平台 [4] - 上海设立算力券、模型券、语料券支持创新型企业和高校优惠使用智能算力、语料库等资源 [4] - 上海正在征集50余个城市级示范场景,为垂类应用开发提供训练场和试验田 [5] 世界人工智能大会 - 今年将举办第七届世界人工智能大会,宣布更多合作倡议和产业成果 [1] - 大会将发布《国际人工智能开源合作倡议》,号召全球以开源为纽带共建开放包容社区 [1] - 大会将举办"人形机器人与具身智能发展"论坛,发布人形机器人产业图谱 [3] - 大会将展示相当多的应用场景,体现上海人工智能赋能千行百业的成果 [3] 人工智能应用推进 - 上海正在加快制定"AI+制造"行动方案,围绕10个制造业方向打造复合性场景和标杆工厂 [5] - 上海通过构建"开源+社区"两大载体,加快培育面向基础共性、典型场景的智能服务商 [4] - 上海采取三方面措施赋能各行各业:支持AI赋能新模式、深化AI应用新场景、优化AI落地新机制 [3]
Meta 抢占AI霸权争夺加剧,微美全息(WIMI.US)布局产业生态应对市场竞争
Meta在人工智能领域的战略布局 - 公司正斥资数十亿美元建设数据中心以支持高端大型语言模型的开发和驱动 [1] - 投入数十亿美元挖走顶尖人才和技术,包括从OpenAI苏黎世办事处挖走三名研究员 [2] - 开出高达1亿美元的签约费用吸引人才,已有四人加入公司的超级智能团队 [4] - 同意以148亿美元收购人工智能初创公司Scale AI 49%的股份,为史上最大外部投资 [4] 人工智能大模型领域的竞争态势 - 中国已有433款大模型完成备案并上线提供服务,反映大模型研发能力跃升 [7] - 开源成为重要发展模式,推动基座大模型创新生态培育和技术垄断打破 [7] - DeepSeek等优质模型促进中小企业便捷定制和微调,加速创新应用扩散 [7] 微美全息的人工智能战略 - 搭建高性能AI算力基地,集成多元异构架构芯片以支持大模型训练与推理 [9] - 基于DeepSeek开发自然语言处理、代码补全等AI应用,通过算法优化降低成本 [9] - 推动生成式AI在电商直播、数字营销等场景渗透,构建差异化竞争力 [9] 人工智能场景创新与未来发展 - AI场景创新促进大模型落地应用向纵深推进,支撑智慧制造、医疗、交通等领域 [10] - 复杂场景需求反向拉动大模型高精度、高水平迭代升级 [10] - 企业将更加注重底层技术开发和基础研究,为大模型发展奠定基础 [10]
罗马仕深夜正式发布停工停产通知,将停工6个月|首席资讯日报
首席商业评论· 2025-07-07 03:55
湖北省人形机器人产业投资母基金 - 湖北省设立总规模100亿元的人形机器人产业投资母基金,首期规模50亿元,省政府投资引导基金和武汉产业基金各认缴20%,长江证券和湖北省科投集团各认缴30% [1] - 基金重点投向人形机器人和人工智能相关产业核心领域,包括湖北省重点发展的人形机器人链主企业及具有核心技术实力的零部件、脑机接口、控制系统、模型算法等科技型企业 [1] 华为盘古团队开源声明 - 华为诺亚方舟实验室声明盘古Pro MoE开源模型基于昇腾硬件平台开发训练,并非基于其他厂商模型增量训练 [2] - 团队表示严格遵循开源许可证要求,在开源代码文件中清晰标注版权声明,符合开源社区通行做法 [2] 美团即时零售订单数据 - 美团即时零售日订单突破1.2亿单,其中餐饮订单超过1亿单 [3] - 2小时内订单增长超过2000万笔,周末夜宵时段仍是外卖高峰期 [3] - 即时配送已成为消费新常态 [4] 罗马仕停工停产事件 - 罗马仕发布停工停产通知,自2025年7月7日起持续6个月 [5] - 停工期间首月按约定标准支付工资,次月起按当地最低工资标准80%支付生活费 [5] - 公司召回2023年6月至2024年7月期间制造的三个型号充电宝,共491745台,并向消费者致歉 [14] 新能源汽车动态 - 蔚来乐道L90起售价将低于30万元,展车将于7月10日到店并开启预售 [7] - 理想汽车CEO李想表示造车需All in,曾建议雷军全力投入 [8][9] - 李想透露理想汽车未来定位为空间机器人企业,专注AI硬件终端颠覆性产品 [13] 马斯克政治动向 - 马斯克宣布成立"美国党",并计划明年参选 [10] 暑期档电影票房 - 2025年暑期档总票房突破25亿元,《酱园弄·悬案》《碟中谍8》《名侦探柯南》暂列前三 [11] 盗版Labubu市场现状 - 盗版Labubu产品成本仅几元,海外售价可达20美元以上且供不应求 [12] - 专家建议正版厂商平衡市场供求,可借鉴NFT方式防伪 [12] 机器人产业趋势 - 华泰证券认为机器人产业进入去伪存真阶段,投资需关注实际应用效果和订单情况 [15] - 市场关注点从运控能力转向大脑能力,再到应用效果,投资范式转向务实 [15]