Workflow
RLinf
icon
搜索文档
【产业互联网周报】 《上海合作组织成员国元首理事会关于进一步深化人工智能国际合作的声明》发布;工信部:前7个月软件业务收入83246亿元,同比增长12....
钛媒体APP· 2025-09-08 02:52
国内AI大模型与开源框架进展 - 美团正式发布并开源采用创新性混合专家模型架构的LongCat-Flash-Chat 总参数560B 激活参数18.6B-31.3B(平均27B)[2] - 清华大学等机构联合开源首个面向具身智能的大规模强化学习框架RLinf 实现超120%系统提速 VLA模型性能提升40%-60% 1.5B和7B数学推理大模型在AIME24等数据集取得SOTA[3] - 阿里推出智能体开发框架AgentScope 1.0 提供覆盖开发部署监控全生命周期的生产级解决方案[8] - 腾讯开源智能体框架Youtu-Agent 不依赖海外闭源大模型API 完全基于开源生态[9] - 月之暗面Kimi K2模型更新至0905版本 上下文长度扩展至256K 输出速度达60-100 Token/s[18] - 华为公布AI模型运行专利 通过嵌入向量预取技术减少处理延时[19] 3D建模与空间智能技术 - 腾讯发布混元Voyager3D世界模型 业界首个支持原生3D重建的超长漫游世界模型 为虚拟现实/游戏开发提供高保真3D场景漫游能力[10] Web3.0与区块链安全布局 - 三未信安作为香港Web3.0标准化协会副理事长单位 针对稳定币/RWA等Web3.0应用场景布局 重点提供RWA数据上链/冷热钱包/资产托管解决方案[7] - 公司牵头制定国内首个区块链密码行业标准GM/T 0111-2021 研制首批通过国家商密认证的区块链密码机[7] 算力基础设施与芯片研发 - 神州数码以神州鲲泰智算产品为基础 丰富算力设备形态 强化智算基建支撑能力[11] - 上海支持人工智能高性能训练/推理芯片及端侧芯片研发应用 加快超大规模智算集群技术突破[44] - 华为公布AI模型运行专利 优化处理器与计算卡间的数据预取机制[19] 具身智能与机器人合作 - 神州数码与宇树科技等多家具身智能头部企业合作 联手打造面向巡检/安防等场景的解决方案[11] - 上海支持具身智能机器人在物流装配/工业制造/医疗康养等领域打造应用示范场景[45] 数据安全与标准化建设 - 人工智能生成合成内容标识等一批国家标准于9月1日实施 GB 45438—2025标准规范AI生成内容标识方法[4] - 北京数据集团正式注册成立 注册资本30亿元 经营范围涵盖大数据服务/人工智能公共服务平台技术咨询[5][6] - 两部门鼓励企业开展DCMM评估 加强人工智能高质量数据集建设[47] 企业战略合作与股权激励 - 字节跳动为Seed部门大模型技术人员增发期权 员工每月可获得9-13万元期权 累计总量达百万元[12] - 抖音在上海成立小荷智能医疗科技公司 注册资本10万元 专注人工智能应用软件开发[13] - 蚂蚁集团旗下公司入股昕原半导体 后者专注ReRAM新型存储技术研发[27] - 蚂蚁集团旗下公司入股烨知芯科技 加强集成电路芯片设计布局[31] 国际合作与政策支持 - 中国-上海合作组织数字经济合作先行区落地天津滨海新区 推动数据基础设施互联互通和标准协议互认[14][15] - 上合组织发布深化人工智能国际合作声明 将加强基础设施合作/人才培养/投资合作[39] - 工信部表示将积极参与数字经济/人工智能等领域全球治理[40] - 国家发改委将持续在算力等领域发放"人工智能券" 推动降低研发使用成本[33] - 围绕"人工智能+"行动将出台配套细则 分层分行业加快标准制订[34] 行业数据与市场表现 - 前7个月软件业务收入83246亿元同比增长12.3% 利润总额10890亿元增长12.4%[41] - 1-7月规模以上互联网企业实现利润总额938.8亿元同比下降1.8% 研发经费580.3亿元增长2.8%[42][43] - 基础软件产品收入1052亿元增长13% 工业软件产品收入1677亿元增长8.8%[41] 融资并购与IPO动态 - Anthropic完成130亿美元新一轮融资 估值达1830亿美元 为AI领域最大规模融资之一[28] - OpenAI以11亿美元收购产品测试初创公司Statsig 为历史上最大收购交易之一[29] - 企业级跨境支付网络Obita完成超千万美元天使轮融资 加速全球稳定币跨境支付网络布局[25] - 数据安全公司Cohesity考虑2026年IPO 英伟达已投资该公司[32] - 新紫光集团等成立芯紫志高科技公司 注册资本1000万元 专注集成电路设计[26] - 智元机器人入股江苏华智天成科技 注册资本增至约1176万元[33] 应用场景创新 - WPS正式上线"HTML素材"功能 支持运行AI大模型生成的HTML代码 为业内首个支持该功能的办公软件[16] - 中国首个"全国茶叶碳足迹数字化平台"发布 实现茶叶全产业链碳足迹精准量化管理[17] - 特斯拉发布"宏图计划4" 重点打造把AI带入物理世界的产品和服务[22]
首个具身智能大规模强化学习框架RLinf开源 无问芯穹联合清华等机构打造
北京商报· 2025-09-01 05:05
公司动态 - 无问芯穹联合清华大学、北京中关村学院及北京大学、加州大学伯克利分校等机构正式开源首个面向具身智能的"渲训推一体化"大规模强化学习框架RLinf [1] - RLinf名称中"inf"代表"infrastructure"(基础设施)并寓意"infinite"(无限扩展) [1] - 框架通过六大层级(用户层、任务层、执行层、调度层、通信层、硬件层)设计突破技术难点 [1] 技术突破 - RLinf核心解决当前框架对具身智能支持受限的问题 [1] - 相比纯推理大模型,具身智能需兼顾"大脑"(推理规划)与"小脑"(执行操作) [1] - 具身智能存在"渲训推一体化"特性,对算力、显存及框架灵活性要求更高 [1]
首个具身智能大规模强化学习框架RLinf开源,无问芯穹联合清华等机构打造
北京商报· 2025-09-01 04:49
公司技术发布 - 无问芯穹联合清华大学、北京中关村学院及北京大学、加州大学伯克利分校等机构开源首个面向具身智能的"渲训推一体化"大规模强化学习框架RLinf [1] - RLinf名称中"inf"代表基础设施和无限扩展 核心解决当前框架对具身智能支持受限的问题 [1] - 框架通过六大层级设计突破技术难点 包括用户层、任务层、执行层、调度层、通信层和硬件层 [1] 行业技术发展 - 具身智能需兼顾"大脑"推理规划与"小脑"执行操作 相比纯推理大模型对算力、显存及框架灵活性要求更高 [1] - RLinf具备"渲训推一体化"特性 为人工智能从"感知"向"行动"跨越提供关键技术支撑 [1]
RLinf开源!首个面向具身智能“渲训推一体化”的大规模强化学习框架
具身智能之心· 2025-09-01 04:02
文章核心观点 - 清华大学、北京中关村学院和无问芯穹联合推出面向具身智能的大规模强化学习框架RLinf 该框架通过创新的混合式执行模式、统一编程接口和自适应通信机制 在具身智能训练场景下实现系统提速超120% 模型性能提升40%-60% 同时支持数学推理大模型训练并取得SOTA性能[5][7][9][24][29] 技术架构设计 - 系统采用六层级抽象架构 包括用户层、任务层、执行层、调度层、通信层和硬件层 支持混合式执行模式[7] - 提出宏工作流到微执行流映射机制(M2Flow) 实现过程式编程灵活性与声明式编程优化能力的结合[14] - 支持三种执行模式:共享式(组件常驻或交替使用GPU)、分离式(组件流水线执行)、混合式(自定义组合放置形式)[15][17] 性能表现 - 在具身智能训练中相比分离式执行模式系统提速超120%[7][24][27] - OpenVLA模型在Maniskill3任务中成功率从SFT后的30%-50%提升至80%-90% 涨幅40%-50%[24][28] - OpenVLA-OFT在LIBERO测试平台平均成功率97.3% 相比SFT模型提升62.4%[24][26] - 1.5B数学推理模型在AIME24/AIME25/GPQA-diamond数据集分别达48.44%/35.63%/38.46% 平均40.84%[29][30] - 7B数学推理模型在相同数据集达68.33%/52.19%/48.18% 平均56.23% 均实现SOTA[29][31] 系统优化特性 - 集成两套后端:Megatron+SGLang/vLLM支持已收敛模型架构 FSDP+HuggingFace支持未收敛模型架构[21] - 自适应通信库包含四项优化:自适应CUDAIPC/NCCL通信、负载均衡传输队列、多通道并发通信、快速通信重配置[19][22][25] - 自动化调度模块支持秒级在线扩缩容 70B模型1秒完成5D并行动态扩缩[23] - 支持LoRA训练、断点续训、多可视化工具集成 正在集成SFT模块提供一站式服务[18] 应用范围 - 专门支持Vision-Language-Action Models(VLAs)+RL训练 集成OpenVLA、OpenVLA-OFT、Pi 0等主流具身大模型[24] - 支持百余类具身智能任务 涵盖CPU-based和GPU-based仿真器[24] - 率先实现Pi 0的大规模强化学习微调 相关算法将于9月底发布[24] - 框架设计具通用性 可快速支持其他非具身智能应用场景[29]
首个为具身智能而生的大规模强化学习框架RLinf!清华、北京中关村学院、无问芯穹等重磅开源
机器之心· 2025-09-01 02:49
清华大学、北京中关村学院、无问芯穹联合北大、伯克利等机构重磅开源RLinf:首个面向具身智能的"渲训推一体化"大规模强化学习框架。 人工智能正在经历从 "感知" 到 "行动" 的跨越式发展,融合大模型的具身智能被认为是人工智能的下一发展阶段,成为学术界与工业界共同关注的话题。 机器之心报道 在大模型领域,随着 o1/R1 系列推理模型的发布,模型训练的重心逐渐从数据驱动的预训练 / 后训练转向奖励驱动的强化学习(Reinforcement Learning, RL)。 OpenAI 预测强化学习所需要的算力甚至将超过预训练。与此同时,能够将大规模算力高效利用的 RL infra 的重要性也日益凸显,近期也涌现出一批优秀的框架, 极大地促进了该领域的发展。 机器之心编辑部 图 1 : OpenAI 在红杉资本闭门会上的分享 然而,当前框架对具身智能的支持仍然受限。相比推理大模型这一类纯大脑模型,具身智能领域存在大脑(侧重推理、长程规划,如RoboBrain)、小脑(侧重执 行、短程操作,如OpenVLA)及大小脑联合(快慢系统,如pi 0.5)等多样模型。 其次, 具身智能除了包含Agentic AI的多步决策 ...