具身智能之心 - 财报，业绩电话会，研报，新闻

具身智能之心

搜索文档

具身智能之心· 2025-12-05 16:02

文章核心观点 - 由清华姚班校友领军的中国初创公司“词元无限”开发的编码智能体InfCode，在SWE-Bench Verified和Multi-SWE-bench-CPP两项权威基准测试中均取得第一名的成绩，标志着AI编程从注重快速原型的“感性时代”（Vibe Coding）进入了面向企业级复杂工程的“工程时代” [6][9] - InfCode的技术突破主要体现在其多智能体体系，能够解决传统AI编程在大型代码库、跨文件修改和C++等系统级语言中面临的挑战，为企业引入AI编码提供了从“单体提效”走向“组织进化”的新范式 [8][12][17] AI编程范式演进与行业基准 - AI编程正从传统大模型生成代码片段，演进为强调自主性、全流程覆盖和工程实用性的“编码智能体”（Coding Agent）时代 [10][11] - **SWE-Bench Verified**：由普林斯顿大学等提出、OpenAI升级的权威基准，包含来自真实GitHub项目的Python问题，要求智能体解决问题且不破坏其他功能 [11] - **Multi-SWE-bench**：由字节跳动等机构于2025年推出，覆盖Java、TypeScript、JavaScript、Go、Rust、C与C++七种语言，包含1632个人工验证的修复任务 [11] - 系统级语言（如C++）的修复任务远难于高级语言，通常需要一次修改200多行、涉及7个文件，导致大语言模型表现显著降低，领先模型的解决率往往不足8% [12][16] 公司产品InfCode的性能表现 - 在**SWE-Bench Verified**基准上，InfCode以Pass@1得分**79.4%** 刷新世界最佳记录（SOTA），远高于公开排行榜上GPT-5、Claude等顶尖模型约70%的成绩 [7][14] - 在**Multi-SWE-bench的C++子集**上，InfCode达到**25.58%** 的解决率，大幅领先于Claude 3.7 Sonnet的**8.59%**、DeepSeek V3的**7.75%** 以及Qwen2.5-72B-Instruct几乎为零的解决率 [7][15][16] - 该成绩体现了产品在复杂语法和大型项目中生成正确补丁的能力，对工业界具有重要价值 [17] InfCode的核心技术亮点 - **基于功能意图的复杂上下文定位**：提出“代码意图分析”机制，超越传统基于向量相似度的RAG，通过理解自然语言背后的功能意图并将其映射到具体实现单元，精准定位问题代码，尤其在无堆栈信息的条件下表现突出 [20][21] - **基于AST的结构化检索**：自研基于抽象语法树的结构化检索引擎，通过Tree-Sitter构建完整语法树，提供如FindClass、FindFunction等语法层API，实现语法感知搜索，在C++等复杂语言中能高精度定位bug，避免传统文本搜索工具（如grep）的噪声问题 [22][23][25][26][28] - **对抗式双智能体生成架构**：首创由代码补丁生成器与测试补丁生成器构成的对抗式双智能体架构，二者在闭环中交替迭代，使补丁在鲁棒性与完备性上持续演化，达到工程级质量，契合了下一代编码智能体迭代-验证-优化的核心范式 [29][30][31][32][33] 产品的工程化流程 - 修复流程分为**生成**与**筛选**两阶段 [35] - **生成阶段**：系统并行启动多个独立容器运行修复链路，允许模型查看代码库、运行测试、分析错误，并最多进行五轮迭代以产生多样化候选补丁 [40] - **筛选阶段**：在真实构建和测试环境中重放每个补丁，除验证测试通过外，还考虑行为一致性、稳定性和副作用，最终选出具有更强工程完整性与可维护性的补丁 [40] 公司团队背景与战略 - 核心团队由**清华姚班校友**带队，拥有顶尖技术实力，并融合了技术前瞻、产品化能力与商业化思维 [6][42] - 团队领军人物**杨萍**曾在字节跳动主导创立公司首个软件工程实验室，其孵化的内部AI Coding产品已全面覆盖公司研发体系，对在超大规模组织中应用AI有深刻理解 [42] - **CTO 王伟**来自清华姚班，曾带队在SWE-Bench获得全球第二的成绩，具备扎实的大模型与智能体算法工程经验 [42] - **商业化负责人李莹**拥有十余年AI产业落地经验，曾主导完成大模型To B领域数亿元规模的项目落地，具备将技术价值转化为商业回报的能力 [43] - 团队汇聚了来自字节、百度、微软等顶尖企业及清华、北大、哥大、MIT等世界名校的人才，构成“顶尖老将 + 新生代骨干”组合，多个重要岗位由00后领衔 [43] - 公司对AI Coding赛道的认知已从“工具效能”提升转向对软件工程全生命周期的重构（AI SWE），致力于打造提供端到端价值闭环的“数字员工”平台，并通过“Coding + 细分行业”的深度融合构建商业生态闭环 [44]

对话多个行业大佬！VLA与RL方案在真机上的部署怎么样啦？

具身智能之心· 2025-12-05 16:02

直播活动概览 - 具身智能之心公众号将举办一场主题为“VLA与RL的真机部署如何更好落地”的线上直播 [13] - 直播时间为12月6日19:30，可通过扫描二维码免费观看 [25] - 直播将围绕VLA算法与RL落地问题展开，探讨多个具体技术话题 [3][16] 分享嘉宾背景 - **隋伟 (地瓜机器人副总裁)**：曾任职地平线，负责机器人与自动驾驶的2.5D及3D视觉算法研发，带领30人团队开发了高阶自动驾驶BEV感知方案并搭建了先进的4D标注系统，其成果已在数百万片旭日系列芯片和多个量产车型上应用，发表论文20余篇，拥有专利40多项 [4][5] - **张强 (北京人形机器人首席研究员和学术委主任)**：研究方向包括人形机器人运动控制、多模态感知及具身智能体，曾在Fourier GR-1、PNDbotics Adam及天工机器人平台担任强化学习算法核心研发，发表数十篇顶会顶刊论文 [6][7][8] - **汪天才 (原力灵机合伙人)**：原旷视科技高级研究员，是端到端自动驾驶算法PETR及多目标追踪算法MOTR的核心作者，发表顶会顶刊论文30余篇，谷歌学术引用量超6000次，PETR论文入选2022年最具影响力百篇AI论文 [9][10] - **于超 (清华深圳研究院助理教授)**：研究方向为强化学习驱动的决策智能，以第一/通讯作者发表顶级会议期刊论文50余篇，谷歌学术总引用4600余次，其NeurIPS 2022论文MAPPO引用超2000次 [11][12] 核心讨论议题 - VLA的架构和模型目前存在哪些痛点 [7][16] - 让机器人“舞得更好”的全身运动控制方案还有哪些进化空间 [7][16] - VLA与强化学习如何更好地在真机上部署，包括如何挑选硬件“板子”以及轻量化实现方法 [7][16] 后续深度内容 - 直播完整版深度内容、技术细节、QA及未公开彩蛋已独家上线知识星球「具身智能之心」 [28] - 知识星球涵盖多个深度技术解析主题，包括灵巧手设计与难题、Agent概念探讨、VLA推理加速框架Spec-VLA以及CMU的跨实体世界模型等 [28]