强化学习
搜索文档
清华系前腾讯Robotics X核心成员创业,业内首款能“单手玩手机”的灵巧手来了|涌现新项目
36氪· 2025-09-06 23:56
公司及产品介绍 - 源升智能机器人(深圳)有限公司发布首款五指灵巧手产品Apex Hand 强调在自由度、动态性能等关键指标上的均衡表现 是业内首个可单手操作手机的灵巧手 能够完成把脉、操作鼠标等手部任务[1] - 产品具备六个核心能力:21个自由度覆盖人手工作需求 响应/加速度接近人手级 单指指尖力约2.5KG 垂直提拉极限约30KG 可承受意外撞击 精度≤0.1mm 通过自研电子皮肤实现触觉感知[3] - 产品通过Kapandji对指测试 实现狭小空间光滑物体稳定抓取及人类工具使用 单指指尖力可戳破1cm厚木板[3][14] 技术优势 - 公司具备灵巧手和触觉传感器全栈开发经验 采用内刚外柔结构保证负载能力与交互安全性[3] - 首创类脑式超高时空分辨率触觉处理技术 具备亚毫秒通讯延迟 支持上万个触觉点同时传输 刷新频率>1000Hz[4] - 自研电子皮肤采用柔性材质 解决橡胶材质柔软度与耐用性难以兼得的问题[4] 团队与研发背景 - 创始人兼CEO杨思成毕业于北京航空航天大学和清华大学 曾为腾讯Robotics X实验室最早核心成员[1] - 联合创始人兼CTO李望维拥有新加坡国立大学博士学位[1] - 创始团队在灵巧手与触觉感知领域累计发表顶刊论文近50篇 专利超过100项[1] 融资进展 - 2025年8月完成数千万元天使+轮融资 由千乘资本领投 浔商创投和老股东昆仲资本跟投[2] 行业分析与市场前景 - 灵巧手是具身智能落地主要瓶颈 特斯拉Optimus机器人手部研发占整体工程量近一半[15] - 2024年AI模型能力突破使强化学习解决高自由度灵巧手控制问题成为可能 行业进入产品化阶段[15] - QYResearch预测2030年灵巧手市场规模超50亿美元 公司比拼重点在于产品化突破速度[16] 产品设计理念 - 21个自由度可复现人手绝大部分能力 超过21个自由度会增加电机数量并带来控制难题[9][10] - 采用模块化设计保障复杂机电系统量产一致性与可靠性 避免将多个自由度机械捆绑导致维护问题[11] - 产品需兼顾灵巧性(自由度/尺寸/触觉)、实用性(负载/速度/精度)和鲁棒性(非结构化环境适应性)[6] 发展路径规划 - 硬件稳定性、数据瓶颈与模型能力需协同发展 2-3年内优先落地半结构化场景(如工厂特定任务)[11][12] - 公司避免过早固化到单一场景 防止偏离灵巧手开发初衷[13] - 灵巧手作为数据入口可收集物理世界交互数据 支持具身智能学习[15]
《Science Robotics》重磅:仅需2小时,机器人柔性装配技能直逼人类顶尖水平
机器人大讲堂· 2025-09-06 11:43
文章核心观点 - 美国伯克利大学研究团队提出的人机协同强化学习系统HIL-SERL,通过巧妙融合人类引导与机器人自主探索,仅需1至2.5小时的真实世界训练,即可使机器人精通一系列复杂操作任务,成功率接近100%,执行速度超越人类水平,并展现出强大的抗干扰与自适应能力[2][9] 传统方法困境与HIL-SERL系统原理 - 传统机器人操控方法依赖精心设计的控制规则或模仿学习,缺乏适应性,在新场景易失败,且难以达到人类水平的熟练度和速度[1] - 强化学习在模拟环境中表现优异,但在现实世界训练存在成本高、效率低和安全风险等难题[1] - HIL-SERL系统通过少量人类演示提供入门指导,随后在机器人自主尝试中,由人类操作员进行干预纠正,并将纠正数据纳入训练,形成高效安全的学习闭环[3] - 系统架构由执行器进程、学习器进程及重放缓冲区三个分布式核心组件构成,采用离策略强化学习技术,整合预训练视觉模型与安全底层控制器[4] 系统性能验证与实验结果 - 实验设计涵盖精密装配、双臂协调和动态操作等多类高难度任务,例如电脑主板组装、汽车仪表盘组装及平底锅翻转物体等[5][8] - 经过1至2.5小时真实训练后,机器人在各项任务中成功率接近100%,执行速度比模仿学习快1.8倍,显著高于HG-DAgger基线49.7%的平均成功率[9] - 在部分任务如叠叠乐、插入RAM棒和组装正时皮带上的表现超越了人类操作员[9] - 系统展现出强大抗干扰能力,在面对主板移动5毫米、夹爪被掰开、零件旋转15度等突发状况时,能迅速调整策略,如微调机械臂角度或加大握力,实现实时纠错[9][10][12] 系统策略演化与适应性原理 - 系统能根据任务需求自主演化出不同的控制策略,无需人为指定[13][16] - 对于高精度实时调整任务,系统学会闭环反应策略,动作方差初期较高允许试探,接近目标时迅速降低以实现精细调整,并能基于感官反馈进行实时纠错[13] - 对于动态操作任务,系统采用开环预测策略,动作方差全程保持低位,执行预先规划的稳定连贯动作序列[13] - 此方法通过直接在感知数据上学习,编码了解决任务所需的内在动态,避免了传统方法对复杂动态建模和状态估计的高度依赖,更高效且易扩展[16] 研究意义与行业应用展望 - 研究证明,结合高效算法、预训练视觉模型、安全控制和人类指导,强化学习能克服样本效率低和安全性差的弱点,直接在现实世界中高效学习复杂技能[14] - 该技术为工业应用打开新局面,特别适用于需要多品种、小批量生产的柔性制造领域,如电子产品组装、汽车零部件装配等[14] - 未来,此类系统可作为生成高质量机器人数据的“技能引擎”,为训练更通用的机器人基础模型提供支持,最终实现真正通用的机器人操作能力[14]
想要「版本」超车,Agent 需要怎样的「Environment」?
机器之心· 2025-09-06 07:00
AI行业战略转型 - AI创企you.com完成1亿美元C轮融资 同时宣布从搜索引擎转型为AI基础设施公司[1] - 转型遵循"产品驱动基础设施"战略模式 顺应Agentic AI商业化趋势[1] Agentic AI发展趋势 - 人工智能重心从生成式AI转向具备自主执行能力的Agentic AI[4] - 吴恩达多次强调AI Agent将成为人机交互新界面 用户可通过自然语言指令替代传统编码交互[5] - Cursor、Bolt和Mercor等公司通过智能体产品实现显著营收增长[6] Agent环境需求演变 - 具备Computer Use能力的AI Agent可直接通过像素信息与图形界面交互 摆脱API依赖[6] - 开发者面临自由度与安全性的矛盾:既希望Agent能运行任意代码 又需确保环境隔离和敏感信息保护[6] - 现代Agent环境需求从训练场转变为作业区 需提供对真实世界工具的安全访问[9] Agent环境解决方案 - E2B和Modal Labs等公司通过虚拟机形式提供安全隔离的云环境(Sandbox) 专用于运行AI生成代码[7] - Agent Environment定义为AI智能体生存和行动的数字或物理空间 提供必要输入和行动定义[7] - 环境分类包括:物理环境(机器人/无人车)、数字环境(虚拟助手)以及人类作为交互对象的环境[10] 代表性项目 - E2B的Sandbox和Browserbase的AI浏览器是Agent Environment领域的典型创业项目[1][7] - 不同Agent应用对应特定环境:Manus使用虚拟机 DeVin对应浏览器 Flowith对应笔记本[10]
深度|OpenAI联创:GPT-5的突破在于智能开始触及真正的深度认知领域;理想状态应该是默认使用我们的自动选择,而非手动配置
Z Potentials· 2025-09-06 04:40
文章核心观点 - OpenAI联合创始人Greg Brockman分享GPT-5和GPT-OSS的技术突破及AGI战略路径 强调推理能力演进、算力核心地位和模型泛化能力 [3][4][6] - GPT-5实现深度认知突破 在数学证明、编程和科研领域达到接近人类专家的智能水平 标志AGI发展进入新阶段 [24][25][26] - 强化学习与在线学习范式成为技术核心 通过推理-训练循环和现实交互提升模型可靠性 推动智能体集群协同发展 [9][10][29] - 算力规模化是技术突破的根本驱动力 成本两年半降低1000倍 未来算力分配将成社会核心议题 [12][39][59] OpenAI推理能力演进 - GPT-4后期训练发现对话能力 但存在可靠性不足和错误答案问题 通过强化学习实践提升假设验证能力 [5][6] - 推理技术团队提出10种方案验证 最终由Jerry领导团队取得突破 依赖卓越基础设施和跨团队协同 [7] - 模型从离线预训练转向在线学习 通过token价值强化实现高质量数据生成 样本效率远超传统预训练 [8][9] - 人类策划任务产生高杠杆效应 10-100个任务可激发复杂行为 下一步将实现实时在线学习 [10] 算力规模化与超临界学习 - 算力是根本瓶颈 通过持续突破算力边界推进技术 扩展过程蕴含工程实践价值 [11][12] - 算力转化为智能势能 通过摊销效应降低单次使用成本 形成优美技术范式 [12] - IMO模型能力可迁移至IOI竞赛 核心团队仅三人 证明通用学习技术解决复杂问题的可迁移性 [14] - 生物学语言与人类语言在神经网络中同构 400亿参数模型已达GPT-2水平 需突破长上下文处理 [18][21][22] GPT-5技术特征与应用 - 智能达到深度认知领域 能写出媲美人类的数学证明 在编程任务中实现无需调整的完美执行 [23][24] - 作为科研合作伙伴加速研究 帮助物理学家快速推导洞见 改变传统科研范式 [25] - 在竞争性编程平台表现卓越 但真实编程环境更复杂 需连接智能与现实应用多样性 [26][27] - 通过多实例协同释放潜力 用户需培养模型直觉 成为智能体集群管理者而非单智能体 [28] 模型优化与安全架构 - 采用指令层级技术建立信任层级 类似SQL注入防护 通过沙盒隔离和多级防护保证安全性 [30] - Model Spec提供价值对齐框架 规范与行为差距持续缩小 社区反馈完善争议问题处理 [31] - 架构决策受限于运行时资源 混合专家模型优化内存占用和计算消耗 体现工程务实性 [43] - 本地与远程模型协同实现隐私架构 边缘计算保持基础功能 智能分配计算负载 [44] 技术普及与生态建设 - 降价策略激进 价格降低80%后用量激增 需求曲线陡峭 推理效率持续优化 [39] - 开源模型构建技术栈依存关系 有利于商业发展和国家战略 形成完整生态系统 [46] - 软件工程变革聚焦AI优化架构 创建自包含单元和模块组合 提升10倍效率 [47][48] - 算力分配成未来核心议题 物质需求满足后 算力访问权决定问题解决能力 [59] 发展路径与行业展望 - 研究领域存在多样性 各实验室持有独特视角 OpenAI专注阶跃式突破和范式转移 [52][53] - 多模态、语音、图像生成相互关联 但需聚焦连贯核心问题 硬件瓶颈领域进展缓慢 [55] - 模型连接现实应用蕴藏机遇 需深入理解行业和建立合作关系 而非单纯技术优化 [56] - 技术发展速度使2045年难以想象 人类或成多行星物种 算力需求持续飙升 [58][59]
沉寂一个月,openPangu性能飙升8%!华为1B开源模型来了
机器之心· 2025-09-05 04:31
端侧AI模型技术突破 - 华为发布专为昇腾端侧硬件打造的高性能语言模型openPangu Embedded-1B 通过软硬件协同设计显著降低推理延迟并提升资源利用率 采用多阶段训练策略增强任务表现[1] - 模型仅10亿参数但实现性能与效率高度协同 树立"小模型大能力"新标杆 成功将强大AI能力带入端侧设备[2] 性能表现与基准测试 - 模型在多个权威基准上创下10亿参数级别全新SOTA纪录 整体平均分达63.90 持平更大规模Qwen3-1.7B模型(63.69分)[3] - 数学推理能力突出 GSM8K数学基准达82.76% MATH数学题集达81.83% 大幅领先同类模型[3] - 相比上月开源版本V1 V1.1版本平均分实现8%以上大幅跃升 显示开源盘古系列加速迭代升级[5] 软硬件协同优化 - 针对昇腾Atlas硬件特性定制网络超参数 隐藏层规模与前馈网络维度匹配高效吞吐配置 确保计算单元充分利用[9] - 在Atlas 200I A2硬件上首字输出延迟仅约1.8秒 后续每词生成约0.156秒 速度优势显著[12] 创新训练方法 - 采用两阶段课程学习式微调 第一阶段专注理性推理能力 第二阶段训练快速作答 激活深层推理能力[15][23] - 引入离线On-Policy知识蒸馏方法 学生模型自主作答后教师模型针对性指导 提升准确率和泛化能力[18][24] - 采用多源奖励强化学习机制 数学代码任务使用规则奖励 复杂任务采用轻量级LLM评估 结合格式规范奖励策略[22][25] - 开发昇腾NPU集群高效并行方案 减少约30%设备空闲 通过主机-设备权重共享优化大规模强化学习运行效率[21] 技术发展前景 - 提出自适应快慢融合方案 模型可根据问题难度自动选择快速作答或深入推理 在保持精度的同时提高易答问题效率[29] - openPangu-Embedded-7B模型已应用该策略并在7B量级取得领先 升级版本即将开源[30]
从近1000篇工作中,看具身智能的技术发展路线!
具身智能之心· 2025-09-05 00:45
机器人操作技术演进 - 机器人操作从机械编程向具身智能演进 从简单夹爪发展到多指灵巧手[5] - 灵巧操作依赖数据采集与技能学习框架 包括模拟 人类演示和遥操作三种数据采集方式以及模仿学习与强化学习两种学习框架[5] - 面临三大关键挑战 涉及复杂被操作对象和多样操作类型[5][8] - 核心技术方向包括灵巧操作 多指手 人工智能赋能机器人 数据采集 模仿学习和强化学习[6] 具身导航与物理模拟器 - 导航与操作是具身智能核心能力 现实训练存在高成本问题 Sim-to-Real迁移受域差距制约[9] - 物理模拟器分为室内型 室外型和通用型 包括Habitat AI2-THOR CARLA AirSim ThreeDWorld和Isaac Sim等[14][15] - 导航从显式记忆转向隐式记忆 操作从强化学习拓展至模仿学习 扩散策略及VLA模型[15] - 操作任务按复杂程度和自由度递增 硬件演进涵盖多种类型[13] 具身多模态大模型发展 - 具身多模态大模型可弥合感知 认知与动作鸿沟 基础构成包括具身智能体 大语言模型 大视觉模型和视觉语言模型等[16][19] - 核心任务涵盖具身感知 导航 交互和仿真 感知分GPT与非GPT模型 导航分通用与专用模型 交互分短长视域动作策略[19] - 数据集包括Open X-Embodiment和HM3D等 面临跨模态对齐难 计算资源消耗大 领域泛化性弱等技术挑战[19] 具身仿真与研究任务 - 具身AI模拟器存在真实感 可扩展性和交互性问题 研究任务面临长轨迹记忆设计等多重挑战[20][24] - 视觉探索通过运动或感知构建环境内部模型 方法分好奇心驱动 覆盖最大化和重建驱动 核心数据集为Matterport3D和Gibson V1[24] - 视觉导航含点导航 物体导航 带先验导航和视觉语言导航 评估指标以成功率和路径长度加权成功率为主[24] 强化学习在视觉领域应用 - 强化学习在大语言模型中成效显著 近年拓展至视觉多模态领域 面临高维视觉输入等挑战[25] - 基础理论涵盖RLHF DPO和RLVR三大对齐范式 以及PPO和GRPO两种策略优化算法[26] - 核心研究方向包括多模态大语言模型 视觉生成 统一模型和视觉语言动作模型[28] 遥操作与人形机器人 - 人形机器人遥操作可结合人类认知与机器人物理能力 适配人类环境与危险场景如核救援和空间探索[29] - 系统架构含人类状态测量 运动重定向 机器人控制和多模态反馈 支持单向或双向遥操作[32] - 应用包括远程存在和危险作业等 挑战集中在非专家操作门槛 动态环境适应和长延迟稳定性[35] 视觉语言动作模型进展 - VLA模型从跨模态学习架构演化至融合视觉语言模型和动作规划器的通用智能体 涵盖80多个近三年发布的模型[33] - 按架构范式分类 提出基于任务复杂度 模态多样性和数据集规模的新型评估标准 涉及102个VLA模型和26个基础数据集[36] - 发展历程分萌芽 探索和快速发展三阶段 从模型架构 训练数据 预训练方法 后训练方法和模型评估五个维度剖析现状[38] - 横向整合VLA建模实践 提出单体模型与分层模型的分类体系 探索强化学习融合等前沿方向[41]
GPT-5被批过度炒作、性能落后,OpenAI联创揭秘其中原因:我们把它关在 “象牙塔”,和现实世界接触不够
AI前线· 2025-09-04 06:30
GPT-5企业市场表现 - GPT-5目标用户为企业市场而非普通消费者[2] - 多家初创公司如Cursor、Vercel和Factory已将GPT-5设为默认模型 因其设置速度更快 复杂任务表现更出色且价格更低廉[2] - 在代码和界面设计领域 GPT-5已能与Anthropic的Claude相匹敌甚至实现超越[2] 企业客户反馈与测试 - Box针对长篇逻辑性文档测试GPT-5 其CEO称该模型推理能力是以往系统无法比拟的突破[3] - JetBrains将GPT-5设为AI Assistant和Kineto的默认语言 因其能快速生成单一用途工具[3] - Factory与OpenAI合作将GPT-5设为默认工具语言 其CEO指出GPT-5在制定复杂编码解决方案计划方面表现更好 长期计划连贯性更优[3] - Lovable公司对GPT-5 Beta测试非常满意 发现其在复杂用例中更强大智能 且更易采取行动并反思[4] 技术发展与模型能力 - GPT-5代表几乎难以形容的智能 能在IMO数学竞赛中写出顶尖人类水平证明 这是前所未有的突破[22] - 模型从纯文本GPT-3 多模态GPT-4发展到GPT-5时代核心特征为与AI合作的科研模式 加速人类研究进展[22][23] - 在强化学习范式下 模型通过尝试和反馈学习 人类设计任务价值极高但需要成比例投入更多算力[12] - 从GPT-4发布至今 同等智能水平成本已降低1000倍 仅用两年半时间[35] 算力与扩展 - 模型发展瓶颈永远是算力 只要有足够算力就能找到方法迭代并充分利用[12] - 算力可分配到不同维度 如让模型更大 投入更多预训练算力或更多推向强化学习[13] - 算力是从能量变成算力再变成智能的结晶化过程 训练时投入大量算力但可无数次复用摊薄成本[14] 模型应用与泛化 - GPT-5在需要深度智能的复杂问题上表现比任何其他测试模型都好[24] - 模型已能泛化到不同领域 如IMO模型也能在IOI中获得金牌 无需专门训练[14] - 在生物学领域 训练400亿参数模型处理DNA序列 效果相当于GPT-1到GPT-2之间 但需解决长上下文挑战[19] 开发与工程实践 - 开发者需积累提示词库 测试模型优势和短板 并思考如何拆分任务让模型处理自包含子任务[25] - 代码库应围绕模型优劣构建 更独立单元 快速运行单元测试和清晰文档[41] - 模型在软件工程中优势高度匹配大多数工程师工作 如用不熟悉语言写代码 但架构类问题也开始擅长[39] 安全与可靠性 - 从深度防御角度思考代理稳健性 采用指令层级技术防止恶意攻击[28] - 模型规范让外界清晰了解对模型预期 规范与实际行为差距不断缩小[29] - 随着代理被赋予更多责任 安全性和可靠性必须同步提升[29] 定价与成本 - GPT-5定价有竞争力 甚至比Gemini更低[34] - 定价历史持续降价 每年降10倍甚至更激进 如GPT-3降价80%后使用量增长使收入持平或上升[34] - 当前瓶颈主要是计算资源 依赖算力 但还有很大效率提升空间[35] 未来方向与研究 - 研究领域多样性出乎意料 不同实验室有不同视角和聚焦点[43] - OpenAI关注如何通过研究实现阶跃式突破和范式转变 如推理范式突破[44] - 多模态 生成方式等方面多样性让研究比以往更丰富[44]
以年轻科创精神为桥梁,“西南偏南”科技艺术节向2025外滩大会发来邀请
经济观察网· 2025-09-04 04:50
大会概况 - 2025年外滩大会于9月10日至13日在上海黄浦世博园区召开 主题为"重塑创新增长" [1][4] - 大会包含1场开幕主论坛 40多场开放见解论坛 全球主题日 18场创新者舞台 近万平米科技展览 5000平科技集市及1场科技智能创新大赛 [4] - 吸引10多个国家近两万名青年科技人才报名参与 包括中国 美国 英国 澳大利亚 加拿大 韩国 新加坡 巴西 爱尔兰 越南 [2] 行业影响力 - 美国科技艺术节"西南偏南"战略合作副总裁Neil Minocha特别视频致信 肯定大会展现的人与科技创意链接及中国年轻一代的创造力 [1] - "西南偏南"被誉为全球青年科技朝圣之地 是Twitter Airbnb Snapchat等知名产品的发迹摇篮 [1] - 外滩大会聚集近百位AI科学家 科技企业创始人 CEO及年轻AI科技人才 包括图灵奖得主理查德·萨顿 宇树科技CEO王兴兴 AI青年领军人物许华哲 吴翼等 [2] 科技展示内容 - 科技展区提供蚂蚁健康管家AQ的一键拍药盒 读体检报告 病症咨询 睡眠管理 皮肤管理 肺功能检测等360度健康管家服务 [3] - 机器人小镇展示机器人拳击赛 武术 足球赛互动 低空飞行器 自动驾驶等未来生活方式体验 [3] - 创新者舞台呈现可控核聚变等尖端科学 AI复刻味觉触觉 城市噪音转预防阿尔兹海默症的创意DJ等跨界实践 [3] 国际交流合作 - "西南偏南"2026年将迎来40周年庆典 向中国年轻创新者及外滩大会参与者发出赴奥斯汀参与盛会的正式邀请 [4] - 大会被评价为科技从宏大走向具体的实践平台 强调科技不仅关乎芯片火箭 更关乎AI生活伙伴 用药提醒助手等日常应用 [3][4]
苹果四位 AI 大将出走,其中三位是华人
36氪· 2025-09-04 02:13
苹果AI人才流失事件 - 苹果公司近期损失四位AI领域关键研究人员,包括机器人首席AI研究员Jian Zhang以及基础模型团队的三名研究员Nan Du、Zhao Meng和John Peebles [1] - 此次人才流失集中在基础模型团队,四名离职人员中有三名来自该团队 [3] - 离职人员中华人占比高,四名中有三名是华人 [3] 人才流向分布 - 仅Jian Zhang一人加入Meta,Nan Du和John Peebles加入OpenAI,Zhao Meng则加入Anthropic [3] - 此次人才流动与Meta此前的高薪抢人行动关联不大,仅一人流向Meta [24] 离职人员专业背景与贡献 - Jian Zhang在苹果人工智能与机器学习部门担任机器人研究负责人长达十年,专注于机器人技术底层研究,特别是在仿生扑翼飞行器领域 [5][8] - 其学术影响力显著,论文总被引次数达1353次,h指数为18,2020年以来被引1182次 [9] - 代表性论文《Uncertainty weighted actor-critic for offline reinforcement learning》被引用241次,专注于利用固定历史数据训练决策模型 [10] - Nan Du在谷歌效力超过7年,参与开发拥有1万亿参数的稀疏专家模型GLAM及第二代Pathways Language Model PaLM 2,2023年加入苹果担任首席研究员 [17][20] - Zhao Meng专注于多模态AI和生成式模型,论文总引用数超过770次,h指数为12,其2016年论文《How Transferable are Neural Networks in NLP Applications?》被引381次 [21][22] - John Peebles专注于生成式AI和大型语言模型,参与改进模型推理能力及隐私保护AI系统,是深度学习训练系统AXLearn论文共同作者 [16] 公司战略与行业动态 - 苹果机器人技术专注于未来产品线开发,包括带屏幕的桌面机器人以及零售店和制造业的机械臂 [5] - Meta机器人工作室Robotics Studio部门正开发人形机器人硬件和软件,最初针对家务场景,并与Unitree Robotics和Figure AI等公司讨论合作计划 [12] - Anthropic在Zhao Meng加入同时完成130亿美元F轮融资,估值达1830亿美元 [23] - 行业顶尖人才薪酬水平高,OpenAI技术人员年薪最高达53万美元,Anthropic研究工程师年薪可达69万美元,顶尖OpenAI研究人员年薪酬可超1000万美元,谷歌DeepMind为顶尖研究人员提供每年2000万美元薪酬方案 [26] AI人才流动趋势 - AI人才流动不仅受高薪驱动,公司战略、资源分配、理想主义及职场环境等因素均影响决策 [25] - 近期出现Meta新员工迅速回流现象,两名新加入Meta的研究员在入职不到30天内返回OpenAI [28] - OpenAICEO曾称"传教士将击败雇佣兵",强调使命感对吸引人才的作用 [27] - 即便无高薪抢人行动,AI人才流动仍持续发生,反映人才对平台战略方向及文化契合度的重视 [31]
松延动力:从清华园跑出的机器人“小孩哥”
新京报· 2025-09-03 02:02
公司背景与创始人 - 松延动力是北京机器人企业 创办不足两年 旗下人形机器人产品N2被观众称为"小孩哥" [1] - 创始人姜哲源1998年出生 清华大学电子工程系毕业 博士期间专攻强化学习 2023年从清华博士辍学创业 [2] - 公司办公地点从海淀迁至昌平 单位面积扩大一倍 团队完成扩招 [1] 产品与技术路线 - 核心产品包括可跑步的N2机器人(身高1.2米)、7自由度手臂的E1机器人 以及全球首个脸部突破30自由度的仿生人机器人"小诺" [1][5] - 采用"自研硬件本体+运动控制算法"技术路线 目标实现人形机器人的高度集成与智能化 [5] - N2机器人售价数万元 定位小尺寸适合科研教育 安全且易二次开发 [3] 市场表现与订单 - N2机器人总订单量突破2500台 总合同额超过1亿元 成为继宇树科技后又一家销量破千的人形机器人公司 [3] - 人形机器人马拉松赛后每日咨询量从300次增长至500-1000次 [3] - 产品聚焦教育、科研、文旅、商演四大场景 计划2025年第四季度发力海外市场 [5] 赛事成就与产品验证 - 获得人形机器人马拉松比赛亚军 世界人形机器人运动会体操项目与跳远项目金牌 个人舞蹈项目银牌 [1][4] - 在体操项目中配合《本草纲目》完成动作 在舞蹈项目中表演英歌舞 [4] - 赛事成绩印证了产品在多领域的应用潜力 [4] 融资与资金状况 - 2023年底依靠首个机器人原型获得种子轮融资 [2] - 2023年10月公司账上现金约3000万元 但2024年初因研发停滞和团队臃肿导致资金濒临枯竭 [2] - 仿生人脸机器人产品获得北京机器人产业投资基金投资 老股东追投使公司度过危机 [2] 行业环境与政策支持 - 北京市2019年起连续出台两轮三年行动计划 培养专精特新"小巨人"企业57家 获批手术机器人注册证33个 集聚人形机器人整机单位30家 均居全国首位 [5] - 2024年北京市机器人产业营收同比增长50% 2025年上半年增长40% 产业稳居国内第一梯队 [5] - 公司发展受益于北京市及昌平区的前瞻布局与支持 [5]