Workflow
Astribot S1
icon
搜索文档
全部超越π0、π0.5!端到端全身VLA模型Lumo-1
自动驾驶之心· 2025-12-12 03:02
文章核心观点 - AI机器人公司星尘智能推出的端到端全身视觉-语言-动作模型Lumo-1,通过创新的三阶段训练架构,显著提升了机器人在复杂物理环境中的推理与操作能力,使其在多步骤长时序任务、精细操作及泛化能力上超越现有先进模型[9][11][12] 技术模型:Lumo-1的架构与训练 - Lumo-1是一个端到端全身VLA模型,旨在实现机器人的“心手合一”,通过具身化VLM、跨本体联合训练、推理-动作真机训练以及强化学习校准对齐等方式,将大模型“心智”转化为流畅的全身操作[9] - 训练采用三阶段架构:第一阶段为具身化VLM,在精选数据上预训练以获得空间理解等能力,在7个经典具身推理基准中大部分超过RoboBrain-7B、Robix-7B等专用模型[12][17];第二阶段为跨本体联合训练,融合多机器人数据以强化指令跟随与空间推理[18];第三阶段为真机推理-动作训练,利用绳驱机器人Astribot S1的仿人示教轨迹学习真实世界的可执行动作模式[18] - 最后加入强化学习推理-行动对齐,通过多维度的奖励信号校准高级推理与低级动作之间的误差,使模型在任务成功率、动作合理性与泛化能力上显著超越仅模仿专家示范的表现[20][29] 核心能力与性能表现 - Lumo-1在多步骤长时序、精细灵巧操作、可泛化抓取放置三大类核心操作任务中,全部超越了π0、π0.5等先进模型[11][13] - 在未见过的物体、场景和指令等分布外情况,以及处理抽象、模糊、需扩展推理的指令时,优势更为明显[11][13] - 在7个多模态基准测试中的6个优于其骨干模型Qwen2.5-VL-7B,并超越了专门的具身模型RoboBrain-7B和Robix-7B,同时未损害核心多模态感知和推理能力[31] 关键技术拆解 - **动作空间建模**:通过空间动作分词器将连续动作轨迹压缩成可复用、组合的“动作单词库”,比FAST与分桶方法更紧凑和稳定,减少了数据收集引入的无关噪音[21] - **结构化推理**:将推理拆解为文字推理与视觉推理两个维度,形成解释动作的结构化推理链,使“为什么这样做”先于“怎么做”,并将视觉理解映射为路径点预测,实现从2D到3D控制的自然过渡[24][25] - **数据策略**:采用数据受限扩展定律验证,发现在固定模型规模下,数据多样性对泛化能力的影响远超数据重复次数,指明了注重数据质量的方向[30] 实际应用与泛化案例 - 机器人能够处理复杂、长时序的日常活动任务,如清扫、削皮、倾倒、刷洗、折叠等,这些任务可自然分解为多个子任务[23] - 展现出强大的抽象概念推理和情境理解能力,例如:理解“代表爱情的花”并放入花瓶;根据“KFC里的东西”推理出炸鸡、汉堡;根据“画海洋的工具”找到蓝色画笔[25] - 具备灵活的实时决策能力,例如在“把可乐放到盘子上”任务中,当左臂路径被加入障碍物时,能实时推理并切换为使用右臂[27] - 在真实环境中展现出惊人的泛化能力,如面对不同高度容器自动调整手臂姿态,以及识别从印刷体换成手写体的菜单并完成食材配对[31]
全部超越了π0、π0.5!端到端全身VLA模型Lumo-1:迈进推理-行动闭环时代
具身智能之心· 2025-12-11 02:01
文章核心观点 - 星尘智能公司推出的端到端全身视觉-语言-动作模型Lumo-1,通过创新的三阶段训练架构,显著提升了机器人在复杂物理环境中的推理与操作能力,使其能够处理多步骤长时序任务、理解抽象模糊指令并泛化至未见过的场景,在多项基准测试和真实任务中超越了当前主流先进模型[7][9][11] 技术方案:Lumo-1模型架构与训练 - 模型采用三阶段训练架构:第一阶段为具身化视觉语言模型预训练,在7个经典具身推理基准中大部分超过RoboBrain-7B、Robix-7B等专用模型[15];第二阶段为跨本体联合训练,融合多机器人、多视角轨迹与VLM数据,强化指令跟随与空间推理能力[16];第三阶段为基于绳驱机器人Astribot S1高质量真机轨迹的推理-动作训练,学习真实世界的可执行动作模式[16] - 训练最后加入强化学习推理-行动对齐,通过多维度的奖励信号校准高级推理与低级动作之间的误差,使模型在任务成功率、动作合理性与泛化能力上显著超越仅模仿专家示范的原始表现[18][27] - 训练策略验证了数据多样性(场景、物体、指令的覆盖面)对泛化能力的影响远超数据重复次数,为行业指明了注重数据质量的方向[28] 核心技术创新 - 引入动作空间建模,将连续动作轨迹压缩并聚类成紧凑的“动作单词”token,能像组合句子一样复用和组合动作,比FAST与分桶方法更紧凑稳定,减少了数据收集引入的无关噪音[19] - 采用结构化推理,将推理拆解为文字推理与视觉推理两个维度,形成解释动作的结构化推理链,使“为什么这样做”先于“怎么做”,并将2D视觉理解映射为3D控制路径点[22][23] - 模型展现出强大的抽象概念推理与实时决策能力,例如理解“代表爱情的花”指代玫瑰,或当左臂遇障时实时推理并切换为右臂执行任务[23][25] 性能表现与成果 - 在多步骤长时序、精细灵巧操作、可泛化抓取放置三大类核心机器人操作任务中,Lumo-1全部超越了π0、π0.5等先进模型[9][11] - 在未见过的物体、场景和指令等分布外情况,以及抽象、模糊、需扩展推理的指令中,模型优势更为明显[9][11] - 在7个多模态基准测试中的6个优于骨干模型Qwen2.5-VL-7B,并超越了专门的具身模型RoboBrain-7B和Robix-7B,且融入动作学习后未损害核心多模态感知与推理能力[29] - 在真实环境部署中,机器人S1展现出强大的泛化能力,如面对不同高度容器自动调整手臂姿态,或准确识别从印刷体换成手写体的菜单并进行食材配对[29] 行业意义与影响 - 该研究标志着机器人从依赖“轨迹记忆”和“动作库”模仿,向具备“理解烹饪原理”般的多层次推理能力演进,使机器人能理解任务意图、拆解子任务并规划运动路径[6][10] - 技术方案解决了当前主流视觉-语言-动作模型在开放环境中的三大缺陷:抽象概念失效、环境泛化困难以及长时序任务易崩溃[6] - 通过将大模型“心智”与高质量真机训练结合,实现了“心手合一”,让推理能直接转化为丝滑的全身操作,推动了具身智能向更通用、更智能的方向发展[7]
端到端全身VLA模型Lumo-1:让机器人心手合一,迈进推理-行动闭环时代
具身智能之心· 2025-12-10 10:00
文章核心观点 - AI机器人公司星尘智能推出的端到端全身视觉-语言-动作模型Lumo-1,通过创新的三阶段训练架构,显著提升了机器人在复杂物理世界中的推理与操作能力,使其在多步骤长时序任务、精细灵巧操作和泛化抓取放置等核心任务上超越了π0、π0.5等先进模型,尤其在处理未见过的物体、场景和抽象指令时优势明显 [7][9][11] 技术方案与模型架构 - Lumo-1是一个端到端全身VLA模型,旨在实现机器人的“心手合一”,其训练结合了具身化VLM、跨本体联合训练、推理-动作真机训练以及强化学习校准对齐等方法 [7] - 模型采用三阶段训练架构:第一阶段为具身化VLM,在7个经典具身推理基准中大部分超过RoboBrain-7B、Robix-7B等专用模型 [15];第二阶段为跨本体联合训练,强化指令跟随与空间推理能力 [16];第三阶段为利用绳驱机器人Astribot S1的示教轨迹进行真机推理-动作训练 [16] - 最后通过强化学习推理-行动对齐,设计多维度的奖励信号来校准高级推理与低级动作之间的误差,从而在任务成功率、动作合理性与泛化能力上显著超越模仿专家示范的原始表现 [18][27] 核心技术创新 - **动作空间建模**:通过空间动作分词器将连续动作轨迹转化为可复用、组合的“动作单词库”,比FAST与分桶方法更紧凑和稳定,减少了数据收集引入的无关噪音 [19] - **结构化推理**:将推理拆解为文字推理与视觉推理两个维度,形成解释动作的结构化推理链,使机器人从“执行动作”转变为“执行想法” [22][23] - 结构化推理能力使机器人能理解抽象语义与文化隐喻,例如将玫瑰识别为“代表爱情的花”,或将“KFC里的东西”推理为炸鸡和汉堡 [23] - 该设计支持灵活的实时决策,例如在“把可乐放到盘子上”任务中,当左臂路径遇障时,机器人能自主推理并切换为使用右臂 [25] 性能表现与验证 - 在**多步骤长时序**、**精细灵巧操作**、**可泛化抓取放置**三大类核心机器人操作任务中,Lumo-1全部超越了π0、π0.5等先进模型 [9][11] - 在未见过的物体、场景和指令等分布外情况,以及抽象、模糊、需扩展推理的指令中,Lumo-1的优势更为明显 [9][11] - 在7个多模态基准测试中,有6个优于其骨干模型Qwen2.5-VL-7B,并超越了专门的具身模型RoboBrain-7B和Robix-7B [29] - 通过数据受限扩展定律验证,发现在固定模型规模下,数据多样性对泛化能力的影响远超数据重复次数,为行业指明了注重数据质量的方向 [28] - 在真实环境验证中,S1机器人展现出强大的泛化能力,如面对不同高度容器自动调整手臂姿态,以及识别从印刷体换成手写体的菜单并精准配对食材 [29] 机器人任务能力展示 - 机器人能够完成“热面包”等复杂长时序任务,通过推理识别物体、理解“加热”需用微波炉,并自主完成开门、放入、旋钮、取出等一系列操作 [4] - 能够执行“整理文具”任务,在混乱桌面中快速找齐并精细处理不同形状、材质和尺寸的物品 [4] - 能够处理需要抽象推理的任务,例如“把可以画海洋的文具放到绿盘子里”,并准确找到蓝色的画笔 [23] - 机器人具备四类推理能力:抽象概念推理、子任务推理、视觉观测描述以及运动推理 [30]
杭州蚂蚁投了家腾讯系具身智能公司
量子位· 2025-11-23 10:33
融资情况 - 星尘智能完成数亿元A++轮融资,由国科投资与蚂蚁集团联合领投,老股东锦秋基金跟投[2][5] - 本轮融资后公司估值进入20亿元俱乐部[4] - 2024年以来已完成四轮融资,包括4月由锦秋基金和蚂蚁集团领投的数亿元A轮及A+轮融资,以及去年7月由经纬创投领投的数千万美元Pre-A轮融资[7][8][9] 技术路线与产品 - 公司核心技术路线为绳驱AI机器人,采用“柔性绳索+卷扬电机”设计,实现低摩擦、高跟随、连续力域的控制[13][17][22] - 绳驱技术具备高拟人表现力、高动态响应和高交互安全特性,尤其适合家庭、商业等需要灵巧操作与人机协作的场景[23] - 公司打造集顶尖本体、领先遥操、高效模型于一体的具身智能全栈平台,并推出Astribot S1等机器人产品,能完成叠衣服、打咏春、颠勺做菜等复杂任务[24][25] - 2024年10月发布半身商用机器人Astribot S1-U、超远程数字分身遥操作系统及面向商业服务的DuoCore全身VLA模型[27] 商业化进展 - 公司与金马游乐达成战略合作,推出文旅文娱机器人系列产品[31] - 全球首个由绳驱AI机器人全自主运营的零售服务店“机器人MART”在中山落地,能全自主为游客制作小吃、调饮料[32][33] - 与仙工智能、字节跳动、腾讯、百度、央视、京东等头部企业达成合作,业务覆盖科研、文旅、服务、物流等领域,累计获得数千台订单[35] - 2024年6月攻克绳驱量产难关,实现多个月批量稳定交付[37] 团队背景 - 创始人兼CEO来杰拥有16年机器人研发经验,曾为腾讯Robotics X实验室一号员工,主导研发轮腿式机器人Ollie等多款产品[40][41][44] - 联合创始人戴媛拥有加州大学洛杉矶分校博士学位,同样出身于腾讯Robotics X实验室[46][47][48] - 核心团队成员背景横跨腾讯、谷歌、优必选、百度和华为等前沿科技公司[48]
瑞承:成本高且应用有限,大规模落地需要多久
金投网· 2025-11-10 11:02
行业技术发展现状 - 人形机器人外观设计主流采用躯干、头颈、四肢的类人结构,手部分为灵巧手、二指夹爪、三指手,足部有双足型与非足型之分 [1] - 高端灵巧手单价达10万-20万元,占机器人总成本的三分之一,多数厂商选择二指夹爪与轮式结构以平衡性价比 [1] - 功能技能覆盖表演、劳动与交互三大领域,表演能完成舞蹈走秀运动,劳动可承担家务整理工业分拣咖啡制作,交互支持语音对话与简单指令响应 [1] 当前技术瓶颈 - 动作层面存在同质化,多家厂商的机器人舞蹈动作重复度高,后空翻摔倒等姿势重复出现 [1] - 效率在家务场景中叠衣服速度缓慢,在工业场景仅能完成基础分拣 [1] - 交互控制方式分为遥操、同构臂、语音控制三类,复杂任务需依赖遥操或同构臂,缺乏动态环境适应能力,例如晾衣服需依赖固定坐标与可见物体 [2] - 通用泛化能力不足,机器人仅能对相似场景泛化,无法实现跨领域响应 [3] 应用场景与市场定位 - 应用场景分为企业级与消费级两大方向,To B领域聚焦文娱表演、工业制造、文旅服务、医疗康养,其中文娱表演最为成熟 [2] - To C领域瞄准家庭服务,目标替代保安、保洁、保姆等“三保”工作,但目前实际价值有限,传统AGV机器人在仓库搬运场景的效率与成本仍具优势 [2] - 部分企业实现技术突破,星尘智能Astribot S1通过“元技能库”学习法对相似场景进行泛化处理,银河通用Galbot依托零售场景具身智能大模型GroceryVLA能自主完成商品抓取支付交互等全流程服务 [2] 产业发展与竞争格局 - 我国机器人产业营收与产量保持增长,连续多年位居全球最大工业机器人应用市场,年内新增机器人相关注册企业数量同比显著增长,超20家头部公司启动或计划IPO,其中中国企业占比达16家 [3] - 竞争格局呈现多路径探索,宇树科技以核心硬件自研与商业化落地为优势推出9.9万元亲民机型,智元机器人通过全链条自主研发与产业链投资构建生态,银河通用聚焦零售场景 [3] - 行业估值梯队初步形成,头部企业估值超70亿元,第二梯队在20亿-50亿元区间 [3] 未来发展趋势 - 合成数据、仿真模拟技术与专用大模型的发展正推动机器人向自主决策与场景适应能力进化 [3] - 人形机器人正加速从实验室走向现实,在劳动替代、效率提升等领域的潜力或将重塑人类对智能与生产力的认知 [4]
首佳科技拟设超级新材料合资公司 加速布局机器人腱绳赛道
证券时报网· 2025-10-22 08:59
公司战略与业务布局 - 首佳科技新加坡合营企业将成立一家超级新材料公司,全面加码机器人腱绳产业链布局[1] - 公司长期聚焦钢帘线主业,此次布局是依托在金属材料领域的多年积累,延伸至微丝、微绳等高端应用场景,以寻求第二增长曲线[1] - 首佳科技与国内前沿AI机器人公司星尘智能进行交流与合作,共同推动机器人腱绳等新兴领域的产业标准与关键材料定义[1] 合作伙伴星尘智能概况 - 星尘智能是绳驱AI机器人的定义者,业界首个量产绳驱AI机器人的公司,拥有"本体—数据—模型"全栈闭环体系,创始团队出身于腾讯Robotics X[1] - 公司于2024年8月发布新一代AI机器人助理Astribot S1,在复杂任务中表现优异,并于2024年11月与Physical Intelligence达成战略合作[2] - 截至2025年4月,星尘智能已完成Pre-A、A、A+三轮融资,累计募集资金数亿元人民币,投资方包括经纬创投、蚂蚁公司等知名机构[2] 腱绳传动技术趋势与产品方案 - 随着行业对灵巧性、安全性和轻量化要求提升,腱绳传动方案已成为机器人发展的重要方向[2] - 星尘智能在其Astribot系列机器人中率先采用腱绳驱动系统,通过量产积累"刚柔耦合驱动"技术的应用经验[2] - 首佳科技目前提供57种结构规格的躯干腱绳方案,绳径从0.46mm到3.24mm,破断力强度最高达6500MPa[3] - 公司还提供12种规格的灵巧手腱绳,绳径从0.155mm到1.80mm,金属丝强度最高达6500MPa,可满足绝大部分供应商及机器人企业的需求[3] 市场前景与产业机遇 - 首佳科技相信机器人产业将持续拥有更高标准和要求的绳驱方案,产业上下游都将迎来新的发展机遇与价值释放空间[3] - 星尘智能的S1机器人已在科研、商业服务、文娱演出及工业制造等领域实现部署,推动机器人行业的场景化应用与商业化进程[2]
首佳科技(103.HK)拟设超级新材料合资公司,加速布局机器人腱绳赛道
机器人大讲堂· 2025-10-22 08:17
公司战略与业务布局 - 首佳科技通过其新加坡合营企业成立专注于超级新材料的企业,全面加码机器人腱绳产业链布局[1] - 公司长期深耕钢帘线主业,并以"科技赋能"为战略核心,积极寻求第二增长曲线,本次布局是依托其在金属材料领域的多年积累延伸至高端应用场景[1] - 公司对机器人产业的关注源自钢帘线工艺与机器人腱绳的工艺共同性以及兄弟企业首程控股的机器人产业资源[2] 合作伙伴与行业背景 - 首佳科技与国内前沿AI机器人公司星尘智能进行交流与合作,共同推动机器人腱绳等新兴领域的产业标准与关键材料定义[2] - 星尘智能是绳驱AI机器人的定义者及业界首个量产绳驱AI机器人的公司,拥有"本体—数据—模型"全栈闭环体系,创始团队出身于腾讯Robotics X[2] - 星尘智能于2024年8月发布新一代AI机器人助理Astribot S1,并在复杂任务中表现优异,截至2025年4月已完成Pre-A、A、A+三轮融资,累计募集资金数亿元人民币[4][5] 绳驱传动技术优势 - 绳驱传动模拟人体柔性肌腱牵引机制,在同样体积和重量条件下具备更高输出效率、柔顺性强、能吸收冲击和减少末端组件体积,带来高安全性和结构轻量化[6] - 实际应用中,在同样单位重量和体积下,腱绳传动比直驱或推杆传动具备更高传动性能,是灵巧、柔性机器人发展的关键方向[7] - 与关节直驱和推杆传动相比,绳驱传动在结构轻量化、灵活性/顺应性、抗冲击能力和安全性方面具有优势,但工艺复杂且技术门槛高[8] 腱绳材料性能与应用 - 金属材料在蠕变性能方面明显优于高分子材料,常温条件下加载70%断裂载荷持续7天蠕变量小于0.3%,而超高分子量聚乙烯在同样条件下蠕变量超过3%[10] - 超细规格钨丝的强度达到6500MPa,远高于超高分子量聚乙烯的2600-3800MPa,且金属材料在耐高温性能方面具有明显优势,钨熔点达3410℃[10] - 首佳科技已成功开发多种腱绳材料方案,涵盖不锈钢、高碳钢、钨钢三种市面主流金属,并提供57种结构规格的躯干腱绳方案和12种规格的灵巧手腱绳[11][12] 市场前景与产业机遇 - 随着机器人行业对灵巧性、安全性和轻量化的要求不断提升,腱绳传动方案已逐步成为机器人发展的重要方向[9] - 星尘智能在其Astribot系列机器人中率先采用腱绳驱动系统,为未来灵巧机器人量产和性能演进奠定基础[9] - 伴随机器人产业与新材料技术的商业化推进和持续融合,机器人产业将持续拥有更高标准和要求的绳驱方案,产业上下游都将迎来新的发展机遇[13]
家用机器人,真要敲门入户了?
虎嗅· 2025-10-20 09:34
行业发展趋势 - 全球家用机器人行业正经历快速更新 集体奔向第三代际 [1] - 行业最新发展集中体现在8款被称为"未来室友"的家用机器人产品上 [1] 主要市场参与者 - 家用机器人市场主要参与者涵盖中美欧三地 包括Optimus Figure03 Neo Gamma等品牌 [1] - 中国本土企业积极布局 代表性产品包括齐家Q1 HIVA海娃和美的的家用机器人 [1] - 欧美市场主要产品包括Booster T1和Astribot S1 [1] 产品对比分析 - 视频内容对中国与欧美家用机器人进行了直接对比 [1]
CoRL 2025最新工作!ControlVLA:机器人看10遍就会,“通智大脑”能力再升级!
具身智能之心· 2025-09-25 09:54
文章核心观点 - 北京通用人工智能研究院联合星尘智能提出物体中心表征微调框架ControlVLA,使机器人通过极少量(10-20次)人类示范即可掌握复杂任务,成功率超过75%,相较传统方法提升近4倍 [1] - ControlVLA框架结合预训练VLA模型与物体中心表示,通过ControlNet风格架构实现高效少样本微调,大幅缩短机器人训练时间和成本 [1][5][9] - 该技术在星尘智能AI机器人Astribot S1上验证,在8项现实世界任务中总体成功率达76.7%,长时序任务平均成功率达60%,展现出色泛化与执行能力 [1][15][19] 技术原理与方法 - ControlVLA工作流程分为三步:大规模VLA模型预训练、物体中心表示提取、ControlNet式微调适配 [12] - 通过零初始化投影层将预训练VLA模型与以对象为中心表示连接,在不覆盖先验知识情况下引入物体中心条件 [5][10] - 物体中心表示通过GroundingDINO和SAM2对任务相关物体进行分割与跟踪,提取几何特征与位置特征 [12] 实验成果与性能 - 在8个现实世界任务实验中,每个任务仅使用10-20条演示数据训练,ControlVLA总体成功率达到76.7%,远超传统方法20.8%的水平 [14][15] - 长时序任务(如多物体分类整理、抽屉物体替换)平均成功率达60%,约为现有最佳方法的3倍 [17][19] - 在OrganizeToy任务中,ControlVLA使用20条演示数据即可达到80%成功率,而其他方法即使使用100条演示也未能达到同等表现 [21] 泛化能力与鲁棒性 - 在未见过物体(面包、香蕉、橙子)与新背景下测试,ControlVLA仍保持60%-70%的任务成功率 [24][25] - 该方法提升了对复杂场景、长时序任务以及未见过物体与环境的鲁棒性与扩展性 [10][24] 硬件平台支持 - 研究成果基于星尘智能AI机器人Astribot S1完成,该产品采用绳驱传动技术,传动效率>90%,回驱性>80% [2] - 绳驱模仿人类肌腱运动方式,让机器人具备高表现力与高安全性,适合需要精细触觉反馈的AI任务 [2]
AI周报|9月起AI生成合成内容必须添加标识;Anthropic融资130亿美元
第一财经· 2025-09-07 02:00
Anthropic融资与估值 - Anthropic完成130亿美元F轮融资 最新估值达1830亿美元 成为全球估值排名第四的独角兽 仅次于SpaceX(3500亿美元)、字节跳动(3300亿美元)和OpenAI(3000亿美元)[2] - 公司年化收入从2025年初的10亿美元增长至2025年8月的50亿美元 八个月内增长400%[2] - 估值支撑来自旗下大模型Claude在编程和数学领域的领先性能[2] AI生成内容监管 - 《人工智能生成合成内容标识办法》于9月1日正式施行 要求所有AI生成的文字、图片、视频等内容添加标识[3] - DeepSeek、腾讯元宝、抖音、B站等平台已实施AI生成内容标识措施[3] - 该办法旨在通过标识机制帮助用户区分真实内容与AI生成内容 减少信息混淆风险[3] 半导体与AI芯片动态 - 博通获得新客户超100亿美元AI芯片订单 推动其2026财年AI收入显著增长[4] - 公司2025财年第三季度AI相关业务收入达52亿美元 同比增长63% 预计第四季度将达62亿美元[4] - 博通属于ASIC芯片阵营 客户自研芯片趋势减弱了对英伟达GPU的依赖[4] 量子计算投资进展 - 英伟达风投部门首次投资量子计算公司Quantinuum 该公司本轮融资6亿美元 估值达100亿美元[5] - 新投资者包括广达电脑和QED Investors[5] - 英伟达CEO黄仁勋认为量子计算正接近拐点 逻辑量子比特数量预计每5年增长10倍[5] 智能体模型竞争 - DeepSeek正开发具备多步操作与学习能力的先进AI智能体模型 目标在第四季度发布[6] - 该模型设计用于最小化用户指令 并能根据历史操作持续优化[6] - OpenAI、Anthropic和微软近期均推出了类似智能体软件[6] AI终端产品创新 - 联想在IFA大会发布多款AI终端 包括可垂直旋转屏幕的14英寸AI PC和具备人脸追踪、语音控制功能的智能概念设备[7] - 公司采用创新与商业可行性并重的筛选逻辑 即使概念产品未商业化也能积累技术专利[7] - 2017年折叠屏笔记本概念最终促成了摩托罗拉Razr折叠手机问世[7] AI对就业影响 - Salesforce裁减约4000个客户支持岗位 将岗位人数从9000人缩减至5000人 因AI承担了50%的工作任务[8] - AI已直接引发美国多行业裁员 但部分分析认为科技公司将疫情期过度招聘问题归咎于AI[8] 科技企业AI合作 - 苹果与谷歌达成新协议 重点评估Gemini模型 并搁置收购Perplexity的计划[9] - 苹果同时测试OpenAI和Anthropic技术 但未最终确定供应商[9] - 合作反映科技企业更倾向于通过技术协同而非收购实现AI资源优化[9] 人形机器人商业化 - 优必选获得2.5亿元人形机器人采购合同 涉及Walker S2产品 为全球该领域最大合同[10] - 公司今年7月还中标觅亿科技9051.15万元机器人采购项目[11] - 智元机器人和宇树科技7月中标中国移动1.2亿元人形机器人订单[11] 工业机器人部署 - 星尘智能与仙工智能达成千台级人形机器人订单合作 计划两年内在工业、制造、仓储场景部署[12] - 机器人将承担物料配送、搬运、上下料等重复性任务[12] - 工业场景被视为人形机器人最早实现大规模落地的领域[12]