GUI Agent技术
搜索文档
阶跃星辰开源GUI Agent套件,宣布合作超60%国产手机厂商
新浪科技· 2025-12-01 08:34
公司技术进展 - 阶跃星辰推出GELab-Zero套组及4B GUI Agent模型(GELab-Zero-4B-preview)[2] - 该技术在手机端、电脑端等多个GUI榜单上刷新同尺寸模型性能纪录,取得SOTA成绩[2] - 公司早在今年7月便联合中兴推出“长辈AI助手”,具备一键执行挂号、缴纳社保等适老化功能[2] 行业合作与市场渗透 - 阶跃星辰已经与包括荣耀、OPPO、中兴在内超60%国产手机厂商达成合作[2] - 搭载“豆包手机助手技术预览版”的中兴手机上市并引发广泛关注[2]
直击WAIC2025|手机Agent竞赛升级:荣耀发布多模态感知大模型MagicGUI,从单智能体任务执行到多智能体协同
每日经济新闻· 2025-07-26 09:47
AI手机发展趋势 - AI手机不应仅满足于翻译、文档处理等简单功能,而应结合AI"智慧"与手机便捷特性拓展更广阔应用场景[1] - 主流手机厂商共识:语音助手将从"鸡肋时代"转向具备感知、推理、决策、操作能力的"轻量级智能体"[2] - 安卓阵营AI助手实用性显著领先苹果,荣耀、vivo、小米等已实现从聊天机器人到任务型智能体的进化[6] 荣耀MagicGUI大模型技术突破 - 荣耀发布70亿参数规模MagicGUI大模型并开源,支持跨应用协同完成任务(如打车场景多步操作)[1] - 模型实现从单智能体任务执行到多智能体协同升级,可调度设计、排版、支付等专项模块完成复杂指令[7] - 采用两阶段训练范式(CPT+RFT)提升屏幕感知与泛化能力,支持根据视觉反馈动态调整操作[9] 行业技术变革 - 交互主体从App转向Agent,GUI Agent技术通过多模态视觉模型实现任务自动化(如点击、输入等)[8] - 技术挑战包括应用多样性(Google Play达168万个应用)和界面频繁变动导致的执行不确定性[8] - 对比苹果Siri功能停滞,安卓厂商已实现点咖啡、订餐厅、发红包等深度任务集成[6] 厂商竞争格局 - 荣耀YOYO智能体通过MagicGUI实现多智能体协同,显著优于单智能体的任务局限性[7] - vivo"蓝心小V"、小米"超级小爱"等竞品同样具备复杂任务执行能力,但未实现多智能体调度[2][6] - 苹果在AI功能落地进度落后,国行iPhone 15Pro/16系列仍无法使用基础AI指令[6]