Agent S3

搜索文档
你敢信?GPT-5的电脑操作水平只比人类低2%了
机器之心· 2025-10-04 03:38
| 机器之心报道 | 机器之心编辑部 | | | | --- | --- | --- | --- | | Agent(智能体)是最近一段时间的人工智能热点之一,将大语言模型的能力与工具调用、环境交互和自主规划结合起来,使其能够像虚拟助理一样完成复杂任 | 务。 | | | | 其中「计算机使用智能体」(computer-use agent,CUA)是一种能够直接在电脑环境中代替人类执行操作的智能体。它和传统的对话式 AI 不同,不只是回答问 | 在该领域,Simular Research 推出的框架 Agent S 是典型代表之一 | 题,而是模拟人类使用鼠标、键盘和操作软件来完成任务。 | 。 | | 一年前,Agent S 在 CUA 基准测试「OSWorld 」上取得了 20.6% 的成绩。此后能力继续扩展,Agent S2 将业界水平提升到了 48.8%。就在昨日, | Agent S3 又刷新 | 了自身记录,将性能拉升到了 69.9%,超出先前的 SOTA 10%,接近人类水平的 72% 。 | | 加州大学圣巴巴拉分校助理教授、 Simular 研究负责人 Xin Eric Wang 表示,「接 ...