Workflow
AutoGLM
icon
搜索文档
借道“无障碍”,AI助手可能在盯着你
创业邦· 2025-09-25 04:27
以下文章来源于时代财经APP ,作者冯恋阁 时代财经APP . 聚焦于企业财经新闻,互联网新闻信息服务许可证编号:44120230006 来源丨 时代财经APP(ID:tf-app) 作者丨 冯恋阁 图源丨Midjourney 2025年是当之无愧的Agent元年。 从Manus爆火,到各家终端厂商开始推出并迭代端侧AI助手,不难发现,厂商也意识到了这背后的机会。 与曾经的大语言模型不同,AI Agent能做的比聊天更多。 只需要一句自然语言指令,手机就能自动完成点外卖、发红包等曾经需要多步点击的任务。 大部分AI Agent能够代管手机,是使用了安卓系统里特殊的无障碍权限。这个本来是设计给视障人士的功能,能够让手机看到屏幕上的一切,同时,还可以 代替用户执行点击、滑动等操作。如今,厂商选择用这个权限来实现AI功能。 但当下,这份便利的背后实际隐藏着风险。在无障碍权限开放的背景下,AI应用基本"全知全能",应用或许能够读取到包括支付密码、聊天记录在内的敏感 信息,也可能可以随意点击。 一个可见的事实是,随着AI Agent技术不断迭代,人类只会越来越习惯被硅基助手们包围的日常。 因此,当下更应该搞清楚AI A ...
借道「无障碍」,AI助手可能在盯着你
36氪· 2025-09-21 09:37
2025年是当之无愧的Agent元年。 从Manus爆火,到各家终端厂商开始推出并迭代端侧AI助手,不难发现,厂商也意识到了这背后的机 会。 与曾经的大语言模型不同,AI Agent能做的比聊天更多。 只需要一句自然语言指令,手机就能自动完成点外卖、发红包等曾经需要多步点击的任务。 大部分AI Agent能够代管手机,是使用了安卓系统里特殊的无障碍权限。这个本来是设计给视障人士的 功能,能够让手机看到屏幕上的一切,同时,还可以代替用户执行点击、滑动等操作。如今,厂商选择 用这个权限来实现AI功能。 但当下,这份便利的背后实际隐藏着风险。在无障碍权限开放的背景下,AI应用基本"全知全能",应用 或许能够读取到包括支付密码、聊天记录在内的敏感信息,也可能可以随意点击。 一个可见的事实是,随着AI Agent技术不断迭代,人类只会越来越习惯被硅基助手们包围的日常。 因此,当下更应该搞清楚AI Agent背后的运行机制,以及未来业界应该选择走向何方,以求在"效 率"和"安全"之间找到平衡。 AI Agent的"翻墙"困境 "目前行业内主要存在两种技术路径。"一位在头部AI公司从事相关工作的技术人员向时代财经介绍,一 ...
AI浏览器被曝重大安全漏洞,2分30秒内完成盗号
21世纪经济报道· 2025-08-26 12:54
AI浏览器安全漏洞事件 - Perplexity公司AI浏览器Comet存在重大安全漏洞 攻击者可通过论坛评论区隐藏恶意指令诱导AI智能体泄露用户邮箱 验证码等敏感信息 盗号过程仅需2分30秒 [1] - 漏洞由竞争对手Brave浏览器安全团队发现 攻击步骤包括在Reddit帖子添加剧透标签隐藏指令 用户使用"总结当前网页"功能时AI自动执行恶意操作 [1] - Perplexity声称漏洞已提前修复且无用户数据泄露 但Brave团队表示7月25日报告后问题未完全解决 公司未分享修复方案 [2] AI智能体行业安全风险 - "间接提示词攻击"成为AI智能体核心安全风险 攻击者可通过网页 PDF或聊天消息注入隐藏指令使大模型偏离用户原始请求 [3] - 交互界面简化导致开发者低估攻击风险 实际攻击隐蔽性增强 案例显示攻击者可劫持智能体窃取WhatsApp用户聊天记录 [3] - 传统网络安全体系不足 需建立全新安全与隐私架构 用户授权AI处理银行 医疗等敏感数据时风险成倍增加 [2][3] 行业安全防护方案 - Brave提出AI浏览器"四道防线":区分用户指令与网页内容 检查任务符合性 敏感操作需用户确认 代理模式与常规浏览隔离 [4] - 谷歌 OpenAI等公司避免推出类似Comet功能 转向虚拟机与云浏览器模式 阿里巴巴无影云和智谱AutoGLM"虚拟手机"属同类探索 [4] 行业竞争格局 - 智能体成为2025年核心竞争领域 海外苹果 Anthropic 谷歌 OpenAI与国内百度 字节 腾讯 阿里全面投入布局 [3]
单任务成本约0.2美元 智谱要用云端Agent抢市场
第一财经· 2025-08-20 14:45
产品升级与功能拓展 - 智谱于8月20日将Agent产品AutoGLM升级至2.0版本 新增云端执行模式 与阿里云及腾讯云合作 不占用用户本地设备资源 [2] - 新版本支持操作美团、京东、小红书、抖音等数十个高频应用 较初期版本仅支持微信点赞、淘宝购物等功能显著扩展 [2] - 云端模式解决本地化运行限制(如3月版本需通过GUI界面操作) 确保任务持续执行且不影响用户其他设备使用 [2][3] 技术路线演进 - 公司采用"模型即Agent"技术路径 通过端到端强化学习直接赋予模型Agent能力 而非依赖人类专家轨迹学习 [3] - 实现Deep Research与Browser-use Agent技术融合 使Agent能处理大量数据并充分挖掘生产资料价值 与ChatGPT Agent技术方向一致 [3] - 技术迭代驱动从本地化运行(如小红书14天养号任务)向云端虚拟机架构迁移 解决设备依赖与任务中断问题 [2][3] 成本结构与商业化 - AutoGLM单任务成本约0.2美元(含模型与虚拟机) 预计随规模化和商业化推进进一步压缩 [5] - C端产品目前免费 B端采用定制化报价模式 未披露标准调用价格 [5] - 国内Agent单任务定价区间为0.008-0.04元人民币(中金数据) 海外商业化定价多为0.5-2美元/任务 [5] 行业市场动态 - 海外B端Agent市场处于结构性拐点 生态布局与技术演进同步催化市场空间打开 [5] - 2025年以来国内用户对AI应用认知度提升(受DeepSeek等推动) Agent市场需求端瓶颈逐步疏通 [5]
单任务成本约0.2美元,智谱要用云端Agent抢市场
第一财经· 2025-08-20 13:12
智谱AutoGLM单任务成本约0.2美元。 8月20日,大模型初创公司智谱将旗下Agent(智能体)产品AutoGLM升级至2.0版本,开启云电脑与云手机执行任务模式。据第一财经记者了解,此次智谱 主要与阿里云及腾讯云合作,不占用用户本地设备存量,在云端运行Agent程序,避免影响用户使用其他APP。 智谱在Agent方面的迭代从去年10月持续至今,初级版本可微信点赞、淘宝购物、携程订票。11月升级后新增会议总结、文档处理、网页搜索与总结等功 能。彼时智谱CEO张鹏对记者表示,智谱对智能体的理解更偏底层技术。 关于底层技术路线的变化,采访中智谱AutoGLM 技术负责人刘潇对记者表示,与其他Agent不同的是,智谱相信"模型即Agent",即Agent相当大一部分能力 正直接被模型通过端到端强化学习的方式吸纳。去年智谱Agent方案更多依赖于对人类专家轨迹的学习,虽然当时产品可以点外卖,但只要是没有见过的任 务类型,就无法完成。这推动团队在沉思产品上实现Deep Research(深度研究)与Browser-use Agent(网页智能体)的融合,因为如果不使用Browser-use的 方式,便无法阅读大量数 ...
手机“自动驾驶”时代来了,智谱还让手机拥有“云替身”
歸藏的AI工具箱· 2025-08-20 08:54
核心观点 - 智谱推出新版AutoGLM 实现全球首个手机通用Agent 通过云手机技术跨平台操控设备 支持复杂多应用任务执行 显著提升移动端操作效率并拓展AI应用场景 [1][3][4] 技术能力 - 云手机Agent在云端运行任务 解放用户本地设备资源 支持iOS、安卓和网页全平台客户端 [4] - 实现跨应用程序自动泛化任务执行 即将新增定时任务功能 [4] - 多模态内容识别能力突出 能处理高德地图等界面复杂、元素密集的应用 [9] - 通过手机虚拟机解决权限控制问题 避免与用户设备权限冲突 [24] 应用场景 - 生活服务: 自动规划行程 例如跨大众点评和高德地图完成餐厅筛选与通勤查询 涉及20余次点击操作 [7][9] - 比价购物: 同步搜索京东和拼多多商品 例如大疆无人机 京东最低价4837.9元 拼多多百亿补贴价4219元 提供优惠详情和购买建议 [11][14] - 内容运营: 检索小红书、抖音热门内容并整合加工 提供发布策略和互动数据侧重点 [16][17] - 适老化支持: 帮助老人操作腾讯视频等复杂APP 例如通过筛选功能找剧集并加入收藏 [19][21] 行业影响 - 中国互联网80%流量集中于移动端 AutoGLM通过云手机技术突破用户时间限制 创造无限注意力经济增长通道 [24][28] - 解决国内特殊环境需求: 必需操作依赖手机APP 与海外以网页为主的服务模式存在显著差异 [22] - 面临验证码和反爬机制等执行障碍 需与互联网巨头协同构建稳定Agent运行环境 [26] - 手机Agent化成为不可避免趋势 模型能力已达标 生态建设成为关键发展因素 [26]
厉害了,智谱造了全球首个手机通用Agent!人人免费,APP甚至直接操控云电脑
36氪· 2025-08-20 07:34
产品发布与核心功能 - 智谱发布全球首个手机通用Agent AutoGLM 可免费使用 [2] - AutoGLM通过云端执行任务 不占用本地资源且不影响设备正常使用 [4][23] - 支持生活助手和办公助手两类任务 例如点外卖、比价、生成调研报告等 [5][14][16] 技术实现与行业突破 - 基于云端智能手机和云电脑执行任务 预装应用并支持跨APP操作 [13][22] - 依托GLM-4.5和GLM-4.5V模型 整合推理、编码、研究等多项能力 [32] - 解决行业痛点:本地设备算力有限且任务执行干扰用户体验 [24] 应用场景与生态扩展 - 支持手机、PC、智能音箱、车载系统及物联网设备集成 [26] - 推出移动端API和开发者生态共建计划 开放能力赋能第三方产品 [26] - 办公场景中可自动生成基于近100份参考源的数千字调研报告 [17] 战略定位与行业影响 - AutoGLM是智谱AGI路线图中实现L3"自主学习智能体"的关键步骤 [29] - 行业玩家积极布局云端Agent 如阿里云推出无影AgentBay [25] - 提出3A原则:全时待命、零干扰运行、全域设备连接 [35][36][37] 用户体验与效率提升 - 复杂任务如跨平台比价可自主执行 用户仅需发起指令 [14] - 原需一天完成的调研报告生成任务 现仅需几分钟 [17][21] - 云端备用机机制释放本地存储空间 提升设备运行流畅度 [23]
智谱的手机智能体内测10月后终上线,能否缓解隐私担忧?
南方都市报· 2025-08-20 07:17
产品发布与核心特性 - 智谱旗下手机Agent产品AutoGLM于8月20日正式上线苹果和安卓应用商店 距离首次发布已10个月 [1] - 产品由最新语言模型GLM-4.5与视觉推理模型GLM-4.5V驱动 成本较接入国外模型的智能体大幅下降 [1] 技术架构与执行方式 - 采用云手机方案 智能体任务执行从手机终端迁移到云端 通过腾讯云手机服务调用云端桌面App [2] - 无需索取手机终端系统敏感权限 不占用终端屏幕和算力 用户可同步操作其他事项 [2] - 支持操作抖音 小红书 美团 京东等40多款高频应用 覆盖点外卖 订机票 查房源 预约健康服务等场景 [2] - 执行能力封装为API 开发者可接入AI眼镜等可穿戴设备 通过Rokid AI眼镜演示点咖啡指令 [3] 用户体验与操作流程 - 使用前需在云手机桌面登录各App个人账号 指令需具体以提升执行准确度 [2] - 出于资金安全考量 智能体不能直接付款下单 需人为接管完成最后一步 [2] - 云手机登录导致手机终端相应App账号自动退出 后续需重新登录带来不便 [2] 隐私安全机制 - 产品不再调用终端设备无障碍权限和录屏权限 仅读取云设备屏幕内容 [4] - 系统将云设备图像发送给大模型分析 模拟人类操作方式完成任务 [4] - 隐私政策强调仅为完成指令获取屏幕信息 采取严格数据加密保护措施 不用于其他目的 [4] - 云手机界面明确告知不保存第三方App账号密码 非任务状态不获取屏幕信息 [5] 市场与监管背景 - 应用商店对智能体产品隐私安全性要求严格 AutoGLM经大量迭代达到上架标准 [4] - 此前无障碍权限使用受工信部门严格管控 因涉及敏感权限且可能超出原设计目的 [4] - 部分用户在社交平台对产品隐私安全仍存担忧 [5]
中美AI竞争加剧:OpenAI对手智谱发布智能体应用,奥尔特曼称美国低估中国AI威胁
钛媒体APP· 2025-08-20 05:13
智谱AI产品发布 - 智谱发布全球首个手机Agent智能体应用产品AutoGLM 2.0版本 基于纯国产模型GLM-4.5和GLM-4.5V驱动 具备推理、代码与多模态能力 支持iOS、安卓和网页全平台 [3] - AutoGLM 2.0突破硬件限制 通过Agent+云手机技术在任何设备和场景下运行 实现从"言"到"行"的范式转变 [3][10] - 产品定位C端用户 通过多智能体系统帮助用户平行处理工作和日常任务 实现"1(用户)+N(智能体)"的能力扩展 [3] 技术性能与测试表现 - 在Device Use基准测试中 AutoGLM整体表现优于ChatGPT Agent、UI-TARS-1.5和Claude 4 Sonnet 其中在OSWorld测试中获得48.1分 远超ChatGPT Agent的42.9分 [11][12] - 在Browser Use测试中达到87.7分 在Mobile Use的AndroidWorld测试中获得75.8分 均领先竞争对手 [12] - 技术实现基于端到端异步强化学习突破 结合GLM-4.5系列模型原生能力 支持推理、编码、研究和GUI操作等多类任务 [10] 公司融资与生态布局 - 智谱累计完成约11次融资 总金额超125亿元人民币 投资方包括红杉中国、高瓴资本、阿里巴巴、腾讯等头部机构及多地国资 [7] - 公司定位开放平台 与高通、三星、英特尔、荣耀等硬件厂商合作 在AIPC和智能助手领域落地应用 [9] - 使用成本低于竞争对手 DeepSeek 最低仅需8个英伟达H20芯片即可运行GLM-4.5系列模型 [7] 行业竞争与中美AI发展 - 2024年中国人工智能产业规模超7000亿元人民币 连续多年保持20%以上增长率 截至3月共有346款生成式AI服务完成备案 [5] - OpenAI CEO奥尔特曼表示美国低估中国AI进展 中国在推理和技术探索方面可能更快构建能力 中美AI竞赛复杂度超出简单领先排名 [5][17] - 中国开源模型DeepSeek V3训练成本不到600万美元 性能媲美ChatGPT 促使OpenAI改变模型发布策略并首次推出开放权重模型 [13][17][18] 市场发展与预测 - 2025年被行业称为"智能体爆发年" 百度、阿里、腾讯等互联网大厂密集布局 智能体市场进入协同作战阶段 [7] - 仅2024年上半年就有超50款智能体产品发布 包括字节跳动的扣子空间和360的多智能体蜂群系统 [7] - IDC预测到2027年60%的大型企业将采用协作型智能体系统 业务流程效率提升50%以上 [20]
厉害了,智谱造了全球首个手机通用Agent!人人免费,APP甚至直接操控云电脑
量子位· 2025-08-20 04:33
产品发布与核心功能 - 智谱发布全球首个手机通用Agent AutoGLM 实现云端执行任务 支持跨APP操作如点外卖、比价等[1][5][9] - 产品免费向公众开放 兼容安卓和iOS系统 并可操控云电脑执行复杂任务[6][9][23] - 提供生活助手和办公助手两类任务 用户通过"接管手机"进入云端界面操作[11][15][17] 技术实现与架构 - 采用云端执行模式 不占用本地设备资源 任务流畅且与用户本地操作互不干扰[9][33][37] - 依托智谱开源模型GLM-4.5和GLM-4.5V 整合推理、编码、多模态等能力于单一模型[50][52] - 为每位用户配备云手机和云电脑 预装应用生态 支持数据持久化存储[31][32] 应用场景与案例 - 生活场景:自主完成外卖订购、跨平台比价(如淘宝、京东、拼多多对比200元保温杯)[19][20][21] - 办公场景:自动生成调研报告(参考近100份源文件、输出数千字)及制作PPT[25][26][29] - 支持多设备集成 包括智能音箱、车载系统等 并通过开放API赋能开发者生态[42] 行业意义与趋势 - 解决Agent落地痛点:云端执行规避本地算力限制和高并发任务宕机问题[36][37][53] - 行业竞相布局云端Agent 如阿里云推出无影AgentBay、PPIO推出Agent沙箱产品[38][39][40] - 推动Agent从"信息辅助"向"直接操作"升级 成为处理复杂场景的全能型工具[31][54][55] 公司战略与AGI路径 - AutoGLM是智谱AGI路线图中L3"自主学习智能体"的关键一步 通过真实应用反馈推动模型自我进化[48][49] - 提出3A原则:全时待命(Around-the-clock)、零干扰(Autonomy)、全域连接(Affinity)[56][57] - 目标是通过技术与应用的正向飞轮 夯实公司在Agent领域的领先地位[48][49]