AutoGLM模型
搜索文档
豆包和智谱,二线手机厂商的救命稻草
钛媒体APP· 2025-12-11 12:35
行业趋势与市场预测 - 埃隆·马斯克预测未来5到6年内传统智能手机及独立应用程序将会消失,未来设备将成为“AI推理的边缘节点”,主要负责显示、音频和通信,复杂任务由云端与本地AI协同完成[2] - IDC预计,2026年中国新一代AI手机出货量将达到1.47亿台,同比增长31.6%,占据整体市场的53%[17] - 端云结合将成为主流服务模式,厂商将更多调用外部云侧大模型,同时专注于端侧多模态模型的轻量化与深度推理能力建设[17] 新一代AI手机的核心突破 - 新一代AI手机的核心突破是“端侧大模型”的深度嵌入,将大型AI模型直接装入手机,赋予设备独立“思考能力”,可离线快速处理复杂任务并跨应用操作[7] - 早期手机厂商的AI功能多聚焦于单点辅助,如拍照美颜、智能翻译、简单日程提醒等,无法跨应用完成复杂流程[5][6] - 行业数据显示,新的协同模式使AI手机功能落地周期从早年的12个月缩短至3个月,应用覆盖场景从不足20个扩展至100多个[12] 豆包AI手机案例 - 豆包联合中兴推出努比亚M153工程机,被称为“豆包AI手机”,原价3499元,首批3万台已售罄,二手平台全新未拆封版本报价3999到4999元不等,最高报价炒至3.6万元,并衍生出日租金50到79元的短期租赁业务[2] - 该手机通过“系统级嵌入”将豆包大模型嵌入安卓系统底层,获取底层权限,能调动所有系统资源和APP,实现跨应用自动化操作,例如全网比价下单[7] - 首发仅3天后,该手机遭遇多家平台的使用限制,豆包紧急下线部分功能以适配各平台安全规范,官方强调这只是一款工程样机,公司没有开发手机的计划[9][10] 智谱的AutoGLM开源策略 - 智谱开源了AutoGLM模型,其凭借GLM-4.5与GLM-4.5V双模型驱动,具备强大的屏幕理解与操作执行能力,可稳定应对长达数十步的复杂任务流程[3][8] - 该模型已支持微信、淘宝、抖音、美团等超过50个高频中文应用的核心场景,用户一句语音指令即可触发AI自主完成点外卖、订机票等操作[8] - 智谱采取“安卓式开放”思路,将包含50多个高频APP操作能力的AutoGLM模型、Phone Use框架及工具链全面开源,支持厂商“拿来即用”,快速形成生态[11] - 为解决安全问题,智谱将AI Agent置于云端的虚拟手机中运行,每个动作可回放、审计、干预,敏感数据严格隔离,并通过开源和私有化部署让使用方掌控数据[13][14] 生态竞争与行业影响 - 豆包与智谱采取了两种不同的落地路径:豆包将AI“下放”到手机底层系统以实现强大控制力;智谱通过开源与合作伙伴共建生态,但两者本质都是在争夺“AI时代的操作系统入口”[15][16] - 传统手机厂商正在为AI生态投票:豆包在扩展与更多手机厂商的合作;荣耀、三星则与智谱达成战略合作[16] - 苹果宣布将联合阿里巴巴为中国用户开发iPhone的AI功能[17] - 当AI Agent可以直接调度多APP完成服务,超级APP的用户留存、广告变现、数据壁垒将被瓦解,按周鸿祎的说法,这将“冲垮互联网大厂护城河”[18] - 用户习惯“一句话完成任务”后,超级APP将从“流量守门员”转型为AI Agent的“能力供应商”[19] 发展挑战与未来关键 - AI手机助手处于早期探索阶段,其直接调动系统能力引发了数据安全风险,各大公司出于安全考虑采取限制措施是可以理解的[10] - AI Agent面临的最大问题之一是如何在合规层面建立“AI操作认证体系”,以有效区分正常辅助与恶意外挂[20] - AI Agent在手机上的落地不仅是技术问题,更是生态协同问题,最终胜出者将是能平衡“用户体验、商业利益、安全合规”的生态协调者[20]
大模型开始“点击”屏幕!智谱、字节抢滩“手机操作”,AI超级入口争夺战升级
每日经济新闻· 2025-12-10 14:52
文章核心观点 - 2025年末,AI行业围绕终端入口的争夺战显著提速,焦点从云端大模型转向对手机等终端设备的直接操作与控制,旨在重构移动互联网的流量分发权和交互逻辑 [1] - 科技巨头通过不同技术路径(如开源模型、系统级嵌入)竞逐“AI超级入口”,竞争范围已从手机扩展至穿戴设备和原生App,试图把握下一代流量入口并可能引发行业格局变革 [1][5][6] 行业动态与竞争格局 - 行业竞争在2025年末突然提速,巨头们不约而同地将目光锁定在“Phone Use”(手机操作),目标是从被动问答升级为主动执行,重构移动互联网流量分发权和交互逻辑 [1] - AI超级入口的争夺是战略层面的生死之战,在移动互联网红利见顶的背景下,大模型厂商试图通过Agent技术将分散的App功能收敛到一个统一入口 [5] - 竞争已不仅限于手机,科技巨头正试探新的硬件形态以求弯道超车,例如AI眼镜,行业正押注下一代流量入口,可能颠覆手机的统治地位 [6][7] - 另一条竞争路径是将App本身进化为超级AI应用,例如阿里巴巴基于性能领先的AI模型和自身生态优势,打造面向C端用户的AI超级原生应用 [8] 主要参与者的战略与产品 - **智谱**:于12月9日正式宣布开源其自主研发的AutoGLM模型,口号是“让每台手机都能成为AI手机” [1]。其战略是通过开源核心模型和Phone Use能力框架,降低行业门槛,旨在将相关能力变为行业可共同打磨的公共底座 [2] - **字节跳动(豆包)**:于12月1日发布豆包手机助手技术预览版,选择与手机厂商在操作系统层面进行深度合作的系统级嵌入路径 [1][2]。官方演示展示了“所见即可问”和“所言即可为”的能力,能完成查票订票、商品下单等任务 [2]。公司明确表示目前没有自行开发手机的计划,而是选择生态共建 [3] - **小米**:于今年6月推出售价1999元的AI眼镜,雷军将其定义为随身AI入口,试图通过摄像头和语音交互成为连接人与数字世界的轻量化中介 [6] - **阿里**:旗下夸克于11月正式发布AI眼镜,试图将搜索场景从手机屏幕延伸至视觉场景 [6]。阿里在11月相继推出千问与灵光两大App,在AI to C领域,基于性能领先的AI模型和自身生态优势,打造面向C端用户的AI超级原生应用 [8] 技术发展现状与挑战 - **技术能力现状**:大模型开始能够点击手机屏幕、理解UI并执行任务,但距离完美仍有很长的路要走 [1][3]。智谱指出,行业希望Agent能完成数十分钟甚至数小时的长距离任务,但当前模型仍难以充分实现这一目标 [3]。豆包团队也提示,受限于大模型技术的不确定性,相关场景无法保证百分百复现,产品实际可用性与预期有差距 [3] - **核心挑战(智商瓶颈)**:智谱认为最大的问题在于模型本身的“智商”,需要算法和模型公司的持续努力 [3] - **工程与应用挑战**:如何为AI手机提供所需的操作系统和产品,以及建立Agent身份认证,需要行业共同协作 [3] 安全、隐私与部署模式 - **安全与隐私挑战**:当AI具备操作微信、支付软件等权限时,如何防止其随意操作是悬在行业头顶的达摩克利斯之剑 [3]。用户隐私是行业共同的关注点 [3] - **部署模式趋势**:出于对用户隐私、响应及时程度和云端使用成本等因素的考虑,轻量化本地部署是手机大模型的一个重要趋势 [3]。这意味着大模型将直接部署到手机内,并由手机芯片承担模型推理工作,这需要使用更少的数据量和计算资源 [4] - **智谱的安全策略**:采取了较为保守的云手机与强隔离策略,在算法和工程开发早期就融入了敏感操作和安全栅栏的设计理念,将可控性和隐私放在最优先位置考虑 [5] 对产业链的影响与未来展望 - **对手机厂商的影响**:AI技术可能带来一轮新的换机潮,但也可能让手机沦为大模型的躯壳 [6]。与国内领先的大模型厂商相比,手机厂商在算力基础设施上的储备往往不够充足,研发常遇算力受限,且投入巨大并面临技术挑战 [6] - **流量与生态变化**:智谱提出了“Agent流量”的概念,即由Agent自主执行带来的流量,为移动互联网注入新流量 [5]。Agent带来的生产力改变和更好的个性化服务能力,被认为是对整个生态的新流量和红利注入 [6] - **商业利益与开放问题**:当AI Agent成为超级入口,可能改写App开屏广告、推荐流广告的价值。但在商业利益分配机制理顺之前,拥有海量数据的头部App(如微信、美团、抖音等)是否愿意向Agent开放核心接口或数据,仍是巨大问号 [8] - **未来合作与参与方式**:智谱表示希望看到更多Agent应用、AI原生手机及硬件问世,未来的参与方式将是多种多样且超出当前想象的 [6]
透过史上最火WAIC,看Agent六大趋势
36氪· 2025-08-01 09:55
行业核心观点 - Agent从概念验证阶段进入大规模应用阶段 成为人工智能行业的必答题 [1] - WAIC 2025展示800余家企业3000余项展品 展品数量比往年增加一倍 [1] 技术发展趋势 - 万物皆可Agent化 从工业生产到医疗健康等多领域实现应用落地 [2][4] - 智能体系统展示工业场景协同能力 西门子Industrial Copilot实现从订单输入到物流调度的全流程自动化 [2][4] - 多智能体协同(Multi-Agent)成为解决复杂任务的关键方式 蜜度展示的办公系统将数小时工作缩短至分钟级 [7] - 从工具思维转向协作伙伴思维 智能体具备自主决策和任务规划能力 [7] 企业战略转型 - 科技巨头从展示大模型转向展示Agent应用 智谱AI AutoGLM模型实现跨平台任务执行包括抢红包 电商下单等操作 [5] - 交付模式从SaaS转向RaaS(结果即服务) 强调实际交付结果而非功能数量 [9][11] - MiniMax Agent展示全栈开发能力 半小时内生成可运行的横版冒险游戏框架 [9][13] 市场应用扩展 - C端产品出现井喷式爆发 WPS灵犀支持自然语言多轮对话完成文档创作和演示文稿生成 [14] - Agent被确立为AI时代的软件形态产品 类比PC时代的网站和手机时代的App [14] 基础设施发展 - 阿里云发布"无影AgentBay"云基础设施 开发者仅需三行代码即可接入高性能环境 [16] - PPIO搭建全栈式Agent基础设施服务平台 包含国内首个Agent沙箱和模型服务 [17] - 星环科技展示10分钟打造AI产业问答智能体 将数周开发过程极致压缩 [17] - 月之暗面聚焦开发者工具型模型 主力模型Kimi K2主打代码能力和Agentic任务处理 [17]
大厂不再重压ChatBot、“六小虎”声量分化、机器人不依赖绳索“吊着”|WAIC观察
财经网· 2025-07-31 03:53
WAIC展会核心观察 - 展会吸引约35万线下观众,800多家展商展示从大模型到机器人零部件的全产业链技术进展 [1] - 大模型应用从ChatBot转向Agent成为行业焦点,Agent市场规模已达50亿美元且年增长率40% [3][4] - 人形机器人实现从"被吊着"到实际场景复刻的跨越,展示娱乐表演/工厂作业/家庭服务三大类应用 [2][10] 大厂Agent布局 - 阿里推出无影AgentBay并展示三款开源大模型,夸克AI眼镜集成Qwen大模型支持导航/支付/比价功能 [3] - 百度GenFlow 2.0 Agent平台支持多智能体协作和主动干预,8月将全量上线 [3] - 蚂蚁数科基于Qwen3推出金融推理大模型Agentar-Fin-R1,联合金融机构推出超百个金融智能体解决方案 [6] 大模型"六小虎"动态 - 百川智能和零一万物未参展,后者战略转向ToB推出万智企业大模型平台2.0 [7] - 阶跃星辰发布Step3大模型并组建"模芯生态联盟",全年营收目标10亿元 [8] - 智谱AI展示AutoGLM模型可自主完成电商操作,月之暗面重点展示K2模型 [8] 人形机器人进展 - 宇树/智元/星动纪元等厂商展示舞蹈/搬运/服务等场景,核心零部件六维力传感器出货量年增2000+台 [10][12] - 蓝点触控六维力传感器占国内70%市场份额,订单排至9月并完成近亿元B轮融资 [12][14] - 非夕科技展示自适应机器人完成蛋雕/按摩等精细操作,结合具身智能大模型实现复杂任务 [11] 基础设施与算力 - 超云展示AI大模型一体机SuperCube R7000,强调高性价比和专业服务 [9] - 大模型一体机市场快速膨胀,超云通过联合生态伙伴打通应用落地"最后一公里" [10] 行业趋势 - 技术展示转向场景演练,AI应用从"技术炫技"进入产品化能力比拼阶段 [14] - 具身智能技术路线尚未收敛,软硬协同和生态组建成为竞争关键变量 [14]
在WAIC 2025看到AI的明天:六个变化,正在发生
经济观察报· 2025-07-27 12:06
核心观点 - AI正从底层能力展示阶段转向高频应用场景,重构个体能力与生产力[2] - 具身智能从拟人展示迈向真实场景协作,银河通用等公司融资超24亿元进入第一梯队[4][5] - AI成为个人效率"隐性搭档",华为昇腾384超节点开辟芯片传输高速通道[9] - AI智能体从聊天工具进化至任务执行,百度数字人平台NOVA实现5500万元GMV[18][19] - 创业公司路径加速分化,"AI六小龙"中4家参展,面壁智能与车企合作量产端侧模型[23][27][29] - AI从工具转向情感化伙伴,商汤科技推出毫秒级情绪反应陪伴机器人[32] - 新锐公司Flowith凭借"无限画布"交互设计吸引数十万用户,48小时生成1420万创造物[41][43] 具身智能进展 - 银河通用机器人Galbot实现货架商品精准抓取,公司累计融资24亿元[4] - 擎朗智能商用机器人全球出货超10万台,覆盖60多国端茶倒水等任务[5] - 智元机器人展演敲锣打鼓等复杂动作,展位达300平方米为全场最大[5] - 人形机器人公司展示分拣流水线应用,具身智能从"能动"升级至"能干活"[5] 个人效率增强 - 华为昇腾384超节点实现系统级优化,训练速度提升能耗降低[9] - 阿里巴巴夸克AI眼镜集成导航支付比价功能,成为人机交互中枢[10][12] - 百度"秒哒"平台支持零代码开发,累计生成20万个应用覆盖多场景[13][15] AI智能体进化 - 百度NOVA数字人平台支持多模态同步,预计10月全行业开放[18][19] - MiniMax Agent展示全栈开发能力,可交付网页电商应用[20] - 智谱AutoGLM模型实现抢红包/淘宝下单等复杂任务链执行[20] 创业公司分化 - 阶跃星辰开源多模态模型Step 3,联合吉利推出拟人车载智能体[23] - MiniMax聚焦生产力工具转型,强调AI对社会能力的系统性增强[24] - 面壁智能端侧模型落地长安马自达等车型,8月量产上市[27] 情感化AI伙伴 - 商汤科技AI陪伴产品实现毫秒级情绪反应,覆盖心理教育场景[32] - 金山办公WPS灵犀助手提供写作润色/图表生成等模块化能力[33] - 蜜度模力通2.0提升60%公文效率,未来将实现多Agent协同办公[36] 新兴公司突破 - Flowith"无限画布"支持非线性思维交互,48小时吸引数十万用户[41] - 第二代产品Neo上线后生成1420万创造物,强调交互创新优势[43] - 团队聚焦思维辅助器定位,通过快速创新应对大厂竞争[43][44]
在WAIC 2025看到AI的明天:六个变化,正在发生
经济观察网· 2025-07-27 11:13
核心观点 - 2025世界人工智能大会(WAIC 2025)呈现六大趋势:具身智能迈向真实世界协作、AI终端形态拓展、AI智能体从聊天工具走向任务执行、大厂与创业公司路径分化、新一代创业者聚焦人机交互与思维辅助、AI新星崛起 [2] - 人工智能正从底层能力展示阶段走向服务、办公、内容与交互等高频应用场景,催生全新工具、平台与解决方案,围绕重构个体能力、激活生产力展开 [2] 具身智能发展 - 银河通用的人形机器人Galbot可在真实货架中识别用户意图并完成精准抓取,公司累计融资超过24亿元 [3] - 人形机器人(上海)公司演示人形机器人在模拟分拣流水线中的应用,具备识别与协作能力 [3] - 擎朗智能商用服务机器人累计出货超过10万台,已出口至全球60多个国家 [3] - 上海智元展示"机器人天团",四台机器人分别负责敲锣打鼓、挥舞彩带、书法展示等任务,展位面积达300平方米 [3] - 与2024年相比,具身机器人已从展示状态转变为可自主完成复杂动作与持续交互,迈向能干活、可协作阶段 [4] AI终端与个人效率 - 华为展示昇腾384超节点,通过系统级优化实现资源调度与计算性能显著提升,为AI模型训练带来更高速度、更低能耗与更强稳定性 [8] - 阿里巴巴首款自研AI眼镜"夸克AI眼镜"首次亮相,搭载通义千问大模型和夸克AI能力,支持导航、支付、比价等功能 [10] - 百度"秒哒"平台主打"一句话生成应用",累计生成应用超过20万个,覆盖教育、营销、交易等多类场景 [14] - AI技术向"人人可用、人人可创"方向推进,成为普通人能力边界的延伸装置 [18] AI智能体进化 - 百度发布数字人平台NOVA,曾支撑罗永浩数字人直播间实现5500万元GMV,预计10月面向全行业开放 [19] - NOVA平台数字人技术升级体现在多模态同步、专业剧本模式、直播"AI大脑"实时响应三方面 [23] - MiniMax Agent支持全栈开发,可在平台上完成网页、电商应用等交付任务 [23] - 智谱AI AutoGLM模型展示任务规划与屏幕理解能力,可自主完成抢红包、信息整合、互动、下单、写作等多项操作 [23] - AI Agent系统正成为AI落地能力的关键接口 [26] 创业公司分化 - "AI六小龙"中阶跃星辰、MiniMax、智谱AI与月之暗面参展,呈现多元路径 [27] - 阶跃星辰推出全尺寸原生多模态推理模型Step 3并宣布开源,联合吉利银河M9发布车载AI智能体 [27] - MiniMax展出AI原生产品MiniMax Agent、海螺AI等,强调AI正转向更具创造力与执行力的生产力工具 [29] - 月之暗面展出主力模型Kimi2,主打代码能力和Agentic任务处理 [33] - 面壁智能推动端侧大模型在终端设备应用落地,与多家车企合作,首款量产车计划8月底上市 [36] - 大模型赛道呈现战略分化,"六小龙"版图松动,转向更具场景特色与技术风格的多点突围 [41] AI人性化趋势 - 商汤科技发布AI情感陪伴产品,搭载多模态情绪识别系统和长上下文记忆 [42] - 金山办公WPS灵犀助手展示模块化AI能力,拓展至AI头像生成与创作辅助,成为内容创作与知识管理的主动协作体 [44] - 科大讯飞借助智能办公本X5和讯飞听见等产品,打通从说、写到懂的全链路,适配隐私敏感、网络受限的办公环境 [49] - 蜜度模力通2.0支持60%以上公文处理效率提升,AI正从辅助工具转向自主伙伴 [53] - AI正在成为人们生活和工作中真正的伙伴与助手 [55] AI新星崛起 - Flowith成为AI交互领域最受关注的新锐力量之一,产品曾登上B站热搜第一 [56] - Flowith核心产品"无限画布"允许用户展开非线性思维,为创作场景带来更多可能性 [58] - Flowith发布第二代Agent产品Neo,上线48小时内吸引数十万在线用户,交付超过1420万个创造物 [58] - 创业公司机会在于"跑得更快、更专注",在用户体验、场景设计和人机交互方式上深度打磨 [59]
智谱发布智能体产品“AutoGLM沉思” 公司CEO张鹏:智能体也存在规模定律
每日经济新闻· 2025-03-31 06:07
产品发布与核心能力 - 公司于3月31日中关村论坛正式发布具备深度研究和实际操作能力的智能体“AutoGLM沉思”,推动人工智能Agent进入“边想边干”阶段 [1] - 智能体展现出自主规划能力,例如在未经专门训练的情况下,能规划通过访问巨潮资讯网来收集指定研报的解决方案 [1] 技术演进与模型参数 - “AutoGLM沉思”的技术演进路径为:GLM-4基座模型→GLM-Z1推理模型→GLM-Z1-Rumination沉思模型→AutoGLM模型 [1] - 公司基于最新技术积累,重新训练了参数规模达320亿的基座模型GLM-4-Air-0414,该模型在工具调用、联网搜索等智能体任务上能力大大加强 [2] - GLM-4-Air-0414模型在预训练阶段加入了更多代码类和推理类数据,并在对齐阶段针对智能体能力进行了优化 [2] 行业洞察与生态战略 - 公司CEO提出Agent存在类似Scaling Law的特点,通过扩展训练时的推理计算,Agent性能会更强 [1] - 公司计划于4月14日正式开源核心链路的模型和技术,以此推动行业生态发展 [1]