通用Agent

搜索文档
朱啸虎:搬离中国,假装不是中国AI创业公司,是没有用的
虎嗅· 2025-09-20 14:15
开源AI模型趋势 - DeepSeek等中国开源模型显著影响行业 保证AI技术不被少数私有化公司控制 开源成为AI领域主流趋势[3] - Hugging Face平台中国开源模型下载量已超过美国 开源模型与闭源模型能力差距正迅速缩小 预计半年到一年内可齐头并进[4] - 形成"中国开源vs美国闭源"竞争格局 美国开发者也在采用开源模型 开源生态一旦建立将形成长期壁垒[5][6][7][9] AI应用核心壁垒 - Manus案例显示Go-to-Market能力是关键壁垒 中国创业者技术能力不逊色但市场进入策略存在短板[10] - AI应用公司首要壁垒是发展速度 需要让竞争对手感到绝望的快速增长 其次才是用户留存能力[11] - 中美市场存在Token消耗差异 中国更关注Token消耗量作为"含AI量"指标 日均消耗达百亿级别 大厂提供补贴使性价比显著提升[12][13][14] AI编程赛道分析 - AI编程是大厂主导领域 中美都在进行补贴 美国补贴AI Coding 中国补贴外卖 几乎都是负毛利运营[15] - Cursor从月费改为按流量收费 显示ARR难以维持 负毛利达300%-500% 收入增长越快VC补贴压力越大[16] - 程序员群体忠诚度低 对价格和性能高度敏感 切换成本极低 OpenAI的API调用量曾因Gemini新版本发布而急剧下降[18] 机器人投资策略 - 重点关注能实际干活的"牛马型机器人" 如洗船机器人和按摩机器人 虽然外观不讨巧但能创造真实商业价值[21] - 按摩机器人不仅能按摩理疗 还能实现卖卡功能 转化率甚至高于人工 真正取代整个岗位而非"半个人"[22][23] - 机器人ROI计算必须完整取代岗位 很多创业公司陷入只能取代"半个人"的陷阱 导致ROI测算不真实[22] AI硬件发展逻辑 - AI硬件成功关键是做减法而非加法 优先保证大批量发货能力 许多公司因添加花哨功能无法交货而失败[28] - Plaud案例显示应选择小切入点 使用成熟技术实现商业化 FuzozoAI玩具本质是游戏玩法创新 AI只是噱头[28] - AI时代独有新硬件物种尚未出现 取代手机非常困难 电池 存储 联网等技术瓶颈可能需要10-20年突破[29][30] 全球化战略 - 中国C端App在全球市场具有绝对优势 过去十年超过百亿美金的C端App几乎全是中国创业者开发 美国VC已基本不投Consumer领域[37] - To B应用面临Go-to-Market挑战 PLG模式可做到2000-3000万美金ARR 但要突破5000万美金必须转型SLG模式[38][39] - 出海市场选择取决于团队背景 F-35级别打美国市场 F-20级别打日本市场 F-16级别打东南亚市场[39] 估值与资本环境 - 高估值会压缩犯错空间 移动互联网时代很多大厂高管创业即获5000万美金估值 但产品上线后第二轮融资就失败[43] - 中国美元基金资金量减少 因大量LP资金被锁在字节 小红书 蚂蚁等未上市公司 总市值约1.5-2万亿美金[45] - 香港成为主要IPO目的地 中国企业应选择在香港上市 全球投资人都认可香港市场的资产购买价值[47] AI创业投资策略 - 投资回报期指现金回收时间 希望市场投放资金在3-6个月内回笼 最佳情况是首月投1元收回0.8元 六个月后能收回2元[50] - 早期投资更关注用户参与度指标 如日活率 周活率 留存率 使用时长等 而非仅看收入数据[51] - AI时代演化速度是移动互联网的三倍速 创业者需在离大厂三条马路之外寻找机会 并以三倍速发展[53]
AutoGLM2.0升级发布,智谱:给每个手机装上通用Agent
新浪科技· 2025-08-20 07:45
产品升级 - AutoGLM 2.0突破硬件限制 可在任何设备及场景下运行[1] - 从1.0有限场景升级为云端自主执行型助手[1] - 配备专属智能体手机/电脑 无需占用用户本地设备[1] 生活场景应用 - 支持操作美团、京东、小红书、抖音等数十个高频应用[1] - 实现点外卖、订机票、查房源等生活服务功能[1] - 可通过语音指令完成具体消费行为如购买奶茶[1] 办公场景应用 - 跨网站操作飞书、网易邮箱、知乎、微博等网页平台[1] - 覆盖信息检索、内容撰写、生成视频/PPT/播客全流程[1] - 直接完成社交媒体平台内容发布功能[1] 技术实现方式 - 云端自主完成任务 用户可同步使用其他APP[1] - 实现多任务并行处理能力[1] - 突破本地硬件资源限制[1]
智谱AI发布AutoGLM 2.0 - 首个为手机而生的通用Agent。
数字生命卡兹克· 2025-08-20 04:47
产品发布与迭代 - 智谱发布AutoGLM2.0版本 距离1.0版本已过去10个月 [1] - 首次支持IOS系统并更改logo设计 [6] - 底层模型采用GLM-4.5和GLM-4.5V 单次任务成本仅0.2美元 [23] 技术方案创新 - 通过云端虚拟手机实现AI操作 用户可同时使用实体手机进行其他活动 [8] - 云手机预装主流APP 支持7x24小时不间断运行 [8][16] - 操作延迟约为0.5秒至1秒 主要面向AI操作而非人工直接使用 [20] 功能应用场景 - 支持外卖点餐 商品搜索 导航等生活化场景 [21][23] - 实现跨APP操作 如小红书搜索后跳转至高德地图导航 [4] - 支持定时任务功能 预计8月底版本更新 [26] 用户体验改进 - 解决1.0版本占用实体手机的问题 实现多任务并行处理 [5][8] - 云手机支持应用双开功能 方便多账号管理 [18] - 支付环节仍需人工确认 但AI可自动使用优惠券 [21] 行业意义 - 首个专注于手机端场景的通用Agent产品 [25][38] - 标志AI技术从语言交互向实际操作的能力跃迁 [46] - 通过自动化处理重复性任务释放用户注意力 [36][37] 局限性说明 - 云手机无法下载新APP 仅限使用预装应用 [20] - 未预装微信 可能出于隐私保护考虑 [20][42] - 建议使用低敏感度账号进行操作 核心账号仍需谨慎 [43]
Agent引爆产品新思维、奇点智能研究院正式成立!2025 全球产品经理大会首日精彩速览
AI科技大本营· 2025-08-15 13:56
产品经理角色演变 - PC时代产品经理角色更偏向"需求分析师",移动互联网时代转向"用户体验设计者"[1] - 大模型和Agent技术正在重塑产品经理工作方式,打破角色边界并升级思维模式[1] - 2025全球产品经理大会汇聚40余位专家及1000多位与会者,探讨AI产业趋势[1] 奇点智能研究院成立 - 由CSDN与Boolan联合发起,定位为人工智能前沿技术和产业落地的创新研究机构[3] - 聚焦计算范式、开发范式和交互范式转换,设立六大研究领域[5][7] - 与华东师范大学合作成立"开源创新与变革联合实验室",计划发布全球开源发展报告等研究成果[5] 大模型驱动的AI产业生态 - 基础大模型经历从"训练"到"推理"范式转换,强化学习推动"经验数据时代"[10] - SOTA模型内置Agent和Tool Use能力,大模型从Chatbot进化到Agentic模型[11] - Vibe Coding(氛围编程)创造增量市场,有望实现"可塑软件"和低成本编程[12] - 自然语言对话界面重构智能应用形态,带来应用服务化等新趋势[13] - 未来智能体生态可能由多元设备(眼镜、手机、汽车等)作为交互入口[14] 生成式AI与生产力革命 - 昆仑万维发布全球首款AI Agent架构Office智能体Skywork Super Agents,将8小时工作量缩短至8分钟[18] - 昆仑万维开源多款多模态模型,覆盖音频驱动数字人、交互式世界模型等领域[19] - 海外AI API调用统计显示编程类占比87%,角色扮演类占5.4%[20][22] - 行业化大模型是必然趋势,通用Agent难以覆盖所有行业[23] - ToB场景核心是"增效",ToC场景核心是"降本"[23] GenAI应用交互设计 - 当前GenAI产品多以"助手"形态存在,受现有环境约束明显[25] - 交互设计核心任务:高效获取任务与上下文、便捷审核与应用结果[26][29] - 鼠标双击唤起助手可能成为GenAI时代的新型交互方式[28] AI时代的产品人味 - 当前AI工具存在交付模式单一、环境感知不足、交互设计不直观等问题[34] - 产品设计需平衡"天道(环境)、人道(人类需求)、AI道(技术)"[34] - YouMind通过多模态优化和内容可编辑性提升"人味",实现AI与用户双向协作[36][37] AI时代的产品经理机遇 - AI时代产品方法论面临跳跃式颠覆,产品经理既是受益者也是被颠覆者[40] - 技能边界被打破,"一人公司"模式可能普及[41] - 开源模型推动全产业链协作式创新,对产品经理具有战略意义[44][45] Chat BI与数据挑战 - Chat BI最大挑战是企业数据基础薄弱,原始数据质量影响分析结果[46][47] AI产品用户体验 - AI产品需明确功能优化与数据能力的边界,避免过早依赖语言模型升级[48] - 创业公司应集中资源在关键节点形成差异化优势[49] 行业应用与合作伙伴 - 大会设置12大专题,覆盖生成式AI、Agent设计、企业级应用等领域[51] - 鸿蒙生态、万兴科技等合作伙伴展示创新成果[51]
百度聚焦,心响失宠
36氪· 2025-07-30 09:51
百度AI业务调整 - 公司于七月初组织会议点名多个产品并明确减少投入 包括心响和月匣 [2] - 心响作为公司旗下首个C端通用AI智能体 支持超200种功能 覆盖知识解析 旅游规划 学习办公等领域 但公测后不到一个季度即面临资源收紧 [2][5] - 月匣作为AI社交应用遭遇架构调整 团队被合并至其他业务线 业务规模降级 管理层决定再观望一至两个季度 [2][9] 人事与组织变动 - 搜索及智能体业务总经理谢天转岗至IDG地图事业部 此为干部轮岗机制下的正常调整 [3] - 谢天于2024年下半年接手搜索及智能体业务线 心响和月匣均在其任内上线 [4] - 部分心响产品组成员已调离原业务 月匣团队在业务合并后也有员工被抽调至其他业务 [5][9] 产品表现与挑战 - 心响定位为"AI任务完成引擎" 通过自然语言交互实现复杂任务拆解和可视化结果交付 但被内部评价为能解决的问题非常简单 不值得用户花几分钟生成答案 [5][6][7] - 月匣作为第四代AI社交产品 对标星野 猫箱 Wow等 但上线后处于半成品状态 功能迭代滞后 缺乏TTS等成熟功能 [8][9] - 两款产品均未进行大规模投流 用户增长依赖内部流量和自然裂变 业务管理层对月活指标敏感 检验周期有限 [7][10] 行业环境与商业化困境 - 国内ToC软件市场难以实现付费转化 模型能力应用程度有限 限制通用Agent发展 [6] - 心响提供的200个场景包含很多非常规功能 用户使用意愿和频率可能不高 [6][7] - AI社交头部产品均减少投放 业内缺少长期稳定的百万DAU级产品 行业呈现收缩态势 [10][11] 战略聚焦与反思 - 李彦宏在季度高管会议上指出公司缺乏战略聚焦 导致多场关键战役失利 需要清楚干什么和不干什么 [2][12] - 公司正重新聚焦基础模型能力和搜索端应用 近期开源文心大模型4.5系列 包含10个不同参数和场景的模型组合 [12][13] - 内部业务规划按季度划分阶段 若首季度不及预期则项目难推进 业务模式倾向于维持现状 [14] 人才与管理问题 - 公司于2024年6月启动最大规模顶尖AI人才招聘 岗位招聘同比扩大60% 并计划5年内培育1000万AI人才 [13] - 内部管理存在僵化问题 自研AI工具平台能力被反馈弱于友商 但汇报时只呈现好的一面 [13] - 业务协同存在标准不统一问题 不同团队适配效果不佳 大团队惯性问题依旧存在 [14]
90%被大模型吃掉,AI Agent的困局
投中网· 2025-07-25 08:33
通用Agent行业现状 - 通用Agent面临尴尬境地,90%的市场份额可能被大模型吞噬[3][4][8] - Manus等头部公司出现收入下滑和用户活跃度下降,Manus 6月访问量1781万次,较3月峰值2376万次下降25%[5][22] - Genspark发布45天即达3600万美元ARR,但6月MRR环比下跌13.58%至295万美元[20][22] 商业化与竞争格局 - 头部产品商业化表现分化:Manus 5月ARR达936万美元,但6月MRR环比暴跌51.79%至167万美元[20][21] - 国内大厂主导市场,百度、字节等通过免费策略挤压创业公司空间[26][27][29] - 收费模式对比:Manus Pro会员199美元/月限积分制(约10次/天),Claude Opus 4同价但支持不限量使用[9][11] 技术瓶颈与场景困境 - 大模型能力溢出直接冲击Agent价值,用户更倾向使用基础模型API[9][12] - 垂类Agent在企业端优势显著,可对接内部知识库实现精准输出[15][16] - 当前通用Agent核心场景局限在PPT生成、深度研究等办公功能,但存在信息错漏和低价值输出问题[24][32][34] 技术演进方向 - MiniMax采用线性注意力机制支持100万上下文输入,强化法律文书处理能力[35] - 强化学习(RL)成为突破关键,月之暗面Agent模型在HLE测试得分从8.6%提升至26.9%[36][38] - OpenAI最新Agent产品ChatGPT Agent在HLE测试创41.6%的SOTA成绩[38] 市场趋势 - 行业呈现"模型即Agent"趋势,大模型公司直接切入Agent赛道[28][29] - 开发者生态成竞争焦点,阿里、字节等通过平台推广和比赛吸引开发者[26] - 深度研究功能因成本较低成为主流方向,多模态能力成为标配[30][32]
Manus“删博、裁员、跑路新加坡”后,创始人首次复盘经验教训
虎嗅· 2025-07-19 06:44
公司发展历程 - 公司Manus因"全球首个通用Agent"概念在3月走红,被称为中国的"第二个DeepSeek时刻" [4] - 5月完成由硅谷顶级风投Benchmark领投的7500万美元B轮融资,估值飙升至5亿美元 [5] - 6月底被曝出无预警裁员、创始团队删博、公司主体搬到新加坡等争议事件 [6][7] 技术策略与创新 - 选择上下文工程而非端到端自研大模型,基于开源或商业大模型最大化现有能力 [8] - KV缓存命中率是代理系统核心指标,输入输出Token比高达100:1,缓存可节省10倍成本 [20] - 用文件系统作为无限上下文,解决长上下文窗口限制问题,信息可随时存取 [9][37] - 通过显式"背诵"机制操控模型注意力,自动生成todo.md文件保持任务聚焦 [10][46] - 保留错误信息帮助模型自我修正,减少同类错误发生概率 [11][50] 产品设计原则 - 遮蔽而非移除工具管理,通过屏蔽Token概率保持灵活性同时避免缓存失效 [8][28] - 避免动态增减工具,确保提示前缀稳定和上下文仅追加不修改 [25] - 增加动作和观察的多样性,打破固定模式提升代理鲁棒性 [54][55] 行业影响与争议 - 公司被质疑利用中国工程师资源打造产品后迅速融资并裁员跑路 [2] - 联合创始人发长文回应技术路线但未解释裁员和搬迁新加坡等关键问题 [14][15] - 公司技术探索获认可,但能否将技术转化为实际用户价值仍存疑 [16] 创始人观点 - 上下文工程是新兴实验科学,核心在于通过上下文塑造代理行为而非比拼模型本身 [12][56] - 智能代理未来需通过精心设计的情境逐步构建,强调实践迭代的重要性 [57]
90%被大模型吃掉,AI Agent的困局
36氪· 2025-07-18 10:48
通用Agent市场现状 - 通用Agent面临增长放缓困境,Manus访问量从3月2376万次下跌至6月1781万次(跌幅25%),Genspark访问量下降8% [10] - 商业化表现波动明显:Manus 5月ARR达936万美元但6月MRR环比下跌超50%至254万美元,Genspark同期ARR 3600万美元但MRR下跌13.58%至295万美元 [9][11] - 核心问题在于缺乏杀手级应用场景,当前功能集中于PPT生成、多模态处理等办公场景,用户付费持续性不足 [2][11] 竞争格局变化 - 基础模型能力溢出侵蚀市场:Claude Opus 4等模型提供不限量服务(200美元/月),相较Manus Pro会员199美元/月但限制每日约10次任务更具性价比 [4][6] - 垂类Agent在企业端形成优势:Head AI等垂类产品能对接内部知识库,准确度显著高于通用Agent [7] - 大厂主导国内市场:百度、字节等通过免费策略挤压创业公司空间,MiniMax等采用积分制但难敌大厂资源 [12][13] 技术演进方向 - 强化学习(RL)成为突破重点:月之暗面Kimi-Researcher通过RL将HLE测试得分从8.6%提升至26.9%,OpenAI ChatGPT Agent最新达41.6% [18][20] - 长文本处理能力升级:MiniMax M1模型支持100万token上下文,优于Gemini 2.5 Pro的200K上限 [17][18] - 多模态集成趋势明显:MiniMax融入视频生成能力,百度心响整合原有对话系统 [15] 商业模式挑战 - 成本转嫁矛盾突出:Manus采用积分制导致高频用户成本高企,对比基础模型API无使用次数限制 [6] - B端落地障碍:企业需求与通用Agent"黑盒"特性存在冲突,需深度集成内部系统 [7] - 大厂生态战略:阿里、字节等侧重开发者平台建设,通过比赛推广而非直接产品竞争 [11]
梁文锋等来及时雨
虎嗅APP· 2025-07-16 00:05
行业竞争格局 - 国内大模型行业竞争加剧,"AI六小龙"中的阶跃星辰、智谱AI计划7月底发布新一代基础大模型,科大讯飞也将推出全新模型 [1] - Kimi K2模型发布后成为国内首个总参数量达1万亿的MoE架构开源模型,在代码和数学推理任务上反超DeepSeek [7] - 阿里、字节、百度等科技大厂通过推出更低价的API模型,正在夺走DeepSeek的性价比标签 [7] DeepSeek市场表现 - DeepSeek月活跃用户规模从1月爆发式增长后,4月开始下滑,5月MAU为1.69亿,环比下降5.1% [1] - 官网访问量下降29%,用户使用率从年初7.5%峰值回落至5月底的3% [2] - 苹果App Store免费应用下载榜排名从榜首跌至30名开外 [2] 技术发展动态 - DeepSeek近期仅进行小版本升级,如DeepSeek-R1-0528仍基于2024年12月的V3 Base模型微调,未推出新一代V4模型 [6] - Kimi K2支持128K上下文窗口,MiniMax-M1支持100万上下文输入,远超DeepSeek R1的64K窗口 [10] - DeepSeek是主流AI助手中唯一暂不支持多模态功能的产品,缺乏语音、图片生成等能力 [13] 算力与供应链 - 英伟达H20芯片因美国出口管制被禁售,导致DeepSeek算力储备紧缺,影响R2模型上线 [3] - 7月15日英伟达公告正在申请重新销售H20芯片,美国政府已承诺授予许可证 [4] - MiniMax-M1模型训练仅用512块H800三周时间,租赁成本53.47万美元,远低于DeepSeek V3模型的557万美元 [8] 商业模式与策略 - DeepSeek选择开源路线但忽视C端应用,专注AGI研发,导致产品体验落后竞争对手 [10] - OpenAI通过高频更新保持热度,GPT-4.1系列发布后份额迅速增至10%,而DeepSeek R1使用率从7%峰值降至3% [12] - 第三方平台托管的DeepSeek R1与V3模型使用量自发布以来增长近20倍,显示开发者生态活跃 [9]
「0天复刻Manus」的背后,这名95后技术人坚信:“通用Agent一定存在,Agent也有Scaling Law”| 万有引力
AI科技大本营· 2025-07-11 09:10
AI Agent技术发展 - Manus项目引爆AI Agent热潮,展示从语言理解向任务执行的演化能力[2] - 行业对Agent Scaling Law和通用Agent可行性存在争议,部分研究者认为技术进步将实现通用能力跨越[2] - OWL项目在GAIA Benchmark位列第一,是最强开源Agent之一,十天斩获1w+ Star[6][8] - CAMEL框架是全球首个多智能体框架,已有两年技术积累[6] - OWL项目构建初衷是为开发者提供开源可拓展基础框架,而非与Manus比拼产品化能力[8] 开源社区与技术迭代 - OWL项目上线后收到大量社区反馈,GitHub上关闭200+ Issue,微信群反馈达上千条[9] - 社区开发者积极贡献PR,改进UI/UX和交互体验[10] - OWL进行重要重构,平衡性能与成本控制,GAIA-58.18分支为性能最优版本[11] - 新增Terminal Tool Kit功能,支持Agent调用终端安装依赖库并执行代码[12] - CAMEL团队计划将40多种常用工具接入MCP Server,构建工具生态[31] 多智能体系统研究 - 在多智能体协作实验中,70%任务场景中双Agent协作效果优于单Agent[21] - OASIS项目支持100万Agent交互,开展社会模拟研究[22] - 探索利用Agent生成合成数据提升多智能体系统质量[23] - 多智能体系统优化涉及协作机制、任务调度、工具调用流程等多个维度[27] - 未来可能形成分工明确、组合灵活、成本可控的Agent生态[29] 行业协议与生态 - MCP协议简化Agent开发流程,提供统一接口调用外部工具[30][32] - Google推出A2A协议,侧重统一Agent间接入范式[34] - 协议价值取决于参与者数量和生态繁荣程度[34] - CAMEL团队同时支持MCP和A2A协议[35] 开发者经验与建议 - 建议开发者从模型底层机制入手学习Agent开发,而非直接使用抽象框架[38] - 使用AI Coding工具需进行代码审查,修改量约20%[44] - AI生成代码可能仅提供局部最优解,需关注全局结构[46] - 保持学习能力和辨别能力是应对AI快速迭代的关键[37]