Workflow
AI革命下一站:Anthropic与OpenAI斥巨资打造“虚拟员工”
36氪·2025-09-17 05:11

核心观点 - Anthropic和OpenAI正开发能替代人类执行复杂工作的AI同事 通过模拟企业软件训练模型 使其像人类员工一样理解和操作真实工作流程 [1] - 该训练方法采用模拟办公沉浸式教学 聘请各行业专家担任职业导师 手把手教授模型软件操作技巧 [2] - 训练成本高昂 Anthropic计划明年投入10亿美元建设AI训练健身房 OpenAI预计今年数据相关支出达10亿美元 2030年将增至80亿美元 [2] - 专家时薪持续上涨 目前20%专家时薪超90美元 10%突破120美元 预计18个月内顶级专家时薪将达150-250美元 [3] - 成功后将突破传统训练技术瓶颈 可能开辟销售AI智能体或开发更强大企业级应用等新商业模式 [3] 训练方法 - 采用强化学习环境模拟真实办公场景 将复杂任务拆分为多个简单步骤并验证完成正确性 [6][7][8] - 以销售任务为例 考核标准包括按最后联系时间筛选客户数据库 发送包含Calendly会议链接的邮件 将潜在客户状态更新为重新接洽等 [7][8] - 通过人类专家示范生成正确案例 筛选模型计算结果与人类一致的案例进行集中训练 快速低成本生成大量训练样本 [11] 基础设施投入 - Anthropic目前将不到10%的后训练预算用于强化学习环境 但由于初期效果显著 明年将大幅提高投入 [8] - 图灵公司已建成超1000个强化学习模拟环境 覆盖从Airbnb到Excel等各类应用场景 每个模拟环境配备100-500个定制任务示例 [9] - Scale、Surge、Mercor和Invisible Technologies等竞争对手纷纷推出类似服务 配备行业专家设计训练任务 [9] 行业影响 - OpenAI高管预测整个经济体未来可能变成巨大的强化学习机器 AI通过记录各领域专业人士日常工作来学习训练 [12] - AI开发商持续用精心筛选的高难度问答训练模型 如顶级编程竞赛题或博士水平生物学问题 用于强化学习特定领域新技能 [9] - 数据标注公司招聘标准升级 从硕博在读生转变为拥有多年经验的职场精英 包括NASA数据科学家、能源部化学家、放射科医师等 [11]