数据标注
搜索文档
Mercor 高速增长的秘诀与其中的聪明人|42章经
42章经· 2025-09-14 12:40
公司业务定位 - 核心业务是帮助顶尖AI公司招聘各行业专家 而非传统数据标注公司[4][26] - 通过专家提供系统性反馈来提升AI模型智能 替代传统数据标注平台[6][27] - 交付物为评估标准和基准测试规范 相当于模型的PRD[27][28] 商业模式 - 采用平台化运营模式 客户将资金支付给平台 再由平台结算给专家[8] - 平均时薪超过90美元 不同职业差异显著:英文语音训练21美元 软件工程师100-200美元 皮肤科医生高达400美元[16] - 从100万美元到1亿美元年化营收运行率仅用11个月 增速超过Cursor的12个月纪录[39] 市场竞争优势 - 完全替代传统数据标注平台 模型可直接基于其提供的评估标准进行强化学习[6] - 核心能力在于人才质量评估 能通过科学方法从万份简历中筛选顶尖人才[10][11] - 相比Scale AI被收购后的业务下滑 Mercor抓住模型升级带来的市场空白[20][25] 运营流程 - 获客主要依靠熟人推荐(超50%专家来源) 推荐人可获得推荐费[12] - 采用AI视频面试自动生成问题 20-30分钟面试后生成带转录文本的视频报告[13] - 通过多人交叉验证机制确保标注质量 异常方案会被及时识别并淘汰[15] 市场前景 - 数据标注市场规模约50-100亿美元 随OpenAI等公司持续投入而扩大[36] - 业务模式可复用到所有行业 核心是解决"挑选"环节的痛点[32] - 未来工作形态将向项目制演进 全职岗位减少 AI衡量能力将拓展至更多场景[29][30] 团队特质 - 团队平均年龄22岁 多位成员曾获Thiel Fellowship并有过创业经历[39] - 决策速度极快 依赖创始人直觉而非完全数据驱动 强调快速试错[48][49] - 执行能力突出 团队每日工作时间为7:30至凌晨1:00 依靠增长作为核心激励[53][55] 人才标准 - 注重技术实践能力 要求候选人展示实际构建成果[58] - 强调Agency(主动性) 即克服困难达成结果的能力[59][60] - 通过概念类比测试学习能力 例如用MCP vs API的类比快速理解新概念[63][65]
290亿美元巨头,正被对手“围剿”
虎嗅· 2025-09-06 23:36
诉讼事件概述 - Scale AI起诉前客户关系管理负责人Eugene Ling及其新东家Mercor,指控其在离职时窃取超过100份机密文件并试图策反重要客户[1][9] - Ling被指控在离职前频繁接触竞争对手,并在与Mercor CEO会面后加速下载公司机密文件,行为被认定为有预谋的窃密[8][9] - Mercor向Ling开出极具诱惑力的条件:承诺支付其从引入客户项目中产生毛利润的20%作为提成,前提是Ling能为公司带来超过500万美元的毛利润[6] 涉事方回应 - Ling承认个人云盘存有旧文件但坚称无恶意,且Mercor工作中未使用这些文档,并透露曾应Scale AI要求暂不删除文件[12] - Mercor联合创始人Surya Midha否认公司使用过任何Scale AI商业机密,坚称虽聘用许多Scale AI前员工但对Scale AI商业秘密无兴趣,并已主动联系Scale AI寻求解决[16][17] - Scale AI传播副总裁Tom Channick在X平台强硬表态,指责Mercor拖延沟通且拒绝调离涉事员工,强调不允许通过非法捷径牺牲业务[11] Scale AI面临的行业挑战 - Meta斥资143亿美元收购Scale AI 49%股份,将其估值推高至290亿美元,但此交易导致Scale AI与谷歌、OpenAI、微软、xAI等Meta竞争对手的客户关系陷入尴尬[18][19] - 包括谷歌和OpenAI在内的多家核心客户已开始减少或终止与Scale AI合作,谷歌正计划终止一份价值2亿美元的合同,微软、xAI等巨头也在重新评估合作关系[20] - 就连其大金主Meta内部的TBD Labs也未完全依赖Scale AI,仍继续与Mercor和Surge等竞争对手合作,且有Meta研究人员直言Scale AI数据质量不及竞品[21][22] 竞争对手Mercor的崛起 - Mercor估值已达20亿美元,凭借独特的“博士军团”商业模式迅速崛起,成功赢得包括OpenAI在内的顶级AI实验室的青睐[24][27] - 与Scale AI规模化数据标注工场模式不同,Mercor直接招聘生物学、法学等垂直领域专家参与大语言模型数据训练与标注,以专业性和高质量数据形成差异化竞争优势[25][26] - 在Scale AI陷入客户信任危机的背景下,Mercor迎来绝佳突围良机,尽管规模不及Scale AI,却在短时间内赢得多家重量级客户[23][27]
估值2000亿元独角兽怒告前员工:窃取上百份文件,策反数百万美元客户!公司面临更大危机
每日经济新闻· 2025-09-06 14:26
核心诉讼事件 - Scale AI起诉前客户关系管理负责人Eugene Ling及其新雇主Mercor 指控其窃取机密文件并试图策反核心客户 [1] - Ling被指控在离职前下载超过100份机密文件 包括客户信息及业务策略 并转移至个人云盘 [4] - Mercor向Ling提供极具诱惑的薪酬条件:承诺支付其引入客户项目毛利润的20%作为提成 前提是带来超过500万美元毛利润 [3] 涉事人员背景与双方回应 - Eugene Ling在Scale AI任职超过三年 负责企业客户关系与战略合作 深度维系公司最大客户关系 [7] - Ling承认个人云盘存有旧文件 但坚称无恶意且未在Mercor工作中使用 并称曾主动询问Scale AI是否删除文件 [6] - Mercor联合创始人Surya Midha否认使用Scale AI商业机密 称公司正调查情况 并强调虽聘用多名前Scale AI员工 但对商业秘密无兴趣 [9][10] Scale AI的客户流失危机 - Meta投资143亿美元收购Scale AI 49%股份 将其估值推高至290亿美元 [12] - 核心客户包括谷歌、OpenAI、微软、xAI因Scale AI与Meta关联 担忧数据安全 正减少或终止合作 [12] - 谷歌计划终止价值2亿美元的合同 微软及xAI重新评估合作关系 [12] - 甚至Meta内部TBD Labs未完全依赖Scale AI 仍与Mercor等竞争对手合作 内部研究人员称Scale AI数据质量不及竞品 [13] 行业竞争格局变化 - Mercor估值达20亿美元 采用差异化商业模式:直接招聘生物学、法学等垂直领域专家参与数据训练与标注 形成博士军团模式 [15] - 该模式提供更高质量数据及更强客户粘性 已赢得OpenAI等顶级AI实验室青睐 [15] - Scale AI以规模化数据标注工场模式起家 但面临新锐竞争者精准打击策略的挑战 [15]
估值2000亿独角兽怒告前员工:窃取上百份文件,策反数百万美元客户
每日经济新闻· 2025-09-06 14:09
诉讼事件概述 - Scale AI起诉前客户关系管理负责人Eugene Ling及其新雇主Mercor 指控其窃取机密文件并策反核心客户 [1] - Ling被指控在离职前下载超过100份机密文件 包括客户信息及业务策略 并转移至个人云盘 [3][4] - Mercor向Ling提供极具诱惑力的薪酬条件 承诺支付其引入客户项目毛利润的20%作为提成 前提是带来超过500万美元毛利润 [3] 涉事人员背景 - Eugene Ling曾在Scale AI任职超过三年 负责企业客户关系与战略合作 深度维系公司最大客户关系 [5] - Ling承认个人云盘存有旧文件 但坚称无恶意且未在工作中使用 并称已配合Scale AI要求暂不删除文件 [4] - Mercor联合创始人Surya Midha否认公司使用Scale AI商业机密 强调虽聘用多名前Scale AI员工 但无意获取其商业秘密 [7] 行业竞争格局 - Scale AI面临核心客户流失危机 谷歌计划终止2亿美元合同 OpenAI、微软及xAI正重新评估合作关系 [8] - Meta以143亿美元收购Scale AI 49%股份 使其估值达290亿美元 但导致其与Meta竞争对手的合作关系陷入尴尬 [8] - Mercor凭借差异化商业模式崛起 估值达20亿美元 专注招聘垂直领域博士专家进行数据标注 获OpenAI等顶级客户青睐 [10] 商业模式对比 - Scale AI采用规模化数据标注工场模式 但被Meta内部研究人员指出数据质量不及竞品 [9] - Mercor以博士军团模式形成精准打击优势 通过领域专家提供高质量数据标注 强化客户粘性 [10] - Meta内部TBD Labs未完全依赖Scale AI 仍与Mercor及Surge等第三方数据服务商合作 [8] 客户关系影响 - Scale AI指控Ling试图策反代号客户A 该业务可为Mercor带来数百万美元价值 [3] - 谷歌、OpenAI等核心客户因Scale AI与Meta的股权关系产生信任危机 减少或终止合作 [2][8] - Ling在离职前频繁接触竞争对手 与Mercor CEO会面后机密文件下载频率骤增 [3]
估值2000亿元独角兽怒告前员工:窃取上百份文件,策反数百万美元客户!公司面临更大危机:谷歌和OpenAI等“金主”流失
每日经济新闻· 2025-09-06 13:59
诉讼事件概述 - Scale AI起诉前客户关系管理负责人Eugene Ling及其新东家Mercor 指控其窃取机密文件并策反重要客户[1] - Ling被指控在离职前下载超过100份机密文件 包括客户信息及业务策略 并转移至个人云盘[3][4] - Ling承认个人云盘存有旧文件 但否认恶意使用 Mercor声称未访问或使用这些资料[6][9] 涉事人员背景 - Eugene Ling在Scale AI任职超过三年 负责企业客户关系与战略合作 深度维系公司最大客户[7] - Mercor向Ling提供极具诱惑力的条件 承诺支付其引入客户项目毛利润的20%作为提成 前提是带来超过500万美元毛利润[3] 公司战略差异 - Scale AI以规模化数据标注工场模式起家 Mercor采用差异化策略 直接招聘生物学、法学等垂直领域专家参与数据训练[14] - Mercor估值达20亿美元 专注于由博士专家进行高质量数据标注 赢得OpenAI等顶级AI实验室青睐[14] 行业竞争格局 - Scale AI获Meta投资143亿美元收购49%股份 估值达290亿美元 但面临核心客户流失风险[12] - 谷歌计划终止价值2亿美元的合同 微软、xAI等重新评估与Scale AI的合作关系[12] - Meta内部TBD Labs仍与Mercor等第三方数据服务商合作 因Scale AI数据质量被指不及竞品[12][13] 客户关系影响 - Scale AI强调"客户A"业务对Mercor价值数百万美元 Ling与该客户关系紧密[3] - Meta投资导致Scale AI身份尴尬 谷歌、OpenAI等客户因竞争关系减少合作[12]
A股反复震荡,9月有哪些重要交易主线?高手这样看
每日经济新闻· 2025-09-03 11:17
A股市场表现 - 上证指数周三下跌1.16%至3813.56点,跌破5日和10日均线 [1] - 沪深两市成交额23641亿元,较周二大幅缩量5109亿元 [1] - 仅823只个股上涨,4560只个股下跌,行业板块普跌,军工板块跌幅居前 [1][5] 期货市场表现 - 鸡蛋和黄金期货涨幅居前,碳酸锂和股指期货跌幅居前 [1] - 期货模拟大赛选手最高收益率达179.82% [2] - 黄金期货因美联储独立性担忧和"降息交易"主线上涨,涨幅落后于股票 [7] 投资大赛概况 - "经·粮杯"期货模拟大赛提供100万虚拟资金,设周赛和月赛现金奖励,月最高奖金1288元 [4][8][9] - 掘金大赛股票模拟提供50万虚拟资金,设周赛和月度积分王奖励,第一名奖金688元 [4][10] - 两大赛事均零成本参赛,正收益即可获奖,并提供投研团队教学与交流群 [4][8][9][12] 参赛选手策略观点 - 上证指数压力位3900-4000点,支撑位3700点,若无法站上5日均线则休整时间延长 [5] - 看好AI编程、数据标注、光交换机等板块机会 [7] - 市场存在游资、量化、中长线机构三类资金,风格分别为涨停拉升、超短线和长线投资 [7] - 建议通过多市场学习提升交易认知,期货大赛提供夜盘交易方便上班族 [7][9] 赛事附加价值 - 期货大赛提供黄金期货和股指期货专项交流群,掘金大赛提供持仓查看功能和《火线快评》免费阅读权限 [9][11][21] - 赛事全年12期滚动开展,新手完成1笔交易即算有效参赛 [8][9] - 模拟交易规则与实盘完全一致,含手续费和保证金机制 [8][9]
大模型下半场:谁在掘金数据标注?
36氪· 2025-09-02 08:25
Meta收购Scale AI交易分析 - Meta以约150亿美元收购Scale AI 49%股份 交易后Scale AI估值达290亿美元[1] - Scale AI创始人兼CEO汪滔将卸任并加入Meta组建超级智能小组 同时保留Scale董事会席位[1] - 收购反映Meta对高质量训练数据的迫切需求 因其Llama4Behemoth模型30%语料来自低质量社交媒体内容 导致多模态理解等核心指标落后GPT-4.5约12%[2] 数据标注行业概况 - 全球数据标注行业市场规模约20亿美元 其中美国市场占8.38亿美元份额达40%[5] - 行业主要分为三类玩家:纯人力型公司(低成本劳动力标准化任务)、互联网大厂众包平台(自有业务需求+外部劳动力池)、智能型服务商(自主研发平台+算法能力+定制化解决方案)[3] - 头部智能型企业多从人力公司进化而来 Scale AI前身为"ScaleAPI" 通过"人力API"模式积累数据后逐步采用AI替代人力[4] Scale AI业务模式演变 - 公司最初通过"人力API"模式为开发者提供远程劳动力团队服务 客户包括丰田本田等企业[4] - 2018年起构建"机器预标注+人工复核"混合工作流 用算法完成预标注后由人工专家审核修正[4] - ChatGPT平均标注成本低于0.003美元 比传统众包平台便宜20倍 GPT-4标注准确率达88.4%超过人类标注员的86.2%[4] 全球市场竞争格局 - 美国企业凭借全球化分工将基础任务外包至菲律宾肯尼亚等低成本地区 Scale AI通过Remotasks平台拥有超24万注册工人[6] - 中美技术存在明显差距:中国云测数据自动标注主要应用于智能驾驶领域 海天瑞声智能化水平有限仍高度依赖人工[6] - 美国形成完整产业生态 除Scale外还有SurgeAI(微调服务)、Turing、Lionbridge(文本语音)等专业公司[8] 行业技术发展趋势 - AI标注目前仅适用于交通图像人脸识别等标准化任务 规则制定和质量把关仍需人工介入[8] - 大模型训练重心从预训练转向强化学习 对医疗影像法律文本等专业化数据需求增加[9] - 标注员需具备专业知识与跨学科能力 任务涉及推理链条和多模态对齐等复杂场景[10] 代表性企业对比 - Surge AI专注于高质量数据生成(如编程代码数据) 2024年营收达10亿美元超越Scale AI的8.7亿美元[10] - 合成数据作为替代路径存在局限性:现实场景变化时有效性不足 数据安全风险限制大规模应用[10] - 数据标注行业正向更高质量和更强专业化方向演进 技术壁垒不断拔高[11]
清华大学张小劲谈数据标注:高质量数据集走到哪,AI就到哪
南方都市报· 2025-08-29 06:50
行业发展趋势 - 数据标注产业进入新战略阶段 行业逐步完善并走向成熟 催生新职业和职业技能标准 [3] - 传统人工标注市场竞争激烈且内卷化 用工需求规模大且流动性高 [4] - 未来大模型将带动标注工作 智能检测和工具优化成为长远发展方向 [4] - 合成数据领域发展值得关注 通过AI数据搭接适应发展需求 [5] 地域与行业分布 - 用工需求从低成本地区向经济发达地区和人工智能前沿领域转移 [4] - 河南、四川等人力资本丰富地区呈现活跃发展态势 [4] - 行业主要集中在信息技术和科学研究领域 人工智能先导研究行业用工需求最旺盛 [4] 企业分类与发展模式 - 数据标注企业可通过2×2矩阵按场景强度和基础强度划分为双强、双弱、偏强、偏弱四种类型 [5] - 具身机器人行业发展较好 技术具有引领性 [5] - 大型产业和企业拥有更多专业力量开发模型并进行数据标注 [5] - 国外场景团队专注于垂直场景的数据采集和标注 [5] - 外包团队和众包团队提供灵活低成本劳动力 众包团队在小众场景创新方面具有优势 [5] 发展战略建议 - 推进AI辅助标注与全自动化标注技术 使产业从劳动密集型向知识密集型转变 [8] - 建立多轮质检与反馈机制 完善质控体制 精准淘汰劣质数据 [8] - 开发行业针对性标注系统 利用中国丰富应用场景和数据资源推动垂直细分领域发展 [8] - 深化校企合作加速技术转化 推动行业标准制定 [9] - 强化技能培训优化人力配置 建立质量追踪机制提升从业人员专业技能 [9] 核心发展理念 - 大模型人工智能与高质量数据集形成相辅相成、双轮驱动的格局 [1][6][8] - 人工智能+行动到哪里 高质量数据集就走到哪里 [6] - 高质量数据集走到哪里 人工智能就走到哪里 [1][6][8]
Alarum Technologies .(ALAR) - 2025 Q2 - Earnings Call Transcript
2025-08-28 13:30
财务数据和关键指标变化 - 第二季度收入880万美元 略低于去年同期的890万美元 [6][16] - 净利润30万美元 去年同期净亏损40万美元 [6][19] - 调整后EBITDA 100万美元 去年同期为340万美元 [6][19] - 非IFRS毛利率63% 去年同期为78% [17] - 运营费用540万美元 去年同期420万美元 主要因研发人员成本增加 [17] - 金融收入40万美元 去年同期金融费用250万美元 主要因认股权证公允价值变动 [18] - 股东权益增至2910万美元 去年底为2640万美元 [20] - 现金及长期投资余额2500万美元 与去年持平 [14][20] - 基本每股收益0.04美元 去年同期亏损0.05美元 [19][20] 各条业务线数据和关键指标变化 - AI客户群体显著增长 主要替代其他细分市场的客户 [16] - 新推出大规模AI数据收集和标注项目 涉及数据收集、标注和微调用例 [7][8] - 旗舰产品数据收集器和网站解锁器需求强劲 代理网络快速扩张 [8] - 客户结构变化导致净留存率NRR为0.98 [16] 各个市场数据和关键指标变化 - AI市场成为主要驱动力 客户包括大型科技公司和电商平台 [6][7] - 与亚洲最大在线市场之一达成合作 开展大规模数据收集项目 [7] - 客户范围从科技巨头到初创企业 数据价值显著提升 [7] 公司战略和发展方向和行业竞争 - 战略决策增加投资 利用盈利业务再投资于公司发展 [13] - 投资重点包括创新、基础设施、客户群扩张和与大公司合作 [13] - 代理网络基础设施投资增加销售成本但优化长期网络基础设施 [10] - 研发投入增加以扩展产品组合和能力 [11][17] - 目标成为AI数据收集的核心企业 满足各类公司需求 [12][13] - 行业处于早期阶段 高度动态和不可预测 [12] - 竞争激烈 公司利用盈利运营和专业知识扩大网络和服务器能力 [60] 管理层对经营环境和未来前景的评论 - 业绩超预期且符合6月上调的指引 [6] - 数据成为最有价值的商品 带来一代人一次的机会 [9] - 短期利润率下降是设计选择 为满足主要AI玩家需求 [10][13] - 市场仍处于婴儿期 客户需求难以预测超过几个月 [12] - 建议投资者以多季度而非单季度评判发展 [12] - 第三季度起与战略客户合作 预计增加季度收入约300万美元 [17] - 新项目初期利润率较低 影响整体盈利能力 [17][22] 其他重要信息 - 认股权证将在一个月内到期 消除未来影响 [18] - 2025年1月支付170万美元税款 影响现金流 [21] - 2025年收入指引1280万美元 同比增长78% [22] - 调整后EBITDA指引约110万美元 范围±5万美元 [22] - 指引包含新大型AI数据项目的初步影响 [22] 问答环节所有提问和回答 问题: 大客户利润率低的原因和恢复条件 [25] - 因新产品的技术基础设施成本高 特别是服务器和网络相关成本 [27][28][30] - 需要改善成本结构或增加标准毛利率项目来恢复利润率 [32] 问题: 新产品特点 [34] - 数据量、体积和带宽需求巨大 与以往项目有重大区别 [35] 问题: 更广泛客户群使用情况和新客户渠道 [36] - AI和数据需求趋势强劲 新客户不断涌入 渠道良好 [37] - 需求巨大 正投资网络基础设施和功能以满足需求 [38] 问题: 客户结构变化对客户终身价值的影响 [42][43] - NRR计算方法可能暂时误导 但季度间增长显著 [45][47] - AI客户需求可能持续 未来NRR将反映这种变化 [47] 问题: 大客户历史和对Q2的影响 [49] - 客户合作约1.5季度 Q2已有可观收入 现在显著增长 [50][51] 问题: Q3收入300万美元的可见性 [52] - 三分之二季度已过 对9月预测有信心 [55] - 项目持续时间不可预测 与其他项目相同 [56] 问题: 未来毛利率走势 [59] - 若增长来自当前业务模式 毛利率可能改善 - 若有新项目 可能再次影响毛利率 - 行业需求增长但竞争激烈 公司正投资扩大能力 [60]
当AI浪潮来到西部山乡小县
新华社· 2025-08-19 10:18
行业发展趋势 - 人工智能数据标注被纳入国家职业分类目录 数据标注总规模达17282TB 从业人员5.8万人[4][7] - 预计到2027年数据标注产业规模年均复合增长率超过20% 产业向高质量精细化定制化发展[7] - 西北欠发达县建成数字经济创新中心 辐射带动1000余人就业 人工智能打破县乡就业天花板[9] 企业运营状况 - 宜君县爱豆科技累计完成60.7万项数据标注任务 实现产值3500余万元[6] - 公司员工人数达240余人 超过70%为当地农村女性 包含回乡就业大学生[6][7] - 企业配备儿童成长空间解决员工育儿需求 实现工作生活平衡[8] 业务模式特点 - 数据标注涵盖文本图片语音注释 涉及无人驾驶辅助医疗金融保险等AI应用场景[4][6] - 基础数据标注通过系统培训即可胜任 对从业人员要求不高[4] - 员工需通过零误差考试才能上岗 单日最高切换7个任务类型[6] 人才结构变化 - 46岁农妇转型人工智能训练师 月均收入达4000元[2][7] - 员工原从事导游幼师纺织工等职业 现持证上岗成为技术人才[6] - 31岁农村员工成为企业骨干 代表参加世界人工智能大会[9] 区域经济影响 - 7.2万人口小县吸引青年人才回流 带动外卖平台及餐饮服务业发展[1][9] - 县政府联合企业开展高校招聘 成功引进20多名铜川籍员工[5] - 科技企业招聘不设年龄学历门槛 重点培训电脑操作技能[4]