Game化标注
搜索文档
19岁亚裔女孩,做“赏金猎人”,融了1个亿
虎嗅APP· 2025-11-08 09:29
公司概况与市场定位 - Datacurve是一家成立于2024年的年轻数据标注公司,其核心产品Shipd平台采用“游戏化标注”方式,将算法题、调试任务等编程挑战打包为“通关任务”并明码标价,吸引工程师参与完成[2][3] - 公司成立一年多即累计融资1770万美元(约合人民币1.2亿元),其中2025年10月完成的A轮融资额为1500万美元,投资方包括Chemistry的Mark Goldberg以及DeepMind、Anthropic、OpenAI等AI一线公司员工[2][4] - 公司旨在挑战该领域的绝对独角兽Scale AI,后者估值已达200多亿美元,而同赛道公司Turing的估值也达到22亿美元[3] 商业模式与核心优势 - 平台通过“赏金猎人”形式与游戏化结构吸引工程师,任务被包装为“Quests”,并设有排行榜、连胜奖励与任务等级,使参与者兼具解题者和竞技者身份[10] - 平台强调“工程师优先”的社区文化,旨在为高技能参与者提供有归属感、认可度与专业认同的生态环境,而非单纯的任务派发系统[11] - 这种“游戏化+精英制”设计形成了独特护城河,平台不追求让所有人都参与,而是筛选能完成特定类型任务的顶尖工程师,从而保障数据质量[11] - 平台上线不久已支付超过100万美元的赏金,吸引了来自亚马逊、AMD等企业的高级工程师参与[15] 产品理念与冷启动过程 - 公司起点源于CEO Serena Ge在Cohere实习时意识到高质量编码数据供给是模型能力提升的瓶颈,传统标注方式无法满足模型所需的复杂度与专业性[12] - 公司将数据标注转变为具备挑战性质的题目,通过游戏化平台激励工程师贡献数据,这一理念使其成功入选硅谷最大孵化器Y Combinator的2024年冬季项目[13] - 公司始终将Shipd定位为“面向工程师的消费者产品,而不是数据标记操作”,将大量精力投入用户体验优化,确保用户“愿意来、愿意留”[15] - 商业化路径上,公司初期聚焦与高端AI实验室和工具型初创公司建立合作,包括OpenAI、Anthropic等基础模型实验室,依托早期投资人网络与口碑传播实现数据销售[15] 版权风险与合规机制 - 平台通过多层机制防护版权风险,包括贡献者原创声明、自动抄袭检测以及共识评审机制(即同行互评)[19] - 平台从源头控制任务来源,优先发布来自受控仓库的题目,避免涉及企业私有代码,部分任务要求工程师在沙盒环境中从零编写[19] - 在法律层面,公司通过“数据合同”和“许可协议”清晰定义数据的使用范围、归属权和责任边界[19] 行业竞争格局与公司对比 - 数据标注行业公司主要分为由人力资源公司转型而来(如Mercor、Turing)和新型数据公司转型而来两大类[24] - Mercor从AI招聘公司转型为数据标注服务商,依托其积累的医生、律师等专家资源,在RLHF和垂直领域标注任务方面展现出强竞争力[24][25] - Turing从远程工程师招聘业务扩展至AI基础设施服务,实现从人才服务向训练数据与人才管理一体化平台的转型[25] - Datacurve的直接竞争对手是同样走精细化高质量数据路线的Surge AI,后者采用human-in-the-loop机制,由领域专家配合定制化模型完成标注[18][25] - 公司未来计划将平台机制迁移到金融、医学、营销等垂直专业领域,以拓展业务边界[25]