高质量数据

搜索文档
突破AI行业高质量数据缺乏的瓶颈,Surge AI营收超10亿美元
36氪· 2025-08-06 09:08
路透社援引消息人士称,Surge AI已聘请顾问,计划进行其公司历史上的首次融资,规模或高达10亿美元,目标估值超过150亿美元。 估值290亿美元的ScaleAI,正面对一个强大的对手,一家叫Surge AI的AI数据公司公布自己的营收超过了10亿美元,而ScaleAI在同期的营收是8.7亿美元。 同时,Surge AI目前已实现盈利。 在首轮融资之前,Surge AI一直依靠自有资金实现滚动发展,这次融资将结合新股发行与老股转让,旨在为员工持股提供变现机会。 01 MIT出身的华人创业者, 用高质量数据为OpenAI和Anthropic的SOTA模型提供"动力" Surge AI的创始人Edwin Chen毕业于麻省理工学院(MIT),他在MIT著名的CSAIL实验室搞研究,专注于算法交易、理论计算等领域。在创立Surge之 前,他曾在谷歌、Facebook和Twitter担任机器学习和数据相关的工程职位。 在创立Surge AI时,Edwin Chen拉来不少老同事,例如工程团队负责人Andrew Mauboussin,他是前Twitter机器学习工程师,毕业于哈佛大学计算机科学专 业。还有产品与增长负 ...
独家对话中国联通赵亚晖,AI时代的“数据燃料”是如何炼成的?
凤凰网· 2025-08-04 12:47
中国联通数据产业底座的核心能力 - 公司作为中国通信行业国家队,拥有海量通信数据资源,并在数据治理、安全流通与行业赋能方面形成特色道路 [1] - 软件研究院是公司自主研发主力,承担数字与智能创新中心职能,副院长赵亚晖负责业务、管理及大数据系统建设 [1] AI时代高质量数据集的战略布局 - 公司数据产业底座覆盖算力、算法、数据三大能力融合,重点建设高质量数据集,包括数据基础设施产品、行业特色数据集及场景化应用 [2] - 沉淀700PB企业数据资源,联合行业伙伴构建400TB以上通信领域及行业数据集,形成"三个一"体系框架(方法论+平台工具+数据集) [2] - 建成8个领域专业化数据集(网络运营、客户服务等),支撑27个大模型场景训练,信息通信数据集入选国资委首批央企高质量建设成果 [3] 数据治理与技术创新实践 - 建立数据集分级分类管理框架,实现全生命周期规范化运营,参与国家级标准制定 [3] - 自主研发全流程工具链,集成多模态数据处理算法与自动化标注引擎,获DataOps工具创新奖 [3] - 通过"数据采集-清洗-标注-质检-应用-评估"闭环处理链路,实现智能化端到端数据生产 [3] 行业赋能与场景化应用 - 对内构建上千个智能体覆盖七大领域(办公管理、市场营销等),涉及千余细分场景,超万人参与 [6] - 对外联合伙伴开发上百个行业应用(装备制造、医疗健康等),典型案例使数据报表制作时间从小时级缩短至分钟级 [6] - 通信数据具备实时性、准确性优势,已开放工业、金融等场景服务,强调数据与大模型场景结合是关键差异化点 [6] 数据安全与流通机制 - 内部部署数据分类分级平台、4A金库等工具,实现数据使用全程上链管控 [7] - 对外构建多重技术防护体系,开发安全态势监测等产品,参与国家可信数据空间建设,推动"可用不可见"流通模式 [7] - 开展隐私计算、区块链等技术探索,协同政府与行业完善数据确权、交易等配套机制 [7]