Workflow
数据标注
icon
搜索文档
东北三省共建数据标注产业集群
辽宁日报· 2025-11-23 00:48
产业战略规划 - 辽宁、吉林、黑龙江三省将共建具备全球竞争力的数据标注产业集群,并谋划组建东北数据标注解决方案联合体 [1] - 东北地区将以专业化、智能化、国际化为导向,通过政府引导、企业主体、市场运作的协同共建模式,构建区域性产业集群体系 [2] - 联合体将整合各地资源和优势,为全国客户提供全栈式、高价值的解决方案,并联合开拓应用场景 [2] 产业发展现状 - 沈阳市作为国家级数据标注基地之一,已标注数据总量超过8323TB,形成134个高质量数据集,应用于76个大模型 [1] - 沈阳市参与制定国家标准2项、行业标准4项,引育数据标注企业65家,从业人员达1.18万余人,产业规模约25.9亿元 [1] - 产业加快数据要素价值释放,已交易数据集28个,交易金额达1.02亿元 [1] 应用与生态建设 - 数据标注被定义为人工智能训练过程中的关键环节,是将数据“原油”炼成“汽油”的关键工艺 [1] - 联合体将“打包”东北的工业、农业、文旅等全域产业升级需求,为区域内标注企业提供试验田和首用地 [2] - 目标是建设覆盖东北亚的数据标注产业,形成专业化分工协作、互联互通的产业生态 [2]
19岁,A轮公司掌门人
投中网· 2025-11-11 00:53
文章核心观点 - 高质量数据标注正成为AI产业链中竞争激烈的关键赛道,多家初创公司获得高额融资和估值 [6][7] - 新兴数据标注公司通过平台化、社区化和游戏化模式重构传统业务,吸引高素质专业人士参与,以解决AI模型训练对专家级数据的迫切需求 [9][10][13] - 资本对数据标注领域给予高估值,反映了市场对“数据即服务”基础设施潜力的押注,但行业也面临技术自动化替代和利润率的现实考验 [16][17] AI数据标注行业现状与竞争格局 - 在AI算力和算法竞争被巨头垄断的背景下,高质量人工标注数据成为创业公司能切入的少数机会之一 [7] - 海外数据标注公司成为资本布局重点,Meta斥资14.3亿美元入股Scale AI使其估值达290亿美元,Surge AI计划以250亿美元估值融资10亿美元 [7] - 数据标注本质是将非结构化数据转化为机器可理解的结构化数据,随着强化学习重要性提升,对精细标记数据集的需求和预算激增 [12] 新兴公司的商业模式创新 - Datacurve采用“赏金猎人”系统,通过平台Shipd吸引全球熟练软件工程师参与数据任务,每任务奖励5至50美元,拥有超1400名注册工程师,累计发放赏金超100万美元 [10] - 公司成立两个月即实现营收破百万美元,为全球超一半基础模型实验室及Facebook、苹果等企业提供高质量代码数据 [10] - Surge AI搭建高技能承包商网络,通过技术体系进行质量控制和流程优化,已与超100万名承包商合作,向谷歌、Anthropic等公司出售数据集 [13] - 新模式将低附加值行业“产品化”,让专业人群以兴趣和挑战感参与,创建可扩展的数字经济服务 [13] 资本市场表现与估值分析 - Scale AI在2024年营收约8.7亿美元,估值290亿美元,市销率约33倍;Surge AI同年营收超10亿美元,目标估值150亿至250亿美元,市销率约15至25倍 [16] - 高估值反映投资人对公司“数据基础设施化”潜力的押注,而非当前盈利能力,其客户包括OpenAI、Anthropic等核心实验室 [16][17] - 行业面临利润率考验,Scale AI 2024年净利润不足1亿美元,人力与审核成本制约利润空间 [17] 行业未来发展趋势与挑战 - 独特、垂直、难以复制的数据资源是AI企业构建护城河的关键,未来竞争在于将数据转化为模型可理解知识的速度 [18] - 如果AI自监督学习、自动标注技术提速,对人工标注的依赖可能被削弱,这是一个既永恒又脆弱的生意 [17] - 与中国以项目制服务为主的产业形态不同,美国平台化、SaaS化模式获得更高估值,但商业模式在国内不易获得资本青睐 [17]
两人能抵上万人,际数科技自研算法服务人工智能大厂车企
长江日报· 2025-11-11 00:37
公司技术与效率 - 公司通过自研的空间智能模型平台实现数据标注自动化,仅需两人即可完成相当于上万名数据标注师的工作量[1] - 传统人工标注师一小时可完成240件数据标注,而公司的全自动标注系统一小时可完成360万件,效率提升显著[6] - 公司的核心技术源于创始人在测绘领域的算法研究,该算法曾获得中国测绘科技进步奖一等奖[6] 公司业务与客户 - 公司数据来源包括合作车企采集的视频以及北斗卫星地图数据供应商拍摄的图像,数据更新频率维持在一个月左右[10] - 公司服务的客户包括吉利、奇瑞等大型车企,以及商汤、博世等人工智能企业[10] - 公司近期获得青山产投集团数千万元投资,计划将服务区域从长三角扩展至全国[10] 行业背景与政策支持 - 2023年国内从事数据标注的企业众多,但运用智能模型进行全自动标注的企业较少[6] - 测绘技术融合了卫星定位、遥感、地理信息系统,能精确识别物体属性、位置和状态,在恶劣天气或复杂路况下优势明显[7] - 武汉市出台数据标注产业发展三年行动方案,目标引进培育龙头企业,带动人工智能相关产业规模增量超过100亿元[10] 未来发展规划 - 公司计划从空间智能服务向具身智能等前沿应用场景探索,利用工业场景如炼钢车间、化工厂生产车间进行技术迁移[10] - 通过持续的图像标注,公司旨在提升机器人的智能水平,使其成为工厂的高效助手[10] - 公司将总部迁至武汉并计划招聘30人,依托当地产业政策支持加速发展[6][10]
未来产业:数据要素和交易
2025-11-07 01:28
行业与公司 * 行业为数据要素与人工智能产业 公司提及海能生等数据标注龙头企业[1][9] 核心观点与论据 * 数据要素是人工智能产业发展的三大关键要素之一 是重要的战略资源和底层基础设施[2] * 国家高度重视数据要素 自2022年12月起出台多项纲领性政策文件 并于2023年初成立国家数据局进行专门管理[1][2][4][5] * 建设全国统一大市场是核心目标 数据资源的流通、交易和确权是其重要组成部分[1][2] * 数据标注行业发展迅速 国家已统筹建设七大高质量数据标注基地 数据集总规模达29TB 带动相关产值超过83亿元[1][6] * 人工智能应用规模快速增长 2025年初至6月底 我国日均Token消耗量从约1,000亿增长至超过30万亿 增长超过300倍[1][8] * 大模型训练中中文数据占比超过60% 部分模型达到80% 高质量中文数据集开发空间巨大[1][9] * 2025年10月政策文件指出工业制造、现代农业等9个领域的数据要素典型应用场景 各行业对数据要素有强烈需求[1][10] * 公共数据的开发利用至关重要 能提高社会治理效率 需通过合理机制打通公安、医疗、运营商、金融等不同部门的数据[1][10][12] 其他重要内容 * 数据要素产业投资热点方向包括数交所、人工智能及医保、交通、能源等具体应用场景探索[8] * 在人工智能时代 模型调用的Token数是衡量应用受欢迎程度和市场潜力的重要指标[1][8] * 北京、上海、天津等城市在试点数据作价入股模式 将高质量数据集折算成股权投入企业 上半年数据集相关交易额接近40亿元[8] * 算力基础设施建设与数据密切相关 国家推进数据中心建设和分布式计算技术发展[9] * 广东、上海、福建、浙江等省份有望在数字经济发展中领先 地方国有企业和掌握高质量数据资源的龙头公司将形成协同优势[3][11] * 上市公司积极参与数据要素应用探索[3][11]
日照推进产教融合打造数据标注产业人才供给“蓄水池”
齐鲁晚报· 2025-11-06 16:21
文章核心观点 - 日照市通过“教育链—人才链—产业链”三链深度融合模式构建数据标注产业人才供给体系以解决行业人才紧缺问题并推动产业高质量发展 [1][2] 教育链与产业链对接 - 日照市推动8所高校针对性开设数据标注相关专业并定制《多模态数据处理》等实用课程使教学内容贴合产业需求 [1] - 企业通过共建产业学院和引入真实标注项目让学生在校内基地参与数据清洗和标注审核等全流程操作实现学习与实践无缝衔接 [1] 人才链与产业链支撑 - 日照市通过制定数字人才培育专项政策明确人才培育方向为企业提供适配的人才储备 [1] - 企业建立表彰奖励机制对表现突出的标注人才和团队给予奖励以吸引外部人才并留住本地骨干力量 [1] 产业链对教育链的反哺 - 以泰盈科技和中开科技为核心的实训基地每年承接近9000人次学生实习实训将产业一线最新需求反馈给高校以优化课程设置 [2] - 产业反馈帮助高校调整教学重点最终形成“人才培养—就业上岗—产业升级—反哺教学”的闭环生态 [2] 未来发展规划 - 日照市计划进一步强化产教融合特色生态通过“三链融合”模式持续输送优质人才全力打造数据产业新增长极 [2]
建设高质量数据集,江苏势在必行、必须先行
新华日报· 2025-11-06 08:16
大会概况与成果 - 2025全国高质量数据集和数据标注产业供需对接大会于11月5日在南京成功举办 围绕大模型训练和行业智能化转型数据需求设置了5个行业供需对接专场 吸引国内500余家企业参与 现场达成合作90余项 交易额超9亿元 [1] - 大会是全国首个高质量数据集和数据标注产业供需对接大会 首次试水即火热出圈 [1] 江苏省数据资源与政策支持 - 江苏省是数据要素资源大省 截至今年10月底在医疗、交通、工业、能源、文旅等重点领域形成高质量数据集321个 数据总规模超93PB 相当于9300万部高清电影 [1] - 江苏省构建1+N的人工智能高质量发展政策体系 在算力、算法、数据和人工智能应用上系统发力 [2] - 江苏省数据局等八部门联合印发《江苏省发展数据标注产业建设高质量数据集实施方案(2025—2027年)》 把数据标注和高质量数据集一体统筹 聚焦17个领域引导供需企业协同推进高质量数据集建设 [2] - 江苏省会同八部门印发《江苏省培育壮大数据企业行动方案(2025—2027年)》 开展涵盖数据资源等6类数商引育工作 加快高质量数据集生态圈建设 [2] 高质量数据集的定义与标准 - 高质量数据集数据量不一定很大但一定要精 关键标准是符合AI大模型训练需要 在不同行业中定义标准不一 [2] - 中国电子技术标准化研究院在全国数标委推动下正式发布4项高质量数据集系列技术文件 包括建设指南、格式要求、分类指南、质量评测规范 通过标准化方式解决建设面临的突出问题 [6] - 我国正按照1+3+5+N的思路推进高质量数据集基础设施化 依托1个管理服务平台 从3个层次推进 通过5类建设主体 以N个典型应用场景为牵引建设高质量数据集 [6] 数据标注的挑战与重要性 - 数据标注至关重要 是找特征和找意外情况的过程 例如在智能驾驶中标注风险点以提升安全性 [3] - 数据标注有专业门槛 普通视频和2D照片易于上手 但鸟瞰图、三维图需要数学知识 医学类数据标注需要较高水平的专业知识 [3] - 细分领域大模型进展缓慢的原因包括数据供给不足和加工能力不足 行业渴盼高水平、专业性强的数据标注师队伍 [4] 行业面临的成本与融资问题 - 高质量数据集建设面临存储成本高企的问题 持续增长的数据采集总数与居高不下的存储成本并存 企业自建存储中心或租赁第三方云存储服务均产生成本 [5] - 企业呼吁在数据采集端和标注端加大金融扶持力度 建议金融机构对有市场价值的高质量数据集以订单贷或信用贷等形式发放启动资金 一个价值100元的数据集中80元是采买原始数据的成本 [6] - 数据行业是知识密集型叠加资金密集型的行业 融资成本制约企业做大做强 [6] 未来发展路径与解决方案 - 为降低数据存储成本 企业建议在我国中西部地区建设冷存储中心 对暂时用不到的数据进行低成本保存 [5] - 江苏省未来将围绕高质量数据集价值实现从供需两侧发力 编制数据富集领域建设指南和数据标注产业图谱 加快数联网、可信数据空间试点及公共服务平台建设 [7] - 江苏省计划强化中小企业培育 推动省级资源与地方需求精准匹配 组织供需对接会支持企业加速高质量数据集构建和应用转化 [7]
业界专家学者、行业精英聚首江苏扬州 共绘数字文旅新图景
中国新闻网· 2025-11-05 06:36
大会概况 - 全国高质量数据集和数据标注产业供需对接大会在江苏扬州举行,业界聚焦数字文旅新图景 [1][3] 数据要素与文旅产业融合 - 数据作为新型生产要素是驱动高质量发展的核心引擎,文化旅游产业是高质量数据集建设的天然富矿和数据标注技术应用的广阔舞台 [3] - 大会共商数据要素与文旅产业深度融合之道,被认为正当其时且意义深远 [3] 扬州数字经济发展优势 - 扬州数字经济动能澎湃,数字基础扎实稳健,数字治理融合创新 [3] - 扬州智算规模超28EFLOPS,占江苏省40%以上,被字节跳动确定为全国核心节点之一,算力能力居江苏第一、全国前列 [3] - 扬州构建算力“一张网”,运河城市算力平台汇聚9座城市24个算力资源池,接入超万PFLOPS算力资源,实时调度算力超2000PFLOPS [3] - 主办方选择在扬州举办大会是看中其“算力+数据”双重优势 [3] 数据标注与高质量数据集发展 - 发展数据标注产业、打造高质量数据集是卡位人工智能发展、抢占AI科技革命新高地的重要一环 [4] - 高质量数据集建设要以场景锚定价值坐标,数据标注产业发展要以技术与标准破解瓶颈,并以可信互联、价值共生打造协同发展生态 [4] - 需求方应主动传递场景细节并提供精细化需求指导,供给方应从“供给数据”向“供给知识”转变 [4] 产业合作与生态建设 - 江苏省文化和旅游厅邀请业界在江苏数字文旅领域开展深度合作,为文旅高质量发展注入新活力 [4] - “全国数据标注产教融合发展基地”正式成立,中国电子云、科大讯飞等首批企业入驻 [5] - 发布“文化旅游高质量数据集行业共建扬州倡议”,围绕共研统一标准、共促有序流通、共筑生态底座、共创应用价值四个方面推动打破文旅数据壁垒 [5] 大会成果发布 - 大会发布18项行业高质量数据集,内容涵盖文旅行业垂直数据集、乐器及音教行业音频标注数据集、苏州丝绸纹样数据库、无锡文脉系列数据集、地方志高质量数据集、“下扬州”大模型数据集等多个前沿领域 [5] - 举行一批重点项目集中签约,聚焦数字经济与文旅深度融合,涵盖平台建设、总部引入与智能服务等多个关键领域 [5]
三位AI天才白手起家,刷新全球最年轻亿万富豪纪录
搜狐财经· 2025-11-03 09:45
公司融资与估值 - 公司近期完成3.5亿美元融资,由Felicis Ventures领投,Benchmark、General Catalyst、Robinhood等机构跟投[1] - 此轮融资后公司估值达到100亿美元[1] 创始人信息与财富 - 三位联合创始人年龄均为22岁,成为全球最年轻的白手起家亿万富豪[1][2] - 三位创始人各自持有公司约22%的股份[2] - 三位创始人均为蒂尔奖学金获得者,该项目为放弃大学学业的年轻人提供10万美元资助[2] - 创始人首席执行官布伦丹·富迪16岁上高中时就开始创业[4] 公司业务与运营 - 公司是一家招聘初创企业,专为硅谷顶尖AI实验室提供模型训练支持[1] - 公司打造了一个招聘平台,求职者可通过AI虚拟形象参与面试,平台会将其与有人才需求的企业进行匹配[3] - 公司业务意外切入了需求旺盛的数据标注领域,为OpenAI等前沿实验室对接博士、律师等专业级承包商[3] - 公司年化营收达到5亿美元,较3月的1亿美元大幅增长[3] - 公司入选《福布斯》2025年30 Under 30榜单,并登上《福布斯》云计算100强榜单[3] 行业竞争与动态 - 数据标注行业经历重大变动,Meta宣布以140亿美元收购行业巨头Scale AI 49%的股份[4] - 行业竞争对手Surge正洽谈新一轮融资,估值有望达到300亿美元[4] - 竞争对手Turing AI于7月完成1.1亿美元融资,估值22亿美元[4] - 小型公司Invisible已成为OpenAI和微软的首选合作伙伴[4] - 公司于9月被Scale AI提起诉讼,指控其窃取商业机密,涉及一位从Scale离职加入公司的前高管[4]
构建与我国对外投资贸易相宜的海外综合服务体系
21世纪经济报道· 2025-10-20 08:45
新型城市基础设施建设 - 住建部等九部门联合发布行动方案,推动新一代信息技术与城市基础设施深度融合,目标是到2027年底前使重点任务取得明显进展并形成可推广经验 [2] - 方案提出推动智能化市政基础设施建设和改造,包括编制改造行动计划、探索信息动态更新机制、推进城市生命线安全工程 [2] - 方案提出推动智慧城市基础设施与智能网联汽车协同发展,涵盖车路协同设施建设、提升物流配送能力及推进智慧停车 [3] - 方案提出开展数字家庭建设,重点包括加强住宅信息基础设施建设、强化数字家庭工程设施建设、推进产品平台互联互通 [3] 海外综合服务体系完善 - 商务部等五部门联合印发指导意见,旨在构建与中国对外投资贸易发展相适应的海外综合服务体系,系该领域首个指导文件 [4] - 意见提出优化公共服务,将走出去公共服务平台升级为国家层面海外综合服务平台,形成综合大平台与专业分平台结合的服务体系 [4] - 意见提出集成创新地方服务,指导地方打造企业出海服务“一站式”窗口,并鼓励地方探索打造出海综合服务港 [4] - 意见提出延伸健全海外服务,包括拓展境外经贸合作区功能,并在重点国别建立海外综合服务站,为出海企业提供持续服务 [4] 公安交管服务数字化 - 公安部将于11月1日起施行6项“一网通办”新措施,使网办业务增至41项,预计每年惠及上亿办事群众 [5] - 在便利用车方面推出3项措施:网上办理解除机动车抵押登记、网上补换领机动车登记证书、全面推行机动车转籍信息网上转递 [5][6] - 在便利考取驾驶证方面推出2项措施:允许通过App提前一天取消考试预约、可通过App网上申领校车驾驶资格免交纸质材料 [6] - 在服务行业方面推出网上办理大件运输车辆临时号牌举措,符合条件的企业可通过App为车辆再次申领临牌 [6] 地方营商环境优化举措 - 天津武清区行动方案提出纵深推进“专员服务”扩面提质,组建“企业专员”队伍打造全方位为企服务矩阵 [7] - 方案推动政务服务向“好办”“易办”转变,推行两项“高效办成一件事”集成服务改革,并建立用户需求常态化征集响应渠道 [7] - 方案要求拓宽金融服务渠道,包括组织政银企座谈会、推送融资需求“白名单”、推进“政采贷”模式和探索小微企业融资对接路径 [7] - 贵州省大数据发展专项资金推出25项支持措施,对数据标注企业按当年业务收入总额的3%给予奖励,每户企业奖励上限500万元 [8] - 对当年主营业务收入首次达2000万元及以上的软信企业给予20万元一次性奖励,对通过备案的生成式AI大模型产品每件给予50万元奖励 [8] 政务服务数字化案例 - 广西壮族自治区上线住房公积金服务一体化信息平台,实现79项服务全程网办,全区服务事项网办率超过95% [9] - 平台通过打通与公安、民政、不动产等多部门数据共享通道,实现身份证、婚姻证明等多项证明材料免提交 [10] - 平台使住房公积金贷款、提取等18项高频事项实现即时办结,并接入AI智能客服提供全天候咨询和业务办理引导 [10]
发展数据标注技术,把数据“原油”炼成“汽油”
人民日报· 2025-10-15 06:46
行业政策与规划 - 国务院提出支持发展数据标注、数据合成等技术,培育壮大数据处理和数据服务产业[1] - 国家发展改革委等部门提出到2027年数据标注产业年均复合增长率超过20%[2] - 国家数据局已指导7个城市建设数据标注基地,截至今年上半年带动相关产值超过83亿元[2] 产业定义与重要性 - 数据标注是通过给文本、语音、图片、视频等数据打标签,将人类知识转化为计算机语言的关键工艺[1] - 数据标注是人工智能高质量数据集建设的关键环节,能有效提升垂类大模型的专业领域性能[1] - 高质量数据可加速人工智能赋能千行百业,如在分子药物研发和工业质检场景中标记关键信息[2] 市场需求与增长 - 在人工智能大模型和政策驱动下,数据标注需求爆发式增长[2] - 有企业过去一年承接了2000多项数据标注项目需求,预计今年业务量将增长超过30%[2] - 数据标注产业已初步形成覆盖上游数据提供方、中游平台公司、下游服务商的产业链闭环[3] 技术与发展趋势 - 智能化标注技术不断突破,人机协同标注模式日益成熟,通过人工智能预标注提高效率和准确性[3] - 数据标注产业从劳动密集型转变为知识密集型,对从业者专业要求越来越高[3] - 被标注数据从文本、图像等单模态向多模态转变,领域从通识扩展到医疗、工业制造等专识领域[3] 当前阶段与未来方向 - 数据标注产业还处于初期阶段,需要各方群策群力共同培育产业生态[4] - 各地需加强政策落实和引导,搭建常态化供需对接服务平台[4] - 应用企业需以实际需求驱动数据标注能力体系建设,与标注企业共同开展工具研发和流程优化[4]