高质量数据集

搜索文档
国家数据局:加快行业高质量数据集建设
中国证券报· 2025-09-21 20:17
● 本报记者 连润 刘烈宏表示,要加大数据领域的投入,制造业企业要像重视技术研发、设备更新一样重视数据资源的开 发利用,在数据采、存、算、管、用全过程增加投入力度,加快行业高质量数据集建设,赋能"人工智 能+"在行业、在企业得到落地。要加力投资数据产业,积极培育数据资源、技术、服务、应用、安 全、基础设施等各类型数据企业。要培育为优质数据付费的市场意识,像购买先进设备、引进高端技术 一样,形成"为高质量数据付费"的共识,让数据在流动中使用、在使用中增值,真正形成数据供得出、 流得动、用得好、保安全的良好局面。要共同防范和破除"内卷式"竞争,企业尤其是数智化能力强的龙 头企业,要靠创新驱动和数据驱动来发展。 国家数据局9月21日消息,9月20日,国家数据局局长刘烈宏在安徽合肥举办的2025世界制造业大会上表 示,要加大数据领域的投入,制造业企业要像重视技术研发、设备更新一样重视数据资源的开发利用, 加快行业高质量数据集建设。 刘烈宏说,数据成为制造业高质量发展的基础资源和创新引擎,作为关键生产要素,贯穿于制造业的研 发设计、生产制造、经营管理、市场营销、客户服务等全流程。高质量数据集成为数智化转型的新型燃 料, ...
国家数据局:加快行业 高质量数据集建设
中国证券报· 2025-09-21 20:15
● 本报记者连润 刘烈宏说,数据成为制造业高质量发展的基础资源和创新引擎,作为关键生产要素,贯穿于制造业的研 发设计、生产制造、经营管理、市场营销、客户服务等全流程。高质量数据集成为数智化转型的新型燃 料,就像经过精炼加工的"高标号燃油",在很大程度上决定着人工智能技术在制造业应用中能否跑得 稳、跑得远、跑出效益。 刘烈宏表示,要加大数据领域的投入,制造业企业要像重视技术研发、设备更新一样重视数据资源的开 发利用,在数据采、存、算、管、用全过程增加投入力度,加快行业高质量数据集建设,赋能"人工智 能+"在行业、在企业得到落地。要加力投资数据产业,积极培育数据资源、技术、服务、应用、安 全、基础设施等各类型数据企业。要培育为优质数据付费的市场意识,像购买先进设备、引进高端技术 一样,形成"为高质量数据付费"的共识,让数据在流动中使用、在使用中增值,真正形成数据供得出、 流得动、用得好、保安全的良好局面。要共同防范和破除"内卷式"竞争,企业尤其是数智化能力强的龙 头企业,要靠创新驱动和数据驱动来发展。 国家数据局9月21日消息,9月20日,国家数据局局长刘烈宏在安徽合肥举办的2025世界制造业大会上表 示,要加大 ...
加快推动高质量数据集建设 助力构建开放共赢的数据生态
证券日报网· 2025-09-16 12:18
国家高质量数据集建设先行先试工作启动 - 国家数据局组织开展高质量数据集建设先行先试工作 确定140个先行先试工作单位 围绕试技术、试支撑、试标准、试机制等四项重点任务 [1] - 先行先试工作覆盖全国25个省份 支撑18个重点领域包括科学研究、工业制造、金融服务、医疗卫生等 以及低空经济、智能驾驶等创新领域 [1] - 国家数据局将加强对先行先试工作指导 定期监测项目进展和成效 开展技术交流及主题研讨活动 [1] 高质量数据集发展现状与市场意义 - 2024年我国高质量数据集数量同比增长27.4% 数据质量是人工智能从"可用"向"好用"跨越的关键瓶颈 [2] - 通过"场景驱动+示范先行"策略推动跨部门跨行业数据协同 培育"为优质数据买单"的市场环境 推动数据从"资源"向"资产"转化 [2] - 数据合成、隐私计算等关键技术突破将推动高质量数据集生产规模化 助力构建开放共赢的数据生态 [2] 金融领域高质量数据集应用案例 - 证通股份申报《资本市场融资企业高质量数据集建设》 恒生电子申报《面向金融行业大模型的多模态高质量数据集建设》 [2] - 高质量数据集整合企业研发投入、专利数据、供应链关系等多维度信息 构建动态化企业画像 降低信息不对称问题 [3] - 投资者和金融机构通过数据集精准识别企业技术领先性与商业化潜力 提升对轻资产、高成长性企业的风险评估能力 [3] 高质量数据集的监管与技术创新价值 - 为监管机构提供穿透式监管工具 通过整合企业交易数据、关联方信息、资金流向等实时识别违规操作 提升监管效率 [3] - 隐私计算技术确保数据"可用不可见" 平衡数据共享与隐私保护的需求 [3] - 推动金融业态从"经验驱动"向"数据驱动"深度变革 为构建高效、安全、创新的现代金融体系提供关键支撑 [3]
广东电网:“数字匠芯”筑就AI高质量数据基石
中国电力报· 2025-09-16 07:36
核心观点 - 广东电网构建的高质量数据集获评国家数据局典型案例 标志着公司在人工智能数据工程领域的前瞻布局落地见效 [1] - 通过高标准数据处理与标注体系为人工智能工程注入精准可靠数据 为设备赋智 企业赋值 产业赋能提供全新范本 [1] - 将150万条多模态电力安全数据转化为可复用 可迭代 可赋能的数字资产 推动安全监管算法从单一场景识别向多维度风险预判升级 [4] - 高质量数据集入选国家级典型案例 为人工智能与实体经济深度融合提供可复制 可推广的电力范本 [5] 人工智能数据工程建设 - 搭建高标准高精度数据处理与标注体系 形成产业化样本标注体系 如同智能化数据工厂对海量电力现场图片 视频 声纹波形进行精细化加工标注 [2] - 高质量数据集为AI在电力行业深度应用奠定坚实数字基石 此前产出的数据集为AI模型进化提供核心燃料 [2] - 成熟体系能高效批量生成教材 让AI学得更快更准 保障数据精准 助力模型在安全生产风险预警中发挥大作用 [2] 实际应用成效 - 在广州电缆隧道智能巡检中 AI模型依托高质量数据集能瞬间识别工作人员作业风险 准确率与效率远超人工 [3] - 基于算法识别的高频违规行为数据 团队反向优化作业流程规范 全年减少同类违规事件32% 实现数据 算法 业务的价值闭环 [4] - AI算法在安全监管中实现看得见 辨得准 预警快 探索出数据驱动业务优化的新路径 [4] 行业价值与推广意义 - 电力数据凭借实时性 连续性 高价值性的独特优势 成为破解行业发展难题 培育新质生产力的关键抓手 [4] - 数据集打破传统数据分散存储 价值沉睡的壁垒 实现电力作业安全数据标准化采集 精细化标注 体系化应用 [4] - 从现场数据采集标准化到标准质控体系化 再到数据 算法 应用闭环化 每个环节紧扣行业实际需求 有效避免技术空转 [5] - 案例证明只有立足行业场景 聚焦实际需求构建的数据体系 才能让AI真正扎下根 结出果 为多领域AI应用提供有益借鉴 [5]
2025年中国数据要素行业发展研究报告
艾瑞咨询· 2025-09-14 00:07
核心观点 - 数据作为第五生产要素具有非竞争、可复制、无限增长特性 其价值挖掘需依赖政策框架与市场化体系 通过政产联动推动数据要素市场发展[1] - 国内数据要素市场预计以20.26%复合增长率增长 2028年突破3000亿元 其中数据处理环节规模达1440亿元[6] - 数据价值链流通涵盖合规确权、登记、评估、入表、交易、资本化及通证化七个环节 形成完整价值释放体系[11][13][16][19][21][23][25] 行业现状 - 政策指导与产业建设共同推动数据要素市场体系完善 行业向更高价值政产联动迈进[2] - 数字经济规模从2017年27.2万亿增长至2023年53.9万亿 复合增长率12.07% 2024年核心产业增加值达13.49万亿元 占GDP10%[6] 政策体系 - 数据二十条政策明确三大数据源分类分级确权制度 划分数据资源持有权、加工使用权与产品经营权[11] - 建立1+3政策体系推动公共数据资源管理 通过国家公共数据资源登记平台实现全国一体化登记[13] 市场规模 - 数据要素市场复合增长率20.26% 2025年达2000亿元 2028年突破3000亿元[6] - 金融业占比约三分之一 互联网产业占比20% 通讯、制造、政务、医疗、交通等行业持续提升规模[28] 价值链流通-合规确权 - 数据要素权属体系建设是价值链流通前提 数据二十条政策完善确权制度但实践仍存在公共数据开放不足、企业流通受阻等问题[11] 价值链流通-数据登记 - 数据资源由行政事业单位登记 数据产品及资产由交易机构登记 公共数据通过国家平台实现全国互联互通[13] 价值链流通-价值评估 - 2019年发布数据资产评估指引开启计量时代 2024年6月发布公共数据价值评价标准填补领域空白[16] - 数据价值易变性导致评估复杂 需阶段性评估调整 市场公允价值评估依赖信息透明度与专家主观判断[17] 价值链流通-资产入表 - 2024年会计处理暂行规定实施 数据资源以无形资产等形式入表 改善企业资产负债结构[19] - 上市企业数据入表数量提升 主要应用于对外服务、内部降本增效及AI开发 但交易流通活跃度不足[19] 价值链流通-资产交易 - 数据交易呈现内冷外热模式 场外交易占主导 政策调整为场内场外协调发展[21] - 五大头部交易所在交易规模、标准制定等领域发挥主导作用 但场外交易面临安全与合规问题[21] 价值链流通-资本化应用 - 数据资本化优化企业融资渠道 特别服务科技企业 实现科技-产业-金融循环[23] - 金融杠杆同步扩大数据价值属性与市场风险 需动态评估把控风险[23] 价值链流通-资产通证化 - RWA将实物资产转化为数字资产 RDA通过四大创新模式将数据转化为金资产[25] - DCB体系以交易底链、资产链与价值链组合保障通证化安全推进[25] 产业实践-金融业 - 多元数据融合提升风控、营销、投资业务表现 金融机构技术输出助力中小企业转型[30] - 金融数据要素规模以19.06%复合增长 2028年突破1000亿元 五大数交所上架2060款金融数据产品[31] 产业实践-工业制造业 - 可信数据空间与高质量数据集推动产业由规模红利向数据红利转型[34] - 工业数据要素规模以24.22%复合增长 从2025年157亿元增长至2028年302亿元[34] 产业实践-医疗健康业 - 医疗数据推动三医产业协同发展 提升资源配置与服务效率[36] - 医疗数据要素规模以23.69%复合增长 2028年突破250亿元 需关注个人数据安全合规[36] 行业趋势-高质量数据集 - 高质量数据集为AI产业提供关键要素 2025年行动方案将其作为重点布局对象[39] - 截至2025年上半年建设数据集524个 规模超29PB 服务163个大模型[39] 行业趋势-可信数据空间 - 可信数据空间实现数据可用不可见下的价值共创 2025年出台发展行动计划[42] - 首批试点63个项目涵盖13城市、22行业、28企业 2028年计划建设超100个可信数据空间[42]
助力数据要素价值释放!烟台市启动高质量数据集征集工作
齐鲁晚报网· 2025-09-10 11:36
烟台市高质量数据集征集行动 - 烟台市大数据局启动高质量数据集征集工作 面向企事业单位和社会组织广泛征集高质量数据集 旨在贯彻落实《"数据要素×"三年行动计划(2024-2026年)》 充分发挥数据要素乘数效应 [1] - 高质量数据集被定位为发展人工智能和推动产业智能化升级的"新石油" 具有数据质量高 多模态融合好 应用场景实 流通性强等特点 对抢占数字经济领域新赛道具有重大战略意义 [1] - 征集涵盖12个重点行业领域包括工业制造 现代农业 商贸流通 交通运输 金融服务 科技创新 文化旅游 医疗健康 应急管理 气象服务 城市治理 绿色低碳 以及5大新兴领域包括低空经济 具身智能 智能驾驶 智慧海洋 生物制造 及其他特色方向 [1] 数据集要求与申报细节 - 数据集要求规模适度 权属清晰 价值密度高 符合国家安全标准 申报单位需于9月29日前提交相关材料 [1] - 此次征集旨在挖掘具有示范意义的高质量数据集 通过烟台市数据要素服务平台促进数据流通与价值释放 为数字化转型和高质量发展注入新动能 [2] - 入选数据集将获得重点推广 并优先推荐参与国家和省级试点 助力烟台打造"蓝色数谷"城市新名片 [2] 烟台市现有数据集建设成果 - 烟台在高质量数据集建设方面已取得积极进展 涌现出代表性项目包括应辉环境科技"全国76个行业排污许可数字链组数据集" 蓝天云"全国138个城市全媒体广告数据集" 微程之家"全国2万家文旅企业产供销管数据集" [2] - 在2025年山东省"数据要素×"创新应用项目奖补名单中 烟台有10个项目成功入选 数量位居全省第二 [2]
江苏绘就数据“蓝图”
国际金融报· 2025-08-30 16:36
发展目标 - 到2027年底建设不少于1000个完整规范、准确实用的高质量数据集 [1][2] - 产业规模在全国占比预计超过10%且年均复合增长率超过20% [2] - 打造3个数据标注基地并培育10个左右创新引领力强、要素集聚力强、行业影响力强的数据标注重点企业 [2] 产业布局与集群效应 - 形成全国领先、全球有影响力的数据标注产业集群并通过基地和重点企业实现资源优化配置 [2] - 产业集聚可降低企业运营成本并促进企业间交流合作与创新活力 [2] - 企业共享技术设备和标注人才以提高标注效率和质量 [2] 数据集覆盖领域 - 首批高质量数据集涉及交通运输、医疗健康、金融服务、文化旅游、教育教学等17个生活服务场景领域 [3] - 自动驾驶数据集聚焦路端感知、特定场景与任务、4D成像雷达等关键方面 [3] - 网约车数据集覆盖智能调度、出行保障、订单信息、行程录音等关键环节 [4] 典型应用案例 - 遴选100个可复制、可推广的典型应用案例作为产业发展样板间 [6] - 案例证明数据标注产业在不同领域的应用可行性和有效性 [6] - 通过总结推广成功经验可降低发展成本并提高发展效率 [6]
国家数据局派发高质量数据集建设先行“工单”
新华日报· 2025-08-28 21:30
国家数据局高质量数据集建设部署 - 国家数据局在2025中国国际大数据产业博览会上部署新一批高质量数据集建设先行先试任务 聚焦行业高质量数据集建设 通过试技术融合、试场景支撑、试标准验证、试机制建设形成可复制推广经验模式 [1] 江苏省入选项目清单 - 江苏省4个入选项目包括新华报业文化传媒行业高质量数据集建设项目、医疗卫生行业高质量数据集建设项目、高质量多模态医疗数据集项目及节能光伏一体化综合能源高质量数据集建设项目 [1] 新华报业传媒集团项目 - 新华报业文化传媒行业高质量数据集建设项目围绕"1+3+10+N"总体架构 破解传媒行业数据"散、乱、杂"难题 实现数据安全可控与合规流通 [2] 医疗卫生行业项目 - 医疗卫生行业高质量数据集建设项目在心血管、肿瘤、慢病管理等六大领域开展试点示范 为全国医疗数据治理与智能应用提供标杆 [2] 多模态医疗数据集项目 - 高质量多模态超声医学数据集项目总投资8000万元 打造国内首个超声领域多模态标准化可运营医学影像数据集 提升AI模型训练效率与临床应用可靠性 [2] 节能光伏一体化项目 - 节能光伏一体化综合能源高质量数据集项目将综合能源系统从经验驱动局部优化升级为数据驱动全局最优模式 提供绿色低碳运营场景和交付服务能力 [2] 项目实施机制 - 4家单位以试技术、试场景、试标准、试机制为核心抓手 强化高质量数据供给 丰富应用场景 总结建设方法 明确行业数据治理与价值释放路径 [3]
涉及交通、医疗、教育……江苏到2027年底建设不少于1000个高质量数据集
扬子晚报网· 2025-08-28 12:29
发展目标与产业规划 - 到2027年底数据标注产业规模全国占比超10% 年均复合增长率超20% [2] - 建成3个数据标注基地 培育10个左右创新引领力强、要素集聚力强、行业影响力强的重点企业 [2] - 建设1000个完整规范、准确实用的高质量数据集 遴选100个可复制、可推广的典型应用案例 [1][2] 重点建设领域与应用场景 - 高质量数据集覆盖交通运输、医疗健康、金融服务、文化旅游、教育教学等17个生活相关场景领域 [1][4] - 自动驾驶数据集聚焦路端感知、特定场景与任务、4D成像雷达 应用于模型训练、智能交通管理和交通规划 [3] - 医疗健康数据集涵盖肿瘤、血液病、代谢病、免疫病等生物信息学数据 推动新药研发、临床诊疗和基础医学研究AI训练 [4] - 医保数据集包含全省定点医院及药房的费用结算、药品交易和诊疗登记数据 支持医保基金智能监管、医药产业发展和商保服务 [4] 技术实施与产业生态 - 支持大模型企业、数据服务商、科研院所使用高质量数据集开展自然语言处理、多模态交互、知识图谱及具身智能训练 [4] - 通过行业数据富集和应用场景多元优势抢占人工智能发展制高点 全面赋能经济社会高质量发展 [2][4]
“人工智能+”行动的意见发布,政策驱动AI产业进入加速周期
天风证券· 2025-08-27 13:27
行业投资评级 - 报告未明确给出具体的行业投资评级 [1][2][3][4][5][6][7][8][9][10][11] 核心观点 - 国务院发布《关于深入实施"人工智能+"行动的意见》提出科学技术、产业发展、消费提质、民生福祉、治理能力与全球合作六大重点行动以及涵盖模型、数据、算力、应用环境、开源生态、人才体系、政策法规与安全治理的"八大强化基础支撑能力" [1] - 政策设定了可量化目标和阶段时间线:到2027年新一代智能终端、智能体等应用普及率超过70%;到2030年普及率超过90%;到2035年全面步入智能经济与智能社会新阶段 [1] - 政策通过设定可量化目标和阶段性时间线强化政策执行的确定性与产业落地的可预期性 随着政策逐步落地叠加模型能力持续迭代和AI成本进一步下降 中国AI渗透率有望加速提升 [1] - 《意见》在基础层面的部署为产业发展提供了长期制度性保障 有助于缓解当前AI发展中算力不足、数据供给部分质量不高等瓶颈 未来随着基础能力的持续完善 国内AI产业链有望实现规模化扩张与良性循环 [2] - "人工智能+"行动的深入实施有望驱动算力需求持续增长 [3] 重点关注领域及公司 人工智能+科学技术 - 晶泰控股、商汤、第四范式 [3] 人工智能+产业发展 - 企业服务:金蝶国际、移卡、迈富时 [3] - 工业软件:创新奇智 [3] 人工智能+消费提质 - 广告电商:值得买、焦点科技、汇量科技、微盟集团、有赞 [3] - 游戏:昆仑万维、恺英网络、心动公司、创梦天地 [3] - 影视:果麦文化、华智数媒、欢瑞世纪、慈文传媒、中文在线、阅文集团 [3] - 内容:知乎、阜博集团 [3] - AI创作:美图公司 [3] - 智能驾驶:小鹏汽车、蔚来汽车、理想汽车、禾赛科技、速腾聚创 [3] - 智能终端:出门问问、Keep、涂鸦智能 [3] 人工智能+民生福祉 - AI教育:粉笔、世纪天鸿、豆神教育 [3] - AI医疗:京东健康、阿里健康、方舟健客 [3] 人工智能+治理能力 - 人民网、新华网 [3] 互联网AI生态 - 阿里巴巴、腾讯控股、快手、小米集团、哔哩哔哩 [3] 国产算力板块 - "人工智能+"行动的深入实施有望驱动算力需求持续增长 [3]