大模型语料训练数据
搜索文档
专家共议“数据要素市场赋能千行百业”
新浪财经· 2025-12-10 09:49
数据要素市场发展趋势与核心观点 - 当前数据热点已从传统数据库转向人工智能原生数据(AINet),数据供给的核心是适配人工智能发展需求,将数据加工为标准化高质量数据集是先决条件 [2][8] - 数据要素市场旨在赋能千行百业,其发展需要跨界融合、复合型人才以及长期耐心的资本投入,以解决技术与业务之间的语言壁垒,并将数据能力转化为解决实际生产问题的产品与服务 [5][11] - 公共数据的开放共享面临安全合规与价值释放的悖论,需要顶层设计建立全国性整合机制、容错机制并赋予地方统筹决策权,以突破地域限制,降低企业获取和使用数据的成本 [4][10] 数据供给与技术工具创新 - 可信数据空间技术成为加速数据流通的关键工具,已有实践通过参与国家数据局高质量数据集评测平台、与深圳数据交易所合作,实现了大模型语料训练数据的合规交付 [2][8] - 标准化数据与技术工具的协同价值已在政务数据应用中得到验证,例如技术支撑已落地海淀区公共数据智能体评测场景 [2][8] - 数据产业发展需要耐心资本加持,当前热钱集中于具身智能等终端领域,而数据产业作为底层支撑需要长期资本投入培育生态,深耕数据供给、技术工具等基础领域 [5][11] 行业应用场景与实践案例 - 在文旅场景,票付通作为国家数据局首批数据要素试点,打通了福建省残疾人、教师、大学生等特定人群数据,通过“一次认证、全国通用”平台实现游客刷脸或动态身份码一秒入园,解决了景区核验效率低的难题 [3][9][10] - 在产业端,统一股份通过建设内部数据智能体,将几十万条原材料、配方数据纳入研发,使产品配方开发周期从1年缩短至3个月 [3][10] - 文旅场景正在进行碳普惠探索,通过游客绿色出行、酒店节能减排等场景,实现环保与商业价值的共赢 [5][11] 公共数据应用的挑战与需求 - 产业端对公共数据存在迫切需求,例如碳足迹、水足迹核算缺乏统一标准与公共数据支撑,企业需自行投入大量成本核算且数据国际认可度低,呼吁国家牵头建立标准化核算体系与公共数据平台 [3][10] - 全国游客流动的特性要求公共数据突破地域限制,需建立全国性数据整合机制,让企业通过统一入口获取跨区域公共数据,避免层层申报的效率损耗 [3][10] - 公共数据供给存在“安全合规与开放共享”的悖论,越强调数据价值,数据溯源单位越谨慎,反而增加了数据输出障碍 [4][10] 数据要素落地的关键支撑 - 数据要素落地需要复合型人才,企业需在组织架构层面推动业务与技术岗位的协同,以解决“懂业务的不懂技术,懂技术的不懂业务”的行业普遍痛点 [5][11] - 激活数据价值的关键是跨界融合与场景创新,必须从机械、加工等行业企业的实际生产问题出发,将数据能力转化为可解决具体问题的产品与服务 [5][11] - 顶层设计需建立容错机制,为数据要素创新提供制度保障 [4][10]