数据治理
搜索文档
2025深圳香蜜湖金融年会召开 擘画智能金融新蓝图
证券时报· 2025-12-21 09:16
为活动现场 2025年12月20日,以"识变局,开新局——促进粤港澳大湾区科技-产业-金融良性循环"为核心主题,聚 焦"让金融更智能,让智能更温暖"的2025深圳香蜜湖金融年会在深圳市福田区隆重举行。原中国保监会 党委副书记、副主席周延礼担任主持,来自政、产、学、研各界嘉宾齐聚一堂,共同见证《香蜜湖智能 金融发展报告(2025)》(以下简称《报告》)发布,并围绕智能金融的技术创新、行业应用、数据治 理、港澳实践与监管治理等关键议题展开深度研讨。 图 重磅报告发布 全景呈现智能金融发展脉络 作为年会核心环节,《香蜜湖智能金融发展报告(2025)》正式发布。该报告由中国证监会原主席肖钢 担任课题组组长,30余位专家历时2025年全年编撰完成,延续过往年度写作框架的同时实现创新突破, 分为技术篇、应用篇、专题篇、探索篇、港澳篇、治理篇六大篇章,全景式展现我国智能金融发展现 状、趋势与路径。其中,首次增设的"港澳篇"成为一大亮点,突显粤港澳大湾区协同发展特色,为区 域"科技-产业-金融"良性循环提供了重要参考。 肖钢在报告解读中指出,科技金融作为金融"五篇大文章"之首,对推进科技自立自强、促进科技创新与 产业创新深度 ...
2025数据资产管理大会在京召开 发布《数据资产管理实践指南8.0》
证券日报网· 2025-12-19 12:10
本报讯(记者郭冀川)2025年12月18日,由中国通信标准化协会主办的"2025数据资产管理大会"在京召 开。本次大会以"数驭智能,治数新章"为主题,采用"1主论坛+3个专题论坛"的形式,从数据资产管 理、数智底座与智能体应用、高质量数据集与数据基础设施等行业热点话题出发,分享业界实践,发布 多项重磅成果。来自通信、金融、能源、制造等多个行业的上千位专家、代表现场参会。 本次大会还根据数据资产领域热点议题设置了下一代数据资产论坛、数智底座与智能体应用论坛、高质 量数据集与数据基础设施论坛等三大平行论坛,业内专家齐聚一堂,就各类数据治理、数据资产化、数 智应用场景、高质量数据集、数据基础设施等关键问题进行深度分享,共同探讨我国数据资产管理新趋 势、新实践。 中国通信标准化协会副理事长兼秘书长代晓慧出席大会主论坛并在致辞中表示,协会围绕国家和行业重 点需求,充分发挥标准的引领作用,累计发布数智相关行业标准52项、团体标准73项,产出技术文件、 研究报告等超260项。未来,协会将贯彻政策引领精神,发挥平台引导作用,进一步推动标准研制和宣 贯工作,持续跟进国际标准化工作新趋势,推动全球数智时代的蓬勃发展。 中国信通院 ...
远光软件:公司不断推进大数据业务深化,当前聚焦数据治理、数据场景服务、工具提供及智能场景
证券日报网· 2025-12-19 12:10
证券日报网12月19日讯远光软件(002063)在12月18日回答调研者提问时表示,公司不断推进大数据业 务深化,当前聚焦数据治理、数据场景服务、工具提供及智能场景,未来潜力在于激活客户数据要素价 值。电网数据真实、全面,能反映经济运行情况,可用于多种场景。公司正积极探索与客户更多的合作 模式,未来将数据作为生产要素赋能更多领域,构建新增长极。 ...
具身智能的数据难题,终于有了可规模化的解法
量子位· 2025-12-18 04:40
公司概况与市场表现 - 公司简智机器人是一家专注于具身智能赛道数据治理与产线设计的企业,其战略定位是成为行业的“数据与能力底座”[3][40] - 公司成立仅4个月就完成了3轮融资,累计融资金额超2亿元,投资方包括Momenta、百度风投、顺为资本等头部机构[4][36] - 公司已服务30余家具身智能头部公司,业务覆盖全球市场,超过70%的收入来自海外[4][37] 行业核心瓶颈:数据困境 - 具身智能发展的核心瓶颈在于数据,其所需数据需完成“人类技能的数字化”,对精度要求极高,且难以从互联网直接获取[7][8] - 行业面临五大核心数据痛点:1) 采集成本高;2) 效率低下;3) 数据鲜度不足;4) 真实性缺失;5) 规模难以突破[9][10][11] - 更深层的问题是“全链路闭环缺失”与“数据基建空白”的系统性困境,导致数据无法有效转化为驱动模型升级的燃料[12][14] 公司核心战略与解决方案 - 公司战略聚焦于解决数据全链路难题,而非卷模型或堆硬件,其核心是打通“人类技能数据化-云端AI数据治理-机器人应用”全链条[15][16] - 公司构建了“平台+产线”双引擎数据治理体系,旨在提供标准化、自动化的数据流解决方案[16][29] - 公司为数据产品立下“铁律”,追求真实、高质量、高精度、高鲜度、低成本、原子化标注与切片[17] 硬件创新:无感采集设备 - 公司推出核心硬件Gen DAS无感可穿戴采集设备,采用轻量化设计,确保用户长时间佩戴无负担,避免“动作变形”[19] - 设备布置了行业首个且数量最多的三目摄像头,结合车轨级IMU及自研VIO、SLAM技术,将轨迹恢复精度提升至小于1厘米[21] - 设备支持无线同步传输、长续航,无需复杂场地部署,开机即用,并能将数据体积压缩至原大小的2%,实现分钟级上传[27] 数据治理平台:Gen Matrix - Gen Matrix数据智能平台是保障数据质量的核心基石,旨在实现“高质量数据供给”[26] - 平台具备五大核心能力:1) 高精准轨迹还原(误差小于1厘米);2) 智能标注切片;3) 高鲜度低成本并行;4) 超强吞吐能力;5) 智能治理生长[30][31] - 平台每日数据时长增长超1万小时,高质量数据产出超10万clips,且持续加速[31] 行业首创:规模化数据产线 - 公司行业首创Gen ADP智能数据产线,打破了“真实场景数据采集难规模化”的僵局,是其核心壁垒[30] - 公司提出“数据当作产品来制造”的理念,融合众包模式,构建了规模化、自动化的真实场景数据闭环生产系统[33] - 该产线已在超1000个真实家庭完成部署,累计积累超百万小时真实场景数据,覆盖500余种高频技能场景[35] - 产线交付效率领先,采集完成后2小时内,加工数据就能送达模型,为迭代提供“即时燃料”[35] 核心竞争优势 - 团队优势:核心成员来自Momenta、华为、蔚来、字节、理想汽车、DeepMind、斯坦福等顶尖机构,兼具模型与智驾数据工程经验,仅用4个月就完成从产品设计到软硬件交付的全流程[16][36] - 战略优势:在行业聚焦硬件制造时,公司精准押注数据治理与产线设计,构建了“硬件为基础、治理为核心、产线为支撑”的完整差异化体系[36] - 商业化进展:技术实力已快速转化为商业成果,与30余家行业头部企业深度合作,并推动具身智能在家庭服务、工业制造、医疗健康等领域的规模化应用[37][38]
新华报业获颁高质量数据集检测证书
新华日报· 2025-12-15 22:00
中国信通院的评测结果,对标国际数据治理规则,针对数据采集、清洗、标注到流通应用等全链条构建 评测规范,是国内企业参与国内数据交易、跨境数据流通及行业合作的重要信用凭证,有助于显著降低 数据应用方的信任成本与合规风险,在行业内具备高认可度。 中国信通院此次围绕数据集质量、合规性、应用价值等核心维度,严格依据数据智能服务产业相关标 准,对"新华.文风训练数据集"开展了专业化评测。该高质量数据集,是依托新华高质量数据集运营管 理系统汇聚的海量真实稿件数据,构建覆盖13种典型文风的基准数据集,为文风生成模型提供精准、多 元的训练语料。 本报讯(记者聂伟)12月13日,新华报业传媒集团"新华.文风训练数据集"获得由中国信通院颁发的高质量 数据集检测证书。据悉,这是全国首张传媒领域高质量数据集检测证书,标志着新华报业在数据治理、 数据集标准化建设与价值转化方面的实践获国家级权威认可,也为传媒领域数据要素合规流通与高效应 用提供了可借鉴的"新华方案"。 ...
数字化转型“深水区”怎样走实走稳?
中国化工报· 2025-12-10 02:40
行业数字化转型成效 - “十四五”期间石化行业数字化转型取得长足进展[2] - 天津市工业企业数字化设计工具普及率高达91.1%,关键工序数控率达70.2%[2] - 天津市已培育529家基础及以上智能工厂,其中221家先进级、17家卓越级,覆盖12条产业链[2] - 智能工厂核心系统在天津渤海化学全面落地,违章行为识别准确率超92%,隐患闭环率达98%[2] - 彩客化学山东公司打造8个智能制造场景,实现生产效率提升27%,能源利用率提高38%,产品不良品率降低11.34%[2] - 生产区域AI监控全覆盖帮助避免了一次火灾事故[3] 当前面临的主要挑战 - 行业数字化转型面临数据治理和人才短板两大挑战[3] - 国内大多数石化企业属于第二类,各系统彼此分离,处于“数据孤岛”状态[3] - 企业内各部门有独立系统和平台,相互隔离是“数据孤岛”重要成因[3] - 各系统间通过数据接口互联,缺乏统一数据标准,导致横向与纵向链条割裂[4] - 人才结构失衡是制约深度转型的普遍瓶颈,既懂行业知识又懂编程和数字化的复合型人才稀缺[4] 破局路径与未来方向 - 解决挑战需聚焦数据治理、系统融合和人才培育,联合院校、服务商等多方协同攻坚[1] - 企业应以治理内部数据为先,激活数据资产,并由业务部门主导采购业务产品,沉淀先验知识为系统融合奠基[4] - 企业数字化转型需先进行“蓝图设计”,由各业务部门共同厘清管理对象、潜在后果及应对措施,形成统一业务标准[4] - 服务商开发平台需了解企业生产过程,以架构出真正“管事”的数字平台[4] - 数字化转型应一体化定制实施,与工艺需求深度匹配,期待服务商提供针对特定场景的专属方案[5] - 建议由行业协会牵头,组织院校、服务商和企业共建实训基地,为行业提供人才支撑[5] - 展望“十五五”,行业数字化转型面临三大战略机遇:政策红利集中释放、AI等技术从单点应用走向全流程渗透、产业集群链式协同升级带动中小企业改造[5] - 希望国家层面出台单独针对石化行业数字化转型的政策,给予支持以提高企业积极性[5]
2025AI生态共建论坛圆桌对话:以数据驱动产业 以安全筑牢根基
中金在线· 2025-12-04 10:07
论坛背景与核心议题 - 2025企业家博鳌论坛系列活动于12月2日至5日在海南博鳌举办,期间举行了“2025AI生态共建论坛暨《睿德数字经济创新发展大数据平台》发布会” [1] - 论坛核心圆桌对话主题为“数据驱动产业革命,垂直领域的智能体化实践”,聚焦于垂直领域AI落地的实际问题、场景及安全 [1][6] AI行业发展阶段与挑战 - AI发展正从通用普惠阶段深化至垂直行业应用阶段 [3] - 规模化落地面临数据治理、算力成本、安全可信及复合型人才短缺等挑战 [3] - 传统企业特别是中小型制造企业在推进AI转型过程中面临突出挑战,研发垂直大模型需要强大的数据治理能力、高额算力投入和跨领域专业团队,对许多企业而言成本过高 [3] 数据质量与治理的关键性 - 数据质量是人工智能深入发展的重要支撑,如果投喂给AI的数据本身不真实、权属不清晰,再先进的算法和算力也可能输出“有毒”结果并误导决策 [4] - 数据源头的可信性已成为AI能否真正落地的基础前提 [4] - 构建源头可信机制能显著降低后续AI数据治理成本,为分析决策构建扎实可靠的基础 [4] - 公司实践:矩网科技通过自主研发的动码印章技术,为文件绑定不可篡改、可溯源的可信标识,为产业数据附加“数字身份证” [4] AI落地与业务融合 - AI落地须深入业务场景、理解行业运行逻辑 [4] - 公司实践:小哆智能科技通过长期驻点服务方式,全程参与从数据采集、清洗到使用的业务环节,以深入理解客户需求 [4] - 只有真正理解业务,才能设计出可交付实际成效的AI系统,推动AI从“可用”走向“好用”,最终实现“结果化” [4] 安全可信与风险防范 - 完全防止AI安全漏洞是不现实的,但可以通过技术加固、备案管理、人才培育等多重手段提升整体防护水平 [3] - 公司实践:北大法宝基于二十余年积累,建立了严谨的数据采集、标注与审核流程,并通过为AI回答提供法条原文链接等方式,确保结果可溯源、可验证,有效维护信息准确性 [5][6] 人才培养与产学研协同 - 当前兼具专业技术与行业洞察能力的复合型人才较为稀缺 [5] - 高校与产业间在人才培养与供需对接方面存在一定脱节 [3] - 公司实践:北大法宝与多所高校合作,共同开设法律大数据、法律AI等课程,着力推进产学研协同育人 [5] - 人工智能的未来需要在数据可信、安全可控、人才充沛的前提下,持续推动技术与行业的深度融合 [3] - 在AI技术不断演进的背景下,需要产学研用协同发力,突破关键瓶颈,共同推动智能化在实践中扎根生长 [6]
数据领导力系列:行之有效的数据治理是从监管到大规模实现数据价值
36氪· 2025-12-04 03:31
文章核心观点 - 有效的数据治理核心在于赋能团队做出更快、更可信的决策,而非实施控制[1] - 治理需从被动的“把关式”转变为主动的“赋能式”,专注于创造价值而非仅关注合规或减少歧义[1] - 成功的治理方案需秉持积极主动的思维,与最终用户合作解决其问题,实现数据民主化[1] 治理失灵之时 - 早期通过简单文档统一命名规则,成功提升了数据质量并实现了团队间的互操作与自我监管[5] - 随着数据使用场景增加,治理规模化过程中陷入典型陷阱:审批瓶颈导致开发进度放缓[5] - 文档陷阱表现为创建过量文档造成认知负担,无人阅读冗长政策文件[6] - 中心化与分散化团队在数据不一致时互相指责,责任归属不清[6] - 因中心团队交付无法满足需求,业务团队自行开发变通方案,导致治理旨在防止的碎片化和风险[6] 将产品思维应用于数据治理 - 治理思维转变的关键是将问题从“如何控制数据使用”变为“如何让正确使用数据比错误使用更容易”[10] - 从制度转向平台:投资在数据管道中构建质量检查机制,而非制定规则[10] - 从委员会转向自动化:投资自动化并建立明确升级路径,取代人工审批流程[10] - 从文档转向发现:投资动态数据目录实时显示质量、沿袭和使用模式,取代静态策略文档[10] - 数据网格框架强调去中心化架构和将数据视为产品,但需找到适合组织规模和需求的平衡点[10] 赋能治理的三大支柱 支柱一:透明的数据质量和背景 - 团队需在工作流程中了解数据质量和上下文,透明度应体现在数据实际使用的地方[11] - 在控制面板中添加质量指标(如数据新鲜度、覆盖范围、已知问题)使用户能自行查看数据状态,减少对数据正确性的质疑[11] - 示例数据质量显示:转化率92.1%为健康,客户流失率73.9%为一般,收入归因58.6%为差,库存准确性87.5%为健康,客户净推荐值79.8%为健康[12] 支柱二:智能默认设置的自助服务 - 实现合规治理最快的方法是使其成为阻力最小的路径,让团队能自主快速正确地解决数据问题[13] - 建立公司范围内可靠的黄金记录作为起点,同时允许团队根据特定运营需求构建更细粒度的数据集[14] - 制定政策但放手让团队快速行动并赋予权限,定期评估以确保决策正确,团队在符合自身利益的智能指导下自然会遵循治理原则[14] 支柱三:嵌入式所有权和问责制 - 数据治理应是所有数据使用团队积极参与的过程,数据质量的实际所有权需分配给最了解数据的领域专家[15] - 将数据视为产品,要求团队对其创建的数据质量和使用情况负责,数据产品无人使用则表明存在问题[15] - 成立由各业务部门数据产品负责人代表组成的数据产品治理委员会,定期分享挑战、统一标准并协调跨团队变更,需由能凝聚力量、避免官僚主义的领导者领导[15] 让治理真正发挥作用:实施指南 - 明确质量标准:优先治理受质疑的数据集以弥合信任鸿沟,先从三个关键数据产品入手作为典范[18] - 将治理机制融入平台:将治理决策嵌入数据平台架构,实现自动质量检查、基于分类的访问控制和集成血缘跟踪,统一数据目录是基石[18] - 建立反馈机制:利用信任度与易用性调查、治理功能使用分析及质量趋势跟踪等方法实现持续改进[18] - 加强数据素养:团队需理解规则及其重要性,让成员参与并化繁为简,避免治理沦为官僚主义[18] 当治理真正奏效时 - 良好的治理对用户无形但体现在结果上:团队减少质疑数据的时间,更多精力投入基于洞察的行动[21] - 数据质量问题能更快被发现和解决,新成员无需大量培训即可查找和使用数据[21] - 治理需惠及所有团队而非部分,目标是建立一种无需团队成员操心就能改善工作的机制[21]
欧盟尝试为数字监管“松绑”
经济日报· 2025-11-29 00:53
欧盟数字监管政策转向 - 欧盟委员会于11月19日提出一揽子旨在精简和调整数字与科技监管举措的改革建议,标志着其从过去强调隐私保护与权利优先的严格监管模式向更为务实、旨在为产业“松绑”的方向转变[1] - 此次政策调整的背景是科技浪潮加速、经济增长乏力以及国际竞争压力不断加大,欧盟试图重新评估制度负担与发展动力,推动一场旨在鼓励创新和提升科技竞争力的改革[1] 《人工智能法案》调整 - 建议将生物识别监控、公共事业供应、医疗系统、信用评估、求职筛选以及执法等敏感领域高风险人工智能系统的相关规定最迟比原定时间推后16个月生效[1] - 将统一网络安全事件的报告入口,并将更多人工智能监管职能集中到欧盟人工智能办公室[1] 《通用数据保护条例》调整 - 关于数据主体访问请求的拒绝理由将被适度放宽,企业在使用匿名化和假名化数据训练人工智能模型时将拥有更大空间[2] - 广泛关注的cookie弹窗将迎来变化,用户未来或可在浏览器的统一控制界面中对某些“无风险”cookie进行管理[2] 改革驱动因素 - 首要目标是提升科技竞争力,欧委会公开表示改革旨在为企业“松绑”,鼓励企业创新,为经济复苏注入新动能[3] - 响应企业和行业关于减少行政负担的诉求,据估算改革措施若顺利实施,到2029年欧盟企业行政成本可减少高达50亿欧元[3] - 计划引入的“欧洲商业钱包”将为企业提供统一的数字身份,有望每年为企业节省高达1500亿欧元的文书成本[3] - 来自美国大型科技平台、行业组织乃至美国政府的持续施压是促使欧盟作出政策调整的重要原因,美国官方明确表示若欧盟在数字监管上展现更大灵活性,将考虑下调对欧盟钢铁和铝产品的关税[4] 改革特点与潜在影响 - 新提案提出的数字综合框架意在统一人工智能、网络安全和数据治理相关规定,简化公司流程,减少企业在跨成员国经营时面临的制度碎片化问题[4] - 多项“高难度”新规将只在确保企业拥有所需的标准和支持工具后才会正式适用,这被视为欧盟在面对复杂技术环境时的务实应对[4] - 此次改革并非全面“松绑”,《数字服务法》和《数字市场法》等核心制衡平台权利的法规并未受到显著影响[4] - 有分析指出,若草案通过,将使欧盟模式更接近一种以产业为驱动、对数据与人工智能监管更宽松的做法,而不再坚持过去“权利优先、谨慎监管”的传统[6] 改革前景与挑战 - 提案将提交欧洲议会及27个成员国政府审议,围绕该改革的争论预计将在未来数月升级,最终落地需要跨机构、跨党派达成广泛共识[6] - 改革提案面临修订、削弱甚至部分被否决的可能性,立法过程将伴随激烈的政治博弈和游说行动[6] - 欧盟正尝试从“价值先行”的监管模式向“价值与竞争力并重”的框架过渡,这一转变是否能帮助欧洲重振科技实力同时守住隐私和权利保障的底线取决于未来立法进程[7]
Cloudera首席技术官:每家零售企业都需要成为一家科技公司
环球网· 2025-11-27 07:26
文章核心观点 - 零售行业正全面加速向数字化、智能化转型,在年末促销季期间尤为关键 [1] - 能够脱颖而出的零售企业需具备“科技公司式”的思维与能力,将数据视为战略资产 [1] - 将数据的可见性与可控性置于核心的零售商,才能在扩展业务、强化安全的同时提供无缝的客户体验 [1] - 随着节日购物高峰临近,将数据可见性与治理能力纳入核心战略的零售商,将更有能力稳定运营、提升客户体验并实现增长 [4][5] 零售行业面临的挑战与压力 - 节假日高峰期给零售系统带来三大压力:可扩展性、容错能力以及人手短缺 [2] - 线上线下流量往往成倍增长,突发性负载激增极易触发系统故障或性能下降,且恢复难度极高 [2] - 任何停机都会带来高昂代价,不仅直接造成销售损失,更会影响消费者整体满意度 [2] - 交易处理和欺诈检测系统在流量暴增时仍需稳定运行,压力尤为明显 [2] - 亚太地区占全球网络攻击总数的34%,位居各地区之首 [1] - 由于交易量激增且掌握大量敏感数据,零售商在节假日期间往往成为网络攻击的重点目标 [2] - 普华永道调查显示,74%的亚太消费者对隐私与数据共享感到担忧 [3] 成功零售商的关键能力与战略 - 数据管理平台必须同时具备可扩展性和容错能力,以从容应对额外负载并避免停机 [2] - 企业数据血缘能力能够迅速定位数据管道中的断点,帮助团队以最小代价恢复业务运行 [2] - 通过在混合云和多云环境中构建统一的数据访问与活动视图,零售商可消除可见性盲区,确保敏感数据得到持续监控与全面保护 [2] - 要保持客户黏性,零售商必须向公众证明其对数据的使用是安全、透明且负责任的 [3] - 健全的治理体系与零信任架构尤为重要,安全设计原则可最大限度降低数据暴露风险 [3] - 统一的治理框架确保在混合环境中始终如一地落实数据安全与合规要求 [3] 数据与技术的应用价值 - AI和机器学习已成为优化需求预测、实现个性化体验以及强化欺诈检测的关键能力 [3] - 历史数据用于训练需求预测模型并洞察消费者行为 [3] - 实时数据采集系统让零售商能够进行动态决策,例如在交易发生的瞬间识别异常,或在消费者踏入门店时立即推送个性化优惠 [4] - 在零售行业,时机决定成效:优惠信息哪怕晚到15分钟都可能失去作用,而滞后的欺诈检测更可能带来可观的财务损失 [4] - 借助实时可见性,零售商能够即时响应,在损害形成前就完成对合法交易的放行,并及时拦截可疑行为 [4] - Cloudera同时支持历史数据与实时数据的处理,两者对于零售业务的成功都不可或缺 [3]