Workflow
高质量数据集
icon
搜索文档
OpenAI:预计今年ChatGPT收入近100亿美元|首席资讯日报
首席商业评论· 2025-09-07 04:09
辛巴调查传闻 - 辛选集团创始人辛巴被报道遭相关部门带走调查并前往香港 但集团相关人士回应称消息不属实 [2] 文化传播与国际合作 - 中国影片《南京照相馆》于9月5日在英国两大主流院线"电影世界公司"和"奥迪恩"上映 影片被英国发行方欧洲时报英国分社评论为超越单一文化圈层 成为不同背景群体对战争记忆和历史真相的共同对话 [3] AI计算与技术创新 - 中科曙光协同AI芯片、AI整机、大模型等20多家产业链上下游企业 在2025世界智能产业博览会上发布国内首个AI计算开放架构 推出AI超集群系统 单机柜支持96加速卡、百P级AI算力 最大可实现百万卡大规模扩展 [4] - 依托国家先进计算产业创新中心启动"AI计算开放架构联合实验室"建设 [4] 资本市场与监管动态 - 十四届全国政协经济委员会副主任易会满因涉嫌严重违纪违法接受中央纪委国家监委纪律审查和监察调查 [5] - 易会满2019年1月至2024年2月执掌中国证监会5年 任期内A股20次跌破3000点(收盘价) [6] 科技行业动态 - 美国总统特朗普在白宫宴请科技巨头 扎克伯格忘关麦向其道歉 坦言未准备好回答在美国投入资金的具体数字问题 [7] - 2025可信数据空间高质量数据集生态大会发布首批85个高质量数据集建设清单 涉及汽车领域新能源汽车动力电池安全测评、智能驾驶算法研发等数据集 以及低空经济领域天目星座全球大气海洋遥感、低空城市安全巡检卫士等数据集 [8] - 小米集团公关部总经理王化回应"30万小时手机测试" 称是千台测试机累计时长 为行业标准说法 [9] - OpenAI预计2030年收入将比此前预测高出约15% 今年预计通过ChatGPT实现近100亿美元收入 总营收达130亿美元 今年预计消耗超过80亿美元 比此前预测高出约15亿美元 [10] 企业并购与投资 - 美国医疗健康投资公司Patient Square Capital正考虑收购医疗保健公司PREMIER [11] 加密货币与金融 - 特朗普家族发行加密货币敛财50亿美元 美国民主党参议员伊丽莎白·沃伦指责其未能兑现降低通胀承诺 家族财富因此增加数十亿美元 [11] 个人财富与体育 - 巴西亿万富豪将全部遗产赠予足球巨星内马尔 遗产价值超过10亿美元 内马尔团队回应称尚未收到正式通知 [12] 网络平台与内容监管 - 反诈老陈回应快手账号被封 原因为"攻击、抹黑其他主播" 表示不后悔也不怕 以后还继续喊话 [13]
首批85个高质量数据集建设清单发布
证券时报网· 2025-09-06 02:48
大会核心事件 - 2025可信数据空间高质量数据集生态大会于9月5日在重庆开幕 [1] - 大会发布首批85个高质量数据集建设清单 [1] - 启动2025高质量数据集建设先行先试工作(重庆)与可信数据空间国家创新发展试点(重庆)项目 [1] 高质量数据集建设重点领域 - 汽车领域将加快建设新能源汽车动力电池安全测评、智能驾驶算法研发等数据集 [1] - 汽车领域数据集旨在为万亿级产业集群提供数据支持 [1] - 低空经济领域将加快建设天目星座全球大气海洋遥感、低空城市安全巡检卫士等数据集 [1] - 低空经济领域数据集旨在构建空间感知能力,赋能城市高效化、精细化、智能化治理 [1]
时代风口 数据质变 引领智能文明新跃迁
证券时报· 2025-09-04 21:58
行业规模与交易现状 - 高质量数据集总量超过400PB 累计交易额接近40亿元[1] 技术演进与发展范式 - AI发展从粗放式数据投喂转向高质量数据集驱动 标志着从蛮荒阶段进入精耕细作阶段[1] - 高质量数据与AI形成"双轮驱动"共生关系 优质数据滋养AI进化 智能化AI反哺数据价值挖掘[1] 文化价值与社会治理 - 高质量数据集融入中华优秀传统文化 在数据底层注入文明价值观以消除文化偏见[2] - 深圳在征信和气象领域实践数据质量与社会治理深度结合[2] 潜在挑战与结构性风险 - 高质量数据可能加剧数字鸿沟 拥有优质数据的机构将垄断AI红利[2] - 数据分级分类与安全防护不到位时 高质量数据可能成为系统性风险放大器[2] 未来发展方向 - 需建立数据质量国家标准 推动跨域数据融合打破数据孤岛[3] - 在数据注智过程中嵌入人文精神 避免AI沦为纯功利工具[3]
时代风口 | 数据质变引领智能文明新跃迁
证券时报· 2025-09-04 18:53
行业规模与交易数据 - 高质量数据集总量超400PB 累计交易额近40亿元[1] 技术演进趋势 - AI发展范式从粗放式数据投喂转向高质量数据集驱动的精耕模式[1] - 数据与AI形成"双轮驱动"的共生关系 优质数据滋养AI进化 智能化AI反哺数据价值挖掘[1] - 高质量数据集建设标志着从"海量"到"高质"的产业变革 体现数字文明从量扩张转向质淬炼的必然路径[1] 文化价值与应用实践 - 高质量数据集作为数字时代"文化基因库" 需融入中华优秀传统文化价值观[2] - 深圳在征信和气象领域实现数据质量与社会治理深度结合的实践雏形[2] - 西方早期互联网数据存在文化偏见 当前建设注重用数据编码华夏智慧[2] 潜在挑战 - 高质量数据可能加剧数字鸿沟 拥有优质数据的机构将垄断AI红利[2] - 数据分级分类与安全防护不到位时 高质量数据可能成为系统性风险放大器[2] - 需通过数据政策兼顾效率与公平 避免优质数据成为少数主体私产[2] 未来发展路径 - 需建立数据质量国家标准体系 推动跨域数据融合打破数据孤岛[3] - 在数据注智过程中嵌入人文精神 避免AI沦为纯功利工具[3] - 推动数据有质有魂有温度 成为驱动人类进步的硬通货[3]
高质量数据集和AI共振 成为数据流通“硬通货”
中国新闻网· 2025-09-02 14:32
高质量数据集政策支持 - 国家多部门2024年12月印发指导意见 首次明确支持企业开发高质量数据集并发展数据即服务等新业态 [2] - 《高质量数据集建设指引》指出数据需求从量级积累转向量质并重 因应大模型参数规模指数级增长和多模态能力拓展 [2] 高质量数据集发展现状 - 截至2025年6月全国建设高质量数据集超3.5万个 总量超400PB [2] - 数据交易机构挂牌高质量数据集3364个 累计交易额近40亿元 规模达246PB [2] - 中国信通院院长指出全球大量私域数据释放是构成高质量数据集的重要方向 [2] 高质量数据集与AI发展关系 - 高质量数据集成为数据流通硬通货 因AI大模型训练需海量数据而面临数据短缺或依赖合成数据 [3] - 人工智能大模型与高质量数据集形成相辅相成双轮驱动格局 [3] - 数据建设质量和安全是大模型发展生命线 需完善分级分类安全制度并强化全流程技术防护 [3] 高质量数据集应用实践 - 深圳市通过公共数据资源授权运营和可信数据空间建设 支持公共与企业数据融合应用 [3] - 在征信金融、气象、商保理赔等领域开展试点并取得较好成效 [3]
江苏发布首批高质量数据集重点领域建设清单
新华日报· 2025-09-01 23:24
高质量数据集建设清单 - 江苏发布首批高质量数据集重点领域建设清单 涉及工业制造 交通运输 医疗健康等16个重点领域以及通用大模型 数据跨境等其他领域 [1] - 通过搭建高质量数据集"创新场景" 助力人工智能大模型技术创新 场景应用和产业生态繁荣 [1] 医疗健康领域应用 - 卫生健康信息数据集综合医疗门诊 住院 检验检查 影像 药品及耗材使用 健康档案管理等医疗和公共卫生功能于一体 [1] - 该数据集为卫生健康分析及决策支持 疾病监测及预防控制 临床辅助决策支持 公共卫生应急响应 医疗质量监控提供智慧支撑 [1] 人力资源领域应用 - 人力资源社会保障行业数据集汇集个人社保缴纳信息 企业社保缴纳信息 职业资格证书信息 劳动仲裁信息 劳动监察信息 [1] - 数据集赋能公共服务精准惠民和信用评价体系建设 [1]
江苏发布高质量数据集重点领域建设清单
新华日报· 2025-09-01 22:36
核心观点 - 江苏省发布高质量数据集重点领域首批建设清单 覆盖16个重点领域及其他创新领域 旨在通过搭建高质量数据集"创新场景" 助力人工智能大模型技术创新 场景应用和产业生态繁荣 [1] 重点领域覆盖 - 清单涉及工业制造 交通运输 医疗健康 科学研究 金融服务 文化旅游 城市治理 人力资源 绿色低碳 农业农村 智慧能源 教育教学 商务领域 应急管理 气象服务 公共安全等16个重点领域 [1] - 除16个重点领域外 还涵盖通用大模型 数据跨境 政务服务等其他领域的高质量数据集 [1] 具体应用场景 - 医疗健康领域的"卫生健康信息数据集"综合医疗门诊 住院 检验检查 影像 药品及耗材使用 健康档案管理 慢性病管理 老年保健等医疗和公共卫生功能 为卫生健康分析及决策支持 疾病监测及预防控制 临床辅助决策支持 公共卫生应急响应 医疗质量监控提供智慧支撑 [1] - "人力资源社会保障行业数据集"汇集个人社保缴纳信息 企业社保缴纳信息 职业资格证书信息 劳动仲裁信息 劳动监察信息 赋能公共服务精准惠民和信用评价 [1]
专题发布数据基础设施建设成果、入选高质量数据集典型案例
南京日报· 2025-09-01 02:18
数博会概况 - 2025中国国际大数据产业博览会于8月30日在贵阳落幕 主题为"数聚产业动能 智启发展新篇" 设置六大主题展馆和五大核心板块 吸引375家中外企业参展并举办26场交流活动[1] 数据基础设施建设成果 - 国家数据局专题发布南京与大连市数据基础设施互联互通成果 实现全国首例2笔双向跨域数据交易 验证数据基础设施互联互通及跨域互操作的可行性和便捷性[2] - 南京—大连数据流通交易全程通过国家数据流通基础设施完成 是国内城市间首例跨域数据产品可信流通 为数据要素安全可信流通提供示范样板[2] - 国家数据局将在全国范围内组织推广应用跨域数据交易模式[3] 高质量数据集典型案例 - 国家数据局发布首批104个高质量数据集典型案例名单 覆盖农业 医疗 通信等领域[4] - 南京莱斯信息"公共信用档案高质量数据集"入选 累计归集数据超800亿条 覆盖1.8亿社会法人和8亿自然人 年增量稳定在20亿条以上 对接47个部委和31个省级单位[5] - 南京南自信息"中国华电发电智能巡检与安全管控高质量数据集"入选 覆盖风电 光伏 水电 火电全发电类型 构建视觉和声纹数据集标准体系[6] 产业基地建设与合作 - "中国高质量数据集产业基地(南京)"正式揭牌 聚焦高质量数据集关键技术攻关和标准体系构建 重点围绕工业制造 交通 医疗领域开展数据标注实践[7] - 电信AI公司 南京电信 南京大数据集团 玄武高新集团签署战略合作协议 将打通数据价值转化全链条 吸引产业链上下游企业参与[7] - 基地计划建设本地特色AI数据集 培养行业数据标注人才 引育科技型数据标注企业 构建创新要素聚集的产业新格局[7]
我省4项目入选国家高质量数据集典型案例
新华日报· 2025-08-30 23:21
国家数据局高质量数据集典型案例 - 国家数据局在2024年8月28日至30日中国国际大数据产业博览会上发布首批104个高质量数据集典型案例名单 [1] - 江苏省有4个案例入选典型案例名单 包括中国移动研发大模型数据集 公共信用档案数据集 发电智能巡检与安全管控数据集 以及节能光伏一体化综合能源数据集 [1] 入选案例数据规模与应用领域 - 中国移动研发大模型高质量数据集总数据量超10TB 覆盖8类17个技术类中文语料数据集 可复用于工业 金融 交通等垂直领域行业大模型质量提升与评估 [1] - 公共信用档案高质量数据集已对接47个部委和31个省级单位及兵团 截至2024年6月累计归集数据超800亿条 广泛应用于政务服务和社会治理领域 [1] - 中国华电发电智能巡检与安全管控高质量数据集构建覆盖风电 光伏 水电 火电全发电类型的智能巡检与安全管控视觉数据集 [1] - 节能光伏一体化综合能源高质量数据集为行业客户提供一体化绿色低碳运营场景和交付服务能力 [1]
实探数博会:数据赋能千行百业
中国证券报· 2025-08-28 20:16
数字经济规模与增长 - 预测2025年底数字经济增加值达49万亿元 占GDP比重35% [1] - 数字经济核心产业增加值占GDP比重提前完成"十四五"规划目标 [1] - 2024年贵州省数字产业规模2500多亿元 同比增长18.3% [3] 产业活动与参与度 - 数博会举办26场交流活动和34场系列特色活动 [1] - 1.6万余名嘉宾注册参会 375家中外企业参展 [1] 数据要素基础设施 - 截至6月底建设高质量数据集超过400PB [3] - 全国智算总规模78万PFlops 位居世界第二 [3] - 八大国家枢纽节点集聚60%以上新增算力 智算规模62万PFlops占全国总量80% [3] - 西部地区数据中心建设运营成本为东部的50%至70% [3] 企业技术应用案例 - 中科星图展示低空经济全链条产品体系 包括GEOVIS iFlight低空智航应用平台 [1][2] - 平台基于星图云及星图低空云提供航摄采集 智能巡检 物流配送等标准化服务 [2] - 万联易达利用生态系统交易 物流 金融服务信息沉淀数据支撑产业互联网大模型建设 [2] - 产业互联网大模型提供产业知识问答 数据问答等服务帮助企业提高效率降低成本 [2] 数据要素市场发展 - 高质量大规模数据成为推动人工智能+行动的有力支撑 [3] - 数据要素流通交易需从供给侧和需求侧同时拉动 供需匹配促进市场有效运行 [4] - 国家数据局部署数据产业集聚区建设试点 加快形成产业生态和规模优势 [4] 数据集建设挑战与建议 - 专业高质量数据集厂商规模较小 自动化智能化生产水平有待提升 [4] - 建议通过发放语料券补贴高质量数据集供给端 需求端和交易端 [4] - 培养各方为高质量数据集付费习惯 推动高质量数据集构建 [4]