中国科学院自然科学史研究员孙显斌:字节跳动“识典古籍”平台用AI持续推动古籍数字化进程
财富在线·2025-04-28 08:52

识典古籍平台项目 - 字节跳动公益于2022年10月上线完全公益的古籍智能阅读和整理平台“识典古籍” [2] - 平台利用OCR技术和人工校对扩容古籍图文库,已免费公开1.6万余部古籍,月访问量超240万用户 [2] - 平台计划到2025年底发布3至4万部古籍,预计2026年底发布品种数量将超过现有所有商业和公益古籍图文库总和 [2] 技术与效率提升 - 识典古籍采用自动标点、自动分段、自动校勘等AI技术,成为古籍整理和研究的数字人文平台 [4] - 引入数字整理平台后,据专家测算至少可提高五倍效率,极大加快古籍整理进程并方便保留过程文档 [4] - 平台创建大字符集解决方案,利用人工智能等新技术成果推动古籍数字化 [2][4] 大众参与与协作 - 2024年发起“我是校书官”活动,联合高校古籍研究机构,1000余所高校1万余名学生参与,整理1600余部古籍,校对总字数超过6亿 [3] - 2025年3月“我用AI校古籍”活动发起机构扩大到全国20余所高校,倡议社会公众和学生参与 [3] - “众筹建设”是公益古籍数字化项目的重要路径,平台得益于科技力量与大众力量 [3] 文化传承与拓展 - 2024年12月,字节跳动公益捐赠2500万元,支持北京大学开展《儒藏》编纂与研究工作,相关数字化成果将在识典古籍上线 [4] - 公司通过抖音平台支持非遗传承,过去一年有上千名非遗代表性传承人活跃,1379万网友分享非遗体验,非遗团购商品订单量同比增长356% [5] - 公司联动全国各大博物馆、创作者,通过直播、短视频普及文物知识,大多数国家三级以上博物馆内容可在抖音找到 [5] 行业背景与意义 - 中华典籍文化遗产总量估计为传世古籍约20万种,50万个版本 [1] - 最方便使用的古籍图文库多为商业数据库,限制了普通公众访问,且商业库扩容边际收益断崖式下跌 [1] - 教育部等九部门发布意见,指出需聚焦集成化、智能化、国际化,促进人工智能助力教育变革 [5]