DeepSeek上线论文,用OCR技术减少计算和存储开销
Seek .Seek .(US:SKLTY) 选股宝·2025-10-20 23:31

核心技术进展 - DeepSeek发布新论文《DeepSeek-OCR:Contexts Optical Compression》,提出通过将长文本内容渲染成图片再由模型识别,实现对文本信息的压缩[1] - 该方法显著减少计算和存储开销,在10倍压缩比时OCR精度达97%,20倍压缩时精度为60%[1] - 模型在压缩文本同时保持高准确性,处理长文档时效果尤为突出[1] 行业技术定义与发展趋势 - 光学字符识别技术是通过电子设备识别纸质文档字符并转换为可处理文本格式的过程,广泛应用于文档数字化、信息检索和数据分析[1] - OCR技术与人工智能结合成为新趋势,深度学习应用使复杂场景下识别精度显著提升[1] - 基于深度学习的OCR已成为行业主流,未来发展方向包括一体化端到端模型、高效轻量化模型及向更高智能化发展[1] 市场规模预测 - 2024年全球人工智能驱动的OCR市场规模约81.7亿元,预计到2031年将接近136.9亿元[2] 主要公司竞争力 - 合合信息扫描全能王产品为业内标杆,OCR识别率显著领先市场同类产品[2] - 公司在复杂场景下平均字符识别率达81.9%,领先于百度的70.0%、腾讯的65.0%和阿里的66.9%[2] - 汉王科技OCR技术曾获国家科学技术进步二等奖,在手写体识别、满文识别、藏文识别、复杂场景和版面识别方面技术优势突出[2]