大模型破译甲骨文创下新SOTA!复旦团队推出新框架
量子位·2025-09-08 05:04
复旦大学团队 投稿 量子位 | 公众号 QbitAI 让大模型破译从未见过的甲骨文,准确率拿下新SOTA! 来自复旦大学的研究人员提出了一种 基于部首和象形分析的可解释甲骨文破译框架 —— 不仅在公开基准数据集HUST-OBC和EV-OBC上,达到最先进的Top-10识别准确率以及优异的零样本破译能力。 而且面对未破译甲骨文,所提方法也能够输出可解释性的分析文本,从而为考古破译工作提供潜在帮助。 事实上,作为最古老的成熟文字系统,甲骨文长期以来因其稀有性、抽象性和象形多样性,给考古破译工作带来了重大挑战。 当前基于深度学习的方法在甲骨文破译任务上取得了令人鼓舞的进展, 但现有方法往往忽视了甲骨文字形与语义之间的复杂关联 。 这导致了有限的泛化能力和可解释性,尤其是在处理 零样本场景 和 未破译的甲骨文 时。 为此,本文提出了一种基于大型视觉语言模型的可解释甲骨文破译方法,该方法通过联合部首分析与象形语义理解,弥合了甲骨文字形与语意 之间的鸿沟。 下面具体来看—— 首个象形解析甲骨文破译数据集 概括而言,团队提出了一种渐进式训练策略,引导模型从部首识别和部首分析,过渡到象形分析,最后进行部首-象形交互分析,从而 ...