厦门大学的一支科研团队近日在古文字研究领域迈出了创新步伐,他们宣布正探索利用人工智能(AI)技术,特别是多模态大模型,来辅助破解历史悠久的甲骨文。这一消息通过该校官方公众号于12月4日正式发布。
甲骨文,亦被称为“殷墟文字”,是拥有超过三千年历史的古老文字体系,被视为世界四大古文字之一,同时也是现代汉字的源头。然而,传统的甲骨文考释工作极为复杂且耗时,主要依赖专家通过字形分析、辞例研究等人工方法进行释读,这不仅要求深厚的专业知识,还需广泛阅读大量相关文献。
面对甲骨文考释工作的巨大挑战,厦门大学的研究团队转而寻求AI技术的支持。近年来,AI技术的飞速发展,特别是深度学习模型在语义表示方面的强大能力,为甲骨文的辅助考释提供了新的可能。
针对甲骨文数据稀缺且图像质量参差不齐的问题,该团队系统整理了相关古文字数据,构建了更大规模、更高质量的甲骨文多模态数据集。他们提出了“基于甲骨文多模态大模型的多元信息辅助考释模型”的技术方案,旨在通过AI技术提高考释效率和准确性。
为了有效训练这一多模态大模型,团队设计了一系列与实际考释过程密切相关的任务和评估方法。这些方法包括跨字体图像映射、跨字体IDS(表达结构的部首偏旁序列)解码以及甲骨字与现代汉字的对译关系等,旨在全方位提升模型的考释能力。
团队充分利用AI的跨模态理解能力,将音、形、义、用等多元信息融入考释过程中。在大模型提供的语义嵌入基础上,他们还设计了一个端到端的甲骨文综合考释模型,该模型结合了字形结构分析、语义关联判断、同音通假识别以及用法聚类分析等多种方法。他们还致力于开发一种更加轻量的考释系统,以适应资源有限的实际考释场景。
通过这一创新性的研究方法,厦门大学的研究团队为甲骨文的考释工作开辟了新的道路。他们相信,随着AI技术的不断进步和应用,将有更多古老的文字被重新解读,为人类文明的研究和发展贡献新的力量。