廈門大學近日在其官方公眾號上公布了一項創新性的學術探索,旨在通過人工智能技術,為古老的甲骨文考釋工作注入新的活力。據悉,該校的研究團隊正著手利用AI多模態大模型,結合甲骨文的音韻、形態與意義,協助專家們更加高效地解讀這一有著三千多年歷史的文字。
甲骨文,亦稱“殷墟文字”,作為世界四大古文字之一,不僅是中華文明的重要瑰寶,也是現代漢字的源頭。然而,傳統的甲骨文考釋工作卻面臨著巨大的挑戰,需要考古專家憑借深厚的知識積累和豐富的文獻閱讀,通過字形分析和辭例研究等方法,逐步破譯這些古老的文字。這一過程不僅耗時費力,而且效率極低。
面對這一困境,廈門大學的研究團隊決定借助近年來迅猛發展的AI技術,利用深度學習模型的強大語義表示能力,為甲骨文考釋提供新的解決方案。針對甲骨文數據稀缺、圖像質量參差不齊的問題,團隊系統整理了相關古文字數據,構建了更大規模、更高質量的甲骨文多模態數據集,并提出了基于多元信息輔助考釋模型的技術方案。
為了實現這一目標,團隊設計了一系列與實際考釋過程密切相關的任務和評估方法,如跨字體圖像映射、跨字體IDS解碼以及甲骨字與現代字的對譯關系等。這些任務旨在有效訓練多模態大模型,提升其對于甲骨文的理解和識別能力。
在AI技術的輔助下,團隊利用其強大的跨模態理解能力,對甲骨文進行更為深入的考釋。在大模型提供的語義嵌入基礎上,團隊還計劃設計融合音、形、義、用多元信息的端到端甲骨文綜合考釋模型。這一模型將綜合利用字形結構、語義關聯、同音通假和用法聚類分析等多種手段,開發一種更加輕便、高效的考釋系統,以適應資源有限的實際考釋場景。
可以預見,隨著AI技術在甲骨文考釋領域的不斷應用,這一古老而神秘的文字將有望得到更為全面、深入的解讀。廈門大學的這一創新嘗試,不僅為甲骨文的保護與傳承提供了新的可能,也為考古學、歷史學等相關領域的研究開辟了新的道路。