圖夫茨大學最新研究發現,大型語言模型在識別對話中的合適插話時機方面存在明顯缺陷,這一發現揭示了人工智能在對話能力上的局限性。
在自然語言處理經驗方法會議(EMNLP 2024)上,該大學的研究團隊將詳細介紹他們的研究成果。該研究已提前在arXiv預印本服務器上發布,引起了學術界的廣泛關注。
研究指出,人類在交談時通常會根據多種輸入線索來判斷何時是合適的插話時機,這被語言學家稱為“話輪轉換點”(TRP)。然而,AI在識別這些關鍵時點上表現得并不理想。
傳統觀點認為,對話中的副語言信息,如語調和停頓,是識別TRP的關鍵。但圖夫茨大學的JP de Ruiter教授表示,實際上,語言內容本身才是決定輪流發言時機的最重要因素。
研究人員嘗試通過微調和對話內容額外訓練來提升AI的對話能力,但結果發現仍存在難以克服的限制。他們警告說,基于統計相關性的AI可能無法真正理解對話的深層語境和意圖。
為了克服這些限制,研究團隊建議對大型語言模型進行更大規模的自然口語語料庫預訓練。然而,目前收集足夠數量的對話錄音和轉錄數據仍是一個巨大挑戰。