近期,英國廣播公司(BBC)公布了一項關于人工智能(AI)聊天機器人在新聞總結方面能力的深度研究結果,引發廣泛關注。此次研究涉及了多家知名AI工具,包括微軟的Copilot、OpenAI的ChatGPT、谷歌的Gemini以及Perplexity等。
在這項研究中,BBC選取了100篇新聞報道,要求這些AI工具對它們進行總結,并根據總結內容提出相關問題。然而,研究結果卻揭示了AI在新聞總結方面的嚴重準確性問題。超過一半的AI生成的答案存在顯著問題,其中約五分之一的答案甚至引入了明顯的事實錯誤,包括數據、陳述和日期等關鍵信息的誤導。
BBC新聞與時事首席執行官德博拉?特內斯對此表示擔憂,她指出:“當AI助手引用BBC文章內容時,超過十分之一的‘引文’被篡改或根本不存在于原文中。”這不僅影響了信息的準確性,更可能對讀者的認知產生誤導。
研究還發現AI助手在新聞總結過程中存在其他問題。它們難以區分事實與觀點,無法辨別新聞報道中的即時信息與歷史存檔信息,且在給出答案時容易摻入主觀觀點。特內斯強調:“這些AI工具所生成的結果往往問題重重,與消費者所期望的經過驗證的事實和清晰表述相去甚遠。”
值得注意的是,微軟的Copilot和谷歌的Gemini在處理新聞總結時表現出的問題更為復雜。與ChatGPT和Perplexity相比,它們在區分觀點與事實、編輯化處理以及遺漏關鍵背景信息方面表現欠佳。這一發現進一步凸顯了AI在新聞總結方面的局限性和挑戰。
實際上,AI工具的準確性問題并非僅限于新聞總結領域。近期,蘋果公司也因旗下Apple Intelligence通知工具分享錯誤標題而引發爭議,該功能因此被暫時停用,并受到新聞機構和自由團體的批評。這些事件再次提醒我們,AI技術在應用過程中仍需謹慎對待。
鑒于AI在新聞總結方面存在的問題,BBC呼吁在與AI服務提供商進行深入對話并找到解決方案之前,應暫停使用AI生成的新聞總結。特內斯表示:“我們希望通過合作,共同尋找解決之道,以確保信息的準確性和可靠性。”