智快網 - 新科技與新能源行業網絡媒體

          醫學AI模型易“中毒”?0.001%錯誤信息足以影響準確性

             發布時間:2025-01-14 17:58 作者:柳晴雪

          紐約大學近期公布的一項研究,揭示了大型語言模型(LLM)在接收醫學領域訓練數據時面臨的潛在風險。研究顯示,即便訓練數據中僅混入極少量(0.001%)的錯誤信息,也可能導致LLM輸出不準確的醫學答案,這一發現引起了廣泛關注。

          研究團隊還深入探究了錯誤信息的最低影響閾值。以疫苗錯誤信息為例,當錯誤信息僅占訓練數據的0.01%時,模型生成的答案中超過10%包含錯誤信息;即便錯誤信息比例降至0.001%,仍有超過7%的答案是有害的。研究指出,對于擁有700億參數的LLaMA 2模型,進行類似的攻擊僅需生成4萬篇文章(成本不到100美元)。這些“文章”可以是普通的網頁,錯誤信息可以隱藏在網頁的不可見區域,或者通過隱藏文本(如黑色背景上的黑色文字)來實現。

          研究同時指出,現有的錯誤信息問題同樣嚴峻。許多非專業人士傾向于從通用的LLM中獲取醫學信息,而這些模型往往基于整個互聯網進行訓練,其中包含大量未經核實的錯誤信息。為了應對這一問題,研究人員設計了一種算法,能夠識別LLM輸出中的醫學術語,并與經過驗證的生物醫學知識圖譜進行比對,從而標記出無法驗證的短語。盡管這種方法未能捕捉到所有醫學錯誤信息,但成功標記了其中的大部分。

          然而,即便是最優質的醫學數據庫(如PubMed)也未能幸免于錯誤信息的問題。醫學研究文獻中充斥著未能驗證的理論和已被淘汰的治療方法。研究進一步表明,即便依賴最優質的醫學數據庫進行訓練,也無法確保LLM完全免受錯誤信息的影響。醫學領域的復雜性和多樣性使得構建一個始終可靠的醫學LLM變得異常艱難。

          研究還強調了錯誤信息在LLM訓練中的隱蔽性和持久性。一旦錯誤信息被模型學習并固化,就很難通過后續的更新或修正來完全消除。這要求我們在構建和訓練LLM時,必須更加謹慎地選擇和審核訓練數據,以確保模型的準確性和可靠性。

          總之,紐約大學的這項研究為我們敲響了警鐘,提醒我們在利用LLM進行醫學信息傳播和決策支持時,必須保持高度的警惕和審慎。

           
           
          更多>同類內容
          全站最新
          熱門內容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數碼群

          国产精品av一区二区三区不卡蜜| 国产精品国产三级国产专播| 日韩成人在线免费视频| 亚洲精品无码久久| 精品无码一区二区三区亚洲桃色| 中文字幕精品一区二区精品| 日本Aⅴ大伊香蕉精品视频| 91福利精品老师国产自产在线| 国内精品久久久久影院网站| 在线精品日韩一区二区三区| 国产精品宅男在线观看| 亚洲A∨精品一区二区三区下载| 777国产偷窥盗摄精品品在线| 国99精品无码一区二区三区| 国精品产露脸自拍| 亚洲精品麻豆av| 五月天精品视频在线观看| 精品综合久久久久久888蜜芽| 国产精品久线在线观看| 老司机精品免费视频| 国产A√精品区二区三区四区 | 日韩一区二区三区在线| 国产a不卡片精品免费观看| 国产精品成人免费视频网站京东 | 久久er99热精品一区二区| 久99久精品免费视频热77| 久久免费精品视频| 亚洲精品高清无码视频| 国产亚洲精品福利在线无卡一| 精品国产午夜肉伦伦影院| 国产成人高清精品一区二区三区 | 精品国产麻豆免费人成网站| 国产亚洲精品不卡在线| 久久99精品久久久久久9蜜桃 | 日韩人妻潮喷中文在线视频| 日韩人妻无码一区二区三区综合部| 国产精品爽爽va在线观看无码| 精品久久久无码中文字幕边打电话| 久久精品免费一区二区喷潮| 久久久久久久99精品国产片| 久久精品国产亚洲一区二区|