近期,據國外媒體報道,DeepSeek AI因其高效的訓練效率而備受矚目。與Open AI的ChatGPT及其他機器學習平臺相比,DeepSeek AI在過去一周內人氣急劇上升。
技術行業分析師Ben Thompson在其網站Stratechery上發布的報告中指出,DeepSeek AI的設計雖面臨諸多限制,但這些限制卻激發了機器學習計算能力上的創新。DeepSeek由一家位于中國的初創公司開發,而該公司因貿易禁運無法獲取美國Nvidia公司生產的高質量半導體芯片。面對這一困境,DeepSeek的開發團隊采用了多種人工智能優化技術,使得他們的機器學習平臺在性價比上實現了顯著提升。
據斯坦福大學2024年人工智能指數報告顯示,DeepSeek的開發團隊聲稱,其最新版本的AI訓練成本僅為560萬美元,相比之下,ChatGPT 4的訓練成本高達7800萬美元,而谷歌的Gemini Ultra更是達到了1.91億美元。這一數據無疑彰顯了DeepSeek在降低訓練成本方面的顯著成就。
華盛頓大學圣路易斯分校的科學家和消費者也將從這一成本降低中受益。計算機科學與工程助理教授烏馬爾·伊克巴爾表示,他的實驗室在使用這些平臺時需要花費數萬美元,而中國初創公司的競爭有望降低這一價格。
Stratechery的文章中提到,DeepSeek降低訓練成本的一個關鍵方法是蒸餾。他們利用像ChatGPT這樣的成熟生成式AI系統來“教導”自己的系統如何完成工作。McKelvey Engineering的博士生也嘗試了這種方法來改進大型語言模型,且無需額外的訓練。
“要讓技術得到大規模采用,它們必須價格低廉。”伊克巴爾強調,“這表明使用模型可以變得非常便宜。”他還表示,這將使得他們能夠進行更多大規模的實驗。
然而,伊克巴爾也指出了DeepSeek等人工智能平臺存在的潛在問題。他主要研究的課題是互聯網安全和隱私,他警告說,運行這些模型需要訪問大型硬件,而數據在傳輸到云端的人工智能機器上時,用戶可能會失去對數據的控制。這是一個非常嚴重的問題。
伊克巴爾進一步指出,人工智能系統可以構建龐大的監控基礎設施,其中一些已經以搜索引擎的形式存在,追蹤來自整個網絡的用戶數據,以促進電子商務。所有這些數據都會被發送給不同的人工智能供應商,他們可以利用這些信息來分析用戶、推斷興趣、監視甚至影響用戶。
另一個令人擔憂的趨勢是人工智能語言模型越來越多地融入移動應用。例如,人工智能在規劃假期方面的應用越來越廣泛。當人工智能使用各種應用程序來完成這項任務時,如果存在惡意軟件,它就有可能從用戶那里收集更多的數據并操縱人工智能尋求的結果。
“當這些技術具有巨大潛力時,它們會發展得非常快。”伊克巴爾說,“你需要在設計中埋設護欄和保護措施。而當前的人工智能系統卻沒有做到這一點。”