近期,DeepSeek R1在全國范圍內迅速走紅,從智能手機應用到新能源汽車,眾多產品紛紛接入這一技術。對于內容編輯而言,DeepSeek R1無疑是一個強大的助手,從大綱制定到內容審閱,都能大幅提升工作效率。然而,官方滿血版的DeepSeek R1雖然功能強大,但頻繁掉線的問題讓人頭疼,平均每小時僅能穩定使用一次。第三方滿血版雖然掉線較少,但用戶對于上傳隱私或保密數據至云端仍心存顧慮。
鑒于上述情況,不少用戶開始考慮自行搭建DeepSeek R1。然而,滿血版DeepSeek R1模型體積龐大,達到了404GB,遠遠超出了普通消費級顯卡的顯存容量。即便是32B的蒸餾模型,也需要20GB的顯存空間。這對顯卡性能提出了極高的要求,例如,擁有32GB顯存的英偉達RTX 5090 D公版顯卡,官方售價高達16999元,而實際購買成本往往還要高出萬元。
面對高昂的硬件成本,用戶開始探索經濟實惠且高效的解決方案。多顯卡協同工作成為了一個不錯的選擇,但AMD新顯卡已不再支持交火,英偉達SLI技術也不支持顯存疊加。幸運的是,Intel的Arc顯卡不僅支持交火,而且顯存可以疊加,價格也相對親民。兩張Arc A770 16GB顯卡的價格大約在3600元左右,即可獲得32GB的顯存。本次測試選擇了兩張藍戟Intel Arc A770 Photon 16G OC顯卡進行交火,以部署DeepSeek R1的32B蒸餾模型。
藍戟Intel Arc A770顯卡分為8GB和16GB兩個版本,本次選擇的16GB版本配備了GDDR6顯存,顯存帶寬高達512GB/s,擁有32個Xe核心,最高頻率可達2400Mhz。由于采用雙卡方案,主板和電源的配置也需特別注意。主板需至少具備兩個PCIe顯卡插槽,且每個插槽需支持PCIe 4.0 x8傳輸速率。電源方面,單張藍戟Intel Arc A770 Photon 16G OC的TBP為285W,兩張顯卡總功耗接近600W。因此,選擇了海韻1300W電源進行測試,該電源不僅能滿足功率需求,還能提供兩張顯卡所需的4個PCIe 8Pin接口。模型部署方面,選擇使用IPEX-LLM工具在Linux系統上運行,相比Windows系統,Linux系統的運行效率更高。
搭建完成后,通過另一臺電腦在局域網內訪問后端進行測試。在測試過程中,盡量避免對測試電腦進行截圖或錄屏操作,以減少對GPU資源的占用。
在性能與效果方面,本次測試使用了32B模型,要求模型編寫一個包含特定功能的HTML貪吃蛇游戲。模型迅速生成了代碼,兩張Arc A770顯卡的風扇全力運轉,后端顯示平均生成吞吐量穩定在26 tokens/s以上。相比之下,單張RTX 5090 D運行32B模型的性能約為46 tokens/s,而本次測試以不到兩成的價格獲得了五成以上的性能,表現令人驚喜。
生成的HTML貪吃蛇游戲可以直接預覽運行,但在實際操作中發現,使用上下方向鍵會滾動網頁,影響了游戲體驗。因此,要求模型對代碼進行修改,用A、S、D、W鍵代替方向鍵。DeepSeek R1準確理解了需求,并成功完成了修改。隨后,又要求生成更為復雜的俄羅斯方塊HTML代碼,雖然參數量僅為32B,但DeepSeek R1生成的游戲幾乎無Bug,表現同樣出色。
在邏輯能力測試方面,選擇了兩個問題對雙A770搭建的DeepSeek R1進行測試。對于“神父去世是離職還是升職?”這一令人一愣的問題,32B的DeepSeek R1能從現實與信仰兩種角度出發給出分析與解釋,展現出強大的邏輯能力。而對于“變形金剛應該交車險還是人險?”這一二選一的提問,DeepSeek R1并沒有死板地做出選擇,而是理解了變形金剛不同形態的特征,給出了兩種保險都買的絕佳答案。