近日,基調聽云,一家在可觀測性與應用安全領域占據領先地位的公司,正式公布了其針對DeepSeek-R1推理大模型API服務的首期性能評測報告。這份報告深度剖析了多家提供DeepSeek-R1 API服務的供應商,為開發者和最終用戶提供了寶貴的決策依據。
自DeepSeek-R1推理大模型于今年1月20日面世以來,其強大的邏輯推理能力迅速吸引了全球范圍內的廣泛關注。然而,隨著用戶數量的急劇增長,官方服務頻繁遭遇報錯和服務器繁忙等問題。面對這一挑戰,多家第三方服務商適時推出了相關服務,從而加劇了市場競爭。
為了全面評估這些服務的性能,基調聽云利用其先進的撥測工具,模擬真實用戶行為進行了主動監控。測試覆蓋了網絡性能、接口響應時間、推理速度、內容生成速度等多個核心指標,并綜合考慮了城市、運營商、主機和時間等多個維度,以確保評測結果的準確性和可靠性。
評測結果顯示,在參與評測的火山引擎、DeepSeek官方、硅基流動、騰訊云、阿里云百煉等廠商中,火山引擎的表現尤為搶眼。其API響應性能全面領先,平均速度、推理速度和生成速度均位居榜首,可用性高達99.83%,成為API接入的首選。相比之下,DeepSeek官方雖然在推理速度上表現不俗,但首Token延遲高達7.753秒,且可用性僅為42.21%,成為其明顯短板。硅基流動的首Token響應速度快且可用性穩定,但平均速度相對較弱。騰訊云的整體性能較低,總性能最差,且可用性一般。阿里云百煉的平均速度最慢,首包時間最長,但可用性尚可。
進一步從城市維度分析,火山引擎在北京、上海、廣州、深圳、蘇州、成都、重慶、武漢、杭州等城市測試中均保持了最高性能。DeepSeek官方在重慶的首Token時間最長,而在其他城市則均在9秒以內。硅基流動的可用性在廣州表現最差,但在其他城市均保持在98%以上。從運營商維度來看,DeepSeek官方在中國移動網絡下的建連時間較長,而在其他運營商網絡下均在0.05秒以內。其余服務商的指標未見明顯差異。在主機維度上,騰訊云擁有數量最多、分布最廣的主機,而DeepSeek官方的主機數量最少。從時間維度來看,不同時段各服務商的表現各異,整體受到用戶流量和服務器負載的影響。
此次評測不僅為開發者和企業用戶提供了詳實的數據支撐,有助于其科學選擇服務商并優化產品體驗,還為普通用戶整理了支持DeepSeek-R1的第三方服務及相關網站信息。這些信息涵蓋了免費和付費模式,方便用戶根據自身需求進行選擇?;{聽云還預告正在對網頁版本的DeepSeek-R1服務進行評測,并計劃后續發布相關評測結果。