近日,國家超算互聯網平臺傳來消息,宣布將正式上線阿里巴巴開源推理模型QwQ-32B的API接口服務。據悉,用戶將有機會免費獲得100萬Tokens的使用額度。
QwQ-32B是阿里巴巴Qwen團隊最新研發的一款推理模型,其構建基礎為Qwen2.5-32B與強化學習的結合。根據官方發布的基準評測結果,QwQ-32B在數學能力測試AIME24評測集以及代碼能力評估LiveCodeBench中的表現,與DeepSeek-R1相當,甚至超越了o1-mini及同尺寸的R1蒸餾模型。
國家超算互聯網平臺迅速完成了對QwQ-32B的全面適配工作,包括基于vLLM和PyTorch的推理適配。平臺同步上線了QwQ-32B的模型鏡像和模型文件,用戶無需下載至本地,即可一鍵啟動Notebook功能,在平臺上進行QwQ-32B模型的開發,或引入專有數據進行進一步的私有化部署。
除了QwQ-32B模型API接口服務外,國家超算互聯網平臺近期還推出了DeepSeek-R1全家桶、最高671B滿血版的API部署與AI Web應用服務。這一系列的舉措,無疑為用戶提供了更為豐富和強大的AI模型選擇。
對于如何使用國家超算互聯網平臺的QwQ-32B API調用服務,平臺也給出了詳細的步驟指南。用戶只需在超算互聯網商城首頁搜索QwQ-32B,并點擊“去使用”按鈕,即可進入API接口信息頁面。在頁面中,用戶可以根據需求選擇訪問形式,包括使用Postman、Apifox等HTTP工具訪問,使用Python代碼訪問,以及在終端頁面直接訪問。
目前,國家超算互聯網平臺已經連接了國內14個省份的20多家超算和智算中心,平臺上提供了超過6500款算力商品,其中AI模型服務近240款。這些模型服務既包括了DeepSeek、Qwen等國內開源模型,也涵蓋了Llama、Stable Diffusion、Gemma等國外AI開源模型。用戶可以根據自己的需求,在平臺上選擇適合的AI模型進行使用。