阿里云團隊近期公布了一項重大進展,正式向公眾開源了其最新的推理模型——通義千問 QwQ-32B。緊隨其后,摩爾線程智能科技(北京)股份有限公司迅速宣布,在該模型發布后不久,便成功實現了對其的支持。
摩爾線程官方詳細介紹稱,他們利用自主研發的大語言模型高速推理框架 vLLM 和 MT Transformer 推理引擎,成功部署了 QwQ-32B。在實際應用中,該模型展現出了出色的推理性能和高度穩定性。這一成果不僅彰顯了摩爾線程在 AI 模型支持方面的技術實力,也進一步驗證了其 MUSA 架構和全功能 GPU 在生態兼容與快速響應方面的獨特優勢。
為了讓更多用戶能夠體驗到這一先進技術,摩爾線程將 QwQ-32B 模型開放上線至其模型廣場“夸娥工場”。用戶只需訪問指定網址,即可輕松體驗這一高性能推理模型。這一舉措無疑將極大地推動 AI 技術在更多領域的應用和發展。
據摩爾線程官方提供的體驗地址顯示,夸娥工場體驗地址為:https://playground.mthreads.com,而 QwQ-32B 的專屬體驗地址則為:https://playground.mthreads.com:12019。通過這些平臺,用戶可以深入了解并體驗 QwQ-32B 模型的強大功能。
早前,阿里云通義千問官方曾透露,QwQ-32B 是一款擁有 320 億參數的推理模型。盡管其參數量相對較少,但其性能卻足以與擁有 6710 億參數(其中 370 億被激活)的 DeepSeek-R1 相媲美。這一數據無疑令人驚嘆,也進一步證明了阿里云在 AI 技術領域的深厚積累和創新能力。
隨著 QwQ-32B 模型的開源和摩爾線程的快速支持,我們有理由相信,這一高性能推理模型將在未來在更多領域發揮重要作用,推動 AI 技術的不斷發展和創新。