在人工智能與邊緣計算的交匯點上,微軟近日邁出了重要一步,宣布推出專為NPU(神經處理單元)優化的DeepSeek-R1模型。這一創新之舉不僅標志著微軟對邊緣計算潛力的深刻洞察,也預示著搭載高通驍龍X芯片的Copilot+ PC將率先迎來一場技術革命,隨后英特爾酷睿Ultra 200V等平臺也將陸續加入這一行列。
微軟通過官方渠道宣布,DeepSeek-R1的首個版本——DeepSeek-R1-Distill-Qwen-1.5B,已正式入駐Azure AI Foundry和GitHub,供開發者下載使用。同時,微軟還透露,參數規模更大的7B和14B版本也即將面世,這將極大地助力開發者充分挖掘Copilot+ PC中NPU的強大性能。
微軟強調,Copilot+ PC上的NPU開創了一種全新的AI應用范式。在這一范式下,生成式AI不僅能夠在被調用時迅速響應,還能支持半連續運行的服務模式。這一特性使得開發者能夠利用AI推理引擎,構建出更加主動、持續的用戶體驗。
為了實現這一目標,微軟在Phi Silica項目的基礎上,積累了豐富的推理優化經驗和技術。這些經驗和技術被巧妙地融入到針對NPU優化的DeepSeek模型中,包括模型分割以實現性能與效率的最佳平衡、低比特率量化以及Transformer模型到NPU的映射等。微軟還借助Windows Copilot Runtime(WCR)和ONNX QDQ格式,在多樣化的Windows生態系統中實現了模型的廣泛部署。
為了讓更多開發者能夠輕松體驗DeepSeek模型的魅力,微軟提供了便捷的下載途徑。只需在Visual Studio Code中安裝AI Toolkit擴展,開發者即可輕松獲取這一創新成果。同時,以ONNX QDQ格式優化的DeepSeek模型也將很快出現在AI Toolkit的模型目錄中,供開發者直接從Azure AI Foundry中拉取使用。
微軟還通過實例展示了原始模型與NPU優化模型之間的差異。在相同的提示下,原始模型和NPU優化模型給出了略有不同的響應。這一對比不僅彰顯了NPU優化模型在推理能力上的提升,也進一步驗證了微軟在模型優化方面的深厚實力。