英偉達今日正式揭曉,其DeepSeek-R1模型已在build.nvidia.com平臺上以NVIDIA NIM微服務的預覽形式亮相。這一創新服務在NVIDIA HGX H200系統上實現了驚人的性能,每秒可處理高達3,872個tokens,標志著AI處理能力的又一次飛躍。
據悉,開發人員現在即可通過該平臺測試和體驗全新的應用程序編程接口(API)。這一API預計很快將以可下載的NIM微服務形式推出,成為NVIDIA AI Enterprise軟件平臺的重要組成部分。通過這一平臺,英偉達正不斷推動AI技術的邊界,為企業和個人開發者提供更多可能性。
DeepSeek-R1 NIM微服務不僅簡化了部署流程,還通過支持行業標準API,進一步降低了技術門檻。企業可以在自己的加速計算基礎設施上運行NIM微服務,從而確保數據的安全性和隱私性。結合NVIDIA AI Foundry和NVIDIA NeMo軟件,企業還能為特定的AI代理定制專屬的DeepSeek-R1 NIM微服務,實現更加個性化和高效化的AI應用。
回顧過去,英偉達在2024年3月推出了NIM(Nvidia Inference Microservices)云原生微服務,旨在幫助各種規模的企業更便捷地部署AI服務。NIM微服務經過精心優化,旨在縮短產品上市時間,并簡化生成式AI模型在云、數據中心和GPU加速工作站等任何地點的部署過程。通過采用行業標準API,NIM微服務成功地將AI模型開發和生產包裝的復雜性抽象化,從而吸引了更多開發者加入這一領域。
英偉達的這一系列舉措不僅展示了其在AI技術領域的深厚積累,也彰顯了其致力于推動AI技術普及和發展的決心。隨著DeepSeek-R1 NIM微服務的推出,我們有理由相信,未來將有更多創新性的AI應用涌現,為人們的生活和工作帶來更多便利和可能性。