上海交通大學近日宣布,該校已成功實現了DeepSeek全系列模型在昇騰Atlas 800T A2算力集群上的本地化部署,這一壯舉標志著該校成為國內首個完成千億級大模型全棧國產化部署的高等學府。此次部署覆蓋了DeepSeek系列中的多個核心模型,如DeepSeek-R1和DeepSeek-V3,它們將廣泛應用于教學、科研、管理以及服務等多個領域,為上海交通大學的人工智能基礎設施建設開啟了新的篇章。
此次成功的背后,離不開昇騰先進架構所提供的卓越性能以及原廠服務FAE的鼎力支持。這些關鍵因素共同為DeepSeek系列模型提供了強大的算力支撐。針對高校這一特殊應用場景,上海交通大學與昇騰攜手實現了三大技術上的重大突破:
首先,在輕量化推理架構方面,通過昇騰Ascend核間通信優化技術,僅使用4臺Atlas 800服務器便能承載DeepSeek-R1和DeepSeek-V3這兩個擁有千億參數的模型進行推理,硬件投入成本因此降低了65%。這一突破為高效利用資源、降低成本提供了有力保障。
其次,在動態資源調度方面,借助昇騰AI原生算力平臺,上海交通大學實現了針對不同應用場景的算力彈性分配。無論是教學、科研還是管理和服務場景,都能根據實際需求靈活調配算力資源,從而提高了資源利用率。
再者,在全棧自主可控方面,從昇騰處理器到MindSpore框架的深度適配,使得DeepSeek-V3在復雜數學推理任務中的端到端時延相比傳統方案有了顯著改善。這一突破進一步增強了模型在處理復雜任務時的效率和穩定性。
得益于華為昇騰的獨特優勢,DeepSeek系列模型在推理效率上得到了顯著提升,同時成本也大幅降低。2025年2月4日,DeepSeek-V3、DeepSeek-R1以及Janus-Pro正式登陸華為昇騰社區,用戶只需一鍵操作即可獲取這些先進的模型。
即日起,上海交通大學的師生們可通過網頁或APP申請體驗“滿血版”的DeepSeek系列模型,無需再擔心深度思考功能受限或對話提問無響應的問題。同時,上海交通大學鯤鵬昇騰科教創新卓越中心也將積極推動DeepSeek系列模型與課程設計、科研創新等方面的深度融合,探索在AI技術加持下的全新學習與科研范式。
作為基于鯤鵬昇騰技術路線的校級生態合作平臺,鯤鵬昇騰科教創新卓越中心在校企合作、產教融合方面發揮著舉足輕重的作用。該卓越中心將持續推動DeepSeek等重要AI創新成果在高校領域的落地應用,進一步將人工智能技術融入師生們的日常生活、學習和科研之中,引領他們勇攀世界科技高峰。