近期,DeepSeek在全球范圍內(nèi)的熱度持續(xù)攀升,引發(fā)廣泛關(guān)注。上海超算計算中心攜手上海昇騰人工智能創(chuàng)新中心,成功在其依托的昇騰硬件上部署了DeepSeek大模型,這一舉措為行業(yè)市場帶來了全方位的強(qiáng)大支持,依托于上海市人工智能公共算力服務(wù)平臺。
在模型部署方面,DeepSeek推出了兩款重量級模型——DeepSeek-R1-Distill-Qwen-32與Janus-Pro-7B。前者專注于復(fù)雜推理任務(wù),通過先進(jìn)的蒸餾技術(shù),模型體積大幅縮減,同時保持了高質(zhì)量的推理能力。其靈活性與適用性顯著增強(qiáng),能夠以更加合理的資源占用,為自然語言處理、智能推薦系統(tǒng)等應(yīng)用場景提供高效、精準(zhǔn)的服務(wù)。這款模型能夠迅速應(yīng)對各類復(fù)雜任務(wù),充分滿足了不同行業(yè)對于復(fù)雜推理的嚴(yán)苛需求。
而Janus-Pro-7B作為DeepSeek推出的前沿多模態(tài)理解和生成模型,在圖像理解與生成方面展現(xiàn)出了卓越的性能。該模型采用了獨(dú)特的獨(dú)立編碼方法,直接利用文本到圖像數(shù)據(jù)進(jìn)行訓(xùn)練,并引入了合成美學(xué)數(shù)據(jù),進(jìn)一步提升了圖像生成的質(zhì)量。無論是從文本生成圖像,還是理解圖片并生成精準(zhǔn)描述,Janus-Pro-7B都能表現(xiàn)出色。盡管在圖像分辨率方面存在一定的局限,但在近景、特寫等特定場景下,其優(yōu)勢尤為明顯。
在部署方式上,DeepSeek采用了區(qū)域本地化部署策略,充分利用本地服務(wù)器資源,不依賴云服務(wù)。這一舉措為企業(yè)提供了DeepSeek-R1和Janus-Pro兩款模型的接口調(diào)用服務(wù),實現(xiàn)了開箱即用,極大地提高了企業(yè)的運(yùn)營效率,并滿足了其個性化業(yè)務(wù)場景的需求。
上海市人工智能公共算力服務(wù)平臺作為貫徹落實國家戰(zhàn)略、加快實施“東數(shù)西算”工程、深化發(fā)展數(shù)字經(jīng)濟(jì)的重要舉措,由上海超級計算中心負(fù)責(zé)建設(shè)和運(yùn)營。該平臺致力于為廣大科研機(jī)構(gòu)和中小企業(yè)提供具有公信力的普惠算力服務(wù),全部采用昇騰AI軟硬件平臺,計算峰值能力高達(dá)100PFLOPS(FP16)。這一平臺的建立,為科研探索與產(chǎn)業(yè)創(chuàng)新領(lǐng)域提供了強(qiáng)大的算力底座與模型支持。