近日,北京市商湯科技開(kāi)發(fā)有限公司發(fā)布了一則重要通知,宣布其企業(yè)客戶(hù)與開(kāi)發(fā)者能夠通過(guò)商湯大裝置萬(wàn)象平臺(tái)迅速部署DeepSeek-V3、DeepSeek-R1等一系列先進(jìn)模型。這些用戶(hù)還將享受到一項(xiàng)特別福利:在三個(gè)月內(nèi),他們將獲得高達(dá)1000萬(wàn)tokens的免費(fèi)使用權(quán)。
商湯大裝置此次的升級(jí)服務(wù)尤為引人注目。該公司依托其強(qiáng)大的技術(shù)平臺(tái)和專(zhuān)家資源,構(gòu)建了一個(gè)從“場(chǎng)景定義”到“訓(xùn)練”、“部署”再到“迭代”的全方位閉環(huán)服務(wù)體系。這一體系旨在更好地滿(mǎn)足企業(yè)客戶(hù)的多樣化需求。
對(duì)于追求輕量化模型定制的企業(yè)而言,商湯大裝置提供了基于場(chǎng)景強(qiáng)化學(xué)習(xí)的解決方案。這一方案能夠在特定場(chǎng)景下對(duì)基模型進(jìn)行提升,并支持將其蒸餾到小模型中,從而實(shí)現(xiàn)高效推理。這無(wú)疑為企業(yè)帶來(lái)了更加靈活和高效的模型應(yīng)用選擇。
對(duì)于有私有化需求的企業(yè),商湯大裝置同樣提供了全面的綜合解決方案。該方案涵蓋了模型定制、模型開(kāi)發(fā)平臺(tái)以及Agent應(yīng)用開(kāi)發(fā)平臺(tái)三大核心模塊,能夠適配多種國(guó)產(chǎn)化硬件,并提供從開(kāi)發(fā)到部署的全鏈路支持。這為企業(yè)客戶(hù)在數(shù)據(jù)安全與自主可控方面提供了強(qiáng)有力的保障。
在部署方式上,商湯大裝置同樣展現(xiàn)出了極高的靈活性和兼容性。它支持公有云、私有化以及一體機(jī)等多種部署方式,能夠滿(mǎn)足不同企業(yè)的實(shí)際需求。在硬件層面,商湯大裝置兼容英偉達(dá)與國(guó)產(chǎn)異構(gòu)芯片,通過(guò)軟硬件的深度協(xié)同優(yōu)化,實(shí)現(xiàn)了多種芯片的高效混合部署和流量智能分發(fā)。
在推理層面,商湯大裝置支持多款主流推理引擎,并對(duì)緩存進(jìn)行了針對(duì)性的加速優(yōu)化。官方還計(jì)劃在未來(lái)推出PD(Prefill-Decode)分離式推理架構(gòu)。這一架構(gòu)將計(jì)算任務(wù)智能拆分,并分別調(diào)度至最適合的算力單元執(zhí)行,從而進(jìn)一步提升能效比。
商湯大裝置還支持包括商湯“日日新”融合大模型SenseNova、DeepSeek、Qwen、Llama等在內(nèi)的多款大模型。這一舉措將為企業(yè)客戶(hù)提供更加豐富和多樣的模型選擇,助力他們?cè)诟髯灶I(lǐng)域取得更加卓越的成績(jī)。