智快網 - 新科技與新能源行業(yè)網絡媒體

          美團DeepSeek R1模型INT8量化版發(fā)布,老顯卡也能暢享高效推理

             發(fā)布時間:2025-03-08 20:13 作者:柳晴雪

          美團技術團隊近期取得了一項重要進展,成功將DeepSeek R1模型進行了INT8精度量化,此舉極大地拓寬了該模型的應用場景。

          此前,DeepSeek R1模型由于采用FP8數據格式的原生權重,導致其部署范圍受限,僅能在新款英偉達GPU上運行,而像A100這樣的老型號GPU則無法直接支持。這在一定程度上限制了模型的使用靈活性和推廣范圍。

          為了打破這一局限,美團搜索和推薦平臺部門的技術人員著手對DeepSeek R1模型進行了INT8精度量化嘗試。經過不懈努力,他們發(fā)現量化后的模型在保持原有精度的基礎上,成功實現了在不同型號GPU上的部署。這意味著,現在DeepSeek R1模型不僅能夠在新款英偉達GPU上高效運行,還能在A100等老型號GPU上穩(wěn)定工作。

          不僅如此,INT8量化還為DeepSeek R1模型帶來了性能上的顯著提升。與BF16相比,INT8量化后的模型在吞吐量方面實現了50%的增長,這大大降低了模型的推理成本,提高了整體運行效率。

          為了讓更多開發(fā)者能夠受益于此項技術突破,美團技術團隊已經將INT8量化的代碼開源發(fā)布在LLM推理框架SGLang上。同時,量化后的DeepSeek R1模型也被上傳至Hugging Face社區(qū),供廣大開發(fā)者下載和使用。以下是模型的具體鏈接:

          模型鏈接1:https://huggingface.co/meituan/DeepSeek-R1-Block-INT8

          模型鏈接2:https://huggingface.co/meituan/DeepSeek-R1-Channel-INT8

           
           
          更多>同類內容
          全站最新
          熱門內容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數碼群

          日韩精品一区二三区中文| 亚洲爆乳精品无码一区二区三区| 亚洲国产成人久久精品软件| 人妻熟妇乱又伦精品视频| 国产精品成人网站| 国内精品久久久久久野外| 999国内精品永久免费观看| 中文字幕久久精品| www好男人精品视频在线观看| 在线观看国产精品va| 国产成人精品怡红院| 99精品在线视频| 久久精品国产99国产精2020丨| 91麻豆精品国产自产在线观看亚洲| 日韩精品一区二区三区在线观看l| 国产精品国产三级国产av中文| 精品国产成人亚洲午夜福利| 在线中文字幕精品第5页| 日韩在线看片中文字幕不卡| 国产精品视频公开费视频| 国产精品亚洲产品一区二区三区 | 精品性高朝久久久久久久| 久久精品女人毛片国产| 久久精品国产亚洲一区二区三区| 日韩精品一卡2卡3卡4卡新区乱码 日韩精品一线二线三线优势 | 一本久久A久久免费精品不卡 | 国产女主播精品大秀系列| 精品国产综合区久久久久久| 日韩国产精品99久久久久久| 日韩精品一区二区三区大桥未久| 日韩精品一区二区三区中文字幕 | 日韩视频在线精品视频免费观看| 久久久久亚洲精品无码蜜桃| 国产精品99久久免费观看| 一本久久a久久精品亚洲| 中文国产成人精品久久下载| 国产精品免费一区二区三区| 九九久久精品国产AV片国产| 免费视频精品一区二区| 国产日韩视频一区| 日韩一区二区精品观看|