站內搜索 | 手機版

智快網 - 新科技與新能源行業(yè)網絡媒體

當前位置：智快網 > 產業(yè) > 正文內容

美團DeepSeek R1模型INT8量化版發(fā)布，老顯卡也能暢享高效推理

發(fā)布時間：2025-03-08 20:13 來源：ITBEAR 作者：柳晴雪

美團技術團隊近期取得了一項重要進展，成功將DeepSeek R1模型進行了INT8精度量化，此舉極大地拓寬了該模型的應用場景。

此前，DeepSeek R1模型由于采用FP8數據格式的原生權重，導致其部署范圍受限，僅能在新款英偉達GPU上運行，而像A100這樣的老型號GPU則無法直接支持。這在一定程度上限制了模型的使用靈活性和推廣范圍。

為了打破這一局限，美團搜索和推薦平臺部門的技術人員著手對DeepSeek R1模型進行了INT8精度量化嘗試。經過不懈努力，他們發(fā)現量化后的模型在保持原有精度的基礎上，成功實現了在不同型號GPU上的部署。這意味著，現在DeepSeek R1模型不僅能夠在新款英偉達GPU上高效運行，還能在A100等老型號GPU上穩(wěn)定工作。

不僅如此，INT8量化還為DeepSeek R1模型帶來了性能上的顯著提升。與BF16相比，INT8量化后的模型在吞吐量方面實現了50%的增長，這大大降低了模型的推理成本，提高了整體運行效率。

為了讓更多開發(fā)者能夠受益于此項技術突破，美團技術團隊已經將INT8量化的代碼開源發(fā)布在LLM推理框架SGLang上。同時，量化后的DeepSeek R1模型也被上傳至Hugging Face社區(qū)，供廣大開發(fā)者下載和使用。以下是模型的具體鏈接：

模型鏈接1：https://huggingface.co/meituan/DeepSeek-R1-Block-INT8

模型鏈接2：https://huggingface.co/meituan/DeepSeek-R1-Channel-INT8

更多>同類內容

武漢天河機場凈空保護區(qū)劃定，55公里范圍內無人機禁飛！

03-08

DeepSeek火爆全球！AI應用排行榜緊追ChatGPT成亞軍

03-08

AMD RX 9070系列顯卡供貨緊張，公司回應將鼓勵零售商維持原價

03-08

《哪吒2》票房高歌猛進，全球動畫電影榜直逼《復聯3》！

03-08

林肯Z與冒險家“一口價”特惠，18.88萬起，性價比如何？

03-08

任天堂Switch 2曝光：支持NFC與Wi-Fi 6，更多細節(jié)即將揭曉？

03-08

小米10月新機曝光：將采用3D打印金屬中框，性能再升級？

03-08

小鵬“陸地航母”2026年量產，飛行汽車時代真要來了？

03-08

Dynabook新商務輕薄本Z40L-N：AI加持，安全時尚新選擇！

03-08

《貓貓的奇幻漂流》：票房破千萬，奧斯卡封王，動畫佳作引熱議！

03-08

宇樹G1人形機器人直播首秀，攜手Go2機器狗演繹未來生活新篇章

03-08

華為3月服務日六大福利來襲，你準備好了嗎？

03-08

理想汽車重申：所有車型均為自建工廠生產，力帆代工傳言不攻自破

03-08

《死亡擱淺2》實體版本多樣，預購即將啟動，何時能一探究竟？

03-08

微軟PowerToys UI大變身，Fluent設計讓Win11風格更統(tǒng)一

03-08

點擊查看更多 +

全站最新

蘋果新款Mac為何舍棄WiFi7？刀法精準還是策略考量？

蘋果新款Mac為何舍棄WiFi7？刀法精準還是策略考量？

華碩無畏18大屏核顯本德國上市，AMD R7 260處理器性能如何？

華碩無畏18大屏核顯本德國上市，AMD R7 260處理器性能如何？

韓俊透露：我國農業(yè)無人機超20萬架，科技助力農業(yè)高效發(fā)展

韓俊透露：我國農業(yè)無人機超20萬架，科技助力農業(yè)高效發(fā)展

機械革命無界15X Pro曝光：續(xù)航超15小時，無界14X Pro也將面世？

機械革命無界15X Pro曝光：續(xù)航超15小時，無界14X Pro也將面世？

武漢天河機場凈空保護區(qū)劃定，55公里范圍內無人機禁飛！

武漢天河機場凈空保護區(qū)劃定，55公里范圍內無人機禁飛！

比亞迪“靈鳶”智能車載無人機系統(tǒng)發(fā)布，大疆Air 3S定制版功能升級！

比亞迪“靈鳶”智能車載無人機系統(tǒng)發(fā)布，大疆Air 3S定制版功能升級！

iPhone 17 Pro Max機身增厚，電池容量提升，設計靈感源自小米11 Ultra？

iPhone 17 Pro Max機身增厚，電池容量提升，設計靈感源自小米11 Ultra？

DeepSeek火爆全球！AI應用排行榜緊追ChatGPT成亞軍

DeepSeek火爆全球！AI應用排行榜緊追ChatGPT成亞軍

熱門內容

本欄最新

武漢天河機場凈空保護區(qū)劃定，55公里范圍內無人機禁飛！

武漢天河機場凈空保護區(qū)劃定，55公里范圍內無人機禁飛！

DeepSeek火爆全球！AI應用排行榜緊追ChatGPT成亞軍

DeepSeek火爆全球！AI應用排行榜緊追ChatGPT成亞軍

AMD RX 9070系列顯卡供貨緊張，公司回應將鼓勵零售商維持原價

AMD RX 9070系列顯卡供貨緊張，公司回應將鼓勵零售商維持原價

《哪吒2》票房高歌猛進，全球動畫電影榜直逼《復聯3》！

《哪吒2》票房高歌猛進，全球動畫電影榜直逼《復聯3》！

林肯Z與冒險家“一口價”特惠，18.88萬起，性價比如何？

林肯Z與冒險家“一口價”特惠，18.88萬起，性價比如何？

任天堂Switch 2曝光：支持NFC與Wi-Fi 6，更多細節(jié)即將揭曉？

任天堂Switch 2曝光：支持NFC與Wi-Fi 6，更多細節(jié)即將揭曉？

小米10月新機曝光：將采用3D打印金屬中框，性能再升級？

小米10月新機曝光：將采用3D打印金屬中框，性能再升級？

小鵬“陸地航母”2026年量產，飛行汽車時代真要來了？

小鵬“陸地航母”2026年量產，飛行汽車時代真要來了？

智快實驗室評測約稿合作微信：netspread（注明:智快科技）簡體繁體根據客戶端智慧切換，如顯示有問題，請點擊頁面右上角的簡繁切換功能！
Copyright ? 2016-2021 zhikuai.com All rights reserved. 魯ICP備20033456號

微信群

微信掃一掃
加微信拉群
電動汽車群
科技數碼群

日韩精品一区二三区中文| 亚洲爆乳精品无码一区二区三区| 亚洲国产成人久久精品软件| 人妻熟妇乱又伦精品视频| 国产精品成人网站| 国内精品久久久久久野外| 999国内精品永久免费观看| 中文字幕久久精品| www好男人精品视频在线观看| 在线观看国产精品va| 国产成人精品怡红院| 99精品在线视频| 久久精品国产99国产精2020丨| 91麻豆精品国产自产在线观看亚洲| 日韩精品一区二区三区在线观看l| 国产精品国产三级国产av中文| 精品国产成人亚洲午夜福利| 在线中文字幕精品第5页| 日韩在线看片中文字幕不卡| 国产精品视频公开费视频| 国产精品亚洲产品一区二区三区 | 精品性高朝久久久久久久| 久久精品女人毛片国产| 久久精品国产亚洲一区二区三区| 日韩精品一卡2卡3卡4卡新区乱码日韩精品一线二线三线优势 | 一本久久A久久免费精品不卡 | 国产女主播精品大秀系列| 精品国产综合区久久久久久| 日韩国产精品99久久久久久| 日韩精品一区二区三区大桥未久| 日韩精品一区二区三区中文字幕 | 日韩视频在线精品视频免费观看| 久久久久亚洲精品无码蜜桃| 国产精品99久久免费观看| 一本久久a久久精品亚洲| 中文国产成人精品久久下载| 国产精品免费一区二区三区| 九九久久精品国产AV片国产| 免费视频精品一区二区| 国产日韩视频一区| 日韩一区二区精品观看|