站內搜索 | 手機版

智快網 - 新科技與新能源行業網絡媒體

當前位置：智快網 > 行業 > 正文內容

美團INT8量化技術：老型號GPU也能滿血運行DeepSeek R1

發布時間：2025-03-07 19:25 來源：ITBEAR 作者：楊凌霄

近期，美團技術團隊傳來新進展，他們成功對DeepSeek R1模型實施了INT8精度量化處理，此舉意味著該模型將不再受限于特定型號的GPU，能夠在更多設備上實現高效部署。

自DeepSeek R1發布以來，眾多企業和個人用戶紛紛嘗試部署其滿血版本。然而，該模型原生版本的權重格式為FP8，這一格式對GPU芯片類型有著嚴格要求，僅支持英偉達的新型GPU，如Ada和Hopper架構芯片，而像A100這樣的老型號GPU則無法直接部署。

面對這一挑戰，用戶曾嘗試將FP8權重反量化為BF16權重，以便在A100等GPU上進行推理。然而，這種方法不僅將顯存需求提升了一倍，還導致了推理吞吐量的下降。這顯然不是最優解。

為了打破這一僵局，美團搜索和推薦平臺部技術團隊決定對DeepSeek R1模型進行INT8精度量化嘗試。經過努力，他們驚喜地發現，量化后的模型在精度上幾乎沒有損失。這一發現為DeepSeek R1的廣泛應用打開了新的大門。

通過INT8量化，DeepSeek R1模型成功解鎖了芯片限制，現在可以在A100等其他型號的GPU上部署。與BF16格式相比，INT8量化后的模型在推理吞吐量上實現了50%的提升，進一步降低了推理成本。這對于那些希望在不同硬件環境中部署DeepSeek R1的用戶來說，無疑是一個重大利好。

美團技術團隊已經將量化代碼開源到了LLM推理框架SGLang上，供行業內外人士參考和使用。同時，量化后的DeepSeek R1模型也已經在Hugging Face社區發布，用戶可以直接下載和使用。這一舉措無疑將促進DeepSeek R1模型的廣泛應用和進一步發展。

對于對DeepSeek R1模型量化過程感興趣的用戶，可以查閱美團官方發布的技術報告，以獲取更詳細的信息和了解背后的技術原理。

更多>同類內容

2025款小鵬G9大升級：5C超充AI電池+極致續航，安全性能再突破！

03-07

2月全球手游市場，中國廠商攬金近19億美元，誰領風騷？

03-07

華碩ProArt創16 2024：AI專業創作本，助力創意工作事半功倍！

03-07

Manus AI爆火，市場上同名代幣卻無關團隊？真相揭曉

03-07

2025款上汽大通G50混動MPV預售，1.5L插混+85km續航，僅售15.28萬！

03-07

大眾ID.Every1概念車亮相，廉價小車新選擇，能否進軍中國市場？

03-06

賽博風拉滿！超頻三北境GT360一體式水冷散熱器圖賞來襲

03-06

英特爾代工虧損70億指控遭法院駁回，股東訴訟路在何方？

03-06

滬昆高速變身“智慧路”！江西交投與華為共筑一體化高速新未來

03-06

小米米家循環扇新品上市，100擋風速+智能控，僅售299元！

03-06

廣汽傳祺向往S7預售在即，高端配置曝光：10氣囊+3K吸頂屏，科技感爆棚！

03-05

銘凡NAB9 PLUS迷你主機升級上市，i9處理器僅售2299元起！

03-05

華為首推AI原生核心網，引領萬物智聯向萬智智聯跨越

03-05

智能眼鏡市場爆發式增長，2025年出貨量將超375萬副，小米入局引期待

03-05

vivo OS部門重組，AI領域新設，大模型訓練重心轉向端側

03-05

點擊查看更多 +

全站最新

努比亞Flip 2小折疊新機亮相：AI萌寵、雙屏預覽，售價2899元起！

努比亞Flip 2小折疊新機亮相：AI萌寵、雙屏預覽，售價2899元起！

2025學習機精選榜單！學而思等哪款才是孩子的智慧之選？

2025學習機精選榜單！學而思等哪款才是孩子的智慧之選？

2025手機國補大戰，蘋果16對戰華為Mate70，誰是性價比之王？

2025手機國補大戰，蘋果16對戰華為Mate70，誰是性價比之王？

本田中國2月銷量大跌，新能源汽車轉型慢成主因？

本田中國2月銷量大跌，新能源汽車轉型慢成主因？

M4 MacBook Air性能大爆發，逼近MacBook Pro實力水平？

M4 MacBook Air性能大爆發，逼近MacBook Pro實力水平？

大朋AI眼鏡來襲，能否成為智能生活新寵？

大朋AI眼鏡來襲，能否成為智能生活新寵？

英國玩家有福！索尼PlayStation推出PS5等設備月租計劃

英國玩家有福！索尼PlayStation推出PS5等設備月租計劃

影馳RTX 5070 FIRE顯卡開箱：暗黑機械風，小機箱玩家的輕薄新選擇

影馳RTX 5070 FIRE顯卡開箱：暗黑機械風，小機箱玩家的輕薄新選擇

熱門內容

本欄最新

2025款小鵬G9大升級：5C超充AI電池+極致續航，安全性能再突破！

2025款小鵬G9大升級：5C超充AI電池+極致續航，安全性能再突破！

2月全球手游市場，中國廠商攬金近19億美元，誰領風騷？

2月全球手游市場，中國廠商攬金近19億美元，誰領風騷？

華碩ProArt創16 2024：AI專業創作本，助力創意工作事半功倍！

華碩ProArt創16 2024：AI專業創作本，助力創意工作事半功倍！

Manus AI爆火，市場上同名代幣卻無關團隊？真相揭曉

Manus AI爆火，市場上同名代幣卻無關團隊？真相揭曉

2025款上汽大通G50混動MPV預售，1.5L插混+85km續航，僅售15.28萬！

2025款上汽大通G50混動MPV預售，1.5L插混+85km續航，僅售15.28萬！

大眾ID.Every1概念車亮相，廉價小車新選擇，能否進軍中國市場？

大眾ID.Every1概念車亮相，廉價小車新選擇，能否進軍中國市場？

賽博風拉滿！超頻三北境GT360一體式水冷散熱器圖賞來襲

賽博風拉滿！超頻三北境GT360一體式水冷散熱器圖賞來襲

英特爾代工虧損70億指控遭法院駁回，股東訴訟路在何方？

英特爾代工虧損70億指控遭法院駁回，股東訴訟路在何方？

智快實驗室評測約稿合作微信：netspread（注明:智快科技）簡體繁體根據客戶端智慧切換，如顯示有問題，請點擊頁面右上角的簡繁切換功能！
Copyright ? 2016-2021 zhikuai.com All rights reserved. 魯ICP備20033456號

微信群

微信掃一掃
加微信拉群
電動汽車群
科技數碼群

久久精品一品道久久精品9| 日韩免费无码视频一区二区三区 | 久久永久免费人妻精品| 九九久久国产精品| 免费久久精品国产片香蕉| 在线精品自偷自拍无码中文| 久久精品人人做人人爽电影蜜月 | 久久99国产精品99久久| 国产精品女同一区二区久久| 亚洲欧洲国产日韩精品| 日本精品3d动漫一区二区| 91精品国产免费久久久久久青草| 亚洲国产精品一区二区久久| 亚洲精品你懂的在线观看| 黑人无码精品又粗又大又长 | 四虎国产精品成人| 中文字幕日韩精品有码视频| 国内精品福利视频| 亚洲av永久中文无码精品| 69pao精品视频在线观看| 精品人妻中文av一区二区三区| 久久精品99国产精品日本| 国产精品亚洲片在线观看不卡| 国产视频精品免费视频| 亚洲国产婷婷综合在线精品| 日韩在线看片中文字幕不卡| 日韩内射美女人妻一区二区三区| 国产伦精品一区二区三区精品| 最新国产精品自在线观看| 黑巨人与欧美精品一区| 亚洲午夜精品一区二区麻豆 | 日韩精品久久一区二区三区| www.精品在线| 亚洲日韩在线中文字幕第一页| 国产精品成年片在线观看| 国内揄拍国内精品少妇国语| 精品日产a一卡2卡三卡4卡乱| 亚洲精品无码日韩国产不卡av| 久久久久久午夜精品| 国产精品视频一区二区三区经| 91精品国产自产在线观看|