智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

          Meta新推Llama 3.2量化版,1B/3B模型功耗再降低!

             發(fā)布時間:2024-10-27 15:15 作者:陸辰風(fēng)

          meta公司近日宣布,繼9月推出Llama 3.2的1B與3B模型后,他們于10月24日發(fā)布了這兩個模型的量化版本。通過量化,模型大小平均縮減了56%,RAM使用量降低了41%,并且模型運行速度提升了2至4倍,功耗也有所下降,這使得模型更易于部署在移動設(shè)備上。

          meta采用了兩種量化方法:量化感知訓(xùn)練(QAT)和后訓(xùn)練量化(SpinQuant)。前者注重模型的準確性,后者則強調(diào)模型的可移植性。

          針對Llama 3.2的1B和3B模型,meta分別推出了兩款量化版本。這些量化模型相較于非量化的Llama BF16模型,速度更快,RAM占用更少,功耗更低,同時保持了與Llama BF16版本相近的精度。

          盡管量化后的模型支持的Token上下文有所減少,但meta的測試顯示,量化版本的基準測試結(jié)果與原版相差無幾。

          meta已在一加12、三星S24+/S22及蘋果iOS設(shè)備等移動平臺上測試了這些量化模型,并計劃未來通過神經(jīng)處理單元(NPU)進一步提升模型性能。

           
           
          更多>同類內(nèi)容
          全站最新
          熱門內(nèi)容
          本欄最新
           
          智快科技微信賬號
          ITBear微信賬號

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數(shù)碼群

          国产美女精品三级在线观看| 久久精品免视看国产陈冠希| 国产精品自在自线免费观看| 5555国产在线观看精品| 久久亚洲精品国产精品| 久久e热在这里只有国产中文精品99 | 久久93精品国产91久久综合| 日韩精品无码一本二本三本| 成人区人妻精品一区二区三区 | 精品国产乱码久久久久久1区2区| 国产福利精品一区二区| 久久93精品国产91久久综合| 日韩中文有码高清| 国产亚洲Av综合人人澡精品| 精品日产一卡2卡三卡4卡自拍| 久久久久久精品久久久久| 久久99精品久久水蜜桃| 国内午夜国产精品小视频| 精品熟女少妇aⅴ免费久久| 日批日韩在线观看| 日韩精品无码一区二区中文字幕| 国产日韩精品一区二区在线观看播放| 久热综合在线亚洲精品| 精品国产一级在线观看 | 久久亚洲精品无码观看不卡| 青草国产精品视频。| 亚洲欧美日韩中文字幕一区二区三区 | 亚洲欧美日韩中文无线码| 国产91精品久久久久久| 黑人粗长大战亚洲女2021国产精品成人免费视频 | 亚洲国产精品狼友中文久久久| 国产日韩在线观看视频网站| 日韩视频一区二区三区| 亚洲日韩精品一区二区三区| 四虎成人精品在永久在线观看| 国产精品午夜小视频观看| 久久精品aⅴ无码中文字字幕不卡 久久精品aⅴ无码中文字字幕重口 | 国产精品亚洲高清一区二区| 香蕉依依精品视频在线播放| 日韩av激情在线观看| 日韩精品久久一区二区三区|