精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

低比特量化的LLAMA3模型有多好? | 香港大學&北航最新研究發布

發布于 2024-4-24 10:10
瀏覽
0收藏

低比特量化的LLAMA3模型有多好? | 香港大學&北航最新研究發布-AI.x社區

論文鏈接:https://arxiv.org/pdf/2404.14047.pdf
項目鏈接:https://github.com/Macaronlin/LLaMA3-Quantization  
模型鏈接:https://huggingface.co/LLMQ


Meta的LLAMA系列已成為最強大的開源大語言模型(LLM)系列之一。值得注意的是,LLAMA3模型最近發布,并在超大規模的預訓練數據(超過15T tokens)上取得了令人印象深刻的性能。鑒于在資源有限的情況下低比特量化在LLMs中的廣泛應用,本文探索了LLAMA3在量化到低比特寬度時的能力。這一探索有可能揭示LLAMA3和其他即將推出的LLMs的低比特量化的新見解和挑戰,特別是在解決LLM壓縮中遇到的性能下降問題方面。

具體而言,本文評估了LLAMA3的10種現有的訓練后量化和LoRA微調方法,分別在1-8比特和各種數據集上,以全面揭示LLAMA3的低比特量化性能。本文的實驗結果表明,在這些場景中,LLAMA3仍然遭受了相當大的性能下降,尤其是在超低比特寬度下。這凸顯了未來發展中需要填補的低比特寬度下的顯著性能差距。


本文期望這項實證研究將有助于推動未來模型的發展,推動LLMs在更低的比特寬度上以更高的精度實用化。

介紹

由Meta于2023年2月推出的LLaMA系列代表了使用Transformer架構的自回歸大語言模型(LLMs)的突破。從其第一個版本開始,擁有130億參數的LLaMA系列就成功地超越了擁有1750億參數的更大的、閉源的GPT-3模型。2024年4月18日,Meta推出了LLAMA3模型,提供了80億和700億參數的配置。由于在超過15萬億數據tokens上進行了廣泛的預訓練,LLAMA3模型在各種任務中實現了最先進的性能,將LLaMA系列確立為可用于廣泛應用和部署場景的最優秀的開源LLMs之一。


盡管它們的性能令人印象深刻,但在許多場景中部署LLAMA3模型仍然面臨著重大挑戰,這主要是由于資源限制。幸運的是,低比特量化已經成為壓縮LLMs最流行的技術之一。這種技術在推斷期間降低了LLMs的內存和計算需求,使它們能夠在資源有限的設備上運行。

解決壓縮后性能下降的問題是當前LLM量化方法的主要關注點。雖然已經提出了許多低比特量化方法,但它們的評估主要集中在較早和能力較弱的LLaMA模型(LLAMA1和LLAMA2)上。因此,LLAMA3為LLM社區提供了一個新的機會,評估對最新LLM進行量化的性能,并了解現有方法的優勢和局限性。在這項實證研究中,目標是分析LLAMA3處理由于量化而導致的性能下降所面臨的挑戰的能力。

?

本文的研究確定了兩個主要的技術路線來量化LLMs:訓練后量化(PTQ)和LoRA-FineTuning(LoRA-FT)量化, 旨在全面評估LLAMA3模型的量化效果。本文在技術路線上探索了一系列前沿的量化方法(RTN、GPTQ、AWQ、SmoothQuant、PB-LLM、QuIP、DB-LLM和BiLLM用于PTQ;QLoRA和IR-QLoRA用于LoRA-FT),覆蓋了從1比特到8比特的廣泛范圍,并利用了多種評估數據集,包括WikiText2、C4、PTB、CommonSenseQA數據集(PIQA、ARC-e、ARC-c、HellaSwag、Winogrande)和MMLU基準


本文的研究概述如下圖1所示。這些評價評估了LLAMA3模型在當前LLM量化技術下的能力和限制,并為未來LLM量化方法的設計提供了靈感。專注于LLAMA3模型的選擇是由于其在各種數據集上的卓越性能,包括5-shot MMLU、0-shot GPQA、0-shot HumanEval、8-shot CoT GSM-8K和4-shot CoT MATH等,這使其成為當前所有開源指令調整型LLMs中表現最優秀的模型。此外,已經在https://github.com/Macaronlin/LLaMA3-Quantization和https://huggingface.co/LLMQ上向公眾提供了本文的項目和量化模型。這不僅有助于推動LLM量化社區內的研究,而且有助于更廣泛地理解和應用有效的量化技術。

低比特量化的LLAMA3模型有多好? | 香港大學&北航最新研究發布-AI.x社區

實驗評估

實驗設置

評估LLMs。 本文對預訓練的LLAMA3-8B和-70B進行了評估,通過官方倉庫獲取。

量化方法。 為了評估低比特量化的LLAMA3的性能,本文選擇了具有廣泛影響和功能的代表性LLM量化方法,包括8種PTQ方法和2種LoRA-FT方法。本文評估的量化方法的實現遵循它們的開源倉庫。本文還使用了八個具有80GB GPU內存的NVIDIA A800進行定量評估。


評估數據集。 對于PTQ方法,本文在WikiText2、PTB和C4數據集的一部分上評估量化的LLAMA3,使用困惑度(Perplexity,PPL)作為評估指標。隨后,本文進一步在五個 zero-shot 評估任務(PIQA、Winogrande、ARC-e、ARC-c和Hellaswag)上進行實驗,以充分驗證LLAMA3的量化性能。對于LoRA-FT方法,本文在5-shot MMLU基準上進行評估,同時還驗證了在前述五個 zero-shot 數據集的LoRA-FT方法。


為了評估的公平性,本文統一使用WikiText2作為所有量化方法的校準數據集,樣本大小為128,token 序列長度保持一致為2048。此外,對于需要通道分組的量化方法,本文采用塊大小為128,以平衡性能和推斷效率,這是現有工作中的常見做法。

技術路線1:訓練后量化

如下表1和下表2所示,本文分別提供了LLAMA3-8B和LLAMA3-70B在8種不同的PTQ方法下的性能,涵蓋了從1到8比特的廣泛比特寬度范圍。

低比特量化的LLAMA3模型有多好? | 香港大學&北航最新研究發布-AI.x社區

低比特量化的LLAMA3模型有多好? | 香港大學&北航最新研究發布-AI.x社區

其中,Round-To-Nearest(RTN)是一種基本的四舍五入量化方法。GPTQ是目前最有效率和有效的僅權重量化方法之一,它利用量化中的誤差補償。但在2-3比特下,GPTQ在量化LLAMA3時會導致嚴重的準確度下降。AWQ采用異常通道抑制方法來減少權重量化的難度,而QuIP通過優化矩陣計算來確保權重和Hessian之間的不一致性。它們兩者都能保持LLAMA3在3比特的性能,并且甚至可以將2比特量化推向前景。


最近出現的二值化LLM量化方法實現了超低比特寬度LLM權重壓縮。PB-LLM采用混合精度量化策略,在將大部分權重量化為1比特的同時保留了一小部分重要權重的完整精度。DB-LLM通過雙二值化權重分割實現了高效的LLM壓縮,并提出了一種基于偏差感知的蒸餾策略,進一步增強了2比特LLM的性能。


BiLLM通過突出權重的殘差逼近和非突出權重的分組量化,將LLM量化邊界進一步推至低至1.1比特。這些專為超低比特寬度設計的LLM量化方法可以在?2比特時獲得更高的LLAMA3-8B量化精度,在2比特以下遠遠超過了像GPTQ、AWQ和QuIP等方法(甚至在某些情況下超過3比特)。


本文還通過SmoothQuant對量化激活的LLAMA3進行評估,SmoothQuant將量化難度從激活轉移到權重上,以平滑激活的異常值。本文的評估顯示,SmoothQuant在8比特和6比特的權重和激活下可以保持LLAMA3的準確性,但在4比特時面臨性能下降。

此外,本文發現LLAMA3-70B模型在各種量化方法中表現出顯著的穩健性,即使在超低比特寬度下也是如此。

技術路線2:LoRA-FineTuning量化

除了PTQ方法之外,如下表3所示,本文還提供了4比特LLAMA3-8B使用2種不同LoRA-FT量化方法的性能,包括QLoRA和IR-QLoRA。

低比特量化的LLAMA3模型有多好? | 香港大學&北航最新研究發布-AI.x社區

在MMLU數據集上,LLAMA3-8B在LoRA-FT量化下最顯著的觀察是,Alpaca數據集上的低秩微調不僅不能彌補量化引入的錯誤,甚至使惡化更加嚴重。具體來說,與沒有LoRA-FT的4比特對應版本相比,各種LoRA-FT量化方法在4比特下獲得的性能更差的量化LLAMA3。這與LLAMA1和LLAMA2上類似的現象形成鮮明對比,對于前者,在MMLU上,4比特的低秩微調量化版本甚至可以輕松超過原始的FP16對應版本。



直覺分析,這種現象的主要原因是由于LLAMA3通過其大規模預訓練帶來的強大性能,這意味著原始模型的量化帶來的性能損失無法通過在低秩參數的小數據集上進行微調來彌補(可以看作是原始模型的一個子集)。盡管無法通過微調來彌補量化帶來的顯著下降,但4比特LoRA-FT量化的LLAMA3-8B在各種量化方法下明顯優于LLAMA1-7B和LLAMA2-7B。例如,使用QLoRA方法,4比特LLAMA3-8B的平均準確度為57.0(FP16:64.8),超過了4比特LLAMA1-7B的38.4(FP16:34.6)18.6,以及超過了4比特LLAMA2-7B的43.9(FP16:45.5)13.1。這意味著在LLAMA3時代需要一種新的LoRA-FT量化范式。

類似的現象也在CommonSenseQA基準測試中發生。與沒有LoRA-FT的4比特對應版本相比,使用QLoRA和IR-QLoRA微調的模型的性能也下降了(例如,QLoRA平均下降了2.8%,而IR-QLoRA平均下降了2.4%)。這進一步證明了在LLAMA3中使用高質量數據集的優勢,因為一般數據集Alpaca并不對模型在其他任務中的性能做出貢獻。

結論

Meta最近發布的LLAMA3模型迅速成為最強大的LLM系列,引起了研究人員的極大興趣。借助這一勢頭,本文的研究旨在全面評估LLAMA3在各種低比特量化技術下的性能,包括訓練后量化和LoRA微調量化。本文的目標是通過利用現有的LLM量化技術,評估LLAMA3在資源有限的情況下的能力邊界。本文的研究發現表明,盡管LLAMA3在量化后仍然表現出優越的性能,但與量化相關的性能下降是顯著的,甚至在許多情況下可能導致更大的下降。這一發現突顯了在資源受限環境中部署LLAMA3的潛在挑戰,并強調了在低比特量化背景下增長和改進的充足空間。本文研究的實證洞見預計將對未來LLM量化技術的發展具有價值,特別是在縮小與原始模型之間的性能差距方面。通過解決低比特量化引起的性能下降,預計隨后的量化范式將使LLMs能夠以更低的計算成本實現更強大的能力,最終推動生成式人工智能的進步,如LLMs所代表的,達到新的高度。


本文轉自 AI生成未來 ,作者:Wei Huang等


原文鏈接:??https://mp.weixin.qq.com/s/KQdaPvpbWyXza-8__4iAeg??

標簽
收藏
回復
舉報
回復
相關推薦
香蕉加勒比综合久久| 伊人成人在线| 欧洲精品中文字幕| 欧美亚洲视频一区| 人妻无码中文字幕免费视频蜜桃| 人人狠狠综合久久亚洲婷| 欧美日本视频在线| 精品国偷自产一区二区三区| 日本在线一二三| 久久99久久久欧美国产| 久久久免费在线观看| 色欲狠狠躁天天躁无码中文字幕 | 日本va中文字幕| 97caopor国产在线视频| 久久综合九色综合欧美就去吻| 日本成人黄色片| 欧美成欧美va| 日韩欧美自拍| 亚洲精品www久久久| 日本久久精品一区二区| av中文字幕电影在线看| 国产精品成人免费在线| 精品免费国产| 国产成人精品免费看视频| 久久中文字幕一区二区三区| 日韩中文字幕网| 青青草福利视频| 一区二区三区四区精品视频| 欧美日韩在线播放三区| 日本一本二本在线观看| 国产蜜臀一区二区打屁股调教| 久久精品人人做人人综合| 福利视频一区二区三区| 欧美日韩a v| 在线看片日韩| 久久久久免费视频| 好吊日在线视频| 日本不卡免费一区| 一色桃子一区二区| 无码国产69精品久久久久同性| 中文字幕亚洲在线观看 | 99草在线视频| 蜜臀av亚洲一区中文字幕| 日本成人黄色片| 五月婷婷视频在线| 国产亚洲在线| 欧美综合在线第二页| 日韩精品一区二区不卡| 国产综合网站| 国内精品美女av在线播放| 久草视频免费在线| 欧美日韩爆操| 久久久亚洲天堂| 日本熟妇乱子伦xxxx| 欧美激情麻豆| 欧美激情视频网站| 国产性生活网站| 在线国产日韩| 91精品国产91久久久久久久久 | 一本到三区不卡视频| 69堂免费视频| 日韩精品99| 在线视频欧美区| 天天爽夜夜爽一区二区三区| 日韩有码欧美| 日韩欧美一区电影| 国产女主播在线播放| 另类尿喷潮videofree| 日韩毛片在线看| 91资源在线播放| 99热国内精品| 欧美激情第1页| 国产污污视频在线观看| 日韩电影网1区2区| 国产欧美一区二区三区视频| 国产特级黄色片| 成人看片黄a免费看在线| 久久久精品国产一区二区三区| 日韩一级在线播放| 久久久久久**毛片大全| 一区二区三区不卡在线| 日韩精品卡一| 色香蕉久久蜜桃| 在线视频日韩欧美| 久久精品福利| 日韩一区二区av| 不卡的免费av| 日本中文字幕一区| 亚洲自拍小视频免费观看| 少妇荡乳情欲办公室456视频| 9久草视频在线视频精品| 青娱乐一区二区| av免费网站在线| 色综合久久中文综合久久牛| 一区二区三区欧美精品| 欧美美女啪啪| www.欧美免费| 国偷自拍第113页| 国内久久婷婷综合| 欧美日本韩国一区二区三区| 搞黄网站在线观看| 在线免费视频一区二区| 亚洲精品鲁一鲁一区二区三区| 青青草这里只有精品| www.xxxx精品| 国产婷婷色一区二区在线观看| 麻豆传媒一区二区三区| 精品国产乱码久久久久久蜜柚| 九色在线视频| 亚洲国产综合在线| 亚洲怡红院在线| 欧美**vk| 久久免费精品视频| 99re只有精品| 国产精品成人免费在线| 男人天堂999| youjizz亚洲| 日韩中文字幕国产精品| 国产无遮挡呻吟娇喘视频| 福利一区福利二区| 日韩亚洲不卡在线| 麻豆mv在线看| 精品国产乱码久久久久久浪潮| 亚洲区自拍偷拍| 亚洲免费成人| 99中文视频在线| 国产盗摄在线观看| 欧美日免费三级在线| 免费在线观看你懂的| 在线观看的日韩av| 国产精品美女xx| 日本片在线看| 欧美一区二区三区免费视频| 五月婷婷六月香| 日韩在线一区二区| 欧美一级爽aaaaa大片| 中文在线8资源库| 日韩大片免费观看视频播放| 国产污视频在线看| 成人午夜视频在线| 日韩成人手机在线| 中文字幕一区二区三区中文字幕 | 国产aⅴ精品一区二区三区黄| 91激情在线| 在线观看欧美黄色| 色欲AV无码精品一区二区久久| 亚洲免费播放| 久久99精品久久久久子伦| 咪咪网在线视频| 亚洲跨种族黑人xxx| wwwwww国产| 久久中文字幕电影| 北条麻妃在线视频| 欧美系列电影免费观看| 国产精品盗摄久久久| 国产福利电影在线| 精品视频一区三区九区| 五月天免费网站| 国产一区二区免费看| 国产资源第一页| 亚洲三区欧美一区国产二区| 欧美另类99xxxxx| 好吊色一区二区| 精品日韩视频在线观看| 欧美图片一区二区| 日本伊人色综合网| 国产高清精品软男同| 欧美9999| 亚洲综合网在线观看| 日本免费久久| 亚洲欧美中文字幕| 销魂美女一区二区| 国产精品丝袜91| 五月婷婷之婷婷| 中文字幕免费一区二区| 成人免费在线看片| 青青青免费在线视频| 亚洲欧洲成视频免费观看| 中文字幕+乱码+中文乱码91| 亚洲图片你懂的| 一级黄色电影片| 亚欧美中日韩视频| 一区二区三区我不卡| 中文久久电影小说| 日本高清+成人网在线观看| av电影在线网| 欧美成人女星排名| 免费的毛片视频| 亚洲同性gay激情无套| 蜜臀av粉嫩av懂色av| 日韩av在线发布| xxxxxx在线观看| 天海翼精品一区二区三区| 国产精品久久久久久av下载红粉| 欧美男男激情freegay| 欧美日韩国产片| 国产亚洲欧美精品久久久www | 综合久久一区二区三区| 美女网站视频在线观看| 日韩成人免费在线| 成人av在线不卡| 成人久久一区| 国产欧美日韩伦理| 亚洲伊人精品酒店| 欧洲亚洲免费视频| 秋霞在线午夜| 中文在线不卡视频| 亚洲欧美日韩精品永久在线| 欧美精品一二三| 免费视频久久久| 亚洲在线一区二区三区| 波多野结衣喷潮| 久久影院视频免费| 亚洲成人福利视频| 麻豆精品国产传媒mv男同| 无码播放一区二区三区| 欧美黄色一级视频| 亚洲综合欧美日韩| 免费成人av| 国产九色精品| 日韩精品中文字幕一区二区 | 国产精品夜夜夜爽张柏芝| 综合干狼人综合首页| 国产精品一区二区三区在线观| 丁香婷婷久久| 国产97色在线| 亚洲插插视频| 午夜精品久久久久久久99热浪潮 | 亚洲图片在线观看| 伊人成综合网站| 欧美裸体男粗大视频在线观看| 欧洲免费在线视频| 欧美精品一区二区高清在线观看 | 人妻大战黑人白浆狂泄| www.欧美亚洲| 四虎永久免费观看| 国产91丝袜在线观看| 亚洲第一区第二区第三区| 蜜臀精品一区二区三区在线观看| www.日本在线播放| 激情视频一区二区三区| 真人做人试看60分钟免费| 亚洲网色网站| 国产日韩第一页| 91精品国产调教在线观看| 亚洲日本无吗高清不卡| 日本a口亚洲| 亚洲一区二区不卡视频| 日韩激情在线| 一区二区三区四区五区精品| 欧美精品一区二区久久| 亚洲成人第一| 久久激情电影| 2021狠狠干| 欧美日韩 国产精品| 欧美久久在线观看| 日韩午夜av| 久久久久久久久久久久久国产精品| 日韩天天综合| 国产福利视频在线播放| 丝袜美腿亚洲综合| 亚洲第一狼人区| 精品一区二区三区免费观看| 6080国产精品| 成人福利视频网站| 亚洲午夜久久久久久久久红桃 | 中文字幕求饶的少妇| 自拍偷拍亚洲欧美日韩| 男人的天堂久久久| 亚洲成人资源在线| 日韩在线视频不卡| 欧美色区777第一页| 国产三级在线观看视频| 欧美va亚洲va香蕉在线| 香港一级纯黄大片| 亚洲天堂男人天堂女人天堂| 在线观看av的网站| 欧美人与性动交| 在线黄色的网站| 国产精品自产拍在线观| 亚洲精品一区二区三区在线| 精品一区二区国产| 国产精品片aa在线观看| 国产手机视频在线观看| 一本久道久久久| www.久久av.com| 91在线观看下载| 久久久国产一级片| 亚洲国产成人91porn| 日韩精品在线一区二区三区| 在线综合亚洲欧美在线视频| 亚洲av无码国产综合专区| 亚洲欧美中文日韩v在线观看| 午夜毛片在线| 国外成人免费在线播放| 免费一区二区三区四区| 国产精品一区二区三区免费观看 | 日韩麻豆第一页| www免费在线观看| 日本精品va在线观看| 韩国三级成人在线| 日本视频一区二区在线观看| 最新精品国产| 青青青国产在线视频| 成人小视频免费观看| 中国特黄一级片| 欧美日韩国产页| 99在线观看免费| 一本大道亚洲视频| 国产又色又爽又黄刺激在线视频| 国产99久久久欧美黑人| 国产精品videossex| 一区二区高清视频| 久久亚洲色图| 黄色国产在线视频| 亚洲丝袜美腿综合| 懂色av蜜臀av粉嫩av喷吹 | 日中文字幕在线| 久久99精品久久久久久琪琪| 成人国产一区| 欧美二区三区在线| 亚洲二区在线| 秘密基地免费观看完整版中文 | 成人免费av网站| 精品女人久久久| 在线一区二区三区| 色吊丝在线永久观看最新版本| 久久久国产精品x99av| 日本综合久久| 欧美日韩亚洲免费| 国产日韩专区| aaaaaav| 亚洲大片在线观看| 免费观看黄一级视频| 欧美日韩ab片| 久久天堂久久| 8x8x华人在线| 国产乱码精品一区二区三区忘忧草 | 午夜视频一区| 日韩在线一区视频| 国产精品久久三区| 亚洲一线在线观看| 日韩最新免费不卡| 亚洲人成网站在线在线观看| 亚洲 日韩 国产第一区| 青青草国产成人av片免费| 波多野结衣 在线| 亚洲国产你懂的| 少妇一区二区三区四区| 97国产成人精品视频| 日韩福利视频一区| 黄色一级大片在线观看| 欧美国产精品劲爆| 亚洲一级片免费看| 插插插亚洲综合网| 国产剧情一区二区在线观看| 亚洲小视频在线播放| 成人免费看黄yyy456| 亚洲日本韩国在线| 亚洲图片在线综合| a一区二区三区亚洲| 欧美乱做爰xxxⅹ久久久| 成人精品免费看| 久久久久久久久久久影院| 一本色道久久综合狠狠躁篇的优点 | 国产第一页视频| 久久婷婷国产综合精品青草| 精品视频一二三区| www高清在线视频日韩欧美| 国产一精品一av一免费爽爽| 日韩在线观看a| 91麻豆视频网站| av首页在线观看| 久久不射热爱视频精品| 国产乱人伦精品一区| 欧美 国产 小说 另类| 国产精品久久久久久久午夜片| 国产精品视频无码| 久久久久国产精品免费| 欧洲专线二区三区| 小早川怜子一区二区三区| 亚洲成av人影院| jyzzz在线观看视频| 91手机在线视频| 久久福利一区| 国产suv精品一区二区68| 亚洲精品成人久久电影| 成人av集中营| 韩日视频在线观看| 日本一区二区成人在线| 亚洲精品一区二区口爆| 国产精品精品一区二区三区午夜版 | 粉嫩av蜜桃av蜜臀av| 欧美亚洲一区二区三区四区| 91蜜桃在线视频| 欧美亚洲精品日韩| 国产91精品一区二区麻豆亚洲| 国产精品久久久久久久久久精爆| 最近2019年好看中文字幕视频 | 蜜桃一区二区三区四区|