精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

將330億參數(shù)大模型「塞進(jìn)」單個消費(fèi)級GPU,加速15%、性能不減

人工智能 新聞
個人終端設(shè)備跑大模型成為現(xiàn)實(shí)了。

預(yù)訓(xùn)練大語言模型(LLM)在特定任務(wù)上的性能不斷提高,隨之而來的是,假如 prompt 指令得當(dāng),其可以更好的泛化到更多任務(wù),很多人將這一現(xiàn)象歸功于訓(xùn)練數(shù)據(jù)和參數(shù)的增多,然而最近的趨勢表明,研究者更多的集中在更小的模型上,不過這些模型是在更多數(shù)據(jù)上訓(xùn)練而成,因而在推理時更容易使用。

舉例來說,參數(shù)量為 7B 的 LLaMA 在 1T token 上訓(xùn)練完成,盡管平均性能略低于 GPT-3,但參數(shù)量是后者的 1/25。不僅如此,當(dāng)前的壓縮技術(shù)還能將這些模型進(jìn)一步壓縮,在保持性能的同時還能大幅減少內(nèi)存需求。通過這樣的改進(jìn),性能良好的模型可以在終端用戶設(shè)備(如筆記本)上進(jìn)行部署。

然而,這又面臨另一個挑戰(zhàn),即想要將這些模型壓縮到足夠小的尺寸以適應(yīng)這些設(shè)備,怎樣才能兼顧生成質(zhì)量。研究表明,盡管壓縮后的模型生成的答案準(zhǔn)確率還可以,但現(xiàn)有的 3-4 位量化技術(shù)仍然會讓準(zhǔn)確性降低。由于 LLM 生成是順序進(jìn)行的,依賴于先前生成的 token,小的相對誤差不斷累積并導(dǎo)致嚴(yán)重的輸出損壞。為了確??煽康馁|(zhì)量,關(guān)鍵是設(shè)計出低位寬的量化方法,與 16 位模型相比不會降低預(yù)測性能。

然而,將每個參數(shù)量化到 3-4 位通常會導(dǎo)致中等程度、甚至是高等程度的準(zhǔn)確率損失,特別是那些非常適合邊緣部署的 1-10B 參數(shù)范圍內(nèi)的較小模型。

為了解決準(zhǔn)確性問題,來自華盛頓大學(xué)、蘇黎世聯(lián)邦理工學(xué)院等機(jī)構(gòu)的研究者提出了一種新的壓縮格式和量化技術(shù) SpQR(Sparse-Quantized Representation,稀疏 - 量化表征),首次實(shí)現(xiàn)了 LLM 跨模型尺度的近無損壓縮,同時達(dá)到了與以前方法相似的壓縮水平。

SpQR 通過識別和隔離異常權(quán)重來工作,這些異常權(quán)重會導(dǎo)致特別大的量化誤差,研究者將它們以更高的精度存儲,同時將所有其他權(quán)重壓縮到 3-4 位,在 LLaMA 和 Falcon LLMs 中實(shí)現(xiàn)了不到 1% 的困惑度相對準(zhǔn)確率損失。從而可以在單個 24GB 的消費(fèi)級 GPU 上運(yùn)行 33B 參數(shù)的 LLM,而不會有任何性能下降,同時還能提高 15% 的速度。

SpQR 算法高效,既可以將權(quán)重編碼為其他格式,也可以在運(yùn)行時進(jìn)行有效地解碼。具體來說,該研究為 SpQR 提供了一種高效的 GPU 推理算法,可以比 16 位基線模型更快地進(jìn)行推理,同時實(shí)現(xiàn)了超過 4 倍的內(nèi)存壓縮收益。

圖片

  • 論文地址:https://arxiv.org/pdf/2306.03078.pdf
  • 項目地址:https://github.com/Vahe1994/SpQR

方法

該研究提出一種混合稀疏量化的新格式 —— 稀疏量化表征(SpQR),可以將精確預(yù)訓(xùn)練的 LLM 壓縮到每個參數(shù) 3-4 位,同時保持近乎無損。

具體來說,該研究將整個過程分為兩步。第一步是異常值檢測:該研究首先孤立了異常值權(quán)重,并證明其量化會導(dǎo)致高誤差:異常值權(quán)重保持高精度,而其他權(quán)重以低精度(例如 3 位的格式)存儲。然后,該研究以非常小的組大小實(shí)現(xiàn)分組量化(grouped quantization)的變體,并表明量化尺度本身可以被量化為 3 位表征。

SpQR 極大地減少了 LLM 的內(nèi)存占用,而不會降低準(zhǔn)確性,同時與 16 位推理相比,LLM 的生成速度快了 20%-30%。

此外,該研究發(fā)現(xiàn),權(quán)重矩陣中敏感權(quán)重的位置不是隨機(jī)的,而是具有特定的結(jié)構(gòu)。為了在量化過程中突出顯示其結(jié)構(gòu),該研究計算了每個權(quán)重的敏感度,并為 LLaMA-65B 模型可視化這些權(quán)重敏感度。下圖 2 描繪了 LLaMA-65B 最后一個自注意力層的輸出投影。

圖片

該研究對量化過程進(jìn)行了兩個改變:一個用于捕捉小的敏感權(quán)重組,另一個用于捕捉單個的異常值。下圖 3 為 SpQR 的總體架構(gòu):

圖片

下表為 SpQR 量化算法,左邊的代碼片段描述了整個過程,右邊的代碼片段包含了二級量化和查找異常值的子程序:

圖片

實(shí)驗

該研究將 SpQR 與其他兩種量化方案進(jìn)行了比較:GPTQ、RTN(rounding-to-nearest),并用兩個指標(biāo)來評估量化模型的性能。首先是困惑度的測量,所用數(shù)據(jù)集包括 WikiText2、 Penn Treebank 以及 C4;其次是在五個任務(wù)上的零樣本準(zhǔn)確率:WinoGrande、PiQA、HellaSwag、ARC-easy、ARC-challenge。

主要結(jié)果。圖 1 結(jié)果顯示,在相似的模型大小下,SpQR 的性能明顯優(yōu)于 GPTQ(以及相應(yīng)的 RTN),特別是在較小的模型上。這種改進(jìn)得益于 SpQR 實(shí)現(xiàn)了更多的壓縮,同時也減少了損失退化。

圖片

表 1、表 2 結(jié)果顯示,對于 4 位量化,與 GPTQ 相比,SpQR 相對于 16 位基線的誤差減半。

圖片

圖片

表 3 報告了 LLaMA-65B 模型在不同數(shù)據(jù)集上的困惑度結(jié)果。

圖片

最后,該研究評估了 SpQR 推理速度。該研究將專門設(shè)計的稀疏矩陣乘法算法與 PyTorch(cuSPARSE)中實(shí)現(xiàn)的算法進(jìn)行了比較,結(jié)果如表 4 所示??梢钥吹剑M管 PyTorch 中的標(biāo)準(zhǔn)稀疏矩陣乘法并沒有比 16 位推理更快,但本文專門設(shè)計的稀疏矩陣乘法算法可以提高約 20-30% 的速度。

圖片

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2023-06-12 11:49:37

GPT-4 API論文

2022-08-20 07:52:56

語言模型參數(shù)PaLM

2009-03-20 09:56:41

2023-06-02 15:47:49

2024-02-21 12:10:00

模型數(shù)據(jù)

2023-09-04 12:58:05

2023-09-23 12:36:32

蘋果模型

2023-07-05 14:01:50

AI技術(shù)

2023-12-13 12:55:39

模型數(shù)據(jù)

2024-08-05 14:36:17

大型語言模型量化

2025-10-13 08:33:33

2023-04-04 13:17:00

GPUCMU開源

2020-04-30 13:30:30

Facebook 機(jī)器人開源

2022-06-25 21:17:15

人工智能訓(xùn)練

2023-07-18 15:05:00

開源大模型

2023-06-06 16:33:11

云計算人工智能

2022-01-20 15:56:14

AI訓(xùn)練GPU

2024-04-19 09:17:33

AI模型
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

午夜国产福利视频| 久久精品一卡二卡| 国产区视频在线播放| 卡一卡二国产精品| 欧美人与物videos| 麻豆国产精品一区| 少妇高潮一区二区三区99| 一区二区三区成人| 日本在线播放一区| av中文字幕免费在线观看| 国产亚洲一级| 久久激情视频久久| 人妻少妇精品视频一区二区三区| 国产情侣一区二区三区| 亚洲大片免费看| 亚洲精品国产系列| 午夜激情小视频| 久久国产精品99久久人人澡| 韩国三级电影久久久久久| 欧美激情视频二区| 牛牛影视久久网| 欧美乱妇一区二区三区不卡视频| 日本a视频在线观看| 免费在线观看av网站| 91啪亚洲精品| 成人免费视频网站| 国产一区二区在线视频聊天| 亚洲在线国产日韩欧美| 欧美激情xxxx性bbbb| sm捆绑调教视频| 在线日韩一区| 亚洲激情第一页| 搡的我好爽在线观看免费视频| 成人黄色免费短视频| 亚洲a一区二区| 麻豆映画在线观看| 米奇精品一区二区三区| 国产欧美日韩中文久久| 久久久久久久久久久久久久一区 | 亚洲国产精品日韩专区av有中文 | 欧美艳星brazzers| av动漫在线看| av手机在线观看| 亚洲自拍偷拍av| 一二三四中文字幕| 黄色视屏免费在线观看| 中文字幕中文字幕在线一区| 日韩欧美在线观看强乱免费| 国产午夜精品一区理论片| 91色视频在线| 欧美久久在线| 国产资源在线播放| 2023国产一二三区日本精品2022| 国产美女在线精品免费观看| 蜜桃久久一区二区三区| 成人激情动漫在线观看| 国产精成人品localhost| 高清一区二区三区四区| 成人午夜又粗又硬又大| 国产精品久久国产精品| 日批免费在线观看| 99久久777色| 欧美激情视频一区二区三区| 免费资源在线观看| 国产欧美一区二区三区在线看蜜臀| 久久这里精品国产99丫e6| 午夜视频www| 久久久国产精品麻豆| 日本成人黄色| 日本不卡在线| 亚洲综合在线五月| 我的公把我弄高潮了视频| 麻豆mv在线看| 欧美在线观看视频一区二区三区| 亚洲欧美日韩一级| 国产日韩一区二区三免费高清| 欧美一区欧美二区| 图片区偷拍区小说区| 香蕉久久夜色精品国产使用方法| 亚洲午夜精品视频| 亚洲一级片在线播放| 亚洲精品97| 亚洲2020天天堂在线观看| 欧美日韩一级黄色片| 久久精品国产第一区二区三区| 91青草视频久久| 国产成人无码www免费视频播放| 91在线精品一区二区三区| 日本欧美精品久久久| 老司机99精品99| 五月婷婷综合激情| 手机看片一级片| 成人福利一区| 中文字幕久久久| 国产一级久久久| 日韩中文字幕av电影| 亚洲一区二区三区xxx视频| 色丁香婷婷综合久久| 国产精品久久久久久久久快鸭| 国产精品无码免费专区午夜| 韩国成人动漫| 日韩欧美一二三四区| 中文字幕丰满孑伦无码专区| 婷婷丁香综合| 亲爱的老师9免费观看全集电视剧| 一本色道久久综合亚洲| 成人h动漫精品| 亚洲一区二区免费视频软件合集| 成人免费高清观看| 欧美日韩国产另类一区| 菠萝菠萝蜜网站| 91精品国产成人观看| 国产成人高潮免费观看精品| 成人毛片在线免费观看| 丁香花在线电影| 国产精品久久久久一区| 欧美在线一区视频| 国产精区一区二区| 国产亚洲欧洲在线| 日韩欧美中文字幕一区二区| 久久成人麻豆午夜电影| 久久久久久久久久久一区| 丝袜中文在线| 欧美精选一区二区| 免费看的黄色网| 99在线观看免费视频精品观看| 91传媒视频免费| 日本不卡在线| 欧美主播一区二区三区| 爱爱的免费视频| 亚洲另类黄色| 99视频日韩| 久操视频在线免费播放| 欧美日韩国产小视频在线观看| 四虎永久免费在线观看| 夜夜嗨av一区二区三区网站四季av| 成人免费网站在线| 日本视频不卡| 欧美日韩精品久久久| 91社区视频在线观看| 久久精品人人| 欧美日韩精品免费看| 小草在线视频免费播放| 亚洲国产小视频在线观看| 九九视频免费在线观看| 国产激情一区二区三区四区| 欧美a级黄色大片| 国产亚洲字幕| 久久视频精品在线| av中文字幕播放| 亚洲综合丁香婷婷六月香| 真实乱偷全部视频| 欧美日韩精品| 国产精品毛片一区视频| 国产精品偷拍| 精品亚洲夜色av98在线观看 | 精品国产鲁一鲁一区二区张丽| www.黄色网| 在线午夜精品| 欧美日韩亚洲综合一区二区三区激情在线| 天堂av中文在线观看| 日韩精品福利在线| 波多野结衣不卡| 国产精品婷婷午夜在线观看| 亚洲免费av一区| 中文字幕乱码亚洲无线精品一区| 亚洲字幕一区二区| eeuss鲁一区二区三区| 精品亚洲永久免费精品| 精品无码一区二区三区的天堂| 欧美激情综合网| 992tv人人草| 国产精品www.| 裸模一区二区三区免费| 91p九色成人| 久久亚洲精品小早川怜子66| 殴美一级特黄aaaaaa| 精品高清一区二区三区| xxxx日本黄色| 国产精品一区二区三区四区 | 日韩在线观看一区二区| 亚洲午夜精品一区二区三区| 久久久久久久久久久久电影| 97久久久久久| a视频网址在线观看| 91精品黄色片免费大全| 亚洲精品www久久久久久| 中文字幕精品一区二区三区精品| 三日本三级少妇三级99| 亚洲国产专区校园欧美| 午夜一区二区三区| 999在线精品| 国产精品久久中文| 电影k8一区二区三区久久 | 极品粉嫩小仙女高潮喷水久久 | 亚洲成人自拍网| 欧美成人国产精品一区二区| 国产精品系列在线播放| 黄色一级一级片| 欧美日韩国产一区精品一区| 日韩av一区二区三区在线| 97品白浆高清久久久久久| 国产精品久久久久久av福利软件| 欧美xxxx性xxxxx高清| 亚洲欧美另类人妖| 成人毛片视频免费看| 欧美日韩精品是欧美日韩精品| 中文字幕亚洲高清| 国产精品蜜臀av| 老熟妇精品一区二区三区| 久久99精品国产麻豆婷婷洗澡| 欧美成人免费在线观看视频| 亚洲v在线看| 日韩偷拍一区二区| 精品av导航| 91手机在线视频| 欧美一级免费| 国产不卡av在线| 激情黄产视频在线免费观看| 久久亚洲电影天堂| 北条麻妃在线| 日韩精品中文在线观看| 亚洲xxxx天美| 在线电影国产精品| 中国老头性行为xxxx| 色综合久久99| 成年人午夜视频| 亚洲午夜电影网| 91aaa在线观看| 国产精品久久久久久久岛一牛影视 | 成年人深夜视频| 一区二区三区四区电影| 亚洲一卡二卡区| 日韩久久久久| 亚洲图片欧洲图片日韩av| 国产欧美日韩精品一区二区三区 | 免费看的av网站| 久久99精品久久久久久动态图| 一区二区在线播放视频| 噜噜噜在线观看免费视频日韩| 亚洲 自拍 另类小说综合图区| 欧美日韩亚洲一区| 国产精品国产三级国产专区51| 国产精品久久久久久久久久10秀 | 魔女鞋交玉足榨精调教| 99国产欧美久久久精品| 亚洲欧美日韩偷拍| 成人av网在线| 国产福利在线观看视频| 成人av在线网| 三级黄色片网站| 久久众筹精品私拍模特| 中文字幕网站在线观看| 中文字幕乱码一区二区免费| www.xx日本| 亚洲丝袜另类动漫二区| 劲爆欧美第一页| 午夜天堂影视香蕉久久| 天堂网一区二区三区| 欧美性猛交丰臀xxxxx网站| 麻豆成人免费视频| 欧美中文字幕一区二区三区| 国产影视一区二区| 日韩一级在线观看| 人人妻人人玩人人澡人人爽| 亚洲精品理论电影| 国产视频二区在线观看| y97精品国产97久久久久久| 亚洲丝袜精品| 97精品免费视频| 粉嫩91精品久久久久久久99蜜桃| 国产视频观看一区| **爰片久久毛片| 欧美人xxxxx| 欧美r级电影| 美脚丝袜脚交一区二区| 久久久噜噜噜| 日本美女视频一区| 不卡视频在线看| 亚洲午夜精品久久久久久高潮| 欧美国产日韩精品免费观看| 国产suv一区二区三区| 五月天丁香久久| 日本视频www色| 欧美成人激情免费网| 青青青免费视频在线2| 精品国产欧美一区二区五十路 | 91在线高清视频| 国产伦精品一区二区三区免费优势| 日本婷婷久久久久久久久一区二区| 97精品一区| 无码精品a∨在线观看中文| 蜜臀久久99精品久久久久久9| 韩国一区二区三区四区| 久久久久88色偷偷免费| 青娱乐国产在线视频| 欧洲一区二区三区免费视频| 精品女同一区二区三区| 国产午夜精品一区理论片飘花 | 亚洲国产中文字幕| wwwwww在线观看| 亚洲高清免费观看高清完整版| 成年人视频在线免费观看| 欧美激情欧美狂野欧美精品| 日本综合视频| 国内视频一区二区| 亚洲精品久久| 性生活免费在线观看| 99久久婷婷国产综合精品 | 亚洲电影在线免费观看| 亚洲特级黄色片| 亚洲免费精彩视频| 日本在线观看大片免费视频| 国产女人18毛片水18精品| 日韩系列在线| 国产精品69久久久| 韩国v欧美v日本v亚洲v| 熟女少妇内射日韩亚洲| 精品久久久国产精品999| 国产农村妇女毛片精品久久| 亚洲女人初尝黑人巨大| 成人bbav| 国产高清在线一区二区| 中文字幕日韩一区二区不卡| xxww在线观看| 国产午夜亚洲精品不卡| 女人十八岁毛片| 精品久久久久一区二区国产| 超碰电影在线播放| 91精品国产自产在线观看永久| 国产一区二区三区四区| 阿v天堂2017| 成人av资源网站| 日韩成年人视频| 亚洲电影天堂av| 国模私拍视频在线播放| 97久草视频| 欧美激情在线| 欧美性猛交乱大交| 亚洲精品成a人| 亚洲国产精品成人久久蜜臀| 不卡av日日日| 午夜日韩影院| 中文字幕免费高| 国产真实乱偷精品视频免| 国产性生活大片| 8x福利精品第一导航| 激情成人四房播| 亚洲精品日韩激情在线电影| 欧美日韩国产欧| 大桥未久恸哭の女教师| 精品国产乱码久久久久久天美| 性插视频在线观看| 日韩av三级在线观看| 国产成人影院| 国产视频1区2区3区| 成人免费视频在线观看| 99久久久久成人国产免费| 欧美日韩成人免费| 国产图片一区| 国产精品免费成人| 欧美激情在线看| 国产毛片久久久久| 欧美国产日本在线| 日韩欧美黄色| 欧美精品性生活| 亚洲丝袜另类动漫二区| 欧美 日韩 国产 在线| 欧亚精品中文字幕| 久久美女视频| 中文字幕第六页| 精品美女国产在线| youjizz在线播放| 91精品啪在线观看麻豆免费| 狠狠色丁香久久综合频道| 国产精品1000部啪视频| 欧美性大战久久久久久久蜜臀 | 天天操天天操天天干| 国产97在线视频| 999久久久精品国产| 日批视频免费看| 色国产综合视频| av片在线观看网站| 乱一区二区三区在线播放| 激情久久五月天| 国产成人自拍视频在线| 中文字幕日韩av电影| 一区二区三区视频免费视频观看网站| 日本日本19xxxⅹhd乱影响| 国产精品乱人伦一区二区| 成人毛片视频免费看| 国产精自产拍久久久久久| 黄色精品免费| 人妻熟人中文字幕一区二区| 日韩精品一区二区三区swag| 日韩在线免费| 日韩精品在线视频免费观看| 中文字幕精品一区二区三区精品| 亚洲av永久无码国产精品久久| 国产福利精品视频|