精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

清華、哈工大把大模型壓縮到了1bit,把大模型放在手機里跑的愿望就快要實現了!

人工智能 新聞
近期,清華大學和哈爾濱工業大學聯合發布了一篇論文:把大模型壓縮到 1.0073 個比特時,仍然能使其保持約 83% 的性能!

自從大模型火爆出圈以后,人們對壓縮大模型的愿望從未消減。這是因為,雖然大模型在很多方面表現出優秀的能力,但高昂的的部署代價極大提升了它的使用門檻。這種代價主要來自于空間占用和計算量。「模型量化」 通過把大模型的參數轉化為低位寬的表示,進而節省空間占用。目前,主流方法可以在幾乎不損失模型性能的情況下把已有模型壓縮至 4bit。然而,低于 3bit 的量化像一堵不可逾越的高墻,讓研究人員望而生畏。

圖 1 : 量化模型的困惑度在 2bit 時迅速上升

近期,一篇由清華大學、哈爾濱工業大學合作發表在 arXiv 上的論文為突破這一阻礙帶來了希望,在國內外學術圈引起了不小的關注。這篇論文也在一周前登上 huggingface 的熱點論文,并被著名論文推薦師 AK 推薦。研究團隊直接越過 2bit 這一量化級別,大膽地進行了 1bit 量化的嘗試,這在模型量化的研究中尚屬首次。

圖片

論文標題:OneBit: Towards Extremely Low-bit Large Language Models

論文地址:https://arxiv.org/pdf/2402.11295.pdf

作者提出的方法稱作 「OneBit」,非常貼切地形容了這一工作的本質:把預訓練大模型壓縮到真正的 1bit。該論文提出了模型參數 1bit 表示的新方法,以及量化模型參數的初始化方法,并通過量化感知訓練(QAT)把高精度預訓練模型的能力遷移至 1bit 量化模型。實驗表明,這一方法能夠在極大幅度壓縮模型參數的同時,保證 LLaMA 模型至少 83% 的性能。

作者指出,當模型參數壓縮至 1bit 后,矩陣乘法中的 「元素乘」將不復存在,取而代之的是更快速的 「位賦值」操作,這將大大提升計算效率。這一研究的重要意義在于,它不但跨越了 2bit 量化的鴻溝,也使在 PC 和智能手機上部署大模型成為可能。

已有工作的局限性

模型量化主要通過把模型的 nn.Linear 層(Embedding 層和 Lm_head 層除外)轉化為低精度表示實現空間壓縮。此前工作 [1,2] 的基礎是利用 Round-To-Nearest(RTN)方法把高精度浮點數近似映射到附近的整數網格。這可以被表示成圖片。

然而基于 RTN 的方法在極低位寬時(3bit 以下)存在嚴重的精度損失問題,量化后的模型能力損失十分嚴重。特別是,量化后參數以 1bit 表示時,RTN 中的縮放系數 s 和零點 z 會失去實際意義。這導致基于 RTN 的量化方法在 1bit 量化時幾乎失效,難以有效地保留原模型的性能。

此外,此前的研究中也曾對 1bit 模型可能采用什么結構進行過探索。幾個月前的工作 BitNet [3] 通過讓模型參數通過 Sign (?) 函數并轉為 + 1/-1 來實現 1bit 表示。但這一方法存在性能損失嚴重、訓練過程不穩定的問題,限制了其實際應用。

OneBit 框架

OneBit 的方法框架包括全新的 1bit 層結構、基于 SVID 的參數初始化方法和基于量化感知知識蒸餾的知識遷移。

1. 新的 1bit 結構

OneBit 的終極目標是將 LLMs 的權重矩陣壓縮到 1bit。真正的 1bit 要求每個權重值只能用 1bit 表示,即只有兩種可能的狀態。作者認為,在大模型的參數中,有兩個重要因素都必須被考慮進來,那就是浮點數的高精度和參數矩陣的高秩。

因此,作者引入兩個 FP16 格式的值向量以補償由于量化導致的精度損失。這種設計不僅保持了原始權重矩陣的高秩,而且通過值向量提供了必要的浮點精度,有助于模型的訓練和知識遷移。1bit 線性層的結構與 FP16 高精度線性層的結構對比如下圖:

圖 3 : FP16 線性層與 OneBit 線性層的對比

左側的 (a) 是 FP16 精度模型結構,右側的 (b) 是 OneBit 框架的線性層??梢?,在 OneBit 框架中,只有值向量 g 和 h 保持 FP16 格式,而權重矩陣則全部由 ±1 組成。這樣的結構兼顧了精度和秩,對保證穩定且高質量的學習過程很有意義。

OneBit 對模型的壓縮幅度究竟如何?作者在論文中給了一個計算。假設對一個 4096*4096 的線性層進行壓縮,那么 OneBit 需要一個 4096*4096 的 1bit 矩陣,和兩個 4096*1 的 16bit 值向量。這里面總的位數為 16,908,288,總的參數個數為 16,785,408,平均每個參數占用僅僅約 1.0073 個 bit。這樣的壓縮幅度是空前的,可以說是真正的 1bit 大模型。

2. 基于 SVID 初始化量化模型

為了使用充分訓練好的原模型更好地初始化量化后的模型,進而促進更好的知識遷移效果,作者提出一種新的參數矩陣分解方法,稱為 「值 - 符號獨立的矩陣分解(SVID)」。這一矩陣分解方法把符號和絕對值分開,并把絕對值進行秩 - 1 近似,其逼近原矩陣參數的方式可以表示成:

圖片

這里的秩 - 1 近似可以通過常見的矩陣分解方式實現,例如奇異值分解(SVD)和非負矩陣分解(NMF)。而后,作者在數學上給出這種 SVID 方法可以通過交換運算次序來和 1bit 模型框架相匹配,進而實現參數初始化。并且,論文還證明了符號矩陣在分解過程中確實起到了近似原矩陣的作用。

3. 通過知識蒸餾遷移原模型能力

作者指出,解決大模型超低位寬量化的有效途徑可能是量化感知訓練 QAT。在 OneBit 模型結構下,通過知識蒸餾從未量化模型中學習,實現能力向量化模型的遷移。具體地,學生模型主要接受教師模型 logits 和 hidden state 的指導。

 

 

訓練時,值向量和矩陣的值會被更新。模型量化完成后,直接把 Sign (?) 后的參數保存下來,在推理和部署時直接使用。

實驗及結果

OneBit 與 FP16 Transformer、經典的訓練后量化強基線 GPTQ、量化感知訓練強基線 LLM-QAT 和最新的 2bit 權重量化強基線 OmniQuant 進行了比較。此外,由于目前還沒有 1bit 權重量化的研究,作者只對自己的 OneBit 框架使用了 1bit 權重量化,而對其他方法采取 2bit 量化設置,屬于典型的 「以弱勝強」。

在模型選擇上,作者也選擇了從 1.3B 到 13B 不同大小、OPT 和 LLaMA-1/2 不同系列的模型來證明 OneBit 的有效性。在評價指標上,作者沿用了以往模型量化的兩大評價維度:驗證集的困惑度和常識推理的 Zero-shot 準確度。

表 1 : OneBit 與基線方法的效果比較(OPT 模型與 LLaMA-1 模型)

圖片

表 2 : OneBit 與基線方法的效果比較(LLaMA-2 模型)

表 1 和表 2 展示出了 OneBit 相比于其他方法在 1bit 量化時的優勢。就量化模型在驗證集的困惑度而言,OneBit 與 FP16 模型最為接近。就 Zero-shot 準確度而言,除 OPT 模型的個別數據集外,OneBit 量化模型幾乎取得了最佳的性能。其余的 2bit 量化方法在兩種評價指標上呈現較大的損失。

值得注意的是,OneBit 在模型越大時,效果往往越好。也就是說,隨著模型規模增大,FP16 精度模型在困惑度降低上收效甚微,但 OneBit 卻表現出更多的困惑度下降。此外,作者還指出量化感知訓練對于超低位寬量化或許十分有必要。

圖片

圖 4 : 常識推理任務對比

圖片

圖 5 : 世界知識對比

圖 6 : 幾種模型的空間占用和平均位寬

圖 4 - 圖 6 還對比了幾類小模型的空間占用和性能損失,它們是通過不同的途徑獲得的:包括兩個充分訓練的模型 Pythia-1.0B 和 TinyLLaMA-1.1B,以及通過低秩分解獲得的 LowRank Llama 和 OneBit-7B。可以看出,盡管 OneBit-7B 有最小的平均位寬、占用最小的空間,它在常識推理能力上仍然優于不遜于其他模型。作者同時指出,模型在社會科學領域面臨較嚴重的知識遺忘??偟膩碚f,OneBit-7B 展示出了其實際應用價值。正如圖 7 所展示的,OneBit 量化后的 LLaMA-7B 模型經過指令微調后,展示出了流暢的文本生成能力。

圖片

圖 7 : OneBit 框架量化后的 LLaMA-7B 模型的能力

討論與分析

1. 效率

表 3 : OneBit 在不同 LLaMA 模型的壓縮比

表 3 給出的是 OneBit 對不同規模 LLaMA 模型的壓縮比??梢钥闯?,OneBit 對模型的壓縮比均超過 90%,這一壓縮能力是史無前例的。其中值得注意的是,隨著模型增大,OneBit 的壓縮比越高,這是由于 Embedding 層這種不參與量化的參數占比越來越小。前文提到,模型越大,OneBit 帶來的性能增益越大,這顯示出 OneBit 在更大模型上的優勢。

圖片

圖 8 : 模型大小與性能的權衡

雖然超低比特量化可能會導致一定的性能損失,但如圖 8 所示,它在大小和性能之間達到了良好的平衡。作者認為,壓縮模型的大小十分重要,特別是在移動設備上部署模型時。

此外,作者還指出了 1bit 量化模型在計算上的優勢。由于參數是純二進制的,可以用 0/1 在 1bit 內表示,這毫無疑問地節省大量的空間。高精度模型中矩陣乘法的元素相乘可以被變成高效的位運算,只需位賦值和加法就可以完成矩陣乘積,非常有應用前景。

2. 魯棒性

二值網絡普遍面臨訓練不穩定、收斂困難的問題。得益于作者引入的高精度值向量,模型訓練的前向計算和后向計算均表現的十分穩定。BitNet 更早地提出 1bit 模型結構,但該結構很難從充分訓練的高精度模型中遷移能力。如圖 9 所示,作者嘗試了多種不同的學習率來測試 BitNet 的遷移學習能力,發現在教師指導下其收斂難度較大,也在側面證明了 OneBit 的穩定訓練價值。

圖 9 : BitNet 在多種不同學習率下的訓練后量化能力

論文的最后,作者還建議了超低位寬未來可能得研究方向。例如,尋找更優的參數初始化方法、更少的訓練代價,或進一步考慮激活值的量化。

更多技術細節請查看原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-03-11 09:27:00

框架模型AI

2023-09-23 12:36:32

蘋果模型

2024-01-29 11:56:23

數據AI

2023-11-03 07:47:12

機器資源大模型:

2025-06-16 14:39:56

模型開源框架

2025-11-21 12:02:41

2024-02-29 11:56:48

2023-07-05 14:01:50

AI技術

2024-03-18 10:38:03

模型算法

2024-01-03 17:40:49

模型AI

2025-07-31 06:45:00

大模型LLMOpenAI

2025-02-12 12:45:59

2023-11-05 10:04:47

2025-09-02 10:03:34

2024-05-10 12:58:08

2025-02-28 12:32:42

2024-03-18 09:22:43

AI模型

2023-08-17 16:07:16

模型優化

2023-09-04 15:42:19

人工智能
點贊
收藏

51CTO技術棧公眾號

国产对白videos麻豆高潮| 伊人五月天婷婷| 青青草视频在线观看| 日韩中文字幕区一区有砖一区| 在线日韩第一页| 性色av浪潮av| 日韩成人影音| 亚洲精品国产成人久久av盗摄| 久久er99热精品一区二区三区| 中文精品久久久久人妻不卡| 欧美精品一区二区三区久久久竹菊| 日韩国产一区三区| 欧美精品 - 色网| 欧美极品影院| 亚洲国产wwwccc36天堂| 亚洲色图自拍| 欧美精品久久久久久久久久丰满| 国内精品国产三级国产a久久| 91精品国产99久久久久久| 国产福利在线导航| 婷婷综合福利| 日韩精品中文字幕在线不卡尤物 | 欧美专区18| 欧美大胆a视频| 日本成人午夜影院| 欧美精品密入口播放| 欧美一区二区三区爱爱| www.超碰com| av资源中文在线| 亚洲女子a中天字幕| 久久综合给合久久狠狠色| 亚洲精品成av人片天堂无码 | 男人的天堂免费| 国产精品蜜月aⅴ在线| 欧美日韩国产一区二区| 成人小视频在线观看免费| 9191在线观看| 国产精品午夜在线观看| 欧美在线日韩精品| 日本黄在线观看| 99久久综合精品| 99久久精品无码一区二区毛片| 一级特黄aa大片| 日韩精品色哟哟| 日本不卡视频在线播放| 日本一级淫片色费放| 欧美日韩视频| 欧美肥臀大乳一区二区免费视频| 国产精品免费人成网站酒店| 中文字幕精品影院| 国产丝袜精品视频| av网站免费在线看| 国产乱码精品一区二区三区四区| 日韩成人av在线| 日本黄色免费观看| 秋霞影视一区二区三区| 日韩精品一二三四区| 好吊日免费视频| 亚洲春色h网| 亚洲欧美一区二区精品久久久| 亚洲专区区免费| 美女亚洲一区| 国产亚洲欧美aaaa| 天堂网中文在线观看| 99国产精品一区二区| 久久精品小视频| 男人操女人的视频网站| 黑人一区二区三区四区五区| 久久久亚洲成人| av大片在线免费观看| 麻豆九一精品爱看视频在线观看免费| 欧美在线免费看| 成人黄色三级视频| 精品午夜一区二区三区在线观看 | 欧美在线观看视频网站| 欧美与亚洲与日本直播| 67194成人在线观看| 亚洲少妇一区二区| 亚洲+小说+欧美+激情+另类 | 久久久久久久有限公司| 国产福利在线看| 亚洲激情图片qvod| 欧美一区二区中文字幕| 欧美日韩视频免费观看| 欧美久久久久久久久久| 中文字幕乱码一区| 欧美日中文字幕| 色综合久久天天综线观看| 天天操天天射天天爽| 久久深夜福利| 亚洲已满18点击进入在线看片| 天天综合天天色| 国产精品美女久久久久久久久 | 唐朝av高清盛宴| 国产精品视区| 成人亚洲激情网| 无码国精品一区二区免费蜜桃| 国产日本欧美一区二区| 青草全福视在线| 欧美国产大片| 日韩视频免费直播| 亚洲自拍偷拍图| 黄色成人在线网址| 国产免费成人av| 三级国产在线观看| 一区二区三区在线视频播放| 国产一区二区视频免费在线观看| 美国十次综合久久| 国产亚洲精品一区二555| 精品少妇爆乳无码av无码专区| 久久国产福利| 国产精品免费一区二区三区| 秋霞a级毛片在线看| 欧美日韩激情小视频| 男女视频在线观看网站| 国产亚洲电影| 7777精品视频| 亚洲成人黄色片| 亚洲欧洲日本在线| 色一情一乱一伦一区二区三区日本| 日韩在线观看中文字幕| 日韩中文字幕精品| 国产99免费视频| 91原创在线视频| 欧美精品卡一卡二| 日本成人手机在线| 精品国偷自产在线视频99| 久久精品国产亚洲av麻豆蜜芽| 99精品视频在线免费观看| 九九久久九九久久| 国产精品亚洲综合在线观看| 中文字幕一精品亚洲无线一区 | 欧美不卡三区| 国产白浆在线免费观看| 亚洲国产精品久久久久| 我家有个日本女人| 国产精品91xxx| 综合一区中文字幕| 欧美一级做a| 久久精品99久久久香蕉| 一卡二卡在线视频| 中文字幕日韩av资源站| 免费一区二区三区在线观看 | 在线成人中文字幕| 成人黄色激情视频| 国产婷婷色一区二区三区在线| 蜜臀av午夜一区二区三区| 免费欧美视频| 国产99视频在线观看| 国产福利片在线| 欧美色图在线观看| 国产人与禽zoz0性伦| 国产一区在线观看麻豆| 黄色免费高清视频| 久久伦理中文字幕| 欧美黄色片视频| 少妇高潮久久久| 欧美网站在线观看| 欧美黄色高清视频| 免费成人在线网站| 91xxx视频| 粉嫩久久久久久久极品| 5278欧美一区二区三区| 国产精品无码2021在线观看| 欧美日韩一区三区四区| 日韩影院一区二区| 成人av资源网站| 欧美一级黄色片视频| 99国产精品一区二区| 丁香五月网久久综合| 高端美女服务在线视频播放| 国产亚洲欧美aaaa| 99国产精品久久久久99打野战| 亚洲黄网站在线观看| 久久福利小视频| 日韩国产欧美三级| 懂色av粉嫩av蜜臀av| 久久黄色影视| 国产精品美女免费视频| 伊人春色在线观看| 日韩精品www| 亚洲一区二区色| 亚洲一区二区三区四区在线观看 | 美女做暖暖视频免费在线观看全部网址91 | 黄色精品一二区| 青草青青在线视频| 成人久久久久| 粉嫩精品一区二区三区在线观看| 不卡av影片| 久久久成人av| 深夜福利视频在线免费观看| 欧美日韩不卡在线| 日本少妇bbwbbw精品| 国产精品五月天| 蜜臀av粉嫩av懂色av| 欧美aⅴ一区二区三区视频| 国产精品igao激情视频| 国产一区不卡| 国产伦精品一区二区三区视频孕妇| 裤袜国产欧美精品一区| 久久6免费高清热精品| 黄色av网址在线免费观看| 日韩欧美国产wwwww| 欧美三级网站在线观看| 亚洲一区二区三区视频在线播放| 亚洲高潮女人毛茸茸| 波多野结衣中文一区| 一区二区在线免费看| 香蕉亚洲视频| 成人短视频在线观看免费| 欧美精品一区二区三区精品| 国产伦精品一区二区三区照片| 色婷婷成人网| 日韩美女毛茸茸| 丁香花在线电影小说观看 | 极品美鲍一区| 欧美成人精品h版在线观看| 国产视频第一页在线观看| 精品国产sm最大网站免费看| 国产精品嫩草影院精东| 色噜噜久久综合| 国产成人无码一区二区三区在线 | 日韩精品免费一区| 天天射综合网视频| 性高潮久久久久久久久| 国产成人调教视频在线观看| 精品国产一区二区三区麻豆小说| 9999在线精品视频| 国产免费一区视频观看免费| 免费成人直播| 欧美一级电影久久| 国产麻豆精品久久| 成人片在线免费看| а天堂中文最新一区二区三区| 国产91免费观看| 国产拍在线视频| 国内精品模特av私拍在线观看| 国产黄大片在线观看画质优化| 在线视频日本亚洲性| 蜜桃成人在线视频| 亚洲欧洲在线观看| 日本a一级在线免费播放| 日韩精品亚洲精品| 欧美欧美欧美| 亚洲欧洲偷拍精品| 第九色区av在线| 一区二区三区国产视频| 国产精品四虎| 色妞色视频一区二区三区四区| 国产精品毛片一区二区三区四区| 亚洲欧美自拍一区| 8888四色奇米在线观看| 日韩中文字幕久久| 综合久久2o19| 久久久久久久久久婷婷| √8天堂资源地址中文在线| 国内精品国产三级国产在线专| 中文字幕伦理免费在线视频 | 日韩av一区二区在线影视| 黑森林福利视频导航| 日韩激情在线观看| 制服丝袜中文字幕第一页| 国产一区二区福利| 亚洲图片欧美另类| 91老师片黄在线观看| 在线免费观看黄色小视频| 国产视频一区不卡| 亚洲视频重口味| 亚洲在线一区二区三区| 日韩精品在线免费看| 一本久久精品一区二区| 中文字幕人妻互换av久久| 欧美精品在线观看一区二区| www.天堂av.com| 日韩成人中文字幕| 第三区美女视频在线| 欧美成人三级视频网站| 成人黄色动漫| 国产精品久久一| 老司机亚洲精品一区二区| 久久伦理网站| 国产精品成久久久久| 国产精品一色哟哟| 视频一区二区中文字幕| 天天综合成人网| 99久久久久久99| 日本一级片免费| 性欧美疯狂xxxxbbbb| 探花国产精品一区二区| 欧美一卡2卡3卡4卡| 青青青手机在线视频观看| 日韩网站在线观看| 天堂电影一区| 91在线网站视频| 免费一区二区| 黄色网在线视频| 蜜臀久久久久久久| 国产xxxxxxxxx| 亚洲欧美视频在线观看| 麻豆成人免费视频| 日韩欧美国产高清| a黄色在线观看| 午夜精品久久久久久久久久久久久| 91久久久久久白丝白浆欲热蜜臀| 懂色av一区二区三区在线播放| 日韩免费久久| 国产三区在线视频| 国产成人精品免费看| 无码人中文字幕| 欧美色视频日本高清在线观看| 99久久免费国产精精品| 亚洲午夜未满十八勿入免费观看全集| 在线观看wwwxxxx| 国产欧美日韩高清| 欧美激情在线免费| www.av毛片| 国产成人亚洲精品狼色在线| 中文字幕第二区| 欧美视频13p| 少妇高潮久久久| 欧美丰满少妇xxxx| 欧美日本三级| 在线视频亚洲自拍| 日本不卡视频在线观看| 国产呦小j女精品视频| 亚洲二区视频在线| 亚洲第一页视频| 精品国产一区av| 四虎成人在线| 欧美日韩国产不卡在线看| 日韩午夜高潮| 中文字幕99页| 一区二区国产视频| 99热这里精品| 欧美成人精品在线播放| 日本免费成人| 一区二区精品在线观看| 免费看欧美女人艹b| 在线观看日本中文字幕| 在线视频国内一区二区| 黄色的视频在线免费观看| 日本精品视频在线| 久久99青青| 热久久精品免费视频| 国产精品三级视频| 中文字幕 国产| 综合136福利视频在线| 成人午夜毛片| 亚洲在线播放电影| 激情综合色综合久久| 成人自拍小视频| 欧美一级二级在线观看| 午夜在线激情影院| 国产精品免费一区二区三区在线观看| 国内精品美女在线观看 | 91影院在线播放| 久久视频免费观看| 日本成人精品| 国产91xxx| 久久亚洲综合色| 中文字幕+乱码+中文乱码91| 色噜噜狠狠狠综合曰曰曰88av| 亚洲精品毛片| 欧美极品少妇无套实战| av成人老司机| 高潮毛片又色又爽免费 | 亚洲国产欧美久久| 国产免费不卡| 亚洲图色在线| 国产成人午夜片在线观看高清观看| 日本特黄一级片| 国产午夜精品美女视频明星a级| 久久久久久一区二区三区四区别墅 | 蜜桃91麻豆精品一二三区| 久久久久久午夜| 猛男gaygay欧美视频| 污视频网址在线观看| 一区二区三区四区在线免费观看| 亚洲av成人精品日韩在线播放| 国产精品久久久久久久7电影| 91精品国产91久久久久久密臀| 国产亚洲精品成人a| 色哟哟欧美精品| 欧美成人高清在线| 成人动漫在线观看视频| 天堂资源在线中文精品| 国产高潮国产高潮久久久91| 亚洲精品一区二区三区不| 四虎国产精品永久在线国在线| 日本香蕉视频在线观看| 国产日韩欧美不卡在线| 午夜久久久久久久久久| 国产成人综合久久| 女人天堂亚洲aⅴ在线观看| 亚洲国产欧美视频| 日韩一区二区在线播放| 欧美色网在线| 国产真人做爰毛片视频直播| 中文字幕精品三区| 香蕉视频成人在线|