精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

650億參數(shù),8塊GPU就能全參數(shù)微調(diào):邱錫鵬團隊把大模型門檻打下來了

人工智能 新聞
全參數(shù)微調(diào)的顯存使用量和推理一樣多,大模型不再只是大型科技公司的玩具了。

在大模型方向上,科技巨頭在訓更大的模型,學界則在想辦法搞優(yōu)化。最近,優(yōu)化算力的方法又上升到了新的高度。

大型語言模型(LLM)徹底改變了自然語言處理(NLP)領(lǐng)域,展示了涌現(xiàn)、頓悟等非凡能力。然而,若想構(gòu)建出具備一定通用能力的模型,就需要數(shù)十億參數(shù),這大幅提高了 NLP 研究的門檻。在 LLM 模型調(diào)優(yōu)過程中通常又需要昂貴的 GPU 資源,例如 8×80GB 的 GPU 設(shè)備,這使得小型實驗室和公司很難參與這一領(lǐng)域的研究。

最近,人們正在研究參數(shù)高效的微調(diào)技術(shù)(PEFT),例如 LoRA 和 Prefix-tuning,為利用有限資源對 LLM 進行調(diào)優(yōu)提供了解決方案。然而,這些方法并沒有為全參數(shù)微調(diào)提供實用的解決方案,而全參數(shù)微調(diào)已被公認為是比參數(shù)高效微調(diào)更強大的方法。

在上周復旦大學邱錫鵬團隊提交的論文《Full Parameter Fine-tuning for Large Language Models with Limited Resources》中,研究人員提出了一種新的優(yōu)化器 LOw-Memory Optimization(LOMO)。

通過將 LOMO 與現(xiàn)有的內(nèi)存節(jié)省技術(shù)集成,與標準方法(DeepSpeed 解決方案)相比,新方法將內(nèi)存使用量減少到了之前的 10.8%。因此,新方法能夠在一臺具有 8×RTX 3090 的機器上對 65B 模型進行全參數(shù)微調(diào),每個 RTX 3090 具有 24GB 內(nèi)存。

圖片

論文鏈接:https://arxiv.org/abs/2306.09782

在該工作中,作者分析了 LLM 中內(nèi)存使用的四個方面:激活、優(yōu)化器狀態(tài)、梯度張量和參數(shù),并對訓練過程進行了三方面的優(yōu)化:

  1. 從算法的角度重新思考了優(yōu)化器的功能,發(fā)現(xiàn) SGD 在微調(diào) LLM 完整參數(shù)方面是一種很好的替代品。這使得作者可以刪除優(yōu)化器狀態(tài)的整個部分,因為 SGD 不存儲任何中間狀態(tài)。
  2. 新提出的優(yōu)化器 LOMO 將梯度張量的內(nèi)存使用量減少到 O (1),相當于最大梯度張量的內(nèi)存使用量。
  3. 為了使用 LOMO 穩(wěn)定混合精度訓練,作者集成了梯度歸一化、損失縮放,并在訓練期間將某些計算轉(zhuǎn)換為全精度。

新技術(shù)讓內(nèi)存的使用等于參數(shù)使用加上激活和最大梯度張量。全參數(shù)微調(diào)的內(nèi)存使用被推向了極致,其僅等同于推理的使用。這是因為 forward+backward 過程的內(nèi)存占用應該不會比單獨的 forward 過程少。值得注意的是,在使用 LOMO 節(jié)省內(nèi)存時,新方法確保了微調(diào)過程不受影響,因為參數(shù)更新過程仍然等同于 SGD。

該研究評估了 LOMO 的內(nèi)存和吞吐量性能,表明借助 LOMO,研究者在 8 個 RTX 3090 GPU 上就可以訓練 65B 參數(shù)的模型。此外,為了驗證 LOMO 在下游任務上的性能,他們應用 LOMO 來調(diào)優(yōu) SuperGLUE 數(shù)據(jù)集集合上 LLM 的全部參數(shù)。結(jié)果表明了 LOMO 對具有數(shù)十億參數(shù)的 LLM 進行優(yōu)化的有效性。

方法介紹

在方法部分,本文詳細介紹了 LOMO(LOW-MEMORY OPTIMIZATION)。一般而言,梯度張量表示一個參數(shù)張量的梯度,其大小與參數(shù)相同,這樣一來內(nèi)存開銷較大。而現(xiàn)有的深度學習框架如 PyTorch 會為所有參數(shù)存儲梯度張量。現(xiàn)階段,存儲梯度張量有兩方面原因:計算優(yōu)化器狀態(tài)以及歸一化梯度。

由于該研究采用 SGD 作為優(yōu)化器,因此沒有依賴于梯度的優(yōu)化器狀態(tài),并且他們有一些梯度歸一化的替代方案。

他們提出了 LOMO,如算法 1 所示,LOMO 將梯度計算與參數(shù)更新融合在一個步驟中,從而避免了梯度張量的存儲。

下圖為 SGD 和 LOMO 在反向傳播和參數(shù)更新階段的比較。Pi 為模型參數(shù),Gi 為 Pi 對應的梯度。LOMO 將梯度計算和參數(shù)更新融合到一個步驟中,使梯度張量最小。

圖片

LOMO 對應的算法偽代碼:

圖片

具體而言,該研究將 vanilla 梯度下降表示為

圖片

,這是一個兩步過程,首先是計算梯度,然后更新參數(shù)。融合版本為 

圖片

 該研究的關(guān)鍵思想是在計算梯度時立即更新參數(shù),這樣就不會在內(nèi)存中存儲梯度張量。這一步可以通過在向反向傳播中注入 hook 函數(shù)來實現(xiàn)。PyTorch 提供了注入 hook 函數(shù)的相關(guān) API,但卻無法用當前的 API 實現(xiàn)精確的即時更新。相反,該研究在內(nèi)存中最多存儲一個參數(shù)的梯度,并隨著反向傳播逐一更新每個參數(shù)。本文方法減少了梯度的內(nèi)存使用,從存儲所有參數(shù)的梯度到只存儲一個參數(shù)的梯度。

大部分 LOMO 內(nèi)存使用與參數(shù)高效微調(diào)方法的內(nèi)存使用一致,這表明 LOMO 與這些方法相結(jié)合只會導致梯度占用內(nèi)存的輕微增加。這樣就可以為 PEFT 方法調(diào)優(yōu)更多的參數(shù)。

實驗結(jié)果

在實驗部分,研究者從三個方面評估了他們提出的方法,即內(nèi)存使用情況、吞吐量和下游性能。如果不作進一步解釋,所有的實驗都是用 7B 到 65B 的 LLaMA 模型進行的。

內(nèi)存使用情況

研究者首先剖析了,在不同設(shè)置下,訓練期間的模型狀態(tài)和激活的內(nèi)存使用情況。如表 1 所示,與 AdamW 優(yōu)化器相比,LOMO 優(yōu)化器的使用導致內(nèi)存占用大幅減少,從 102.20GB 減少到 14.58GB;與 SGD 相比,在訓練 LLaMA-7B 模型時,內(nèi)存占用從 51.99GB 減少到 14.58GB。內(nèi)存用量的大幅減少主要歸因于梯度和優(yōu)化器狀態(tài)的內(nèi)存需求減少。因此,在訓練過程中,內(nèi)存大部分被參數(shù)占據(jù),與推理過程中的內(nèi)存用量相當。

圖片

如圖 2 所示,如果采用 AdamW 優(yōu)化器進行 LLaMA-7B 訓練,相當大比例的內(nèi)存(73.7%)被分配給優(yōu)化器狀態(tài)。用 SGD 優(yōu)化器替換 AdamW 優(yōu)化器可以有效減少優(yōu)化器狀態(tài)占用內(nèi)存的百分比,從而減輕 GPU 內(nèi)存使用(從 102.20GB 減少到 51.99GB)。如果使用 LOMO,參數(shù)更新和 backward 會被融合到一個步驟中,進一步消除優(yōu)化器狀態(tài)對內(nèi)存的需求。

圖片

吞吐量

研究者比較了 LOMO、AdamW 和 SGD 的吞吐性能。實驗是在一臺配備了 8 個 RTX 3090 GPU 的服務器上進行的。

對于 7B 的模型,LOMO 的吞吐量呈現(xiàn)顯著優(yōu)勢,超過 AdamW 和 SGD 約 11 倍。這一重大改進可歸功于 LOMO 在單個 GPU 上訓練 7B 模型的能力,這減少了 GPU 間的通信開銷。與 AdamW 相比,SGD 的吞吐量略高,這可歸因于 SGD 排除了動量和方差的計算。

至于 13B 模型,由于內(nèi)存的限制,它無法在現(xiàn)有的 8 個 RTX 3090 GPU 上用 AdamW 訓練。在這種情況下,模型的并行性對 LOMO 來說是必要的,LOMO 在吞吐量方面仍然優(yōu)于 SGD。這一優(yōu)勢歸功于 LOMO 的內(nèi)存高效特性,以及只需要兩個 GPU 以相同的設(shè)置來訓練模型,從而降低了通信成本,提高了吞吐量。此外,在訓練 30B 模型時,SGD 在 8 個 RTX 3090 GPU 上遇到了內(nèi)存不足(OOM)的問題,而 LOMO 在只有 4 個 GPU 的情況下表現(xiàn)良好。

最后,研究者使用 8 個 RTX 3090 GPU 成功訓練了 65B 模型,實現(xiàn)了 4.93 TGS 的吞吐量。利用這樣的服務器配置和 LOMO,模型在 1000 個樣本上的訓練過程(每個樣本包含 512 個 token)大約需要 3.6 小時。

下游性能

為了評估 LOMO 在微調(diào)大型語言模型方面的有效性,研究者進行了一系列廣泛的實驗。他們將 LOMO 與其他兩種方法進行比較,一種是不需要微調(diào)的 Zero-shot,另一種是目前很流行的參數(shù)高效微調(diào)技術(shù) LoRA。

圖片

表 3 結(jié)果顯示:

  • LOMO 的表現(xiàn)明顯好于 Zero-shot;
  • 在大多數(shù)實驗中,LOMO 普遍優(yōu)于 LoRA;
  • LOMO 可以有效擴展至 650 億參數(shù)的模型。

LOMO 和 LoRA 在本質(zhì)上是相互獨立的。為了驗證這一說法,研究者使用 LLaMA-13B 在 BoolQ 和 MultiRC 數(shù)據(jù)集上進行了實驗。結(jié)果如圖 3 所示。

他們發(fā)現(xiàn),LOMO 在持續(xù)增強 LoRA 的性能,不管 LoRA 取得的結(jié)果有多高。這表明,LOMO 和 LoRA 采用的不同微調(diào)方法是互補的。具體來說,LOMO 專注于微調(diào)預訓練模型的權(quán)重,而 LoRA 則調(diào)整其他模塊。因此,LOMO 不會影響到 LoRA 的性能;相反,它有助于對下游任務進行更好的模型調(diào)優(yōu)。

圖片

更多細節(jié)參見原論文。

責任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2023-11-24 12:11:35

2024-02-28 11:37:53

英偉達AI

2021-06-11 15:02:36

模型人工智能深度學習

2023-12-13 12:55:39

模型數(shù)據(jù)

2022-08-20 07:52:56

語言模型參數(shù)PaLM

2023-09-12 17:52:00

模型智能

2022-11-09 17:12:38

AI模型

2023-10-30 14:59:28

2024-01-06 17:39:47

數(shù)據(jù)視頻

2023-06-26 12:49:25

2023-09-23 12:35:19

模型參數(shù)

2024-03-04 12:32:20

模型訓練

2023-06-02 15:47:49

2023-08-10 14:04:15

代碼模型

2023-07-18 15:05:00

開源大模型

2023-02-25 16:14:36

AIMeta語言模型

2025-07-08 03:22:00

大模型參數(shù)AI

2024-01-18 15:38:17

語言模型大型語言模型

2023-06-07 17:55:01

模型性能

2023-01-04 12:47:05

AI
點贊
收藏

51CTO技術(shù)棧公眾號

国产精品视频一区二区三区,| 中文字幕在线1| 欧美亚洲天堂| 99re66热这里只有精品3直播| 国产91色在线播放| 精品无码一区二区三区蜜臀 | 丁香五六月婷婷久久激情| 久久99精品久久久久子伦| 中文字幕在线播放av| 国产精品啊v在线| 国产香蕉精品视频一区二区三区| 久久人人爽av| 极品视频在线| 日韩理论片网站| 蜜桃麻豆91| www.国产三级| 蜜臀久久99精品久久久画质超高清| 欧美精品在线看| 精品国产成人亚洲午夜福利| 中文字幕av一区二区三区四区| 色欧美片视频在线观看| 99久久免费观看| 在线观看国产原创自拍视频| av资源站一区| 亚洲影院在线看| 日韩乱码一区二区三区| 99精品福利视频| 不卡中文字幕av| www.日本高清视频| 亚洲动漫在线观看| 精品久久久久久久久久久久久久久 | 91麻豆精品国产91| 亚洲欧美另类动漫| 综合日韩av| 五月婷婷另类国产| 国产精品久久国产| 在线你懂的视频| 国产精品久久久一区麻豆最新章节| 九色综合日本| 少妇一区二区三区四区| 高清免费成人av| 成人精品在线视频| 亚洲天堂视频网| 可以免费看不卡的av网站| 久久久久国色av免费观看性色 | 亚洲香肠在线观看| 国产911在线观看| 欧美性猛交xxx乱大交3蜜桃| 亚洲国产精品99久久久久久久久| 欧美极品一区二区| 日韩大胆视频| 91视频免费观看| 国产亚洲二区| 手机在线不卡av| 成人免费黄色在线| 国产精品国色综合久久| 高清乱码毛片入口| 波多野结衣91| 国产在线精品一区二区三区| 色一情一乱一区二区三区| 成人免费看黄yyy456| 国产精品久久久久久久久久久久午夜片 | 精品动漫av| 午夜剧场成人观在线视频免费观看| 麻豆精品一区二区三区视频| 欧美激情视频一区二区三区在线播放| 另类色图亚洲色图| 久草视频免费在线播放| 精品69视频一区二区三区Q| 午夜精品一区二区三区在线| 中文字字幕在线中文| 影音先锋亚洲电影| 欧美亚洲在线播放| 欧美一级做a爰片免费视频| 欧美a级理论片| 91人成网站www| 成人毛片在线精品国产| 26uuu另类欧美| 亚洲国产欧美日韩| 亚洲图区一区| 丰满岳妇乱一区二区三区| 国产精品69页| 人人精品久久| 精品国产伦一区二区三区免费| 99re久久精品国产| 成人vr资源| 欧美成人免费小视频| 国产精选第一页| 久久精品欧洲| 92国产精品久久久久首页| 丰满熟妇人妻中文字幕| 国产亚洲一区二区三区四区| 国产精品jizz在线观看老狼| 97se在线视频| 色综合视频网站| 国产性生活免费视频| www.久久久| 欧美中文在线字幕| 国产视频久久网| 亚洲日本在线a| 激情欧美日韩| f2c人成在线观看免费视频| 欧美日韩在线中文字幕| 中文字幕av久久爽av| 久久uomeier| 欧美日韩国产精品成人| 男男受被啪到高潮自述| 岳的好大精品一区二区三区| 日韩视频精品在线| 久久久久久久久影院| 久久99热狠狠色一区二区| 国产一区二区三区黄| 国产区视频在线播放| 一区二区三区日韩精品| 国产免费视频传媒| 第一区第二区在线| 久久精品电影一区二区| 麻豆精品久久久久久久99蜜桃| 激情小说亚洲一区| 日本免费高清一区二区| 成人黄色动漫| 日韩精品一区二区三区蜜臀| 日本高清黄色片| 亚洲一区二区网站| 国产精品自拍首页| 黄色免费网站在线观看| 在线看国产一区二区| 日本一级片在线播放| 中文字幕一区二区三区欧美日韩 | 国产三级av在线播放| 欧美黄色免费| 成人黄色av播放免费| 国内三级在线观看| 欧美性猛交xxx| 四虎精品一区二区| 欧美网站在线| 亚洲最大福利视频网| 91美女视频在线| 欧美在线免费观看亚洲| a毛片毛片av永久免费| 国产日韩欧美一区| 国严精品久久久久久亚洲影视| www免费在线观看| 91精品国产综合久久精品 | 精品一区不卡| 日韩美女免费观看| 青草久久伊人| 日韩欧美亚洲综合| 亚洲午夜福利在线观看| 一本色道88久久加勒比精品| 国产日产精品一区二区三区四区| 欧美四级在线| 欧美mv和日韩mv国产网站| 青娱乐国产在线| 成人午夜激情在线| 国产美女在线一区| 日本亚洲不卡| 情事1991在线| 91社区在线观看播放| 欧美日韩高清一区二区三区| 中文字幕在线观看二区| 久久国产精品色| 一区国产精品| 香蕉大人久久国产成人av| 欧美激情一二三| 性插视频在线观看| 日韩欧美国产中文字幕| 亚洲第一综合网| 久久av资源站| 日韩欧美视频免费在线观看| 高清精品视频| 日韩av不卡电影| 中文字幕日本在线观看| 538prom精品视频线放| 久久久久久久国产精品毛片| 99国产精品久| 天天色综合社区| 午夜久久福利| 免费一区二区三区在在线视频| 日本精品不卡| 美女久久久久久久久久久| 国产成人无码www免费视频播放| 无码av免费一区二区三区试看| 老牛影视av老牛影视av| 精品在线亚洲视频| 秋霞无码一区二区| 国产在线日韩精品| 亚洲综合在线做性| 不卡一二三区| 久久久精品网站| 外国精品视频在线观看| 欧美日韩中文精品| 日本特黄一级片| 中文字幕乱码一区二区免费| 精品国产aⅴ一区二区三区东京热 久久久久99人妻一区二区三区 | 原纱央莉成人av片| 久久久精品久久| 日本亚洲一区| 日韩视频123| 色老头在线视频| 一区二区三区在线观看网站| www.久久av| 国产成人精品1024| 国产一线二线三线在线观看| 极品日韩av| 中文字幕一区综合| 亚洲图区在线| 国产chinese精品一区二区| 亚洲综合在线电影| 久久久久久97| 黄色动漫在线观看| 亚洲三级av在线| 日本xxxx人| 欧美一区二区三区在线看| 波多野结衣mp4| 午夜成人免费电影| 国产女人被狂躁到高潮小说| 日本一区二区免费在线观看视频| 亚洲av永久无码精品| 久久成人久久爱| jizz欧美激情18| 国产精品久久久久久久久久妞妞 | 一区二区三区导航| 经典三级在线视频| 精品日韩免费| 久久久久久久久四区三区| 日韩三级网址| 91久久精品国产| 六九午夜精品视频| 国产精品美女久久| 人人视频精品| **欧美日韩vr在线| a天堂资源在线| 欧美黄色性视频| 日本天码aⅴ片在线电影网站| 日韩网站免费观看| 最新97超碰在线| 在线观看国产精品日韩av| 麻豆影视在线| 亚洲区免费影片| 伦理片一区二区三区| 国产网站欧美日韩免费精品在线观看 | 国产免费成人| 欧美黄色免费影院| 国产精品视频| 激情婷婷综合网| 丝袜诱惑亚洲看片| 国产精品涩涩涩视频网站| 日韩高清一区在线| 九色91popny| 美女视频免费一区| 日本中文字幕精品—区二区| 另类欧美日韩国产在线| 怡红院亚洲色图| 激情偷乱视频一区二区三区| 一本色道久久亚洲综合精品蜜桃| 青青草伊人久久| 五月天婷婷在线观看视频| 国产综合成人久久大片91| 涩多多在线观看| 福利91精品一区二区三区| 亚洲色偷偷色噜噜狠狠99网| 成人美女视频在线观看| 精品中文字幕在线播放| 国产亚洲美州欧州综合国| 自拍偷拍你懂的| 亚洲三级小视频| 麻豆国产尤物av尤物在线观看 | 精品少妇人欧美激情在线观看| 国产综合自拍| 丝袜老师办公室里做好紧好爽| 首页亚洲欧美制服丝腿| 五月婷婷六月丁香激情| 国产精品影音先锋| 黄色网址在线视频| 中文字幕第一区综合| 一区二区视频免费看| 亚洲成av人片一区二区梦乃| 中文字幕视频网| 欧美精品九九99久久| 少妇高潮一区二区三区69| 亚洲老头同性xxxxx| 午夜老司机在线观看| 欧美大片免费观看| 国模套图日韩精品一区二区| 国产女人18毛片水18精品| 少妇精品在线| 欧美另类一区| 真实国产乱子伦精品一区二区三区| 国产va亚洲va在线va| 日韩不卡一区二区三区| 国产人妻精品午夜福利免费| 国产亚洲短视频| 欧美日韩在线视频免费播放| 欧美三级欧美成人高清www| 国产精品女人久久久| 日韩电影中文 亚洲精品乱码 | 国产美女永久免费| 精品亚洲男同gayvideo网站 | 色综合中文网| 黄色影视在线观看| 久久一区中文字幕| 精品伦一区二区三区| 国产精品视频看| av大片免费在线观看| 欧美日韩国产成人在线免费| 香蕉人妻av久久久久天天| 久久综合色88| 欧美va视频| 精品国产综合区久久久久久| 国产精品99一区二区三| 白嫩少妇丰满一区二区| 国产超碰在线一区| 亚洲 欧美 变态 另类 综合| 欧美日韩免费看| 亚洲奶汁xxxx哺乳期| 日韩中文字幕在线视频| 欧美gay视频| 精品在线视频一区二区| 欧美在线视屏| 99九九精品视频| 国产精品久久久久影院亚瑟| 亚洲国产成人精品女人久久| 亚洲激情视频网站| 女人黄色免费在线观看| 亚洲精品日韩av| 欧美a级片视频| 国产免费又粗又猛又爽| 久久品道一品道久久精品| 日韩欧美亚洲视频| 日韩精品一区在线观看| 菠萝蜜视频国产在线播放| 国产精品爽爽ⅴa在线观看| 国产成人手机高清在线观看网站| 日本wwwcom| 成人一区二区三区中文字幕| 欧美黑人性猛交xxx| 777a∨成人精品桃花网| 免费在线你懂的| 国产精品无av码在线观看| 精品一区二区三| 亚洲一区二区三区四区五区xx| 久久久国产综合精品女国产盗摄| 国产一级一级国产| 亚洲欧洲免费视频| www.26天天久久天堂| 亚洲国产精品视频一区| 美腿丝袜一区二区三区| 欧美成人久久久免费播放| 欧美日韩大陆一区二区| 欧美18hd| 亚洲mm色国产网站| 欧美日韩精选| 精人妻一区二区三区| 亚洲va欧美va人人爽午夜| 日本高清视频www| 97成人精品视频在线观看| 自拍偷拍一区| 国产自偷自偷免费一区| 中文成人综合网| 国产男男gay体育生白袜| 欧美猛交ⅹxxx乱大交视频| 4438全国亚洲精品观看视频| 国产毛片视频网站| 国产三级一区二区| 一级特黄特色的免费大片视频| www.久久久久| 第一区第二区在线| 亚洲黄色a v| 亚洲免费观看高清完整版在线观看 | 紧身裙女教师波多野结衣| 欧美r级电影在线观看| 深夜福利视频一区二区| 亚洲国产精品久久久久久女王| 精品一区二区三区在线播放视频| 男女性高潮免费网站| 亚洲电影免费观看高清完整版在线| 中文字幕在线视频网站| 日韩三级电影| 国产成人在线电影| 人妻 日韩精品 中文字幕| 色偷偷偷亚洲综合网另类| 91精品国产自产精品男人的天堂| 免费成人午夜视频| 亚洲欧洲韩国日本视频| 亚洲精品一区二区三区区别 | 女人帮男人橹视频播放| wwwwxxxxx欧美| 国产免费视频一区二区三区| 欧美国产第二页| 欧洲美女日日| 成年人看片网站| 欧美综合欧美视频| 麻豆蜜桃在线| 亚洲色图自拍| 91视频.com| 亚洲av无码国产综合专区| 国产成人a亚洲精品| 欧美激情成人在线| 色欲AV无码精品一区二区久久|