精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Packing Analysis:LLM 樣本 Padding 與 Packing 的對比

發(fā)布于 2024-10-17 15:49
瀏覽
0收藏

一、背景

我們之前已經(jīng)分享過幾篇關(guān)于 Sample Packing 相關(guān)的文章,也提到了其中的性能優(yōu)化問題。最近今天又看到一篇新的論文,這里進(jìn)行簡單介紹。

對應(yīng)的論文為:[2410.08081] Packing Analysis: Packing Is More Appropriate for Large Models or Datasets in Supervised Fine-tuning

相關(guān)工作可以參考我們之前的文章:

  • Sample Packing:長序列 LLM 訓(xùn)練的 Attention 問題及優(yōu)化
  • Sample Packing 綜述:LLM 效果與效率的 Tradeoff
  • Binary Block Masking:加快稀疏 Attention 的一種新方法?

二、摘要

Sample Packing 技術(shù)最初應(yīng)用于大模型預(yù)訓(xùn)練階段,旨在通過合并不同的訓(xùn)練樣本來適應(yīng)模型的最大輸入長度,從而最大化硬件利用率。盡管在預(yù)訓(xùn)練中已展示了有效性,但對監(jiān)督微調(diào)(SFT)階段還缺乏全面分析:

  • Packing 能否在保持性能的同時有效提升訓(xùn)練效率。
  • 適合采用 Packing 技術(shù)進(jìn)行微調(diào)的模型和數(shù)據(jù)集的規(guī)模。
  • Packing 無關(guān)或者相關(guān)的訓(xùn)練樣本是否可能導(dǎo)致模型過度忽略或依賴上下文。

本文中,作者對使用 Padding 和 Packing 的 SFT 方案進(jìn)行了對比,涵蓋從 69K 到 1.2M 的 SFT 數(shù)據(jù)集,以及 8B 和 70B 規(guī)模的模型。作者首次提供了關(guān)于 Padding 和 Packing 優(yōu)缺點的全面分析,以及在各種訓(xùn)練場景中實施 Packing 的考量。作者的分析涉及多個基準(zhǔn),包括知識、推理和編碼,以及基于 GPT 的評估、訓(xùn)練效率等。此外,作者還開源了相應(yīng)微調(diào)和評估代碼,并提供了在不同規(guī)模數(shù)據(jù)集上微調(diào)的 Checkpoint,旨在推動未來 Packing 技術(shù)的研究。

PS:個人感覺這篇文章還有很多可以改善的地方,比如說:

  • 沒有考慮 Document Level Mask 的問題。
  • 沒有考慮長序列場景。
  • 可以提供更多的實驗證明其觀點:“特殊 Token [EOS] 可以有效地幫助模型區(qū)分兩個相鄰的訓(xùn)練樣本”。

三、方法

3.1 方法概述

如下圖 Figure 1 所示為對應(yīng)的 Padding 和 Packing 方案,其中 SFT 數(shù)據(jù)集包含單輪對話(一個樣本只包含一個輸入和對應(yīng)的一個輸出)和多輪對話(包含多個輸入-輸出對)。

  • Padding:

每個序列中只包含一個樣本,如果不超過 Max Sequence Length 則補(bǔ)充[PAD] 占位 Token,到滿足 Max Sequence Length。

如果是多輪對話,每個輸入-輸出對之后也要添加[EOS] 結(jié)束 Token。

  • Greedy Packing:
  • 首先,將多輪對話的多個輸入-輸出對合并成單個樣本,用 [EOS] 間隔。
  • 然后,將所有的數(shù)據(jù)按照長度排序。
  • 最后,從最長的樣本開始 Packing,將連續(xù)的幾個樣本打包,如果加上某個樣本后總長度超過 Max Sequence Length,則放棄這個樣本,補(bǔ)充 [PAD] Token 并開始一個新的序列。
  • Random Packing:
  • 首先,將所有訓(xùn)練樣本拼接為一個單一的序列,同樣會使用 [EOS] Token 間隔。
  • 然后,按照 Max Sequence Length 將序列截斷。?

Packing Analysis:LLM 樣本 Padding 與 Packing 的對比-AI.x社區(qū)

3.2 優(yōu)劣

Padding 方案的優(yōu)勢和劣勢:

  • 優(yōu)勢:

實現(xiàn)簡單,任何框架都比較容易實現(xiàn)。

簡單的 Padding 和截斷可以避免變長序列引申出的各種計算錯誤或性能問題。

  • 劣勢:
  • 如果 Padding 太多,會導(dǎo)致計算量明顯增加,并且對訓(xùn)練沒有任何幫助。(PS:其實很多框架都支持變長計算,比如 FlashAttention,識別出 Padding 的 Token 可以不參與計算)

Random Packing 方案的優(yōu)勢和劣勢:

  • 優(yōu)勢:

可以最大限度減少未使用的空間(Token),從而提升計算效率。

可以提供更廣泛的上下文組合,從而提供更多元化的場景,有可能幫助提升模型的泛化能力。(也就是說不會使用 Document Level 的 Mask?)

  • 劣勢:
  • 可能導(dǎo)致兩個不同或相似的樣本串聯(lián),可能導(dǎo)致模型過度忽略或依賴上下文。不過作者提到這并不會導(dǎo)致模型過度關(guān)注 Packing 的上下文,主要是兩個原因:

Random Packing 導(dǎo)致兩個相似訓(xùn)練樣本打包在一起的概率非常低。

特殊 Token [EOS] 可以有效地幫助模型區(qū)分兩個相鄰的訓(xùn)練樣本。(PS:是否可以通過驗證 Attention Score 來判斷是否真的如此?)

  • 這種方法也可能導(dǎo)致單個對話中的不同輪次被劃分到了不同的子序列中,比如 Figure 1 中的 (Instruction 1 + Answer 1) 和 (Instruction 2 + Answer 2) 被劃分到不同序列中

Greedy Packing 方案的優(yōu)勢和劣勢:

  • 優(yōu)勢:

可以降低將一個多輪對話樣本劃分到不同序列的風(fēng)險。

  • 劣勢:
  • 需要對整個樣本排序,會打亂樣本分布的隨機(jī)性,也會影響一個 Batch 中樣本的多樣性。

PS:上述 Greedy Packing 方案也有可以改進(jìn)的地方,作者的 Packing 方法中會優(yōu)先使用當(dāng)前更長的序列來拼接,如果超過 Max Sequence Length 就直接結(jié)束,這也就導(dǎo)致更多的短上下文樣本無法利用這一部分空間。比如說,Max Sequence Length 為 2048,當(dāng)前已拼接的序列長度為 1800,需要 Padding 248 個 Token,假設(shè)下一個樣本的長度為 300,則會直接結(jié)束;然而,當(dāng)前還有大量長度小于 248 的 Token 可以被拼接。

四、實驗

4.1 實驗配置

包含 4 個 SFT 數(shù)據(jù)集:

  • WildChat(GPT-4):WildChat 是用戶訪問 ChatGPT 或者 GPT-4 生成的數(shù)據(jù)。這里作者只選擇了 GPT-4 相關(guān)數(shù)據(jù),包含 69K 個真實世界的數(shù)據(jù)。
  • TULU:包含 326K 個對話數(shù)據(jù)集,也是來自真實世界。
  • WildChat(Full):來自 WildChat 的全量 652K 數(shù)據(jù)。
  • Open-Source 1M:總共包含 1.2M 對話數(shù)據(jù),來自多個數(shù)據(jù)源。如下圖 Table 1 所示。?

Packing Analysis:LLM 樣本 Padding 與 Packing 的對比-AI.x社區(qū)

訓(xùn)練配置如下圖 Table 2 所示,主要是基于 LLaMA-3-8B 和 LLaMA-3-70B 微調(diào),訓(xùn)練是在 4 臺機(jī)器,每臺集群 8 個 A800 GPU:

Packing Analysis:LLM 樣本 Padding 與 Packing 的對比-AI.x社區(qū)

4.2 實驗結(jié)果

如下圖 Table 3 和 Table 4 所示,作者使用各種模型和數(shù)據(jù)集驗證,Packing 的平均性能會比 Padding 的更好。比如 LLaMA-3-70B 上微調(diào) WildChat(GPT-4)數(shù)據(jù)集,Padding 對應(yīng)平均性能為 61.96,而 Packing 對應(yīng)為 65.97(Random Packing)。

Packing Analysis:LLM 樣本 Padding 與 Packing 的對比-AI.x社區(qū)

Packing Analysis:LLM 樣本 Padding 與 Packing 的對比-AI.x社區(qū)

PS:上述的結(jié)論有點奇怪,智譜 AI 在 [2401.18058] LongAlign: A Recipe for Long Context Alignment of Large Language Models 中的實驗表明,短序列任務(wù)上的差異并不明顯,而在長序列上甚至 Packing 會導(dǎo)致指標(biāo)下降。當(dāng)然,LongAlign 使用了 Document Level 的 Mask,實際上 Meta LLaMA 等論文也建議在微調(diào)時使用 Document Level Mask。

Packing Analysis:LLM 樣本 Padding 與 Packing 的對比-AI.x社區(qū)

如下圖 Table 5 所示,使用 Packing 的方案確實可以有效提升訓(xùn)練速度,可以實現(xiàn) 3x 左右的加速,主要是 Packing 后 Padding 少了很多,訓(xùn)練的 Step 數(shù)少了很多:

Packing Analysis:LLM 樣本 Padding 與 Packing 的對比-AI.x社區(qū)

上述結(jié)論也與智譜 AI 在 [2401.18058] LongAlign: A Recipe for Long Context Alignment of Large Language Models 中的結(jié)論類似,如下圖 Figure 5 所示:

Packing Analysis:LLM 樣本 Padding 與 Packing 的對比-AI.x社區(qū)

五、參考鏈接

  1. https://arxiv.org/abs/2410.08081
  2. https://arxiv.org/abs/2401.18058

本文轉(zhuǎn)載自 ??AI閑談??,作者: AI閑談

標(biāo)簽
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
久久久久国产精品www| 中文字幕精品一区| 欧美高清自拍一区| www.超碰97| 一本一道久久a久久精品蜜桃| www.黄色片| 99成人超碰| 欧美videofree性高清杂交| 久久av综合网| 精品乱码一区二区三四区视频| 日本不卡视频在线观看| 久久99精品久久久久久噜噜| 亚洲第一页av| 中文字幕日本一区| 狠狠做深爱婷婷久久综合一区| 五月天色一区| 日韩有码第一页| 蜜桃视频一区二区三区在线观看| 欧美大片免费看| a天堂中文字幕| 久久伊人精品| 在线观看视频一区二区欧美日韩| 国内自拍中文字幕| 97视频在线观看网站| 成人激情动漫在线观看| 国产日韩中文字幕| 日韩精品1区2区| 一区二区三区在线电影| 亚洲欧美中文日韩在线| 亚洲成人激情小说| 国产精品传媒麻豆hd| 亚洲v中文字幕| 午夜久久久久久久久久久| 国产日产精品久久久久久婷婷| 国产ts人妖一区二区| 91精品国产综合久久香蕉的用户体验| 日韩精品在线免费看| 亚洲a在线视频| 这里精品视频免费| 在线免费观看日韩av| 操欧美女人视频| 日韩一区二区免费在线观看| 中文字幕国内自拍| 欧美日韩五码| 欧美性极品xxxx娇小| www.成年人视频| 国产激情小视频在线| 国产精品不卡在线| 一个色的综合| 成人免费黄色网页| 国产偷v国产偷v亚洲高清| 久久99国产精品| 天天av天天翘| 91丨porny丨蝌蚪视频| 精品国产综合| 十八禁一区二区三区| 不卡视频在线看| 国产免费一区| 婷婷五月综合激情| 99久久精品免费精品国产| 国产精品二区在线观看| 亚洲国产精品一| 成人手机电影网| 国产精品一区视频| 神马午夜精品95| 久久夜色精品国产噜噜av| 久久av一区二区| 久久电影视频| 中文字幕av一区二区三区高| 亚洲人成网站在线播放2019| 久久日韩视频| 一区二区三区在线观看欧美| 欧洲精品在线播放| 玖玖在线播放| 欧洲视频一区二区| 午夜一区二区视频| 午夜日韩影院| 亚洲精品国产suv| 久久精品国产亚洲AV熟女| 国产一区二区三区不卡视频网站| 在线视频欧美性高潮| 手机av在线不卡| 亚洲午夜精品一区 二区 三区| 欧美精品在线播放| 色婷婷av国产精品| 欧美aaaaaa午夜精品| 成人写真视频福利网| 国产91绿帽单男绿奴| 91麻豆.com| 一区二区三区|亚洲午夜| 视频在线这里都是精品| 欧美日韩在线视频一区| 欧美一级裸体视频| 警花av一区二区三区| 亚洲丁香婷深爱综合| 欧美 日韩 成人| 伊人色**天天综合婷婷| 97视频在线观看网址| 中国老头性行为xxxx| 国产成人亚洲精品狼色在线| 欧美精品一区二区三区在线看午夜 | 久9re热视频这里只有精品| 亚洲摸下面视频| 岛国毛片在线观看| 久久久久久一区二区| 亚洲在线观看视频网站| 视频三区在线观看| 亚洲欧美日韩电影| 热久久精品国产| 亚洲一区二区三区免费| 一本大道久久加勒比香蕉 | 精品国产乱码久久久久久虫虫漫画| 日韩欧美在线免费观看视频| 99re热精品视频| 中日韩美女免费视频网址在线观看| 久久久99精品| 免费xxxx性欧美18vr| 国内精品久久久久久久果冻传媒| 日本三级视频在线观看| 欧美午夜美女看片| 国产吃瓜黑料一区二区| 91综合久久一区二区| 日本精品免费一区二区三区| 国内老熟妇对白xxxxhd| 国产精品美女久久久久久| 国产精品后入内射日本在线观看| 日本一区二区三区电影免费观看| 日韩天堂在线视频| 黄色av网站免费| 99久久久久免费精品国产 | 99亚洲一区二区| 亚洲一区二区免费| 免费大片黄在线| 精品视频1区2区| 韩国三级hd中文字幕| 亚洲欧美成人综合| 精品久久久久久一区| 黄色的视频在线观看| 日韩欧美中文字幕一区| 很污很黄的网站| 久久精品国产99国产| 日韩欧美在线电影| 视频精品导航| 在线看欧美日韩| 欧美激情一区二区三区免费观看 | 777xxx欧美| 91禁男男在线观看| 蜜臀久久99精品久久久久宅男 | 欧美精品久久久久久久久久丰满| 亚洲一区二区五区| 国产精品一级无码| 国产精品mm| 高清视频在线观看一区| 丁香花视频在线观看| 亚洲国产成人91精品| 国产福利拍拍拍| 99免费精品在线观看| 91九色在线观看视频| 久久99国产成人小视频| 国产精品高潮粉嫩av| 日本电影在线观看网站| 国产视频丨精品|在线观看| 日产精品高清视频免费| 在线免费看h| 日韩精品在线视频观看| 五月婷婷色丁香| 久久精品视频免费| 免费看污污网站| 亚洲精品国产偷自在线观看| 成人网欧美在线视频| 伊人精品影院| 亚洲成人在线视频播放| 亚洲精品男人天堂| 国产午夜久久久久| www.久久91| 欧美精品国产| 久久精品国产第一区二区三区最新章节 | 一区二区三区视频免费看| 久久久午夜电影| 成人日韩在线视频| 国内一区二区三区| 蜜桃麻豆www久久国产精品| 99久久精品一区二区成人| 久久九九全国免费精品观看| 好吊视频一二三区| 日本二三区不卡| 暗呦丨小u女国产精品| 粉嫩蜜臀av国产精品网站| 国产午夜伦鲁鲁| 91久久夜色精品国产按摩| 999日本视频| 性欧美1819sex性高清| 久久五月天综合| 天堂а在线中文在线无限看推荐| 欧美日本高清视频在线观看| 日本一区二区三区免费视频| 国产亚洲精品aa| 4438x全国最大成人| 久久在线精品| 喜爱夜蒲2在线| 日韩精品免费一区二区三区竹菊| 国产欧美一区二区| 午夜影院在线观看国产主播| 久久亚洲一区二区三区四区五区高| 午夜福利理论片在线观看| 欧美精选在线播放| 五月婷婷中文字幕| 一区二区免费看| 1024在线看片| 日本五十路女优| 欧美日韩一区国产| 四虎永久在线精品无码视频| 国产在线视频你懂得| 日韩欧美视频在线播放| ww亚洲ww在线观看国产| 国产精品乱码久久久久| 亚洲欧洲美洲一区二区三区| 六十路精品视频| 91亚洲精品视频在线观看| 国产精品美女午夜av| 超碰在线cao| 欧美大成色www永久网站婷| 国产人成在线视频| 亚洲精品久久视频| 国产黄色大片网站| 欧美久久久久中文字幕| 亚洲av无码精品一区二区| 亚洲图片欧美一区| 一区视频免费观看| 国产精品剧情在线亚洲| av小说在线观看| 91亚洲男人天堂| 丰满少妇xbxb毛片日本| 国产九色精品成人porny | 99热这里只有精品8| 国产一二三四五| 成人一二三区| 欧美中文娱乐网| 在线看成人短视频| 久久亚洲精品欧美| 久久久久久久久久久久久久久久久久久久| 亚洲a在线播放| 亚洲男男av| 91精品视频在线免费观看| 国产成人精品一区二区三区免费| 欧美中文字幕在线| 欧产日产国产精品视频| 性欧美暴力猛交69hd| 国精产品一区一区三区mba下载| 久久69精品久久久久久久电影好 | 中文字幕亚洲不卡| 亚洲AV成人无码网站天堂久久| 国产日韩欧美一区二区三区乱码| a级大片在线观看| 久久精品日韩一区二区三区| 中国女人特级毛片| 国产精品美日韩| 国产日产在线观看| 亚洲美女偷拍久久| 青娱乐免费在线视频| 亚洲一区二区三区国产| 日韩三级视频在线播放| 疯狂做受xxxx欧美肥白少妇 | 欧美精品一二三四| 国产乱淫片视频| 日韩欧美电影一区| 隣の若妻さん波多野结衣| 亚洲精品国产精品国自产观看浪潮| 手机看片一区二区| 亚洲精品日韩在线| 成年人视频网站在线| 日韩少妇与小伙激情| 午夜av在线播放| 97色在线播放视频| 奇米777日韩| 91色精品视频在线| 国产厕拍一区| 麻豆91蜜桃| 欧美韩国日本在线观看| 三级在线免费观看| 亚洲专区免费| 欧美日韩一区二区三区69堂| 国产精品资源站在线| 中国av免费看| 国产精品久久久一本精品| 麻豆亚洲av成人无码久久精品| 偷拍与自拍一区| 中文字幕一区二区三区四区免费看 | 99久久国产综合精品色伊| 九九九视频在线观看| 一区二区三区欧美亚洲| 啦啦啦免费高清视频在线观看| 欧美日本在线视频| 女人18毛片一区二区三区| 亚洲偷欧美偷国内偷| 特级毛片在线| 国产91色在线播放| 亚洲图色一区二区三区| 秋霞久久久久久一区二区| 小说区亚洲自拍另类图片专区| 免费看国产一级片| 久久99精品久久只有精品| av免费观看不卡| 中文字幕中文在线不卡住| aaa人片在线| 欧美一区二区三区色| 毛片在线免费| 欧美日韩不卡合集视频| 99久久婷婷国产综合精品首页| 国产精品免费观看高清| 日韩精品网站| 国产偷人视频免费| 国产福利精品导航| 免费成人深夜天涯网站| 午夜成人免费电影| a级片在线播放| 伊人男人综合视频网| 九九色在线视频| 国产欧美精品在线播放| 亲子伦视频一区二区三区| 菠萝蜜视频在线观看入口| 青青草国产成人av片免费| 日韩免费高清一区二区| 亚洲黄色尤物视频| 国产精品美女一区| 综合欧美国产视频二区| 欧美xx视频| 国产精品毛片va一区二区三区| 国产精品久久久久一区二区三区厕所| 日韩无套无码精品| 99久久婷婷国产| 久久精品视频日本| 欧美一级二级三级蜜桃| 国产在线高潮| 成人女保姆的销魂服务| 91亚洲国产| 高潮一区二区三区| 国产欧美一区二区三区在线看蜜臀 | 一区二区三区四区毛片| 日本一区二区三级电影在线观看 | 久久亚洲精品伦理| 精品夜夜澡人妻无码av| 婷婷一区二区三区| 欧美在线 | 亚洲| 国内外成人免费激情在线视频 | 免费不卡亚洲欧美| 国产亚洲综合精品| 少妇被狂c下部羞羞漫画| 亚洲一区在线看| 日本黄视频在线观看| 欧美激情啊啊啊| 福利电影一区| 久久艹国产精品| 99国产精品视频免费观看| 国产成人愉拍精品久久| 日韩福利视频在线观看| 亚洲欧洲高清| 日本高清久久一区二区三区| 久久婷婷av| 国产精品视频在| 91精品国产综合久久婷婷香蕉| 在线黄色网页| 动漫美女被爆操久久久| 亚洲人体偷拍| 四虎影成人精品a片| 欧洲精品在线观看| 又爽又大又黄a级毛片在线视频| 国产精品日韩在线播放| 亚洲午夜精品一区二区国产| 折磨小男生性器羞耻的故事| 精品久久久久久久久中文字幕| 久色视频在线| 成人xxxxx| 精品99视频| 老牛影视av老牛影视av| 色88888久久久久久影院按摩| av资源网站在线观看| 成人在线中文字幕| 亚洲午夜精品久久久久久app| 给我免费观看片在线电影的| 色吊一区二区三区| 黄色动漫在线| 精品国产一区二区三区四区精华 | 成人毛片一区二区三区| 欧美精品久久天天躁| 色呦呦视频在线观看| 国产在线精品一区| 日本女人一区二区三区| 欧美成人免费看| 日韩成人在线网站| 久久夜夜久久| 欧美日韩一道本| 国产精品麻豆视频| 女人18毛片一区二区三区| 国产精品久久久久久久久久久新郎| 91成人国产| 国产中文字幕一区二区| 7777精品伊人久久久大香线蕉的| yellow在线观看网址| 综合网五月天|