精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Bert重大創新,RAG突破512長度限制

發布于 2024-12-31 13:03
瀏覽
0收藏

當前RAG的檢索、召回模塊,受到了傳統BERT模型只支持512長度的極大限制。導致文檔切分后的chunksize,極大影響RAG的性能。

本文介紹的ModernBERT,在BERT的基礎上進行了重大改進,以提高下游任務的性能和效率,尤其是在更長序列長度上的表現。

ModernBERT在2萬億個token上進行訓練,原生支持8192序列長度,展現了在多樣化分類任務和單向、多向檢索任務上的卓越性能。

ModernBERT解決的問題 

  • 問題1:傳統Bert序列長度512的限制

ModernBERT通過增加序列長度到8192個token,顯著提高了模型處理長文本的能力。

  • 問題2:傳統BERT注意力機制效率低下

為了提高模型的運行速度和內存效率,ModernBERT引入了一系列現代模型優化技術,包括交替的全局和局部注意力機制、無填充(unpadding)策略以及Flash Attention技術。

  • 問題3:傳統Bert架構陳舊

ModernBERT采用了最新的模型架構改進,例如GeGLU激活函數、RoPE位置編碼和預標準化(pre-normalization)技術

突破性能的關鍵技術 

  • 在相同的參數數量下,具有更多窄層的模型(深而窄)與具有較少寬層的模型(淺而寬)具有不同的學習模式。
  • 深而窄的語言模型比其較淺的對應模型具有更好的下游性能,但代價是推理速度較慢。
  • 為了獲得更好的下游性能,ModernBERT設計的目標是盡可能深而窄。
  • ModernBERT的基礎模型和大型模型分別具有22層和28層,參數總數分別為1.49億和3.95億,在后續性能和硬件效率之間取得了平衡。
  • ModernBERT基礎模型的隱藏層大小為768,GLU擴展為2304;大型模型的隱藏層大小為1024a,GLU擴展為5248。 這些比例允許跨張量核心的最佳平鋪。

transformer架構的改進

  1. GeGLU激活函數:替代原有的GeLU激活函數,提供更好的非線性表達能力。
  2. RoPE位置編碼:使用旋轉位置編碼(RoPE)代替絕對位置編碼,以提高模型對序列順序的理解能力。
  3. 預標準化(pre-normalization):在每個Transfaormer塊中使用預標準化技術,有助于穩定訓練過程。
  • 在嵌入層之后添加了一個層歸一化。 為避免重復,去除了第一個注意力層中的第一個層歸一化。
  1. 交替注意力機制:在模型中交替使用全局和局部注意力,以平衡計算效率和性能。
  • 全局注意力:序列中的每個token都關注其他每個token
  • 局部注意力:token僅關注一個小滑動窗口內的token。
  • 在ModernBERT中,每三層使用RoPE theta為160,000的全局注意力,其余層使用具有128個token、RoPE theta為10,000的局部滑動窗口注意力。

模型訓練的改進

  1. 在2萬億個token上進行訓練,數據來源包括網頁文檔、代碼和科學文獻。模型采用了現代的BPE分詞器,并設置了50,368的詞匯量,以優化GPU利用率。
  2. 訓練采用了Masked Language Modeling(MLM),并去除了Next-Sentence Prediction(NSP)目標,因為后者并未帶來性能上的提升。
  3. 模型使用了StableAdamW優化器,并采用了改進的梯形學習率計劃
  4. 采用去除填充策略,去除填充token,減少計算資源的浪費
  • encoder-only語言模型通常使用填充符元來確保批次中統一的序列長度,從而浪費在語義上為空的符元上的計算資源。
  • 去除填充通過移除填充token、將小批量中的所有序列連接成單個序列并將其作為單個批次進行處理來避免這種低效。
  • 之前的去除填充實現會在不同的模型層內部去除填充并重新填充序列,從而浪費計算資源和內存帶寬。
  • 使用Flash Attention的可變長度注意力和RoPE實現,允許在單個未填充序列上使用不規則的注意力掩碼和RoPE應用。
  • ModernBERT在嵌入層之前去除輸入的填充,并可以選擇性地重新填充模型輸出,這使得其性能比其他去除填充方法提高了10%到20%。
  1. 使用Flash Attention技術,提高了注意力計算的內存和計算效率。
  • ModernBERT結合使用Flash Attention 3進行全局注意力層
  • 使用Flash Attention 2進行局部注意力
  1. 利用PyTorch的torch.compile編譯功能,提高了訓練的吞吐量10%。
  2. 通過增加全局注意力層的RoPE theta值,將原生上下文長度512擴展到8192個token,并在額外的3000億個token上進行訓練,以優化長文本處理能力。

訓練參數的配置 

  • MLM:

a.使用30%的掩碼率,原始的15%掩碼率再次被證明是次優的

  • StableAdamW優化器:

a.StableAdamW的學習率裁剪在下游任務中優于標準梯度裁剪,并導致更穩定的訓練。

  • 梯形學習率 (LR) :

a.在預訓練期間,我們使用改進的梯形學習率 (LR) schedule,也稱為預熱-穩定-衰減 (WSD)。

b.在短暫的LR預熱之后,梯形schedule在大部分訓練中保持LR不變,然后進行短暫的LR衰減。

c.此schedule已被證明可以匹配余弦schedule的性能。

d.并且可以對任何檢查點進行持續訓練而不會出現冷啟動問題。

e.使用1-sqrt的LR衰減,要優于線性衰減和余弦衰減

f.ModernBERT-base 以8e-4的恒定LR訓練了1.7萬億個token,預熱了30億個token

g.預熱20億個token后,以5e-4的LR訓練了ModernBERT-large,訓練了9000億個符元。

h.在large的損失在5e-4下保持穩定了幾百億個token后,將學習率回滾到5e-5,并重新訓練剩余的8000億個token。

  • 批量大小調度:

a.批量大小調度從較小的梯度累積批量開始,隨著時間的推移逐漸增加到完整的批量大小,能加快訓練進度

b.ModernBERT-base和-large的批量大小分別在500億個token內從768增加到4608,在100億個token內從448增加到4928,采用不均勻的token調度,以便每個批量大小具有相同數量的更新步驟。

  • 權重初始化和平鋪:

a.使用中心平鋪和Gopher層縮放,直接從ModernBERT-base的預訓練權重初始化ModernBERT-large

b.由于Base的權重矩陣小于Large的權重矩陣,對Base的權重進行了中心化處理,考慮了每個token嵌入和注意力頭,然后使用環繞填充其余權重。

  • 上下文長度擴展:

a.以1024個序列長度和10,000的RoPE theta對1.7萬億個token進行訓練后,通過將全局注意力層的RoPE theta增加到160,000并將額外訓練3000億個token來擴展ModernBERT的原生上下文長度到8192個token。

b.首先,以3e-4的恒定較低學習率對8192個token的原始預訓練數據集混合體進行2500億個token的訓練

c.接下來,對更高質量的來源進行上采樣,并在500億個token上進行具有1-sqrt學習率調度的衰減階段。

??https://github.com/AnswerDotAI/ModernBERT??

??https://arxiv.org/pdf/2412.13663??

本文轉載自??CourseAI??,作者: CourseAI 

已于2024-12-31 14:27:13修改
收藏
回復
舉報
回復
相關推薦
久久精品视频免费| 国内自拍视频一区二区三区| 欧美日韩一区二区三区四区五区| 亚洲在线欧美| 国产成人精品av在线观| 国产视频一区欧美| 久久精品亚洲热| 黄色免费看视频| 波多野结衣午夜| 日韩美女一区二区三区在线观看| 欧美一区二区三区视频在线观看| 日本在线xxx| 欧美jizzhd欧美| www.日本不卡| 成人激情视频网| 男人午夜免费视频| 91精品天堂福利在线观看| 亚洲精品久久在线| 6080国产精品| 欧美黄色三级| 性欧美疯狂xxxxbbbb| 91热精品视频| 国产伦精品一区二区三区视频我| 亚洲乱码电影| 在线视频欧美性高潮| 在线免费播放av| 电影一区二区三区久久免费观看| 欧美视频13p| 日韩不卡一二区| 国产精品一二三区视频| 白白色 亚洲乱淫| 亚洲精品日产aⅴ| 亚洲 小说区 图片区| 中文亚洲字幕| 欧美激情视频在线免费观看 欧美视频免费一 | av网站在线免费播放| 激情视频一区| 久久精品99久久香蕉国产色戒| 欧美图片一区二区| 理论片一区二区在线| 亚洲福利一区二区三区| 亚洲一一在线| 成人精品一区二区三区校园激情| 99精品视频一区| 国产精品久久国产三级国电话系列 | 深夜福利视频在线观看| 成人免费不卡视频| 国模视频一区二区| 欧美激情图片小说| 午夜影院欧美| 久久精品国产久精国产一老狼| 欧洲美熟女乱又伦| 精品国产视频| 国产一区二区三区三区在线观看| 18禁裸乳无遮挡啪啪无码免费| 91午夜精品| 精品国产乱码久久久久久蜜臀| 亚洲视频在线不卡| 日韩一二三区| 精品国精品国产| av免费播放网址| 成av人片在线观看www| 亚洲午夜影视影院在线观看| 黄色一区三区| 特黄aaaaaaaaa真人毛片| 成人毛片视频在线观看| 国产精品免费一区二区三区四区| 亚洲精华国产精华精华液网站| 国产高清精品久久久久| ts人妖另类在线| 污污网站在线免费观看| 2021国产精品久久精品| 欧美精品尤物在线| www.成人.com| 亚洲日本va午夜在线影院| 激情五月五月婷婷| 国产直播在线| 欧美丝袜第一区| 国产精品人人爽人人爽| 天堂av在线电影| 亚洲午夜国产一区99re久久| 久久99中文字幕| 免费黄色网址在线观看| 自拍偷拍亚洲欧美日韩| 无码人妻精品一区二区蜜桃网站| 国产盗摄——sm在线视频| 色一区在线观看| 中文字幕久久av| 国产成人精品亚洲线观看| 亚洲精品久久久一区二区三区| 这里只有久久精品| 亚洲精品一区二区在线看| 久久久久久亚洲| 成人免费一级片| 国产精品一二三四| 免费电影一区| av在线播放观看| 欧美日韩国产中文精品字幕自在自线| 激情视频免费网站| 亚洲欧洲美洲av| 欧美日韩你懂的| 91精品又粗又猛又爽| 国产精品欧美在线观看| 亚洲白拍色综合图区| 在线 丝袜 欧美 日韩 制服| 国产99亚洲| 亚洲精品97久久| 欧美成人另类视频| 最新日韩欧美| 成人高清视频观看www| 五月天激情婷婷| 亚洲精品国产品国语在线app| 岳毛多又紧做起爽| 色妞ww精品视频7777| 国产亚洲成精品久久| 国产无遮挡裸体免费视频| 久久99精品久久久| 欧美一区二区三区四区在线观看地址| 丝袜在线观看| 欧美挠脚心视频网站| 中文字幕国产综合| 亚洲精品社区| 91传媒视频在线观看| 九色在线观看| 精品久久久久久久久久久| 国产成人亚洲综合无码| 日本一区免费网站| 精品视频久久久久久久| 久久av高潮av无码av喷吹| 美女mm1313爽爽久久久蜜臀| 国产精品视频区| 日本成人一区二区三区| 亚洲国产精品久久久男人的天堂| 中文字幕66页| 日韩电影一区| 国产精品美女主播| 国产中文在线| 色婷婷国产精品久久包臀| 国产+高潮+白浆+无码| 亚洲欧美亚洲| 5566中文字幕一区二区| 黄色免费网站在线观看| 91久久精品一区二区二区| 亚洲av片不卡无码久久| 国产日韩欧美一区二区三区在线观看| 国产精品国产三级国产专区53 | 亚洲女人****多毛耸耸8| 黄色手机在线视频| 色男人天堂综合再现| 国产精品日日摸夜夜添夜夜av| 国产永久av在线| 日本黄色一区二区| 91在线无精精品白丝| 久久精品午夜| 日韩精品电影网站| 国产一区二区三区影视| 中文字幕国产亚洲2019| 亚洲精品国产精品国自产网站按摩| 国产日韩高清在线| 日本激情视频在线播放| 国产精品精品| 91青青草免费观看| a级片免费在线观看| 亚洲精品按摩视频| 国产一区二区视频免费| 欧美激情中文字幕一区二区| 亚洲免费一级视频| 在线国产一区二区| 国产精品永久入口久久久| sm捆绑调教国产免费网站在线观看| 亚洲国产一区二区三区四区| 亚洲精品男人的天堂| 日本一区二区三区久久久久久久久不| 小明看看成人免费视频| 亚洲天堂男人| 青青成人在线| 国产精品1区在线| 97视频在线观看免费| 国产精品久久久久久久龚玥菲| 精品视频免费在线| 久久久精品91| 91麻豆精品秘密| 亚洲欧洲日本精品| 精品999网站| 日本一区二区三区四区高清视频| 伊人亚洲精品| 97超视频免费观看| 在线观看黄av| 亚洲福利视频在线| 艳妇乳肉豪妇荡乳av无码福利 | 400部精品国偷自产在线观看| 日韩欧美中文字幕一区二区三区| 4p变态网欧美系列| 麻豆网站在线免费观看| 日韩av在线免费观看一区| 最近中文字幕免费观看| 亚洲综合精品久久| 嘿嘿视频在线观看| av在线不卡电影| 色婷婷一区二区三区av免费看| 一区免费在线| 亚洲精品视频一二三| 欧美日日夜夜| 99久久伊人精品影院| 亚洲伦理影院| 51精品国产黑色丝袜高跟鞋| 欧美成人视屏| 亚洲日韩中文字幕在线播放| www.蜜臀av.com| 欧美三级日韩三级| 精品人妻一区二区三区免费看| 亚洲欧美偷拍三级| 国产高清一区二区三区四区| 白白色亚洲国产精品| 伊人精品视频在线观看| 日韩精品亚洲一区| 日韩精品―中文字幕| 免费精品一区| 国产精品成人久久久久| 国产盗摄一区二区| 另类图片亚洲另类| 尤物在线视频| 国产亚洲精品va在线观看| 亚洲大尺度网站| 91精品综合久久久久久| 中文字幕 视频一区| 狠狠色狠狠色综合日日小说| 精品无码久久久久久久久| 一区二区中文字幕在线| 337人体粉嫩噜噜噜| 久久婷婷一区二区三区| 久久久久麻豆v国产精华液好用吗| 国产成人在线网站| 午夜福利123| 精品制服美女丁香| 午夜在线观看av| 蜜乳av一区二区| 最新中文字幕免费视频| 日韩 欧美一区二区三区| 国产第一页视频| 亚洲欧美视频一区二区三区| 久久久久久久中文| 国产精品一区毛片| 免费国产a级片| 99视频一区| 女人和拘做爰正片视频| 国产精品久久久一区二区| 国产视频九色蝌蚪| 国产农村妇女精品一区二区| 激情综合在线观看| 久久国产精品久久久久久电车| www.玖玖玖| 美女国产一区| 国产九九在线观看| 激情伊人五月天久久综合| 一二三av在线| 国产成+人+日韩+欧美+亚洲| 折磨小男生性器羞耻的故事| 成人激情校园春色| 最新中文字幕视频| 国产蜜臀av在线一区二区三区| 麻豆视频免费在线播放| 东方aⅴ免费观看久久av| xxxxwww一片| 成人精品一区二区三区中文字幕| 中国一级特黄录像播放| 91啦中文在线观看| 国产一二三四区在线| 国产精品电影院| 久久久久久久久久久97| 精品人伦一区二区三区蜜桃免费| 国产精品视频123| 欧美另类变人与禽xxxxx| av片免费播放| 日韩福利视频在线观看| av在线首页| 欧美日韩国产成人| 综合日韩av| 成人国内精品久久久久一区| 成午夜精品一区二区三区软件| 欧美人xxxxx| 国产精品久久久久久麻豆一区软件 | 狠狠88综合久久久久综合网| 国产91在线免费| 捆绑变态av一区二区三区| 91视频福利网| 26uuuu精品一区二区| 国产天堂av在线| 精品久久久久久久久中文字幕| 中文在线字幕免费观| 欧美大肚乱孕交hd孕妇| 免费福利在线观看| 大量国产精品视频| 最近在线中文字幕| 亚洲精品免费网站| 猛男gaygay欧美视频| 裸体大乳女做爰69| 久久久久欧美精品| 毛片毛片毛片毛片毛| 久久亚洲欧美国产精品乐播 | 亚洲av网址在线| 国产精品国产精品国产专区不片| 日本在线视频免费观看| 亚洲欧美偷拍另类a∨色屁股| 亚洲视频免费播放| 制服丝袜在线91| 韩国福利在线| 久久久久久久国产精品| 四虎影视国产精品| 蜜桃传媒一区二区| 国产尤物精品| 国产福利精品一区二区三区| 国产亚洲成aⅴ人片在线观看| 国产亚洲精品成人| 欧美美女黄视频| 国产在线小视频| 91爱视频在线| 亚洲一区二区三区中文字幕在线观看 | 丰满人妻妇伦又伦精品国产| 久久久国产一区| 99精品国自产在线| 国产欧美精品久久久| 欧洲亚洲视频| 欧美日韩福利在线| 国产免费成人| 国产乱国产乱老熟300部视频| 国产精品国产三级国产| 国产裸体美女永久免费无遮挡| 亚洲精品一区av在线播放| sm在线观看| 国产传媒一区| 欧美精选一区| 国产精品无码人妻一区二区在线| 国产一区二区0| 潘金莲一级黄色片| 欧美人妇做爰xxxⅹ性高电影| 精品欧美不卡一区二区在线观看 | 亚洲一区二区三区四区| 久99久在线| 99精品福利视频| 一区二区免费在线观看视频| 亚洲成人av在线电影| 国产综合视频在线| 欧美激情性做爰免费视频| 一区中文字幕| 日本精品久久久久久久久久| 国产成人99久久亚洲综合精品| 欧美人与禽zozzo禽性配| 欧美一区二区视频观看视频| av免费看在线| 99re视频| 亚洲精品护士| 日韩精品卡通动漫网站| 日本久久电影网| 男人影院在线观看| 91欧美激情另类亚洲| 欧美三级免费| 亚洲精品在线视频免费观看| 色婷婷久久一区二区三区麻豆| 久久电影中文字幕| 国产精品一二区| 亚洲啊v在线观看| 亚洲一区和二区| 精品福利在线观看| 黄色小视频在线观看| 国产欧美日韩精品专区| 一本一道久久综合狠狠老| 秘密基地免费观看完整版中文| 五月婷婷激情综合网| 国产剧情在线观看| 91手机视频在线观看| 国产精品国码视频| 可以直接看的无码av| 欧美三级在线看| 羞羞网站在线看| 欧美另类一区| 国产综合久久久久影院| 国产午夜精品无码一区二区| 亚洲欧洲日产国码av系列天堂 | 国产精品一 二 三| 久久国产精品毛片| 欧美大片xxxx| 日韩av网站大全| 精品女同一区二区三区在线观看| wwwjizzjizzcom| 91麻豆精品视频| 国产精品一区二区人人爽| 91爱视频在线| 天天综合亚洲| 麻豆国产精品一区| 欧美日韩和欧美的一区二区| 91九色在线播放| 日本一区二区三区精品视频| 国产suv精品一区二区三区| 四虎成人在线观看| 欧美日韩成人网| 不卡在线一区| 国产精品伦子伦| 91精品国产91久久综合桃花| av资源亚洲|