精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

LLM上下文窗口突破200萬!無需架構變化+復雜微調,輕松擴展8倍

發布于 2024-4-29 13:12
瀏覽
0收藏

大型語言模型(LLM)往往會追求更長的「上下文窗口」,但由于微調成本高、長文本稀缺以及新token位置引入的災難值(catastrophic values)等問題,目前模型的上下文窗口大多不超過128k個token


最近,Microsoft Research的研究人員提出了一個新模型LongRoPE,首次將預訓練 LLM 的上下文窗口擴展到了2048k個token,在256k的訓練長度下只需要1000個微調步驟即可,同時還能保持原始短上下文窗口的性能。


LLM上下文窗口突破200萬!無需架構變化+復雜微調,輕松擴展8倍-AI.x社區

論文鏈接:??https://arxiv.org/abs/2402.13753??

代碼鏈接:https: //github.com/microsoft/LongRoPE


LongRoPE主要包含了三個關鍵創新點:


1. 通過高效搜索識別并利用了位置插值中的兩種非均勻性,為微調提供了更好的初始化,并在非微調情況下實現了 8 倍擴展;


2. 引入了漸進擴展策略,首先微調 256k 長度的 LLM,然后在微調擴展的LLM上進行第二次位置插值,以實現 2048k 上下文窗口;


3. 在8k長度上重新調整 LongRoPE以恢復短上下文窗口性能。


在 LLaMA2 和 Mistral 上對各種任務進行的大量實驗證明了該方法的有效性。

通過 LongRoPE 擴展的模型保留了原始架構,只對位置嵌入稍作修改,并且可以重復使用大部分已有的優化。

位置插值的不均勻性

Transformer模型需要明確的位置信息,通常以位置嵌入(position embedding)的形式來表示輸入token的順序。


本文中的位置嵌入表示方法主要來自于RoPE, 對于位置索引為 n 的標記,其相應的 RoPE 編碼可簡化如下:


LLM上下文窗口突破200萬!無需架構變化+復雜微調,輕松擴展8倍-AI.x社區


其中,d 是嵌入維度,nθi 是標記在位置 n 上的旋轉角度,θi = θ -2i/d 表示旋轉頻率。在 RoPE 中,θ 的默認基準值為 10000。


受 NTK 和 YaRN 的啟發,研究人員注意到這兩個模型可以從非線性嵌入中獲得性能提升,特別是在考慮 RoPE 各維度的不同頻率以進行專門的內插法和外推法時。


然而,當前的非線性在很大程度上依賴于人為設計的規則。


這也自然引出了兩個問題:


1. 當前的位置插值是否是最佳的?

2. 是否存在尚未探索的非線性?


LLM上下文窗口突破200萬!無需架構變化+復雜微調,輕松擴展8倍-AI.x社區


為了回答這些問題,研究人員使用進化搜索(evolution search)為LLaMA2-7B發現更好的非均勻位置插值。搜索以易錯性為指導,使用來自PG19驗證集的5個隨機樣本。


通過實證分析,研究人員總結了幾個主要發現。


發現1:RoPE維度表現出很大的不均勻性,目前的位置插值方法無法有效處理這些不均勻性;


在公式 2 中為每個 RoPE 維度搜索最佳 λ。


LLM上下文窗口突破200萬!無需架構變化+復雜微調,輕松擴展8倍-AI.x社區


研究人員對比了PG19和Proof-pile測試集上使用不同方法的 LLaMA2-7B 在不進行微調的情況下的復雜度。


LLM上下文窗口突破200萬!無需架構變化+復雜微調,輕松擴展8倍-AI.x社區


從結果來看,搜索到的解決方案有明顯改善,表明當前的線性(PI,positional interpolation)和非均勻(Dynamic-NTK 和 YaRN)插值方法都不是最佳的。


值得注意的是,YaRN 在 PG19 上的表現不如 PI 和 NTK,因為其達不到非微調 LLM 的目標上下文窗口長度。


例如,在 8k 上下文大小的情況下,YaRN 的困惑度在 7k 后達到峰值。


通過搜索,公式 2 中的重標度(rescaled)因子λ變得不均勻,與PI、NTK的公式計算和YaRN的分組計算中的固定標度s有所不同。


在8k和16k上下文窗口中,這些非均勻因子大大提高了LLaMA2的語言建模性能(即復雜度),而無需進行微調,主要是因為由此產生的位置嵌入有效地保留了原始的RoPE,尤其是關鍵維度,從而降低了LLM區分近似token位置的難度。


發現2:輸入序列中初始詞塊的RoPE推斷應減少插值;


對于輸入序列中的初始n個token,假設RoPE應該做較少的插值,這是因為會獲得較大的注意力分數,從而對注意力層至關重要,正如在Streaming LLM和 LM-Infinite 中觀察到的那樣。


為了驗證這一點,研究人員使用PI和NTK將上下文窗口擴展到 8k 和 16k,保留前 n(0,2, ..., 256)個token,不進行插值。當n=0 時,則恢復到原來的 PI 和 NTK


LLM上下文窗口突破200萬!無需架構變化+復雜微調,輕松擴展8倍-AI.x社區


上表中可以觀察到兩個結果:


1. 保留起始token而不進行位置插值確實能提高性能。

2. 最佳起始token數n取決于目標擴展長度。


發現3:在微調和非微調設置中,非均勻位置插值都能有效擴展 LLM 上下文窗口。


雖然已經證明,在不進行微調的情況下,搜索到的非均勻位置插值能顯著提高8k和16k擴展性能,但更長的擴展需要微調。


因此使用搜索到的RoPE對LLaMA2-7B的64k上下文窗口大小進行了微調。


LLM上下文窗口突破200萬!無需架構變化+復雜微調,輕松擴展8倍-AI.x社區


從結果中可以看到,在微調LLaMA2-7B之前和之后,該方法都明顯優于PI和YaRN,主要原因是有效地使用了非均勻位置插值、最小化信息損失,以及為微調提供了更好的初始化。


受上述發現的啟發,研究人員提出了LongRoPE,首先引入了一種高效的搜索算法,以充分利用這兩種不均勻性,并將LLM上下文窗口擴展到 200 萬個token


LLM上下文窗口突破200萬!無需架構變化+復雜微調,輕松擴展8倍-AI.x社區


具體形式化算法參見原文。


實驗結果

研究人員將LongRoPE應用于LLaMA2-7B和Mistral-7B模型上,并從三個方面對其性能進行了評估:


1. 長文檔中擴展上下文 LLM 的困惑度;


2. 密鑰(passkey)檢索任務,該任務衡量模型從大量無關文本中檢索簡單密鑰的能力;


3. 4096上下文窗口的標準LLM基準;


在256k范圍內進行長序列語言建模


在Proof-pile和PG19上通過不同插值方法擴展的 LLaMA2 和 Mistral 的困惑度。


從實驗結果中可以得出兩個關鍵的結論:


1. 從 4k 到 256k 的評估長度來看,擴展模型展現出整體困惑度下降的趨勢,表明模型有能力利用更長的上下文;


2. 即使在上下文窗口長度為 16 倍的情況下(這通常是在較短上下文長度下保持性能所面臨的挑戰),我們的 LongRoPE-2048k 模型在 256k 上下文長度內的性能仍優于最先進的基線模型。


LLM上下文窗口突破200萬!無需架構變化+復雜微調,輕松擴展8倍-AI.x社區


LLM上下文窗口突破200萬!無需架構變化+復雜微調,輕松擴展8倍-AI.x社區

超過2000k的長序列語言建模


為了評估超長文檔的有效性,研究人員使用了Books3數據集。


為了評估效率,隨機選擇20本書,每本長度超過2048k個token,并使用256k的滑動窗口。


LLM上下文窗口突破200萬!無需架構變化+復雜微調,輕松擴展8倍-AI.x社區


從結果中可以看出,LongRoPE成功地將LLaMA2-7B和Mistral-7B的上下文窗口擴展到2048k,同時還在8k-128k的較短長度內實現了與基線相當或更好的困惑度。


還可以觀察到2048k LLaMA2和Mistral之間的顯著性能差異:Mistral在較短的長度上優于基線,但困惑度在超過256k長度時達到7


LLaMA2的性能與預期一致:隨著時間的延長,困惑感會有所減少,在1024k和2048k時略有增加。


此外,在LLaMA2上,LongRoPE-2048k在256k比128k的微調長度下表現更好,主要是由于次級延伸比(secondary extension ratio)更小(即8倍對16倍)。


相比之下,Mistral在微調128k的窗口大小方面表現更好,主要原因是對于Mistral的128k和256k微調,研究人員遵循YaRN的設置使用16k訓練長度,影響了Mistral在微調后進一步擴展上下文窗口的能力。


本文轉自新智元 ,作者:新智元


原文鏈接:??https://mp.weixin.qq.com/s/8V4yGzXBsFfGwCZ4VJDE1g??

標簽
收藏
回復
舉報
回復
相關推薦
亚洲国产精品一区二区久| 亚洲精品免费播放| 国产精品久久久久高潮| 538精品视频| vam成人资源在线观看| 亚洲男同1069视频| 国产一区二区三区高清视频| 日本中文字幕在线| 日韩在线观看一区 | 欧美刺激午夜性久久久久久久| 国产手机视频在线观看| 日本高清视频免费观看| 免费成人你懂的| 欧美国产中文字幕| 蜜乳av中文字幕| 成人爽a毛片免费啪啪红桃视频| 欧美视频不卡中文| 最新视频 - x88av| 人人九九精品| 国产精品乡下勾搭老头1| 欧美在线性爱视频| 久久久久久欧美精品se一二三四| 夜夜躁狠狠躁日日躁2021日韩| 欧美疯狂性受xxxxx喷水图片| av高清在线免费观看| 香蕉视频网站在线观看| 久久久久久久免费视频了| 97自拍视频| 中国a一片一级一片| 亚洲另类视频| 欧美成人激情图片网| 国产精品20p| 噜噜噜狠狠夜夜躁精品仙踪林| 欧美最新大片在线看| 国产免费黄色小视频| 成人福利在线观看视频| 中文字幕国产一区二区| 欧美日韩国产精品一卡| 婷婷五月综合激情| 福利电影一区二区| 91精品视频在线播放| 免费看av在线| 性欧美长视频| 亚州av一区二区| 黄色一级视频免费观看| 91精品一区二区三区综合| 中文字幕视频在线免费欧美日韩综合在线看| 女女调教被c哭捆绑喷水百合| 欧洲成人一区| 日本精品免费观看高清观看| 国产l精品国产亚洲区久久| wwwwxxxx在线观看| 亚洲成a人片在线不卡一二三区| 亚洲免费av网| 高潮毛片在线观看| 亚洲色图清纯唯美| 色呦呦网站入口| 97超碰资源站在线观看| 亚洲欧美一区二区三区国产精品| 亚洲国产日韩欧美| 自拍视频在线| 中文字幕日韩精品一区| 少妇熟女一区二区| 青草影视电视剧免费播放在线观看| 亚洲欧洲日韩在线| 人人妻人人澡人人爽精品欧美一区| a天堂在线资源| 国产精品人成在线观看免费| 在线视频欧美一区| www在线观看播放免费视频日本| 国产精品美女一区二区在线观看| 亚洲精品乱码久久久久久蜜桃91| av在线电影免费观看| 国产精品久久久久一区| 日本中文字幕一级片| 国精产品一区一区三区mba下载| 亚洲一区在线观看网站| 国产原创popny丨九色| www.成人爱| 欧美三日本三级三级在线播放| 精品999在线| 欧洲大片精品免费永久看nba| 6080国产精品一区二区| 26uuu国产| 亚洲精品中文字幕99999| 国产一区二区三区网站| 日韩在线一卡二卡| 伊人成人网在线看| 国产精品成人v| av免费在线不卡| av一区二区不卡| 亚洲成人精品电影在线观看| www.久久ai| 福利二区91精品bt7086| 老司机午夜性大片| 无人区乱码一区二区三区| 日韩精品免费在线视频观看| 99久久久免费精品| 国产视频一区免费看| 国产精品久久久久免费a∨大胸| 7777久久亚洲中文字幕| av在线播放成人| 影音先锋欧美资源| 人狥杂交一区欧美二区| 91精品国产一区二区人妖| 噜噜噜在线视频| 久久久久亚洲| 欧美专区在线观看| www久久久com| 国产精品欧美精品| 国产婷婷一区二区三区| 日韩国产大片| 亚洲欧美精品一区| 国产福利久久久| 久久精品99久久久| 麻豆av一区二区| 在线观看中文字幕的网站| 色狠狠一区二区| 中文字幕人妻熟女在线| 99久久精品费精品国产风间由美| 91国内免费在线视频| 国产精品无码一区二区桃花视频| 91一区二区在线| 国产精品三级一区二区| 国产精品第一| 亚洲欧美日韩第一区| 国产无遮挡免费视频| 精品一区二区三区免费观看| 欧美一区观看| 咪咪网在线视频| 日韩欧美亚洲国产另类| 色哟哟一一国产精品| 日产国产高清一区二区三区 | av成人男女| 久久国产精品久久久久久| 久草热在线观看| 久久久91精品国产一区二区精品| 国产av熟女一区二区三区| 亚洲成人精品综合在线| 在线视频中文亚洲| 亚洲精品中文字幕乱码三区91| 国产成人免费网站| 操bbb操bbb| 国产一区二区三区亚洲综合 | 人妻大战黑人白浆狂泄| 9色国产精品| 国新精品乱码一区二区三区18| 国产网友自拍视频导航网站在线观看| 午夜天堂影视香蕉久久| 精品熟女一区二区三区| 极品少妇一区二区三区| 国产乱码精品一区二区三区日韩精品 | 日本一区二区三区在线不卡| 狠狠干 狠狠操| 美女av一区| 久久久噜噜噜久久中文字免| 好吊色一区二区| 亚洲国产精品久久艾草纯爱| 稀缺小u女呦精品呦| 一区在线视频| 免费看成人片| 日韩不卡免费高清视频| 永久免费看mv网站入口亚洲| 一区二区三区日| 亚洲精品日韩综合观看成人91| 超碰在线免费av| 国语精品一区| 精品福利影视| 偷拍中文亚洲欧美动漫| 最好看的2019的中文字幕视频| 69xxxx国产| 中文字幕的久久| 涩涩网站在线看| 欧美日韩中文| 久久天天狠狠| 日韩成人综合网| 久久久久久久久久久人体| 亚洲人成色777777精品音频| 欧美专区日韩专区| 成人免费精品动漫网站| 成人一级片网址| 88av.com| 亚洲午夜精品一区 二区 三区| 96国产粉嫩美女| 九九色在线视频| 亚洲欧美日韩国产中文专区| 91一区二区视频| 亚洲高清在线精品| 日本一级免费视频| 国产福利一区二区| 国产精品秘入口18禁麻豆免会员| 国内精品久久久久久久影视简单| 国产日韩欧美夫妻视频在线观看| 四虎亚洲成人| 亚洲性69xxxbbb| 午夜精品久久久久久久99| 色综合一区二区三区| 亚洲 欧美 国产 另类| www.av精品| 中文字幕第一页在线视频| 亚洲精选久久| 免费观看黄色的网站| 亚洲成人一品| 99porn视频在线| 69堂免费精品视频在线播放| 欧美激情图片区| 午夜在线视频| 亚洲男人的天堂在线播放| www.桃色av嫩草.com| 在线日韩国产精品| 香蕉视频一区二区| 综合欧美亚洲日本| 亚洲a v网站| 成人动漫中文字幕| 亚洲av毛片在线观看| 美女网站色91| 成人在线观看a| 综合色一区二区| 亚洲欧美日韩国产成人综合一二三区 | 日韩在线国产精品| 污污网站免费在线观看| 日韩欧美自拍偷拍| 在线观看毛片网站| 婷婷一区二区三区| 黄色一级片在线| 亚洲色图制服丝袜| 黄色av免费播放| 久久久精品国产99久久精品芒果| 成人免费黄色av| 精品一区二区三区在线观看国产| 成人中文字幕在线播放| 亚洲无吗在线| 韩国无码av片在线观看网站| 91一区二区| 手机看片福利永久国产日韩| 免费不卡中文字幕在线| 久久久久国产精品视频| 精品丝袜久久| 精品网站在线看| 欧美黄色录像| 精品亚洲欧美日韩| 国产一级成人av| 国产精成人品localhost| 欧美午夜网站| 91国产丝袜在线放| 欧美日韩黄色| 电影午夜精品一区二区三区| 亚洲码欧美码一区二区三区| av在线亚洲男人的天堂| 日韩在线成人| 18成人免费观看网站下载| 久久精品一级| 电影午夜精品一区二区三区| 超碰97久久国产精品牛牛| 高清视频一区二区三区| 国产精品巨作av| 久久99精品久久久久久久久久| 国产精品对白久久久久粗| 狠狠色噜噜狠狠色综合久| 天堂av一区二区三区在线播放| 国产精品一区二区免费看| 国产精品一区二区中文字幕 | jizzjizzxxxx| 男人的天堂亚洲| 黑森林福利视频导航| 青青草精品视频| 久久久久久久久久毛片| 成人一道本在线| 国产精品815.cc红桃| 欧美激情一区二区三区全黄| 国产美女高潮视频| 一区二区三区国产豹纹内裤在线| 国产在线视频二区| 好吊成人免视频| 日韩电影在线观看一区二区| 欧美日韩视频在线观看一区二区三区| 在线观看污污网站| 欧美丰满嫩嫩电影| 无码精品人妻一区二区三区影院| 日韩精品在线观看一区| 国产鲁鲁视频在线观看免费| 久久韩国免费视频| 超碰97国产精品人人cao| 国产97在线|亚洲| 99精品视频在线免费播放| 国产精品区一区| 精品国产一区二区三区香蕉沈先生| 亚洲三区在线| 在线欧美不卡| 黄色三级视频在线| 国产a区久久久| 欧美大波大乳巨大乳| 夜夜精品浪潮av一区二区三区| 国产成人亚洲精品自产在线| 欧美日韩亚洲国产综合| 亚洲毛片在线播放| 亚洲新声在线观看| 福利在线导航136| 国产精品久久久久久久久久久久 | 精品麻豆一区二区三区 | 欧美亚洲另类久久综合| 欧美电影《轻佻寡妇》| 免费观看国产精品视频| 激情综合网最新| 中文字幕第20页| 亚洲成人精品在线观看| 11024精品一区二区三区日韩| 精品国产一区二区三区不卡| 午夜激情在线观看| 91精品国产91久久久久久久久| 影音成人av| 精品乱色一区二区中文字幕| 欧美福利专区| 午夜精品在线免费观看| 成人国产精品免费| 亚洲 欧美 变态 另类 综合| 欧洲亚洲精品在线| 天天综合网在线| 欧美高清激情视频| 日本一区二区三区中文字幕| 欧美一区二区三区四区在线观看地址| 91欧美大片| 中文字幕无码不卡免费视频| www.色精品| 久草资源在线视频| 欧美另类一区二区三区| 国产三级在线免费| 高清欧美性猛交xxxx| 日本一区影院| 午夜探花在线观看| 美腿丝袜亚洲综合| 永久免费毛片在线观看| 91成人在线免费观看| 日韩a在线看| 欧美在线观看网站| 麻豆成人入口| 69堂免费视频| 91一区二区三区在线观看| 国产精品美女毛片真酒店| 精品不卡在线视频| 黑人玩欧美人三根一起进| 亚洲在线一区二区| 中文字幕一区二区三区在线视频| 天堂一区在线观看| 国产精品美女视频| 中文字幕视频免费观看| 一区二区三区四区视频| 成人亚洲网站| 亚洲精品成人久久久998| 奇米影视在线99精品| 欧美日韩国产黄色| 欧美日韩精品高清| 麻豆影视在线观看_| 成人亚洲综合色就1024| 午夜激情一区| 麻豆精品国产传媒av| 精品久久久久久久大神国产| 免费在线稳定资源站| 日韩av免费在线观看| 成人精品视频| 日韩av片免费观看| 一区二区在线观看免费视频播放| 99久久精品国产成人一区二区| 久久五月天色综合| 日韩精品成人| 精品视频在线观看一区| 久久久久久免费网| 一级α片免费看刺激高潮视频| 久久精品成人动漫| 亚洲一区网址| 精品少妇一区二区三区在线| 久久网这里都是精品| 91精品国产乱码久久久| 欧美高清在线观看| 香蕉一区二区| 日韩av.com| 亚洲午夜在线观看视频在线| 日本成人一区二区三区| 国产日本欧美一区二区三区| 欧美精品三级| 国产特黄级aaaaa片免| 欧美日韩亚洲综合在线| 国产理论电影在线 | 日韩精品永久网址| 中文写幕一区二区三区免费观成熟| 亚洲午夜精品网| 日韩午夜影院| 成人午夜激情网| 99日韩精品| 欧美三级黄色大片| 亚洲精品720p| 色综合久久久| 欧美爱爱视频免费看| 中文字幕一区视频| 色视频在线观看| 91丨九色丨国产在线| 国产精品久久国产愉拍| 搜索黄色一级片| 亚洲人成在线观看| 一区二区三区亚洲变态调教大结局|