精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

拯救被「掰彎」的GPT-4!西交微軟北大聯合提出IN2訓練治療LLM「中間迷失」

發布于 2024-5-22 08:49
瀏覽
0收藏

辛辛苦苦給大語言模型輸入了一大堆提示,它卻只記住了開頭和結尾?


這個現象叫做LLM的中間迷失(Lost in the Middle),是大模型當前仍面臨的最大挑戰之一。


畢竟,LLM現在的上下文長度已經沖到了百萬級別,而難以處理中間的信息,會使得LLM在評估大量數據時不再可靠。

拯救被「掰彎」的GPT-4!西交微軟北大聯合提出IN2訓練治療LLM「中間迷失」-AI.x社區

Midjourney對于Lost in the Middle的理解

其實,我們人類也有類似「中間迷失」的毛病,心理學上叫「Primacy/recency effect」,感興趣的讀者可以參見:

??https://www.sciencedirect.com/topics/psychology/recency-effect??


「我怕零點的鐘聲太響......后面忘了」


不過就在不久前,來自西交、微軟和北大的研究人員,開發了一種純粹的數據驅動解決方案,來治療LLM丟失中間信息的癥狀:

拯救被「掰彎」的GPT-4!西交微軟北大聯合提出IN2訓練治療LLM「中間迷失」-AI.x社區

論文地址:https://arxiv.org/pdf/2404.16811


研究人員認為,Lost in the Middle的原因是訓練數據中的無意偏差。


因為LLM的預訓練側重于根據最近的一些token預測下一個token,而在微調過程中,真正的指令又往往位于上下文開始的位置。


這在不知不覺中引入了一種立場偏見,讓LLM認為重要信息總是位于上下文的開頭和結尾。


基于這樣的見解,研究人員提出了信息密集型(INformation-INtensive,IN2)訓練方法,來建立數據之間的橋梁。

拯救被「掰彎」的GPT-4!西交微軟北大聯合提出IN2訓練治療LLM「中間迷失」-AI.x社區

既然是訓練過程造成的偏見,那么就用訓練數據來解決。


IN2訓練使用合成問答數據,向模型顯式指出重要信息可以位于上下文中的任何位置。


整個上下文長度(4K-32K個token),被分為許多128個token的片段,而答案所對應的信息位于隨機位置的片段中。

拯救被「掰彎」的GPT-4!西交微軟北大聯合提出IN2訓練治療LLM「中間迷失」-AI.x社區

研究人員使用了兩種類型的訓練問題:一種是要求在一個片段中提供細節,另一種是需要整合和推斷來自多個片段的信息。


IN2訓練到底效果如何?使用明星模型Mistral-7B來試試。


將IN2訓練應用于Mistral-7B,得到了新模型FILM-7B(FILl-in-the-Middle),然后測試為長上下文設計的三個新的提取任務。


測試任務涵蓋不同的上下文類型(文檔、代碼、結構化數據)和搜索模式(向前、向后、雙向)。

拯救被「掰彎」的GPT-4!西交微軟北大聯合提出IN2訓練治療LLM「中間迷失」-AI.x社區

結果表明,IN2顯著降低了原始Mistral模型的「中間丟失」問題。更厲害的是,作為只有7B的模型,FILM的性能在很多情況下甚至超越了GPT-4 Turbo。


在保持自己執行短上下文任務能力的同時,FILM-7B在各種長上下文任務中也表現出色,例如總結長文本,回答有關長文檔的問題,以及對多個文檔的推理。

拯救被「掰彎」的GPT-4!西交微軟北大聯合提出IN2訓練治療LLM「中間迷失」-AI.x社區

上表是不同模型在現實的長上下文任務中的表現。與本體Mistral-7B 相比,INformation-INtensive (IN2) 訓練帶來的提升很明顯,FILM-7B的綜合成績僅次于GPT-4 Turbo。


不過有一說一,Lost in the Middle的問題并沒有完全解決,而且在長上下文存在問題的情況下,GPT-4 Turbo也仍然是上下文基準中最強的模型。

Lost in the Middle

LLM丟失中間信息的問題最早由斯坦福、UC伯克利和Samaya AI的研究人員在去年發現。

拯救被「掰彎」的GPT-4!西交微軟北大聯合提出IN2訓練治療LLM「中間迷失」-AI.x社區

論文地址:https://arxiv.org/pdf/2307.03172


當面對較長的信息流時,人類傾向于記住開頭和結尾,中間的內容更容易被忽視。

沒想到LLM也學會了這個套路:對于從輸入中檢索信息的任務,當信息位于輸入的開頭或結尾時,模型的表現最好。


但是,當相關信息位于輸入的中間時,性能會顯著下降。尤其是在回答需要從多個文檔中提取信息的問題時,性能下降尤為明顯。


——真是干啥啥不行,偷懶第一名。


模型必須同時處理的輸入越多,其性能往往越差。——而在實際得應用場景中,往往就是需要LLM同時均勻地處理大量信息。


另外,研究結果還表明,大型語言模型使用額外信息的效率是有限的,具有特別詳細指令的「大型提示」可能弊大于利。

拯救被「掰彎」的GPT-4!西交微軟北大聯合提出IN2訓練治療LLM「中間迷失」-AI.x社區

對于許多長上下文LLM,中間信息丟失的現象普遍存在。上表測試了當時市面上流行的各種款式LLM,包括GPT-4,一共是七種。


可以看出,不論是開源還是閉源模型的強者,測試結果都顯示出明顯的U形曲線,說明都是在兩頭效果好,而中間就拉跨了。

拯救被「掰彎」的GPT-4!西交微軟北大聯合提出IN2訓練治療LLM「中間迷失」-AI.x社區

即使強如GPT-4,也難逃被「掰彎」的命運。


這也不禁讓人質疑:你們這些卷超長上下文的模型到底有沒有用啊?不但吃得多,中間信息也記不住。

信息密集型訓練大法

為了明確教導模型,在長上下文中的任何位置都可以包含關鍵信息。研究人員構建了一個長上下文問答訓練數據集 D = {L,q,a},其中問題q的答案a,來自長上下文L中的隨機位置。


下圖展示了整個數據構建過程。具體來說,訓練數據D基于通用自然語言語料庫C。給定一個原始文本,首先使用LLM(GPT-4-Turbo)生成一個問答對 (q,a),然后合成一個長上下文 L,其中包括來自C的其他隨機抽樣文本的必要信息。

拯救被「掰彎」的GPT-4!西交微軟北大聯合提出IN2訓練治療LLM「中間迷失」-AI.x社區

上圖包含兩種類型的問答對:(1)對長上下文中細粒度信息的掌握;(2)對長上下文中不同位置出現的信息進行整合和推理。

細粒度信息感知

將包含128個token的段視為上下文的最小信息單元。給定一個原始文本C,首先從中隨機提取一個128個token的段s,然后生成q、a和 L:

拯救被「掰彎」的GPT-4!西交微軟北大聯合提出IN2訓練治療LLM「中間迷失」-AI.x社區

信息整合和推理

除了利用每個片段之外,研究人員還考慮為兩個或多個片段中包含的信息生成問答對。

按照上面最小信息單元的設置,同樣將全文拆分為一組128個token的段 [s],然后相應地生成 q、a和L:

拯救被「掰彎」的GPT-4!西交微軟北大聯合提出IN2訓練治療LLM「中間迷失」-AI.x社區

使用LLM生成多跳問答對,保證每個問題對應的答案至少需要兩個段內的信息。

訓練

整個訓練數據集包含:1.1M用于細粒度信息感知的長上下文數據(~63%)、300K用于信息整合和推理的長上下文數據(~17%)、150K短上下文問答數據(~9%)和200K通用指令調整數據(~11%)。


使用上面構建的訓練數據,研究人員對Mistral-7B-Instruct-v0.2執行 IN2訓練:將長上下文和問題作為指令,并使用答案部分的損失來更新模型。


超參數:將全局批處理大小設置為128,使用余弦學習率衰減,最大值為1e-6。

拯救被「掰彎」的GPT-4!西交微軟北大聯合提出IN2訓練治療LLM「中間迷失」-AI.x社區

模型訓練在16個80G A100 GPU上進行,采用由pytorch FSDP實現的完整分片策略和cpu卸載策略,整個訓練過程耗時大約18天。

VAL 探測

研究人員提出了VAL探測方法,作為評估語言模型上下文性能的更合適的方法,涵蓋了不同的上下文風格和檢索模式,以進行更徹底的評估。


下圖表示VAL探測中的三個任務。檢索模式由檢索關鍵字與要檢索的信息之間的相對位置決定。

拯救被「掰彎」的GPT-4!西交微軟北大聯合提出IN2訓練治療LLM「中間迷失」-AI.x社區

這里考慮了三種上下文樣式(文檔、代碼和結構化數據上下文)和三種檢索模式(前向、后向和雙向檢索)。


VAL探測中的每個上下文都包含約32K個token,每個任務包含約3K個示例。


文檔句子檢索(雙向):上下文由許多自然語言句子組成,目的是檢索包含給定片段的單個句子。這些句子是從arXiv上的論文摘要中抽取的。


此任務遵循雙向檢索模式,因為預期的檢索結果包含上下文中給定片段之前和之后的單詞。評估指標是單詞級別的召回率分數。


代碼函數檢索(向后):上下文由Python函數組成,目的是檢索函數定義中給定代碼行的函數名稱。原始代碼函數是從StarCoder數據集中采樣的,并為每個函數隨機選擇三行定義。


此任務遵循向后檢索模式,因為函數名稱始終位于定義之前。評估指標是匹配精度。


數據庫實體檢索(向前):上下文包含結構化實體列表,每個實體都有三個字段:ID、label和description,目的是檢索給定ID的標簽和說明。這些實體是從維基百科數據中采樣的。


此任務遵循正向檢索模式,因為標簽和說明跟隨ID。以寬松的匹配準確性作為衡量標準:如果響應中的標簽或描述完全匹配,則給出 1 分,否則為0分。


本文轉自 新智元 ,作者:新智元


原文鏈接:??https://mp.weixin.qq.com/s/O0GXiaa3aypMWLJcvyboYA??


收藏
回復
舉報
回復
相關推薦
国产成人综合视频| 国产日韩欧美| 精品国产不卡一区二区三区| 1024av视频| 国产一二在线观看| 国产一区二区三区在线观看精品| 国内精品久久久久久中文字幕| 亚洲精品女人久久久| 欧美日韩免费电影| 精品久久中文字幕久久av| 亚洲高清视频一区二区| 亚洲第一精品网站| 免费成人av资源网| 午夜精品免费视频| 精品人妻伦九区久久aaa片| 五月综合久久| 欧美变态tickle挠乳网站| 在线免费观看视频黄| av免费不卡| 亚洲日本乱码在线观看| 欧美日韩国产综合在线| 国产丰满美女做爰| 免费观看日韩av| 欧美一区二区三区图| 精品无码久久久久久久| 日韩在线观看一区| 亚洲欧美日韩中文视频| 中文字幕人妻一区| 97久久精品一区二区三区的观看方式 | 女人香蕉久久**毛片精品| 亚洲午夜色婷婷在线| avtt香蕉久久| 成人在线tv视频| 欧美一二三区在线观看| 日韩不卡一二三| 97se综合| 色综合天天天天做夜夜夜夜做| 免费人成在线观看视频播放| 日本视频不卡| 国产欧美精品在线观看| 欧美精品欧美精品| 性猛交xxxx| 99久久国产综合精品色伊| 99久热re在线精品视频| 一卡二卡在线视频| 日本不卡视频在线| 国产va免费精品高清在线| 久久99精品波多结衣一区| 精品动漫av| 国产69精品久久久久9999| 久久久久久久久久久97| 亚洲欧洲中文字幕| 精品综合久久久久久97| 欧美日韩在线观看免费| 欧美日韩国产综合网| 免费成人高清视频| 久久久久久福利| 欧美视频日韩| 97人人做人人爱| 你懂的国产视频| 男人天堂欧美日韩| 国产精品r级在线| 中文字幕一区二区人妻痴汉电车| 日韩精品乱码免费| 国产一区二区丝袜| 国产成人三级一区二区在线观看一| 国产乱子轮精品视频| 国产91免费视频| 视频一区二区免费| 久久日韩粉嫩一区二区三区| 神马影院我不卡午夜| 美女免费久久| 亚洲国产乱码最新视频| 免费 成 人 黄 色| 视频在线日韩| 欧美精品视频www在线观看| 天堂网成人在线| 爱高潮www亚洲精品| 亚洲国产第一页| 高潮毛片无遮挡| 我不卡伦不卡影院| 欧美精品久久久久久久久| 日韩欧美高清在线观看| 老司机免费视频久久| 成人av在线亚洲| 四虎免费在线观看| 国产欧美中文在线| 成人国产在线看| 免费日韩电影| 日韩一级成人av| 亚洲第一香蕉网| 久久久久久久久久久久久久久久久久| 欧美精品激情在线| 中文字幕一区2区3区| 成人丝袜视频网| 日韩精品一区二区三区丰满| 在线h片观看| 富二代精品短视频| 九九热视频免费| 美日韩中文字幕| 久久6精品影院| 艳妇乳肉豪妇荡乳av无码福利| 国产精品一区二区你懂的| 你懂的网址一区二区三区| 99在线播放| 在线视频一区二区免费| 日本人妻一区二区三区| 国产一区毛片| 欧美精品精品精品精品免费| 亚洲天堂aaa| 91小视频在线| 午夜啪啪福利视频| 欧美free嫩15| 亚洲成色999久久网站| 国精品人伦一区二区三区蜜桃| 一本综合精品| 99porn视频在线| 自拍视频在线免费观看| 狠狠爱在线视频一区| 亚洲女人在线观看| 婷婷中文字幕一区| 国产精品va在线| 日本不卡免费播放| 亚洲国产精品久久人人爱| 国产成人在线综合| 国产亚洲一卡2卡3卡4卡新区 | 樱桃视频成人在线观看| 精品精品国产高清一毛片一天堂| 999久久久国产| 丝袜美腿亚洲一区二区图片| 国产一区视频观看| 日本孕妇大胆孕交无码| 欧美精品v日韩精品v韩国精品v| 久久久久久国产精品无码| 在线成人直播| 成人激情视频在线播放| 一本一道波多野毛片中文在线| 一本色道久久综合狠狠躁的推荐 | 盗摄牛牛av影视一区二区| 久久精品91久久香蕉加勒比| 中文字幕在线网址| 国产欧美精品国产国产专区| 无码日韩人妻精品久久蜜桃| 网红女主播少妇精品视频| 性欧美xxxx视频在线观看| 欧洲av在线播放| 亚洲国产sm捆绑调教视频| 真实乱偷全部视频| 欧美日韩精品| 国产欧美日韩伦理| 日韩伦理在线一区| 亚洲精品综合精品自拍| 精产国品一区二区| 国产日本欧美一区二区| 国产wwwxx| 日韩视频在线观看| 成人福利视频在线观看| 直接在线观看的三级网址| 日韩一区二区三区四区| 精品无码久久久久| 91美女片黄在线观看| 黄色一级二级三级| 国产精品7m凸凹视频分类| 2022国产精品| 999精品网| 日韩精品免费在线视频观看| 日批视频免费在线观看| 国产精品久久久99| 中文字幕一二三区| 国产日韩欧美三区| 视频一区二区三区免费观看| 亚瑟国产精品| 欧美激情视频给我| 欧美中文在线| 91精品中文字幕一区二区三区| 九九视频免费看| 91丨九色丨国产丨porny| 亚洲少妇第一页| 欧美一区成人| 久久青青草综合| 亚洲欧洲二区| 高清在线视频日韩欧美| 国产高清在线| 日韩欧美精品在线| 日本视频免费观看| 亚洲精品一二三| 少妇大叫太粗太大爽一区二区| 久久精品国产**网站演员| 国产精品无码免费专区午夜| 亚洲香蕉视频| 91九色蝌蚪成人| 女生影院久久| 欧美极品欧美精品欧美视频| 福利成人在线观看| 精品久久久久久综合日本欧美| 亚洲av中文无码乱人伦在线视色| 国产精品午夜免费| 国产精品麻豆入口| 老司机免费视频一区二区| 国产成人永久免费视频| 成人精品影视| 国产一区国产精品| 九九九九九九精品任你躁| 国产91热爆ts人妖在线| 日本片在线观看| 国产一区二区三区视频免费| 黄色片网站免费在线观看| 欧美三级电影一区| 在线观看免费国产视频| 有坂深雪av一区二区精品| 亚洲色图 激情小说| 成人丝袜高跟foot| 深爱五月综合网| 日本欧美在线观看| 国产成人无码精品久久久性色| 亚洲最新av| 神马一区二区影院| 岳的好大精品一区二区三区| 国产精品夜夜夜一区二区三区尤| 国产精品原创视频| 国产97在线视频| 九色porny自拍视频在线播放| 欧美大尺度激情区在线播放| 香港伦理在线| 在线电影av不卡网址| 牛牛影视精品影视| 日韩精品极品视频免费观看| 亚洲爱情岛论坛永久| 91精品国产乱码久久蜜臀| 日批视频免费观看| 欧美中文字幕一区二区三区| 国产成人一级片| 欧美午夜久久久| 欧美啪啪小视频| 精品免费在线视频| 国产性xxxx高清| 亚洲国产美女搞黄色| 精品亚洲永久免费| 亚洲综合免费观看高清在线观看| 精品亚洲乱码一区二区| 国产精品福利av| 免费一级黄色录像| 国产精品乱子久久久久| 国产精品一区二区亚洲| 国产精品午夜在线| 永久免费看片视频教学| 亚洲欧洲日本在线| 欧美成人777| 一区二区三区成人| 国产精品成人久久| 午夜精品久久久久久久久久久| 久久久久久久久久免费视频 | 日本少妇高潮喷水视频| 日韩一级在线| 久久久噜噜噜www成人网| 老牛国产精品一区的观看方式| 青青在线视频免费| 秋霞午夜av一区二区三区| 国产aaaaa毛片| 久久国产精品99精品国产| 亚洲色图欧美自拍| 高清不卡一二三区| 中国极品少妇videossexhd| 97aⅴ精品视频一二三区| 性高潮久久久久久久 | 九九视频在线免费观看| 亚洲一区在线播放| 天天综合天天干| 日本韩国欧美一区| 在线免费看91| 日韩免费福利电影在线观看| 天天摸天天干天天操| 国产一区二区三区网站| 欧美性天天影视| 欧美激情国内偷拍| 伊人久久视频| 成人www视频在线观看| 91久久偷偷做嫩草影院电| 看欧美日韩国产| 99久久亚洲精品蜜臀| 国产精品久久久久久久乖乖| 亚洲专区欧美专区| 久久国产精品国产精品| 国产传媒欧美日韩成人| 97超碰在线免费观看| 亚洲视频综合在线| 亚洲黄色小说图片| 7777精品伊人久久久大香线蕉经典版下载 | 日韩精品在线免费| 国产69久久| 欧美激情一级二级| 在线观看精品| 99精品99久久久久久宅男| 国产va免费精品观看精品视频 | 国产另类自拍| 日韩黄色大片| 日本精品免费在线观看| 国产米奇在线777精品观看| 少妇精品一区二区三区| 亚洲日本在线观看| 天堂免费在线视频| 亚洲精品美女免费| caoporn免费在线视频| 91精品国产乱码久久久久久蜜臀 | 国产精品久久久久久久av| 亚洲一区在线观看网站| 自拍偷拍福利视频| 日韩精品在线影院| 日本在线视频www鲁啊鲁| 国产免费一区二区三区在线能观看 | 4438成人网| 国产综合视频一区二区三区免费| 久久99亚洲热视| 欧美风情在线视频| 免费在线成人av| 99精品免费视频| 潘金莲一级淫片aaaaa| 国产精品免费看片| 中文字幕手机在线视频| 亚洲成年人影院在线| 综合久久2019| 成人午夜在线影院| 日韩精品永久网址| 亚洲成人福利在线观看| 久久亚洲精品小早川怜子| 国产一区二区三区影院| 欧美成人乱码一区二区三区| 超碰在线无需免费| 成人免费高清完整版在线观看| 欧美视频网址| 老头吃奶性行交视频| 久久影院午夜片一区| 国产精品视频久久久久久久| 精品久久久久久最新网址| 亚洲国产精品精华素| aaa级精品久久久国产片| 牛夜精品久久久久久久99黑人| 中文字幕日韩综合| 国产精品福利一区二区| 91亚洲欧美激情| 久久国内精品一国内精品| 小说区图片区亚洲| 正在播放久久| 国内精品不卡在线| 中文字幕在线2021| 日韩情涩欧美日韩视频| 91高清在线观看视频| 99精品国产一区二区| 激情偷拍久久| 一区二区三区四区影院| 亚洲国产色一区| 天堂中文在线资| 国产ts人妖一区二区三区| 国产一区二区三区网| 色乱码一区二区三区在线| 一区在线播放视频| 国产黄色av网站| 国内精品国产三级国产在线专| 国产色噜噜噜91在线精品| 欧美亚洲一二三区| 中文字幕欧美激情| 国产一区二区视频免费观看 | 欧美理论影院| 亚洲成色最大综合在线| 国产酒店精品激情| 久一视频在线观看| 日韩精品在线观看一区| 欧美成人app| 午夜在线视频免费观看| 成人h动漫精品一区二| 日本a级c片免费看三区| 视频在线观看一区二区| 亚洲专区**| 欧在线一二三四区| 亚洲免费观看高清在线观看| 欧美在线 | 亚洲| 国产精品久久久久影院日本| 91精品精品| 亚洲国产精品自拍视频| 欧美日韩国产一级片| 久草在线视频福利| 日本成人三级| 国产高清亚洲一区| 亚洲中文一区二区| 九九精品在线观看| 亚洲裸色大胆大尺寸艺术写真| 欧美成年人视频在线观看| 亚洲一区国产视频| 国产精品ⅴa有声小说| 超碰国产精品久久国产精品99| 视频一区中文字幕| 麻豆视频在线观看| 中文字幕一区二区三区电影| aaa国产精品视频| 在线看的黄色网址| 亚洲二区在线观看| 免费大片在线观看www| 久久久久高清| 国产成人自拍网| 亚洲天堂999|