精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

在長上下文LLM的時代,RAG是否仍然必要?

發布于 2024-9-14 13:15
瀏覽
0收藏

在長上下文LLM的時代,RAG是否仍然必要?-AI.x社區

一、結論寫在前面

論文標題:In Defense of RAG in the Era of Long-Context Language Models

論文鏈接:??https://arxiv.org/pdf/2409.01666??

克服早期生成式大型語言模型(LLMs)的有限上下文限制,檢索增強生成(RAG)在過去一直是基于上下文的答案生成的可靠解決方案。最近,長上下文LLMs的出現使得模型能夠整合更長的文本序列,使得RAG變得不那么吸引人。最近的研究表明,長上下文LLMs在長上下文應用中顯著優于RAG。與現有傾向于長上下文LLM而非RAG的工作不同,論文認為LLMs中的極長上下文會導致對相關信息的注意力減弱,并可能導致答案質量的潛在下降。    

論文重新審視了RAG在長上下文回答生成中的有效性。論文觀察到,在LLM的上下文中,檢索到的塊的順序對回答質量至關重要。與傳統RAG將檢索到的塊按相關性降序排列不同,論文提出在原始文本中保留檢索到的塊的順序。論文的實驗表明,所提出的順序保留機制顯著提高了RAG的回答質量。

與此同時,使用提出的保序RAG,隨著檢索塊數量的增加,答案質量起初上升然后下降。這是因為,隨著檢索塊的增多,模型能夠訪問到更多潛在相關的信息,從而提高了檢索到生成高質量答案所需正確上下文的機會。然而,隨著檢索塊的增多,引入不相關或干擾信息的可能性也增加。這些多余的信息可能會迷惑模型,導致答案質量下降。因此,權衡在于通過檢索更多上下文來提高召回率與通過限制干擾來保持精確度之間。最佳點在于相關與不相關信息的平衡最大化答案質量。超過這一點,引入過多不相關信息會降低模型性能。這解釋了將整個長上下文作為LLM輸入的方法性能較差的原因。

與Li等人(2024)的結論不同,通過提出的保序機制,RAG相比僅依賴長上下文LLM的同類方法,實現了更高的答案質量。如圖4a所示,在∞Bench的En.QA數據集上,僅使用16K檢索token,論文使用Llama3.1-70B達到了44.43 F1分數。相比之下,不使用RAG,Llama3.1-70B充分利用128K上下文僅達到34.32 F1分數,GPT-40僅達到32.36 F1分數,Gemini-1.5-Pro在Li等人(2024)的評估下僅獲得43.08 F1分數。也就是說,RAG即使在輸入長度顯著減少的情況下,也能實現更高的 F1分數。

二、論文的簡單介紹

2.1 論文的背景

由于早期LLM的上下文窗口長度有限(例如,4096),檢索增強生成(RAG)是處理大規模上下文語料庫不可或缺的選擇。由于答案質量在很大程度上依賴于檢索模型的性能,因此在設計RAG系統時,大量的努力都投入到提高檢索的召回率/精確度上。

最近,最先進的LLMs支持更長的上下文窗口。例如,GPT-40,Claudi-3.5,Llama3.1、Phi-3和Mistral-Large2都支持128K上下文。Gemini-1.5-pro甚至支持1M上下文窗口。長上下文LLM的近期涌現自然引發了一個問題:在長上下文LLM的時代,RAG是否仍然必要?Li et al.(2024)最近系統地比較了RAG與長上下文(LC)LLM(不使用RAG),并證明LC(long-context) LLM在回答質量方面始終優于RAG。    

在長上下文LLM的時代,RAG是否仍然必要?-AI.x社區

圖1:提出的順序保留檢索增強生成(OP-RAG)與使用長上下文LLM但不使用RAG的方法在coBench的En.QA數據集上的比較。論文的OP-RAG使用Llama3.1-70B作為生成器,顯著優于不使用RAG的Llama3.1-70B。



在長上下文LLM的時代,RAG是否仍然必要?-AI.x社區

圖 2 :普通RAG與提出的順序保留RAG的對比。如圖所示,文檔被分割成13個片段 。每個片段附有一個相似度分數。論文檢索相似度分數最高的4個片段。普通RAG按分數降序排列片段,而提出的順序保留RAG則根據片段在原始文檔中的順序排列。

2.2 順序保留RAG

論文用 d 表示長文本上下文,例如一個長文檔。論文將 d 順序且均勻地分割成 N個片段 c_i。索引 i 表示片段 c_i在 d 中的順序。即, c_i-1表示 c_i之前的片段,而 c_i+1表示 c_i之后的片段。給定一個查詢 q ,論文通過計算 q 的嵌入與 c_i的嵌入之間的余弦相似度來獲得片段 c_i的相關性分數:

在長上下文LLM的時代,RAG是否仍然必要?-AI.x社區

其中 cos(., .) 表示余弦相似度函數,emb(.) 表示嵌入函數。

在長上下文LLM的時代,RAG是否仍然必要?-AI.x社區

   

圖3:上下文長度對RAG性能的影響。評估在coBench的En.QA和EN.MC數據集上進行。

論文檢索與最高余弦相似度 d 對應的top-k個片段J這些片段在原始長上下文中的順序,即論文約束

在長上下文LLM的時代,RAG是否仍然必要?-AI.x社區

圖2展示了vanilla RAG與提出的順序保留RAG之間的差異。與vanilla RAG按相似度降序排列片段不同,提出的順序保留RAG保持了片段在原始文檔中的順序。

2.3 實驗

2.3.1 數據集

論文在∞Bench基準測試的En.QA和EN.MC數據集上進行實驗,這些數據集專門設計用于長上下文問答評估。具體來說,En.QA包含351個人工標注的問答對。平均而言,En.QA中的長上下文包含150,374個單詞。論文使用F1-score作為En.QA的評估指標。EN.MC包含224個問答對,其標注方式與En.QA類似,但每個問題提供四個答案選項。平均而言,EN.MC中的長上下文包含142,622個單詞。論文使用準確率作為EN.MC的評估指標。論文注意到還有一個名為LongBench的基準測試。然而,LongBench的平均上下文長度低于20K個單詞,不足以評估支持128K-token窗口大小的最新長上下文LLMs。

2.3.2 實現細節

論文在所有數據集上將片段大小設置為128個token。片段之間不重疊。論文默認使用BGE-large-en-v1.5來提取查詢和片段的嵌入。

2.3.3 消融實驗

論文評估了上下文長度對提出的保序RAG性能的影響。由于每個塊包含128個token,上下文長度為128 m,其中m是作為生成答案上下文檢索塊的數量。如圖3所示,隨著上下文長度的增加,性能最初有所提升。這是因為更多的上下文可能更有機會覆蓋相關塊。然而,隨著上下文長度進一步增加,答案質量下降,因為使用了更多不相關的塊作為干擾。

具體來說,Llama3.1-8B模型在EN.QA數據集和EN.MC數據集上的性能峰值出現在上下文長度為16K時,而Llama3.1-70B模型在EN.QA上的最佳性能出現在48K,在EN.MC上為32K。Llama3.1-70B的峰值點晚于Llama3.1-8B模型,這可能是因為更大規模的模型具有更強的能力來區分無關的干擾。    

在長上下文LLM的時代,RAG是否仍然必要?-AI.x社區

圖 4:提出的順序保留RAG與普通RAG的比較。評估在coBench的En.QA和EN.MC數據集上進行,使用Llama3.1-70B模型

順序保留RAG與普通RAG的比較。如圖4 所示,當檢索的塊數較少時(例如,8),提出的順序保留RAG相對于普通RAG的優勢并不顯著。相反,當檢索的塊數較多時,論文的順序保留RAG顯著優于普通RAG。具體來說,在EN.QA數據集上,當檢索的塊數為128時,普通RAG僅達到38.40 F1分數,而論文的順序保留RAG達到44.43 F1分數。在EN.MC數據集上,檢索192個塊時,普通RAG僅達到81.22的準確率,而論文的順序保留RAG達到88.65的準確率。

2.3.4 主要結果

論文將提出的順序保留RAG與兩類基線進行比較。第一類方法使用不帶RAG的長上下文LLM。如表1所示,沒有RAG時,LLM需要輸入大量的token,這既低效又昂貴。

相比之下,提出的順序保留RAG不僅顯著減少了token數量,還顯著提高了答案質量。例如,使用Llama3.1-70B模型,沒有RAG的方法在EN.QA上僅達到34.26的F1分數,平均輸入117K個token。

相比之下,論文的OP-RAG在輸入48K個token時達到47.25的F1分數。第二類基線采用SELF-ROUTE機制(Li et al., 2024),該機制根據模型自我反思將查詢路由到RAG或長上下文LLM。如表1所示,論文的方法顯著優于在LLMs輸入中使用少得多的token。    

在長上下文LLM的時代,RAG是否仍然必要?-AI.x社區

表1:不帶RAG的長上下文LLM、SELF-ROUTE機制(Li et al., 2024)與提出的順序保留(OP)RAG的比較。

本文轉載自 ??AI帝國??,作者: 無影寺

收藏
回復
舉報
回復
相關推薦
国产伦理吴梦梦伦理| 午夜剧场高清版免费观看| 黄色一区二区视频| 亚洲va久久久噜噜噜久久| 亚洲视频每日更新| 国产精品丝袜高跟| 亚洲专区区免费| 嗯~啊~轻一点视频日本在线观看| 久久狠狠亚洲综合| 亚洲性生活视频| 日本在线视频www| 天堂在线中文网| 亚洲国产一区二区三区a毛片| 制服丝袜亚洲精品中文字幕| 一区二区三区四区五区视频| 奴色虐av一区二区三区| 啪啪亚洲精品| 在线亚洲欧美专区二区| 欧美日韩精品免费观看| 国产高潮久久久| 色吊丝一区二区| 欧美午夜美女看片| 免费成人av网站| 国产精品一区无码| 欧美日本成人| 欧美一a一片一级一片| 日韩在线观看电影完整版高清免费 | av中文在线资源库| 成人涩涩免费视频| 91禁外国网站| 非洲一级黄色片| 精品69视频一区二区三区| 国产精品热久久久久夜色精品三区| 国产精品久久久久久久久久久不卡| 人人妻人人澡人人爽 | 成人xxxxx| 久久久久久视频| 视频免费一区二区| 亚洲第一综合色| 六月婷婷久久| 中文字幕理论片| 99久久激情| 精品毛片乱码1区2区3区| av日韩一区二区三区| 日韩二区三区| 久久爱www久久做| 久久91精品国产| av网站有哪些| 国产黄色精品| 亚洲国产视频网站| 日本不卡高清视频一区| 91av国产精品| 亚洲激精日韩激精欧美精品| 亚洲欧美日韩国产中文| 亚洲高清免费在线观看| 手机在线免费av| 久久久久久**毛片大全| 成人黄色av播放免费| www.av视频在线观看| 国产精品免费不| 欧美一卡二卡三卡| 免费观看精品视频| 黄网站在线免费看| 久久久久久久久久久久久久久99| 成人久久一区二区三区| 亚洲视频免费播放| 99精品美女| 日韩高清欧美高清| 男女视频在线观看网站| 一级毛片久久久| 亚洲精品一二三四区| 久久国产精品精品国产色婷婷 | 国产女优一区| 日韩一区二区福利| 成人免费看aa片| 日本亚州欧洲精品不卡| 在线观看日韩av先锋影音电影院| 国产肉体ⅹxxx137大胆| yourporn在线观看中文站| 丁香桃色午夜亚洲一区二区三区| 国产精品永久免费| 色婷婷av国产精品| 欧美黄污视频| 日韩在线观看视频免费| 好吊日免费视频| 精品欠久久久中文字幕加勒比| 欧美四级电影网| 久久久久久久久久久福利| 在线观看三级视频| 国产精品免费久久| 日韩精彩视频| 欧美69xxxxx| 91小视频免费看| 国产精品青青草| 亚洲第一页视频| 激情伊人五月天久久综合| 国产精品久久久久久婷婷天堂| 国产第一页在线播放| 欧美日韩久久| 九色精品美女在线| 欧美国产精品一二三| 天天射成人网| 久久精品国产亚洲精品2020| 污污视频网站在线免费观看| 日韩欧美精品综合| 综合久久五月天| 蜜桃av.com| 久久久久国产| 欧美精品一本久久男人的天堂| 午夜爽爽爽男女免费观看| 欧美hd在线| 日韩最新中文字幕电影免费看| 丁香激情五月少妇| 日本道不卡免费一区| 中文字幕av一区| 男人天堂资源网| 国产精品久久久久久影院8一贰佰 国产精品久久久久久麻豆一区软件 | 日韩一区二区精品在线观看| 午夜剧场高清版免费观看| 国产精品蜜月aⅴ在线| 欧美精品色一区二区三区| 91精品视频国产| 日韩视频一二区| 亚洲成人网久久久| 黄色性生活一级片| 国产99精品| 日韩在线免费视频观看| 欧美一区免费观看| 欧美精品日本| 91精品国产一区| 无码人妻丰满熟妇区bbbbxxxx | 精品国产免费无码久久久| 国产麻豆精品95视频| 99精彩视频| 四虎精品成人免费网站| 久久精品夜色噜噜亚洲aⅴ| 亚洲国产高清国产精品| 黄色在线免费网站| 亚洲大片精品永久免费| 成年人视频网站免费观看| 日韩一区二区三区在线免费观看| 欧美日韩国产综合久久| 制服下的诱惑暮生| 欧洲亚洲成人| 日韩视频欧美视频| 国产一级在线播放| 天堂成人国产精品一区| 91免费欧美精品| 天堂91在线| 亚洲视频免费看| 成人黄色片视频| www欧美在线观看| 日韩av在线电影网| 男人av资源站| 亚洲免费一区二区| 成人网在线视频| 婷婷国产在线| 亚洲色图欧美偷拍| www.com毛片| 国产精品高清一区二区| 亚洲日韩欧美视频一区| 久草免费在线观看视频| 免费精品视频在线| 精品伦理一区二区三区| 黄色av电影在线播放| 欧美日韩午夜激情| 黄页网站在线看| 欧美日韩精品在线一区| 4388成人网| 亚洲第一成人av| 国产精品萝li| 欧美日韩第二页| 成人另类视频| 草民午夜欧美限制a级福利片| 男人天堂视频在线| a级精品国产片在线观看| 国产高清免费在线| 台湾佬中文娱乐久久久| 亚洲国产精品免费| 欧美成人精品欧美一级私黄| 日本中文字幕一区二区有限公司| 狠狠色伊人亚洲综合网站色| 69xxx在线| 欧美放荡的少妇| 91麻豆制片厂| 日韩av电影免费观看高清完整版| 免费国产一区二区| 国产精品xx| 亚洲精品一区二区精华| 青娱乐国产在线视频| 九一久久久久久| 亚洲国产日韩欧美| 日韩一区二区三区免费| 日韩精品999| 青青草av在线播放| av高清久久久| 国产素人在线观看| 成人福利一区| 性色av一区二区三区在线观看| 国产国语亲子伦亲子| 亚洲色图欧美激情| 又黄又爽又色的视频| 91精品在线观看国产| 91亚洲精品久久久| 欧美性video| 精品少妇一区二区三区在线播放| 九九在线观看视频| 国产成人精品www牛牛影视| 国产又粗又爽又黄的视频| 国产精品中文| 欧美高清自拍一区| 少妇喷水在线观看| 欧美日韩在线视频首页| 女尊高h男高潮呻吟| 国产亚洲欧洲| 欧洲精品码一区二区三区免费看| 日本成人福利| 精品国内自产拍在线观看| 国产视频在线一区| 亚洲在线视频一区| 亚洲欧美日韩偷拍| 亚洲免费一区二区| 性欧美.com| 国产激情一区| 性色av一区二区三区| 九色在线免费| 欧美一区二区三区思思人| 青草影院在线观看| 成人av在线网站| 无码精品国产一区二区三区免费| 成人精品亚洲| 97中文在线| av资源亚洲| 日韩亚洲精品视频| 黄色片一区二区三区| 日韩欧美高清视频| 无码人中文字幕| 国产成人免费在线视频| 亚欧无线一线二线三线区别| 成久久久网站| 电影午夜精品一区二区三区| 国产精品一区二区av影院萌芽| 日韩一级黄色av| 人妻无码中文字幕免费视频蜜桃| 91久久精品午夜一区二区| 天天操夜夜操av| 91婷婷韩国欧美一区二区| 91国产精品视频在线观看| 午夜欧美精品久久久久久久| 欧美一区国产一区| 精品视频在线观看网站| 欧美一级淫片aaaaaaa视频| 欧洲不卡av| 亚洲精品美女网站| 国产精品久久婷婷| 岛国视频午夜一区免费在线观看| 婷婷国产成人精品视频| va亚洲va日韩不卡在线观看| 在线观看av免费观看| 午夜亚洲一区| 丁香色欲久久久久久综合网| 欧美精品尤物在线观看| 国产欧美日韩一区| 四虎精品一区二区免费| 日本高清视频一区| 天堂av在线电影| 色噜噜狠狠狠综合曰曰曰 | 国产精品99久久久久久有的能看| 欧美爱爱视频免费看| 亚洲国产日韩欧美在线| 日韩久久在线| 欧美网色网址| 国产精品一区二区a| 99久久久成人国产精品| 国产成人在线视频| 看黄在线观看| 欧美精品videosex极品1| 日本中文字幕在线视频| 亚洲人高潮女人毛茸茸| 婷婷亚洲一区二区三区| 亚洲高清在线观看| 国产三级精品在线观看| 欧美日韩免费观看一区三区| 精品国产乱子伦| 欧美色视频日本高清在线观看| 久久精品国产亚洲av高清色欲| 国产精品美女久久久久久久网站| 精品人妻互换一区二区三区| 91丨九色丨蝌蚪富婆spa| 无码人妻一区二区三区精品视频| 国产呦萝稀缺另类资源| 国产精品嫩草影院8vv8| 蜜桃91丨九色丨蝌蚪91桃色| 成人免费xxxxx在线视频| 翔田千里一区二区| 成 年 人 黄 色 大 片大 全| 激情另类综合| 99色这里只有精品| 尤物在线精品| 黄色av网址在线播放| 亚洲久久一区二区| 欧美午夜性视频| 亚洲激情婷婷| 阿v天堂2017| 午夜影院日韩| 国产精品天天av精麻传媒| 久久婷婷av| 午夜免费高清视频| 蜜臀a∨国产成人精品| 亚洲免费999| 国产一区二三区| 在线播放国产视频| av网站一区二区三区| 搡老熟女老女人一区二区| 久久综合色一综合色88| 免费看黄色的视频| 欧美激情中文字幕| 强制高潮抽搐sm调教高h| 亚洲人成亚洲人成在线观看图片 | 亚洲国产美国国产综合一区二区| 欧美日韩精品亚洲精品| 亚洲成人av在线电影| 天天干天天干天天操| 欧美性感一区二区三区| 国产情侣自拍小视频| 精品成人在线观看| 欧美另类自拍| 日韩在线免费观看视频| 免费网站在线观看人| 97超碰色婷婷| 亚洲综合av一区二区三区| 91久久久国产精品| 国内精品国产成人国产三级粉色 | 色777狠狠狠综合伊人| 欧美与动交zoz0z| 一本色道88久久加勒比精品| 国产欧美高清在线| 精品一区二区三区蜜桃| 欧亚乱熟女一区二区在线| 国产精品污网站| 久久精品www| 91成人免费在线| www黄色在线观看| 亚洲丝袜在线视频| av在线免费网站| 日韩av电影院| 欧美经典影片视频网站| 美乳视频一区二区| 亚洲最新av| 岳毛多又紧做起爽| 国产一区二区在线看| 久久久久久久久免费看无码| 亚洲欧美自拍偷拍| 最新中文字幕一区| 欧美一区二区三区四区高清| 免费在线观看一级毛片| 欧美高清视频在线| 视频一区在线免费看| 国产精品手机在线| 性欧美欧美巨大69| 久久久久久久久久久久久久国产| 国产成人综合在线播放| 在线观看免费小视频| 黄网动漫久久久| a级片在线播放| 中文字幕av一区中文字幕天堂| ****av在线网毛片| 成人免费视频a| 欧州一区二区| 大陆极品少妇内射aaaaa| 国产成人av一区二区三区在线 | 欧美一区三区三区高中清蜜桃| 国产日韩一区二区三免费高清| 欧美性天天影院| 一道本一区二区| 麻豆tv在线观看| 亚洲美女视频在线观看| 中文字幕免费观看视频| 亚洲美女av在线| 欧美调教sm| 精品久久久久久亚洲| 欧美精品色网| 四川一级毛毛片| 亚洲精品乱码久久久久久黑人| 在线观看中文字幕码| 中文字幕国产日韩| 国产成人精品123区免费视频| 美脚丝袜一区二区三区在线观看| 99在线精品免费视频九九视| zjzjzjzjzj亚洲女人| 一区二区三区**美女毛片| 91美女精品网站| www.亚洲免费视频| 成人四虎影院| 一区二区日本伦理| 久久99这里只有精品| 成年人网站在线观看视频| 欧美日韩一区二区三区免费看| 都市激情在线视频| 国产精品91免费在线|