精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

又來一個RAG:RankRAG,英偉達RAG新思路

發布于 2024-7-16 09:30
瀏覽
0收藏

1. 背景

檢索增強生成無疑是當前最熱門的LLM研究領域了,但是傳統RAG存在一些局限性:

? 檢索器容量的限制。考慮到處理效率,現有的RAG一般采用稀疏檢索(比如BM25)或中等規模的嵌入模型(比如Bert)作為檢索器。

? 只選擇前K個文檔。盡管最新的大語言模型擴大了上下文長度的限制,能夠接受更多的上下文作為輸入,但是實際性能會隨著K的增加而迅速達到飽和。比如在長問答任務中,最佳的分塊上下文數量大約是10。雖然更大的K可以提高召回率,但是同時也引入了更多無關的內容,干擾大語言模型生成準確回答。

因此,作者設計了一個新的RAG:RankRAG,利用單一大語言模型來實現高召回率的上下文提取和高質量內容生成。通過對單一大語言模型進行指令調優,使其可以同時進行上下文排序和答案生成,進一步提升LLM在RAG檢索和生成階段排除不相關上下文的能力。

2. RankRAG

RankRAG整體包括兩個階段:指令調優階段、排名與生成綜合指令調優階段。

又來一個RAG:RankRAG,英偉達RAG新思路-AI.x社區圖片

2.1 第一階段:指令調優(SFT)階段

指令調優(或監督式微調)可以顯著提升大語言模型指令遵循的能力,從而提高下游任務的零樣本性能。所以,作者先對大語言模型進行指令調優。

總共準備了128K SFT樣本,確保樣本中沒有數據泄露,沒有與評估任務重的數據重疊,并采用多輪對話格式。

第一階段的指令調優數據集包括:公共對話數據集、長篇問答數據集、Chain of Thought數據集以及合成數據集。

2.2 排名與生成的綜合指令調優階段

第一階段的SFT目的是為大模型奠定指令遵循的基礎能力,但是在RAG任務上,這些模型仍然還有提升空間。為了提升這些模型在RAG任務上的性能,作者進行了第二階段的指令調優。第二階段的指令調優包括五個部分:

2.2.1 第一階段的SFT數據

這部分數據的納入是為了保持LLM遵循指令的能力。

2.2.2 富含上下文的QA數據

在數據集中加入多個富含上下文的QA任務數據來加強LLM利用上下文回答問題的能力。采用混合訓練數據集:

  • ? 標準的QA和閱讀理解數據集
  • ? 對話QA數據集

2.2.3 檢索增強問答數據

引入兩個新數據集,不僅包含標準答案的上下文,還包括通過BM25算法檢索出的最相關上下文。

增強LLM在生成回答時,對無關上下文的抗干擾能力也非常重要,所以作者特別考慮了SQuAD和WebQuestion兩個問答任務數據集。對于每個問題,作者將標準答案的上下文和BM25檢索出的上下文進行融合,確保每個問題都能至少關聯5個上下文。其中部分檢索出的上下文可能是不包含答案的,這些被稱為負樣本。

2.2.4 上下文排名數據

為了使模型具有LLM排名能力,作者采用了大家普遍認可的MS MARCO段落排名數據集。將標準查詢-段落對(q,d+)定義為正樣本,而通過BM25算法挖掘出的硬負樣本段落(q,d-)定義為負樣本。LLM需要根據給定的查詢-段落對生成“真”或“假”的回答,任務指令是“針對問題{question},請判斷該段落是否與問題相關。”

雖然MS MARCO覆蓋了眾多主題,但問題均為單輪簡短句子。然而,針對對話問答的排名數據極為稀缺。

為解決這一局限,將對話問答對重新設計,以生成偽相關對。鑒于每段對話僅關聯一個文檔,將每個文檔切割成150字的段落(d1,d2,...,dn)。計算每個段落di與標準答案間的4-gram召回率,將召回率超過0.5的段落判定為與對話相關,低于0.1的則判定為不相關。每個樣本包含一對問題-上下文,用于排名數據集。

合成后的數據加上開始的MS MARCO數據,一共約50K數據用于本階段的指令微調。

2.2.5 檢索增強型排名數據

為了使模型能夠針對一個問題評估多個上下文的相關性,采用了SQuAD和WebQuestions兩個問答數據集,通過BM25算法,將標準答案上下文與檢索出的最相關上下文相結合,確保每個問題關聯五個上下文。凡包含答案的上下文均被視為相關,訓練LLM識別與問題相關的所有上下文。

2.3 RankRAG 推理流程:檢索-重排-生成三部曲

融入額外的重排環節,RankRAG 的推理流程轉變為三步走策略:檢索-重排-生成,具體步驟如下:

(1) 檢索器 ? 率先在文本庫中篩選出 top-k 個相關上下文。

又來一個RAG:RankRAG,英偉達RAG新思路-AI.x社區圖片

(2) RankRAG 模型進而基于上表中的提示,評估問題與這些檢索到的上下文之間的相關性得分,以此作為生成正確答案的概率,隨后對上下文進行重排,精挑細選出 top-k(k'遠小于k)個最為貼切的上下文,作為下一步生成答案的依據。

(3) 精選出的 top-k' 個上下文與問題串聯,再次輸入 RankRAG 模型,以此生成最終的答復。

3. 效果對比

3.1 主要結果

又來一個RAG:RankRAG,英偉達RAG新思路-AI.x社區圖片

又來一個RAG:RankRAG,英偉達RAG新思路-AI.x社區圖片

又來一個RAG:RankRAG,英偉達RAG新思路-AI.x社區圖片

上圖展示了RankRAG與基線在九個數據集上的比較結果。所有結果均在零樣本評估條件下得出(除非特別標注),未附加額外示例。

RankRAG在性能上超越了現有的RAG方法: 以8B模型規模來看,RankRAG持續領先于ChatQA-1.5 8B,后者是最近開源且在眾多RAG基準測試中表現卓越的模型。即使面對參數量多得多的基線模型,RankRAG 8B依然展現出強勁的競爭力。舉例來說,它顯著超越了參數量為其五倍的InstructRetro、參數量為其八倍的RA-DIT 65B,甚至在NQ和TriviaQA任務上超越了參數量為其八倍的Llama3-instruct 70B。參數量更多的RankRAG 70B不僅戰勝了強勁的ChatQA-1.5 70B模型,還大幅超越了以InstructGPT為基礎LLM的先前RAG基線。

RankRAG在更具挑戰性的數據集上取得了更顯著的進步: RankRAG在處理更具挑戰性的QA數據集時,性能提升更為顯著。比如,在長尾QA(PopQA)和多跳QA(2WikimQA)任務中,相較于ChatQA-1.5,實現了超過10%的性能提升。這些結果表明,在挑戰性的開放問答數據集中,當檢索器返回的頂部文檔與答案的相關性不高時,上下文排名能顯著增強性能。今天這篇論文專注于提升QA任務的單次檢索效果。如何有效地將多輪RAG流程與RankRAG結合,是未來研究值得探索的有趣方向。

5.3 組件效果分析

又來一個RAG:RankRAG,英偉達RAG新思路-AI.x社區圖片

通過在九個廣泛領域的數據集上以Llama3 8B作為基礎模型,展示了對RankRAG進行的組件切除實驗。總體來看,發現所提出的各個組件均對提升最終性能起到了積極作用。

若去除上下文排名功能,將在所有任務中造成性能下降,這證實了其在篩選與目標問題最密切相關上下文中的關鍵作用。

同時,為指令微調特別設計的檢索增強問答(RQA)和檢索增強排名(RAR)通過輔助模型明確識別相關上下文,在大多數任務中帶來了性能提升。

又來一個RAG:RankRAG,英偉達RAG新思路-AI.x社區圖片

性能隨不同檢索器的變化。如上圖,對比了RankRAG和ChatQA-1.5在三個典型任務中搭配不同密集檢索器的表現,特別考慮了DPR與Contriever-MS MARCO這兩種檢索器變體。可以看到,即便初次檢索結果不盡人意,RankRAG在平均性能上依然超越了ChatQA-1.5,幅度超過10%。綜上,RankRAG對于檢索器的選擇展現出了良好的適應性和魯棒性。

5.4 領域特定RAG基準測試的實驗驗證

為驗證RankRAG對專業領域的適應能力,在生物醫學領域的最新RAG基準測試Mirage上進行了實驗。采用MedCPT(Jin等人,2023年)作為檢索器?,并以MedCorp2作為語料庫??。

又來一個RAG:RankRAG,英偉達RAG新思路-AI.x社區圖片

上圖展示了RankRAG與基線的實驗結果,即便未針對生物醫學領域進行微調,RankRAG在醫學問答任務上依然表現卓越。特別是RankRAG 8B在性能上超越了醫療領域領先的開源LLM Meditron 70B達6.3%。

此外,RankRAG 70B的性能更是達到了GPT-4的98%以上。充分證明了RankRAG具備快速適應新領域并無需額外訓練的能力。

5.5 細究排名模塊

RankRAG在數據使用上極為高效:

傳統RAG流程的上下文排名方法通常需要一個獨立的重排模型。作者評估了四款在完整MS MARCO段落排名數據集上經過微調的模型(BERT(Glass等人,2022年)/T5(Nogueira等人,2020年)/Llama3(Ma等人,2023年)),一個強大的現成重排模型BGE-ranker,以及兩款OpenAI的GPT系列模型。對于GPT系列,用‘True’標記的概率來代理相關性得分。

又來一個RAG:RankRAG,英偉達RAG新思路-AI.x社區圖片

如上表,RankRAG在多數情況下,即使在排名數據量僅為十分之一,也能實現比專用排名模型更好的召回率。此外,RankRAG在大多數任務上仍能超越經過超過100萬個排名對訓練的BGE-ranker。這一優勢可能源于我們模型訓練的適應性,排名數據與一般RAG微調數據高度相似。直接使用ChatQA-1.5進行段落排名會降低性能,這表明在指令微調中納入排名數據的必要性。

作者驗證了上下文排名數據量與最終性能之間的關聯。僅用5k排名數據(約MS MARCO數據集的1%),RankRAG便能取得非常出色的成果,而將排名數據量增加至50k,能帶來額外的顯著增益。這驗證了RankRAG的數據高效性——僅需少量排名數據即可達到高效性能,并在多樣的任務中維持其適應性。

RankRAG的性能與時間效率權衡:

擴大模型規模時需注意的一個細節是,延遲開銷的增加——模型需要對每個樣本進行排名,這會耗費更多時間。

又來一個RAG:RankRAG,英偉達RAG新思路-AI.x社區圖片

為了探究時間效率與性能之間的聯系,調整了重排名過程中使用的樣本數k,上圖展示了k值與最終準確性之間的關系。結果表明,即便k值設為20,RankRAG的性能依然超過了未進行重排名的基線模型。當k值從20增加至100,三個任務的完全匹配準確率提升了5.9%至9.1%,而所需時間僅增加了0.9至6.0倍,遠低于人們可能預期的20至100倍的增長。

又來一個RAG:RankRAG,英偉達RAG新思路-AI.x社區

本文轉載自 ??大語言模型論文跟蹤??,作者:HuggingAGI

已于2024-7-16 09:31:28修改
收藏
回復
舉報
回復
相關推薦
亚洲福利av| 8050国产精品久久久久久| 最新国产黄色网址| 色爱综合区网| 国产午夜精品福利| **亚洲第一综合导航网站| 中文字幕一区二区三区手机版| 欧美黑人做爰爽爽爽| 在线免费av一区| www.成年人视频| 成人高清免费在线播放| 国产成人av电影| 国产精品高精视频免费| 久久久无码精品亚洲国产| 亚洲丝袜啪啪| 精品久久久久久久久久久院品网 | 激情欧美日韩| 日韩在线视频网站| 波多野结衣片子| heyzo欧美激情| 欧美男人的天堂一二区| 日韩欧美精品在线观看视频| 97超碰资源站在线观看| 欧美激情中文字幕| 免费精品视频一区二区三区| 亚洲精品久久久蜜桃动漫| 久久成人18免费观看| 欧美最顶级的aⅴ艳星| 九九视频在线免费观看| 99久久亚洲精品蜜臀| 亚洲精品一区中文| 中文在线观看免费视频| 国产一区二区视频在线看| 欧美性猛交xxxx乱大交退制版| av之家在线观看| 国产一线二线在线观看| 亚洲精品日韩专区silk| 亚洲图片都市激情| 91短视频版在线观看www免费| 久久青草欧美一区二区三区| 亚洲最大福利视频网站| 国产免费一区二区三区免费视频| 蜜臀国产一区二区三区在线播放| 日本在线精品视频| 久久久免费高清视频| 亚洲欧洲日本mm| 欧美精品videosex性欧美| 欧美人妻精品一区二区三区| 天天做天天爱天天综合网| 一区二区三区视频免费在线观看| 97超碰在线免费观看| 一区三区在线欧| 亚洲欧美日韩一区在线| 国产ts在线播放| 欧美日韩激情| 色视频www在线播放国产成人| 天堂资源在线视频| 91久久夜色精品国产按摩| 综合国产在线观看| 91传媒免费观看| 91精品91| 国外成人在线直播| www日韩精品| 丝袜国产日韩另类美女| 国产成人在线视频| 一区二区久久精品66国产精品| 蜜桃视频在线观看一区| 91在线高清免费观看| 国产99久一区二区三区a片 | 91九色视频在线| 国产免费黄色网址| 成人黄色一级视频| 欧洲精品国产| 精品51国产黑色丝袜高跟鞋| 亚洲免费在线视频一区 二区| av一区二区三区免费观看| av中文资源在线资源免费观看| 日韩欧美在线免费| 国产精品久久久毛片| 高清精品久久| 亚洲成在人线av| 亚洲区免费视频| 99精品一区| 久久免费视频观看| 亚洲av无码不卡| 精品影视av免费| 懂色av一区二区三区在线播放| 亚州男人的天堂| 国产精品久久久久久久久久久免费看 | jlzzjlzz亚洲女人| 欧美精品少妇videofree| 日韩欧美国产亚洲| 久久99久国产精品黄毛片色诱| 91精品国产99久久久久久红楼| 涩涩视频在线观看免费| 中文字幕一区二区5566日韩| 东北少妇不带套对白| а√天堂资源国产精品| 亚洲黄在线观看| 欧美精品日韩在线| 亚洲国产午夜| 国产在线视频2019最新视频| 性xxxfllreexxx少妇| 亚洲欧洲国产专区| 国产精品少妇在线视频| 玖玖精品一区| 在线看日韩欧美| 欧美福利视频一区二区| 久久er99热精品一区二区| 九九久久99| 亚洲精品天堂| 欧美三级在线视频| 亚洲天堂美女视频| 中文精品久久| 国产精品久久久久久搜索| 狠狠综合久久av一区二区| 国产精品国产三级国产aⅴ原创| 日本午夜激情视频| 欧美专区视频| 精品国产拍在线观看| 麻豆成人免费视频| 成人免费观看视频| 天天综合中文字幕| 91成人在线| 国产午夜精品久久久| 亚洲精品在线观看av| 国产一区中文字幕| 亚洲一区二区三区涩| 成人免费看黄| 亚洲男人第一av网站| 日韩三级av在线| 国产成人精品影视| 91精品国产毛片武则天| 亚洲免费看片| 精品国产区一区二区三区在线观看| 中文字幕亚洲精品一区| 成人av电影免费在线播放| 一级特黄妇女高潮| 国产极品嫩模在线观看91精品| 亚洲理论在线a中文字幕| 久久久久久久久影院| 国内精品视频一区二区三区八戒| 亚洲视频小说| 亚洲精品69| 日韩午夜在线视频| 一级黄色片网站| 中文字幕一区二区三区不卡| 欧美美女一级片| 亚洲精品国产偷自在线观看| 91免费电影网站| 精品黄色免费中文电影在线播放| 欧美二区三区91| 99久久婷婷国产综合| 国产精品乡下勾搭老头1| 男人c女人视频| 国产一级成人av| 91av视频在线| 国产小视频在线观看| 欧美三级电影一区| 久久av红桃一区二区禁漫| 国内精品久久久久影院一蜜桃| 91麻豆天美传媒在线| 国产精品qvod| 欧洲成人免费aa| av网在线观看| 日韩午夜在线观看| 五月天综合激情| 亚洲国产精品成人综合色在线婷婷| 中文字幕久久av| 欧美午夜一区| 欧美精品一区二区三区在线四季 | 在线亚洲免费视频| 小嫩苞一区二区三区| 国产老女人精品毛片久久| 无码人妻少妇伦在线电影| 欧洲亚洲成人| 国产欧美久久一区二区| 视频在线观看入口黄最新永久免费国产 | 999精品视频在线| 你懂的亚洲视频| 免费国产在线精品一区二区三区| 欧美xxxx性| 久久久欧美一区二区| 男男激情在线| 欧美福利视频一区| 亚洲精品1区2区3区| 国产精品毛片大码女人| 性折磨bdsm欧美激情另类| 久久性色av| 女同性恋一区二区| 在线成人动漫av| 97操在线视频| 欧美影视资讯| 久久久久久综合网天天| 91视频在线观看| 亚洲国产毛片完整版| 伊人精品一区二区三区| 亚洲成人一二三| 在线观看亚洲网站| 久久毛片高清国产| 激情小说欧美色图| 日韩不卡免费视频| 国产精品久久..4399| 91日韩免费| 欧美精品七区| 巨人精品**| 亚洲free嫩bbb| 69堂免费精品视频在线播放| 久久久最新网址| 美女国产在线| 夜夜嗨av一区二区三区免费区| 高清一区二区三区四区| 欧美日韩一区三区四区| 无码日韩精品一区二区| 亚洲丶国产丶欧美一区二区三区| 国产黄色录像片| 国产欧美一区二区精品忘忧草| 无码国产精品一区二区免费式直播 | 亚洲黄色小说网| 欧美日韩不卡一区| 无码人妻精品一区二| 黄色成人av在线| 日本三级中文字幕| 亚洲午夜一区二区| 欧美在线视频第一页| 国产精品伦理在线| 国产精成人品免费观看| 久久亚洲二区三区| 中文字幕日韩三级片| 成人黄色在线视频| 日本50路肥熟bbw| 国产精品一级片| 中文字幕亚洲影院| 久久99精品久久久| 深夜黄色小视频| 日韩国产精品久久| 亚洲精品怡红院| 全国精品久久少妇| 性猛交ⅹ×××乱大交| 久色婷婷小香蕉久久| 国产一区视频免费观看| 日日夜夜精品视频免费| 北条麻妃69av| 久久久久一区| 国产一区二区视频免费在线观看| 久久精品30| 国产精彩免费视频| 青青草视频一区| 色婷婷一区二区三区av免费看| 久久激五月天综合精品| 国产色视频在线播放| 久久爱www久久做| 国产人妻精品久久久久野外| 国产福利不卡视频| 亚洲美女在线播放| 26uuu精品一区二区在线观看| 狠狠人妻久久久久久综合蜜桃| 久久久一区二区三区| 国产99在线 | 亚洲| 综合电影一区二区三区| 亚洲国产精品久| 欧美日韩国产一区二区三区| 国产区一区二区三| 欧美亚洲动漫制服丝袜| 国产一区二区在线视频观看| 日韩一级二级三级| 午夜在线观看视频18| 中文字幕成人精品久久不卡| 精品黄色免费中文电影在线播放| 欧美激情一区二区三区在线视频观看 | 色综合久久88色综合天天 | 国产拍在线视频| 日韩免费在线播放| 先锋影音网一区二区| 不卡的av一区| 亚洲人成精品久久久| 一区二区精品在线观看| 韩日视频一区| 欧美性猛交xxx乱久交| 国产精品综合av一区二区国产馆| 日韩av无码一区二区三区不卡| 国产欧美日韩精品一区| 538精品在线观看| 色综合久久综合中文综合网| 91国偷自产中文字幕久久| 亚洲成人精品视频在线观看| 久久米奇亚洲| 久久久久久久久久久av| 日韩不卡视频在线观看| 粉嫩高清一区二区三区精品视频 | 国产精品免费入口| 捆绑变态av一区二区三区| 国产精品果冻传媒| 国产精品欧美综合在线| 欧美成人精品欧美一级乱黄| 欧美日韩性生活| 视频二区在线| 久久成人国产精品| 日韩pacopacomama| 国产伦精品一区二区三毛| 不卡中文字幕| 欧美变态另类刺激| 国产在线精品免费av| 尤物视频最新网址| 一区二区三区蜜桃网| 瑟瑟视频在线免费观看| 日韩国产欧美精品一区二区三区| 超碰在线最新| 国产精品色悠悠| 香蕉久久99| 屁屁影院ccyy国产第一页| 蜜臀av性久久久久蜜臀aⅴ流畅| 奇米777第四色| 一区二区三区欧美视频| 在线免费看91| 亚洲一区二区福利| 一区二区电影免费观看| 国产a一区二区| 国产精品99一区二区| 在线观看日本www| 国产精品私人影院| www.久久精品视频| 日韩精品在线免费观看视频| 国产99re66在线视频| 91入口在线观看| 亚洲国产日韩欧美在线| wwwwwxxxx日本| 国产欧美一区二区精品秋霞影院| 久久久免费高清视频| 日韩的一区二区| 97人人在线视频| 国产在线视频欧美一区二区三区| 午夜精品网站| 97免费公开视频| 亚洲精品成人悠悠色影视| av免费在线不卡| 欧美另类99xxxxx| 欧美午夜网站| 草草草视频在线观看| 国产成人亚洲综合a∨婷婷| 五月婷婷一区二区| 欧美成人一区二区| 国产亚av手机在线观看| 国产精品美女诱惑| 一区二区三区四区五区精品视频| 中文字幕一区二区人妻电影丶| 亚洲午夜久久久久| 天堂av资源网| 91高清视频在线免费观看| 精品淫伦v久久水蜜桃| 国产精品69久久久| 99国产精品久久久久| 在线观看日本网站| 亚洲人线精品午夜| 色婷婷成人网| 亚洲色婷婷久久精品av蜜桃| 成人综合婷婷国产精品久久 | 九9re精品视频在线观看re6| 亚洲久久成人| mm131丰满少妇人体欣赏图| 91国产视频在线观看| 日韩精品毛片| 99视频在线播放| 国产精品日本| xxxx日本黄色| 欧美一区二区三区在线电影| 色yeye免费人成网站在线观看| 精品久久sese| 麻豆国产一区二区| 久久久久无码国产精品| 亚洲精品永久免费精品| 少妇高潮一区二区三区99| 男人天堂新网址| 久久综合久久综合久久| 一级黄色片网站| 午夜精品视频在线| 教室别恋欧美无删减版| 日本在线视频播放| 疯狂做受xxxx欧美肥白少妇| 中文字幕日本在线| 国产区欧美区日韩区| 全部av―极品视觉盛宴亚洲| 免费一级片在线观看| 亚洲性生活视频在线观看| 日韩精品免费视频一区二区三区| 狠狠97人人婷婷五月| 国产精品久久毛片| 无码国精品一区二区免费蜜桃| 国产欧美日韩专区发布| 狠久久av成人天堂| 一二三四在线观看视频| 亚洲激情视频在线播放| 久久精品超碰| 美女福利视频在线| 亚洲老妇xxxxxx| 国产高清在线| 国产伦精品一区| 激情国产一区二区| 无码视频一区二区三区| 国内免费精品永久在线视频|