精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

HybGRAG:Hit@1 的平均相對提升率達到 51%的新思路

發布于 2025-1-3 13:52
瀏覽
0收藏

1. 傳統RAG存在的問題

檢索增強生成(Retrieval-Augmented Generation ,RAG)能讓大型語言模型(LLMs)從非結構化文檔數據庫獲取信息,使得LLMs 就能處理未知事實,并借助額外的文本信息解決開放域問答(Open-Domain Question Answering,ODQA)問題。

圖檢索增強生成(Graph RAG,GRAG)從結構化知識庫中檢索信息,其中的文檔通過關系相互關聯。現有的 GRAG 方法主要集中在兩個方向:

? 從知識圖譜(Knowledge Graphs,KGs)中提取關系信息,并利用 LLMs 進行知識庫問答,以及在數據庫中的文檔間建立關系以提升 ODQA 性能。

? “混合”問答(Hybrid Question Answering,HQA):給定一個半結構化知識庫(Semi-structured Knowledge Base,SKB),通過結構化數據和文本數據共同完成一個問題的答案。SKB 由知識圖譜(也就是結構化數據庫)和非結構化文本文檔構成,其中文本文檔與 KG 的實體相關聯。

HybGRAG:Hit@1 的平均相對提升率達到 51%的新思路-AI.x社區圖片

但是,通過現有分析表明,現有的RAG或者GRAG都無法有效解決HQA問題:

? 其一,這兩種方法只專注于檢索文本或關系信息。

? 其二,在混合問題中,檢索不同類型信息所需的方面可能難以區分。如上圖,通過問題路由識別問題。但在不成功的路由中,文本方面“納米流體傳熱論文”和關系方面“由 John Smith 撰寫”之間的混淆會導致不正確的檢索。

2. 什么是HYB GRAG?

為解決 SKB 中的 HQA,我們提出 HYB GRAG(HYBrid Graph RAG)。HYB GRAG 利用檢索器庫處理混合問題,同時利用文本和關系信息??傮w上,HYB GRAG有以下特點:

? 智能體(Agentic):通過自我反思自動優化問題路由;

? 自適應(Adaptive):通過統一框架解決文本、關系和混合問題;

? 可解釋(Interpretable):通過直觀的優化路徑證明決策的合理性;

? 有效(Effective):在真實世界的 HQA 基準測試中優于所有基線。

2.1 HQA面臨的兩個問題:

2.1.1 C1: 混合來源問題(Hybrid-Sourcing Question)

作者通過一系列實驗,證明了HQA需要同時借助文本和關系信息來回答混合問題,表明文本文檔和知識圖譜(KG)包含有用但不重合的信息。

結果表明:

? 向量相似度搜索(Vector Similarity Search,VSS)作為僅使用文本信息的檢索器,通過在嵌入空間中對比問題與文檔來進行檢索和排序;

? 個性化 PageRank(PPR):作為僅使用關系信息的檢索器,從 LLM 識別出的實體出發進行隨機游走,并依據它們在 SKB 的 KG 中的連通性對相鄰實體進行排名。

HybGRAG:Hit@1 的平均相對提升率達到 51%的新思路-AI.x社區圖片

如上圖,文本和關系檢索器的性能不相上下。如果最優路由總是選擇能給出正確結果的檢索器,性能會大幅提升,這表明文本和圖形檢索器的優勢幾乎不存在重疊。表明通過協同這兩個檢索器來同時利用文本和關系信息的解決方案的重要性。

2.1.2 C2:需要改進的問題

KBQA 的成功往往依賴于這樣一個假設:目標實體處于從知識圖譜(KG)中抽取的子圖內。同樣,在 HQA 中回答問題需要從 SKB 里的 KG 抽取子圖。

由于混合問題兼具文本和關系兩方面,因此作者測試 LLM 能否從 KG 中抽取包含目標實體的子圖。

1. 通過提示詞識別問題中的關系層面,即實體和用于抽取子圖的有用關系。

2. 若目標實體不在子圖中,則利用一個通過提示詞進行帶有反饋的額外迭代。

HybGRAG:Hit@1 的平均相對提升率達到 51%的新思路-AI.x社區圖片

如上表:

? (第二行)若結果有誤,單純提示 LLM 重新抽取會獲得更高的命中率。

? (第三行)如果 LLM 收到指出抽取錯誤部分的反饋(比如,抽取的主題實體有誤),結果會顯著提升。這是因為在包含文本和關系方面的混合問題中,LLM 可能會誤將文本方面當作關系方面。

所以第二個挑戰:在 HQA 中,LLM 首次嘗試時難以區分問題的文本和關系方面,故而需要進一步完善。

2.2 針對C1提出的新的檢索庫架構

HYB GRAG的檢索模塊由多個檢索模塊和一個路由器構成的檢索器庫。

設計了兩個檢索模塊,分別是文本檢索模塊混合檢索模塊,用于從文本文檔和 SKB 中獲取信息。每個檢索模塊均包含一個檢索器和一個排序器,用來應對各類問題提供了靈活性。

?文本檢索模塊:通過針對給定問題 Q 的相似性搜索來檢索文檔,比如密集檢索,直接在文本文檔中找到答案。

?混合檢索模塊:將識別出的實體 E 和有用關系 R 作為輸入。使用圖形檢索器提取由 R 連接的 E 的自環圖中的實體。

?路由器:給定一個問題 Q,LLM 路由器執行問題路由來確定檢索模塊的選擇和使用。路由器首先依據實體類型和關系類型,借助少量示例識別關系方面,即實體 E 和有用關系 R 。然后路由器做出選擇,決定采用文本檢索模塊還是混合檢索模塊。

2.3 針對C2提出的評論模塊

給定一個混合問題 Q,路由器需執行問題路由,包括識別實體和有用關系 。但在首次迭代中它們可能會被錯誤識別。

為解決此問題,提出評論模塊,能提供反饋以助力路由器更好地執行問題路由。作者沒有直接采用單個 LLM 完成這一復雜任務,而是將其分為兩部分:

? 即 LLM 驗證器用于驗證檢索結果的正確性

? LLM 評論員用于在檢索有誤時提供反饋

這種分治策略,具有兩大關鍵優勢:

1.將難題分解為兩個較易處理的任務,能借助 LLM 來解決,同時保持良好性能。

  1. 由于驗證和評論的任務相互獨立,各自可有專屬上下文,避免包含無關信息及“Lost in the Middle”的現象。

2.3.1 驗證器 LLM

驗證器的目的是驗證檢索到的頂級參考文獻是否符合問題 Q 的要求,屬于二分類任務。為提高準確性,為驗證器提供額外的驗證上下文。將主題實體與提取的自我圖中實體間的推理路徑用作驗證上下文,用于檢驗輸出是否滿足問題中的某些要求。

2.3.2 評論員 LLM

HybGRAG:Hit@1 的平均相對提升率達到 51%的新思路-AI.x社區圖片

評論員旨在提供反饋以協助路由器優化問題路由。為有效引導路由器,構建易于理解的糾正性反饋。會指出每個動作中的錯誤,如實體的錯誤識別(上表展示了識別錯誤的分類)。

與可能因使用的 LLM 而導致不確定性或不一致的自然語言反饋不同,糾正性反饋為如何優化問題路由提供了明確指引。此外,它借助上下文學習(ICL)提供精細的反饋。

3. 效果評估

3.1 HYB GRAG 在現實世界的 GRAG 基準測試中的表現怎樣?

HybGRAG:Hit@1 的平均相對提升率達到 51%的新思路-AI.x社區圖片

如上表,HYB GRAG 在 STARK 的兩個數據集中均顯著優于所有基準方法。大多數基準方法是為處理 ODQA 和 KBQA 而設計的,結果表明它們無法有效處理 HQA。

混合檢索模塊表現位居第二,表明能同時運用文本和關系信息的協同檢索模塊的重要性。

HYB GRAG 的表現明顯優于混合檢索模塊,意味著在首次迭代中提取的實體和關系常常有誤。

通過分別利用HYB GRAG檢索器庫和評論模塊應對挑戰 1 和 2,HYB GRAG 的性能有了顯著提升。

3.2 消融研究:HYB GRAG 的所有設計選擇是否必要?

3.2.1 評論模塊

把 HYB GRAG 變體與沒有驗證上下文的驗證器、僅有五次示例的評論者的情況進行對比。

HybGRAG:Hit@1 的平均相對提升率達到 51%的新思路-AI.x社區圖片

從上圖可以看出,在所有的設計選擇下,HYB GRAG 表現最佳,接近標準性能。 

3.2.2 自我反思

HybGRAG:Hit@1 的平均相對提升率達到 51%的新思路-AI.x社區圖片

從上圖可以看出,隨著更多的自我反思迭代,HYB GRAG 的性能進一步提升。當迭代次數從 1 增加到 2 時,性能顯著提高,其中第 1 次迭代未進行自我反思。同時表明,幾次迭代就已足夠,因為隨著迭代次數增多,改進逐漸減小。 

3.3 可解釋性:HYB GRAG 如何依據反饋優化其問題路由?

HybGRAG:Hit@1 的平均相對提升率達到 51%的新思路-AI.x社區圖片

上圖展示了 STARK-MAG 中檢索器庫的路由器與評論模塊相互作用的實例。

上圖左側的首輪迭代中,路由器誤將“電子電路中的光學 TALU 實現”認定為代表研究領域的主題實體(關系方面)。由于基于此實體提取的圖和基于“Netaji Subhash 工程學院”提取的圖無交集,評論模塊判定前一實體更可能是文本方面。于是,它向路由器反饋,路由器也相應地進行處理。HYBGRAG 的這種優化路徑類似 CoT,具有可解釋性,方便用戶理解。

3.4 端到端評估

HybGRAG:Hit@1 的平均相對提升率達到 51%的新思路-AI.x社區圖片

上表中,HYB GRAG 在 CRAG 中的表現優于所有基線。

? 具有單個檢索模塊的 RAG 無法應對兩種類型的問題。

? 具有連接參考的 RAG 也會因長參考中的無關內容而分心。

? 即便提供了相同的檢索庫,自反思基線仍難以優化自身行動。

? 由于 ReAct 依賴于 LLM 的思考能力并提供自然語言反饋,它往往缺少改進行動的明確指引。

? 沒有經過微調的檢索評估器,Corrective RAG 無法有效識別參考的有用性。這體現了帶有糾正反饋的評論模塊的優越性。

3.5 模型成本分析

HybGRAG:Hit@1 的平均相對提升率達到 51%的新思路-AI.x社區圖片

上面兩個表分別匯總了 STARK 和 CRAG 中 HYB GRAG 迭代各步驟的 API 調用次數和令牌消耗。

盡管大部分令牌消耗源于用于 ICL 的示例,但提示本身所需令牌極少。而且,由于 HYB GRAG 把聊天 LLM 當作路由器,ICL 的示例僅需提供一次。

相較于 STARK 中的最先進基線 AVATAR,其訓練時至少需 500 次 API 調用,混合檢索模塊僅 2 次 API 調用,在 Hit@1 上就實現了 24%的相對提升,而 HYB GRAG 最多 14 次 API 調用就能達成 51%的提升,二者均無需訓練。

本文轉載自 ??大語言模型論文跟蹤??,作者:HuggingAGI


收藏
回復
舉報
回復
相關推薦
国产在线不卡一区| 亚洲伦理久久| 久久久久久综合| 国产成人亚洲综合91| 久久久久99精品成人| 爱情电影网av一区二区| 国产福利视频在线观看| 色欲av无码一区二区人妻| 成人a级免费视频| 第一次破处视频| 亚洲综合资源| 欧美日韩国产激情| 视频一区亚洲| 蜜臀av在线观看| 蜜臀av亚洲一区中文字幕| 欧美国产精品va在线观看| 女~淫辱の触手3d动漫| av一级久久| 欧美视频一二三| 欧美性受黑人性爽| 欧美巨乳在线| 国产精品99久久久久| 人体精品一二三区| 黄色一级视频在线观看| 欧美日本成人| 精品91自产拍在线观看一区| 欧美三级午夜理伦三级富婆| 九九色在线视频| а√在线中文在线新版| 欧美韩国日本综合| 中文字幕一区三区| 欧美高清无遮挡| 在线视频第一页| 色88888久久久久久影院| 777a∨成人精品桃花网| 能在线观看的av网站| 人人澡人人添人人爽一区二区| 久久久久久久久久电影| 国产一区二区中文字幕免费看| 97人妻一区二区精品免费视频| 亚洲影院一区| 97超级碰碰碰久久久| 美女毛片在线观看| 欧美成熟视频| 久久精品国产亚洲精品2020| 欧美另类z0zx974| 亚洲国产网址| 亚洲美女精品成人在线视频| 日本三级日本三级日本三级极| 秋霞午夜一区二区三区视频| 欧美顶级少妇做爰| 成人黄色一级大片| 日本午夜精品久久久久| 在线免费观看日韩欧美| 亚洲国产精品久久艾草纯爱| 麻豆一区区三区四区产品精品蜜桃| www.色呦呦| 国产精品一区在线| 99re在线观看| 亚洲国产一二三区| 国产jizzjizz一区二区| 风间由美久久久| 日韩在线观看视频一区| www.99精品| 久久久久久一区| 男人天堂亚洲二区| 国产日产欧美一区| 四虎一区二区| 久草免费在线| 一区二区三区国产精品| 欧美视频免费看欧美视频| 女人天堂av在线播放| 亚洲韩国一区二区三区| 日韩小视频在线播放| 成人片免费看| 欧美体内she精视频| 国产一级片自拍| 日韩三级av高清片| 亚洲三级观看| 亚洲成人中文字幕| 精品夜夜澡人妻无码av| 国产一区二区三区站长工具| xx视频.9999.com| 国产一级性生活| 久热精品在线| 91在线视频导航| 亚洲国产精品suv| 久久综合九色欧美综合狠狠| 亚洲精品成人三区| 污污的网站在线看| 色综合久久久久综合体| 手机看片一级片| 国内精品国产成人国产三级粉色| 亚洲欧洲国产精品| 玖玖爱这里只有精品| 亚洲欧美日韩国产综合精品二区| 国产精品美女www| 亚洲成人久久精品| 国产视频一区二区在线观看| 超碰10000| 日韩伦理三区| 日韩女同互慰一区二区| 性欧美精品中出| 欧美日韩中文| 国产精品久久久久久久久影视| 国产高清免费av| 国产欧美一区二区在线| 久久综合久久久久| 久久爱.com| 日韩av在线免费播放| 国产又粗又长又黄的视频| 亚洲日本国产| 亚洲www永久成人夜色| 国产在线黄色| 午夜精品久久久久久久久久久| 成 人 黄 色 小说网站 s色| 少妇精品导航| 欧美劲爆第一页| 91精品视频免费在线观看| 91影院在线观看| 精品久久国产老人久久综合| 欧美日韩国产精品一卡| 在线观看h网| 欧美日韩国产经典色站一区二区三区 | 亚洲黄色精品视频| 国产精品久久综合| 日本久久久精品视频| 风间由美性色一区二区三区四区 | 亚洲精品中字| 韩日精品一区二区| 亚洲高清久久网| 麻豆亚洲av熟女国产一区二| 国产在线播放一区三区四| 亚洲精品一区二| 日韩一区二区三区免费| 国产精品亚洲综合在线观看| 91久久国产综合久久| 稀缺呦国内精品呦| 欧美日韩爆操| 成人91免费视频| 欧美理论电影| 日韩精品一区二区三区视频在线观看 | 国产午夜精品一区二区| 91视频 -- 69xx| 久久久久观看| 午夜欧美大片免费观看| 高h放荡受浪受bl| 一区二区三区久久| 动漫美女无遮挡免费| 亚洲婷婷在线| 国产精品视频免费一区二区三区| 日本天码aⅴ片在线电影网站| 69av一区二区三区| 欧美三级黄色大片| 国产揄拍国内精品对白| 欧洲金发美女大战黑人| 91麻豆精品国产91久久久久推荐资源| 欧美日韩成人网| www.精品久久| 黄色精品一区二区| 在线免费观看成年人视频| 久久精品毛片| 天堂资源在线亚洲视频| 日韩成人综合网| 久久av在线看| 蜜桃av鲁一鲁一鲁一鲁俄罗斯的| 亚洲成人av电影| 老司机福利av| 免费在线欧美视频| ijzzijzzij亚洲大全| 7777精品| 国产成人激情小视频| 91大神在线网站| 91精品免费观看| 亚洲一区二区91| 99国产精品久久久久| 丁香啪啪综合成人亚洲| 久久麻豆精品| 国产超碰91| 欧美韩国亚洲| 欧美大片免费看| 日本视频在线观看一区二区三区| 在线观看亚洲专区| 日本少妇高清视频| 久久日韩精品一区二区五区| 亚洲国产日韩欧美在线观看| 中文av一区| 欧美性天天影院| 91丨精品丨国产| 91精品国产乱码久久久久久久久| 888av在线| 亚洲国产精品yw在线观看| www.亚洲激情| 亚洲午夜av在线| 少妇太紧太爽又黄又硬又爽小说| 国产高清精品久久久久| 国产又黄又猛视频| 欧美日韩调教| 五月婷婷一区| 欧洲亚洲成人| 91久久精品国产91久久性色tv| 黄频免费在线观看| 萌白酱国产一区二区| 你懂的在线看| 欧美va在线播放| 一级视频在线播放| 欧美三级免费观看| 玖玖爱免费视频| 国产精品高潮久久久久无| 国产精品福利导航| 国产一区二区三区免费看 | 在线电影看在线一区二区三区| ccyy激情综合| 成人激情视频在线播放| 性欧美又大又长又硬| 麻豆国产精品va在线观看不卡| 久久久久久女乱国产| 日韩精品一区二区三区视频 | 欧美大片日本大片免费观看| 五月天中文字幕| 黑人欧美xxxx| 国产无遮挡又黄又爽在线观看| 亚洲人成小说网站色在线| 亚洲自拍偷拍图| 久久一区二区三区四区| 视频免费在线观看| 国产精品一区二区三区99| 五月天婷婷亚洲| 日韩不卡一区二区| 亚洲视频欧洲视频| 久久久免费看| 成人污版视频| 国产精品亚洲自拍| 97久久香蕉国产线看观看| 久久久久久久97| 色老头在线观看| 欧美高清视频免费观看| 97caopron在线视频| 久久久国产视频| 黄在线免费观看| 日韩视频精品在线| 免费在线观看av片| 日韩在线播放视频| 日本www在线| 日韩在线精品视频| 日本中文字幕在线观看| 日韩在线视频线视频免费网站| 91在线网址| 色偷偷88888欧美精品久久久 | 日本一区二区三区视频在线| 奇米影视亚洲狠狠色| 香蕉成人av| 国产精品久久久久999| av在线不卡精品| 国产热re99久久6国产精品| 粉嫩av一区二区三区四区五区| 国产一区二区香蕉| 欧美日韩黄网站| 国产亚洲精品自在久久| 亚洲人成网亚洲欧洲无码| 日韩妆和欧美的一区二区| 欧美亚洲在线日韩| 正在播放国产精品| 欧美人与禽猛交乱配视频| 日韩精品一区二区免费| 国产精品一区毛片| 国产高潮免费视频| 久久av一区二区| 国产美女无遮挡永久免费| 欧美综合亚洲图片综合区| 中文字幕 国产精品| 欧美午夜理伦三级在线观看| 中文字幕日韩经典| 欧美一级理论片| 色网站免费观看| 国产亚洲人成a一在线v站| 日本高清视频在线播放| 欧美另类第一页| 51av在线| 国产精品极品美女粉嫩高清在线| 99综合久久| 久久av免费观看| 久久久久久久久久久妇女| 精品成在人线av无码免费看| 国产亚洲毛片在线| 中文av一区二区三区| 国产成人综合视频| 久久精品国产亚洲av麻豆| 国产精品看片你懂得| 久久免费小视频| 91久久精品午夜一区二区| 国产免费福利视频| 亚洲精选在线观看| 亚洲区欧洲区| 国产精品久久久久秋霞鲁丝| 影音先锋欧美激情| 日韩国产欧美一区| 韩国亚洲精品| 黄色免费网址大全| 成人精品视频一区二区三区尤物| 一区二区三区伦理片| 亚洲午夜羞羞片| 91国偷自产中文字幕久久| 日韩精品在线观看一区二区| 国产黄大片在线观看画质优化| 2020欧美日韩在线视频| 成人污污视频| 色涩成人影视在线播放| 亚洲电影av| 中文字幕亚洲影院| 久久久精品综合| 久久高清免费视频| 欧美一区二区在线观看| 国产在线一二| 91爱爱小视频k| 欧美片网站免费| 亚洲一区二区三区乱码| 亚洲一区国产| 第一页在线视频| 亚洲色图另类专区| 亚洲熟女乱色一区二区三区久久久| 精品无人区乱码1区2区3区在线| a级毛片免费观看在线| 国产欧美日韩专区发布| 国内黄色精品| 久久久久久久久久久久久国产精品| 国产成人午夜精品影院观看视频| 日本视频在线免费| 在线亚洲一区二区| 欧美女v视频| 日产精品99久久久久久| 女同久久另类99精品国产| 黄色成人在线免费观看| 激情成人综合网| 亚洲精品卡一卡二| 欧美日韩国产乱码电影| avtt亚洲| 国产在线视频欧美| 99久久视频| 精品亚洲视频在线| 亚洲视频 欧洲视频| 国产毛片毛片毛片毛片毛片| 久久精品精品电影网| 亚洲一区二区三区久久久| 在线免费观看成人网| 精品在线免费视频| 国产黄a三级三级| 91精品国产色综合久久不卡蜜臀 | 91综合久久爱com| 欧美高清中文字幕| 国产a区久久久| 日韩免费在线视频观看| 亚洲精品第一页| 依依综合在线| 婷婷亚洲婷婷综合色香五月| 免费观看成人鲁鲁鲁鲁鲁视频| 国产第一页精品| 欧美精品在线一区二区三区| 91网址在线观看| 国产精品麻豆免费版| 亚洲另类自拍| 成年人网站免费在线观看| 日本精品视频一区二区三区| 999国产在线视频| 91久久国产精品| 1024日韩| 级毛片内射视频| 制服丝袜亚洲精品中文字幕| 高清电影在线观看免费| 久久99久久精品国产| 日韩精品久久理论片| 九九精品视频免费| 亚洲成人精品视频| 日本韩国欧美| 最近免费观看高清韩国日本大全| 成人精品国产一区二区4080| 日韩三级一区二区| 日韩视频第一页| 国产精品对白久久久久粗| 亚洲色成人一区二区三区小说| 国产喷白浆一区二区三区| 99久久国产热无码精品免费| 91国产在线精品| 久久国产成人精品| 中文字幕天堂网| 欧美午夜精品久久久久久超碰| 2024最新电影在线免费观看| 极品校花啪啪激情久久| 日韩国产在线观看一区| 全网免费在线播放视频入口| 亚洲男人天堂视频| 久久国际精品| 日韩亚洲在线视频| 亚洲最大色网站| 天堂а√在线资源在线| 国内一区在线| 精品午夜久久福利影院| 五月婷婷视频在线| 久操成人在线视频| 超碰成人久久|