精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

先進的多文檔問答(MDQA)框架HiQA:大幅降低區分度低的復雜多文檔RAG的幻覺問題 原創

發布于 2024-11-12 16:23
瀏覽
0收藏

背景

檢索增強生成(RAG)迅速推進了語言模型領域,特別是在問答(QA)系統。通過在響應生成階段集成外部文檔,RAG顯著提高了語言模型的準確性和可靠性。這種方法提高了響應的質量,并降低了幻覺的頻率,其中模型生成了錯誤或誤導性的信息。然而,這些方法表現出有限的檢索精度時,面對眾多的難以區分的文件,在其實際應用中提出了顯著的挑戰。為了應對這些新出現的挑戰,本文提出HiQA,一個先進的多文檔問答(MDQA)框架,集成級聯元數據到內容和多路由檢索機制。

簡介

大型語言模型 (LLMs) 在多個領域,包括文檔問答 (QA) 得到了廣泛應用。然而,使用 LLMs 進行 QA 仍面臨諸如幻覺問題、及時性問題和預訓練不足的挑戰。檢索擴增生成(RAG)是一種有前景的解決方案。普通的基于 RAG 的 QA 系統將文檔表示為非結構化文本塊,但在處理大量、內容相似或復雜的文檔時,這種方法遇到了限制。多文檔問答提出了更大的挑戰,因為它需要考慮文檔間的關系和差異。我們將此問題確定為“無法區分的多文檔中的RAG降級”。

多文檔QA場景中性能下降的實驗驗證。使用88個文檔進行測試,每個文檔包含88個問題中的一個。使用普通RAG和GPT-4設置(塊大小=400,top-k=5)。查詢單個文檔上的每個問題時,只有一個錯誤答案。然而,一起查詢所有88個文檔會導致30個錯誤答案,這表明隨著文檔數量的增加,性能會顯著下降。結果如下圖所示:

先進的多文檔問答(MDQA)框架HiQA:大幅降低區分度低的復雜多文檔RAG的幻覺問題-AI.x社區

數據擴充被視為可以改進響應的潛在解決方案,可增強原始文件以改善響應,如下圖所示:

先進的多文檔問答(MDQA)框架HiQA:大幅降低區分度低的復雜多文檔RAG的幻覺問題-AI.x社區

我們的直觀想法是,在文檔QA中使用RAG的關鍵是匹配知識的“關鍵塊”來回答文檔中的查詢(Q)。這類似于射箭,其中查詢充當箭頭,我們需要確保關鍵知識在目標區域內。因此,通過將“定義”文本合并到塊中,我們可以調整它們的分布,使查詢嵌入更容易擊中關鍵塊。

HiQA

PDFTriage 通過提取文檔的結構元素并將其轉換為可檢索的元數據,解決了結構化文檔的多文檔QA任務。PDFTriage 對元數據的使用可以被描述為一種硬分區技術。這種策略相當于在信息檢索之前對子集進行剪枝和選擇。這樣的措施被實施以通過減小段的大小來改進檢索精度。然而,在涉及復雜任務(如跨文檔搜索)的場景中,在硬分區方法中,有用的知識有可能在檢索之前丟失。

為了解決這一挑戰,我們提出了HiQA(分層上下文增強RAG多文檔QA),結合一種新的文檔解析和轉換方法。這種方法包括一個基于元數據的增強策略,以增強塊的可擴展性,以及一個復雜的多路由檢索機制。專門為多文檔環境量身定制,我們的方法旨在提高知識檢索的精度和相關性,克服傳統的基于向量的檢索系統的固有局限性。這種增強顯著提高了基于RAG的系統在管理多文檔問答(MDQA)的復雜需求方面的性能。我們的方法框架如下圖所示:

先進的多文檔問答(MDQA)框架HiQA:大幅降低區分度低的復雜多文檔RAG的幻覺問題-AI.x社區

最初,每個文檔經過Markdown格式化器的處理,根據其固有的章節結構將其轉換為[章節元數據:章節內容]對(稱為片段),然后以Markdown格式存儲。隨后,我們提取片段的層次結構,并將元數據級聯到每個章節中,以構建我們的數據庫。最后,我們使用多路徑檢索方法來增強RAG。由于層次增強先于檢索,因此它提供了一種可擴展的解決方案,可以無縫集成各種嵌入或檢索方法。

方法

我們提出的HiQA系統由三個組件組成:Markdown格式化器(MF),分層上下文增強器(HCA)和多路徑檢索器(MRR)。MF模塊處理源文檔把它轉換成一個markdown文件,一個片段序列。不是將文檔分成固定大小的塊,而是每個片段對應于一個自然的章節,包括章節元數據和內容。HCA模塊從markdown中提取分層元數據并將其組合,形成級聯元數據,從而增強每個片段的信息。MRR模塊采用多路徑檢索方法來找到最合適的片段,然后將其作為上下文輸入提供給語言模型。

Markdown格式化器

由于我們提出的方法需要獲取層次結構信息,因此源文檔必須經過結構解析。因此,Markdown因其出色的結構化文檔格式化功能而被選中。因此,我們引入了Markdown格式轉換器,將源文檔轉換為富含結構化元數據的Markdown文檔。

Markdown Formatter使用LLM進行文檔解析。使用LLM的決定是由其通過利用歷史信息處理跨頁面連貫上下文的能力以及其語義理解和標點符號使用的能力驅動的。這些功能可以實現精確的章節分割和有效的表格數據恢復,充分利用LLM的高級語義理解功能。

當進入長上下文時,存在精度損失、遺忘、指令弱化、幻覺等問題。為了確保輸出內容的結構連貫、準確并與原始文檔一致,我們采用了滑動窗口技術,窗口大小為W,步長為W,附加填充為K。

先進的多文檔問答(MDQA)框架HiQA:大幅降低區分度低的復雜多文檔RAG的幻覺問題-AI.x社區

為了得到高質量的文檔處理結果,使用指令進行生成markdown核心思想如下:

  • 將文檔中的每一章,無論其級別如何,都視為Markdown中的一級標題,并附上數字標識符。將每章視為一個知識片段,而不是固定大小的塊。
  • 設置正確的章節編號,后面跟著章節標題。
  • 通過Markdown語法生成表格并記錄表格標題。

分層上下文增強器(Hierarchical Contextual Augmentor, HCA)

使用級聯文檔結構在數據處理過程中進行文本增強,從Markdown文件中提取層次結構元數據,并將其級聯到每個章節,形成增強的段落。具體步驟包括:

  • 使用深度優先搜索遍歷章節樹,連接和傳遞元數據。
  • 對文本、表格和圖像等不同類型的段落進行不同的處理。

先進的多文檔問答(MDQA)框架HiQA:大幅降低區分度低的復雜多文檔RAG的幻覺問題-AI.x社區

多路徑檢索器(Multi-Route Retriever, MRR)

我們提出了我們的多路徑檢索方法的QA任務,集成了各種技術,以提高精度的知識檢索廣泛的文檔語料庫。具體來說,我們使用以下三種方法實現了檢索:

  • 向量相似性匹配:使用Elasticsearch和BM25。
  • 關鍵詞匹配:使用預訓練的關鍵實體檢測模型提取關鍵詞。
  • 補償向量相似性限制:結合基于頻率的檢索技術和關鍵詞排名策略。

如果兩個文檔非常相似(比如“iPhone10”的說明書和“iPhone15”的說明書),傳統的方法可能會遇到問題。因為它們主要通過計算文檔之間的"向量相似性"來辨別文檔的差異,但這種方法對于一些只有細微差別(例如生產日期或電池容量)的文檔區分效果并不理想。

為了解決這個問題,我們引入了一個新的工具——稱為Lucene索引。這個工具更多地關注每個詞語(或者叫令牌)在文檔中出現的頻率,而不是單純的計算整體相似度。這樣就可以更有效地區分那些在大部分內容都很相似,但在某些細節上有所不同的文檔。

除此之外,我們還使用了其他的策略來提升檢索的準確性,比如利用命名實體識別和人類專家設置的關鍵詞來給相關的部分賦予更大的權重。這意味著,如果搜索“iPhone15”這個關鍵詞,那么所有包含“iPhone15”的部分會被認為更重要,因此在檢索結果中的排名會更高。

先進的多文檔問答(MDQA)框架HiQA:大幅降低區分度低的復雜多文檔RAG的幻覺問題-AI.x社區

驗證效果

先進的多文檔問答(MDQA)框架HiQA:大幅降低區分度低的復雜多文檔RAG的幻覺問題-AI.x社區

先進的多文檔問答(MDQA)框架HiQA:大幅降低區分度低的復雜多文檔RAG的幻覺問題-AI.x社區

結論

我們介紹了HiQA,一種新的框架,專門設計用于解決現有的RAG在多文檔問答(MDQA)環境中的局限性,特別是在處理不可區分的多文檔時。HiQA采用了軟分區策略,該策略利用文檔的結構性元數據進行有效的塊拆分和嵌入增強,并采用多路徑檢索機制來增強檢索效率。我們廣泛的實驗驗證了我們的方法的魯棒性和有效性,有助于更深入地理解嵌入空間內的文檔段分布的理論。

?

本文轉載自公眾號AI 博物院 作者:longyunfeigu

原文鏈接:??https://mp.weixin.qq.com/s/T849yx6ylvOn0Q_XYrvp9A??

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
欧美日韩激情视频| 久久成人免费日本黄色| 亚洲精品视频播放| 99re精彩视频| 欧美理论电影| 久久精品夜色噜噜亚洲aⅴ| 国产精品久久激情| 国产亚洲第一页| 国产精品嫩草影院在线看| 3d动漫精品啪啪一区二区竹菊| 男人添女荫道口女人有什么感觉| 青春有你2免费观看完整版在线播放高清| 免费观看日韩av| 久久免费成人精品视频| 欧美福利第一页| 精品无人区一区二区| 欧美日韩一区二区三区在线 | 色婷婷av一区二区三区大白胸| 一区二区精品视频| 深夜福利免费在线观看| 国产综合久久久久影院| 日本成人在线视频网址| 久草视频中文在线| 国产大片一区| 在线观看欧美成人| 亚洲av片不卡无码久久| 在线综合色站| 51精品国自产在线| 91热这里只有精品| 综合日韩av| 亚洲一区二区在线免费看| 亚洲一区3d动漫同人无遮挡| 亚洲区小说区图片区| 国产在线精品国自产拍免费| 5566日本婷婷色中文字幕97| 国产亚洲欧美精品久久久www| 久久综合电影| 国产一区二区三区三区在线观看 | 国产一区二区三区探花| 亚洲第一精品福利| 欧美性猛交乱大交| 国产在线不卡一区二区三区| 欧美色老头old∨ideo| 污污视频网站免费观看| 欧产日产国产精品视频| 午夜精品久久久久久久久久久 | 免费成人你懂的| 国产91网红主播在线观看| 男人的天堂一区二区| 影音先锋在线一区| 欧美激情xxxx| 国产真人真事毛片| 亚洲性图久久| 欧美极品美女视频网站在线观看免费| 三级av在线免费观看| 国产精品久久久久久久免费观看| 日韩中文理论片| 中文字幕美女视频| 午夜国产一区二区| 日韩中文娱乐网| 婷婷久久综合网| 欧美 日韩 国产 一区| 久久6精品影院| 久久久美女视频| 亚洲国产三级| 日本久久久久久久久| 国产字幕在线观看| 蜜桃视频在线一区| 91在线观看免费| 嫩草影院一区二区| 久久嫩草精品久久久久| 日韩av免费电影| 欧美尤物美女在线| 一区二区三区日韩欧美精品| 隔壁人妻偷人bd中字| 国产欧洲在线| 日本韩国欧美一区| 日本高清久久久| 爱爱精品视频| 亚洲偷熟乱区亚洲香蕉av| 国产精品麻豆免费版现看视频| 日韩免费久久| 欧美精品久久久久久久| 久久久久99精品成人片三人毛片| 日本v片在线高清不卡在线观看| 成人黄色网免费| 欧美一级一区二区三区| 久久久久久久久99精品| 欧美性视频在线播放| 黄色小说在线播放| 欧美午夜电影在线| 国产成年人视频网站| 99久久免费精品国产72精品九九| 亚洲欧美精品一区二区| 精品一区在线观看视频| 亚洲一区一卡| 91中文在线视频| 欧美孕妇性xxxⅹ精品hd| 国产又爽又黄ai换脸| 中文字幕v亚洲ⅴv天堂| 日韩av毛片在线观看| 欧美.日韩.国产.一区.二区| 久久久久在线观看| 中文字幕人妻精品一区| 国产精品456露脸| 欧美国产一二三区| 成人av福利| 欧美午夜激情在线| 免费人成视频在线播放| 国产免费久久| 久久久久成人网| 亚洲专区在线播放| 91玉足脚交白嫩脚丫在线播放| 亚洲一区二区三区欧美| 男人av在线播放| 日韩视频一区在线观看| 久久亚洲AV无码专区成人国产| 欧美精品18| 国产九九精品视频| 日本精品一区二区三区视频 | 日韩av一区二区在线| 欧美美女性生活视频| 国产一区二区三区久久| 99久久精品免费看国产四区| 亚洲黄色免费在线观看| 国产精品无码一区| 不卡的电视剧免费网站有什么| 在线国产精品网| 国模冰冰炮一区二区| 欧美精品一区二区三区四区 | 国产精品福利网站| 天天操天天射天天| 亚洲一级二级在线| 99国产精品免费视频| 98精品久久久久久久| 国产成人一区二区三区小说| 视频福利在线| 亚洲韩国精品一区| 超碰人人cao| 欧美在线高清| 97se亚洲综合在线| 超碰porn在线| 欧美日本视频在线| 99re6热在线精品视频| 老司机精品导航| 欧美成人dvd在线视频| av日韩中文| 亚洲国产成人精品久久| 国产污视频在线看| www.亚洲免费av| 日日摸日日碰夜夜爽无码| 一区二区在线免费播放| 欧美高清不卡在线| 免费看av毛片| 国产第一精品| 欧美午夜影院一区| 亚洲天堂精品一区| 国模大尺度一区二区三区| 中文字幕精品—区二区日日骚| 99re久久| 久久艳片www.17c.com| 国产男女猛烈无遮挡| 亚洲激情网站免费观看| 无码人妻一区二区三区在线| 亚洲国产高清一区二区三区| 精品国产一区二区三区久久久久久 | 久久婷婷五月综合色丁香| 中文字幕日韩高清| 一级全黄少妇性色生活片| 亚洲日本在线a| 在线观看成人动漫| 香蕉国产精品偷在线观看不卡| 欧美一级爽aaaaa大片| 六九午夜精品视频| 欧美成人激情视频免费观看| 亚洲AV无码精品色毛片浪潮| 午夜电影网一区| 国产毛片久久久久久久| 黄网站免费久久| 精品一区二区三区无码视频| 天堂av一区二区三区在线播放| 国产99视频在线观看| 亚洲欧美视频一区二区| 日韩欧美激情一区| 中文字幕精品三级久久久| 国产欧美精品一区二区三区四区 | 一本一道人人妻人人妻αv| 亚洲欧美一区二区久久| 波多野结衣加勒比| 蜜桃视频一区二区三区| 丰满的少妇愉情hd高清果冻传媒| 丝袜av一区| 91九色国产视频| 久草在线资源站手机版| 日韩中文字幕网站| 手机av在线免费观看| 欧美在线观看视频在线| 豆国产97在线 | 亚洲| 国产欧美一区二区精品性色超碰| 下面一进一出好爽视频| 久久综合图片| 日韩视频在线视频| 99国产**精品****| 免费精品视频一区二区三区| 国产成人久久精品一区二区三区| 91av在线不卡| 中文字幕有码在线视频| 国产小视频91| 五月婷婷六月色| 日韩一区二区精品| 中文字幕第2页| 精品二区三区线观看| 欧美第一页在线观看| 国产视频不卡一区| 特大黑人巨人吊xxxx| 国产一区二区精品久久| www.超碰com| 亚洲视频www| 欧美a级免费视频| 欧美高清在线| 日韩一区二区电影在线观看| 欧美1区二区| av观看久久| 白嫩亚洲一区二区三区| 国产精品久久久久久一区二区 | 欧美日韩一级黄| 精品国产免费观看| 一个色综合av| 免费看一级一片| 亚洲精品乱码久久久久久| 制服丨自拍丨欧美丨动漫丨| 国产亚洲欧美中文| 亚洲成人日韩在线| www.欧美精品一二区| 中文在线字幕观看| 国产成人av资源| 午夜影院免费版| 国产最新精品精品你懂的| 无码少妇一区二区三区芒果| 国产精品视区| 国产欧美在线一区| 久久激情久久| 国产美女三级视频| 久久亚洲二区| 日本va中文字幕| 欧美aaaaaa午夜精品| 色综合色综合色综合色综合| 蜜臂av日日欢夜夜爽一区| 国产主播中文字幕| 欧美bbbbb| 欧美日韩一区二区三区69堂| 精品一区二区在线视频| 在线免费黄色网| 国产一区二区在线观看免费 | 一区二区在线视频观看| 91超碰在线电影| 丁香5月婷婷久久| 精品欧美国产| 国产videos久久| 亚洲一区三区电影在线观看| 香蕉视频官网在线观看日本一区二区| 伊人久久大香线蕉精品| 91高清一区| 久久精品xxx| 男人的天堂成人在线| 丰满少妇在线观看| 韩日精品视频一区| 完美搭档在线观看| 久久亚洲精华国产精华液| 一级在线观看视频| 亚洲色欲色欲www| 久久久久香蕉视频| 色丁香久综合在线久综合在线观看 | 精品动漫av| 国产 福利 在线| 久久国产精品无码网站| 亚洲成年人av| 国产亚洲成aⅴ人片在线观看| 国产精品理论在线| 亚洲精品大片www| 国产成人综合欧美精品久久| 欧美日韩国产影片| 可以免费看毛片的网站| 国产亚洲精品成人av久久ww| 理论片午午伦夜理片在线播放| 九色精品美女在线| 日本免费一区二区三区四区| 国产伊人精品在线| 久久男人av| 日本黄色播放器| 亚洲一区欧美激情| 五月天国产视频| 久久精品视频网| 久久伊人成人网| 精品视频在线看| 亚洲区小说区图片区| 久久久www成人免费精品| 国产美女高潮在线观看| 91久久精品国产91性色| 亚洲资源网你懂的| 国产欧美久久久久| 免费视频最近日韩| 老熟妇精品一区二区三区| 国产精品久久久久久久浪潮网站| 国产精品99无码一区二区| 欧美伊人久久大香线蕉综合69 | 无码人妻精品一区二区三区蜜桃91 | 国产三区在线播放| 亚洲色图偷窥自拍| 毛片大全在线观看| 成人免费在线视频网站| 岳的好大精品一区二区三区| 亚洲一区 在线播放| 蜜臀va亚洲va欧美va天堂| 一本加勒比波多野结衣| 亚洲精品亚洲人成人网| 波多野结衣激情视频| 久久午夜电影网| 成人性生交视频免费观看| 99精品视频免费在线观看| 久久久久久久久久97| 欧美午夜女人视频在线| 精品国自产拍在线观看| 色999日韩欧美国产| 性欧美xxx69hd高清| 成人91视频| 91精品一区国产高清在线gif | 97在线观看视频免费| 欧美亚洲综合一区| 日本福利午夜视频在线| 久久久亚洲精品视频| 日本免费一区二区视频| 午夜探花在线观看| 久久精品国产在热久久| 国产精品久久久久无码av色戒| 亚洲成人自拍偷拍| 成人久久久精品国产乱码一区二区| 久久香蕉国产线看观看网| av久久网站| 亚洲精品一区二区毛豆| 日本亚洲三级在线| 日韩免费成人av| 欧美视频在线观看一区二区| 毛片在线播放网址| 日本精品久久中文字幕佐佐木| 日本韩国欧美超级黄在线观看| 日本a视频在线观看| 波多野结衣中文一区| 日韩精品成人一区| 亚洲精品99久久久久中文字幕| av蜜臀在线| 久久伊人一区| 久久综合九色综合欧美狠狠| 91社区视频在线观看| 欧美在线|欧美| 秋霞午夜理伦电影在线观看| 成人免费福利在线| 欧美91福利在线观看| 亚洲欧美日韩中文字幕在线观看| 一区二区三区四区亚洲| 欧美视频一二区| 欧美一级黑人aaaaaaa做受| 久久最新网址| 日日干夜夜操s8| 亚洲精品成人天堂一二三| 国模私拍视频在线| 日本欧美在线视频| 久久亚洲在线| 欧美日韩一区二区区别是什么| 亚洲国产一区二区视频| 日本在线视频1区| 国产女人18毛片水18精品| 欧美久久综合| av网站有哪些| 欧美久久久久久久久久| 性欧美高清come| 久久亚裔精品欧美| 久久精品久久精品| 日韩免费观看一区二区| 国产亚洲一区二区精品| 91成人app| 国产免费毛卡片| 国产精品国模大尺度视频| 亚洲欧美另类一区| 日韩av成人在线观看| 亚洲成人tv| 黄色片视频免费观看| 精品视频色一区| 成人影音在线| 性欧美精品一区二区三区在线播放| 国产美女精品一区二区三区| 西西44rtwww国产精品| 色妞欧美日韩在线| 精品综合久久88少妇激情| 午夜在线观看av| 亚洲成a人v欧美综合天堂| 日韩在线免费电影| 另类欧美小说| 国产精品羞羞答答xxdd| 欧美brazzers|