精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

VisRAG:清華大學(xué)&面壁智能提出了一種新的RAG思路,效果提升明顯

發(fā)布于 2024-10-21 12:59
瀏覽
0收藏

1. 為啥要提出VisRAG?

檢索增強(qiáng)生成(Retrieval-augmented generation, RAG) 已經(jīng)成為解決LLM幻覺(jué)和知識(shí)更新的經(jīng)典方案,典型的RAG流程是基于文本的(以下簡(jiǎn)稱(chēng)TextRAG),以分割后的文本作為檢索單元。

但是在真實(shí)場(chǎng)景中,知識(shí)往往以多模態(tài)的形式出現(xiàn),比如教科書(shū)、手冊(cè)等。這些文檔中的文本與圖像交織在一起。為了從這類(lèi)數(shù)據(jù)源中提取文本,通常需要一個(gè)解析階段,這包括布局識(shí)別、光學(xué)字符識(shí)別(OCR)和文本合并等后處理步驟。雖然這種方法在大多數(shù)情況下是有效的,但解析過(guò)程還是會(huì)不可避免地引入錯(cuò)誤,從而對(duì)檢索和生成階段產(chǎn)生負(fù)面影響。

TextRAG只利用了文本信息,忽略了其他模態(tài),如圖像中可能包含的信息。盡管已經(jīng)對(duì)圖像檢索和多模態(tài)RAG進(jìn)行了研究,但這些研究主要集中在預(yù)定義場(chǎng)景中,其中圖像和描述性文本已經(jīng)被正確提取和配對(duì),與現(xiàn)實(shí)世界中文本和圖像(包括圖形)常常交錯(cuò)在單個(gè)文檔頁(yè)面內(nèi)的情況有所不同。

所以,本文作者提出了一種VisRAG,旨在探索完全基于視覺(jué)語(yǔ)言模型(VLMs)構(gòu)建純視覺(jué)RAG流程的可行性。

2. 什么是VisRAG?

VisRAG是一種新型視覺(jué)檢索增強(qiáng)生成系統(tǒng),由VLM驅(qū)動(dòng)的檢索器VisRAG-Ret和生成器VisRAG-Gen組成。

VisRAG:清華大學(xué)&面壁智能提出了一種新的RAG思路,效果提升明顯-AI.x社區(qū)圖片

如上圖(左邊)所示,TextRAG 通常使用基于文本的單元進(jìn)行檢索和生成。右邊是 VisRAG,與傳統(tǒng)RAG框架利用文本片段進(jìn)行檢索和生成不同,VisRAG通過(guò)文檔圖像來(lái)保留全部信息,確保數(shù)據(jù)的完整性。

2.1 檢索階段

VisRAG的首個(gè)環(huán)節(jié),即VisRAG-Ret,在給定查詢(xún)q的情況下,從文檔集合D中檢索出一系列頁(yè)面。

借鑒了文本密集檢索器的 Bi-Encoder 架構(gòu),將查詢(xún)和文檔(直接使用文檔圖像,而非依賴(lài)提取的文本內(nèi)容)映射到嵌入空間。

Bi-Encoders:將句子 A 和 B 獨(dú)立地傳遞給 BERT,從而產(chǎn)生句子嵌入 u 和 v,然后可以使用余弦相似度比較。

查詢(xún)和頁(yè)面在VLM中分別以文本和圖像的形式獨(dú)立編碼,為了得到最終的嵌入向量,采用了位置加權(quán)平均池化處理VLM的最后一層隱藏狀態(tài)。

2.2 生成階段

VisRAG的第二環(huán)節(jié):VisRAG-Gen,利用視覺(jué)語(yǔ)言模型(VLM)根據(jù)用戶(hù)查詢(xún)和檢索出的頁(yè)面生成答案。考慮到檢索出的頁(yè)面往往都不止一頁(yè),而大多數(shù)多模態(tài)大模型只能接受單張圖片,所以提出了兩種方案來(lái)實(shí)現(xiàn):

? 頁(yè)面合并(Page Concatenation):將檢索出的頁(yè)面合并為一張圖片,在VisRAG中,作者主要嘗試的是水平合并。

? 加權(quán)篩選(Weighted Selection):讓VLM為top-k中的每個(gè)頁(yè)面生成一個(gè)答案,并選擇置信度最高的答案作為最終答案。

3. 效果對(duì)比

3.1 檢索性能

對(duì)比了VisRAG-Ret與三種情況模型進(jìn)行對(duì)比:

? a. 現(xiàn)成模型

? b. 僅利用合成數(shù)據(jù)的跨領(lǐng)域模型

? c. 同時(shí)利用領(lǐng)域內(nèi)和合成數(shù)據(jù)

VisRAG:清華大學(xué)&面壁智能提出了一種新的RAG思路,效果提升明顯-AI.x社區(qū)圖片

如上表(a)(b)所示,VisRAG-Ret在跨領(lǐng)域數(shù)據(jù)上的訓(xùn)練成果超越了所有現(xiàn)成基線模型,包括文本和視覺(jué)模型。它顯著地優(yōu)于BM25和bge-large,并超越了擁有7.85B參數(shù)的先進(jìn)文本檢索模型NV-Embed-v2。

bge-large和NV-Embed-v2是在數(shù)百萬(wàn)查詢(xún)-文檔對(duì)上訓(xùn)練的,比VisRAG-Ret訓(xùn)練數(shù)據(jù)多出10倍。盡管bge-large在MTEB等基準(zhǔn)測(cè)試中勝過(guò)BM25,但在作者的數(shù)據(jù)集上表現(xiàn)不佳,表明:在干凈文本上訓(xùn)練的嵌入模型難以應(yīng)對(duì)現(xiàn)實(shí)世界文檔解析出的文本。

當(dāng)在相同的數(shù)據(jù)設(shè)置下訓(xùn)練時(shí),VisRAG-Ret顯著超越了文本模型MiniCPM (OCR) & (Captioner)和視覺(jué)模型SigLIP。

在跨領(lǐng)域環(huán)境中,VisRAG-Ret的優(yōu)勢(shì)更加明顯,相較于MiniCPM (OCR)和SigLIP分別實(shí)現(xiàn)了15%和22%的提升,而在領(lǐng)域內(nèi)環(huán)境中提升為8%和10%。說(shuō)明VisRAG-Ret相比以文本和視覺(jué)為中心的模型具有更佳的泛化能力。

盡管MiniCPM (Captioner)使用了相同的VLM MiniCPM-V 2.0進(jìn)行解析,但其表現(xiàn)不及VisRAG-Ret,這表明直接用VLMs編碼比用VLMs解析更為有效。可能是因?yàn)樵趯⒍嗄B(tài)信息轉(zhuǎn)錄為文本時(shí)不可避免地會(huì)有信息損失。

MiniCPM (OCR)和SigLIP在不同數(shù)據(jù)集上的表現(xiàn)各異:

? SigLIP在ArxivQA和ChartQA中表現(xiàn)出色,而MiniCPM (OCR)在DocVQA和InfographicsVQA中顯著優(yōu)于SigLIP。這可能是因?yàn)閮蓚€(gè)模型的關(guān)注點(diǎn)不同:MiniCPM側(cè)重于文本,而SigLIP側(cè)重于視覺(jué)信號(hào)。

? VisRAG-Ret基于MiniCPM-V 2.0構(gòu)建,結(jié)合了SigLIP編碼器和MiniCPM語(yǔ)言模型的優(yōu)勢(shì),在所有數(shù)據(jù)集上均有良好表現(xiàn),能夠從文檔中捕獲更全面的信息。

與ColPali相比,ColPali是一個(gè)多向量文檔頁(yè)面嵌入模型,VisRAG-Ret保持了優(yōu)越的性能,實(shí)現(xiàn)了更佳的內(nèi)存效率。ColPali用分布在1030個(gè)128維向量上的256KB數(shù)據(jù)表示一頁(yè),而VisRAG-Ret僅使用單個(gè)2304維向量的4.5KB。這使得VisRAG-Ret更適合在現(xiàn)實(shí)世界的應(yīng)用中擴(kuò)展至數(shù)百萬(wàn)或數(shù)十億文檔。

3.2 生成性能

在統(tǒng)一的檢索智能體VisRAG-Ret之上,應(yīng)用了多種基于文本和視覺(jué)的生成器和方法,探究它們?cè)诮o定查詢(xún)和檢索文檔的情況下生成答案的能力。

VisRAG:清華大學(xué)&面壁智能提出了一種新的RAG思路,效果提升明顯-AI.x社區(qū)圖片

上表展示了多種生成方式的效果:

? a. 基于文本的生成(TextRAG-Gen)

? b. 采用單張圖片輸入的VLM MiniCPM-V 2.0進(jìn)行的生成

? c. 采用能接受多張圖片輸入的VLM進(jìn)行的生成

當(dāng)模型僅被提供真實(shí)文檔("Oracle")時(shí),直接處理文檔圖像的VisRAG-Gen模型顯著超越了僅依賴(lài)提取文本的RAG-Gen模型。比如:MiniCPM-V 2.0在利用真實(shí)文檔時(shí)的性能比MiniCPM (OCR)高出36%。從文檔中提取答案時(shí)視覺(jué)線索的關(guān)鍵作用,并顯示出VisRAG-Gen相比TextRAG-Gen有著更高的性能潛力。

在實(shí)際應(yīng)用場(chǎng)景中,模型通常會(huì)接收到包含噪聲的前1至3個(gè)檢索文檔,VisRAG-Gen在同一系列模型中持續(xù)超越TextRAG-Gen。

特別是對(duì)于僅能處理單張圖片的MiniCPM-V 2.0,加權(quán)選擇方法在處理2或3個(gè)檢索文檔時(shí),比頁(yè)面合并方法展現(xiàn)出更優(yōu)的表現(xiàn)。簡(jiǎn)單的合并可能會(huì)向VLM傳遞過(guò)多不必要的信息,而加權(quán)選擇則基于各個(gè)文檔的條件,通過(guò)多個(gè)VLM輸出來(lái)篩選答案,從而減輕了信息負(fù)載。

TextRAG流程通常因檢索文檔數(shù)量的增加而受益,因?yàn)檫@能更好地覆蓋信。然而,盡管加權(quán)選擇增強(qiáng)了性能的穩(wěn)健性,但采用這種方法時(shí),隨著檢索文檔數(shù)量的增加,并沒(méi)有帶來(lái)顯著的性能提升。值得注意的是,僅有最先進(jìn)的VLM,如能處理多張圖片的GPT-4o,隨著檢索文檔數(shù)量的增加,表現(xiàn)出明顯的性能提升。這表明對(duì)多張圖片進(jìn)行推理對(duì)當(dāng)前的VLM來(lái)說(shuō)仍是一個(gè)挑戰(zhàn)。

3.3 整體性能

在這項(xiàng)實(shí)驗(yàn)中,對(duì)比了VisRAG與TextRAG兩條處理流程的效果,以評(píng)估VisRAG流程的有效性。

TextRAG流程中,采用了MiniCPM (OCR)負(fù)責(zé)檢索,MiniCPM-V 2.6 (OCR)負(fù)責(zé)生成,而VisRAG流程則由VisRAG-Ret負(fù)責(zé)檢索,MiniCPM-V 2.6負(fù)責(zé)生成。

VisRAG:清華大學(xué)&面壁智能提出了一種新的RAG思路,效果提升明顯-AI.x社區(qū)圖片

VisRAG:清華大學(xué)&面壁智能提出了一種新的RAG思路,效果提升明顯-AI.x社區(qū)圖片

上面兩個(gè)圖展示了在InfographicsVQA數(shù)據(jù)集上的性能表現(xiàn)。

VisRAG在精確檢索文檔的比率上超越了TextRAG,并且在從精確檢索到的文檔生成正確答案的比率上也有顯著提升。檢索和生成兩個(gè)階段的綜合改進(jìn),使得整體準(zhǔn)確率從22.1%提升至42.7%。

VisRAG:清華大學(xué)&面壁智能提出了一種新的RAG思路,效果提升明顯-AI.x社區(qū)圖片

在六個(gè)評(píng)估數(shù)據(jù)集中,VisRAG平均實(shí)現(xiàn)了39%的準(zhǔn)確率提升(如上圖)。

? 論文原文: https://arxiv.org/abs/2410.10594

本文轉(zhuǎn)載自??大語(yǔ)言模型論文跟蹤??,作者:HuggingAGI ????

收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
亚洲欧美日韩动漫| 亚洲激情第一页| 另类视频在线观看| 国产黄页在线观看| 国产露脸国语对白在线| 欧美男人操女人视频| 精品一区二区三区视频| 精品国产sm最大网站| 亚洲欧洲日本国产| 久久久久亚洲av成人毛片韩| 国产精品久久免费视频| 国产三级一区二区三区| 性色av一区二区三区在线观看| 日本一二区免费| 国产人成在线观看| 欧美电影在线观看完整版| 日韩欧亚中文在线| 91在线短视频| 国产精品18在线| 欧洲一级精品| 91麻豆123| 97超级碰碰碰| 欧美熟妇精品一区二区蜜桃视频| 欧美jizz18hd性欧美| 人人爽香蕉精品| 国产一区二区三区久久精品 | 精品久久不卡| 在线视频国内一区二区| 久久96国产精品久久99软件| 久久综合加勒比| 日本亚州欧洲精品不卡| 一区二区三区欧美| 91在线观看网站| 国产精品视频久久久久久| 美女91精品| 亚洲午夜未删减在线观看| 少妇极品熟妇人妻无码| 午夜小视频在线观看| 国产精品一区二区久久精品爱涩| 日韩视频在线观看免费| www.亚洲高清| 国产网站在线免费观看| 国产东北露脸精品视频| 欧美老女人xx| 激情综合激情五月| 蜜桃麻豆av在线| 久久久不卡影院| 国产精品无av码在线观看| 三级黄色录像视频| 成人精品动漫一区二区三区| 香蕉乱码成人久久天堂爱免费| 久久99精品国产99久久| 丰满人妻一区二区三区无码av| 欧美日韩91| 日韩av在线一区| 性欧美videossex精品| 成人区精品一区二区不卡| 成人一区二区三区| 人妖精品videosex性欧美| 91av手机在线| 99精品在线观看| 精品粉嫩超白一线天av| youjizz.com日本| 激情视频极品美女日韩| 欧美在线影院一区二区| 青青青在线视频免费观看| 国产鲁鲁视频在线观看特色| 自拍偷拍欧美精品| 激情久久av| 91麻豆成人精品国产免费网站| 国产真实久久| 在线观看日韩av| 天堂www中文在线资源| 麻豆成人入口| 亚洲深夜福利在线| 色婷婷狠狠18禁久久| 亚洲精品福利| 欧美视频第二页| 拔插拔插海外华人免费| 在线a人片免费观看视频| av午夜精品一区二区三区| 国产日产久久高清欧美一区| 日本高清www免费视频| 色婷婷亚洲mv天堂mv在影片| 精品欧美一区二区在线观看| 污污视频网站免费观看| 日本资源在线| 欧美日韩在线第一页| 正在播放精油久久| 国产1区2区3区在线| 国产精品国产三级国产aⅴ中文| 精品无码久久久久久久动漫| 电影在线高清| 一区二区三区**美女毛片| 国产精品后入内射日本在线观看| 国产一区二区三区影视| 色综合夜色一区| 青青草久久伊人| 成功精品影院| 色婷婷综合久久久久| 级毛片内射视频| 菁菁伊人国产精品| 丝袜亚洲欧美日韩综合| 日本网站在线免费观看| 狠狠干成人综合网| 国产精品久久久久久久久借妻 | 黄色在线免费看| 精品久久久久久久久久| 天堂а√在线中文在线| 最近高清中文在线字幕在线观看| 久久夜色精品国产噜噜av| 国产视频精品网| 欧美视频xxx| 成人午夜短视频| 亚洲精品在线观看免费| segui88久久综合| 亚洲成人精品一区二区| 国产欧美日韩网站| 亚洲视频资源| 日韩一本二本av| 日韩女优在线视频| 日本一区二区三区视频| 57pao成人永久免费视频| 日本三级小视频| 久久一区二区三区超碰国产精品| 国产精欧美一区二区三区| а中文在线天堂| 视频在线观看91| 国产亚洲欧美一区二区三区| 18+激情视频在线| 一区二区三区**美女毛片| 高清av免费看| 精品无人区麻豆乱码久久久| 91爱视频在线| 少妇喷水在线观看| 国产丝袜欧美中文另类| 国产婷婷一区二区三区| 校园春色亚洲色图| 欧美日高清视频| 又黄又色的网站| 在线一区电影| 26uuu久久噜噜噜噜| 成人1区2区3区| 久久伊人蜜桃av一区二区| 免费观看美女裸体网站| 成人知道污网站| 欧美另类在线观看| 国产v片在线观看| 91麻豆国产福利在线观看| 欧美国产日韩激情| 国产精品亚洲d| 亚洲性日韩精品一区二区| 免费的毛片视频| 国内外成人在线视频| 99c视频在线| 国外av在线| 亚洲精品国产高清久久伦理二区| 婷婷五月综合缴情在线视频| aaa国产精品视频| 久久久久在线观看| 91午夜交换视频| 亚洲人成影院在线观看| 日日碰狠狠添天天爽超碰97| 精品亚洲免a| 国产91精品久久久久久| 酒色婷婷桃色成人免费av网| 亚洲黄色免费电影| 波多野结衣办公室双飞 | 日本成人在线免费视频| 国产精品1区| 欧美裸体xxxx极品少妇| 欧美亚洲精品在线观看| 欧美日韩亚洲一区二区三区| 国产精品扒开腿做爽爽| 欧美日韩国产在线一区| 国产亚洲自拍偷拍| 国产麻豆久久| 九九久久综合网站| 日韩精品视频无播放器在线看| 国产精品久久久爽爽爽麻豆色哟哟| www.xxx麻豆| 小嫩嫩12欧美| 韩剧1988免费观看全集| 久久久久久女乱国产| 欧美人伦禁忌dvd放荡欲情| 欧美风情第一页| 免费视频一区二区| 精品产品国产在线不卡| 欧美黑人粗大| 欧美老肥婆性猛交视频| 免费人成黄页在线观看忧物| 欧美精品一卡两卡| 欧美另类z0zx974| 免费日韩视频| 精品综合久久| 日韩在线免费| 久久久久久久久久亚洲| 精品人妻一区二区三区含羞草| 天天综合日日夜夜精品| 国产日韩精品中文字无码| 久久最新视频| 日韩一级特黄毛片| 成人3d精品动漫精品一二三| 日韩免费av在线| 国产资源在线看| 日韩精品在线一区| 久久久久成人片免费观看蜜芽| 久久夜色精品一区| 91精产国品一二三| 美女精品一区二区| 欧美日韩视频在线一区二区观看视频| av有码在线观看| 中文字幕国产精品久久| 日本一区二区三区久久| 亚洲va欧美va人人爽| 91视频青青草| 欧美国产日韩精品免费观看| 熟女少妇在线视频播放| 婷婷中文字幕一区| 色之综合天天综合色天天棕色| 韩国精品主播一区二区在线观看 | 国产传媒免费在线观看| 久久久久久久久久看片| 久久久男人的天堂| 国产精品一区2区| 在线不卡一区二区三区| 日韩黄色片在线观看| 欧美激情论坛| 国产精品自在线拍| 日本精品久久久久久久| 国产探花视频在线观看| 日韩精品在线看| 91麻豆精品在线| 日本韩国一区二区三区| 人人艹在线视频| 日本一区二区动态图| 韩国女同性做爰三级| 国产三级精品三级在线专区| 国产在线观看无码免费视频| 日本在线不卡一区| 99久久久无码国产精品6| 日韩免费视频| 视频一区二区精品| 精品国产一区二区三区小蝌蚪| 久久狠狠久久综合桃花| 少妇精品导航| 欧美精品国产精品久久久| 一本色道久久综合亚洲精品酒店 | 国产精品久久777777换脸| 欧美午夜精品理论片a级按摩| 特黄一区二区三区| 中文字幕第一区综合| a资源在线观看| 成人三级伦理片| 水蜜桃av无码| 91女神在线视频| 五月天综合视频| 国产精品久久网站| 欧美日韩在线观看成人| 久久一夜天堂av一区二区三区| 亚洲一区二区三区四区五区六区| 日本视频免费一区| 国产视频1区2区3区| 精品在线一区二区| ass极品水嫩小美女ass| 老司机午夜精品视频| 91日韩视频在线观看| 久久99国产精品成人| 成人三级做爰av| 99国产精品久久久久| 日本中文字幕观看| 国产在线精品一区二区夜色| 能在线观看的av| 欧美精品偷拍| 国精产品一区一区三区视频| 鲁大师影院一区二区三区| 亚欧美在线观看| 国产91精品一区二区麻豆网站| 日日噜噜噜噜久久久精品毛片| 麻豆精品新av中文字幕| 粗大的内捧猛烈进出视频| 91天堂素人约啪| 久久一级免费视频| 午夜电影一区二区三区| 自拍偷拍色综合| 精品美女在线播放| 92国产在线视频| 久久久女人电视剧免费播放下载| 亚洲男人av| 69av在线视频| 欧美激情不卡| 国产精品久久久久久久久久小说 | 在线区一区二视频| 99热这里精品| 亚洲天堂免费在线| 蜜臀av在线播放| 插插插亚洲综合网| 午夜激情在线播放| 亚洲永久在线观看| 国产日本亚洲| 日本精品一区| 精品久久久久久久| 欧美精品卡一卡二| 久久狠狠亚洲综合| 欧美成人三级伦在线观看| 中文字幕日韩一区| 中日韩黄色大片| 日韩欧美一级精品久久| av影片在线看| 欧洲亚洲免费视频| 一区二区在线免费播放| 亚洲v国产v| 噜噜噜躁狠狠躁狠狠精品视频| 人妻精油按摩bd高清中文字幕| 亚洲国产成人在线| 永久免费无码av网站在线观看| 日韩精品一区二区在线| 欧洲日本在线| 国产精品都在这里| 一区二区美女| ww国产内射精品后入国产| 国产成人啪午夜精品网站男同| 正在播放国产对白害羞| 日本高清不卡在线观看| 神马精品久久| 亚洲免费小视频| 日本天堂在线观看| 国产精品99导航| 九色精品国产蝌蚪| 正在播放国产精品| 毛片av中文字幕一区二区| 素人fc2av清纯18岁| 国产欧美日韩三区| 亚洲AV无码成人精品区东京热| 精品国产乱码91久久久久久网站| 八戒八戒神马在线电影| 成人欧美在线观看| 国产欧美一区二区三区米奇| 青青在线免费视频| 国产欧美亚洲一区| 手机在线免费观看毛片| 2020国产精品久久精品美国| 欧美一二三区视频| 亚洲精品二三区| 深夜成人在线| 美女黄毛**国产精品啪啪| 欧美国产偷国产精品三区| 美女av免费观看| 国产精品亚洲第一| 久草视频免费在线播放| 欧美日韩中文在线观看| 在线观看国产区| 一区二区欧美激情| yiren22亚洲综合| 亚洲最大成人在线| 亚洲午夜精品一区二区国产| 欧美国产日韩在线视频| 久久综合久色欧美综合狠狠| 久久99精品波多结衣一区| 亚洲欧美自拍一区| 99re久久| 日韩最新中文字幕| 久久婷婷久久| 一级特黄曰皮片视频| 欧美日韩精品一区视频| 黄色av电影在线观看| 波多野结衣成人在线| 9色国产精品| 手机av在线网站| 洋洋成人永久网站入口| 天天操天天干天天插| 日韩美女视频免费在线观看| 日韩精品首页| 午夜性福利视频| 日韩欧美国产高清91| 午夜在线小视频| 99热在线播放| 快she精品国产999| 欧美老熟妇一区二区三区| 91福利区一区二区三区| 美女隐私在线观看| 国产一区二区不卡视频在线观看| 久久一区激情| 日本天堂中文字幕| 亚洲欧美国产精品久久久久久久 | 亚洲综合影视| 蜜桃视频在线观看91| 精品夜夜嗨av一区二区三区| 国产亚洲精久久久久久无码77777| 亚洲免费视频在线观看| 国产美女视频一区二区| 天天摸天天碰天天添| 亚洲精品久久久蜜桃| 欧美色视频免费| 91精品国产一区二区三区动漫| 男女精品网站| 99久久99久久精品国产| 亚洲免费视频在线观看| 中文字幕区一区二区三| a在线观看免费视频|