精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

一文讀懂:從RAG到多模態(tài)RAG 原創(chuàng) 精華

發(fā)布于 2024-11-1 15:56
瀏覽
0收藏

如果說2023年見證了大語言模型的“寒武紀(jì)大爆發(fā)”,那么2024年則是多模態(tài)大模型“元年”。GPT-4o的出現(xiàn)讓大家見識(shí)到多模態(tài)能力引入,給下游應(yīng)用生態(tài)帶來的巨大改變。隨之而來的,RAG技術(shù)也將逐漸從單語言模態(tài)的RAG進(jìn)化到多模態(tài)RAG。本文將帶大家速覽多模態(tài)RAG技術(shù)的原理及實(shí)現(xiàn)。

一文讀懂:從RAG到多模態(tài)RAG-AI.x社區(qū)

什么是RAG

什么是RAG:Retrieval Augmented Generation,檢索增強(qiáng)生成。是一種結(jié)合了信息檢索技術(shù)和大型語言模型提示功能的框架。它通過從數(shù)據(jù)源檢索信息來輔助LLM生成答案,提高了模型在知識(shí)密集型任務(wù)中的準(zhǔn)確性和可信度。

我們?yōu)槭裁葱枰猂AG:大型語言模型通?;诠潭ǖ臍v史數(shù)據(jù)集進(jìn)行訓(xùn)練,這意味著它們的知識(shí)是過時(shí)的,無法涵蓋最新的信息或特定領(lǐng)域的專業(yè)知識(shí)。RAG的目的是通過引入額外知識(shí)庫,檢索其中的相關(guān)信息,并根據(jù)檢索結(jié)果給予用戶回答。這也可以顯著減少大模型因?yàn)椴⒉痪邆湎嚓P(guān)知識(shí),而出現(xiàn)的“幻覺”現(xiàn)象。當(dāng)然我們也可以直接把整個(gè)數(shù)據(jù)庫作為L(zhǎng)LM的prompt輸入,但由于transformer架構(gòu)O(N2)復(fù)雜度的限制,LLM支持的最長(zhǎng)輸入長(zhǎng)度通常有限,多數(shù)支持到128k token已經(jīng)是極限,使得在面臨更長(zhǎng)知識(shí)庫輸入時(shí),RAG依然是當(dāng)下唯一可行的解決方案。

如何實(shí)現(xiàn)RAG:在實(shí)際應(yīng)用時(shí),我們常需要給定一系列文檔,并使用RAG方法,讓LLM針對(duì)這些文檔進(jìn)行檢索與交互。RAG的實(shí)現(xiàn)主要包含以下幾個(gè)步驟:

  • 數(shù)據(jù)準(zhǔn)備階段:包括數(shù)據(jù)提取、分塊(chunking)、向量化(embedding)、數(shù)據(jù)入庫等環(huán)節(jié)。數(shù)據(jù)提取涉及將不同格式的數(shù)據(jù)(如PDF、Word、數(shù)據(jù)庫等)處理為統(tǒng)一的格式。分塊是將大文檔分割成較小的、語義完整的單元,以便于后續(xù)處理和檢索。
  • 檢索階段:系統(tǒng)根據(jù)輸入查詢檢索相關(guān)文檔或信息。這個(gè)階段依賴于搜索算法和索引方法來快速識(shí)別大量集合中最相關(guān)的數(shù)據(jù)。
  • 增強(qiáng)階段:將用戶查詢和檢索到的額外上下文放入一個(gè)提示模板中,以增強(qiáng)提示。
  • 生成階段:使用大型語言模型來針對(duì)檢索結(jié)果,生成對(duì)用戶的回復(fù)。?

走向多模態(tài)RAG

從RAG的應(yīng)用可以看出,多數(shù)時(shí)候,我們需要把一些文檔作為RAG的輸入,用于檢索和生成。而現(xiàn)實(shí)應(yīng)用中,文檔通常是以圖文交錯(cuò)的形式存在的,比如網(wǎng)頁、PDF、PPT文件等等。

通常的做法是,只保留文檔中的文本信息。對(duì)于PDF文檔,則進(jìn)行OCR文字識(shí)別,讀取其中的文本。但這樣會(huì)導(dǎo)致大量圖片中至關(guān)重要的信息被丟失,以及很多結(jié)構(gòu)化內(nèi)容的錯(cuò)亂,比如標(biāo)題、表格、頁眉頁腳等格式錯(cuò)亂。

改進(jìn)的做法是,把所有模態(tài)信息都轉(zhuǎn)換為純文本,再進(jìn)行RAG。我們可以使用多種計(jì)算機(jī)視覺模型,比如檢測(cè)模型對(duì)文檔結(jié)構(gòu)進(jìn)行識(shí)別,然后對(duì)文檔中不同的模塊,使用不同的“廣義OCR模型”進(jìn)行解析。比如對(duì)于文本段落,使用OCR模型進(jìn)行文本識(shí)別;對(duì)于表格,可以用表格模型進(jìn)行識(shí)別轉(zhuǎn)換為Markdown或LaTeX文本;對(duì)于公式,則套用公式識(shí)別轉(zhuǎn)換為L(zhǎng)aTeX;對(duì)于圖片,則可使用多模態(tài)大模型如GPT-4o進(jìn)行文本解讀(caption),保存為文本描述。有很多開源的工具可以完成這些事情,比如MinerU等。通過解析算法,多模態(tài)數(shù)據(jù)就被完全轉(zhuǎn)換為純文本的格式了,也就可以照葫蘆畫瓢套用純文本的RAG方法了。

一文讀懂:從RAG到多模態(tài)RAG-AI.x社區(qū)

圖像來源: 張穎峰 | 所見即所得:多模態(tài)RAG正在向我們走來

我們注意到,使用上述的方法,信息不可避免會(huì)存在丟失,而且依賴過多的解析模型。而時(shí)間來到2024年,多模態(tài)大模型實(shí)現(xiàn)了爆發(fā)式的技術(shù)突破,高分辨率的視覺輸入已經(jīng)取得了巨大突破,使用單一的多模態(tài)大模型做廣義OCR也變得非常容易。比如QWen2-VL以及InternVL-2等開源多模態(tài)大模型,在文檔的廣義OCR上都有非常好的效果。

一文讀懂:從RAG到多模態(tài)RAG-AI.x社區(qū)

多模態(tài)大模型成功,讓端到端(end-to-end)的算法已經(jīng)成為了主流。原生多模態(tài)的RAG算法也成為了可能:既然多模態(tài)大模型有能力理解文本,那我們其實(shí)即無需再把圖像轉(zhuǎn)換為文本,而可以直接使用圖像,提取embedding去做RAG。

一文讀懂:從RAG到多模態(tài)RAG-AI.x社區(qū)

即從圖(a)轉(zhuǎn)變?yōu)閳D(b)的模式

DSE

??https://arxiv.org/abs/2406.11251??

一文讀懂:從RAG到多模態(tài)RAG-AI.x社區(qū)

DSE,即Document Screenshot Embedding,是一個(gè)不使用廣義OCR的多模態(tài)RAG方法,直接把原始文檔的掃描圖片,切片后,使用視覺語言模型的編碼器編碼。其對(duì)query和docunment使用了雙編碼的架構(gòu)。驗(yàn)證了這一想法的可行性。

ColPali

??https://arxiv.org/abs/2407.01449??

一文讀懂:從RAG到多模態(tài)RAG-AI.x社區(qū)

ColPali架構(gòu)也是利用視覺語言模型來從文檔頁面的圖像中產(chǎn)生高質(zhì)量的上下文化嵌入。ColPali使用了延遲交互(late interaction)技術(shù),大大提高了檢索效率,同時(shí)在檢索性能上超越了現(xiàn)有的文檔檢索系統(tǒng),并且具有更快的處理速度和可端到端訓(xùn)練的特點(diǎn)。上圖對(duì)比了傳統(tǒng)的文檔RAG與多模態(tài)RAG的區(qū)別。因?yàn)闇p少了廣義OCR的解析過程,使得處理速度也有了質(zhì)的提升。

一文讀懂:從RAG到多模態(tài)RAG-AI.x社區(qū)

CoPali其實(shí)從名字上看,就知道靈感來源于兩個(gè)工作,PaliGemma和CoBERT。PaliGemma 是 Google 開發(fā)的一款具有多模態(tài)功能的視覺語言模型,它結(jié)合了視覺模型 SigLIP 和大型語言模型 Gemma?!癈ol” 則來自于ColBERT 的延遲交互編碼器。ColPali 算是延遲交互編碼器在多模態(tài) RAG 檢索的應(yīng)用,并且極大提高了檢索召回的精度。

延遲交互編碼結(jié)合了雙編碼器和交叉編碼器的優(yōu)點(diǎn)。在這種架構(gòu)中,query和文檔被分別編碼成獨(dú)立的embedding集合,然后通過一個(gè)高效的交互機(jī)制來計(jì)算它們之間的相似度。


一文讀懂:從RAG到多模態(tài)RAG-AI.x社區(qū)


延遲交互編碼的核心思想是將查詢和文檔的編碼過程分開,這樣文檔的編碼可以離線完成,而查詢的編碼則在在線階段進(jìn)行。這種方法的優(yōu)點(diǎn)是可以在查詢時(shí)僅對(duì)查詢進(jìn)行編碼,從而大大提高了處理速度。此外,由于文檔的編碼是預(yù)先完成的,可以將其存儲(chǔ)在數(shù)據(jù)庫中,這樣就可以對(duì)更多的文檔進(jìn)行排序,從而提高查詢的精度。

在延遲交互編碼中,一個(gè)關(guān)鍵的計(jì)算是最大相似性(MaxSim)函數(shù),它計(jì)算每個(gè)查詢Token向量與所有文檔Token向量之間的相似度,并跟蹤每個(gè)查詢Token的最大得分。查詢和文檔的總相似度分?jǐn)?shù)是這些最大余弦相似度分?jǐn)?shù)的總和。這種方法允許模型在保持較高排序質(zhì)量的同時(shí),也具備較高的性能。

隨著多模態(tài)大語言模型能力的增強(qiáng),以它為基礎(chǔ)的多模態(tài)RAG,也早已突破了傳統(tǒng)的圖像檢索的應(yīng)用方式,而是真正具備大規(guī)模非結(jié)構(gòu)化多模態(tài)數(shù)據(jù)深度理解的能力,將會(huì)有更多toB的商業(yè)應(yīng)用價(jià)值。


本文轉(zhuǎn)載自公眾號(hào)思源數(shù)據(jù)科學(xué) 作者:思源Source

原文鏈接:??https://mp.weixin.qq.com/s/IDkIjZfyfllajfoWh4mlLQ???

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
標(biāo)簽
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
精品福利一二区| 久久久综合激的五月天| 麻豆国产精品va在线观看不卡| 国产999免费视频| 麻豆mv在线看| 国产精品久久久久久久久久久免费看 | 天堂蜜桃91精品| 久久精视频免费在线久久完整在线看| 中文成人无字幕乱码精品区| 欧美激情啪啪| 欧美日韩中文字幕日韩欧美| 亚洲免费视频播放| 福利在线午夜| av一区二区不卡| 91啪国产在线| 五月婷婷激情视频| 亚洲午夜精品久久久久久app| 国产亚洲激情在线| 国产精品入口麻豆| 精品国产鲁一鲁****| 欧美亚一区二区| 人妻av中文系列| 国产精品一区二区三区视频网站| 久久你懂得1024| 国产欧美日韩亚洲| 国产黄色片免费| 免费在线观看精品| 国产97人人超碰caoprom| 在线免费不卡视频| 亚洲自拍偷拍福利| 最近中文字幕在线视频| 亚洲一区欧美二区| 欧美精品成人在线| 九九精品在线观看视频| 欧美hd在线| 最近中文字幕2019免费| 亚洲精品国产一区黑色丝袜| 欧美人妖视频| 亚洲精品乱码久久久久久按摩观| 中文字幕一二三| 成人污污www网站免费丝瓜| 欧美日韩国产首页| 色综合天天色综合| 经典三级一区二区| 91官网在线观看| 日韩av片在线看| 涩涩在线视频| 精品女同一区二区三区在线播放| 真人抽搐一进一出视频| 91av久久| 日韩欧美国产视频| 少妇人妻互换不带套| 国产精品一区二区av影院萌芽| 精品国产91久久久久久| 波多野结衣之无限发射| 色资源二区在线视频| 日韩欧美亚洲一二三区| 人妻有码中文字幕| 国产综合av| 欧美日韩国产综合草草| 免费黄频在线观看| 99re8这里有精品热视频8在线| 精品区一区二区| 一级黄色电影片| 欧美日韩看看2015永久免费 | 亚洲午夜久久久久中文字幕久| 少妇大叫太大太粗太爽了a片小说| 欧美6一10sex性hd| 午夜视黄欧洲亚洲| 92看片淫黄大片一级| 精品无人乱码一区二区三区| 欧美午夜精品电影| 亚洲午夜福利在线观看| 人人精品视频| 亚洲天堂第二页| 中文字幕精品亚洲| 91精品综合久久久久久久久久久| 久久大大胆人体| 日本三级中文字幕| 日韩av电影免费观看高清完整版| 国产日韩中文字幕| 亚洲国产成人精品一区二区三区| 99久久免费国产| 亚洲精品国产一区| 男男gaygays亚洲| 欧美视频二区36p| 中文字幕第88页| а√中文在线天堂精品| 亚洲一二三在线| 欧美黑人猛猛猛| 麻豆精品网站| 99porn视频在线| 免费黄网站在线观看| 亚洲视频在线一区观看| 日韩在线综合网| 欧美视频精品| 日韩精品在线免费播放| 国产午夜手机精彩视频| 亚洲欧美高清| 99国产视频在线| 粉嫩一区二区三区国产精品| 亚洲一区二区三区四区在线免费观看| 九九视频精品在线观看| av自拍一区| xxxxxxxxx欧美| 欧美 日韩 精品| 国产91丝袜在线播放九色| 午夜精品一区二区三区四区 | 国产免费av一区二区三区| 九九热视频这里只有精品| 中文字幕在线日本| 成年人国产精品| 大桥未久一区二区三区| 国产91在线精品| 精品小视频在线| 国产精品18p| 国产精品综合在线视频| 亚洲一区二三| 韩国精品主播一区二区在线观看 | 五月婷婷在线观看| 色综合一个色综合| 中文字幕乱码在线| 国产精品二区影院| 96sao精品视频在线观看| 午夜在线观看视频| 日本高清成人免费播放| 日韩乱码人妻无码中文字幕久久| 日韩一级大片| 都市激情久久久久久久久久久| 操你啦视频在线| 欧美丰满一区二区免费视频| 美女av免费看| 日韩高清在线电影| 明星裸体视频一区二区| 神马久久午夜| 亚洲欧洲在线免费| 伊人中文字幕在线观看| 久久蜜臀中文字幕| 国产精品涩涩涩视频网站| 日韩成人一级| 热久久美女精品天天吊色| 婷婷在线免费观看| 精品久久久久久久中文字幕| 欧美夫妇交换xxx| 国产欧美激情| 久久综合久久久| 中文字幕在线看片| 亚洲欧美制服第一页| 波多野结衣啪啪| 国产女人水真多18毛片18精品视频| 99久久久无码国产精品6| 国产一区二区三区四区五区传媒| 日本一区二区三区四区视频| 国产系列电影在线播放网址| 欧美亚洲综合久久| 日本一级特级毛片视频| 国产成人精品午夜视频免费| av网站大全免费| 香蕉久久精品| 国产精品久久久久久久久久99| 亚洲成人三级| 日韩精品一区二区三区四区| 久久免费视频播放| 久久久久久一二三区| 不卡的av中文字幕| 欧美一区91| 精品国产乱码久久久久久丨区2区| 色多多在线观看| 中文字幕亚洲一区在线观看 | 成人性视频网站| 国模吧无码一区二区三区| 精品欧美久久| 51国产成人精品午夜福中文下载| 黑人精品视频| 国产一区二区三区中文 | 成人日韩av| 欧美第一黄色网| 青青草免费在线| 欧美狂野另类xxxxoooo| 国产一级特黄毛片| 国产免费成人在线视频| 久久黄色一级视频| 小嫩嫩精品导航| 9l视频自拍9l视频自拍| 欧美性生活一级片| 91精品国产综合久久久久久久久| 日本高清在线观看| 亚洲人精品午夜在线观看| 国产精品女人久久久| 欧美日韩亚洲激情| 极品魔鬼身材女神啪啪精品| 91免费视频大全| 一二三av在线| 视频一区二区三区中文字幕| 欧美一级爱爱视频| 国产一区二区三区探花 | 第一sis亚洲原创| 国产精品香蕉视屏| 欧美啪啪网站| 国产suv精品一区二区| 牛牛精品视频在线| 色诱女教师一区二区三区| 天天干天天干天天干| 777a∨成人精品桃花网| 久操视频在线免费观看| 亚洲成a人v欧美综合天堂| 天天做夜夜爱爱爱| 久久精品一区二区三区不卡 | 国内老熟妇对白xxxxhd| 欧美午夜宅男影院| 久久99精品波多结衣一区| 亚洲免费av网站| 东京热无码av男人的天堂| 91香蕉视频mp4| 性折磨bdsm欧美激情另类| 蜜臀91精品一区二区三区| 日韩精品一区二区三区久久| 黄色国产精品| 久久久久亚洲av无码专区喷水| 日本不卡高清| 色姑娘综合网| 国产一区二区三区四区二区| 欧美国产综合视频| 欧美男男freegayvideosroom| 国产乱码精品一区二区三区日韩精品| **国产精品| 成人激情视频在线播放| 国产精品麻豆成人av电影艾秋| 日本精品一区二区三区在线播放视频| 国产v日韩v欧美v| 久久人91精品久久久久久不卡| 日韩精品分区| 欧美激情视频一区二区| 亚洲综合影视| 九九热精品在线| 韩国成人免费视频| 久久人人爽人人爽人人片av高清| 毛片大全在线观看| 午夜精品99久久免费| av白虎一区| 国产91成人video| 亚洲人成午夜免电影费观看| 日本道色综合久久影院| 欧美7777| 国产精品免费一区豆花| 丁香久久综合| 成人亚洲欧美一区二区三区| 中文字幕久久一区| 欧美va久久久噜噜噜久久| 亚洲欧美日本国产有色| 999国产精品视频| 日韩大陆欧美高清视频区| 国产精品又粗又长| 亚洲激情欧美| 男女视频网站在线观看| 老司机一区二区三区| 亚洲成人av免费看| 久久精品国产精品亚洲精品| 国产又粗又猛大又黄又爽| 成人免费观看av| 少妇精品一区二区三区| 欧美韩国日本一区| 亚洲二区在线播放| 亚洲福中文字幕伊人影院| 天堂中文在线网| 欧美午夜片在线观看| aa视频在线免费观看| 亚洲激情小视频| 97电影在线| 欧美精品在线网站| 伊人成综合网站| 国产精品一区二区久久久久| 一区二区三区免费在线看| 蜜桃传媒视频麻豆一区| 日韩在线二区| 欧美黑人经典片免费观看| 视频一区视频二区中文| 亚洲自拍第三页| 91亚洲午夜精品久久久久久| 久久视频精品在线观看| 一区二区三区欧美激情| 黄网在线观看视频| 欧美精品久久天天躁| 你懂的网站在线| 日韩综合中文字幕| 日韩伦理在线一区| 成人信息集中地欧美| 日韩大胆成人| 国产人妻互换一区二区| 久久美女性网| 久久精品无码专区| 国产精品久久久久久一区二区三区 | 久热精品在线视频| 午夜伦理福利在线| 91在线精品观看| 大片网站久久| 国产精品无码一区二区在线| 久久狠狠亚洲综合| 真人bbbbbbbbb毛片| 亚洲男人的天堂在线观看| 国产伦精品一区二区三区视频网站| 欧美精品日韩一区| 春暖花开成人亚洲区| 欧美高清视频在线观看| 成人国产激情| 欧美精品七区| 狠色狠色综合久久| 中文字幕剧情在线观看| 国产日产欧美精品一区二区三区| 国产一级av毛片| 7777精品伊人久久久大香线蕉经典版下载 | 久久久一本二本三本| 国产精品自拍三区| 少妇av片在线观看| 欧美午夜无遮挡| 人妻与黑人一区二区三区| 精品国产一区二区三区四区在线观看 | 欧美高清性xxxxhdvideosex| 精品99视频| 性高潮久久久久久| 日韩美女视频一区二区| 中文字幕乱码一区二区| 精品亚洲一区二区三区在线播放| 日本三级在线观看网站 | 亚洲精品亚洲人成在线观看| www.国产在线视频| 国产精品18久久久久久久久久久久| 超碰人人干人人| 欧美最新大片在线看| 人人九九精品| 欧美中文在线观看| 日韩理论电影中文字幕| 成人在线观看你懂的| 成人免费视频caoporn| 久久久一二三区| 日韩欧美中文字幕制服| a视频在线免费看| 3d蒂法精品啪啪一区二区免费| 欧美电影免费播放| 依人在线免费视频| 中文字幕一区在线观看视频| 中文字幕日韩经典| 色阁综合伊人av| 亚洲青青久久| 樱空桃在线播放| 成人一区二区三区| 欧美一二三区视频| 亚洲精品中文字幕有码专区| 芒果视频成人app| 日韩av在线电影观看| 日韩av一二三| 中文字幕亚洲欧美日韩| 日韩一级视频免费观看在线| 免费在线观看av电影| 国产精品久久久久久久久久久久冷| 黑人一区二区三区四区五区| 欧美深性狂猛ⅹxxx深喉| 欧美性20hd另类| 成av人电影在线观看| 91精品在线播放| 激情欧美亚洲| 在线观看福利片| 欧美午夜影院一区| 国产三区视频在线观看| 国产伦精品一区二区三区免费视频| 亚洲承认在线| 老牛影视av老牛影视av| 欧美日韩国产a| 神马午夜伦理不卡| 免费在线成人av| 国内精品国产成人| 国产精品99精品无码视| 亚洲人成电影在线播放| 欧美激情三区| www插插插无码视频网站| 久久久久久久久久久久久夜| 在线观看黄色网| 97热精品视频官网| 国产欧美日韩精品高清二区综合区| 午夜精品久久久久久久99热影院| 亚洲成人免费视频| aaa在线观看| 国产一区二区三区免费不卡| 日韩高清不卡在线| 国产av 一区二区三区| 日韩电影免费观看在线观看| 日韩毛片免费看| 国产h视频在线播放| 国产精品久久久久久久午夜片| 懂色av蜜臀av粉嫩av分享吧| 国产精品一区二区性色av | 精品72久久久久中文字幕| 国产农村妇女精品久久| 欧美视频在线观看免费网址| 黄色网址在线免费观看| 久久久久综合一区二区三区| 国产一区二区三区在线观看免费视频 | 黄色在线视频观看网站| 7777精品久久久大香线蕉小说| 久久亚洲不卡|