精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

關(guān)于RAG應(yīng)用中怎么高質(zhì)量的進(jìn)行數(shù)據(jù)召回——召回策略的研究 原創(chuàng)

發(fā)布于 2025-4-29 09:35
瀏覽
0收藏

“ 數(shù)據(jù)召回是RAG技術(shù)的重要領(lǐng)域,而不同的召回策略甚至?xí)a(chǎn)生完全不同的效果。”

RAG技術(shù)的核心原理很簡(jiǎn)單,本質(zhì)上就是在外部維護(hù)一個(gè)資料庫(kù),在進(jìn)行大模型問(wèn)答之前,先從資料庫(kù)中找到相關(guān)的內(nèi)容,然后一起輸入到大模型中。

但由于文檔的復(fù)雜性,在進(jìn)行文檔處理時(shí)很難真正做到高質(zhì)量的數(shù)據(jù)處理;因此,在做數(shù)據(jù)召回時(shí)就會(huì)面臨著各種各樣的問(wèn)題。

所以,怎么進(jìn)行高質(zhì)量的數(shù)據(jù)召回,就成為RAG必須要研究的一個(gè)課題;而今天,我們就來(lái)簡(jiǎn)單介紹一下常見的幾種召回策略。

關(guān)于RAG應(yīng)用中怎么高質(zhì)量的進(jìn)行數(shù)據(jù)召回——召回策略的研究-AI.x社區(qū)

召回策略

RAG的難點(diǎn)主要有兩個(gè),一個(gè)是前期的文檔處理;其次就是數(shù)據(jù)的召回;由于大模型本身無(wú)法分辨輸入到模型中的文檔質(zhì)量,因此關(guān)于數(shù)據(jù)的召回只能進(jìn)行人為的控制,而人為控制的方法只能通過(guò)技術(shù)手段來(lái)進(jìn)行約束。

因此,在不考慮前期文檔處理的情況下,RAG應(yīng)用中最重要的一點(diǎn)就是解決數(shù)據(jù)召回的問(wèn)題。

召回的本質(zhì)其實(shí)很簡(jiǎn)單,就是快速準(zhǔn)確地從外部資料庫(kù)中找到與問(wèn)題相關(guān)的數(shù)據(jù);比如說(shuō),用戶的問(wèn)題是怎么學(xué)習(xí)人工智能?

然后就需要從大量的外部數(shù)據(jù)中快速找到與人工智能相關(guān)的內(nèi)容,包括,書籍,視頻,論文等多種不同的形式。

舉例來(lái)說(shuō),以目前世界上現(xiàn)存的知識(shí)體系為例;涉及的領(lǐng)域沒(méi)有一千也有八百;而一個(gè)人不可能什么領(lǐng)域都能涉及,什么領(lǐng)域都懂;因此,如果有一個(gè)人想快速入門一個(gè)領(lǐng)域應(yīng)該怎么辦?

首先,他可以通過(guò)互聯(lián)網(wǎng)搜索任何他想從事的領(lǐng)域的內(nèi)容資料;但現(xiàn)在的問(wèn)題是,世界上的資料,文檔那么多,搜索引擎怎么知道怎么找到與之相關(guān)的數(shù)據(jù)?

這就是搜索引擎要解決的事情,而RAG需要解決的也是這個(gè)事情。

關(guān)于RAG應(yīng)用中怎么高質(zhì)量的進(jìn)行數(shù)據(jù)召回——召回策略的研究-AI.x社區(qū)

RAG是基于神經(jīng)網(wǎng)絡(luò)模型做的語(yǔ)義性檢索,因此其與傳統(tǒng)的字符匹配方式檢索有很大的區(qū)別,比較直觀的體現(xiàn)就是向量計(jì)算;因此基于RAG系統(tǒng)有專門的向量數(shù)據(jù)庫(kù)進(jìn)行向量檢索。

當(dāng)然,并不是說(shuō)RAG只能使用向量數(shù)據(jù)庫(kù),RAG的本質(zhì)是快速找到相關(guān)數(shù)據(jù),但RAG不會(huì)在意你的數(shù)據(jù)是使用向量數(shù)據(jù)庫(kù)存儲(chǔ)還是傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)存儲(chǔ)。也就是說(shuō)RAG和數(shù)據(jù)持久化是無(wú)關(guān)的,或者說(shuō)數(shù)據(jù)持久化只是RAG的一部分。

召回策略

關(guān)于RAG的召回策略有多種實(shí)現(xiàn)方式,最簡(jiǎn)單的就是基于傳統(tǒng)的字符匹配和搜索技術(shù),以及目前比較火的語(yǔ)義檢索方式——向量計(jì)算。

什么是語(yǔ)義檢索?

所謂的語(yǔ)義就是指,你不但要聽到我所說(shuō)的話,你還要能聽懂我所說(shuō)的意思。

比如說(shuō),問(wèn)你吃飯了嗎?這可能只是一種問(wèn)候語(yǔ),也可能是他想請(qǐng)你吃飯,順便聊聊天,在不同的環(huán)境下其語(yǔ)義是不同的。

RAG的主要召回策略有以下幾種:

  • 基于傳統(tǒng)的字符匹配和分詞檢索
  • 基于向量計(jì)算的語(yǔ)義檢索
  • 數(shù)據(jù)重排技術(shù)——Rerank
  • 問(wèn)題拆分技術(shù)
  • 多路召回

關(guān)于RAG應(yīng)用中怎么高質(zhì)量的進(jìn)行數(shù)據(jù)召回——召回策略的研究-AI.x社區(qū)



基于傳統(tǒng)的字符匹配和分詞檢索

在大模型出現(xiàn)之前,搜索引擎主要采用的就是字符匹配和分詞技術(shù);常見的技術(shù)載體就是關(guān)系型數(shù)據(jù)庫(kù)和ES這種分詞檢索工具。

在某些業(yè)務(wù)場(chǎng)景下,RAG依然會(huì)使用這些技術(shù),原因就在于其技術(shù)體系比較成熟,解決方案也比較完善,并且效果也不錯(cuò)。

基于向量計(jì)算的語(yǔ)義檢索

基于向量計(jì)算的語(yǔ)義檢索,常見的就是向量數(shù)據(jù)庫(kù)或者支持向量計(jì)算的傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù);其本質(zhì)是通過(guò)Embedding(嵌入)模型,把文本轉(zhuǎn)化成向量,然后通過(guò)歐式距離或余弦計(jì)算等方式,計(jì)算其相似度。

數(shù)據(jù)重排技術(shù)——Rerank

數(shù)據(jù)重排也是基于向量計(jì)算的一種方式,其原理是通過(guò)把第一步檢索到的結(jié)果通過(guò)重排技術(shù),找到其“分?jǐn)?shù)”也就是相似度最高的數(shù)據(jù)。

舉例來(lái)說(shuō),你搜索孫悟空,可能會(huì)得到很多與之相關(guān)的內(nèi)容,比如說(shuō)介紹四大名著的內(nèi)容,介紹三打白骨精的內(nèi)容,亦或者大鬧天宮的內(nèi)容;

而你想了解的可能只是大鬧天宮,或者三打白骨精,這時(shí)介紹四大名著的內(nèi)容可能就不需要了。

而通過(guò)重排序就可以實(shí)現(xiàn)召回?cái)?shù)據(jù)的二次篩選,達(dá)到更加精確的數(shù)據(jù)匹配。

關(guān)于RAG應(yīng)用中怎么高質(zhì)量的進(jìn)行數(shù)據(jù)召回——召回策略的研究-AI.x社區(qū)

問(wèn)題拆分技術(shù)

問(wèn)題拆分原理很簡(jiǎn)單,本質(zhì)上就是利用大模型來(lái)分析你的問(wèn)題,然后給出幾個(gè)相似的問(wèn)題;然后通過(guò)這幾個(gè)相似問(wèn)題去進(jìn)行召回,這樣就可以提高召回?cái)?shù)據(jù)的精度。

比如說(shuō),用戶問(wèn)題是我想去旅游,你有什么建議嗎? 

這時(shí)大模型就可以根據(jù)這個(gè)問(wèn)題幫你拆分幾個(gè)相似性的問(wèn)題;比如說(shuō),我想去一個(gè)風(fēng)景優(yōu)美的地方;我想找個(gè)地方放松一下心情;亦或者我想去看看祖國(guó)的大好河山。

通過(guò)問(wèn)題拆分的方式,用戶就可以得到多個(gè)相似性的問(wèn)題,這樣就可以從更多的維度去向量數(shù)據(jù)庫(kù)或者其它地方召回更多相關(guān)的問(wèn)題;之后再通過(guò)重排序技術(shù),來(lái)找到其中最相關(guān)的內(nèi)容。

多路召回

多路召回的原理也很簡(jiǎn)單,就是通過(guò)多種不同的策略,或者模型或渠道,檢索出多個(gè)與之相關(guān)的內(nèi)容;其有點(diǎn)類似于問(wèn)題拆分的思想,但區(qū)別是問(wèn)題拆分是從問(wèn)題入手,而多路召回是從檢索策略或檢索途徑入手。

舉一個(gè)比較形象的例子就是,如果你想了解某個(gè)行業(yè);你可以選擇從公網(wǎng)上查找數(shù)據(jù),也可以選擇找專門的行業(yè)論壇或社區(qū)了解內(nèi)容;還可以通過(guò)找專業(yè)人士交談來(lái)了解。

而這種通過(guò)多種不同的方式,以及不同的渠道進(jìn)行數(shù)據(jù)召回的方式就是多路召回。

關(guān)于RAG應(yīng)用中怎么高質(zhì)量的進(jìn)行數(shù)據(jù)召回——召回策略的研究-AI.x社區(qū)

當(dāng)然,召回技術(shù)并不僅僅只限于RAG領(lǐng)域,在傳統(tǒng)的搜索引擎領(lǐng)域,召回技術(shù)同樣扮演著重要角色;因此,RAG技術(shù)也同樣可以應(yīng)用于搜索引擎領(lǐng)域。

當(dāng)然,這里僅僅只是介紹一下簡(jiǎn)單的,比較常見的召回策略;在RAG的具體實(shí)踐中,在不同的場(chǎng)景下也會(huì)存在一些特殊的召回方式和策略;比如說(shuō)數(shù)據(jù)分類,建立索引等方式,以及知識(shí)圖譜等新型技術(shù)。

最重要的是,你要理解這些召回方式并不是互斥的;在很多場(chǎng)景下都是把這些策略進(jìn)行組合使用,以此達(dá)到更加精準(zhǔn)的召回質(zhì)量;特別是在大數(shù)據(jù)量的情況下,完全基于向量相似度計(jì)算的方式,其對(duì)算力和響應(yīng)的要求,是不被允許的。

因此,在大數(shù)據(jù)量的情況下,先進(jìn)行快速的非精確匹配,然后再進(jìn)行更加精確的相似度計(jì)算是一種常見的召回方式。


本文轉(zhuǎn)載自公眾號(hào)AI探索時(shí)代 作者:DFires

原文鏈接:??https://mp.weixin.qq.com/s/plrG1-UsjxygOazV7hNsPw??


?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
已于2025-4-29 15:49:58修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
男人日女人bb视频| 婷婷中文字幕一区| 亚洲国产日日夜夜| 国产精品免费看一区二区三区| 青娱乐在线视频免费观看| 精品网站aaa| 黄色成人av在线| 日韩欧美三级一区二区| 999精品国产| 一本综合精品| 久久精品精品电影网| 亚洲xxxx2d动漫1| 国产天堂在线播放视频| 韩国v欧美v亚洲v日本v| 91精品国产免费久久久久久| 人人妻人人澡人人爽| 欧美第一在线视频| 色欧美片视频在线观看在线视频| mm131午夜| 五月色婷婷综合| 老司机午夜精品| 欧美亚洲激情在线| 欧美精品成人久久| 91精品短视频| 欧美猛男男办公室激情| 国模无码视频一区二区三区| 超碰在线最新| 国产欧美一区二区精品秋霞影院| 国产福利一区二区三区在线观看| 99久久久久久久久| 在线观看日韩av电影| 久久九九全国免费精品观看| 亚洲av无码一区二区二三区| 99香蕉久久| 91麻豆精品国产91久久久久久| 免费在线观看毛片网站| 欧美极品少妇videossex| 中文字幕一区免费在线观看| 裸模一区二区三区免费| 嫩草影院一区二区| 国产盗摄一区二区三区| 成人免费观看a| 337p粉嫩色噜噜噜大肥臀| 国产精品视频| 美女黄色丝袜一区| 日韩av手机在线免费观看| 欧美一级精品| 一区二区福利视频| 国产aⅴ激情无码久久久无码| 欧美精品中文| 亚洲国产精品免费| yjizz视频| 日本在线一区二区三区| 91精品国产综合久久精品性色| 在线观看的毛片| 香蕉成人影院| 欧美午夜精品电影| 网站一区二区三区| 日韩福利影视| 欧美精品第一页| 91亚洲精品久久久蜜桃借种| 人人精品久久| 欧美一区二区三区日韩视频| 精品国产乱码久久久久久1区二区| 久久亚洲精品人成综合网| 欧美性大战久久| 99视频在线视频| 欧美黄色网络| 制服丝袜亚洲网站| 人妻巨大乳一二三区| 91成人福利| 日韩电影免费观看中文字幕| 一区二区不卡免费视频| 国产精品密蕾丝视频下载 | www国产无套内射com| 影音先锋在线播放| 亚洲国产日日夜夜| 成年人黄色片视频| 日韩成人综合网站| 精品国产一区二区三区久久久蜜月 | 成人动漫在线视频| 蜜桃av噜噜一区二区三区麻豆| 国产在线不卡一卡二卡三卡四卡| 99久久99久久精品国产片| 手机看片1024国产| 久久久久久久网| 日本一区二区三区免费看| 99精品老司机免费视频| 亚洲激情成人在线| 久久精品免费一区二区| 国产成人精选| 欧美一区二区三区系列电影| 手机在线成人av| 不卡视频在线| 欧美极品美女电影一区| 99精品在线播放| 精品一区二区三区久久久| 豆国产97在线| 狠狠v欧美ⅴ日韩v亚洲v大胸| 国产精品久久久久aaaa| h无码动漫在线观看| 我爱我色成人网| 日韩一区二区三区免费观看| 亚洲av无码国产精品久久| 天天射综合网视频| 青草热久免费精品视频| 中文字幕人妻一区二区三区视频| 日韩中文字幕不卡| 成人精品网站在线观看| 欧美一区二区视频| 伊人夜夜躁av伊人久久| 成年人在线观看视频免费| 日韩精品视频在线看| 777久久久精品| 亚洲av网址在线| 国产高清欧美| 日本sm极度另类视频| 成人av免费播放| 国产精品免费丝袜| 久久国产精品视频在线观看| 亚洲欧美在线人成swag| 亚洲欧美日韩图片| 中文字幕一区二区三区精品| 国产一区免费电影| 神马影院我不卡午夜| 久草在线视频福利| 欧美日韩国产一级| 亚洲专区区免费| 日韩亚洲国产欧美| av免费精品一区二区三区| 天堂资源在线中文| 欧美亚洲日本国产| 91中文字幕永久在线| 亚洲精品影院在线观看| 91精品在线观| 欧美性videos| 日韩欧美aⅴ综合网站发布| 成人做爰www看视频软件| 香蕉精品视频在线观看| 国产精品一区二区3区| 国产一区精品| 在线免费观看视频一区| 一本加勒比北条麻妃| 亚洲美女毛片| 999视频在线免费观看| 成人影欧美片| 91麻豆精品国产91久久久久| 秋霞欧美一区二区三区视频免费 | 一区二区在线免费观看| 九九九在线观看视频| 欧洲视频一区| 国产suv精品一区二区三区88区| 亚洲av成人无码网天堂| 性欧美疯狂xxxxbbbb| 天堂www中文在线资源| 狠狠爱成人网| 精品国产一区二区三区麻豆小说 | 色偷偷在线观看| 性感美女极品91精品| 亚洲香蕉中文网| 在线播放精品| 另类视频在线观看+1080p| 欧美动物xxx| 亚洲欧美国内爽妇网| aaa在线视频| 国产精品青草综合久久久久99| 国产第一页视频| gogogo高清在线观看一区二区| 国产精品美女无圣光视频| 理论视频在线| 欧美日韩国产首页| 欧美日韩在线国产| 成人av电影免费在线播放| 极品美女扒开粉嫩小泬| 国产欧美日韩一区二区三区四区 | 99亚洲男女激情在线观看| 久久天堂av综合合色| 亚洲高清视频网站| 日韩欧美精品网址| 扒开jk护士狂揉免费| 99精品热6080yy久久| 欧美一区二区视频17c| 亚洲青青久久| 97精品一区二区视频在线观看| 免费国产在线视频| 欧美一区二区三区免费大片| 久久久久久久久99| 久久蜜桃av一区精品变态类天堂| 国产一伦一伦一伦| 亚洲二区视频| 视频三区二区一区| 6080亚洲理论片在线观看| 日本精品久久中文字幕佐佐木| 亚洲精品承认| 亚洲第一视频在线观看| 五月婷婷激情视频| 亚洲免费观看高清完整 | 日本一区二区三区四区| 奇米777在线视频| 男女精品网站| 国产精品久久国产| 成人在线视频免费观看| 国产一区高清视频| 国产精品视频首页| 久久久免费精品| 一区二区三区视频在线观看视频| 制服丝袜中文字幕亚洲| 国产一级片免费视频| 国产精品毛片久久久久久| 中文字幕免费高清视频| 精品一区二区三区视频在线观看| 国产玉足脚交久久欧美| 91偷拍一区二区三区精品| 久久久久久久久久久久久久一区 | 成人综合色站| 人人玩人人添人人澡欧美| 日本伊人精品一区二区三区介绍| 毛片免费不卡| 中文字幕精品网| 人成免费电影一二三区在线观看| 日韩欧美中文一区| 中文字幕欧美人妻精品一区蜜臀| 五月综合激情日本mⅴ| a级黄色片免费看| 中文字幕在线一区免费| 亚洲码无人客一区二区三区| www.在线欧美| 日批视频在线看| 久久精品国产第一区二区三区| 欧美女人性生活视频| 尤物在线精品| 小泽玛利亚av在线| 一个色综合网| 亚洲国产日韩综合一区| 亚洲免费毛片| 成人资源视频网站免费| 最新国产精品精品视频| 国产日产久久高清欧美一区| 蜜桃视频www网站在线观看| 日韩一区二区久久久| av电影在线观看一区二区三区| 亚洲欧美中文字幕在线一区| 欧美日韩国产亚洲沙发| 日韩激情在线视频| 丰满肉嫩西川结衣av| 日韩一区二区视频| 99在线精品视频免费观看软件| 日韩欧美亚洲一二三区| 日韩成年人视频| 亚洲二区在线视频| 国产成人精品a视频一区| 一区二区三区美女视频| 国产一级大片在线观看| 亚洲成人动漫一区| 九一国产在线观看| 亚洲二区在线视频| 国产精品7777777| 亚洲午夜私人影院| 天天操天天摸天天干| 亚洲国产aⅴ天堂久久| 天堂网一区二区三区| 色综合久久66| 中文字幕男人天堂| 欧美一区二区三区在线电影| 亚洲精品网站在线| 精品99一区二区三区| 亚洲色图 校园春色| 精品偷拍各种wc美女嘘嘘| 高清av在线| 精品国产视频在线| 啦啦啦中文在线观看日本| 国外色69视频在线观看| 女同一区二区免费aⅴ| 国内成人精品一区| 欧美大片1688网站| 91久久国产精品91久久性色| 成人性生交大片免费看96| 精品久久精品久久| 欧美日韩激情| 中文字幕日韩精品无码内射| 欧美99久久| 国产淫片免费看| 美女在线一区二区| 亚洲 国产 图片| 成人一区二区三区视频| 在线视频 日韩| 国产精品久久久久婷婷二区次| 天堂网av2018| 精品久久久久人成| 国产精品免费无遮挡| 亚洲精品久久久久中文字幕二区| 国产片在线观看| 欧美极品xxxx| 欧美aaa级| 美女一区视频| 在线电影一区二区| 黑人糟蹋人妻hd中文字幕| 久久成人av少妇免费| 伊人网综合视频| 国产亚洲欧美中文| 国产精品1234区| 欧美日韩精品一区视频| 黄色小视频免费观看| 日韩在线观看免费高清完整版| 欧美人与性动交α欧美精品济南到 | 鲁丝一区鲁丝二区鲁丝三区| 中文字幕免费精品| 免费看污污网站| 99免费精品在线| 久久国产精品国语对白| 在线观看日韩av先锋影音电影院| 亚洲精品国产一区二| 中文字幕一区二区三区电影| 中文字幕色婷婷在线视频| 999视频在线观看| 午夜影院欧美| 男人的天堂99| 成人动漫av在线| 欧美交换国产一区内射| 欧美日韩综合不卡| 婷婷五月综合久久中文字幕| 久久成人亚洲精品| 男人亚洲天堂| 亚洲人成网站在线播放2019| 久久久久久久高潮| 中文字幕在线观看网址| 亚洲国产日韩在线一区模特| 99热这里只有精品66| 色妞久久福利网| 91另类视频| 日韩中文字幕av在线| 亚洲成人中文| 污污免费在线观看| 夜夜揉揉日日人人青青一国产精品| 亚洲永久精品视频| 伊人久久大香线蕉av一区二区| 91av亚洲| 免费看污久久久| 久久国产高清| 人妻大战黑人白浆狂泄| 一本一本久久a久久精品综合麻豆 一本一道波多野结衣一区二区 | 欧美色图片你懂的| 成人在线观看网站| 欧美性一区二区三区| 欧州一区二区三区| 亚洲午夜精品福利| 久久久久看片| 精品人妻无码一区| 在线观看免费视频综合| 99se视频在线观看| 成人免费在线网址| 综合日韩在线| 日本一区二区免费视频| 国产精品成人一区二区三区夜夜夜 | 国产一区二区三区不卡在线| 国产不卡一区二区在线播放| 国产精品一区二区av日韩在线 | 裸体武打性艳史| 日韩丝袜美女视频| av在线理伦电影| 久久伊人资源站| 秋霞国产午夜精品免费视频| 成年人网站在线观看视频| 欧美一级艳片视频免费观看| 久久香蕉av| 欧美一区观看| 紧缚捆绑精品一区二区| 久久久久亚洲av无码专区体验| 精品国产成人系列| 国产在线观看黄色| 一区二区三区精品| 国产综合视频在线| 国产成人精品aa毛片| 人妻无码久久一区二区三区免费| 99久久综合精品| 日韩美女黄色片| 亚洲男人的天堂在线播放| 国产成人毛片| 亚洲理论电影在线观看| 久久综合国产精品| 在线观看免费中文字幕| 国产偷亚洲偷欧美偷精品| av丝袜在线| 水蜜桃亚洲精品| 男男视频亚洲欧美| 国产在线免费视频| 国产亚洲精品美女久久久| 亚洲视频自拍| 少妇无码av无码专区在线观看| 欧美国产视频在线| 亚洲精品.www| 国产精品免费一区豆花| 欧美日韩亚洲一区三区| 国产肥白大熟妇bbbb视频| 日韩亚洲欧美成人一区| 奇米777日韩| 免费看日本黄色| 国产视频不卡一区| 精品亚洲aⅴ无码一区二区三区| 欧美亚洲免费在线一区|