精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

論文解讀:迄今為止最好的 RAG 技術(shù)棧

發(fā)布于 2024-11-22 11:43
瀏覽
0收藏

概述

這篇文章深入探討了 Wang 等人在 2024 年的研究,旨在為構(gòu)建高效的檢索增強(qiáng)生成(RAG)系統(tǒng)提供最佳實(shí)踐建議。文章由 Towards AI 的聯(lián)合創(chuàng)始人兼 CTO Louis-Francois 撰寫,分析了 RAG 系統(tǒng)的核心組件與策略。

主要內(nèi)容摘要

  • 查詢分類:通過(guò)分類任務(wù)決定是否需要進(jìn)行檢索,確保系統(tǒng)只在必要時(shí)檢索外部數(shù)據(jù)。
  • 數(shù)據(jù)分塊:為數(shù)據(jù)選擇合適的塊大小至關(guān)重要,理想的塊大小在 256 至 512 個(gè) token 之間,有助于減少噪音和提高效率。
  • 元數(shù)據(jù)與混合搜索:元數(shù)據(jù)(如標(biāo)題或關(guān)鍵詞)與混合搜索(結(jié)合語(yǔ)義搜索和傳統(tǒng)關(guān)鍵詞搜索 BM25)可顯著提升檢索精度。
  • 嵌入模型選擇:挑選適合的嵌入模型,文章推薦使用像 FlagEmbedding 這樣性能與效率均衡的模型。
  • 向量數(shù)據(jù)庫(kù):使用像 Milvus 這樣的高性能向量數(shù)據(jù)庫(kù)來(lái)處理大量檢索請(qǐng)求,確保系統(tǒng)的長(zhǎng)期穩(wěn)定性。
  • 查詢轉(zhuǎn)換:在檢索前進(jìn)行查詢轉(zhuǎn)換以提高準(zhǔn)確性,如通過(guò)查詢重寫或分解復(fù)雜問(wèn)題,改進(jìn)系統(tǒng)的檢索表現(xiàn)。
  • 重新排序與文檔打包:在文檔檢索后,通過(guò) reranking 技術(shù)提升結(jié)果的相關(guān)性,并進(jìn)行文檔重新打包,以優(yōu)化信息呈現(xiàn)。
  • 摘要:生成之前進(jìn)行文檔摘要,有助于去除冗余信息,降低生成成本。
  • 微調(diào)生成模型:通過(guò)對(duì)生成模型進(jìn)行微調(diào),提高模型處理復(fù)雜查詢和去除無(wú)關(guān)信息的能力。
  • 多模態(tài)檢索:整合多模態(tài)技術(shù)處理圖像查詢,并基于類似內(nèi)容進(jìn)行檢索,進(jìn)一步提高系統(tǒng)的響應(yīng)準(zhǔn)確性。

意見

  • Wang 等人的研究被認(rèn)為是 RAG 系統(tǒng)的“洞察金礦”。
  • 查詢分類對(duì)于確定何時(shí)需要檢索至關(guān)重要。
  • 數(shù)據(jù)的最佳塊大小介于 256 到 512 個(gè)令牌之間,但可能因數(shù)據(jù)集而異。
  • 元數(shù)據(jù)和混合搜索是高效檢索的首選,而不是 HyDE 等更復(fù)雜的方法。
  • 建議使用 FlagEmbedding 的 LLM,因?yàn)樗谛阅芎痛笮≈g取得了平衡。
  • Monot5 是最受歡迎的重新排名模型,因?yàn)樗谛阅芎托手g取得了平衡。
  • 建議以“相反”的順序重新打包文檔,以改進(jìn) LLM 的生成過(guò)程。
  • 像 Recomp 這樣的摘要工具對(duì)于減少提示長(zhǎng)度和成本很有價(jià)值。
  • 使用相關(guān)文檔和隨機(jī)文檔的混合來(lái)微調(diào)生成器有利于處理不相關(guān)的信息。
  • 多模態(tài)檢索是處理文本和圖像的系統(tǒng)的一個(gè)重要考慮因素。
  • 該論文承認(rèn)了未來(lái)研究的局限性和領(lǐng)域,例如獵犬和發(fā)電機(jī)的聯(lián)合訓(xùn)練。

探索每個(gè)組件

大家早上好!我是 Towards AI 的聯(lián)合創(chuàng)始人兼首席技術(shù)官 Louis-Francois,今天,我們正在深入研究可能是最好的檢索增強(qiáng)一代 (RAG) 技術(shù)棧——這要?dú)w功于 Wang 等人在 2024 年的一項(xiàng)出色研究。

這是構(gòu)建最佳 RAG 系統(tǒng)的見解金礦,我在這里為您分解它。

那么,是什么讓 RAG 系統(tǒng)真正成為頂級(jí)的系統(tǒng)呢?是組件,對(duì)吧?讓我們回顧一下最好的組件以及它們的工作原理,這樣您也可以使您的 RAG 系統(tǒng)成為頂級(jí)系統(tǒng)并獲得多模式獎(jiǎng)勵(lì)。

論文解讀:迄今為止最好的 RAG 技術(shù)棧-AI.x社區(qū)圖片

查詢分類

讓我們從 Query Classification

Wang 等人創(chuàng)建了 15 個(gè)任務(wù)類別,確定查詢是否提供了足夠的信息或是否需要檢索。他們訓(xùn)練了一個(gè)二元分類器來(lái)分隔任務(wù),在不需要檢索的地方標(biāo)記為“sufficient”,在需要檢索時(shí)標(biāo)記為“insufficient”。在此圖像中,黃色表示不需要,紅色表示去獲取一些文檔!

論文解讀:迄今為止最好的 RAG 技術(shù)棧-AI.x社區(qū)

分塊

接下來(lái):分塊。這里的挑戰(zhàn)是為您的數(shù)據(jù)找到完美的數(shù)據(jù)塊大小。太長(zhǎng)了?您會(huì)增加不必要的噪音和成本。太短了?你錯(cuò)過(guò)了上下文。

論文解讀:迄今為止最好的 RAG 技術(shù)棧-AI.x社區(qū)

Wang 等人發(fā)現(xiàn) 256 到 512 個(gè)標(biāo)記之間的塊大小效果最好。但請(qǐng)記住,這因數(shù)據(jù)而異 - 因此請(qǐng)務(wù)必運(yùn)行您的評(píng)估!專業(yè)提示:使用 small2big(從小塊開始進(jìn)行搜索,然后移動(dòng)到較大的塊進(jìn)行生成),或嘗試滑動(dòng)窗口以重疊塊之間的標(biāo)記。

元數(shù)據(jù)和混合搜索

利用您的元數(shù)據(jù)!添加標(biāo)題、關(guān)鍵字甚至假設(shè)問(wèn)題等內(nèi)容。將其與 Hybrid Search

HyDE(生成偽文檔以增強(qiáng)檢索)很酷,可以帶來(lái)更好的結(jié)果,但效率非常低。現(xiàn)在,堅(jiān)持使用 Hybrid Search——它取得了更好的平衡,尤其是在原型設(shè)計(jì)方面。

嵌入模型

選擇正確的 嵌入模型

你不想要打網(wǎng)球的足球鞋。

來(lái)自 FlagEmbedding 的 LLM 最適合這項(xiàng)研究——性能和大小的完美平衡。不太大,也不太小——恰到好處。

請(qǐng)注意,他們只測(cè)試了開源模型,因此 Cohere 和 OpenAI 被淘汰出局。否則,Cohere 可能是您最好的選擇。

矢量數(shù)據(jù)庫(kù)

論文解讀:迄今為止最好的 RAG 技術(shù)棧-AI.x社區(qū)

現(xiàn)在是數(shù)據(jù)庫(kù)。對(duì)于長(zhǎng)期使用,Milvus

查詢轉(zhuǎn)換

在檢索之前,您必須 轉(zhuǎn)換 這些用戶查詢!無(wú)論是通過(guò) 查詢重寫 以使其清晰,還是通過(guò)查詢 分解 將復(fù)雜問(wèn)題分解為更小的問(wèn)題并檢索每個(gè)子問(wèn)題,甚至生成偽文檔(如 HyDE

重新排名

現(xiàn)在我們來(lái)談?wù)? Reranking

在這項(xiàng)研究中,monoT5 脫穎而出,成為平衡性能和效率的最佳選擇。它微調(diào) T5 模型,以根據(jù)文檔與查詢的相關(guān)性對(duì)文檔重新排序,確保最佳匹配優(yōu)先。 RankLLaMA  總體性能最好,但 TILDEv2

論文解讀:迄今為止最好的 RAG 技術(shù)棧-AI.x社區(qū)

文檔重新打包

重新排名后,您需要進(jìn)行一些 Document Repacking

綜述


然后,在調(diào)用 LLM,您希望使用 Summarization

使用 Recomp

微調(diào)生成器

論文解讀:迄今為止最好的 RAG 技術(shù)棧-AI.x社區(qū)

最后,您是否應(yīng)該微調(diào)用于生成的 LLM?絕對(duì)!使用相關(guān)文檔和隨機(jī)文檔的混合進(jìn)行微調(diào)可以提高生成器處理不相關(guān)信息的能力。它使模型更加健壯,并有助于它給出更好的整體響應(yīng)。論文中沒有提供確切的比率,但結(jié)果很明確:微調(diào)是值得的!不過(guò),這顯然也取決于您的域。

多模態(tài)

論文解讀:迄今為止最好的 RAG 技術(shù)棧-AI.x社區(qū)

處理圖像?實(shí)施多模式檢索。對(duì)于文本到圖像,在數(shù)據(jù)庫(kù)中查詢相似圖像可以加快該過(guò)程。在圖像到文本中,匹配相似的圖像可檢索準(zhǔn)確的預(yù)存儲(chǔ)字幕。這一切都與接地氣有關(guān)——檢索真實(shí)的、經(jīng)過(guò)驗(yàn)證的信息。

結(jié)論

簡(jiǎn)而言之,Wang 等人的這篇論文為我們提供了一個(gè)構(gòu)建高效 RAG 系統(tǒng)的堅(jiān)實(shí)藍(lán)圖。但請(qǐng)記住,這只是一篇論文,并未涵蓋 RAG 管道的各個(gè)方面。例如,獵犬和發(fā)電機(jī)的聯(lián)合訓(xùn)練沒有被探索,這可能會(huì)釋放更多的潛力。由于成本原因,他們也沒有深入研究分塊技術(shù),但這是一個(gè)值得探索的方向。

我強(qiáng)烈建議您查看完整的論文以獲取更多信息。我們最近還出版了《Building LLMs for Production》一書,其中充滿了 RAG 和微調(diào)見解、技巧和實(shí)際示例,可幫助您構(gòu)建和改進(jìn)基于 LLM 的系統(tǒng)。該鏈接也位于下面的實(shí)體書和電子書版本的描述中。

一如既往,感謝您的閱讀。如果您覺得此分析有幫助或有任何評(píng)論,請(qǐng)?jiān)谙旅娴脑u(píng)論中告訴我,我們下次見!

引用

用于生產(chǎn)的構(gòu)建LLMs:https://amzn.to/4bqYU9b

Wang et al., 2024 (論文參考):https://arxiv.org/abs/2407.01219

LLM(嵌入模型):https://github.com/FlagOpen/FlagEmbedding/tree/master/FlagEmbedding/llm_embedder

Milvus (vector database):https://milvus.io/

Liu et al., 2024 (文檔重新包裝): https://arxiv.org/abs/2307.03172

Recomp (摘要工具):https://github.com/carriex/recomp

RagLlmFine Tuning人工智能嵌入

本文轉(zhuǎn)載自 ??AI大模型世界??,作者: Louis-Francois

收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
在线观看久久久久久| 亚洲一区二区三区激情| 国产欧美va欧美va香蕉在线| 亚洲精品久久久久久国| 久久久久久亚洲精品美女| 亚洲国产精品嫩草影院| 日韩一区二区电影在线观看| 国产高清免费观看| 久久久久一区| 欧美成人一区在线| 伊人网伊人影院| 国产在线一区不卡| 91极品美女在线| 精品免费久久久久久久| av中文字幕在线| 丁香另类激情小说| 国产欧美亚洲精品| 91精品国产综合久久久蜜臀九色| 欧美精选视频在线观看| 精品国产伦一区二区三区观看体验 | 人妻精品无码一区二区| 老司机午夜精品99久久| 57pao精品| 免费中文字幕视频| 日韩在线二区| 亚洲无av在线中文字幕| 99热超碰在线| 视频一区日韩| 538prom精品视频线放| 亚洲免费av一区二区三区| 在线观看a级片| 加勒比av一区二区| 亚洲精品之草原avav久久| 老司机久久精品| 暖暖成人免费视频| 黄色成人av网| 国产美女永久无遮挡| 欧美69xxxx| 欧美国产一区二区| 欧美专区一二三| 午夜影院免费视频| 波多野结衣91| 精品麻豆av| 亚洲av无码一区二区三区性色| 久久精品国产免费| 国产日韩欧美自拍| 亚洲一级黄色大片| 蜜臀a∨国产成人精品| 国产成人综合亚洲| 国产又粗又猛又爽又| 噜噜噜91成人网| 91黄色小网站| 欧美亚洲国产成人精品| www.涩涩爱| 成人在线免费观看网站| 亚洲天堂视频在线观看| 好吊日免费视频| 久久av资源| 一本大道亚洲视频| 亚洲高潮女人毛茸茸| 精品国产一区二区三区四区| 亚洲欧美日韩精品久久亚洲区 | 亚洲福利视频免费观看| 久久久久无码国产精品一区李宗瑞| 精品视频在线一区| 精品国产乱码久久久久久图片| 国产裸体视频网站| 亚洲一区二区三区免费| 精品av久久707| 日本xxxx裸体xxxx| 精品久久影视| 久久伊人精品视频| 人人干人人干人人干| 久久国产日韩| 国产欧美日韩精品在线观看 | 激情综合亚洲精品| 成人免费视频网站| 日本国产在线| 国产精品天干天干在线综合| 激情五月五月婷婷| 好看的中文字幕在线播放| 精品国产91久久久久久| 99免费视频观看| av在线成人| 亚洲精品国产精品自产a区红杏吧| 一本加勒比北条麻妃| 四虎8848精品成人免费网站| 欧美激情精品久久久久| 欧美性猛交bbbbb精品| 久久精品国产色蜜蜜麻豆| 国产精品三区在线| a天堂中文在线88| 午夜久久久影院| www.日本一区| 美女网站色精品尤物极品姐弟| 国产一区二区三区网站| 亚洲国产成人精品综合99| 视频一区二区三区在线| 亚洲mm色国产网站| 亚洲日本香蕉视频| 亚洲男女毛片无遮挡| 人妻熟女一二三区夜夜爱| 国产美女视频一区二区| 91人人澡人人爽人人精品| 男人天堂网在线| 亚洲另类色综合网站| 男人操女人免费软件| 日本午夜精品久久久久| 精品亚洲aⅴ在线观看| 在线观看黄网址| 乱码第一页成人| 欧美男男激情freegay| 首页亚洲欧美制服丝腿| 91蜜桃网站免费观看| 国产一区二区影视| 亚洲福利视频三区| 在线观看视频在线观看| 欧美日韩一区二区综合| 97视频国产在线| 99riav国产| 国产精品妹子av| 国产免费一区二区三区视频| 一区二区三区四区精品视频| 在线视频国产日韩| 国产情侣自拍av| 国产福利精品一区二区| 在线观看欧美亚洲| 国产精品久久亚洲不卡| 亚洲免费电影一区| 三级黄色在线视频| 成人免费福利片| 50度灰在线观看| 精品国产亚洲一区二区在线观看| 在线视频中文亚洲| 懂色av中文字幕| 久久影音资源网| 欧美日韩亚洲一| 老牛精品亚洲成av人片| 久久久久亚洲精品国产| 亚洲国产综合网| 亚洲精品中文在线观看| 男女视频在线观看网站| 一本到12不卡视频在线dvd| 国产日本欧美在线观看| 免费高清完整在线观看| 欧美精品自拍偷拍| 女性裸体视频网站| 精品写真视频在线观看| 日本三级福利片| 99精品女人在线观看免费视频| 中文字幕久热精品视频在线| 亚洲天堂视频在线| 国产精品国产三级国产aⅴ原创| 黄色手机在线视频| 偷偷www综合久久久久久久| 91在线精品视频| 亚洲天堂中文字幕| 国产一区二区三区奇米久涩| 日韩精品分区| 精品国产乱码久久久久久图片| 久久婷婷国产麻豆91| 91美女片黄在线观看游戏| r级无码视频在线观看| 日韩高清在线观看一区二区| 欧美成人精品三级在线观看| 精品国产av一区二区| 亚洲一区二区偷拍精品| 精品熟女一区二区三区| 国产农村妇女毛片精品久久莱园子 | 91传媒视频在线观看| 污视频在线免费观看网站| 亚洲成人黄色在线| 日韩免费av网站| 国产精品福利一区| xxxx国产视频| 亚洲男女自偷自拍| 天堂社区 天堂综合网 天堂资源最新版| 嫩草伊人久久精品少妇av杨幂| 久久国内精品一国内精品| 99在线观看精品视频| 五月婷婷欧美视频| 一级在线观看视频| 国产成人一级电影| 欧美黑人又粗又大又爽免费| 91精品国产乱码久久久久久| 国产精品成人一区二区三区| 日韩性xxx| 美女扒开尿口让男人操亚洲视频网站| 欧美一级做性受免费大片免费| 色香色香欲天天天影视综合网| 男人晚上看的视频| 99久精品国产| 亚洲一级片av| 免费久久99精品国产自在现线| 91制片厂免费观看| 中文字幕伦av一区二区邻居| 成人性生交大片免费观看嘿嘿视频 | 午夜老司机福利| 91黄色免费看| 国产真实夫妇交换视频| 欧美国产在线观看| 网站免费在线观看| 国产一区二区不卡在线| 成人中文字幕av| 亚洲免费播放| 国产精品一区在线免费观看| 精品高清在线| 国产中文一区二区| 国产一区二区三区| 国产精品久久久久免费a∨大胸| 狂野欧美激情性xxxx欧美| 色妞久久福利网| 日本福利在线观看| 亚洲国产精品小视频| 99国产精品99| 欧美三级视频在线| 极品国产91在线网站| 亚洲成人自拍网| 妺妺窝人体色www在线下载| 国产精品久久免费看| 波多野结衣办公室33分钟| 国产成人高清视频| 无套内谢丰满少妇中文字幕| 日韩国产欧美在线观看| 国产欧美高清在线| 亚洲欧美日韩国产综合精品二区| 97av中文字幕| 欧美精品入口| 男女裸体影院高潮| 综合在线视频| 日韩人妻精品一区二区三区| 日韩成人三级| 亚洲国产一区在线| 欧美一级精品| 日韩精品资源| 精品一区二区三区中文字幕老牛 | 国产精品久久观看| 亚洲美女搞黄| 国产欧美日韩精品一区二区免费| 久久久com| 一本色道久久综合狠狠躁的番外| 精品蜜桃一区二区三区| 色婷婷久久久| 蜜桃视频在线观看91| 中文字幕av一区二区三区人| 欧美久久久久久一卡四| 色综合中文网| 亚洲国产精品日韩| 99久久精品费精品国产| 色呦呦网站入口| 亚洲综合色站| 欧美性潮喷xxxxx免费视频看| 亚洲小说欧美另类婷婷| 日韩免费视频播放| 久久综合伊人| 色呦色呦色精品| 国产精品亚洲第一 | 国产日韩欧美电影| а天堂中文在线资源| 综合久久一区二区三区| 日本一级二级视频| 亚洲电影第三页| 国产成人精品777777| 欧美怡红院视频| 97免费观看视频| 精品欧美久久久| 欧美在线观看在线观看| 综合激情国产一区| 四虎影院观看视频在线观看 | 99久久久久免费精品国产| 99久久人妻无码中文字幕系列| 久久久亚洲精品石原莉奈| 91动漫免费网站| 一区二区三区四区激情| 99热只有这里有精品| 欧美三级一区二区| 国精产品一品二品国精品69xx| 亚洲国内高清视频| av影片免费在线观看| 欧美激情18p| 欧美黑人一区| 97人人模人人爽人人喊38tv| 欧美久久精品| 亚洲永久激情精品| 亚洲国产国产亚洲一二三| 日本va中文字幕| 国产精品18久久久久久久久| 性欧美13一14内谢| 一区二区三区在线视频免费观看 | heyzo在线播放| 国产精品日韩一区| 国产精品白丝av嫩草影院| 色综合久久av| 91久久亚洲| 91欧美一区二区三区| 久久久久国产精品麻豆| 破处女黄色一级片| 日本韩国精品在线| 色wwwwww| 久久久精品视频在线观看| 欧美xxxhd| av成人观看| 色狮一区二区三区四区视频| 免费看一级大黄情大片| 国产综合久久久久影院| 性欧美13一14内谢| 亚洲成人福利片| 99热这里只有精品3| 在线观看日韩专区| 亚洲欧美se| 国内精品一区二区| 伊人成综合网| 亚洲久久中文字幕| 国产午夜精品久久久久久免费视 | 免费成人在线电影| 懂色av一区二区三区在线播放| 欧美电影《睫毛膏》| 国产精品第12页| 99精品桃花视频在线观看| 欧美成人aaa片一区国产精品| 欧美日韩一区二区三区高清 | 91色国产在线| 久久亚洲免费视频| 午夜毛片在线观看| 日韩黄色在线免费观看| 91视频欧美| 国产精品乱码| 综合天天久久| av影片在线播放| 亚洲综合一区二区精品导航| 国产乱码一区二区| 久久精品国产欧美激情| 欧美成人aaa| 亚洲午夜精品久久久中文影院av | 人妻少妇一区二区| 日韩欧美一区二区三区| 日漫免费在线观看网站| 韩日精品中文字幕| 欧美18xxxx| 免费在线观看亚洲视频| 99re66热这里只有精品3直播| 国产精品theporn动漫| 亚洲成年网站在线观看| av在线中出| 久久av一区二区| 久久成人免费| 女人黄色一级片| 欧美人体做爰大胆视频| 免费黄网站在线| 亚洲伊人一本大道中文字幕| 女主播福利一区| 久久免费精品国产| 狠狠色噜噜狠狠狠狠97| 蜜桃免费在线| 国产美女精彩久久| 99久久久国产精品美女| 黑人无套内谢中国美女| 亚洲一区自拍偷拍| 午夜黄色小视频| 国产99久久精品一区二区| 欧美成人激情| 第一页在线视频| 欧美午夜www高清视频| 岛国最新视频免费在线观看| 国产在线视频2019最新视频| 在线精品小视频| 国产 xxxx| 欧美亚洲动漫制服丝袜| 菠萝菠萝蜜在线视频免费观看| 成人av男人的天堂| 裸体一区二区| 中文字幕观看av| 亚洲国产精品va在线观看黑人| 亚洲精品一区| 免费观看中文字幕| 99精品视频免费在线观看| 中文字幕人妻丝袜乱一区三区| 久久夜色撩人精品| 亚洲图片久久| 亚洲视频在线不卡| 色综合一个色综合| a级在线观看| 日本精品视频一区| 国产精品伊人色| 日本视频免费观看| 欧美日韩成人在线观看| 视频一区在线观看| 4438x全国最大成人| 在线观看视频一区| 久草成色在线| 亚洲综合欧美日韩| 97久久精品人人做人人爽| 国产又粗又猛又黄又爽无遮挡 | 国产精品99精品一区二区三区∴| 国产精品av免费观看| 久久久99精品久久| 亚洲av无码片一区二区三区| 国产精品久久久久久av下载红粉| 好看的日韩av电影| 永久免费看片直接|