精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

盤(pán)點(diǎn)RAG中最容易犯的五個(gè)錯(cuò)誤

人工智能
基于向量的檢索無(wú)疑是 RAG 成功的重要因素。向量嵌入非常適合映射文本的語(yǔ)義含義。它們也適用于不同大小的文本。你的查詢(xún)可能是一句話(huà),但你的文檔存儲(chǔ)包含整頁(yè)文章?——向量搜索可以處理。

我大部分時(shí)間都在構(gòu)建和改進(jìn) Retrieval-Augmented Generation (RAG) 應(yīng)用。

我相信 RAG 可能是最受歡迎的 AI 應(yīng)用之一。它無(wú)處不在,從聊天機(jī)器人到文檔摘要。

圖片圖片

我也相信,由于各種原因,許多 RAG 應(yīng)用最終未能部署,其中很多并非技術(shù)原因。然而,我希望自己早知道一些技術(shù)方面的知識(shí),以創(chuàng)建更有效的 RAG。

但這就是我們學(xué)習(xí)新事物的方式。沒(méi)有比構(gòu)建并失敗更好的工程學(xué)習(xí)方法了。

從我的失敗中,我學(xué)到了一些寶貴的經(jīng)驗(yàn)教訓(xùn),這些經(jīng)驗(yàn)對(duì)首次構(gòu)建 RAG 的人很有幫助。你不必重復(fù)我犯過(guò)的錯(cuò)誤,這樣你就能更快前進(jìn)。

那么,讓我們談?wù)劦谝粋€(gè)錯(cuò)誤。

向量數(shù)據(jù)庫(kù)并非硬性規(guī)定

幾乎所有關(guān)于 RAG 的網(wǎng)絡(luò)教程都使用向量數(shù)據(jù)庫(kù)。如果你搜索過(guò) RAG 相關(guān)內(nèi)容,你會(huì)明白我的意思。

基于向量的檢索無(wú)疑是 RAG 成功的重要因素。向量嵌入非常適合映射文本的語(yǔ)義含義。它們也適用于不同大小的文本。你的查詢(xún)可能是一句話(huà),但你的文檔存儲(chǔ)包含整頁(yè)文章?——向量搜索可以處理。

然而,檢索并不僅限于基于向量的檢索。

RAG 可以從互聯(lián)網(wǎng)、關(guān)系數(shù)據(jù)庫(kù)、Neo4J 中的知識(shí)圖譜或三者的組合中檢索信息。

在許多情況下,我注意到混合方法能帶來(lái)更好的性能。

對(duì)于通用應(yīng)用,你可以使用向量數(shù)據(jù)庫(kù),但當(dāng)向量數(shù)據(jù)庫(kù)中沒(méi)有所需信息時(shí),你可以搜索互聯(lián)網(wǎng)。

對(duì)于客戶(hù)聊天機(jī)器人,你可能需要讓 RAG 訪問(wèn)部分客戶(hù)數(shù)據(jù)庫(kù),這可以是關(guān)系數(shù)據(jù)庫(kù)。

企業(yè)的知識(shí)管理系統(tǒng)可能會(huì)創(chuàng)建一個(gè)知識(shí)圖譜,并從中檢索信息,而不是使用向量數(shù)據(jù)庫(kù)。

這些都是 RAG 的定義。

然而,選擇數(shù)據(jù)源的過(guò)程并非直截了當(dāng)。你需要嘗試各種選項(xiàng),了解每種方法的優(yōu)點(diǎn)。接受或拒絕一個(gè)想法的理由可能受技術(shù)和業(yè)務(wù)因素的影響。

例如,你可以為每個(gè)客戶(hù)簡(jiǎn)介信息創(chuàng)建文本版本并進(jìn)行向量化以供檢索。這對(duì)于查詢(xún)來(lái)說(shuō)可能很高效,因?yàn)槟阒惶幚硪粋€(gè)數(shù)據(jù)庫(kù)。但它的準(zhǔn)確性可能不如運(yùn)行 SQL 查詢(xún)。這是技術(shù)原因。

然而,讓 LLM 運(yùn)行 SQL 查詢(xún)可能導(dǎo)致 SQL 注入攻擊。這是技術(shù)和業(yè)務(wù)上的問(wèn)題。

向量數(shù)據(jù)庫(kù)在語(yǔ)義檢索方面也很高效。但這并不意味著其他數(shù)據(jù)庫(kù)不能處理語(yǔ)義檢索;幾乎所有其他數(shù)據(jù)庫(kù)都可以進(jìn)行向量搜索。

因此,如果你決定在 RAG 中使用某種形式的向量嵌入,這里還有一個(gè)建議。

優(yōu)先選擇經(jīng)過(guò)微調(diào)的小模型

嵌入模型可以將任何內(nèi)容轉(zhuǎn)化為向量形式。大型模型的性能通常優(yōu)于小型模型。

但這并不意味著越大越好。

別管模型大小。所有模型都在公開(kāi)數(shù)據(jù)集上訓(xùn)練。它們能區(qū)分“蘋(píng)果”水果和“蘋(píng)果”品牌。但如果你和朋友用“蘋(píng)果”作為暗號(hào),嵌入模型無(wú)法知道。

然而,我們創(chuàng)建的幾乎所有應(yīng)用都專(zhuān)注于一個(gè)小的細(xì)分領(lǐng)域。

對(duì)于這些應(yīng)用,大型模型的收益是微不足道的。

這里有一個(gè)不同的做法。

為你的領(lǐng)域數(shù)據(jù)創(chuàng)建一個(gè)數(shù)據(jù)集,并對(duì)小型嵌入模型進(jìn)行微調(diào)。

小型模型足以捕捉語(yǔ)言細(xì)微差別,但可能無(wú)法理解在不同語(yǔ)境中有特殊含義的詞。

但仔細(xì)想想,你的模型為什么需要理解木星的衛(wèi)星?

小型模型更高效。它們速度快,成本低。

為了彌補(bǔ)模型在領(lǐng)域知識(shí)方面的不足,你可以對(duì)其進(jìn)行微調(diào)。

這兩個(gè)建議可以?xún)?yōu)化索引部分以實(shí)現(xiàn)高效檢索。然而,檢索過(guò)程也可以進(jìn)一步優(yōu)化。

檢索過(guò)程可以更高級(jí)

最直接的檢索過(guò)程是直接查詢(xún)。

如果你使用向量數(shù)據(jù)庫(kù),可以對(duì)用戶(hù)輸入進(jìn)行語(yǔ)義搜索。否則,你可以使用 LLM 生成 SQL 或 Cipher 查詢(xún)。

必要時(shí)你還可以調(diào)用 HTTP 端點(diǎn)。

但直接查詢(xún)方法很少能產(chǎn)生可靠的上下文。

你可以以更高級(jí)的方式查詢(xún)數(shù)據(jù)源。例如,你可以嘗試查詢(xún)路由技術(shù)來(lái)決定從哪個(gè)數(shù)據(jù)源獲取數(shù)據(jù)。具有良好推理能力的 LLM 可以用于此目的。你還可以在小型模型上進(jìn)行指令微調(diào),以節(jié)省成本并降低延遲。

另一種技術(shù)是鏈?zhǔn)秸?qǐng)求。對(duì)于初始查詢(xún),我們可以從數(shù)據(jù)源獲取信息。然后,根據(jù)獲取的文檔,我們可以獲取后續(xù)文檔。

分塊是 RAG 中最具挑戰(zhàn)性且至關(guān)重要的部分

當(dāng)上下文包含無(wú)關(guān)信息時(shí),LLM 容易出現(xiàn)幻覺(jué)。

防止 RAG 幻覺(jué)的最佳方法是分塊。

現(xiàn)代 LLM 可能支持更長(zhǎng)的上下文長(zhǎng)度。例如,Gemini 2.5 Pro 支持高達(dá) 200 萬(wàn)個(gè) token,足以容納兩到三本大學(xué)級(jí)別的物理教科書(shū)。

但對(duì)于基礎(chǔ)力學(xué)問(wèn)題,你很少需要量子物理的上下文信息。

如果你將教科書(shū)分解成較小的部分,可能每個(gè)部分只討論一個(gè)主題,你就能只獲取回答問(wèn)題所需的相關(guān)信息。

這里的挑戰(zhàn)在于分塊技術(shù)有很多種。每種技術(shù)都有其優(yōu)缺點(diǎn)。適合你領(lǐng)域的技術(shù)可能不適用于其他領(lǐng)域。

遞歸字符分塊可能是最簡(jiǎn)單的,也是我的默認(rèn)選擇。然而,它假設(shè)文本中每個(gè)主題的討論長(zhǎng)度相等,這很少是事實(shí)。盡管如此,這是最好的起點(diǎn)。

圖片圖片

你甚至可以嘗試主題聚類(lèi)和代理分塊。

嘗試重新排序

最后但同樣重要的是,重新排序。

事實(shí)證明,相關(guān)分塊的位置是高質(zhì)量 LLM 響應(yīng)的關(guān)鍵因素。

然而,常規(guī)向量搜索甚至數(shù)據(jù)庫(kù)查詢(xún)的排序方式并不智能。LLM 可以做到。

因此,我們使用專(zhuān)門(mén)的大型語(yǔ)言模型 (LLM) 作為重新排序器,重新排列獲取的上下文并進(jìn)一步過(guò)濾,找出最相關(guān)的分塊。

這種二級(jí)重新排序在某些應(yīng)用中有幫助,但在其他應(yīng)用中未必。但你可以使用一些技術(shù)來(lái)改進(jìn)重新排序的結(jié)果。

其中之一是獲取大量初始結(jié)果。寬松定義初始標(biāo)準(zhǔn)會(huì)拉取一些無(wú)關(guān)上下文,但會(huì)增加獲取正確內(nèi)容的概率。

圖片圖片

重新排序器現(xiàn)在可以處理這個(gè)大型集合并過(guò)濾出更相關(guān)的部分。

最終思考

構(gòu)建 RAG 已成為任何 LLM 應(yīng)用的必備。即使是 200 萬(wàn) token 的上下文窗口也無(wú)法挑戰(zhàn)它。

我們開(kāi)發(fā)的原型通常未能部署。部分原因歸于業(yè)務(wù)決策,但也有可以解決的技術(shù)原因。

本文是我在構(gòu)建 RAG 方面的經(jīng)驗(yàn)總結(jié)。

雖然這不是一個(gè)全面的列表,但考慮這五個(gè)方面將確保你開(kāi)發(fā)出更持久的 RAG。

責(zé)任編輯:武曉燕 來(lái)源: PyTorch研習(xí)社
相關(guān)推薦

2015-08-26 10:00:31

獨(dú)立游戲cp錯(cuò)誤

2019-11-01 14:19:02

大數(shù)據(jù)機(jī)器學(xué)習(xí)工具

2023-07-19 11:19:37

AI項(xiàng)目人工智能

2016-11-02 12:56:58

Linux新手錯(cuò)誤

2023-01-09 12:06:33

2022-06-28 10:13:09

Pandas錯(cuò)誤Python

2011-05-31 15:38:37

CSS

2022-05-17 09:32:24

Bash編程Linux

2019-04-24 08:56:34

Java開(kāi)發(fā)人員常犯錯(cuò)誤

2016-11-30 14:15:34

網(wǎng)絡(luò)布線(xiàn)錯(cuò)誤

2011-04-18 12:55:04

JavaScript開(kāi)發(fā)者

2022-12-26 11:02:06

云計(jì)算CIOIT

2015-07-29 10:46:20

Java錯(cuò)誤

2012-08-31 10:09:04

用戶(hù)體驗(yàn)錯(cuò)誤初創(chuàng)團(tuán)隊(duì)

2018-04-04 09:55:18

語(yǔ)言PHP易犯錯(cuò)誤

2012-09-21 14:02:36

創(chuàng)業(yè)創(chuàng)業(yè)團(tuán)隊(duì)用戶(hù)體驗(yàn)

2021-09-02 08:40:10

程序員錯(cuò)誤

2009-07-10 09:20:11

IT人才經(jīng)驗(yàn)談

2024-05-27 16:27:22

2011-07-06 08:49:05

程序員
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

av每日在线更新| 无码一区二区三区在线| 欧美人与禽性xxxxx杂性| eeuss鲁片一区二区三区在线观看| 97在线日本国产| 91精品久久久久久久久久久久| 99综合久久| 欧美日韩在线视频首页| 爱爱爱视频网站| 无码精品视频一区二区三区| 日韩高清在线电影| 欧美精品激情在线| 成人精品一二三区| 亚洲精品无吗| 日韩欧美色电影| 中文字幕在线导航| 嗯~啊~轻一点视频日本在线观看| 欧美国产一区在线| 国产麻豆乱码精品一区二区三区| 丰满熟女人妻一区二区三| 国产精品国码视频| 中文字幕亚洲图片| www.久久国产| aaa国产精品视频| 欧美精品乱人伦久久久久久| 97av视频在线观看| 成人高潮aa毛片免费| 国产精品网曝门| 久久久精彩视频| 亚洲国产成人一区二区| 精品综合久久久久久8888| 日本精品久久中文字幕佐佐木| 九九热精品在线观看| 精品久久久久久一区二区里番| 久久久久久久久久久免费视频| 免费大片在线观看www| 久久久噜噜噜久久人人看| av成人在线电影| 国产男男gay网站| 免费观看30秒视频久久| 日韩男女性生活视频| 国产成年人免费视频| 欧美在线高清| 久久久精品免费视频| 韩国女同性做爰三级| 亚洲va久久| 日韩第一页在线| 97精品人妻一区二区三区蜜桃| 欧美二区观看| 欧美一区二区不卡视频| 午夜激情影院在线观看| 羞羞视频在线观看一区二区| jizz18欧美18| 欧美视频在线免费看| 久久这里只有精品23| 免费网站在线观看人| 一区二区三区在线不卡| 国产精品88久久久久久妇女 | 97超碰在线免费| 亚洲一区在线看| 丝袜人妻一区二区三区| 蜜桃在线视频| 在线亚洲一区二区| 一本一道久久a久久综合蜜桃| 亚洲在线资源| 日韩美女视频在线| 日韩av手机在线播放| 少妇久久久久| 中文字幕视频在线免费欧美日韩综合在线看 | 一区二区冒白浆视频| 国产三区在线观看| 亚洲国产日韩综合久久精品| 黄网站欧美内射| 偷拍视频一区二区三区| 欧美日韩午夜影院| 国产精品无码自拍| 欧美日韩一区二区三区不卡视频| 亚洲免费福利视频| www.xx日本| 国精品一区二区| 日本精品久久久久影院| 91久久精品国产91性色69| 国产精品一区专区| 久久一区二区三区av| www.黄在线观看| 亚洲精品免费看| 久久网站免费视频| 国产成人精品一区二区三区视频| 日韩一级高清毛片| 国产交换配乱淫视频免费| 99精品视频在线观看播放| 欧美激情免费在线| 夜夜躁日日躁狠狠久久av| 国产又粗又猛又爽又黄91精品| 狠狠久久综合婷婷不卡| 日韩在线免费电影| 午夜伦理一区二区| 天天操狠狠操夜夜操| 久久久伦理片| 久久亚洲精品一区| 日本中文在线播放| 欧美aaa在线| 国内精品二区| 麻豆传媒在线免费| 色哟哟一区二区在线观看| 亚洲综合20p| av在线不卡顿| 久久久欧美一区二区| 影音先锋黄色网址| 91丝袜高跟美女视频| 久久av喷吹av高潮av| 校园春色亚洲色图| 亚洲丁香婷深爱综合| 丝袜 亚洲 另类 欧美 重口| 日韩va欧美va亚洲va久久| 国产精品二区二区三区| 黄色片网站在线观看| 色诱视频网站一区| 插我舔内射18免费视频| 亚洲国产日韩欧美在线| 国产精品免费观看在线| 免费在线一级视频| 午夜精品久久久久| 善良的小姨在线| 久久在线播放| 国产精品久久久久久久久免费 | 中日精品一色哟哟| 久久综合色8888| 精品少妇人欧美激情在线观看| 91精品国产自产观看在线| 亚洲天堂男人的天堂| www.国产高清| aaa国产一区| 精品无码一区二区三区爱欲| 久久久久亚洲精品中文字幕| 日韩中文娱乐网| 中文字幕人妻一区二区在线视频| 国产亚洲一本大道中文在线| 日本三区在线观看| 亚洲aa在线| 庆余年2免费日韩剧观看大牛| 四虎精品一区二区三区| 亚洲风情在线资源站| 中文字幕久久久久久久| 欧美午夜电影在线观看 | 亚洲精品字幕在线| 一区二区三区高清| 中文字幕无码毛片免费看| 欧美精品国产| 国产九色91| 天堂av中文在线观看| 亚洲精品av在线| 亚洲永久精品在线观看| 久久久久国产精品人| 999香蕉视频| 欧美伦理影院| 91色视频在线导航| 色婷婷在线播放| 亚洲国产精品高清久久久| www日韩精品| 国产丝袜欧美中文另类| 美女网站色免费| 亚洲精品2区| 国产欧美精品一区二区三区| 午夜伦理福利在线| 国产一区av在线| 国产精品久久欧美久久一区| 亚洲人成精品久久久久| 日本wwwwwww| 久久精品网址| 亚洲一区二区三区乱码| 69精品国产久热在线观看| 97视频在线观看播放| 成人影视在线播放| 欧美一区二区三区喷汁尤物| 国产亚洲成人av| 久久色成人在线| 奇米影视四色在线| 国产精品草草| 日韩在线导航| 亚洲一区二区三区中文字幕在线观看| 午夜精品蜜臀一区二区三区免费| 久久手机免费观看| 欧美一级在线免费| 五月婷婷亚洲综合| 亚洲欧美在线视频| 日韩精品人妻中文字幕有码| 日日摸夜夜添夜夜添国产精品| 久久av喷吹av高潮av| 亚州av一区| 亚洲一区二区在线| 欧美7777| 欧美寡妇偷汉性猛交| 国产黄在线观看免费观看不卡| 91精品国产乱| 香蕉污视频在线观看| 亚洲黄一区二区三区| 亚洲精品国产一区黑色丝袜| 国产精品综合在线视频| 国产淫片av片久久久久久| 中文字幕人成人乱码| 日本免费高清一区二区| 亚洲精品午夜| 成人免费大片黄在线播放| 擼擼色在线看观看免费| 欧美精品在线播放| av在线电影网| 亚洲激情久久久| 国产黄a三级三级看三级| 色呦呦日韩精品| 日韩三级av在线| 亚洲免费观看高清完整版在线观看熊 | 四虎影院在线免费播放| 亚洲资源在线观看| sm捆绑调教视频| 久久精品夜色噜噜亚洲a∨| www.美色吧.com| 国内精品写真在线观看| 亚洲性生活网站| 午夜亚洲视频| 精品国偷自产一区二区三区| 91精品二区| 亚洲图片小说在线| 伊人久久大香线蕉无限次| 国产九区一区在线| 成人性生交大片免费看96| 亚洲a∨日韩av高清在线观看| 日本综合久久| 日本免费久久高清视频| 男女羞羞在线观看| 国产综合在线视频| 国产蜜臀在线| 欧美激情视频一区二区| 污视频在线看网站| 欧美成人午夜剧场免费观看| 麻豆av在线免费看| 日韩网站免费观看| 男人天堂手机在线| 日韩亚洲一区二区| 免费网站看v片在线a| 色一区av在线| 麻豆传媒视频在线| 麻豆国产精品va在线观看不卡 | 日本午夜人人精品| 成人香蕉视频| 国产脚交av在线一区二区| 美女福利一区二区| 国产精品第三页| 韩国精品视频在线观看| 国产精品视频区| 亚洲欧洲专区| 99re国产视频| 米奇精品关键词| 欧美久久久久久久| 第一会所sis001亚洲| 一本一道久久久a久久久精品91 | 国产视频九色蝌蚪| 国产视频一区三区| 人妻内射一区二区在线视频| 日韩电影一区二区三区四区| 美女网站视频黄色| 国产一区在线观看麻豆| 少妇伦子伦精品无吗| 成人免费福利片| av在线网站观看| 国产精品卡一卡二卡三| 青青草原国产视频| 精品福利一区二区| 探花国产精品一区二区| 3d动漫精品啪啪1区2区免费 | 99热国产精品| 免费看黄色三级| 亚洲精品久久嫩草网站秘色| 国产成人无码精品亚洲| 欧美性高清videossexo| av网站在线观看免费| 亚洲精品国精品久久99热| 成人福利在线| 欧美国产日韩中文字幕在线| 小草在线视频免费播放| 国产精品综合不卡av| 成人线上播放| 亚洲午夜精品福利| 亚洲激情专区| 亚洲一级免费在线观看| 99re这里只有精品视频首页| 色婷婷国产精品免| 亚洲福利国产精品| 一区二区三区www污污污网站| 91精品欧美一区二区三区综合在 | 男人亚洲天堂网| 国产一区在线精品| 国产高清一区二区三区四区| 亚洲黄色录像片| 中文字幕69页| 日韩欧美高清在线| 成人在线免费看| 久久琪琪电影院| 欧美国产视频| 免费av在线一区二区| 亚洲一区二区日韩| 992kp快乐看片永久免费网址| 国产成人精品一区二区三区网站观看| 无码国产69精品久久久久同性| 亚洲一区二区三区视频在线| 伊人免费在线观看| 亚洲精品一区二区三区婷婷月| 国产在线看片| 国产精品男人的天堂| 欧美三级午夜理伦三级小说| 男人草女人视频| 美国十次了思思久久精品导航| 人妻少妇精品视频一区二区三区| 亚洲女与黑人做爰| 中文字幕乱码中文字幕| 日韩精品高清视频| www中文字幕在线观看| 国产专区精品视频| 成人久久久久| 久久精品香蕉视频| 91在线视频免费观看| 国产亚洲精品成人| 日韩欧美资源站| 国产高清一区二区三区视频| 国产精品美女久久| 精品国产乱码久久久久久1区2匹| 欧美极品欧美精品欧美| 成人免费精品视频| 精品无码久久久久久久| 日韩三级视频中文字幕| 国产盗摄在线观看| 91青草视频久久| 亚洲欧洲美洲一区二区三区| 日韩欧美亚洲另类| 17c精品麻豆一区二区免费| 亚洲视频一区在线播放| 中文字幕国产日韩| 成人免费在线观看视频| 日韩欧美亚洲日产国| 日韩成人免费电影| 国产精品无码无卡无需播放器| 欧美影视一区在线| sese在线视频| 国产中文字幕日韩| 99久久综合| 中文国产在线观看| 亚洲精品水蜜桃| 亚洲成a人片77777精品| 欧美日韩成人在线播放| 日韩一区二区三区在线看| 欧美乱做爰xxxⅹ久久久| 国产成人综合在线观看| 国产午夜久久久| 亚洲精品xxx| 外国成人直播| 亚洲毛片aa| 国内成人精品2018免费看| 国产97免费视频| 欧美精品一区二区蜜臀亚洲| 理论不卡电影大全神| 欧美中文娱乐网| 久久精品99国产国产精| 黄色一级片中国| 精品动漫一区二区三区在线观看| 超碰在线99| 日韩免费毛片| 国产精品一区久久久久| 日韩欧美亚洲一区二区三区| 亚洲色图偷窥自拍| 国产精品成人3p一区二区三区| 在线观看污视频| 91在线精品一区二区| 一区二区三区麻豆| 欧美成人午夜剧场免费观看| 欧美电影免费网站| 亚洲老女人av| 亚洲影视在线播放| 能在线看的av| 亚洲直播在线一区| 国产日韩视频| 美女视频久久久| 亚洲黄色片网站| 伊人久久精品| 国产白丝袜美女久久久久| 国产精品久久久久精k8| 人妻一区二区三区免费| 国产精品久久久av| 亚洲视频久久| 正在播放国产对白害羞| 精品国产亚洲一区二区三区在线观看| 欧美xxx性| 97超碰在线视| 亚洲国产成人私人影院tom| 亚洲精品久久久久久久久久 | 亚洲免费成人av在线| 五月六月丁香婷婷| 欧美性xxxxx极品| 2021国产在线| 亚洲国产日韩综合一区| 99免费精品视频|