精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

顛覆直覺:Top N 越大,RAG效果可能越差

發布于 2025-2-24 11:28
瀏覽
0收藏

一、RAG 系統的背景與挑戰

在自然語言處理(NLP)領域,大型語言模型(LLMs)如 GPT、BERT 等已經展現出了強大的文本生成、問答和摘要能力。然而,這些模型也存在一些顯著的局限性。

? 首先,LLMs 的知識是靜態的,這意味著它們無法及時更新以反映新信息,導致生成的回答可能過時。

? 其次,LLMs 有時會生成聽起來合理但事實上錯誤的回答,這種現象被稱為“幻覺”。

? 最后,LLMs 在涉及高級專業領域的知識時,往往缺乏足夠的深度。

為了應對這些挑戰,檢索增強生成(Retrieval-Augmented Generation, RAG)系統應運而生。RAG 系統通過引入檢索組件,使 LLMs 能夠動態地利用外部知識源,從而生成更準確、更及時的回答。

RAG 系統已經在多個行業中得到廣泛應用,尤其是在企業內部文檔查詢等場景中。然而,盡管 RAG 系統的應用日益廣泛,關于其最佳配置的研究卻相對缺乏,特別是在上下文大小、基礎 LLM 選擇以及檢索方法等方面。

二、試驗結果

RAG 系統通常由兩個主要組件構成:檢索器(Retriever)和生成器(Reader):

? 檢索器負責從外部知識庫中檢索相關的上下文片段,這些片段隨后被傳遞給生成器

? 生成器基于這些上下文生成最終的回答。

作者重點探討了這三個方面(檢索器、上下文、生成器)對系統整體性能的影響。

首先研究了上下文大小對生成器問答能力的影響。結果表明:隨著上下文片段數量的增加,系統的性能逐步提升,但當片段數量達到 10 到 15 個時,性能開始趨于穩定,甚至在某些情況下會出現下降。這一現象表明,過多的上下文片段可能會導致信息過載,反而影響生成器的表現。

2.1 黃金片段測試

顛覆直覺:Top N 越大,RAG效果可能越差-AI.x社區圖片

上圖展示了四個較大尺寸的大語言模型(LLMs)在使用黃金片段后的表現,四個模型分別是GPT3.5、GPT-4o、Llama 3 70B、Mixtral (8x7B)。

所有模型都呈現出相似的模式:

? 從較低的零樣本性能開始,僅使用一個上下文片段就能顯著提升性能。

? 大多數模型在所有三個評估指標上逐步且穩定地改進。

2.2 封閉式測試

使用了包含八千篇PubMed文章的小型知識庫,這些文章在BioASQ中被用作黃金證據。

顛覆直覺:Top N 越大,RAG效果可能越差-AI.x社區圖片

實驗結果如上表所示,模型性能與之前有所下降。即使是表現最佳的Mixtral模型,其性能也平均下降。

盡管如此,隨著選擇的top k片段數量的增加,性能仍然逐步提升,表明更多的上下文信息能夠帶來更好的表現。

這一點在top-10設置中尤為明顯,因為選擇的證據片段越多,選中用于生成理想答案的黃金證據片段的概率就越高。

2.3 開放式測試

使用約1000萬篇PubMed文章作為檢索的知識庫。其目的是觀察:

(1)在開放式設置下,性能與使用黃金證據的封閉式設置相比有多大差異;

(2)不同檢索器對性能的影響。

顛覆直覺:Top N 越大,RAG效果可能越差-AI.x社區圖片

顛覆直覺:Top N 越大,RAG效果可能越差-AI.x社區圖片

上表結果顯示:

? 開放式檢索顯然是最具挑戰性的設置,整體平均得分最低。

? 使用BM25檢索文檔的最終性能略優于語義搜索。

3. 結論

3.1 檢索技術

顛覆直覺:Top N 越大,RAG效果可能越差-AI.x社區圖片

從上表可以看出,BM25在整體性能上表現更優。由于BM25基于關鍵詞匹配,這種檢索技術優化了搜索結果的精確度(precision)而非召回率(recall),從而確保檢索到的文檔更有可能討論問題中提到的相同概念(關鍵詞)。

優化精確度并將查詢關鍵詞與知識庫中的內容匹配,可以提升性能。特別是在生物醫學領域等關鍵應用中,優化精確度和生成穩健的答案可能比語義搜索提供的召回率更為重要

注:

? ROUGE-L 是一種基于最長公共子序列(LCS)的評估指標,主要用于衡量生成文本與參考文本之間的相似性。它關注生成文本中與參考文本匹配的最長連續子序列,側重于召回率(Recall),即生成文本中有多少內容與參考文本一致。

? BERTScore 是一種基于預訓練語言模型(如 BERT)的評估指標,通過計算生成文本與參考文本在語義空間中的相似性來評估質量。它使用 BERT 模型將文本編碼為向量,然后計算生成文本與參考文本之間的余弦相似度。相比 ROUGE 等基于詞匯重疊的指標,BERTScore 更能捕捉語義層面的相似性,適合評估生成文本的語義準確性。

? Ent.% 是基于自然語言推理(Natural Language Inference, NLI)模型的評估指標,用于衡量生成文本與參考文本之間的邏輯一致性(蘊含關系)。NLI 模型會判斷生成文本是否邏輯上蘊含(Entailment)參考文本的內容。

3.2 內部知識與外部知識的沖突

顛覆直覺:Top N 越大,RAG效果可能越差-AI.x社區圖片

上表中開放式檢索的一個有趣現象:GPT和Mixtral在零樣本答案(無上下文片段)中的得分高于提供多達10個上下文片段的答案。

這種現象的一個可能解釋是:盡管在語料庫中發現的片段可能與問題在語義上相似,但它們并不總是提供所有重要信息。

當僅使用普通提示時,LLM基于其“內部”知識生成答案:反映了LLM從大規模預訓練語料庫中積累的知識。

因此,LLM的內部知識答案可能比RAG設置中的答案更具信息量,因為在RAG設置中,LLM被指示僅使用提供的短片段來回答問題。隨著更多片段的加入,RAG答案的信息量開始超越LLM的內部知識。

顛覆直覺:Top N 越大,RAG效果可能越差-AI.x社區圖片

以上表中的第一個示例為例,Mixtral基于內部知識生成的答案提到了純化和IgG,與黃金答案一致,而基于top-3片段生成的答案則是不完整的。

一般來說,瓶頸通常與錯誤的檢索有關——有時檢索到的片段根本沒有回答問題,尤其是對于BioASQ中復雜的生物醫學術語。

另一方面,普通設置下的LLM總是基于其最佳知識提供答案,因此在檢索不佳的情況下表現更好。在上表的第二個示例中顯而易見。

展示了LLM內部知識與傳遞給它們的上下文知識之間沖突的已知挑戰,也是一個有趣的未來研究方向。

3.3 上下文飽和

顛覆直覺:Top N 越大,RAG效果可能越差-AI.x社區圖片

上表中的另一個發現是,性能提升存在一定的上限。

隨著不斷增加上下文片段的數量,增加到20個時,性能趨于停滯,而在檢索到30個上下文片段時,性能略有下降。

當達到飽和點后,向提示中添加更多上下文只會導致回答中的噪音和混淆。

證實了文獻中的先前發現,即在長提示中,上下文可能會“迷失在中間”,并在LLM回答問題時被忽略。

注:本論文代碼和數據已開源:https://github.com/jvladika/ContextRAG

本文轉載自??大語言模型論文跟蹤??,作者:HuggingAGI 

已于2025-2-24 13:26:50修改
收藏
回復
舉報
回復
相關推薦
日韩av午夜在线观看| xxxxxhd亚洲人hd| 欧美国产日韩精品免费观看| 国产欧美一区二区三区视频| 日本美女黄色一级片| 国产视频一区二| 精品日本美女福利在线观看| 欧美日韩一区在线播放| 国产精品人妻一区二区三区| 欧美日韩少妇| 亚洲视频在线看| 97人人模人人爽人人澡| 女同视频在线观看| 26uuu精品一区二区三区四区在线 26uuu精品一区二区在线观看 | 国产日韩视频在线播放| 日韩在线视频第一页| 日韩激情视频网站| 久久久人成影片一区二区三区观看 | 欧美日韩一区二区视频在线| 国产精品视频无码| 免费在线播放第一区高清av| 久久这里有精品| 人妻精品久久久久中文字幕| 深夜福利一区二区三区| 欧美在线免费视屏| 亚洲美免无码中文字幕在线 | 99精品国产视频| 国产精品久久久久久久久久小说 | 欧美性jizz18性欧美| www婷婷av久久久影片| 成人在线二区| 91啪九色porn原创视频在线观看| 亚洲永久免费观看| 亚洲在线精品视频| 久久精品日产第一区二区| 久久久久久久久久久成人| 国产三级精品三级观看| 国内精品久久久久久久久电影网| 亚洲第一区在线观看| 国内av免费观看| 91久久久久久白丝白浆欲热蜜臀| 精品久久久一区| 777久久精品一区二区三区无码| 神马电影在线观看| 成人av免费网站| av成人观看| 国产精品无码久久av| 麻豆freexxxx性91精品| 国产精品久久不能| 久久久黄色大片| 国产美女精品| 2019中文在线观看| 久久精品欧美一区二区| 欧美三区不卡| 欧美激情a在线| 欧美日韩偷拍视频| 国产在线欧美| 欧美激情手机在线视频 | 亚洲色图偷拍视频| 日韩五码电影| 51精品久久久久久久蜜臀| 人人干人人干人人| 国产成人午夜性a一级毛片| 欧美午夜在线一二页| 黄色一级免费大片| 91欧美精品| 欧美日韩久久久久久| 香蕉视频网站入口| 另类一区二区三区| 欧美精品亚洲二区| 国产黑丝在线视频| 精品精品国产毛片在线看| 亚洲护士老师的毛茸茸最新章节| 捆绑凌虐一区二区三区| 窝窝社区一区二区| 国产午夜精品一区二区三区| 国产三级短视频| 伊人久久大香线| 欧美激情a在线| 69视频免费在线观看| 日韩激情视频网站| 亚洲一区二区久久久久久| 亚洲成人一二三区| 久久综合久久综合久久| 亚洲bbw性色大片| а√中文在线8| 亚洲成人av电影在线| 亚洲熟妇av一区二区三区| 中文.日本.精品| 日韩一区二区影院| 朝桐光av一区二区三区| 欧美日韩伦理| 欧美日本高清视频| 超碰中文字幕在线| 久久国产福利国产秒拍| 国产91精品入口17c| 日韩资源在线| 日本一二三不卡| 成人区一区二区| 三上悠亚国产精品一区二区三区| 欧美日韩在线观看一区二区| 日本道中文字幕| 欧美一区电影| 久久久噜噜噜久噜久久| 亚洲免费视频二区| 成人精品亚洲人成在线| 欧美一区二区福利| 视频在线这里都是精品| 色999日韩国产欧美一区二区| 亚洲精品乱码久久久久久动漫| 超碰在线亚洲| 精品国产一区二区三区四区在线观看| 国产精品theporn动漫| 男人的j进女人的j一区| 国产在线精品二区| 成人日韩欧美| 欧美在线色视频| 久久午夜夜伦鲁鲁片| 91成人精品视频| 欧美又大粗又爽又黄大片视频| 国产精品一区二区av白丝下载| www国产亚洲精品久久麻豆| 色乱码一区二区三区熟女| 激情开心成人网| 亚洲精品二三区| 在线观看成人毛片| 美女视频黄免费的久久| 久草一区二区| 福利在线导航136| 日韩一区二区免费高清| 亚洲综合第一区| 久久成人在线| 精品一区久久久久久| 羞羞的视频在线观看| 欧美另类videos死尸| 免费看污片的网站| 欧美亚洲三区| 久久av免费一区| 97蜜桃久久| 日韩欧美色电影| 亚洲欧美精品aaaaaa片| 蜜桃视频一区二区三区| 亚洲成人自拍| а√天堂资源国产精品| 国产一区二区美女视频| 成年人视频免费| 久久网这里都是精品| 91成人在线观看喷潮教学| 1769国产精品视频| 欧美激情欧美激情在线五月| 国产黄色一区二区| 亚洲精品ww久久久久久p站| 欧美日韩成人在线| 在线视频不卡国产| 久久av日韩| 深夜福利一区二区| 日韩不卡高清视频| 中文字幕av在线一区二区三区| 成人免费xxxxx在线视频| 精品国产一区二区三区av片| 青青草一区二区| 六十路在线观看| 日本高清无吗v一区| 神马久久久久久久久久久| 蜜臀av一级做a爰片久久| 亚洲日本精品一区| 91成人精品观看| 成人97在线观看视频| 草逼视频免费看| 亚洲成人中文在线| 亚洲天堂网一区二区| 久久久久91| 日韩高清三级| 亚洲一区二区小说| 久久久久久高潮国产精品视| 刘亦菲久久免费一区二区| 婷婷一区二区三区| 国产亚洲精品熟女国产成人| 美女视频一区二区| 黄色小视频大全| 久久悠悠精品综合网| 国产91色在线免费| 人人干在线视频| 日韩三级在线免费观看| 日韩黄色一级大片| 国产精品理论在线观看| 久久久精品人妻一区二区三区| 亚洲伦理一区| 神马影院午夜我不卡影院| 精品一区二区三区四区五区| 4388成人网| 欧美极品视频| 日韩午夜电影在线观看| 毛片在线免费视频| 中文字幕视频一区| 亚洲av成人片无码| 日韩中文欧美在线| 第九区2中文字幕| 日韩高清影视在线观看| 国产乱人伦真实精品视频| 国产福利在线免费观看| 在线观看成人黄色| 亚洲精品久久久久久久久久久久久久 | av资源站久久亚洲| 成人动漫一区| 欧美巨猛xxxx猛交黑人97人| 三级无遮挡在线观看| 日韩一级二级三级| 国产情侣小视频| 亚洲一区二区三区四区五区中文 | 91精品国产乱码久久久久久蜜臀 | 色综合导航网站| 爱久久·www| 亚洲精品国产美女| 国产视频一二三四区| 色老汉一区二区三区| 免费日韩在线视频| 中文一区二区在线观看| 中文精品在线观看| 国产·精品毛片| 五月花丁香婷婷| 天堂av在线一区| 99热亚洲精品| 91超碰国产精品| 亚洲精品国产精品国自产| 亚洲涩涩av| 国产精品毛片一区视频| crdy在线观看欧美| 国产精品久久久久久中文字| 忘忧草在线影院两性视频| 欧美国产日本高清在线| 巨大荫蒂视频欧美大片| 伊人伊成久久人综合网小说 | 精品一区二区三区四区五区 | 中文字幕 自拍偷拍| 精品国产91久久久| 国产真实夫妇交换视频| 亚洲精品视频一区二区| 2014亚洲天堂| 国产精品国产精品国产专区不蜜| 真实乱视频国产免费观看| www成人在线观看| 久久人妻少妇嫩草av无码专区 | 精品国产午夜肉伦伦影院| 国产在线不卡精品| 色猫猫成人app| 日本aⅴ大伊香蕉精品视频| 黄频免费在线观看| 韩剧1988在线观看免费完整版| 欧美1—12sexvideos| 欧美猛少妇色xxxxx| 在线观看小视频| 久久国产精品亚洲| 午夜成年人在线免费视频| 久久6免费高清热精品| 午夜dj在线观看高清视频完整版| 久久精品成人欧美大片| 成人av黄色| 欧美日韩ab片| 黑人精品视频| 45www国产精品网站| 日韩欧美精品一区二区三区| 1769国内精品视频在线播放| 吉吉日韩欧美| 国产精品久久久久不卡| 青青国产精品| eeuss一区二区三区| 91精品入口| 久久99影院| 日韩激情免费| 波多野结衣 作品| 亚洲精品少妇| 色七七在线观看| 精品一区二区综合| 日本少妇xxx| 91免费视频大全| 懂色av粉嫩av浪潮av| 亚洲麻豆国产自偷在线| 五月天婷婷综合网| 日本大香伊一区二区三区| 亚洲视频一区二区三区四区| 日韩欧美电影一区| 婷婷亚洲一区二区三区| 一区二区三欧美| 在线网址91| 国产成人高潮免费观看精品| 亚洲午夜剧场| 久久精品国产美女| 国产精品91一区二区三区| 久艹在线免费观看| 日日夜夜免费精品| 男生和女生一起差差差视频| 99久久国产综合精品色伊| 亚洲一二三精品| 亚洲已满18点击进入久久| 特级西西444www大精品视频免费看| 91精品国产自产在线丝袜啪| 97国产精品视频人人做人人爱| 成人看片在线观看| caoporn国产精品免费公开| 久操成人av| 久操手机在线视频| 男女男精品视频| 中文在线观看免费视频| 国产精品入口麻豆九色| 日本一区二区不卡在线| 欧美片网站yy| 色就是色亚洲色图| 欧美成人午夜剧场免费观看| 成人自拍av| 国产传媒一区二区三区| 成人综合专区| 黑人糟蹋人妻hd中文字幕| 国产一区二区调教| 熟女俱乐部一区二区| 亚洲大片精品永久免费| 国产婷婷在线视频| 在线看国产精品| 中国字幕a在线看韩国电影| 91文字幕巨乱亚洲香蕉| 成人国产精品一级毛片视频| 国产3p露脸普通话对白| 国产一区二区电影| 亚洲欧美日韩第一页| 欧美日韩精品在线| 成人乱码一区二区三区| 日韩中文字幕第一页| 欧美亚洲大片| 欧美日韩精品免费看| 亚洲精品美女91| 中文字幕在线播放一区二区| 亚洲欧洲精品天堂一级| 亚洲无码精品一区二区三区| www.日韩在线| 男女午夜激情视频| 波多野结衣精品在线| 久草视频在线免费看| 欧美一区二区三级| 国产原厂视频在线观看| 国产欧美婷婷中文| 日本一区二区高清不卡| 人人爽人人av| 国产欧美综合色| 亚洲精品中文字幕乱码三区91| 日韩精品视频在线播放| av剧情在线观看| 国产午夜精品在线| 亚洲黄色毛片| 国产 xxxx| 亚洲va韩国va欧美va精品| www.四虎在线观看| 久久99热精品| 97久久超碰| 国产 日韩 亚洲 欧美| av中文字幕在线不卡| 久久国产视频播放| 亚洲欧美成人一区二区在线电影| 牛牛精品一区二区| 欧美精品人人做人人爱视频| 久久精品系列| 蜜臀久久99精品久久久久久| 欧美精品丝袜中出| 高清在线观看av| 国产精品电影观看| 久久精品高清| 久久久久久久久久一区| 亚洲伦在线观看| 欧洲精品久久一区二区| 97久久伊人激情网| 免费观看不卡av| 国产精品涩涩涩视频网站| 国产欧美精品国产国产专区| 亚洲视频在线观看免费视频| 日韩小视频网址| 免费观看亚洲视频大全| 亚洲成人动漫精品| 麻豆成人在线视频| 精品国产乱码久久久久久老虎| 大桥未久在线视频| 日本公妇乱淫免费视频一区三区| 麻豆视频观看网址久久| www.毛片com| 精品成人在线观看| 日本高清不卡一区二区三区视频 | 一区二区三区亚洲视频| 另类图片亚洲另类| 久久动漫网址| 在线观看av日韩| 亚洲男人都懂的| 日韩精品系列| 91精品视频播放| 欧美亚洲免费| 国产精品视频一区二区三 | 99视频在线观看地址| 97av自拍| 首页欧美精品中文字幕| 国产探花在线免费观看| 亚洲男子天堂网| 亚洲精品福利| 超碰在线人人爱|