精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Anthropic研究團隊提出新技術,引入Contextual Retrieval讓RAG再進化,大幅降低檢索失敗率 原創

發布于 2024-11-14 10:13
瀏覽
0收藏

?在當前的知識檢索領域,RAG技術正引領著最新潮流,它的目標是為大型語言模型(LLM)提供豐富而精確的上下文信息。然而,傳統RAG方法在處理信息時經常會忽略上下文細節,這限制了其從知識庫中提取相關信息的能力。解決如何有效保存上下文信息的問題,已成為該領域的重點。

針對這一挑戰,Anthropic的研究團隊提出了一種名為“上下文檢索”的創新技術,使得在這一領域取得了重大突破。他們最近發表的研究詳細介紹了這一技術,展示了如何通過上下文嵌入和上下文敏感的BM25算法顯著降低檢索失敗率。讓我們深入探討這一方法的關鍵要素。

關于使用較長提示符的說明

有時候最簡單的解決方案就是最好的。如果你的知識庫小于200,000個token(大約500頁的材料),你可以在給出模型的提示中包含整個知識庫,而不需要RAG或類似的方法。

幾周前,Claude發布了快速緩存,這使得這種方法更快,更具成本效益。開發人員現在可以在API調用之間緩存頻繁使用的提示,將延遲減少2倍以上,成本降低高達90%(可以通過閱讀prompt caching cookbook了解它是如何工作的)。

但是,隨著知識庫的增長,您將需要一個更具可擴展性的解決方案。這就是上下文檢索的用武之地。

擴展到更大的知識庫

對于不適合上下文窗口的較大知識庫,RAG是典型的解決方案。RAG通過使用以下步驟預處理知識庫來工作:

  1. 將知識庫(文檔的“語料庫”)分解為更小的文本塊,通常不超過幾百個標記;
  2. 使用嵌入模型將這些塊轉換為編碼含義的向量嵌入;
  3. 將這些嵌入存儲在矢量數據庫中,以便根據語義相似性進行搜索。

在運行時,當用戶向模型輸入查詢時,向量數據庫用于基于與查詢的語義相似性來找到最相關的塊。然后,將最相關的塊添加到發送到生成模型的提示中。

雖然嵌入模型擅長捕捉語義關系,但它們可能會錯過關鍵的精確匹配。幸運的是,有一種更古老的技術可以幫助解決這些問題。BM 25是一個排名功能,它使用詞匯匹配來查找精確的單詞或短語匹配。它對于包含唯一標識符或技術術語的查詢特別有效。BM 25基于TF-IDF概念,TF-IDF衡量一個單詞對集合中文檔的重要性。BM 25通過考慮文檔長度并將飽和函數應用于詞頻來細化這一點,這有助于防止常見詞主導結果。

假設用戶在技術支持數據庫中查詢“Error code TS-999”。嵌入模型通常可以找到有關錯誤代碼的內容,但可能會錯過精確的“TS-999”匹配。BM 25查找此特定文本字符串以識別相關文檔。

RAG解決方案可以通過使用以下步驟結合嵌入和BM 25技術來更準確地檢索最適用的塊:

  1. 將知識庫(文檔的“語料庫”)分解為更小的文本塊,通常不超過幾百個標記;
  2. 為這些塊創建TF-IDF編碼和語義嵌入;
  3. 使用BM 25來找到基于精確匹配的頂部塊;
  4. 基于語義相似度,使用嵌入來找到頂部塊;
  5. 使用融合技術對來自(3)和(4)的結果進行聚合和去重;
  6. 將前K個塊添加到提示符中以生成響應。

通過利用BM 25和嵌入模型,傳統的RAG系統可以提供更全面和準確的結果,平衡精確的術語匹配和更廣泛的語義理解。

Anthropic研究團隊提出新技術,引入Contextual Retrieval讓RAG再進化,大幅降低檢索失敗率-AI.x社區

這種方法使您能夠經濟高效地擴展到巨大的知識庫,遠遠超出了單個提示中所能容納的內容。但是這些傳統的RAG系統有一個顯著的局限性:它們經常破壞上下文。

傳統RAG中的語境難題

在傳統的RAG中,文檔通常被分成更小的塊以進行有效的檢索。雖然這種方法對于許多應用程序都很有效,但當單個塊缺乏足夠的上下文時,它可能會導致問題。

例如,假設您的知識庫中嵌入了一系列財務信息,您收到了以下問題:“ACME Corp在2023年第二季度的收入增長是多少?"

一個相關的塊可能包含這樣的文本:“公司的收入比上一季度增長了3%。“然而,這一大塊本身并沒有指定它所指的是哪家公司或相關的時間段,因此很難檢索正確的信息或有效地使用這些信息。

Contextual Retrieval

上下文檢索簡介

上下文檢索通過在嵌入之前將特定于塊的解釋性上下文前置到每個塊(Contextual Embeddings)并創建BM 25索引(Contextual BM25)來解決這個問題。

下面是一個如何轉換塊的示例:

原始分塊 = "公司的收入比上一季度增長了3%。"
上下文化分塊 = "這個分塊來自ACME公司在2023年第二季度的SEC文件;上一季度的收入為3.14億美元。公司的收入比上一季度增長了3%。"

值得注意的是,過去已經提出了使用上下文來改進檢索的其他方法。其他建議包括:將通用文檔摘要添加到塊,假設文檔嵌入和基于摘要的索引。這些方法的收益和性能都很低。

實現上下文檢索

手動為知識庫中的成千上萬個分塊添加上下文顯然是不現實的。為此,研究團隊使用了 Claude 模型,通過一個特定的提示生成每個分塊的簡潔上下文,生成的上下文通常為 50-100 個 token,然后在嵌入和創建 BM25 索引之前將其添加到分塊中。對應的prompt示例:

<document> 
{{WHOLE_DOCUMENT}} 
</document> 
Here is the chunk we want to situate within the whole document 
<chunk> 
{{CHUNK_CONTENT}} 
</chunk> 
Please give a short succinct context to situate this chunk within the overall document for the purposes of improving search retrieval of the chunk. Answer only with the succinct context and nothing else.

下面是預處理流程在實踐中的樣子:

Anthropic研究團隊提出新技術,引入Contextual Retrieval讓RAG再進化,大幅降低檢索失敗率-AI.x社區

使用Prompt Caching降低上下文檢索成本

上下文檢索得益于Prompt Caching功能,通過Claude可以以低成本獨特地實現。有了提示緩存,您不需要為每個塊傳入參考文檔。您只需將文檔加載到緩存中一次,然后引用之前緩存的內容。假設800個令牌的塊,8k令牌的文檔,50令牌的上下文指令,以及每個塊的100令牌的上下文,生成上下文化塊的一次性成本是每百萬文檔令牌1.02美元。

注意事項

在實現上下文檢索時,需要記住幾個注意事項:

  1. 塊邊界:考慮如何將文檔拆分為塊。塊大小、塊邊界和塊重疊的選擇會影響檢索性能。
  2. 嵌入模型:雖然上下文檢索提高了我們測試的所有嵌入模型的性能,但某些模型可能比其他模型受益更多。Gemini和Voyage嵌入特別有效。
  3. 自定義prompt:雖然通用提示效果很好,但您可以使用針對特定領域或用例定制的提示(例如,包括可能僅在知識庫中的其他文檔中定義的關鍵術語的詞匯表)來實現更好的結果。
  4. **塊的數量:**在上下文窗口中添加更多的塊可以增加包含相關信息的機會。然而,更多的信息可能會分散模型的注意力,所以這是有限制的。嘗試使用5、10和20塊,發現使用20塊是這些選項中性能最好的,但值得在您的用例中進行試驗。

通過Rerank進一步提升性能

Anthropic研究團隊提出新技術,引入Contextual Retrieval讓RAG再進化,大幅降低檢索失敗率-AI.x社區

在傳統 RAG 中,AI 系統會從知識庫中檢索到大量潛在相關的信息分塊。對于大型知識庫,這一初始檢索往往會返回大量分塊,有時多達數百個,且相關性和重要性各不相同。重排序是一種常用的過濾技術,確保只有最相關的分塊被傳遞給模型。實驗結果顯示,重排序后的上下文嵌入和上下文 BM25 將前 20 個分塊的檢索失敗率減少了 67%(從 5.7%降至 1.9%)。

Anthropic研究團隊提出新技術,引入Contextual Retrieval讓RAG再進化,大幅降低檢索失敗率-AI.x社區

成本和延遲考慮

重排序的一個重要考慮因素是對延遲和成本的影響,特別是在對大量塊進行重排序時。因為重排序在運行時增加了一個額外的步驟,所以它不可避免地增加了少量的延遲,即使重排序器并行地對所有塊進行評分。在重新排序更多塊以獲得更好的性能與重新排序更少塊以降低延遲和成本之間存在固有的權衡。建議您在特定用例中嘗試不同的設置,以找到正確的平衡。

總結

研究團隊通過大量的實驗,為大家指出了一個新的提升 RAG 性能的方法,為開發者指出了實踐新方向。同時,研究團隊基于大量實驗的結果,給出了一些關鍵的經驗總結:

  1. Embeddings+BM25 比單獨使用Embeddings效果更好
  2. Voyage 和 Gemini 是測試中效果最好的嵌入模型
  3. 將前20個塊傳遞給模型比只傳遞前10個或前5個塊更有效
  4. 在語塊中加入上下文可以大大提高檢索的準確率
  5. 采用重排序的方法比起不進行重排序
  6. 將這些改進策略綜合起來:為了最大限度地提高性能,我們可以將contextual embeddings(來自Voyage或Gemini)與contextual BM25結合起來,再加上重新排序步驟,并將20個塊添加到提示符中。

?

本文轉載自公眾號AI 博物院 作者:longyunfeigu

原文鏈接:??https://mp.weixin.qq.com/s/qEZ-oyzFYDmWJJ0ycFLzDg??

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
中文字幕第31页| 日本69式三人交| 中文字幕在线观看播放| 国产福利精品一区| 色综合久久天天| 日韩国产伦理| 国产黄色大片网站| 性久久久久久| 久久深夜福利免费观看| 北条麻妃视频在线| 国产日产一区二区三区| 国产麻豆日韩欧美久久| 4k岛国日韩精品**专区| 激情高潮到大叫狂喷水| 欧美交a欧美精品喷水| 欧美久久一二区| 欧美极品欧美精品欧美| 黄色在线论坛| 久久久精品蜜桃| 豆国产97在线| 一级黄色片视频| 亚洲女优在线| 欧美激情中文网| 午夜免费福利网站| 精品国模一区二区三区| 无码av中文一区二区三区桃花岛| av动漫免费观看| 桃花色综合影院| 成人免费视频视频| 国产中文欧美精品| 中文字幕在线网站| 天堂一区二区在线免费观看| 91干在线观看| 国产午夜免费视频| 欧美1级日本1级| 精品欧美一区二区久久| av中文字幕网址| 日韩久久一区二区三区| 岛国av午夜精品| www精品久久| 日本片在线看| 亚洲免费资源在线播放| 一本色道久久综合亚洲精品婷婷 | 国产99对白在线播放| 日韩精品成人一区二区在线| 2019中文字幕全在线观看| 国产一级特黄a高潮片| 欧美在线三区| 另类图片亚洲另类| 国产高清视频免费在线观看| 成人精品视频| 一区二区国产精品视频| 17c国产在线| www.精品国产| 在线观看欧美黄色| 五月婷婷丁香综合网| 625成人欧美午夜电影| 精品久久中文字幕| 又粗又黑又大的吊av| 91白丝在线| 精品日本美女福利在线观看| 久草热视频在线观看| 2018av在线| 高潮白浆女日韩av免费看| 六月丁香激情网| 亚洲国产成人二区| 欧美中文字幕一区二区三区亚洲| 午夜两性免费视频| 小说区图片区亚洲| 日韩色在线观看| 无码人妻一区二区三区免费n鬼沢| 日韩视频1区| 亚洲白虎美女被爆操| www.17c.com喷水少妇| 久久草在线视频| 亚洲全黄一级网站| 超碰人人干人人| 欧美一区成人| 久久人人看视频| 手机在线看片1024| 日本不卡一区二区三区 | 欧美日韩dvd| 国产在线激情| 亚洲欧美一区二区三区国产精品 | 欧美日韩精品在线播放| 日韩avxxx| 成人影院在线免费观看| 欧美一卡二卡在线观看| 波多野结衣办公室33分钟| 日韩av免费大片| 欧美高清videos高潮hd| 999视频在线| 国精产品一区一区三区mba视频| 国产精品久久一区二区三区| 狠狠狠综合7777久夜色撩人| 亚洲免费资源在线播放| 欧美性大战久久久久xxx | 夜级特黄日本大片_在线| 亚洲少妇中出一区| 1024av视频| 欧美激情啪啪| 精品久久国产老人久久综合| 欧美做受高潮6| 大型av综合网站| 伊人久久久久久久久久久| 黑人巨大精品一区二区在线| 久久久久久一区二区| 91在线网站视频| 人操人视频在线观看| aaa亚洲精品一二三区| 国产高清一区二区三区| 超碰在线国产| 国产精品沙发午睡系列990531| 精品嫩模一区二区三区| 欧美国产大片| 精品国产123| 国产尤物在线播放| 水野朝阳av一区二区三区| 国产精品日韩欧美一区二区| 在线观看精品一区二区三区| 国产精品久久夜| 男人天堂网视频| 91蜜桃臀久久一区二区| 精品国内亚洲在观看18黄| 一本一道无码中文字幕精品热| 国产乱子伦一区二区三区国色天香| 日韩精品久久一区| 在线女人免费视频| 亚洲国产精品免费| 亚洲国产成人精品综合99| 蜜桃91丨九色丨蝌蚪91桃色| 欧美精品v日韩精品v国产精品| 日韩123区| 欧美一区二区三区婷婷月色| 青青青手机在线视频| 日韩av网站免费在线| 日本成人黄色| 欧美大胆性生话| 亚洲免费高清视频| 中文字幕亚洲高清| 91亚洲资源网| 成熟了的熟妇毛茸茸| 欧美大奶一区二区| 91精品国产91久久| 五十路在线观看| 午夜精品久久久久久久久久久| 人妻少妇被粗大爽9797pw| 亚洲国产一区二区三区网站| 久久精品视频导航| 11024精品一区二区三区日韩| 中日韩免费视频中文字幕| 久久免费视频2| 亚洲伊人精品酒店| 精品国产乱码久久久久久老虎| 亚洲欧美小视频| 中文精品在线| 久久久久久久有限公司| 欲香欲色天天天综合和网| 精品成a人在线观看| 日本少妇裸体做爰| 2022国产精品视频| 爱情岛论坛成人| 日韩欧美网站| 91亚洲va在线va天堂va国| 尤物在线网址| 亚洲精品久久久久| 91在线看视频| 国产激情一区二区三区桃花岛亚洲| 国产成年人在线观看| 亚洲视频一起| 91sa在线看| 国产视频网址在线| 在线播放国产精品二区一二区四区| 日本妇女毛茸茸| a级精品国产片在线观看| 国产视频九色蝌蚪| 欧美一区二区麻豆红桃视频| 亚洲一区二区久久久久久| caoporn-草棚在线视频最| 精品中文视频在线| 亚洲天堂中文网| 一区二区三区波多野结衣在线观看| 亚洲av人人澡人人爽人人夜夜| 久久久www| 中文字幕不卡每日更新1区2区| 亚洲1区在线| 日本高清视频精品| bt在线麻豆视频| 日韩精品在线第一页| 91theporn国产在线观看| 亚洲综合激情小说| 人妻精品久久久久中文| 国产一区二区三区精品视频| 欧美成人一区二区在线观看| 欧美电影《睫毛膏》| 国产日韩一区二区| 国产情侣一区二区三区| 久久全国免费视频| 永久免费在线观看视频| 亚洲经典中文字幕| 97在线视频人妻无码| 欧美日韩亚洲天堂| 日本aⅴ在线观看| 国产午夜精品福利| 亚洲av无码专区在线播放中文| 麻豆91在线播放免费| 国产极品尤物在线| 欧美在线影院| 日韩高清专区| 日日狠狠久久偷偷综合色| 亚洲www永久成人夜色| 国产免费不卡| 韩国一区二区电影| caoporn免费在线| 亚洲无亚洲人成网站77777| 久久久久久久久久成人| 亚洲大片精品永久免费| 成人一级黄色大片| 国产日韩欧美不卡在线| 漂亮人妻被黑人久久精品| 狠狠色丁香久久婷婷综合丁香| 男人操女人免费| 亚洲激情女人| 国产青草视频在线观看| 香蕉国产精品| 亚洲在线观看一区| 精品国产午夜| 欧美不卡三区| 菁菁伊人国产精品| 国产精品对白刺激久久久| 成人免费91| 国产主播在线一区| 久久伊人国产| 国产主播精品在线| 欧美爱爱视频| 国产在线高清精品| 亚洲成人高清| 国产综合福利在线| 97久久中文字幕| 91精品美女在线| 亚洲欧美专区| 91香蕉电影院| 婷婷综合国产| 国产精品久久久久久久久婷婷 | 国产精品99久久久久久久| 24小时成人在线视频| 国产精品视频一| 国产一二区在线| 日韩在线视频二区| jizz在线观看| 少妇高潮 亚洲精品| aiai在线| 日韩中文字幕在线观看| 久久99精品久久| 蜜月aⅴ免费一区二区三区| 日韩性xxxx| 亚洲韩国日本中文字幕| 网站黄在线观看| 精品在线小视频| 岛国在线视频免费看| 在线观看欧美视频| 在线观看av黄网站永久| 久久精品视频va| 欧美韩日亚洲| 亚洲免费视频网站| 秋霞av在线| 亚洲天堂免费观看| 午夜视频成人| 日韩综合视频在线观看| av毛片在线| 国外成人在线播放| 成人性生活视频| 国产精品久久二区| 先锋影音一区二区| 国产91aaa| 一道本一区二区三区| 亚洲欧美日产图| 国产精品videossex久久发布| 青青草成人免费在线视频| 久久精品日产第一区二区 | 久久无码精品丰满人妻| 精品久久久久久国产| 夜夜躁日日躁狠狠久久av| 欧美一区二区三区爱爱| 无码精品一区二区三区在线| 中文字幕无线精品亚洲乱码一区| 污污网站在线看| 欧美中文字幕视频| 亚洲最大的免费视频网站| 成人自拍爱视频| 欧美午夜精彩| 无码av天堂一区二区三区| 久久大逼视频| 制服下的诱惑暮生| 国产午夜精品久久久久久免费视| 欧美性猛交xxxxx少妇| 色天使色偷偷av一区二区| 99热这里只有精品66| 亚洲色图欧美制服丝袜另类第一页| 综合图区亚洲| 国产精品成熟老女人| 一区二区在线视频观看| 欧洲精品码一区二区三区免费看| 欧美高清一区| 天美星空大象mv在线观看视频| 国产伦精品一区二区三区视频青涩 | 全亚洲第一av番号网站| 亚洲综合第一页| 日本成人小视频| 国模无码视频一区二区三区| 国产精品99久久久| 黄色免费一级视频| 欧美性色xo影院| 搡老岳熟女国产熟妇| 久久夜色精品国产| avav成人| 国产精品露脸av在线| 老司机成人在线| 欧美一级中文字幕| 久久国产人妖系列| 精品无码人妻一区二区免费蜜桃| 亚洲午夜精品一区二区三区他趣| 91久久精品无码一区二区| 亚洲午夜未满十八勿入免费观看全集| 久久免费电影| 1卡2卡3卡精品视频| 97精品国产| www.精品在线| 国产精品一区二区91| 日本精品久久久久中文| 日韩欧美极品在线观看| 性插视频在线观看| 国精产品一区一区三区有限在线| 免费观看亚洲天堂| 天堂av免费看| 国产在线精品一区二区不卡了| 成人性视频免费看| 欧美午夜影院一区| 超碰97在线免费观看| 国产精品h片在线播放| а天堂中文最新一区二区三区| 色999五月色| 欧美精品三级| 精品人妻一区二区乱码| 亚洲欧美日韩国产中文在线| 国产精品久久久久久无人区| 日韩一区二区福利| 欧美爱爱视频| 久久久无码中文字幕久...| 国产资源精品在线观看| 国产高潮国产高潮久久久91 | 欧美伦理影院| 少妇激情一区二区三区| 国产精品麻豆99久久久久久| 伊人精品一区二区三区| 精品国产一区二区三区久久久| www一区二区三区| 欧美日韩视频免费| 成人av先锋影音| 成人毛片18女人毛片| 亚洲欧美日韩成人| 成人四虎影院| 中国一级黄色录像| 成人黄色网址在线观看| 国产成人在线播放视频| 国产婷婷色综合av蜜臀av| jizzjizz少妇亚洲水多| 黄色高清视频网站| 成人免费的视频| 日韩av免费播放| 久久精品国产清自在天天线| 51亚洲精品| av黄色在线网站| 中文字幕欧美区| 亚洲av无码一区二区三区dv | 精品国产三级a∨在线| 国产成人在线电影| 在线免费黄色av| 日韩网站免费观看高清| 成人18夜夜网深夜福利网| 免费看a级黄色片| 伊人开心综合网| 一区二区视频网| 免费av一区二区| 日本亚洲不卡| 亚洲a级黄色片| 亚洲成人手机在线| 91在线品视觉盛宴免费| 国产福利久久| 青青草伊人久久| 国产第一页在线播放| 一区二区三区视频免费| 免费观看亚洲天堂| 亚洲成人福利在线观看| 悠悠色在线精品| 经典三级在线| 粉嫩av免费一区二区三区| 日本va欧美va精品| 国产精品第9页| 久久香蕉国产线看观看av|