精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Anthropic提出Contextual Retrieval讓RAG再進化,大幅降低檢索失敗率

發布于 2024-9-23 09:42
瀏覽
0收藏

在知識庫問答等場景中,RAG已經成為當下最流行的LLM應用范式,為LLM提供又全又準的上下文信息是眾多RAG技術努力的方向。在傳統的 RAG 解決方案中,編碼信息時往往會丟失上下文,這導致系統無法從知識庫中檢索到相關信息,如何能夠更好地保留上下文信息成為了問題關鍵。

Anthropic 研究團隊提出了“Contextual Retrieval(上下文檢索)”的創新方法在此領域取得了顯著進展。近日,他們發表文章[1]可披露了這一技術的細節,他們通過上下文嵌入(Contextual Embeddings)和上下文 BM25(Contextual BM25)(文本檢索)可以將檢索失敗率減少 49%,聯合重排序(reranking),失敗率可減少 67%。

我們一起來了解這一方法的核心內容。

上下文檢索的創新點

傳統的 RAG 系統在分割文檔時會破壞上下文,導致檢索到的信息分塊缺乏足夠的背景信息。

例如,假設你有一個包含財務信息的知識庫,并收到以下問題:“ACME 公司在 2023 年第二季度的收入增長是多少?”一個相關的分塊可能包含這樣的文本:“公司的收入比上一季度增長了 3%。”然而,這個分塊本身并沒有指定是哪家公司或相關的時間段,導致難以檢索到正確的信息或有效地使用這些信息。

研究團隊嘗試過一些業內流行的改進措施,諸如:分塊中添加文檔摘要(adding generic document summaries to chunks)[2],假設文檔嵌入(hypothetical document embedding)[3],以及索引摘要(summary-based indexing)[4],但都效果不佳。

他們通過大量實驗摸索,采用上下文檢索時通過在嵌入前為每個分塊添加特定的解釋性上下文(Contextual Embeddings)和創建 BM25 索引(Contextual BM25)來解決這個問題。例如:

原始分塊 = "公司的收入比上一季度增長了3%。"
上下文化分塊 = "這個分塊來自ACME公司在2023年第二季度的SEC文件;上一季度的收入為3.14億美元。公司的收入比上一季度增長了3%。"

Anthropic提出Contextual Retrieval讓RAG再進化,大幅降低檢索失敗率-AI.x社區圖片

這種方法顯著提高了檢索的準確性,特別是在處理包含特定標識符或技術術語的查詢時。

如何實現上下文檢索

手動為知識庫中的成千上萬個分塊添加上下文顯然是不現實的。為此,研究團隊使用了 Claude 模型,通過一個特定的提示生成每個分塊的簡潔上下文,生成的上下文通常為 50-100 個 token,然后在嵌入和創建 BM25 索引之前將其添加到分塊中。

這是官方 prompt 示例:

<document>
{{WHOLE_DOCUMENT}}
</document>
Here is the chunk we want to situate within the whole document
<chunk>
{{CHUNK_CONTENT}}
</chunk>
Please give a short succinct context to situate this chunk within the overall document for the purposes of improving search retrieval of the chunk. Answer only with the succinct context and nothing else.

Anthropic提出Contextual Retrieval讓RAG再進化,大幅降低檢索失敗率-AI.x社區

以下是詳細的實現步驟:

  1. 生成上下文

首先,研究團隊使用 Claude 為每個分塊生成上下文。通過設計一個特定的提示,Claude 可以為每個分塊生成簡潔而有意義的上下文。

例如,假設我們有一個分塊:

“公司的收入比上一季度增長了3%。”

我們可以設計一個提示,讓 Claude 生成上下文:

“請為以下分塊生成一個簡潔的上下文:‘公司的收入比上一季度增長了3%。’”

Claude 可能會生成以下上下文:

“這個分塊來自ACME公司在2023年第二季度的SEC文件;上一季度的收入為3.14億美元。公司的收入比上一季度增長了3%。”
  1. 添加上下文到分塊

生成上下文后,將其添加到原始分塊中。這樣,每個分塊都包含了足夠的背景信息,便于后續的檢索和使用。

上下文化分塊 = "這個分塊來自ACME公司在2023年第二季度的SEC文件;上一季度的收入為3.14億美元。公司的收入比上一季度增長了3%。"
  1. 創建嵌入

接下來,使用嵌入模型將上下文化分塊轉換為向量嵌入。向量嵌入是高維空間中的點,表示文本的語義含義。常用的嵌入模型包括 Voyage 和 Gemini,它們在實驗中表現出色。

嵌入向量 = 嵌入模型(上下文化分塊)
  1. 創建 BM25 索引

除了生成嵌入,還需要為上下文化分塊創建 BM25 索引。BM25 是一種基于詞頻和逆文檔頻率的檢索算法,能夠有效地衡量文本分塊與查詢之間的相關性。

BM25索引 = BM25模型(上下文化分塊)
  1. 存儲和檢索

將生成的嵌入向量和 BM25 索引存儲在向量數據庫和 BM25 索引庫中。這樣,當用戶輸入查詢時,系統可以同時使用嵌入向量和 BM25 索引進行檢索,從而找到最相關的上下文化分塊。

向量數據庫.存儲(嵌入向量)
BM25索引庫.存儲(BM25索引)
  1. 重排序

在檢索到相關分塊后,使用重排序技術對分塊進行過濾和排序,確保只有最相關的分塊被傳遞給生成模型。重排序可以顯著提高檢索的準確性和相關性。

相關分塊 = 向量數據庫.檢索(查詢)
重排序分塊 = 重排序模型(相關分塊)

在實現上下文檢索時,研究團隊特別指出需要考慮以下幾點:

  1. 分塊策略:考慮如何將文檔分割成分塊分塊大小、邊界和重疊的選擇會影響檢索性能。
  2. 嵌入模型:選擇合適的嵌入模型,對提高上下文檢索性能幫助更大,Gemini[5]Voyage[6]在測試中表現更好。
  3. 自定義上下文提示:雖然通用提示效果良好,但仍然可能需要針對一些場景定制提示來獲得更好的結果。
  4. 分塊的數量:將更多的塊添加到上下文窗口中,增加了包含相關信息的可能性。然而,過多的信息可能會使模型分心,因此存在一個限制。研究團隊嘗試了提供 5、10 和 20 塊,發現使用 20 塊在這三個選項中表現最佳,但仍然在一些具體場景中進行實驗選擇。
  5. 持續評估:通過將上下文化的語塊傳遞給響應生成器,并區分上下文和語塊,可以改進響應生成。

效果如何

研究團隊的實驗結果顯示:

  • 上下文嵌入將前 20 個分塊的檢索失敗率減少了 35%(從 5.7%降至 3.7%)。
  • 結合上下文嵌入和上下文 BM25 將前 20 個分塊的檢索失敗率減少了 49%(從 5.7%降至 2.9%)。

Anthropic提出Contextual Retrieval讓RAG再進化,大幅降低檢索失敗率-AI.x社區

同時,利用提示緩存技術降低了使用成本。通過提示緩存,您不需要為每一塊都傳遞參考文檔。您只需將文檔加載到緩存中一次,然后引用之前緩存的內容即可。假設每塊有 800 個 token,8k 個 token 的文檔,50 個 token 的上下文指令,以及每塊 100 個 token 的上下文,生成上下文化塊的一次性成本為每百萬文檔 token1.02 美元。

聯合重排序進一步提升性能

Anthropic提出Contextual Retrieval讓RAG再進化,大幅降低檢索失敗率-AI.x社區

在傳統 RAG 中,AI 系統會從知識庫中檢索到大量潛在相關的信息分塊。對于大型知識庫,這一初始檢索往往會返回大量分塊,有時多達數百個,且相關性和重要性各不相同。重排序是一種常用的過濾技術,確保只有最相關的分塊被傳遞給模型。實驗結果顯示,重排序后的上下文嵌入和上下文 BM25 將前 20 個分塊的檢索失敗率減少了 67%(從 5.7%降至 1.9%)。

Anthropic提出Contextual Retrieval讓RAG再進化,大幅降低檢索失敗率-AI.x社區

同時注意,由于重排序在運行時增加了額外的步驟,即使所有分塊都是并行評分,也必然會增加一小部分延遲,在重排序大量分塊時表現更加明顯。重排序在使用更多分塊以獲得更好性能與更少分塊以降低延遲和成本之間存在取舍,這需要在具體的場景下嘗試不同的設置,以找到合適的平衡點。

總結

研究團隊通過大量的實驗,為大家指出了一個新的提升 RAG 性能的方法,為開發者指出了實踐新方向。

同時,研究團隊基于大量實驗的結果,給出了一些關鍵的經驗總結:

  1. 嵌入+BM25 比單獨使用嵌入效果更好(向量檢索與文本檢索相結合);
  2. Voyage 和 Gemini 是測試中效果最好的嵌入模型;
  3. 將前 20 個分塊傳遞給模型比僅傳遞前 10 個或前 5 個分塊更有效;
  4. 分塊添加上下文顯著提高了檢索準確性;
  5. 重排序比不重排序效果更好;
  6. 所有這些改進措施可以疊加:結合上下文嵌入(Voyage 或 Gemini)、上下文 BM25 和重排序步驟,并將前 20 個分塊添加到提示中,可以最大化性能提升。

對于該方法感興趣的讀者,可以在cookbook[7]指導下上手體驗。

參考資料

[1]文章: https://www.anthropic.com/news/contextual-retrieval

[2]分塊中添加文檔摘要(adding generic document summaries to chunks): https://aclanthology.org/W02-0405.pdf

[3]假設文檔嵌入(hypothetical document embedding): https://arxiv.org/abs/2212.10496

[4]索引摘要(summary-based indexing): https://www.llamaindex.ai/blog/a-new-document-summary-index-for-llm-powered-qa-systems-9a32ece2f9ec

[5]Gemini: https://ai.google.dev/gemini-api/docs/embeddings

[6]Voyage: https://www.voyageai.com/

[7]cookbook: https://github.com/anthropics/anthropic-cookbook/tree/main/skills/contextual-embeddings

本文轉載自 ??AI工程化??,作者: ully

收藏
回復
舉報
回復
相關推薦
精品国产污污免费网站入口 | 欧美日韩高清丝袜| 日韩一区二区三区免费| 国产精品国产三级国产有无不卡 | 一区二区三区蜜桃| 久久av免费一区| 亚洲天堂777| 亚洲激情自拍| 精品国产一区二区三区在线观看| 国产女主播在线播放| 日韩高清在线| 亚洲超碰97人人做人人爱| 神马影院一区二区三区| 亚洲免费成人在线| 日韩制服丝袜av| 欧美激情精品久久久久久蜜臀| 中文字幕网站在线观看| 动漫3d精品一区二区三区乱码| 在线精品国精品国产尤物884a| 91精品国产毛片武则天| yourporn在线观看视频| 国产福利精品一区| 国产精品丝袜视频| 国产精品久久久久久99| 午夜国产精品视频免费体验区| 亚洲欧美国产另类| 日本不卡视频一区| 99精品美女视频在线观看热舞| 欧美午夜视频一区二区| 久艹在线免费观看| 欧美一区二区三区在线观看免费| 99精品在线观看视频| 5g国产欧美日韩视频| 无码人妻精品一区二| 亚洲精品护士| 久久97久久97精品免视看 | 婷婷伊人综合中文字幕| 国产精品一区二区三区四区| 国产精品免费久久久| 青青青国产在线| 99精品欧美| 欧美激情手机在线视频| 麻豆精品一区二区三区视频| 国产精品88久久久久久| 色综合亚洲精品激情狠狠| 永久免费成人代码| 国产一区二区三区不卡视频网站| 日韩精品欧美国产精品忘忧草| 丰满人妻一区二区三区免费视频棣| 日韩黄色三级| 欧美日本在线看| 九九热免费在线观看| 久久野战av| 色狠狠综合天天综合综合| 2022亚洲天堂| 在线观看的黄色| 欧美日韩一区二区在线| 日韩中文字幕在线视频观看| 激情国产在线| 精品福利一区二区| 欧美s码亚洲码精品m码| 亚洲欧美韩国| 色综合天天综合给合国产| 无码人妻丰满熟妇区五十路百度| 久草在线资源福利站| 欧美日韩国产一中文字不卡| 欧美日韩亚洲一| 桃花岛tv亚洲品质| 欧美三区在线视频| 国产成人美女视频| 日韩av综合| 亚洲成人av在线| 丰满少妇在线观看资源站| 蜜臀久久99精品久久一区二区| 亚洲精品自产拍| 亚洲精品一区二区三区影院忠贞| sdde在线播放一区二区| 久久激情视频免费观看| 538精品在线观看| 影音先锋日韩资源| 欧美一区第一页| 国产一卡二卡三卡| 久久99热国产| 丁香五月网久久综合| 性xxxx视频播放免费| 国产日韩视频一区二区三区| 夜夜春亚洲嫩草影视日日摸夜夜添夜| 免费人成在线观看播放视频| 一区二区三区四区高清精品免费观看| 福利视频一区二区三区四区| 亚洲综合电影| 欧美精品精品一区| 亚洲av成人片无码| 日韩大片在线播放| 国内精品一区二区三区| 69视频免费在线观看| 日本美女一区二区| 成人欧美一区二区| 成人高清在线| 亚洲国产精品天堂| 中文字幕第17页| 国产 日韩 欧美 综合 一区| 国产亚洲精品va在线观看| 日韩黄色免费观看| 久久综合九色| 不卡日韩av| yes4444视频在线观看| 亚洲无人区一区| 亚洲成人天堂网| 美女福利一区| 欧美精品在线观看91| 欧美brazzers| av成人动漫在线观看| 91免费网站视频| 欧美91看片特黄aaaa| 日韩欧美电影一二三| 日韩黄色中文字幕| 99亚洲伊人久久精品影院红桃| 国产精品亚洲片夜色在线| 日韩一区二区三区在线观看视频| 国产精品美女久久久久高潮| 日本精品一区在线观看| 2023国产精华国产精品| 日韩中文字幕精品| 无码人妻av免费一区二区三区| 成a人片亚洲日本久久| 欧美性受黑人性爽| 99久久综合国产精品二区| 日韩精品免费一线在线观看| 久久久精品视频免费| 精品无码三级在线观看视频| 日韩精品成人一区二区在线观看| 成全电影大全在线观看| 欧美一区二区网站| 少妇高潮惨叫久久久久| 久久精品免费| 久久精品日产第一区二区三区精品版 | 波多野结衣91| 轻点好疼好大好爽视频| 日本免费一区二区三区等视频| 亚洲性日韩精品一区二区| 国产精品xxxx喷水欧美| 成人毛片在线观看| 国产欧美精品aaaaaa片| 欧美国产中文高清| 久久精品视频在线| 一级淫片免费看| 国产精品毛片a∨一区二区三区| 欧美两根一起进3p做受视频| 综合综合综合综合综合网| 欧美一级视频在线观看| 免费播放片a高清在线观看| 欧美日韩亚洲成人| 9.1成人看片免费版| 另类国产ts人妖高潮视频| 久久综合福利| 最新日韩三级| 尤物tv国产一区| 一区二区日韩在线观看| 中文字幕一区二区在线观看| 亚洲第一天堂久久| 在线中文字幕亚洲| 国产精品对白刺激久久久| 大黄网站在线观看| 亚洲激情第一页| 九九热在线免费观看| 久久九九影视网| 网站一区二区三区| 久久久久久久久久久9不雅视频| 成人在线免费观看视视频| 综合久久2019| 亚洲国产欧美一区二区丝袜黑人 | 久久久xxx| 亚洲午夜精品久久久中文影院av| 亚洲三级在线| 久久免费福利视频| 国产在线一二| 88在线观看91蜜桃国自产| 五月婷婷一区二区| 91啪亚洲精品| 三上悠亚在线一区| 欧美视频不卡| 欧美日韩三区四区| 成人豆花视频| 91a在线视频| 日本天堂在线观看| 精品久久五月天| youjizz在线视频| 国产精品电影院| 俄罗斯黄色录像| 日韩精品一二三四| 特级西西人体www高清大胆| 日韩av影院| 国产免费一区二区三区在线能观看| 大片免费在线看视频| 亚洲精品国产精品国产自| 这里只有久久精品视频| 一级中文字幕一区二区| 一级片手机在线观看| 国产美女久久久久| 1024av视频| 永久亚洲成a人片777777| 欧美系列一区| 超碰成人在线观看| 国产欧美日韩亚洲精品| 天天综合av| 欧美大片免费看| yourporn在线观看视频| 日韩成人av在线| 国产成人精品一区二三区四区五区 | 亚洲人成在线免费观看| 午夜老司机福利| 欧美偷拍一区二区| 国产又大又黑又粗免费视频| 1000精品久久久久久久久| 色婷婷av777| 国产91丝袜在线观看| 色乱码一区二区三区在线| 亚洲精品字幕| www.亚洲成人网| 天天色综合色| 亚洲国内在线| 国产免费播放一区二区| 国产在线一区二区三区欧美 | 欧美精品视频www在线观看| 国产精品视频一区在线观看| 亚洲高清视频中文字幕| 麻豆一区产品精品蜜桃的特点| 中文字幕日韩欧美一区二区三区| 成人午夜剧场视频网站| 91丨porny丨国产| 人妻av一区二区| 成人看片黄a免费看在线| 一级黄色免费毛片| 国产在线精品免费| 久久久久久久久久毛片| 久久66热偷产精品| 亚洲一区二区福利视频| 美女视频一区二区三区| 黄色三级视频片| 老牛国产精品一区的观看方式| 男人用嘴添女人下身免费视频| 国产精品hd| 欧美做暖暖视频| 欧美激情视频一区二区三区在线播放 | 欧美~级网站不卡| 中文字幕超清在线免费观看| 91精品国产91久久综合| 异国色恋浪漫潭| 欧美二区不卡| 免费高清一区二区三区| 极品av少妇一区二区| 国产欧美日韩小视频| 伊人蜜桃色噜噜激情综合| 18禁网站免费无遮挡无码中文| 一区在线观看| 国产第一页视频| 日本特黄久久久高潮| 少妇一级淫免费播放| 激情综合五月天| 波多野结衣电影免费观看| 成人小视频在线| 性色av蜜臀av色欲av| 久久久蜜桃精品| 日本猛少妇色xxxxx免费网站| 中文字幕亚洲综合久久菠萝蜜| 欧美日韩午夜视频| 亚洲午夜久久久久中文字幕久| 日韩经典在线观看| 一本大道久久a久久综合| 正在播放木下凛凛xv99| 91精品免费观看| 懂色av蜜臀av粉嫩av分享吧| 亚洲精品一区二区三区精华液 | 欧美精品在线免费播放| 爱啪啪综合导航| 国产精品7m视频| 999色成人| 精品国产_亚洲人成在线| 国产一区不卡| 国产乱子伦精品无码专区| 日韩一级免费| 欧美午夜aaaaaa免费视频| 国产在线播精品第三| 亚洲天堂2024| 欧美国产视频在线| 久久久久久福利| 91国内精品野花午夜精品| 国产精品视频在线观看免费| 精品国内片67194| 国产黄在线观看| 欧美激情一区二区三区久久久| xxxxx性欧美特大| 亚洲自拍偷拍色图| 神马久久一区二区三区| 日韩最新中文字幕| 亚洲一区二区网站| 成人性生交视频免费观看| 91在线视频免费观看| 999精品在线视频| 日韩欧美在线视频观看| 国产偷拍一区二区| 亚洲欧美一区二区激情| av片哪里在线观看| 国产精品久久久久久久一区探花| 99久久人爽人人添人人澡| 亚洲欧美日韩国产成人综合一二三区| 国产一区二区中文| 天堂一区在线观看| 91蜜桃婷婷狠狠久久综合9色| 一级片一级片一级片| 欧美日韩在线视频观看| www.四虎在线观看| 最新的欧美黄色| www.成人影院| 国产欧美日韩综合精品二区| 91精品国产乱码久久久久久| 国产精彩免费视频| 99久久久免费精品国产一区二区| 亚洲一级生活片| 欧美日韩一区中文字幕| 亚洲色图狠狠干| 久久久久久中文字幕| 国产亚洲高清一区| 亚洲精品一区二区三区蜜桃久| 国产精品毛片在线看| 精品伦一区二区三区| 亚洲乱码中文字幕| 亚洲一级视频在线观看| 亚洲视频在线播放| 欧美成人黑人| 久久久久一区二区| 国产欧美日韩一区二区三区在线| 99免费观看视频| 一区二区三区日韩在线观看| 91国偷自产中文字幕久久| 国产一区二区三区在线免费观看 | 欧美性猛交xxxx偷拍洗澡| 秋霞av鲁丝片一区二区| 欧美黄色性视频| 一区二区三区视频播放| 日本成人在线不卡| 国产精品综合av一区二区国产馆| 国产精品久久久免费看| 欧美日韩精品电影| 伊人免费在线| 成人自拍性视频| 欧美jizzhd精品欧美巨大免费| 韩国一区二区在线播放| 亚洲三级免费观看| 国产wwwxxx| 久久91精品国产| 狠狠久久伊人| 国产91在线视频观看| 久久久www免费人成精品| 欧美男人天堂网| 最近2019中文免费高清视频观看www99 | 亚洲美女色禁图| 免费a级黄色片| 欧美午夜一区二区三区免费大片| 91精彩视频在线观看| 91精品综合视频| 国产一在线精品一区在线观看| 97精品人妻一区二区三区蜜桃| 黑人极品videos精品欧美裸| 蜜芽tv福利在线视频| 国产精品一区二区三区成人| 午夜精品毛片| aaa黄色大片| 欧美日韩美女在线| 在线观看免费版| 亚洲最大福利视频网| 一区在线视频| 最新中文字幕av| 欧美一区二区三区在线观看视频| 色女人在线视频| 欧美乱偷一区二区三区在线| 人禽交欧美网站| 久久久久亚洲av成人片| 精品视频偷偷看在线观看| 国产乱子精品一区二区在线观看| 成人国产一区二区三区| 91视频91自| 国产又粗又猛又黄又爽无遮挡| 欧美夫妻性生活xx| 最近国产精品视频| av影片在线播放| 色综合久久综合网97色综合| av大片在线播放| 国产精品一区二区三区免费| 天堂影院一区二区| 欧美做爰爽爽爽爽爽爽| 日韩风俗一区 二区| 少妇精品视频在线观看| 少妇高潮毛片色欲ava片| 国产精品美女久久久久久2018| 搡老岳熟女国产熟妇| 国产欧美日韩免费看aⅴ视频| 亚洲精品裸体| 九一在线免费观看|