精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

LLM超長上下文查詢-性能評估實戰(zhàn)

發(fā)布于 2024-6-14 11:49
瀏覽
0收藏

在大型語言模型(LLM)的應(yīng)用中,有幾個場景需要以結(jié)構(gòu)化的方式呈現(xiàn)數(shù)據(jù),其中信息提取和查詢分析是兩個典型的例子。我們最近通過更新的文檔和一個專門的代碼倉庫強調(diào)了信息提取的重要性。對于查詢分析,我們同樣更新了相關(guān)文檔。在這些場景中,數(shù)據(jù)字段可能包括字符串、布爾值、整數(shù)等多種類型。而在這些類型中,處理高基數(shù)的分類值(即枚舉類型)是最具挑戰(zhàn)性的。

LLM超長上下文查詢-性能評估實戰(zhàn)-AI.x社區(qū)

所謂的“高基數(shù)分類值”,指的是那些必須從有限的選項中選擇的值,這些值不能隨意指定,而必須來自一個預定義的集合。當這個集合中的有效值數(shù)量非常龐大時,我們稱之為“高基數(shù)”。處理這類值之所以困難,是因為LLM本身并不知道這些可能的值是什么。因此,我們需要向LLM提供關(guān)于這些可能值的信息。如果忽略了這一點,LLM可能會自行編造值。對于只有少數(shù)幾個可能值的情況,我們可以通過在提示中明確列出這些值來解決。但是,當可能的值非常多時,問題就變得復雜了。

隨著可能值數(shù)量的增加,LLM正確選擇值的難度也隨之增加。一方面,如果可能的值太多,它們可能無法適應(yīng)LLM的上下文窗口。另一方面,即使所有可能的值都能適應(yīng)上下文,將它們?nèi)堪趦?nèi)會導致處理速度變慢、成本增加,以及LLM在處理大量上下文時的推理能力下降。

我們最近對查詢分析進行了深入研究,并在修訂相關(guān)文檔時特別增加了一個關(guān)于如何處理高基數(shù)分類值的頁面。在這篇博客中,我們將深入探討幾種實驗性方法,并提供它們的性能基準測試結(jié)果。

結(jié)果的概覽可以在LangSmithhttps://smith.langchain.com/public/8c0a4c25-426d-4582-96fc-d7def170be76/d?ref=blog.langchain.dev中查看。接下來,我們將詳細介紹:

LLM超長上下文查詢-性能評估實戰(zhàn)-AI.x社區(qū)

數(shù)據(jù)集概覽

詳細的數(shù)據(jù)集可以在這里查看https://smith.langchain.com/public/8c0a4c25-426d-4582-96fc-d7def170be76/d?ref=blog.langchain.dev。

為了模擬這一問題,我們假設(shè)了一個場景:我們要查找某位作者關(guān)于外星人的書籍。在這個場景中,作者字段是一個高基數(shù)分類變量——可能的值有很多,但它們應(yīng)該是特定的有效作者名字。為了測試這一點,我們創(chuàng)建了一個包含作者姓名和常用別名的數(shù)據(jù)集。例如,“Harry Chase”可能是“Harrison Chase”的別名。我們希望智能系統(tǒng)能夠處理這類別名。有了這個姓名和別名列表后,我們又生成了10,000個隨機姓名。需要注意的是,10,000的基數(shù)并不算高——對于企業(yè)級系統(tǒng)來說,可能要面對的是數(shù)百萬級別的基數(shù)。

利用這個數(shù)據(jù)集,我們提出了這樣的問題:“Harry Chase關(guān)于外星人的書有哪些?”我們的查詢分析系統(tǒng)應(yīng)該能夠?qū)⑦@個問題解析為結(jié)構(gòu)化格式,包含兩個字段:主題和作者。在這個例子中,預期的輸出應(yīng)該是{“topic”: “aliens”,“author”: “Harrison Chase”}。我們期望系統(tǒng)能夠識別出沒有名為Harry Chase的作者,但Harrison Chase可能是用戶想要表達的意思。

通過這種設(shè)置,我們可以針對我們創(chuàng)建的別名數(shù)據(jù)集進行測試,檢查它們是否能夠正確映射到真實姓名。同時,我們還會記錄查詢的延遲和成本。這種查詢分析系統(tǒng)通常用于搜索,因此我們非常關(guān)心這兩個指標。出于這個原因,我們也限制了所有方法只能進行一次LLM調(diào)用。我們可能會在未來的文章中對使用多次LLM調(diào)用的方法進行基準測試。

接下來,我們將介紹幾種不同的方法及其性能表現(xiàn)。

LLM超長上下文查詢-性能評估實戰(zhàn)-AI.x社區(qū)

完整的結(jié)果可以在LangSmith中查看,復現(xiàn)這些結(jié)果的代碼可以在這里找到。

基線測試

首先,我們對LLM進行了基線測試,即在不提供任何有效姓名信息的情況下,直接要求LLM進行查詢分析。結(jié)果不出所料,沒有一個問題得到了正確回答。這是因為我們故意構(gòu)建了一個需要通過別名查詢作者的數(shù)據(jù)集。

上下文填充法

在這種方法中,我們將所有10,000個合法的作者姓名都放入了提示中,并要求LLM在進行查詢分析時記住這些是合法的作者姓名。一些模型(如GPT-3.5)由于上下文窗口的限制,根本無法執(zhí)行這個任務(wù)。對于其他具有更長上下文窗口的模型,它們在準確選擇正確姓名方面也遇到了困難。GPT-4只在26%的案例中選擇了正確的姓名。它最常見的錯誤是提取了姓名但沒有進行校正。這種方法不僅速度慢,成本也高,平均需要5秒鐘才能完成,總成本為8.44美元。

LLM前過濾法

我們接下來測試的方法是在將可能的值列表傳遞給LLM之前進行過濾。這樣做的好處是只傳遞可能姓名的子集給LLM,這樣LLM需要考慮的姓名就少得多,希望能夠讓它更快、更便宜、更準確地完成查詢分析。但這也增加了一個新的潛在失敗模式——如果初步過濾出錯怎么辦?

基于嵌入的過濾法

我們最初使用的過濾方法是嵌入法,并選擇了與查詢最相似的10個姓名。需要注意的是,我們是將整個查詢與姓名進行比較,這并不是一個理想的比較方式!

我們發(fā)現(xiàn),使用這種方法,GPT-3.5能夠正確處理57%的案例。這種方法比以前的方法快得多,也便宜得多,平均只需要0.76秒就能完成,總成本僅為0.002美元。

基于NGram相似性的過濾法

我們使用的第二種過濾方法是對所有有效姓名的3-gram字符序列進行TF-IDF向量化,并使用向量化的有效姓名與向量化的用戶輸入之間的余弦相似度來選擇最相關(guān)的10個有效姓名添加到模型提示中。同樣需要注意的是,我們是將整個查詢與姓名進行比較,這并不是一個理想的比較方式!

我們發(fā)現(xiàn),使用這種方法,GPT-3.5能夠正確處理65%的案例。這種方法同樣比以前的方法快得多,也便宜得多,平均只需要0.57秒就能完成,總成本僅為0.002美元。

LLM后選擇法

我們最后測試的方法是在LLM完成初步查詢分析后,嘗試糾正任何錯誤。我們首先對用戶輸入進行了查詢分析,沒有在提示中提供任何關(guān)于有效作者姓名的信息。這與我們最初進行的基線測試相同。然后,我們進行了一個后續(xù)步驟,取作者字段中的姓名,找到最相似的有效姓名。

基于嵌入相似性的選擇法

首先,我們使用嵌入法進行了相似性檢查。

我們發(fā)現(xiàn),使用這種方法,GPT-3.5能夠正確處理83%的案例。這種方法比以前的方法快得多,也便宜得多,平均只需要0.66秒就能完成,總成本僅為0.001美元。

基于NGram相似性的選擇法

最后,我們嘗試使用3-gram向量化器進行相似性檢查。

我們發(fā)現(xiàn),使用這種方法,GPT-3.5能夠正確處理74%的案例。這種方法同樣比以前的方法快得多,也便宜得多,平均只需要0.48秒就能完成,總成本僅為0.001美元。

結(jié)論

我們對處理高基數(shù)分類值的查詢分析方法進行了多種基準測試。我們限制了自己只能進行一次LLM調(diào)用,這是為了模擬現(xiàn)實世界中的延遲限制。我們發(fā)現(xiàn),使用LLM后基于嵌入相似性的選擇方法表現(xiàn)最佳。

還有其他方法值得進一步測試。特別是,在LLM調(diào)用之前或之后尋找最相似的分類值有許多不同的方法。此外,本數(shù)據(jù)集中的類別基數(shù)并不像許多企業(yè)系統(tǒng)所面臨的那樣高。這個數(shù)據(jù)集大約有10,000個值,而許多現(xiàn)實世界中的系統(tǒng)可能需要處理的是數(shù)百萬級別的基數(shù)。因此,對更高基數(shù)的數(shù)據(jù)進行基準測試將是非常有價值的。

本文轉(zhuǎn)載自 ??AI小智??,作者: AI小智

收藏
回復
舉報
回復
相關(guān)推薦
亚洲男人在线| 国产精品无码白浆高潮| 少妇久久久久| 欧美三区在线观看| www.国产亚洲| 美州a亚洲一视本频v色道| 久久99精品国产| 国内揄拍国内精品| 妖精视频在线观看免费| 99久久婷婷国产综合精品青牛牛| 欧美丝袜一区二区三区| 中文字幕欧美人与畜| 好男人www在线视频| 蜜臂av日日欢夜夜爽一区| 欧美日韩国产999| 一色道久久88加勒比一| 日韩免费一级| 欧美日韩一级黄| 欧美精品自拍视频| 大片免费在线看视频| 91丨porny丨户外露出| 91啪国产在线| 最近中文字幕免费观看| 国产日韩高清一区二区三区在线| 久久久精品2019中文字幕神马| 一级特级黄色片| 国产精品一区二区精品视频观看| 狠狠色噜噜狠狠狠狠97| 一二三四中文字幕| 午夜在线观看视频| 久久久久久99久久久精品网站| 91九色偷拍| 中文字幕乱码中文字幕| 香蕉久久夜色精品| 午夜精品理论片| 丝袜美腿小色网| 日韩欧美中字| 国产午夜精品一区理论片飘花| www.美色吧.com| 久久九九精品视频| 欧美日韩国产综合视频在线观看 | 日韩欧美精品免费在线| 青青青在线观看视频| 黄色在线观看网站| 国产精品国产自产拍在线| 色噜噜一区二区| 成人精品一区二区| 国产性色一区二区| 欧美日韩精品不卡| 久蕉依人在线视频| 久久久久久久综合日本| 鲁片一区二区三区| 深夜影院在线观看| 91一区在线观看| 国产伦精品一区二区三区四区视频| 性一交一乱一乱一视频| 国产精品一区二区视频| 亚洲自拍小视频免费观看| av中文字幕观看| 国产黑丝在线一区二区三区| 99re国产在线播放| 亚洲乱色熟女一区二区三区| 国产mv日韩mv欧美| 国产欧美日韩综合精品二区| 色网站免费观看| 99久久精品国产精品久久| 久久久久久久久久久久久9999| 四虎精品成人免费网站| www成人在线观看| 日韩一区二区三区高清| 亚洲1卡2卡3卡4卡乱码精品| 成人免费在线视频| 日本免费a视频| 人在线成免费视频| 欧美在线你懂的| 国产大片一区二区三区| 日韩高清二区| 亚洲国产精品电影在线观看| 国产全是老熟女太爽了| 日韩在线二区| 欧美高清videos高潮hd| 日韩精品在线免费视频| 日韩精品福利网| 亚洲va久久久噜噜噜| 国产 日韩 欧美 综合| 91麻豆福利精品推荐| 亚洲日本精品国产第一区| 在线观看的网站你懂的| 婷婷综合五月天| 色婷婷狠狠18| 国产厕拍一区| 在线精品国产成人综合| a级黄色片免费看| 亚洲欧美日韩一区在线观看| 国产精品尤物福利片在线观看| 国产三级小视频| www久久久久| 中国一级黄色录像| 亚洲伦乱视频| 欧美videos中文字幕| 中文字幕网站在线观看| 国产精品观看| 国产精品毛片a∨一区二区三区|国| 国产色片在线观看| 久久久国产午夜精品| 日韩欧美猛交xxxxx无码| 日本成人三级电影| 亚洲成avwww人| 美女av免费看| 午夜亚洲性色福利视频| 亚洲综合色av| 日韩一卡二卡三卡| 深夜影院在线观看| 亚洲无线视频| 国产成人精品av在线| 99久久久国产精品无码免费| а√天堂8资源在线官网| 国产精品美女久久久久aⅴ| 久久手机在线视频| 秋霞国产精品| 日韩av网站大全| 青草影院在线观看| 日韩av一区二| 久久综合九色99| 欧美黑人xx片| 欧美久久久一区| 欧美黄色一级生活片| 亚洲人成久久| 国产乱码精品一区二区三区中文 | 福利视频一二区| 国产午夜精品一区在线观看 | 国产精品香蕉视屏| 成人在线免费看片| 欧美日韩亚洲综合一区 | 中文字幕一区二区三区精华液| 黄页免费在线观看视频| 视频国产精品| 欧美巨乳美女视频| 99久久久国产精品无码网爆| 国产精品乱码人人做人人爱| 午夜免费精品视频| 久久av资源| 国产91亚洲精品| 欧美日韩激情视频一区二区三区| 亚洲一区二区av电影| 日韩av成人网| 欧美午夜影院| 国产精品毛片va一区二区三区| www久久日com| 日韩欧美aaaaaa| 青青操视频在线播放| 国产精品一区二区男女羞羞无遮挡| 久久久国产精华液999999| 成人免费一区| 伊人av综合网| 亚洲中文字幕一区二区| 国产精品久久久久久久久搜平片| 美女在线视频一区二区| 天天综合精品| 91嫩草在线| 激情在线视频播放| 亚洲第一视频网| 午夜在线a亚洲v天堂网2018| 国产精品理论在线观看| 色多多国产成人永久免费网站| 中文字幕69页| 国产亚洲短视频| 亚洲国产高清av| 婷婷亚洲五月| 国产高清精品一区| 欧美久久天堂| 揄拍成人国产精品视频| 91精品中文字幕| 亚洲精品国产精华液| 中文字幕99页| 久久久久99| 中文字幕久久综合| 日韩免费一级| 欧美在线影院在线视频| √新版天堂资源在线资源| 777午夜精品视频在线播放| 久草视频在线免费看| 9i在线看片成人免费| 99热手机在线| 亚洲网站视频| 亚洲aⅴ天堂av在线电影软件| 一区在线影院| 久久久久久久久久久av| 国产精品一区二区婷婷| 欧美一区二区成人6969| 在线能看的av| 日韩一区欧美小说| 国产视频久久久久久| 欧美少妇在线观看| 日本欧美韩国| 久久91精品国产91久久跳| 人人妻人人澡人人爽久久av| 日韩欧美视频一区二区三区| 四虎永久免费地址| 成人av在线播放网址| av丝袜天堂网| 尤物在线精品| 一区二区三区日韩视频| 偷窥自拍亚洲色图精选| 91成人免费在线观看| 成人做爰视频www网站小优视频| 欧美成人网在线| 国产精品视频一区二区久久| 精品少妇一区二区三区免费观看| 成年人视频免费| 亚洲一区国产视频| 免费黄色国产视频| 久久天天做天天爱综合色| 香蕉视频1024| 美日韩一区二区三区| 精品国产免费av| 欧美二区视频| 在线观看一区二区三区三州| 美女久久久久| 国产在线欧美日韩| 免费观看亚洲天堂| 国产日韩精品综合网站| 日韩成人动漫| 欧洲成人午夜免费大片| 污网站在线免费看| 麻豆国产精品va在线观看不卡| 国产视频网站在线| 日韩成人在线免费观看| 懂色av一区二区三区四区| 欧美一级在线观看| 亚洲网站免费观看| 欧洲精品在线观看| 黑人精品无码一区二区三区AV| 亚洲一二三四区| 欧美成人三级视频| 一区二区三区日本| 18岁成人毛片| 亚洲老司机在线| 朝桐光av在线| 亚洲视频中文字幕| 日韩欧美国产成人精品免费| 成人欧美一区二区三区小说| 波多野结衣欲乱| 亚洲欧洲av在线| 黄视频网站免费看| 亚洲久本草在线中文字幕| 日本精品人妻无码77777| 亚洲视频狠狠干| 日韩精品123区| 亚洲六月丁香色婷婷综合久久 | 涩爱av色老久久精品偷偷鲁| 国产精品一区二区三区成人| 成人在线高清| 成人网在线免费看| 精品视频一二| 国产精品三区www17con| 另类图片第一页| 玛丽玛丽电影原版免费观看1977| 偷拍自拍一区| 日韩妆和欧美的一区二区| 日韩欧美一区免费| 99久re热视频精品98| 亚洲手机视频| 免费在线观看的av网站| 日韩激情在线观看| 久久国产激情视频| 国产精一区二区三区| 在线天堂www在线国语对白| 91老师片黄在线观看| 久操视频在线观看免费| 国产精品女主播av| 青青草在线观看视频| 午夜亚洲福利老司机| 伊人久久久久久久久久久久| 欧美色偷偷大香| 成 人 黄 色 片 在线播放| 亚洲第一网站免费视频| 黄色小视频在线免费观看| 日韩中文字幕在线观看| 成人免费高清观看| 国产精品成人久久久久| 麻豆国产精品| 蜜桃在线一区二区三区精品| 欧美电影免费播放| 日韩日韩日韩日韩日韩| 日韩高清一级片| 欧美一级片在线免费观看| 久久亚区不卡日本| 懂色av懂色av粉嫩av| 欧美性少妇18aaaa视频| 国产尤物在线观看| 亚洲精品久久久一区二区三区 | 国产精品传媒入口麻豆| 国产一级做a爱免费视频| 在线亚洲人成电影网站色www| 国产男女猛烈无遮挡| 日韩精品福利网站| 黄色动漫在线观看| 国产91免费观看| 色悠久久久久综合先锋影音下载| 日本午夜一区二区三区| 欧美.www| 久久久久国产一区| 99re成人精品视频| 农村妇女精品一区二区| 欧美午夜免费电影| 天堂在线中文网| 久久香蕉国产线看观看av| 日韩欧美另类一区二区| 成人在线视频电影| 国产精品国内免费一区二区三区| 女性女同性aⅴ免费观女性恋| 国产最新精品免费| 一区二区三区在线观看免费视频| 亚洲18色成人| 亚洲男人天堂久久| 久久成人这里只有精品| 韩国成人在线| 奇米精品在线| 亚洲深爱激情| 69亚洲乱人伦| 一区二区三区四区中文字幕| 这里只有精品免费视频| 亚洲另类欧美自拍| 2019中文字幕在线电影免费| 亚洲一区二区中文| 99久久夜色精品国产亚洲96 | 青青草国产一区二区三区| 欧美国产二区| 亚洲一区一卡| 女人被狂躁c到高潮| 午夜欧美一区二区三区在线播放| 国产精品羞羞答答在线| zzjj国产精品一区二区| 欧美一级免费| 亚洲精品高清视频| 美女免费视频一区二区| 成人在线观看免费高清| 欧美性猛交一区二区三区精品| 毛片免费在线| 日韩av色综合| 国内精品久久久久久99蜜桃| 丁香啪啪综合成人亚洲| 91网站在线观看视频| 欧美精品亚洲精品日韩精品| 亚洲成av人片在线观看香蕉| av在线播放资源| 久久久精彩视频| 西西裸体人体做爰大胆久久久| 毛茸茸多毛bbb毛多视频| 欧美性猛交xxxx乱大交极品| 日韩a在线看| 国产成人精彩在线视频九色| 成人精品影视| 午夜精品免费看| 亚洲精品国产一区二区三区四区在线| 国产剧情久久久| 欧美激情欧美激情| 精品视频自拍| 999在线免费视频| 中文字幕一区在线| 不卡av中文字幕| 97视频在线免费观看| 视频一区中文| 国产无遮挡猛进猛出免费软件| 亚洲欧洲成人精品av97| 亚洲成人中文字幕在线| 91成人国产在线观看| 国产91一区| 三区视频在线观看| 亚洲国产日韩一级| 嫩草研究院在线观看| 国产日韩综合一区二区性色av| 91精品电影| 免费的av网站| 欧美群妇大交群的观看方式| 在线视频观看国产| 久久综合九九| 狠狠色2019综合网| 自拍偷拍欧美亚洲| 日韩中文字幕免费看| www.成人网| 一区二区在线播放视频| 亚洲精品视频在线看| 牛牛澡牛牛爽一区二区| 91精品在线影院| 一本色道久久综合一区| 成年人二级毛片| 精品一区电影国产| 婷婷久久免费视频| 免费成人在线视频网站| 国产精品福利av| 五月激情婷婷网| 国产精品综合久久久| 亚洲日本激情| 成人免费黄色小视频| 亚洲欧美一区二区三区四区| 欧美日本三级| 成人性做爰aaa片免费看不忠| 亚洲综合av网|