精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

LLM超長(zhǎng)上下文查詢-性能評(píng)估實(shí)戰(zhàn)

發(fā)布于 2024-4-9 11:28
瀏覽
0收藏

在大型語(yǔ)言模型(LLM)的應(yīng)用中,有幾個(gè)場(chǎng)景需要以結(jié)構(gòu)化的方式呈現(xiàn)數(shù)據(jù),其中信息提取和查詢分析是兩個(gè)典型的例子。我們最近通過(guò)更新的文檔和一個(gè)專(zhuān)門(mén)的代碼倉(cāng)庫(kù)強(qiáng)調(diào)了信息提取的重要性。對(duì)于查詢分析,我們同樣更新了相關(guān)文檔。在這些場(chǎng)景中,數(shù)據(jù)字段可能包括字符串、布爾值、整數(shù)等多種類(lèi)型。而在這些類(lèi)型中,處理高基數(shù)的分類(lèi)值(即枚舉類(lèi)型)是最具挑戰(zhàn)性的。

LLM超長(zhǎng)上下文查詢-性能評(píng)估實(shí)戰(zhàn)-AI.x社區(qū)

所謂的“高基數(shù)分類(lèi)值”,指的是那些必須從有限的選項(xiàng)中選擇的值,這些值不能隨意指定,而必須來(lái)自一個(gè)預(yù)定義的集合。當(dāng)這個(gè)集合中的有效值數(shù)量非常龐大時(shí),我們稱(chēng)之為“高基數(shù)”。處理這類(lèi)值之所以困難,是因?yàn)長(zhǎng)LM本身并不知道這些可能的值是什么。因此,我們需要向LLM提供關(guān)于這些可能值的信息。如果忽略了這一點(diǎn),LLM可能會(huì)自行編造值。對(duì)于只有少數(shù)幾個(gè)可能值的情況,我們可以通過(guò)在提示中明確列出這些值來(lái)解決。但是,當(dāng)可能的值非常多時(shí),問(wèn)題就變得復(fù)雜了。

隨著可能值數(shù)量的增加,LLM正確選擇值的難度也隨之增加。一方面,如果可能的值太多,它們可能無(wú)法適應(yīng)LLM的上下文窗口。另一方面,即使所有可能的值都能適應(yīng)上下文,將它們?nèi)堪趦?nèi)會(huì)導(dǎo)致處理速度變慢、成本增加,以及LLM在處理大量上下文時(shí)的推理能力下降。

我們最近對(duì)查詢分析進(jìn)行了深入研究,并在修訂相關(guān)文檔時(shí)特別增加了一個(gè)關(guān)于如何處理高基數(shù)分類(lèi)值的頁(yè)面。在這篇博客中,我們將深入探討幾種實(shí)驗(yàn)性方法,并提供它們的性能基準(zhǔn)測(cè)試結(jié)果。

結(jié)果的概覽可以在LangSmithhttps://smith.langchain.com/public/8c0a4c25-426d-4582-96fc-d7def170be76/d?ref=blog.langchain.dev中查看。接下來(lái),我們將詳細(xì)介紹:

LLM超長(zhǎng)上下文查詢-性能評(píng)估實(shí)戰(zhàn)-AI.x社區(qū)

數(shù)據(jù)集概覽

詳細(xì)的數(shù)據(jù)集可以在這里查看https://smith.langchain.com/public/8c0a4c25-426d-4582-96fc-d7def170be76/d?ref=blog.langchain.dev。

為了模擬這一問(wèn)題,我們假設(shè)了一個(gè)場(chǎng)景:我們要查找某位作者關(guān)于外星人的書(shū)籍。在這個(gè)場(chǎng)景中,作者字段是一個(gè)高基數(shù)分類(lèi)變量——可能的值有很多,但它們應(yīng)該是特定的有效作者名字。為了測(cè)試這一點(diǎn),我們創(chuàng)建了一個(gè)包含作者姓名和常用別名的數(shù)據(jù)集。例如,“Harry Chase”可能是“Harrison Chase”的別名。我們希望智能系統(tǒng)能夠處理這類(lèi)別名。有了這個(gè)姓名和別名列表后,我們又生成了10,000個(gè)隨機(jī)姓名。需要注意的是,10,000的基數(shù)并不算高——對(duì)于企業(yè)級(jí)系統(tǒng)來(lái)說(shuō),可能要面對(duì)的是數(shù)百萬(wàn)級(jí)別的基數(shù)。

利用這個(gè)數(shù)據(jù)集,我們提出了這樣的問(wèn)題:“Harry Chase關(guān)于外星人的書(shū)有哪些?”我們的查詢分析系統(tǒng)應(yīng)該能夠?qū)⑦@個(gè)問(wèn)題解析為結(jié)構(gòu)化格式,包含兩個(gè)字段:主題和作者。在這個(gè)例子中,預(yù)期的輸出應(yīng)該是{“topic”: “aliens”,“author”: “Harrison Chase”}。我們期望系統(tǒng)能夠識(shí)別出沒(méi)有名為Harry Chase的作者,但Harrison Chase可能是用戶想要表達(dá)的意思。

通過(guò)這種設(shè)置,我們可以針對(duì)我們創(chuàng)建的別名數(shù)據(jù)集進(jìn)行測(cè)試,檢查它們是否能夠正確映射到真實(shí)姓名。同時(shí),我們還會(huì)記錄查詢的延遲和成本。這種查詢分析系統(tǒng)通常用于搜索,因此我們非常關(guān)心這兩個(gè)指標(biāo)。出于這個(gè)原因,我們也限制了所有方法只能進(jìn)行一次LLM調(diào)用。我們可能會(huì)在未來(lái)的文章中對(duì)使用多次LLM調(diào)用的方法進(jìn)行基準(zhǔn)測(cè)試。

接下來(lái),我們將介紹幾種不同的方法及其性能表現(xiàn)。

LLM超長(zhǎng)上下文查詢-性能評(píng)估實(shí)戰(zhàn)-AI.x社區(qū)

完整的結(jié)果可以在LangSmith中查看,復(fù)現(xiàn)這些結(jié)果的代碼可以在這里找到。

基線測(cè)試

首先,我們對(duì)LLM進(jìn)行了基線測(cè)試,即在不提供任何有效姓名信息的情況下,直接要求LLM進(jìn)行查詢分析。結(jié)果不出所料,沒(méi)有一個(gè)問(wèn)題得到了正確回答。這是因?yàn)槲覀児室鈽?gòu)建了一個(gè)需要通過(guò)別名查詢作者的數(shù)據(jù)集。

上下文填充法

在這種方法中,我們將所有10,000個(gè)合法的作者姓名都放入了提示中,并要求LLM在進(jìn)行查詢分析時(shí)記住這些是合法的作者姓名。一些模型(如GPT-3.5)由于上下文窗口的限制,根本無(wú)法執(zhí)行這個(gè)任務(wù)。對(duì)于其他具有更長(zhǎng)上下文窗口的模型,它們?cè)跍?zhǔn)確選擇正確姓名方面也遇到了困難。GPT-4只在26%的案例中選擇了正確的姓名。它最常見(jiàn)的錯(cuò)誤是提取了姓名但沒(méi)有進(jìn)行校正。這種方法不僅速度慢,成本也高,平均需要5秒鐘才能完成,總成本為8.44美元。

LLM前過(guò)濾法

我們接下來(lái)測(cè)試的方法是在將可能的值列表傳遞給LLM之前進(jìn)行過(guò)濾。這樣做的好處是只傳遞可能姓名的子集給LLM,這樣LLM需要考慮的姓名就少得多,希望能夠讓它更快、更便宜、更準(zhǔn)確地完成查詢分析。但這也增加了一個(gè)新的潛在失敗模式——如果初步過(guò)濾出錯(cuò)怎么辦?

基于嵌入的過(guò)濾法

我們最初使用的過(guò)濾方法是嵌入法,并選擇了與查詢最相似的10個(gè)姓名。需要注意的是,我們是將整個(gè)查詢與姓名進(jìn)行比較,這并不是一個(gè)理想的比較方式!

我們發(fā)現(xiàn),使用這種方法,GPT-3.5能夠正確處理57%的案例。這種方法比以前的方法快得多,也便宜得多,平均只需要0.76秒就能完成,總成本僅為0.002美元。

基于NGram相似性的過(guò)濾法

我們使用的第二種過(guò)濾方法是對(duì)所有有效姓名的3-gram字符序列進(jìn)行TF-IDF向量化,并使用向量化的有效姓名與向量化的用戶輸入之間的余弦相似度來(lái)選擇最相關(guān)的10個(gè)有效姓名添加到模型提示中。同樣需要注意的是,我們是將整個(gè)查詢與姓名進(jìn)行比較,這并不是一個(gè)理想的比較方式!

我們發(fā)現(xiàn),使用這種方法,GPT-3.5能夠正確處理65%的案例。這種方法同樣比以前的方法快得多,也便宜得多,平均只需要0.57秒就能完成,總成本僅為0.002美元。

LLM后選擇法

我們最后測(cè)試的方法是在LLM完成初步查詢分析后,嘗試糾正任何錯(cuò)誤。我們首先對(duì)用戶輸入進(jìn)行了查詢分析,沒(méi)有在提示中提供任何關(guān)于有效作者姓名的信息。這與我們最初進(jìn)行的基線測(cè)試相同。然后,我們進(jìn)行了一個(gè)后續(xù)步驟,取作者字段中的姓名,找到最相似的有效姓名。

基于嵌入相似性的選擇法

首先,我們使用嵌入法進(jìn)行了相似性檢查。

我們發(fā)現(xiàn),使用這種方法,GPT-3.5能夠正確處理83%的案例。這種方法比以前的方法快得多,也便宜得多,平均只需要0.66秒就能完成,總成本僅為0.001美元。

基于NGram相似性的選擇法

最后,我們嘗試使用3-gram向量化器進(jìn)行相似性檢查。

我們發(fā)現(xiàn),使用這種方法,GPT-3.5能夠正確處理74%的案例。這種方法同樣比以前的方法快得多,也便宜得多,平均只需要0.48秒就能完成,總成本僅為0.001美元。

結(jié)論

我們對(duì)處理高基數(shù)分類(lèi)值的查詢分析方法進(jìn)行了多種基準(zhǔn)測(cè)試。我們限制了自己只能進(jìn)行一次LLM調(diào)用,這是為了模擬現(xiàn)實(shí)世界中的延遲限制。我們發(fā)現(xiàn),使用LLM后基于嵌入相似性的選擇方法表現(xiàn)最佳。

還有其他方法值得進(jìn)一步測(cè)試。特別是,在LLM調(diào)用之前或之后尋找最相似的分類(lèi)值有許多不同的方法。此外,本數(shù)據(jù)集中的類(lèi)別基數(shù)并不像許多企業(yè)系統(tǒng)所面臨的那樣高。這個(gè)數(shù)據(jù)集大約有10,000個(gè)值,而許多現(xiàn)實(shí)世界中的系統(tǒng)可能需要處理的是數(shù)百萬(wàn)級(jí)別的基數(shù)。因此,對(duì)更高基數(shù)的數(shù)據(jù)進(jìn)行基準(zhǔn)測(cè)試將是非常有價(jià)值的。

本文轉(zhuǎn)載自?? AI小智??,作者: AI小智


標(biāo)簽
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
久久久久久久国产精品| 日韩一区二区免费视频| 亚洲午夜精品国产| 国产乱码一区二区| 亚洲精品麻豆| 中文字幕久久久| 少妇极品熟妇人妻无码| 成人直播视频| 一区二区三区在线播| 免费久久久一本精品久久区| 一道本无吗一区| 夜夜嗨一区二区| 日韩一级裸体免费视频| 人妻丰满熟妇aⅴ无码| 欧洲精品久久久久毛片完整版| 亚洲国产日韩a在线播放性色| 日韩伦理一区二区三区av在线| 99久久精品无免国产免费 | 成人美女在线观看| 国产精品国产自产拍高清av水多 | 最新版天堂资源在线| 色香欲www7777综合网| 亚洲伊人伊色伊影伊综合网| 亚洲一区二区在线看| 日韩a在线观看| 国产精品一区在线| 国产精品亚洲美女av网站| 国产精品一区二区6| 伊人久久大香线蕉综合四虎小说| 亚洲精品午夜精品| 大桥未久恸哭の女教师| 57pao成人永久免费| 一本久道中文字幕精品亚洲嫩| 国产视频在线观看网站| 日本高清视频在线播放| 国产亚洲精久久久久久| 极品尤物一区二区三区| 成人乱码一区二区三区| 国产福利一区在线| 亚洲a在线观看| 在线观看免费中文字幕| 日韩精品亚洲一区二区三区免费| 性欧美亚洲xxxx乳在线观看| 久久久夜色精品| 91精品国产91久久久久久密臀| 在线不卡国产精品| 精品无码国产污污污免费网站| 日韩av影院| 日韩电影中文 亚洲精品乱码| 中文字幕人妻一区| 久久99偷拍| 日韩第一页在线| 国产草草浮力影院| 美女网站色精品尤物极品姐弟| 精品久久久久一区二区国产| 亚洲少妇一区二区三区| jazzjazz国产精品久久| 欧美不卡在线视频| 中文字幕在线国产| 激情小说一区| 亚洲美女中文字幕| 欧美大波大乳巨大乳| 经典一区二区| 日韩中文字幕欧美| 三级av在线免费观看| 欧美99在线视频观看| 欧美尺度大的性做爰视频| 欧美xxxx黑人xyx性爽| 欧美日韩国产欧| 欧美极品欧美精品欧美视频| 国产成人在线播放视频| 久久精品日产第一区二区| 国产精品第2页| 91免费视频播放| 国产传媒日韩欧美成人| 精品国产综合| av在线三区| 亚洲精品欧美激情| av动漫在线看| 国产91欧美| 日韩精品一区二区三区中文不卡 | 午夜精品久久久久久久99热| 在线能看的av| 另类欧美日韩国产在线| 91gao视频| 爽爽视频在线观看| 成人免费一区二区三区视频| 成人毛片一区二区| 精品裸体bbb| 精品欧美黑人一区二区三区| 超碰97人人干| 欧美日韩国内| 国产精品黄色av| 高h放荡受浪受bl| 日本一区二区三区免费乱视频| 永久免费在线看片视频| 欧美男男激情videos| 欧美精品久久久久久久多人混战| 久久性爱视频网站| 久久国产电影| 国产91|九色| 99热这里是精品| 久久亚洲影视婷婷| 超碰97在线看| 成人影院在线免费观看| 亚洲第一级黄色片| 麻豆网址在线观看| 国产精品久久久免费| 亚洲va久久久噜噜噜| 久久电影中文字幕| 亚洲午夜电影在线观看| 日本黄大片一区二区三区| 欧美午夜寂寞| 欧美大片在线影院| 国产一区二区在线不卡| 久久久久国色av免费看影院| 久久www视频| 天堂综合在线播放| 亚洲欧美国产va在线影院| 久久久一区二区三区四区| 久久丁香综合五月国产三级网站| 欧美日韩精品免费观看| 日本大胆在线观看| 88在线观看91蜜桃国自产| 卡一卡二卡三在线观看| 毛片一区二区| 国产日韩在线一区二区三区| 羞羞污视频在线观看| 欧美日免费三级在线| 国产成人av一区二区三区不卡| 黑丝一区二区三区| 91视频网页| h片在线观看网站| 欧美日韩情趣电影| 一级黄色录像毛片| 日韩成人av影视| 精品人伦一区二区三区| 国产精品一区二区日韩| 亚洲丁香婷深爱综合| 国产亚洲欧美精品久久久久久| 国产最新精品免费| 日本一本草久p| 91九色成人| 欧美成人中文字幕| 亚洲国产www| 亚洲国产精品影院| 毛茸茸free性熟hd| 国产亚洲精品v| 美女被啪啪一区二区| 欧美大胆性生话| 怡红院精品视频| 在线视频 91| 国产精品国产三级国产有无不卡| 奇米视频7777| 伊人成综合网| 国产日韩精品推荐| 偷拍中文亚洲欧美动漫| 中文字幕精品网| 99在线无码精品入口| 一区二区三区日韩欧美| 成年人小视频在线观看| 国产亚洲毛片| 日韩av影视| **国产精品| 久久乐国产精品| 色就是色亚洲色图| 欧美在线不卡视频| 99久久99久久精品国产| 国产·精品毛片| 欧美 国产 小说 另类| 青青草国产成人a∨下载安卓| 成人黄色网免费| 国精一区二区三区| 亚洲欧美综合另类中字| 在线观看亚洲国产| 一区二区三区精品| 亚洲永久精品ww.7491进入| 热久久一区二区| 大胆欧美熟妇xx| 亚洲黄页网站| 91精品一区二区| 美女在线视频免费| 色999日韩欧美国产| 精品黑人一区二区三区国语馆| 精品久久久在线观看| 午夜黄色福利视频| 成人sese在线| 牛夜精品久久久久久久| 韩日成人av| 天堂资源在线亚洲资源| 爱高潮www亚洲精品| 国产精品99蜜臀久久不卡二区| 1区2区在线观看| 亚洲天堂男人天堂| 精品久久久无码中文字幕| 色综合天天综合在线视频| 丝袜 亚洲 另类 欧美 重口| 久久―日本道色综合久久| 伊人五月天婷婷| 日日摸夜夜添夜夜添亚洲女人| 欧美交换配乱吟粗大25p| 久久99高清| 成人免费在线看片| 在线视频成人| 国产精品福利久久久| 久久香蕉一区| 日韩综合中文字幕| 免费在线稳定资源站| 日韩欧美国产综合一区| 久久久久精彩视频| 岛国av一区二区在线在线观看| 成人性生活毛片| 国产精品热久久久久夜色精品三区| 蜜臀aⅴ国产精品久久久国产老师| 美女视频免费一区| 精品久久久久久久免费人妻| 一区在线视频观看| 精品嫩模一区二区三区| 首页国产精品| 日本一区二区三区视频在线播放 | 亚洲精品影视在线观看| 亚洲精品国产精品国| 在线播放国产精品二区一二区四区 | 亚洲精品国产首次亮相| 日韩精品电影网站| 久久最新网址| 美乳视频一区二区| 久久365资源| 国产精品久久久久久久久久久久午夜片| 日本免费成人| 国产日韩精品视频| 日韩精品免费观看视频| 欧美在线国产精品| 亚洲人成在线网站| 国产91精品不卡视频| 国产h片在线观看| 97国产在线观看| 国产激情在线播放| 97超视频免费观看| 色一区二区三区| 奇米成人av国产一区二区三区| 91av久久| 51视频国产精品一区二区| 超碰在线cao| 全亚洲最色的网站在线观看| 全亚洲第一av番号网站| 日本91av在线播放| 第四色男人最爱上成人网| 国产999精品久久久| 欧美三级网址| 国产精品亚洲欧美导航| 四虎视频在线精品免费网址| 亚洲一区二区在线| 亚洲不卡视频| 国内精品**久久毛片app| 香蕉国产成人午夜av影院| 欧美国产视频在线观看| 红桃成人av在线播放| 亚洲国产欧美日韩| 婷婷综合亚洲| 精品国产一区三区| 久久狠狠婷婷| 手机免费av片| 国产成人精品午夜视频免费| 亚州av综合色区无码一区| 91在线观看一区二区| 无码一区二区三区在线| 成人免费一区二区三区在线观看| 免费在线黄色网| 午夜久久电影网| 无码aⅴ精品一区二区三区| 欧美日韩成人激情| 高清国产mv在线观看| 亚洲跨种族黑人xxx| 午夜不卡视频| 久久久久成人精品| 忘忧草在线www成人影院| 成人精品视频久久久久| 国产精品网址| 色噜噜一区二区| 欧美精品首页| 日韩手机在线观看视频| 国产一区二区三区国产| 菠萝菠萝蜜网站| 亚洲国产第一区| 国产精品久久免费看| 国产精品成人aaaa在线| 欧美视频自拍偷拍| 黄色av网址在线| 日韩在线视频免费观看| 在线看片福利| 亚洲一区二区三区乱码aⅴ| 日韩精选在线| 久久人妻无码一区二区| 日韩综合小视频| 农村末发育av片一区二区 | 日韩国产精品亚洲а∨天堂免| 3p在线观看| 全球成人中文在线| 91夜夜蜜桃臀一区二区三区| 亚洲欧美国产精品桃花| 99xxxx成人网| 国产人妻精品久久久久野外| 国产亚洲一区二区三区四区| 欧美久久久久久久久久久久| 欧美伊人久久大香线蕉综合69 | 中文字幕在线观看欧美| 亚洲护士老师的毛茸茸最新章节 | 欧美三级情趣内衣| 欧美久久久久久久久久久久久| 黄色资源网久久资源365| 第一次破处视频| 婷婷国产在线综合| 精品二区在线观看| 日韩在线视频网站| 精品网站在线| 久久亚洲综合网| 亚洲大片av| 久久久无码人妻精品无码| 中文字幕一区二区三区精华液| 国产一级免费视频| 精品av综合导航| 18视频在线观看| 91免费人成网站在线观看18| 成人三级视频| 亚洲最大综合网| 久久综合九色综合欧美就去吻| 日本中文字幕网| 精品精品国产高清a毛片牛牛| 97超碰在线公开在线看免费| 国产美女精品视频免费观看| 日韩精品免费一区二区三区| 日韩在线第三页| 国产午夜精品福利| 国产精品久久久久久久久夜色| 亚洲欧美另类中文字幕| 性感女国产在线| 久久亚洲综合网| 丝袜国产日韩另类美女| 老牛影视av老牛影视av| 日本电影亚洲天堂一区| 久青草国产在线| 国产精品九九九| 色综合五月天| theporn国产精品| 亚洲精品视频自拍| 国产又粗又猛视频| 欧美成人在线免费视频| youjizz亚洲| 日本一区二区黄色| 久久久久九九视频| 亚洲熟妇无码久久精品| 精品国产一区二区三区久久久狼| 国产精品久一| 国产精品视频网站在线观看| 东方aⅴ免费观看久久av| 国产69精品久久久久久久久久| 日韩成人在线播放| 日韩美女在线看免费观看| 无码免费一区二区三区免费播放| 久久精品国产精品青草| 激情综合网五月天| 亚洲精品动漫久久久久| 成人性生活视频| 26uuu成人| 成人av资源网站| 黄色一级视频免费看| 日韩中文在线视频| 电影一区二区三区久久免费观看| 国产又粗又猛又爽又黄的网站| 99久久精品免费| 中文字幕人妻一区二区在线视频| 久久夜色精品亚洲噜噜国产mv| 日韩欧美中文字幕在线视频 | 色婷婷在线视频观看| 精品国产青草久久久久福利| 自拍网站在线观看| 中文字幕免费在线不卡| 成人免费va视频| 欧美另类高清videos的特点| 美女视频黄免费的亚洲男人天堂| 日本精品影院| 九九精品久久久| 午夜欧美在线一二页| av在线天堂| 国产日韩久久| 国内成人精品2018免费看| 影音先锋亚洲天堂| 久久精品国亚洲| 欧美电影在线观看完整版| 91小视频网站| 亚洲va天堂va国产va久| 在线a免费看| 国产偷久久久精品专区| 久久99久久久久| 国产九色在线播放九色| 欧美大片va欧美在线播放| 免费视频亚洲| 亚洲色偷偷色噜噜狠狠99网| 欧美三级电影网站|