精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型前綴緩存技術,有望將服務成本降低90% 原創

發布于 2025-2-17 10:47
瀏覽
0收藏

大模型應用程序中的提示詞重復率高達70%。前綴緩存機制能夠將推理成本降低達90%,顯著優化性能并節約資金。

是不是總感覺ChatGPT響應緩慢?

大家可能沒有留意,大模型應用程序的提示詞重復率高達70%,問天氣、問翻譯和問節日安排的內容大量出現,且每次都要消耗算力進行處理。這樣的情況在分布式集群的各節點上被無數次放大,白白燒掉寶貴的能源和金錢。

為此,Anthropic日前詳細介紹了如何利用提示詞緩存技術將推理成本降低90%。其實不少開源大模型運行時(包括vLLM、TRT-LLM和SGLang等)都擁有自動前綴緩存(也稱上下文緩存)功能,負責將相同前綴請求中的輸入提示詞自動緩存起來。

前綴緩存的工作原理

為了更好地理解前綴緩存,我們先來聊聊大模型推理的工作原理。

推理過程在宏觀上分為兩個步驟:

  • 通過正向傳遞處理給定的輸入標記序列,即預填充階段
  •  解碼階段,從首個token連續生成至最后一個token,且當前token依賴于上一token。

大模型前綴緩存技術,有望將服務成本降低90%-AI.x社區

圖一

由于此過程的自回歸屬性(即新token依賴于前一token),因此有效的內存管理非常重要。多數大模型會采取為中間狀態保留KV緩存的做法。與簡單提示詞或語義緩存的不同之處在于,其不會將全文輸入和輸出保存在數據庫內,因為這樣就只有完全匹配(或者幾乎完全相同的查詢)才能立即命中緩存并收到響應。

在預填充階段,在大模型處理token時會計算“注意力”,即每個token與其他token的關系。計算過程會為每個token生成鍵-值矩陣。如果不經任何KV緩存,那么模型每次回顧此前token時都需要重新計算這些矩陣。KV緩存在設計上只支持一次生成,即只會在生成一條輸出的過程中捕捉中間狀態。

如果有兩條具有相同前綴的請求,該怎么處理?

KV緩存的基本思路啟發并衍生出了前綴緩存,確保在生成包含相同前綴的提示詞時給出不同的響應。簡單類比一下,假設已經計算過2 * 6的結果,那么對于2 * 6 * 3 * 5 這個新問題,可以直接復用之前的答案,避免在序列中重復計算。

這對應用程序有何幫助?

我們可以使用以下最佳實踐來充分發揮前綴緩存的優勢:

為提示詞結構設計策略

可以將系統提示詞、基礎指令或者共享上下文等常量元素放在提示詞的開頭(圖二),從而為多條查詢建立可復用基礎。其他動態或特殊內容則可放在末尾。

大模型前綴緩存技術,有望將服務成本降低90%-AI.x社區

圖二

對請求進行重新分組

將共享通用結構/前綴的請求捆綁在一起(圖三)。例如,在處理以常見問候語或稱呼開頭的多條客戶查詢時,可以嘗試將它們分為一組,盡可能提高計算過程的緩存和復用率。

大模型前綴緩存技術,有望將服務成本降低90%-AI.x社區

圖三

監控緩存利用率

另外,需要注意跟蹤緩存利用率。

包括命中率與未命中率:

  • 找出哪些前綴比其他一般前綴更重要
  • 識別緩存未命中的模式

依托這些見解,就能優化提示詞結構以獲得最佳性能。

簡單示例

以下示例為當多條查詢共享相同的上下文時,前綴緩存如何優化大模型推理。我們使用一份簡單的員工數據庫表,并對其中內容進行不同查詢。

Python
import time
from vllm import LLM, SamplingParams

# A small table containing employee information
LONG_PROMPT = """You are a helpful assistant that recognizes content in markdown tables. Here is the table:

| ID | Name          | Department | Salary  | Location    | Email                |
|----|---------------|------------|---------|-------------|---------------------|
| 1  | Alice Smith   | Engineering| 85000   | New York    | alice@company.com   |
| 2  | Bob Johnson   | Marketing  | 65000   | Chicago     | bob@company.com     |
| 3  | Carol White   | Sales      | 75000   | Boston      | carol@company.com   |
| 4  | David Brown   | Engineering| 90000   | Seattle     | david@company.com   |
| 5  | Eve Wilson    | Marketing  | 70000   | Austin      | eve@company.com     |
"""

def get_generation_time(llm, sampling_params, prompts):
    start_time = time.time()
    output = llm.generate(prompts, sampling_params=sampling_params)
    end_time = time.time()
    print(f"Output: {output[0].outputs[0].text}")
    print(f"Generation time: {end_time - start_time:.2f} seconds")

# Initialize LLM with prefix caching enabled
llm = LLM(
    model='lmsys/longchat-13b-16k',
    enable_prefix_caching=True
)

sampling_params = SamplingParams(temperature=0, max_tokens=50)

# First query - will compute and cache the table
get_generation_time(
    llm,
    sampling_params,
    LONG_PROMPT + "Question: What is Alice Smith's salary? Your answer: Alice Smith's salary is "
)

# Second query - will reuse the cached table computation
get_generation_time(
    llm,
    sampling_params,
    LONG_PROMPT + "Question: What is Eve Wilson's salary? Your answer: Eve Wilson's salary is "
)

運行以上代碼,即可查詢不同查詢間的實際時間差異。第二條查詢明顯更快,因為其復用了緩存中的表上下文。具體時間將根據硬件和設置而有所浮動。

總結

前綴緩存是一項強大的大模型應用優化技術。實施上述最佳實踐將幫助開發人員顯著降低推理成本,且不致影響響應質量。參考示例也表明其操作難度極低,推薦大家馬上在自己的應用程序中試一試。

原文標題:??90% Cost Reduction With Prefix Caching for LLMs?,作者:Mahak Shah

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
在线看片一区| 91国内外精品自在线播放| 国产成人8x视频一区二区 | 国产精品视频免费观看www| 五月激情四射婷婷| 无人区乱码一区二区三区| 亚洲国产精品一区二区www在线| 久久大香伊蕉在人线观看热2| 精品久久久久久久久久久久久久久久| 国产精品福利在线观看播放| 精品粉嫩超白一线天av| 亚洲免费av一区二区三区| av网站导航在线观看免费| 成人福利视频在线| 国产又爽又黄的激情精品视频| 免看一级a毛片一片成人不卡| 国产日产精品一区二区三区四区的观看方式| 欧美久久久一区| 看av免费毛片手机播放| a级毛片免费观看在线| 久久精品人人做人人爽人人| 亚洲自拍偷拍色图| 亚洲大尺度在线观看| 国内在线观看一区二区三区| 国产一区二区三区在线免费观看| 国产欧美日韩亚州综合| 色噜噜在线播放| 黄色一级片网址| 午夜福利123| av免费不卡| 成人免费小视频| 日本精品二区| 色窝窝无码一区二区三区成人网站| 免费不卡在线视频| 青青精品视频播放| 国产无遮挡又黄又爽又色| 久久婷婷蜜乳一本欲蜜臀| 亚洲女人天堂色在线7777| 伊人久久一区二区三区| 亚洲视频国产精品| 91精品国产色综合久久| 自拍偷拍21p| 成人免费直播| 韩曰欧美视频免费观看| 欧美成人高潮一二区在线看| 欧美高清另类hdvideosexjaⅴ| 自拍偷在线精品自拍偷无码专区 | 国产精品毛片一区视频播| 久久精品伊人| 日韩免费在线观看视频| 六月丁香婷婷综合| 六月天综合网| 国产成人精品在线| 精品国产乱子伦| 久久久久免费| 国产精品激情av在线播放| 亚洲黄网在线观看| 日本亚洲欧美天堂免费| 国产精品免费一区豆花| 亚洲一区中文字幕在线| 毛片不卡一区二区| 91免费综合在线| 99热这里只有精品5| 国产精品99久久久久| 91免费看蜜桃| 亚洲黄色在线播放| 成人av一区二区三区| 麻豆蜜桃91| 国产一级片在线播放| 欧美国产成人在线| 亚洲天堂第一区| 9999精品成人免费毛片在线看| 欧美日韩激情小视频| 黄色片一级视频| 久久久加勒比| 日韩精品自拍偷拍| 男男做爰猛烈叫床爽爽小说| 亚洲综合图色| 最好看的2019的中文字幕视频| 亚洲综合久久av一区二区三区| 91tv官网精品成人亚洲| 欧美韩日一区二区| 无码无套少妇毛多18pxxxx| 久久精品国产99国产| 97久久人人超碰caoprom欧美| 乱精品一区字幕二区| 久久综合av免费| 一区二区三区视频在线播放| 日韩专区av| 色伊人久久综合中文字幕| 日韩在线一区视频| 女仆av观看一区| 国产一区二区三区中文| 久久国产在线视频| 日产国产欧美视频一区精品| 99在线影院| 飘雪影院手机免费高清版在线观看| 国产精品久久久久久久岛一牛影视 | 国产黄色大片网站| 久久久久久久久久看片| 国外成人在线直播| 国产精品美女久久久久aⅴ | 免费在线小视频| 精品国产31久久久久久| 美女网站视频黄色| 白白在线精品| 色偷偷88888欧美精品久久久| 国产精品99无码一区二区| 日本美女视频一区二区| 国产精品国产精品国产专区蜜臀ah| 男人的天堂在线免费视频| 亚洲精品视频一区二区| 97xxxxx| 日韩一区二区三区精品视频第3页 日韩一区二区三区精品 | 欧美黄色录像| 久久亚洲一区二区三区四区五区高| 国产污污视频在线观看| 国产乱对白刺激视频不卡| 欧美一区1区三区3区公司| 久草在线视频福利| 在线成人小视频| 自拍偷拍视频亚洲| 亚洲少妇诱惑| 国产精品区免费视频| 麻豆tv入口在线看| 欧洲中文字幕精品| 久久人人妻人人人人妻性色av| 伊人成综合网| 成人女保姆的销魂服务| jizz在线观看视频| 91成人在线免费观看| 久久久久成人精品无码中文字幕| 自拍日韩欧美| 91免费看片在线| 免费在线看黄| 欧美日韩不卡在线| www中文在线| 精一区二区三区| 在线免费一区| 精品国产美女a久久9999| 亚洲欧美精品中文字幕在线| 国产成人精品一区二三区| 成人性生交大片免费看中文网站| a级片一区二区| 国产精品国产亚洲精品| 久久激情视频免费观看| 亚洲一级黄色大片| 国产精品毛片久久久久久| 牛夜精品久久久久久久| 欧美一区二区三区高清视频| 国产精品9999| 暖暖日本在线观看| 91麻豆精品国产91久久久更新时间| 亚洲AV成人无码网站天堂久久| 久久99热这里只有精品| 超碰在线免费观看97| 成人51免费| 久久久久久久爱| 亚洲人午夜射精精品日韩| 欧美视频在线免费| 五月天综合视频| 精品一区二区影视| www.日本三级| 99亚洲乱人伦aⅴ精品| 久久久久久国产免费| 香蕉人妻av久久久久天天| 日本久久电影网| 国精产品一区一区| 国产一区二区三区免费观看| 免费网站在线观看视频| 欧美黑白配在线| 国产精品视频色| 在线国产91| 亚洲二区中文字幕| 无码人妻熟妇av又粗又大| 国产精品久久久久久久久搜平片| 日本高清一区二区视频| 亚洲二区免费| 秋霞久久久久久一区二区| 少妇精品视频在线观看| 欧美精品激情blacked18| 神马电影在线观看| 9191成人精品久久| 久久精品国产成人av| 国产精品久久久爽爽爽麻豆色哟哟| 欧美色图校园春色| 裸体素人女欧美日韩| 艳母动漫在线观看| 中文字幕中文字幕精品| 亚洲自拍在线观看| 国产精品亚洲一区二区三区在线观看 | 国产精成人品免费观看| 国产一区二区看久久| 免费看一级大黄情大片| 99精品在线观看| 久久久一本精品99久久精品66 | 亚洲专区一区| 国产精品夜夜夜爽张柏芝| 欧美在线关看| 亚洲japanese制服美女| 欧美电影免费看| 欧美激情欧美激情| 麻豆传媒视频在线| 亚洲视频视频在线| 免费国产黄色片| 欧美老人xxxx18| 69av视频在线观看| 亚洲国产乱码最新视频| 欧美爱爱免费视频| 欧美国产综合色视频| 亚洲国产精品成人综合久久久| 久久99最新地址| 国产免费人做人爱午夜视频| 极品日韩av| 免费看黄色a级片| 99热国内精品| 五月天亚洲综合小说网| 婷婷五月色综合香五月| 粉嫩av免费一区二区三区| 日本午夜精品久久久久| 国产成人一区二区三区电影| 精品众筹模特私拍视频| 欧美成人免费大片| 国产精品久久久久久福利| 主播福利视频一区| freemovies性欧美| 亚洲午夜性刺激影院| 亚洲欧美日韩综合在线| 亚洲福利视频网| 亚洲黄色在线播放| 精品久久久久久久久久久久久久久 | av网站免费线看精品| 宇都宫紫苑在线播放| 九九在线精品视频| theporn国产精品| 久久精品国产秦先生| 男人添女人下面免费视频| 日本不卡一区二区三区高清视频| 妞干网在线免费视频| 久久最新视频| 欧美一级黄色片视频| 久久国产88| 日韩有码免费视频| 日日骚欧美日韩| 中文字幕第80页| 麻豆极品一区二区三区| 中文av一区二区三区| 久久草av在线| 久久精品久久99| 国产精品自产自拍| 青青草视频网站| 91在线看国产| av永久免费观看| 中文字幕第一区综合| 亚洲欧美另类日本| 亚洲欧美日韩综合aⅴ视频| 成熟的女同志hd| 亚洲五月六月丁香激情| 日韩在线观看第一页| 色婷婷综合久久久中文字幕| 亚洲精品国产欧美在线观看| 欧美日韩在线综合| www.色亚洲| 精品无码久久久久久国产| 成人午夜在线观看视频| 久久久电影免费观看完整版| 波多野结衣久久| 日韩美女写真福利在线观看| 少妇精品视频在线观看| 成人女人免费毛片| 九九在线高清精品视频| 一区二区三区免费看| 在线观看日韩av电影| 青青青国产在线视频| 国产麻豆欧美日韩一区| 久久无码人妻精品一区二区三区| 国产女人18水真多18精品一级做| 精品国产视频在线观看| 婷婷综合在线观看| 中文字幕视频免费观看| 精品美女被调教视频大全网站| 日韩精品系列| 久久在线免费观看视频| 涩涩av在线| 91手机视频在线观看| 天堂资源在线亚洲| 久久香蕉视频网站| 日韩高清欧美激情| zjzjzjzjzj亚洲女人| 中文字幕的久久| 日本三级理论片| 欧美精品乱人伦久久久久久| 天堂在线中文网| 日韩亚洲欧美成人| av高清不卡| 97免费资源站| 色综合狠狠操| 无码人妻丰满熟妇区毛片18| 国产精品一二二区| 日本一区二区视频在线播放| 亚洲成精国产精品女| 91在线精品入口| 亚洲欧美一区二区三区在线| caoporn97在线视频| 国产精品美女在线| 美女视频亚洲色图| 懂色av粉嫩av蜜臀av| 丝袜诱惑制服诱惑色一区在线观看| 免费欧美一级片| 国产精品的网站| 无码人妻丰满熟妇奶水区码| 亚洲的天堂在线中文字幕| 国产网友自拍视频导航网站在线观看| 国产99久久精品一区二区 夜夜躁日日躁 | 精品国免费一区二区三区| 一广人看www在线观看免费视频| 午夜精品国产精品大乳美女| 国产视频网站一区二区三区| 日本一区二区三区精品视频| 国产日韩专区| 人妻换人妻a片爽麻豆| 亚洲精品中文在线影院| 国产一区二区三区黄片| 一区二区三区天堂av| 亚洲www免费| 免费在线国产精品| 久久精品30| 国产一二三四五区| 色综合视频在线观看| 色在线免费视频| 2021国产精品视频| 精品无人区一区二区| 老子影院午夜伦不卡大全| 国产一区二区三区香蕉| 欧美日韩黄色网| 欧美一区永久视频免费观看| 九色porny在线| 91老司机在线| 亚洲视频电影在线| 欧美体内she精高潮| 亚洲欧美国产高清| 国产夫妻在线观看| 欧美成人精品一区二区| 亚洲精品午夜| 国产日本在线播放| 99免费精品视频| 久久久久久久久黄色| 国产一区二区三区四区福利| 欧美日韩国产v| 四虎永久国产精品| 开心九九激情九九欧美日韩精美视频电影 | 在线日韩成人| 国产精品va在线观看无码| 国产福利一区在线| 欧美一区二区在线| 日韩欧美大片在线观看| 中文字幕亚洲在线观看| 亚洲大片一区二区三区| 高清一区二区三区视频| 国产亚洲欧美精品久久久www| 亚洲高清免费| 日批视频在线看| 亚洲亚洲精品在线观看| 日本高清视频免费观看| 57pao国产成人免费| 国产在线日韩精品| 亚洲精品视频三区| 亚洲精品视频观看| 三级网站免费观看| 国产成+人+综合+亚洲欧洲| 青青草国产免费一区二区下载| 福利视频999| 亚洲成精国产精品女| 蜜桃视频在线播放| 成人写真福利网| 99在线精品视频在线观看| 黄免费在线观看| 91精品国产乱码| 日韩av一卡| 欧美日韩在线免费观看视频| 成人深夜福利app| 免费精品一区二区| 欧美激情啊啊啊| 精品国产91久久久久久浪潮蜜月| 涩多多在线观看| 欧美视频一二三| 国产日产一区二区| 久久久久久艹| 国产专区欧美精品| 99久热在线精品996热是什么| www.久久撸.com| 久久99偷拍| 人人爽人人爽av| 欧美性生交大片免网| 国产高清一区二区三区视频| 久久久久久久久久久久久9999| 极品美女销魂一区二区三区免费 | 天堂中文资源在线观看| 国产精品久久久久91| 精品二区久久|