精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

吞吐量提升5倍,聯合設計后端系統和前端語言的LLM接口來了

人工智能 新聞
開源社區的研究者們面向 LLM 提出了一種結構化生成語言(Structured Generation Language)——SGLang。SGLang 能夠增強與 LLM 的交互,通過聯合設計后端運行時系統和前端語言,使 LLM 更快、更可控。

大型語言模型 (LLM) 越來越多地用于需要多個鏈式生成調用、高級 prompt 技術、控制流以及與外部環境交互的復雜任務。然而,用于編程和執行這些應用程序的現有高效系統存在著明顯的缺陷。

現在,開源社區的研究者們面向 LLM 提出了一種結構化生成語言(Structured Generation Language)——SGLang。SGLang 能夠增強與 LLM 的交互,通過聯合設計后端運行時系統和前端語言,使 LLM 更快、更可控。機器學習領域知名學者、CMU 助理教授陳天奇還轉發了這項研究。

圖片

總的來說,SGLang 的貢獻主要包括:

  • 在后端,研究團隊提出了 RadixAttention,這是一種跨多個 LLM 生成調用的 KV 緩存(KV cache)復用技術,自動且高效。
  • 在前端,研究團隊開發了一種嵌入 Python 的、靈活的域指定(domain-specific)語言來控制生成過程。該語言可以在解釋器模式或編譯器模式下執行。

后端前端組件協同工作,可提高復雜 LLM 程序的執行和編程效率。

該研究使用 SGLang 實現了常見的 LLM 工作負載,包括智能體、推理、提取、對話和小樣本學習任務,并在 NVIDIA A10G GPU 上采用 Llama-7B 和 Mixtral-8x7B 模型。如下圖 1 、圖 2 表明,與現有系統(即 Guidance 和 vLLM)相比,SGLang 的吞吐量提高了 5 倍。

圖片

圖 1:不同系統在 LLM 任務上的吞吐量(A10G、FP16 上的 Llama-7B、張量并行度 = 1)

圖片

圖 2:不同系統在 LLM 任務上的吞吐量(A10G、FP16 上的 Mixtral-8x7B,張量并行度 = 8)

后端:使用 RadixAttention 自動 KV 緩存復用

在 SGLang 運行時的開發過程中,該研究發現了復雜 LLM 程序的優化關鍵 ——KV 緩存復用,當前系統對此處理不佳。KV 緩存復用意味著具有相同前綴的不同 prompt 可以共享中間 KV 緩存,避免冗余的內存和計算。在涉及多個 LLM 調用的復雜程序中,可能存在各種 KV 緩存復用模式。下圖 3 說明了 LLM 工作負載中常見的四種此類模式。雖然某些系統能夠在某些場景下處理 KV 緩存復用,但通常需要手動配置和臨時調整。此外,由于可能的復用模式的多樣性,即使通過手動配置,現有系統也無法自動適應所有場景。

圖片

圖 3:KV 緩存共享示例。藍色框是可共享的 prompt 部分,綠色框是不可共享的部分,黃色框是不可共享的模型輸出。可共享的部分包括小樣本學習示例、自洽(self-consistency)問題、多輪對話中的對話歷史以及思維樹(tree-of-thought)中的搜索歷史。

為了系統地利用這些復用機會,該研究提出了一種在運行時自動 KV 緩存復用的新方法 —— RadixAttention。該方法不是在完成生成請求后丟棄 KV 緩存,而是在基數樹(radix tree)中保留 prompt 和生成結果的 KV 緩存。這種數據結構可以實現高效的前綴搜索、插入和驅逐。該研究實現了最近最少使用(LRU)驅逐策略,并輔以緩存感知調度策略,以提高緩存命中率。

基數樹可作為 trie(前綴樹)節省空間的替代方案。與典型的樹不同,基數樹的邊緣不僅可以用單個元素來標記,還可以用不同長度的元素序列來標記,這提高了基數樹的效率。

該研究利用基數樹來管理映射,這種映射是在充當鍵的 token 序列和充當值的相應 KV 緩存張量之間進行的。這些 KV 緩存張量以分頁布局存儲在 GPU 上,其中每個頁的大小相當于一個 token。

考慮到 GPU 內存容量有限,無法重新訓練無限的 KV 緩存張量,這就需要驅逐策略。該研究采用 LRU 驅逐策略,遞歸地驅逐葉節點。此外,RadixAttention 與連續批處理和分頁注意力等現有技術兼容。對于多模態模型,RadixAttention 可以輕松擴展以處理圖像 token。

下圖說明了在處理多個傳入請求時如何維護基數樹。前端總是向運行時發送完整的 prompt,運行時會自動進行前綴匹配、復用和緩存。樹形結構存儲在 CPU 上,維護開銷較小。

圖片

圖 4. 采用 LRU 驅逐策略的 RadixAttention 操作示例,分九個步驟進行說明。

圖 4 演示了基數樹響應各種請求的動態演變。這些請求包括兩個聊天會話、一批小樣本學習查詢和自洽性抽樣。每個樹邊緣都帶有一個標簽,表示子字符串或 token 序列。節點采用顏色編碼以反映不同的狀態:綠色表示新添加的節點,藍色表示在該時間點訪問的緩存節點,紅色表示已被驅逐的節點。

前端:使用 SGLang 輕松進行 LLM 編程

在前端,該研究提出了 SGLang,一種嵌入在 Python 中的特定于領域的語言,允許表達高級 prompt 技術、控制流、多模態、解碼約束和外部交互。SGLang 函數可以通過各種后端運行,例如 OpenAI、Anthropic、Gemini 和本地模型。

圖片

圖 5. 用 SGLang 實現多維文章評分。

圖 5 顯示了一個具體示例。它利用分支 - 解決 - 合并 prompt 技術實現多維文章評分。該函數使用 LLM 從多個維度評估文章的質量,合并判斷,生成摘要,并分配最終等級。突出顯示的區域說明了 SGLang API 的使用。(1) fork 創建 prompt 的多個并行副本。(2) gen 調用 LLM 生成并將結果存儲在變量中。該調用是非阻塞的,因此它允許多個生成調用在后臺同時運行。(3) [variable_name] 檢索生成的結果。(4) 選擇對生成施加約束。(5) run 使用其參數執行 SGLang 函數。

給定這樣一個 SGLang 程序,我們可以通過解釋器執行它,也可以將其跟蹤為數據流圖并使用圖執行器運行它。后一種情況為一些潛在的編譯器優化開辟了空間,例如代碼移動、指令選擇和自動調整。

SGLang 的語法很大程度上受到 Guidance 的啟發,并引入了新的原語,還處理程序內并行性和批處理。所有這些新功能都有助于 SGLang 的出色性能。

基準測試

研究團隊在常見的 LLM 工作負載上測試了其系統,并報告了所實現的吞吐量。

具體來說,該研究在 1 個 NVIDIA A10G GPU (24GB) 上測試了 Llama-7B,在 8 個具有張量并行性的 NVIDIA A10G GPU 上使用 FP16 精度測試了 Mixtral-8x7B,并使用 vllm v0.2.5、指導 v0.1.8 和 Hugging Face TGI v1.3.0 作為基準系統。

如圖 1 和圖 2 所示,SGLang 在所有基準測試中均優于基準系統,吞吐量提高了 5 倍。它在延遲方面也表現出色,特別是對于第一個 token 延遲,其中前綴緩存命中可以帶來顯著的好處。這些改進歸功于 RadixAttention 的自動 KV 緩存復用、解釋器實現的程序內并行性以及前端和后端系統的協同設計。此外,消融研究表明,即使沒有緩存命中,也沒有明顯的開銷,這會導致在運行時始終啟用 RadixAttention。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-05-09 02:00:00

代碼接口吞吐量

2024-12-13 13:58:53

2024-05-23 16:41:40

2024-09-12 15:24:29

2023-12-01 14:36:33

模型數據

2024-09-09 14:12:38

2024-06-06 16:15:00

2024-11-02 10:28:03

2022-05-26 15:17:54

訓練模型

2025-07-08 09:33:08

2025-10-27 09:06:00

2024-11-01 20:25:28

2023-02-09 08:57:11

Callable異步java

2025-09-11 02:00:00

2019-08-14 08:20:59

Iperf網絡吞吐量帶寬測試

2023-12-07 06:51:18

AI模型

2025-06-05 03:00:00

Spring異步接口

2010-04-14 16:02:09

IDF

2023-11-07 15:11:46

Kafka技巧

2023-08-03 14:18:29

Rust阻塞函數
點贊
收藏

51CTO技術棧公眾號

国产精品白丝jk喷水视频一区| 精品视频久久久久久久| 超碰97在线看| 日本韩国在线观看| 天堂va蜜桃一区二区三区 | 国产欧美日韩影院| 欧美男人的天堂一二区| 美女扒开大腿让男人桶| 黄色av网址在线免费观看| 国内成人自拍视频| 2019国产精品自在线拍国产不卡| 国产精品视频在| 国产欧美三级电影| 欧美日韩国产精品自在自线| 亚洲 欧美 综合 另类 中字| 成人在线播放视频| 成人丝袜18视频在线观看| 国产精品美女免费| 日本三级视频在线| 久久精品亚洲欧美日韩精品中文字幕| 亚洲爱爱爱爱爱| 无尽裸体动漫2d在线观看| 国产在线拍揄自揄拍视频 | 婷婷精品国产一区二区三区日韩 | 僵尸再翻生在线观看| 国产精品久久久久久久午夜片| 国产精品久久久久久久久婷婷 | 国产真实乱子伦精品视频| 欧美综合在线观看| 久久久久久久国产视频| 97在线精品| 亚洲午夜国产成人av电影男同| 韩国黄色一级片| 狂野欧美性猛交xxxx| 色综合久久久久综合99| 国产a级片网站| 午夜小视频福利在线观看| 亚洲国产成人一区二区三区| 六十路精品视频| 蜜桃视频污在线观看| 韩国v欧美v日本v亚洲v| 国产精品色午夜在线观看| 可以免费看的av毛片| 狠狠爱成人网| 日韩有码片在线观看| 精品无码在线观看| 国产永久精品大片wwwapp| 日韩精品有码在线观看| 欧美在线一级片| 国产成人澳门| 亚洲电影免费观看高清完整版在线观看| 青娱乐国产精品视频| 日韩大陆av| 欧美日韩国产欧美日美国产精品| 中文字幕第80页| 秋霞国产精品| 精品视频一区二区三区免费| 天美星空大象mv在线观看视频| 久久久人成影片一区二区三区在哪下载 | 无码人妻丰满熟妇区毛片蜜桃精品| 欧美成人高清视频在线观看| 欧美日韩免费一区二区三区| 777视频在线| 伊人久久精品| 日韩女优av电影| 中国xxxx性xxxx产国| 青青草久久爱| 亚洲一级片在线看| 天天躁日日躁aaaa视频| 欧美日韩中文字幕一区二区三区| 怡红院精品视频| 国产又粗又长又硬| 一区二区三区在线观看免费| 久久91亚洲精品中文字幕| 久久亚洲成人av| 国产日韩亚洲| 国产精品老女人精品视频| 亚洲综合精品在线| 国产精品主播直播| 国产一区二区在线网站| 精品av中文字幕在线毛片| 国产精品欧美久久久久无广告 | 美女精品一区| 国产精品午夜视频| 国产肥老妇视频| 99国产精品一区| 一区二区冒白浆视频| 欧美亚洲系列| 日本精品一级二级| 91精品国产三级| 四虎5151久久欧美毛片| 色天天综合狠狠色| 日韩毛片在线视频| 麻豆视频观看网址久久| 国产精品免费在线播放| 国产九色在线| 亚洲一区二区三区四区五区中文| 日韩手机在线观看视频| 精品中文在线| 国产一区二区三区18| 波多野结衣亚洲色图| 久久av一区| 成人在线观看av| 91精品专区| 欧美日韩加勒比精品一区| 国产精品区在线| 日韩av网站在线免费观看| 久久精品国产视频| av黄色在线播放| 国产成人啪午夜精品网站男同| 欧美极品色图| 色呦呦在线观看视频| 欧美性受xxxx黑人xyx性爽| 亚洲最大视频网| 精品日产免费二区日产免费二区| 欧美日韩第一视频| 中文字幕观看视频| 99麻豆久久久国产精品免费| 樱空桃在线播放| 午夜av成人| 国产丝袜一区二区三区| 久久国产精品二区| 韩国一区二区在线观看| 欧美亚洲精品日韩| а√天堂中文在线资源8| 91麻豆精品国产91久久久久| 欧美激情 一区| 国产精品综合| 精品久久中出| 激情av在线| 日韩欧美亚洲国产精品字幕久久久| 日本理论中文字幕| 久久久777| 蜜桃视频在线观看成人| 黄色激情在线播放| 亚洲精品一线二线三线无人区| 亚洲欧美精品aaaaaa片| 蜜桃免费网站一区二区三区| 欧美成人综合一区| 丝袜老师在线| 日韩精品在线观| 午夜毛片在线观看| 91免费观看国产| 欧美日韩二三区| 欧美电影完整版在线观看| 久久久久久午夜| 成人av无码一区二区三区| 亚洲精品ww久久久久久p站| 性久久久久久久久久久久久久| 国产精品99久久精品| 国产欧美精品久久久| 日本免费视频在线观看| 欧美伦理视频网站| 国产福利视频网站| 国产美女娇喘av呻吟久久| 青青草综合视频| av不卡一区二区| 高清欧美电影在线| 四虎影院在线域名免费观看| 欧美性xxxx极品hd欧美风情| 人人人妻人人澡人人爽欧美一区| 日韩国产欧美在线视频| 亚洲a∨一区二区三区| 国产成人免费精品| 久久亚洲欧美日韩精品专区 | 亚洲a∨精品一区二区三区导航| 亚洲人成电影网站色xx| 影音先锋国产在线| 亚洲欧美偷拍卡通变态| 大尺度在线观看| 先锋影音久久| 亚洲v欧美v另类v综合v日韩v| 欧美视频免费看| 欧美精品免费在线| 人妻少妇一区二区三区| 91久久免费观看| 91香蕉视频在线播放| 丁香啪啪综合成人亚洲小说| 黄色影院一级片| 久久国产精品亚洲人一区二区三区 | 日韩电影中文 亚洲精品乱码 | 欧美福利第一页| 国产一区福利在线| 日本少妇高潮喷水视频| 日本不卡高清| 国产手机精品在线| 日韩不卡视频在线观看| 久久国产精品电影| 色久视频在线播放| 欧美剧在线免费观看网站| 久久精品免费在线| 国产欧美在线观看一区| 极品人妻一区二区| 久久国产欧美| 欧美 亚洲 视频| 国产一区三区在线播放| 高清视频在线观看一区| 国产福利一区二区三区在线播放| 欧美黑人又粗大| www 日韩| 亚洲精品久久久久久久久久久| 亚洲无码久久久久| 午夜电影网一区| 九九精品视频免费| 久久久久久久国产精品影院| 99久久综合网| 青草av.久久免费一区| 久久久亚洲国产精品| 91麻豆精品国产91久久久平台| 国产日韩精品推荐| gogo大尺度成人免费视频| 日本三级韩国三级久久| 午夜羞羞小视频在线观看| 最近2019好看的中文字幕免费| 午夜国产在线视频| 日韩一区二区免费视频| 涩涩视频在线观看| 大荫蒂欧美视频另类xxxx| 国产又黄又粗又猛又爽的 | 亚洲精品天堂网| 91麻豆福利精品推荐| www.四虎精品| 国产一区二区三区四| 婷婷激情四射五月天| 国产精品综合色区在线观看| 国产精品久久..4399| 欧美日韩精选| 激情视频小说图片| 偷偷www综合久久久久久久| 神马影院我不卡午夜| 蜜桃精品wwwmitaows| 黑人巨大精品欧美一区二区小视频 | 亚洲一区二区久久久久久| 亚洲综合av一区二区三区| 国产成人91久久精品| av高清不卡| 91av福利视频| 欧产日产国产精品视频 | 日韩黄色精品视频| 一区二区在线免费| 九九久久免费视频| 亚洲综合图片区| 久久久久久国产精品免费播放| 亚洲精品视频免费看| 一级片一级片一级片| 国产精品国产三级国产| 亚洲色图100p| ㊣最新国产の精品bt伙计久久| 韩国一级黄色录像| 中文字幕日韩一区二区| 成人免费毛片xxx| 亚洲欧美电影一区二区| 午夜国产福利一区二区| 亚洲精品免费电影| 麻豆疯狂做受xxxx高潮视频| 一级特黄大欧美久久久| 亚洲精品午夜久久久久久久| 亚洲r级在线视频| 欧美一级特黄视频| 色94色欧美sute亚洲13| 在线免费观看日韩视频| 宅男在线国产精品| 亚洲爱情岛论坛永久| 亚洲成人免费网站| 日韩一二三四| 中文字幕欧美日韩| 高清免费电影在线观看| 欧美国产日韩在线| 深夜成人在线| 国产精品视频一| 国产欧美视频在线| 国产精品一码二码三码在线| 日韩大尺度在线观看| 日韩亚洲视频| 午夜精品久久| 国产成人精品视频免费看| 久久欧美肥婆一二区| 制服丝袜中文字幕第一页| 粉嫩av一区二区三区在线播放| 国产精品探花一区二区在线观看| 日本一区二区视频在线| 在线免费日韩av| 欧美日韩一区二区在线| 一区二区小视频| 精品国产区一区| 国产在线视频你懂得| 久久亚洲欧美日韩精品专区 | 亚洲国产老妈| 日韩精品―中文字幕| 麻豆成人av在线| 中文字幕精品久久久| 国产精品久久久久久久久免费樱桃 | 风间由美一区| 欧美二区在线播放| 日韩免费福利视频| 97人人模人人爽人人少妇| 同性恋视频一区| 91免费视频黄| 久久永久免费| 中文字幕在线视频播放| 国产精品久久久久国产精品日日| 精品处破女学生| 欧美日韩精品欧美日韩精品| 好吊视频一二三区| 日韩在线视频观看| 欧美大胆性生话| 国产不卡一区二区在线观看| 日韩一区三区| 国产天堂在线播放| 夫妻av一区二区| 神马久久精品综合| 色婷婷国产精品综合在线观看| 亚洲av无码一区二区乱子伦| 中文字幕亚洲一区| 日韩成人动漫| 精品视频在线观看| 欧美激情性爽国产精品17p| 污视频网站观看| 国产亚洲污的网站| 欧美另类一区二区| 精品噜噜噜噜久久久久久久久试看| 午夜视频在线观看免费视频| 欧美一级大片在线观看| 91精品国产乱码久久久竹菊| 欧美 日韩 国产 在线观看| 日韩精品亚洲一区| 精品人妻一区二区三区日产乱码卜| 专区另类欧美日韩| 在线观看黄色网| 在线播放精品一区二区三区| 久久久久久久| 欧美高清性xxxxhdvideosex| 亚洲经典三级| 中文字幕无人区二| 亚洲激情成人在线| 国产精品美女一区| xxx成人少妇69| 日韩深夜福利网站| 一区二区免费在线视频| 美腿丝袜亚洲综合| 国产又粗又长免费视频| 欧美曰成人黄网| 波多野结衣在线网站| 国产精品福利在线| 欧洲激情综合| 亚洲国产日韩欧美在线观看| 欧美韩国日本一区| 中文字幕在线一| 最好看的2019的中文字幕视频| 91天天综合| 一区二区在线不卡| 黄一区二区三区| 久久久久久久久久网站| 日韩欧美一卡二卡| 欧美hdxxxx| 久久久久高清| 日韩精品欧美精品| 91制片厂在线| 精品少妇一区二区三区免费观看| 97人人在线视频| 欧美一区二区三区成人久久片| 青娱乐精品视频| 国产精品 欧美激情| 亚洲精品一区二区三区四区高清 | 欧美精品日韩一本| 国产日产一区二区| 爱情岛论坛亚洲入口| 亚洲精品一级| 九九九视频在线观看| 欧美日韩亚洲高清一区二区| 超碰超碰在线| 国产综合av一区二区三区| 日韩专区中文字幕一区二区| 国产精品一区二区亚洲| 日韩视频一区二区三区在线播放| caoporn视频在线| 天堂精品一区二区三区| 国产真实精品久久二三区| 久久精品国产亚洲av高清色欲| 国产婷婷97碰碰久久人人蜜臀| 青青久久精品| www.日本在线视频| 久久精品视频一区二区| 国产麻豆91视频| 欧美亚洲成人网| 久久资源中文字幕| 精品少妇人妻av一区二区三区| 色噜噜狠狠成人网p站| 成人免费高清| 欧洲av一区| 成人免费毛片app| 欧美高清69hd| 91成人精品网站| 亚洲精品a级片| 久久精品成人av| 精品国产青草久久久久福利| 精品176极品一区| 337p粉嫩大胆噜噜噜鲁| 综合分类小说区另类春色亚洲小说欧美| 午夜激情在线视频|