精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

vLLM架構到底是個啥?一文全面認知視覺大語言模型~

人工智能 新聞
最近抽出時間詳細的研究了一下vLLM的架構,希望能對vLLM有一個更詳細和全面的認識。

畢業一年了,一直在從事大模型推理相關的工作。工作中最常拿來比較的LLM推理框架就是vLLM,最近抽出時間詳細的研究了一下vLLM的架構,希望能對vLLM有一個更詳細和全面的認識。

1. 架構總覽

圖片vLLM python 工程目錄

如圖標出的文件是vLLM python側的工程目錄中核心的組件,按照層次間的依賴關系,可以大致拆解為如下結構:

LLM 類為頂層用戶應用, LLM 類控制 LLM Engine類 負責總管推理全流程,LLM Engine中包含 Scheduler 類和 Worker類。Scheduler 負責調度不同request,保證vLLM中的Cache Block資源足夠現有的請求完成執行,否則對現有的request進行搶占。Scheduler 類 控制 Block Manager 來管理 Phyical Token Block。Worker 負責模型載入、模型執行,對于分布式推理,則通過創建多個worker在執行完整模型的一部分(Tensor Parallel)。其中Cache Engine 管理CPU/GPU上完整的KV Cache Tensor,執行Scheduler 調度的request的block數據搬運。Model Runner 擁有實際執行的Model 實例,并負責進行數據的pre-process/ post-process 及sampling。

圖片圖片

vLLM架構總覽

【更新】vLLM 代碼進行了重構,和我之前看的code base有一些差異

圖片commit:cc74b vllm架構

整體的架構與之前的改動不大,在Worker之上新增了Executor類的抽象,用于管理不同后端的device如 CPU、GPU、NPU、分布式GPU后端,根據不同的device 派生了特定的Executor、Worker、Model Runner。

并新增了Speculative Decoding、FP8、lora、CPU Page Attention kernel、不同的后端的Attention、prefill decoding混合推理等新特性的支持。

2. Scheduler

Scheduler 的調度行為發生在每一個LLM Engine執行step 推理的最初。負責準備這一次step執行推理的SentenceGroup。Scheduler 負責管理3個隊列 running waiting swapped,waitting 隊伍內的元素為首次prompt phase或preempt recompute,swapped隊伍中的元素從running中被搶占換出的,都處于decode phase。每當LLM Engine 添加一個新的request,Scheduler會把新的request創建的SentenceGroup 入隊waiting。

Scheduler 每一次調度保證這一次step的數據全部是prompt(prefill) phase或全部是decode(auto-regressive) phase。核心的函數為_scheduler():函數中存在3個臨時隊列 scheduled、new running、 preempt

圖片scheduler 核心調度

【prompt phase】(調度waiting)首先判斷swapped隊列是否為空,若為空則表示沒有更早的未完成的request,則把waiting隊列中的元素出隊加入scheduled隊列,直至超過block分配上限或vLLM系統最大seq 上限。_scheduler()返回scheduled隊列

【decoding phase】:

如swapped不為空,則優先處理之前換出的請求。(調度running)首先對running中的請求依照FCFS的policy進行排序,decoding phase SentenceGroup 中的所有的Sentence由于sampling可能會產生不同的output token,需要對每個Sentence分配不同的新的slot存儲新的token。若現有的free block不能滿足為所有的Sentence,則running 隊尾的sentence 被搶占出隊加入preempt隊列[recompute mode 則加入waitting 隊列并釋放block, swap mode 則加入swapped隊列 并swap-out block],直至能夠為running 隊首的所有的sentence分配block,并將隊首的元素出隊加入new running。(調度swapped)再對swapped隊列依照FCFS的policy進行排序,若preempt不為空,說明block資源緊張,_scheduler()直接返回 new running 和swap-out block索引。若preempt為空,block資源可能有富余,則嘗試循環將swapped 隊首的元素swap-in,若成功則加入new running,否則直接返回 new running 和swap-in 索引。

【Scheduler更新】commit:cc74b 的code base下,Scheduler 默認的調度邏輯(_schedule_default)基本不邊,還是和上文描述的一致,保證本次調度的SetenceGroup全部是prompt phase或decode phase,只不過從完整的_scheduler() 函數對running waiting swapped 調度重構拆分為3個細粒度的函數_schedule_prefills、_schedule_running、_schedule_swapped。

此外Scheduler還新增了一種新的調度策略(_schedule_chunked_prefill),新的策略支持本次調度的SentenceGroup同時進行prompt phase和decode phase,能盡可能提高單次matmul的weight 搬運的利用率,提高request并行度以提高tps吞吐。該策略的主要流程是:先執行_schedule_running,保證running 隊列中decode phase 的高優先級SentenceGroup 有足夠的block給每個Sentence生成新的output token,否則preempt running隊列中低優先級SentenceGroup。在執行_schedule_swapped,把滿足free block資源的swapped SentenceGroup swap-in。最后執行_schedule_prefills,把waiting 隊首的SentenceGroup調度直至超出block分配上限。把running、swapped、waiting 成功調度的請求組成新的running 隊列輸出。需要注意由于running隊列中的SentenceGroup會處于prompt phase或decode phase,需要標記每個SentenceGroup所處的階段,在執行Attention的時候會把prompt phase 和decode phase分開進行執行。

圖片Attention 類對不同Scheduler 模式的處理圖片不同階段的Seq分別計算Attention Kernel

vLLM的代碼庫有幾個禮拜沒更新,發現很多地方已經重構了,尷尬。。。

之后再更新存儲管理和page attention相關 kernel解析。

責任編輯:張燕妮 來源: 自動駕駛之心
相關推薦

2017-03-16 15:28:20

人工智能視覺識別

2020-02-17 21:52:19

微信支付寶健康碼

2024-07-23 10:34:57

2025-10-31 00:00:02

硅光光通信英偉達

2025-10-29 07:33:13

2024-02-07 12:35:00

React并發模式concurrent

2022-05-04 08:38:32

Netty網絡框架

2021-05-11 07:30:58

JNIJavaAPI

2021-01-28 17:41:32

Github網站Pull Reques

2022-04-10 19:26:07

TypeScript類型語法

2021-01-18 13:05:52

Serverless Serverfull FaaS

2024-07-12 15:08:23

Python@wraps函數

2024-08-26 14:23:56

2024-08-01 17:34:56

Promiseaxios請求

2021-12-26 00:01:51

Log4Shell漏洞服務器

2022-09-06 21:38:45

數字人數字孿生

2021-12-16 15:11:59

Facebook天秤幣加密貨幣

2022-07-26 00:00:03

語言模型人工智能

2020-10-27 10:26:03

編程開發Java

2024-09-04 16:19:06

語言模型統計語言模型
點贊
收藏

51CTO技術棧公眾號

欧美久久久影院| 久久久久久麻豆| 亚洲h在线观看| 精品国产日本| 亚洲影院一区二区三区| 伊人久久大香线| 91国产丝袜在线播放| 一区二区三区|亚洲午夜| 亚洲成熟女性毛茸茸| 日韩国产欧美| 精品国产免费久久| 四季av一区二区| 大黄网站在线观看| 中文字幕+乱码+中文字幕一区| 91精品国产99久久久久久红楼| 狠狠躁夜夜躁人人爽天天高潮| 成人在线电影在线观看视频| 精品成人一区二区三区| 99热这里只有精品在线播放| 爱情岛亚洲播放路线| 国产精品对白交换视频| 麻豆av一区| 亚洲第一天堂在线观看| 美女网站在线免费欧美精品| 亚洲男人天堂手机在线| 一级做a爱视频| 久久uomeier| 亚洲国产精品嫩草影院| 成人av资源网| 亚洲天堂国产精品| 天堂在线一区二区| 国产69精品久久久| 黄色国产在线播放| 免费成人结看片| 欧美精品一区二区高清在线观看| www.国产视频.com| 国产精品99| 色婷婷激情一区二区三区| 僵尸世界大战2 在线播放| 午夜伦理在线视频| 亚洲欧美国产77777| 亚洲精品一区二区毛豆| 欧美色18zzzzxxxxx| 成人免费看黄yyy456| 91手机在线观看| 国产喷水福利在线视频| 久久国产免费看| 国产日韩欧美成人| 亚洲天堂中文网| 麻豆成人久久精品二区三区小说| 国产精品久久精品| 182在线观看视频| 成人av二区| 国产一区二区三区网站| 免费人成又黄又爽又色| 一区二区三区日本久久久| 欧美亚洲国产一卡| 国产精品wwwww| 91精品xxx在线观看| 国产精品福利一区二区| 中国成人亚色综合网站| 美女隐私在线观看| 亚洲日穴在线视频| 青青视频免费在线观看| 日本片在线观看| 亚洲图片欧美视频| 国产精品无码av在线播放| 亚洲毛片在线播放| 久久午夜电影| 国产国语videosex另类| 麻豆视频在线观看| 一区在线免费| www国产精品视频| 强制高潮抽搐sm调教高h| 91高清一区| 欧美精品成人在线| 欧美性猛交bbbbb精品| 老司机精品视频网站| 国产在线精品一区免费香蕉| av网站免费大全| 94色蜜桃网一区二区三区| 欧美日韩免费观看一区| 在线a免费看| 一区二区三区在线免费观看| 青青草精品视频在线| 欧美天堂视频| 51精品国自产在线| 蜜臀av粉嫩av懂色av| 欧美女优在线视频| 久久精品人人做人人爽| 日本熟妇成熟毛茸茸| 日韩成人免费电影| 97国产一区二区精品久久呦| 日韩久久中文字幕| 久久se精品一区二区| 91爱视频在线| 中文字幕欧美人妻精品| 国产99精品国产| 欧美日韩精品一区| av毛片在线免费| 日韩欧美aaa| 欧美一区二区三区影院| 国产一区二区三区天码| 欧美成人网在线| 欧美一级做a爰片免费视频| 国产黄色成人av| 日本成人看片网址| 香蕉视频网站在线| 国产精品精品国产色婷婷| 九色自拍视频在线观看| 日韩城人网站| 亚洲品质视频自拍网| 三级黄色片网站| 97偷自拍亚洲综合二区| 97av视频在线| 成 人 免费 黄 色| 国产精品丝袜久久久久久app| 国产不卡一区二区视频| 91久久青草| 国产一区二区三区久久精品| 日韩欧美亚洲视频| 国产精品亚洲第一| 中日韩在线视频| 国产经典一区| 亚洲精品视频免费在线观看| 久久这里只有精品免费| 精品一区二区三区免费播放| 欧美一区二区在线视频观看| av免费不卡国产观看| 日韩视频免费观看高清完整版 | 亚洲欧美精品一区二区| 精品无码av在线| 国产毛片精品视频| 在线精品亚洲一区二区| 国产经典一区| 亚洲图片制服诱惑| 无码无套少妇毛多18pxxxx| 暴力调教一区二区三区| 日本高清视频免费在线观看| 日韩有码欧美| 色哟哟亚洲精品一区二区| 人妻丰满熟妇av无码区| 2021国产精品久久精品| 黄色一级片播放| 色天下一区二区三区| 国内外成人免费激情在线视频网站 | 久久久久久影院| 国产欧美一区二区三区视频 | 亚洲国产成人午夜在线一区| 成人精品视频一区二区| 国产91一区| 日韩美女福利视频| 国产福利免费在线观看| 中文字幕国产一区| 国产三级三级三级看三级| 要久久爱电视剧全集完整观看| 91高清免费在线观看| 天堂在线视频观看| 欧美视频专区一二在线观看| 日本黄色网址大全| 日韩国产欧美在线视频| 亚洲精品中文字幕乱码三区不卡| 看片一区二区| 久久久精品日本| 精品国产乱码久久久久久蜜臀网站| 亚洲精品视频在线看| 亚洲精品鲁一鲁一区二区三区| 九一国产精品| 国产精品国产三级国产专播精品人| 国产高清视频免费最新在线| 欧美日韩亚洲综合在线 欧美亚洲特黄一级| 日本美女xxx| 国产在线精品不卡| 韩日视频在线观看| 巨大黑人极品videos精品| 久久综合久久美利坚合众国| 亚洲精品国产片| 黑人巨大精品欧美一区免费视频 | 国产+人+亚洲| 国产女主播在线直播| 欧美日韩激情在线| 国产一级视频在线| 久久超级碰视频| 91视频 - 88av| 丝袜美腿综合| 国产日韩一区在线| 久久久久黄久久免费漫画| 亚洲欧美资源在线| 国产高清在线免费| 色婷婷精品久久二区二区蜜臂av| 国产性生活大片| 97se亚洲国产综合自在线| www.亚洲高清| 亚洲青涩在线| 久久av秘一区二区三区| 美女av一区| 成人免费视频a| 欧美男男激情videos| 日韩一区二区三区国产| 欧美 日韩 国产 成人 在线 91| 色屁屁一区二区| 精品99久久久久成人网站免费| 久久青草国产手机看片福利盒子| 亚洲一区二区三区观看| 先锋影音久久| 久久av高潮av| 欧美成人milf| 欧美黑人3p| av不卡一区| 成人精品福利视频| 日本免费一区二区三区四区| 久久久久久久久久久国产| 午夜在线视频播放| 亚洲区在线播放| 人妻无码中文字幕| 日韩一区二区三区在线| 中文字幕第31页| 欧美日韩激情视频| 欧美毛片在线观看| 中文字幕一区二区不卡| 国产精品无码久久久久一区二区| 国产欧美91| 欧美极品色图| 97久久亚洲| 3d动漫啪啪精品一区二区免费| 韩国成人在线| 国产精品99导航| 自拍偷拍欧美视频| 91国语精品自产拍在线观看性色| 4438x成人网全国最大| www.日韩不卡电影av| 国产福利第一视频在线播放| 日韩精品视频在线观看免费| 欧美性猛交bbbbb精品| 亚洲一区免费视频| 青青草手机视频在线观看| 亚洲色图欧洲色图婷婷| 欧美色图17p| 国产精品人人做人人爽人人添| av男人的天堂av| 久久综合九色综合97_久久久| www国产视频| www.欧美.com| 99re久久精品国产| 99国产欧美另类久久久精品| 国产黑丝在线观看| 91色在线porny| 特大黑人巨人吊xxxx| 91亚洲精品久久久蜜桃网站| 亚洲黄色免费在线观看| 99久久久国产精品| 亚洲国产欧美视频| 久久久青草青青国产亚洲免观| 亚洲综合网在线观看| 国产亚洲欧美日韩俺去了| jizz中文字幕| 国产精品成人网| 天天干中文字幕| 亚洲一区中文日韩| 日韩字幕在线观看| 一本大道久久a久久精二百| 免费黄色片视频| 一区二区三区中文在线| 强行糟蹋人妻hd中文| 亚洲国产精品视频| 亚洲 欧美 日韩 综合| 日韩欧美中文在线| 中文在线资源天堂| 91精品国产综合久久香蕉麻豆| 国产高清视频免费观看| 亚洲精品福利免费在线观看| 日本午夜在线视频| 最近2019年手机中文字幕| 亚洲欧美成人影院| 4k岛国日韩精品**专区| 日本午夜精品久久久久| 不卡一卡2卡3卡4卡精品在| 久久资源综合| 亚洲精品久久区二区三区蜜桃臀| 亚洲va在线| 2018国产在线| 久久激情五月婷婷| 97精品人人妻人人| 久久69国产一区二区蜜臀| 男插女视频网站| 99riav久久精品riav| 成人在线手机视频| 一区二区三区四区中文字幕| 可以免费看的av毛片| 欧美在线短视频| www.av日韩| 亚洲系列中文字幕| 青青草原国产在线| 日韩免费高清在线观看| 高清一区二区中文字幕| 国产日本欧美一区二区三区| 视频精品一区| 日韩欧美精品在线不卡| 午夜国产一区| 精品999在线| jizz一区二区| 中文字幕电影av| 在线这里只有精品| 欧美一区二区在线观看视频| 最近中文字幕日韩精品| 理论不卡电影大全神| 成人综合国产精品| 狠狠色狠狠色综合婷婷tag| 17c丨国产丨精品视频| 国产精品久久久久久久久久10秀| 免费看黄在线看| 经典一区二区三区| 极品蜜桃臀肥臀-x88av| 五月综合激情婷婷六月色窝| 国产精品伊人久久| 亚洲一区二区黄| 欧美xxxhd| 国产乱子伦精品| 午夜视频精品| 亚洲一区精品视频在线观看| 久久精品一区二区三区不卡牛牛| 免费中文字幕视频| 欧美一区二区三区免费大片 | 亚洲一区 二区| 一区二区三区四区欧美日韩| 久久精品一区二区国产| 中国极品少妇videossexhd| 亚洲精品日产精品乱码不卡| 亚洲在线精品视频| 一区二区三区四区视频| 人狥杂交一区欧美二区| 国产手机精品在线| 亚洲图片在线| 午夜性福利视频| 亚洲精品乱码久久久久久久久 | 欧美成人精精品一区二区频| 国产精品嫩草影院桃色| 日韩av中文字幕在线免费观看| 新版中文在线官网| 999热视频| 欧美天天视频| 波多野结衣家庭教师在线| 成人美女视频在线看| 久久这里只有精品免费| 日韩欧美在线1卡| 色呦呦在线看| 国产精品99久久久久久久| 狠色狠色综合久久| av免费观看不卡| 亚洲成人自拍一区| 熟妇高潮一区二区三区| 欧美亚洲另类激情另类| 伊人春色之综合网| 国产成人精品视频ⅴa片软件竹菊| 97久久精品人人做人人爽| 综合激情网五月| 亚洲欧美中文另类| 国产成人免费| 麻豆映画在线观看| 国产91精品露脸国语对白| 国产真实的和子乱拍在线观看| 精品国产精品一区二区夜夜嗨| 91禁在线看| 欧美日韩国产免费一区二区三区| 爽爽淫人综合网网站| 大胸美女被爆操| 欧美一区二区三区视频在线| 日韩精品卡一| 免费h精品视频在线播放| 日本aⅴ亚洲精品中文乱码| 性色国产成人久久久精品| 日韩一级欧美一级| 极品视频在线| 日韩在线导航| 国产精品456露脸| 在线天堂中文字幕| 一区二区三区美女xx视频| 成人激情久久| 日本中文字幕网址| 国产一区二区三区免费观看| 欧美激情国产精品免费| 日韩精品免费在线观看| 国产精品亚洲成在人线| 欧美久久久久久久久久久久久久| 91视频国产资源| 国产日本精品视频| 538国产精品视频一区二区| 99成人在线视频| 99久久免费看精品国产一区| 在线观看免费一区| 中文字幕有码在线观看| 欧美高清性xxxxhdvideosex| 精品一区二区在线免费观看| 九九热在线视频播放| 色七七影院综合| 日韩av中文字幕一区| 欧美激情第四页| 色噜噜夜夜夜综合网| 女囚岛在线观看| 亚洲一区二区精品在线观看|