精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Kimi論文自曝推理架構,80%流量都靠它承擔

人工智能 新聞
清華大學計算機系助理教授章明星表示,從目前的趨勢來看,大模型服務的負載會愈發的復雜和多元化,調度會越來越復雜,也會越來越重要。

月之暗面和清華KVCache.ai團隊的最新論文,首次揭秘了Kimi背后的推理架構

要知道Kimi是國產大模型的當紅炸子雞,火到可以說從來沒缺過流量,甚至還經常出現過載。

圖片

而隨著論文的發布,這潑天的流量到底如何被Kimi接住的問題,也有了答案。

圖片

Kimi背后的推理架構名叫Mooncake(月餅),主要特點是采取了分離式的設計方案

而且,Mooncake在設計之時就考慮了可能出現的大流量場景,并針對這種情況專門研發。

在模擬場景下,Mooncake最高能帶來525%的吞吐量增長,實際場景中也能多處理75%請求

另據月之暗面工程副總裁許欣然的一篇知乎文章介紹,Kimi有80%以上的流量,都是由該系統承接

從KV緩存出發,建造分布式系統

整個Mooncake系統設計的核心,是圍繞著KV緩存展開的。

(KV緩存用于存儲鍵-值對(Key-Value Pairs),主要優勢在于可以簡單高效地訪問和檢索數據,在大模型當中可以提高推理速度并減少計算資源消耗。)

之所以這樣做,是因為團隊預計KV緩存的容量會長期保持高位,因此圍繞KV緩存進行優化十分必要。

圖片

從結構上看,Mooncake由全局調度器(Conductor)、Prefill節點集群、Decoding節點集群和分布式KVCache池幾部分組成,另外還有RDMA通信組件(Messenger)

其中全局調度器是用戶請求到達系統后的第一站,它負責接收請求并根據KV緩存分布和負載情況,將請求調度到Prefill和Decoding節點

調度器在調度時需要綜合考慮KV緩存的復用長度、負載均衡等因素,實現KV緩存復用的最大化。

具體到Mooncake,它采用了一種啟發式的自動熱點遷移策略,可以在不需要精確預測未來訪問的情況下自動復制熱點KV緩存塊。

同時,這種動態復制熱點KV緩存塊的方式,也是實現均衡負載的一種重要途徑。

實驗結果表明,與隨機調度和負載均衡調度相比,Mooncake的調度策略可以顯著降低TTFT(Time To First Token,首個Token延遲),提高系統性能。

圖片

完成調度之后,任務會分別交由Prefill和Decoding節點進行運算。

Prefill節點接收到調度器轉發過來的請求后,會從KV緩存池中讀取緩存,執行預計算并生成新的KV緩存。

對于長上下文請求,Mooncake還會分塊流水并行的方式,使用多個節點并行處理來降低延遲。

而Decoding節點除了接收調度器發來的請求外,還會收到Prefill階段生成的KV緩存,節點會對這些緩存執行解碼并生成最終結果。

圖片

這當中,大容量、高性能的KV緩存存儲由緩存池提供;RDMA通信組件則憑借其高帶寬、低延遲的優勢,負責在不同節點之間的KV緩存傳輸。

除了采取以KV緩存為中心的工作流程外,Mooncake還有另一個重要特點——分離式的架構

采取分離式架構的重要因素之一,是在于Prefill和Decoding兩個階段的計算特性差異很大

具體來說,它們分別要對TTFT和TBT(Time Between Tokens,Token間延遲)負責。

這就導致了兩者在計算復雜度、內存訪問方式、并行粒度和對延遲的敏感度上都存在差異:

圖片

所以,月之暗面團隊對GPU集群也進行了相應的拆分,以便將它們分別部署在不同節點集群上,實現資源隔離和專門優化。

另外,Mooncake中的KV緩存池也是分布式的,同時充分利用了GPU集群中空閑的CPU、DRAM和SSD資源,實現了大容量、高帶寬的KV緩存存儲和傳輸,同時也減少了閑置資源的浪費。

圖片

提前預測負載,及時拒絕超量請求

不過,即使Mooncake采用了高效的分離架構,但實際環境中的超大流量,對系統仍然是一個考驗。

對此,作者也提出了新的應對策略。

在過載場景下,調度的關鍵是決定是否接受新的請求。

由于Mooncake采用的是分離式架構,可以采取早期拒絕策略,在Prefill階段就根據Decoding節點的負載情況,提前拒絕請求。

Mooncake使用TTFT和TBT的SLO(Service Level Objective,服務等級目標)滿足情況作為負載的度量指標。

具體的SLO要求是TTFT的90分位值(P90)不超過單個請求在空載條件下處理時間的10倍,TBT的P90值不超過5倍。

這種早期拒絕策略可以顯著減少無效的Prefill計算,提高資源利用率,但同時也帶來了新的問題——Prefill和Decoding節點負載的波動,導致資源利用率下降、影響系統性能。

圖片

這是由于早期拒絕策略中,系統做出請求拒絕的決策時存在滯后性,如下圖所示:

  • 在階段1,Prefill節點和Decoding節點的負載都較低,此時調度器會持續接受新的請求,直到Prefill節點的負載達到上限。
  • 進入階段2后,Rrefill節點處理的請求開始進入Decoding節點,導致其負載快速上升。當Decoding節點的負載超過閾值后調度器開始拒絕新的請求,但此時Prefill節點的負載仍然很高。
  • 到了階段3,由于調度器拒絕新請求,Prefill節點的負載開始下降。但此前積壓的請求正在Decoding階段處理,節點的負載仍然很高。
  • 最后是階段4,Decoding節點的負載開始下降,因為前面的請求都處理完成,而新的請求又被拒絕了。這時調度器再次開始接受新請求,Prefill節點的負載又開始上升。
  • 之后,這個過程會周期性地重復,導致Prefill和Decoding節點的負載出現反相位的波動。

圖片

針對這一問題,月之暗面團隊對這種簡單的早期拒絕策略進行了修正,提出了基于預測的早期拒絕策略,從而降低節點負載的波動。

這種策略的核心思想是對一段時間后的Decoding節點負載進行預測,并基于預測結果決定是否拒絕請求。

預測可以在請求級別和系統級別兩個層面進行,請求級別的預測比較困難,因為要預測單個請求的執行時間;系統級別的預測相對容易一些,只需要預測整體的負載情況。

Mooncake采用的是一種簡化的系統級別預測方法,假設每個請求的執行時間服從某個固定分布,據此預測未來一段時間內的負載情況。

實驗結果表明,這種基于預測的早期拒絕策略,可以有效緩解負載波動問題。

圖片

最終,端到端性能評估結果表明,Mooncake的架構設計和優化策略,有效提高了推理服務性能,尤其在長上下文和真實場景下優勢更加顯著。

在ArXiv Summarization和L-Eval數據集上,Mooncake的吞吐量比baseline方法vLLM分別提高了20%和40%。

圖片

在模擬數據集上,Mooncake的吞吐量最高可達525%,在真實數據集上也可以比vLLM多處理約75%的請求。

圖片

過載場景下的性能評估結果則顯示,使用基于預測的早期拒絕策略時,拒絕的請求數量從baseline的4183個減少到了3589個,說明系統的請求處理能力得到了提高。

圖片

針對未來的發展,論文的另一位作者、清華大學計算機系助理教授章明星表示,從目前的趨勢來看,大模型服務的負載會愈發的復雜和多元化,調度會越來越復雜,也會越來越重要。

而對于月之暗面的發展方向,則是由許欣然做了解答——分布式策略的實施,也意味著未來月之暗面的整個系統,將往“算力/$”和“帶寬/$”兩個方向獨立發展,從而對硬件優化更加友好。

論文地址:https://arxiv.org/pdf/2407.00079
GitHub:https://github.com/kvcache-ai/Mooncake

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-05-19 08:54:00

2021-09-26 07:46:28

互聯網CDNHTTP 協議

2024-11-29 13:54:13

Kimi架構大模型

2021-05-07 06:15:32

編程開發端口掃描

2025-05-21 13:56:37

模型圖像AI

2025-10-31 16:04:17

DeepMindGPT-5世界模型

2025-04-11 09:10:00

模型開源AI

2023-05-09 13:55:08

GPT-4AI

2016-11-14 08:27:26

云計算數據中心

2025-02-24 08:30:00

視覺模型訓練

2009-07-17 13:24:55

Swing組件

2022-09-21 14:17:58

Umi-OCR軟件

2019-07-04 14:46:00

垃圾分類物聯網IoT

2018-11-06 21:30:44

jQuery前端API

2023-11-27 13:19:54

模型訓練

2025-10-15 00:00:00

2009-04-13 09:34:48

2025-09-04 09:03:08

2009-12-11 09:18:55

朗科80后億萬富翁

2025-10-09 07:05:00

Spark運維
點贊
收藏

51CTO技術棧公眾號

黄色免费在线观看网站| 男人天堂av在线播放| 日韩中文字幕无砖| 五月综合激情网| 日日噜噜噜噜夜夜爽亚洲精品| 在线观看中文字幕网站| 欧美视频日韩| 亚洲性无码av在线| 国产91在线免费观看| 免费一二一二在线视频| 日韩美女视频一区二区| 鲁丝一区二区三区免费| av天堂一区二区三区| 鲁大师成人一区二区三区| 美女扒开尿口让男人操亚洲视频网站| 中文字幕日韩三级片| 亚洲毛片在线免费| 日韩欧美在线网址| 中文字幕日韩精品无码内射| 国产区高清在线| av电影在线观看一区| 国产在线视频一区| 手机在线看片1024| 激情成人综合| 美女精品视频一区| 日韩欧美视频免费观看| 欧美人与牛zoz0性行为| 精品1区2区在线观看| 免费黄频在线观看| 在线日本欧美| 黑人欧美xxxx| 真实国产乱子伦对白视频| 91在线网址| 国产亚洲制服色| 国产一区二区三区黄| a天堂在线视频| 极品少妇xxxx精品少妇| 国产激情久久久久| 欧美一级片免费在线观看| 国产在线日韩| 欧美黄色片视频| 国产老头老太做爰视频| 在线日韩网站| 亚洲精品丝袜日韩| 人妻丰满熟妇av无码久久洗澡| 亚洲一区 二区| 日韩女同互慰一区二区| 91视频福利网| 网站一区二区| 日韩欧美综合在线| 日本55丰满熟妇厨房伦| 国产精品麻豆成人av电影艾秋| 在线观看一区不卡| 男女污污的视频| 51一区二区三区| 欧美日韩欧美一区二区| 成年人在线观看视频免费| 国产免费不卡| 欧美日韩情趣电影| 中文字幕在线视频精品| www久久久| 欧美一区二区三区在线电影| 两女双腿交缠激烈磨豆腐| 日本一区二区三区播放| 精品美女一区二区三区| 男男一级淫片免费播放| 日韩av三区| 亚洲视频自拍偷拍| 精品亚洲乱码一区二区| 亚洲成人一区| 国产69精品久久久久9999| 六月丁香激情综合| 亚洲精品国产精品乱码不卡| 你微笑时很美电视剧整集高清不卡| 日韩av网站在线| 素人fc2av清纯18岁| 国产一区二区电影在线观看| 色老头一区二区三区在线观看| 中文乱码字幕高清一区二区| 亚洲色图欧美| 国a精品视频大全| 国产suv精品一区二区33| 日本不卡一区二区三区高清视频| 国产裸体写真av一区二区 | 久久精品主播| 国产欧美精品日韩精品| 国产黄频在线观看| 91在线一区二区| 亚洲欧美成人一区| 性欧美ⅴideo另类hd| 欧美日韩免费网站| 污污的网站免费| 99ri日韩精品视频| 亚洲小视频在线观看| 欧美成人片在线观看| 午夜在线一区二区| 成人两性免费视频| 天堂av在线7| 综合电影一区二区三区| 日韩精品―中文字幕| 国产91精品在线| 亚洲成人黄色网| 四虎影视1304t| 性色一区二区三区| 91丨九色丨国产在线| 欧美成人片在线| 综合久久国产九一剧情麻豆| 黄色片一级视频| 亚洲3区在线| 在线亚洲国产精品网| 日韩成人免费在线视频| 精品一区二区国语对白| 日本成人看片网址| av成人 com a| 日韩你懂的在线播放| 超碰人人人人人人人| 一区二区日韩免费看| 99在线热播| 男人天堂久久久| 91高清视频免费看| 菠萝菠萝蜜网站| 欧美日本不卡高清| 91精品久久久久久久久久久| 伦理片一区二区三区| 午夜影院久久久| 伊人免费视频二| 日韩高清欧美| 国产不卡av在线| 三级av在线| 亚洲成a人片综合在线| 捷克做爰xxxⅹ性视频| 日韩欧美精品综合| 国产精品高潮呻吟久久av野狼| 亚洲欧洲综合在线| 懂色av影视一区二区三区| 亚洲熟妇一区二区| 黄色亚洲免费| 成人资源av| 丰满的护士2在线观看高清| 日韩一级片网址| a在线视频播放观看免费观看| 久久99日本精品| 杨幂一区欧美专区| 成人精品国产亚洲| 日韩中文字幕精品| 国产精品亚洲lv粉色| 综合精品久久久| 在线免费黄色小视频| 欧美阿v一级看视频| 91在线直播亚洲| 怡红院在线播放| 欧美大片一区二区三区| 久久国产一级片| 成人激情文学综合网| av免费观看国产| 日韩mv欧美mv国产网站| 欧美在线视频观看免费网站| 欧美日韩视频精品二区| 日本精品一级二级| 极品尤物一区二区| 国产一区二区伦理片| 免费看日b视频| 国内自拍欧美| 国产www精品| 久草资源在线| 精品人伦一区二区色婷婷| 国产乡下妇女做爰视频| 久久先锋资源网| 午夜精品在线免费观看| 外国成人免费视频| 肥熟一91porny丨九色丨| 美女高潮在线观看| 中文字幕av一区| 99国产精品99| 五月综合激情婷婷六月色窝| 国产毛片欧美毛片久久久| 精品一区二区三区免费播放| 好吊色视频988gao在线观看| 精品久久ai| 国产精品久久久久久久久借妻| 成人影院在线看| 精品视频久久久久久久| 中文字幕在线日亚洲9| 亚洲一区二区五区| 中文字幕人妻一区二区三区在线视频 | 亚洲日本aⅴ片在线观看香蕉| 日韩欧美一级大片| 亚洲尤物在线视频观看| 亚洲码无人客一区二区三区| 国产米奇在线777精品观看| 99精品在线免费视频| 日韩中文字幕高清在线观看| 国产亚洲第一区| 日韩成人综合网| 欧洲成人性视频| 在线中文字幕第一页| 国产亚洲精品91在线| 亚洲国产精品国自产拍久久| 欧洲精品视频在线观看| 日本三级黄色大片| 综合色中文字幕| 性欧美精品中出| 成人毛片老司机大片| 亚洲综合欧美激情| 久久国产高清| 日韩国产成人无码av毛片| 色喇叭免费久久综合| 蜜桃视频在线观看成人| 日韩在线亚洲| 国产日韩欧美一二三区| 国产精品av一区二区三区 | 亚洲欧洲在线看| 亚洲爱爱综合网| 欧美久久久久久蜜桃| 极品国产91在线网站| 亚洲午夜在线电影| 少妇人妻丰满做爰xxx| 欧美激情中文字幕| 精品无人区无码乱码毛片国产| 成人91在线观看| 免费成年人高清视频| 强制捆绑调教一区二区| 99久久久无码国产精品6| 亚洲狠狠婷婷| 日本一本中文字幕| 欧美久久九九| 国产大尺度在线观看| 欧美综合另类| 日本不卡在线播放| 综合亚洲色图| 免费h精品视频在线播放| 国产精品毛片视频| 国产精品初高中精品久久| 日韩精品一级| 亚洲淫片在线视频| 日本精品在线播放 | 91看片在线免费观看| 美女精品一区| 99爱视频在线| 国产视频一区免费看| 欧美啪啪免费视频| 亚洲一区黄色| 成人一级片网站| 国产精品入口| 成人羞羞国产免费网站| 视频一区二区三区入口| 国产成人综合一区| 男人的j进女人的j一区| 在线观看亚洲色图| 麻豆国产精品777777在线| 天天爽夜夜爽一区二区三区| 久久精品久久99精品久久| 五月婷婷之婷婷| 国产九九视频一区二区三区| 亚洲综合中文网| www.亚洲在线| www.中文字幕av| 日本一区二区三区国色天香 | 欧美精品自拍偷拍动漫精品| 国产原创中文av| 日韩视频免费观看高清完整版| 亚洲av综合色区无码一二三区 | 国产欧美在线| 久久久久久香蕉| 蜜臀国产一区二区三区在线播放| 手机免费av片| 成人av影院在线| www.中文字幕av| 亚洲欧美另类久久久精品 | 超碰porn在线| 国内伊人久久久久久网站视频| 不卡av播放| 成人网在线免费观看| 成人爽a毛片| 日韩美女一区| 国语自产精品视频在线看8查询8| 久在线观看视频| 精品在线你懂的| www国产视频| 中文字幕不卡在线播放| 久久综合加勒比| 色婷婷久久久久swag精品| 国产精品欧美亚洲| 日韩大片免费观看视频播放| √天堂资源地址在线官网| 欧美激情网站在线观看| 日韩性xxx| 99中文视频在线| 激情婷婷综合| 国产3p露脸普通话对白| 美女视频黄 久久| 亚洲视频在线播放免费| 中文字幕一区视频| 欧美bbbbbbbbbbbb精品| 7777精品伊人久久久大香线蕉超级流畅| 欧美熟女一区二区| 久久久精品久久久久| 亚洲精品日产| 产国精品偷在线| 欧美激情成人| 国产精品69页| 成人avav影音| 免费一级片在线观看| 欧美三级日韩在线| 日韩美女一级视频| 欧美黑人一区二区三区| **日韩最新| 亚洲国产欧洲综合997久久| 99亚洲伊人久久精品影院红桃| 天堂网成人在线| 国产精品久久精品日日| 你懂的国产在线| 精品国产凹凸成av人网站| 黄网页免费在线观看| 国产精品扒开腿做爽爽爽男男| 2023国产精华国产精品| 潘金莲一级淫片aaaaa免费看| 日韩国产欧美一区二区三区| 2一3sex性hd| 亚洲二区在线观看| 国产高清视频免费| 久久精品成人动漫| 麻豆精品蜜桃| 欧美一级片免费观看| 国产精品五区| 69xxx免费视频| 夜夜精品视频一区二区| aaa级黄色片| 九九久久久久久久久激情| 伊人久久大香| 香蕉视频在线网址| 精品亚洲国内自在自线福利| 91禁男男在线观看| 欧美人成免费网站| 人人干在线视频| 国产九九精品视频| 亚洲啊v在线观看| 亚洲色图偷拍视频| 亚洲视频一二三区| 国产三级三级在线观看| 久久九九免费视频| 精品国产亚洲一区二区三区| 中国 免费 av| 国产精品夜夜嗨| 九热这里只有精品| 亚洲福利视频专区| 国产夫妻在线| 欧美日韩亚洲免费| 免费欧美在线视频| 黄色录像二级片| 日韩欧美中文一区| 超碰资源在线| 免费电影一区| 免费高清视频精品| 日韩一区二区不卡视频| 日韩欧美国产午夜精品| 国产传媒在线观看| 日韩国产在线一区| 国产一区二区三区久久久| 精品国产欧美日韩不卡在线观看| 日韩一级欧美一级| 咪咪网在线视频| 日韩精品无码一区二区三区| 九九在线精品视频| 麻豆changesxxx国产| 亚洲精品视频在线观看视频| 91国拍精品国产粉嫩亚洲一区| 在线观看日韩羞羞视频| 国产传媒一区在线| 成人在线免费看视频| 这里只有视频精品| 亚洲精品黑牛一区二区三区| 国产黄视频在线| 国产精品毛片久久久久久| 国产黄a三级三级看三级| 欧美性一区二区三区| 久久一区二区三区喷水| 秘密基地免费观看完整版中文 | 黄上黄在线观看| 成人黄色av播放免费| 99精品视频免费| 国产精品18在线| 亚洲精品国产综合久久| 日韩一级特黄| 99热自拍偷拍| 亚洲欧美日韩综合aⅴ视频| 精品久久久久成人码免费动漫| 青青草原一区二区| 亚洲字幕久久| 99久久久无码国产精品性| 日韩一级完整毛片| 8av国产精品爽爽ⅴa在线观看| 国产成人生活片| 国产欧美精品一区| 人人妻人人澡人人爽久久av| 国产精品自产拍在线观看中文| 亚洲精品乱码| 五月天婷婷色综合| 中文字幕亚洲无线码在线一区| 黄色网一区二区|