精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

集群 CPU 利用率均值達(dá) 45% ,揭秘小紅書規(guī)模化混部技術(shù)實(shí)踐

開(kāi)發(fā) 架構(gòu)
整體架構(gòu)上,離線業(yè)務(wù)發(fā)布入口統(tǒng)一收斂在在一個(gè)集群,我們稱之為元數(shù)據(jù)集群,目的是為業(yè)務(wù)屏蔽底層多物理 K8s 集群。通過(guò) Virtual-Kubelet 連接元數(shù)據(jù)集群與物理集群,將閑置資源匯聚到元數(shù)據(jù)集群,在元數(shù)據(jù)集群中調(diào)度分發(fā)轉(zhuǎn)碼類任務(wù)到底層物理集群。

根據(jù) Gartner 預(yù)測(cè)數(shù)據(jù)顯示:2024 年全球 IT 支出預(yù)計(jì)將達(dá)到 5.1 萬(wàn)億美元,比 2023 年增長(zhǎng) 8 %。然而,該機(jī)構(gòu)的另一項(xiàng)調(diào)查數(shù)據(jù)顯示:全球數(shù)據(jù)中心服務(wù)器平均 CPU 利用率普遍低于 20%,存在巨大的資源浪費(fèi)。據(jù)測(cè)算,以數(shù)百萬(wàn)核 CPU 規(guī)模的數(shù)據(jù)中心為例,每提升 1 個(gè)百分點(diǎn)的整體資源利用率,每年將節(jié)省數(shù)千萬(wàn)元的成本。由此可見(jiàn),提高資源利用率對(duì)于降低企業(yè)運(yùn)營(yíng)成本具有顯著的效果。

早在 2015 年,谷歌就在其經(jīng)典論文《Large-scale cluster management at Google with Borg》中披露了它在資源管理和調(diào)度方面的實(shí)踐經(jīng)驗(yàn),是最早通過(guò)混部技術(shù)來(lái)提升資源利用率的公司之一。國(guó)內(nèi)多家頭部互聯(lián)網(wǎng)企業(yè)也相繼實(shí)施類似的技術(shù)方案,并取得可觀的資源利用率提升效果。

隨著小紅書業(yè)務(wù)的高速發(fā)展,各類在線、離線業(yè)務(wù)對(duì)計(jì)算資源的需求日益增長(zhǎng)。與此同時(shí),我們觀察到:部分在線集群天均利用率的水位卻維持在較低的水平。造成這一現(xiàn)象的主要原因有以下幾點(diǎn):

  • 在線服務(wù)資源使用量隨著終端用戶的使用習(xí)慣呈現(xiàn)穩(wěn)定的潮汐現(xiàn)象,夜間 CPU 利用率極低,從而導(dǎo)致整個(gè)集群的均值 CPU 利用率降低。
  • 業(yè)務(wù)保有大量的獨(dú)占資源池,資源池割裂產(chǎn)生大量的資源碎片,進(jìn)而降低 CPU 的利用率。
  • 出于穩(wěn)定性考慮,業(yè)務(wù)傾向于過(guò)量?jī)?chǔ)備資源,進(jìn)一步降低 CPU 的利用率。

基于以上背景,為了幫助業(yè)務(wù)降低資源使用成本,小紅書容器團(tuán)隊(duì)從 2022 年開(kāi)始規(guī)模化落地混部技術(shù),提升集群 CPU 利用率。截止目前,混部集群 CPU 利用率均值可達(dá) 45% 以上,為業(yè)務(wù)提供數(shù)百萬(wàn)核時(shí)的算力成本優(yōu)化。

一、技術(shù)演進(jìn)

小紅書混部技術(shù)演進(jìn)分為以下四個(gè)階段(如圖所示):

圖片圖片

階段一:閑置資源再利用

在早期,小紅書的集群資源管理相對(duì)粗放,集群中存在大量業(yè)務(wù)獨(dú)占的資源池。由于資源碎片化等因素,各個(gè)集群中存在許多低分配率的低效節(jié)點(diǎn),導(dǎo)致大量資源浪費(fèi)。同時(shí),基于 Kubernetes(K8s)發(fā)布的轉(zhuǎn)碼類近線/離線場(chǎng)景,在全天時(shí)段均存在大量計(jì)算資源需求。基于以上背景,小紅書容器平臺(tái)通過(guò)技術(shù)手段將集群中的閑置資源進(jìn)行收集,并將其分配給轉(zhuǎn)碼類業(yè)務(wù)場(chǎng)景使用。

整體架構(gòu)上,離線業(yè)務(wù)發(fā)布入口統(tǒng)一收斂在在一個(gè)集群,我們稱之為元數(shù)據(jù)集群,目的是為業(yè)務(wù)屏蔽底層多物理 K8s 集群。通過(guò) Virtual-Kubelet 連接元數(shù)據(jù)集群與物理集群,將閑置資源匯聚到元數(shù)據(jù)集群,在元數(shù)據(jù)集群中調(diào)度分發(fā)轉(zhuǎn)碼類任務(wù)到底層物理集群。

策略方面,二次調(diào)度器負(fù)責(zé)巡檢集群中的所有節(jié)點(diǎn),識(shí)別出低效節(jié)點(diǎn)并進(jìn)行標(biāo)記;隨后 Virtual-Kubelet 獲取物理集群中的低效節(jié)點(diǎn)可用資源作為集群閑置資源,再次分配給離線轉(zhuǎn)碼場(chǎng)景。同時(shí),二次調(diào)度器確保一旦在線服務(wù)有資源需求,將會(huì)立刻驅(qū)逐離線 Pod 并歸還資源。通過(guò)此舉,我們能夠提高集群資源的利用效率,減少資源浪費(fèi),并滿足轉(zhuǎn)碼類場(chǎng)景對(duì)計(jì)算資源的需求。

圖片圖片

階段二:整機(jī)騰挪分時(shí)復(fù)用

搜推廣等業(yè)務(wù)的獨(dú)占資源池,存在明顯的 CPU 利用率潮汐現(xiàn)象,尤其夜間利用率極低。通常情況下,資源池中的單個(gè)節(jié)點(diǎn)往往也只部署一個(gè)大規(guī)格業(yè)務(wù) Pod。基于這種情況,平臺(tái)通過(guò)彈性能力(HPA),在凌晨業(yè)務(wù)低峰期按比例對(duì)在線業(yè)務(wù)進(jìn)行縮容,釋放出整機(jī)資源,并將轉(zhuǎn)碼、訓(xùn)練等離線 Pod 在該時(shí)段運(yùn)行起來(lái),實(shí)現(xiàn)資源優(yōu)化,起到利用率“填谷”的效果。

在具體實(shí)施過(guò)程中,我們需要確保在線服務(wù)能夠在規(guī)定的時(shí)間內(nèi)全部被拉起。為此,我們采取以下策略:實(shí)現(xiàn)離線服務(wù)的提前退場(chǎng),并通過(guò)調(diào)度器的搶占機(jī)制進(jìn)行兜底,確保在線服務(wù)在業(yè)務(wù)高峰期來(lái)臨之前能被全量且及時(shí)地重新啟動(dòng)。

這一階段能最大限度地利用資源,使得離線服務(wù)在低峰期得到有效運(yùn)行,同時(shí)保證在線服務(wù)在業(yè)務(wù)高峰期能夠快速恢復(fù)運(yùn)行。

圖片圖片

階段三:常態(tài)混部

為了降低資源碎片率和業(yè)務(wù)資源持有成本,平臺(tái)持續(xù)推進(jìn)業(yè)務(wù)的大規(guī)模合池,將業(yè)務(wù)從獨(dú)占資源池遷移到平臺(tái)托管的公共混部池。通過(guò)合池、資源超賣等技術(shù)手段,我們有效提升了 CPU 分配率,但依舊無(wú)法解決合并后的資源池夜間利用率較低等問(wèn)題。另外,在合池后的復(fù)雜混部場(chǎng)景下,整機(jī)騰挪、分時(shí)混部離線的調(diào)度策略很難再繼續(xù)實(shí)施。平臺(tái)需要建設(shè)更為細(xì)粒度的資源管理與調(diào)度能力,來(lái)實(shí)現(xiàn)均值利用率提升的目標(biāo),具體包含以下幾點(diǎn):

1. 調(diào)度側(cè)

  • 通過(guò)動(dòng)態(tài)超賣技術(shù)獲取可用于二次分配給離線服務(wù)的可用資源量,并抽象出離線資源視圖,使得 K8s 調(diào)度器感知到這些離線資源。調(diào)度器調(diào)度離線負(fù)載到對(duì)應(yīng)節(jié)點(diǎn)上,實(shí)現(xiàn)離線服務(wù)對(duì)節(jié)點(diǎn)利用率的“填谷”效果。
  • 通過(guò)負(fù)載調(diào)度,盡可能避免在線服務(wù)被調(diào)度到高負(fù)載機(jī)器上,讓集群中節(jié)點(diǎn)負(fù)載更加均衡。
  • 通過(guò)二次調(diào)度,驅(qū)逐負(fù)載熱點(diǎn)機(jī)器上的高利用率服務(wù),使得集群負(fù)載保持動(dòng)態(tài)均衡狀態(tài)。

2. 單機(jī)側(cè)

  • 支持 QoS(Quality of Service)保障策略,根據(jù)服務(wù)的 QoS 等級(jí)提供差異化的運(yùn)行時(shí)資源保障能力。
  • 支持干擾檢測(cè)、離線驅(qū)逐等能力,當(dāng)離線服務(wù)對(duì)在線敏感服務(wù)產(chǎn)生干擾時(shí),第一時(shí)間驅(qū)逐離線服務(wù)。

通過(guò)以上技術(shù)手段,我們能夠有效地保障服務(wù)混合部署時(shí)的穩(wěn)定性,從而實(shí)現(xiàn)在線和離線工作負(fù)載在節(jié)點(diǎn)上的常態(tài)混合運(yùn)行,實(shí)現(xiàn)利用率“填谷”效果的最大化。

圖片圖片

階段四:統(tǒng)一調(diào)度

隨著常態(tài)混部和大規(guī)模資源合池的持續(xù)推進(jìn),小紅書云原生資源調(diào)度將會(huì)面臨以下挑戰(zhàn):

1. 各類業(yè)務(wù)場(chǎng)景對(duì)資源調(diào)度存在復(fù)雜且各異的功能和性能需求

  • 大數(shù)據(jù)、AI 場(chǎng)景下:排隊(duì)調(diào)度、批量調(diào)度(All-or-Nothing)、高吞吐量調(diào)度等需求。
  • 在線敏感服務(wù)場(chǎng)景下:資源調(diào)度成功率保障性需求、服務(wù)運(yùn)行時(shí)質(zhì)量保障性需求。

2. GPU 等異構(gòu)資源調(diào)度需求

  • 支持 GPU 共享調(diào)度、bin packing等調(diào)度能力,以提升 GPU 利用率及 GPU 機(jī)器上的 CPU 利用率。
  • 支持 GPU 拓?fù)涓兄⒂H和性調(diào)度等調(diào)度能力,通過(guò)優(yōu)化 GPU 間的通信效率,大幅提升大規(guī)模訓(xùn)練效率。

基于以上背景,我們提出面向混合云架構(gòu)的統(tǒng)一調(diào)度方案。該方案基于統(tǒng)一資源池,通過(guò)統(tǒng)一調(diào)度能力來(lái)管理異構(gòu)計(jì)算資源,并支持各類業(yè)務(wù)形態(tài)的工作負(fù)載調(diào)度能力。通過(guò)站在全局視角,將工作負(fù)載調(diào)度到最合適的節(jié)點(diǎn),讓業(yè)務(wù)跑得更快更穩(wěn)定,并降低全局資源使用成本。涉及到的關(guān)鍵技術(shù)點(diǎn)如下:

1. 在離線統(tǒng)一調(diào)度

  • 提供以 K8s 為底座的統(tǒng)一調(diào)度能力,支持包含在線敏感型服務(wù)、大數(shù)據(jù)/ AI 任務(wù)型工作負(fù)載在內(nèi)的統(tǒng)一資源調(diào)度。

2. QoS 感知調(diào)度

  • 基于服務(wù)畫像,結(jié)合系統(tǒng)指標(biāo)識(shí)別干擾源,并刻畫節(jié)點(diǎn)資源質(zhì)量。通過(guò)綜合調(diào)度、重調(diào)度和單機(jī)調(diào)度等不同維度的調(diào)度能力,降低業(yè)務(wù)間混部造成的干擾,從而提升在線服務(wù)的運(yùn)行質(zhì)量。

3. GPU 調(diào)度

  • 支持 GPU Share、bin packing、多 GPU 卡之間的親和性調(diào)度等調(diào)度能力,以提高 GPU 資源的利用效率。

4. 資源售賣模型

  • 根據(jù)資源質(zhì)量、資源供應(yīng)形態(tài)(如常態(tài)化供應(yīng)資源、分時(shí)潮汐資源、Spot 資源)和資源套餐規(guī)格等多個(gè)維度,定義差異化資源售賣模型,降低資源綜合使用成本。

5. 資源配額

  • 支持資源配額管理能力,包括分時(shí)配額、彈性配額和層級(jí)結(jié)構(gòu)管理等功能,避免多租戶之間的資源爭(zhēng)搶,提升資源使用效率。

二、架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)

小紅書容器統(tǒng)一資源調(diào)度系統(tǒng) Tusker (The Unified Scheduling system base on Kubernetes for Efficiency and Reliability) 架構(gòu)設(shè)計(jì)如圖所示:

圖片圖片

小紅書的各類業(yè)務(wù)場(chǎng)景通過(guò)多個(gè)發(fā)布平臺(tái)和任務(wù)平臺(tái)提交,并通過(guò)上層負(fù)載編排能力,以 Pod 形式下發(fā)到統(tǒng)一調(diào)度系統(tǒng)。統(tǒng)一調(diào)度系統(tǒng)基于不同的調(diào)度需求,為在線服務(wù)提供強(qiáng)保障的資源交付能力、差異化的 QoS 保障能力,同時(shí)為離線服務(wù)提供最小資源需求的保障能力和極致的彈性能力。

在調(diào)度側(cè),離線調(diào)度采用 Coscheduling 技術(shù);二次調(diào)度處理資源熱點(diǎn)問(wèn)題,包括熱點(diǎn)驅(qū)逐和碎片整理;負(fù)載調(diào)度基于 CPU 水位進(jìn)行調(diào)度,以實(shí)現(xiàn)更好地資源利用;資源視圖用于資源走查和模擬調(diào)度。

在單機(jī)側(cè),通過(guò)壓制策略如 BVT(Borrowed Virtual Time)進(jìn)行性能控制和資源限制,并進(jìn)行內(nèi)存驅(qū)逐操作;QoS 保障方面,采用綁核和超線程干擾抑制等技術(shù)來(lái)實(shí)現(xiàn)資源的差異化保障;計(jì)算和上報(bào)可用的 Batch 資源信息;來(lái)自 Kernel 的指標(biāo)采集包括  PSI(Pressure Stall Information)、調(diào)度信息等;干擾檢測(cè)基于 CPI(Cycles Per lnstruction)、PSI(Pressure Stall Information)和業(yè)務(wù)指標(biāo)等,用于檢測(cè)和處理干擾情況。

2.1 離線調(diào)度資源視圖

離線服務(wù)資源調(diào)度的基本原理是基于在線服務(wù)負(fù)載感知能力的動(dòng)態(tài)超賣,具體實(shí)現(xiàn)是將節(jié)點(diǎn)空閑資源二次分配給離線業(yè)務(wù):

圖片圖片

其中離線可用資源為節(jié)點(diǎn)上的空閑資源(包含未分配資源和已分配未使用資源之和),扣除安全預(yù)留資源之后的剩余資源,離線可用資源計(jì)算公式如下:

離線可用資源 = 整機(jī)資源 – 預(yù)留資源 – 在線服務(wù)實(shí)際使用量

將計(jì)算出的離線可用資源量按照時(shí)間分布后如圖所示(圖中綠色部分):

圖片圖片

實(shí)際落地過(guò)程中,為了避免離線可用資源隨在線服務(wù)資源使用波動(dòng)而大幅波動(dòng),從而影響離線資源質(zhì)量和離線服務(wù)運(yùn)行穩(wěn)定性,可以通過(guò)資源畫像對(duì)上述公式中的在線服務(wù)實(shí)際使用量數(shù)據(jù)進(jìn)一步處理,去除數(shù)據(jù)噪點(diǎn),最終計(jì)算出一個(gè)相對(duì)穩(wěn)定的離線可用資源量(圖中綠色部分),如圖所示:

圖片圖片

2.2 混部 QoS 保障策略

2.2.1 QoS 分級(jí)

按照業(yè)務(wù)對(duì)于服務(wù)質(zhì)量(QoS: Quality of Service)的需求,小紅書的業(yè)務(wù)類型可以簡(jiǎn)單劃分為三個(gè) QoS 級(jí)別,如下表所示:

QoS 等級(jí)

說(shuō)明

業(yè)務(wù)場(chǎng)景


Latency-Sensitive

最高 QoS 保障等級(jí),延遲極為敏感服務(wù)


搜推廣延遲極為敏感場(chǎng)景


Mid


默認(rèn) QoS 保障等級(jí),容忍部分干擾延遲


網(wǎng)關(guān)、Java 微服務(wù)



Batch


最低 QoS 保障等級(jí),延遲不敏感,資源隨時(shí)可能被搶

轉(zhuǎn)碼、Spark、Flink、訓(xùn)練等計(jì)算場(chǎng)景

2.2.2 QoS 保障

根據(jù)服務(wù)的 QoS 需求,節(jié)點(diǎn)側(cè)可以采取 Pod 粒度的分級(jí)資源保障,以實(shí)現(xiàn)不同資源維度的差異化 QoS 保障策略,具體的保障參數(shù)如下:

資源

特性

Latency-Sensitive

Mid

Batch


CPU


CPU Burst

enable

enable

disable

調(diào)度優(yōu)先級(jí)

最高

默認(rèn)

綁核

share(默認(rèn))

share(默認(rèn))

reclaimed

NUMA

強(qiáng)保證

prefer(默認(rèn))

none

L3 Cache

100%

100%(默認(rèn))


30%(默認(rèn))

內(nèi)存帶寬

100%

100%(默認(rèn))

30%(默認(rèn))


內(nèi)存


OOM 優(yōu)先級(jí)

最低

默認(rèn)

最高

內(nèi)存回收水線

調(diào)高

默認(rèn)

調(diào)低

在 CPU 核編排層面,我們針對(duì)不同的需求場(chǎng)景,設(shè)置了三種不同的綁核類型,并設(shè)計(jì)了一套精細(xì)化 CPU 核編排策略,分配示意圖如下:

圖片圖片

三種綁核類型分別為:

Exclusive

  • 特點(diǎn):綁定 cpuset 調(diào)度域、CCD 感知、NUMA 綁定、獨(dú)占排他
  • 場(chǎng)景:適用于對(duì)延遲極為敏感的搜推廣大規(guī)格服務(wù)

Share(推薦)

  • 特點(diǎn):綁定 cpuset 調(diào)度域、CCD 感知、NUMA(可選)綁定、Share/Exlusive 排他、可與 None 類型業(yè)務(wù)共享
  • 場(chǎng)景:適用于容忍部分干擾的 Java 微服務(wù)、應(yīng)用網(wǎng)關(guān)、Web服務(wù)等

Reclaimed

  • 特點(diǎn):無(wú) cpuset 綁定、可能與非 exlusive 綁核模式的業(yè)務(wù)共享核,核的分配完全由內(nèi)核控制,CPU 資源并非百分之百能夠滿足需求
  • 場(chǎng)景:適用于 Batch 類離線服務(wù),部分對(duì)延遲無(wú)要求的計(jì)算服務(wù)

2.2.3 離線驅(qū)逐

在極端場(chǎng)景下,如整機(jī)內(nèi)存使用率較高、有觸發(fā) OOM 風(fēng)險(xiǎn),或者離線業(yè)務(wù) CPU 長(zhǎng)期得不到滿足時(shí),可以采取離線驅(qū)逐策略。單機(jī)側(cè)支持按照離線服務(wù)內(nèi)部定義的優(yōu)先級(jí)配置、資源用量和運(yùn)行時(shí)長(zhǎng)等多維度綜合算分排序后,按序驅(qū)逐離線服務(wù),以達(dá)到最優(yōu)的資源利用效果。

2.3 離線業(yè)務(wù)場(chǎng)景舉例

小紅書作為一個(gè)擁有數(shù)億用戶的內(nèi)容社區(qū),其離線業(yè)務(wù)場(chǎng)景豐富多樣,其中包含大量視頻類和圖片類轉(zhuǎn)碼場(chǎng)景、搜推、CV/NLP 算法推理訓(xùn)練、算法特征生產(chǎn)以及數(shù)倉(cāng)查詢等離線場(chǎng)景。具體而言,包含以下業(yè)務(wù)類型:

  • 近離線轉(zhuǎn)碼場(chǎng)景(已容器化)
  • Flink 流式/批式計(jì)算(已容器化)
  • Spark 批式計(jì)算 (未容器化、On YARN)
  • CV/NLP 算法回掃場(chǎng)景(已容器化)
  • 訓(xùn)練場(chǎng)景 (已容器化)

通過(guò)基于 K8s 的在離線統(tǒng)一調(diào)度能力,將這些離線業(yè)務(wù)與在線服務(wù)混合部署在統(tǒng)一資源池中。不僅能為在線服務(wù)提供差異化的資源質(zhì)量保障,亦能為離線服務(wù)提供海量的低成本算力,以實(shí)現(xiàn)資源效能的提升。

圖片圖片

2.3.1 K8s 與 YARN 混部方案

在小紅書商業(yè)化、社區(qū)搜索等業(yè)務(wù)中存在大量的算法類 Spark 任務(wù),由于離線集群資源緊張,任務(wù)無(wú)法及時(shí)處理,導(dǎo)致任務(wù)堆積。同時(shí),在線集群在業(yè)務(wù)低峰時(shí)段資源使用率較低。另外,相當(dāng)大比例的 Spark 任務(wù)資源調(diào)度仍運(yùn)行在 YARN 調(diào)度器上。基于此背景,為了快速降低業(yè)務(wù)遷移成本,在方案選型方面,我們選擇與 Kooridinator 社區(qū)合作,采用 YARN on K8s 混部方案來(lái)快速落地 Spark 離線場(chǎng)景混部,具體方案如圖所示:

圖片圖片

在線和離線工作負(fù)載在容器化環(huán)境下通過(guò) K8s 鏈路發(fā)布到在線集群內(nèi)。Spark 作業(yè)通過(guò) YARN ResourceManager 調(diào)度到具體節(jié)點(diǎn),并由節(jié)點(diǎn)上的 NodeManager 組件拉起。NodeManager 以容器的形式部署在在線 K8s 集群中,實(shí)現(xiàn)資源的有效管理。除此之外,還涉及到以下組件:

1. 調(diào)度側(cè)

  • Koord-Yarn-Operator:支持 K8s 與 YARN 調(diào)度器資源視圖的雙向同步,確保資源信息的共享和一致性。

2. 節(jié)點(diǎn)側(cè)

  • Copilot:作為 NodeManager 的操作代理,提供 YARN Task 的管控接口。
  • Tusker-agent/koordlet:負(fù)責(zé)離線資源的上報(bào)、節(jié)點(diǎn)上離線 Pod/Task 管理,并處理沖突解決、驅(qū)逐、壓制策略等功能。

多調(diào)度器資源同步

K8s 調(diào)度器與 YARN 調(diào)度器之間原本獨(dú)立且相互不感知,為了共享分配節(jié)點(diǎn)上的總可用離線資源,需要通過(guò) Koord-Yarn-Operator 組件來(lái)做兩個(gè)調(diào)度器之間的資源雙向同步和協(xié)調(diào),并實(shí)現(xiàn)兩個(gè)同步鏈路:

1. K8s ->YARN 調(diào)度器資源同步鏈路,負(fù)責(zé)同步 YARN 視角離線資源總量,其中 YARN 離線資源總量計(jì)算如下:

YARN離線資源總量 = 離線總可用量 – K8s 側(cè)節(jié)點(diǎn)已分配

2. YARN->K8s 調(diào)度器資源同步鏈路,負(fù)責(zé)同步已分配的 YARN 資源量,其中 K8s 離線資源總量計(jì)算如下:

K8s 離線資源總量 = 離線總可用量 – YARN 側(cè)節(jié)點(diǎn)已分配

基于各自節(jié)點(diǎn)離線資源視圖,兩個(gè)調(diào)度器分別作出調(diào)度決策,將離線 Pod 與 YARN Task 調(diào)度到適當(dāng)?shù)墓?jié)點(diǎn)上。由于同步過(guò)程不適合加鎖,可能會(huì)出現(xiàn)資源被過(guò)量分配的問(wèn)題:

圖片圖片

具體解決措施是在單機(jī)側(cè)增加了仲裁邏輯。當(dāng)節(jié)點(diǎn)已分配的離線服務(wù)資源量長(zhǎng)期超過(guò)節(jié)點(diǎn)可用離線資源,且離線使用率持續(xù)較高時(shí),存在離線服務(wù)無(wú)法獲得資源而被餓死的風(fēng)險(xiǎn)。單機(jī)側(cè)會(huì)根據(jù)離線服務(wù)的優(yōu)先級(jí)、資源占用量和運(yùn)行時(shí)長(zhǎng)等因素綜合算分,并按序驅(qū)逐。

三、落地收益

截止目前,小紅書混部能力覆蓋數(shù)十萬(wàn)臺(tái)機(jī)器規(guī)模,覆蓋算力規(guī)模數(shù)百萬(wàn)核,支持?jǐn)?shù)萬(wàn)規(guī)模在線、離線場(chǎng)景服務(wù)的資源調(diào)度。通過(guò)大規(guī)模容器混部的持續(xù)推進(jìn),小紅書在資源成本效能等方面都取得了顯著收益,具體包含以下兩方面:

     CPU 利用率

  • 在保證在線服務(wù)服務(wù)質(zhì)量的前提下,在線混部集群天均 CPU 利用率提升至 45% 以上,部分集群天均 CPU 利用率可穩(wěn)定提升至 55%。
  • 通過(guò)在離線混部等技術(shù)手段,在線集群 CPU 利用率提升 8%-15% 不等,部分存儲(chǔ)集群利用率提升可達(dá) 20% 以上。

     資源成本

  • 在保證離線業(yè)務(wù)穩(wěn)定性的前提下,為小紅書各類離線場(chǎng)景提供數(shù)百萬(wàn)核時(shí)的低成本算力。
  • 混部集群 CPU 分配率提升至 125% 以上,相較于獨(dú)占資源池,資源碎片率明顯下降。

四、總結(jié)與展望

在小紅書近一年多的混部技術(shù)探索中,我們?cè)谫Y源效能提升方面積累了較為豐富的落地經(jīng)驗(yàn),并取得了不錯(cuò)的收益。隨著公司業(yè)務(wù)規(guī)模逐步增長(zhǎng),場(chǎng)景愈發(fā)復(fù)雜,我們將會(huì)面臨諸多新的技術(shù)挑戰(zhàn)。展望未來(lái),我們的目標(biāo)是建設(shè)面向混合云架構(gòu)的統(tǒng)一資源調(diào)度能力,具體工作將圍繞以下三方面展開(kāi):

  1. 混合工作負(fù)載調(diào)度能力支持:為了滿足小紅書所有業(yè)務(wù)場(chǎng)景的資源調(diào)度功能、性能需求,重點(diǎn)發(fā)展任務(wù)型工作(包括大數(shù)據(jù)、AI等 )的負(fù)載調(diào)度能力建設(shè)。
  2. 資源效能進(jìn)一步提升:面向混合云架構(gòu),我們將推進(jìn)更大規(guī)模的資源合池,推動(dòng) Quota 化資源交付。通過(guò)采用更先進(jìn)的彈性、混部、超賣等技術(shù)手段,進(jìn)一步提升集群資源利用率,實(shí)現(xiàn)資源成本的大幅度下降。
  3. 更高服務(wù)質(zhì)量保障能力:在更具挑戰(zhàn)性的 CPU 利用率目標(biāo)下,我們將建設(shè) QoS 感知調(diào)度能力、干擾檢測(cè)能力,并依托安全容器等技術(shù)手段,解決深水區(qū)混部中可能遇到的各類干擾問(wèn)題。

作者簡(jiǎn)介

桑鐸(宋澤輝):基礎(chǔ)技術(shù)部/云原生平臺(tái)

小紅書資源調(diào)度負(fù)責(zé)人,在容器資源調(diào)度、混部部署、資源隔離等方面有豐富的實(shí)踐經(jīng)驗(yàn),目前主要負(fù)責(zé)小紅書大規(guī)模容器資源調(diào)度、在離線混部等方向的技術(shù)研發(fā)工作。

黃瀨(索增增):基礎(chǔ)技術(shù)部/云原生平臺(tái)

小紅書資源調(diào)度資深研發(fā)工程師,主要負(fù)責(zé)資源調(diào)度、工作負(fù)載編排相關(guān)的研發(fā)工作。

灰仔(葉楊婕):基礎(chǔ)技術(shù)部/云原生平臺(tái)

小紅書資源調(diào)度研發(fā)工程師,主要負(fù)責(zé)在離線混部方向研發(fā)工作。

特別感謝:小紅書音視頻架構(gòu)組、數(shù)據(jù)引擎組、交易算法組所有業(yè)務(wù)方同學(xué)。

責(zé)任編輯:武曉燕 來(lái)源: 小紅書技術(shù)REDtech
相關(guān)推薦

2023-11-27 19:37:51

CPU云原生

2018-11-13 08:55:35

阿里規(guī)模化混部

2022-04-12 15:54:12

阿里云云原生開(kāi)源

2013-01-04 10:44:31

IBMdW

2023-04-04 09:22:50

LinuxCPU命令

2017-08-25 15:56:54

Linuxproc文件系統(tǒng)CPU利用率

2010-03-11 16:49:55

Linux CPU利用

2019-03-05 15:53:40

Linux服務(wù)器CPU

2013-04-02 09:15:40

服務(wù)器虛擬化

2020-12-01 11:09:14

2024-08-02 14:56:00

2025-05-28 01:40:00

GPUNVIDIAMPS

2024-10-14 13:01:33

AOTcpu符號(hào)

2011-03-17 15:16:38

2012-10-11 10:21:33

數(shù)據(jù)中心CPU利用率服務(wù)器效率

2019-08-28 06:58:06

Linux監(jiān)控腳本Shell

2012-11-07 15:07:30

VMware虛擬化

2011-04-12 09:07:47

磁盤空間利用率虛擬化的隱藏成本

2024-02-29 09:17:43

數(shù)據(jù)中心

2024-06-26 09:29:53

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

精品蜜桃传媒| 日韩免费观看高清| 大桥未久恸哭の女教师| 日本不卡1234视频| 国产精品私房写真福利视频| 91欧美日韩一区| 成年人视频在线免费看| 婷婷丁香综合| 亚洲免费影视第一页| 亚洲图片 自拍偷拍| 欧洲一区精品| 亚洲免费av高清| 热re99久久精品国产99热| 精品人妻无码一区二区| 日韩中文字幕区一区有砖一区| 久久伊人精品视频| 国产精品国产三级国产专业不| 国产精品亚洲四区在线观看| 色哟哟一区二区三区| 国产精品av免费观看| 国产一级免费在线观看| 成人免费毛片aaaaa**| 国产欧美欧洲在线观看| 欧美日韩综合一区二区三区| 欧美日韩国产精品一区二区亚洲| 国产一区二区三区久久精品| 性色av蜜臀av浪潮av老女人 | 精品视频99| 精品国产人成亚洲区| 亚洲欧美日韩三级| 色8久久影院午夜场| 午夜精品123| 菠萝蜜视频在线观看入口| 北岛玲一区二区三区| 91网站最新网址| 波多野结衣一区二区三区在线观看| 精品一区二区无码| 亚洲欧美不卡| 91精品国产91久久久| 久久久久久久久久99| 欧美在线视屏| 久热在线中文字幕色999舞| 2019男人天堂| 精品日韩毛片| 亚洲一二在线观看| 91精品人妻一区二区| 精品网站aaa| 亚洲国产99精品国自产| 国产原创剧情av| 亚洲福利合集| 精品国产污网站| 日韩成人av影院| 欧州一区二区三区| 日韩欧美国产小视频| 香蕉在线观看视频| 国产精品网址| 日韩成人在线视频| 亚洲精品视频久久久| 综合伊思人在钱三区| 亚洲人成在线播放| 欧美性猛交xxxx乱| 欧美a级成人淫片免费看| 日韩在线免费观看视频| 日韩精品久久久久久久的张开腿让| 日韩电影免费在线观看| 日韩视频在线观看免费| 51精品免费网站| 欧美二区不卡| 国内自拍欧美激情| 一级成人黄色片| 男人的天堂亚洲一区| 91精品久久久久久久久久| 国产又大又黄又爽| 成人免费的视频| 欧美不卡在线一区二区三区| 77777影视视频在线观看| 亚洲欧洲无码一区二区三区| 400部精品国偷自产在线观看| 一色桃子av在线| 天天色 色综合| 手机看片福利日韩| 国产美女精品视频免费播放软件 | 国产精品黄色av| 在线免费观看一级片| 国产黄人亚洲片| 蜜桃传媒一区二区| 精品176二区| 午夜精品久久久久久久99水蜜桃| 最近免费中文字幕中文高清百度| 欧美亚洲二区| 亚洲福利视频网| 黄色av片三级三级三级免费看| 亚洲国产一区二区三区在线播放| 91黑丝高跟在线| 国产精品欧美亚洲| 成人av免费在线观看| 日本在线成人一区二区| 国产激情视频在线观看| 色偷偷成人一区二区三区91| 中文字幕第三区| 亚洲最好看的视频| 九九久久综合网站| 黄色av网站免费观看| 国产麻豆精品视频| 欧美中文娱乐网| 男女在线视频| 538在线一区二区精品国产| bl动漫在线观看| 一区二区三区毛片免费| 国产成人av网| 天天操天天舔天天干| 中文字幕一区二区三区色视频 | 国产福利电影在线播放| 欧美人妖巨大在线| 精品无码人妻一区| 亚洲第一在线| 97碰碰视频| 在线毛片网站| 欧美日韩亚洲精品内裤| 中文字幕第六页| 久久视频在线| 日韩av片永久免费网站| 免费观看黄色一级视频| 亚洲欧洲国产日韩| 天天爽人人爽夜夜爽| 欧美大片网址| 国模精品一区二区三区色天香| 国产精品免费无遮挡| 国产精品欧美精品| 又色又爽又高潮免费视频国产| 国产欧美三级电影| 欧美日韩成人网| 国产免费av观看| 国产精品久久久久久久午夜片 | 日韩不卡一二区| 啪啪av大全导航福利综合导航| 亚洲香蕉成人av网站在线观看| 免费日韩一级片| 丁香啪啪综合成人亚洲小说 | 91ts人妖另类精品系列| 狂野欧美一区| 欧洲亚洲一区二区| 欧美free嫩15| 国产小视频国产精品| 亚洲天堂一区在线| 91麻豆swag| 看av免费毛片手机播放| 久久这里只有精品一区二区| 久久久久久久国产| 无码精品人妻一区二区| 精品久久久久久| 久久一区二区电影| 一本久道久久综合婷婷鲸鱼| 九九九九精品| 日本在线高清| 一区二区三欧美| 中文字幕+乱码+中文乱码www| 国产欧美一区视频| 九九热精品在线播放| 天天操综合网| www.久久爱.cn| 国产激情在线播放| 亚洲人成五月天| 中文字幕视频一区二区| 中文字幕日本不卡| 免费黄视频在线观看| 亚洲国产第一| 欧美资源一区| 国产亚洲亚洲国产一二区| 欧美黑人国产人伦爽爽爽| 好吊色一区二区| 日韩欧美综合在线视频| www久久久久久久| 国产高清不卡二三区| 久操网在线观看| 欧美精品色图| 成人毛片网站| 三级成人在线| 操日韩av在线电影| 五月激情丁香婷婷| 欧美在线999| 欧美黑人一级片| 91麻豆视频网站| 午夜一区二区视频| 亚洲经典自拍| 亚洲午夜精品久久| 精品中国亚洲| 成人av.网址在线网站| 黄色在线观看视频网站| 亚洲午夜av久久乱码| 精品黑人一区二区三区在线观看| 岛国av一区二区| 少妇高潮一区二区三区喷水| 暴力调教一区二区三区| 91欧美视频在线| 99成人免费视频| 亚洲一卡二卡三卡| 国产精品网址| 91青草视频久久| 日韩中文影院| 久久久欧美一区二区| 91在线导航| 日韩高清人体午夜| 国产夫绿帽单男3p精品视频| 色拍拍在线精品视频8848| 欧美日韩在线视频免费| 国产免费成人在线视频| 免费不卡的av| 国产精品一卡二卡| 亚欧美在线观看| 午夜影院日韩| 18黄暴禁片在线观看| 天天色天天射综合网| 日韩一本精品| 婷婷精品在线观看| 成人免费91在线看| 国产精品一区二区美女视频免费看| 日本久久精品视频| 9999热视频在线观看| 欧美巨大黑人极品精男| 在线免费观看黄色av| 亚洲欧洲视频在线| 天天操天天舔天天干| 欧美精品一区二区三区视频| 国产又粗又长又黄| 欧美日韩国产综合一区二区三区| 天堂中文在线网| 亚洲国产精品久久人人爱| 久久高清内射无套| 国产精品白丝在线| 欧美日韩国产黄色| 国产日韩欧美制服另类| 97伦伦午夜电影理伦片| 91婷婷韩国欧美一区二区| 亚洲啪av永久无码精品放毛片| 国产乱码精品一区二区三 | av在线播放不卡| 黑人玩弄人妻一区二区三区| 高清久久久久久| 亚洲熟妇一区二区| 国产sm精品调教视频网站| 久久精品亚洲天堂| 国产一区二区91| 亚洲欧美日韩网站| 国产乱码精品1区2区3区| 亚洲免费黄色网| 国产精品综合二区| 手机在线播放av| 国产成人aaa| 美女露出粉嫩尿囗让男人桶| 成人性生交大片免费看中文网站| 9.1在线观看免费| 91最新地址在线播放| 97人妻精品一区二区三区免| 99精品桃花视频在线观看| 亚洲黄色在线网站| 国产亚洲va综合人人澡精品| 亚洲欧洲久久久| 国产精品美女视频| 紧身裙女教师波多野结衣| 亚洲欧美日韩国产中文在线| 久草网站在线观看| 五月激情六月综合| 福利网址在线观看| 欧美日韩视频一区二区| 国产美女精品视频国产| 精品国精品国产| 日本国产在线| 日韩亚洲欧美中文在线| 中文字幕在线播放网址| 高清欧美性猛交| 另类激情视频| 91免费精品视频| 国产精品nxnn| 神马影院一区二区| 欧美96在线丨欧| 91成人在线观看喷潮教学| 日韩av中文字幕一区二区| 伊人色在线视频| 91丨九色丨蝌蚪富婆spa| 色婷婷国产精品免| 一区二区激情小说| 337p粉嫩色噜噜噜大肥臀| 91精品久久久久久久91蜜桃| www日本视频| 国产亚洲xxx| 特级毛片在线| 国产精品成人免费视频| 网站一区二区| 日韩国产欧美一区| 欧美三区美女| 三级a在线观看| caoporm超碰国产精品| 后入内射无码人妻一区| 五月婷婷另类国产| 97人妻人人澡人人爽人人精品| 亚洲精品一区二区三区香蕉| 成a人片在线观看www视频| 久久久中精品2020中文| 久久久久久久性潮| 好看的日韩精品| 中文字幕日韩一区二区不卡| 无码aⅴ精品一区二区三区浪潮 | chinese全程对白| 欧美日韩免费一区| a视频免费在线观看| 中文字幕av一区二区三区谷原希美| 激情图片在线观看高清国产| 国产精品一区二区女厕厕| 啪啪国产精品| av动漫在线播放| 蜜乳av一区二区三区| 免费在线观看成年人视频| 一区二区三区四区乱视频| 97人妻精品视频一区| 日韩av最新在线| 怡红院av在线| 1卡2卡3卡精品视频| 波多野结衣一区| 亚洲人成无码www久久久| 99久免费精品视频在线观看| 久久av高潮av无码av喷吹| 欧美人伦禁忌dvd放荡欲情| 成人性生交大片免费看午夜| 97免费中文视频在线观看| 亚洲精品在线国产| 中国一级大黄大黄大色毛片| 久久99日本精品| 91精品国自产在线| 91成人免费在线| 国产黄色免费在线观看| 国产aⅴ夜夜欢一区二区三区| 日韩av午夜| 国产免费黄视频| ww亚洲ww在线观看国产| 免费在线不卡视频| 亚洲国内精品视频| 福利影院在线看| 国产一区视频观看| 99精品视频免费观看| 亚洲一区二区乱码| 欧美午夜激情在线| 日韩av成人| 国产精品成人一区| 欧美美女视频| 波多结衣在线观看| 中日韩av电影| 国产又大又黄的视频| 插插插亚洲综合网| 中文一区二区三区四区| 97中文字幕在线| 成人av免费在线观看| 日韩精品一区二区三区国语自制| 日韩精品久久久久久久玫瑰园| 蜜桃av在线播放| 欧美高清视频一区| 日韩成人免费在线| 26uuu成人网| 精品黑人一区二区三区久久 | 免费黄网在线观看| 亚洲va欧美va国产综合久久| 中文字幕av亚洲精品一部二部| 免费观看黄网站| 亚洲国产婷婷综合在线精品| 好吊视频一区二区三区| 欧美在线亚洲在线| 欧美手机视频| 毛片毛片毛片毛片毛| 亚洲一区在线免费观看| 天堂8在线视频| 国产精品福利片| 亚洲国产精品成人| 麻豆精品国产传媒av| 色猫猫国产区一区二在线视频| 在线日本视频| 国产精品一码二码三码在线| 久久精品免费| 糖心vlog免费在线观看| 亚洲成色999久久网站| 成人黄色毛片| 日韩久久久久久久久久久久| 久久综合av免费| 91九色蝌蚪91por成人| 久久久久久久999| 日韩成人免费| 免费黄色三级网站| 欧美日韩亚洲综合一区| 波多野结衣在线播放| 日韩hmxxxx| 成人三级伦理片| 在线黄色av网站| 亚洲91精品在线观看| 色狮一区二区三区四区视频| 欧美xxxxx少妇| 欧美日韩精品一区视频| 国产网站在线| 天堂av免费看| 国产亚洲一区二区在线观看| www.色婷婷.com| 国产精品人成电影|