精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

集群 CPU 利用率均值達(dá) 45% ,揭秘小紅書(shū)規(guī)模化混部技術(shù)實(shí)踐

云計(jì)算 云原生
為了幫助業(yè)務(wù)降低資源使用成本,小紅書(shū)容器團(tuán)隊(duì)從 2022 年開(kāi)始規(guī)模化落地混部技術(shù),提升集群 CPU 利用率。截止目前,混部集群 CPU 利用率均值可達(dá) 45% 以上,為業(yè)務(wù)提供數(shù)百萬(wàn)核時(shí)的算力成本優(yōu)化。

根據(jù) Gartner 預(yù)測(cè)數(shù)據(jù)顯示:2024 年全球 IT 支出預(yù)計(jì)將達(dá)到 5.1 萬(wàn)億美元,比 2023 年增長(zhǎng) 8 %。然而,該機(jī)構(gòu)的另一項(xiàng)調(diào)查數(shù)據(jù)顯示:全球數(shù)據(jù)中心服務(wù)器平均 CPU 利用率普遍低于 20%,存在巨大的資源浪費(fèi)。據(jù)測(cè)算,以數(shù)百萬(wàn)核 CPU 規(guī)模的數(shù)據(jù)中心為例,每提升 1 個(gè)百分點(diǎn)的整體資源利用率,每年將節(jié)省數(shù)千萬(wàn)元的成本。由此可見(jiàn),提高資源利用率對(duì)于降低企業(yè)運(yùn)營(yíng)成本具有顯著的效果。

早在 2015 年,谷歌就在其經(jīng)典論文《Large-scale cluster management at Google with Borg》中披露了它在資源管理和調(diào)度方面的實(shí)踐經(jīng)驗(yàn),是最早通過(guò)混部技術(shù)來(lái)提升資源利用率的公司之一。國(guó)內(nèi)多家頭部互聯(lián)網(wǎng)企業(yè)也相繼實(shí)施類(lèi)似的技術(shù)方案,并取得可觀的資源利用率提升效果。

隨著小紅書(shū)業(yè)務(wù)的高速發(fā)展,各類(lèi)在線、離線業(yè)務(wù)對(duì)計(jì)算資源的需求日益增長(zhǎng)。與此同時(shí),我們觀察到:部分在線集群天均利用率的水位卻維持在較低的水平。造成這一現(xiàn)象的主要原因有以下幾點(diǎn):

  • 在線服務(wù)資源使用量隨著終端用戶的使用習(xí)慣呈現(xiàn)穩(wěn)定的潮汐現(xiàn)象,夜間 CPU 利用率極低,從而導(dǎo)致整個(gè)集群的均值 CPU 利用率降低。
  • 業(yè)務(wù)保有大量的獨(dú)占資源池,資源池割裂產(chǎn)生大量的資源碎片,進(jìn)而降低 CPU 的利用率。
  • 出于穩(wěn)定性考慮,業(yè)務(wù)傾向于過(guò)量?jī)?chǔ)備資源,進(jìn)一步降低 CPU 的利用率。

基于以上背景,為了幫助業(yè)務(wù)降低資源使用成本,小紅書(shū)容器團(tuán)隊(duì)從 2022 年開(kāi)始規(guī)模化落地混部技術(shù),提升集群 CPU 利用率。截止目前,混部集群 CPU 利用率均值可達(dá) 45% 以上,為業(yè)務(wù)提供數(shù)百萬(wàn)核時(shí)的算力成本優(yōu)化。

1、技術(shù)演進(jìn)

小紅書(shū)混部技術(shù)演進(jìn)分為以下四個(gè)階段(如圖所示):

階段一:閑置資源再利用

在早期,小紅書(shū)的集群資源管理相對(duì)粗放,集群中存在大量業(yè)務(wù)獨(dú)占的資源池。由于資源碎片化等因素,各個(gè)集群中存在許多低分配率的低效節(jié)點(diǎn),導(dǎo)致大量資源浪費(fèi)。同時(shí),基于 Kubernetes(K8s)發(fā)布的轉(zhuǎn)碼類(lèi)近線/離線場(chǎng)景,在全天時(shí)段均存在大量計(jì)算資源需求。基于以上背景,小紅書(shū)容器平臺(tái)通過(guò)技術(shù)手段將集群中的閑置資源進(jìn)行收集,并將其分配給轉(zhuǎn)碼類(lèi)業(yè)務(wù)場(chǎng)景使用。

整體架構(gòu)上,離線業(yè)務(wù)發(fā)布入口統(tǒng)一收斂在在一個(gè)集群,我們稱(chēng)之為元數(shù)據(jù)集群,目的是為業(yè)務(wù)屏蔽底層多物理 K8s 集群。通過(guò) Virtual-Kubelet 連接元數(shù)據(jù)集群與物理集群,將閑置資源匯聚到元數(shù)據(jù)集群,在元數(shù)據(jù)集群中調(diào)度分發(fā)轉(zhuǎn)碼類(lèi)任務(wù)到底層物理集群。

策略方面,二次調(diào)度器負(fù)責(zé)巡檢集群中的所有節(jié)點(diǎn),識(shí)別出低效節(jié)點(diǎn)并進(jìn)行標(biāo)記;隨后 Virtual-Kubelet 獲取物理集群中的低效節(jié)點(diǎn)可用資源作為集群閑置資源,再次分配給離線轉(zhuǎn)碼場(chǎng)景。同時(shí),二次調(diào)度器確保一旦在線服務(wù)有資源需求,將會(huì)立刻驅(qū)逐離線 Pod 并歸還資源。通過(guò)此舉,我們能夠提高集群資源的利用效率,減少資源浪費(fèi),并滿足轉(zhuǎn)碼類(lèi)場(chǎng)景對(duì)計(jì)算資源的需求。

階段二:整機(jī)騰挪分時(shí)復(fù)用

搜推廣等業(yè)務(wù)的獨(dú)占資源池,存在明顯的 CPU 利用率潮汐現(xiàn)象,尤其夜間利用率極低。通常情況下,資源池中的單個(gè)節(jié)點(diǎn)往往也只部署一個(gè)大規(guī)格業(yè)務(wù) Pod。基于這種情況,平臺(tái)通過(guò)彈性能力(HPA),在凌晨業(yè)務(wù)低峰期按比例對(duì)在線業(yè)務(wù)進(jìn)行縮容,釋放出整機(jī)資源,并將轉(zhuǎn)碼、訓(xùn)練等離線 Pod 在該時(shí)段運(yùn)行起來(lái),實(shí)現(xiàn)資源優(yōu)化,起到利用率“填谷”的效果。

在具體實(shí)施過(guò)程中,我們需要確保在線服務(wù)能夠在規(guī)定的時(shí)間內(nèi)全部被拉起。為此,我們采取以下策略:實(shí)現(xiàn)離線服務(wù)的提前退場(chǎng),并通過(guò)調(diào)度器的搶占機(jī)制進(jìn)行兜底,確保在線服務(wù)在業(yè)務(wù)高峰期來(lái)臨之前能被全量且及時(shí)地重新啟動(dòng)。

這一階段能最大限度地利用資源,使得離線服務(wù)在低峰期得到有效運(yùn)行,同時(shí)保證在線服務(wù)在業(yè)務(wù)高峰期能夠快速恢復(fù)運(yùn)行。

階段三:常態(tài)混部

為了降低資源碎片率和業(yè)務(wù)資源持有成本,平臺(tái)持續(xù)推進(jìn)業(yè)務(wù)的大規(guī)模合池,將業(yè)務(wù)從獨(dú)占資源池遷移到平臺(tái)托管的公共混部池。通過(guò)合池、資源超賣(mài)等技術(shù)手段,我們有效提升了 CPU 分配率,但依舊無(wú)法解決合并后的資源池夜間利用率較低等問(wèn)題。另外,在合池后的復(fù)雜混部場(chǎng)景下,整機(jī)騰挪、分時(shí)混部離線的調(diào)度策略很難再繼續(xù)實(shí)施。平臺(tái)需要建設(shè)更為細(xì)粒度的資源管理與調(diào)度能力,來(lái)實(shí)現(xiàn)均值利用率提升的目標(biāo),具體包含以下幾點(diǎn):

1. 調(diào)度側(cè)

  • 通過(guò)動(dòng)態(tài)超賣(mài)技術(shù)獲取可用于二次分配給離線服務(wù)的可用資源量,并抽象出離線資源視圖,使得 K8s 調(diào)度器感知到這些離線資源。調(diào)度器調(diào)度離線負(fù)載到對(duì)應(yīng)節(jié)點(diǎn)上,實(shí)現(xiàn)離線服務(wù)對(duì)節(jié)點(diǎn)利用率的“填谷”效果。
  • 通過(guò)負(fù)載調(diào)度,盡可能避免在線服務(wù)被調(diào)度到高負(fù)載機(jī)器上,讓集群中節(jié)點(diǎn)負(fù)載更加均衡。
  • 通過(guò)二次調(diào)度,驅(qū)逐負(fù)載熱點(diǎn)機(jī)器上的高利用率服務(wù),使得集群負(fù)載保持動(dòng)態(tài)均衡狀態(tài)。

2. 單機(jī)側(cè)

  • 支持 QoS(Quality of Service)保障策略,根據(jù)服務(wù)的 QoS 等級(jí)提供差異化的運(yùn)行時(shí)資源保障能力。
  • 支持干擾檢測(cè)、離線驅(qū)逐等能力,當(dāng)離線服務(wù)對(duì)在線敏感服務(wù)產(chǎn)生干擾時(shí),第一時(shí)間驅(qū)逐離線服務(wù)。
  • 通過(guò)以上技術(shù)手段,我們能夠有效地保障服務(wù)混合部署時(shí)的穩(wěn)定性,從而實(shí)現(xiàn)在線和離線工作負(fù)載在節(jié)點(diǎn)上的常態(tài)混合運(yùn)行,實(shí)現(xiàn)利用率“填谷”效果的最大化。

階段四:統(tǒng)一調(diào)度

隨著常態(tài)混部和大規(guī)模資源合池的持續(xù)推進(jìn),小紅書(shū)云原生資源調(diào)度將會(huì)面臨以下挑戰(zhàn):

1. 各類(lèi)業(yè)務(wù)場(chǎng)景對(duì)資源調(diào)度存在復(fù)雜且各異的功能和性能需求

  • 大數(shù)據(jù)、AI 場(chǎng)景下:排隊(duì)調(diào)度、批量調(diào)度(All-or-Nothing)、高吞吐量調(diào)度等需求。
  • 在線敏感服務(wù)場(chǎng)景下:資源調(diào)度成功率保障性需求、服務(wù)運(yùn)行時(shí)質(zhì)量保障性需求。

2. GPU 等異構(gòu)資源調(diào)度需求

  • 支持 GPU 共享調(diào)度、bin packing等調(diào)度能力,以提升 GPU 利用率及 GPU 機(jī)器上的 CPU 利用率。
  • 支持 GPU 拓?fù)涓兄⒂H和性調(diào)度等調(diào)度能力,通過(guò)優(yōu)化 GPU 間的通信效率,大幅提升大規(guī)模訓(xùn)練效率。

基于以上背景,我們提出面向混合云架構(gòu)的統(tǒng)一調(diào)度方案。該方案基于統(tǒng)一資源池,通過(guò)統(tǒng)一調(diào)度能力來(lái)管理異構(gòu)計(jì)算資源,并支持各類(lèi)業(yè)務(wù)形態(tài)的工作負(fù)載調(diào)度能力。通過(guò)站在全局視角,將工作負(fù)載調(diào)度到最合適的節(jié)點(diǎn),讓業(yè)務(wù)跑得更快更穩(wěn)定,并降低全局資源使用成本。涉及到的關(guān)鍵技術(shù)點(diǎn)如下:

1. 在離線統(tǒng)一調(diào)度

提供以 K8s 為底座的統(tǒng)一調(diào)度能力,支持包含在線敏感型服務(wù)、大數(shù)據(jù)/ AI 任務(wù)型工作負(fù)載在內(nèi)的統(tǒng)一資源調(diào)度。

2. QoS 感知調(diào)度

基于服務(wù)畫(huà)像,結(jié)合系統(tǒng)指標(biāo)識(shí)別干擾源,并刻畫(huà)節(jié)點(diǎn)資源質(zhì)量。通過(guò)綜合調(diào)度、重調(diào)度和單機(jī)調(diào)度等不同維度的調(diào)度能力,降低業(yè)務(wù)間混部造成的干擾,從而提升在線服務(wù)的運(yùn)行質(zhì)量。

3. GPU 調(diào)度

支持 GPU Share、bin packing、多 GPU 卡之間的親和性調(diào)度等調(diào)度能力,以提高 GPU 資源的利用效率。

4. 資源售賣(mài)模型

根據(jù)資源質(zhì)量、資源供應(yīng)形態(tài)(如常態(tài)化供應(yīng)資源、分時(shí)潮汐資源、Spot 資源)和資源套餐規(guī)格等多個(gè)維度,定義差異化資源售賣(mài)模型,降低資源綜合使用成本。

5. 資源配額

支持資源配額管理能力,包括分時(shí)配額、彈性配額和層級(jí)結(jié)構(gòu)管理等功能,避免多租戶之間的資源爭(zhēng)搶?zhuān)嵘Y源使用效率。

2、架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)

小紅書(shū)容器統(tǒng)一資源調(diào)度系統(tǒng) Tusker (The Unified Scheduling system base on Kubernetes for Efficiency and Reliability) 架構(gòu)設(shè)計(jì)如圖所示:

小紅書(shū)的各類(lèi)業(yè)務(wù)場(chǎng)景通過(guò)多個(gè)發(fā)布平臺(tái)和任務(wù)平臺(tái)提交,并通過(guò)上層負(fù)載編排能力,以 Pod 形式下發(fā)到統(tǒng)一調(diào)度系統(tǒng)。統(tǒng)一調(diào)度系統(tǒng)基于不同的調(diào)度需求,為在線服務(wù)提供強(qiáng)保障的資源交付能力、差異化的 QoS 保障能力,同時(shí)為離線服務(wù)提供最小資源需求的保障能力和極致的彈性能力。

在調(diào)度側(cè),離線調(diào)度采用 Coscheduling 技術(shù);二次調(diào)度處理資源熱點(diǎn)問(wèn)題,包括熱點(diǎn)驅(qū)逐和碎片整理;負(fù)載調(diào)度基于 CPU 水位進(jìn)行調(diào)度,以實(shí)現(xiàn)更好地資源利用;資源視圖用于資源走查和模擬調(diào)度。

在單機(jī)側(cè),通過(guò)壓制策略如 BVT(Borrowed Virtual Time)進(jìn)行性能控制和資源限制,并進(jìn)行內(nèi)存驅(qū)逐操作;QoS 保障方面,采用綁核和超線程干擾抑制等技術(shù)來(lái)實(shí)現(xiàn)資源的差異化保障;計(jì)算和上報(bào)可用的 Batch 資源信息;來(lái)自 Kernel 的指標(biāo)采集包括 PSI(Pressure Stall Information)、調(diào)度信息等;干擾檢測(cè)基于 CPI(Cycles Per lnstruction)、PSI(Pressure Stall Information)和業(yè)務(wù)指標(biāo)等,用于檢測(cè)和處理干擾情況。

2.1 離線調(diào)度資源視圖

離線服務(wù)資源調(diào)度的基本原理是基于在線服務(wù)負(fù)載感知能力的動(dòng)態(tài)超賣(mài),具體實(shí)現(xiàn)是將節(jié)點(diǎn)空閑資源二次分配給離線業(yè)務(wù):

其中離線可用資源為節(jié)點(diǎn)上的空閑資源(包含未分配資源和已分配未使用資源之和),扣除安全預(yù)留資源之后的剩余資源,離線可用資源計(jì)算公式如下:

離線可用資源 = 整機(jī)資源 – 預(yù)留資源 – 在線服務(wù)實(shí)際使用量

將計(jì)算出的離線可用資源量按照時(shí)間分布后如圖所示(圖中綠色部分):

實(shí)際落地過(guò)程中,為了避免離線可用資源隨在線服務(wù)資源使用波動(dòng)而大幅波動(dòng),從而影響離線資源質(zhì)量和離線服務(wù)運(yùn)行穩(wěn)定性,可以通過(guò)資源畫(huà)像對(duì)上述公式中的在線服務(wù)實(shí)際使用量數(shù)據(jù)進(jìn)一步處理,去除數(shù)據(jù)噪點(diǎn),最終計(jì)算出一個(gè)相對(duì)穩(wěn)定的離線可用資源量(圖中綠色部分),如圖所示:

2.2 混部 QoS 保障策略

2.2.1 QoS 分級(jí)

按照業(yè)務(wù)對(duì)于服務(wù)質(zhì)量(QoS: Quality of Service)的需求,小紅書(shū)的業(yè)務(wù)類(lèi)型可以簡(jiǎn)單劃分為三個(gè) QoS 級(jí)別,如下表所示:





QoS 等級(jí)






說(shuō)明





業(yè)務(wù)場(chǎng)景





Latency-Sensitive






最高 QoS 保障等級(jí),延遲極為敏感服務(wù)






搜推廣延遲極為敏感場(chǎng)景





Mid






默認(rèn) QoS 保障等級(jí),容忍部分干擾延遲






網(wǎng)關(guān)、Java 微服務(wù)





Batch






最低 QoS 保障等級(jí),延遲不敏感,資源隨時(shí)可能被搶






轉(zhuǎn)碼、Spark、Flink、訓(xùn)練等計(jì)算場(chǎng)景



2.2.2 QoS 保障

根據(jù)服務(wù)的 QoS 需求,節(jié)點(diǎn)側(cè)可以采取 Pod 粒度的分級(jí)資源保障,以實(shí)現(xiàn)不同資源維度的差異化 QoS 保障策略,具體的保障參數(shù)如下:





資源






特性





Latency-Sensitive





Mid





Batch





CPU






CPU Burst






enable





enable





disable






調(diào)度優(yōu)先級(jí)






最高





默認(rèn)









綁核






share

(默認(rèn))






share(默認(rèn))





reclaimed





NUMA






強(qiáng)保證






prefer(默認(rèn))





none





L3 Cache





100%






100%(默認(rèn))






30%

(默認(rèn))





內(nèi)存帶寬





100%






100%(默認(rèn))






30%

(默認(rèn))





內(nèi)存






OOM 優(yōu)先級(jí)






最低





默認(rèn)





最高






內(nèi)存回收水線






調(diào)高





默認(rèn)





調(diào)低



在 CPU 核編排層面,我們針對(duì)不同的需求場(chǎng)景,設(shè)置了三種不同的綁核類(lèi)型,并設(shè)計(jì)了一套精細(xì)化 CPU 核編排策略,分配示意圖如下:

三種綁核類(lèi)型分別為:

Exclusive

特點(diǎn):綁定 cpuset 調(diào)度域、CCD 感知、NUMA 綁定、獨(dú)占排他

場(chǎng)景:適用于對(duì)延遲極為敏感的搜推廣大規(guī)格服務(wù)

Share(推薦)

特點(diǎn):綁定 cpuset 調(diào)度域、CCD 感知、NUMA(可選)綁定、Share/Exlusive 排他、可與 None 類(lèi)型業(yè)務(wù)共享

場(chǎng)景:適用于容忍部分干擾的 Java 微服務(wù)、應(yīng)用網(wǎng)關(guān)、Web服務(wù)等

Reclaimed

特點(diǎn):無(wú) cpuset 綁定、可能與非 exlusive 綁核模式的業(yè)務(wù)共享核,核的分配完全由內(nèi)核控制,CPU 資源并非百分之百能夠滿足需求

場(chǎng)景:適用于 Batch 類(lèi)離線服務(wù),部分對(duì)延遲無(wú)要求的計(jì)算服務(wù)

2.2.3 離線驅(qū)逐

在極端場(chǎng)景下,如整機(jī)內(nèi)存使用率較高、有觸發(fā) OOM 風(fēng)險(xiǎn),或者離線業(yè)務(wù) CPU 長(zhǎng)期得不到滿足時(shí),可以采取離線驅(qū)逐策略。單機(jī)側(cè)支持按照離線服務(wù)內(nèi)部定義的優(yōu)先級(jí)配置、資源用量和運(yùn)行時(shí)長(zhǎng)等多維度綜合算分排序后,按序驅(qū)逐離線服務(wù),以達(dá)到最優(yōu)的資源利用效果。

2.3 離線業(yè)務(wù)場(chǎng)景舉例

小紅書(shū)作為一個(gè)擁有數(shù)億用戶的內(nèi)容社區(qū),其離線業(yè)務(wù)場(chǎng)景豐富多樣,其中包含大量視頻類(lèi)和圖片類(lèi)轉(zhuǎn)碼場(chǎng)景、搜推、CV/NLP 算法推理訓(xùn)練、算法特征生產(chǎn)以及數(shù)倉(cāng)查詢等離線場(chǎng)景。具體而言,包含以下業(yè)務(wù)類(lèi)型:

  • 近離線轉(zhuǎn)碼場(chǎng)景(已容器化)
  • Flink 流式/批式計(jì)算(已容器化)
  • Spark 批式計(jì)算 (未容器化、On YARN)
  • CV/NLP 算法回掃場(chǎng)景(已容器化)
  • 訓(xùn)練場(chǎng)景 (已容器化)

通過(guò)基于 K8s 的在離線統(tǒng)一調(diào)度能力,將這些離線業(yè)務(wù)與在線服務(wù)混合部署在統(tǒng)一資源池中。不僅能為在線服務(wù)提供差異化的資源質(zhì)量保障,亦能為離線服務(wù)提供海量的低成本算力,以實(shí)現(xiàn)資源效能的提升。

2.3.1 K8s 與 YARN 混部方案

在小紅書(shū)商業(yè)化、社區(qū)搜索等業(yè)務(wù)中存在大量的算法類(lèi) Spark 任務(wù),由于離線集群資源緊張,任務(wù)無(wú)法及時(shí)處理,導(dǎo)致任務(wù)堆積。同時(shí),在線集群在業(yè)務(wù)低峰時(shí)段資源使用率較低。另外,相當(dāng)大比例的 Spark 任務(wù)資源調(diào)度仍運(yùn)行在 YARN 調(diào)度器上。基于此背景,為了快速降低業(yè)務(wù)遷移成本,在方案選型方面,我們選擇與 Kooridinator 社區(qū)合作,采用 YARN on K8s 混部方案來(lái)快速落地 Spark 離線場(chǎng)景混部,具體方案如圖所示:

在線和離線工作負(fù)載在容器化環(huán)境下通過(guò) K8s 鏈路發(fā)布到在線集群內(nèi)。Spark 作業(yè)通過(guò) YARN ResourceManager 調(diào)度到具體節(jié)點(diǎn),并由節(jié)點(diǎn)上的 NodeManager 組件拉起。NodeManager 以容器的形式部署在在線 K8s 集群中,實(shí)現(xiàn)資源的有效管理。除此之外,還涉及到以下組件:

1. 調(diào)度側(cè)

Koord-Yarn-Operator:支持 K8s 與 YARN 調(diào)度器資源視圖的雙向同步,確保資源信息的共享和一致性。

2. 節(jié)點(diǎn)側(cè)

Copilot:作為 NodeManager 的操作代理,提供 YARN Task 的管控接口。

Tusker-agent/koordlet:負(fù)責(zé)離線資源的上報(bào)、節(jié)點(diǎn)上離線 Pod/Task 管理,并處理沖突解決、驅(qū)逐、壓制策略等功能。

多調(diào)度器資源同步

K8s 調(diào)度器與 YARN 調(diào)度器之間原本獨(dú)立且相互不感知,為了共享分配節(jié)點(diǎn)上的總可用離線資源,需要通過(guò) Koord-Yarn-Operator 組件來(lái)做兩個(gè)調(diào)度器之間的資源雙向同步和協(xié)調(diào),并實(shí)現(xiàn)兩個(gè)同步鏈路:

1. K8s ->YARN 調(diào)度器資源同步鏈路,負(fù)責(zé)同步 YARN 視角離線資源總量,其中 YARN 離線資源總量計(jì)算如下:

YARN離線資源總量 = 離線總可用量 – K8s 側(cè)節(jié)點(diǎn)已分配

2. YARN->K8s 調(diào)度器資源同步鏈路,負(fù)責(zé)同步已分配的 YARN 資源量,其中 K8s 離線資源總量計(jì)算如下:

K8s 離線資源總量 = 離線總可用量 – YARN 側(cè)節(jié)點(diǎn)已分配

基于各自節(jié)點(diǎn)離線資源視圖,兩個(gè)調(diào)度器分別作出調(diào)度決策,將離線 Pod 與 YARN Task 調(diào)度到適當(dāng)?shù)墓?jié)點(diǎn)上。由于同步過(guò)程不適合加鎖,可能會(huì)出現(xiàn)資源被過(guò)量分配的問(wèn)題:

具體解決措施是在單機(jī)側(cè)增加了仲裁邏輯。當(dāng)節(jié)點(diǎn)已分配的離線服務(wù)資源量長(zhǎng)期超過(guò)節(jié)點(diǎn)可用離線資源,且離線使用率持續(xù)較高時(shí),存在離線服務(wù)無(wú)法獲得資源而被餓死的風(fēng)險(xiǎn)。單機(jī)側(cè)會(huì)根據(jù)離線服務(wù)的優(yōu)先級(jí)、資源占用量和運(yùn)行時(shí)長(zhǎng)等因素綜合算分,并按序驅(qū)逐。

3、落地收益

截止目前,小紅書(shū)混部能力覆蓋數(shù)十萬(wàn)臺(tái)機(jī)器規(guī)模,覆蓋算力規(guī)模數(shù)百萬(wàn)核,支持?jǐn)?shù)萬(wàn)規(guī)模在線、離線場(chǎng)景服務(wù)的資源調(diào)度。通過(guò)大規(guī)模容器混部的持續(xù)推進(jìn),小紅書(shū)在資源成本效能等方面都取得了顯著收益,具體包含以下兩方面:

CPU 利用率

  • 在保證在線服務(wù)服務(wù)質(zhì)量的前提下,在線混部集群天均 CPU 利用率提升至 45% 以上,部分集群天均 CPU 利用率可穩(wěn)定提升至 55%。
  • 通過(guò)在離線混部等技術(shù)手段,在線集群 CPU 利用率提升 8%-15% 不等,部分存儲(chǔ)集群利用率提升可達(dá) 20% 以上。

資源成本

  • 在保證離線業(yè)務(wù)穩(wěn)定性的前提下,為小紅書(shū)各類(lèi)離線場(chǎng)景提供數(shù)百萬(wàn)核時(shí)的低成本算力。
  • 混部集群 CPU 分配率提升至 125% 以上,相較于獨(dú)占資源池,資源碎片率明顯下降。

4、總結(jié)與展望

在小紅書(shū)近一年多的混部技術(shù)探索中,我們?cè)谫Y源效能提升方面積累了較為豐富的落地經(jīng)驗(yàn),并取得了不錯(cuò)的收益。隨著公司業(yè)務(wù)規(guī)模逐步增長(zhǎng),場(chǎng)景愈發(fā)復(fù)雜,我們將會(huì)面臨諸多新的技術(shù)挑戰(zhàn)。展望未來(lái),我們的目標(biāo)是建設(shè)面向混合云架構(gòu)的統(tǒng)一資源調(diào)度能力,具體工作將圍繞以下三方面展開(kāi):

  1. 混合工作負(fù)載調(diào)度能力支持:為了滿足小紅書(shū)所有業(yè)務(wù)場(chǎng)景的資源調(diào)度功能、性能需求,重點(diǎn)發(fā)展任務(wù)型工作(包括大數(shù)據(jù)、AI等 )的負(fù)載調(diào)度能力建設(shè)。
  2. 資源效能進(jìn)一步提升:面向混合云架構(gòu),我們將推進(jìn)更大規(guī)模的資源合池,推動(dòng) Quota 化資源交付。通過(guò)采用更先進(jìn)的彈性、混部、超賣(mài)等技術(shù)手段,進(jìn)一步提升集群資源利用率,實(shí)現(xiàn)資源成本的大幅度下降。
  3. 更高服務(wù)質(zhì)量保障能力:在更具挑戰(zhàn)性的 CPU 利用率目標(biāo)下,我們將建設(shè) QoS 感知調(diào)度能力、干擾檢測(cè)能力,并依托安全容器等技術(shù)手段,解決深水區(qū)混部中可能遇到的各類(lèi)干擾問(wèn)題。

5、作者簡(jiǎn)介

桑鐸(宋澤輝):基礎(chǔ)技術(shù)部/云原生平臺(tái)

小紅書(shū)資源調(diào)度負(fù)責(zé)人,在容器資源調(diào)度、混部部署、資源隔離等方面有豐富的實(shí)踐經(jīng)驗(yàn),目前主要負(fù)責(zé)小紅書(shū)大規(guī)模容器資源調(diào)度、在離線混部等方向的技術(shù)研發(fā)工作。

黃瀨(索增增):基礎(chǔ)技術(shù)部/云原生平臺(tái)

小紅書(shū)資源調(diào)度資深研發(fā)工程師,主要負(fù)責(zé)資源調(diào)度、工作負(fù)載編排相關(guān)的研發(fā)工作。

灰仔(葉楊婕):基礎(chǔ)技術(shù)部/云原生平臺(tái)

小紅書(shū)資源調(diào)度研發(fā)工程師,主要負(fù)責(zé)在離線混部方向研發(fā)工作。

特別感謝:小紅書(shū)音視頻架構(gòu)組、數(shù)據(jù)引擎組、交易算法組所有業(yè)務(wù)方同學(xué)。

責(zé)任編輯:龐桂玉 來(lái)源: 小紅書(shū)技術(shù)REDtech
相關(guān)推薦

2024-01-03 07:47:18

CPU規(guī)模化技術(shù)

2018-11-13 08:55:35

阿里規(guī)模化混部

2022-04-12 15:54:12

阿里云云原生開(kāi)源

2023-04-04 09:22:50

LinuxCPU命令

2017-08-25 15:56:54

Linuxproc文件系統(tǒng)CPU利用率

2013-01-04 10:44:31

IBMdW

2010-03-11 16:49:55

Linux CPU利用

2019-03-05 15:53:40

Linux服務(wù)器CPU

2013-04-02 09:15:40

服務(wù)器虛擬化

2024-10-14 13:01:33

AOTcpu符號(hào)

2011-03-17 15:16:38

2019-08-28 06:58:06

Linux監(jiān)控腳本Shell

2012-10-11 10:21:33

數(shù)據(jù)中心CPU利用率服務(wù)器效率

2025-05-28 01:40:00

GPUNVIDIAMPS

2024-08-02 14:56:00

2020-12-01 11:09:14

2011-04-12 09:07:47

磁盤(pán)空間利用率虛擬化的隱藏成本

2012-11-07 15:07:30

VMware虛擬化

2024-06-26 09:29:53

2025-04-17 06:00:00

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

亚洲成人网在线播放| 缅甸午夜性猛交xxxx| 国产女人高潮时对白| 国产精品jizz在线观看美国| 亚洲精品成人网| 北条麻妃在线视频| 久草免费在线| 99这里只有精品| 国产精品爽爽爽| 国产一级aa大片毛片| 亚洲人成网77777色在线播放 | 亚洲人久久久| 丰满肉嫩西川结衣av| 日韩高清一区二区| 欧美激情一区二区三区久久久| 一区二区三区四区免费| 日韩亚洲精品在线观看| 欧美三级三级三级| 国产69精品久久久久久久| 2019中文字幕在线视频| 成人sese在线| 亚洲在线视频福利| 国产成人麻豆免费观看| 亚洲国内精品| 蜜臀久久99精品久久久久久宅男 | 久久精品国产91精品亚洲| 国产91精品久| wwwav国产| 欧美亚洲高清| 亚洲欧美综合图区| 美女黄色一级视频| 欧美一级片网址| 欧美性欧美巨大黑白大战| 3d动漫一区二区三区| 激情影院在线观看| 国产精品毛片久久久久久久| 欧美凹凸一区二区三区视频| 黄色片一区二区| 国产福利91精品一区二区三区| 国产精品一区二区三区成人| 日韩欧美在线观看免费| 中文一区在线| 国内免费久久久久久久久久久| 国产天堂av在线| 久久精品国产99久久| 亚洲天堂一区二区三区| 美国黄色a级片| 免费看成人人体视频| 日韩美女天天操| 99国产精品免费视频| 亚洲综合伊人| 欧美一卡在线观看| 中文字幕55页| 日韩精品一区二区三区中文| 日韩欧美资源站| 国产精久久久久| 91精品短视频| 亚洲第一男人av| 中国一级特黄录像播放| 蜜桃久久久久| 亚洲欧美三级伦理| 一级特黄曰皮片视频| 日本一本不卡| 日韩中文字幕在线视频| 99成人在线观看| 欧美黄免费看| 91极品视频在线| 黄瓜视频在线免费观看| 日韩精品久久久久久| 国产精品免费观看在线| 一卡二卡三卡在线观看| 国产一区不卡视频| 国产精品18毛片一区二区| 日本韩国在线观看| 26uuu色噜噜精品一区二区| 欧美午夜精品久久久久久蜜| www日韩tube| 亚洲欧美电影院| 蜜桃传媒一区二区三区| 高清电影一区| 91精品国产综合久久福利| 亚洲国产精品第一页| 欧美影院天天5g天天爽| 中文在线不卡视频| 青青草手机在线观看| 亚洲理伦在线| 国产精品入口日韩视频大尺度| 国产精选久久久| av欧美精品.com| 欧美lavv| 日本在线视频www鲁啊鲁| 欧美日韩在线免费| 日韩av.com| 欧美三级电影在线| 久久好看免费视频| 日韩污视频在线观看| 日一区二区三区| av一区二区三区在线观看| 日韩在线观看视频一区| 中国av一区二区三区| 国产精品igao激情视频| 都市激情亚洲综合| 日韩一区二区三区三四区视频在线观看| 欧洲熟妇的性久久久久久| 欧美一区二区三| 久久免费少妇高潮久久精品99| 超碰在线97观看| 粉嫩绯色av一区二区在线观看| 日本一区不卡| 羞羞视频在线观看不卡| 在线观看免费一区| 国产精品一区二区无码对白| 成人看的视频| 8x海外华人永久免费日韩内陆视频| 亚洲视频久久久| 92精品国产成人观看免费 | www.四虎在线| 97精品97| 国产精品av网站| 黄片毛片在线看| 综合久久久久综合| 天天影视综合色| 国产精品极品在线观看| 久久视频在线播放| 一级成人免费视频| 国产蜜臀av在线一区二区三区| 欧美一级片免费播放| 成人豆花视频| 久久精品国产免费观看| 国产日韩在线免费观看| 91捆绑美女网站| 黄色一级视频片| 欧美美女黄色| 久久久亚洲精品视频| 国产伦精品一区二区三区四区| 久久久久久**毛片大全| 日日鲁鲁鲁夜夜爽爽狠狠视频97 | 亚洲精品一区中文| 九九热国产精品视频| 激情av综合网| 日韩第一页在线观看| 日韩免费在线电影| www.日韩视频| 国产有码在线观看| 中文字幕一区av| 乌克兰美女av| 欧美顶级大胆免费视频| 国产精品入口日韩视频大尺度| seseavlu视频在线| 欧美影院精品一区| 丁香六月激情综合| 久久丁香综合五月国产三级网站| 亚洲精品中文字幕乱码三区不卡| 欧美日韩精品一区二区三区视频| 一区二区三区久久精品| 国产免费www| 国产精品国产三级国产普通话三级 | 懂色av粉嫩av蜜乳av| 裸体素人女欧美日韩| 日本日本精品二区免费| 91av一区| 麻豆成人在线看| 亚洲国产999| 香港成人在线视频| 美女洗澡无遮挡| 蜜桃在线一区二区三区| 国产精品美女在线播放| 亚洲视频一起| 欧美在线免费视频| av电影在线观看| 在线综合视频播放| 国产亚洲精久久久久久无码77777| 成人精品视频网站| 成人免费在线小视频| 日韩免费av| 99精彩视频| 桃花岛tv亚洲品质| 最近日韩中文字幕中文| 精品国产九九九| 岛国av午夜精品| 成人精品一二三区| 大白屁股一区二区视频| 精品国产成人av在线免| 91成人观看| 精品伊人久久大线蕉色首页| 日本欧美韩国| 欧美激情精品久久久久久免费印度| 午夜小视频免费| 欧美人狂配大交3d怪物一区| 久久网一区二区| 国产网红主播福利一区二区| 女王人厕视频2ⅴk| 天堂一区二区在线| 欧美美女黄色网| 欧美伦理影院| 99久久伊人精品影院| 自拍偷自拍亚洲精品被多人伦好爽| 欧美成人久久久| 欧美扣逼视频| 精品成人在线观看| 亚洲天堂网视频| 动漫精品一区二区| 久久久精品视频免费观看| 久久久久久久久免费| 国产精品一级无码| 久久精品中文| 欧美一级免费播放| 国产韩日影视精品| 欧美性天天影院| 99ri日韩精品视频| 91嫩草在线视频| 日韩三区免费| 4438全国成人免费| 里番在线播放| 精品国模在线视频| 蝌蚪视频在线播放| 亚洲国产精品久久| 精品国产亚洲AV| 欧美精品乱人伦久久久久久| 免费黄色片视频| 午夜精品久久久久久久99樱桃| 成人性生活毛片| 国产精品美女久久久久aⅴ | 午夜精品理论片| 中国av在线播放| 色伦专区97中文字幕| 久久99久久| 亚洲全黄一级网站| 台湾av在线二三区观看| 欧美精品一区视频| 亚洲精品无amm毛片| 日韩视频一区二区| 999久久久久久| 正在播放亚洲一区| 国产一区二区三区视频免费观看| 色狠狠一区二区| 亚洲欧美综合另类| 欧美日韩亚洲高清| 久久久久女人精品毛片九一| 香蕉乱码成人久久天堂爱免费| 精品99在线观看| 亚洲午夜视频在线| 久久久99精品| 亚洲综合免费观看高清完整版在线| 黄色a级片在线观看| 亚洲免费观看高清完整版在线| 在线看的片片片免费| 亚洲欧美偷拍卡通变态| 欧美国产日韩在线观看成人| 亚洲女爱视频在线| 久久久久久久久97| 五月天一区二区三区| 精品国产乱码一区二区| 欧美日韩精品在线| 亚洲无码精品一区二区三区| 日本韩国精品一区二区在线观看| 日韩乱码一区二区三区| 欧美日韩在线直播| 国产三级伦理片| 精品久久久久久久久久久久久久久 | 国精产品一区一区二区三区mba| 亚洲日本一区二区三区| 妺妺窝人体色www聚色窝仙踪 | 久久夜色精品国产噜噜av| 熟女少妇一区二区三区| 国产无一区二区| 日本黄色片免费观看| 亚洲国产色一区| 青青草免费观看视频| 欧美日韩一区二区三区不卡 | 成人免费短视频| 国产精品亚洲自拍| 久久伦理中文字幕| 国产区二精品视| 女厕嘘嘘一区二区在线播放 | 99热精品在线| 亚洲狼人综合干| 国产综合久久久久影院| 亚洲观看黄色网| 中文字幕欧美国产| 青青草免费av| 色噜噜狠狠色综合欧洲selulu| 亚洲视频在线免费播放| 欧美成人综合网站| 国产黄色片在线观看| 欧美成人h版在线观看| 国模精品视频| 成人夜晚看av| 小说区图片区色综合区| 亚洲一区三区在线观看| 亚洲精品孕妇| 中国黄色片一级| 91色综合久久久久婷婷| 久久久久久久久久97| 五月天亚洲婷婷| 国产三级在线观看视频| 亚洲男人天堂古典| 永久免费网站在线| 国产精品九九九| 国产精品调教视频| 一区二区三区av| 久久久夜夜夜| 国产精品成人免费一区久久羞羞| 国产精品美女久久久久高潮| 国产成人愉拍精品久久| 日韩亚洲欧美一区二区三区| 国产高清美女一级毛片久久| 久久久久五月天| 91嫩草国产线观看亚洲一区二区 | 国产日韩一区在线| 亚洲制服欧美另类| 国产精品国产三级国产专区51| 人人超碰91尤物精品国产| 中文字幕在线播放视频| 亚洲自拍偷拍欧美| 91国在线视频| 夜夜嗨av色综合久久久综合网| av福利导福航大全在线| 成人免费看黄网站| 欧美日韩久久精品| 欧美视频第一区| 成人黄色av网站在线| 中文字幕av免费在线观看| 欧美日韩国产三级| 国产毛片在线| 日韩免费精品视频| 欧美交a欧美精品喷水| 亚洲中文字幕无码av永久| 国产精品一级黄| 日本精品人妻无码77777| 欧美日本不卡视频| 欧美天天影院| 国产综合色香蕉精品| 久久国产成人午夜av影院宅| 超碰影院在线观看| 国产日韩欧美亚洲| 国产免费一区二区三区四区五区| 亚洲免费人成在线视频观看| 黄毛片在线观看| 久久爱av电影| 亚久久调教视频| 六月婷婷七月丁香| 日韩欧美在线第一页| 免费播放片a高清在线观看| 欧美一级淫片aaaaaaa视频| 日本欧美三级| 日韩av资源在线| 欧美激情在线一区二区| 国产精品第6页| 中文字幕一区二区精品| 欧美黑粗硬大| 中文字幕第50页| 国产suv精品一区二区6| 日韩精品一区三区| 日韩精品日韩在线观看| 欧美极度另类| 一区二区成人国产精品| 国产精品中文字幕欧美| 男女羞羞免费视频| 亚洲激情在线视频| 天天免费亚洲黑人免费| 亚洲高清在线观看一区| 国产一区二区不卡在线| 国产亚洲精久久久久久无码77777| 亚洲国产精品国自产拍av秋霞| 台湾佬成人网| 欧洲美女和动交zoz0z| 国产99精品国产| 视频一区二区三区四区五区| 在线精品91av| 视频在线亚洲| 女人和拘做爰正片视频| 国产精品午夜春色av| 精品国精品国产自在久不卡| 97视频在线播放| 日韩免费一区| 欧美日韩人妻精品一区在线| 91福利在线观看| 尤物在线网址| 欧洲精品久久| 国产精品18久久久久久久久| 91精品国产乱码久久久张津瑜| 伊人精品在线观看| 日韩一区二区三区在线看| 欧洲黄色一级视频| 国产精品久久久久久亚洲毛片| 亚洲乱码国产乱码精品精软件| 国产va免费精品高清在线| 久久久久久久久国产一区| 亚洲熟女一区二区| 欧美日韩一二三区| 日韩伦理在线一区| 一级黄色免费在线观看| 91在线视频播放地址| 国产精选久久久| 国产成人在线一区| 日韩欧美一区二区三区四区 | 天堂网avav| 亚洲深夜福利网站| jazzjazz国产精品久久|