精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

字節跳動開源自研 Shuffle 框架——Cloud Shuffle Service

原創 精選
開源
字節跳動宣布,正式開源 Cloud Shuffle Service。目前,CSS 已在 Github 上開源,歡迎感興趣的同學一起參與共建!
今天,字節跳動宣布,正式開源 Cloud Shuffle Service。

Cloud Shuffle Service(以下簡稱CSS) 是字節自研的通用 Remote Shuffle Service 框架,支持 Spark/FlinkBatch/MapReduce 等計算引擎,提供了相比原生方案穩定性更好、性能更高、更彈性的數據 Shuffle 能力,同時也為存算分離/在離線混部等場景提供了 Remote Shuffle 解決方案。

目前,CSS 已在 Github 上開源,歡迎感興趣的同學一起參與共建!

項目地址:

https://github.com/bytedance/CloudShuffleService

開源背景

在大數據計算引擎中,Pull-Based Sort Shuffle 是一種常見的 Shuffle 方案,比如 Spark/MapReduce/FlinkBatch (高于1.15版本)等都將 Sort Shuffle 作為引擎默認方案,但是 Sort Shuffle 實現機制有一定的缺陷,在大規模生產環境下經常因為 Shuffle 問題影響作業穩定性。

以 Spark 的 Sort Shuffle 為例:

圖片

如上圖所示鏈路,Sort Shuffle 會存在以下一些問題:

  • 將多個 Spill 文件合并成一個文件,會額外消耗讀寫 IO;

假設有 m 個 MapTask & n 個 ReduceTask,會產生 m*n 個網絡鏈接,當數量特別多時:

  • 大量的網絡請求會導致 Shuffle Service 容易形成積壓;
  • Shuffle Service 會產生大量的隨機讀取,容易導致 IO 瓶頸,特別是 HDD 集群;
  • Shuffle Service 無法做到 Application 的資源隔離,當有一個異常作業時,可能會影響同一個 Shuffle Service 節點上其它所有作業,問題容易放大;
  • MapTask 生成的 Shuffle Data File 只存儲一份到本地,當磁盤壞了也會導致數據丟失,同樣引起 FetchFailed 問題;
  • Shuffle Data File 寫到本地磁盤的方式,依賴計算節點上的磁盤,無法做到存算分離

這些都很容易導致 ShuffleRead 慢或者超時,引起 FetchFailed 相關錯誤,嚴重影響線上作業的穩定性,ShuffleRead 慢也會大大降低資源利用率(CPU&Memory),同時 FetchFailed 也會導致 Stage 中相關 Task 重算,浪費大量資源,拖慢整個集群作業運行;無法存算分離的架構,在在離線混部(在線資源磁盤不足)/Serverless 云原生等場景下,也很難滿足要求。字節跳動使用 Spark 作為主要的離線大數據處理引擎,每天線上運行作業數過百萬,日均 Shuffle 量 300+PB。在 HDFS 混部&在離線混部等場景,Spark 作業的穩定性經常無法得到保障,影響業務 SLA:

  • 受限 HDD 磁盤 IO 能力/磁盤壞等情況,導致大量的 Shuffle FetchFailed 引起的作業慢/失敗/Stage 重算等問題,影響穩定性&資源利用率
  • External Shuffle Service (以下簡稱ESS)  存算無法分離,遇到磁盤容量低的機器經常出現磁盤打滿影響作業運行

在此背景下,字節跳動自研了 CSS,用來解決 Spark 原生 ESS 方案的痛點問題。自 CSS 在內部上線一年半以來,當前線上節點數 1500+,日均 Shuffle 量 20+PB,大大提高了 Spark 作業的 Shuffle 穩定性,保障了業務的 SLA。

Cloud Shuffle Service 介紹

CSS 是字節自研的 Push-Based Shuffle Service,所有 MapTask 通過 Push 的方式將同一個 Partition 的 Shuffle 數據發送給同一個 CSS Worker 節點進行存儲,ReduceTask 直接從該節點通過 CSS Worker 順序讀取該 Partition 的數據,相對于 ESS 的隨機讀取,順序讀的 IO 效率大大提升。

CSS 架構

圖片Cloud Shuffle Service(CSS) 架構圖CSS Cluster 是獨立部署的 Shuffle Service 服務,主要涉及的組件為:

CSS Worker

CSS Worker 啟動后會向 ZooKeeper 節點注冊節點信息,它提供 Push/Fetch 兩種服務請求,Push 服務接受來自 MapTask 的 Push 數據請求,并將同一個 Partition 的數據寫到同一個文件;Fetch 服務接受來自 ReduceTask 的 Fetch 數據請求,讀取對應 Partition 數據文件返回;CSS Worker還負責 Shuffle 數據清理的工作,當 Driver 進行 UnregisterShuffle 請求刪除 ZooKeeper 對應 ShuffleId 的 Znode 時,或者 Application 結束刪除 ZooKeeper 中 ApplicationId 的 Znode 時,CSS Workers 會 Watch 相關事件對 Shuffle 數據進行清理。

CSS Master

作業啟動后會在 Spark Driver 中啟動 CSS Master,CSS Master 會從 ZooKeeper 中獲取到 CSS Worker 的節點列表,然后為后續 MapTask 產生的各個 Partition 分配 n 個副本(默認為2)的 CSS Worker 節點,并對這些 Meta 信息進行管理,供 ReduceTask 獲取 PartitionId 所在的 CSS Worker 節點進行拉取,同時在 RegisterShuffle/UnregisterShuffle 過程中會在 ZooKeeper 中創建對應的 ApplicationId/ShuffleId 的 Znode,CSS Worker 會 Watch Delete 事件對 Shuffle 數據進行清理。

ZooKeeper

如前描述,用來存儲 CSS Worker 節點信息以及 ShuffleId 等信息。

CSS 特性

多引擎支持

CSS除了支持 Spark(2.x&3.x) 之外,也可以接入其他引擎,目前在字節跳動內部,CSS 還接入了 MapReduce/FlinkBatch 引擎。

PartitionGroup 支持

為了解決單個 Partition 太小,Push 效率比較低的問題,實際會將多個連續的 Partition 組合成更大的 PartitionGroup進行 Push。

高效統一的內存管理

跟 ESS 類似,MapTask 中的 CSS Buffer 將所有 Partition 的數據都存儲在一起,在 Spill 之前會對數據按照 PartitionId 進行排序,然后按照 PartitionGroup 維度進行數據推送;同時 CSS Buffer 完全納入 Spark 的 UnifiedMemoryManager 內存管理體系,內存相關參數由 Spark 統一管理。

容錯處理

Push 失敗:當觸發 Spill 進行 Push PartitionGroup 數據時,每次 Push 的數據大小為 4MB(一個Batch),當某次 Push batch 失敗時,并不影響之前已經 Push 成功的數據,只需要重新分配節點(Reallocate)繼續 Push 當前失敗的數據以及后續還未 Push 的數據,后續 ReduceTask 會從新老節點讀取完整的 Partition 數據;多副本存儲:ReduceTask 從 CSS Worker 讀取某個 Partition 數據是按照 Batch 粒度進行拉取的,當 CSS Worker 異常(如網絡問題/磁盤壞等)導致無法獲取該 Batch 數據,可以繼續選擇另外一個副本節點繼續讀取該 Batch 以及后續 Batch 的數據;數據去重:當作業開啟 Speculative 推測執行會有多個 AttempTask 并發跑,需要在讀取的時候進行去重。在 Push Batch 的時候,會給 Batch 數據加上 Header 信息,Header 信息中包含  MapId + AttempId + BatchId 等信息,ReduceTask 讀取時可以根據這些 ID 信息進行去重。

Adaptive Query Execution(AQE) 適配

CSS 完整支持 AQE 相關的功能,包括動態調整 Reduce 個數/ SkewJoin 優化/Join 策略優化。對于SkewJoin,CSS做了更多的適配優化工作,解決了 Skew Partition 數據被多個 ReduceTask 重復讀取問題,大大提高了性能。

CSS 性能測試

我們將 CSS 與開源的 ESS 使用獨占 Label 計算資源進行 1TB 的 TPC-DS Benchmark 測試對比,整體端到端的性能提升15%左右,部分 Query 有30%以上的性能提升。同時我們也使用線上混部資源隊列(ESS 穩定較差)進行 1TB 的 TPC-DS Benchmark 測試對比,整體端到端性能提升4倍左右。

圖片

CSS 1TB 測試提升 30% 以上的 Query

未來規劃

CSS 目前開源了部分 Feature,還有一些 Feature & 優化后續會陸續開放:

  • 支持 MapReduce/FlinkBatch 引擎;
  • CSS 集群增加 ClusterManager 服務角色,管理 CSS Worker 的狀態&負載信息,同時將當前 CSS Master 分配 CSS Worker 的功能提到 ClusterManager;
  • 基于異構機器(如磁盤能力不同)/負載 等維度的 CSS Worker 分配策略。
責任編輯:未麗燕 來源: 字節跳動技術團隊
相關推薦

2023-11-20 07:27:00

云原生Spark

2018-06-29 09:01:51

開源技術 深度學習

2022-06-22 06:49:39

Hertz開源HTTP 框架

2022-09-19 10:40:36

deepin開源Unilang

2022-01-17 09:36:20

阿里云小米EMR

2022-05-17 17:18:40

Kite字節跳動微服務框架

2023-10-18 11:56:17

開源AI

2023-04-19 16:51:54

分布式Primus開源

2022-05-09 09:30:06

框架開源模型

2009-12-07 13:50:10

PHP函數shuffl

2022-04-07 16:35:59

PGO 優化profile 數據編譯優化

2022-03-21 17:56:59

大模型訓練訓練框架

2022-03-21 15:06:10

模型字節跳動框架

2021-09-17 13:05:55

模型人工智能框架

2024-11-07 11:46:41

2025-09-15 06:25:00

2022-11-02 10:02:24

BitSail字節跳動數據集成

2020-05-20 10:25:43

華為谷歌開源

2018-06-12 07:15:18

阿里巴巴技術語音識別
點贊
收藏

51CTO技術棧公眾號

99久久99久久精品国产片果冻| 凹凸成人精品亚洲精品密奴| 午夜国产不卡在线观看视频| 玛丽玛丽电影原版免费观看1977 | 天天摸天天干天天操| 亚洲久久一区| www.欧美三级电影.com| 逼特逼视频在线观看| 欧美大片高清| 亚洲精品视频自拍| 久久一区二区精品| 国产成人精品毛片| 老司机精品视频网站| 久久艹在线视频| 亚洲一区视频在线播放| 亚洲一区二区免费在线观看| 在线一区二区三区四区| 成人午夜免费在线视频| 成年人免费在线视频| 国产激情91久久精品导航| 国产a∨精品一区二区三区不卡| 搜索黄色一级片| 欧美美女在线| 亚洲二区中文字幕| 日本成人在线免费观看| 亚洲欧美在线成人| 欧美日韩在线看| 草草草视频在线观看| 91女主播在线观看| 2020日本不卡一区二区视频| 99re在线视频上| 一区二区www| 丝袜美腿亚洲综合| 6080yy精品一区二区三区| 1024手机在线视频| 91九色精品| 自拍偷拍亚洲欧美| 亚洲天堂久久新| 亚洲电影男人天堂| 亚洲激情成人网| 在线观看免费视频国产| 亚洲一区二区三区免费| 日韩免费观看高清完整版在线观看| jizz欧美性11| 69堂免费精品视频在线播放| 色欧美乱欧美15图片| 欧美aⅴ在线观看| 久热在线观看视频| 婷婷中文字幕一区三区| 成年人午夜视频在线观看 | 久草在线成人| 亚洲日本aⅴ片在线观看香蕉| 国产亚洲色婷婷久久99精品91| 一区二区三区国产好| 精品国免费一区二区三区| 国产在线观看免费播放| 91夜夜蜜桃臀一区二区三区| 精品久久久久久久一区二区蜜臀| 美女又黄又免费的视频| youjizz欧美| 亚洲爱爱爱爱爱| 一级特黄a大片免费| 欧美wwwsss9999| 亚洲色图第一页| 阿v天堂2014| 欧美激情国产在线| 久久影视电视剧免费网站清宫辞电视 | 一级淫片免费看| 国产一区二区影院| 国产乱码精品一区二区三区卡| 肥臀熟女一区二区三区| 成av人片一区二区| 蜜桃导航-精品导航| 黄色小视频在线免费观看| 国产日韩一级二级三级| 亚洲精品成人自拍| 成年人黄视频在线观看| 亚洲一区二区欧美| 日韩av黄色网址| 日本国产欧美| 4438x成人网最大色成网站| 亚洲av综合色区无码另类小说| 久久丝袜视频| 中文字幕久久精品| 杨钰莹一级淫片aaaaaa播放| 在线观看视频日韩| 国产精品白嫩初高中害羞小美女 | 亚洲国产综合在线观看| 欧美成人精精品一区二区频| 精品无码在线视频| 国产精品99一区二区三| 欧美激情一区二区三区久久久| 久久精品视频1| 激情图片小说一区| 久久大片网站| 黄色网址在线免费| 黑人巨大精品欧美一区二区三区 | 亚洲人成7777| 免费成人在线视频网站| 96sao精品免费视频观看| 亚洲精品www久久久久久广东| 欧美亚洲色综久久精品国产| 禁久久精品乱码| 国产精品网站视频| 色欲av伊人久久大香线蕉影院| 国产精品理论片| 国产极品尤物在线| 国产电影一区| 亚洲日韩欧美视频一区| 久久免费小视频| 捆绑紧缚一区二区三区视频| 久久精品国产综合精品| av片在线观看网站| 欧美丝袜丝交足nylons| 国产亚洲色婷婷久久99精品91| 天天影视天天精品| 国产精品女主播| 五月婷婷伊人网| 亚洲黄色尤物视频| 伊人网在线综合| 国产一区二区精品久| 久久久久久久av| 国产精品欧美久久久久天天影视| 91首页免费视频| 久艹视频在线免费观看| 伊人久久一区| 社区色欧美激情 | 国产suv精品一区二区33| av不卡免费电影| 黄色一级片国产| 国产精品日韩精品在线播放| 中文字幕欧美视频在线| 亚洲国产成人精品女人久久| 91小视频免费观看| 欧美久久久久久久久久久久久| 高清在线一区二区| 久久精品人人爽| ,一级淫片a看免费| 国产精品女上位| 日本久久久久久久久久久久| 国产真实有声精品录音| 欧美最猛性xxxxx免费| 性高潮久久久久久久久久| 亚洲福利视频一区二区| 美女搡bbb又爽又猛又黄www| 黑丝一区二区| 国产一区二区精品在线| 国产精品电影| 精品夜色国产国偷在线| 黄色在线视频网址| 久久久久久久久97黄色工厂| 可以免费在线看黄的网站| 国产一区二区精品福利地址| 国产精品视频区| 免费网站成人| 日韩一区二区在线观看视频播放| 亚洲国产精品久| 波多野结衣亚洲一区| 欧美亚洲精品一区二区| 你懂的视频欧美| 国产精品久久久久免费a∨大胸| 国产特黄在线| 欧美日韩国产综合一区二区三区| 69夜色精品国产69乱| 国产原创一区二区| av女优在线播放| 日韩mv欧美mv国产网站| 国产成人综合亚洲| 看黄网站在线| 亚洲国产欧美日韩精品| 日本视频免费观看| 国产精品麻豆久久久| 伊人国产精品视频| 一区在线免费观看| 欧美日韩精品免费看| 青青热久免费精品视频在线18| 久久精品亚洲热| 亚洲av综合色区无码一二三区 | 成人免费无码av| 91亚洲国产| 国产乱子伦精品| 99久久综合国产精品二区| 欧美成人免费全部| 婷婷亚洲一区二区三区| 欧美日韩国产bt| 国产在线成人精品午夜| 国产欧美视频一区二区三区| 超碰91在线播放| 国产伦理一区| 五月天综合婷婷| 要久久电视剧全集免费| 亚洲精品免费网站| 韩漫成人漫画| 欧美激情videos| av网站无病毒在线| 亚洲激情自拍图| 在线观看免费观看在线| 性感美女久久精品| 91制片厂在线| 久久综合九色综合欧美就去吻 | av动漫在线观看| 99久久久久久中文字幕一区| 精品国产一二| 五月亚洲婷婷| 国产精品亚洲网站| 亚洲欧美一区二区三区| 欧美激情区在线播放| 福利在线视频导航| 亚洲精品国产suv| 国产剧情久久久| 在线一区二区三区四区| 男女视频免费看| 一区二区三区四区国产精品| 国产调教在线观看| 91在线丨porny丨国产| 女教师高潮黄又色视频| 麻豆成人av在线| 男人天堂网视频| 亚洲激情社区| 久久www视频| 女同性一区二区三区人了人一| 午夜精品一区二区在线观看| 日韩欧美天堂| 国产美女精品在线观看| 欧美三级一区| 91美女福利视频高清| 久久久久久一区二区三区四区别墅| 欧美整片在线观看| 国产精品25p| 性欧美视频videos6一9| 国产美女福利在线观看| 欧美成人免费大片| 50度灰在线| 欧美俄罗斯性视频| 手机av免费在线| 久久成人这里只有精品| 国产欧美久久久久久久久| 色七七影院综合| 免费av不卡| 日韩亚洲综合在线| 巨大荫蒂视频欧美另类大| www.国产精品一二区| 免费超碰在线| 欧美大片va欧美在线播放| 91网址在线观看| 久99久在线视频| 黄色影院在线看| 午夜精品国产精品大乳美女| gogo久久| 清纯唯美日韩制服另类| se01亚洲视频| 国产欧美亚洲视频| 国产精品一级在线观看| 99久久99久久| 波多野结衣欧美| 久久久影院一区二区三区 | 在线成人一区二区| 日本视频不卡| 欧美成年人网站| 国产第一页在线视频| 97婷婷大伊香蕉精品视频| 一区二区三区四区日本视频| 国产精品第一视频| 91国产一区| 国产伦精品一区二区三区四区免费 | 在线亚洲欧美| 激情视频免费网站| 狠狠狠色丁香婷婷综合久久五月| 中文字幕第六页| 97久久久精品综合88久久| 亚洲精品国产精品国自产网站| 国产精品免费网站在线观看| 日韩女优一区二区| 疯狂做受xxxx高潮欧美日本| 老熟妇一区二区三区啪啪| 91精品婷婷国产综合久久性色 | 国产精品3区| 国语精品免费视频| 成人6969www免费视频| 国产精品12p| 亚洲欧美成人综合| jizz18女人| 成人精品视频.| 神马久久久久久久久久久| 亚洲精品自拍动漫在线| 黄色片免费观看视频| 欧美日韩精品欧美日韩精品| 黄色av小说在线观看| 中文字幕日韩综合av| 黄色的视频在线观看| 国产欧美精品日韩| 欧美中文一区| 中文字幕欧美日韩一区二区三区 | www.成人黄色| 26uuu久久天堂性欧美| 91精品少妇一区二区三区蜜桃臀| 精品欧美激情精品一区| 国产乱淫av片免费| 亚洲欧美日韩网| 色呦呦在线播放| 国产日韩中文字幕在线| 亚洲激情播播| 久久福利一区二区| 久久超碰97中文字幕| 91成人破解版| 亚洲成人综合视频| 一级黄色片在线播放| 亚洲男人第一av网站| 男人添女人下部高潮视频在线观看| 国产精品成人国产乱一区| 久久夜色精品国产噜噜av小说| 伊人久久大香线蕉精品| 亚洲综合日本| 色哟哟无码精品一区二区三区| 国产精品久线在线观看| 免费污污视频在线观看| 亚洲国产古装精品网站| 中文字幕在线观看网站| 91九色国产在线| 欧美在线观看视频一区| 黄色a级片免费| av一二三不卡影片| 久草视频中文在线| 制服.丝袜.亚洲.中文.综合| shkd中文字幕久久在线观看| 欧美在线亚洲在线| 日韩电影不卡一区| 国产美女主播在线播放 | 欧美日韩综合色| 你懂的在线观看| 51色欧美片视频在线观看| 国产精品99久久免费观看| 欧美黑人在线观看| 国产成人免费视| 久久综合色综合| 精品国产乱码久久久久久夜甘婷婷| 国产区在线观看| 91色琪琪电影亚洲精品久久| 久久中文视频| 亚洲一二三不卡| **网站欧美大片在线观看| 一区二区三区精彩视频| 久久九九热免费视频| 亚洲美女色播| 91精品一区二区三区四区| 国产呦萝稀缺另类资源| 欧美黄色一区二区三区| 日韩欧美一区二区在线视频| 中日韩高清电影网| 99久久一区三区四区免费| 18成人免费观看视频| www.88av| 色88888久久久久久影院野外| 韩日视频在线| 国产欧美在线看| 亚洲九九视频| 风韵丰满熟妇啪啪区老熟熟女| 亚洲一区二区三区国产| 天天影院图片亚洲| 国产成人精品一区| 日韩免费在线| 在线一区二区不卡| 亚洲一区二区三区三| 香蕉av一区二区三区| 国产福利视频一区二区| 国产精品二区不卡| 亚洲女则毛耸耸bbw| 黑人巨大精品欧美一区二区| 91av资源在线| 成人蜜桃视频| 久久精品在线| 国产一区二区播放| 亚洲成人av资源网| 日本免费久久| 在线视频一二三区| 99精品偷自拍| 在线免费av片| 欧美极品少妇xxxxⅹ裸体艺术| 欧美尿孔扩张虐视频| 色免费在线视频| 亚洲专区一二三| 国产精品无码2021在线观看| 91香蕉国产在线观看| 99精品热6080yy久久| 国产精品久久久久久成人| 日韩一级免费观看| 免费观看亚洲| 国内精品国产三级国产99| 久久嫩草精品久久久精品一| 国产三级三级在线观看| 欧美夜福利tv在线| 五月天综合网站| 野花社区视频在线观看| 51久久夜色精品国产麻豆| 亚洲第一av| 老汉色影院首页| 国产日韩欧美激情| 亚洲精品一区二区三区不卡| 国产精品免费福利| 999在线观看精品免费不卡网站|