精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Spark體系架構必讀

大數據 Spark
最近看到一篇關于Spark架構的博文,作者是 Alexey Grishchenko。看過Alexey博文的同學應該都知道,他對Spark理解地非常深入,讀完他的 “spark-architecture” 這篇博文,有種醍醐灌頂的感覺,從JVM內存分配到Spark集群的資源管理,步步深入,感觸頗多。因此,在周末的業余時間里,將此文的核心內容譯成中文,并在這里與大家分享。

最近看到一篇關于Spark架構的博文,作者是 Alexey Grishchenko。看過Alexey博文的同學應該都知道,他對Spark理解地非常深入,讀完他的 “spark-architecture” 這篇博文,有種醍醐灌頂的感覺,從JVM內存分配到Spark集群的資源管理,步步深入,感觸頗多。因此,在周末的業余時間里,將此文的核心內容譯成中文,并在這里與大家分享。如在翻譯過程中有文字上的表達紕漏,還請大家指出。

首先來看一張Spark 1.3.0 官方給出的圖片,如下:

 

在這張圖中,你會看到很多的術語 ,諸如“executor”, “task”, “cache”, “Worker Node” 等。原作者表示,在他開始學spark的時候,上述圖是唯一一張可以找到的圖片(Spark 1.3.0),形勢很不樂觀。更加不幸地是,這張圖并沒有很好地表達出Spark內在的一些概念。因此,通過不斷地學習,作者將自己所學的知識整理成一個系列,而此文僅是其中的一篇。下面進入核心要點。

Spark 內存分配

在你的cluster或是local machine上正常運行的任何Spark程序都是一個JVM進程。對于任何的JVM進程,你都可以使用-Xmx和-Xms配置它的堆大小(heap size)。問題是:這些進程是如何使用它的堆內存(heap memory)以及為何需要它呢?下面圍繞這個問題慢慢展開。

首先來看看下面這張Spark JVM堆內存分配圖:

 

Heap Size

默認情況下,Spark啟動時會初始化512M的JVM 堆內存。處于安全角度以及避免OOM錯誤,Spark只允許使用90%的的堆內存,該參數可以通過Spark的spark.storage.safetyFraction參數進行控制。 OK,你可能聽說Spark是基于內存的工具,它允許你將數據存在內存中。如果你讀過作者的 Spark Misconceptions 這篇文章,那么你應該知道Spark其實不是真正的基于內存(in-memory)的工具。它僅僅是在LRU cache (http://en.wikipedia.org/wiki/Cache_algorithms) 過程中使用內存。所以一部分的內存用在數據緩存上,這部分通常占安全堆內存(90%)的60%,該參數也可以通過配置spark.storage.memoryFraction進行控制。因此,如果你想知道在Spark中可以緩存多少數據,你可以通過對所有executor的堆大小求和,然后乘以safetyFraction 和storage.memoryFraction即可,默認情況下是0.9 * 0.6 = 0.54,即總的堆內存的54%可供Spark使用。

Shuffle Memory

接下來談談shuffle memory,計算公式是 “Heap Size” * spark.shuffle.safetyFraction * spark.shuffle.memoryFraction。spark.shuffle.safetyFraction的默認值是 0.8 或80%, spark.shuffle.memoryFraction的默認值是0.2或20%,所以你***可以用于shuffle的JVM heap 內存大小是 0.8*0.2=0.16,即總heap size的16%。 問題是Spark是如何來使用這部分內存呢?官方的Github上面有更詳細的解釋(https://github.com/apache/spark/blob/branch-1.3/core/src/main/scala/org/apache/spark/shuffle/ShuffleMemoryManager.scala)。

總得來說,Spark將這部分memory 用于Shuffle階段調用其他的具體task。當shuffle執行之后,有時你需要對數據進行sort。在sort階段,通常你還需要一個類似緩沖的buffer來存儲已經排序好的數據(謹記,不能修改已經LRU cache中的數據,因為這些數據可能會再次使用)。因此,需要一定數量的RAM來存儲已經sorted的數據塊。如果你沒有足夠的memory用來排序,該怎么做呢?在wikipedia 搜一下“external sorting” (外排序),仔細研讀一下即可。外排序允許你對塊對數據塊進行分類,然后將***的結果合并到一起。

unroll Memory

關于RAM***要講到”unroll” memory,用于unroll 進程的內存總量計算公式為:spark.storage.unrollFraction * spark.storage.memoryFraction *spark.storage.safetyFraction。默認情況下是 0.2 * 0.6 * 0.9 = 0.108,即10.8%的heap size。 當你需要在內存中將數據塊展開的時候使用它。為什么需要 unroll 操作呢?在Spark中,允許以 序列化(serialized )和反序列化(deserialized) 兩種方式存儲數據,而對于序列化后的數據是無法直接使用的,所以在使用時必須對其進行unroll操作,因此這部分RAM是用于unrolling操作的內存。unroll memory 與storage RAM 是共享的,也就是當你在對數據執行unroll操作時,如果需要內存,而這個時候內存卻不夠,那么可能會致使撤銷存儲在 Spark LRU cache中少些數據塊。

Spark 集群模式JVM分配

OK,通過上面的講解,我們應該對Spark進程有了進一步的理解,并且已經知道它是如何利用JVM進程中的內存。現在切換到集群上,以YARN模式為例。

在YARN集群里,它有一個YARN ResourceMananger 守護進程控制著集群資源(也就是memory),還有一系列運行在集群各個節點的YARN Node Managers控制著節點資源的使用。從YARN的角度來看,每個節點可以看做是可分配的RAM池,當你向ResourceManager發送request請求資源時,它會返回一些NodeManager信息,這些NodeManager將會為你提供execution container,而每個execution container 都是一個你發送請求時指定的heap size的JVM進程。JVM的位置是由 YARN ResourceMananger 管理的,你沒有控制權限。如果某個節點有64GB的RAM被YARN控制著(可通過設置yarn-site.xml 配置文件中參數 yarn.nodemanager.resource.memory-mb ),當你請求10個4G內存的executors時,這些executors可能運行在同一個節點上,即便你的集群跟大也無濟于事。

當以YARN模式啟動spark集群時,你可以指定executors的數量(-num-executors 或者 spark.executor.instances 參數),可以指定每個executor 固有的內存大小(-executor-memory 或者 spark.executor.memory),可以指定每個executor使用的cpu核數(-executor-cores 或者 spark.executor.cores),可以指定分配給每個task的core的數量(spark.task.cpus),還可以指定 driver 上使用的內存(-driver-memory 或者spark.driver.memory)。

當你在集群上執行應用程序時,job程序會被切分成多個stages,每個stage又會被切分成多個task,每個task單獨調度,可以把每個executor的JVM進程看做是task執行槽池,每個executor 會給你的task設置 spark.executor.cores/ spark.task.cpus execution個執行槽。例如,在集群的YARN NodeManager中運行有12個節點,每個節點有64G內存和32個CPU核(16個超線程物理core)。每個節點可以啟動2個26G內存的executor(剩下的RAM用于系統程序、YARN NM 和DataNode),每個executor有12個cpu核可以用于執行task(剩下的用于系統程序、YARN NM 和DataNode),這樣整個集群可以處理 12 machines * 2 executors per machine * 12 cores per executor / 1 core = 288 個task 執行槽,這意味著你的spark集群可以同時跑288個task,幾乎充分利用了所有的資源。整個集群用于緩存數據的內存有0.9 spark.storage.safetyFraction * 0.6 spark.storage.memoryFraction * 12 machines * 2 executors per machine * 26 GB per executor = 336.96 GB. 實際上沒有那么多,但在大多數情況下,已經足夠了。

到這里,大概已經了解了spark是如何使用JVM的內存,并且知道什么是集群的執行槽。而關于task,它是Spark執行的工作單元,并且作為exector JVM 進程中的一個thread執行。這也是為什么Spark job啟動時間快的原因,在JVM中啟動一個線程比啟動一個單獨的JVM進程塊,而在Hadoop中執行MapReduce應用會啟動多個JVM進程。

Spark Partition

下面來談談Spark的另一個抽象概念”partition”。在Spark程序運行過程中,所有的數據都會被切分成多個Partion。問題是一個parition是什么并且如何決定partition的數量呢?首先Partition的大小完全依賴于你的數據源。在Spark中,大部分用于讀取數據的method都可以指定生成的RDD中Partition數量。當你從hdfs上讀取一個文件時,你會使用Hadoop的InputFormat來指定,默認情況下InputFormat返回每個InputSplit都會映射到RDD中的一個Partition上。對于HDFS上的大部分文件,每個數據塊都會生成一個InputSplit,大小近似為64 MB/128 MB的數據。近似情況下,HDFS上數據的塊邊界是按字節來算的(64MB一個塊),但是當數據被處理時,它會按記錄進行切分。對于文本文件來說切分的字符就是換行符,對于sequence文件,它以塊結束等等。比較特殊的是壓縮文件,由于整個文件被壓縮了,因此不能按行進行切分了,整個文件只有一個inputsplit,這樣spark中也會只有一個parition,在處理的時候需要手動對它進行repatition。

責任編輯:趙寧寧 來源: 36大數據
相關推薦

2017-02-27 16:42:23

Spark識體系

2021-12-28 07:20:43

架構師技術架構

2019-07-01 12:55:05

安全體系架構網絡安全企業安全

2023-06-02 08:16:14

MySQL體系架構

2018-05-06 16:59:14

大數據python數據可視化

2009-12-23 10:13:20

WPF體系架構

2017-06-27 14:05:19

2021-01-06 10:09:38

MySQL

2021-12-29 06:58:41

架構師數據應用

2016-12-14 19:20:07

Spark SQL架構分布式

2015-03-10 14:05:46

程序員軟件架構讀書筆記

2021-04-06 09:43:41

微服務架構數據

2012-03-08 11:13:23

企業架構

2025-08-26 03:15:00

MASLLM映射

2011-04-29 13:40:37

MongoDBCommand

2017-04-17 09:56:43

系統架構體系

2009-11-05 09:35:54

WCF體系架構

2018-12-05 10:10:40

HBase服務器架構

2023-06-28 10:24:04

2022-03-22 18:24:50

數據安全加密
點贊
收藏

51CTO技術棧公眾號

欧美日本中文| 国产精品一区二区三区av | 国产在线98福利播放视频| 国产精品酒店视频| 精品一区二区三区中文字幕在线 | 26uuu亚洲综合色欧美| 国产精品99导航| 欧美成人精品欧美一级私黄| 欧美人与动xxxxz0oz| 欧美日韩一本到| 男人添女荫道口图片| 春暖花开成人亚洲区| 国产成人在线视频网址| 国产精品福利在线| 久久一区二区三| 日韩88av| 日韩精品在线电影| 亚洲成人激情小说| 亚州一区二区三区| 精品国产精品自拍| 99热一区二区三区| 国产51人人成人人人人爽色哟哟| 国产激情偷乱视频一区二区三区 | 免费一级a毛片| 国内精品久久久久久久97牛牛 | 亚洲在线播放电影| 香蕉视频成人在线| 国产91精品免费| 成人免费直播live| 久久久国产免费| 国产一区导航| 久久久久久亚洲精品| 69夜色精品国产69乱| 欧美伦理影院| 日韩国产精品一区| 黑森林av导航| 日本精品一区二区三区在线观看视频| 色系网站成人免费| 极品美女扒开粉嫩小泬| 欧美日韩在线视频免费观看| 中文字幕一区二区三区不卡在线| 欧美精品七区| 视频一区二区在线播放| 成人av手机在线观看| www.久久久| www.com欧美| 国产一区三区三区| 国产精品视频精品| 久久99国产综合精品免费| 日韩视频在线一区二区三区 | 日韩三区免费| 在线精品视频免费播放| 妞干网在线免费视频| 依依综合在线| 色综合色狠狠综合色| 北条麻妃69av| 成人影院大全| 欧美在线观看18| www.亚洲高清| 亚洲精品成a人ⅴ香蕉片| 欧美日韩亚州综合| 日本一二区免费| 国产精品亚洲四区在线观看 | 香蕉视频网站在线| 91农村精品一区二区在线| 久久久久无码国产精品一区| 日本午夜在线视频| 国产午夜久久久久| 一区二区三区欧美成人| 1区2区3区在线视频| 一区二区三区波多野结衣在线观看 | 日本国产一级片| 日韩精品一区二区三区免费视频| 欧美成人一级视频| 在线免费观看污视频| 美女久久99| 日韩亚洲成人av在线| 少妇视频一区二区| 国模 一区 二区 三区| 97在线看福利| 久久久久精彩视频| 国产在线精品免费av| 成人国产1314www色视频| 无码国产精品高潮久久99| 国产亚洲精品超碰| 久久久久久久久影视| 成人黄色动漫| 欧美日韩久久不卡| 无码av免费精品一区二区三区| 任你弄精品视频免费观看| 亚洲天堂网站在线观看视频| 国产色无码精品视频国产| 国产一区亚洲| 国产精品人成电影| 亚洲精品免费在线观看视频| 91在线看国产| 黄色网zhan| 国产精品高清乱码在线观看| 91精品国产高清一区二区三区| 亚洲国产精品无码久久久久高潮 | 不卡一区视频| 日韩成人性视频| 黑人操日本美女| 免费一级欧美片在线播放| 成人免费在线视频网站| 欧洲毛片在线| 亚洲风情在线资源站| 欧美日韩一区二区三区69堂| 日本欧美三级| 精品中文字幕在线2019| 久久久久精彩视频| 91在线码无精品| 白白操在线视频| av亚洲一区| 亚洲精品在线看| 欧美日韩大片在线观看| 美女视频一区二区三区| 久久亚洲国产精品日日av夜夜| aa在线视频| 欧美影片第一页| 欧美黑人欧美精品刺激| 欧美激情第10页| 国产在线视频欧美| 成人高清免费观看mv| 午夜精品一区二区三区免费视频| 韩国一区二区在线播放| 欧美日韩一二三四| 2019中文字幕免费视频| 亚洲风情第一页| 亚洲柠檬福利资源导航| www午夜视频| 欧美肉体xxxx裸体137大胆| 欧美性视频精品| 天天操天天操天天操| 亚洲线精品一区二区三区| 国产探花在线观看视频| 欧美黄色录像片| 国产精品视频成人| chinese偷拍一区二区三区| 色诱亚洲精品久久久久久| 国产成人精品无码片区在线| 激情欧美日韩| 好吊妞www.84com只有这里才有精品| av网址在线看| 欧美一级生活片| 中文字幕在线有码| 国产一区免费电影| 9色视频在线观看| 在线精品国产亚洲| 欧美黑人巨大xxx极品| aaa一区二区三区| 亚洲精品国久久99热| 美女被艹视频网站| 国语自产精品视频在线看8查询8| 97人人模人人爽视频一区二区| 中文字幕有码在线观看| 日韩色在线观看| 伊人国产在线观看| 99久久精品国产网站| 日韩av在线第一页| 精品国产aⅴ| 国产精品视频久久久| 黄色成人影院| 日韩一区二区三区视频在线| 久久亚洲精品大全| 97久久超碰精品国产| 日av中文字幕| 我不卡影院28| 国产精品久久久久久久久婷婷 | 成年人视频在线免费观看| 欧美视频在线一区二区三区| 手机av在线看| 成人avav影音| 欧美精品第三页| 欧美激情理论| 国产呦系列欧美呦日韩呦| 日韩免费福利视频| 久久精品2019中文字幕| 国产小视频一区| 在线一区二区视频| a在线视频播放观看免费观看| 国产99久久久精品| 精品视频一区二区在线| 99国产**精品****| 国产在线欧美日韩| 久久亚洲人体| 91精品国产91久久| 69久久久久| 亚洲级视频在线观看免费1级| 依依成人综合网| 成人欧美一区二区三区视频网页| 无码人妻一区二区三区精品视频| 国产亚洲毛片| 天天操天天干天天玩| 中日韩免视频上线全都免费| 91精品视频专区| 综合日韩av| 欧美大胆a视频| 国产一级片在线| 日韩欧美一级二级三级| 国产免费a视频| 亚洲综合激情网| 亚洲综合欧美综合| www.亚洲激情.com| www.污网站| 久久激情一区| 久久在线中文字幕| 国产精品福利在线观看播放| 久久精品二区| 91在线一区| 91精品久久久久久久久久入口| 草草视频在线观看| 欧美日韩成人黄色| 网友自拍视频在线| 亚洲丝袜一区在线| 天天干天天色天天| 日韩一区二区三区四区| 92久久精品一区二区| 色婷婷精品久久二区二区蜜臂av| 免费毛片在线播放免费| 国产精品第四页| 精品无码在线观看| 久久综合一区二区| 无码人妻精品一区二区三| 国产一区二区三区av电影| 亚洲五月天综合| 噜噜爱69成人精品| 日韩欧美视频网站| 在线亚洲激情| www插插插无码视频网站| 欧美在线免费一级片| 亚洲国产一区二区三区在线播 | 色综合久久久| 国产精品免费福利| 日本一区二区三区视频在线| 青青草成人在线| xxxxxx欧美| 奇米四色中文综合久久| 日韩电影免费看| 97国产精品视频| 24小时免费看片在线观看| 欧美高清不卡在线| 日韩精品分区| 欧美激情欧美激情在线五月| 久色国产在线| 国内精品久久久久影院优 | 成人高清免费在线播放| 国产亚洲激情在线| av影片在线看| 日韩视频精品在线| 国产最新在线| 欧美丰满少妇xxxx| 91豆花视频在线播放| 69视频在线播放| 波多野结衣久久精品| 国产97人人超碰caoprom| 日韩电影免费观看高清完整版| 国产精品jvid在线观看蜜臀| 巨胸喷奶水www久久久| 国产噜噜噜噜久久久久久久久| 久久亚洲国产精品尤物| 91免费看网站| 美女av一区| 日本一区二区三区免费看| 色中色综合网| japanese在线播放| 亚洲理论在线| 激情 小说 亚洲 图片: 伦| 捆绑调教美女网站视频一区| 日本网站在线看| 国产91富婆露脸刺激对白| 黄色免费视频网站| 国产日韩欧美高清在线| 亚洲女人久久久| 亚洲国产综合人成综合网站| 男人的天堂一区二区| 91精品91久久久中77777| 91精品中文字幕| 亚洲成人激情在线观看| 久草视频在线看| 欧美成人精品xxx| 色是在线视频| 国产在线拍揄自揄视频不卡99| 99精品在免费线中文字幕网站一区| 免费成人av网站| 中文字幕日韩一区二区不卡| 能在线观看的av| 久久99国产精品久久| 欧美肉大捧一进一出免费视频| 国产视频一区不卡| 免费一级黄色大片| 欧美在线不卡视频| 日本韩国在线观看| 自拍偷拍亚洲区| 9999精品成人免费毛片在线看| 国产精品免费久久久久久| 国产欧美啪啪| 亚洲欧洲中文| 国产精品入口| 老司机av网站| 国产精品网友自拍| 久久狠狠高潮亚洲精品| 欧美一区二区三区不卡| 欧美一区二区少妇| 久久久久久网站| 外国成人毛片| 日本在线一区| 亚洲国产美女| 国产亚洲色婷婷久久| 国产亚洲精品资源在线26u| 黄色激情视频在线观看| 欧美精品v国产精品v日韩精品 | 综合av第一页| 一级特黄免费视频| 日韩精品在线电影| 欧美理论电影| 亚洲自拍偷拍在线| 久久亚洲影视| 欧美一级特黄a| 91麻豆精品视频| 日韩成人免费在线观看| 日韩视频在线观看一区二区| 欧美jizzhd欧美| 国产精品极品美女在线观看免费 | 丁香六月婷婷综合| 精品国产电影一区二区| 丝袜中文在线| 91亚洲国产精品| 国产精品成人a在线观看| 婷婷六月天在线| 国产欧美一区二区三区在线老狼| 中文字幕亚洲高清| 亚洲国产精品久久久| 久操av在线| 国产欧美一区二区三区另类精品| 综合一区av| 男插女视频网站| 亚洲精品国产视频| 国产模特av私拍大尺度| 久久精品国产69国产精品亚洲 | 日韩精品亚洲一区| 天天躁日日躁aaaxxⅹ| 欧美性猛交xxxxx免费看| 亚州男人的天堂| 51久久精品夜色国产麻豆| 久久a级毛片毛片免费观看| 蜜臀av色欲a片无码精品一区| 成人丝袜18视频在线观看| 久久久久国产精品夜夜夜夜夜| 欧美成人vps| 97在线超碰| 免费看污久久久| 视频一区国产视频| 国产aaaaaaaaa| 欧美精品tushy高清| 国产高清一区二区三区视频| 91精品久久香蕉国产线看观看| 中文字幕一区二区三区欧美日韩 | 一级特黄录像免费看| 久久精品国产欧美激情| 日韩区欧美区| 成人网站免费观看入口| 久久伊人中文字幕| 中文字幕av片| 久久不射热爱视频精品| 亚洲综合影院| 亚洲欧洲日产国码无码久久99 | 亚洲一区尤物| 国产精品456露脸| 日本一二三区视频| 国产亚洲精品久久久优势| 四虎国产精品成人免费影视| 欧美极品少妇无套实战| 91视频免费看| 在线观看免费中文字幕| 色综合久久88| 视频国产一区| 少妇性l交大片7724com| 欧美日韩在线视频观看| 网友自拍视频在线| 国产福利久久| 日韩专区中文字幕一区二区| 91嫩草丨国产丨精品| 亚洲精美色品网站| 国产精品高潮久久| 欧美精品久久久久久久久久久| 久久久久久久久久美女| 国产乱码精品一区二三区蜜臂 | 亚洲欧美自拍视频| 久久精品国产久精国产一老狼| 免费成人三级| 日本三级黄色网址| 午夜精品视频在线观看| 香港伦理在线| 精品高清视频| 国产很黄免费观看久久| 蜜臀尤物一区二区三区直播| 九九热最新视频//这里只有精品| 国产a久久精品一区二区三区| 波多野结衣中文字幕在线播放|