精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Hadoop大數據面試--Hadoop篇

企業動態 Hadoop
本篇大部分內容參考網上,其中性能部分參考:http://blog.cloudera.com/blog/20 ... reduce-performance/、http://www.idryman.org/blog/2014 ... ing-best-practices/

[[179381]]

原理篇

1. Hadoop2.X的各個模塊一句話簡介

1)Hadoop Common:為Hadoop其他模塊提供支持的公共工具包;

2)HDFS:Hadoop分布式文件系統;

3)YARN:任務調度和集群資源管理框架;

4)MapReduce:用于處理大數據集的框架,可擴展和并行;

2. HDFS數據上傳原理

1) Client端發送一個添加文件到HDFS的請求給NameNode;

2) NameNode告訴Client端如何來分發數據塊以及分發到哪里;

3) Client端把數據分為塊(block)然后把這些塊分發到DataNode中;

4) DataNode在NameNode的指導下復制這些塊,保持冗余;

可以在講解的時候,拿只筆和紙畫下:

Tips:

a. NameNode之存儲文件的元數據,而不存儲具體的數據;

b. HDFS Federation: 解決HA單點故障問題,支持NameNode水平擴展,每個NameNode對應一個NameSpace;

3. MapReduce概述

1)map和reduce任務在NodeManager節點上各自有自己的JVM;

2)所有的Mapper完成后,實時的key/value對會經過一個shuffle和sort的階段,在這個階段中所有共同的key會被合并,發送到相同的Reducer中;

3)Mapper的個數根據輸入的格式確定,Reducer的個數根據job作業的配置決定;

4)Partitioner分區器決定key/value對應該被送往哪個Reducer中;

5)Combiner合并器可以合并Mapper的輸出,這樣可以提高性能;

4. map--》shuffle、sort--》reduce

map階段:

1) InputFormat確定輸入數據應該被分為多少個分片,并且為每個分片創建一個InputSplit實例;

2) 針對每個InputSplit實例MR框架使用一個map任務來進行處理;在InputSplit中的每個KV鍵值對被傳送到Mapper的map函數進行處理;

3) map函數產生新的序列化后的KV鍵值對到一個沒有排序的內存緩沖區中;

4) 當緩沖區裝滿或者map任務完成后,在該緩沖區的KV鍵值對就會被排序同時流入到磁盤中,形成spill文件,溢出文件;

5) 當有不止一個溢出文件產生后,這些文件會全部被排序,并且合并到一個文件中;

6) 文件中排序后的KV鍵值對等待被Reducer取走;

reduce階段:

主要包括三個小階段:

1) shuffle:或者稱為fetch階段(獲取階段),在這個階段所有擁有相同鍵的記錄都被合并而且發送到同一個Reducer中;

2) sort: 和shuffle同時發生,在記錄被合并和發送的過程中,記錄會按照key進行排序;

3) reduce:針對每個鍵會進行reduce函數調用;

reduce數據流:

1) 當Mapper完成map任務后,Reducer開始獲取記錄,同時對他們進行排序并存入自己的JVM內存中的緩沖區;

2) 當一個緩沖區數據裝滿,則會流入到磁盤;

3) 當所有的Mapper完成并且Reducer獲取到所有和他相關的輸入后,該Reducer的所有記錄會被合并和排序,包括還在緩沖區中的;

4) 合并、排序完成后調用reduce方法;輸出到HDFS或者根據作業配置到其他地方;

5. YARN相關

YARN包括的組件有:ResourceManager、NodeManager、ApplicationMaster,其中ResourceManager可以分為:Scheduler、ApplicationsManager

Hadoop1.X中的JobTracker被分為兩部分:ResourceManager和ApplicationMaster,前者提供集群資源給應用,后者為應用提供運行時環境;

YARN應用生命周期:

1) 客戶端提交一個應用請求到ResourceManager;

2) ResourceManager中的ApplicationsManager在集群中尋找一個可用的、負載較小的NodeManager;

3) 被找到的NodeManager創建一個ApplicationMaster實例;

4) ApplicationMaster向ResourceManager發送一個資源請求,ResourceManager回復一個Container的列表,包括這些Container是在哪些NodeManager上啟動的信息;

***pplicationMaster在ResourceManager的指導下在每個NodeManager上啟動一個Container,Container在ApplicationMaster的控制下執行一個任務;

Tips:

a. 客戶端可以從ApplicationMaster中獲取任務信息;

b. 一個作業一個ApplicationMaster,一個Application可以有多個Container,一個NodeManager也可以有多個Container;

性能篇

性能涉及較多內容,這里參考前文中給出的鏈接,并按照作業運行、map階段、reduce階段的順序來組織性能相關的點。

1. 命令行參數:

在自定義集群的參數時,不修改集群的文件,而在命令行使用參數,這樣可以針對不同的參數設置方便,從而不必修改集群中的配置文件,一般有下面兩種方式:

1)hadoop jar ExampleJob-0.0.1.jar ExampleJob -conf my-conf.xml arg0 arg1

使用配置文件的方式,把需要修改的地方設置在配置文件里面,使用-conf指定配置文件(上面命令行來自:http://www.idryman.org/blog/2014 ... ing-best-practices/);

2)hadoop jar ExampleJob-0.0.1.jar ExampleJob -Dmapred.reduce.tasks=20 arg0

使用-D參數來這是相應的值也是可以的(上面的命令行來自:http://www.idryman.org/blog/2014 ... ing-best-practices/);

2. map階段

1) map的個數問題

map的個數是不能直接設置的,如果有很多mapper的執行時間小于1分鐘,那么建議設置mapred.min.split.size的大小,提高分片的大小,這樣來減小Mapper的個數,可以減小Mapper初始化的時間;或者設置JVM重用(圖片來自:http://www.idryman.org/blog/2014 ... ing-best-practices/)

2) 設置mapred.child.java.opts參數

使用Ganglia、Nagios等監控工具檢測slave節點的內存使用情況,設置合適的mapred.child.java.opts 參數,避免交換的發生;

3)map的輸出使用壓縮

當map的輸出較多時,可以考慮使用壓縮,這能提高很大的性能(圖片來自:http://www.idryman.org/blog/2014 ... ing-best-practices/):

4)使用合適的Writable作為key(鍵)和value(值)類型

這一點在mapper和reducer的編程中都可以使用,如果全部數據都使用Text的話,那么數據的占有空間將會很大,導致效率低下。如果有必要可以自定義Writable類型。

5)重用已有變量

在mapper或者reducer的編程中重用已經定義的變量,可以避免重復的生成新對象,而導致垃圾回收頻繁的調用,如下代碼1和2(代碼參考:http://blog.cloudera.com/blog/20 ... reduce-performance/); 

  1. public void map(...) {  
  2.     ...  
  3.     for (String word : words) {  
  4.         output.collect(new Text(word), new IntWritable(1));  
  5.     }  
  6.  
  1. class MyMapper ... {  
  2.     Text wordText = new Text();  
  3.     IntWritable one = new IntWritable(1);  
  4.     public void map(...) {  
  5.         ...  
  6.         for (String word : words) {  
  7.             wordText.set(word);  
  8.             output.collect(word, one);  
  9.         }  
  10.     }  
  11.  

6) 設置mapreduce.reduce.shuffle.parallelcopies參數

設置此參數,可以使 Reducer在一個Mapper完成后就開始獲取數據,并行化數據獲取;

7) 最小化mapper輸出:

a. 在Mapper端過濾,而不是在Reducer端過濾;

b. 使用更小的數據來存儲map輸出的key和value(參考第4)點);

c. 設置Mapper的輸出進行壓縮(參考第3)點);

3. reduce階段Reducer負載均衡:

1) Reducer的個數,根據實際集群的數量來設置Reducer的個數,使其負載均衡。比如集群有100個節點,那么Reducer的個數設置為101個則應該是不合理的,在***次任務分配時分配了100個作業,這100個作業是并行的,但是***一個作業并不是并行的。

2)Reducer中部分因為相同key的數據量大,導致個別Reducer運行耗時相比其他Reducer耗時長很多。

可以考慮:

a. 實現一個更好的hash函數繼承自Partitioner類;

b. 如果知道有大量相同的key的數據,可以寫一個預處理的作業把相同的key分到不同的輸出中,然后再使用一個MR作業來處理這個特殊的key的數據;

4. 設置輸入輸出如果有多個連續的MR作業,可以設置輸入輸出為序列文件,這樣可以達到更好的性能。

個人整理,如有錯誤,敬請指教。

分享,成長,快樂

腳踏實地,專注

【本文為51CTO專欄作者“王森豐”的原創稿件,轉載請注明出處】

責任編輯:龐桂玉 來源: 神算子
相關推薦

2010-06-04 10:01:26

Hadoop安裝

2016-10-26 08:57:13

HadoopScrapy大數據

2015-04-01 15:09:30

Hadoop大數據

2021-05-16 07:44:01

Hadoop大數據HDFS

2017-01-15 14:18:35

大數據HadoopScrapy

2013-04-12 10:56:31

大數據

2014-11-11 10:47:19

hadoop數據流

2015-09-25 10:44:02

大數據Hadoop

2013-08-20 09:26:03

大數據時代hadoop

2018-07-11 13:33:43

大數據人工智能Hadoop

2012-06-29 09:19:39

大數據

2012-05-31 14:54:59

Hadoop大數據

2013-09-23 09:27:43

Hadoop大數據

2012-03-12 10:09:50

Hadoop微軟大數據

2022-10-14 15:44:03

大數據Hadoop

2013-09-23 13:54:05

2015-04-24 11:20:15

Hadoop大數據架構大數據

2017-07-03 13:11:39

大數據Hadoop模塊介紹

2013-05-06 10:22:28

大數據Hadoop

2013-12-12 10:00:03

大數據
點贊
收藏

51CTO技術棧公眾號

久久综合社区| 欧美成人手机在线| 国内自拍欧美激情| 一级特黄a大片免费| 小h片在线观看| 亚洲精品毛片| www.66久久| 国产suv精品一区二区| 污污视频网站在线免费观看| 日韩精品成人| 一本久久a久久精品亚洲| 亚洲三区在线| 亚洲免费不卡视频| 天堂成人免费av电影一区| 精品国偷自产在线| 国产真实乱人偷精品| 日韩免费大片| 日本韩国一区二区三区| 日韩三级中文字幕| 国产福利成人在线| 欧美日韩成人免费观看| 精品一区二区三区在线| 日韩欧美国产wwwww| 在线免费视频a| 55av亚洲| 亚洲欧美综合网| 鲁鲁狠狠狠7777一区二区| 国产精品毛片久久久久久久av| 一本久久知道综合久久| 欧美成人午夜剧场免费观看| 天天躁日日躁aaaa视频| 你懂的在线观看一区二区| 日韩一级片网站| 污版视频在线观看| 奇米777日韩| 亚洲6080在线| 精品一二三四五区| 国产成人无吗| 综合网在线视频| 丝袜美腿玉足3d专区一区| 亚洲三区在线播放| 99久久婷婷国产精品综合| 亚洲1区2区3区视频| 91在线无精精品一区二区| 91av在线免费视频| 日韩激情小视频| 粉嫩久久久久久久极品| 日韩一区二区三区四区| 天天操精品视频| 精品三级在线| 在线观看91av| 国产精品久久久久久久av福利| 九九热这里有精品| 欧美日韩国产首页| 国产精品自拍视频在线| 色猫猫成人app| 欧美午夜片在线观看| 亚洲激情在线观看视频| 国产精品久久亚洲不卡| 欧美性大战久久| 污视频网站观看| 日本午夜免费一区二区| 91麻豆精品91久久久久久清纯| 视频免费1区二区三区| 粉嫩一区二区三区在线观看| 欧美一区二区三区啪啪| 中文字幕第10页| gogo人体一区| 91精品福利在线一区二区三区 | 精品无码av在线| 久久综合伊人77777麻豆最新章节| 国产午夜福利一区| 国产精品探花在线观看| 一本一道久久a久久精品逆3p| 无码人妻aⅴ一区二区三区69岛| av中文字幕一区二区| 在线观看亚洲区| 亚洲女人久久久| 国产主播精品| 国产91精品不卡视频| 无码人妻久久一区二区三区 | 一区二区三区在线视频观看58| 成年在线观看视频| 亚洲精品一区| 欧美喷潮久久久xxxxx| 性一交一黄一片| 亚洲精品蜜桃乱晃| 色偷偷偷亚洲综合网另类| 欧美成人精品一区二区免费看片 | 视频一区欧美| 久久精品精品电影网| 午夜剧场免费看| 国产不卡精品视频| 国产不卡在线视频| 在线播放日韩欧美| 久久久久久久久久久久久久久久av | 欧美性一二三区| 中文字幕人妻无码系列第三区| 18国产精品| 亚洲亚裔videos黑人hd| 国产1区2区3区4区| 亚洲一区中文| 91黄色精品| 黄色在线视频观看网站| 一区二区三区影院| 美女一区二区三区视频| 成人搞黄视频| 精品国产美女在线| 亚洲黄色激情视频| 国产成人在线网站| 少妇精品久久久久久久久久| www.8ⅹ8ⅹ羞羞漫画在线看| 国产麻豆精品在线| 亚洲国产va精品久久久不卡综合| 喜爱夜蒲2在线| 日韩大尺度黄色| 日韩欧美卡一卡二| 亚洲无人区码一码二码三码的含义| 欧美激情 亚洲a∨综合| 国产99久久久欧美黑人| 狠狠躁日日躁夜夜躁av| 国产精品久久久久一区| 99精品在线免费视频| 久久精品一级| 日韩在线免费高清视频| 天堂а√在线中文在线新版| 国产高清成人在线| 亚洲一区二三| 亚洲爱爱视频| 亚洲欧美日韩一区在线| 日本熟伦人妇xxxx| 国产成人精品亚洲日本在线桃色| 亚洲欧美久久234| 欧美黑人疯狂性受xxxxx野外| 日韩美女天天操| 久久久久久久久久97| 日韩 欧美一区二区三区| 精品国产免费一区二区三区| 性国产高清在线观看| 69精品人人人人| 四虎影视1304t| 石原莉奈一区二区三区在线观看| 国产综合第一页| 国产探花视频在线观看| 国产免费成人在线视频| 国产精品美日韩| 久久久久久国产精品一区 | 精品欧美视频| 中文字幕亚洲综合| 一级黄色在线观看| 久久老女人爱爱| 日韩欧美国产免费| 亚洲va久久久噜噜噜久久| 91av在线网站| 天堂资源中文在线| 日韩欧美精品免费在线| 一级黄色片大全| 日韩在线a电影| 亚洲福利av| 欧美日韩破处视频| 久久亚洲电影天堂| 国产福利免费视频| 亚洲国产日韩a在线播放| 无码av免费精品一区二区三区| 国产精品av久久久久久麻豆网| 99视频网站| 女人让男人操自己视频在线观看 | 99riav国产精品| 麻豆传媒一区二区| 成人不卡视频| 伦伦影院午夜日韩欧美限制| 精品久久国产视频| 五月婷婷久久综合| 国产日本欧美一区| 欧美黄色高清视频| 中文字幕在线字幕中文| 亚洲成人二区| 51精品国产人成在线观看 | 另类色图亚洲色图| 亚洲av无码乱码国产精品| 亚洲综合精品久久| 在线观看国产网站| 免费人成精品欧美精品| 四虎免费在线观看视频| 国产一区二区三区亚洲| 国产成人一区二区三区| 国产区在线看| 日韩成人av网址| 亚洲无码精品国产| 香蕉乱码成人久久天堂爱免费| 法国伦理少妇愉情| 国内成人免费视频| 男女激情无遮挡| 99精品视频在线观看免费播放| 亚洲最大激情中文字幕| 欧美xxx视频| 欧美成人午夜激情| 东凛在线观看| 亚洲成人黄色网址| 一级aaaa毛片| 一本大道av伊人久久综合| wwwav国产| 久久精品视频一区二区| 午夜诱惑痒痒网| 久久中文精品| 日韩 欧美 视频| 久久精品国产68国产精品亚洲| 国产欧美日韩综合一区在线观看 | 国产精品嫩草在线观看| 亚洲日本在线观看视频| 久久久久久久一| 精品美女在线观看视频在线观看| 国产午夜精品久久久| 国产成人精品毛片| 欧美视频完全免费看| 国产成人无码精品久在线观看| 中文字幕一区免费在线观看| 30一40一50老女人毛片| 国产丝袜视频在线播放| 亚洲第一福利一区| 人妻无码一区二区三区免费| 99re亚洲国产精品| 日韩av福利在线观看| 欧美aⅴ一区二区三区视频| 精品久久久久久久久久中文字幕| 亚洲最新av| 亚洲精品视频一区二区三区| 久久爱www成人| 成人免费看片网址| 国产精品日本一区二区三区在线| 国产成人精品视| free性m.freesex欧美| 超碰97人人做人人爱少妇| 91露出在线| 中文字幕久久久| 成人在线观看黄色| 亚洲偷欧美偷国内偷| 四虎国产精品永远| 亚洲国产精品热久久| 可以免费观看的毛片| 日韩一级黄色大片| 国产sm主人调教女m视频| 欧美精品日日鲁夜夜添| 亚洲中文字幕在线一区| 欧美日韩国产在线播放网站| 九九热最新视频| 欧美在线不卡视频| 日韩欧美国产另类| 在线观看亚洲精品视频| 亚洲午夜无码久久久久| 欧美亚洲精品一区| 在线观看一二三区| 欧美日本一道本| 国产又粗又猛又黄| 91精品国产综合久久精品性色| 国产精品国产一区二区三区四区| 欧美裸体视频| 在线观看欧美视频| a视频网址在线观看| 中国人与牲禽动交精品| 免费高清完整在线观看| 久久精品亚洲一区| 丝袜美女在线观看| 97国产精品视频| 都市激情国产精品| 国产91在线高潮白浆在线观看| 欧美aaa视频| 国产视频观看一区| 欧美日韩黄色| 精品国产_亚洲人成在线| 伊甸园亚洲一区| 亚洲国产精品一区在线观看不卡| 欧美激情777| 日本福利视频在线观看| 亚洲最黄网站| 久久午夜夜伦鲁鲁一区二区| 久久99精品久久久久久国产越南| 三级av免费看| www.在线成人| 一级在线观看视频| 亚洲免费在线观看视频| 国产亚洲欧美精品久久久www| 婷婷综合另类小说色区| 欧美另类高清videos的特点| 欧美一区二区精品| 香蕉视频成人在线| 神马久久桃色视频| av在线不卡免费| 国产精品专区一| 精品国产18久久久久久洗澡| 青青草原亚洲| 欧美视频在线观看| 男女啪啪网站视频| 国产精品一区在线观看你懂的| 亚洲免费不卡| a级片在线免费观看| 国产成人精品日本亚洲 | 欧美精品一区二区三区很污很色的| 春日野结衣av| 久久99国产乱子伦精品免费| 中文字幕人妻熟女在线| 日本一区二区不卡视频| 免费毛片一区二区三区| 欧美日韩中文字幕一区二区| 免费激情视频网站| 日韩在线视频中文字幕| 小草在线视频免费播放| ts人妖另类在线| 欧美激情电影| 日批视频在线免费看| 国产a精品视频| 人妻无码一区二区三区免费| 精品国产户外野外| www.亚洲欧美| 日韩视频免费在线| 久久人体大尺度| 国产一区二区免费电影| 亚洲九九在线| 91亚洲免费视频| 国产三级欧美三级| 日韩在线视频免费播放| 日韩亚洲欧美在线| 丝袜美腿美女被狂躁在线观看| 青青草成人在线| 国产精品玖玖玖在线资源| 小说区视频区图片区| 日本不卡一二三区黄网| 三级电影在线看| 婷婷一区二区三区| 天天av天天翘| 久久免费国产精品1| 日韩中文字幕| japanese在线播放| 极品少妇xxxx偷拍精品少妇| xxxx日本免费| 久久精品欧美一区| 天天夜碰日日摸日日澡性色av| 国产精选一区二区三区| 亚洲综合图片一区| 91亚洲国产| 亚洲午夜精品久久久久久浪潮| 久久精品亚洲一区二区| 欧美 变态 另类 人妖| 亚洲成人免费在线| 亚洲精品无amm毛片| 久久伊人免费视频| 国产精品白丝久久av网站| av不卡在线免费观看| 精品综合久久久久久8888| 69xxx免费| 欧美精品久久久久久久久老牛影院| 成a人v在线播放| 国产热re99久久6国产精品| 精品国产一区探花在线观看| 日日摸日日碰夜夜爽av | 极品蜜桃臀肥臀-x88av| 日本久久电影网| 91伦理视频在线观看| 成人写真视频福利网| 中文字幕免费一区二区| 三级黄色片免费观看| 一区二区三区久久| 黄色三级网站在线观看| 青青草国产精品一区二区| 亚洲人成精品久久久| mm1313亚洲国产精品无码试看| 国产视频一区二区在线观看| 中文字幕一区2区3区| 久久久91精品国产| 999久久久精品一区二区| 大陆极品少妇内射aaaaa| 国产日韩高清在线| 夜夜嗨av禁果av粉嫩avhd| 久久大大胆人体| 国产亚洲精品美女久久 | 国产一区中文字幕| 精品在线免费观看视频| 亚洲剧情一区二区| 久久婷婷五月综合色丁香| 久久久无码中文字幕久...| 日韩av电影天堂| 91免费福利视频| 成人福利小视频| 色婷婷av一区二区三区在线观看 | 日本福利在线| 欧美www在线| 91精品一区二区三区蜜桃| 国产一区二区三区91| 日韩欧美国产wwwww| 精品美女视频在线观看免费软件| 国产精品久久久久久一区二区| 久久久久蜜桃| 日本xxxx裸体xxxx| 欧美群妇大交群的观看方式| 国产网红在线观看| 五码日韩精品一区二区三区视频| 国产一区二区三区久久悠悠色av| 国产欧美日韩另类| 久久精品青青大伊人av| 亚洲精品进入|