精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

為啥集群小文件治理那么重要,你真的懂嗎?

大數(shù)據(jù) Hadoop
小文件對于計算的影響就是需要大量節(jié)點之間頻繁建立聯(lián)系,數(shù)據(jù)傳輸?shù)?,浪費資源,消耗時間長。其次小文件相關(guān)大量的任務初始化時間甚至比計算時間還長,造成計算資源的使用浪費,降低集群的吞吐量。?

小文件是 Hadoop 集群運維中的常見挑戰(zhàn),尤其對于大規(guī)模運行的集群來說可謂至關(guān)重要。如果處理不好,可能會導致許多并發(fā)癥。Hadoop集群本質(zhì)是為了TB,PB規(guī)模的數(shù)據(jù)存儲和計算應運而生的。為啥大數(shù)據(jù)開發(fā)都說小文件的治理重要,說HDFS 存儲小文件效率低下,比如增加namenode負載等,降低訪問效率等?究竟本質(zhì)上為什么重要?以及如何從本質(zhì)上剖析小文件,治理小文件呢?今天就帶你走進小文件的世界。

1.什么是小文件?

日常生產(chǎn)中HDFS上小文件產(chǎn)生是一個很正常的事情,有些甚至是不可避免,比如jar,xml配置文件,tmp臨時文件,流式任務等都是小文件的組成部分。當然更多的是因為集群設置不合理,造成一些意料之外的小文件產(chǎn)生。實際公司生產(chǎn)中對于小文件的大小沒有一個統(tǒng)一的定義。一般公司集群的blocksize的大小在128/256兩者居多。首先小文件大小肯定是要遠小于blocksize的文件。一般公司小文件的大小定義如1Mb,8Mb,甚至16Mb,32Mb更大。根據(jù)公司實際集群狀態(tài)定義,因為有些情況合并小文件需要消耗額外的資源。

既然剖析小文件,那么不可避免的要先剖析hdfs的存儲原理。眾多周知了,HDFS上文件的數(shù)據(jù)存儲分為namenode元數(shù)據(jù)管理和實際數(shù)據(jù)文件。hdfs上的數(shù)據(jù)文件被拆分成塊block,這些塊block在整個集群中的datanode的本地文件系統(tǒng)上存儲和復制,每個塊也維護者自己的blockmeta信息。namenode主要維護這些文件的元數(shù)據(jù)信息,具體namenode的解析參考我的其他博客。

如下一個某個文件的某個block在data上存儲的情況。


2.小文件的產(chǎn)生

1.流式數(shù)據(jù),如flume,kafak,sparkstreaming,storm,flink等,流式增量文件,小窗口文件,如幾分鐘一次等。

2.MapReduce引擎任務:如果純map任務,大量的map;如果mapreduce任務,大量的reduce;兩者都會造成大量的文件。出現(xiàn)這種情況的原因很多,果分布表的過度分區(qū),輸入大量的小文件,參數(shù)設置的不合理等,輸出沒有文件合并等。

3.spark任務過度并行化,Spark 分區(qū)越多,寫入的文件就越多。

4.文件的壓縮與存儲格式不合理;一般生產(chǎn)公司很少使用textfile這種低效的文件格式了。

使用壓縮,降低文件的大小,同時也會降低文件的總塊數(shù)。注意文件存儲格式和壓縮不合理只是加劇小文件問題,不是產(chǎn)生小文件的本質(zhì)。

3.小文件的危害

3.1小文件對namenod的影響

如下圖1,一個文件192Mb,默認blocksize=128Mb,副本個數(shù)為3,存儲為2個block。

圖1


如下圖2,同樣一個文件192Mb,默認blocksize=128Mb,副本個數(shù)為3,存儲為192個block

圖2

namenode的namespace中主要占存儲對象是文件的目錄個數(shù),文件(文件名長度)以及文件block數(shù)。根據(jù)namenode實際使用經(jīng)驗來看,一個存儲對象大概占用150字節(jié)的空間。HDFS上存儲文件占用的namenode內(nèi)存計算公式如下:

Memory=150bytes*(1個文件inode+(文件的塊數(shù)*副本個數(shù)))

如上圖1 ,一個文件192Mb,默認blocksize=128Mb,副本個數(shù)為3,存儲為2個block,需要namenode內(nèi)存=150*(1+2*3)=1050 Bytes

同理,圖2 一個文件192Mb,默認blocksize=128Mb,副本個數(shù)為3,存儲為192個block,需要namenode內(nèi)存=150 x (192 + (192 x 3)) = 115200 Bytes

尖叫總結(jié):

1 .從上面可以看出,同樣的一個文件,大小不同形態(tài)的存儲占用namenode的內(nèi)存之比相差了109倍之多。所以如果對于單namenode的集群來說,大量的小文件的會占用大量的namenode堆內(nèi)存空間,給集群的存儲造成瓶頸。有些人可能會說我們聯(lián)邦,多組namenode不就沒有這個問題了,其實不然,且往下看

2.當 NameNode 重新啟動時(雖然生產(chǎn)上這種情況很少),它必須將文件系統(tǒng)元數(shù)據(jù)fsimage從本地磁盤加載到內(nèi)存中。這意味著如果 namenode 元數(shù)據(jù)很大,重啟會更慢(以我們公司3億block,5萬多個文件對象來說,重啟一次1.5小時,期間應用不可用)其次,datanode 還通過網(wǎng)絡向 NameNode 報告塊更改;更多的塊意味著要通過網(wǎng)絡報告更多的變化,等待時間更長。

3.更多的文件,更多的block,意味著更多的讀取請求需要由 NameNode 提供服務,這將增加 RPC 隊列和處理延遲,進而導致namenode性能和響應能力下降。官方介紹說接近 40K~50K RPCs/s 人為是極高的負載。實際使用來看比這低時對于namenode來說性能都會打很大的折扣。

3.2 小文件對datanode影響

文件的block存儲是存儲在datanode本地系統(tǒng)上,底層的磁盤上,甚至不同的掛載目錄,不同的磁盤上。大量的小文件,意味著數(shù)據(jù)著尋址需要花費很多時間,尤其對于高負載的集群來說,磁盤使用率50%以上的集群,花費在尋址的時間比文件讀取寫入的時間更多。這種就違背了blocksize大小設計的初衷(實踐顯示最佳效果是:尋址時間僅占傳輸時間的1%)。這樣會造成磁盤的讀寫會很慢,擁有大量小文件會導致更多的磁盤搜索。如下磁盤延遲:

3.3小文件對計算的影響

基于HDFS文件系統(tǒng)的計算,blokc塊是最小粒度的數(shù)據(jù)處理單元。塊的多少往往影響應用程序的吞吐量。更多的文件,意味著更多的塊,以及更多的節(jié)點分布。

比如以MapReduce任務為例(hive等),在 MapReduce 中,會為每個讀取的塊生成一個單獨的 Map 任務,如果大量小文件,大量的塊,意味著著更多任務調(diào)度,任務創(chuàng)建開銷,以及更多的任務管理開銷(MapReduce 作業(yè)的 application master 是一個 Java 應用,它的主類是 MRAppMaster。它通過創(chuàng)建一定數(shù)量的bookkeeping object跟蹤作業(yè)進度來初始化作業(yè),該對象接受任務報告的進度和完成情況)。雖然可以開啟map前文件合并,但是這也需要不停地從不同節(jié)點建立連接,數(shù)據(jù)讀取,網(wǎng)絡傳輸,然后進行合并,同樣會增加消耗資源和增加計算時間,成本也很高。

同樣,如果是spark計算引擎,executor的一次讀取和處理一個分區(qū),默認情況下,每個分區(qū)是一個 HDFS 塊,如果大量的小文件,每個文件都在不同的分區(qū)中讀取,這將導致大量的任務調(diào)度開銷,同時每個 CPU 內(nèi)核的吞吐量降低。

簡單總結(jié)一下:小文件對于計算的影響就是需要大量節(jié)點之間頻繁建立聯(lián)系,數(shù)據(jù)傳輸?shù)?,浪費資源,消耗時間長。其次小文件相關(guān)大量的任務初始化時間甚至比計算時間還長,造成計算資源的使用浪費,降低集群的吞吐量。

本文轉(zhuǎn)載自微信公眾號「滌生大數(shù)據(jù)」,作者「滌生大數(shù)據(jù)」,可以通過以下二維碼關(guān)注。

轉(zhuǎn)載本文請聯(lián)系「滌生大數(shù)據(jù)」公眾號。

責任編輯:武曉燕 來源: 滌生大數(shù)據(jù)
相關(guān)推薦

2022-06-21 09:53:03

FedoraUbuntuLinux

2023-06-08 07:34:19

HDFS小文件壓縮包

2021-03-30 09:59:52

支付寶加密數(shù)據(jù)泄露

2019-11-13 23:33:16

工業(yè)物聯(lián)網(wǎng)IIOT物聯(lián)網(wǎng)

2019-07-24 10:11:51

jdkjreJava

2021-01-20 10:40:16

緩存固態(tài)硬盤SSD

2016-07-21 17:11:18

操作系統(tǒng)Windows升級

2020-09-10 14:33:18

計算機

2018-05-10 09:06:24

2019-02-01 09:38:16

2019-12-11 10:07:02

緩存架構(gòu)數(shù)據(jù)庫

2023-05-11 00:17:44

分區(qū)HiveReduce

2020-03-31 10:58:38

2025-06-17 08:35:00

2021-02-01 20:35:49

Kafka大數(shù)據(jù)數(shù)據(jù)

2019-12-18 15:11:42

數(shù)組集合數(shù)據(jù)

2021-04-12 06:00:01

MongoDB數(shù)據(jù)庫存儲

2011-06-14 10:57:31

SQL Server管理

2017-09-07 16:32:05

華為

2021-10-15 10:26:56

代碼項目Mapper
點贊
收藏

51CTO技術(shù)棧公眾號

爱情岛论坛vip永久入口| 久久久久久久久久码影片| 国语对白在线播放| 国产精品三p一区二区| 欧美日韩综合视频网址| 一区二区精品视频| 人妻va精品va欧美va| 久久综合影音| 欧美成人午夜剧场免费观看| 亚洲欧美日韩色| 日韩视频网站在线观看| 一区二区三区丝袜| 日产国产精品精品a∨| 特级西西444www高清大视频| 国产综合欧美| 中文字幕日韩高清| av黄色一级片| 国产精品日韩精品在线播放| 日韩欧美aaa| 欧美一区二区三区综合| 美丽的姑娘在线观看免费动漫| 久久精品国产精品亚洲红杏 | www日韩tube| 懂色av中文一区二区三区| 国产精品免费看久久久香蕉| 国产无遮挡又黄又爽| 亚洲精品一区二区在线看| 亚洲精品有码在线| www.啪啪.com| jizzjizzjizz欧美| 欧美一区二区三区免费观看视频| 五月婷婷深爱五月| 樱花草涩涩www在线播放| 亚洲国产精品尤物yw在线观看| 亚洲一区不卡在线| 国产美女性感在线观看懂色av| av电影在线观看一区| 99久久精品无码一区二区毛片| 免费在线不卡av| 久久福利影视| 欧美在线视频一二三| 国产无套内射又大又猛又粗又爽| 希岛爱理一区二区三区| 中文字幕综合在线| 黄色三级生活片| 国产成人精品免费视| 亚洲精品国产精品久久清纯直播| 久久久久久久久久久影视| 国产精品麻豆| 欧美一级理论性理论a| 亚洲午夜精品一区| 欧美成人黄色| 666欧美在线视频| 三日本三级少妇三级99| 四虎地址8848精品| 欧美日产国产精品| 亚洲欧美日韩精品一区| 国产亚洲欧美日韩精品一区二区三区| 在线视频国产一区| 亚洲精品性视频| 国产麻豆一区二区三区| 欧美一区二区成人6969| 国产人妖在线观看| 盗摄牛牛av影视一区二区| 亚洲国产欧美在线成人app| 中文字幕第3页| 天堂99x99es久久精品免费| 日韩精品视频在线免费观看| 人妻一区二区视频| 欧美电影免费播放| 久久777国产线看观看精品| 久久久国产精华液| 免费视频一区| 国产精品美女www| hs视频在线观看| www.激情成人| 日本欧洲国产一区二区| 日本精品在线| 亚洲线精品一区二区三区八戒| 欧美一区二区三区爽大粗免费 | 国产成人综合精品| 一区二区视频免费| 国产精品一区一区| 精品国产免费一区二区三区| 国产视频精选在线| 亚洲欧美日韩系列| 3d动漫一区二区三区| 欧美亚洲大片| 日韩三级中文字幕| 国产制服丝袜在线| 99热国内精品| 97久久精品国产| 中文字幕乱码一区二区| 国产·精品毛片| 欧美亚洲国产免费| 特级毛片在线| 色婷婷久久一区二区三区麻豆| 亚洲免费999| 天海翼精品一区二区三区| 色综久久综合桃花网| 日本熟女一区二区| 久久99国产精品久久99| 精品欧美日韩| av在线导航| 日本高清免费不卡视频| 国产欧美视频一区| 日韩www.| 欧美做受高潮电影o| 国产手机视频在线| 国产蜜臀av在线一区二区三区| 人人妻人人澡人人爽欧美一区| 欧美日韩精品一区二区三区视频| 日韩欧美另类在线| 永久免费观看片现看| 亚洲欧洲综合| 3d动漫精品啪啪一区二区三区免费| 欧美性孕妇孕交| 亚洲综合色视频| 奇米视频888| 国模吧精品视频| 68精品久久久久久欧美 | 韩国精品免费视频| 欧美午夜精品久久久久免费视| 女人天堂av在线播放| 欧美日韩国产免费一区二区| 法国空姐电影在线观看| 99精品国产99久久久久久福利| 91久久久久久国产精品| 99青草视频在线播放视| 日韩欧美在线观看| 欧美做受喷浆在线观看| 亚洲香蕉网站| 91在线观看免费| 日本免费中文字幕在线| 欧美日韩三级一区| 欧美丰满老妇熟乱xxxxyyy| 午夜在线视频一区二区区别 | 成人毛片免费看| 欧洲成人午夜免费大片| 天天操天天干天天爽| 亚洲一区二区四区蜜桃| 亚洲成人av免费观看| 希岛爱理av一区二区三区| 国产精品免费久久久| av免费观看一区二区| 精品视频一区二区三区免费| 国产欧美一区二区三区在线观看视频| 久久精品电影| 热re99久久精品国产99热| 台湾佬成人网| 亚洲桃花岛网站| 波多野结衣视频观看| 中文字幕电影一区| 日本肉体xxxx裸体xxx免费| 超碰成人久久| 成人在线小视频| av在线免费播放| 亚洲第一区在线| 欧美videossex极品| xfplay精品久久| 91福利国产成人精品播放| 日韩88av| av在线不卡一区| а√天堂中文资源在线bt| 日韩精品在线影院| 天堂网免费视频| 中文字幕五月欧美| 无码人妻丰满熟妇区毛片蜜桃精品 | 真人做人试看60分钟免费| 日本最黄一级片免费在线| 337p亚洲精品色噜噜噜| 久久久久久久久久久97| 99国产精品国产精品毛片| 我的公把我弄高潮了视频| 亚洲a级精品| 国产精品成人一区二区| 麻豆传媒免费在线观看| 日韩写真欧美这视频| 国产在线精品观看| 国产亚洲女人久久久久毛片| 不卡的在线视频| 亚洲欧洲一区| 亚洲精品一区二区三区四区五区 | 日韩一区二区免费在线观看| 久久精品这里有| 国产三级一区二区| 欧美体内she精高潮| 国产美女精品| 在线视频精品一区| 色综合久久中文| 国产自摸综合网| 麻豆mv在线看| xvideos亚洲人网站| 涩涩视频免费看| 欧美日韩国产综合视频在线观看| 久久黄色免费网站| 国产女主播一区| 中国黄色片视频| 久久精品国产亚洲高清剧情介绍 | 欧美xxx久久| 99re国产在线| 亚洲成人免费观看| www中文在线| 26uuu久久天堂性欧美| 999热精品视频| 老司机午夜精品视频| 91免费国产精品| 欧美精品尤物在线观看| 国产精品免费一区二区三区观看| 91在线亚洲| 欧美亚洲伦理www| 在线播放免费av| 一区二区国产精品视频| 蜜臀久久久久久999| 欧美精选一区二区| 久久久久久无码午夜精品直播| 亚洲综合999| 亚洲一级二级片| 国产日韩欧美麻豆| 黄色a一级视频| 成人免费毛片a| 亚洲高清视频免费| 毛片av中文字幕一区二区| 欧美黄网站在线观看| 激情综合激情| 麻豆传媒网站在线观看| 日韩中文字幕高清在线观看| 欧美日韩综合久久| 私拍精品福利视频在线一区| 国产亚洲福利社区| 都市激情亚洲| 国产 高清 精品 在线 a| 国产免费区一区二区三视频免费 | 欧美精品一区免费| 激情综合激情| 日韩伦理在线免费观看| 国产综合激情| 国产欧美日韩小视频| 你懂的国产精品永久在线| 亚洲综合视频一区| 99久久婷婷| 国产香蕉一区二区三区| 国产精品国产三级国产在线观看| 亚洲国产欧美不卡在线观看| 欧美精品久久久久久| 亚洲高清在线播放| 凹凸成人精品亚洲精品密奴| 视频在线99re| 欧美oldwomenvideos| 一本一道久久久a久久久精品91| 日韩精品电影| 一区二区三区av| 亚洲破处大片| 日韩精品一区在线视频| 99亚洲一区二区| 欧美日韩第二页| 日韩中文字幕亚洲一区二区va在线| 黄色a级片免费| 日韩电影在线一区二区三区| 特级丰满少妇一级| 国产一区二区在线视频| 99热这里只有精品2| 国产成人久久精品77777最新版本| 麻豆av免费看| 99精品一区二区| 九色porny自拍视频| 中文在线一区二区| 成人免费精品动漫网站| 一区二区三区高清| 午夜毛片在线观看| 91搞黄在线观看| 国产三级视频在线播放| 日韩一区二区免费高清| 午夜福利视频一区二区| 日韩 中文字幕| 极品尤物久久久av免费看| 免费无码毛片一区二三区| 免费视频一区| 亚洲美女爱爱视频| 粉嫩嫩av羞羞动漫久久久| 人妻丰满熟妇aⅴ无码| 欧美激情一区二区三区在线| av激情在线观看| 午夜a成v人精品| 中文字幕777| 精品免费一区二区三区| 欧美精品久久久久久久久久丰满| 最新中文字幕亚洲| 24小时免费看片在线观看| 国产成人综合一区二区三区| 天堂久久av| 日本一区二区精品| 好看的亚洲午夜视频在线| 天天天干夜夜夜操| 福利91精品一区二区三区| a天堂中文字幕| 一区二区三区在线视频观看58 | 成人美女av在线直播| 国产精品zjzjzj在线观看| 亚洲国产精品日韩| 国产欧美午夜| 污视频在线观看免费网站| 久久久午夜精品理论片中文字幕| 蜜臀久久精品久久久用户群体| 精品久久中文字幕久久av| 国产三级精品在线观看| 亚洲精品中文字| 欧美aaa免费| 91精品综合视频| 国产探花在线精品| 免费成人午夜视频| 国产伦精品一区二区三区免费迷 | 日本欧美国产在线| 网站一区二区| 免费在线观看污污视频| 老**午夜毛片一区二区三区| 国产麻豆剧传媒精品国产| 中文字幕欧美区| 国内自拍视频在线播放| 精品欧美一区二区久久| 秋霞午夜在线观看| 国产精品久久久久高潮| 无码日韩精品一区二区免费| 无码粉嫩虎白一线天在线观看| 紧缚奴在线一区二区三区| 小早川怜子久久精品中文字幕| 五月婷婷另类国产| 亚洲高清在线观看视频| 久久国产精品久久国产精品| 玖玖精品在线| 亚洲欧洲另类精品久久综合| 视频一区欧美日韩| 午夜理伦三级做爰电影| 欧美日韩美女在线| 神马午夜一区二区| 欧美精品激情blacked18| 精品久久亚洲| 糖心vlog在线免费观看| 麻豆精品国产传媒mv男同 | 亚洲精品v日韩精品| 亚洲综合网av| 色久欧美在线视频观看| www.成人在线视频| 亚洲午夜精品久久| 久久综合综合久久综合| 五月天婷婷丁香网| 欧美精品国产精品| 91网址在线观看| 不卡视频一区二区三区| 国产精品大片| 国产大学生视频| 欧美性猛交xxxx| 久青青在线观看视频国产| 国产精品jizz在线观看麻豆| 精品大片一区二区| www.超碰97.com| 亚洲精品乱码久久久久久黑人| 国产黄色一区二区| 国内精品久久久久久久久| 女仆av观看一区| 少妇人妻互换不带套| 国产精品免费久久| 99精品在线看| 国内精品视频一区| 亚洲人成网亚洲欧洲无码| 色婷婷综合久久久久中文字幕 | 久久久久成人片免费观看蜜芽| 亚洲成人久久电影| 92国产精品| 亚洲视频小说| 国产成人亚洲综合a∨婷婷| 国产视频91在线| 伊人久久免费视频| 亚洲午夜剧场| av女优在线播放| 久久久国际精品| 国产强伦人妻毛片| 亚州成人av在线| 成人vr资源| 年下总裁被打光屁股sp| 五月天激情小说综合| 国产三级视频在线播放线观看| 成人高h视频在线| 最新日韩欧美| 永久免费看片视频教学| 亚洲成人1234| 国产极品一区| 男人添女人下部高潮视频在观看| 久久久久久亚洲综合影院红桃| 国产情侣激情自拍| 7777免费精品视频| 91精品国产成人观看| 中文字幕在线播放视频| 欧美日韩一区高清| 免费h在线看| 天天操天天干天天玩| 久久青草国产手机看片福利盒子| 国产精品久久免费| 欧美孕妇性xx| 黄色欧美成人|