精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Hadoop關于處理大量小文件的問題和解決方法

運維 系統運維 Hadoop
小文件指的是那些size比HDFS的block size(默認64M)小的多的文件。如果在HDFS中存儲小文件,那么在HDFS中肯定會含有許許多多這樣的小文件(不然就不會用hadoop了)。而HDFS的問題在于無法很有效的處理大量小文件。

小文件指的是那些size比HDFS的block size(默認64M)小的多的文件。如果在HDFS中存儲小文件,那么在HDFS中肯定會含有許許多多這樣的小文件(不然就不會用hadoop了)。而HDFS的問題在于無法很有效的處理大量小文件。

任何一個文件,目錄和block,在HDFS中都會被表示為一個object存儲在namenode的內存中,沒一個object占用150 bytes的內存空間。所以,如果有10million個文件,沒一個文件對應一個block,那么就將要消耗namenode 3G的內存來保存這些block的信息。如果規模再大一些,那么將會超出現階段計算機硬件所能滿足的極限。

不僅如此,HDFS并不是為了有效的處理大量小文件而存在的。它主要是為了流式的訪問大文件而設計的。對小文件的讀取通常會造成大量從datanode到datanode的seeks和hopping來retrieve文件,而這樣是非常的低效的一種訪問方式。

大量小文件在mapreduce中的問題

Map tasks通常是每次處理一個block的input(默認使用FileInputFormat)。如果文件非常的小,并且擁有大量的這種小文件,那么每一個map task都僅僅處理了非常小的input數據,并且會產生大量的map tasks,每一個map task都會消耗一定量的bookkeeping的資源。比較一個1GB的文件,默認block size為64M,和1Gb的文件,沒一個文件100KB,那么后者沒一個小文件使用一個map task,那么job的時間將會十倍甚至百倍慢于前者。

hadoop中有一些特性可以用來減輕這種問題:可以在一個JVM中允許task reuse,以支持在一個JVM中運行多個map task,以此來減少一些JVM的啟動消耗(通過設置mapred.job.reuse.jvm.num.tasks屬性,默認為1,-1為無限制)。另一種方法為使用MultiFileInputSplit,它可以使得一個map中能夠處理多個split。

為什么會產生大量的小文件?

至少有兩種情況下會產生大量的小文件

1.這些小文件都是一個大的邏輯文件的pieces。由于HDFS僅僅在不久前才剛剛支持對文件的append,因此以前用來向unbounde files(例如log文件)添加內容的方式都是通過將這些數據用許多chunks的方式寫入HDFS中。

2.文件本身就是很小。例如許許多多的小圖片文件。每一個圖片都是一個獨立的文件。并且沒有一種很有效的方法來將這些文件合并為一個大的文件

這兩種情況需要有不同的解決方式。對于第一種情況,文件是由許許多多的records組成的,那么可以通過件邪行的調用HDFS的sync()方法(和append方法結合使用)來解決。或者,可以通過些一個程序來專門合并這些小文件(see Nathan Marz’s post about a tool called the Consolidator which does exactly this)。

對于第二種情況,就需要某種形式的容器來通過某種方式來group這些file。hadoop提供了一些選擇:

HAR files

Hadoop Archives (HAR files)是在0.18.0版本中引入的,它的出現就是為了緩解大量小文件消耗namenode內存的問題。HAR文件是通過在HDFS上構建一個層次化的文件系統來工作。一個HAR文件是通過hadoop的archive命令來創建,而這個命令實 際上也是運行了一個MapReduce任務來將小文件打包成HAR。對于client端來說,使用HAR文件沒有任何影響。所有的原始文件都 visible && accessible(using har://URL)。但在HDFS端它內部的文件數減少了。

通過HAR來讀取一個文件并不會比直接從HDFS中讀取文件高效,而且實際上可能還會稍微低效一點,因為對每一個HAR文件的訪問都需要完成兩層index文件的讀取和文件本身數據的讀取(見上圖)。并且盡管HAR文件可以被用來作為MapReduce job的input,但是并沒有特殊的方法來使maps將HAR文件中打包的文件當作一個HDFS文件處理??梢钥紤]通過創建一種input format,利用HAR文件的優勢來提高MapReduce的效率,但是目前還沒有人作這種input format。需要注意的是:MultiFileInputSplit,即使在HADOOP-4565的改進(choose files in a split that are node local),但始終還是需要seek per small file。

Sequence Files

通常對于“the small files problem”的回應會是:使用SequenceFile。這種方法是說,使用filename作為key,并且file contents作為value。實踐中這種方式非常管用。回到10000個100KB的文件,可以寫一個程序來將這些小文件寫入到一個單獨的SequenceFile中去,然后就可以在一個streaming fashion(directly or using mapreduce)中來使用這個sequenceFile。不僅如此,SequenceFiles也是splittable的,所以mapreduce可以break them into chunks,并且分別的被獨立的處理。和HAR不同的是,這種方式還支持壓縮。block的壓縮在許多情況下都是最好的選擇,因為它將多個records壓縮到一起,而不是一個record一個壓縮。

將已有的許多小文件轉換成一個SequenceFiles可能會比較慢。但是,完全有可能通過并行的方式來創建一個一系列的SequenceFiles。(Stuart Sierra has written a very useful post about converting a tar file into a SequenceFile—tools like this are very useful)。更進一步,如果有可能最好設計自己的數據pipeline來將數據直接寫入一個SequenceFile。

責任編輯:黃丹 來源: oschina.net
相關推薦

2013-10-23 11:22:47

HadoopHadoop處理大量小

2010-06-09 09:39:42

Opensuse雙系統

2010-06-17 11:17:34

裝系統出現Grub

2010-12-27 11:00:53

Virtualbox

2010-03-08 09:29:09

Linux Debia

2019-11-21 16:26:44

Windows電腦瀏覽器

2021-01-12 11:40:12

SonarQube平臺數據項目授權

2018-04-25 07:35:07

Kubernetes節點解決方法

2011-05-16 10:53:45

2020-06-27 08:57:55

HTTP403服務器

2009-09-10 09:35:25

Linq語句

2016-11-14 10:06:04

大數據max位圖

2010-05-11 15:09:51

Unix系統

2011-05-26 11:38:23

重復頁

2011-07-14 13:41:33

緩存小文件Redis

2010-08-24 11:34:37

DIV+CSS

2025-07-25 10:22:12

2010-02-23 13:07:07

CentOS gcc

2018-08-28 08:47:09

服務器宕機方法

2017-05-04 14:37:38

Windows故障方法
點贊
收藏

51CTO技術棧公眾號

欧美日韩123| 成av人片在线观看www| 日本欧美大码aⅴ在线播放| 综合欧美国产视频二区| 伊人免费视频二| av电影在线地址| 久久久久久免费毛片精品| 国产精品日韩在线一区| 欧美成人免费看| 天天躁日日躁成人字幕aⅴ| 在线观看亚洲a| 亚洲天堂第一区| 日夜干在线视频| 麻豆精品在线观看| 亚州国产精品久久久| 国产精品国产三级国产专业不| 亚洲国产精选| 欧美色另类天堂2015| 一区二区成人国产精品 | 色操视频在线| 国产欧美综合在线观看第十页| 亚洲一区二区三区久久| 伊人中文字幕在线观看| 欧美精品入口| 在线亚洲午夜片av大片| 亚洲色偷偷色噜噜狠狠99网| 欧美亚洲黄色| 狠狠色香婷婷久久亚洲精品| 日日噜噜夜夜狠狠久久丁香五月 | 成人精品电影在线观看| 国产免费成人av| 久久免费激情视频| 欧美区国产区| 日韩中文字幕在线| 免费在线观看你懂的| 99久久婷婷国产综合精品青牛牛 | 亚洲综合色在线观看| 免费一二一二在线视频| 一区二区成人在线观看| av不卡在线免费观看| 粉嫩av一区| 99视频精品在线| 风间由美一区二区三区| www.国产黄色| 国产在线精品视频| 国产日韩精品入口| 最新国产中文字幕| 天堂成人国产精品一区| 欧洲日本亚洲国产区| 日韩av在线播放观看| 欧美日韩mv| 欧美精品在线免费观看| 久久99久久99精品免费看小说| 欧美一区二区三区激情视频 | 成人做爽爽免费视频| 国产成人精品亚洲| 秋霞电影一区二区| 国产成人亚洲综合青青| 黄色在线免费观看| 久久狠狠婷婷| 国产成人精品网站| 欧美亚洲另类小说| 日韩在线a电影| 国产精品99久久久久久久久| 91丝袜一区二区三区| 久久男女视频| 国产成人在线精品| 中文字幕av久久爽| 精品午夜久久福利影院| 亚洲精品欧美日韩| 亚洲免费不卡视频| aaa亚洲精品| 免费久久久一本精品久久区| 国产在线播放av| 国产三区在线成人av| 翔田千里亚洲一二三区| 日韩毛片久久久| 依依成人综合视频| 少妇人妻无码专区视频| www.com.cn成人| 欧洲亚洲国产日韩| 黄色一级片免费的| 国产成人一二| 亚洲毛片在线看| 精品伦精品一区二区三区视频密桃| 久久精品国产68国产精品亚洲| 久久精品国产2020观看福利| 久操免费在线视频| 亚洲欧美日韩国产一区| 国产精品久久久久久久久久99 | 国产精选在线| 欧美日韩一区二区三区四区五区| 中文字幕精品一区二区三区在线| 午夜精品在线| 亚洲欧洲国产伦综合| 黑人狂躁日本娇小| 伊人影院久久| 国产精品亚洲美女av网站| 亚洲爱爱综合网| 久久久久久久久99精品| 中文字幕第一页亚洲| 日本黄色免费在线| 欧美精品三级日韩久久| 真人bbbbbbbbb毛片| 波多野结衣一区| 久久久久久亚洲精品中文字幕| 国产一级一级国产| 国产精品中文字幕日韩精品| 精品一区二区久久久久久久网站| 香蕉视频在线免费看| 午夜精品福利一区二区三区av| 超碰在线播放91| 久久91在线| 久久久999精品免费| 亚洲av中文无码乱人伦在线视色| 国内精品久久久久影院色| 免费久久一级欧美特大黄| 看黄网站在线| 在线免费观看不卡av| 在线观看免费视频黄| 欧美aaaa视频| 日韩69视频在线观看| 亚洲精品国产精品国| 国产精品伦理在线| 麻豆av免费在线| 国产精品zjzjzj在线观看| 俺去了亚洲欧美日韩| 日本天堂网在线| 成人免费视频网站在线观看| 一区二区三区四区视频在线观看 | 国产精品 欧美在线| 欧美 日韩 综合| 亚洲一二三四区| 午夜影院免费观看视频| 999精品视频| 国产精品日韩欧美| 二人午夜免费观看在线视频| 日韩欧美在线中文字幕| 国产精品jizz| 性色av一区二区怡红| 久久免费视频1| 久久男人av资源站| 亚洲黄页网在线观看| 日本一区二区三区免费视频| 国产99久久久久| 国产av熟女一区二区三区| 日韩区欧美区| 久久久免费精品视频| 高清乱码毛片入口| 亚洲国产精品一区二区久久| 欧美图片自拍偷拍| 伊人精品成人久久综合软件| 国产伦精品一区二区三区免| 福利影院在线看| 国产婷婷色综合av蜜臀av| 国产性生活视频| 欧美国产成人在线| 四季av一区二区三区| 欧美电影一二区| 91精品免费久久久久久久久| 日本高清视频在线播放| 欧美日韩日日摸| 四季av中文字幕| 韩国午夜理伦三级不卡影院| 中文字幕99| 九九99久久精品在免费线bt| 久久精品国产一区| 一级片视频在线观看| 久久五月婷婷丁香社区| 日本999视频| 欧美亚洲高清| 国产精品影院在线观看| 最新av在线播放| 日韩一区二区三区电影在线观看| 中文字幕在线有码| 国产精品888| 中文字幕一区二区三区四区五区六区 | 91久久精品一区二区三| 国产综合精品在线| 欧美aa在线视频| 亚洲综合五月天| 91欧美日韩在线| 97热在线精品视频在线观看| 天天操天天干天天爽| 欧美午夜女人视频在线| 公肉吊粗大爽色翁浪妇视频| 韩国成人精品a∨在线观看| 欧美一级黄色录像片| 97色成人综合网站| 欧美在线观看网址综合| www免费网站在线观看| 日韩一区二区三区视频| av资源吧首页| 国产女同互慰高潮91漫画| 亚洲另类第一页| 天天超碰亚洲| 久久久久久久久久码影片| 在线观看精品| 久久久国产精品一区| 亚洲精品综合久久| 色综合天天综合网天天狠天天| 国产美女永久免费无遮挡| 国产麻豆视频一区| 日韩在线综合网| 日韩电影免费网址| 久久精品日产第一区二区三区 | 无码无遮挡又大又爽又黄的视频| 欧美在线免费看视频| 91香蕉视频在线下载| 国产一区二区主播在线| 欧美国产日韩中文字幕在线| 你懂的在线播放| 欧美一级久久久| 久青草视频在线观看| 国产精品乱子久久久久| 国产伦精品一区二区免费| 爽好多水快深点欧美视频| 中文字幕精品在线播放| 精品视频免费| 国产欧美一区二区三区不卡高清| 亚洲www啪成人一区二区| 午夜欧美不卡精品aaaaa| www.亚洲免费| 亚洲成人久久久| 97超碰人人模人人人爽人人爱| 色综合天天综合| 久久久久久天堂| 国产精品久久久久天堂| 蜜桃精品成人影片| 国产精品中文字幕一区二区三区| 国产裸体舞一区二区三区| 亚洲午夜91| 在线看成人av电影| 成人在线免费观看网站| 久久成人资源| 在线精品国产亚洲| 成人久久久久久| 最新欧美色图| 人人做人人澡人人爽欧美| 欧美一卡二卡| 久久久精品电影| 69久久精品| 色爱精品视频一区| 国模吧精品人体gogo| 亚洲激情成人网| 国产成人三级在线观看视频| 欧美xxx久久| 国产精品特级毛片一区二区三区| 日韩欧美在线观看| 四虎永久在线精品| 偷拍亚洲欧洲综合| 精品处破女学生| 亚洲久本草在线中文字幕| 欧美性生交大片| 亚洲欧美一区二区久久| 手机av在线不卡| 欧美激情一区二区三区不卡 | 亚洲精选av| 92看片淫黄大片欧美看国产片| 欧美aaaaaaaa| 国产欧美日韩精品专区| 91九色成人| 成人夜晚看av| 国产色99精品9i| 91免费看蜜桃| 日韩啪啪网站| 欧美日韩免费观看一区| 台湾佬综合网| 欧美一区二区三区四区在线观看地址| 欧美五码在线| 日本一区二区三区四区高清视频| 精品国产精品| 亚洲日本欧美在线| 91精品天堂福利在线观看| 99在线免费视频观看| 国产欧美在线| 欧美激情成人网| 蜜桃一区二区三区在线观看| 一区二区在线免费观看视频| 懂色一区二区三区免费观看| 亚洲无人区码一码二码三码| 99久久精品国产一区| 免费一级特黄3大片视频| 国产精品三级av| 波多野结衣久久久久| 一级日本不卡的影视| 成人午夜视频在线播放| 精品视频123区在线观看| 国产精品视频无码| 日韩一级黄色大片| 欧美日韩国产中文字幕在线| 在线看国产精品| av片在线观看永久免费| 欧美福利视频在线| 日本欧美一区| 亚洲a在线播放| 日韩人体视频| 亚洲v国产v| 国产精品国内免费一区二区三区| japanese在线播放| 老司机一区二区三区| 1314成人网| 91老司机福利 在线| 91动漫免费网站| 黄色一区二区在线观看| 国产成人av免费看| 亚洲欧美激情一区| bestiality新另类大全| 国语自产精品视频在线看一大j8| 自拍偷拍亚洲| 看高清中日韩色视频| 婷婷伊人综合| 婷婷激情四射五月天| 福利一区二区在线观看| 精品无码在线观看| 亚洲动漫第一页| japanese国产| 国产一区二区三区久久精品| 色女人在线视频| 国产日韩欧美视频| 国产精品一线天粉嫩av| 99热这里只有精品免费| 免费高清在线一区| 欧美特黄一区二区三区| 一卡二卡欧美日韩| 亚洲一区二区三区高清视频| 日韩精品极品视频| 91高清视频在线观看| 91精品国产综合久久香蕉最新版| 日本欧美韩国国产| 亚洲精品国产精品国自产观看| 羞羞视频在线观看欧美| 亚洲美女精品视频| 最新中文字幕一区二区三区| 在线视频你懂得| 亚洲欧美国产日韩中文字幕| 成年网站在线视频网站| 91亚洲午夜在线| 欧美69视频| 思思久久精品视频| 国产精品无人区| 亚洲视频在线观看一区二区| 亚洲男人天堂2023| 1区2区在线| 成人自拍偷拍| 欧美不卡一区| 性久久久久久久久久久久久久| 91美女蜜桃在线| 91丝袜一区二区三区| 日韩激情在线视频| 精品丝袜在线| 欧美日本亚洲| 视频一区欧美日韩| 中日韩精品一区二区三区| 午夜精品免费在线观看| 人人妻人人澡人人爽人人欧美一区 | 91成人午夜| 欧美a级黄色大片| 不卡一卡二卡三乱码免费网站| 麻豆亚洲av成人无码久久精品| 欧美日韩极品在线观看一区| 欧美美女色图| 国产精品美女在线观看| 三上亚洲一区二区| 亚洲欧美偷拍另类| 亚洲精品国产无天堂网2021| 精品人妻一区二区三区三区四区| 欧美成年人在线观看| 国产精品色呦| 男人天堂1024| 久久精品视频一区二区| 国产精品无码久久av| 久久99久久99精品免观看粉嫩| 日韩精品一区二区三区中文| 欧美精品久久久久久久自慰| 99在线热播精品免费| 中文字幕视频网站| 亚洲精品久久久久久久久久久| 中文字幕av一区二区三区佐山爱| 日韩理论片在线观看| 久久成人免费电影| 在线观看精品国产| 亚洲人成电影在线观看天堂色| 素人啪啪色综合| 激情成人开心网| 91视频在线观看免费| 黄色一区二区视频| 欧美激情网站在线观看| 女同另类激情重口| 91蝌蚪视频在线观看| 一区在线观看视频| 亚洲男人第一天堂| 欧美亚洲国产精品| 中文字幕乱码亚洲无线精品一区| 超碰人人cao| 日韩欧美主播在线| 日韩三级免费| 秋霞久久久久久一区二区| 激情小说亚洲一区| 欧产日产国产69|