精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

HDFS小文件治理總結,你學會了嗎?

大數據 Hadoop
對于大量的小文件,可以使用壓縮工具將多個小文件壓縮為一個壓縮包,以減少存儲空間。例如,使用gzip或bzip2壓縮工具壓縮文件,在HDFS上存儲壓縮文件,以減少存儲空間和文件數量.

隨著大數據時代的到來,數據量不斷增長,HDFS也成為了數據存儲和處理的重要組成部分。然而,由于HDFS的設計原理和文件存儲方式,HDFS系統中存在大量的小文件,這些小文件會導致HDFS的性能下降,增加管理和維護的難度,嚴重影響數據處理效率和數據質量。因此,HDFS小文件的治理變得越來越重要。 

一、HDFS小文件的問題影響

HDFS小文件通常指文件大小小于HDFS塊(Block)大小(默認為128MB)的文件。在HDFS系統中,小文件會帶來以下問題:

1.占用過多的存儲空間:由于HDFS文件系統的特點,每個文件都會占用一個獨立的Block,因此大量的小文件會導致內存空間的浪費,增加HDFS系統的內存開銷;

2.影響數據處理效率:HDFS是為大量的數據處理而設計的,而小文件會導致數據處理效率下降,增加數據處理時間和開銷;

3.增加管理和維護難度:當HDFS系統中存在大量的小文件時,管理和維護變得更加困難,需要耗費更多的精力和時間來維護系統。

二、HDFS小文件的治理方法

針對HDFS小文件的問題,有以下幾種治理方法:

1.合并小文件:將多個小文件合并為一個大文件,減少文件數量。這種方法需要注意文件的內容和格式,以免合并后的文件無法使用或者存在數據丟失等問題;

2.壓縮文件:將多個小文件壓縮為一個壓縮包,減少存儲空間。這種方法可以使用Hadoop自帶的壓縮工具,如gzip、bzip2等;

3.刪除無用文件:刪除不再需要的小文件,釋放存儲空間;

4.設置文件過期時間:對于不再需要的文件,可以設置其過期時間,自動刪除過期文件;

5.使用SequenceFile:使用Hadoop自帶的SequenceFile格式存儲小文件,將多個小文件合并到一個SequenceFile中,以減少文件數量,提高處理效率。

3、HDFS小文件治理的實踐案例

以下是一些HDFS小文件治理的實踐案例:

1.合并小文件:對于日志文件等大量的小文件,可以使用Hadoop自帶的合并工具將多個小文件合并為一個大文件。下面是通過hive的重寫方式合并小文件,核心參數如下;

set hive.input.format = org.apache.hadoop.hive.ql.io.CombineHiveInputFormat;
set hive.merge.mapfiles = true;
set hive.merge.mapredfiles = true;
set hive.merge.smallfiles.avgsize=256000000;
set hive.merge.size.per.task=12800000;
set mapred.max.split.size=256000000;
set mapred.min.split.size=64000000;
set mapred.min.split.size.per.node=64000000;
set mapred.min.split.size.per.rack=64000000;

2.壓縮文件:對于大量的小文件,可以使用壓縮工具將多個小文件壓縮為一個壓縮包,以減少存儲空間。例如,使用gzip或bzip2壓縮工具壓縮文件,在HDFS上存儲壓縮文件,以減少存儲空間和文件數量;

3.刪除無用文件:對于不再需要的小文件,可以使用Hadoop自帶的命令hadoop fs -rm命令刪除文件,或者使用定時任務腳本定期刪除過期文件; 

4.設置文件過期時間:使用hadoop fs -touchz命令設置文件的過期時間,當文件過期后,自動刪除文件。例如,使用hadoop fs -touchz命令設置文件的過期時間為30天,當文件超過30天未被訪問時,自動刪除文件;

5.使用SequenceFile:對于大量的小文件,可以使用SequenceFile格式存儲文件,將多個小文件合并成一個SequenceFile文件。例如,使用Hadoop自帶的SequenceFile.Writer類將多個小文件寫入SequenceFile文件中,以減少存儲空間和文件數量。

4、HDFS小文件監控

HDFS的fsimage是HDFS文件系統的一個重要組成部分,記錄了HDFS文件系統的元數據信息,包括文件、目錄、權限、塊等信息。通過監控HDFS的fsimage,可以了解HDFS文件系統的整體情況,包括文件數量、文件大小、文件類型等信息,進而實現對HDFS小文件的監控和治理。

具體來說,可以通過以下步驟對HDFS小文件進行監控:

1.獲取HDFS的fsimage:使用Hadoop自帶的命令hdfs oiv -p XML -i fsimage命令獲取HDFS的fsimage文件。該命令會將HDFS的fsimage文件以XML格式輸出,包括HDFS中所有文件和目錄的元數據信息;

2.解析fsimage文件:使用Python等腳本語言解析獲取到的fsimage文件,提取其中的文件、目錄、塊等信息。可以使用Python的ElementTree模塊等工具對XML文件進行解析,提取需要的信息;

3.統計文件數量和文件大小:根據解析后的文件信息,統計HDFS中小文件的數量和大小。通常可以根據文件大小和文件數量的閾值來定義小文件,例如文件大小小于128MB或文件數量小于1000個等;

4.可視化展示:使用可視化工具,如Grafana、Kibana等將統計結果進行可視化展示,以便于對HDFS小文件的監控和管理。

5、HDFS小文件監控案例

下面是解析HDFS的fsimage文件,導入hive表進行分析得到最終結果表導入clickhouse通過grafana進行數據展示;

解析fsimage文件為txt文件:

hdfs oiv -i  fsimage_0000000192578352133 -o /data2/data/fsimage/$day/fsimage.txt -p Delimited -t /data2/data/fsimage/$day/tmp

fsimage文件重要的字段釋義:

INODE_ID:文件或目錄的唯一標識符;
NAME:文件或目錄的名稱;
PARENT_ID:父目錄的INODE_ID;
MODIFICATION_TIME:最后修改時間;
ACCESS_TIME:最后訪問時間;
BLOCK_IDS:文件的數據塊ID列表;
BLOCK_SIZE:數據塊大小;
NUM_BLOCKS:數據塊數量;
PERMISSIONS:文件或目錄的權限信息;
USER_NAME:文件或目錄所屬用戶;
GROUP_NAME:文件或目錄所屬用戶組;
SYMLINK:如果是符號鏈接,則包含符號鏈接的目標路徑;
UNDER_CONSTRUCTION:如果文件正在寫入中,則為true;
UNDER_RECOVERY:如果文件正在恢復中,則為true;
FILE_LENGTH:文件長度;
NS_QUOTA:命名空間配額;
DS_QUOTA:磁盤配額;
STORAGE_POLICY:存儲策略。

下面是基于解析后的文件映射到hive表最終處理后的數據表和最終數據樣例:

CREATE TABLE `tmp_fsimage_info_log_clean`(
  `path` string, 
  `replication` int, 
  `db` string, 
  `table_name` string, 
  `parttition_nm1` string, 
  `parttition_nm2` string, 
  `parttition_nm3` string, 
  `file_name` string, 
  `modificationtime` string, 
  `accesstime` string, 
  `preferredblocksize_mb` decimal(20,5), 
  `blockscount` int, 
  `filesize_mb` decimal(20,5), 
  `filesize_gb` decimal(20,5), 
  `username` string, 
  `groupname` string)
PARTITIONED BY ( 
  `stat_day` string COMMENT '分區時間:yyyy-mm-dd')
ROW FORMAT SERDE 
  'org.apache.hadoop.hive.ql.io.orc.OrcSerde' 
STORED AS INPUTFORMAT 
  'org.apache.hadoop.hive.ql.io.orc.OrcInputFormat' 
OUTPUTFORMAT 
  'org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat'

圖片

同步hive數據到CK的工具使用的是seatunnel,下面貼一份相關的配置文件:

env {
  spark.app.name = "hive_to_clickhouse"
  spark.executor.instances = 10
  spark.executor.cores = 4
  spark.executor.memory = "12g"
}


source {
  file {
    path = "hdfs://ds01:8020/user/hive/warehouse/paas_test.db/db_table_file_all/stat_day="${day}""   
    result_table_name = "db_table_file_all"
    format = "orc"
  }
}


transform {
 sql {
    sql = "SELECT  '"${dayStr}"' as stat_day, _col0 as db, _col1 as table_name,_col2 as sum_filesize,_col3 as count_filesize,_col4 as count_filesize_less_10,_col5 as count_filesize_less_50,_col6 as count_filesize_less_150,_col7 as count_filesize_less_250,_col8 as count_filesize_less_300,_col9 as count_filesize_less_10_diff,_col10 as count_filesize_less_50_diff,_col11  as count_filesize_less_150_diff,_col12 as count_filesize_less_250_diff,_col13 as count_filesize_less_300_diff,_col14 as table_storage_increase,_col15 as count_filesize_diff,_col16 as latest_accesstime  from db_table_file_all"
 }
}




sink {
  clickhouse {
    host = "ds03:8123"
    clickhouse.socket_timeout = 50000
    database = "fsimage_info"
    table = "db_table_file_all"
    fields = ["db","table_name","sum_filesize","count_filesize","count_filesize_less_10","count_filesize_less_50","count_filesize_less_150","count_filesize_less_250","count_filesize_less_300","count_filesize_less_10_diff","count_filesize_less_50_diff","count_filesize_less_150_diff","count_filesize_less_250_diff","count_filesize_less_300_diff","table_storage_increase","count_filesize_diff","latest_accesstime","stat_day"]
    username = ""
    password = ""
  }


}

最終展示在grafana中效果:

圖片

本文轉載自微信公眾號「滌生大數據」,作者「滌生-強哥」,可以通過以下二維碼關注。轉載本文請聯系「滌生大數據」公眾號。

責任編輯:武曉燕 來源: 滌生大數據
相關推薦

2022-12-26 07:48:04

敏捷項目

2022-10-18 17:59:46

Bootstrap源碼父類

2022-07-26 00:25:57

PandasQuery索引器

2023-01-26 00:28:45

前端測試技術

2024-01-19 08:25:38

死鎖Java通信

2023-01-10 08:43:15

定義DDD架構

2024-02-04 00:00:00

Effect數據組件

2023-07-26 13:11:21

ChatGPT平臺工具

2023-08-01 12:51:18

WebGPT機器學習模型

2024-01-02 12:05:26

Java并發編程

2022-08-09 08:25:44

Stream創建流流計算

2024-02-06 08:33:54

文件系統SSD

2023-01-30 09:01:54

圖表指南圖形化

2022-07-08 09:27:48

CSSIFC模型

2024-08-06 09:47:57

2023-10-10 11:04:11

Rust難點內存

2024-07-31 08:39:45

Git命令暫存區

2023-12-12 08:02:10

2024-05-06 00:00:00

InnoDBView隔離

2023-06-06 07:50:07

權限管理hdfsacl
點贊
收藏

51CTO技術棧公眾號

神马国产精品影院av| 国产精品日韩精品欧美在线| 久久人人爽人人| 亚洲欧美日韩色| 色是在线视频| 国产精品免费看片| 99热在线国产| 亚洲中文字幕无码爆乳av| 99tv成人| 日韩av最新在线| 一区二区三区四区毛片| 国产福利片在线观看| 亚洲国产精品国自产拍av| 97se亚洲综合在线| av首页在线观看| 欧美日韩第一区| 国产一区二区三区在线视频| 午夜性福利视频| 人人鲁人人莫人人爱精品| 亚洲天堂精品视频| 欧美h视频在线| 国产草草影院ccyycom| 亚洲欧美视频| 欧美国产日韩二区| 天堂а√在线中文在线鲁大师| 国产精品sss在线观看av| 欧美亚洲国产一区二区三区| av在线观看地址| 麻豆传媒在线观看| 国产婷婷一区二区| 国产一区二区三区高清| 国产精品视频a| 久久综合伊人| 欧美性视频精品| 久草成人在线视频| 国产精品成久久久久| 亚洲人成电影在线播放| 91传媒理伦片在线观看| 亚洲日韩中文字幕一区| 在线一区二区三区四区| 日韩欧美一区三区| 国产在线xxx| 亚洲精品成人在线| 久久精品国产精品亚洲精品色| 免费毛片在线| 91丨porny丨中文| 国产区一区二区三区| 国产哺乳奶水91在线播放| 精品一区二区三区不卡 | 午夜激情在线| 国产精品久久久久久久蜜臀| 日韩精品一区二区三区丰满| 欧美高清电影在线| xfplay精品久久| 久久99精品久久久久久久久久| 亚洲精品一区二区三区蜜桃| 国产麻豆精品在线观看| 成人网在线免费看| 精品毛片在线观看| 国产精品 日产精品 欧美精品| 成人网中文字幕| 国产又黄又爽视频| 国产一区美女在线| 91传媒免费看| www.成人精品| 成人国产亚洲欧美成人综合网| 成人免费视频网站入口| 在线播放第一页| heyzo亚洲| 国产日产欧美a一级在线| 国产精品第56页| 亚洲午夜91| 国外色69视频在线观看| 日韩精品视频免费播放| 国产精品试看| 国产精品成人一区| 亚洲综合精品在线| 精品中文字幕一区二区| 成人在线免费观看视视频| 伊人精品在线视频| 国产精品一区二区久久不卡| 国产精品av一区| 水莓100在线视频| 国产欧美精品国产国产专区| 伊人天天久久大香线蕉av色| 在线中文字幕电影| 天天亚洲美女在线视频| 五月婷婷狠狠操| 国产专区精品| 日韩精品一区二区视频| 青青草华人在线视频| 欧美激情偷拍| 日本电影一区二区三区| 免费在线看黄网址| 亚洲欧洲日本一区二区三区| 国产91精品黑色丝袜高跟鞋| 中文字幕免费高清在线观看| 国产九色精品成人porny| 国产精品乱子乱xxxx| 黄色在线免费观看大全| 国产欧美久久久久久| 日韩毛片无码永久免费看| 国产在线观看91一区二区三区 | 久久久久久久av| 亚洲第一在线播放| 精品一区二区三区在线播放 | 可以看污的网站| 一区二区三区四区高清视频| 亚洲欧美在线播放| 国产波霸爆乳一区二区| 日一区二区三区| 99re国产视频| 成年人免费在线视频| 亚洲精品成人a在线观看| 日本va中文字幕| 超碰在线一区| www日韩欧美| 天天干在线播放| 国产毛片精品视频| 日韩精品欧美一区二区三区| wwww亚洲| 欧美久久一二三四区| aaaaa级少妇高潮大片免费看| 婷婷久久综合| 国产精品国产福利国产秒拍| 天天插天天干天天操| 亚洲欧美日韩电影| 天天影视综合色| 网红女主播少妇精品视频| 欧美福利视频网站| 亚洲香蕉在线视频| 久久久精品欧美丰满| 黄色大片在线免费看| 国产精品2区| 少妇高潮久久77777| 中文在线第一页| 99久久精品国产观看| 99热这里只有精品免费| 精品国模一区二区三区欧美| 自拍偷拍亚洲一区| 国产精品自拍第一页| 国产亚洲婷婷免费| 精品国产成人av在线免| 私拍精品福利视频在线一区| 久久久亚洲影院| 乱色精品无码一区二区国产盗| 亚洲欧美日韩综合aⅴ视频| 亚洲国产成人va在线观看麻豆| 韩日一区二区三区| 国产精品第一页在线| 国产在线高清| 在线观看欧美精品| 影音先锋制服丝袜| 日韩成人一级大片| 香蕉久久夜色| 欧美男男gaygay1069| 最近2019年中文视频免费在线观看 | 国产浮力第一页| 一区二区三区免费看视频| 在线播放av中文字幕| 羞羞色午夜精品一区二区三区| 成人免费大片黄在线播放| 国产淫片在线观看| 日韩欧美在线1卡| 精品人妻在线播放| 99r精品视频| 国模杨依粉嫩蝴蝶150p| 国产一区国产二区国产三区| 国产精品视频导航| 成人福利片网站| 精品国产一区二区三区久久影院 | 国产欧美一区二区三区在线| 米奇777四色精品人人爽| 欧美一区二区三区四区五区| 欧美高清视频一区二区三区| 成人aaaa免费全部观看| 国产裸体舞一区二区三区| 俺要去色综合狠狠| 亚洲va男人天堂| 9765激情中文在线| 亚洲一区二区精品| 99精品视频在线播放免费| 亚洲一二三专区| 香蕉网在线播放| 美国欧美日韩国产在线播放| 日本福利视频网站| 香蕉视频一区二区三区| 91精品国产综合久久香蕉最新版| 一二三四区在线观看| 精品视频中文字幕| 国产又粗又黄视频| 精品久久久久久久久国产字幕| 熟女少妇内射日韩亚洲| 国产一区激情在线| 爱福利视频一区二区| 久久久久久久久久久妇女 | 亚洲97在线观看| av在线播放av| 精品国产一区二区亚洲人成毛片| 中文字幕av第一页| 亚洲成av人片在线| 日本少妇aaa| 99re热这里只有精品免费视频| 午夜激情av在线| 红桃视频国产一区| 亚洲午夜在线观看| 色愁久久久久久| 91超碰在线电影| 欧美与亚洲与日本直播| 久久全球大尺度高清视频| 在线免费看黄网站| 日韩精品亚洲精品| 国 产 黄 色 大 片| 精品视频1区2区| 亚洲免费黄色网址| 亚洲一区二区高清| 黄色录像二级片| 国产欧美日韩不卡| 亚洲黄色在线网站| 处破女av一区二区| 一级做a爱视频| 日本美女视频一区二区| 成人毛片视频网站| 亚洲天堂黄色| 日本黄xxxxxxxxx100| 久久电影院7| 日本一区二区三区视频在线播放 | 日韩精品一线二线三线| 牛牛精品成人免费视频| 91原创国产| 秋霞影院一区| 亚洲淫片在线视频| 亚洲一区有码| 国产日韩在线视频| 国产91在线播放精品| 国产精品96久久久久久又黄又硬 | 国产三级精品网站| 国产韩日精品| 国产精品高清在线| 日本综合视频| 国产精品国产三级国产aⅴ浪潮| 小早川怜子影音先锋在线观看| 久久久久久噜噜噜久久久精品| av片在线观看网站| 九九精品视频在线| 日本乱理伦在线| 欧美激情视频网址| 黄页在线观看免费| 国内外成人免费激情在线视频| 免费污视频在线| 久久久久亚洲精品| 美女扒开腿让男人桶爽久久软| 91精品国产99| 成人欧美一区二区三区的电影| 欧洲成人性视频| 欧美xoxoxo| 国产精品美乳一区二区免费 | 成人av播放| 99re8这里有精品热视频免费| av一区和二区| 欧美aaaaaaaa牛牛影院| 久久久www免费人成黑人精品| 亚洲日产av中文字幕| 欧美日韩无遮挡| 欧洲杯半决赛直播| 偷拍盗摄高潮叫床对白清晰| 中文字幕免费一区二区三区| 妞干网在线播放| 亚洲人成免费| 日本三区在线观看| 久久精品国产精品青草| 日本亚洲一区二区三区| 国产999精品久久久久久绿帽| 人妻无码中文久久久久专区| 久久久亚洲高清| 免费成人深夜夜行网站| 一区二区欧美精品| 一级做a爰片久久毛片| 欧美日韩一卡二卡| www.黄色av| 亚洲精品自拍偷拍| 日韩精品毛片| 欧美精品www| 久久sese| av一区二区三区免费| 人人网欧美视频| 一区二区免费在线观看| 亚洲精品极品| 鲁一鲁一鲁一鲁一av| 福利电影一区二区| 91视频免费在观看| 一区二区三区四区在线| 国产三级精品三级在线观看| 欧美精品1区2区3区| 污视频在线免费观看| 中文字幕av一区中文字幕天堂 | 人妻少妇精品无码专区久久| 国产亚洲精品久久久优势| 中文在线观看免费| 国产精品高潮呻吟久久av无限| 免费精品一区| 日产中文字幕在线精品一区| 国产综合网站| 中文字幕22页| 91美女片黄在线观看91美女| 国产精品白丝喷水在线观看| 日韩欧美国产高清91| 国产999久久久| 亚洲最新av在线网站| av岛国在线| 91亚洲午夜在线| 精品国产乱码| 亚洲理论电影在线观看| 久久av资源网| 91网站免费入口| 亚洲国产精品天堂| 国产精品毛片一区二区在线看舒淇 | 国产九一精品| 777av视频| 国产精品香蕉一区二区三区| 手机av在线不卡| 欧美视频国产精品| 蜜桃视频在线观看www| 久久色在线播放| 99只有精品| 蜜桃av噜噜一区二区三区| 国产精品a级| 伊人精品视频在线观看| 日本一区二区久久| 精品黑人一区二区三区| 精品小视频在线| 高清毛片在线观看| 97人人干人人| 亚洲一区二区三区| 亚洲人视频在线| 国产精品私人自拍| 男人天堂视频在线| 亚洲免费伊人电影在线观看av| 久久亚洲导航| 北条麻妃高清一区| 欧美久久九九| 苍井空张开腿实干12次| 亚洲免费电影在线| 国产成人精品毛片| 久久久成人精品| 成人豆花视频| 最新视频 - x88av| 国产一区二区免费视频| 精品国产精品国产精品| 91精品国产色综合久久不卡蜜臀 | 97超视频在线观看| 色婷婷av一区二区三区久久| 国产福利一区二区三区在线播放| 亚洲a∨一区二区三区| 另类调教123区| 五月综合色婷婷| 欧美一级在线观看| 青草影视电视剧免费播放在线观看| 成人在线视频网址| 黄色成人91| 国产精品三级在线观看无码| 91国产福利在线| av网页在线| 亚洲专区在线视频| 一区视频在线看| 97超碰在线资源| 欧美日韩国产在线观看| 二区在线播放| 国产精品制服诱惑| 香蕉视频成人在线观看| 国产黄色录像视频| 欧美一区二区视频在线观看2020 | 亚洲影视资源网| 日本免费不卡视频| 欧美一区二区.| 色婷婷综合网| 国产大尺度视频| 日韩欧美亚洲范冰冰与中字| av中文资源在线| 91精品国产综合久久久久久丝袜 | 中文字幕第38页| 亚洲日本成人在线观看| 蜜臀av在线观看| 国产精品久久久久福利| 99国内精品久久久久久久| 在线观看免费视频国产| 在线观看日韩精品| 调教一区二区| 欧美一区二区三区四区在线观看地址| 麻豆精品在线视频| 日本熟妇毛茸茸丰满| 一本久久综合亚洲鲁鲁| 51精品国产| 亚洲精品高清无码视频| 亚洲自拍偷拍麻豆| 成人在线视频成人| 国产精品免费在线| 精品一区二区免费看| 日本一区二区免费在线观看| 最近2019免费中文字幕视频三|