精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

一篇文章徹底掌握 HDFS 跨集群跨版本數據同步工具 Hadoop Distcp

開發 開發工具 Hadoop
最近有小伙伴問到 hadoop distcp 的使用,對其中的一些細節和容易踩的坑不是很清楚,所以今天我們來看下 hadoop distcp 的原理,細節和容易踩的坑。

大家好,我是明哥!

最近有小伙伴問到 hadoop distcp 的使用,對其中的一些細節和容易踩的坑不是很清楚,所以今天我們來看下 hadoop distcp 的原理,細節和容易踩的坑。

1.DistCp 概述

我們知道大數據集群內部都有節點級別和機架級別的容錯機制(存儲層對應的就是傳統的三副本或糾刪碼機制),但對于一些數據安全性要求更改的場景,比如在金融行業典型的兩地三中心場景下,經常有跨區域跨集群災備的需求,此時就會涉及到跨集群的數據同步。

DistCp (distributed copy) 就是一款跨集群的數據同步工具。

DistCp 可以用來做 hdfs 集群內部或集群之間的大規模的數據同步,由于在底層使用了 MapReduce 框架會通過多個 mapper 來拷貝需要拷貝的文件列表,其性能相比 hdfs dfs -get/put 等通過本地文件系統中轉的數據同步方案,要高效快速很多。

同時由于 DistCp 可以跨 hdfs 大版本進行數據同步,且新版本的 DistCp(distcp version 2) 相比老版本的DistCp(legacy DistCp,version 1.2.1)在很多方面都做了優化和改進,所以大規模的數據同步,不論是集群內部還是集群之間,首選的方案都是DistCp。

很多商業的hdfs數據同步方案,其底層都是原生的 DistCp,比如 cdh 的 bdr 工具,比如 tdh 的 backup工具,其原理都是如此。

2.關于集群間數據同步

  • 集群間數據同步,可以從原集群推送數據到目標集群,此時會為會占用原集群 yarn 中的資源;
  • 集群間數據同步,也可以從目標集群發起作業,主動拉取原集群的數據,此時消耗的是目標集群的YARN資源;
  • 如果原集群是生產集群,一般在目標集群執行命令hadoop distcp來發起作業,通過拉的方式來同步數據,此時不會消耗原集群即生產集群的YARN資源;
  • 當原集群和目標集群大版本不同時,(比如在 hadoop 1.x 跟 hadoop 2.x 之間同步數據),需要使用 webhdfs 協議,即通過以下格式指定遠端集群:webhdfs://:;(當然,既可以從原集群推數據,也可以從目標集群拉數據);
  • 當原集群和目標集群大版本相同時,(比如都是 hadoop 2.x或都是hadoop 3.x),推薦使用 hdfs 協議,此時性能比 webhdfs 更好;
  • 如果 webhdfs 配置了 SSL 加密,則需要使用協議 “swebhdfs://” ;

3.關于開啟了 kerberos 安全認證后的數據同步

  • 如果原集群和目標集群都啟用了kerberos認證 (hadoop.security.authentication=kerberos),需要首先做 kerberos 的 realm 互信,然后才能通過推或拉的方式執行 dictcp 進行數據同步;
  • 如果原集群與目標集群一個啟用了kerberos認證,另一個沒有啟用kerberos認證,為簡單起見,可以在啟用了kerberos認證的集群中執行distCp,通過推或拉的方式進行數據同步;

4.DistCp 的底層工作機制

新版 DistCp 底層有以下組件,其各自的職責如下:

  • DistCp Driver:負責解析 DistCp 的命令行參數,并編排協調具體的拷貝任務(首先調用 copy-listing-generator 獲得需拷貝的文件列表,然后配置并提交 Map-Reduce 拷貝任務,最后根據配置項返回 MR 任務句柄并推出,或等待 MR任務執行結束;)
  • Copy-listing generator:負責解析給定的 source-paths(目錄或文件,可以包含通配符),生成待拷貝的文件/目錄列表,并輸出到一個 SequenceFile;
  • Input-formats 和 Map-Reduce:負責讀取 Copy-listing generator 生成的 SequenceFile 中的待烤包的文件列表,并執行實際的文件拷貝;

5.DistCp 的重要參數講解

DistCp 提供了多種參數,來控制拷貝任務的各種細節,經常使用到的關鍵參數有 -update, -delete, -overwrite, -m, -bandwidth,-diff,-p,-i 等:

  • -m :控制 map 任務的最大個數;(實際的 map 任務數,不會大于待拷貝的文件的個數;更多的 map 數不一定會提升整體IO吞吐);
  • -bandwidth:控制每個 map 任務可用的最大帶寬,單位 MB;
  • -p[rbugpcaxt]:控制是否保留源文件的屬性,rbugpcaxt 分別指:replication number, block size, user, group, permission,checksum-type, acl, xattr,以及 tiemstamp;
  • skipcrccheck:控制檢查源和目標文件差異以生成待拷貝文件列表時,是否跳過 CRC 校驗;
  • update: 如果源和目標目錄下的文件,在 文件大小/塊大小/checksum 上有不同,就用;
  • -update: 拷貝目標目錄下不存在而源目錄下存在的文件,或目標目錄下和源目錄在文件大小/塊大小/checksum 上不同的文件;
  • -overwrite: 覆蓋目標目錄下的同名文件。(如果某個 map 任務執行失敗且沒有指定 -i 參數,則所有的待拷貝的文件,包括拷貝失敗的文件,都會被重新拷貝);
  • -i: 忽略拷貝過程中某些 MAP 任務的錯誤,繼續執行其余的 map拷貝任務,而不是直接失敗整個作業;(默認情況下,如果有某個 map 任務失敗的次數達到了 mapreduce.map.maxattempts,則未完成的 map 任務都會被 kill;);
  • -delete: 刪除目標目錄下存在,但源目錄下不存在的文件;該參數只能和 -update 或 -overwrite 配合使用;
  • -diff 和 -rdiff:控制是否結合使用快照機制,會基于兩個快照的差異(snapshot diff)來確定待拷貝的文件列表,以下要點需要注意:
    • -diff 和 -rdiff,需要配合選項 -update 一起使用;
    • -diff 和 -rdiff,不能和 -delete 一起使用,否則會報錯:java.lang.IllegalArgumentException: -delete and -diff/-rdiff are mutually exclusive. The -delete option will be ignored;
    • 該命令的前提條件:需要源目錄下有指定的兩個快照 from_snapshot 和 to_snapshot;
    • 該命令的前提條件:需要目標目錄下有快照 from_snapshot;
    • 該命令的前提條件:需要目標目錄在前期制作了 from_snapshot 快照后,沒有新的文件寫操作 (create, rename, delete);
    • 該命令執行完畢后,目標目錄下并不會自動創建快照 to_snapshot,如果后續還需要基于快照來做增量同步,需要手工在同步完畢后對目標目錄制作快照 to_snapshot,為后續基于快照的同步(hadoop distcp -diff -update)做好準備;

6.易踩的坑 - skipcrccheck

  • 參數 -skipcrccheck 的意思是 “Whether to skip CRC checks between source and target paths.”,即是否跳過原路徑和目標路徑下文件的 crc 校驗(CRC:Cyclic Redundancy Check)。
  • 如果指定了該參數,會跳過crc校驗,同步作業速度會快些;
  • 但指定該參數后,由于不校驗 crc,而是通過文件名和文件大小來發現哪些文件需要進行同步,在極端情況下,可能會漏掉某些需要同步的小文件,比如某些只有少數幾條記錄的小文件,從而造成數據不一致;
  • 下圖展示的就是,某兩個 hive orc 表都只有1條記錄,對應的 HDFS 文件也比較小且都是 299 BYTE, 指定參數 skipcrccheck 執行同步操作時,就遺漏了該文件,造成了源目錄與目標目錄數據的不一致:“sudo -u hdfs hadoop distcp -update -delete -skipcrccheck -pugpb hdfs://nameservice1/user/hive/warehouse/hs_liming.db/test_single_row_scp hdfs://nameservice1/user/hive/warehouse/hs_liming.db/test_single_row_scp2“:

skipcrccheck 的坑-hdfs

skipcrccheck 的坑-hive sql

7.關于 hive 的跨集群數據同步

  • 關于 hive的跨集群數據同步,hive 社區在推動 hive replication 的方案,但因為該方案的各種前提和限制,目前該方案在業界采用的比較少;
  • 市面上采用的較多的hive的跨集群數據同步,是對hive的元數據和數據分別進行數據同步;
  • 對于 hive 數據的同步,本質上就是對于底層 hdfs 數據的同步,可以采用上述hdfs的distcp方案;
  • 對于hive元數據的同步,本質上就是對底層 metastore db,如 mysql/posggresql 等rdbms中的數據的同步,可以采用成熟的 mysqldump 和 source方案。

8.常用命令總結 

  • 執行數據同步操作時,需要停止對目標目錄的其它寫操作;
  • 當沒有對原目錄的寫操作時(即停止了對源目錄的寫操作),可以使用以下命令來跨集群同步數據:hadoop distcp -delete -update -pugpb -m 10 -bandwidth 5 hdfs://xx.xx/ hdfs://yy.yy/
  • 當有對原目錄的寫操作時(即有對原目錄的并發寫操作),需要結合快照機制來同步數據:hadoop distcp -diff -update -pugpb
  • 結合快照機制來同步數據時,有以下前提要求:
    • 需要源目錄下有指定的兩個快照 from_snapshot 和 to_snapshot;
    • 需要目標目錄下有快照 from_snapshot;
    • 需要目標目錄在前期制作了 from_snapshot 快照后,沒有新的文件寫操作如 create/rename/delete (即要求目標目錄的當前狀態跟原目錄的from-snapshot一致);
    • 該命令執行完畢后,目標目錄下并不會自動創建快照 to_snapshot,如果后續還需要基于快照來做增量同步,需要手工在同步完畢后對目標目錄制作快照 to_snapshot,為后續基于快照的同步(hadoop distcp -diff -update)做好準
責任編輯:武曉燕 來源: 明哥的IT隨筆
相關推薦

2024-06-25 08:18:55

2013-04-15 10:59:08

iOS開發ARC版本說明

2020-12-31 08:14:39

VueAxiosJavaScript

2017-08-22 16:20:01

深度學習TensorFlow

2017-07-20 16:55:56

Android事件響應View源碼分析

2015-07-15 17:09:48

HiveHadoop分布式文件系統

2016-07-01 14:55:07

開源數據庫

2017-06-27 14:15:22

LinuxShellsed

2022-02-21 08:21:00

微服務數據通信數據同步

2020-10-09 08:15:11

JsBridge

2025-01-26 15:38:11

Spring事務編程式

2019-07-23 08:55:46

Base64編碼底層

2021-04-07 13:28:21

函數程序員異步

2024-05-17 10:05:06

Java機制應用

2017-08-04 15:33:33

大數據數據可視化方法

2021-11-11 12:02:17

HiveOrderSort

2017-09-05 08:52:37

Git程序員命令

2020-04-22 13:27:20

數據分析模塊解決

2021-04-09 08:40:51

網絡保險網絡安全網絡風險

2022-02-21 09:44:45

Git開源分布式
點贊
收藏

51CTO技術棧公眾號

欧美美女被草| 你懂的免费在线观看视频网站| 精品少妇av| 777午夜精品免费视频| 欧美一级黄色录像片| 国产丰满美女做爰| 国产精品久久久久久久免费软件| 亚洲天堂免费视频| 国产精品igao网网址不卡| www中文字幕在线观看| 久久久久九九视频| 91视频免费网站| 日韩精品在线观看免费| 天堂美国久久| 亚洲理论在线a中文字幕| www欧美激情| 不卡av免费观看| 亚洲欧洲日本在线| 欧美日韩亚洲在线| 精品国产伦一区二区三区| 噜噜噜91成人网| 色综合视频一区中文字幕| 国产呦小j女精品视频| 国产乱码精品一区二区三区亚洲人| 亚洲va中文字幕| 青少年xxxxx性开放hg| 日漫免费在线观看网站| 国产成人激情av| 国产免费一区二区三区香蕉精| 国内免费精品视频| 欧美日韩国产色综合一二三四| 中文字幕亚洲国产| 亚洲专区区免费| 精品素人av| 亚洲成人xxx| 中文字幕欧美视频| 欧美亚洲黄色| 欧美性欧美巨大黑白大战| 国产精品无码一区二区在线| 日本在线观看高清完整版| 国产精品久久久久一区二区三区| 免费日韩av电影| 天天干天天干天天干| 国产精品18久久久久久久久久久久| 国产免费一区视频观看免费| 国产精品露脸视频| av影视在线| 亚洲欧美一区二区视频| 日韩动漫在线观看| 免费福利在线视频| 久久这里只精品最新地址| 精品国产乱码久久久久久108| 精品黑人一区二区三区国语馆| 久久成人免费日本黄色| 国产精品免费久久久久久| 欧美日韩综合一区二区三区| 亚洲欧美视频一区二区三区| 69国产精品成人在线播放| 国产精品99无码一区二区| 欧美精品不卡| 欧美激情视频网址| 久久一二三四区| 精品91在线| 98精品国产自产在线观看| av大片免费在线观看| 99成人精品| 热门国产精品亚洲第一区在线| 天堂网av手机版| 日韩中文字幕一区二区三区| 国产精品扒开腿爽爽爽视频| 性高潮视频在线观看| 蜜桃视频一区二区三区| 成人激情视频小说免费下载| 99在线精品视频免费观看软件| 国产一区二区电影| 成人欧美视频在线| 日本高清视频免费观看| 久久这里都是精品| 天堂精品视频| www在线免费观看视频| 亚洲妇熟xx妇色黄| 久久久久久久久久久免费视频| 日韩精品麻豆| 91精品午夜视频| 免费观看污网站| 性人久久久久| 中文字幕久热精品在线视频| 天天操天天操天天操天天操天天操| 一区二区三区中文| 97免费视频在线播放| 天天干在线播放| 美女视频免费一区| 粉嫩av四季av绯色av第一区| 欧美男男激情freegay| 国产精品国产三级国产aⅴ中文| 法国空姐在线观看免费| 理论不卡电影大全神| 欧美亚日韩国产aⅴ精品中极品| www.日本久久| 亚洲日本三级| 欧美成人精品一区| 国产黄色片视频| 秋霞午夜鲁丝一区二区老狼| 99久久自偷自偷国产精品不卡| 日韩精品系列| 亚洲乱码国产乱码精品精的特点| 国产精品免费入口| 免费看一区二区三区| 日韩电影在线观看中文字幕| 亚洲国产123| 羞羞答答国产精品www一本| 91精品一区二区| 麻豆影视在线| 亚洲国产成人tv| 亚洲18在线看污www麻豆| 玖玖玖免费嫩草在线影院一区| 久久好看免费视频| 国产精品免费无遮挡无码永久视频| 99精品一区| 69久久夜色精品国产7777| 国产农村老头老太视频| 久久久亚洲精品一区二区三区| 成人小视频在线观看免费| 久久爱.com| 亚洲天堂免费视频| 日韩美女视频网站| 国产乱码精品一区二区三区五月婷 | 91精品视频网| 人人妻人人藻人人爽欧美一区| 欧美777四色影| 91免费精品国偷自产在线| 国产鲁鲁视频在线观看免费| 午夜精品久久久久| 亚洲熟妇一区二区| 亚洲激情久久| 国产免费亚洲高清| 77777影视视频在线观看| 色88888久久久久久影院野外 | 亚洲天堂手机版| 久久久精品国产免费观看同学| 精品久久一二三| 国产精品对白| 久久久免费电影| 亚洲精品久久久久久久久久久久久久| 综合自拍亚洲综合图不卡区| 亚洲综合日韩欧美| 日韩在线第七页| 国产精品永久免费| 日本成人网址| 欧美夫妻性生活| 亚洲熟女少妇一区二区| 美女爽到高潮91| 中文字幕免费高| 美女久久精品| 欧美福利视频网站| 黄色a在线观看| 性久久久久久久久久久久| 久草视频福利在线| 亚洲作爱视频| 色播五月综合| 日韩精品第二页| 免费99精品国产自在在线| 国产女人高潮时对白| 亚洲精品国产第一综合99久久 | 日本美女高潮视频| 精品国产一区二区三区久久久樱花| 国产精品mp4| 又爽又大又黄a级毛片在线视频| 亚洲国产精品精华液2区45| 国产精品亚洲a| 精品日韩免费| 亚洲qvod图片区电影| 日本一级理论片在线大全| 亚洲成色777777女色窝| 国产污污视频在线观看 | 青青国产91久久久久久| 一区二区三区在线视频111| 9999在线精品视频| 久久久久日韩精品久久久男男 | 国产精品99久久免费观看| 国产69久久精品成人看| av在线天堂| 欧美大片在线观看一区二区| 色播视频在线播放| 中文字幕高清不卡| 韩国黄色一级片| 麻豆久久精品| 懂色av粉嫩av蜜臀av| 国产精品网在线观看| 91tv亚洲精品香蕉国产一区7ujn| 成年女人的天堂在线| 欧美成人在线直播| 亚洲欧美另类在线视频| 亚洲欧美日韩系列| 国产综合香蕉五月婷在线| 日韩精品成人在线| 久久奇米777| www.亚洲自拍| 亚洲欧美日本日韩| 欧美一级免费在线观看| 91成人在线精品视频| 国产精欧美一区二区三区| av片在线观看网站| 亚洲人成在线播放| 亚洲经典一区二区三区| 91久久人澡人人添人人爽欧美| 曰本女人与公拘交酡| 久久久无码精品亚洲日韩按摩| 亚洲国产午夜精品| 天堂一区二区在线| 国产精品入口福利| 国产美女情趣调教h一区二区| 亚洲图片制服诱惑| 免费av网站观看| 欧美久久婷婷综合色| 国产美女激情视频| 一个色综合av| 永久免费看mv网站入口| 久久久久久黄色| 亚洲精品第二页| 激情综合网激情| av污在线观看| 一本久道综合久久精品| 91精品一区二区三区四区| 精品久久91| 噜噜噜噜噜久久久久久91| 在线精品视频一区| 3d动漫啪啪精品一区二区免费| 欧美暴力调教| 日本欧美国产在线| 国内激情视频在线观看| 欧美激情乱人伦一区| 成人a在线视频免费观看| 最近的2019中文字幕免费一页| 欧洲一级在线观看| 亚洲精品午夜精品| 天天操天天射天天| 亚洲精品国产精品自产a区红杏吧| 精品人妻av一区二区三区| 欧美高清激情brazzers| 夜夜躁很很躁日日躁麻豆| 欧洲国内综合视频| 久久久久久亚洲av无码专区| 日本高清无吗v一区| 青青青国产在线 | 亚洲成人激情在线观看| www.av在线.com| 日韩一区二区精品葵司在线| 国产三级小视频| 91精品在线观看入口| 国产精品一区二区免费视频| 欧美精品aⅴ在线视频| 中文字幕在线观看你懂的| 欧美又粗又大又爽| 中文字幕日韩三级| 欧美日韩国产在线观看| 亚洲午夜激情视频| 欧美一区中文字幕| 午夜精品久久久久久久99| 日韩精品一区二区三区三区免费 | 91在线免费播放| 日本xxx在线播放| 久久久精品免费免费| 手机看片日韩av| 国产精品毛片久久久久久| 四虎影院中文字幕| 亚洲中国最大av网站| 精品国产乱码一区二区| 色噜噜狠狠色综合欧洲selulu| 国产情侣小视频| 欧美疯狂性受xxxxx喷水图片| 国产视频第一页| 亚洲高清久久网| 国产黄在线播放| 久久天天躁狠狠躁夜夜爽蜜月| 污污影院在线观看| 欧美中文在线观看国产| 成人国产精品入口免费视频| 91亚洲国产成人精品性色| ccyy激情综合| 欧美精品七区| 国产精品久久久久久影院8一贰佰 国产精品久久久久久麻豆一区软件 | 蜜臀久久99精品久久久久久宅男| 日韩精品亚洲人成在线观看| 欧美亚洲国产视频| 色综合一区二区日本韩国亚洲| 成人免费视频网站| 精品国产乱码| 久久精品xxx| 人妖欧美一区二区| 色婷婷狠狠18禁久久| 久久一区二区视频| 中文字幕电影av| 欧美视频在线观看免费| 国产一区二区在线视频聊天| 亚洲国产精品字幕| av男人的天堂在线| 久久久久国产精品免费网站| 四虎4545www国产精品| 波多野结衣成人在线| re久久精品视频| 男人天堂a在线| 久久99九九99精品| 粉嫩av蜜桃av蜜臀av| 亚洲综合免费观看高清在线观看| 在线免费黄色av| 欧美tk丨vk视频| 久久99精品久久| 日韩**中文字幕毛片| 成人台湾亚洲精品一区二区| 亚洲日本精品| 性欧美lx╳lx╳| 日韩精品第1页| 日本成人在线电影网| 亚洲 欧美 日韩在线| 日韩理论片网站| 国产午夜无码视频在线观看| 精品国产免费人成在线观看| 久草中文在线观看| 国产精品69av| 天美av一区二区三区久久| 日本大胆人体视频| 捆绑调教美女网站视频一区| 粉嫩老牛aⅴ一区二区三区| 国产女片a归国片aa| 欧美少妇一区二区| 亚洲av综合色区无码一二三区| 在线视频欧美日韩精品| 日韩大片免费观看| 91亚洲人电影| 久久一区二区三区电影| 亚洲国产精品久久久久爰色欲| 成人免费视频播放| 国产免费无码一区二区视频| 制服丝袜国产精品| 在线免费观看黄| 国产精品福利在线观看| 亚洲小说图片视频| 国产主播在线看| www久久精品| 国产高清中文字幕| 亚洲男人天堂2019| 日本不卡网站| 久久亚洲精品欧美| 性色一区二区| 高潮毛片无遮挡| 色狠狠色狠狠综合| 狠狠v欧美ⅴ日韩v亚洲v大胸| 国产成人精品网站| 欧美精品久久久久久| 亚洲精品一二三四五区| 日本一区二区三区视频视频| 中文字幕一区二区人妻| 最近2019中文字幕大全第二页 | 欧美精品电影| 成人a免费视频| 中文字幕免费一区二区| 中文字幕avav| 亚洲午夜精品久久久久久久久| 亚洲av色香蕉一区二区三区| 久久久久久久久久av| 美女午夜精品| 国模杨依粉嫩蝴蝶150p| 欧美经典一区二区| 国产女人高潮毛片| 久久久久国产一区二区三区| 国产精品高潮粉嫩av| 亚洲都市激情| 久久久极品av| 日韩五码电影| 欧美黑人在线观看| av动漫一区二区| 手机av免费观看| 久久精品国产2020观看福利| 欧洲大片精品免费永久看nba| 黄色一级片黄色| 91麻豆国产福利在线观看| 波多野结衣视频在线观看| 久久精彩免费视频| av综合网址| 精品久久久噜噜噜噜久久图片| 日韩一区欧美小说| 亚洲AV无码一区二区三区性| 免费看黄裸体一级大秀欧美| 岛国大片在线播放| 久久久99免费| 国产乱淫av片免费| 777午夜精品福利在线观看| 欧美日韩一区二区三区不卡视频| 久草在在线视频| 亚洲精品中文在线观看| 日韩二区三区| 国产在线精品播放| 亚洲精品在线二区| jizz日本在线播放| 亚洲第一av网| 99re8精品视频在线观看| 欧美精品一区免费| 亚洲色大成网站www久久九九| 性感美女一级片|