精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

百 PB 級 Hadoop 集群存儲空間治理

存儲 存儲軟件 Hadoop
現在這個世道,隨便什么公司什么人都張嘴閉嘴大數據,連做個幾十人的問卷都敢叫大數據調查分析。真是無知者無畏。

 [[263768]]

現在這個世道,隨便什么公司什么人都張嘴閉嘴大數據,連做個幾十人的問卷都敢叫大數據調查分析。真是無知者無畏。

但也真有不少公司是真的有足夠大的數據量的,也確實是在用心做大數據。這些公司通常規模不小,但盈利不一定理想。就算能穩定盈利,也一定有不小的成本壓力。因為,大數據,如果真的夠大,是真的很費錢。

以我所在的公司為例,每年的服務器采購成本就已經好幾千萬,眼看奔著8位數去了。

因此我們有很強的節省成本的動力。

另一方面,之前我在思考作為公共部門和基礎設施部門,在不做業務不賺錢的情況下,怎么體現自己的價值。其中很重要的一點就是,省錢就是賺錢呀,體現在公司收支上效果是差不多的。

在計算資源可復用、可靈活調度的情況下,存儲空間往往是帶來成本的最重要的原因。這篇文章就簡單梳理下這幾年我們在數十 PB 到百 PB 級別數據量下對存儲空間做的一些治理工作。

1、降低備份數

大家都知道 HDFS 是靠著 3 副本來保證數據的高可用的。但也正是這 3 副本帶來了 3 倍的成本。那要降低成本很自然的就想到降低副本數。

這個辦法看起來很笨也很 low,不過確實能解決問題。當然考慮到會犧牲一定高可用性的風險,確實也不是個普適性的辦法。

我們把這個辦法用在臨時文件上,或者說是線上業務不會直接用到的數據上。就算真的丟了,也不會直接影響到業務。要么確實沒用,丟了就丟了,要么能從其他數據恢復過來。

由于我們對 Hive 庫做了比較嚴格的權限管理,但又為了給大家留一定的靈活空間來開發調試和做實驗,非線上的業務都被趕到了 tmp 庫。雖然我們設定了定時刪除的策略,但 tmp 庫的存儲開銷仍然穩定在一個比較高的水平。

于是我們寫了這么個腳本,定時遍歷去把 tmp 庫的文件副本數設為 2。這樣就把 tmp 庫的存儲消耗降低了 1/3。這可就是幾百萬的 RMB。

當然也考慮過修改 Hadoop 的源碼,自動在分配 block 的時候就去把這個事做了,而不是事后再去改副本數。簡單討論了下,覺得一個小腳本就能解決的問題,事后再做代價也不大,沒必要去侵入代碼增加復雜性。

另外值得一提的是,在節點數足夠多而網絡帶寬也足夠大的情況下,如果存儲壓力實在大,其實可以考慮把更多的數據設置為 2 副本。因為即使有一臺機器掛了,也能很快從其他機器上通過網絡補回 2 副本。當然風險也是有的,如果運氣差到家了,2 個副本所在的機器同時都報廢了,那就真丟數據了。

2、壓縮

除了刪數據和減少副本外,另一個很容易想到的辦法就是壓縮。

 

上面的圖列出了 Hadoop 最常見的幾種壓縮格式。其中 native 決定了對單個文件的處理性能,畢竟 Java 在這種計算密集型的活上還是比不過 C 系列的。而 splitable 決定了一個文件是否可切分給多個 mapper 處理,也就是文件是否能被并行處理,同樣也會對性能造成很大影響。

所以從定性的角度考慮,單看性能,lzo 和 bzip2 似乎是***。

但性能到底怎么樣,還得看實際的性能測試結果,由于時間實在太久,一時找不到當時的數據。從網上找了個 benchmark 看看。不要糾結絕對數字,只要知道相對差距就行。

 

很明顯,bzip2 壓縮和解壓速率實在太慢了,差了數量級了,***個被淘汰。

剩下3個,gzip 壓縮比***,也就是最省空間,但處理速率相對慢些,但也不至于像 bzip2 那么夸張。lzo 和 snappy 無論壓縮比還是處理速度,都很不錯,再考慮到 splitable,似乎 lzo 應該是***。

但實際上,lzo 有個不可忽視的特性。lzo 的 splitable 是需要額外的索引文件來支持的,每個文件都需要有一個同名的索引文件。并且這個索引文件需要單獨去生成。這還不算,索引文件會導致實際文件數多出一倍,這對于大規模集群的 NameNode 會造成巨大的壓力。

綜合上面這些情況,實際生產環境,我們采用的是這樣的方式:

  • 原始日志采集落地的時候使用 snappy 壓縮,兼顧存儲空間和處理速度
  • 周期性的對清洗完的日志文件做 archive,并把 snappy 文件轉換為 gzip,以節省空間
  • 對結構化的數據,主要是 Hive 表,采用 parquet+gzip 的方式,gzip 節省空間,而相對于 snappy 的性能劣勢,則由 parquet 的性能優勢來彌補

這樣,就能在存儲空間和性能之間找到比較好的平衡。

3、冷熱分層

在存儲領域有個很流行的詞,叫異構存儲(heterogeneous storage),大白話講就是不同類型的存儲放在一個系統里,比如 RAM、SSD、DISK 等等。不少類似 Spark 這樣的框架都對異構存儲做了廣泛的支持。

異構存儲通常用來解決訪問性能問題,這很容易理解,不同的存儲介質訪問速度普遍差了數量級。但同時,空間大小和成本也差了數量級,因此也能被用來節省成本。

HDFS 定義了兩個概念來支持異構存儲。

***個概念,Storage Type,用來表示不同類型的存儲,包括:

  • ARCHIVE,其實就是更大更便宜的硬盤,花同樣多的 RMB 能存下更多的數據。我們生產環境單臺 128 TB。
  • DISK,常見的普通硬盤,我們生產環境單臺空間 48TB。
  • SSD,常見的固態硬盤。
  • RAM_DISK,其實就是內存,一般不會這么奢侈。

很顯然,從上到下越來越快但也越來越貴。

第二個概念,Storage Policy,用來表示不同的存儲策略,可以對應數據的冷熱程度,也就是使用頻次。包括:

  • Hot,熱數據,經常被訪問到的數據,所有副本都保存到 DISK
  • Cold,冷數據,很少訪問的數據,所有副本都保存到 ARCHIVE
  • Warm,溫數據,介于冷熱之間的數據,一個副本保存在 DISK,其他全部在 ARCHIVE
  • All_SSD,沒有冷熱對應,所有副本保存在 SSD
  • One_SSD,沒有冷熱對應,一個副本保存在 SSD,其他都在 DISK

不同版本對以上兩個概念的支持可能略有差異。既然是要節省成本,那 SSD 自然就排除掉,離線大數據處理的場景也確實不太有需要 SSD 的情況。

通常按這個思路去劃分數據冷熱,然后設置 Storage Policy 做就能解決大部分問題了。至于怎樣定義和衡量數據冷熱,就又是一個可以另開一篇的話題了。簡單提點思路,可以按照數據時間和訪問次數兩個維度去劃分區間,從 HDFS 審計日志統計結果。

除了社區的默認支持外,我們在 hot warm cold 的基礎上,又加了一層 frozen 層,用來保存最冷的數據。

考慮到 ARCHIVE 已經是***的存儲介質了,具體 frozen 的效果并沒有也沒辦法再在 Storage Type 上做文章。我們把目光轉移到了***節提到的降低備份數上。

當然不能是簡單的設置 repica,不然這部分就直接放***節講了。我們使用的是 HDFS 的糾刪碼(erasure code)。

通俗點說就是 HDFS 上的 RAID。RAID 這個思路其實早就被 Facebook 和騰訊這樣的公司在生產環境大規模實踐過,畢竟他們肯定是***遇到也最有動力解決存儲成本問題的公司。可惜要么版本古老不再更新維護,要么閉源沒有回饋社區。

好在 Hadoop 3.0 正式支持了這個功能。當然,缺點也是有的。首先,代碼穩定性有待考驗,畢竟業界還沒有大規模的 3.0 踩坑經驗;其次,CDH 目前還沒有發布 Hadoop 3.0 的正式版,因此部署維護就沒那么方便和統一了。

所以,只有真的非常老和很長時間都不用的數據才適合設置為 frozen 放在啟用了糾刪碼的 3.0 集群上。

按我們生產環境 archive 機器成本占 disk 機器大概 1/3 算,分層存儲的空間和成本開銷對比如下:

看到這個表格,相信大家都有足夠的動力去做分層存儲了。

4、大存儲機器

但是,最近幾年,有個說法開始逐漸顛覆大家的傳統認知。

說沒有必要再分 DISK、ARCHIVE 兩種機型,直接全部上大存儲機器。

考慮到隨著萬兆網卡的普及,再加上網卡綁定、交換機性能的提升等,網絡 IO 已經不再是瓶頸。

同時考慮到數據規模,DISK/Memory 比也沒有意義,因此也不用顧及計算資源相對少的問題。更何況還有相當數量的冷數據躺在哪里,根本不需要為它們預留計算資源。

看起來很有道理,也值得一試。后面稍稍沒那么忙了,我們會集中測試對比下性能。大家有經驗的可以留言一起探討下。

主要內容就是這樣,其他零散的治理方法就略過了。

隨著數據量的增長,元數據也會急劇膨脹,很快 NameNode 就會成為集群的瓶頸。解決方法是 HDFS Federation,我們在生產環境已經有了不錯的實踐。但這又是一個復雜的話題了,下次有機會單獨開一篇再細說。

責任編輯:武曉燕 來源: 漫談大數據
相關推薦

2022-03-11 09:47:17

Google手機空間應用歸檔

2013-05-29 10:07:34

大數據存儲技術

2017-12-04 08:37:31

存儲空間NAS

2018-06-27 14:40:50

Windows 10Windows存儲空間

2015-12-15 15:38:57

Windows 10存儲空間微軟

2013-03-04 09:55:18

大數據存儲

2012-11-06 09:31:12

2021-09-18 10:48:29

手機內存微信

2022-03-16 12:49:28

IT數據存儲

2018-08-15 15:50:03

Windows 10存儲空間應用程序

2020-08-06 14:36:24

Elasticsear集群運維

2018-03-08 11:10:33

分布式存儲Ceph

2025-09-10 07:57:44

SpringBootMinio存儲

2021-05-19 07:59:35

VDO存儲Centos8

2020-04-27 14:17:00

iPhone SE蘋果存儲

2014-05-22 09:56:36

初志科技云存儲

2010-01-22 16:55:52

C++編譯器

2021-04-21 08:15:47

Android 12自動休眠安卓

2023-09-11 06:23:42

谷歌Android

2020-09-07 14:08:36

Windows 10存儲空間硬盤
點贊
收藏

51CTO技術棧公眾號

精品久久一区二区三区| 国产欧美精品在线观看| 91超碰中文字幕久久精品| 国产精品密蕾丝袜| 国产精品毛片无码| 岛国av午夜精品| 综合视频在线观看| 偷拍自拍在线| 久久国产精品99精品国产| 欧美极品在线播放| gv天堂gv无码男同在线观看| 亚洲国产中文在线二区三区免| 天天影视涩香欲综合网| 自拍偷拍一区二区三区| 色就是色亚洲色图| 国产一区二区精品久久99| 91国产美女视频| 日韩精品123区| 亚洲人成网站77777在线观看| 欧美精品v日韩精品v韩国精品v| 怡红院av亚洲一区二区三区h| 免费网站免费进入在线| 久久久综合视频| 国产91精品一区二区绿帽| 中文字幕久久久久| 国产精品人人爽人人做我的可爱| 久久av中文字幕| 中文字幕有码在线播放| 国内精品偷拍| 日韩亚洲电影在线| 国产一伦一伦一伦| 欧美黄色三级| 精品露脸国产偷人在视频| 欧美日韩dvd| 精品美女在线观看视频在线观看| 久久久久久久久一| 精品在线视频一区二区| 刘玥91精选国产在线观看| 国产一区二区网址| 成人在线精品视频| 成人免费一级片| 天堂va蜜桃一区二区三区漫画版| 久久久久五月天| 毛片a片免费观看| 亚洲国产成人精品女人| 中文字幕亚洲欧美在线| 久久av无码精品人妻系列试探| 风间由美性色一区二区三区四区 | 妞干网在线免费视频| 丁香影院在线| 亚洲国产视频在线| 欧美在线观看视频免费| 丝袜综合欧美| 亚洲自拍偷拍九九九| 国产精品videossex国产高清| 久久日韩视频| 亚洲精品成人悠悠色影视| 欧美a级黄色大片| 18videosex性欧美麻豆| 一区二区免费看| 久久综合久久久久| www.51av欧美视频| 欧美性猛交xxxx乱大交| 日韩在线xxx| 亚洲第一会所001| 欧美日韩免费不卡视频一区二区三区 | 久久天堂电影| 国产午夜精品理论片a级大结局| 欧美日韩一区综合| 在线观看免费黄视频| 国产精品国产成人国产三级| 日韩视频一二三| av人人综合网| 色狠狠av一区二区三区| 亚洲少妇久久久| 国产一区二区三区黄网站| 精品久久国产老人久久综合| 大乳护士喂奶hd| 国产尤物久久久| 久久精品91久久香蕉加勒比| 青娱乐国产在线| 国产情侣一区| 成人av资源在线播放| 北条麻妃一二三区| 久久尤物电影视频在线观看| 亚洲国产精品久久久久婷婷老年| v天堂福利视频在线观看| 性欧美大战久久久久久久久| 无码人妻精品一区二区三区66| 青青国产精品| 亚洲成人av在线| 欧美a在线播放| 欧美日韩午夜| 国产精品91免费在线| av免费观看网址| www国产成人| 波多野结衣三级在线| 黄色在线免费观看网站| 欧美日韩日日骚| 水蜜桃av无码| 99久久激情| 2020欧美日韩在线视频| 99草在线视频| 久久久久久久久久电影| 亚洲色婷婷久久精品av蜜桃| 欧美香蕉视频| 精品毛片乱码1区2区3区| 丁香激情五月少妇| 99综合精品| 亚洲最大福利视频网站| 国产天堂在线| 午夜精品福利一区二区三区av| 日韩爱爱小视频| 日韩高清一级| 欧美激情18p| 一本色道久久综合亚洲| 久久综合av免费| 国产综合中文字幕| 免费精品一区| 色婷婷综合久久久久中文字幕1| 国产在线观看99| 激情综合色综合久久| 欧美日韩三区四区| 136福利第一导航国产在线| 91精品国产综合久久久久久久久久| 波多野结衣办公室33分钟| 国内综合精品午夜久久资源| 96精品久久久久中文字幕| 成人精品一区二区| 欧美性色视频在线| 国产一线在线观看| 激情婷婷久久| 99中文字幕| 香蕉久久aⅴ一区二区三区| 欧美日韩国产经典色站一区二区三区 | 国产欧美熟妇另类久久久| 国产日韩欧美不卡在线| 日韩在线xxx| 欧美日韩播放| 国产精品观看在线亚洲人成网| 天堂在线中文资源| 精品国产91久久久久久| 免费成人蒂法网站| 亚洲一区二区成人| 欧美精品v日韩精品v国产精品| 手机在线观看av| 日韩成人免费视频| 少妇高潮av久久久久久| 久久综合999| 国产又大又黄又粗的视频| 精品视频99| 国产欧美日韩精品丝袜高跟鞋| 丁香婷婷在线观看| 91高清在线观看| jizz日本在线播放| 九一九一国产精品| 警花观音坐莲激情销魂小说| 成人av在线播放| 欧美成在线观看| 精品人妻午夜一区二区三区四区 | 亚洲欧美日韩小说| 色婷婷一区二区三区在线观看| 一个色综合网| 国产精品一区二区你懂得| 一区二区三区短视频| 亚洲美女又黄又爽在线观看| 国产又粗又猛又黄视频| 国产精品国产三级国产三级人妇| 一级 黄 色 片一| 亚洲国产高清一区二区三区| 久久久久网址| 91亚洲精品| 欧美成人午夜激情视频| 天天操天天干天天爱| 色噜噜狠狠成人中文综合| 青青操在线播放| 国产成人aaa| 97成人在线观看视频| 日韩成人激情| 国产精品白丝jk白祙| 成人性生活视频| 久久手机免费视频| 三级视频在线看| 欧美日韩一区 二区 三区 久久精品| 顶臀精品视频www| 99精品偷自拍| 天天综合网久久| 亚洲三级视频| 中文字幕欧美人与畜| 红杏一区二区三区| 91精品久久久久久久久中文字幕| 七七久久电影网| 在线观看日韩av| 色wwwwww| 制服丝袜日韩国产| 亚洲 欧美 中文字幕| 亚洲精品成人悠悠色影视| 欧美大波大乳巨大乳| 丁香天五香天堂综合| 天天干天天操天天玩| 一区二区三区成人精品| 在线码字幕一区| 色愁久久久久久| 亚洲一区二区免费| 成人国产网站| 51色欧美片视频在线观看| av免费看在线| 在线日韩精品视频| 色资源在线观看| 精品国产欧美一区二区| 一级黄色片在线播放| 欧美午夜精品久久久久久人妖| 黄视频网站免费看| 国产精品美女久久久久av爽李琼| www.17c.com喷水少妇| 国产一区二区中文字幕| 一区二区三区 欧美| 国产精品婷婷| 欧美乱大交xxxxx潮喷l头像| 亚洲国产精品成人| 一区不卡字幕| 国产一区二区区别| 免费看成人午夜电影| 北条麻妃一区二区三区在线| 亚洲一区二区免费| 国产精品国产亚洲精品| 国产日韩av在线| 国产毛片精品久久| 国产精品日韩av| 色豆豆成人网| 国产www精品| 伊人久久综合一区二区| 欧美一级视频免费在线观看| 91超碰在线免费| 久久免费视频在线| xxxx另类黑人| 久久久久久久久久久久av| 色a资源在线| 欧美丰满少妇xxxxx做受| 先锋成人av| 久久久久久伊人| av在线不卡免费| 97精品国产97久久久久久免费 | 亚洲综合精品一区二区| 国产精品亚洲成在人线| 成人福利网站在线观看11| 国产成人久久精品麻豆二区| 国产精品男人的天堂| 粉嫩av一区二区三区四区五区| 国产精品露脸自拍| 福利精品一区| 成人福利网站在线观看11| 九九99久久精品在免费线bt| 3d蒂法精品啪啪一区二区免费| 国内精品视频| 国产精品swag| 亚洲精品合集| 亚洲国产精品www| 91精品国产成人观看| 91视频 - 88av| 亚洲精品九九| 国产自偷自偷免费一区| 久久爱www久久做| 亚洲精品一二三四| 99国内精品久久| 日本乱子伦xxxx| 亚洲欧洲日韩女同| 久久婷婷综合国产| 懂色av影视一区二区三区| 波多野结衣毛片| 91.麻豆视频| 欧美一区二区公司| 亚洲全黄一级网站| 国产在线高清视频| 91高清视频在线免费观看| 素人一区二区三区| 91久久国产综合久久蜜月精品| 高潮按摩久久久久久av免费| 欧美一区二区三区电影在线观看 | 成人免费视频在线观看| 国产性猛交普通话对白| 欧美性猛交xxxx免费看久久久| 自拍偷拍校园春色| 制服丝袜亚洲精品中文字幕| 亚洲欧美日韩免费| 日韩中文字幕在线视频| 黄色18在线观看| 91精品久久久久久综合乱菊 | 日韩国产精品亚洲а∨天堂免| av在线播放av| 国模精品视频一区二区三区| 99re久久| 国产精品国产精品国产专区蜜臀ah | 91tv亚洲精品香蕉国产一区| 亚洲自拍偷拍福利| 精品一区免费| 污污污污污污www网站免费| 翔田千里一区二区| 中文字幕第10页| 日本一区二区三区免费乱视频| 久久国产精品波多野结衣| 欧美在线观看视频在线| 男人天堂一区二区| 久久人人爽人人爽人人片亚洲 | 欧洲国产伦久久久久久久| 99er热精品视频| 中文字幕欧美日韩精品| 草草视频在线观看| 147欧美人体大胆444| 日韩精品91| 黄色片一级视频| 丁香激情综合五月| chinese全程对白| 欧美性三三影院| 青青九九免费视频在线| 精品少妇v888av| 香蕉久久一区| 亚洲欧美日韩另类精品一区二区三区| 亚洲国产电影| 成年女人免费视频| 一区二区三区四区中文字幕| 亚洲熟妇无码久久精品| 在线免费看av不卡| 午夜激情成人网| 欧美二区在线| 国产精品一国产精品k频道56| 亚洲欧洲日韩综合| 亚洲少妇屁股交4| 一区二区三区黄色片| 中文字幕无线精品亚洲乱码一区| 唐人社导航福利精品| 欧美不卡三区| 免费在线播放第一区高清av| yy6080午夜| 精品久久久久国产| 五月婷婷深深爱| 国内精品久久久| 久久超级碰碰| 自慰无码一区二区三区| 91免费版在线| 99精品在线播放| 亚洲无限av看| 久久麻豆视频| 在线国产伦理一区| 国产一区二区在线观看视频| 国产女人18水真多毛片18精品| 91 com成人网| 污污视频在线| 精品伦精品一区二区三区视频| 伊人天天综合| 亚洲熟妇无码av| 在线影院国内精品| 日本精品一区二区三区在线播放| 国产在线精品成人一区二区三区| 91视频综合| 免费黄色在线播放| 午夜精品福利久久久| 欧美色视频免费| 国产剧情久久久久久| 亚洲国产日韩欧美在线| 成年女人免费视频| 欧美性极品xxxx做受| yiren22综合网成人| 91九色国产在线| 亚洲激情视频| xxxxx在线观看| 91精品欧美福利在线观看| 成人av影院在线观看| 裸体丰满少妇做受久久99精品| 日韩电影免费一区| 免费成人深夜夜行网站| 亚洲第一网站免费视频| 黄色成人免费网| 国产精品av免费| 99国产精品久久久| 亚洲怡红院av| 欧美高清在线视频观看不卡| 人人香蕉久久| 国产3p在线播放| 精品国产电影一区| 在线免费av网站| 国产一区在线免费| 麻豆国产精品777777在线| 国产一级一片免费播放| 亚洲网站在线播放| 99re8这里有精品热视频8在线| 国模杨依粉嫩蝴蝶150p| 亚洲欧美日韩在线不卡| 婷婷婷国产在线视频| 91精品国产综合久久男男| 日韩一级在线| 黄色录像免费观看| 亚洲男女自偷自拍图片另类| 国产亚洲字幕| 日韩精品一区二区三区色欲av| 最近日韩中文字幕| 日本电影一区二区在线观看| 成人日韩av在线| 久久精品伊人| 国产一级片免费|