精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

如何根據數據冷熱程度分層存儲,讓HDFS更高效?

存儲
隨著大數據技術相關技術的發展和普及,越來越多的公司開始使用基于開源Hadoop的平臺系統,同時,越來越多的業務和應用也在從傳統的技術架構遷移到大數據平臺上。在典型的Hadoop大數據平臺中,人們使用HDFS作為存儲服務的核心。

主題簡介:

HDFS優化存儲功能講解

SSM系統架構設計

SSM系統應用場景分析

一、背景

隨著大數據技術相關技術的發展和普及,越來越多的公司開始使用基于開源Hadoop的平臺系統,同時,越來越多的業務和應用也在從傳統的技術架構遷移到大數據平臺上。在典型的Hadoop大數據平臺中,人們使用HDFS作為存儲服務的核心。

而在大數據發展之初,最主要的應用場景仍然是離線批處理場景,對存儲的需求追求的是吞吐量,HDFS正是針對這樣的場景而設計的,而隨著技術不斷的發展,越來越多的場景會對存儲提出新的需求,HDFS也面臨著新的挑戰。主要包括幾個方面:

[[208366]]

1、數據量問題

一方面隨著業務的增長和新的應用接入,會給HDFS帶來更多的數據,另一方面隨著深度學習,人工智能等技術的發展,用戶通常希望能保存更長時間的數據,以提升深度學習的效果。數據量的快速增加會使集群不斷面臨擴容需求,從而導致存儲成本不斷增加。

2、小文件問題

眾所周知,HDFS的設計是針對離線批處理大文件的,處理小文件并非傳統HDFS擅長的場景。HDFS小文件問題的根源在于文件的元數據信息都是維護在單點Namenode的內存中,單臺機器的內存空間始終是有限的。據估算,單臺namenode集群能容納系統文件數量極限大約在1.5億左右。實際上,HDFS平臺通常作為底層存儲平臺服務于上層多種計算框架,多個業務場景,所以小文件問題從業務的角度也難以避免。目前也有方案例如HDFS-Federation解決Namenode單點擴展性問題,但同時也會帶來巨大的運維管理難度。

3、冷熱數據問題

隨著數據量的不斷增長積累,數據也會呈現出訪問熱度不同的巨大差異。例如一個平臺會不斷地寫入***的數據,但通常情況下最近寫入的數據訪問頻率會比很久之前的數據高很多。如果無論數據冷熱情況,都采用同樣的存儲策略,是對集群資源的一種浪費。如何根據數據冷熱程度對HDFS存儲系統進行優化是一個亟待解決的問題。

二、現有HDFS優化技術

從Hadoop誕生到今天也有超過10年的時間,在此期間HDFS技術本身也在不斷優化演進。HDFS現有一些技術能夠一定程度上解決上述一些問題。這里簡要介紹一下HDFS異構存儲和HDFS糾刪碼技術。

HDFS異構存儲:

Hadoop從2.6.0版本開始支持異構存儲功能。我們知道HDFS默認的存儲策略,對于每個數據塊,采用三個副本的存儲方式,保存在不同節點的磁盤上。異構存儲的作用在于利用服務器不同類型的存儲介質(包括HDD硬盤、SSD、內存等)提供更多的存儲策略(例如三個副本一個保存在SSD介質,剩下兩個仍然保存在HDD硬盤),從而使得HDFS的存儲能夠更靈活高效地應對各種應用場景。

HDFS中預定義支持的各種存儲包括:

  • ARCHIVE:高存儲密度但耗電較少的存儲介質,例如磁帶,通常用來存儲冷數據
  • DISK:磁盤介質,這是HDFS最早支持的存儲介質
  • SSD:固態硬盤,是一種新型存儲介質,目前被不少互聯網公司使用
  • RAM_DISK :數據被寫入內存中,同時會往該存儲介質中再(異步)寫一份

HDFS中支持的存儲策略包括:

  1. Lazy_persist:一個副本保存在內存RAM_DISK中,其余副本保存在磁盤中
  2. ALL_SSD:所有副本都保存在SSD中
  3. One_SSD:一個副本保存在SSD中,其余副本保存在磁盤中
  4. Hot:所有副本保存在磁盤中,這也是默認的存儲策略
  5. Warm:一個副本保存在磁盤上,其余副本保存在歸檔存儲上
  6. Cold:所有副本都保存在歸檔存儲上

總體上HDFS異構存儲的價值在于,根據數據熱度采用不同策略從而提升集群整體資源使用效率。對于頻繁訪問的數據,將其全部或部分保存在更高訪問性能的存儲介質(內存或SSD)上,提升其讀寫性能;對于幾乎不會訪問的數據,保存在歸檔存儲介質上,降低其存儲成本。但是HDFS異構存儲的配置需要用戶對目錄指定相應的策略,即用戶需要預先知道每個目錄下的文件的訪問熱度,在實際大數據平臺的應用中,這是比較困難的一點。

HDFS糾刪碼:

傳統HDFS數據采用三副本機制保證數據的可靠性,即每存儲1TB數據,實際在集群各節點上占用的數據達到3TB,額外開銷為200%。這給節點磁盤存儲和網絡傳輸帶來了很大的壓力。

在Hadoop3.0開始引入支持HDFS文件塊級別的糾刪碼,底層采用Reed-Solomon(k,m)算法。RS是一種常用的糾刪碼算法,通過矩陣運算,可以為k位數據生成m位校驗位,根據k和m的取值不同,可以實現不同程度的容錯能力,是一種比較靈活的糾刪碼算法。

常見的算法為RS(3,2)、RS(6,3)、RS(10,4),k個文件塊和m個校驗塊構成一個組,這個組內可以容忍任意m個數據塊的丟失。

HDFS糾刪碼技術能夠降低數據存儲的冗余度,以RS(3,2)為例,其數據冗余度為67%,相比Hadoop默認的200%大為減少。但是糾刪碼技術存儲數據和數據恢復都需要消耗cpu進行計算,實際上是一種以時間換空間的選擇,因此比較適用的場景是對冷數據的存儲。冷數據存儲的數據往往一次寫入之后長時間沒有訪問,這種情況下可以通過糾刪碼技術減少副本數。

三、大數據存儲優化:SSM

前面介紹的無論HDFS異構存儲還是糾刪碼技術,前提都是需要用戶對特定的數據指定存儲的行為,就是說用戶需要知道哪些數據是熱點數據,哪些是冷數據。那有沒有一種方法可以自動對存儲進行優化呢?

答案是有的,這里介紹的SSM(Smart Storage Management)系統,它從底層存儲(通常是HDFS)中獲取元數據信息,并通過數據讀寫訪問信息分析獲取數據熱度情況,針對不同熱度的數據,按照預先制定的一系列規則,采用相應的存儲優化策略,從而提升整個存儲系統的效率。SSM是一個由Intel主導的開源的項目,中國移動也參與其中的研發,項目可以在Github中獲取到:https://github.com/Intel-bigdata/SSM 。

SSM定位是一個存儲外圍優化的系統,整體上采用Server-Agent-Client的架構,其中Server負責SSM整體邏輯的實現,Agent用于對存儲集群執行各種操作,Client是提供給用戶的數據訪問接口,通常其中包含了原生HDFS的接口。

SSM-Server的主要框架如上圖所示,從上到下,StatesManager與HDFS集群進行交互,用于獲取HDFS元數據信息,并維護每個文件的訪問熱度信息。StatesManager中的信息會持久化到關系型數據庫中。在SSM中采用TiDB作為底層存儲的數據庫。RuleManager維護和管理規則相關信息,用戶通過前臺界面為SSM定義一系列存儲規則,RuleManger負責規則的解析和執行。CacheManager/StorageManager根據熱度和規則,生成具體的action任務。ActionExecutor 負責具體的action任務,把任務分配給Agent,并在Agent節點執行。

SSM-Server內部邏輯實現依賴于規則的定義,需要管理員通過前臺web頁面為SSM系統制定一系列規則。一條規則包括幾部分組成:

  • 操作對象,通常是指符合特定條件的文件。
  • 觸發器,指規則觸發的時間點,例如每天定時觸發。
  • 執行條件,定義一系列基于熱度的條件,例如文件在一段時間訪問次數計數要求。
  • 執行操作,對符合執行條件的數據進行相關操作,通常是指定其存儲策略等。

一個實際的規則示例:

file.path matchs ”/foo/*”: accessCount(10min) >= 3 | one-ssd

這條規則表示對于在/foo目錄下的文件,滿足10分鐘內被訪問次數不低于三次,則對其采用One-SSD的存儲策略,即數據一個副本保存在SSD上,剩余2個副本保存在普通磁盤上。

四、SSM應用場景

SSM能夠針對數據的冷熱程度,采用不同存儲策略進行優化,以下是一些典型的應用場景:

最典型的場景就是針對冷數據,如上圖所示,定義相關規則,將較長時間為沒有訪問的數據采用更低成本的存儲。例如原先的數據塊,從SSD存儲退化到HDD存儲。

與此類似,對于熱點的數據,同樣可以根據不同的規則,對其采用更快速的存儲策略,如上圖所示,短時間內訪問此處較多的熱點數據,會從HDD存儲上升至SSD存儲,更熱點的數據會采用內存存儲的策略。

針對冷數據的場景,SSM也可以采用糾刪碼的優化,通過定義相應規則,對于訪問次數很少的冷數據,對其執行erasure code操作,降低數據副本冗余。

另外值得一提的是SSM針對小文件也有相應優化手段,這個功能仍然處于開發過程中。大體邏輯是SSM會對HDFS上一系列小文件執行合并成大文件的操作,同時,在SSM的元數據中記錄下原始小文件和合并后大文件的映射關系以及每個小文件在大文件中的偏移量。當用戶需要訪問小文件時,通過SSM特定的客戶端(SmartClient),根據SSM元數據中的小文件映射信息,從合并后的文件中獲取到原始小文件。

***SSM是個開源的項目,目前仍然在非常快速的迭代演進過程中,歡迎任何感興趣的朋友參與項目的開發貢獻。

Q&A

Q1:HDFS自行搭建應該從多大規模開始?

A1:HDFS支持偽分布模式,即使只有一個節點,也能搭建一個HDFS系統。如果希望更好體驗和理解HDFS的分布式架構,建議有3到5個節點的環境來搭建。

Q2:蘇研在實際各省的大數據平臺用SSM了嗎?

A2:目前還沒有,這個項目還在快速發展中,需要等到測試穩定后才會逐步用到生產上。

Q3:HDFS和Spark區別是什么?優缺點呢?

A3:HDFS和Spark并不是同一個層面上的技術,HDFS是存儲系統,而Spark是一種計算引擎。我們經常拿來和Spark對標的是Hadoop中的Mapreduce計算框架而非HDFS存儲系統。在實際項目建設中,通常HDFS和Spark是協作的關系,底層存儲使用HDFS,上層計算使用Spark。

責任編輯:武曉燕 來源: DBAplus社群
相關推薦

2015-04-02 12:42:26

HDFS分層存儲高效

2019-04-19 08:47:00

前端監控數據

2023-09-12 16:20:04

邊緣AI深度學習

2018-05-08 14:58:07

戴爾

2010-12-12 09:40:00

Android UI設

2015-09-30 14:22:44

Qlik數據

2023-11-24 11:20:04

functoolsPython

2016-06-30 16:54:49

UCloud愛數云計算

2025-04-24 08:40:00

JavaScript代碼return語句

2011-07-21 13:52:43

組策略網絡打印機

2024-12-20 16:41:22

2016-09-29 13:44:23

數據中心

2017-12-21 14:36:10

大數據健身智慧

2013-04-03 09:49:48

LinkedIn大數據

2024-06-24 00:05:00

Python代碼

2010-12-23 15:55:00

上網行為管理

2018-10-23 15:20:29

SparkShuffleSpark SQL

2024-04-26 07:54:07

ZustandReact狀態管理庫

2015-12-31 11:57:17

華為eLTE物聯網
點贊
收藏

51CTO技術棧公眾號

久久久久久国产精品免费免费| 91日韩视频| 久久在线91| 精品成人一区二区| 在线播放 亚洲| 精品无码一区二区三区| 四季久久免费一区二区三区四区| 欧美日韩国产高清电影| 亚洲国产另类av| 18成人免费观看网站下载| 超碰人人干人人| 日韩久久一区二区三区| 91麻豆精品一区二区三区| 高清在线视频日韩欧美| 中文字幕一区二区三区人妻在线视频| 欧美激情视频在线播放| 美女视频网站久久| 最近2019免费中文字幕视频三| 久久久久免费精品| 国产高清自拍视频在线观看| 久久久777| 日韩av在线最新| 日韩国产欧美亚洲| 天堂av在线7| 久久aⅴ国产紧身牛仔裤| 精品国产欧美一区二区三区成人| 成人日韩在线视频| 国产三级在线播放| 国产成人亚洲综合a∨婷婷| 精品中文字幕在线观看| 影音先锋资源av| 蜜桃视频www网站在线观看| 91视频国产观看| av成人观看| 欧美精品亚洲精品日韩精品| 日韩有码中文字幕在线| 在线精品视频免费播放| 亚洲女人毛片| www.蜜臀av| 伊人激情综合| 亚洲欧美成人精品| 亚洲一区二区三区四区五区| 欧美粗大gay| 国产精品美女久久久久aⅴ | 一卡二卡3卡四卡高清精品视频| 这里只有精品免费视频| 欧美xxxx在线| 欧美在线视频全部完| 欧美变态另类刺激| av在线电影免费观看| 国产在线观看一区二区| 欧美激情aaaa| 国产在线观看h| 99精品女人在线观看免费视频 | 国产福利一区二区| 91久久精品美女高潮| 免费在线观看黄色av| 免费成人网www| 欧美一级夜夜爽| 免费在线观看的av网站| 精精国产xxxx视频在线| 中文字幕色av一区二区三区| 国产日韩欧美一区二区| 中文字幕1区2区3区| 日韩精品亚洲一区二区三区免费| 久久视频中文字幕| 97伦伦午夜电影理伦片| 国产精品欧美一区二区三区不卡| 五月天丁香久久| 一级做a爰片久久| 麻豆传媒在线完整视频| 亚洲精品成人悠悠色影视| 欧美亚洲国产免费| 高潮一区二区三区乱码| 美女视频免费一区| 91精品视频网站| 午夜精品久久久久久久99老熟妇| 成人中文字幕电影| 91久久嫩草影院一区二区| 国产精品视频a| 日韩av一区二区在线影视| 欧美极品少妇xxxxⅹ免费视频| 欧美一区二区三区粗大| 我不卡伦不卡影院| 一区二区三区亚洲| 国产吞精囗交久久久| 国产中文精品久高清在线不| 亚洲国产精品高清久久久| 色18美女社区| 成人国产网站| 在线视频亚洲一区| 欧美成人手机在线视频| 激情视频极品美女日韩| 欧美成人一区二区三区在线观看| 亚洲精品手机在线观看| 成人高潮a毛片免费观看网站| 欧美人xxxx| 亚洲免费看av| 全球最大av网站久久| 91国产精品成人| 热久久精品国产| 都市激情亚洲综合| 狠狠操狠狠色综合网| 青青草精品视频在线| 久久大胆人体| 亚洲成人7777| 中文字幕 日韩 欧美| 日韩av系列| 欧美成人小视频| 麻豆changesxxx国产| 免费看的黄色欧美网站| 热久久免费视频精品| 国产尤物在线视频| 蜜桃av一区| 99视频日韩| 日本在线观看www| 国产精品久久久一本精品| 久久综合久久久久| sm在线播放| 欧美日韩亚洲成人| 国产精品igao网网址不卡| 99视频这里有精品| 亚洲天天在线日亚洲洲精| 最新中文字幕av| 欧美电影免费| 青青久久aⅴ北条麻妃| 亚洲国产精品一| 99久久99久久精品国产片果冻| 国产一区自拍视频| 国内精品久久久久国产| 在线观看免费视频综合| 国产伦精品一区二区三区妓女 | 久久久久97国产| 极品av少妇一区二区| 91精品视频播放| 日本中文字幕在线2020| 欧美日韩在线不卡| 无码国产精品久久一区免费| 日韩一区二区三区免费播放| 美女国内精品自产拍在线播放| 午夜一级黄色片| 久久综合五月天婷婷伊人| 视频在线99re| 欧美78videosex性欧美| 欧美一卡2卡三卡4卡5免费| 登山的目的在线| 亚洲清纯自拍| 国产精品爽黄69| 超碰人人人人人人| 亚洲免费观看高清完整| 日本三级免费网站| 国产视频网站一区二区三区| 日韩在线观看av| 国产精品国产三级国产普通话对白| 中文子幕无线码一区tr| 日本大片免费看| 99a精品视频在线观看| 久久久久久久久久久亚洲| 欧美综合视频在线| 欧美激情在线看| 国产freexxxx性播放麻豆| 精品视频一区二区三区四区五区| 亚洲天堂成人在线视频| 国产香蕉在线视频| 九一九一国产精品| 欧美久久久久久久| 91tv亚洲精品香蕉国产一区| 中文字幕亚洲欧美一区二区三区| 日本三级视频在线| 国产乱人伦偷精品视频免下载| 麻豆精品蜜桃一区二区三区| √天堂8在线网| 欧美日韩中文字幕一区二区| 日韩三级久久久| 久久aⅴ国产紧身牛仔裤| 日本精品二区| 天堂av在线| 精品成人佐山爱一区二区| 国产一区二区99| 欧美激情一区二区在线| 午夜免费福利网站| 国产高清一区| 高清视频一区| 伊人在我在线看导航| 亚洲精品国产精品国自产观看浪潮 | 懂色av中文字幕| 成人黄色777网| 成人一区二区av| 欧美一级在线| 中文字幕欧美精品在线 | 在线一区av| 色多多国产成人永久免费网站| 精品人妻一区二区三区日产乱码| 精品毛片三在线观看| 亚洲精品电影院| 日本三级亚洲精品| 国产在线无码精品| 国产一区二区三区亚洲综合| 国a精品视频大全| 午夜伦理在线| 日韩禁在线播放| 国产在成人精品线拍偷自揄拍| 亚洲大型综合色站| 天堂网中文在线观看| 91在线小视频| 免费看91视频| 久久97超碰国产精品超碰| 又粗又黑又大的吊av| 中文字幕午夜精品一区二区三区| 成人啪啪免费看| 国产cdts系列另类在线观看| 欧美一区二区三区在线视频| 一区二区三区福利视频| 久久精品一区二区| 波多野结衣天堂| 久久精品高清| 欧美日韩电影一区二区| 99亚洲乱人伦aⅴ精品| 成人疯狂猛交xxx| 日韩精品第一| 国产福利视频一区二区| 91青青在线视频| 91精品婷婷国产综合久久性色| 中文字幕在线观看二区| 国产一区中文字幕| 午夜激情在线观看视频| 欧美亚洲视频| 久久成人免费观看| 激情综合网址| 国产精品又粗又长| 国产在线成人| 麻豆成人av| 日本天堂一区| 精品国产乱码一区二区三区四区 | 色婷婷综合五月| 天天舔天天操天天干| 暴力调教一区二区三区| 精品久久久久久久免费人妻| 最新日韩欧美| 蜜臀av无码一区二区三区| 国产一在线精品一区在线观看| 日韩中文字幕在线不卡| 欧美国产激情| 日本免费高清一区二区| 日韩有码中文字幕在线| 欧美激情论坛| 精品国产一区二区三区久久久蜜臀| 鲁丝一区二区三区免费| 蜜臀av免费一区二区三区| 欧美日韩一区在线播放| 国产精品一区二区三区av麻| 欧美日韩综合精品| 欧美日韩国产传媒| 一本—道久久a久久精品蜜桃| 三上亚洲一区二区| 干日本少妇视频| 免费精品国产的网站免费观看| 久久青青草原| 国模精品一区| 国产奶头好大揉着好爽视频| 欧美va天堂| 国产伦精品一区二区三区四区视频_| 一区二区三区成人精品| 国产911在线观看| 黄色精品网站| a在线视频观看| 日韩专区一卡二卡| 在线观看免费av网址| 国产精品白丝jk白祙喷水网站| 精品国产aⅴ一区二区三区东京热 久久久久99人妻一区二区三区 | 国产91精品久久久久| 国产在线1区| 欧美黑人性生活视频| 日本乱码一区二区三区不卡| 国产精品mp4| 国产盗摄一区二区| 久久精彩免费视频| 国产三区四区在线观看| 久久天天躁狠狠躁夜夜av| www.8ⅹ8ⅹ羞羞漫画在线看| 久久不射热爱视频精品| 9765激情中文在线| 国产精品91免费在线| 日本精品视频| 成人亚洲欧美一区二区三区| 丁香一区二区| 99久热re在线精品996热视频| 欧美人体视频| 最新国产精品久久| 日韩一区三区| 免费视频爱爱太爽了| 日韩av一区二区在线影视| 性一交一黄一片| 国产一区二区不卡| av直播在线观看| 亚洲欧美精品午睡沙发| 亚洲成人av影片| 色婷婷狠狠综合| 国产美女无遮挡永久免费| 欧美久久一二三四区| 在线不卡免费视频| 欧美日韩国产综合久久| 天天av天天翘| 亚洲精品视频在线播放| 日本一卡二卡四卡精品| 亚洲欧美另类人妖| 在线heyzo| 国产日韩欧美黄色| gogo大尺度成人免费视频| 久久青青草原一区二区| 黄色亚洲大片免费在线观看| 一个色综合久久| 国产三级一区二区三区| 成人午夜免费影院| 福利微拍一区二区| 成人激情四射网| 久久这里只有精品视频首页| 国产激情欧美| 日本午夜精品一区二区| 99精品国产福利在线观看免费| 自拍一级黄色片| 亚洲视频每日更新| 日韩激情一区二区三区| 91精品国产福利| 色视频在线免费观看| 国产精品久久久久久久久男 | 日韩一级二级三级精品视频| av加勒比在线| 日韩成人小视频| 操喷在线视频| 国产精品推荐精品| 国产欧美日韩| 国产免费黄色小视频| 国产·精品毛片| 欧美做受xxxxxⅹ性视频| 亚洲mv大片欧洲mv大片精品| 久久久久久亚洲av无码专区| 日韩大片免费观看视频播放| 超碰成人av| 精品国产免费久久久久久尖叫| 亚洲国产影院| 欧美在线一级片| 国产精品第五页| 国产成人亚洲精品自产在线 | 欧美色图麻豆| 三级4级全黄60分钟| 91在线视频在线| 日韩美一区二区| 国产一区二区三区视频| 素人一区二区三区| 偷拍视频一区二区| 理论片日本一区| 精品人妻一区二区三区日产乱码卜| 亚洲韩国一区二区三区| 亚洲精品一区二区二区| 中文字幕亚洲一区二区三区| 88xx成人网| 天天在线免费视频| 成人午夜精品在线| 亚洲黄色小说图片| 中文字幕视频一区二区在线有码| 国产资源一区| 久久影院理伦片| 日韩国产一区二| 天堂网avav| 欧美日韩日日骚| caoporn97在线视频| 国产精品免费一区二区三区在线观看 | 亚洲精品国产一区二| 久久久久久久色| 国产一区二区三区电影在线观看| 国产原创精品在线| 久久一夜天堂av一区二区三区| 无码人妻av一区二区三区波多野| 精品欧美乱码久久久久久1区2区| 91网在线播放| 99免费在线观看视频| 狂野欧美一区| 欧美成人免费看| 91精品国产乱码| 国产三级电影在线播放| 水蜜桃一区二区三区| 国产电影一区在线| 国产嫩bbwbbw高潮| 久久九九亚洲综合| 夜夜躁狠狠躁日日躁2021日韩| 给我免费播放片在线观看| 久久色中文字幕| 国产丝袜在线视频| 日本精品久久久久影院| 亚洲成a人片77777在线播放 | 精品一区二区三区毛片| 91在线精品秘密一区二区| 在线视频 中文字幕| 久久久久久久影院| 日韩成人三级| 免费中文字幕av| 欧美一区二区精品| 日本欧美韩国| 男人揉女人奶房视频60分|