精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

來自Twitter的Hadoop優化經驗:集群越大越明顯!

云計算 Hadoop
此文介紹了Twitter的核心數據類庫團隊,在使用Hadoop處理離線任務時,使用的性能分析方法,及由此發現的問題和優化手段,對如何使用 JVM/HotSpot profile(-Xprof)分析Hadoop Job的方法調用開銷、Hadoop配置對象的高開銷、MapReduce階段的排序中對象序列化/反序列的高開銷問題及優化等給出了實際可操作的方案。32個贊!

一、來源

Streaming Hadoop Performance Optimization at Scale, Lessons Learned at Twitter

二、讀后感

2.1 概要

此稿介紹了Twitter的核心數據類庫團隊,在使用Hadoop處理離線任務時,使用的性能分析方法,及由此發現的問題和優化手段,對如何使用 JVM/HotSpot profile(-Xprof)分析Hadoop Job的方法調用開銷、Hadoop配置對象的高開銷、MapReduce階段的排序中對象序列化/反序列的高開銷問題及優化等給出了實際可操作的方案。

其介紹了Apache Parquet這一面向列的存儲格式,并成功應用于列投影(column project),配合predicated push-down技術,過濾不需要的列,極大提高了數據壓縮比和序列化/反序列化的性能。

純干貨。

32個贊!

2.2 優化總結

1) Profile!(-Xprofile)性能優化不能靠猜,而應靠分析!

2) 序列化開銷很大,但是Hadoop里有許多序列化(操作)!

3) 根據特定(數據)訪問模式,選擇不同的存儲格式(面向行還是面向列)!

4) 使用column projection。

5) 在Hadoop的MR階段,排序開銷很大,使用Raw Comparators以降低開銷。

注:此排序針對如Comparator,其會引發序列化/反序列化操作。

6) I/O并不一定就是瓶頸。必要的時候要多I/O換取更少的CPU計算。

JVM/HotSpot原生profile能力(-Xprof),其優點如下:

1) 低開銷(使用Stack sampling)。

2) 能揭示開銷***的方法調用。

3) 使用標準輸出(Stdout)將結果直接寫入Task Logs。

2.3 Hadoop的配置對象

 

1) Hadoop的Configuration Object開銷出人意料的高。

2) Conf的操作看起來就像一個HashMap的操作。

 

3) 構造函數:讀取+解壓+分析一個來自磁盤的XML文件

 

4) get()調用引起正則表達式計算,變量替換。

 

Twitter核心數據類庫團隊的Hadoop優化經驗

5) 如果在循環中對上述等方法進行調用,或者每秒一次調用,開銷很高.某些(Hadoop)Jobs有30%的時間花在配置相關的方法上!(的確是出人意料的高開銷)

 

總之,沒有profile(-Xprof)技術,不可能獲取以上洞察,也不可能輕易找到優化的契機和方向,需要使用profile技術來獲知I/O和CPU誰才是真正的瓶頸。

#p#

2.4 中間結果的壓縮

  • Xprof揭示了spill線程中的壓縮和解壓縮操作消耗了大量時間。
  • 中間結果是臨時的。
  • 使用lz4方法取代lzo level 3,減少了30%多的中間數據,使其能被更快地讀取。
  • 并使得某些大型Jobs提速150%。

2.5 對記錄的序列化和反序列,會成為Hadoop Job中開銷***的操作!

2.6 對記錄的序列化是CPU敏感的,相對比之下,I/O都不算什么了!

2.7 如何消除或者減小序列化/反序列化引起的(CPU)開銷?

2.7.1 使用Hadoop的Raw Comparator API(來比較元素大小)

 

開銷分析:如下圖所示,Hadoop的MR在map和reduce階段,會反序列化map結果的keys以在此階段進行排序。

(反序列化操作)開銷很大,特別是對于復雜的、非原語的keys,而這些keys又很常用。

 

Hadoop提供了一個RawComparator API,用于對已序列化的(原始的)數據(字節級)進行比較:

 

 

 

不幸的是,需要親手實現一個自定義的Comparator。

現在,假設數據已序列化后的字節流,本身是易于比較的:

Scala有個很拉風的API,Scala還有一些宏可以產生這些API,以用于:

Tuples , case classes , thrift objects , primitives , Strings,等等數據結構。

 

怎么拉風法呢?首先,定義一個密集且易于比較的數據序列化(字節)格式:

其次,生成一個用于比較的方法,以利用這種數據格式的優勢:

 

下圖是采用上述優化手段后的比較開銷對比:

 

提速到150%!

接著優化!

#p#

2.7.2 使用column projection

不要讀取不需要的列:

 

Twitter核心數據類庫團隊的Hadoop優化經驗

1) 可使用Apache Parquet(列式文件格式)。

 

Twitter核心數據類庫團隊的Hadoop優化經驗

2) 使用特別的反序列化手段可以在面向行的存儲中跳過一些不需要的字段。

面向列的存儲中,一整列按順序存儲(而不是向面向行的存儲那樣,列是分開存儲的):

 

Twitter核心數據類庫團隊的Hadoop優化經驗

可以看到,面向列的存儲,使得同類型的字段被順序排在一起(易于壓縮):

 

Twitter核心數據類庫團隊的Hadoop優化經驗

采用Lzo + Parquet,文件小了2倍多!

2.7.3 Apache Parquet

1) 按列存儲,可以有效地進行列投影(column projection)。

2) 可按需從磁盤上讀取列。

3) 更重要的是:可以只反序列化需要的列!

Twitter核心數據類庫團隊的Hadoop優化經驗

看下效果:

 

Twitter核心數據類庫團隊的Hadoop優化經驗

可以看到,列數越少,Parquet的威力越大,到40列時,其效率反而不如Lzo Thrift。

  • 在讀取所有列的情況下,Parquet一般比面向行的存儲慢。
  • Parquet是種密集格式,其讀性能和模式中列的數目相關,空值讀取也消耗時間。
  • 而面向行的格式(thrift)是稀疏的,所以其讀性能和數據的列數相關,空值讀取是不消耗時間的。

 

Twitter核心數據類庫團隊的Hadoop優化經驗

#p#

跳過不需要的字段,如下所示:

 

Twitter核心數據類庫團隊的Hadoop優化經驗

  • 雖然,沒有降低I/O開銷
  • 但是,可以僅將感興趣的字段編碼進對象中
  • 相對于從磁盤讀取 + 略過編碼后字節的開銷,在解碼字符串時所花的CPU時間要高的多!

看下各種列映射方案的對比:

 

Twitter核心數據類庫團隊的Hadoop優化經驗

Parquet Thrift還有很多優化空間;Parquet在選取的列數小于13列之前,是更快的;此模式相對平坦,且大多數列都被生成了。

  • 還可以采用Predicate Push-Down策略,使得Parquet可以跳過一些不滿足過濾條件的數據記錄。
  • Parquet存儲了一些統計信息,比如記錄的chunks,所以在某些場景下,可以通過對這些統計信息進行讀取分析,以跳過整個數據塊(chunk)。

 

Twitter核心數據類庫團隊的Hadoop優化經驗

注:左圖為column projection,中圖為predicate push-down過濾,右圖為組合效果。可以看到很多字段被跳過了,那絕壁可以優化序列化/反序列化的效率

下圖則展示了push-down過濾 + parquet的優化成效:

 

Twitter核心數據類庫團隊的Hadoop優化經驗

2.8 結語

感嘆:Twitter真是一家偉大的公司!

上述優化手段,集群越大、Hadoop Job越多,效果越明顯!

原文鏈接:http://www.cnblogs.com/foreach-break/archive/2015/07/15/learn_bigdata_from_twitter_hadoop_tuning.html
 

責任編輯:Ophira 來源: 博客園
相關推薦

2010-05-24 14:59:29

Hadoop集群

2021-09-29 15:36:43

人工智能算法AI

2025-02-21 10:59:22

2020-07-13 08:37:28

程序員技術職場

2013-05-29 10:33:38

程序員經驗

2014-04-08 14:21:09

Twitter StoStormStorm 集群

2017-12-17 16:24:31

云計算AISaaS

2017-12-18 17:04:00

AI智能機器學習

2013-07-12 09:39:34

2009-07-23 15:07:32

2010-06-07 09:14:55

Hadoop集群

2013-09-05 09:47:35

TwitterSummingbird開源

2015-10-08 14:32:19

微信Apk瘦身

2017-12-26 15:34:55

2011-01-12 17:27:53

2022-02-13 00:03:06

AndroidAndroid 13安卓

2022-03-11 10:22:58

IT變革IT領導者數字化轉型

2019-04-12 08:28:18

物聯網智慧城市IOT

2012-04-11 09:35:04

TwitterMySQL

2017-02-28 09:48:30

點贊
收藏

51CTO技術棧公眾號

国产chinesehd精品露脸| 在线看成人av电影| 中文字幕 国产精品| 久久一区二区三区喷水| 日韩欧美色电影| 精品一区二区中文字幕| 日韩毛片久久久| 成人午夜电影小说| 国产精品91在线| 欧美精品99久久久| 欧美日韩久久精品| 欧美成人精品二区三区99精品| 免费观看精品视频| 影音先锋中文在线视频| 久久久午夜精品理论片中文字幕| 成人做爰www免费看视频网站| 日韩xxx高潮hd| 日本久久一二三四| 亚洲精品videossex少妇| 亚洲xxx在线观看| 人人草在线视频| 亚洲欧美日韩中文播放| 欧美日韩中文国产一区发布| www日本高清| 美洲天堂一区二卡三卡四卡视频| 91成人在线播放| 久久久久亚洲av片无码| 欧美人与牛zoz0性行为| 亚洲国产精品成人av| 老司机午夜性大片| 日本欧美不卡| 日韩欧美在线播放| 99国产精品白浆在线观看免费| a黄色在线观看| xfplay精品久久| 国产精品入口免费| www.狠狠干| 国产精品综合网| 国产精品一区二区三区免费视频| 午夜影院在线看| 亚洲欧洲视频| 孩xxxx性bbbb欧美| 欧美黑吊大战白妞| 婷婷综合五月| 日韩有码视频在线| 人妻无码一区二区三区免费| 精品国产a一区二区三区v免费| 日韩精品免费在线视频观看| 老司机免费视频| jazzjazz国产精品麻豆| 精品美女在线播放| 精品人妻一区二区免费| 亚洲精品国产九九九| 日韩网站在线看片你懂的| 亚洲第一区第二区第三区| www.欧美| 日韩精品一区二区在线观看| 一起草最新网址| 一区二区三区国产好| 欧美不卡一区二区三区四区| 娇妻高潮浓精白浆xxⅹ| 久久夜色电影| 亚洲跨种族黑人xxx| 亚洲成人网在线播放| 亚洲va久久久噜噜噜久久| 日韩精品在线视频观看| 国产精品高清无码在线观看| 女人av一区| 亚洲性生活视频在线观看| 中国女人特级毛片| 婷婷久久一区| 久久久久久中文字幕| 日韩精品视频播放| 久久综合婷婷| 成人伊人精品色xxxx视频| 性中国xxx极品hd| gogo大胆日本视频一区| 欧美理论一区二区| 日本在线免费网| 亚洲小说欧美激情另类| 久久精品免费一区二区| 成人亚洲网站| 日韩免费在线观看| 精品人妻一区二区三区日产乱码卜| 欧洲专线二区三区| www.久久久久久.com| 久久精品这里有| 久久亚洲精品伦理| 95av在线视频| 免费人成黄页在线观看忧物| 最新不卡av在线| 国产午夜大地久久| 国产精品久久久久久久久免费高清 | 欧美精品粉嫩高潮一区二区| 曰本三级日本三级日本三级| 男男gay无套免费视频欧美| 久久久成人精品| 久久精品视频5| 国产一区二区三区四| 美女三级99| 91麻豆免费在线视频| 色综合久久久久久久久久久| 免费欧美一级片| 九九免费精品视频在线观看| 久久99亚洲热视| 国模私拍一区二区| 99re热这里只有精品视频| 在线看视频不卡| 欧美大胆性生话| 欧美变态凌虐bdsm| 国产免费嫩草影院| 亚洲综合欧美| 99re在线| 麻豆视频在线| 欧美影院午夜播放| 538国产视频| 黄色成人在线网址| 成人乱人伦精品视频在线观看| 午夜国产在线观看| 亚洲一二三级电影| 中国老熟女重囗味hdxx| 欧美3p视频| 国产精品久久久久久久久久久久久| 亚洲免费成人在线| 日韩毛片高清在线播放| 男人天堂成人在线| 亚州精品视频| 97视频在线观看视频免费视频 | 996这里只有精品| 久久久加勒比| 国产亚洲综合久久| 成人免费毛片视频| 2021中文字幕一区亚洲| 国产二级片在线观看| 91成人入口| 欧美夫妻性视频| 99热这里只有精品在线| 亚洲欧洲日产国产综合网| 亚洲一区在线不卡| 欧美综合在线视频观看| 国产精品91久久| 视频二区在线| 天天av天天翘天天综合网色鬼国产| 师生出轨h灌满了1v1| 欧美精品18| 操一操视频一区| 色帝国亚洲欧美在线| 日韩欧美高清一区| 久久婷婷国产麻豆91| 成人免费看视频| 国产免费观看高清视频| 欧美色图婷婷| 日韩美女av在线免费观看| 国产中文字幕在线播放| 91福利国产精品| 一级特黄曰皮片视频| 免费一区二区视频| 一区二区免费在线视频| 国产视频网站一区二区三区| 欧美激情精品久久久久久| 理论片中文字幕| 欧美性极品xxxx做受| 亚洲av成人无码久久精品| 蜜臀久久久久久久| 最新av网址在线观看| 国产美女撒尿一区二区| 日本国产欧美一区二区三区| 啊v视频在线| 欧美一区二区高清| 久青草视频在线观看| 99热国产精品| 乌克兰美女av| 欧美日韩亚洲一区三区| 精品国产综合久久| 高清欧美日韩| 久久免费视频在线| 川上优的av在线一区二区| 7777精品久久久大香线蕉 | 欧美视频成人| 麻豆久久久9性大片| 成人激情视屏| 欧美黑人国产人伦爽爽爽| 欧美女优在线| 欧美一区二区三区在线电影 | 欧美在线观看视频一区二区三区| 欧美性生交大片| 粉嫩av亚洲一区二区图片| 国产aaa一级片| 欧美一区国产在线| 蜜桃传媒视频第一区入口在线看| 日韩成人精品一区二区三区| 国外成人性视频| 三级外国片在线观看视频| 精品国产91久久久久久久妲己 | 欧美精品videos极品| 26uuu久久天堂性欧美| 天天av天天操| 久久激情网站| 人妻激情另类乱人伦人妻| 欧美伦理影院| 国产一区二区三区黄| 欧美大片网站| 欧美在线一级视频| 亚洲按摩av| 中文字幕日韩电影| 亚洲av成人无码久久精品老人| 欧美精品亚洲一区二区在线播放| 欧美激情亚洲综合| 亚洲男人电影天堂| 91在线无精精品白丝| 99精品热视频| 五月天国产视频| 青娱乐精品视频| 日日鲁鲁鲁夜夜爽爽狠狠视频97 | 不卡av中文字幕| 欧美日韩国产影片| 日日夜夜操视频| 欧美日韩激情视频8区| 久久国产精品二区| 综合久久一区二区三区| 综合 欧美 亚洲日本| 久久嫩草精品久久久精品| 秘密基地免费观看完整版中文 | 欧美日韩国产在线观看| 亚洲不卡视频在线观看| 午夜精品久久久久久久久| 亚洲波多野结衣| 国产精品久久久久久久久果冻传媒| 素人fc2av清纯18岁| 91原创在线视频| 中国免费黄色片| 丁香五精品蜜臀久久久久99网站| 日本一二区免费| 捆绑紧缚一区二区三区视频| 99免费视频观看| 日韩电影在线观看电影| 亚洲成熟丰满熟妇高潮xxxxx| 国产一区二区三区的电影| 日韩a∨精品日韩在线观看| 韩国av一区| 日韩av高清在线看片| 亚洲国产高清一区二区三区| 久草视频这里只有精品| 狠狠久久婷婷| 婷婷无套内射影院| 国产精品久久久久9999高清| 精品国产免费av| 蘑菇福利视频一区播放| 哪个网站能看毛片| 日韩极品在线观看| 成年人在线看片| 日韩成人午夜精品| 三上悠亚在线一区二区| 久久精品国产第一区二区三区| 亚洲这里只有精品| 激情五月婷婷综合网| 亚洲在线观看网站| 国产91在线观看| www.日本高清| 国产日韩欧美a| 欧洲性xxxx| 亚洲精品国产品国语在线app| 久久精品性爱视频| 欧美日韩美女视频| 亚洲精品国产欧美在线观看| 欧美人伦禁忌dvd放荡欲情| 999av视频| 亚洲国产婷婷香蕉久久久久久| 视频在线不卡| xvideos成人免费中文版| 性欧美高清come| 国内精品久久久久久影视8| 亚洲国产欧美日本视频| 国产精品亚洲第一区| 欧美日本三级| 看欧美日韩国产| 91欧美日韩| 黄色成人在线看| 日韩不卡一区二区三区| 国产黑丝在线视频| 99视频精品在线| 一级片黄色录像| 午夜亚洲国产au精品一区二区| www.色国产| 日韩三级中文字幕| 婷婷国产在线| 久久精品一本久久99精品| jizzjizz中国精品麻豆| 国产精品美女午夜av| 亚洲国产欧美国产第一区| 欧美人xxxxx| 欧美99在线视频观看| 日韩中文字幕二区| 国产福利视频一区二区三区| 人妻视频一区二区| 亚洲成人一区二区在线观看| 中文字幕人妻精品一区| 亚洲第一中文字幕| 最新av网站在线观看| 97欧美精品一区二区三区| 一区二区三区| 日韩国产高清一区| 99国产成+人+综合+亚洲欧美| 久热精品在线播放| 91蜜桃视频在线| 国产一级视频在线| 欧美卡1卡2卡| 国产一二在线观看| 91国偷自产一区二区三区的观看方式| 国产资源一区| 日本一区二区高清视频| 亚洲国产美女 | 亚洲不卡视频| 图片区小说区区亚洲五月| 午夜亚洲影视| 久久免费精品国产| 亚洲黄一区二区三区| 91麻豆成人精品国产| 在线看欧美日韩| 成人欧美magnet| 国产一级特黄a大片99| 伊人色**天天综合婷婷| 永久免费的av网站| 欧美国产一区二区在线观看 | 久久久国产亚洲精品| 久久久男人的天堂| 亚洲美腿欧美偷拍| 91久久国语露脸精品国产高跟| 亚洲天堂日韩电影| 成人片免费看| 老司机精品福利在线观看| 影音先锋在线一区| 中国男女全黄大片| 亚洲午夜影视影院在线观看| www.com欧美| 欧美日韩不卡合集视频| 中文在线综合| 日韩小视频网站| 成人免费毛片a| 国产午夜在线播放| 日韩不卡在线观看| 小h片在线观看| 久久久久久久久久码影片| 国产精品老牛| av女人的天堂| 欧美性猛交xxxx乱大交退制版| 成人高潮成人免费观看| 国产精品电影久久久久电影网| 精品一区二区三| 色一情一区二区| 亚洲精品国久久99热| 亚洲黄色小说网址| 91av视频在线观看| 国产videos久久| 国产精品视频分类| 1024国产精品| 俄罗斯嫩小性bbwbbw| 午夜精品一区二区三区在线| 蜜桃国内精品久久久久软件9| 日韩在线xxx| 国产精品免费aⅴ片在线观看| 国产精品高潮呻吟AV无码| 久久99久久亚洲国产| 菁菁伊人国产精品| 国产成人手机视频| 日韩毛片视频在线看| 熟妇人妻一区二区三区四区| 欧美在线影院在线视频| 成人影院天天5g天天爽无毒影院 | 欧美中文高清| 蜜臀av色欲a片无码精品一区| 91丨porny丨国产入口| 波多野结衣日韩| 毛片精品免费在线观看| 动漫av一区| 欧美在线观看视频网站| 国产精品国产三级国产普通话99 | 日韩中文在线中文网在线观看 | 欧美日韩免费精品| 久久国内精品自在自线400部| 久久久91视频| 亚洲色图18p| 欧美另类中文字幕| 色诱视频在线观看| 亚洲精品中文字幕乱码三区 | 视频一区国产| 日av中文字幕| 亚洲美女免费视频| 欧美一区二区少妇| 92国产精品久久久久首页| 久久久久在线| 久久久久久av无码免费网站| 国产亚洲精品日韩| 国产一区二区三区不卡av| 男女视频在线看| 精品美女国产在线| 国产在线1区| 日韩激情视频| 99这里只有精品| 国产福利免费视频|