精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

小米數據工場的技術架構和小團隊如何玩轉大數據

原創
企業動態
由51CTO舉辦的WOT2016互聯網運維與開發者峰會上,來自前小米數據工場負責人、現任火線數據創始人兼CEO盧學裕做了以 “小米數據工場的技術架構和小團隊如何玩轉大數據”為主題的演講。本文章是把本次分享干貨亮點的整理成文字形式,呈獻廣大的用戶。

本文是WOT2016互聯網運維與開發者大會的現場干貨,  新一屆主題為WOT2016企業安全技術峰會將在2016年6月24日-25日于北京珠三角JW萬豪酒店隆重召開!

盧學裕的演講分為小米數據工場的技術架構和小團隊如何玩轉大數據兩部分,從中開發者可以知道小米數據工場的技術架構是怎樣的? 面對大數據的技術紛繁復雜,小團隊要如何面臨缺技術/缺分析師/缺數據等問題?在這種現狀下如何做好技術選型,如何權衡面臨的使用成本和數據隱私擔憂?盧學裕主張一半自建一半用云,然而這又要面臨哪些運維挑戰?

小米數據工場的技術架構

盧學裕表示, 小米數據工廠跟各家的大數據平臺、數據系統有很多類似之處也有自己獨特的點。工廠整個底層基礎平臺建立在Hadoop體系,除此小米跟Cloudera合作也非常緊密。小米整個底層平臺會有專門平臺組去開發,***用的HDFS,上面用的Hive、Spark和Mapreduce這些是混合到一個亞運集群上。Impala小米很早就在用,是一個很重的計算角色。

小米數據工場總體結構

如上圖, 上半部分是自研的數據工廠,是為最頂業務層提供服務的。數據工廠主要是提供數據可視化、計算任務管理、數據管理、權限管理、任務調度、數據共享等服務。盧學裕表示,公司越大就更希望數據能夠開放給公司的各個部門,數據可相互利用。但不能沒有任何限制的去使用,所以需要對數據權限做管理。任務調度是整個工廠里面最重的部分。數據共享就是類似非常火的用戶畫像類數據,還有其他公共數據如IP庫,這些數據具有公共特點,就不用重復計算,就可以通過數據共享的方式在各個團隊之間使用這些數據。

數據管理,分為數據預覽、元數據、數據源三部分。數據預覽是每個團隊用來互相了解數據的。

元數據,就是數據使用過程中要把非結構化的數據轉換結構化的數據。元數據管理就是去了解每個字段的含義和機器解析。機器解析包括Mapreduce程序可直接讀文件可解析,如用Impala、Spark和Hive同樣也能解析,而不需要每個使用者再去格式化,再去解析這個數據。但面臨的問題是數據一旦出現格式的轉變或者某些字段的調整,以前任務可能都會出現問題,故一定要統一管理的地方。數據源,數據管理非常核心的是數據集成,能夠把各個地方的數據集成到平臺上來。

HDFS目錄管理。有公共數據空間、業務數據空間、團隊數據空間、個人數據空間、Yarn計算空間五部分。

  • 公共數據空間,是用來把公共數據放到上面,把維護權限和讀的權限分開。這樣大部分都是讀這個空間,空間數據安全性等級相對來講比較低,可以付給更多人。
  • 業務數據空間,因為每個業務數據的增長量是不一樣的,甚至有些業務會出現如剛上來一個新功能,數據量迅速的增大,有的甚至會出現某個團隊的數據增加,導致把整個集群空間全吃掉,又沒有事先招呼。這種情況下做好業務間的限額配額是非常重要,防止某一個團隊的增長導致整個集群出現一些問題。
  • 團隊數據空間,就是把權限控制到個人,用來幫助做團隊之間的數據協作。如把線上任務會放到團隊賬號中去,團隊賬號的權限要做好控制,權限不隨便開放。團隊人員發生變動后,整個團隊任務不用再去切換賬戶而導致交接的復雜性。
  • 個人數據空間,數據工程師、開發工程師等是需要做一些調試或做自己的計算這就要給這些人一定空間的同時對其數據做配額。這是為了防止這些人過多的使用資源和為了空間不夠需要清理數據時,哪些數據要清理,哪些數據不能清理一目了然。這樣限制空間的情況下,這種廢文件或者垃圾文件的積累會相對較少。
  • Yarn計算空間,做配額限制呢是為了杜絕空間濫用的問題。盧學裕舉例道,“之前發生過一件事,某人在Reduce里面寫了一個死循環,不停的輸出數據,導致整個集群很快就去報警。后來才發現這個計算造成的一些問題,***差點導致那些日志上傳、數據的寫入都出問題,幸虧處理的比較及時。”所以,Yarn計算空間是需要做一個配額限制,防止對整個集群造成過大的影響。

盧學裕表示,小米數據存儲格式統一采用的Parquet,優點在于其使用的是列式存儲,支持Mapreduce、Hive、Impala、Spark和讀取快占用空間少。

客戶端數據接入兩種模式優劣勢

客戶端數據接入。客戶端指的是如說Wap、App等數據,存在方式有SDK和服務端Log兩種模式。上圖為兩種模式的優劣勢。

服務器端數據源。除前端數據源外,整個處理數據時還會有大量服務器端數據源需要處理。業務數據庫類,用ETL工具做導入。服務器端日志,用Scribe將數據寫入HDFS。

元數據管理。當公司業務變多后,每一個數據的處理方式都有可能不一樣,這時候就凸顯出元數據管理的重要性。如視頻播放日志,分析師希望用Hive,用Impala直接寫SQL去計算,但數據挖掘工程師就要去寫Mapreduce,寫Spark的方式去讀,去解析。元數據管理就是要做數據統一,既能夠滿足Hive、Spark、Impala,還能滿足Mapreduce。這樣一來節省大家對數據理解、執行的時間。

元數據管理

如上圖,小米數據工廠是每一份數據的描述都需要在數據工廠上提交,之后數據工廠會在MetaStore中做建表的同時帶上元數據的行為,供Hive、Spark、Impala使用。數據管理還會生成Jave  Class,給Mapreduce使用。當去解析用某個數據時候,可以直接用這樣的方式把它解析成Jave類。

計算管理

計算管理。盧學裕表示,計算是很重要的事情,數據管理相對來講是一次性的活,計算就是很復雜的事情。計算任務數一天達到幾千或過萬時,就會變得非常復雜。對于計算管理這快優化,小米做了如上圖的一些工作。

Docker。為了管理好這些紛繁的計算框架和模型,在計算的執行方面,小米使用Docker來解決對環境的不同需求和異構問題,并且與Hive、Impala、Spark這些不同的計算模型都進行了對接,去適配不同應用場景計算不同數據的模型。另外,在不同業務場景下,同一個計算邏輯也可以選用不同的計算模型,Docker 的使用也避免了資源的浪費。比如一個計算任務每天凌晨運行,為了追求吞吐量,可以放到Hive里跑;還是同樣一個計算模型,現在就要跑,可以不用更改,就放到Impala里運行。Docker不僅解決了環境的異構,也解決了資源問題。另外,Docker的環境適應性很強,做橫向擴展會比較容易。對于數據隱私方面,小米考慮得非常重。采用Docker與自身安全策略的綜合,小米用戶數據的隱私和安全性也得到了極其嚴格的控制。

小團隊如何玩轉大數據

 小團隊玩大數據會面臨哪些問題?小團隊會面臨人力資源不足,技術儲備不足,時間有限等問題。面對這些問題,盧學裕在技術選型上給出如下三個建議。

  1. 選擇熱門技術。因為人才比較多,相對獲取這樣人才會比較容易。技術成熟,因為小團隊沒有時間去踩坑。還有幫助多,這如說網上文檔幫助、社群幫助,朋友幫助等。
  2. 夠用。針對一些小團隊或者初創公司的特點,業務變化特別快,也不穩定,這種情況下做到夠用就好,不需要過分的設計和采用過重的系統。盡量根據業務驅動,業務需要什么數據就抓什么數據。
  3. 演進。隨著需求的變化需要不斷的演進,包括系統演進、使用方式演進。

一定要做好數據積累。盧學裕表示,無論你用什么樣的技術,用Hadoop也好,不用Hadoop也好,一定要做好數據的積累,這是對一家數據公司非常重要的部分。這就需要提前規劃好數據,還要避免邏輯孤島。還需要注意ID問題,也就是關聯的問題。當采集了數據,卻發現沒有采用戶ID,沒有提前做好這個規劃,當算到用戶級別時候那就尷尬了。

演講***,盧學裕強調:“現在越來越多業務都回到了用戶時代,以前講的是流量時代,講的是PV如何。回到用戶時代,核心問題就是我們要做好用戶的數據積累,尤其是用戶模型建立。模型包括的畫像、用戶點點滴滴行為等。這些行為在業務發展之后,尤其是要做數據挖掘,做推薦系統時,會非常非常的有幫助。建議大家做好這樣的數據積累,在數據技術上隨著變化可以不停的再做一些改變,甚至做一些混合,在不同的地方用不同的方式。

 演講視頻:http://edu.51cto.com/lesson/id-100757.html

講師簡介:

[[166688]]

現任火線數據創始人兼CEO,前小米科技小米云團隊,負責小米數據工場。之前擔任優酷土豆大數據團隊技術總監,打造了優酷土豆的大數據開放平臺、數據分析、數據挖掘、推薦系統等。最早服務于騰訊客戶端安全團隊做技術開發。

 

責任編輯:王雪燕 來源: 51CTO
相關推薦

2016-03-28 17:34:25

技術架構大數據51CTO

2016-03-22 10:02:23

WOT2016創業團隊大數據

2021-07-30 16:01:05

大數據技術應用

2015-03-17 10:24:38

2017-01-04 10:45:26

大數據商業銀行應用

2015-08-25 09:45:06

2020-08-30 16:29:12

數據科學團隊數據團隊CIO

2020-03-06 05:42:47

大數據隊架構工作指標

2013-10-21 10:56:48

微軟大數據中國石化

2014-08-21 09:28:04

出版社

2013-05-07 10:42:20

互聯網營銷大數據

2015-05-07 11:00:49

電信運營商大數據

2011-10-25 09:50:41

大數據

2018-06-25 11:20:18

LinuxPython大數據

2022-10-18 15:21:25

大數據管理技術數據倉庫

2024-02-20 13:16:00

大數據數據倉庫數據湖

2014-11-16 16:22:11

大數據

2017-07-17 16:06:58

大數據產品設計架構技術策略

2013-08-22 10:17:51

Google大數據業務價值

2016-02-22 11:39:27

亞馬遜AWS大數據
點贊
收藏

51CTO技術棧公眾號

久久久精品视频成人| 欧美色另类天堂2015| 亚洲free性xxxx护士hd| 久草视频在线免费看| 九九视频精品全部免费播放| 欧美日韩一区二区在线观看| 成人在线观看毛片| 亚洲色图欧美视频| 久草精品在线观看| 91高清免费在线观看| 精品无码一区二区三区蜜臀| 国产欧美自拍一区| 欧美日本免费一区二区三区| 国产亚洲黄色片| 黄色片在线免费观看| 国产精品456| 国产成人免费av| 成人免费看片98| 日韩欧美高清在线播放| 亚洲国产成人精品久久| 91视频这里只有精品| 久久久男人天堂| 亚洲男人的天堂网| 日本不卡一区| 婷婷五月综合久久中文字幕| 精品亚洲porn| 国产成人精品在线| 日韩成人免费观看| 欧美精品99| 久久好看免费视频| 欧美人与禽zoz0善交| 日韩成人av在线资源| 日韩欧美一级片| 中文字幕国产免费| 黄色亚洲网站| 欧美视频不卡中文| xxxx18hd亚洲hd捆绑| 在线观看av免费| 亚洲三级在线免费观看| 亚洲一区二区在线看| 黄色影院在线播放| 91丝袜国产在线播放| 国产欧美韩日| 手机看片1024国产| 国产白丝精品91爽爽久久| 成人午夜小视频| 一级欧美一级日韩| 六月丁香综合在线视频| 国产极品精品在线观看| 国产婷婷色一区二区在线观看| 亚洲欧洲日本一区二区三区| 久久久久久久久亚洲| 美女视频黄免费| 欧美天天视频| 欧美激情久久久久久| 激情综合五月网| 国产综合精品| 久久男人资源视频| 日韩高清免费av| 中文日韩欧美| 日本一欧美一欧美一亚洲视频| 性无码专区无码| 午夜综合激情| 国产精品扒开腿做爽爽爽的视频| 亚洲 欧美 中文字幕| 日韩1区2区日韩1区2区| 国产精品无av码在线观看| 中文字幕日日夜夜| 精品一区二区三区欧美| 91视频最新| 天堂中文在线看| 久久综合一区二区| 亚洲国产日韩综合一区| 美女免费久久| 一级特黄大欧美久久久| 国产黄页在线观看| 日韩欧美一区二区三区在线观看 | 欧洲精品在线播放| cao在线视频| 91久久线看在观草草青青| 无尽裸体动漫2d在线观看| 国产精品一区二区三区av | 97人妻精品一区二区三区免| 久久99国产精一区二区三区| 色哟哟网站入口亚洲精品| 欧美国产精品一二三| 国产精品日韩| 成人免费福利在线| 天天操天天干天天爽| 欧美激情在线一区二区三区| 成人在线免费观看网址| 一区二区三区四区日本视频| 欧美日韩精品免费| 四虎精品一区二区| 欧美韩日一区| 51精品在线观看| 99热这里只有精品在线| 2021中文字幕一区亚洲| 免费看啪啪网站| 无遮挡在线观看| 日韩一级免费观看| 亚洲一区二区三区日韩| 欧美天天在线| 成人精品一区二区三区电影黑人| 日本精品一二区| 国产精品女主播在线观看| 日本a在线免费观看| 香蕉久久久久久| 亚洲美女免费精品视频在线观看| 免费在线观看h片| 日韩制服丝袜av| 激情视频在线观看一区二区三区| 91最新在线| 日韩欧美福利视频| 中文字幕天堂av| 欧美精品一区二区三区久久久竹菊| 国产999在线| 四虎永久在线精品免费网址| 亚洲欧美日韩综合aⅴ视频| aa在线免费观看| 成人午夜大片| 欧美肥臀大乳一区二区免费视频| 瑟瑟视频在线免费观看| 91视频观看免费| 国产玉足脚交久久欧美| 人人九九精品视频| 久久久精品视频在线观看| 中文字幕永久在线| 久久蜜桃香蕉精品一区二区三区| 日韩国产一级片| 日韩在线精品强乱中文字幕| www.欧美三级电影.com| 日韩国产亚洲欧美| 26uuu精品一区二区三区四区在线| 天堂8在线天堂资源bt| 国产精品777777在线播放| 色婷婷av一区二区三区在线观看| 无码一区二区三区| 久久久久久久电影| av观看免费在线| 伊人成综合网yiren22| 亚州成人av在线| 手机在线精品视频| 亚洲成人精品影院| 亚洲色图14p| 国产欧美亚洲一区| 久精品国产欧美| 中文在线免费视频| 亚洲免费电影一区| 免费的毛片视频| 国产日韩欧美激情| 在线观看免费污视频| 色综合久久一区二区三区| 国产原创欧美精品| а√天堂官网中文在线| 欧美一级高清大全免费观看| 青娱乐国产在线| 成人午夜电影小说| 欧美日韩成人免费视频| 亚洲电影男人天堂| 国产精品wwwwww| 在线免费观看黄色网址| 777奇米成人网| 久久国产在线观看| 99精品欧美一区二区蜜桃免费| 国产亚洲欧美在线视频| 国产区精品区| 91精品久久久久久久久久久| 99在线视频观看| 欧美精品一区二| 国产suv精品一区二区33| 日本一区二区三区视频视频| 五月天婷婷亚洲| 国产精品黄色| 欧美极品一区| 伊人久久大香| 91国内精品久久| xxxxx日韩| 欧美一级二级三级蜜桃| 亚洲国产成人精品激情在线| 国产欧美一区二区精品性色超碰| 911福利视频| 国产情侣久久| 亚洲永久激情精品| 啪啪激情综合网| 国产精选久久久久久| 久久香蕉av| 国产亚洲a∨片在线观看| 国产口爆吞精一区二区| 欧美午夜精品久久久久久久| 日韩一区二区三区四区视频| 成人一区在线看| 少妇网站在线观看| 亚洲视频免费| 亚洲欧美综合一区| 嗯用力啊快一点好舒服小柔久久| 国产a级全部精品| 先锋成人av| 一本色道久久88综合亚洲精品ⅰ| 精品国产亚洲一区二区麻豆| 色婷婷精品大视频在线蜜桃视频| 天堂网avav| 国产午夜久久久久| 亚洲av无码专区在线播放中文| 日本在线不卡视频一二三区| 成年人看的毛片| 99精品美女| 日韩aⅴ视频一区二区三区| 波多野结衣欧美| 成人网欧美在线视频| 澳门成人av网| 国a精品视频大全| 很黄的网站在线观看| 亚洲性视频网址| 天天干天天爱天天操| 91精品国产福利在线观看| 亚洲中文一区二区| 性做久久久久久久免费看| 波多野结衣亚洲一区二区| 久久久99精品免费观看| 亚洲av熟女高潮一区二区| 国产一区视频网站| 亚洲欧洲日本精品| 丝袜美腿亚洲色图| 一本大道熟女人妻中文字幕在线| 欧美不卡在线| 亚洲色婷婷久久精品av蜜桃| 欧美少妇性xxxx| 欧美精品久久久| 亚洲老女人视频免费| 精品一区二区不卡| 国产精品色呦| 3d动漫啪啪精品一区二区免费 | 青青草免费av| 中文字幕一区二区视频| 国产精品久久久视频| 久久久久久久久久电影| 一区二区三区少妇| 99re6这里只有精品视频在线观看 99re8在线精品视频免费播放 | 国产高清视频色在线www| 欧美高清在线观看| 性直播体位视频在线观看| 美女啪啪无遮挡免费久久网站| 日韩精品毛片| 日韩日本欧美亚洲| 久久久久久艹| h视频网站在线观看| 亚洲女人天堂视频| 久久精品a一级国产免视看成人| 亚洲摸下面视频| 国产精品一区二区三区四区色| 亚洲人成绝费网站色www| 欧美婷婷久久五月精品三区| 亚洲欧洲偷拍精品| freemovies性欧美| 日韩在线视频国产| www.久久ai| 国色天香2019中文字幕在线观看| 免费影视亚洲| 91国在线精品国内播放| 性爽视频在线| 国产精品普通话| av国产精品| 国产一区二区三区高清| 黄色免费大全亚洲| 欧美午夜欧美| 日韩欧美一区二区三区在线视频 | 欧美性做爰猛烈叫床潮| 中文字幕在线视频免费| 欧美电影一区二区三区| 精品人妻少妇AV无码专区| 欧美精品一区在线观看| 欧美亚洲日本| 久久久精品一区| 国产精选在线| 国产精品欧美亚洲777777| 国产情侣一区在线| 激情欧美一区二区三区中文字幕| 少妇精品久久久| 永久免费在线看片视频| 亚洲精品免费观看| 性欧美极品xxxx欧美一区二区| 精品午夜一区二区三区在线观看| 逼特逼视频在线观看| 国产午夜精品一区二区三区嫩草| 一级片一级片一级片| 午夜天堂影视香蕉久久| 最新国产中文字幕| 欧美成人福利视频| 国产三级电影在线| 欧美极品欧美精品欧美视频| 欧美xxx网站| 91成人免费看| 国际精品欧美精品| r级无码视频在线观看| 青青草国产成人99久久| 又大又长粗又爽又黄少妇视频| 久久色在线视频| 黄色一级片在线免费观看| 91国产免费看| 人妻无码中文字幕| 色噜噜狠狠色综合网图区| 狠狠操一区二区三区| 成人字幕网zmw| 国产精品片aa在线观看| 91精品国产毛片武则天| 日韩在线一区二区三区| 国产激情视频网站| 亚洲人成在线播放网站岛国| 夜夜躁日日躁狠狠久久av| 亚洲第五色综合网| 精品国产丝袜高跟鞋| 日韩免费在线看| 国产suv精品一区| 色爽爽爽爽爽爽爽爽| 日本欧美在线观看| 国产精品边吃奶边做爽| 亚洲一区电影777| 国产婷婷在线视频| 中文字幕免费精品一区| 成人亚洲欧美| 国产综合av一区二区三区| 欧美一区国产在线| 日本中文字幕影院| 中日韩免费视频中文字幕| 国产精品一区二区三区四| 精品国产乱码久久久久久蜜臀| 黄色在线视频网站| 亚洲巨乳在线| 欧美xxxxx在线视频| av电影在线观看完整版一区二区| 在线观看成人毛片| 69成人精品免费视频| 日本中文字幕在线看| 国产精品久久久久久久av大片| 亚洲最大在线| 日韩 欧美 高清| 久久久久久一级片| 精品免费囯产一区二区三区 | 久cao在线| 成人免费网站在线观看| 久久影院100000精品| 日日噜噜夜夜狠狠| 中文在线资源观看网站视频免费不卡| 亚洲国产成人精品女人久久| 亚洲欧美国产va在线影院| 亚洲精华液一区二区三区| 欧美高清性xxxxhd| 日韩精品免费专区| 国产aaaaaaaaa| 4438成人网| 伊人222成人综合网| 99一区二区三区| 亚洲精品美女91| 中文字幕人妻一区二区| 在线观看一区二区视频| 国产区在线视频| 国产欧美在线观看| 亚洲乱码电影| av av在线| 色狠狠一区二区三区香蕉| eeuss影院www在线观看| 91九色国产在线| 黄色工厂这里只有精品| 粉嫩av懂色av蜜臀av分享| 欧美日韩中国免费专区在线看| 六十路在线观看| 国产日韩中文在线| 国产精品vip| 成人免费网站黄| 51精品视频一区二区三区| 岛国片av在线| 日本午夜精品一区二区三区| 麻豆成人av在线| 久久中文字幕在线观看| 国产丝袜一区二区三区| 欧美日韩成人影院| 裸体裸乳免费看| 99久久久久免费精品国产| 最新黄色网址在线观看| 欧美激情亚洲视频| 国产一区日韩| 精品人妻一区二区三| 激情成人在线视频| 色网站免费在线观看| 国产精品视频500部| 蜜臀av国产精品久久久久| 欧美精品色哟哟| 在线观看国产欧美| 99这里只有精品视频| 黑人粗进入欧美aaaaa| 艳妇臀荡乳欲伦亚洲一区| 激情小视频在线观看| 亚洲bt天天射| 日本欧美韩国一区三区| 国产真人真事毛片| 中文字幕欧美在线| 久久夜色精品国产噜噜av小说| 永久免费的av网站| 欧美日韩在线一区|