精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

王晶晶:京東零售海量日志數據處理實踐

大數據 新聞
本次分享主要從三個方面介紹京東流量場下的數據處理方案,同時也會結合京東實際場景案例,介紹京東在流量場下的一些數據應用和實踐。

01 京東零售流量數倉架構

1. 京東零售——流量簡介

① 什么是流量? 

簡單來說,流量就是用戶作用在京東頁面上,產生一系列行為數據的集合。

② 流量數據的來源

數據來源主要是移動端和PC端,以及線下店、外部采買、合作商的數據等。

圖片?

這些數據是如何流轉到數倉的呢?

2. 京東零售——流量數據處理架構

由架構圖可以看出,對不同的終端采取不同的采集模式;例如,對APP原生頁面采取SDK的采集模式,對于PC、H5頁面是JS采集,數據采集后按照實時和離線雙寫,離線直接寫到CFS分布式文件系統中,每小時從CFS拉取數據文件,同時對數據文件大小、采集ip進行監控,防止數據丟失;實時是以白名單的方式動態配置,寫到kafka中,最后將數據入倉。

圖片?

3. 京東零售——流量數倉分層介紹

圖片

數據流轉到數倉會進行一些統一化的管理,數倉是如何分層的呢?

受京東業務復雜度和數據體量的影響,整體分層較細,分為:數據緩沖層(BDM)、貼源數據層(FDM)、基礎數據層(GDM)、公共數據層(ADM)、應用數據層(APP)五層。

① BDM層

是源業務系統的一些數據,會進行永久性保存。

② FDM層

主要是從報文日志轉化成業務格式,對業務字段進行拆解、排序和數據回寫等,例如用戶逛京東時前期未登錄,最終下單時才登陸,那對用戶全鏈路回寫便是在這一層進行。

③ GDM層

按照主題域進行標準化封裝,整體會屏蔽生產系統干擾,同時會處理數據回灌事情。

④ ADM層

ADM是公共數據層,面向主題、面向業務過程的數據整合,目前劃分成兩層:ADM-D、ADM-S。

ADM-D負責統一的數據口徑封裝,提供各主題統一維度和指標的最細粒度數據;

ADM-S提供各主題統一維度和指標的聚合數據, 為各業務方提供統一口徑的共享數據。

⑤ APP層

數據看板的數據整合,也可以進行一些跨主題的聚合數據處理。

⑥ 維度層

DIM層主要就是一些通用的維度數據。

基于以上的數倉分層方案,來看下京東流量數倉架構在離線和實時上別分是如何處理的。

4. 京東零售-流量離線數倉架構

圖片

① 基礎數據層

離線數倉最下面一部分是基礎數據,主要面向實體模型建設,按照數據渠道和不同類型做數據整合,例如渠道:app、pc、m等;日志類型:瀏覽、點擊、曝光等。

② 公共數據層

這一層也是大家應用比較廣泛的一層,上面也提到了adm面向業務過程的模型建設,這層也是分成了明細和匯總兩層。在明細層,我們會把所有的業務口徑沉淀到adm明細中,封裝各種業務標識,保障數據口徑統一管理,避免口徑二義性,同時,為數據可視化管理,提供源數據依賴。

③ 應用數據層

應用層主要是面向數據看板的建設,提供預計算和OLAP兩種方式服務模式,這一層整體上會很薄,重點解決數據引擎查詢效率問題,高頻訪問的維度提供預計算、低頻應用的數據由OLAP方式提供數據服務。

④ 數據服務層

面向多維數據分析場景,進行指標和維度的統一管理,以及服務接口的可視化管理,對外提供統一的數據服務。

5. 京東零售——流量實時數倉架構

實時數倉與離線數倉的建設理念是基本一致的。

RDDM是分渠道、分站點、分日志類型的實時數據流,構建過程中主要考慮解耦,如果只消費部分數據,依然需要全量讀取,對帶寬、i/o都是一種浪費。同時,也方便下游按照業務實際情況進行數據融合。

RADM面向業務場景,在RDDM的基礎上進行整體封裝整合,例如商詳、來源去向、路徑樹等業務場景。

在整體封裝后,數據會接入到指標市場,按照統一的接口協議和元數據管理規范進行錄入,對外提供統一的數據服務。

以上主要介紹了京東流量場景的數據處理架構,接下來我們結合一個京東實際案例,講述京東特殊場景下的數據處理方案。

圖片?

02 京東零售場景的數據處理

1. 京東零售——流量挑戰

首先是數據爆炸式的增長。2015年至今,整體的數據量翻了約十幾倍,但資源情況并沒有相應成比例的增長。其次,業務的復雜度升高,包括新增了小程序、開普勒、線下店的一些數據以及并購的企業的數據等,因此整體的數據格式以及完備度上還是存在較大差異的。再次,隨著業務發展,流量精細化運營的場景增多,但數據服務的時效并沒有較大變化,需要我們在有限時間內處理一些更多更大體量的數據,以滿足更多場景化應用。特別是京東刷崗這樣的場景,對數據的范圍、需要處理的數據量,以及數據時效都是一個比較大的挑戰。

圖片?

2. 海量數據更新實踐——刷崗

什么是刷崗?將發生在該SKU的歷史事實數據,按照最新的SKU對應運營人員、崗位、部門等維度信息,進行歷史數據回刷。

圖片?

刷崗在京東也經歷了多個階段,從最初數據量較小,采取全量刷崗的模式,后續逐漸升級成增量的刷崗。后續采取OLAP的刷崗模式,也就是將數據寫到CK中,通過Local join進行關聯查詢。目前我們通過iceberg+olap的方式來實現數據刷崗。

首先構建iceberg表;其次、對流量商品表的更新處理,將所有會發生變化的字段拼接做MD5的轉化,后續每天做這種差異化的判斷,如果有變化就做upsert操作;最后,生成的流量商品表與事實表進行merge into,進而得到刷崗更新后的數據;同時在此數據基礎上,針對不同應用頻率的數據,采取了預計算和OLAP兩種數據服務模式。

通過數據湖的方式來實現數據更新,相比于hive存儲格式,支持多版本并發控制,同時支持ACID事務語義,保障他的一致性,數據在同一個批次內提交,要么全對,要么全錯,不會更新一部分。另外,支持增量數據導入和更新刪除能力,支持upsert操作,整天數據處理的復雜度要降低很多,同時在資源的消耗和性能以及數據處理范圍上較hive端模式都有了極大的提升。

基于數據湖的模式進行刷崗目前還面臨數據傾斜的問題需要解決。

圖片

3. 數據傾斜治理方案

圖片?

① 數據傾斜的原因及處理方式

數據傾斜出現的一個主要原因是數據分布不均,出現熱點key。對于數據傾斜的處理方案,比較常見的有:優化參數,如增加reduce的個數、過濾一些異常值、賦隨機值,或者按經驗值設置固定閾值,把大于某閾值的數據單獨處理。賦隨機數的處理方式,當任務執行過程中,某個節點異常,切換新節點重新執行,隨機數據會發生變化,導致數據異常。通過這種經驗值設定閾值的一個弊端是,在不同的場景下,不容易界定閾值大小,包括對于熱點key的識別,通常也只能事后發現處理。

圖片

② 數據傾斜的解決方案

基于此,我們在探索的過程中建立了一套智能監測傾斜的任務。

首先,利用實時的數據,提前對數據進行監測,針對數據分布特點,通過3倍標準差確定離群點,離群點即傾斜閾值。

其次,根據傾斜閾值計算分桶數量。

最后,按照對列資源在不同時段的健康度進行作業編排。

③ 如何尋找熱點key及傾斜閾值

熱key尋找的核心思想,就是根據數據的分布特點,通過3倍標準差確定離群點,離群點即傾斜閾值,如下圖所示,整體的數據是呈右偏分布,我們通過兩次3倍標準差得到最后的傾斜閾值X2。

第二步計算分桶的數量,根據整體的數據分布情況看,第一階段的拒絕域面積與第二階段的拒絕域面積相等。根據積分原理,頻率絕對數與頻次絕對數呈反比,因概率密度分布曲線未知,所以用兩次離群點的頻次均值比例,代表兩次抽樣數據量比例,進而得到分桶數。

圖片?

④ 數據分桶作業

最后是作業編排,一次性起多個任務會出現資源獲取不到,一直處于等待狀態,同時對其他的任務也會產生較大影響,并發少了又會帶來資源浪費,針對這類問題,我按照對列資源的健康度,對執行的任務做了編排,由整體串聯執行和固化并發,調整為按資源健康度動態擴展,實現資源利用最大化。

圖片

03 數據處理架構未來探索

?未來探索方向

首先,目前我們基于Flink+Spark的方式來做流批一體的探索。圖中可以看到傳統的Lambda數據架構有一個很大的特點:實時和離線是兩套不同的數據鏈路。整體的數據處理過程中,研發的運維成本相對較高,而且兩條不同的數據鏈路,會容易導致數據口徑上的差異。

后續通過FlinkSQL+數據湖存儲實現同一套代碼兩種計算模式,同時保證計算口徑一致性。同時也會有一些挑戰,開發模式的改變,CDC(change data capture)延遲目前是分鐘級延遲,如果調整為秒級,頻繁提交,會生成很多小版本,對數據湖的吞吐量造成影響,總體來說,在部分應用場景下存在一定局限性,但分鐘級延遲可以滿足大多數的實時應用場景,對于研發成本和效率都會有較大提升,當然,目前也在不斷的完成和探索。總體來說,目前在一些特殊場景下具有一定的局限性。

圖片?

04 問答環節

Q:分桶的應用效果?

A:總結成幾個點就是:

  • 從事后處理轉變為事前監測。
  • 不同周期、不同場景下動態計算傾斜閾值和分桶數量。
  • 根據對列資源健康度動態擴展任務并發數量,實現資源利用最大化。

Q:Spark的應用在京東場景里最小的延遲是多少? 

A:目前主要是基于小站點數據去做探索,數據處理量級比較小,目前延遲大概在分鐘級左右,如提交的頻率增大,對于io的性能會是一個很大的考驗。

Q:Spark應該是不支持行級別的upsert,京東這邊是怎么去解決這個問題的問題,分區和小文件的合并有哪些相關的經驗分享?

A:目前的版本可以支持行級更新,關于分區這部分主要還是結合業務特性,在設計分區時,盡量讓變化的數據都集中到少部分文件上,降低文件更新范圍。

今天的分享就到這里,謝謝大家。

責任編輯:張燕妮 來源: DataFunTalk
相關推薦

2021-09-17 18:40:55

京東mPaaS移動端

2022-05-18 13:24:47

京東調優實踐

2023-01-30 15:22:31

2024-07-11 08:09:21

2018-06-06 17:39:03

2024-02-07 09:25:52

數據處理快手大模型

2019-03-21 19:19:35

新零售阿里云零售云

2018-03-20 09:56:50

新零售

2017-09-30 10:00:41

2018-12-08 11:17:50

2019-07-17 05:33:33

零售物聯網IOT

2021-09-15 16:41:20

京東零售云Flutter熱重載

2012-07-23 16:22:07

Oracle

2017-09-27 10:48:31

2017-07-06 12:48:35

大數據動向新零售

2012-11-26 09:27:07

零售儀表盤大數據

2021-09-16 18:44:05

京東云PaaS平臺Android

2021-07-23 10:25:41

物聯網IOT智能零售
點贊
收藏

51CTO技術棧公眾號

成人高潮片免费视频| 青青青视频在线免费观看| 亚洲第一av| 国产亚洲美州欧州综合国| 国产日韩专区在线| 欧美日韩精品在线观看视频| 日韩欧美ww| 在线播放欧美女士性生活| wwwwww欧美| 国产高清视频在线播放| 激情六月婷婷久久| 国产91精品视频在线观看| 国产一区第一页| 天堂99x99es久久精品免费| 欧美日韩一区二区三区视频| 国产在线播放观看| 顶级网黄在线播放| 久久精品一区二区三区av| 91精品视频网站| 亚洲 欧美 成人| 国产综合色产| 日韩视频免费在线观看| 毛片网站免费观看| 婷婷视频一区二区三区| 欧美午夜电影一区| 免费av观看网址| 欧美家庭影院| 亚洲免费观看在线视频| 色一情一乱一伦一区二区三欧美| 成人午夜视频一区二区播放| 国内一区二区视频| 国产精品极品美女在线观看免费 | 国产精品久久久国产盗摄| 99成人在线| 久久久久久久久久久成人| chinese全程对白| 加勒比久久综合| 亚洲精品国偷自产在线99热| 最新日本中文字幕| 韩国一区二区三区视频| 欧美日韩国产另类一区| 欧美性猛交久久久乱大交小说 | 国产精品久久久久久久免费观看| 亚洲精品自拍视频| 超碰caoprom| 99a精品视频在线观看| 日韩午夜激情av| 九九热视频免费| 亚洲美女色播| 在线电影一区二区三区| av免费一区二区| 精品九九久久| 欧美精品日日鲁夜夜添| 男女视频在线看| 91精品店在线| 欧美天堂一区二区三区| 亚洲 欧美 日韩系列| 91成人在线| 欧美精品黑人性xxxx| 杨幂毛片午夜性生毛片 | 在线中文字幕第一页| 亚洲欧美精品午睡沙发| 日韩一二区视频| 黄色影院在线看| 午夜精品久久久久久久99水蜜桃| www.国产在线视频| 鲁鲁在线中文| 色94色欧美sute亚洲线路一ni | 国产一区二区三区四区五区入口 | 99视频在线视频| 草莓视频成人appios| 欧美日韩国产综合久久| 亚洲一区二区偷拍| www.成人网| 日韩电影在线观看永久视频免费网站| 三级电影在线看| 精品视频免费在线观看| 日韩在线免费高清视频| 欧美精品videos极品| 一区在线观看| 国产精品69av| 国产高清精品软件丝瓜软件| jizz一区二区| 亚洲综合首页| 成人免费图片免费观看| 欧美亚洲自拍偷拍| 日本黄色一级网站| 任我爽精品视频在线播放| 亚洲人成欧美中文字幕| 午夜精品一区二区三级视频| 一区视频在线| 国产久一一精品| 亚洲国产www| 久久精品人人做| 久久精品在线免费视频| 天堂在线中文网官网| 欧美日韩一级大片网址| 少妇伦子伦精品无吗| 国产一区二区精品福利地址| 欧美理论片在线观看| 在线免费观看av网址| 国产黄色91视频| 欧美在线视频二区| 男女视频在线| 欧美日韩性生活| 亚洲久久久久久| 亚洲澳门在线| 日韩免费在线视频| 成人午夜视频一区二区播放| 国产精品久久影院| 大j8黑人w巨大888a片| 高清久久一区| 原创国产精品91| 色婷婷av国产精品| 国产精品一区二区不卡| 天堂av一区二区| 交100部在线观看| 日韩视频中午一区| 极品尤物一区二区| 久久国产日韩| 国产日韩欧美综合精品| 91中文在线| 欧美日韩综合一区| 久久午夜福利电影| 亚洲视频大全| 超碰97在线人人| 拍真实国产伦偷精品| 色噜噜夜夜夜综合网| 亚洲永久无码7777kkk| 欧美91视频| 91香蕉国产在线观看| 91在线免费看| 欧美在线视频你懂得| 亚洲第一成人网站| 一本一道久久综合狠狠老精东影业| 2014亚洲精品| www红色一片_亚洲成a人片在线观看_| 精品视频1区2区3区| 手机看片日韩av| 久久性天堂网| 日本在线免费观看一区| a欧美人片人妖| 日韩成人中文字幕| 日本三级视频在线| 不卡大黄网站免费看| 拔插拔插海外华人免费| 成人高潮视频| 午夜精品视频网站| 天堂中文在线资源| 欧美日韩国产一中文字不卡| 国产精品无码电影| 亚洲一区二区网站| 欧美黑人3p| 在线日本欧美| 在线免费看av不卡| 在线免费观看中文字幕| 国产精品久久久99| 天堂av8在线| 最新国产精品| 国产高清在线一区| 午夜激情电影在线播放| 亚洲日本成人女熟在线观看| 欧美成人一区二区三区四区| 欧美国产综合色视频| 色噜噜狠狠永久免费| 7777久久香蕉成人影院| 99精彩视频在线观看免费| 538视频在线| 日韩激情av在线免费观看| 成人一二三四区| 国产精品国产a| 中国特级黄色片| 亚洲一区二区伦理| 五月婷婷综合色| 美女国产精品久久久| 久久免费精品日本久久中文字幕| 天天操天天干天天操| 色噜噜狠狠色综合中国| 成人一级黄色大片| av综合在线播放| av无码精品一区二区三区| 国产韩日影视精品| 国产精品中出一区二区三区| 韩国成人动漫| 久久天天躁狠狠躁夜夜躁| 欧美视频一二区| 欧洲精品一区二区| 免费在线观看av网址| 久久蜜桃av一区精品变态类天堂 | 日韩在线视频免费播放| 国产精品午夜电影| 麻豆短视频在线观看| 日韩精品一二三四| 台湾无码一区二区| 欧美猛男做受videos| 亚洲综合色激情五月| 成人美女视频| 欧美人与性动交| av在线免费观看网| 精品sm在线观看| 一级黄色片在线观看| 欧美性猛xxx| 午夜69成人做爰视频| 久久免费偷拍视频| 女女调教被c哭捆绑喷水百合| 日韩精品久久久久久| 欧美一级视频在线播放| 成人精品天堂一区二区三区| 精品婷婷色一区二区三区蜜桃| 日韩黄色碟片| 国产成人免费av| 91色在线看| 久久99久久久久久久噜噜| 国产人成在线视频| 亚洲精品国产精品国产自| 国产视频第二页| 欧美日韩一区中文字幕| 一级黄色免费网站| 亚洲国产成人91porn| 天天做夜夜爱爱爱| 国产精品午夜在线| 摸摸摸bbb毛毛毛片| 99国产精品久久久| 久久久久久无码精品人妻一区二区| 男女激情视频一区| 男女av免费观看| 中文欧美日韩| 成人精品视频在线播放| 四季av一区二区三区免费观看| 欧美日韩高清免费| 日本中文字幕在线一区| 国产激情一区二区三区在线观看 | gay欧美网站| 57pao成人国产永久免费| 欧美寡妇性猛交xxx免费| 欧美成人久久久| 麻豆视频在线观看免费网站| 中文字幕在线观看亚洲| 国内精品在线视频| 亚洲午夜色婷婷在线| 国际av在线| 一区二区三区国产视频| 蜜桃视频在线播放| 一本大道久久加勒比香蕉| 精品乱码一区二区三四区视频| 亚洲免费高清视频| 免费看男男www网站入口在线| 亚洲免费伊人电影在线观看av| 毛片在线免费| 伊人亚洲福利一区二区三区| av电影在线观看| 日韩日本欧美亚洲| 国产鲁鲁视频在线观看特色| 久久久黄色av| 国产蜜臀在线| 欧洲成人性视频| 国产69精品久久| 成人免费大片黄在线播放| www欧美在线观看| 国产精品国产精品国产专区蜜臀ah| 91成人短视频| 欧美日本亚洲| 性xxxx欧美老肥妇牲乱| 中文字幕の友人北条麻妃| 欧美成熟视频| 久久视频这里有精品| 丝袜美腿亚洲一区二区图片| 国产wwwxx| 国产精品一级片在线观看| 污网站免费观看| 久久先锋资源网| 国产3级在线观看| 一区二区欧美在线观看| 青青草成人av| 欧美人与性动xxxx| 免费av网站在线播放| 亚洲欧美国产精品va在线观看| 成年人在线观看视频| 麻豆国产va免费精品高清在线| 丁香花电影在线观看完整版| 国产精品99久久久久久人| 国产精品高清一区二区| 精品亚洲欧美日韩| 久久一本综合| 欧美一级欧美一级| 毛片一区二区三区| 成人在线观看一区二区| 国产人伦精品一区二区| 久久无码精品丰满人妻| 欧美亚洲禁片免费| 成人激情四射网| 在线免费观看羞羞视频一区二区| 日韩伦理av| 国产精品麻豆va在线播放| 99国产精品免费网站| 手机看片福利永久国产日韩| 极品裸体白嫩激情啪啪国产精品| 亚洲 中文字幕 日韩 无码| 盗摄精品av一区二区三区| wwwww黄色| 黄色精品在线看| 99热精品在线播放| 亚洲欧洲在线免费| 国产一线二线在线观看| 国产精品小说在线| 日本一道高清一区二区三区| 在线视频一二三区| 玖玖视频精品| av无码一区二区三区| 日韩大片在线永久免费观看网站| 亚洲成年人在线播放| 秋霞午夜在线观看| 国产福利精品视频| 好吊妞视频这里有精品| 日本黄色a视频| 日本强好片久久久久久aaa| www国产视频| 亚洲香肠在线观看| 国产精品欧美久久久久天天影视| 国产一区二区三区三区在线观看| а√天堂中文在线资源8| 91免费在线观看网站| 水蜜桃久久夜色精品一区| 成年人小视频网站| 91在线你懂得| 国产无遮挡aaa片爽爽| 日韩精品一区二区三区四区 | 国产精品久久久久久久久动漫| 好看的av在线| 亚洲激情自拍图| 成人国产电影在线观看| 国产精品亚洲一区| 欧美大片一区| 久久久久久久久久久影视| 综合久久给合久久狠狠狠97色| 国产91av在线播放| 亚洲欧洲在线免费| 日韩高清在线| 日韩偷拍一区二区| 日本亚洲天堂网| wwwww黄色| 欧美日韩视频一区二区| 在线激情小视频| 成人国产精品免费视频| 99re66热这里只有精品8| 亚洲免费一级视频| 国产精品久久午夜| 国产精品久久久久久在线| 久色乳综合思思在线视频| 免费精品一区| 成年丰满熟妇午夜免费视频 | 九九热久久66| 香蕉久久夜色精品国产| 香蕉视频黄色在线观看| 91国在线观看| 快射视频在线观看| 91夜夜未满十八勿入爽爽影院 | 99免费视频观看| 国产精品美女久久久久久久| 国产一区二区三区视频免费观看| 久久人人爽亚洲精品天堂| www.久久热| 大伊香蕉精品视频在线| 久久亚洲综合av| 伊人亚洲综合网| 欧美精品在线免费观看| 豆花视频一区二区| 久久无码高潮喷水| 欧美国产欧美综合| 国产人妖在线播放| 国内精品久久久久伊人av| 男男gay无套免费视频欧美| 国产野外作爱视频播放| 亚洲综合丝袜美腿| 男女视频在线观看| 国产日韩欧美自拍| 亚洲国产99| 黄色国产在线播放| 日韩欧美在线综合网| 二区三区不卡| 最新精品视频| 成人av网站免费观看| 中文字幕在线天堂| 久操成人在线视频| 欧美日韩xxxx| 99国产精品免费视频| 色偷偷久久人人79超碰人人澡| 久久99精品久久| 精品视频高清无人区区二区三区| 蜜桃一区二区三区在线| 久久精品国产亚洲av无码娇色 | 日韩黄色免费电影| 波多野结衣亚洲色图| 亚洲男人天天操| 日本一区二区乱| 免费日韩中文字幕| 亚洲丰满少妇videoshd| 在线观看的av| 精品视频一区二区三区四区| 国产精品一二三四五|