精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

用戶離線實時畫像融合實踐得物技術(shù)

開發(fā) 后端
本文主要講述用戶畫像在離線、實時方面的數(shù)據(jù)鏈路處理以及基于特定場景要求如何將離線、實時畫像進行在線融合的過程。

1、引言

用戶畫像,即用戶信息標簽化,它本質(zhì)是對用戶的一種建模,能夠幫助企業(yè)快速找到精準用戶群體以及用戶需求等更為廣泛的反饋信息,在現(xiàn)如今應(yīng)用越來越廣泛。本文主要講述用戶畫像在離線、實時方面的數(shù)據(jù)鏈路處理以及基于特定場景要求如何將離線、實時畫像進行在線融合的過程。

2、背景

目前的算法畫像服務(wù)分為兩部分,一部分是離線畫像,也就是批處理計算層,依賴DataWorks每天T+1的調(diào)度處理。批處理層是通過處理所有的已有歷史數(shù)據(jù)來實現(xiàn)數(shù)據(jù)的準確性。這意味著它是基于完整的數(shù)據(jù)集來重新計算的,能夠修復(fù)數(shù)據(jù)錯誤;另一部分是實時畫像,它的數(shù)據(jù)處理依賴流式計算層Flink。根據(jù)用戶實時的行為數(shù)據(jù)進行流式處理實時更新用戶畫像。由于兩種模式提供的狀態(tài)差異,所以需要我們?yōu)榕幚砗土魈幚硖峁┎煌姆?wù)層并在這個上面做合并處理。基于此,需要我們基于離線和實時畫像進行融合處理。

整個的數(shù)據(jù)鏈路大致如下:

主要分為三部分:批處理層、流處理層、數(shù)據(jù)融合層。接下來逐一講解每層的數(shù)據(jù)鏈路處理。

3、批處理層

批處理層依賴于定時調(diào)度,基于用戶日常的行為數(shù)據(jù)通過批處理過程以精確地計算用戶的離線畫像。離線畫像一方面用作補充實時鏈路的數(shù)據(jù)問題;另一方面是當用戶冷啟動時,如何進行用戶畫像的補充,在算法側(cè)請求時能夠拿到這部分用戶的畫像。同時在離線畫像數(shù)據(jù)加工完成后,需要考慮將這部分ODPS中的離線畫像及時地更新到用戶畫像服務(wù)中。在這里我們采取懶加載的方式,將離線畫像存儲到HBASE中,后續(xù)基于用戶當天第一次啟動App時,將用戶的離線畫像進行加載,這部分懶加載流程會在下文講解。

數(shù)據(jù)鏈路如下:

主要分為兩個部分:

a、每天定時調(diào)度生成日活用戶的離線畫像T+1,導(dǎo)入HBASE中。

b、基于步驟1的完成,向HBASE中記錄一條Log,代表當天T+1的離線畫像已經(jīng)成功寫入,Log中包含當天畫像的數(shù)據(jù)量、畫像的版本號及完成時間。這里的Log實際是作為標志位,用于判斷T+1畫像的完整性,后續(xù)懶加載流程會利用當天的Log來判斷是否加載離線畫像以及加載幾次。

4、流處理層

這里的流處理層分為兩塊,一塊是實時畫像,訂閱用戶的實時行為數(shù)據(jù)進行Flink處理而來;另一塊實際是對批處理層提供的離線畫像進行處理,基于用戶的實時登錄行為懶加載離線畫像。

上文提到在批處理層將用戶離線畫像導(dǎo)入HBASE后,通過懶加載的方式將離線畫像加載到畫像融合框架。

整個懶加載流程如下:

大致分為如下幾個步驟:

a、訂閱用戶的登錄行為埋點APPSTART。

b、根據(jù)訂閱的用戶登錄行為加載HBASE中的離線畫像。這里有一點需要說明的就是上述提到HBASE中的畫像Log記錄,利用Log來判斷是否需要加載畫像。假設(shè)當天T+1的畫像已經(jīng)完整的導(dǎo)入到HBASE中,當天用戶第一次登錄時,就會Load離線畫像,同時利用Flink的State記錄當天用戶已經(jīng)加載了T+1畫像,后續(xù)用戶當天再次登錄時就不會再Load離線畫像,做到當天只加載一次T+1畫像,降低HBASE的訪問壓力;相反如果用戶當天登錄時,T+1畫像并沒有Log記錄, Load畫像時State會記錄用戶當天加載了T+2畫像,后續(xù)只有當T+1畫像完成后用戶再次登錄,才會去獲取一次最新的離線畫像,同時更改State記錄。

c、讀取標簽配置表,根據(jù)對應(yīng)標簽的配置信息將畫像的格式、類型進行轉(zhuǎn)換滿足算法側(cè)的使用。

d、將轉(zhuǎn)換后的畫像統(tǒng)一成畫像框架消費的Action格式發(fā)送到消息隊列中,供后續(xù)融合框架消費和實時畫像進行融合。

懶加載的流程整體上就是上面所述,在這里有一點補充就是步驟1中訂閱的用戶登錄埋點APPSTART。在實際中由于受到埋點上報延遲、網(wǎng)絡(luò)等一系列原因,可能會導(dǎo)致部分用戶離線畫像加載的延遲,用戶請求時離線畫像尚未加載到,造成畫像覆蓋率降低。基于此,我們通過訂閱用戶的Init數(shù)據(jù)(先于推薦流請求)作為補充觸發(fā)事件來加載離線畫像,從而進一步提升畫像覆蓋率。

另外就是Log中版本號的概念,主要是為了容錯,防止出現(xiàn)畫像數(shù)據(jù)版本當天迭代更新。我們要求每次迭代version都要對應(yīng)+1,這樣當用戶登錄時假如當天的version出現(xiàn)了變化會再次加載最新的版本畫像,從而保障用戶加載的離線畫像版本是最新的。

接下來看下實時畫像的數(shù)據(jù)鏈路,整個流程如下:

大致分為如下幾個步驟:

1)Flink訂閱用戶行為數(shù)據(jù),根據(jù)畫像具體的業(yè)務(wù)要求處理行為數(shù)據(jù)。

2)將處理后的行為數(shù)據(jù)構(gòu)建畫像框架統(tǒng)一的Action算子發(fā)送到Kafka中。Action中包含標簽名稱、標簽值、標簽對應(yīng)的處理算子、行為時間等相關(guān)信息。

3)畫像框架消費Action信息,根據(jù)配置的信息做對應(yīng)的算子類型處理。比如map、List、String等一系列類型處理。

4)將處理后的實時畫像寫入Redis。 離線畫像的懶加載流程和實時畫像處理流程大致如上,最終目的是要按照框架Action格式發(fā)送到Kafka中供畫像框架融合使用,達到離線和實時畫像的合并。

5、畫像融合層

基于批處理層和流處理層的畫像數(shù)據(jù),我們需要將離線畫像和實時畫像進行融合處理。

首先需要明確的一點就是離線、實時畫像的數(shù)據(jù)格式一定要統(tǒng)一,否則談不上融合。同時在數(shù)據(jù)處理的口徑上也是要統(tǒng)一的,這樣做的好處是校驗數(shù)據(jù)時容易追溯、定位問題。

那如何進行畫像融合呢?這里以具體的標簽舉例。假如標簽a是用戶的點擊行為序列List,序列中包含用戶點擊商品cspuId、用戶行為時間、商品推薦渠道等信息。標簽a的數(shù)據(jù)格式如下:

[
{"cspuId":111, "et":1663234014003, "channel":1},
{"cspuId":222, "et":1663234030023, "channel":2},
{"cspuId":333, "et":1663234050083, "channel":3},
{"cspuId":444, "et":1663234085048, "channel":4}
......
]

在畫像配置表中,我們首先會配置標簽a的相關(guān)信息,比如sizeLimt為1000,排序字段為et,按照cspuId、et兩個字段去重等等信息。

在實時畫像層,我們知道用戶實時的點擊行為會產(chǎn)生實時的點擊畫像數(shù)據(jù),假設(shè)產(chǎn)生的實時畫像數(shù)據(jù)如下:

{"cspuId":444, "et":1663234085048, "channel":4}

基于這個實時畫像數(shù)據(jù)我們會構(gòu)建統(tǒng)一的Action格式算子,實時的標簽a配置的處理算子是 list.rpush,代表將針對a標簽進行List的add操作。

在懶加載層,加載到的離線標簽a的數(shù)據(jù)格式如下:

[
{"cspuId":111, "et":1663234014003, "channel":1},
{"cspuId":222, "et":1663234030023, "channel":2},
{"cspuId":333, "et":1663234050083, "channel":3}
]

基于這個離線畫像我們也會構(gòu)建統(tǒng)一的Action格式算子,離線標簽a配置的處理算子是 list.rpushl,代表對a標簽進行List的addAll操作。

畫像融合框架消費Action消息隊列時,由于TTL的原因,假設(shè)Redis中用戶的a標簽數(shù)據(jù)已經(jīng)清空,在用戶冷啟動時畫像框架會根據(jù)消費到的離線標簽數(shù)據(jù)及對應(yīng)的操作算子將a標簽數(shù)據(jù)補充完整。與此同時用戶后續(xù)產(chǎn)生了上述實時的畫像,同樣道理根據(jù)對應(yīng)的操作算子將實時畫像add到標簽a中,當然會根據(jù)標簽a的配置信息比如大小,排序字段等取最近的sizeLimit畫像。

另外比如用戶的a標簽中數(shù)據(jù)已經(jīng)有歷史累積了,這時候離線畫像可以用作數(shù)據(jù)修復(fù)。畫像融合框架拿到離線畫像會結(jié)合已經(jīng)存在的a標簽數(shù)據(jù)進行去重,按照et排序等一系列操作,補充實時鏈路可能出現(xiàn)的數(shù)據(jù)丟失問題,最終得到完整的上述a標簽數(shù)據(jù)。

考慮到不同類型標簽的操作差異,畫像融合框架會根據(jù)需求定制不同的操作算子,這樣可以很靈活地處理算法側(cè)不同的標簽需求。

基于此,通過簡單的標簽舉例,能夠了解整個畫像融合的過程。當然實際中還有更多細節(jié)問題可以后續(xù)進一步分享。

6、總結(jié)

整個離線、實時畫像的融合鏈路整體上如上所述。從數(shù)據(jù)準備、數(shù)據(jù)加工、數(shù)據(jù)融合到最終提供完整畫像,實際上類似于Lambda架構(gòu)。當然在批處理層,考慮到不同業(yè)務(wù)域?qū)+1日活畫像完整性的要求,我們采用了不同的處理方式。比如直接將這部分日活畫像寫到Redis中而不是通過懶加載方式去更新,這樣可以讓算法側(cè)自身去結(jié)合實際場景融合使用。另外一點就是在批處理層是否能夠進一步優(yōu)化,降低維護成本,比如HBASE的中間存儲,目前也在探索基于每天生成離線畫像的snapshot,直接從ODPS進行Load使用,也是在進一步探索如何充分利用離線畫像的同時降低開發(fā)成本。

責(zé)任編輯:龐桂玉 來源: 得物技術(shù)
相關(guān)推薦

2023-03-30 18:39:36

2025-11-11 01:55:00

2025-03-20 10:47:15

2023-02-01 18:33:44

得物商家客服

2022-12-09 18:58:10

2023-12-27 18:46:05

云原生容器技術(shù)

2023-02-06 18:35:05

架構(gòu)探測技術(shù)

2023-10-09 18:35:37

得物Redis架構(gòu)

2025-03-13 06:48:22

2022-12-15 08:35:01

用戶畫像平臺

2023-02-08 18:33:49

SRE探索業(yè)務(wù)

2023-11-27 18:38:57

得物商家測試

2022-12-14 18:40:04

得物染色環(huán)境

2024-12-03 11:59:53

2022-12-02 18:45:06

SOP機器人技術(shù)

2023-08-09 20:43:32

2023-07-19 22:17:21

Android資源優(yōu)化

2017-02-09 11:34:57

大數(shù)據(jù)用戶畫像應(yīng)用實踐

2016-11-17 11:18:01

金融行業(yè)大數(shù)據(jù)用戶畫像

2022-10-26 18:44:33

藍紙箱設(shè)計數(shù)據(jù)
點贊
收藏

51CTO技術(shù)棧公眾號

中文字幕在线导航| 手机看片福利永久国产日韩| 欧美卡一卡二卡三| 福利在线一区| 日本精品一区二区三区四区的功能| 亚洲欧美在线网| 国产成人精品一区二三区四区五区| 极品日韩av| 国产亚洲精品91在线| 三级黄色片免费观看| 蜜桃视频在线观看免费视频| 欧美国产1区2区| 动漫3d精品一区二区三区| 亚洲天堂视频网站| 欧美a级在线| 亚洲网站在线观看| 蜜桃色一区二区三区| 91福利精品在线观看| 亚洲一区二区三区中文字幕| 日本在线成人一区二区| 亚洲av永久无码国产精品久久| 久久综合图片| 欧美精品xxx| 911国产在线| 一区二区小说| 精品国产乱码久久久久久闺蜜| 手机看片福利盒子久久| 国产极品人妖在线观看| 成人免费在线播放视频| 欧美精品一区二区三区在线看午夜| 97caocao| 日韩国产成人精品| 97高清免费视频| 欧美激情图片小说| 成人在线免费观看91| 日韩电影免费观看在线观看| av在线网站免费观看| 91综合国产| 色婷婷综合视频在线观看| 男人的天堂avav| а√中文在线8| 国产精品日韩精品欧美在线| 欧美二区在线看| 日韩中文字幕免费观看| 国产精品69久久久久水密桃| 国产剧情久久久久久| 免费看污视频的网站| 亚洲视频成人| 91av成人在线| 玖玖爱免费视频| 亚洲精品888| 久久国产精品偷| 日韩福利小视频| 国产精品久久久久久久久久10秀| 中文字幕日韩视频| 毛片aaaaaa| 操欧美老女人| 国产亚洲精品美女| 在线国产视频一区| 欧洲毛片在线视频免费观看| 在线观看国产精品91| 中文字幕免费视频| 国产探花一区在线观看| 亚洲视频欧洲视频| 一色道久久88加勒比一| 成人久久综合| 美女视频黄免费的亚洲男人天堂| 少妇人妻丰满做爰xxx| 亚洲最大黄网| 欧美黑人国产人伦爽爽爽| 久久一级黄色片| 一区二区三区四区五区在线| 91成品人片a无限观看| 97久久久久久久| 日本在线观看不卡视频| 国产精品视频永久免费播放| 亚洲天堂自拍偷拍| 国产激情视频一区二区三区欧美 | 久久er热在这里只有精品66| 欧美日韩视频在线观看一区二区三区 | 人妻 丝袜美腿 中文字幕| 99精品国产高清一区二区麻豆| 欧美成人官网二区| 国产制服丝袜在线| re久久精品视频| 久久亚洲精品一区二区| 日韩精品无码一区二区| 久久午夜精品| 亚洲最大成人网色| 免费国产黄色片| 国产性做久久久久久| youjizz.com亚洲| 免费污视频在线观看| 欧美视频中文在线看| 九九热99视频| 国产91精品入| 中文字幕一区二区三区电影| 九九在线观看视频| 日韩成人午夜电影| 国产乱人伦精品一区二区在线观看| 国产美女主播一区| 黄色av免费观看| 国产目拍亚洲精品99久久精品| 超碰10000| 男人皇宫亚洲男人2020| 欧美一级二级三级乱码| 少妇精品一区二区三区| 99久久www免费| 欧美一级视频在线观看| 国产乱码精品一区二区| 91在线观看免费视频| 中文字幕一区综合| 桃子视频成人app| 欧美成人性福生活免费看| 免费成人深夜天涯网站| 好吊视频一区二区三区四区| 国产精品一区电影| 外国精品视频在线观看| 亚洲男人的天堂在线观看| 日本久久久精品视频| 欧洲精品99毛片免费高清观看| 亚洲女人天堂成人av在线| 欧美激情国产精品免费| 美美哒免费高清在线观看视频一区二区 | 国产精品性做久久久久久| 欧美三级网色| 草草视频在线观看| 日韩午夜av电影| 日韩精品久久久久久久的张开腿让| 亚洲国产1区| 91黄色精品| 男人的天堂在线视频免费观看| 色综合天天综合狠狠| 亚洲视频 中文字幕| 久久久久亚洲| 国产精品视频一区国模私拍| 男人的天堂在线免费视频| 亚洲午夜在线电影| 亚洲AV成人精品| 亚洲视频在线免费| 91精品久久久久久久久青青 | 日韩在线视频网站| 波多野结衣视频观看| 91网站在线播放| 免费超爽大片黄| 91蝌蚪精品视频| 欧美激情小视频| 午夜精品一二三区| 一区二区国产视频| 亚洲乱妇老熟女爽到高潮的片| 欧美69wwwcom| 成人做爽爽免费视频| 日本免费中文字幕在线| 欧美三级在线看| 91资源在线播放| 美女视频黄免费的久久| 一区二区视频在线观看| 亚洲精品大片| 久久最新资源网| 精品国产乱码久久久久久蜜臀网站| 亚洲男同性恋视频| 午夜福利三级理论电影 | 中文字幕在线观看第三页| 国产欧美日韩在线观看视频| 国产精品久久久久久久电影| yes4444视频在线观看| 欧美视频中文字幕| 五月天色婷婷丁香| 国产精选一区二区三区| 国产freexxxx性播放麻豆| 精品国产影院| 国产高清在线不卡| 日本高清在线观看wwwww色| 91麻豆精品国产91久久久使用方法| 欧美一级片在线视频| 成人一区在线看| 黄色免费视频大全| 欧美日中文字幕| 亚洲a级在线观看| 国产剧情av在线播放| 亚洲欧美激情一区| 国产一区二区女内射| 一区二区三区加勒比av| 亚洲一区二区三区无码久久| 奇米色一区二区三区四区| 91九色国产ts另类人妖| 美女av一区| 国产剧情日韩欧美| 国产蜜臀在线| 亚洲欧美制服第一页| 一区二区精品视频在线观看| 亚洲午夜久久久久中文字幕久| 粉嫩av蜜桃av蜜臀av| 久久国内精品自在自线400部| 丝袜人妻一区二区三区| 精品一级毛片| 国产乱人伦精品一区二区| 日韩漫画puputoon| 欧美精品videossex性护士| av亚洲在线| 精品动漫一区二区三区在线观看 | 欧美日韩国产精品自在自线| 亚洲欧美一区二区三区四区五区| 2019国产精品| 韩国三级在线播放| 日韩激情在线观看| 国产91沈先生在线播放| 欧美好骚综合网| 欧美黑人3p| 伊人精品久久| 国产日本欧美一区二区三区| 国产精品yjizz视频网| 久久偷看各类女兵18女厕嘘嘘| 天堂在线中文字幕| 日韩一区二区中文字幕| 国产精品无码粉嫩小泬| 精品久久久中文| 免费在线观看黄视频| 国产精品入口麻豆原神| 亚洲天堂视频一区| 成人av综合一区| 亚欧精品在线视频| 日本欧美一区二区| 国产v亚洲v天堂无码久久久| 在线欧美亚洲| 99re6这里有精品热视频| 99tv成人| 午夜老司机精品| 精品在线手机视频| 久久精品国产99精品国产亚洲性色| 视频欧美一区| 91在线免费视频| 亚洲精品成a人ⅴ香蕉片| 国产精品人成电影| 欧美日韩不卡| 日本中文字幕不卡免费| 伊人久久综合一区二区| 91国自产精品中文字幕亚洲| 美女网站视频在线| 精品视频9999| 日韩成人伦理| 色在人av网站天堂精品| 中文字幕免费高清电视剧网站在线观看 | 国产欧美日韩亚洲精品| 国产麻豆久久| 国产精品久久久久7777婷婷| 亚洲成人激情社区| 国产精品国产自产拍高清av水多| 怡红院成人在线| 国产精品欧美日韩一区二区| 亚州一区二区三区| 国产精品久久久久久久久免费看| 日本精品网站| 国产精品日韩在线观看| 国产福利91精品一区二区| 国产精品尤物福利片在线观看| 精品福利在线| 成人国产在线视频| 精品国产第一国产综合精品| 97伦理在线四区| 久久大胆人体视频| 欧美精品一区二区视频 | 中文字幕亚洲色图| 午夜国产福利在线| 美女视频久久黄| 大香伊人久久| 奇米成人av国产一区二区三区| 夜鲁夜鲁夜鲁视频在线播放| 日本欧美黄网站| 国产精品无码久久久久| 91麻豆国产精品| 国产精品成人自拍| 麻豆蜜桃91| 日韩成人综合| 欧美激情亚洲天堂| 亚洲一区二区三区四区五区午夜| 黄色片视频在线播放| 麻豆视频观看网址久久| 国产精品探花在线播放| 白白色 亚洲乱淫| 蜜桃无码一区二区三区| 成人欧美一区二区三区在线播放| 久草视频精品在线| 日韩欧美国产一区二区| 国产精品久久久久久久免费| 亚洲精品按摩视频| av午夜在线| 97免费在线视频| 成人亚洲免费| 国产一区二区黄色| 色999日韩| 日本中文字幕亚洲| 久久99国产精品尤物| 久久久午夜精品福利内容| 国产精品美女久久久久久久网站| 青青草成人免费| 91福利国产成人精品照片| jizz国产视频| 国产香蕉一区二区三区在线视频 | 小早川怜子一区二区三区| 成人av在线电影| 国精产品一区一区| 丰满岳妇乱一区二区三区| 国产一区二区自拍视频| 亚洲精品自拍第一页| 2024最新电影免费在线观看| 人人做人人澡人人爽欧美| 国产精品一区二区三区av| 日本a级片久久久| 欧美成人精品| 视频二区在线播放| 99这里只有精品| 久草免费在线视频观看| 欧美视频一区二区| 四虎在线免费观看| 欧美国产日韩视频| 日韩久久99| 日产国产精品精品a∨| 在线成人www免费观看视频| www.成年人| 中文字幕精品三区| 日韩色图在线观看| 欧美精品一区二区高清在线观看 | 欧美在线免费看| 天堂av一区| 欧洲美女和动交zoz0z| 奇米影视在线99精品| 日韩网站在线播放| 亚洲地区一二三色| 精品人妻伦一二三区久久 | 欧美一区二区三区免费观看视频| 久久久pmvav| 98精品国产自产在线观看| 日韩三级av高清片| 日韩视频在线免费播放| 麻豆成人免费电影| 国产福利在线导航| 欧美日韩在线播放一区| 国产爆初菊在线观看免费视频网站| 韩国三级日本三级少妇99| 亚洲一级大片| www.亚洲视频.com| 丁香婷婷综合五月| 精品视频在线观看免费| 日韩一卡二卡三卡四卡| 国产在线1区| 91在线观看免费| 黄色一区二区三区四区| 人妖粗暴刺激videos呻吟| 亚洲成在线观看| 手机av免费在线观看| 4388成人网| 蜜桃一区二区三区| 自拍偷拍 国产| 中文字幕乱码日本亚洲一区二区| 特级西西444www高清大视频| 色哟哟网站入口亚洲精品| 欧洲午夜精品| 看一级黄色录像| 成人一道本在线| 日韩免费在线视频观看| 亚洲免费精彩视频| 懂色aⅴ精品一区二区三区| 亚洲一区二区三区精品动漫| 激情都市一区二区| 清纯粉嫩极品夜夜嗨av| 亚洲精品久久久久中文字幕欢迎你| 欧产日产国产精品视频| 日韩中文字幕av在线| 精品一区二区三区在线观看国产| 永久看片925tv| 亚洲国产毛片完整版| 欧美福利在线播放| 大桥未久一区二区三区| 不卡一区二区在线| 国产午夜精品久久久久| 色噜噜狠狠狠综合曰曰曰| 伊人www22综合色| 成人在线免费播放视频| 日韩毛片视频在线看| 国产高清免费观看| 欧美综合第一页| 91精品国产福利在线观看麻豆| 日本美女视频网站| 色综合一区二区三区| 麻豆最新免费在线视频| 精品国产综合久久| 奇米一区二区三区av| 在线免费观看毛片| 一本久久综合亚洲鲁鲁| 在线综合色站| 欧美一级黄色影院| 亚洲在线视频网站| 国产高清一区在线观看| 国产高清精品一区二区三区| 日日夜夜免费精品视频| 欧美黄色一区二区三区| 尤物yw午夜国产精品视频| 97se亚洲| 三级av免费观看|