精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

數據湖在快手的應用實踐

大數據 數據湖
本文將分享數據湖在快手的應用實踐。文章從業務使用方的視角,全面回顧了數據湖(Hudi)在快手內部的應用推廣歷程,給業務開發帶來的效率提升和成本優化,以及在實際應用中如何與技術團隊緊密配合將 Hudi 打造為覆蓋全公司、賦能多場景的核心基礎設施。

一、數據湖在快手的應用歷程

1. 業務面臨的問題與挑戰

圖片

(1)數倉規模的持續膨脹

快手業務發展迅速,對數據精細化運營的要求越來越高。隨之而來,數倉的數據模型持續快速增長。這帶來了兩個主要問題:

其一,計算和存儲成本也隨之線性增長。在當前降本增效的大背景下,持續的成本增長與團隊的目標戰略相悖。

其二,龐大的數據模型給治理和運維帶來了挑戰。多套數據模型迭代節奏不一致,容易導致數據一致性的質量問題,運維成本越來越高。

(2)協作效率有待提升

快手是一家多元化的業務公司,不可避免地會涉及到跨部門的數據協作。以計算ROI 為例,就需要匯總收入和支出兩部分數據,而這些數據掌握在不同的業務部門手中。跨部門協作時,主要會遇到兩個問題:

其一,時間的匹配。由于不同部門的業務側重點不一樣,在排期上難免會有差異,影響協作效率。

其二,數據異動追蹤不夠敏捷。當數據發生異動時,由于聯動上下游多方排查時數據連環依賴加工,造成牽連廣泛、排查周期較長。

(3)實時與離線數據差異

對數據時效性要求高的場景,比如活動效果監控、策略快速驗證等,存在實時和離線數據誤差的問題。如,實時數據顯示當天目標達成或未達成,但次日離線數據結果相反,這就會影響到業務決策的及時性和準確性。

圖片

對于數倉規模為什么會持續擴漲,接下來基于真實的案例做分析。從需求交付的視角,最細粒度的目標是基于[公共模型 3]同時交付核心日報、增長錢效、增長日報 3 個需求;這樣看起來最合理的數倉模型只需要 1 個模型即可;但,實際為什么不行。我個人認為原因有二,其一:面向數據應用的視角,時效 SLA 是繞不開的話題,因為用到多個數據來源,將結果整合到一起,數據的時效 SLA = 最晚的數據源就緒時間 + 任務執行時間,那么為了滿足數據時效 SLA 的訴求,會建設[公共模型 1&2&3];其二:如果將大量的業務過程的指標和緯度整合到一個模型,當前的計算引擎(Hive、Spark)的執行時長過長&優化難度較大;從而進一步帶來時效 SLA 的保障壓力。

那么有沒有辦法實現純面向領域模型、業務過程、數據建模理論,滿足計算性能要求,滿足時效 SLA 要求的解決方案。經過思考,我們需要一個引擎,它支持對數倉模型的更新寫。

2. 架構演進:從 Hive 到 Hudi 的技術變革之路

圖片

經過調研,數據湖技術支持對數倉模型的更新寫。市面上有多個引擎該如何選擇?主要的評判標準有三:第一,引擎的功能豐富度,功能越豐富,就可以適配更多的業務場景,適用性更強;第二,與快手現有大數據架構和技術棧的契合度,契合度越高,引入新引擎的投入越小、時間越短,解決問題的效率越高;第三,引擎的自動化程度,自動化程度越高帶來的運維成本越低。

綜合對比后,Hudi 憑借其豐富的功能、與現有架構的良好適配性,以及相對較低的運維成本,成為快手大數據團隊的首選。

選定引擎后,對數倉架構的規劃藍圖是:按照業務實體整體設計大寬表,實現跨領域的打通(增長、商業化、電商),跨業務的并行協作;單領域(增長)的多業務過程的團隊內并行協作;業務間&團隊內實施的同學關注于實體粒度下實現。依據 SLA 的訴求將模型拆成合理的子任務,通過更新的方式補充模型數據內容。

下邊我們基于問題看下如何應用。

3. 快手 Hudi 數據庫應用推廣歷程

圖片

我們依賴引擎的更新能力,可以從純數倉架構最理想模型的視角設計數倉模型。比如,我們將[數據統計]的所有指標和緯度 + 實體 ID 整合,建設跨主題的明細表,具體方案:

(1)基于時效SLA 的訴求,將子任務拆成 4、5、6、7 點執行的 4 個任。

(2)不用時間點執行的子任務,更新數據內容到跨主題的明細表。

(3)上層應用基于時效 SLA 抽取部分字段計算滿足業務訴求。

綜上,可以滿足數據架構的合理性、數據時效 SLA 的訴求、不同數據域(團隊)的協作。

對比傳統的一次性更新的模型,子任務邏輯更簡單、數量更小,因此任務的計算&執行效率更高,進一步提升了數據的 SLA 時效。

針對上述的建設過程,經過真實業務驗證取得了一些成效。

4. 快手Hudi 應用實踐初見成效

圖片

(1)從數倉模型視角:引擎更新能力的支持,可以將我們過往散落的模型中的業務過程做有效的整合。能更聚焦和詳細的通過數據描述業務;同時在數據的查找、使用、應用(計算)效率上有顯著提升。

(2)從數倉規模視角:去掉了因時效 SLA 帶來的非必要中間模型,因計算能力不足拆分的優化模型;數據規模有顯著下降;規模的下降帶來運維壓力的減輕、存儲、計算成本的下降。

(3)從數倉增量視角:除必要的新實體,絕大部分工作體現在對實體資產的迭代;使得公共數據的完備度持續完善,復用度持續提升;從而間接提升研發效率。

從結果來看,數據湖技術在生產、應用、效率、成本上是有收益的,那實際的推廣策略是什么,如何評估新引擎推廣的 ROI?

圖片

推廣策略、生態建設。

圖片

在推廣策略上分為幾個階段。

(1)功能&場景的覆蓋驗證

要推廣一款新的基礎組件,要找準切入點。我們重點聚焦在當前 Hive 和 Spark 生態無法有效解決的"老大難"問題:活動的分鐘級時效問題、狀態演變的全量回刷場景、DAU 點擊的時效優化場景。通過解決“老大難"問題,從業務的視角可以驗證引擎可以解決過往的不可能,體現其增量價值。

(2)論證點到面的普適性

在增長業務驗證其 100% 支持業務的可能性,從歷史任務的改造遷移、增量任務的直接應用,結果如上數據。通過整個業務方向的論證,可以認為:引擎在解決業務問題上具有普遍適用性。

(3)工具鏈生態建設、提升研發效率

技術落地的關鍵在于復用。快手內部擁很多業務部門,要做到全面普及,必須標準化使用范式,沉淀出一整套工具鏈。同時,我們在不斷地實踐中探索總結出了一些技術最佳實踐,以 ShowCase 的形式推廣到各個業務部門,實現了經驗的快速復制。

(4)廣泛應用

在引擎技術的可能性基礎上,加上工具生態的效率加持;公司各個團隊根據自己的業務場景和業務痛點進行針對性的應用與優化;目前已經得到廣泛的應用。

二、數據湖在快手的應用案例

1. 業務賦能:Hudi 在快手的典型場景

(1)CDC 數據同步

圖片

在數據同步方面,Hudi 展現出了不錯的效果。通過將小時或者天的定時觸發同步,迭代成實時的數據同步;這種數據同步模式,為許多實時性要求高的業務提供了有力保障。業務方不必再受限于夜間批處理的時間窗口,而是可以隨時消費到最新的數據,極大地提升了數據應用的靈活性。在時效上收益明顯,比如,一些核心的場景有60~90 分鐘的提升。

(2)批流結合業務加速

圖片

在某些場景下,僅有批處理還不夠,還需要實時的流式計算能力。Hudi 通過無縫集成批處理引擎和流處理引擎,很好地滿足了這一訴求。比如,除夕的紅包雨,需要在兩輪紅包雨之間完成下一輪 Push 推送的計算,使用歷史的小時計算需要 4~5 個小時的時間,但使用 Hudi 可以在上一輪紅包雨期間完成參與用戶的更新標記。Hudi 從技術上滿足了業務的場景訴求。在活動期間高頻應用,拿到了顯著的結果收益。

(3)架構升級數倉優化

圖片

基于寬表數據建設,將歷史基于時效&計算優化的 71 個模型,設計整合為基于設備&用戶為實體的 3 個模型,同時基于 SLA 的訴求拆分不同的子任務,最終在模型規模、計算成本、存儲成本都拿到不錯的收益。

圖片

基于引擎的更新能力,對數倉模型的設計思路和實現方式也有根本上的改變;比如,在計算 N 留存的設計,從過完多次重復的笛卡爾積計算轉為簡單更新計算,在時效和成本上取得顯著收益。

2. 快手 Hudi 應用實踐的一些思考

(1)需求引領,技術驅動

企業級服務的推廣切忌閉門造車,一定要深入了解一線的業務需求,找準痛點,才能真正發揮技術的驅動作用。快手的例子充分說明,Hudi 之所以能夠在較短時間內取得驕人的成績,正是得益于其直指業務痛點的能力。從這個意義上說,Hudi 在快手的成功首先應歸功于需求的精準引領。

(2)制度先行,奠定規范基礎

Hudi 在快手的推廣之所以能夠做到體系化,與其完善的配套制度是分不開的。通過建立統一的數據分層規范,快手為 Hudi 構建了一個蓬勃發展的良好生態。同時,將 Hudi 的最佳實踐以制度的形式固化下來,又為后續的推廣應用掃清了障礙。這為我們提供了一個很好的借鑒:任何新技術的引入都要考慮與現有的制度規范相配套,二者相輔相成,才能創造奇跡。

(3)打破壁壘,集體智慧方顯威力

Hudi 在快手的成功應用離不開各方的通力協作。從最初由基礎架構團隊主導,到后來獲得越來越多BU 的青睞和使用,我們越來越意識到要打破部門壁壘,讓集體智慧發揮出最大的威力。正如開源界流行的 "Given enough eyeballs,all bugs are shallow" 法則,新技術能否真正落地,關鍵在于能否調動起全員的積極性,在實踐中不斷打磨,集眾人之所長,補己之所短。

總而言之,快手在 Hudi 的引入和推廣過程中積累了豐富的經驗,也收獲了不菲的回報。其成功的要義在于需求引領、制度先行、破除壁壘,我們期待 Hudi 在快手能夠為業務創新和增長提供源源不斷的動力。也希望我們的實踐能給業界帶來一些啟示,為同行提供一些可資借鑒的范式。技術的進步永無止境,讓我們攜手共進,共創美好未來!

三、Q&A

Q:新的 Hudi 架構后,查詢速度優化可以從哪些方面來考慮?

A:對 Hudi 的查詢有兩種模式,第一種是在生產完成數據更新后即可以讀,第二種是數據需要 merge 之后才能使用,這種情況下需要等待 merge 之后再讀取數據。從生產讀的話,可以基于 Hudi 無增量來消費上游的變更數據,通過變更數據加上增量計算減少開銷提高性能。分析查詢的話,可以加上二級索引來快速進行查詢。

責任編輯:姜華 來源: DataFunTalk
相關推薦

2023-07-12 16:07:50

鏈路數據湖技術

2023-05-16 07:24:25

數據湖快手

2023-06-28 07:47:34

Iceberg數據湖

2022-05-23 13:30:48

數據胡實踐

2023-10-13 07:25:50

2023-02-13 14:01:32

2019-05-31 12:03:06

SQLHadoop大數據

2022-06-09 14:19:46

順豐數據集成Flink

2021-09-13 13:46:29

Apache HudiB 站數據湖

2024-04-22 07:56:32

數據倉庫數據中臺數據服務

2016-08-22 15:15:14

數據實踐

2015-06-11 10:09:04

大數據HBase

2023-04-07 07:31:17

渠道數據

2024-02-07 09:25:52

數據處理快手大模型

2018-09-30 15:05:38

數據湖數據倉庫Hadoop

2024-07-12 11:40:13

2023-11-14 14:25:09

數據湖大數據

2022-07-08 09:26:45

Flink快手計算

2020-09-28 10:05:57

數據工具技術

2023-12-14 13:01:00

Hudivivo
點贊
收藏

51CTO技術棧公眾號

www.xxx麻豆| 国产高清精品一区二区三区| 超碰97av在线| 国产一区二区三区免费观看在线 | 无码 人妻 在线 视频| 欧美不卡高清一区二区三区| 亚洲三级视频在线观看| 懂色中文一区二区三区在线视频| 91国产丝袜播放在线| jiujiure精品视频播放| 日韩一区二区三区四区 | 免费在线观看的电影网站| 91在线云播放| 91精品久久久久久久久久入口| 疯狂试爱三2浴室激情视频| 国产精品任我爽爆在线播放| 欧美亚洲禁片免费| 久久手机在线视频| 91ph在线| 久久久综合视频| 99re视频| 一级黄色大毛片| 噜噜噜91成人网| 欧美激情第三页| 在线免费观看视频| 天堂99x99es久久精品免费| 91麻豆精品国产91久久久使用方法| 日本a视频在线观看| 三级外国片在线观看视频| 99九九99九九九视频精品| 亚洲自拍偷拍区| 中国女人一级一次看片| 亚洲女人av| 欧美精品久久一区二区| 在线观看亚洲网站| 精品一区二区三区的国产在线观看| 亚洲成人性视频| 在线免费黄色小视频| 精品176极品一区| 欧美性大战xxxxx久久久| 免费在线激情视频| 国产三级电影在线播放| 一片黄亚洲嫩模| 干日本少妇视频| 午夜激情视频在线| 国产精品美女视频| 日本一区二区在线视频观看| 日本啊v在线| 337p粉嫩大胆色噜噜噜噜亚洲| 国产精品久久久一区二区三区| 国产情侣自拍小视频| 精品一二三四在线| 成人免费网站在线看| 国产精品久久久久毛片| 极品少妇xxxx精品少妇| 成人黄色激情网| 一级黄色免费片| 麻豆91精品视频| 国产精品视频自拍| 亚洲图片中文字幕| 韩国av一区二区三区四区| 成人国产精品一区| 国产成人精品一区二区无码呦| 精品午夜久久福利影院| 成人精品一区二区三区| 国产美女永久免费| 国产.欧美.日韩| 精品国产电影| 户外极限露出调教在线视频| 国产欧美日韩在线视频| 一区二区精品在线观看| 蜜桃视频在线观看www社区 | 久久国产一区二区三区| www.4hu95.com四虎| 国产精品久久久久久久| 欧美成人在线免费| 欧美日韩综合在线观看| 日本中文字幕不卡| 91在线视频导航| 性中国古装videossex| 白白色 亚洲乱淫| 欧美日韩亚洲免费| 久热国产在线| 午夜精品久久久久久久久久久| 波多野结衣家庭教师在线| 日韩毛片一区| 欧美成人欧美edvon| 狠狠人妻久久久久久综合蜜桃| 精品理论电影| 欧美麻豆久久久久久中文| 国产成人精品a视频一区| 日韩中文字幕不卡| 亚洲综合中文字幕在线观看| 天天综合在线视频| 国产精品乱人伦| 青青青在线视频播放| 99久久久国产精品免费调教网站 | 亚洲高清免费观看 | 小说区视频区图片区| 黄色大片在线| 精品1区2区3区| 国产女主播在线播放| 精品国产欧美日韩| 久久久久久久国产| а中文在线天堂| 国产成人一区二区精品非洲| 欧美另类视频在线| 91三级在线| 在线看日本不卡| 国产精品嫩草av| 欧美一区国产在线| 国产精品视频免费观看www| 欧美一区二不卡视频| 国产精品热久久久久夜色精品三区| 800av在线免费观看| 日韩美女在线| 亚洲欧美中文字幕在线一区| www.av视频在线观看| 久久se这里有精品| 日韩美女一区| 色网在线免费观看| 精品电影一区二区| 亚洲aaa视频| 久久精品三级| 久久99国产精品99久久| 啦啦啦中文在线观看日本| 7777精品伊人久久久大香线蕉经典版下载| 国产美女喷水视频| 亚洲日产国产精品| 国产精品嫩草在线观看| 黄av在线免费观看| 欧美日韩黄色一区二区| 中文字幕第24页| 久久五月激情| 蜜桃av久久久亚洲精品| 韩国成人二区| 日韩成人免费视频| 日韩av黄色片| 99re热视频这里只精品| 国产成人无码精品久久久性色| 99ri日韩精品视频| 久久久久久国产三级电影| 精品毛片一区二区三区| 亚洲精品高清视频在线观看| 三级黄色片免费看| 欧美三级第一页| 91超碰在线电影| 天天色天天射天天综合网| 日韩一区二区三区高清免费看看| 538精品在线视频| 国产精品亚洲一区二区三区在线| 免费国产成人看片在线| 精品一区91| 久久久女人电视剧免费播放下载| 国精品人妻无码一区二区三区喝尿| 一区二区三区四区中文字幕| 潘金莲一级淫片aaaaa| 欧美日韩国产欧| 久久久com| 影视一区二区三区| 日韩中文字幕在线| 精品国产99久久久久久宅男i| 亚洲激情第一区| 亚洲观看黄色网| 日韩国产精品久久久久久亚洲| 日韩高清三级| 国产精选久久| 午夜欧美大片免费观看| 秋霞av在线| 欧美色国产精品| 国产av 一区二区三区| 成人精品视频一区二区三区尤物| 国产在线播放观看| 国产中文精品久高清在线不| 国产日韩换脸av一区在线观看| 超碰在线无需免费| 日韩激情在线视频| 91av国产精品| 亚洲成a人片在线不卡一二三区| 四虎永久免费影院| 久久国产麻豆精品| 国产无限制自拍| 成人亚洲一区| 国产91视觉| 亚洲一区二区三区四区| 九九精品视频在线观看| 色视频免费在线观看| 欧美猛男男办公室激情| 奇米影视第四色777| 国产精品三级视频| 在线天堂www在线国语对白| 蜜臀久久99精品久久久久宅男| 成人国产一区二区三区| 国产精品探花在线观看| 91精品久久久久久蜜桃| 成人影院大全| 久久久久久久久久久久av| av在线电影免费观看| 欧美精品一区二区三区在线| 中文字幕在线网址| 好吊成人免视频| 欧美交换国产一区内射| 中文字幕欧美日本乱码一线二线| 香蕉视频污视频| 狠狠色综合播放一区二区| 哪个网站能看毛片| 国产综合婷婷| 手机福利在线视频| 精品久久网站| 免费不卡亚洲欧美| 加勒比视频一区| 91嫩草在线| 欧美视频免费看| 人人澡人人澡人人看欧美| 狂野欧美性猛交xxxxx视频| 色yeye香蕉凹凸一区二区av| 国内在线免费高清视频| 日韩av影视综合网| 风流老熟女一区二区三区| 欧美一区二区三区啪啪| 91国内精品久久久| 色猫猫国产区一区二在线视频| 黄色一级片在线| 亚洲精品成人悠悠色影视| www中文在线| 国产精品热久久久久夜色精品三区| 国产精品无码久久久久久| 99久久亚洲一区二区三区青草| 中文字幕一区二区三区人妻在线视频 | 久久亚洲一级片| bl动漫在线观看| 成人av免费观看| 四季av综合网站| 成人性色生活片| 成熟妇人a片免费看网站| 国产成人av自拍| www.黄色网| 风间由美性色一区二区三区| 麻豆网站免费观看| 国产精品自拍网站| 韩国三级在线播放| 成人午夜视频在线| 人妻 丝袜美腿 中文字幕| 成人综合婷婷国产精品久久蜜臀 | 91av视频在线免费观看| 182在线视频观看| 91av在线播放| 欧洲av不卡| 国产精品91久久久久久| 九九热这里有精品| 成人淫片在线看| 欧美h版在线观看| 超碰在线97av| 国产欧美自拍一区| 欧美在线3区| 色综合久久网| 九九久久九九久久| 亚洲性视频h| 欧美韩国日本在线| 美国欧美日韩国产在线播放 | 99精品久久只有精品| 日韩中文字幕电影| 国产精品久久久久aaaa樱花| 私库av在线播放| 五月综合激情婷婷六月色窝| 无码人妻丰满熟妇奶水区码| 精品视频一区二区不卡| 国产福利资源在线| 亚洲精品乱码久久久久久按摩观| 国产中文在线观看| 久久九九亚洲综合| 91福利在线免费| 国产成人精品一区| 国产精品亚洲欧美日韩一区在线| 国产精品一 二 三| 精品国产一区二区三区久久久樱花| 久久免费视频2| 夜久久久久久| 91福利国产成人精品播放| 国产福利一区二区三区| 91精品人妻一区二区三区蜜桃欧美| 国产精品乱码一区二区三区软件 | 国产精品入口免费| sdde在线播放一区二区| 妞干网在线播放| 日日欢夜夜爽一区| 美女伦理水蜜桃4| 中国色在线观看另类| 精品午夜福利在线观看| 欧美午夜电影网| 人妻少妇精品无码专区| 深夜福利日韩在线看| www视频在线观看| 国产欧美精品日韩| 亚洲aa在线| 久久久久久久久影视| 三级成人在线视频| 一级黄色片毛片| 中文字幕在线观看一区| 六月丁香婷婷综合| 日韩视频免费直播| av网在线观看| 日本久久久久久久| 91成人午夜| 国产av不卡一区二区| 日韩va欧美va亚洲va久久| 久久午夜夜伦鲁鲁片| 亚洲欧美日韩国产手机在线| 尤物视频免费观看| 日韩精品视频免费| 七七成人影院| 成人福利免费观看| 日韩成人综合| 亚洲欧洲日产国码无码久久99| 国产91丝袜在线观看| 黄色a级片在线观看| 在线观看av一区二区| 青青久草在线| 97激碰免费视频| 欧美经典一区| 四虎免费在线观看视频| 久久国产精品99久久久久久老狼| 国产精品密蕾丝袜| 欧美日韩国产综合新一区| 日本成人动漫在线观看| 欧美丰满少妇xxxxx| 精品国产一区二区三区2021| 亚洲第一精品区| 免费人成在线不卡| 国产一二三四视频| 在线观看国产一区二区| 成人在线免费视频| 国产成+人+综合+亚洲欧美丁香花| 亚洲桃色综合影院| 丝袜老师办公室里做好紧好爽| 不卡电影免费在线播放一区| 国产精品1234区| 精品国产sm最大网站免费看| 国内在线视频| 国产一区二区三区四区hd| 亚洲国产精品一区| 91玉足脚交白嫩脚丫| 欧美日韩亚洲国产一区| 日本一区二区三区在线观看视频| 6080yy精品一区二区三区| 欧美大胆视频| 久久国产色av免费观看| 中文字幕第一区综合| 亚洲一区二区三区网站| 久久视频免费在线播放| 综合激情网...| 欧美人成在线观看| 91日韩精品一区| 国产性生活视频| 色播久久人人爽人人爽人人片视av| 四虎国产精品免费久久| 欧美日韩午夜爽爽| aaa欧美日韩| 91丝袜一区二区三区| 中国人与牲禽动交精品| 婷婷久久综合九色综合99蜜桃| 国产免费xxx| 成人av电影在线观看| 国产精品久久久久久久久久久久久久久久久 | 国产无遮挡aaa片爽爽| 亚洲精品91美女久久久久久久| 欧美aa在线观看| 日本视频一区二区不卡| 激情六月婷婷久久| 国产极品美女高潮无套嗷嗷叫酒店| 日韩精品亚洲元码| 国产亚洲精品精品国产亚洲综合| 9999在线观看| proumb性欧美在线观看| 亚洲视屏在线观看| 欧美福利在线观看| 亚洲人成伊人成综合图片| 色啦啦av综合| 午夜电影网一区| 福利片在线看| 91国产在线播放| 日日骚欧美日韩| 久久久久黄色片| 夜夜躁日日躁狠狠久久88av| 欧美性aaa| 亚洲美免无码中文字幕在线| 国产精品网站在线| 色呦呦中文字幕| 国产精品爽黄69| 国产亚洲毛片在线| 男人av资源站| 亚洲精品一区久久久久久| 国产成年精品| 亚洲人成无码www久久久| 一区二区在线看| 六十路在线观看| 国产成人精品一区二区三区福利| 欧美aaa在线| 日本黄色片视频| 久久影院中文字幕|