精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

網易郵箱數倉演進之路

大數據 數據倉庫
展望未來,郵箱業務會持續發展,甚至會嘗試突破業務的領域邊界。預計會有更多針對特定領域的數據應用出現。這些應用實際上是把調用數倉算力的門檻降低了,會給數據支撐工作帶來更大的壓力。

本文介紹了網易郵箱數倉的演進過程和期間一些關鍵的技術方案引入決策,并闡述了這些決策背后的業務需求和技術考慮因素,以及實施后的實際產出成效。最后對整個過程進行了總結及后續展望。

1、概述

到目前為止,網易郵箱數倉的發展大致經歷了三個階段:

圖片

第一個階段是2020年10月份之前,這時候我們的數據系統的主要任務是支持郵箱日常的運營統計;

第二個階段大概是2020年11月份到2021年的11月份,這段期間公司嘗試做業務的調整,挖掘新的長期增長方向。我們在這時候對郵箱數倉底層的OLAP引擎和整個數據處理鏈路都進行了重構,以適應業務方寬泛的即席數據探索需求;

第三個階段大概是2021年的12月份到現在,我們進入了精細化運營探索期。這個時期我們的主要工作是完善數倉結構,滿足更多、更深入的數據應用需求。

可以看到,由于每個時期面臨的主要問題不同,前兩個階段切換的主題在于重建基礎設施,而后兩個階段切換的主題則是完善上層建筑。

2、初始狀態

早期的網易郵箱數倉底層是一套完整的Hadoop體系結構,它的組件構成比較龐雜。但后期它完成的主要任務就是從貼源層計算統計結果到應用層,用作BI報表展示。

圖片

有一組數據能夠反映2020年10月份之前這個系統的狀態:整個集群大概有300個節點,存了9P+的數據,其中小文件眾多,導致元數據條目有6億+,這個元數據規模讓HDFS的NameNode不堪重負,2次崩潰。其中第二次崩潰導致郵箱所有的數據統計任務停了整整1周多的時間,這也是導致我們下決心后續對數倉進行升級改造的直接原因。

然而我們當時只有兩名數據開發人員,并且沒有專職的大數據運維人員。因此,從資源的角度看,我們實際上也是沒有條件繼續支撐這套體系持續穩定運轉的,一次徹底的底層重構勢在必行。

根據當時的情況,重構方案在技術層面需要下面考慮三點:

  • 開發效率:因為開發人員少,而基于MR框架的開發效率比較低,我們需要一個使用成本更低、效率更高的開發平臺;
  • 系統性能:老系統的任務執行效率較低(尤其是邏輯較復雜的長周期統計任務),新方案應該要在大規模數據集下有更好的查詢性能;
  • 運維效率:因為缺少專職的數據運維,我們需要架構相對簡單,維護難度相對低的技術選型。

另外,在業務層面,當時我們的產品和運營側都還在新方向探索期,對業務指標間的關聯性了解不足,沒有形成穩定的觀察指標體系。具體的癥狀就是這兩個:

  • “不知道要什么”:當你問業務方:“最想要看哪些指標?”,結果通常都是說不上來,不知道哪些指標和用戶、會員等核心指標的提升關聯度大;
  • “什么都要”:當業務方提需求的時候就是:什么都要。各種業務過程的不同維度、不同粒度下的指標都要看。

如果在這個時期就去構建完整的多層數倉結構,預先做好多維度的聚合指標,很容易變成無用功,最后要推倒重來。實際上業務側這時候最需要的是在明細事實數據層面的高性能的ad-hoc查詢能力,并且最好更夠支持他們進行自助的數據探索。

3、數倉1.0

于是經過綜合考慮,我們從2020年底到2021年中逐步做了下面幾個工作:

  • 第一個是將舊Hadoop集群的數據進行壓縮、清理后,遷移到新搭建的猛犸Hadoop集群(規模小了很多),成為新數倉的ODS層,向上層提供原始數據輸入;
  • 第二個是選型、引入了以數據查詢和寫入性能著稱的OLAP引擎ClickHouse(下文簡稱CK),作為新數倉的DWD層,支持應用側以SQL的形式查詢、挖掘事實數據;
  • 第三個是基于Kafka和Flink搭建了一套新的、支持實時數據采集的數據處理鏈路,為CK輸入清洗后的事實數據。

圖片

這套框架搭建完之后帶來下面幾個方面的好處:

(1)在開發層面

  • 統一用SQL進行數據需求的開發,降低了開發難度,也便于形成統一的開發規范;
  • 降低了業務側自助查詢的門檻,讓運營、QA、前后端開發等職能可以自己實現數據統計任務和報表產出,相當于增加了數據開發的人力(這點對我們來說很重要,它讓我們能夠在人力資源這么緊張的情況下,還能騰出手來,在數倉的外延去補充數據中臺的一些能力);
  • 實現了高效的數據接入流程。

(2)在業務提效層面

  • CK具有很高的單表查詢和寫入性能,提升了數據需求實現的效率;
  • 依靠強大的基礎性能,CK可以覆蓋從T+1的運營統計到準實時的服務質量基線統計需求。

(3)在運維層面

  • 盡管CK自身也有在擴容等方面的維護難點,但整體上相比Hadoop技術棧的組件要少,部署結構相對簡單;
  • 另外CK在數據壓縮后仍能維持較好的查詢性能,有助于我們控制存儲規模。

在新數倉上線后,我們取得了比較顯著的業務和技術成效。比如在業務支撐方面,業務側自助取數占比從0提升到了80%以上,平均取數時長從天級縮短至分鐘級,當時的業務指標覆蓋度也有了質的提升;在開發層面,統計任務的開發效率、數據查詢性能和數據接入效率都成倍地提升;而在運維層面,我們用比之前更少的服務器資源支撐了更高的數據吞吐量,同時系統可用性還得到了提升。

看上去我們已經很好地支撐了當時的業務需求,為什么還要繼續折騰呢?

圖片

因為業務會成長。隨著各項運營目標的推進,大家總算是形成了一些相對穩定的業務觀察指標了,但觀察了一段時間之后的結論就是:很多關鍵業務指標的增長都出現了瓶頸。而同時在降本增效的趨勢下,運營觸達行為的轉化率要求也提升了。

實際上是業務增長現在需要更精細化的運營策略了,而這時候我們的系統能力就逐漸和新的需求演化趨勢之間產生了一些失配:

  • 首先是深挖業務增長因素的多維度分析場景增多了,而CK的Join性能優化較弱,或者說對于業務側同學和數據分析師來說,要寫出高效的關聯查詢SQL的門檻比較高,所以應用復雜的維度建模方法的難度較大(如果都打成CK喜歡的大寬表的模式的話,數據表的復用度低,重復開發量大,數據變更的影響也大);
  • 第二個是運營策略越來越依賴用戶、設備等維度的標簽,而標簽(尤其是統計數值類標簽)是容易發生變更的,而CK對數據熱更新的支持不完善,會增加標簽維護的成本;
  • 第三個是隨著更多數據應用的出現,分析查詢的頻次提升了,對數倉的并發請求增多,但CK的并發查詢支撐能力不強。

所以我們需要對系統進行進一步的能力提升。但從資源、成本以及需求時效性的角度考慮,去改造CK或者等它升級提供所需要的能力和特性顯然都不現實。

為了能夠在不大規模地改變現有架構的前提下,快速地補充缺失的能力,我們考慮新引入一個能滿足這些能力要求的OLAP引擎,并讓它主要工作在DWM層,用來承載輕度聚合數據、標簽及其他維表,并支撐業務的多維度分析需求。

圖片

在這個新數倉的選型上,我們對比了業界多個優秀的OLAP引擎,其中有基于Hadoop生態的方案,也有采用獨立研發的存算系統的方案。最終考慮到StarRocks在與現有系統的整合難度、關聯查詢優化、數據更新支持、并發查詢能力和運維成本等方面的均衡表現,決定選擇它作為新的選型。

StarRocks實際上是與Doris同源的另外一個開源分支。這背后其實還隱含了另外一個選型因素,就是我們和StarRocks的技術團隊在很早之前就建立了聯系,他們也在我們的實踐過程中提供了很好的技術支持。

4、數倉2.0

于是從2021年年末起,我們按計劃引入了StarRocks,并調整了數倉的邏輯結構,從而又帶來了一系列提升:

圖片

(1)在業務支撐層面

  • 可以支持并發度比較高的多維度分析查詢需求;
  • 以較小的開發、維護成本滿足了數據應用側的標簽查詢需求。

(2)在開發及架構層面

  • 我們讓CK和StarRocks工作在了各自擅長的層次。在數據規模比較大的細粒度事實層,數據探索依然可以依賴CK的大寬表模式;而在中間層的開發中我們也能充分利用StarRocks的自動聚合、智能物化視圖等這些特性來提升開發效率;
  • 提升通用指標的復用度,減少了重復開發;
  • 降低了對明細層數據的查詢壓力。

目前,我們StarRocks中存儲了40多個標簽表,數據量達300多億條,日均數據更新7億多次,每天承載的查詢量達到了千萬級(這里包括了一些在線應用的實時請求)。

在業務成效方面,一些特定的用戶標簽讓定向引流觸達活動的點擊率平均提升了90%以上;基于數倉中間層的取數系統和畫像系統上線以來,累計節省了約10人月的數據開發人力投入;同時標簽庫也支撐了風控因子庫和個性化反垃圾模型的構建。

5、總結

圖片

如果用一句話來總結到目前為止的數倉建設過程,那就是:“雖然起步晚,但幾乎總是在關鍵的業務發展節點前補充了與之匹配的能力”。我們從中得到的感觸主要有兩點:

首先是數據團隊應該時刻關注業務的運營狀態和數據的產出價值。這是我們跟上業務的發展節奏甚至推動它前進的前提,同時也體現了一種價值取向:就是技術團隊的最終產出價值通常不是技術本身,我們的技術活動的終極目標通常也不是技術先進性,而是讓業務在殘酷的市場競爭中獲得生存優勢;

其次是數倉建設無法一蹴而就。因為業務需求的演進需要一個過程,而方案的實施又有各種資源和成本上的限制,所以不可能也沒有必要從一開始就考慮實現一個大而全的系統。更好的方式可能是提前預判需求的演變趨勢,用來做長期的建設規劃,但按中短期的能力要求循序漸進地推進。

6、展望

展望未來,郵箱業務會持續發展,甚至會嘗試突破業務的領域邊界。預計會有更多針對特定領域的數據應用出現。這些應用實際上是把調用數倉算力的門檻降低了,會給數據支撐工作帶來更大的壓力。

為此我們計劃做好以下幾件事情:

  • 為了保持數倉系統的健康度,需要完善數據中臺的數據治理能力,尤其是通過數據價值評估和數據生命周期管理,有效地控制數倉的熱存儲中的數據規模;
  • 為了在降本增效的前提下應對不斷提升的應用算力需求,需要提升數倉系統的資源利用率和彈性伸縮能力,因此考慮引入OLAP引擎層面的存算分離和資源隔離機制;
  • 為了應對業務領域拓展可能會帶來的不同的數據分析模式,還需要考慮湖倉一體和簡化、加速數據湖分析的方案。

本次的分享就到這里,謝謝大家。

責任編輯:武曉燕 來源: 網易有數
相關推薦

2022-12-06 17:52:57

離線數倉治理

2016-12-02 11:42:58

網易視頻云直播

2023-08-15 08:12:12

數倉建模數倉建設

2016-12-05 11:27:04

直播

2023-07-02 11:14:21

工具TypeScript框架

2012-05-25 13:54:18

JavaScript

2015-10-19 18:16:15

2012-04-16 18:08:02

網易郵箱

2014-11-13 16:43:45

網易郵箱

2025-09-08 09:39:25

2013-04-03 14:25:36

網易郵箱

2024-10-28 22:37:36

下載中心設計系統

2024-07-17 11:40:58

2021-06-07 11:22:38

大數據數據倉庫湖倉一體

2022-08-16 16:22:18

湖倉一體網易數帆開源

2009-08-05 16:14:32

CDMA網絡的演進無線網絡發展

2018-03-27 10:06:26

對象存儲演進

2024-03-29 13:25:12

互動玩法直播

2015-10-20 23:52:32

數據泄露網易郵箱
點贊
收藏

51CTO技術棧公眾號

午夜精品久久久久久久第一页按摩| 亚洲成人第一| 国产亚洲精品久久777777| 欧美亚洲福利| 18成人在线观看| 91精品免费视频| 中日韩美女免费视频网站在线观看| 色播五月综合| 国产精品爽爽久久久久久| 激情综合网五月| 欧美三级电影网站| 日本一区二区三区免费看| 亚洲图片视频小说| 亚洲视频中文| 亚洲欧洲xxxx| 九九视频精品在线观看| av在线免费观看网| 国产一区二区福利视频| 久热精品视频在线免费观看| 伊人久久一区二区三区| 亚洲成人va| 亚洲国产日韩av| 久久艹中文字幕| 一级黄色免费看| 伊人成年综合电影网| 国产亚洲欧洲高清一区| 免费黄色av网址| 日韩制服诱惑| 亚洲精品伦理在线| 另类欧美小说| 国产模特av私拍大尺度| 老鸭窝毛片一区二区三区| 久久精品国产精品亚洲| 欧美无人区码suv| 欧美成人免费全部网站| 亚洲黄色录像片| 国产精品日韩欧美一区二区| 性色av一区二区三区四区| 亚洲黄色毛片| 中文字幕国产精品| 无码人妻丰满熟妇啪啪网站| 韩日一区二区| 欧美日韩中文字幕在线| 欧美a级在线| 首页亚洲欧美制服丝腿| 日韩精品在线视频美女| 五月六月丁香婷婷| 浪潮色综合久久天堂| 一级做a爱片久久| 一区二区不卡视频| 成人动漫在线免费观看| 国产91精品入口| 成人欧美一区二区三区在线湿哒哒 | 免费国偷自产拍精品视频| 中文字幕色婷婷在线视频| 悠悠色在线精品| 亚洲巨乳在线观看| 天堂中文字幕在线| 成人动漫中文字幕| 91丨九色丨国产| 国产一区二区自拍视频| 免费高清在线一区| 国产精品高潮呻吟久久av无限 | 26uuu亚洲伊人春色| 久久99久久久| 欧美片第1页综合| 久久精品小视频| 香蕉成人在线视频| 久久视频国产| 波霸ol色综合久久| 中文字幕观看av| 日韩大片在线观看| 色婷婷久久一区二区| 久久午夜精品视频| 香蕉视频一区| 亚洲国产美女久久久久 | 国产麻豆视频一区| 成人激情在线播放| 国产精品久久久久久69| 蜜桃精品视频在线| 成人精品一区二区三区| 国产精品亚洲lv粉色| 国产精品亚洲专一区二区三区 | 亚洲一区综合| 午夜在线观看视频| 亚洲免费观看视频| 日b视频免费观看| ririsao久久精品一区| 色8久久久久| 色综合天天爱| 亚洲人av在线影院| av黄色在线免费观看| japanese国产精品| 日韩最新免费不卡| 久久久全国免费视频| 在线欧美一区| 日韩免费在线免费观看| 激情网站在线观看| 国产成人av在线影院| 久久精品国产一区二区三区日韩| 成人三级黄色免费网站| 一二三区精品福利视频| 免费黄色特级片| 国产视频一区二| 亚洲欧美www| 5566中文字幕| 99re国产精品| 91久久久久久久久久久久久| 无码国产精品一区二区色情男同| 国产午夜精品久久久久久久| 欧美大黑帍在线播放| 自拍偷自拍亚洲精品被多人伦好爽| 555夜色666亚洲国产免| 蜜臀av一区二区三区有限公司| 婷婷伊人综合| 国产不卡视频在线| 免费国产精品视频| 日韩码欧中文字| 日韩毛片在线免费看| 中文久久电影小说| 日韩中文字幕在线视频| 色一情一乱一伦| 国产成人aaa| 在线免费观看成人网| 英国三级经典在线观看| 精品国产网站在线观看| 国产一二三四视频| 爽好多水快深点欧美视频| 国产精品一区二区a| 成人福利在线观看视频| 在线精品视频一区二区三四| 538国产视频| 欧美啪啪一区| 91精品黄色| 黄色免费网站在线| 欧美日韩一区二区三区四区| 黄色片视频免费观看| 欧美日韩国产亚洲一区| 91在线免费网站| 麻豆传媒视频在线观看免费| 在线免费观看日本欧美| 日本高清www| 国产婷婷精品| 久久国产精品精品国产色婷婷| 免费看电影在线| 欧美一区二区视频在线观看2022 | 91色在线porny| 日韩小视频网站| 亚洲不卡在线| 欧美国产乱视频| av免费在线不卡| 亚洲欧美日韩中文播放| 亚洲男人天堂2021| 91精品高清| 99九九视频| 手机av免费在线| 亚洲精品一线二线三线| 久久精品国产亚洲AV无码麻豆| 国产不卡在线播放| 欧美精品自拍视频| 老牛影视av一区二区在线观看| 国内揄拍国内精品| 精品人妻一区二区三区含羞草| 一区二区三区四区视频精品免费 | 国产美女精品人人做人人爽| 在线免费观看成人| 视频一区在线| 国语自产在线不卡| 欧美69xxxxx| 日韩欧美在线免费| 天天操天天舔天天射| 美女在线视频一区| av电影一区二区三区| 亚洲日本视频在线| 91黑丝在线观看| 国产中文在线视频| 欧美精品1区2区3区| 日韩福利小视频| 国产福利一区二区三区视频| 日韩 欧美 视频| 毛片网站免费观看| 国产免费a级片| 18禁一区二区三区| 日本久久久久久久久久| 久久人妻少妇嫩草av蜜桃| 五月天丁香花婷婷| 国产福利精品一区二区三区| 中文字幕久久av| 91精产国品一二三产区别沈先生| 欧美日韩精品区别| 99视频在线观看视频| av av在线| 性欧美成人播放77777| 国产精成人品免费观看| 免费黄色av网址| 污污视频网站免费观看| 霍思燕三级露全乳照| 麻豆一区二区三区在线观看| 一区二区在线高清视频| 北条麻妃在线一区| 日本精品在线免费观看| 精品动漫3d一区二区三区免费版 | 欧美日韩精品三区| 色婷婷综合久久久久中文| 欧美这里有精品| 欧美色电影在线| 欧美日韩国产首页在线观看| 日韩美女在线视频| 亚洲欧美一区二区三区四区| 久久精品成人欧美大片| 国产精品久久久久久久av大片| 欧美大片免费播放| 国产永久免费高清在线观看视频| 在线播放欧美女士性生活| 日本中文字幕在线免费观看| 国产精品无圣光一区二区| 美女露出粉嫩尿囗让男人桶| 麻豆精品久久精品色综合| 成人综合视频在线| 欧美精品福利| 亚洲免费视频一区| 窝窝社区一区二区| 岛国视频一区| 99久久99九九99九九九| 国产精品 欧美在线| 成人性生交大片免费看在线播放| 中文字幕欧美国内| 欧美xxx.com| 亚洲精品国精品久久99热一| 国产aⅴ一区二区三区| 欧美日韩一区二区在线观看| 久久久久久不卡| 婷婷丁香久久五月婷婷| 国产性一乱一性一伧一色| 国产精品国产自产拍高清av| 国产三级av在线播放| 91麻豆国产在线观看| 国产婷婷在线观看| 国产盗摄一区二区三区| 天堂av.com| 久久成人精品无人区| 国内自拍视频网| 久久一日本道色综合久久| 少妇高潮喷水在线观看| 国自产拍偷拍福利精品免费一| 中文字幕一区二区三区四区五区人 | 夜夜狠狠擅视频| 欧美网站一区二区| 在线免费观看av网址| 色综合咪咪久久| 亚洲午夜18毛片在线看| 午夜激情一区二区三区| 久久丫精品久久丫| 亚洲高清视频在线| 久久狠狠高潮亚洲精品| 天天色综合成人网| 国产成人无码精品亚洲| 欧美日韩中国免费专区在线看| 中文字幕在线观看免费视频| 亚洲va韩国va欧美va精品| 国产在线视频你懂的| 亚洲已满18点击进入久久| 久久精品视频久久| 亚洲高清视频中文字幕| 日本一级片免费看| 色哟哟日韩精品| 怡红院成永久免费人全部视频| 欧美日韩中文字幕精品| 国产精品久久久久久免费播放| 3d动漫精品啪啪| www日本高清视频| 亚洲精品在线观看网站| 亚洲av成人精品毛片| 国产亚洲欧美日韩美女| 日本成人在线播放| 欧美另类交人妖| 国产精品13p| 国产精品久久久久77777| 香蕉成人在线| 粉嫩av一区二区三区免费观看| 九九热播视频在线精品6| 欧美日韩亚洲综合一区二区三区激情在线 | 亚洲熟妇一区二区三区| 欧美激情一区二区三区不卡| 男人的午夜天堂| 亚洲韩国精品一区| 无码人妻精品一区二区50| 欧美日韩欧美一区二区| 黄色www视频| 中文字幕久久精品| caoporn-草棚在线视频最| 欧美在线一级视频| 日日夜夜一区| 精品无人乱码一区二区三区的优势| 欧美一区二区麻豆红桃视频| 久久久无码中文字幕久...| 国产精品一页| 天天做天天干天天操| 91麻豆成人久久精品二区三区| 蜜桃av.com| 五月激情六月综合| 在线免费观看一区二区| 亚洲国产精品字幕| 免费在线视频欧美| 欧美一区二粉嫩精品国产一线天| 亚洲美女色播| 美国av一区二区三区| 欧美成人中文| 黄色在线视频网| 91在线观看污| 国产a免费视频| 91国产视频在线观看| 亚洲国产精品成人久久蜜臀| 中文字幕亚洲无线码在线一区| 成人女同在线观看| 91精品在线观| 日韩电影一区| 日日鲁鲁鲁夜夜爽爽狠狠视频97| 国产一区不卡在线| 国产精品情侣呻吟对白视频| 亚洲成人免费视频| 99精品视频免费看| 日韩在线一区二区三区免费视频| 中文字幕在线官网| 国产成人精品免费视频大全最热| 日韩精品永久网址| 国产裸体免费无遮挡| 99精品一区二区| 激情五月少妇a| 777午夜精品视频在线播放| 精品电影在线| 2018国产精品视频| 成人自拍在线| 91嫩草国产丨精品入口麻豆| 日本不卡一区二区三区高清视频| 欧美熟妇一区二区| 狠狠躁夜夜躁人人躁婷婷91| 欧美 日韩 国产 在线| 欧美精品免费在线| 精品久久国产一区| 色乱码一区二区三区熟女| 日本成人中文字幕在线视频| caopeng视频| 日韩欧美一区二区在线| 头脑特工队2在线播放| 2018国产精品视频| 亚洲小说图片视频| 99999精品视频| 久久一留热品黄| 日韩免费av网站| 亚洲欧美日韩一区在线| 日韩伦理三区| 欧美人与性禽动交精品| 天堂成人免费av电影一区| 黑人巨大精品欧美| 色哟哟一区二区| 成人影视在线播放| 国产精品色悠悠| 99精品视频在线观看播放| 亚洲精品性视频| 日韩理论片中文av| 国产极品久久久| 欧美国产在线视频| 精品欧美午夜寂寞影院| 免费在线观看亚洲视频| 久久婷婷国产综合精品青草| 亚洲自拍一区在线观看| 中文字幕欧美视频在线| 日韩精品一页| 欧美xxxx吸乳| 高清av一区二区| 少妇一级淫片免费放中国 | 亚洲成人精选| 三上悠亚 电影| 午夜精品爽啪视频| 男女污视频在线观看| 国产欧美日韩最新| 自拍偷拍欧美| 99久久免费看精品国产一区| 色综合夜色一区| 欧美成人三区| 成人av资源网| 久久久久久黄| 国产精品嫩草影院俄罗斯| 欧美zozozo| 欧美成a人片在线观看久| 综合久久国产| 成人精品鲁一区一区二区| 人人妻人人爽人人澡人人精品| 久久精品国产69国产精品亚洲| 福利电影一区| 三级在线视频观看| 亚洲一区影音先锋| 国产三级电影在线| 97操在线视频| 视频在线观看一区二区三区| 成人免费视频网站入口::| 日韩大陆毛片av| 在线欧美激情| 茄子视频成人免费观看|