精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

基于Kafka+Flink平臺化設計,實時數倉還能這樣建

大數據 Kafka
本文由網易云音樂實時計算平臺研發工程師岳猛分享,主要從以下四個部分將為大家介紹 Flink + Kafka 在網易云音樂的應用實戰。

本文由網易云音樂實時計算平臺研發工程師岳猛分享,主要從以下四個部分將為大家介紹 Flink + Kafka 在網易云音樂的應用實戰:

背景

  • Flink + Kafka 平臺化設計
  • Kafka 在實時數倉中的應用
  • 問題 & 改進

一、背景介紹

1、流平臺通用框架

目前流平臺通用的架構一般來說包括消息隊列、計算引擎和存儲三部分,通用架構如下圖所示。客戶端或者 web 的 log 日志會被采集到消息隊列;計算引擎實時計算消息隊列的數據;實時計算結果以 Append 或者 Update 的形式存放到實時存儲系統中去。

目前,我們常用的消息隊列是 Kafka,計算引擎一開始我們采用的是 Spark Streaming,隨著 Flink 在流計算引擎的優勢越來越明顯,我們最終確定了 Flink 作為我們統一的實時計算引擎。

2、為什么選 Kafka?

Kafka 是一個比較早的消息隊列,但是它是一個非常穩定的消息隊列,有著眾多的用戶群體,網易也是其中之一。我們考慮 Kafka 作為我們消息中間件的主要原因如下:

  • 高吞吐,低延遲:每秒幾十萬 QPS 且毫秒級延遲;
  • 高并發:支持數千客戶端同時讀寫;
  • 容錯性,可高性:支持數據備份,允許節點丟失;
  • 可擴展性:支持熱擴展,不會影響當前線上業務。

3、為什么選擇 Flink?

Apache Flink 是近年來越來越流行的一款開源大數據流式計算引擎,它同時支持了批處理和流處理,考慮 Flink 作為我們流式計算引擎的主要因素是:

  • 高吞吐,低延遲,高性能;
  • 高度靈活的流式窗口;
  • 狀態計算的 Exactly-once 語義;
  • 輕量級的容錯機制;
  • 支持 EventTime 及亂序事件;
  • 流批統一引擎。

4、Kafka + Flink 流計算體系

基于 Kafka 和 Flink 的在消息中間件以及流式計算方面的耀眼表現,于是產生了圍繞 Kafka 及 Flink 為基礎的流計算平臺體系,如下圖所示:基于 APP、web 等方式將實時產生的日志采集到 Kafka,然后交由 Flink 來進行常見的 ETL,全局聚合以及Window 聚合等實時計算。

5、網易云音樂使用 Kafka 的現狀

目前我們有 10+個 Kafka 集群,各個集群的主要任務不同,有些作為業務集群,有些作為鏡像集群,有些作為計算集群等。當前 Kafka 集群的總節點數達到 200+,單 Kafka 峰值 QPS 400W+。目前,網易云音樂基于 Kafka+Flink 的實時任務達到了 500+。

二、Flink+Kafka 平臺化設計

基于以上情況,我們想要對 Kafka+Flink 做一個平臺化的開發,減少用戶的開發成本和運維成本。實際上在 2018 年的時候我們就開始基于 Flink 做一個實時計算平臺,Kafka 在其中發揮著重要作用,今年,為了讓用戶更加方便、更加容易的去使用 Flink 和 Kafka,我們進行了重構。

基于 Flink 1.0 版本我們做了一個 Magina 版本的重構,在 API 層次我們提供了 Magina SQL 和 Magina SDK 貫穿 DataStream 和 SQL 操作;然后通過自定義 Magina SQL Parser 會把這些 SQL 轉換成 Logical Plan,在將 LogicalPlan 轉化為物理執行代碼,在這過程中會去通過 catalog 連接元數據管理中心去獲取一些元數據的信息。我們在 Kafka 的使用過程中,會將 Kafka 元數據信息登記到元數據中心,對實時數據的訪問都是以流表的形式。在 Magina 中我們對 Kafka 的使用主要做了三部分的工作:

  • 集群 catalog 化;
  • Topic 流表化;
  • Message Schema 化。

用戶可以在元數據管理中心登記不同的表信息或者 catalog 信息等,也可以在 DB 中創建和維護 Kafka 的表,用戶在使用的過程只需要根據個人需求使用相應的表即可。下圖是對 Kafka 流表的主要引用邏輯。

三、Kafka 在實時數倉中的應用

1、在解決問題中發展

Kafka 在實時數倉使用的過程中,我們遇到了不同的問題,中間也嘗試了不同的解決辦法。

在平臺初期, 最開始用于實時計算的只有兩個集群,且有一個采集集群,單 Topic 數據量非常大;不同的實時任務都會消費同一個大數據量的 Topic,Kafka 集群 IO 壓力異常大;

因此,在使用的過程發現 Kafka 的壓力異常大,經常出現延遲、I/O 飆升。

我們想到把大的 Topic 進行實時分發來解決上面的問題,基于 Flink 1.5 設計了如下圖所示的數據分發的程序,也就是實時數倉的雛形。基于這種將大的 Topic 分發成小的 Topic 的方法,大大減輕了集群的壓力,提升了性能,另外,最初使用的是靜態的分發規則,后期需要添加規則的時候要進行任務的重啟,對業務影響比較大,之后我們考慮了使用動態規則來完成數據分發的任務。

解決了平臺初期遇到的問題之后,在平臺進階過程中 Kafka 又面臨新的問題:

  • 雖然進行了集群的擴展,但是任務量也在增加,Kafka 集群壓力仍然不斷上升;
  • 集群壓力上升有時候出現 I/O 相關問題,消費任務之間容易相互影響;
  • 用戶消費不同的 Topic 過程沒有中間數據的落地,容易造成重復消費;
  • 任務遷移 Kafka 困難。

針對以上問題,我們進行了如下圖所示的 Kafka 集群隔離和數據分層處理。其過程簡單來說,將集群分成 DS 集群、日志采集集群、分發集群,數據通過分發服務分發到 Flink 進行處理,然后通過數據清洗進入到 DW 集群,同時在 DW 寫的過程中會同步到鏡像集群,在這個過程中也會利用 Flink 進行實時計算的統計和拼接,并將生成的 ADS 數據寫入在線 ADS 集群和統計 ADS 集群。通過上面的過程,確保了對實時計算要求比較高的任務不會受到統計報表的影響。

通過上面的過程,確保了對實時計算要求比較高的任務不會受到統計報表的影響。但是我們分發了不同的集群以后就不可避免的面臨新的問題:

  • 如何感知 Kafka 集群狀態?
  • 如何快速分析 Job 消費異常?

針對上面兩個問題,我們做了一個 Kafka 監控系統,其監控分為如下兩個維度,這樣在出現異常的時候就可以進行具體判斷出現問題的詳細情況:

  • 集群概況的監控:可以看到不同集群對應的 Topic 數量以及運行任務數量,以及每個 Topic 消費任務數據量、數據流入量、流入總量和平均每條數據大小;
  • 指標監控:可以看到 Flink 任務以及對應的 Topic、GroupID、所屬集群、啟動時間、輸入帶寬、InTPS、OutTPS、消費延遲以及 Lag 情況。

2、Flink + Kafka 在 Lambda 架構下的運用

流批統一是目前非常火的概念,很多公司也在考慮這方面的應用,目前常用的架構要么是 Lambda 架構,要么是 Kappa 架構。對于流批統一來講需要考慮的包括存儲統一和計算引擎統一,由于我們當前基建沒有統一的存儲,那么我們只能選擇了 Lamda 架構。

下圖是基于 Flink 和 Kafka 的 Lambda 架構在云音樂的具體實踐,上層是實時計算,下層是離線計算,橫向是按計算引擎來分,縱向是按實時數倉來區分。

四、問題&改進

在具體的應用過程中,我們也遇到了很多問題,最主要的兩個問題是:

  • 多 Sink 下 Kafka Source 重復消費問題;
  • 同交換機流量激增消費計算延遲問題。

1、多 Sink 下 Kafka Source 重復消費問題

Magina 平臺上支持多 Sink,也就是說在操作的過程中可以將中間的任意結果插入到不同的存儲中。這個過程中就會出現一個問題,比如同一個中間結果,我們把不同的部分插入到不同的存儲中,那么就會有多條 DAG,雖然都是臨時結果,但是也會造成 Kafka Source 的重復消費,對性能和資源造成極大的浪費。

于是我們想,是否可以避免臨時中間結果的多次消費。在 1.9 版本之前,我們進行了 StreamGraph 的重建,將三個 DataSource 的 DAG 進行了合并;在 1.9 版本,Magina 自己也提供了一個查詢和 Source 合并的優化;但是我們發現如果是在同一個 data update 中有對同一個表的多個 Source 的引用,它自己會合并,但是如果不是在同一個 data update 中,是不會立即合并的,于是在 1.9 版本之后中我們對 modifyOperations 做了一個 buffer 來解決這個問題。

2、同交換機流量激增消費計算延遲問題

這個問題是最近才出現的問題,也可能不僅僅是同交換機,同機房的情況也可能。在同一個交換機下我們部署了很多機器,一部分機器部署了 Kafka 集群,還有一部分部署了 Hadoop 集群。在 Hadoop 上面我們可能會進行 Spark、Hive 的離線計算以及 Flink 的實時計算,Flink 也會消費 Kafka 進行實時計算。在運行的過程中我們發現某一個任務會出現整體延遲的情況,排查過后沒有發現其他的異常,除了交換機在某一個時間點的瀏覽激增,進一步排查發現是離線計算的瀏覽激增,又因為同一個交換機的帶寬限制,影響到了 Flink 的實時計算。

為解決這個問題,我們就考慮要避免離線集群和實時集群的相互影響,去做交換機部署或者機器部署的優化,比如離線集群單獨使用一個交換機,Kafka 和 Flink 集群也單獨使用一個交換機,從硬件層面保證兩者之間不會相互影響。

Q&A

Q1:Kafka 在實時數倉中的數據可靠嗎?

A1:這個問題的答案更多取決于對數據準確性的定義,不同的標準可能得到不同的答案。自己首先要定義好數據在什么情況下是可靠的,另外要在處理過程中有一個很好的容錯機制。

Q2:我們在學習的時候如何去學習這些企業中遇到的問題?如何去積累這些問題?

A2:個人認為學習的過程是問題推動,遇到了問題去思考解決它,在解決的過程中去積累經驗和自己的不足之處。

Q3:你們在處理 Kafka 的過程中,異常的數據怎么處理,有檢測機制嗎?

A3:在運行的過程中我們有一個分發的服務,在分發的過程中我們會根據一定的規則來檢測哪些數據是異常的,哪些是正常的,然后將異常的數據單獨分發到一個異常的 Topic 中去做查詢等,后期用戶在使用的過程中可以根據相關指標和關鍵詞到異常的 Topic 中去查看這些數據。

 

責任編輯:未麗燕 來源: Flink 中文社區
相關推薦

2021-08-31 10:18:34

Flink 數倉一體快手

2021-07-13 07:04:19

Flink數倉數據

2022-06-22 06:42:35

美團業務FlinkSQL數倉

2018-10-19 14:16:09

Flink數據倉庫數據系統

2025-05-20 10:03:59

數據倉庫Flink SQLPaimon

2022-09-28 07:08:25

技術實時數倉

2021-01-18 05:20:52

數倉hive架構

2021-07-16 10:55:45

數倉一體Flink SQL

2022-08-01 15:58:48

數據倉庫架構數據

2023-08-29 10:20:00

2022-01-05 18:18:01

Flink 數倉連接器

2023-12-11 08:00:00

架構FlinkDruid

2022-08-17 09:01:10

數據存儲

2023-10-13 07:25:50

2021-04-27 10:22:04

數倉分布式事務

2021-07-22 18:29:58

AI

2024-09-03 14:59:00

2018-08-03 15:28:51

數據平臺數據倉庫OLTP

2023-07-27 07:44:07

云音樂數倉平臺
點贊
收藏

51CTO技術棧公眾號

国产有码在线| 国产黄色录像视频| 亚洲天堂免费电影| 久久精品人人做人人综合 | 欧美另类高清zo欧美| www.黄色网址.com| 欧美一区二区三区少妇| 精品在线播放午夜| 97国产精品免费视频| xxxxx99| www.久久东京| 欧美日韩一级视频| 日本www在线视频| 精品国产99久久久久久| 91视频观看视频| 成人精品网站在线观看| 日韩毛片一区二区三区| 影音先锋日韩精品| 亚洲天堂av在线播放| 色婷婷狠狠18禁久久| 国产另类xxxxhd高清| 亚洲一区国产视频| 亚洲午夜久久久影院伊人| 欧洲精品久久一区二区| 久久99国产精品麻豆| 欧日韩不卡在线视频| 久久久久亚洲av无码专区体验| 深爱激情综合网| 欧美精品一区二区三区蜜桃| 亚洲精品手机在线观看| 欧美日韩视频网站| 午夜视频在线观看一区二区| japanese在线播放| 91精品国产综合久久久久久豆腐| 91片在线免费观看| 国产精品视频一区二区三区经| 91在线精品入口| 日本不卡高清视频| 欧美专区日韩视频| 亚洲精品77777| 欧美三级网页| 欧美精品一区二区三区国产精品| 国产精品麻豆免费版现看视频| 久久91麻豆精品一区| 日韩福利在线播放| 黄色在线观看av| 麻豆成人入口| 日韩成人性视频| 亚洲一区二区在线免费| 成人激情自拍| 亚洲精品国产精品乱码不99按摩| 国产女主播在线播放| 亚洲码欧美码一区二区三区| 日韩欧美中文一区| 国产无套精品一区二区三区| 精品中文字幕一区二区三区| 日韩欧美亚洲国产另类| 国产精品嫩草影视| 日韩一级淫片| 精品国产区一区| 国产精品麻豆入口| 青青久久av| 亚洲视频视频在线| 国产调教在线观看| 天天色综合色| 欧美国产日韩xxxxx| 国产一级理论片| 日韩一区二区免费看| 欧日韩不卡在线视频| 无码免费一区二区三区| 蜜臀av性久久久久蜜臀av麻豆| 国产欧美va欧美va香蕉在线| 国产美女www爽爽爽视频| 国产精品一区久久久久| 国产精品福利视频| 色视频精品视频在线观看| 久久丝袜美腿综合| 亚洲一区二区免费视频软件合集| 超碰caoporn久久| 亚洲国产精品一区二区久久恐怖片| 人人干视频在线| 欧美激情喷水| 欧美福利视频导航| 任你躁av一区二区三区| 色天天色综合| 色777狠狠综合秋免鲁丝| 免费网站看av| 麻豆成人精品| 91系列在线播放| 天天色棕合合合合合合合| 国产日产亚洲精品系列| 在线观看17c| 欧美xxxx做受欧美护士| 日韩一区二区免费在线观看| 一区二区三区免费在线观看视频| 日本一二区不卡| 久久久久国产一区二区三区| 无码人妻久久一区二区三区不卡| 国产一区二区影院| 玖玖玖精品中文字幕| 黄色网页在线看| 午夜精品一区二区三区电影天堂| 日日碰狠狠丁香久燥| 日韩成人视屏| 色多多国产成人永久免费网站 | 蜜桃传媒视频麻豆一区| 免费在线看黄| 色诱亚洲精品久久久久久| 婷婷中文字幕在线观看| 国产成人1区| 欧美极品少妇xxxxⅹ喷水| 国产精品无码一区| 97精品电影院| 999久久欧美人妻一区二区| 欧洲精品一区二区三区| 亚洲国产精品久久精品怡红院| 人妻无码一区二区三区免费| 一本一本久久| 国产精品一区二区你懂得| 蜜桃视频在线观看免费视频网站www| 激情懂色av一区av二区av| 日韩av自拍偷拍| 欧美一区二区三区激情视频| 91高清免费视频| 亚洲乱色熟女一区二区三区| 国产精品精品国产色婷婷| 成人久久久久久久久| 高清欧美性猛交xxxx黑人猛| 久久中文字幕在线| 中文字幕一区2区3区| 久久久久国产精品麻豆| 国产一区二区视频播放| youjizzjizz亚洲| 久久久精品国产一区二区| 日韩乱码一区二区三区| 久久久久久影视| 国产日韩一区二区在线| 久久97精品| 久久久久久久香蕉网| 亚洲xxx在线| 亚洲精品亚洲人成人网| 日本美女久久久| 亚洲影视一区二区三区| 91人成网站www| av大全在线| 91精品国产丝袜白色高跟鞋| 91高清免费观看| 国产米奇在线777精品观看| 亚洲精品国产精品久久| 国产资源一区| 久久精品国产69国产精品亚洲 | 亚洲成人激情社区| 亚洲欧美国产一区二区三区| 人人妻人人爽人人澡人人精品 | 国产97免费视频| 国产一区二区伦理片| 青青草免费在线视频观看| 国产精品毛片aⅴ一区二区三区| 久久av红桃一区二区小说| 国产三级漂亮女教师| 夜夜嗨av一区二区三区网页| yjizz视频| 亚洲欧美视频| 午夜一区二区三区| 精品视频在线播放一区二区三区 | 久久久久伊人| 日韩在线观看高清| 精品久久人妻av中文字幕| 亚洲国产一区二区在线播放| 亚洲天堂2024| 久久国产高清| 这里只有精品66| 91蝌蚪精品视频| 日本欧美中文字幕| 拍真实国产伦偷精品| 日韩欧美电影在线| 亚洲熟女综合色一区二区三区| 欧美激情在线观看视频免费| 日韩在线一区视频| 亚洲九九精品| 新呦u视频一区二区| 久久久久毛片免费观看| 午夜精品在线观看| av在线中文| 精品国精品国产尤物美女| 久久精品一二区| 亚洲欧洲日韩综合一区二区| aaa黄色大片| 日韩电影免费在线看| 国产91视频一区| 欧美激情在线精品一区二区三区| 91精品美女在线| www视频在线观看| 色偷偷888欧美精品久久久 | 一区二区中文字幕| 精品人妻少妇嫩草av无码专区| 欧美性猛交xxxx久久久| 裸体武打性艳史| 国产亚洲精品7777| 亚洲AV成人精品| 免费观看在线综合色| 男女激情无遮挡| 久久久久久久久国产一区| 欧美高清一区二区| 午夜电影一区| 国产精品欧美风情| 国产精品高颜值在线观看| 精品国产依人香蕉在线精品| 欧美日韩影视| 亚洲精品av在线| a天堂在线视频| 欧洲一区二区三区在线| 你懂的国产视频| 亚洲精品一二三区| 日本美女黄色一级片| 久久久影视传媒| 精品人妻在线视频| 国产精品一二三四| 第四色婷婷基地| 可以看av的网站久久看| 一二三四视频社区在线| 欧美xxx在线观看| 在线综合视频网站| 欧州一区二区| 欧美一区免费视频| 丝袜连裤袜欧美激情日韩| av一区二区三区免费| 国产精品中文| 国产日韩欧美自拍| 99精品在免费线偷拍| 国产999精品| 免费看av不卡| 日韩美女视频免费看| 免费看男女www网站入口在线| 欧美疯狂xxxx大交乱88av| 大片免费在线观看| 社区色欧美激情 | 看女生喷水的网站在线观看| 最近2019免费中文字幕视频三| 韩国中文字幕2020精品| 亚洲女人被黑人巨大进入al| 奇米影视888狠狠狠777不卡| 亚洲精品在线看| 男操女在线观看| 亚洲免费精彩视频| 国产美女视频一区二区三区| 亚洲人a成www在线影院| 国产三级视频在线| 一区二区欧美久久| av黄色在线观看| www.日韩系列| av小次郎在线| 欧美极品少妇xxxxⅹ免费视频 | 黄色精品在线看| 国产高潮久久久| 91久久精品网| 又污又黄的网站| 欧美一区日韩一区| xxxwww在线观看| 亚洲国产又黄又爽女人高潮的| 四虎精品成人影院观看地址| 亚洲欧美精品中文字幕在线| 在线观看av的网站| 久久亚洲欧美日韩精品专区| 免费看电影在线| 欧美综合第一页| 欧美国产日韩电影| 91亚洲精品在线| 成人福利免费在线观看| 欧美亚洲免费高清在线观看 | 久久久久国产精品麻豆| 免费黄色激情视频| 亚洲一卡二卡三卡四卡无卡久久| 日韩免费黄色片| 色综合久久综合| 国产又黄又粗又长| 精品欧美一区二区久久| 日本天堂在线| 俺去亚洲欧洲欧美日韩| tube8在线hd| 国产精品91久久久久久| 九九99久久精品在免费线bt| 国产亚洲欧美一区二区| sdde在线播放一区二区| 青青在线免费视频| 国产精品久久久久久模特| 一区二区三区入口| 丰满少妇久久久久久久| 亚洲色成人网站www永久四虎| 亚洲日本青草视频在线怡红院| 9i看片成人免费看片| 欧美高清精品3d| 九九在线视频| 欧美黄色免费网站| 91精品国产66| 精品国产一区二区三区四区精华| 人人狠狠综合久久亚洲婷| 性一交一乱一伧国产女士spa| 日韩av一二三| 欧美在线一级片| 亚洲欧洲日韩一区二区三区| 久久国产黄色片| 亚洲精品在线免费播放| 色综合久久影院| 人人做人人澡人人爽欧美| 亚洲一区二区三区四区电影 | 九七久久人人| 国产精品v日韩精品| 精品三级在线观看视频| 婷婷视频在线播放| 日韩国产成人精品| 国产精品一区二区人妻喷水| 一区二区三区蜜桃| 亚洲天堂手机版| 亚洲色图13p| 在线观看的黄色| 激情视频在线观看一区二区三区| 欧美伊人久久| 色戒在线免费观看| 久久久www免费人成精品| 免费中文字幕在线观看| 777午夜精品免费视频| 99reav在线| 国产精品久久久久久搜索| 婷婷成人影院| av免费观看网| 成人av资源在线| 久久精品视频日本| 欧美成人精品高清在线播放| 黄色小网站在线观看| 国产精品主播视频| 国产欧美日韩一区二区三区四区| 国产 日韩 亚洲 欧美| 成人在线综合网| 久久久久久久久久久97| 日韩欧美一级片| 在线xxxx| 国产精品12| 国内精品嫩模av私拍在线观看| av地址在线观看| 成人免费在线视频| 国产又爽又黄又嫩又猛又粗| 久久在线精品视频| www.久久99| 成年在线观看视频| 国产福利91精品一区二区三区| 精品国产乱码久久久久久鸭王1| 日韩一区二区三区电影在线观看 | www.555国产精品免费| 亚洲综合清纯丝袜自拍| 国产成人手机在线| 91干在线观看| 国产欧美日韩| 日本中文字幕精品—区二区| 中文字幕综合网| av一级黄色片| 韩国三级电影久久久久久| 色老板在线视频一区二区| 成人免费视频久久| 国产精品人成在线观看免费| 国产精选久久久| 国内外成人免费激情在线视频| 欧美亚洲大陆| 国产视频手机在线播放| 中文字幕一区二区三| www.久久久久久| 91成人福利在线| 91视频综合| 丰满熟女人妻一区二区三区| 色中色一区二区| 韩国av网站在线| 精品乱色一区二区中文字幕| 肉色丝袜一区二区| 日本a级片视频| 亚洲精品在线不卡| 91丨精品丨国产| 欧美大片在线播放| 中文字幕免费一区| 性生活免费网站| 国产不卡av在线| 欧美精品国产| 波多野在线播放| 日韩一区二区免费高清| xxxxx性欧美特大| 手机成人av在线| 91美女片黄在线观看| 97在线播放免费观看| 欧美一级片免费在线| 97精品视频在线看| 欧美成人三级伦在线观看| 欧美日韩aaaaaa| 牛牛精品一区二区| 在线观看欧美激情| 97久久人人超碰| 国产精品无码天天爽视频| 7777kkkk成人观看| 一本到12不卡视频在线dvd| 丰满少妇一区二区| 日韩欧美亚洲国产精品字幕久久久| 免费观看一级欧美片|