精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

建立高性能風險數據集市的分步指南

譯文
大數據
開發人員追求數據驅動的管理,他們的目標是在數據平臺開發中滿足四個需求:監控和警報、查詢和分析、儀表板和數據建模。出于這些目的,他們基于Greenplum和CDH構建了數據處理架構。其中最重要的部分是風險數據集市。

譯者 | 李睿

審校 | 重樓

開發人員追求數據驅動的管理,他們的目標是在數據平臺開發中滿足四個需求:監控和警報、查詢和分析、儀表板和數據建模。出于這些目的,他們基于Greenplum和CDH構建了數據處理架構。其中最重要的部分是風險數據集市。

風險數據集市:Apache Hive

以下介紹風險數據集市是如何按照數據流工作的:

(1)業務數據被導入Greenplum進行實時分析以生成商業智能(BI)報告。這些數據的一部分也會進入Apache Hive進行查詢和建模分析。

(2)風險控制變量在Elasticsearch中通過消息隊列實時更新,同時Elasticsearch也將數據攝取到Hive中進行分析。

(3)將風險管理決策數據從MongoDB傳遞給Hive進行風控分析和建模。

這是風險數據集市的三個數據源。

整個架構是用CDH 6.0構建的,其中的工作流程可分為實時數據流和離線風險分析。

  • 實時數據流:來自Apache Kafka的實時數據將被Apache Flink清理,然后寫入Elasticsearch。Elasticsearch會匯總接收到的部分數據,并將其發送給風險管理作為參考。
  • 線下風險分析:基于CDH解決方案,利用Sqoop對其進行線下數據攝取。然后將這些數據與來自MongoDB的第三方數據放在一起。然后,經過數據清洗之后,將所有這些數據輸入Hive中進行日常的批量處理和數據查詢。

簡要概述一下,這些組件支持數據處理平臺的四個功能:

如上圖所見,Apache Hive是這個架構的核心。但在實踐中,Apache Hive執行分析需要幾分鐘,因此下一步是提高查詢速度。

是什么拖慢了查詢速度?

外部表中的巨大數據量

基于Hive的數據集市現在承載著超過300TB的數據。大約有2萬個表和500萬個字段。將它們全部放在外部表中是維護密集型的。此外,數據攝取可能是一個令人頭疼的問題。

更大的平面表

由于風險管理中規則引擎的復雜性,企業在變量的推導上投入了大量的資金。在某些維度上,有數千個甚至更多的變量。因此,Hive中一些常用的平面表有超過3000個字段。因此,可以想象這些查詢是多么耗時。

不穩定的接口

日常離線批處理產生的結果將定期發送到Elasticsearch集群 (這些更新中的數據量很大,接口調用可能會過期) 。這一過程可能導致高I/O并引入垃圾收集器抖動,從而進一步導致接口服務不穩定。

此外,由于風控分析師和建模工程師使用Hive和Spark,不斷擴展的數據架構也拖累了查詢性能。

統一查詢網關

在此需要一個統一的網關來管理異構數據源。這就是為什么介紹Apache Doris的原因

但這不會讓事情變得更復雜嗎?事實上并沒有。

可以將各種數據源連接到Apache Doris,并簡單地對其進行查詢。這是由Apache Doris的多目錄特性實現的:它可以與各種數據源接口,包括像Apache Hive、Apache Iceberg和Apache Hudi這樣的數據湖,以及像MySQL、Elasticsearch和Greenplum這樣的數據庫。這恰好涵蓋了工具箱。

在Apache Doris中創建Elasticsearch Catalog和Hive Catalog。這些目錄映射到Elasticsearch和Hive中的外部數據,因此可以使用Apache Doris作為統一網關跨這些數據源執行查詢。此外,使用Spark-Doris- connector來實現Spark和Doris之間的數據通信。所以基本上,用Apache Doris代替Apache Hive作為數據架構的中心樞紐。

這對數據處理效率有何影響?

  • 監控和警報:這是關于實時數據查詢。使用Apache Doris中的Elasticsearch Catalog訪問Elasticsearch集群中的實時數據。然后直接在Apache Doris中執行查詢。它能夠在幾秒鐘內返回結果,而不是使用Hive時的幾分鐘級別的響應時間。
  • 查詢和分析:在Hive中有20,000個表,所以將它們全部映射到Hive中的外部表是沒有意義的。這需要花費一大筆維護費用。與其相反,利用Apache Doris 1.2的Multi Catalog特性。它支持目錄級別的數據映射,因此可以簡單地在Doris中創建一個Hive Catalog。然后再進行查詢。這將查詢操作從Hive的日常批量處理工作量中分離出來,從而減少資源沖突。
  • 儀表板:使用Tableau和Doris提供儀表板服務。這將查詢響應時間縮短到幾秒和幾毫秒,而在“Tableau + Hive”時則需要幾分鐘。
  • 建模:使用Spark和Doris進行聚合建模。Spark-Doris-Connector允許數據的相互同步,因此來自Doris的數據也可以用于建模以進行更準確的分析。

生產環境中的集群監控

在生產環境中測試了這個新架構,為此建立了兩個集群。

配置:

生產集群:4個前端+ 8個后端,m5d.16xlarge

備份集群:4個前端+ 4個后端,m5d.16xlarge

以下是監控板:

如上圖所示,查詢速度很快。預計它至少需要10個節點,但在實際情況中,主要通過Catalogs進行查詢,因此可以用相對較小的集群大小來處理這個問題。兼容性也很好。它不會影響現有系統的其余部分。

快速數據集成指南

為了加速從Hive到Apache Doris 1.2.2的常規數據攝取,以下有一個解決方案:

主要部件:

  • Dolphin Scheduler 3.1.4
  • SeaTunnel 2.1.3

對于當前的硬件配置,使用DolphinScheduler的Shell腳本模式,并定期調用SeaTunnel腳本。數據同步任務的配置文件:

SQL 
  env{
 spark.app.name = “hive2doris-template”
  spark.executor.instances = 10
 spark.executor.cores = 5
 spark.executor.memory = “20g”
 }
 spark {
  spark.sql.catalogImplementation = “hive”
 }
 source {
  hive {
  pre_sql = “select * from ods.demo_tbl where dt=’2023-03-09’”
  result_table_name = “ods_demo_tbl”
  }
 }

 transform {
 }
 
 sink {
  doris {
  fenodes = “192.168.0.10:8030,192.168.0.11:8030,192.168.0.12:8030,192.168.0.13:8030”
  user = root
  password = “XXX”
  database = ods
  table = ods_demo_tbl
  batch_size = 500000
  max_retries = 1
  interval = 10000
  doris.column_separator = “\t”
  }
 }

這一解決方案消耗更少的資源和內存,但在查詢和數據攝取方面帶來更高的性能。

更低的存儲成本

  • 之前:Hive中的原始表有500個字段。它按天劃分為多個分區,每個分區有1.5億條數據。在HDFS中存儲需要810G存儲空間。
  • 之后:為了數據同步,使用SeaTunnel在YARN上調用Spark。它可以在40分鐘內完成,并且攝取的數據只占用270G的存儲空間。

更少的內存使用和更高的查詢性能

  • 之前:Hive中對上述表進行GROUP BY查詢,占用720個內核,占用YARN 1.44T,響應時間為162秒。
  • 之后在Doris中使用Hive Catalog執行聚合查詢,設置exec_mem_limit=16G,在58.531秒后收到結果。也嘗試將表放入Doris,并在Doris本身進行同樣的查詢,只需要0.828秒。

其對應語句如下:

  • Hive查詢,響應時間:162秒。
SQL 
 select count(*),product_no FROM ods.demo_tbl where dt='2023-03-09'
 group by product_no;
  • 在Doris中使用Hive Catalog查詢,響應時間:58.531秒。
SQL 
 set exec_mem_limit=16G;
 select count(*),product_no FROM hive.ods.demo_tbl where dt=’2023-03-09’
 group by product_no;
  • 直接在Doris查詢,響應時間:0.828秒。
SQL 
 select count(*),product_no FROM ods.demo_tbl where dt=’2023-03-09’
 group by product_no;

更快的數據攝取

  • 之前:Hive的原始表有40個字段。它按天劃分為多個分區,每個分區有11億條數據。在HDFS中存儲需要806G的存儲空間。
  • 之后:為了數據同步,使用SeaTunnel在YARN上調用Spark。可以在11分鐘內完成(每分鐘1億條),并且所攝取的數據僅占用378G的存儲空間。

結語

構建高性能風險數據集市的關鍵步驟是利用Apache Doris的Multi Catalog特性來統一異構數據源。這不僅提高了查詢速度,而且還解決了以前的數據架構帶來的許多問題。

  • 部署Apache Doris允許將日常批處理工作負載與臨時查詢解耦,因此它們不必爭奪資源。這將查詢響應時間從幾分鐘縮短到幾秒鐘。
  • 采用基于Elasticsearch集群構建數據攝取接口,這在傳輸大量離線數據時可能會導致垃圾收集器抖動。當將接口服務數據集存儲在Doris上時,在數據寫入過程中沒有發現抖動,并且能夠在10分鐘內傳輸1000萬行代碼。
  • Apache Doris已經在許多場景下進行了優化,包括平面表。與ClickHouse相比,Apache Doris 1.2在SSB-Flat-table基準測試中的速度快了一倍,在TPC-H基準測試中快了幾十倍。
  • 在集群擴展和更新方面,過去在修改配置后的恢復時間窗口很大。但是Doris支持熱插拔和易于擴展,所以可以在幾秒鐘內重新啟動節點,并最大限度地減少集群擴展對用戶造成的干擾。

原文標題:Step-By-Step Guide to Building a High-Performing Risk Data Mart,作者:Jacob Chow

責任編輯:華軒 來源: 51CTO
相關推薦

2022-05-29 22:56:13

數據安全元數據

2023-08-02 09:59:51

2018-05-08 18:26:49

數據庫MySQL性能

2017-01-06 08:51:31

2022-01-29 14:09:45

編程語言PythonTaichi

2023-07-12 08:24:19

Java NIO通道

2024-09-25 08:46:31

2022-11-23 15:57:40

測試開發Java

2023-02-09 16:22:29

云計算CIO云服務

2024-10-18 09:16:45

2010-03-12 08:33:55

Greenplum數據引擎數據倉庫

2022-10-18 14:04:01

LinuxLVM

2023-09-22 11:48:37

2022-08-23 09:00:00

Web測試工具自動化

2024-10-12 08:00:00

機器學習Docker

2025-05-12 00:00:00

2025-09-09 09:32:04

2017-07-20 09:36:39

高性能存儲Z-NAND

2021-08-13 09:06:52

Go高性能優化

2018-10-10 14:27:34

數據庫連接池MySQL
點贊
收藏

51CTO技術棧公眾號

欧美日韩一区二区三区四区| 久久久久亚洲蜜桃| 欧美成人免费va影院高清| 国产老头和老头xxxx×| av在线加勒比| 久久久99久久| 亚洲最大的网站| 国产在线观看成人| 国产九一精品| 日韩午夜电影av| 爱福利视频一区二区| 日p在线观看| 菠萝蜜视频在线观看一区| 国产www精品| 黄色小视频在线免费看| 欧美日韩在线观看视频小说| 欧美大片一区二区| 好男人www社区| 黑人另类精品××××性爽| 中文字幕av一区二区三区高| 国产三级精品在线不卡| 一级片在线观看视频| 中文一区二区| 欧美另类在线播放| 亚洲一级片在线播放| 精品午夜电影| 7777精品伊人久久久大香线蕉的 | 国产欧美一区二区精品久久久| 制服丝袜在线91| 韩国日本在线视频| 七七久久电影网| 亚洲欧洲另类国产综合| 欧美黄色直播| 深夜福利视频网站| 国产麻豆欧美日韩一区| 国产日韩欧美成人| 国产成人自拍偷拍| 久久大逼视频| 午夜免费日韩视频| 国产性一乱一性一伧一色| 国产精品久久久久久久久妇女| 亚洲欧美日韩天堂| 亚洲精品乱码久久| 国产精品白浆| 亚洲成人黄色网| 又黄又色的网站| 欧美a级大片在线| 69堂亚洲精品首页| 国产成人黄色网址| 国产情侣一区二区三区| 欧美在线你懂的| 白嫩少妇丰满一区二区| 一二三四视频在线中文| 午夜欧美一区二区三区在线播放| 91国在线高清视频| 在线中文字幕视频观看| 亚洲日本欧美天堂| 警花观音坐莲激情销魂小说| 在线免费观看的av网站| 中文在线一区二区 | 欧美日韩精品区别| 国产精成人品2018| 欧美色爱综合网| 深夜黄色小视频| 四虎视频在线精品免费网址| 欧美理论电影在线| 亚洲精品国产久| 国产精品1区在线| 日韩天堂在线观看| 亚洲黄色小说在线观看| 国产一区在线电影| 国产偷亚洲偷欧美偷精品 | 国产欧美日韩在线视频| 日韩理论片在线观看| xxxxx日韩| 中文字幕亚洲欧美在线不卡| 蜜臀av.com| 1234区中文字幕在线观看| 精品久久久久久电影| 免费裸体美女网站| 欧美xxxx性| 精品国产污污免费网站入口| 久久午夜夜伦鲁鲁片| 国产精选一区| 欧美人在线视频| 日韩黄色三级视频| 免费观看成人鲁鲁鲁鲁鲁视频| 91精品免费看| 狠狠人妻久久久久久综合麻豆| 99国产精品久久久久久久久久久| 欧洲成人一区二区| 黄色网址在线免费观看| 亚洲激情成人在线| 91av资源网| 国产精品成人3p一区二区三区| 精品免费一区二区三区| 国产特黄级aaaaa片免| 手机亚洲手机国产手机日韩| 欧美激情在线观看| 午夜久久久久久久久久影院| 国产精品1区二区.| 久久亚裔精品欧美| 国产精品实拍| 色婷婷综合久久久久中文 | 欧美h视频在线观看| 国产高清中文字幕在线| 欧美三级蜜桃2在线观看| xxxx视频在线观看| 不卡日本视频| 久久久伊人日本| 国产三级精品三级在线观看| 国产精品18久久久久久久久| 亚洲第一综合| 激情国产在线| 91精品国产综合久久香蕉麻豆| 国产精品无码在线| 亚洲一区二区三区| 国产福利精品视频| 日本人妻熟妇久久久久久 | 亚洲欧美日韩精品综合在线观看| 91福利在线免费| 欧美疯狂性受xxxxx喷水图片| 野花社区视频在线观看| 欧美久久影院| 国产欧美精品一区二区三区-老狼 国产欧美精品一区二区三区介绍 国产欧美精品一区二区 | 三年中国中文在线观看免费播放 | 欧美一区亚洲一区| www.99视频| 国产精品欧美一区二区三区| 国产精品97在线| www.久久东京| 欧美成人合集magnet| 欧美成人一区二区视频| 91在线丨porny丨国产| 久久av高潮av| 秋霞影院一区| 久久这里只有精品视频首页| 怡红院成永久免费人全部视频| 91蜜桃传媒精品久久久一区二区| 精品人妻大屁股白浆无码| 99精品国产九九国产精品| 在线播放亚洲激情| 色老头在线视频| 91欧美一区二区| 无码播放一区二区三区| 澳门精品久久国产| 欧美黄色成人网| 精品国产av一区二区三区| 亚洲欧洲制服丝袜| 亚洲一级片av| 欧美在线三区| 亚洲iv一区二区三区| 国产精品一区二区三区视频网站| 91精品欧美福利在线观看| 亚洲欧美卡通动漫| 久草在线在线精品观看| 一区高清视频| 日韩精品成人| 欧美激情在线狂野欧美精品| 欧美一区二区黄片| 午夜精品福利在线| 菠萝菠萝蜜网站| 香蕉国产精品偷在线观看不卡| 久久精品magnetxturnbtih| 欧美a级在线观看| 亚洲欧美日韩视频一区| 中文字幕精品一区二| 国产精品久99| japan高清日本乱xxxxx| 国内在线观看一区二区三区| 精品一区二区三区免费毛片| 中文字幕一区久| 尤物tv国产一区| 国产精品玖玖玖| 亚洲在线一区二区三区| 亚洲精品乱码久久久久久不卡| 久久久久久9| 亚洲最新在线| 亚洲专区**| 欧美一二三视频| 91社区在线高清| 欧美一级高清片| 久久夜靖品2区| 国产欧美日韩亚州综合| 人妻换人妻仑乱| 亚洲久久视频| 亚洲天堂电影网| 福利电影一区| 国产成人精品久久二区二区91 | 国产婷婷在线视频| 亚洲第一成人在线| 久久精品视频18| 国产一区二区免费看| 久久视频这里有精品| 欧美久久综合网| 99国精产品一二二线| 午夜影院在线观看国产主播| 色yeye香蕉凹凸一区二区av| 六月婷婷综合网| 欧美少妇bbb| www.av视频在线观看| 国产精品久久久一本精品 | 国产66精品| 国产精品久久久久久久一区探花 | 亚洲三级网页| 亚洲一区亚洲二区亚洲三区| 久久爱91午夜羞羞| 欧美日韩国产成人在线观看| 福利视频在线导航| 精品久久久久久亚洲综合网| 中文资源在线播放| 五月婷婷综合网| 永久久久久久久| 国产性色一区二区| 私密视频在线观看| 韩国v欧美v亚洲v日本v| 不要播放器的av网站| 韩日成人av| 一级全黄肉体裸体全过程| 美女毛片一区二区三区四区| 99视频国产精品免费观看| 国产精品久久久久久久久免费高清 | 91免费看国产| 欧美成人精品三级网站| 国内精品久久久| 91精品久久| 日韩在线中文视频| 国产午夜视频在线观看| 亚洲福利视频在线| 精品人妻aV中文字幕乱码色欲| 欧美色精品天天在线观看视频| 久久亚洲精品石原莉奈| 精品成人国产在线观看男人呻吟| 青青草手机视频在线观看| 国产精品视频免费| 中文字幕第20页| 99久精品国产| 怡红院一区二区| 床上的激情91.| 四虎成人在线播放| 精品一区免费av| 第一区免费在线观看| 美日韩一级片在线观看| 国产福利影院在线观看| 日韩精品一级二级| 欧美激情国产精品日韩| 国产亚洲在线观看| 男人和女人啪啪网站| 亚洲久久成人| a在线视频观看| 在线视频免费在线观看一区二区| 国产在线播放观看| 伊人成年综合电影网| 亚洲理论电影在线观看| 黄色日韩在线| 妞干网在线观看视频| 亚洲精品影视| 精品99在线视频| 久久久久网站| wwwwwxxxx日本| 国内成人自拍视频| 亚洲欧美日韩网站| 国产黑丝在线一区二区三区| 香蕉视频在线观看黄| 成人不卡免费av| 在线精品一区二区三区| 久久网站热最新地址| 国产偷人妻精品一区| 久久这里只有精品6| 国产综合精品久久久久成人av| 欧美国产日产图区| 成人信息集中地| 亚洲欧美日韩久久| 国产一级片免费| 疯狂做受xxxx高潮欧美日本 | 制服丝袜日韩国产| www.av网站| 亚洲精品国精品久久99热| 男人天堂资源在线| 日韩一中文字幕| 日本电影在线观看| 欧美有码在线视频| 福利一区二区免费视频| 亚洲综合中文字幕在线| 成人黄色av网址| 日本一区免费看| 亚欧美无遮挡hd高清在线视频 | 午夜伦理在线视频| 777777777亚洲妇女| 国产精品亲子伦av一区二区三区| 亚洲影院污污.| 首页亚洲中字| 一区二区不卡在线视频 午夜欧美不卡'| 欧美区国产区| 国产无套粉嫩白浆内谢的出处| 狠狠色综合日日| 国产精品无码一区二区三| 欧美激情在线一区二区三区| 欧美国产精品一二三| 色综合一个色综合| 国产哺乳奶水91在线播放| 国产丝袜精品第一页| 国产不卡在线| 日本伊人精品一区二区三区介绍| 国产95亚洲| 奇米视频888战线精品播放| 888久久久| 国产性生交xxxxx免费| 国产高清不卡二三区| 美国黑人一级大黄| 精品国产精品自拍| 国产99久一区二区三区a片| 日韩精品在线观看一区| 色综合999| 国产免费一区二区三区香蕉精| 宅男在线一区| 日韩小视频网站| 激情五月播播久久久精品| 男女黄床上色视频| 一个色综合网站| 国产老妇伦国产熟女老妇视频| 亚洲人成电影网站色| h片精品在线观看| 91啪国产在线| 成人精品视频| 国产精品人人妻人人爽人人牛| 成人小视频免费观看| 午夜爱爱毛片xxxx视频免费看| 91豆麻精品91久久久久久| 污污网站在线免费观看| 欧美国产乱视频| 精品视频一区二区三区| 亚洲资源在线网| 秋霞电影一区二区| 一级黄色片大全| 丁香五六月婷婷久久激情| 黄色www视频| 欧美激情综合亚洲一二区| 亚洲日韩中文字幕一区| 亚洲最大免费| 精品一区中文字幕| 三级黄色录像视频| 欧美色视频在线观看| 午夜激情视频在线| 国产精品丝袜久久久久久高清| 欧美日韩国产在线观看网站| 欧美极品欧美精品欧美图片| 91亚洲精品乱码久久久久久蜜桃| 日本熟伦人妇xxxx| 精品久久免费看| cao在线视频| 九九九九九九精品| 一本色道久久综合一区| 国产精品一级黄片| 午夜欧美一区二区三区在线播放| 天堂v在线观看| 欧美性受xxxx黑人猛交| 婷婷综合福利| 日批视频在线免费看| 久久久国产一区二区三区四区小说 | 国产精品99久久久久久白浆小说| 国产一卡不卡| 黄色片视频在线| **网站欧美大片在线观看| 国产农村妇女毛片精品久久| 欧美成人精品在线播放| 成功精品影院| 播放灌醉水嫩大学生国内精品| 91一区二区三区在线观看| 欧美一区二区三区久久久| 伊人久久精品视频| 成年永久一区二区三区免费视频| 欧美日韩中文字幕在线播放 | 欧美日韩亚洲不卡| 九七久久人人| 成人三级在线| 国产精品毛片在线| 国产精品www爽爽爽| 91精品国产综合久久福利| 美女网站视频在线| 蜜桃av久久久亚洲精品| 青椒成人免费视频| 中文字幕在线观看成人| 亚洲精品美女在线观看| 成人看片在线观看| av磁力番号网| 99久久久精品| ,亚洲人成毛片在线播放| 欧美猛交免费看| 亚洲第一福利专区| 在线黄色免费看| 精品久久香蕉国产线看观看亚洲| gogogo高清在线观看免费完整版| 96sao精品视频在线观看| 在线亚洲精品| 91视频最新网址| 亚洲韩国欧洲国产日产av| 精品176极品一区| aa视频在线播放| 亚洲欧洲精品一区二区精品久久久|