精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

字節跳動基于Doris的湖倉分析探索實踐

數據庫 新聞
Doris是一種MPP架構的分析型數據庫,主要面向多維分析、數據報表、用戶畫像分析等場景。自帶分析引擎和存儲引擎,支持向量化執行引擎,不依賴其他組件,兼容MySQL協議。

01 Doris簡介

Apache Doris具備以下幾個特點:

  • 良好的架構設計,支持高并發低延時的查詢服務,支持高吞吐量的交互式分析。多FE均可對外提供服務,并發增加時,線性擴充FE和BE即可支持高并發的查詢請求。
  • 支持批量數據load和流式數據load,支持數據更新。支持Update/Delete語法,unique/aggregate數據模型,支持動態更新數據,實時更新聚合指標。
  • 提供了高可用,容錯處理,高擴展的企業級特性。FE Leader錯誤異常,FE Follower秒級切換為新Leader繼續對外提供服務。
  • 支持聚合表和物化視圖。多種數據模型,支持aggregate, replace等多種數據模型,支持創建rollup表,支持創建物化視圖。rollup表和物化視圖支持動態更新,無需用戶手動處理。
  • MySQL協議兼容,支持直接使用MySQL客戶端連接,非常易用的數據應用對接

Doris 由 Frontend(以下簡稱FE)和 Backend(以下簡稱BE)組成,其中FE負責接受用戶請求、編譯、優化、分發執行計劃、元數據管理、BE節點的管理等功能,BE負責執行由FE下發的執行計劃,存儲和管理用戶數據。

圖片?

02 數據湖格式Hudi簡介

Hudi是下一代流式數據湖平臺,為數據湖提供了表格式管理的能力,提供事務,ACID,MVCC,數據更新刪除,增量數據讀取等功能。支持Spark, Flink, Presto, Trino等多種計算引擎。

圖片?

Hudi根據數據更新時行為不同分為兩種表類型

圖片

針對Hudi的兩種表格式,存在3種不同的查詢類型

圖片

03

Doris分析Hudi數據的技術背景

在數倉業務中,隨著業務對數據實時性的要求越來越高,T+1數倉業務逐漸往小時級、分鐘級,甚至秒級演進。實時數倉的應用也越來越廣,也經歷了多個發展階段。目前存在著多種解決方案。

1. Lambda架構

Lambda將數據處理流分為在線分析和離線分析兩條不同的處理路徑,兩條路徑互相獨立,互不影響。

離線分析處理T+1數據,使用Hive/Spark處理大數據量,不可變數據,數據一般存儲在HDFS等系統上。如果遇到數據更新,需要overwrite整張表或整個分區,成本比較高。

在線分析處理實時數據,使用Flink/Spark Streaming處理流式數據,分析處理秒級或分鐘級流式數據,數據保存在Kafka或定期(分鐘級)保存到HDFS中。?

該套方案存在以下缺點

  • 同一套指標可能需要開發兩份代碼來進行在線分析和離線分析,維護復雜。
  • 數據應用查詢指標時可能需要同時查詢離線數據和在線數據,開發復雜。
  • 同時部署批處理和流式計算兩套引擎,運維復雜。
  • 數據更新需要overwrite整張表或分區,成本高。

2. Kappa架構

隨著在線分析業務越來越多,Lambda架構的弊端就越來越明顯,增加一個指標需要在線離線分別開發,維護困難,離線指標可能和在線指標對不齊,部署復雜,組件繁多。于是Kappa架構應運而生。

Kappa架構使用一套架構處理在線數據和離線數據,使用同一套引擎同時處理在線和離線數據,數據存儲在消息隊列上。?

Kappa架構也有一定的局限

  • 流式計算引擎批處理能力較弱,處理大數據量性能較弱。
  • 數據存儲使用消息隊列,消息隊列對數據存儲有有效性限制,歷史數據無法回溯。
  • 數據時序可能亂序,可能對部分在時序要求方面比較嚴格的應用造成數據錯誤。
  • 數據應用需要從消息隊列中取數,需要開發適配接口,開發復雜。

3. 基于數據湖的實時數倉

針對Lambda架構和Kappa架構的缺陷,業界基于數據湖開發了Iceberg, Hudi,  DeltaLake這些數據湖技術,使得數倉支持ACID, Update/Delete,數據Time Travel, Schema Evolution等特性,使得數倉的時效性從小時級提升到分鐘級,數據更新也支持部分更新,大大提高了數據更新的性能。兼具流式計算的實時性和批計算的吞吐量,支持的是近實時的場景。

以上方案中其中基于數據湖的應用最廣,但數據湖模式無法支撐更高的秒級實時性,也無法直接對外提供數據服務,需要搭建其他的數據服務組件,系統較為復雜。基于此背景下,部分業務開始使用Doris來承接,業務數據分析師需要對Doris與Hudi中的數據進行聯邦分析,此外在Doris對外提供數據服務時既要能查詢Doris中數據,也要能加速查詢離線業務中的數據湖數據,因此我們開發了Doris訪問數據湖Hudi中數據的特性。

04 Doris分析Hudi數據的設計原理

基于以上背景,我們設計了Apache Doris中查詢數據湖格式Hudi數據,因Hudi生態為java語言,而Apache Doris的執行節點BE為C++環境,C++ 無法直接調用Hudi java SDK,針對這一點,我們有三種解決方案。

1.實現Hudi C++ client,在BE中直接調用Hudi C++ client去讀寫Hudi表。?

該方案需要完整實現一套Hudi C++ client,開發周期較長,后期Hudi行為變更需要同步修改Hudi C++ client,維護較為困難。

2.BE通過thrift協議發送讀寫請求至Broker,由Broker調用Hudi java client讀取Hudi表。

該方案需要在Broker中增加讀寫Hudi數據的功能,目前Broker定位僅為fs的操作接口,引入Hudi打破了Broker的定位。第二,數據需要在BE和Broker之間傳輸,性能較低。

3.在BE中使用JNI創建JVM,加載Hudi java client去讀寫Hudi表。

該方案需要在BE進程中維護JVM,有JVM調用Hudi java client對Hudi進行讀寫。讀寫邏輯使用Hudi社區java實現,可以維護與社區同步;同時數據在同一個進程中進行處理,性能較高。但需要在BE維護一個JVM,管理較為復雜。

4.使用BE arrow parquet c++ api讀取hudi parquet base file,hudi表中的delta file暫不處理。?

該方案可以由BE直接讀取hudi表的parquet文件,性能最高。但當前不支持base file和delta file的合并讀取,因此僅支持COW表Snapshot Queries和MOR表的Read Optimized Queries,不支持Incremental Queries。

綜上,我們選擇方案四,第一期實現了COW表Snapshot Queries和MOR表的Read Optimized Queries,后面聯合Hudi社區開發base file和delta file合并讀取的C++接口。

05 Doris分析Hudi數據的技術實現

Doris中查詢分析Hudi外表使用步驟非常簡單。

1. 創建Hudi外表

建表時指定engine為Hudi,同時指定Hudi外表的相關信息,如hive metastore uri,在hive metastore中的database和table名字等。

建表僅僅在Doris的元數據中增加一張表,無任何數據移動。

建表時支持指定全部或部分hudi schema,也支持不指定schema創建hudi外表。指定schema時必須與hiveMetaStore中hudi表的列名,類型一致。

Example:

Plaintext
CREATE TABLE example_db.t_hudi
ENGINE=HUDI
PROPERTIES (
"hudi.database" = "hudi_db",
"hudi.table" = "hudi_table",
"hudi.hive.metastore.uris" = "thrift://127.0.0.1:9083"
);


CREATE TABLE example_db.t_hudi (
column1 int,
column2 string)
ENGINE=HUDI
PROPERTIES (
"hudi.database" = "hudi_db",
"hudi.table" = "hudi_table",
"hudi.hive.metastore.uris" = "thrift://127.0.0.1:9083"
);

2. 查詢Hudi外表

查詢Hudi數據表時,FE在analazy階段會查詢元數據獲取到Hudi外表的的hive metastore地址,從Hive metastore中獲取hudi表的schema信息與文件路徑。

  • 獲取hudi表的數據地址。
  • FE規劃fragment增加HudiScanNode。HudiScanNode中獲取Hudi table對應的data file文件列表。
  • 根據Hudi table獲取的data file列表生成scanRange。
  • 下發HudiScan 任務至BE節點。
  • BE節點根據HudiScanNode指定的Hudi外表文件路徑調用native parquet reader進行數據讀取。

圖片?

06 后期規劃

目前Apche Doris查詢Hudi表已合入社區,當前已支持COW表的Snapshot Query,支持MOR表的Read Optimized Query。對MOR表的Snapshot Query暫時還未支持,流式場景中的Incremental Query也沒有支持。

后續還有幾項工作需要處理,我們和社區也在積極合作進行中:

  • MOR表的Snapshot Query。MOR表實時讀需要合并讀取Data file與對應的Delta file,BE需要支持Delta file AVRO格式的讀取,需要增加avro的native讀取方式。
  • COW/MOR表的Incremental Query支持實時業務中的增量讀取。
  • BE讀取Hudi base file和delta file的native接口目前BE讀取Hudi數據時,僅能讀取data file,使用的是parquet的C++ SDK。后期我們和聯合Hudi社區提供Huid base file和delta file的C++/Rust等語言的讀取接口,在Doris BE中直接使用native接口來查詢Hudi數據。

今天的分享就到這里,謝謝大家。

責任編輯:張燕妮 來源: DataFunTalk
相關推薦

2022-09-15 09:32:42

數據倉處理

2022-08-21 21:28:32

數據庫實踐

2022-05-23 13:30:48

數據胡實踐

2023-03-27 21:24:18

架構數據處理分析服務

2022-06-08 13:25:51

數據

2024-01-03 16:29:01

Agent性能優化

2024-09-25 15:57:56

2021-06-11 14:01:51

數據倉庫湖倉一體 Flink

2021-06-07 10:45:16

大數據數據倉庫數據湖

2022-06-24 10:41:53

日志數據

2023-10-13 07:25:50

2024-04-23 10:16:29

云原生

2023-01-10 09:08:53

埋點數據數據處理

2023-10-30 07:25:37

數據湖數據處理

2024-11-01 17:00:03

2023-06-28 07:28:36

湖倉騰訊架構

2023-12-14 13:01:00

Hudivivo

2023-05-26 06:45:08

2022-11-24 10:01:10

架構分布式
點贊
收藏

51CTO技術棧公眾號

亚洲精品中文字幕乱码三区| 久久er99精品| 日韩精品在线免费播放| 久久久久免费精品| а√资源新版在线天堂| gogogo免费视频观看亚洲一| 日韩美女视频免费看| 五月综合色婷婷| 黄色免费大全亚洲| 欧美三级中文字幕| 国产中文字幕二区| av影片免费在线观看| 成人性色生活片| 国产精品日韩在线| 日韩av一二三区| 五月婷婷六月综合| 国产视频自拍一区| 中文字幕第六页| 婷婷六月国产精品久久不卡| 亚洲美女偷拍久久| 色一情一乱一伦一区二区三区丨| 99草在线视频| 人人超碰91尤物精品国产| 久久久天堂国产精品女人| 中文字幕精品亚洲| 国产剧情在线观看一区| 亚洲成人av片在线观看| 九九热99视频| 日韩美女在线看免费观看| 亚洲国产精品久久久男人的天堂 | 国产欧美日韩不卡| 成人一区二区三区四区| 一级做a爱片性色毛片| 小嫩嫩精品导航| 久久久久女教师免费一区| 少妇视频一区二区| 国产中文精品久高清在线不| 亚洲精品白浆高清久久久久久| √天堂资源在线| 成人精品国产亚洲| 一本一道综合狠狠老| 国产中文字幕二区| segui88久久综合| 亚洲一线二线三线视频| 色一情一乱一乱一区91| 免费观看久久久久| 国产精品免费视频观看| 欧洲av一区| 男男激情在线| 久久精品日产第一区二区三区高清版| 国产一区精品视频| 四季av日韩精品一区| 成+人+亚洲+综合天堂| 国产91精品入口17c| www五月婷婷| 国产寡妇亲子伦一区二区| 亚洲一区二区三区视频| 99热这里只有精品在线观看| 国产精品影视网| 91国产在线免费观看| av在线亚洲天堂| 国产精品99久久久久| 91免费看蜜桃| 国产成人手机在线| 99国产精品久| 日本中文不卡| 亚洲s色大片| 亚洲欧洲成人自拍| 黄色污污在线观看| 丁香花在线电影小说观看 | 日韩人妻无码一区二区三区99 | 亚洲熟妇无码另类久久久| free性欧美| 疯狂做受xxxx高潮欧美日本| 黄色国产精品视频| 成人午夜sm精品久久久久久久| 在线精品观看国产| 国产原创精品在线| 精品入口麻豆88视频| 欧美成人vps| 亚洲精品乱码久久久久久不卡| 欧美极品在线观看| 最近2019中文字幕mv免费看 | 亚洲一级二级在线| 国产日韩一区二区在线| 狠狠久久伊人中文字幕| 91精品国产色综合久久 | 99久久99久久精品国产片果冻| 久久久福利视频| av二区在线| 亚洲自拍偷拍图区| 免费激情视频在线观看| 成人噜噜噜噜| 日韩经典中文字幕| 一区二区国产精品精华液| 精品白丝av| 国产精品精品视频| 精品国产伦一区二区三区| 91视频国产资源| 一区二区三区免费看| 男人天堂亚洲天堂| 欧美自拍丝袜亚洲| 深夜视频在线观看| re久久精品视频| 韩剧1988在线观看免费完整版| 国产精品乱码一区二区视频| 国产一区中文字幕| 免费电影一区| 午夜成年人在线免费视频| 色呦呦国产精品| wwwxxxx在线观看| 精品国产中文字幕第一页| 欧美激情欧美狂野欧美精品| 九九热最新视频| 欧美亚洲国产精品| 国产香蕉一区二区三区在线视频 | 日韩欧美中文一区| 日韩人妻无码一区二区三区| 久久精品亚洲人成影院| 欧美尤物巨大精品爽| 亚洲精品国产精| 中文字幕一区二区三区av | 麻豆一区二区99久久久久| 国产视频不卡| 在线观看中文| 欧美午夜精品久久久久久孕妇| 亚洲自拍偷拍精品| 91精品91| 成人精品久久一区二区三区| 三级无遮挡在线观看| 亚洲国产日韩在线一区模特| 深爱五月综合网| 久久精品欧美一区| 91精品久久久久久综合乱菊| 国产在线观看黄| 欧美午夜激情小视频| 国产精品果冻传媒| 欧美福利专区| 91视频88av| 快射视频在线观看| 正在播放一区二区| 久久久久久视频| 韩国成人在线视频| 伊人久久大香线蕉成人综合网| 日韩三级影视| 亚洲人成欧美中文字幕| 欧美亚洲精品天堂| 91免费看片在线观看| 欧美 国产 日本| 亚洲丝袜啪啪| 国产精品96久久久久久| 美州a亚洲一视本频v色道| 疯狂欧美牲乱大交777| 日本少妇色视频| 国产美女一区| 欧美激情论坛| 亚洲成人一区在线观看| 尤物yw午夜国产精品视频明星| 国产又粗又猛又爽又| 日本一区二区三区在线观看| 日本人视频jizz页码69| 久久综合88| 91视频88av| 国产精品—色呦呦| 亚洲加勒比久久88色综合| 91av在线免费视频| 国产亚洲精品中文字幕| 最新天堂中文在线| 亚洲成人精选| 国产亚洲欧美另类一区二区三区| 中文不卡1区2区3区| 国产亚洲精品美女久久久| 91精品国产乱码久久久久| 亚洲色图19p| 国产成人av无码精品| 久久九九免费| 国产精品av免费| 99久久香蕉| 国产成人精品免高潮费视频| 淫片在线观看| 日韩精品一区二区三区在线| 国产 欧美 日韩 在线| 国产三级一区二区| 天堂网成人在线| 亚洲一区二区三区免费在线观看 | 成人日批视频| 亚洲成人久久一区| 亚洲无码精品一区二区三区| 亚洲欧洲日韩一区二区三区| 国内自拍偷拍视频| 日本人妖一区二区| 日韩视频 中文字幕| 婷婷精品视频| 亚洲一区亚洲二区| 免费日韩电影| 欧美成人精品三级在线观看| 亚洲色图欧美视频| 在线不卡免费欧美| 久久久久久久久久免费视频 | 国产精品a成v人在线播放| 91在线码无精品| 中文字幕12页| 老司机久久99久久精品播放免费| 国产精品av免费| 国产精品亚洲人成在99www| 97netav| 美女18一级毛片一品久道久久综合| 中文字幕亚洲激情| 四虎精品在线| 欧美成人a视频| 中文字幕人妻色偷偷久久| 午夜激情久久久| 国产极品国产极品| 亚洲国产成人在线| 国产福利在线观看视频| 国产精品一二二区| 在线观看免费黄网站| 一本色道精品久久一区二区三区| 日韩第一页在线观看| 国产探花一区在线观看| 国产视频99| 波多野结衣一区二区三区免费视频| 国产精品丝袜视频| 中文不卡1区2区3区| 国模吧一区二区| 影音先锋在线播放| 久久中文字幕国产| 毛片在线不卡| 播播国产欧美激情| 最新真实国产在线视频| 亚洲亚裔videos黑人hd| 四虎成人免费在线| 亚洲精品www久久久久久广东| 国产麻豆一精品一男同| 欧美日韩二区三区| 国产精品午夜一区二区| 日韩欧美在线看| 五月天综合激情网| 欧美日韩在线第一页| 国产大片aaa| 午夜视黄欧洲亚洲| 国产真实乱人偷精品视频| 亚洲综合久久av| 久久久国产成人| 亚洲国产日韩综合久久精品| 国产无码精品一区二区| 亚洲国产aⅴ天堂久久| 精品无码av在线| 亚洲成在人线免费| 日韩免费在线视频观看| 午夜久久电影网| 精品成人av一区二区在线播放| 亚洲成人午夜电影| 日韩 国产 在线| 色成年激情久久综合| 四虎影院在线免费播放| 欧美性生交片4| 一区二区三区免费观看视频| 欧美日韩国产另类不卡| 国产精品久久久久毛片| 51精品久久久久久久蜜臀| av中文字幕观看| 亚洲成人在线视频播放| 亚洲区小说区图片区| 国产一区二区三区网站| a天堂中文在线88| 萌白酱国产一区二区| 啦啦啦中文在线观看日本| 91精品国产91久久久久久吃药| 人在线成免费视频| 国产精品99久久久久久白浆小说| 激情亚洲小说| 99久久国产免费免费| 欧美自拍视频| 亚洲国产午夜伦理片大全在线观看网站| 久久影院100000精品| 国产尤物av一区二区三区| 在线亚洲伦理| 潘金莲激情呻吟欲求不满视频| 国产精品一区二区三区四区| 制服丝袜第一页在线观看| 国产性色一区二区| 久久国产美女视频| 精品久久久久久电影| 国产91av在线播放| 欧美一激情一区二区三区| 日本波多野结衣在线| 亚洲一区二区福利| 福利在线视频网站| 欧日韩不卡在线视频| 日韩一区二区三免费高清在线观看| 成人欧美一区二区三区在线观看| 蜜桃视频欧美| 神马午夜伦理影院| 久久国产精品亚洲77777| 91av视频免费观看| 久久综合国产精品| 在线免费观看亚洲视频| 色拍拍在线精品视频8848| 国产三级小视频| 亚洲偷熟乱区亚洲香蕉av| 天堂av资源在线观看| 国产99久久精品一区二区永久免费| 美女久久精品| 午夜精品亚洲一区二区三区嫩草| 国产精品大片| 五月天激情播播| 久久久久久久久久美女| 国产一级aa大片毛片| 91麻豆精品国产91久久久资源速度| 五月婷婷六月激情| 欧美另类高清videos| 日本.亚洲电影| 久久涩涩网站| 欧美婷婷在线| 亚洲综合伊人久久| 国产欧美日韩综合| 久久久久久久久影院| 欧美一区二区精品在线| 大地资源中文在线观看免费版| 久久久女女女女999久久| 精品一区二区三区中文字幕在线 | 川上优av一区二区线观看| 九九在线高清精品视频| 每日在线观看av| 国产成人综合精品三级| 日韩激情小视频| 欧美日韩一区二区在线视频| 免费黄网站在线观看| 欧美一区在线直播| 久久精品国产亚洲blacked| 国产情侣第一页| 懂色av一区二区三区免费观看 | 成a人片在线观看www视频| 91精品国产一区| 精品国产导航| 欧美午夜性视频| 丁香桃色午夜亚洲一区二区三区| 91麻豆精品成人一区二区| 欧美日韩国产系列| 日本美女在线中文版| 国产一区玩具在线观看| 99久久精品费精品国产| 成 人 黄 色 小说网站 s色| 中文字幕中文在线不卡住| 亚洲最新av网站| 操人视频在线观看欧美| 欧美h版在线观看| 日本精品福利视频| 懂色av噜噜一区二区三区av| 欧美一级高潮片| 日韩乱码在线视频| 厕沟全景美女厕沟精品| 天堂精品视频| 精品一区二区免费视频| 国产人妻精品一区二区三区不卡| 日韩亚洲欧美中文三级| 人人超在线公开视频| 精品亚洲欧美日韩| 久久国产精品久久久久久电车| 国产1区2区在线观看| 欧美精三区欧美精三区| 影音先锋中文在线视频| 九九九九精品九九九九| 久久一区中文字幕| 成人午夜免费影院| 欧美v国产在线一区二区三区| 国内高清免费在线视频| 玛丽玛丽电影原版免费观看1977 | 免费亚洲网站| 丰满的亚洲女人毛茸茸| 3d成人h动漫网站入口| ririsao久久精品一区| 欧美日韩一区二区三| 国产自产视频一区二区三区| 国产污片在线观看| 国产亚洲精品va在线观看| 粉嫩av国产一区二区三区| 久久亚洲精品无码va白人极品| 91视频com| 国产又粗又长又大视频| 97在线日本国产| 日本一区二区在线看| 4438x全国最大成人| 欧美性猛xxx| 老司机在线看片网av| 国产免费一区二区| 日产国产欧美视频一区精品| 国产盗摄一区二区三区在线| 亚洲精品国产综合区久久久久久久| 国产三级一区| 久久亚洲中文字幕无码| 一区在线观看免费| 青草久久伊人| 99re视频在线观看| 日本视频在线一区| 日韩av黄色片| 欧美另类在线播放| 少妇精品久久久| 熟妇高潮一区二区|