精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

數據湖三劍客,大數據時代的新范式?

大數據 數據湖
目前的數據倉庫技術出現了一定的局限性,比如單一不變的 schema 和模型已經無法滿足各類不同場景和領域的數據分析的要求、流批一體的數據存儲引擎和計算引擎適配問題以及Hadoop體系文件系統的ACID能力缺失等問題急需要解決,但就目前的技術棧而言,打破這些技術的桎梏,似乎多少有些力不從心,這個過程中,一項重大變革似乎在破曉前顯得尤為必要。

隨著互聯網高速發展,大數據技術快速發展和迅速迭代,降低了用戶處理海量數據的門檻,越來越多的應運場景出現在我們的身邊存儲和處理需求越來越多樣化,逐漸呈現出數據倉庫往數據湖方向發展、批處理往流式處理發展、本地部署往云模式發展的趨勢。

但在技術發展層面,逐漸出現了諸多的掣肘,不斷有新的問題出現,僅僅就存儲方面來講,與數據庫這樣高度優化的技術相比,大數據技術的抽象和實現還是太原始和初級。

目前的數據倉庫技術出現了一定的局限性,比如單一不變的 schema 和模型已經無法滿足各類不同場景和領域的數據分析的要求、流批一體的數據存儲引擎和計算引擎適配問題以及Hadoop體系文件系統的ACID能力缺失等問題急需要解決,但就目前的技術棧而言,打破這些技術的桎梏,似乎多少有些力不從心,這個過程中,一項重大變革似乎在破曉前顯得尤為必要。

在不停地探索和思考中,大數據人開始慢慢醒悟,回頭看向成名已久的數據庫,將更多數據庫的成熟技術和理念借鑒到大數據中,似乎是一條高效又穩健的道路。至此,數據湖技術應運而生,在諸多方面向數據庫看齊,你可以說是學習,當然,也可以說是致敬,是業界針對這些問題的一種解決方案。

那么,什么是數據湖技術呢?

計算引擎之下、數據存儲之上,處于中間層的數據湖。

簡單地說,這類新技術是介于上層計算引擎和底層存儲格式之間的一個中間層,我們可以把它定義成一種“數據組織格式”。其最核心的點便是將事務能力帶到了大數據領域,并抽象成統一的中間格式供不同引擎適配對接。

為此,Uber開源了Apache Hudi,Databricks提出了Delta Lake,而 Netflix 則發起了 Apache Iceberg 項目,一時間這種具備 ACID 能力的表格式中間件成為了大數據、數據湖領域炙手可熱的方向。

Iceberg 將其稱之為“表格式”也是表達類似的含義。它與底層的存儲格式(比如 ORC、Parquet 之類的列式存儲格式)最大的區別是,它并不定義數據存儲方式,而是定義了數據、元數據的組織方式,向上提供統一的“表”的語義。它構建在數據存儲格式之上,其底層的數據存儲仍然使用 Parquet、ORC 等進行存儲。

Apache Iceberg、Hudi 和 Delta Lake 誕生于不同公司,需要解決的問題存在差異,因此三者在設計初衷上稍有不同。

其中,Iceberg 的設計初衷更傾向于定義一個標準、開放且通用的數據組織格式,同時屏蔽底層數據存儲格式上的差異,向上提供統一的操作 API,使得不同的引擎可以通過其提供的 API 接入;Hudi 的設計初衷更像是為了解決流式數據的快速落地,并能夠通過 upsert 語義進行延遲數據修正;Delta Lake 作為 Databricks 開源的項目,更側重于在 Spark 層面上解決 Parquet、ORC 等存儲格式的固有問題,并帶來更多的能力提升。

雖然這三個項目在設計初衷上稍有不同,但實現的思路和提供的能力卻非常相似,他們都提供了 ACID 的能力,都基于樂觀鎖實現了沖突解決和提供線性一致性,同時相應地提供了 time travel 的功能。

但是因為設計初衷的不同,三個項目當前的能力象限各有不同,Iceberg 在其格式定義和核心能力上最為完善,但是上游引擎的適配上稍顯不足;Hudi 基于 Spark 打造了完整的流式數據落地方案,但是其核心抽象較弱,與 Spark 耦合較緊;Delta Lake 同樣高度依賴于 Spark 生態圈,與其他引擎的適配尚需時日。

那么,當下數據湖技術呈現的三足鼎立的技術場面,優劣點如何看待,技術選型如何去做,當然是我們最關心的問題,下文逐步解析。

Delta Lake,spark生態圈急先鋒

傳統的 lambda 架構需要同時維護批處理和流處理兩套系統,資源消耗大,維護復雜。

基于 Hive 的數倉或者傳統的文件存儲格式(比如 parquet / ORC),都存在一些難以解決的問題:小文件問題、并發讀寫問題、有限的更新支持及海量元數據(例如分區)導致 metastore 不堪重負問題等。

如上圖,Delta Lake 是 Spark 計算框架和存儲系統之間帶有 Schema 信息的存儲中間層。

它集中解決了傳統hive數倉的諸多問題,使得實時數據湖變得優雅又絲滑,不見了天生的慵懶,只看到輕盈又婀娜的身姿。重要變化如下:

  1. 設計了基于 HDFS 存儲的元數據系統,解決 metastore 不堪重負的問題;
  2. 支持更多種類的更新模式,比如 Merge / Update / Delete 等操作,配合流式寫入或者讀取的支持,讓實時數據湖變得水到渠成;
  3. 流批操作可以共享同一張表;
  4. 版本概念,可以隨時回溯,避免因為一次誤操作或者代碼邏輯而無法恢復的災難性后果。

基于Parquet的列式存儲層,在多并發寫入之間提供 ACID 事務保證。每次寫入都是一個事務,并且在事務日志中記錄了寫入的序列順序。

但是,Delta Lake定位于spark流批一體的數據處理工具,地主家的公子,自己家的事情如數家珍,輕松搞定,但走出家門后,難免會有些水土不服。

Apache Hudi,有天生缺陷的優等生

Apache Hudi 代表 Hadoop Upserts and Incrementals,能夠使HDFS數據集在分鐘級的時延內支持變更,也支持下游系統對這個數據集的增量處理。

Hudi數據集通過自定義的inputFormat 兼容當前 Hadoop 生態系統,包括 Apache Hive,Apache Parquet,Presto 和 Apache Spark,使得終端用戶可以無縫的對接。

如下圖,基于 Hudi 簡化的服務架構,分鐘級延遲。

Hudi 會維護一個時間軸,在每次執行操作時(如寫入、刪除、合并等),均會帶有一個時間戳。

通過時間軸,可以實現在僅查詢某個時間點之后成功提交的數據,或是僅查詢某個時間點之前的數據。

這樣可以避免掃描更大的時間范圍,并非常高效地只消費更改過的文件(例如在某個時間點提交了更改操作后,僅 query 某個時間點之前的數據,則仍可以 query 修改前的數據)。

如上圖的左邊,Hudi 將數據集組織到與 Hive 表非常相似的基本路徑下的目錄結構中。

數據集分為多個分區,每個分區均由相對于基本路徑的分區路徑唯一標識。

如上圖的中間部分,Hudi 以兩種不同的存儲格式存儲所有攝取的數據。

讀優化的列存格式(ROFormat):僅使用列式文件(parquet)存儲數據。在寫入/更新數據時,直接同步合并原文件,生成新版本的基文件(需要重寫整個列數據文件,即使只有一個字節的新數據被提交)。此存儲類型下,寫入數據非常昂貴,而讀取的成本沒有增加,所以適合頻繁讀的工作負載,因為數據集的最新版本在列式文件中始終可用,以進行高效的查詢。

寫優化的行存格式(WOFormat):使用列式(parquet)與行式(avro)文件組合,進行數據存儲。在更新記錄時,更新到增量文件中(avro),然后進行異步(或同步)的compaction,創建列式文件(parquet)的新版本。此存儲類型適合頻繁寫的工作負載,因為新記錄是以appending 的模式寫入增量文件中。但是在讀取數據集時,需要將增量文件與舊文件進行合并,生成列式文件。

Apache Iceberg,基礎扎實,后生可畏

Iceberg 作為新興的數據湖框架之一,開創性地抽象出“表格式”table format)這一中間層,既獨立于上層的計算引擎(如Spark和Flink)和查詢引擎(如Hive和Presto),也和下層的文件格式(如Parquet,ORC和Avro)相互解耦。

此外 Iceberg 還提供了許多額外的能力:

  • ACID事務;
  • 時間旅行(time travel),以訪問之前版本的數據;
  • 完備的自定義類型、分區方式和操作的抽象;
  • 列和分區方式可以進化,而且進化對用戶無感,即無需重新組織或變更數據文件;
  • 隱式分區,使SQL不用針對分區方式特殊優化;
  • 面向云存儲的優化等;

Iceberg的架構和實現并未綁定于某一特定引擎,它實現了通用的數據組織格式,利用此格式可以方便地與不同引擎(如Flink、Hive、Spark)對接。

所以 Iceberg 的架構更加的優雅,對于數據格式、類型系統有完備的定義和可進化的設計。

綜合而言,三個引擎的初衷場景并不完全相同,Hudi 為了 incremental 的 upserts,相對而言最為成熟,但底層架構設計較差,擴展性及生態延續方面難度較大;Iceberg 定位于高性能的分析與可靠的數據管理,底層架構的抽象及架構的開放性方面做的很好,數據湖upsert和compaction兩個關鍵的功能也趨于完善,正在快速發展期;Delta 定位于流批一體的數據處理,無縫對接Spark生態。

我們在技術選型的時候,不僅要知到要到哪里去,更要明確我們從哪里來,選擇適合自己當下業務需求的技術,才能更快速、更高效輔助業務開發。


責任編輯:華軒 來源: 今日頭條
相關推薦

2011-03-28 16:04:44

nagios

2010-02-04 16:22:21

2019-06-27 10:06:54

Linux 性能工具

2014-12-25 11:40:25

云計算企業軟件Docker

2023-10-04 00:20:31

grepLinux

2009-02-26 18:22:49

桌面虛擬化Linux

2024-06-04 00:20:00

Python函數

2017-07-25 08:53:14

CorrectLinkCCA-SD算法

2019-08-20 14:29:45

grepsedawk

2021-05-13 10:25:29

Linuxgrep命令

2014-11-26 10:18:32

Cloud Setupwindows在線打包工具

2018-05-04 15:18:01

DockerDocker Comp容器

2021-03-15 07:39:48

LinuxAwk 語言

2011-08-06 23:58:34

愛普生投影機

2011-07-04 09:07:54

2023-11-25 17:08:47

ChatbotLLAMALangChain

2011-04-11 11:01:03

AndroidHTC蘋果

2009-03-19 20:52:58

LinuxPHPCMS

2025-04-22 09:39:46

Python爬蟲網頁數據抓取

2025-10-24 14:29:04

vivo前端三劍客前端
點贊
收藏

51CTO技術棧公眾號

2019精品视频| 日韩一区二区精品在线观看| 亚洲精品欧洲精品| 亚洲一区中文字幕永久在线| 欧美一区视频| 日韩国产欧美精品一区二区三区| 黄色三级视频片| 国产激情小视频在线| 成人精品视频一区二区三区| 国产99久久久欧美黑人| 中文字幕电影av| 亚洲欧洲美洲国产香蕉| 日韩无一区二区| 亚洲色图38p| 欧美黑人xx片| 中文成人av在线| 精品国产aⅴ麻豆| 91精品国产乱码久久久久| 91久久在线| 久久成人国产精品| 免费黄色在线网址| 日韩动漫一区| 欧美成人aa大片| 超碰超碰在线观看| 成人私拍视频| 午夜久久久影院| 国产人妻互换一区二区| 国产乱视频在线观看| 成人av在线资源网站| 91精品久久久久久久久久另类| 色婷婷av国产精品| 国产精品magnet| 久久精品视频一| 懂色av粉嫩av浪潮av| 天天躁日日躁狠狠躁欧美| 精品国产乱码久久久久久1区2区| 亚洲娇小娇小娇小| 亚洲承认视频| 欧美色xxxx| 免费看国产一级片| 好久没做在线观看| 一区二区三区精品视频在线| 欧美精品一区二区性色a+v| 国产人成在线视频| 国产亚洲欧美一区在线观看| 精品久久一区二区三区蜜桃| 国产 日韩 欧美 精品| 国产成人精品免费看| 成人h猎奇视频网站| 亚洲无码精品国产| 美女视频网站黄色亚洲| 国产精品久久久精品| 成人小视频在线播放| 久久综合伊人| 国产黑人绿帽在线第一区| 韩国av中文字幕| 久久香蕉精品| 国产精品99久久久久久人| 波多野结衣日韩| 日本欧美一区二区| 国产精品入口夜色视频大尺度| 国产精品熟女视频| 青青草精品视频| 国产欧美日韩精品专区| 在线免费观看视频网站| 韩日av一区二区| 亚洲一区中文字幕在线观看| 性欧美videos另类hd| 成人综合在线网站| 久久国产精品一区二区三区四区| 青青草观看免费视频在线| 久久久99免费| 超碰97免费观看| 手机av免费在线| 亚洲成人综合视频| 日本黄网站免费| 亚洲热av色在线播放| 欧美大片在线观看一区二区| 午夜久久久久久久| 精品一二三区| 久久综合色影院| 亚洲国产精品成人无久久精品| 99视频在线精品国自产拍免费观看| 国产91精品久久久久| 中文字幕永久在线视频| 国产精品一二三四五| 精品视频在线观看| 午夜伦全在线观看| 亚洲一区二区三区四区在线观看| 无罩大乳的熟妇正在播放| 蜜桃视频成人m3u8| 日韩欧美国产综合| 人妻一区二区视频| 国产精品99免费看| 国产精品美乳一区二区免费| 成人1区2区3区| 久久精品一区二区| 在线观看成人免费| 欧美aa视频| 日韩欧美一级二级三级久久久| 日本黄色录像片| 国产精品99在线观看| 国内精品久久久| 97在线播放免费观看| 91老司机福利 在线| 亚洲国产精品女人| 中文字幕日本一区二区| 精品少妇一区二区三区| 东方伊人免费在线观看| 最新亚洲一区| 91久久在线观看| 国产区在线视频| 午夜电影网亚洲视频| 最新免费av网址| 蜜桃视频欧美| 欧美黄色成人网| 国产一区二区三区在线观看| 99riav一区二区三区| 日本丰满少妇黄大片在线观看| 香蕉久久免费电影| 亚洲国产91色在线| 欧美高清视频一区二区三区| 毛片不卡一区二区| 欧美日韩一区综合| 毛片在线网站| 亚洲福利视频在线| 久久婷婷国产麻豆91| 狠狠色伊人亚洲综合成人| 性欧美videosex高清少妇| 华人av在线| 精品va天堂亚洲国产| 午夜精品福利在线视频| 蜜桃视频在线观看一区二区| 青娱乐国产91| 345成人影院| 日韩电影中文字幕av| 久久精品国产亚洲AV无码麻豆| 国产乱子伦一区二区三区国色天香 | 成年人免费视频播放| 日本xxxxxxxxxx75| 精品无码人妻一区二区三区品| 亚洲免费黄色| 99免费在线观看视频| 免费黄网站在线| 欧美日本在线播放| av在线免费播放网址| 免费观看日韩av| 色噜噜狠狠色综合网| 亚洲天堂一区二区| 亚洲人午夜色婷婷| 国产午夜麻豆影院在线观看| 久久网站热最新地址| 欧美 激情 在线| 神马电影久久| 国产精品欧美一区二区| h视频网站在线观看| 欧美丝袜自拍制服另类| 蜜桃av.com| 国产精品一二三在| 成人午夜视频在线观看免费| 加勒比视频一区| 欧美做受高潮1| 国产福利电影在线| 91精品国产综合久久久蜜臀粉嫩| 动漫性做爰视频| 成人蜜臀av电影| 日韩 欧美 高清| 久久精品国产99久久| 亚洲v日韩v综合v精品v| 日本在线视频www鲁啊鲁| 亚洲黄页网在线观看| 亚洲欧美综合自拍| 久久久91精品国产一区二区三区| 中文字幕在线导航| 亚洲午夜精品一区 二区 三区| av日韩免费电影| 自拍网站在线观看| 久久视频在线播放| 色wwwwww| 欧美吞精做爰啪啪高潮| 欧美另类视频在线观看| 2024国产精品视频| 小泽玛利亚视频在线观看| 一区二区三区午夜探花| 精品麻豆av| 日日夜夜精品| 97热精品视频官网| av网站在线免费播放| 日韩久久久精品| 波多野结衣啪啪| 一区二区三区在线观看动漫| 91视频在线网站| 国产乱码精品一品二品| 国产黄色片免费在线观看| 欧美午夜精品一区二区三区电影| 亚洲中国色老太| 韩国精品主播一区二区在线观看 | 国产精品一二| 香蕉精品视频在线| 九九久久婷婷| 成人看片视频| 涩涩涩久久久成人精品| 91av视频在线观看| 黄色网在线免费观看| 亚洲精品影视在线观看| 国产av无码专区亚洲av| 日本电影亚洲天堂一区| 国产精品白浆一区二小说| 国产精品国产自产拍在线| 日本护士做爰视频| 国产精品456| 无限资源日本好片| 午夜在线播放视频欧美| 一区二区三区四区视频在线观看| 欧洲精品一区| 国产精品大全| 国产电影一区| 国产免费一区二区三区在线观看| 性欧美18xxxhd| 欧美激情视频在线| www在线视频| 色偷偷噜噜噜亚洲男人的天堂| 青青草视频免费在线观看| 日韩免费观看高清完整版| 91theporn国产在线观看| 色先锋久久av资源部| 日韩乱码一区二区| 亚洲影视在线播放| 无码人妻精品一区二区三区夜夜嗨| 91麻豆国产在线观看| 国产伦理在线观看| 国产毛片精品视频| 中文字幕免费高清在线| 麻豆freexxxx性91精品| 日韩欧美精品在线观看视频| 国产精品试看| 欧美日韩黄色一级片| 亚洲精品1区2区| 成人免费观看cn| 亚洲精品婷婷| 好吊妞无缓冲视频观看| 日韩亚洲在线| 日本wwww视频| 久久精品网址| 久久黄色免费看| 日本亚洲视频在线| 在线观看免费污视频| 久久国产精品无码网站| 性生生活大片免费看视频| 麻豆国产精品一区二区三区| gai在线观看免费高清| 精一区二区三区| 日韩av福利在线观看| 国产精品一区二区你懂的| 人妻互换一二三区激情视频| 国产suv精品一区二区883| 小毛片在线观看| 久久综合久久鬼色中文字| 亚洲性猛交xxxx乱大交| 国产精品你懂的| 在线看的片片片免费| 一区二区三区中文免费| 在线观看 中文字幕| 日韩欧美a级成人黄色| 天堂av免费在线观看| 欧美日本国产视频| 朝桐光av在线一区二区三区| 亚洲精品wwww| freemovies性欧美| 超碰精品一区二区三区乱码| 欧美寡妇性猛交xxx免费| 欧美亚洲免费电影| 制服诱惑亚洲| 91九色在线观看| 人体久久天天| 亚洲一区二区三区精品视频| 欧美成人精品| 日日摸日日碰夜夜爽av| 老汉av免费一区二区三区| 人妻av一区二区三区| 久久综合久久久久88| 天天色天天综合| 天天亚洲美女在线视频| 中文字幕一区二区在线视频| 精品久久久久久最新网址| 九色视频在线观看免费播放| 久久精品电影一区二区| 神马久久午夜| 成人在线播放av| 午夜精品福利影院| 五月天av影院| 欧美亚洲一区| 成年人看片网站| 国产丝袜欧美中文另类| 久久久久久久九九九九| 欧美怡红院视频| 日本xxxx人| 最好看的2019年中文视频| 国产蜜臀在线| 成人黄色片在线| 欧美**vk| 欧美激情视频免费看| 久久99精品视频| 国产交换配乱淫视频免费| 一区二区三区免费| 一区二区视频播放| 日韩精品高清视频| 色呦呦呦在线观看| 91精品国产综合久久男男| 亚洲另类av| 搞av.com| 国产成人精品亚洲午夜麻豆| 国产精品酒店视频| 岛国精品视频在线播放| 午夜精品久久久久久久96蜜桃| 一区二区三区国产视频| 中文av在线全新| 精品国产_亚洲人成在线| 午夜日韩电影| 日本一二三四区视频| 国产精品久久久久久久第一福利 | av资源在线免费观看| 欧美日韩午夜视频在线观看| 亚洲爆乳无码一区二区三区| 日韩在线观看免费| 黄色成人在线视频| 欧美婷婷久久| 美女视频一区免费观看| 97人妻精品一区二区三区免费| 亚洲精品久久久蜜桃| 国产喷水福利在线视频| 日韩中文字幕网址| 福利一区二区免费视频| 亚洲精品欧美精品| 久久精品99国产国产精| 日本猛少妇色xxxxx免费网站| 日韩欧美大尺度| 日本福利片高清在线观看| 8x海外华人永久免费日韩内陆视频| 91欧美极品| 欧美午夜小视频| 成人av网站免费| 国产精品500部| 亚洲国产精品资源| 蜜臀久久精品| 欧美日韩一区二区三区免费| 欧美亚洲自偷自偷| 丝袜美腿中文字幕| 在线观看日产精品| 98在线视频| 91精品综合久久久久久五月天| 国产精品videosex性欧美| 手机在线观看日韩av| 一区二区三区中文字幕精品精品| 亚洲AV午夜精品| 91高清视频在线免费观看| 小嫩嫩12欧美| 色片在线免费观看| 亚洲天堂免费看| 黄色成人一级片| 奇米4444一区二区三区| av一区二区在线播放| 亚洲欧美偷拍另类| 亚洲一卡二卡三卡四卡| 日韩三级电影网| 国产日本欧美一区二区三区| 一本一道久久a久久精品蜜桃 | a天堂中文在线观看| 欧美高清视频一区二区| 亚洲电影一级片| 制服丝袜中文字幕第一页 | 久久这里只有精品99| 97se亚洲国产一区二区三区| 每日在线更新av| 国产精品情趣视频| 亚洲av无码一区二区三区性色 | 国产av人人夜夜澡人人爽麻豆| 91蝌蚪porny九色| 亚洲天堂免费av| 欧美激情精品久久久久久大尺度| 色天下一区二区三区| 一区二区三区视频网| 亚洲第一av色| 成人高潮成人免费观看| av日韩中文字幕| 青青青爽久久午夜综合久久午夜 | 国产精品www.| 91网站免费视频| 日韩精品在线一区二区| 电影天堂国产精品| 日b视频免费观看| 日本一区二区视频在线| 午夜精品在线播放| 国产精品视频免费在线观看| 亚洲高清电影| 久久国产高清视频| 亚洲全黄一级网站| 综合激情网...| 国产三级精品三级在线| 高跟丝袜欧美一区|