精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大數據編排框架

大數據
編排框架通常被忽略,許多公司最終為其管道實施定制解決方案。 在本文中,我將介紹一些最常見的開源業務流程框架。

大數據是復雜的,我已經寫了很多關于廣闊的生態系統和廣泛的可用選項的文章。 通常被忽略但很關鍵的一個方面是管理大數據管道的不同步驟的執行。 框架的決定或執行過程的設計經常會推遲到稍后的階段,從而導致許多問題并延誤項目。

[[348345]]

您應該盡早設計管道編排,以避免在部署階段出現問題。 編排應像其他可交付成果一樣對待; 所有利益相關者都應該對其進行計劃,實施,測試和審查。

編排框架通常被忽略,許多公司最終為其管道實施定制解決方案。 這不僅成本高昂,而且效率低下,因為自定義業務流程解決方案往往會面臨現成框架已經解決的相同問題。 造成漫長的反復試驗。

在本文中,我將介紹一些最常見的開源業務流程框架。

管道編排

數據管道編排是一個交叉過程,可管理管道任務之間的依賴關系,調度作業等。 如果使用流處理,則需要編排每個流應用程序的依賴關系,而對于批處理,則需要安排和編排作業。

請記住,任務和應用程序可能會失敗,因此您需要一種以統一的方式調度,重新調度,重放,監視,重試和調試整個數據管道的方法。

業務流程框架提供的一些功能是:

  • 作業調度
  • 依賴管理
  • 錯誤管理和重試
  • 工作參數化
  • SLA跟蹤,警報和通知
  • 具有儀表板的用戶界面,例如甘特圖和圖形
  • 歷史和審計
  • 元數據的數據存儲
  • 日志匯總

讓我們回顧一下一些選項…

Apache Oozie

Apache Oozie是Hadoop的調度程序,作業創建為DAG,并且可以由基于cron的調度或數據可用性觸發。 Oozie是作為Java Web應用程序運行的可伸縮,可靠和可擴展的系統。 它與Sqoop等提取工具和Spark等處理框架集成在一起。

Oozie工作流程定義以hPDL(XML)編寫。 工作流包含控制流節點和動作節點。 控制流節點定義工作流的開始和結束(開始,結束和失敗節點),并提供一種機制來控制工作流的執行路徑(決策,派生和聯接節點)[1]。

動作節點是一種機制,工作流通過該機制觸發任務的執行。 Oozie支持不同類型的操作(map-reduce,Pig,SSH,HTTP,電子郵件…),并且可以擴展以支持其他類型的操作[1]。

同樣,可以對工作流程進行參數設置,并且可以同時執行幾個相同的工作流程作業。

它是Hadoop的第一個調度程序,非常流行,但是已經有點過時了,如果您完全依賴Hadoop平臺,它仍然是一個不錯的選擇。

Apache Airflow

Airflow是一個平臺,可用于計劃,運行和監視工作流程。 由于其易用性和創新的工作流作為代碼方法,它已成為大數據管道的最著名協調者,其中DAG在Python代碼中定義,可以像其他任何可交付的軟件一樣進行測試。

它使用DAG創建復雜的工作流程。 圖中的每個節點都是一個任務,邊定義了任務之間的依賴關系。 任務分為兩類:

  • 操作員:執行一些操作。
  • 傳感器:檢查過程或數據結構的狀態。

Airflow Scheduler在遵循您描述的指定依賴項的同時,在一組工作線程上執行您的任務。 它具有模塊化架構,并使用消息隊列來協調任意數量的工作程序,并且可以擴展到無窮大[2]。

它為您生成DAG,從而最大程度地提高了并行度。 DAG是用Python編寫的,因此您可以在本地運行它們,對其進行單元測試并將其與開發工作流程集成。 當工作流定義為代碼時,它們變得更加可維護,可版本控制,可測試和協作[2]。

豐富的用戶界面可以輕松地可視化生產中運行的管道,監視進度并在需要時對問題進行故障排除[2]。 它快速,易于使用且非常有用。 它具有多種視圖和多種方法來解決問題。 它保留了運行的歷史記錄,以供以后參考。

大數據編排框架

> Airflow UI[2]: https://airflow.apache.org/docs/stable/

安裝非常簡單。 您只需要Python。 它具有兩個獨立運行的進程,即UI和Scheduler。

原則[2]:

  • 動態的:氣流管道是通過代碼(Python)配置的,從而可以動態生成管道。 這允許編寫可動態實例化管道的代碼。
  • 可擴展:輕松定義您自己的運算符,執行程序并擴展庫,使其適合于您的環境的抽象級別。
  • 優雅:氣流管道簡潔明了。 使用強大的Jinja模板引擎將參數化腳本內置到Airflow中。
  • 可擴展

盡管氣流是作為代碼編寫的,但是氣流并不是數據流解決方案[2]。 此外,工作流預計大部分是靜態的或緩慢變化的,對于非常小的動態作業,還有其他選項,我們將在后面討論。

盡管XCOM功能用于在經常需要的任務之間傳遞小的元數據,例如當您需要某種相關性ID時,它卻是簡單且無狀態的。 它還支持變量和參數化作業。 最后,它具有支持SLA和警報。 它可以與用于監視的通話工具集成在一起。

Luigi是具有類似功能的Airflow的替代產品,但Airflow具有更多功能,并且比Luigi具有更好的擴展性。

Dagster

Dagster是機器學習,分析和ETL的新編排者[3]。 主要區別在于,您可以像Apache NiFi一樣跟蹤數據的輸入和輸出,從而創建數據流解決方案。 這意味著它可以跟蹤執行狀態,并可以將值具體化為執行步驟的一部分。 您可以使用數據管道和資產的統一視圖在本地測試并在任何地方運行。 它支持任何云環境。

Dagster對業務流程圖中各步驟之間的數據依賴關系進行建模,并處理它們之間的數據傳遞。 輸入和輸出上的可選類型有助于盡早發現錯誤[3]。 管道由共享的,可重用的,可配置的數據處理和基礎架構組件構建而成。 Dagster的網絡用戶界面使任何人都可以檢查這些對象并發現如何使用它們[3]。

大數據編排框架

> Dagster UI[4]: https://docs.dagster.io/

它還可以并行運行多個作業,易于添加參數,易于測試,提供簡單的版本控制,出色的日志記錄,故障排除功能等等。 與Airflow相比,它具有更多功能,但是它還有些不成熟,并且由于它需要跟蹤數據,因此可能難以擴展,由于狀態性,這是NiFi面臨的一個問題。 而且它很大程度上基于Python生態系統。

Prefect

Prefect與Dagster相似,提供本地測試,版本控制,參數管理等等。 它也是基于Python的。

Prefect之所以與眾不同,是為了克服Airflow執行引擎的局限性,例如改進的調度程序,參數化的工作流,動態工作流,版本控制和改進的測試。 對于許多面向DevOps的組織來說,必須具有版本控制功能,但Airflow仍不支持版本控制,Prefect確實支持該功能。

它具有一個核心的開源工作流管理系統以及一個完全不需要設置的云產品。 Prefect Cloud由GraphQL,Dask和Kubernetes支持,因此可以隨時使用[4]。 UI僅在云產品中可用。

Apache NiFi

Apache NiFi不是業務流程框架,而是更廣泛的數據流解決方案。 NiFi還可以安排作業,監視,路由數據,警報等等。 它專注于數據流,但您也可以處理批處理。

它不需要任何類型的編程,并提供拖放UI。 它非常易于使用,您可以將其用于中等難度的作業,而不會出現任何問題,但是對于較大的作業,它往往存在可伸縮性問題。

它在Hadoop外部運行,但可以觸發Spark作業并連接到HDFS / S3。

大數據編排框架

> NiFi UI[5]: https://nifi.apache.org/

用例

讓我們看一些例子…

  • 我有一個舊的Hadoop集群,其Spark批處理作業的運行速度很慢,您的團隊符合Scala開發人員的要求,而您的DAG并不太復雜。 在這種情況下,Ozzie是一個不錯的選擇,因為它提供了計劃Spark作業的簡單方法。
  • 我有許多具有復雜依賴關系的運行緩慢的Spark作業,您需要能夠測試依賴關系并最大化并行性,您需要一個易于部署且提供大量故障排除功能的解決方案。 在這種情況下,Airflow是您最好的選擇。
  • 我需要從許多來源實時獲取數據,您需要跟蹤數據沿襲,路由數據,豐富數據并能夠調試任何問題。 這是您的BA所需要的實時數據流傳輸管道,他們沒有太多的編程知識。 在這種情況下,Apache NiFi是您最好的選擇,因為它不需要Python技能即可提供所需的所有功能。 如果您的團隊具備Python技能,請考慮使用Dagster。
  • 我想在云中創建實時和批處理管道,而不必擔心維護服務器或配置系統。 我需要一個快速,強大的解決方案來增強基于Python的分析團隊的能力。 在這種情況下,請使用Prefect Cloud。
  • 我有短暫的,瞬息萬變的工作,要處理要跟蹤的復雜數據,我需要一種方法來解決問題并快速進行生產變更。 在這種情況下,請考慮Dagster。
  • 我處理數百TB的數據,我有一個復雜的依賴項,我想自動化我的工作流程測試。 對于這種情況,請使用Airflow,因為它可以擴展,與許多系統交互并可以進行單元測試。 Dagster或Prefect可能在此規模的數據上存在規模問題。
  • 我不確定我需要什么。 在這種情況下,請從Airflow開始,因為它是最受歡迎的選擇。

結論

我們似乎是一些最常見的業務流程框架。 如您所見,它們中的大多數將DAG用作代碼,因此您可以在將新的工作流程投入生產之前在本地進行測試,調試管道并對其進行正確的測試。 考慮本文討論的所有功能,并選擇最適合該工作的工具。

簡而言之,如果您的需求只是編排不需要共享數據的獨立任務,并且/或者您的工作很慢,并且/或者您不使用Python,請使用Airflow或Ozzie。 對于需要數據沿襲和跟蹤的數據流應用程序,請對非開發人員使用NiFi; 或Dagster或Prefect(適用于Python開發人員)。

在可能的情況下,請嘗試使工作保持簡單并在Orchestrator外部管理數據依賴關系,這在Spark中很常見,在Spark中您將數據保存到深度存儲中而不傳遞。 在這種情況下,Airflow是一個不錯的選擇,因為它不需要跟蹤數據流,并且您仍然可以使用XCOM傳遞小的元數據,例如數據的位置。 對于更小,運行速度更快,基于python的作業或更多動態數據集,您可能希望在Orchestrator中跟蹤數據依賴性并使用Dagster之類的工具。

 

責任編輯:趙寧寧 來源: 今日頭條
相關推薦

2013-08-14 09:48:02

微軟REEF

2021-12-02 16:20:17

開源微服務框架

2019-08-14 17:13:23

大數據MapReduce框架

2020-07-16 14:40:23

大數據計算框架

2017-07-03 13:11:39

大數據Hadoop模塊介紹

2024-10-15 17:28:05

2021-02-10 16:03:19

大數據開源框架

2021-12-14 09:56:51

HadoopSparkKafka

2021-03-15 14:09:05

大數據大數據框架技術數據開發

2017-04-28 08:13:08

大數據框架HDFS

2019-06-27 11:18:00

Spark內存大數據

2019-04-08 17:11:46

大數據框架Spark

2024-02-04 08:44:28

2021-06-29 20:51:16

大數據框架分桶

2019-07-22 10:45:31

2020-12-23 15:42:42

大數據大數據技術大數據框架

2020-01-13 15:24:22

框架SparkHadoop

2014-08-01 10:20:05

2017-01-19 11:10:20

5G網絡Open Baton虛擬網絡

2022-05-13 23:03:25

大數據Big Data巨量資料
點贊
收藏

51CTO技術棧公眾號

欧美美女黄视频| 国产亚洲一本大道中文在线| 欧美另类老女人| 久久久久亚洲AV成人网人人小说| 超碰在线cao| 国产色91在线| 亚洲影院色在线观看免费| 久久久久亚洲AV| 久操精品在线| 日韩一区二区精品葵司在线| 红桃av在线播放| 8888四色奇米在线观看| 国内欧美视频一区二区| 97精品在线观看| 任你操精品视频| 极品束缚调教一区二区网站| 日韩欧美在线视频免费观看| 午夜在线视频免费观看| 深夜福利在线观看直播| 九九精品视频在线看| 性色av一区二区三区| 国产不卡在线观看视频| 精品综合久久88少妇激情| 欧美三电影在线| 青草青青在线视频| 秋霞成人影院| 久久久精品国产免大香伊| 96久久精品| 在线播放成人av| 精品999成人| 久久久国产一区二区| 亚洲国产精品成人综合久久久| **日韩最新| 日本道在线观看一区二区| 成人午夜免费在线视频| 在线观看的av| 久久久精品tv| 蜜桃传媒一区二区| 狠狠躁日日躁夜夜躁av| 狠狠狠色丁香婷婷综合久久五月| 国产成人福利网站| 日韩精品一区二区三| 欧美成人69av| 久久精品视频在线观看| 手机看片国产日韩| 美女久久99| 亚洲精品不卡在线| 四虎成人免费视频| 日韩综合一区二区三区| 3d动漫精品啪啪| 亚洲免费999| 久久精品嫩草影院| 日韩欧美在线国产| 国产精品宾馆在线精品酒店| 动漫一区二区| 亚洲制服丝袜在线| www.国产二区| 欧美一卡二卡| 一区二区三区视频在线看| 欧美性受xxxx黑人猛交88| 免费在线毛片网站| 中文字幕一区二区在线观看| 亚洲成人自拍| 三区四区在线视频| 自拍av一区二区三区| 免费看啪啪网站| jizz性欧美10| 亚洲一区在线观看免费| 亚洲 欧美 综合 另类 中字| 福利成人导航| 大桥未久av一区二区三区| 男人日女人bb视频| 欧美xxx性| 欧美日韩一区二区三区免费看| 冲田杏梨av在线| 成人av在线播放| 日韩欧美一级二级三级| 久久久久久久久久久久国产精品| 极品束缚调教一区二区网站| 亚洲精品一区中文| 久久久久久久毛片| 久久亚洲精品中文字幕蜜潮电影| 久久激情五月丁香伊人| 九九热精品在线观看| 99视频一区| 国产精品久久视频| 国产成人精品无码高潮| 成人黄色一级视频| 免费av一区二区三区| av大片在线看| 一区二区三区精品久久久| 缅甸午夜性猛交xxxx| 成人免费网站www网站高清| 欧美精品久久天天躁| 97精品人人妻人人| 成人久久综合| 精品少妇一区二区30p| 圆产精品久久久久久久久久久| 日本午夜一本久久久综合| 亚洲精品欧美日韩| 天堂av在线7| 中文字幕一区二区在线观看| 国产精品一区二区免费在线观看| 精品国产欧美日韩一区二区三区| 日韩视频在线永久播放| 亚洲精品成人无码| 亚洲一区欧美| 日本在线精品视频| 99热这里只有精品在线| 久久人人超碰精品| 国产午夜精品视频一区二区三区| 性xxxxfreexxxxx欧美丶| 91精品国产丝袜白色高跟鞋| 自拍视频一区二区| 亚洲女同中文字幕| 国产mv久久久| 欧美性猛交 xxxx| 最新日韩av在线| 欧美精品色婷婷五月综合| 日韩在线视频一区二区三区| 正在播放亚洲1区| 久热这里只有精品6| 国内一区二区视频| 日韩国产美国| 中文一区一区三区高中清不卡免费| 4438x亚洲最大成人网| 欧美激情亚洲色图| 99香蕉国产精品偷在线观看| 96久久精品| 国产一二区在线| 欧美午夜精品久久久| 成人手机在线免费视频| 精品999网站| 3d精品h动漫啪啪一区二区| jizz在线观看中文| 舔着乳尖日韩一区| 91丨porny丨对白| 午夜久久福利| 亚洲最大成人网色| 毛片在线看网站| 欧美日韩在线三级| 中文字幕精品亚洲| 久久午夜精品一区二区| 久久久久久国产精品mv| av资源中文在线| 精品日韩一区二区三区免费视频| 亚洲天堂黄色片| 激情另类小说区图片区视频区| 婷婷四房综合激情五月| 亚洲第一会所001| 中文字幕成人在线| 中文字幕资源网| 中文字幕一区二区三区在线播放| 国产野外作爱视频播放| 欧美理论视频| 国产精品老女人精品视频| 国产高清av在线| 欧美日韩免费观看一区二区三区| 一区二区三区伦理片| 日韩中文字幕一区二区三区| 日韩欧美三级一区二区| 国产 日韩 欧美一区| 伊人一区二区三区久久精品| 亚洲精品无码久久久久| 国产精品女同互慰在线看| www.99r| 91精品一区国产高清在线gif | 青青草原国产视频| 狠狠狠色丁香婷婷综合久久五月| 今天免费高清在线观看国语| 一区视频网站| 久久免费精品视频| 性xxxx18| 欧美偷拍一区二区| 三级在线观看免费大全| 高清国产一区二区| 3d动漫一区二区三区| 一区二区导航| 国产专区欧美专区| 亚洲卡一卡二| 日韩国产精品一区| 又色又爽又黄无遮挡的免费视频| 亚洲美女屁股眼交3| 国产成人精品无码片区在线| 久久精品导航| 最新国产精品久久| 日韩av三区| 国产精品尤物福利片在线观看| 日本不卡影院| 国产一区av在线| 国产黄色片免费观看| 欧美日韩中文字幕日韩欧美| 国产精品麻豆一区| www.性欧美| www.精品在线| 999亚洲国产精| 一本一道久久a久久综合精品| 99re热精品视频| 国产精品久久久久久久久影视| 在线视频国产区| 亚洲人成电影网站色…| 国产成人精品一区二区无码呦 | 国产免费观看高清视频| 成人羞羞在线观看网站| 成人区精品一区二区| 香蕉成人影院| 国内自拍欧美激情| 免费大片黄在线观看视频网站| 亚洲福利精品在线| 亚洲在线视频播放| 日韩欧美国产高清91| 欧美日韩中文字幕在线观看| 国产三级三级三级精品8ⅰ区| 自拍视频第一页| 免费在线看一区| 玩弄中年熟妇正在播放| 一区二区三区在线| 日韩资源av在线| 免费成人蒂法| 99re国产视频| 亚洲精品一区av| 国产精品久久久久久久久久新婚 | 免费黄网站在线| 国产视频一区在线| 高清国产mv在线观看| 欧美男生操女生| 日韩熟女一区二区| 婷婷成人综合网| 黄色小视频在线免费看| 亚洲欧美日韩久久精品| 亚洲色图日韩精品| 久久美女高清视频| 精品中文字幕在线播放| 国产成人精品一区二区三区网站观看| 一级片视频免费观看| 视频一区欧美精品| 国产肥臀一区二区福利视频| 影音先锋亚洲一区| 欧洲精品在线播放| 国模吧视频一区| 超碰超碰超碰超碰超碰| 天天射成人网| 中文字幕在线亚洲精品| 久久亚洲精品中文字幕蜜潮电影| 视频在线一区二区三区| 欧美日韩久久精品| 日韩精品一区二区三区四区五区| 丝袜av一区| 女同一区二区| 国产伦精品一区二区三区千人斩| 久久综合入口| 神马影视一区二区| 欧美一区二区三区电影在线观看| 全国精品免费看| 免费亚洲一区二区| 国产精品免费不| 神马影院我不卡午夜| 成人情趣视频网站| 国产一区一区三区| 欧美成人嫩草网站| 国产av国片精品| 国产美女诱惑一区二区| 久草青青在线观看| 欧美aⅴ一区二区三区视频| 国产又猛又黄的视频| 久久精品国产色蜜蜜麻豆| 中文字幕 日韩 欧美| 国产一区二区久久| 性高潮免费视频| 久久久三级国产网站| 一区二区三区在线播放视频| 亚洲欧美日韩中文字幕一区二区三区| 麻豆chinese极品少妇| 亚洲成人av福利| 国产女主播喷水视频在线观看| 欧美日韩午夜在线| 国产叼嘿视频在线观看| 亚洲第一男人av| 国产小视频免费在线网址| 最近中文字幕mv在线一区二区三区四区 | 欧美va在线观看| 亚洲一区二区三区久久| 美女福利一区| 亚洲五月六月| 精品成人一区| 精品久久久久久中文字幕2017| 加勒比av一区二区| 亚洲av成人片色在线观看高潮 | 正在播放91九色| 激情久久婷婷| 国产一二三四在线视频| 国产精品123| 久久av无码精品人妻系列试探| 国产精品盗摄一区二区三区| 久久久久无码精品国产| 欧美中文字幕久久| 性生活视频软件| 在线播放国产精品| 男女在线观看视频| 国产精品久久久久福利| 99a精品视频在线观看| 亚洲福利av在线| 亚洲国产片色| 国产5g成人5g天天爽| 91影院在线观看| 欧美黑人猛猛猛| 一本高清dvd不卡在线观看| 99国产成人精品| 亚洲色图色老头| 91桃色在线观看| 91在线视频九色| 精品国产一区二区三区小蝌蚪| 欧美亚洲色图视频| 久久99精品久久久久久| 免费看黄色的视频| 亚洲成人在线观看视频| 国产手机精品视频| 亚洲午夜精品久久久久久性色| xxx性欧美| 亚洲最大福利视频| 91亚洲国产成人久久精品| 99精品视频在线看| 丁香六月综合激情| 神马久久精品综合| 欧美在线free| 日色在线视频| 91爱爱小视频k| 国产精品色呦| 国产在线观看欧美| 国产剧情一区二区| 99久久婷婷国产综合| 欧美日韩国产电影| 国产九色在线| 国产99在线|中文| 蜜桃精品噜噜噜成人av| 成人午夜精品久久久久久久蜜臀| 国产一区欧美二区| 777777国产7777777| 欧美日韩激情一区| a√在线中文网新版址在线| 国产99久久久欧美黑人| 国产一区日韩| 久久综合伊人77777麻豆最新章节| 久久久精品免费免费| 欧美一区二区三区网站| 日韩av中文字幕在线播放| yellow在线观看网址| 国产区二精品视| 99精品国产一区二区青青牛奶| yy6080午夜| 欧美午夜美女看片| 免费理论片在线观看播放老| 日韩美女免费线视频| 欧美禁忌电影| 538任你躁在线精品免费| 国产精品系列在线| 亚洲无码精品在线观看| 搡老女人一区二区三区视频tv| 久久精品超碰| 欧美日韩亚洲国产成人| 国产精品一二三| 久久免费小视频| 亚洲福利影片在线| 中文在线资源| 亚州欧美一区三区三区在线| 久国产精品韩国三级视频| 久久久久久视频| 亚洲成人久久久久| 东京一区二区| 亚洲永久激情精品| 国产成a人亚洲精| 在线观看日韩中文字幕| 这里精品视频免费| 日韩成人视屏| 逼特逼视频在线| 国产精品久久久久久久久晋中| 国产哺乳奶水91在线播放| 国语自产偷拍精品视频偷| 精品在线99| 亚洲制服在线观看| 欧美日韩国产精品专区 | 亚洲九九爱视频| 午夜av免费在线观看| 国产精品999999| 欧美黄色精品| 亚洲av片不卡无码久久| 欧美日韩国产精品自在自线| 污视频网站在线免费| 欧美一区二区视频17c| 国产一区视频导航| 日韩视频在线观看一区| 日韩中文字幕在线免费观看| **爰片久久毛片| 我要看一级黄色大片| 亚洲一二三四区| 69xxxx欧美| 蜜桃麻豆91| 国产福利电影一区二区三区| 黄色污污网站在线观看| 欧美剧在线观看|