精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

4個簡單技巧,可提高您的Apache Spark工作性能

大數據 Spark
在開發Spark應用程序時,最耗時的部分之一是優化。 在此博客文章中,我將提供一些性能提示,以及(至少對我而言)啟動時可能會使用的未知配置參數。

使您的Apache Spark應用程序運行速度更快,而對代碼的更改最少!

[[326152]]

介紹

在開發Spark應用程序時,最耗時的部分之一是優化。 在此博客文章中,我將提供一些性能提示,以及(至少對我而言)啟動時可能會使用的未知配置參數。

因此,我將介紹以下主題:

  • 多個小文件作為源
  • 隨機分區參數
  • 強制廣播Join
  • 分區vs合并vs隨機分區參數設置

我們可以改善什么?

1. 使用多個小文件?

OpenCostInBytes(來自文檔)—可以同時掃描打開文件的估計成本(以字節數衡量)。 將多個文件放入分區時使用。 最好高估一下,然后,具有較小文件的分區將比具有較大文件的分區(首先安排)更快。 默認值為4MB。

spark.conf.set("spark.files.openCostInBytes", SOME_COST_IN_BYTES)

我對包含12,000個文件的1GB文件夾,包含800個文件的7.8GB文件夾和包含1.6k個文件的18GB文件夾進行了測試。 我的目的是弄清楚輸入文件是否較小,最好使用低于默認值的文件。

因此,當測試1GB和7.8GB文件夾時-肯定是較低的值,但是測試大約11MB的文件時,較大的參數值會更好。

使用接近您的小文件大小的openCostInBytes大小。 這樣會更有效率!

2. 隨機分區

開始使用Spark時,我莫名其妙地想到了在創建Spark會話時設置的配置是不可變的。 天哪,我怎么錯。

因此,通常,在進行聚集或聯接時,spark分區在spark中是一個靜態數字(默認為200)。 根據您的數據大小,這會導致兩個問題:

  • 數據集很小-200太多,數據分散且效率不高
  • 數據集巨大-200太少了。 數據被浪費了,我們沒有充分利用我們想要的所有資源。

因此,在遇到此類問題時遇到了一些麻煩,我在Google上花費了很多時間,發現了這個美麗的東西

  1. spark.conf.set("spark.sql.shuffle.partitions", X) 

可以在運行時中途隨時隨地更改此整潔的配置,它會影響設置后觸發的步驟。 您也可以在創建Spark會話時使用這個壞男孩。 在對聯接或聚合進行數據混排時,將使用此分區數量。 還獲得數據幀分區計數:

  1. df.rdd.getNumPartitions() 

您可以估計最合適的混搭分區數,以進行進一步的聯接和聚合。

也就是說,您有一個巨大的數據框,并且想要保留一些信息。 這樣就得到了大數據幀的分區數。 將shuffle分區參數設置為此值。 這樣一來,加入后就不會成為默認值200! 更多并行性-我們來了!

3. 廣播Join

非常簡單的情況:我們有一個龐大的表,其中包含所有用戶,而我們的表中包含內部用戶,質量檢查人員和其他不應包含在內的用戶。 目標只是離開非內部人員。

  • 讀兩個表
  • Huge_table 左防聯接小表

它看起來像是一個簡單且性能明智的好解決方案。 如果您的小型表小于10MB,則您的小型數據集將在沒有任何提示的情況下進行廣播。 如果在代碼中添加提示,則可能會使它在更大的數據集上運行,但這取決于優化程序的行為。

但是,假設它是100-200MB,并且提示您不要強制廣播它。 因此,如果您確信它不會影響代碼的性能(或引發一些OOM錯誤),則可以使用它并覆蓋默認值:

  1. spark.conf.set("spark.sql.autoBroadcastJoinThreshold", SIZE_OF_SMALLER_DATASET) 

在這種情況下,它將廣播給所有執行者,并且加入應該工作得更快。

當心OOM錯誤!

4. 分區vs合并vs隨機分區配置設置

如果您使用的是Spark,則可能知道重新分區方法。 對我來說,來自SQL后臺方法合并的方式有不同的含義! 顯然,在分區上進行火花合并時,其行為方式有所不同-它移動并將多個分區組合在一起。 基本上,我們將數據改組和移動減到最少。

如果我們只需要減少分區數,則應該使用合并而不是重新分區,因為這樣可以最大程度地減少數據移動并且不會觸發交換。 如果我們想更均勻地在分區之間劃分數據,請重新分區。

但是,假設我們有一個重復出現的模式,我們執行聯接/轉換并得到200個分區,但是我們不需要200個分區,即100個甚至1個。

讓我們嘗試進行比較。 我們將讀取11MB的文件夾,并像以前一樣進行匯總。

通過將數據幀持久存儲在僅存儲選件磁盤上,我們可以估計數據幀大小。 所以small_df只有10 MB,但是分區數是200。等等? 平均每個分區可提供50KB的數據,這效率不高。 因此,我們將讀取大數據幀,并將聚合后的分區計數設置為1,并強制Spark執行,最后我們將其算作一項操作。

這是我們三種情況的執行計劃:

4個簡單技巧,可提高您的Apache Spark工作性能

> Setting shuffle partition parameter

4個簡單技巧,可提高您的Apache Spark工作性能

> Coalesce action

4個簡單技巧,可提高您的Apache Spark工作性能

> Repartitioning

因此,在所有可見的設置中,我們不會調用Coalesce / Exchange的其他步驟(重新分區操作)。 因此,我們可以通過跳過它來節省一些執行時間。 如果我們看一下執行時間:Shuffle Partition設置在7.1分鐘,Coalesce 8.1,Repartition 8.3中完成。

這只是一個簡單的示例,它仍然顯示了通過設置一個配置參數可以節省多少時間!

摘要

關于如何使您的Apache Spark應用程序更快,更高效地運行,有許多小而簡單的技巧和竅門。 不幸的是,使用Spark時,大多數情況下解決方案都是單獨的。 為了使其正常工作,大多數時候您必須了解Spark內部組件的內幕,并從頭到尾閱讀文檔多次。

在本文中,我提到了如何更快地讀取多個小文件,如何強制建議廣播連接,選擇何時使用shuffle分區參數,合并和重新分區。

我希望它很有用,并會在您開發Apache Spark應用程序的過程中為您提供幫助!

 

責任編輯:趙寧寧 來源: 今日頭條
相關推薦

2017-11-06 13:25:25

MySQL數據庫技巧

2024-10-25 15:48:21

GPUPyTorch編程

2020-03-25 08:00:32

Kubernetes節點工作

2020-09-23 09:20:58

代碼Java字符串

2017-02-05 17:33:59

前端優化Web性能

2020-08-04 08:30:18

JS數組技巧

2021-05-12 09:00:00

WebReactJavaScript

2009-12-23 17:07:37

WPF性能

2017-11-17 08:56:59

Java性能優化技巧

2015-11-16 10:03:10

效率

2023-10-13 12:56:23

工作效率VS Code技巧

2017-05-18 09:16:54

前端CSS技巧

2020-06-04 15:55:54

GitHub代碼開發者

2016-10-21 16:05:44

SQLSQL SERVER技巧

2011-08-05 10:55:53

2019-08-30 14:25:03

Vim命令Linux

2009-06-17 10:13:03

提高EJB性能

2019-03-19 14:20:58

Linux在機器學習腳本

2024-04-09 14:21:15

HTML開發

2023-02-21 14:55:40

React開發技巧
點贊
收藏

51CTO技術棧公眾號

国产成人精品免费| 二区三区精品| 国产精品你懂的| 欧洲大片精品免费永久看nba| 国产资源在线观看入口av| 麻豆国产欧美日韩综合精品二区| 欧美精品一区二区三区国产精品 | 亚洲国产精品一区制服丝袜| 亚洲激情视频网站| 欧美女同在线观看| 最新真实国产在线视频| 日日夜夜精品视频| 午夜久久福利影院| 伊人婷婷久久| 天堂√在线中文官网在线| 免费一级欧美片在线观看| 欧美大秀在线观看| 99久久99久久精品免费| 超碰精品在线| 69堂成人精品免费视频| 国产a级片免费观看| a天堂中文在线官网在线| 久久久综合网站| 国产精品sss| 一卡二卡三卡在线| 久久久精品五月天| 性色av一区二区三区免费| 久久av红桃一区二区禁漫| 国产99久久| 亚洲高清不卡av| 熟妇无码乱子成人精品| av成人免费看| 午夜精品福利一区二区蜜股av| 永久免费在线看片视频| 成人av电影观看| 久久尤物电影视频在线观看| 99在线观看视频| 国产女人18毛片水18精| 日本不卡在线视频| 欧美中文字幕在线播放| 日本污视频在线观看| 偷拍欧美精品| 色妞一区二区三区| av手机在线播放| 一本久久青青| 亚洲精品视频在线播放| 国产成人精品无码片区在线| 高清欧美性猛交xxxx黑人猛| 日韩一区二区免费在线电影| 99久久99精品| 北岛玲精品视频在线观看| 欧美日韩亚洲高清一区二区| 青青青在线视频免费观看| 亚洲天堂av影院| 精品美女永久免费视频| 成品人视频ww入口| 欧产日产国产精品视频 | 亚洲人成亚洲人成在线观看| 2一3sex性hd| 另类ts人妖一区二区三区| 亚洲国产精品人久久电影| 亚洲熟女一区二区三区| 中文字幕亚洲在线观看| 欧美成人一区二区三区片免费 | 久久亚洲一区二区三区明星换脸| 精品久久久久久中文字幕动漫| 亚洲精品综合网| 成人av电影在线| 精品乱码一区| 四虎影视在线观看2413| 久久久蜜臀国产一区二区| 日本一区二区免费看| 国模人体一区二区| 国产成人99久久亚洲综合精品| 91免费看蜜桃| 免费av一级片| 久久九九影视网| 亚洲一区二区三区在线观看视频| 九色porny在线| 亚洲综合久久av| 91专区在线观看| 新片速递亚洲合集欧美合集| 欧美日本免费一区二区三区| 无套内谢丰满少妇中文字幕| 国产精品美女在线观看直播| 亚洲免费影视第一页| 毛片视频免费播放| 国产综合自拍| 欧美综合第一页| 一级α片免费看刺激高潮视频| 国产精品综合网| 精品视频导航| 亚洲欧美视频一区二区| 亚洲一区二区三区中文字幕在线| 亚洲中文字幕无码中文字| 国产精品久久久久久妇女| 欧美一区二区三区日韩| 内射中出日韩无国产剧情| 久久精品国产亚洲夜色av网站| 九九九热精品免费视频观看网站| 国产成人精品一区二三区| 久久se精品一区精品二区| 国产精品日韩一区二区| 天堂在线中文字幕| 蜜臀99久久精品久久久久小说| 成人精品毛片| 亚洲人成绝费网站色www| 欧美风情第一页| 亚洲精品极品| 成人a视频在线观看| 好吊色在线观看| 国产精品嫩草影院com| 免费超爽大片黄| 性欧美video另类hd尤物| 日韩电影在线观看中文字幕 | 红杏aⅴ成人免费视频| 伊人精品在线观看| 91国产丝袜播放在线| 国产精品一区二区三区网站| 日韩欧美一区二区三区四区| 福利影院在线看| 91精品国产综合久久婷婷香蕉 | 麻豆av电影在线观看| 亚洲日本护士毛茸茸| 国产黄色特级片| 加勒比中文字幕精品| 久久成人在线视频| 特级西西444www大胆免费看| 成人激情免费电影网址| 中文字幕中文字幕在线中一区高清| 欧美极品videos大乳护士| 欧美一级欧美三级在线观看| 日韩欧美视频免费观看| 久久精品三级| 蜜桃av久久久亚洲精品| 高清电影在线免费观看| 欧美一级高清片| 日韩欧美123区| 蜜桃在线一区二区三区| 欧美日韩亚洲免费| 波多野结衣亚洲一二三| 亚洲第一视频网站| 久久精品国产亚洲AV无码麻豆| 国产在线观看一区二区| 中文字幕一区二区三区精彩视频 | 国产综合精品久久久久成人av| 国产欧美不卡| 国产综合第一页| 超碰在线视屏| 亚洲精品成人网| 国产成人啪精品午夜在线观看| 国产馆精品极品| www.69av| 国产精品玖玖玖在线资源| 久久免费视频网| 亚洲精品久久久狠狠狠爱 | 国内外成人激情免费视频| 国产精品久久免费视频| 美女视频黄免费的亚洲男人天堂| 国产毛片毛片毛片毛片| 日韩美女视频一区| 性生活在线视频| 黄色在线一区| 久久99精品久久久久子伦| 日韩伦理在线一区| 亚洲石原莉奈一区二区在线观看| 中文字幕免费观看| 中文字幕国产精品一区二区| 天天干天天操天天玩| 亚洲成人一区| 高清日韩一区| 色综合桃花网| 国产亚洲一区二区在线| 97超碰人人草| 亚洲国产精品人人做人人爽| 亚洲 欧美 日韩在线| 久久激情网站| 亚洲午夜精品国产| 波多野结衣在线一区二区| 欧洲成人在线视频| 日本亚洲精品| 亚洲精品在线免费播放| 黄色av一级片| 国产精品久久久久一区 | 欧美在线视频精品| 一区二区三区自拍| 亚洲av无码一区二区二三区| 美女一区二区三区| 给我免费播放片在线观看| 男人的天堂久久| 国产日韩中文在线| 97天天综合网| 中文字幕久热精品视频在线| 亚洲av无码国产综合专区 | 一本久道综合色婷婷五月| 97人人精品| 国产日韩欧美综合精品| 国产精品字幕| 久久久免费电影| www 日韩| 亚洲激情国产精品| 国产情侣激情自拍| 色哟哟精品一区| 欧美日韩人妻精品一区二区三区| 久久一日本道色综合| 中文字幕亚洲影院| 久久一区二区三区四区五区 | 老司机一区二区三区| 中文字幕乱码一区二区三区| 天堂综合网久久| 91日本在线观看| 欧美三区四区| 高清欧美电影在线| 黄色网页在线免费观看| 亚洲女人被黑人巨大进入| 亚洲国产一二三区| 欧美亚洲免费在线一区| 国产性xxxx高清| 亚洲色图视频网站| 欧美人与禽zoz0善交| 91免费看`日韩一区二区| 亚洲天堂一区二区在线观看| 日韩电影网1区2区| www国产精品内射老熟女| 欧美精品不卡| 免费在线观看污污视频| 欧美一区2区| 日韩av高清| 女优一区二区三区| 久久久久天天天天| 精品三级av| 国产精品一 二 三| 中文字幕一区日韩精品 | 国产精品久久久久久免费播放| 色悠悠久久综合| 久久久久久久久影院| 亚洲成人av一区| 日本特黄一级片| 亚洲已满18点击进入久久| 国产十六处破外女视频| 亚洲男同1069视频| 伊人在线视频观看| 中文字幕一区二区三区四区| 国产aaaaaaaaa| 亚洲国产精品高清| 国产性猛交xx乱| 欧美激情一区二区三区不卡| 欧美大波大乳巨大乳| 久久久久久毛片| 97人妻人人揉人人躁人人| 国产欧美一区二区精品性色| 久久精品国产亚洲AV熟女| 久久久午夜电影| 北岛玲一区二区| 91麻豆国产自产在线观看| 蜜臀av粉嫩av懂色av| 成人午夜在线播放| 中文乱码人妻一区二区三区视频| 成人动漫一区二区在线| 欧美做受喷浆在线观看| 91视频精品在这里| 久久精品无码一区| 国产精品无圣光一区二区| 亚洲国产精品一区二区久久hs| 国产精品国产自产拍高清av王其| 在线免费看av网站| 亚洲图片欧美色图| 国产毛片aaa| 欧美体内she精视频| 亚洲资源在线播放| 欧美一区二区视频网站| 成人免费一级视频| 亚洲精品永久免费| 日本在线看片免费人成视1000| 美日韩在线视频| 久久男人天堂| 国产精品免费看久久久香蕉| 国产欧美日韩电影| 精品国产福利| 激情五月综合网| 日韩视频一二三| 国产模特精品视频久久久久| 91最新在线观看| 国产成人午夜电影网| 伊人网伊人影院| 亚洲激情综合网| 啦啦啦免费高清视频在线观看| 欧美色国产精品| 亚洲精品视频专区| 一区二区三区动漫| 黄色的视频在线观看| 国产精品极品美女在线观看免费| 国产日韩一区二区三免费高清| 精品中文字幕一区| 天天射成人网| 成人在线观看a| 国产91精品一区二区| 夫妇交换中文字幕| 亚洲成va人在线观看| 在线观看黄色国产| 亚洲精品99久久久久| 国产在线一区二区视频| 亲子乱一区二区三区电影 | 1024在线看片你懂得| 国产精品国模在线| 91久久精品无嫩草影院| 五月天国产一区| 亚洲男女自偷自拍| 四虎国产精品永久免费观看视频| 久久精品人人做人人综合 | av在线网页| 国产欧美日韩中文字幕| 啪啪国产精品| 一本大道东京热无码aⅴ| 欧洲精品久久一区二区| 蜜臀av一级做a爰片久久| 亚洲国产午夜精品| 国产蜜臀97一区二区三区 | 亚洲女同另类| av免费网站观看| 99r国产精品| 国产在线欧美在线| 正在播放亚洲一区| a天堂在线资源| 欧亚精品在线观看| 欧美日韩大片免费观看| 国产aaa免费视频| 国内精品免费在线观看| 人人艹在线视频| 在线观看日韩毛片| 你懂的好爽在线观看| 91国产美女视频| 加勒比色老久久爱综合网| 日本一级黄视频| 国产一区二区三区精品视频| 中文字幕第69页| 欧美日韩国产一级二级| 成人免费在线视频网| 国产suv精品一区二区| 色天天色综合| 日韩av黄色网址| 久久综合色之久久综合| 黄色在线观看国产| 亚洲欧美日韩中文视频| 成人影院入口| 欧美午夜免费| 视频一区视频二区在线观看| av网站免费在线看| 欧美视频在线一区| 日本最新在线视频| 国产伦精品一区二区三区精品视频| 第一会所亚洲原创| 国产无色aaa| 亚洲精品视频在线| 国精产品一品二品国精品69xx | 久久精品国产v日韩v亚洲| 久久久久久久性潮| 亚洲第一综合网站| 国产999精品久久久久久绿帽| 欧美黄色免费看| 亚洲丁香久久久| 黑人巨大精品欧美一区二区桃花岛| 美女主播视频一区| 美女高潮久久久| 国产成人综合在线视频| 日韩欧美aaaaaa| 美女扒开腿让男人桶爽久久软| 精品国产乱码一区二区三区四区| 亚洲永久网站| 91大神福利视频| 日韩欧美电影一区| 日韩伦理在线一区| 亚洲国产欧洲综合997久久 | 91n在线视频| 欧美刺激脚交jootjob| 午夜影院在线观看国产主播| 日韩欧美精品在线不卡| 国产一区二区在线视频| 国产在线观看免费视频今夜| 亚洲美女av黄| 不卡的国产精品| 北条麻妃在线视频观看| 国产精品久99| 天堂中文字幕av| 国产精品美乳一区二区免费| 欧美激情成人在线| 国产在线观看h| 日韩一区二区三区在线观看 | 国产精品videosex极品| 一区二区不卡免费视频| 91精品欧美综合在线观看最新| 欧美bbbxxxxx| 亚洲欧美日韩综合一区| 成人一区二区三区视频| 在线免费观看av片| 久久久久在线观看| 99久久这里只有精品| 亚洲AV无码国产精品| 欧美精品一二三四| 成人欧美一区二区三区的电影|