精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大數據系列之并行計算引擎Spark介紹

大數據 Spark
Spark是UC Berkeley AMP lab (加州大學伯克利分校的AMP實驗室)所開源的類Hadoop MapReduce的通用并行框架,Spark,擁有Hadoop MapReduce所具有的優點;但不同于MapReduce的是Job中間輸出結果可以保存在內存中,從而不再需要讀寫HDFS,因此Spark能更好地適用于數據挖掘與機器學習等需要迭代的MapReduce的算法。

 [[189321]]

Spark:

Apache Spark 是專為大規模數據處理而設計的快速通用的計算引擎。

Spark是UC Berkeley AMP lab (加州大學伯克利分校的AMP實驗室)所開源的類Hadoop MapReduce的通用并行框架,Spark擁有Hadoop MapReduce所具有的優點;但不同于MapReduce的是Job中間輸出結果可以保存在內存中,從而不再需要讀寫HDFS,因此Spark能更好地適用于數據挖掘與機器學習等需要迭代的MapReduce的算法。

Spark 是一種與 Hadoop 相似的開源集群計算環境,但是兩者之間還存在一些不同之處,這些有用的不同之處使 Spark 在某些工作負載方面表現得更加優越,換句話說,Spark 啟用了內存分布數據集,除了能夠提供交互式查詢外,它還可以優化迭代工作負載。

Spark 是在 Scala 語言中實現的,它將 Scala 用作其應用程序框架。與 Hadoop 不同,Spark 和 Scala 能夠緊密集成,其中的 Scala 可以像操作本地集合對象一樣輕松地操作分布式數據集。

盡管創建 Spark 是為了支持分布式數據集上的迭代作業,但是實際上它是對 Hadoop 的補充,可以在 Hadoop 文件系統中并行運行。通過名為 Mesos 的第三方集群框架可以支持此行為。Spark 由加州大學伯克利分校 AMP 實驗室 (Algorithms, Machines, and People Lab) 開發,可用來構建大型的、低延遲的數據分析應用程序。

Spark的性能特點:

1.更快的速度:內存計算下,Spark 比 Hadoop 快100倍。

  • 內存計算引擎,提供Cache機制來支持需要反復迭代計算或者多次數據共享,減少數據讀取的I/O開銷
  • DAG引擎,減少多次計算之間中間結果寫到HDFS的開銷;
  • 使用多線程池模型來減少task啟動開銷,shuffle過程中避免不必要的sort操作已經減少磁盤I/O操作;

2.易用性:

  • Spark 提供了80多個高級運算符。
  • 提供了豐富的API,支持JAVA,Scala,Python和R四種語言;
  • 代碼量比MapReduce少2~5倍;

3.通用性:Spark 提供了大量的庫,包括SQL、DataFrames、MLlib、GraphX、Spark Streaming。 開發者可以在同一個應用程序中無縫組合使用這些庫。

4.支持多種資源管理器:Spark 支持 Hadoop YARN,Apache Mesos,及其自帶的獨立集群管理器

Spark基本原理:

Spark Streaming:構建在Spark上處理Stream數據的框架,基本的原理是將Stream數據分成小的時間片斷(幾秒),以類似batch批量處理的方式來處理這小部分數據。Spark Streaming構建在Spark上,一方面是因為Spark的低延遲執行引擎(100ms+),雖然比不上專門的流式數據處理軟件,也可以用于實時計算,另一方面相比基于Record的其它處理框架(如Storm),一部分窄依賴的RDD數據集可以從源數據重新計算達到容錯處理目的。此外小批量處理的方式使得它可以同時兼容批量和實時數據處理的邏輯和算法。方便了一些需要歷史數據和實時數據聯合分析的特定應用場合。

Spark背景:

1.MapReduce局限性:

1.僅支持Map和Reduce兩種操作;

2.處理效率低效;不適合迭代計算(如機器學習、圖計算等),交互式處理(數據挖掘)和流失處理(日志分析)

3.Map中間結果需要寫磁盤,Reduce寫HDFS,多個MR之間通過HDFS交換數據;

4.任務調度和啟動開銷大;

5.無法充分利用內存;(與MR產生時代有關,MR出現時內存價格比較高,采用磁盤存儲代價小)

6.Map端和Reduce端均需要排序;

7.MapReduce編程不夠靈活。(比較Scala函數式編程而言)

8.框架多樣化[采用一種框架技術(Spark)同時實現批處理、流式計算、交互式計算]:

  • 批處理:MapReduce、Hive、Pig;
  • 流式計算:Storm
  • 交互式計算:Impala

Spark核心概念:

  • RDD:Resilient Distributed Datasets,彈性分布式數據集

  • 分布在集群中的只讀對象集合(由多個Partition 構成);
  • 可以存儲在磁盤或內存中(多種存儲級別);
  • 通過并行“轉換”操作構造;
  • 失效后自動重構;
  • RDD基本操作(operator)

Transformation具體內容

  • map(func) :返回一個新的分布式數據集,由每個原元素經過func函數轉換后組成
  • filter(func) : 返回一個新的數據集,由經過func函數后返回值為true的原元素組成

*flatMap(func) : 類似于map,但是每一個輸入元素,會被映射為0到多個輸出元素(因此,func函數的返回值是一個Seq,而不是單一元素)

  • flatMap(func) : 類似于map,但是每一個輸入元素,會被映射為0到多個輸出元素(因此,func函數的返回值是一個Seq,而不是單一元素)
  • sample(withReplacement, frac, seed) :

根據給定的隨機種子seed,隨機抽樣出數量為frac的數據。

  • union(otherDataset) : 返回一個新的數據集,由原數據集和參數聯合而成
  • groupByKey([numTasks]) :

在一個由(K,V)對組成的數據集上調用,返回一個(K,Seq[V])對的數據集。注意:默認情況下,使用8個并行任務進行分組,你可以傳入numTask可選參數,根據數據量設置不同數目的Task

  • reduceByKey(func, [numTasks]) : 在一個(K,V)對的數據集上使用,返回一個(K,V)對的數據集,key相同的值,都被使用指定的reduce函數聚合到一起。和groupbykey類似,任務的個數是可以通過第二個可選參數來配置的。
  • join(otherDataset, [numTasks]) :

在類型為(K,V)和(K,W)類型的數據集上調用,返回一個(K,(V,W))對,每個key中的所有元素都在一起的數據集

  • groupWith(otherDataset, [numTasks]) : 在類型為(K,V)和(K,W)類型的數據集上調用,返回一個數據集,組成元素為(K, Seq[V], Seq[W]) Tuples。這個操作在其它框架,稱為CoGroup

cartesian(otherDataset) : 笛卡爾積。但在數據集T和U上調用時,返回一個(T,U)對的數據集,所有元素交互進行笛卡爾積。

  • flatMap(func) :

類似于map,但是每一個輸入元素,會被映射為0到多個輸出元素(因此,func函數的返回值是一個Seq,而不是單一元素)

Actions具體內容

  • reduce(func) : 通過函數func聚集數據集中的所有元素。Func函數接受2個參數,返回一個值。這個函數必須是關聯性的,確保可以被正確的并發執行
  • collect() : 在Driver的程序中,以數組的形式,返回數據集的所有元素。這通常會在使用filter或者其它操作后,返回一個足夠小的數據子集再使用,直接將整個RDD集Collect返回,很可能會讓Driver程序OOM
  • count() : 返回數據集的元素個數
  • take(n) : 返回一個數組,由數據集的前n個元素組成。注意,這個操作目前并非在多個節點上,并行執行,而是Driver程序所在機器,單機計算所有的元素(Gateway的內存壓力會增大,需要謹慎使用)
  • first() : 返回數據集的***個元素(類似于take(1))

saveAsTextFile(path) : 將數據集的元素,以textfile的形式,保存到本地文件系統,hdfs或者任何其它hadoop支持的文件系統。Spark將會調用每個元素的toString方法,并將它轉換為文件中的一行文本

  • saveAsSequenceFile(path) : 將數據集的元素,以sequencefile的格式,保存到指定的目錄下,本地系統,hdfs或者任何其它hadoop支持的文件系統。RDD的元素必須由key-value對組成,并都實現了Hadoop的Writable接口,或隱式可以轉換為Writable(Spark包括了基本類型的轉換,例如Int,Double,String等等)
  • foreach(func) : 在數據集的每一個元素上,運行函數func。這通常用于更新一個累加器變量,或者和外部存儲系統做交互

算子分類

大致可以分為三大類算子:

  • Value數據類型的Transformation算子,這種變換并不觸發提交作業,針對處理的數據項是Value型的數據。
  • Key-Value數據類型的Transfromation算子,這種變換并不觸發提交作業,針對處理的數據項是Key-Value型的數據對。
  • Action算子,這類算子會觸發SparkContext提交Job作業。

  • Spark RDD cache/persist

Spark RDD cache

1.允許將RDD緩存到內存中或磁盤上,以便于重用

2.提供了多種緩存級別,以便于用戶根據實際需求進行調整

 

3.cache使用

  • 之前用MapReduce實現過WordCount,現在我們用Scala實現下wordCount.是不是很簡潔呢?!
  1. import org.apache.spark.{SparkConf, SparkContext} 
  2.  
  3. object SparkWordCount{ 
  4.  def main(args: Array[String]) { 
  5.  if (args.length == 0) { 
  6.  System.err.println("Usage: SparkWordCount <inputfile> <outputfile>"
  7.  System.exit(1) 
  8.  } 
  9.  
  10.  val conf = new SparkConf().setAppName("SparkWordCount"
  11.  val sc = new SparkContext(conf) 
  12.  
  13.  val file=sc.textFile("file:///hadoopLearning/spark-1.5.1-bin-hadoop2.4/README.md"
  14.  val counts=file.flatMap(line=>line.split(" ")) 
  15.  .map(word=>(word,1)) 
  16.  .reduceByKey(_+_) 
  17.  counts.saveAsTextFile("file:///hadoopLearning/spark-1.5.1-bin-hadoop2.4/countReslut.txt"
  18.  
  19.  } 
  • 關于RDD的Transformation與Action的特點我們介紹下;

1.接口定義方式不同:

Transformation: RDD[X]–>RDD[y]

Action:RDD[x]–>Z (Z不是一個RDD,可能是一個基本類型,數組等)

2.惰性執行:

Transformation:只會記錄RDD轉化關系,并不會觸發計算

Action:是觸發程序執行(分布式)的算子。

程序的執行流程:

Spark運行模式:

Local(本地模式):

1.單機運行,通常用于測試;

  • local:只啟動一個executor
  • local[k]:啟動k個executor
  • local[*]:啟動跟cpu數目相同的executor

2.standalone(獨立模式)

獨立運行在一個集群中

3.Yarn/mesos

1.運行在資源管理系統上,比如Yarn或mesos

2.Spark On Yarn存在兩種模式

yarn-client

yanr-cluster


兩種方式的區別:

Spark在企業中的應用場景

  • 基于日志數據的快速查詢系統業務;

構建于Spark之上的SparkSQL ,利用其快速以及內存表等優勢,承擔了日志數據的即席查詢工作。

  • 典型算法的Spark實現

預測用戶的廣告點擊概率;

計算兩個好友間的共同好友數;

用于ETL的SparkSQL和DAG任務。

責任編輯:武曉燕 來源: 36大數據
相關推薦

2010-03-22 14:45:40

云計算

2019-04-08 17:11:46

大數據框架Spark

2023-10-30 08:57:19

.Net開發并行計算

2021-06-01 05:51:37

云計算并行計算分布式計算

2025-05-06 07:15:00

Dask并行計算大數據

2011-04-21 09:13:14

并行計算

2012-08-17 09:32:52

Python

2022-07-08 10:59:32

深度學習計算

2009-12-18 09:38:27

.NET 4.0并行計

2011-04-20 17:15:21

并行計算

2012-12-18 15:33:44

遞歸數據并行計算

2014-04-24 10:25:15

2010-03-19 17:23:45

云計算

2019-04-18 09:15:05

DaskPython計算

2014-01-21 11:16:59

MPI并行計算

2011-08-29 10:40:02

浪潮英特爾并行計算

2010-06-10 08:37:04

并行計算

2010-03-11 15:23:44

Visual Stud

2010-04-21 09:23:09

.NET 4

2020-05-14 13:40:40

SparkFlink大數據
點贊
收藏

51CTO技術棧公眾號

69久久久久久| 日本一区免费| 国产污视频在线看| 亚洲素人在线| 欧美日韩一区三区四区| 妞干网这里只有精品| 国产视频在线观看免费| 日韩午夜免费| 色老头一区二区三区在线观看| 久久艹这里只有精品| 僵尸再翻生在线观看| 欧美激情综合在线| 成人午夜电影在线播放| 国产成人愉拍精品久久| 成人嫩草影院| 亚洲国产成人在线视频| 中国黄色片免费看| 黄色在线看片| 国产精品美女久久久久aⅴ国产馆 国产精品美女久久久久av爽李琼 国产精品美女久久久久高潮 | 伊人久久青草| 日本免费不卡| 国产福利一区在线| 国产精品av电影| 国产在线综合网| 99re6这里只有精品| 亚洲黄色免费三级| 特黄特黄一级片| 国产亚洲人成a在线v网站| 亚洲成a人片综合在线| 亚洲欧洲免费无码| 欧洲毛片在线| 不卡一区二区三区四区| 成人写真福利网| 国产99久久久久久免费看| 最新成人av网站| 欧美成人午夜免费视在线看片| 精品国产aaa| 欧美wwwwww| 欧美精品一区二区高清在线观看 | 亚洲视频在线观看| 无码人妻精品一区二区三| 91精品视频一区二区| 欧美在线观看18| 日本精品久久久久中文字幕| 久草在线视频网站| 亚洲精品成人a在线观看| 亚洲三区四区| 91涩漫在线观看| 欧美激情综合在线| 色大师av一区二区三区| 你懂的在线观看视频网站| av一区二区久久| 国产不卡一区二区三区在线观看| 99精品视频免费看| 国产一区欧美一区| 亚洲精品免费网站| 国产又黄又爽视频| 国内精品伊人久久久久av一坑| 国产精品青草久久久久福利99| 狠狠人妻久久久久久综合| 亚洲激情综合| 7m第一福利500精品视频| 亚欧洲精品在线视频| 激情综合亚洲| **欧美日韩vr在线| 免费黄色网址在线| 久久精品盗摄| 国产精品极品在线| 亚洲自拍偷拍另类| 国模大尺度一区二区三区| 91久久中文字幕| 性欧美一区二区三区| 国产99一区视频免费| 国产精品亚洲综合| 香蕉视频成人在线| 久久精品视频免费观看| 日韩欧美在线电影| 九义人在线观看完整免费版电视剧| 成人欧美一区二区三区视频网页| 特色特色大片在线| 国产乱码精品一区二三赶尸艳谈| 欧美日韩国产中字| 欧美三级理论片| 日本在线成人| 亚洲欧美福利视频| 国产精品久久免费观看| 天天揉久久久久亚洲精品| 久久91亚洲精品中文字幕奶水| 国产一级在线观看视频| 久久久久99| 91精品视频大全| 手机av免费在线观看| 国产日韩欧美激情| 久久久久亚洲av无码专区喷水| 国产精品—色呦呦| 91成人免费电影| 成人三级做爰av| 国产精品欧美三级在线观看| 久久精品99无色码中文字幕| 中文字幕一区二区三区手机版 | 国产ts人妖一区二区三区 | 免费毛片b在线观看| 在线欧美一区二区| 亚洲最大视频网| 国产中文字幕一区二区三区| 欧美大肥婆大肥bbbbb| 四虎成人永久免费视频| 激情伊人五月天久久综合| 国产在线一区二区三区四区| www.在线播放| 精品日韩中文字幕| 亚洲自拍第三页| 久久99高清| 久久久久国产精品免费| 一区二区乱子伦在线播放| 成人的网站免费观看| 亚洲精品久久久久久一区二区| av影视在线| 欧美日韩精品一区二区天天拍小说| 中文在线观看免费视频| 婷婷亚洲最大| 国产精品 欧美在线| 免费av网站在线播放| 亚洲天堂中文字幕| 国产精品久久久毛片| 婷婷综合成人| 久久久久久高潮国产精品视| 国产精品女人久久久| 国产亚洲一区二区三区在线观看| www.av片| 成人另类视频| 久久精品小视频| 中文字幕 自拍偷拍| 91麻豆视频网站| 国产免费一区二区视频| 日韩中文字幕在线一区| xvideos国产精品| 又色又爽又黄无遮挡的免费视频| www亚洲一区| 日韩欧美国产综合在线| 97色成人综合网站| 欧美美女15p| 精品国产伦一区二区三| 日韩一区在线看| 在线免费看v片| 99国产精品一区二区| 国产精品美女呻吟| 在线观看黄av| 欧美日韩视频不卡| 妖精视频在线观看免费 | 国产精品久久综合av爱欲tv| 高清av电影在线观看| 在线一区二区三区| 国产又粗又猛又爽又黄av| 久久久久久夜| 日本欧美精品久久久| 欧美精选视频一区二区| 国产一级揄自揄精品视频| 欧美日韩一级黄色片| 91蝌蚪porny| 福利在线一区二区三区| 欧美精品一二| 成人欧美一区二区三区黑人孕妇| 蜜芽在线免费观看| 欧美一区二区三区四区视频| 可以直接看的黄色网址| 国产成人亚洲综合a∨猫咪| 国产黄色激情视频| 欧美电影在线观看免费| 国产z一区二区三区| av播放在线| 91精品国产品国语在线不卡| 久久午夜无码鲁丝片| 91在线小视频| 无需播放器的av| 自拍偷拍欧美| 精品视频在线观看| www.26天天久久天堂| 久久精品视频亚洲| 天堂在线观看免费视频| 在线欧美日韩精品| 超碰手机在线观看| 成人黄色av电影| 欧美综合在线观看视频| 日韩欧美自拍| 成人免费看片网址| 奇米777日韩| 久久影院在线观看| 日本精品久久久久| 欧美日韩一区国产| 久久久精品人妻一区二区三区四 | 蜜桃传媒麻豆第一区在线观看| 艳母动漫在线免费观看| 99香蕉久久| 国产精品成人在线| 午夜dj在线观看高清视频完整版| 日韩黄色av网站| 国产精品视频一区二区三区,| 午夜在线电影亚洲一区| 精品人体无码一区二区三区| 成人免费视频caoporn| 一本久道综合色婷婷五月| 中文字幕免费精品| 欧美日韩系列| 亚洲精品一二三**| 国产精品久久久久久久午夜| 黄色在线观看视频网站| 丝袜亚洲另类欧美重口| 天天操天天干天天| 91精品国产欧美一区二区18| 日批视频免费在线观看| 亚洲影视在线观看| 99热6这里只有精品| 91在线你懂得| 精品无码av一区二区三区不卡| 久久久久91| 亚洲国产精品无码av| 天天综合网网欲色| 日本不卡一区二区三区视频| 粉嫩一区二区三区四区公司1| 国产日韩专区在线| 国产精品迅雷| 9.1国产丝袜在线观看| 午夜av在线免费观看| 北条麻妃一区二区三区中文字幕| 久久99久久| 日韩电影中文字幕一区| 亚洲国产一二三区| 在线电影院国产精品| 亚洲高清在线看| 欧美日韩激情小视频| 精品无码av在线| 一区二区三区影院| 多男操一女视频| 中文字幕第一区| 人妻一区二区视频| 91在线精品一区二区三区| 在线播放第一页| 国产激情91久久精品导航| 亚洲第一区第二区第三区| 免费观看久久久4p| av免费播放网址| 亚洲欧美日韩视频二区| 国产97在线 | 亚洲| 亚洲精品护士| 国产69精品久久久久久久| 激情视频一区| 少妇人妻在线视频| 99re国产精品| 欧美日韩黄色一级片| 亚洲毛片av| 天天夜碰日日摸日日澡性色av| 99国产精品私拍| 黑人糟蹋人妻hd中文字幕| 国产一区二区三区的电影 | 日韩网红少妇无码视频香港| 亚洲一区二区视频在线观看| 欧美日韩大片在线观看| 亚洲夂夂婷婷色拍ww47| 欧美精品一区二区成人| 亚洲国产另类av| 国产区在线观看视频| 欧美视频一二三| 欧美brazzers| 欧美另类一区二区三区| 国产婷婷在线视频| 精品国产第一区二区三区观看体验| 亚洲精品久久久狠狠狠爱 | 在线中文字幕电影| 久久成人人人人精品欧| 女同视频在线观看| 97久久精品国产| 三级成人在线| 91久久久久久久一区二区| 欧美不卡在线观看| 国产一区二区在线网站| 久久综合影院| 麻豆md0077饥渴少妇| 亚洲美女一区| 午夜精品在线免费观看| 国产九色精品成人porny| 成人做爰www看视频软件| 免费看av不卡| 久久久国产精品视频| 国产美女一区视频| 国产99视频精品免视看7| 四虎国产精品成人免费影视| 成人av电影免费| 亚洲毛片免费看| 亚洲一区二区在线观| 欧美激情自拍| 国产精品亚洲二区在线观看 | 五月天开心婷婷| 成人午夜视频网站| 无码人妻精品一区二区中文| 亚洲少妇中出一区| 日本三级一区二区| 欧美男人的天堂一二区| 少妇av在线播放| 日韩亚洲一区二区| 天堂中文在线播放| 成人国产亚洲精品a区天堂华泰| 精品视频在线你懂得| 日韩三级电影| 在线观看的日韩av| 中文字幕 91| 91网站最新网址| 激情五月婷婷小说| 欧美视频三区在线播放| 天堂网av2014| 精品中文字幕在线| 国产精品黄色片| 国产欧美韩日| 综合激情婷婷| 成人亚洲精品777777大片| av影院午夜一区| 1024手机在线视频| 欧美三级日韩三级国产三级| 色丁香婷婷综合久久| 久热爱精品视频线路一| 一区二区视频免费完整版观看| 波多野结衣一区二区三区在线观看| 日韩在线欧美| 久草福利视频在线| 91亚洲精品久久久蜜桃网站| 欧美日韩大片在线观看| 制服丝袜中文字幕一区| avtt亚洲| 国产精品夜色7777狼人| 曰本一区二区三区视频| 精品视频在线观看一区二区| 美女精品自拍一二三四| 国产精品高清无码在线观看| 欧美日韩另类在线| 免费观看成年人视频| 九九热在线精品视频| 警花av一区二区三区| 婷婷视频在线播放| 精品一区免费av| 免费成人美女女在线观看| 欧美色图12p| 一区二区三区视频在线观看视频| 国产精品69久久| 欧美日韩在线二区| 无码内射中文字幕岛国片| 久久综合色播五月| jizz国产在线观看| 国产亚洲精品va在线观看| 免费观看欧美大片| 欧美日韩在线观看一区二区三区| 亚洲欧美日韩专区| 国产全是老熟女太爽了| 色老汉av一区二区三区| 久久视频www| 国产精品久久久久99| 欧美日韩伦理在线免费| a在线观看免费视频| 亚洲视频香蕉人妖| 亚洲精品国偷拍自产在线观看蜜桃| 欧美激情综合亚洲一二区 | 国产中文一区二区三区| 久久成人小视频| 日韩视频免费观看高清完整版 | 亚洲精品中文字幕在线播放| 欧美日韩国产一区二区三区| 毛片免费在线观看| 国产精品久久久久999| 久久一区91| 性一交一黄一片| 婷婷成人激情在线网| 精品av中文字幕在线毛片| 国产精品久久久久久亚洲影视 | 精品国产18久久久久久洗澡| 免费成人在线视频网站| 久久精品亚洲乱码伦伦中文| 亚洲天堂网在线观看视频| 久久国产精品电影| 欧美jizz19性欧美| 五月婷婷激情久久| 亚洲精品中文在线影院| 日本高清视频在线| 国产精品日韩欧美| 综合精品一区| 制服丝袜第二页| 欧美男同性恋视频网站| 国产经典三级在线| 日韩一区免费观看| 国产精品香蕉一区二区三区| av大片在线免费观看| 色视频www在线播放国产成人| www.国产精品一区| av五月天在线| 亚洲午夜一区二区三区| 毛片在线免费| 99在线看视频| 日韩av不卡在线观看| 九九视频免费看| 在线日韩中文字幕| 波多野结衣欧美| www.夜夜爽|