Spark的基本運行流程_第1頁
Spark的基本運行流程_第2頁
Spark的基本運行流程_第3頁
Spark的基本運行流程_第4頁
Spark的基本運行流程_第5頁
已閱讀5頁,還剩5頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

Spark的基本運行流程1.掌握Spark術(shù)語解釋

2.掌握Spark運行流程

1.

Spark術(shù)語解釋

2.

Spark運行流程

Spark術(shù)語解釋Master:資源管理的主節(jié)點(進(jìn)程)Worker:資源管理的從節(jié)點(進(jìn)程)或者說管理本機資源的進(jìn)程Application:基于Spark的用戶程序Driver:任務(wù)調(diào)度進(jìn)程Spark術(shù)語解釋Executor:是在一個worker進(jìn)程所管理的節(jié)點上為某Application啟動的一個進(jìn)程,該進(jìn)程負(fù)責(zé)運行任務(wù)Task:被送到某個executor上的工作單元(Thread)Job:包含很多任務(wù)(Task)的并行計算,可以看成和Action算子一一對應(yīng)RDD(彈性分布式數(shù)據(jù)集,它是一個抽象的概念,實際上它并沒有儲存真正的數(shù)據(jù),保存的的只是索引,可以將它理解為數(shù)據(jù)集的代理)運行流程當(dāng)

jar在客戶端進(jìn)行spark-submit的時候spark流程就開始了1.application啟動之后,會在本地啟動一個Driver進(jìn)程用于控制整個流程。2.首先需要初始化的是SparkContext,SparkContext

要構(gòu)建出DAGScheduler,TaskScheduler

3.在初始化TastScheduler的時候,它會去連接master,并向master注冊Application,master收到信息之后,會調(diào)用自己的資源調(diào)度算法,在spark集群的work上,啟動Executor,并進(jìn)行資源的分配,Spark術(shù)語解釋4.現(xiàn)在可以進(jìn)行我們編寫的的業(yè)務(wù)了,一般情況下通過sc.textFile("file")去加載數(shù)據(jù)源5.DagScheduer先按照action將程序劃分為一至多個job(每一個job對應(yīng)一個Dag),之后對DagScheduer按照是否進(jìn)行shuffer,將job劃分為多個Stage每個

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論