版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
主講:張義目錄0102Spark內(nèi)存分配MapReduce集群調(diào)優(yōu)總結(jié)Spark內(nèi)存分配1Spark內(nèi)存分配Spark使用內(nèi)存有兩個目的:執(zhí)行作業(yè)和存儲數(shù)據(jù)。執(zhí)行內(nèi)存是Spark用來執(zhí)行shuffle、join、sort和aggregation功能的。存儲內(nèi)存用于緩存數(shù)據(jù)和傳輸集群內(nèi)的內(nèi)部數(shù)據(jù)。當不使用任何執(zhí)行內(nèi)存時,作業(yè)可以使用所有可用的內(nèi)存進行存儲。在使用的存儲內(nèi)存達到使用閾值之前,執(zhí)行內(nèi)存可以從內(nèi)存中取出可用的存儲內(nèi)存。Spark在其內(nèi)存中提供了一個子區(qū)域,在其中緩存可以長時間存活的數(shù)據(jù)塊,其不會被用作執(zhí)行內(nèi)存。然而,存儲內(nèi)存永遠不會被用作執(zhí)行內(nèi)存。Spark內(nèi)存分配Spark的動態(tài)自動內(nèi)存分配功能可以自動調(diào)整分配給shufle操作和緩存的內(nèi)存。對于Spark的內(nèi)存,可以通過命令行確定用于分組、連接和聚合的shuffle數(shù)據(jù)結(jié)構(gòu)的最大大小。Spark還需要一些非堆存儲內(nèi)存。Spark需要在RDDS內(nèi)存和用于運行shuffle進程的內(nèi)存及非堆存儲內(nèi)存之間進行權(quán)衡。作業(yè)由任務組成。任務執(zhí)行Spark代碼。驅(qū)動程序是老板一它將任務分配給工作節(jié)點。工作進程運行執(zhí)行器,其中可以包括多個任務。驅(qū)動程序負責運行應用程序,并在應用程序執(zhí)行時對所有必要的動作進行管理。MapReduce集群調(diào)優(yōu)總結(jié)2MapReduce集群調(diào)優(yōu)總結(jié)對前面的MapReduce集群調(diào)優(yōu)的學習內(nèi)容中,總結(jié)出以下幾點:給YARN作業(yè)合理地分配內(nèi)存是優(yōu)化集群資源使用的重要方法。如果為容器分配的內(nèi)存太多,則浪費了集群的資源。太少的內(nèi)存,意味著任務運行的時間會延長,甚至有時會失敗。當配置集群的內(nèi)存時,再也沒有比學習和理解Hadoop的配置參數(shù)更重要的了。MapReduce集群調(diào)優(yōu)總結(jié)可以使用各種策略來優(yōu)化MapReduce作業(yè),其中一些策略需要管理員設置集群級別的配置屬性,而有些策略則需要進行程序開發(fā)方面的改動,包括編寫更有效的代碼和使用先進的概念,如combiners和partitioners等。可以利用多種優(yōu)化技術(shù)來提高Hive和Pig作業(yè)的性能。在進行重要改動時進行基準測試是一個好主意,比如添加更多的服務器或更改重要的配置參數(shù)?;鶞蕼y試還可以用于比較不同集群的性能。理解Hadoop的內(nèi)置計數(shù)器有助于作業(yè)故障排除和作業(yè)性能調(diào)優(yōu)。MapReduce集群調(diào)優(yōu)總結(jié)MapReduce旨在處理大數(shù)據(jù)。由于在MapReduce框架中,在默認情況下,每個mapper任務都會處理一個HDFS文件,所以如果有大量輸入文件,則使用特殊輸入格式(如MultiIFileInputFormat)可以更有效地處理每個mapper任務中的多個文件。而且,讓每個mapper處理更大的數(shù)據(jù)塊是個好主意。那么一個好的策略是將多個小輸入文件
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版牛糞有機肥生產(chǎn)加工合同規(guī)范4篇
- 二零二五年度新型農(nóng)村電商服務合同規(guī)范文本4篇
- 二零二五年度美容美發(fā)產(chǎn)品研發(fā)及成果轉(zhuǎn)化合同3篇
- 二零二五年度城市更新改造項目投資合同6篇
- 二零二五年度出國勞務派遣與職業(yè)技能提升培訓合同3篇
- 房貸合同范本(2篇)
- 承包牛羊合同(2篇)
- 2025年度幕墻工程材料供應與配送合同4篇
- 2025年度農(nóng)機維修服務網(wǎng)點加盟管理合同4篇
- 2025年歐派櫥柜出口貿(mào)易合同4篇
- (正式版)CB∕T 4552-2024 船舶行業(yè)企業(yè)安全生產(chǎn)文件編制和管理規(guī)定
- JBT 14588-2023 激光加工鏡頭 (正式版)
- 2024年四川省成都市樹德實驗中學物理八年級下冊期末質(zhì)量檢測試題含解析
- 九型人格與領(lǐng)導力講義
- 廉潔應征承諾書
- 2023年四川省成都市中考物理試卷真題(含答案)
- 泵車述職報告
- 2024年山西文旅集團招聘筆試參考題庫含答案解析
- 恢復中華人民共和國國籍申請表
- 管理期貨的趨勢跟蹤策略 尋找危機阿爾法
- 瀝青化學分析試驗作業(yè)指導書
評論
0/150
提交評論