版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
作業(yè)調(diào)度系統(tǒng)曙光信息產(chǎn)業(yè)(北京)有限公司作業(yè)調(diào)度系統(tǒng)曙光信息產(chǎn)業(yè)(北京)有限公司1內(nèi)容任務(wù)管理系統(tǒng)概述作業(yè)調(diào)度系統(tǒng)PBS作業(yè)調(diào)度系統(tǒng)作業(yè)調(diào)度系統(tǒng)的使用內(nèi)容任務(wù)管理系統(tǒng)概述2機(jī)群使用中的問題機(jī)群結(jié)構(gòu)的松散性(單一系統(tǒng)映象)節(jié)點(diǎn)類型的差別(CPU類型、內(nèi)存大小、數(shù)量等)系統(tǒng)資源豐富(節(jié)點(diǎn)/CPU)用戶不同類型的作業(yè)(串行/并行)用戶可以使用資源的限制機(jī)群使用中的問題機(jī)群結(jié)構(gòu)的松散性(單一系統(tǒng)映象)3任務(wù)管理系統(tǒng)的功能單一系統(tǒng)映象機(jī)群松散的結(jié)構(gòu)的整合系統(tǒng)資源整合異構(gòu)系統(tǒng)的整合多用戶的管理用戶提交的任務(wù)的統(tǒng)一安排,避免沖突用戶權(quán)限的管理非授權(quán)用戶的控制任務(wù)管理系統(tǒng)的功能單一系統(tǒng)映象4任務(wù)管理系統(tǒng)的簡史任務(wù)管理系統(tǒng)的簡史5任務(wù)管理系統(tǒng)的分類基于進(jìn)程級別的調(diào)度由機(jī)群中的操作系統(tǒng)或者運(yùn)行時(shí)Runtime內(nèi)部支持,對運(yùn)行的作業(yè)進(jìn)行監(jiān)控;以實(shí)現(xiàn)機(jī)群內(nèi)的透明調(diào)度、以及自動(dòng)優(yōu)化進(jìn)程的分配和平衡負(fù)載基于作業(yè)級別的調(diào)度這種方式由獨(dú)立的作業(yè)管理系統(tǒng)實(shí)現(xiàn)。該系統(tǒng)通過專門的入口,接收用戶提交的任務(wù),送入相應(yīng)的隊(duì)列等待調(diào)度;并在適當(dāng)?shù)臅r(shí)機(jī)分配資源,為任務(wù)創(chuàng)建作業(yè),將作業(yè)提入運(yùn)行,在作業(yè)運(yùn)行結(jié)束后完成收尾工作,并提供記帳功能。管理員和用戶還可以在機(jī)群中查詢并預(yù)訂符合要求的資源,,從而實(shí)現(xiàn)對作業(yè)和資源的全程交互控制。任務(wù)管理系統(tǒng)的分類基于進(jìn)程級別的調(diào)度6任務(wù)管理系統(tǒng)的比較任務(wù)管理系統(tǒng)的比較7內(nèi)容任務(wù)管理系統(tǒng)概述作業(yè)調(diào)度系統(tǒng)PBS作業(yè)調(diào)度系統(tǒng)作業(yè)調(diào)度系統(tǒng)的使用內(nèi)容任務(wù)管理系統(tǒng)概述8作業(yè)管理的組成資源管理器:管理集群的硬件資源及認(rèn)證信息等隊(duì)列管理器:管理當(dāng)前所有已提交但還未完成的作業(yè)調(diào)度器:為作業(yè)分配資源作業(yè)管理的組成資源管理器:管理集群的硬件資源及認(rèn)證信息等9作業(yè)管理系統(tǒng)的結(jié)構(gòu)作業(yè)管理系統(tǒng)的結(jié)構(gòu)10作業(yè)特性比較作業(yè)特性比較11內(nèi)容任務(wù)管理系統(tǒng)概述作業(yè)調(diào)度系統(tǒng)PBS作業(yè)調(diào)度系統(tǒng)作業(yè)調(diào)度系統(tǒng)的使用內(nèi)容任務(wù)管理系統(tǒng)概述12PBS作業(yè)調(diào)度系統(tǒng)PBS最初由NASA的Ames研究中心開發(fā),為了提供一個(gè)能滿足異構(gòu)計(jì)算網(wǎng)絡(luò)需要的軟件包。它力求提供對批處理的初始化和調(diào)度執(zhí)行的控制,允許作業(yè)在不同主機(jī)間的路由。PBS作業(yè)調(diào)度系統(tǒng)PBS最初由NASA的Ames研究中心開13PBS的技術(shù)特色力求控制對批處理的初始化和調(diào)度執(zhí)行,允許作業(yè)在不同主機(jī)間的路由。獨(dú)立的調(diào)度模塊存有各個(gè)可用的排隊(duì)作業(yè)、運(yùn)行作業(yè)和系統(tǒng)資源使用信息,并且允許系統(tǒng)管理員定義資源和每個(gè)作業(yè)可使用的數(shù)量。在作業(yè)調(diào)度策略上,PBS提供了默認(rèn)的公平共享和獨(dú)占FIFO調(diào)度策略,還提供了TCL、BACL、C三種過程語言和調(diào)度類,與定義了一些調(diào)度需要的函數(shù)和完整的API,方便實(shí)現(xiàn)新的調(diào)度策略。提供文件傳送,F(xiàn)ileStage-in和Stage-out。滿足POSIX1003.2d標(biāo)準(zhǔn),支持作業(yè)依賴,和完整的安全認(rèn)證。提供用戶映射功能,使PBS能用于用戶不一致的系統(tǒng)中。PBS的技術(shù)特色力求控制對批處理的初始化和調(diào)度執(zhí)行,允許作業(yè)14PBS的結(jié)構(gòu)PBS的結(jié)構(gòu)15PBS的組成服務(wù)器:pbs_server調(diào)度器:pbs_sched執(zhí)行器:pbs_mom命令行:用戶腳本,管理命令等PBS的組成服務(wù)器:pbs_server16PBS的基本原理PBS的基本原理17PBS的優(yōu)缺點(diǎn)支持系統(tǒng)級檢查點(diǎn)功能(需底層操作系統(tǒng)支持)很好的大規(guī)模擴(kuò)展性獨(dú)立的調(diào)度模塊**支持作業(yè)依賴符合POSIX1003.2d標(biāo)準(zhǔn)-只支持Unix類操作系統(tǒng)-多集群協(xié)作功能有限-不支持用戶級檢查點(diǎn)功能PBS的優(yōu)缺點(diǎn)支持系統(tǒng)級檢查點(diǎn)功能(需底層操作系統(tǒng)支持)18術(shù)語節(jié)點(diǎn)(node)
一個(gè)單一的操作系統(tǒng)映像,一個(gè)統(tǒng)一的虛擬內(nèi)存映像一個(gè)個(gè)或多個(gè)cpu,一個(gè)或多個(gè)IP地址的計(jì)算機(jī)系統(tǒng)被稱之為一個(gè)節(jié)點(diǎn)。通常執(zhí)行主機(jī)(executionhost)也被稱之為節(jié)點(diǎn)。節(jié)點(diǎn)屬性
隊(duì)列、服務(wù)器和節(jié)點(diǎn)都有與自己相關(guān)的屬性,這些屬性提供控制信息。與節(jié)點(diǎn)相關(guān)的屬性有:狀態(tài)、類型、虛擬處理器的個(gè)數(shù)、作業(yè)列表(本節(jié)點(diǎn)被分配給的作業(yè))以及節(jié)點(diǎn)的特性?!?/p>
節(jié)點(diǎn)特性
為了提供一組節(jié)點(diǎn)的分配的方法,零個(gè)或者多個(gè)特性被賦給每個(gè)節(jié)點(diǎn)。這個(gè)特性不過是一串對于PBS沒有含義的字母和數(shù)字的組合(第一個(gè)字符必須是字母)。術(shù)語節(jié)點(diǎn)(node)19PBS安裝解壓源文件包
[root@node1/public]#tar-zxvfopenpbs-2.3.16.tar.gz編譯設(shè)置
[root@node1/public/OpenPBS_2.3.16]#./configure--enable-gui--set-server_home=/var/spool/pbs--enable-docs--x-libraries=/usr/X11R6/lib64
其中,--x-libraries=/usr/X11R6/lib64是在X86_64(AMD64或EM64T)上安裝時(shí),需要指明系統(tǒng)64位庫的位置。編譯安裝
[root@node1/public/OpenPBS_2.3.16]#make [root@node1/public/OpenPBS_2.3.16]#makeinstallPBS安裝解壓源文件包20PBS在機(jī)群上安裝
由于節(jié)點(diǎn)系統(tǒng)相同,因而可以用如下SHELLscript在node2~node8上安裝;
PBS在機(jī)群上安裝 由于節(jié)點(diǎn)系統(tǒng)相同,因而可以用如下SHEL21服務(wù)進(jìn)程配置和啟動(dòng)文件系統(tǒng)配置文件/etc/pbs.conf #!/bin/sh pbs_home=/var/spool/pbs指定系統(tǒng)的pbs的設(shè)置的目錄位置 pbs_exec=/usr/local指定pbs可執(zhí)行程序的目錄位置 start_server=1 start_sched=1當(dāng)為1是表示守護(hù)進(jìn)程啟動(dòng),0為守護(hù)進(jìn)程不啟動(dòng) start_mom=1
系統(tǒng)啟動(dòng)腳本/etc/init.d/openpbs
Server的系統(tǒng)啟動(dòng)腳本/etc/init.d/pbs_serverScheduler系統(tǒng)啟動(dòng)腳本/etc/init.d/pbs_schedMom系統(tǒng)啟動(dòng)腳本/etc/init.d/pbs_mom服務(wù)進(jìn)程配置和啟動(dòng)文件系統(tǒng)配置文件/etc/pbs.conf22Server端設(shè)置初始化server:(第一次運(yùn)行或者重新配置) /usr/local/sbin/pbs_server–tcreateServer配置目錄 /var/spool/pbs/server_priv/節(jié)點(diǎn)屬性聲明:/var/spool/pbs/nodes
node2R220Anp=2 node3R220Anp=2 node4dualcorenp=4 node5dualcorenp=4 node6R4280Anp=4 node7R4280Anp=4Server端設(shè)置初始化server:(第一次運(yùn)行或者重新23mom端設(shè)置mom配置目錄:/var/spool/pbs/mom_priv/mom配置文件:/var/spool/pbs/mom_priv/config
mom端設(shè)置mom配置目錄:/var/spool/pb24Server端的動(dòng)態(tài)設(shè)置PBS要能正常運(yùn)行還需要通過qmgr命令的server進(jìn)行配置,設(shè)置一些屬性。輸入qmgr命令進(jìn)入配置交互命令。下面是讓PBS可以正常運(yùn)行的一些步驟。Server端的動(dòng)態(tài)設(shè)置PBS要能正常運(yùn)行還需要通過qmgr25qmgr命令(管理員使用)輸入qmgr進(jìn)入交互式模式后即可輸入各種命令
qmgr動(dòng)作:對象類型和操作符
qmgr命令(管理員使用)輸入qmgr進(jìn)入交互式模式后即可輸26PBS隊(duì)列設(shè)置導(dǎo)入server配置文件: [root@node1root]#qmgr<queue.conf輸出配置文件: [root@node1root]#qmgr–c“printserver”>queue.conf配置文件例子:
PBS隊(duì)列設(shè)置導(dǎo)入server配置文件:27Scheduler調(diào)度行為配置Scheduler的行為由配置目錄下的sched_priv/sched_config文件進(jìn)行控制Sort_by關(guān)鍵字控制調(diào)度算法可以選擇的選項(xiàng)為
no_sort,shortest_job_first,longest_job_first,smallest_memory_first,largest_memory_first,high_priority_first,low_priority_first,multi_sort,fair_share,large_walltime_first,short_walltime_first修改這個(gè)文件后重新啟動(dòng)scheduler即可。Scheduler調(diào)度行為配置Scheduler的行為由配置28內(nèi)容任務(wù)管理系統(tǒng)概述作業(yè)調(diào)度系統(tǒng)PBS作業(yè)調(diào)度系統(tǒng)作業(yè)調(diào)度系統(tǒng)的使用內(nèi)容任務(wù)管理系統(tǒng)概述29PBS的使用步驟準(zhǔn)備:編寫描述改作業(yè)的腳本,包括作業(yè)名,需要的資源等。提交:使用qsub命令將該作業(yè)提交給PBS服務(wù)器排隊(duì):服務(wù)器將該任務(wù)排入適當(dāng)?shù)年?duì)列調(diào)度:服務(wù)器檢查各工作節(jié)點(diǎn)的狀態(tài)是否符合該作業(yè)的要求,并進(jìn)行調(diào)度。執(zhí)行:當(dāng)條件滿足時(shí),作業(yè)被發(fā)給相應(yīng)的執(zhí)行服務(wù)器執(zhí)行。程序運(yùn)行時(shí)執(zhí)行服務(wù)器會(huì)收集程序的標(biāo)準(zhǔn)輸出和標(biāo)準(zhǔn)錯(cuò)誤流,等程序結(jié)束時(shí),將這些信息返回給用戶。查詢和調(diào)整:當(dāng)作業(yè)在運(yùn)行時(shí),用戶可以使用qstat進(jìn)行狀態(tài)查詢。用戶發(fā)現(xiàn)作業(yè)提交錯(cuò)誤時(shí),可以使用qdel刪除正在運(yùn)行的作業(yè)。查看結(jié)果:使用文本編輯軟件vi或者系統(tǒng)命令cat,less等查看輸出及錯(cuò)誤信息顯示。PBS的使用步驟準(zhǔn)備:編寫描述改作業(yè)的腳本,包括作業(yè)名,需要30PBS的基本命令在PBS系統(tǒng)中,用戶使用qsub命令提交用戶程序。用戶運(yùn)行程序的命令及PBS環(huán)境變量設(shè)置組成PBS作業(yè)腳本,作業(yè)腳本使用如下格式提交到PBS系統(tǒng)運(yùn)行:PBS的基本命令在PBS系統(tǒng)中,用戶使用qsub命令提交31qsub運(yùn)行參數(shù)qsub運(yùn)行參數(shù)32PBS作業(yè)腳本注釋,以“#”開頭PBS指令,以“#PBS”開頭SHELL命令PBS作業(yè)腳本注釋,以“#”開頭33PBS的環(huán)境變量PBS的環(huán)境變量34PBS作業(yè)腳本注釋,以“#”開頭PBS指令,以“#PBS”開頭SHELL命令PBS作業(yè)腳本注釋,以“#”開頭35PBS作業(yè)腳本舉例PBS作業(yè)腳本舉例36一個(gè)復(fù)雜的PBS作業(yè)腳本一個(gè)復(fù)雜的PBS作業(yè)腳本37查詢和取消作業(yè)查詢和取消作業(yè)38查詢作業(yè)運(yùn)行的位置查詢作業(yè)運(yùn)行的位置39錯(cuò)誤處理作業(yè)提交后處于排隊(duì)狀態(tài)
沒有可用的節(jié)點(diǎn),也就是節(jié)點(diǎn)資源被其他作業(yè)使用;節(jié)點(diǎn)處于忙狀態(tài);調(diào)度器失效;指定的節(jié)點(diǎn)失效,或者節(jié)點(diǎn)上的mom失效作業(yè)提交后異常結(jié)束
腳本文件使用的是windows格式腳本中使用一些命令路徑問題腳本退出但是作業(yè)沒有退出用戶使用的文件的權(quán)限問題處理方法的原則是查看作業(yè)的標(biāo)準(zhǔn)輸入和標(biāo)準(zhǔn)錯(cuò)誤輸出的結(jié)果錯(cuò)誤處理作業(yè)提交后處于排隊(duì)狀態(tài)40錯(cuò)誤處理(續(xù))如果環(huán)境配置錯(cuò)誤,可能導(dǎo)致作業(yè)反復(fù)在等待狀態(tài)和運(yùn)行狀態(tài)轉(zhuǎn)換,可以通過“qdel作業(yè)號(hào)”將該作業(yè)刪除再重新配置環(huán)境???/p>
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2021年健康管理師《基礎(chǔ)知識(shí)》模擬試卷一(含答案)
- 2021年新安全生產(chǎn)法知識(shí)競賽試題庫及答案共300題范文五篇
- 2024年湘潭縣第二人民醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫頻考點(diǎn)附帶答案
- 2024年深圳市人民醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫頻考點(diǎn)附帶答案
- 2024年淮南市第一人民醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫頻考點(diǎn)附帶答案
- 第三單元 主題活動(dòng)四《自主選題:橋梁知多少》(說課稿)-2023-2024學(xué)年四年級下冊綜合實(shí)踐活動(dòng)內(nèi)蒙古版001
- 2024年沈陽市大東區(qū)新生醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫頻考點(diǎn)附帶答案
- 一上第八單元 家中的安全與健康(說課稿)-小學(xué)道德與法治核心素養(yǎng)學(xué)科教學(xué)專題培訓(xùn)系列
- 《鴉片戰(zhàn)爭定稿》課件
- 2024施工合同管理范例
- 2024-2025學(xué)年第一學(xué)期期中考試 初一語文 試卷
- 單位內(nèi)部發(fā)生治安案件、涉嫌刑事犯罪事件的報(bào)告制度
- 2023年心理學(xué)基礎(chǔ)知識(shí)試題及答案
- 湖南省岳陽市2023-2024學(xué)年高三上學(xué)期教學(xué)質(zhì)量監(jiān)測(一)(一模) 英語 含解析
- 河南省道德與法治初二上學(xué)期期末試題與參考答案(2024-2025學(xué)年)
- 卡西歐手表EQW-550(5178)中文使用說明書
- JJF(京) 3029-2023 醫(yī)用(硬性)內(nèi)窺鏡校準(zhǔn)規(guī)范
- 人教版八年級英語上冊期末專項(xiàng)復(fù)習(xí)-完形填空和閱讀理解(含答案)
- 人教版(2024新版)七年級上冊生物期末復(fù)習(xí)全冊知識(shí)點(diǎn)提綱
- 住院醫(yī)師規(guī)范化培訓(xùn)婦產(chǎn)科出科考試帶答案
- 期末達(dá)標(biāo)測試卷(二)(試卷)-2024-2025學(xué)年冀教版數(shù)學(xué)四年級上冊
評論
0/150
提交評論