高性能計算平臺用戶使用手冊_第1頁
高性能計算平臺用戶使用手冊_第2頁
高性能計算平臺用戶使用手冊_第3頁
高性能計算平臺用戶使用手冊_第4頁
高性能計算平臺用戶使用手冊_第5頁
已閱讀5頁,還剩53頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、西北農(nóng)林科技大學(xué)高性能計算平臺用戶使用手冊北京景行銳創(chuàng)軟件有限公司時間:2015-11-18聯(lián)系人:劉煒、周兆永電話:87082236目錄 TOC o 1-3 h z u HYPERLINK l _Toc454294241 第一章高算平臺介紹 PAGEREF _Toc454294241 h 4 HYPERLINK l _Toc454294242 第二章命令行使用方式 PAGEREF _Toc454294242 h 5 HYPERLINK l _Toc454294243 2.1.編譯的登陸方式 PAGEREF _Toc454294243 h 5 HYPERLINK l _Toc454294244

2、 2.1.1Windows用戶訪問方式: PAGEREF _Toc454294244 h 5 HYPERLINK l _Toc454294245 2.1.2Linux和mac的登陸方式: PAGEREF _Toc454294245 h 6 HYPERLINK l _Toc454294246 2.2.數(shù)據(jù)上傳方式 PAGEREF _Toc454294246 h 6 HYPERLINK l _Toc454294247 2.3.景行資源管理與調(diào)度軟件簡單介紹 PAGEREF _Toc454294247 h 6 HYPERLINK l _Toc454294248 2.4.景行調(diào)度作業(yè)提交命令: PAG

3、EREF _Toc454294248 h 11 HYPERLINK l _Toc454294249 2.4.1單節(jié)點單核、多核任務(wù)的提交方式: PAGEREF _Toc454294249 h 11 HYPERLINK l _Toc454294250 2.4.2單節(jié)點單核、多核并且程序需要的內(nèi)存大于60G 任務(wù)的提交方式: PAGEREF _Toc454294250 h 11 HYPERLINK l _Toc454294251 2.4.3多節(jié)點多核任務(wù)的提交方式(mpirun): PAGEREF _Toc454294251 h 11 HYPERLINK l _Toc454294252 2.4.4

4、ncl的提交方式 PAGEREF _Toc454294252 h 11 HYPERLINK l _Toc454294253 2.4.5wrf作業(yè)提交方式 PAGEREF _Toc454294253 h 12 HYPERLINK l _Toc454294254 2.4.6cfs作業(yè)提交方式 PAGEREF _Toc454294254 h 12 HYPERLINK l _Toc454294255 2.4.7cesm作業(yè)提交方式 PAGEREF _Toc454294255 h 12 HYPERLINK l _Toc454294256 2.4.8指定作業(yè)運(yùn)行的內(nèi)存限制(單節(jié)點多核任務(wù)) PAGEREF

5、 _Toc454294256 h 12 HYPERLINK l _Toc454294257 2.4.9小作業(yè)提交方式 PAGEREF _Toc454294257 h 12 HYPERLINK l _Toc454294258 2.5.景行調(diào)度作業(yè)管理 PAGEREF _Toc454294258 h 12 HYPERLINK l _Toc454294259 2.5.1提交作業(yè) PAGEREF _Toc454294259 h 12 HYPERLINK l _Toc454294260 2.5.2查看作業(yè)信息 PAGEREF _Toc454294260 h 13 HYPERLINK l _Toc4542

6、94261 2.5.3作業(yè)控制 PAGEREF _Toc454294261 h 13 HYPERLINK l _Toc454294262 2.5.4查看作業(yè)歷史 PAGEREF _Toc454294262 h 13 HYPERLINK l _Toc454294263 2.5.5修改作業(yè)信息 PAGEREF _Toc454294263 h 13 HYPERLINK l _Toc454294264 第三章基于WEB頁面使用方式 PAGEREF _Toc454294264 h 13 HYPERLINK l _Toc454294265 3.1 jre安裝介紹 PAGEREF _Toc454294265

7、 h 13 HYPERLINK l _Toc454294266 3.2 vncviewer安裝介紹 PAGEREF _Toc454294266 h 14 HYPERLINK l _Toc454294267 第四章高算平臺使用 PAGEREF _Toc454294267 h 18 HYPERLINK l _Toc454294268 4.1.登錄 PAGEREF _Toc454294268 h 18 HYPERLINK l _Toc454294269 4.2.編譯節(jié)點使用 PAGEREF _Toc454294269 h 19 HYPERLINK l _Toc454294270 4.3.提交任務(wù) P

8、AGEREF _Toc454294270 h 21 HYPERLINK l _Toc454294271 4.3.1wrf應(yīng)用提交 PAGEREF _Toc454294271 h 21 HYPERLINK l _Toc454294272 4.3.2matlab應(yīng)用提交 PAGEREF _Toc454294272 h 23 HYPERLINK l _Toc454294273 4.3.3通用作業(yè)提交 PAGEREF _Toc454294273 h 25 HYPERLINK l _Toc454294274 4.3.4blastx作業(yè)提交 PAGEREF _Toc454294274 h 26 HYPER

9、LINK l _Toc454294275 4.3.5并行通用作業(yè)提交 PAGEREF _Toc454294275 h 28 HYPERLINK l _Toc454294276 4.4.作業(yè)管理使用 PAGEREF _Toc454294276 h 30 HYPERLINK l _Toc454294277 4.5.分享組管理使用 PAGEREF _Toc454294277 h 39 HYPERLINK l _Toc454294278 4.6.會話管理 PAGEREF _Toc454294278 h 40 HYPERLINK l _Toc454294279 4.7.集群監(jiān)控 PAGEREF _Toc

10、454294279 h 41 HYPERLINK l _Toc454294280 4.8.數(shù)據(jù)管理 PAGEREF _Toc454294280 h 49 HYPERLINK l _Toc454294281 3.9.注銷 PAGEREF _Toc454294281 h 57 HYPERLINK l _Toc454294282 第四章軟件安裝列表 PAGEREF _Toc454294282 h 57 HYPERLINK l _Toc454294283 第五章注意事項 PAGEREF _Toc454294283 h 57 HYPERLINK l _Toc454294284 5.1支持的瀏覽器版本 P

11、AGEREF _Toc454294284 h 57 HYPERLINK l _Toc454294285 5.2jre的版本 PAGEREF _Toc454294285 h 57 HYPERLINK l _Toc454294286 5.3上傳下載打不開的原因 PAGEREF _Toc454294286 h 57 HYPERLINK l _Toc454294287 5.4用戶名登錄失敗的原因 PAGEREF _Toc454294287 h 57 HYPERLINK l _Toc454294288 5.5管理員聯(lián)系方式 PAGEREF _Toc454294288 h 58第一章高算平臺介紹高性能計算

12、平臺有106臺計算節(jié)點、2臺胖節(jié)點、1臺GPU節(jié)點組成,外加1PB的數(shù)據(jù)存儲。各個服務(wù)器的配置信息如下:服務(wù)器Cpu內(nèi)存計算節(jié)點2顆Intel Xeon E5-2680 V3總共24 核,2.5GHZ64GB DDR4 2133 ECC內(nèi)存胖節(jié)點4顆Intel Xeon E7-4850 V3供 56核,2.2GHZ1024GB DDR4 2133 ECC內(nèi)存GPU節(jié)點2顆Intel Xeon E5-2640 v3共16核,2.6GHZ64GBDDR4 2133 ECC內(nèi)存第二章命令行使用方式編譯的登陸方式Windows用戶訪問方式:可以通過第三方工具(xshell、putty等)登陸高算平臺,

13、xshell的登陸方式如下圖所示:輸入用戶名密碼直接登陸:Linux和mac的登陸方式:直接在terminal終端上輸入:ssh HYPERLINK mailto:username06 username06輸入密碼登陸。數(shù)據(jù)上傳方式可以通過ftp和第三方工具winscp或者sftp的方式登陸。景行資源管理與調(diào)度軟件簡單介紹云計算資源管理:景行資源管理與調(diào)度軟件可以將網(wǎng)絡(luò)上的多個異構(gòu)的計算機(jī)、集群資源整合為一個應(yīng)用服務(wù)平臺。應(yīng)用程序不再局限于個人工作站的資源,也不需要為了使用應(yīng)用服務(wù)平臺的資源而改動程序,只需要一些簡單的腳本和命令就能使應(yīng)用程序使用到應(yīng)用服務(wù)平臺上的計算資源。并且景行資源管理與調(diào)

14、度軟件還可以根據(jù)主機(jī)的負(fù)載條件和應(yīng)用程序的資源需求在整個應(yīng)用服務(wù)平臺中選擇最合適的計算資源。景行資源管理與調(diào)度軟件不僅可以管理物理計算資源,還可以通過與虛擬機(jī)管理系統(tǒng)集成管理主流的虛擬機(jī)計算資源(VMware、XEN和KVM等)。這些虛擬計算資源在啟動時自動加入景行資源管理與調(diào)度軟件應(yīng)用服務(wù)平臺,停止后自動退出平臺。執(zhí)行作業(yè):對于景行資源管理與調(diào)度軟件管理的應(yīng)用服務(wù)系統(tǒng),遠(yuǎn)程執(zhí)行作業(yè)的行為和在本機(jī)上執(zhí)行作業(yè)是一樣的。對于用戶而言是透明的,即使是復(fù)雜的終端交互控制作業(yè),也好像作業(yè)是在本地執(zhí)行似的。當(dāng)作業(yè)獲得所需要的軟硬件資源或應(yīng)用服務(wù)系統(tǒng)負(fù)載較輕時,景行資源管理與調(diào)度軟件會根據(jù)策略自動執(zhí)行作業(yè)。

15、在應(yīng)用服務(wù)系統(tǒng)中,景行資源管理與調(diào)度軟件對作業(yè)的可以進(jìn)行完全控制,可以根據(jù)資源負(fù)載情況將作業(yè)掛起和恢復(fù)執(zhí)行。景行資源管理與調(diào)度軟件可以以交互式作業(yè)或批處理作業(yè)的形式執(zhí)行串行的或并行的應(yīng)用程序。當(dāng)作業(yè)在一組負(fù)載較輕或空閑的資源上執(zhí)行時,作業(yè)的執(zhí)行效率會大大提高。管理應(yīng)用:對于景行資源管理與調(diào)度軟件管理的應(yīng)用服務(wù)系統(tǒng),用戶可以運(yùn)行本地工作站上沒有的軟件。例如,可以在配置較低的桌面機(jī)上運(yùn)行只能在高端服務(wù)器上才有的CAD工具。作業(yè)實際運(yùn)行在后臺高端服務(wù)器上,但其執(zhí)行過程和結(jié)果完全透明地展示在桌面機(jī)上??刂葡到y(tǒng)資源的訪問:對于景行資源管理與調(diào)度軟件管理的應(yīng)用服務(wù)系統(tǒng),系統(tǒng)管理員可以輕易地控制資源的訪問,

16、例如:誰可以提交作業(yè),這些作業(yè)可以使用哪些主機(jī);某個用戶或者某個用戶組最多可以同時執(zhí)行多少個作業(yè),最多可以使用多少計算資源;提交到指定隊列的作業(yè)的資源限制;每個計算單元可執(zhí)行作業(yè)的時間窗口;在某種負(fù)載條件下指定的計算單元可以接收作業(yè)或者掛起一些低優(yōu)先級的作業(yè)。資源和作業(yè)記賬:景行資源管理與調(diào)度軟件提供了資源和作業(yè)記賬的機(jī)制。這些信息可以幫助管理員清晰的描繪出資源的使用情況,以及系統(tǒng)在一天或者一周內(nèi)的負(fù)載情況,同時幫助管理員確定是否有資源過載情況發(fā)生,為系統(tǒng)擴(kuò)展或者升級提供詳盡的數(shù)據(jù)支持。應(yīng)用:絕大多數(shù)應(yīng)用可以通過景行資源管理與調(diào)度軟件的接口訪問景行資源管理與調(diào)度軟件管理的應(yīng)用服務(wù)系統(tǒng)。并且絕大

17、多數(shù)應(yīng)用不需要直接和景行資源管理與調(diào)度軟件交互,也不需要為了使用景行資源管理與調(diào)度軟件管理的應(yīng)用服務(wù)器系統(tǒng)而修改程序。幾乎所有的Linux/Unix或者Windows的命令和第三方應(yīng)用程序都可以使用景行資源管理與調(diào)度軟件管理的應(yīng)用服務(wù)系統(tǒng)。容錯:一旦有計算請求,景行資源管理與調(diào)度軟件通過高效的策略尋找計算資源,并保證計算請求被派發(fā)并且執(zhí)行。只要在應(yīng)用服務(wù)系統(tǒng)中還有一個服務(wù)器在運(yùn)行,景行資源管理與調(diào)度軟件就能繼續(xù)接收計算請求。如果計算請求執(zhí)行失敗,景行資源管理與調(diào)度軟件會把計算請求重新派發(fā)到另一個滿足資源需求的可用服務(wù)器上執(zhí)行。景行資源管理與調(diào)度軟件將整個應(yīng)用服務(wù)系統(tǒng)的狀態(tài)保存在文件數(shù)據(jù)庫中。只

18、要該事務(wù)文件可訪問,景行資源管理與調(diào)度軟件保證執(zhí)行所有的計算請求。還可以為該事務(wù)文件設(shè)置鏡像備份,以保證當(dāng)主文件服務(wù)器停止工作時,景行資源管理與調(diào)度軟件可以根據(jù)鏡像的事務(wù)文件執(zhí)行操作,從而提供了額外的容錯能力。異構(gòu)系統(tǒng)的支持:景行資源管理與調(diào)度軟件是架構(gòu)在操作系統(tǒng)之上的中間件。其架構(gòu)使得景行資源管理與調(diào)度軟件非常容易支持不同的操作系統(tǒng)。景行資源管理與調(diào)度軟件不僅僅支持Unix、Linux和Windows,還支持Unix/Linux和Windows之間的互操作。檢查點和遷移:景行資源管理與調(diào)度軟件支持所有提供內(nèi)核級檢查點的操作系統(tǒng)。這種方法對應(yīng)用程序是透明的,應(yīng)用程序不需要改變?nèi)魏未a或重新與檢

19、查點的函數(shù)庫進(jìn)行鏈接。對于那些沒有內(nèi)核級檢查點的操作系統(tǒng),景行資源管理與調(diào)度軟件提供用戶級的檢查點函數(shù)庫供應(yīng)用程序使用。景行資源管理與調(diào)度軟件擁有開放的檢查點接口,可以支持任何類型的檢查點功能(應(yīng)用,用戶或者系統(tǒng)級別的)。一旦作業(yè)被設(shè)置檢查點,它就能夠在線地被遷移到其他計算資源上,比如計算能力較高的計算資源。并行處理:景行資源管理與調(diào)度軟件支持PVM(Parallel Virtual Machine)和MPI(Message Passing Interface)。景行資源管理與調(diào)度軟件是資源的分配者和管理者,為每個并行模塊找到最佳的主機(jī)。調(diào)度策略:景行資源管理與調(diào)度軟件提供了高效的調(diào)度策略來管

20、理應(yīng)用服務(wù)系統(tǒng)。用戶可以根據(jù)不同的需要使用不同的策略,例如可以在隊列級別設(shè)置公平共享策略來管理對計算資源的需求沖突。景行資源管理與調(diào)度軟件還有許多其它隊列級別的策略,如基本的先來先服務(wù)、搶占式和獨占式等等。其中在景行資源管理與調(diào)度軟件3.0中還提供了虛擬機(jī)調(diào)度策略以及基于數(shù)據(jù)庫開放的調(diào)度框架。資源預(yù)留:某個作業(yè)或者隊列強(qiáng)制預(yù)留資源。資源預(yù)留保證了正在運(yùn)行的作業(yè)有足夠的資源可用(在作業(yè)執(zhí)行時它的資源需求會發(fā)生變化,使用資源預(yù)留可減輕作業(yè)需求資源不夠的問題)。作業(yè)記賬:應(yīng)用服務(wù)系統(tǒng)記錄作業(yè)的大量信息,比如說:提交節(jié)點和執(zhí)行節(jié)點;提交、派發(fā)、執(zhí)行和結(jié)束時間;執(zhí)行作業(yè)的資源開銷;CPU時間、作業(yè)整體周

21、轉(zhuǎn)時間和自然時間等;所有這些數(shù)據(jù)都存儲在一個作業(yè)記賬文件中。作業(yè)數(shù)組:作業(yè)數(shù)組延伸了作業(yè)的概念。作業(yè)從一個單輸入文件、單例執(zhí)行的應(yīng)用程序延伸為多輸入文件、多例執(zhí)行的應(yīng)用程序。許多現(xiàn)實世界的問題,如渲染一個動畫場景或者在數(shù)據(jù)轉(zhuǎn)換時,都需要輸入不同的數(shù)據(jù)來多次執(zhí)行同一應(yīng)用程序。使用景行資源管理與調(diào)度軟件的作業(yè)數(shù)組允許用戶提交單個作業(yè),而該作業(yè)可以使用不同的輸入數(shù)據(jù)來多次執(zhí)行一個應(yīng)用程序。交互式作業(yè):交互式作業(yè)允許景行資源管理與調(diào)度軟件管理員使用后臺作業(yè)的策略來使用交互式命令。典型的后臺作業(yè)會將stdin/stdout/stderr重定向到文件中,而交互式作業(yè)則將stdin/stdout/stder

22、r重定向到終端會話中??蓴U(kuò)展性:景行資源管理與調(diào)度軟件具有很強(qiáng)的可擴(kuò)展性,它的單個應(yīng)用集群可以支持多達(dá)1000個節(jié)點。景行資源管理與調(diào)度軟件的可擴(kuò)展性包含以下三方面:一個集群中的節(jié)點數(shù)可以達(dá)到1000個以上單個并行作業(yè)可以使用2048個核作業(yè)吞吐量,每天可以處理5萬個作業(yè)共享資源:共享資源是指景行資源管理與調(diào)度軟件管理集群中所有節(jié)點上的可用資源。共享資源是一種在集群中所有機(jī)器上或者某一些機(jī)器上可用的資源,而且這些資源可以在機(jī)器組之間共享。應(yīng)用軟件的浮動許可證是共享資源的一個典型應(yīng)用。浮動許可證是一種網(wǎng)絡(luò)上的共享資源,任何安裝有該軟件的機(jī)器都可以申請一個許可證來執(zhí)行該軟件。景行資源管理與調(diào)度軟件

23、可以保證在作業(yè)派發(fā)到執(zhí)行節(jié)點時該作業(yè)可以獲得許可證,從而使得該浮動許可證資源得到最大化的利用。并行作業(yè)的處理器預(yù)留:在同一個景行資源管理與調(diào)度軟件集群中執(zhí)行并行應(yīng)用和普通應(yīng)用程序時,因為普通作業(yè)只需要一個CPU而并行程序需要等待多個空閑的CPU,所以并行程序所需要的CPU總被普通應(yīng)用程序先占用。并行作業(yè)處理器預(yù)留功能則允許并行作業(yè)在排隊期間將空閑的處理器(作業(yè)slots)預(yù)留一段時間而不被其它的作業(yè)使用。Job Starter:每一個景行資源管理與調(diào)度軟件隊列都可以配置一個Job Starter。Job Starter是一個腳本或者是可執(zhí)行程序,用來創(chuàng)建作業(yè)執(zhí)行的環(huán)境。通過Job Starte

24、r,景行資源管理與調(diào)度軟件管理員可以自定義作業(yè)執(zhí)行的環(huán)境。例如:配置輸入/輸出緩存和重定向在Fluent環(huán)境下執(zhí)行作業(yè)可配置的作業(yè)控制方式:景行資源管理與調(diào)度軟件的作業(yè)控制改變作業(yè)在系統(tǒng)中的狀態(tài)。通常情況下,作業(yè)先進(jìn)入PEND狀態(tài),然后進(jìn)入RUN狀態(tài),完成后顯示DONE狀態(tài)。有時在作業(yè)的生命周期內(nèi),作業(yè)被系統(tǒng)掛起進(jìn)入SSUSP狀態(tài),或者被用戶掛起而進(jìn)入USUSP狀態(tài)。景行資源管理與調(diào)度軟件提供給管理員配置作業(yè)控制時所觸發(fā)的動作,當(dāng)作業(yè)改變狀態(tài)時,這些自定義的觸發(fā)動作將被執(zhí)行。CPU Binding:景行資源管理與調(diào)度軟件3.0提供了CPU binding的功能。旨在增加CPU緩存的命中率,并且

25、適合time-sensitive應(yīng)用。CPU之間是不能共享緩存的,在作業(yè)調(diào)度過程中,會出現(xiàn)多個進(jìn)程在各個CPU間頻繁切換,需要不斷的使舊CPU的Cache失效。如果進(jìn)程只在某個CPU上執(zhí)行,則不會出現(xiàn)失效的情況。在多個線程操作相同數(shù)據(jù)的情況下,如果把這些線程調(diào)度到一個處理器上,大大地增加了CPU緩存的命中率。在real-time或time-sensitive應(yīng)用中,可以將系統(tǒng)進(jìn)程綁定到某些CPU上,把應(yīng)用進(jìn)程綁定到剩余的CPU上,合理使用CPU資源。CPU binding功能增強(qiáng)了景行資源管理與調(diào)度軟件對CPU資源的管理能力和合理利用能力。User Mapping:景行資源管理與調(diào)度軟件3.1

26、及以上版本支持該功能。景行資源管理與調(diào)度軟件提供作業(yè)的提交和執(zhí)行等一系列操作,但是這些作業(yè)只能在存在該作業(yè)提交用戶的節(jié)點上執(zhí)行,如果不存在提交作業(yè)的用戶,這個作業(yè)就不能正常執(zhí)行。目前景行資源管理與調(diào)度軟件可以使用多個用戶提交作業(yè)到Windows節(jié)點,指定作業(yè)在Windows節(jié)點上運(yùn)行時的執(zhí)行用戶EXEC_USER。用戶通過設(shè)置環(huán)境變量WIN_USER_MAPPING=username,從而mapping到Windows上存在的用戶?,F(xiàn)在只對執(zhí)行在Windows上的作業(yè)實現(xiàn)user mapping的功能,非Windows節(jié)點的作業(yè)mapping不起作用?;跀?shù)據(jù)庫的調(diào)度框架:景行資源管理與調(diào)度軟

27、件提供了開放的基于數(shù)據(jù)庫的調(diào)度框架。用戶可以根據(jù)該框架的要求,定義設(shè)置調(diào)度策略,從而更高效地利用集群的資源,實現(xiàn)對調(diào)度策略的深度定制。虛擬機(jī)調(diào)度:景行資源管理與調(diào)度軟件提供了虛擬機(jī)調(diào)度功能,主要是為了解決用戶集群環(huán)境中Windows節(jié)點過少,Windows資源不能滿足大量Windows應(yīng)用執(zhí)行的問題。通過在KVM服務(wù)器節(jié)點上創(chuàng)建Windows虛擬機(jī),在Windows應(yīng)用作業(yè)調(diào)度的時候,將在KVM服務(wù)器上啟動適合應(yīng)用運(yùn)行的Windows虛擬機(jī),會分配給Windows虛擬機(jī)滿足作業(yè)執(zhí)行的cpu數(shù)和內(nèi)存量,從而完成Windows應(yīng)用作業(yè)的執(zhí)行,當(dāng)應(yīng)用作業(yè)執(zhí)行完畢后,虛擬機(jī)自動關(guān)閉,分配的資源歸還給K

28、VM服務(wù)器,這樣也不會占用KVM服務(wù)器的資源使用。GPU調(diào)度:景行資源管理與調(diào)度軟件提供了GPU調(diào)度功能,該功能會自動檢測節(jié)點GPU信息,并將GPU信息管理起來,用于調(diào)度使用。GPU調(diào)度支持兩種模式,分別是基礎(chǔ)GPU調(diào)度和BIND GPU調(diào)度,基礎(chǔ)GPU調(diào)度是用戶可以將GPU定義為資源,再寫一個用來收集該自定義資源的ELIM腳本,這樣就可以將GPU作為一種資源來調(diào)度。BIND GPU調(diào)度是以基礎(chǔ)GPU調(diào)度為基礎(chǔ),添加了給作業(yè)綁定GPU的功能,使作業(yè)獨占被分配到的GPU。并行作業(yè)管理器(PJM:Parallel Job Manager):主要功能是收集并行作業(yè)在各執(zhí)行節(jié)點所使用的資源信息,如me

29、m、swap、pid、及cputime等,使作業(yè)展示的信息更具體、更詳細(xì)。對于MPI和某些商業(yè)軟件異常退出不能全部清理TASK的問題也提供了解決方案。現(xiàn)在對于并行作業(yè)主要是針對自研程序和商業(yè)程序的集成。自研MPI程序主要是與MPI集成,收集MPI各TASK在執(zhí)行節(jié)點上使用的資源信息。商業(yè)軟件現(xiàn)在僅支持Fluent14.5,后續(xù)版本會支持更多的商業(yè)軟件。Windows自動同步集群信息:自動同步集群信息功能主要提供了Windows節(jié)點自動同步集群配置信息及新添加的用戶信息,當(dāng)Windows節(jié)點正確安裝景行資源管理與調(diào)度軟件并設(shè)置成系統(tǒng)服務(wù)啟動時,該節(jié)點會自動同步并更新集群配置文件。用戶賬戶信息及密

30、碼信息通過jhpasswd命令和主節(jié)點進(jìn)行同步并更新,以確保Windows節(jié)點配置信息和集群保持一致,并使Windows節(jié)點能正確識別新添加的用戶信息,以增強(qiáng)景行資源管理與調(diào)度軟件在Windows平臺安裝。景行資源管理調(diào)度命令行使用方式單節(jié)點單核、多核任務(wù)的提交方式:命令:nodesub cpu_core “command_exec”參數(shù)解析:cpu_core:指提交作業(yè)運(yùn)行的cpu核數(shù)command_exec:指提交作業(yè)的可執(zhí)行腳本或者可運(yùn)行命令。如果是可執(zhí)行腳本做好寫全路徑。列子:nodesub 1 ./run_test.sh ; nodesub 1 “sleep100”每個作業(yè)運(yùn)行完后會

31、生成一個output_jobid.txt的輸出文件。單節(jié)點單核、多核并且程序需要的內(nèi)存大于60G 任務(wù)的提交方式:提交命令:smpsub cpu_core “command_exec”參數(shù)解析:cpu_core:指提交作業(yè)運(yùn)行的cpu核數(shù)command_exec:指提交作業(yè)的可執(zhí)行腳本或者可運(yùn)行命令。如果是可執(zhí)行腳本做好寫全路徑。列子:smpsub 1 ./run_test.sh ; smpsub 1 “sleep 100”每個作業(yè)運(yùn)行完后會生成一個output_jobid.txt的輸出文件。多節(jié)點多核任務(wù)的提交方式(mpirun):提交命令:parasub cpu_core“command_

32、exec”參數(shù)解析:cpu_core:指提交作業(yè)運(yùn)行的cpu核數(shù)command_exec:指提交作業(yè)的可執(zhí)行腳本或者可運(yùn)行命令。如果是可執(zhí)行腳本做好寫全路徑。列子:parasub24./run_test.sh ; parasub24sleep 100每個作業(yè)運(yùn)行完后會生成一個output_jobid.txt的輸出文件。ncl的提交方式提交命令:nclsub cpu_core“command_exec”參數(shù)解析:cpu_core:指提交作業(yè)運(yùn)行的cpu核數(shù)command_exec:指提交作業(yè)的可執(zhí)行腳本或者可運(yùn)行命令。如果是可執(zhí)行腳本做好寫全路徑。列子:nclsub1./run_test.sh

33、; nclsub1sleep 100每個作業(yè)運(yùn)行完后會生成一個output_jobid.txt的輸出文件。wrf作業(yè)提交方式提交命令:wrfsub cpu_core“command_exec”參數(shù)解析:cpu_core:指提交作業(yè)運(yùn)行的cpu核數(shù)command_exec:指提交作業(yè)的可執(zhí)行腳本或者可運(yùn)行命令。如果是可執(zhí)行腳本做好寫全路徑。列子:wrfsub 24 ./wrf.exe ; wrfsub 24 ./real.exe每個作業(yè)運(yùn)行完后會生成一個output_jobid.txt的輸出文件。cfs作業(yè)提交方式提交命令:cfssub cpu_core“command_exec”參數(shù)解析:cp

34、u_core:指提交作業(yè)運(yùn)行的cpu核數(shù)command_exec:指提交作業(yè)的可執(zhí)行腳本或者可運(yùn)行命令。如果是可執(zhí)行腳本做好寫全路徑。列子:cfssub24./cfs_test.sh每個作業(yè)運(yùn)行完后會生成一個output_jobid.txt的輸出文件。cesm作業(yè)提交方式提交命令:cesmsub cpu_core“command_exec”參數(shù)解析:cpu_core:指提交作業(yè)運(yùn)行的cpu核數(shù)command_exec:指提交作業(yè)的可執(zhí)行腳本或者可運(yùn)行命令。如果是可執(zhí)行腳本做好寫全路徑。列子:cesmsub 24 ./cesm_test.sh每個作業(yè)運(yùn)行完后會生成一個output_jobid.t

35、xt的輸出文件。指定作業(yè)運(yùn)行的內(nèi)存限制(單節(jié)點多核任務(wù))提交命令:memlimitsubcpu_core mem_limit“command_exec”參數(shù)解析:cpu_core:指提交作業(yè)運(yùn)行的cpu核數(shù)mem_limit:指提交作業(yè)申請的內(nèi)存大小,單位為kb,如1048576=1Gcommand_exec:指提交作業(yè)的可執(zhí)行腳本或者可運(yùn)行命令。如果是可執(zhí)行腳本做好寫全路徑。列子:memlimitsub 24 1048576./run_test.sh每個作業(yè)運(yùn)行完后會生成一個output_jobid.txt的輸出文件。小作業(yè)提交方式正在規(guī)劃中,在后期采購胖節(jié)點時會增加該方面的內(nèi)容。景行調(diào)度作

36、業(yè)管理提交作業(yè)請查看景行資源管理與調(diào)度軟件命令使用手冊第二章的2.1節(jié)jsub使用方式。查看作業(yè)信息請查看景行資源管理與調(diào)度軟件命令使用手冊第二章的2.2節(jié)jjobs使用方式。作業(yè)控制請查看景行資源管理與調(diào)度軟件命令使用手冊第二章的2.4節(jié)jctrl使用方式。查看作業(yè)歷史請查看景行資源管理與調(diào)度軟件命令使用手冊第二章的2.5節(jié)jhist使用方式。修改作業(yè)信息請查看景行資源管理與調(diào)度軟件命令使用手冊第二章的2.3節(jié)jmod使用方式。其他各種命令請參考“景行資源管理與調(diào)度軟件命令使用手冊”。第三章景行資源管理調(diào)度WEB頁面使用方式3.1 jre安裝介紹jre主要是用來做文件的上傳、下載。是景行公司

37、開發(fā)的ftp上傳工具,依托于java的applet,可以上傳幾十G的大文件,并且可以實現(xiàn)斷點續(xù)傳。訪問/appform/login進(jìn)入高算平臺的登錄頁面,在頁面上下載jhapp的插件,并安裝。3.2 vncviewer安裝介紹為了實現(xiàn)任務(wù)的圖形可視化,景行公司借助于第三方的開源工具,實現(xiàn)程序的二維圖形傳遞。第四章高算平臺使用登錄訪問/appform/login進(jìn)入高算平臺的登錄頁面,如下:輸入用戶名密碼登錄,登錄進(jìn)去的主頁面如下:編譯節(jié)點使用用戶可以在編譯節(jié)點上做軟件的編譯安裝,還可以修改自己的代碼和源程序。編譯節(jié)點的訪問方式:在登錄主頁面點擊(單擊)Terminal的圖標(biāo)。系統(tǒng)會自動啟動編譯

38、節(jié)點的Terminal到本地窗口,如下所示窗口。在該窗口中可以修改代碼、編譯軟件等等。該窗口和本地的窗口一樣如果關(guān)閉,需要重新啟動一個。下次登錄時可以在“會話管理”中鏈接該Terminal。提交任務(wù)wrf應(yīng)用提交在登錄的主頁面可以直接點擊WRF的圖標(biāo),點擊之后會彈出WRF的提交頁面,如下:項目:默認(rèn)是default,不用該修改。作業(yè)名:記錄您當(dāng)前任務(wù)的名稱,方便查找。namelist文件名:real、wrf運(yùn)行時的namelist.input文件。wps預(yù)處理文件:WPS預(yù)處理后的文件。CPU個數(shù):當(dāng)前提交任務(wù)的cpu核數(shù)。軟件版本:real、wrf的軟件版本??蓤?zhí)行程序:real、wrf。設(shè)

39、置完參數(shù)后點擊“提交作業(yè)”,提交完之后頁面會自動進(jìn)入到作業(yè)的詳細(xì)信息頁面,如下:在該頁面是提交任務(wù)的臨時工作區(qū),在該頁面可以點擊“刷新”按鈕查看作業(yè)狀態(tài)。作業(yè)運(yùn)行過程中產(chǎn)生的“中間臨時文件”、“結(jié)果文件”都會存放在當(dāng)前目錄下。運(yùn)算完成后可以在該頁面下載所需要的文件?!霸敿?xì)信息”欄如下所示,該頁面可以查看作業(yè)執(zhí)行的臨時目錄等等??梢渣c擊“查看作業(yè)輸出”查看作業(yè)運(yùn)行過程中屏幕輸出。matlab應(yīng)用提交在登錄的主頁面可以直接點擊Matlab的圖標(biāo),點擊之后會彈出matlab的提交頁面,如下:項目:默認(rèn)是default,不用該修改。作業(yè)名:記錄您當(dāng)前任務(wù)的名稱,方便查找。*輸入.m文件:matlab運(yùn)

40、行時的主程序文件。其他計算文件:matlab依賴的其他函數(shù)文件、或者庫文件。其他選項:指的是matlab提交的其他輸入?yún)?shù)。CPU個數(shù):當(dāng)前提交任務(wù)的cpu核數(shù)。版本:real、wrf的軟件版本。圖形界面支持:可以監(jiān)控任務(wù)運(yùn)行的過程。設(shè)置完參數(shù)后點擊“提交作業(yè)”,提交完之后頁面會自動進(jìn)入到作業(yè)的詳細(xì)信息頁面,如下:在該頁面是提交任務(wù)的臨時工作區(qū),在該頁面可以點擊“刷新”按鈕查看作業(yè)狀態(tài)。作業(yè)運(yùn)行過程中產(chǎn)生的“中間臨時文件”、“結(jié)果文件”都會存放在當(dāng)前目錄下。運(yùn)算完成后可以在該頁面下載所需要的文件。如果在提交任務(wù)時選擇了“圖形界面支持”,可以點擊“打開應(yīng)用圖形”的按鈕,會彈出作業(yè)運(yùn)行過程中的圖形

41、窗口。如下:“詳細(xì)信息”欄如下所示,該頁面可以查看作業(yè)執(zhí)行的臨時目錄等等??梢渣c擊“查看作業(yè)輸出”查看作業(yè)運(yùn)行過程中屏幕輸出。通用作業(yè)提交在登錄的主頁面可以直接點擊通用作業(yè)提交的圖標(biāo),點擊之后會彈出通用作業(yè)的提交頁面,如下:項目:默認(rèn)是default,不用該修改。作業(yè)名:記錄您當(dāng)前任務(wù)的名稱,方便查找。可執(zhí)行文件:real、wrf運(yùn)行時的namelist.input文件。命令行參數(shù):WPS預(yù)處理后的文件。其他計算文件:程序依賴的其他文件和庫文件。CPU個數(shù):當(dāng)前提交任務(wù)的cpu核數(shù)。設(shè)置完參數(shù)后點擊“提交作業(yè)”,提交完之后頁面會自動進(jìn)入到作業(yè)的詳細(xì)信息頁面,如下:在該頁面是提交任務(wù)的臨時工作區(qū)

42、,在該頁面可以點擊“刷新”按鈕查看作業(yè)狀態(tài)。作業(yè)運(yùn)行過程中產(chǎn)生的“中間臨時文件”、“結(jié)果文件”都會存放在當(dāng)前目錄下。運(yùn)算完成后可以在該頁面下載所需要的文件?!霸敿?xì)信息”欄如下所示,該頁面可以查看作業(yè)執(zhí)行的臨時目錄等等??梢渣c擊“查看作業(yè)輸出”查看作業(yè)運(yùn)行過程中屏幕輸出。blastx作業(yè)提交在登錄的主頁面可以直接點擊Blastx的圖標(biāo),點擊之后會彈出Blastx的提交頁面,如下:項目:默認(rèn)是default,不用該修改。作業(yè)名:記錄您當(dāng)前任務(wù)的名稱,方便查找。算例文件:Blastx的算例文件。其他計算文件:程序依賴的其他文件和庫文件。CPU個數(shù):當(dāng)前提交任務(wù)的cpu核數(shù)。命令行參數(shù):blastx提

43、交的其他命令行參數(shù)。設(shè)置完參數(shù)后點擊“提交作業(yè)”,提交完之后頁面會自動進(jìn)入到作業(yè)的詳細(xì)信息頁面,如下:在該頁面是提交任務(wù)的臨時工作區(qū),在該頁面可以點擊“刷新”按鈕查看作業(yè)狀態(tài)。作業(yè)運(yùn)行過程中產(chǎn)生的“中間臨時文件”、“結(jié)果文件”都會存放在當(dāng)前目錄下。運(yùn)算完成后可以在該頁面下載所需要的文件?!霸敿?xì)信息”欄如下所示,該頁面可以查看作業(yè)執(zhí)行的臨時目錄等等??梢渣c擊“查看作業(yè)輸出”查看作業(yè)運(yùn)行過程中屏幕輸出。并行通用作業(yè)提交在登錄的主頁面可以直接點擊并行通用作業(yè)提交的圖標(biāo),點擊之后會彈出并行通用作業(yè)提交的提交頁面,如下:項目:默認(rèn)是default,不用該修改。作業(yè)名:記錄您當(dāng)前任務(wù)的名稱,方便查找??蓤?zhí)

44、行文件:并行的可執(zhí)行腳本。其他計算文件:程序依賴的其他文件和庫文件。CPU個數(shù):輸入您需要的cpu核數(shù)??蓤?zhí)行腳本編寫的要求:腳本需要接受一個參數(shù),如果是bash腳本的話使用$1獲取該參數(shù)。參數(shù)為mpirun -n $1的參數(shù)腳本中需要source自己的環(huán)境變量。下面給出一個例子供大家參考:mpirun -n $1 -f ./.hostfile.txt -bootstrap ssh 應(yīng)用程序。$1是獲取的參數(shù),必須被定義,后面的應(yīng)用程序是自己的主程序。設(shè)置完參數(shù)后點擊“提交作業(yè)”,提交完之后頁面會自動進(jìn)入到作業(yè)的詳細(xì)信息頁面,如下:在該頁面是提交任務(wù)的臨時工作區(qū),在該頁面可以點擊“刷新”按鈕查

45、看作業(yè)狀態(tài)。作業(yè)運(yùn)行過程中產(chǎn)生的“中間臨時文件”、“結(jié)果文件”都會存放在當(dāng)前目錄下。運(yùn)算完成后可以在該頁面下載所需要的文件?!霸敿?xì)信息”欄如下所示,該頁面可以查看作業(yè)執(zhí)行的臨時目錄等等??梢渣c擊“查看作業(yè)輸出”查看作業(yè)運(yùn)行過程中屏幕輸出。作業(yè)管理使用作業(yè)管理主要是指查看作業(yè)信息、掛起作業(yè)、繼續(xù)作業(yè)、終止作業(yè)四個功能。還可以按作業(yè)號、狀態(tài)、隊列、提交時間、執(zhí)行節(jié)點、作業(yè)名對作業(yè)進(jìn)行排序。管理員可以在作業(yè)管理頁面查看到所有用戶的作業(yè),并對這些作業(yè)進(jìn)行操作。而其他用戶僅能在該頁面上查看到自己提交的作業(yè)。作業(yè)管理頁面如圖4-2-1所示:圖4-2-1作業(yè)管理頁面作業(yè)管理頁面上顯示了以下元素:作業(yè)號:默認(rèn)

46、顯示;狀態(tài):默認(rèn)顯示,其中作業(yè)的狀態(tài)包含有:RUN、PEND、PSUSP、USUSP、SSUSP、ZOMBI、UNKWN、DONE、EXIT;隊列:默認(rèn)顯示,顯示作業(yè)運(yùn)行的隊列名稱;用戶:默認(rèn)顯示,顯示作業(yè)的執(zhí)行用戶;提交時間:默認(rèn)顯示;執(zhí)行節(jié)點:默認(rèn)顯示;作業(yè)槽數(shù):默認(rèn)顯示;執(zhí)行時間:默認(rèn)未顯示,可從“顯示/隱藏列”中選擇顯示該列,顯示的是作業(yè)執(zhí)行的時間點;結(jié)束時間:默認(rèn)未顯示,可從“顯示/隱藏列”中選擇顯示該列,顯示的是作業(yè)執(zhí)行完成的時間點;項目:默認(rèn)顯示。當(dāng)景行應(yīng)用門戶軟件集成了景行安全控制軟件,顯示該列,反之未集成,就不顯示該選項。作業(yè)管理頁面對每一列提供了過濾設(shè)置,并支持個性化手動設(shè)

47、置過濾條件。用戶可以通過在每一列右邊的漏斗狀圖標(biāo),就可以進(jìn)行每一列元素的過濾。這些過濾條件會自動保存起來,下次訪問該頁面的時候,會執(zhí)行自己設(shè)置的過濾條。其中每一列的過濾條件有:作業(yè)號:提供等于、大于、和小于三個過濾條件。過濾展開框如圖4-2-2所示:圖4-2-2 作業(yè)號過濾框(作業(yè)管理頁面)狀態(tài):提供等于、不等于兩個過濾條件,并提供一個選擇框選擇不同狀態(tài)與兩個過濾條件組合使用。過濾展開框如圖4-2-3所示:圖4-2-3狀態(tài)過濾框(作業(yè)管理頁面)隊列:提供等于、不等于、包含和不包含四個過濾條件。過濾展開框如圖4-2-4所示:圖4-2-4 隊列過濾框(作業(yè)管理頁面)用戶:作業(yè)的執(zhí)行用戶。提供等于、

48、不等于、包含和不包含四個過濾條件。過濾展開框如圖4-2-5所示:圖4-2-5 用戶過濾框(作業(yè)管理頁面)執(zhí)行節(jié)點:未提供過濾設(shè)置,僅提供排序功能。作業(yè)槽數(shù):提供等于和不等于兩個過濾提交,進(jìn)行過濾。過濾框如圖4-2-6所示:圖4-2-6 作業(yè)槽數(shù)過濾框(作業(yè)管理頁面)提交時間:提供大于和小于兩個過濾提交,同時選擇時間點,進(jìn)行過濾。過濾框如圖4-2-7所示:圖4-2-7 提交時間過濾框(作業(yè)管理頁面)項目:提供等于、不等于、包含和不包含四個過濾條件。項目列的顯示與是否集成了景行安全控制軟件有關(guān)。若集成了景行安全控制軟件,會顯示該列,反之不顯示。過濾框如圖4-2-8所示:圖4-2-8 項目過濾框(作

49、業(yè)管理頁面)作業(yè)管理還提供了“作業(yè)執(zhí)行時間”和“作業(yè)結(jié)束時間”的過濾設(shè)置,默認(rèn)是隱藏的。點擊作業(yè)管理列表右上角的“顯示/隱藏列”,會顯示出隱藏的列。如圖4-2-9所示:圖4-2-9 顯示/隱藏列(作業(yè)管理頁面)例如:點擊作業(yè)號右上角的漏斗標(biāo)志,如圖4-2-2所示,輸入“2600”,選擇包含過濾條件,過濾出作業(yè)號大于2600的作業(yè),點擊“篩選”按鈕,即可完成篩選操作。完成篩選操作后,右上角的漏斗標(biāo)志將會變成實心的漏斗。如圖4-2-10所示:圖4-2-10過濾舉例下面將詳細(xì)介紹作業(yè)管理的四個主要功能:查看作業(yè)信息掛起作業(yè)繼續(xù)作業(yè)終止作業(yè)查看作業(yè)信息作業(yè)信息主要包括用戶、隊列、項目、狀態(tài)、命令、提交

50、節(jié)點、執(zhí)行節(jié)點、提交目錄、執(zhí)行目錄、作業(yè)槽數(shù),提交時間、執(zhí)行時間、結(jié)束時間、CPU執(zhí)行時間、作業(yè)歷史信息、作業(yè)輸出等。作業(yè)信息頁面如圖4-2-11所示:圖4-2-11作業(yè)信息頁面作業(yè)詳細(xì)信息頁面統(tǒng)計了作業(yè)的資源需求與使用,以及作業(yè)的執(zhí)行情況。詳細(xì)信息頁面統(tǒng)計了以下幾項:作業(yè)號作業(yè)名用戶:作業(yè)的執(zhí)行用戶。隊列:作業(yè)的執(zhí)行隊列項目:作業(yè)的項目名狀態(tài):作業(yè)的實時狀態(tài)命令:作業(yè)的執(zhí)行命令提交節(jié)點/提交目錄執(zhí)行節(jié)點/執(zhí)行目錄作業(yè)槽數(shù):若是RUN狀態(tài)的作業(yè),該參數(shù)指的是作業(yè)占用的槽數(shù),若是PEND狀態(tài)即為作業(yè)執(zhí)行所需要的槽數(shù)。資源需求:作業(yè)提交的請求資源串。CPU執(zhí)行時間:作業(yè)執(zhí)行完成后所使用的CPU時間

51、。在作業(yè)執(zhí)行完成后才顯示。內(nèi)存/交換區(qū)使用量:作業(yè)執(zhí)行完成后所使用的內(nèi)存和交換區(qū)使用。在作業(yè)執(zhí)行完成后才顯示。提交/執(zhí)行/結(jié)束時間鼠標(biāo)放到提交節(jié)點或執(zhí)行節(jié)點上,會顯示該節(jié)點的機(jī)器狀態(tài),如圖4-2-12所示:圖4-2-12作業(yè)提交節(jié)點信息點擊查看作業(yè)輸出,可以在頁面上直接看到作業(yè)的運(yùn)行輸出信息(只有在作業(yè)運(yùn)行時才有輸出),如圖4-2-13所示:圖4-2-13作業(yè)輸出信息點擊查看作業(yè)歷史,可以在頁面上直接看到作業(yè)的歷史信息,如圖4-2-14所示:圖4-2-14作業(yè)歷史信息掛起作業(yè) 僅能對PEND、RUN狀態(tài)的作業(yè)執(zhí)行掛起操作??梢酝瑫r選擇一個或多個作業(yè)進(jìn)行掛起操作,也可以在作業(yè)信息頁面對作業(yè)進(jìn)行掛

52、起操作。其中PEND狀態(tài)的作業(yè)掛起后狀態(tài)變成PSUSP,RUN狀態(tài)的作業(yè)掛起后狀態(tài)變成USUSP。繼續(xù)作業(yè)僅能對PSUSP、USUSP狀態(tài)的作業(yè)進(jìn)行喚醒操作,使掛起的作業(yè)可以繼續(xù)運(yùn)行??梢酝瑫r選擇一個或多個作業(yè)進(jìn)行繼續(xù)操作,也可以在作業(yè)信息頁面對作業(yè)進(jìn)行繼續(xù)操作。其中PSUSP狀態(tài)的作業(yè)繼續(xù)后狀態(tài)變成PEND,USUSP狀態(tài)的作業(yè)繼續(xù)后狀態(tài)變成RUN。終止作業(yè)僅能對PEND、RUN、PSUSP、USUSP狀態(tài)的作業(yè)進(jìn)行終止操作??梢酝瑫r選擇一個或多個作業(yè)進(jìn)行終止操作,也可以在作業(yè)信息頁面對作業(yè)進(jìn)行終止操作。其中,對作業(yè)進(jìn)行終止后作業(yè)狀態(tài)變成EXIT。分享組管理使用通過分享組管理我們可以實現(xiàn)局部

53、范圍的數(shù)據(jù)共享,比如A同學(xué)要將數(shù)據(jù)共享給B同學(xué),就可以創(chuàng)建臨時的分享組,在將數(shù)據(jù)上傳到分享組中,這樣B同學(xué)就可以點擊確定按鈕,添加完成。本地文件的共享再次點擊分享組管理按以下步驟操作,分享完之后被分享的用戶登錄之后就可以在分享組中看見您共享的文件。服務(wù)器文件的共享會話管理用戶啟動的jhapp、或者遠(yuǎn)程桌面都可以在會話管理查看。集群監(jiān)控集群監(jiān)控主要顯示集群中各節(jié)點的信息、對節(jié)點進(jìn)行打開上線和下線操作(該操作僅限系統(tǒng)管理員)、查詢可用CPU等。集群監(jiān)控頁面如圖4-4-1所示:圖4-4-1集群監(jiān)控頁面集群監(jiān)控列表顯示了以下元素:節(jié)點名:默認(rèn)顯示;Batch狀態(tài):默認(rèn)顯示,包括:ok、unavail、

54、unreach、closed_Full、closed_Adm、closed_LIM;任務(wù)數(shù):默認(rèn)顯示,即占用的作業(yè)槽數(shù);CPU使用率:默認(rèn)顯示;物理內(nèi)存使用量:默認(rèn)顯示,單位MB;交換區(qū)使用量:默認(rèn)顯示,單位MB;集群負(fù)載頁面對每一列提供了過濾設(shè)置,并支持個性化手動設(shè)置過濾條件。用戶可以通過在每一列右邊的漏斗狀圖標(biāo),就可以進(jìn)行每一列元素的過濾。這些過濾條件會自動保存起來,下次訪問該頁面的時候,會執(zhí)行自己設(shè)置的過濾條。其中每一列的過濾條件有:節(jié)點名:提供等于、不等于、包含和不包含四個過濾條件。過濾展開框如圖4-4-2所示:圖4-4-2 節(jié)點名過濾框(集群負(fù)載頁面)batch狀態(tài):提供等于、不等于

55、兩個過濾條件,并提供一個選擇框選擇不同狀態(tài)與兩個過濾條件組合使用。過濾展開框如圖4-4-3所示:圖4-4-3 batch狀態(tài)過濾框(集群負(fù)載頁面)任務(wù)數(shù):提供等于、大于和小于三個過濾條件。過濾展開框如圖4-4-4所示:圖4-4-4 任務(wù)數(shù)過濾框(集群負(fù)載頁面)CPU使用率:提供等于、大于和小于三個過濾條件。過濾展開框如圖4-4-5所示:圖4-4-5 CPU使用率過濾框(集群負(fù)載頁面)物理內(nèi)存使用量:提供等于、大于和小于三個過濾條件。過濾展開框如圖4-4-6所示:圖4-4-6 物理內(nèi)存使用量過濾框(集群負(fù)載頁面)交換區(qū)使用量:提供等于、大于和小于三個過濾條件。過濾框如圖4-4-7所示:圖4-4-

56、7 交換區(qū)使用量過濾框(作業(yè)管理頁面)例如:點擊節(jié)點名右上角的漏斗標(biāo)志,如圖4-4-2所示,輸入“win7”,選擇包含過濾條件,過濾出節(jié)點名稱包含“win7”關(guān)鍵字的節(jié)點,點擊“篩選”按鈕,即可完成篩選操作。完成篩選操作后,右上角的漏斗標(biāo)志將會變成實心的漏斗。如圖4-4-8所示:圖4-4-8 過濾舉例下面將詳細(xì)介紹集群監(jiān)控的主要兩項:工作站負(fù)載可用CPU查詢工作站負(fù)載在該頁面(圖4-4-1),可以同時選擇一個或多個節(jié)點進(jìn)行上線下線操作(僅限管理員),可以根據(jù)節(jié)點名、batch狀態(tài)、任務(wù)數(shù)、CPU使用率、物理內(nèi)存使用率、交換區(qū)使用率對節(jié)點進(jìn)行排序,可以通過過濾框搜索節(jié)點。也可以點擊節(jié)點名,進(jìn)入節(jié)

57、點詳細(xì)信息頁面。節(jié)點詳細(xì)信息頁面如圖4-4-9所示:圖4-4-9節(jié)點詳細(xì)信息頁面節(jié)點詳細(xì)信息頁面包括工作站負(fù)載和作業(yè)數(shù)據(jù)兩項。節(jié)點負(fù)載該頁面主要顯示了節(jié)點的詳細(xì)信息,在該頁面也可以對節(jié)點進(jìn)行上線下線操作(僅限管理員操作)。節(jié)點上作業(yè):運(yùn)行在該節(jié)點上的作業(yè)。節(jié)點上作業(yè)頁面如圖4-4-10所示:圖4-4-10節(jié)點上作業(yè)頁面該頁面顯示了在該節(jié)點上執(zhí)行的作業(yè)的信息,在該頁面可以對作業(yè)進(jìn)行掛起、繼續(xù)、終止的操作,可以點擊作業(yè)號查看作業(yè)的詳細(xì)信息。該頁面上同樣提供了每一列的過濾設(shè)置,與作業(yè)管理頁面完全相同。可用CPU查詢可用CPU查詢顯示系統(tǒng)中CPU總數(shù)、作業(yè)占用CPU、運(yùn)行作業(yè)占用CPU、掛起作業(yè)占用C

58、PU、可用CPU、系統(tǒng)當(dāng)前等待作業(yè)數(shù)、還需CPU數(shù)??捎肅PU查詢頁面如圖4-4-11所示:圖4-4-11可用CPU查詢頁面可用CPU查詢頁面對每一列也提供了過濾設(shè)置,并支持個性化手動設(shè)置過濾條件。其中每一列的過濾條件有:節(jié)點類型:提供等于、不等于兩個過濾條件,并提供一個選擇框選擇不同節(jié)點類型與過濾條件組合使用。過濾框展開如圖4-4-12所示:圖4-4-12節(jié)點類型過濾框(可用CPU查詢頁面)CPU總數(shù):提供等于、小于和大于三個過濾條件。過濾框展開如圖4-4-13所示:圖4-4-13 CPU總數(shù)過濾框(可用CPU查詢頁面)作業(yè)占用CPU:提供等于、小于和大于三個過濾條件。過濾框展開如圖4-4-14所示:圖4-4-14 作業(yè)占用CPU過濾框(可用CPU查詢頁面)運(yùn)行作業(yè)占用CPU:提供等于、小于和大于三個過濾條件。過濾框展開如圖4-4-15所示圖4-4-15 運(yùn)行作業(yè)占用CPU過濾框(可用CPU查詢頁面)掛起作業(yè)占用CPU:提供等于、小于和大于三個過濾條件。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論