銀河群星高性能計算服務系統(tǒng)YHStarW10T技術方案 用戶手冊 國家超級計算長沙中心_第1頁
銀河群星高性能計算服務系統(tǒng)YHStarW10T技術方案 用戶手冊 國家超級計算長沙中心_第2頁
銀河群星高性能計算服務系統(tǒng)YHStarW10T技術方案 用戶手冊 國家超級計算長沙中心_第3頁
銀河群星高性能計算服務系統(tǒng)YHStarW10T技術方案 用戶手冊 國家超級計算長沙中心_第4頁
銀河群星高性能計算服務系統(tǒng)YHStarW10T技術方案 用戶手冊 國家超級計算長沙中心_第5頁
已閱讀5頁,還剩54頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

國家超級計算長沙中心

用戶手冊如何使用中心資源申請賬號首先進入中心網(wǎng)站主頁面,了解中心能提供的基本資源和服務,然后在“上機服務--》文檔培訓”中下載并填寫《用戶申請表》,經(jīng)單位領導簽字加蓋公章后送到中心才能完成最后注冊。中心對《用戶申請表》進行審查后,為用戶開通賬號,用戶即可使用中心資源了。如何使用中心資源三種使用模式遠程登錄:采用Xwindows或Telnet,putty等遠程登錄工具直接登錄到機群上使用資源;高性能計算門戶:利用瀏覽器使用中心的資源,登錄中心首頁;應用軟件的客戶/服務方式:客戶端軟件安裝在用戶桌面上,直接使用中心資源

機群基本操作遠程登錄

step1:利用putty進入登錄服務器(以node68()為例):機群基本操作step2:點擊open后進入以下界面:機群基本操作step3:輸入你的用戶名及密碼:機群基本操作

用戶登錄服務器后,默認進入到與用戶名同名的目錄下,5萬億次進入到/vol/user_name,10萬億次進入到/vol5/home/user_name

機群基本操作基本操作

1)進入目錄:cd2)建文件夾:mkdir3)查看目錄信息:lsll4)刪除文件:rm文件名5)拷貝文件:cpoptionssource

dest6)改變文件/目錄屬性:chmod7)設置文件/目錄擁有者:chown8)搜索文件:find,grep9)進程管理:pstopwwho10)壓縮解壓縮:tar,gzip11)修改密碼:passwd機群基本操作

vi編輯器Vi提供三種操作模式:命令模式、插入模式、末行模式,三種模式可通過ESC鍵進行相互轉(zhuǎn)換。:q!離開vi,并放棄剛在緩沖區(qū)內(nèi)編輯的內(nèi)容:wq

將緩沖區(qū)內(nèi)的資料寫入磁盤中,并離開vi:x同wq

:w將緩沖區(qū)內(nèi)的資料寫入磁盤中,但并不離開vi:q離開vi,若文件被修改過,則會被要求確認是否放棄修改的內(nèi)容,機群基本操作:setnu設定資料的行號。:setnonu取消行號設定。

:10,20wtest將第10行至第20行的資料寫入test文件。:10,20w>>test將第10行至第20行的資料加在test文件之后。刪除、復制及搬移:10,20d刪除第10行至第20行的資料。:10d刪除第10行的資料。:%d刪除整個編輯緩沖區(qū)。:10,20co30將第10行至第20行的資料復制至第30行之后。:10,20mo30將第10行至第20行的資料搬移至第30行之后。用戶作業(yè)管理作業(yè)提交基本流程

Step1:用戶準備數(shù)據(jù)輸入與作業(yè)腳本文件;

Step2:ftp上傳數(shù)據(jù)文件至用戶目錄;用戶可用任意ftp工具將數(shù)據(jù)上傳或下載數(shù)據(jù),用戶名密碼即為你登錄機群時使用的用戶名和密碼用戶作業(yè)管理Step3:登錄機群服務器,用yhinfo命令查看節(jié)點的信息:用戶作業(yè)管理

yhinfo可以顯示節(jié)點的一些信息,具體說明如下:(1)PARTITION:表示節(jié)點的分組情況;默認的組會有組名前加上*號,例如:以上情況下,work就是默認的組,若不指定,作業(yè)會自動加載到默認組中的節(jié)點,如需要到將作業(yè)加載到特殊的組別需要添加相應參數(shù);(2)AVAIL:表示節(jié)點默認的狀態(tài),up表示可用;(3)NODE:表示作業(yè)占用的節(jié)點數(shù);(4)STATE:表示節(jié)點目前的狀態(tài);(5)NODELIST:表示作業(yè)占用的節(jié)點列表;用戶作業(yè)管理狀態(tài)含義備注down節(jié)點故障,不可用用戶切記不要在登錄節(jié)點上運行作業(yè).alloc節(jié)點已分配,不可用idle節(jié)點空閑,可用下表是節(jié)點狀態(tài)的具體信息:用戶作業(yè)管理Step4:編譯,調(diào)試作業(yè);集群上安裝了包括gcc,icc等常用的編譯器,用戶可以根據(jù)自身的需要進行選擇。如果是并行程序,編譯命令應使用以下命令:mpicc:用于對c語言寫的并行程序;Mpicxx:用于使用c++語言編寫的并行程序;Mpif77,mpif90:用于使用fortran語文編寫的程序;后綴的選擇與你使用的fortran語言版本有關;具體命令(以C語言程序為例):mpicc–ocpi(編譯后的可執(zhí)行代碼)cpi.c(原程序)用戶作業(yè)管理Step5:利用命令yhrun/yhbatch提交作業(yè):提交作業(yè)命令:yhrun,常用參數(shù)如下:-n,--ntasks=ntasks指定提交作業(yè)的任務數(shù)-N,--nodes=N指定作業(yè)需要占用的節(jié)點數(shù);

-x,--exclude=hosts...指定作業(yè)在除某個節(jié)點外的節(jié)點運行;

-wnode[…]指定作業(yè)在某些節(jié)點運行-p,partitionname組名用戶作業(yè)管理

-i,--input=in標準輸入重載

-o,--output=out標準輸出重載

-e,--error=err標準錯誤重載例:%yhrun/yhbatch–n4my_program

提交作業(yè)my_program,任務數(shù)為4,由系統(tǒng)指定節(jié)點。

%yhrun/yhbatch-N2my_program

指定作業(yè)my_program在兩個節(jié)點上運行,具體節(jié)點不指定。

%yhrun/yhbatch–n2–wnode6my_program

提交作業(yè)my_program在node6上運行。%yhrun/yhbatch-n8–N1–wnode1-ptestmyprogram

提交作業(yè)my_program在test組中的node1上運行作業(yè).用戶作業(yè)管理yhbatch是提交批處理作業(yè)的命令,使作業(yè)在后臺運行,作用yhbatch命令提交時,用戶需要確認提交的作業(yè)為批處理格式的作業(yè)腳本,具體使用yhbatch方法為如下:(1)進行用戶作業(yè)所在的目錄并編寫可運行批處理作業(yè)的腳本:#cdpath(用戶作業(yè)所在的目錄)#vitask(用戶根據(jù)需要自行命名)#!/bin/sh/usr/local/yhrms2.0/bin/yhrun/path/job_name(path為用戶作業(yè)的全路徑)(2)將作業(yè)腳本的屬性改為可執(zhí)行#chmod+xtask(3)用yhbatch方式發(fā)作業(yè):#yhbatch–n16–N2–wnode[1-2]./task(4)如果提交成功,系統(tǒng)會在屏幕上出現(xiàn)與以下內(nèi)容相似的提示:yhbatch:Submittedbatchjob23371,同時,系統(tǒng)會在當前目錄下生成一個類似于slurm-23371.out的文件,系統(tǒng)會將擬輸出到屏幕的內(nèi)容保存到這個文件中,其中23371是作業(yè)ID號。用戶作業(yè)管理注意:

任務數(shù)n=節(jié)點數(shù)N*單個節(jié)點的CPU核數(shù).yhrun-N1-n8-wnode4job_name

用戶在提交作業(yè)時,一定要指明所需的節(jié)點數(shù),即在命令行設置參數(shù)-N,以防作業(yè)提交出錯.用戶作業(yè)管理作業(yè)提交后,可用命令yhqueue查看作業(yè)是否提交成功:用戶作業(yè)管理當用戶需要在作業(yè)運行時結(jié)束作業(yè),可以利用yhcancel命令,但用戶只能刪除自己的作業(yè),無法對其他用戶的作業(yè)進行操作.%yhcancel15578

結(jié)束作業(yè)號為15578的作業(yè).如果需要將作業(yè)放到后臺運行,可以使用命令:yhbatch,主要的參數(shù)與yhrun相同.用戶作業(yè)管理用戶如果因為自身需要不能用作業(yè)管理器提交作業(yè)(如起圖形界面、需要登錄到計算結(jié)點運行一些測試程序)時,請先使用以下命令占住你需要使用的結(jié)點,然后再使用這些結(jié)點運行你自己的程序。如用testzj用戶運行以下命令:

yhalloc-n16-N2-wnode[4-5]-pfluent

運行成功后會出現(xiàn)以下的提示:

yhalloc:Grantedjoballocation43786用yhinfo查看:

JOBIDPARTITIONNAMEUSERSTTIMENODESNODELIST(REASON)43786fluentbashtestzjR0:022node[4-5]

用戶作業(yè)管理用戶使用yhalloc命令后不要退出當前的shell,否則,占用的結(jié)點會被釋放掉,即會出現(xiàn)以下提示:

yhalloc:Relinquishingjoballocation43786如果程序完成后,需要停止占用結(jié)點,可以使用yhcancel

jobid

命令或yhalloc作業(yè)停止。

yhcancel43786

屏幕上會出現(xiàn):

yhalloc:Joballocation43786hasbeenrevoked.

這表示你占用的結(jié)點已經(jīng)退出,其它用戶可以使用這些結(jié)點了。

中心軟件的使用方法Fluent:使用方式:

(1)圖形界面:

a.用戶可雙擊打開Xstart,點擊new,新建一個用戶會話窗口,并自定義一個窗口名,在Host欄輸入你要登錄的機器的IP地址,在Protocal欄選擇SSH,在UserName欄輸入你的用戶名,在Password欄輸入你登錄的密碼,在ExecutionCommand選擇xterm(Linux:type1)或xterm(Linux:type2),點擊Run,即可進入登錄節(jié)點(如下圖);中心軟件的使用方法中心軟件的使用方法中心軟件的使用方法b.運行以下命令:yhinfo,查看是否有空閑節(jié)點可供用戶使用:中心軟件的使用方法c.運行以下命令,占住你所需要的空閑節(jié)點:

yhalloc–N1–n8–wnode1–pcae

注意:占用節(jié)點后,不要退出登錄界面,否則占用的節(jié)點也會同時釋放。中心軟件的使用方法d.進入其中的一個節(jié)點,在計算節(jié)點上起圖形界面:

ssh–Xnode1/vol/Fluent.Inc/bin/fluent3d–pnet(其中3d是指version,你可以根據(jù)自己的需要進行調(diào)整為其它version)注意:因為起圖形界面比較占用資源,我們推薦用戶不要在mds上起圖形界面以免影響其他用戶使用資源。中心軟件的使用方法中心軟件的使用方法對并行環(huán)境進行配置:1、在Parallel標簽中配置,點擊network->configure中心軟件的使用方法2、在Hostname里輸入節(jié)點名,在Username里輸入用戶名,點擊Add,根據(jù)自己的需要添加節(jié)點中心軟件的使用方法3、選中你所需的節(jié)點,在SpawnCount輸入處理器個數(shù),點擊Spawn鍵中心軟件的使用方法4、讀入.cas、.dat文件中心軟件的使用方法中心軟件的使用方法中心軟件的使用方法5、進行并行計算:點擊solve->Iterate,設置需要計算的步數(shù)其他參數(shù)后,點擊Iterate進行計算中心軟件的使用方法中心軟件的使用方法(2)命令行方式:a.首先編寫一個可自動執(zhí)行的命令文件.vifluent_testfile/read-casesample.casfile/read-datsample.datit10file/write-casesample_end.casfile/write-datsample_end.datexit

中心軟件的使用方法(2)命令行方式:b.編輯machinefilevimachinefilenode1-bnode1-bnode1-bnode1-bnode1-bnode1-b

中心軟件的使用方法c.編寫作業(yè)運行腳本vitask#!/bin/shexportIBA_MPIRUN=/usr/local/mvapich_zm/bin/mpirun_rshexportIBA_MPILIB=/usr/local/mvapich_zm/lib/shared中心軟件的使用方法/vol/Fluent.Inc/bin/fluent2d–t8-mpi=mvapich-pib-ssh-cnf=machinefile-g-ifluent_test中心軟件的使用方法d.運行作業(yè)腳本yhrun–N1–wnode1./task注:如果在運行過程中不需要交互,則可以考慮使用yhbatch命令將作業(yè)提交到后臺運行.viyhtask#!/bin/sh/usr/local/yhrms1.4/bin/yhrun/vol/zj119/example2/task保存退出,運行以下命令:yhbatch–N1–wnode1./yhtaskAnsys:使用情況:使用次數(shù)不多;使用方式:

主要有圖形方式和命令行方式兩種.

中心軟件的使用方法中心軟件的使用方法圖形方式Step1:用xmanager登錄,占住所需要的節(jié)點,并進入其中一個計算節(jié)點(方法同使用fluent時一樣)Step2:進入ansys配置界面:#cd/vol/Ansys11/v110/ansys/bin#./launcher110中心軟件的使用方法中心軟件的使用方法Step2:配置環(huán)境1、在CustomizationPreference標簽中配置:a)在SimulationEnvironment中選ANSYSb)在License中選ANSYSMultiPhysics2、在FileManagement標簽中配置:在WorkingDirectory:中設置用戶ansys程序所在路徑,如:/zj119/ansys/work/3、在HighPerformanceComputingSetup標簽中配置:

a)選擇RundistributedANSYS; UseDistributedANSYSb)在selectedhosts中用NewHost添加運算節(jié)點,注意添加第一個節(jié)點必須是控制節(jié)點mds。中心軟件的使用方法中心軟件的使用方法Step3:點擊“run”,出現(xiàn):“ANSYSMultiphysicsUtilityMenu”界面中心軟件的使用方法step4:開始執(zhí)行ANSYS程序

1)打開用戶ansys原程序在菜單file->Resumefrom,出現(xiàn)ResumeDatabase對話框。在filter中輸入用戶工作目錄:/vol/zj119/Ansys11/work則在右邊的窗口中顯示該目錄下的所有文件。選擇ansys_520.db(ansys_520.db為用戶ansys原程序)

中心軟件的使用方法中心軟件的使用方法中心軟件的使用方法2)在ANSYSMainMenu中選Solution->Solve->CurrentLS.就開始并行運行用戶程序了。中心軟件的使用方法

命令行方式

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論