x-數值-并行計算導論

上傳人：洞*** IP屬地：北京上傳時間：2023-01-29 格式：DOCX 頁數：538 大?。?.39MB 積分：22 舉報 版權申訴

已閱讀5頁，還剩533頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

(CIP)并行計算導論/張林波等編著.—： (高等院校信息與計算科學專業(yè)系列)ISBNI.并...II.張...III.并行算法–高等學校–IV.TP301.6館CIP(2006)第026693本書是并行計算，特別是分布式并行計算環(huán)境和消息傳遞并行編程的入門，目的是促進并行計算技術在我國的應用。書中介Lx/UNIXLx機PI消息傳遞并行編程的基本概念與方法。書中還提供了一批典型科學計算問題的并行算法與程序設計實例，介紹了一些當前國際上流行的科學計算軟件工知識，在逐步學習使用的過程中學會利用并行計算解決自己學習和工作中的問題。本書側重介紹高性能計算的實用技術，可作為與計算專業(yè)的專業(yè)基礎課，也可作為其他理工科非計算機專業(yè)的并行算程。外，書可作有關Lx機群建、I息傳遞并行算法設計與編程及常用高性能科學計算軟件的參考書使用。隨著高性能并行計算機，尤其是Linux微機機群在我國應用部成科學計算軟件工具箱、庫等的普及教育和推廣應用還明顯不夠，入門。它側重于介紹利用現有的微機條件建立并行計算的軟硬件消息傳遞并行編程的基本概念與方全書分為三部分，共包括九章和兩個附錄1141章講述并行計算機的發(fā)展歷史、并行計算機體系結構以及2Linux操3章講述標準消息傳遞并行編程接口MPI，并介紹如何利用目前流行的免費MPI軟件MPICH和Linux并鑒于國內已有一些專門關于MPI編程的書，本書中關于MPI編程的部分僅限于講述MPI編程的基本概念和介紹一些MPI的重要函數，同時在附錄B中提供MPI變量和函數的完整參考方便讀者查詢。第4章講述程序性能評價與優(yōu)化方面的有關知識。第2部分包括第5章至第9章。在這部分中，通過一些典行算法設計及并行程序實現的實例，介紹并行算法設計的基本思想與PI5章介紹一個自適應數值積分算法的并行算法設計與PI并行程序實現。第6章介紹矩陣計算行與序第7章介紹快速變換(FFT)的并行算法及在消息傳遞并行環(huán)境中的實現方法。第8章以二維isson方程5點差分格式的點Jacobi9章通過二維熱傳導方程的DI格式介紹基于流水線方法的并行算法設計的基本思想及實現方法。第3部分由兩個附錄構成。附錄A介紹一些重要的高性能計BLAS，LAPACK，ScaLAPACK，FFTWPETScB是一個為方便讀者速查而整理的較完整的MPI參考手冊。建立的實際操作及Linux系統的管理和使用，與自己的工作領域相結合編寫具體模型問題的例子程序舉一反三通過本書在本書的作者中，張林波(中國數學與系統科學)編寫了3章、5章、9章和B，以及第2章、4章和附錄A中的部分內容；遲學斌(中國計算機網絡信息中心)編寫了第6章、第7章，以及附錄A中的部分內容；莫則堯(應用京大學數學科學學院)編寫了第2章。本程序實例可以從下面的 (A.3)、(A.2)、(A.4)，在此一并致謝。作2006717日于第1部分基礎知第1章預備知并行計算的主要研究目標和內什么是并行計并行計算的主要研究目標和內推動并行計算發(fā)展的主要動并行計算機發(fā)展歷應用需求的推動作 70年 80年代早 80年代中 80年代后 90年代早 90年代中后 2000年到當并行機體系結 1.4.2并行編程環(huán)境....................并行算法..........................1.5.1并行算法的分類..................1.5.2并行算法的發(fā)展階段................習...............................2LinuxLinux安裝與使用入門..................2.1.1Linux系統的安裝.................2.1.2基本使用與管理..................Linux基本命令和概念..................2.2.1一些基本命令....................2.2.2 ........................2.2.3文本文件處理....................程序開發(fā)環(huán)境.......................2.3.1第一個程序(C程序)...............2.3.2Fortran程序的開發(fā)................2.3.3軟件開發(fā)......................第3章消息傳遞編程接口單機環(huán)境下MPICH的安裝.. 機群環(huán)境下MPICH的安裝.. MPI編程................ MPI編程的基本概程序基本結 MPI的原始數據類點對點通信函數與通信模聚合通信與同步..................自定義數據類型..................進程組與通信器..................進程拓撲結構....................文件輸入/輸出...................程序主要結構....................習 4程序性能評價并行程序執(zhí)行時間.....................并行加速比與效率.....................并行程序性能評價方法..................4.3.1浮點峰值性能與實際浮點..........4.3.2數值效率和并行效率................可擴展分析.........................程序性能優(yōu)化........................4.5.1串行程序性能.................4.5.2并行程序性能.................習...............................第2部分并行算法設計與實現實第5章自適應數值積梯形積分公局部二分自適應區(qū)間加串行程基于簡單區(qū)域分解的并行算基于主從模式的并行算基于非阻塞通信的并行程基于動態(tài)負載調度的并行算法基于動態(tài)負載調度的并行算法..............習...............................第6章矩陣并行計并行矩陣乘串行矩陣乘行列劃分算行行劃分算列列劃分算列行劃分算 Cannon算線性代數方程組并行求解方分布式系統的并行LU分解算三角方程組的并行解對稱正定線性方程組的并行解 Cholesky分解列格式的并行計雙曲變換Cholesky分修正的雙曲變換Cholesky分三對角方程組的并行解經典迭代算法的并行 Jacobi迭代 Gauss-Seidel迭代異步并行迭代異步并行迭代法基線性迭代的一般收斂性結代數特征值問題的并行求對稱三對角矩陣特征值問 Householder變化對稱矩陣為三對角矩習第7章FFT算法與應一維串行FFT算二維串行FFT算并行FFT算 FFT應用示多項式相循環(huán)矩陣方程組的求第8章二維Poisson方并行算法設 MPI并行程序設并行效率分 MPI并行程序的改習第9章二維熱傳導方空間離散與區(qū)域劃時間離散：顯式格時間離散：隱式/半隱式格時間離散：ADI方分塊流水線方模型問模型問題的并行效率分習第3部分附錄并行程序開發(fā)工具與高性能程序 Level1 Level2 Level3 LAPACK軟件包組 LAPACK程序文 LAPACK參數設 LAPACK使用示 ScaLAPACK體系結 ScaLAPACK程序介 ScaLAPACK安 ScaLAPACK編程指復型變實型變并行 FFTW計算實 PETSc的系統結 PETSc的基本特 PETSc的基本功 PETSc計算實 PETSc小 MPI參考手MPI函數、變量速查表..................MPI預定義的變量及類型................B.2.1C語言MPI原始數據類型............B.2.2Fortran77語言MPI原始數據類型.......B.2.3預定義的通信器與進程組.............B.2.4用于歸約函數的預定義的二目運算.......B.2.5C變量類型及預定義.............B.2.6空對象.......................B.2.7MPI常量......................B.2.8進程拓撲結構...................B.2.9通信狀態(tài)信息...................B.2.10錯誤碼.......................B.2.11MPI–2...初始化、退出與錯誤處理函數..............點對點通信......................B.4.1阻塞型通信函數..................B.4.2非阻塞型通信函數.................B.4.3持久通信函數...................數據類型與打包函數...................同步與聚合通信函數...................進程組與通信器操作...................B.7.1進程組操作.....................B.7.2域內通信器操作..................進程拓撲結域間通信器操時間函參考文名詞索表三種并行編程環(huán)境主要特征一覽 Linux常用的分 Linux文件的特 Linux常用信常用環(huán)境變 Bash的環(huán)境變量字符串過 Bash的文件檢測操 Bash比較兩個文件的操 Bash的算術比較及字符串檢測操 Bash的算術表達 gdb的基本命 GNUMake常用自動變量及含 MPI原始數據類 MPI點對點通信類型及模式匯 MPI–2文件讀寫函數匯代碼5.4在4結點微機機群上的運行時間統按位倒置變遞推關系式的流水線計算流插Origin–2000結構并行機體系結構示意圖：內存模塊與結點分并行機體系結構示意圖：內存模塊位于結點內含4個結點的一維陣列和環(huán)的拓撲結含44個結點的二維網格和網格環(huán)的拓撲結含8個結點的二叉樹和X–樹的拓撲結超立方體拓撲結動態(tài)拓撲結多級結構示意 Cache讀操作工作流程示意 SMP體系結構典型示意 MPP體系結構典型示意單進程多線程執(zhí)行示意消息傳遞進程拓撲結構和并行機模 top命令抓 Emacs屏幕截 Doxygen生成的LATEX文 Doxygen生成的HTML文自適應梯形公式計算定積使用3個處理機求解下三角線性代數方程 FFT數據依賴關 DIFFFT計算過兩種區(qū)域分解策 3的二維塊區(qū)域分輔助網格單元示意流水線方法計算流程示意分塊流水線方法計算時間變化曲 LAPACK軟件結 ScaLAPACK軟件的層次結 ScaLAPACK軟件 PETSc實現的層次結稀疏矩陣結構：二維拉斯方非線性求解器(SNES)的主要計算流 TS的主要計算流程：隱式Euler方第1部分1并行計算是伴隨并行機的出現，在近30年來迅速發(fā)展的一同，并行地執(zhí)行而達到加速求解速度，或者求解應用問題規(guī)模的目的由此，為了成功開展并行計算，必須具備三個基本條件：應用問題必須具有并行度。也就是說，應用可以分解為多個子2個星期（14天），這個速度對一般的應用而言，是無法100臺處理器，加速50倍，將執(zhí)行時間縮短為6.72個小時提高求解問題的規(guī)模。例如，在單處理器上，受內存資源的限制，只能計算10萬個網格，但是，當前數值模擬要求計算千萬個網格。于是，也可以借助并行計算，使用100個處理將問題求解規(guī)模線性地擴大100倍并行計算之所以必需，主要在于，當前的單處理器性能不可能滿足大規(guī)?？茖W與工程計算及商業(yè)應用的需求，并行計算是目前唯一能滿足實際大規(guī)模計算需求的支撐技術。例如，即使是當前較為先進的微處理器（Itanium–II1.5GHz、POWER41.5GHz等值性能也僅為60億次/秒。近2年內，微處理器的峰值性能也不會超過100億次/秒。并行計算之所以可行，主要在于，并發(fā)性是物質并行機的高性能特征抽取。主要任務在于，充分理解和抽取當前并行機體系結構的高性能特征，提出實用的并行計算模型和并行算法設計與分析。針對應用領域專家求解各類應用問題的MPI[20或者并行算法和并行程序。一個沒有經過實際應用驗證和確認的算的基礎，第2、3部分是并行計算研究的，也是在并行機上高效求解應用問題的基本保證，第4部分是并行計算研究的目也是驗證和確認并行計算研究成果的最有效的途徑。第4部分將為第2、3需要說明的是，并行計算不同于分布式計算（distributedcom-下面給出并行計算和分布式計算的幾個例子，以示區(qū)別例1.1:（并行計算）N個數被分布在P臺處理器，P臺處理1.2:（并行計算Dirichlet問題?uf，5NNxNy個網格單PPxPyJacobi迭Dirichlet問題，從而達到縮短求解問題的時間，或者擴大網格規(guī)模N的目的。，例1.3:（分布式計算）觀眾點播駕馭式可視化，電視會議等，大規(guī)?？茖W與工程計算應用對并行計算的需求是推動的。全球氣象預報中期天氣預報模式要求在24小時內完48小時天氣預測數值模擬，此時，至少需要計算635 存需求大于1TB，計算性能要求高達25 億次、30萬億次和100萬億次的大規(guī)模并行數值模擬，實現全三維、全物理過程、高分辨率的核數值模擬。除此之外，在天體物理、，近10年來在大規(guī)模科學與工程計算應用領域啟動了三，第一次是在1983年，配合星球大戰(zhàn)防御計劃而開展的計算機計劃（SCP），研制了每秒十億次CRAY并行機。第二次是在993年，由科學、工程、技術協調委員會向國會倡議的“重大性項目：高性能計算與通信（HC計T（1Tops1TB內存容量和TB/s的I/OT1012學與工程計算中的重大性課題，保持其在高性能計算和計算機通信領域中的世界領先地位，利用高性能計算機與網絡技術刺激生高性能計算機系統（PC（AA（NREN（BRHR對一大批重要應用問題，計算性能要達到每秒萬億次運2發(fā)展相關的系統軟件，對一大批問題改進算法；3國家研究網能力要達到每秒十億位；4充分保證計算機科學與工程領域的科研人員的需求。HPCC計劃背景是一大批巨大性問題需要解決，其空氣污染，蛋白質結構設計，金星圖象分析和破譯技術。世界上第一臺峰值速度超過1T?ops的高性能計算機由In公司于1996年12月成功研制。我國863高科技計劃也將并行計算機的研制列為關鍵攻關技術。第三次在1996年，能源部聯合三大核 Alamos國家、LawrenceLivermore國家和Sandia國力。為此，三大分別向三大公司（In 、IBM和SGI）預定了峰值速度超過1T?ops的并行機計劃分四個階段分別實現萬以TOP500[9]中第1的峰值性能為185萬億次的IBMBlueGene/L為標志，四個階段的并行機研制已經初步實現。目前，整個ASCI計劃發(fā)展到第2個階段改名為“先進模擬計算計劃(ASC)”。對應于的ASCI計劃，和歐洲也提出了相應對策。尤其是，以2002年研制的EarthSimulator[9]及其在大氣海洋環(huán)流除了大規(guī)?？茖W與工程計算應用外，微電子技術與大規(guī)模集成電路LI的發(fā)展是推進并行計算發(fā)展的另一個主要動力。當前，ooe定律仍在延續(xù)，計算機微處理器的速度每3年翻兩番，內存容量每兩年翻–4連技飛展行絡延遲可低于1個微秒，帶寬可達GB/s，并行機網絡延遲可低于6.2GB/s行編程模式帶來新的。當前，如何快速地開發(fā)并行應用程序，高效率地發(fā)揮當前并行機的峰值性能，已經成為當前并行計算研究的一個性問題。7080年代蓬勃發(fā)展和百家爭鳴，90年代體系結構框架趨于統一，近5年來機群技術的快速發(fā)展，市場需求一直是推動并行計算機發(fā)展的主要動力，大量實際應高性能并行計算機的研制與應用水平，一直是以和為首的各個發(fā)達國家共同追逐的目標，是衡量一個國家科技、經濟和HC計劃701972ILLIACIV32型機器。對大量流體力學程序，ILLIACIV2–6倍于當時性能最高的CDC7600機器的速度。0年代誕生的并行機還有陣列機ICLPGooerPP及向量機CY–1-00ID量機CY–170年代的并行計算機引起了人們的極大，吸引了大量的專家學者從事于并行計算機研80年代并行計算機的蓬勃發(fā)展奠定了堅實的基礎。8080年代早期，以MIMD并行機的研制為主。首先誕生的是DenelcorHEP，含16臺處理機，共享，能同時支持細粒度和其次，誕生了共享向量多處理機CRAYX–MP/22（2個向量機能。同時，以超立方體結構連接的分布式MIMD結構原型機開80功的機器為Sequent（20個結點、Encore（16-32個結點它們提列串行機構成了嚴重的。同時，還誕生了8個結點的向量多處理機Alliant，它提供了非常好的自量并行編譯技術；誕生了4CRAY–2。這些向量多處理機系統在實際應用此期間還誕生了可擴展的分布IDPE機器含04個點CPU和單元均分布包含在結點，所有結點通過超立方體網絡相互連接，支持消息傳遞并行編程環(huán)境，并真正投入實際使用。由于該機對流體力學中的幾個實際應用問題獲得了超過100的加速比，引起了計算機界的轟動，改變了人們對hl當時，在分布式體系結構中，處理機間的消息傳遞與消息長度、處理機間的距離有較大的關系。因此互連網絡最優(yōu)拓撲連接和數據包路由選擇算法的研究引起了人們的大量注意，目的在于減少處理機遠端的花費。8080年代后期，真正具有強大計算能力的并行機開始出現。例如，Meiko系統，由400個T800Transputer通過二維Mesh相互連和DAP，其中CM–2對Linpack測試獲得了5.2G?ops的性能；超立方體連接的分布MIMD并行機nCUBE–2與In 分別可擴展到8K個結點和128個結點，峰值性能達27G?ops和7G?ops；由硬件支持共享機制的BBNTC2000，用Butter?y多級互連網連接處理機和模塊，可擴展到500臺處理機，本地cache內存和遠端內存的延遲時間為1:3:7；共享向量多處理機系統CRAYY–MP，能獲得很好的實際運算性能。90的微處理的性能幾乎以每18個月增長1倍、內存容量每年幾為了滿足HPCC計劃中高性能計算要求考慮到共享存布式MPP系統，使得MPP的硬件和軟件系統得到了長足的發(fā)Fortran（HPF）這一時期，MIMD類型占據絕對主導位置。用于科學與工程計SIMD類型并行機和單純的向量機已逐漸退出歷史舞臺，但以單個向量機為結點構成的MIMD并行機仍然在實際應用中發(fā)揮重這段時間出現的分布式MPP并行機主要有CM–5E16–1KRISCSPARC處理器（含四個向量部 ParagonXP/S，含24–3K個i860/XP微處理（主CRAYT3D，16–1K2個處理器（64RISCDECchip21064150M?ops）64MB，最大128GBTorusSP21616個處理器（POWER–2芯關HPS連接，機柜之間采用信息傳遞光纖網絡連接。在共享方面由向量機構成的并行機CRAYY-MPC90(1616G?ops)YH-24臺向量機，峰值性能1G?ops)也誕生了，在應用問題中發(fā)揮了重要作用。思想已經們接受。這方面的代表機型為1991生產的Kendall為15G?ops。90SUNUltraSPARC250MHz1G?ops第一，以高性能微處理和互連網絡通信技術為基礎，共享存儲對稱多處理機SP系統得到了迅速發(fā)展。它們大多以高性能服務器的面目出現，能提供每秒幾百億次的浮點運算能力、幾十個GB的內存和超過GBcI/O64UltraSPARC處理器（250MB，2MBcache），12.8GB/Sec，I/O帶寬為64GB/Sec。它采用標準UNIX操作系統，支持共享、消息傳遞并行程序設計。類似的SMP系統還有SGIPowerChallengeR10000，HPC–240，DECAlphaserver400C等，這第二，以微處理為的工作站能提供近1G?ops的計算MB的內存，能單獨承擔一定的計算任務。并且，將多備一定的并行支撐軟件，形成一個松散耦合的并行計算環(huán)境，協同地并行求解同一個問題，稱之為工作站機群（NOWs：NetworkOfPVM、MPI消息傳遞并行程序設計軟件支撐環(huán)境，序設計難等許多亟待解決的問題，吸引了大量國內外專家學者的注意力。易被用戶接受的缺點，單純的分布式并行機已經朝分布共享方向發(fā)展。它們都采用最先進的微處理作為處理單元，單元內配備有較大的局部cache 所有結點通過高性能網絡相互連接，從而用戶可以采用共享或數據并行的并行程序設計方式，并且自由地申請結點個數和內存大小。DSMCC–NUMA結構具有比SMPSMP的共能。但是，它并不能完全避免SMP結構中出現的內存瓶頸問SMP的折衷機型。CC-NUMASGIOrigin系列超級服務器，它是基于directory）CC-NUMA1.1Origin–20008個機柜，每個8個結點，結點是構成Origin–2000的基本單位，它包含：1–2195MHzR10000CPUCPU4MB的二級cache；512MB–4GB，分主存（mainmemory）和內存（direc-torymemory，用于保持結點間的cache一致性）；集線器（HUB）4個端口（interface）：CPU端口、內存端口、XIO端口、CrayLink互連網絡端口，采用交叉開關實現兩個CPU、內存、輸入輸出和互連網絡路由器（router）之間的1.5GB/sOrigin–2000CrayLink網絡相互連接。路由器是構9.3GB/s的現路由器間的互連，形成互連網絡拓撲結構。CrayLink的半分帶寬能，512GB的內存，已近千億次并行計算的要求。Origin–2000采用標準UNIX操作系統，支持共享、數據并1.1Origin–2000結構NUA即原分式機基上，局部內存的全局共享功能，提供共享并行編程環(huán)境。它們能繼持分布式并行機的可擴展性，但當處理機臺數較多時，也只有息傳遞并行程序設計方式才能發(fā)揮它們的潛在并行計算性能。這方面的典型代表為CyT3E和CyT-100個CP（主頻00H值性能達到.T?op。20002000年以來，受重大計算需求的牽引和微處理器及高速展。至2005年底，國內陸續(xù)安裝到位的萬億次并行機將近20臺用型的并行機系統，以微機機群為典型代表，它們具有優(yōu)良的性能應用問題而定制的MPP 系統，通常為國家的應用而特殊定制。從體系結構的角度，當前并行機的體系結構可分為如下三類[10]：機群(cluster)系統由結點構成，每個結點包含2-4個微處理器，采用機換機連接結點，結點間分布目前機群采用的典型64位微處理器代表為IBMPPC、2.2GHz，InItanium–II1.5GHz，AMDOpteron2.2GHz，峰值1.25GB/s)128個目前，2005年6月TOP500第5位的IBMJS20機群（巴塞羅拉超級計算機中心、4800IBMPPC9702.2GHz、Myrinet互連、峰值性能每秒42萬億次）第7位的CDCThunder(LLNL4096InItanium–IITiger41.4GHz、Quadrics互連、峰值性能每中心、2560AMDOpteron2.2GHz、Myrinet互連、峰值性能、機群系統占據了304臺套，占絕對優(yōu)勢星群(conslation)。它們也有三個明顯的特征系統由結點構成，每個結點是一臺共享或者分布共享采用機換機連接結點，結點間分布在各個結點上，運行的結點操作系統、編譯系統和作業(yè)管理系統。星群的典型代表為TOP500第3位的SGIColumbia系統（NASA/Ames/NAS、20個結點通過VoltaireIn?niBandSGIAltix3700系統（含由SGINUMAlink512Itanium–II1.5GHz處理器SGILinux61萬億次。20056月的TOP500中，星群占據79臺套。大規(guī)模并行機系統（MPP：MassivelyParallelProcessing）。它系統由結點構成，每個結點含10個左右處理器，共享。處理器采用或者CPU。采用高性能網絡互連，結點間分布系統運行操作系統、編譯系統和作業(yè)管理系統此類系統是傳統意義的大規(guī)模并行處理系統。它區(qū)別于其他兩種體系結構的一個特征就是，它的處理器或者結點間的互連網絡是針對應用需求而特殊定制的，在某種程度上，帶有并理器個數可擴展到數十萬個。MPP的典型代表為第1位的IBMBlueGene/L(DOE/NNSA/LLNL、65536顆IBMPowerPC440700MHz處理器、IBMProprietary互連網、峰值性能每秒184萬億次)，另一個典型代表是第4位的NECEarth-Simulator(地球模擬中心、640個結點通過Multi-satge交叉開關互連、每個結點含8顆向量處理表是第10位的CRAYRedStorm（Sandia國家實驗室、1250個結點通過CRAYXT3互連網絡連接、每個結點4AMDOpteron2GHz20萬億次。20056TOP500中，MPP117臺套。以上僅簡單地討論了并行機的發(fā)展。如果讀者希望詳細了解當考TP00[9]內TOP00[]。當前，如圖1.2和圖1.3所示，組成并行機的三個要素結點（node）互聯網絡（iterconnectnetwrk）。所有結點通過互聯網絡相互1.2所示所示，位于各個結點的內部結結點是構成并行機的最基本單位。以圖1.3為例結點個進程將并行地運行在結點的各個微處理器上。每個微處理器擁有局部的二級高速緩存（L2cache）。L2cache是現代高性能微處理器用于彌補日益增長的CPU執(zhí)行速度和內存速度差距（訪存墻）而采取的關鍵部件。它按cache映射策略緩存內存的數據，同CPUcache提供計算數據。CPUcache些內容。有者請參考專著[12]。當前，集線器可以提供給微處理器每秒數十GB的訪存帶寬和百個納秒之內的訪存延遲，以及最快每秒6.4GB的互聯網絡帶寬。當處理器個數較少時，例如8–16個以內，集線器一般采用高速傳統地，11小。例如，10.4個字節(jié)的內存單元。如果604個處理器的單結2408GB以上。于是，64首先，介紹互聯網絡拓撲結構的幾個重要定義結點距離：兩個結點之間的圖的邊的最少條數網絡直徑：網絡中任意兩個結點之間的最長距離延遲稱為網絡的最小延遲，所有結點之間的最大延遲稱為網絡的最大延遲；折半寬度對分帶寬（它們的結點數相等，或者至多相差1）時，必須去掉的邊的最少條數，或1.1:L與它們之間的距離m有一個簡單的關系式其中，L0為相鄰兩個結點之間的延遲，δ表示消息一個結點所需的開銷。一般的，δ!L0。因此，當并行機包含的結點個數較少控制在2個微秒差之內1.2:點對點帶寬是指連接兩個結點之間的物理通道在單位時間內可傳輸的字節(jié)總數。通常這種傳輸是即沿兩個不同的:BN的消息傳遞的時間可近似寫為：TpNq N 結構中，如果兩個結點之間存在直接物理連接，則稱之互為相鄰結點。論著[2]詳細地討論了當前并行機采用的各類靜態(tài)拓撲結構，包括陣(array)(ring)、網格(mesh)、網格環(huán)(torus，也叫環(huán)面)、樹1.4(a)PP個pijij0P1，相互連接的充要條 1i, 0,..., 1.4(b)PPpi和結點pj相互連接的充要條件是： 1mod 0,..., 高到2，網絡直徑從P1減少rP2s1，是對一維陣列的有效改(a)一維陣 (b)1.44網格和網格環(huán)如圖1.5(a)所示，d(d?2)維網格包含PP0P1 Pd1個結點，所有結點排列成d維陣列，結點0,i1,,id1q和結點0,j1,,jd1q相互連接的充要條件是

?如圖1.5(b)所示，d(d?2)維網格環(huán)包含PP0P1 Pd1個結點，所有結點排列成d維陣列，結點0,i1,,id1q和結點0,j1,,jd1q相互連接的充要條件是?容易容易看出，網格和網格環(huán)的結點的度均為2d，網格的網絡直

1: jk 1mod

d1 1q，而網格環(huán)的網絡直徑等 d1prPks1q有關網k k 和網格環(huán)的折半寬度，請讀者自己計算(作業(yè)3)樹如圖1.6(a)所示，標準二叉樹拓撲結構包含P 2N個葉結二維網圖1.5含 4個結點的二維網格和網格環(huán)的拓撲結2logP，非據等，但是，它的折半寬度只為1，不利于結點之間的大數據量通信X–1.68個結點的二叉樹和X–樹的拓撲結是將每層結點形成環(huán)；或者也就是多叉?zhèn)€內結點的超立1.7(a)和圖1.7(b)所示，d維超立(d包含 2d個結點，結點i的二進制編號 id 0, 結點 id1和結點 jd1相互連接的充要條件 1 Dp?

2d1d，隨并行機規(guī)模的增加而增不超過5維。例如，SGIOrigin系列并行計算機的SuperLinker網絡，采用5維的嵌套超立方體拓撲結構，實現高效的通信。動態(tài)拓撲結構是指，結點之間無固定的物理連接，而是在連接路徑的交叉點處用電子開關、路由器或仲裁器等提供動態(tài)連接，主要單總線接理模塊和/O備座，在主設備（處理器）和從設備（器）之間傳遞數據，其特征(a)三維超立方1.7超立方體拓撲結150MHz，總線寬度為64位，則該總線的帶寬為采用公平的協議與仲裁算法，以確定在某個時刻選擇哪個例如，SGIPowerChallengeXL系列共享服務器，多個CPU共享總線，在處理器和模塊之間傳遞數據。又如，IBM并行機ASCIWhite16IBMPowerPC處理器，結點內大多數用于充當并行機單個結點內部多個CPU之間的連接通道。多層總線在并行機的結點內部，多個處理器共享本地總線，而單一可擴展能力。圖1.8(a)給交叉開關(crossbarswitch)所有結點通過交叉開關陣列相互和“閉”兩種狀態(tài)。圖1.8(b)給出了一個4 4的交叉開關拓撲結兩級總441.8NN陣列，但在每一行時只能接通N對結點。結構為NN的交叉開關只能提供2N在大規(guī)模并行機中的應用。交叉開關一般僅適合數個處理器的情形，或者，在結點內部為處理器和器之間提供快速高效通道。多級互聯網絡(IN:lisageIcocion)連接，可以動態(tài)地設置開關狀態(tài)。多級互聯網絡的典型代表為蝶網、CC網和ees紹，有者請參考[][]。，寬帶互聯網絡隨著網絡技術的成熟寬帶互聯網絡逐步成為連接微機而構成簡易并行機的互聯網絡，并且，相繼推出了除了MPP系統采用靜態(tài)的拓撲結構外，微機機群均采用寬帶，(1)以太 (Ethernet)。以太網絡是早期網絡連接最常用的802.3國際標準相繼推出了三代網絡，性能分別為10Mbps（82為100Mbps，連接8臺處理機，則每臺處理機的平均帶寬僅為12.5Mbps(2)交換機（switch）。交換機內部采用全互聯方式，可同時(3)微機機群互聯網絡，它們的功能類似于交換機，但是，10μs。請參考[13]。6μs。請參考[14]。于6μs。請參考[15]。多級體系結得益于主頻和量指令級流水線技術的發(fā)展，現代微處理器的發(fā)展仍然遵循ooe定律，峰值運算速度每18速度卻沒有得到平衡的發(fā)展。相比較而言，內存的速度要比處理器執(zhí)行速度慢很多，難以發(fā)揮微處理器的峰值速度，這就...(memorywall)為了盡量克服內存墻對性能的影響，一個簡捷的方法是，在內存和處理器之間增加一個高速緩沖區(qū)，稱為cache緩存內存模塊的部分數據，盡量將內存的轉換為對cache的，cache稱為二cache(L2cache)。在處理器內部，還存在一，cachecache(L1cache)。L1cache連接CPUL2cacheL2cache中的數據到寄存器中。位于最頂層的是CPU，它從寄存器中數據；寄存器從L1cache中數據。CPU寄存器和L1cache構成微處理器(chip)L1微處理器和L2cache通常可視為微處理器。多個微處理器和它還存在其他結點的局部內存模塊稱之為內存空間。顯然，是，訪存速度越來越快，即訪存延遲越來越小，帶寬越來越高。以圖1.9多級結構示意500MHzIn Pentium–III為處理器的微機機群為例假設處理器之包括兩個方面，一個是cae的映射策略，即ce是如何從內存中下面主要從這兩個方面來介紹并行機的多級體系結構。這些內在當Cachecache(line)cache線包L8個字節(jié)。例如，L4cache線包4832個字節(jié)；L8cache8864個字個字cachecache線為基本單位，即數據從內存調入cache時，不是以該單個數據字為單位，而是以Lcache，cachecache線中的位置。因此，通過cache線的一次調入，隨后的數據可能就落在Fortran循環(huán)。DODOI=1,A(I)=A(I)+5.0*B(I)假設沒有cache，則內存讀次數為2M次。如果有cache，則內存次數下降為2M{L次。從而，由前面的多級結構性能分析數據可知，cache的使用必定加快程序的執(zhí)行速度。一次內存操作，如果操作數存在于cache中，則稱該次問是cache..的，否則，稱該次cache..的。為了衡量cachecache為，程序執(zhí)行過程中，cache命Cachecache容量、cache線大小、cache個數、cache的映射策略、cache線的置換策略、cache數Cache中，大量數據表明，超大容量cache并不能顯著提高性能，反而顯著容量一般為1MB–16MB，且只程序的數據；L1cache的容量比L2cache的容量小幾個數量級，一般為數KB到數十KB。CacheCache大小也應該有一個合適的長度。當前，cache4–8Cachecache一般還分為兩個一個指令，另一個數據。二級cacheCachecache線之間建立相互映射關系，是具體實現只能到被映射的cache線中，而cache線中的數據也能夠且只能被映射到對應的內存塊中。當前，cache的映射策略可分為.....、K–...............所謂直接映射策略，指每個內存塊只能被唯一地映射到一條cae線中。cacheM2rcache(每條線的長度L2w個字)j塊內存將被映射到第i條cache線中，其中 mod 假設內存地址空間（以字為單位）總共可用 psrqrw位表示cache線之間的映射關系條cache線對應2sr個內存塊。例如，假D20r8w表示，內存總共包含220個字，cache包含 28條線cache線的422個字。則內存中地址為aa0a1a19a20的字將被唯一地映射到第ba11a18條cache線的ca19a20個字節(jié)處。每cache線對應1024個連續(xù)的數據單元位于不同的內存塊中，而這些塊被映射到同一條cache線中，連續(xù)的數據將引起頻繁的cache線置cacheMcache線，M2r，cache線L2wNML2rw，假設程序有四個數COMMONCOMMON/XXX/A(N),B(N),C(N),則下面的循環(huán)將發(fā)生嚴重的cacheDODOI=1,A(I)=A(I)+B(I)+C(I)+D(I)I的同一個元素被映射到換，cache對程序的性能沒有任何改進。為了改進上面的cache，從程序設計的角度，通常采用“補邊法(padding)”，在COMMON塊的設計中，每個數組的長數組之間增加一些輔助數組，使得各個數組至少錯開一條cachecache線。例COMMONCOMMON/XXX/A(N),X1(K),B(N),X2(K),C(N),X3(K),其實，在某些編譯器中，有自動補邊的優(yōu)化功能K–路組關聯映射策略(K–waysetassociationmapCacheVKcache線組成，內存塊按直接映射策略映射到某個組，但是在該組中，內存塊可到cache中的K條cache線的任何一條。具體算法為：址之間的自然cache線長度2w個字，cache包含V2dK2rcache線，內存空間包含2sw2sdr個字的內存塊被映射到同一個cache組中。例如，對前面的例子，如果K4，則cache就可被消除。cache映射策略是2–路或4–路組關全關聯映射策略(fullassociationmap內存塊可以被映射到ce中的任意一條e映射策略的實現比較復雜，通常只有理論上存在的價值，在實際中并不多見。Cache線FIFO(FirstInputFirstOutput)線LFULeastFrequentlyUsed)線隨機算法：隨機選擇一條cache線置換Cache顯然，為了保持計算結果的正確性，必須設計某種策略，保持cache數據和內存數據的一致性。通常有兩Write–through策略：cache線中的數據一旦被修改，則立即寫Write–backcache線置換時，或者有外部請求內存塊時，將cache線的數據寫入內存。綜上所述，以讀操作為例，cache的工作流程可用圖1.10示意訪存型(UMA：UniformMemoryAccessmodel)(NUMA：Non-UniformMemoryAccessmodel)(DMA：Distri-butedMemoryAccessmodel)及混合訪存模(HMA：HybridMem-oryAccessmodel)四類。本小節(jié)只是簡單地介紹這些模型的主要特均勻訪存模型。如圖1.2所示，內存模塊與結點分離，分別位1.10Cache讀操作工作流程示意物理器被所有結點共享所有結點任意單元的時間相同CPU可帶有局部私有高速緩存I/O 當前對稱多處理共享并行機P:SmmeicMti-Processing均采用這種模型。在并行機的分類中將再討論此類并行機的主要特征。非均勻訪存模型。如圖.3訪存模型也可稱為分布共享訪存模型。該模型具有如下典型特征：物理器被所有結點共享，任意結點可以直接任意結點內存模塊的速度不同：本地模塊的速度一般是其他結點內存模塊的3倍以上；CPU可帶有局部私有高速緩存非均勻訪存模型的典型例子為SGIOrigin系列并行機，它們采用基于cache Cache–CoherentNonuniformMemoryAccess），設計了專門的硬致性。限于篇幅，這里不介紹并行機各個結點之間的cache一1.3所示，并行機分類單指令多數據流（ID：按同一條指令，并行機的各個不同的功能部件同時對不同的數據進行不同的處理，例如：傳統的0年代初期的陣列機CM–行機可分為對稱多處理共享并行機（SMP：SymmetricMulti-Processing）分布共享并行機（DSM：DistributedSharedMem-MassivelyParallelProcessing）等五類。對稱多處理共享并行機（SMP。如圖.11模塊和處理器對稱地分布在互聯網絡的兩側，內存屬典型的型SP并行機有如下主要特征：對稱共享：系統中任何處理器均可直接任何模塊中的單元和I/O問成功的概率是一致的。所有內存單元統一編址。各個處理器之間的地位等價，不存在任何處理器。操作系統可在任意處理器上運行。單一的操作系統映像：全系統只有一個操作系統駐留在共享器中，它據各個處理器的負載情況，動態(tài)分配個進程到各個處理器，并保持各處理器間的負載平衡。ace局部cce，它們可以擁有獨立的局部數據，但是這些數據必中據一。/寫操作系統提供的共享數據緩存區(qū)來完成處理器間的通信，其延遲通常小于網絡通信的延遲。共享總線帶寬：所有處理器共享總線的帶寬，完成對內存模塊和I/O模塊的。支持消息傳遞、共享并行程序設計SMP欠可靠：總線、器或操作系統失效可導致系統32倍，跟不上處理器速度和內存容量的增加步伐，因此，SMP并行機的處理器個數一SMP1.11SMPSGIPOWERChallengeXL系列并行機（36MIPSR10000微處理器COMPAQAlphaserver84005/440（12Alpha微處理器HP9000/T600（12HPPA9000微處理器IBMRS6000/R40（8RS6000微處理器多處理共享并行機的可擴展能力。DSM并行機具有如下主個CPU擁有自己的局部cache，并共享局部器和I/O物理上分布：內存模塊分布在各結點中，并通過高SMP訪存總線的帶寬瓶頸，單一的內存地址空間：盡管內存模塊分布在各個結點，但網絡連接形成了并行機的共享器。各個結點既可以直接本地局部內存單元，又可以直接其他結點的局部內存單元。非一致內存（NUMA）模式：由于遠端必須通過高遠端的延遲一般是本地延遲的3倍以上。單一的操作系統映像：類似于SMP，在DSM并行機中，cache的數據一致性：通常采用基于的cache一致性協議來保證各結點的局部cache數據與器中數據DSMCC–NUMA低通信延遲與高通信帶寬：的高性能互聯網絡使得結點間的延遲很小，通信帶寬可以擴展。例如，SGIOrigin3000的雙向點對點通信帶寬可達3.2GB/s1μs。浮點運算性能。例如，SGIOrigin–200064個結點（512CPU），SGIAltix512個結支持消息傳遞、共享并行程序設計分布共享并行機的典型代表為GIOii0（圖.GIOigin300和GIAixGIAix供給用戶的是一個單一操作系統的用戶交互式界面，可以象工作站一樣被用戶使用。同時，由于它實現了全局硬件編址的分布共享，進程間消息傳遞的延遲低于1個微秒，帶寬高達/機群系統。請參考第1.2.8節(jié)(第18頁)星群系統。請參考第1.2.8節(jié)(第19頁)儲系統，其體系結構如圖1.12所示。其典型特I/O結點組成，每個結點局部cache，并通過局部總線或互聯網絡與局部內存模塊和這些結點由局部高性能網卡NIC)通過高性能互聯網絡相靜態(tài)拓撲結構耦合而成的混合拓撲結構，其通信延遲和通信帶寬均明顯優(yōu)于機群互聯網絡。PP的各個結點均擁有不同的操作系統映像。一般情況下，用戶可以將作業(yè)提交給作業(yè)管理系統，由它負責調度當PP也允許用戶登錄到某個特定的結點，或在某些特定的結點上運行作業(yè)。各個結點間的內存模塊相互獨立，且不存在全局內存單元的統一硬件編址。一般情形下，各個結點只能直接自身的局部內存模塊，如果要求直接其他結點的局部內Fortran并行程序設計，不支持全局共享的OpenMP并行程序設計模式。1.12MPP體系結構典型示意當前，TOP500中第一的BlueGene/L就是典型MPPMPP1.2.8(19頁)基本概念，重點在于學習消息傳遞或者共享并行編程所必須了解UNIX操作系統幾乎是當前所有高性能并行機（SMP、DSM、 lation、MPP）采用的標準操作系統，其中包括SGI公司的IRIX，COMPAQ公司的True64，HP公司的HPUX，IBM公司的AIXSUN公司的Solaris和自由軟件Linux等。雖然各并行機廠商研制的UNIX操作系統的實現原理不盡相同，但是，它們給用戶提供的基本UNIX操作系統界面是大體一致的。因此，用戶只要對UNIX操作系統有一定的了解，就可以方便地使用以上介紹的各在程序設計語言方面，SMP、DSMMPP并行機一般均提供符合國際標準的Fortran77/90、C/C++、HPF等語言，而機群系GNUFortran77/95、GNUC/C++等語言。特別地，1.4.2將介紹各類并行機支持的并行程序設計平臺?，F代NX一個重要概念便是進程(prcess)。正是由于多個進程之間的相互通信，進任何進程總和程序聯系在一起，程序一旦在具體操作系統環(huán)境中投入運行，就變成了進程。各個進程擁有獨立的執(zhí)行環(huán)境，其中包括內I/O進程具有兩個明顯的特征：一個是資源特征，包括那些程序執(zhí)I/O設進程執(zhí)行過程中動態(tài)改變的特征，例如（即進程執(zhí)行的指令序列、進程的控制與執(zhí)行狀態(tài)等。進程的資源特征反映了進任何進程，在執(zhí)行過程中，均涉及如下幾種狀態(tài)：非存在狀態(tài)就緒狀態(tài)：進程由其父進程（例如，操作系統的內核進程或進程，或其他應用程序進程）調入并準運行狀態(tài)CPU和其他必需的計算資源，并執(zhí)行指掛起狀態(tài)CPU或其他必需的計算資源被其他進程占有，退出狀態(tài)：進程正常結束或因異常退出而被廢棄只對消息傳遞并行程序設計感的讀者，了解以上的進程概進程間通信無論位于同一臺處理機，還是位于不同處理機，進程始終是操作系統資源調度的基本單位，且各個進程不能直接其他進程的于同一臺處理機或不同處理機的多個進程之間相互交流信息，具體。個進程之間傳遞的數據為..，稱這種操作為....。顯然，..：同步是使位于相同或不同處理機中的多個進程之間相互態(tài)之后才進行。其實，同步也是進程之間相互通信的式。..(..)：將位于相同或不同處理機中的多個進程的局部結果綜合起來，通過某種操作，例如求最大值、最小值、累同步和，統稱為.....，而操作的具體數據對象為..，具體操作為....。進程間通信的具體實現大體可以分為兩類（在共享環(huán)中，通過讀/寫操作系統提供的共享數據緩存區(qū)來實現（2在分布現的具體細節(jié)對并行編程的用戶都是的，用戶看到的均是統一的（PI。MPI線由于管理重量級進程的高開銷較大地影響了并行機性能的發(fā)揮，解兩個一部分由其資源特稱之為進....... 所示，進程的指令路徑可以分解為并行的互不相關的多條子路CPU，對不同的數據進行處理，從而達到提高進程執(zhí)行速度圖開銷也遠遠小于進程間的切換開銷。因此，線程的管理開銷遠遠小于進程的管理開銷，比較適合細粒度的共享的并行程序設計。共享并行編程基于線程級細粒度并行，僅被SP和M支持數據的共享，所以并行編程的難度較小，但一般情形展性。但是，消息傳遞并行編程只能支持進程間的分布模式，內存空間的只能通過消息傳遞來實現。因此，學習和使用消息傳遞并行編程的難度均大于共享和數據并行兩種編程由于當前流行的各類SMP、DSM、MPP和微機機群等并行機傳遞并行程序從而簡化并行程序設增強程序的可移植性。1.1特消息傳典型代可移植并行粒異異數據模共共顯隱較容偏可擴展好較一MPI表示每個進程的局部內存空間，多個“P/M”1.14P/M模塊替換成處理器，且規(guī)定每個處并行機模型實際上屬于典型的分布式并行機，且每臺處理器只1.14這里，有必要說明的是，消息傳遞分布式并行機模型和具體（SPDMclsercosaionPP，用戶面對的都是該模型隱含的進程拓撲結構，只是各類具體并行機實現的消息傳遞函數庫的方式不同，但用戶無須知道這些細節(jié)。例如，在共享PDSM在PPPDM并行機內部是通過共享數據緩存SPDM圖14所示的分布式并行機模型。標準消息傳遞界面1994年6月，全球工業(yè)、和科研應用部門聯合推出消息傳遞并行編程環(huán)境的標準用戶界面（MPI），它將消息傳遞并行編程環(huán)境分解為兩個部分，第一是構成該環(huán)境的所有消息傳遞函數的標準接口說明，它們是根據并行應用程序對消息傳遞功能的不同要求而制定的，不考慮該函數能否具體實現；第二是各并行機廠商提供的對這PI庫函數的標準接口，PI并行程序，便可在支持PIPI系統就是指所有這些具有標準接口說明的消息傳遞函數所構成的函數庫。入實現進程MPI消息傳遞庫函數，就構成了MPI并行程序設計所依賴的并行編程環(huán)境。MPI吸收了眾多消息傳遞系統的優(yōu)點，例P4、PVM、Express、PARMACS等，是目前國內外最流行象、石油、、空氣動力學、核物理等）的科研與工程軟件已經移植到MPI平臺。有精確的定義，從而為并行軟件的發(fā)展提供了必要的條件了如下的消息傳遞功能I/O：允許多個進程同時讀/寫同（與penP的混合并行編程（動態(tài)進程管理：允許并行應用程序在執(zhí)行過程中，動態(tài)地增加和刪除進程個數（4單邊通信：允許某個進程對其他進程的局部內存單元直接執(zhí)行讀/寫，而不要對方進程的顯式干預（5并行應用程序之間的動態(tài)互操作：允許各個PI并行應用程序之間動態(tài)地建立和刪除消息傳遞通信通道。并行算法....是適合在并行機上實現的算法，一個好的并行算法應計算方法數值離散后，剩下的問題就是如何設計并行算法，編制并目前，并行算法根據運算基本對象的不同可分為：數值并行算主要為數值計算方法而設計的并行算法主要為符號運算而設計的并行算法，如圖論算根據并行進程間相互執(zhí)行順序關系的不同可分為：同步并行算法進程間由于運算執(zhí)行順序而必須相互等待的并行異步并行算法進程間執(zhí)行相對獨立，不需要相互等待的一種算法，通常針對消息傳遞ID算的整個過程中均不需要等待，而是根據消息決定進程的繼續(xù)或終止；獨立并行算法進程間執(zhí)行是完全獨立的，計算的整個過程不需要根據各進程承擔的計算任務粒度的不同，可分為：細粒度并行算通常指基于向量和循環(huán)級并行的算法中粒度并行算法通常指基于子任務級并行的算法，例如通常的并行算法的幾個重要發(fā)展階段可分為基于向量運算的并行算法該類算法是隨著向量機(如CRY–1YH–1等)的出現而出現0年代末和80名的成果為遞歸問題的向量化。我國在這方面有很好的研究和[]?；诙嘞蛄刻幚頇C的并行算法設計階如CRYYPY的出現而出現的，其特點是既要考慮到多處理機間的任務級大粒度并行，又要考慮到單處理機上的向量級細粒度并行。該類算法在0年代初期和中期比較流行，目前一直持在這方面SIMDCM-2、Systolic陣列、Transputer等類并行機上的并行算法。該類并行算法研究在80年代中期比較熱門，但由于缺少一般性，過分MIMD該類并行機的顯著特點是處理器功能比較強大，能獨立處理各求解同一問題。并且，處理器間單位數據的通信開銷通常遠遠高于處理器的單位運算開銷。因此，該類并行機通常需要任務級并行機。興起于80現代并行算法設計展性和可移植性。但隨著微處理器和互聯網絡速度的發(fā)展，可擴展高性能的獲取必須要求并行算法設計兼顧兩個發(fā)展方向：第一， 0，請設計一個算法，在最短的時間內完成這N個數相加P2NM3個結點，請給出一維陣列（環(huán)、點個數為P）的結點度、點對點延遲（以的邊的條數為單假設8個結點，分別連接在1Gbps100Mbps24switch上，請問任意兩個結點間的平均帶寬為多簡單闡述當前并行計算機的多級結構，以及在程序設計中如何適應這種結構。闡述當前流行的并行計算機的分類，以及各類并行機體系結構的主要特征。2章LinuxLinux操作系統PCClusterLinux操作系統的一些基本知識有Linux的安裝和基本使用，以及在2.3節(jié)。如果對于該系統下的程序設計也已Linux操作系統進行工作可以認為，LinuxUNIX操Windows1操作系統完成日常工作，并且具有程本章將在此基礎上講述Linux操作系統的安裝、使用以及在LinuxLinuxLinuxLinux系統，需要進行一些硬件以避免出現一些硬件支持方面的問題。Linux系統對太過時的硬件1Windows 公司的商標WindowsLinux操作系統時可以保留已有的操作系統，但必須在硬盤上留出安裝Linux所Windows中的某個非系統分區(qū)，或是借助一些工具，如PartitionMagic，調Windows分區(qū)的大小來達到這一目的。建議至少保留5GB的空間給Linux系統用，其中4.5GBLinux的文件系統，0.51GB另外一個備是一套ix系統的安裝光。光盤裝是目前最簡單的裝方Lix系統可以通許多其式安裝軟U網卡至直接貝硬盤區(qū)或文系統可以等熟了Lix裝ix系統的安光盤可以過商網可己前上或上供的Lix有很版本們被稱不同的版(isii)，這樣局面出現是為ix是一個開放碼的操系統，任人都以將Lx核些軟合起一。te它有都方如使計沒么別的硬件，該裝iws操作系沒有什顯差別，過非常單也好只跟裝的行就以鑒于本章后介紹主基由eat(紅帽)司支持的Fea，建最好安裝eaCe(htp/ /)，以本閱練。安裝時將第一張光盤放入光驅，接通計算機的電源，設置計算經驗的人或者在網絡上尋求幫助。另外，市場上大量關于Lx系統安裝的入門資料亦可參考。超級用戶，用戶名為root，它是計算機的管理員帳戶，在安裝過程中也要為超級用戶設置一個口令。一般來說，在使用Linux系統工每個版都帶有豐富的軟件。如果為Linux系統留出的硬盤Linux操作系統Linux的各種發(fā)LinuxLILOGrub。新引導程序允許用等。選擇啟動Linux，便可以進入到剛剛安裝的Linux系統中。Lix系統默的文件統格式是ex2，它的后繼ex3。其他操作系統一樣，Linux 的文件系統采用的也是樹形結構樹的根就...(tiec)，用個正斜杠“”表，樹的子是文件，中間結點則是。要注意的是，Liux的路徑名中用正斜杠“/”分隔名，而Windows中用的則是反斜杠“\”。Linux系統的 /usr/home：普通用戶的家所在的位置，可以選擇將它放在一個不/procLinux內 /sbin/bin/boot/initrd：系統啟動用的文件/lib：庫文其他：/opt，/misc，/var：這些普通用戶基本上不用；需要的是系統日志文件在/var/log下面。/usr是所有中最復雜的一為除了最基本的系統軟件裝在/opt/usr/local下面)。其中包含的主要有：這個中；裝在/opt；等。XLinux/UNIX的圖形界面軟件，圖形用戶界面的軟件通常都在該中；share/man和share/doc家。通常，普通用戶的家/home下，名字和用戶名相同。普通用戶能夠修改的主要內容局限在自己的家例如，作者的用戶名是rli，家的位置就是/home/rli。Linux系統后，首先看到的是一個登錄界面，通常是Linux系統時為自己創(chuàng)建的用戶名，緊接著根據提雖然Linux系統提供了與Windows操作系統類似的圖形界面，但對于編程者來說，學會直接使用Linux令行操作依然十分重錄的，則需要首先啟動一個s..，例如點擊系統菜單中的“系統工具—終端”，然后才能在窗口中輸入命令。S字面上的令，并將命令執(zhí)行結果返回給用戶。S本身也是一個應用程序，有很多不同類型的s可供選擇，比較常用的有Bournes、Cs、Korns、TCs和Zshs等。在Linux中，最常用的是Bash，其全稱是Bourne–AgainS，它是Bournes的一個擴展版本。S窗口也叫....，其中運行著一個交互式s[rli@arenatmp]$出一個提示符，等待用戶輸入命令。S提示符的形式是可以配置[rli@arenatmp]$命令名[可選項1可選項2...]參數1參數2$s提示符前輸入一條命令，命令名[可選項1可選項2...]參數1參數2[rli@arenatmp]$su-su轉換成為超級用戶，為此，只需在s提示符前輸入命令[rli@arenatmp]$su-[root@arena[root@arena系統會提示要求輸。輸入超級用戶的口令后，系統提示符會“$”“#”，su命令后面加“-”的主要作用是為了得到超級用戶的路徑，以便直接使用/sbin和/usr/sbin中令。帳號Linux系統最重要的配置文件之一是/etc/passwd，它記載著系統中所有用戶的信息。在傳統的UNIX系統中，該文件用戶的單獨在另外一個文件/etc/shadow中，所以/etc/passwd中實容在命令執(zhí)行前后的變化來了解命令的確切作用。Linux中添加新用戶令為useradd，它的簡單語法為useradd[-d][-g組名][-s用戶由于后續(xù)介紹中將采用上面的格式來介紹許多Linux命令的語法，這里稍稍做些解釋。在上面的格式中命令名為useradd，寫在方括 (默認值為/home/用戶名)，組名指定新用戶所屬的用戶組(稍后解釋)，s指定用戶的默認，即用戶登錄時自動獲得的s(默認值為/bin/bash)。例如， [root@arena[root@arenatmp]#useradd-gusers-s/bin/bash添加一個名為aaa的新用戶，該用戶屬于用戶組users，s/bin/bash。上述命令的執(zhí)行會使得/etc/passwd文件中增加下面文件/etc/passwd中每行定義一個用戶，由用冒號分割開的幾是一個x，真實的口令在文件/etc/shadow中)、用戶號(uid)、和s。刪除一個用戶令userdeluserdel[-r]用戶“-r”[root@arena[root@arenatmp]#passwd[用戶名[root@arenatmp]#[root@arenatmp]#usermod-s/bin/csh會將用戶aaa的默認s改成Cs(/bin/csh)個用戶可以同時屬于多個用戶組，/etc/passwd中給出的用戶組是組的信息在文件/etc/group中。對于用戶組的管理也有相應令，如groupadd、groupdel等。為了將一個用戶加入某個組或者從某個組去掉，可以使用命令gpasswd[root@arenatmp]#groupaddvisitor[root@arenatmp]#groupaddvisitor[root@arenatmp]#gpasswd-daaavisitor[root@arenatmp]#groupdelvisitor上述命令中，首先創(chuàng)建了一個叫做visitor的用戶組，然后將用戶aaa加入到該組。這樣，用戶aaausersvisitorvisitor/etc/group(gname)(grouppassword)，組號(gid)，最后是屬于該用戶組的用戶名列表。Linux

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 人人文庫網僅提供信息存儲空間，僅對用戶上傳內容的表現方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

x-數值-并行計算導論

文檔簡介

溫馨提示

最新文檔

評論

x-數值-并行計算導論

文檔簡介

溫馨提示

最新文檔

評論

相關文檔