版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 第第8 8章章 并行處理機(jī)并行處理機(jī)8.1 并行處理機(jī)模型并行處理機(jī)模型8.2 并行處理機(jī)結(jié)構(gòu)并行處理機(jī)結(jié)構(gòu)8.3 并行處理機(jī)實(shí)例并行處理機(jī)實(shí)例并行性的兩個(gè)方面:并行性的兩個(gè)方面:(1)同時(shí)性并行Simultaneity:兩個(gè)或兩個(gè)以上事件在同一時(shí)刻發(fā)生。(2)并發(fā)性并行Concurrency:兩個(gè)或兩個(gè)以上事件在同一時(shí)間間隔內(nèi)發(fā)生。 三條技術(shù)途徑:三條技術(shù)途徑:(1)資源重復(fù):重復(fù)設(shè)置多個(gè)部件來(lái)提高速度。(2)時(shí)間重疊:流水線(3)資源共享:分時(shí)系統(tǒng),分布式系統(tǒng)8.1 并行處理機(jī)模型并行處理機(jī)模型1. 并行處理機(jī)的定義并行處理機(jī)的定義 在在同一個(gè)同一個(gè)控制部件控制部件CU控制下,按照一定控
2、制下,按照一定方式互連的方式互連的多個(gè)多個(gè)處理部件處理部件PU對(duì)各自的數(shù)據(jù)完對(duì)各自的數(shù)據(jù)完成成同一條指令同一條指令規(guī)定的操作。從規(guī)定的操作。從CU看,指令是看,指令是串行執(zhí)行的,從串行執(zhí)行的,從PU看,數(shù)據(jù)是并行處理的。看,數(shù)據(jù)是并行處理的。 并行處理機(jī)也稱為陣列處理機(jī),按照Flynn分類法,它屬于SIMD處理機(jī)。2. 并行處理機(jī)的主要應(yīng)用領(lǐng)域并行處理機(jī)的主要應(yīng)用領(lǐng)域 用于高速向量或矩陣運(yùn)算。3. 并行處理機(jī)的操作模型并行處理機(jī)的操作模型 M(N,C,I,M,R) 其中: N:PE個(gè)數(shù)個(gè)數(shù)。如IlliacIV有64個(gè)PE; C:控制部件:控制部件CU執(zhí)行的指令集執(zhí)行的指令集,包括標(biāo)量指 令和程
3、序控制指令; I:所有:所有PE并行執(zhí)行的指令集并行執(zhí)行的指令集,包括ALU、數(shù)據(jù)傳送等操作; M:屏蔽操作集:屏蔽操作集,將PE劃分為允許操作和禁止操作兩個(gè)子集; R: 數(shù)據(jù)尋徑集數(shù)據(jù)尋徑集,互連網(wǎng)絡(luò)中PE間通信所需要的各種模式 。 4. H.J.Siegel提出的并行處理機(jī)模型提出的并行處理機(jī)模型 P0M0PE0P1M1PE1P2M2PE2Pn-1Mn-1Pen-1互連網(wǎng)絡(luò)控制器一臺(tái)并行處理機(jī)由五個(gè)部分組成:一臺(tái)并行處理機(jī)由五個(gè)部分組成:多個(gè)處理單元多個(gè)處理單元PEPE;多個(gè)存儲(chǔ)器模塊多個(gè)存儲(chǔ)器模塊M M;一個(gè)控制器一個(gè)控制器CUCU;一個(gè)互連網(wǎng)絡(luò)一個(gè)互連網(wǎng)絡(luò)ICNICN;一臺(tái)輸入輸出處理
4、機(jī)一臺(tái)輸入輸出處理機(jī)IOPIOP。8.2 并行處理機(jī)結(jié)構(gòu)并行處理機(jī)結(jié)構(gòu) 8.2.1 基本結(jié)構(gòu)基本結(jié)構(gòu) 并行處理機(jī)有兩種典型結(jié)構(gòu):并行處理機(jī)有兩種典型結(jié)構(gòu):分布存儲(chǔ)器并行處理機(jī);分布存儲(chǔ)器并行處理機(jī);共享存儲(chǔ)器并行處理機(jī)。共享存儲(chǔ)器并行處理機(jī)。 8.2.2 分布存儲(chǔ)器并行處理機(jī)分布存儲(chǔ)器并行處理機(jī) 目前的大部分并行處理機(jī)屬于基于分布式存儲(chǔ)器模型。分布式存儲(chǔ)器并行處理機(jī)比較容易構(gòu)成MPP (Massively Parallel Processor),可以有幾十萬(wàn)個(gè)處理部件PE。 CUIOPLM0LM1LMn-1PE0PE1PEn-1互連網(wǎng)絡(luò) 分布式存儲(chǔ)器并行處理機(jī)的結(jié)構(gòu)框圖分布式存儲(chǔ)器并行處理機(jī)的
5、結(jié)構(gòu)框圖 CU是控制部件。對(duì)于標(biāo)量指令,在CU中直接執(zhí)行;對(duì)于向量指令,CU把它廣播到各個(gè)PE中去執(zhí)行。在CU中通常有一個(gè)較大容量的存儲(chǔ)器,用來(lái)存放程序和共享數(shù)據(jù)。LM0互連網(wǎng)絡(luò)PE0LM1PE1LMn-1PEn-1IOPCU IOP是輸入輸出處理機(jī),或稱為主機(jī)。在IOP上安裝操作系統(tǒng),它除了負(fù)擔(dān)輸入輸出工作外,還負(fù)責(zé)程序的編輯、編譯和調(diào)試等工作。 IOP可以是一臺(tái)通用計(jì)算機(jī)。LM0互連網(wǎng)絡(luò)PE0LM1PE1LMn-1PEn-1IOPCULM0互連網(wǎng)絡(luò)PE0LM1PE1LMn-1PEn-1IOPCULM和PE組成了PU陣列。LM0互連網(wǎng)絡(luò)PE0LM1PE1LMn-1PEn-1IOPCU8.2.
6、3 共享存儲(chǔ)器并行處理機(jī)共享存儲(chǔ)器并行處理機(jī) 共享多體并行存儲(chǔ)器SM通過(guò)互連網(wǎng)絡(luò)與各處理單元PE相連。PE0互連網(wǎng)絡(luò)PE1PEn-1IOPSM0SM1SMk-1 CU 存儲(chǔ)模塊的數(shù)目等于或略大于處理單元的數(shù)目。為了實(shí)現(xiàn)無(wú)沖突訪問(wèn),存儲(chǔ)模塊的個(gè)數(shù)為質(zhì)數(shù)。 PE0互連網(wǎng)絡(luò)PE1PEn-1IOPSM0SM1SMk-1 CU 在存儲(chǔ)模塊之間合理分配數(shù)據(jù),通過(guò)靈活、高速的互連網(wǎng)絡(luò),使存儲(chǔ)器與處理單元之間的數(shù)據(jù)傳送在大多數(shù)向量運(yùn)算中都能以存儲(chǔ)器的最高頻率進(jìn)行,而最少受存儲(chǔ)器沖突的影響。 因此,對(duì)互連網(wǎng)絡(luò)的要求很高。對(duì)互連網(wǎng)絡(luò)的要求很高。PE0互 連 網(wǎng) 絡(luò)PE1PEn-1IOPSM0SM1SMk-1 CU
7、PE0互 連 網(wǎng) 絡(luò)PE1PEn-1IOPSM0SM1SMk-1 CU 共享存儲(chǔ)器模型的處理單元數(shù)目一般不多,幾個(gè)至幾十個(gè)。 Burroughs Scientific Processor(BSP)采用了這種結(jié)構(gòu)。16個(gè)PE通過(guò)一個(gè)1617的對(duì)準(zhǔn)互連網(wǎng)絡(luò)訪問(wèn)17個(gè)共享存儲(chǔ)器模塊。 存儲(chǔ)器模塊數(shù)與PE數(shù)互質(zhì)可以實(shí)現(xiàn)無(wú)沖突并行訪問(wèn)存儲(chǔ)器。PE0互 連 網(wǎng) 絡(luò)PE1PEn-1IOPSM0SM1SMk-1 CU主要特點(diǎn)如下:主要特點(diǎn)如下:1. 速度快,而且潛力大速度快,而且潛力大2. 模塊性好,生產(chǎn)和維護(hù)方便模塊性好,生產(chǎn)和維護(hù)方便3. 可靠性高,容易實(shí)現(xiàn)容錯(cuò)和重構(gòu)可靠性高,容易實(shí)現(xiàn)容錯(cuò)和重構(gòu)4. 效率
8、低效率低8.2.4 并行處理機(jī)的特點(diǎn)并行處理機(jī)的特點(diǎn) 與流水線處理機(jī)、向量處理機(jī)等比較,并行處理機(jī)依靠的是資源重復(fù),而不是時(shí)間重疊,它的每個(gè)處理單元要擔(dān)負(fù)多種處理功能,其效率要低一些。5. 潛力大潛力大 主要依靠增加PE個(gè)數(shù),與流水線處理機(jī)主要依靠縮短時(shí)鐘周期相比,其提高速度的潛力要大得多。6. 依賴于互連網(wǎng)絡(luò)和并行算法依賴于互連網(wǎng)絡(luò)和并行算法 互連網(wǎng)絡(luò)決定了PE之間的連接模式,也決定了并行處理機(jī)能夠適應(yīng)的算法。7. 需要有一臺(tái)高性能的標(biāo)量處理機(jī)需要有一臺(tái)高性能的標(biāo)量處理機(jī) 如果一臺(tái)機(jī)器的向量處理速度極高,但標(biāo)量處理速度只是每秒一百萬(wàn)次,那么對(duì)于標(biāo)量運(yùn)算占10的題目來(lái)說(shuō),總的有效速度就不過(guò)是每
9、秒一千萬(wàn)次。8.3 并行處理機(jī)實(shí)例并行處理機(jī)實(shí)例 IlliacIV 是最先采用SIMD結(jié)構(gòu)的并行處理機(jī)。 隨后一個(gè)方向是用位片PE制造的并行處理機(jī),如Goodyear MPP、AMT/DAP610和TMC/CM-2 CM-5是以SIMD模式運(yùn)行的同步MIMD計(jì)算機(jī),另一方向是字寬運(yùn)算PE的中粒度SIMD計(jì)算機(jī)。并行處理機(jī)的兩個(gè)發(fā)展方向: 保留陣列結(jié)構(gòu),但每個(gè)處理單元的規(guī)模減小保留陣列結(jié)構(gòu),但每個(gè)處理單元的規(guī)模減小,如一個(gè)bit。 去掉陣列結(jié)構(gòu)和分布存儲(chǔ)器去掉陣列結(jié)構(gòu)和分布存儲(chǔ)器。Burroughs公司的BSP是代表。8.3.1 IlliavIV 并行處理機(jī)并行處理機(jī) 1963年,美國(guó)西屋電器公
10、司提出“Slotnick,The SOLOMON Computer,Simultaneous Operation linked Ordinal Modular Network”。 1966年美國(guó)國(guó)防遠(yuǎn)景研究規(guī)劃局ARPR與伊利諾依大學(xué)簽定合同。原計(jì)劃:256個(gè)PE,運(yùn)算速度為1GFLOPS。 Burroughs公司和伊利諾依大學(xué)于1972年共同設(shè)計(jì)和生產(chǎn),1975年實(shí)際投入運(yùn)行。用了4倍的經(jīng)費(fèi),只達(dá)到1/20的速度。只實(shí)現(xiàn)了8864個(gè)PE,只達(dá)到50MFLOPS。 IlliacIV的影響非常大。它是并行處理機(jī)的典型代表,也是分布存儲(chǔ)器并行處理機(jī)的典型代表。PEM63PEM0PEM1CUCDCB
11、IOMB6700CPUB6700內(nèi)存B6700多路開關(guān)B6700外圍設(shè)備IOS激光存儲(chǔ)器6464 X 8CU總 線控 制 線模 式 位 線APPA網(wǎng) 接 口1282561024I/O 總 線CDBPE63PE01024 實(shí) 時(shí) 裝 置48484848256PE0PE1PE63.DFSIlliacIV由三大部分組成由三大部分組成IlliacIV處理機(jī)陣列:88 PE、PEM和互連網(wǎng)絡(luò);陣列控制器CU;輸入輸出處理機(jī)IOP:一臺(tái)標(biāo)準(zhǔn)的 B6700計(jì)算機(jī)。1. 陣列控制器陣列控制器 陣列控制器CU實(shí)際上是一臺(tái)小型計(jì)算機(jī)。對(duì)陣列處理單元實(shí)行控制和完成標(biāo)量操作。對(duì)陣列處理單元實(shí)行控制和完成標(biāo)量操作。標(biāo)量
12、操作與各標(biāo)量操作與各PE的數(shù)組操作可以重疊執(zhí)行。的數(shù)組操作可以重疊執(zhí)行。 控制器的功能有以下五個(gè)方面:(1)對(duì)指令進(jìn)行譯碼,并執(zhí)行標(biāo)量指令;(2)向各PE發(fā)出執(zhí)行數(shù)組操作指令的控制信號(hào);(3)產(chǎn)生并向所有處理單元廣播公共的地址;(4)產(chǎn)生并向所有處理單元廣播公共的數(shù)據(jù);(5)接收和處理PE、I/O操作以及B6700產(chǎn)生的陷阱中斷信號(hào)。2. 輸入輸出系統(tǒng)輸入輸出系統(tǒng) IlliacIV的輸入輸出系統(tǒng)包括:磁盤文件系統(tǒng)DFS,I/O分系統(tǒng),一臺(tái)B6700處理機(jī)組成。 I/O分系統(tǒng)由三個(gè)部分組成:輸入輸出開關(guān)IOS,控制描述字控制器CDC,輸入輸出緩沖存儲(chǔ)器BIOM。3. IlliacIV處理陣列處理
13、陣列 IlliacIV處理陣列由64個(gè)PU組成。每個(gè)PU由處理部件PE和它的局部存儲(chǔ)器PEM組成。 每一個(gè)PUi只和它的東、西、南、北四個(gè)近鄰:PUi+1 mod 64、PUi-1 mod 64、PUi+8 mod 64、PUi-8 mod 64直接連接。 南北方向同一列PU連成一個(gè)環(huán), 東西方向構(gòu)成一個(gè)閉合螺線。 閉合螺線網(wǎng)絡(luò)直徑為閉合螺線網(wǎng)絡(luò)直徑為7步,步, 環(huán)形網(wǎng)格的直徑為環(huán)形網(wǎng)格的直徑為8步。步。 PU56 PU57 PU63 PU63 2 3 4 5 6 PU8 PU8 10 11 12 13 14 PU16 16 17 18 19 20 21 22 23 24 25 26 27 2
14、8 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 PU55 58 59 60 61 62 PU0 PU0 PU1 PU7 PU0 PU1 PU8 PU9 PU56 PU57 PU7 PU15 PU63 例如:從PU0到PU36,采用環(huán)行網(wǎng)格必須8步: PUPU0 0PUPU1 1PUPU2 2PUPU3 3PUPU4 4PUPU1212PUPU2020PUPU2828PUPU3636或 PUPU0 0PUPU8 8PUPU1616PUPU2424PUPU3232PUPU3333P
15、UPU3434PUPU3535PUPU3636 或 如果采用閉合螺旋線,只需要如果采用閉合螺旋線,只需要7 7步:步: PUPU0 0PUPU6363PUPU6262PUPU6161PUPU6060PUPU5252PUPU4444PUPU3636或PUPU0 0PUPU6363PUPU5555PUPU4747PUPU3939PUPU3838PUPU3737PUPU3636 或 對(duì)于nn個(gè)單元的陣列,網(wǎng)絡(luò)直徑為n-1n-1。二維閉合螺旋線網(wǎng)格網(wǎng)二維閉合螺旋線網(wǎng)格網(wǎng) 結(jié)點(diǎn)度為4,網(wǎng)絡(luò)直徑為n-1。 處理單元PE的主要部件有:4個(gè)64位寄存器(RGA,RGB,RGR,RGS)、算術(shù)單元AU、邏輯單元
16、LU、移位單元SU 、16位變址寄存器RGX和地址加法器ADA以及一個(gè)保存測(cè)試結(jié)果和PE屏蔽信息的8位模式寄存器RGM 。 RGA是累加寄存器,可存放操作結(jié)果。 RGR是數(shù)據(jù)傳送寄存器,用來(lái)接收和發(fā)送傳送的數(shù)據(jù)。數(shù)據(jù)在PE間傳送,即是指?jìng)魉图拇嫫鞯膬?nèi)容在傳送。 模式寄存器RGM的屏蔽信息用來(lái)規(guī)定PE處于活動(dòng)狀態(tài)還是非活動(dòng)狀態(tài)。若PE是活動(dòng)的,則它執(zhí)行從CU廣播來(lái)的指令。若PE是非活動(dòng)的,則它不執(zhí)行CU廣播給它的指令。4. 處理單元處理單元PE5. 并行算法舉例并行算法舉例 并行算法的一個(gè)關(guān)鍵是提高向量化的程度提高向量化的程度。 在設(shè)計(jì)并行算法時(shí),要特別注意: 數(shù)據(jù)在多個(gè)存儲(chǔ)模塊之間的分布,因此
17、,要解決好要解決好訪問(wèn)存儲(chǔ)器的沖突問(wèn)題。訪問(wèn)存儲(chǔ)器的沖突問(wèn)題。 并行處理機(jī)特別依賴于并行算法。依賴于并行算法。互連網(wǎng)絡(luò)并不能提供所有處理單元之間的連接,因此,并行算法要并行算法要充分利用互連網(wǎng)絡(luò)的結(jié)構(gòu)充分利用互連網(wǎng)絡(luò)的結(jié)構(gòu)。 并行算法要用并行程序?qū)崿F(xiàn),并行程序的編寫需要使用并行程序設(shè)計(jì)語(yǔ)言;要使編寫好的程序能在機(jī)器上運(yùn)行,還必須有并行編譯器;而編譯器在程序優(yōu)化的過(guò)程中又受制于機(jī)器的結(jié)構(gòu),因此編譯器往往依賴于機(jī)器。 (1)矩陣加()矩陣加(假定二個(gè)假定二個(gè)8x8的矩陣的矩陣A、B相加相加 )矩陣相加的存貯器分配 A(0,0)B(0,0)C(0,0)+1+2PEM0A(0,1)B(0,1)C(0,
18、1)+1+2PEM1A(7,7)B(7,7)C(7,7)+1+2PEM63.LDA ALPHA 全部(a)由PEMi送PEi的累加器RGAiADRN ALPHA+1 全部(a+1)與(RGAi)進(jìn)行相加, 結(jié)果 送RGAiSTA ALPHA+2 全部(RGAi)由PEi送PEMi的a+2單元這里,0i63。有限差分方法是一種通用和有效方法:把連續(xù)方程變換成離散形式。二階偏導(dǎo)數(shù)表示為差分形式:22220UxUy22222222UxU xhU xU xhhUyU xhU xU xhh(,)( ,)(,)( ,)( ,)( ,) y y y y y y(2) 有限差分問(wèn)題有限差分問(wèn)題并代入原方程,則
19、可得有限差分計(jì)算公式:其中:(x, y)為平面直角坐標(biāo), h為網(wǎng)格間距。 IlliacIV的陣列結(jié)構(gòu)特別適合計(jì)算這種在網(wǎng)格上定義的有限差分函數(shù)。 把內(nèi)部網(wǎng)格點(diǎn)分配給各個(gè)處理單元,計(jì)算過(guò)程可以并行完成。 運(yùn)算速度的提高可以與處理機(jī)數(shù)目成正比。U xU x hU xhU x hU xh()()()()(), y, y, y, y, y4(3) 矩陣乘矩陣乘 矩陣乘是典型的并行程序,非常適合在SIMD并行處理機(jī)上運(yùn)行。 例如:A、B、C均為88的二維矩陣,則CAB的計(jì)算公式為: 在串行機(jī)上要用一個(gè)三重循環(huán)程序,乘法和加法分別為512次。ca bijikkjk, 0i, j707 如果在并行處理機(jī)上求
20、解,F(xiàn)ORTRAN語(yǔ)言程序如下: DO 10 I0,7 C(I, J)=0 DO 20 K=0, 720 C(I, J)=C (I, J )+A(I, K) * B(K, J)10 CONTINUE 可以在8個(gè)PE的并行處理機(jī)運(yùn)行,運(yùn)算速度可提高8倍。也可在64個(gè)PE的并行處理機(jī)上運(yùn)行。在并行處理機(jī)上,J循環(huán)只需一次。 PE0PE0:c c0000a a0000b b0000a a0101b b1010a a0202b b2020a a0707b b7070 PE1 PE1:c c0101a a0000b b0101a a0101b b1111a a0202b b2121a a0707b b7
21、171 PE7 PE7:c c0707a a0000b b0707a a0101b b1717a a0202b b2727a a0707b b7777 PE0PE0:c c1010a a1010b b0000a a1111b b1010a a1212b b2020a a1717b b7070 PE1PE1:c c1111a a1010b b0101a a1111b b1111a a1212b b2121a a1717b b7171 PE7 PE7:c c1717a a1010b b0707a a1111b b1717a a1212b b2727a a1717b b7777 PE7 PE7:c
22、c7777a a7070b b0707a a7171b b1717a a7272b b2727a a7777b b7777局局部部存存儲(chǔ)儲(chǔ)器器中中的的數(shù)數(shù)據(jù)據(jù)分分布布如如下下: PEM0 PEM1 PEM2 PEM3 PEM4 PEM5 PEM6 PEM7 b00 b10 b70 c00 c10 c70 a00 a10 a70 b01 b11 b71 c01 c11 c71 a01 a11 a71 b02 b12 b72 c02 c12 c72 a02 a12 a72 b03 b13 b73 c03 c13 c73 a03 a13 a73 b04 b14 b74 c04 c14 c74 a04
23、 a14 a74 b05 b15 b75 c05 c15 c75 a05 a15 a75 b06 b16 b76 c06 c16 c76 a06 a16 a76 b07 b17 b77 c07 c17 c77 a07 a17 a77 數(shù)據(jù)如何分布到各個(gè)局部存儲(chǔ)器中?開 始i = 0C i , j = 0 , k = 0 讀讀 L L O O A A D D A A i i , , k k 播播送送 B B C C A A S S T T A A i i , , k k 乘乘 M M U U L L Y Y B B k k , , j j 加加 A A D D D D C C i i , , j
24、 j 保保存存 S S T T O O R R E E C C i i , , j j k = k + 1k = 8 ?i = i + 1i = 8 ?結(jié) 束 把N個(gè)數(shù)的順序相加變?yōu)椴⑿邢嗉印?串行求和的 FORTRAN 程序如下: C(-1)0 DO 10 I0, N10 C(I)C(I-1)A(I) 在并行處理機(jī)上,采用遞歸加法,F(xiàn)ORTRAN 程序如下: DO 10 I=0,log2N110 AASRL(A, 2*I) ;A向量右移向量右移2i個(gè)個(gè)PE 在并行處理機(jī)上只需做在并行處理機(jī)上只需做 log2N 次加法。次加法。4 求累加和求累加和第 三 步 : 0 0 0 0第 二 步 :
25、0 0第 一 步 : 0操 作 數(shù) :處 理 機(jī) : PE0 PE1 PE2 PE3 PE4 PE5 PE6 PE7A0A1A2A3A4A5A6A7A0A0+A1A1+A2A2+A3A3+A4A4+A5A5+A6A6+A7A0A0+A1A0A2A0A3A1A4A2A5A0.A0+A1A0A2A0A3A0A4A0A7A4A7A3A6A0A6A0A5遞歸求和算法的性能分析:遞歸求和算法的性能分析:運(yùn)算速度提高運(yùn)算速度提高:加速比為加速比為N/log2N倍倍運(yùn)算次數(shù)增加運(yùn)算次數(shù)增加:從從N次增加到次增加到Nlog2N次次效率降低效率降低:實(shí)際效率為實(shí)際效率為1/log2N如:N1024,速度提高,速
26、度提高100倍,運(yùn)算次數(shù)倍,運(yùn)算次數(shù)增加增加10倍,效率只有倍,效率只有1/10如果N220,即100萬(wàn)個(gè)數(shù)求和,速度可以提高5萬(wàn)倍。這種方法也稱為級(jí)聯(lián)求和,或遞歸求和。與流水線中采用的方法類似,它利用加法結(jié)合律來(lái)提高并行度。8.3.2 BSP處理機(jī)處理機(jī) BSP(Buroughs Scientific Processor)計(jì)算機(jī)是由美國(guó)寶來(lái)公司和伊利諾依大學(xué)于1979年制造的。 BSP是共享存儲(chǔ)器并行處理機(jī)的典型代表。BSP由5個(gè)部分組成:控制處理機(jī)、并行處理機(jī)、文件存儲(chǔ)器、并行存儲(chǔ)器模塊、對(duì)準(zhǔn)網(wǎng)絡(luò)。1. 并行處理機(jī)并行處理機(jī) 17個(gè)存儲(chǔ)模塊,每個(gè)模塊512K字,周期160ns5級(jí)流水線:級(jí)流水線:(1)從17個(gè)存儲(chǔ)模塊中讀出數(shù)據(jù)(2)通過(guò)輸出對(duì)準(zhǔn)網(wǎng)絡(luò)把數(shù)據(jù)送入16個(gè)并行處理部件(3)16個(gè)并行處理部件并行處理機(jī)數(shù)據(jù)(4)通過(guò)輸入對(duì)準(zhǔn)網(wǎng)絡(luò)把數(shù)據(jù)從并行處理部件送到并行存儲(chǔ)器(5)把接收到的數(shù)據(jù)寫入并行存儲(chǔ)器時(shí)鐘周期160ns,向量運(yùn)算速度向量運(yùn)算速度50MFLOPS。1 16 6算算術(shù)術(shù)單單元元( (A AE E5 5) )輸輸
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度農(nóng)機(jī)行業(yè)人才引進(jìn)與培養(yǎng)合同4篇
- 二零二五年度大摩退出中金項(xiàng)目合同終止倒計(jì)時(shí)通知2篇
- 2025年度南京家庭裝修工程竣工驗(yàn)收備案合同4篇
- 2025年度個(gè)人光伏發(fā)電貸款擔(dān)保合同3篇
- 2025版文化娛樂(lè)場(chǎng)所租賃及活動(dòng)策劃服務(wù)合同模板4篇
- 2025版儲(chǔ)罐泄漏檢測(cè)與預(yù)防措施合同范本3篇
- 2025版農(nóng)民合作社農(nóng)村農(nóng)村電商扶貧項(xiàng)目融資合同3篇
- 二零二五年度拋光設(shè)備生產(chǎn)與銷售合作合同4篇
- 2025年外墻涂料工程承包與節(jié)能評(píng)估合同4篇
- 二零二五年度場(chǎng)項(xiàng)目投標(biāo)失敗原因分析及合同解除條件合同4篇
- 《裝配式蒸壓加氣混凝土外墻板保溫系統(tǒng)構(gòu)造》中
- T-CSTM 01124-2024 油氣管道工程用工廠預(yù)制袖管三通
- 2019版新人教版高中英語(yǔ)必修+選擇性必修共7冊(cè)詞匯表匯總(帶音標(biāo))
- 新譯林版高中英語(yǔ)必修二全冊(cè)短語(yǔ)匯總
- 基于自適應(yīng)神經(jīng)網(wǎng)絡(luò)模糊推理系統(tǒng)的游客規(guī)模預(yù)測(cè)研究
- 河道保潔服務(wù)投標(biāo)方案(完整技術(shù)標(biāo))
- 品管圈(QCC)案例-縮短接臺(tái)手術(shù)送手術(shù)時(shí)間
- 精神科病程記錄
- 閱讀理解特訓(xùn)卷-英語(yǔ)四年級(jí)上冊(cè)譯林版三起含答案
- 清華大學(xué)考博英語(yǔ)歷年真題詳解
- 人教版三年級(jí)上冊(cè)口算題(全冊(cè)完整20份 )
評(píng)論
0/150
提交評(píng)論