計(jì)算機(jī)體系結(jié)構(gòu)第4章_第1頁(yè)
計(jì)算機(jī)體系結(jié)構(gòu)第4章_第2頁(yè)
計(jì)算機(jī)體系結(jié)構(gòu)第4章_第3頁(yè)
計(jì)算機(jī)體系結(jié)構(gòu)第4章_第4頁(yè)
計(jì)算機(jī)體系結(jié)構(gòu)第4章_第5頁(yè)
已閱讀5頁(yè),還剩67頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1 1/72/72第4章 向量處理機(jī)2 2/72/724.1向量的處理方式4.2向量處理機(jī)的結(jié)構(gòu)4.3提高向量處理機(jī)性能的常用技術(shù)4.4向量處理機(jī)的性能評(píng)價(jià) 4.5向量處理機(jī)實(shí)例3 3/72/72向量由一組有序、具有相同類型和位數(shù)的元素組成。 在流水線處理機(jī)中,設(shè)置向量數(shù)據(jù)表示和相應(yīng)的向量指令,稱為向量處理機(jī)。不具有向量數(shù)據(jù)表示和相應(yīng)的向量指令的流水線處理機(jī),稱為標(biāo)量處理機(jī)。典型的向量處理機(jī)q1976年年 Cray-1超級(jí)計(jì)算機(jī)超級(jí)計(jì)算機(jī) 浮點(diǎn)運(yùn)算速度達(dá)到了浮點(diǎn)運(yùn)算速度達(dá)到了每秒每秒1億次億次qCDC Cyber 205,Cray Y-MP,NEC SX-X/44,F(xiàn)ujitsu VP2600

2、等等 性能達(dá)到了性能達(dá)到了每秒幾十億幾百億每秒幾十億幾百億次浮點(diǎn)運(yùn)算次浮點(diǎn)運(yùn)算4 4/72/724.1 向量的處理方式 以計(jì)算表達(dá)式以計(jì)算表達(dá)式 D=A(BC)為例)為例 A、B、C、D 長(zhǎng)度為長(zhǎng)度為 N 的向量的向量5 5/72/724.1 向量的處理方式1. 橫向(水平)處理方式向量計(jì)算是按行的方式從左到右橫向地進(jìn)行。q先計(jì)算:先計(jì)算: d d1 1aa1 1(b(b1 1c c1 1) )q再計(jì)算:再計(jì)算: d d2 2aa2 2(b(b2 2c c2 2) )q q最后計(jì)算:最后計(jì)算: d dN NaaN N(b(bN Nc cN N) )組成循環(huán)程序進(jìn)行處理。 q qi ibbi i

3、c ci i d di iqqi ia ai iq數(shù)據(jù)相關(guān):數(shù)據(jù)相關(guān):N N次次 功能切換:功能切換:2N2N次次不適合于向量處理機(jī)的并行處理。6 6/72/724.1 向量的處理方式 縱向 (垂直)處理方式向量計(jì)算是按列的方式從上到下縱向地進(jìn)行。 q q1 1bb1 1c c1 1 d d1 1qq1 1a a1 1先計(jì)算先計(jì)算 再計(jì)算再計(jì)算 q qN NbbN Nc cN N d dN NqqN Na aN N表示成向量指令: Q QB BC C D DQ QA Aq兩條向量指令之間:兩條向量指令之間: 數(shù)據(jù)相關(guān):數(shù)據(jù)相關(guān):1 1次次 功能切換:功能切換:1 1次次7 7/72/724.1

4、 向量的處理方式 縱橫 (分組)處理方式又稱為分組處理方式。把向量分成若干組,組內(nèi)按縱向方式處理,依次處理各組。對(duì)于上述的例子,設(shè): N=SN=Sn nr rq其中其中N N為向量長(zhǎng)度,為向量長(zhǎng)度,S S為組數(shù),為組數(shù),n n為每組的長(zhǎng)度,為每組的長(zhǎng)度,r r為余為余數(shù)。數(shù)。q若余下的若余下的r r個(gè)數(shù)也作為一組處理,則共有個(gè)數(shù)也作為一組處理,則共有S+1S+1組。組。運(yùn)算過程為:8 8/72/724.1 向量的處理方式q先算第先算第1 1組:組: Q Q1 1n nBB1 1n nC C1 1n n D D1 1n nQQ1 1n nA A1 1n nq再算第再算第2 2組:組: Q Q(n

5、+1)(n+1)2n2nBB(n+1)(n+1)2n2nC C(n+1)(n+1)2n2n D D(n+1)(n+1)2n2nQQ(n+1)(n+1)2n2nA A(n+1)(n+1)2n2nq依次進(jìn)行下去,直到最后一組:第依次進(jìn)行下去,直到最后一組:第S+1S+1組。組。q每組內(nèi)各用兩條向量指令。每組內(nèi)各用兩條向量指令。 數(shù)據(jù)相關(guān):數(shù)據(jù)相關(guān):1 1次次 功能切換:功能切換:2 2次次9 9/72/72向量處理機(jī)的結(jié)構(gòu)因具體機(jī)器不同而不同。 由所采用的向量處理方式?jīng)Q定。由所采用的向量處理方式?jīng)Q定。有兩種典型的結(jié)構(gòu)q存儲(chǔ)器存儲(chǔ)器- -存儲(chǔ)器型結(jié)構(gòu)存儲(chǔ)器型結(jié)構(gòu) 縱向處理方式采用縱向處理方式采用q寄

6、存器寄存器- -寄存器型結(jié)構(gòu)寄存器型結(jié)構(gòu) 分組處理方式采用分組處理方式采用4.2 向量處理機(jī)的結(jié)構(gòu)1010/72/724.2 向量處理機(jī)的結(jié)構(gòu)4.2.1 “存儲(chǔ)器-存儲(chǔ)器”結(jié)構(gòu) 采用縱向處理方式的向量處理機(jī)對(duì)處理機(jī)結(jié)構(gòu)的要求:存儲(chǔ)器存儲(chǔ)器結(jié)構(gòu)向量指令的源向量和目的向量都是存放在存儲(chǔ)器 中,運(yùn)算的中間結(jié)果需要送回存儲(chǔ)器。 流水線運(yùn)算部件的輸入和輸出端都直接(或經(jīng)過 緩沖器)與存儲(chǔ)器相聯(lián),從而構(gòu)成存儲(chǔ)器-存儲(chǔ) 器型操作的運(yùn)算流水線。q例如:例如:STAR-100STAR-100、CYBER-205CYBER-2051111/72/724.2 向量處理機(jī)的結(jié)構(gòu)“存儲(chǔ)器存儲(chǔ)器存儲(chǔ)器存儲(chǔ)器”型操作的運(yùn)算

7、流水線型操作的運(yùn)算流水線 存存 儲(chǔ)儲(chǔ) 系系 統(tǒng)統(tǒng) 流水處理部件流水處理部件 緩沖器緩沖器 緩沖器緩沖器 1212/72/724.2 向量處理機(jī)的結(jié)構(gòu) 要充分發(fā)揮這種結(jié)構(gòu)的流水線效率,存儲(chǔ)器要不斷地提供源操作數(shù),并不斷地從運(yùn)算部件接收結(jié)果。 (每拍從存儲(chǔ)器讀取兩個(gè)數(shù)據(jù),并向存儲(chǔ)器寫回一個(gè)結(jié)果)(每拍從存儲(chǔ)器讀取兩個(gè)數(shù)據(jù),并向存儲(chǔ)器寫回一個(gè)結(jié)果)對(duì)存儲(chǔ)器的帶寬以及存儲(chǔ)器與處理部件的通信帶寬提出了非常高的要求。解決方法:一般是通過采用多體交叉并行存儲(chǔ)器和緩沖器技術(shù)。 例如,例如,70年代初問世的年代初問世的Star 100q存儲(chǔ)器:存儲(chǔ)器:32個(gè)體個(gè)體交叉交叉q每個(gè)體的數(shù)據(jù)寬度:每個(gè)體的數(shù)據(jù)寬度:8

8、個(gè)字個(gè)字(字長(zhǎng)(字長(zhǎng)64位位)q最大數(shù)據(jù)流量:最大數(shù)據(jù)流量:每秒每秒2億字億字1313/72/724.2 向量處理機(jī)的結(jié)構(gòu) 在向量的分組處理方式中,對(duì)向量長(zhǎng)度N沒有限制,但組的長(zhǎng)度n卻是固定不變的。對(duì)處理機(jī)結(jié)構(gòu)的要求:寄存器寄存器結(jié)構(gòu)設(shè)置能快速訪問的向量寄存器,用于存放源向量、目的向量及中間結(jié)果。讓運(yùn)算部件的輸入、輸出端都與向量寄存器相聯(lián),就構(gòu)成了“寄存器寄存器”型操作的運(yùn)算流水線。q典型的寄存器寄存器結(jié)構(gòu)的向量處理機(jī)典型的寄存器寄存器結(jié)構(gòu)的向量處理機(jī) 美國(guó)的美國(guó)的CRAY-1CRAY-1、我國(guó)的、我國(guó)的YH-1YH-1巨型機(jī)巨型機(jī)4.2.2 “寄存器-寄存器”結(jié)構(gòu)1414/72/724.2

9、向量處理機(jī)的結(jié)構(gòu)以CRAY-1機(jī)為例q美國(guó)美國(guó)CRAYCRAY公司公司 q19761976年年q每秒每秒1 1億次浮點(diǎn)運(yùn)算億次浮點(diǎn)運(yùn)算 q時(shí)鐘周期:時(shí)鐘周期:12.5ns12.5ns 1. CRAY-1的基本結(jié)構(gòu)功能部件 共有共有1212條條可并行工作的可并行工作的單功能流水線單功能流水線,可分別流,可分別流水地進(jìn)行地址、向量、標(biāo)量的各種運(yùn)算。水地進(jìn)行地址、向量、標(biāo)量的各種運(yùn)算。1616/72/724.2 向量處理機(jī)的結(jié)構(gòu)q6 6個(gè)單功能流水部件:個(gè)單功能流水部件:進(jìn)行向量運(yùn)算進(jìn)行向量運(yùn)算 n整數(shù)加(整數(shù)加(3 3拍)拍)n邏輯運(yùn)算(邏輯運(yùn)算(2 2拍)拍)n移位(移位(4 4拍)拍)n浮點(diǎn)加

10、(浮點(diǎn)加(6 6拍)拍)n浮點(diǎn)乘(浮點(diǎn)乘(7 7拍)拍)n浮點(diǎn)迭代求倒數(shù)(浮點(diǎn)迭代求倒數(shù)(1414拍)拍) 括號(hào)中的數(shù)字為其流水經(jīng)過的時(shí)間,每拍為一個(gè)括號(hào)中的數(shù)字為其流水經(jīng)過的時(shí)間,每拍為一個(gè)時(shí)鐘周期,即時(shí)鐘周期,即12.5ns12.5ns。1717/72/724.2 向量處理機(jī)的結(jié)構(gòu)向量寄存組Vq由由512512個(gè)個(gè)6464位位的寄存器組成,分成的寄存器組成,分成8 8塊塊。q編號(hào):編號(hào):V V0 0V V7 7q每一個(gè)塊稱為一個(gè)每一個(gè)塊稱為一個(gè)向量寄存器向量寄存器,可存放一個(gè)長(zhǎng)度,可存放一個(gè)長(zhǎng)度 (即元素個(gè)數(shù))不超過(即元素個(gè)數(shù))不超過6464的向量。的向量。q每個(gè)向量寄存器可以每拍向功能

11、部件提供一個(gè)數(shù)據(jù)元每個(gè)向量寄存器可以每拍向功能部件提供一個(gè)數(shù)據(jù)元素,或者每拍接收一個(gè)從功能部件來的結(jié)果元素。素,或者每拍接收一個(gè)從功能部件來的結(jié)果元素。標(biāo)量寄存器S和快速暫存器Tq標(biāo)量寄存器有標(biāo)量寄存器有8 8個(gè)個(gè):S S0 0S S7 7 64 64位位q快速暫存器快速暫存器T T用于在標(biāo)量寄存器和存儲(chǔ)器之間提供緩用于在標(biāo)量寄存器和存儲(chǔ)器之間提供緩 沖。沖。 1818/72/724.2 向量處理機(jī)的結(jié)構(gòu)向量屏蔽寄存器VMq6464位位,每一位對(duì)應(yīng)于向量寄存器的一個(gè)單元。,每一位對(duì)應(yīng)于向量寄存器的一個(gè)單元。q作用:作用:用于向量的歸并、壓縮、還原和測(cè)試操作、用于向量的歸并、壓縮、還原和測(cè)試操作

12、、 對(duì)向量某些元素的單獨(dú)運(yùn)算等。對(duì)向量某些元素的單獨(dú)運(yùn)算等。 CRAY-1向量處理的一個(gè)顯著特點(diǎn)每個(gè)向量寄存器Vi都有連到6個(gè)向量功能部件的單獨(dú)總線。每個(gè)向量功能部件也都有把運(yùn)算結(jié)果送回向量寄存器組的總線。 1919/72/724.2 向量處理機(jī)的結(jié)構(gòu)只要不出現(xiàn)Vi沖突和功能部件沖突,各Vi之間和各 功能部件之間都能并行工作,大大加快了向量指 令的處理。qV Vi i沖突:沖突:并行工作的各向量指令的源向量或結(jié)果向量并行工作的各向量指令的源向量或結(jié)果向量使用了相同的使用了相同的V Vi i。例如:例如:源向量相同源向量相同 V V3 3V V1 1V V2 2 V V5 5VV4 4V V1

13、1q功能部件沖突:功能部件沖突:并行工作的各向量指令要使用同一個(gè)并行工作的各向量指令要使用同一個(gè)功能部件。功能部件。例如:例如:都需使用乘法功能部件都需使用乘法功能部件 V V3 3VV1 1V V2 2 V V5 5VV4 4V V6 62020/72/724.2 向量處理機(jī)的結(jié)構(gòu) CRAY-1向量指令類型qV Vk k V Vi i op V op Vj jqV Vk k S Si i op V op Vj jqV Vk k 主存主存q主存主存 V Vi i 2121/72/72提高向量處理機(jī)性能的方法設(shè)置多個(gè)功能部件,使它們并行工作;采用鏈接技術(shù),加快一串向量指令的執(zhí)行;采用循環(huán)開采技術(shù)

14、,加快循環(huán)的處理;采用多處理機(jī)系統(tǒng),進(jìn)一步提高性能。4.3 提高向量處理機(jī)性能的常用技術(shù)2222/72/724.3 提高向量處理機(jī)性能的常用技術(shù)設(shè)置多個(gè)獨(dú)立的功能部件。這些部件能并行工作,并各自按流水方式工作,從而形成了多條并行工作的運(yùn)算操作流水線。例如:例如:CRAY-1CRAY-1向量處理機(jī)有向量處理機(jī)有4 4組組1212個(gè)個(gè)單功能流水部件:?jiǎn)喂δ芰魉考簄向量部件:向量加,移位,邏輯運(yùn)算向量部件:向量加,移位,邏輯運(yùn)算n浮點(diǎn)部件:浮點(diǎn)加,浮點(diǎn)乘,浮點(diǎn)求倒數(shù)浮點(diǎn)部件:浮點(diǎn)加,浮點(diǎn)乘,浮點(diǎn)求倒數(shù)n標(biāo)量部件:標(biāo)量加,移位,邏輯運(yùn)算,標(biāo)量部件:標(biāo)量加,移位,邏輯運(yùn)算, 數(shù)數(shù)“1”/1”/計(jì)數(shù)計(jì)

15、數(shù)n地址運(yùn)算部件:整數(shù)加,整數(shù)乘地址運(yùn)算部件:整數(shù)加,整數(shù)乘4.3.1 設(shè)置多個(gè)功能部件2323/72/724.3 提高向量處理機(jī)性能的常用技術(shù)1. 兩條向量指令占用功能流水線和向量寄存器的4種情況 指令不相關(guān)例如:例如:V0V1V2 V6V4*V5q這兩條指令分別使用各自所需的流水線和向量寄存器,這兩條指令分別使用各自所需的流水線和向量寄存器,可以并行執(zhí)行??梢圆⑿袌?zhí)行。 功能部件沖突例如:例如:V3V1V2 V6V4V54.3.2 鏈接技術(shù)2424/72/724.3 提高向量處理機(jī)性能的常用技術(shù)q這兩條指令都要使用加法流水線,發(fā)生了功能部件沖這兩條指令都要使用加法流水線,發(fā)生了功能部件沖突

16、(但向量寄存器不沖突)。當(dāng)?shù)谝粭l指令流出時(shí),突(但向量寄存器不沖突)。當(dāng)?shù)谝粭l指令流出時(shí),占用加法流水線。第二條指令要等加法流水線變成空占用加法流水線。第二條指令要等加法流水線變成空閑后,才能流出。閑后,才能流出。 源寄存器沖突例如:例如:V3V1V2 V6V1*V4q這兩條向量指令的源向量之一都取自這兩條向量指令的源向量之一都取自V1。由于兩者。由于兩者的首元素下標(biāo)可能不同,向量長(zhǎng)度也可能不同,所以的首元素下標(biāo)可能不同,向量長(zhǎng)度也可能不同,所以難以由難以由V1同時(shí)提供兩條指令所需要的源向量。同時(shí)提供兩條指令所需要的源向量。q這兩條向量指令不能同時(shí)執(zhí)行。只有等第一條向量指這兩條向量指令不能同時(shí)

17、執(zhí)行。只有等第一條向量指令執(zhí)行完、釋放令執(zhí)行完、釋放V1之后,第二條向量指令才能開始之后,第二條向量指令才能開始執(zhí)行。執(zhí)行。2525/72/724.3 提高向量處理機(jī)性能的常用技術(shù)結(jié)果寄存器沖突 兩條向量指令使用了相同的結(jié)果向量寄存器。例如:例如:V4V1V2 V4V3*V5q這兩條指令都要訪問目的寄存器這兩條指令都要訪問目的寄存器V4。由于第一條指。由于第一條指令在先,所以它先占用令在先,所以它先占用V4直到運(yùn)算完成,然后再流直到運(yùn)算完成,然后再流出后一條指令。出后一條指令。 當(dāng)前一條指令的結(jié)果寄存器是后一條指令的源寄存器、且不存在任何其他沖突時(shí),就可以用鏈接技術(shù)來提高性能。例如:例如:V3

18、V1V2 V6V3*V42626/72/724.3 提高向量處理機(jī)性能的常用技術(shù)向量流水線鏈接:具有先寫后讀相關(guān)的兩條指令,在不出現(xiàn)功能部件沖突和源向量沖突的情況下,可以把功能部件鏈接起來進(jìn)行流水處理,以達(dá)到加快執(zhí)行的目的。qCray-1向量處理的一個(gè)顯著特點(diǎn)向量處理的一個(gè)顯著特點(diǎn) q鏈接特性的鏈接特性的實(shí)質(zhì)實(shí)質(zhì) 把流水線把流水線定向定向的思想引入到向量執(zhí)行過程的結(jié)果的思想引入到向量執(zhí)行過程的結(jié)果。2727/72/724.3 提高向量處理機(jī)性能的常用技術(shù)鏈接時(shí),Cray-1中把向量數(shù)據(jù)元素送往向量功能部件以及把結(jié)果存入向量寄存器都需要一拍時(shí)間,從存儲(chǔ)器中把數(shù)據(jù)送入訪存功能部件也需要一拍時(shí)間。

19、(同步的要求)(同步的要求)2828/72/724.3 提高向量處理機(jī)性能的常用技術(shù) 例例4.1 考慮在考慮在Cray-1上利用鏈接技術(shù)執(zhí)行以下上利用鏈接技術(shù)執(zhí)行以下4條指令:條指令: V0存儲(chǔ)器存儲(chǔ)器/ 訪存取向量:訪存取向量:7拍拍 V2V0V1/ 向量加:向量加:3拍拍 V3V2A3 / 按(按(A3)左移:)左移:4拍拍 V5V3V4/ 與操作:與操作:2拍拍 畫出鏈接示意圖,并求該鏈接流水線的通過時(shí)間。如果向量長(zhǎng)畫出鏈接示意圖,并求該鏈接流水線的通過時(shí)間。如果向量長(zhǎng)度為度為64,則需要多少拍才能得到全部結(jié)果。,則需要多少拍才能得到全部結(jié)果。 解解 對(duì)這對(duì)這4條指令進(jìn)行分析可知:它們既

20、沒有部件沖突,也沒有條指令進(jìn)行分析可知:它們既沒有部件沖突,也沒有寄存器沖突,相鄰兩條指令之間都存在先寫后讀相關(guān),因而可以把寄存器沖突,相鄰兩條指令之間都存在先寫后讀相關(guān),因而可以把訪存流水線、向量加流水線、向量移位流水線以及向量邏輯運(yùn)算流訪存流水線、向量加流水線、向量移位流水線以及向量邏輯運(yùn)算流水線鏈接成一個(gè)較長(zhǎng)的流水線。水線鏈接成一個(gè)較長(zhǎng)的流水線。 1 2 3 V V0 0 1 2 4 6 1 2 3 5 a a 7 存儲(chǔ)器讀取流水線存儲(chǔ)器讀取流水線 存儲(chǔ)器存儲(chǔ)器 V V1 1 V V2 2 V V3 3 V V4 4 V V5 5 向量加向量加 c c 流水線流水線 d d d d f

21、f 1 2 3 4 左移流水線左移流水線 g g i i 向量與向量與 流水線流水線 j j j j l l Cray-1的流水線鏈接舉例的流水線鏈接舉例 3030/72/724.3 提高向量處理機(jī)性能的常用技術(shù)鏈接操作的時(shí)間圖:鏈接操作的時(shí)間圖: t0 t1 t2 t3 t4 t5 t6 t7 t8 t9 t10 t11 t12 t13 t14 t15 t16 t17 t18 t19 t20 t21 t22 t23 t24 t25 t26 t27 t28 t29 t30 t31 t32 V5-0 V5-1 V5-2 V5-3 V5-4 V5-5 V5-6 V5-7 V5-8 a b c d

22、e f g h i j k l 3131/72/724.3 提高向量處理機(jī)性能的常用技術(shù)a:存儲(chǔ)字到存儲(chǔ)字到“讀功能部件讀功能部件”的傳送時(shí)間的傳送時(shí)間 b:存儲(chǔ)字經(jīng)過存儲(chǔ)字經(jīng)過“讀功能部件讀功能部件”的通過時(shí)間的通過時(shí)間c:存儲(chǔ)字從存儲(chǔ)字從“讀功能部件讀功能部件”到到V0分量的傳送時(shí)間分量的傳送時(shí)間 d:V0和和V1中操作數(shù)到整數(shù)加功能部件的傳送時(shí)間中操作數(shù)到整數(shù)加功能部件的傳送時(shí)間e:整數(shù)加功能部件的通過時(shí)間整數(shù)加功能部件的通過時(shí)間 f:和從整數(shù)加功能部件到和從整數(shù)加功能部件到V2分量的傳送時(shí)間分量的傳送時(shí)間g:V2中的操作數(shù)分量到移位功能部件的傳送時(shí)間中的操作數(shù)分量到移位功能部件的傳送時(shí)

23、間 h:移位功能部件的通過時(shí)間移位功能部件的通過時(shí)間i:結(jié)果從移位功能部件到結(jié)果從移位功能部件到V3分量的傳送時(shí)間分量的傳送時(shí)間 j:V3和和V4中的操作數(shù)分量到邏輯部件的傳送時(shí)間中的操作數(shù)分量到邏輯部件的傳送時(shí)間k:邏輯功能部件的通過時(shí)間邏輯功能部件的通過時(shí)間 l:最后結(jié)果到最后結(jié)果到V5分量的傳送時(shí)間分量的傳送時(shí)間3232/72/724.3 提高向量處理機(jī)性能的常用技術(shù) 例例4.24.2 在在CRAY-1CRAY-1上用鏈接技術(shù)進(jìn)行向量運(yùn)算上用鏈接技術(shù)進(jìn)行向量運(yùn)算 D=AD=A(B+CB+C) 假設(shè)向量長(zhǎng)度假設(shè)向量長(zhǎng)度N64N64,向量元素為浮點(diǎn)數(shù),且向量,向量元素為浮點(diǎn)數(shù),且向量B B、

24、C C已存已存放在放在V V0 0和和V V1 1中。中。 畫出鏈接示意圖,并分析非鏈接執(zhí)行和鏈接執(zhí)行兩種情況下畫出鏈接示意圖,并分析非鏈接執(zhí)行和鏈接執(zhí)行兩種情況下的執(zhí)行時(shí)間。的執(zhí)行時(shí)間。 解解 用以下三條向量完成上述運(yùn)算:用以下三條向量完成上述運(yùn)算: V V3 3 存儲(chǔ)器存儲(chǔ)器/ / 訪存取向量訪存取向量A A V V2 2 V V0 0 V V1 1 / / 向量向量B B和向量和向量C C進(jìn)行浮點(diǎn)加進(jìn)行浮點(diǎn)加 V V4 4 V V2 2 V V3 3/ / 浮點(diǎn)乘,結(jié)果存入浮點(diǎn)乘,結(jié)果存入V V4 4 V4 V2 1 2 3 6 V0 V1 浮點(diǎn)加浮點(diǎn)加 1 2 3 7 V3 訪訪 存存

25、 4 6 1 2 3 5 存儲(chǔ)器存儲(chǔ)器 浮點(diǎn)乘浮點(diǎn)乘 鏈接示意圖鏈接示意圖 3434/72/724.3 提高向量處理機(jī)性能的常用技術(shù)3條指令全部用串行方法執(zhí)行,則執(zhí)行時(shí)間為: (1 16 61 1)N N11 (1 16 61 1)N N11 (1 17 71 1)N N1 = 3N 1 = 3N 22 22 (拍)(拍)前兩條指令并行執(zhí)行,然后再串行執(zhí)行第3條指令,則執(zhí)行時(shí)間為: (1 16 61 1)N N11 (1 17 71 1)N N1 1 = 2N = 2N 15 15 (拍)(拍)第1、2條向量指令并行執(zhí)行,并與第3條指令鏈接執(zhí)行。 (1 16 61 1) (1 17 71 1)

26、 (N N1 1) = N= N16 16 (拍)(拍)3535/72/724.3 提高向量處理機(jī)性能的常用技術(shù)進(jìn)行向量鏈接的要求保證:無向量寄存器使用沖突和無功能部件使用沖突保證:無向量寄存器使用沖突和無功能部件使用沖突q只有在前一條指令的第一個(gè)結(jié)果元素送入結(jié)果向量只有在前一條指令的第一個(gè)結(jié)果元素送入結(jié)果向量寄存器的那一個(gè)時(shí)鐘周期才可以進(jìn)行鏈接。寄存器的那一個(gè)時(shí)鐘周期才可以進(jìn)行鏈接。q當(dāng)一條向量指令的兩個(gè)源操作數(shù)分別是兩條先行指當(dāng)一條向量指令的兩個(gè)源操作數(shù)分別是兩條先行指令的結(jié)果寄存器時(shí),要求先行的兩條指令產(chǎn)生運(yùn)算結(jié)果令的結(jié)果寄存器時(shí),要求先行的兩條指令產(chǎn)生運(yùn)算結(jié)果的時(shí)間必須相等,即要求有關(guān)

27、功能部件的通過時(shí)間相的時(shí)間必須相等,即要求有關(guān)功能部件的通過時(shí)間相等。等。q要進(jìn)行鏈接執(zhí)行的向量指令的向量長(zhǎng)度必須相等,要進(jìn)行鏈接執(zhí)行的向量指令的向量長(zhǎng)度必須相等,否則無法進(jìn)行鏈接。否則無法進(jìn)行鏈接。3636/72/724.3 提高向量處理機(jī)性能的常用技術(shù) 如果向量的長(zhǎng)度大于向量寄存器的長(zhǎng)度,該如何處理呢? 當(dāng)向量的長(zhǎng)度大于向量寄存器的長(zhǎng)度時(shí),必須把長(zhǎng)向量分成長(zhǎng)度固定的段,然后循環(huán)分段處理,每一次循環(huán)只處理一個(gè)向量段。這種技術(shù)稱為分段開采技術(shù)。q由系統(tǒng)硬件和軟件控制完成,對(duì)程序員是透明的。由系統(tǒng)硬件和軟件控制完成,對(duì)程序員是透明的。 4.3.3 分段開采技術(shù)3737/72/724.3 提高向量

28、處理機(jī)性能的常用技術(shù) 例例4.34.3 設(shè)設(shè)A A和和B B是長(zhǎng)度為是長(zhǎng)度為N N的向量,考慮在的向量,考慮在Cray-1Cray-1向量處理器上向量處理器上實(shí)現(xiàn)以下的循環(huán)操作:實(shí)現(xiàn)以下的循環(huán)操作: DO 10 I = 1DO 10 I = 1,N N 10 A 10 A(I I)= 5.0 = 5.0 * * B B(I I) + C+ C3838/72/724.3 提高向量處理機(jī)性能的常用技術(shù)S S1 1 5.0 5.0 ;將常數(shù);將常數(shù)5.05.0送入標(biāo)量寄存器送入標(biāo)量寄存器S S1 1S S2 2 C C ;將常數(shù);將常數(shù)C C送入標(biāo)量寄存器送入標(biāo)量寄存器S S2 2VL NVL N

29、;在;在VLVL中設(shè)置向量長(zhǎng)度中設(shè)置向量長(zhǎng)度N NV V0 0 B B ;從將向量;從將向量B B讀入向量寄存器讀入向量寄存器V V0 0V V1 1 S S1 1 V V0 0 ;向量;向量B B中的每個(gè)元素分別和常數(shù)中的每個(gè)元素分別和常數(shù)S S1 1相乘相乘V V2 2 S S2 2 + V+ V1 1 ;向量;向量V V1 1中的每個(gè)元素分別和常數(shù)中的每個(gè)元素分別和常數(shù)S S2 2 相加相加A VA V2 2 ;將結(jié)果向量存入;將結(jié)果向量存入A A數(shù)組數(shù)組 當(dāng)當(dāng)N N 64 64時(shí),可以用以下指令序列:時(shí),可以用以下指令序列:3939/72/724.3 提高向量處理機(jī)性能的常用技術(shù)當(dāng)N

30、64時(shí),就需要進(jìn)行分段開采。q循環(huán)次數(shù)循環(huán)次數(shù)K K :q余數(shù)余數(shù)L L:q在進(jìn)入循環(huán)前,先對(duì)余數(shù)個(gè)元素進(jìn)行計(jì)算,然后用循在進(jìn)入循環(huán)前,先對(duì)余數(shù)個(gè)元素進(jìn)行計(jì)算,然后用循環(huán)的方式計(jì)算向量環(huán)的方式計(jì)算向量A的其他部分,每次循環(huán)計(jì)算的其他部分,每次循環(huán)計(jì)算64個(gè)個(gè)元素,而循環(huán)體則是由上述第元素,而循環(huán)體則是由上述第4條到第條到第7條向量指令組條向量指令組成。成。 64NK6464NNL4040/72/724.3 提高向量處理機(jī)性能的常用技術(shù) 許多新型向量處理機(jī)系統(tǒng)采用了多處理機(jī)系統(tǒng)結(jié)構(gòu)。例如:qCRAY-2CRAY-2n包含了包含了4 4個(gè)向量處理機(jī)個(gè)向量處理機(jī)n浮點(diǎn)運(yùn)算速度最高可達(dá)浮點(diǎn)運(yùn)算速度最高

31、可達(dá)1800MFLOPS1800MFLOPSqCRAY Y-MPCRAY Y-MP、C90C90 最多可包含最多可包含1616個(gè)向量處理機(jī)個(gè)向量處理機(jī) 4.3.4 采用多處理機(jī)系統(tǒng)4141/72/72衡量向量處理機(jī)性能的主要參數(shù) :向量指令的處理時(shí)間向量長(zhǎng)度為無窮大時(shí)的向量處理機(jī)的最大性能半性能向量長(zhǎng)度向量長(zhǎng)度臨界值4.4 向量處理機(jī)的性能評(píng)價(jià)R4242/72/724.4 向量處理機(jī)的性能評(píng)價(jià)1. 一條向量指令的處理時(shí)間Tvp 執(zhí)行一條向量長(zhǎng)度為n的向量指令所需的時(shí)間為:qTs :向量處理部件流水線的建立時(shí)間:向量處理部件流水線的建立時(shí)間 為了使處理部件流水線能開始工作(即開始流入數(shù)為了使處理

32、部件流水線能開始工作(即開始流入數(shù)據(jù))所需要的準(zhǔn)備時(shí)間。據(jù))所需要的準(zhǔn)備時(shí)間。 qTe :向量流水線的通過時(shí)間:向量流水線的通過時(shí)間第一對(duì)向量元素通過流水線并產(chǎn)生第一個(gè)結(jié)果所花的時(shí)間第一對(duì)向量元素通過流水線并產(chǎn)生第一個(gè)結(jié)果所花的時(shí)間 。qTc :流水線的時(shí)鐘周期時(shí)間:流水線的時(shí)鐘周期時(shí)間 4.4.1 向量指令的處理時(shí)間TvpcesvpTnTTT) 1( 4343/72/724.4 向量處理機(jī)的性能評(píng)價(jià)把上式中的參數(shù)都折算成時(shí)鐘周期個(gè)數(shù) :qs s:Ts所對(duì)應(yīng)的時(shí)鐘周期數(shù)所對(duì)應(yīng)的時(shí)鐘周期數(shù)qe: Te所對(duì)應(yīng)的時(shí)鐘周期數(shù)所對(duì)應(yīng)的時(shí)鐘周期數(shù)不考慮Ts,并令Tstart=e1 qTstart:從一條向

33、量指令開始執(zhí)行到還差一個(gè)時(shí)鐘周期從一條向量指令開始執(zhí)行到還差一個(gè)時(shí)鐘周期就產(chǎn)生第一個(gè)結(jié)果所需的時(shí)鐘周期數(shù)??煞Q之為該就產(chǎn)生第一個(gè)結(jié)果所需的時(shí)鐘周期數(shù)??煞Q之為該向向量指令的啟動(dòng)時(shí)間量指令的啟動(dòng)時(shí)間。此后,便是每個(gè)時(shí)鐘周期流出一。此后,便是每個(gè)時(shí)鐘周期流出一個(gè)結(jié)果,共有個(gè)結(jié)果,共有n個(gè)結(jié)果。個(gè)結(jié)果。 cvpTnesT)1(cstartvpTnTT4444/72/724.4 向量處理機(jī)的性能評(píng)價(jià) 一組向量指令的處理時(shí)間對(duì)于一組向量指令而言,其執(zhí)行時(shí)間主要取決于三個(gè)因素:q向量的長(zhǎng)度向量的長(zhǎng)度q向量操作之間是否存在流水功能部件的使用沖突向量操作之間是否存在流水功能部件的使用沖突 q數(shù)據(jù)的相關(guān)性數(shù)據(jù)的

34、相關(guān)性把能在同一個(gè)時(shí)鐘周期內(nèi)一起開始執(zhí)行的幾條向量指令稱為一個(gè)編隊(duì)。4545/72/724.4 向量處理機(jī)的性能評(píng)價(jià)q可以看出:同一個(gè)編隊(duì)中的向量指令之間一定不可以看出:同一個(gè)編隊(duì)中的向量指令之間一定不存在流水向量功能部件的沖突和數(shù)據(jù)的沖突。存在流水向量功能部件的沖突和數(shù)據(jù)的沖突。 編隊(duì)后,這個(gè)向量指令序列的總的執(zhí)行時(shí)間為各編隊(duì)的執(zhí)行時(shí)間的和 。qT(i)vp :第:第i個(gè)編隊(duì)的執(zhí)行時(shí)間個(gè)編隊(duì)的執(zhí)行時(shí)間qm:編隊(duì)的個(gè)數(shù):編隊(duì)的個(gè)數(shù) miivpallTT1)(4646/72/724.4 向量處理機(jī)的性能評(píng)價(jià)當(dāng)一個(gè)編隊(duì)是由若干條指令組成時(shí),其執(zhí)行時(shí)間就應(yīng)該由該編隊(duì)中各指令的執(zhí)行時(shí)間的最大值來確定。

35、 T(i)start:第第i編隊(duì)中各指令的啟動(dòng)時(shí)間的最大值編隊(duì)中各指令的啟動(dòng)時(shí)間的最大值 該組指令總的啟動(dòng)時(shí)間(時(shí)鐘周期個(gè)數(shù))該組指令總的啟動(dòng)時(shí)間(時(shí)鐘周期個(gè)數(shù)) q表示成時(shí)鐘周期個(gè)數(shù)表示成時(shí)鐘周期個(gè)數(shù) Tall = Tstart + mn(拍)(拍) cstartcmiistartcmiistartmiivpallTmnTTmnTTnTTT)()()(1)(1)(1)(miistartstartTT1)(4747/72/724.4 向量處理機(jī)的性能評(píng)價(jià) 例例4.44.4 假設(shè)每種向量功能部件只有一個(gè),假設(shè)每種向量功能部件只有一個(gè),而且不考慮向量而且不考慮向量鏈接,鏈接,那么下面的一組向量指令

36、能分成幾個(gè)編隊(duì)?那么下面的一組向量指令能分成幾個(gè)編隊(duì)? LV V1LV V1,Rx Rx / 取向量取向量x MULTSV V2 MULTSV V2,R0R0,V1 V1 / 向量向量x和標(biāo)量(和標(biāo)量(R0)相乘)相乘 LV V3LV V3,Ry Ry / 取向量取向量y ADDV V4 ADDV V4,V2V2,V3 V3 / 相加,結(jié)果保存到相加,結(jié)果保存到V4中中 SV RySV Ry,V4 V4 / 存結(jié)果存結(jié)果 解:解:分為四個(gè)編隊(duì)分為四個(gè)編隊(duì)p第一編隊(duì):第一編隊(duì):LVLVp第二編隊(duì):第二編隊(duì):MULTSVMULTSV; LVLVp第三編隊(duì):第三編隊(duì):ADDVADDVp第四編隊(duì):第四

37、編隊(duì):SVSV4848/72/724.4 向量處理機(jī)的性能評(píng)價(jià) 分段開采時(shí)一組向量指令的總執(zhí)行時(shí)間 當(dāng)向量長(zhǎng)度n大于向量寄存器長(zhǎng)度MVL時(shí),需要分段開采。引入一些額外的處理操作(假設(shè):這些操作所引入的額外時(shí)間為(假設(shè):這些操作所引入的額外時(shí)間為Tloop個(gè)時(shí)鐘周期)個(gè)時(shí)鐘周期)p設(shè)設(shè) q:余數(shù):余數(shù)q共有共有m個(gè)編隊(duì)個(gè)編隊(duì) 對(duì)于最后一次循環(huán)來說,所需要的時(shí)間為: Tlast = Tstart +Tloop+ mq pMVLn4949/72/724.4 向量處理機(jī)的性能評(píng)價(jià)其他的每一次循環(huán)所要花費(fèi)的時(shí)間為: Tstep = Tstart +Tloop+ mMVL總的執(zhí)行時(shí)間為: Tall = T

38、stepp+ Tlast=(Tstart +Tloop+ mMVL)p +(Tstart +Tloop+ mq )=(p +1)(Tstart +Tloop)+ m(MVLp+q)mnTTMVLnloopstart)(5050/72/724.4 向量處理機(jī)的性能評(píng)價(jià) 例例4.54.5 在某向量處理機(jī)上執(zhí)行在某向量處理機(jī)上執(zhí)行DAXPYDAXPY的向量指令序列,也即的向量指令序列,也即完成:完成: 其中其中X X和和Y Y是向量,最初保存在主存中,是向量,最初保存在主存中,是一個(gè)標(biāo)量,已存放是一個(gè)標(biāo)量,已存放在寄存器在寄存器F0F0中。它們的向量指令序列如下:中。它們的向量指令序列如下: YXa

39、YLV V1LV V1,RxRxMULTFV V2MULTFV V2,F(xiàn)0F0,V1V1LV V3LV V3,RyRyADDV V4ADDV V4,V2V2,V3V3SV V4SV V4,RyRy5151/72/724.4 向量處理機(jī)的性能評(píng)價(jià) 假設(shè)向量寄存器的長(zhǎng)度假設(shè)向量寄存器的長(zhǎng)度MVL=64,Tloop=15,各功能部件的啟,各功能部件的啟動(dòng)時(shí)間為:動(dòng)時(shí)間為: 取數(shù)和存數(shù)部件為取數(shù)和存數(shù)部件為12個(gè)時(shí)鐘周期;個(gè)時(shí)鐘周期; 乘法部件為乘法部件為7個(gè)時(shí)鐘周期;個(gè)時(shí)鐘周期; 加法部件為加法部件為6個(gè)時(shí)鐘周期。個(gè)時(shí)鐘周期。 分別對(duì)于不采用向量鏈接技術(shù)和采用鏈接技術(shù)的兩種情況,分別對(duì)于不采用向量鏈

40、接技術(shù)和采用鏈接技術(shù)的兩種情況,求完成上述向量操作的總執(zhí)行時(shí)間。求完成上述向量操作的總執(zhí)行時(shí)間。 解:解:當(dāng)不采用向量鏈接技術(shù)時(shí),當(dāng)不采用向量鏈接技術(shù)時(shí),可以把上述五條向量指令分成可以把上述五條向量指令分成4個(gè)編隊(duì):個(gè)編隊(duì):q第一編隊(duì):第一編隊(duì):LV V1LV V1,RxRx;q第二編隊(duì):第二編隊(duì):MULTFV V2MULTFV V2,F(xiàn)0F0,V1V1;LV V3LV V3,RyRy;q第三編隊(duì):第三編隊(duì):ADDV V4ADDV V4,V2V2,V3V3;q第四編隊(duì):第四編隊(duì):SV V4SV V4,RyRy。 Tstart=12+12+6+12,m=4 可知,對(duì)可知,對(duì)n個(gè)向量元素進(jìn)行個(gè)向量

41、元素進(jìn)行DAXPY表達(dá)式計(jì)算所需的時(shí)鐘周表達(dá)式計(jì)算所需的時(shí)鐘周期個(gè)數(shù)為:期個(gè)數(shù)為:nnnnmnTTMVLnTstartloopn457644)126121215(64)(5353/72/724.4 向量處理機(jī)的性能評(píng)價(jià) 采用向量鏈接技術(shù),那么上述采用向量鏈接技術(shù),那么上述5條向量指令的編隊(duì)結(jié)果如下(條向量指令的編隊(duì)結(jié)果如下(m=3) p第一編隊(duì):第一編隊(duì):LV V1,Rx;MULTFV V2,F0,V1;p第二編隊(duì):第二編隊(duì):LV V3,Ry;ADDV V4,V2,V3;p第三編隊(duì):第三編隊(duì): SV V4SV V4,RyRy 。 前兩個(gè)編隊(duì)中各自的兩條向量指令都可以鏈接執(zhí)行。根據(jù)鏈接的前兩個(gè)編

42、隊(duì)中各自的兩條向量指令都可以鏈接執(zhí)行。根據(jù)鏈接的含義可知:含義可知: q第一編隊(duì)啟動(dòng)需要第一編隊(duì)啟動(dòng)需要12+7=1912+7=19個(gè)個(gè)時(shí)鐘周期時(shí)鐘周期q第二個(gè)編隊(duì)啟動(dòng)需要第二個(gè)編隊(duì)啟動(dòng)需要12+6=1812+6=18個(gè)個(gè)時(shí)鐘周期時(shí)鐘周期q第三個(gè)編隊(duì)啟動(dòng)仍然需要第三個(gè)編隊(duì)啟動(dòng)仍然需要1212個(gè)個(gè)時(shí)鐘周期時(shí)鐘周期 5454/72/724.4 向量處理機(jī)的性能評(píng)價(jià)對(duì)對(duì)n個(gè)向量元素進(jìn)行計(jì)算所需的時(shí)鐘周期數(shù)為:個(gè)向量元素進(jìn)行計(jì)算所需的時(shí)鐘周期數(shù)為: nnnnmnTTMVLnTstartloopn364643)12181915(64)(5555/72/724.4 向量處理機(jī)的性能評(píng)價(jià)1. 向量處理機(jī)的峰

43、值性能 RR 表示當(dāng)向量長(zhǎng)度為無窮大時(shí),向量處理機(jī)的最高性能,也稱為峰值性能。對(duì)于上述例題4.5向量指令序列中的操作而言,只有“MULTFV V2,F0,V1”和“ADDV V4,V2,V3”兩條浮點(diǎn)操作向量指令。的時(shí)鐘周期數(shù)向量指令序列執(zhí)行所需時(shí)鐘頻率算次數(shù)向量指令序列中浮點(diǎn)運(yùn)nRlim4.4.2 最大性能R和半性能向量長(zhǎng)度n1/25656/72/724.4 向量處理機(jī)的性能評(píng)價(jià)的時(shí)鐘周期數(shù)的時(shí)鐘周期數(shù)向量指令序列執(zhí)行所需向量指令序列執(zhí)行所需時(shí)鐘頻率時(shí)鐘頻率算次數(shù)算次數(shù)向量指令序列中浮點(diǎn)運(yùn)向量指令序列中浮點(diǎn)運(yùn) nRlim 2 2 n n 200 200nlimn n6464 6464 3 3

44、 n n 2 2 n n 200 200nlim4 4 n n 100100 MFLOPS假設(shè)該向量處理機(jī)的時(shí)鐘頻率為200MHz,那么:5757/72/724.4 向量處理機(jī)的性能評(píng)價(jià) 半性能向量長(zhǎng)度n n1/21/2半性能向量長(zhǎng)度n n1/21/2是指向量處理機(jī)的性能為其最大性能的一半時(shí)所需的向量長(zhǎng)度。評(píng)價(jià)向量流水線的建立時(shí)間對(duì)性能影響的重要參數(shù)。 例例4.64.6 對(duì)于例對(duì)于例4.5,假設(shè)時(shí)鐘頻率為,假設(shè)時(shí)鐘頻率為200MHz,求半性能向量,求半性能向量長(zhǎng)度長(zhǎng)度n1/2。 假設(shè)該向量處理機(jī)的峰值性能假設(shè)該向量處理機(jī)的峰值性能R100 MFLOPS,所以根據(jù)半所以根據(jù)半性能向量長(zhǎng)度的定義有

45、:性能向量長(zhǎng)度的定義有: 5858/72/724.4 向量處理機(jī)的性能評(píng)價(jià)假設(shè)假設(shè) 6464,那么有:,那么有: n n1/21/2643n1/2 2n1/2 20050 8n1/2 5n1/2 64,n1/2 12.8n1/2 132n1/2 200643n1/2n1/264 505959/72/724.4 向量處理機(jī)的性能評(píng)價(jià) 向量長(zhǎng)度臨界值n nv v向量長(zhǎng)度臨界值n nv v是指:對(duì)于某一計(jì)算任務(wù)而言,向量方式的處理速度優(yōu)于標(biāo)量串行方式處理速度時(shí)所需的最小向量長(zhǎng)度。對(duì)于上述DAXPY的例子p假設(shè),在標(biāo)量串行工作方式假設(shè),在標(biāo)量串行工作方式下實(shí)現(xiàn)下實(shí)現(xiàn)DAXPYDAXPY循環(huán)的開循環(huán)的開

46、銷為銷為1010個(gè)個(gè)時(shí)鐘周期。那么在標(biāo)量串行方式下,計(jì)算時(shí)鐘周期。那么在標(biāo)量串行方式下,計(jì)算DAXPYDAXPY循環(huán)所需要的時(shí)鐘周期數(shù)為:循環(huán)所需要的時(shí)鐘周期數(shù)為: T Ts s =( 10 =( 10121212127 76 612 )12 )n nv v = 59n = 59nv v6060/72/724.4 向量處理機(jī)的性能評(píng)價(jià)q在向量方式下,計(jì)算在向量方式下,計(jì)算DAXPYDAXPY循環(huán)所需要的時(shí)鐘周期數(shù)為:循環(huán)所需要的時(shí)鐘周期數(shù)為: T Tv v = 64 = 643n3nv v q根據(jù)向量長(zhǎng)度臨界值的定義,有:根據(jù)向量長(zhǎng)度臨界值的定義,有: T Tv v = T = Ts s 64

47、643n3nv v = 59n = 59nv v=6456= 2nv6161/72/72美國(guó)和日本生產(chǎn)的一些向量處理機(jī)的簡(jiǎn)要信息 4.5 向量處理機(jī)實(shí)例4.5.1 具有代表性的向量處理機(jī)6262/72/72系統(tǒng)型號(hào)系統(tǒng)型號(hào)推出時(shí)間推出時(shí)間最大配置,時(shí)鐘周期,最大配置,時(shí)鐘周期,操作系統(tǒng)操作系統(tǒng)/編譯系統(tǒng)編譯系統(tǒng)特色和要點(diǎn)特色和要點(diǎn)Cray 1S1976年年有有10條流水線的單處理機(jī),條流水線的單處理機(jī),12.5ns,COS/CF7 2.1第一臺(tái)基于第一臺(tái)基于ECL的超級(jí)的超級(jí)計(jì)算機(jī)計(jì)算機(jī)Cray 2S/4-2561985年年256M字存儲(chǔ)器的字存儲(chǔ)器的4臺(tái)處理機(jī),臺(tái)處理機(jī),4.1ns,COS或

48、或UNIX/CF77 3.016K字的本地存儲(chǔ)器,字的本地存儲(chǔ)器,移植了移植了UNIX VCray X-MP 4161983年年16M字存儲(chǔ)器的字存儲(chǔ)器的4臺(tái)處理機(jī),臺(tái)處理機(jī),128M字字SSD,8.5ns,COS/CF77 5.0使用共享寄存器組用于使用共享寄存器組用于IPCCray Y-MP 8321988年年128M字存儲(chǔ)器的字存儲(chǔ)器的8臺(tái)處理機(jī),臺(tái)處理機(jī),6ns,CF77 5.0X-MP的改進(jìn)型的改進(jìn)型Cray Y-MP C-901991年年每臺(tái)處理機(jī)每臺(tái)處理機(jī)2條向量流水線,條向量流水線,16臺(tái)處理臺(tái)處理機(jī),機(jī),4.2ns,UNICOS/CF77 5.0最大的最大的Cray機(jī)器機(jī)器C

49、DC Cyber 2051982年年有有4條流水線的單處理機(jī),條流水線的單處理機(jī),20ns,虛擬虛擬OS/FTN200存儲(chǔ)器存儲(chǔ)器-存儲(chǔ)器系統(tǒng)結(jié)存儲(chǔ)器系統(tǒng)結(jié)構(gòu)構(gòu)4.5 向量處理機(jī)實(shí)例6363/72/724.5 向量處理機(jī)實(shí)例系統(tǒng)型號(hào)系統(tǒng)型號(hào)推出時(shí)間推出時(shí)間最大配置,時(shí)鐘周期,最大配置,時(shí)鐘周期,操作系統(tǒng)操作系統(tǒng)/編譯系統(tǒng)編譯系統(tǒng)特色和要點(diǎn)特色和要點(diǎn)ETA 10E1985年年單處理機(jī),單處理機(jī),10.5ns,ETAV/FTN 200Cyber 205的后繼型號(hào)的后繼型號(hào)NEC SX-X/441991年年每臺(tái)處理機(jī)每臺(tái)處理機(jī)4組流水線,組流水線,4臺(tái)處理機(jī),臺(tái)處理機(jī),2.9ns,F(xiàn)77SXFuji

50、tsu VP2600/101991年年5條流水線的單處理機(jī)和雙標(biāo)量處理?xiàng)l流水線的單處理機(jī)和雙標(biāo)量處理機(jī),機(jī),3.2ns,MSP.EX/F77 EX/VP使用可重構(gòu)微向量寄使用可重構(gòu)微向量寄存器和屏蔽存器和屏蔽Hitachi 820/801988年年512MB存儲(chǔ)器,存儲(chǔ)器,18個(gè)流水線功能部個(gè)流水線功能部件的單處理機(jī),件的單處理機(jī),4ns,F(xiàn)ORT 77/HAP V23-OC64個(gè)個(gè)I/O通道,最大傳通道,最大傳輸率為輸率為288MB/秒秒6464/72/724.5 向量處理機(jī)實(shí)例1. Cray Y-MP 816 1991年問世 系統(tǒng)結(jié)構(gòu)圖q可以配置可以配置1臺(tái)、臺(tái)、2臺(tái)、臺(tái)、4臺(tái)或臺(tái)或8臺(tái)處

51、理機(jī)臺(tái)處理機(jī)q8個(gè)個(gè)CPU共享中央存儲(chǔ)器、共享中央存儲(chǔ)器、I/O 子系統(tǒng)、處理機(jī)通信子系統(tǒng)、處理機(jī)通信子系統(tǒng)和實(shí)時(shí)時(shí)鐘子系統(tǒng)和實(shí)時(shí)時(shí)鐘qCPU的時(shí)鐘周期:的時(shí)鐘周期:6ns中央存儲(chǔ)器q分成分成256個(gè)交叉訪問的存儲(chǔ)體個(gè)交叉訪問的存儲(chǔ)體 通過每個(gè)通過每個(gè)CPU對(duì)對(duì)4個(gè)存儲(chǔ)器端口的交叉訪問可以個(gè)存儲(chǔ)器端口的交叉訪問可以實(shí)現(xiàn)對(duì)存儲(chǔ)器的重疊存取。實(shí)現(xiàn)對(duì)存儲(chǔ)器的重疊存取。 4.5.2 Cray Y-MP和C-90 CPU2CPU2 處理機(jī)之間通信處理機(jī)之間通信 實(shí)時(shí)鐘(實(shí)時(shí)鐘(64 位)位) 中央存儲(chǔ)器中央存儲(chǔ)器 V寄存器 8 個(gè)寄存器 每個(gè) V 寄存器 有64個(gè)64位 分量寄存器 發(fā)送寄存器 加/減、

52、移位、 向量功能部件 向量部分向量部分 T 寄存器 邏輯(64 位運(yùn)算) 屏蔽寄存器 (64 位) 向量長(zhǎng)度 (8 位) 加/減、倒數(shù)、乘、 浮點(diǎn)功能部件 近似(64 位運(yùn)算) (8 個(gè) 64 位 寄存器) S 寄存器 寄存器) (8 個(gè) 64 位 (8 個(gè) 32 位 寄存器) B 寄存器 A 寄存器 寄存器) (8 個(gè) 32 位 CPU1CPU1 加/減、移位、 標(biāo)量功能部件 邏輯(32 位運(yùn)算) 加/減、乘 地址功能部件 (32 位運(yùn)算) 指令緩沖區(qū) (512 個(gè) 16 位 指令區(qū)) 指令輸出 交換參數(shù) 寄存器 可編程時(shí)鐘(32 位) I/O 控制 性能監(jiān)控器 狀態(tài)寄存器 控制部分控制部分 標(biāo)量部分標(biāo)量部分 地址部分地址部分 I/OI/O 部分部分 外部設(shè)備外部設(shè)備 CPU3CPU3 CPU4CPU4 CPU5CPU5 CPU6CPU6 CPU7

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論