計算機體系結(jié)構(gòu)_第1頁
計算機體系結(jié)構(gòu)_第2頁
計算機體系結(jié)構(gòu)_第3頁
計算機體系結(jié)構(gòu)_第4頁
計算機體系結(jié)構(gòu)_第5頁
已閱讀5頁,還剩20頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

一、計算機體系結(jié)構(gòu)的基本概念

計算機體系結(jié)構(gòu)是指機器語言程序的設(shè)計者或是編譯程序設(shè)計

者所看到的計算機系統(tǒng)的概念性結(jié)構(gòu)和功能特性。Amdahl所定義的

體現(xiàn)結(jié)構(gòu)是指程序員面對的是硬件的系統(tǒng)。所關(guān)心的是如何合理的進(jìn)

行軟便件功能的分配。

計算機系統(tǒng)結(jié)構(gòu)是指機器語言級的程序員所了解的計算機的屬

性,即外特性??梢园瑪?shù)據(jù)表示,寄存器定義、數(shù)量、使用方式,

指令系統(tǒng),中斷系統(tǒng),存存儲系統(tǒng),IO系統(tǒng)等。

計算機組成是計算機結(jié)構(gòu)的邏輯實現(xiàn)??梢园瑪?shù)據(jù)通路寬度,

專用部件設(shè)置,緩沖技術(shù),優(yōu)化處理等。

計算機的實現(xiàn)是指其計算機組成的物理實現(xiàn)。包括處理機,主存

部件的物理結(jié)構(gòu),器件的集成度,速度的選擇,模塊、硬件、插件底

板的劃分和連接。

從使用語言的角度,可以把計算機系統(tǒng)按功能從高到低分為7

級:0應(yīng)用語言機器級、1高級程序語言機器級、2匯編語言機器級、

3操作系統(tǒng)機器級、4傳統(tǒng)機器語言機器級、5微程序機器級和6電

子線路級。3?6級為虛擬機,其語言功能均由軟件實現(xiàn)。

硬件功能分配的基木原則:(1)功能要求。首先是應(yīng)用領(lǐng)域?qū)?yīng)

的功能要求,其次是對軟件兼容性的要求;(2)性能要求。如運算速

度,存儲容量,可靠性,可維護(hù)性和人機交互能力等;(3)成本要求。

體系結(jié)構(gòu)設(shè)計的方法有三種:由上而下一從考慮如何滿足應(yīng)用要

求開始設(shè)計;由下而上一基于硬件技術(shù)所具有的條件;由中間開始的

方法。

體系設(shè)計的步驟:需求分析、需求說明、概念性設(shè)計、具體設(shè)計、

優(yōu)化和評價。

計算機體系結(jié)構(gòu)的分類:(1)弗林FLYNN分類法:按指令流和

數(shù)據(jù)流將計算機分為4類:①單指令流、單數(shù)據(jù)流一Single

InstructionStreamSingleDataStream,SISD?計算機,即傳統(tǒng)

的單處理機,通常用的計算機多為此類,如脈動陣列計算機systolic

array;②單指令流、多數(shù)據(jù)流一Multiple,SIMD。典型代表是并行

處理機。其并行性在于指令一級。如ILLIAC、PEPE、STARAN、MPP等;

③MISD計算機;④MIMD計算機。多處理機系統(tǒng),實現(xiàn)全面并行的理

想結(jié)構(gòu)??梢酝ㄟ^共享存儲器和消息傳遞來耦合系統(tǒng),每個處理器分

別執(zhí)行系統(tǒng)分配的程序,同時執(zhí)行多個指令流對多個數(shù)據(jù)流不同的處

理,如IBM3081/3084,Cray-2等。〃弗林分類法基本上是對除流水

線處理機外的諾衣曼型畫畫計算機進(jìn)行分類,而不包括對像數(shù)據(jù)流

計算機這種非諾衣曼型機器進(jìn)行分類;(2)馮氏分類法。依據(jù)是并行

度一即計算機在單位時間內(nèi)能夠處理的最大二進(jìn)制位數(shù)。據(jù)此分為4

類:①字串位串WordSerialandBitSerialoWSBS計算機。只有

一個串行的處理部件,每字長1位;②字并位串Parallel。WPBS計

算機。只有一個處理部件。該部件處理字長n位;③字串位并WSBP

計算機。有多個處理部件。每個處理部件字長1位;④字并位并WPBP

計算機。有多個處理部件,各部件字長也并行,如1LLICA2計算機具

有64個字長64位的處理單元。

馮?諾衣曼型計算機體系結(jié)構(gòu)及其發(fā)展(1)是存儲程序計算機的

別稱。在體系結(jié)構(gòu)有著如下特點:①機器以運算器位中心,使用單一

處理部件來完成計算、存儲及通信工作;②采用存儲程序的原理,使

用線性組織的定長存儲單元來存儲程序,存儲時對指令和數(shù)據(jù)不加區(qū)

別;③存儲空間的單元是直接尋址的,每個單元位數(shù)固定;④使用二

進(jìn)制機器語言,其指令完成基本操作碼的簡單操作;⑤對計算機進(jìn)行

集中的順序控制。(2)兩個最主要的特征:一是計算機內(nèi)部信息流動

是由指令驅(qū)動的,而指令執(zhí)行順序由指令計數(shù)器決定;二是計算機的

應(yīng)用仍主要面向數(shù)值計算和數(shù)據(jù)處理。(3)發(fā)展:①數(shù)據(jù)流計算機

DFMo只要所需的操作數(shù)齊備就可以執(zhí)行,這時只取決于執(zhí)行部件的

并行處理能力;②智能計算機。主要處理一些非數(shù)值化信息。

體系結(jié)構(gòu)并行技術(shù)的發(fā)展(1)并行性是指在同一時刻或同一時

間間隔內(nèi)完成兩種或兩種以上性質(zhì)相同或不同的工作的特性。具有同

口寸性和并發(fā)性二重性。(2)等級劃分:(由低到高):①按執(zhí)行程序的

等級劃分:指令內(nèi)部、指令之間、任務(wù)或進(jìn)程之間、作業(yè)或程序之間;

②處理數(shù)據(jù)等級劃分:字串位串、字串位并、字并位串、字并位并;

③按信息加工的等級劃分:存儲器操作并行、處理器操作并行、指令

任務(wù)作.業(yè)并行;(2)并行性的技術(shù)途徑:①時間重疊。多個處理過程

在時間上錯開,如流水線處理機;②資源重復(fù)。重復(fù)設(shè)置硬件資源來

提高計算機的性能。如陣列處理機;③資源共享。用軟件方法讓多個

用戶按一定時間順序輪流使用同一套件資源,以提高計算機設(shè)備利用

率。如多道程序分時系統(tǒng)。

題目:

1.高級語言經(jīng)陋程囹的酶形成匯編語言程序;

2.傳統(tǒng)機器語言機器級,是用|微指令程序]來麗機器指令;微指令

由麗直接執(zhí)行;

3.Amdahl加速比定律:加速比:Sp=l/(1-Fe+Fe/Se),其中Fe為

被改進(jìn)部分的執(zhí)行時間所占的百分比的大??;Se是其性能提高的

倍數(shù)。〃局部性原理:程序趨向于重用它當(dāng)前已經(jīng)在使用的指令

和數(shù)據(jù)。包括時間局部性和空間局部性。時間局部性是指當(dāng)前訪

問的項目在最近的將來還會被訪問;空間局部性是指某個項目及

其附近地址的其他項目會同時被引用。

4.實現(xiàn)軟件移植的基本技術(shù)有:統(tǒng)一的高級語言、采用陣列機、模

擬和仿真;

5.仿真是指用微程序直接解釋另一臺計算機的機器指令系統(tǒng);模擬

指用機器語言解釋實現(xiàn)軟件移植的方法;

6.多機系統(tǒng)的耦合度可分為:最低耦合、松散耦合和緊密耦合三種

類型;

二、指令系統(tǒng)

指令系統(tǒng)又稱指令集InstructionSet,它對計算機系統(tǒng)有全劇性影

響,即指令的功能將直接反映系統(tǒng)功能。指令集發(fā)展有兩個趨勢:

CISC和RISC;

指令集體系結(jié)構(gòu)的分類(1)分類依據(jù),可以有5種:操作數(shù)在

CPU中的存儲方式;顯示操作數(shù)的數(shù)量;操作數(shù)的位置;指令的操

作;操作數(shù)的類型和大小。(2)按暫存機制分類:依據(jù)在CPU內(nèi)部

存儲操作數(shù)的區(qū)別,可以把指令集體系結(jié)構(gòu)分為3類:堆棧stack、

累力口器accumulator、寄存器即asetofregisters。①堆棧機。主要操作

是壓入和彈出,其他操作還有加、減、比較等;優(yōu)點是:表示數(shù)值的

模型簡單、指令長度短。②累加器類機器是有一個隱含操作數(shù)的機器。

例如PDP-8、Motorola6809;優(yōu)點是機器的內(nèi)部狀態(tài)很少,指令也比

較短。③寄存器為基礎(chǔ)的指令系統(tǒng)優(yōu)點是:速度更快、數(shù)值表示上有

很強的適應(yīng)性。例如IBM360、DECVAXo(3)通用寄存器

general-purposeresistermachine,簡稱GPR機。其關(guān)鍵性優(yōu)點起

因于編譯程序能有效的使用寄存器,無論是計算表達(dá)式的值,還是從

更為全局的角度使用寄存器來保存變量的有??梢苑譃?類:①寄存

器-寄存器resister-resistero只能對存儲器有存取指令,所有操

作在兩個寄存器之間進(jìn)行,操作結(jié)果送入第三個寄存器中;優(yōu)點是:

速度快、指令具有良好的正交編碼模型;如RISC和Cray計算機;②

寄存器-存儲器類register-memoryo在指令中,由寄存器內(nèi)容加上

存儲器內(nèi)容尋址構(gòu)成尋址技術(shù)。如VAX、IBM360.Motorola68000.

PDP11等。優(yōu)點是:數(shù)據(jù)不需要寄存器裝入就能存取、指令大小適中;

③存儲器-存儲器memory-memory。如VAX2和IBM370,優(yōu)點是緊湊、

不需要消耗臨時寄存器。

指令格式(1)指令編碼方法,通常有3種:①正交法orthogonal

methodo對流水線計算機特別適應(yīng),采用微程序控制時微程序數(shù)量可

以較少;②整體法integrated??梢园咽褂妙l率高的操作數(shù)通操作

數(shù)地址碼組合起來,加以縮短優(yōu)化,而使用頻率低的操作碼可以較長

些,從而節(jié)省存儲容量,但需要較大的微程序存儲器;③混合法mixed。

把以上兩個方法優(yōu)點結(jié)合。(2)指令格式。最普通的是:操作碼。pccde-

操作數(shù)operand/地址。操作碼字段表明操作類型;操作數(shù)/地址字段

指明具體的操作數(shù),也可以指明操作數(shù)地址,通常是和尋址方式相配

合形成的。(3)尋址技術(shù)。即指令按什么方式尋找所需的操作數(shù)或信

息,它影響主存規(guī)模速度和存取方式。尋址方式對于應(yīng)用程序是透明

的。①編址方式:統(tǒng)一編址一把各個不部件統(tǒng)一編成從0開始的一維

線性地址空間;局部編址一指導(dǎo)這些部件適當(dāng)分類,各自從0開始單

獨編址,形成多個一維的線性地址空間;隱含編址一地址隱含于操作

碼中;②程序定位方式。程序定位是把指令和數(shù)據(jù)中的邏輯地址轉(zhuǎn)變

成主存物理地址的過程,有三種方法:直接定位方式、靜態(tài)定位方式、

動態(tài)定位方式;③尋址方式。大多計算機都將主存、通用寄存器、堆

棧分類編址,因此就有分別面向寄存器、堆棧和主存的尋址方式。

指令的優(yōu)化(1)指令格式的優(yōu)化。就是從整個指令系統(tǒng)的利用

率角度出發(fā),盡量設(shè)法減少指令中冗余信息量,以便用最少的位數(shù)提

供足夠的操作信息和地址信息。包括操作碼的優(yōu)化和操作數(shù)的優(yōu)化;

(2)哈夫曼編碼。左1右0。(3)理論碼長一信息源烙。任意隨機

事件的出現(xiàn)概率為Pi,則它的信息量Ii=Tog2(Pi),則平均信息

量為H=-和(Pi*log2(Pi)),由此式的結(jié)果H即為理論碼長。信息

冗余量=1-理論碼長/操作碼的平均長度。(4)等長擴展碼。哈夫曼

編碼方法形成的指令碼很不規(guī)則,長度不一。事實上計算機采用等長

擴展碼,介于等長二進(jìn)制編碼和全哈夫曼編碼之間的一種編碼方式,

仍利用哈夫曼思想,對概論高的指令用短瑪,概率低的用長碼,但在

整體上只采用了有限的幾種碼長。如下表:

指令頻度哈夫曼碼等長碼等長擴展碼

110.40000000

120.3010001()1

130.1511001010

140.05111000111100

150.04111011001101

160.03111101011110

170.03111111101111

平均碼長2.2032.30

理論碼長為2.17。

指令系統(tǒng)的復(fù)雜化(1)CISC和RISC的目標(biāo)是相同的,都是為

了提高性能,減少語義差距,改善性能價格比。目前多用CISC類型,

如IBM360/370和4300系列等;(2)指令系統(tǒng)復(fù)雜化的實現(xiàn)措施:

①面向目標(biāo)代碼的優(yōu)化。按靜態(tài)使用頻度(程序中出現(xiàn)的百分比)改

進(jìn)可以減少存儲空間;按動態(tài)使用頻率(執(zhí)行過程中出現(xiàn)的百分比)

改進(jìn)可以減少目標(biāo)程序運行的執(zhí)行時間;②面向高級語言的優(yōu)化,就

是盡可能縮小高級語言和機器語言之間的活義差異,以利于支持高級

語言的編譯系統(tǒng),左端編譯程序的長度和編譯所需時間;③面向操作

系統(tǒng)的優(yōu)化。就是進(jìn)一步縮小操作系統(tǒng)和體系結(jié)構(gòu)之間的語義差異,

減少輔助時間,節(jié)省操作系統(tǒng)軟件占用空間;(3)CISC的主要弊端:

指令集過于龐雜;微程序技術(shù)是其重要支柱,這降低了處理速度;難

以優(yōu)化編譯使之生成真正的目標(biāo)代碼;強調(diào)完善的中斷機制,導(dǎo)致動

作的煩雜;給芯片設(shè)計帶來很多困難,出錯幾率增大,不利于大批量

生產(chǎn)。

RISC技術(shù)一精簡指令集計算機ReducedInstructionSet

Computero(1)基本特征:精簡指令數(shù)量一一般在100條左右;簡化

指令格式一在1?2種之內(nèi)并讓全部指令具有相同長度;采用單周期

指令一幾乎所有指令在一個機器周期內(nèi)完成;采用寄存器操作一盡量

減少訪存操作;硬件控制邏輯一大多指令采用硬件控制實現(xiàn),少數(shù)用

微程序?qū)崿F(xiàn);優(yōu)化編譯程序。(2)RISC體系結(jié)構(gòu):①數(shù)據(jù)類型。有2

種表示方法,一是用操作碼編碼表示,一是通過操作數(shù)內(nèi)部標(biāo)志位表

示,即自定義數(shù)據(jù)表示;字長64位,包括整型數(shù)據(jù)和浮點數(shù)據(jù),支

持附加數(shù)據(jù)類型;②尋址方式,有:立即尋址方式、寄存器直接尋址

方式、寄存器間接尋址、相對尋址方式、變址值方式和位移量方式。

③寄存器模型和寄存器管理。有三種模型:窗口模型Windows、Cache

模型、矩陣Matrix模型;④存儲器管理。(3)RISC的主要技術(shù):①

重疊寄存器窗口技術(shù)。有利于合理利用有限的芯片面積,特別是支持

最費時的過程調(diào)用和返回操作;伯克利設(shè)計的重疊窗口有8個,每個

共有32個32位的寄存器,其中10個全局性寄存器,10個局部性寄

存器,6個高位寄存器,6個地位寄存器,其典型調(diào)用時間是2微秒;

②優(yōu)化編譯技術(shù)??梢院侠矸峙浼拇嫫?,提高寄存器的使用效率,減

少訪存次數(shù)等。③超流水線及超標(biāo)量技術(shù)。超流水線superpipeline

技術(shù)是一種并行處理技術(shù),通過細(xì)化流水,增加級數(shù)和提高主頻,使

得在每個機器周期內(nèi)能完成一個甚至兩個浮點操作,實質(zhì)是|以時間換

取空間|;超標(biāo)量superscalar技術(shù)也是并行處理技術(shù),通過內(nèi)裝多條

流水線來同時執(zhí)行多個處理,實質(zhì)是|以空間換取時間|;④硬線邏輯與

微程序相結(jié)合。

MIPS和MFLOPS(1)MIPS每秒執(zhí)行的百萬次指令數(shù)。(2)MFLOPS,

每秒浮點運算的百萬次數(shù)。

三、存儲系統(tǒng)

存儲器的層次結(jié)構(gòu)(1)存儲器以存取速度為主要標(biāo)準(zhǔn)依次排列:

最快的是與CPU同在一塊芯片上的寄存器resister,其次是高速緩沖

存儲器cache-memory,然后是主存儲器main-memory,接著是輔

助存儲器auxiliary-storage,最低層是海量存儲器mass-storageo(2)

有兩個重要的存儲層次,一是主一輔層次,以擴大存儲容量位宗旨,

多用軟件管理來實現(xiàn)。另一個Cache一主存層次,以提高存取速度為

宗旨,均用硬件方法實現(xiàn);(3)實現(xiàn)存儲體系的依據(jù)正是局部性原理,

包括時間局部性和空間局部性。存儲體系的性能參數(shù)有:①平均字節(jié)

價格C=(C1S1+C2S2)/(S1+S2);為了使得存儲系統(tǒng)的字節(jié)價格接

近輔存的字節(jié)價格,要求主存容量遠(yuǎn)小于輔存容量;②命中率11=川/

(NHN2);③存取時間T=HT1+(1-H)T2;④存儲器利用率u=Sa/S,

Sa是程序“活躍”部分所占用的存儲空間,S是可利用的存儲空間總

容量。

并行存儲器(1)并行存儲技術(shù)也是存儲器中的體系結(jié)構(gòu)問題,

它既能擴大存儲容量,乂能提高訪問速度。把存儲器分成多個模塊,

在一次訪問的時間內(nèi),就能并行的讀出更多信息量,具有這樣組織形

式的存儲器稱為并行存儲器Parallelmemoryo又稱為存儲器的多體

交叉訪問multiplemoduleinterleavedmemory;(2)訪問控制方

法:①同時訪問??梢砸淮翁峁┒鄠€數(shù)據(jù)或多條指令,適合對多數(shù)據(jù)

流或多指令流進(jìn)行并行處理。應(yīng)注意頻帶寬度的問題,保證處理單元

接收/處理數(shù)據(jù)的速率要和并行存儲器同時讀寫數(shù)據(jù)的速率相匹配;

采用交叉開關(guān)總線;②輪流訪問。在對并行多體存儲器訪問時.,各模

塊按一定的順序輪流啟動各自的訪問周期。降低了對帶寬匹配的要

求。采用分時共享總線。

虛擬存儲器(1)虛擬存儲器的管理方式。決定于主存與虛存間

不同的地址影響方式,分別是段式管理、頁式管理和段頁式管理3種

方式。①段式管理。地址映象一將虛存空間分段,主存的空間按這種

段來分配和管理。段是按程序的邏輯功能來劃分的。當(dāng)程序從輔存調(diào)

入主存時,是按段分配主存空間,需要建立一個包括段長度和主存起

始地址的段表,存放在主存中;地址轉(zhuǎn)換一在段式管理中,主存地址

格式包括段號和段內(nèi)地址,虛存地址格式包括用戶號、段號和段內(nèi)地

址。②頁式管理。將主存空間和虛存空間按固定大小劃分成塊,每塊

稱為一頁。頁的大小和劃分與程序邏輯功能無關(guān)。③段頁式管理。將

虛擬存儲空間按段式管理,主存空間則按頁式管理。存在虛擬空間的

程序按邏輯關(guān)系分段,每一段又可分成固定大小的頁。主存則只分成

若干大小相同的頁。許多大型機都采取該管理方式;(2)頁面替換算

法。在虛擬存儲器中,由于虛擬空間比主存空間大得多,會出現(xiàn)當(dāng)主

存中所有頁已經(jīng)全部被占用,而CPU需要的指令卻在主存中找不到,

從而產(chǎn)生頁面失效Pagefaulto這是需要從輔存中調(diào)入新頁,并把

主存中已經(jīng)不用的舊頁替換出去。常用的替換算法有:①隨機算法

RANDo算法簡單,易于實現(xiàn);②先進(jìn)先出FIFO;③近期最少使用算

法LRU;④優(yōu)化替換算法OPT一預(yù)先知道將要使用哪些頁面,替換時

把下次調(diào)用該頁時的時間間隔最大的頁面調(diào)出去。這是一種理想算

法。

高速緩沖存儲器Cache(1)為彌補主存速度不足,在|處理機和

主存之間|設(shè)置一個高速小容量的Cache,構(gòu)成“Cache-主存”層次,

其在本質(zhì)上是一個兩級的“頁”式系統(tǒng);(2)“Cache-主存”和“主

存-輔存”的比較:前者目的是提高存儲系統(tǒng)速度,后者是擴大容量;

兩者工作原理相同,都需要地址變換,但失效時,后者采取頁面替換,

前者采用塊block替換;前者通過硬件實現(xiàn)地址變換和塊替換,后者

則是由操作系統(tǒng)來管理的;主輔層次的兩種存儲介質(zhì)有很大區(qū)別,不

易匹配,而前者則便于匹配;Cache對應(yīng)用程序員和系統(tǒng)程序員都是

透明的,而主輔層次則對系統(tǒng)程序員不完全透明。(3)在有Cache的

系統(tǒng)中,訪問主存請求的優(yōu)先級安排次序是Cache-通道-寫數(shù)-讀數(shù)-

取指令。(4)地址映象和變換。地址映象是指每個主存按什么規(guī)則裝

入Cache中。有全相聯(lián)映象、直接映象、組相聯(lián)映象。(5)Cache的

塊替換算法。有RAND、FIFO、LRU等;LRU替換算法的硬件實現(xiàn)有:

①堆棧法。從棧底到棧頂?shù)膸缀挝恢梅从沉烁鲏K近期最久未被訪問的

次序。②比較對法。讓各塊成對組合,用觸發(fā)器狀態(tài)表示每個比較對

內(nèi)的訪問次序,從而找出被替換的塊。綜上所述,設(shè)計替換算法實現(xiàn)

應(yīng)考慮到:如何對每次訪問進(jìn)行記錄和符合根據(jù)所記錄信息來判定哪

個塊是近期內(nèi)最久未被訪問的。(6)Cache的塊表示。在級相聯(lián)或直

接映象Cache中,地址的數(shù)據(jù)結(jié)構(gòu)由3個部分組成:標(biāo)志tag一給出

塊幀地址;索引index一組相聯(lián)中通過它選擇組號;塊內(nèi)位移block

offset一給出在一個塊內(nèi)所找數(shù)據(jù)的地址。(7)Cache的寫策略,即

更新主存內(nèi)容的算法。①寫直達(dá)法writethrough:只要CPU有寫操

作,在寫入Cache同時,也通過“Cache一主存”通路直接寫入主存;

②寫回法writeback。在CPU執(zhí)行寫操作時,信息只寫入Cache,僅

當(dāng)某塊被替換時,才把曾被寫入過的Cache塊先送回主存,然后再調(diào)

入新塊?!▽懼边_(dá)法的可靠性高,但增加了訪問主存的流量,寫回法

則相反,減少了不必要的訪存,但可靠性受影響,常需要在Cache中

增加更多的冗余信息位來提高其內(nèi)容可靠性。

題目:

1.衡量一個存儲層次體系性能主要從平均字節(jié)價格、命中率、存取

時間等三個方面考慮;

2.選擇存儲映象方式時最基本的考慮因素是易于實現(xiàn)。

3.在多級存儲層次中,根據(jù)時間局部性,層次Ml不必存入整個程序,

只需將近期用過的塊或頁存入;根據(jù)空間局部性,當(dāng)M2將所要訪

問的字送到Ml時,一并把該字所在塊或頁整個取來。

四、I/O通道和新型總線

、IO子系統(tǒng)概述(1)它包括IO設(shè)備、響應(yīng)控制器以及為IO操作

而設(shè)計的軟件。根據(jù)其操作的控制方式,10控制可以分為三類:程

序控制10、DMA和IO處理機方式。①程序控制10方式,是大多計

算機具有的簡單控制方式。在該方式下,10設(shè)備、主存和CPU通過

共享總線進(jìn)行通信,10設(shè)備可以和主存統(tǒng)一編址;優(yōu)點是控制簡單,

編程容易,缺點是大量時間被花于K)操作上,外設(shè)和CPU不能同時

工作;②DMA和中斷控制方式。DMA方式是直接存儲器訪問方式。它

要求外設(shè)和主存之間有直接數(shù)據(jù)通路。優(yōu)點是它把部分10控制交給

設(shè)備控制部分,實現(xiàn)CPU和10設(shè)備的部分并行。缺點是CPU仍需要

啟動每個信息塊的傳輸,增加了成本;中斷控制方式優(yōu)點是初步解決

了CPU、主存和外設(shè)之間的速度匹配問題。缺點是中斷所需輔助操作

很多;③通道控制方式是在DMA基礎(chǔ)上發(fā)展起來的。一個10過程CPU

只參與兩次工作。優(yōu)點是并行操作能力強,提高設(shè)備利用率;缺點是

不能完全獨立于主機;④1()處理機10P專門負(fù)責(zé)1()操作,具有更強

的處理功能,不必借助于CPUo優(yōu)點是CPU幾乎移交了對10的全部

控制,完全獨立于主機;缺點是提高系統(tǒng)成本。這方式廣泛應(yīng)用于

IBM360、370系統(tǒng)。

通道的工作原理(1)通道的功能:接受CPU發(fā)來的10指令,按

指令要求和指定的10設(shè)備進(jìn)行聯(lián)系;從主存取出屬于該通道程序的

通道指令,對指令進(jìn)行譯碼,向1()設(shè)備及控制器發(fā)出多種操作命令;

為主存和外設(shè)裝配和拆卸信息;從10設(shè)備獲得設(shè)備狀態(tài)信息形成并

保存通道信息,并根據(jù)需要將這些信息送往主存指定單元;將10設(shè)

備的中斷請求及通道本身的中斷請求發(fā)送給CPU;(2)通道種類:字

節(jié)多路通道bytemultiplexerchannel一適合于連接大量低速設(shè)備,

其工作模式有字節(jié)交叉模式和突發(fā)模式;數(shù)組多路通道block

multiplexerchannel適于為高速設(shè)備服務(wù);選擇通道selector

channel也是為多臺高速設(shè)備服務(wù)的,但在數(shù)據(jù)傳送期間,通道只能

為某一臺高速設(shè)備服務(wù),只能執(zhí)行一道通道程序。(3)通道字和通道

程序。①通道命令字CCW是通道能夠執(zhí)行的一組指令,又稱通道控制

字。由命令碼、數(shù)據(jù)地址、標(biāo)志碼、保留位、計數(shù)字段組成,共64

位;②通道地址字CAW指明要執(zhí)行的第一個通道命令字的地址,即通

道程序首地址,共32位,主要由存儲保護(hù)字段和地址字段組成;③

通道狀態(tài)字CSW用來記錄通道和外設(shè)執(zhí)行通道程序的狀態(tài),存放在內(nèi)

存儲器的固定單元中,共64位。④通道程序,由若干個通道命令可

組成一個通道程序。(4)通道的工作原理。1()操作過程可分為5個

階段:準(zhǔn)備、啟動、數(shù)據(jù)傳輸、結(jié)束傳輸、結(jié)束中斷。通道分擔(dān)了

CPU對輸入輸出操作的控制,基本上實現(xiàn)了CPU和外部設(shè)備之間的并

行執(zhí)行,減少了外設(shè)向CPU請求中斷的次數(shù),提高了CPU運行效率。

(5)通道流量設(shè)計。通道流量是指在數(shù)據(jù)傳送期間單位時間內(nèi)傳送

的字節(jié)數(shù)。

EISA和MCA(1)微機總線的演變:第一代PC總線:8位/16位

總線一內(nèi)部總線16位,外部總線8位;第二代PC總線:16位息線

—另一名稱是ISA,即工業(yè)標(biāo)準(zhǔn)體系結(jié)構(gòu)總線;第三代PC總線:32

位總線一可提供多達(dá)4GB的尋址空間,能自動配置系統(tǒng)及擴充插卡,

微機的32位總線主要有3大類,分別是Compaq等公司的EISA總線,

IBM公司的MCA總線,Apple公司的NuBus總線。(2)MCA微通道體

系結(jié)構(gòu)。MCA是MicroChannelArchitecture微通道體系結(jié)構(gòu)的縮

寫,其主要的特點可概括為:①是32位的高速微通道,可支持8、

16、32位的數(shù)據(jù)轉(zhuǎn)換與傳送,改善了數(shù)據(jù)完整性;②MCA是完異步的

總線結(jié)構(gòu),支持各總線主控器以及CPU公平地分享總線;③MCA采用

了可編程任選POS,能識別用戶安裝地MCA插卡類型,并自動地給他

分配系統(tǒng)資源;④可磁兼容性好,可靠性高;⑤支持多處理和并行處

理系統(tǒng),支持0等待狀態(tài),能提高處理效率。(3)EISA擴展工業(yè)標(biāo)

準(zhǔn)體系結(jié)構(gòu)。特點為:①它是32位地擴展工業(yè)標(biāo)準(zhǔn)總線,即ISA總

線擴充;②EISA基木上是一個同步總線,它和CPU協(xié)同工作;③仲

裁方案以輪流服務(wù)為基礎(chǔ);④采用了精致的雙排擴展插槽;⑤和MCA

都采用共享地中斷線路。

VESA和PCI局部總線(1)VESA是視頻電子標(biāo)準(zhǔn)協(xié)會開發(fā)地局部

總線標(biāo)準(zhǔn),又稱VL總線,基于該標(biāo)準(zhǔn)的4類產(chǎn)品是:VESA局部總線

主板、VESA硬盤卡、VESA顯示卡、多功能卡;(2)PCI局部總線,

PCI,PeripheralComponentInterface,是外部部件接口的縮寫。

PCI是32位的總線,在33MHz的時鐘頻率下所提供的最大數(shù)據(jù)傳輸

速率是132MbpsoPCI還采取32位數(shù)據(jù)總線和64位地址總線,把帶

寬透明的擴充到264MbpsoPCI局部總線能顯著提高網(wǎng)絡(luò)服務(wù)器的性

能。其優(yōu)點有:能大幅度提高數(shù)據(jù)吞吐率一測試表明,ISA總線的CPU

占有率46%,EISA總線CPU占有率12%,而PCI局部總線CPU占有

率不到6%;具有較低的訪問延遲。

五、流水技術(shù)和向量處理機

指令的流水處理(1)指令控制方式有三種:①順序方式。即各

機器指令之間順序串行的執(zhí)行;優(yōu)點是控制簡單,缺點是速度上不去,

機器的利用率低;②重疊方式。在前一條指令操作完成之前,開始解

釋下一條指令。優(yōu)點是速度提高,缺點是會出現(xiàn)沖突、轉(zhuǎn)移和相關(guān)等

問題;③流水方式。把并行性或并發(fā)性鑲嵌到計算機系統(tǒng)里的形式。

通常用時空圖描述流水線工作。(2)流水線的分級:按處理級別可分

為3級:①操作部件級一也叫運算操作流水線ArithmeticPipelines,

是將復(fù)雜算術(shù)、邏輯運算組成流水線工作方式;②指令級流水

InstructionPipelines,把指令解釋過程分成多個子過程;③處理

機級流水,是一種宏流水線Meer。Pipelines,其中每個處理機完成

某一專門任務(wù),各個處理機所得到的結(jié)果需要存放在與下一個處理機

所共享的存儲器中c(3)流水線性能分析。①吞吐率Throughputrate。

指在單位時間內(nèi)流水線所完成的任務(wù)數(shù)或輸出結(jié)果的數(shù)量;最大吞吐

率TPmax=l/max(dt),即最大吞吐率取決于流水線中最慢的一段的

時間;實際吞吐率TP=TPmax/(1+(m-1)/n),其中m為流水線段

數(shù),n為任務(wù)數(shù);②加速比Speedupratioo指m段流水線的速度和

等效的非流水線的速度之比。S=T0/T1=n*m*dt/[m*dt+(n-l)*dt]

=m/[1+(m-1)/n];③效率Efficiency。是流水線的設(shè)備利用率。E

=n個任務(wù)占用的時空區(qū)/m個段總的時空區(qū)。(4)流水的相關(guān)處理。

①局部性相關(guān)原理。流水線同時解釋的指令可能出現(xiàn)相關(guān)。解決的辦

法有兩種:一是推后法,即推后對相關(guān)單元的讀;二是通路法,即設(shè)

置相關(guān)專用通路而不必使用存儲單元的寫讀;②全局性相關(guān)原理。轉(zhuǎn)

移指令和它后面的指令之間存在關(guān)聯(lián),不能同時解釋,執(zhí)行時可能會

改動指令緩沖器中預(yù)取到的指令內(nèi)容,從而造成流水線吞吐率和效率

下降;解決辦法有3種:一是猜測轉(zhuǎn)移分支;二是加快和提前形成條

件碼;三是加快短循環(huán)程序的處理;③流水的中斷處理。中斷也會引

起流水線斷流。但出現(xiàn)概率比條件轉(zhuǎn)移的要低。其處理關(guān)鍵在于如何

處理好斷點和中斷后的恢復(fù)問題。(5)時鐘周期和流水線調(diào)度。①時

鐘周期直接決定流水線的最大吞吐率。其越???,流水線分段越多,

寄存器延遲時間救越長,降低了流水線的實際吞吐率。時鐘周期越小,

TPmax越高;②流水線為避免功能段的沖突,存在任務(wù)的調(diào)度問題。

通常采用預(yù)約表R(Reservationtable)的方法。

流水處理指令并行性的開發(fā)(1)超級標(biāo)量計算機,配置了多個

功能部件和指令譯碼器,和多個寄存器端口和總線,能同時執(zhí)行多個

操作。其流水線調(diào)度包括指令的發(fā)射策略和完成策略。指令發(fā)射

InstructionIssue是啟動指令進(jìn)入執(zhí)行段的過程,分為按序發(fā)射和

無序發(fā)射。指令發(fā)射策略是指指令發(fā)射時所使用的協(xié)議或規(guī)則。指令

的完成也有按序和無序之分。超標(biāo)量流水線的調(diào)度策略共有三種:按

序發(fā)射按序完成、按序發(fā)射無序完成、無序發(fā)射無序完成。(2)超長

指令字計算機VLIW。是由編譯程序在編諾時找出指令之間潛在的并

行性,進(jìn)行適當(dāng)調(diào)度安排,把多個能并行執(zhí)行的操作組合在一起,成

為一條具有多個操作段的超長指令,由它控制多個互相獨立的功能部

件,每個操作段控制一個功能部件,相當(dāng)于同時執(zhí)行多條指令。例如

Cycra5計算機,其每個操作段的典型格式為:一個操作碼、兩個源

寄存器描述碼、一個目的寄存器描述碼和一個判定寄存器描述碼。(3)

超級流水線計算機。結(jié)構(gòu)是把每個流水線分成若干個子流水線,而每

個子流水線取出的仍只有一條指令,這樣看來在一個周期內(nèi)便取出了

多條指令。例如MIPS公司宣布的64位RISC計算機一R4000機,每

個周期可流出2條指令。

向量流水處理機(1)向量處理方式:以計算D=A*(B+C)為例,

其中ABC均為有n個元素的向量。①橫向處理方式。按組成的元素順

序逐個進(jìn)行計算。即分別求行=Ai*(Bi+Ci);該方式在速度和效率

上都沒有提高;②縱向處理方式。先計算向量B+C=E,再計算向量

A*E=D.③分組/縱橫處理方式。前兩種方式的結(jié)合。即把原來向量分

成幾組,每組按縱向處理方式進(jìn)行。CRAY1超級計算機采取縱橫處理

方式;CRYER205則采取縱向處理方式。實際上,向量處理機的體系

結(jié)構(gòu)有兩種基本類型:一是寄存器一寄存器機;另一是存儲器一存儲

器向量機。(2)向量流水處理機。①CRAY1向量流水處理機。屬于寄

存器一寄存器類型,時鐘周期位12.5ns,存儲器周期為4個時鐘周

期,運算速度為160MFLOPS。只有120條指令,指令格式有兩種:16

位的單字段指令和32位雙字段指令。機器字長64位,包括3種數(shù)據(jù)

格式:24位帶符號整數(shù)、64位帶符號整數(shù)、64位浮點數(shù)。CRAY1采

取了大量的寄存器組。并具有4類12種功能流水線(見附);CRAY1

解決沖突的方法有鏈接技術(shù)和推遲執(zhí)行兩種。輸入輸出由24個通道

組成。CRAY1使得模擬成為重要的科學(xué)研究方法之一。②CRYER205。

機器的中心部件是標(biāo)量部件,包括指令處理部件和標(biāo)量執(zhí)行部件。其

存儲器基本模型是64位的1M存儲器,最大容量為4M*64b。時鐘周

期80nso提供8個32位的10通道,傳輸速率200MbpsoCRYER205

性能指標(biāo)比CRAY1高,單運行上并誤多大差別,因為存儲器一存儲器

向量機再體系結(jié)構(gòu)上不及寄存器一寄存器優(yōu)越。

附:

1.CRAY1的寄存器組包括向量寄存器、標(biāo)量寄存器、A寄存器、B寄

存器、T寄存器;

2.CRAY1有4類12種功能流水線:①地址功能流水:包括地址加、

地址乘2條流水線;②標(biāo)量功能流水:標(biāo)量加、標(biāo)量位移、標(biāo)量

邏輯、計數(shù)4條流水線;③向量功能流水:向量

加、向量位移、向量邏輯3條;④浮點

功能流水:浮點加、浮點乘、求倒數(shù)近似3條。

六、并行處理技術(shù)和多處理機

并行性主要是指同時性或并發(fā)性。在進(jìn)行并行處理時,其每次處

理的規(guī)模大小可能是不同的,這可用并行性顆粒度來表示:G=所有

處理器進(jìn)行計算的時間總和/所有處理器通信時間總和。并行性從執(zhí)

行程序的角度看,并行性等級可分為5個:作.業(yè)級、任務(wù)級、例行程

序/子程序級、循環(huán)和迭代級、語句和指令級;從處理數(shù)據(jù)的角度看,

可分為4級:字串位串、字串位并、字并位串、字并位并/全并行。

并行處理技術(shù)(1)層次越高的并行處理顆粒就越細(xì),粗粒度并

行性開發(fā)主要采用MIMD方式;|開發(fā)計算機系統(tǒng)并行性,一般采用

資源重復(fù)、時間重疊和資源共享三種方法|c資源重復(fù)是通過使用多功

能部件,引入空間重復(fù)因素;時間重疊是在并行性概念中引入時間因

素,讓多個處理過程重疊地使用同一套部件各個部分;資源共享主要

是采用軟件手段讓多個用戶按時間片輪流使用同一套硬件資源。(2)

并行處理機地結(jié)構(gòu)和特點。以SIMD方式工作,采用資源共享重復(fù)的

并行性措施的陣列處理機:①基本結(jié)構(gòu):由一個控制器CU、n個處理

單元PE、m個存儲模塊M和一個互連網(wǎng)絡(luò)部件IN組成。根據(jù)存儲器

模塊是以分布方式還是集中方式存取,可以分為兩種基本結(jié)構(gòu):分布

式存儲器的陣列機和共享存儲器的陣列機:②主要特點:采用資源重

復(fù)方法引入空間因素;以某一類算法位背景的專用計算機;其研究必

須和并行算法研究密切結(jié)合,使之具有更強適應(yīng)性;從處理單元看,

可以將其看成一個同構(gòu)型并行機。

SIMD的互連網(wǎng)絡(luò)(1)基本互連函數(shù):①恒等置換。相同編號的

輸入輸出端對應(yīng)。表達(dá)式:/區(qū)_]蒼35|工0)二n"”-2「//0;②交換置

換。第0位位值不同的輸入端和輸出端之間的連接。

七(元,1凡,2.4工0)=匕/2...M1。;③方體置換。第k位位值不同的輸入端和

輸出端之間的連接cC(X"”.2…々…中0)=…%%;④均勻洗牌置

換。輸入端分成數(shù)目相等的兩半,再隔一個順序和輸出端相連。

。區(qū)…XXoZ-l,可見洗牌是將輸入端二進(jìn)制地址循環(huán)左移

一位得到對應(yīng)的輸出端二進(jìn)制地址;⑤蝶式置換。

%)=x()x〃2Tx即將輸入二進(jìn)制地址的最高位和最低位互

換位置取可求得響應(yīng)輸出的地址。⑥位序顛倒置換。

〃一2…%2%一1。(2)互連網(wǎng)絡(luò)的特性:網(wǎng)絡(luò)規(guī)模一網(wǎng)絡(luò)中

結(jié)點個數(shù);結(jié)點度一和結(jié)點相連接的邊數(shù);距離一量結(jié)點之間相連的

最少邊數(shù);網(wǎng)絡(luò)直徑一網(wǎng)絡(luò)中結(jié)點之間最大距離;等分寬度一當(dāng)網(wǎng)絡(luò)

被分成兩半時,沿切口的最小邊數(shù);結(jié)點之間的線長一兩個結(jié)點間的

線的長度;對稱性一若從任何結(jié)點看拓?fù)浣Y(jié)構(gòu)都一眼則稱為對稱網(wǎng)

絡(luò)。(3)網(wǎng)絡(luò)性能參數(shù):頻寬bandwidth—傳輸信息的最大速率,單

位為兆位/秒;傳輸時間transmissiontime一等于消息長度除以頻

寬;“飛行”時間timeoffly一包括時延;傳輸時延transportlatency

一等于飛行時間+傳輸時間。發(fā)送方開銷senderoverhead—處理器

把消息放到互聯(lián)網(wǎng)的時間;接收方開銷receiveroverhead-處理器

把到達(dá)的消息從互聯(lián)網(wǎng)上取出的時間;〃總時延=發(fā)送方開銷+飛行

時間+消息長度/頻寬+接受方開銷。(4)常用的單級互連網(wǎng)絡(luò):①交

換互連網(wǎng)絡(luò)。鳳X)?=(如…瓦..4);②PM2I互連網(wǎng)絡(luò):

r

PM2+,=(j+2)mod^;=(八2,)modN,OWiWnT,OWjWN-l;其

中N是結(jié)點數(shù),n=log2N;③混洗交換互連網(wǎng)絡(luò)。由全混洗和交換兩

種互連函數(shù)詞成。④蝶式互連網(wǎng)絡(luò)Butterfly(x"g"A)尸".2…X"⑸

關(guān)于多級連接。多級連接特性決定因素主要有交換開關(guān)、拓?fù)浣Y(jié)構(gòu)、

控制方式3種。常用的多級互連網(wǎng)絡(luò)有多級立方網(wǎng)絡(luò)、多級混洗交換

網(wǎng)絡(luò)、多級PM2I互連網(wǎng)絡(luò)。

多處理機(1)多處理機具有兩臺以上的處理機。在操作系統(tǒng)控

制下通過共享主存或輸入輸出子系統(tǒng)或高速通信網(wǎng)絡(luò)進(jìn)行通信。屬于

MIMD系統(tǒng)。特點有:結(jié)構(gòu)靈活性、程序并行性、并行任務(wù)派生、進(jìn)

程同步、資源分配和調(diào)度。(2)多處理機系統(tǒng)中,機間互連主要采用

以下幾種方式:總線方式、縱橫交叉開關(guān)互

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論