計算機體系結(jié)構(gòu)

上傳人：非*** IP屬地：河北上傳時間：2024-12-08 格式：PDF 頁數(shù)：25 大小：8.07MB 積分：12 舉報 版權(quán)申訴

已閱讀5頁，還剩20頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

一、計算機體系結(jié)構(gòu)的基本概念

計算機體系結(jié)構(gòu)是指機器語言程序的設(shè)計者或是編譯程序設(shè)計

者所看到的計算機系統(tǒng)的概念性結(jié)構(gòu)和功能特性。Amdahl所定義的

體現(xiàn)結(jié)構(gòu)是指程序員面對的是硬件的系統(tǒng)。所關(guān)心的是如何合理的進(jìn)

行軟便件功能的分配。

計算機系統(tǒng)結(jié)構(gòu)是指機器語言級的程序員所了解的計算機的屬

性，即外特性?？梢园瑪?shù)據(jù)表示，寄存器定義、數(shù)量、使用方式，

指令系統(tǒng)，中斷系統(tǒng)，存存儲系統(tǒng)，IO系統(tǒng)等。

計算機組成是計算機結(jié)構(gòu)的邏輯實現(xiàn)?？梢园瑪?shù)據(jù)通路寬度，

專用部件設(shè)置，緩沖技術(shù)，優(yōu)化處理等。

計算機的實現(xiàn)是指其計算機組成的物理實現(xiàn)。包括處理機，主存

部件的物理結(jié)構(gòu)，器件的集成度，速度的選擇，模塊、硬件、插件底

板的劃分和連接。

從使用語言的角度，可以把計算機系統(tǒng)按功能從高到低分為7

級：0應(yīng)用語言機器級、1高級程序語言機器級、2匯編語言機器級、

3操作系統(tǒng)機器級、4傳統(tǒng)機器語言機器級、5微程序機器級和6電

子線路級。3?6級為虛擬機，其語言功能均由軟件實現(xiàn)。

硬件功能分配的基木原則：（1）功能要求。首先是應(yīng)用領(lǐng)域?qū)?yīng)

的功能要求，其次是對軟件兼容性的要求；（2）性能要求。如運算速

度，存儲容量，可靠性，可維護(hù)性和人機交互能力等；（3）成本要求。

體系結(jié)構(gòu)設(shè)計的方法有三種：由上而下一從考慮如何滿足應(yīng)用要

求開始設(shè)計；由下而上一基于硬件技術(shù)所具有的條件；由中間開始的

方法。

體系設(shè)計的步驟：需求分析、需求說明、概念性設(shè)計、具體設(shè)計、

優(yōu)化和評價。

計算機體系結(jié)構(gòu)的分類：（1）弗林FLYNN分類法：按指令流和

數(shù)據(jù)流將計算機分為4類：①單指令流、單數(shù)據(jù)流一Single

InstructionStreamSingleDataStream,SISD?計算機，即傳統(tǒng)

的單處理機，通常用的計算機多為此類，如脈動陣列計算機systolic

array；②單指令流、多數(shù)據(jù)流一Multiple,SIMD。典型代表是并行

處理機。其并行性在于指令一級。如ILLIAC、PEPE、STARAN、MPP等;

③MISD計算機；④MIMD計算機。多處理機系統(tǒng)，實現(xiàn)全面并行的理

想結(jié)構(gòu)?？梢酝ㄟ^共享存儲器和消息傳遞來耦合系統(tǒng)，每個處理器分

別執(zhí)行系統(tǒng)分配的程序，同時執(zhí)行多個指令流對多個數(shù)據(jù)流不同的處

理，如IBM3081/3084,Cray-2等。〃弗林分類法基本上是對除流水

線處理機外的諾衣曼型畫畫計算機進(jìn)行分類，而不包括對像數(shù)據(jù)流

計算機這種非諾衣曼型機器進(jìn)行分類；（2）馮氏分類法。依據(jù)是并行

度一即計算機在單位時間內(nèi)能夠處理的最大二進(jìn)制位數(shù)。據(jù)此分為4

類：①字串位串WordSerialandBitSerialoWSBS計算機。只有

一個串行的處理部件，每字長1位；②字并位串Parallel。WPBS計

算機。只有一個處理部件。該部件處理字長n位；③字串位并WSBP

計算機。有多個處理部件。每個處理部件字長1位；④字并位并WPBP

計算機。有多個處理部件，各部件字長也并行，如1LLICA2計算機具

有64個字長64位的處理單元。

馮?諾衣曼型計算機體系結(jié)構(gòu)及其發(fā)展（1）是存儲程序計算機的

別稱。在體系結(jié)構(gòu)有著如下特點：①機器以運算器位中心，使用單一

處理部件來完成計算、存儲及通信工作；②采用存儲程序的原理，使

用線性組織的定長存儲單元來存儲程序，存儲時對指令和數(shù)據(jù)不加區(qū)

別；③存儲空間的單元是直接尋址的，每個單元位數(shù)固定；④使用二

進(jìn)制機器語言，其指令完成基本操作碼的簡單操作；⑤對計算機進(jìn)行

集中的順序控制。（2）兩個最主要的特征：一是計算機內(nèi)部信息流動

是由指令驅(qū)動的，而指令執(zhí)行順序由指令計數(shù)器決定；二是計算機的

應(yīng)用仍主要面向數(shù)值計算和數(shù)據(jù)處理。（3）發(fā)展：①數(shù)據(jù)流計算機

DFMo只要所需的操作數(shù)齊備就可以執(zhí)行，這時只取決于執(zhí)行部件的

并行處理能力；②智能計算機。主要處理一些非數(shù)值化信息。

體系結(jié)構(gòu)并行技術(shù)的發(fā)展（1）并行性是指在同一時刻或同一時

間間隔內(nèi)完成兩種或兩種以上性質(zhì)相同或不同的工作的特性。具有同

口寸性和并發(fā)性二重性。（2）等級劃分：（由低到高）：①按執(zhí)行程序的

等級劃分：指令內(nèi)部、指令之間、任務(wù)或進(jìn)程之間、作業(yè)或程序之間;

②處理數(shù)據(jù)等級劃分：字串位串、字串位并、字并位串、字并位并；

③按信息加工的等級劃分：存儲器操作并行、處理器操作并行、指令

任務(wù)作.業(yè)并行；（2）并行性的技術(shù)途徑：①時間重疊。多個處理過程

在時間上錯開，如流水線處理機；②資源重復(fù)。重復(fù)設(shè)置硬件資源來

提高計算機的性能。如陣列處理機；③資源共享。用軟件方法讓多個

用戶按一定時間順序輪流使用同一套件資源，以提高計算機設(shè)備利用

率。如多道程序分時系統(tǒng)。

題目：

1.高級語言經(jīng)陋程囹的酶形成匯編語言程序；

2.傳統(tǒng)機器語言機器級，是用|微指令程序］來麗機器指令;微指令

由麗直接執(zhí)行;

3.Amdahl加速比定律:加速比:Sp=l/(1-Fe+Fe/Se),其中Fe為

被改進(jìn)部分的執(zhí)行時間所占的百分比的大??；Se是其性能提高的

倍數(shù)。〃局部性原理：程序趨向于重用它當(dāng)前已經(jīng)在使用的指令

和數(shù)據(jù)。包括時間局部性和空間局部性。時間局部性是指當(dāng)前訪

問的項目在最近的將來還會被訪問；空間局部性是指某個項目及

其附近地址的其他項目會同時被引用。

4.實現(xiàn)軟件移植的基本技術(shù)有：統(tǒng)一的高級語言、采用陣列機、模

擬和仿真；

5.仿真是指用微程序直接解釋另一臺計算機的機器指令系統(tǒng)；模擬

指用機器語言解釋實現(xiàn)軟件移植的方法；

6.多機系統(tǒng)的耦合度可分為：最低耦合、松散耦合和緊密耦合三種

類型；

二、指令系統(tǒng)

指令系統(tǒng)又稱指令集InstructionSet,它對計算機系統(tǒng)有全劇性影

響，即指令的功能將直接反映系統(tǒng)功能。指令集發(fā)展有兩個趨勢：

CISC和RISC；

指令集體系結(jié)構(gòu)的分類（1）分類依據(jù)，可以有5種：操作數(shù)在

CPU中的存儲方式；顯示操作數(shù)的數(shù)量；操作數(shù)的位置；指令的操

作；操作數(shù)的類型和大小。（2）按暫存機制分類：依據(jù)在CPU內(nèi)部

存儲操作數(shù)的區(qū)別，可以把指令集體系結(jié)構(gòu)分為3類：堆棧stack、

累力口器accumulator、寄存器即asetofregisters。①堆棧機。主要操作

是壓入和彈出，其他操作還有加、減、比較等；優(yōu)點是：表示數(shù)值的

模型簡單、指令長度短。②累加器類機器是有一個隱含操作數(shù)的機器。

例如PDP-8、Motorola6809；優(yōu)點是機器的內(nèi)部狀態(tài)很少，指令也比

較短。③寄存器為基礎(chǔ)的指令系統(tǒng)優(yōu)點是：速度更快、數(shù)值表示上有

很強的適應(yīng)性。例如IBM360、DECVAXo（3）通用寄存器

general-purposeresistermachine,簡稱GPR機。其關(guān)鍵性優(yōu)點起

因于編譯程序能有效的使用寄存器，無論是計算表達(dá)式的值，還是從

更為全局的角度使用寄存器來保存變量的有?？梢苑譃?類：①寄存

器-寄存器resister-resistero只能對存儲器有存取指令，所有操

作在兩個寄存器之間進(jìn)行，操作結(jié)果送入第三個寄存器中；優(yōu)點是：

速度快、指令具有良好的正交編碼模型；如RISC和Cray計算機；②

寄存器-存儲器類register-memoryo在指令中，由寄存器內(nèi)容加上

存儲器內(nèi)容尋址構(gòu)成尋址技術(shù)。如VAX、IBM360.Motorola68000.

PDP11等。優(yōu)點是：數(shù)據(jù)不需要寄存器裝入就能存取、指令大小適中；

③存儲器-存儲器memory-memory。如VAX2和IBM370,優(yōu)點是緊湊、

不需要消耗臨時寄存器。

指令格式（1）指令編碼方法，通常有3種：①正交法orthogonal

methodo對流水線計算機特別適應(yīng)，采用微程序控制時微程序數(shù)量可

以較少；②整體法integrated?？梢园咽褂妙l率高的操作數(shù)通操作

數(shù)地址碼組合起來，加以縮短優(yōu)化，而使用頻率低的操作碼可以較長

些，從而節(jié)省存儲容量，但需要較大的微程序存儲器;③混合法mixed。

把以上兩個方法優(yōu)點結(jié)合。(2)指令格式。最普通的是:操作碼。pccde-

操作數(shù)operand/地址。操作碼字段表明操作類型；操作數(shù)/地址字段

指明具體的操作數(shù)，也可以指明操作數(shù)地址，通常是和尋址方式相配

合形成的。(3)尋址技術(shù)。即指令按什么方式尋找所需的操作數(shù)或信

息，它影響主存規(guī)模速度和存取方式。尋址方式對于應(yīng)用程序是透明

的。①編址方式：統(tǒng)一編址一把各個不部件統(tǒng)一編成從0開始的一維

線性地址空間；局部編址一指導(dǎo)這些部件適當(dāng)分類，各自從0開始單

獨編址，形成多個一維的線性地址空間；隱含編址一地址隱含于操作

碼中；②程序定位方式。程序定位是把指令和數(shù)據(jù)中的邏輯地址轉(zhuǎn)變

成主存物理地址的過程，有三種方法：直接定位方式、靜態(tài)定位方式、

動態(tài)定位方式；③尋址方式。大多計算機都將主存、通用寄存器、堆

棧分類編址，因此就有分別面向寄存器、堆棧和主存的尋址方式。

指令的優(yōu)化(1)指令格式的優(yōu)化。就是從整個指令系統(tǒng)的利用

率角度出發(fā)，盡量設(shè)法減少指令中冗余信息量，以便用最少的位數(shù)提

供足夠的操作信息和地址信息。包括操作碼的優(yōu)化和操作數(shù)的優(yōu)化;

(2)哈夫曼編碼。左1右0。(3)理論碼長一信息源烙。任意隨機

事件的出現(xiàn)概率為Pi,則它的信息量Ii=Tog2(Pi),則平均信息

量為H=-和(Pi*log2(Pi)),由此式的結(jié)果H即為理論碼長。信息

冗余量=1-理論碼長/操作碼的平均長度。（4）等長擴展碼。哈夫曼

編碼方法形成的指令碼很不規(guī)則，長度不一。事實上計算機采用等長

擴展碼，介于等長二進(jìn)制編碼和全哈夫曼編碼之間的一種編碼方式，

仍利用哈夫曼思想，對概論高的指令用短瑪，概率低的用長碼，但在

整體上只采用了有限的幾種碼長。如下表：

指令頻度哈夫曼碼等長碼等長擴展碼

110.40000000

120.3010001()1

130.1511001010

140.05111000111100

150.04111011001101

160.03111101011110

170.03111111101111

平均碼長2.2032.30

理論碼長為2.17。

指令系統(tǒng)的復(fù)雜化（1）CISC和RISC的目標(biāo)是相同的，都是為

了提高性能，減少語義差距，改善性能價格比。目前多用CISC類型,

如IBM360/370和4300系列等；（2）指令系統(tǒng)復(fù)雜化的實現(xiàn)措施：

①面向目標(biāo)代碼的優(yōu)化。按靜態(tài)使用頻度（程序中出現(xiàn)的百分比）改

進(jìn)可以減少存儲空間；按動態(tài)使用頻率（執(zhí)行過程中出現(xiàn)的百分比）

改進(jìn)可以減少目標(biāo)程序運行的執(zhí)行時間；②面向高級語言的優(yōu)化，就

是盡可能縮小高級語言和機器語言之間的活義差異，以利于支持高級

語言的編譯系統(tǒng)，左端編譯程序的長度和編譯所需時間；③面向操作

系統(tǒng)的優(yōu)化。就是進(jìn)一步縮小操作系統(tǒng)和體系結(jié)構(gòu)之間的語義差異，

減少輔助時間，節(jié)省操作系統(tǒng)軟件占用空間；(3)CISC的主要弊端:

指令集過于龐雜；微程序技術(shù)是其重要支柱，這降低了處理速度；難

以優(yōu)化編譯使之生成真正的目標(biāo)代碼；強調(diào)完善的中斷機制，導(dǎo)致動

作的煩雜；給芯片設(shè)計帶來很多困難，出錯幾率增大，不利于大批量

生產(chǎn)。

RISC技術(shù)一精簡指令集計算機ReducedInstructionSet

Computero(1)基本特征：精簡指令數(shù)量一一般在100條左右；簡化

指令格式一在1?2種之內(nèi)并讓全部指令具有相同長度；采用單周期

指令一幾乎所有指令在一個機器周期內(nèi)完成；采用寄存器操作一盡量

減少訪存操作；硬件控制邏輯一大多指令采用硬件控制實現(xiàn)，少數(shù)用

微程序?qū)崿F(xiàn)；優(yōu)化編譯程序。(2)RISC體系結(jié)構(gòu)：①數(shù)據(jù)類型。有2

種表示方法，一是用操作碼編碼表示，一是通過操作數(shù)內(nèi)部標(biāo)志位表

示，即自定義數(shù)據(jù)表示；字長64位，包括整型數(shù)據(jù)和浮點數(shù)據(jù)，支

持附加數(shù)據(jù)類型；②尋址方式，有：立即尋址方式、寄存器直接尋址

方式、寄存器間接尋址、相對尋址方式、變址值方式和位移量方式。

③寄存器模型和寄存器管理。有三種模型：窗口模型Windows、Cache

模型、矩陣Matrix模型；④存儲器管理。(3)RISC的主要技術(shù)：①

重疊寄存器窗口技術(shù)。有利于合理利用有限的芯片面積，特別是支持

最費時的過程調(diào)用和返回操作；伯克利設(shè)計的重疊窗口有8個，每個

共有32個32位的寄存器，其中10個全局性寄存器，10個局部性寄

存器，6個高位寄存器，6個地位寄存器，其典型調(diào)用時間是2微秒;

②優(yōu)化編譯技術(shù)?？梢院侠矸峙浼拇嫫?，提高寄存器的使用效率，減

少訪存次數(shù)等。③超流水線及超標(biāo)量技術(shù)。超流水線superpipeline

技術(shù)是一種并行處理技術(shù)，通過細(xì)化流水，增加級數(shù)和提高主頻，使

得在每個機器周期內(nèi)能完成一個甚至兩個浮點操作，實質(zhì)是|以時間換

取空間|;超標(biāo)量superscalar技術(shù)也是并行處理技術(shù)，通過內(nèi)裝多條

流水線來同時執(zhí)行多個處理，實質(zhì)是|以空間換取時間|;④硬線邏輯與

微程序相結(jié)合。

MIPS和MFLOPS(1)MIPS每秒執(zhí)行的百萬次指令數(shù)。(2)MFLOPS,

每秒浮點運算的百萬次數(shù)。

三、存儲系統(tǒng)

存儲器的層次結(jié)構(gòu)(1)存儲器以存取速度為主要標(biāo)準(zhǔn)依次排列：

最快的是與CPU同在一塊芯片上的寄存器resister,其次是高速緩沖

存儲器cache-memory,然后是主存儲器main-memory,接著是輔

助存儲器auxiliary-storage,最低層是海量存儲器mass-storageo(2)

有兩個重要的存儲層次，一是主一輔層次，以擴大存儲容量位宗旨，

多用軟件管理來實現(xiàn)。另一個Cache一主存層次，以提高存取速度為

宗旨，均用硬件方法實現(xiàn)；(3)實現(xiàn)存儲體系的依據(jù)正是局部性原理,

包括時間局部性和空間局部性。存儲體系的性能參數(shù)有：①平均字節(jié)

價格C=(C1S1+C2S2)/(S1+S2)；為了使得存儲系統(tǒng)的字節(jié)價格接

近輔存的字節(jié)價格，要求主存容量遠(yuǎn)小于輔存容量；②命中率11=川/

(NHN2)；③存取時間T=HT1+(1-H)T2；④存儲器利用率u=Sa/S,

Sa是程序“活躍”部分所占用的存儲空間，S是可利用的存儲空間總

容量。

并行存儲器(1)并行存儲技術(shù)也是存儲器中的體系結(jié)構(gòu)問題，

它既能擴大存儲容量，乂能提高訪問速度。把存儲器分成多個模塊，

在一次訪問的時間內(nèi)，就能并行的讀出更多信息量，具有這樣組織形

式的存儲器稱為并行存儲器Parallelmemoryo又稱為存儲器的多體

交叉訪問multiplemoduleinterleavedmemory；(2)訪問控制方

法：①同時訪問?？梢砸淮翁峁┒鄠€數(shù)據(jù)或多條指令，適合對多數(shù)據(jù)

流或多指令流進(jìn)行并行處理。應(yīng)注意頻帶寬度的問題，保證處理單元

接收/處理數(shù)據(jù)的速率要和并行存儲器同時讀寫數(shù)據(jù)的速率相匹配；

采用交叉開關(guān)總線；②輪流訪問。在對并行多體存儲器訪問時.，各模

塊按一定的順序輪流啟動各自的訪問周期。降低了對帶寬匹配的要

求。采用分時共享總線。

虛擬存儲器(1)虛擬存儲器的管理方式。決定于主存與虛存間

不同的地址影響方式，分別是段式管理、頁式管理和段頁式管理3種

方式。①段式管理。地址映象一將虛存空間分段，主存的空間按這種

段來分配和管理。段是按程序的邏輯功能來劃分的。當(dāng)程序從輔存調(diào)

入主存時，是按段分配主存空間，需要建立一個包括段長度和主存起

始地址的段表，存放在主存中；地址轉(zhuǎn)換一在段式管理中，主存地址

格式包括段號和段內(nèi)地址，虛存地址格式包括用戶號、段號和段內(nèi)地

址。②頁式管理。將主存空間和虛存空間按固定大小劃分成塊，每塊

稱為一頁。頁的大小和劃分與程序邏輯功能無關(guān)。③段頁式管理。將

虛擬存儲空間按段式管理，主存空間則按頁式管理。存在虛擬空間的

程序按邏輯關(guān)系分段，每一段又可分成固定大小的頁。主存則只分成

若干大小相同的頁。許多大型機都采取該管理方式；（2）頁面替換算

法。在虛擬存儲器中，由于虛擬空間比主存空間大得多，會出現(xiàn)當(dāng)主

存中所有頁已經(jīng)全部被占用，而CPU需要的指令卻在主存中找不到，

從而產(chǎn)生頁面失效Pagefaulto這是需要從輔存中調(diào)入新頁，并把

主存中已經(jīng)不用的舊頁替換出去。常用的替換算法有：①隨機算法

RANDo算法簡單，易于實現(xiàn)；②先進(jìn)先出FIFO；③近期最少使用算

法LRU；④優(yōu)化替換算法OPT一預(yù)先知道將要使用哪些頁面，替換時

把下次調(diào)用該頁時的時間間隔最大的頁面調(diào)出去。這是一種理想算

法。

高速緩沖存儲器Cache（1）為彌補主存速度不足，在|處理機和

主存之間|設(shè)置一個高速小容量的Cache,構(gòu)成“Cache-主存”層次，

其在本質(zhì)上是一個兩級的“頁”式系統(tǒng)；（2）“Cache-主存”和“主

存-輔存”的比較：前者目的是提高存儲系統(tǒng)速度，后者是擴大容量;

兩者工作原理相同，都需要地址變換，但失效時，后者采取頁面替換,

前者采用塊block替換；前者通過硬件實現(xiàn)地址變換和塊替換，后者

則是由操作系統(tǒng)來管理的；主輔層次的兩種存儲介質(zhì)有很大區(qū)別，不

易匹配，而前者則便于匹配；Cache對應(yīng)用程序員和系統(tǒng)程序員都是

透明的，而主輔層次則對系統(tǒng)程序員不完全透明。（3）在有Cache的

系統(tǒng)中，訪問主存請求的優(yōu)先級安排次序是Cache-通道-寫數(shù)-讀數(shù)-

取指令。（4）地址映象和變換。地址映象是指每個主存按什么規(guī)則裝

入Cache中。有全相聯(lián)映象、直接映象、組相聯(lián)映象。（5）Cache的

塊替換算法。有RAND、FIFO、LRU等；LRU替換算法的硬件實現(xiàn)有：

①堆棧法。從棧底到棧頂?shù)膸缀挝恢梅从沉烁鲏K近期最久未被訪問的

次序。②比較對法。讓各塊成對組合，用觸發(fā)器狀態(tài)表示每個比較對

內(nèi)的訪問次序，從而找出被替換的塊。綜上所述，設(shè)計替換算法實現(xiàn)

應(yīng)考慮到：如何對每次訪問進(jìn)行記錄和符合根據(jù)所記錄信息來判定哪

個塊是近期內(nèi)最久未被訪問的。（6）Cache的塊表示。在級相聯(lián)或直

接映象Cache中，地址的數(shù)據(jù)結(jié)構(gòu)由3個部分組成：標(biāo)志tag一給出

塊幀地址；索引index一組相聯(lián)中通過它選擇組號；塊內(nèi)位移block

offset一給出在一個塊內(nèi)所找數(shù)據(jù)的地址。（7）Cache的寫策略，即

更新主存內(nèi)容的算法。①寫直達(dá)法writethrough：只要CPU有寫操

作，在寫入Cache同時，也通過“Cache一主存”通路直接寫入主存;

②寫回法writeback。在CPU執(zhí)行寫操作時，信息只寫入Cache,僅

當(dāng)某塊被替換時，才把曾被寫入過的Cache塊先送回主存，然后再調(diào)

入新塊?！▽懼边_(dá)法的可靠性高，但增加了訪問主存的流量，寫回法

則相反，減少了不必要的訪存，但可靠性受影響，常需要在Cache中

增加更多的冗余信息位來提高其內(nèi)容可靠性。

題目：

1.衡量一個存儲層次體系性能主要從平均字節(jié)價格、命中率、存取

時間等三個方面考慮;

2.選擇存儲映象方式時最基本的考慮因素是易于實現(xiàn)。

3.在多級存儲層次中，根據(jù)時間局部性，層次Ml不必存入整個程序,

只需將近期用過的塊或頁存入；根據(jù)空間局部性，當(dāng)M2將所要訪

問的字送到Ml時，一并把該字所在塊或頁整個取來。

四、I/O通道和新型總線

、IO子系統(tǒng)概述(1)它包括IO設(shè)備、響應(yīng)控制器以及為IO操作

而設(shè)計的軟件。根據(jù)其操作的控制方式，10控制可以分為三類：程

序控制10、DMA和IO處理機方式。①程序控制10方式，是大多計

算機具有的簡單控制方式。在該方式下，10設(shè)備、主存和CPU通過

共享總線進(jìn)行通信，10設(shè)備可以和主存統(tǒng)一編址；優(yōu)點是控制簡單,

編程容易，缺點是大量時間被花于K)操作上，外設(shè)和CPU不能同時

工作；②DMA和中斷控制方式。DMA方式是直接存儲器訪問方式。它

要求外設(shè)和主存之間有直接數(shù)據(jù)通路。優(yōu)點是它把部分10控制交給

設(shè)備控制部分，實現(xiàn)CPU和10設(shè)備的部分并行。缺點是CPU仍需要

啟動每個信息塊的傳輸，增加了成本；中斷控制方式優(yōu)點是初步解決

了CPU、主存和外設(shè)之間的速度匹配問題。缺點是中斷所需輔助操作

很多；③通道控制方式是在DMA基礎(chǔ)上發(fā)展起來的。一個10過程CPU

只參與兩次工作。優(yōu)點是并行操作能力強，提高設(shè)備利用率；缺點是

不能完全獨立于主機；④1()處理機10P專門負(fù)責(zé)1()操作，具有更強

的處理功能，不必借助于CPUo優(yōu)點是CPU幾乎移交了對10的全部

控制，完全獨立于主機；缺點是提高系統(tǒng)成本。這方式廣泛應(yīng)用于

IBM360、370系統(tǒng)。

通道的工作原理(1)通道的功能：接受CPU發(fā)來的10指令，按

指令要求和指定的10設(shè)備進(jìn)行聯(lián)系；從主存取出屬于該通道程序的

通道指令，對指令進(jìn)行譯碼，向1()設(shè)備及控制器發(fā)出多種操作命令;

為主存和外設(shè)裝配和拆卸信息；從10設(shè)備獲得設(shè)備狀態(tài)信息形成并

保存通道信息，并根據(jù)需要將這些信息送往主存指定單元；將10設(shè)

備的中斷請求及通道本身的中斷請求發(fā)送給CPU；(2)通道種類：字

節(jié)多路通道bytemultiplexerchannel一適合于連接大量低速設(shè)備，

其工作模式有字節(jié)交叉模式和突發(fā)模式；數(shù)組多路通道block

multiplexerchannel適于為高速設(shè)備服務(wù)；選擇通道selector

channel也是為多臺高速設(shè)備服務(wù)的，但在數(shù)據(jù)傳送期間，通道只能

為某一臺高速設(shè)備服務(wù)，只能執(zhí)行一道通道程序。(3)通道字和通道

程序。①通道命令字CCW是通道能夠執(zhí)行的一組指令，又稱通道控制

字。由命令碼、數(shù)據(jù)地址、標(biāo)志碼、保留位、計數(shù)字段組成，共64

位；②通道地址字CAW指明要執(zhí)行的第一個通道命令字的地址，即通

道程序首地址，共32位，主要由存儲保護(hù)字段和地址字段組成；③

通道狀態(tài)字CSW用來記錄通道和外設(shè)執(zhí)行通道程序的狀態(tài)，存放在內(nèi)

存儲器的固定單元中，共64位。④通道程序，由若干個通道命令可

組成一個通道程序。(4)通道的工作原理。1()操作過程可分為5個

階段：準(zhǔn)備、啟動、數(shù)據(jù)傳輸、結(jié)束傳輸、結(jié)束中斷。通道分擔(dān)了

CPU對輸入輸出操作的控制，基本上實現(xiàn)了CPU和外部設(shè)備之間的并

行執(zhí)行，減少了外設(shè)向CPU請求中斷的次數(shù)，提高了CPU運行效率。

(5)通道流量設(shè)計。通道流量是指在數(shù)據(jù)傳送期間單位時間內(nèi)傳送

的字節(jié)數(shù)。

EISA和MCA(1)微機總線的演變：第一代PC總線：8位/16位

總線一內(nèi)部總線16位，外部總線8位；第二代PC總線：16位息線

—另一名稱是ISA,即工業(yè)標(biāo)準(zhǔn)體系結(jié)構(gòu)總線；第三代PC總線：32

位總線一可提供多達(dá)4GB的尋址空間，能自動配置系統(tǒng)及擴充插卡，

微機的32位總線主要有3大類，分別是Compaq等公司的EISA總線,

IBM公司的MCA總線,Apple公司的NuBus總線。(2)MCA微通道體

系結(jié)構(gòu)。MCA是MicroChannelArchitecture微通道體系結(jié)構(gòu)的縮

寫，其主要的特點可概括為：①是32位的高速微通道，可支持8、

16、32位的數(shù)據(jù)轉(zhuǎn)換與傳送，改善了數(shù)據(jù)完整性；②MCA是完異步的

總線結(jié)構(gòu)，支持各總線主控器以及CPU公平地分享總線；③MCA采用

了可編程任選POS,能識別用戶安裝地MCA插卡類型，并自動地給他

分配系統(tǒng)資源；④可磁兼容性好，可靠性高；⑤支持多處理和并行處

理系統(tǒng)，支持0等待狀態(tài)，能提高處理效率。(3)EISA擴展工業(yè)標(biāo)

準(zhǔn)體系結(jié)構(gòu)。特點為：①它是32位地擴展工業(yè)標(biāo)準(zhǔn)總線，即ISA總

線擴充；②EISA基木上是一個同步總線，它和CPU協(xié)同工作；③仲

裁方案以輪流服務(wù)為基礎(chǔ)；④采用了精致的雙排擴展插槽；⑤和MCA

都采用共享地中斷線路。

VESA和PCI局部總線(1)VESA是視頻電子標(biāo)準(zhǔn)協(xié)會開發(fā)地局部

總線標(biāo)準(zhǔn)，又稱VL總線，基于該標(biāo)準(zhǔn)的4類產(chǎn)品是：VESA局部總線

主板、VESA硬盤卡、VESA顯示卡、多功能卡；（2）PCI局部總線，

PCI,PeripheralComponentInterface,是外部部件接口的縮寫。

PCI是32位的總線，在33MHz的時鐘頻率下所提供的最大數(shù)據(jù)傳輸

速率是132MbpsoPCI還采取32位數(shù)據(jù)總線和64位地址總線，把帶

寬透明的擴充到264MbpsoPCI局部總線能顯著提高網(wǎng)絡(luò)服務(wù)器的性

能。其優(yōu)點有：能大幅度提高數(shù)據(jù)吞吐率一測試表明，ISA總線的CPU

占有率46%,EISA總線CPU占有率12%,而PCI局部總線CPU占有

率不到6%；具有較低的訪問延遲。

五、流水技術(shù)和向量處理機

指令的流水處理（1）指令控制方式有三種：①順序方式。即各

機器指令之間順序串行的執(zhí)行；優(yōu)點是控制簡單，缺點是速度上不去,

機器的利用率低；②重疊方式。在前一條指令操作完成之前，開始解

釋下一條指令。優(yōu)點是速度提高，缺點是會出現(xiàn)沖突、轉(zhuǎn)移和相關(guān)等

問題；③流水方式。把并行性或并發(fā)性鑲嵌到計算機系統(tǒng)里的形式。

通常用時空圖描述流水線工作。（2）流水線的分級：按處理級別可分

為3級:①操作部件級一也叫運算操作流水線ArithmeticPipelines,

是將復(fù)雜算術(shù)、邏輯運算組成流水線工作方式；②指令級流水

InstructionPipelines,把指令解釋過程分成多個子過程；③處理

機級流水，是一種宏流水線Meer。Pipelines,其中每個處理機完成

某一專門任務(wù)，各個處理機所得到的結(jié)果需要存放在與下一個處理機

所共享的存儲器中c(3)流水線性能分析。①吞吐率Throughputrate。

指在單位時間內(nèi)流水線所完成的任務(wù)數(shù)或輸出結(jié)果的數(shù)量；最大吞吐

率TPmax=l/max(dt),即最大吞吐率取決于流水線中最慢的一段的

時間；實際吞吐率TP=TPmax/(1+(m-1)/n),其中m為流水線段

數(shù)，n為任務(wù)數(shù)；②加速比Speedupratioo指m段流水線的速度和

等效的非流水線的速度之比。S=T0/T1=n*m*dt/[m*dt+(n-l)*dt]

=m/[1+(m-1)/n]；③效率Efficiency。是流水線的設(shè)備利用率。E

=n個任務(wù)占用的時空區(qū)/m個段總的時空區(qū)。(4)流水的相關(guān)處理。

①局部性相關(guān)原理。流水線同時解釋的指令可能出現(xiàn)相關(guān)。解決的辦

法有兩種：一是推后法，即推后對相關(guān)單元的讀；二是通路法，即設(shè)

置相關(guān)專用通路而不必使用存儲單元的寫讀；②全局性相關(guān)原理。轉(zhuǎn)

移指令和它后面的指令之間存在關(guān)聯(lián)，不能同時解釋，執(zhí)行時可能會

改動指令緩沖器中預(yù)取到的指令內(nèi)容，從而造成流水線吞吐率和效率

下降；解決辦法有3種：一是猜測轉(zhuǎn)移分支；二是加快和提前形成條

件碼；三是加快短循環(huán)程序的處理；③流水的中斷處理。中斷也會引

起流水線斷流。但出現(xiàn)概率比條件轉(zhuǎn)移的要低。其處理關(guān)鍵在于如何

處理好斷點和中斷后的恢復(fù)問題。(5)時鐘周期和流水線調(diào)度。①時

鐘周期直接決定流水線的最大吞吐率。其越??？，流水線分段越多，

寄存器延遲時間救越長，降低了流水線的實際吞吐率。時鐘周期越小,

TPmax越高；②流水線為避免功能段的沖突，存在任務(wù)的調(diào)度問題。

通常采用預(yù)約表R（Reservationtable）的方法。

流水處理指令并行性的開發(fā)（1）超級標(biāo)量計算機，配置了多個

功能部件和指令譯碼器，和多個寄存器端口和總線，能同時執(zhí)行多個

操作。其流水線調(diào)度包括指令的發(fā)射策略和完成策略。指令發(fā)射

InstructionIssue是啟動指令進(jìn)入執(zhí)行段的過程，分為按序發(fā)射和

無序發(fā)射。指令發(fā)射策略是指指令發(fā)射時所使用的協(xié)議或規(guī)則。指令

的完成也有按序和無序之分。超標(biāo)量流水線的調(diào)度策略共有三種：按

序發(fā)射按序完成、按序發(fā)射無序完成、無序發(fā)射無序完成。（2）超長

指令字計算機VLIW。是由編譯程序在編諾時找出指令之間潛在的并

行性，進(jìn)行適當(dāng)調(diào)度安排，把多個能并行執(zhí)行的操作組合在一起，成

為一條具有多個操作段的超長指令，由它控制多個互相獨立的功能部

件，每個操作段控制一個功能部件，相當(dāng)于同時執(zhí)行多條指令。例如

Cycra5計算機，其每個操作段的典型格式為：一個操作碼、兩個源

寄存器描述碼、一個目的寄存器描述碼和一個判定寄存器描述碼。（3）

超級流水線計算機。結(jié)構(gòu)是把每個流水線分成若干個子流水線，而每

個子流水線取出的仍只有一條指令，這樣看來在一個周期內(nèi)便取出了

多條指令。例如MIPS公司宣布的64位RISC計算機一R4000機,每

個周期可流出2條指令。

向量流水處理機（1）向量處理方式：以計算D=A*（B+C）為例,

其中ABC均為有n個元素的向量。①橫向處理方式。按組成的元素順

序逐個進(jìn)行計算。即分別求行=Ai*（Bi+Ci）；該方式在速度和效率

上都沒有提高；②縱向處理方式。先計算向量B+C=E,再計算向量

A*E=D.③分組/縱橫處理方式。前兩種方式的結(jié)合。即把原來向量分

成幾組，每組按縱向處理方式進(jìn)行。CRAY1超級計算機采取縱橫處理

方式；CRYER205則采取縱向處理方式。實際上，向量處理機的體系

結(jié)構(gòu)有兩種基本類型：一是寄存器一寄存器機；另一是存儲器一存儲

器向量機。（2）向量流水處理機。①CRAY1向量流水處理機。屬于寄

存器一寄存器類型，時鐘周期位12.5ns,存儲器周期為4個時鐘周

期，運算速度為160MFLOPS。只有120條指令，指令格式有兩種：16

位的單字段指令和32位雙字段指令。機器字長64位，包括3種數(shù)據(jù)

格式：24位帶符號整數(shù)、64位帶符號整數(shù)、64位浮點數(shù)。CRAY1采

取了大量的寄存器組。并具有4類12種功能流水線（見附）；CRAY1

解決沖突的方法有鏈接技術(shù)和推遲執(zhí)行兩種。輸入輸出由24個通道

組成。CRAY1使得模擬成為重要的科學(xué)研究方法之一。②CRYER205。

機器的中心部件是標(biāo)量部件，包括指令處理部件和標(biāo)量執(zhí)行部件。其

存儲器基本模型是64位的1M存儲器，最大容量為4M*64b。時鐘周

期80nso提供8個32位的10通道，傳輸速率200MbpsoCRYER205

性能指標(biāo)比CRAY1高，單運行上并誤多大差別，因為存儲器一存儲器

向量機再體系結(jié)構(gòu)上不及寄存器一寄存器優(yōu)越。

附：

1.CRAY1的寄存器組包括向量寄存器、標(biāo)量寄存器、A寄存器、B寄

存器、T寄存器；

2.CRAY1有4類12種功能流水線：①地址功能流水：包括地址加、

地址乘2條流水線；②標(biāo)量功能流水：標(biāo)量加、標(biāo)量位移、標(biāo)量

邏輯、計數(shù)4條流水線；③向量功能流水：向量

加、向量位移、向量邏輯3條；④浮點

功能流水：浮點加、浮點乘、求倒數(shù)近似3條。

六、并行處理技術(shù)和多處理機

并行性主要是指同時性或并發(fā)性。在進(jìn)行并行處理時，其每次處

理的規(guī)模大小可能是不同的，這可用并行性顆粒度來表示：G=所有

處理器進(jìn)行計算的時間總和/所有處理器通信時間總和。并行性從執(zhí)

行程序的角度看，并行性等級可分為5個：作.業(yè)級、任務(wù)級、例行程

序/子程序級、循環(huán)和迭代級、語句和指令級；從處理數(shù)據(jù)的角度看,

可分為4級：字串位串、字串位并、字并位串、字并位并/全并行。

并行處理技術(shù)（1）層次越高的并行處理顆粒就越細(xì)，粗粒度并

行性開發(fā)主要采用MIMD方式；|開發(fā)計算機系統(tǒng)并行性，一般采用

資源重復(fù)、時間重疊和資源共享三種方法|c資源重復(fù)是通過使用多功

能部件，引入空間重復(fù)因素；時間重疊是在并行性概念中引入時間因

素，讓多個處理過程重疊地使用同一套部件各個部分；資源共享主要

是采用軟件手段讓多個用戶按時間片輪流使用同一套硬件資源。（2）

并行處理機地結(jié)構(gòu)和特點。以SIMD方式工作，采用資源共享重復(fù)的

并行性措施的陣列處理機：①基本結(jié)構(gòu)：由一個控制器CU、n個處理

單元PE、m個存儲模塊M和一個互連網(wǎng)絡(luò)部件IN組成。根據(jù)存儲器

模塊是以分布方式還是集中方式存取，可以分為兩種基本結(jié)構(gòu)：分布

式存儲器的陣列機和共享存儲器的陣列機：②主要特點：采用資源重

復(fù)方法引入空間因素；以某一類算法位背景的專用計算機；其研究必

須和并行算法研究密切結(jié)合，使之具有更強適應(yīng)性；從處理單元看，

可以將其看成一個同構(gòu)型并行機。

SIMD的互連網(wǎng)絡(luò)（1）基本互連函數(shù)：①恒等置換。相同編號的

輸入輸出端對應(yīng)。表達(dá)式：/區(qū)_］蒼35|工0）二n"”-2「//0；②交換置

換。第0位位值不同的輸入端和輸出端之間的連接。

七（元,1凡,2.4工0）=匕/2...M1。；③方體置換。第k位位值不同的輸入端和

輸出端之間的連接cC（X"”.2…々…中0）=…％%；④均勻洗牌置

換。輸入端分成數(shù)目相等的兩半，再隔一個順序和輸出端相連。

。區(qū)…XXoZ-l，可見洗牌是將輸入端二進(jìn)制地址循環(huán)左移

一位得到對應(yīng)的輸出端二進(jìn)制地址；⑤蝶式置換。

%）=x（）x〃2Tx即將輸入二進(jìn)制地址的最高位和最低位互

換位置取可求得響應(yīng)輸出的地址。⑥位序顛倒置換。

〃一2…％2%一1。（2）互連網(wǎng)絡(luò)的特性:網(wǎng)絡(luò)規(guī)模一網(wǎng)絡(luò)中

結(jié)點個數(shù)；結(jié)點度一和結(jié)點相連接的邊數(shù)；距離一量結(jié)點之間相連的

最少邊數(shù)；網(wǎng)絡(luò)直徑一網(wǎng)絡(luò)中結(jié)點之間最大距離；等分寬度一當(dāng)網(wǎng)絡(luò)

被分成兩半時，沿切口的最小邊數(shù)；結(jié)點之間的線長一兩個結(jié)點間的

線的長度；對稱性一若從任何結(jié)點看拓?fù)浣Y(jié)構(gòu)都一眼則稱為對稱網(wǎng)

絡(luò)。（3）網(wǎng)絡(luò)性能參數(shù)：頻寬bandwidth—傳輸信息的最大速率，單

位為兆位/秒；傳輸時間transmissiontime一等于消息長度除以頻

寬;“飛行”時間timeoffly一包括時延；傳輸時延transportlatency

一等于飛行時間+傳輸時間。發(fā)送方開銷senderoverhead—處理器

把消息放到互聯(lián)網(wǎng)的時間；接收方開銷receiveroverhead-處理器

把到達(dá)的消息從互聯(lián)網(wǎng)上取出的時間；〃總時延=發(fā)送方開銷+飛行

時間+消息長度/頻寬+接受方開銷。（4）常用的單級互連網(wǎng)絡(luò)：①交

換互連網(wǎng)絡(luò)。鳳X）?=（如…瓦..4）；②PM2I互連網(wǎng)絡(luò)：

PM2+,=（j+2）mod^;=（八2，）modN,OWiWnT,OWjWN-l；其

中N是結(jié)點數(shù)，n=log2N；③混洗交換互連網(wǎng)絡(luò)。由全混洗和交換兩

種互連函數(shù)詞成。④蝶式互連網(wǎng)絡(luò)Butterfly（x"g"A）尸".2…X"⑸

關(guān)于多級連接。多級連接特性決定因素主要有交換開關(guān)、拓?fù)浣Y(jié)構(gòu)、

控制方式3種。常用的多級互連網(wǎng)絡(luò)有多級立方網(wǎng)絡(luò)、多級混洗交換

網(wǎng)絡(luò)、多級PM2I互連網(wǎng)絡(luò)。

多處理機（1）多處理機具有兩臺以上的處理機。在操作系統(tǒng)控

制下通過共享主存或輸入輸出子系統(tǒng)或高速通信網(wǎng)絡(luò)進(jìn)行通信。屬于

MIMD系統(tǒng)。特點有：結(jié)構(gòu)靈活性、程序并行性、并行任務(wù)派生、進(jìn)

程同步、資源分配和調(diào)度。（2）多處理機系統(tǒng)中，機間互連主要采用

以下幾種方式：總線方式、縱橫交叉開關(guān)互

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

計算機體系結(jié)構(gòu)

文檔簡介

溫馨提示

最新文檔

評論

計算機體系結(jié)構(gòu)

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔