版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
一、計算機體系結(jié)構(gòu)的基本概念
計算機體系結(jié)構(gòu)是指機器語言程序的設(shè)計者或是編譯程序設(shè)計
者所看到的計算機系統(tǒng)的概念性結(jié)構(gòu)和功能特性。Amdahl所定義的
體現(xiàn)結(jié)構(gòu)是指程序員面對的是硬件的系統(tǒng)。所關(guān)心的是如何合理的進(jìn)
行軟便件功能的分配。
計算機系統(tǒng)結(jié)構(gòu)是指機器語言級的程序員所了解的計算機的屬
性,即外特性??梢园瑪?shù)據(jù)表示,寄存器定義、數(shù)量、使用方式,
指令系統(tǒng),中斷系統(tǒng),存存儲系統(tǒng),IO系統(tǒng)等。
計算機組成是計算機結(jié)構(gòu)的邏輯實現(xiàn)??梢园瑪?shù)據(jù)通路寬度,
專用部件設(shè)置,緩沖技術(shù),優(yōu)化處理等。
計算機的實現(xiàn)是指其計算機組成的物理實現(xiàn)。包括處理機,主存
部件的物理結(jié)構(gòu),器件的集成度,速度的選擇,模塊、硬件、插件底
板的劃分和連接。
從使用語言的角度,可以把計算機系統(tǒng)按功能從高到低分為7
級:0應(yīng)用語言機器級、1高級程序語言機器級、2匯編語言機器級、
3操作系統(tǒng)機器級、4傳統(tǒng)機器語言機器級、5微程序機器級和6電
子線路級。3?6級為虛擬機,其語言功能均由軟件實現(xiàn)。
硬件功能分配的基木原則:(1)功能要求。首先是應(yīng)用領(lǐng)域?qū)?yīng)
的功能要求,其次是對軟件兼容性的要求;(2)性能要求。如運算速
度,存儲容量,可靠性,可維護(hù)性和人機交互能力等;(3)成本要求。
體系結(jié)構(gòu)設(shè)計的方法有三種:由上而下一從考慮如何滿足應(yīng)用要
求開始設(shè)計;由下而上一基于硬件技術(shù)所具有的條件;由中間開始的
方法。
體系設(shè)計的步驟:需求分析、需求說明、概念性設(shè)計、具體設(shè)計、
優(yōu)化和評價。
計算機體系結(jié)構(gòu)的分類:(1)弗林FLYNN分類法:按指令流和
數(shù)據(jù)流將計算機分為4類:①單指令流、單數(shù)據(jù)流一Single
InstructionStreamSingleDataStream,SISD?計算機,即傳統(tǒng)
的單處理機,通常用的計算機多為此類,如脈動陣列計算機systolic
array;②單指令流、多數(shù)據(jù)流一Multiple,SIMD。典型代表是并行
處理機。其并行性在于指令一級。如ILLIAC、PEPE、STARAN、MPP等;
③MISD計算機;④MIMD計算機。多處理機系統(tǒng),實現(xiàn)全面并行的理
想結(jié)構(gòu)??梢酝ㄟ^共享存儲器和消息傳遞來耦合系統(tǒng),每個處理器分
別執(zhí)行系統(tǒng)分配的程序,同時執(zhí)行多個指令流對多個數(shù)據(jù)流不同的處
理,如IBM3081/3084,Cray-2等。〃弗林分類法基本上是對除流水
線處理機外的諾衣曼型畫畫計算機進(jìn)行分類,而不包括對像數(shù)據(jù)流
計算機這種非諾衣曼型機器進(jìn)行分類;(2)馮氏分類法。依據(jù)是并行
度一即計算機在單位時間內(nèi)能夠處理的最大二進(jìn)制位數(shù)。據(jù)此分為4
類:①字串位串WordSerialandBitSerialoWSBS計算機。只有
一個串行的處理部件,每字長1位;②字并位串Parallel。WPBS計
算機。只有一個處理部件。該部件處理字長n位;③字串位并WSBP
計算機。有多個處理部件。每個處理部件字長1位;④字并位并WPBP
計算機。有多個處理部件,各部件字長也并行,如1LLICA2計算機具
有64個字長64位的處理單元。
馮?諾衣曼型計算機體系結(jié)構(gòu)及其發(fā)展(1)是存儲程序計算機的
別稱。在體系結(jié)構(gòu)有著如下特點:①機器以運算器位中心,使用單一
處理部件來完成計算、存儲及通信工作;②采用存儲程序的原理,使
用線性組織的定長存儲單元來存儲程序,存儲時對指令和數(shù)據(jù)不加區(qū)
別;③存儲空間的單元是直接尋址的,每個單元位數(shù)固定;④使用二
進(jìn)制機器語言,其指令完成基本操作碼的簡單操作;⑤對計算機進(jìn)行
集中的順序控制。(2)兩個最主要的特征:一是計算機內(nèi)部信息流動
是由指令驅(qū)動的,而指令執(zhí)行順序由指令計數(shù)器決定;二是計算機的
應(yīng)用仍主要面向數(shù)值計算和數(shù)據(jù)處理。(3)發(fā)展:①數(shù)據(jù)流計算機
DFMo只要所需的操作數(shù)齊備就可以執(zhí)行,這時只取決于執(zhí)行部件的
并行處理能力;②智能計算機。主要處理一些非數(shù)值化信息。
體系結(jié)構(gòu)并行技術(shù)的發(fā)展(1)并行性是指在同一時刻或同一時
間間隔內(nèi)完成兩種或兩種以上性質(zhì)相同或不同的工作的特性。具有同
口寸性和并發(fā)性二重性。(2)等級劃分:(由低到高):①按執(zhí)行程序的
等級劃分:指令內(nèi)部、指令之間、任務(wù)或進(jìn)程之間、作業(yè)或程序之間;
②處理數(shù)據(jù)等級劃分:字串位串、字串位并、字并位串、字并位并;
③按信息加工的等級劃分:存儲器操作并行、處理器操作并行、指令
任務(wù)作.業(yè)并行;(2)并行性的技術(shù)途徑:①時間重疊。多個處理過程
在時間上錯開,如流水線處理機;②資源重復(fù)。重復(fù)設(shè)置硬件資源來
提高計算機的性能。如陣列處理機;③資源共享。用軟件方法讓多個
用戶按一定時間順序輪流使用同一套件資源,以提高計算機設(shè)備利用
率。如多道程序分時系統(tǒng)。
題目:
1.高級語言經(jīng)陋程囹的酶形成匯編語言程序;
2.傳統(tǒng)機器語言機器級,是用|微指令程序]來麗機器指令;微指令
由麗直接執(zhí)行;
3.Amdahl加速比定律:加速比:Sp=l/(1-Fe+Fe/Se),其中Fe為
被改進(jìn)部分的執(zhí)行時間所占的百分比的大??;Se是其性能提高的
倍數(shù)。〃局部性原理:程序趨向于重用它當(dāng)前已經(jīng)在使用的指令
和數(shù)據(jù)。包括時間局部性和空間局部性。時間局部性是指當(dāng)前訪
問的項目在最近的將來還會被訪問;空間局部性是指某個項目及
其附近地址的其他項目會同時被引用。
4.實現(xiàn)軟件移植的基本技術(shù)有:統(tǒng)一的高級語言、采用陣列機、模
擬和仿真;
5.仿真是指用微程序直接解釋另一臺計算機的機器指令系統(tǒng);模擬
指用機器語言解釋實現(xiàn)軟件移植的方法;
6.多機系統(tǒng)的耦合度可分為:最低耦合、松散耦合和緊密耦合三種
類型;
二、指令系統(tǒng)
指令系統(tǒng)又稱指令集InstructionSet,它對計算機系統(tǒng)有全劇性影
響,即指令的功能將直接反映系統(tǒng)功能。指令集發(fā)展有兩個趨勢:
CISC和RISC;
指令集體系結(jié)構(gòu)的分類(1)分類依據(jù),可以有5種:操作數(shù)在
CPU中的存儲方式;顯示操作數(shù)的數(shù)量;操作數(shù)的位置;指令的操
作;操作數(shù)的類型和大小。(2)按暫存機制分類:依據(jù)在CPU內(nèi)部
存儲操作數(shù)的區(qū)別,可以把指令集體系結(jié)構(gòu)分為3類:堆棧stack、
累力口器accumulator、寄存器即asetofregisters。①堆棧機。主要操作
是壓入和彈出,其他操作還有加、減、比較等;優(yōu)點是:表示數(shù)值的
模型簡單、指令長度短。②累加器類機器是有一個隱含操作數(shù)的機器。
例如PDP-8、Motorola6809;優(yōu)點是機器的內(nèi)部狀態(tài)很少,指令也比
較短。③寄存器為基礎(chǔ)的指令系統(tǒng)優(yōu)點是:速度更快、數(shù)值表示上有
很強的適應(yīng)性。例如IBM360、DECVAXo(3)通用寄存器
general-purposeresistermachine,簡稱GPR機。其關(guān)鍵性優(yōu)點起
因于編譯程序能有效的使用寄存器,無論是計算表達(dá)式的值,還是從
更為全局的角度使用寄存器來保存變量的有??梢苑譃?類:①寄存
器-寄存器resister-resistero只能對存儲器有存取指令,所有操
作在兩個寄存器之間進(jìn)行,操作結(jié)果送入第三個寄存器中;優(yōu)點是:
速度快、指令具有良好的正交編碼模型;如RISC和Cray計算機;②
寄存器-存儲器類register-memoryo在指令中,由寄存器內(nèi)容加上
存儲器內(nèi)容尋址構(gòu)成尋址技術(shù)。如VAX、IBM360.Motorola68000.
PDP11等。優(yōu)點是:數(shù)據(jù)不需要寄存器裝入就能存取、指令大小適中;
③存儲器-存儲器memory-memory。如VAX2和IBM370,優(yōu)點是緊湊、
不需要消耗臨時寄存器。
指令格式(1)指令編碼方法,通常有3種:①正交法orthogonal
methodo對流水線計算機特別適應(yīng),采用微程序控制時微程序數(shù)量可
以較少;②整體法integrated??梢园咽褂妙l率高的操作數(shù)通操作
數(shù)地址碼組合起來,加以縮短優(yōu)化,而使用頻率低的操作碼可以較長
些,從而節(jié)省存儲容量,但需要較大的微程序存儲器;③混合法mixed。
把以上兩個方法優(yōu)點結(jié)合。(2)指令格式。最普通的是:操作碼。pccde-
操作數(shù)operand/地址。操作碼字段表明操作類型;操作數(shù)/地址字段
指明具體的操作數(shù),也可以指明操作數(shù)地址,通常是和尋址方式相配
合形成的。(3)尋址技術(shù)。即指令按什么方式尋找所需的操作數(shù)或信
息,它影響主存規(guī)模速度和存取方式。尋址方式對于應(yīng)用程序是透明
的。①編址方式:統(tǒng)一編址一把各個不部件統(tǒng)一編成從0開始的一維
線性地址空間;局部編址一指導(dǎo)這些部件適當(dāng)分類,各自從0開始單
獨編址,形成多個一維的線性地址空間;隱含編址一地址隱含于操作
碼中;②程序定位方式。程序定位是把指令和數(shù)據(jù)中的邏輯地址轉(zhuǎn)變
成主存物理地址的過程,有三種方法:直接定位方式、靜態(tài)定位方式、
動態(tài)定位方式;③尋址方式。大多計算機都將主存、通用寄存器、堆
棧分類編址,因此就有分別面向寄存器、堆棧和主存的尋址方式。
指令的優(yōu)化(1)指令格式的優(yōu)化。就是從整個指令系統(tǒng)的利用
率角度出發(fā),盡量設(shè)法減少指令中冗余信息量,以便用最少的位數(shù)提
供足夠的操作信息和地址信息。包括操作碼的優(yōu)化和操作數(shù)的優(yōu)化;
(2)哈夫曼編碼。左1右0。(3)理論碼長一信息源烙。任意隨機
事件的出現(xiàn)概率為Pi,則它的信息量Ii=Tog2(Pi),則平均信息
量為H=-和(Pi*log2(Pi)),由此式的結(jié)果H即為理論碼長。信息
冗余量=1-理論碼長/操作碼的平均長度。(4)等長擴展碼。哈夫曼
編碼方法形成的指令碼很不規(guī)則,長度不一。事實上計算機采用等長
擴展碼,介于等長二進(jìn)制編碼和全哈夫曼編碼之間的一種編碼方式,
仍利用哈夫曼思想,對概論高的指令用短瑪,概率低的用長碼,但在
整體上只采用了有限的幾種碼長。如下表:
指令頻度哈夫曼碼等長碼等長擴展碼
110.40000000
120.3010001()1
130.1511001010
140.05111000111100
150.04111011001101
160.03111101011110
170.03111111101111
平均碼長2.2032.30
理論碼長為2.17。
指令系統(tǒng)的復(fù)雜化(1)CISC和RISC的目標(biāo)是相同的,都是為
了提高性能,減少語義差距,改善性能價格比。目前多用CISC類型,
如IBM360/370和4300系列等;(2)指令系統(tǒng)復(fù)雜化的實現(xiàn)措施:
①面向目標(biāo)代碼的優(yōu)化。按靜態(tài)使用頻度(程序中出現(xiàn)的百分比)改
進(jìn)可以減少存儲空間;按動態(tài)使用頻率(執(zhí)行過程中出現(xiàn)的百分比)
改進(jìn)可以減少目標(biāo)程序運行的執(zhí)行時間;②面向高級語言的優(yōu)化,就
是盡可能縮小高級語言和機器語言之間的活義差異,以利于支持高級
語言的編譯系統(tǒng),左端編譯程序的長度和編譯所需時間;③面向操作
系統(tǒng)的優(yōu)化。就是進(jìn)一步縮小操作系統(tǒng)和體系結(jié)構(gòu)之間的語義差異,
減少輔助時間,節(jié)省操作系統(tǒng)軟件占用空間;(3)CISC的主要弊端:
指令集過于龐雜;微程序技術(shù)是其重要支柱,這降低了處理速度;難
以優(yōu)化編譯使之生成真正的目標(biāo)代碼;強調(diào)完善的中斷機制,導(dǎo)致動
作的煩雜;給芯片設(shè)計帶來很多困難,出錯幾率增大,不利于大批量
生產(chǎn)。
RISC技術(shù)一精簡指令集計算機ReducedInstructionSet
Computero(1)基本特征:精簡指令數(shù)量一一般在100條左右;簡化
指令格式一在1?2種之內(nèi)并讓全部指令具有相同長度;采用單周期
指令一幾乎所有指令在一個機器周期內(nèi)完成;采用寄存器操作一盡量
減少訪存操作;硬件控制邏輯一大多指令采用硬件控制實現(xiàn),少數(shù)用
微程序?qū)崿F(xiàn);優(yōu)化編譯程序。(2)RISC體系結(jié)構(gòu):①數(shù)據(jù)類型。有2
種表示方法,一是用操作碼編碼表示,一是通過操作數(shù)內(nèi)部標(biāo)志位表
示,即自定義數(shù)據(jù)表示;字長64位,包括整型數(shù)據(jù)和浮點數(shù)據(jù),支
持附加數(shù)據(jù)類型;②尋址方式,有:立即尋址方式、寄存器直接尋址
方式、寄存器間接尋址、相對尋址方式、變址值方式和位移量方式。
③寄存器模型和寄存器管理。有三種模型:窗口模型Windows、Cache
模型、矩陣Matrix模型;④存儲器管理。(3)RISC的主要技術(shù):①
重疊寄存器窗口技術(shù)。有利于合理利用有限的芯片面積,特別是支持
最費時的過程調(diào)用和返回操作;伯克利設(shè)計的重疊窗口有8個,每個
共有32個32位的寄存器,其中10個全局性寄存器,10個局部性寄
存器,6個高位寄存器,6個地位寄存器,其典型調(diào)用時間是2微秒;
②優(yōu)化編譯技術(shù)??梢院侠矸峙浼拇嫫?,提高寄存器的使用效率,減
少訪存次數(shù)等。③超流水線及超標(biāo)量技術(shù)。超流水線superpipeline
技術(shù)是一種并行處理技術(shù),通過細(xì)化流水,增加級數(shù)和提高主頻,使
得在每個機器周期內(nèi)能完成一個甚至兩個浮點操作,實質(zhì)是|以時間換
取空間|;超標(biāo)量superscalar技術(shù)也是并行處理技術(shù),通過內(nèi)裝多條
流水線來同時執(zhí)行多個處理,實質(zhì)是|以空間換取時間|;④硬線邏輯與
微程序相結(jié)合。
MIPS和MFLOPS(1)MIPS每秒執(zhí)行的百萬次指令數(shù)。(2)MFLOPS,
每秒浮點運算的百萬次數(shù)。
三、存儲系統(tǒng)
存儲器的層次結(jié)構(gòu)(1)存儲器以存取速度為主要標(biāo)準(zhǔn)依次排列:
最快的是與CPU同在一塊芯片上的寄存器resister,其次是高速緩沖
存儲器cache-memory,然后是主存儲器main-memory,接著是輔
助存儲器auxiliary-storage,最低層是海量存儲器mass-storageo(2)
有兩個重要的存儲層次,一是主一輔層次,以擴大存儲容量位宗旨,
多用軟件管理來實現(xiàn)。另一個Cache一主存層次,以提高存取速度為
宗旨,均用硬件方法實現(xiàn);(3)實現(xiàn)存儲體系的依據(jù)正是局部性原理,
包括時間局部性和空間局部性。存儲體系的性能參數(shù)有:①平均字節(jié)
價格C=(C1S1+C2S2)/(S1+S2);為了使得存儲系統(tǒng)的字節(jié)價格接
近輔存的字節(jié)價格,要求主存容量遠(yuǎn)小于輔存容量;②命中率11=川/
(NHN2);③存取時間T=HT1+(1-H)T2;④存儲器利用率u=Sa/S,
Sa是程序“活躍”部分所占用的存儲空間,S是可利用的存儲空間總
容量。
并行存儲器(1)并行存儲技術(shù)也是存儲器中的體系結(jié)構(gòu)問題,
它既能擴大存儲容量,乂能提高訪問速度。把存儲器分成多個模塊,
在一次訪問的時間內(nèi),就能并行的讀出更多信息量,具有這樣組織形
式的存儲器稱為并行存儲器Parallelmemoryo又稱為存儲器的多體
交叉訪問multiplemoduleinterleavedmemory;(2)訪問控制方
法:①同時訪問??梢砸淮翁峁┒鄠€數(shù)據(jù)或多條指令,適合對多數(shù)據(jù)
流或多指令流進(jìn)行并行處理。應(yīng)注意頻帶寬度的問題,保證處理單元
接收/處理數(shù)據(jù)的速率要和并行存儲器同時讀寫數(shù)據(jù)的速率相匹配;
采用交叉開關(guān)總線;②輪流訪問。在對并行多體存儲器訪問時.,各模
塊按一定的順序輪流啟動各自的訪問周期。降低了對帶寬匹配的要
求。采用分時共享總線。
虛擬存儲器(1)虛擬存儲器的管理方式。決定于主存與虛存間
不同的地址影響方式,分別是段式管理、頁式管理和段頁式管理3種
方式。①段式管理。地址映象一將虛存空間分段,主存的空間按這種
段來分配和管理。段是按程序的邏輯功能來劃分的。當(dāng)程序從輔存調(diào)
入主存時,是按段分配主存空間,需要建立一個包括段長度和主存起
始地址的段表,存放在主存中;地址轉(zhuǎn)換一在段式管理中,主存地址
格式包括段號和段內(nèi)地址,虛存地址格式包括用戶號、段號和段內(nèi)地
址。②頁式管理。將主存空間和虛存空間按固定大小劃分成塊,每塊
稱為一頁。頁的大小和劃分與程序邏輯功能無關(guān)。③段頁式管理。將
虛擬存儲空間按段式管理,主存空間則按頁式管理。存在虛擬空間的
程序按邏輯關(guān)系分段,每一段又可分成固定大小的頁。主存則只分成
若干大小相同的頁。許多大型機都采取該管理方式;(2)頁面替換算
法。在虛擬存儲器中,由于虛擬空間比主存空間大得多,會出現(xiàn)當(dāng)主
存中所有頁已經(jīng)全部被占用,而CPU需要的指令卻在主存中找不到,
從而產(chǎn)生頁面失效Pagefaulto這是需要從輔存中調(diào)入新頁,并把
主存中已經(jīng)不用的舊頁替換出去。常用的替換算法有:①隨機算法
RANDo算法簡單,易于實現(xiàn);②先進(jìn)先出FIFO;③近期最少使用算
法LRU;④優(yōu)化替換算法OPT一預(yù)先知道將要使用哪些頁面,替換時
把下次調(diào)用該頁時的時間間隔最大的頁面調(diào)出去。這是一種理想算
法。
高速緩沖存儲器Cache(1)為彌補主存速度不足,在|處理機和
主存之間|設(shè)置一個高速小容量的Cache,構(gòu)成“Cache-主存”層次,
其在本質(zhì)上是一個兩級的“頁”式系統(tǒng);(2)“Cache-主存”和“主
存-輔存”的比較:前者目的是提高存儲系統(tǒng)速度,后者是擴大容量;
兩者工作原理相同,都需要地址變換,但失效時,后者采取頁面替換,
前者采用塊block替換;前者通過硬件實現(xiàn)地址變換和塊替換,后者
則是由操作系統(tǒng)來管理的;主輔層次的兩種存儲介質(zhì)有很大區(qū)別,不
易匹配,而前者則便于匹配;Cache對應(yīng)用程序員和系統(tǒng)程序員都是
透明的,而主輔層次則對系統(tǒng)程序員不完全透明。(3)在有Cache的
系統(tǒng)中,訪問主存請求的優(yōu)先級安排次序是Cache-通道-寫數(shù)-讀數(shù)-
取指令。(4)地址映象和變換。地址映象是指每個主存按什么規(guī)則裝
入Cache中。有全相聯(lián)映象、直接映象、組相聯(lián)映象。(5)Cache的
塊替換算法。有RAND、FIFO、LRU等;LRU替換算法的硬件實現(xiàn)有:
①堆棧法。從棧底到棧頂?shù)膸缀挝恢梅从沉烁鲏K近期最久未被訪問的
次序。②比較對法。讓各塊成對組合,用觸發(fā)器狀態(tài)表示每個比較對
內(nèi)的訪問次序,從而找出被替換的塊。綜上所述,設(shè)計替換算法實現(xiàn)
應(yīng)考慮到:如何對每次訪問進(jìn)行記錄和符合根據(jù)所記錄信息來判定哪
個塊是近期內(nèi)最久未被訪問的。(6)Cache的塊表示。在級相聯(lián)或直
接映象Cache中,地址的數(shù)據(jù)結(jié)構(gòu)由3個部分組成:標(biāo)志tag一給出
塊幀地址;索引index一組相聯(lián)中通過它選擇組號;塊內(nèi)位移block
offset一給出在一個塊內(nèi)所找數(shù)據(jù)的地址。(7)Cache的寫策略,即
更新主存內(nèi)容的算法。①寫直達(dá)法writethrough:只要CPU有寫操
作,在寫入Cache同時,也通過“Cache一主存”通路直接寫入主存;
②寫回法writeback。在CPU執(zhí)行寫操作時,信息只寫入Cache,僅
當(dāng)某塊被替換時,才把曾被寫入過的Cache塊先送回主存,然后再調(diào)
入新塊?!▽懼边_(dá)法的可靠性高,但增加了訪問主存的流量,寫回法
則相反,減少了不必要的訪存,但可靠性受影響,常需要在Cache中
增加更多的冗余信息位來提高其內(nèi)容可靠性。
題目:
1.衡量一個存儲層次體系性能主要從平均字節(jié)價格、命中率、存取
時間等三個方面考慮;
2.選擇存儲映象方式時最基本的考慮因素是易于實現(xiàn)。
3.在多級存儲層次中,根據(jù)時間局部性,層次Ml不必存入整個程序,
只需將近期用過的塊或頁存入;根據(jù)空間局部性,當(dāng)M2將所要訪
問的字送到Ml時,一并把該字所在塊或頁整個取來。
四、I/O通道和新型總線
、IO子系統(tǒng)概述(1)它包括IO設(shè)備、響應(yīng)控制器以及為IO操作
而設(shè)計的軟件。根據(jù)其操作的控制方式,10控制可以分為三類:程
序控制10、DMA和IO處理機方式。①程序控制10方式,是大多計
算機具有的簡單控制方式。在該方式下,10設(shè)備、主存和CPU通過
共享總線進(jìn)行通信,10設(shè)備可以和主存統(tǒng)一編址;優(yōu)點是控制簡單,
編程容易,缺點是大量時間被花于K)操作上,外設(shè)和CPU不能同時
工作;②DMA和中斷控制方式。DMA方式是直接存儲器訪問方式。它
要求外設(shè)和主存之間有直接數(shù)據(jù)通路。優(yōu)點是它把部分10控制交給
設(shè)備控制部分,實現(xiàn)CPU和10設(shè)備的部分并行。缺點是CPU仍需要
啟動每個信息塊的傳輸,增加了成本;中斷控制方式優(yōu)點是初步解決
了CPU、主存和外設(shè)之間的速度匹配問題。缺點是中斷所需輔助操作
很多;③通道控制方式是在DMA基礎(chǔ)上發(fā)展起來的。一個10過程CPU
只參與兩次工作。優(yōu)點是并行操作能力強,提高設(shè)備利用率;缺點是
不能完全獨立于主機;④1()處理機10P專門負(fù)責(zé)1()操作,具有更強
的處理功能,不必借助于CPUo優(yōu)點是CPU幾乎移交了對10的全部
控制,完全獨立于主機;缺點是提高系統(tǒng)成本。這方式廣泛應(yīng)用于
IBM360、370系統(tǒng)。
通道的工作原理(1)通道的功能:接受CPU發(fā)來的10指令,按
指令要求和指定的10設(shè)備進(jìn)行聯(lián)系;從主存取出屬于該通道程序的
通道指令,對指令進(jìn)行譯碼,向1()設(shè)備及控制器發(fā)出多種操作命令;
為主存和外設(shè)裝配和拆卸信息;從10設(shè)備獲得設(shè)備狀態(tài)信息形成并
保存通道信息,并根據(jù)需要將這些信息送往主存指定單元;將10設(shè)
備的中斷請求及通道本身的中斷請求發(fā)送給CPU;(2)通道種類:字
節(jié)多路通道bytemultiplexerchannel一適合于連接大量低速設(shè)備,
其工作模式有字節(jié)交叉模式和突發(fā)模式;數(shù)組多路通道block
multiplexerchannel適于為高速設(shè)備服務(wù);選擇通道selector
channel也是為多臺高速設(shè)備服務(wù)的,但在數(shù)據(jù)傳送期間,通道只能
為某一臺高速設(shè)備服務(wù),只能執(zhí)行一道通道程序。(3)通道字和通道
程序。①通道命令字CCW是通道能夠執(zhí)行的一組指令,又稱通道控制
字。由命令碼、數(shù)據(jù)地址、標(biāo)志碼、保留位、計數(shù)字段組成,共64
位;②通道地址字CAW指明要執(zhí)行的第一個通道命令字的地址,即通
道程序首地址,共32位,主要由存儲保護(hù)字段和地址字段組成;③
通道狀態(tài)字CSW用來記錄通道和外設(shè)執(zhí)行通道程序的狀態(tài),存放在內(nèi)
存儲器的固定單元中,共64位。④通道程序,由若干個通道命令可
組成一個通道程序。(4)通道的工作原理。1()操作過程可分為5個
階段:準(zhǔn)備、啟動、數(shù)據(jù)傳輸、結(jié)束傳輸、結(jié)束中斷。通道分擔(dān)了
CPU對輸入輸出操作的控制,基本上實現(xiàn)了CPU和外部設(shè)備之間的并
行執(zhí)行,減少了外設(shè)向CPU請求中斷的次數(shù),提高了CPU運行效率。
(5)通道流量設(shè)計。通道流量是指在數(shù)據(jù)傳送期間單位時間內(nèi)傳送
的字節(jié)數(shù)。
EISA和MCA(1)微機總線的演變:第一代PC總線:8位/16位
總線一內(nèi)部總線16位,外部總線8位;第二代PC總線:16位息線
—另一名稱是ISA,即工業(yè)標(biāo)準(zhǔn)體系結(jié)構(gòu)總線;第三代PC總線:32
位總線一可提供多達(dá)4GB的尋址空間,能自動配置系統(tǒng)及擴充插卡,
微機的32位總線主要有3大類,分別是Compaq等公司的EISA總線,
IBM公司的MCA總線,Apple公司的NuBus總線。(2)MCA微通道體
系結(jié)構(gòu)。MCA是MicroChannelArchitecture微通道體系結(jié)構(gòu)的縮
寫,其主要的特點可概括為:①是32位的高速微通道,可支持8、
16、32位的數(shù)據(jù)轉(zhuǎn)換與傳送,改善了數(shù)據(jù)完整性;②MCA是完異步的
總線結(jié)構(gòu),支持各總線主控器以及CPU公平地分享總線;③MCA采用
了可編程任選POS,能識別用戶安裝地MCA插卡類型,并自動地給他
分配系統(tǒng)資源;④可磁兼容性好,可靠性高;⑤支持多處理和并行處
理系統(tǒng),支持0等待狀態(tài),能提高處理效率。(3)EISA擴展工業(yè)標(biāo)
準(zhǔn)體系結(jié)構(gòu)。特點為:①它是32位地擴展工業(yè)標(biāo)準(zhǔn)總線,即ISA總
線擴充;②EISA基木上是一個同步總線,它和CPU協(xié)同工作;③仲
裁方案以輪流服務(wù)為基礎(chǔ);④采用了精致的雙排擴展插槽;⑤和MCA
都采用共享地中斷線路。
VESA和PCI局部總線(1)VESA是視頻電子標(biāo)準(zhǔn)協(xié)會開發(fā)地局部
總線標(biāo)準(zhǔn),又稱VL總線,基于該標(biāo)準(zhǔn)的4類產(chǎn)品是:VESA局部總線
主板、VESA硬盤卡、VESA顯示卡、多功能卡;(2)PCI局部總線,
PCI,PeripheralComponentInterface,是外部部件接口的縮寫。
PCI是32位的總線,在33MHz的時鐘頻率下所提供的最大數(shù)據(jù)傳輸
速率是132MbpsoPCI還采取32位數(shù)據(jù)總線和64位地址總線,把帶
寬透明的擴充到264MbpsoPCI局部總線能顯著提高網(wǎng)絡(luò)服務(wù)器的性
能。其優(yōu)點有:能大幅度提高數(shù)據(jù)吞吐率一測試表明,ISA總線的CPU
占有率46%,EISA總線CPU占有率12%,而PCI局部總線CPU占有
率不到6%;具有較低的訪問延遲。
五、流水技術(shù)和向量處理機
指令的流水處理(1)指令控制方式有三種:①順序方式。即各
機器指令之間順序串行的執(zhí)行;優(yōu)點是控制簡單,缺點是速度上不去,
機器的利用率低;②重疊方式。在前一條指令操作完成之前,開始解
釋下一條指令。優(yōu)點是速度提高,缺點是會出現(xiàn)沖突、轉(zhuǎn)移和相關(guān)等
問題;③流水方式。把并行性或并發(fā)性鑲嵌到計算機系統(tǒng)里的形式。
通常用時空圖描述流水線工作。(2)流水線的分級:按處理級別可分
為3級:①操作部件級一也叫運算操作流水線ArithmeticPipelines,
是將復(fù)雜算術(shù)、邏輯運算組成流水線工作方式;②指令級流水
InstructionPipelines,把指令解釋過程分成多個子過程;③處理
機級流水,是一種宏流水線Meer。Pipelines,其中每個處理機完成
某一專門任務(wù),各個處理機所得到的結(jié)果需要存放在與下一個處理機
所共享的存儲器中c(3)流水線性能分析。①吞吐率Throughputrate。
指在單位時間內(nèi)流水線所完成的任務(wù)數(shù)或輸出結(jié)果的數(shù)量;最大吞吐
率TPmax=l/max(dt),即最大吞吐率取決于流水線中最慢的一段的
時間;實際吞吐率TP=TPmax/(1+(m-1)/n),其中m為流水線段
數(shù),n為任務(wù)數(shù);②加速比Speedupratioo指m段流水線的速度和
等效的非流水線的速度之比。S=T0/T1=n*m*dt/[m*dt+(n-l)*dt]
=m/[1+(m-1)/n];③效率Efficiency。是流水線的設(shè)備利用率。E
=n個任務(wù)占用的時空區(qū)/m個段總的時空區(qū)。(4)流水的相關(guān)處理。
①局部性相關(guān)原理。流水線同時解釋的指令可能出現(xiàn)相關(guān)。解決的辦
法有兩種:一是推后法,即推后對相關(guān)單元的讀;二是通路法,即設(shè)
置相關(guān)專用通路而不必使用存儲單元的寫讀;②全局性相關(guān)原理。轉(zhuǎn)
移指令和它后面的指令之間存在關(guān)聯(lián),不能同時解釋,執(zhí)行時可能會
改動指令緩沖器中預(yù)取到的指令內(nèi)容,從而造成流水線吞吐率和效率
下降;解決辦法有3種:一是猜測轉(zhuǎn)移分支;二是加快和提前形成條
件碼;三是加快短循環(huán)程序的處理;③流水的中斷處理。中斷也會引
起流水線斷流。但出現(xiàn)概率比條件轉(zhuǎn)移的要低。其處理關(guān)鍵在于如何
處理好斷點和中斷后的恢復(fù)問題。(5)時鐘周期和流水線調(diào)度。①時
鐘周期直接決定流水線的最大吞吐率。其越???,流水線分段越多,
寄存器延遲時間救越長,降低了流水線的實際吞吐率。時鐘周期越小,
TPmax越高;②流水線為避免功能段的沖突,存在任務(wù)的調(diào)度問題。
通常采用預(yù)約表R(Reservationtable)的方法。
流水處理指令并行性的開發(fā)(1)超級標(biāo)量計算機,配置了多個
功能部件和指令譯碼器,和多個寄存器端口和總線,能同時執(zhí)行多個
操作。其流水線調(diào)度包括指令的發(fā)射策略和完成策略。指令發(fā)射
InstructionIssue是啟動指令進(jìn)入執(zhí)行段的過程,分為按序發(fā)射和
無序發(fā)射。指令發(fā)射策略是指指令發(fā)射時所使用的協(xié)議或規(guī)則。指令
的完成也有按序和無序之分。超標(biāo)量流水線的調(diào)度策略共有三種:按
序發(fā)射按序完成、按序發(fā)射無序完成、無序發(fā)射無序完成。(2)超長
指令字計算機VLIW。是由編譯程序在編諾時找出指令之間潛在的并
行性,進(jìn)行適當(dāng)調(diào)度安排,把多個能并行執(zhí)行的操作組合在一起,成
為一條具有多個操作段的超長指令,由它控制多個互相獨立的功能部
件,每個操作段控制一個功能部件,相當(dāng)于同時執(zhí)行多條指令。例如
Cycra5計算機,其每個操作段的典型格式為:一個操作碼、兩個源
寄存器描述碼、一個目的寄存器描述碼和一個判定寄存器描述碼。(3)
超級流水線計算機。結(jié)構(gòu)是把每個流水線分成若干個子流水線,而每
個子流水線取出的仍只有一條指令,這樣看來在一個周期內(nèi)便取出了
多條指令。例如MIPS公司宣布的64位RISC計算機一R4000機,每
個周期可流出2條指令。
向量流水處理機(1)向量處理方式:以計算D=A*(B+C)為例,
其中ABC均為有n個元素的向量。①橫向處理方式。按組成的元素順
序逐個進(jìn)行計算。即分別求行=Ai*(Bi+Ci);該方式在速度和效率
上都沒有提高;②縱向處理方式。先計算向量B+C=E,再計算向量
A*E=D.③分組/縱橫處理方式。前兩種方式的結(jié)合。即把原來向量分
成幾組,每組按縱向處理方式進(jìn)行。CRAY1超級計算機采取縱橫處理
方式;CRYER205則采取縱向處理方式。實際上,向量處理機的體系
結(jié)構(gòu)有兩種基本類型:一是寄存器一寄存器機;另一是存儲器一存儲
器向量機。(2)向量流水處理機。①CRAY1向量流水處理機。屬于寄
存器一寄存器類型,時鐘周期位12.5ns,存儲器周期為4個時鐘周
期,運算速度為160MFLOPS。只有120條指令,指令格式有兩種:16
位的單字段指令和32位雙字段指令。機器字長64位,包括3種數(shù)據(jù)
格式:24位帶符號整數(shù)、64位帶符號整數(shù)、64位浮點數(shù)。CRAY1采
取了大量的寄存器組。并具有4類12種功能流水線(見附);CRAY1
解決沖突的方法有鏈接技術(shù)和推遲執(zhí)行兩種。輸入輸出由24個通道
組成。CRAY1使得模擬成為重要的科學(xué)研究方法之一。②CRYER205。
機器的中心部件是標(biāo)量部件,包括指令處理部件和標(biāo)量執(zhí)行部件。其
存儲器基本模型是64位的1M存儲器,最大容量為4M*64b。時鐘周
期80nso提供8個32位的10通道,傳輸速率200MbpsoCRYER205
性能指標(biāo)比CRAY1高,單運行上并誤多大差別,因為存儲器一存儲器
向量機再體系結(jié)構(gòu)上不及寄存器一寄存器優(yōu)越。
附:
1.CRAY1的寄存器組包括向量寄存器、標(biāo)量寄存器、A寄存器、B寄
存器、T寄存器;
2.CRAY1有4類12種功能流水線:①地址功能流水:包括地址加、
地址乘2條流水線;②標(biāo)量功能流水:標(biāo)量加、標(biāo)量位移、標(biāo)量
邏輯、計數(shù)4條流水線;③向量功能流水:向量
加、向量位移、向量邏輯3條;④浮點
功能流水:浮點加、浮點乘、求倒數(shù)近似3條。
六、并行處理技術(shù)和多處理機
并行性主要是指同時性或并發(fā)性。在進(jìn)行并行處理時,其每次處
理的規(guī)模大小可能是不同的,這可用并行性顆粒度來表示:G=所有
處理器進(jìn)行計算的時間總和/所有處理器通信時間總和。并行性從執(zhí)
行程序的角度看,并行性等級可分為5個:作.業(yè)級、任務(wù)級、例行程
序/子程序級、循環(huán)和迭代級、語句和指令級;從處理數(shù)據(jù)的角度看,
可分為4級:字串位串、字串位并、字并位串、字并位并/全并行。
并行處理技術(shù)(1)層次越高的并行處理顆粒就越細(xì),粗粒度并
行性開發(fā)主要采用MIMD方式;|開發(fā)計算機系統(tǒng)并行性,一般采用
資源重復(fù)、時間重疊和資源共享三種方法|c資源重復(fù)是通過使用多功
能部件,引入空間重復(fù)因素;時間重疊是在并行性概念中引入時間因
素,讓多個處理過程重疊地使用同一套部件各個部分;資源共享主要
是采用軟件手段讓多個用戶按時間片輪流使用同一套硬件資源。(2)
并行處理機地結(jié)構(gòu)和特點。以SIMD方式工作,采用資源共享重復(fù)的
并行性措施的陣列處理機:①基本結(jié)構(gòu):由一個控制器CU、n個處理
單元PE、m個存儲模塊M和一個互連網(wǎng)絡(luò)部件IN組成。根據(jù)存儲器
模塊是以分布方式還是集中方式存取,可以分為兩種基本結(jié)構(gòu):分布
式存儲器的陣列機和共享存儲器的陣列機:②主要特點:采用資源重
復(fù)方法引入空間因素;以某一類算法位背景的專用計算機;其研究必
須和并行算法研究密切結(jié)合,使之具有更強適應(yīng)性;從處理單元看,
可以將其看成一個同構(gòu)型并行機。
SIMD的互連網(wǎng)絡(luò)(1)基本互連函數(shù):①恒等置換。相同編號的
輸入輸出端對應(yīng)。表達(dá)式:/區(qū)_]蒼35|工0)二n"”-2「//0;②交換置
換。第0位位值不同的輸入端和輸出端之間的連接。
七(元,1凡,2.4工0)=匕/2...M1。;③方體置換。第k位位值不同的輸入端和
輸出端之間的連接cC(X"”.2…々…中0)=…%%;④均勻洗牌置
換。輸入端分成數(shù)目相等的兩半,再隔一個順序和輸出端相連。
。區(qū)…XXoZ-l,可見洗牌是將輸入端二進(jìn)制地址循環(huán)左移
一位得到對應(yīng)的輸出端二進(jìn)制地址;⑤蝶式置換。
%)=x()x〃2Tx即將輸入二進(jìn)制地址的最高位和最低位互
換位置取可求得響應(yīng)輸出的地址。⑥位序顛倒置換。
〃一2…%2%一1。(2)互連網(wǎng)絡(luò)的特性:網(wǎng)絡(luò)規(guī)模一網(wǎng)絡(luò)中
結(jié)點個數(shù);結(jié)點度一和結(jié)點相連接的邊數(shù);距離一量結(jié)點之間相連的
最少邊數(shù);網(wǎng)絡(luò)直徑一網(wǎng)絡(luò)中結(jié)點之間最大距離;等分寬度一當(dāng)網(wǎng)絡(luò)
被分成兩半時,沿切口的最小邊數(shù);結(jié)點之間的線長一兩個結(jié)點間的
線的長度;對稱性一若從任何結(jié)點看拓?fù)浣Y(jié)構(gòu)都一眼則稱為對稱網(wǎng)
絡(luò)。(3)網(wǎng)絡(luò)性能參數(shù):頻寬bandwidth—傳輸信息的最大速率,單
位為兆位/秒;傳輸時間transmissiontime一等于消息長度除以頻
寬;“飛行”時間timeoffly一包括時延;傳輸時延transportlatency
一等于飛行時間+傳輸時間。發(fā)送方開銷senderoverhead—處理器
把消息放到互聯(lián)網(wǎng)的時間;接收方開銷receiveroverhead-處理器
把到達(dá)的消息從互聯(lián)網(wǎng)上取出的時間;〃總時延=發(fā)送方開銷+飛行
時間+消息長度/頻寬+接受方開銷。(4)常用的單級互連網(wǎng)絡(luò):①交
換互連網(wǎng)絡(luò)。鳳X)?=(如…瓦..4);②PM2I互連網(wǎng)絡(luò):
r
PM2+,=(j+2)mod^;=(八2,)modN,OWiWnT,OWjWN-l;其
中N是結(jié)點數(shù),n=log2N;③混洗交換互連網(wǎng)絡(luò)。由全混洗和交換兩
種互連函數(shù)詞成。④蝶式互連網(wǎng)絡(luò)Butterfly(x"g"A)尸".2…X"⑸
關(guān)于多級連接。多級連接特性決定因素主要有交換開關(guān)、拓?fù)浣Y(jié)構(gòu)、
控制方式3種。常用的多級互連網(wǎng)絡(luò)有多級立方網(wǎng)絡(luò)、多級混洗交換
網(wǎng)絡(luò)、多級PM2I互連網(wǎng)絡(luò)。
多處理機(1)多處理機具有兩臺以上的處理機。在操作系統(tǒng)控
制下通過共享主存或輸入輸出子系統(tǒng)或高速通信網(wǎng)絡(luò)進(jìn)行通信。屬于
MIMD系統(tǒng)。特點有:結(jié)構(gòu)靈活性、程序并行性、并行任務(wù)派生、進(jìn)
程同步、資源分配和調(diào)度。(2)多處理機系統(tǒng)中,機間互連主要采用
以下幾種方式:總線方式、縱橫交叉開關(guān)互
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《平衡記分卡的應(yīng)用》課件
- 《企業(yè)人力績效管理》課件
- 2024-2025學(xué)年天津市紅橋區(qū)高一上學(xué)期期中考試歷史試卷(解析版)
- 單位管理制度分享匯編人事管理
- 單位管理制度分享大全人力資源管理十篇
- 單位管理制度范例選集人力資源管理篇
- 《磺達(dá)肝癸鈉》課件
- 單位管理制度呈現(xiàn)大合集人力資源管理十篇
- 《市場營銷學(xué)案例分》課件
- 《投資經(jīng)濟(jì)學(xué)》教學(xué)大綱
- 數(shù)學(xué)-湖南省天一大聯(lián)考暨郴州市2025屆高考高三第二次教學(xué)質(zhì)量檢測(郴州二檢懷化統(tǒng)考)試題和答案
- 2024-2025學(xué)年人教版生物學(xué)八年級上冊期末復(fù)習(xí)測試題(含答案)
- 施工現(xiàn)場環(huán)保要求措施
- 重癥患者的營養(yǎng)支持
- 瓷磚店銷售薪酬方案
- 小學(xué)體育課件教學(xué)
- 2024年事業(yè)單位招聘考試計算機基礎(chǔ)知識復(fù)習(xí)題庫及答案(共600題)
- 西京學(xué)院《機械制造技術(shù)基礎(chǔ)》2022-2023學(xué)年第一學(xué)期期末試卷
- 2024新版《藥品管理法》培訓(xùn)課件
- 【初中語文】2024-2025學(xué)年新統(tǒng)編版語文七年級上冊期中專題12:議論文閱讀
- 信息科技大單元教學(xué)設(shè)計之七年級第一單元探尋互聯(lián)網(wǎng)新世界
評論
0/150
提交評論