版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
總復習
第1章計算機系統(tǒng)結構的基本概念
1.1計算機系統(tǒng)的多級層次結構
L2計算機系統(tǒng)結構、組成與實現(xiàn)
1.3軟件取舍與計算機系統(tǒng)的設計思路
1.4軟件、應用、器件對系統(tǒng)結構的影響
1.5系統(tǒng)結構中的并行性及系統(tǒng)的分類
L1多級層次結構
*1.六級層次結構
應用語言機器------面向用戶
高級語言機器-----面向用戶
匯編語言機器-----^面向用戶
操作系統(tǒng)機器------面向上層機器
小傳統(tǒng)機器---------^面向上層機器
微指令機器-------^面向上層機器
2.層次結構的實現(xiàn)方式
根據(jù)性價比,軟硬件邏輯是等同的
3.分層優(yōu)點
L2計算機系統(tǒng)結構、組成與實現(xiàn)
*1.結構、組成與實現(xiàn)的概念
2.結構、組成與實現(xiàn)之間的關系
1)具有相同系統(tǒng)結構(如指令系統(tǒng)相同)的計
算機可以因速度等因素的要求不同而采用
不同的組成。
2)相同的計算機組成可以采用多種不同實現(xiàn)
方法。
3)不同的系統(tǒng)結構會使組成技術產(chǎn)生差異
4)計算機組成也會影響系統(tǒng)結構,組成的設
計,其上取決于系統(tǒng)結構,其下又受限于
所可以用的實現(xiàn)技術。
1.4軟件、應用、器件對系統(tǒng)結構的影響
1.軟件的可移植性
1)概念:指軟件可以不加修改或經(jīng)少量修改,就可
以由一臺機器搬到另一臺機器去運行,使得同一
套軟件可以應用于不同的硬件環(huán)境。
2)優(yōu)點:可以大量節(jié)省重復工作量,是軟件設計者
可以集中精力更好的改進或開發(fā)全新的軟件。
2.實現(xiàn)可移植性的技術
1)統(tǒng)一高級語言
2)系列機思想
3)模擬與仿真
三、統(tǒng)設計的定量原理
1.大概率事件優(yōu)先原理jw/HT3
對于大概率事件(最常見的事件),賦予它優(yōu)先的
處理權和資源使用權,以獲得全局的最優(yōu)結果。
一一最重要、最廣泛采用的設計準則,能明顯
提高整個系統(tǒng)性能。
考出好成績!
2.阿姆達爾(Amdahl)定律
;1系統(tǒng)中第一部件中于采用某種更快的執(zhí)行方
式后,整個系統(tǒng)性能的提高與這種方式的使用頻
:率多占號執(zhí)彳彳時日的?例隼7d,.賤
假設對機器進行某種改進,定義加速比為改進前后
性能或時間的比值:
cTo1
Sp=——=------------------
Tn(1-Fe)+Fe/Se
乏無度計算機執(zhí)行某個任務的總時間中可被改進部分的時間所
比,總小于1。
進部卬策用改足措施后比沒有采用改進措施前性能提
高的倍數(shù),總大于1。
考出好康績,:::!:!:!
3.計算CPU時鐘周期總數(shù)Nc:〃
Nc=£(CPIi*li)
li表示i指令在程序中執(zhí)行的次數(shù),Jli表示i指令所需
;的平多時”周期;數(shù),,為指和種聿f-1?;
可得表示--用于設計方案評價:
CPIn
工〃
CPI二上-------------------------二(CPU*—)
lcj=iIc
示i指令在程序中所占的比例II
考出好康績,;;【;;…
5.計算機系統(tǒng)的分類
1)弗林分類法
根據(jù)指令流和數(shù)據(jù)流的多倍性(是指在系統(tǒng)性能瓶
頸部件上處于同一執(zhí)行階段的指令或數(shù)據(jù)的最大可
能個數(shù))狀況對計算機進行分類。
a)單指令流單數(shù)據(jù)流SISD
b)單指令流多數(shù)據(jù)流SIMD
c)多指令流單數(shù)據(jù)流MISD
d)多指令流多數(shù)據(jù)流MDMD
第2章數(shù)據(jù)表示與指令系統(tǒng)
2」數(shù)據(jù)表示
2.2尋址方式
2.3指令系統(tǒng)的設計與改進
2.1數(shù)據(jù)表示
1.數(shù)據(jù)表示與數(shù)據(jù)結構
1)基本概念
a)數(shù)據(jù)表示:能由機器硬件直接識別和的引用的數(shù)
據(jù)類型。
b)數(shù)據(jù)結構:各種數(shù)據(jù)元素或信息單元之間的結構
關系。
2)兩者關系
a)數(shù)據(jù)結構是通過軟件映像將信息變換成數(shù)據(jù)表示
來實現(xiàn)的,表示是結構的元素。
b)不同的表示為結構的實現(xiàn)提供不同的支持
c)結構和表示是軟、硬件的交接面
2.高級數(shù)據(jù)表示
1)自定義數(shù)據(jù)表示
目的:進一步減少標志符所占空間,對于向
量、數(shù)組、記錄等數(shù)據(jù),每個元素具有相
同屬性,為此提出了數(shù)據(jù)描述符。
2.3指令系統(tǒng)的設計和改進
1.指令格式的優(yōu)化
1)基本概念
a)指令格式的優(yōu)化:用最短的位數(shù)來表示指令的操
作信息和地址信息,使程序中指令的平均字長最
短。
b)哈夫曼壓縮思想:當各種事件發(fā)生概率不等時,
概率最高事件用最短位數(shù)表示,概率低事件用長
位數(shù)表示,就會使平均位數(shù)縮短??捎糜诖a、
程序、存貯空間、時間等的壓縮。
*2)操作碼的優(yōu)化表示
a)目的:縮短指令字長度,減少程序總位數(shù),增加
指令字所能表示的操作信息和地址信息。
b)信息源炳H:
H=-Lpilog2pi
其中,R是指令的使用頻度。
c)定長操作碼的信息冗余量:
(實際平均長度一H)/實際平均長度
*d)哈夫曼編碼
?將指令的使用頻度由小到大排序
?每次選最小兩個頻度結合一個新節(jié)點
?再按頻度大小插入余下未結合的頻度值中
?如此重復直至全部結合完畢成根節(jié)點
?沿兩個分支,分別用“0”或“1”來表示
這樣,從根節(jié)點開始,沿線到達個頻度指令的
代碼序列就是該指令的哈夫曼編碼。
e)擴展操作碼編碼
結合哈夫曼編碼與定長二進制編碼思想,只用有
限幾種碼長,仍是概率大的事件用長碼,小的用短
碼。以此來縮短碼長,降低冗余量,便于譯碼。
f)常用擴展方法
?等長擴展法
?15/15/15編碼法
適用于Pi在前15種指令中比較大,而在30種指令
后急劇減小的情況。
?8/64/512編碼法
適用于曲在前8種指令中比較大,且之后的64種
指令的小也不是過小時。
?衡量標準:碼長XpJi最短
各種不同地址數(shù)指令的特點及適用場合
三地址短最大一般向量,矩陣運算為
主
二地址一般很大很低一般不宜采用
一地址較長較大較快連續(xù)運算,硬件結
構簡單
零地址最小最低嵌套,遞歸,變量
較多
二地址R一般最小最快多累加器,數(shù)據(jù)傳
型送較多
?思路:
思路一:按統(tǒng)計出的指令和指令串的使用頻度來
分析改進
靜態(tài)使用頻度:對程序中出現(xiàn)的指令及指令串
進行統(tǒng)計得到的百分比。目的是減少目標程序所
占用的存貯空間。
動態(tài)使用頻度:在目標程序執(zhí)行中對指令和指
令串統(tǒng)計的百分比。目的是減少目標程序的執(zhí)行
時間。
思路二:增設強功能的復合指令,取代原先由宏
指令或子程序實現(xiàn)的功能,可以提高運算速度,
減少程序調用的額外開銷,也減少子程序所占用
的空間。
3)CISC的結構和思路存在的問題
a)指令系統(tǒng)龐大,設計麻煩,周期長,成本高,
可靠性低,查錯和糾錯代價大。
b)指令操作煩雜,執(zhí)行速度很低。
c)難以優(yōu)化編譯生成真正高效的機器語言。
d)各種指令使用頻度不高,且差別大,有些指
令利用率很低,降低系統(tǒng)性價比。
3.按RISC方向發(fā)展與改進指令系統(tǒng)
1)RISC的改進思路
通過減少指令總數(shù)和簡化指令功能來降低硬件設
計的復雜度,提高指令執(zhí)行速度。按這種途徑和方
向發(fā)展,使機器指令精練簡單,因此稱為精簡指令
系統(tǒng)計算機(ReducedInstructionSetComputer-----
RISC)o
2)RISC的設計原則
a)只選擇使用頻度高的指令,增加少量有效支
持OS和高級語言實現(xiàn)的有用指令,減少條數(shù)。
b)減少系統(tǒng)可用的尋址方式,簡化指令的格式,
限于兩種內(nèi),讓全部指令等長。
c)讓所有指令都在一個機器周期內(nèi)完成。
d)增加通用寄存器以減少訪存操作,所有指令
只有存、取可以訪存,其它都在寄存器間進行。
e)指令多數(shù)用硬聯(lián)控制,少數(shù)用微程序控制。
。以簡單有效的方式支持高級語言的實現(xiàn)。
*3)RISC結構采用的基本技術
a)遵循按RISC機器一般原則設計的技術。
b)在邏輯上采用硬聯(lián)實現(xiàn)和微程序固件實現(xiàn)相結
合的技術。
c)在CPU中設置數(shù)量較大的寄存器組,并采用重疊
寄存器窗口的技術。
d)指令的執(zhí)行采用流水和延遲轉移技術。
e)采用認真設計和優(yōu)化編譯系統(tǒng)設計的技術。
第3章總線、中斷與I/O系統(tǒng)
3.1輸入輸出系統(tǒng)概述
3.2總線設計
3.3中斷系統(tǒng)
3?4通道處理機
3.5外圍處理機
3.1I/O系統(tǒng)概述
LI/O系統(tǒng)的功能
1)功能:對指定的外設進行輸入、輸出操作,同時
完成其它的管理和控制。
2)包括:
a)對指定外設的信息編址,連接好主存與指定外
設的信息通路。
b)完成指定外設編址區(qū)和OS指定的主存空間之間
的信息傳送。
c)對傳送信息的格式變換,產(chǎn)生有關I/O操作是否
完成或出錯的信息,經(jīng)中斷系統(tǒng)交給OS分析處理
2.1/0系統(tǒng)的三種方式
1)程序控制I/O
a)全軟的
b)程序查詢狀態(tài)驅動的一鍵盤
c)中斷驅動的一中斷控制器8259A
2)直接存貯器訪問(DMA)
3)1/0處理機
a)通道方式(Channel)
有自己的指令和程序,功能簡單,使用面窄。
b)外圍處理機方式(PPU)
獨立性、通用性和功能較強。
3.2總線設計
I/O系統(tǒng)總線既要能傳送數(shù)據(jù)信息、地址信息、控
制信息,還要傳送狀態(tài)信息,并使多臺外設與CPU
或主存交叉地經(jīng)這些總線傳送信息。所以其設計的
好壞,對I/O系統(tǒng)的性能影響較大。
1.總線的類型
1)按信息傳送方向分
a)單向傳輸
b)雙向傳輸
?半雙向
?全雙向
2)按用法分
a)專用總線
定義:只連接一對物理部件的總線
優(yōu)點:
?多個部件可以同時發(fā)送和接受信息,幾乎不必
爭用總線,系統(tǒng)流量高。
?控制簡單,不用指明信息源和目的。
?任何總線的失效只影響相連的兩個部件不能直
接通信,但可以間接通信,系統(tǒng)可靠性高。
缺點:
?總線數(shù)目多,N個部件全部互連需N(N-l)/2組總線
?難以小型化、集成電路化,總線長時成本高。
?利用率低
?不利于模塊化,增加一個部件要增加許多新的接
口和連線。
b)非專用總線
定義:可以被多種功能或多個部件分時共享,同
一時刻只有一對部件使用總線進行通信。
優(yōu)點:
?總線少,造價低。
?接口標準化、模塊性強,易于簡化接口設計
?擴充能力強,多重總線提高帶寬和可靠性
缺點:
?經(jīng)常出現(xiàn)總線爭用,系統(tǒng)流量小。
?可能成為系統(tǒng)速度瓶頸,導致系統(tǒng)癱瘓
3.3中斷系統(tǒng)
1.中斷的分類和分級
1)基本概念
a)中斷源:引起中斷的各種事件。
b)中斷請求:中斷源向中斷系統(tǒng)發(fā)出請求中斷的申
請。同時可以有多個中斷請求,這時中斷系統(tǒng)要
根據(jù)中斷響應優(yōu)先次序對優(yōu)先級高的中斷請求予
以相應。
c)中斷響應:就是允許其中斷CPU現(xiàn)行程序的運行
而轉去對該請求進行預處理,包括保存斷點現(xiàn)場,
調出相應中斷處理程序,準備運行。也可以屏蔽
這一請求使其暫時得不到響應。
*2)中斷分類
a)中斷(Interrupt)
專指與當前進程運行無關的請求暫停的事件,如
機器故障中斷請求、外設中斷請求、定時中斷請求
等。中斷可以被屏蔽,暫時保存在中斷寄存器,屏
蔽解除后繼續(xù)得到響應和處理。
b)異常(Exception)
由現(xiàn)行指令引起的暫停事件,如頁面失效、溢出
等,一般不能屏蔽,立即得到響應和處理。
*4)中斷響應次序與處理次序
a)中斷響應次序
同時發(fā)生多個中斷請求時,由中斷響應硬件的排
隊器所決定的響應次序,次序是固定的。
b)中斷處理次序
一個中斷處理程序執(zhí)行前或中再有其它中斷產(chǎn)生
時中斷處理完的次序,可以不同于響應次序。
c)處理原則
在處理某級中斷時,只有更高級的請求到來才轉
去響應和處理,完成后返回原中斷繼續(xù)處理。
*5)中斷處理次序改變
a)方法:
?設置中斷級屏蔽位寄存器硬件以決定是否讓某級
中斷請求進入中斷響應排隊器,只要進入排隊器
中斷請求,就讓級別高的優(yōu)先得到響應。
?OS對每類中斷處理程序的現(xiàn)行PSW中的中斷級
屏蔽位進行設置,可以實現(xiàn)希望的處理次序。
b)優(yōu)點:
改變響應次序中用排隊器硬件實現(xiàn)的固定次序
為OS軟件實現(xiàn)的靈活性。
2.中斷系統(tǒng)的軟硬件功能分配
1)中斷系統(tǒng)的功能
a)中斷請求的保存和清除
b)優(yōu)先級的確定
c)中斷斷點及現(xiàn)場的保存
d)對中斷請求的分析和處理
e)中斷返回
3)類型:
a)字節(jié)多路通道
適用于連接大量字符低速設備,傳送一個字
符或字
第4章存貯體系
4.1存貯體系的形成與性能
4.2虛擬存貯
4.3高速緩沖存貯器Cache
4.4主存保護
4.1存貯體系的形成與性能
L存貯器的性能要求
1)大容量
SM=W-1-m
W:存貯體的字長,單位為bit或Byte。
1:每個存貯體的字數(shù)。
m:并行工作的存貯體的個數(shù)。
2)低價格
可以用總價格C或每位價格c來表示。具有SM位
的存貯器每位價格C=C/SM。其中包括了存貯器本身
4.存貯體系的性能參數(shù)
1)存貯體系的每位平均價格c
2)命中率H=RJ(RI+R2)
3)等效訪問時間
TA=HTA1+(1-H)TA2
4.2虛擬存貯器
影響主存命中率和CPU效率的某些因素
a)與Sp有關
PKO圖4.30頁面大小Sp、容量Si與命中率H的關
系曲線圖
b)命中率與主存容量曲有關
「⑸圖4.31命中率H與容量加的關系圖
c)與所采用的頁面調度策略有關
4.3高速緩沖存貯器(Cache)
1.基本結構
特點:9個方面(與虛擬存貯器對比)
2.地址的映像與變換
1)全相聯(lián)映像和變換
a)規(guī)則:主存中的任意一塊均可映像裝入到Cache
內(nèi)的任意一塊的位置。
b)地址變換過程
c)優(yōu)缺點
塊沖突率低;代價大,查表速度難以提高。
*2)直接映像及其變換
規(guī)則:主存中每一塊只能映像到Cache中唯一一個
特定位置:主存的第i塊只能映像到第imod211cb塊位
置上。相當于把主存空間按Cache空間分區(qū),每區(qū)
內(nèi)各塊只能按位置對應到Cache相應位置上。
*3)組相聯(lián)映象及其變換
規(guī)則:把主存按Cache大小分區(qū),整個Cache是一
區(qū),每個區(qū)再分成相等的組,組內(nèi)分塊。組間直接
映象,組內(nèi)各塊全相聯(lián)映象。
4)段相聯(lián)映象
規(guī)則:把主存和Cache分成具有相同的Z塊的若干
段,段與段之間采用全相聯(lián)映象,而段內(nèi)各塊之間
采用直接映象,實質上就是組相聯(lián)映象的特例。
*3.替換算法的實現(xiàn)
1)堆棧法
思想:棧頂恒存放近期最久訪問過的頁的頁號,
而棧底恒存放近期最久沒有訪問過的頁的頁號,即
準備被替換掉的頁的頁號。按此思想組成一個硬件
堆棧。
2)比較對法
思路:讓各個塊成對組合,用一個觸發(fā)器的狀態(tài)
來表示該比較對內(nèi)兩塊訪問的遠近次序,再經(jīng)門電
路就可以找到LRU塊。
4.Cache的透明性及性能分析
*l)Cache的透明性分析
a)寫回法
在CPU執(zhí)行寫操作時,只是把信息寫入Cache,
僅當需要被替換時,才將已經(jīng)被寫入過的Cache塊
先送回主存,然后再調入新塊。
第5*濾水方向量處理機
5.1重疊解釋方式
5?2流水方式
5.3向量的流水處理與向量流水處理機
5.1重疊解釋方式
5.1.1基本思想和一次重疊
取指令分析執(zhí)行
圖5.1對一條機器指令的解釋
一、順序執(zhí)行方式
特點:指令之間串行/其指令內(nèi)微操作也串行
P179圖5.2(a)
優(yōu)占:簡單、易于實現(xiàn)
缺言:速度難以提高,各部件利用率低;
二;重疊執(zhí)行方式;;;;;
(1)一次重疊執(zhí)行方式。一種最簡單的流水線方式。
(2)二次重疊執(zhí)行方式。
5.2流水方式
5.2.1基本概念及特點
在流水技術中有如下一些特點:
(1)一條流水線由多個流水段組成(多段)
(2)每個流水段有專門的功能部件對指令進行某種加工(專
件)
(3)各流水段所需時間是一樣的(同時)
(4)流水線工作階段可分為建立、滿載和排空三個階段(在
階段)
(5)在理想情況下,當流水線充滿后,每隔At時間將會有
一個結果流出流水線。
流水線的表示方法
?流水線的連接圖表示方法
表示流水線的邏輯關系
-流水線的時空圖表示方法
表示流水線的時間關系
2.流水線的分類
1、線性流水線與非線性流水線
流水線的各個流水段之間是否有反饋信號。
?線性流水線(LinearPipelining):
每一個流水段都流過一次,而且僅流過一次。
?非線性流水線(NonlinearPipelining):
在流水線的某些流水段之間有反饋回路或前饋回路。
2、按照流水線的級別來分
3、單功能流水線與多功能流水線
4、靜態(tài)流水線與動態(tài)流水線
5.2.2流水線處理機的主要性能
吞吐率TP(ThroughputRate)
效率E(Efficiency)
加速比Sp(SpeedupRatio)
1.吞吐率
吞吐率是流水線單位時間里能流出的任務數(shù)或結果數(shù)。
(1)最大吞吐率
TP:-------------!-------------
max
max{ZV],AZ29A/35A/49}
(2)實際吞吐率:
任務不連續(xù),建立和排空時間
(3)實際吞吐率計算方法
2,效率
設備的時間利用率,真正用于工作
分母——m段和總時間T所圍成的面積
分子——時空圖中實際占用的總面積
效率即n個任務所占用的時空區(qū)與m個段所占用的
總的時空區(qū)的面積之比
相關:在流水線中更復雜、更嚴重,
影響更大
全局性相關:遇到轉移指令
;;;;-條件轉移;
局部性相關:指令相關、主存和通用寄
存器組操作數(shù)相關及基/變址值相關
考出好成績!
1、局部性相關的處理
;指令、主存數(shù)、寄存器相關稱為
局鄙性相關;;;;
——不影響指緩中的內(nèi)容,
解決:1)推后讀
2)相關專用通路
考出好成績!
2.全局性相關的處理
控制轉移沖突:這是很經(jīng)常發(fā)生的沖突,主要是由轉移指令
引起的,當轉移發(fā)生時,將使流水線的流動受到破壞
卜)舄測法;;???????
|'(2)力;快或L前菰成衣件碼;;;;;;
必要性:盡早產(chǎn)生條件碼對減少流水線吞吐率和效率的損
失非常有效。
可能性:對于大多數(shù)情況,可以在運算實際開始之前或者
在運算中間產(chǎn)生條件碼。
(3)加快短循環(huán)程序的處理:???
(4)延遲轉移
3.流水機器的中斷處理
特點、不經(jīng)常發(fā)生???????
2)不可預測
3)一旦進入中斷,可能持續(xù)很長時間。:;?
流水線中斷要求:????????
對流水線,斷點現(xiàn)場的保護與恢復;;;;;
斷點要求,第i條指令的斷點現(xiàn)場IIIII
流水線同時處理多條指令,斷點現(xiàn)場可能不是中斷時的現(xiàn)場
4.流水線調度
”性流水”;;;;;;;
1無反饋,只需每隔At輸入一個任務即可t
非線性流水線;;;;;;;;
由于段間有前饋和反饋通路任務,執(zhí)行過程中
可能會多次通過同一流水段,發(fā)生幾個任務同時
爭用同一流水段的現(xiàn)象,這就是功能段的使用沖
突。?????????
解決方法:間隔恰當?shù)呐臄?shù)后再向流水線送入下
一個任務才既不發(fā)生功能段使用沖突,又能使流
水線有較高的吞吐率。這就需要對流水線作適當
的調度。
達到最佳調度方法:
;平均間隔最小分最大吞吐率
;等間隔;:少簡化控制
二維預約表方法(重點)
5.3向量的流水處理與向量流水處理機
;;;向量機CA設計要求
1.較好的維持向量/標量性能平衡
2.可擴展性
3.存儲系統(tǒng)容量和性能;::
4.高性能的I/O和易訪問的網(wǎng)絡
考出好成績!
向量鏈接技術
結果寄存器可能成為后繼指令的操作數(shù)寄存
器,兩條有數(shù)據(jù)相關的向量指令并行執(zhí)行,這種技
術稱為兩條流水線的鏈接技術。
例如:有如下3條向量指令。
V3-A
V2―V0+V1
V4<-V2*V3
ex
三種執(zhí)行方式比較:
如果向量長度為N,三條指令采用串行方法執(zhí)行的時間為:
[(1+6+1)+N?1]+[(1+6+1)+N?1]+[(1+7+1)+N?1]=3N+22拍
如果前兩條指令并行執(zhí)行,第三條指令串行執(zhí)行,則執(zhí)行時
間為:
[(1+6+1)+N-1]+[(1+7+1)+N-1]=2N+15拍
如果采用鏈接技術,則執(zhí)行時間為:
(1+6+1)+(1+7+1)+(N/)=17+N?1=N+16拍
〃啟動訪存、[訪存]〃存/3、,送浮乘部件
1>+6<>+1<U1<>
送浮加部件浮加存『2送浮乘部件
I>
+7{浮剩+1{存?。?17拍
實現(xiàn)鏈接的條件:
(1)沒有向量寄存器沖突和功能部件沖突,
(2)只有第一個結果送入向量寄存器的那一個周期可以鏈接。
(3)如果一條向量指令的兩個源操作數(shù)分別是兩條先行指令的
執(zhí)行結果,則要求先行的兩條指令產(chǎn)生運算結果的時間必須相
同。
(4)兩條向量指令的向量長度必須相等。
第6章陣列處理機
6.1陣列處理機的原理.............................
6.2SIMD計算機的互連網(wǎng)絡?11111
6.3共享主存構形陣列處理機中并行存儲器的無沖突訪問
6.4脈動陣列處理機
2.陣列處理機的算法舉例
1)有限差分問題
2)矩陣加;
3)矩陣乘;
4)累加和
2,并行處理機的特點
速度高,而且潛力大。
模塊性好,生產(chǎn)和維護方便。
可靠性高,容易實現(xiàn)容錯和重構。
效率低(與流水線處理機、向量處理機等比較)。
通常作為專用計算機,因此,在很大程度上依賴于
并行算法。它依靠的是資源重復,而不是時間重疊,
它的每個處理單元要擔負多種處理功能,其效率要
低一些。另一方面,它依靠增加PE個數(shù),與流水線
處理機主要依靠縮短時鐘周期相比,其提高速度的
潛力要大得多。
特別依賴于互連網(wǎng)絡?;ミB網(wǎng)絡決定了PE之間的連接模式,
也決定了并行處理機能夠適應的算法。
需要有一臺高性能的標量處理機。如果一臺機器的向量處理
速度極高,但標量處理速度只是每秒一百萬次,那么對于標
量運算占10%的題目來說,總的有效速度就不過是每秒一千
萬次。
6.1.3SIMD計算機的互連網(wǎng)絡
定義:由開關元件按一定拓撲結構和控制方
式構成的網(wǎng)絡以實現(xiàn)計算機系統(tǒng)內(nèi)部多個處
理機或多個功能部件間的相互連接。
2.基本的單級互連網(wǎng)絡
1)立方體單級網(wǎng)絡
口%(以]=月一…巨…6丸
2)PM2I單級網(wǎng)絡
z
JpM2+/=7+2mod^
bw2-=J-2"modN
這種互連網(wǎng)絡由全混洗和交
3)混洗交換單級網(wǎng)絡換兩種互連函數(shù)組成:
Shuffle{Pn_xPn_2…耳匕)=心2…卓調t
1.多級立方體網(wǎng)絡
級控制信號(KzKiKQ
000001010011100101110111
001234567
X110325476
A
223016745
332107654
騎
445670123
啟554761032
667452301
776543210
4組
2元
4組2組4組
執(zhí)+
2元4元2元
行4組2組2組1組
恒等+++
的2元4元4兀8兀
2組1組11組
交十
4元8元8元
換1組
函8元
數(shù)Cube。
功Cube0Cube。Cube1+
能、
iCube0Cube1十Cube2++Cube
Cube1Cube2Cube2十
Cub,
多級PM2I網(wǎng)絡
入出
端端
級10
6.2.5全排列網(wǎng)絡
;如果互連網(wǎng)絡是從N個入端到N個出端的一到一的映射.
就可以把它看成是對此N個端的重新排列。因此,互連網(wǎng)絡的
功能實際上就是用新排列來置換N個入端原有的排列。前面所
介紹的各種基本多級網(wǎng)絡都能實現(xiàn)任意一個入端與任意一個出
端間的連接,但是要同時實現(xiàn)兩對或多對入端與出端之間的
連接時,都有可能因爭用數(shù)據(jù)傳送路徑而發(fā)生沖突。我們稱
具有這類性質的互連網(wǎng)絡為阻塞式網(wǎng)絡(BlockingNetwork)o
反之,不具有這類性質的互連網(wǎng)絡為非阻塞式網(wǎng)絡,或稱為
全排列網(wǎng)絡。非阻塞式網(wǎng)絡連接的靈活性好,但連線多,控制
復雜,成本高。
第7幸,處理機
7.1多處理機的概念、問題和硬件結構
7.2緊耦合多處理機多Cache的一致性問題
7.3多處理機的并行性和性能;;
7.4多處理機的操作系統(tǒng):1
7.5多處理機的發(fā)展
7.1.2多處理機的硬件結構
1.緊耦合和松耦合
'□緊耦合多處理機......................
緊耦合多處理機是通過共享主存實現(xiàn)處理機間通信的,
其通信速率受限于主存頻寬。各處理機與主存經(jīng)互連網(wǎng)絡連
接,處理機數(shù)受限于互連網(wǎng)絡帶寬及各處理機訪主存沖突的
概率。
2)松耦合多處理機
「松耦合多處理機中,每臺處理機都有一個容量較大的局
部存儲器,用于存儲經(jīng)常用的指令和數(shù)據(jù),以減少緊耦合系
統(tǒng)中存在的訪主存沖突。不同處理機間或者通過通道互連實
現(xiàn)通信,以共享某些外部設備;或者通過消息傳送系統(tǒng)
MTS(MessageTransferSystem)來交換信息,這時各臺處理機
可帶有自己的外部設備。消息傳送系統(tǒng)常采用分時總線或環(huán)
形、星形、樹形等拓撲結構。松耦合多處理機較適合做粗粒
度的并行計算。處理的作業(yè)分割成若干相對獨立的任務,在
各個處理機上并行,而任務間的信息流量較小。當各處理機
任務間交互作用很少時,這種耦合度很松的系統(tǒng)是很有效的,
可看成是一個分布系統(tǒng)。
2.機間互連形式
多處理機機間互連的形式是決定多處理機性能的一個
重要因素。在滿足高通信速率、低成本的條件下,互連還
應靈活多樣,以實現(xiàn)各種復雜的乃至不規(guī)則的互連而不發(fā)
生沖突。因此,多處理機的互連一般采用;:
總線、;;;;;;;;;;
環(huán)形互連;;;;;;;;;;
交叉開關;;;;;;;;;;
多端口存儲器1;;;;;;;;
蠕蟲穿洞尋徑網(wǎng)絡等幾種形式。
3,存儲器的組織
;多處理機的主存一般都采用由多個模塊構成的并行存儲
器。由m個存儲器模塊構成的并行存儲器,存儲單
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 課題申報參考:明代戲曲的少數(shù)民族書寫研究
- 二零二五年度智慧城市人工費承包合同協(xié)議2篇
- 二零二五年度民房租賃合同終止協(xié)議范本
- 2025年度建筑模板施工班組質量保修服務合同
- 2025年度個人在線教育平臺會員貸款合同(含課程更新)4篇
- 河南省鄭州市智林學校高三上學期期末考試語文試題(含答案)
- 二零二五年度抹灰施工安全教育培訓資源共享合同4篇
- 二零二五年度新型木門安裝與綠色建材采購合同4篇
- 2025年度企業(yè)內(nèi)部培訓項目合同書范本4篇
- 2025年度苗木養(yǎng)護與生態(tài)園林景觀改造合同4篇
- CONSORT2010流程圖(FlowDiagram)【模板】文檔
- 腦電信號處理與特征提取
- 游戲綜合YY頻道設計模板
- 高中數(shù)學知識點全總結(電子版)
- GB/T 10322.7-2004鐵礦石粒度分布的篩分測定
- 2023新譯林版新教材高中英語必修一重點詞組歸納總結
- 蘇教版四年級數(shù)學下冊第3單元第2課時“常見的數(shù)量關系”教案
- 弘揚中華傳統(tǒng)文化課件
- 基于協(xié)同過濾算法的電影推薦系統(tǒng)設計
- 消防應急預案流程圖
- 人教統(tǒng)編版高中語文必修下冊第六單元(單元總結)
評論
0/150
提交評論