《計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)》(單博煒) 課后習(xí)題解答_第1頁(yè)
《計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)》(單博煒) 課后習(xí)題解答_第2頁(yè)
《計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)》(單博煒) 課后習(xí)題解答_第3頁(yè)
《計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)》(單博煒) 課后習(xí)題解答_第4頁(yè)
《計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)》(單博煒) 課后習(xí)題解答_第5頁(yè)
已閱讀5頁(yè),還剩22頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第一章 計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)導(dǎo)論透明性:本來(lái)存在的事物或?qū)傩?,單從某種角度看卻好像不存在的現(xiàn)象。N+1NNN+1N+1NN+1模擬:仿真:用微程序直接解釋另一種機(jī)器指令系統(tǒng)實(shí)現(xiàn)軟件移植的方法稱(chēng)為仿真并行性:同時(shí)性:并發(fā)性:兩個(gè)或多個(gè)事件在同一時(shí)間間隔發(fā)生的并行性時(shí)間重疊:在并行性概念中引入時(shí)間因素,即多個(gè)處理過(guò)程在時(shí)間上相互錯(cuò)開(kāi),輪流重疊的使用同一套硬件設(shè)備的各個(gè)部分,以加快硬件周轉(zhuǎn)來(lái)提高處理速度資源共享:異構(gòu)型多處理機(jī)系統(tǒng):()CPI:每條指令的平均時(shí)鐘周期數(shù)CPI(ClockCyclesPerInstruction)MIPS:(MillionInstructionsPerSecond),即百萬(wàn)條指令每秒MFLOPS(MilioFlatngPontpertiosPSecod)NKns1Nns,KN2nsKN3nsMii-1Mii-1NK解:程在一:間K執(zhí)了IC指則執(zhí)每指的間為?? ????對(duì)第二級(jí):要完成同樣功能,需要指令????條?? ???????? ??=??×??????=????2

????

?? ????2??3=??(??)

??3??4=??(??)答:計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)是計(jì)算機(jī)系統(tǒng)的軟、硬件的界面;計(jì)算機(jī)組成是計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)的邏輯實(shí)現(xiàn);計(jì)算機(jī)實(shí)現(xiàn)是計(jì)算機(jī)組成的物理實(shí)現(xiàn)。具有相同系統(tǒng)結(jié)構(gòu)的計(jì)算機(jī)可因性價(jià)比要求不同而采用不同的組成技術(shù)。同樣,一種計(jì)算機(jī)組成也可以采用多種不同的計(jì)算機(jī)實(shí)現(xiàn)。計(jì)算機(jī)實(shí)現(xiàn)是計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)和計(jì)算機(jī)組成的基礎(chǔ)。計(jì)算機(jī)實(shí)現(xiàn),尤其是器件技術(shù)的發(fā)展對(duì)計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)有著很大的影響。系統(tǒng)結(jié)構(gòu)的設(shè)計(jì)必須結(jié)合應(yīng)用考慮,為軟件和算法的實(shí)現(xiàn)提供更多更好的支持。同時(shí),還要涉及可能采用和準(zhǔn)備采用的組成技術(shù)。m交叉存取I/OI/OCache答:本來(lái)存在的事物或?qū)傩裕珡哪撤N角度看卻好像不存在的現(xiàn)象稱(chēng)為透明性對(duì)于計(jì)算機(jī)系統(tǒng)結(jié)構(gòu):1)(4)(5)(6)(9)(12(2)(3)(7)(8)(10(11)1-6(匯編)乘法器移位器答:指令緩沖器時(shí)標(biāo)發(fā)生器條件碼寄存器乘法器主存地址寄存器移位器答:在邏輯功能上是等效的。在性能,價(jià)格,實(shí)現(xiàn)難易上不同。早期圖形加速都通過(guò)軟件實(shí)現(xiàn),隨著GPU的發(fā)明又通過(guò)硬件實(shí)現(xiàn)了答:時(shí)間重疊:高性能單處理機(jī)系統(tǒng);資源重復(fù):多處理機(jī)系統(tǒng)資源共享:分時(shí)系統(tǒng)Se1=30Se2=20Se3=101230%,那么,部件3Sn10?30%、30%和20%解:3改進(jìn)前總時(shí)間加比S= =改進(jìn)后總時(shí)間解方程得到x=36%

130%÷30+30%÷20+??÷10+(1?30%?30%???)

=10(2)比S= 130%÷30+30%÷20+20%÷10+(1?30%?30%?20%)為改部所比= 1?30%?30%?20%

=4.08=81.63%30%÷30+30%÷20+20%÷10+(1?30%?30%?20%)f40MHzCPI1.5CPIMIPS表1.5指今在程序中出現(xiàn)的條數(shù)和每種指令的CPI指令類(lèi)型指令條數(shù)CPIALU1200001加載/存儲(chǔ)指令(Cache命中時(shí))360002轉(zhuǎn)移指令240003訪存指令(Cache不命中時(shí))200008解:CPI是各種類(lèi)型指令CPI的加權(quán)平均120000×1+36000×2+24000×3+20000×8??????=120000+36000+24000+20000

424000=200000

=2.12?? 40×106????????=??????×106=2.12×106=18.9????????40MHz1.6CPI、MIPS表1.6各類(lèi)指令條數(shù)和指令的平均時(shí)鐘周期數(shù)指令類(lèi)型指令條數(shù)平均時(shí)鐘周期數(shù)整數(shù)運(yùn)算450001數(shù)據(jù)傳送320002浮點(diǎn)運(yùn)算150002控制傳送80002解:CPI是各種類(lèi)型指令CPI的加權(quán)平均45000×1+32000×2+15000×2+8000×2??????= =45000+32000+15000+8000

155000100000

=1.55?? 40×106 155000????????=??????×106=1.55×106=100000=25.8????????程序執(zhí)行時(shí)間=45000×1+32000×2+15000×2+8000×2=155000=0.003875??=3875?????? 40×1061(1)處理機(jī)的CPI值是多少?(230MHz230%15%2MIPS。解:(1)10????????= ????????×106

=15×106??????×106解出每條指令的平均CPI=1.5CPI=1.5-1=0.5(2)CPI=30%(0.52)5%(0.54650.5=1.3?? 30×106 155000????????=??????×106=1.3×106=100000=23.08????????加載/存儲(chǔ)/(CPI)1.7表1.7指令比例及指令的平均周期數(shù)指令類(lèi)型比例CPI算邏指令44%1Load指令20%2Store運(yùn)算12%2轉(zhuǎn)移傳送24%2(1)求該指令系統(tǒng)的指令平均周期數(shù)。(2)25LoadR-M)CPI2解:(1)CPI=44120%212%224%2=1.56R-M指令類(lèi)型比例CPI算邏指令19%1R-M算邏指令25%2Load指令20%2Store運(yùn)算12%2轉(zhuǎn)移傳送24%2平均CPI=19%×1+25%×2+20%×2+12%×2+24%×2=1.81第二章 指令系統(tǒng)數(shù)據(jù)表示:是能由機(jī)器硬件直接識(shí)別和引用的數(shù)據(jù)類(lèi)型邏輯地址:程序員編寫(xiě)程序時(shí)使用的地址物理地址:程序在主存中的實(shí)際地址信息按整數(shù)邊界存儲(chǔ):信息在主存中存放的地址必須是該信息寬度(字節(jié)數(shù))的整數(shù)倍HuffmanComplexInstructionSetComputerRISC:精簡(jiǎn)指令系統(tǒng)計(jì)算機(jī)ReducedInstructionSetComputer重疊寄存器窗口技術(shù):CPU中都設(shè)置有數(shù)量較大的寄存器組,讓每個(gè)過(guò)程使用一個(gè)有限數(shù)量的寄存器窗口,并讓各個(gè)過(guò)程的寄存器窗口部分重疊指令延遲轉(zhuǎn)移技術(shù):由編譯程序自動(dòng)在轉(zhuǎn)移指令后面都插入一條空操作指令(NOP),或?qū)⑥D(zhuǎn)移指令與其前面的一條指令對(duì)換位置,讓成功轉(zhuǎn)移總是在緊跟的指令被執(zhí)行之后發(fā)生,從而使按要求的轉(zhuǎn)移目的地址預(yù)取的指令不作廢,同時(shí)可能節(jié)省一個(gè)機(jī)器周期。答:數(shù)據(jù)表示是數(shù)據(jù)結(jié)構(gòu)的子集。基本原則是得到對(duì)應(yīng)用中遇到的數(shù)據(jù)結(jié)構(gòu)有較高的實(shí)現(xiàn)效率。標(biāo)志符數(shù)據(jù)表示與描述符數(shù)據(jù)表示有何區(qū)別?描述符數(shù)據(jù)表示與向量數(shù)據(jù)表示對(duì)向量數(shù)據(jù)結(jié)構(gòu)所提供的支持由4(經(jīng)ROM30ROMROM地址內(nèi)容地址內(nèi)容地址內(nèi)容地址內(nèi)容地址內(nèi)容0000000010001010001001100110000100101010111001101110111100100010110011101010111101110011010011110010111101111111111HH解:H的含義是信息所包含的平均信息量。H的作用在于:計(jì)算實(shí)際編碼的平均碼長(zhǎng)值接近H者編碼質(zhì)量高。答:應(yīng)根據(jù)系統(tǒng)中指令的使用頻度分布和指令系統(tǒng)的大小來(lái)決定選擇何種擴(kuò)展編碼方法。CISCRISCCISCRISC目標(biāo)程序的執(zhí)行時(shí)間更長(zhǎng)?答:據(jù)式 ??????時(shí)間=????×??????×??。相能的序然ICCISC<ICRISC,但是CPICISC>CPIRISC,和且TCISC>TRISC,所以總的CPU時(shí)間CISC更長(zhǎng)。q=6ep=6m用解:對(duì)于階碼長(zhǎng)度q,階碼基re,尾數(shù)長(zhǎng)度p,尾數(shù)基rm,純小數(shù)補(bǔ)碼的范圍,有如下公式,???1×???2??≤??

≤(1??????)×???2???1 -1×???2???1≤??

≤?(???1??????)×???2???? ?? 正

?? ??

?? 負(fù)

?? ?? ??代入上述數(shù)據(jù)可以得到16?65≤??正≤(1?16?6)1663 ?16?63≤??負(fù)≤?(?16?1?16?6)16?64664答:變址尋址是對(duì)數(shù)組等數(shù)據(jù)塊運(yùn)算的支持,利于循環(huán)程序。基址尋址是對(duì)邏輯地址空間到物理地址空間變換的支持,利于實(shí)現(xiàn)程序的動(dòng)態(tài)再定位。將大地址空間64個(gè)地址分塊,用基址寄存器指出程序所在塊號(hào),用指令中6位地址碼表示該塊內(nèi)64個(gè)地址之一,這樣基址和變址相結(jié)合可以訪問(wèn)大地址任意64個(gè)地址之一。2-1010p7=0.05,p8=0.04,p9=0.03,p10=0.02。(l)計(jì)算這10條指令的操作碼編碼的最短平均碼長(zhǎng)。10Huffman解:(1)

Hpilog2pi=0.25*2+0.2*2.322+0.15*2.737+0.1*3.322+0.08*3.644+0.08*3.644+0.05*4.322+0.04*4.644+0.03*5.059+0.02*5.6440.25=2.94位(2)等長(zhǎng)操作碼操作碼時(shí),實(shí)際長(zhǎng)度l=4,信息冗余量1-H12.9410.73526.5%l 4(3)Huffman編碼I1=00, I2=10, I3=010, I4=110,I5=0110, 10平均長(zhǎng)l =0.25*2+0.2*2+0.15*3+0.1*3+0.08*4+0.08*4+0.05*4+0.04*5+0.03*6+0.02*6=2.99位i1信息冗余量1-H12.9410.9830.017=1.7%l (4)指令頻率3-5等長(zhǎng)碼碼長(zhǎng)I10.250003I20.20013I30.150103I40.10113I50.081003I60.081013I70.051103I80.04111005I90.03111015I100.0211110510平均長(zhǎng)l =0.25*3+0.2*3+0.15*3+0.1*3+0.08*3+0.08*3+0.05*3+0.04*5+0.03*5+0.02*5=3.18位i1如果是2-5等長(zhǎng)碼,l=3.2位答:指令格式優(yōu)化是用最短的位數(shù)來(lái)表示指令內(nèi)容,是程序中執(zhí)行的平均字長(zhǎng)最短,以節(jié)省程序的存儲(chǔ)空間。操作碼優(yōu)化:Huffman編碼;擴(kuò)展操作碼編碼地址碼優(yōu)化:(1)由于指令中操作數(shù)個(gè)數(shù)不同可采用多種地址制;(2)同一種地址制可以采用多種地址形式和長(zhǎng)度,ADD:43% SUB:13% JMP:7% JOM:6% SHR:l% CIL:2% CLA:22% STP:l%請(qǐng)分別設(shè)計(jì)這九條指令中操作碼的Huffman編碼、3/3/3擴(kuò)展編碼和2/7擴(kuò)展編碼,并計(jì)算這三種編碼的平均碼長(zhǎng)。解:某計(jì)機(jī)九指令各令使頻分別為I1:52% I2:14% I3:12% I4:7% I5:6%I6:5% I7:2% I8:1% I9:l%試分別用Huffman編碼和2-4-6等長(zhǎng)擴(kuò)展編碼為其操作碼編碼,并分別計(jì)算平均碼長(zhǎng)。解:Huffman編碼平均碼長(zhǎng):l=2.24位,2-4-6擴(kuò)展碼:l=2.52位4(0~9)“_”字符空進(jìn)統(tǒng)后得出們出頻分為 4527 王 1293李 0247四 李四12930247__:20% 0:17% 1:6%2:8% 4:8%5:5% 6:8% 7:13%8:3% 9:l%16(4Huffman平均碼長(zhǎng)l=3.23位(2)每個(gè)字符平均長(zhǎng)度為:3.23*(4+1)=16.15,傳送106個(gè),則需要傳輸?shù)亩M(jìn)制位數(shù)為:1.615*107位(3)需要傳輸?shù)亩M(jìn)制位數(shù)為:4*(4+1)*106位=2*107位。42551612位,每個(gè)地址碼長(zhǎng)為3位,問(wèn)能否以擴(kuò)展操作碼為其編碼?如果其中一地址指令為254條呢?說(shuō)明其理由。()23位對(duì)于三地址指令地址占據(jù)12-3*3=3,三地址指令最多23=8條,現(xiàn)三地址指令需4條,∴可有4條編碼作為擴(kuò)展碼,∴一地址指令最多為4×23×23=28=256條,現(xiàn)要求單地址指令255條,∴可有一條編碼作擴(kuò)展碼∴零地址指令最多為1×23=8條不滿足題目要求∴不可能以擴(kuò)展碼為其編碼。(2)若一地址指令有254條,根據(jù)(1)一地址指令可以用2條編碼作為擴(kuò)展碼,∴零地址指令最多為2×23=16條∴可以以擴(kuò)展碼作為編碼166x條,問(wèn)一地址指令最多可以有多少條?答:雙地址指令最多是2(16-6-6)=24=16條,現(xiàn)雙地址指令有x條,∴可有(16-x)條編碼作為擴(kuò)展碼,∴單地址指令最多為(16-x)×26ADD:30%SUB:24%LOD:6%STO:7%JMP:7%SHR:2%ROL:3%MOV:20%STP:1%16mHuffman解(1)Huffman編碼指令PiHuffman編碼碼長(zhǎng)ADD0.301SUB0.241113MOV0.21103STO0.0710114JMP0.0710104LOD0.0610004ROL0.03100105SHR0.021001106STP0.011001116平均碼長(zhǎng)l=2.75指令Pi擴(kuò)展碼2-5碼長(zhǎng)ADD0.3002SUB0.24012MOV0.2102STO0.07110005JMP0.07110015LOD0.06110105ROL0.03110115SHR0.02111005STP0.01111015平均碼長(zhǎng)l=2.782位 3位 3位操作碼寄存器1寄存器2長(zhǎng)指令5位 3位 3位 5位操作碼寄存器1變址寄存器相對(duì)位移通用寄存器8個(gè)最大相對(duì)位移量2^5=32個(gè)字節(jié)。35%25%20%10%5%3%(l)請(qǐng)?jiān)O(shè)計(jì)七條指令操作碼的Huffman編碼,并計(jì)算操作碼的平均碼長(zhǎng)。(2)若要求設(shè)計(jì)8位長(zhǎng)的寄存器一寄存器型指令三條,16位長(zhǎng)的寄存器一存儲(chǔ)器型變址尋址指令四條,變址范圍為-127~+127,請(qǐng)?jiān)O(shè)計(jì)指令格式,并給出指令各字段的長(zhǎng)度和操作碼編碼。()指令PiHuffman編碼I10.3511I20.2510I30.200I40.1010I50.050110I60.0301110I70.0201111平均碼長(zhǎng)l=2*(0.35+0.25+0.2)+3*0.1+4*0.05+5*(0.03+0.02)=2.35位三條令作分為10,00四條令作分為0100, 0101, 166位。如果二地址指令有15()154001;一地址指令地址占了6位,操作碼占了10位,其中4位用于和二地址區(qū)分由1111占據(jù),還剩6位一地指條數(shù)26-1=63條操碼其中需留零址零地址指令地址占了0位,操作碼占了16位,其中10位用于和一地址區(qū)分由1111111111占據(jù),還剩6位零地址指令條數(shù)26=64條,操作碼1111111111000000-1111111111111111(2)二址令14條,作碼一地指令63+63=126,操碼+ 零地令64+64=128條.操作碼 +CISCRISC答:一般原則P45P46-P48CPICISCRISC答:

第三章 流水線技術(shù)與向量處理技術(shù)指令的重疊解釋方式:在解釋第k條指令的操作完成之前,就可開(kāi)始解釋第k+l條指令。一次重疊:任何時(shí)候,指令分析部件和指令執(zhí)行部件都只有相鄰兩條指令在重疊解釋。k+lk“k”k+1、k+l“”。數(shù)相關(guān):如果第k+l條指令的源操作數(shù)地址i正好是第k條指令存放運(yùn)算結(jié)果的地址,在笫k、k+1條指令的數(shù)據(jù)地址之間有了關(guān)聯(lián),稱(chēng)為發(fā)生了“數(shù)相關(guān)”。靜態(tài)流水線:是指在同一時(shí)間內(nèi),多功能流水線中的各個(gè)功能段只能按一種功能的連接方式工作。動(dòng)態(tài)流水線:是指在同一時(shí)間內(nèi),多功能流水線中的各個(gè)功能段可以實(shí)現(xiàn)多種連接,同時(shí)執(zhí)行多種功能。線性流水線:是指流水線各段串行連接,數(shù)據(jù)順序流經(jīng)流水線各段一次且僅流過(guò)一次。非線性流水線:是指在流水線各段之間除有串行連接之外,還有某種反饋回路,使一個(gè)任務(wù)流經(jīng)流水線時(shí),需多次經(jīng)過(guò)某個(gè)段或越過(guò)某些段流水線的實(shí)際吞吐率:流水線的實(shí)際吞吐率TP是指從啟動(dòng)流水線處理機(jī)開(kāi)始到流水線操作結(jié)束,單位時(shí)間內(nèi)能流出的任務(wù)數(shù)或能流出的結(jié)果數(shù)流水線的加速比:是指流水方式與非流水線順序方式工作,完成同樣任務(wù)量時(shí)的工作速度提高的比值。流水線的效率:是指流水線的設(shè)備利用率,即流水線在整個(gè)運(yùn)行時(shí)間里,流水線的設(shè)備實(shí)際使用時(shí)間所占的比率“√”是一個(gè)n-1局部性相關(guān):指指令相關(guān)、主存空間數(shù)相關(guān)和通用寄存器組數(shù)相關(guān)等全局性相關(guān):指的是已進(jìn)入流水線的轉(zhuǎn)移指令(尤其是條件轉(zhuǎn)移指令)和其后面的指令之間的相關(guān)。先寫(xiě)后讀相關(guān):如果指令j的源操作數(shù)地址與指令h的目的操作數(shù)地址相同,而當(dāng)指令j到達(dá)讀段時(shí),指令h還沒(méi)有到達(dá)寫(xiě)段完成寫(xiě)入操作,則指令j讀出的數(shù)據(jù)就是錯(cuò)誤的,指令h和j就發(fā)生了先寫(xiě)后讀的操作數(shù)相關(guān)。先讀后寫(xiě)相關(guān):對(duì)同一單元,要求在先的指令先讀出,在后的指令后寫(xiě)入的關(guān)聯(lián)為“先讀后寫(xiě)”相關(guān)寫(xiě)后寫(xiě)相關(guān):稱(chēng)這種對(duì)同一單元要求在先的指令先寫(xiě)入,在后的指令后寫(xiě)入的關(guān)聯(lián)為“寫(xiě)后寫(xiě)”相關(guān)超標(biāo)量流水線:在一個(gè)時(shí)鐘周期內(nèi)能夠同時(shí)發(fā)射多條指令VLIW:超長(zhǎng)指令字VeryLongInstructionWord,將多條指令中若干可并行執(zhí)行的操作安排在一個(gè)超長(zhǎng)指令字中的各指令操作字段上,形成一條可達(dá)數(shù)百位的指令,超流水線:指在每個(gè)節(jié)拍只發(fā)射一條指令,但每個(gè)機(jī)器周期內(nèi)可并發(fā)發(fā)射多條指令并產(chǎn)生多個(gè)結(jié)果的流水線超標(biāo)量超流水線:超標(biāo)量流水與超流水技術(shù)的結(jié)合答:差別之處:順序方式,指令不分解;“一次重疊”把一條指令的解釋分解為兩個(gè)子過(guò)程,而“流水”則是分解成更多個(gè)子過(guò)程。流水相比完全重復(fù)增加多套部件:優(yōu)點(diǎn)還是節(jié)省硬件,成本較低;缺點(diǎn)是控制復(fù)雜,需要解決好指令相關(guān),數(shù)據(jù)相關(guān)以及流水線中斷等問(wèn)題。t、t分析t執(zhí)行(l)分別計(jì)算下列幾種情況下,執(zhí)行完100條指令所需時(shí)間的一般關(guān)系式。①順序方式。②僅“執(zhí)行k”與“取指k+1”重疊。③僅“執(zhí)行k”、“分析k+1”、“取指k+2”重疊。(2)分別在t取指=t分析=2、t執(zhí)行=1及t取指=t執(zhí)行=5、t分析=2兩種情況下,計(jì)算出上述各結(jié)果。解:①順序方式t=(t1+t2+t3)*100t1=t2=2,t3=1,t=(2+2+1)*100=500t1=t3=5,t2=2,t=(5+2+5)*100=1200②僅“執(zhí)行k”與“取指k+1”重疊。t=t1+100*t2+99*max(t1,t3)+t3t1=t2=2,t3=1,t=2+100*2+99*2+1=401t1=t3=5,t2=2,t=5+100*2+99*5+5=705③僅“執(zhí)行k”、“分析k+1”、“取指k+2”重疊t=t1+max(t1,t2)+98*max(t1,t2,t3)+max(t2,t3)+t3t1=t2=2,t3=1,t=2+2+98*2+2+1=203t1=t3=5,t2=2,t=5+5+98*5+5+5=510Δt105Δt連續(xù)輸入10個(gè)數(shù)據(jù),如此重復(fù)。畫(huà)出時(shí)-空?qǐng)D,計(jì)算流水線的實(shí)際吞吐率、加速比和效率。解:時(shí)空?qǐng)DTP

1015t

0.67/t加速比ST0Tm效率

10*E4*10t0.674*15t3.50圖3.50流水線結(jié)構(gòu)其中,段S1和S3的執(zhí)行時(shí)間均為200ns,段S2和S4的執(zhí)行時(shí)間均為100ns。(l)(2)S1S3別使用公式和時(shí)一空?qǐng)D求連續(xù)流入四條指令的實(shí)際吞吐率和效率。()s44321432143214321200ns實(shí)際吞吐率TP

4

t0.0033ns1E

24*100

50%(2)時(shí)空?qǐng)Dss4s3bs3as2s12s1112342413123412341234

100nst實(shí)際吞吐率TP

4

0.0044ns1E

6*4006*9*100

44%Δt10F i1畫(huà)出流水線時(shí)-空?qǐng)D,計(jì)算流水線的實(shí)際吞吐率、加速比和效率。Δt(1)當(dāng)在流水線間隔Δt連續(xù)流入任務(wù)時(shí),會(huì)發(fā)生什么情況?(2)該流水線的最大吞吐率是多少?如果每2Δt輸入一個(gè)任務(wù),連續(xù)流入10個(gè)任務(wù),流水線的實(shí)際吞吐率和效率分別是多少?(3)如何改造該流水線,以提高吞吐率?仍然連續(xù)流入10個(gè)任務(wù),改造后的流水線的實(shí)際吞吐率相對(duì)于改造前的流水線吞吐率提高了多少?(1)答:會(huì)發(fā)生流水線阻塞現(xiàn)象(2)解:第三段是瓶頸段占用2Δt,所以最大吞吐率TPmax=1/2Δt如果每2Δt輸入一個(gè)任務(wù),連續(xù)流入10個(gè)任務(wù)時(shí):(3)重復(fù)設(shè)置部件,并聯(lián)在流水線上,6Δt6F(ii)i1畫(huà)出流水線時(shí)-空?qǐng)D,并計(jì)算流水線的實(shí)際吞吐率、加速比和效率。解:ΔtΔtΔt5ΔtΔtΔt542361因?yàn)槭庆o態(tài)流水線,所以需要乘法完成之后,再啟動(dòng)加法。Δt。輸入端和輸出端的緩沖器足夠大,且輸出端的數(shù)據(jù)可以直接返回到輸入端。若用流水線按最快的處理方式計(jì)算(l)畫(huà)出流水線計(jì)算f的時(shí)一空?qǐng)D。

44f(ii)i1ΔtΔΔtΔtΔt542361答案略

Δt Δt Δt8ABA·B的時(shí)-(l)處理器有一個(gè)乘法部件和一個(gè)加法部件,不能同時(shí)工作,部件內(nèi)也只能按順序方式工作,完成一次加法或乘法均需5Δt。與(l)Δt。Δt。MOVE、ADD和MUL的執(zhí)行分別需要二個(gè)、三個(gè)和四個(gè)時(shí)鐘周期,且都在第一個(gè)時(shí)鐘周期從通用寄存器中讀取源操作數(shù),在最后一個(gè)時(shí)鐘周期把目的操作數(shù)寫(xiě)到通用寄存器中。k: MOVERl, R0 ; R1←(R0)k+l: MUL R0, R2, Rl ; k+2: ADD R0, R2, R3 ; R0←(R2)+(R3)(l)就程序本身而言,哪些指令之間可能發(fā)生何種數(shù)據(jù)相關(guān)?(2)畫(huà)出按指令序列的順序流水執(zhí)行的時(shí)一空?qǐng)D。共使用了多少個(gè)時(shí)鐘周期?(2)3.2表3.2預(yù) 約 表時(shí)間段號(hào)t0t1t2t3t4t5t6t7t8S1√√S2√√S3√√√S4√√S5√√(l)分別寫(xiě)出禁止表F、沖突向量C。(2)狀態(tài)轉(zhuǎn)移圖(3)最佳調(diào)度方案(2,5)TPmax=1/3.5Δt6實(shí)際吞吐率3.3F、沖突向量C;畫(huà)出流水線狀態(tài)轉(zhuǎn)移圖;求出最小平均延遲及流水線的最大吞吐率及其調(diào)度時(shí)的最佳方案。按此流水調(diào)度方案,輸入六個(gè)任務(wù),求實(shí)際的吞吐率。表3.2預(yù) 約 表時(shí)間段號(hào)t1t2t3t4t5t6t7S1√√√S2√√S3√S4√√12別畫(huà)出在標(biāo)量流水處理機(jī)及并行度m均為4的超標(biāo)量處理機(jī)、超長(zhǎng)指令字處理機(jī)、起流水線處理機(jī)上工作的時(shí)-空?qǐng)D,分別計(jì)算出它們相對(duì)標(biāo)量流水處理機(jī)的加速比Sp。解,標(biāo)量處理機(jī)超標(biāo)量m=4超長(zhǎng)指令字m=4超流水線m=4Sp=14/5.75=2.43某VLIWΔt,12、14、16解:任務(wù)數(shù)分別為12時(shí),分12/4=3條長(zhǎng)指令,執(zhí)行時(shí)間為(5+3-1)=7Δt任務(wù)數(shù)分別為14時(shí),分4條長(zhǎng)指令,執(zhí)行時(shí)間為(5+4-1)=8Δt任務(wù)數(shù)分別為16時(shí),分4條長(zhǎng)指令,執(zhí)行時(shí)間為(5+4-1)=8Δt若上題的VLIWΔt12、14、16時(shí),各需要的時(shí)間是多少?解:n=2,m=4124 1任務(wù)數(shù)分別為12時(shí),執(zhí)行時(shí)間為:T5

6t4 2144 1任務(wù)數(shù)分別為14時(shí),執(zhí)行時(shí)間為:T5

4 2164 1任務(wù)數(shù)分別為16時(shí),執(zhí)行時(shí)間為:T5

4 23-15題的VLIW12、14、16解:超流水n=41任務(wù)分為12,時(shí)間:T5 1141任務(wù)分為14,時(shí)間:T5 141任務(wù)分為16,時(shí)間:T5 4D=A·(B+C)N令:①V3←存器; 取A送向寄器V3②V2←VO+Vl; B+C→K③V4←V2*V3; K*A→D設(shè)啟動(dòng)存儲(chǔ)器、啟動(dòng)乘/加流水線、數(shù)據(jù)輸入寄存器各需要時(shí)間Δt,向量加流水線完成一次加法需要時(shí)間6Δt,訪存一次需要時(shí)間6Δt,向量乘流水線完成一次乘法需要時(shí)間7Δt。求出分別采用下列三種方式工作時(shí),完成三條向量指令共需的時(shí)間。(l)三條指令依序串行。解:(1)T=1+6+N+ 1+6+N+ 1+7+N=(22+3N)ΔtT=1+6+N+ 1+7+N=(15+2N)Δt第三條與一、二條并行執(zhí)行T=1+6+ 1+ 1+7 +N=(16+N)Δtf=200MHz/12VSnV1←存儲(chǔ)器V2←V1×SV3←存儲(chǔ)器V4←V2+V3存儲(chǔ)器←V4(l)處理機(jī)順序執(zhí)行各向量指令且不鏈接,若n=64,計(jì)算處理機(jī)的執(zhí)行時(shí)間。MFLOPS()T12++6411+7+1+64-11+12+1+64-1+1+6+1+64-1+1+12+1+64-1=374Δt=374/(200*106)=187*10-8s(2)MFLOPS=2*64/(187*10-8*106)=68(3)5條向量指令在標(biāo)量處理機(jī)上以順序方式處理,各自需要的處理時(shí)間分別為:T1=64×12Δt=768ΔtT2=64×7Δt=448ΔtT3=64×12Δt=768ΔtT4=64×6Δt=384ΔtT5=64×12Δt=768Δt標(biāo)量處理機(jī)順序執(zhí)行所需要的時(shí)間為:T=T1+T2+T3+T4+T5=3136/(200*106)=1568*10-8s加速比:Sp=1568/187=8.3932,SVΔt/6Δt算需要時(shí)間6Δt,完成一對(duì)數(shù)據(jù)的乘運(yùn)算需要時(shí)間7Δt。問(wèn)下列各指令組中,哪些指令可以同時(shí)并行?哪些指令可以鏈接?分別計(jì)算各指令組的執(zhí)行時(shí)間。(1)V0←存儲(chǔ)器V1←V2+V3(2)V3←存儲(chǔ)器V2←V0+V1V4←V5×V6S0←S2+S3(3)S0←S1+S2V3←存儲(chǔ)器(2)V3←V1×V4V0←存儲(chǔ)器V2←V0+V1V2

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論