計算機(jī)系統(tǒng)概述計算機(jī)組成原理課件_第1頁
計算機(jī)系統(tǒng)概述計算機(jī)組成原理課件_第2頁
計算機(jī)系統(tǒng)概述計算機(jī)組成原理課件_第3頁
計算機(jī)系統(tǒng)概述計算機(jī)組成原理課件_第4頁
計算機(jī)系統(tǒng)概述計算機(jī)組成原理課件_第5頁
已閱讀5頁,還剩42頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

Ch1:ComputerAbstractions

計算機(jī)系統(tǒng)概述

第1講:計算機(jī)系統(tǒng)概述

第2講:計算機(jī)性能評價

2010年12月28日星期

第一講計算機(jī)系統(tǒng)概述

。計算機(jī)發(fā)展簡史

?IAS通用計算機(jī)模型機(jī):馮?諾依曼結(jié)構(gòu)

?IBM360系列機(jī):引入兼容性(系列機(jī))概念

?DECPDP-8:引入總線結(jié)構(gòu)

。計算機(jī)系統(tǒng)的組成

?計算機(jī)硬件:CPU+MM+I/O

?計算機(jī)軟件:系統(tǒng)軟件+應(yīng)用軟件

。計算機(jī)層次結(jié)構(gòu)

?計算機(jī)硬件和軟件的接口:指令系統(tǒng)

?計算機(jī)軟件如何在硬件上執(zhí)行

°本課程主要內(nèi)容

2010年12月28日星期.

Chapter1.2

計算機(jī)的功能和特點(diǎn)

。什么是計算機(jī)?

■計算機(jī)是一種能對數(shù)字化信息進(jìn)行自動、高速運(yùn)算的通用

處理裝置。

。計算機(jī)的功能:

■數(shù)據(jù)運(yùn)算、數(shù)據(jù)存儲、數(shù)據(jù)傳送、控制

。計算機(jī)的特點(diǎn):

■高速:高速元器件和“存儲程序”工作方式帶來高速性

?通用:體現(xiàn)在處理對象和應(yīng)用領(lǐng)域沒有限制

?準(zhǔn)確:精度足夠的算術(shù)運(yùn)算帶來準(zhǔn)確性

?智能:邏輯推理能力帶智能性

2010年12月28日星期.

Chapter1.3

回顧:計算機(jī)發(fā)展簡史

°第一代:真空管(電子管VacuumTube)1946?57年

?46年誕生第1臺電子計算機(jī)EN機(jī)C

-體積龐大,重30噸,有18000多個真空管組成,5000次加法/秒。

-采用十進(jìn)制表示/運(yùn)算,其存儲器由20個累加器組成,每個累加器

可存10位十進(jìn)制數(shù),每一位數(shù)由10個真空管表示。

-采用手動編程,通過設(shè)置開關(guān)和插拔電纜來實(shí)現(xiàn)。

?馮?諾依曼機(jī)(VonNeumannMachine)

-45年馮?諾依曼(圖靈也同時)提出“存儲程序(Stored-

program)”思想,并于46年開始設(shè)計“存儲程序”計算機(jī)。

-“存儲程序”思想:

將事先編好的程序和原始數(shù)據(jù)送入主存中,然后啟動執(zhí)行。計算機(jī)

應(yīng)能在不需操作人員干預(yù)下,自動完成逐條取出指令和執(zhí)行指令

的任務(wù)。

2010年12月28日星期.

Chapter1.4SKIP

TheFirstGeneration:VacuumTube

Computers(1946-1957)

Thefirstgeneral-purposecomputer-ENIAC

ENIAC——NonvonNeumannModel

CK

2010年12月28日星期.

Chapter1.6

馮?諾依曼結(jié)構(gòu)的主要思想

1.計算機(jī)應(yīng)由運(yùn)算器、控制器、存儲器、輸入設(shè)備和輸出設(shè)備

五個基本部件組成。

2.各基本部件的功能是:

/存儲器不僅能存放數(shù)據(jù),而且也能存放指令,形式上兩者

沒有區(qū)別,但計算機(jī)應(yīng)能區(qū)分?jǐn)?shù)據(jù)還是指令;

,控制器應(yīng)能自動執(zhí)行指令;

,運(yùn)算器應(yīng)能進(jìn)行加/減/乘/除四種基本算術(shù)運(yùn)算,并且也能

進(jìn)行一些邏輯運(yùn)算和附加運(yùn)算;

/操作人員可以通過輸入設(shè)備、輸出設(shè)備和主機(jī)進(jìn)行通信。

3.內(nèi)部以二進(jìn)制表示指令和數(shù)據(jù)。每條指令由操作碼和地址碼

兩部分組成。操作碼指出操作類型,地址碼指出操作數(shù)的地

址。由一串指令組成程序。

4.采用“存儲程序”工作方式。

2010年12月28日星期.

Chapter1

計算機(jī)發(fā)展簡史

°第二代:晶體管1958?64年

晶體管:

?元器件:邏輯元件采用晶體管,內(nèi)存由磁Transistor

芯構(gòu)成,外存為磁鼓與磁帶。

?特點(diǎn):變址,浮點(diǎn)運(yùn)算,多路存儲器,I/O

處理機(jī),中央交換結(jié)構(gòu)(非總線結(jié)構(gòu))。

■軟件:使用高級語言,提供了系統(tǒng)軟件。

?代表機(jī)種:IBM7094(scientific)X1401

(busin;)和DECPDP-1

DECPDP-1

2010年12月28日星期.

Chapter1.8

計算機(jī)發(fā)展簡史

第三代:SSI/MSI1965?71年

?元器件:邏輯元件與主存儲器均由集成電路(IC)實(shí)現(xiàn)。

?特點(diǎn):微程序控制,Cache,虛擬存儲器,流水線等。

?代表機(jī)種:IBM36(^DDECPDP-8(大/巨型機(jī)與小型機(jī)同時發(fā)展)

-巨型機(jī)(Supercomputer):Cray-1

-大型機(jī)(Mainframe):IBM360系列

-小型機(jī)(Minicomputer):DECPDP-8

2010年12月28日星期.

Chapter1.9

IBMSystem/360系列計算機(jī)

IBM公司于1964年研制成功

引入了“兼容機(jī)”(“系列機(jī)”

概念

?兼容機(jī)的特征:

-相同的或相似的指令集

-相同或相似的操作系統(tǒng)

-更高的速度

-更多的I/O端口數(shù)

-更大的內(nèi)存容量

低端機(jī)指零矗幽榆I的一個

子集,稱為“向后兼容”。功問題1:引入“兼容機(jī)”有什么好處?

能相同,而性能不同。

問題2:實(shí)現(xiàn)“系列機(jī)”的關(guān)鍵是什么

2010年12月28日星期.

Chapter1.10

DEC公司的PDP-8機(jī)

同在64年出現(xiàn)。與舊M360相比,價格更低、更小巧,因而

被稱為小型機(jī)(Minicomputer)

PDP-8“創(chuàng)造了小型機(jī)的概念,并使之成為數(shù)十億美元的工

業(yè)”,使DEC成為了最大的小型機(jī)制造商。

主要特點(diǎn):首次采用總線結(jié)構(gòu)。

Omnibus總線包含了96個獨(dú)立的信號通道,用以傳送控制

、地址和數(shù)據(jù)信號。這種結(jié)構(gòu)具有高度的靈活性,允許將模

塊插入總線以形成各種配置。

2010年12月28日星期.

Chapter1.11

PDP-8/E計算機(jī)系統(tǒng)框圖

控制臺

CPU主存儲器I/O模塊I/O模塊

控n制器

Omni總線

PDP—8計算機(jī)總線結(jié)構(gòu)圖

問題:“總線結(jié)構(gòu)”有什么好處?

具有高度的靈活性,允許將模塊插入總線以形成各種配置

節(jié)省器件,體積小,價格便宜

2010年12月28日星期.

Chapter1.12

計算機(jī)發(fā)展簡史

(第四代:LSI/VLSI/ULSI1972?至今)

?微處理器和半導(dǎo)體存儲器的技術(shù)發(fā)展迅猛,微型計算機(jī)出現(xiàn)。

使計算機(jī)以辦公設(shè)備和個人電腦的方式走向普通用戶。

半導(dǎo)體存儲器

-70年FWrchild公司生產(chǎn)出第一個相對大容量半導(dǎo)體存儲器

-74年位價格低于磁芯的半導(dǎo)體存儲器出現(xiàn),并快速下跌

-從70年起,存儲密度呈4倍提高(幾乎是每3年)。

微處理器

-微處理器芯片密度不斷增加,使CPU中所有元件放在一塊芯片上成

為可能。71年開發(fā)出第一個微處理器芯片4004。

?特點(diǎn):共享存儲器,分布式存儲器及大規(guī)模并行處理系統(tǒng)

以后幾代(標(biāo)準(zhǔn)、意見不一)

(注:有稱第四代是VLSI,從80年代開始;也有稱第四代是LSL從72年開始;

有的又分成LSI時代和VLSI時代)

2010年12月28日星期.

Chapter1.13

打開計算機(jī)來看看

powers叩My

fanwithcover

motherboard

PC主板

-PCI總線插槽

內(nèi)存條

2010年12月28日星期

解剖計算機(jī)

Howdoyoubuildsystemswith>1Gcomponents?

個人計算機(jī)由主CircuitBoard:IntegratedCircurt:

機(jī)和外設(shè)組成主機(jī)中包含每個電路板中有Module:

多個電路板十幾個集成電路每個集成電路中

有十幾個模塊

MOSFET

每個門電路實(shí)現(xiàn)基

本的邏輯運(yùn)算

+Cell:

所有信息都用二每個模塊中有

進(jìn)制編碼表示上千萬個單元

每個單元中有

十幾個門電路

2010年12月28日星期.

Chapter1.16

IntegratedCircuitsmanufacturingprocess

圓形薄片/硅拋光片

單晶硅錠(6/8/12寸,厚度不足1mm)

SiliconingotBlankwafers

Slicer

20to30processvigsteps

Individualdies

Patternedwafers

Die

tester

不合格的用磁IC小片/芯片

漿點(diǎn)上記號“晶圓”/大芯片

PackageddiosTestedpackageddies

回回同回叵叵

回回回Shiptocustomers

封裝:將芯片固定在塑膠或陶瓷基座上,把芯片上蝕刻出來

的引線與基座底部伸出的引腳連接,蓋上蓋板并封焊成芯片約需400多道工序!

2010年12月28日星期.

Chapter1.17

Pentium這片內(nèi)的主要功能塊

DieArea:91mm2

直徑8inch(200mm)的

Wafer最多可做196個Die

工3,300,000Transistors

Cache:=1MTransistors

296Pins

PentlumPro芯片內(nèi)的主要功能塊

?DieArea:306mm2

?直彳£8inch(200mm)的

Wafer最多可做78個Die

?-5,500,000Transistors

?Cache:MMTransistors

?ExternalCache:

31MTransistors

PentiumProPackage=

PentiumPro+ExternalCache

387Pins

Pentium4處理器內(nèi)部布局

Control

ControlI/O

interface

Instructioncache

Data

cache

Enhanced

floatingpoint

andmultimediaInteger

datapath

Secondary

cache

and

memory

interface

=f-1Control

Advancedpipelining

Control

hyperthreadingsupport

2010年12月28日星期.

Chapter1.20

Hardware/SoftwareInterface

temp=v[k];

v[k]=v[k+l];

v[k+l]=temp;

lw$15,0($2)

lw$16,4($2)

sw$16,0($2)

sw$15,4($2)

1000iioooioomioooooooooooooooo

10001100010100000000000000000100

101011000101oooooooooooooooooooo

10101100010011110000000000000100

MachineInterpretation

…,EXTop=1,ALUSe1A=1,ALUSe1B=11,ALUop=add,

ControlSignal

SpecificationIorD=l,Read,MemtoReg=l,RegWr=l,......

2010年12月28日星期.

Chapter1.21

Hardware/SoftwareInterface(界面)

指令集體系結(jié)構(gòu)

機(jī)器語言由指令代碼構(gòu)成,能被硬件直接執(zhí)行。

2010年12月28日星期.

Chapter1.22

Software

Systemsoftware(系統(tǒng)軟件)■簡化編程過程,使硬件資源被有效利用

?操作系統(tǒng)(OperatingSystem):硬件資源管理,用戶接口

?語言處理系統(tǒng):翻譯程序+Linker,Debug,Loader,etc...

-翻譯程序(Translator)有三類:

A匯編程序(Assembler):將匯編語言源程序翻譯為機(jī)器語言目

標(biāo)程序文件。

>編譯程序(Complier):將高級語言源程序翻譯為匯編語言或

機(jī)器語言目標(biāo)程序文件。

>解釋程序(Interpreter):將高級語言語句逐條翻譯成機(jī)器指

令并立即執(zhí)行。不生成目標(biāo)文件。

?其他實(shí)用程序:如:磁盤碎片整理程序、備份程序等

Applicationsoftware(應(yīng)用軟件)?解決具體應(yīng)用問題/完成具體應(yīng)用任務(wù)

?各類媒體處理程序:Word/Image/Graphics/...

?管理信息系統(tǒng)(MIS)

?Game,...

2010年12月28日星期.

Chapter1.23

ComputerHierarchy(計算機(jī)系統(tǒng)層次)

應(yīng)用程序員最終用戶

。上圖給出的是計算機(jī)系統(tǒng)的層次結(jié)構(gòu)

指令系統(tǒng)(即ISA)是軟/硬件的交界面

。不同用戶工作在不同層次,所看到的計算機(jī)不一樣

。中間陰影部分就是本課程主要內(nèi)容,處于最核心的部分!

2010年12月28日星期.

Chapter1.24

一個典型系統(tǒng)的硬件組成

CPU

registerfile

PC昌

□systembusmemorybusMM

4main|

I/O仁」一

MemoryInterface

bridge---------/Imemory

OT=>

MObusExpansionslotsfor

X7otherdevicessuch

USBdrskasnetworkadapters.

controlleradaptercontrcHJer

^lou^^eyboa^^^spia^)

elIoexecutable

storedondish

Input/Output

PC:程序計數(shù)器;ALU:算術(shù)/邏輯單元;USB:通用串行總線

2010年12月28日星期.

Chapter1.25

一個典型程序的轉(zhuǎn)換處理過程

經(jīng)典的“hello.c”C?源程序hello.c的ASCII文本表示

1#include<stdio.h>#inc1ude<sp><stdio.

23510511099108117100101326011511610010511146

3intmain()h>\n\nint<sp>main()\n{

1046210101051101163210997105110404110123

4(\n<sp><sp><sp><sp>printf(**hel

5printf("hello,world\n");10323232321121141051101161024034104101108

6}lo,<sp>world\nH);\n}

程序的功能是:10811144321191111141081009211034415910125

輸出“hello,world”

programsourceprogramobjectobject

(text)program仲刈programsprogram

(text)(binary)(binary)

2010年12月28日星期.

Chapter1.26

Hello程序的數(shù)據(jù)流動過程unix>./hello[Enter]

hello,world

unix>

CPURed:shell命令行處理

registerfileBlue:可執(zhí)行文件加載

Cyan:hello程序執(zhí)行過程

IPC|

systembusmemorybus

^$1mainI“簡。"

Memoryi

bridgememoryuhello,world/nn

zA

MObusExpansionslotsfor

otherdevicessuch

USgraphicsdiskasnetworkadapters.

controladaptercontroiler

mousekeyboarddisplay

“hello,world/n”工Hello可執(zhí)行文件

“hello”disk

數(shù)據(jù)經(jīng)常在各存儲部件間傳送。故現(xiàn)代計算機(jī)大多采用“緩存”技術(shù)!

所有過程都是在CPU執(zhí)行指令所產(chǎn)生的控制信號的作用下進(jìn)行的。

2010年12月28日星期.

Chapter1.27

該課程的主要學(xué)習(xí)內(nèi)容

如何設(shè)計高性能CPU?

registerfile

如何設(shè)計總線BUS?

PC昌如何設(shè)計存

systembusmemorybus儲器系統(tǒng)?

□一4gn|

I/O

MemoryInterface

bridge--------------/Imemory

OT=>

MObusExpansionslotsfor

X7otherdevicessuch

USBdrskasnetworkadapters.

controlleradaptercontrcHJer

^lou^^eyboa^^

elIoexecutable

storedondish

如何設(shè)計I/O?

信息(指令和數(shù)據(jù))在計算機(jī)中如何表示?

指令系統(tǒng)如何設(shè)計?

2010年12月28日星期.

Chapter1.28

CourseOutline

°性能評價(Performancemeasurement)

°計算機(jī)算術(shù)(ArithmeticforComputer)

?數(shù)據(jù)的表示和運(yùn)算

°存儲器層次結(jié)構(gòu)(MemoryHierarchies)

°指令集體系結(jié)構(gòu)(InstructionSetArchitecture)

°CPU設(shè)計

?數(shù)據(jù)通路(Datapath)和控制器(ControlUnit)

°流水線技術(shù)(Pipelining)

°系統(tǒng)總線(SystemBuses)

°輸入/輸出系統(tǒng)(Input/Outputsystem)

2010年12月28日星期.

Chapter1.29

第二講計算機(jī)性能評價

°制造成本(manufacturingcost)

°衡量計算機(jī)性能的基本指標(biāo)

?響應(yīng)時間(responsetime)

-執(zhí)行時間(executionTime)、等待時間(latency)

?throughput(吞吐量)

-帶寬(bandwidth)

°計算機(jī)性能測量

°指令執(zhí)行速度(MIPS、MFLOPS)

°基準(zhǔn)程序(Benchmark)

2010年12月28日星期.

Chapter1.30

回顧:IntegratedCircuitsCosts?manufacturingprocess

在考察性能前,先考察成本!

圓形薄片/硅拋光片

單晶硅錠(6/8/12寸,厚度不足1mm)

SiliconingotBlankwafers

?Slicer

20to30processvigsteps

回回同回叵叵

回回回Shiptocustomers

封裝:將芯片固定在塑膠或陶瓷基座上,把芯片上蝕刻出來

的引線與基座底部伸出的引腳連接,蓋上蓋板并封焊成芯片約需400多道工序!

2010年12月28日星期.

Chapter1.31

IntegratedCircuitsCosts公式

芯片成本與以下因素有關(guān):

Cost_per_wafter

Diecost=

Die_per_waferxYield■圓晶價格

■圓晶所含小片數(shù)

wafer_area

Diesperwafer=-=------

Diearea?小片合格率

小片合格率

DieYield=-----------------------------------------------------

(1+(Defect_per_area\Die_area))

由此看出:每個圓晶片上的小片數(shù)、集成電路成本都與芯片面積有關(guān)!

2010年12月28日星期.

Chapter1.32

計算機(jī)性能的基本評價指標(biāo)

。計算機(jī)有兩種不同的性能

°Tlmetodothetask不同應(yīng)用場合用戶關(guān)心的性能不同:

一響應(yīng)時間(responsetime)要求吞吐率高的場合,例如:

-執(zhí)行時間(executiontime)多媒體應(yīng)用(音/視頻播放要流暢)

-等待時間或時延(latency)要求響應(yīng)時間短的場合:例如:

°Tasksperday,hour,sec,ns.??事務(wù)處理系統(tǒng)(存/取款的速度要快)

要求吞吐率高且響應(yīng)時間短的場合:

-吞吐率(throughput)

ATM、文件服務(wù)器、Web服務(wù)器等

一帶寬(bandwidth)

°基本的性能評價標(biāo)準(zhǔn)是:CPU的執(zhí)行時間

XisntimesfasterthanY"means相對性能用執(zhí)行時間

ExTime(Y)Performance(X)的倒數(shù)來表示!

ExTime(X)Performance(Y)

2010年12月28日星期.

Chapter1.33

計算機(jī)性能的測量

比較計算機(jī)的性能時,用執(zhí)行時間來衡量

?完成同樣工作量所需時間最短的那臺計算機(jī)就是性能最好的

?處理器時間往往被多個程序共享使用,因此,用戶感覺到的程序執(zhí)行時

間并不是程序真正的執(zhí)行時間(從hello程序執(zhí)行過程可知)

?通常把用戶感覺到的響應(yīng)時間分成:

-CPU時間:指CPU真正花在程序執(zhí)行上的時間。又包括兩部分:

/用戶CPU時間:用來運(yùn)行用戶代碼的時間

/系統(tǒng)CPU時間:為了執(zhí)行用戶程序而需要運(yùn)行操作系統(tǒng)程序的時間

-其他時間:指等待I/O操作完成或CPU花在其他用戶程序的時間

?系統(tǒng)性能和CPU性能不等價,有一定的區(qū)別

-系統(tǒng)性能(Systemperformance):系統(tǒng)響應(yīng)時間,與CPU外的其

他部分也都有關(guān)系

-CPU性能(CPUperformance):用戶CPU時間

?本章主要討論CPU性能,即:CPU真正用在用戶程序執(zhí)行上的時間

問題:用戶CPU時間與系統(tǒng)響應(yīng)時間哪個更長?

2010年12月28日星期.

Chapter1.34

CPU執(zhí)行時間的計算

CPI:CyclesPerInstruction

CPU執(zhí)行時間=CPU時鐘周期數(shù)/程序X時鐘周期

=CPU時鐘周期數(shù)/程序小時鐘頻率

=指令條數(shù)/程序XCPIX時鐘周期

CPU時鐘周期數(shù)/程序=指令條數(shù)/程序XCPI

CPI=CPU時鐘周期數(shù)/程序+指令條數(shù)/程序

CPI用來衡量以下各方面的綜合結(jié)果

?InstructionSetArchitecture(ISA)

?Implementationofthatarchitecture

?program

2010年12月28日星期.

Chapter1.35

AspectsofCPUPerformance

CPUtime=Seconds=InstructionsxCyclesxSeconds

ProgramProgramInstructionCycle

instr,countCPIclockrate

Program

Compiler

Instr.SetArch.

Organization

Technology

思考:三個因素與哪些方面有關(guān)?

2010年12月28日星期.

Chapter1.36

AspectsofCPUPerformance

CPUtime=Seconds=InstructionsxCyclesxSeconds

ProgramProgramInstructionCycle

instr,countCPIclockrate

ProgramXX

CompilerX(X)

Instr.SetArch.XX

OrganizationXX

TechnologyX

問題:ISA、計算機(jī)組織(Organization)、計算機(jī)實(shí)現(xiàn)技術(shù)(Technology)

三者的關(guān)系是什么?

2010年12月28日星期.

Chapter1.37

Architecture=InstructionSetArch.+Organization

ComputerDesign

InstructionSetDesignComputerHarawareDesign

°MachineLanguage°MachineImplementation

°CompilerView°LogicDesigner'sView

°"ComputerArchitecture"°"ProcessorArchitecture"

"InstructionSetProcessor""ComputerOrganization"

"BuildingArchitect',"ConstructionEngineer"

“建筑設(shè)計師”“建造工程師”

功能定義與設(shè)計考慮用什么材料,如何布線等

例如,是否提供“乘法指令”是ISA設(shè)計要考慮的問題;如何實(shí)現(xiàn)乘法指令(用專門的

乘法器還是用一個加法器+移位器實(shí)現(xiàn))是組成(Organization)考慮的問題;如何布

線、用什么材料、工藝設(shè)計等是計算機(jī)實(shí)現(xiàn)技術(shù)(Technology)考慮的問題。

2010年12月28日星期.

Chapter1.38

如何計算CPI?

對于某一條特定的指令而言,其CPI是一個確定的值。但是,對于某一類指

令、或一個程序、或一臺機(jī)器而言,其CPI是一個平均值,表示該類指令或

該程序或該機(jī)器的指令集中每條指令執(zhí)行時平均需要多少時鐘周期。

假定CPIi和Ci分別為第i類指令的CPI和指令條數(shù),則程序的總時鐘數(shù)為

nn

總時鐘數(shù)CPIXc所以,CPU時間二時鐘周期CPIXc

.all..Il

I=1I=1

假定CPIi、Fi是各指令CPI和在程序中的出現(xiàn)頻率,則程序綜合CPI為:

〃C,

CPI=£CPIxFwhere耳=----------------------

z=i''InstructionCount

已知CPU時間、時鐘頻率、總時鐘數(shù)、指令條數(shù),則程序綜合CPI為:

CPI=(CPU時間X時鐘頻率)/指令條數(shù)=總時鐘周期數(shù)/指令條數(shù)

問題:指令的CPI、機(jī)器的CPI、程序的CPI各能反映哪方面的性能?

單靠CPI不能反映CPU的性能!為什么?如:單周期處理器CPI=L但性能差!

2010年12月28日星期.

Chapter1.39

Examplel

程序P在機(jī)器A上運(yùn)行需10s,機(jī)器A的時鐘頻率為400MHz。

現(xiàn)在要設(shè)計一臺機(jī)器B,希望該程序在B上運(yùn)行只需6s.

機(jī)器B時鐘頻率的提高導(dǎo)致了其CPI的增加,使得程序P在機(jī)器

B上時鐘周期數(shù)是在機(jī)器A上的1.2倍。機(jī)器B的時鐘頻率達(dá)到A

的多少倍才能使程序P在B上執(zhí)行速度是A上的10/6=1.67倍?

Answer:

CPU時間A二時鐘周期數(shù)A/時鐘頻率A

時鐘周期數(shù)A=10secx400MHz=4000M個

時鐘頻率B=時鐘周期數(shù)B/CPU時間B

=1.2x4000M/6sec=800MHz

機(jī)器B的頻率是A的兩倍,但機(jī)器B的速度并不是A的兩倍!

2010年12月28日星期.

Chapter1.40

MarketingMetrics(產(chǎn)品宣稱指標(biāo))

MIPS=InstructionCount/Timex106

=ClockRate/CPIx106

MillionInstructionsPerSecond

因?yàn)槊織l指令執(zhí)行時間不同,所以MIPS總是一個平均值。

?不同機(jī)器的指令集不同、

?程序由不同的指令混合而成J用MIPS數(shù)表示性

?指令使用的頻度動態(tài)變化能有沒有局限?

?PeakMIPS:(不實(shí)用)J

所以MIPS數(shù)不能說明性能的好壞(用下頁中的例子來說明)

MFLOPS=FPOperations/Timex106

MillionFloating-pointOperationsPerSecond

■與機(jī)器相關(guān)性大

用MFLOPS數(shù)表示

?并不是程序中花時間的部分性能也有局限!

2010年12月28日星期.

Chapter1.41

Example:MIPS數(shù)不可靠!

Assumewebuildanoptimizingcompilerfortheload/storemachine.The

compilerdiscards50%oftheALUinstructions.

1)WhatistheCPI?僅僅在軟件上進(jìn)行優(yōu)化,沒有涉及到任何硬件措施。

2)Assuminga20nsclockcycletime(50MHzclockrate).WhatistheMIPS

ratingforoptimizedcodeversusunoptimizedcode?DoestheMIPSrating

agreewiththeratingofexecutiontime?

Optimizingcompiler

OpFreaCycleNewFreq

27%

ALU43%121.5/(21.5+21+12+24)=27%

Load21%227%

21/(21.5+21+12+24)=27%

Store12%215%

Branch24%2127(21.5+21+12+24)=15%

31%

24/(21.5+21+12+24)=31%

CPI1.5750M/1.57=31.8MIPS1.73

MIPS31.850M/1.73=28.9MIPS------------28.9

結(jié)果:因?yàn)閮?yōu)化后減少了ALU指令(其他指令數(shù)沒變),所以

程序執(zhí)行時間一定減少了,但優(yōu)化后的MIPS數(shù)反而降低了。

Chapter1.42201。年12月28日星期

選擇性能評價程序(Benchmarks)

°用基準(zhǔn)程序來評測計算機(jī)的性能

?基準(zhǔn)測試程序是專門用來進(jìn)行性能評價的一組程序

?不同用戶使用的計算機(jī)用不同的基

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論