版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、計算機系統(tǒng)結(jié)構(gòu)計算機系統(tǒng)結(jié)構(gòu)主講:楊主講:楊 銳銳Email: Tel:算機科學(xué)與技術(shù)系計算機科學(xué)與技術(shù)系 東區(qū)東區(qū)FZ1392015、03 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)2作業(yè)、考核與答疑作業(yè)、考核與答疑q考試成績考試成績70%+平時成績平時成績30為最終總評成績?yōu)樽罱K總評成績q平時成績包括:作業(yè)平時成績包括:作業(yè)+考勤考勤+實驗實驗q考試為系考,閉卷考試,考試為系考,閉卷考試,范圍和題型與平時作業(yè)范圍和題型與平時作業(yè)基本相同基本相同。q答疑:每周五答疑:每周五 下午下午 5-6 FZ139q符合考試資格者才能參加期末考試符合考試資格者才能參加期末考試 計算機科學(xué)
2、與技術(shù)計算機科學(xué)與技術(shù)3課程教材課程教材鄭緯民,湯志忠,計算機系統(tǒng)結(jié)構(gòu):清華大學(xué)出版社, 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)4實驗參考教材實驗參考教材q張晨曦q計算機系統(tǒng)結(jié)構(gòu)實踐教程q 清華大學(xué)出版社 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)實驗時間安排實驗時間安排第十周第十周 周五周五第十五周第十五周 周五周五第十六周第十六周 周三周三第十六周第十六周 周五周五5 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)6參考教材參考教材 1q張晨曦 王志英等,計算機系統(tǒng)結(jié)構(gòu)教程 清華大學(xué)出版社 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)7參考教材參考教材 2qComputer Architecture - A Quantitativ
3、e Approach(第5版)q David A. Patterson, John L. HennessyComputer Architecture: A Quantitative Approach:機械工業(yè)出版社 2012 、6 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)8目錄目錄q第一章 計算機體系結(jié)構(gòu)的基本概念q第二章 指令系統(tǒng)q第三章 存儲系統(tǒng)q第四章 輸入輸出系統(tǒng)q第五章 標量處理機q第六章 向量處理機q第七章 互連網(wǎng)絡(luò)q第八章 并行處理機和多處理機中心問題:處理、存儲、輸入輸出處理、存儲、輸入輸出 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)9計算機性能的高速增長受益于計算機性能的高速增長受益于p 技術(shù)
4、的進步技術(shù)的進步 制造技術(shù)的發(fā)展制造技術(shù)的發(fā)展p 設(shè)計方法的創(chuàng)新設(shè)計方法的創(chuàng)新 體系結(jié)構(gòu)技術(shù)的發(fā)展體系結(jié)構(gòu)技術(shù)的發(fā)展 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)10從20世紀80年代以來處理器性能的增長 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)The effect of this dramatic growthq提供給計算機用戶更強大的功能。今天的高性能微處理器的處理能力高于10年前的超級計算機。11 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)The effect of this dramatic growth12PMD逐漸取代逐漸取代PC 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)q由摩爾定律預(yù)見的半導(dǎo)體性能的增長使得基于微處理
5、器的計算機在整個計算機領(lǐng)域處于主導(dǎo)地位。基于邏輯電路和門陣列的小型計算機已經(jīng)被服務(wù)器取代,而大型機和超級計算機也是有多個微處理器構(gòu)成。The effect of this dramatic growth13 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)q軟件:越來越多的程序員采用腳本編程語言The effect of this dramatic growth14 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)新應(yīng)用新應(yīng)用qGoogle goggles15 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)16q現(xiàn)在對計算技術(shù)、計算應(yīng)用和計算機市場等方面的觀點發(fā)生了巨大的改變。計算機在外觀、使用方法等方面的變化最終推動了以下細分產(chǎn)品市場的
6、形成,其中的每一個都擁有各不相同的應(yīng)用場景、需求和實現(xiàn)技術(shù)。q個人移動設(shè)備(PMD)q桌面計算機q服務(wù)器q嵌入式計算機q機群/倉儲規(guī)模計算機 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)計算機分類與特征計算機分類與特征17 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)18 / 2014. Nov 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)19理論計算峰值(理論計算峰值(Rpeak):):54,902.4TFlop/s實測數(shù)值(實測數(shù)值(Rmax):33,862.7 TFlop/s 功耗功耗:17,808kW 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)20Computer Architectureq
7、系統(tǒng)結(jié)構(gòu)設(shè)計者需要做的工作:首先獲知大量的信息,深刻的理解最新的技術(shù)和做法,從過去到現(xiàn)在系統(tǒng)的設(shè)計思想,最終是要擁有一種設(shè)計理念來和諧的構(gòu)造完整的系統(tǒng)。q和諧的系統(tǒng)?在市場和成本性能之間找到平衡點。q如何實現(xiàn)?需要大量的信息,深入理解基本概念,選擇那些已經(jīng)被驗證過且被成功實施過的技術(shù),同時掌握定量的研究方法作為基礎(chǔ)。第一章第一章 計算機系統(tǒng)結(jié)構(gòu)基本概念計算機系統(tǒng)結(jié)構(gòu)基本概念 1.1 計算機系統(tǒng)結(jié)構(gòu) 1.2 計算機系統(tǒng)的設(shè)計技術(shù) 1.3 系統(tǒng)結(jié)構(gòu)的評價標準 1.4 計算機系統(tǒng)結(jié)構(gòu)的發(fā)展1.1 計算機系統(tǒng)結(jié)構(gòu)計算機系統(tǒng)結(jié)構(gòu)1.1.1 計算機系統(tǒng)的層次結(jié)構(gòu)1.1.2 計算機系統(tǒng)結(jié)構(gòu)定義1.1.3 計
8、算機組成與實現(xiàn)1.1.4 計算機系統(tǒng)結(jié)構(gòu)的分類 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)231.1 計算機系統(tǒng)結(jié)構(gòu)計算機系統(tǒng)結(jié)構(gòu)1.1.1 計算機系統(tǒng)的層次結(jié)構(gòu) 為了更好的設(shè)計和研究計算機,通常將其分為不同的抽象層次。 可以從使用語言語言的角度出發(fā)將計算機分為層次結(jié)構(gòu)。 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)24計算機程序設(shè)計語言計算機程序設(shè)計語言q構(gòu)成元素是語句,核心是描述計算機系統(tǒng)可以理解并且能夠按照規(guī)定執(zhí)行的操作。q層次等級: 面向機器的語言 高級程序設(shè)計語言 面向應(yīng)用的語言q計算機語言是由低級向高級發(fā)展的,高一級的語言相對于低級語言,功能更強,更便于應(yīng)用,但都以低級語言為基礎(chǔ)。q可以按照語言的功能將
9、計算機系統(tǒng)劃分成若干層次。每一層都有自己的編程語言。 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)25電電 子子 線線 路路微程序機器級微程序機器級從計算機程序設(shè)計語言的角度來看的計算機系統(tǒng)從計算機程序設(shè)計語言的角度來看的計算機系統(tǒng)層次結(jié)構(gòu)層次結(jié)構(gòu)是實現(xiàn)機器指定是實現(xiàn)機器指定功能的中央控制功能的中央控制部分,語言是微部分,語言是微指令集,實現(xiàn)計指令集,實現(xiàn)計算機指令集中的算機指令集中的每一條指令的功每一條指令的功能。用微指令編能。用微指令編寫的微程序一般寫的微程序一般是直接由硬件解是直接由硬件解釋實現(xiàn)的。釋實現(xiàn)的。 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)26電電 子子 線線 路路微程序機器級微程序機器級傳傳 統(tǒng)
10、統(tǒng) 機機 器器 級級 解釋解釋從計算機程序設(shè)計語言的角度來看的計算機系統(tǒng)從計算機程序設(shè)計語言的角度來看的計算機系統(tǒng)層次結(jié)構(gòu)層次結(jié)構(gòu)這一級的機器語這一級的機器語言是該機的指令言是該機的指令集,程序員用機集,程序員用機器指令編寫的程器指令編寫的程序由微程序解釋序由微程序解釋執(zhí)行。執(zhí)行。 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)27電電 子子 線線 路路微程序機器級微程序機器級傳傳 統(tǒng)統(tǒng) 機機 器器 級級 解釋解釋操操 作作 系系 統(tǒng)統(tǒng) 級級解釋解釋從計算機程序設(shè)計語言的角度來看的計算機系統(tǒng)從計算機程序設(shè)計語言的角度來看的計算機系統(tǒng)層次結(jié)構(gòu)層次結(jié)構(gòu)本級的機器語言本級的機器語言中多數(shù)指令是傳中多數(shù)指令是傳統(tǒng)機
11、器指令,如統(tǒng)機器指令,如算術(shù)運算、邏輯算術(shù)運算、邏輯運算、位移指令運算、位移指令等。同時本級還等。同時本級還提供操作系統(tǒng)指提供操作系統(tǒng)指令,如打開文件令,如打開文件讀寫文件等。讀寫文件等。 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)28軟硬件界面軟硬件界面 電電 子子 線線 路路微程序機器級微程序機器級傳傳 統(tǒng)統(tǒng) 機機 器器 級級 解釋解釋操操 作作 系系 統(tǒng)統(tǒng) 級級解釋解釋匯匯 編編 語語 言言 級級 翻譯翻譯( (匯編程序匯編程序) ) 從計算機程序設(shè)計語言的角度來看的計算機系統(tǒng)從計算機程序設(shè)計語言的角度來看的計算機系統(tǒng)層次結(jié)構(gòu)層次結(jié)構(gòu)這級的機器這級的機器語言是匯編語言是匯編語言。匯編語言。匯編語言
12、編寫的語言編寫的程序首先被程序首先被翻譯成第翻譯成第3級或者第級或者第2級的語言,級的語言,再由相應(yīng)的再由相應(yīng)的機器進行解機器進行解釋。釋。 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)29軟硬件軟硬件界面界面 電電 子子 線線 路路微程序機器級微程序機器級傳傳 統(tǒng)統(tǒng) 機機 器器 級級 解釋解釋操操 作作 系系 統(tǒng)統(tǒng) 級級解釋解釋匯匯 編編 語語 言言 級級 翻譯翻譯( (匯編程序匯編程序) ) 高高 級級 語語 言言 級級翻譯翻譯( (編譯程序編譯程序) )從計算機程序設(shè)計語言的角度來看的計算機系統(tǒng)從計算機程序設(shè)計語言的角度來看的計算機系統(tǒng)層次結(jié)構(gòu)層次結(jié)構(gòu)這級的機器這級的機器語言是高級語言是高級語言。本
13、級語言。本級語言編寫的語言編寫的程序由編譯程序由編譯器翻譯到第器翻譯到第4級或者第級或者第3級語言。個級語言。個別高級語言別高級語言采用解釋方采用解釋方式執(zhí)行。式執(zhí)行。 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)30應(yīng)應(yīng) 用用 語語 言言 級級 應(yīng)用軟件應(yīng)用軟件 系統(tǒng)軟件系統(tǒng)軟件 軟硬件界面軟硬件界面 物理機物理機虛擬機虛擬機電電 子子 線線 路路微程序機器級微程序機器級傳傳 統(tǒng)統(tǒng) 機機 器器 級級 解釋解釋操操 作作 系系 統(tǒng)統(tǒng) 級級解釋解釋匯匯 編編 語語 言言 級級 翻譯翻譯( (匯編程序匯編程序) ) 高高 級級 語語 言言 級級翻譯翻譯( (編譯程序編譯程序) )翻譯翻譯( (應(yīng)用程序包應(yīng)用程
14、序包) )從計算機程序設(shè)計語言的角度來看的計算機系統(tǒng)從計算機程序設(shè)計語言的角度來看的計算機系統(tǒng)層次結(jié)構(gòu)層次結(jié)構(gòu) 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)31Translation & Interpretationq各機器級的實現(xiàn)主要靠解釋和翻譯或者兩者的結(jié)合來實現(xiàn)的。q翻譯和解釋是語言實現(xiàn)的兩種基本技術(shù)。它們均是以執(zhí)行一段N級的指令來實現(xiàn)N+1級的指令。 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)32Translation & Interpretationq翻譯:想把N+1級程序全部變換成N級程序后再去執(zhí)行新產(chǎn)生的N級程序,在執(zhí)行過程中N+1級程序不再被訪問。q解釋:每當一條N+1級的指令被譯碼
15、后,就執(zhí)行一串等效的N級指令,然后再去取下一條N+1級指令,依此重復(fù)執(zhí)行。q解釋執(zhí)行慢,翻譯執(zhí)行快,解釋方式占用存儲空間少,翻譯方式占用存儲空間多。 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)33虛擬機虛擬機軟硬件界面軟硬件界面 電電 子子 線線 路路微程序機器級微程序機器級傳傳 統(tǒng)統(tǒng) 機機 器器 級級 解釋解釋操操 作作 系系 統(tǒng)統(tǒng) 級級解釋解釋匯匯 編編 語語 言言 級級 翻譯翻譯( (匯編程序匯編程序) ) 高高 級級 語語 言言 級級翻譯翻譯( (編譯程序編譯程序) )傳統(tǒng)機器級以上傳統(tǒng)機器級以上的所有機器都稱的所有機器都稱為虛擬機為虛擬機,它們,它們是由軟件實現(xiàn)的是由軟件實現(xiàn)的機器。機器。最底
16、層由硬件最底層由硬件/固固件實現(xiàn),稱為物件實現(xiàn),稱為物理機。理機。虛擬機也可以由虛擬機也可以由硬件硬件/固件實現(xiàn)。固件實現(xiàn)。 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)34計算機系統(tǒng)的層次結(jié)構(gòu)計算機系統(tǒng)的層次結(jié)構(gòu)q從不同的角度看到的計算機系統(tǒng)的屬性是不同的。q對計算機的認識通常只需要在某一個層次。q硬件設(shè)計人員、系統(tǒng)程序員、應(yīng)用程序員。 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)35透明性透明性q概念:本來存在的事物或特性從某個角度看去好像不存在。這里指使用者可以不了解的知識。q如:浮點數(shù)表示、乘法指令如:浮點數(shù)表示、乘法指令 對高級語言程序員、應(yīng)用程序員來講,是透明的;對高級語言程序員、應(yīng)用程序員來講,是透明的
17、; 對匯編語言程序程序員、機器語言程序員來講,是不對匯編語言程序程序員、機器語言程序員來講,是不透明的。透明的。q如:微程序如:微程序 對匯編語言程序員,機器語言程序員來講,是透明的;對匯編語言程序員,機器語言程序員來講,是透明的; 對硬件設(shè)計者,計算機維護人員來講,是不透明的。對硬件設(shè)計者,計算機維護人員來講,是不透明的。 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)361.1.2 計算機系統(tǒng)結(jié)構(gòu)的定義計算機系統(tǒng)結(jié)構(gòu)的定義qComputer Architectureq“計算機系統(tǒng)結(jié)構(gòu)是程序員所看到的屬性,即概念計算機系統(tǒng)結(jié)構(gòu)是程序員所看到的屬性,即概念性結(jié)構(gòu)和功能性特性性結(jié)構(gòu)和功能性特性”C.M.Amd
18、ahlqAmdahl提出的計算機系統(tǒng)結(jié)構(gòu)是提出的計算機系統(tǒng)結(jié)構(gòu)是機器語言程序機器語言程序員員所能看到的計算機屬性。所能看到的計算機屬性。編寫出能在機器上正編寫出能在機器上正確運行的程序所必須了解到確運行的程序所必須了解到的的。q實質(zhì):計算機系統(tǒng)中軟硬界面的確定,即指令集實質(zhì):計算機系統(tǒng)中軟硬界面的確定,即指令集系統(tǒng)(系統(tǒng)(ISA)的設(shè)計。)的設(shè)計。界面之上是軟件實現(xiàn)的功能,界面之下是硬件和固件實現(xiàn)的功能。 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù) 數(shù)據(jù)表示:數(shù)據(jù)表示:硬件能夠直接認別和處理的數(shù)據(jù)類型硬件能夠直接認別和處理的數(shù)據(jù)類型 尋址技術(shù):尋址技術(shù):編址方式、尋址方式和定位方式等編址方式、尋址方式和
19、定位方式等 寄存器組織:寄存器組織:操作數(shù)寄存器、變址寄存器、控制寄存操作數(shù)寄存器、變址寄存器、控制寄存 器及專用寄存器的定義、數(shù)量和使用規(guī)則等器及專用寄存器的定義、數(shù)量和使用規(guī)則等 指令系統(tǒng):指令系統(tǒng):操作類型、格式,指令間的排序控制等操作類型、格式,指令間的排序控制等 中斷系統(tǒng):中斷系統(tǒng):中斷類型、中斷級別和中斷響應(yīng)方式等中斷類型、中斷級別和中斷響應(yīng)方式等 存儲系統(tǒng):存儲系統(tǒng):尋址空間、虛擬存儲器、尋址空間、虛擬存儲器、CacheCache存儲器等存儲器等 處理機工作狀態(tài):處理機工作狀態(tài):定義和切換方式,如管態(tài)和目態(tài)等定義和切換方式,如管態(tài)和目態(tài)等 輸入輸出系統(tǒng):輸入輸出系統(tǒng):數(shù)據(jù)交換方式
20、、交換過程的控制等數(shù)據(jù)交換方式、交換過程的控制等 信息保護:信息保護:信息保護方式和硬件對信息保護的支持等信息保護方式和硬件對信息保護的支持等。功能特性功能特性 指令系統(tǒng)及其執(zhí)行模式指令系統(tǒng)及其執(zhí)行模式 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)對系統(tǒng)結(jié)構(gòu)設(shè)計者提出的要求對系統(tǒng)結(jié)構(gòu)設(shè)計者提出的要求q計算機設(shè)計者面臨的是一項復(fù)雜的工作:首先確定一個新機器所必須具備的特性,然后設(shè)計出具有最佳處理性能的機器同時兼具低價位和低功耗的特性。要完成這個任務(wù)必須兼顧多方面:包括指令系統(tǒng)設(shè)計、功能組織、邏輯設(shè)計和物理實現(xiàn)。物理實現(xiàn)是必須面對集成電路設(shè)計、存儲、功耗和冷卻等問題。要優(yōu)化設(shè)計就需要關(guān)注更多技術(shù),例如編譯器、
21、操作系統(tǒng)等。38 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)39q經(jīng)典計算機系統(tǒng)結(jié)構(gòu)概念認為:計算機系統(tǒng)結(jié)構(gòu)就是指令集的設(shè)計。q廣義的系統(tǒng)結(jié)構(gòu)定義廣義的系統(tǒng)結(jié)構(gòu)定義:ISA的設(shè)計、計算機組成(Computer Organization) 、計算機硬件實現(xiàn)(Computer Implementation) 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)401.1.3 計算機組成與實現(xiàn)計算機組成與實現(xiàn)q計算機組成:計算機組成:計算機組成是計算機系統(tǒng)結(jié)構(gòu)的邏計算機組成是計算機系統(tǒng)結(jié)構(gòu)的邏輯實現(xiàn),包括機器內(nèi)部的數(shù)據(jù)流的組成以及邏輯輯實現(xiàn),包括機器內(nèi)部的數(shù)據(jù)流的組成以及邏輯設(shè)計等。設(shè)計等。q涵蓋了計算機設(shè)計的更高層次,例如存儲
22、系統(tǒng)、涵蓋了計算機設(shè)計的更高層次,例如存儲系統(tǒng)、存儲器互連以及內(nèi)部處理器或者存儲器互連以及內(nèi)部處理器或者CPU的設(shè)計。的設(shè)計。q計算機實現(xiàn):計算機實現(xiàn):是指計算機組成的物理實現(xiàn)。包括是指計算機組成的物理實現(xiàn)。包括具體的邏輯電路設(shè)計和封裝技術(shù)。具體的邏輯電路設(shè)計和封裝技術(shù)。q同一系列的計算機通常擁有相同的指令集系統(tǒng)和同一系列的計算機通常擁有相同的指令集系統(tǒng)和相同的組成,但是具體的硬件實現(xiàn)卻不相同。相同的組成,但是具體的硬件實現(xiàn)卻不相同。 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)411.1.3 計算機組成與實現(xiàn)計算機組成與實現(xiàn)q例如:例如:AMD Opteron64和和Intel Pentium 4 擁有
23、擁有相同的指令集系統(tǒng)結(jié)構(gòu),兩者都執(zhí)行相同的指令集系統(tǒng)結(jié)構(gòu),兩者都執(zhí)行X86系統(tǒng),系統(tǒng),但是內(nèi)部的設(shè)計確是采用不同的流水線和但是內(nèi)部的設(shè)計確是采用不同的流水線和Cache結(jié)構(gòu)。也就是結(jié)構(gòu)。也就是相同的系統(tǒng)結(jié)構(gòu)卻組成不同相同的系統(tǒng)結(jié)構(gòu)卻組成不同。q例如:例如:Pentium4和和Pentium M,兩者的設(shè)計幾乎,兩者的設(shè)計幾乎相同,但是提供不同的時鐘頻率和存儲系統(tǒng),這相同,但是提供不同的時鐘頻率和存儲系統(tǒng),這樣樣Pentium M更適用于筆記本電腦。從而可知更適用于筆記本電腦。從而可知相相同的組成可以采用不同的實現(xiàn)同的組成可以采用不同的實現(xiàn)。 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)421.1.4 計算
24、機系統(tǒng)結(jié)構(gòu)的分類計算機系統(tǒng)結(jié)構(gòu)的分類qFlynn分法:1966,by Michael FlynnqSISD-Single Instruction Stream Single Data StreamqSIMD- Single Instruction Stream Multiple Data StreamqMISD- Multiple Instruction Stream Single Data StreamqMIMD- Multiple Instruction Stream Multiple Data Stream 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)43指令流與數(shù)據(jù)流指令流與數(shù)據(jù)流q指令流:機器執(zhí)
25、行的指令序列。q數(shù)據(jù)流:由指令調(diào)用的數(shù)據(jù)序列。 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)441.1.4 計算機系統(tǒng)結(jié)構(gòu)的分類計算機系統(tǒng)結(jié)構(gòu)的分類q關(guān)鍵點:數(shù)據(jù)或者處理是否有并行使用。例如計算機是否有多個獨立的處理器?每個處理器是否都運行不同的程序?是否單個程序作用到多個數(shù)據(jù)上? 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)45CU:控制部件PU:處理部件MM:存儲器模塊IS:指令流DS:數(shù)據(jù)流單指令流單數(shù)據(jù)流SISDCUPUMMISDSISSISD 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)46單指令流多數(shù)據(jù)流SIMDCUPU1PU2PUnISMM1MM2MMnDS1DS2DSnMISD 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)4
26、7應(yīng)用舉例:向量處理器、圖形處理器應(yīng)用舉例:向量處理器、圖形處理器q將一個有N個元素的向量V進行規(guī)格化,規(guī)格化要求向量中的每個元素都乘一個浮點數(shù)Q。qSISD結(jié)構(gòu)實現(xiàn)算法:qSIMD結(jié)構(gòu)實現(xiàn)算法: V VQq底層系統(tǒng)包含了并行操作的多個操作的硬件部件,并且確定了用于向量操作的向量指令。for i from 1 to N V i V i Q 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)48多指令流單數(shù)據(jù)流MISDCU1CU2CUnPU1PU1PU1MM1MM2MMnIS1IS2ISnIS1IS2ISnDSDSMISD 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)49多指令流多數(shù)據(jù)流MIMDMM1MM2MMnCU1CU2
27、CUnPU1PU1PU1DS1DS2DSnIS1IS2ISnIS1IS2ISn 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)q馮氏分類法馮氏分類法m用系統(tǒng)的最大并行度對計算機進行分類。qHandler分類法m根據(jù)并行度和流水線對計算機進行分類。501.2 計算機系統(tǒng)設(shè)計技術(shù)計算機系統(tǒng)設(shè)計技術(shù)1.2.1 計算機系統(tǒng)設(shè)計的定量原理1.2.2 計算機系統(tǒng)設(shè)計者的主要任務(wù)1.2.3 計算機系統(tǒng)設(shè)計的主要方法 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)521.2.1 計算機系統(tǒng)設(shè)計的定量原理計算機系統(tǒng)設(shè)計的定量原理1 加快經(jīng)常性事件的速度 這是最重要也是最廣泛采用的計算機設(shè)計準則。當設(shè)計上需要有取舍時,優(yōu)先考慮經(jīng)常性事件。
28、計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)53q例如:學(xué)生的生活費:吃飯每日10元,共365日,每年看電影10次,每次20元。為減少開支,采用如下兩方法:q方法1:減少了20吃飯開銷,為每日8元。共節(jié)省:2365730元。q減少了80看電影開銷,將每年看電影次數(shù)為2。共節(jié)省: 820160元q原因:吃飯每年3650元:看電影每年200元。計算機設(shè)計也用到同樣的原理:計算機設(shè)計也用到同樣的原理: 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)54經(jīng)常性事件常和應(yīng)用有關(guān)。例: 事務(wù)處理 I/O 處理 圖象處理、科學(xué)計算 處理器、內(nèi)存的速度優(yōu)化經(jīng)常性事件后對整體性能提高的貢獻大小。有Amdahl定律來解決1、什么是經(jīng)常性事
29、件、什么是經(jīng)常性事件Key points:2、量化、量化 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)552 Amdahl定律定律AmdahlAmdahl定律:定律:系統(tǒng)中某一部件由于采用某種更快系統(tǒng)中某一部件由于采用某種更快的執(zhí)行方式后整個系統(tǒng)性能的提高與這種執(zhí)行方的執(zhí)行方式后整個系統(tǒng)性能的提高與這種執(zhí)行方式的使用頻率或占用總執(zhí)行時間的比例有關(guān)。式的使用頻率或占用總執(zhí)行時間的比例有關(guān)。1改進后的性能改進前的時間(To)加速比(Sn)改進前的性能改進后的時間(Tn) 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)56AmdahlAmdahl定律的分析:加速比和如下幾個因素有關(guān)定律的分析:加速比和如下幾個因素有關(guān)(1 1
30、). . 在原有的計算機上,能被改進并增強的部分在在原有的計算機上,能被改進并增強的部分在總執(zhí)行時間中所占的比例總執(zhí)行時間中所占的比例 反映了是否反映了是否“經(jīng)常經(jīng)常”發(fā)生發(fā)生定義定義A1ToFe 可改進部分占用的時間改進前整個任務(wù)的執(zhí)行時間其中:其中:FeFe 被改進部分原執(zhí)行時間占原來總時間的被改進部分原執(zhí)行時間占原來總時間的百分比。百分比。 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)57(2 2). .改進部分采用改進措施后比沒有采用改進措施前性改進部分采用改進措施后比沒有采用改進措施前性能的提高倍數(shù)能的提高倍數(shù) 反映了加快的反映了加快的“程度程度”定義定義A1BSe 改進前改進部分的執(zhí)行時間改進
31、后改進部分的執(zhí)行時間其中:其中:SeSe 被改進部分的局部加速比。被改進部分的局部加速比。 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)58可用如下方式表示:可用如下方式表示:ToToA AC CB BTnTn其中:其中: Sn Sn 全局加速比全局加速比 A A 可改進部分可改進部分 B B 改進后剩余的部分改進后剩余的部分 C C 不可改進的部分不可改進的部分 To To 原執(zhí)行時間(原執(zhí)行時間(T oldT old) Tn Tn 改進后的執(zhí)行時間(改進后的執(zhí)行時間(T newT new) 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)59(1)1( 1) )(1o eenooo eoo eoeeeeooneeno
32、eeeeT FFATTA B TT FTT FTFSSSTTSFFTTFFSS 改進之后由于其中部分操作加快,總時間降為:根據(jù)加速比定義,有:則則: : 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)60分析分析0(1)ooeoeC TA TT FTF因為不可改進因為不可改進部分部分所以所以1eF反應(yīng)了不可改變部分所占的時間反應(yīng)了不可改變部分所占的時間當當0111eeononFFCTTTS 則性能的提高幅度受到改進部分所占比例限制則性能的提高幅度受到改進部分所占比例限制故性能改善的極限受故性能改善的極限受eFifif11eneSSF 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)61解:解:依依 AmdahlAmdahl
33、定律公式,已知:定律公式,已知:Fe=0.4Fe=0.4,Se=10Se=10,求求SnSn。它說明局部(它說明局部(40%40%)的大幅度改進()的大幅度改進(1010倍)倍)對全局的作用要小得多(對全局的作用要小得多(1.561.56倍)。倍)。111.560.40.6410.410nS 例例1.11.1:假設(shè)將某系統(tǒng)的某一部件的處理速度加快到:假設(shè)將某系統(tǒng)的某一部件的處理速度加快到1010倍,倍, 但該部件的原處理時間僅為整個運行時間的但該部件的原處理時間僅為整個運行時間的4040, 則采用加快措施后能使整個系統(tǒng)的性能提高多少?則采用加快措施后能使整個系統(tǒng)的性能提高多少? 計算機科學(xué)與技
34、術(shù)計算機科學(xué)與技術(shù)62AmdahlAmdahl定律的圖形定律的圖形從下圖可以看出,增大從下圖可以看出,增大SeSe和和FeFe對對SnSn都有提升作用;但當都有提升作用;但當FeFe固定時,一味增大固定時,一味增大SeSe對對SnSn的作用會越來越不顯著。的作用會越來越不顯著。 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)63例例1.2:求平方根是圖形處理器中經(jīng)常用到的一種:求平方根是圖形處理器中經(jīng)常用到的一種轉(zhuǎn)換,求浮點數(shù)(轉(zhuǎn)換,求浮點數(shù)(FP)平方根的不同實現(xiàn)方法在)平方根的不同實現(xiàn)方法在性能上可能有很大的差異,特別是這種差異在為圖性能上可能有很大的差異,特別是這種差異在為圖形專門設(shè)計的處理器中更加明
35、顯。假設(shè)求浮點數(shù)平形專門設(shè)計的處理器中更加明顯。假設(shè)求浮點數(shù)平方根(方根(FPSQR)在某臺機器上的一個基準測試程)在某臺機器上的一個基準測試程序中占總執(zhí)行時間的序中占總執(zhí)行時間的20%。一種實現(xiàn)方法是采用專。一種實現(xiàn)方法是采用專門的門的FPSQR硬件,使硬件,使FPSQR操作的速度提高到原操作的速度提高到原來的來的10倍。另一種實現(xiàn)方法提高所有浮點數(shù)運算指倍。另一種實現(xiàn)方法提高所有浮點數(shù)運算指令(令(FP)的執(zhí)行速度,)的執(zhí)行速度,F(xiàn)P指令在總執(zhí)行時間中占指令在總執(zhí)行時間中占50%,設(shè)計小組認為可以將所有的,設(shè)計小組認為可以將所有的FP指令執(zhí)行速指令執(zhí)行速度提高到原來的度提高到原來的2倍。請
36、比較這兩種設(shè)計方案。倍。請比較這兩種設(shè)計方案。 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)64解解:已知方案已知方案1 :Fe1=0.2,Se1=10,求求Sn1; 已知方案已知方案2 :Fe2=0.5,Se2=2,求求Sn2 。 采用采用FPSQR方案時方案時 采用采用FP方案時方案時它說明大范圍的小幅度改進(方案它說明大范圍的小幅度改進(方案2 2)效果可能更好。)效果可能更好。21 0.210nS 111.330.50.751 0.52nS 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)653 CPU性能公式性能公式qCPU時間:一個程序所花的CPU時間,指CPU的執(zhí)行時間,不包括I/O
37、的等待時間。q時鐘周期:由于計算機的時鐘速度是固定的,它的運行周期稱為時鐘周期。CPUCPU CPU時間 時鐘周期數(shù) 時鐘周期長時鐘周期數(shù) 頻率 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)66CPI與程序執(zhí)行時間與程序執(zhí)行時間Te定義:定義: CPI(Cycle Per instruction):每條指令執(zhí)行時所花費的):每條指令執(zhí)行時所花費的 平均時鐘周期數(shù)。平均時鐘周期數(shù)。CPI CPI CPUCPU時鐘周期數(shù)時鐘周期數(shù) / IC/ ICCPUCPU時鐘周期數(shù)時鐘周期數(shù) CPICPIICIC則則 CPUCPU時間時間 (CPICPIICIC)/ / 頻率頻率 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)67分析
38、:分析:CPU的性能由的性能由CPI、IC、頻率頻率三方面決定三方面決定f f: 取決于硬件技術(shù)和組織取決于硬件技術(shù)和組織CPICPI:取決于系統(tǒng)結(jié)構(gòu)和指令集,反映了取決于系統(tǒng)結(jié)構(gòu)和指令集,反映了CPUCPU的結(jié)構(gòu)性能。的結(jié)構(gòu)性能。ICIC: 取決于系統(tǒng)的指令集和編譯技術(shù)取決于系統(tǒng)的指令集和編譯技術(shù)舉例:舉例:80888088 CPI CPI202080486 CPI80486 CPI2 2Pentium CPIPentium CPI1 1PII CPIPII CPI0.30.3這三個因素對這三個因素對CPU的影響是相同的,但無法孤立的改變一個的影響是相同的,但無法孤立的改變一個參數(shù),改變各因
39、素的技術(shù)是相互關(guān)聯(lián)的:參數(shù),改變各因素的技術(shù)是相互關(guān)聯(lián)的: 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)68CPI是衡量是衡量CPU執(zhí)行指令效率的重要指標。讓我們先考慮執(zhí)行指令效率的重要指標。讓我們先考慮一個標準測速程序的一個標準測速程序的全部執(zhí)行時間全部執(zhí)行時間Te和其中所有和其中所有第第i種指種指令的累計時間令的累計時間Ti,易知:,易知:fICCPITe/ )(fICiCPIiTi/ )(niICiIC1其中:其中:又有:又有:fICiCPIifICiCPIiTiTeninini/ ) )(/ )(111 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)69總總CPI為所有為所有CPI的加權(quán)平均值的加權(quán)平均值)(1
40、niICiCPIiICCPI或可寫為:或可寫為:niCPIiICICiCPI1)( 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)70例:例:對于剛才的例子,假設(shè)我們有如下的測量:FP指令的操作比例=25%FP指令的平均CPI=4.0其他指令的平均CPI=1.33FPSQR指令的操作比例=2%FPSQR指令的CPI=20q假定有兩種備選的設(shè)計方案,一種是把FP 的CPI減到2。另一種是把所有FPSQR的CPI減到2.用處理器性能公式比較兩種方案哪種更好一些。 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)71q不論用哪種方法,只有CPI發(fā)生了變化,時鐘頻率和操作比例保持不變。所以只要計算兩種方案的系統(tǒng)CPI就可以。 計算
41、機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)72方法方法1CPIoriginal=40.25+1.330.75=2方案1:CPInew=20.25+1.330.75=1.5方案2:CPInew=(2-200.02)+20.02=1.64Sn1=2/1.5=1.33 Sn2=2/1.64=1.22可見:方案1優(yōu)于方案2 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)73方法方法2FP方案:CPInew =2-0.25(CPIfp-CPInew fp) =2-0.25(4-2)=1.5FPSQR方案:CPInew =2-0.02(CPIFPSQR-CPInew FPSQR) =2-0.02(20-2)=1.64Sn1=2/1.
42、5=1.33 Sn2=2/1.64=1.22 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)74FP方案:方案:CPUoriginal=CPUfp+CPU非FP CPUnew=CPUnew fp+CPU非FP 所以:CPUoriginal-CPUfp= CPUnew-CPUnew fpICTCPIorigina -ICfpTCPIfp=ICTCPInew -ICfpTCPInew fp CPIorigina -0.4CPIfp=CPInew -0.4CPInew fpCPInew = CPIoriginal -0.4(CPIfp-CPInew fp) 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)75補充:補充:q在處理
43、器性能公式中,經(jīng)常可以測量其中的某個分量,這是比Amdahl定律優(yōu)越的地方。一般很難直接測量某種指令的執(zhí)行時間在總執(zhí)行時間中所占的比例。如果是通過指令的執(zhí)行次數(shù)和CPI來計算CPU的性能則更加方便。 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)764 訪問的局部性原理訪問的局部性原理q程序經(jīng)常會重復(fù)使用它最近使用過的指令和數(shù)據(jù)。即:程序花費90%的時間來執(zhí)行10%的代碼。q程序的時間局部性程序的時間局部性:最近訪問過的內(nèi)容很可能即將被再次使用;q程序的空間局部性程序的空間局部性:地址臨近的內(nèi)容可能在一定時間內(nèi)被連續(xù)使用。 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)774 訪問的局部性原理訪問的局部性原理q實質(zhì):可以
44、根據(jù)最近使用過的指令和數(shù)據(jù)在一定的誤差范圍內(nèi)合理的預(yù)測將要用到的指令和數(shù)據(jù)。局部性原理在指令存取中效果比數(shù)據(jù)存取明顯,是是系統(tǒng)結(jié)構(gòu)設(shè)計的基礎(chǔ)之一。是存儲系統(tǒng)設(shè)計的系統(tǒng)結(jié)構(gòu)設(shè)計的基礎(chǔ)之一。是存儲系統(tǒng)設(shè)計的基本原理基本原理。 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)781.1.2 計算機系統(tǒng)設(shè)計者的主要任務(wù)計算機系統(tǒng)設(shè)計者的主要任務(wù)q計算機系統(tǒng)結(jié)構(gòu)的設(shè)計者必須設(shè)計能滿足包括價格、供電、性能和可用性指標的計算機。 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)791.1.2 計算機系統(tǒng)設(shè)計者的主要任務(wù)計算機系統(tǒng)設(shè)計者的主要任務(wù)首要任務(wù):明確功能需求,包括使用適應(yīng)市場需求的特定功能。明確如何使用機器,應(yīng)用軟件通常決定了對特
45、定功能要求的選擇。如果市場上已有大量為某一指令集系統(tǒng)結(jié)構(gòu)設(shè)計的軟件,系統(tǒng)結(jié)構(gòu)設(shè)計者就應(yīng)考慮在新的機器中與這一指令系統(tǒng)兼容。如果對某一特定應(yīng)用軟件的市場需求非常大,設(shè)計者也可能會在新計算機中引入某些支持這些軟件的功能特性,以增強新計算機在市場中的競爭力。系統(tǒng)結(jié)構(gòu)的設(shè)計者還應(yīng)關(guān)注實現(xiàn)技術(shù)和計算機應(yīng)用方面的重要發(fā)展趨勢,這不僅影響到機器未來的成本,也影響到所設(shè)計系統(tǒng)的生存周期。 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)801.2.3 計算機系統(tǒng)設(shè)計的主要方法計算機系統(tǒng)設(shè)計的主要方法 1 “由下往上由下往上”(bottom-up)設(shè)計設(shè)計 2 “由上往下由上往下”(top-down)設(shè)計設(shè)計 3 “由中間開始
46、由中間開始”(middle-out)設(shè)計)設(shè)計1.3 系統(tǒng)結(jié)構(gòu)的評價標準系統(tǒng)結(jié)構(gòu)的評價標準1.3.1 性能1.3.2 成本 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)82衡量機器性能的唯一可靠的標準就是真正的執(zhí)行程序的時間衡量機器性能的唯一可靠的標準就是真正的執(zhí)行程序的時間可以用可以用MIPSMIPS來作為衡量程序執(zhí)行時間的一個指標:來作為衡量程序執(zhí)行時間的一個指標:MIPSMIPS: million instructions per second million instructions per second 每秒百萬每秒百萬條指令數(shù)條指令數(shù) 1 性能性能661010CPIfTeICMIPS例子:例子
47、: PentiumIV 2GHz的的CPICPI0.250.25,計算該處理機的運算,計算該處理機的運算速度。速度。解:解: 已知已知 CPI CPI 0.250.25,f = 2GHzf = 2GHz MIPS = f/CPIMIPS = f/CPI10106 6 = 2 = 210109 9/0.25/0.2510106 6 = 8000MIPS = 8000MIPS 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)83MIPS作為性能指標作為性能指標 主要優(yōu)點:主要優(yōu)點:直觀、方便。直觀、方便。目前還經(jīng)常使用目前還經(jīng)常使用 主要缺點主要缺點: (1) 不同指令的執(zhí)行速度差別很大不同指令的執(zhí)行速度差別很大
48、 (2) 指令使用頻度差別很大指令使用頻度差別很大 (3) 有相當多的非功能性指令有相當多的非功能性指令 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)84MFLOPS 6程序中的浮點操作次數(shù),主要用于向量計算機執(zhí)行時間 10。MFLOPS:Million Floating Operation Per Second 每秒百萬次浮點操作次數(shù)每秒百萬次浮點操作次數(shù)分析:分析: MFLOPSMFLOPS只能用來衡量機器浮點操作的性能,而不能體現(xiàn)只能用來衡量機器浮點操作的性能,而不能體現(xiàn) 機器的總體性能。機器的總體性能。優(yōu)點:優(yōu)點:基于操作而非指令,可以用來比較兩種不同的機器。基于操作而非指令,可以用來比較兩種不同
49、的機器。缺點:缺點:不同的機器上浮點運算集不同;依賴不同的機器上浮點運算集不同;依賴 于操作類型;單個程序的值并不能反映機器的性能。于操作類型;單個程序的值并不能反映機器的性能。 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)85測量、報告和總結(jié)計算機的性能測量、報告和總結(jié)計算機的性能q因為計算機設(shè)計用來實施各種任務(wù),沒有一種系統(tǒng)結(jié)構(gòu)可以對所有的任務(wù)都最適宜,所以一個系統(tǒng)的性能要看所實施的任務(wù)而定。q不同的使用者關(guān)注的指標也有不同。 從用戶的角度看計算機的“快”: 響應(yīng)時間響應(yīng)時間(response time)短短 從系統(tǒng)管理員的角度看計算機的“快”: 吞吐率吞吐率(throughout)高高 計算機科學(xué)與
50、技術(shù)計算機科學(xué)與技術(shù)86性能的測量性能的測量q任何不以時間做標準或不用實際程序進行測試的方法都會產(chǎn)生誤導(dǎo),甚至導(dǎo)致計算機設(shè)計的失誤。q響應(yīng)時間:完成一個任務(wù)的全部時間,包括磁盤訪問時間、存儲器訪問時間、I/O操作時間,操作系統(tǒng)開銷等。當多個程序同時執(zhí)行時,一個程序等待I/O操作完成時處理器會轉(zhuǎn)而執(zhí)行另一個程序。這會影響單個程序從開始執(zhí)行到結(jié)束的時間。qCPU時間:CPU計算耗用的時間,不包括等待I/O操作完成或運行其他程序的時間。不同于用戶感受到的響應(yīng)時間。 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)q經(jīng)常使用相同程序的用戶最有資格對一臺新機器的性能進行評估。為了測試新系統(tǒng)的性能,只要比較相同負載的執(zhí)行
51、時間。q大多數(shù)情況下,用戶必須依靠測評程序來評價機器的性能。87 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)88基準測試程序集基準測試程序集(Benchmarks suites)q通常將基準測試程序集中起來(基準測試程序集)來測試處理器的性能?;鶞蕼y試程序集由各種不同的真實應(yīng)用程序構(gòu)成,能比較全面地反映計算機在各個方面的處理性能。qStandard Performance Evaluation CorporationSPEC,20世紀80年代為了評估工作站性能而推出的,是目前最成功的基準測試程序集之一。SPEC機器衍生的基準測試程序集覆蓋了各種不同的應(yīng)用領(lǐng)域。 計算機科學(xué)與技術(shù)
52、計算機科學(xué)與技術(shù)89基準測試程序基準測試程序SPEC提出一系列用來比較性能的標準基準測試程序,每個基準程序由一組程序組成,運行這些程序,對系統(tǒng)性能進行測量。得分為SPEC Marks,被業(yè)界作為對計算機系統(tǒng)性能做的獨立于廠家的測試。桌面計算機的基準測試程序:處理器性能測試程序圖形性能測試程序 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)90基準測試程序基準測試程序服務(wù)器基準測試程序:SPECSFS:用于NFS(網(wǎng)絡(luò)文件系統(tǒng))文件服務(wù)器的測試程序。它不僅測試處理器的性能,而且測試I/O系統(tǒng)的性能。重點測試吞吐率。SPECWeb:Web服務(wù)器測試程序。模擬多個客戶請求訪問服務(wù)器中的動態(tài)和靜態(tài)頁面以及向服務(wù)器上
53、傳數(shù)據(jù)的情況。SPECviewperf:用于測試圖形系統(tǒng)支持OpenGL庫的性能。SPECapc:用于測試圖形密集型應(yīng)用的性能。 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)91性能評價報告總結(jié)性能評價報告總結(jié)q一旦選擇一套基準測試程序集來測試機器性能,就可以用數(shù)字總結(jié)這套基準測試程序集的性能測試結(jié)果。q為每個基準測試程序加上一個權(quán)值,然后使用加權(quán)算術(shù)平均值作為性能分析的依據(jù)。qP18例例 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)僅看運行時間:僅看運行時間:運行程序運行程序P1時,時,A的速度是的速度是B的的10倍;倍;運行程序運行程序P2時,時,B的速度是的速度是A的的10倍;倍;運行程序運行程序P1時,時,A
54、的速度是的速度是C的的20倍;倍;運行程序運行程序P2時,時,C的速度是的速度是A的的50倍;倍;運行程序運行程序P1時,時,B的速度是的速度是C的的2倍;倍;運行程序運行程序P2時,時,C的速度是的速度是B的的5倍。倍。例例 4:兩個程序在三臺機器上的執(zhí)行時間:兩個程序在三臺機器上的執(zhí)行時間 機器機器 A 機器機器 B 機器機器 C 程序程序 P1(秒)(秒) 1 10 20 程序程序 P2(秒)(秒) 1000 100 20 A與與B比較比較A與與C比較比較B與與C比較比較 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)93例例 4:兩個程序在三臺機器上的執(zhí)行時間:兩個程序在三臺機器上的執(zhí)行時間 機器機
55、器 A 機器機器 B 機器機器 C 程序程序 P1(秒)(秒) 1 10 20 程序程序 P2(秒)(秒) 1000 100 20 各執(zhí)行各執(zhí)行1次的算數(shù)平均:次的算數(shù)平均: 500.5 55 20 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)q各執(zhí)行1次的算數(shù)平均:qA: 500.5 B: 55 C: 20 程序P1和P2各執(zhí)行1次,B的速度是A的9.1倍; 程序P1和P2各執(zhí)行1次,C的速度是A的25倍; 程序P1和P2各執(zhí)行1次,C的速度是B的2.75倍。 結(jié)論:結(jié)論: 執(zhí)行程序P1和P2相同次數(shù), 機器機器A最慢,機器最慢,機器C最快最快 算術(shù)平均速度:算術(shù)平均速度:三臺機器的速度之比為: A:B
56、:C = 1:9.1:25 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)加權(quán)算術(shù)平均:權(quán)值不同結(jié)果不同加權(quán)算術(shù)平均:權(quán)值不同結(jié)果不同 機器A機器B機器C程序P1執(zhí)行時間(s)程序P2執(zhí)行時間(s)加權(quán)加權(quán)W1 (0.5, 0.5)加權(quán)加權(quán)W2 (0.909, 0.091)加權(quán)加權(quán)W3 (0.999, 0.001) 1 1000500.50 91.91 2.00 10 10055.0018.1910.09 20 2020.0020.0020.00加權(quán)算術(shù)平均加權(quán)算術(shù)平均W1三臺機器的速度:三臺機器的速度:A B C加權(quán)算術(shù)平均加權(quán)算術(shù)平均W2三臺機器的速度:三臺機器的速度:A C B加權(quán)算術(shù)平均加權(quán)算術(shù)平均
57、W3三臺機器的速度:三臺機器的速度:C B A 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)96性能評價報告總結(jié)性能評價報告總結(jié)q將一個任務(wù)的執(zhí)行時間標準化為一個參考機器的執(zhí)行時間。將參考計算機的執(zhí)行時間除以被測計算機的執(zhí)行時間,得到和被測計算機之間的性能比。由于比率不是一個絕對執(zhí)行時間,沒有單位,此時則需要使用幾何平均數(shù)。采用幾何平均值,不論選哪臺機器作為參考機,比較結(jié)果能保持一致性,與所選擇的參考機器無關(guān)。 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)q參考計算機的執(zhí)行時間除以被測計算機的執(zhí)行時間所得值為SpecRatio 97Execution time referenceExecution timeSpecR
58、atio=innisample1幾何平均數(shù) 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)SpecRatio與性能的關(guān)系與性能的關(guān)系98量化比較時與所選擇的參考機器無關(guān),兩臺量化比較時與所選擇的參考機器無關(guān),兩臺SpecRatio的比值體現(xiàn)出兩臺機器的性能比。的比值體現(xiàn)出兩臺機器的性能比。 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)以以Sun Ultra2000為參考機,為參考機,AMD Opteron和和Intel Itanium2 的的SPECfp2000執(zhí)行時間和執(zhí)行時間和SPECRations99 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)性能與參考機器無關(guān)。執(zhí)行時間的比率等于性能與參考機器無關(guān)。執(zhí)行時間的比率等于Sp
59、ecRatio的比率的比率100 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)性能與參考機器無關(guān)。兩臺機器幾何平均值的比等于兩臺性能與參考機器無關(guān)。兩臺機器幾何平均值的比等于兩臺機器性能比的幾何平均值機器性能比的幾何平均值101 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)幾何平均數(shù)的比率和性能比率的幾何平均幾何平均數(shù)的比率和性能比率的幾何平均數(shù)相等,與所選的參考機器無關(guān)數(shù)相等,與所選的參考機器無關(guān)102 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)103成本與價格成本與價格軟件成本(開發(fā)成本)+硬件成本(開發(fā)成本+生產(chǎn)成本) 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)成本的發(fā)展趨勢成本的發(fā)展趨勢q時間、產(chǎn)量和產(chǎn)品化的影響m當成品率提高和
60、競爭壓力共同導(dǎo)致成本降低時,隨著時間的推移,價格在以一定的速率下降。m 產(chǎn)量增加提高采購和生產(chǎn)的效率,可以降低成本。同時隨著產(chǎn)量的增加,每件產(chǎn)品平均的開發(fā)費用會降低,因而產(chǎn)品的價格會進一步降低。m 產(chǎn)品化后,行業(yè)競爭激烈,競爭會降低成本和價格。m集成電路的成本:集成電路的成本則呈下降趨勢。m成本與價格:隨著商品化程度的提高,產(chǎn)品的成本與價格的差距在縮小。1041.4 計算機系統(tǒng)結(jié)構(gòu)的發(fā)展計算機系統(tǒng)結(jié)構(gòu)的發(fā)展1 馮諾依曼結(jié)構(gòu)的特點2 計算機系統(tǒng)結(jié)構(gòu)中并行性的發(fā)展3 軟件對系統(tǒng)結(jié)構(gòu)發(fā)展的影響4 器件技術(shù)對系統(tǒng)結(jié)構(gòu)的影響 計算機科學(xué)與技術(shù)計算機科學(xué)與技術(shù)1061.4.1. 馮諾依曼體系結(jié)構(gòu)的特點馮諾依曼體系結(jié)構(gòu)的特
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025服務(wù)外包合同
- 2025房地產(chǎn)交割監(jiān)管合同
- 2025合同法討論案例
- 2024年神經(jīng)系統(tǒng)用藥項目資金籌措計劃書代可行性研究報告
- 智慧校園建設(shè)與學(xué)生學(xué)習方式的變革
- 現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)園區(qū)規(guī)劃與管理研究
- 高速公路服務(wù)區(qū)物業(yè)服務(wù)方案
- 二零二五年度出租房水電費在線結(jié)算服務(wù)合同4篇
- 2025年新科版八年級生物上冊階段測試試卷含答案
- 2025年牛津譯林版九年級歷史上冊月考試卷含答案
- 不同茶葉的沖泡方法
- 光伏發(fā)電并網(wǎng)申辦具體流程
- 建筑勞務(wù)專業(yè)分包合同范本(2025年)
- 企業(yè)融資報告特斯拉成功案例分享
- 五年(2020-2024)高考地理真題分類匯編(全國版)專題12區(qū)域發(fā)展解析版
- 《阻燃材料與技術(shù)》課件 第8講 阻燃木質(zhì)材料
- 低空經(jīng)濟的社會接受度與倫理問題分析
- GB/T 4732.1-2024壓力容器分析設(shè)計第1部分:通用要求
- 河北省保定市競秀區(qū)2023-2024學(xué)年七年級下學(xué)期期末生物學(xué)試題(解析版)
- 運動技能學(xué)習與控制課件
- 六編元代文學(xué)
評論
0/150
提交評論