計算機系統(tǒng)結構課件第1章基本概念_第1頁
計算機系統(tǒng)結構課件第1章基本概念_第2頁
計算機系統(tǒng)結構課件第1章基本概念_第3頁
計算機系統(tǒng)結構課件第1章基本概念_第4頁
計算機系統(tǒng)結構課件第1章基本概念_第5頁
已閱讀5頁,還剩114頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、05 八月 20221第1章 計算機系統(tǒng)設計基礎第2章 數(shù)據(jù)表示與指令系統(tǒng)性能分析第3章 流水技術和向量處理 第4章 陣列計算機 第5章 多處理機系統(tǒng)第6章 數(shù)據(jù)流計算機05 八月 20222第1章 計算機系統(tǒng)設計基礎1.1 計算機系統(tǒng)的基本概念1.2 計算機系統(tǒng)的設計技術1.3 計算機系統(tǒng)的性能評價1.4 計算機系統(tǒng)結構的發(fā)展05 八月 20223本章學習要求了解計算機系統(tǒng)的多級層次結構掌握系統(tǒng)結構、組成和實現(xiàn)的定義及屬性,會透明性分析掌握計算機系統(tǒng)的設計原理、性能計算掌握計算機系統(tǒng)的分類,特別是Flynn分類了解軟件對計算機系統(tǒng)結構發(fā)展的影響05 八月 202241.1 計算機系統(tǒng)的基本概

2、念機器:能存儲和執(zhí)行相應語言程序的算法和數(shù)據(jù)結構的執(zhí)行體計算機語言:是用以描述控制流程的、有一定規(guī)則的字符集合語言不是專屬軟件范疇,可以介屬于計算機系統(tǒng)的各個層次,具有不同作用 從使用語言的角度上,將計算機系統(tǒng)看成按功能劃分的多級層次結構 機器、匯編、高級、應用語言 低級 高級 后者比前者功能更強、使用更方便;而前者是后者發(fā)展的基礎,在單條指令的執(zhí)行速度相比較,前者更快。1.1.1計算機系統(tǒng)的多級層次結構05 八月 20226計算機系統(tǒng)的多級層次結構圖微程序/硬聯(lián)直接由硬件執(zhí)行解釋部分解釋(操作系統(tǒng))翻譯(匯編程序)翻譯(編譯程序)翻譯(應用程序包)應用語言級L5虛擬機高級語言機器L4虛擬機匯

3、編語言機器L3虛擬機應用軟件固 件系統(tǒng)軟件傳統(tǒng)機器級操作系統(tǒng)機器軟硬件交界面L2虛擬機物理機器硬 件軟 件05 八月 20227多級層次結構(機器語言)M5: 應用語言機器-應用語言(L5)M4: 高級語言機器-高級語言(L4)M3: 匯編語言機器-匯編語言(L3)M2: 操作系統(tǒng)機器-作業(yè)控制語言(L2)M1: 傳統(tǒng)機器-機器語言(L1)M0: 微程序機器-微程序語言(L0)05 八月 20228從設計人員看到的層次應用程序級 用戶高級語言級 高級語言程序員匯編語言級 匯編語言程序員操作系統(tǒng)級 操作員機器語言級 機器語言程序員微程序控制級 邏輯程序員硬聯(lián)邏輯級 硬件設計員翻譯(Transla

4、tion):先用轉(zhuǎn)換程序?qū)⒏咭患墮C器級上的程序整個地變換成低一級機器級上可運行的等效程序(中間程序),然后再在低一級機器級上去實現(xiàn)的技術。例:英語翻譯計算機系統(tǒng)中的翻譯功能常由應用程序包、編譯程序、匯編程序等軟件完成。解釋(Interpretation):在低一級機器級上用它的一串語句或指令來仿真高一級機器上的一條語句或指令的功能,通過對高一級機器語言程序中的每條語句或指令逐條解釋來實現(xiàn)的技術 解釋過程中不生成中間程序(節(jié)省了存儲空間)或者:一條N+1級指令-一串N級指令例:解釋一件事翻譯和解釋是語言實現(xiàn)的兩種基本技術。解釋比翻譯費時,但節(jié)省存儲空間翻譯為整體行為,可以優(yōu)化,效率高,與平臺有關

5、解釋為局部行為,不優(yōu)化,效率低,與平臺無關翻譯+解釋:Java05 八月 202212控制流程的三種實現(xiàn)方法全硬件、軟硬件結合、全軟件邏輯上等價,物理意義上不等價硬件實現(xiàn):速度快、成本高;靈活性差、占用內(nèi)存少軟件實現(xiàn):速度低、復制費用低;靈活性好、占用內(nèi)存多發(fā)展趨勢硬件實現(xiàn)的比例越來越高硬件所占的成本越來越低05 八月 202213計算機系統(tǒng)的軟硬件成本變化成本年代軟件硬件70年代從概念和功能上將計算機系統(tǒng)看成多級層次結構的優(yōu)點:1. 理解軟件、硬件、固件的地位和作用 2. 理解各種語言的實質(zhì)和實現(xiàn)途徑 3. 探索虛擬機新的實現(xiàn)方法和新的系統(tǒng)設計 由硬件固件實現(xiàn)高級語言機器 多處理機系統(tǒng)由真正

6、微處理機實現(xiàn) 4. 理解計算機體系結構的定義 5. 在一臺真正的宿主機上通過模擬或仿真另一臺不同的假想機器自虛擬技術 05 八月 2022151.1.2 系統(tǒng)結構、組成與實現(xiàn)定義與理解三者的相互關系05 八月 202216計算機系統(tǒng)結構的定義System Architecture是對計算機系統(tǒng)中各機器級之間界面的劃分和定義,以及對各級界面上、下的功能進行分配1964年,IBM/360系列機的總設計工程師G.M. Amdahl、G.A. Blauw、F.P. Brooks等人提出。也稱體系結構。是從程序員的角度所看到的系統(tǒng)的屬性,是概念上的結構和功能上的行為它不同于數(shù)據(jù)流程和控制的組織,不同于邏

7、輯設計以及物理實現(xiàn)方法05 八月 202217定義的理解從兩個角度理解一是計算機系統(tǒng)結構既然是“從程序員的角度所看到的系統(tǒng)的屬性”,那么每一級“機器”都有一個系統(tǒng)結構,而且它們相互不同二是將計算機的系統(tǒng)結構定義在傳統(tǒng)機器界面(M1)程序員所看到的計算機的基本屬性05 八月 202218計算機系統(tǒng)結構的基本屬性一般應包括以下幾個方面指令系統(tǒng)、數(shù)據(jù)表示、操作數(shù)的尋址方式寄存器的構成定義、中斷機構和例外條件存儲體系和管理、I/O結構機器工作狀態(tài)定義和切換、信息保護在所有系統(tǒng)結構的特性中,指令系統(tǒng)的外特性是最關鍵的05 八月 202219計算機組成Computer Organization研究硬件系統(tǒng)

8、各組成部分的內(nèi)部構造和相互聯(lián)系,以實現(xiàn)機器指令級的各種功能和特性,目標是用最合理地方式將各種設備和部件連接為計算機,以達到最優(yōu)的性價比,從而實現(xiàn)所確定的系統(tǒng)結構。它是計算機系統(tǒng)結構的邏輯實現(xiàn),包括機器級內(nèi)的數(shù)據(jù)流和控制流的組成以及邏輯設計等。05 八月 202220計算機組成的基本屬性數(shù)據(jù)通路寬度各種操作功能部件的共享程度專用部件的設置功能部件的并行性緩沖和排隊技術控制機構的組成方式預測技術可靠性技術05 八月 202221計算機實現(xiàn)Computer Implementation 研究各部件的物理結構、機器的制造技術和工藝等,它著眼于器件技術和微組裝技術主存的物理實現(xiàn),如存儲器采用什么樣器件,

9、邏輯電路設計和微組裝技術均屬計算機實現(xiàn)它是計算機組成的物理實現(xiàn)05 八月 202222定義理解舉例主存系統(tǒng)主存容量與編址方式的確定-系統(tǒng)結構主存速度的確定、邏輯結構的模式-組成器件的選定、電路的設計、組裝技術-實現(xiàn)指令系統(tǒng)指令系統(tǒng)的確定-系統(tǒng)結構指令的實現(xiàn)-組成具體電路、器件設計及裝配技術-實現(xiàn)05 八月 202223系統(tǒng)結構、組成和實現(xiàn)相互關系 *具有相同系統(tǒng)結構的計算機可以采用不同的組成,一種計算機組成可以采用多種不同的計算機實現(xiàn)(系列機與兼容機)*采用不同的系統(tǒng)結構會使可以采用的組成技術產(chǎn)生差異,計算機組成也會影響系統(tǒng)結構05 八月 202224是否設置乘方/開方指令邏輯設計1(硬聯(lián)電路

10、)實現(xiàn)方案1(V1,$1,T1)邏輯設計3微程序邏輯設計2(ROM查表)實現(xiàn)方案2(V2,$2,T2)實現(xiàn)方案3(V3,$3,T3)相同系統(tǒng)結構的計算機可以采用不同的組成相同計算機組成可以采用多種不同的計算機實現(xiàn)計算機系統(tǒng)結構計算機組成計算機實現(xiàn)是否05 八月 202225舉例:不同系統(tǒng)結構對軟件的影響A:= B+C D:=E*F面向三地址尋址: ADD B,C,A MPY E,F,D面向寄存器: LOAD R1,B ADD R1,C STORE R1,A LOAD R2,E MPY R2,F STORE R2,D05 八月 202226透明性 Transparency本來存在的事物或?qū)傩裕瑥?/p>

11、某個角度去看卻看不到。在一個計算機系統(tǒng)中,低層機器的屬性往往對高層機器的程序員是透明的。計算機組成設計的內(nèi)容,對傳統(tǒng)機器程序員來講一般是透明的。05 八月 202227舉例1 在多級層次結構的計算機系統(tǒng)中,傳統(tǒng)機器級的概念性結構和功能特性,對高級語言的程序員來說是透明的,而對匯編語言的程序員來說不是透明的。這說明高級語言的程序員不必知道機器的指令系統(tǒng)、中斷機構等,這些本來存在的屬性,對高級語言的程序員來說好像不存在一樣,所以說是透明的。對計算機系統(tǒng)結構來說,存儲器采用交叉存取還是并行存取、CPU內(nèi)部的數(shù)據(jù)通路的寬度是8位還是16位,這些都是透明的,而對計算機組成來說這些不是透明的。05 八月

12、202228舉例2 指令執(zhí)行采用串行、重疊還是流水控制方式,對系統(tǒng)結構來說是透明的,但對計算機組成來說不是透明的。乘法指令采用專用乘法器實現(xiàn),對系統(tǒng)結構來說是透明的,而對計算機組成來說不是透明的存儲器采用哪種芯片,對計算機系統(tǒng)結構和組成來說是透明的,而對計算機實現(xiàn)來說不是透明的。05 八月 2022291.1.3 計算機系統(tǒng)的分類采用的基本器件分類計算機系統(tǒng)成本分類1966年Michael J. Flynn分類1978年David J. Kuck分類1972年馮澤云分類05 八月 202230一 按采用的基本器件分類計算機的更新?lián)Q代第一代:電子管計算機第二代:晶體管計算機第三代:中小規(guī)模集成電

13、路第四代:大或超大規(guī)模集成電路第五代:VLSI(甚大規(guī)模集成電路)計算機性能的大幅度提高和更新?lián)Q代,一方面依靠器件的不斷更新,同時也依賴系統(tǒng)結構的不斷改進。硬件設計公理:越小越快05 八月 202231二 按計算機系統(tǒng)成本分類巨型計算機、超級計算機: puter大型計算機: puter中型計算機: puter小型計算機: puter微型計算機: puter工作站:Workstation介于小型機和微型機之間,具有小型機的性能,微型機的價格05 八月 202232Michael J.Flynn (弗林)分類法按照指令流和數(shù)據(jù)流的多倍性進行分類1.基本概念 指令流(instruction stre

14、am):機器執(zhí)行的指令序列 數(shù)據(jù)流(data stream):由指令流調(diào)用的數(shù)據(jù)序列 多倍性(multiplicity):在系統(tǒng)瓶頸部件上處于同一執(zhí)行階段的指令或數(shù)據(jù)的最大可能個數(shù)多指令流多數(shù)據(jù)流 MIMD (Multiple Instruction stream Multiple Data stream)(多計算機系統(tǒng))2.分類單指令流單數(shù)據(jù)流 SISD(Single Instruction stream Single Data stream) (傳統(tǒng)計算機,如IA結構的PC機)單指令流多數(shù)據(jù)流SIMD (Single Instruction stream Multiple Data str

15、eam) (陣列計算機,如ILLIAC 機 )多指令流單數(shù)據(jù)流 MISD (Multiple Instruction stream Single Data stream)(較先進的流水線處理機,如VLIW機)05 八月 202234四 David J. Kuck分類 庫克分類:指令流、執(zhí)行流、多倍性單指令流單執(zhí)行流SISE單指令流多執(zhí)行流SIME多指令流單執(zhí)行流MISE多指令流多執(zhí)行流MIME05 八月 202235五 1972年馮澤云分類用最大并行度Pm分類最大并行度Pm:在單位時間內(nèi)能夠處理的最大的二進制位數(shù) 05 八月 202236 橫坐標代表字寬(n位),即在一個字中同時處理的二進制位

16、數(shù)縱坐標代表位片寬度(m位),即在一個位片中能同時處理的字數(shù) 字寬n位片寬m。n=1,m=1,字串位串(WSBS) 如串行計算機。n1,m=1,字并位串(WPBS) 如傳統(tǒng)計算機。1163264116326425628816384。n1,m1,字并位并(WPBP) 如陣列計算機。n=1,m1,字串位并(WSBP) 如 STARAN等機。MPPSTARANPDP-11IBM360TI-ASCILLIACPEPECmmp。05 八月 2022371.2 計算機系統(tǒng)的設計技術1.2.1 計算機系統(tǒng)的設計原理-加快經(jīng)常性事件的速度-Amdahl定律-程序訪問的局部性規(guī)律1.2.2 計算機系統(tǒng)的設計方法

17、-軟硬件舍取的基本原則-計算機系統(tǒng)設計者的主要任務-計算機系統(tǒng)設計的基本方法 (三種)05 八月 2022381.2.1 計算機系統(tǒng)的設計原理加快經(jīng)常性事件的速度Amdahl定律程序訪問的局部性規(guī)律Amdahl/case準則成功轉(zhuǎn)移法則Cache法則05 八月 2022391.加快經(jīng)常性事件的速度這是計算機設計中最重要也最廣泛采用的設計準則。使經(jīng)常性事件的處理速度加快能明顯提高整個系統(tǒng)的性能在當今的微處理機實現(xiàn)技術中,經(jīng)常發(fā)生的事件由硬件完成,而不經(jīng)常發(fā)生的事件交由軟件完成。05 八月 202240 2. Amdahl定律系統(tǒng)對某一部件采用某種更快執(zhí)行方式所能獲得的系統(tǒng)性能改進程度,取決于這種

18、執(zhí)行方式被使用的頻率,或所占總執(zhí)行時間的比例。IBM大型計算機之父05 八月 202241Amdahl定律(理解)CPU硬件系統(tǒng)ALU占系統(tǒng)運行時間的30%編譯軟件系統(tǒng)公共子程序30%被加(提)速部件要優(yōu)化改進的軟件05 八月 202242Amdahl定律表達式表示被改進部分在改進前占系統(tǒng)的比例表示被改進部分的加速比05 八月 202243Amdahl表達式的解釋改進后的執(zhí)行總時間=不可改進部分的執(zhí)行時間 +不可改進部分的比例可改進部分的執(zhí)行時間05 八月 202244Amdahl 舉例假設將某系統(tǒng)的某一部件的處理速度加快到10倍,但該部件的原處理時間僅為整個運行時間的40%,則采用加快措施后

19、能使整個系統(tǒng)的性能提高多少?解:由題意可知 fe=0.4, re=10, 根據(jù)Amdahl定律05 八月 202245思考題 采用哪種實現(xiàn)技術來求浮點數(shù)平方根FPSQR的操作對系統(tǒng)的性能影響較大。假若FPSQR操作占整個測試程序執(zhí)行時間的20%。一種實現(xiàn)方法是采用FPSQR硬件,使FPSQR操作的速度加快到10倍。另一種實現(xiàn)方法是使所有的浮點數(shù)據(jù)指令的速度加快,使之加快到2倍,還假設FP指令占整個執(zhí)行時間的50%。05 八月 2022463. 程序訪問的局部性規(guī)律程序訪問局部性主要反映在時間和空間局部性兩個方面時間局部性是指程序中近期被訪的信息項很可能馬上將被再次訪問;空間局部性是指那些在訪問

20、地址上相鄰近的信息項很可能會被一起訪問這是構成存儲體系(存儲層次)的主要規(guī)律 05 八月 2022474、Amdahl/case準則一個平衡的計算機系統(tǒng),其CPU每1MIPS的速度應有1MB的主存容量和1Mb/s的I/O吞吐率。這一準則為設計平衡的計算機系統(tǒng)的提出了三者之間的參考指標。由于是統(tǒng)計結果,具體應用還需要適當調(diào)整。05 八月 2022485、成功轉(zhuǎn)移法則對于轉(zhuǎn)移指令:向后轉(zhuǎn)移指令有90%的成功率;對于向前轉(zhuǎn)移指令有20%的成功率。這一轉(zhuǎn)移法則為預測處理提供了參考信息。05 八月 2022496、Cache法則容量為C的直接映像Cache的失效率與容量為C/2的二路組相聯(lián)Cache的失

21、效率大致相等。這一法則指出在相同命中率條件下控制復雜性的增加可以換取Cache容量的減小。1.軟硬取舍的基本原則原則一:在現(xiàn)有器件和技術條件下,系統(tǒng)要有高的性能價格比原則二:不應對組成和實現(xiàn)技術有過多的限制原則三:對軟件提供更多更好的支持(OS、編譯、高級語言) 1.2.2 計算機系統(tǒng)的設計方法05 八月 2022512.計算機系統(tǒng)設計的主要任務要滿足用戶對功能上的要求以及相應的對價格和性能要求 在滿足功能要求基礎上,進行設計的優(yōu)化 設計應能適應日后發(fā)展趨勢 05 八月 202252計算機發(fā)展的基本趨勢 一個芯片上的晶體管數(shù)大約每年增加25,因此每三年可增加一倍; 器件的開關速度增長基本類似D

22、RAM的密度每 年增長約60,因此每三年將增長三倍; 訪問存儲器周期改進相應較慢,每十年約減 少13;硬盤密度每年增加25,每三年增加一倍,訪問時間則每十年減少13。05 八月 202253計算機系統(tǒng)設計的主要方法方法一:“由上往下”設計: 先考慮如何滿足應用要求,確定好面對使用者那級機器應有什么基本功能和特性,如基本命令、指令或語言結構、數(shù)據(jù)類型和格式等,然后再逐級往下設計,每級都考慮怎樣優(yōu)化上一級實現(xiàn)。方法特征:它適合于專用機設計,不適合于通用機設計。 05 八月 202254方法二:由下往上設計 不管應用要求,只根據(jù)能拿到的器件參照或吸收已有各種機器的特點,先設計出微程序機器級(如果采用

23、微程序控制)及傳統(tǒng)機器級,然后再為不同應用配多種操作系統(tǒng)和編譯系統(tǒng)軟件。 方法特征:設計周期長。當一種結構的機器完成以后,硬件技術又已發(fā)展了一大步。20世紀6070年代前常用此方法。 05 八月 202255方法三:由中間開始設計 先進行合理的軟、硬件功能分配,既要考慮能拿到的硬、器件,又要考慮可能的應用所需的算法和數(shù)據(jù)結構,先定義好這個交界面。確定哪些功能由硬件實現(xiàn),哪些功能由軟件實現(xiàn),同時還要考慮好硬件對操作系統(tǒng)、編譯系統(tǒng)的實現(xiàn)提供些什么支持。然后由這個中間點分別往上、往下進行軟件和硬件的設計。“中間”指傳統(tǒng)機器級界面。方法特征:設計周期短,軟硬件結合。 05 八月 202256提高微處理

24、器性能方法1、提高主頻。提高主頻可使系統(tǒng)中的各個部件受益,是提高系統(tǒng)性能最直接的方法。2、多線程??呻[藏訪存延遲,是提高系統(tǒng)吞吐率的有效辦法。3、2Bump技術。時鐘信號的上升、下降沿均控制信息的發(fā)送和接收,此技術既可用于邏輯電路也可用于總線。05 八月 2022574、提高IPC技術。即為先進的流水技術。5、合理分配軟、硬件功能。6、優(yōu)化片內(nèi)Cache。將二、三級Cache盡量放在處理器內(nèi)部。7、加大通用寄存器數(shù)量。8、亂序發(fā)送/亂序完成的指令調(diào)度技術。9、預取技術。10、分支預測技術。05 八月 2022581.3 計算機系統(tǒng)的性能評價CPU 性能公式(CPU工作時間)MIPS和MFLOP

25、S 基準測試程序 性能評價結果的統(tǒng)計和比較 05 八月 2022591.3.1 CPU性能公式一個程序在CPU上運行所需的時間:其中,05 八月 202260思考題 如果FP操作的比例為25%,平均CPI=4,其它指令的CPI=1.33, FPSQR操作的比例為2%,CPI=20。假若有兩種設計方案,分別將FP操作和FPSQR操作的CPI都減為2。試比較這兩個方案哪個更好?05 八月 2022611.3.2 MIPS和MFLOPSMIPS每秒(可執(zhí)行)百萬條指令MFLOPS每秒(可執(zhí)行)百萬條浮點指令05 八月 202262舉例 例1 用一臺4OMHz處理機執(zhí)行標準測試程序,它含的混合指令數(shù)和

26、相應所需的時鐘周期數(shù)如下: 指令類型 指令條數(shù) 時鐘周期數(shù) 整數(shù)運算 45000 1 數(shù)據(jù)傳送 32000 2 浮點運算 15000 2 控制轉(zhuǎn)移 8000 2求有效CPI、MIPS速率和程序的執(zhí)行時間。05 八月 202263 解:依題意可知 IN=105條,n=4,05 八月 202264 例2 某工作站采用時鐘頻率為15MHz、處理速率為10MIPS的處理機來執(zhí)行一個巳知混合程序。假定每次存儲器存取為1周期延遲、試問: (1) 此計算機的有效CPI是多少? (2) 假定將處理機的時鐘提高到30MHz,但存儲器子 系統(tǒng)速率不變。這樣,每次存儲器存取需要兩個時鐘 周期。如果30指令每條只需要

27、一次存儲存取,而另 外5每條需要兩次存儲存取,還假定已知混合程序 的指令數(shù)不變,并與原工作站兼容,試求改進后的處 理機性能。 解 (1)05 八月 202265(2) 依題意可知:30%的指令需要一次存儲存取,則這些指令在處理器提高時鐘頻率之后需要增加1個時鐘周期;另外5%的指令需要增加2個時鐘周期。 改進后性能提高情況可用CPU時間之比表示: 05 八月 2022661.3.3 基準測試程序用于評價計算機系統(tǒng)性能的基準測試程序(Benchmark) 。采用實際應用程序。如c語言的各種編譯程序及CAD工具軟件等;從實際程序中抽取少量關鍵循環(huán)程序段來組成核心程序,以此來評估性能;合成測試程序。它

28、類似于核心程序方法,但這種合成測試程序是人為編制的。較流行的合成測試程序有 Whetstone和 Dhrystone兩種. 05 八月 202267SPEC測試程序在1988年,美國HP、DEC、MIPS以及SUN公司,發(fā)起成立了SPEC(Standard Performance Evaluation Corporation)(標準性能評估協(xié)會)SPEC是一非盈利社團,致力于“建立、維護和認可一個基準測試程序標準化集,以用于最新一代高性能計算機的性能衡量?!盨PEC89、92、95和2000共四個版本05 八月 202268 SPEC89由10個工程/科學測試程序(GCC,Espresso,S

29、plce2g6,DODUC,NASA7,Li,Eqntott,Matrix300,F(xiàn)PPPP,TOMCATV)組成。 其中4個用C語言編寫(GCC,Espresso,Li和Eqntott)用于整數(shù)運算,6個用FORTRAN語言編寫,用于浮點運算。計算所得SPECmark的分值越大越好,它是相對于VAX11780的性能,lSPEC分值約相當于0.20.3MFLOPS。 SPEC89后來演化出兩個測試程序集:SPECmark測量10個程序的執(zhí)行速率,SPECthruput考察系統(tǒng)的吞吐率。05 八月 202269Pentium與80486性能比較 Pentium/66 80486DX2/66推出日

30、期: 1993年3月 1992年8月制造工藝: 0.8um CMOS 0.8um CMOS整數(shù)/浮點部件: 2/1個 2/1個片內(nèi)Cache : 16K(指/數(shù)分開) 8K(指/數(shù)混存)外部數(shù)據(jù)總線 : 64 位 32位Dhryston值: 100MIPS 54MIPSSPECint89值: 70 33.6SPECfp89值: 70 18.305 八月 202270SPEC92由20個測試程序組成,包括CINT92(6)和CFP92(14)參照機:VAX11/780程序描述/領域CompressEspresoGccEqntottScxlisp自適應壓縮函數(shù)最小化GNU C編譯器邏輯設計電子表格

31、Lisp解釋器程序描述/領域AlvinnDoduceEarFppppHydro2dMdljdp2Mdljsp2Masa7OraSpiceSu2corSwm256TomcatWave5神經(jīng)網(wǎng)絡/機器人核反應堆模擬/物理學耳朵模擬/醫(yī)學電子積分/化學噴氣計算/天體物理運動方程/化學(雙)運動方程/化學(單)浮點內(nèi)核光線跟蹤/光學電路模擬/電路設計粒子質(zhì)量/量子物理水方程求解/模擬網(wǎng)格生成程序麥克斯韋方程求解05 八月 202271SPEC95由18個測試程序組成,包括CINT95(8)和CFP95(10)參照機:SUN SPARC 10/40SPEC2000由26個測試程序組成,包括CINT200

32、0(12)和CFP2000(14)參照機:SUN Ultra5_10 300MHz Alpha Station 500/500(System#1) Personal Workstation 500au(System#2) Alpha Server 4100 5/533(System#3)05 八月 202272SPECint2000整數(shù)基準測試程序集基準測試程序語言駐留大小虛擬大小描述164.gzipc181 (MB)200(MB)壓縮175.vprc5055.2FPGA應用176.gccc155158C編譯器181.mcfc190192組合優(yōu)化186.craftyc2.14.2下棋游戲197

33、.parserc3762.5字處理252.eonC+0.73.3計算機可視化253.perlbmkc146159Perl編程254.gapc193196解釋器(群論)255.vortexc7281Oob數(shù)據(jù)庫256.bzip2c185200壓縮300.twolfc1.94.1路由模擬器05 八月 202273Gcc.176編譯器05 八月 202274SPECfp2000浮點基準測試程序集基準測試程序語言駐留大小虛擬大小描述168.wupwiseF77176 (MB)177(MB)量子染色動力學171.swinF77191192淺水建模172.mgridF775656.7三維勢能場173.ap

34、pluF77181191偏微分方程177.mesac9.524.7三維圖形庫178.galgelF9063155計算流體力學179.artc3.75.9神經(jīng)網(wǎng)絡應用183.equakec4951.1地震波傳輸模擬187.facerecF901618.5圖象處理:臉部識別188.ammpc2630計算化學189.lucasF90142143數(shù)論191.fma3dF90103105有限元模擬200.sixtrackF772659.8核物理應用301.apsiF77191192氣象學:污染物質(zhì)分布05 八月 202275龍芯2號處理器 05 八月 20227605 八月 20227705 八月 20

35、2278HPC的性能測試LinpackLinpack包括: Linpack100、1000和HPLLinpack是用高斯消元法要求解一元N次稠密線性方程。只能采用編譯優(yōu)化選項,不能更改程序代碼,甚至是代碼中的注釋必須安裝支持C和Fortran77的編譯器、并行編程環(huán)境MPICH05 八月 2022791.3.4 性能評價結果的統(tǒng)計和比較 1算術性能平均值Am2幾何性能平均值Gm3調(diào)和性能平均值HmRi表示由n個程序組成的工作負荷中執(zhí)行第i個程序的速率,Ti表示執(zhí)行第i個程序所需的時間 05 八月 202280程序機器A執(zhí)行時間機器B執(zhí)行時間機器C執(zhí)行時間程序111020程序2100010020

36、程序3500100050程序4100800100例3 已知四個程序在三臺計算機上的執(zhí)行時間(s)如下表: 假設四個程序中每一個都有100 000 000條指令要執(zhí)行,計算這三臺計算機中每臺機器上每個程序的MIPS速率。根據(jù)這些速率值,你能否得出有關三臺計算機相對性能的明確結論?你能否找到一種將它們統(tǒng)計排序的方法?試說明理由。05 八月 202281程序機器A的MIPS機器B的MIPS機器C的MIPS程序1100105程序20.115程序30.20.12程序410.1251由上述機器的MIPS速率,可知每臺機器對4個程序有不同的處理時間,而且大小順序不同,所以不能得出明確的結論。解:根據(jù)式 可得

37、出每臺機器每個程序的MIPS速率如下: 05 八月 202282平均執(zhí)行時間機器A機器B機器C算術平均25.32.813.25幾何平均1.190.592.66調(diào)各平均0.250.202.1如果按照算術平均比較性能,機器A最快,機器B最慢;如果按照幾何平均比較性能,機器C最快,機器B最慢;如果按照調(diào)各平均比較性能,機器C最快,機器B最慢。下面可采用統(tǒng)計的方法比較各機器的性能: 如機器A的算術平均:05 八月 2022831.4 計算機系統(tǒng)結構的發(fā)展傳統(tǒng)計算機結構特點及其演變軟件、器件和應用對系統(tǒng)結構發(fā)展的影響計算機的成本和價格05 八月 2022841.4.1 傳統(tǒng)機結構特點及其演變 傳統(tǒng)的馮.

38、諾依曼計算機結構輸出設備輸入設備控制器運算器存儲器傳統(tǒng)計算機結構模式的主要缺點有 :1.存在有兩個瓶頸:物理瓶頸和智能瓶頸;2.低級的機器語言和高級的程序設計語言之間存在著巨大的語義差距;3.復雜的數(shù)據(jù)結構對象無法直接存放到一維線性地址空間的存儲器中,必須經(jīng)過地址映象。 05 八月 202286針對傳統(tǒng)計算機結構模式的演變兩個瓶頸:“改良”方法“改革”方法Cache存儲器、并行主存技術高級流水技術語義差距:數(shù)據(jù)結構:面向高級語言機器、虛擬存儲技術以支持高級語言編程自定義數(shù)據(jù)表示、多維存儲空間非傳統(tǒng)計算機結構:并行處理計算機脈動陣列計算機數(shù)據(jù)流計算機歸約計算機人工智能計算機05 八月 20228

39、71.4.2 系統(tǒng)結構的發(fā)展軟件對系統(tǒng)結構發(fā)展的影響器件對系統(tǒng)結構發(fā)展的影響應用對系統(tǒng)結構發(fā)展的影響價格對系統(tǒng)結構的影響算法對系統(tǒng)結構的影響05 八月 202288一、軟件對系統(tǒng)結構發(fā)展的影響軟件對系統(tǒng)結構的影響主要是解決軟件的可移植出 性( 軟件成本越來越高軟件產(chǎn)量和可靠性的提高困難 積累了大量成熟的軟件排錯比編寫困難、軟件生產(chǎn)率低因而出現(xiàn)了“軟件危機”)實現(xiàn)軟件的可移植性有三個主要途徑:1.統(tǒng)一高級語言2.采用系列機方法3.模擬與仿真2.采用系列機方法 系列機:由同一廠商生產(chǎn),系統(tǒng)結構相同、組成和實現(xiàn)不同的不同檔次(速度、容量、成本和可靠性)的機器。 如IBM公司的360、370系列計算機

40、,DEC公司的PDP-ll系列機 和INTEL公司的80X86系列微型計算機。 1.統(tǒng)一高級語言(應用、認識和習慣勢力三個問題)05 八月 202290系列機方法只是解決了系統(tǒng)結構相同的計算機之間的軟件移植。系列機方法也限制了系統(tǒng)結構的發(fā)展。 系列機方法較好地解決了硬件技術更新發(fā)展快(系統(tǒng)結構要求不斷更新)而軟件編寫開發(fā)周期比較長(軟件環(huán)境要求相對穩(wěn)定)之間的矛盾。兼容機:不同廠商生產(chǎn),系統(tǒng)結構相同、組成和實現(xiàn)不同的不同檔次的機器。05 八月 202291系列機要求 :保證向后兼容 力爭做到向上兼容當前機器時間機器檔次向上兼容向下兼容向前兼容向后兼容05 八月 2022923.模擬與仿真微程序

41、機器級高級語言級匯編語言級操作系統(tǒng)級傳統(tǒng)機器級A機器系統(tǒng)模擬高級語言級操作系統(tǒng)級傳統(tǒng)機器級B機器系統(tǒng)仿真宿主機虛擬機目標機模擬:用一臺機器的指令系統(tǒng),去解釋另一臺系統(tǒng)結構不同的機器的指令系統(tǒng),以實現(xiàn)軟件的移植。(實現(xiàn)容易、速度較慢)仿真:直接用微程序去解釋另一臺系統(tǒng)結構不同的機器的指令系統(tǒng),以實現(xiàn)軟件的移植。(微程序編寫困難、實現(xiàn)速度較快) 模擬與仿真可實現(xiàn)系統(tǒng)結構不同的機器之間軟件的移植。 對于使用頻率較高的指令,盡可能用仿真方法以提高運算速度,而對使用頻率低且難于用仿真實現(xiàn)的指令(包括IO指令等)則用模擬方法加以實現(xiàn)。 05 八月 202294開放式系統(tǒng)(open system)1978年

42、由國際標準化組織(ISO)首先提出了關于開放式系統(tǒng)的新概念。 是指種獨立于廠商,且遵循有關國際標準而建立的、具有系統(tǒng)可移植性、交互操作性,從而能允許用戶自主選擇具體實現(xiàn)技術和多廠商產(chǎn)品渠道的系統(tǒng)集成技術的系統(tǒng)。它是相對于原來的封閉系統(tǒng)或?qū)S邢到y(tǒng)而言的。USB, TCP/IPJava, CORBA, Web Services等 05 八月 202295系統(tǒng)結構的發(fā)展軟件對系統(tǒng)結構發(fā)展的影響器件對系統(tǒng)結構發(fā)展的影響應用對系統(tǒng)結構發(fā)展的影響價格對系統(tǒng)結構的影響算法對系統(tǒng)結構的影響05 八月 202296二、器件對系統(tǒng)結構發(fā)展的影響 器件發(fā)展使得計算機的主頻速度、單芯片的集成度飛速提高。(如1979年

43、推出的8088/8086,主頻約5MHz,單芯片上集成2.9萬個晶體管;1997年推出的PII主頻在300MHz左右,單芯片上集成1500萬個晶體管)器件的發(fā)展使得系統(tǒng)結構技術“下移”速度加快。05 八月 202297 器件的發(fā)展使得器件原有的使用性質(zhì)發(fā)生了轉(zhuǎn)變(通用型現(xiàn)場型專用型)。 器件的發(fā)展會影響到算法、語言和軟件的發(fā)展。 器件的發(fā)展改變了傳統(tǒng)的邏輯設計思想和 邏輯設計方法。器件是推動系統(tǒng)結構發(fā)展的主要動力,最活躍的因素,是計算機更新?lián)Q代的標志之一。05 八月 20229805 八月 20229905 八月 2022100美國NSF向美國政府申請2009年計劃經(jīng)費2000多萬美元,為超越

44、摩爾定律(SEBML )部署新計劃NSF:摩爾定律將在10到20年后達到物理和概念上的極限具體方向包括:碳納米管、量子計算和并行計算以及大規(guī)模多核計算機等 05 八月 2022101系統(tǒng)結構的發(fā)展軟件對系統(tǒng)結構發(fā)展的影響器件對系統(tǒng)結構發(fā)展的影響應用對系統(tǒng)結構發(fā)展的影響價格對系統(tǒng)結構的影響算法對系統(tǒng)結構的影響05 八月 2022102三、應用對系統(tǒng)結構發(fā)展的影響應用范圍:數(shù)值計算、數(shù)據(jù)庫及事務處理系統(tǒng)、CAD、多媒體處理、人工智能在某個應用領域的確定以后,系統(tǒng)結構設計者的首要任務,是確保系統(tǒng)中的每一個功能部件獲得更高的性能系統(tǒng)結構設計者總是根據(jù)用戶(市場)需求設計或改進系統(tǒng)結構,以適應發(fā)展05

45、八月 2022103系統(tǒng)結構的發(fā)展軟件對系統(tǒng)結構發(fā)展的影響器件對系統(tǒng)結構發(fā)展的影響應用對系統(tǒng)結構發(fā)展的影響價格對系統(tǒng)結構的影響算法對系統(tǒng)結構的影響05 八月 2022104四、價格對系統(tǒng)結構的影響性能與價格(性/價比)均衡改善與提高性能或價格較小的變化產(chǎn)生比原系統(tǒng)好的性/價比提高系統(tǒng)的絕對性能,而價格增長又比較合理05 八月 2022105五、算法對系統(tǒng)結構的影響充分利用算法和系統(tǒng)結構兩者優(yōu)勢,構建一種有效的解決問題的方法改進和提高基本的系統(tǒng)結構利用并行性獲得高速度05 八月 2022106系統(tǒng)結構發(fā)展小結軟件是促使計算機系統(tǒng)結構發(fā)展的最重要的因素沒有軟件,機器就不能運行,所以為了能方便地使用

46、現(xiàn)有軟件,就必須考慮系統(tǒng)結構的設計軟件最重要應用需求是促使計算機系統(tǒng)結構發(fā)展的最根本的動力機器是給人用的,我們追求更快更好,機器就要做得更快更好需求最根本器件是促使計算機系統(tǒng)結構發(fā)展最活躍的因素沒有器件就產(chǎn)生不出電腦,器件的每一次升級就帶來計算機系統(tǒng)結構的改進器件最活躍05 八月 20221071.4.3 計算機的成本和價格成本敏感設計(Cost-sensitive designs):-非設計時的元器件成本,而是產(chǎn)品交付市場時的規(guī)劃成本。-封裝成本。隨著時間的推移,設計時安排在一個印制板上的所有器件,生產(chǎn)時可能只用一個單芯片集成。05 八月 2022108平均折扣毛利潤直接成本元器件成本計算機

47、產(chǎn)品價格的構成25-40%35-40%6-8%20-30%制造成本:工人工資、元器件采購、 器件損耗、維護保修等 間接成本:研制費、銷售費、廣告宣傳費、廠房租金、設備使用、管理費等 利潤(批零差價):生產(chǎn)廠家利潤、中間商利潤、零售商利潤等 目錄價格05 八月 2022109部分習題解答 12 如有一個經(jīng)解釋實現(xiàn)的計算機,可以按功能劃分成4級。每一級為了執(zhí)行一條指令需要下一級的N條指令解釋。若執(zhí)行第一級的一條指令需K(ns)時間,那么執(zhí)行第2、3、4級的一條指令各需要用多少時間(ns)?05 八月 2022110本題有兩個問題應特別注意:第一個問題是“上一級”與“下一級”的關系,即哪是上一級,哪是下一級?在圖1.1中第3級是第2級的“上一級”,第1級又是第2級的“下一級”。第二個問題是該計算機是一個“經(jīng)解釋實現(xiàn)的計算機”,上一級的程序在下一級上實

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論