計算機體系結構論文剖析_第1頁
計算機體系結構論文剖析_第2頁
已閱讀5頁,還剩5頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、高級計算機體系結構題目:計算機體系結構的發(fā)展史2015年12月計算機體系結構的發(fā)展史摘要本文回顧了計算機體系的發(fā)展歷程,并分析了計算機體系的發(fā)展和技術研究的關鍵:Cell和多核等新型處理結構和可重構計算技術。提出了新的計算機體系結構,為計算機研究和應用提供參考。關鍵詞:計算機體系微處理器多處理器可重構多核目錄引言1計算機體系的發(fā)展歷程1Cell和多核等新型處理器結構帶來新的方向3可重構技術與多核技術的融合6引言現(xiàn)代計算機的發(fā)展歷程可以分為2個時代:串行計算時代和并行計算時代。并行計算是在串行計算的基礎上,由一組處理單元組成,處理單元彼此通過相互之間的通信與協(xié)作,共同高速完成一項大規(guī)模的計算任務

2、。而每一個計算時代都是從體系結構的發(fā)展開始,然后才是基于該結構的系統(tǒng)軟件(特別是編譯器與操作系統(tǒng))、應用軟件的發(fā)展,最后隨著問題求解和發(fā)展而達到頂峰。計算機系統(tǒng)結構也可以稱為計算機體系結構。1964年Amdahl等人提出了計算機系統(tǒng)結構這個概念。他們把系統(tǒng)結構定義為程序員所看到的計算機系統(tǒng)的屬性,即計算機系統(tǒng)的概念性結構與功能屬性。這些屬性是機器語言程序設計者(或者編譯程序生成系統(tǒng))為使其所設計(或生成)的程序能在機器上正常運行,所需遵循的計算機屬性。這些屬性是計算機系統(tǒng)中由硬件或固件完成的功能,程序員在了解這些屬性后才能編出在傳統(tǒng)機器級上正確運行的程序。因此,計算機系統(tǒng)結構概念的實質是確定計

3、算機系統(tǒng)中軟硬件的界面。界面之上是軟件的功能,界面之下是硬件和固件的功能。微電子技術和封裝技術的進步,使得高性能的VLSI微處理器得以大批量生產,性能價格比不斷合理,這為并行多處理機的發(fā)展奠定了重要的物質基礎。計算機系統(tǒng)性能增長的根本因素有兩個:一是微電子技術,另一個是計算機體系結構技術。五十年代以來,人們先后采用了先行控制技術、流水線技術、增加功能部件甚至多機技術、存儲尋址和管理能力的擴充、功能分布的強化、各種互聯(lián)網(wǎng)絡的拓撲結構以及支持多道、多任務的軟件技術等一系列并行處理技術,提高計算機處理速度,增強系統(tǒng)性能。多處理機體系結構是計算機體系結構發(fā)展中的一個重要內容,已成為并行計算機發(fā)展中人們

4、最關注的結構。計算機體系的發(fā)展歷程隨著計算技術的發(fā)展,計算機體系也在不斷發(fā)展變化。20世紀60年代初期,隨著晶體管和磁芯存儲器的出現(xiàn),處理單元和存儲器實現(xiàn)小型化,并行計算機開始出現(xiàn)。到了20世紀60年代末期,單一處理器中可以集成多個功能單元,產生了流水線技術。該技術與單純提高CPU時鐘頻率相比,大大提高了并行計算機系統(tǒng)的性能。當時,伊利諾依大學和Burroughs公司開始著手實施IlliacW計劃,研制1臺64顆CPU的SIMD主機系統(tǒng),涉及到相關硬件技術、體系結構、I/O設備、操作系統(tǒng)、程序設計語言,以及包括應用程序在內的眾多研究課題。1975年,隨著一臺規(guī)模大大縮小的原型系統(tǒng)(僅使用了16

5、顆CPU)的面世,新的計算技術也得到了發(fā)展。首先是存儲系統(tǒng)的概念,提出了虛擬存儲和緩存的思想,大大提高了計算機的整體性能。其次是半導體存儲器開始代替磁芯存儲器,大大縮小了存儲器的體積并提高了訪存速度。集成電路技術也被廣泛而迅速地應用到計算機技術中。1976年Cray-1問世,向量計算技術被應用到高性能計算機中。Cray-1對所使用的邏輯電路是經過精心設計的,采用RISC精簡指令集,引入向量寄存器,完成向量運算。20世紀80年代開始,微處理器技術高速發(fā)展,隨著機器的字長從4位、8位、16位一直增加到32位、64位,其性能也隨之顯著提高??▋然仿〈髮W提出共享存儲多處理器體系結構,并在當時流行的D

6、ECPDP-11小型計算機的基礎上研制出1臺由16臺PDP-11/40處理機通過交叉開關與16個共享存儲器模塊相連接而成的共享存儲多處理器系統(tǒng)C.mmp。伯克利加州大學對基于SMP方式的總線協(xié)議進行擴展,提出了Cache一致性問題的處理方案。從此,C.mmp開創(chuàng)出的共享存儲多處理器體系結構便成為服務器和桌面工作站的主流。20世紀80年代中期,基于消息傳遞機制的并行計算機開始出現(xiàn),加州理工學院將64個i8086/i8087處理器通過超立方體互連結構連接起來。此后,便先后出現(xiàn)了InteliPSC系列、INMOSTransputer系列、IntelParagon,以及IBMSP的前身Vulcan等基

7、于消息傳遞機制的并行計算機°RISC精簡指令集計算機,用20%指令的組合實現(xiàn)了CISC計算機指令系統(tǒng)不常用的80%指令的功能。在提高性能方面,RISC采用了超級流水線、超級標量、超長指令字并行處理結構;多級指令Cache;編譯優(yōu)化等技術,充分利用RISC的內部資源,發(fā)揮其內部操作的并行性,從而提高流水線的執(zhí)行效率。20世紀80年代后期,RISC處理機的性能指標幾乎以每年翻一番的速度發(fā)展,它對于提高計算機系統(tǒng)的性能和應用水平起著巨大的作用。目前,由Intel和HP兩家公司聯(lián)合開發(fā)的基于IA64架構的Merced芯片,并由其共同定義的顯式并行指令計算技術EPIC(ExplicitlyPa

8、rallelInstructionComputing),將為微處理器技術的發(fā)展帶來突破性進展。EPIC技術主要指編譯器在微處理器執(zhí)行指令之前就對整個程序的代碼作出優(yōu)化安排,編譯器分析指令間的依賴關系,將沒有依賴關系的指令(最多3個)組成一“組”,由Merced內置的執(zhí)行單元讀入被分成組的指令群并執(zhí)行。從理論上講,EPIC可以并行執(zhí)行3倍于執(zhí)行單元數(shù)的指令。64位體系結構的Merced芯片還采用了指令預測、數(shù)據(jù)預裝等技術,可以顯著地減少實際執(zhí)行程序的長度,同時增強語句執(zhí)行的并行性,經過代碼的重組,程序的執(zhí)行時間比基于傳統(tǒng)體系結構的微處理器幾乎減少了一半;更加不同凡響的是,可以消除分支預測錯誤的三

9、分之二。IA64微處理器具有128個通用寄存器以及128個浮點寄存器,而目前基于RISC的微處理器通常只有32個寄存器。它還具有更為豐富的與大量寄存器相連的附屬功能部件,使得其應用更為廣泛,同時內部各功能部件之間的可伸縮性擴展了機器的“寬度”,提高了系統(tǒng)的性能。容量更大的Cache以及更多的讀寫端口,使得基于IA64微處理器的速度不再受到存儲延遲的限制。EPIC設計的Merced芯片可并行處理十幾個運算,而當今最優(yōu)秀的芯片也只能并行處理4個運算操作。EPIC芯片用并行方式執(zhí)行任務而不用順序執(zhí)行,這將使其速度比現(xiàn)在的CISC和RISC芯片至少快兩倍。只有0.18微米微小距離的跡線間寬度也使芯片時

10、鐘能夠達到900MHZ。使用EPIC設計的Merced是第一個被分為三部分的芯片:一部分運行CISC,另一部分運行RISC,第三部分運行EPIC。把三種體系結合于一塊芯片意味著現(xiàn)存的應用程序將仍然可以運行在基于新芯片的服務器上。Cell和多核等新型處理器結構帶來新的方向隨著人們對計算機CPU速度的不斷追求和微電子技術的發(fā)展及限制,一種新的處理器結構開始出現(xiàn),它就是Cell和多核架構技術的實現(xiàn)。Cell架構是1個單芯片多核處理單元,處理單元之間共享存儲器資源。與多核處理器不同,Cell主要采用協(xié)處理器方式,然后依靠多個處理器并行技術來實現(xiàn)運算速度的提高。盡管存在應用程序難以充分利用的弊病,但是其

11、綜合效率以及功耗控制都非常理想,開創(chuàng)了完全可擴展的架構模式。從而為大型機、服務器、以至包括手機在內的所有消費類電子產品提供1個統(tǒng)一的架構平臺。只需要改變頻率、內核數(shù)量等相關參數(shù),即可保證在1個機器上開發(fā)、在所有機器上運行,大大節(jié)省了軟件移植所帶來的費用。因此,使用Cell的手機完全可以與相應的服務器進行直接溝通和資源共享,從而把這些小資源集合成為一個龐大的計算資源,構成一個真正的信息化時代。在這個資源體系中,每個資源節(jié)點可能是微不足道的,但是每個節(jié)點的運算都可能被整個資源庫無窮放大,從而構成一個完整的Cell網(wǎng)絡,為消費類電子的信息網(wǎng)絡化帶來真正的革命。多核處理器的出現(xiàn)則是一場新的計算方式的革

12、命1,2。2006年,處理器開始從單核向多核處理器發(fā)展,多核處理器已不再局限于高端服務器,開始向PC機普及,多核處理器使PC機變成并行式計算機。在多核處理器逐漸成為市場主導后,怎樣利用多核的優(yōu)勢來優(yōu)化并行程序設計成為一個需要研究和解決的問題。多核設計的出現(xiàn)為摩爾定律轉向基辛格規(guī)則帶來了生命力。英特爾推出了雙核、四核至強和雙核安騰處理器,AMD也推出了雙核、四核皓龍芯片,IBM的Power5+芯片也是雙核設計,針對HPC和圖形運算的Cell芯片更是擁有1+8個核,SUN公司的UltrasparcT1擁有8個核,Clearspeed(96核)、思科NPU(192核)、RIKEN(512核)更是推出

13、了擁有數(shù)十個甚至數(shù)百個核的芯片,預計到2020年,千核CPU也會誕生。同時,多核技術在高性能計算中也已獲得了廣泛應用。3可重構計算技術帶來新的亮點以前的計算機硬件技術都是固件化的,無法隨著環(huán)境的改變而改變,產生大量的電子垃圾,不利于環(huán)保經濟的發(fā)展,而可重構計算技術的出現(xiàn)則為我們帶來了曙光??芍貥嬘嬎憔褪峭ㄟ^實現(xiàn)硬件的可編程技術來滿足不同計算任務的需求,從而達到最佳性能,且要求這種硬件結構的變化能實時地適應計算任務要求的變化。這種體系結構可變的特點,可以滿足實際應用中的多元化需求。實現(xiàn)可重構計算的底層技術有FPGA(現(xiàn)場可編程門陣列)和CPLD編程技術。在處理器芯片體系結構設計中采用可重構計算技

14、術的基本思想是通過動態(tài)配置片上大量的處理單元、存儲單元和互連單元,來支持各種不同類型并行性的計算模型,從而能在一個很寬的應用范圍內達到高性能,提高片上硬件資源的利用率?;诳芍貥嬘嬎慵夹g實現(xiàn)的多型微處理芯片體系結構能夠很好地利用半導體技術發(fā)展提供的能力,在解決應用的多樣性問題的同時,還可解決片上資源利用率、設計復雜性、系統(tǒng)可靠性以及降低成本和功耗等多方面的問題??芍貥嬘嬎慵夹g在處理器芯片設計中的應用改變了傳統(tǒng)的指令集體系結構、微體系結構設計和實現(xiàn)技術??芍貥嬘嬎慵夹g3-5使計算機硬件的設計不再復雜,硬件不再只是“硬”,也具備“軟”的特性,即硬件可“編程”。在可編程的介質中提供強大的計算能力和密

15、度,使得在單片系統(tǒng)上以低硬件復雜度開發(fā)出各種類型的應用,同時能夠針對應用中固有的并行性特征動態(tài)配置多個微體系結構模型,從而大幅度提高計算系統(tǒng)性能、降低功耗和設計的復雜性。在設計中通常采用“自頂向下”的方法,即把系統(tǒng)分為若干模塊。原則是使得每個模塊有較獨立的功能,模塊之間的耦合盡可能?。ㄍǔ1憩F(xiàn)為相互通信盡量簡單)。劃分之后,再分別實現(xiàn)每個模塊,最后把模塊像搭積木似地組裝起來。其中某些模塊可以做成現(xiàn)成的,可供設計時使用,即IP核心,它可以重復使用,從而提高了設計效率。再配合成熟的EDA工具作為設計流程的工具鏈,這樣設計就顯得相對容易。當然相對使用高級語言的軟件編程,仍然是難于設計和缺乏靈活性的,

16、其實IP的思想與軟件的靜態(tài)鏈接庫很相似??梢园袸P核心封裝成軟件可調用的庫的形式。庫分為靜態(tài)庫和動態(tài)庫,動態(tài)庫允許在程序執(zhí)行時按需加載和卸載。這相當于硬件在設計運行時,IP核心可以動態(tài)地載入和卸出,當然前提是并不破壞原有程序和數(shù)據(jù)。把IP核心封裝成動態(tài)庫,將是可重構計算平臺最為核心的思想。隨著芯片設計技術的SoC化,如何在1個芯片中集成很多現(xiàn)有的IP核,快速設計系統(tǒng)成為未來研究發(fā)展的重點。這時,IP核的可重用性和可更改性就成了最關鍵的技術,而開放源碼的IP核將提供方向。中國有案可查的開放源碼硬件項目是2001年3月啟動的OpenARM項目,在“中國芯”盛行的那幾年里,不少學校和研究單位參考開放

17、源碼的處理器設計了自己的微處理器。這個時期,中國利用開放源碼硬件的資源進行IC設計的方法開始悄然流行。中國工程院院士許居衍的論文半導體特征循環(huán)與可重構芯片中基于此技術的發(fā)展提出“許氏循環(huán)”3,半導體產品的主要特征將沿著“通用”與“專用”循環(huán)波動,每10年1次,從2018年2028年,將會重新走向通用?!霸S氏循環(huán)”發(fā)展圖如圖2所示。MFlC/U-SoC通用明48專用圖工“許氏循師”找展圖58電路設計許居衍的依據(jù)是,因為“可重構計算是1個難度頗大、涉及面甚廣的課題,盡管當前很多人在研究,但是無論在器件結構、系統(tǒng)結構還是在設計方法學方面,均存在不少問題,仍有很長的路要走??芍貥嬘嬎慵夹g的發(fā)展,最終將

18、推動主流應用進入U-SoC通用波動。只通過對'毛坯芯片'(RawChip)的配置編程就可以得到用戶自定義的功能電路,從而引導半導體產業(yè)結構演變,最終促進芯片應用創(chuàng)新Designless模式的興起"。所謂的Designless,就是無需設計、自動生成集成電路,工程師只需要關注應用和功能層面即可。但實現(xiàn)Disignless的前提是必須軟硬件都開放。因為如果只開放軟件,不知硬件細節(jié),還是無法生成一個完整設計。因此,一個邏輯的發(fā)展應是“硬”、“軟”均可編程,即算法可編程、可重構器件也可編程的U-SoC??芍貥嫾夹g與多核技術的融合自從計算機發(fā)明以來,馮諾依曼體系結構一直占據(jù)計算機體系結構的統(tǒng)治地位,科學家和工程師們在此基礎上不斷研究硬件和軟件,使CPU和存儲器技術得到了飛速的發(fā)展,也為信息化、網(wǎng)絡化奠定了基礎。隨著人們對信息化的要求越來越高,馮諾依曼體系結構已經無法滿足人們的技術需求和發(fā)展要求,對計算機的要求不再僅僅是高速計算,同時更應具備信息處理和智能升級能力??芍貥嫾夹g與多核技術的出現(xiàn)為此提供了基礎。筆者認為新的計算機體系結構將是:(l)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論