版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
Ch1摩爾定律(芯片技術(shù))當(dāng)價格不變時,集成電路上可容納的元器件的數(shù)目,約每隔18-24個月便會增加一倍,性能也將提升一倍。安德厚定律計算機分類的依據(jù):現(xiàn)代計算機應(yīng)用新的分類:個人移動設(shè)備(PersonalMobileDevice(PMD):智能手機、平板電腦等,強調(diào)高效和實時性;桌面計算(DesktopComputing):PC業(yè)務(wù),強調(diào)性價比(priceperformance);服務(wù)器:強調(diào)可用性(availability)、規(guī)?;?可擴展性(scalability)、吞吐率;倉庫級計算機(Clusters/WarehouseScaleComputers(WSA)):用于軟件及服務(wù)(SaaS)服務(wù),強調(diào)性價比和可用性。嵌入式計算(EmbeddedComputers):強調(diào)價格。>應(yīng)用程序中的兩種并行數(shù)據(jù)級并行(Data-LevelParallelism(DLP)):可以同時操作許多數(shù)據(jù)項任務(wù)級并行(Task-LevelParallelism(TLP)):創(chuàng)建一些能夠單獨處理但大量采用并行方式執(zhí)行的工作任務(wù)。Classesofarchitecturalparallelism/計算機硬件實現(xiàn)DLP和TLP兩種并行的4種方式指令級并行(Instruction-LevelParallelism(ILP)):流水線向量體系結(jié)構(gòu)和圖形處理器(Vectorarchitectures/GraphicProcessorUnits(GPUs)):將單條指令并行應(yīng)用于一個數(shù)據(jù)集,以開發(fā)數(shù)據(jù)級并行。線程級并行(Thread-LevelParallelism)請求級并行(Request-LevelParallelism)心Flynn'sTaxonomy(弗林分類法)SISD——標(biāo)準(zhǔn)的順序計算機,可以利用指令級并行SIMD——開發(fā)數(shù)據(jù)級并行MISD——沒有這種類型的商用多處理器,但是包含這種類型后,分類變得完整MIMD——開發(fā)線程級并行?計算機體系結(jié)構(gòu)經(jīng)典:機器語言程序員所看到的傳統(tǒng)機器級所具有的屬性,即概念性結(jié)構(gòu)與功能特性。計算機組成:計算機系統(tǒng)結(jié)構(gòu)的邏輯實現(xiàn)一種體系結(jié)構(gòu)可以有多種組成。e.g.X86一種組成可以有多種物理實現(xiàn)現(xiàn)代計算機體系結(jié)構(gòu)則包括組成與實現(xiàn),即計算機系統(tǒng)的層次結(jié)構(gòu)。>ISA(指令集體系結(jié)構(gòu))
ARM&&MIPS80x86ISA分類載入-存儲ISA寄存器-存儲器ISA存儲器尋址必須對齊不需要對齊尋址模式MIPS:寄存器尋址、立即數(shù)尋址、位移量尋址ARM:...+程序計數(shù)器尋址、兩個寄存器之和???+位移量的3種變化形式(寄存器間接尋址、基址尋址、變址尋址)操作數(shù)的類型和大小8、16、32、64、IEEE754浮點數(shù)還支持80位浮點數(shù)操作指令簡單、易于實現(xiàn)流水化豐富、大控制流指令MIPS條件分支檢測寄存器中的內(nèi)容;ARM和MIPS將返回地址放在寄存器中和ARM分支測試條件代碼位;將返回地址放在存儲器的一個棧中ISA的編碼定長32位變長1-18字節(jié)>趨勢技術(shù)趨勢(5)集成電路邏輯技術(shù);半導(dǎo)體DRAM;半導(dǎo)體閃存;磁盤技術(shù);網(wǎng)絡(luò)技術(shù)性能趨勢帶寬優(yōu)于時延集成電路中的功率和能耗趨勢在時鐘頻率和電源電壓保持不變的情況下,提咼能耗效率成本趨勢構(gòu)建成本:技術(shù)改進(jìn)運行成本:需要高效利用能源來降低虛擬機:由軟件實現(xiàn)的機器系列機:由同一廠家生產(chǎn)的具有相同的系統(tǒng)結(jié)構(gòu),但具有不同的組成和實現(xiàn)的一系列不同型號的機器。WSC和服務(wù)器:相同:非常看重可用性WSC以很多廉價組件作為構(gòu)建模塊,依靠軟件層來捕獲和隔離在這一級別進(jìn)行計算時發(fā)生的許多故障。WSC的可擴展性通過連接這些計算機的局域網(wǎng)實現(xiàn),而服務(wù)器則是通過集成計算機硬件來實現(xiàn)。WSA和超級計算機:相同:非常昂貴超級計算機強調(diào)浮點性能,常用于運行大型的、通信密集的批程序,這些程序可能一次運行幾個星期。這種緊密耦合性決定了超級計算機要使用非常快速的內(nèi)部網(wǎng)絡(luò);而WSC則更重視互動應(yīng)用程序、大規(guī)模存儲、可靠性和很高的因特網(wǎng)帶寬。
心PrinciplesofComputerDesign充分利用并行局部性原理(時間局部性、控件局部性)以經(jīng)常性事件為重點Amdahl定律加快某部件執(zhí)行速度所能獲得的系統(tǒng)性能加速比,受限于該部件的執(zhí)行時間占系統(tǒng)中總執(zhí)行時間的百分比。加速比依賴于兩個因素:可改進(jìn)比例和部件加速比加速比=總執(zhí)行時間改進(jìn)前總執(zhí)行時間加速比=總執(zhí)行時間改進(jìn)前總執(zhí)行時間改進(jìn)后(1一可改進(jìn)比例)+可改進(jìn)比例部件加速比⑤CPU性能公式CPU時間=指令數(shù)xCPIx時鐘周期數(shù)>MTTF:平均無故障時間MTTR:平均修復(fù)時間MTBF:平均故障間隔時間MTBF=MTTF+MTTR> Ch2>存儲器層次結(jié)構(gòu)服務(wù)器:CPU(寄存器)fL1緩存fL2緩存fL3緩存f存儲器f磁盤存儲PMD:CPU(寄存器)fL1緩存fL2緩存f存儲器f磁盤存儲>從用戶的角度來看,存儲器的三個主要指標(biāo):容量、速度和價格(指每位價格)>從主存的角度來看:“Cache—主存”層次:彌補主存速度的不足“主存一輔存”層次:彌補主存容量的不足>全相聯(lián):主存中的任一塊可以被放置到Cache中的任意一個位置。直接映象:主存中的每一塊只能被放置到Cache中唯一的一個位置。組相聯(lián):主存中的每一塊可以被放置到Cache中唯一的一個組中的任何一個位置。
"Cache—主存”與“主存一輔存”層次的區(qū)別頂uCache-主存"層次“主存-舲磁目 的為了彌補主存速度的不足為了彌補主存容量的不足存緒理弼主要由專用碩件實現(xiàn)主要由軟件實現(xiàn)訪間速度的比值第一級和第m幾比一幾百比_典型的塊(頁)大小幾十個字節(jié)幾詡幾樸川CPI-般二及的訪問方式可直接訪問均通過第一級失效時CPU是否切換不切換切換到其他進(jìn)程1?“寫"操作必須在確認(rèn)是命中后才可進(jìn)行"寫”訪問有可能導(dǎo)致Caehe和主存內(nèi)容的不一致兩種寫策略寫策略是區(qū)分不同Cache設(shè)計方案的一個重要標(biāo)志。>寫直達(dá)法執(zhí)行“寫”操作時,不僅寫入Cache,而且也寫入下一級存儲器。>寫回法(也稱為拷回法)執(zhí)行“寫”操作時,只寫入Cache.僅當(dāng)Oiche中相應(yīng)
的塊被替換時,才寫回主存。(設(shè)置“修改位”)平均訪存時間公式可以分為指令訪問和數(shù)據(jù)訪問兩部分:平均訪存時間=指令所占的百分比X(指令命中時間+指令失效率X失效開銷)
十?dāng)?shù)據(jù)所占的百分比X(數(shù)據(jù)命中時間十?dāng)?shù)據(jù)失效率X失效開銷)1.稈序執(zhí)行時間CPU時間=(CPU執(zhí)行周期數(shù)+存儲器停頓周期數(shù)》X時鐘周期時間其中:存儲器停頓時鐘周期數(shù)=“讀”的次數(shù)X讀失效率X讀失效開銷+“寫”的次數(shù)X寫失效率X寫失效開銷存儲器停頓時鐘周期數(shù)=訪存次數(shù)X失效率X失效開銷訪存次數(shù)
指令數(shù)X失效率X失效開銷卜時鐘周期時間訪存次數(shù)
指令數(shù)X失效率X失效開銷卜時鐘周期時間每條指令的平均失效次數(shù)=盍奚譽扌曰令遜.訪存枕.數(shù)X失效率指令數(shù)寸間=7Cx|CJVs破”+存儲青作瞿期數(shù))乂時鐘周期時間例5.2我們用一個和AlphaAXP類似的機器作為第一個例子口假設(shè)心證血失效開銷為50個時鐘周期,當(dāng)不考慮存儲器停頓時,所有指令的執(zhí)行時間都是迂0個時鐘周期,訪問gche失效率為2%,平均每條指令訪存1.33次°試分析Ceiche對性能的影響口解別時間=心ICPI品+存儲科數(shù)X時鐘周期時間考慮C眈血的失效后,性能為:EPU時間^CMhfl=ICX(2.0+1.33X2%X50)X時鐘周期時間=ICX3.33X時鐘周期時間實際丹:3.3333/2.0=1.67(倍)QPU時間也增加為原來的1.研倍.但若不采用Cache,則=CPI=2.0+50X1.33=68.5>Cache對于低CPI、高時鐘頻率的CPU來說更加重要。>優(yōu)化緩存性能的16種方法增大塊降低失效率增大緩存提高相聯(lián)程度采用多級緩存讓讀失效優(yōu)先于寫在緩存索引期間避免地址轉(zhuǎn)換縮短命中時間容量小、結(jié)構(gòu)簡單的cache縮短命中時間路預(yù)測實現(xiàn)緩存訪問的流水化增加緩存帶寬采用無阻塞緩存采用多種緩存合并寫緩沖區(qū)降低缺失代價編譯器優(yōu)化(循環(huán)父換、分塊)降低缺失率對指令和數(shù)據(jù)進(jìn)行硬件預(yù)取降低缺失代價或缺失率用編譯器控制預(yù)取5.3.4VictimCache一種能減少沖突失效次數(shù)而又不影響時鐘頻率的方法?;舅枷?gt;在Cache和它從下一級存儲器調(diào)數(shù)據(jù)的通路之間設(shè)置一個全相聯(lián)的小Cache,用于存放被替換出去的塊(稱為Victim),以備重用。> Ch3SIMDvsMIMD(3個優(yōu)勢)?SIMD的3種變體:向量體系結(jié)構(gòu)、多媒體SMD指令集擴展、圖形處理單元GPUVMIPS的主要組件(4)流水線沖突是指對于具體的流水線來說,由于相關(guān)的存在,使得指令流中的下一條指令不能在指定的時鐘周期執(zhí)彳丁。流水線沖突有三種類型:結(jié)構(gòu)沖突、數(shù)據(jù)沖突、控制沖突1.最基本的開發(fā)循環(huán)級并行的技術(shù)>循環(huán)展開(loopunrolIing)技術(shù)》 >采用向量扌旨令和向量數(shù)扌啟表示Tomasulo算法:核心思想:記錄和檢測指令相關(guān),操作數(shù)一旦就緒就立即執(zhí)行,把發(fā)生RAW沖突的可能性減少到最??;通過寄存器換名來消除WAR沖突和WAW沖突。 >緩存一致性協(xié)議(Cachecoherenceprotocols):為多個處理器保存緩存一致性的協(xié)議>解決緩存一致性的兩種協(xié)議:基于目錄的協(xié)議(directorybased):用特定的物理存儲快來保存每一個塊的共享狀態(tài)。監(jiān)聽式的協(xié)議(snooping):如果一個緩存擁有某一物理存儲器塊中的數(shù)據(jù)副本,它就可以跟蹤該塊的共享狀態(tài)。>監(jiān)聽一致性協(xié)議寫入失效協(xié)議(writeinvalidateprotocol):確保處理器在寫入某一數(shù)據(jù)項之前,獲取對改數(shù)據(jù)項的獨占訪問,在執(zhí)行寫操作時會使其他副本失效。使用總線來執(zhí)行失效操作。在獲得總線訪問權(quán)限之前,無法實際完成共享數(shù)據(jù)項的寫入操作。寫入更新協(xié)議(writeupdate):在寫入一個數(shù)據(jù)項時更新該數(shù)據(jù)項的所有緩存副本計算機的發(fā)展歷程:數(shù)據(jù)處理、信息處理、知識處理、智能處理解決一致性問題的策略: >WSCv.s.HPCHPC的處理器和節(jié)點之間的網(wǎng)絡(luò)通常比WSC中快得多,因為HPC應(yīng)用程序的獨立性更強,通信更頻繁。HPC傾向于使用定制硬件(特別是在網(wǎng)絡(luò)中),通常不能通過使用大眾化商用芯片來降低成本。HPC強調(diào)線程級并行或數(shù)據(jù)級并行,通常強調(diào)完成單項任務(wù)的延遲,WSC強調(diào)請求級并行。HPC集群通常擁有長時間的運行的作業(yè),會使服務(wù)器滿荷運行,甚至能持續(xù)數(shù)周以上,而WSC中服務(wù)器的利用率在10%-50%之間,而且每天都會發(fā)生變化。WSCv.s.Datacenters數(shù)據(jù)中心集不同的硬件和軟件于一身,為一家組織中的不同客戶提供服務(wù)oWSC使倉庫中的硬件和軟件看起來像只有一臺計算機,只是在上面運行著各種不同的應(yīng)用程序。傳統(tǒng)數(shù)據(jù)中心的最大成本是維護(hù)人員的費用,WSC中,服務(wù)器硬件是最大的成本。傳統(tǒng)數(shù)據(jù)中心不具備WSC的規(guī)模,無法獲得規(guī)模經(jīng)濟效應(yīng),也沒有WSC面對的挑戰(zhàn)和機遇,無論是體系結(jié)構(gòu)方面還是運轉(zhuǎn)方面。WSC的成本構(gòu)建成本【Capitalexpenditures(CAPEX)資本性支出】:服務(wù)器、電力與制冷基礎(chǔ)設(shè)備、網(wǎng)絡(luò)設(shè)備、其他基礎(chǔ)設(shè)備運行成本【Operationalexpenditures(OPEX)運行性支出】:用電成本、安全與設(shè)施管理人力成本PUE(PowerUtilizationEffectiveness功率利用效率) 測量WSC的效率PUE=總設(shè)施功率/IT設(shè)備功率PUE三1,PUE越大,WSC的效率就越低云計算的三個特點:風(fēng)險轉(zhuǎn)移、成本相關(guān)性、按需付費云計算服務(wù)的框架一一“SPI”。這個縮寫代表著云計算提供的三種主要的服務(wù):軟件即服務(wù)(software-as-a-service,SaaS),平臺即服務(wù)(platform-as-a-service,PaaS),以及基礎(chǔ)設(shè)施即服務(wù)(infrastructure-as-a-service,IaaS)。圖2-3描述了云計算的服務(wù)、用戶和類型之間的關(guān)系。最燙用戶平臺提洪商服箸接口按使用重收費按里收喪朋勢接口應(yīng)用朋箸提供商XASP^-ApplicationServiceProvider^基礎(chǔ)設(shè)施即朋務(wù)(IaaS)按使用里收費云計算荃礎(chǔ)設(shè)施提供商/虛擬化層)最燙用戶平臺提洪商服箸接口按使用重收費按里收喪朋勢接口應(yīng)用朋箸提供商XASP^-ApplicationServiceProvider^基礎(chǔ)設(shè)施即朋務(wù)(IaaS)按使用里收費云計算荃礎(chǔ)設(shè)施提供商/虛擬化層)性能的發(fā)展趨勢一一帶寬優(yōu)于時延2014.10.163計算機技術(shù)的飛速發(fā)展得益于兩個方面:計算機制造技術(shù)的發(fā)展、計算機系統(tǒng)結(jié)構(gòu)的創(chuàng)新計算機系統(tǒng)中的透明性舉例:浮點運算器、多核透明性一虛擬化一云計算計算機體系結(jié)構(gòu):必考:定量原理(5個)30%1、以經(jīng)常性事件為重點(大概率事件優(yōu)先原則)2014、10、23軟件應(yīng)滿足可以向上和向后兼容。解釋方法:一條一條指令地調(diào)進(jìn)內(nèi)存,一條一條地解釋。時間長但花費空間少提高并行性的技術(shù)途徑:時間重疊(流水技術(shù))資源重復(fù):引入空間因素,以數(shù)量取勝。資源共享計算機的分類劃代主要以器件作為劃分標(biāo)準(zhǔn)2014.10.30優(yōu)化緩存性能的16種方法(必考)2014.11.27第四章考試比例較小開發(fā)ILP涉及到的主要技術(shù)(可能考)參考課件后的:ILP研究中為客服各種停頓所采取的相關(guān)技術(shù)。2014.12.4開放考題:GPU、云計算(軟件級服務(wù),平臺式服務(wù)。。。3個)(與書上第六章相關(guān),并適當(dāng)查詢新資料)E.g.超算中心有什么特別之處(可能考)Thamosulo算法核心思想、基本概念第四章沒有計算題,主要考GPU和SIMD...SIMD的三個變體加速比(必考)2014.12.18考點:看書上相關(guān)的例子重新寫消除相關(guān)(寄存器重命名)期末考試不考流水線2014.12.25考:填空:云計算的三個特點:風(fēng)險轉(zhuǎn)移、成本相關(guān)性、按需付費考:概念題:PUEPUE總是大于等于1PUE等于1最佳大于1時說明資源浪費考:解釋W(xué)SC的成本:構(gòu)建成本和運行成本畫出SPM模型(3個服務(wù))HPC服務(wù)器2015.1.8(考點)計算機性能的變遷:從單處理器到多核將來的計算機:智能并行性分級存儲結(jié)構(gòu)相聯(lián)3C4C模式3C模式:強制(Compulsory)、容量(Capacity)、沖突(Conflict)、一致性(Coherency)缺失平均訪存公式優(yōu)化(6基本+10高級(分5類))三、 相關(guān)ILP流水線消除停頓的方法不計算Tomasulo算法基本思想CPIIPC相關(guān)性在數(shù)組的情況下如何解決相關(guān)性四、SIMD的三種變體數(shù)據(jù)級并行相關(guān)性的引申第四章的相關(guān)性的例子五、 (期中測過)兩個協(xié)議解決一次性問題的策略倉庫級計算機的基礎(chǔ)設(shè)施和價格——運行成本(制冷等)PUE的公式構(gòu)建成本和運行成本云計算訃算機休系結(jié)構(gòu)和關(guān)公式1.CPU時伺比旨令數(shù)xCPIx時鐘周期時間2X的速度杲丫的門倍:n茫執(zhí)行時閭丫/執(zhí)行時同?=料就J件能yAmdahl逞律:總加速比=療抗行時間(總加速比=療抗行時間(1-升級比例H升級比例
升級加速比4?能耗*容性負(fù)菽*電壓“5.功率立工g*容性負(fù)載龍電壓S開關(guān)頻率6.功率曲x電流機*電壓7
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 水利設(shè)施旅游開發(fā)合同協(xié)議書
- 初中語文教材和教學(xué)方法改革計劃
- 課程設(shè)計師職稱
- 旅游公司法人聘用合同
- 經(jīng)濟區(qū)砌磚施工合同
- 2024物品財務(wù)擔(dān)保合同范本
- 馬道保護(hù)層開挖課程設(shè)計
- 供熱供氣施工合同
- 實驗室消防安全施工方案
- 混凝土雙向板課程設(shè)計
- 高中英語語法教學(xué)與信息技術(shù)融合的教學(xué)設(shè)計高三英語復(fù)習(xí)
- 《舞劇》教學(xué)設(shè)計(湖北省縣級優(yōu)課)-八年級音樂教案
- 小學(xué)三年級(2)班家長會
- 基于主題意義探究下的小學(xué)英語單元整體教學(xué)設(shè)計實踐探究 論文
- 國家開放大學(xué)-機電控制與可編程控制器課程專題報告
- 鍋爐汽包水位串級三沖量給水控制系統(tǒng)設(shè)計
- 監(jiān)理檢測方案
- 驗收測試大綱
- 卷管道施工方案
- 動物感覺系統(tǒng)-眼(動物解剖生理課件)
- 系統(tǒng)運維年終總結(jié)模板
評論
0/150
提交評論