高級計算機體系結構第3章2_第1頁
高級計算機體系結構第3章2_第2頁
高級計算機體系結構第3章2_第3頁
高級計算機體系結構第3章2_第4頁
高級計算機體系結構第3章2_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、15 5、CacheCache一致性協(xié)議一致性協(xié)議(1)(1)一致性協(xié)議一致性協(xié)議 * *原理:原理:各各CacheCache中的塊均設有狀態(tài)位,某中的塊均設有狀態(tài)位,某CacheCache中塊的數(shù)據(jù)中塊的數(shù)據(jù)被改變時,其它被改變時,其它CacheCache相應改變相應改變該塊的該塊的狀態(tài)或數(shù)據(jù)狀態(tài)或數(shù)據(jù) * *種類:種類:有有基于作廢基于作廢、基于更新基于更新兩種一致性兩種一致性協(xié)議協(xié)議(2)(2)一致性協(xié)議的實現(xiàn)一致性協(xié)議的實現(xiàn) * *方法方法:某某CacheCache產(chǎn)生產(chǎn)生事務事務( (通知改變通知改變) ),其余,其余CacheCache響應響應事務事務 * *途徑途徑:互連結構不同

2、,獲得塊改變信息的有效途徑不同,互連結構不同,獲得塊改變信息的有效途徑不同, 共有共有總線總線監(jiān)聽法監(jiān)聽法或或目錄法目錄法兩種兩種途徑途徑(3)(3)一致性協(xié)議的性能參數(shù)一致性協(xié)議的性能參數(shù) * *性能參數(shù)性能參數(shù):總線流量、撲空總線流量、撲空率率、更新速率等、更新速率等 * *影響因素:影響因素:CacheCache參數(shù)、一致性粒度等參數(shù)、一致性粒度等轉上頁2四、并行計算機四、并行計算機通信機構通信機構1 1、通信操作、通信操作 * *通信過程通信過程: P P通知通信開始通知通信開始 拷貝到緩沖區(qū)拷貝到緩沖區(qū)打包打包 NICNIC啟動包傳輸啟動包傳輸網(wǎng)絡網(wǎng)絡傳輸傳輸 NICNIC接收數(shù)據(jù)包

3、接收數(shù)據(jù)包通知信息到達通知信息到達拆包拆包( (含保護檢查含保護檢查) ) 通知通知通信請求到達通信請求到達處理通信操作處理通信操作發(fā)送通信結果發(fā)送通信結果等等 * *實現(xiàn)分析:實現(xiàn)分析:整個過程整個過程由由P P、OSOS、NICNIC分工分工協(xié)作協(xié)作完成完成; 部分部分階段階段可可選擇選擇由硬件由硬件/ /軟件實現(xiàn)軟件實現(xiàn)互連網(wǎng)絡互連網(wǎng)絡M M1 1NICNIC1 1P P1 1 /C/C1 1MBMB節(jié)點節(jié)點1 1BridgeBridge1 1IOBIOBM Mn nNICNICn nP Pn n /C/Cn nMBMB節(jié)點節(jié)點n nBridgeBridgen nIOBIOB回下頁3 *

4、 *性能指標:性能指標:時延、帶寬、時延、帶寬、代價代價 通信時間通信時間(n)=(n)=開銷開銷數(shù)據(jù)時延數(shù)據(jù)時延網(wǎng)絡延遲網(wǎng)絡延遲占用度占用度 =t=t0 0n/n/B Bt tl lt tc c 其中:其中: t t0 0-P-P通知通信開始通知通信開始NICNIC啟動傳輸?shù)膯觽鬏數(shù)难舆t延遲 t tc c數(shù)據(jù)包數(shù)據(jù)包占用網(wǎng)絡資源導致沖突而等待的占用網(wǎng)絡資源導致沖突而等待的延遲延遲 t tl l數(shù)據(jù)包數(shù)據(jù)包穿過網(wǎng)絡穿過網(wǎng)絡( (無沖突無沖突) )的的延遲延遲 * *影響性能的因素:影響性能的因素: 通信通信硬件硬件指指NICNIC等功能的延遲等功能的延遲 通信軟件通信軟件指多次接口抽象、緩沖

5、區(qū)拷貝等的指多次接口抽象、緩沖區(qū)拷貝等的開銷開銷 通信通信服務服務指服務質(zhì)量指服務質(zhì)量( (可靠傳輸可靠傳輸、流控、失效處理、流控、失效處理、按序傳輸、按序傳輸) )等的等的開銷開銷( (分攤在分攤在NICNIC及通信軟件中及通信軟件中) )轉上頁回34頁 通信通信代價代價= =頻率頻率( (通信通信時間時間重疊重疊時間時間) ) =f=f(t(t0 0n/n/B Bt tc ct tl lt toverlapoverlap) ) 注:通信重疊有通信注:通信重疊有通信- -計算、通信計算、通信- -通信重疊兩種通信重疊兩種42 2、通信操作與編程模型、通信操作與編程模型 * *( (并行并行)

6、 )編程模型:編程模型:數(shù)據(jù)并行、共享變量、消息數(shù)據(jù)并行、共享變量、消息傳輸傳輸3 3種種 * *通信操作通信操作- -編程模型:編程模型:不同編程模型的通信操作差距較大不同編程模型的通信操作差距較大(1(1) )通信通信操作的要求操作的要求 * *通信表示要求:通信表示要求:隱式、顯隱式、顯式式方式方式2 2種,種,穿插穿插在程序中在程序中 * *通信定通信定序要求:序要求: 普通及通信操作普通及通信操作各進程按各進程按程序次序程序次序( (隱式隱式) )定序定序 特定通信操作特定通信操作全局按全局按同步操作同步操作( (顯式顯式) )定序定序 * *通信方式通信方式要求要求:有有同步、異步

7、互鎖、異步非互同步、異步互鎖、異步非互鎖鎖3 3種種 * *通信模式通信模式要求:要求:有一對一有一對一( (如點點如點點) )、一對多、一對多( (如廣播如廣播) )、多對一、多對一( (如聚集如聚集) )、多對多、多對多( (如置換如置換) )4 4種種P P0 0:P P1 1:R RW W1 1R R1 1W WW W2 2R R2 2W W2 2R R2 2R RW W3 3=0=0=1=1R R3 35(2)(2)數(shù)據(jù)并行數(shù)據(jù)并行模型的通信操作模型的通信操作 * *特點:特點:單線程單線程、松散同步、松散同步( (語句級語句級) )并行、單地址空間、數(shù)并行、單地址空間、數(shù)據(jù)并行、據(jù)

8、并行、隱隱式分配式分配( (屏蔽方式屏蔽方式) ) * *通信操作:通信操作:PUPU間通信間通信ININ、OUTOUT,顯式完成,顯式完成 PUPU間同步間同步無無( (松散同步自動實現(xiàn)松散同步自動實現(xiàn)) )(3)(3)共享變量共享變量模型的通信操作模型的通信操作 * *特點:特點:多線程多線程、異步并行、異步并行、單地址空間單地址空間、操作并行、操作并行、顯顯式分配式分配 * *通信操作:通信操作:P P間通信間通信R R、W W,隱式,隱式完成完成 P P間同步間同步進程進程創(chuàng)建創(chuàng)建( (操作操作) )、撤消、撤消/ /同步同步( (操作操作) )(4)(4)消息傳遞消息傳遞模型的通信操

9、作模型的通信操作 * *特點:特點:多線程多線程、異步并行、異步并行、多地址空間多地址空間、操作并行、操作并行、顯顯式分配式分配 * *通信通信操作:操作:P P間通信間通信SendSend、RecvRecv,顯式顯式完成完成 P P間同步間同步進程進程創(chuàng)建創(chuàng)建( (操作操作) )、撤消、撤消/ /同步同步( (通信通信) )回33頁63 3、通信機構的組成、通信機構的組成 * *通信機構層次結構通信機構層次結構: * *通信機構研究通信機構研究內(nèi)容:內(nèi)容: 定義定義通信操作、通信原語、硬件原語通信操作、通信原語、硬件原語 ( (用戶用戶/ /系統(tǒng)層系統(tǒng)層) () (軟件軟件/ /硬件層硬件層

10、) ) 確定確定高效高效地實現(xiàn)地實現(xiàn)這些原語的方法這些原語的方法回34頁無通信無通信操作操作注注:通信:通信抽象抽象用戶層實現(xiàn)編程模型的通信操作用戶層實現(xiàn)編程模型的通信操作( (或原語或原語) )用戶用戶/ /系統(tǒng)邊界系統(tǒng)邊界軟件軟件/ /硬件邊界硬件邊界操作系統(tǒng)層操作系統(tǒng)層通信硬件層通信硬件層( (如如NIC)NIC)物理通信介質(zhì)層物理通信介質(zhì)層( (如如IN)IN)編譯或庫層編譯或庫層 CADCAD 數(shù)據(jù)庫數(shù)據(jù)庫 科學科學建模等建模等 并行應用并行應用 多道程序多道程序 共享變量共享變量 消息傳遞消息傳遞 數(shù)據(jù)并行數(shù)據(jù)并行 編程模型編程模型通信抽象通信抽象74 4、通信機構的實現(xiàn)通信機構的

11、實現(xiàn) * *通信抽象通信抽象( (通信通信操作操作) ): 共享變量共享變量模型模型ReadRead、WriteWrite指令指令,高級同步,高級同步結構結構 消息消息傳遞模型傳遞模型SendSend、RecvRecv函數(shù)函數(shù),高級同步,高級同步結構結構 * *用戶用戶/ /系統(tǒng)通信系統(tǒng)通信邊界邊界( (通信原語通信原語) ): 共享變量共享變量模型模型ReadRead、WriteWrite操作操作,低級同步,低級同步原語原語 消息消息傳遞模型傳遞模型SendSend、RecvRecv操作操作,低級同步,低級同步原語原語共享變量共享變量消息傳遞消息傳遞UMAUMA訪存模型訪存模型地址映射地址映

12、射 NICNIC實現(xiàn)虛實現(xiàn)虛- -實地址映射實地址映射傳輸實現(xiàn)傳輸實現(xiàn) NICNIC通過通過總線操作總線操作實現(xiàn)實現(xiàn)NUMANUMA訪存模型訪存模型地址映射地址映射 NICNIC或或OSOS實現(xiàn)地址映射實現(xiàn)地址映射傳輸實現(xiàn)傳輸實現(xiàn) NICNIC通過通過網(wǎng)絡事務網(wǎng)絡事務實現(xiàn)實現(xiàn)NORMANORMA訪存模型訪存模型地址映射地址映射OSOS實現(xiàn)進程實現(xiàn)進程- -節(jié)點映射節(jié)點映射傳輸實現(xiàn)傳輸實現(xiàn)NICNIC通過通過網(wǎng)絡事務網(wǎng)絡事務實現(xiàn)實現(xiàn) * *軟件軟件/ /硬件通信邊界硬件通信邊界:轉31頁OSOS組織并實現(xiàn)組織并實現(xiàn)各種通信操作各種通信操作8 * *通信模型的可擴展性:通信模型的可擴展性: 取決于

13、取決于結構模型結構模型及及互連網(wǎng)絡互連網(wǎng)絡的可的可擴展性擴展性5 5、通信機構的通信機構的性能性能 * *通信抽象的性能:通信抽象的性能: 性能參數(shù)性能參數(shù)通信操作的通信操作的使用效率使用效率 影響因素影響因素對對應用程序應用程序的支持程度的支持程度 對對編譯器編譯器/ /運行庫運行庫的支持程度的支持程度 * *通信通信實現(xiàn)的性能:實現(xiàn)的性能: 性能參數(shù)性能參數(shù)通信原語通信原語( (含硬件原語含硬件原語) )的的延遲延遲和和開銷開銷 影響因素影響因素實現(xiàn)過程的實現(xiàn)過程的軟硬件功能軟硬件功能分配分配 互連網(wǎng)絡的互連網(wǎng)絡的性能性能 通信通信- -計算、通信計算、通信- -通信間的通信間的重疊重疊程

14、度程度轉32頁轉29頁9五、并行計算機五、并行計算機同步機構同步機構1 1、同步操作、同步操作 用于實現(xiàn)用于實現(xiàn)兩個或多個進程兩個或多個進程間的同步間的同步 * *類型:類型:互斥、點點事件、柵障事件互斥、點點事件、柵障事件( (全局事件全局事件) )進程進程1 1:進程進程2 2:進程進程3 3:II1212 請求請求請求請求請求請求獲得獲得釋放釋放等待等待等待等待II1313 等待等待II3333 II2222 獲得獲得II2323 II1111 II2121 II3131 各進程競爭同步權各進程競爭同步權獲得獲得釋放釋放II3232 釋放釋放 * *組成組成:獲得方法、等待算法、釋放獲得

15、方法、等待算法、釋放方法方法回下頁同步同步原子操作原子操作控制同步控制同步數(shù)據(jù)同步數(shù)據(jù)同步互斥互斥路障路障找到找到信號燈和鎖信號燈和鎖產(chǎn)產(chǎn)- -銷銷池和隊列池和隊列102 2、同步機構的實現(xiàn)同步機構的實現(xiàn) * *同步結構:同步結構: 事件事件( (Signal/WaitSignal/Wait)用于點點事件同步用于點點事件同步 路障路障( (BarrierBarrier)用于柵障事件同步用于柵障事件同步 鎖鎖( (Lock/UnlockLock/Unlock) )和臨界區(qū)和臨界區(qū)( (E/L CriticalE/L Critical)用于互斥用于互斥 * *硬件原語硬件原語: 具有具有讀讀- -

16、改改- -寫功能寫功能的的原子操作指令原子操作指令 例例Test&SetTest&Set、Compare&SwapCompare&Swap、Fetch&AddFetch&Add等指令等指令 * *同步機構研究同步機構研究內(nèi)容:內(nèi)容: 定義定義編程模型的編程模型的同步結構同步結構、軟件軟件/ /硬件的硬件的硬件原語硬件原語 確定確定高效實現(xiàn)同步結構的方法高效實現(xiàn)同步結構的方法轉上頁派生派生113 3、同步模型的性能、同步模型的性能 * *接口抽象的性能:接口抽象的性能: 性能參數(shù)性能參數(shù)同步結構的同步結構的使用效率使用效率 影響因素影響因素對應用程

17、序、編譯器對應用程序、編譯器/ /運行庫的運行庫的支持支持程度程度 * *同步實現(xiàn)的性能:同步實現(xiàn)的性能: 性能性能參數(shù)參數(shù)延遲、通信量、公正性、可擴放延遲、通信量、公正性、可擴放性性 影響因素影響因素同步同步權的獲得方法、等待算法、釋放權的獲得方法、等待算法、釋放方法方法 (主要(主要反映為低級同步原語的反映為低級同步原語的性能)性能)12六、并行計算機體系結構發(fā)展六、并行計算機體系結構發(fā)展1 1、并行體系結構比較、并行體系結構比較 * *結構內(nèi)容比較:結構內(nèi)容比較:并行類型并行類型SIMDSIMDMIMDMIMD結構模型結構模型SIMDSIMD集中式集中式(MBus)(MBus)分布式分布

18、式( (MbusMbus/ /IOBusIOBus) )PVPPVPSMPSMPDSMDSMMPPMPPCOWCOW訪存模型訪存模型UMAUMAUMAUMACOMACOMA、CC-NUMACC-NUMA NCC-NUMANCC-NUMANORMANORMA單地址單地址單地址單地址單地址單地址多地址多地址一致性一致性模型模型CacheCache無無無無支持支持支持支持不支持不支持無無存儲存儲順序順序順序順序 所有類型所有類型所有類型所有類型所有類型所有類型通信及同步通信及同步數(shù)據(jù)并行數(shù)據(jù)并行共享變量共享變量共享變量共享變量消息傳遞消息傳遞互連互連網(wǎng)絡網(wǎng)絡控制控制 集中控制集中控制分布控制分布控制

19、類型類型定制定制交叉交叉開關開關總線或總線或交叉開關交叉開關定制定制定制定制 商用商用回下頁 * *相互影響:相互影響:結構與訪存模型,通信結構與訪存模型,通信/ /同步機構與編程模型,同步機構與編程模型, 一致性模型與程序性能及系統(tǒng)性能一致性模型與程序性能及系統(tǒng)性能132 2、并行體系結構發(fā)展、并行體系結構發(fā)展(1)(1)機器組織的發(fā)展機器組織的發(fā)展向通用結構向通用結構發(fā)展發(fā)展 * *殼體系結構殼體系結構成為成為主流:主流:殼殼結構結構有利于有利于P P的代的代可可擴展性擴展性 * *MPPMPP與與COWCOW的界線越來越含糊:的界線越來越含糊:COWCOW現(xiàn)多為緊耦合、共享現(xiàn)多為緊耦合、

20、共享HDHD互連網(wǎng)絡互連網(wǎng)絡NICNIC節(jié)點節(jié)點n n(a)(a)無共享無共享LMLMNICNIC節(jié)點節(jié)點1 1C CLDLDP PShellShellLMLMNICNIC節(jié)點節(jié)點1 1C CP PShellShell互連網(wǎng)絡互連網(wǎng)絡(b)(b)共享磁盤共享磁盤NICNIC節(jié)點節(jié)點n nSDSD(c)(c)共享存儲器共享存儲器NICNIC節(jié)點節(jié)點1 1C CP PShellShell互連網(wǎng)絡互連網(wǎng)絡NICNIC節(jié)點節(jié)點n nSDSDSMSM可擴展并行計算機可擴展并行計算機的常用的常用體系結構體系結構轉上頁回下頁 * *DSMDSM是是SMPSMP、MPPMPP的自然的自然結合:結合:NUMAN

21、UMA利于系統(tǒng)的可擴展性利于系統(tǒng)的可擴展性14(2)(2)通信機制的發(fā)展通信機制的發(fā)展向混合模型發(fā)展向混合模型發(fā)展 * *通信通信的硬件實現(xiàn)方法趨于統(tǒng)一的硬件實現(xiàn)方法趨于統(tǒng)一 分布式結構為主流結構,分布式結構為主流結構, NIC NIC通過通過網(wǎng)絡事務網(wǎng)絡事務實現(xiàn)遠程節(jié)點實現(xiàn)遠程節(jié)點訪問,訪問, NICNIC或或OSOS轉換轉換成編程模型所需接口成編程模型所需接口( (R/WR/W操作和消息傳遞操作和消息傳遞) ) * *編程編程模型與機器組織逐步模型與機器組織逐步分離:分離: 同同一一機器機器可通過運行庫或可通過運行庫或OSOS實現(xiàn)實現(xiàn)不同編程模型不同編程模型 單地址空間機器的消息傳遞單地址

22、空間機器的消息傳遞可用可用共享的共享的緩沖區(qū)緩沖區(qū)實現(xiàn)實現(xiàn) 多地址空間機器的遠程多地址空間機器的遠程R/WR/W a)APPa)APP可構成可構成全局地址空間全局地址空間,利用,利用運行庫運行庫實現(xiàn)實現(xiàn) b)b)進程組可進程組可有有頁級頁級共享地址空間共享地址空間,利用缺頁異常,利用缺頁異常OSOS遠程遠程調(diào)調(diào)頁實現(xiàn)頁實現(xiàn)轉上頁15(3)(3)互連網(wǎng)絡的發(fā)展互連網(wǎng)絡的發(fā)展向可向可擴展及商品化擴展及商品化發(fā)展發(fā)展 * *技術革新使技術革新使ININ可可擴展性擴展性較強:較強: +IN+IN采用采用蟲孔尋徑蟲孔尋徑傳輸方式,對傳輸方式,對ININ拓撲結構拓撲結構的要求降低的要求降低 使延遲主要在使

23、延遲主要在P P及及NICNIC上上 +NIC+NIC的的DMADMA傳輸傳輸不阻塞不阻塞CPUCPU,對,對ININ拓撲結構拓撲結構的要求降低的要求降低 通信通信- -計算可重疊計算可重疊 注:注:T T網(wǎng)絡網(wǎng)絡T T路由路由L L消息消息/B/B通道通道,T T路由路由主要由主要由拓撲結構決定拓撲結構決定 * *商品化商品化網(wǎng)絡基本可滿足網(wǎng)絡基本可滿足需求:需求: + +商品化網(wǎng)絡與專用商品化網(wǎng)絡與專用網(wǎng)絡的網(wǎng)絡的性能性能差距差距減小減小 + +商品化網(wǎng)絡的商品化網(wǎng)絡的性能性能/ /價格價格較高較高163 3、并行體系結構設計的相關問題、并行體系結構設計的相關問題 系統(tǒng)結構設計是軟硬件系統(tǒng)

24、結構設計是軟硬件交互設計、反復設計與評價的交互設計、反復設計與評價的過程過程(1)(1)確定系統(tǒng)的結構模型和訪存模型確定系統(tǒng)的結構模型和訪存模型 SIMD/MIMDSIMD/MIMD,UMA/NUMA/NORMAUMA/NUMA/NORMA(2)(2)確定系統(tǒng)的一致性模型確定系統(tǒng)的一致性模型 是是/ /否支持、硬件否支持、硬件/ /軟件支持軟件支持CacheCache一致性,存儲一致性一致性,存儲一致性模型模型(3)(3)確定系統(tǒng)的確定系統(tǒng)的通信機構及同步機構通信機構及同步機構 確定軟件確定軟件/ /硬件邊界的硬件邊界的通信原語、同步通信原語、同步原語原語(4)(4)確定殼結構及其參數(shù)確定殼結

25、構及其參數(shù) MEMMEM及及CacheCache容量、交換粒度、一致性粒度、關聯(lián)度容量、交換粒度、一致性粒度、關聯(lián)度等等(5)(5)通信與互連設計通信與互連設計 NICNIC設計、互連網(wǎng)絡設計設計、互連網(wǎng)絡設計等等17第三節(jié)第三節(jié) 可擴展設計原理可擴展設計原理 一、可擴展性范圍一、可擴展性范圍 * *可擴展性:可擴展性:包括包括資源可擴展性、應用可擴展性、技術可資源可擴展性、應用可擴展性、技術可擴展性擴展性1 1、資源可擴展性、資源可擴展性 指增加指增加機器規(guī)模機器規(guī)模(P(P數(shù)量數(shù)量) )、存儲部件存儲部件規(guī)模規(guī)模及及軟件軟件規(guī)模規(guī)模等時,等時,系統(tǒng)系統(tǒng)應具有應具有更更高的性能高的性能或或功

26、能功能 * *規(guī)??蓴U展性規(guī)模可擴展性:指系統(tǒng)指系統(tǒng)最多允許增加最多允許增加的的P P數(shù)量,增加應包括數(shù)量,增加應包括 IN IN、NICNIC等;等; * *資源可擴展性資源可擴展性:指系統(tǒng)指系統(tǒng)最多允許增加的最多允許增加的MEMMEM容量,增加應容量,增加應包包 括括CacheCache和磁盤等;和磁盤等; * *軟件可擴展性軟件可擴展性:指系統(tǒng)指系統(tǒng)是否是否允許擴展允許擴展OSOS、編譯器、編譯器、數(shù)學庫數(shù)學庫 和和工程庫、應用軟件和編程環(huán)境工程庫、應用軟件和編程環(huán)境等等回46頁回49頁182 2、應用可擴展性、應用可擴展性 指指機器規(guī)模擴大機器規(guī)模擴大( (問題規(guī)模不變問題規(guī)模不變)

27、)時,系統(tǒng)性能時,系統(tǒng)性能應成應成比例比例提高提高;問題規(guī)模擴大問題規(guī)模擴大( (機器規(guī)模不變機器規(guī)模不變) )時,系統(tǒng)性能時,系統(tǒng)性能應應不會明顯不會明顯下降下降 * *機器規(guī)??蓴U展性:機器規(guī)模可擴展性:指隨著資源指隨著資源( (P P、MEMMEM、I/OI/O) )的增加,的增加, 系統(tǒng)性能可提高系統(tǒng)性能可提高的的程度程度 例例處理處理某問題時某問題時T T32P32P=100h=100h,若,若T T64P64P50h50h,則,則 * *問題規(guī)??蓴U展性:問題規(guī)??蓴U展性:指隨著問題指隨著問題規(guī)模的增加,規(guī)模的增加, 系統(tǒng)性能系統(tǒng)性能下降的下降的程度程度應應不會不會失衡失衡 例例矩

28、陣矩陣加加運算時運算時T Tmnmnmnmn= =kTkTn nn n,若,若k=ck=cm m2 2,則,則 機器規(guī)模及問題規(guī)模應與機器規(guī)模及問題規(guī)模應與程序處理方法程序處理方法相相對應對應 反例反例若程序并行度若程序并行度為為3232,則,則P P3232時時性能永遠性能永遠不變不變回49頁193 3、技術可擴展性、技術可擴展性 指系統(tǒng)指系統(tǒng)適應技術改變適應技術改變的程度,有代的程度,有代可擴展性、空間可擴展性可擴展性、空間可擴展性和異構可和異構可擴展性擴展性3 3個方面?zhèn)€方面 * *代可擴展性:代可擴展性:系統(tǒng)對使用下一代部件或系統(tǒng)對使用下一代部件或軟件的軟件的支持支持程度程度 例例更換

29、處理器,應不需要更換主板等更換處理器,應不需要更換主板等 * *空間可擴展性:空間可擴展性:系統(tǒng)對地理位置擴展的支持系統(tǒng)對地理位置擴展的支持程度程度 例例SMPSMP、MPPMPP空間可擴展性有限空間可擴展性有限, Internet Internet網(wǎng)網(wǎng)空間可擴展性空間可擴展性最好最好 * *異構可擴展性:異構可擴展性:系統(tǒng)對不同設計者和系統(tǒng)對不同設計者和廠商軟硬件廠商軟硬件的支持的支持程度程度 例例硬件是否具有標準接口、開放系統(tǒng)結構硬件是否具有標準接口、開放系統(tǒng)結構, 軟件是否可軟件是否可移植移植等等回下頁20二、可擴展設計原理二、可擴展設計原理 包括獨立原理、平衡設計原理、可擴展設計原理和

30、包括獨立原理、平衡設計原理、可擴展設計原理和時延包時延包容原理容原理4 4個個方面方面1 1、獨立原理、獨立原理 應應努力使努力使系統(tǒng)的系統(tǒng)的各組成部分各組成部分( (軟件及硬件軟件及硬件) )相互相互獨立獨立 原理特點:原理特點:便于實現(xiàn)資源、軟件、代及便于實現(xiàn)資源、軟件、代及異構可擴展性異構可擴展性 示例示例算法算法應獨立于體系結構應獨立于體系結構( (如如InternetInternet) ), 程序設計語言應獨立于機器硬件程序設計語言應獨立于機器硬件( (如如C C語言語言) ), 節(jié)點節(jié)點應獨立于網(wǎng)絡、應獨立于網(wǎng)絡、NICNIC獨立于網(wǎng)絡拓撲獨立于網(wǎng)絡拓撲結構結構 * *獨立的實現(xiàn):

31、獨立的實現(xiàn):體系結構與實現(xiàn)體系結構與實現(xiàn)分離分離 使用標準使用標準組件組件轉43頁轉上頁212 2、平衡設計原理、平衡設計原理 應應努力努力最小最小化性化性能瓶頸能瓶頸和和避免單點避免單點失效失效(1)(1)AmdahaAmdaha定律定律 系統(tǒng)性能系統(tǒng)性能改善程度改善程度(S)(S)取決于取決于改進部分被使用的改進部分被使用的頻率頻率(2)(2)AmdahaAmdaha法則法則 系統(tǒng)系統(tǒng)處理速度應處理速度應與與MEMMEM容量和容量和I/OI/O速度速度相平衡相平衡 * *常用平衡點:常用平衡點:1MIPS1MIPS1MB1MB1Mb/s1Mb/s 注注此此結果不結果不包含非包含非計算需求計

32、算需求( (如檢查點如檢查點) )eeeerffTTPS/)1(10改進后運行時間改進前運行時間 * *平衡的實現(xiàn)平衡的實現(xiàn):優(yōu)先處理高頻優(yōu)先處理高頻使用使用部件,避免部件,避免性能性能瓶頸產(chǎn)生瓶頸產(chǎn)生22(3)50%(3)50%法則法則 平衡理解平衡理解、t tp p、t t0 0及及t tc c等相加項均相近時等相加項均相近時 * *50%50%法則法則:若程序性能各相加項的若程序性能各相加項的每項使系統(tǒng)性能衰減均不每項使系統(tǒng)性能衰減均不大于大于50%50%時,認為該系統(tǒng)是平衡的時,認為該系統(tǒng)是平衡的 程序性能程序性能若工作若工作負載負載= =nwnw,則則n n個個節(jié)點的并行執(zhí)行時間節(jié)點

33、的并行執(zhí)行時間)()()()log2( 0parallelecommunicatcomputentntwnttnwTTTTpcfn其中:其中:t tf f -一個浮點操作時間;一個浮點操作時間;-負載不平衡開銷;負載不平衡開銷; t t0 0 -通信啟動開銷;通信啟動開銷;t tc c-每字節(jié)通信開銷;每字節(jié)通信開銷; -通信通信- -計算比;計算比; t tp p-并行化開銷并行化開銷 * *平衡的平衡的實現(xiàn):實現(xiàn):平衡平衡w w、t tf f、t t0 0、t tc c、t tp p之間關系,之間關系,使程序性能的各相加項使程序性能的各相加項基本基本相等相等23轉43頁轉44頁顆粒度顆粒度

34、w w (flop) (flop)節(jié)點速度節(jié)點速度1/1/t tf f ( (MflopMflop/s)/s)啟動開銷啟動開銷t t0 0 ( (ss) )100(100(細細) )4 425252020551000(1000(中中) )101010010050502020 例例1 1根據(jù)給定的根據(jù)給定的w及及1/tf,估算平衡的通信啟動開銷估算平衡的通信啟動開銷t0 0 解解平衡時通信啟動開銷平衡時通信啟動開銷t0 0wtf,即,即 例例2 2根據(jù)給定的根據(jù)給定的及及1/tf,估算平衡的通信帶寬估算平衡的通信帶寬1/1/tc c 解解平衡時通信帶寬平衡時通信帶寬1/1/tc ctf,即,即通

35、信通信/ /計算計算(B/flop)(B/flop)節(jié)點速度節(jié)點速度1/1/t tf f( (MflopMflop/s)/s)通信帶寬通信帶寬1/1/t tc c(MB/s)(MB/s)0.010.014 40.040.0420200.20.20.10.1101011505055 原理特點:原理特點:便于實現(xiàn)規(guī)模、資源及應用可便于實現(xiàn)規(guī)模、資源及應用可擴展性擴展性243 3、可擴展設計原理、可擴展設計原理 系統(tǒng)設計時增加一些特性,以滿足可擴展性需要,包括系統(tǒng)設計時增加一些特性,以滿足可擴展性需要,包括過度過度設計設計和和向后兼容性向后兼容性設計設計2 2個方面?zhèn)€方面 * *過度設計過度設計:設計時增加一些特性設計時增加一些特性,以兼顧將來擴展的需求以兼顧將來擴展的需求 例例PCIPCI總線的總線的AD63:32AD

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論