計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)的概念人機(jī)交互與虛擬現(xiàn)實(shí)研究中心課件_第1頁
計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)的概念人機(jī)交互與虛擬現(xiàn)實(shí)研究中心課件_第2頁
計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)的概念人機(jī)交互與虛擬現(xiàn)實(shí)研究中心課件_第3頁
計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)的概念人機(jī)交互與虛擬現(xiàn)實(shí)研究中心課件_第4頁
計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)的概念人機(jī)交互與虛擬現(xiàn)實(shí)研究中心課件_第5頁
已閱讀5頁,還剩94頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)的概念人機(jī)交互與虛擬現(xiàn)實(shí)研究中心課件計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)的概念人機(jī)交互與虛擬現(xiàn)實(shí)研究中心課件并行性概念 只要在同一時(shí)刻或是在同一時(shí)間間隔內(nèi)完成兩種或兩種以上性質(zhì)相同或不同的工作,它們在時(shí)間上能互相重疊。 同時(shí)性(Simultaneity):兩個(gè)或多個(gè)事件在同一時(shí)刻發(fā)生。并發(fā)性(Concurrency):兩個(gè)或多個(gè)事件在同一時(shí)間間隔內(nèi)發(fā)生。 并行性概念 只要在同一時(shí)刻或是在同一時(shí)間間隔內(nèi)完成兩種或兩種從計(jì)算機(jī)系統(tǒng)中執(zhí)行程序角度來看 指令內(nèi)部 指令之間任務(wù)或進(jìn)程之間作業(yè)或進(jìn)程之間 從計(jì)算機(jī)系統(tǒng)中執(zhí)行程序角度來看 指令內(nèi)部 從計(jì)算機(jī)應(yīng)用角度來看Data-Level Parallelism (

2、DLP) arises because there are many data items that can be operated on at the same time.Task-Level Parallelism (TLP) arises because tasks of work are created that can operate independently and largely in parallel.從計(jì)算機(jī)應(yīng)用角度來看Data-Level Paralleli從處理數(shù)據(jù)的并行性來看 位串字串位并字串位片串字并全并行存儲(chǔ)器操作并行處理器操作步驟并行處理器操作并行指令、任務(wù)、作

3、業(yè)并行 從處理數(shù)據(jù)的并行性來看 位串字串從計(jì)算機(jī)技術(shù)實(shí)現(xiàn)方式來看Instruction-Level Parallelism) exploits data-level parallelism at modest levels with compiler help using ideas like pipelining and at medium levels using ideas like speculative execution.Vector Architectures and Graphic Processor Units (GPUs) exploit data-level parall

4、elism by applying a single instruction to a collection of data in parallel.Thread-Level Parallelism exploits either data-level parallelism or task-level parallelism in a tightly coupled hardware model that allows for interaction among parallel threads.Request-Level Parallelism exploits parallelism a

5、mong largely decoupled tasks specified by the programmer or the operating system.從計(jì)算機(jī)技術(shù)實(shí)現(xiàn)方式來看Instruction-Level 并行性開發(fā)途徑 時(shí)間重疊(Time Interleaving)是在并行性概念中引入時(shí)間因素,讓多個(gè)處理過程在時(shí)間上相互錯(cuò)開,輪流重疊地使用同一套硬件設(shè)備的各個(gè)部分,以加快硬件周轉(zhuǎn)而贏得速度。舉例:流水線分離、細(xì)化功能部件流水線功能不同的多機(jī)系統(tǒng)異構(gòu)型多處理機(jī)系統(tǒng)并行性開發(fā)途徑 時(shí)間重疊(Time Interleaving指令流水線舉例取指分析執(zhí)行kK+1kkK+1K+1K+2

6、K+2K+2部件分析取指執(zhí)行時(shí)間指令流水線舉例取指分析執(zhí)行kK+1kkK+1K+1K+2K+并行性開發(fā)途徑(續(xù))資源重復(fù)(Resource Replication):是在并行性概念中引入空間因素,通過重復(fù)設(shè)置硬件資源來提高可靠性或性能。多操作部件和多體存儲(chǔ)器相聯(lián)、并行處理機(jī)同構(gòu)型多處理機(jī)系統(tǒng)并行性開發(fā)途徑(續(xù))資源重復(fù)(Resource ReplicCUPE(0)PE(1)PE(N-1)資源重復(fù)的例子CUPE(0)PE(1)PE(N-1)資源重復(fù)的例子并行性開發(fā)途徑(續(xù))資源共享(Resource Sharing):是利用軟件的方法讓多個(gè)用戶按一定時(shí)間順序輪流地使用同一套資源,以提高其利用率,

7、這樣也可以提高整個(gè)系統(tǒng)的性能。網(wǎng)絡(luò)打印機(jī)多道程序、分時(shí)OS 真正的處理機(jī)代替虛擬機(jī)分布處理系統(tǒng)并行性開發(fā)途徑(續(xù))資源共享(Resource Sharin計(jì)算機(jī)系統(tǒng)的并行性發(fā)展 1960年以前 算術(shù)運(yùn)算的位運(yùn)算(EDSAC、EDVAC、UNIVAC1)輸入輸出間操作的并行直接存儲(chǔ)器訪問(DMA)IBM709系列1960年至1970年流水線單處理機(jī)多功能部件流水線高速緩沖存儲(chǔ)器Cache計(jì)算機(jī)系統(tǒng)的并行性發(fā)展 1960年以前 計(jì)算機(jī)系統(tǒng)的并行性發(fā)展(續(xù))1970年至1980年多種并行處理系統(tǒng)結(jié)構(gòu),例:向量、陣列、相聯(lián)等1980年至1990年RISC、多處理機(jī)、數(shù)據(jù)流機(jī)、智能機(jī)1990年以來MPP

8、:Massively Parallel Processor 大規(guī)模并行處理機(jī)SMP:Symmetric Multiprocessor 對稱多處理機(jī)SMP On Board, SMP on ChipCluster:機(jī)群、集群計(jì)算機(jī)系統(tǒng)的并行性發(fā)展(續(xù))1970年至1980年坐落于Lawrence Livermore國家實(shí)驗(yàn)室的ASCI White 坐落于Lawrence Livermore國家實(shí)驗(yàn)室的ASCFUJITSU VPP5000FUJITSU VPP5000IBM p69032x1.7GHz Power4+,217GFlops128GB 內(nèi)存,205GB/S內(nèi)存帶寬3 x I/O抽屜,6

9、0 x PCI-X,18GB/S I/O子系統(tǒng)帶寬42x146.8GB UltraSCSI3 磁盤,1920MB/S 磁盤接口帶寬(stripping)2 x Gigabit Ethernet 接口IBMIBM p69032x1.7GHz Power4+,217G傳統(tǒng)的科學(xué)工程研究方法理論+實(shí)驗(yàn)局限:困難:大型風(fēng)道昂貴:小鳥撞飛機(jī)緩慢:氣候變化、星際演變危險(xiǎn):武器設(shè)計(jì)、藥物設(shè)計(jì)傳統(tǒng)的科學(xué)工程研究方法理論+實(shí)驗(yàn)并行計(jì)算-高性能計(jì)算并行計(jì)算(Parallel Computing)高端計(jì)算(High-end Parallel Computing) 高性能計(jì)算(High Performance Com

10、puting)超級(jí)計(jì)算(Super Computing)任何高性能計(jì)算和超級(jí)計(jì)算都離不開使用并行技術(shù)計(jì)算科學(xué)與傳統(tǒng)的兩種科學(xué),即理論科學(xué)和實(shí)驗(yàn)科學(xué),并立被認(rèn)為是人類認(rèn)識(shí)自然的三大支柱,他們彼此相輔相成地推動(dòng)科學(xué)發(fā)展與社會(huì)進(jìn)步。在許多情況下,或者是理論模型復(fù)雜甚至理論尚未建立,或者實(shí)驗(yàn)費(fèi)用昂貴甚至無法進(jìn)行時(shí),計(jì)算就成了求解問題的唯一或主要的手段并行計(jì)算-高性能計(jì)算并行計(jì)算(Parallel Compu計(jì)算能力挑戰(zhàn)為尋找出潛在的抑制劑藥物,需要對所有已知化合物數(shù)據(jù)庫中的微生物藥物靶標(biāo)做甄別,甄別工作需要高性能計(jì)算機(jī)輔助完成360萬億次的高性能計(jì)算機(jī)需要運(yùn)行365天1000萬億次的高性能計(jì)算機(jī)需要運(yùn)

11、行30天5000萬億次的高性能計(jì)算機(jī),需要運(yùn)行一年完成所有已知的人類藥物靶標(biāo)目前最高性能的Intel四核PC的性能大約為500億次每秒計(jì)算能力挑戰(zhàn)為尋找出潛在的抑制劑藥物,需要對所有已知化合物數(shù)日益膨脹的高性能計(jì)算需求HPC目前成為國家各行業(yè)科技創(chuàng)新的基礎(chǔ),當(dāng)前對HPC人才的需求持續(xù)攀升日益膨脹的高性能計(jì)算需求HPC目前成為國家各行業(yè)科技創(chuàng)新的基高性能計(jì)算應(yīng)用分類計(jì)算密集型應(yīng)用(Computing-intensive):大型科學(xué)工程計(jì)算,數(shù)值模擬等。應(yīng)用領(lǐng)域:石油、氣象、CAD、核能、制藥、環(huán)境監(jiān)測分析、系統(tǒng)仿真等。數(shù)據(jù)密集型應(yīng)用(Data-intensive):數(shù)字圖書館,數(shù)據(jù)倉庫,數(shù)據(jù)挖掘

12、,計(jì)算可視化等。應(yīng)用領(lǐng)域:圖書館、銀行、證券、稅務(wù)、決策支持系統(tǒng)等。通信密集型應(yīng)用(Network-intensive):協(xié)同工作,網(wǎng)格計(jì)算,遙控和遠(yuǎn)程診斷等。應(yīng)用領(lǐng)域:網(wǎng)站、信息中心、搜索引擎、電信、流媒體等。高性能計(jì)算應(yīng)用分類計(jì)算密集型應(yīng)用(Computing-int計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)的概念人機(jī)交互與虛擬現(xiàn)實(shí)研究中心課件對計(jì)算能力的需求持續(xù)增長對計(jì)算能力的需求持續(xù)增長2020年以前超級(jí)計(jì)算機(jī)發(fā)展趨勢2000年 每秒10萬億次浮點(diǎn)運(yùn)算2005年 每秒100萬億次浮點(diǎn)運(yùn)算2009年 每秒1000萬億次浮點(diǎn)運(yùn)算(Pflop/s)2013年 每秒1億億次浮點(diǎn)運(yùn)算2016年 每秒10億億次浮點(diǎn)運(yùn)算202

13、0年 每秒100億億次浮點(diǎn)運(yùn)算(Eflop/s)基本上每10年左右性能提高1000倍2020年以前超級(jí)計(jì)算機(jī)發(fā)展趨勢2000年 每秒10萬億次計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)的概念人機(jī)交互與虛擬現(xiàn)實(shí)研究中心課件超級(jí)計(jì)算機(jī)發(fā)展路線圖時(shí)間2020年2030年2050年器件CMOS納米量子器件量子、生物分子計(jì)算速度Exaflops(1018)Zettaflops(1021)Yottaflops(1024)并行度109-101011 -10121013 -1015內(nèi)存容量25PBEB(1018B)ZB(1021B)功耗40MWMWMW用途核聚變模擬蛋白質(zhì)折疊等地球模擬生命科學(xué)等MEMS優(yōu)化腦科學(xué)模擬等201020202

14、0302050超級(jí)計(jì)算機(jī)發(fā)展路線圖時(shí)間2020年2030年2050年器件C并行計(jì)算軟件環(huán)境及現(xiàn)狀操作系統(tǒng):UNIX、LINUX、Windows NT在SMP,DSM并行機(jī)上編譯系統(tǒng)通常具有一定的對用戶程序(C/Fortran) 進(jìn)程自動(dòng)并行化的能力,但經(jīng)常需要人工干預(yù) (通過編譯制導(dǎo),命令行選項(xiàng)等) 以達(dá)到理想的并行效率,且并行主要針對循環(huán)進(jìn)行 (屬于細(xì)粒度并行)在分布式內(nèi)存并行機(jī)上尚無通過高效的自動(dòng)并行工具,主要依靠人工編寫并行程序并行算法的設(shè)計(jì)及并行程序的編制已成為目前特約大規(guī)模并行計(jì)算機(jī)應(yīng)用的主要障礙并行編程現(xiàn)狀并行軟件開發(fā)遠(yuǎn)遠(yuǎn)落后于并行系統(tǒng)體系結(jié)構(gòu)的發(fā)展。缺少合適的并行軟件是阻礙主流用

15、戶社會(huì)接納并行計(jì)算的原因與串行軟件相比,并行軟件數(shù)量少,功能原始并行計(jì)算軟件環(huán)境及現(xiàn)狀操作系統(tǒng):UNIX、LINUX、Win編程環(huán)境落后的并行編譯器、調(diào)試器 vs. 通用先進(jìn)的串行編程環(huán)境.自動(dòng)并行編譯器遠(yuǎn)遠(yuǎn)滿足不了程序并行化的要求.算法并行模型的多樣化(并行計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)的多樣性) vs. 串行編程中的唯一模型: 馮.諾依曼模型問題的并行求解的困難在于問題的多樣性和求解過程中所需的創(chuàng)造性勞動(dòng),使得這一過程難以進(jìn)行自動(dòng)化對串行機(jī)而言, 解法 = 唯一串行算法+計(jì)算程序(通用)對并行機(jī)而言, 解法 = 某種并行算法+有針對性的計(jì)算程序(很難通用)程序員稀少而初級(jí)的并行編程人員 vs. 成熟而經(jīng)驗(yàn)

16、豐富的串行程序員編程環(huán)境并行處理計(jì)算機(jī)的結(jié)構(gòu) 流水線計(jì)算機(jī)(時(shí)間重疊) 陣列處理機(jī)(資源重復(fù))多處理機(jī)系統(tǒng)(資源共享)數(shù)據(jù)流計(jì)算機(jī) 并行處理計(jì)算機(jī)的結(jié)構(gòu) 流水線計(jì)算機(jī)(時(shí)間重疊)流水線計(jì)算機(jī)、陣列處理機(jī)和多處理機(jī)流水線計(jì)算機(jī):主要通過時(shí)間重疊,讓多個(gè)部件在時(shí)間上交錯(cuò)重疊地并行執(zhí)行運(yùn)算和處理,以實(shí)現(xiàn)時(shí)間上的并行。陣列處理機(jī):主要通過資源重復(fù),設(shè)置大量算術(shù)邏輯單元,在同一控制部件作用下同時(shí)運(yùn)算和處理,以實(shí)現(xiàn)空間上的并行。多處理機(jī)系統(tǒng):主要通過資源共享,讓共享輸入/輸出子系統(tǒng)、數(shù)據(jù)庫資源及共享或不共享貯存的一組處理機(jī)在統(tǒng)一的操作系統(tǒng)全盤控制下,實(shí)現(xiàn)軟件和硬件各級(jí)上相互作用,達(dá)到時(shí)間和空間上的異步并行

17、。流水線計(jì)算機(jī)、陣列處理機(jī)和多處理機(jī)流水線計(jì)算機(jī):主要通過時(shí)間多機(jī)系統(tǒng)指的是多處理機(jī)系統(tǒng)和多計(jì)算機(jī)系統(tǒng) 多處理機(jī)系統(tǒng):是由多臺(tái)處理機(jī)組成的單一計(jì)算機(jī)系統(tǒng),各處理機(jī)都可有自己的控制部件,可帶自己的局部存儲(chǔ)器,能執(zhí)行各自的程序。多計(jì)算機(jī)系統(tǒng):是由多臺(tái)獨(dú)立的計(jì)算機(jī)組成的系統(tǒng),各計(jì)算機(jī)分別在邏輯上獨(dú)立的操作系統(tǒng)控制下運(yùn)行,機(jī)間可以互不通信,即使通信也只是經(jīng)通道或通信線路以文件或數(shù)據(jù)集形式進(jìn)行,實(shí)現(xiàn)多個(gè)作業(yè)的并行。 多機(jī)系統(tǒng)指的是多處理機(jī)系統(tǒng)和多計(jì)算機(jī)系統(tǒng) 多機(jī)系統(tǒng)的耦合度 為了反映多機(jī)系統(tǒng)中各級(jí)器之間物理連接的緊密程度和交叉作用能力的強(qiáng)弱。最低耦合系統(tǒng)(Least Coupled System):各種

18、脫機(jī)系統(tǒng) 松散耦和系統(tǒng)(Loosely Coupled System):如果多臺(tái)計(jì)算機(jī)通過通道或通信線路實(shí)現(xiàn)互連,共享某些磁帶、磁盤等外圍設(shè)備,以較低頻帶在文件或數(shù)據(jù)集一級(jí)相互作用。間接耦合系統(tǒng)緊密耦合系統(tǒng)(Tightly Coupled System):如果多臺(tái)機(jī)器之間通過總線或高速開關(guān)互連,共享主存,并有較高的信息傳輸速度,可以實(shí)現(xiàn)數(shù)據(jù)集一級(jí)、任務(wù)級(jí)、作業(yè)級(jí)的并行。直接耦合系統(tǒng) 多機(jī)系統(tǒng)的耦合度 為了反映多機(jī)系統(tǒng)中各級(jí)計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)的概念人機(jī)交互與虛擬現(xiàn)實(shí)研究中心課件并行向量處理機(jī)(PVP)結(jié)構(gòu)特點(diǎn):具有少量的高性能專門設(shè)計(jì)的VP;定制高帶寬互連網(wǎng);共享存儲(chǔ)器;大量的向量寄存器而無高速緩存

19、。典型結(jié)構(gòu): 并行向量處理機(jī)(PVP)結(jié)構(gòu)特點(diǎn):具有少量的高性能專門設(shè)計(jì)的分布共享存儲(chǔ)多處理機(jī)(DSM)結(jié)構(gòu)特點(diǎn):MIMDDM,CCNUMA;單地址空間的應(yīng)用界面;DIR用以支持分布高速緩存一致性;定制互連網(wǎng)絡(luò)。典型結(jié)構(gòu): 分布共享存儲(chǔ)多處理機(jī)(DSM)大規(guī)模并行處理機(jī)(MPP)結(jié)構(gòu)特點(diǎn):MIMDDM,NORMA;商用微處理器具有片上高速緩存;分布式存儲(chǔ)器;定制的互連網(wǎng)絡(luò)。物理和邏輯上均是分布內(nèi)存;能擴(kuò)展至成百上千個(gè)處理器(微處理器或向量處理器);采用高通信帶寬和低延遲的互聯(lián)網(wǎng)絡(luò) (專門設(shè)計(jì)和定制的);一種異步的MIMD機(jī)器;程序系由多個(gè)進(jìn)程組成,每個(gè)都有其私有地址空間,進(jìn)程間采用傳遞消息相互

20、作用;典型結(jié)構(gòu): 大規(guī)模并行處理機(jī)(MPP)結(jié)構(gòu)特點(diǎn):MIMDDM,NORM對稱多處理機(jī)(SMP)共享內(nèi)存多處理機(jī):任意處理器可直接訪問任意內(nèi)存地址,且訪問延遲、帶寬、幾率都是等價(jià)的; 系統(tǒng)是對稱的;結(jié)構(gòu)特點(diǎn):商用微處理器具有片上高速緩存;MIMDSM,對稱,UMA;共享存儲(chǔ)器;總線或交叉開關(guān)互連;總線偵聽協(xié)議。常用作CCNUMA或機(jī)群系統(tǒng)中節(jié)點(diǎn)處理器。典型結(jié)構(gòu):對稱多處理機(jī)(SMP)共享內(nèi)存多處理機(jī):任意處理器可直接訪問機(jī)群系統(tǒng)Cluster結(jié)構(gòu)特點(diǎn):MIMD-DM自治系統(tǒng),每個(gè)節(jié)點(diǎn)是一個(gè)獨(dú)立的計(jì)算機(jī);互連網(wǎng)絡(luò)使用標(biāo)準(zhǔn)低成本商用局網(wǎng);節(jié)點(diǎn)機(jī)可以是工作站或PC機(jī),帶有磁盤,具有完整的OS。是近

21、代最流行的并行分布式系統(tǒng)。典型結(jié)構(gòu): 機(jī)群系統(tǒng)Cluster訪存模型UMA:NORMA:NUMA:多處理機(jī)(單地址空間共享存儲(chǔ)器) UMA: Uniform Memory Access NUMA: Nonuniform Memory Access多計(jì)算機(jī)(多地址空間非共享存儲(chǔ)器) NORMA:No-Remote Memory Access訪存模型UMA:NORMA:NUMA:多處理機(jī)(單地址空間共均勻存儲(chǔ)器存取 (UMA)均勻存儲(chǔ)器存?。║MAUniform Memory Access)所有處理器均勻共享物理存儲(chǔ)器,這里所謂均勻是指所有處理器對所有存儲(chǔ)字具有相同的存取時(shí)間每臺(tái)處理器可帶私有高速

22、緩存外圍設(shè)備也可以一定形式共享各處理機(jī)之間的通信是通過共享存儲(chǔ)器的共享變量來實(shí)現(xiàn)的這一類多處理機(jī)由于對資源的高度共享,常稱緊耦合系統(tǒng)(tightly coupled system)UMA:均勻存儲(chǔ)器存取 (UMA)均勻存儲(chǔ)器存取(UMAUnifo均勻存儲(chǔ)器存取 (UMA)對稱多處理機(jī)系統(tǒng)(symmetric multi-processor)所有處理機(jī)都能同樣訪問所有外圍設(shè)備;所有處理機(jī)都能同樣運(yùn)行執(zhí)行程序,如操作系統(tǒng)的內(nèi)核、I/O服務(wù)程序不對稱處理機(jī)系統(tǒng)(asymmtric multi-processor)只有一臺(tái)或一組處理機(jī)(MP主處理機(jī))執(zhí)行操作系統(tǒng)并操縱I/O,其余處理機(jī)(AP附屬處理機(jī)

23、)沒有I/O能力均勻存儲(chǔ)器存取 (UMA)對稱多處理機(jī)系統(tǒng)(symmetri非均勻存儲(chǔ)訪問(NUMA)非均勻存儲(chǔ)訪問(NUMANonuniform Memory Access)被共享的存儲(chǔ)器在物理上是分布在所有的處理其中的,其所有本地存儲(chǔ)器的集合就組成了全局地址空間處理器訪問存儲(chǔ)器的時(shí)間是不一樣的:訪問本地存儲(chǔ)器(LM)較快,而訪問外地的存儲(chǔ)器較慢(此即是非均勻存儲(chǔ)訪問名稱的由來)每臺(tái)處理器可帶私有高速緩存,且外設(shè)也可以某種形式共享NUMA:非均勻存儲(chǔ)訪問(NUMA)非均勻存儲(chǔ)訪問(NUMANonu非遠(yuǎn)程存儲(chǔ)訪問(NORMA)非遠(yuǎn)程存儲(chǔ)訪問(NORMA No-Remote Memory Acc

24、ess)所有存儲(chǔ)器都是私有的,僅能由其處理器所訪問絕大都數(shù)都不支持遠(yuǎn)程存儲(chǔ)器的訪問NORMA:非遠(yuǎn)程存儲(chǔ)訪問(NORMA)非遠(yuǎn)程存儲(chǔ)訪問(NORMA 結(jié)構(gòu)模型 - 訪存模型UMA:NUMA:NORMA:結(jié)構(gòu)模型 - 訪存模型UMA:NUMA:NORMA:多處理機(jī) 多計(jì)算機(jī)UMA:NUMA:NORMA: 多處理機(jī)(共享存儲(chǔ)) 多計(jì)算機(jī)(分布式存儲(chǔ))多處理機(jī) 多計(jì)算機(jī)UMA:NUMA:NORMA: 多計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)的概念人機(jī)交互與虛擬現(xiàn)實(shí)研究中心課件名次解釋UMA:Uniform Memory Access 均勻存儲(chǔ)訪問NUMA:Nouniform Memory Access 非均勻存儲(chǔ)訪問COM

25、A:Cache-Only Memory Access 全高速緩存存儲(chǔ)訪問CC-NUMA:Cache-Coherent Nonuniform Memory Access 高速緩存一致性均勻存儲(chǔ)訪問NCC-NUMA:Cache-Coherent Nonuniform Memory Access 非高速緩存一致性均勻存儲(chǔ)訪問NORMA:No-Remote Memory Access 非遠(yuǎn)程存儲(chǔ)訪問DSM:Distributed Shared Memory 分布式共享存儲(chǔ)PVP:Parallel Vector Processor 并行向量處理機(jī)名次解釋UMA:Uniform Memory Access

26、 計(jì)算機(jī)系統(tǒng)的分類 采用的基本器件 處理器性能1966年Michael J,Flynn 1978年David J.Kuck:用指令流和執(zhí)行流(Execution Stream)及其多倍性來描述計(jì)算機(jī)系統(tǒng)總控制器的結(jié)構(gòu)特征 1972年馮澤云:提出用數(shù)據(jù)處理的并行度來定量地描述各種計(jì)算機(jī)系統(tǒng)特性 。計(jì)算機(jī)系統(tǒng)的分類 采用的基本器件 按采用的基本器件分類計(jì)算機(jī)的更新?lián)Q代第一代 電子管計(jì)算機(jī)第二代 晶體管計(jì)算機(jī)第三代 中小規(guī)模集成電路第四代 大或超大規(guī)模集成電路第五代 VLSI(甚大規(guī)模集成電路)目前的絕大多數(shù)計(jì)算機(jī)系統(tǒng)是VLSI計(jì)算機(jī)公認(rèn)的第五代計(jì)算機(jī)什么時(shí)候誕生?第五代計(jì)算機(jī)以什么作為標(biāo)志來劃分?

27、計(jì)算機(jī)性能的大幅度提高或更新?lián)Q代,一方面依靠器件的不斷更新,同時(shí)也依賴系統(tǒng)結(jié)構(gòu)的不斷改進(jìn)。按采用的基本器件分類計(jì)算機(jī)的更新?lián)Q代第一代19451954電子管繼電器存儲(chǔ)程序計(jì)算機(jī)程序控制I/O機(jī)器語言匯編語言普林斯頓ISA、ENIAC、IBM701第二代19551964晶體管、磁芯印刷電路浮點(diǎn)數(shù)據(jù)表示、尋址技術(shù)、中斷、I/O處理機(jī)高級(jí)語言、編譯、批處理監(jiān)控程序Univac LARC、CDC 1604IBM 7030第三代19651973)多層印刷電路微程序流水線、Cache、先行處理、系列機(jī)多道程序分時(shí)操作系統(tǒng)IBM 360/370CDC 6600/7600DEC PDP-8第四代19741990

28、LSI、VLSI半導(dǎo)體存儲(chǔ)器向量處理分布式存儲(chǔ)器并行和分布處理Cray-1、IBM 3090DEC VAX 9000Convax-1第五代1990 高性能微處理器高密度電路超標(biāo)量、超流水、SMP、MP、MPP大規(guī)模、可擴(kuò)展并行與分布處理SGI Cray T3EIBM、SP2、DECAlphaServer 8400五代計(jì)算機(jī)的特征表 第一代電子管存儲(chǔ)程序計(jì)算機(jī)機(jī)器語言普林斯頓ISA、ENIAC按處理器性能分類按系統(tǒng)成本劃分按用途劃分按數(shù)據(jù)類型劃分按處理器個(gè)數(shù)和種類劃分按處理器性能分類按系統(tǒng)成本劃分按計(jì)算機(jī)系統(tǒng)成本分類巨型計(jì)算機(jī)、超級(jí)計(jì)算機(jī) SuperComputer大型計(jì)算機(jī) MainCompu

29、ter中型機(jī)算機(jī) MidComputer小型計(jì)算機(jī) MiniComputer微型計(jì)算機(jī) MicroComputer 工作站介于小型機(jī)和微型機(jī)之間,具有小型機(jī)的性能,微型機(jī)的價(jià)格。 按計(jì)算機(jī)系統(tǒng)成本分類巨型計(jì)算機(jī)、超級(jí)計(jì)算機(jī) SuperCo劃分原則:以性能為特征,按價(jià)格來劃分存在問題:劃分標(biāo)準(zhǔn)是隨時(shí)間而變化每五年左右降低一個(gè)等級(jí)設(shè)計(jì)方法:最高性能:特殊用途最佳性能價(jià)格比:一般商用計(jì)算機(jī)最低價(jià)格:家用計(jì)算機(jī)等Small is fast.劃分原則:以性能為特征,按價(jià)格來劃分按用途劃分種類:科學(xué)計(jì)算、事務(wù)處理、實(shí)時(shí)控制、工作站、服務(wù)器、家用計(jì)算機(jī)等劃分原則:科學(xué)計(jì)算:浮點(diǎn)運(yùn)算能力事務(wù)處理:字符處理、十

30、進(jìn)制運(yùn)算實(shí)時(shí)控制:中斷響應(yīng)速度、I/O能力工作站:圖形處理能力服務(wù)器:數(shù)據(jù)處理速度、數(shù)據(jù)存儲(chǔ)能力家用計(jì)算機(jī):價(jià)格便宜,軟件豐富發(fā)展方向:具備上述所用功能的通用計(jì)算機(jī)各種專用處理機(jī)、協(xié)處理器、嵌入式處理器按用途劃分種類:按數(shù)據(jù)類型劃分定點(diǎn)計(jì)算機(jī)浮點(diǎn)計(jì)算機(jī)向量計(jì)算機(jī)堆棧計(jì)算機(jī)等按數(shù)據(jù)類型劃分定點(diǎn)計(jì)算機(jī)按處理器個(gè)數(shù)和種類劃分單處理機(jī)、多處理機(jī)、分布處理機(jī)關(guān)聯(lián)處理機(jī)超標(biāo)量處理機(jī)、超流水線處理機(jī)、VLIW處理機(jī)SMP(對稱多處理機(jī))、MPP(大規(guī)模處理機(jī))、機(jī)群(Cluster)系統(tǒng)等按處理器個(gè)數(shù)和種類劃分單處理機(jī)、多處理機(jī)、分布處理機(jī)Hennessy分類Hennessy分類Personal Mobil

31、e Device (PMD)is the term we apply to a collection of wireless devices with multimedia user interfaces such as cell phones, tablet computers, and so on. Cost is a prime concern given the consumer price for the whole product is a few hundred dollars.Applications on PMDs are often Web-based and media-

32、orientedResponsiveness and predictability are key characteristics for media applicationsOther key characteristics in many PMD applications are the need to minimize memory and the need to use energy efficiently.Sales in 2010 included about 1.8 billion PMDs (90% cell phones)Personal Mobile Device (PMD

33、)isDesktop ComputingThe first, and probably still the largest market in dollar termsspans from low-end netbooks that sell for under $300 to high-end, heavily configured workstations that may sell for $2500.Throughout this range in price and capability, the desktop market tends to be driven to optimi

34、ze price-performanceSales in 2010 , 350 million desktop PCsDesktop ComputingThe first, anServersAs the shift to desktop computing occurred in the 1980s, the role of servers grew to provide larger-scale and more reliable file and computing services. Such servers have become the backbone of large-scal

35、e enterprise computing, replacing the traditional mainframe.First, availability is critical.A second key feature of server systems is scalability.Finally, servers are designed for efficient throughput.Sales in 2010, 20 million servers.ServersAs the shift to desktopClusters/Warehouse-Scale ComputersT

36、he growth of Software as a Service (SaaS) for applications like search, social networking, video sharing, multiplayer games, online shopping, and so on has led to the growth of a class of computers called clusters. Clusters are collections of desktop computers or servers connected by local area netw

37、orks to act as a single larger computer. Each node runs its own operating system, and nodes communicate using a networking protocol. The largest of the clusters are called warehouse-scale computers (WSCs), in that they are designed so that tens of thousands of servers can act as one.Price-performanc

38、e and power are critical to WSCs since they are so large.WSCs are related to servers, in that availability is critical.Supercomputers are related to WSCs in that they are equally expensive, costing hundreds of millions of dollars, but supercomputers differ by emphasizing floating-point performance a

39、nd by running large, communication-intensive batch programs that can run for weeks at a time.Clusters/Warehouse-Scale Compu計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)的概念人機(jī)交互與虛擬現(xiàn)實(shí)研究中心課件計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)的概念人機(jī)交互與虛擬現(xiàn)實(shí)研究中心課件20英尺產(chǎn)品占地面積15,最大重量20噸,可容納7680個(gè)計(jì)算核心,能夠提供百萬億次計(jì)算能力,整合47個(gè)云海集裝箱形成的數(shù)據(jù)中心可達(dá)到世界性能最高的天河一號(hào)峰值能力,最大可提供6PB存儲(chǔ)空間,能夠容納300萬部高清電影或者50萬人口醫(yī)療視頻資料,2個(gè)sm

40、artcloud集裝箱數(shù)據(jù)中心可存儲(chǔ)美國國會(huì)圖書館藏書。 20英尺產(chǎn)品占地面積15,最大重量20噸,可容納7680個(gè)Embedded Computersfound in everyday machines; microwaves, washing machines, most printers, most networking switches, and all cars contain simple embedded microprocessors.The total number of embedded processors sold was nearly 19 billion. In t

41、otal, 6.1 billion ARM-technology based chips were shipped in 2010.Embedded Computersfound in eve個(gè)人計(jì)算機(jī)1981年8月12日1985年1986年1990年1993年1994年1995年2000年IBM5150Windows1.0CompaqWindows3.1PentiumNetscapeWindows95Pentium4個(gè)人計(jì)算機(jī)1981年8月12日1985年1986年1990年Wrist PCDesktop PCTablet PCPocket PCPhone PC無線連接Wearable co

42、mputerWrist PCDesktop PCTablet PCPocMichael J,Flynn分類指令流:是指機(jī)器執(zhí)行的指令序列。 數(shù)據(jù)流:是指指令流調(diào)用的數(shù)據(jù)序列,包括輸入數(shù)據(jù)和中間結(jié)果。多倍性:是指在系統(tǒng)性能瓶頸部件上處于同一執(zhí)行階段的指令或數(shù)據(jù)的最大可能個(gè)數(shù)。 Michael J,Flynn分類指令流:是指機(jī)器執(zhí)行的指令Michael J,Flynn分類SISD 單指令流單數(shù)據(jù)流傳統(tǒng)的單處理機(jī)屬于SISD計(jì)算機(jī)SIMD 單指令流多數(shù)據(jù)流并行處理機(jī)是SIMD計(jì)算機(jī)的典型代表我國的YH-I型是此類計(jì)算機(jī)型MISD 多指令流單數(shù)據(jù)流實(shí)際上不存在,但也有學(xué)者認(rèn)為存在MIMD 多指令流多數(shù)

43、據(jù)流包括了大多數(shù)多處理機(jī)及多計(jì)算機(jī)系統(tǒng)我國的YH-II型計(jì)算機(jī)是這種類型的計(jì)算機(jī)Michael J,Flynn分類SISD 單指令流單數(shù)據(jù)SISD典型單處理機(jī)單功能部件處理機(jī)IBM1401、VAX-11多功能部件處理機(jī)IBM360/91、370/168、CDC6600等流水線處理機(jī)指標(biāo)量流水線處理機(jī)SISD典型單處理機(jī)單功能部件處理機(jī)CUPUMMCSDSISSISDCU:控制部件,PU:處理機(jī),MM:貯存模塊,SM:共享主存IS:指令流,CS:控制流,DS:數(shù)據(jù)流CUPU1PU2PUnMM1MM2MMmDS1DS2DSnCSISSIMDSMCUPUMMCSDSISSISDCU:控制部件,PU:

44、處理機(jī)SIMD種類:并行處理機(jī)、陣列處理機(jī)、向量處理機(jī)、相聯(lián)處理機(jī)、超標(biāo)量處理機(jī)、超流水線處理機(jī)多個(gè)PU按一定方式互連,在同一個(gè)CU控制下,對各自的數(shù)據(jù)完成同一條指令規(guī)定的操作;從CU看指令順序執(zhí)行,從PU看數(shù)據(jù)并行執(zhí)行SIMD種類:CU1PU1PU2PUnMM1MM2MMmDSDSCS1ISnMISDSMCU2CUnCS2CSnIS2IS1CU:控制部件,PU:處理機(jī),MM:貯存模塊,SM:共享主存IS:指令流,CS:控制流,DS:數(shù)據(jù)流CU1PU1PU2PUnMM1MM2MMmDSDSCS1ISMISD幾條指令對同一個(gè)數(shù)據(jù)進(jìn)行不同的處理,實(shí)際上不存在MISD幾條指令對同一個(gè)數(shù)據(jù)進(jìn)行不同的處

45、理,實(shí)際上不存在CU1PU1PU2PUnMM1MM2MMmDS1DSnCS1ISnMIMDCU2CUnCS2CSnIS2IS1DS2CU:控制部件,PU:處理機(jī),MM:貯存模塊,SM:共享主存IS:指令流,CS:控制流,DS:數(shù)據(jù)流CU1PU1PU2PUnMM1MM2MMmDS1DSnCS1MIMD緊密耦合:IBM3081、IBM3084、UNIVAC-1100/80松散耦合:D-825、Cmmp、CRAY-2MIMD緊密耦合:Flynn分類法得到廣泛應(yīng)用SIMD、MIMD、SPMD、XIMD、。主要缺點(diǎn)分類太粗在SIMD中包含有多種處理機(jī)對流水線處理機(jī)的劃分不明確標(biāo)量流水線為SISD,向量流

46、水線為SIMD根本問題是把兩個(gè)等級(jí)不同的功能并列對待數(shù)據(jù)流受指令流控制,造成MISD不存在非馮計(jì)算機(jī)的分類?其他新型計(jì)算機(jī)的分類Flynn分類法得到廣泛應(yīng)用David J.Kuck分類用指令流和執(zhí)行流(Execution Stream)及其多倍性來描述計(jì)算機(jī)系統(tǒng)總控制器的結(jié)構(gòu)特征。 SISE:單處理機(jī)系統(tǒng) SIME:多操作部件的處理機(jī)MISE:帶指令級(jí)多道程序的單處理機(jī)MIME:多處理機(jī) David J.Kuck分類用指令流和執(zhí)行流(Executi主要缺點(diǎn)有些系統(tǒng),如分布處理機(jī),沒有總控制器分類級(jí)別太低。沒有處理機(jī)級(jí)和機(jī)器級(jí)分類太粗,如SIME中包含了多種處理機(jī)主要缺點(diǎn)有些系統(tǒng),如分布處理機(jī),

47、沒有總控制器馮澤云分類提出用數(shù)據(jù)處理的并行度來定量地描述各種計(jì)算機(jī)系統(tǒng)特性。 WSBS(字串位串) WSBP(字串位并)WPBS(字并位串)WPBP(字并位并) 位片寬字寬SISDSIMD(MPP)SIMDMIMD1mn1mn馮澤云分類提出用數(shù)據(jù)處理的并行度來定量地描述各種計(jì)算機(jī)系統(tǒng)特Von Neumann結(jié)構(gòu)計(jì)算機(jī)運(yùn)算器ALU控制器輸出設(shè)備輸入設(shè)備存儲(chǔ)器Van Nenmann基本思想于1936年1946年期間形成,由馮諾依曼等人于1946年提出Von Neumann結(jié)構(gòu)計(jì)算機(jī)運(yùn)算器控制器輸出設(shè)備輸入設(shè)備馮諾依曼的設(shè)計(jì)思想“程序存儲(chǔ)”核心思想計(jì)算機(jī)的程序和數(shù)據(jù)可以一同存在于存儲(chǔ)器中,計(jì)算機(jī)通過

48、在存儲(chǔ)器中順序讀取程序來獲取指令馮諾依曼的設(shè)計(jì)思想“程序存儲(chǔ)”核心思想計(jì)算機(jī)的程序和數(shù)據(jù)可主存儲(chǔ)器程序控制器I/O設(shè)備算術(shù)邏輯單元存儲(chǔ)數(shù)據(jù)和指令對二進(jìn)制數(shù)進(jìn)行算術(shù)和邏輯運(yùn)算控制內(nèi)存中的指令并執(zhí)行系統(tǒng)的輸入輸出設(shè)備主存儲(chǔ)器程序控制器I/O設(shè)備算術(shù)邏輯存儲(chǔ)數(shù)據(jù)和指令對二進(jìn)制存儲(chǔ)程序控制 Stored Program Control 實(shí)現(xiàn)指令流程的三或四個(gè)階段 取指令 取操作數(shù) 執(zhí)行指令 寫回結(jié)果存儲(chǔ)程序控制 Stored Program ControVon Neumann機(jī)結(jié)構(gòu)的主要特征 存儲(chǔ)器是字長固定的、順序線性編址的一維結(jié)構(gòu),每一個(gè)地址是唯一定義的按地址訪問、單元位數(shù)固定、運(yùn)算速度與訪存次數(shù)有關(guān)由指令形式的低級(jí)語言驅(qū)動(dòng),指令=操作碼+地址碼 操作數(shù)的類型由操作碼決定指令在存儲(chǔ)器中是按其執(zhí)行順序存儲(chǔ),程序分支由轉(zhuǎn)移指令實(shí)現(xiàn)存儲(chǔ)器內(nèi)指令和數(shù)據(jù)同等看待二進(jìn)制編碼、運(yùn)算以運(yùn)算器為中心,I/O與存儲(chǔ)器之間數(shù)據(jù)通過運(yùn)算器,運(yùn)算器、存儲(chǔ)器、I/O設(shè)備的操作及之間的聯(lián)系,由控制器控制 Von Neumann機(jī)結(jié)構(gòu)的主要特征 存儲(chǔ)器是字

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論