




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、Intel 多核微處理器技術(shù)多核處理器是指在一枚處理器中集成兩個(gè)或多個(gè)完整的計(jì)算引擎( 內(nèi)核) 。多核技術(shù)的開(kāi)發(fā)源于工程師們認(rèn)識(shí)到,僅僅提高單核芯片的速度會(huì)產(chǎn)生過(guò)多熱量且無(wú)法帶來(lái)相應(yīng)的性能改善,先前的處理器產(chǎn)品就是如此。他們認(rèn)識(shí)到,在先前產(chǎn)品中以那種速率, 處理器產(chǎn)生的熱量很快會(huì)超過(guò)太陽(yáng)表面。即便是沒(méi)有熱量問(wèn)題,其性?xún)r(jià)比也令人難以接受,速度稍快的處理器價(jià)格要高很多。英特爾工程師們開(kāi)發(fā)了多核芯片,使之滿(mǎn)足“橫向擴(kuò)展”(而非“縱向擴(kuò)充”)方法,從而提高性能。該架構(gòu)實(shí)現(xiàn)了“分治法”戰(zhàn)略。通過(guò)劃分任務(wù),線(xiàn)程應(yīng)用能夠充分利用多個(gè)執(zhí)行內(nèi)核,并可在特定的時(shí)間內(nèi)執(zhí)行更多任務(wù)。多核處理器是單枚芯片(也稱(chēng)為“硅核
2、”) ,能夠直接插入單一的處理器插槽中,但操作系統(tǒng)會(huì)利用所有相關(guān)的資源,將每個(gè)執(zhí)行內(nèi)核作為分立的邏輯處理器。 通過(guò)在兩個(gè)執(zhí)行內(nèi)核之間劃分任務(wù), 多核處理器可在特定的時(shí)鐘周期內(nèi)執(zhí)行更多任務(wù)。多核架構(gòu)能夠使軟件更出色地運(yùn)行,并創(chuàng)建一個(gè)促進(jìn)未來(lái)的軟件編寫(xiě)更趨完善的架構(gòu)。英特爾對(duì)多核芯片信心十足, 預(yù)估, 到 2015 年多核芯片將廣泛應(yīng)用于筆記本電腦、服務(wù)器、移動(dòng)裝置上,市占率分別為 70% 、 85% 、 70%, 多核微處理器技術(shù)將成為主流根據(jù)摩爾定律, CPU 的速度應(yīng)該每過(guò)18 個(gè)月翻一番。在過(guò)去的幾十年中 , CPU 的速度以一個(gè)令人意想不到的速度上升 , 在這當(dāng)中每年性能的提升可以達(dá)到
3、58% 之多。 可是自從 1996 年以后 , CPU 速度上升的步伐似乎慢了下來(lái)。根據(jù)專(zhuān)家們的分析, 從 1996 年到 2002 年 , CPU 的提升速度只有 41%, 而從 2002 年至今,更是下降到25% 。 有業(yè)內(nèi)人士分析說(shuō) , 這種下降的趨勢(shì)還會(huì)繼續(xù)下去。那么究竟是什么因素阻礙著 CPU 的快速發(fā)展? 首先讓我們看看影響CPU 性能的幾個(gè)關(guān)鍵技術(shù)指標(biāo)。影響 CPU 性能的幾個(gè)關(guān)鍵技術(shù)指標(biāo):1、主頻。即 CPU 的工作頻率, 也就是 CPU 每秒執(zhí)行的指令數(shù)。主頻越高 , CPU 的速度越快。主頻是衡量CPU 性能的一個(gè)指標(biāo)。2、前端總線(xiàn)速度。前端總線(xiàn)即Front Side Bu
4、s, 通常用 FSB表示 , 是將 CPU 連接到北橋芯片 (一 塊電腦主板, 以 CPU 插座為北的話(huà),靠近CPU 插座的一個(gè)起連接作用的芯片稱(chēng)為“北橋芯片”,英文名:North Bridge Chipset 。北橋芯片就是主板上離CPU 最近的芯片,這主要是考慮到北橋芯片與處理器之間的通信最密切, 為了提高通信性能而縮短傳輸距離。)的總線(xiàn)。計(jì)算機(jī)的前端總線(xiàn)頻率是由 CPU 和北橋芯片共同決定的。北橋芯片是主板上最靠近CPU 的那塊芯片 ,它是負(fù)責(zé)聯(lián)系內(nèi)存、顯卡等數(shù)據(jù)吞吐量最大的部件。前端總線(xiàn)是CPU 和外界交換數(shù)據(jù)的最主要通道, 因此前端總線(xiàn)的數(shù)據(jù)傳輸能力對(duì)計(jì)算機(jī)整體性能作用很大, 如果沒(méi)
5、有足夠快的前端總線(xiàn), CPU 的速度再快, 也只能干著急 , 等著前端總線(xiàn)把所需數(shù)據(jù)傳遞過(guò)來(lái)后 , 才能進(jìn)行計(jì)算。3、流水線(xiàn)和超標(biāo)量技術(shù)及分支預(yù)測(cè)機(jī)制。每一條指令的執(zhí)行至多需要5 個(gè)周期 , 分別為取指周期、譯碼周期、執(zhí)行周期、訪(fǎng)問(wèn)存儲(chǔ)器周期和寫(xiě)回周期。流水線(xiàn)就是在一個(gè)時(shí)鐘周期啟動(dòng)一條指令, 從而實(shí)現(xiàn)一個(gè)時(shí)鐘周期完成一條指令; 超標(biāo)量就是在一個(gè)時(shí)鐘周期啟動(dòng)多條指令。因而, 一個(gè)時(shí)鐘周期可以完成多條指令。因此, 流水線(xiàn)和超標(biāo)量技術(shù)通過(guò)指令間的并行 , 來(lái)提高 CPU 的運(yùn)算速度。指令間的并行度越大,CPU 的速度越快。比如 Intel Xeon 3.2 GHz (EM64T) 支持SSE3 流指
6、令技術(shù), 英特爾開(kāi)發(fā)的第三代SIMD 指令集 , 可以增強(qiáng)浮點(diǎn)和多媒體運(yùn)算的速度。 而正確的分支預(yù)測(cè)可以將需要執(zhí)行的指令提前預(yù)取, 從而提高 CPU 的速度。4、緩存的級(jí)數(shù)和各級(jí)緩存的大小。最初的計(jì)算機(jī)CPU 里 ,并沒(méi)有緩存。 因?yàn)槟菚r(shí)內(nèi)存的速度和 CPU 的速度基本相當(dāng) ,內(nèi)存能夠滿(mǎn)足CPU 的數(shù)據(jù)需要。 可是后來(lái) CPU 的速度按照摩爾定律提升, 而內(nèi)存的速度卻上升相對(duì)緩慢。為了解決內(nèi)存速度緩慢引起的系統(tǒng)瓶頸, 緩存的概念應(yīng)運(yùn)而生。緩存保存 CPU 經(jīng)常使用的數(shù)據(jù), 所以緩存越大, 保存的信息越多命中率越高 , 就減少了 CPU 訪(fǎng)問(wèn)內(nèi)存的次數(shù), 從而提高了整體性能。緩存可以做很多級(jí),
7、目前已經(jīng)做到三級(jí)。5、芯片架構(gòu)。以前的CPU 都是單核心的 , 現(xiàn)在雙核心的CPU 已經(jīng)問(wèn)世。 Intel 的 Pentium 840 Extreme Edition 芯片采用的是 Smithfield, 它是在一塊硅芯片上集成兩個(gè)處理器核心 , 以后還會(huì)有多核心的 CPU 。從芯片架構(gòu)這方面分析,衡量處理器效率通常有兩個(gè)指標(biāo):一是芯片的能源利用效率,也就是每瓦性能,在消耗同等能源條件下,最終性能高的產(chǎn)品能源效率就較高;第二個(gè)指標(biāo)便是芯片的晶體管效率, 我們可以引入 “每晶體管性能來(lái)衡量,在消耗等量晶體管數(shù)量條件下,芯片效能高者效率就越高。 晶體管規(guī)模越大, 制造成本越高, 對(duì)芯片廠(chǎng)商來(lái)說(shuō),提
8、高每晶體管性能能夠在保持成本不變的前提下獲得更卓越的性能。一般來(lái)說(shuō),每瓦性能和每晶體管性能總是被結(jié)合起來(lái)討論,不同指令體系的產(chǎn)品在此相差甚遠(yuǎn),例如當(dāng)前頂級(jí)的 RISC 處理器與頂級(jí)的 X86 處理器作對(duì)比, 我們便會(huì)發(fā)現(xiàn) X86 芯片遠(yuǎn)遠(yuǎn)落后。多核心設(shè)計(jì)可謂是提高每晶體管效能的最佳手段。 在單核 產(chǎn)品中,提高性能主要通過(guò)提高頻率和增大緩存來(lái)實(shí)現(xiàn),前者會(huì)導(dǎo)致芯片功耗的提升,后者則會(huì)讓芯片晶體管規(guī)模激增,造成芯片成本大幅度上揚(yáng)。盡管代價(jià)高昂,這兩種措施也只能帶來(lái)小幅度性能提升。而如果引入多核技術(shù),便可以在較低頻率、較小緩存的條件下達(dá)到大幅提高性能的目的。相比大緩存的單核產(chǎn)品, 耗費(fèi)同樣數(shù)量晶體管的
9、多核心處理器擁有更出色的效能,同樣在每瓦性能方面,多核設(shè)計(jì)也有明顯的優(yōu)勢(shì)。正因?yàn)槿绱?,?dāng) IBM 于 2001 年率先推出雙核心產(chǎn)品之后,其他高端RISC 處理器廠(chǎng)商也迅速跟進(jìn),雙核心設(shè)計(jì)由此成為高端RISC 處理器的標(biāo)準(zhǔn)。此時(shí), RISC 業(yè)界又朝向多核、多線(xiàn)程的方向發(fā)展,四核心、八核心設(shè)計(jì)紛紛登臺(tái)亮相,并行線(xiàn)程數(shù)量多達(dá)32條,并且開(kāi)始從通用多核體系轉(zhuǎn)向簡(jiǎn)化核以及專(zhuān)用化的DSP , 實(shí)現(xiàn)性能的跨越性提升這些新設(shè)計(jì)和新方向也都將被X86業(yè)界所借鑒。一、 多核微處理器技術(shù)簡(jiǎn)介Intel 表示未來(lái)采用多核心處理器,這種處理器對(duì)連接處理器和芯片組之間的總線(xiàn)帶寬提出更高要求,現(xiàn)在的 FSB總線(xiàn)帶寬已經(jīng)
10、成為瓶頸,這也就是代號(hào)Demspey 的雙核心Xeon 處理器將采用 2 個(gè)處理器總線(xiàn)連接處理器和芯片組 (代號(hào) Blackford 和 Greencreek )的原因。目前并行 FSB 前端總線(xiàn)的最高承受速度在1.2GHz 。 未來(lái)Smithfield 的 FSB 在 800MHz , 65nm工藝的雙核心Allendale 和 Millville 的 FSB 也在 1066MHz還在目前并行FSB 可以承受的速度范圍之內(nèi)。在2007-2008年內(nèi), Intel 將推行 DDR3 800/1066/1333 內(nèi)存,因此內(nèi)存界面也將分 2個(gè)階段邁向串行方式, 第 1 個(gè)階段是為 FB-DIMM
11、搭配 Advanced Memory Buffer ( AMB ,高階內(nèi)存緩存)芯片, 將并行傳輸轉(zhuǎn)換成串行。 第 2 個(gè)階段是裝備真正的 SerialDIMM 串行內(nèi)存。以雙核心處理器為例,簡(jiǎn)單地說(shuō)就是在一塊CPU 基板上集成兩個(gè)處理器核心, 并通過(guò)并行總線(xiàn)將各處理器核心連接起來(lái)。雙核心并不是一個(gè)新概念,而只是 CMP(Chip MultiProcessors ,單芯片多處理器) 中最基本、最簡(jiǎn)單、最容易實(shí)現(xiàn)的一種類(lèi)型。其實(shí)在 RISC 處理器領(lǐng)域,雙核心甚至多核心都早已經(jīng)實(shí)現(xiàn)。 CMP 最早是由美國(guó)斯坦福大學(xué)提出的,其 思 想 是 在 一 塊 芯 片 內(nèi) 實(shí) 現(xiàn) SMP(Symmetric
12、alMulti-Processing ,對(duì)稱(chēng)多處理)架構(gòu),且并行執(zhí)行不同的進(jìn)程。早在上個(gè)世紀(jì)末,惠普和 IBM 就已經(jīng)提出雙核處理器的可行性設(shè)計(jì)。IBM 在 2001 年就推出了基于雙核心的POWER4 處理器,隨后是Sun 和惠普公司,都先后推出了基于雙核架構(gòu)的UltraSPARC 以及PA-RISC 芯片,但此時(shí)雙核心處理器架構(gòu)還都是在高端的 RISC 領(lǐng)域,直到前不久Intel 和 AMD 相繼推出自己的雙核心處理器, 雙核心才真正走入了主流的 X86 領(lǐng)域。Intel 不是惟一要推出雙核處理器的廠(chǎng)商,目前幾乎所有 處理器廠(chǎng)商都有多核計(jì)劃。 IBM 已經(jīng)銷(xiāo)售雙核芯片多年,ARM 也在手機(jī)
13、市場(chǎng)銷(xiāo)售雙核芯片。惠普、 Sun 都已經(jīng)擁有多核心產(chǎn)品。Intel 強(qiáng)調(diào)自身的特色在于生產(chǎn)雙核乃至多核芯片不只是推出一個(gè)處理器的概念, 它還包括利用平行處理與平臺(tái)的整合,如更高的運(yùn)算能力及支持其他如無(wú)線(xiàn)網(wǎng)絡(luò)安全裝置,整體提升使用者的操作經(jīng)驗(yàn)。Intel 指出,多核處理器的應(yīng)用領(lǐng)域包括可作為數(shù)碼家庭的防火墻、資料備份、掃毒等功能,以及作為辦公室的資料處理、科學(xué)運(yùn)算。事實(shí)上,以上功能在目前的單核架構(gòu)下就能完成就如下圖所示,多核微處理器技術(shù)將成為一個(gè)發(fā)展趨勢(shì)。 ANV公町 J在門(mén)城 的6八為了從1個(gè)命令界抽出 可叵,。我打的芻拿而第 軍芭方法和什由第培津部 當(dāng)威的徐捂內(nèi)臭鼻些龍北門(mén) 加行曲解的貴卜四
14、錦日動(dòng)奘西洋投上VLIVY 暨L強(qiáng)型修 ; 尸 h,/.:MWHHMiAlvBHHMBaaiFC及反符JS中 推顯理塾的次屐,帔他處KI4期薩必二, 相杷的H片年中書(shū)號(hào)以我同時(shí)看芍要檸用成飾。wffia»xw業(yè)后生毗秘H,可笑現(xiàn)拄譏也行和越厚捫。的彼處EH力了從宅個(gè)苜孫融應(yīng)出 垣上L叵汨凡行的中噂 tfi如吃年以卮構(gòu)型微S2,itSRQ(System Request Queue,系統(tǒng)請(qǐng)求隊(duì)列)技術(shù),在工作 的時(shí)候每一個(gè)核心都將其請(qǐng)求放在SRQ中,當(dāng)獲得資源之后請(qǐng)求將會(huì)被送往相應(yīng)的執(zhí)行核心,所以其緩存數(shù)據(jù)的一致性不需要通過(guò)北橋芯片,直接在處理器內(nèi)部就可以完成。與 Intel的雙核心處理
15、器相比,具優(yōu)點(diǎn)是緩存數(shù)據(jù)延遲得以大大 降低。AMD目前的桌面平臺(tái)雙核心處理器是Athlon 64 X2 ,其型號(hào)按照PR值分為3800+至4800+等幾種,同樣采用0.09 微米制程,Socket 939 接口,支持 1GHz 的 Hyper Transport , 當(dāng)然也都支持雙通道 DDR內(nèi)存技術(shù)2. Intel雙核心構(gòu)架剖析AMD曾經(jīng)指由奔騰至尊版是兩個(gè)核心共享一個(gè)二級(jí)緩存,這就是一個(gè)非常明顯的錯(cuò)誤。事實(shí)上,奔騰至尊版和奔騰D都是每個(gè)核心配有獨(dú)享的一級(jí)和二級(jí)緩存,不同的是英特爾將雙核爭(zhēng)用前端總線(xiàn)的任務(wù)仲裁功能放在了芯片組的北橋芯片中。圖1:基于Smithfield衍生生的奔騰至尊版和奔騰
16、D,主要區(qū)別就在于奔騰至尊版支持超線(xiàn)程,而奔騰D屏蔽了超線(xiàn)程功能。按照 離得越近、走得越快”的集成電路設(shè)計(jì)原則, 把這些 功能組件集成在處理器中確實(shí)可以提高效率,減少延遲。不 過(guò),在臺(tái)式機(jī)還不可能在短期內(nèi)就支持4個(gè)內(nèi)核和更多內(nèi)核的現(xiàn)實(shí)情況下,只要有高帶寬的前端系統(tǒng)總線(xiàn),就算把這些 任務(wù)仲裁組件外置, 對(duì)于雙核處理器的臺(tái)式機(jī)來(lái)說(shuō)帶來(lái)的延 遲和性能損失也是微乎其微的。英特爾945和955系列芯片組目前可提供 800MHz (用于 目前的奔騰D)和1066MHz (用于奔騰至尊版)前端總線(xiàn), 如果是供一個(gè)四核處理器使用,那肯定會(huì)造成資源爭(zhēng)搶?zhuān)?對(duì)于雙核來(lái)說(shuō),這個(gè)帶寬已經(jīng)足夠了。英特爾認(rèn)為目前雙核
17、系統(tǒng)中的主要瓶頸還是內(nèi)存、I/O總線(xiàn)和硬盤(pán)系統(tǒng),提升這些模塊的速度才能使整個(gè)系統(tǒng)的計(jì)算平臺(tái)更加均衡。基于這種設(shè)計(jì)思路, 英特爾在945和955系列芯片組中加強(qiáng)了對(duì)PCI-Express總線(xiàn)的支持,增加了對(duì)更局速 DDR2內(nèi) 存的支持,對(duì)SATA(串行ATA)的支持速度增加了一倍由1.5Gb/s升級(jí)3Gb/s,進(jìn)一步增加了磁盤(pán)陣列RAID 5和RAID 10的支持。System BusSystem BusTrfito C«hsLi DClicM *ndO-7LB3T&& LTL3BTBa li-TLS,息 11七,uqd Qupue,Schedule門(mén)FFB.FRF建“
18、皤fMccxMfTr*c OrtcheRAnamerAllafuep 弓S-GtlfidUlflTSTn)cfl Cach«BIB 1 kTLBLyillHiinlaIand ContmlR.rtarn*,JU 心七 uop QvwJftsTP/ 版”LI D-Cach*andD-TLBFF»RF&choddlttfsLI D-Cqeh* and D-TLB.圖2:單核奔騰4處理器(左)和雙核奔騰 D處理器(右) 微架構(gòu)示意圖止匕外,英特爾奔騰至尊版有一個(gè)獨(dú)門(mén)絕活)那就是雙核心加超線(xiàn)程的架構(gòu),這種架構(gòu)可同時(shí)處理四個(gè)線(xiàn)程,這讓它在多任務(wù)多線(xiàn)程的應(yīng)用中具有明顯優(yōu)勢(shì)。而且
19、CMP與SMT(同時(shí)多線(xiàn)程,英特爾超線(xiàn)程就是一種 SMT技術(shù))的結(jié)合 是業(yè)界公認(rèn)的處理器重要發(fā)展趨勢(shì), 最早推由雙核處理器的 IBM也是這一趨勢(shì)的推動(dòng)者。圖3:奔騰至尊版的雙核+超線(xiàn)程架構(gòu)讓它具備同時(shí)四線(xiàn)程處理能力英特爾之所以在奔騰至尊版和奔騰D上采用共享前端總線(xiàn)的雙核架構(gòu),還是由于雙核架構(gòu)自身的緊湊設(shè)計(jì)和生產(chǎn)進(jìn) 程方面的考慮,這種架構(gòu)使英特爾能夠迅速推由全系列的雙 核處理器家族,加快雙核處理器的產(chǎn)品化,而且它帶來(lái)的成 本優(yōu)勢(shì)也大大降低了奔騰至尊版、奔騰D與現(xiàn)有主流單核處理器奔騰4系列的差價(jià),有利于雙核處理器在PC市場(chǎng)上的迅速普及。3、 雙核心處理器的適用范圍目前,Windows XP專(zhuān)業(yè)版等
20、操作系統(tǒng)支持雙物理核心和 四個(gè)邏輯核心,但這并不意味著所有軟件對(duì)此都有優(yōu)化。事實(shí)上大量的測(cè)試已經(jīng)證明,無(wú)論是Intel還是AMD的雙核心處理器,相對(duì)于其各自的同頻率的單核心處理器而言,對(duì)于目前的普通應(yīng)用例如多媒體軟件、游戲和辦公軟件等等都沒(méi)有任何性能提升,甚至可能還稍有降低,因?yàn)檫@些普通應(yīng)用目前都還只是單線(xiàn)程程序, 在處理器執(zhí)行指令時(shí)實(shí)際上只有一個(gè)核心在工作, 而另外一個(gè)核心則處于空閑狀態(tài)幫不上忙。所以對(duì)普通用戶(hù)而言, 只要日常應(yīng)用的程序仍然是單線(xiàn)程的話(huà),雙核心處理器實(shí)際上沒(méi)有任何意義,反而還增大了購(gòu)買(mǎi)成本。除非經(jīng)常執(zhí)行大運(yùn)算量的多任務(wù)處理,例如在游戲的同時(shí)進(jìn)行音視頻處理等等, 這時(shí)雙核心處理
21、器才能真正發(fā)揮作用。目前最適合雙核心處理器發(fā)揮威力的平臺(tái)是服務(wù)器和工作站,這是因?yàn)槠浣?jīng)常進(jìn)行多任務(wù)處理,而且日常運(yùn)行的大量程序都是多線(xiàn)程程序,例如圖形工作站所使用的 AdobePhotoshop 和 3D MAX 等都是多線(xiàn)程程序。一般來(lái)說(shuō),在執(zhí)行多任務(wù)處理和多線(xiàn)程程序時(shí), 雙核心處理器要比同頻率的單核心處理器的性能要高大約 50%-70% ,甚至在某些應(yīng)用下性能幾乎能提升100% 。當(dāng)然, 隨著雙核心處理器的強(qiáng)勢(shì)推出和逐漸普及, 日后支持多線(xiàn)程的普通應(yīng)用程序也會(huì)逐漸增多, 對(duì)普通用戶(hù)而言那時(shí)雙核心處理器才會(huì)真正發(fā)揮作用。4、 多核心處理器目前所存在的問(wèn)題無(wú)論是 Intel 的 Pentium
22、 D 和 Pentium EE , 還是 AMD 的Athlon 64 X2 處理器, 都是簡(jiǎn)單地將兩個(gè)物理內(nèi)核" 疊加 " 在一起,這必然帶來(lái)晶體管數(shù)量的大幅度增加,雙方都已經(jīng)達(dá) 到了兩億三千萬(wàn)個(gè)以上的晶體管; 帶來(lái)的直接后果就是由泄 漏電流引起的功耗大幅度增加, 就算是采用了節(jié)能技術(shù)其發(fā) 熱量也居高不下, 從而導(dǎo)致雙核心處理器相對(duì)于單核心處理 器而言頻率提升更加困難。而且由于目前的制造工藝的限制, 雙核心處理器的良品率要比單核心處理器的低,這必然會(huì)帶來(lái)成本的居高不下,所以目前的雙核心處理器的價(jià)格都太貴了, 距離普及還差得很遠(yuǎn)。當(dāng)然,隨著處理器核心架構(gòu)和制造技術(shù)的發(fā)展,今
23、后必然會(huì)解決目前所遇到的問(wèn)題。(一) I/O 成瓶頸由于兩個(gè)核心只能共用一個(gè)I/O 通道,當(dāng)兩個(gè)核心之間的數(shù)據(jù)進(jìn)行交流的時(shí)候, 就無(wú)法再?gòu)耐獠孔x入數(shù)據(jù)從而利用兩者的時(shí)間差實(shí)現(xiàn)資源的有效搭配和利用。 盡管兩個(gè)核心之間可以并行運(yùn)算,但就整個(gè)系統(tǒng)而言,無(wú)法實(shí)現(xiàn)真正的流水線(xiàn)操作。加上分離的緩存結(jié)構(gòu)需要取得一致性,兩個(gè)內(nèi)核之間的交流變得經(jīng)常而且頻繁, 這實(shí)際上也會(huì)降低處理器的效 率,因此 Pentium D 在技術(shù)上并不被看好。AMD 因?yàn)橥ㄟ^(guò)引入HyperTransport ,部分解決了這個(gè)問(wèn)題,并且因?yàn)樘幚砥鲀?nèi)部自己有獨(dú)立的內(nèi)存控制器,可以獨(dú)立訪(fǎng)問(wèn)內(nèi)存,兩個(gè)核心之間的行為具有相對(duì)獨(dú)立性,數(shù)據(jù)相關(guān)變得
24、很小。因而一些測(cè)試表明,其隨機(jī)處理數(shù)據(jù)的能力要高于 Pentium D 。AMD64 的最大特性是引入了 HyperTransport ,它的良好擴(kuò)展性使得處理器實(shí)現(xiàn)多核、多處理器系統(tǒng)相對(duì)容易一些,并且,多處理器擴(kuò)展的效果也非常好,這是它能夠在桌面雙核領(lǐng)域暫時(shí)領(lǐng)先的重要原因。 考慮到這些, Intel 可能也會(huì)在合適的時(shí)候引入類(lèi)似架構(gòu)。Cell 的多核實(shí)現(xiàn)起來(lái)并不完全一樣,因?yàn)橹圃焯珡?fù)雜,估計(jì)到 65nm 的時(shí)候,這個(gè)處理器才能夠在成本上具有競(jìng)爭(zhēng)力。與其他基于對(duì)稱(chēng)多處理器不同的是,這個(gè)處理器把重心放在了運(yùn)算基元之上, 從而能夠把處理器應(yīng)用到面對(duì)不同的應(yīng)用類(lèi)型, 它其中包含的核心更多是以運(yùn)算的基
25、礎(chǔ)元件形式存在的。因而,即便在內(nèi)部,也是按照一個(gè)系統(tǒng)的思想來(lái)實(shí)現(xiàn)的,各個(gè)運(yùn)算單元之間有高速的連接通道,除了主控處理器用來(lái)分配任務(wù)從而形成運(yùn)算的流水線(xiàn)思想外, 其余幾個(gè)并不是具有很完善的運(yùn)算能力。這幾種系統(tǒng)都面臨同樣的問(wèn)題: I/O 將是最嚴(yán)重的瓶頸。虛擬化在一定程度上能夠處理一些因?yàn)槎嗪藥?lái)的問(wèn)題,可以讓?xiě)?yīng)用軟件和操作系統(tǒng)在透明的環(huán)境下對(duì)處理器資源進(jìn)行分配和管理。(二 ) 軟件是軟肋即使桌面操作系統(tǒng)支持雙處理器,也需要很長(zhǎng)一段時(shí)間。目前在對(duì)稱(chēng)多處理器方面,操作系統(tǒng)對(duì)資源的分配和管理并沒(méi)有本質(zhì)的改變,多以對(duì)稱(chēng)的方式進(jìn)行平均分配。也就是說(shuō),在操作系統(tǒng)層面,當(dāng)一個(gè)任務(wù)到來(lái)時(shí),剝離成為兩個(gè)并行的線(xiàn)程,
26、 因?yàn)榫€(xiàn)程之間需要交流以及操作系統(tǒng)監(jiān)管,它導(dǎo)致的效率損失要比硬件層面的大得多。并且,多數(shù)軟件并沒(méi)有充分考慮到雙核乃至多核的運(yùn)行情況, 導(dǎo)致線(xiàn)程的平均分配時(shí)間以及線(xiàn)程之間的溝通時(shí)間都會(huì)大大增加,尤其是當(dāng)線(xiàn)程需要反復(fù)訪(fǎng)問(wèn)內(nèi)存的時(shí)候。比如做一個(gè)FFT測(cè)試時(shí),由軟件和硬件構(gòu)成的系統(tǒng)將呈現(xiàn)出巨大差異,這時(shí)Pentium D 將被完全擊倒。這不是Pentium D 的錯(cuò),多數(shù)操作系統(tǒng)還沒(méi)有完全實(shí)現(xiàn)自由的資源分配。 IBM 也是通過(guò) AIX5.3L 在支持更自由的虛擬化 Power5 上,實(shí)現(xiàn)了資源的動(dòng)態(tài)調(diào)配和劃分。從長(zhǎng)遠(yuǎn)來(lái)看, 需要使用虛擬化技術(shù)才可能實(shí)現(xiàn)操作系統(tǒng)對(duì)任務(wù)的具體劃分,這很可能改變一些通用的編程模式。不僅操作系統(tǒng)層面無(wú)法完全解決這個(gè)問(wèn)題, 就是軟件在編寫(xiě)的時(shí)候其編譯器都無(wú)法充分解決這個(gè)問(wèn)題。面對(duì)多核系統(tǒng), 需要有并行編程的思想才有可能充分利用資源,而人類(lèi)的思維模型習(xí)慣于線(xiàn)性思維,對(duì)“面”或者 更為復(fù)雜的立體編程模式,效率會(huì)下降很多。軟件的缺失給多核蒙上了一些陰影。 盡管用戶(hù)在充滿(mǎn)希望地期待著,但思維完全的改變,不是一朝一夕的事情。更重要的是,一些表現(xiàn)多核處理能力的輸出系統(tǒng)無(wú)法承受這樣的運(yùn)算量?,F(xiàn)在能充分享受到多核系統(tǒng)的用戶(hù)依然還是企業(yè)級(jí)用戶(hù), 那些專(zhuān)門(mén)進(jìn)行密集計(jì)算
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 烤肉調(diào)料出售合同范本
- 合同范本有作用
- 烏市購(gòu)房合同范本
- 墓地個(gè)人協(xié)議合同范本
- 合租鋪?zhàn)愚D(zhuǎn)讓合同范本
- 個(gè)人間合作合同范本
- 2025年防腐導(dǎo)靜電材料項(xiàng)目合作計(jì)劃書(shū)
- 危廢收購(gòu)合同范例
- 勞改農(nóng)場(chǎng)收購(gòu)合同范本
- 其他類(lèi)合同范本
- 大學(xué)生創(chuàng)新創(chuàng)業(yè)基礎(chǔ)(創(chuàng)新創(chuàng)業(yè)課程)完整全套教學(xué)課件
- 人教版小學(xué)數(shù)學(xué)四年級(jí)下冊(cè)第一單元測(cè)試卷附答案(共9套)
- 財(cái)務(wù)報(bào)表分析財(cái)務(wù)報(bào)表分析課件
- T∕CCCMHPIE 1.2-2016 植物提取物 檳榔多糖多酚
- 局域網(wǎng)規(guī)劃設(shè)計(jì)_畢業(yè)論文
- 脛骨平臺(tái)骨折(課堂PPT)
- 冷室壓鑄機(jī)電腦操作控制部分操作說(shuō)明
- 中考復(fù)習(xí)復(fù)分解反應(yīng)類(lèi)型方程式書(shū)寫(xiě)訓(xùn)練題(無(wú)答案)
- 部編版四年級(jí)道德與法治下冊(cè)第3課《當(dāng)沖突發(fā)生》優(yōu)秀課件(含視頻)
- 病理學(xué)課程標(biāo)準(zhǔn)
- 通橋(2013)8388A常用跨度梁橋面附屬設(shè)施_圖文
評(píng)論
0/150
提交評(píng)論