鯤鵬處理器(架構(gòu)與編程)上篇_第1頁
鯤鵬處理器(架構(gòu)與編程)上篇_第2頁
鯤鵬處理器(架構(gòu)與編程)上篇_第3頁
鯤鵬處理器(架構(gòu)與編程)上篇_第4頁
鯤鵬處理器(架構(gòu)與編程)上篇_第5頁
已閱讀5頁,還剩150頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

鯤鵬處理器架構(gòu)與編程(上篇)目錄\h第1章服務(wù)器與處理器\h1.1服務(wù)器體系結(jié)構(gòu)\h1.1.1服務(wù)器的分類\h1.1.2服務(wù)器的性能評價(jià)\h1.1.3服務(wù)器的可靠性與管理\h1.2服務(wù)器處理器\h1.2.1高性能處理器的并行組織結(jié)構(gòu)\h1.2.2英特爾處理器體系結(jié)構(gòu)\h1.2.3ARM處理器體系結(jié)構(gòu)\h1.3服務(wù)器技術(shù)基礎(chǔ)\h1.3.1高性能處理器的存儲器組織與片上互連\h1.3.2內(nèi)存順序模型與內(nèi)存屏障\h1.3.3服務(wù)器虛擬化技術(shù)\h1.3.4PCIExpress總線\h第2章ARMv8-A體系結(jié)構(gòu)\h2.1ARMv8-A處理單元的核心架構(gòu)\h2.1.1ARMv8-A架構(gòu)的處理器運(yùn)行模式\h2.1.2ARMv8-A架構(gòu)的寄存器\h2.1.3ARMv8-A架構(gòu)的異常與中斷\h2.2ARMv8-A處理單元的存儲系統(tǒng)架構(gòu)\h2.2.1ARMv8-A架構(gòu)的內(nèi)存模型\h2.2.2ARM架構(gòu)的系統(tǒng)存儲管理單元\h2.3ARMv8-A架構(gòu)的服務(wù)器特性\h2.3.1ARMv8-A的服務(wù)器架構(gòu)標(biāo)準(zhǔn)化\h2.3.2ARMv8-A的RAS擴(kuò)展與PMU擴(kuò)展\h第3章鯤鵬處理器片上系統(tǒng)架構(gòu)\h3.1鯤鵬處理器片上系統(tǒng)與TaiShan處理器內(nèi)核架構(gòu)\h3.1.1鯤鵬處理器片上系統(tǒng)概況\h3.1.2TaiShanV110處理器內(nèi)核微架構(gòu)\h3.1.3鯤鵬920處理器片上系統(tǒng)的邏輯結(jié)構(gòu)\h3.1.4鯤鵬920處理器片上系統(tǒng)的內(nèi)存儲系統(tǒng)\h3.2鯤鵬920處理器片上系統(tǒng)的組織與管理\h3.2.1鯤鵬920處理器片上系統(tǒng)的配置\h3.2.2鯤鵬處理器多芯片系統(tǒng)\h3.2.3鯤鵬920處理器片上系統(tǒng)的管理與安全架構(gòu)\h3.2.4鯤鵬920處理器片上系統(tǒng)的PMU\h3.3鯤鵬920處理器片上系統(tǒng)的設(shè)備與輸入/輸出\h3.3.1鯤鵬920處理器片上系統(tǒng)的輸入/輸出概述\h3.3.2鯤鵬920處理器片上系統(tǒng)的PCIExpress控制器\h3.3.3鯤鵬920處理器片上系統(tǒng)的平臺設(shè)備第1章服務(wù)器與處理器本章首先簡要介紹服務(wù)器的相關(guān)概念、分類及特征,然后重點(diǎn)總結(jié)在服務(wù)器領(lǐng)域主流的英特爾系列處理器以及新興的ARM架構(gòu)服務(wù)器處理器的歷史演變。為方便讀者了解現(xiàn)代服務(wù)器相關(guān)的技術(shù)背景,本章還將簡要介紹在高性能服務(wù)器中普遍采用的一些主要技術(shù)。1.1服務(wù)器體系結(jié)構(gòu)服務(wù)器(Server)是一個(gè)使用非常廣泛的技術(shù)用語。一般意義的服務(wù)器是指通用計(jì)算機(jī)硬件的一個(gè)類別或形態(tài),也即在網(wǎng)絡(luò)環(huán)境下運(yùn)行相應(yīng)的應(yīng)用軟件為網(wǎng)上用戶提供信息資源共享和網(wǎng)絡(luò)、Web應(yīng)用、數(shù)據(jù)庫、文件、打印等各種服務(wù)的一種高性能計(jì)算機(jī)。廣義而言,任何計(jì)算機(jī)都可以安裝網(wǎng)絡(luò)操作系統(tǒng)并連接到網(wǎng)絡(luò)上對外提供服務(wù),因而都能夠在一定程度上承擔(dān)某些特定的服務(wù)器功能。但是通常所說的服務(wù)器一般被當(dāng)作網(wǎng)絡(luò)數(shù)據(jù)的節(jié)點(diǎn)和樞紐,負(fù)責(zé)為網(wǎng)絡(luò)中的多個(gè)客戶端或用戶同時(shí)提供信息服務(wù),因而對其功能和性能的要求遠(yuǎn)比只服務(wù)于少數(shù)人并承擔(dān)個(gè)人業(yè)務(wù)的個(gè)人計(jì)算機(jī)(PersonalComputer,PC)高出許多。作為一種特定的計(jì)算機(jī),服務(wù)器與一般計(jì)算機(jī)系統(tǒng)的整體組成結(jié)構(gòu)并無不同,同樣包含CPU(CentralProcessingUnit,中央處理器)、內(nèi)存儲器、硬盤、總線和各種外部擴(kuò)展部件等。特別之處在于,服務(wù)器硬件需要承擔(dān)大量服務(wù),必須要有足夠的系統(tǒng)處理能力,因而服務(wù)器通常具備高速運(yùn)算能力和強(qiáng)大的外部數(shù)據(jù)吞吐能力等。此外,服務(wù)器通常需要長時(shí)間連續(xù)提供服務(wù),因而又必須具備高可靠性、高可用性、高可擴(kuò)展性、高安全性和可管理性等特征,以避免因故障停機(jī)、網(wǎng)絡(luò)中斷、數(shù)據(jù)丟失等意外引起服務(wù)失效,造成巨大損失。因此,服務(wù)器硬件一方面會(huì)使用專門設(shè)計(jì)的高性能、高可靠性的中央處理器、系統(tǒng)總線和存儲系統(tǒng)部件以提升系統(tǒng)配置,另一方面又會(huì)采用對稱多處理器(SymmetricMulti-Processor,SMP)技術(shù)、冗余備份技術(shù)、在線診斷技術(shù)、故障診斷告警技術(shù)、傳輸存儲加密與檢錯(cuò)糾錯(cuò)技術(shù)、熱插拔技術(shù)和遠(yuǎn)程診斷技術(shù)等,盡最大可能提升系統(tǒng)持續(xù)、可靠地提供高性能服務(wù)的能力。1.1.1服務(wù)器的分類服務(wù)器有各種不同種類,其分類沒有統(tǒng)一的標(biāo)準(zhǔn),可以從多個(gè)維度對服務(wù)器分類。例如,按照應(yīng)用場景可以把服務(wù)器分為文件服務(wù)器、Web應(yīng)用服務(wù)、FTP(文件傳輸協(xié)議)服務(wù)器、光盤鏡像服務(wù)器、數(shù)據(jù)庫服務(wù)器、流媒體服務(wù)器、電子郵件服務(wù)器等;也可以按用途把服務(wù)器劃分為通用型服務(wù)器和專用型服務(wù)器兩類,后者是為某一種或某幾種功能專門設(shè)計(jì)的服務(wù)器。在設(shè)計(jì)和選配服務(wù)器時(shí)比較重要的分類方式通常是按照其應(yīng)用層次、機(jī)械結(jié)構(gòu)、用途和處理器架構(gòu)分類。1.按應(yīng)用層次分類按應(yīng)用層次劃分,服務(wù)器大致分為入門級服務(wù)器、工作組級服務(wù)器、部門級服務(wù)器和企業(yè)級服務(wù)器四類。這幾類服務(wù)器之間的界限并不嚴(yán)格,只是服務(wù)器等級的粗略劃分。1)入門級服務(wù)器顯然,入門級服務(wù)器是一種滿足最基本的服務(wù)器功能和性能要求的低端設(shè)備。入門級服務(wù)器通常只使用少量CPU,并根據(jù)需要配置相應(yīng)的內(nèi)存儲器和大容量硬盤,必要時(shí)也會(huì)采用RAID(RedundantArraysofIndependentDisks,獨(dú)立磁盤冗余陣列)技術(shù)進(jìn)行數(shù)據(jù)冗余保護(hù)。入門級服務(wù)器主要滿足辦公室的中小型網(wǎng)絡(luò)用戶的文件共享、打印服務(wù)、簡單數(shù)據(jù)庫應(yīng)用、互聯(lián)網(wǎng)接入及小型網(wǎng)絡(luò)范圍內(nèi)的電子郵件、萬維網(wǎng)(Web)服務(wù)等應(yīng)用需求。由于服務(wù)業(yè)務(wù)量不大,因而對硬件配置的要求相對較低,也不需要特別專業(yè)的維護(hù)管理工作支持。2)工作組級服務(wù)器工作組級服務(wù)器大致的服務(wù)范圍為50臺左右的個(gè)人計(jì)算機(jī)組成的網(wǎng)絡(luò)工作組,其性能較入門級服務(wù)器有所提高,功能也有所增強(qiáng),并且可以支持一定程度的可擴(kuò)展性要求。這類服務(wù)器一般會(huì)支持對稱多處理器結(jié)構(gòu)、熱插拔硬盤和熱插拔電源等功能,易于管理和維護(hù),具有高可用性。工作組級服務(wù)器可以滿足中小型網(wǎng)絡(luò)用戶的數(shù)據(jù)處理、文件共享、互聯(lián)網(wǎng)接入及簡單數(shù)據(jù)庫應(yīng)用的需求。3)部門級服務(wù)器部門級服務(wù)器屬于中檔服務(wù)器,一般具備比較完備的硬件配置,具有全面的服務(wù)器管理能力,集成了大量的監(jiān)測及管理電路,可監(jiān)測溫度、電壓、風(fēng)扇和機(jī)箱工作狀態(tài)等狀態(tài)參數(shù)。大多數(shù)部門級服務(wù)器能夠滿足用戶在業(yè)務(wù)量迅速增大時(shí)所需的系統(tǒng)可擴(kuò)展性要求,能夠及時(shí)在線升級系統(tǒng)。部門級服務(wù)器是企業(yè)網(wǎng)絡(luò)中在分散的各基層數(shù)據(jù)采集單位與最高層數(shù)據(jù)中心之間保持順利連通的必要環(huán)節(jié),適合中型企業(yè)用于數(shù)據(jù)中心、Web服務(wù)器等應(yīng)用場景。4)企業(yè)級服務(wù)器企業(yè)級服務(wù)器屬于高檔服務(wù)器,其功能和性能能滿足大業(yè)務(wù)量、長時(shí)間穩(wěn)定服務(wù)的需求。企業(yè)級服務(wù)器普遍支持較多的處理器配置,擁有高性能的內(nèi)存和擴(kuò)展總線設(shè)計(jì),配置大容量熱插拔硬盤和熱插拔電源,具有超強(qiáng)的數(shù)據(jù)處理能力。除了具有部門級服務(wù)器的全部特性外,企業(yè)級服務(wù)器最大的特點(diǎn)就是在可靠性工程方面做了大量優(yōu)化,具有高度的容錯(cuò)能力、優(yōu)良的可擴(kuò)展性能,支持故障預(yù)報(bào)警功能、在線診斷和部件熱插拔功能,可滿足極長的系統(tǒng)連續(xù)運(yùn)行時(shí)間要求。企業(yè)級服務(wù)器主要適用于金融、證券、交通、通信、電子商務(wù)和信息服務(wù)等需要高速處理大量高并發(fā)業(yè)務(wù)數(shù)據(jù)并對可靠性要求極高的大型企業(yè)和重要行業(yè),可用于支撐企業(yè)資源管理、電子商務(wù)、辦公自動(dòng)化和大型企業(yè)級數(shù)據(jù)庫服務(wù)等應(yīng)用需求。2.按機(jī)械結(jié)構(gòu)分類按服務(wù)器的機(jī)械結(jié)構(gòu)和外觀劃分,服務(wù)器可以分為塔式(臺式)服務(wù)器、機(jī)架式/機(jī)柜式服務(wù)器和刀片服務(wù)器。1)塔式(臺式)服務(wù)器塔式服務(wù)器(TowerServer)也稱為臺式服務(wù)器,如圖1.1所示,其外觀與結(jié)構(gòu)類似于普通臺式個(gè)人計(jì)算機(jī),塔式服務(wù)器是一種最常見的服務(wù)器。由于該服務(wù)器的擴(kuò)展性較強(qiáng),配置通常也較高,所以塔式服務(wù)器的主機(jī)機(jī)箱通常比標(biāo)準(zhǔn)的個(gè)人計(jì)算機(jī)的機(jī)箱要大,一般都會(huì)預(yù)留足夠的內(nèi)部空間以便進(jìn)行硬盤和電源等部件的擴(kuò)展。圖1.1塔式服務(wù)器示意圖塔式服務(wù)器更多地應(yīng)用在入門級和工作組級服務(wù)器上。其優(yōu)點(diǎn)是成本較低,無須搭配額外設(shè)備,對放置空間的要求較低,并且具有良好的可擴(kuò)展性,可以滿足大部分中小企業(yè)用戶常見的應(yīng)用需求。但是塔式服務(wù)器也有不少缺點(diǎn),例如體積較大,占用空間多,密度低,不方便管理,不適合用在需要采用多臺服務(wù)器協(xié)同工作以滿足更高的應(yīng)用需求的場景。2)機(jī)架式/機(jī)柜式服務(wù)器機(jī)架式服務(wù)器(RackServer)也稱為機(jī)架安裝服務(wù)器(Rack-mountedServer),是服務(wù)器的主流機(jī)械結(jié)構(gòu)之一。機(jī)架(Rack)結(jié)構(gòu)是傳統(tǒng)電信機(jī)房的設(shè)備結(jié)構(gòu)標(biāo)準(zhǔn),機(jī)架內(nèi)包含很多安裝槽,每個(gè)安裝槽內(nèi)都可以用螺絲或免螺絲刀固定裝置把硬件設(shè)備固定在適當(dāng)位置上。因而機(jī)架式服務(wù)器的外觀更像是網(wǎng)絡(luò)通信設(shè)備,安裝在標(biāo)準(zhǔn)的19英寸\h\h(1)機(jī)架內(nèi)。服務(wù)器的寬度為19英寸,高度以1U為基準(zhǔn)單位,1U等于1.75英寸(4.445cm)高度,通常有1U、2U、4U和8U等規(guī)格,以1U和2U最為常見。與安裝在垂直、獨(dú)立機(jī)箱中的塔式服務(wù)器相比,機(jī)架式服務(wù)器的機(jī)箱高度有限。一個(gè)機(jī)架上可以安裝層層堆疊的多臺標(biāo)準(zhǔn)設(shè)備,因而可以在有限的空間內(nèi)部署更多的機(jī)架式服務(wù)器,這有助于降低整體服務(wù)成本。機(jī)架式服務(wù)器因其配置方式簡化了網(wǎng)絡(luò)組件的布線,尤其在信息服務(wù)類企業(yè)的數(shù)據(jù)中心機(jī)房中應(yīng)用最為普遍。在大型專用機(jī)房可以通過標(biāo)準(zhǔn)化的方式統(tǒng)一部署和管理大量的機(jī)架式服務(wù)器,并綜合考慮服務(wù)器的體積、功耗、發(fā)熱量等物理參數(shù),在機(jī)房中配置嚴(yán)密的保安措施、良好的冷卻系統(tǒng)和多重備份的供電系統(tǒng)。在高檔服務(wù)器應(yīng)用場景中,還會(huì)采用機(jī)柜式服務(wù)器。機(jī)架一般為敞開式結(jié)構(gòu),而機(jī)柜采用全封閉式或半封閉式結(jié)構(gòu),因而使用機(jī)柜更方便進(jìn)行熱管理,并具有增強(qiáng)電磁屏蔽效果、降低設(shè)備工作噪聲以及過濾空氣等功能。圖1.2為華為TaiShan200機(jī)架式服務(wù)器的前視圖和后視圖。圖1.2華為TaiShan200機(jī)架式服務(wù)器3)刀片服務(wù)器隨著用戶對系統(tǒng)總體運(yùn)營成本和系統(tǒng)管理維護(hù)成本關(guān)注度的日益提升,刀片服務(wù)器(BladeServer)已經(jīng)成為高性能計(jì)算機(jī)群的主流。刀片服務(wù)器是一種單板形態(tài)的服務(wù)器結(jié)構(gòu),也是機(jī)群系統(tǒng)的一種常見實(shí)現(xiàn)方式。刀片服務(wù)器將傳統(tǒng)的機(jī)架式服務(wù)器的所有功能集中在一塊高度壓縮的電路板中,然后再插入機(jī)柜或機(jī)架內(nèi)。多臺刀片服務(wù)器能夠重疊在一起,方便地插入一個(gè)機(jī)架或機(jī)柜的平面中,充分節(jié)省空間。每一塊“刀片”實(shí)際上就是一塊單獨(dú)的很薄的服務(wù)器系統(tǒng)主板,集成了一個(gè)完整的計(jì)算機(jī)系統(tǒng),包括處理器、內(nèi)存、硬盤、網(wǎng)絡(luò)連接和相關(guān)的電子器件,并獨(dú)立安裝自己的操作系統(tǒng),但網(wǎng)絡(luò)等I/O(Input/Output,輸入/輸出)接口及供電、散熱和管理等功能則全部由機(jī)柜統(tǒng)一提供。刀片服務(wù)器之間共享公用高速總線,共用機(jī)架或機(jī)柜基礎(chǔ)設(shè)施,并支持冗余特性,又由于設(shè)備的發(fā)熱量降低,因而采用刀片服務(wù)器降低了能源消耗。因此,刀片服務(wù)器是為高密度計(jì)算環(huán)境專門設(shè)計(jì)的一種實(shí)現(xiàn)高可用、高密度的低成本服務(wù)器。刀片服務(wù)器屬于高密度服務(wù)器,可以構(gòu)成完成某一特定任務(wù)的服務(wù)器機(jī)群。大型數(shù)據(jù)中心或互聯(lián)網(wǎng)服務(wù)提供商(InternetServiceProvider,ISP)的網(wǎng)站服務(wù)器主機(jī)一般都采用刀片服務(wù)器。圖1.3顯示了華為刀片服務(wù)器的機(jī)箱與計(jì)算節(jié)點(diǎn)。圖1.3華為刀片服務(wù)器機(jī)箱與計(jì)算節(jié)點(diǎn)3.按用途分類根據(jù)服務(wù)器主要提供的服務(wù),可以將其大致分為以下幾類。1)業(yè)務(wù)服務(wù)器業(yè)務(wù)服務(wù)器用于支撐某類特定業(yè)務(wù)的服務(wù),例如Web應(yīng)用服務(wù)器、數(shù)據(jù)庫應(yīng)用服務(wù)器、大數(shù)據(jù)分析服務(wù)器等。2)存儲服務(wù)器存儲服務(wù)器專注于提供數(shù)據(jù)存儲功能,通常這類服務(wù)器會(huì)包含大量的磁盤等外存儲器設(shè)備。3)其他專用服務(wù)器為了提供高性能的專業(yè)服務(wù),有些數(shù)據(jù)中心會(huì)把部分專用的功能匯聚在一起,這些專用服務(wù)器會(huì)被獨(dú)立管理,專門用于解決特定的問題,通常也會(huì)配置專用的硬件和軟件。例如人工智能的訓(xùn)練通常需要借助異構(gòu)計(jì)算架構(gòu)提供算力,這類機(jī)器往往需要配置大量的GPU(GraphicsProcessingUnit,圖形處理器)或FPGA(FieldProgrammableGateArray,現(xiàn)場可編程門陣列)實(shí)現(xiàn)CPU加速,而專用于安全服務(wù)的設(shè)備可以配置專用的加密/解密硬件加速器。4.按處理器架構(gòu)分類對任何計(jì)算機(jī)系統(tǒng)而言,處理器都是核心,服務(wù)器也不例外。在某種程度上,服務(wù)器使用的處理器體系結(jié)構(gòu)(架構(gòu))對服務(wù)器的功能、性能、成本、功耗及其生態(tài)環(huán)境的影響巨大。通??梢愿鶕?jù)處理器在其設(shè)計(jì)時(shí)遵循的原則將計(jì)算機(jī)劃分為CISC(ComplexInstructionSetComputer,復(fù)雜指令集計(jì)算機(jī))和RISC(ReducedInstructionSetComputer,精簡指令集計(jì)算機(jī))。相應(yīng)地,處理器體系結(jié)構(gòu)也被劃分為CISC架構(gòu)和RISC架構(gòu)。雖然從處理器的設(shè)計(jì)思想看,CISC架構(gòu)和RISC架構(gòu)各有各的明顯特征,但是現(xiàn)代處理器設(shè)計(jì)都會(huì)盡可能吸收利用RISC處理器設(shè)計(jì)思想中的精華。因而現(xiàn)代處理器結(jié)構(gòu)中已經(jīng)很難找到完全符合CISC架構(gòu)特征的實(shí)例了。盡管如此,人們習(xí)慣上仍會(huì)把從早期的CISC架構(gòu)延續(xù)下來并與之保持指令集兼容的處理器稱為CISC架構(gòu)處理器。按照所使用的處理器的體系結(jié)構(gòu)劃分,服務(wù)器可以分為CISC架構(gòu)服務(wù)器、RISC架構(gòu)服務(wù)器和EPIC架構(gòu)服務(wù)器。其中,EPIC架構(gòu)是一種特殊的RISC架構(gòu)。1)CISC架構(gòu)服務(wù)器CISC架構(gòu)服務(wù)器主要是指采用英特爾(Intel)公司的Intel64架構(gòu)、超威半導(dǎo)體(AMD)公司的AMD64架構(gòu)處理器及早期的32位IA-32架構(gòu)處理器的服務(wù)器。由于這種架構(gòu)的服務(wù)器是從個(gè)人計(jì)算機(jī)發(fā)展而來的,和PC采用的處理器體系結(jié)構(gòu)相似,因此也被稱為PC服務(wù)器或x86服務(wù)器。CISC架構(gòu)服務(wù)器是當(dāng)前服務(wù)器市場的主流,據(jù)統(tǒng)計(jì)其出貨量占到服務(wù)器總出貨量的90%以上。當(dāng)前使用的x86架構(gòu)的服務(wù)器處理器主要有英特爾公司的至強(qiáng)(Xeon)系列和AMD公司的皓龍(Opteron)系列、霄龍(EPYC)系列等。其中,英特爾公司在服務(wù)器處理器市場上占據(jù)著相當(dāng)大的份額。2)RISC架構(gòu)服務(wù)器RISC架構(gòu)服務(wù)器一般是指采用非英特爾架構(gòu)的服務(wù)器,例如IBM的Power系列、惠普公司的Alpha系列和PA-RISC系列、SUN/Oracle公司的SPARC系列、MIPS公司的MIPS處理器等采用RISC架構(gòu)處理器的服務(wù)器,也包括最近幾年迅速進(jìn)入市場的ARM架構(gòu)服務(wù)器。RISC架構(gòu)的服務(wù)器基于不同體系結(jié)構(gòu)的RISC處理器,一般而言其價(jià)格昂貴、體系封閉,主要采用UNIX和其他專用操作系統(tǒng),但是穩(wěn)定性好、性能強(qiáng)大,在金融、電信等大型企業(yè)和關(guān)鍵應(yīng)用領(lǐng)域中居于非常重要的地位。早期進(jìn)入市場的RISC架構(gòu)服務(wù)器,由于用途單一、生產(chǎn)規(guī)模太小,因而其處理器價(jià)格居高不下,目前大部分產(chǎn)品已經(jīng)停止銷售了。當(dāng)前,除了新興的ARM架構(gòu)服務(wù)器之外,在中高檔服務(wù)器市場上銷售的RISC架構(gòu)服務(wù)器處理器中,IBM公司的Power架構(gòu)是主流,占據(jù)了最大的UNIX服務(wù)器市場份額。Power架構(gòu)是由蘋果公司、IBM公司和摩托羅拉公司共同開發(fā)的微處理器架構(gòu),Power的含義是“性能優(yōu)化的增強(qiáng)RISC處理器(PerformanceOptimizedWithEnhancedRISC)”。Power架構(gòu)性能強(qiáng)大,但價(jià)格高昂,其在硬件上的最大特點(diǎn)是采用對稱多處理器(SMP)技術(shù),可以保障任何一個(gè)CPU訪問內(nèi)存的速度都相同。在國內(nèi),IBM公司與浪潮電子信息產(chǎn)業(yè)股份有限公司共同建立的合資企業(yè)———浪潮商用機(jī)器有限公司(IPS)負(fù)責(zé)運(yùn)營Power服務(wù)器業(yè)務(wù)。IBM公司于2019年發(fā)布了Power指令集架構(gòu)的開放標(biāo)準(zhǔn),芯片設(shè)計(jì)人員能夠在無須支付許可費(fèi)的情況下將OpenPower功能加入自己的處理器中,甚至可以針對特定的應(yīng)用場景擴(kuò)展和定制指令集。最新的Power9處理器采用全新的構(gòu)架,其指令流水線支持8條指令取指、6條指令分發(fā)和9條指令發(fā)射,執(zhí)行單元位寬達(dá)128位,共可以實(shí)現(xiàn)256位數(shù)據(jù)執(zhí)行位寬以及獨(dú)立的存儲器訪問(Load和Store)隊(duì)列。Power9支持SMT8或SMT4處理器內(nèi)核兩種配置,圖1.4顯示了IBMPower9SMT8處理器內(nèi)核的核心架構(gòu)。從圖1.4中可以看出,Power9處理器的核心由VSU(VectorScalarUnit,向量標(biāo)量單元)流水線、LSU(LoadStoreUnit,加載存儲單元)和BRU(BRanchUnit,分支單元)等部件構(gòu)成,處理器針對性能和效率進(jìn)行了精準(zhǔn)優(yōu)化。早期由SUN公司開發(fā)、目前由Oracle(甲骨文)公司繼承的SPARC(可擴(kuò)展處理器架構(gòu),ScalableProcessorARChitecture)也曾在高性能服務(wù)器領(lǐng)域占據(jù)優(yōu)勢地位。Oracle公司和富士通公司仍在生產(chǎn)基于SPARC架構(gòu)的服務(wù)器。SPARC架構(gòu)以可擴(kuò)展性見長,因與Oracle軟件一體化設(shè)計(jì),可以更好地支持業(yè)務(wù)關(guān)鍵型環(huán)境的數(shù)據(jù)庫和企業(yè)應(yīng)用。圖1.4IBMPower9SMT8處理器內(nèi)核的核心架構(gòu)最近幾年,ARM架構(gòu)的處理器進(jìn)軍服務(wù)器市場,多家企業(yè)推出的ARM架構(gòu)服務(wù)器正在收復(fù)RISC架構(gòu)服務(wù)器的陣地。3)EPIC架構(gòu)服務(wù)器EPIC即顯式并行指令計(jì)算(ExplicitlyParallelInstructionComputing),采用這一架構(gòu)的處理器就是英特爾公司和惠普等公司聯(lián)合開發(fā)的基于IA-64架構(gòu)的安騰(Itanium)處理器。雖然安騰處理器也被認(rèn)為是RISC處理器,但其體系結(jié)構(gòu)卻與其他RISC處理器有顯著的不同,其最突出的特色即顯式并行指令計(jì)算技術(shù)與超長指令字技術(shù)的結(jié)合。安騰處理器的指令字中設(shè)計(jì)了屬性字段,用于指明哪些指令可以并行執(zhí)行。這些屬性信息并不是在指令執(zhí)行過程中由處理器判定后獲得的,而是由編譯程序在編譯時(shí)通過對源代碼的分析獲取指令級并行性信息并填寫到執(zhí)行代碼中。這就是所謂的“顯式并行”的概念。傳統(tǒng)的超標(biāo)量RISC體系結(jié)構(gòu)雖然同樣支持指令級并行,但并沒有充分利用編譯程序產(chǎn)生的許多有用信息去調(diào)整程序的運(yùn)行路線,因而RISC處理器必須設(shè)計(jì)非常復(fù)雜的并行調(diào)度電路。EPIC技術(shù)則充分利用現(xiàn)代編譯程序強(qiáng)大的對程序執(zhí)行過程的調(diào)度能力,由專用的EPIC編譯器首先分析源代碼,根據(jù)指令之間的依賴關(guān)系最大限度地挖掘指令級的并行性,從而確定哪些指令可以并行執(zhí)行,然后把可并行執(zhí)行的指令組合在一起并重新排序,提取并調(diào)度其指令級的并行性,并將這種并行性通過屬性字段“顯式”地告知指令執(zhí)行部件。與RISC處理器在指令執(zhí)行的很短的時(shí)間內(nèi)對數(shù)十條指令的可執(zhí)行代碼進(jìn)行掃描和并行性優(yōu)化相比,EPIC編譯器有足夠多的時(shí)間掃描足夠長的源代碼,從而獲得全局性的并行編譯優(yōu)化效果,并使處理器硬件變得簡單而高速。從這個(gè)意義上說,安騰體系結(jié)構(gòu)中處理器的功能是由處理器硬件和軟件編譯器兩部分協(xié)同完成的。處理器硬件只需按序高速并行處理指令和數(shù)據(jù),EPIC編譯器從某種意義上等價(jià)于協(xié)調(diào)并行工作必需的一部分控制電路。這一方面降低了處理器的復(fù)雜度,簡化了處理器的結(jié)構(gòu),大大縮短了處理器在程序執(zhí)行時(shí)所消耗的時(shí)間;另一方面又打破了傳統(tǒng)體系結(jié)構(gòu)順序執(zhí)行的限制,使處理器的并行計(jì)算能力達(dá)到了更高的水平。VLIW(VeryLongInstructionWord,超長指令字)技術(shù)也是提高計(jì)算機(jī)系統(tǒng)并行性的有效手段。VLIW系統(tǒng)中指令字長可多達(dá)幾百位,由編譯器在編譯時(shí)找出指令間潛在的并行性,進(jìn)行適當(dāng)?shù)恼{(diào)度安排,把多個(gè)能夠并行執(zhí)行的操作組合在一起合并成一條具有多個(gè)操作碼的超長指令,控制處理器中的多個(gè)相互獨(dú)立的功能部件,相當(dāng)于同時(shí)執(zhí)行多條指令,從而提高處理器的并行性。而EPIC正是基于超長指令字的設(shè)計(jì)。編譯器生成的可執(zhí)行代碼并不是串行指令,而是一系列長度固定為128位的“指令束”(InstructionBundle),每個(gè)“指令束”包含了3條各為41位長的指令和5位長的指令模板。處理器在執(zhí)行指令時(shí)每次取得一個(gè)指令束,并向各執(zhí)行單元同時(shí)發(fā)送3條指令,這使得單個(gè)芯片內(nèi)的并行能力達(dá)到了新的高度。通過將多條指令放入一個(gè)超長指令字,能有效提高處理器內(nèi)各個(gè)執(zhí)行部件的利用率。雖然EPIC處理器的設(shè)計(jì)思想有其獨(dú)到之處,但由于生態(tài)環(huán)境等原因,生產(chǎn)EPIC架構(gòu)服務(wù)器的惠普(HP)公司已經(jīng)宣布將于2025年前停止對基于安騰處理器的服務(wù)器的支持,屆時(shí)EPIC架構(gòu)將完全退出市場。1.1.2服務(wù)器的性能評價(jià)服務(wù)器的處理能力和穩(wěn)健、連續(xù)、可靠的工作能力是其區(qū)別于個(gè)人計(jì)算機(jī)的最重要的兩個(gè)方面。在評價(jià)服務(wù)器的處理能力時(shí),測試基準(zhǔn)(Benchmark)是最常見的工具。當(dāng)企業(yè)或客戶無法通過建立接近真實(shí)業(yè)務(wù)應(yīng)用的操作環(huán)境進(jìn)行各種壓力測試時(shí),借助各類測試基準(zhǔn)測算出不同應(yīng)用環(huán)境下服務(wù)器系統(tǒng)的響應(yīng)時(shí)間、吞吐量等指標(biāo)有助于相對客觀地對服務(wù)器的性能做出接近真實(shí)狀況的評估。基準(zhǔn)測試程序集成了某一類用戶的典型負(fù)載,是進(jìn)行程序性能度量的有力工具。基準(zhǔn)測試程序針對特定的應(yīng)用環(huán)境,通過一組有代表性的程序評估系統(tǒng)的性能,比單個(gè)程序更能代表用戶的負(fù)載狀況。測試程序以程序運(yùn)行時(shí)間長度為度量,或是以單位時(shí)間內(nèi)完成的操作數(shù)量為度量,兩者存在對應(yīng)關(guān)系。測試程序會(huì)給出某個(gè)系統(tǒng)的分?jǐn)?shù),通常是程序運(yùn)行時(shí)間的函數(shù)。在服務(wù)器的工業(yè)標(biāo)準(zhǔn)基準(zhǔn)測試體系中存在眾多的性能測試基準(zhǔn),包括TPC、SPEC、SAPSD、Linpack和HPCC等,可以從處理器性能、服務(wù)器系統(tǒng)性能、商業(yè)應(yīng)用性能,乃至高性能計(jì)算機(jī)系統(tǒng)的性能等不同層面給出量化的參考評價(jià)指標(biāo)。不同的測試基準(zhǔn)的側(cè)重點(diǎn)不同,例如:Linpack基準(zhǔn)側(cè)重于系統(tǒng)浮點(diǎn)峰值運(yùn)算能力的測試,成為全球超級計(jì)算機(jī)500強(qiáng)(TOP500)的評測基準(zhǔn);而STREAM測試基準(zhǔn)關(guān)注對系統(tǒng)的數(shù)據(jù)訪問能力的定量評價(jià);SPECCPU測試基準(zhǔn)和SPECWeb測試基準(zhǔn)分別針對單CPU性能及作業(yè)吞吐能力和應(yīng)用于Web服務(wù)器時(shí)的性能。這些測試基準(zhǔn)中,最常用的是TPC和SPEC兩大基準(zhǔn)。1.TPC測試基準(zhǔn)TPC代表事務(wù)處理性能委員會(huì)(TransactionprocessingPerformanceCouncil),是由以計(jì)算機(jī)軟硬件廠家為主的數(shù)十家會(huì)員企業(yè)聯(lián)合創(chuàng)建的非營利性組織,總部設(shè)在美國。該組織的主要工作是制定商務(wù)應(yīng)用基準(zhǔn)測試程序的測試基準(zhǔn),以及評估和檢測這些測試基準(zhǔn)的完整流程。TPC定義了一系列基準(zhǔn)測試程序的標(biāo)準(zhǔn)規(guī)范,以及能耗、性能和價(jià)格度量標(biāo)準(zhǔn),并在其網(wǎng)站()發(fā)布測試源碼(早期的版本不提供測試源碼)和TPC測試結(jié)果。從TPC的名稱可以看出,TPC的測試體系側(cè)重在線處理能力和數(shù)據(jù)庫查詢能力。TPC推出的測試基準(zhǔn)有很多種,分別針對不同的應(yīng)用場景或者使用不同的評測手段。例如,目前針對在線事務(wù)處理(On-LineTransactionProcessing,OLTP)的測試基準(zhǔn)有兩個(gè):TPC-C和TPC-E。TPC-C(TPC測試基準(zhǔn)C,TPCBenchmarkC)的最新規(guī)范版本為2010年發(fā)布的5.11版。TPC-C從系統(tǒng)的角度反映數(shù)據(jù)庫應(yīng)用的性能,其測試包含處理器、內(nèi)存儲器和輸入/輸出設(shè)備在內(nèi)的系統(tǒng)整機(jī),因此該基準(zhǔn)推出后被廣泛用于評估服務(wù)器的性能。而2007年推出的TPC-E測試基準(zhǔn)比TPC-C更能反映當(dāng)前的技術(shù)現(xiàn)實(shí),測試成本也更低,其最新版本為2015年發(fā)布的1.14.0版。TPC測試基準(zhǔn)中比較常用的還有用于決策支持和大數(shù)據(jù)的測試標(biāo)準(zhǔn)TPC-H和TPC-DS,以及用于服務(wù)器虛擬化測試的基準(zhǔn)TPC-VMS等。早期的TPC-A、TPC-B、TPC-D等標(biāo)準(zhǔn)已經(jīng)停止使用,并被新的標(biāo)準(zhǔn)取代。2.SPEC測試基準(zhǔn)SPEC指的是標(biāo)準(zhǔn)性能評估機(jī)構(gòu)(StandardPerformanceEvaluationCorporation),是由超過60家世界知名計(jì)算機(jī)廠商支持的全球性的、非營利性的第三方應(yīng)用性能基準(zhǔn)測試組織,旨在確立和認(rèn)定一系列服務(wù)器應(yīng)用性能評估的標(biāo)準(zhǔn)。SPEC組織的成員包括IBM、AT&T、DG、DEC、富士通、HP、英特爾、MIPS、摩托羅拉、SUN、Unisys等知名企業(yè)。相對而言,SPEC測試基準(zhǔn)能夠更全面反映機(jī)器的性能,具有很高的參考價(jià)值。SPEC同樣會(huì)根據(jù)應(yīng)用領(lǐng)域的不同設(shè)置不同的測試基準(zhǔn)。SPEC針對云計(jì)算場景推出的測試基準(zhǔn)為SPECCloudIaaS,是面向基礎(chǔ)架構(gòu)即服務(wù)(Infrastructure-as-a-Service,IaaS)的云計(jì)算SPEC基準(zhǔn)。該基準(zhǔn)側(cè)重于擁有多種多實(shí)例工作負(fù)載(Multi-instanceWorkloads)的IaaS公有云平臺和私有云平臺的配置、計(jì)算、存儲和網(wǎng)絡(luò)資源。最新的版本為SPECCloudIaaS2018。針對圖形和工作站性能,SPEC除了推出面向?qū)I(yè)應(yīng)用的圖形性能測試基準(zhǔn)———SPECviewperf和SPECviewperfLinuxEdition,面向工作站的測試基準(zhǔn)———SPECworkstation外,還針對Autodesk3dsMax、Maya、Solidworks等常用軟件專門推出了相應(yīng)版本的SPECapc測試基準(zhǔn)。針對高性能計(jì)算和OpenMP、MPI、OpenACC及OpenCL等異構(gòu)與并行計(jì)算場景,SPEC推出了SPECACCEL、SPECMPI、SPECOMP測試基準(zhǔn)。針對Java的客戶機(jī)/服務(wù)器體系,SPECjbb測試基準(zhǔn)面向JVM虛擬機(jī)廠商、硬件設(shè)計(jì)師和Java應(yīng)用程序員以及研究人員,用于評估Java服務(wù)器性能;SPECjEnterprise基準(zhǔn)及其WebProfile版本則是度量Java企業(yè)版(JavaEE)應(yīng)用服務(wù)器、數(shù)據(jù)庫及其支撐架構(gòu)全系統(tǒng)性能的工具。SPECjvm基準(zhǔn)則用于Java運(yùn)行環(huán)境(JavaRuntimeEnvironment,JRE)的測試。SPEC基準(zhǔn)也有專門面向文件服務(wù)器存儲應(yīng)用、功耗評估和虛擬化應(yīng)用的SPECSFS、SPECpower_ssj和SPECVIRT_SC等版本。上述這些SPEC測試基準(zhǔn)通常面向特定應(yīng)用領(lǐng)域和特定應(yīng)用場景,甚至面向特定應(yīng)用軟件,而其覆蓋范圍一般會(huì)涉及處理器和存儲器在內(nèi)的運(yùn)行環(huán)境。由于這些基準(zhǔn)通常能夠體現(xiàn)軟、硬件平臺的性能和成本指標(biāo),因而被金融、電信、證券等關(guān)鍵行業(yè)用戶作為選擇信息系統(tǒng)的權(quán)威基準(zhǔn)指標(biāo)。SPEC測試基準(zhǔn)規(guī)范中歷史最悠久、應(yīng)用最普遍的應(yīng)該就是SPECCPU基準(zhǔn)了。SPECCPU測試基準(zhǔn)體系針對支撐運(yùn)算密集的工作負(fù)載的計(jì)算機(jī)系統(tǒng)的性能度量,并支持在眾多計(jì)算機(jī)系統(tǒng)之間進(jìn)行比較。該基準(zhǔn)重點(diǎn)關(guān)注計(jì)算機(jī)系統(tǒng)的處理器、存儲子系統(tǒng)和編譯器,不涉及硬盤、輸入/輸出和網(wǎng)絡(luò)等部件。SPECCPU測試基準(zhǔn)經(jīng)歷了SPECCPU92、SPECCPU95、SPECCPU2000、SPECCPU2006和SPECCPU2017等多個(gè)版本。在2006年版的SPECCPU測試基準(zhǔn)中,包含針對定點(diǎn)數(shù)運(yùn)算的SPECint測試和針對浮點(diǎn)數(shù)運(yùn)算的SPECfp測試。前者共有12個(gè)不同的基準(zhǔn)測試項(xiàng),使用C語言或者C++語言,不使用CPU的浮點(diǎn)運(yùn)算單元;后者共有19個(gè)不同的基準(zhǔn)測試項(xiàng),使用FORTRAN77/90語言和C語言。更進(jìn)一步地講,SPECCPU測試基準(zhǔn)通過不同方式度量處理器性能:測量計(jì)算機(jī)完成單一任務(wù)時(shí)間的方式為SPEC速度測量(SPECspeedMetrics),并通過SPECint2006benchmark指標(biāo)呈現(xiàn),用于比較不同計(jì)算機(jī)完成單一任務(wù)的能力;而衡量在特定時(shí)間長度內(nèi)能夠完成多少任務(wù)的方式稱為吞吐率(Throughput)測量、容量(Capacity)測量或者速度(Rate)測量,并通過SPECint_rate2006benchmark指標(biāo)呈現(xiàn),評價(jià)機(jī)器承載大量任務(wù)的能力,通常用于多CPU系統(tǒng)的評價(jià)。SPEC在其網(wǎng)站()上發(fā)布了CPU測試基準(zhǔn)的測試程序源代碼,由用戶編譯生成可執(zhí)行代碼后完成測試,以保證該測試基準(zhǔn)能夠?qū)崿F(xiàn)跨平臺測試。SPECCPU測試基準(zhǔn)中的大部分源代碼來源于真實(shí)應(yīng)用場景,包括各類開源項(xiàng)目。由于源代碼到可執(zhí)行代碼的映射并不唯一,因而編譯器的效率就顯得十分重要。SPECCPU2006給出的測試結(jié)果有“基礎(chǔ)(Base)”和“峰值(Peak)”兩種。在基礎(chǔ)測試時(shí)需要限制編譯時(shí)的優(yōu)化參數(shù),以保證測試的公平,而對峰值測試的限制則比較寬松。最新的SPECCPU2017版本包含多達(dá)43項(xiàng)工業(yè)標(biāo)準(zhǔn)的基準(zhǔn)測試,劃分成4個(gè)測試組(Suite):針對整數(shù)計(jì)算的SPECspeed2017Integer和SPECrate2017Integer測試組,以及針對浮點(diǎn)數(shù)運(yùn)算的SPECspeed2017FloatingPoint和SPECrate2017FloatingPoint測試組。SPECCPU還包含測試能源消耗的選項(xiàng)。其中,SPECspeed2017Integer和SPECspeed2017FloatingPoint測試組用于比較完整的單一任務(wù)在計(jì)算機(jī)系統(tǒng)上的執(zhí)行時(shí)間的測試,而SPECrate2017Integer和SPECrate2017FloatingPoint測試組用于吞吐率度量,也即測試單位時(shí)間的工作任務(wù)量。1.1.3服務(wù)器的可靠性與管理IBM公司為了衡量其大型機(jī)的穩(wěn)健性,曾提出可靠性(Reliability)、可用性(Availability)和可服務(wù)性(Serviceability)的概念,這三個(gè)特性被統(tǒng)稱為RAS特性,并且被用作描述計(jì)算機(jī)與信息系統(tǒng)硬件工程可靠性的一個(gè)術(shù)語,廣泛應(yīng)用于信息技術(shù)相關(guān)的各個(gè)領(lǐng)域。可服務(wù)性也稱作可維護(hù)性(Maintainability),故RAS有時(shí)也被稱為RAM。此外,在評價(jià)系統(tǒng)穩(wěn)健性時(shí)通常還會(huì)考慮可擴(kuò)展性(Scalability)、易用性(Usability)和可管理性(Manageability)等屬性。1.服務(wù)器的RASUM特性很多文獻(xiàn)把評價(jià)服務(wù)器或系統(tǒng)是否滿足其可靠性工程設(shè)計(jì)目標(biāo)的五個(gè)特性統(tǒng)稱為RASUM,即可靠性、可用性、可擴(kuò)展性或可服務(wù)性、易用性和可管理性。1)可靠性可靠性用于描述系統(tǒng)是否能夠正確工作,或者說系統(tǒng)是否具有提供持續(xù)正確服務(wù)的能力,也即軟件或硬件是否能夠按照其規(guī)范持續(xù)提供服務(wù)。具體而言,可靠性指的是系統(tǒng)能夠正確產(chǎn)生輸出結(jié)果達(dá)到一個(gè)給定時(shí)限的能力。增強(qiáng)可靠性有助于避免、檢測和修復(fù)故障。這意味著高可靠性的系統(tǒng)必須能夠檢測某些錯(cuò)誤并能夠滿足下面幾個(gè)條件之一:(1)能夠自修復(fù)錯(cuò)誤;(2)對于無法自修復(fù)的錯(cuò)誤能夠進(jìn)行隔離并上報(bào)給更高層次的自恢復(fù)機(jī)制處理;(3)能夠停止系統(tǒng)受損部分的運(yùn)行,并保障系統(tǒng)其余部分正常運(yùn)轉(zhuǎn);(4)能夠停止整個(gè)系統(tǒng)的工作并報(bào)告相應(yīng)的錯(cuò)誤??煽啃酝ǔS霉收下剩‵ailureinTime,F(xiàn)IT)或平均失效間隔時(shí)間(MeanTimeBetweenFailure,或稱平均無故障時(shí)間,MTBF)來度量。1FIT等于每十億(Billion)小時(shí)內(nèi)產(chǎn)生一個(gè)錯(cuò)誤,MTBF大約等于11.4萬年。2)可用性可用性用于描述系統(tǒng)能夠正確工作的時(shí)間,指的是系統(tǒng)能夠在給定的時(shí)間內(nèi)確??梢赃\(yùn)行的能力。一般而言,一個(gè)高可用性的系統(tǒng)即使出現(xiàn)一些小的問題也不會(huì)影響整個(gè)系統(tǒng)的正常運(yùn)行,在某些情況下甚至可以進(jìn)行熱插拔操作,以替換有問題的組件,從而嚴(yán)格地將系統(tǒng)的宕機(jī)(停機(jī))或無法正常服務(wù)的時(shí)間限定在一定范圍內(nèi)??捎眯酝ǔ?梢杂枚喾N方式度量:一定時(shí)間內(nèi)的宕機(jī)或不能提供服務(wù)的平均時(shí)間長度,給定時(shí)間內(nèi)系統(tǒng)宕機(jī)或不能提供服務(wù)的總時(shí)間長度,或者系統(tǒng)實(shí)際運(yùn)行時(shí)間中可用時(shí)間所占的百分比??捎眯钥梢允褂孟旅娴墓接?jì)算:可用性=正常運(yùn)行時(shí)間(uptime)/總時(shí)間(totaltime)也可以等價(jià)表示為:可用性=[總時(shí)間(totaltime)-停機(jī)時(shí)間(downtime)]/總時(shí)間(totaltime)高可用性的系統(tǒng)一般在一年中可能只有數(shù)小時(shí)甚至數(shù)分鐘的停機(jī)時(shí)間。例如,5個(gè)9的可用性是指可用時(shí)間占到99.999%,系統(tǒng)連續(xù)運(yùn)行一年時(shí)間最長的服務(wù)中斷時(shí)間是:(1-99.999%)×365天×24小時(shí)×60分鐘=5.26分鐘在運(yùn)營商的通信服務(wù)器、電子商務(wù)網(wǎng)站服務(wù)器、銀行和證券的交易系統(tǒng)等需要持續(xù)穩(wěn)定服務(wù)的場景中,系統(tǒng)的高可用性能產(chǎn)生巨大價(jià)值。3)可服務(wù)性可服務(wù)性(可維護(hù)性)用于描述系統(tǒng)的容錯(cuò)能力,也即在出現(xiàn)錯(cuò)誤之后通過維護(hù)或維修恢復(fù)服務(wù)的難易程度。因此,盡早發(fā)現(xiàn)潛在問題是提高可服務(wù)性的關(guān)鍵,可服務(wù)性高的系統(tǒng)甚至能夠在嚴(yán)重故障出現(xiàn)之前實(shí)現(xiàn)自動(dòng)修復(fù)。具體而言,可服務(wù)性指的是系統(tǒng)是否能夠提供便利的診斷功能,如系統(tǒng)日志、動(dòng)態(tài)檢測等,方便管理人員進(jìn)行系統(tǒng)診斷和維護(hù)操作,從而及早地發(fā)現(xiàn)錯(cuò)誤并修復(fù)錯(cuò)誤。例如:某些企業(yè)級應(yīng)用系統(tǒng)在發(fā)生故障時(shí)可在無須人工干預(yù)的情況自動(dòng)啟動(dòng)服務(wù)機(jī)制,告知設(shè)備廠商故障情況并進(jìn)行診斷、分析和處理操作。4)易用性易用性是指用戶對系統(tǒng)的易學(xué)和易用程度。服務(wù)器的功能相對于個(gè)人計(jì)算機(jī)而言更復(fù)雜,其硬件配置和軟件系統(tǒng)配置更豐富。要讓服務(wù)器充分發(fā)揮其功能和性能優(yōu)勢,必須要解決如何讓用戶更好地使用服務(wù)器的問題。易用性設(shè)計(jì)的重點(diǎn)在于讓系統(tǒng)設(shè)計(jì)更能夠符合使用者的習(xí)慣與需求。對服務(wù)器硬件設(shè)計(jì)而言,常見的免工具拆卸設(shè)計(jì)、可熱插拔的電源模塊及硬盤模塊設(shè)計(jì)、清晰直觀的前端面板系統(tǒng)狀態(tài)標(biāo)識燈等機(jī)箱設(shè)計(jì)人性化手段都是服務(wù)器在易用性方面的設(shè)計(jì)實(shí)現(xiàn)。對于服務(wù)器而言,其用戶主要是系統(tǒng)管理員,服務(wù)器軟件易用性主要體現(xiàn)在服務(wù)器是否容易操作,用戶導(dǎo)航系統(tǒng)是否完善,是否有關(guān)鍵恢復(fù)功能及操作系統(tǒng)備份功能等。軟件的易用性通常包含可學(xué)習(xí)性,效率,可記憶性,很少出現(xiàn)嚴(yán)重錯(cuò)誤和滿意度高等方面。5)可管理性可管理性(易管理性)描述的是系統(tǒng)在運(yùn)行過程中便于管理的程度,也即一個(gè)系統(tǒng)能夠滿足管理需求的能力及管理該系統(tǒng)的便利程度。大多數(shù)系統(tǒng)管理任務(wù)由系統(tǒng)管理員通過使用一系列管理工具來完成,少數(shù)管理任務(wù)需要領(lǐng)域?qū)<业膮⑴c,另外一些任務(wù)則可由管理系統(tǒng)自動(dòng)完成。對于與服務(wù)器相關(guān)的種類繁多的硬件設(shè)備,每個(gè)設(shè)備都要有相應(yīng)的工具提供全面的管理支持,例如網(wǎng)絡(luò)流量監(jiān)控、數(shù)據(jù)庫軟件的參數(shù)配置、服務(wù)器所處環(huán)境的溫度監(jiān)測等,設(shè)備本身為管理功能的實(shí)現(xiàn)提供支持。服務(wù)器的可管理性通常通過智能管理系統(tǒng)實(shí)現(xiàn)。服務(wù)器硬件通常配置鍵盤(Keyboard)、視頻(Video)、鼠標(biāo)(Mouse)端口,能夠直接連接外部人-機(jī)交互設(shè)備,實(shí)現(xiàn)訪問和控制。服務(wù)器也通過管理網(wǎng)口實(shí)現(xiàn)服務(wù)器的遠(yuǎn)程管理,例如通過IPMI(IntelligentPlatformManagementInterface,智能平臺管理接口)2.0來實(shí)現(xiàn)遠(yuǎn)程對服務(wù)器的物理健康特征的監(jiān)控,包括溫度、電壓與風(fēng)扇工作狀態(tài)、電源狀態(tài)等。良好的易管理性可以有效減少系統(tǒng)的管理和維護(hù)成本。6)可擴(kuò)展性服務(wù)器的可擴(kuò)展性(可伸縮性)是指服務(wù)器的硬件配置可以根據(jù)需要靈活改變。例如,服務(wù)器的內(nèi)存容量、適配器和硬盤數(shù)量及處理器參數(shù)等可以隨著不同的需要而改變配置。通常在機(jī)架上要為硬盤和電源的增加留有充分余地,主機(jī)板上的擴(kuò)展插槽不但應(yīng)種類齊全,而且保證有一定數(shù)量。2.RAS技術(shù)對于承載關(guān)鍵業(yè)務(wù)而又要提供連續(xù)服務(wù)的服務(wù)器系統(tǒng)而言,處理能力越高,承載的業(yè)務(wù)越多,服務(wù)器計(jì)劃外宕機(jī)對用戶的影響就越大。據(jù)調(diào)查,計(jì)劃外宕機(jī)造成的業(yè)務(wù)成本往往高達(dá)每小時(shí)數(shù)十萬甚至上百萬美元。除了金錢之外,意外宕機(jī)的損失還包括對企業(yè)聲譽(yù)的負(fù)面影響、客戶不自覺流失及員工無法按計(jì)劃工作等。RAS技術(shù)可以通過以下方式有效減少故障出現(xiàn)的概率:在造成系統(tǒng)失效之前檢測并修正瞬時(shí)錯(cuò)誤;定位和替換失效部件;提前預(yù)測失效,以便在計(jì)劃的維護(hù)時(shí)間內(nèi)更換系統(tǒng)或部件。1)高可靠性技術(shù)一個(gè)高可靠性系統(tǒng)在發(fā)生故障時(shí)應(yīng)能自動(dòng)檢測錯(cuò)誤,甚至能修復(fù)錯(cuò)誤。提升可靠性有多種方式:減少系統(tǒng)中的組件數(shù)量或系統(tǒng)中的連接器的數(shù)量有助于延長系統(tǒng)的平均無故障間隔時(shí)間;通過糾錯(cuò)碼、數(shù)據(jù)校驗(yàn)以及指令級重試等手段修復(fù)間歇性錯(cuò)誤,確保數(shù)據(jù)完整性也能夠提高可靠性;針對無法修正的錯(cuò)誤,可以采用隔離故障部件并上報(bào)給高級系統(tǒng)恢復(fù)機(jī)制或切換至冗余部件等方式。2)高可用性技術(shù)高可用性系統(tǒng)可以在發(fā)生故障后繼續(xù)運(yùn)行,其實(shí)現(xiàn)方式可以是禁用發(fā)生故障的部件,此時(shí)雖然系統(tǒng)性能有可能會(huì)有一定程度的降低,但保證了整個(gè)系統(tǒng)的可用性。高可用性還可以通過下面的方式實(shí)現(xiàn):(1)部件冗余配置。如果系統(tǒng)停機(jī)造成的損失高于冗余部件本身的成本,對部件進(jìn)行冗余配置就是一種合理的解決方案。(2)采用在部件或子系統(tǒng)內(nèi)部提升數(shù)據(jù)可用性的技術(shù),例如具有熱備份功能的內(nèi)存條或支持鏡像的磁盤驅(qū)動(dòng)器等。(3)在采用集群架構(gòu)的系統(tǒng)中,持續(xù)監(jiān)視服務(wù)器、存儲部件、網(wǎng)絡(luò)子系統(tǒng)和應(yīng)用程序的運(yùn)行狀況有助于維持服務(wù)的高可用性。3)高可服務(wù)性技術(shù)高可服務(wù)性系統(tǒng)一般要支持部件的熱插拔(HotPlug)或熱切換(HotSwap)功能,以便在系統(tǒng)帶電工作的情況下進(jìn)行維護(hù)。熱切換操作不需要主機(jī)操作系統(tǒng)和服務(wù)器提供協(xié)助或提前做好準(zhǔn)備;可以在系統(tǒng)運(yùn)行過程中更換部件,也無須任何設(shè)置工作;而熱插拔操作需要操作系統(tǒng)和服務(wù)器在移除或插入部件之前做好準(zhǔn)備,熱插拔之后可能還需要執(zhí)行一些額外的設(shè)置命令才能令部件正常工作。提升系統(tǒng)的RAS特性需要多種技術(shù)協(xié)同,并統(tǒng)籌考慮處理器、內(nèi)存儲器、輸入/輸出設(shè)備、供電子系統(tǒng)、散熱子系統(tǒng)及操作系統(tǒng)、集群軟件等多種要素。各種RAS特性之間通常相互依存,有些特性之間還存在相互制約關(guān)系,即一種特性的提升會(huì)以另一種特性的降低為代價(jià)。例如,提高系統(tǒng)中各個(gè)部件的集成度能減少系統(tǒng)中芯片或電路板的數(shù)量,從而降低芯片間互連或板間互連引入的干擾,提高系統(tǒng)可靠性。但是這種方案有可能加大系統(tǒng)維護(hù)的難度或延長系統(tǒng)維修所需的時(shí)間,導(dǎo)致可用性和可服務(wù)性的降低。類似地,熱插拔或熱切換功能要求在系統(tǒng)中增加更多的連接器,因而熱插拔或熱切換技術(shù)在提升了可用性的同時(shí)卻降低了可靠性。因此,在設(shè)計(jì)高可靠性、高可用性及高可服務(wù)性系統(tǒng)時(shí)需要在各個(gè)特性之間取得平衡,還要兼顧系統(tǒng)成本等其他因素,才能有效提升整個(gè)系統(tǒng)的RAS性能。3.服務(wù)器管理規(guī)范IPMI(IntelligentPlatformManagementInterface,智能平臺管理接口)是管理服務(wù)器系統(tǒng)中所使用的設(shè)備的規(guī)范,支持用戶利用IPMI技術(shù)監(jiān)視服務(wù)器的物理健康特征,如溫度、電壓與風(fēng)扇工作狀態(tài)、電源狀態(tài)等。IPMI規(guī)范最早用于管理基于英特爾架構(gòu)的企業(yè)系統(tǒng)中所使用的外圍設(shè)備上,現(xiàn)已經(jīng)成為服務(wù)器行業(yè)的工業(yè)標(biāo)準(zhǔn)。服務(wù)器對運(yùn)行環(huán)境的要求通常比個(gè)人計(jì)算機(jī)嚴(yán)格,需要高標(biāo)準(zhǔn)的供電、冷卻等技術(shù)的支持,而且風(fēng)扇噪聲更大,多數(shù)情況下服務(wù)器都會(huì)放置于單獨(dú)的服務(wù)器機(jī)房。因此,服務(wù)器一般不會(huì)長期借助顯示器、鍵盤、鼠標(biāo)等部件進(jìn)行近端操作與管理,通常通過網(wǎng)絡(luò)遠(yuǎn)程連接的方式實(shí)現(xiàn)訪問與管理。IPMI規(guī)范能夠覆蓋硬件平臺、固件和操作系統(tǒng),可以通過智能的方式監(jiān)視、控制并自動(dòng)回報(bào)大量服務(wù)器的運(yùn)行狀態(tài),以降低服務(wù)器系統(tǒng)的運(yùn)維成本。IPMI是與操作系統(tǒng)無關(guān)的,Windows、Linux、Solaris及MacOS等不同的操作系統(tǒng)都可以與之協(xié)同。IPMI可以實(shí)現(xiàn)帶外管理,其管理任務(wù)不占用業(yè)務(wù)傳輸?shù)臄?shù)據(jù)帶寬。IPMI規(guī)范的核心是專用的BMC(BaseboardManagementController,主板管理控制器)芯片。BMC芯片獨(dú)立于服務(wù)器的處理器、固件和操作系統(tǒng),通常配置于服務(wù)器主板上的獨(dú)立板卡內(nèi),或集成在服務(wù)器主板之上。BMC芯片上運(yùn)行的軟件系統(tǒng)可以看作是一個(gè)獨(dú)立于服務(wù)器系統(tǒng)的小型操作系統(tǒng),可以與BIOS和操作系統(tǒng)下的系統(tǒng)管理軟件交互,協(xié)同完成系統(tǒng)管理任務(wù)。BMC規(guī)范描述了內(nèi)置到主板上的管理功能,如本地和遠(yuǎn)程診斷、控制臺操作支持、配置管理、硬件管理和故障排除等。使用IPMI規(guī)范中定義的指令可以向BMC發(fā)送命令,完成相應(yīng)的IPMI功能。BMC通過主板上的不同傳感器監(jiān)視系統(tǒng)狀態(tài),并在系統(tǒng)事件日志中記錄事件消息,維護(hù)傳感器數(shù)據(jù)記錄。BMC提供了各種各樣的接口供上層網(wǎng)管查詢。系統(tǒng)管理員可以通過Web方式、命令行方式直接查詢系統(tǒng)狀態(tài),上層管理軟件也可以通過SNMP(SimpleNetworkManagementProtocol,簡單網(wǎng)絡(luò)管理協(xié)議)、IPMI等接口實(shí)現(xiàn)自動(dòng)查詢。當(dāng)檢測到有異?;蚬收习l(fā)生時(shí),BMC可以通過SNMPtrap(陷阱)消息、SMTP(SimpleMailTransferProtocol,簡單郵件傳輸協(xié)議)郵件消息、httpjson報(bào)文等手段主動(dòng)向上層網(wǎng)管軟件的服務(wù)端報(bào)告,以便運(yùn)維人員及時(shí)識別并處理故障。1.2服務(wù)器處理器1.2.1高性能處理器的并行組織結(jié)構(gòu)日益復(fù)雜的大數(shù)據(jù)、云計(jì)算與人工智能應(yīng)用領(lǐng)域要求現(xiàn)代處理器不斷地為軟件提供更為強(qiáng)大的計(jì)算能力。但由于物理規(guī)律對半導(dǎo)體器件的限制,傳統(tǒng)單處理器通過提高主頻提升性能的方法受到制約,不可能再沿著摩爾定律預(yù)測的軌跡持續(xù)提升。隨著晶體管越來越小,芯片內(nèi)部互連線的延遲造成的影響越來越大,無法滿足不斷提高的主頻對數(shù)據(jù)交換速度提高的要求。高頻率導(dǎo)致的過高功耗不僅使能源消耗劇增,而且無法良好散熱會(huì)對系統(tǒng)穩(wěn)定性造成惡劣影響。主存訪問速度的增長也難以跟上處理器主頻的增長速度,計(jì)算、存儲和輸入/輸出的速度越來越難以匹配。因此,計(jì)算機(jī)系統(tǒng)硬件設(shè)計(jì)者不得不放棄簡單地提高處理器主頻的傳統(tǒng)方法,轉(zhuǎn)向盡可能多地實(shí)現(xiàn)并行處理。計(jì)算機(jī)系統(tǒng)可以在不同的層次引入并行機(jī)制。1.指令流水線從執(zhí)行程序的角度看,并行性等級從低到高可分為多個(gè)層次:一條指令執(zhí)行時(shí)各微操作之間的并行,這是指令內(nèi)部的并行;并行執(zhí)行兩條或多條指令,也即指令級并行(Instruction-LevelParallelism,ILP);并行執(zhí)行兩個(gè)或兩個(gè)以上的任務(wù)(程序段)屬于任務(wù)級并行;最高層次的作業(yè)或程序級并行則是指并行執(zhí)行兩個(gè)或兩個(gè)以上的作業(yè)或程序。并行處理著重挖掘計(jì)算過程中的并行事件,使并行性達(dá)到較高的級別。因此,并行處理是體系結(jié)構(gòu)、硬件、軟件、算法、編程語言等多方面綜合的領(lǐng)域。就單個(gè)處理器而言,在性能提升過程中起著主導(dǎo)作用的是時(shí)間并行技術(shù),也即指令流水線。指令流水線將指令執(zhí)行的完整過程按功能分割為若干相互聯(lián)系的子任務(wù),將每一個(gè)子任務(wù)指定給一個(gè)專門的部件完成;然后按時(shí)間重疊原理把各部分執(zhí)行過程在時(shí)間上重疊起來,使所有部件依次分工完成一組同樣的工作。例如,某個(gè)處理器將指令執(zhí)行的5個(gè)子過程分配給5個(gè)專用部件,即取指令部件(IF)、指令譯碼部件(ID)、指令執(zhí)行部件(EX)、訪問存儲器部件(M)、結(jié)果寫回部件(WB)。將各個(gè)部件按流水方式連接起來,就滿足時(shí)間重疊原理,從而使得處理器內(nèi)部能同時(shí)處理多條指令,提高了處理器的速度。時(shí)間并行技術(shù)實(shí)現(xiàn)了計(jì)算機(jī)系統(tǒng)中的指令級并行。當(dāng)前常見的高性能處理器,無論是CISC架構(gòu)還是RISC架構(gòu),無一不采用指令流水線,流水級數(shù)從幾級到三十多級不等。在計(jì)算機(jī)系統(tǒng)的最底層,流水技術(shù)將時(shí)間并行性引入處理器,而多發(fā)射處理器則把空間并行性引入處理器。超標(biāo)量(Superscalar)設(shè)計(jì)采用多發(fā)射技術(shù),在處理器內(nèi)部設(shè)置多條并行執(zhí)行的指令流水線,通過在每個(gè)時(shí)鐘周期內(nèi)向執(zhí)行單元發(fā)射多條指令實(shí)現(xiàn)指令級并行。2.多處理器系統(tǒng)和多計(jì)算機(jī)系統(tǒng)在單個(gè)處理器性能一定的情況下,進(jìn)一步提高計(jì)算機(jī)系統(tǒng)處理能力的簡單方法就是讓多個(gè)處理器協(xié)同工作,共同完成任務(wù)。廣義而言,使用多臺計(jì)算機(jī)協(xié)同工作來完成所要求任務(wù)的計(jì)算機(jī)系統(tǒng)稱為多處理器(Multi-processor)系統(tǒng)。具體而言,多處理器系統(tǒng)由多個(gè)獨(dú)立的處理器組成,每個(gè)處理器都能夠獨(dú)立執(zhí)行自己的程序和指令流,相互之間通過專門的網(wǎng)絡(luò)連接,實(shí)現(xiàn)數(shù)據(jù)的交換和通信,共同完成某項(xiàng)大的計(jì)算或處理任務(wù)。多處理器系統(tǒng)中的各個(gè)處理器由操作系統(tǒng)管理,實(shí)現(xiàn)作業(yè)級或任務(wù)級并行。與廣義多處理器系統(tǒng)不同,狹義多處理器系統(tǒng)僅指在同一計(jì)算機(jī)內(nèi)處理器之間通過共享存儲器(SharedMemory)方式通信的并行計(jì)算機(jī)系統(tǒng)。運(yùn)行在狹義多處理器上的所有進(jìn)程能夠共享映射到公共內(nèi)存的單一虛擬地址空間。任何進(jìn)程都能通過執(zhí)行加載(Load)或存儲(Store)指令來讀寫一個(gè)內(nèi)存字。與狹義多處理器相對應(yīng),由不共享公共內(nèi)存的多個(gè)處理器系統(tǒng)構(gòu)成的并行系統(tǒng)又稱為多計(jì)算機(jī)(Multi-Computers)系統(tǒng)。每個(gè)系統(tǒng)都有自己的私有內(nèi)存,通過消息傳遞的方式進(jìn)行互相通信。多計(jì)算機(jī)系統(tǒng)有各種不同的形態(tài)和規(guī)模。集群(Cluster,也稱機(jī)群)系統(tǒng)就是一種常見的多計(jì)算機(jī)系統(tǒng)。集群系統(tǒng)是由一組完整的計(jì)算機(jī)通過高性能的網(wǎng)絡(luò)或局域網(wǎng)互連而成的系統(tǒng),這組計(jì)算機(jī)作為統(tǒng)一的計(jì)算機(jī)資源一起工作,并能產(chǎn)生一臺機(jī)器的印象。術(shù)語“完整計(jì)算機(jī)”意指一臺計(jì)算機(jī)離開集群系統(tǒng)仍能運(yùn)行自己的任務(wù)。集群系統(tǒng)中的每臺計(jì)算機(jī)一般稱為節(jié)點(diǎn)。多處理器系統(tǒng)也遵循時(shí)間重疊、資源重復(fù)、資源共享原理,向不同體系結(jié)構(gòu)的多處理器方向發(fā)展。但在采取的技術(shù)措施上與單處理器系統(tǒng)有些差別。為了反映多處理器系統(tǒng)各機(jī)器之間物理連接的緊密程度與交互作用能力的強(qiáng)弱,通常使用耦合度這一術(shù)語。多處理器系統(tǒng)可以根據(jù)耦合度分為緊耦合系統(tǒng)和松耦合系統(tǒng)兩大類。緊耦合系統(tǒng)又稱為直接耦合系統(tǒng),指處理器之間物理連接的頻帶較高,一般通過總線或高速開關(guān)實(shí)現(xiàn)互連,可以共享主存。由于具有較高的信息傳輸率,因而可以快速并行處理作業(yè)或任務(wù)。松耦合系統(tǒng)又稱為間接耦合系統(tǒng),一般是通過通道或通信線路實(shí)現(xiàn)處理器之間的互連,可以共享外存設(shè)備(磁盤、磁帶等),機(jī)器之間的相互作用是在文件或數(shù)據(jù)集一級上進(jìn)行的。松耦合系統(tǒng)表現(xiàn)為兩種形式:一種是多臺計(jì)算機(jī)和共享的外存設(shè)備連接,不同機(jī)器之間實(shí)現(xiàn)功能上的分工,機(jī)器處理的結(jié)果以文件或數(shù)據(jù)集的形式送到共享外存設(shè)備,供其他機(jī)器繼續(xù)處理;另一種是計(jì)算機(jī)網(wǎng),機(jī)器通過通信線路連接,以求得更大范圍的資源共享。3.多線程處理器除了用多臺計(jì)算機(jī)完成任務(wù)級并行之外,處理器廠商還設(shè)計(jì)了許多處理器片內(nèi)并行技術(shù),以應(yīng)對通過簡單提高處理器主頻的方法提升單處理器的性能的傳統(tǒng)方法受到的制約。除了傳統(tǒng)的指令級并行技術(shù)之外,多線程技術(shù)和多核技術(shù)也是提高單芯片處理能力的片內(nèi)并行技術(shù)。由于現(xiàn)代處理器廣泛采用指令流水線,因而處理器必須面對一個(gè)固有的問題:如果處理器訪存時(shí)Cache(高速緩沖存儲器)缺失(Miss,不命中),則必須訪問主存,這會(huì)導(dǎo)致執(zhí)行部件長時(shí)間的等待,直到相關(guān)的Cache塊被加載到Cache中。解決指令流水線必須暫停的一種方法就是片上多線程(On-chipMulti-threading)技術(shù)。在處理器設(shè)計(jì)中引入硬件多線程(HardwareMulti-threading)的概念,其原理與操作系統(tǒng)中的軟件多線程并行技術(shù)相似。硬件多線程用來描述一個(gè)獨(dú)立的指令流,而多個(gè)指令流能共享同一個(gè)支持多線程的處理器。當(dāng)一個(gè)指令流因故暫時(shí)不能執(zhí)行時(shí),可以轉(zhuǎn)向執(zhí)行另一個(gè)線程的指令流。由于各個(gè)線程相互獨(dú)立,從而大大降低了因單線程指令流中各條指令之間的相互依賴導(dǎo)致的指令流水線沖突現(xiàn)象,有效提高處理器執(zhí)行單元的利用率。因此,并行的概念就從指令級并行擴(kuò)展至線程級并行(Thread-LevelParallelism)。多線程處理器通常為每個(gè)硬件線程維護(hù)獨(dú)立的程序計(jì)數(shù)器和數(shù)據(jù)寄存器。處理器硬件能夠快速實(shí)現(xiàn)線程間的切換。由于多個(gè)相互獨(dú)立的線程共享執(zhí)行單元的處理器時(shí)間,并且能夠進(jìn)行快速的線程切換,因而多線程處理器能夠有效地減少垂直浪費(fèi)情況,從而利用線程級并行來提高處理器資源的利用率。為了最大限度地利用處理器資源,同時(shí)多線程(SimultaneousMulti-Threading,SMT)技術(shù)被引入現(xiàn)代處理器中。同時(shí)多線程技術(shù)結(jié)合了超標(biāo)量技術(shù)和細(xì)粒度多線程技術(shù)的優(yōu)點(diǎn),允許在一個(gè)時(shí)鐘周期內(nèi)發(fā)送來自不同線程的多條指令,因而可以同時(shí)減少水平浪費(fèi)和垂直浪費(fèi)。設(shè)想一個(gè)支持兩個(gè)線程的同時(shí)多線程處理器。在一個(gè)時(shí)鐘周期內(nèi),處理器可以執(zhí)行來自不同線程的多條指令。當(dāng)其中某個(gè)線程由于長延遲操作或資源沖突而沒有指令可以執(zhí)行時(shí),另一個(gè)線程甚至能夠使用所有的指令發(fā)送時(shí)間。因此,同時(shí)多線程技術(shù)既能夠利用線程級并行減少垂直浪費(fèi),又能夠在一個(gè)時(shí)鐘周期內(nèi)同時(shí)利用線程級并行和指令級并行來減少水平浪費(fèi),從而大大提高處理器的整體性能。同時(shí)多線程技術(shù)是一種簡單、低成本的并行技術(shù)。與單線程處理器相比,同時(shí)多線程處理器只花費(fèi)很小的代價(jià),而性能得到很大改善。在原有的單線程處理器內(nèi)部為多個(gè)線程提供各自的程序計(jì)數(shù)器、相關(guān)寄存器以及其他運(yùn)行狀態(tài)信息,一個(gè)“物理”處理器被模擬成多個(gè)“邏輯”處理器,以便多個(gè)線程同步執(zhí)行并共享處理器的執(zhí)行資源。應(yīng)用程序無須做任何修改就可以使用多個(gè)邏輯處理器。由于多個(gè)邏輯處理器共享處理器內(nèi)核的執(zhí)行單元、高速緩存和系統(tǒng)總線接口等資源,因而在實(shí)現(xiàn)多線程時(shí)多個(gè)邏輯處理器需要交替工作。如果多個(gè)線程同時(shí)需要某一個(gè)共享資源,則只有一個(gè)線程能夠使用該資源,其他線程要暫停并等待資源空閑時(shí)才能繼續(xù)執(zhí)行。因此,同時(shí)多線程技術(shù)就性能提升而言遠(yuǎn)不能等同于多個(gè)相同時(shí)鐘頻率處理器內(nèi)核組合而成的多核處理器,但從性價(jià)比的角度看,同時(shí)多線程技術(shù)是一種對單線程處理器執(zhí)行資源的有效而經(jīng)濟(jì)的優(yōu)化手段。為了實(shí)現(xiàn)同時(shí)多線程,處理器需要解決一系列問題。例如,處理器內(nèi)需要設(shè)置大量寄存器保存每個(gè)線程的現(xiàn)場信息,需要保證由于并發(fā)執(zhí)行多個(gè)線程帶來的Cache沖突不會(huì)導(dǎo)致顯著的性能下降,確保線程切換的開銷盡可能小。在英特爾系列處理器產(chǎn)品中采用的超線程(HyperThreading,HT)技術(shù)就是同時(shí)多線程技術(shù)的具體實(shí)現(xiàn)。英特爾公司的至強(qiáng)處理器等產(chǎn)品就使用了超線程技術(shù)。多線程技術(shù)只對傳統(tǒng)的單線程超標(biāo)量處理器結(jié)構(gòu)做了很少改動(dòng),但卻獲得很大的性能提升。啟用超線程技術(shù)的內(nèi)核比禁用超線程技術(shù)的內(nèi)核吞吐率要高出30%左右。當(dāng)然,超線程技術(shù)需要解決一系列復(fù)雜的技術(shù)問題。例如,作業(yè)調(diào)度策略、取指和發(fā)送策略、寄存器回收機(jī)制、存儲系統(tǒng)層次設(shè)計(jì)等比單線程處理器復(fù)雜許多。4.多核處理器(片上多處理器)在傳統(tǒng)的多處理器結(jié)構(gòu)中,分布于不同芯片上的多個(gè)處理器通過片外系統(tǒng)總線連接,因此需要占用更大的芯片尺寸,消耗更多的熱量,并需要額外的軟件支持。多個(gè)處理器可以分布于不同的主板上,也可以構(gòu)建在同一塊電路板上,處理器之間通過高速通信接口連接;而多核(Multi-Core)技術(shù)則是多處理器結(jié)構(gòu)的升級版本。多線程技術(shù)能夠屏蔽線程的存儲器訪問延遲,增加系統(tǒng)吞吐率,但并未提高單個(gè)單線程的執(zhí)行速度;而多核技術(shù)通過開發(fā)程序內(nèi)的線程級或進(jìn)程級并行性提高性能。多核處理器是指在一顆處理器芯片內(nèi)集成兩個(gè)或兩個(gè)以上完整且并行工作的計(jì)算引擎(核),也稱為片上多處理器(ChipMulti-Processor,CMP)。核(Core,又稱內(nèi)核或核心)通常是指包含指令部件、算術(shù)/邏輯運(yùn)算部件、寄存器堆和一級或兩級Cache的處理單元,這些核通過某種方式互連后,能夠相互交換數(shù)據(jù),對外呈現(xiàn)為一個(gè)統(tǒng)一的多核處理器。多核技術(shù)的興起一方面是由于單核技術(shù)面臨繼續(xù)發(fā)展的瓶頸,另一方面也是由于大規(guī)模集成電路技術(shù)的發(fā)展使單芯片容量增長到足夠大,能夠把原來大規(guī)模并行處理器結(jié)構(gòu)中的多處理器和多計(jì)算機(jī)節(jié)點(diǎn)集成到同一芯片內(nèi),讓各個(gè)處理器內(nèi)核實(shí)現(xiàn)片內(nèi)并行運(yùn)行。因此,多核處理器是一種特殊的多處理器架構(gòu)。所有的處理器都在同一塊芯片上,不同的核執(zhí)行不同的線程,在內(nèi)存的不同部分操作。多核也是一個(gè)共享內(nèi)存的多處理器:所有的核共享同一個(gè)內(nèi)存空間。多個(gè)核在一個(gè)芯片內(nèi)直接連接,多線程和多進(jìn)程可以并行運(yùn)行。對于現(xiàn)代服務(wù)器處理器而言,多核是必不可少的架構(gòu)。與傳統(tǒng)的單核技術(shù)相比,多核技術(shù)是應(yīng)對芯片物理規(guī)律限制的相對簡單的辦法。與早期通過簡單提高處理器主頻提升計(jì)算性能的方式相比,在一個(gè)芯片內(nèi)集成多個(gè)相對簡單而主頻稍低的處理器內(nèi)核既可以充分利用摩爾定律帶來的芯片面積提升,又可以更容易地解決功耗、芯片內(nèi)部互連延遲和設(shè)計(jì)復(fù)雜度等問題。多核處理器由于在一個(gè)芯片內(nèi)集成多個(gè)核心,核間耦合度高,核間互連延遲更小,功耗更低,故可以在任務(wù)級、線程級和指令級等多個(gè)層次充分提升程序的并行性,靈活度高。為了滿足人類社會(huì)對計(jì)算性能的無止境需求,處理器內(nèi)部的核心數(shù)量不斷增加。當(dāng)處理器內(nèi)的核心的數(shù)量超過32個(gè)時(shí),一般稱為眾核(Many-Core)處理器。2012年,英特爾公司發(fā)布了基于英特爾集成眾核(ManyIntegratedCore,MIC)架構(gòu)的至強(qiáng)融核(XeonPhi)產(chǎn)品。而當(dāng)前各個(gè)廠商推出的ARM架構(gòu)多核服務(wù)器處理器的核心數(shù)普遍超過32個(gè),都屬于眾核架構(gòu)。5.同構(gòu)多核處理器與異構(gòu)多核處理器按多核處理器內(nèi)的計(jì)算內(nèi)核的地位對等與否劃分,多核處理器可以分為同構(gòu)多核處理器和異構(gòu)多核處理器兩種類型。同構(gòu)多核(HomogenousMulti-Core)處理器內(nèi)的所有計(jì)算核心結(jié)構(gòu)相同,地位對等。同構(gòu)多核處理器大多由通用的處理器內(nèi)核構(gòu)成,每個(gè)處理器內(nèi)核可以獨(dú)立地執(zhí)行任務(wù),其結(jié)構(gòu)與通用單核處理器結(jié)構(gòu)相近。同構(gòu)多核處理器的各個(gè)核心之間可以通過共享總線Cache結(jié)構(gòu)互連,也可以通過交叉開關(guān)結(jié)構(gòu)互連和片上網(wǎng)絡(luò)結(jié)構(gòu)互連。同構(gòu)多核結(jié)構(gòu)原理簡單,硬件實(shí)現(xiàn)復(fù)雜度低,因而個(gè)人計(jì)算機(jī)和服務(wù)器等通用計(jì)算機(jī)上的多核處理器通常主要采用同構(gòu)多核結(jié)構(gòu)。但在實(shí)際的應(yīng)用場景中,并不總是能夠把計(jì)算任務(wù)均勻分配到同構(gòu)的多個(gè)核心上,多核處理器必須面對如何平衡若干處理器的負(fù)載并進(jìn)行任務(wù)協(xié)調(diào)等難題。即使能夠不斷增加同類型的處理器內(nèi)核的數(shù)量以加強(qiáng)并行處理能力,整個(gè)系統(tǒng)的處理性能仍然會(huì)受到軟件中必須串行執(zhí)行的代碼的制約。異構(gòu)多核(HeterogeneousMulti-Core)處理器則通過配置不同特點(diǎn)的核心來優(yōu)化處理器內(nèi)部結(jié)構(gòu),實(shí)現(xiàn)處理器性能的最佳化,并能有效地降低系統(tǒng)功耗。異構(gòu)多核處理器內(nèi)的各個(gè)計(jì)算內(nèi)核結(jié)構(gòu)不同,地位不對等。異構(gòu)多核處理器根據(jù)不同的應(yīng)用需求配置不同的處理器內(nèi)核,一般多采用“主處理核+協(xié)處理核”的主從架構(gòu)。采用異構(gòu)多核處理器方式的好處是可以同時(shí)發(fā)揮不同類型的處理器各自的優(yōu)勢來滿足不同種類的應(yīng)用的性能和功耗需求。異構(gòu)多核處理器將結(jié)構(gòu)、功能、功耗、運(yùn)算性能各不相同的多個(gè)核心集成在芯片上,并通過任務(wù)分工和劃分將不同的任務(wù)分配給不同的核心,讓每個(gè)核心處理自己擅長的任務(wù)。異構(gòu)多核架構(gòu)的一個(gè)典型實(shí)例就是在通用計(jì)算機(jī)上將通用GPU與通用CPU集成在一顆芯片上構(gòu)成的異構(gòu)多核處理器。在這樣的架構(gòu)下,系統(tǒng)中必須串行執(zhí)行的代碼能在一個(gè)強(qiáng)大的CPU核上加速,而可以并行的部分則通過很多很小的GPU核來提速。除了通用處理器外,目前的異構(gòu)多核處理器還可以集成DSP(DigitalSignalProcessor,數(shù)字信號處理器)、FPGA以及媒體處理器、網(wǎng)絡(luò)處理器、人工智能處理器等多種類型的處理器內(nèi)核,并針對不同需求配置應(yīng)用其計(jì)算性能。其中,通用處理器內(nèi)核常作為處理器控制主核,并用于通用計(jì)算;而其他處理器內(nèi)核則作為從核用于加速特定的應(yīng)用。例如,多核異構(gòu)網(wǎng)絡(luò)處理器配有負(fù)責(zé)管理調(diào)度的主核和負(fù)責(zé)網(wǎng)絡(luò)處理功能的從核,經(jīng)常用于科學(xué)計(jì)算的異構(gòu)多核處理器在主核之外可以配置用于定點(diǎn)運(yùn)算和浮點(diǎn)運(yùn)算等計(jì)算功能的專用核心。研究表明,異構(gòu)組織方式比同構(gòu)的多核處理器執(zhí)行任務(wù)更有效率,實(shí)現(xiàn)了資源的最佳化配置,而且降低了系統(tǒng)的整體功耗。但異構(gòu)多核結(jié)構(gòu)也存在著一些難點(diǎn),如選擇哪幾種不同的核相互搭配,核間任務(wù)如何分工,如何實(shí)現(xiàn)良好的可擴(kuò)展性等,必須在性能、成本、功耗等方面仔細(xì)平衡,并通過軟硬件相互配合使任務(wù)的并行性最大化。6.多核處理器的對稱性同構(gòu)多核和異構(gòu)多核處理器是對處理器內(nèi)核硬件結(jié)構(gòu)和地位是否一致的劃分。如果再考慮各個(gè)核之上的操作系統(tǒng),從用戶的角度看,可以把多核處理器的運(yùn)行模式劃分為對稱多處理(SymmetricMulti-Processing,SMP)和非對稱多處理(AsymmetricMulti-Processing,AMP)兩種不同類型。多核處理器中的對稱多處理結(jié)構(gòu)是指處理器片內(nèi)包含相同結(jié)構(gòu)的核,多個(gè)核緊密耦合并運(yùn)行一個(gè)統(tǒng)一的操作系統(tǒng)。每個(gè)核的地位是對等的,共同處理操作系統(tǒng)的所有任務(wù)。對稱多處理結(jié)構(gòu)由多個(gè)同構(gòu)的處理器內(nèi)核和共享存儲器構(gòu)成,由一個(gè)操作系統(tǒng)的實(shí)例同時(shí)管理所有處理器內(nèi)核,并將應(yīng)用程序分配至各個(gè)核上運(yùn)行。對稱多處理結(jié)構(gòu)下的集群中的每個(gè)處理器內(nèi)核地位相同,存儲器和共享硬件也都是相同的。而每個(gè)處理器內(nèi)核的角色都是動(dòng)態(tài)確定的,任何應(yīng)用程序、進(jìn)程或任務(wù)都可以運(yùn)行在任意處理器內(nèi)核之上。只要有一個(gè)內(nèi)核空閑可用,操作系統(tǒng)就可以在線程等待隊(duì)列中分配下一個(gè)線程給這個(gè)空閑內(nèi)核來運(yùn)行。操作系統(tǒng)的調(diào)度程序也可以在處理器內(nèi)核之間遷移任務(wù),以便平衡系統(tǒng)負(fù)載。應(yīng)用程序本身可以不關(guān)心有多少個(gè)核在運(yùn)行,由操作系統(tǒng)自動(dòng)協(xié)調(diào)運(yùn)行,并管理共享資源。同構(gòu)多核處理器也可以構(gòu)成非對稱多處理結(jié)構(gòu)。若處理器芯片內(nèi)部是同構(gòu)多核,但每個(gè)核運(yùn)行一個(gè)獨(dú)立的操作系統(tǒng)或同一操作系統(tǒng)的獨(dú)立實(shí)例,那就變成非對稱多核。非對稱多處理結(jié)構(gòu)的多核系統(tǒng)也可以采用異構(gòu)多核和共享存儲器構(gòu)成。1.2.2英特爾處理器體系結(jié)構(gòu)當(dāng)前,在通用處理器領(lǐng)域廣泛使用的最普遍的一種處理器就是兼容英特爾公司x86指令集的IA-32(IntelArchitecture32,英特爾32位體系結(jié)構(gòu))及其后繼64位兼容版本的處理器。無論是在個(gè)人計(jì)算機(jī)市場還是在服務(wù)器市場,由英特爾公司和AMD公司等少數(shù)處理器廠商生產(chǎn)的x86/x86-64(x64)處理器產(chǎn)品都有廣泛的應(yīng)用。1.IA-32處理器及其發(fā)展IA-32處理器最早應(yīng)用于桌面?zhèn)€人計(jì)算機(jī)。幾十年來,基于英特爾公司IA-32處理器的通用計(jì)算機(jī)系統(tǒng)一直是最常見的、應(yīng)用最廣的計(jì)算機(jī)系統(tǒng)之一。英特爾公司1978年推出16位的Intel8086和準(zhǔn)16位的Intel8088微處理器,這是個(gè)人計(jì)算機(jī)發(fā)展歷史上的一個(gè)重要事件。當(dāng)時(shí)的處理器芯片含有上萬只晶體管,處理器每次只執(zhí)行一條指令,并沒有采用流水技術(shù)。而1985年推出的Intel386處理器則是IA-32處理器家族中的第一款32位微處理器。此時(shí)處理器芯片上的晶體管數(shù)已增加到數(shù)十萬只,流水技術(shù)被引入微處理器中。1995年英特爾公司發(fā)布了專門針對服務(wù)器和工作站應(yīng)用領(lǐng)域的32位高能奔騰(PentiumPro)處理器,可以應(yīng)用在高速計(jì)算機(jī)輔助設(shè)計(jì)和科學(xué)計(jì)算等領(lǐng)域,英特爾架構(gòu)開始成為服務(wù)器處理器的選項(xiàng)之一。由于所有的基于IA-32的微處理器都需要保持與x86指令系統(tǒng)的兼容,因而從整體上看,IA-32仍是基于CISC架構(gòu)的處理器。但RISC處理器的性能優(yōu)勢非常明顯,因而從1993年推出奔騰(Pentium)處理器開始,RISC處理器的設(shè)計(jì)思想逐漸被引入新的IA-32中。奔騰處理器開始采用超標(biāo)量流水技術(shù),允許兩條指令同時(shí)執(zhí)行。從高能奔騰處理器開始,英特爾甚至將處理器體系結(jié)構(gòu)設(shè)計(jì)成CISC外殼加RISC內(nèi)核的結(jié)構(gòu),CISC指令在執(zhí)行時(shí)被翻譯成一條或多條RISC指令執(zhí)行,從而有效提高了系統(tǒng)性能。計(jì)算機(jī)的應(yīng)用領(lǐng)域越來越廣,而對處理器計(jì)算能力的需求仍在不斷提高,在服務(wù)器等高性能計(jì)算機(jī)市場上尤其如此。隨著電子技術(shù)的飛速發(fā)展和處理器體系結(jié)構(gòu)的演變,處理器字長也在不斷增加。從20世紀(jì)70年代末到90年代中期,16位計(jì)算大行其道;1995年以后的十年則是從16位計(jì)算到32位計(jì)算的過渡階段;而當(dāng)前的通用處理器無論是在個(gè)人計(jì)算機(jī)市場還是高性能工作站和服務(wù)器市場上,64位計(jì)算的應(yīng)用都是主流。為了進(jìn)一步提升處理器的總體性能,越來越多的處理器通過提高并行性來加快指令的執(zhí)行速度。傳統(tǒng)的IA-32微處理器架構(gòu)存在一些基本的性能限制,而64位計(jì)算不僅僅是擴(kuò)展運(yùn)算器字長,更主要的是體系結(jié)構(gòu)的改進(jìn)和提高。直觀地看,64位字長至少可以帶來兩點(diǎn)好處:一是參加整數(shù)運(yùn)算的操作數(shù)的范圍擴(kuò)大了,二是計(jì)算機(jī)系統(tǒng)的尋址空間大大擴(kuò)展。16位的Intel8086處理器最多只能訪問1兆字節(jié)的物理內(nèi)存空間,32位的80386處理器則支持4吉字節(jié)的物理內(nèi)存。而64位系統(tǒng)以太字節(jié)計(jì)算的內(nèi)存尋址空間容量使其在未來很長一段時(shí)間內(nèi)都能夠滿足高速互聯(lián)網(wǎng)和多媒體等高端應(yīng)用環(huán)境對內(nèi)存尋址的需求。伴隨著處理器字長增長的不僅僅是內(nèi)存尋址空間,而是包括計(jì)算性能、體系結(jié)構(gòu)和應(yīng)用模式在內(nèi)的完整改變。2.安騰架構(gòu)與Intel64架構(gòu)早在1994年,英特爾公司和惠普(HP)公司即開始合作,為服務(wù)器和工作站市場共同開發(fā)全新的基于64位處理器體系結(jié)構(gòu)IA-64(IntelArchitecture64)的處理器。這一體系結(jié)構(gòu)吸取了英特爾數(shù)十年x86處理器設(shè)計(jì)的經(jīng)驗(yàn),又結(jié)合了惠普在64位PA-RISC處理器上積累的技術(shù)成果。2001年5月,基于顯式并行指令計(jì)算(EPIC)技術(shù)的第一代處理器上市,標(biāo)志著IA-64體系結(jié)構(gòu)進(jìn)入實(shí)用化階段。此后的幾年時(shí)間里,IA-64體系結(jié)構(gòu)的處理器不斷推陳出新,性能不斷提高,英特爾將這些處理器統(tǒng)稱為安騰處理器家族(ItaniumProcessorFamily,IPF)。2005年9月,英特爾聯(lián)合惠普、富士通、日立、NEC、SGI、SAP、微軟與優(yōu)利公司在內(nèi)的業(yè)界領(lǐng)導(dǎo)廠商成立了一個(gè)推動(dòng)安騰發(fā)展的全球性組織———安騰解決方案聯(lián)盟(ItaniumSolutionsAlliance,ISA),以圖加速安騰處理器在64位服務(wù)器計(jì)算平臺上的推廣?;贓PIC技術(shù)的IA-64以實(shí)現(xiàn)持續(xù)高性能為設(shè)計(jì)目標(biāo)。為此,英特爾并不是簡單地把x86架構(gòu)由32位擴(kuò)展到64位,而是設(shè)計(jì)了全新的架構(gòu),甚至在IA-64中放棄了與IA-32指令系統(tǒng)的兼容性。IA-64處理器結(jié)合了RISC處理器和VLIW技術(shù)的優(yōu)勢,顯著提高了微處理器的性能。但是,市場上數(shù)十年積累下來的基于IA-32指令系統(tǒng)的x86體系結(jié)構(gòu)的計(jì)算機(jī)系統(tǒng)仍然在運(yùn)行,眾多的用戶和應(yīng)用軟件無法直接從IA-32平滑過渡到不兼容的IA-64。新的體系結(jié)構(gòu)是否保留對舊體系結(jié)構(gòu)的兼容性,這對處理器制造商、眾多的計(jì)算機(jī)用戶和軟硬件外圍廠商而言都是一個(gè)兩難的選擇:繼續(xù)保持兼容性意味著新的處理器必須背負(fù)一個(gè)沉重的包袱,將嚴(yán)重制約處理器性能的提高;但放棄兼容性會(huì)讓新產(chǎn)品與舊有的體系結(jié)構(gòu)完全決裂,廠商和用戶原有的投資無法得到保護(hù)。面對市場的壓力,英特爾也曾左右搖擺。由于IA-32的廣泛應(yīng)用,眾多基于x86指令集的軟件仍然需要繼續(xù)使用,而新設(shè)計(jì)的指令系統(tǒng)無法直接兼容低效率的IA-32指令系統(tǒng)。為了讓IA-64處理器能夠支持兩種體系結(jié)構(gòu)的軟件,英特爾在IA-64架構(gòu)中引入了32位兼容模式,在執(zhí)行32位代碼時(shí)通過x86-to-IA-64解碼器把IA-32的二進(jìn)制代碼翻譯為IA-64指令,以便在IA-64處理器上仿真運(yùn)行。但這個(gè)解碼器的效率并不高,因此安騰處理器在運(yùn)行x86應(yīng)用程序時(shí)的性能非常糟糕。2004年,英特爾推出了名為IA-32EL(IA-32ExecutionLayer,IA-32執(zhí)行層)的仿真軟件,用于在IA-64架構(gòu)的計(jì)算機(jī)上執(zhí)行IA-32應(yīng)用程序,而新的安騰處理器中將不再包含支持x86的硬件電路。英特爾將安騰處理器定位在高端服務(wù)器市場,期望缺少對現(xiàn)有的x86體系結(jié)構(gòu)的直接支持也不會(huì)對安騰處理器造成非常大的影響。但是,中低端的個(gè)人和中小企業(yè)市場則必須保持與x86體系結(jié)構(gòu)的直接兼容。為此,英特爾將原有的IA-32擴(kuò)展至64位,稱為EM64T(64位內(nèi)存擴(kuò)展技術(shù))或IA-32e,并保持與IA-32的完全兼容。2006年,英特爾將EM64T更名為Intel64(英特爾64)。而IA-64則被稱為安騰體系結(jié)構(gòu)。因此,英特爾公司目前支持兩種不同的64位處理器體系結(jié)構(gòu):英特爾64體系結(jié)構(gòu)和安騰體系結(jié)構(gòu)。在英特爾公司當(dāng)時(shí)的處理器路線圖中,這兩種64位的體系結(jié)構(gòu)曾經(jīng)各有其側(cè)重的應(yīng)用領(lǐng)域:安騰體系結(jié)構(gòu)用于數(shù)據(jù)密集的商業(yè)應(yīng)用,以保證性能、可用性、可伸縮性和安全性為首要目標(biāo),主要市場為大型多處理器服務(wù)器平臺;而英特爾64體系結(jié)構(gòu)則適用于中小型企業(yè)主流應(yīng)用基礎(chǔ)架構(gòu)和多服務(wù)器分布式計(jì)算環(huán)境,能夠保持與32位應(yīng)用的兼容性,并支持從32位到64位計(jì)算的平滑過渡。從英特爾最早將其安騰體系結(jié)構(gòu)命名為IA-64可以看出,英特爾當(dāng)初是期望安騰作為IA-32架構(gòu)的后繼者承擔(dān)64位計(jì)算大任的。安騰處理器集成了支持并行計(jì)算的諸多先進(jìn)特性,引入了EPIC技術(shù)、VLIW技術(shù)、分支推斷(Predication)技術(shù)、推測(Speculation)技術(shù)、軟件流水技術(shù)和寄存器堆棧技術(shù)等,并且完全放棄了既有的CISC架構(gòu)而轉(zhuǎn)向RISC架構(gòu)。應(yīng)當(dāng)說,安騰架構(gòu)在技術(shù)上是有不少創(chuàng)新的,但是也存在過度依賴編譯器、技術(shù)復(fù)雜度過高以及處理器與其他部件不匹配等問題,導(dǎo)致其性能并沒有預(yù)期的高。而最重要的是,安騰處理器既無法利用原有的IA-32生態(tài)環(huán)境,也無法吸引眾多軟硬件廠商轉(zhuǎn)向該架構(gòu)而構(gòu)建新的生態(tài)環(huán)境。2017年,英特爾發(fā)布了最后一代安騰處理器:安騰9700系列處理器。2019年1月,安騰系列處理器開始進(jìn)入壽命終結(jié)(End-Of-Life,EOL)周期,并將于2021年7月終止出貨。在經(jīng)過二十年的市場打磨之后,安騰體系結(jié)構(gòu)即將終結(jié),基于EPIC架構(gòu)的服務(wù)器處理器也將完成其歷史使命,英特爾公司的處理器架構(gòu)將回歸統(tǒng)一,也即通常所說的x86/IA-32/x86-64/Intel64兼容架構(gòu)。3.英特爾至強(qiáng)系列服務(wù)器處理器為了明確區(qū)分服務(wù)器處理器市場和個(gè)人計(jì)算機(jī)處理器市場,英特爾又引入了專門針對服務(wù)器市場的子品牌至強(qiáng)(Xeon)。1998年英特爾發(fā)布其全新研制的服務(wù)器處理器時(shí),使用奔騰Ⅱ至強(qiáng)(PentiumⅡXeo

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論