容錯技術(shù)與容錯服務(wù)器_第1頁
容錯技術(shù)與容錯服務(wù)器_第2頁
容錯技術(shù)與容錯服務(wù)器_第3頁
容錯技術(shù)與容錯服務(wù)器_第4頁
容錯技術(shù)與容錯服務(wù)器_第5頁
已閱讀5頁,還剩42頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

容錯技術(shù)與容錯服務(wù)器2內(nèi)容容錯技術(shù)與容錯服務(wù)器單機容錯VS.雙機熱備容錯帶給客戶的價值行業(yè)應(yīng)用3什么是容錯?容錯是什么?這就是容錯

我們不用擔心某一個部件的損壞會導(dǎo)致整個系統(tǒng)的失效系統(tǒng)能容忍任一部件的失效并繼續(xù)工作

計算機系統(tǒng)可靠性設(shè)計方案避錯設(shè)計技術(shù)>>

容錯設(shè)計技術(shù)4容錯技術(shù)的發(fā)展60‘70‘80‘90‘2000‘專有容錯系統(tǒng)軟件容錯系統(tǒng)硬件容錯系統(tǒng)單機雙機Cluster集群5世界上最可靠的服務(wù)器技術(shù)和解決方案

美國容錯技術(shù)有限公司

|StratusTechnologies1980--硬件級容錯計算機系統(tǒng)廠商Stratus成立(位于美國波士頓),主要投資者有Intel,NEC,Investcorp,MidOceanPartners1981--首先推出基于硬件的容錯計算機系統(tǒng)1986--建立世界上第一個提供24小時服務(wù)的遠程服務(wù)網(wǎng)1990—

推出世界上第一個容錯的UNIX操作系統(tǒng)-FTX1991--推出RISC結(jié)構(gòu)的XA/R系列容錯計算機系統(tǒng)1995--推出RISC結(jié)構(gòu)的Continuum系列容錯計算機系統(tǒng)1997--推出容錯的HP-UX操作系統(tǒng)2001--推出世界上第一臺WinNTX86平臺硬件容錯服務(wù)器ftServer2005--推出支持RedHatLinuxEnterprise的X86平臺硬件容錯服務(wù)器6技術(shù)合作伙伴基于OS可用性特征的合作內(nèi)存再同步強化驅(qū)動程序企業(yè)關(guān)鍵應(yīng)用的支持方式ftServer?W系列產(chǎn)品安置在Redmond測試實驗室共同決定處理器的使用程序(LockStep技術(shù))更早得到最新處理器ftServerW系列產(chǎn)品安置在Intel實驗室ftServerW系列產(chǎn)品安置在EMC認證實驗室

CLARiiON?產(chǎn)品的轉(zhuǎn)銷合作支持方式7容錯服務(wù)器的優(yōu)越性容錯服務(wù)器的優(yōu)越性

連續(xù)處理技術(shù)

操作簡單

價格優(yōu)勢8ContinuousProcessing?

Technology快速部署,簡化操作;

最高級別的在線運行時間保障連續(xù)運行的最佳方案——連續(xù)處理技術(shù)9Stratus連續(xù)處理?技術(shù)(一)10鎖步技術(shù)(時鐘同步技術(shù))零切換時間單軟件映象消除單點故障CPU

NwaySMPSNPASICMemoryChipsetTMRCPU

NwaySMPSNPASICMemoryChipsetCPU

NwaySMPSNPASICMemoryChipsetDMRLockstepCPUsDiskPCISSPASICPCISSPASICDisk11錯誤檢測和隔離嵌入式I/OPCI磁盤處理器芯片集內(nèi)存錯誤檢測和隔離錯誤檢測和隔離嵌入式I/OPCI磁盤處理器芯片集內(nèi)存錯誤檢測和隔離同步鎖定CPUs多路徑I/O模塊方式實現(xiàn)660012Stratus連續(xù)處理?技術(shù)(二)13Windows2003:Server,EnterpriseServer,DataCenterServerI/OSystemSecurityLocalVirtualProcessStructureObjectServicesFileServerObjectmanagement/executiveruntimeDeviceDrivers(Level1)Level2PlatformInterfaceI/ODevicesDMAControlBIOSCacheControlPrivilegedArchitectureHardwareAbstractionLayer(HAL)PCIConfig IOVA InterruptsKernelDaemons Services Applications ManagementFileServerSecuritySessionManagerReplicatorLogonAltererEventLoggerOtherSQLServerMSExchangeWebServerDiagnosticsRemoteConsoleServerManagementStratusValueAddDeviceDrivers(Level1)Level2BIOSHardwareAbstractionLayer(HAL)PCIConfig IOVA InterruptsDiagnosticsRemoteConsoleServerManagement

Stratus軟件增強透明性14故障安全軟件機制軟件屏蔽瞬間硬件錯誤強化驅(qū)動程序預(yù)防軟件故障廣泛綜合和錯誤插入測試軟件在線升級服務(wù)內(nèi)存和磁盤數(shù)據(jù)保護故障防范!!!軟件可靠性預(yù)防、診斷、和解決軟件問題15

Stratus連續(xù)處理?技術(shù)(三)16

ActiveService?

體系結(jié)構(gòu)自動的故障檢測和隔離(服務(wù)器的自身糾錯機制)集成的故障”回叫”和遠程支持

(StratusCAC)Stratus和第三方的合作支持系統(tǒng)非工作狀態(tài)的管理能力技術(shù)激活的服務(wù)方式在問題引發(fā)系統(tǒng)停頓前檢測和報告錯誤

故障防范管理訪問網(wǎng)絡(luò)ActiveService體系結(jié)構(gòu)17

ActiveService?

體系:自動獲得可用性熱插拔部件非常容易更換系統(tǒng)自動同步更換的部件系統(tǒng)正常處理貫穿整個更換過程!系統(tǒng)自動訂購正確的更換部件NextDayDeliveryService部件故障.系統(tǒng)隔離錯誤并通知Stratus有CPU故障18GuestOS問題分析處理一站式的技術(shù)支持CountonStratus&Hite19ActiveService?

體系:24x7關(guān)鍵性系統(tǒng)支持可用性動員全球性24x7電話支持準確的故障隔離,部件派發(fā)Stratus驅(qū)動OS問題解決Microsoft金牌認證合作伙伴100%可用性計劃WorldwideActiveService?Network20容錯服務(wù)器產(chǎn)品線ftServerEnter-SeriesWindows/Linux-basedsolutionftServerT-Series/L-SeriesTelco/EnterpriseLinuxSolutionftServerV-SeriesVOSUNIXsolutionContinuumVOSUNIX&HPUNIXsolution21最新推出的第五代容錯服務(wù)器采用最新架構(gòu)IntelXeonE5-2670V22.5GHz,25MBL2Cache處理器。服務(wù)器整體性能提升125%以上;邏輯內(nèi)存可擴展至512GB以上;內(nèi)置8對2.5”SAS磁盤,物理存儲容量可達8TB;集成遠程管理模塊,服務(wù)器的管理更加智能靈活…222710

Low-endsystem4710

Mid-tiersystem6410

High-endsystemProcessors1-socket12-socketCPUQPIPerformanceQuad-core2.10GHz

7.2GT/sQPIQuad-core2.50GHzGT/sQPIQuad-core2.50GHz8GT/sQPICPUCache15MBShared25MBShared25MBSharedMemoryBandwidth19.2GB/s51.1GB/s51.1GB/sMemorySlots6DIMMSlots10DIMMSlots10DIMMSlotsSystemMemory8GB8GB32GBEmbeddedSAS,2xENET(10/100/1000),3xUSB2.0(rear),1xUSB2.0(front),2xCOMM,VGA,BMC,DVDR(front)PCISlotsEmbedded2xPCIePCISlotExpansionNotAvailable2xPCIeGen2

OR2xPCI-X2xPCIeGen2OR2xPCI-XRAID1Disk(Internal)8x2.5”SASDisksFormFactor4URack4URack4URackNote:AllI/Ooptionsspecifiedinlogicalcount,physicalcountis2timesnumbersspecified23內(nèi)容容錯技術(shù)與容錯服務(wù)器單機容錯VS.雙機熱備容錯帶給客戶的價值行業(yè)應(yīng)用24MicrosoftState/windowsserver/en/library/dba487bf-61b9-45af-b927-e2333ec810b61033.mspx?mfr=true25委屈求全的“容錯”方案--ClusterHA方案,HighAvailability但這并不是真正意義上的容錯?。。?6集群是如何工作的DataDisk(Mirror)OSSCSIENETSMMMPU,MemoryServer-PrimaryClusterAppMiddlewareApplicationOSSCSIENETSMMMPU,MemoryServer-StandbyClusterAppMiddlewareApplicationStorageEnclosureHeart-BeatCheckingWorkstation2Workstation3123Workstation127系統(tǒng)架構(gòu)對比Stratus

ftServer(SingleSystem)System&DataDisk(Mirror)SCSISCSIStorageEnclosureENETENETSMMSMMMPU,MemoryMPU,MemoryOSMiddlewareApplicationDataDisk(Mirror)StorageEnclosureCluster(MulitpleSystems)OSSCSIENETSMMMPU,MemoryServer-PrimaryClusterAppMiddlewareApplicationOSSCSIENETSMMMPU,MemoryServer-StandbyClusterAppMiddlewareApplication28拓撲結(jié)構(gòu)比較心跳線系統(tǒng)結(jié)構(gòu)復(fù)雜環(huán)節(jié)過多,外部連接故障發(fā)生點多無單點故障的集群方案無單點故障的容錯方案系統(tǒng)結(jié)構(gòu)簡單如同單機,內(nèi)部連接故障發(fā)生點少29工作原理比較—容錯PassiveBackplaneSSPSSPSNPSNPI/OI/OCPUCPU1+1=?1+1=?MEMMEM22DiskDisk所有運算在不同板上同時進行I/O板CPU/MEM板30當CPU主板出現(xiàn)問題時…….PassiveBackplaneSSPSNPI/OI/OCPUCPU1+1=?1+1=?MEMXDiskDiskSNPSSP2MEM2任何一塊CPU板上的任何部件損壞,都不會影響系統(tǒng)的正常運行。正在進行的運算和操作會象沒發(fā)生問題一樣繼續(xù)下去。31如果I/O板再出現(xiàn)問題呢?PassiveBackplaneSSPSNPI/OI/OCPU1+1=?DiskDiskSSP2MEM2X任何一塊I/O板上的任何部件損壞,也不會影響系統(tǒng)的正常運行。正在進行的運算和操作同樣象沒發(fā)生問題一樣繼續(xù)下去。I/O板CPU/MEM板32工作原理比較---集群I/OCPU1+1=?MEM2I/OCPU1+1=?MEM2Disk0100010110100010101010111010111010010110001100011101X1+2=3CPU、內(nèi)存和等待I/O的所有數(shù)據(jù)丟失,數(shù)據(jù)庫、應(yīng)用、文件系統(tǒng)都沒有被安全關(guān)閉需要時間等待備機檢測到故障發(fā)生需要時間和運氣進行磁盤組切換、需要時間和運氣進行文件系統(tǒng)檢查需要時間重新啟動應(yīng)用程序,需要重新進行一些運算以回到斷點需要時間和運氣重新啟動數(shù)據(jù)庫并進行數(shù)據(jù)庫修復(fù)工作最重要的是:切換并不一定總是成功!??!系統(tǒng)A系統(tǒng)B33集群和容錯方案硬軟件工作原理比較通用HA容錯CA交易丟失選擇新平臺業(yè)務(wù)延滯故障出現(xiàn)故障恢復(fù)數(shù)據(jù)丟失,后期會花費大量的力量來找回

恢復(fù)總時間= 基本系統(tǒng)恢復(fù)時間

+數(shù)據(jù)庫恢復(fù)時間

+應(yīng)用程序恢復(fù)時間

+網(wǎng)絡(luò)恢復(fù)時間34計算機業(yè)界對可靠性的定義方案可靠性99.999%99.99%99.9%99%容錯服務(wù)器獨立服務(wù)器使用外部磁陣的獨立服務(wù)器簡易的集群系統(tǒng)消除單點故障的集群系統(tǒng)大型主機35每年的停機成本.08764.388.76Hoursunavailable$25,000perhour$10,000perhour$5,000perhourComputingEnvironment$900.00$43,800.00$87,600.00$400.00$22,900.00$43,800.00$219,000.0024x799.9%$2,200.0099.999%$109,500.0099.95%Costofdowntimewillvarybyapplication.0087699.9999%$44.00$88.00$219.00Downtimemeans$$$$........36$$$$$Windows2003x22套主機系統(tǒng)集群部件以及存儲陣列應(yīng)用程序和中間件

x2系統(tǒng)維護以及停機損失應(yīng)用程序和中間件x1集群軟件集群規(guī)劃實施費用-集群設(shè)計-集群測試驗證-應(yīng)用程序設(shè)置簡單的單機管理Win2003x1RapidDiskResync用戶成本比較容錯ftServerTCO比較一套ftServerCluster集群372003美國供電中斷

是由于集群切換方案的失敗區(qū)域供電中斷13分鐘38當我們有徹底避免災(zāi)難的方案時

為什么還要選擇災(zāi)難恢復(fù)方案呢災(zāi)難恢復(fù)集群方案災(zāi)難預(yù)防容錯方案“Whychooseaserverdesignedtorecoverfromafailure,ratherthanaserverdesignednottofail?”

VernonTurner,IDC39內(nèi)容容錯技術(shù)與容錯服務(wù)器單機容錯VS.雙機熱備容錯帶給客戶的價值行業(yè)應(yīng)用40容錯為客戶帶來價值Stratus向客戶提供解決方案:具有連續(xù)可用性能力

-擁有無可比擬的優(yōu)勢

(99.9998+%uptime)操作簡便性-

提供具有顯著的操作簡便性財務(wù)優(yōu)勢-

產(chǎn)品和解決方案(最小的TCO)41容錯服務(wù)器的優(yōu)勢1.可用性:99.99987%vs99.95%2.故障恢復(fù)時間3.動態(tài)數(shù)據(jù)一致性4.應(yīng)用透明性5.生命周期及風險6.可維護性42內(nèi)容容錯技術(shù)與容錯服務(wù)器單機硬件容錯VS.雙機熱備容錯帶給客戶的價值行業(yè)應(yīng)用43工業(yè)控制系統(tǒng)的應(yīng)用ftServersystems:oneoffirstserverstoearn

theABB“IndustrialITCertified”designation44秒分鐘小時班組天周月年L1/L2L3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論