企業(yè)同城災(zāi)備系統(tǒng)解決方案建議書_第1頁(yè)
企業(yè)同城災(zāi)備系統(tǒng)解決方案建議書_第2頁(yè)
企業(yè)同城災(zāi)備系統(tǒng)解決方案建議書_第3頁(yè)
企業(yè)同城災(zāi)備系統(tǒng)解決方案建議書_第4頁(yè)
企業(yè)同城災(zāi)備系統(tǒng)解決方案建議書_第5頁(yè)
已閱讀5頁(yè),還剩56頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、XX集團(tuán)同城災(zāi)備系統(tǒng)解決方案建議書賽門鐵克軟件(北京)有限公司2012年5月12345678目錄前言.3XX建立災(zāi)備系統(tǒng)的意義分析.4XX集團(tuán)災(zāi)備系統(tǒng)總體設(shè)計(jì).53.1本次災(zāi)備系統(tǒng)覆蓋的范圍.53.2災(zāi)備系統(tǒng)建設(shè)目標(biāo).53.3本次災(zāi)備系統(tǒng)的整體建議.5XX集團(tuán)災(zāi)備系統(tǒng)的具體實(shí)現(xiàn).94.1第一步:本地備份整合.94.2第二步:同城災(zāi)備建議方案一(NBU遠(yuǎn)程備份).134.2.1方案一的詳細(xì)設(shè)計(jì).134.2.2AIR技術(shù)的特點(diǎn)和優(yōu)勢(shì).184.2.3遠(yuǎn)程數(shù)據(jù)的驗(yàn)證.194.2.4災(zāi)備系統(tǒng)的統(tǒng)一監(jiān)控和管理.214.2.5方案一的優(yōu)勢(shì).234.3第二步:同城災(zāi)備建議方案二(StorageFoundati

2、onVVR遠(yuǎn)程復(fù)制).244.3.1方案二的詳細(xì)設(shè)計(jì).244.3.2VVR的實(shí)現(xiàn)原理和特點(diǎn).294.3.3網(wǎng)絡(luò)故障條件下的復(fù)制模式切換.314.3.4本地存儲(chǔ)系統(tǒng)的加固(可選).324.3.5應(yīng)用級(jí)容災(zāi)初步探討.344.3.6災(zāi)備系統(tǒng)的統(tǒng)一監(jiān)控和容災(zāi)演練.384.3.7方案二的優(yōu)勢(shì).40財(cái)務(wù)公司災(zāi)備系統(tǒng)的實(shí)現(xiàn).41方案所需的產(chǎn)品和初步報(bào)價(jià).42主要涉及的產(chǎn)品簡(jiǎn)介.457.1NetBackup備份軟件.457.2StorageFoundation容災(zāi)軟件.54賽門鐵克災(zāi)備成功案例列表.602/611前言十分感謝XX集團(tuán)的領(lǐng)導(dǎo)和專家對(duì)賽門鐵克公司的信任和支持,給我們一個(gè)機(jī)會(huì)參與貴處容災(zāi)系統(tǒng)方案的設(shè)

3、計(jì)。賽門鐵克將全力以赴為本次項(xiàng)目的順利實(shí)施做出貢獻(xiàn)。作為全球一流的計(jì)算機(jī)軟件公司和開放系統(tǒng)的領(lǐng)導(dǎo)者,賽門鐵克公司擁有完善的信息處理技術(shù)和豐富的應(yīng)用經(jīng)驗(yàn)。賽門鐵克公司在存儲(chǔ)管理及災(zāi)備領(lǐng)域有著豐富的經(jīng)驗(yàn),并熟知災(zāi)備建設(shè)相關(guān)的國(guó)家標(biāo)準(zhǔn)信息系統(tǒng)災(zāi)難恢復(fù)規(guī)范-GB/T20988-2007,嚴(yán)格按照國(guó)家標(biāo)準(zhǔn)和行業(yè)法規(guī),賽門鐵克公司充分利用自身的產(chǎn)品與技術(shù)優(yōu)勢(shì),設(shè)計(jì)適合XX集團(tuán)的災(zāi)備系統(tǒng)。賽門鐵克公司為XX集團(tuán)提供的災(zāi)難恢復(fù)方案具體以下特點(diǎn)和優(yōu)勢(shì):深刻理解災(zāi)備建設(shè)相關(guān)的國(guó)家標(biāo)準(zhǔn)信息系統(tǒng)災(zāi)難恢復(fù)規(guī)范-GB/T20988-2007,并嚴(yán)格按照其規(guī)定設(shè)計(jì)解決方案,為客戶達(dá)到國(guó)家及行業(yè)的災(zāi)備建設(shè)規(guī)范提供可靠的條件賽

4、門鐵克根據(jù)多年容災(zāi)項(xiàng)目經(jīng)驗(yàn)總結(jié)歸納了業(yè)務(wù)連續(xù)和災(zāi)難恢復(fù)建設(shè)方法論,可以系統(tǒng)的指導(dǎo)災(zāi)備系統(tǒng)的建設(shè)完整詳盡的數(shù)據(jù)遠(yuǎn)程備份和災(zāi)難恢復(fù)方案,賽門鐵克能夠提供從服務(wù)器、網(wǎng)絡(luò)、存儲(chǔ)、SAN等全面容災(zāi)解決方案大量實(shí)施案例,經(jīng)過驗(yàn)證的容災(zāi)系統(tǒng)實(shí)施和支持能力,豐富的實(shí)施經(jīng)驗(yàn)和人員,強(qiáng)大的專人支持賽門鐵克公司在國(guó)內(nèi)已經(jīng)成功地為眾多客戶實(shí)施了容災(zāi)系統(tǒng)。希望以我們?cè)跒?zāi)備系統(tǒng)建設(shè)中積累的豐富經(jīng)驗(yàn)和技術(shù),為XX集團(tuán)本次災(zāi)備系統(tǒng)的建設(shè)做出貢獻(xiàn)。3/612XX建立災(zāi)備系統(tǒng)的意義分析XX投資公司(XX集團(tuán))是中央直接管理的國(guó)有重要骨干企業(yè)之一,下設(shè)11個(gè)全資子公司和13個(gè)控股子公司,擁有三級(jí)以上全資和控股投資企業(yè)176家,其中

5、包括5家控股上市公司,公司在國(guó)民經(jīng)濟(jì)發(fā)展中發(fā)揮著重要的作用。對(duì)于總公司來說,管理這么大規(guī)模企業(yè)的難度不小,挑戰(zhàn)也很多。在信息化方面,當(dāng)越來越多的員工已經(jīng)習(xí)慣于、依賴于IT技術(shù)的環(huán)境下,任何關(guān)鍵信息系統(tǒng)運(yùn)轉(zhuǎn)的中斷或者數(shù)據(jù)的丟失都將導(dǎo)致不可估量的損失和廣泛的影響。當(dāng)然,XX的信息管理部門早就有了危機(jī)意識(shí),也已經(jīng)通過多種技術(shù)手段盡力避免危機(jī)的產(chǎn)生。比如采用了本地雙機(jī)熱備、數(shù)據(jù)備份等,增強(qiáng)了業(yè)務(wù)系統(tǒng)的高可用性和數(shù)據(jù)的安全性,在一定程度上避免了由于軟硬件故障、人為操作失誤等因素引起的系統(tǒng)停機(jī)或數(shù)據(jù)丟失。但是,在目前的數(shù)據(jù)中心,如電源(UPS)故障、空調(diào)故障、管道漏水、消防噴嘴故障、煙感探測(cè)系統(tǒng)故障、火災(zāi)

6、等不可預(yù)測(cè)的災(zāi)難時(shí)有發(fā)生,這時(shí)建立遠(yuǎn)程災(zāi)備系統(tǒng),利用各種技術(shù)和管理手段將這些致命的災(zāi)難化解就具有重要的意義。建立災(zāi)備系統(tǒng)可以給XX集團(tuán)帶來如下的價(jià)值:重要業(yè)務(wù)數(shù)據(jù)在災(zāi)難發(fā)生后得以保護(hù)。重要業(yè)務(wù)在災(zāi)難發(fā)生后可以在一定的時(shí)間內(nèi)恢復(fù),連續(xù)運(yùn)行。業(yè)務(wù)計(jì)算機(jī)系統(tǒng)抵御災(zāi)難的級(jí)別提高。提升了關(guān)鍵業(yè)務(wù)系統(tǒng)的高可用性,減少計(jì)劃性停機(jī)對(duì)業(yè)務(wù)的影響。在生產(chǎn)系統(tǒng)正常運(yùn)轉(zhuǎn)的情況下,容災(zāi)系統(tǒng)還可以被用來開展諸如數(shù)據(jù)挖掘、經(jīng)營(yíng)分析等增值業(yè)務(wù)。4/613XX集團(tuán)災(zāi)備系統(tǒng)總體設(shè)計(jì)3.1本次災(zāi)備系統(tǒng)覆蓋的范圍本次災(zāi)備系統(tǒng)將集團(tuán)公司的IT系統(tǒng)和財(cái)務(wù)公司的IT系統(tǒng)一并考慮,但鑒于集團(tuán)公司和財(cái)務(wù)公司不同系統(tǒng)的RPO和RTO要求不同,建

7、議的災(zāi)備技術(shù)也具有各自的針對(duì)性。據(jù)初步統(tǒng)計(jì),集團(tuán)公司目前有2臺(tái)IBMP570小型機(jī),20臺(tái)左右的WindowsPC服務(wù)器和1臺(tái)LinuxPC服務(wù)器;財(cái)務(wù)公司目前有2臺(tái)IBMP520小型機(jī)和6-7臺(tái)WindowsPC服務(wù)器。本次針對(duì)這些服務(wù)器和應(yīng)用系統(tǒng)將設(shè)計(jì)不同的災(zāi)備技術(shù)和策略。3.2災(zāi)備系統(tǒng)建設(shè)目標(biāo)容災(zāi)系統(tǒng)在實(shí)踐中主要表現(xiàn)為兩個(gè)方面:一是保證企業(yè)數(shù)據(jù)的安全;二是保證業(yè)務(wù)的連續(xù)性。通過在生產(chǎn)站點(diǎn)和災(zāi)難恢復(fù)站點(diǎn)運(yùn)行同樣的系統(tǒng),包括操作系統(tǒng)、基礎(chǔ)數(shù)據(jù)庫(kù)和應(yīng)用軟件,并通過IP或FC通道完成實(shí)時(shí)或異步的數(shù)據(jù)復(fù)制。假如生產(chǎn)站點(diǎn)突發(fā)災(zāi)難,不能再繼續(xù)工作,這時(shí)容災(zāi)中心會(huì)將業(yè)務(wù)數(shù)據(jù)及時(shí)恢復(fù)到備用服務(wù)器上,并迅速

8、將業(yè)務(wù)系統(tǒng)加載到備用服務(wù)器,然后實(shí)現(xiàn)業(yè)務(wù)的遠(yuǎn)程切換(Fail-over),恢復(fù)應(yīng)用系統(tǒng)不間斷的運(yùn)行;在此基礎(chǔ)上,在災(zāi)難過后,生產(chǎn)系統(tǒng)恢復(fù)正常后,再將業(yè)務(wù)運(yùn)行切換回正常的生產(chǎn)系統(tǒng),實(shí)現(xiàn)業(yè)務(wù)系統(tǒng)的災(zāi)難恢復(fù)(Fail-back)。本次項(xiàng)目,XX集團(tuán)重要數(shù)據(jù)的異地保存是首要需求,首先要保證數(shù)據(jù)的遠(yuǎn)程可用,另外對(duì)于總公司和財(cái)務(wù)公司的一些關(guān)鍵業(yè)務(wù)系統(tǒng),將考慮一定程度的應(yīng)用級(jí)容災(zāi)。3.3本次災(zāi)備系統(tǒng)的整體建議一個(gè)較為完善的災(zāi)難恢復(fù)系統(tǒng)主要包括三個(gè)部分:數(shù)據(jù)容災(zāi)系統(tǒng)、應(yīng)用容災(zāi)系統(tǒng)和容災(zāi)演練系統(tǒng)??梢哉f,數(shù)據(jù)容災(zāi)是抗御災(zāi)難的基本保障,應(yīng)用容災(zāi)則是災(zāi)難恢復(fù)系統(tǒng)建設(shè)的最終目的,而容災(zāi)演練系統(tǒng)最終保證容災(zāi)系統(tǒng)的正常運(yùn)

9、行??紤]到不同系統(tǒng)RPO和RTO的需求不一樣,本次災(zāi)備系統(tǒng)的整體建議如下:5/61系統(tǒng)名稱ERP核算、人力ERP數(shù)據(jù)庫(kù)對(duì)于XX總部,我們提供兩個(gè)方案供您選擇,這兩個(gè)方案的效果和投資成本均不同:1.使用NetBackup軟件整合本地所有數(shù)據(jù)的備份,再把備份的數(shù)據(jù)自動(dòng)復(fù)制一份到遠(yuǎn)程保存,具體的指標(biāo)見下表:型號(hào)數(shù)量災(zāi)備技術(shù)選擇參考的RPO范圍參考的RTO范圍容災(zāi)級(jí)別IBMP570NetBackup本地備份RPO24小時(shí)RTO48小時(shí)測(cè)試系統(tǒng)16Core2整合+遠(yuǎn)程備份1小時(shí)-24小時(shí)2小時(shí)-48小時(shí)國(guó)標(biāo)第4級(jí)資金管理集團(tuán)OA數(shù)據(jù)庫(kù)Windows4個(gè)分區(qū)PC服務(wù)器應(yīng)用服務(wù)器10個(gè)應(yīng)用+10個(gè)數(shù)20Ne

10、tBackup本地備份整合+遠(yuǎn)程備份RPO24小時(shí)1小時(shí)-24小時(shí)RTO48小時(shí)2小時(shí)-48小時(shí)國(guó)標(biāo)第4級(jí)據(jù)庫(kù)培訓(xùn)系統(tǒng)LinuxPC1NetBackup本地備份RPO24小時(shí)RTO48小時(shí)國(guó)標(biāo)第4級(jí)服務(wù)器整合+遠(yuǎn)程備份1小時(shí)-24小時(shí)2小時(shí)-48小時(shí)2.使用NetBackup軟件整合本地所有數(shù)據(jù)的備份,同時(shí)包括2臺(tái)小型機(jī)在內(nèi)的所有關(guān)鍵服務(wù)器利用StorageFoundation的VVR復(fù)制軟件將重要的數(shù)據(jù)準(zhǔn)實(shí)時(shí)的復(fù)制到遠(yuǎn)程,如果需要,StorageFoundation的GCO功能還能實(shí)現(xiàn)業(yè)務(wù)的遠(yuǎn)程切換。關(guān)鍵服務(wù)器暫定為2臺(tái)Unix小機(jī)和10臺(tái)應(yīng)用服務(wù)器(5個(gè)應(yīng)用+5個(gè)數(shù)據(jù)庫(kù)),數(shù)量可根據(jù)需求進(jìn)

11、一步調(diào)整。其余服務(wù)器上的數(shù)據(jù)通過NetBackup的遠(yuǎn)程備份來實(shí)現(xiàn)數(shù)據(jù)級(jí)的災(zāi)備。另外,方案二還可以利用StorageFoundation的鏡像功能在本地?cái)?shù)據(jù)中心對(duì)關(guān)鍵6/61系統(tǒng)名稱ERP核算、服務(wù)器實(shí)現(xiàn)雙機(jī)雙柜,加強(qiáng)本地存儲(chǔ)系統(tǒng)的高可用性。具體的指標(biāo)見下表:型號(hào)數(shù)量災(zāi)備技術(shù)選擇參考的RPO范圍參考的RTO范圍容災(zāi)級(jí)別人力IBMP570NetBackup本地備份ERP數(shù)據(jù)庫(kù)16Core2整合StorageFoundation+RPO30分鐘1-30分鐘RTO8小時(shí)2小時(shí)-8小時(shí)國(guó)標(biāo)第5級(jí)測(cè)試系統(tǒng)資金管理Windows4個(gè)分區(qū)PC服務(wù)器VVR遠(yuǎn)程復(fù)制NetBackup本地備份5個(gè)應(yīng)用整合RPO3

12、0分鐘RTO8小時(shí)關(guān)鍵應(yīng)用+5個(gè)數(shù)據(jù)10StorageFoundation+1-30分鐘2小時(shí)-8小時(shí)國(guó)標(biāo)第5級(jí)服務(wù)器庫(kù)PC服務(wù)器VVR遠(yuǎn)程復(fù)制Windows非關(guān)鍵應(yīng)用服務(wù)器5個(gè)應(yīng)用+5個(gè)數(shù)據(jù)10NetBackup本地備份整合+遠(yuǎn)程備份RPO24小時(shí)1小時(shí)-24小時(shí)RTO48小時(shí)2小時(shí)-48小時(shí)國(guó)標(biāo)第4級(jí)庫(kù)培訓(xùn)系統(tǒng)LinuxPC1NetBackup本地備份RPO24小時(shí)RTO48小時(shí)國(guó)標(biāo)第4級(jí)服務(wù)器整合+遠(yuǎn)程備份1小時(shí)-24小時(shí)2小時(shí)-48小時(shí)對(duì)于財(cái)務(wù)公司,鑒于業(yè)務(wù)的連續(xù)性要求較高,我們建議在利用NetBackup本地備份整合的基礎(chǔ)上,直接使用StorageFoundationVVR遠(yuǎn)程災(zāi)備的

13、方式,具體的指標(biāo)如下:系統(tǒng)名稱型號(hào)數(shù)量災(zāi)備技術(shù)選擇NetBackup本地備份參考的RPO范圍參考的RTO范圍容災(zāi)級(jí)別集團(tuán)IBMP520整合RPO30分鐘RTO8小時(shí)財(cái)務(wù)管理2StorageFoundation+1-30分鐘2小時(shí)-8小時(shí)國(guó)標(biāo)第5級(jí)VVR遠(yuǎn)程復(fù)制7/61NetBackup本地備份WindowsPC服務(wù)器整合RPO30分鐘RTO8小時(shí)前置機(jī)7StorageFoundation+1-30分鐘2小時(shí)-8小時(shí)國(guó)標(biāo)第5級(jí)VVR遠(yuǎn)程復(fù)制8/614XX集團(tuán)災(zāi)備系統(tǒng)的具體實(shí)現(xiàn)4.1第一步:本地備份整合本地?cái)?shù)據(jù)備份的整合是建立災(zāi)備系統(tǒng)的基礎(chǔ),因?yàn)閿?shù)據(jù)同步復(fù)制技術(shù)不能完全代替?zhèn)浞莸墓δ?,即使使用了?shù)

14、據(jù)同步復(fù)制技術(shù),也有可能需要將數(shù)據(jù)恢復(fù)到歷史的時(shí)間點(diǎn)。XX集團(tuán)現(xiàn)在已經(jīng)對(duì)關(guān)鍵的數(shù)據(jù)庫(kù)系統(tǒng)進(jìn)行了在線備份,但OA和ERP等不同的業(yè)務(wù)系統(tǒng)采用了不同的備份技術(shù),而且操作系統(tǒng)和部分服務(wù)器上的文件還沒有進(jìn)行備份,建議XX建立一個(gè)統(tǒng)一的數(shù)據(jù)備份和管理平臺(tái),將所有的PC服務(wù)器和小型機(jī)都納入進(jìn)來,涵蓋包括文件、操作系統(tǒng)和數(shù)據(jù)庫(kù)等全部重要的內(nèi)容,作為災(zāi)備系統(tǒng)的建設(shè)的后備保障力量。目前,集團(tuán)公司有2臺(tái)P570小型機(jī),每個(gè)小型機(jī)分為4個(gè)分區(qū),運(yùn)行著ERP核算、人2力、預(yù)算合并、數(shù)據(jù)庫(kù)、測(cè)試系統(tǒng)等;臺(tái)小機(jī)為主備集群。數(shù)據(jù)庫(kù)為Oracle數(shù)據(jù)庫(kù),版本為9i,由于數(shù)據(jù)庫(kù)版本較低,近期準(zhǔn)備升級(jí)到11g。另外還有大約20臺(tái)

15、WindowsPC服務(wù)器,約10個(gè)應(yīng)用系統(tǒng),架構(gòu)均為1臺(tái)應(yīng)用服務(wù)器+1臺(tái)數(shù)據(jù)庫(kù)服務(wù)器,數(shù)據(jù)庫(kù)有SQLServer、Oracle和Domino等。之外還有1臺(tái)Linux服務(wù)器作為培訓(xùn)系統(tǒng)。本地備份整合的拓?fù)淙缦滤荆?/61結(jié)合XX集團(tuán)的實(shí)際情況,建議是利用SAN和LAN的存儲(chǔ)架構(gòu),采用目前最先進(jìn)的新型LAN-Free備份技術(shù)并結(jié)合LAN的備份技術(shù),來減輕局域網(wǎng)的壓力,是目前最成熟的技術(shù)解決方案。推薦采用SymantecNetbackup(以下簡(jiǎn)稱NBU)企業(yè)級(jí)備份軟件作為統(tǒng)一的備份和管理平臺(tái)來滿足用戶的需求。NBU是目前業(yè)界市場(chǎng)占有率第一的備份軟件,其主要模塊如下:NetBackup主服務(wù)器(

16、MasterServer)負(fù)責(zé)管理制定全域內(nèi)的備份策略和跟蹤客戶端的備份,能夠管理磁盤空間和磁帶庫(kù),實(shí)現(xiàn)多個(gè)客戶端的數(shù)據(jù)備份。NetBackup主服務(wù)器是備份域內(nèi)集中管理的核心。一般一個(gè)備份域配置1臺(tái)MasterServer即可。企業(yè)客戶端(EnterpriseClient)可以讓備份的客戶端直接連接和管理備份設(shè)備,具有介質(zhì)管理服務(wù)器的角色,這樣客戶端可以自己備份自己,不用再向備份服務(wù)器傳送數(shù)據(jù)??捎美眯矢叩腟AN網(wǎng)絡(luò),而不用占用LAN網(wǎng)絡(luò)帶寬。企業(yè)客戶端上如果有數(shù)據(jù)庫(kù)10/61需要在線備份,還需要安裝數(shù)據(jù)庫(kù)代理模塊(DatabasePack)。標(biāo)準(zhǔn)客戶端(StandardClient)

17、可以讓備份的客戶端通過LAN網(wǎng)絡(luò)進(jìn)行備份。所有備份的數(shù)據(jù)均需發(fā)送到備份管理服務(wù)器,由備份管理服務(wù)器寫入備份設(shè)備。標(biāo)準(zhǔn)客戶端上如果有數(shù)據(jù)庫(kù)需要在線備份,也需要安裝數(shù)據(jù)庫(kù)代理模塊。本次建議采用NBU5220備份一體機(jī)實(shí)現(xiàn)備份環(huán)境的整合和統(tǒng)一備份,NBU5220的本質(zhì)是”NBU管理服務(wù)器+備份設(shè)備”,既承擔(dān)了整合備份域的統(tǒng)一管理功能,又提供高性能大容量的磁盤備份空間,并且完全集成NBU的重復(fù)數(shù)據(jù)刪除功能,優(yōu)化了整個(gè)數(shù)據(jù)中心的備份性能。如上圖所示:XX集團(tuán)原有的系統(tǒng)架構(gòu)無需做任何改變,只需要增加1臺(tái)NBU5220備份一體機(jī)設(shè)備,該設(shè)備前端連接以太網(wǎng),后端連接SAN網(wǎng)絡(luò),提供LAN和LAN-FREE等多

18、種備份模式的支持。NBU5220提供新型的LAN-FREE備份技術(shù)(又叫做SANClient技術(shù)),使用這種技術(shù)進(jìn)行備份,LAN-FREE的客戶端無需連接和管理備份設(shè)備,只需要利用SAN網(wǎng)絡(luò)將備份數(shù)據(jù)備份到NBU5220即可。由于無需客戶端管理備份設(shè)備,降低了對(duì)客戶端本身資源的占用,也減少了備份設(shè)備變更對(duì)客戶端的影響,客戶端的備份效率和整個(gè)備份系統(tǒng)的擴(kuò)展能力大大增強(qiáng)。備份的客戶端只需安裝NBU客戶端代理,進(jìn)行LAN-FREE備份的客戶端安裝NBU企業(yè)客戶端代理,進(jìn)行LAN備份的客戶端安裝NBU標(biāo)準(zhǔn)客戶端代理,所有的數(shù)據(jù)庫(kù)和應(yīng)用程序服務(wù)器再安裝數(shù)據(jù)庫(kù)代理模塊,提供對(duì)數(shù)據(jù)庫(kù)進(jìn)行在線的熱備份。11/

19、61NBU5220預(yù)裝了NBU備份軟件,支持NBU軟件的所有新功能,包括NBU7.5最新的備份加速功能,可將文件系統(tǒng)的備份速度最高提高100倍以上。另外,使用NBU5220內(nèi)置的重復(fù)數(shù)據(jù)刪除功能,可對(duì)整個(gè)備份域進(jìn)行全局消重,降低了對(duì)備份空間的占用,可以讓5220存儲(chǔ)更多的備份數(shù)據(jù)。NBU5220的硬件指標(biāo)如下:產(chǎn)品規(guī)范形態(tài)構(gòu)架CPU內(nèi)存存儲(chǔ)設(shè)備2U主柜+3U擴(kuò)展柜雙IntelE5620CPU24GB或48GBDDR內(nèi)存主柜:2x1TBSATA系統(tǒng)盤,8x1TBSAS數(shù)據(jù)盤擴(kuò)展柜:16x2TB或16x3TBSAS磁盤6個(gè)1Gb以太網(wǎng)端口服務(wù)端口可擴(kuò)展為2個(gè)10Gb以太網(wǎng)端口可擴(kuò)展為6個(gè)8GbFC

20、端口使用NBU5220構(gòu)建統(tǒng)一的備份域具有以下明顯的優(yōu)勢(shì):(1)(2)(3)(4)(5)(6)(7)提供管理服務(wù)器和備份空間等一體化方案,簡(jiǎn)單易用內(nèi)置NBU備份軟件,支持NBU所有的新功能和新技術(shù)內(nèi)置重復(fù)數(shù)據(jù)刪除功能:支持10-50倍的壓縮,節(jié)省最多99%的帶寬提供源端和目標(biāo)端的重復(fù)數(shù)據(jù)刪除位置,方便用戶的靈活選擇高可用硬件設(shè)計(jì),提供99.95%的可用性操作和配置簡(jiǎn)單易用:只需要幾分鐘時(shí)間就可以完全配置好支持磁帶的出庫(kù),可與磁帶庫(kù)完美配合12/61整個(gè)集團(tuán)公司的統(tǒng)一備份平臺(tái)所需的軟硬件模塊列表整體如下:所需硬件:NetBackup5220名稱NBU5220備份一體機(jī)主要描述提供備份管理和磁盤備

21、份空間的一體化硬件設(shè)備數(shù)量1所需軟件:NetBackup7.5EnterpriseServer備份管理服務(wù)器授權(quán),Linux平臺(tái)LAN-Free備份客戶端,Unix平臺(tái)EnterpriseClientLAN-Free備份客戶端,Windows平臺(tái)StandardClientLAN備份客戶端,Windows/Linux平臺(tái)數(shù)據(jù)庫(kù)和應(yīng)用在線備份模塊,Unix平臺(tái)DatabasePack數(shù)據(jù)庫(kù)和應(yīng)用在線備份模塊,Win/Linux平臺(tái)121011210Optimization10DataProtection重復(fù)數(shù)據(jù)刪除模塊,1TB容量授權(quán)4.2第二步:同城災(zāi)備建議方案一(NBU遠(yuǎn)程備份)4.2.1方

22、案一的詳細(xì)設(shè)計(jì)方案一建議利用SymantecNetbackup備份管理平臺(tái)實(shí)現(xiàn)備份數(shù)據(jù)的遠(yuǎn)程復(fù)制,整個(gè)復(fù)制過程基于容災(zāi)鏈路完全自動(dòng)化運(yùn)行,這樣基本達(dá)到國(guó)標(biāo)第3級(jí)的容災(zāi)目標(biāo);另外,建議在容災(zāi)中心設(shè)立若干臺(tái)應(yīng)用服務(wù)器,例如可以為每一類服務(wù)器(Unix和Windows)配置1臺(tái)備機(jī),定期把備份數(shù)據(jù)在遠(yuǎn)程的應(yīng)用服務(wù)器上進(jìn)行恢復(fù),以進(jìn)行驗(yàn)證或使用,這樣可達(dá)到國(guó)標(biāo)第4級(jí)的容災(zāi)目標(biāo)。國(guó)標(biāo)第4級(jí)的具體要求如下:第4級(jí):電子傳輸及完整設(shè)備支持要素要求13/61A.4.1數(shù)據(jù)備份系統(tǒng)a)完整數(shù)據(jù)備份至少每天一次;b)備份介質(zhì)場(chǎng)外存放;c)每天多次利用通信網(wǎng)絡(luò)將關(guān)鍵數(shù)據(jù)定時(shí)批量傳送至備用場(chǎng)地。A.4.2備用數(shù)據(jù)處理

23、系統(tǒng)a)配備災(zāi)難恢復(fù)所需的全部數(shù)據(jù)處理設(shè)備,并處于就緒狀態(tài)或運(yùn)行狀態(tài)。A.4.3A.4.4備用網(wǎng)絡(luò)系統(tǒng)備用基礎(chǔ)設(shè)施a)配備災(zāi)難恢復(fù)所需的通信線路;b)配備災(zāi)難恢復(fù)所需的網(wǎng)絡(luò)設(shè)備,并處于就緒狀態(tài)。a)有符合介質(zhì)存放條件的備用場(chǎng)地;b)有符合備用數(shù)據(jù)處理系統(tǒng)和備用網(wǎng)絡(luò)設(shè)備運(yùn)行要求的場(chǎng)地;c)有滿足關(guān)鍵業(yè)務(wù)功能恢復(fù)運(yùn)作要求的場(chǎng)地;d)以上場(chǎng)地應(yīng)保持7*24運(yùn)作。A.4.5技術(shù)支持A.4.6運(yùn)行維護(hù)支持A.4.7災(zāi)難恢復(fù)預(yù)案在備用場(chǎng)地有:a)7*24專職計(jì)算機(jī)機(jī)房管理人員;b)專職數(shù)據(jù)備份技術(shù)支持人員;c)專職硬件、網(wǎng)絡(luò)技術(shù)支持人員。a)有介質(zhì)存取、驗(yàn)證和轉(zhuǎn)儲(chǔ)管理制度;b)按介質(zhì)特征對(duì)備份數(shù)據(jù)進(jìn)行定期

24、的有效性驗(yàn)證;c)有備用計(jì)算機(jī)機(jī)房運(yùn)行管理制度;d)有硬件和網(wǎng)絡(luò)運(yùn)行管理制度;e)有電子傳輸數(shù)據(jù)備份系統(tǒng)運(yùn)行管理制度。有相應(yīng)的經(jīng)過完整測(cè)試和演練的災(zāi)難恢復(fù)預(yù)案。為保證災(zāi)備機(jī)房設(shè)備運(yùn)行環(huán)境的正常,需要為災(zāi)備機(jī)房增配機(jī)房環(huán)境監(jiān)測(cè)、UPS電源、機(jī)柜等基礎(chǔ)設(shè)施,保證機(jī)房條件滿足設(shè)備運(yùn)行環(huán)境。整體拓?fù)淙缦滤荆?4/61方案一建議在災(zāi)備中心配置1臺(tái)NBU5220備份一體機(jī)設(shè)備,生產(chǎn)機(jī)房和災(zāi)備機(jī)房之間通過IP鏈路連接即可。災(zāi)備機(jī)房的NBU5220設(shè)置為MasterServer的角色,利用NBU的AIR技術(shù)把生產(chǎn)機(jī)房的MasterServer上的備份數(shù)據(jù)復(fù)制到災(zāi)備機(jī)房的MasterServer上。生產(chǎn)機(jī)房的

25、NBU5220與災(zāi)備機(jī)房的NBU5220需要能夠正常通信,但彼此的通信并不頻繁,只有在需要復(fù)制數(shù)據(jù)的時(shí)候才會(huì)互相通信,減少了由于通信問題或者網(wǎng)絡(luò)問題影響復(fù)制的隱患,確保了整個(gè)復(fù)制架構(gòu)的穩(wěn)定性。另外由于遠(yuǎn)程的NBU5220構(gòu)成了一個(gè)單獨(dú)的備份域,這樣一旦本地的備份域完全癱瘓也可以在遠(yuǎn)程進(jìn)行恢復(fù)。下面就災(zāi)備系統(tǒng)的實(shí)現(xiàn)過程做一個(gè)簡(jiǎn)單的描述:復(fù)制的功能通過NBU存儲(chǔ)生命周期策略來實(shí)現(xiàn)。首先在生產(chǎn)機(jī)房的NBU5220上建立一個(gè)存儲(chǔ)生命周期策略,在這個(gè)策略中將主站點(diǎn)的NBU5220作為第一級(jí)備份設(shè)備,將遠(yuǎn)15/61程的NBU5220作為第二級(jí)備份設(shè)備。然后在生產(chǎn)機(jī)房的NBU5220上創(chuàng)建針對(duì)于每個(gè)備份客戶

26、端的備份策略,在這個(gè)備份策略中,調(diào)用存儲(chǔ)生命周期策略。這樣在備份時(shí),客戶端的數(shù)據(jù)會(huì)先發(fā)送給本地的NBU5220,寫入完成后不久便會(huì)自動(dòng)復(fù)制到遠(yuǎn)程的NBU5220上,整個(gè)過程完全自動(dòng)化執(zhí)行。在災(zāi)備機(jī)房的NBU5220上面創(chuàng)建一個(gè)同樣名稱的存儲(chǔ)生命周期策略,生產(chǎn)機(jī)房的NBU5220和災(zāi)備機(jī)房的NBU5220互相驗(yàn)證,這樣,復(fù)制過來的數(shù)據(jù)會(huì)自動(dòng)導(dǎo)入災(zāi)備機(jī)房的NBU5220上。當(dāng)生產(chǎn)機(jī)房的業(yè)務(wù)系統(tǒng)發(fā)生故障導(dǎo)致數(shù)據(jù)丟失時(shí),優(yōu)先從本地的NBU5220中進(jìn)行還原。如生產(chǎn)機(jī)房遭遇重大災(zāi)難時(shí),無法從本地進(jìn)行還原,可以在異地重建業(yè)務(wù)系統(tǒng),從異地?cái)?shù)據(jù)備份進(jìn)行還原,以保證數(shù)據(jù)安全和信息系統(tǒng)及時(shí)恢復(fù)正常運(yùn)行。這種情況,

27、需要在遠(yuǎn)程為每一類操作系統(tǒng)主機(jī)設(shè)置1臺(tái)或多臺(tái)備機(jī),以便在遠(yuǎn)程恢復(fù)和驗(yàn)證數(shù)據(jù)。目前,NBU的AIR技術(shù)不僅支持對(duì)數(shù)據(jù)的遠(yuǎn)程復(fù)制和異機(jī)恢復(fù),還支持對(duì)操作系統(tǒng)的遠(yuǎn)程復(fù)制和異機(jī)恢復(fù),這樣,整個(gè)災(zāi)備系統(tǒng)的RTO值將進(jìn)一步降低。備份管理員可以決定客戶端的數(shù)據(jù)是否復(fù)制到遠(yuǎn)程,因?yàn)樵诤芏鄷r(shí)候,非重要的客戶端上的數(shù)據(jù),或者是重要的客戶端上的非重要數(shù)據(jù)是沒有必要復(fù)制到遠(yuǎn)程的,只在本地備份磁盤上保存即可。這樣,一方面是減輕備份管理服務(wù)器備份和復(fù)制的壓力,另外也節(jié)省了對(duì)災(zāi)備鏈路帶寬的搶占,保證災(zāi)備鏈路的帶寬主要用于重要數(shù)據(jù)的復(fù)制。提到災(zāi)備鏈路的帶寬,一個(gè)基本原則是要保證一個(gè)全備份在合理的時(shí)間內(nèi)(比如說12小時(shí),時(shí)間越

28、長(zhǎng),RPO就越大)可以復(fù)制過去。目前集團(tuán)公司的數(shù)據(jù)總量還不算大,全備份大約在幾百GB,關(guān)鍵數(shù)據(jù)庫(kù)的增量每天大約5GB,建議租用一條10Mb以上的SDH備份專用線路作為災(zāi)備數(shù)據(jù)傳輸線路。生產(chǎn)機(jī)房和災(zāi)備機(jī)房各需要1套路由交換設(shè)備接入災(zāi)備專用網(wǎng)絡(luò)。16/61以10MbSDH鏈路舉例,假如鏈路帶寬有效地傳輸效率為80%,每小時(shí)可以復(fù)制的數(shù)據(jù)為:10/8*0.8*3600/1024=3.5GB,那么24小時(shí)可以復(fù)制的數(shù)據(jù)為:3.5*24=84GB。實(shí)際的傳輸效率可能會(huì)更小一點(diǎn)。因此,我們認(rèn)為在這種災(zāi)備鏈路的條件下,假如不使用重復(fù)數(shù)據(jù)刪除技術(shù),全部的災(zāi)備數(shù)據(jù)應(yīng)控制在100GB左右,這就要求管理員需要明確區(qū)

29、分重要和非重要的數(shù)據(jù)。如果結(jié)合備份軟件的重復(fù)數(shù)據(jù)刪除功能,那么可以在本地備份時(shí)消除備份的重復(fù)數(shù)據(jù)。這個(gè)功能非常好,這意味這需要復(fù)制的數(shù)據(jù)大幅減少。以平均1:8的消重率計(jì)算,假如原來備份的數(shù)據(jù)為800GB,那么使用消重技術(shù)之后,實(shí)際占用的空間僅為100GB,這意味著在10Mb的窄帶鏈路下,可以承擔(dān)的數(shù)據(jù)復(fù)制總量將提高8倍,達(dá)到800GB。在災(zāi)備系統(tǒng)當(dāng)中,最可能成為備份瓶頸的就是災(zāi)備鏈路帶寬,今后如果數(shù)據(jù)傳輸?shù)臅r(shí)間過長(zhǎng),可考慮進(jìn)一步增加鏈路帶寬。采用NBU5220構(gòu)建災(zāi)備系統(tǒng),簡(jiǎn)單易用,優(yōu)勢(shì)明顯:1.NBU5220即插即用,配置非常簡(jiǎn)單(最快幾分鐘即可完成配置),對(duì)現(xiàn)有環(huán)境改造的影響極小。2.3.

30、4.5.直接支持基于IP災(zāi)備鏈路進(jìn)行復(fù)制,對(duì)復(fù)制帶寬的要求不高。NBU5220支持NBU7.5最新的各種功能,沒有任何兼容性問題??梢员镜貍浞莸臄?shù)據(jù)和需要容災(zāi)的備份數(shù)據(jù)分開,減輕對(duì)災(zāi)備網(wǎng)絡(luò)資源的占用。NBU5220的網(wǎng)絡(luò)穿透能力很強(qiáng),可以用在一個(gè)備份域內(nèi)部復(fù)制,也可以用在多個(gè)備份域之間復(fù)制。6.在遠(yuǎn)程災(zāi)備中心的部署簡(jiǎn)單,不需要額外的介質(zhì)服務(wù)器,管理和配置也很便捷。方案一所需的軟硬件模塊列表如下:17/61所需硬件:NetBackup5220(用于災(zāi)備)名稱NBU5220備份一體機(jī)PC服務(wù)器主要描述提供備份管理和磁盤備份空間的一體化硬件設(shè)備用于遠(yuǎn)程恢復(fù)和驗(yàn)證數(shù)據(jù),暫定2臺(tái)數(shù)量12所需軟件:Net

31、Backup7.5(用于災(zāi)備)EnterpriseServerDataProtectionOptimization備份管理服務(wù)器授權(quán),Linux平臺(tái)1重復(fù)數(shù)據(jù)刪除模塊,1TB容量授權(quán)10LAN備份客戶端,Windows/Linux平臺(tái)2StandardClient用于遠(yuǎn)程的異機(jī)恢復(fù)4.2.2AIR技術(shù)的特點(diǎn)和優(yōu)勢(shì)上節(jié)提到,方案一是用NBUAIR技術(shù)實(shí)現(xiàn)備份數(shù)據(jù)的遠(yuǎn)程災(zāi)備。AIR是NBU7.1的新功能,全稱是AutoImageReplication,主要的作用是將一個(gè)備份域的備份數(shù)據(jù)復(fù)制到另外一個(gè)備份中,然后可以在另外一個(gè)備份中恢復(fù)和驗(yàn)證數(shù)據(jù)。NBU是唯一支持該技術(shù)的產(chǎn)品。18/61其主要特點(diǎn)如

32、下:1.自動(dòng)的在兩個(gè)獨(dú)立的備份域間復(fù)制備份映像2.數(shù)據(jù)自動(dòng)的導(dǎo)入到目標(biāo)備份域的目錄庫(kù),無需人工干預(yù)3.與重復(fù)數(shù)據(jù)刪除技術(shù)集成,優(yōu)化復(fù)制帶寬4.支持對(duì)數(shù)據(jù)和BMR(操作系統(tǒng)裸機(jī)恢復(fù))的遠(yuǎn)程復(fù)制和異機(jī)恢復(fù)5.數(shù)據(jù)可進(jìn)一步在容災(zāi)站點(diǎn)復(fù)制到磁帶及出庫(kù)保存4.2.3遠(yuǎn)程數(shù)據(jù)的驗(yàn)證由于重要應(yīng)用系統(tǒng)對(duì)數(shù)據(jù)可恢復(fù)性以及RTO指標(biāo)要求較高,建議在災(zāi)備中心定期將復(fù)制的備份數(shù)據(jù)在恢復(fù)環(huán)境中進(jìn)行恢復(fù)測(cè)試,一方面驗(yàn)證數(shù)據(jù)的可恢復(fù)性,另一方面對(duì)恢復(fù)操作進(jìn)行演練,以保證RTO指標(biāo)。在管理上,建議將業(yè)務(wù)級(jí)別與恢復(fù)演練策略結(jié)合起來,根據(jù)業(yè)務(wù)的重要行規(guī)劃恢復(fù)演練策略。例如,針對(duì)高級(jí)別的業(yè)務(wù)系統(tǒng),加大演練頻率;對(duì)于低級(jí)別的業(yè)務(wù)系統(tǒng)

33、,適當(dāng)延長(zhǎng)演19/61練頻率。建議XX集團(tuán)對(duì)一級(jí)業(yè)務(wù)系統(tǒng),每一個(gè)月進(jìn)行一次恢復(fù)演練;二級(jí)業(yè)務(wù)系統(tǒng),每一季度進(jìn)行一次恢復(fù)演練;三級(jí)業(yè)務(wù)系統(tǒng),沒半年進(jìn)行一次恢復(fù)演練。普通的文件類數(shù)據(jù)的驗(yàn)證比較簡(jiǎn)單,在災(zāi)備中心的服務(wù)器上安裝NBU的客戶端,直接將復(fù)制過去的數(shù)據(jù)恢復(fù)到遠(yuǎn)程的客戶端上即可。數(shù)據(jù)庫(kù)的恢復(fù)略微復(fù)雜,需要在遠(yuǎn)程的服務(wù)器上部署與生產(chǎn)中心相同的數(shù)據(jù)庫(kù)系統(tǒng),建立相同的數(shù)據(jù)庫(kù)結(jié)構(gòu)和參數(shù),可手工配置,也可以利用NBU的BMR功能做異機(jī)恢復(fù),然后再利用NBU的數(shù)據(jù)庫(kù)代理恢復(fù)數(shù)據(jù)庫(kù)數(shù)據(jù),并將數(shù)據(jù)庫(kù)Mount進(jìn)行讀寫驗(yàn)證。另外,針對(duì)Oracle數(shù)據(jù)庫(kù),可以利用NBU獨(dú)有的Oracle克隆功能進(jìn)行驗(yàn)證。Orac

34、le克隆功能能通過向?qū)綀D形界面將Oracle恢復(fù)到其他目錄或其他服務(wù)器,用于測(cè)試等目的,極大地降低了數(shù)據(jù)庫(kù)管理員的工作難度,參見下圖。這個(gè)功能要配合生產(chǎn)中心的OpsCenter監(jiān)控平臺(tái)來實(shí)現(xiàn)。20/614.2.4災(zāi)備系統(tǒng)的統(tǒng)一監(jiān)控和管理對(duì)于XX集團(tuán)來說,可通過NBUOpsCenter平臺(tái)來統(tǒng)一監(jiān)控和管理生產(chǎn)機(jī)房和災(zāi)備機(jī)房的2個(gè)NBU5220備份域。OpsCenter是一個(gè)基于Web的管理平臺(tái),可以安裝在1臺(tái)Windows服務(wù)器上,部署在生產(chǎn)機(jī)房,對(duì)整個(gè)災(zāi)備系統(tǒng)進(jìn)行集中的管理和監(jiān)控,如下圖所示:21/61OpsCenter提供了全面的功能:監(jiān)控和報(bào)告的內(nèi)容:-備份作業(yè)運(yùn)行情況-備份成功率-備份

35、數(shù)據(jù)量大小-備份策略設(shè)置情況-備份介質(zhì)使用情況-備份設(shè)備(驅(qū)動(dòng)器)狀態(tài)-備份成功率-備份客戶端的配置搜索、保留和恢復(fù):22/61基于保管人、用戶組、日期、文件位置和文件類型創(chuàng)建查詢條件跨備份域聯(lián)合搜索擴(kuò)大搜索范圍搜出的文件可以立即永久保留用于法規(guī)遵從或訴訟能夠恢復(fù)到不同位置用于:異機(jī)測(cè)試、災(zāi)難恢復(fù)演習(xí)OpsCenter基本功能為免費(fèi)的。在OpsCenter的基礎(chǔ)上僅需要一個(gè)License授權(quán)即可升級(jí)到OpsCenterAnalytics。OpsCenterAnalytics屬于NetBackup平臺(tái)的一部分,可以提供高級(jí)備份報(bào)告,以驗(yàn)證公司的關(guān)鍵任務(wù)數(shù)據(jù)庫(kù)受到保護(hù),以及RTO(恢復(fù)時(shí)間目標(biāo))和

36、RPO(恢復(fù)點(diǎn)目標(biāo))要求可以得到滿足。另外還幫助備份管理員深入了解數(shù)據(jù)保護(hù)基礎(chǔ)架構(gòu),為備份操作進(jìn)行有效的業(yè)務(wù)計(jì)劃。OpsCenter可以為XX集團(tuán)帶來如下價(jià)值:對(duì)多個(gè)備份域的備份和恢復(fù)進(jìn)行報(bào)告對(duì)生產(chǎn)系統(tǒng)和災(zāi)備系統(tǒng)的NetBackup備份和恢復(fù)環(huán)境進(jìn)行集中統(tǒng)一的報(bào)告,每天針對(duì)所有的客戶端的情況生成報(bào)告準(zhǔn)確評(píng)估備份成功率和可恢復(fù)能力提供了全面的成功率報(bào)告,可有效評(píng)估關(guān)鍵業(yè)務(wù)數(shù)據(jù)和應(yīng)用程序的可恢復(fù)能力長(zhǎng)期保留數(shù)據(jù)以供趨勢(shì)研究和分析之用可通過隨時(shí)了解增長(zhǎng)率更好地預(yù)測(cè)備份和歸檔存儲(chǔ)的消耗情況。無論XX集團(tuán)是需要逐年分析趨勢(shì),還是分析很早以前的趨勢(shì),都可以使用OpsCenterAnalytics在可配置的

37、時(shí)間范圍內(nèi)保留的數(shù)據(jù)來實(shí)現(xiàn)4.2.5方案一的優(yōu)勢(shì)方案一通過備份軟件實(shí)現(xiàn)備份數(shù)據(jù)的遠(yuǎn)程容災(zāi)是數(shù)據(jù)級(jí)容災(zāi)系統(tǒng)最基礎(chǔ)的組成部分,也是最簡(jiǎn)單和有效的方式。這種方式有以下一些明顯優(yōu)點(diǎn):1.對(duì)容災(zāi)鏈路的要求不高,省去了高昂的鏈路租用費(fèi)用(容災(zāi)鏈路的投資占到容災(zāi)基23/61礎(chǔ)設(shè)施投資的50%以上,而且需要持續(xù)的投資)。2.完全支持基于IP網(wǎng)絡(luò)的復(fù)制,不局限于FC網(wǎng)絡(luò),降低了對(duì)FC轉(zhuǎn)IP設(shè)備的需求。3.在容災(zāi)中心無需昂貴的存儲(chǔ)和網(wǎng)絡(luò)設(shè)備,只需要普通的備份管理服務(wù)器和備份設(shè)備即可,如果不需要遠(yuǎn)程應(yīng)用接管,連應(yīng)用服務(wù)器也可以省掉。4.對(duì)現(xiàn)有的應(yīng)用系統(tǒng)的沒有影響,復(fù)制過程完全基于備份后的數(shù)據(jù),不需要對(duì)本地應(yīng)用系統(tǒng)進(jìn)

38、行大規(guī)模的改造。5.最重要的是管理和配置簡(jiǎn)單,在容災(zāi)中心可以無人值守或只派駐少量的管理人員。4.3第二步:同城災(zāi)備建議方案二(StorageFoundationVVR遠(yuǎn)程復(fù)制)4.3.1方案二的詳細(xì)設(shè)計(jì)方案二與方案一并不是完全替代的關(guān)系,而是在方案一的基礎(chǔ)上利用SymantecStorageFoundationVVR軟件來對(duì)關(guān)鍵的數(shù)據(jù)庫(kù)系統(tǒng)和應(yīng)用系統(tǒng)實(shí)現(xiàn)更高RPO和RTO要求的災(zāi)難備份。關(guān)鍵服務(wù)器暫定為2臺(tái)Unix小機(jī)和10臺(tái)應(yīng)用服務(wù)器(5個(gè)應(yīng)用+5個(gè)數(shù)據(jù)庫(kù)),數(shù)量可根據(jù)需求進(jìn)一步調(diào)整。其余服務(wù)器上的數(shù)據(jù)建議任然采用方案一NetBackup的遠(yuǎn)程備份來實(shí)現(xiàn)數(shù)據(jù)級(jí)的災(zāi)備。利用StorageFou

39、ndationVVR軟件來實(shí)現(xiàn)災(zāi)備可達(dá)到國(guó)標(biāo)第5級(jí)的容災(zāi)目標(biāo)。國(guó)標(biāo)第5級(jí)的具體要求如下:第5級(jí):實(shí)時(shí)數(shù)據(jù)傳輸及完整設(shè)備支持A.5.1要素?cái)?shù)據(jù)備份系統(tǒng)要求a)完全數(shù)據(jù)備份至少每天一次;b)備份介質(zhì)場(chǎng)外存放;c)采用遠(yuǎn)程數(shù)據(jù)復(fù)制技術(shù),并利用通信網(wǎng)絡(luò)將關(guān)鍵數(shù)據(jù)實(shí)時(shí)復(fù)制到備份場(chǎng)地。24/61A.5.2A.5.3備用數(shù)據(jù)處理系統(tǒng)備用網(wǎng)絡(luò)系統(tǒng)a)配備災(zāi)難恢復(fù)所需的全部數(shù)據(jù)處理設(shè)備,并處于就緒或運(yùn)行狀態(tài)。a)配備災(zāi)難恢復(fù)所需的通信線路;b)配備災(zāi)難恢復(fù)所需的網(wǎng)絡(luò)設(shè)備,并處于就緒狀態(tài);c)具備通信網(wǎng)絡(luò)自動(dòng)或集中切換能力。A.5.4備用基礎(chǔ)設(shè)施A.5.5技術(shù)支持A.5.6運(yùn)行維護(hù)支持A.5.7災(zāi)難恢復(fù)預(yù)案a)有

40、符合介質(zhì)存放條件的備用場(chǎng)地;b)有符合備用數(shù)據(jù)處理系統(tǒng)和備用網(wǎng)絡(luò)設(shè)備運(yùn)行要求的場(chǎng)地;c)有滿足關(guān)鍵業(yè)務(wù)功能恢復(fù)運(yùn)作要求的場(chǎng)地;d)以上場(chǎng)地應(yīng)保持7*24運(yùn)作。在備用場(chǎng)地有:a)7*24專職計(jì)算機(jī)機(jī)房管理人員;b)7*24專職數(shù)據(jù)備份技術(shù)支持人員;c)7*24專職硬件、網(wǎng)絡(luò)技術(shù)支持人員。a)有介質(zhì)存取、驗(yàn)證和轉(zhuǎn)儲(chǔ)管理制度;b)按介質(zhì)特性對(duì)備份數(shù)據(jù)進(jìn)行定期的有效性驗(yàn)證;c)有備用計(jì)算機(jī)機(jī)房運(yùn)行管理制度;d)有硬件和網(wǎng)絡(luò)運(yùn)行管理制度;e)有實(shí)時(shí)數(shù)據(jù)備份系統(tǒng)運(yùn)行管理制度。有相應(yīng)的經(jīng)過完整測(cè)試和演練的災(zāi)難恢復(fù)預(yù)案。具體實(shí)現(xiàn)的拓?fù)浼軜?gòu)如下圖所示:25/61利用StorageFoundationVVR軟件來

41、實(shí)現(xiàn)災(zāi)備,從技術(shù)本身來說并不復(fù)雜,以Unix數(shù)據(jù)庫(kù)服務(wù)器為例,簡(jiǎn)單描述下實(shí)現(xiàn)的過程:(1)先配置本地的雙機(jī)集群:在本地的2臺(tái)Unix小機(jī)上安裝StorageFoundationHA/DR軟件(包括VVR模塊),由于這兩臺(tái)小機(jī)上都有分區(qū),因此需要在每個(gè)分區(qū)上分別安裝和配置。并利用StorageFoundation管理存儲(chǔ)設(shè)備上的數(shù)據(jù)卷,然后在2臺(tái)小機(jī)上利用StorageFoundation的HA模塊配置雙機(jī)集群關(guān)系。本地可使用單存儲(chǔ)設(shè)備,也可以再增加一臺(tái)同檔次的存儲(chǔ)設(shè)備實(shí)現(xiàn)存儲(chǔ)的鏡像,StorageFoundation本身就提供這樣的功能,新增的存儲(chǔ)設(shè)備無需與原設(shè)備同品牌同型號(hào)。詳見4.3.4節(jié)

42、配置完成后,原有的AIX雙機(jī)軟件和卷管理功能由StorageFoundationHA/DR來替代。(2)配置遠(yuǎn)程的服務(wù)器26/61在遠(yuǎn)程的小機(jī)上設(shè)置分區(qū),安裝相應(yīng)的數(shù)據(jù)庫(kù)和應(yīng)用軟件,然后在每個(gè)分區(qū)安裝StorageFoundationHA/DR軟件(包括VVR模塊),由于遠(yuǎn)程只有1臺(tái)服務(wù)器,可設(shè)置成單節(jié)點(diǎn)集群模式,其他步驟與步驟一相同。(3)配置遠(yuǎn)程復(fù)制關(guān)系將本地的數(shù)據(jù)卷與遠(yuǎn)程的卷通過VVR配置成復(fù)制關(guān)系,復(fù)制時(shí)間間隔取決于數(shù)據(jù)的變化量,由于XX的數(shù)據(jù)變化量不大,基本可以控制在30分鐘以內(nèi)。(4)應(yīng)用級(jí)災(zāi)備切換如果需要實(shí)現(xiàn)應(yīng)用的切換,首先需要災(zāi)備中心的網(wǎng)絡(luò)情況滿足遠(yuǎn)程訪問的要求(如DNS轉(zhuǎn)換等

43、),在此基礎(chǔ)上可以通過StorageFoundation的GCO模塊將本地的服務(wù)器集群和遠(yuǎn)程的單節(jié)點(diǎn)集群統(tǒng)一管理,并可以實(shí)現(xiàn)一鍵式的故障切換。詳見4.3.5節(jié)Windows服務(wù)器的配置與Unix基本相同,StorageFoundationVVR并不要求卷必須位于SAN存儲(chǔ)上,VVR也支持復(fù)制服務(wù)器內(nèi)置硬盤卷,對(duì)于XX來說,這樣更方便不同架構(gòu)的災(zāi)備的實(shí)現(xiàn)。另外,關(guān)于災(zāi)備鏈路的帶寬問題,根據(jù)目前XX總的數(shù)據(jù)量和每日數(shù)據(jù)增量的情況,初步推薦50Mb專網(wǎng)(這個(gè)帶寬需要進(jìn)一步計(jì)算和討論)。由于VVR直接支持基于IP的復(fù)制,因此,災(zāi)備鏈路和內(nèi)網(wǎng)的連接直接通過IP網(wǎng)絡(luò)設(shè)備連接即可,無需連接SAN網(wǎng)絡(luò),網(wǎng)絡(luò)架

44、構(gòu)更加簡(jiǎn)單,投資成本也更少。,50Mb帶寬每分鐘可以傳輸?shù)臄?shù)據(jù)量為50/8*0.8*60=300MB30分鐘傳輸?shù)目偭繛?.8G,如果XX在峰值情況下的30分鐘I/O不超過8.8G,50Mb的帶寬即可以滿足災(zāi)備要求。如果災(zāi)備鏈路不是專用的,還有應(yīng)用數(shù)據(jù)需要傳輸,則鏈路帶寬還需要進(jìn)一步的測(cè)算和調(diào)整。Symantec提供一個(gè)免費(fèi)的圖形化工具VRAdvisor用于測(cè)算災(zāi)備鏈路帶寬。VRAdvisor是27/61一個(gè)智能化網(wǎng)絡(luò)帶寬測(cè)算工具,通過定時(shí)采集運(yùn)行系統(tǒng)數(shù)據(jù)I/O訪問的數(shù)值,測(cè)算出VVR需要的網(wǎng)絡(luò)帶寬。VRAdvisor的現(xiàn)場(chǎng)測(cè)算結(jié)果可作為網(wǎng)絡(luò)帶寬設(shè)計(jì)的依據(jù)。方案二在方案一的基礎(chǔ)上所增加的軟硬件

45、模塊列表如下:所需硬件:名稱主要描述數(shù)量IBM小型機(jī)用于災(zāi)備中心,可比P570配置略低,支持分區(qū)技術(shù)作為生產(chǎn)機(jī)房Windows服務(wù)器的災(zāi)備機(jī),可將15PC服務(wù)器每個(gè)業(yè)務(wù)和對(duì)應(yīng)的數(shù)據(jù)庫(kù)安裝在1臺(tái)災(zāi)備服務(wù)器上,暫定5個(gè)業(yè)務(wù)需要復(fù)制級(jí)災(zāi)備,服務(wù)器可利舊8口FC交換機(jī),用于災(zāi)備機(jī)房,如果災(zāi)備存儲(chǔ)直FC交換機(jī)接連接服務(wù)器,則不需要配置FC交換機(jī)用于存放災(zāi)備數(shù)據(jù),可比生產(chǎn)機(jī)房的DS5000存災(zāi)備磁盤陣列儲(chǔ)配置略低用于本地存儲(chǔ)鏡像,可配置1臺(tái)容量相當(dāng)、性能鏡像磁盤陣列(可選)111相仿的磁盤者陣列,無需同一品牌同一型號(hào)所需軟件:StorageFoundationHA/DR+VVR復(fù)制模塊StorageFou

46、ndationUnix版本,生產(chǎn)中心2套,災(zāi)備中心1套3HA/DRVVR復(fù)制模塊StorageFoundationHA/DRUnix版本,生產(chǎn)中心2套,災(zāi)備中心1套Windows版本,生產(chǎn)中心10套,災(zāi)備中心5套31528/61Windows版本,生產(chǎn)中心10套,災(zāi)備中心5VVR復(fù)制模塊15套4.3.2VVR的實(shí)現(xiàn)原理和特點(diǎn)VVR的數(shù)據(jù)復(fù)制是基于卷(Volume)的,以卷為單位進(jìn)行復(fù)制,復(fù)制的數(shù)據(jù)可以是數(shù)據(jù)庫(kù)中的數(shù)據(jù)(文件方式或裸設(shè)備方式)和文件,整個(gè)復(fù)制是一種同步和異步自適應(yīng)的方式。具體的實(shí)現(xiàn)原理如下:1)首先為每個(gè)業(yè)務(wù)系統(tǒng)中需要進(jìn)行遠(yuǎn)程復(fù)制的多個(gè)卷(有時(shí)只有1個(gè)卷)定義為一個(gè)Replica

47、tedVolumeGroup(簡(jiǎn)稱RVG)。2)在生產(chǎn)站點(diǎn)(SiteA)定義一條復(fù)制鏈路(RLINK)指向?yàn)?zāi)備站點(diǎn)(SiteB)。RLINK是單向的,如果需要雙向復(fù)制,需要各定義一個(gè)指向?qū)Ψ降腞LINK。每個(gè)RVG定義一個(gè)RLINK。3)在生產(chǎn)服務(wù)器上設(shè)置SRL卷,SRL卷的大小需要詳細(xì)的調(diào)研和設(shè)計(jì)。29/61StorageReplicatorLog(簡(jiǎn)稱SRL)是VVR中的重要部件。需要復(fù)制的數(shù)據(jù)首先要寫入SRL,然后傳到異地。VVR通過SRL保證數(shù)據(jù)復(fù)制嚴(yán)格按照寫順序進(jìn)行,這在異步工作方式下非常重要。當(dāng)網(wǎng)絡(luò)中斷或異地系統(tǒng)出現(xiàn)故障時(shí),本地?cái)?shù)據(jù)將記錄在SRL中,等系統(tǒng)恢復(fù)正常時(shí)再將SRL中的數(shù)

48、據(jù)按照先進(jìn)先出的順序傳送到異地。由于SRL是順序?qū)懘疟P塊,因此性能很高。SRL可以動(dòng)態(tài)擴(kuò)展,因此溢出的機(jī)會(huì)不多。4)一旦發(fā)生SRL溢出,VVR將通過DataChangMap(簡(jiǎn)稱DCM)記錄變化過的數(shù)據(jù)塊的塊號(hào)。DCM與主節(jié)點(diǎn)的RVG相關(guān),它其中的內(nèi)容是位圖信息,記錄某一時(shí)間點(diǎn)后修改過的數(shù)據(jù)塊位置。DCM在正常情況下不使用,在SRL滿后記錄變化的數(shù)據(jù)塊的塊號(hào),當(dāng)恢復(fù)正常復(fù)制后,等SRL中的數(shù)據(jù)傳送完后,將DCM中記錄的塊傳送到異地。災(zāi)難恢復(fù)后的反向復(fù)制也用到DCM。5)數(shù)據(jù)復(fù)制的工作模式缺省為同步/異步自適應(yīng),即在網(wǎng)絡(luò)延時(shí)情況較好、數(shù)據(jù)能夠及時(shí)復(fù)制時(shí),工作在同步方式,完全保證兩邊數(shù)據(jù)的一致性;

49、當(dāng)網(wǎng)絡(luò)延時(shí)情況較差、數(shù)據(jù)不能及時(shí)復(fù)制時(shí),工作在異步方式下,保證主節(jié)點(diǎn)的I/O性能。數(shù)據(jù)復(fù)制根據(jù)實(shí)際情況,自行在兩種工作模式之間切換。如果數(shù)據(jù)復(fù)制的線路帶寬有限,出于保證本地服務(wù)器讀寫性能的考慮,可以將復(fù)制工作模式定義為異步。由于VVR的數(shù)據(jù)復(fù)制嚴(yán)格按照I/O的修改順序進(jìn)行,所以,無論在同步還是異步工作方式下,都能保證數(shù)據(jù)的完整性。對(duì)于數(shù)據(jù)庫(kù)系統(tǒng),該復(fù)制機(jī)制能夠保證災(zāi)備節(jié)點(diǎn)的數(shù)據(jù)庫(kù)在災(zāi)難發(fā)生時(shí)正常啟動(dòng)并提供服務(wù)。6)第一次災(zāi)備時(shí),兩邊的數(shù)據(jù)需要完全同步,之后,由于VVR僅將Volume上每次I/O的實(shí)際數(shù)據(jù)實(shí)時(shí)復(fù)制到遠(yuǎn)程節(jié)點(diǎn),所以在網(wǎng)絡(luò)線路上傳輸?shù)臄?shù)據(jù)量很少,對(duì)帶寬的需求也很小。30/617)當(dāng)

50、某些嚴(yán)重意外情況發(fā)生后,后備節(jié)點(diǎn)會(huì)變成新的主節(jié)點(diǎn),稱為角色轉(zhuǎn)換。在災(zāi)難期間,不進(jìn)行數(shù)據(jù)復(fù)制,新的主節(jié)點(diǎn)用DCM記錄變化數(shù)據(jù)位置。8)當(dāng)原來的主節(jié)點(diǎn)在災(zāi)難后恢復(fù)正常,需要進(jìn)行數(shù)據(jù)反向同步和角色轉(zhuǎn)換。反向同步有兩種情況,一種是在災(zāi)難發(fā)生時(shí)刻,原主節(jié)點(diǎn)與災(zāi)備節(jié)點(diǎn)的數(shù)據(jù)是同步的(即無未復(fù)制的數(shù)據(jù));第二種是在災(zāi)難發(fā)生時(shí)刻,原主節(jié)點(diǎn)與災(zāi)備節(jié)點(diǎn)的數(shù)據(jù)不是完全同步的(即主節(jié)點(diǎn)有數(shù)據(jù)尚未復(fù)制到災(zāi)備節(jié)點(diǎn))。第二種情況在反向同步開始時(shí)第一步首先要進(jìn)行重置,指將原主節(jié)點(diǎn)SRL和DCM中數(shù)據(jù)(這些數(shù)據(jù)在災(zāi)難發(fā)生時(shí)尚未來得及傳送)的位置信息修改當(dāng)前主節(jié)點(diǎn)(即原后備節(jié)點(diǎn))的DCM。然后,將DCM中指向的數(shù)據(jù)全部傳送到原主

51、節(jié)點(diǎn)。而第一種情況的話,直接進(jìn)行第二步工作。傳送完成后,將當(dāng)前主節(jié)點(diǎn)的數(shù)據(jù)庫(kù)和應(yīng)用停止,將雙方角色復(fù)原,并在原主節(jié)點(diǎn)提供正常服務(wù)。9)無重大災(zāi)難情況下應(yīng)用切換到備節(jié)點(diǎn)時(shí),主節(jié)點(diǎn)SRL數(shù)據(jù)需要完全同步到遠(yuǎn)程才發(fā)生切換,且角色轉(zhuǎn)換后會(huì)立即進(jìn)行反向復(fù)制。10)災(zāi)備數(shù)據(jù)的脫機(jī)處理。通過使用VVR的In-BandControl(IBC)消息、Snapshot、以及FastResync(簡(jiǎn)稱FR,即快速同步)功能,可以實(shí)現(xiàn)遠(yuǎn)程數(shù)據(jù)的脫機(jī)處理,用于測(cè)試或驗(yàn)證等操作。11)雙重確認(rèn)機(jī)制保證數(shù)據(jù)的一致性。災(zāi)備節(jié)點(diǎn)對(duì)復(fù)制數(shù)據(jù)的接收確認(rèn)有兩個(gè)階段。第一個(gè)確認(rèn)當(dāng)后備節(jié)點(diǎn)收到數(shù)據(jù)后發(fā)出;第二個(gè)確認(rèn)當(dāng)后備節(jié)點(diǎn)數(shù)據(jù)成功寫入

52、硬盤后發(fā)出。當(dāng)主節(jié)點(diǎn)收到第二個(gè)確認(rèn)后,將SRL中的相應(yīng)數(shù)據(jù)清空。4.3.3網(wǎng)絡(luò)故障條件下的復(fù)制模式切換需要首先說明的是,如果選擇兩條不同的網(wǎng)絡(luò)線路供應(yīng)商提供的線路,或同一供應(yīng)商的不同線路來進(jìn)行復(fù)制,那么網(wǎng)絡(luò)故障的幾率就會(huì)下降到極低,可認(rèn)為復(fù)制停止的事件不會(huì)發(fā)31/61生。就對(duì)網(wǎng)絡(luò)連接的中斷容忍度而言,VVR的功能非常強(qiáng)大。在VVR看來,災(zāi)備系統(tǒng)中斷與災(zāi)備系統(tǒng)的網(wǎng)絡(luò)中斷是等價(jià)的。但如果失去了與災(zāi)備系統(tǒng)的聯(lián)系,則會(huì)自動(dòng)轉(zhuǎn)為異步模式,并開始對(duì)SRL進(jìn)行后臺(tái)寫入。這允許主應(yīng)用系統(tǒng)繼續(xù)運(yùn)行并為用戶提供服務(wù),同時(shí)恢復(fù)備份能力。當(dāng)災(zāi)備系統(tǒng)修復(fù)或者網(wǎng)絡(luò)問題得到解決后,系統(tǒng)會(huì)將SRL中的更新信息導(dǎo)出到災(zāi)備系統(tǒng)。

53、VVR容忍長(zhǎng)期中斷的能力完全由SRL的大小來控制。而能以多快的速度恢復(fù),則取決于Rlink通道的帶寬。例如,如果用戶遭遇了為期3天的中斷,并且這期間寫入了30GB的數(shù)據(jù),則SRL必須能容納這30GB的數(shù)據(jù)以及它要導(dǎo)出的其它數(shù)據(jù)。能以多快的速度將這30GB的數(shù)據(jù)轉(zhuǎn)移到災(zāi)備系統(tǒng),將由復(fù)制鏈路的網(wǎng)絡(luò)帶寬來限定。需要強(qiáng)調(diào)的是,在使用SRL進(jìn)行異步操作的過程中,VVR可以完全保證災(zāi)備中心數(shù)據(jù)的一致性。此技術(shù)通過OSCP的認(rèn)證。4.3.4本地存儲(chǔ)系統(tǒng)的加固(可選)(由于StorageFoundation支持磁盤鏡像功能,因此,如果條件允許的話需要增加1臺(tái)同,檔次的磁盤陣列)XX可以先在本地實(shí)現(xiàn)雙機(jī)雙柜,再

54、利用VVR把數(shù)據(jù)復(fù)制到遠(yuǎn)程災(zāi)備機(jī)房。這樣,一旦本地的磁盤陣列發(fā)生故障,可快速切換到鏡像存儲(chǔ)上,不用直接切換到遠(yuǎn)程災(zāi)備系統(tǒng)。畢竟現(xiàn)在磁盤陣列發(fā)生故障的事情還是經(jīng)常有的,一旦磁盤陣列發(fā)生故障,與之相連的所有服務(wù)器的業(yè)務(wù)都會(huì)重點(diǎn),影響面比較大。32/61兩臺(tái)存儲(chǔ)設(shè)備之間建立一個(gè)跨存儲(chǔ)設(shè)備的鏡像卷,服務(wù)器對(duì)該鏡像卷進(jìn)行數(shù)據(jù)讀寫操作。由于鏡像卷跨兩個(gè)存儲(chǔ)設(shè)備,因此一臺(tái)存儲(chǔ)設(shè)備發(fā)生整體故障,鏡像卷不會(huì)失效,也不會(huì)影響服務(wù)器端業(yè)務(wù)的正常進(jìn)行。StorageFoundation存儲(chǔ)鏡像技術(shù)具備以下明顯優(yōu)勢(shì):零停機(jī)、零切換:基于鏡像的原理,鏡像中的任何一個(gè)磁盤陣列出現(xiàn)問題停頓時(shí),都不會(huì)導(dǎo)致應(yīng)用中斷。從而使容災(zāi)的

55、效果能夠達(dá)到無縫的數(shù)據(jù)高可用性,對(duì)業(yè)務(wù)系統(tǒng)的高可用性提供了保障。當(dāng)然沒有停機(jī),也就沒有切換操作,也就不會(huì)造成切換帶來的一系列麻煩。成熟性:鏡像技術(shù)是從磁盤容錯(cuò)技術(shù)中最成熟、歷史最悠久、可靠性最高的數(shù)據(jù)保護(hù)技術(shù)。簡(jiǎn)單性:鏡像技術(shù)是實(shí)現(xiàn)最為簡(jiǎn)單的數(shù)據(jù)容錯(cuò)技術(shù)。33/61異構(gòu)性:鏡像技術(shù)不僅可以在磁盤陣列內(nèi)部實(shí)現(xiàn),也可以跨越不同磁盤系統(tǒng)來實(shí)現(xiàn),鏡像技術(shù)完全不依賴于磁盤系統(tǒng)的品牌和型號(hào)。所以,利用鏡像技術(shù)實(shí)現(xiàn)容災(zāi),我們就可以保留在任何時(shí)候自由、靈活的選擇磁盤系統(tǒng)的權(quán)利。4.3.5應(yīng)用級(jí)容災(zāi)初步探討從StorageFoundationHA/DR軟件的角度來說實(shí)現(xiàn)應(yīng)用級(jí)容災(zāi)并不復(fù)雜,但從XX的角度來說,在

56、利用StorageFoundationHA/DR做應(yīng)用級(jí)容災(zāi)之前需要做大量的前期準(zhǔn)備工作,包括應(yīng)用系統(tǒng)梳理和整合、網(wǎng)絡(luò)環(huán)境的改造以及災(zāi)備管理人員和技術(shù)的儲(chǔ)備等,這部分的難度和挑戰(zhàn)會(huì)比較大。因此,應(yīng)用級(jí)容災(zāi)可能不會(huì)在本次項(xiàng)目中實(shí)施。可以等數(shù)據(jù)容災(zāi)工作完成后,未來?xiàng)l件成熟時(shí)再考慮。StorageFoundationHA/DR軟件本身具備應(yīng)用級(jí)容災(zāi)的功能,可以在數(shù)據(jù)容災(zāi)的基礎(chǔ)上無縫擴(kuò)展到應(yīng)用級(jí)容災(zāi)。本節(jié)就對(duì)這部分內(nèi)容做一個(gè)初步的描述。StorageFoundationHA/DR應(yīng)用級(jí)容災(zāi)的核心軟件模塊為VCS和GCO,其中VCS用于管理監(jiān)控本地集群,GCO用于管理集群之間的切換。在數(shù)據(jù)級(jí)容災(zāi)方案中,

57、我們已經(jīng)使用了VCS做本地集群管理,保證本地業(yè)務(wù)系統(tǒng)的軟硬件高可用性。VCS以其出色的可靠性和易管理性聞名,支持多達(dá)32個(gè)節(jié)點(diǎn)的集群,其可以實(shí)現(xiàn)以下功能:負(fù)責(zé)監(jiān)控和管理硬件系統(tǒng)和操作系統(tǒng),當(dāng)出現(xiàn)故障時(shí)進(jìn)行快速切換。通過代理(Agent)監(jiān)控和管理數(shù)據(jù)庫(kù)和其他應(yīng)用系統(tǒng),當(dāng)出現(xiàn)故障時(shí)進(jìn)行快速切換。通過API或腳本編寫針對(duì)性客戶化應(yīng)用代理,監(jiān)控和管理應(yīng)用系統(tǒng),當(dāng)出現(xiàn)故障時(shí)進(jìn)行快速切換。34/61支持單節(jié)點(diǎn)、N+1、N+N、N+M等不同集群模式??膳c復(fù)制軟件配合(如VVR)實(shí)現(xiàn)遠(yuǎn)程的集群。支持容災(zāi)演練功能,可有效驗(yàn)證災(zāi)備系統(tǒng)的可恢復(fù)性。sGlobalClusterOption(簡(jiǎn)稱GCO)可以稱為Cl

58、usterCluster(集群的集群)。它負(fù)責(zé)對(duì)多個(gè)不同地點(diǎn)的多個(gè)集群系統(tǒng)進(jìn)行監(jiān)控和管理,在發(fā)生嚴(yán)重災(zāi)難時(shí),進(jìn)行site的切換(即應(yīng)用的遠(yuǎn)程切換)。我們以A和B來分別表示主中心和災(zāi)備中心來簡(jiǎn)單描述GCO控制切換的流程:I.正常情況下:1)業(yè)務(wù)系統(tǒng)運(yùn)行在地點(diǎn)A,包括數(shù)據(jù)庫(kù)實(shí)例、有關(guān)的文件、數(shù)據(jù)庫(kù)數(shù)據(jù)、應(yīng)用軟件。A節(jié)點(diǎn)對(duì)外提供服務(wù)。2)A節(jié)點(diǎn)所有的有關(guān)的數(shù)據(jù)通過VVR實(shí)時(shí)復(fù)制到B節(jié)點(diǎn)。3)兩地的VCS對(duì)的各自節(jié)點(diǎn)內(nèi)的兩臺(tái)服務(wù)器的主機(jī)情況、數(shù)據(jù)庫(kù)服務(wù)、應(yīng)用軟35/61件進(jìn)行實(shí)時(shí)監(jiān)控和管理,其中,VCS還對(duì)VVR數(shù)據(jù)復(fù)制服務(wù)進(jìn)行監(jiān)控。4)GCO監(jiān)控兩地Cluster系統(tǒng)的運(yùn)行。II.當(dāng)A地點(diǎn)的主服務(wù)器

59、發(fā)生硬件或軟件故障,導(dǎo)致主服務(wù)器無法提供正常服務(wù):1)VCS進(jìn)行本地切換,將主服務(wù)器的數(shù)據(jù)庫(kù)服務(wù)、應(yīng)用軟件、VVR數(shù)據(jù)復(fù)制服務(wù)切換到本地后備節(jié)點(diǎn)。2)整個(gè)系統(tǒng)運(yùn)行在本地后備節(jié)點(diǎn),包括VVR數(shù)據(jù)復(fù)制服務(wù),由后備服務(wù)器提供對(duì)外服務(wù)和數(shù)據(jù)復(fù)制服務(wù)。3)GCO將監(jiān)控到該切換事件的發(fā)生。4)如果僅僅是主服務(wù)器數(shù)據(jù)復(fù)制服務(wù)發(fā)生故障,可以不進(jìn)行切換,只需將復(fù)制服務(wù)修復(fù)并正常運(yùn)行。III.如果A地點(diǎn)的主服務(wù)器恢復(fù)正常,整個(gè)系統(tǒng)將重新運(yùn)行在正常情況下。IV.如果在情況二的狀態(tài)下,A地點(diǎn)的后備服務(wù)器也發(fā)生硬件或軟件故障,整個(gè)A地點(diǎn)無法正常提供服務(wù):1)GCO將監(jiān)控到該嚴(yán)重災(zāi)難的發(fā)生,將對(duì)接收到的SiteAdown

60、事件進(jìn)行處理:發(fā)出嚴(yán)重告警,并在管理界面上彈出服務(wù)災(zāi)難性切換(及服務(wù)切換到遠(yuǎn)程地點(diǎn))等待確認(rèn)畫面。2)在有關(guān)人員確認(rèn)后,在GCO切換等待確認(rèn)畫面上按確認(rèn)按鈕,將進(jìn)行地點(diǎn)間的容災(zāi)切換。3)A地點(diǎn)的業(yè)務(wù)將在B地點(diǎn)正常提供服務(wù)。4)數(shù)據(jù)復(fù)制暫停。5)SiteB的VVR將從Secondary變成NewPrimary,使用DCM記錄所有變化的數(shù)據(jù)塊。36/61V.如果A、B地點(diǎn)間網(wǎng)絡(luò)發(fā)生故障:1)VVR心跳檢測(cè)將發(fā)現(xiàn)該故障,A地點(diǎn)VVR將根據(jù)事先的配置進(jìn)行處理。我們的建議是VVR將網(wǎng)絡(luò)故障期間所有數(shù)據(jù)的更改記錄在SRL。2)如果在一段較長(zhǎng)時(shí)間內(nèi),網(wǎng)絡(luò)故障無法恢復(fù)。當(dāng)VVR的SRL卷接近滿時(shí),VVR將使用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論