異地數(shù)據(jù)備份方案樣本_第1頁
異地數(shù)據(jù)備份方案樣本_第2頁
異地數(shù)據(jù)備份方案樣本_第3頁
異地數(shù)據(jù)備份方案樣本_第4頁
異地數(shù)據(jù)備份方案樣本_第5頁
已閱讀5頁,還剩29頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

新一篇:

VERITAS全線存儲備份容災(zāi)解決方案第一章 劫難備份背景及優(yōu)勢 31.1什么是計算機(jī)業(yè)務(wù)系統(tǒng)劫難 31.2 國外計算機(jī)業(yè)務(wù)系統(tǒng)劫難備份應(yīng)用狀況 31.3 國內(nèi)計算機(jī)系統(tǒng)劫難備份籌劃應(yīng)用狀況 41.4 建設(shè)劫難備份中心重要意義 4第二章 劫難分析 7第三章 劫難備份設(shè)計目的 83.1 劫難備份設(shè)計目的 8第四章 劫難備份設(shè)計思路及模型 94.1容災(zāi)項目開始 94.2劫難風(fēng)險分析 94.3制定恢復(fù)籌劃 94.4方案實行 94.5支持與維護(hù) 9第五章 xxxx業(yè)務(wù)系統(tǒng)劫難備份/恢復(fù)體系設(shè)計 125.1 劫難備份/恢復(fù)體系總體設(shè)計 125.2 應(yīng)用層方式容災(zāi)構(gòu)造簡介 135.3 數(shù)據(jù)庫方式容災(zāi)構(gòu)造簡介 155.4 鏡像軟件容災(zāi)方式構(gòu)造簡介 195.5 XP磁盤陣列容災(zāi)方式構(gòu)造簡介 215.5.1劫難恢復(fù)系統(tǒng)硬件,軟件配備闡明 235.5.2XPCA軟件容災(zāi)原理 245.5.3切換環(huán)節(jié) 265.5.5XP容災(zāi)方案性能分析 30第六章 劫難備份恢復(fù)流程 31第七章 培訓(xùn)測試及維護(hù) 337.1 培訓(xùn) 337.2 測試劫難備份籌劃 337.3 維護(hù) 34第八章 成功案例簡介 358.1 國外成功案例 358.2 國內(nèi)成功案例 35

第一章 劫難備份背景及優(yōu)勢1.1什么是計算機(jī)業(yè)務(wù)系統(tǒng)劫難今天,XXXX比以往任何時候都更加依賴于計算機(jī)系統(tǒng),計算機(jī)系統(tǒng)在為XXXX迅猛發(fā)展提供技術(shù)基本架構(gòu)同步,由于顧客業(yè)務(wù)解決高度集中,以及不可預(yù)見故障和劫難,導(dǎo)致整個系統(tǒng)存在諸多劫難性破壞隱患,有也許成為整體系統(tǒng)中單故障點。因而,業(yè)務(wù)拓展與劫難防范是所有顧客都必要同步注重問題。那么,什么是計算機(jī)業(yè)務(wù)系統(tǒng)劫難呢?普通定義是指采用計算機(jī)系統(tǒng)解決重要電子數(shù)據(jù)丟失至不可恢復(fù)或由此導(dǎo)致業(yè)務(wù)中斷以至于延長到不可接受時間。1.2 國外計算機(jī)業(yè)務(wù)系統(tǒng)劫難備份應(yīng)用狀況劫難備份籌劃在發(fā)達(dá)國家電信行業(yè)和金融行業(yè)得到了較早實行,現(xiàn)已較為普遍。例如在美國,因一九八五年紐約銀行計算機(jī)故障,聯(lián)邦管理部門更加強(qiáng)了在這方面監(jiān)管力度?,F(xiàn)美國計算機(jī)業(yè)務(wù)系統(tǒng)普通出于如下三方面來考慮劫難備份籌劃:重要數(shù)據(jù)保護(hù)與業(yè)務(wù)持續(xù)運營需要:在美國,各行業(yè)內(nèi)部競爭激烈;在計算機(jī)管理制度上較為完善;一旦因突發(fā)劫難而導(dǎo)致數(shù)據(jù)丟失或業(yè)務(wù)中斷,將會導(dǎo)致重大乃至致命打擊。審計規(guī)定:美國較大型公司普通會由第三家獨立審計公司來提供其資信業(yè)務(wù)、管理等方面征詢服務(wù),而世界知名六大審計公司在對公司評估項目中均包括劫難備份籌劃一項;評估公司數(shù)據(jù)在劫難等威脅破壞下數(shù)據(jù)完整性,一致性與安全性,及業(yè)務(wù)可恢復(fù)性等,有些征詢審計公司還會參加驗證所制定容災(zāi)籌劃詳細(xì)過程和其可行性。缺少劫難備份籌劃及其危害性會在評估報告中被顯示出來。法律規(guī)定:美國政府及州政府通過多項法律強(qiáng)制性規(guī)定電信、金融業(yè)等大型公司備有計算機(jī)安全及劫難備份籌劃。對于沒有遵守這項劫難備份籌劃公司,會遭受曝光及罰款等嚴(yán)重解決,同步亦也許對有關(guān)負(fù)責(zé)人采用罰款甚至監(jiān)禁等懲罰。已知劫難例子有:日本神戶大地震、美國佛羅里達(dá)州颶風(fēng)(數(shù)百家公司實行了劫難備份籌劃)、臺灣大地震等。1.3 國內(nèi)計算機(jī)系統(tǒng)劫難備份籌劃應(yīng)用狀況隨著國內(nèi)入“世”腳步越來越近,老式產(chǎn)業(yè)在進(jìn)入新市場新方式競爭中,公司電子信息架構(gòu)搭建,成為最具備戰(zhàn)略意義資源投資。作為信息架構(gòu)核心數(shù)據(jù),其安全備份和劫難恢復(fù)隨著世紀(jì)交替Y2K問題引起,逐漸引起人們思考和注重。當(dāng)代公司必要直面一種迫在眉睫問題:如何對數(shù)據(jù)進(jìn)行持續(xù)不斷地存儲,并通過有效地應(yīng)用這些信息,提高公司利潤率和競爭力。因此,在當(dāng)今公司運營電子化進(jìn)程中,存儲將與網(wǎng)絡(luò)、軟件應(yīng)用和系統(tǒng)CPU處在同等重要地位,成為決定系統(tǒng)成熟與否核心。由于存在著各種數(shù)據(jù)丟失也許,隨著人們對網(wǎng)絡(luò)系統(tǒng)依賴日益增長,從硬件到軟件對數(shù)據(jù)保護(hù)和備份的確是不容忽視環(huán)節(jié)。公司IT專家們逐漸結(jié)識到,也許導(dǎo)致數(shù)據(jù)丟失因素重要有三種:自然災(zāi)害劫難性破壞導(dǎo)致數(shù)據(jù)永久丟失,最佳解決方案就是異地數(shù)據(jù)備份;計算機(jī)和網(wǎng)絡(luò)系統(tǒng)硬件和軟件故障,這種損失也只有通過完整數(shù)據(jù)備份來彌補;此外,自然免不了黑客破壞以及人員操作失誤。這些事故發(fā)生都是防不勝防,唯一能把損失降到最低辦法就只有依賴具備數(shù)據(jù)備份和劫難恢復(fù)功能存儲設(shè)備。近年來國內(nèi)顧客在計算機(jī)應(yīng)用方面飛速發(fā)展,計算機(jī)系統(tǒng)基本架構(gòu)建設(shè)、特別是計算機(jī)容災(zāi)系統(tǒng)設(shè)計與建設(shè)正逐漸被顧客所注重。不言而喻,如果顧客業(yè)務(wù)系統(tǒng)有一套完備劫難備份/恢復(fù)體系,當(dāng)突發(fā)性劫難發(fā)生后,業(yè)務(wù)系統(tǒng)核心業(yè)務(wù)數(shù)據(jù)損失將減至最小。特別是隨著中華人民共和國加入WTO日益臨近和行業(yè)競爭越來越激烈,完善劫難備份/恢復(fù)體系在不遠(yuǎn)將來將是國內(nèi)公司發(fā)展可靠保障。在國內(nèi),隨著Internet逐漸普及和電子商務(wù)熱潮興起,公司需要整合越來越多數(shù)據(jù),而數(shù)據(jù)合并、管理、分享、保護(hù)都需要一種強(qiáng)大、高可靠性數(shù)據(jù)中心;同步,隨著國內(nèi)公司經(jīng)營者對公司數(shù)據(jù)信息價值和數(shù)據(jù)安全備份結(jié)識提高,存儲設(shè)備投資也正在公司信息化建設(shè)投入中占據(jù)著越來越高比重。IT行業(yè)權(quán)威人士以為,在將來一至兩年中,數(shù)據(jù)存儲系統(tǒng)要耗費所有公司計算系統(tǒng)投資70%。1.4 建設(shè)劫難備份中心重要意義隨著計算機(jī)管理技術(shù)和網(wǎng)絡(luò)技術(shù)發(fā)展,為了提高公司業(yè)務(wù)管理水平、增強(qiáng)公司市場競爭能力,越來越多公司開始使用計算機(jī)來解決內(nèi)部尋常事務(wù)和外部業(yè)務(wù)往來,從而使得這些公司越來越依賴于系統(tǒng)管理數(shù)據(jù)和業(yè)務(wù)信息。特別是在公司業(yè)務(wù)不斷增長、數(shù)據(jù)量成倍增長乃至浮現(xiàn)數(shù)據(jù)膨脹現(xiàn)象時,由此引起公司從數(shù)據(jù)膨脹、到計算機(jī)性能提高、再導(dǎo)致新一輪數(shù)據(jù)膨脹循環(huán)不斷加劇,進(jìn)而在公司中引起新數(shù)據(jù)安全恐慌,數(shù)據(jù)失效問題時有發(fā)生。建設(shè)劫難備份中心目就是在于防止某些劫難性小概率事件也許對集中式信息系統(tǒng)導(dǎo)致不可恢復(fù)原始數(shù)據(jù)丟失,這些劫難性事件也許涉及為火災(zāi),地震,電源故障及某些人為操作失誤等,如下圖所示。

當(dāng)代公司管理非常注重總體擁有成本(TCO)。所謂TCO,事實上是由實際成本、使用成本和風(fēng)險成本三項構(gòu)成。實際成本和使用成本在公司建設(shè)與生產(chǎn)中往往容易引起人們注重,因而考慮得非常周到。而風(fēng)險成本不但是公司看不見、摸不著東西,也是公司運作時很難預(yù)料和把握內(nèi)容。在使用計算機(jī)系統(tǒng)公司中,風(fēng)險成本包括用于管理關(guān)系到公司生命各項數(shù)據(jù)與信息安全、正常、可靠高速運營所需費用。因此,為將風(fēng)險成本降至最低,同步使公司長期處在最佳狀態(tài),對公司業(yè)務(wù)和計算機(jī)管理與控制系統(tǒng)數(shù)據(jù)進(jìn)行全面存儲備份是一項絕對值得、也是必要投資。咱們懂得,隨著公司計算機(jī)系統(tǒng)建設(shè)籌劃逐漸實行,XXXX尋常業(yè)務(wù)同計算機(jī)系統(tǒng)聯(lián)系越來越緊密。因而,業(yè)務(wù)主機(jī)系統(tǒng)運營浮現(xiàn)故障所帶來業(yè)務(wù)影響范疇會被迅速擴(kuò)大,而客戶對公司計算機(jī)業(yè)務(wù)系統(tǒng)持續(xù)運營,業(yè)務(wù)系統(tǒng)、顧客數(shù)據(jù)高可用性以及業(yè)務(wù)計算機(jī)系統(tǒng)抵抗突發(fā)性劫難能力規(guī)定也必然急劇提高。XXXX建設(shè)劫難備份/恢復(fù)中心有如下意義:重要業(yè)務(wù)數(shù)據(jù)在劫難發(fā)生后得以有效保護(hù)重要業(yè)務(wù)在劫難發(fā)生后可以在設(shè)定期間內(nèi)恢復(fù),從而實現(xiàn)業(yè)務(wù)持續(xù)運營業(yè)務(wù)計算機(jī)系統(tǒng)抵抗突發(fā)性劫難能力和級別提高進(jìn)一步提高XXXX名譽,增強(qiáng)客戶及潛在客戶信心擴(kuò)大對同行業(yè)競爭對手優(yōu)勢

第二章 劫難分析也許發(fā)生劫難因各都市/地區(qū)地理、氣候、社會治安、都市管理,如供水、供電、通訊條件等差別而有所不同。仔細(xì)地分析各種突發(fā)性災(zāi)害發(fā)生也許性以及由此所導(dǎo)致后果,對于制定和構(gòu)建完整和有很強(qiáng)針對性劫難備份體系是有很大協(xié)助。

下表是一張分析表樣本,可使咱們對于也許發(fā)生突發(fā)性劫難評估有較為清晰概念。

也許劫難也許性:

12345工作場合火災(zāi)

數(shù)據(jù)中心火災(zāi)

電源故障

氣候劫難(臺風(fēng),洪水等)

工業(yè)破壞

都市事件(罷工,動亂等)

硬件故障

軟件故障

設(shè)備問題(如管道漏水等)

供水故障

通訊系統(tǒng)故障

計算機(jī)故意破壞(如病毒等)

爆炸威脅

工作場合環(huán)境緊急事件(化學(xué)污染等)

第三章 劫難備份設(shè)計目的3.1 劫難備份設(shè)計目的采用何種容災(zāi)方式(邏輯數(shù)據(jù)復(fù)制/物理數(shù)據(jù)復(fù)制)實現(xiàn)劫難備份系統(tǒng)設(shè)計目的重要應(yīng)從如下四個方面來考慮:詳細(xì)數(shù)據(jù)類型與目的劫難保護(hù):從顧客業(yè)務(wù)系統(tǒng)正常運作角度分析各種核心業(yè)務(wù)數(shù)據(jù),作出重要性與可恢復(fù)性規(guī)定評估,并由此制定系統(tǒng)數(shù)據(jù)劫難保護(hù)政策。劫難發(fā)生后可恢復(fù)業(yè)務(wù)分析:對顧客各種業(yè)務(wù)與管理流程進(jìn)行分析評估,并據(jù)此制定出顧客核心業(yè)務(wù)系統(tǒng)劫難備份/恢復(fù)方略。劫難發(fā)生后可恢復(fù)分析:對于突發(fā)性劫難這樣重大事件,有時受災(zāi)地區(qū)并不茍求所有業(yè)務(wù)系統(tǒng)都可以可持續(xù)運營,故可按實際需求和比例進(jìn)行分析,并由此配備相應(yīng)容災(zāi)設(shè)備。劫難發(fā)生后業(yè)務(wù)可恢復(fù)時間指標(biāo):可以將劫難發(fā)生分為兩類,一類是可以預(yù)測詳細(xì)時間劫難,如損害性極大臺風(fēng)等;另一類是不可預(yù)測詳細(xì)時間突發(fā)性劫難,如地震、主機(jī)系統(tǒng)非籌劃性Down機(jī)等。針對兩種不同劫難類型,要設(shè)定不同業(yè)務(wù)恢復(fù)時間指標(biāo)。普通來說,對第一類劫難業(yè)務(wù)恢復(fù)時間要大大短于對第二類突發(fā)性劫難業(yè)務(wù)恢復(fù)時間.依照顧客對系統(tǒng)容災(zāi)能力不同規(guī)定以及投資方面因素,HP公司提供各種容災(zāi)解決方案,各有側(cè)重不同,咱們會從不同角度簡介容災(zāi)系統(tǒng)實現(xiàn)辦法,以及系統(tǒng)典型配備。

第四章 劫難備份設(shè)計思路及模型為了設(shè)計與實行xxxx劫難備份系統(tǒng),按照大型項目管理辦法和HP公司在項目管理方面所積累豐富經(jīng)驗,在這里將整體項目設(shè)計與實行分為五個階段:4.1容災(zāi)項目開始明確xxxx劫難備份/恢復(fù)籌劃必要性明確劫難備份籌劃負(fù)責(zé)人和實行隊伍制定項目實行時間表。4.2劫難風(fēng)險分析擬定對xxxx業(yè)務(wù)至關(guān)重要系統(tǒng)、網(wǎng)絡(luò)和顧客擬定由于自然或人為劫難對這些導(dǎo)致威脅和損失,并盡量精確為詳細(xì)損失收集各種業(yè)務(wù)和顧客對系統(tǒng)中斷時間等規(guī)定4.3制定恢復(fù)籌劃制定當(dāng)劫難發(fā)生,原業(yè)務(wù)主機(jī)系統(tǒng)或網(wǎng)絡(luò)系統(tǒng)不可用時,提供第二主機(jī)(災(zāi)備主機(jī))或網(wǎng)絡(luò)(災(zāi)備網(wǎng)絡(luò))選取方略。4.4方案實行開始實行劫難備份籌劃,如數(shù)據(jù)實時在線備份、應(yīng)用系統(tǒng)切換、記錄本地數(shù)據(jù)備份磁帶管理等。4.5支持與維護(hù)由指定人員、部門或公司提供容災(zāi)系統(tǒng)尋常支持與維護(hù)服務(wù),保證劫難備份/恢復(fù)系統(tǒng)可持續(xù),高可用運營。如下為容災(zāi)方案實行各階段框圖:項目開始劫難風(fēng)險分析方案實行支持與維護(hù)制定恢復(fù)籌劃

對于其中核心某些-第三項“制定恢復(fù)籌劃”,依照xxxx業(yè)務(wù)特點,這里分為如下幾種環(huán)節(jié):1、制定業(yè)務(wù)主機(jī)系統(tǒng)集群系統(tǒng)熱備份籌劃:涉及對服務(wù)器、操作系統(tǒng)、應(yīng)用系統(tǒng)、數(shù)據(jù)庫系統(tǒng)、重要數(shù)據(jù)等熱備份籌劃。2、制定位于生產(chǎn)地、與業(yè)務(wù)主機(jī)系統(tǒng)有關(guān)前置服務(wù)器數(shù)據(jù)熱備份籌劃:涉及對其她機(jī)型操作系統(tǒng)、數(shù)據(jù)庫系統(tǒng)、應(yīng)用系統(tǒng)、重要數(shù)據(jù)和通訊配備等熱備份籌劃。3、制定網(wǎng)絡(luò)通訊備份籌劃:對網(wǎng)絡(luò)設(shè)備、網(wǎng)絡(luò)合同、網(wǎng)絡(luò)參數(shù)設(shè)定、故障切換邏輯過程、通訊線路備份籌劃等。4、制定客戶端備份籌劃:涉及終端設(shè)備,終端顧客注冊與權(quán)限管理備份。5、制定磁帶備份籌劃:涉及系統(tǒng)備份、非系統(tǒng)數(shù)據(jù)文獻(xiàn)備份、業(yè)務(wù)數(shù)據(jù)庫數(shù)據(jù)備份,及與備份系統(tǒng)有關(guān)其她全量備份、增量備份等,以構(gòu)成完整系統(tǒng)保護(hù)辦法。6、制定劫難備份批示系統(tǒng):此系統(tǒng)用來提供清晰全面劫難備份指南,可以在劫難發(fā)生時在最短時間內(nèi)找到劫難備份流程,與有關(guān)負(fù)責(zé)人和供應(yīng)商聯(lián)系方式,以及應(yīng)當(dāng)采用應(yīng)急辦法等。

如下為流程框圖:

第五章 xxxx業(yè)務(wù)系統(tǒng)劫難備份/恢復(fù)體系設(shè)計5.1 劫難備份/恢復(fù)體系總體設(shè)計惠普公司為xxxx業(yè)務(wù)系統(tǒng)提供劫難備份/恢復(fù)方案可以滿足顧客對于計算機(jī)系統(tǒng)、數(shù)據(jù)最高保護(hù)規(guī)定,保證雖然發(fā)生斷電,火災(zāi)等嚴(yán)重劫難時,顧客業(yè)務(wù)也可以7x24小時持續(xù)運營,同步保證業(yè)務(wù)數(shù)據(jù)在主中心和備份中心得到及時更新,保證顧客數(shù)據(jù)最大完整性。依照惠普公司近年來所積累實行高可靠性劫難備份/恢復(fù)解決方案成功經(jīng)驗,咱們可以承諾顧客在最小投資范疇內(nèi),按照惠普公司項目實行流程,在最短時間周期內(nèi)達(dá)到整個項目設(shè)計目的,并且通過惠普公司完善周全售后服務(wù)體系,保證XXXX核心業(yè)務(wù)計算機(jī)系統(tǒng)全天候、安全、穩(wěn)定運營。由于顧客數(shù)據(jù)中心核心業(yè)務(wù)系統(tǒng)相對集中,因而在數(shù)據(jù)中心實現(xiàn)核心業(yè)務(wù)數(shù)據(jù)規(guī)范化本地數(shù)據(jù)備份是災(zāi)備系統(tǒng)建設(shè)前提基本;同步通過進(jìn)行重要業(yè)務(wù)數(shù)據(jù)遠(yuǎn)程同步實現(xiàn)顧客重要業(yè)務(wù)數(shù)據(jù)遠(yuǎn)程異地存儲,為實現(xiàn)業(yè)務(wù)系統(tǒng)遠(yuǎn)程正常運作奠定堅實基本;容災(zāi)系統(tǒng)核心就是遠(yuǎn)程生產(chǎn)數(shù)據(jù)自動復(fù)制,由于顧客應(yīng)用均為基于數(shù)據(jù)庫聯(lián)機(jī)事務(wù)解決(OLTP)業(yè)務(wù)系統(tǒng),因此業(yè)務(wù)數(shù)據(jù)遠(yuǎn)程復(fù)制核心就是保證數(shù)據(jù)庫數(shù)據(jù)完整性、持續(xù)性,實時性和可恢復(fù)性。而當(dāng)前惠普公司基于顧客不同容災(zāi)需求所提供劫難備份/恢復(fù)方案重要有如下四大類型:1)

通過應(yīng)用程序來進(jìn)行遠(yuǎn)程數(shù)據(jù)復(fù)制(應(yīng)用層次);其重要原理就是通過修改應(yīng)用程序或者使用BEA等公司中間件產(chǎn)品,使得前端平臺在向數(shù)據(jù)庫服務(wù)器發(fā)送生產(chǎn)數(shù)據(jù)時,同步向主數(shù)據(jù)中心和備份數(shù)據(jù)中心均發(fā)送交易數(shù)據(jù),主數(shù)據(jù)中心解決交易數(shù)據(jù)并返回解決成果,備份中心在正常狀況下,只解決交易數(shù)據(jù),當(dāng)主數(shù)據(jù)中心無法正常工作時,備份中心服務(wù)器接替主中心服務(wù)器向前端平臺返回解決成果。2)

運用數(shù)據(jù)庫廠家軟件產(chǎn)品完畢遠(yuǎn)程數(shù)據(jù)備份(數(shù)據(jù)庫層次);既有某些數(shù)據(jù)庫廠家例如Oracle數(shù)據(jù)庫可以提供STANDBY數(shù)據(jù)庫功能,通過通信網(wǎng)絡(luò)將實際數(shù)據(jù)庫日記文獻(xiàn)傳至備份中心存儲系統(tǒng),備份中心STANDBY數(shù)據(jù)庫按照主數(shù)據(jù)庫構(gòu)造從日記文獻(xiàn)中重新恢復(fù)數(shù)據(jù)庫;又例如Informix數(shù)據(jù)庫可以提供HADR(High-AvailabilityDataReplication)功能,在初始化時將主數(shù)據(jù)中心數(shù)據(jù)庫中所有dbspace進(jìn)行一次零級備份,并恢復(fù)到備份數(shù)據(jù)中心數(shù)據(jù)庫中,之后主數(shù)據(jù)中心數(shù)據(jù)庫服務(wù)器可以通過通信網(wǎng)絡(luò)將生產(chǎn)數(shù)據(jù)庫邏輯日記文獻(xiàn)傳送至備份中心數(shù)據(jù)庫服務(wù)器,備份中心secondary數(shù)據(jù)庫將這些邏輯日記恢復(fù)到相應(yīng)dbspace上.3)

運用主機(jī)上安裝操作系統(tǒng)級鏡像軟件進(jìn)行遠(yuǎn)程數(shù)據(jù)鏡像(系統(tǒng)軟件,如HP-UXMirrorDisk/UX,VeritasVolumeReplicator等);主中心存儲設(shè)備與備份中心存儲設(shè)備進(jìn)行邏輯卷鏡像,主機(jī)同步將數(shù)據(jù)分別寫到本地和遠(yuǎn)程磁盤設(shè)備上,實現(xiàn)業(yè)務(wù)數(shù)據(jù)遠(yuǎn)程復(fù)制。4)

通過惠普最新存儲產(chǎn)品XP系列磁盤陣列(磁盤陣列硬件層次),可以實現(xiàn)主數(shù)據(jù)中心和備份中心操作系統(tǒng)、文獻(xiàn)系統(tǒng)、數(shù)據(jù)庫、應(yīng)用程序?qū)崟r遠(yuǎn)程拷貝復(fù)制。主、備中心XP磁盤陣列自身就可以通過陣列上微解決器完畢數(shù)據(jù)實時同步功能,將劫難發(fā)生時核心數(shù)據(jù)損失降至最低,并且不需要主機(jī)干涉或占用主機(jī)資源,可以做到劫難發(fā)生同步實現(xiàn)應(yīng)用解決過程恢復(fù)。遠(yuǎn)程備份系統(tǒng)重新啟動可以做到象普通輸入電源故障后重新啟動那么簡樸。如下是對各種容災(zāi)實現(xiàn)方案總體比較:

數(shù)據(jù)量應(yīng)用復(fù)雜度數(shù)據(jù)實時性對主機(jī)性能影響帶寬投資成本交易數(shù)據(jù)備份交易數(shù)據(jù)高(也許修改應(yīng)用)低<10%幾十萬數(shù)據(jù)庫日記備份2-4倍交易數(shù)據(jù)數(shù)據(jù)庫工具也許至少丟失1個LOG較高(10-20%)幾十萬鏡像軟件4-8倍交易數(shù)據(jù)應(yīng)用透明高(I/O級),網(wǎng)絡(luò)/鏡像軟件故障影響主機(jī)業(yè)務(wù)高(10-30%)幾百萬磁盤陣列4-8倍交易數(shù)據(jù)應(yīng)用透明高(I/O級)無幾百萬

5.2 應(yīng)用層方式容災(zāi)構(gòu)造簡介運用應(yīng)用層容災(zāi)方式建立針對顧客業(yè)務(wù)劫難備份系統(tǒng),其重要原理是通過應(yīng)用程序或者中間件產(chǎn)品同步向主中心和備份中心傳播未經(jīng)解決生產(chǎn)數(shù)據(jù),主中心服務(wù)器和備份中心服務(wù)器同步解決數(shù)據(jù)。在正常狀況下,只用主中心和業(yè)務(wù)系統(tǒng)聯(lián)系,備份中心只在后臺解決數(shù)據(jù);當(dāng)主中心癱瘓時,由于備份中心也存有生產(chǎn)數(shù)據(jù)庫,也存有生產(chǎn)數(shù)據(jù),因此可以迅速接管業(yè)務(wù)。由于是運用應(yīng)用軟件來實現(xiàn)數(shù)據(jù)同步及保證一致性,因而對于硬件方面影響較小。如圖所示:這種方案重要長處就是:a)

由于通過網(wǎng)絡(luò)傳播交易數(shù)據(jù)時未經(jīng)數(shù)據(jù)庫解決,因此傳播數(shù)據(jù)量小,對傳播數(shù)據(jù)網(wǎng)絡(luò)帶寬規(guī)定不高;b)

傳播數(shù)據(jù)過程中,主中心和備份中心異步進(jìn)行,由傳播距離產(chǎn)生延遲和通信帶寬瓶頸不會相應(yīng)用產(chǎn)生較大影響.缺陷是:a)

相應(yīng)用程序修改較大,增長應(yīng)用軟件商二次開發(fā)承擔(dān);b)

由于主,備數(shù)據(jù)中心業(yè)務(wù)解決過程為異步進(jìn)行,如何保障數(shù)據(jù)一致性非常困難,需要在應(yīng)用中對數(shù)據(jù)同步進(jìn)行周密設(shè)計;

這種容災(zāi)方式適合于傳播距離極長(幾千公里),且網(wǎng)絡(luò)傳播帶寬和通信質(zhì)量無法得到有效保證顧客環(huán)境.而對于存儲設(shè)備則沒有嚴(yán)格限制,顧客可以靈活選取滿足容量和速度規(guī)定存儲設(shè)備。5.3 數(shù)據(jù)庫方式容災(zāi)構(gòu)造簡介5.3.1原理數(shù)據(jù)庫方式由于只是傳送數(shù)據(jù)庫日記,與應(yīng)用沒有直接關(guān)系,因而不必相應(yīng)用程序作大量修改。如下簡介重要以O(shè)racle和Informix數(shù)據(jù)庫為主。數(shù)據(jù)庫方式容災(zāi)通過數(shù)據(jù)復(fù)制把數(shù)據(jù)定期、在線地復(fù)制到目地機(jī)器上去,以保持分布在不同地方兩個或各種數(shù)據(jù)庫系統(tǒng)內(nèi)容一致性,來實現(xiàn)數(shù)據(jù)保護(hù)。但它將消耗大量主機(jī)資源(至少要占用監(jiān)控和復(fù)制兩個進(jìn)程)。復(fù)制對象是數(shù)據(jù)庫解決單位,如事務(wù)日記(邏輯日記),實現(xiàn)方式也有同步與異步兩種,嚴(yán)格來講,這種辦法很難有真正同步方案。由于同步數(shù)據(jù)復(fù)制規(guī)定做任何一筆交易,都要實時地將成果發(fā)送到遠(yuǎn)程站點中,等遠(yuǎn)程操作結(jié)束后,再執(zhí)行下一筆交易;而在實際操作中,很難做到這一點,只能做異步數(shù)據(jù)復(fù)制。因此一種實時應(yīng)用系統(tǒng)中,普通采用異步方式。

備份數(shù)據(jù)中心通過網(wǎng)絡(luò)連接到中央數(shù)據(jù)中心。在正常狀況下,Oracle數(shù)據(jù)庫運營在主數(shù)據(jù)中心服務(wù)器上,數(shù)據(jù)存儲于主數(shù)據(jù)中心磁盤陣列中。運用Oracle數(shù)據(jù)庫提供STANDBY數(shù)據(jù)庫功能,可以通過通信網(wǎng)絡(luò)將實際數(shù)據(jù)庫日記文獻(xiàn)傳至備份中心存儲系統(tǒng),備份中心STANDBY數(shù)據(jù)庫按照主數(shù)據(jù)庫構(gòu)造從日記文獻(xiàn)中重新恢復(fù)數(shù)據(jù)庫,以保持?jǐn)?shù)據(jù)一致性。一旦中央數(shù)據(jù)中心浮現(xiàn)問題,顧客可以及時啟動備份數(shù)據(jù)中心備份數(shù)據(jù)庫以及有關(guān)應(yīng)用。Achivelog備份方式

這一實現(xiàn)方式核心在于通過一種專用程序?qū)⒅鲾?shù)據(jù)中心數(shù)據(jù)庫中AchiveLog定期通過通信網(wǎng)絡(luò)傳播到備份中心數(shù)據(jù)庫中。一旦主數(shù)據(jù)中心不能提供服務(wù),備份中心一方面通過RedoLog恢復(fù)數(shù)據(jù),然后再代替主數(shù)據(jù)中心恢復(fù)應(yīng)用?;跀?shù)據(jù)庫方式容災(zāi)可以把變化了數(shù)據(jù)定期、在線地復(fù)制到目地機(jī)器上去。對顧客來說,這種復(fù)制方式長處是可以較好地保證數(shù)據(jù)一致性,但它將消耗大量主機(jī)資源(至少要占用監(jiān)控和復(fù)制兩個進(jìn)程)。此方案可以做到在有限投資范疇內(nèi),充分運用既有機(jī)器設(shè)備,實現(xiàn)應(yīng)用系統(tǒng)和重要數(shù)據(jù)劫難恢復(fù)功能。作為惠普公司成熟劫難恢復(fù)技術(shù),此方案已經(jīng)在國內(nèi)許多顧客中成功實行過。其中涉及:上海浦東國際機(jī)場劫難恢復(fù)系統(tǒng)等。

建立遠(yuǎn)程容災(zāi)環(huán)境:運用中央數(shù)據(jù)庫全備份(零級備份)建立劫難備份數(shù)據(jù)庫由專門進(jìn)程負(fù)責(zé)傳播中央數(shù)據(jù)庫生成日記文獻(xiàn)到遠(yuǎn)地,這里可以通過定義日記文獻(xiàn)大小及傳播時機(jī)來控制劫難發(fā)生時數(shù)據(jù)損失盡量減少,并可加快容災(zāi)應(yīng)用切換速度,盡快恢復(fù)業(yè)務(wù)在備份數(shù)據(jù)中心系統(tǒng)上運營。劫難備份數(shù)據(jù)庫使用傳播來日記文獻(xiàn)(Archivelog或Logicallog)不斷更新備份數(shù)據(jù)庫,這時數(shù)據(jù)庫始終處在恢復(fù)狀態(tài)(Informix數(shù)據(jù)庫為quiescent狀態(tài)),其數(shù)據(jù)不可被訪問(對于Informix數(shù)據(jù)庫,備份數(shù)據(jù)庫中數(shù)據(jù)可被用來進(jìn)行讀操作,但無法進(jìn)行寫操作)。劫難備份數(shù)據(jù)庫更新出錯且無法解決時,應(yīng)重新建立備份數(shù)據(jù)庫。劫難備份數(shù)據(jù)庫應(yīng)定期做激活測試,以保證其在核心時刻可用性。應(yīng)用系統(tǒng)需考慮發(fā)生劫難時如何將聯(lián)接切換到劫難備份數(shù)據(jù)庫。

容災(zāi)切換:將中央數(shù)據(jù)庫可獲得日記文獻(xiàn)傳至劫難數(shù)據(jù)庫后,將劫難備份數(shù)據(jù)庫更新到近來點,并啟動數(shù)據(jù)庫供應(yīng)用系統(tǒng)使用;及時對劫難數(shù)據(jù)庫做數(shù)據(jù)庫全備份;對損失數(shù)據(jù)進(jìn)行修補;以建立劫難數(shù)據(jù)庫同樣方式建立中央數(shù)據(jù)庫,并將運營系統(tǒng)切換回中央數(shù)據(jù)庫,該次切換可做到數(shù)據(jù)無損失;及時對中央數(shù)據(jù)庫做數(shù)據(jù)庫全備份;重新建立劫難備份環(huán)境,恢復(fù)容災(zāi)系統(tǒng).5.3.2容災(zāi)環(huán)境維護(hù)(中央數(shù)據(jù)庫構(gòu)造發(fā)生變化)尋常管理中,需對中央數(shù)據(jù)庫歸檔日記(邏輯日記)目錄定期進(jìn)行備份和清理,亦需清除劫難備份數(shù)據(jù)庫歸檔日記(邏輯日記)目錄中使用過歸檔日記(邏輯日記)。在系統(tǒng)運營過程中,也許發(fā)生變化中央數(shù)據(jù)庫構(gòu)造狀況,這時需要進(jìn)行恰當(dāng)操作使劫難備份數(shù)據(jù)庫跟上更新變化,保持?jǐn)?shù)據(jù)庫構(gòu)造一致和同步:1增長數(shù)據(jù)文獻(xiàn)在中央數(shù)據(jù)庫上增長數(shù)據(jù)文獻(xiàn)將產(chǎn)生相應(yīng)日記,當(dāng)被施用到劫難備份數(shù)據(jù)庫時控制文獻(xiàn)中會加入此數(shù)據(jù)文獻(xiàn)名,此時如劫難備份數(shù)據(jù)庫能在相應(yīng)目錄找到此數(shù)據(jù)文獻(xiàn),恢復(fù)操作繼續(xù);否則會停止,在繼續(xù)恢復(fù)操作之前,需選取如下操作:-將此新數(shù)據(jù)文獻(xiàn)拷貝到劫難備份節(jié)點相應(yīng)目錄下;-在劫難備份數(shù)據(jù)庫上執(zhí)行命令A(yù)lterDatabaseCreateDatafile‘filename’.2數(shù)據(jù)文獻(xiàn)改名對中央數(shù)據(jù)庫數(shù)據(jù)文獻(xiàn)進(jìn)行改名,需要刷新劫難備份數(shù)據(jù)庫控制文獻(xiàn),或在對中央數(shù)據(jù)庫作該操作時亦對劫難備份數(shù)據(jù)庫作類似操作,即可保證中央與劫難備份數(shù)據(jù)庫同步。3修改聯(lián)機(jī)日記文獻(xiàn)設(shè)立在對中央數(shù)據(jù)庫聯(lián)機(jī)日記文獻(xiàn)進(jìn)行增長、刪除等操作后,都不會影響劫難備份數(shù)據(jù)庫。但在中央數(shù)據(jù)庫上執(zhí)行命令A(yù)lterDatabaseClearUnarchivedLogfile,或以Resetlogs選項打開數(shù)據(jù)庫,則會使容災(zāi)備份數(shù)據(jù)庫失效,由于容災(zāi)備份數(shù)據(jù)庫無法得到進(jìn)行恢復(fù)操作所需歸檔日記文獻(xiàn),這時需要重新建立容災(zāi)環(huán)境。4修改控制文獻(xiàn)若在中央數(shù)據(jù)庫上使用CreateControlfile命令執(zhí)行如下操作,將使容災(zāi)數(shù)據(jù)庫控制文獻(xiàn)失效:-變化聯(lián)機(jī)日記組或文獻(xiàn)最大數(shù)目參數(shù)-變化數(shù)據(jù)文獻(xiàn)最大數(shù)目參數(shù)-變化并發(fā)打開數(shù)據(jù)庫實例最大數(shù)目參數(shù)此時需要刷新劫難備份數(shù)據(jù)庫控制文獻(xiàn)。在中央數(shù)據(jù)庫上使用帶Resetlogs選項CreateControlfile命令將在下一次打開中央數(shù)據(jù)庫時重置聯(lián)機(jī)日記,日記序列回到1,從而導(dǎo)致容災(zāi)備份數(shù)據(jù)庫失效。5數(shù)據(jù)庫啟動參數(shù)建議使中央數(shù)據(jù)庫與劫難備份數(shù)據(jù)庫參數(shù)配備相似,以免因參數(shù)不同影響容災(zāi)數(shù)據(jù)庫性能甚至恢復(fù)操作實現(xiàn)。6刷新劫難備份數(shù)據(jù)庫控制文獻(xiàn)當(dāng)中央數(shù)據(jù)庫控制文獻(xiàn)發(fā)生變化時,依照如下環(huán)節(jié)刷新劫難備份數(shù)據(jù)庫控制文獻(xiàn):-停止劫難備份數(shù)據(jù)庫恢復(fù)操作-關(guān)閉劫難備份數(shù)據(jù)庫-在中央數(shù)據(jù)庫上執(zhí)行命令A(yù)lterDatabaseCreateStandbyDatabaseControlfileAs‘filename’創(chuàng)立供劫難備份數(shù)據(jù)庫使用控制文獻(xiàn)-在中央數(shù)據(jù)庫上執(zhí)行命令A(yù)lterSystemArchiveLogCurrent歸檔出當(dāng)前日記-將上兩步產(chǎn)生控制文獻(xiàn)及歸檔日記文獻(xiàn)傳送至容災(zāi)節(jié)點-啟動劫難備份數(shù)據(jù)庫在Nomount狀態(tài),執(zhí)行AlterDatabaseMountStandbyDatabase使數(shù)據(jù)庫處在Mount狀態(tài)-進(jìn)行劫難備份數(shù)據(jù)庫正?;謴?fù)操作7關(guān)于Unrecoverable操作產(chǎn)生數(shù)據(jù)中央數(shù)據(jù)庫上用Unrecoverable選項操作(如CreateTable…unrecoverable)產(chǎn)生數(shù)據(jù)更新不生產(chǎn)日記,因而無法傳送到劫難備份數(shù)據(jù)庫,此時只能采用如下三種辦法之一:-在劫難備份數(shù)據(jù)庫中,使受該操作影響數(shù)據(jù)文獻(xiàn)處在Offline狀態(tài)。劫難切換后,刪除劫難備份數(shù)據(jù)庫中相應(yīng)表空間。該辦法在容許損失此整個表空間數(shù)據(jù)時才干使用。-重建容災(zāi)環(huán)境-在中央數(shù)據(jù)庫上備份該操作影響表空間,歸檔當(dāng)前日記,傳送到容災(zāi)節(jié)點后,啟動劫難備份數(shù)據(jù)庫恢復(fù)操作。注意:如在中央數(shù)據(jù)庫做了Unrecoverable操作,而未采用以上辦法進(jìn)行操作,仍在劫難備份數(shù)據(jù)庫上進(jìn)行正?;謴?fù),將不會有錯誤信息提示,該錯誤信息將出當(dāng)前數(shù)據(jù)庫日記中($ORACLE_BASE/admin/<sid>/bdump/alert_<sid>.log)。因而管理員必要定期檢查數(shù)據(jù)庫日記。5.3.3優(yōu)缺陷比較用數(shù)據(jù)庫功能實現(xiàn)遠(yuǎn)程數(shù)據(jù)復(fù)制長處為:a)

支持廣域網(wǎng)合同,備份中心地點不受傳播距離影響;b)

硬件/軟件投資較少;缺陷重要為:a)傳播歸檔日記或邏輯日記需占用主機(jī)資源(CPU,內(nèi)存,網(wǎng)絡(luò)等,詳細(xì)指標(biāo)未擬定);b)

當(dāng)劫難發(fā)生時,業(yè)務(wù)無法在備份中心得到迅速恢復(fù);c)

備份中心數(shù)據(jù)無法迅速恢復(fù)回主數(shù)據(jù)中心,從而應(yīng)用無法迅速切換回主中心運營;d)

無法實現(xiàn)非數(shù)據(jù)庫數(shù)據(jù)遠(yuǎn)程復(fù)制;

此種容災(zāi)方式適合于只遠(yuǎn)程備份數(shù)據(jù)庫數(shù)據(jù),傳播距離較長(幾百公里以上),且網(wǎng)絡(luò)傳播帶寬不大顧客環(huán)境.5.4 鏡像軟件容災(zāi)方式構(gòu)造簡介運用操作系統(tǒng)層鏡像軟件,如HP-UXMirrorDisk/UX,實現(xiàn)本地主數(shù)據(jù)中心邏輯卷和遠(yuǎn)端備份數(shù)據(jù)中心邏輯卷之間實時同步數(shù)據(jù)復(fù)制.當(dāng)主數(shù)據(jù)中心發(fā)生突發(fā)性劫難時,顧客可以通過在備份中心服務(wù)器上激活相應(yīng)卷組和邏輯卷,進(jìn)而啟動備份中心服務(wù)器上數(shù)據(jù)庫和應(yīng)用系統(tǒng),從而實現(xiàn)業(yè)務(wù)系統(tǒng)劫難恢復(fù)目的.

正常狀況下,業(yè)務(wù)系統(tǒng)運營在主中心服務(wù)器上,數(shù)據(jù)存儲在主中心磁盤陣列中,同步在備份中心配備相似容量磁盤陣列。主中心和備份中心距離普通限制在10公里左右,主中心服務(wù)器使用光纖通道卡通過光纖互換機(jī)和光纜分別連接兩個中心磁盤陣列,運用服務(wù)器端鏡像軟件對數(shù)據(jù)鏡像存儲。在發(fā)生劫難時最嚴(yán)重?fù)p失就是數(shù)據(jù)自身丟失,而磁盤鏡像規(guī)定向磁盤進(jìn)行每個物理寫操作都被復(fù)制到另一種地點另一種磁盤。由于復(fù)制是向磁盤進(jìn)行物理寫操作,因此它與應(yīng)用程序無關(guān)。在主中心因故浮現(xiàn)存儲陣列損壞、癱瘓時,備份中心數(shù)據(jù)依然完好。主中心服務(wù)器仍能正常訪問備份中心數(shù)據(jù)。一旦主中心磁盤陣列恢復(fù)后,可以在系統(tǒng)上使用磁盤重新鏡像命令將數(shù)據(jù)進(jìn)行同步,從而備份中心陣列中數(shù)據(jù)會拷貝到主中心存儲陣列中。

鏡像軟件容災(zāi)方式優(yōu)缺陷比較.長處:可完全保證數(shù)據(jù)復(fù)制完整性,一致性;容災(zāi)構(gòu)造相對簡樸;對磁盤子系統(tǒng)透明,主/備數(shù)據(jù)中心可采用不同磁盤陣列設(shè)備.缺陷:遠(yuǎn)程數(shù)據(jù)復(fù)制操作占用主機(jī)較多資源(10-30%);主中心應(yīng)用系統(tǒng)寫操作性能受主/備中心傳播距離影響較大;網(wǎng)絡(luò)連接和鏡像軟件故障將導(dǎo)致主中心業(yè)務(wù)系統(tǒng)中斷;備份中心更新數(shù)據(jù)無法迅速恢復(fù)回主數(shù)據(jù)中心;

這種容災(zāi)方式合用于對主機(jī)寫操作性能規(guī)定不高,并且業(yè)務(wù)系統(tǒng)可以忍受因光纖傳播線路暫時故障而導(dǎo)致業(yè)務(wù)中斷顧客環(huán)境.5.5 XP磁盤陣列容災(zāi)方式構(gòu)造簡介惠普公司XP陣列由ContinuousAccessXP/XPExtension軟件提供完全劫難備份/恢復(fù)功能。

主數(shù)據(jù)中心和備份數(shù)據(jù)中心構(gòu)造基本一致:采用HPXP系列磁盤陣列作為中心存儲,所有主機(jī)通過光纖與磁盤陣列相連。磁盤陣列上運營ContinueAccessXP容災(zāi)軟件。主中心與備份中心之間XP磁盤陣列物理上通過兩條光纖通道直聯(lián),采用XP磁盤陣列上容災(zāi)軟件ContinueAccess做到兩地數(shù)據(jù)實時同步。兩套磁盤陣列之間數(shù)據(jù)一致性依托磁盤陣列自身專用軟件(直接運營在磁盤陣列上)來完畢,完全不依賴主機(jī)系統(tǒng),也不影響本地應(yīng)用響應(yīng)速度。當(dāng)配備了ContinuousAccessXP/XPExtension軟件兩臺XP陣列分別處在兩數(shù)據(jù)中心時,通過光纖線路進(jìn)行連接,主數(shù)據(jù)中心XP存儲磁盤陣列可以隨時自動將更新后數(shù)據(jù)傳送至異地備份XP存儲設(shè)備,以保持兩臺XP陣列數(shù)據(jù)完全一致性。整個工作由XP陣列自身完畢,對主機(jī)系統(tǒng)完全透明,不需占用任何主機(jī)資源。當(dāng)主數(shù)據(jù)中心由于地震,火災(zāi)等各種意外因素導(dǎo)致整個主中心核心業(yè)務(wù)系統(tǒng)崩潰時,異地備份系統(tǒng)將完全接管所有工作,在極短時間內(nèi),恢復(fù)業(yè)務(wù)系統(tǒng)運營。客戶端也是劫難備份恢復(fù)系統(tǒng)防護(hù)對象,需要通過網(wǎng)絡(luò)連接到劫難備份中心運營系統(tǒng)。劫難備份中心運營系統(tǒng)具備重構(gòu)運營環(huán)境能力,在劫難發(fā)生后代替生產(chǎn)中心行使運營系統(tǒng)職能,接受客戶端注冊和訪問,其運營環(huán)境和業(yè)務(wù)數(shù)據(jù)由備份服務(wù)器和備份數(shù)據(jù)系統(tǒng)提供。特點:老式劫難備份系統(tǒng)主備機(jī)切換過程為1)

主機(jī)發(fā)生故障2)

系統(tǒng)切換到備機(jī)3)

修復(fù)主機(jī)4)

關(guān)閉全套系統(tǒng)涉及主機(jī)及備機(jī)5)

將系統(tǒng)從新切換回主機(jī)其中在第4個環(huán)節(jié)中,顧客將不得不承受停機(jī)所帶來損失。而惠普公司SureStoreEContinuousAccessXP/XPExtension軟件將使顧客避免這一損失,由于當(dāng)系統(tǒng)從主機(jī)切換到備機(jī)后,備機(jī)將成為主機(jī),修復(fù)后“主機(jī)”成為備機(jī)使用。此方案最大優(yōu)勢就是對主機(jī)應(yīng)用完全透明,所有數(shù)據(jù)復(fù)制工作由磁盤陣列硬件層完畢,不需修改應(yīng)用,并且可以保證大量數(shù)據(jù)復(fù)制性能。由于磁盤陣列數(shù)據(jù)復(fù)制原理是運用磁盤遠(yuǎn)程鏡像功能,因此可以保證主數(shù)據(jù)中心核心業(yè)務(wù)數(shù)據(jù)和備份中心核心業(yè)務(wù)數(shù)據(jù)完全一致,并且容災(zāi)系統(tǒng)實現(xiàn)起來非常簡便。還可以充分運用既有服務(wù)器設(shè)備,實現(xiàn)應(yīng)用系統(tǒng)和重要數(shù)據(jù)劫難恢復(fù)功能。作為惠普公司成熟劫難備份/恢復(fù)技術(shù),此方案已經(jīng)在國內(nèi)外許多顧客環(huán)境中成功實行過。其中涉及上海熱線,大連電信,云南建行,湖南建行等劫難備份恢復(fù)系統(tǒng)。由于XXXX容災(zāi)距離,顧客環(huán)境和業(yè)務(wù)需求也十分適合于使用XP磁盤陣列實現(xiàn)存儲硬件層劫難備份恢復(fù)方案,因而HP公司也向XXXX推薦這種容災(zāi)方式.而這種容災(zāi)方案重要限制就是由于在磁盤一級進(jìn)行數(shù)據(jù)復(fù)制,相應(yīng)用系統(tǒng)完全透明,因此相比應(yīng)用層和數(shù)據(jù)庫層容災(zāi)方式,復(fù)制數(shù)據(jù)量較大,對光纖數(shù)據(jù)鏈路傳播質(zhì)量和傳播帶寬規(guī)定較高.長處:1、

當(dāng)前而言是所有異地容災(zāi)方式中最為可靠和成熟技術(shù);2、

有磁盤陣列自身來完畢,完全不影響主機(jī)性能,也不依賴于操作系統(tǒng)平臺,因而形式所有實現(xiàn)方式中性能最佳,使用范疇最廣泛一種;3、

通過磁盤陣列之間專用互連完畢通信,因而不占用局域網(wǎng)資源。缺陷:投資較大

5.5.1劫難恢復(fù)系統(tǒng)硬件,軟件配備闡明咱們推薦數(shù)據(jù)中心中心磁盤陣列采用HP高性能全光纖通道互換式構(gòu)造磁盤陣列XP512。為了適應(yīng)當(dāng)前數(shù)據(jù)中心越來越明顯存儲中心化趨勢(即:存儲作為整套系統(tǒng)核心,各種平臺服務(wù)器作為存儲外設(shè)),XP512與老式磁盤陣列相比已經(jīng)不是單純硬盤堆疊,而是新一代存儲+服務(wù)器構(gòu)造。無論從它硬件構(gòu)造還是直接運營在XP512上各種各樣軟件都可以明顯感覺到這一點。系統(tǒng)數(shù)據(jù)存儲在主中心存儲磁盤陣列XP512中。同步在異地備份中心配備相似構(gòu)造存儲磁盤陣列XP。由于XXXX容災(zāi)環(huán)境距離為10公里左右,從數(shù)據(jù)復(fù)制性能以及數(shù)據(jù)復(fù)制完整性和一致性方面考慮,建議顧客在主中心和備份中心之間構(gòu)建單模光纖線路用于傳播備份數(shù)據(jù),并選用DWDM(密集波分復(fù)用)設(shè)備實現(xiàn)數(shù)據(jù)復(fù)制鏈路多路復(fù)用,從而提高數(shù)據(jù)復(fù)制傳播帶寬,并改進(jìn)遠(yuǎn)程數(shù)據(jù)傳播性能。通過HP公司提供劫難備份恢復(fù)軟件(HPContinuousAccessXP)可以自動實現(xiàn)主中心存儲數(shù)據(jù)與備份中心數(shù)據(jù)實時完整備份。在主數(shù)據(jù)中心,按照顧客規(guī)定,還可以配備磁帶備份服務(wù)器,用來安裝HP備份軟件OmnibackII,以及SureStoreE磁帶庫。備份服務(wù)器直接連接到存儲陣列和磁帶庫,控制業(yè)務(wù)系統(tǒng)尋常數(shù)據(jù)磁帶備份。為保證顧客主數(shù)據(jù)中心主機(jī)系統(tǒng)負(fù)載分擔(dān),容錯能力等功能,惠普公司提供了先進(jìn),具備高度可靠性群集構(gòu)造。該構(gòu)造可由兩臺或多臺HP9000/800系列高檔服務(wù)器構(gòu)成,并通過LAN和共用硬盤構(gòu)成協(xié)調(diào)、高效群集構(gòu)造。當(dāng)Cluster中某個節(jié)點浮現(xiàn)異常(服務(wù)器硬件,系統(tǒng)軟件,應(yīng)用程序和局域網(wǎng)故障等)時,MC/ServiceGuard可以及時發(fā)現(xiàn)故障節(jié)點,自動將故障節(jié)點當(dāng)前應(yīng)用系統(tǒng)遷移到其他正常節(jié)點中,使之繼續(xù)進(jìn)行正常業(yè)務(wù)解決,并可自動隔離故障節(jié)點以便于技術(shù)人員故障排除工作,從而消除核心業(yè)務(wù)系統(tǒng)中單故障點。主數(shù)據(jù)中心配備為:部件名稱數(shù)量闡明XP5121臺:高速數(shù)據(jù)緩存44塊x4GB(每塊)=8GB磁盤柜1

73GB光纖磁盤8822組x4(每組)x73GB=6424GBHOTSPARE磁盤222組x4(每組)x73GB=6424GB指令內(nèi)存2

主機(jī)接口卡2

CommandViewXP1不依賴于平臺基于Web控制管理軟件LUNConfigurationXP1LUN配備、管理軟件存儲光纖互換機(jī)2臺:光纖端口24

備份數(shù)據(jù)中心配備為:部件名稱數(shù)量闡明XP5121臺:高速數(shù)據(jù)緩存44塊x4GB(每塊)=8GB磁盤柜1

73GB光纖磁盤8822組x4(每組)x73GB=6424GBHOTSPARE磁盤222組x4(每組)x73GB=6424GB指令內(nèi)存2

主機(jī)接口卡2

CommandViewXP1不依賴于平臺基于Web控制管理軟件LUNConfigurationXP1LUN配備、管理軟件存儲光纖互換機(jī)2臺:光纖端口24

5.5.2XPCA軟件容災(zāi)原理

XP(MCU)RCP

XP(RCU)服務(wù)器(主)服務(wù)器(備)FiberChannel連接CA磁盤卷組拷貝方向SVPM-VOLR-VOLR-VOLLCPREMOTECONTROLREMOTECONTROL(TCP/IP)M-VOLSVP(TCP/IP)

(1)CA磁盤卷組CA磁盤卷組由不同XP磁盤陣列裝置內(nèi)或不同CLUSTER內(nèi)命名為M-VOL和R-VOL2個邏輯磁盤卷構(gòu)成。在具備CA磁盤卷組關(guān)系后,M-VOL被稱為主磁盤卷。M-VOL可被讀/寫。R-VOL(遠(yuǎn)程磁盤卷)被稱為副磁盤卷。在XP磁盤陣列內(nèi)部控制裝置作用下,M-VOL內(nèi)容和服務(wù)器來寫數(shù)據(jù)被拷貝到R-VOL。CA卷組建立后,R-VOL為只讀磁盤卷。在一種XP設(shè)備內(nèi)部,既可有M-VOL,也可有R-VOL。這樣可以實現(xiàn)雙向數(shù)據(jù)境像。

(2〕MCU和RCUMCU(主磁盤控制器)和RCU(遠(yuǎn)程磁盤控制器)分別和M-VOL,R-VOL相連,MCU控制由服務(wù)器來寫向M-VOL數(shù)據(jù)寫操作,還控制M-VOL和R-VOL之間數(shù)據(jù)拷貝操作。并且提供CA磁盤卷組狀態(tài)和構(gòu)成管理。RCU執(zhí)行由MCU發(fā)出寫命令操作。寫操作執(zhí)行辦法和執(zhí)行服務(wù)器來寫操作過程相似。除此之外,RCU還具備管理一某些CA磁盤卷組狀態(tài)和構(gòu)成信息能力。對于任何一種磁盤卷組,都需要定義MCU/RCU。一種XP設(shè)備磁盤控制裝置在控制M-VOL時,可作為MCU使用,當(dāng)控制R-VOL時侯,又可作為RCU使用。(3)遠(yuǎn)程備份連接MCU和RCU之間由專用光纖(ESCON)來連結(jié)。當(dāng)光纖直聯(lián),不增長任何設(shè)備時,兩臺XP512之間最遠(yuǎn)可相隔3KM。在兩臺XP512之間加入ESCON延長裝置(ESCONDIRECTOR或REPATER)可使磁盤陣列間距離最大延長至43KM。如果使用E3或ATM遠(yuǎn)程電信合同,在兩臺XP512之間將不會有距離限制。加入ESCON延長裝置連接圖如下圖所示:通過ESCON光纖通道,MCU和RCU可互相進(jìn)行數(shù)據(jù)傳送和控制命傳送。在構(gòu)筑CA時,考慮到消除單點故障引患,兩臺XP512之間ESCON光纖最低需要2根。這樣當(dāng)一根光纖浮現(xiàn)意外不能使用時,運用剩余一根可完畢MCU和RCU間通信。不至引起系統(tǒng)數(shù)據(jù)傳播中斷。(4)RemotecontrolRemoteControl可完畢CA構(gòu)成設(shè)定,卷組狀態(tài)變更和表達(dá)。

5.5.3高可靠性方案與高可用性方案選取當(dāng)主運用端發(fā)生不可恢復(fù)數(shù)據(jù)損失后,遠(yuǎn)地備份中心鏡象磁盤卷R-VOL里數(shù)據(jù)與數(shù)據(jù)損失發(fā)生前主中心磁盤卷M-VOL一致性往往會決定系統(tǒng)損失大小以及把主應(yīng)用恢復(fù)到正常狀態(tài)所需時間。鏡象卷組間數(shù)據(jù)完全一致時,只要將遠(yuǎn)地備份中心數(shù)據(jù)拷回到主運用端起動修復(fù)程序便可恢復(fù)到正常業(yè)務(wù)解決。但是由于數(shù)據(jù)傳播是通過ESCON及CNT進(jìn)行,并且途徑較遠(yuǎn),鏈路中斷等因素均有也許導(dǎo)致鏡象卷組間數(shù)據(jù)不完全一致。在鏡象卷組失去同步時,主運用端發(fā)生不可恢復(fù)數(shù)據(jù)損失后,將會導(dǎo)致某些數(shù)據(jù)丟失。固然,鏈路故障與主運用端同步發(fā)生損壞也許性非常低?;陬櫩拖到y(tǒng)與否有優(yōu)先保證在任何時候鏡象卷組都要一致需要,CAXP提供兩種運營方案:高可靠性方案與高可用性方案。高可靠性方案:在此方案中,將日記文獻(xiàn)和表數(shù)據(jù)更新拷貝模式都設(shè)為“DATA”。在這種拷貝模式下,在M-VOL和R-VOL鏡象卷組失去同步前,MCU會據(jù)絕服務(wù)器對M-VOL發(fā)出寫操作并發(fā)出寫錯誤信息。因而,M-VOL和R-VOL鏡象卷組一致性得到保證。這種模式雖然提供了良好一致性保證,但是相應(yīng)用環(huán)境也有較高規(guī)定。當(dāng)兩條ESCON鏈路所有斷掉或者遠(yuǎn)地備份中心XP512因停電導(dǎo)致運營中斷等偶發(fā)性故障發(fā)生時,CAXP鏡象卷組M-VOL狀態(tài)變?yōu)椤癝USPEND”,MCU檢測出此狀態(tài)后為了保證鏡象卷組一致性將禁止M-VOL寫操作即有也許中斷主運用端應(yīng)用正常運營。因而,此方案規(guī)定系統(tǒng)具備忍受應(yīng)用暫時停止能力。當(dāng)由于M-VOL以外地方發(fā)生故障引起主運用端應(yīng)用運營中斷時,系統(tǒng)管理員又想繼續(xù)應(yīng)用進(jìn)行,可以用命令刪除CAXP鏡象卷組邏輯關(guān)系,使M-VOL狀態(tài)該變?yōu)椤癝IMPLEX”,開放對M-VOL寫操作。此后,主運用對M-VOL更新不會被反映到R-VOL端,即鏡象卷組失去同步。鏡像失去同步后建議增長對在本地M-VOL在線BACKUP頻度。高可靠性方案可以保證M-VOL和R-VOL嚴(yán)格同步。但雖然主運用端不發(fā)生故障也有也許導(dǎo)致應(yīng)用中斷。此方案合用于優(yōu)先磁盤卷組內(nèi)容一致系統(tǒng)運用,且此方案規(guī)定系統(tǒng)具備忍受應(yīng)用暫時停止能力。

高可用性方案在此方案中,將日記文獻(xiàn)與表數(shù)據(jù)更新拷貝模式都設(shè)為“NEVER”。在這種拷貝模式下建立起來CAXP鏡像卷組雖然在光纖或R-VOL故障引起M-VOL和R-VOL鏡象卷組失去同步后,只要M-VOL沒有遭到損壞,MCU就不會據(jù)絕服務(wù)器對M-VOL發(fā)出寫操作。從服務(wù)器端來看,M-VOL對R-VOL鏡象卷數(shù)據(jù)更新象在正常進(jìn)行,服務(wù)器應(yīng)用也不會被中斷。但是實際當(dāng)光纖鏈路故障發(fā)生后,對R-VOL更新會被停止,M-VOL里被更新磁道會被標(biāo)上標(biāo)記,并且MCU向服務(wù)器和RETOMECONTROL發(fā)出磁盤卷組異常信息提示。當(dāng)浮現(xiàn)光纖、CNT、遠(yuǎn)地備份中心XP512停電等故障時,由于不影響應(yīng)用運營,因此沒有必要象“DATA”那樣強(qiáng)制中斷CAXP卷組。在此期間M-VOL更新數(shù)據(jù)會被記錄下來。故障修復(fù)后,可用激活命令執(zhí)行M-VOL更新某些拷備再同步磁盤卷組。鏡像卷失去同步后建議增長對在本地M-VOL在線BACKUP頻度。此應(yīng)用方案合用于優(yōu)先保證主運用系統(tǒng)和光纖線路狀態(tài)不太安定地區(qū)。但使用此方案前,必須有一種明確結(jié)識,那就是在恢復(fù)CAXP卷組同步前,如果主運用端發(fā)生不可修復(fù)災(zāi)害,將會導(dǎo)致數(shù)據(jù)丟失。數(shù)據(jù)丟失量與R-VOL變?yōu)椤癝USPEND”時間關(guān)于,即M-VOL停止向R-VOL更新時間。鑒于XXXX業(yè)務(wù)為核心應(yīng)用,由于某些次要因素故障如線路故障等停止在線服務(wù)會對信譽,業(yè)務(wù)導(dǎo)致較大損失。因而咱們建議顧客使用高可用性方案。5.5.4切換環(huán)節(jié)向備份中心切換概要:(a)主中心端XPMCU由于劫難故障不能使用。卷組狀態(tài)

MCU

RCU服務(wù)器(主〕服務(wù)器(備用〕環(huán)節(jié)1:分析R-VOL一致性-從RCU看卷組狀態(tài)及更新拷備模式

RDeletePair環(huán)節(jié)2:刪除所有CA卷組-在RCU側(cè)執(zhí)行DeletePair命令-R-VOL狀態(tài)變?yōu)椤竤implex」

MCU

RCU服務(wù)器(主〕服務(wù)器(備用〕S如果沒有在備用服務(wù)器上再開新應(yīng)用,則到此為止。

MCU

RCU服務(wù)器(主〕服務(wù)器(備用〕S環(huán)節(jié)3:使用前準(zhǔn)備(如果在備用服務(wù)器上再開應(yīng)用〕-執(zhí)行Vgchang-ae命令-執(zhí)行Fsck命令-MountR-VOL

(b)由備份中心切換回主中心端

RCU

MCU服務(wù)器(主〕

服務(wù)器(備用〕MR環(huán)節(jié)4:中斷備用服務(wù)器上應(yīng)用,從服務(wù)器上將M-VOL解放(unmount)

RCU

MCU服務(wù)器(主〕

服務(wù)器(備用〕MR環(huán)節(jié)5:確任所有CA磁盤卷組狀態(tài)都變?yōu)镈uplex。(CA卷組處在同步狀態(tài)〕CA卷組狀態(tài)

服務(wù)器(主〕

服務(wù)器(備用〕

SS環(huán)節(jié)6:在RCU上刪除所有CA磁盤卷組。-DeletePair:刪除所有CA磁盤卷組-DeleteRCU-端口變更:將RCP變化為LCP。DeletePairDeleteRCU變更Portmode

MCU

RCU服務(wù)器(主〕

服務(wù)器(備用〕環(huán)節(jié)7:按本來方向建立CA磁盤卷組(不執(zhí)行初始拷貝〕,MountM-VOL->恢復(fù)主運用運營。將LCP端口改為RCP端口?AddRCU?AddPair

-MR

注:M:M-ROL,R:R-VOL,S:Simplex卷組

5.5.5XP容災(zāi)方案性能分析XP陣列在用光纖構(gòu)筑CAXP時,為了保證系統(tǒng)不會因單點故障,而浮現(xiàn)數(shù)據(jù)傳播中斷現(xiàn)象,規(guī)定至少配備兩根光纖通道,CNTUWM間一條光纖傳播速率為100MB/Sec,可通過轉(zhuǎn)換FC波長實現(xiàn)最多8路光纖信號同步傳播,即可達(dá)到800MB/Sec傳播帶寬.依照XXXX核心業(yè)務(wù)系統(tǒng)既有和將來一段時間發(fā)展業(yè)務(wù)量記錄,咱們可以得出結(jié)論,XXXX需要實現(xiàn)實時備份每秒鐘數(shù)據(jù)傳播量不大于以上線路實際傳播能力,因此不會引起遠(yuǎn)程數(shù)據(jù)復(fù)制傳播瓶頸現(xiàn)象,對于客戶系統(tǒng)數(shù)據(jù)有足夠傳送能力。對異步寫響應(yīng)時間計算:固然在衡量CA構(gòu)成合理性時,不能單單只注重數(shù)據(jù)傳送能力,尚有一種非常重要指標(biāo)就是關(guān)于CA卷組寫操作響應(yīng)時間。雖然對于異步寫操作而言,XP之間數(shù)據(jù)復(fù)制不直接影響生產(chǎn)系統(tǒng)正常寫操作。但是在距離較遠(yuǎn)時,由于時延較大,兩臺XP如果在較長時間里得不到互相信息,將會影響到應(yīng)用系統(tǒng)運營。關(guān)于CA卷組寫操作過程簡介中,咱們懂得完畢一種寫操作要有4個過程,其中影響寫性能某些有:MCU,RCU解決寫操作時間和由光纖引起延遲2某些。

總時延=主機(jī)時延+4*CNT時延+數(shù)據(jù)塊大小/帶寬(FC)+2*傳播時延

在XXXX容災(zāi)環(huán)境中,由于傳播距離約為10公里,經(jīng)計算,傳播時延約為0.05ms,CNTUWM時延為10ns(0.00001ms),因而對主機(jī)應(yīng)用性能無明顯影響.在實際狀況中,為保證系統(tǒng)正常運營,咱們必要同廣域網(wǎng)帶寬租賃商詳細(xì)確認(rèn)數(shù)據(jù)傳播延時(依照路由個數(shù))。

第六章 劫難備份恢復(fù)流程劫難恢復(fù)流程是指在主數(shù)據(jù)中心發(fā)生計算機(jī)系統(tǒng)故障或劫難事件時,為了盡量減少對業(yè)務(wù)導(dǎo)致?lián)p失,而制定急救辦法、故障隔離辦法、恢復(fù)環(huán)節(jié)和辦法、與各關(guān)于部門和人員聯(lián)系方式等。劫難恢復(fù)流程是控制風(fēng)險一種有效辦法,是劫難備份恢復(fù)一種重要構(gòu)成某些。劫難恢復(fù)流程內(nèi)容應(yīng)盡量詳盡,并易于操作。任何劫難恢復(fù)流程實行都需要有一種強(qiáng)有力、訓(xùn)練有素工作小組去操作,小組中人員應(yīng)熟知劫難恢復(fù)流程。平時應(yīng)對小組人員進(jìn)行培訓(xùn)和教誨,以便使小組中每個人都明白在救災(zāi)和恢復(fù)過程中應(yīng)肩負(fù)職責(zé),提高劫難救護(hù)和恢復(fù)技能。此外,應(yīng)定期對劫難恢復(fù)流程進(jìn)行演習(xí),使小組人員可以在劫難發(fā)生時做到從容不迫、緊張有序地開展急救、隔離和恢復(fù)工作。需要做好各個生產(chǎn)中心

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論