版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
容災(zāi)項(xiàng)目方案設(shè)計(jì)目錄
容災(zāi)技術(shù)規(guī)范作為風(fēng)險(xiǎn)防備系統(tǒng),災(zāi)備系統(tǒng)建設(shè)自身在總體規(guī)劃、方案選擇和投產(chǎn)實(shí)行后的管理運(yùn)行,以及真正面對(duì)劫難時(shí)的切換操作等方面也存在著潛在的風(fēng)險(xiǎn)。
計(jì)算機(jī)信息系統(tǒng)實(shí)現(xiàn)數(shù)據(jù)大集、應(yīng)用大集中后,系統(tǒng)的運(yùn)行安全成為風(fēng)險(xiǎn)控制的焦點(diǎn)。目前,已經(jīng)有多系統(tǒng)開始或準(zhǔn)備進(jìn)行災(zāi)備系統(tǒng)的建設(shè),災(zāi)備系統(tǒng)建設(shè)的目的是減災(zāi)容災(zāi),使計(jì)算機(jī)信息系統(tǒng)和數(shù)據(jù)可以最大程度地防備和化解多種意外和災(zāi)害所帶來的風(fēng)險(xiǎn)。然而,與大多數(shù)工程同樣,災(zāi)備系統(tǒng)建設(shè)自身在總體規(guī)劃、方案選擇和投產(chǎn)實(shí)行后的管理運(yùn)行,以及真正面對(duì)劫難時(shí)的切換操作等方面也存在著潛在的風(fēng)險(xiǎn)。
可以說,風(fēng)險(xiǎn)防備系統(tǒng)自身也存在風(fēng)險(xiǎn)點(diǎn),需要小心應(yīng)對(duì)。
災(zāi)備系統(tǒng)建設(shè)中所波及的潛在風(fēng)險(xiǎn)大體可分為技術(shù)風(fēng)險(xiǎn)、管理風(fēng)險(xiǎn)和投資風(fēng)險(xiǎn),其中尤以技術(shù)選擇風(fēng)險(xiǎn)最大,技術(shù)方案選擇優(yōu)越,可以規(guī)避一定的管理風(fēng)險(xiǎn)和投資風(fēng)險(xiǎn)。而這三者也存在內(nèi)在的互相關(guān)聯(lián),不一樣災(zāi)備級(jí)別對(duì)應(yīng)的建設(shè)投資規(guī)模、所采用的技術(shù)以及實(shí)行和管理的復(fù)雜度也不一樣,應(yīng)考慮保護(hù)計(jì)算機(jī)系統(tǒng)的原有投資并提高災(zāi)備系統(tǒng)建設(shè)投資的運(yùn)用率。容災(zāi)的總體規(guī)劃
真正的容災(zāi)是數(shù)據(jù)被不間斷的一致性訪問!在劫難備份的世界里,是有等級(jí)觀念的,級(jí)別不一樣,災(zāi)備系統(tǒng)所采用的技術(shù)和到達(dá)的功能是不一樣的,在系統(tǒng)建設(shè)資金投入方面的差距也很巨大。因此,對(duì)顧客來說,明確災(zāi)備系統(tǒng)建設(shè)的總體規(guī)劃十分必要。技術(shù)指標(biāo)RPO、RTO衡量容災(zāi)技術(shù)的兩個(gè)技術(shù)指標(biāo)RPO、RTORPO(RecoveryPointObjective):以數(shù)據(jù)為出發(fā)點(diǎn),重要指的是業(yè)務(wù)系統(tǒng)所能容忍的數(shù)據(jù)丟失量。及在發(fā)生劫難,容災(zāi)系統(tǒng)接替原生產(chǎn)系統(tǒng)運(yùn)行時(shí),容災(zāi)系統(tǒng)與原生產(chǎn)中心不一致的數(shù)據(jù)量。RPO是反應(yīng)恢復(fù)數(shù)據(jù)完整性的指標(biāo),在同步數(shù)據(jù)復(fù)制方式下,RPO等于數(shù)據(jù)傳播時(shí)延的時(shí)間;在異步數(shù)據(jù)復(fù)制方式下,RPO基本為異步傳播數(shù)據(jù)排隊(duì)的時(shí)間。在實(shí)際應(yīng)用中,考慮到數(shù)據(jù)傳播原因,業(yè)務(wù)數(shù)據(jù)庫與容災(zāi)備份數(shù)據(jù)庫的一致性(SCN)是不相似的,RPO表達(dá)業(yè)務(wù)數(shù)據(jù)與容災(zāi)備份數(shù)據(jù)的SCN的時(shí)間差。發(fā)生劫難后,啟動(dòng)容災(zāi)系統(tǒng)完畢數(shù)據(jù)恢復(fù),RPO就是新恢復(fù)業(yè)務(wù)系統(tǒng)的數(shù)據(jù)損失量。RTO(RecoveryTimeObjective):以應(yīng)用為出發(fā)點(diǎn),即應(yīng)用的恢復(fù)時(shí)間目的,重要指的是所能容忍的應(yīng)用停止服務(wù)的最長(zhǎng)時(shí)間,也就是從劫難發(fā)生到業(yè)務(wù)系統(tǒng)恢復(fù)服務(wù)功能所需要的最短時(shí)間周期。是反應(yīng)業(yè)務(wù)恢復(fù)及時(shí)性的指標(biāo),表達(dá)業(yè)務(wù)從中斷到恢復(fù)正常所需的時(shí)間。RTO值越小,代表容災(zāi)系統(tǒng)的數(shù)據(jù)恢復(fù)能力越強(qiáng)。多種容災(zāi)處理方案的RTO有較大差異,基于光通道技術(shù)的同步數(shù)據(jù)復(fù)制,配合異地備用的業(yè)務(wù)系統(tǒng)和跨業(yè)務(wù)中心與備份中心的高可用管理,這種容災(zāi)處理方案具有最小的RTO。容災(zāi)系統(tǒng)為獲得最小的RTO,需要投入大量資金。不一樣容災(zāi)方案的RTO和RPO是不相似的。國際原則SHARE?78要建設(shè)容災(zāi)系統(tǒng),就必須提出對(duì)應(yīng)的設(shè)計(jì)指標(biāo),以此作為衡量和選擇容災(zāi)處理方案的參數(shù)。目前,國際上通用的容災(zāi)系統(tǒng)的評(píng)審原則為SHARE78,重要包括如下內(nèi)容。
●備份/恢復(fù)的范圍
●劫難恢復(fù)計(jì)劃的狀態(tài)
●業(yè)務(wù)中心與容災(zāi)中心之間的距離
●業(yè)務(wù)中心與容災(zāi)中心之間怎樣連接
●數(shù)據(jù)是怎樣在兩個(gè)中心之間傳送的
●容許有多少數(shù)據(jù)丟失
●保證更新的數(shù)據(jù)在容災(zāi)中心被更新
●容災(zāi)中心可以開始容災(zāi)進(jìn)程的能力
SHARE78是建立容災(zāi)系統(tǒng)的一種評(píng)審原則。建立容災(zāi)系統(tǒng)的最終目的,是為了在劫難發(fā)生后可以以最迅速度恢復(fù)數(shù)據(jù)服務(wù),重要體目前RTOObjective)和RPO上。SHARE?78,?M028匯報(bào)中定義的災(zāi)備的七個(gè)級(jí)別和與其對(duì)應(yīng)的數(shù)據(jù)丟失量與恢復(fù)時(shí)間狀況詳見下表:劫難備份等級(jí)與業(yè)務(wù)恢復(fù)狀況對(duì)照表等級(jí)描述RPORTO企業(yè)比例0級(jí)無災(zāi)備計(jì)劃--<0.3%1級(jí)車輛運(yùn)送方式24~48小時(shí)>48小時(shí)<0.1%2級(jí)車輛運(yùn)送+熱備份24~48小時(shí)24小時(shí)90%3級(jí)電子傳送<24小時(shí)<24小時(shí)6%4級(jí)活動(dòng)狀態(tài)備份中心秒級(jí)<24小時(shí)<0.5%5級(jí)兩中心、兩階段確認(rèn)秒級(jí)<2小時(shí)<0.1%6級(jí)零數(shù)據(jù)丟失零丟失<2小時(shí)3%Tier0Tier0-無異地?cái)?shù)據(jù)備份(Nooff-siteData)Tier0被定義為沒有信息存儲(chǔ)的需求,沒有建立備份硬件平臺(tái)的需求,也沒有發(fā)展應(yīng)急計(jì)劃的需求,數(shù)據(jù)僅在當(dāng)?shù)剡M(jìn)行備份恢復(fù),沒有數(shù)據(jù)送往異地。這種方式是最為低成本的劫難備份處理方案,但實(shí)際上這種劫難備份并沒有真正劫難備份的能力,由于它的數(shù)據(jù)并沒有被送往遠(yuǎn)離當(dāng)?shù)氐牡胤?,而?shù)據(jù)的恢復(fù)也僅是運(yùn)用當(dāng)?shù)氐挠涗?。Tier1Tier1-PTAM車輛轉(zhuǎn)送方式(PickupTruckAccessMethod)作為Tier1的劫難備份方案需要設(shè)計(jì)一種應(yīng)急方案,可以備份所需要的信息并將它存儲(chǔ)在異地,然后根據(jù)劫難備份的詳細(xì)需求,有選擇地建立備份平臺(tái),但事先并不提供數(shù)據(jù)處理的硬件平臺(tái)。PTAM是一種用于許多中心備份的原則方式,數(shù)據(jù)在完畢寫操作之后,將會(huì)被送到遠(yuǎn)離當(dāng)?shù)氐牡胤?,同步具有有?shù)據(jù)恢復(fù)的程序。在劫難發(fā)生后,一整套系統(tǒng)和應(yīng)用安裝動(dòng)作需要在一臺(tái)未啟動(dòng)的計(jì)算機(jī)上重新完畢。系統(tǒng)和數(shù)據(jù)將被恢復(fù)并重新與網(wǎng)絡(luò)相連。這種劫難備份方案相對(duì)來說成本較低(僅僅需要傳播工具的消耗以及存儲(chǔ)設(shè)備的消耗)。但同步有難于管理的問題,即很難懂得什么樣的數(shù)據(jù)在什么樣的地方。一旦系統(tǒng)可以工作,原則的做法是首先恢復(fù)關(guān)鍵應(yīng)用,其他的應(yīng)用根據(jù)需要恢復(fù)。這樣的狀況下,恢復(fù)是也許的,但需要一定的時(shí)間,同步依賴于什么時(shí)候硬件平臺(tái)可以被提供準(zhǔn)備好。Tier2Tier2-PTAM卡車轉(zhuǎn)送方式+熱備份中心(PTAM+HotSite)Tier2相稱于是Tier1再加上具有熱備份能力中心的劫難備份。熱備份中心擁有足夠的硬件和網(wǎng)絡(luò)設(shè)備去支持關(guān)鍵應(yīng)用的安裝需求。對(duì)于十分關(guān)鍵的應(yīng)用,在劫難發(fā)生的同步,必須在異地有正運(yùn)行著的硬件平臺(tái)提供支持。這種劫難備份的方式依賴于用PTAM的措施去將平常數(shù)據(jù)放在異地存儲(chǔ),當(dāng)劫難發(fā)生的時(shí)候,數(shù)據(jù)再被移動(dòng)到一種熱備份的中心。雖然移動(dòng)數(shù)據(jù)到一種熱備份中心增長(zhǎng)了成本,但卻明顯減少了劫難備份的時(shí)間。Tier3Tier3-電子傳送(ElectronicVaulting)Tier3是在Tier2的基礎(chǔ)上用電子鏈路取代了車輛進(jìn)行數(shù)據(jù)傳送的劫難備份。接受方的硬件平臺(tái)必須與生產(chǎn)中心物理地相分離,在劫難發(fā)生后,存儲(chǔ)的數(shù)據(jù)用于劫難備份。由于熱備份中心要保持持續(xù)運(yùn)行,因此增長(zhǎng)了成本。但確實(shí)是消除了運(yùn)送工具的需要,提高了劫難備份的速度。Tier4Tier4-活動(dòng)狀態(tài)的備份中心(ActiveSecondarySite)Tier4這種劫難備份規(guī)定兩個(gè)中心同步處在活動(dòng)狀態(tài)并管理彼此的備份數(shù)據(jù),容許備份行動(dòng)在任何一種方向發(fā)生。接受方硬件平臺(tái)必須保證與另一方平臺(tái)物理地相分離,在這種狀況下,工作負(fù)載可以在兩個(gè)中心之間被分擔(dān),兩個(gè)中心之間之間彼此備份。在兩個(gè)中心之間,彼此的在線關(guān)鍵數(shù)據(jù)的拷貝不停地互相傳送著。在劫難發(fā)生時(shí),需要的關(guān)鍵數(shù)據(jù)通過網(wǎng)絡(luò)可迅速恢復(fù),通過網(wǎng)絡(luò)的切換,關(guān)鍵應(yīng)用的恢復(fù)時(shí)間也可減少到了小時(shí)級(jí)。Tier5Tier5-兩中心兩階段確認(rèn)(Two-SiteTwo-PhaseCommit)Tier5是在Tier4的基礎(chǔ)上在鏡像狀態(tài)上管理著被選擇的數(shù)據(jù)(根據(jù)單一commit范圍,在當(dāng)?shù)睾瓦h(yuǎn)程數(shù)據(jù)庫中同步更新著數(shù)據(jù)),也就是說,在更新祈求被認(rèn)為是滿意之前,Tier5需要生產(chǎn)中心與備份中心的數(shù)據(jù)都被更新。我們可以想象這樣一種情景,數(shù)據(jù)在兩個(gè)中心之間互相映像,由遠(yuǎn)程two-phasecommit來同步,由于關(guān)鍵應(yīng)用使用了雙重在線存儲(chǔ),因此在劫難發(fā)生時(shí),僅僅傳送中的數(shù)據(jù)被丟失,恢復(fù)的時(shí)間被減少到了小時(shí)級(jí)。Tier6Tier6-零數(shù)據(jù)丟失(ZeroDataLoss)Tier6可以實(shí)現(xiàn)零數(shù)據(jù)丟失率,同步保證數(shù)據(jù)立即自動(dòng)地被傳播到備份中心。Tier6被認(rèn)為是劫難備份的最高的級(jí)別,在當(dāng)?shù)睾瓦h(yuǎn)程的所有數(shù)據(jù)被更新的同步,運(yùn)用了雙重在線存儲(chǔ)和完全的網(wǎng)絡(luò)切換能力。Tier6是劫難備份中最昂貴的方式,也是速度最快的恢復(fù)方式,恢復(fù)的時(shí)間被減少到了分鐘級(jí)。對(duì)于Tier6的劫難備份處理方案,可以應(yīng)用兩種遠(yuǎn)程拷貝技術(shù)來實(shí)現(xiàn),即PPRC同步遠(yuǎn)程拷貝和XRC異步遠(yuǎn)程拷貝。因此,企業(yè)需要根據(jù)其計(jì)算機(jī)處理系統(tǒng)中數(shù)據(jù)的重要性,以及需要恢復(fù)的速度和程度,來進(jìn)行災(zāi)備系統(tǒng)建設(shè)的整體考慮和不一樣劫難對(duì)業(yè)務(wù)沖擊的分析,并最終確定災(zāi)備系統(tǒng)建設(shè)的總體規(guī)劃。災(zāi)備系統(tǒng)建設(shè)的總體規(guī)劃應(yīng)包括如下幾種方面:界定災(zāi)備系統(tǒng)的合用范圍分析不一樣的應(yīng)用系統(tǒng),確定災(zāi)備系統(tǒng)是一種覆蓋整個(gè)計(jì)算機(jī)系統(tǒng)的工程,根據(jù)業(yè)務(wù)的重要性,對(duì)不一樣的系統(tǒng)采用不一樣級(jí)別的容災(zāi)方案,如針對(duì)關(guān)鍵的業(yè)務(wù)應(yīng)用子系統(tǒng),實(shí)行高級(jí)別的容災(zāi)工程;對(duì)低級(jí)別的業(yè)務(wù)系統(tǒng),實(shí)行低級(jí)別的容災(zāi)工程??傊⒁环N綜合性的整體災(zāi)備建設(shè)工程。界定災(zāi)備建設(shè)的目的
生產(chǎn)系統(tǒng)在單位時(shí)間內(nèi)的數(shù)據(jù)處理能力或IO流量確定的狀況下,RPO實(shí)際上成為一種反應(yīng)災(zāi)備恢復(fù)過程中的數(shù)據(jù)丟失量的指標(biāo)。而RTO則是指從劫難發(fā)生到備份系統(tǒng)可以接管原有生產(chǎn)系統(tǒng)所需要花費(fèi)的時(shí)間,這不僅要考慮數(shù)據(jù)的恢復(fù)時(shí)間,還應(yīng)當(dāng)考慮恢復(fù)后數(shù)據(jù)的完整性、一致性的修復(fù)和確認(rèn)、備份中心計(jì)算機(jī)處理系統(tǒng)的啟動(dòng)和備份中心的網(wǎng)絡(luò)切換等所有時(shí)間。總體規(guī)劃中應(yīng)為災(zāi)備系統(tǒng)設(shè)定明確的RPO和RTO指標(biāo)。不過設(shè)計(jì)容災(zāi)系統(tǒng)不能只看RTO和RPO,對(duì)于不一樣的業(yè)務(wù)系統(tǒng)和顧客特殊的規(guī)定,其他某些指標(biāo)有也許成為選擇容災(zāi)處理方案的重要原因。例如,某些地區(qū)為了防備某些特定自然災(zāi)害的風(fēng)險(xiǎn),規(guī)定容災(zāi)備份中心與業(yè)務(wù)中心保持足夠的距離,在這種狀況下,容災(zāi)備份中心與業(yè)務(wù)中心的距離規(guī)定就是容災(zāi)系統(tǒng)的重要指標(biāo)。通信網(wǎng)絡(luò)是容災(zāi)系統(tǒng)的構(gòu)成部分,通信線路的質(zhì)量也是容災(zāi)系統(tǒng)的性能指標(biāo)之一,其中包括網(wǎng)絡(luò)的數(shù)據(jù)傳播帶寬、網(wǎng)絡(luò)傳播通道的冗余和網(wǎng)絡(luò)服務(wù)商的服務(wù)水平(網(wǎng)絡(luò)年中斷率)。假如容災(zāi)系統(tǒng)使用的通信網(wǎng)絡(luò)是確定的,為了比較不一樣容災(zāi)處理方案,可以用單位存儲(chǔ)容量的數(shù)據(jù)庫在同一通信網(wǎng)絡(luò)上的數(shù)據(jù)完全恢復(fù)時(shí)間作為一項(xiàng)設(shè)計(jì)指標(biāo)。大部分業(yè)務(wù)系統(tǒng)都是數(shù)據(jù)庫應(yīng)用構(gòu)造,但業(yè)務(wù)系統(tǒng)容災(zāi)并不等于是數(shù)據(jù)庫容災(zāi),還包括訪問數(shù)據(jù)庫的應(yīng)用程序和有關(guān)配置信息。實(shí)現(xiàn)數(shù)據(jù)庫容災(zāi)是容災(zāi)的基礎(chǔ),在保障數(shù)據(jù)庫數(shù)據(jù)一致的前提下,還要實(shí)現(xiàn)應(yīng)用程序和配置信息的一致性;實(shí)現(xiàn)應(yīng)用系統(tǒng)的高可用性、應(yīng)用程序在容災(zāi)中心與生產(chǎn)中心接管和切回的過程,因此,還要考慮應(yīng)用的模式是C/S、B/S,兩層、三層、多層次的應(yīng)用構(gòu)造等等。界定災(zāi)備系統(tǒng)的總體架構(gòu)
根據(jù)實(shí)際需求、既有技術(shù)、所在地區(qū)、計(jì)劃防備的劫難種類和預(yù)算投入的資金量等實(shí)際狀況,確定災(zāi)備系統(tǒng)預(yù)期到達(dá)的級(jí)別,并以此來確定災(zāi)備系統(tǒng)與生產(chǎn)運(yùn)行系統(tǒng)在地理位置上的距離(同城還是異地或兩者兼?zhèn)洌竟?jié)點(diǎn)),備份數(shù)據(jù)存儲(chǔ)所在的介質(zhì)(磁盤還是磁帶或兩者兼?zhèn)洌?,備份?shù)據(jù)在生產(chǎn)中心與備份中心傳播的方式(這就波及到了詳細(xì)的計(jì)算機(jī)存儲(chǔ)與網(wǎng)絡(luò)技術(shù)),以及備份中心計(jì)算機(jī)系統(tǒng)的處理能力和網(wǎng)絡(luò)接管所需的詳細(xì)架構(gòu)(與否與生產(chǎn)中心采用完全同等數(shù)量、容量和性能的計(jì)算機(jī)、存儲(chǔ)設(shè)備和網(wǎng)絡(luò)體系構(gòu)造)。主流容災(zāi)技術(shù)闡明數(shù)據(jù)備份數(shù)據(jù)備份是系統(tǒng)、數(shù)據(jù)容災(zāi)的基礎(chǔ),也是低端容災(zāi)的實(shí)現(xiàn),是高端容災(zāi)(實(shí)時(shí)數(shù)據(jù)保護(hù))的有力保障。目前備份技術(shù)重要有快照備份、離線備份、異地存儲(chǔ)備份。備份系統(tǒng)通過備份方略,對(duì)計(jì)算機(jī)信息系統(tǒng)的操作系統(tǒng)、文獻(xiàn)系統(tǒng)、應(yīng)用程序、數(shù)據(jù)庫系統(tǒng)等數(shù)據(jù)集,實(shí)現(xiàn)某一時(shí)間點(diǎn)的完整拷貝,拷貝的數(shù)據(jù)處在非在線狀態(tài),不能被立即訪問,必須通過對(duì)應(yīng)操作,如恢復(fù)等方式使用備份數(shù)據(jù)。這也處理了高端容災(zāi)(實(shí)時(shí)數(shù)據(jù)保護(hù))不能處理的問題:人為誤操作、惡意性操作等,此類操作,計(jì)算機(jī)系統(tǒng)是不能辨別的,一旦執(zhí)行,將導(dǎo)致數(shù)據(jù)中心、災(zāi)備中心同步修改;對(duì)于數(shù)據(jù)庫系統(tǒng),在日志方式下,可以通過回滾方式修改,對(duì)于文獻(xiàn)系統(tǒng)、操作系統(tǒng)等其他配置信息是不能回滾的,將導(dǎo)致消滅性的成果。因此在建設(shè)高端容災(zāi)系統(tǒng)的前提,一定要做好當(dāng)?shù)叵到y(tǒng)的備份,這是容災(zāi)技術(shù)的起點(diǎn)。目前成熟的備份軟件有SymantecNetBackup、EMCLegato,IBMTSM,HPProtectServer等等。實(shí)時(shí)數(shù)據(jù)保護(hù)實(shí)時(shí)數(shù)據(jù)保護(hù),就是在多塊磁盤上、多種陣列、多臺(tái)服務(wù)器、多種數(shù)據(jù)中心實(shí)時(shí)的保留同一份數(shù)據(jù)的多份存儲(chǔ),目的是為了防止物理故障,數(shù)據(jù)不會(huì)由于一塊磁盤、一種陣列、一臺(tái)服務(wù)器、一種數(shù)據(jù)中心的故障,而不能訪問。注意,實(shí)時(shí)數(shù)據(jù)保護(hù)需要以數(shù)據(jù)備份作為前提,它不能防備人為誤操作和惡性操作。這里我們要強(qiáng)調(diào)容災(zāi)的目的是讓數(shù)據(jù)在劫難發(fā)生時(shí),還能被訪問,通過實(shí)時(shí)數(shù)據(jù)保護(hù),保證數(shù)據(jù)的完整性;因此實(shí)時(shí)數(shù)據(jù)保護(hù)是容災(zāi)手段,而不是目的。目前實(shí)時(shí)數(shù)據(jù)保護(hù)的技術(shù)重要有兩種:數(shù)據(jù)鏡像和數(shù)據(jù)復(fù)制。數(shù)據(jù)鏡像(Mirroring)數(shù)據(jù)鏡像(Mirroring)是冗余的一種類型,一種磁盤上的數(shù)據(jù)在另一種磁盤上存在一種完全相似的副本即為鏡像。分軟件鏡像與硬件鏡像,它們的的區(qū)別就在于實(shí)現(xiàn)鏡像所需的CPU周期所處的位置。最終,都是根據(jù)程序的指令,為硬件(磁盤,以及磁盤上存儲(chǔ)的數(shù)據(jù))制作一種鏡像副本。鏡像可以保證兩份數(shù)據(jù)完全同樣。鏡像軟件有SymantecVolumeManager;各硬件廠商均有基于自己陣列的硬件鏡像方式。數(shù)據(jù)復(fù)制(Replication)數(shù)據(jù)復(fù)制(Replication)是將一種原數(shù)據(jù)的及其改動(dòng),通過后續(xù)機(jī)制拷貝到此外一處,可以是另一種磁盤、另一種陣列、另一種服務(wù)器、另一種數(shù)據(jù)中心。由于實(shí)現(xiàn)的機(jī)制不一樣,又分為同步復(fù)制和異步復(fù)制兩種方式。同步復(fù)制,可以保證兩份數(shù)據(jù)完全一致,但對(duì)系統(tǒng)的影響較大,一般不會(huì)采用;異步復(fù)制,通過后續(xù)機(jī)制,保證將當(dāng)?shù)馗膭?dòng)的數(shù)據(jù)復(fù)制的異地,對(duì)系統(tǒng)的影響較小,但數(shù)據(jù)同步有延遲,是目前實(shí)現(xiàn)遠(yuǎn)程數(shù)據(jù)同步的重要措施。根據(jù)實(shí)現(xiàn)機(jī)制,數(shù)據(jù)復(fù)制分為軟件方式和硬件方式;硬件方式往往又被稱為遠(yuǎn)程鏡像。軟件復(fù)制有SymantecVolumeReplicator;Datacore等;其中Symantec是基于卷的復(fù)制,Datacore是基于block的復(fù)制,類似于硬件的復(fù)制,純硬件復(fù)制有HDSTrueCopy、EMCSRDF等。其中軟件復(fù)制是可以跨硬件平臺(tái),可以實(shí)現(xiàn)多廠商集成,一般硬件復(fù)制則是相似品牌之間的磁盤子系統(tǒng)的操作。具有一定的限制性。軟件復(fù)制SymantecVolumeReplicator(簡(jiǎn)稱VVR)負(fù)責(zé)遠(yuǎn)程數(shù)據(jù)復(fù)制。VVR復(fù)制基于Volume進(jìn)行。復(fù)制的數(shù)據(jù)可以是數(shù)據(jù)庫中的數(shù)據(jù)(文獻(xiàn)方式或裸設(shè)備方式),數(shù)據(jù)庫日志,復(fù)制的數(shù)據(jù)也可以是多種文獻(xiàn),如應(yīng)用和數(shù)據(jù)庫配置文獻(xiàn),應(yīng)用程序,庫文獻(xiàn),等等。復(fù)制的示意圖見圖四。VVR與VxVM完全集成在一起。用VxVM管理界面和命令統(tǒng)一配置管理;由于VVR僅僅將Volume上每次I/O的實(shí)際數(shù)據(jù)實(shí)時(shí)復(fù)制到遠(yuǎn)程節(jié)點(diǎn),因此在網(wǎng)絡(luò)線路上傳播的數(shù)據(jù)量很少,對(duì)帶寬的需求也很小,因此也與應(yīng)用無關(guān),只要是在定義的復(fù)制卷上的任何操作,都會(huì)被復(fù)制到異地。Datacore則是基于軟件的塊設(shè)備復(fù)制,處在卷的更底層,屬于塊設(shè)備的遠(yuǎn)程復(fù)制,與基于卷的復(fù)制不一樣的是,他具有應(yīng)用操作系統(tǒng)的獨(dú)立性,數(shù)據(jù)的遠(yuǎn)程復(fù)制與操作系統(tǒng)無關(guān),并且不需要遠(yuǎn)端主機(jī)應(yīng)用系統(tǒng)的運(yùn)行,支持異步和同步的方式,并且與硬件存儲(chǔ)子系統(tǒng)不一樣的是,Datacore可以實(shí)現(xiàn)異構(gòu)存儲(chǔ)子系統(tǒng)的集中管理,打破了單一廠商選擇的限制,對(duì)于磁盤子系統(tǒng)的選擇愈加靈活。其復(fù)制示意圖如下:通過整合原有存儲(chǔ)子系統(tǒng)以及新購的存儲(chǔ)子系統(tǒng),將數(shù)據(jù)的改動(dòng)記錄在Datacore的SDS設(shè)備當(dāng)中,采用存儲(chǔ)轉(zhuǎn)發(fā)的傳播機(jī)制,運(yùn)用cache的技術(shù)和buffer的技術(shù),記錄數(shù)據(jù)的變化,然后通過傳播機(jī)制將所有應(yīng)用的數(shù)據(jù)傳播到對(duì)端,該軟件支持一對(duì)多的遠(yuǎn)程復(fù)制。類似于硬件復(fù)制,不過可以不受品牌限制。硬件復(fù)制以EMC的SRDF為例,如下圖:1.系統(tǒng)定期檢測(cè)磁盤物理數(shù)據(jù)塊的變化狀況。假如發(fā)既有數(shù)據(jù)塊改動(dòng),將會(huì)被系統(tǒng)記錄,并一次性將改動(dòng)過的數(shù)據(jù)塊考到復(fù)制緩存,這一動(dòng)作被稱為Switch??截惖骄彺嬷械臄?shù)據(jù)塊,在下一種Switch來臨之前,被復(fù)制到異地對(duì)應(yīng)的陣列緩存中。在下一種Switch時(shí),當(dāng)?shù)財(cái)?shù)據(jù)塊被復(fù)制到當(dāng)?shù)卮嬷?,而異地緩存中上一次被改?dòng)過的數(shù)據(jù)塊才被復(fù)制到容災(zāi)系統(tǒng)中。根據(jù)實(shí)應(yīng)用范圍,數(shù)據(jù)復(fù)制分為應(yīng)用復(fù)制、數(shù)據(jù)庫復(fù)制、卷復(fù)制、控制器復(fù)制。應(yīng)用復(fù)制,是指通過應(yīng)用系統(tǒng)直接向原生產(chǎn)中心和容災(zāi)中心同步發(fā)交易,生產(chǎn)中心和容災(zāi)中心都處理成功,該筆交易才算成功;只要有一邊應(yīng)用處理失敗,該筆交易就算失敗。由于交易的延遲性較大、強(qiáng)健性較差,應(yīng)用復(fù)制一般不會(huì)考慮。應(yīng)用應(yīng)用數(shù)據(jù)庫操作系統(tǒng)控制器物理磁盤數(shù)據(jù)塊SITEA應(yīng)用數(shù)據(jù)庫操作系統(tǒng)控制器物理磁盤SITEBIOLogSQL/Log交易數(shù)據(jù)庫復(fù)制數(shù)據(jù)庫復(fù)制,如Oracle的DataGuard、QuestSharePlex、DSGRealSync等,通過度析數(shù)據(jù)庫RedoLog和ArchiveLog實(shí)現(xiàn)日志的復(fù)制,將分析成果直接或轉(zhuǎn)化為SQL語句傳到容災(zāi)中心,在容災(zāi)中通過心Aply數(shù)據(jù)庫日志或?qū)⑷罩巨D(zhuǎn)化的SQL語句重做,來保證數(shù)據(jù)庫數(shù)據(jù)的一致性。數(shù)據(jù)庫復(fù)制實(shí)際上是應(yīng)用復(fù)制的數(shù)據(jù)庫實(shí)現(xiàn),復(fù)制方式通過異步完畢。卷復(fù)制如上SymantecVolumeReplicator??刂破鲝?fù)制,如上EMC的復(fù)制過程。DatacoreSDS實(shí)際上尚有一種新的復(fù)制方式,稱為基于SAN網(wǎng)絡(luò)的卷復(fù)制,如Datacore的SDS。它是通過特殊的運(yùn)行于操作系統(tǒng)上的SDSSAN控制器,實(shí)際是將低端的無智能存儲(chǔ)變?yōu)楦叨说闹悄艽鎯?chǔ),使得他們得以建立基于智能SAN控制器的卷,通過這種與主機(jī)應(yīng)用無關(guān),但與SDS控制器直接有關(guān)的卷實(shí)現(xiàn)復(fù)制。此種技術(shù)較新,目前具有多家廠商均向此方向發(fā)展,其中Datacore是較早的研發(fā)廠商,當(dāng)中尚有IBM的SVC和HDS的USP系列也是采用此種技術(shù)。應(yīng)用系統(tǒng)恢復(fù)正如前所述,數(shù)據(jù)復(fù)制是容災(zāi)的手段,不是目的,容災(zāi)的目的是數(shù)據(jù)的訪問。因此應(yīng)用的恢復(fù)和如下的網(wǎng)絡(luò)的恢復(fù)也是容災(zāi)的關(guān)鍵。應(yīng)用系統(tǒng)恢復(fù),這和系統(tǒng)的應(yīng)用模式直接有關(guān)。需要考慮應(yīng)用系統(tǒng)的應(yīng)用架構(gòu)。是Client/Server架構(gòu),還是Broswer/Server架構(gòu);是2層架構(gòu)、還是3層架構(gòu)、還是多層架構(gòu)。兩層架構(gòu),表達(dá)容災(zāi)中心的應(yīng)用只要啟動(dòng)數(shù)據(jù)庫就可以服務(wù)了。假如是三層架構(gòu),就意味著應(yīng)用系統(tǒng)除數(shù)據(jù)庫以外,尚有網(wǎng)絡(luò)服務(wù)程序,如中間件Tuxedo、CICS、WebLogic、WebSphere、9iAS、SAP等等。在容災(zāi)應(yīng)用切換時(shí),可以手工或自動(dòng)化的將這些服務(wù)一一啟動(dòng)。網(wǎng)絡(luò)系統(tǒng)恢復(fù)在劫難發(fā)生后,應(yīng)用切換到災(zāi)備中心了,當(dāng)?shù)氐膽?yīng)用前端需要重新訪問容災(zāi)節(jié)點(diǎn)的服務(wù),帶來此外一種問題,網(wǎng)絡(luò)怎樣切換?是建立新的網(wǎng)絡(luò),還是使用動(dòng)態(tài)路由,還是有其他措施?實(shí)際上最簡(jiǎn)樸的措施,就是通過外部DNS服務(wù)器,變化服務(wù)器名和IP的映射關(guān)系,將原服務(wù)器名映射到新的IP地址上,就可以運(yùn)用容災(zāi)網(wǎng)絡(luò),實(shí)現(xiàn)前端對(duì)容災(zāi)中心服務(wù)器數(shù)據(jù)的訪問。容災(zāi)切換過程就是在劫難發(fā)生后,數(shù)據(jù)庫切換、應(yīng)用重新啟動(dòng)、網(wǎng)絡(luò)實(shí)現(xiàn)切換等等,容災(zāi)中心接管原生產(chǎn)中心的整個(gè)過程;同步還包括了在原數(shù)據(jù)中心修復(fù)后,數(shù)據(jù)庫、應(yīng)用、網(wǎng)絡(luò)需要重新切會(huì)來的整個(gè)過程。這些過程,可以通過手工切換、也可以通過自動(dòng)化過程完畢。消防演習(xí)大部分的容災(zāi)方案,在項(xiàng)目實(shí)行后,很難有機(jī)會(huì)來實(shí)現(xiàn)預(yù)演,由于對(duì)于大部分方案來說,這種預(yù)演活動(dòng),需要花費(fèi)大量的人力財(cái)力。不過消防預(yù)演是必不可少的,它是實(shí)時(shí)測(cè)試目前的容災(zāi)方案的漏洞,保證容災(zāi)方案在劫難發(fā)生時(shí),可以真正生效。主流容災(zāi)技術(shù)分析與對(duì)比沒有一種技術(shù)可以處理所有得IT問題,因此,也沒有一種處理方案是完美無缺得,根據(jù)現(xiàn)實(shí)狀況、技術(shù)規(guī)定、和未來的拓展,我們?cè)诖擞懻摰氖亲詈线m容災(zāi)技術(shù)的處理方案。數(shù)據(jù)備份SHARE78評(píng)審原則中,Tier0、Tier1、Tier2級(jí)別容災(zāi)要處理的問題。如前面所論述的,數(shù)據(jù)備份是容災(zāi)系統(tǒng)的起點(diǎn),是最低端的容災(zāi)方案。不是說有了高端的實(shí)時(shí)容災(zāi)方案,就可以不要備份系統(tǒng)了,由于實(shí)時(shí)容災(zāi)不能處理惡性操作、誤操作等故障,而備份系統(tǒng)可以處理。在此我們要討論的是,怎樣運(yùn)用既有的備份系統(tǒng),是容災(zāi)方案愈加完備。備份軟件必須具有跨平臺(tái)能力,對(duì)目前所有的操作系統(tǒng)AIX、Solaris、HP-Unix、Windows、數(shù)據(jù)庫Oracle、SQLServer、DB2、SybaseASE等,備份軟件除了要可以很好的備份有關(guān)的文獻(xiàn)系統(tǒng)數(shù)據(jù)、數(shù)據(jù)庫系統(tǒng)數(shù)據(jù)外,同步必須要滿足系統(tǒng)的裸機(jī)迅速恢復(fù)功能,減少系統(tǒng)重建時(shí)間,可以對(duì)AIX、Solaris、HP-Unix、Windows、Linux操作系統(tǒng)實(shí)現(xiàn)備份,備份這些操作系統(tǒng)的有關(guān)補(bǔ)丁、外設(shè)驅(qū)動(dòng)程序、有關(guān)的文獻(xiàn)系統(tǒng)配置信息、有關(guān)的卷配置信息、內(nèi)核參數(shù)等。在劫難修復(fù)時(shí),可以通過恢復(fù)的方式迅速恢復(fù)有關(guān)操作系統(tǒng)。實(shí)際經(jīng)驗(yàn),操作系統(tǒng)安裝、打補(bǔ)丁,安裝有關(guān)驅(qū)動(dòng)程序、恢復(fù)內(nèi)核參數(shù)、恢復(fù)文獻(xiàn)系統(tǒng)配置、恢復(fù)卷管理系統(tǒng)配置等整個(gè)過程,可以縮短在1小時(shí)內(nèi)完畢,并且減少了人為錯(cuò)誤操作過程。這樣大大提高了原生產(chǎn)中心容災(zāi)恢復(fù)的能力。目前市場(chǎng)上的備份產(chǎn)品,Veritas是市場(chǎng)擁有率最高,功能相對(duì)較全的產(chǎn)品,其他備份產(chǎn)品,或沒有類似與BMR的模塊;或是不能支持AIX、Solaris、HP-Unix、Windows、Linux所有操作系統(tǒng),這些顧客可以根據(jù)實(shí)際狀況來選擇。備份軟件還必須對(duì)遠(yuǎn)程磁帶具有管理功能,可以實(shí)現(xiàn)對(duì)備份數(shù)據(jù)的自動(dòng)拷貝,并實(shí)現(xiàn)異地寄存和管理。-Share78中Tier1、Tier2級(jí)別容災(zāi)。實(shí)時(shí)數(shù)據(jù)保護(hù)SHARE78評(píng)審原則中,Tier3級(jí)別容災(zāi)。數(shù)據(jù)鏡像(Mirroring)數(shù)據(jù)鏡像分軟件鏡像與硬件鏡像。硬件鏡像通過硬件級(jí)別的Raid-1實(shí)現(xiàn),其實(shí)現(xiàn)過程簡(jiǎn)樸,但規(guī)定嚴(yán)格。只能基于同一廠商、同一陣列、同樣容量大小的兩塊磁盤來實(shí)現(xiàn)。基本上硬件的磁盤子系統(tǒng)供應(yīng)商都提供可以實(shí)現(xiàn)此種功能的設(shè)備,但一般價(jià)格較高,投入大,并且只能限定在同一廠商品牌。軟件鏡像軟件鏡像可以實(shí)現(xiàn)邏輯卷級(jí)鏡像,對(duì)存儲(chǔ)空間規(guī)定較低,只要有空間且至少兩塊磁盤就行。不規(guī)定同一廠商、同一陣列、同樣容量大小的兩塊磁盤,軟件鏡像可以實(shí)現(xiàn)跨廠商、跨陣列的鏡像,在磁盤空間不均時(shí),可以實(shí)現(xiàn)1塊磁盤對(duì)多塊磁盤、N塊磁盤對(duì)M塊磁盤的鏡像。軟件鏡像的產(chǎn)品有Symantec的Storagefoundation,這種軟件一般安裝在主機(jī)上,通過主機(jī)的線程對(duì)鏡像進(jìn)行控制。軟件智能存儲(chǔ)鏡像目前新興的虛擬存儲(chǔ)技術(shù),使得讓本來非智能的存儲(chǔ)可以實(shí)現(xiàn)智能化,變化了本來只有高端存儲(chǔ)才具有的智能功能的局面,這種智能的控制器軟件可以實(shí)現(xiàn)存儲(chǔ)間的鏡像和存儲(chǔ)內(nèi)部的硬盤鏡像,同步,此種軟件的可以實(shí)現(xiàn)跨廠商的磁盤子系統(tǒng)設(shè)備的鏡像。鏡像技術(shù)在容災(zāi)中的運(yùn)用在通過SAN的支持,DWDM的拓展,光纖網(wǎng)絡(luò)可以擴(kuò)展到100公里或更遠(yuǎn),鏡像可以在較遠(yuǎn)的兩個(gè)數(shù)據(jù)中心的磁盤上建立。但由于鏡像系統(tǒng)是以同步方式實(shí)現(xiàn)的,受到距離、光纖協(xié)議、和有關(guān)協(xié)議轉(zhuǎn)換的影響,同步方式會(huì)影響當(dāng)?shù)胤?wù)器的性能,因此,一般提議在<20公里的同城容災(zāi)中使用,在遠(yuǎn)程容災(zāi)中可作為一種加強(qiáng)方案與遠(yuǎn)程容災(zāi)方案整合,將在我們的詳細(xì)方案中描述。常說的基于硬件的遠(yuǎn)程磁盤鏡像,實(shí)際上是遠(yuǎn)程磁盤復(fù)制,不是真正意義上的鏡像。我們將在后續(xù)文章描述?;赟AN的鏡像,在容災(zāi)實(shí)現(xiàn)中,使用范圍較小,如上說述,合用于同城容災(zāi),但支持所有的類型數(shù)據(jù)同步,包括文獻(xiàn)數(shù)據(jù)、數(shù)據(jù)庫數(shù)據(jù)、裸設(shè)備、應(yīng)用配置文獻(xiàn)、應(yīng)用程序、庫函數(shù)等,因而支持各類應(yīng)用系統(tǒng)容災(zāi),包括數(shù)據(jù)庫、中間件、客戶自己開發(fā)的應(yīng)用,合用于2層架構(gòu)、3層或多層應(yīng)用架構(gòu)。數(shù)據(jù)復(fù)制(Replication)數(shù)據(jù)復(fù)制是運(yùn)程容災(zāi)實(shí)現(xiàn)的基礎(chǔ)。軟件復(fù)制(卷復(fù)制)卷復(fù)制軟件負(fù)責(zé)遠(yuǎn)程數(shù)據(jù)復(fù)制。復(fù)制基于卷進(jìn)行,將數(shù)據(jù)尤其是需要進(jìn)行遠(yuǎn)程復(fù)制的有關(guān)文獻(xiàn)系統(tǒng)、數(shù)據(jù)庫、裸設(shè)備、應(yīng)用程序等,寄存在復(fù)制卷組中,系統(tǒng)便能自動(dòng)同步當(dāng)?shù)睾彤惖貙?duì)應(yīng)的復(fù)制卷組。卷復(fù)制軟件與卷管理軟件完全集成在一起。由于卷復(fù)制軟件僅僅將卷上每次I/O的操作復(fù)制到遠(yuǎn)程節(jié)點(diǎn),復(fù)制的信息是卷的日志,因此在網(wǎng)絡(luò)線路上傳播的數(shù)據(jù)量很少,對(duì)帶寬的需求也較小。;基于卷的日志(SRL:先進(jìn)先出)保正了再極端狀況下,如容災(zāi)網(wǎng)絡(luò)中斷、數(shù)據(jù)復(fù)制不能正常進(jìn)行,容災(zāi)中心數(shù)據(jù)于生產(chǎn)中心數(shù)據(jù)有延遲,在一切故障排除后,可以嚴(yán)格保證因此I/O的寫次序,此類似于數(shù)據(jù)庫數(shù)據(jù)塊和數(shù)據(jù)庫日志的關(guān)系,通過帶時(shí)間戳的數(shù)據(jù)塊和次序日志,保證數(shù)據(jù)的一致性?;谲浖倪h(yuǎn)程復(fù)制,在容災(zāi)實(shí)現(xiàn)中,使用范圍最廣,支持所有的類型數(shù)據(jù)同步,包括文獻(xiàn)數(shù)據(jù)、數(shù)據(jù)庫數(shù)據(jù)、裸設(shè)備、應(yīng)用配置文獻(xiàn)、應(yīng)用程序、庫函數(shù)等,支持各類應(yīng)用系統(tǒng)容災(zāi),包括數(shù)據(jù)庫、中間件、客戶自己開發(fā)的應(yīng)用,合用于2層架構(gòu)、3層或多層應(yīng)用架構(gòu)。硬件復(fù)制通過基于硬件的遠(yuǎn)程磁盤鏡像實(shí)現(xiàn),其實(shí)現(xiàn)規(guī)定嚴(yán)格。只能基于同一廠商、同型號(hào)陣列、同樣容量大小的兩個(gè)陣列來實(shí)現(xiàn)。廠商一般提議使用間歇性復(fù)制。遠(yuǎn)程磁盤鏡像(復(fù)制),在容災(zāi)實(shí)現(xiàn)中,支持所有的類型數(shù)據(jù)同步,包括文獻(xiàn)數(shù)據(jù)、數(shù)據(jù)庫數(shù)據(jù)、裸設(shè)備、應(yīng)用配置文獻(xiàn)、應(yīng)用程序、庫函數(shù)等,支持各類應(yīng)用系統(tǒng)容災(zāi),包括數(shù)據(jù)庫、中間件、客戶自己開發(fā)的應(yīng)用,合用于2層架構(gòu)、3層或多層應(yīng)用架構(gòu)。與應(yīng)用無關(guān),但與磁盤陣列直接有關(guān)。只能基于同一廠商、同樣容量大小的兩個(gè)陣列來實(shí)現(xiàn)。受光纖線路影響、復(fù)制數(shù)據(jù)量大,在使用間歇性復(fù)制時(shí),數(shù)據(jù)延遲大,磁盤容量規(guī)定4倍于源數(shù)據(jù),并且在極端狀況下,不能保證數(shù)據(jù)一致性。硬件復(fù)制的過程,在上文已經(jīng)描述。下面我們將描述極端狀況。磁盤復(fù)制在生產(chǎn)中心和容災(zāi)中心復(fù)制的是改動(dòng)過的物理數(shù)據(jù)塊,而物理數(shù)據(jù)塊的寫是無序的。為了保證數(shù)據(jù)的一致性,通過帶時(shí)間戳的數(shù)據(jù)塊,改善了一定的數(shù)據(jù)塊的無序性,但仍然不能處理。我們看到,數(shù)據(jù)庫是通過帶時(shí)間戳的數(shù)據(jù)塊和聯(lián)機(jī)日志一起來處理,假如一種數(shù)據(jù)文獻(xiàn)中的數(shù)據(jù)塊的時(shí)間戳不一致,數(shù)據(jù)庫需要日志來修正,日志中記錄的是某些有序的數(shù)據(jù)庫操作,通過Recover的動(dòng)作,將不一致的數(shù)據(jù)文獻(xiàn),前滾或后滾到某一特定期間點(diǎn)。帶時(shí)間戳的數(shù)據(jù)文獻(xiàn)和有序的日志,兩者缺一不可,否則不能保證數(shù)據(jù)的一致性。在磁盤復(fù)制中,唯獨(dú)少了至關(guān)重要的磁盤寫日志(不也許有)。更有甚,假如這種磁盤塊的無序?qū)?,發(fā)生在數(shù)據(jù)庫的聯(lián)機(jī)日志上,那將對(duì)數(shù)據(jù)庫數(shù)據(jù)的一致性導(dǎo)致破壞?;谲浖刂破鞯膹?fù)制基于軟件控制器的復(fù)制,打破了基于硬件的復(fù)制的單廠商設(shè)備的限制,并且具有更大的靈活性,通過建立虛擬磁盤卷的鏡像關(guān)系,真正可以建立數(shù)據(jù)的鏡像,其與軟件復(fù)制的不一樣之處又在于其對(duì)應(yīng)用的無關(guān)性,這點(diǎn)又與基于硬件的復(fù)制相似。在前面我們提到基于塊設(shè)備復(fù)制的應(yīng)用無關(guān)性,不過也具有對(duì)數(shù)據(jù)庫的數(shù)據(jù)一致性的問題,所幸的是這種基于軟件控制器的復(fù)制可以具有比基于純硬件復(fù)制更多的定制功能,可以對(duì)數(shù)據(jù)庫的數(shù)據(jù)一致性提供支持,其實(shí)現(xiàn)的方式是在數(shù)據(jù)庫的運(yùn)行主機(jī)上安裝agent或者是編寫腳本的方式實(shí)現(xiàn),并且腳本與軟件控制器想結(jié)合,從而保證數(shù)據(jù)庫的數(shù)據(jù)復(fù)制一致性,防止在極端狀況下的數(shù)據(jù)損失。我們可以認(rèn)為基于軟件控制器的數(shù)據(jù)復(fù)制是一種介于卷復(fù)制和硬件控制器復(fù)制之間的數(shù)據(jù)復(fù)制方式。并且處理了單一硬件廠商平臺(tái)的限制,是未來的主流發(fā)展方向。數(shù)據(jù)庫復(fù)制數(shù)據(jù)庫復(fù)制,如Oracle的DataGuard、QuestSharePlex、DSGRealSync等,通過度析數(shù)據(jù)庫RedoLog和ArchiveLog實(shí)現(xiàn)日志的復(fù)制,將分析成果直接或轉(zhuǎn)化為SQL語句傳到容災(zāi)中心,在容災(zāi)中通過心Aply數(shù)據(jù)庫日志或?qū)⑷罩巨D(zhuǎn)化的SQL語句重做,來保證容災(zāi)中心數(shù)據(jù)與生產(chǎn)中心數(shù)據(jù)一致。數(shù)據(jù)庫復(fù)制也存在一定的限制,在簡(jiǎn)樸的環(huán)境中,實(shí)現(xiàn)兩個(gè)較小的數(shù)據(jù)庫數(shù)據(jù)同步,可以說是一種簡(jiǎn)化的處理方案。對(duì)于容災(zāi)環(huán)境,其部分限制如下。數(shù)據(jù)庫復(fù)制,是專門針對(duì)對(duì)應(yīng)數(shù)據(jù)庫的,只能實(shí)現(xiàn)單一的數(shù)據(jù)庫復(fù)制。既有的數(shù)據(jù)庫就有Oracle,SQLServer,DB2,SybaseASE。在容災(zāi)系統(tǒng)中,假如使用數(shù)據(jù)庫復(fù)制方式,管理員將要維護(hù)Oracle一套、SQLServer一套、DB2一套、等互相各不相似的數(shù)據(jù)庫復(fù)制技術(shù),管理和維護(hù)工作主線不能保證其可以正常運(yùn)行。下面我們就以O(shè)racle為例,雖然有眾多廠商、技術(shù)方案支持的數(shù)據(jù)庫復(fù)制,仍然有不可逾越的技術(shù)障礙。Oracle數(shù)據(jù)庫的容災(zāi)復(fù)制被稱為StandbyDatabase,其產(chǎn)生于Oracle7.3,在Oracle9i后,改稱為DataGuard。StandbyDatabase又分為PhysicalStandby,和LogicalStandby。PhysicalStandby方式是將生產(chǎn)中心產(chǎn)生的數(shù)據(jù)庫redolog和archivelog,不停復(fù)制到容災(zāi)中心,不停的applylog,來實(shí)現(xiàn)容災(zāi)中心的數(shù)據(jù)庫與生產(chǎn)中心一致。LogicalStandby,是通過解析redolog和archivelog,產(chǎn)生有關(guān)的SQL語句,把這些語句傳到容災(zāi)中心重做。QuestSharePlex和DSG的Realsync類似與DataGuard的LogicalStandby,復(fù)制SQL語句。1.容災(zāi)的目的是使數(shù)據(jù)可以被正常訪問,業(yè)務(wù)可以正常運(yùn)行。數(shù)據(jù)庫復(fù)制技術(shù),不是一種完整的容災(zāi)處理方案,只能有限的復(fù)制數(shù)據(jù)庫數(shù)據(jù),不能復(fù)制其他的應(yīng)用程序,配置文獻(xiàn),就是Oracle自己的tnsnames.ora,listner.ora,initSID.ora,*.ctl也不能復(fù)制,一旦這些文獻(xiàn)改動(dòng)過,將需要管員人為操作或者需要其他軟件的管理,保證容災(zāi)中心與生產(chǎn)中心同步應(yīng)用、程序、配置文獻(xiàn)同步。2.由于DataGuard是通過日志來實(shí)現(xiàn)的,這規(guī)定數(shù)據(jù)庫必須運(yùn)行在歸檔日志模式下。但我們懂得,并不是所有的數(shù)據(jù)庫操作都寫日志:oracle的DML(DataManipulationLanguage)或DDL(DataDictionaryLanguage)語句是不能被復(fù)制的,如createindex、table,altertable等等;觸發(fā)器、存儲(chǔ)過程操作不能被復(fù)制;系統(tǒng)升級(jí)、patchs更新不能被復(fù)制。3.與備份軟件的沖突。如前所述,對(duì)于關(guān)鍵應(yīng)用系統(tǒng),數(shù)據(jù)備份必不可少。對(duì)于數(shù)據(jù)庫的備份,也規(guī)定數(shù)據(jù)庫在歸檔模式下運(yùn)行。備份系統(tǒng)在備份作用發(fā)起時(shí),需要備份數(shù)據(jù)文獻(xiàn)、controlfile、歸檔日志、甚至需要數(shù)據(jù)庫實(shí)現(xiàn)強(qiáng)制歸檔,來備份歸檔日志,備份作業(yè)成功后,由備份系統(tǒng)自動(dòng)刪除備份過的歸檔日志,應(yīng)為當(dāng)數(shù)據(jù)庫運(yùn)行在歸檔日志模式下時(shí),歸檔日志往往因數(shù)據(jù)庫繁忙而迅速大量產(chǎn)生,需要備份軟件自動(dòng)清除維護(hù),否則當(dāng)歸檔日志空間占滿后,聯(lián)機(jī)日志不能歸檔時(shí),生產(chǎn)數(shù)據(jù)庫不在運(yùn)作,則所有應(yīng)用業(yè)務(wù)不能操作,釀成生產(chǎn)事故。為了不影響生產(chǎn)環(huán)境,問題一,在備份作業(yè)發(fā)起,強(qiáng)制歸檔;備份完畢后,刪除歸檔日志后,數(shù)據(jù)庫復(fù)制軟件,該怎樣操作,將嚴(yán)重導(dǎo)致生產(chǎn)中心和容災(zāi)中心數(shù)據(jù)不一致。假如備份作用不刪除歸檔日志,系統(tǒng)管理員將不定期的來維護(hù)歸檔目錄,他必須懂得當(dāng)?shù)貧w檔目錄中,哪一種歸檔日志已經(jīng)被備份,通過檢查容災(zāi)中心數(shù)據(jù)庫中哪一種歸檔日志已經(jīng)被apply,這將是一種惡夢(mèng)同樣的維護(hù)工作。4.極限狀況下的危害。當(dāng)生產(chǎn)中心和容災(zāi)中心的復(fù)制鏈路一定期期內(nèi)不能恢復(fù)時(shí),同樣需要在生產(chǎn)主機(jī)中保留所有的歸檔日志,這又需要管理員大量的維護(hù)工作。應(yīng)用系統(tǒng)恢復(fù)對(duì)于關(guān)鍵的應(yīng)用環(huán)境,在實(shí)現(xiàn)容災(zāi)前,一般都規(guī)定在當(dāng)?shù)貙?shí)現(xiàn)高可用性,通過集群軟件,保證應(yīng)用、數(shù)據(jù)訪問在服務(wù)器級(jí)故障,如網(wǎng)卡、IP、操作系統(tǒng)、磁盤、其他有關(guān)應(yīng)用的故障時(shí),可以自動(dòng)切換到此外一臺(tái)可用的服務(wù)器上,可以被顧客繼續(xù)訪問。容災(zāi)應(yīng)用切換,就是把這種高可用性的應(yīng)用,拓展到廣域網(wǎng)上。也就是說通過HA軟件實(shí)現(xiàn)生產(chǎn)中心的高可用、實(shí)現(xiàn)容災(zāi)中心應(yīng)用的自動(dòng)啟動(dòng)、實(shí)現(xiàn)生產(chǎn)中心在劫難修復(fù)后應(yīng)用的回切過程。目前主流的高可用方案重要有SymantecVCS、IBMHACMP、HPMC/ServiceGuard、SunCluster、WindowsCCS等。各廠商軟件的名字上,我們就可以看到他們的局限性。只能支持自己的平臺(tái)。也就是意味著假如使用他們的處理方案,得分別熟悉AIX、HP-Unix、Solaris、Windows,得在分別熟悉IBMHACMP、HPMC/ServiceGuard、SunCluster、WindowsCCS軟件,并且這些軟件大部分只提供命令行管理、調(diào)試方式,這在管理上又是一大難題。SymantecVCS則是目前市場(chǎng)上主流的跨平臺(tái)集群軟件之一,擁有70%的高端應(yīng)用市場(chǎng)。通過統(tǒng)一得圖形化JAVAGUI或WebGUI,提供對(duì)AIX、HP-Unix、Solaris、Windows、Linux所有操作系統(tǒng)平臺(tái)、所有數(shù)據(jù)庫Oracle、OracleRAC、SQLServer、Sybase、DB2、所有中間件:Weblogic、WebSphere、9iAs、Tuxedo,甚至是顧客自己寫得應(yīng)用程序,實(shí)現(xiàn)得集中統(tǒng)一的集群管理和監(jiān)控。并且可以定義這些服務(wù)啟動(dòng)、切換得先后次序,以保證數(shù)據(jù)可以迅速正常訪問。例如在WebLogicServer啟動(dòng)之前,必須先啟動(dòng)Oracle,由于在WebLogicServer啟動(dòng)是會(huì)建立數(shù)據(jù)庫得連接池,假如數(shù)據(jù)庫未啟動(dòng),WebLogicServer啟動(dòng)將失敗。在劫難發(fā)生時(shí),VCS將根據(jù)這些服務(wù)組之間得關(guān)系,先后依次啟動(dòng)各個(gè)服務(wù)組。大大提供容災(zāi)中心服務(wù)得接管速度。網(wǎng)絡(luò)系統(tǒng)恢復(fù)在劫難發(fā)生后,當(dāng)?shù)貞?yīng)用訪問途徑怎樣由指向原生產(chǎn)中心改為指向容災(zāi)中心。在劫難修復(fù)后,又需要指向原生產(chǎn)中心。我們提到,最簡(jiǎn)樸得措施就是更改外部DNS服務(wù)器得IP映射關(guān)系。在劫難發(fā)生前,IP映射為生產(chǎn)中心服務(wù)器;在劫難發(fā)生后,IP由映射為容災(zāi)中心得服務(wù)器;在劫難修復(fù)后,IP又映射為生產(chǎn)中心得服務(wù)器。當(dāng)然,在某些中間件軟件中,支持多服務(wù)器、多IP得配置,那也是可以考慮的。容災(zāi)系統(tǒng)設(shè)計(jì)環(huán)節(jié)如上圖,對(duì)于容災(zāi)系統(tǒng)的建立,我們提議通過度步實(shí)行,逐漸建立一套完善的系統(tǒng)容災(zāi)處理方案。第一步,深化數(shù)據(jù)備份系統(tǒng);第二步,存儲(chǔ)、應(yīng)用整合;第三步,實(shí)現(xiàn)遠(yuǎn)程實(shí)時(shí)數(shù)據(jù)保護(hù);第四步,建立遠(yuǎn)程切換消防演習(xí)機(jī)制;第五步,建立遠(yuǎn)程切換機(jī)制。第一步,深化數(shù)據(jù)備份系統(tǒng)通過對(duì)應(yīng)的備份軟件,對(duì)目前所有的計(jì)算機(jī)系統(tǒng),做好完善的數(shù)據(jù)備份,尤其是做好操作系統(tǒng)備份、文獻(xiàn)系統(tǒng)備份、數(shù)據(jù)庫系統(tǒng)文獻(xiàn)備份、數(shù)據(jù)庫數(shù)據(jù)文獻(xiàn)備份、有關(guān)的關(guān)鍵應(yīng)用程序備份;建立好完善的備份/恢復(fù)機(jī)制和遠(yuǎn)程磁帶保管機(jī)制。這也是下一步實(shí)現(xiàn)遠(yuǎn)程數(shù)據(jù)復(fù)制容災(zāi)的基礎(chǔ),容災(zāi)中心與生產(chǎn)中心的數(shù)據(jù)初始化同步,都是通過磁帶備份恢復(fù)方式,實(shí)現(xiàn)一種同步起點(diǎn)。第二步,存儲(chǔ)、應(yīng)用整合存儲(chǔ)整合通過有關(guān)的產(chǎn)品選擇,將各服務(wù)器的數(shù)據(jù)、或應(yīng)用,通過基于一定的管理及后續(xù),實(shí)現(xiàn)數(shù)據(jù)的快照、鏡像等技術(shù),遷移到外置基于SAN的陣列庫中,通過唯一的管理接口,實(shí)現(xiàn)統(tǒng)一管理,屏蔽不一樣廠商陣列的差異。應(yīng)用整合通過對(duì)應(yīng)的應(yīng)用集群管理軟件,管理所有的應(yīng)用系統(tǒng)狀態(tài)。對(duì)既有的數(shù)據(jù)庫系統(tǒng)Oracle、SQLServer、DB2、Sybase、中間件等應(yīng)用,實(shí)現(xiàn)雙機(jī)、多機(jī)或是單機(jī)集群管理。操作系統(tǒng)平臺(tái)相似的,可以整合在一起,實(shí)現(xiàn)多機(jī)集群,不一樣的數(shù)據(jù)庫實(shí)例,只是作為一種“數(shù)據(jù)庫服務(wù)組”,運(yùn)行在多機(jī)或雙機(jī)中的某一臺(tái)服務(wù)器上,為中間件、其他應(yīng)用建立“應(yīng)用服務(wù)組”,也納入到集群軟件的管理;并且動(dòng)過集權(quán)軟件建立“應(yīng)用服務(wù)組”與“數(shù)據(jù)庫服務(wù)組”或其他“應(yīng)用服務(wù)組”的依賴關(guān)系,實(shí)現(xiàn)對(duì)應(yīng)用啟動(dòng)、關(guān)閉的有序管理。假如是OracleRAC的應(yīng)用,則需要集權(quán)軟件支持,因此在選擇集權(quán)管理軟件時(shí)要納入考慮原因,通過RAC的支持使得數(shù)據(jù)庫的RAC應(yīng)用也在集群軟件的管理之下。第三步,實(shí)現(xiàn)遠(yuǎn)程實(shí)時(shí)數(shù)據(jù)卷保護(hù)通過第二步的存儲(chǔ)和應(yīng)用整合,使得所有需要容災(zāi)的關(guān)鍵系統(tǒng),所有納入到一種統(tǒng)一的管理平臺(tái)之下,我們將規(guī)劃好應(yīng)用數(shù)據(jù)的寄存方式、數(shù)據(jù)文獻(xiàn)的寄存地點(diǎn)、日志的寄存地點(diǎn),然后統(tǒng)一為這些數(shù)據(jù)指定一定的存儲(chǔ)方略,實(shí)現(xiàn)遠(yuǎn)程數(shù)據(jù)復(fù)制。第四步,建立遠(yuǎn)程切換消防演習(xí)機(jī)制在數(shù)據(jù)庫復(fù)制初始化完畢,有關(guān)應(yīng)用復(fù)制完畢,就可以實(shí)既有關(guān)應(yīng)用的消防演習(xí)了。這是保證容災(zāi)系統(tǒng)正常唯一的、最有效的手段,整個(gè)過程生產(chǎn)中心應(yīng)用在線。對(duì)數(shù)據(jù)庫實(shí)現(xiàn)快照;啟動(dòng)數(shù)據(jù)庫;啟動(dòng)有關(guān)的應(yīng)用;通過壓力程序或測(cè)試程序驗(yàn)證應(yīng)用。第五步,建立遠(yuǎn)程切換機(jī)制確定外部DNS服務(wù)器對(duì)當(dāng)?shù)胤?wù)器與容災(zāi)中心服務(wù)器IP地址的對(duì)應(yīng)關(guān)系,確定GCO對(duì)DNS更新的內(nèi)容。數(shù)據(jù)容災(zāi)的性能分析同步數(shù)據(jù)容災(zāi)的性能分析運(yùn)用同步傳播方式建立異地?cái)?shù)據(jù)容災(zāi),可以保證在當(dāng)?shù)叵到y(tǒng)出現(xiàn)劫難時(shí),異地存在一份與當(dāng)?shù)財(cái)?shù)據(jù)完全一致的數(shù)據(jù)備份。但運(yùn)用同步傳播方式建立這樣一種系統(tǒng),必須考慮“性能”這個(gè)原因。采用同步數(shù)據(jù)傳播方式時(shí),從前面的描述來看,當(dāng)?shù)叵到y(tǒng)必須等到數(shù)據(jù)成功的寫到異地系統(tǒng),才能進(jìn)行下一種I/O操作。一種I/O通過遠(yuǎn)程鏈路寫到異地系統(tǒng),波及到3個(gè)技術(shù)參數(shù):帶寬、距離和中間設(shè)備及協(xié)議轉(zhuǎn)換的時(shí)延。帶寬當(dāng)?shù)豂/O的帶寬是100MB/秒,在I/O流量很大的狀況下,假如與遠(yuǎn)程的I/O帶寬相對(duì)“100MB/秒==800Mbit/秒”窄得多的話,如E1:2Mbit/秒;E3:45Mbit/秒,將會(huì)明顯拖慢生產(chǎn)系統(tǒng)的I/O,從而影響系統(tǒng)性能。距離光和電波在線路上傳播的速度是30萬公里/秒,當(dāng)距離很長(zhǎng)時(shí),這種線路上的延時(shí)將會(huì)變得很明顯。例如:一種異地容災(zāi)系統(tǒng)的距離是1000KM,其數(shù)據(jù)庫寫盤的數(shù)據(jù)塊大小是10KB(一次I/O的數(shù)據(jù)量),那么:當(dāng)?shù)豂/O時(shí)(100米距離內(nèi)):光電在線路上的延時(shí) =0.1km/300,000km*2次/一種來回 =0.67*10-6秒1秒鐘內(nèi)容許I/O次 =1/(0.67*10-6)=1.5*10-6次1秒鐘容許的I/O量 =10KB*1.5*10-6=15GB此數(shù)字遠(yuǎn)遠(yuǎn)超過光纖通道帶寬自身,也就是說,光電在100米距離的線路上的延時(shí)對(duì)性能的影響可以忽視不計(jì)。異地I/O的(1000公里):光電在線路上的延時(shí) =1000km/300,000km*2次 =1/150秒1秒鐘內(nèi)容許I/O次 =1/(1/150)=150次1秒鐘容許的I/O量 =10KB*150=1.5MB此數(shù)據(jù)表明,在1000公里距離上,容許的最大I/O量在不存在帶寬限制時(shí),已經(jīng)遠(yuǎn)遠(yuǎn)低于當(dāng)?shù)豂/O的能力。(注:上面分析尚未考慮中間設(shè)備及協(xié)議轉(zhuǎn)換的延時(shí))。中間鏈路設(shè)備和協(xié)議轉(zhuǎn)換的時(shí)延中間鏈路設(shè)備和協(xié)議轉(zhuǎn)換的方式的不一樣,時(shí)延不一樣,對(duì)性能的影響也不一樣。在對(duì)性能影響的分析中,這個(gè)因數(shù)也應(yīng)計(jì)算在內(nèi)。目前不一樣異地?cái)?shù)據(jù)復(fù)制技術(shù)所依賴的介質(zhì)和協(xié)議不一樣,我們將介質(zhì)、協(xié)議和大概時(shí)延例表如下,這里提供的數(shù)據(jù)只精確到數(shù)量級(jí),僅供參照,實(shí)際數(shù)據(jù)應(yīng)當(dāng)像設(shè)備供應(yīng)上索取。租用線路任意不受限制約1ms(1毫秒)ESC
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 電子房屋買賣合同格式范本編寫示例
- 投標(biāo)安全承諾函
- 八年級(jí)生物下冊(cè) 7.1.1 植物的生殖教案 (新版)新人教版
- 河北省安平縣八年級(jí)地理上冊(cè) 1.1 遼闊的疆域教學(xué)設(shè)計(jì) 新人教版
- 八年級(jí)物理上冊(cè) 第二章 聲現(xiàn)象 第2節(jié) 聲音的特性第2課時(shí)聲音的特性綜合應(yīng)用教案 (新版)新人教版
- 2023六年級(jí)英語上冊(cè) Review Module Unit 2教案 外研版(三起)
- 2024-2025學(xué)年新教材高中化學(xué) 第1章 原子結(jié)構(gòu) 元素周期表 第2節(jié) 元素周期律和元素周期表 微專題二 元素“位-構(gòu)-性”之間的關(guān)系教案 魯科版必修第二冊(cè)
- 2024-2025年高中語文 第3單元 單元導(dǎo)讀教案 粵教版必修1
- 2024-2025學(xué)年高中歷史 第四單元 工業(yè)文明沖擊下的改革 第15課 戊戌變法(2)教學(xué)教案 岳麓版選修1
- 雨污管道勞務(wù)包工細(xì)分合同(2篇)
- 精神科常見危機(jī)狀態(tài)處理
- 工程開工令模板(全)
- 電網(wǎng)計(jì)算機(jī)類面試題及答案
- 作文格子稿紙800字-A4打印版
- 個(gè)人住房貸款提前還款月供及節(jié)省利息EXCEL計(jì)算
- 5000字長(zhǎng)篇表白情書
- 【淺析山東省綜合交通運(yùn)輸體系下的公路交通發(fā)展11000字(論文)】
- 第三章細(xì)胞的基本結(jié)構(gòu)“大單元教學(xué)下的深度學(xué)習(xí)課堂設(shè)計(jì)”說課課件2023-2024學(xué)年高一上學(xué)期生物人教版必修1
- 高中數(shù)學(xué)教材數(shù)學(xué)建模內(nèi)容設(shè)置的比較分析
- 特許經(jīng)營管理手冊(cè)范本(餐飲)
- 大學(xué)進(jìn)階英語1智慧樹知到課后章節(jié)答案2023年下西安科技大學(xué)
評(píng)論
0/150
提交評(píng)論