系統(tǒng)災(zāi)難備份_第1頁(yè)
系統(tǒng)災(zāi)難備份_第2頁(yè)
系統(tǒng)災(zāi)難備份_第3頁(yè)
系統(tǒng)災(zāi)難備份_第4頁(yè)
系統(tǒng)災(zāi)難備份_第5頁(yè)
已閱讀5頁(yè),還剩11頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、   第七章 系統(tǒng)災(zāi)難備份     7.1 容災(zāi)技術(shù)的意義     當(dāng)應(yīng)用系統(tǒng)的一個(gè)完整環(huán)境因?yàn)?zāi)難性事件(如火災(zāi)、地震等)遭到破壞時(shí),為了迅速恢復(fù)應(yīng)用系統(tǒng)的數(shù)據(jù)、環(huán)境,立即恢復(fù)應(yīng)用系統(tǒng)的運(yùn)行,保證系統(tǒng)的可用性,這就需要異地災(zāi)難備份系統(tǒng)(也稱容災(zāi)系統(tǒng))。可以說(shuō),對(duì)于關(guān)鍵事物的處理系統(tǒng),如聯(lián)通的各項(xiàng)業(yè)務(wù)系統(tǒng)(客戶服務(wù)、計(jì)費(fèi)、IDC 等),建立最高級(jí)別的安全體系,也是提高服務(wù)質(zhì)量、在競(jìng)爭(zhēng)中立于不敗之地的重要舉措。     長(zhǎng)期以來(lái),對(duì)企業(yè)而言,建立一套

2、可行的容災(zāi)系統(tǒng)相當(dāng)困難,主要是高昂的成本和技術(shù)實(shí)現(xiàn)的復(fù)雜度。鑒于此,從可行性而言,必須具有良好的性能價(jià)格比。     建立異地容災(zāi)系統(tǒng),即指建立遠(yuǎn)程的數(shù)據(jù)中心,通過(guò)配置遠(yuǎn)程容災(zāi)系統(tǒng)將本地?cái)?shù)據(jù)實(shí)時(shí)進(jìn)行遠(yuǎn)程復(fù)制,同時(shí)實(shí)現(xiàn)本地系統(tǒng)故障時(shí)應(yīng)用系統(tǒng)的遠(yuǎn)程啟動(dòng),確保系統(tǒng)的不中斷運(yùn)行。     建立異地容災(zāi)中心的優(yōu)勢(shì)在于: · 強(qiáng)大的一級(jí)災(zāi)難抗御能力。 · 有效防止物理設(shè)備損傷產(chǎn)生的災(zāi)難后果。 · 提供99.9999%的安全機(jī)制。 · 實(shí)時(shí)數(shù)據(jù)復(fù)制提供強(qiáng)大的數(shù)據(jù)交換能力。 

3、60;  隨著數(shù)據(jù)安全技術(shù)的發(fā)展,Cluster(HA)的技術(shù)越來(lái)越成熟,Cluster 的部署越來(lái)越普及,Cluster 技術(shù)確實(shí)解決了用戶系統(tǒng)的高可用性問(wèn)題,為業(yè)務(wù)的良性發(fā)展提供了穩(wěn)定的基石。隨著業(yè)務(wù)的發(fā)展,商業(yè)環(huán)境對(duì)服務(wù)供應(yīng)商提出的要求也越來(lái)越苛刻,這必將使應(yīng)用系統(tǒng)及其數(shù)據(jù)對(duì)高可用性的要求走上一個(gè)新的臺(tái)階。     一個(gè)本地Cluster 系統(tǒng)理論上可以提供99.99%以上的系統(tǒng)高可用性,但一旦發(fā)生火災(zāi)、自然災(zāi)害、人為破壞等意外事件,服務(wù)商將如何應(yīng)對(duì)呢?如果沒(méi)有必要的準(zhǔn)備和應(yīng)對(duì)手段,這樣的一次意外對(duì)服務(wù)上來(lái)說(shuō)將是災(zāi)難性的。對(duì)于I

4、T 部門(mén)來(lái)講,要提高自己的抗災(zāi)能力,其必要的技術(shù)就是建立起一個(gè)容災(zāi)系統(tǒng)。     7.2 容災(zāi)技術(shù)的分類     一個(gè)容災(zāi)系統(tǒng)的實(shí)現(xiàn)可以采用不同的技術(shù),一種技術(shù)是:采用硬件進(jìn)行遠(yuǎn)程數(shù)據(jù)復(fù)制,存儲(chǔ)工程師稱為硬件復(fù)制技術(shù)。這種技術(shù)的提供者是一些存儲(chǔ)設(shè)備廠商。數(shù)據(jù)的復(fù)制完全通過(guò)專用線路實(shí)現(xiàn)物理存儲(chǔ)設(shè)備之間的交換。另一種技術(shù)是:采用軟件系統(tǒng)實(shí)現(xiàn)遠(yuǎn)程的實(shí)時(shí)數(shù)據(jù)復(fù)制,并且實(shí)現(xiàn)遠(yuǎn)程的全程高可用體系(遠(yuǎn)程監(jiān)控和切換)。這種技術(shù)的代表如VERITAS 等一些著名存儲(chǔ)軟件廠商。存儲(chǔ)工程師在下面的章節(jié)會(huì)對(duì)以上兩種技術(shù)進(jìn)行詳細(xì)的論述。 &

5、#160;   容災(zāi)系統(tǒng)的歸類在另一個(gè)方面要由其最終達(dá)到的效果來(lái)決定。從其對(duì)系統(tǒng)的保護(hù)程度來(lái)分,存儲(chǔ)工程師可以將容災(zāi)系統(tǒng)分為:數(shù)據(jù)容災(zāi)和應(yīng)用容災(zāi)。     所謂數(shù)據(jù)容災(zāi),就是指建立一個(gè)異地的數(shù)據(jù)系統(tǒng),該系統(tǒng)是本地關(guān)鍵應(yīng)用數(shù)據(jù)的一個(gè)實(shí)時(shí)復(fù)制。在本地?cái)?shù)據(jù)及整個(gè)應(yīng)用系統(tǒng)出現(xiàn)災(zāi)難時(shí),系統(tǒng)至少在異地保存有一份可用的關(guān)鍵業(yè)務(wù)的數(shù)據(jù)。該數(shù)據(jù)可以是與本地生產(chǎn)數(shù)據(jù)的完全實(shí)時(shí)復(fù)制,也可以比本地?cái)?shù)據(jù)略微落后,但一定是可用的。     所謂應(yīng)用容災(zāi),是在數(shù)據(jù)容災(zāi)的基礎(chǔ)上,在異地建立一套完整的與本地生產(chǎn)系統(tǒng)相當(dāng)

6、的備份應(yīng)用系統(tǒng)(可以是互為備份)。建立這樣一個(gè)系統(tǒng)相對(duì)比較復(fù)雜,不僅需要一份可用的數(shù)據(jù)復(fù)制,還要有包括網(wǎng)絡(luò)、主機(jī)、應(yīng)用、甚至IP 等資源,以及各資源之間的良好協(xié)調(diào)。應(yīng)用容災(zāi)應(yīng)該說(shuō)是真正意義上的容災(zāi)系統(tǒng)。     存儲(chǔ)工程師先討論一下數(shù)據(jù)容災(zāi)。     數(shù)據(jù)容災(zāi)(硬件容災(zāi)方案和軟件容災(zāi)方案均包括),又稱為異地?cái)?shù)據(jù)復(fù)制技術(shù),按照其實(shí)現(xiàn)的技術(shù)方式來(lái)說(shuō),主要可以分為同步傳輸方式和異步傳輸方式(各廠商在技術(shù)用語(yǔ)上可能有所不同。而根據(jù)容災(zāi)的距離,數(shù)據(jù)容災(zāi)又可以分成遠(yuǎn)程數(shù)據(jù)容災(zāi)和近程數(shù)據(jù)容災(zāi)方式。下面,存儲(chǔ)工程師將主要按同步傳輸

7、方式和異步傳輸方式對(duì)數(shù)據(jù)容災(zāi)展開(kāi)討論,其中也會(huì)涉及到遠(yuǎn)程容災(zāi)和近程容災(zāi)的概念,并作相應(yīng)的分析。 7.2.1 同步傳輸?shù)臄?shù)據(jù)復(fù)制     有關(guān)同步數(shù)據(jù)容災(zāi),在傳統(tǒng)意義上講,就是通過(guò)容災(zāi)軟件(可以含在硬件系統(tǒng)內(nèi)),將本地生產(chǎn)數(shù)據(jù)通過(guò)某種機(jī)制復(fù)制到異地。從廣義上講,同步數(shù)據(jù)容災(zāi)是指在異地建立起一套與本地?cái)?shù)據(jù)實(shí)時(shí)同步的異地?cái)?shù)據(jù)。       從圖7-1可以看出,采用同步傳輸方式進(jìn)行異地?cái)?shù)據(jù)容災(zāi)的過(guò)程包括:     1. 本地主機(jī)系統(tǒng)發(fā)出第一個(gè)I/O 請(qǐng)求

8、A;     2. 主機(jī)會(huì)對(duì)本地磁盤(pán)系統(tǒng)發(fā)出I/O 請(qǐng)求;     3. 本地磁盤(pán)系統(tǒng)完成I/O 操作,并通知本地主機(jī)“I/O 完成”;     4. 在往本地I/O 的同時(shí),本地系統(tǒng)(主機(jī)或磁盤(pán)系統(tǒng))會(huì)向異地系統(tǒng)發(fā)出I/O 請(qǐng)求A;     5. 異地系統(tǒng)完全I(xiàn)/O 操作,并通知本地系統(tǒng)“I/O 完成” 6. 本地主機(jī)系統(tǒng)得到“I/O 完成”的確認(rèn),然后,發(fā)出第二個(gè)I/O 請(qǐng)求B。 圖 7-1 同步數(shù)據(jù)的一個(gè)實(shí)例  

9、;  不同的異地?cái)?shù)據(jù)復(fù)制技術(shù)的實(shí)現(xiàn)方式是不同的,包括:       基于主機(jī)邏輯卷層的同步數(shù)據(jù)復(fù)制方式(軟件復(fù)制方式);       基于磁盤(pán)系統(tǒng)I/O 控制器的同步數(shù)據(jù)復(fù)制方式(硬件復(fù)制方式);     首先,描述基于主機(jī)邏輯卷的同步數(shù)據(jù)復(fù)制方式?;谥鳈C(jī)邏輯卷的同步數(shù)據(jù)復(fù)制方式以VERITAS Volume Replicator(VVR)為代表,VVR是集成于VERITAS Volume Manager(邏輯卷管

10、理)的遠(yuǎn)程數(shù)據(jù)復(fù)制軟件,它可以運(yùn)行于同步模式和異步模式。在同步模式下,其實(shí)現(xiàn)原理如下圖: 圖7-2 基于邏輯卷的數(shù)據(jù)復(fù)制實(shí)例     當(dāng)主機(jī)發(fā)起一個(gè)I/O 請(qǐng)求A 之后,必然通過(guò)邏輯卷層,邏輯卷管理層在向本地硬盤(pán)發(fā)出I/O請(qǐng)求的同時(shí),將同時(shí)通過(guò)TCP/IP 網(wǎng)絡(luò)向異地系統(tǒng)發(fā)出I/O 請(qǐng)求。其實(shí)現(xiàn)過(guò)程如下:     1. 本地主機(jī)系統(tǒng)發(fā)出第一個(gè)I/O 請(qǐng)求A;     2. 主機(jī)邏輯卷層會(huì)對(duì)本地磁盤(pán)系統(tǒng)發(fā)出I/O 請(qǐng)求;     3. 本

11、地磁盤(pán)系統(tǒng)完成I/O 操作,并通知本地邏輯卷“I/O 完成”;     4. 在往本地磁盤(pán)系統(tǒng)I/O 的同時(shí),本地主機(jī)系統(tǒng)邏輯卷會(huì)向異地系統(tǒng)發(fā)出I/O 請(qǐng)求A;     5. 異地系統(tǒng)完成I/O 操作,并通知本地主機(jī)系統(tǒng)“I/O 完成”     6. 本地主機(jī)系統(tǒng)得到“I/O 完成”的確認(rèn),然后,發(fā)出第二個(gè)I/O 請(qǐng)求B。     其次,考察基于磁盤(pán)系統(tǒng)的同步數(shù)據(jù)復(fù)制功能     基于磁盤(pán)系統(tǒng)的同

12、步數(shù)據(jù)復(fù)制功能實(shí)現(xiàn)異地?cái)?shù)據(jù)容災(zāi),如SRDF 和PPRC。這兩個(gè)軟件運(yùn)行的平臺(tái)是磁盤(pán)系統(tǒng),部署這樣的系統(tǒng)必須要求在兩端采用相同種類的磁盤(pán)系統(tǒng)。其同步數(shù)據(jù)復(fù)制的實(shí)現(xiàn)原理如下圖:     當(dāng)主機(jī)發(fā)出一個(gè)I/O 請(qǐng)求A 之后,I/O 進(jìn)入磁盤(pán)控制器。該控制器在接到I/O 請(qǐng)求后,一方面會(huì)寫(xiě)入本地磁盤(pán),同時(shí)利用另一個(gè)控制器(或稱通道),通過(guò)專用通道(如:ESCON)、FC光纖通道(IP over FC)或者租用線路,將數(shù)據(jù)從本地磁盤(pán)系統(tǒng)同步的復(fù)制到異地磁盤(pán)系統(tǒng)。其實(shí)現(xiàn)過(guò)程如下:     1. 本地主機(jī)系統(tǒng)發(fā)出第一個(gè)I/O 請(qǐng)

13、求A;     2. 主機(jī)對(duì)本地磁盤(pán)系統(tǒng)發(fā)出I/O 請(qǐng)求;     3. 在往本地磁盤(pán)系統(tǒng)I/O 的同時(shí),本地磁盤(pán)系統(tǒng)會(huì)向異地磁盤(pán)系統(tǒng)發(fā)出I/O 請(qǐng)求A;     4. 本地磁盤(pán)系統(tǒng)完成I/O 操作;     5. 異地系統(tǒng)完成I/O 操作,并通知本地磁盤(pán)系統(tǒng)“I/O 完成”     6. 本地次盤(pán)系統(tǒng)向主機(jī)確認(rèn)“I/O 完成”,然后,主機(jī)系統(tǒng)發(fā)出第二個(gè)I/O 請(qǐng)求B。7.2.2 同步數(shù)據(jù)容災(zāi)的性

14、能分析     利用同步傳輸方式建立異地?cái)?shù)據(jù)容災(zāi),可以保證在本地系統(tǒng)出現(xiàn)災(zāi)難時(shí),異地存在一份與本地?cái)?shù)據(jù)完全一致的數(shù)據(jù)備份(具有完整的一致性)。但利用同步傳輸方式建立這樣一個(gè)系統(tǒng),必須考慮“性能”這個(gè)因素。     采用同步數(shù)據(jù)傳輸方式時(shí),從前面的描述來(lái)看,本地系統(tǒng)必須等到數(shù)據(jù)成功的寫(xiě)到異地系統(tǒng),才能進(jìn)行下一個(gè)I/O 操作。一個(gè)I/O 通過(guò)遠(yuǎn)程鏈路寫(xiě)到異地系統(tǒng),涉及到3 個(gè)技術(shù)參數(shù):帶寬、距離和中間設(shè)備及協(xié)議轉(zhuǎn)換的時(shí)延。       帶寬  

15、60;  本地I/O 的帶寬是100MB/秒(SAN 網(wǎng)絡(luò)中),在I/O 流量很大的情況下,如果與遠(yuǎn)程的I/O帶寬相對(duì)“100MB/秒 = 800Mbit/秒”窄得多的話,如E1:2Mbit/秒;E3:45Mbit/秒,將會(huì)明顯拖慢生產(chǎn)系統(tǒng)的I/O,從而影響系統(tǒng)性能。        距離     光和電波在線路上傳輸?shù)乃俣仁?0 萬(wàn)公里/秒,當(dāng)距離很長(zhǎng)時(shí),這種線路上的延時(shí)將會(huì)變得很明顯。例如:一個(gè)異地容災(zāi)系統(tǒng)的距離是1000KM,其數(shù)據(jù)庫(kù)寫(xiě)盤(pán)的數(shù)據(jù)塊大小是10KB(一次I/O

16、 的數(shù)據(jù)量),那么: 本地I/O 時(shí)(100 米距離內(nèi)):     此數(shù)字遠(yuǎn)遠(yuǎn)超過(guò)光纖通道帶寬本身,也就是說(shuō),光電在100 米距離的線路上的延時(shí)對(duì)性能的影響可以忽略不計(jì)。 異地I/O 的(1000 公里):     此數(shù)據(jù)表明,在1000 公里距離上,允許的最大I/O 量在不存在帶寬限制時(shí),已經(jīng)遠(yuǎn)遠(yuǎn)低于本地I/O 的能力。(注:上面分析還未考慮中間設(shè)備及協(xié)議轉(zhuǎn)換的延時(shí))。       中間鏈路設(shè)備和協(xié)議轉(zhuǎn)換的時(shí)延    

17、60;中間鏈路設(shè)備和協(xié)議轉(zhuǎn)換的方式的不同,時(shí)延不同,對(duì)性能的影響也不同。在對(duì)性能影響的分析中,這個(gè)因數(shù)也應(yīng)計(jì)算在內(nèi)。目前不同異地?cái)?shù)據(jù)復(fù)制技術(shù)所依賴的介質(zhì)和協(xié)議不同,存儲(chǔ)工程師將介質(zhì)、協(xié)議和大概時(shí)延例表如下,這里提供的數(shù)據(jù)只精確到數(shù)量級(jí),僅供參考,實(shí)際數(shù)據(jù)應(yīng)該向設(shè)備供應(yīng)商索取。 表 7-1 數(shù)據(jù)線路處理時(shí)延估計(jì)     下面是一個(gè)線路時(shí)延分析對(duì)照表,供參考。 表 7-2 數(shù)據(jù)傳輸距離時(shí)延     在1000 公里和100 公里距離上,采用租用線路和ATM,允許的最大I/O 能力(假定帶寬足夠,數(shù)據(jù)塊大小以10KB 為

18、例): 表 7-3 線路系統(tǒng)考察     在10 公里距離上,采用各種傳輸協(xié)議允許的最大I/O 能力,數(shù)據(jù)塊大小以10KB 為例(假定帶寬足夠): 表7-4 等距離條件下的時(shí)間延時(shí)   7.2.3 異步數(shù)據(jù)復(fù)制方式     從前面的分析來(lái)看,同步數(shù)據(jù)容災(zāi)一般只能在較短距離內(nèi)部署(10KM-100KM),大于這個(gè)距離,就沒(méi)有實(shí)際應(yīng)用價(jià)值了。因?yàn)榧词乖?000KM 距離上,4.5MB 的速率即使將數(shù)據(jù)復(fù)制到異地,每個(gè)I/O 的響應(yīng)時(shí)間也會(huì)超過(guò)10ms,這種響應(yīng)速度太慢。   &#

19、160; 異步數(shù)據(jù)容災(zāi)是在“線路帶寬和距離能保證完成數(shù)據(jù)復(fù)制過(guò)程,同時(shí),異地?cái)?shù)據(jù)復(fù)制不影響生產(chǎn)系統(tǒng)的性能”這樣的要求下提出來(lái)的??紤]異步數(shù)據(jù)容災(zāi),應(yīng)該注意到以下幾個(gè)技術(shù)條件和事實(shí)。 · 帶寬必須能保證將本地生產(chǎn)數(shù)據(jù)基本上完全復(fù)制到異地容災(zāi)端,還要考慮距離對(duì)傳輸能力的影響。 · 按照前面的估算:在1000 公里范圍內(nèi),一條帶寬足夠的線路能支持的I/O 流量最大為(數(shù)據(jù)塊大小10KM ):1.4MB×3600 秒×24 小時(shí)=120GB/天 · 異地容災(zāi)遠(yuǎn)端數(shù)據(jù)會(huì)比本地生產(chǎn)端數(shù)據(jù)落后一定時(shí)間,這個(gè)時(shí)間隨采用的技術(shù),帶寬、距離、數(shù)據(jù)流特點(diǎn)的

20、不同而不同。一般而言,軟件方式的數(shù)據(jù)復(fù)制技術(shù)具有完整的數(shù)據(jù)包的排隊(duì)和斷點(diǎn)重發(fā)機(jī)制,在災(zāi)難情況下可以保證災(zāi)難時(shí)間點(diǎn)的數(shù)據(jù)一致性。 · 異步容災(zāi)基本不影響本地系統(tǒng)性能。    與同步傳輸方式相比,異步傳輸方式對(duì)帶寬和距離的要求低很多,它只要求在某個(gè)時(shí)間段內(nèi)能將數(shù)據(jù)全部復(fù)制到異地即可,同時(shí)異步傳輸方式也不會(huì)明顯影響應(yīng)用系統(tǒng)的性能。其缺點(diǎn)是在本地生產(chǎn)數(shù)據(jù)發(fā)生災(zāi)難時(shí),異地系統(tǒng)上的數(shù)據(jù)可能會(huì)短暫損失(如果廣域網(wǎng)速率較低,交易未完整發(fā)送的話),但不影響一致性(類似本地?cái)?shù)據(jù)庫(kù)主機(jī)的異常關(guān)機(jī))。     通過(guò)異步傳輸模式進(jìn)

21、行異地?cái)?shù)據(jù)復(fù)制的技術(shù),包括: · 基于主機(jī)邏輯卷的數(shù)據(jù)復(fù)制方式 · 基于磁盤(pán)系統(tǒng)I/O 控制器的數(shù)據(jù)復(fù)制方式    基于主機(jī)邏輯卷(Volume)的數(shù)據(jù)復(fù)制方式     首先申明:針對(duì)這種方式,這以VERITAS VVR 為例,但并不表示所有基于主機(jī)進(jìn)行復(fù)制的其它軟件采用同樣方式,也不保證其它軟件是有應(yīng)用價(jià)值的。     VERITAS VVR (Volume Replicator)通過(guò)基于Volume 和Log 的復(fù)制技術(shù),保證在任何時(shí)刻本地系統(tǒng)發(fā)生自然

22、災(zāi)難時(shí),在異地的數(shù)據(jù)仍是可用的。     VERITAS VVR 在異步模式下采用了Log 技術(shù)來(lái)跟蹤未及時(shí)復(fù)制的數(shù)據(jù)塊,這個(gè)Log 是一個(gè)先到先服務(wù)的堆棧,每一筆I/O 處理都會(huì)首先被放進(jìn)這個(gè)Log,并按到達(dá)先后順序被復(fù)制到異地服務(wù)器系統(tǒng)。 下圖是其工作的結(jié)構(gòu)原理。 圖7-4 基于邏輯卷的異步數(shù)據(jù)復(fù)制     從上圖,存儲(chǔ)工程師可以看到整個(gè)I/O 和復(fù)制的過(guò)程如下: · 本地主機(jī)系統(tǒng)發(fā)出第一個(gè)I/O 請(qǐng)求A 到邏輯卷; · 邏輯卷對(duì)本地磁盤(pán)系統(tǒng)發(fā)出I/O 請(qǐng)求; · 在往本地磁盤(pán)系統(tǒng)

23、I/O 的同時(shí),邏輯卷向本地磁盤(pán)系統(tǒng)上的VVR Log 發(fā)出相同的寫(xiě)請(qǐng)求; · 本地磁盤(pán)系統(tǒng)完成I/O 操作;并通知邏輯卷“I/O 完成”; · VVR 完成針對(duì)這個(gè)I/O 的遠(yuǎn)程操作,并通知邏輯卷; · 邏輯卷向主機(jī)確認(rèn)“I/O 完成”。    服務(wù)器的另一個(gè)進(jìn)程:VVR 的進(jìn)程,負(fù)責(zé)將Log 隊(duì)列中的I/O 復(fù)制到異地服務(wù)器。這個(gè)過(guò)程和上面的I/O 過(guò)程在時(shí)間上無(wú)關(guān)。如上圖中的標(biāo)記:“I”和“II”。     I: 本地VVR 進(jìn)程從Log 隊(duì)列中取出最先到達(dá)的I/O,復(fù)制到異地服

24、務(wù)器     II: 異地服務(wù)器接收到本地服務(wù)器VVR 發(fā)出的I/O 請(qǐng)求,將相應(yīng)數(shù)據(jù)寫(xiě)到異地磁盤(pán)系統(tǒng),然后,通知本地系統(tǒng)VVR 進(jìn)程,要求下一個(gè)I/O。     這里,跟蹤未及時(shí)復(fù)制的數(shù)據(jù)塊的Log 技術(shù)是保證異地?cái)?shù)據(jù)可用的必要條件。一個(gè)數(shù)據(jù)庫(kù)的I/O 是有嚴(yán)格順序的,這個(gè)順序是保證數(shù)據(jù)庫(kù)完整性的必要條件,一個(gè)完整性被破壞的數(shù)據(jù)庫(kù)一般是不可用的,比如根本無(wú)法啟動(dòng)、打開(kāi)該數(shù)據(jù)庫(kù),且是無(wú)法修復(fù)的。本地?cái)?shù)據(jù)庫(kù)的完整性是由數(shù)據(jù)庫(kù)本身來(lái)維護(hù)的。當(dāng)一個(gè)數(shù)據(jù)庫(kù)被實(shí)時(shí)復(fù)制到異地時(shí),要保證異地?cái)?shù)據(jù)庫(kù)的完整性,必然保證在異地磁盤(pán)I/

25、O 上的I/O 順序和本地I/O 順序完全相同,否則,異地?cái)?shù)據(jù)庫(kù)的完整性就無(wú)法保證。     VERITAS VVR 采用的I/O 控制機(jī)制是支持先到先服務(wù)的Log 技術(shù),因此,不管異地?cái)?shù)據(jù)比本地?cái)?shù)據(jù)落后多少時(shí)間,都能保證異地?cái)?shù)據(jù)庫(kù)數(shù)據(jù)的一致性。比如:本地系統(tǒng)在12:00 時(shí)發(fā)生自然災(zāi)難,由于部分?jǐn)?shù)據(jù)未被及時(shí)復(fù)制到異地,如有10 分鐘的數(shù)據(jù)未完成復(fù)制,那么在異地系統(tǒng)上存在11:50 分鐘以前的所有數(shù)據(jù),且這個(gè)數(shù)據(jù)庫(kù)是可用的。     目前的基于磁盤(pán)系統(tǒng)的異地?cái)?shù)據(jù)復(fù)制技術(shù)采用Bitmap 技術(shù)和Timestamp 技

26、術(shù),這兩種技術(shù)都不能保證本地向異地復(fù)制數(shù)據(jù)的順序嚴(yán)格和本地I/O 的順序相同,所以,這兩種方式都不能保證異地?cái)?shù)據(jù)庫(kù)的完整性。     Bitmap(位圖)技術(shù)記錄未被及時(shí)復(fù)制的數(shù)據(jù)塊的方法是:對(duì)于每個(gè)數(shù)據(jù)塊(如32KB)用一個(gè)Bit 來(lái)對(duì)應(yīng),某一個(gè)Bit 被置為“1”時(shí),表示其對(duì)應(yīng)的數(shù)據(jù)塊已被修改過(guò),正在等待處理(這里是等待被復(fù)制)。由此可以看出,當(dāng)有一塊以上的數(shù)據(jù)塊未被及時(shí)復(fù)制時(shí),系統(tǒng)并無(wú)法確認(rèn)哪一塊數(shù)據(jù)塊應(yīng)該先復(fù)制到異地,所以,系統(tǒng)將任選一塊,即不按到達(dá)的時(shí)間先后進(jìn)行復(fù)制。     可以看出,這種方式不能根本保

27、證異地?cái)?shù)據(jù)庫(kù)數(shù)據(jù)的完整性、一致性。     Timestamp 方式是對(duì)每個(gè)未及時(shí)傳送的數(shù)據(jù)塊蓋上一個(gè)時(shí)間戳。從表面上看,由于時(shí)間戳的關(guān)系,好像能確定一個(gè)數(shù)據(jù)塊被修改的時(shí)間順序了。其實(shí)不然:當(dāng)一個(gè)未被及時(shí)復(fù)制的數(shù)據(jù)塊被第2 次修改,并蓋上新的時(shí)間戳?xí)r,數(shù)據(jù)復(fù)制的順序就被破壞了。例如:     現(xiàn)在有10 塊數(shù)據(jù)塊未被復(fù)制,編號(hào)“1、2、3、4、5、6、7、8、9、10”;這時(shí),第3 塊數(shù)據(jù)被再次修改,并被蓋上一個(gè)新的時(shí)間戳“11”;這時(shí),系統(tǒng)會(huì)按這樣的次序進(jìn)行復(fù)制:“1、2、(沒(méi)有3)、4、5、6、7、8、9、10

28、、11”。存儲(chǔ)工程師可以看到,在復(fù)制進(jìn)行到“410”之間時(shí),異地?cái)?shù)據(jù)的完整性被破壞。     事實(shí)上,在一個(gè)運(yùn)行繁忙的系統(tǒng)中,出現(xiàn)這種情況機(jī)率極高,甚至每時(shí)每刻都處在這種狀態(tài)之下。所以,本著嚴(yán)格的,對(duì)系統(tǒng)可用性負(fù)責(zé)任的態(tài)度,可以認(rèn)為“Timestamp”的技術(shù)雖然比Bitmap 技術(shù)有一定優(yōu)勢(shì),但實(shí)際上也無(wú)法保證異地?cái)?shù)據(jù)的完整性和可用性。     Bitmap 和Timestamp 方式的技術(shù)弱點(diǎn):沒(méi)有l(wèi)og;     作為磁盤(pán)系統(tǒng)內(nèi)置的數(shù)據(jù)復(fù)制功能,傳統(tǒng)的磁盤(pán)管理模式?jīng)]有考

29、慮在磁盤(pán)系統(tǒng)內(nèi)部開(kāi)辟出一個(gè)磁盤(pán)塊給磁盤(pán)系統(tǒng)控制器本身使用,所以,磁盤(pán)系統(tǒng)無(wú)法采用log 模式進(jìn)行異步數(shù)據(jù)復(fù)制。     磁盤(pán)系統(tǒng)保留異步傳輸模式的目的:復(fù)制,但不是容災(zāi)復(fù)制;     數(shù)據(jù)復(fù)制的目的不僅僅是容災(zāi)。數(shù)據(jù)容災(zāi)要求兩地時(shí)時(shí)保持連接,數(shù)據(jù)復(fù)制過(guò)程在任一時(shí)間都在進(jìn)行(除非有線路或設(shè)備故障)。而非容災(zāi)性復(fù)制只要求在某一個(gè)時(shí)間段里將數(shù)據(jù)復(fù)制到異地,復(fù)制告一段落后(在某一時(shí)刻完全同步),復(fù)制工作會(huì)暫停。這種復(fù)制可能是為一個(gè)特殊目的只做一次,如在線業(yè)務(wù)遷移;也可能每天或每月追加一次。這樣,在異地就會(huì)存在一份最大損失數(shù)

30、據(jù)量為1 天或1 個(gè)月的生產(chǎn)數(shù)據(jù)復(fù)制品,其對(duì)數(shù)據(jù)的保障能力,如同磁盤(pán)備份。這種方式復(fù)制數(shù)據(jù)的目的包括:1)在異地保存一份備份數(shù)據(jù)(如同磁帶備份異地保存)。2)在線業(yè)務(wù)遷移,當(dāng)信息中心或其中的一個(gè)服務(wù)要遷移到另一個(gè)地方,又希望少停機(jī)(實(shí)際上也可用磁帶備份和恢復(fù)來(lái)實(shí)現(xiàn))。3)利用與磁盤(pán)快照技術(shù)結(jié)合,為異地開(kāi)發(fā)中心提供一個(gè)與生產(chǎn)數(shù)據(jù)盡量相同的測(cè)試數(shù)據(jù)源。當(dāng)然,也可用于其它可能的目的。     綜上所述,可以看出,雖然基于磁盤(pán)系統(tǒng)的異地?cái)?shù)據(jù)復(fù)制功能有異步傳輸模式,但實(shí)際上并不支持異步數(shù)據(jù)容災(zāi),只有像VERITAS Volume Replicator 這樣基于先進(jìn)

31、先出的Log 技術(shù)的解決方案才真正支持異步數(shù)據(jù)容災(zāi)7.3.1 災(zāi)難備份需求的衡量指標(biāo)  對(duì)于大多數(shù)企業(yè)而言,提到災(zāi)難備份,最直接的反映就是增加預(yù)算,購(gòu)買(mǎi)更多的主機(jī),存儲(chǔ)設(shè)備以及相應(yīng)軟件。雖然這是實(shí)施災(zāi)難備份項(xiàng)目的一個(gè)必要步驟,但是,從“災(zāi)備方案應(yīng)是風(fēng)險(xiǎn)和成本相應(yīng)平衡”的出發(fā)點(diǎn)來(lái)綜合考慮,實(shí)施災(zāi)難備份項(xiàng)目的第一步應(yīng)該從“分析評(píng)估以確定災(zāi)難災(zāi)難備份需求目標(biāo)”開(kāi)始。  􀁺 RTO (Recovery Time Objective)  RTO,Recovery Time Objective,是指災(zāi)難發(fā)生后,從I/T 系統(tǒng)當(dāng)機(jī)

32、導(dǎo)致業(yè)務(wù)停頓之刻開(kāi)始,到IT 系統(tǒng)恢復(fù)至可以支持各部門(mén)運(yùn)作,業(yè)務(wù)恢復(fù)運(yùn)營(yíng)之時(shí),此兩點(diǎn)之間的時(shí)間段稱為RTO。  一般而言,RTO 時(shí)間越短,即意味要求在更短的時(shí)間內(nèi)恢復(fù)至可使用狀態(tài)。雖然從管理的角度而言,RTO 時(shí)間越短越好,但是,這同時(shí)也意味著更多成本的投入,即可能需要購(gòu)買(mǎi)更快的存儲(chǔ)設(shè)備或高可用性軟件。  對(duì)于不同行業(yè)的企業(yè)來(lái)說(shuō),其RTO 目標(biāo)一般是不相同的。即使是在同一行業(yè),各企業(yè)因業(yè)務(wù)發(fā)展規(guī)模的不同,其RTO 目標(biāo)也會(huì)不盡相同。  RTO 目標(biāo)的確定可以用下圖來(lái)說(shuō)明:  7-5 投入/收益示意圖 &

33、#160;  如上所說(shuō),RTO 目標(biāo)越短,成本投入也越大。另一方面,各企業(yè)都有其在該發(fā)展階段的單位時(shí)間贏利指數(shù),該指數(shù)是通過(guò)業(yè)務(wù)沖擊分析(BIA-Business Impact Analysis)咨詢服務(wù),以交談、問(wèn)答和咨詢的方式得到確定的。在確定了企業(yè)的單位時(shí)間贏利指數(shù)后,就可以計(jì)算出業(yè)務(wù)停頓隨時(shí)間而造成的損失大小。如上圖,結(jié)合這兩條曲線關(guān)系,存儲(chǔ)工程師將可以找到對(duì)該企業(yè)而言比較適合的RTO 目標(biāo),即在該目標(biāo)定義下,用于災(zāi)難備份的投入應(yīng)不大與對(duì)應(yīng)的業(yè)務(wù)損失。  􀁺 RPO (Recovery Point Objective) 

34、; RPO,Recovery Point Objective,是指從系統(tǒng)和應(yīng)用數(shù)據(jù)而言,要實(shí)現(xiàn)能夠恢復(fù)至可以支持各部門(mén)業(yè)務(wù)運(yùn)作,系統(tǒng)及生產(chǎn)數(shù)據(jù)應(yīng)恢復(fù)到怎樣的更新程度。這種更新程度可以是上一周的備份數(shù)據(jù),也可以是上一次交易的實(shí)時(shí)數(shù)據(jù)。  與RTO 目標(biāo)不同,RPO 目標(biāo)的確定不是依賴于企業(yè)業(yè)務(wù)規(guī)模,而是決定于企業(yè)業(yè)務(wù)的性質(zhì)和業(yè)務(wù)操作依賴于數(shù)據(jù)的程度。因此,RPO 目標(biāo)對(duì)相同行業(yè)的企業(yè)而言會(huì)有些接近,而對(duì)于不同行業(yè)的企業(yè)來(lái)說(shuō)仍可能會(huì)有較大差距。  RPO 目標(biāo)仍是以咨詢的方式,通過(guò)與各業(yè)務(wù)部門(mén)主管的交流,了解業(yè)務(wù)流程和IT 應(yīng)用的關(guān)系,以及通過(guò)回答

35、問(wèn)卷的方式,確定能夠支持該企業(yè)核心業(yè)務(wù)的RPO 目標(biāo)。7.3.2 重要系統(tǒng)災(zāi)難備份主要的實(shí)現(xiàn)方法 在目前的技術(shù)條件下,重要系統(tǒng)災(zāi)難備份主要的實(shí)現(xiàn)方法主要有一下幾種: 1. 基于應(yīng)用本身的容災(zāi)-應(yīng)用直接指向2 個(gè)同時(shí)運(yùn)作的數(shù)據(jù)中心,在任意一個(gè)中心活動(dòng)情況下繼續(xù)工作 2. 基于文件/數(shù)據(jù)庫(kù)日志-通過(guò)復(fù)制數(shù)據(jù)庫(kù)日志和數(shù)據(jù)文件方式,從生產(chǎn)中心向容災(zāi)中心進(jìn)行數(shù)據(jù)容災(zāi) 3. 基于復(fù)制磁盤(pán)容災(zāi)-通過(guò)復(fù)制磁盤(pán)IO 的方式,從生產(chǎn)中心向容災(zāi)中心進(jìn)行數(shù)據(jù)容災(zāi),根據(jù)復(fù)制設(shè)備的不同,有可以分為: o 基于主機(jī) o 基于磁盤(pán)陣列 o 基于智能SAN 虛擬存儲(chǔ)設(shè)備    下面對(duì)各種

36、方式進(jìn)行一個(gè)簡(jiǎn)單比較: 表7-5 容災(zāi)方式比較     7.3.3 災(zāi)難備份方式比較的分析     各種容災(zāi)方式下,只有基于應(yīng)用本身的方式可以做到RTO為0;其它方式一般需要進(jìn)行網(wǎng)絡(luò)切換、存儲(chǔ)切換和數(shù)據(jù)庫(kù)重啟等工作,RTO一般從幾十分鐘到數(shù)小時(shí)不等。各種容災(zāi)方式下,一般都要求主機(jī)和數(shù)據(jù)庫(kù)同步,雖然存在理論上的異構(gòu)可能,但是在具體實(shí)施時(shí)會(huì)給開(kāi)發(fā)/測(cè)試帶來(lái)巨大的難度,并大大降低容災(zāi)系統(tǒng)的穩(wěn)定程度,一般不會(huì)采用基于應(yīng)用本身的方式雖然可以做到RTO為0,但是對(duì)應(yīng)用要求極高,并且需要極其復(fù)雜的機(jī)制處理雙中心的數(shù)據(jù)同步問(wèn)題;目

37、前浙江系統(tǒng)眾多,應(yīng)用復(fù)雜,如果采用這種方案,需要對(duì)所有應(yīng)用進(jìn)行更改,實(shí)施難度極大,顧不予推薦?;诨谖募?數(shù)據(jù)庫(kù)日志的方式,只能以文件方式傳輸數(shù)據(jù),數(shù)據(jù)丟失單位至少一個(gè)文件,無(wú)法做到RTO=0,在不允許丟失數(shù)據(jù)的關(guān)鍵應(yīng)用上也不適合,顧不予推薦。     基于復(fù)制磁盤(pán)容災(zāi)主要有同步和異步2種方式,異步方式無(wú)法做到RTO=0,在不允許丟失數(shù)據(jù)的關(guān)鍵應(yīng)用上也不適合,顧不予推薦;同步方式的情況下,以復(fù)制主題不同進(jìn)行分類。     基于主機(jī)復(fù)制磁盤(pán)數(shù)據(jù):磁盤(pán)陣列可以異構(gòu)是最大的優(yōu)點(diǎn);但是,這種方式容災(zāi)時(shí)對(duì)主機(jī)性能有一定影響

38、,針對(duì)不同的主機(jī)需要采用不同的實(shí)現(xiàn)方式,目前浙江系統(tǒng)眾多,應(yīng)用復(fù)雜,如果采用這種方案,需要對(duì)所有主機(jī)進(jìn)行論證和實(shí)施,實(shí)施難度較大,顧不予推薦基于磁盤(pán)陣列復(fù)制磁盤(pán)數(shù)據(jù):實(shí)施簡(jiǎn)單是最大的優(yōu)點(diǎn),不影響主機(jī),只鏡像數(shù)據(jù),是目前較主流的一種容災(zāi)方案;但是,這種方式容災(zāi)時(shí),需要磁盤(pán)陣列高度同構(gòu),不但要求磁盤(pán)陣列是一個(gè)廠商的,還必須是同一廠商同一系列的陣列,否則無(wú)法實(shí)現(xiàn)數(shù)據(jù)復(fù)制,所以,這種方案多用于已經(jīng)進(jìn)行存儲(chǔ)整合的大型系統(tǒng);目前浙江的現(xiàn)實(shí)情況是系統(tǒng)非常多,不同系統(tǒng)采用不同磁盤(pán)陣列,很多目前的系統(tǒng)還不支持磁盤(pán)陣列的遠(yuǎn)程鏡像功能;如果實(shí)施這種方案,首先需要升級(jí)/替換很多磁盤(pán)陣列,然后為每一種陣列在容災(zāi)中心配置

39、相應(yīng)的同構(gòu)磁盤(pán)陣列,投資巨大,每一種不同的陣列采用不同的軟件,維護(hù)不便,而且,中心的各個(gè)存儲(chǔ)各自工作,沒(méi)有一個(gè)統(tǒng)一存儲(chǔ)池能夠靈活調(diào)配資源,資源使用也狠浪費(fèi)     基于智能SAN虛擬存儲(chǔ)設(shè)備復(fù)制磁盤(pán)數(shù)據(jù):這種方式擁有所有基于磁盤(pán)陣列復(fù)制磁盤(pán)數(shù)據(jù)的優(yōu)點(diǎn),而且通過(guò)這種方式可以解決許多基于磁盤(pán)陣列無(wú)法解決的問(wèn)題: · 磁盤(pán)陣列可以完全異構(gòu),不同廠商不同系列的陣列可以混合使用,大大節(jié)約客戶方案復(fù)雜程度和實(shí)施難度 · 智能SAN 虛擬存儲(chǔ)設(shè)備實(shí)現(xiàn)遠(yuǎn)程容災(zāi)不在乎客戶現(xiàn)有的SAN 陣列是否支持遠(yuǎn)程數(shù)據(jù)容災(zāi),大大保護(hù)客戶投資 · 智能SAN 虛擬存儲(chǔ)設(shè)備可以將中心的多個(gè)存儲(chǔ)設(shè)備(如果有多個(gè)的話)作為一個(gè)統(tǒng)一的存儲(chǔ)池進(jìn)行管理,存儲(chǔ)效率大大提高 · 智能SAN 虛擬存儲(chǔ)設(shè)備針對(duì)不同的主機(jī)存儲(chǔ)設(shè)備采用統(tǒng)一的軟件實(shí)施遠(yuǎn)程容災(zāi),管理維護(hù)大大簡(jiǎn)化     所以,在目前情況下,基于智能SAN虛擬存儲(chǔ)設(shè)備進(jìn)行磁盤(pán)復(fù)制的方式是最適合目前項(xiàng)目需要的,也是存儲(chǔ)工程師

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論