同城容災(zāi)規(guī)劃方案(模板)_第1頁(yè)
同城容災(zāi)規(guī)劃方案(模板)_第2頁(yè)
同城容災(zāi)規(guī)劃方案(模板)_第3頁(yè)
同城容災(zāi)規(guī)劃方案(模板)_第4頁(yè)
同城容災(zāi)規(guī)劃方案(模板)_第5頁(yè)
已閱讀5頁(yè),還剩27頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、xxxxx容災(zāi)中心規(guī)劃方案目 錄1總體規(guī)劃41.1設(shè)計(jì)依據(jù)41.2設(shè)計(jì)原則41.3建設(shè)內(nèi)容51.3.1第一階段建設(shè)內(nèi)容51.3.2第二階段建設(shè)內(nèi)容51.4總體設(shè)計(jì)61.4.1容災(zāi)技術(shù)選擇61.4.1.1容災(zāi)技術(shù)選擇原則61.4.1.2技術(shù)選擇61.4.2容災(zāi)架構(gòu)設(shè)計(jì)71.4.2.1鏡像實(shí)現(xiàn)數(shù)據(jù)級(jí)容災(zāi)71.4.2.2容災(zāi)方案優(yōu)勢(shì)81.4.2.3本地cluster、同城異地cluster91.4.2.3.1本地cluster101.4.2.3.2同城cluster111.5分階段建設(shè)121.5.1第一階段建設(shè)131.5.1.1基礎(chǔ)設(shè)施建設(shè)131.5.1.1.1容災(zāi)機(jī)房建設(shè)131.5.1.1.2裸光

2、纖鏈路131.5.1.1.3連接設(shè)備131.5.1.1.4san交換機(jī)131.5.1.2數(shù)據(jù)級(jí)容災(zāi)建設(shè)131.5.1.2.1數(shù)據(jù)容災(zāi)架構(gòu)141.5.1.2.2容災(zāi)資源要求141.5.1.3各應(yīng)用系統(tǒng)數(shù)據(jù)異地備份容災(zāi)建設(shè)151.5.2第二階段建設(shè)151.5.2.1應(yīng)用級(jí)容災(zāi)建設(shè)151.5.2.1.1應(yīng)用系統(tǒng)容災(zāi)架構(gòu)161.5.2.1.2設(shè)計(jì)描述161.5.2.1.3容災(zāi)資源要求172詳細(xì)設(shè)計(jì)182.1基礎(chǔ)設(shè)施建設(shè)182.1.1網(wǎng)絡(luò)系統(tǒng)設(shè)計(jì)182.1.1.1設(shè)計(jì)原則182.1.1.2網(wǎng)絡(luò)系統(tǒng)設(shè)計(jì)192.1.2雙中心互聯(lián)設(shè)計(jì)202.1.2.1雙中心之間鏈路選擇202.1.2.2雙中心之間網(wǎng)絡(luò)設(shè)計(jì)20

3、2.2數(shù)據(jù)級(jí)容災(zāi)設(shè)計(jì)212.2.1系統(tǒng)設(shè)計(jì)212.2.1.1方案的結(jié)構(gòu)原理212.2.1.2系統(tǒng)架構(gòu)222.2.2系統(tǒng)故障響應(yīng)232.2.2.1生產(chǎn)中心存儲(chǔ)系統(tǒng)故障232.2.2.2災(zāi)備中心存儲(chǔ)系統(tǒng)故障242.2.2.3生產(chǎn)中心和災(zāi)備中心san鏈路故障242.3應(yīng)用級(jí)容災(zāi)設(shè)計(jì)252.3.1系統(tǒng)構(gòu)架252.3.2系統(tǒng)部署252.3.3容災(zāi)軟件部署262.3.4系統(tǒng)故障和災(zāi)難響應(yīng)282.3.4.1生產(chǎn)中心存儲(chǔ)系統(tǒng)故障282.3.4.2容災(zāi)中心存儲(chǔ)系統(tǒng)故障292.3.4.3生產(chǎn)中心和容災(zāi)中心san鏈路故障292.3.4.4生產(chǎn)中心和容災(zāi)中心之間ip網(wǎng)絡(luò)鏈路故障302.3.4.5生產(chǎn)中心一臺(tái)數(shù)據(jù)庫(kù)服務(wù)

4、器不可用312.3.4.6生產(chǎn)中心所有數(shù)據(jù)庫(kù)服務(wù)器不可用312.3.4.7生產(chǎn)中心所有數(shù)據(jù)庫(kù)服務(wù)器和存儲(chǔ)系統(tǒng)不可用312.4各應(yīng)用系統(tǒng)數(shù)據(jù)異地備份容災(zāi)設(shè)計(jì)322.4.1備份系統(tǒng)建設(shè)原則322.4.2備份方案設(shè)計(jì)331 總體規(guī)劃1.1 設(shè)計(jì)依據(jù)xxxxx容災(zāi)中心建設(shè)設(shè)計(jì),將遵循以下設(shè)計(jì)依據(jù): 2006-2020年國(guó)家信息化發(fā)展戰(zhàn)略(中辦發(fā)【2006】11號(hào)) 信息安全等級(jí)保護(hù)管理辦法 (公通字【2007】 43號(hào)) 重要信息系統(tǒng)災(zāi)難恢復(fù)規(guī)劃指南國(guó)信辦 信息系統(tǒng)災(zāi)難恢復(fù)規(guī)范(gb/t 20988-2007)。1.2 設(shè)計(jì)原則從硬件平臺(tái)的目標(biāo)來(lái)看,首要需要實(shí)現(xiàn)的是第一階段目標(biāo),在第一階段目標(biāo)實(shí)現(xiàn)的基

5、礎(chǔ)上實(shí)現(xiàn)第二階段的目標(biāo)。因此,硬件平臺(tái)設(shè)計(jì)中應(yīng)遵循以下原則:安全性:xxxxx重要系統(tǒng)24小時(shí)運(yùn)行,安全是非常重要,服務(wù)器、存儲(chǔ)系統(tǒng)和數(shù)據(jù)傳輸?shù)确矫娑夹枰紤]安全性,在此基礎(chǔ)上,才能考慮下一步的穩(wěn)定性設(shè)計(jì)。穩(wěn)定性:網(wǎng)絡(luò)、服務(wù)器、存儲(chǔ)等建設(shè)主要目標(biāo)之一是就是穩(wěn)定,應(yīng)該保證業(yè)務(wù)的連續(xù)性,服務(wù)器和存儲(chǔ)系統(tǒng)都需要保證應(yīng)用的穩(wěn)定運(yùn)行,在遇到突發(fā)情況時(shí)備機(jī)和備份系統(tǒng)發(fā)揮作用,確保業(yè)務(wù)能夠持續(xù)??煽啃裕壕W(wǎng)絡(luò)、服務(wù)器和存儲(chǔ)的建設(shè)不可忽視的是可靠性的提升,比如通過(guò)網(wǎng)絡(luò)、服務(wù)器之間的雙機(jī)、存儲(chǔ)級(jí)別的同步來(lái)實(shí)現(xiàn)高可用,網(wǎng)絡(luò)有足夠的帶寬適應(yīng)突增的數(shù)據(jù)流量、保證應(yīng)用系統(tǒng)的可靠性。 兼容性: 硬件和軟件設(shè)施都應(yīng)該有很好的

6、兼容性,需要合理的利用資源,利用虛擬化等技術(shù),保證能和其他的產(chǎn)品很穩(wěn)定的兼容在一起。121.3 建設(shè)內(nèi)容xxxxx現(xiàn)有業(yè)務(wù)系統(tǒng)分為數(shù)據(jù)庫(kù)服務(wù)器、應(yīng)用服務(wù)器兩個(gè)類別。建成后的容災(zāi)中心將實(shí)現(xiàn)如下目標(biāo):容災(zāi)級(jí)別容災(zāi)目標(biāo)同城應(yīng)用級(jí)容災(zāi)要求生產(chǎn)中心故障后,允許人工干預(yù)切換到備份中心,做到數(shù)據(jù)接近零丟失,應(yīng)用恢復(fù)時(shí)間小于2小時(shí)。針對(duì)xxxxx應(yīng)用系統(tǒng)的情況,將xxxxx容災(zāi)中心建設(shè)劃分為二個(gè)階段,具體如下:1.3.1 第一階段建設(shè)內(nèi)容 第一階段建設(shè)內(nèi)容: 容災(zāi)基礎(chǔ)設(shè)施建設(shè):完成容災(zāi)中心機(jī)房、san網(wǎng)絡(luò)、鏈路等基礎(chǔ)設(shè)施建設(shè); 數(shù)據(jù)級(jí)容災(zāi)建設(shè):各應(yīng)用系統(tǒng)的數(shù)據(jù)級(jí)容災(zāi)建設(shè),實(shí)現(xiàn)跨中心的數(shù)據(jù)鏡像,零數(shù)據(jù)丟失; 實(shí)

7、現(xiàn)各應(yīng)用系統(tǒng)數(shù)據(jù)集中備份、異地存放; 建立容災(zāi)應(yīng)急預(yù)案和演練流程。1.3.2 第二階段建設(shè)內(nèi)容 第二階段建設(shè)內(nèi)容: 應(yīng)用級(jí)容災(zāi)建設(shè):完成各應(yīng)用系統(tǒng)的應(yīng)用級(jí)容災(zāi)建設(shè),通過(guò)跨中心的應(yīng)用系統(tǒng)集群、雙活中心建設(shè),實(shí)現(xiàn)零數(shù)據(jù)丟失,2小時(shí)內(nèi)完成業(yè)務(wù)接管; 完善容災(zāi)應(yīng)急預(yù)案和演練流程。1.4 總體設(shè)計(jì)1.4.1 容災(zāi)技術(shù)選擇1.4.1.1 容災(zāi)技術(shù)選擇原則容災(zāi)技術(shù)選擇依據(jù)以下這些原則:1. 滿足不同應(yīng)用需求的容災(zāi)數(shù)據(jù)損失(rpo)、及應(yīng)恢復(fù)時(shí)間(rto),數(shù)據(jù)一致性等具體要求。2. 支持本地的系統(tǒng)加固以及本地系統(tǒng)的彈性構(gòu)架。而彈性構(gòu)架是對(duì)it系統(tǒng)的長(zhǎng)期發(fā)展直觀重要,主要是指it系統(tǒng)橫向、縱向的擴(kuò)展性。比如異

8、構(gòu)環(huán)境的支持、擴(kuò)展。而系統(tǒng)本地加固與遠(yuǎn)程容災(zāi)的技術(shù)必須是互不沖突的。3. 在能夠滿足以上兩項(xiàng)要求的同時(shí),最經(jīng)濟(jì)。4. 支持容災(zāi)各層的總體切換。1.4.1.2 技術(shù)選擇前面對(duì)各種數(shù)據(jù)復(fù)制技術(shù)進(jìn)行了深入分析,根據(jù)xxxxx各應(yīng)用系統(tǒng)容災(zāi)建設(shè)需求,選擇如下技術(shù)實(shí)現(xiàn)容災(zāi):應(yīng)用系統(tǒng)容災(zāi)需求容災(zāi)技術(shù)數(shù)據(jù)級(jí)容災(zāi)rpo=0,rto2小時(shí)異構(gòu)盤陣間鏡像應(yīng)用級(jí)容災(zāi)rpo=0,rto2小時(shí)集群1.4.2 容災(zāi)架構(gòu)設(shè)計(jì)1.4.2.1 鏡像實(shí)現(xiàn)數(shù)據(jù)級(jí)容災(zāi)此次xxxxx容災(zāi)系統(tǒng)建設(shè),建議采用異構(gòu)盤陣間鏡像,逐步實(shí)現(xiàn)從數(shù)據(jù)級(jí)容災(zāi)到應(yīng)用級(jí)容災(zāi)的建設(shè)。利用鏡像技術(shù),實(shí)現(xiàn)異構(gòu)盤陣間的數(shù)據(jù)同步,來(lái)構(gòu)建容災(zāi)方案。就是將生產(chǎn)中心和災(zāi)備

9、中心之間的san存儲(chǔ)區(qū)域網(wǎng)絡(luò)通過(guò)光纖連接起來(lái),建立城域san存儲(chǔ)網(wǎng)絡(luò)。然后,通過(guò)跨陣列磁盤鏡像技術(shù)來(lái)實(shí)現(xiàn)同城容災(zāi)。從原理上講,在城域san存儲(chǔ)網(wǎng)絡(luò)上的兩套磁盤系統(tǒng)之間的鏡像,和在一個(gè)機(jī)房?jī)?nèi)的san上的兩個(gè)磁盤系統(tǒng)之間鏡像并沒(méi)有任何區(qū)別。利用光纖將生產(chǎn)中心和災(zāi)備中心的san網(wǎng)絡(luò)連接起來(lái),構(gòu)成城域san網(wǎng)絡(luò)以后,我們就可以非常方便的使用鏡像技術(shù)實(shí)現(xiàn)生產(chǎn)中心磁盤系統(tǒng)和災(zāi)備中心磁盤系統(tǒng)之間的數(shù)據(jù)同步了。如下圖所示:利用容災(zāi)軟件,我們可以創(chuàng)建任意一個(gè)邏輯卷(volume)供業(yè)務(wù)主機(jī)使用,實(shí)際上是由個(gè)完全對(duì)等的,容量相同的磁盤片構(gòu)成,兩的個(gè)磁盤片上的數(shù)據(jù)完全一樣,業(yè)務(wù)主機(jī)對(duì)該volume的任意修改,都將同

10、時(shí)被寫到位于生產(chǎn)中心和災(zāi)備中心的兩個(gè)磁盤系統(tǒng)上。采用這種方式,生產(chǎn)中心的磁盤陣列與同城容災(zāi)中心的磁盤陣列對(duì)于兩地的主機(jī)而言是完全同等的。利用城域san存儲(chǔ)網(wǎng)絡(luò)和鏡像功能,我們可以非常輕松的實(shí)現(xiàn)數(shù)據(jù)系統(tǒng)的異地容災(zāi)。并且消除了復(fù)制技術(shù)(無(wú)論是同步還是異步)的切換的動(dòng)作,從而保證零停機(jī)時(shí)間,零數(shù)據(jù)損失的實(shí)現(xiàn)。1.4.2.2 容災(zāi)方案優(yōu)勢(shì) 零停機(jī)時(shí)間,業(yè)務(wù)不中斷。無(wú)論是生產(chǎn)中心還是容災(zāi)中心的磁盤陣列發(fā)生問(wèn)題,都不會(huì)導(dǎo)致應(yīng)用停頓,從而導(dǎo)致業(yè)務(wù)中斷。 發(fā)生災(zāi)難時(shí),無(wú)需手工活自動(dòng)切換來(lái)恢復(fù)應(yīng)用,應(yīng)用會(huì)無(wú)縫的繼續(xù)進(jìn)行。從而也不會(huì)造成人為的錯(cuò)誤發(fā)生。 由于應(yīng)用不會(huì)中斷,數(shù)據(jù)的一致性也沒(méi)有任何風(fēng)險(xiǎn),不會(huì)像其他的容

11、災(zāi)方案,在容災(zāi)切換后,數(shù)據(jù)庫(kù)仍然有啟動(dòng)不成功的可能性。 跨磁盤陣列鏡像一旦發(fā)生災(zāi)難,修復(fù)后,跨陣列的可以實(shí)現(xiàn)增量的數(shù)據(jù)同步,而不需要重新同步所有數(shù)據(jù),對(duì)系統(tǒng)的影響極小。 跨整列的鏡像,支持在不同品牌,不同型號(hào)的磁盤陣列之間進(jìn)行??梢宰畲笙薅鹊谋Wo(hù)用戶以前的投資。 跨磁盤陣列鏡像還可以通過(guò)調(diào)整讀寫機(jī)制,提高系統(tǒng)的讀寫性能。 基于san的容災(zāi)技術(shù),其容災(zāi)距離可以在100公里的范圍內(nèi),得到很好的想能保障。 可擴(kuò)充性好,不局限于某一品牌磁盤產(chǎn)品 可控的切換時(shí)間rto表示所能接受的業(yè)務(wù)中斷時(shí)間,從某種程度上講,也就取決于在生產(chǎn)中心宕機(jī)時(shí),將業(yè)務(wù)切換到容災(zāi)中心的時(shí)間長(zhǎng)度。系統(tǒng)的切換時(shí)間:數(shù)據(jù)庫(kù)啟動(dòng)、狀態(tài)檢

12、查5分鐘數(shù)據(jù)庫(kù)切換10分鐘中間件啟動(dòng)1分鐘網(wǎng)絡(luò)切換1分鐘l 應(yīng)用級(jí)的容災(zāi)容災(zāi)分為數(shù)據(jù)級(jí)容災(zāi)和應(yīng)用級(jí)容災(zāi)。本次xxxxx的容災(zāi)系統(tǒng)設(shè)計(jì),將提供應(yīng)用級(jí)別的容災(zāi)方案。所謂應(yīng)用級(jí)的容災(zāi),是指在數(shù)據(jù)容災(zāi)的基礎(chǔ)上,在異地建立一套完整的與本地生產(chǎn)系統(tǒng)相當(dāng)?shù)膫溆脩?yīng)用系統(tǒng)(可以是互為備份)。1.4.2.3 本地cluster、同城異地cluster備份、cluster、復(fù)制等技術(shù)都是為防止系統(tǒng)或數(shù)據(jù)故障時(shí)業(yè)務(wù)仍然可用。其中,cluster技術(shù)可以處理以下原因造成的故障:系統(tǒng)硬件故障如數(shù)據(jù)/系統(tǒng)磁盤的損壞將導(dǎo)致數(shù)據(jù)不能訪問(wèn),并進(jìn)而可能導(dǎo)致應(yīng)用進(jìn)程終止或系統(tǒng)停機(jī),甚至系統(tǒng)不能重啟動(dòng);網(wǎng)卡的損壞可使終端用戶無(wú)法訪問(wèn)系

13、統(tǒng)服務(wù);cpu或內(nèi)存的失效則會(huì)導(dǎo)致系統(tǒng)的死機(jī);應(yīng)用程序或操作系統(tǒng)出錯(cuò)由于操作系統(tǒng)或應(yīng)用程序中可能存在不完善的地方,當(dāng)碰到某種激發(fā)事件時(shí),應(yīng)用程序非正常終止或系統(tǒng)崩潰(只能通過(guò)改善程序或系統(tǒng)來(lái)解決);人為錯(cuò)誤一些人工的誤操作,如刪除系統(tǒng)或應(yīng)用文件,終止系統(tǒng)或應(yīng)用服務(wù)進(jìn)程,也會(huì)導(dǎo)致系統(tǒng)服務(wù)的無(wú)法訪問(wèn);自然災(zāi)害由于一些意外的不可抗拒的因素,如雷擊、火災(zāi)、洪災(zāi)等導(dǎo)致的計(jì)算機(jī)系統(tǒng)破壞,將會(huì)使一般系統(tǒng)的恢復(fù)非常困難和耗時(shí),導(dǎo)致業(yè)務(wù)系統(tǒng)長(zhǎng)時(shí)間的中斷(通過(guò)容災(zāi)系統(tǒng)來(lái)解決)。正常的停機(jī)主要指計(jì)劃內(nèi)的系統(tǒng)升級(jí)、安裝軟件、系統(tǒng)備份等過(guò)程。為保證整個(gè)容災(zāi)系統(tǒng)的高可用,本方案將采用本地cluster和同城異地clust

14、er相結(jié)合的方式實(shí)現(xiàn)應(yīng)用級(jí)容災(zāi)。1.4.2.3.1 本地cluster本地cluster系統(tǒng)應(yīng)用非常廣泛,大部分關(guān)鍵的業(yè)務(wù)系統(tǒng)都采用cluster技術(shù)來(lái)防止單機(jī)故障。一般來(lái)說(shuō),cluster主要由硬件和軟件兩部分組成。硬件部分有:多臺(tái)服務(wù)器設(shè)備,共享磁盤,心跳線;軟件部分有:對(duì)資源的監(jiān)控和切換,心跳協(xié)議,日志管理。cluster會(huì)在兩條心跳鏈路上傳輸偵測(cè)包,實(shí)時(shí)監(jiān)測(cè)其他主機(jī)系統(tǒng)和各種軟硬件資源的運(yùn)行情況,如應(yīng)用進(jìn)程、網(wǎng)卡、ip、磁盤、文件系統(tǒng)等,當(dāng)任何一種資源失效時(shí),cluster即會(huì)按照預(yù)先定義的規(guī)則快速實(shí)行相應(yīng)的硬件或應(yīng)用切換。例如: 當(dāng)一臺(tái)機(jī)器上的工作網(wǎng)卡發(fā)生故障時(shí),cluster會(huì)自動(dòng)

15、地切換到另一塊網(wǎng)卡; 當(dāng)一臺(tái)主機(jī)發(fā)生故障或關(guān)機(jī)時(shí),cluster會(huì)自動(dòng)地將其上的應(yīng)用切換到另一臺(tái)機(jī)器; 當(dāng)應(yīng)用服務(wù)進(jìn)程非正常終止時(shí),cluster會(huì)自動(dòng)重起相關(guān)進(jìn)程,或?qū)⒎?wù)進(jìn)程切換到其他機(jī)器上 當(dāng)系統(tǒng)需要進(jìn)行維護(hù)時(shí),可手工將應(yīng)用從一臺(tái)機(jī)器切換到其他機(jī)器。1.4.2.3.2 同城cluster同城cluster一般也稱為園區(qū)網(wǎng)cluster(campus cluster)或中距離cluster(middle-area-network cluster),以區(qū)別于本地cluster。同城cluster的實(shí)現(xiàn),得益于光纖技術(shù)的發(fā)展。因?yàn)橐郧安捎胹csi線纜共享磁盤的方法,由于scsi線纜的長(zhǎng)度限制,

16、無(wú)法將兩臺(tái)組成cluster的服務(wù)器隔離很遠(yuǎn)。但采用光纖連接主機(jī)和存儲(chǔ)設(shè)備,可以將主機(jī)與磁盤的距離延伸很遠(yuǎn)。因此,同城cluster都采用光纖連接存儲(chǔ)設(shè)備。另外,同城cluster還依賴于跨磁盤陣列的鏡像技術(shù)(一般由volume manager軟件實(shí)現(xiàn))。這樣每臺(tái)服務(wù)器本地連接一份磁盤陣列,兩個(gè)陣列通過(guò)volume manager進(jìn)行鏡像,就可以將兩個(gè)物理上完全獨(dú)立的系統(tǒng)組成一個(gè)cluster系統(tǒng),從而可以防止小范圍災(zāi)難事件的發(fā)生(例如機(jī)房失火)。結(jié)構(gòu)如下所示:因此,在許多實(shí)際應(yīng)用中,都把同城cluster做為同城容災(zāi)的解決方案。cluster方案在成本、切換速度、對(duì)系統(tǒng)的性能影響等方面都有很

17、大優(yōu)勢(shì)。例如,當(dāng)生產(chǎn)中心磁盤故障時(shí),對(duì)整個(gè)系統(tǒng)沒(méi)有任何影響,無(wú)需進(jìn)行應(yīng)用切換,從而不對(duì)業(yè)務(wù)造成的影響。1.5 分階段建設(shè)容災(zāi)系統(tǒng)建設(shè)是一個(gè)復(fù)雜的系統(tǒng)工程,建議xxxxx分階段進(jìn)行建設(shè),這樣對(duì)業(yè)務(wù)系統(tǒng)的影響最小、可以在建設(shè)中逐步積累經(jīng)驗(yàn)。1.5.1 第一階段建設(shè)1.5.1.1 基礎(chǔ)設(shè)施建設(shè)基礎(chǔ)設(shè)施建設(shè)包含容災(zāi)機(jī)房的建設(shè)(包括場(chǎng)地租用、san網(wǎng)絡(luò)建設(shè))、裸光纖租用和生產(chǎn)中心調(diào)整。1.5.1.1.1 容災(zāi)機(jī)房建設(shè)容災(zāi)機(jī)房需要考慮如下各子系統(tǒng): 電力系統(tǒng) 空調(diào)系統(tǒng) 消防系統(tǒng) 安全系統(tǒng) 標(biāo)準(zhǔn)機(jī)架 綜合布線系統(tǒng) 防震系統(tǒng) 1.5.1.1.2 裸光纖鏈路租用或單獨(dú)部署裸光纖。1.5.1.1.3 連接設(shè)備建議

18、采用cwmd設(shè)備用于連接兩地san網(wǎng)絡(luò),實(shí)現(xiàn)波分復(fù)用。1.5.1.1.4 san交換機(jī)使用適當(dāng)端口的san交換機(jī)。1.5.1.2 數(shù)據(jù)級(jí)容災(zāi)建設(shè)針對(duì)系統(tǒng):數(shù)據(jù)庫(kù)服務(wù)器、應(yīng)用服務(wù)器方案效果:雙中心數(shù)據(jù)完全一致,零數(shù)據(jù)丟失;單一存儲(chǔ)設(shè)備故障,零切換;容災(zāi)效果:容災(zāi)等級(jí)達(dá)到國(guó)信辦容災(zāi)最高等級(jí)5級(jí)1.5.1.2.1 數(shù)據(jù)容災(zāi)架構(gòu)1.5.1.2.2 容災(zāi)資源要求n 容災(zāi)中心san網(wǎng)絡(luò):本方案中數(shù)據(jù)容災(zāi)是基于裸光纖鏈路實(shí)現(xiàn)的遠(yuǎn)程鏡像,因此在生產(chǎn)中心及容災(zāi)中心必須首先構(gòu)建好本地的san網(wǎng)絡(luò);當(dāng)前的生產(chǎn)中心已經(jīng)具備了基本san 架構(gòu),容災(zāi)中心新購(gòu)兩臺(tái)san交換機(jī),實(shí)現(xiàn)物理設(shè)備冗余。n 容災(zāi)鏈路:在兩個(gè)中心之間

19、的san鏈路,可以通過(guò)租用裸光纖來(lái)實(shí)現(xiàn)生產(chǎn)中心和容災(zāi)中心的san鏈路直聯(lián)。建議采作用兩條不同的電信運(yùn)營(yíng)商的裸光纖鏈路,以實(shí)現(xiàn)冗余。n 容災(zāi)中心存儲(chǔ):容災(zāi)中心需要采購(gòu)一臺(tái)或兩臺(tái)存儲(chǔ)設(shè)備,用于應(yīng)用服務(wù)器和數(shù)據(jù)庫(kù)服務(wù)器的數(shù)據(jù)容災(zāi),采用軟件實(shí)現(xiàn)跨中心鏡像容災(zāi),磁盤陣列的品牌可以與現(xiàn)有磁盤陣列不同。1.5.1.3 各應(yīng)用系統(tǒng)數(shù)據(jù)異地備份容災(zāi)建設(shè)在xxxxx容災(zāi)系統(tǒng)第一階段建設(shè)中,針對(duì)除第一級(jí)應(yīng)用系統(tǒng)外的其他系統(tǒng),通過(guò)數(shù)據(jù)備份的方式實(shí)現(xiàn)數(shù)據(jù)異地備份與存放,增強(qiáng)數(shù)據(jù)異地容災(zāi)的保護(hù)作用。數(shù)據(jù)中心和容災(zāi)中心之間采用的是裸光纖鏈路,同時(shí)采用了cwmd設(shè)備實(shí)現(xiàn)波分復(fù)用,帶寬資源豐富,因此,在數(shù)據(jù)中心和容災(zāi)中心構(gòu)建統(tǒng)

20、一的備份域,通過(guò)一套備份軟件實(shí)現(xiàn)數(shù)據(jù)本地和異地備份,實(shí)現(xiàn)數(shù)據(jù)容災(zāi)備份。1.5.2 第二階段建設(shè)1.5.2.1 應(yīng)用級(jí)容災(zāi)建設(shè)針對(duì)系統(tǒng):數(shù)據(jù)庫(kù)服務(wù)器、應(yīng)用服務(wù)器方案效果:雙中心數(shù)據(jù)完全一致,零數(shù)據(jù)丟失;單一設(shè)備故障,零切換;數(shù)據(jù)中心站點(diǎn)故障,零數(shù)據(jù)丟失、2小時(shí)內(nèi)恢復(fù)業(yè)務(wù):容災(zāi)效果:容災(zāi)等級(jí)達(dá)到國(guó)信辦容災(zāi)最高等級(jí)6級(jí)1.5.2.1.1 設(shè)計(jì)描述l 應(yīng)用容災(zāi):n 兩地?cái)?shù)據(jù)已通過(guò)鏡像技術(shù)實(shí)現(xiàn)同步,零數(shù)據(jù)丟失;n 通過(guò)cluster技術(shù),在本地和遠(yuǎn)端構(gòu)建獨(dú)立的集群組,通過(guò)站點(diǎn)切換技術(shù)實(shí)現(xiàn)兩個(gè)中心之間的集群組切換,實(shí)現(xiàn)零數(shù)據(jù)丟失、單個(gè)業(yè)務(wù)10分鐘內(nèi)實(shí)現(xiàn)業(yè)務(wù)切換。n 通過(guò)應(yīng)用負(fù)載均衡設(shè)備,實(shí)現(xiàn)雙中心應(yīng)用服務(wù)

21、器的自動(dòng)負(fù)載,零切換。l 網(wǎng)絡(luò)容災(zāi):當(dāng)生產(chǎn)中心發(fā)生災(zāi)難,應(yīng)用程序切換并正常接管工作后,還必須完成容災(zāi)中的網(wǎng)絡(luò)設(shè)備切換及應(yīng)用服務(wù)器的網(wǎng)絡(luò)解析,從而使客戶端自動(dòng)地聯(lián)系到容災(zāi)中心的應(yīng)用服務(wù)器上,正常開展工作。這樣,就真正意義上的實(shí)現(xiàn)了整個(gè)生產(chǎn)中心到容災(zāi)中心的切換。1.5.2.1.2 容災(zāi)資源要求l 本地及容災(zāi)中心san網(wǎng)絡(luò):第一階段已經(jīng)建設(shè)完成。l 容災(zāi)鏈路:n tcp/ip鏈路。應(yīng)用服務(wù)器切換所有需要的tcp/ip網(wǎng)絡(luò)鏈路,可以在租用裸光纖的鏈路上進(jìn)行加載,對(duì)于生產(chǎn)中心和容災(zāi)中心的tcp/ip網(wǎng)絡(luò)鏈路的要求是,只需連個(gè)中心之間的ip地址能夠ping通即可。l 容災(zāi)中心主機(jī):n 為了實(shí)現(xiàn)應(yīng)用的接管,

22、針對(duì)各應(yīng)用系統(tǒng)容災(zāi)中心各添加一臺(tái)相應(yīng)的服務(wù)器,作為數(shù)據(jù)庫(kù)及應(yīng)用的接管服務(wù)器??紤]到投資和災(zāi)難發(fā)生的概率,建議各采用一臺(tái)與生產(chǎn)中心能力相同或者略高的服務(wù)即可。l 容災(zāi)中心存儲(chǔ):第一階段已經(jīng)建設(shè)完成。2 詳細(xì)設(shè)計(jì)2.1 基礎(chǔ)設(shè)施建設(shè)基礎(chǔ)設(shè)施建設(shè)是其他系統(tǒng)容災(zāi)建設(shè)的基礎(chǔ),其包括托管機(jī)房租用、鏈路租用、波分復(fù)用設(shè)備、san交換機(jī)、網(wǎng)絡(luò)負(fù)載均衡器、網(wǎng)絡(luò)安全設(shè)備、網(wǎng)絡(luò)設(shè)備和管理服務(wù)器等建設(shè)。1) 建設(shè)建議:a) 沿用和傳承:網(wǎng)絡(luò)設(shè)備、網(wǎng)絡(luò)安全設(shè)備、san交換機(jī)、pc服務(wù)器等設(shè)備,在價(jià)格同等的情況下,盡量采用現(xiàn)在正在使用品牌的同等設(shè)備,方便管理與維護(hù);b) 采用知名品牌、占有率高的設(shè)備:對(duì)于沒(méi)有采用過(guò)的設(shè)備

23、,盡量采用市場(chǎng)占有率比較高的知名品牌的設(shè)備。2) 各部分建設(shè)說(shuō)明:a) 容災(zāi)機(jī)房建設(shè):容災(zāi)機(jī)房可以采用自建或租用的方式;b) 鏈路租用:分別租用電信和網(wǎng)通的兩條裸光纖鏈路,用于雙中心的san和網(wǎng)絡(luò)互聯(lián),租用電信和網(wǎng)通廣域網(wǎng)鏈路,形成廣域網(wǎng)連接,下面將與波分復(fù)用設(shè)備一同設(shè)計(jì);c) 波分復(fù)用設(shè)備:建議采用支持8個(gè)波長(zhǎng)或者16個(gè)波長(zhǎng)的設(shè)備;d) san交換機(jī):采用4gb設(shè)備,san網(wǎng)絡(luò)設(shè)計(jì)將在存儲(chǔ)系統(tǒng)設(shè)計(jì)中詳細(xì)闡述; 2.1.1 網(wǎng)絡(luò)系統(tǒng)設(shè)計(jì)2.1.1.1 設(shè)計(jì)原則高網(wǎng)絡(luò)服務(wù)質(zhì)量保證網(wǎng)絡(luò)提供最優(yōu)服務(wù)品質(zhì),滿足客戶各種業(yè)務(wù)需求。 最大端到端延遲時(shí)間100ms 網(wǎng)絡(luò)丟包率1% 高可用性可提供的網(wǎng)絡(luò)利用率

24、99.99%,每年網(wǎng)絡(luò)不可用時(shí)間小于53秒。 核心采用雙機(jī)備份,保證在一臺(tái)設(shè)備或一個(gè)斷口中斷時(shí),客戶業(yè)務(wù)也能夠暢通無(wú)阻。網(wǎng)絡(luò)設(shè)備及線路全部采用冗余配置,保證網(wǎng)絡(luò)持續(xù)聯(lián)通。高擴(kuò)展性無(wú)限的擴(kuò)展空間-滿足客戶擴(kuò)展與互聯(lián)互通需要高安全性完善的安全機(jī)制-避免網(wǎng)站遭受攻擊 逐步完善防病毒、入侵檢測(cè)、安全漏洞掃描等安全防護(hù)措施,幫助客戶免遭病毒和黑客襲擊。 可管理性通過(guò)專業(yè)的管理工具,為客戶提供網(wǎng)絡(luò)性能監(jiān)控,按提供性能分析報(bào)告。2.1.1.2 網(wǎng)絡(luò)系統(tǒng)設(shè)計(jì)總體說(shuō)來(lái),xxxxx在網(wǎng)絡(luò)相關(guān)的配套設(shè)施建設(shè)方面還是比較完善的,包括機(jī)房的建設(shè)上,基本上能夠滿足日常運(yùn)行的需要。本次網(wǎng)絡(luò)系統(tǒng)總體設(shè)計(jì),我們將對(duì)xxxxx的

25、網(wǎng)絡(luò)系統(tǒng)進(jìn)行總體規(guī)劃,包括數(shù)據(jù)中心和廣域網(wǎng)。架構(gòu)要點(diǎn):1) 兩路、兩中心:xxxxx同容災(zāi)中心之間通過(guò)兩條鏈路實(shí)現(xiàn)互聯(lián),即,租用兩條isp的鏈路,實(shí)現(xiàn)每各容災(zāi)中心通過(guò)兩條鏈路同數(shù)據(jù)中心、容災(zāi)中心的分別連接,保障兩個(gè)數(shù)據(jù)中心之間的數(shù)據(jù)負(fù)載均衡;2) cwdm應(yīng)用:通過(guò)cwdm技術(shù),實(shí)現(xiàn)一對(duì)光纖資源復(fù)用成8個(gè)波長(zhǎng),實(shí)現(xiàn)網(wǎng)絡(luò)、san環(huán)境的雙波長(zhǎng)高速互聯(lián);3) 路由自動(dòng)切換:采用原有的路由協(xié)議,實(shí)現(xiàn)廣域網(wǎng)鏈路的自動(dòng)切換。2.1.2 雙中心互聯(lián)設(shè)計(jì)數(shù)據(jù)中心、容災(zāi)中心之間搭建的網(wǎng)絡(luò)平臺(tái),不單要實(shí)現(xiàn)兩個(gè)網(wǎng)絡(luò)系統(tǒng)之間的信息交互,還需要為數(shù)據(jù)中心、容災(zāi)中心之間的數(shù)據(jù)傳輸提供通道,包括基于san架構(gòu)的同城容災(zāi),基

26、于ip網(wǎng)絡(luò)的統(tǒng)一集群,以及備份系統(tǒng)等都需要提供鏈路和傳輸平臺(tái);因此,雙中心之間的網(wǎng)絡(luò)設(shè)計(jì)十分重要。2.1.2.1 雙中心之間鏈路選擇雙中心之間傳輸?shù)臄?shù)據(jù),既有通過(guò)ip網(wǎng)絡(luò)傳輸?shù)臄?shù)據(jù),也有通過(guò)san傳輸?shù)臄?shù)據(jù);因此,如果租用鏈路的話,需要租用多條通訊鏈路。為了保護(hù)用戶投資,合理充分利用鏈路資源,建議租用兩條裸光纖,通過(guò)cwdm技術(shù),對(duì)光纖鏈路進(jìn)行復(fù)用。2.1.2.2 雙中心之間網(wǎng)絡(luò)設(shè)計(jì)在數(shù)據(jù)中心、容災(zāi)中心租用不同運(yùn)行商的兩條裸光纖,通過(guò)cwdm技術(shù),對(duì)光纖鏈路進(jìn)行復(fù)用。數(shù)據(jù)中心、容災(zāi)中心的互聯(lián)可以采用cwdm技術(shù),通過(guò)oadm和對(duì)應(yīng)的cwdm收發(fā)器實(shí)現(xiàn)8路1000mbps信號(hào)以不同波長(zhǎng)復(fù)用在單一

27、光纖上,實(shí)現(xiàn)新老數(shù)據(jù)中心備份。 通過(guò)點(diǎn)到點(diǎn)配置波分復(fù)用設(shè)備,最多允許客戶在一對(duì)單模光纖束中增減八個(gè)通道(千兆位以太網(wǎng)和/或光纖通道)。因此,客戶幾乎不需要增加光纖。如果將冗余通道增減到第二對(duì)單模光纖束中,還可以建立冗余點(diǎn)到點(diǎn)鏈路。 2.2 數(shù)據(jù)級(jí)容災(zāi)設(shè)計(jì)2.2.1 系統(tǒng)設(shè)計(jì)2.2.1.1 方案的結(jié)構(gòu)原理設(shè)計(jì)解決方案將采用基于軟件的鏡像技術(shù),來(lái)構(gòu)建高可用方案。利用軟件鏡像技術(shù)構(gòu)建高可用系統(tǒng),需要在生產(chǎn)中心和災(zāi)備中心之間建立城域san存儲(chǔ)區(qū)域網(wǎng)絡(luò),通過(guò)裸光纖連接起來(lái);這樣就可以通過(guò)跨陣列磁盤鏡像技術(shù)來(lái)實(shí)現(xiàn)同城容災(zāi),高可用方案的結(jié)構(gòu)如下圖所示:從原理上講,在城域san存儲(chǔ)網(wǎng)絡(luò)上的兩套磁盤系統(tǒng)之間的鏡

28、像,和在一個(gè)機(jī)房?jī)?nèi)的san上的兩個(gè)磁盤系統(tǒng)之間的鏡像并沒(méi)有任何區(qū)別。利用光纖將生產(chǎn)中心和災(zāi)備中心的san網(wǎng)絡(luò)連接起來(lái),構(gòu)成城域san網(wǎng)絡(luò)以后,我們就可以非常方便的實(shí)現(xiàn)生產(chǎn)中心磁盤系統(tǒng)和災(zāi)備中心磁盤系統(tǒng)之間的鏡像了。如下圖所示。這里,邏輯卷“volume a”是業(yè)務(wù)系統(tǒng)訪問(wèn)磁盤的邏輯設(shè)備名,所有業(yè)務(wù)系統(tǒng)對(duì)磁盤系統(tǒng)的訪問(wèn),都將通過(guò)volume實(shí)現(xiàn)。我們可以看到,利用volume manager,我們可以創(chuàng)建任意一個(gè)邏輯卷(volume)供業(yè)務(wù)主機(jī)使用,比如“volume a”,這個(gè)“volume a”實(shí)際上是由兩個(gè)完全對(duì)等的,容量和“volume a”相同的磁盤片構(gòu)成的,我們這里可以稱在生產(chǎn)中心磁

29、盤系統(tǒng)上的磁盤片為“volume a : plex 1”,而稱在災(zāi)備中心磁盤系統(tǒng)上的磁盤片為“volume a : plex 2”,這兩個(gè)磁盤片上的數(shù)據(jù)完全一樣,業(yè)務(wù)主機(jī)對(duì)該volume的任意修改,都將同時(shí)被寫到位于生產(chǎn)中心和災(zāi)備中心的兩個(gè)磁盤系統(tǒng)上。采用這種方式,生產(chǎn)中心的磁盤陣列與同城容災(zāi)中心的磁盤陣列對(duì)于兩地的主機(jī)而言是完全同等的。利用城域san存儲(chǔ)網(wǎng)絡(luò)和鏡像功能,我們可以非常輕松的實(shí)現(xiàn)數(shù)據(jù)系統(tǒng)的異地容災(zāi)。2.2.1.2 系統(tǒng)架構(gòu)系統(tǒng)拓?fù)鋱D如下:通過(guò)兩對(duì)裸光纖,讓兩個(gè)機(jī)房的san交換機(jī)組成一個(gè)相當(dāng)于本地的完整san網(wǎng)絡(luò),兩地機(jī)房的服務(wù)器既可以通過(guò)本地san交換機(jī)訪問(wèn)本地的san存儲(chǔ),也可

30、以通過(guò)復(fù)用的裸光纖來(lái)訪問(wèn)遠(yuǎn)端機(jī)房的san存儲(chǔ);都可以對(duì)放置在兩地機(jī)房中的存儲(chǔ)進(jìn)行讀寫操作;2.2.2 系統(tǒng)故障響應(yīng)高可用系統(tǒng)建設(shè)完成后,故障和災(zāi)難主要有以下幾情況:1. 生產(chǎn)中心存儲(chǔ)系統(tǒng)不可用2. 容災(zāi)中心存儲(chǔ)系統(tǒng)不可用3. 生產(chǎn)中心和容災(zāi)中心san鏈路故障2.2.2.1 生產(chǎn)中心存儲(chǔ)系統(tǒng)故障生產(chǎn)中心存儲(chǔ)系統(tǒng)故障意味著災(zāi)難,來(lái)看一下擬建后的高可用系統(tǒng)是如何響應(yīng)的,見下圖:當(dāng)生產(chǎn)中心的存儲(chǔ)系統(tǒng)發(fā)生故障(災(zāi)難)時(shí),由于同城容災(zāi)中心的存儲(chǔ)是它的鏡像,所以操作系統(tǒng)會(huì)自動(dòng)隔離生產(chǎn)中心的存儲(chǔ),轉(zhuǎn)而對(duì)容災(zāi)中心的存儲(chǔ)進(jìn)行訪問(wèn)。從上圖我們看到,業(yè)務(wù)系統(tǒng)可以通過(guò)城域san網(wǎng)絡(luò)直接訪問(wèn)災(zāi)備中心的磁盤系統(tǒng)的數(shù)據(jù),而不

31、需要有任何針對(duì)業(yè)務(wù)系統(tǒng)的動(dòng)作。也就是說(shuō),生產(chǎn)中心磁盤系統(tǒng)的災(zāi)難,對(duì)業(yè)務(wù)系統(tǒng)是透明的,應(yīng)用和數(shù)據(jù)庫(kù)不會(huì)因?yàn)樯a(chǎn)中心磁盤系統(tǒng)的故障而停止;更重要的是,因?yàn)閼?yīng)用和數(shù)據(jù)庫(kù)不會(huì)因?yàn)闉?zāi)難而異常中止,從而避免了發(fā)生數(shù)據(jù)庫(kù)損壞的可能。生產(chǎn)中心磁盤系統(tǒng)故障之后,只需要更換損壞的磁盤系統(tǒng),然后利用volume manager重新生成鏡像即可,重新生成鏡像的過(guò)程,實(shí)際上就是將數(shù)據(jù)從災(zāi)備中心磁盤系統(tǒng)復(fù)制到生產(chǎn)中心磁盤系統(tǒng)的過(guò)程。值得注意的是:整個(gè)過(guò)程對(duì)應(yīng)用完全透明,不需要也不會(huì)中斷業(yè)務(wù)系統(tǒng)的正常運(yùn)行。2.2.2.2 災(zāi)備中心存儲(chǔ)系統(tǒng)故障災(zāi)備中心數(shù)據(jù)系統(tǒng)故障,這種故障就同上一種故障類似,但對(duì)業(yè)務(wù)系統(tǒng)的影響更小。2.2.

32、2.3 生產(chǎn)中心和災(zāi)備中心san鏈路故障相對(duì)于以上兩種災(zāi)難,這種故障在高可用系統(tǒng)建立以后,出現(xiàn)的概率會(huì)更大一些,導(dǎo)致鏈路故障的原因很多,包括光纖斷裂,光端設(shè)備故障等,都會(huì)導(dǎo)致鏈路中斷。針對(duì)鏈路故障問(wèn)題,響應(yīng)步驟如下:1. san鏈路發(fā)生故障2. 生產(chǎn)中心的volume manager利用 dco日志記錄volume : plex 1 因業(yè)務(wù)數(shù)據(jù)的變化而變化的數(shù)據(jù)塊,災(zāi)備端volume : plex 2的數(shù)據(jù)不會(huì)作廢3. 一旦san鏈路恢復(fù)正常,volume manager的fmr功能模塊,會(huì)根據(jù) dco日志記錄的情況,將volume : plex 1 中鏈路中斷后更新的業(yè)務(wù)數(shù)據(jù)拷貝到災(zāi)備端vo

33、lume : plex 2,實(shí)現(xiàn)增量更新。2.3 應(yīng)用級(jí)容災(zāi)設(shè)計(jì)2.3.1 系統(tǒng)構(gòu)架2.3.2 系統(tǒng)部署xxxxx應(yīng)用級(jí)容災(zāi)建設(shè)分為7個(gè)內(nèi)容,分別是容災(zāi)機(jī)房、網(wǎng)絡(luò)層建設(shè)、主機(jī)層建設(shè)、存儲(chǔ)層建設(shè)、數(shù)據(jù)庫(kù)層建設(shè)、應(yīng)用層建設(shè)和容災(zāi)集中管理平臺(tái)建設(shè)。1. 容災(zāi)機(jī)房機(jī)房建設(shè)這里不做深入闡述。2. 網(wǎng)絡(luò)層建設(shè):配置cwdm設(shè)備,租用兩條裸光纖,通過(guò)鏈路復(fù)用技術(shù)實(shí)現(xiàn)生產(chǎn)中心和容災(zāi)中心之間ip網(wǎng)絡(luò)和san網(wǎng)絡(luò)數(shù)據(jù)的傳輸。 配置san交換機(jī),用于容災(zāi)中心san網(wǎng)絡(luò)建設(shè),實(shí)現(xiàn)與生產(chǎn)中心san網(wǎng)絡(luò)的高速互聯(lián)。配置路由器,用于容災(zāi)中心網(wǎng)絡(luò)搭建。配置防火墻,用于對(duì)服務(wù)器訪問(wèn)的安全控制。3. 主機(jī)層建設(shè)容災(zāi)中心配置與應(yīng)用

34、系統(tǒng)相對(duì)應(yīng)的、高性能主機(jī)與生產(chǎn)中心主機(jī)通過(guò)cluster遠(yuǎn)程集群功能實(shí)現(xiàn)主機(jī)的高可用性。生產(chǎn)中心、容災(zāi)中心任意一臺(tái)或兩臺(tái)主機(jī)出現(xiàn)故障,業(yè)務(wù)都不會(huì)中斷。 4. 存儲(chǔ)層建設(shè)容災(zāi)中心配置高性能存儲(chǔ),與生產(chǎn)中心存儲(chǔ)通過(guò)卷鏡像技術(shù)實(shí)現(xiàn)數(shù)據(jù)跨陣列遠(yuǎn)程鏡像,生產(chǎn)中心、容災(zāi)中心任意一臺(tái)存儲(chǔ)出現(xiàn)故障,業(yè)務(wù)都不會(huì)中斷。系統(tǒng)數(shù)據(jù)通過(guò)備份軟件,集中備份到生產(chǎn)中心vtl上,定時(shí)將備份數(shù)據(jù)復(fù)制到容災(zāi)中心vtl上,實(shí)現(xiàn)數(shù)據(jù)的異地備份。 2.3.3 容災(zāi)軟件部署此次容災(zāi)項(xiàng)目建設(shè)的核心就是容災(zāi)軟件的部署,容災(zāi)軟件的部署涉及到主機(jī)、存儲(chǔ)和數(shù)據(jù)庫(kù)層面。采用跨陣列磁盤鏡像技術(shù)來(lái)實(shí)現(xiàn)同城應(yīng)用級(jí)容災(zāi),實(shí)現(xiàn)生產(chǎn)中心與容災(zāi)中心在線數(shù)據(jù)完全同

35、步,保證了數(shù)據(jù)零丟失,應(yīng)用零切換。在各層次部署相應(yīng)的組件來(lái)實(shí)現(xiàn)主機(jī)、存儲(chǔ)和數(shù)據(jù)庫(kù)層面容災(zāi),具體部署如下:a) remote mirror:利用remote mirror功能,在生產(chǎn)中心和容災(zāi)中心的兩臺(tái)存儲(chǔ)之間形成跨陣列鏡像;生產(chǎn)中心、容災(zāi)中心任意一臺(tái)存儲(chǔ)出現(xiàn)故障,業(yè)務(wù)都不會(huì)中斷。鏡像進(jìn)程高度可控,可以隨時(shí)暫停、繼續(xù)、終止,并能指定控制在一定的性能范圍內(nèi)實(shí)施數(shù)據(jù)鏡像。故障修復(fù)時(shí)通過(guò)增量數(shù)據(jù)同步功能,對(duì)系統(tǒng)的影響極小。b) 采用動(dòng)態(tài)多路徑組件實(shí)現(xiàn)主機(jī)對(duì)存儲(chǔ)的多路徑讀寫;在 i/o 路徑出現(xiàn)故障時(shí),確保可以訪問(wèn)存儲(chǔ)設(shè)備,保證數(shù)據(jù)的可用性;通過(guò)i/o路徑優(yōu)化算法改進(jìn)i/o 性能。其主要功能如下:a.

36、光纖多通道的fast failover 快速切換;b. i/o 路徑優(yōu)化,提供六種算法:平衡路徑,循環(huán),最小隊(duì)列長(zhǎng)度,自適應(yīng),優(yōu)先級(jí),單個(gè)活動(dòng)路徑;c. 自動(dòng)發(fā)現(xiàn)光纖路徑;d. 動(dòng)態(tài)監(jiān)測(cè)多路徑的狀態(tài);e. 異構(gòu)環(huán)境支持, 支持所有主流的磁盤陣列。c) cluster:是集群軟件,采用 cluster控制啟動(dòng)和停止各應(yīng)用進(jìn)程。數(shù)據(jù)寫入流程如圖所示:圖6:數(shù)據(jù)寫入流程數(shù)據(jù)讀取流程如圖7所示:2.3.4 系統(tǒng)故障和災(zāi)難響應(yīng)容災(zāi)系統(tǒng)建設(shè)完成后,災(zāi)難和故障主要有以下7種情況:1. 生產(chǎn)中心存儲(chǔ)系統(tǒng)不可用2. 容災(zāi)中心存儲(chǔ)系統(tǒng)不可用3. 生產(chǎn)中心和容災(zāi)中心san鏈路故障4. 生產(chǎn)中心一臺(tái)服務(wù)器不可用5.

37、生產(chǎn)中心所有服務(wù)器不可用6. 生產(chǎn)中心和容災(zāi)中心之間心跳鏈路故障7. 生產(chǎn)中心所有服務(wù)器和存儲(chǔ)系統(tǒng)不可用2.3.4.1 生產(chǎn)中心存儲(chǔ)系統(tǒng)故障當(dāng)生產(chǎn)中心存儲(chǔ)系統(tǒng)發(fā)生故障時(shí),數(shù)據(jù)庫(kù)將得不到生產(chǎn)中心存儲(chǔ)數(shù)據(jù)寫完確認(rèn),當(dāng)?shù)却龝r(shí)間超過(guò)容災(zāi)軟件設(shè)置的故障時(shí)間閥值時(shí),容災(zāi)軟件就會(huì)自動(dòng)隔離生產(chǎn)中心的存儲(chǔ),此時(shí)容災(zāi)中心存儲(chǔ)確認(rèn)數(shù)據(jù)寫完,數(shù)據(jù)庫(kù)就向應(yīng)用服務(wù)器提交確認(rèn)。生產(chǎn)中心數(shù)據(jù)庫(kù)可以通過(guò)san網(wǎng)絡(luò)直接訪問(wèn)容災(zāi)中心存儲(chǔ)系統(tǒng)的數(shù)據(jù),因此生產(chǎn)中心存儲(chǔ)系統(tǒng)故障,對(duì)業(yè)務(wù)系統(tǒng)是透明的,應(yīng)用和數(shù)據(jù)庫(kù)都不會(huì)因?yàn)樯a(chǎn)中心存儲(chǔ)系統(tǒng)的故障而停止。生產(chǎn)中心存儲(chǔ)系統(tǒng)故障修復(fù)后,管理人員利用volume manager將增量數(shù)據(jù)從容災(zāi)中心

38、存儲(chǔ)系統(tǒng)復(fù)制到生產(chǎn)中心存儲(chǔ)系統(tǒng),數(shù)據(jù)同步后,生產(chǎn)中心存儲(chǔ)系統(tǒng)將重新提供服務(wù)。2.3.4.2 容災(zāi)中心存儲(chǔ)系統(tǒng)故障容災(zāi)中心存儲(chǔ)系統(tǒng)故障,與生產(chǎn)中心存儲(chǔ)系統(tǒng)故障類似。2.3.4.3 生產(chǎn)中心和容災(zāi)中心san鏈路故障在容災(zāi)系統(tǒng)建立后,系統(tǒng)故障中出現(xiàn)概率比較大的是san鏈路故障。兩條裸光纖san鏈路中斷任意一條,性能將會(huì)受到影響,但業(yè)務(wù)不會(huì)中斷。兩條裸光纖san鏈路都中斷,響應(yīng)步驟如下:1) 根據(jù)生產(chǎn)中心和容災(zāi)中心主機(jī)對(duì)資源的爭(zhēng)奪情況判斷存活的存儲(chǔ),沒(méi)有爭(zhēng)奪到存活權(quán)的存儲(chǔ)將被自動(dòng)隔離。2) 這里闡述生產(chǎn)中心存儲(chǔ)存活的情況,而容災(zāi)中心存儲(chǔ)存活的情況類似。此時(shí)生產(chǎn)中心存儲(chǔ)確認(rèn)數(shù)據(jù)寫完,數(shù)據(jù)庫(kù)就向應(yīng)用服務(wù)器

39、提交確認(rèn)。生產(chǎn)中心的volume manager利用 dco(data change object)日志記錄volume : plex 1變化的數(shù)據(jù)塊;3) 一旦san鏈路恢復(fù)正常,volume manager的fmr(fast mirror resync)功能模塊,會(huì)根據(jù)生產(chǎn)中心dco日志記錄的情況,將鏈路中斷后volume : plex 1 中更新的業(yè)務(wù)數(shù)據(jù)拷貝到容災(zāi)中心volume : plex 2,實(shí)現(xiàn)增量更新。兩個(gè)存儲(chǔ)數(shù)據(jù)同步后,容災(zāi)中心存儲(chǔ)將重新提供服務(wù)。volume manager 用dco和fmr技術(shù)實(shí)現(xiàn)增量同步的過(guò)程如下圖所示:圖:生產(chǎn)中心和容災(zāi)中心san鏈路故障2.3.4.

40、4 生產(chǎn)中心和容災(zāi)中心之間ip網(wǎng)絡(luò)鏈路故障當(dāng)生產(chǎn)中心和容災(zāi)中心之間的兩條裸光纖ip鏈路中斷任意一條,性能將會(huì)受到影響,但業(yè)務(wù)不會(huì)中斷。兩條裸光纖ip鏈路都中斷,應(yīng)用服務(wù)器c分配不到服務(wù)請(qǐng)求,同時(shí)由于心跳中斷,生產(chǎn)中心會(huì)認(rèn)為容災(zāi)中心的數(shù)據(jù)庫(kù)服務(wù)器c發(fā)生故障,并將該數(shù)據(jù)庫(kù)服務(wù)器c從集群中隔離出去。整個(gè)過(guò)程對(duì)應(yīng)用系統(tǒng)沒(méi)有任何影響,在生產(chǎn)中心仍然保持一個(gè)由數(shù)據(jù)庫(kù)服務(wù)器a和數(shù)據(jù)庫(kù)服務(wù)器b構(gòu)成的集群,仍同時(shí)對(duì)生產(chǎn)中心和容災(zāi)中心存儲(chǔ)進(jìn)行讀寫。當(dāng)ip網(wǎng)絡(luò)鏈路恢復(fù)后,cluster將容災(zāi)中心的數(shù)據(jù)庫(kù)服務(wù)器c節(jié)點(diǎn)動(dòng)態(tài)加入集群,應(yīng)用服務(wù)器c可分配到服務(wù)請(qǐng)求。整個(gè)過(guò)程自動(dòng)完成,對(duì)業(yè)務(wù)系統(tǒng)不會(huì)產(chǎn)生任何影響。2.3.4.5 生產(chǎn)中心一臺(tái)數(shù)據(jù)庫(kù)服務(wù)器不可用生產(chǎn)中心數(shù)據(jù)庫(kù)服務(wù)器a發(fā)生故障,所有業(yè)務(wù)全部由生產(chǎn)中心數(shù)據(jù)庫(kù)服務(wù)器b和容災(zāi)中心數(shù)據(jù)庫(kù)服務(wù)器c承擔(dān)。如圖:圖15:生產(chǎn)中心一臺(tái)服務(wù)器不可用同樣的,在數(shù)據(jù)庫(kù)服務(wù)器a的故障修復(fù)以后,其將自動(dòng)分擔(dān)業(yè)務(wù)。2.3.4.6 生產(chǎn)中心所有數(shù)據(jù)庫(kù)服務(wù)器不可用當(dāng)生產(chǎn)中心所有的數(shù)據(jù)庫(kù)服務(wù)器系統(tǒng)都發(fā)生故障,容災(zāi)中心數(shù)據(jù)庫(kù)服務(wù)器c將自動(dòng)接管所有的業(yè)務(wù)。2.3.4.7 生產(chǎn)中心所有數(shù)據(jù)庫(kù)服務(wù)器和存儲(chǔ)系統(tǒng)不可用生產(chǎn)中心所有數(shù)據(jù)庫(kù)服務(wù)器和存儲(chǔ)系統(tǒng)不可用,這種情況一般只有在重大災(zāi)難的情況下才會(huì)發(fā)生,包

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論