公司災(zāi)難恢復(fù)技術(shù)方案改進版加案例版_第1頁
公司災(zāi)難恢復(fù)技術(shù)方案改進版加案例版_第2頁
公司災(zāi)難恢復(fù)技術(shù)方案改進版加案例版_第3頁
公司災(zāi)難恢復(fù)技術(shù)方案改進版加案例版_第4頁
公司災(zāi)難恢復(fù)技術(shù)方案改進版加案例版_第5頁
已閱讀5頁,還剩81頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、某某公司災(zāi)難備份系統(tǒng)集成項I技術(shù)響應(yīng)文件目錄1 項目簡介1.1 項目概述隨著社會飛速發(fā)展,在越來越多的企業(yè)實現(xiàn)了數(shù)據(jù)、應(yīng)用大集中以后,數(shù)據(jù) 的安全、業(yè)務(wù)的連續(xù)性等就成了企業(yè)管理者必須認(rèn)真思考的問題。自然災(zāi)害、人 為失誤,這些大大小小、似乎是防不勝防的災(zāi)難事件給我們的正常生活和工作帶 來了許多負面的影響,比如經(jīng)濟損失、信譽受損,甚至可能導(dǎo)致企業(yè)倒閉。為了 避免或者盡量減輕這些事故或者災(zāi)難對業(yè)務(wù)的影響,企業(yè)必須建設(shè)完善的數(shù)據(jù)備 份及災(zāi)難恢復(fù)系統(tǒng)。災(zāi)難恢復(fù)對企業(yè)而言,已不再以單純的 IT 環(huán)境為對象,而是將快速恢復(fù)整個 業(yè)務(wù)流程及運營作為最終目的,其中的關(guān)鍵,就是恢復(fù)核心數(shù)據(jù)及關(guān)鍵業(yè)務(wù)應(yīng)用 的運行。

2、所以,企業(yè)的災(zāi)難備份策略,要圍繞 “快速恢復(fù)整個業(yè)務(wù)流程及運營 ”這個 最終目的。而災(zāi)難備份方案, 則要緊緊扣住 “恢復(fù)核心數(shù)據(jù)及關(guān)鍵業(yè)務(wù)應(yīng)用的運行 ”這個關(guān) 鍵點。首先是數(shù)據(jù)級的災(zāi)難備份與恢復(fù),緊接著是主要業(yè)務(wù)應(yīng)用的災(zāi)難備份與恢 復(fù)。災(zāi)備系統(tǒng)應(yīng)能達到:一旦主系統(tǒng)出現(xiàn)問題,能在數(shù)秒鐘內(nèi)自動而正確無誤地 切換到災(zāi)備系統(tǒng),保持整個系統(tǒng)繼續(xù)運行;待主系統(tǒng)修復(fù)之后能很方便地復(fù)原, 使整亇系統(tǒng)繼續(xù)正常運行。1.2 項目目標(biāo)與原則1.2.1 項目目標(biāo)結(jié)合某某公司 IT 基礎(chǔ)架構(gòu)的現(xiàn)狀,規(guī)劃將 IBM 4800 上的數(shù)據(jù)容災(zāi)至容災(zāi)中 心的新磁盤陣列上。具體需要實現(xiàn)以下具體目標(biāo):1)高可靠性保障系統(tǒng)數(shù)據(jù)容災(zāi)之

3、后必須保證其正確性和完整性,不能有任何數(shù)據(jù)丟失,盡可 能減少業(yè)務(wù)系統(tǒng)的停機時間。2)高性能設(shè)計新的存儲上線后將面臨大量的用戶業(yè)務(wù)請求 , 和不斷新增的業(yè)務(wù)內(nèi)容, 用戶同 樣不能忍受任何性能瓶頸,因此要求提供的存儲設(shè)備是在大吞吐量以及海量數(shù)據(jù) 環(huán)境中具有高性能設(shè)計的產(chǎn)品。3)高擴展性3-5 年的數(shù)據(jù)存系統(tǒng)數(shù)據(jù)量在未來會有不斷增長,因此要求提供的存儲設(shè)備具有容量以及處 理能力上無縫的擴展能力,存儲設(shè)備的初始容量要能夠滿足未來 儲要求。4)數(shù)據(jù)安全性磁盤、 RAID 級別的故障,業(yè)務(wù)不中斷,數(shù)據(jù)不丟失;陣列級別的故障,業(yè)務(wù) 中斷不超過 1 小時,數(shù)據(jù)不丟失;機房級別的故障,業(yè)務(wù)中斷時間可預(yù)見,數(shù)據(jù)

4、丟失為分鐘級;發(fā)生誤刪除、病毒等邏輯錯誤,數(shù)據(jù)在小時級別恢復(fù);5)高效易管理性通過靈活高效的災(zāi)難恢復(fù)技術(shù),可以將災(zāi)難恢復(fù)系統(tǒng)設(shè)備和災(zāi)難恢復(fù)流程統(tǒng)一的管理起來,降低管理的復(fù)雜度,滿足系統(tǒng)對恢復(fù)點目標(biāo)和恢復(fù)時間目標(biāo)的要 求。1.2.2 項目建設(shè)原則在系統(tǒng)的建設(shè)過程中,我們遵循的建設(shè)原則是:統(tǒng)一規(guī)劃,分步實施,目標(biāo)明確;堅持科學(xué)性、先進性、實用性、可靠性和 標(biāo)準(zhǔn)化等原則;調(diào)動各方面的積極性;制定嚴(yán)格的網(wǎng)絡(luò)安全機制、用戶使用原則 和違約處理原則;特別強調(diào)應(yīng)用與服務(wù)。1)統(tǒng)一性原則為了能夠更好地實施某某公司災(zāi)難恢復(fù)系統(tǒng),我們堅持某某公司統(tǒng)一領(lǐng)導(dǎo)的 原則;根據(jù)實際業(yè)務(wù)流程和管理范圍,對系統(tǒng)規(guī)劃、系統(tǒng)實施進

5、行統(tǒng)一的部署; 系統(tǒng)建設(shè)要統(tǒng)一組織實施,即體現(xiàn)在主要業(yè)務(wù)軟件統(tǒng)一開發(fā)、使用人員統(tǒng)一培訓(xùn) 等方面。2)持續(xù)發(fā)展原則工程設(shè)計方案應(yīng)立足當(dāng)前,著眼長遠;適應(yīng)電信設(shè)備進網(wǎng)管理系統(tǒng)業(yè)務(wù)發(fā)展 的需要,樹立全局意識;進行統(tǒng)一、長遠的規(guī)劃,逐步實施。3)科學(xué)性原則應(yīng)用系統(tǒng)的設(shè)計遵循科學(xué)性原則,包括數(shù)據(jù)結(jié)構(gòu)和標(biāo)準(zhǔn)體系要符合辦公系統(tǒng) 信息的內(nèi)在邏輯體系,同時,要充分考慮人的的認(rèn)知結(jié)構(gòu)。選用適用的標(biāo)準(zhǔn)和科學(xué)的方法是本方案遵循的科學(xué)性原則。以軟件工程理論以及當(dāng)前軟件開發(fā)技術(shù)的理論為基礎(chǔ),應(yīng)用系統(tǒng)架構(gòu)完全采 用這些已經(jīng)得到實踐證明的科學(xué)技術(shù),以科學(xué)理論為準(zhǔn)繩,來指導(dǎo)我們的系統(tǒng)設(shè) 計和開發(fā)工作。4)標(biāo)準(zhǔn)化原則系統(tǒng)建設(shè)將遵

6、守國際標(biāo)準(zhǔn)、國家標(biāo)準(zhǔn)及行業(yè)標(biāo)準(zhǔn),使系統(tǒng)具有良好的兼容性。從計算機技術(shù)和網(wǎng)絡(luò)技術(shù)以及通信技術(shù)的發(fā)展來看,標(biāo)準(zhǔn)化無疑是技術(shù)突飛 猛進的一個重要因素,只有采用標(biāo)準(zhǔn)化的技術(shù)和標(biāo)準(zhǔn)化的協(xié)議才能和國際接軌, 才能和全球信息高速公路接軌,交換數(shù)據(jù)和信息資源,才能保證系統(tǒng)的開放性。系統(tǒng)平臺的選型、系統(tǒng)的接口、數(shù)據(jù)庫標(biāo)準(zhǔn)等等必須采用相關(guān)的國際標(biāo)準(zhǔn)、 國家標(biāo)準(zhǔn)。沒有國際、國家標(biāo)準(zhǔn)的地方根據(jù)應(yīng)用的要求需要制定自己的標(biāo)準(zhǔn),以 保證將來系統(tǒng)的擴展性。系統(tǒng)平臺必須采用國際標(biāo)準(zhǔn)的數(shù)據(jù)庫來實現(xiàn)空間數(shù)據(jù)的管理,對各類應(yīng)用服 務(wù)提供標(biāo)準(zhǔn)的服務(wù)接口和規(guī)范,支持開放性技術(shù),以方便不同應(yīng)用需求。保證設(shè) 計實現(xiàn)的質(zhì)量,以及便于日常維護和

7、系統(tǒng)的擴展。系統(tǒng)應(yīng)建立完備的數(shù)據(jù)標(biāo)準(zhǔn),數(shù)據(jù)的組織應(yīng)符合相關(guān)主要國際和國家標(biāo)準(zhǔn); 對于未有明確規(guī)范的部分,則建立自己的標(biāo)準(zhǔn)并予以規(guī)范。5)先進性原則系統(tǒng)開發(fā)需采用成熟的高新科技,以目前較為先進的方法實現(xiàn)需要的功能, 既反應(yīng)當(dāng)今科技的先進水平,又具有發(fā)展?jié)摿Α?)實用性原則實用性就是能夠最大限度地滿足實際工作要求,是每個信息系統(tǒng)在建設(shè)過程 中所必須考慮的一種系統(tǒng)性能,它是自動化系統(tǒng)對用戶最基本的承諾。所以,從 實際應(yīng)用的角度來看,這個性能更加重要,為了提高辦公自動化和管理信息系統(tǒng)中系統(tǒng)的實用性,應(yīng)該考慮如下幾個方面:系統(tǒng)總體設(shè)計要充分考慮用戶當(dāng)前各業(yè)務(wù)層次、 各環(huán)節(jié)管理中數(shù)據(jù)處理的 便利性和可行性

8、,把滿足業(yè)務(wù)需求作為第一要素進行考慮; 采取總體設(shè)計、分步實施的技術(shù)方案,在總體設(shè)計的前提下,系統(tǒng)實施中 可首先進行業(yè)務(wù)處理層及管理中的低層管理, 穩(wěn)步向中高層管理及全面自 動化過渡,這樣做可以使系統(tǒng)始終與用戶的實際需求緊密連在一起,不但 增加了系統(tǒng)的實用性,而且可使系統(tǒng)建設(shè)保持很好的連貫性; 全部人機操作設(shè)計均應(yīng)充分考慮不同用戶的實際需要; 用戶接口及界面設(shè)計將充分考慮人體結(jié)構(gòu)特征及視覺特征進行優(yōu)化設(shè)計, 切合實際的了解工作人員和用戶的使用習(xí)慣,界面盡可能美觀大方,及具 有良好可操控性。7)可靠性原則系統(tǒng)設(shè)計時,首先考慮選用穩(wěn)定可靠的產(chǎn)品和技術(shù),使其具有必要的糾錯能 力,并且適合計算機網(wǎng)絡(luò)通

9、信技術(shù)的更新?lián)Q代。 各應(yīng)用系統(tǒng)的運行, 365 天不間斷, 要求系統(tǒng)能長期穩(wěn)定可靠地工作。在系統(tǒng)發(fā)生故障時,要有及時有效的備份辦法 處理,使其不影響其它應(yīng)用系統(tǒng)的運行,保證系統(tǒng)數(shù)據(jù)不丟失和迅速恢復(fù)。8)可擴展性原則計算機技術(shù)、網(wǎng)絡(luò)技術(shù)、通信技術(shù)正處于一個不斷飛速發(fā)展的時期,隨著公 司信息化建設(shè)的不斷推進,所涉及的業(yè)務(wù)的需求會不斷的飛速上升,可以預(yù)料需 求也是不斷增長變化的。在軟件結(jié)構(gòu)設(shè)計過程中,必須充分考慮未來信息的增長 趨勢,盡量選用可升級的結(jié)構(gòu),為系統(tǒng)功能的擴充和技術(shù)的平滑升級提供極大的方便。因此整個系統(tǒng)的建設(shè)要遵循可擴展性的原則:系統(tǒng)適應(yīng)靈活多變的業(yè)務(wù)邏 輯,充分發(fā)揮數(shù)據(jù)與應(yīng)用邏輯相分離

10、的思想,適應(yīng)用戶不斷變化的業(yè)務(wù)和功能上 的拓展。系統(tǒng)具有安全方便的移植能力,為用戶系統(tǒng)的升級提供保證。另外,服務(wù)端的發(fā)展是有一個過程的,相應(yīng)的負荷也是一個由小到大的過程。按最經(jīng)濟的原則,將系統(tǒng)規(guī)劃成一個擴展性很強、且在擴容升級時浪費最少的系 統(tǒng)。遵循開放性原則,能夠支持多種硬件設(shè)備和網(wǎng)絡(luò)系統(tǒng),軟件支持二次開發(fā)。應(yīng)用系統(tǒng)采用標(biāo)準(zhǔn)數(shù)據(jù)接口,具有與其他信息系統(tǒng)進行數(shù)據(jù)交換和數(shù)據(jù)共享的能 力等。應(yīng)用軟件順應(yīng)當(dāng)今軟件設(shè)計發(fā)展方向, 采用瀏覽器服務(wù)器 (B/S) 結(jié)構(gòu)和模塊 化設(shè)計,采用模塊化,標(biāo)準(zhǔn)二次可開發(fā)的組件設(shè)計思路保證所設(shè)計的內(nèi)容具有最 好的可擴展性。9) 安全性原則在線業(yè)務(wù)系統(tǒng)的特點決定了安全性

11、將是軟件系統(tǒng)設(shè)計中首要考慮的因素。系 統(tǒng)操作權(quán)限要有嚴(yán)格設(shè)定,數(shù)據(jù)庫的安全措施是保證系統(tǒng)的安全運行的基礎(chǔ)。除 了在硬件 / 網(wǎng)絡(luò)、操作系統(tǒng)、數(shù)據(jù)庫一級提供可靠的安全保密措施以外,上層應(yīng)用 系統(tǒng)的設(shè)計也必須進一步強化確保用戶數(shù)據(jù)在存儲、傳輸、查詢等過程中的絕對 安全,杜絕非法用戶未經(jīng)授權(quán)地對數(shù)據(jù)進行修改和操作數(shù)據(jù)10) 可管理原則系統(tǒng)應(yīng)具備安裝快速簡捷、配置方便容易、使用簡單方便等特點。系統(tǒng)用戶 的素質(zhì)千差萬別,系統(tǒng)建成后,一定要適用于廣大的系統(tǒng)使用人員。1.2.3 項目建設(shè)內(nèi)容項目建設(shè)內(nèi)容包括:? 在災(zāi)備中心建設(shè)一套系統(tǒng)的數(shù)據(jù)級別災(zāi)難恢復(fù)系統(tǒng), 防范本地機房站點級災(zāi)難,同時開發(fā)一套數(shù)據(jù)級災(zāi)難恢

12、復(fù)計劃,并做相應(yīng)的災(zāi)難恢復(fù)演練和災(zāi) 難恢復(fù)培訓(xùn),規(guī)范后續(xù)災(zāi)難恢復(fù)計劃的管理、維護和更新。? 購置一套高性能、高可靠性、高可擴展性磁盤陣列 EVA8400用于容災(zāi)中心。2技術(shù)方案描述2.1 技術(shù)方案設(shè)計2.1.1 用戶現(xiàn)狀分析某某公司在本地本地和異地均有服務(wù)器和交換機,本地和異地之間,通過光纖連接,在本地有一臺IBM 4800存儲,現(xiàn)在需要在異地新購一臺存儲設(shè)備,以實現(xiàn)本地和異地之間的存儲容災(zāi)。在本地災(zāi)難發(fā)生時,使數(shù)據(jù)和應(yīng)用在一定時 間內(nèi),2.1.2 技術(shù)方案設(shè)計原則根據(jù)我們對某某公司災(zāi)難恢復(fù)系統(tǒng)建設(shè)需求的了解和以往實施各大型項目的 經(jīng)驗,我們認(rèn)為,本系統(tǒng)在規(guī)劃和設(shè)計過程中,應(yīng)遵循以下一些原則:

13、開放性和標(biāo)準(zhǔn)性考慮到存儲系統(tǒng)未來引進新的業(yè)務(wù)系統(tǒng),使用的通信協(xié)議和數(shù)據(jù)格式都有可 能不同,因此,系統(tǒng)須支持多種標(biāo)準(zhǔn)的通信協(xié)議和數(shù)據(jù)格式,并完成數(shù)據(jù)格式的統(tǒng)一轉(zhuǎn)換。同時,系統(tǒng)采用的計算機網(wǎng)絡(luò)體系結(jié)構(gòu)以及通信協(xié)議要符合國家安全 標(biāo)準(zhǔn)要求。我們將依據(jù)國際標(biāo)準(zhǔn)和國家標(biāo)準(zhǔn),為用戶建立一個幵放、完善的系統(tǒng), 有效地保護用戶投資。成熟性與先進性系統(tǒng)要真正發(fā)揮出作用,首先必須能夠穩(wěn)定、正常地運行,這就需要建立在 成熟的技術(shù)基礎(chǔ)之上。而在兼顧系統(tǒng)成熟性的前提下,采用業(yè)界先進的技術(shù),才 能保證系統(tǒng)的先進性,使計算機系統(tǒng)發(fā)揮最大的效率,并隨著技術(shù)的不斷發(fā)展得 到相應(yīng)的更新??煽啃耘c可用性采用計算機系統(tǒng)的目的就是為了

14、提高工作效率,更好地實現(xiàn)本工程的各類建 設(shè)目標(biāo)。因此在系統(tǒng)的設(shè)計過程中,我們將努力采用各種先進技術(shù)來加強系統(tǒng)的 高可靠性和高可用性,以保證系統(tǒng)連續(xù)、正常地工作。可擴展性根據(jù)某某公司業(yè)務(wù)發(fā)展的要求,現(xiàn)有系統(tǒng)的設(shè)計必須具有一定的擴展能力, 留有升級的余地,以滿足業(yè)務(wù)的發(fā)展和快速、方便的聯(lián)網(wǎng)。我們將采用結(jié)構(gòu)化、 幵放的、易于擴展的體系結(jié)構(gòu),在充分利用現(xiàn)有資源、保護現(xiàn)有投資的前提下, 保證系統(tǒng)的可擴充性,適應(yīng)業(yè)務(wù)的持續(xù)發(fā)展需要。安全性和保密性建設(shè)系統(tǒng)軟、硬件的選型和建設(shè)模式的制定都必須充分考慮采用成熟、可靠 的產(chǎn)品和技術(shù)措施,保證系統(tǒng)的安全。同時在通過采用各種手段保證敏感信息的 安全。易操作性和可維護

15、性現(xiàn)代計算機系統(tǒng)越來越復(fù)雜,這就對操作管理人員提出了更高的要求。一個 技術(shù)再尖端的計算機系統(tǒng),如果用戶不能自如地進行操作管理,也不可能成為一個好的系統(tǒng),甚至?xí)?dǎo)致系統(tǒng)僅僅成為一個擺設(shè)。因此,我們的系統(tǒng)將貫徹面向 最終用戶的原則,建立友好的用戶界面,使操作簡單、直觀、靈活,易于學(xué)習(xí)掌 握,便于用戶使用和管理,以發(fā)揮系統(tǒng)的最大實際效益。2.1.3技術(shù)方案拓撲圖根據(jù)某某公司系統(tǒng)災(zāi)難恢復(fù)要求設(shè)計的架構(gòu)如下圖:2.1.4技術(shù)方案概述結(jié)合系統(tǒng)對災(zāi)難恢復(fù)數(shù)據(jù)級容災(zāi)的要求,該方案采用新購買一臺高性能的EVA8400做為對原有的IBM 4800的容災(zāi),采用DL580服務(wù)器作為災(zāi)備管理的應(yīng)用服務(wù)器,采用 Veri

16、tas的VERITAS Volume Manager軟件,做為兩臺陣列之間的容災(zāi)軟件。存儲和備份系統(tǒng)設(shè)備配置方案如下:設(shè)備編號設(shè)備名稱數(shù)量備注1磁盤陣列1臺HP EVA8400 32 個 300G 15K FC硬盤, 配管理小家電,配CV管理軟件10T容量許可證,10根15米的LC到LC接口的光纖線,原廠機 柜。3年7*24小時級別服務(wù)。2容災(zāi)軟件1套Veritas VERITAS Volume Man ager 軟件。3災(zāi)備服務(wù)器8套HP DL580R052.1.5技術(shù)方案優(yōu)勢總結(jié)?惠普災(zāi)難恢復(fù)解決方案針對IT系統(tǒng)對于企業(yè)業(yè)務(wù)起關(guān)鍵作用的客戶以及監(jiān)管審計機構(gòu)對業(yè)務(wù)連續(xù)和災(zāi)難恢復(fù)有明確要求的客

17、戶量身打造,涵蓋電信、銀行、稅務(wù)、電力、社保、保險、證券、基金、制造業(yè)等重點行業(yè)。業(yè)務(wù)連續(xù)和災(zāi)難恢復(fù)解決方案是惠普公司專為希望采用遠程災(zāi)難恢復(fù)的方式實現(xiàn)關(guān)鍵業(yè)務(wù)數(shù)據(jù)保護的企業(yè)用戶提供實施幫助而設(shè)計的,它通過惠普公司業(yè)務(wù)連續(xù)專家,項目管理專家和一系列經(jīng)過驗證的分析、設(shè)計、實施以及測試服務(wù)步驟為您提供全面和詳盡的容災(zāi)方案部署和應(yīng)用,并幫助客戶從技術(shù)、流程、人員三方面提高業(yè)務(wù)持續(xù)能力,保證企業(yè)的正常運作和發(fā)展,其服務(wù)內(nèi)容主要涵蓋高可用的信息技術(shù)基礎(chǔ)平臺建設(shè)、日常運作流程設(shè)計、突發(fā)事件管理、大型災(zāi)害的應(yīng)對計劃和策略以及業(yè)務(wù)持續(xù)性管理團隊建設(shè)與咨詢、應(yīng)急指揮中心和通訊系統(tǒng)等。? HP EVA8400 企

18、業(yè)虛擬陣列旨在為大中型企業(yè)市場中的客戶提供領(lǐng)先的高性能、高容量和高可用性“虛擬”陣列存儲解決方案。與傳統(tǒng)架構(gòu)的存儲相比,這些解決方案不但可以降低 IT 成本和復(fù)雜性,而且可以節(jié)約時 間、空間和總體擁有成本。 EVA 專為迫切需要提高存儲利用率和可擴展性 的數(shù)據(jù)中心而設(shè)計,能夠提供始終如一的高性能交易 I/O ,滿足具體應(yīng)用 的需求,可輕松進行容量擴展,同時還提供即時復(fù)制功能和簡化的存儲管 理功能。2.1.6 災(zāi)難恢復(fù)方案惠普公司為上海制造廠提供的災(zāi)難恢復(fù)方案具有以下特點和優(yōu)勢:? HP 根據(jù)二十多年業(yè)務(wù)連續(xù)和災(zāi)難恢復(fù)建設(shè)經(jīng)驗總結(jié)歸納了業(yè)務(wù)連續(xù)和災(zāi)難恢復(fù)建設(shè)方法論,可以系統(tǒng)的指導(dǎo)容災(zāi)系統(tǒng)的建設(shè)?

19、 完整詳盡的數(shù)據(jù)遠程備份和災(zāi)難恢復(fù)方案,惠普能夠提供從服務(wù)器、網(wǎng)絡(luò)、存儲、SAN監(jiān)控、遠程集群等全面解決方案。避免容災(zāi)實施只 是片面實施了存儲復(fù)制? 容災(zāi)實施內(nèi)容包括技術(shù)、流程、人員三個方面,并可以協(xié)助用戶制定災(zāi)難恢復(fù)計劃( DRP)? 大量實施案例,經(jīng)過驗證的容災(zāi)系統(tǒng)實施和支持能力,豐富的實施經(jīng)驗和人員,強大的專人支持HP全球超過5000名關(guān)鍵系統(tǒng)支持工程師和 600名通過認(rèn)證的SAN工程師。HP公司目前在中國有40名售前技術(shù)工程師,70名資深的技術(shù)咨詢工程師,和超過 300名有豐富經(jīng)驗的安裝調(diào)試人員和故障處理工程師, 并有 20多位容災(zāi)咨詢顧問和多位通過國際容災(zāi)協(xié)會認(rèn)證專家。以 XP/EV

20、A 為基礎(chǔ)的災(zāi)難恢復(fù)解決方案作為惠普公司成熟的數(shù)據(jù)保護解決方 案之一,已經(jīng)在國內(nèi)為許多用戶進行安裝運行。我們希望利用最好的資源協(xié)助某 某公司建立災(zāi)難恢復(fù) / 恢復(fù)系統(tǒng),并且在日常的維護中給予及時的響應(yīng),確保整個 系統(tǒng)實施和運轉(zhuǎn)正常。在今天的科技社會中, IT 技術(shù)的運用已經(jīng)滲透到了我們生活和工作的各個層 面,為我們帶來了以往任何一次技術(shù)革命都沒有的便利和迅捷,可以說,由于采 用了 IT 技術(shù)的新的生產(chǎn)方式已經(jīng)基本上代替了原來的生產(chǎn)方式, 成為現(xiàn)代社會運 作和發(fā)展的主流,我們對計算機系統(tǒng)的依賴超過了以往任何一種技術(shù)。然而計算機系統(tǒng)在為業(yè)務(wù)的迅猛發(fā)展提供信息技術(shù)基礎(chǔ)架構(gòu)的同時,也帶來 了以往我們不

21、曾發(fā)覺的負面因素。例如由于信息和處理的高度集中使業(yè)務(wù)運轉(zhuǎn)過 度依賴于 IT 系統(tǒng),并會因為 IT 系統(tǒng)的突發(fā)問題而受到很大影響,嚴(yán)重的甚至可 以導(dǎo)致業(yè)務(wù)系統(tǒng)無法正常進行。這些問題包括了進行系統(tǒng)檢修和升級帶來長時間 的系統(tǒng)停機,系統(tǒng)自身的或者人為的因素或事故發(fā)生連鎖性的擴大,以及不可預(yù) 見的故障和突發(fā)性災(zāi)難等等。如何避免業(yè)務(wù)運轉(zhuǎn)受到影響,或者使業(yè)務(wù)影響盡可能降到最低,這是每一個 企業(yè)管理者必須考慮和重視的問題。某某公司經(jīng)過長期的思考,如何切實有效的 保障綜合營帳等關(guān)鍵業(yè)務(wù)系統(tǒng)的連續(xù)運行已經(jīng)成為某某公司管理層十分關(guān)注的問 題。本方案涵蓋高可用的信息技術(shù)基礎(chǔ)平臺建設(shè)、日常運作流程設(shè)計、突發(fā)事件 管理

22、和大型災(zāi)害的應(yīng)對計劃和策略,業(yè)務(wù)持續(xù)性管理團隊建設(shè)和咨詢等諸多方面 的服務(wù),可以幫助客戶從技術(shù)、流程、人員三方面提高業(yè)務(wù)持續(xù)能力,保證企業(yè) 的正常運作和發(fā)展。2.1.6.1 關(guān)鍵業(yè)務(wù)系統(tǒng)中普遍存在的問題提高 IT 系統(tǒng)的高可靠性以及 IT 系統(tǒng)的容災(zāi)建設(shè)早已不再是新鮮的話題了, 隨著許多電信運營商用戶實施業(yè)務(wù)系統(tǒng)大集中, 針對 IT 系統(tǒng)的高可靠性和容災(zāi)能 力的需求日漸突出,很多電信運營商都已經(jīng)實施了有針對性的容災(zāi)系統(tǒng),并且更 多討論的是如何實現(xiàn)業(yè)務(wù)數(shù)據(jù)的有效保護和電信業(yè)務(wù)的連續(xù)性運行。然而,目前大多數(shù)容災(zāi)系統(tǒng)的建設(shè)還是存在許多問題的。這些問題中不僅有技術(shù)層面的缺陷,更多的是在流程和人員方面的

23、不足。這些問題可能導(dǎo)致的直接 后果就是當(dāng)發(fā)生災(zāi)難時,根本無法實現(xiàn)應(yīng)用系統(tǒng)的快速恢復(fù),甚至可能導(dǎo)致業(yè)務(wù) 運轉(zhuǎn)的長時間災(zāi)難性中斷。我們可以列舉出其中的一些:1 僅從產(chǎn)品功能層面考慮問題,最終建設(shè)的容災(zāi)環(huán)境僅是一個多種產(chǎn)品的堆積。僅實現(xiàn)了數(shù)據(jù)的遠程復(fù)制或者離線存放,沒有進行災(zāi)難的各種場景測試和災(zāi)難預(yù)演,并缺乏災(zāi)難恢復(fù)機制和危機應(yīng)對流程。發(fā)生災(zāi)難時,不知道到底數(shù)據(jù)或者系統(tǒng)能否恢復(fù)正常。2 進行了一定的測試和預(yù)演,但是缺少相應(yīng)的災(zāi)難恢復(fù)計劃和特殊情況下的行動指南,更沒有全面的業(yè)務(wù)連續(xù)性計劃。在真正發(fā)生災(zāi)難時,百廢待興、千頭萬緒的情況下,沒有依據(jù)和參考,可能無法順利進行有關(guān)操作。3 有了災(zāi)難恢復(fù)計劃等必要

24、文檔,但是沒有及時的將IT 系統(tǒng),業(yè)務(wù)流程和管理人員等不斷變化的信息更新,導(dǎo)致容災(zāi)手冊成為一紙空文。IT 系統(tǒng)能夠恢復(fù)但4 具備了以上的要素,但是容災(zāi)系統(tǒng)的建設(shè)局限在IT 部門,缺少業(yè)務(wù)部門的參與和管理高層的介入和全力支持。發(fā)生災(zāi)害時,是業(yè)務(wù)流程仍無法恢復(fù)運轉(zhuǎn)。除了以上列出的問題之外,還有許多問題如容災(zāi)系統(tǒng)的負載能力估計不足, 實施過程中沒有嚴(yán)格遵循高可靠標(biāo)準(zhǔn),實施過程工作界面過多溝通不足,日常運 維管理方面存在不足和漏洞,缺少廠商、系統(tǒng)集成商的后續(xù)支持服務(wù)等等都可能 導(dǎo)致業(yè)務(wù)持續(xù)性系統(tǒng)建設(shè)的失敗。除了以上的問題之外,另一類問題是項目小組僅將目光放在了大型災(zāi)難等突發(fā)事件的應(yīng)對之上,而忽略了計劃

25、性停機對業(yè)務(wù)運行的影響。根據(jù)有關(guān)統(tǒng)計,非 計劃性停機只占 13%的停機概率, 而在非計劃停機中大型自然災(zāi)難占的比例就更低 了。所以在項目實施時,未能很好的優(yōu)化現(xiàn)有系統(tǒng)和流程,沒有充分發(fā)掘現(xiàn)有潛 力,未能將日常操作流程和業(yè)務(wù)持續(xù)性目標(biāo)充分整合,雖然實現(xiàn)了容災(zāi)但是仍沒 有從本質(zhì)上解決持續(xù)性問題。HP公司提供的業(yè)務(wù)連續(xù)性解決方案是基于HP公司長期的實踐經(jīng)驗和業(yè)界公認(rèn)的業(yè)務(wù)持續(xù)方法論(BCP,結(jié)合客戶的具體實際情況,采用業(yè)界先進成熟的產(chǎn)HP公品和技術(shù),由資深顧問和技術(shù)專家構(gòu)成的實施小組遵循IT服務(wù)管理(ITSM)理念進行實施。充分考慮了以上普遍性問題,保證了項目目標(biāo)的成功實現(xiàn),同時 司可以提供整個容災(zāi)

26、項目的整體解決方案單點后續(xù)支持服務(wù),這一點完全不同于 業(yè)界其他友商僅能提供單一產(chǎn)品支持的服務(wù)模式。2.1.6.2 實施業(yè)務(wù)連續(xù)性方案的意義某某公司業(yè)務(wù)發(fā)展的速度是非常驚人的,這點可從業(yè)務(wù)連續(xù)多年快速的發(fā)展 反映出來。這樣的飛速發(fā)展使某某公司在單位時間內(nèi)的盈利水平不斷提高,因此, 業(yè)務(wù)的間斷直接意味著收入損失;另一方面,提供高可靠性、高水準(zhǔn)的客戶服務(wù) 也是某某公司保持競爭能力和市場份額的重要手段;隨著支撐某某公司業(yè)務(wù)運營 的 IT 系統(tǒng)建設(shè)的不斷發(fā)展,某某公司在享受 IT 支撐系統(tǒng)帶來的高效率、高盈利 的優(yōu)勢的同時,其業(yè)務(wù)運作也更加依賴于 IT 系統(tǒng)的穩(wěn)定運行,其結(jié)果是,一旦發(fā) 生大的災(zāi)難, I

27、T 系統(tǒng)及其所支持的關(guān)鍵業(yè)務(wù)系統(tǒng)將處于癱瘓,用戶信息、運營數(shù) 據(jù)等也隨之丟失,這樣的后果,顯然是某某公司不愿意看到的。所以某某公司對其計算機業(yè)務(wù)系統(tǒng)的連續(xù)運行,業(yè)務(wù)系統(tǒng)、業(yè)務(wù)數(shù)據(jù)的高可用性以及業(yè)務(wù)計算機 系統(tǒng)抵御災(zāi)難能力的要求也必然急劇提高。綜上所述,某某公司建設(shè)災(zāi)難備份中心有如下的意義:對于重要業(yè)務(wù)數(shù)據(jù)在災(zāi)難發(fā)生后得以保護。重要業(yè)務(wù)在災(zāi)難發(fā)生后可以在一定的時間內(nèi)恢復(fù),連續(xù)運行。HP提供的方案,即使在本地的IBM 4800發(fā)生宕機,數(shù)據(jù)仍可持續(xù)進行讀寫,完全不影響業(yè)務(wù)的進行,切換時間為零。業(yè)務(wù)計算機系統(tǒng)抵御災(zāi)難的級別提高。提升了關(guān)鍵業(yè)務(wù)系統(tǒng)的高可用性,減少計劃性停機對業(yè)務(wù)的影響。進一步提高某某

28、公司在行業(yè)中的聲譽,增強客戶及潛在客戶對企業(yè)的信心。增加對競爭對手的優(yōu)勢。EVA8400 較之 IBM 4800,性能指標(biāo)上更加先進(具體見本方案第 44頁“ EVA 8400與IBM 4800優(yōu)勢比較表”)。能使容災(zāi)系統(tǒng)地高性能運轉(zhuǎn)。2.1.6.3 惠普災(zāi)難恢復(fù)方法2.1.6.3.1 什么是容災(zāi)系統(tǒng)容災(zāi)系統(tǒng)是業(yè)務(wù)永續(xù)運行的重要的組成部分。所謂災(zāi)難,通常是指引起關(guān)鍵 業(yè)務(wù)的信息服務(wù)中斷,且中斷的時間及造成的損失超出企業(yè)所能承受的范圍之外的意外情況。引起災(zāi)難的因素很多,可以是系統(tǒng)環(huán)境中的軟件、硬件故障,有意 或過失的人為破壞,還可能是因火災(zāi)、颶風(fēng)、地震而引起的數(shù)據(jù)處理設(shè)備的損壞 等等,只要造成了

29、關(guān)鍵業(yè)務(wù)的中斷,都是災(zāi)難。而容災(zāi)就是通過預(yù)先建立的備份 中心、備份設(shè)備和備份數(shù)據(jù)等,在可以容忍的時間內(nèi)恢復(fù)業(yè)務(wù)系統(tǒng)的正常運行, 將企業(yè)因業(yè)務(wù)中斷而導(dǎo)致的損失降低到預(yù)定的程度。相對于業(yè)務(wù)永續(xù)運行來說,容災(zāi)強調(diào)的是企業(yè)的關(guān)鍵業(yè)務(wù)在災(zāi)難發(fā)生時的應(yīng) 對能力和恢復(fù)能力,即通過盡可能快速的、全面的企業(yè)業(yè)務(wù)恢復(fù)運作,將因災(zāi)難 造成的損失降低到最小程度。顯然,它并不保證業(yè)務(wù)的零間斷能力;實際上,容 災(zāi)系統(tǒng)的整個災(zāi)難恢復(fù)過程必須會造成一段時間的業(yè)務(wù)中斷。另外,也正是因為 可以容忍一段時間的業(yè)務(wù)間斷,所以其實施難度、周期和規(guī)模都要遠遠小于實現(xiàn) 業(yè)務(wù)持續(xù)性系統(tǒng)的建設(shè)。從廣義上講,任何提高系統(tǒng)可用性的努力,都可稱之為

30、容災(zāi)。本地容災(zāi),例 如主機集群:當(dāng)某臺主機出現(xiàn)故障,不能正常工作時,其他的主機可以替代該主 機,繼續(xù)進行正常工作。而我們平時講到的容災(zāi),尤其是值得重視的容災(zāi),一般IT 系統(tǒng)中,必然都是指遠程容災(zāi)。遠程容災(zāi)可以這樣理解:在各行業(yè)企業(yè)用戶的 有一部分(尤其是核心部分)是非常重要的,我們叫它生產(chǎn)中心。人們往往給生 產(chǎn)中心配備一個備份中心,該備份中心是遠程的,并且在生產(chǎn)中心的內(nèi)部,已經(jīng) 實施了各種各樣的數(shù)據(jù)保護。不論采取什么方式進行保護,當(dāng)火災(zāi)、地震這類突 發(fā)性災(zāi)難發(fā)生時,一旦生產(chǎn)中心癱瘓了,備份中心將能接管生產(chǎn)系統(tǒng),繼續(xù)提供 網(wǎng)絡(luò)服務(wù)。比如,全國鐵路調(diào)度中心網(wǎng)絡(luò)系統(tǒng),當(dāng)發(fā)生火災(zāi)、地震等災(zāi)難性事件 時

31、,該系統(tǒng)仍要保持正常進行,不能因為調(diào)度中心出現(xiàn)災(zāi)難性事件,全國的鐵路 系統(tǒng)就處于癱瘓狀態(tài),讓災(zāi)難不合理地蔓延。我們認(rèn)為,一個有效的高可靠性計算環(huán)境應(yīng)該能夠做到:數(shù)據(jù)中心任何計算機系統(tǒng)硬件,軟件及應(yīng)用的單點故障將不會影響整個數(shù)據(jù)中心的處理工作;數(shù)據(jù)中心由于災(zāi)難 (火災(zāi)、地震、斷電 ) 等原因無法工作時,應(yīng)有個備份數(shù)據(jù)中心能夠迅速接管關(guān)鍵應(yīng)用,繼續(xù)運行;主數(shù)據(jù)中心恢復(fù)后,應(yīng)用系統(tǒng)、業(yè)務(wù)數(shù)據(jù)應(yīng)能迅速切換回主中心運行。某某公司系統(tǒng) 數(shù)據(jù)容災(zāi)的遠程復(fù)制通常說來,對于遠程災(zāi)難恢復(fù)方案建議用戶建立兩個數(shù)據(jù)中心,主中心和備 份中心。正常情況下,應(yīng)用運行在主數(shù)據(jù)中心的計算機系統(tǒng)上,數(shù)據(jù)也存放在主 中心的存儲系統(tǒng)

32、中。當(dāng)主數(shù)據(jù)中心由于斷電,火災(zāi)甚至地震等災(zāi)難無法工作時, 則立即采取一系列相關(guān)措施,將網(wǎng)絡(luò)、電話線路切換至備份中心,并且利用備份 中心計算機系統(tǒng)重新啟動應(yīng)用系統(tǒng)。而這里最關(guān)鍵的問題就是切換過程時間最短,同時盡可能保持主數(shù)據(jù)中心和 備份中心數(shù)據(jù)的連續(xù)性和完整性。而由于財務(wù)數(shù)據(jù)的重要性,如何解決主、備中 心數(shù)據(jù)庫數(shù)據(jù)備份,恢復(fù)則是災(zāi)難恢復(fù)方案的重點。傳統(tǒng)的磁帶備份方式一般采取定點備份,而當(dāng)系統(tǒng)崩潰時。距最近一次備份 時間之間的數(shù)據(jù)將全部丟失。無法恢復(fù)。而且磁盤備份、恢復(fù)時間比較長由于速 度饅,缺乏實時性,無法滿足用戶大數(shù)據(jù)量數(shù)據(jù)恢復(fù)及數(shù)據(jù)庫連續(xù)性,實時性的要求。而現(xiàn)在流行的災(zāi)難恢復(fù)方案主要是采用實

33、時的數(shù)據(jù)備份的方式。它的主要原理是通過通信線路,實時地將主中心更新數(shù)據(jù)拷貝至備份中心存儲系統(tǒng)中,保證 主、備中心數(shù)據(jù)的實時一致性。當(dāng)主中心無法工作時,備份中心可以立即接管業(yè)務(wù),并且確保數(shù)據(jù)的最大完整性。根據(jù)用戶現(xiàn)狀,其主要實施方法有:a. 通過高端存儲陣列容災(zāi): 例如IBM的ERM鏡像軟件,可以實現(xiàn)主數(shù)據(jù)中心和備份中心的操作系統(tǒng)、文件系統(tǒng)、數(shù)據(jù)庫的實時拷貝維護。不占用主機CPU內(nèi)存,1/0資源,其缺點是本地的存儲設(shè)備一旦發(fā)生損壞,則容災(zāi)中心的容災(zāi)存儲設(shè)備不能實時啟動,本地災(zāi)難發(fā)生后,必須斷幵與遠程的鏈接,且由于容災(zāi)中心的數(shù)據(jù)均為裸數(shù)據(jù),所以重新啟動應(yīng)用需要一定的時間,視數(shù)據(jù)類型的不同,此切換時

34、間,在數(shù)分鐘至數(shù)十分鐘,且在此時間內(nèi),會發(fā)生數(shù)據(jù)丟失現(xiàn)象。b. 采用Veritas 的Storage Foundation軟件,同時將數(shù)據(jù)寫到本地和遠程的數(shù)據(jù)中心。采用這種方式與應(yīng)用和存儲都無關(guān),可實現(xiàn)異構(gòu)存儲且不需修改應(yīng)用, 分別使用HP EVA 8400和IBM DS4800的其一部分的存儲空間通過VERITAS Storage Foundation 進行磁盤卷的鏡像。使得IBM DS4800發(fā)生得任何失效,最后一刻的數(shù)據(jù)都在數(shù)據(jù)容災(zāi)中心的HP EVA 8400磁盤存儲上存在。并且如果服務(wù)器并未發(fā)生停機,則所有應(yīng)用皆可正常運行,沒有任何的停機及切換時間存在。容災(zāi)方式比較采用 IBM 480

35、0采用 HP EVA8400加Veritas 軟件數(shù)據(jù)丟失本地存儲宕機后,本地存儲宕機后,數(shù)數(shù)據(jù)可能產(chǎn)生丟失據(jù)不丟失。應(yīng)用啟動時間本地存儲宕機后,本地存儲宕機后,所異地啟動應(yīng)用,需有應(yīng)用均可正常運要一定時間,從數(shù)行,沒有任何的停機分鐘到數(shù)十分鐘不及切換時間存在。等。存儲IBM 4800指標(biāo)更優(yōu)秀的EVA8400根據(jù)某某公司系統(tǒng)的現(xiàn)狀,我們認(rèn)為采用采用Veritas Volume Ma nager 進行異構(gòu)系統(tǒng)的容災(zāi)方案才是符合某某公司實際需求。2.164容災(zāi)系統(tǒng)的管理2.1.6.4.1組織機構(gòu)容災(zāi)備份系統(tǒng)需要由專門機構(gòu)(指定現(xiàn)有相關(guān)部門或者設(shè)立新機構(gòu))負責(zé)日常的管理、維護、以及災(zāi)難發(fā)生后的系統(tǒng)

36、恢復(fù)等工作。該機構(gòu)的主要職責(zé)、職能 主要包括:(1)備份系統(tǒng)的日常維護工作,確保當(dāng)前備份系統(tǒng)是正常、有效的、以及數(shù)據(jù)備份的完整性、一致性;2)測試及研究工作。測試工作包括對當(dāng)前備份系統(tǒng)、備份數(shù)據(jù)有效性、可用性的測試、以及對應(yīng)用軟件的升級測試等;研究與容災(zāi)備份相關(guān)的技術(shù)方案優(yōu) 化以及相關(guān)制度、規(guī)程的完善;3)日常管理、協(xié)調(diào)職能。 負責(zé)本部門的日常管理工作, 并負責(zé)與主用中心、以及相關(guān)方面的協(xié)調(diào)工作;4)災(zāi)難發(fā)生后的系統(tǒng)恢復(fù)以及生產(chǎn)組織職能;2.1.6.4.2 管理制度和操作規(guī)程容災(zāi)備份系統(tǒng)的管理、維護、系統(tǒng)恢復(fù)、生產(chǎn)組織等需要完善的管理制度和嚴(yán)密的操作規(guī)程予以約束、規(guī)范,以確保備份系統(tǒng)的可用性和

37、生產(chǎn)恢復(fù)的有效性。在建設(shè)容災(zāi)備份系統(tǒng)的同時,應(yīng)結(jié)合自身情況建立并不斷完善相關(guān)的管理制度、操作規(guī)程,其中包括:容災(zāi)備份工作的領(lǐng)導(dǎo)與組織分工; 容災(zāi)備份中心機構(gòu)的職能、職責(zé);人員崗位責(zé)任制度; 日常維護管理制度和操作規(guī)程; 測試管理制度;(包括備份系統(tǒng)有效性測試、應(yīng)用軟件升級測試等) 災(zāi)難 /故障的監(jiān)測與分析、報告制度、以及審批流程規(guī)定;系統(tǒng)恢復(fù) / 切換的操作流程和規(guī)范;7)備份系統(tǒng)恢復(fù)運行后的生產(chǎn)組織制度; (其中應(yīng)包含數(shù)據(jù)的安全與備份)8)主用系統(tǒng)重新恢復(fù)工作的管理與組織制度。2.1.6.4.3 災(zāi)難的預(yù)防系統(tǒng)容災(zāi)應(yīng)包含災(zāi)難預(yù)防的內(nèi)容,即研究相應(yīng)對策將災(zāi)難帶來的損失降低到 最小程度,這包括:

38、1)系統(tǒng)技術(shù)設(shè)計方案的不斷優(yōu)化, 在不斷提升系統(tǒng)自身安全可靠性的同時,使系統(tǒng)和數(shù)據(jù)備份的實施、管理、操作更簡便、運行更可靠;2)容災(zāi)備份策略和技術(shù)方案的不斷完善, 不斷提高備份數(shù)據(jù)的一致性、 完整性,縮短系統(tǒng)運行中斷的時間;3)相關(guān)管理制度、操作流程和規(guī)程的不斷完善、改進; 4)努力減少系統(tǒng)的安全隱患; 5)可能也包括備份系統(tǒng)機房地點的合理選擇等。2.1.6.4.4 災(zāi)難恢復(fù)計劃的測試、試運行和維護通過測試、試運行可檢驗災(zāi)難恢復(fù)系統(tǒng)功能是否達到設(shè)計要求。測試和模擬 試運行可以檢驗災(zāi)難恢復(fù)計劃文檔資料的完整性,恢復(fù)策略的正確性,可以提高 工作人員的操作熟練程度。應(yīng)選擇適當(dāng)?shù)臑?zāi)難恢復(fù)計劃測試策略。

39、通過測試可以 提高災(zāi)難恢復(fù)計劃的質(zhì)量,改進災(zāi)難恢復(fù)過程,可以使相關(guān)部門配合有序,同時 由于應(yīng)用系統(tǒng)環(huán)境如系統(tǒng)環(huán)境、網(wǎng)絡(luò)配置、應(yīng)用系統(tǒng)恢復(fù)的優(yōu)先級不斷變化,災(zāi) 難恢復(fù)計劃也應(yīng)隨之進行修改。2.1.6.5 培訓(xùn)測試及維護經(jīng)過努力建立起的災(zāi)難恢復(fù)計劃系統(tǒng),某某公司必須通過內(nèi)部培訓(xùn)和周期性 的測試才能為各層次參予人員所了解、掌握。同時隨著某某公司 IT 數(shù)據(jù)中心業(yè)務(wù) 的不斷完善和發(fā)展,各方面的條件和情況亦會變化,因此還需要有穩(wěn)定可靠的維 護。2.1.6.5.1 培訓(xùn)? 成立專門的災(zāi)難恢復(fù)計劃小組;? 選定一些對業(yè)務(wù)或技術(shù)非常熟悉的關(guān)鍵人員作為災(zāi)難恢復(fù)小組參予人員。以保證在危機處理的正確、高效。? 制定

40、培訓(xùn)計劃:? 讓大家了解項目的背景, 以及各人在災(zāi)難發(fā)生時的相應(yīng)責(zé)任, 應(yīng)掌握的知識與技能;? 計劃培訓(xùn)進度與日程;? 協(xié)調(diào)各相關(guān)部門負責(zé)人,保證培訓(xùn)時間;? 管理培訓(xùn)質(zhì)量。2.1.6.5.2 測試災(zāi)難恢復(fù)計劃測試災(zāi)難恢復(fù)計劃,不僅可以驗證計劃的有效性、完整性,亦可以幫助大家 熟悉過程,做好準(zhǔn)備工作。歸納如下:? 驗證計劃過程與策略,發(fā)現(xiàn)疵暇之處? 可以獲得具體的恢復(fù)時間概念(如網(wǎng)絡(luò)是如何被恢復(fù)的,速度如何)? 可以測試備份主機系統(tǒng)與網(wǎng)絡(luò)系統(tǒng)的效率? 可以向領(lǐng)導(dǎo)、審計、管理、媒體等展示? 可以使整個隊伍熟練其各自的角色與責(zé)任2.1.6.5.3 測試方法測試的很重要的一個原則是不停生產(chǎn)機,采用獨

41、立或并行的方式進行。如果 是并行則可以與生產(chǎn)環(huán)境比較結(jié)果。測試的第二個原則是按模塊進行,即將龐大的系統(tǒng)分解開來,按模塊獨立測 試,而非一開始就動員全行測試。由于各模塊的相對獨立性,測試是可以分解成 一個一個模塊進行的。這樣的難度較小,也易于組織與管理。2.1.6.5.4 測試的頻率測試目標(biāo)是為了保持系統(tǒng)的現(xiàn)時性,即系統(tǒng)能跟上變化的步伐,但同時亦要 考慮費用問題等。2.1.6.5.5 可能引起變化的因素? 主要操作系統(tǒng)的升級? 重要應(yīng)用軟件和改變? 主要硬件改變? 人員變動2.1.6.5.6 測試流程的制定測試流程的制定是在測試中最為重要的一環(huán),只有測試是在可控的前提下, 測試才具備檢驗系統(tǒng)安全

42、性、鍛煉應(yīng)急隊伍的意義。因此客戶測試流程的制訂需 要在最終客戶、相關(guān)設(shè)備的供應(yīng)商和災(zāi)備系統(tǒng)實施方三方共同協(xié)商確定,已確保 原有系統(tǒng)的穩(wěn)定運行。2.1.6.5.7 維護為保證災(zāi)難恢復(fù)計劃的穩(wěn)定可靠運行,需要有明確的維護政策,保證人員及 資金的適當(dāng)投入。并定期檢查報告,管理層可以了解其狀態(tài)。2.1.6.6 惠普公司容災(zāi)實施服務(wù)內(nèi)容HP 公司為某某公司提供的遠程災(zāi)難備份解決方案由目前業(yè)界技術(shù)最為先進的HP EVA系列磁盤陣列以及相應(yīng)的光纖交換機和用來連接主數(shù)據(jù)中心和備份數(shù)據(jù)中心的光纖網(wǎng)絡(luò)設(shè)備組成。在某某公司容災(zāi)項目的實施過程中,HP公司將委派具有豐富項目實施經(jīng)驗的項目經(jīng)理,使用項目管理的方法對容災(zāi)方

43、案的實施進行高效的統(tǒng)一管理;并利用HP容災(zāi)專家豐富的容災(zāi)知識和實施經(jīng)驗,結(jié)合廣泛驗證的容災(zāi)方法和設(shè)計技術(shù)將大大 縮短實現(xiàn)容災(zāi)方案的時間 , 確保實現(xiàn)容災(zāi)方案的設(shè)計目標(biāo) , 并盡量減少和避免在容 災(zāi)方案的實施過程中對用戶業(yè)務(wù)系統(tǒng)的影響 , 從而全面降低容災(zāi)實施過程中的風(fēng) 險, 確保某某公司的容災(zāi)方案能夠得到平穩(wěn)順利的高質(zhì)量實施。2.1.6.6.1 方案實施核心服務(wù)( Core Service )項目管理服務(wù) 由惠普項目經(jīng)理對容災(zāi)項目的整體實施過程進行管理,包括項目啟動、 制定項目實施計劃、項目采購管理、項目資源管理、項目的整體進度管 理以及跟蹤項目進展并執(zhí)行變更和應(yīng)急情形管理。容災(zāi)方案規(guī)劃設(shè)計在

44、確認(rèn)容災(zāi)的恢復(fù)策略之后, 惠普和客戶將合作進行恢復(fù)技術(shù)方案的詳細設(shè)計,詳細方案包括具體的服務(wù)器配置、存儲配置、SAN配置、容災(zāi)軟件配置、網(wǎng)絡(luò)配置、數(shù)據(jù)復(fù)制對應(yīng)關(guān)系、備份策略、災(zāi)難切換方案。容災(zāi)系統(tǒng)產(chǎn)品及主機代理軟件安裝配置服務(wù)容災(zāi)系統(tǒng)的安裝服務(wù),除了基本的相關(guān)存儲設(shè)備及存儲系統(tǒng)軟件的安裝,還包括數(shù)據(jù)復(fù)制軟件的安裝和LTU激活、相關(guān)邏輯卷,文件系統(tǒng)及應(yīng)用數(shù)據(jù)庫的配置、系統(tǒng)主機代理軟件包的安裝和配置。遠程SAN互聯(lián)服務(wù)(光纖直連) 容災(zāi)系統(tǒng)遠程連接鏈路的搭建服務(wù),基本服務(wù)中只包括光纖直連的方式。服務(wù)內(nèi)容除了光纖交換機的基本安裝,還包括SAN勺綜合布線、跨區(qū)域遠程SA啲配置,Zoning的劃分和合并

45、、光纖數(shù)據(jù)復(fù)制鏈路功能測 試以及光纖網(wǎng)絡(luò)容災(zāi)參數(shù)配置服務(wù)。災(zāi)難切換腳本開發(fā) 開發(fā)容災(zāi)系統(tǒng)切換所需要的腳本, 服務(wù)內(nèi)容包括設(shè)計容災(zāi)系統(tǒng)的切換策 略,并與用戶討論確定;編寫腳本,形成指令切換或自動切換;各種腳 本的測試和驗證、優(yōu)化工作。技術(shù)切換測試 在容災(zāi)系統(tǒng)搭建完成后, 對容災(zāi)系統(tǒng)的基本切換功能進行測試。 包括建 立、檢驗及執(zhí)行異地故障切換機制、系統(tǒng)測試方案的設(shè)計,并與用戶討 論確定、容災(zāi)系統(tǒng)切換及回切測試。包括容災(zāi)災(zāi)難恢復(fù)技術(shù)切換流程開發(fā) 對容災(zāi)系統(tǒng)日常維護和災(zāi)難發(fā)生時的技術(shù)恢復(fù)流程進行設(shè)計, 系統(tǒng)維護方案設(shè)計、 業(yè)務(wù)部門恢復(fù)數(shù)據(jù)的步驟和所需資源的設(shè)計、 故障 流程觸發(fā)模式、升級模式的設(shè)計。容

46、災(zāi)系統(tǒng)現(xiàn)場培訓(xùn)服務(wù)針對用戶容災(zāi)系統(tǒng)提供的現(xiàn)場技術(shù)培訓(xùn),在項目實施過程中提供1天的現(xiàn)場培訓(xùn)(不限人數(shù)) 。培訓(xùn)形式為惠普顧問和工程師就容災(zāi)系統(tǒng)的安裝配置現(xiàn)場指導(dǎo)用戶 IT 技術(shù)人員。容災(zāi)演習(xí)服務(wù)一次容災(zāi)演習(xí)服務(wù)將幫助客戶準(zhǔn)備和執(zhí)行模擬的災(zāi)難恢復(fù)演習(xí)?;萜胀ㄟ^實施這一服務(wù)幫助客戶制定演習(xí)的恢復(fù)目標(biāo)、 描述災(zāi)難場景、 制定演習(xí)計劃,并完成一次災(zāi)難恢復(fù)演習(xí)。 服務(wù)內(nèi)容包括為測試演習(xí)而模擬的故障或災(zāi)難的設(shè)計、 制定系統(tǒng)整體演習(xí)的測試計劃、 召開演習(xí)前的溝通會議、建立測試小組, 觀察測試過程及提出建議、 按照測試計劃進行容災(zāi)演習(xí)以及演習(xí)后的總結(jié)。2.1.6.6.2 方案實施增值服務(wù)( Value-Adde

47、d Service )災(zāi)難風(fēng)險評估( RA)本服務(wù)主要是對客戶現(xiàn)有的風(fēng)險及災(zāi)難管理能力和水平進行評估,其目的是為了了解客戶災(zāi)難控制和預(yù)防的現(xiàn)狀, 從風(fēng)險管理的角度了解要提高客戶的災(zāi)難規(guī)避和控制能力還需作的努力和工作, 作為確定具體項目實施目標(biāo)的依據(jù)。服務(wù)內(nèi)容包括:了解用戶部門現(xiàn)有的風(fēng)險和災(zāi)難管理手段評估組織專題工作組制作問卷現(xiàn)場實地訪談總結(jié)內(nèi)部報告確定所有潛在的災(zāi)難威脅 評估各種災(zāi)難威脅的可能性 評估目前的災(zāi)難緩解能力 確定未被控制的災(zāi)難會對用戶部門系統(tǒng)造成的影響 分析新建立的風(fēng)險控制手段對用戶部門系統(tǒng)的價值 確定項目周期內(nèi)要實施或改進的風(fēng)險控制手段 制作報告并匯報講解業(yè)務(wù)影響分析( BIA)

48、本服務(wù)主要是指在風(fēng)險管理評估的基礎(chǔ)上, 對各種可能無法規(guī)避的災(zāi)難。服務(wù)內(nèi)對客戶業(yè)務(wù)的影響力進行具體的評估, 包括無形的影響力 (如企業(yè)形象、 客戶滿意度等)和可量化的影響(如收入損失、資產(chǎn)損失等) 容包括:首先制定針對用戶 IT 部門,并由用戶認(rèn)可的業(yè)務(wù)影響分析(BIA)的調(diào)研問卷;在調(diào)研問卷的基礎(chǔ)上, 惠普咨詢專家聯(lián)合用戶的 IT 技術(shù)人員將 與使用各業(yè)務(wù)應(yīng)用系統(tǒng)的相關(guān)各業(yè)務(wù)主管,進行一次正式的調(diào) 研訪談, 確定關(guān)鍵的量化指標(biāo) , 包括認(rèn)可的 RTO,RPO;根據(jù)訪談的結(jié)果進行分析, 得出相關(guān)分析結(jié)果并提供分析報告。容災(zāi)策略制定通過災(zāi)難風(fēng)險評估(RA和業(yè)務(wù)影響分析(BIA)確定了客戶需求,檢

49、 查現(xiàn)有的架構(gòu)和運行管理的現(xiàn)狀, 確定實現(xiàn)客戶災(zāi)難恢復(fù)需求的差距并惠普將提出相關(guān)的災(zāi)難恢復(fù)策略, 包括建議恢復(fù)策略下的系統(tǒng)架構(gòu), 關(guān) 鍵應(yīng)用系統(tǒng)的恢復(fù)策略級別 ( Hot/Warm/Cold ),關(guān)鍵應(yīng)用系統(tǒng)的恢復(fù)技 術(shù)的選擇(數(shù)據(jù)庫復(fù)制,存儲區(qū)域網(wǎng)絡(luò)復(fù)制,磁帶恢復(fù),服務(wù)器集群高 可用性技術(shù)等)等內(nèi)容。災(zāi)難恢復(fù)計劃DRP開發(fā)業(yè)務(wù)持續(xù)性計劃 / 災(zāi)難恢復(fù)計劃是一套高級管理和規(guī)章流程,使一個組 織在突發(fā)性事件面前能夠迅速做出反應(yīng),以確保關(guān)鍵業(yè)務(wù)功能可以持 續(xù),而不造成業(yè)務(wù)中斷或業(yè)務(wù)流程本質(zhì)的改變。 本服務(wù)主要是完成具體 的業(yè)務(wù)連續(xù)計劃 / 災(zāi)難恢復(fù)計劃的設(shè)計和開發(fā),任務(wù)包括定義詳細的災(zāi) 難恢復(fù)流程

50、,明確所需的環(huán)境和資源,以及相應(yīng)的容災(zāi)團隊建設(shè)。遠程容災(zāi)鏈路集成服務(wù)對復(fù)雜的容災(zāi)鏈路進行搭建工作,對非光纖直連的遠程 SAN,IP 路由方 案進行實施,包括 DWDM備安裝和鏈路調(diào)試,相關(guān)管理軟件的安裝調(diào) 試,鏈路功能測試,性能調(diào)優(yōu)服務(wù)。容災(zāi)集群實施服務(wù)( DTCS)數(shù)據(jù)高可用集群服務(wù)是惠普根據(jù)用戶需求, 協(xié)助客戶設(shè)計和實施本地集 群、校園級集群、同城集群和洲際集群。服務(wù)內(nèi)容包括:容災(zāi)集群方案設(shè)計: 首先了解客戶當(dāng)前的 IT 環(huán)境以及容災(zāi)需求 分析的結(jié)果(RTO&RFPO協(xié)助客戶選擇合適的容災(zāi)集群技術(shù), 并設(shè)計詳細的容災(zāi)集群方案;容災(zāi)集群方案將根據(jù)容災(zāi)距離和 方案選擇合適的容災(zāi)集群技術(shù)

51、,并根據(jù)各種不同故障或災(zāi)難設(shè)計切換策略;根據(jù)選擇的容災(zāi)集群方案,惠普公司將設(shè)計詳細 的技術(shù)方案; 容災(zāi)集群方案實施:容災(zāi)集群方案的具體實施,包括軟件硬件 安裝配置、集群軟件安裝配置、技術(shù)切換步驟和流程等; 容災(zāi)集群方案測試和知識移交:在容災(zāi)集群方案實施完成后, 將進行技術(shù)切換測試;在容災(zāi)集群技術(shù)切換測試完成后,惠普 顧問將向客戶提供容災(zāi)集群的配置和操作文檔。2.1.6.7 客戶收益提高災(zāi)難應(yīng)對能力 減少災(zāi)難導(dǎo)致財務(wù)損失 減少災(zāi)難對業(yè)務(wù)影響 保護客戶忠誠度和公司形象 獲得審計的認(rèn)可 有能力提供和滿足服務(wù)級別要求 提高競爭力2.168 HP容災(zāi)解決方案優(yōu)勢名門正派 ”: HP 公司能夠提供業(yè)界最完

52、善的產(chǎn)品系列,從而滿足不同企業(yè)級客戶的獨特業(yè)務(wù)需求;并具有業(yè)內(nèi)最先進的業(yè)務(wù)連續(xù)知識方法體系,有 通過 DRII 認(rèn)證的業(yè)務(wù)連續(xù)專家多名。 通過將國際標(biāo)準(zhǔn)的方法論和 HP長期的業(yè)務(wù)連續(xù)系統(tǒng)建設(shè)經(jīng)驗相結(jié)合, HP 提供的業(yè)務(wù)連續(xù)解決方案是從客戶實際出發(fā),符合客戶業(yè)務(wù)需要的,切實可行的業(yè)務(wù)連續(xù)方案。海納百川” HP公司具備業(yè)界最全面的企業(yè)級產(chǎn)品體系,同時HP還可以采用其它經(jīng)驗證是業(yè)界領(lǐng)先的第三方產(chǎn)品來共同為客戶設(shè)計和建設(shè)容災(zāi)系統(tǒng)。這樣在采用先進技術(shù)手段的同時,充分保護了客戶的投資、高了客戶設(shè)備的使用效率。HPHP業(yè)有始有終” HP公司的業(yè)務(wù)連續(xù)方案不僅僅為客戶提供數(shù)據(jù)級容災(zāi),通過的主機和集群技術(shù)還可

53、以幫助客戶建設(shè)應(yīng)用級容災(zāi)系統(tǒng)。通過 務(wù)連續(xù)專家的咨詢服務(wù), 客戶可以在此基礎(chǔ)上進一步實現(xiàn)業(yè)務(wù)級的容 災(zāi)系統(tǒng),達到業(yè)務(wù)全天候連續(xù)運行的目的。“身經(jīng)百戰(zhàn)” :HP公司在國內(nèi)具有大量的成功案例和豐富的專家經(jīng)驗,可以幫助客戶實現(xiàn)多種手段的業(yè)務(wù)連續(xù) /容災(zāi)系統(tǒng)的建設(shè),在制造,金融,電信,政府等多個行業(yè)均有杰出表現(xiàn)。2.169產(chǎn)品配置1. EVA8400我們建議用戶新購 EVA8400-臺。配置如下:數(shù)量序列號描述中文注釋1AF002AHP Un iversal Rack 10642 G2 Shock RackHP機柜1AF002A001Factory Exp ress Base Rack ing1AG8

54、15BHP DL380 G5 Base Storage ServerHP DL380 G5 管理服務(wù)器1AG815B0D1Factory in tegrated1A8003AHP FC2242SR P CI-e DC HBA光纖卡1AJ758AHP EVA8400 14GB Dual Con troller Array14GB緩存的雙控1AJ758A0D1Factory in tegrated1AG638BHP M6412-A Fibre Cha nnel DriveEn closure硬盤籠1AG638B0D1Factory in tegrated10AG690AHP 300GB 15K F

55、C EVA M6412 Enc HDD300G,一萬五千轉(zhuǎn)的光纖硬盤10AG690A0D1Factory in tegrated2AG638BHP M6412-A Fibre Cha nnel DriveEn closure硬盤籠2AG638B0D1Factory in tegrated22AG690AHP 300GB 15K FC EVA M6412 Enc HDD300G,一萬五千轉(zhuǎn)的光纖硬盤22AG690A0D1Factory in tegrated2252663-B31HP 32A High Voltage Modular PDU電源模塊2252663-B310D2Factory horiz on tal mount of PDU1AF074AHP Rack Grou nding Kit機柜套件1AF074A0D1Factory in tegrated1AF062AHP 10K G2 600W Stabilizer Kit電源穩(wěn)定模塊1AF062AB01In clude with compl ete system1AF054AHP 10642 G2 Side panel Kit機柜套件1AF054A0D1F

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論