政務信息中心機房整體搬遷方案_第1頁
政務信息中心機房整體搬遷方案_第2頁
政務信息中心機房整體搬遷方案_第3頁
政務信息中心機房整體搬遷方案_第4頁
政務信息中心機房整體搬遷方案_第5頁
已閱讀5頁,還剩136頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

***政務信息中心機房整體搬遷方案V3.0第5頁共142頁***政務信息中心機房整體搬遷方案(投標得高分版本)目錄TOC\o"1-4"\h\z\u1 總體項目理解 71.1 對技術(shù)規(guī)范書的整體理解 71.2 搬遷設(shè)備清單 71.3 項目成功關(guān)鍵因素及風險建議 91.4 XXX的戰(zhàn)略優(yōu)勢及服務承諾 111.5 XXX理解的本次項目實施工程界面 122 總體方案建議 132.1 搬遷方案設(shè)計的原則 132.2 系統(tǒng)搬遷方法論 142.2.1 風險分析 152.2.2 業(yè)務影響分析 182.2.3 制定搬遷整體規(guī)劃 222.2.4 系統(tǒng)梳理與健康檢查 24 系統(tǒng)的標記 24 系統(tǒng)健康檢查 24 系統(tǒng)備份時間檢查 25 新機房環(huán)境檢查 252.2.5 制定系統(tǒng)搬遷與應急方案 26 制定系統(tǒng)搬遷方案 26 搬遷過程中的工具(表格、文檔等) 29 分工界面定義 322.2.6 搬遷與應急方案演練 322.2.7 搬遷前準備 332.2.8 拆卸、包裝、運輸與安裝 332.2.9 系統(tǒng)恢復與健康檢查 34 系統(tǒng)運行情況跟蹤 352.2.10 設(shè)備維護與保修服務 352.3 數(shù)據(jù)中心搬遷的工程設(shè)計與實施方法 352.3.1 項目管理 362.3.2 總體方案規(guī)劃 362.3.3 總體方案設(shè)計 372.3.4 詳細方案設(shè)計 382.3.5 方案實施階段 392.3.6 項目維護階段 392.3.7 項目驗收 402.4 整體搬遷方案設(shè)計 402.4.1 搬遷次序設(shè)計 40 斷電搬遷描述 41 在線系統(tǒng),斷電搬遷搬運描述 432.4.2 搬遷環(huán)境的準備 442.4.3 備份 44 數(shù)據(jù)庫備份 45 搬遷過程中的系統(tǒng)、數(shù)據(jù)以及應用環(huán)境程序備份與恢復 562.4.4 網(wǎng)絡(luò)出口數(shù)據(jù)割接 57 分業(yè)務系統(tǒng)的網(wǎng)絡(luò)數(shù)據(jù)割接 58 整體網(wǎng)絡(luò)數(shù)據(jù)割接 58 網(wǎng)絡(luò)出口割接建議 593 對新機房的規(guī)劃要求 593.1 機房裝修要求 593.2 機房標準規(guī)格 613.2.1 環(huán)境部分 613.2.2 電力部分 623.2.3 空調(diào)、消防、照明部分 633.2.4 交流電源調(diào)整裝置規(guī)格 643.2.5 不停電系統(tǒng)UPS規(guī)格 654 搬遷后的驗收流程、測試內(nèi)容、測試方案 664.1 檢查、測試方案 664.2 檢查及測試方案的設(shè)計 674.2.1 集成測試及業(yè)務關(guān)聯(lián)性測試 674.2.2 性能測試 674.3 系統(tǒng)搬遷的測試和驗收 684.3.1 驗收測試標準 684.3.2 驗收測試流程 694.3.3 驗收測試方法 70 設(shè)備開啟與自檢 70 設(shè)備測試、簽署交付 70 開啟數(shù)據(jù)庫應用等測試 715 項目組織和人員安排 715.1 項目管理原則 715.2 項目管理辦法 725.3 項目組織結(jié)構(gòu)圖 745.4 項目經(jīng)理 775.5 聯(lián)合項目組 775.6 聯(lián)絡(luò)會議及安排 795.7 各團隊搬遷指南與操作手冊 806 項目實施計劃和進度安排 806.1 項目WBS和任務間關(guān)系說明 806.2 詳細項目實施工程計劃 846.2.1 工程執(zhí)行過程 846.2.2 項目啟動 856.2.3 業(yè)務調(diào)研 856.2.4 方案編寫 856.2.5 方案評審 866.2.6 實施準備 866.2.7 工程實施 876.2.8 測試&維護 876.2.9 驗收&交付 877 專業(yè)的搬遷服務保障計劃 897.1 搬遷服務的質(zhì)量目標 897.2 搬遷服務的后臺支持 907.3 完善的備件庫及備品備件 917.3.1 備件庫介紹 917.3.2 全國快速備件庫基本情況 927.4 搬遷服務工程師資源 937.4.1 XXX專業(yè)搬遷服務工程師資源 937.5 搬遷設(shè)備的維保服務界定 947.6 搬遷服務故障級別的響應方式及時間 957.6.1 搬遷服務的故障等級分類 957.6.2 故障分級的上報時限 957.6.3 搬遷服務的響應時間 967.7 搬遷的800免費報障電話 977.8 搬遷的7x24小時現(xiàn)場服務 977.9 搬遷項目的重要事件現(xiàn)場支持 978 搬遷服務保障的流程 978.1 搬遷的風險分類及風險防范措施 978.2 搬遷的服務保障流程圖 998.2.1 總體服務流程圖 998.2.2 項目質(zhì)量控制流程圖 1008.2.3 搬遷方案變更流程控制圖 1018.2.4 現(xiàn)場支持流程圖 1028.2.5 備件更換流程圖 1038.2.6 搬遷故障受理服務流程圖 1048.2.7 故障件返修流程圖 1058.2.8 緊急故障搶修流程圖 1068.2.9 健康檢查服務流程圖 107政務信息中心機房整體搬遷方案V3.0V3.0PAGE142總體項目理解對技術(shù)規(guī)范書的整體理解XXX數(shù)據(jù)中心機房是XXX的核心設(shè)備所在,對各項業(yè)務起著重要的支撐作用。原有機房的所有設(shè)備,如小型機設(shè)備、存儲設(shè)備、PC服務器設(shè)備等都需要遷入新機房,搬遷服務涉及上述所有設(shè)備的搬運、安裝和調(diào)試工作,確保機房整體搬遷后所有信息系統(tǒng)及網(wǎng)絡(luò)的安全正常運行。數(shù)據(jù)中心搬遷工作的原則是:統(tǒng)一規(guī)劃,建立高可用,高效率的IT支撐平臺;平穩(wěn)過渡,最大限度降低業(yè)務影響。整個搬遷工作以“保障工作時間應用不中斷”為目標,按照預先制定的實施計劃,分批、安全、精準地進行搬遷。具體目標是要保證搬遷后的設(shè)備能夠達到搬遷前的功能、性能和應用要求,主要包括:確保搬遷設(shè)備到達指定位置后的物理完整性;確保搬遷設(shè)備到達指定位置后的功能完整性;確保搬遷設(shè)備到達指定位置后的應用完整性;確保搬遷設(shè)備到達指定位置后的性能達到搬遷前的水平。XXX的機房搬遷服務作為一項業(yè)界特色專業(yè)服務已經(jīng)為眾多的客戶數(shù)據(jù)中心提供了設(shè)備的搬遷咨詢和實施服務。積累了非常豐富的機房搬遷經(jīng)驗,擁有一次專業(yè)的搬遷服務團隊。客戶的機房搬遷,表面上是設(shè)備的搬遷,實際上是客戶業(yè)務的搬遷,所以搬遷的成功與否直接關(guān)系到客戶業(yè)務的可持續(xù)性運營。加之搬遷過程細節(jié)眾多,客戶單方面很難把控所有環(huán)節(jié),搬遷實施有風險,項目成本無法估量。XXX能夠向XXX提供搬遷方面的專業(yè)咨詢,并保證搬遷實施的安全性和可靠性,達到XXX業(yè)務系統(tǒng)的可持續(xù)性要求,實現(xiàn)三個完整性一個性能水平。搬遷設(shè)備清單管理信息系統(tǒng)部序號設(shè)備廠家設(shè)備型號數(shù)量設(shè)備配置詳情運行的應用系統(tǒng)名稱主機(CPU個數(shù),主頻,內(nèi)存容量)存儲(硬盤容量)維保小型機(共計8臺)1XXXXXXP65014CPU,16GB內(nèi)存MSS系統(tǒng)公文應用原廠維保2XXXXXXP65014CPU,16GB內(nèi)存MSS系統(tǒng)郵件原廠維保3XXXXXXP550Q14CPU,16GB內(nèi)存門戶原廠維保4XXXXXXP550Q14CPU,16GB內(nèi)存門戶原廠維保5XXXXXXP550Q14CPU,16GB內(nèi)存原網(wǎng)通OA原廠維保6XXXXXXP550Q14CPU,16GB內(nèi)存原網(wǎng)通OA原廠維保7HPRP247012*750MHzpa-8700CPU,4GBmem項目管理系統(tǒng)第三方維保8HPRP247012*750MHzpa-8700CPU,4GBmem項目管理系統(tǒng)第三方維保存儲(共計2臺)1HPSystem2300110*73HD,2*36GBHD項目管理系統(tǒng)第三方維保2XXXXXXFastT7001一個控制柜,2個硬盤柜。MSS盤陣原廠維保PC-SERVER(共計22臺)1HPHPDL36042C/4G第三方維保2HPHPDL38042C/4G郵件轉(zhuǎn)發(fā)服務器、DNS、短信服務器、郵件防病毒服務器、demo服務器第三方維保3HPHPDL580G444C/8GTIM/TAM在保4HPHPDL580G548C/32GOA歸檔服務器/合同服務器在保5XXXXXXX385024C/16GMSS協(xié)同辦公負載均衡在保6DELLPE265011C/1GMSS協(xié)同辦公負載均衡第三方維保8三星工控機11C/1GMSSVPNRADIUS服務器(備用)第三方維保9XXXServerxSeries22522C/1G物資管理系統(tǒng)第三方維??傆?2項目成功關(guān)鍵因素及風險建議本項目涉及的系統(tǒng)及需要各方配合的工作很多,因此如果要保證項目的成功實施,XXX認為以下幾點是不可或缺的關(guān)鍵因素:項目實施前期詳細周密的方案設(shè)計:包括各被搬遷系統(tǒng)的業(yè)務連續(xù)性分析設(shè)計,具體的搬遷方案、應急方案和回退方案的分析設(shè)計,還有搬遷過程中的業(yè)務保障方案設(shè)計。這些方案都必須切實可行而且需要證明是能夠落地實施的。項目實施過程當中的周密的計劃安排:由于本次工程所涉及到的施工方很多,而且和新機房建設(shè)項目基本同期進行,因此考慮的實施計劃一定要有充分的余量,留有充分的應變空間,而且要確保各方的溝通結(jié)果一致;具有實際項目運作經(jīng)驗的項目團隊及實施資源;項目實施過程當中無縫的溝通及對項目實施風險及質(zhì)量的有效把關(guān),這都需要完整的項目管理體系去支撐;在XXX領(lǐng)導下的各協(xié)作單位的充分支持;搬遷實施單位對大部分的搬遷設(shè)備均具有良好的保障及應急支持能力;根據(jù)XXX以往的大量實施經(jīng)驗,以下是在項目實施過程當中可能會碰到的一些風險,在項目實施過程中,XXX會不斷地根據(jù)風險管理計劃對風險進行管理,以確保項目的順利實施,同時和各方保持無縫的溝通,確保各方都能遵循統(tǒng)一的項目目標及進度。1)設(shè)備搬運前可能面臨的風險業(yè)務故障:由于某些配置為臨時配置(如主機路由信息等),可能導致正常關(guān)機后業(yè)務訪問出現(xiàn)問題;數(shù)據(jù)故障:在搬遷前,考慮到要進行存儲統(tǒng)一,可能要對系統(tǒng)數(shù)據(jù)進行一定的復制等操作,導致數(shù)據(jù)安全問題;2)設(shè)備搬運過程中可能面臨的風險硬件故障:搬遷過程主要是對物理硬件的搬運,所以硬件故障是最有可能發(fā)生的風險;數(shù)據(jù)故障:在搬運途中,可能由于硬件的損壞,導致數(shù)據(jù)的丟失風險;操作系統(tǒng)故障:在搬運途中,可能由于硬件的損壞,導致主機操作系統(tǒng)不能啟動的風險;業(yè)務故障:在搬運途中,可能由于硬件的損壞,導致業(yè)務系統(tǒng)不能啟動的風險;網(wǎng)絡(luò)故障:在搬運途中,可能由于硬件的損壞,導致網(wǎng)絡(luò)不可用或網(wǎng)絡(luò)配置錯誤的風險;3)設(shè)備搬運后可能面臨的風險業(yè)務故障:搬遷后,可能由于搬遷前的一些臨時配置丟失,導致業(yè)務不能正常運行的風險;數(shù)據(jù)故障:搬遷后,由于替換系統(tǒng)和正式系統(tǒng)之間的數(shù)據(jù)傳遞和復制,可能導致業(yè)務數(shù)據(jù)不準確的風險;根據(jù)上述的各階段可能面臨的風險,主要對搬遷過程中可能出現(xiàn)的風險進行了歸類,并結(jié)合各個風險的特點,給出相關(guān)的應對或應急措施:1)硬件故障1、設(shè)備搬遷前,進行系統(tǒng)重新啟動,保證搬遷前無硬件故障;2、搬遷前,所有設(shè)備都要保證有維保服務,保證硬件能及時按照維保流程得到更換和處理;3、現(xiàn)場準備易損的備品備件,或在規(guī)定的時間內(nèi)可以取得的備品備件,保證現(xiàn)場應急;建議向各廠商購買單獨的備品備件支持服務,也可以考慮預留一部分資金,由集成商負責搬遷過程中的核心設(shè)備的備品備件準備;4、要求設(shè)備廠商提供現(xiàn)場技術(shù)支持,保證盡快判斷故障點,并根據(jù)現(xiàn)有的備品備件或應急設(shè)備進行故障處理;2)系統(tǒng)級別故障1、一般都是由于硬件故障導致,利用搬遷前的系統(tǒng)備份和相關(guān)配置信息,盡快恢復系統(tǒng);2、具備RAID1功能的主機,在搬遷前進行系統(tǒng)盤鏡像,保證一塊系統(tǒng)盤損壞不會影響系統(tǒng)啟動;3)數(shù)據(jù)級別故障1、采用備份數(shù)據(jù),盡快恢復;2、利用臨時數(shù)據(jù)庫內(nèi)的數(shù)據(jù)進行磁盤級的數(shù)據(jù)復制,可比備份恢復的速度快;3、繼續(xù)啟用臨時數(shù)據(jù)庫或備用數(shù)據(jù)庫進行服務,制定數(shù)據(jù)恢復計劃并實施完成后,再進行服務接管;4)業(yè)務級別故障搬遷期間,由應用廠商提前準備好業(yè)務應急恢復盤,按照搬遷前的業(yè)務配置備份信息,盡快恢復業(yè)務系統(tǒng);5)網(wǎng)絡(luò)接入故障1、核心網(wǎng)絡(luò)設(shè)備為熱備模式,較有保障;2、采用臨時網(wǎng)絡(luò)設(shè)備進行頂替,替換故障網(wǎng)絡(luò)設(shè)備;(硬件壞)3、在臨時業(yè)務系統(tǒng)接管前以及正式業(yè)務系統(tǒng)接管前,均要進行詳細的連通性測試,保障割接順利;6)搬運過程中的整體保險為了規(guī)避設(shè)備搬運過程中的碰撞和摔損,建議由聯(lián)通公司或設(shè)備物理搬運方為搬遷的設(shè)備購買保險,進一步規(guī)避設(shè)備損壞風險;基于新業(yè)務系統(tǒng)的大型設(shè)備較少,也可考慮進行固定數(shù)額的設(shè)備保險保障,減少資金花費。XXX的戰(zhàn)略優(yōu)勢及服務承諾XXX作為聯(lián)通多年的戰(zhàn)略合作伙伴,對于項目執(zhí)行,主要有以下的戰(zhàn)略優(yōu)勢:XXX具有強大的軟硬件支持能力,能夠確保在項目實施過程當中及時快速的相應;XXX已經(jīng)確定負責在線系統(tǒng)搬遷的實施工作,因此在離線系統(tǒng)的搬遷實施工作中,可以做到統(tǒng)一計劃協(xié)調(diào),能夠保證在線及離線無縫搬遷集成,同時兩類系統(tǒng)的資源可以共享,確保在系統(tǒng)搬遷的過程中資源的及時到位;這次搬遷所涉及到的設(shè)備中,XXX能夠比其他友商提供更及時更直接的支持服務,所以在搬遷過程中能夠7*24小時4小時響應的服務。具體內(nèi)容見搬遷保障。為了保證不影響應用,我們會提供充足的備機備件資源;XXX的實施團隊具有多次落地實施搬遷的成功經(jīng)驗,而且在其他省市也為聯(lián)通提供過類似服務;XXX具有強大的項目實施團隊,能夠為聯(lián)通提供完全滿足資質(zhì)要求的實施人員;XXX理解的本次項目實施工程界面1、準備工作階段制定各業(yè)務系統(tǒng)搬遷技術(shù)方案和應急響應預案;(由中標人負責)確認搬運路線與整個設(shè)備搬遷時間;(由中標人負責)列置需搬運的設(shè)備詳細清單;(由中標人負責)提供設(shè)備搬遷方案,提供詳細的設(shè)備搬遷方案,時間點精確到小時/人員;(由中標人負責)確認搬遷前的保險、設(shè)備、人員、場地等準備工作;(由中標人負責)確認搬遷的設(shè)備運輸路徑,確認提前通知各個相關(guān)部門,做好宣傳工作;(由中標人負責,XXX配合)數(shù)據(jù)庫的離線全備份;(由中標人負責)數(shù)據(jù)庫恢復性測試,保證數(shù)據(jù)安全;(由中標人負責)根據(jù)各機器類型和尺寸制作防靜電袋、包裝箱和叉車等,計算需要的其他包裝材料等的數(shù)量;(由中標人負責,XXX配合提供現(xiàn)存的包裝箱、袋)對新老機房空間過道等進一步檢查測量,安排叉車的具體行車線路;(由中標人負責)對新老機房的關(guān)鍵路徑進行檢查,對臺階等處計劃好需要鋪設(shè)的導引段。(由中標人負責)2、實施階段(1)實施前提確認新機房運行環(huán)境就緒(機柜、電源、空調(diào)、環(huán)境衛(wèi)生等);(由XXX負責)確認新機房網(wǎng)絡(luò)環(huán)境就緒(交換機設(shè)置、網(wǎng)段劃分等);(由XXX負責)確認機房內(nèi)相關(guān)設(shè)備間線路已鋪設(shè)完畢;(由XXX負責)確認設(shè)備在新機房安裝位置;(由中標人負責,XXX配合)新數(shù)據(jù)中心KVM設(shè)備安裝完畢;(由XXX負責)確認對數(shù)據(jù)庫做好備份和測試;(由中標人負責)確認設(shè)備網(wǎng)絡(luò)連接情況及端口的登記;(由中標人負責)確認對搬遷設(shè)備已貼好標簽;(由中標人負責)確認已準備好部分重要設(shè)備的備機。(由中標人負責)(2)實施步驟遷出設(shè)備的健康檢查包含工作內(nèi)容:計劃搬出設(shè)備的健康檢查;確認計劃搬出設(shè)備網(wǎng)絡(luò)連接情況及端口的登記;確認計劃搬出設(shè)備貼標簽;確認計劃搬出設(shè)備系統(tǒng);(由中標人負責)設(shè)備搬移時選擇恰當時間停機;(由中標人負責,XXX配合)設(shè)備拆卸與包裝包含工作內(nèi)容:對搬出設(shè)備下電并拆卸;設(shè)備除塵后包裹,拆卸下的板卡、磁盤要用防靜電袋包裝;打包/裝箱;外包裝貼上標簽,指明設(shè)備信息、組別、目的位置等;(由中標人負責,XXX配合)設(shè)備運輸包含工作內(nèi)容:按照既定的運輸計劃進行運輸;運輸至目的地后,按照計劃將設(shè)備擺放到指定位置;對設(shè)備進行拆包,按要求參照貨物清單的編號進行核實清點,保證搬運過程中不遺漏;(由中標人負責,XXX配合)設(shè)備安裝包含工作內(nèi)容:對設(shè)備進行現(xiàn)場勘驗,并進行潔凈處理,去除雜質(zhì)和油跡;對設(shè)備的完好性進行檢測,根據(jù)設(shè)備目標位置圖確認安裝條件,解決存在的問題,對搬入設(shè)備進行安裝,檢查電源準備情況,連接設(shè)備電源;(由中標人完成、XXX配合)機器內(nèi)部設(shè)備連接連接工作分組進行,主要工作包括:服務器與相關(guān)外設(shè)的連接;局域網(wǎng)部分的跳線連接;與其他相關(guān)設(shè)備的連線連接;(由中標人負責,XXX配合)設(shè)備加電主要工作包括:確認設(shè)備安裝連接無誤后逐個上電;對上電不正常的設(shè)備進行問題處理;(由中標人負責,XXX配合)設(shè)備/系統(tǒng)測試對設(shè)備、系統(tǒng)進行試運行,如果有故障,當場解決故障或更換備機;(由中標人負責,XXX配合)檢查數(shù)據(jù)的完整性;(由中標人負責)恢復生產(chǎn)正常運行,通知各部門正常工作。(由XXX負責)總體方案建議搬遷方案設(shè)計的原則在數(shù)據(jù)中心搬遷項目中,我們將按照以下原則設(shè)計搬遷方案并完成搬遷工作。1、保證業(yè)務連續(xù)性,合理規(guī)劃停機時間;鑒于搬遷項目的關(guān)鍵性,為了在整個項目期間保證各種應用服務的連續(xù)可用性指標,我們在方案設(shè)計中最大限度地采用多種高可靠性與可用性保證措施。對于用戶方,保證最少的停機時間從而減少業(yè)務停頓的影響具有深遠的意義。為此,我們在方案設(shè)計中,為每項和業(yè)務停頓有關(guān)的任務制定時間指標,并采取優(yōu)化措施來盡量縮短每個任務占用的時間。2、周密部署、科學論證、步驟可行;在本項目的整個周期內(nèi)中,我們采用機房搬遷可借鑒的國際最佳實踐,即業(yè)務連續(xù)性計劃(業(yè)務安全),從搬遷的規(guī)劃、設(shè)計、實施到維護都在科學的指導下進行,而不是依賴少數(shù)專家的個人經(jīng)驗。這些業(yè)務安全方法論和具體的搬遷方法都經(jīng)過了實踐的考驗,經(jīng)歷了從實踐到理論,再由理論指導實踐的過程,完全能夠稱得上周密部署、科學論證、步驟可行。3、分步實施、分工明確、協(xié)調(diào)運作;按照業(yè)務安全最佳實踐,我們將機房搬遷項目自上而下地劃分為樹狀結(jié)構(gòu)的任務,并明確定義了每個任務執(zhí)行的優(yōu)先級順序和任務之間串行或并行執(zhí)行的順序,可謂在科學的指導下進行任務細化和分步實施。按照業(yè)務安全最佳實踐,結(jié)合甲方在招標書中的分工界面要求,我們開發(fā)了機房搬遷項目的組織架構(gòu),并定義了角色職責。我們提供的組織架構(gòu)定義方法是科學的、經(jīng)過實踐檢驗了的方法,而不是依賴項目經(jīng)理的個人經(jīng)驗。按照業(yè)務安全最佳實踐,對機房搬遷的任務,我們使用面向?qū)ο蟮募夹g(shù)從宏觀到微觀地定義每個任務。從項目各階段的框架性任務,到每個搬遷團隊成員執(zhí)行的每個操作步驟,都是在可控的條件下進行的,能夠做到有條不紊。4、確保應用和數(shù)據(jù)的可靠性、安全性和一致性我們在方案設(shè)計中最大限度地采用多種高可靠性與可用性保證措施,保證關(guān)鍵應用及其構(gòu)成組件的可靠性、安全性。我們采用專門的數(shù)據(jù)備份策略保證數(shù)據(jù)的完整性和一致性。系統(tǒng)搬遷方法論根據(jù)XXX實施多個系統(tǒng)搬遷項目的成功經(jīng)驗,結(jié)合BCM的方法論的指導,我們將系統(tǒng)搬遷工作分為四個階段。如下圖。系統(tǒng)分析階段風險分析業(yè)務影響分析制定搬遷整體規(guī)劃搬遷方案設(shè)計階段系統(tǒng)梳理與健康檢查制定系統(tǒng)搬遷與應急方案搬遷與應急方案演練搬遷實施階段搬遷前準備拆卸、包裝、運輸、安裝系統(tǒng)恢復與健康檢查后續(xù)服務系統(tǒng)運行情況跟蹤設(shè)備維護與保修服務系統(tǒng)分析階段:系統(tǒng)分析階段主要包括風險分析和業(yè)務影響分析,以及制定搬遷整體規(guī)劃三個步驟,其主要目的是識別系統(tǒng)搬遷過程中的主要風險,提出規(guī)避與轉(zhuǎn)移風險的方法。找出系統(tǒng)搬遷對主要業(yè)務的影響以及業(yè)務系統(tǒng)間的依賴關(guān)系,規(guī)劃系統(tǒng)搬遷的優(yōu)先順序,確定達到系統(tǒng)持續(xù)目標所需要的資源。搬遷方案設(shè)計階段:搬遷方案設(shè)計階段主要包括系統(tǒng)梳理與健康檢查、制定系統(tǒng)搬遷方案和應急方案,以及搬遷方案和應急方案的演練三的步驟。其主要目的是嚴格確定各系統(tǒng)的范圍,明確系統(tǒng)當前的健康狀態(tài),明確系統(tǒng)搬遷的主要步驟,明確協(xié)作各方的工作與責任,制定各種意外情況下的應急預案,確保搬遷方案的可執(zhí)行。搬遷實施階段:搬遷實施階段的主要目的是完成系統(tǒng)搬遷前的一切準備,完成從關(guān)閉應用到應用重新啟動的完整搬遷過程。后續(xù)服務階段:后續(xù)服務階段的主要目的是尚未長時間穩(wěn)定運行的系統(tǒng)提供細致的跟蹤保障工作,確保系統(tǒng)順利過渡到穩(wěn)定運行狀態(tài)。除以上內(nèi)容外,在系統(tǒng)搬遷過程中還包括系統(tǒng)搬遷項目相關(guān)的組織機構(gòu)的建設(shè)(如成立搬遷指導委員會做為最高領(lǐng)導機構(gòu))、搬遷過程中的溝通計劃、項目管理與控制等重要內(nèi)容。風險分析風險分析是系統(tǒng)搬遷工作的第一步。它標識存在的風險、標識與IT系統(tǒng)生命周期(SDLC)關(guān)聯(lián)的風險,找出系統(tǒng)的薄弱環(huán)節(jié)。風險分析的輸出作為風險轉(zhuǎn)移階段的輸入。風險分析包括9個步驟,分別描述如下。第一步:獲取系統(tǒng)相關(guān)信息任務確定評估范圍,明確系統(tǒng)邊界、資源及組成,明確風險的受體。方法IT風險分析的信息采集方法IT模型定義的方法第二步:識別威脅任務標識可能發(fā)生的威脅方法威脅并不一定代表風險的發(fā)生。決定風險的可能性必須考慮3個因素:威脅源、系統(tǒng)的薄弱環(huán)節(jié)、已經(jīng)存在的預防措施。第三步:標識系統(tǒng)薄弱環(huán)節(jié)任務標識系統(tǒng)薄弱環(huán)節(jié)。方法標識薄弱源、執(zhí)行系統(tǒng)安全測試、生成系統(tǒng)安全檢查項列表。第四步:分析預防措施任務分析組織已經(jīng)采用的或者計劃采用的預防措施,這些預防措施將用來減輕、消除威脅源利用系統(tǒng)薄弱環(huán)節(jié)的可能性。方法獲得系統(tǒng)薄弱環(huán)節(jié)在威脅環(huán)境中被利用的幾率,必須考慮當前的和計劃的預防措施。第五步:決定風險發(fā)生的幾率任務:標識風險發(fā)生的幾率方法:獲得在威脅環(huán)境中薄弱環(huán)節(jié)被利用從而發(fā)生風險的幾率,必須考慮以下首要的因素:威脅源的動機和能力薄弱環(huán)節(jié)的屬性當前預防措施是否存在、是否有效第六步:風險影響分析任務:標識風險的影響。方法:測量風險級別的重要步驟是決定風險發(fā)生后造成的負面影響。開始影響分析之前,獲得以下信息是非常必要的:系統(tǒng)執(zhí)行的業(yè)務系統(tǒng)和數(shù)據(jù)的重要性(系統(tǒng)的價值和對組織的重要性)系統(tǒng)和數(shù)據(jù)的敏感度風險對業(yè)務的影響(這些影響的分析就是BIA)重要于風險對IT系統(tǒng)資源的影響。如果還沒有對IT系統(tǒng)資源進行評估,系統(tǒng)和數(shù)據(jù)的敏感度取決于系統(tǒng)和數(shù)據(jù)的可用性、完整性和機密性的保護程度。系統(tǒng)和信息負責人應該決定不同風險對他們負責的系統(tǒng)和數(shù)據(jù)的影響級別。和系統(tǒng)和信息負責人會面是分析系統(tǒng)和數(shù)據(jù)影響的好辦法。因此,一個安全事件的負面影響可以描述為以下三個安全目標的任意組合:完整性、可用性、機密性。完整性丟失,導致數(shù)據(jù)被篡改或破壞,如果不被及時修復,后續(xù)任務會出現(xiàn)不準確、虛假、錯誤的決定。會影響IT系統(tǒng)的可信度。可用性丟失,會導致任務不能執(zhí)行,減少生產(chǎn)時間,阻礙用戶的活動。機密性丟失,會導致國家安全的危險,公眾信心的喪失,觸發(fā)法律問題。有些影響可以根據(jù)損失、恢復代價、修正代價來定量分析;有些影響只能定性分析,分為高、中、低三個級別。通常,我們采用定性分析,一般將風險對業(yè)務的影響定義為高、中、低三個級別,如下圖所示:低中高可用性服務受到周期性的損害服務受到嚴重損害服務根本不可用持續(xù)時間服務停頓時間少于半天服務停頓時間長于半天,少于3天服務停頓時間大于3天范圍影響數(shù)個單獨的個體一個業(yè)務功能受到影響多個業(yè)務功能受到影響定性和定量分析各有其優(yōu)缺點。在決定影響幅度的時候,應該不限于考慮以下因素:評估危險源在某個指定時間段利用薄弱環(huán)節(jié)的頻度;評估每個危險源利用薄弱環(huán)節(jié)后的大致花費;每個危險源利用薄弱環(huán)節(jié)的相對權(quán)重定義第七步:決定風險級別任務標識風險的級別。方法評估風險的級別必須考慮以下因素:危險源利用系統(tǒng)薄弱環(huán)節(jié)的幾率危險源利用系統(tǒng)薄弱環(huán)節(jié)的影響大小防止或減弱危險源利用系統(tǒng)薄弱環(huán)節(jié)的已有的或者計劃的預防措施風險級別是風險發(fā)生的幾率乘于風險的影響。我們假定風險發(fā)生的幾率從1到0,1是高,0.5是中,0.1是低;我們假定風險的影響從100到0,100是高,50是中,10是低;劃分風險發(fā)生的幾率和風險的影響的粒度可以在風險分析的執(zhí)行過程中進一步調(diào)整。第八步:預防措施建議任務:提供最適合用戶組織的預防措施,用于轉(zhuǎn)移或消減風險級別矩陣中已經(jīng)標識出的風險,從而降低風險級別,降低后的風險級別是系統(tǒng)和數(shù)據(jù)可以接受的風險級別。方法:在建議預防措施和可選方案用于轉(zhuǎn)移或消減已經(jīng)標識的風險時,考慮以下因素:建議的預防措施的有效性法律和法規(guī)的要求用戶組織的政策要求對操作的影響(系統(tǒng)性能影響、用戶可接受程度)安全性和可靠性要求預防措施建議是風險分析過程的結(jié)果,預防措施建議作為風險轉(zhuǎn)移過程的輸入,在風險轉(zhuǎn)移過程中建議的預防措施得到再次評估、優(yōu)化、執(zhí)行。并非全部的建議的預防措施得到執(zhí)行,還需要進行成本效益的分析。業(yè)務影響分析業(yè)務影響分析的主要目的是找出系統(tǒng)搬遷對主要業(yè)務的影響以及業(yè)務系統(tǒng)間的依賴關(guān)系,確定達到系統(tǒng)持續(xù)目標所需要的資源。業(yè)務影響分析模塊的規(guī)格指標第一步:數(shù)據(jù)采集辦法1、通過問卷采集數(shù)據(jù)2、通過訪談進行數(shù)據(jù)收集3、通過會議進行數(shù)據(jù)收集4、通過已有文檔進行數(shù)據(jù)收集第二步:業(yè)務分析任務明確關(guān)鍵業(yè)務功能及支持關(guān)鍵業(yè)務功能的資源、明確業(yè)務流程;分析和關(guān)鍵業(yè)務功能有關(guān)的各業(yè)務流程之間的相互依賴關(guān)系;分析與和關(guān)鍵業(yè)務功能的業(yè)務流程有密切聯(lián)系的其他業(yè)務子系統(tǒng)及相關(guān)部門、機構(gòu)之間的相互依賴關(guān)系;分析在風險發(fā)生時,為保證核心業(yè)務的連續(xù),對于這些子系統(tǒng)及其相關(guān)部門資源的依賴和需求;定義恢復時間指標RTO和恢復時間點目標RPO。方法業(yè)務系統(tǒng)的各子系統(tǒng)之間一般以功能邊界劃分,業(yè)務核心子系統(tǒng)是業(yè)務系統(tǒng)中的一個或若干子系統(tǒng)。每個業(yè)務子系統(tǒng)通過一個或者若干業(yè)務功能實現(xiàn)。業(yè)務過程是一套能夠給顧客帶來某種價值的連續(xù)的活動(一段信息流或/和一段物流活動),一個業(yè)務過程可能貫穿多個業(yè)務子系統(tǒng),并通常包括多個功能;業(yè)務過程并不總是可見的;直接分析業(yè)務核心功能是非常有效的分析方式;每個子系統(tǒng)可能執(zhí)行一個或者多個核心功能;在分析某個功能中斷后造成的影響時,理解這些核心功能和最終顧客的關(guān)系是非常關(guān)鍵的;下面的方法用于理解核心功能和業(yè)務流程:檢查、回顧相關(guān)文檔,理解用戶組織的結(jié)構(gòu)和意圖;和用戶的業(yè)務部門、技術(shù)部門、信息中心等核心人員進行面談,獲取業(yè)務情況的一手信息。詳細進行會談準備,通過一次交流獲得業(yè)務分析、運營影響、財務及非財務影響的所有信息;根據(jù)上面獲得的信息進一步完善業(yè)務流程圖。這些流程圖將描述每一個核心業(yè)務功能,并描述作為過程輸入輸出的信息及服務的流程,顧客也作為流程中的一個環(huán)節(jié)。描述基本支持功能。有些子系統(tǒng)為許多其他子系統(tǒng)提供基本支持功能,例如LDAP功能。當生成和執(zhí)行恢復計劃時,這些信息是非常重要的;生成一個核心功能矩陣,描述業(yè)務子系統(tǒng)核心功能之間的關(guān)系;確認理解了各業(yè)務子系統(tǒng)及其核心功能、業(yè)務流程、相關(guān)的管理;提交物與核心功能有關(guān)的文檔;非核心功能的流程描述業(yè)務功能分類及描述:第三步:運營影響分析任務標識和書面化化每個風險對每個業(yè)務功能的關(guān)聯(lián)影響;書面化核心功能之間的關(guān)系,資源和組織機構(gòu)之間的依賴關(guān)系;書面化每個風險事件造成的公共影響;方法運營分析包括以下步驟:采集信息,獲取與所有核心功能相關(guān)的每個風險事件對組織機構(gòu)及公共的關(guān)聯(lián)影響;分析和每個核心功能相關(guān)的信息。決定每個業(yè)務功能的MAO(可接受的最大損耗)、標識每個業(yè)務功能的組織依賴關(guān)系、標識每個業(yè)務功能的資源依賴關(guān)系;為所有核心功能相關(guān)的信息生成提交件。包括:與所有核心功能相關(guān)的每個風險事件對組織機構(gòu)及公共的關(guān)聯(lián)影響,組織依賴關(guān)系列表,資源依賴關(guān)系列表;可以通過和每個業(yè)務子系統(tǒng)關(guān)鍵負責人員訪談來采集信息。三個基本的風險事件是應用失效、存取失效、設(shè)施失效。應該為參與訪談者提供測量業(yè)務功能關(guān)鍵程度的例子。如果某個業(yè)務功能出現(xiàn)風險將對人員和公共安全造成影響、對法律造成破壞,那么這個業(yè)務功能的關(guān)鍵性就特別高了。關(guān)鍵性越高的業(yè)務功能,它的MAO就越小。需要將訪談內(nèi)容整理成文檔。分析每個核心功能相關(guān)的運營信息,決定核心功能的MAO的時間基準。這個時間基準是開發(fā)恢復策略時參考的基準。提交物核心功能一覽表,包括以下內(nèi)容:每個風險事件導致的每個核心功能的關(guān)聯(lián)影響;每個核心功能的資源依賴關(guān)系列表每個核心功能的組織依賴關(guān)系列表每個業(yè)務功能的風險導致的不同顧客類的影響;按照MAO時間基準大小生成的核心功能列表;第四步:財務影響分析任務標識并量化每個風險造成的潛在財務影響,為選擇可選的恢復辦法提供成本判斷依據(jù)。方法首先決定是否有必要進行財務影響分析;采集信息;定制訪談時設(shè)定的問題、獲取作用于業(yè)務功能的每個風險造成的財務影響、量化財務影響;分析獲取的信息;整理獲取的信息;定義財務影響的類型、圖表化財務影響信息;通過和每個業(yè)務子系統(tǒng)的相關(guān)人員訪談獲得每個風險作用在核心功能時造成的財務影響,盡量量化財務影響,不能量化的話給出原因。訪談后整理訪談內(nèi)容。分析訪談獲取的信息,判斷和一個風險有關(guān)的哪個核心進程會造成財務影響。計算在MAO時間基準及超出時間基準時造成的財務影響,盡量量化財務影響,不能量化的話給出原因。財務影響的分析數(shù)據(jù)計算出來后,作為選擇可選恢復方法的依據(jù)。以MAO的時間基準和財務影響生成直觀化的圖表是非常有利于分析的。提交物風險造成的量化的財務影響;第五步:非財務影響分析對風險造成的人員健康和生命、名譽、法律條款、競爭力等的影響進行分析。制定搬遷整體規(guī)劃制定搬遷整體規(guī)劃的主要目的是規(guī)劃系統(tǒng)搬遷的優(yōu)先順序,找出合理的系統(tǒng)搬遷計劃,合理分配資源,降低系統(tǒng)搬遷對業(yè)務持續(xù)的影響。其主要的工作內(nèi)容包括:制定搬遷過程中的存儲、服務器整合方案制定使用臨時設(shè)備方案制定搬遷整體方案(關(guān)注系統(tǒng)搬遷的順序)制定搬遷控制流程尋找系統(tǒng)搬遷承運商搬遷規(guī)劃制定的規(guī)格指標第一步:標識可選用的規(guī)劃任務標識可選用的搬遷規(guī)劃,對規(guī)劃分類。方法對于每個可用的搬遷整體規(guī)劃:標識要搬遷的任務、時間需求按照關(guān)鍵度、上下層依賴關(guān)系來劃分時間緊迫性的級別標識每個領(lǐng)域的專家按照區(qū)域選擇團隊負責人檢查搬遷中涉及的對象可能發(fā)生的問題第二步:規(guī)劃整合任務縱向使低層次計劃順應高層次計劃,橫向協(xié)調(diào)優(yōu)化(在技術(shù)、商務方面)。例如:1、WAN規(guī)劃、服務器規(guī)劃、數(shù)據(jù)異地同步策略等技術(shù)恢復規(guī)劃,WAN帶寬和需要同步的數(shù)據(jù)量要協(xié)調(diào)。2、商務方面的整合要考慮供貨的優(yōu)化、支持服務的優(yōu)化等。辦法關(guān)注關(guān)鍵業(yè)務功能強調(diào)協(xié)調(diào)性優(yōu)化與供應商的合同每個業(yè)務功能需要一個套恢復資源第三步:規(guī)劃的評估任務評估規(guī)劃的目標、是否滿足業(yè)務準則、成本、風險辦法制定用于評估的一致的方法:1、評估規(guī)劃的可靠性的方法2、評估規(guī)劃的成本效益的方法3、比對內(nèi)部和外部的解決方案的方法4、評估每個規(guī)劃的風險的方法進行成本效益分析跟蹤已知的風險問題圍繞業(yè)務單元取得大家一致同意搬遷指導委員會檢查搬遷規(guī)劃可選項是否滿足業(yè)務需求的準則:1、實現(xiàn)關(guān)鍵業(yè)務功能的持續(xù)性2、實現(xiàn)外部因素驅(qū)動的業(yè)務功能持續(xù)性3、被確定的其他問題是否滿足搬遷目標:1、關(guān)鍵業(yè)務功能、優(yōu)先級和內(nèi)在依賴關(guān)系2、搬遷關(guān)鍵業(yè)務功能需要的時間3、恢復信息和通信系統(tǒng)需要的時間4、業(yè)務接續(xù)需要的時間第四步:成本效益分析任務在花費和中斷時間之間做出平衡辦法系統(tǒng)梳理與健康檢查系統(tǒng)梳理與健康檢查的主要目的是嚴格區(qū)分各系統(tǒng)的范圍,明確標記各系統(tǒng)的組成,明確各系統(tǒng)的運行狀態(tài),為搬遷方案的制定提供直接的參考依據(jù)。系統(tǒng)梳理與健康檢查主要通過對系統(tǒng)進行現(xiàn)場調(diào)研,并填寫各種表格完成。系統(tǒng)的標記通過對系統(tǒng)的標記,可以明確系統(tǒng)的組成,區(qū)分系統(tǒng)的范圍,確定系統(tǒng)間的連接關(guān)系。系統(tǒng)的標記規(guī)則通常采用用戶已有的系統(tǒng)標簽標記規(guī)則,否則可以根據(jù)用戶的實際要求在項目過程中確定。系統(tǒng)健康檢查通過系統(tǒng)的健康檢查可以了解系統(tǒng)的詳細情況和系統(tǒng)的運行狀態(tài),避免意外的發(fā)生。系統(tǒng)備份時間檢查由于在系統(tǒng)搬遷過程中,系統(tǒng)數(shù)據(jù)的備份是必須的步驟,因此,提前確定系統(tǒng)備份所花費的時間對統(tǒng)籌安排系統(tǒng)的搬遷過程具有重要的指導意義。通過檢查系統(tǒng)的備份情況還可以確定在搬遷過程中采用何種合理的系統(tǒng)備份方法和恢復方法,驗證系統(tǒng)數(shù)據(jù)恢復的能力。新機房環(huán)境檢查在系統(tǒng)搬遷之前,新機房的各種物理環(huán)境必須滿足各種設(shè)備的運行要求。安裝環(huán)境檢查表,提出有關(guān)安裝環(huán)境準備的建議事項。在服務器搬遷開始前新機房達到裝機要求。新機房環(huán)境檢查包括:機房環(huán)境是否符合標準,新機柜是否能夠保證各類服務器的正常上架工作項目內(nèi)容是否達到要求備注機房裝修是否符合防靜電、防火、及其他安全要求?機房綜合布線強弱電布線系統(tǒng)是否符合相關(guān)設(shè)備的要求?地面承重地面承重能力是否符合安裝設(shè)備的要求?設(shè)備安裝位置設(shè)計是否考慮了足夠物理空間用于設(shè)備安裝?是否為維護操作留出了必須的空間?搬運路線的設(shè)計各通道包括電梯是否能保證設(shè)備的進入?機房輔助設(shè)施工作臺、電源插座、電話機、遠程維護用的電話線是否齊全?機房環(huán)境的溫度與濕度OperatingNon-Operating溫度:16to32°C10to43°C濕度:8to80%8to80%最佳操作環(huán)境(Operating):空間溫度:24℃,濕度:50%空調(diào)是否具備調(diào)節(jié)溫度與濕度到指定要求的能力?電源電壓范圍交流200-240V,50~60Hz,或參閱附錄A,部分設(shè)備支持直流-48V接地要求電源保護地線的專用接地線電阻應小于1歐姆。測量零-地電壓值應小于1V。電壓穩(wěn)定如在電壓不穩(wěn)地區(qū),需裝設(shè)穩(wěn)壓裝置以確保電壓在規(guī)格內(nèi)制定系統(tǒng)搬遷與應急方案制定系統(tǒng)搬遷方案在完成系統(tǒng)的設(shè)備梳理和健康檢查后,在系統(tǒng)整體搬遷規(guī)劃的指導下,需要對每次搬遷的系統(tǒng)制定特定的系統(tǒng)搬遷方案。以下搬遷方案需要根據(jù)用戶的實際情況和具體要求適當調(diào)整。準備工作1.新機房環(huán)境檢測由用戶和XXX公司根據(jù)設(shè)備安裝對新環(huán)境的需求,重點對機房空調(diào)、粉塵情況、電力(交流電源、直流電源)、電源接地等進行檢測;2.確定配套設(shè)施是否就位確定新機房所需要的網(wǎng)絡(luò)綜合布線已經(jīng)完成,并提供相應的竣工文檔確定新機房機架和電源安裝完畢將來放置設(shè)備的位置的地板承重要達到要求,對超重的設(shè)備要為其做底座確定新機房微機桌、椅子等辦公用品已經(jīng)就位等4.由用戶提供相關(guān)單位/部門負責人聯(lián)系電話;5.新機房的傳輸資源安裝調(diào)試完畢,接口模塊就位;城域網(wǎng)落地;6.為了確保割接前新通信線路的載波暢通,要求用戶做好環(huán)路測試;7.以搬家公司為主、XXX協(xié)助準備泡用于搬遷時的設(shè)備包裝體,對設(shè)備進行保護,盡可能避免搬遷過程對設(shè)備的損壞。對有特殊搬遷要求的設(shè)備,提供專用檢測標志;8.檢查搬遷設(shè)備及設(shè)備連線是否做好相應的標記;9.設(shè)備備件及備件庫位置、備件到位時間確認;10.配置好新購的交換機和路由器,并測試可用。搬遷步驟系統(tǒng)準備系統(tǒng)檢查、操作系統(tǒng)、應用軟件、數(shù)據(jù)庫檢查做全部主機的系統(tǒng)全備份,主備機都要做備份,備份是否成功,需要經(jīng)過兩個工程師進行確認,確保備份數(shù)據(jù)正確無誤。做所有數(shù)據(jù)庫的全備份,備份到第三方存儲設(shè)備;重要數(shù)據(jù)(如生產(chǎn)數(shù)據(jù)庫)要做兩套備份;每做一個備份,要記錄備份時間,操作人,備份方式和備份介質(zhì)等信息檢查搬遷設(shè)備及設(shè)備連線是否做好相應的標記設(shè)備安裝位置確認設(shè)備互連線纜預布置在新機房安裝搬遷設(shè)備的機柜、配線架、傳輸設(shè)備等等之間,提前放置好涉及到這些設(shè)備之間互連的網(wǎng)線和網(wǎng)絡(luò)設(shè)備,以及需要的轉(zhuǎn)換器等相關(guān)設(shè)備各技術(shù)支持人員現(xiàn)場就位通知各部門停機時間系統(tǒng)設(shè)備搬遷按照業(yè)務需要的順序停機:對于單機系統(tǒng):先停業(yè)務應用程序,再停止中間件和數(shù)據(jù)庫,后停止存儲,最后停主機;對于雙機系統(tǒng):先停止雙機軟件,再停止存儲,最后停止主機設(shè)備進行拆卸搬運隊負責將設(shè)備運抵新機房設(shè)備搬遷到新機房后,由搬遷工人負責按照事先指定的位置,將設(shè)備放置到位;由各廠商按照已經(jīng)做好的標簽將設(shè)備重新組裝并連接線纜;工程師再次對電源進行檢查;在確認電源正常后,工程師為設(shè)備上電;啟動數(shù)據(jù)庫和應用程序,并對系統(tǒng)做測試,檢查數(shù)據(jù)是否正常;如有異常,各負責人及時解決;系統(tǒng)正常運行,搬遷完畢應急措施在嚴格按照搬遷步驟進行搬遷的同時,必須嚴格控制以上步驟中的關(guān)鍵步驟,針對它們我們制訂如下應急措施。在必要時候,都可以啟動故障升級流程,以保障問題的快速和有效解決:1、數(shù)據(jù)庫數(shù)據(jù)備份關(guān)鍵過程控制:備份是否成功,需要經(jīng)過兩個工程師進行確認,確保備份數(shù)據(jù)正確無誤。在備份數(shù)據(jù)前,要確認環(huán)境變量中的字符集正確無誤。應急措施:如果數(shù)據(jù)備份不成功,應馬上檢查原因并排除故障。如果超過1個小時無法排除故障,則取消搬遷工作,尋求數(shù)據(jù)庫廠商技術(shù)支持。2、倒入數(shù)據(jù)關(guān)鍵過程控制:導入數(shù)據(jù)是否成功,需要經(jīng)過兩個工程師進行確認,確保數(shù)據(jù)導入正確無誤。在導入數(shù)據(jù)前,要確認環(huán)境變量中的字符集正確無誤。應急措施:如果數(shù)據(jù)導入不成功,應馬上檢查原因并排除故障。如果超過1個小時無法排除故障,則取消工作,并尋求數(shù)據(jù)庫廠商技術(shù)支持。3、設(shè)備拆卸及運輸關(guān)鍵過程控制:在搬遷各設(shè)備過程中一定要小心謹慎,謹防碰撞刮傷以免毀壞設(shè)備。要搬遷前要進行設(shè)備標示,避免搬遷后設(shè)備或接口混亂。搬遷過程中的工具(表格、文檔等)系統(tǒng)搬遷方案主要通過搬遷流程步驟控制表的方式明確搬遷參與各方的責任與任務,完成對搬遷工作的計劃和準備。主要表格如下。表格的部分內(nèi)容應根據(jù)用戶的具體情況做適當修改。新機房環(huán)境檢查公共部分序號執(zhí)行任務描述負責方參與方工程師前置任務完成產(chǎn)生文件系統(tǒng)搬遷前的檢查階段用戶方需要確認內(nèi)部協(xié)調(diào)部門的負責人、落實人。在搬遷過程中負責協(xié)調(diào)需要用戶方負責的部分。1新機房運行環(huán)境檢查設(shè)計院關(guān)于新機房的設(shè)計文件《機房測試驗收報告》、《機房環(huán)境確認報告》、《電源環(huán)境確認報告》機房電源環(huán)境\接地電源布線檢查溫度\濕度環(huán)境機架位置設(shè)計院設(shè)計2新機房通訊環(huán)境檢查設(shè)計院關(guān)于新機房通訊環(huán)境設(shè)計文件《通訊環(huán)境確認報告》傳輸環(huán)境網(wǎng)絡(luò)傳輸要求《網(wǎng)絡(luò)環(huán)境測試要求》傳輸、時鐘、時間服務以《網(wǎng)絡(luò)環(huán)境測試要求》為準《網(wǎng)絡(luò)環(huán)境測試要求確認》網(wǎng)絡(luò)布線檢查設(shè)計院設(shè)計臨時鏈路檢查對鏈路物理連接可使用情況已經(jīng)確認;備用鏈路通過可用性測試《臨時鏈路具備可用條件報告》網(wǎng)絡(luò)連通性檢查網(wǎng)絡(luò)物理連接建設(shè)完畢過渡網(wǎng)絡(luò)環(huán)境檢查參照過渡網(wǎng)絡(luò)環(huán)境要求和新環(huán)境網(wǎng)絡(luò)調(diào)試完成情況《臨時網(wǎng)絡(luò)具備可用條件報告》系統(tǒng)搬遷流程步驟控制序號執(zhí)行任務描述責任方參與方工程師前置任務完成產(chǎn)生文件1新機房的環(huán)境檢查***機房電源環(huán)境\接地參照設(shè)計《系統(tǒng)具備搬遷環(huán)境報告》溫度\濕度環(huán)境機架位置系統(tǒng)間聯(lián)線布線系統(tǒng)內(nèi)線纜標識2設(shè)備準備和備份及確認***系統(tǒng)健康檢查負責方操作,配合方監(jiān)督《設(shè)備健康檢查報告》業(yè)務功能測試負責方操作,配合方監(jiān)督《業(yè)務功能性測試報告》系統(tǒng)軟件備份由負責方確認備份可用業(yè)務軟件和數(shù)據(jù)備份由負責方確認備份可用3系統(tǒng)搬遷過程***系統(tǒng)搬遷通告主要針對內(nèi)部相關(guān)部門《系統(tǒng)搬遷通知》再次確認各種搬遷資源《系統(tǒng)搬遷流程確認報告》停止業(yè)務系統(tǒng)應用系統(tǒng)備份完成,具備搬遷環(huán)境系統(tǒng)停機系統(tǒng)下架設(shè)備包裝機柜拆卸運前包裝檢查運輸公司負責的范圍界定在“運前”到“拆包”之間的過程,其它過程設(shè)備問題,由設(shè)備供應商按照正常保修提供設(shè)備的保修服務。設(shè)備物理搬遷**運輸后、拆包前包裝檢查機柜安裝設(shè)備上架線纜連接設(shè)備加電4設(shè)備測試《設(shè)備健康檢查報告》啟動應用5功能測試《業(yè)務功能性測試報告》6觀察期搬遷方案中所涉及的,在搬遷過程中使用的其他主要文檔還包括:《機房測試驗收報告》《通訊環(huán)境確認報告》《網(wǎng)絡(luò)環(huán)境測試要求》《業(yè)務功能性測試報告》《系統(tǒng)及數(shù)據(jù)備份完成確認報告》《系統(tǒng)具備搬遷環(huán)境報告》《系統(tǒng)搬遷參與方列表》《系統(tǒng)搬遷流程確認報告》《包裝箱運輸單》《設(shè)備健康檢查報告》《業(yè)務功能性測試報告》《系統(tǒng)應急設(shè)備確認報告》《子系統(tǒng)初驗報告》《平臺終驗報告》分工界面定義在設(shè)計搬遷方案的過程中還需要進一步明確和確定工程分工界面定義。搬遷與應急方案演練在系統(tǒng)搬遷計劃制定完成后,還需要參照改計劃進行演練。演練的目的之一是使參與搬遷的各單位熟悉搬遷過程,了解自己的工作和責任;另一個目的使通過演練發(fā)現(xiàn)系統(tǒng)搬遷計劃的漏洞和不足,在實際搬遷之前,把搬遷的風險降到最低。搬遷過程的演練以桌面演練為主,輔助以不影響系統(tǒng)正常運行的操作。搬遷前準備正式搬遷前的主要準備工作包括以下內(nèi)容:遞交搬遷申請發(fā)送搬遷通知原廠商與集成商通知用戶通知數(shù)據(jù)備份系統(tǒng)搬遷通知拆卸、包裝、運輸與安裝設(shè)備的拆卸、包裝、運輸與安裝流程主要通過《系統(tǒng)搬遷流程報告進行》控制。一份可用的系統(tǒng)搬遷流程報告如下,其具體內(nèi)容需要根據(jù)用戶實際情況進行修改。系統(tǒng)搬遷流程報告序號搬遷確認點確認單位確認人確認時間備注前期檢查——再次確認各種搬遷資源1《系統(tǒng)具備搬遷環(huán)境報告》已經(jīng)簽署2《系統(tǒng)替代或應急設(shè)備確認報告》已經(jīng)簽署3業(yè)務軟件及數(shù)據(jù)備份完成,備份數(shù)據(jù)準確可用4系統(tǒng)軟件備份完成,備份數(shù)據(jù)準確可用過程確認——前期檢查必須完全確認,才能進行下面的搬遷工作1業(yè)務已正常停止,可以關(guān)閉系統(tǒng)和進行設(shè)備下電2系統(tǒng)已正常停止,設(shè)備已正常下電,可以進行設(shè)備下架3設(shè)備已經(jīng)按照設(shè)備提供商的要求完成包裝,可以進行物理運輸4設(shè)備已經(jīng)運輸?shù)街付ǖ攸c,外觀無破損,可以進行設(shè)備拆包和上架5運輸中有問題,詳細信息見《系統(tǒng)運輸中問題報告》,此報告作為本報告的附件,報告內(nèi)容需包含詳細描述問題發(fā)生原因、現(xiàn)狀和處理過程,并拍照記錄6電源檢測符合設(shè)備要求,可以進行設(shè)備加電(僅針對使用利舊機柜而需要現(xiàn)場連接電源的設(shè)備)加電測試——進入設(shè)備加電、測試和業(yè)務啟動、測試階段注設(shè)備加電及測試過程和結(jié)果見《系統(tǒng)設(shè)備健康檢查報告》,作為本報告的附件業(yè)務啟動及測試過程和結(jié)果見《系統(tǒng)業(yè)務功能性測試報告》,作為本報告的附件系統(tǒng)恢復與健康檢查在系統(tǒng)在新機房重新構(gòu)建后,在正式開展業(yè)務之前,系統(tǒng)還需要進行一次健康檢查,以確保業(yè)務可以正確的展開。最后一次系統(tǒng)健康檢查通過后,業(yè)務可以上線運行。系統(tǒng)運行情況跟蹤當業(yè)務在新機房上線運行后,雖然可以支持用戶的業(yè)務正常開展,但由于系統(tǒng)的搬遷,IT系統(tǒng)處于一個不穩(wěn)定的時期,在搬遷后的3個月內(nèi),系統(tǒng)發(fā)生故障的概率往往高于原有環(huán)境中的系統(tǒng)。為了使用戶可以快速而順利的度過這一不穩(wěn)定期,用戶還可以選擇XXX提供的搬遷后系統(tǒng)運行情況跟蹤服務。XXX將根據(jù)用戶的實際情況制定完善的系統(tǒng)運行跟蹤計劃,提供現(xiàn)場工程師協(xié)助用戶維護新環(huán)境中的系統(tǒng)。搬遷過后的系統(tǒng)運行情況跟蹤服務一般不超過3個月。設(shè)備維護與保修服務設(shè)備維護與保修服務做為用戶可以選擇的另外一個系統(tǒng)搬遷附加服務,可以為用戶提供系統(tǒng)維護與保障服務。包括系統(tǒng)備件的準備與更換服務,定期的系統(tǒng)詢檢服務,定期的系統(tǒng)評估服務等。尤其是可以考慮針對本次搬遷中的非在保設(shè)備。數(shù)據(jù)中心搬遷的工程設(shè)計與實施方法機房搬遷項目的整體需求按照階段劃分為規(guī)劃、設(shè)計、實施和維護四個階段,同時,每個階段都貫穿著相應的需求。在項目的實施階段,我們將與用戶進行更細致的溝通,整理和分析XXX的具體要求,并在詳細設(shè)計方案中對用戶的需求給予體現(xiàn)。我們將按照系統(tǒng)搬遷的方法論,結(jié)合用戶的實際情況,采用以下方法分析用戶具體的需求,并進行工程設(shè)計實施。項目管理項目管理需求如下:創(chuàng)建組織架構(gòu)及定義角色職責定義搬遷工程界面制定并審批計劃管理進度風險管理質(zhì)量管理變更管理問題管理總體方案規(guī)劃在機房搬遷項目的每個階段,都涉及眾多的實體和活動,例如涉及資源、技術(shù)、方法、工具、流程等實體和開發(fā)、設(shè)計、實施、維護、控制、溝通、會議等活動,這就要求我們采用清晰的思路來組織所有實體和活動,使所有實體和活動和諧一致地實現(xiàn)共同的項目目標。根據(jù)搬遷項目的性質(zhì),即搬遷項目屬于IT領(lǐng)域的業(yè)務連續(xù)性管理的范疇,按照國際權(quán)威組織DRII、BCI的最佳實踐,在項目規(guī)劃階段,業(yè)務連續(xù)性項目的規(guī)劃需求如下:1、項目規(guī)劃成員需要業(yè)務連續(xù)性管理方法論做指導;2、項目規(guī)劃成員需要執(zhí)行IT領(lǐng)域的業(yè)務連續(xù)性管理的具體任務,包括搬遷風險分析、搬遷影響分析、搬遷策略分析;具體地講,在總體方案規(guī)劃階段,“搬遷規(guī)劃團隊”將完成以下任務:確定風險防范措施以減小或規(guī)避搬遷中意外事件造成的影響;確定各種資源的依賴關(guān)系,從而確定搬遷的內(nèi)容、批次及需要的資源;確定關(guān)鍵的資源和流程,以便在搬遷之前采取高可用性措施;確定每次搬遷的內(nèi)容的恢復優(yōu)先級順序;確定每次搬遷的內(nèi)容所需的最小恢復資源;確定每批次搬遷對業(yè)務的影響,從而制定最佳搬遷時機;確定自上而下分解的恢復時間指標(RTO),量化搬遷指標;確定需要優(yōu)化哪些資源,以滿足恢復時間指標;確定需要新增哪些新的資源;確定采用什么樣的高可用性措施;確定應急回退策略;確定危機溝通策略;確定對集成商或廠商的產(chǎn)品及服務的要求;總體方案設(shè)計總體方案設(shè)計描述各階段的總體性任務,描述這些任務之間的流程,描述完成這些任務需要的資源,描述全局性的任務。具體地講,在總體方案設(shè)計階段,“搬遷設(shè)計團隊”將完成以下任務:搬遷總體性任務框架及流程設(shè)計搬遷總體資源配置需求(指揮場地、支持與服務、設(shè)備、工具、文檔)各設(shè)備在新機房內(nèi)的位置分布圖新機房系統(tǒng)及網(wǎng)絡(luò)架構(gòu)圖設(shè)備清單設(shè)計指揮和命令任務的設(shè)計新機房環(huán)境評估任務的設(shè)計系統(tǒng)標簽標識設(shè)計危機溝通計劃的設(shè)計系統(tǒng)梳理與健康檢查設(shè)計搬遷與應急方案的測試和演練的設(shè)計培訓計劃項目實施計劃搬遷維護計劃搬遷驗收方法和標準的設(shè)計詳細方案設(shè)計詳細方案設(shè)計描述各系統(tǒng)和設(shè)備在各搬遷階段的具體任務,描述各階段任務之間的流程,描述局部性的任務。具體地講,在詳細方案設(shè)計階段,“搬遷設(shè)計團隊”將完成以下任務:1、搬遷外圍任務的設(shè)計需求搬遷外圍任務,即在邏輯上和搬遷項目相互獨立的任務,需要在搬遷項目的前期完成。通過把與搬遷項目沒有直接關(guān)系的外圍任務標識出來,清晰地界定搬遷項目的工作范圍。外圍任務設(shè)計如下:新增設(shè)備與原有系統(tǒng)整合的任務設(shè)計新機房的網(wǎng)絡(luò)環(huán)境與原有系統(tǒng)整合的任務設(shè)計處理存在故障設(shè)備的任務設(shè)計2、搬遷準備階段的任務設(shè)計需求搬遷準備任務,包括在系統(tǒng)和各相關(guān)設(shè)備下電前需要完成的所有任務。相關(guān)設(shè)計包括:搬遷準備任務之間的流程設(shè)計;系統(tǒng)梳理與健康檢查任務設(shè)計;每個遷移步驟的回退應急方案設(shè)計搬遷準備情況檢查列表的設(shè)計設(shè)備清點任務設(shè)計3、搬遷實施任務的設(shè)計需求搬遷實施任務,是指在搬遷命令下達后,系統(tǒng)和各相關(guān)設(shè)備下電、拆除、包裝、運輸、安裝,上架,上電、連接和調(diào)試的任務。相關(guān)設(shè)計包括:搬遷實施任務之間的流程設(shè)計下達搬遷命令的任務設(shè)計各系統(tǒng)和各相關(guān)設(shè)備的下電、標簽標識、拆除、包裝、運輸、安裝,上架,上電、連接和調(diào)試等的詳細操作步驟設(shè)計;數(shù)據(jù)備份策略以及備份數(shù)據(jù)檢測任務的設(shè)計;各搬遷團隊指南的設(shè)計4、搬遷維護任務的設(shè)計需求搬遷維護任務,是指在系統(tǒng)恢復成功后,由我方提供的系統(tǒng)運營監(jiān)護期(48小時)的維護及技術(shù)支持服務。相關(guān)設(shè)計包括:系統(tǒng)運行情況跟蹤設(shè)計設(shè)備保修設(shè)計現(xiàn)場技術(shù)支持設(shè)計方案實施階段方案設(shè)計階段之后,進入方案實施階段(搬遷實施階段只是方案實施階段的一部分)。具體地講,在方案實施階段,“搬遷項目團隊”將根據(jù)相關(guān)設(shè)計方案順序執(zhí)行以下任務:培訓,保證執(zhí)行任務的人員熟悉和掌握相應的方案和計劃,并具備相應的能力。進行搬遷與應急方案的測試和演練根據(jù)測試演練結(jié)果對方案進行優(yōu)化執(zhí)行外圍搬遷任務執(zhí)行全局性任務執(zhí)行各系統(tǒng)搬遷準備任務執(zhí)行危機溝通下達搬遷命令執(zhí)行各系統(tǒng)搬遷實施任務執(zhí)行各系統(tǒng)搬遷維護任務執(zhí)行搬遷驗收任務項目維護階段方案實施階段之后,進入項目維護階段。具體地講,在項目維護階段,“搬遷維護團隊”將根據(jù)相關(guān)設(shè)計方案執(zhí)行以下任務:跟蹤系統(tǒng)運行情況提供設(shè)備保修提供現(xiàn)場技術(shù)支持項目驗收項目維護階段之后,進入項目驗收階段。整體搬遷方案設(shè)計按照搬遷系統(tǒng)的需求,整體搬遷設(shè)計有兩個我們必須要考慮的設(shè)計要點,也是我們搬遷過程中的最大風險點所在,即數(shù)據(jù)保護和業(yè)務持續(xù):數(shù)據(jù)保護:包含搬遷過程和集中過程中的數(shù)據(jù)安全、數(shù)據(jù)完整性;業(yè)務持續(xù):包含怎樣在最短的時間內(nèi)完成業(yè)務系統(tǒng)的搬遷,如果搬遷不成功的業(yè)務回退以及最壞情況下的業(yè)務中斷情況等;在我們下面的具體方案設(shè)計和搬遷實施中均會對上面的兩個方面進行細致的考慮,并在風險分析和應急措施方面進行著重考慮和準備。搬遷次序設(shè)計搬遷次序的設(shè)計原則循序漸進,根據(jù)業(yè)務系統(tǒng)現(xiàn)狀,由易到難的磨合團隊;由簡到繁,及時總結(jié)和發(fā)現(xiàn)問題,修訂后繼搬遷方案。搬遷次序的設(shè)計方法根據(jù)設(shè)計原則,基于XXX搬遷工作的特點,可按照如下類別考慮各子系統(tǒng)的搬遷次序:類別一:僅需物理搬運系統(tǒng)或現(xiàn)網(wǎng)抽離的設(shè)備搬運;建議:做為搬遷的第一批次(可多組)業(yè)務系統(tǒng),進行搬遷;目的:鍛煉和磨合團隊,梳理搬遷流程和各方配合,發(fā)現(xiàn)搬運過程問題。類別二:需提供基礎(chǔ)設(shè)施的系統(tǒng)或獨立且業(yè)務次要的系統(tǒng);建議:做為搬遷的第二批次業(yè)務系統(tǒng),進行搬遷;目的:為后繼系統(tǒng)提供必備的條件,對比第一批設(shè)備搬遷過程,檢查問題糾正情況,增強各方對搬遷工作的信心。類別三:對外接口較多的次要級系統(tǒng);建議:做為搬遷的第三批次業(yè)務系統(tǒng),進行搬遷;目的:驗證多部門合作的工作方式,發(fā)現(xiàn)問題,并體現(xiàn)在后繼搬遷工作中。類別四:重要/復雜的系統(tǒng);建議:作為搬遷的第四批次業(yè)務系統(tǒng),進行搬遷;目的:經(jīng)過上述三個批次的業(yè)務系統(tǒng)搬遷,使搬遷參與的各方均對整個搬遷過程有了深刻理解和明確分工,整個搬遷團隊配合默契,最為成熟,所以可以保證以最充分的準備,完成最重要的系統(tǒng)搬遷任務。搬遷次序建議根據(jù)以上搬遷設(shè)計原則和設(shè)計方法,通過對XXX各業(yè)務系統(tǒng)進行分析,結(jié)合機房現(xiàn)有系統(tǒng)多而復雜等因素,建議通過分步驟分階段的進行各業(yè)務系統(tǒng)的搬遷,使整個搬遷工程得到分解,降低搬遷的復雜性,從而降低搬遷總體風險。斷電搬遷描述在此次XXX斷電搬遷過程中,主要是斷電搬遷。那么針對此類業(yè)務系統(tǒng)的搬遷,需要在搬遷流程中考慮數(shù)據(jù)的一致性、數(shù)據(jù)完整性、數(shù)據(jù)的安全性角度考慮,需要對系統(tǒng)、業(yè)務和數(shù)據(jù)庫數(shù)據(jù)進行備份、業(yè)務驗證等環(huán)節(jié)的考慮。針對這樣的特點,斷電系統(tǒng)的搬遷過程如下:主機、存儲和數(shù)據(jù)部分的詳細搬遷方案搬遷準備階段的任務設(shè)計搬遷準備階段需要順序執(zhí)行三個任務:系統(tǒng)梳理與健康檢查數(shù)據(jù)備份策略以及備份數(shù)據(jù)檢測的設(shè)計搬遷準備情況檢查系統(tǒng)梳理與健康檢查數(shù)據(jù)備份策略以及備份數(shù)據(jù)檢測的設(shè)計初步建議在搬遷準備階段進行一次業(yè)務和系統(tǒng)數(shù)據(jù)的完全備份。在搬遷實施啟動后,停止應用,再進行增量備份。在搬遷準備階段測試完整備份數(shù)據(jù)和增量備份數(shù)據(jù)的完整性、一致性和安全性。搬遷準備情況檢查列表項設(shè)計搬遷準備情況檢查列表確保搬遷實施的條件已經(jīng)滿足。主機、存儲和數(shù)據(jù)部分的搬遷準備情況檢查包括以下檢查項:是否通過健康檢查?備份策略是否測試成功?是否進行了完全的數(shù)據(jù)備份?相關(guān)介質(zhì)是否準備好?相關(guān)技術(shù)文檔是否準備好?主機、存儲和數(shù)據(jù)部分的技術(shù)支持人員是否就位?在新機房中的位置是否明確?安裝人員是否有相關(guān)位置圖?運輸工具是否就位?等……我們將在設(shè)計階段進一步完善以上檢查項。搬遷實施階段的任務設(shè)計實施步驟設(shè)計主機、存儲和數(shù)據(jù)部分的搬遷實施按照以下步驟順序執(zhí)行:關(guān)閉應用執(zhí)行數(shù)據(jù)增量備份下電標簽標識拆除、包裝、運輸安裝,上架,上電、連接和調(diào)試當回退場景出現(xiàn)時,執(zhí)行遷移回退數(shù)據(jù)增量備份的操作步驟設(shè)計在設(shè)計階段提供。下電步驟設(shè)計在設(shè)計階段提供。標簽標識設(shè)計恢復步驟設(shè)計在設(shè)計階段提供。相關(guān)搬遷團隊指南的設(shè)計我們將為主機、存儲和數(shù)據(jù)部分的搬遷團隊設(shè)計以下搬遷指南,保證團隊成員正確、協(xié)調(diào)一致地完成能夠任務:服務器團隊指南存儲團隊指南數(shù)據(jù)備份團隊指南運輸團隊指南每個指南主要包括以下內(nèi)容:團隊的人員及角色職責團隊的工作接口定義團隊的激活條件團隊工作流程團隊的關(guān)閉條件搬遷操作步驟調(diào)度指揮過程呼叫樹應急預案在線系統(tǒng),斷電搬遷搬運描述在線系統(tǒng)的搬遷設(shè)計,考慮到XXX已經(jīng)存在業(yè)務備份環(huán)境,且是熱備環(huán)境,因此,在線系統(tǒng)的搬遷,對業(yè)務系統(tǒng)的數(shù)據(jù)備份環(huán)節(jié)和業(yè)務系統(tǒng)搬遷過程中業(yè)務驗證環(huán)節(jié)將省略。搬遷環(huán)境的準備新機房的環(huán)境建設(shè)和檢查搬遷前,新機房必須按照設(shè)計文檔,具備相對應的各種搬遷環(huán)境,如:設(shè)備位置環(huán)境:如設(shè)備進出通道、設(shè)備機房位置、設(shè)備線纜進出位置、地板承重、電梯承重等;設(shè)備運行環(huán)境:如機房溫度、濕度、供電容量、供電方式、端子數(shù)量等。以上環(huán)境的檢查均應以機房設(shè)計文檔為主,結(jié)合設(shè)備需求,進行多項檢查。系統(tǒng)的各種搬遷文檔準備系統(tǒng)的各種資源準備就位搬遷前,需要準備各種資源就位以上資源的需求和準備情況,均會體現(xiàn)在《搬遷前資源CheckList》中,便于隨時跟蹤和解決相關(guān)問題。直接斷電搬遷數(shù)據(jù)備份技術(shù)簡介備份斷電系統(tǒng)搬遷選擇主要考慮到系統(tǒng)實時性和影響范圍而選擇的斷電搬遷,但是并不說明系統(tǒng)數(shù)據(jù),業(yè)務的次要性。因此,斷電搬遷的壓力要比不斷電搬遷設(shè)計的更周密。系統(tǒng)斷電搬遷數(shù)據(jù)備份設(shè)計原則:三類數(shù)據(jù)備份:業(yè)務數(shù)據(jù)、數(shù)據(jù)庫數(shù)據(jù)和OS系統(tǒng)的備份數(shù)據(jù)備份的數(shù)據(jù)要滿足數(shù)據(jù)一致性、數(shù)據(jù)完整性、數(shù)據(jù)安全性原則OS數(shù)據(jù)恢復、數(shù)據(jù)庫數(shù)據(jù)恢復、業(yè)務數(shù)據(jù)恢復組成了系統(tǒng)恢復的RTO/RPO的考核要求,即業(yè)務恢復窗口設(shè)計原則要滿足備份數(shù)據(jù)的可驗證性,業(yè)務冷備環(huán)境的可驗證性要求,這點也是演練中的重要部分,提供冷備系統(tǒng)的可驗證性原則數(shù)據(jù)允許丟失水平的設(shè)計,即在極端情況下哪些數(shù)據(jù)是要丟失的,丟失多少,對業(yè)務影響情況。這部分將體現(xiàn)在子系統(tǒng)搬遷技術(shù)設(shè)計中進行詳細設(shè)計和闡明,數(shù)據(jù)丟失容忍度原則數(shù)據(jù)備份技術(shù)手段根據(jù)一套業(yè)務環(huán)境分割,在一套系統(tǒng)顆粒度允許情況下,當系統(tǒng)構(gòu)成比較大時,也可將業(yè)務系統(tǒng)分批次搬遷進行。這就需要前面對業(yè)務系統(tǒng)調(diào)研分析后制定詳細的搬遷方案。業(yè)務系統(tǒng)構(gòu)成分成:OS層、業(yè)務軟件層、數(shù)據(jù)層三層OS系統(tǒng)的備份:通過我們實施經(jīng)驗,對運行環(huán)境系統(tǒng)影響最小的是系統(tǒng)鏡像備份OS,這種備份方式,在不中斷業(yè)務系統(tǒng)的情況就可以進行OS系統(tǒng)備份業(yè)務軟件層數(shù)據(jù)備份:業(yè)務軟件的數(shù)據(jù)備份通常采用兩種方式,一準備業(yè)務軟件介質(zhì),二,對相應的配置目錄進行備份數(shù)據(jù)層:通常數(shù)據(jù)都部署在相應的陣列上的數(shù)據(jù)庫文件、消息隊列文件中。通常在斷電搬遷過程中,我們要忽略消息隊列中的數(shù)據(jù),而關(guān)心數(shù)據(jù)庫中的數(shù)據(jù)在下面技術(shù)選擇比較中,我們著重對數(shù)據(jù)庫的備份方案進行比較。而針對業(yè)務系統(tǒng)的特點的技術(shù)方案可以參考附件中的LSTP的搬遷等系統(tǒng)的舉例進行詳細說明。數(shù)據(jù)庫備份數(shù)據(jù)庫備份和處理的原則數(shù)據(jù)庫的完整性:物理結(jié)構(gòu)和邏輯結(jié)構(gòu)數(shù)據(jù)庫一致性:備份數(shù)據(jù)與原數(shù)據(jù)的一致性原則在此次搬遷業(yè)務系統(tǒng)中使用的數(shù)據(jù)庫主要有Oracle數(shù)據(jù)庫、Sybase數(shù)據(jù)庫。Oracle數(shù)據(jù)庫備份方案介紹根據(jù)我多年數(shù)據(jù)備份的經(jīng)驗,在搬遷過程中,為了能夠滿足恢復窗口的要求、數(shù)據(jù)完整性和一致性的要求,我們通常采用OracleDataGuard方案。DataGuard介紹備用數(shù)據(jù)庫(standbydatabase)是ORACLE推出的一種高可用性(HIGHAVAILABLE)數(shù)據(jù)庫方案,在主節(jié)點與備用節(jié)點間通過日志同步來保證數(shù)據(jù)的同步,備用節(jié)點作為主節(jié)點的備份,可以實現(xiàn)快速切換與災難性恢復。Oracle9i的DataGuard是對Oracle8i中StandbyDatabase功能的加強,而StandbyDatabase技術(shù)出現(xiàn)的主要初衷就是為了容災(DisasterRecovery),所以具有更強大功能的DataGuard毫無疑問成了Oracle數(shù)據(jù)庫高可用性解決方案中首選使用的產(chǎn)品。DataGuard類型比較Oracle9i在DataGuard的配置方面提供了幾種不同的類型,根據(jù)客戶對于高可用性的不同要求,可以選擇不同的DataGuard類型。下面對于DataGuard的幾種類型作一個列舉和比較。DataGuard環(huán)境中包含一個產(chǎn)品數(shù)據(jù)庫,這是正常運行用以支撐日常業(yè)務的主數(shù)據(jù)庫,稱為PrimaryDatabase。另外包含一個或者多個災備數(shù)據(jù)庫,稱為StandbyDatabase。按照備用庫(StandbyDatabase)應用歸檔日志的不同方式,StandbyDatabase可以分為物理備用庫(PhysicalStandby)和邏輯備用庫(LogicalStandby)。按照主數(shù)據(jù)庫(PrimaryDatabase)的保護模式,整個DataGuard環(huán)境分為最大數(shù)據(jù)保護模式(MAXIMIZEPROTECTION),最大可用性模式(MAXIMIZEAVAILABILITY),最大性能模式(MAXIMIZEPERFORMANCE)。按照主庫向備用庫傳遞重作信息的方式,可以分為ARCH方式和LGWR方式。物理備用庫可以運行在數(shù)據(jù)庫三種保護模式中的任何一種模式下,邏輯備用庫只可以運行在最大可用性模式或者最大性能模式下。無論物理備用庫還是邏輯備用庫都可以在傳輸日志上采用ARCH方式或者LGWR方式。物理備用庫(PhysicalStandby):提供了一份跟主數(shù)據(jù)庫在物理級別上完全相同的copy,指在數(shù)據(jù)庫的block級別都是完全相同的,比如數(shù)據(jù)庫表中記錄的rowid。物理備用庫是通過不斷地恢復PrimaryDatabase傳入的重作日志數(shù)據(jù)信息來達到跟主數(shù)據(jù)庫保持同步。物理備用庫在處于自動恢復重作日志信息的狀態(tài)下,無法提供查詢服務。因為此時的備用數(shù)據(jù)庫并不是處于正常打開的狀態(tài),數(shù)據(jù)庫的非sysdba用戶無法登錄備用庫,自然也就無法進行普通的查詢業(yè)務。邏輯備用庫(LogicalStandby):指在邏輯上跟主數(shù)據(jù)庫保持一致,但是在物理層面上跟主數(shù)據(jù)庫并不相同。邏輯備用庫是通過將PrimaryDatabase傳入的重作日志數(shù)據(jù)信息轉(zhuǎn)化為SQL語句,然后在備用庫上重新執(zhí)行來達到跟主數(shù)據(jù)庫保持同步。邏輯備用庫在應用重作信息的同時也可以提供查詢功能。但是由于邏輯備用庫應用重作日志的方式限制,所以邏輯備用庫在功能和性能上面都有所限制。以下是邏輯備用庫的一些限制條件。以下數(shù)據(jù)類型不被支持:NCLOB,LONG,LONGRAW,BFILE,ROWID,UROWID….以下操作不被支持:ALTERDATABASEALTERSESSIONALTERSNAPSHOTALTERSNAPSHOTLOGALTERSYSTEMSWITCHLOGCREATECONTROLFILECREATEDATABASECREATEDATABASELINKCREATEPFILEFROMSPFILECREATESCHEMAAUTHORIZATIONCREATESNAPSHOTCREATESNAPSHOTLOGCREATESPFILEFROMPFILECREATETABLEASSELECTFROMACLUSTERTABLEDROPDATABASELINKDROPSNAPSHOTDROPSNAPSHOTLOGEXPLAINLOCKTABLERENAMESETCONSTRAINTSSETROLESETTRANSACTION高級隊列的管理和物化視圖的刷新不被支持要求每張表應該有主鍵或者唯一性索引,如果必須沒有唯一性標識的表,那么可以激活Primary庫的supplementallogging屬性,但是這樣將會在重作日志中記錄該表中每一條記錄的所有字段信息,會大大增加重作日志的記錄量。以下是DataGuard環(huán)境中物理備用庫和邏輯備用庫的配置圖。最大數(shù)據(jù)保護模式(MAXIMIZEPROTECTION)提供最高等級的數(shù)據(jù)保護,重作信息從主庫同步送到備用庫。直到備用庫成功接收重作信息,主庫上的事務才會提交。如果由于網(wǎng)絡(luò)等問題,導致備用庫不可用,那么主庫也同時會被關(guān)閉。這種模式保證了完全沒有數(shù)據(jù)丟失。最大可用性模式(MAXIMIZEAVAILABILITY)在備用庫正常的情況下,該模式提供了跟“最大數(shù)據(jù)保護模式”一樣的機制,保證沒有任何數(shù)據(jù)丟失。如果備用庫不可用,那么將轉(zhuǎn)換到“最大性能模式”,操作可以在主庫上繼續(xù)執(zhí)行。當備用庫重新可用之后,將會繼續(xù)同步。但是如果在同步完成之前,主庫由于故障損壞,將會丟失數(shù)據(jù)(當然,可以通過RAID,RMAN等方式盡量保護主庫即使出現(xiàn)故障也不丟失數(shù)據(jù))。最大性能模式(MAXIMIZEPERFORMANCE)這種模式下,主庫上的重作信息是異步傳遞到備用庫上,不論備用庫上是否已經(jīng)成功接收了重作信息,主庫上的操作都會成功執(zhí)行。所以這種模式提供了最好的性能,但是最低的數(shù)據(jù)保護。這是Oracle9i配置DataGuard的默認模式。ARCH方式當主庫歸檔聯(lián)機重作日志文件時,ARCH歸檔進程在歸檔到本機的同時,將重作數(shù)據(jù)傳遞到備用庫,由備用庫端的RFS進程(RemoteFileServer)接收,生成備用庫端的歸檔日志文件,然后由備用庫端的MRP進程(物理備用庫類型)或者LSP進程(邏輯備用庫類型)將歸檔日志文件恢復到備用庫中。傳遞方式如圖:LGWR方式物理備用庫類型下,主庫的LGWR進程在將重作數(shù)據(jù)寫到本地聯(lián)機重作日志文件中的同時,將重作數(shù)據(jù)傳遞到備用庫,備用庫的RFS進程將收到的數(shù)據(jù)寫入本地的備用重作日志文件(StandbyRedoLog)中。當主庫日志切換時也觸發(fā)備用庫的日志切換,切換發(fā)生時,備用庫的歸檔進程將重作日志文件歸檔,然后由備用庫端的MRP進程將歸檔日志文件恢復到備用庫中。傳遞方式如圖:邏輯備用庫類型下,不可以創(chuàng)建備用重作日志文件(StandbyRedoLog),所以處理流程跟物理備用庫稍有不同。主庫的LGWR進程在將重作數(shù)據(jù)寫到本地聯(lián)機重作日志文件中的同時,將重作數(shù)據(jù)傳遞到備用庫,備用庫的RFS進程將收到的數(shù)據(jù)寫入本地的歸檔日志文件中。當主庫日志切換時也觸發(fā)備用庫的日志切換,切換發(fā)生時,備用庫的歸檔進程完成歸檔日志文件的最后生成,然后由備用庫端的LSP進程提取歸檔日志文件中的SQL語句,重新在備用庫上運行一遍。傳遞方式如圖:最后上述所有類型或者方式互相搭配進行一個比較。MaximumProtectionMaximumAvailabilityMaximumPerformance重作傳遞方式LGWRLGWRLGWR或者ARCH網(wǎng)絡(luò)傳遞模式同步同步當使用LGWR傳遞方式時為異步方式,如果使用ARCH傳遞方式,那么不牽涉聯(lián)機重作數(shù)據(jù)的網(wǎng)絡(luò)傳輸磁盤寫入選項AFFIRMAFFIRMNOAFFIRM是否需要備用重作日志文件需要只在物理備用庫類型中需要如果物理備用庫使用LGWR傳遞方式,那么需要備份庫類型物理物理或邏輯物理或邏輯Sybase數(shù)據(jù)庫備份方案介紹但考慮到Sybase的版本問題,我們在實際工作中通常采用如下方式對Sybase數(shù)據(jù)庫進行備份。使用Sybase的BackupServer(備份服務器),做Dump備份轉(zhuǎn)儲數(shù)據(jù)庫(Dumpdatabase),就是為整個數(shù)據(jù)庫(包括數(shù)據(jù)、表結(jié)構(gòu)、觸發(fā)器、游標、存儲過程、事務日志等)做一次物理備份。轉(zhuǎn)儲數(shù)據(jù)庫時,系統(tǒng)自動執(zhí)行一次checkpoint,即將日志和數(shù)據(jù)從緩沖區(qū)拷貝到硬盤(只拷貝臟頁),把已被分配的頁(日志和數(shù)據(jù))轉(zhuǎn)儲到設(shè)備。命令格式為:dumpdatabase數(shù)據(jù)庫名to設(shè)備文件名with參數(shù)如果備份到硬盤的文件上,可以不預先估算備份文件的大小,只要硬盤有足夠的存儲空間就可以。如果是備份到dds磁帶上,那么就要估算一下備份后的大小,90米的dds磁帶壓縮存儲空間為4G,120米的磁帶壓縮存儲空間為8G,如果數(shù)據(jù)庫的備份文件超過了這個尺寸,就要考慮多文件轉(zhuǎn)儲,使用stripe參數(shù)。命令格式為:dumpdatabase數(shù)據(jù)庫名to設(shè)備文件名1stripeon設(shè)備文件名2……stripeon設(shè)備文件名3……with參數(shù)這種數(shù)據(jù)備份方式是將整個數(shù)據(jù)庫的運行環(huán)境完整的復制一份,包括數(shù)據(jù)庫的臟頁和碎片,在使用load命令恢復時,只能恢復到同樣大小的數(shù)據(jù)庫中(數(shù)據(jù)和日志的大小都只能和原來完全一致),適用于在每天的日終營業(yè)網(wǎng)點下班后的日常備份。優(yōu)點是數(shù)據(jù)庫完整無誤,缺點是不能直接查看備份內(nèi)容。分數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)記錄做兩次備份在一般情況下,生產(chǎn)機的數(shù)據(jù)庫都比較龐大,而實驗機則相對較小,難以在實驗環(huán)境中以load命令恢復工作機的內(nèi)容。所以,在工作實踐中,我們摸索出了第二種全量備份方案。1、數(shù)據(jù)記錄備份將數(shù)據(jù)庫各表以Sybase自代的bcp(bulkcopy)工具的方式導成一定格式的文本文件,命令格式:bcp表名out路徑名文件名-c-t分隔符-u(用戶名)-p(密

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論