版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、業(yè)務(wù)連續(xù)性容災(zāi)解決方案本地高可用解決方案技術(shù)白皮書業(yè)務(wù)連續(xù)性容災(zāi)解決方案本地高可用解決方案技術(shù)白皮書目錄目錄 HYPERLINK l _bookmark0 概述1 HYPERLINK l _bookmark1 業(yè)務(wù)連續(xù)性的挑戰(zhàn)1 HYPERLINK l _bookmark2 方案概述2 HYPERLINK l _bookmark3 方案亮點(diǎn)2 HYPERLINK l _bookmark4 本地高可用解決方案架構(gòu)3 HYPERLINK l _bookmark5 本地高可用方案3 HYPERLINK l _bookmark7 方案應(yīng)用場(chǎng)景4 HYPERLINK l _bookmark8 本地高可用
2、(HyperMetro)關(guān)鍵技術(shù)原理5 HYPERLINK l _bookmark9 AA 雙活架構(gòu)5 HYPERLINK l _bookmark10 并行訪問5 HYPERLINK l _bookmark11 免網(wǎng)關(guān)設(shè)計(jì)5 HYPERLINK l _bookmark12 I/O 訪問路徑5 HYPERLINK l _bookmark13 高可靠性設(shè)計(jì)6 HYPERLINK l _bookmark14 跨陣列集群技術(shù)6 HYPERLINK l _bookmark15 數(shù)據(jù)實(shí)時(shí)鏡像7 HYPERLINK l _bookmark16 跨陣列壞塊修復(fù)9 HYPERLINK l _bookmark17
3、 仲裁設(shè)計(jì)10 HYPERLINK l _bookmark21 分布式鎖技術(shù)15 HYPERLINK l _bookmark25 高性能設(shè)計(jì)17 HYPERLINK l _bookmark26 數(shù)據(jù)零拷貝17 HYPERLINK l _bookmark28 優(yōu)化訪問18 HYPERLINK l _bookmark30 縮略語22業(yè)務(wù)連續(xù)性容災(zāi)解決方案本地高可用解決方案技術(shù)白皮書1 概述 1 概 述 HYPERLINK l _bookmark1 業(yè)務(wù)連續(xù)性的挑戰(zhàn) HYPERLINK l _bookmark2 方案概述 HYPERLINK l _bookmark3 方案亮點(diǎn)業(yè)務(wù)連續(xù)性的挑戰(zhàn)隨著 I
4、T 信息化技術(shù)的飛速發(fā)展,信息系統(tǒng)在各種行業(yè)的關(guān)鍵業(yè)務(wù)中扮演著越來越重要的角色。系統(tǒng)業(yè)務(wù)中斷會(huì)導(dǎo)致巨大經(jīng)濟(jì)損失、影響品牌形象并可能導(dǎo)致重要數(shù)據(jù)丟 失,其對(duì)企業(yè)帶來的影響也越來越巨大。因此保證業(yè)務(wù)連續(xù)性已成為當(dāng)今 IT 基礎(chǔ)設(shè)施的關(guān)鍵所在,成為通訊、金融、醫(yī)療、電子商務(wù)、物流、政府等越來越多的行業(yè)中關(guān)鍵系統(tǒng)建立的必要條件。根據(jù)每年故障發(fā)生的頻率分析,設(shè)備故障是影響業(yè)務(wù)連續(xù)性運(yùn)行的高發(fā)區(qū)域,包括設(shè)備器件的損壞,磁盤故障,數(shù)據(jù)損壞等問題。那么在保障業(yè)務(wù)連續(xù)運(yùn)行首先需要解決的就是本地?cái)?shù)據(jù)中心設(shè)備器件和數(shù)據(jù)的可靠性,避免因?yàn)樵O(shè)備原因?qū)е聵I(yè)務(wù)的中斷或者數(shù)據(jù)損壞或丟失等問題。方案概述高可用性(High Av
5、ailability)方案。指在本地基礎(chǔ)設(shè)施系統(tǒng)中,存儲(chǔ)、網(wǎng)絡(luò)、服務(wù)器并存,一旦服務(wù)器、網(wǎng)絡(luò)或者存儲(chǔ)發(fā)生故障,用戶能夠繼續(xù)訪問應(yīng)用的能力。即要求服務(wù)器、網(wǎng)絡(luò)和存儲(chǔ)都有冗余架構(gòu),系統(tǒng)運(yùn)行具有很強(qiáng)的容錯(cuò)能力,以保持高可靠性。本地高可用方案是在部件各個(gè)器件冗余的可靠性基礎(chǔ)上建立本地備用系統(tǒng),一旦主用的存儲(chǔ)、網(wǎng)絡(luò)、服務(wù)器等任意單節(jié)點(diǎn)出現(xiàn)故障,可以實(shí)現(xiàn)快速的業(yè)務(wù)接管。本方案通過 VIS 鏡像、陣列的異構(gòu)虛擬化和卷鏡像技術(shù)、陣列雙活技術(shù),實(shí)現(xiàn)存儲(chǔ)層高可用冗余架構(gòu),可以結(jié)合網(wǎng)絡(luò),服務(wù)器及應(yīng)用集群實(shí)現(xiàn)到端到本地高可用方案。方案亮點(diǎn)最小化的宕機(jī)風(fēng)險(xiǎn)提供適用于不同應(yīng)用場(chǎng)景的解決方案,所有方案將華為存儲(chǔ)與上層服務(wù)器
6、集群技術(shù)完美結(jié)合,提供全冗余系統(tǒng)架構(gòu),提供 7*24 的高可用性服務(wù);消除系統(tǒng)單點(diǎn)故障風(fēng)險(xiǎn), 在任何系統(tǒng)單點(diǎn)故障情況下,數(shù)據(jù)零丟失,上層業(yè)務(wù)不中斷。廣泛兼容異構(gòu)服務(wù)器和應(yīng)用類型無關(guān),可以廣泛應(yīng)用于各類操作系統(tǒng)和應(yīng)用,華為 VIS 和存儲(chǔ)可以廣泛兼容友商陣列如:EMC,IBM,HDS,HP 等廠商常見存儲(chǔ)設(shè)備,充分利用設(shè)備剩余資源,保護(hù)現(xiàn)有投資。實(shí)現(xiàn)擴(kuò)展靈活本地高可用方案結(jié)合容災(zāi)復(fù)制等增值特性,可以進(jìn)一步完善更高級(jí)別的容災(zāi)保護(hù),如異地容災(zāi),兩地三中心容災(zāi)等。維護(hù)管理簡(jiǎn)單無需應(yīng)用配置,不需要服務(wù)器層安裝額外的磁盤管理軟件,實(shí)施和管理簡(jiǎn)單方便,單設(shè)備故障不影響 IO 訪問。業(yè)務(wù)連續(xù)性容災(zāi)解決方案本地
7、高可用解決方案技術(shù)白皮書2 本地高可用解決方案架構(gòu) 2 本地高可用解決方案架構(gòu)本地高可用解決方案實(shí)現(xiàn)主要分成服務(wù)器,網(wǎng)絡(luò),存儲(chǔ)幾個(gè)層次。本章主要介紹存儲(chǔ)層本地高可用實(shí)現(xiàn)架構(gòu),方案如下:本地高可用方案圖2-1 陣列本地高可用(HyperMetro)方案架構(gòu) HYPERLINK l _bookmark6 如圖 2-1 所示,本方案采用華為 OceanStor 系列磁盤陣列 HyperMetro 實(shí)現(xiàn)存儲(chǔ)層面的雙活,兩個(gè)磁盤陣列組成雙活集群,利用鏡像卷技術(shù),實(shí)現(xiàn)本地高可靠。兩臺(tái)存儲(chǔ)設(shè)備上的 LUN 被虛擬化為一個(gè)虛擬的卷,主機(jī)寫操作通過卷虛擬化鏡像技術(shù)同時(shí)寫入這兩個(gè)存儲(chǔ)設(shè)備,保持?jǐn)?shù)據(jù)實(shí)時(shí)一致。其中任
8、何一個(gè)存儲(chǔ)設(shè)備故障,虛擬卷仍能提供正常的 IO 讀寫能力,主機(jī)業(yè)務(wù)不受影響。待存儲(chǔ)設(shè)備恢復(fù)正常后,存儲(chǔ)虛擬化設(shè)備將增量數(shù)據(jù)后臺(tái)同步到修復(fù)的存儲(chǔ)設(shè)備,整個(gè)過程對(duì)主機(jī)“透明”,不會(huì)影響主機(jī)業(yè)務(wù)。方案應(yīng)用場(chǎng)景本地高可用方案應(yīng)用場(chǎng)景如下表所示:表2-1 本地高可用方案應(yīng)用場(chǎng)景本地高可用(HyperMetro)方案形態(tài)陣列方案架構(gòu)A-A 集群架構(gòu)數(shù)據(jù)緩存讀寫緩存接管異構(gòu)存儲(chǔ)支持應(yīng)用場(chǎng)景支持異構(gòu)并消除陣列單點(diǎn)故障業(yè)務(wù)連續(xù)性容災(zāi)解決方案本地高可用解決方案技術(shù)白皮書3 本地高可用(HyperMetro)關(guān)鍵技術(shù)原理 3 本地高可用(HyperMetro)關(guān)鍵技術(shù)原理關(guān)于本章 HYPERLINK l _book
9、mark9 AA 雙活架構(gòu) HYPERLINK l _bookmark13 高可靠性設(shè)計(jì) HYPERLINK l _bookmark25 高性能設(shè)計(jì)AA 雙活架構(gòu)并行訪問HyperMetro 特性基于兩套存儲(chǔ)陣列實(shí)現(xiàn) AA(Active-Active)雙活,兩端陣列的雙活 LUN 數(shù)據(jù)實(shí)時(shí)同步,且雙端能夠同時(shí)處理應(yīng)用服務(wù)器的 I/O 讀寫請(qǐng)求,面向應(yīng)用服務(wù)器提供無差異的 AA 并行訪問能力。當(dāng)任何一臺(tái)磁盤陣列故障時(shí),業(yè)務(wù)自動(dòng)無縫切換到對(duì)端存儲(chǔ)訪問,業(yè)務(wù)訪問不中斷。免網(wǎng)關(guān)設(shè)計(jì)HyperMetro 雙活架構(gòu)無需額外部署虛擬化網(wǎng)關(guān)設(shè)備,直接使用兩套存儲(chǔ)陣列組成集群系統(tǒng)。最大支持 32 個(gè)存儲(chǔ)控制器,
10、即兩套 16 控存儲(chǔ)陣列組建雙活關(guān)系。本方案架構(gòu)精簡(jiǎn)、與存儲(chǔ)增值特性良好兼容,對(duì)客戶的價(jià)值如下:減少網(wǎng)關(guān)故障點(diǎn),提高方案可靠性。I/O 響應(yīng)速度更快,無需經(jīng)過存儲(chǔ)網(wǎng)關(guān)轉(zhuǎn)發(fā),減少網(wǎng)關(guān)轉(zhuǎn)發(fā) I/O 時(shí)延。雙活可以兼容存儲(chǔ)陣列已有特性,與 OceanStor V3 融合存儲(chǔ)系統(tǒng)的其它 Smart 系列和 Hyper 系列特性組合,可為客戶提供多種數(shù)據(jù)保護(hù)和災(zāi)備解決方案。顯著降低雙活組網(wǎng)復(fù)雜度,便于維護(hù)。I/O 訪問路徑HyperMetro 在應(yīng)用主機(jī)側(cè),通過 UltraPath 主機(jī)多路徑軟件,將兩臺(tái)存儲(chǔ)陣列上的雙活成員 LUN 聚合為一個(gè)雙活 LUN,以多路徑 vdisk 方式對(duì)應(yīng)用程序提供 I/
11、O 讀寫能力。應(yīng)用程序訪問 vdisk 時(shí),Ultrapath 根據(jù)選路模式,選擇最佳的訪問路徑,將 I/O 請(qǐng)求下發(fā)到存儲(chǔ)陣列。存儲(chǔ)陣列的 LUN 空間上接收到 I/O 請(qǐng)求后,對(duì)于讀 I/O 請(qǐng)求,直接讀本地 Cache 空間,將數(shù)據(jù)返回應(yīng)用程序;對(duì)于寫 I/O 請(qǐng)求,首先會(huì)進(jìn)行并行訪問互斥,獲取寫權(quán)限后,將 I/O 請(qǐng)求數(shù)據(jù)同時(shí)寫本地雙活成員 LUN Cache 以及對(duì)端的雙活成員 LUNCache,雙端寫成功后返回應(yīng)用程序?qū)懲瓿?。圖3-1 雙活 IO 路徑高可靠性設(shè)計(jì)HyperMetro 在繼承 OceanStor 存儲(chǔ)系統(tǒng)高可靠設(shè)計(jì)的基礎(chǔ)上,全新設(shè)計(jì)了一些解決方案級(jí)高可靠技術(shù),最大化
12、提高了存儲(chǔ)雙活方案的可靠性。本章節(jié)將從以幾個(gè)方面介紹 HyperMetro 的高可靠技術(shù):跨陣列集群數(shù)據(jù)實(shí)時(shí)鏡像跨陣列壞塊修復(fù)仲裁設(shè)計(jì)分布式鎖技術(shù)跨陣列集群技術(shù)兩套獨(dú)立的存儲(chǔ)陣列組建成本地高可用集群,提供雙活存儲(chǔ)架構(gòu),向應(yīng)用服務(wù)器提供無差異的并行訪問,處理應(yīng)用服務(wù)器的 I/O 請(qǐng)求。陣列集群配置過程極為簡(jiǎn)單,只需要將兩套存儲(chǔ)陣列配置成雙活域,即可完成集群配置。集群系統(tǒng)使用陣列間 FC 或 IP 鏈路作為通信鏈路,完成全局節(jié)點(diǎn)視圖建立和狀態(tài)監(jiān)控。在全局節(jié)點(diǎn)視圖基礎(chǔ)上,集群系統(tǒng)提供分布式互斥等能力,支持 AA 雙活架構(gòu)。集群節(jié)點(diǎn)具有并發(fā)訪問能力。當(dāng)出現(xiàn)單個(gè)控制器故障時(shí),其承接的業(yè)務(wù)將被切換到本陣列
13、的其它工作控制器;當(dāng)陣列的工作控制器全故障時(shí),則切換至另一個(gè)陣列。圖3-2 本地高可用訪問與切換在跨陣列集群基礎(chǔ)上,HyperMetro 以雙活 Pair 或雙活一致性組為單位提供服務(wù)和進(jìn)行狀態(tài)管理。兩套存儲(chǔ)陣列上的雙活成員 LUN 組成一個(gè)虛擬雙活 LUN,通過實(shí)時(shí)鏡像技術(shù)保持兩個(gè)陣列的雙活成員 LUN 的數(shù)據(jù)實(shí)時(shí)一致。一致性組是多個(gè)雙活 pair 的集合,可以確保單個(gè)存儲(chǔ)系統(tǒng)內(nèi),主機(jī)在跨多個(gè) LUN 進(jìn)行寫操作時(shí)數(shù)據(jù)的一致性。一致性組進(jìn)行分裂、同步等操作時(shí),一致性組的所有雙活 pair 保持步調(diào)一致。當(dāng)遇到鏈路故障時(shí),一致性組的所有成員對(duì)會(huì)一起進(jìn)入異常斷開狀態(tài)。當(dāng)故障排除后,所有成員同時(shí)進(jìn)
14、行數(shù)據(jù)的同步,從而保證災(zāi)備陣列數(shù)據(jù)的可用性。數(shù)據(jù)實(shí)時(shí)鏡像HyperMetro 通過實(shí)時(shí)鏡像功能,保證兩個(gè)存儲(chǔ)陣列之間數(shù)據(jù)的實(shí)時(shí)同步。主機(jī)寫操作通過實(shí)時(shí)鏡像技術(shù)同時(shí)寫入兩個(gè)陣列的雙活成員 LUN,保持?jǐn)?shù)據(jù)實(shí)時(shí)一致。具體的寫I/O 流程如所示。圖3-3 鏡像流程假如陣列 A 收到寫 I/O,鏡像處理流程如下:申請(qǐng)寫權(quán)限和記錄寫日志:陣列 A 收到主機(jī)寫請(qǐng)求,先申請(qǐng)雙活 Pair 的寫權(quán)限。獲得寫權(quán)限后,雙活 Pair 將該請(qǐng)求寫日志。日志中只記錄地址信息,不記錄具體的寫數(shù)據(jù)內(nèi)容。該日志采用具有掉電保護(hù)能力的內(nèi)存空間記錄以獲得良好的性 能。執(zhí)行雙寫:將該請(qǐng)求拷貝兩份分別寫入本地 LUN 和遠(yuǎn)端 LU
15、N 的 Cache。雙寫結(jié)果處理:等待兩端 LUN 的寫處理結(jié)果都返回。響應(yīng)主機(jī):雙活 Pair 返回寫 I/O 操作完成。HyperMetro 支持?jǐn)帱c(diǎn)續(xù)傳功能。當(dāng)某些故障場(chǎng)景(如單套存儲(chǔ)故障)導(dǎo)致雙活 Pair 關(guān)系異常斷開時(shí),HyperMetro 通過記錄日志的方式,記錄主機(jī)新產(chǎn)生的寫 I/O。當(dāng)故障恢復(fù)時(shí),HyperMetro 將自動(dòng)恢復(fù)雙活 Pair 關(guān)系,并且將所記錄的增量數(shù)據(jù)自動(dòng)同步到遠(yuǎn)端,無需全量同步所有數(shù)據(jù),整個(gè)過程對(duì)主機(jī)“透明”,不會(huì)影響主機(jī)業(yè)務(wù)。雙活 Pair 運(yùn)行狀態(tài)和主機(jī)訪問狀態(tài)關(guān)系見。表3-1 雙活主機(jī)訪問狀態(tài)表雙活 Pair 運(yùn)行狀態(tài)主機(jī)訪問狀態(tài)狀態(tài)描述主 LUN
16、從 LUN暫停讀寫不可讀寫用戶暫停雙活鏡像關(guān)系待同步讀寫不可讀寫陣列間鏈路故障或I/O 錯(cuò)誤導(dǎo)致雙活鏡像關(guān)系斷開同步中讀寫不可讀寫恢復(fù)雙活鏡像關(guān)系時(shí)全量/增量同步雙雙活 Pair 運(yùn)行狀態(tài)主機(jī)訪問狀態(tài)狀態(tài)描述端差異數(shù)據(jù)正常讀寫讀寫兩端 LUN 都進(jìn)入雙活 AA 實(shí)時(shí)鏡像關(guān)系強(qiáng)制啟動(dòng)讀寫不可讀寫用戶進(jìn)行了強(qiáng)制將雙活從 LUN 升級(jí)為主 LUN 的操作雙活 Pair 運(yùn)行狀態(tài)和鏡像狀態(tài)關(guān)系見。表3-2 雙活鏡像狀態(tài)表雙活 Pair 運(yùn)行狀態(tài)鏡像狀態(tài)主 LUN從 LUN暫停/待同步/強(qiáng)制啟動(dòng)不鏡像,記錄差異日志不涉及同步中鏡像寫,后臺(tái)復(fù)制差異不涉及正常鏡像寫鏡像寫跨陣列壞塊修復(fù)硬盤在使用過程中可能因
17、為掉電等異常情況出現(xiàn)壞塊,如果是可修復(fù)錯(cuò)誤但是本端已經(jīng)無法修復(fù)時(shí),HyperMetro 將自動(dòng)從遠(yuǎn)端陣列獲取數(shù)據(jù),修復(fù)本地?cái)?shù)據(jù)盤的壞塊,進(jìn)一步提高系統(tǒng)的可靠性。圖3-4 跨陣列壞塊修復(fù)陣列 A 出現(xiàn)壞塊時(shí),從該陣列讀 I/O 處理流程如下:步驟 1 主機(jī)下發(fā)讀 I/O。步驟 2 讀本地 LUN。步驟 3 讀取到壞塊后,如果為可修復(fù)錯(cuò)誤,執(zhí)行步驟 4,否則執(zhí)行 1、2 后流程結(jié)束。重定向遠(yuǎn)端讀。遠(yuǎn)端讀返回。步驟 4 將讀數(shù)據(jù)返回主機(jī),確保主機(jī)響應(yīng)的快速返回。步驟 5 根據(jù)遠(yuǎn)端的讀數(shù)據(jù),進(jìn)行本地寫入修復(fù)。步驟 6 寫修復(fù)結(jié)果返回。-結(jié)束仲裁設(shè)計(jì)當(dāng)提供雙活 LUN 的兩套陣列之間的鏈路故障時(shí),陣列已
18、經(jīng)無法實(shí)時(shí)鏡像同步,此時(shí)只能由其中一套陣列繼續(xù)提供服務(wù)。為了保證數(shù)據(jù)一致性,HyperMetro 將通過仲裁機(jī)制決定由哪套存儲(chǔ)繼續(xù)提供服務(wù)。HyperMetro 支持按雙活 Pair 或雙活一致性組為單位進(jìn)行仲裁。當(dāng)多個(gè)雙活 Pair 提供的業(yè)務(wù)相互依賴時(shí),用戶需要把這些雙活 Pair 配置為一個(gè)雙活一致性組。仲裁完成后, 一個(gè)雙活一致性組只會(huì)在其中一套存儲(chǔ)陣列繼續(xù)提供服務(wù)。例如,Oracle 數(shù)據(jù)庫(kù)的數(shù)據(jù)文件、日志文件可能分別存放在不同的 LUN 上,訪問 Oracle 數(shù)據(jù)庫(kù)的應(yīng)用系統(tǒng)存放在另一些 LUN 上,相互之間存在依賴關(guān)系。配置雙活時(shí),建議將數(shù)據(jù) LUN、日志LUN 和應(yīng)用 LUN
19、 分別配置雙活 pair,并且加入同一個(gè)一致性組。HyperMetro 提供了兩種仲裁模式:靜態(tài)優(yōu)先級(jí)模式仲裁服務(wù)器模式配置雙活 Pair 前,需要配置雙活域,雙活域?yàn)檫壿嫺拍?,包括需要?jiǎng)?chuàng)建雙活關(guān)系的兩套存儲(chǔ)陣列和仲裁服務(wù)器。每個(gè)雙活 Pair 創(chuàng)建時(shí)均要選擇雙活域,每個(gè)雙活域只能同時(shí)應(yīng)用一種仲裁模式。仲裁服務(wù)器模式比靜態(tài)優(yōu)級(jí)模式具備更高的可靠性,可保證在各種單點(diǎn)故障場(chǎng)景下, 業(yè)務(wù)連續(xù)運(yùn)行。因此,華為雙活方案推薦采用仲裁服務(wù)器模式。靜態(tài)優(yōu)先級(jí)模式靜態(tài)優(yōu)先級(jí)模式主要應(yīng)用在無第三方仲裁服務(wù)器的場(chǎng)景。用戶可以按雙活 Pair 或一致性組為單位,設(shè)置其中一端陣列為優(yōu)先陣列,另一端為非優(yōu)先陣列。如所示,
20、不需要額外部署仲裁服務(wù)器。該模式下,陣列間心跳中斷時(shí),優(yōu)先陣列仲裁勝利。當(dāng)發(fā)生陣列間鏈路故障,或者非優(yōu)先陣列故障時(shí),優(yōu)先陣列上的 LUN 繼續(xù)提供服務(wù),非優(yōu)先陣列的 LUN 停止提供服務(wù)。當(dāng)優(yōu)先陣列故障時(shí),非優(yōu)先陣列不能自動(dòng)接管雙活業(yè)務(wù),雙活業(yè)務(wù)停止,需要人工強(qiáng)制啟動(dòng)非優(yōu)先陣列服務(wù)圖3-5 靜態(tài)優(yōu)先級(jí)部署有一種情況除外,當(dāng)優(yōu)先站點(diǎn)陣列主動(dòng)下電維護(hù)時(shí),非優(yōu)先陣列立即接管所有雙活業(yè)務(wù),業(yè)務(wù)不會(huì)中斷。該模式的缺點(diǎn)是:兩陣列之間的心跳丟失時(shí),可能是鏈路丟失或其中一個(gè)陣列故障, 系統(tǒng)無法區(qū)分這兩種情況。 HYPERLINK l _bookmark18 表 3-3 為靜態(tài)優(yōu)先級(jí)模式下的仲裁策略。表3-3
21、靜態(tài)優(yōu)先級(jí)模式仲裁示意圖編號(hào)示意圖仲裁結(jié)果1故障類型:鏈路故障仲裁結(jié)果:H1 繼續(xù)運(yùn)行業(yè)務(wù),H2 停止業(yè)務(wù)2故障類型:非優(yōu)先故障仲裁結(jié)果:H1 繼續(xù)運(yùn)行業(yè)務(wù),H2 失效3故障類型:優(yōu)先故障仲裁結(jié)果:H1 失效;H2 停止業(yè)務(wù),需要人工啟動(dòng)仲裁服務(wù)器模式使用獨(dú)立的物理服務(wù)器或者虛擬機(jī)作為仲裁設(shè)備。如 HYPERLINK l _bookmark19 圖 3-6 所示。圖3-6 仲裁服務(wù)器部署仲裁服務(wù)器模式下,當(dāng)存儲(chǔ)陣列間心跳中斷時(shí),兩端陣列向仲裁服務(wù)器發(fā)起仲裁請(qǐng) 求,由仲裁服務(wù)器綜合判斷哪端獲勝。仲裁獲勝的一方繼續(xù)提供服務(wù),另一方停止服務(wù)。仲裁服務(wù)器模式下如果有優(yōu)先獲得仲裁的要求,也可以配置優(yōu)先級(jí)
22、。優(yōu)先陣列端具有仲裁獲勝的優(yōu)先權(quán),心跳中斷但其它正常時(shí),優(yōu)先陣列將獲得仲裁勝利。仲裁過程如 HYPERLINK l _bookmark20 圖 3-7 所示:圖3-7 仲裁機(jī)制兩臺(tái)存儲(chǔ)陣列之間的鏈路斷開時(shí),集群分裂為兩個(gè)小集群。小集群分別搶占仲裁,優(yōu)先陣列將優(yōu)先搶占仲裁,搶占成功的小集群“獲勝”, 將繼續(xù)對(duì)外提供服務(wù),為應(yīng)用提供存儲(chǔ)訪問空間;搶占失敗的小集群則停止對(duì)外服務(wù)。中間鏈路恢復(fù)時(shí),兩個(gè)子集群檢測(cè)到中間鏈路恢復(fù)正常,經(jīng)過握手通信將兩個(gè)小集群自動(dòng)組成一個(gè)集群,雙活關(guān)系恢復(fù),以 Active-Active 模式提供服務(wù)。列出了仲裁服務(wù)器模式下,各種故障場(chǎng)景下雙活業(yè)務(wù)表現(xiàn)。表3-4 各故障場(chǎng)景
23、仲裁示意圖編號(hào)示意圖仲裁結(jié)果業(yè)務(wù)連續(xù)性容災(zāi)解決方案本地高可用解決方案技術(shù)白皮書3 本地高可用(HyperMetro)關(guān)鍵技術(shù)原理編號(hào)示意圖仲裁結(jié)果1故障類型:仲裁失效仲裁結(jié)果:H1、H2 繼續(xù)運(yùn)行業(yè)務(wù)2故障類型:一套陣列與仲裁之間鏈路故障仲裁結(jié)果:H1、H2 繼續(xù)運(yùn)行業(yè)務(wù)3故障類型:一套陣列失效仲裁結(jié)果:H1 失效,H2 繼續(xù)運(yùn)行業(yè)務(wù)4故障類型:陣列間鏈路中斷仲裁結(jié)果:H2 失效,H1 繼續(xù)運(yùn)行業(yè)務(wù)5故障類型:一套陣列與仲裁同時(shí)失效仲裁結(jié)果:H1 失效,H2 停止業(yè)務(wù)6故障類型:一套陣列與對(duì)端、仲裁的鏈路同時(shí)中斷仲裁結(jié)果:H1 停止業(yè)務(wù),H2 繼續(xù)運(yùn)行業(yè)務(wù)7故障類型:一套陣列失效,且對(duì)端與仲裁
24、鏈路中斷仲裁結(jié)果:H1 失效,H2 停止業(yè)務(wù)業(yè)務(wù)連續(xù)性容災(zāi)解決方案本地高可用解決方案技術(shù)白皮書3 本地高可用(HyperMetro)關(guān)鍵技術(shù)原理編號(hào)示意圖仲裁結(jié)果8故障類型:仲裁失效,且陣列間鏈路中斷仲裁結(jié)果:H1 與 H2 均停止業(yè)務(wù)9故障類型:仲裁失效,且其與一套陣列鏈路中斷仲裁結(jié)果:H1、H2 繼續(xù)運(yùn)行業(yè)務(wù)H1 和 H2 表示組成雙活 HyperMetro LUN 的兩個(gè)陣列,C 表示對(duì)應(yīng)的仲裁服務(wù)器。強(qiáng)制啟動(dòng)某些特定的多重故障情況下,仲裁機(jī)制優(yōu)先保證數(shù)據(jù)的一致性,可能會(huì)將存活的雙活成員 LUN 都停止主機(jī)訪問。例如靜態(tài)優(yōu)先級(jí)模式下優(yōu)先陣列故障等場(chǎng)景,存活的雙活成員 LUN 會(huì)停止主機(jī)訪
25、問,用戶或售后工程師可根據(jù)故障情況選擇人工強(qiáng)制啟動(dòng)業(yè)務(wù),快速恢復(fù)業(yè)務(wù)。強(qiáng)制啟動(dòng)后,被強(qiáng)制啟動(dòng)端會(huì)升級(jí)為雙活數(shù)據(jù)同步源端,強(qiáng)制啟動(dòng)端的雙活成員 LUN 具有最新數(shù)據(jù)。鏈路恢復(fù)后,系統(tǒng)主動(dòng)停止對(duì)端雙活成員 LUN 主機(jī)訪問。發(fā)起數(shù)據(jù)同步時(shí),將以強(qiáng)制啟動(dòng)端的雙活成員 LUN 數(shù)據(jù)覆蓋對(duì)端。該過程中只會(huì)同步增量差異數(shù)據(jù)。執(zhí)行強(qiáng)制啟動(dòng)前,需要充分考慮雙主風(fēng)險(xiǎn),應(yīng)在執(zhí)行前確認(rèn)兩個(gè)陣列的 LUN 狀態(tài)和業(yè)務(wù)狀態(tài),確保對(duì)端存儲(chǔ)已經(jīng)停止工作。分布式鎖技術(shù)分布式互斥能力是實(shí)現(xiàn) AA 雙活的關(guān)鍵能力之一,雙活分布式鎖模塊利用 Paxos 和CHT(Consistent Hash Table)一致性算法,提供了分布式
26、對(duì)象鎖和分布式范圍鎖,從而滿足 AA 雙活的分布式互斥訴求。通過鎖預(yù)取技術(shù),可有效減少跨陣列的數(shù)據(jù)傳輸量和通信交互次數(shù),從而提升 I/O 讀寫性能。在 AP 雙活架構(gòu)中,由于主機(jī)無法通過從端直接訪問雙活 LUN,從端主機(jī)寫數(shù)據(jù)時(shí), 必須將完整的寫數(shù)據(jù)發(fā)送到主控端,再通過鏡像鏈路把 I/O 從主控端同步到備控設(shè)備上,這樣數(shù)據(jù)存在多次跨陣列傳輸,嚴(yán)重影響寫性能,如 HYPERLINK l _bookmark22 圖 3-8 所示。圖3-8 AP 雙活的數(shù)據(jù)訪問HyperMetro 以主機(jī) I/O 粒度,對(duì)主機(jī) I/O 訪問的 LBA 區(qū)間加分布式范圍鎖進(jìn)行并發(fā)互斥,從而達(dá)到雙向?qū)崟r(shí)同步的目的,該方
27、案可省去不必要的陣列間數(shù)據(jù)傳輸帶寬,并有效的減少數(shù)據(jù)傳輸次數(shù)。HyperMetro HYPERLINK l _bookmark23 雙活數(shù)據(jù)訪問如圖 3-9 所示。圖3-9 應(yīng)用分布式鎖的雙活數(shù)據(jù)訪問HyperMetro 分布式鎖技術(shù)使用了智能的鎖預(yù)取和緩存策略,在寫權(quán)限本地?zé)o緩存的情況下,會(huì)通過較小的控制報(bào)文,向鎖權(quán)限緩存節(jié)點(diǎn)申請(qǐng)寫權(quán)限,并多預(yù)取部分區(qū)間的寫權(quán)限緩存到本地。后續(xù)的連續(xù)寫 I/O 可快速在本地命中寫權(quán)限,不需要再跨陣列申請(qǐng)寫權(quán)限。分布式鎖實(shí)現(xiàn)原理 HYPERLINK l _bookmark24 如圖 3-10 所示。圖3-10 分布式鎖預(yù)取高性能設(shè)計(jì)為了保證兩個(gè)存儲(chǔ)的數(shù)據(jù)實(shí)時(shí)一
28、致,寫操作都需要等待兩端存儲(chǔ)寫成功之后再返回主 機(jī)“寫成功”。雙活 I/O 性能因?yàn)閷?shí)時(shí)雙寫導(dǎo)致一定的時(shí)延增加,華為 HyperMetro 設(shè)計(jì)了一系列 I/O 性能優(yōu)化方案,減小對(duì)寫時(shí)延的影響,提升整體本地高可用的業(yè)務(wù)性能。數(shù)據(jù)零拷貝在雙活鏡像數(shù)據(jù)的初始同步或者恢復(fù)過程中的增量同步過程中,差異數(shù)據(jù)塊通常有大量的零數(shù)據(jù)塊,無需逐塊復(fù)制,該功能叫數(shù)據(jù)零拷貝。例如,虛擬化場(chǎng)景下,新建虛擬機(jī)時(shí)會(huì)產(chǎn)生大量的零數(shù)據(jù)塊,一個(gè)數(shù)十 GB 的操作系統(tǒng)盤,實(shí)際非零數(shù)據(jù)塊僅 2-3GB。數(shù)據(jù)零拷貝原理圖如所 HYPERLINK l _bookmark27 圖 3-11 所示。圖3-11 數(shù)據(jù)零拷貝HyperMetro 零頁面識(shí)別技術(shù)的實(shí)現(xiàn)方法如下:通過硬件芯片,對(duì)數(shù)據(jù)拷貝源端進(jìn)行快速識(shí)別,找出零數(shù)據(jù),在拷貝過程中,對(duì)全零數(shù)據(jù)特殊標(biāo)識(shí),只傳輸一個(gè)較小的特殊頁面到對(duì)端,不再全量傳輸。該技術(shù)可有效減少同步數(shù)據(jù)量,減少帶寬消耗,縮短同步時(shí)間。優(yōu)化訪問HyperMetro 特性通過與華為 OceanStor UltraPath 多路徑配合,根據(jù)兩臺(tái)陣列的部署距離,提供了兩種 I/O 訪問策略供用戶選擇。負(fù)載均衡模式優(yōu)選陣列模式負(fù)載均衡模式該模式下實(shí)現(xiàn)了 I/O 的跨陣列負(fù)載均衡,即 I/O 以分片的方式在兩個(gè)陣列上下發(fā)。分片大小可配,例如分片大小為 128M,即起始地址為 0-1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 奢侈品培訓(xùn)汽車
- 專業(yè)分包化標(biāo)準(zhǔn)精裝修工程管理
- Windows Server網(wǎng)絡(luò)管理項(xiàng)目教程(Windows Server 2022)(微課版)3.6 DHCP-任務(wù)5 DHCP客戶端配置
- 語法選修課 高中英語 非謂語動(dòng)詞 A篇
- 江蘇省徐州市銅山區(qū)2023-2024學(xué)年九年級(jí)上學(xué)期期中英語試卷(含答案解析)
- 第六章質(zhì)量與密度基礎(chǔ)練習(xí)題(含解析)2024-2025學(xué)年初中物理人教版八年級(jí)上冊(cè)
- 2024至2030年中國(guó)干豬膀胱行業(yè)投資前景及策略咨詢研究報(bào)告
- 2024至2030年中國(guó)多用途雙面黏貼布帶行業(yè)投資前景及策略咨詢研究報(bào)告
- 2024至2030年中國(guó)保安單元?dú)?shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2024年山東省中考語文試題含解析
- 5個(gè)人股東合作協(xié)議書
- 輕質(zhì)陶粒墻板項(xiàng)目立項(xiàng)申請(qǐng)報(bào)告
- 化工廠用電安全講課
- 學(xué)術(shù)英語寫作(本科)智慧樹知到期末考試答案2024年
- 糧油質(zhì)量檢驗(yàn)-課件-項(xiàng)目四-小麥粉質(zhì)量檢驗(yàn)
- AQ2059-2016 磷石膏庫(kù)安全技術(shù)規(guī)程
- 安全員繼續(xù)教育考試題庫(kù)1000道附參考答案(完整版)
- 2024年中儲(chǔ)糧集團(tuán)招聘筆試參考題庫(kù)附帶答案詳解
- (2024年)保安培訓(xùn)圖文課件
- 2023年《中職音樂》期末考試試卷及參考答案(卷)
- 中建八局項(xiàng)目管理策劃方案
評(píng)論
0/150
提交評(píng)論