網(wǎng)絡(luò)存儲2-RAID與智能存儲_第1頁
網(wǎng)絡(luò)存儲2-RAID與智能存儲_第2頁
網(wǎng)絡(luò)存儲2-RAID與智能存儲_第3頁
網(wǎng)絡(luò)存儲2-RAID與智能存儲_第4頁
網(wǎng)絡(luò)存儲2-RAID與智能存儲_第5頁
已閱讀5頁,還剩108頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、網(wǎng)絡(luò)存儲網(wǎng)絡(luò)存儲北京郵電大學計算機學院體系結(jié)構(gòu)中心姚文斌2021-7-311數(shù)據(jù)保護:RAID2021-7-312簡介簡介l服務(wù)器硬盤設(shè)置l什么是RAID ?lRAID 技術(shù)的實現(xiàn)lRAID分級 lRAID數(shù)據(jù)恢復(fù) lRAID實例2021-7-313服務(wù)器硬盤設(shè)置服務(wù)器硬盤設(shè)置(Hard Disk Infrastructure)lSLED (Single Large Expensive Drive)單個大容量硬盤lJBOD (Just a Bunch Of Disks )串聯(lián)硬盤l不同的物理硬盤被映射到不同的邏輯卷上l不同的物理硬盤被串聯(lián)起來形成一個虛擬盤e.g. Mac OS X 10.4,

2、 Microsofts Windows Home ServerlRAID (Redundant Array of Independent Disks) 冗余磁盤陣列e.g.主流服務(wù)器的硬盤設(shè)置2021-7-3142021-7-315l為什么需要磁盤陣列?為什么需要磁盤陣列?磁盤陣列磁盤陣列 磁盤陣列是把多個磁盤組成一個陣列磁盤陣列是把多個磁盤組成一個陣列,當作單一當作單一磁盤使用磁盤使用,它將數(shù)據(jù)以分段它將數(shù)據(jù)以分段(striping)的方式儲存在不的方式儲存在不同的磁盤中同的磁盤中,存取數(shù)據(jù)時存取數(shù)據(jù)時,陣列中的相關(guān)磁盤一起動作陣列中的相關(guān)磁盤一起動作,大幅降低數(shù)據(jù)的存取時間大幅降低數(shù)據(jù)的存

3、取時間,同時有更佳的空間利用率。同時有更佳的空間利用率。 2021-7-316l什么是磁盤陣列?什么是磁盤陣列?磁盤陣列磁盤陣列 磁盤陣列是一種把若干硬磁盤驅(qū)動器按照一定要求磁盤陣列是一種把若干硬磁盤驅(qū)動器按照一定要求組成一個整體,整個磁盤陣列由陣列控制器管理的系統(tǒng)組成一個整體,整個磁盤陣列由陣列控制器管理的系統(tǒng)。 2021-7-317l磁盤陣列的特點磁盤陣列的特點l存取速度快;存取速度快;l具備容錯具備容錯(fault tolerance)能力,即安全性;能力,即安全性;l有效的利用磁盤空間;有效的利用磁盤空間;l盡量的平衡盡量的平衡CPU,內(nèi)存及磁盤的性能差異,以提高電腦的整,內(nèi)存及磁盤的

4、性能差異,以提高電腦的整體工作性能。體工作性能。磁盤陣列磁盤陣列2021-7-318l什么是冗余磁盤陣列技術(shù)?什么是冗余磁盤陣列技術(shù)?磁盤陣列磁盤陣列 RAID (Redundant Array of Independent Disks)冗余磁盤陣列技術(shù),冗余磁盤陣列技術(shù),1987年由加州大學伯克利分校提出,最初的研制目的是為了組合小的廉價磁盤年由加州大學伯克利分校提出,最初的研制目的是為了組合小的廉價磁盤來代替大的昂貴磁盤,以降低大批量數(shù)據(jù)存儲的費用(來代替大的昂貴磁盤,以降低大批量數(shù)據(jù)存儲的費用(RAID稱為稱為Redundant Array of Inexpensive Disks 廉價

5、的磁盤陣列),同時也希望采用冗余信息的廉價的磁盤陣列),同時也希望采用冗余信息的方式,使得磁盤失效時不會使對數(shù)據(jù)的訪問受損失,從而開發(fā)出一定水平的數(shù)方式,使得磁盤失效時不會使對數(shù)據(jù)的訪問受損失,從而開發(fā)出一定水平的數(shù)據(jù)保護技術(shù)。據(jù)保護技術(shù)。 l常用的常用的RAIDRAID磁盤陣列數(shù)據(jù)根據(jù)不同的校驗方式,分為磁盤陣列數(shù)據(jù)根據(jù)不同的校驗方式,分為0 0、1 1、3 3、5 5、0+10+1五種等級(五種等級(RAID LevelsRAID Levels)。)。RAID的實現(xiàn)的實現(xiàn)軟件軟件RAID硬件硬件RAID例子:0.90 RAID layer (Linux-2.2,Linux-2.4 核心)h

6、ttp://HOWTO/Software-RAID-HOWTO.htmlRAID卡 (基于主機)外部RAID控制器 (基于磁盤陣列)優(yōu)點:成本低 (隨操作系統(tǒng))優(yōu)點:對主機CPU性能影響小,靈活性高缺點:RAID相關(guān)運算影響CPU性能不支持所有RAID級別與操作系統(tǒng)捆綁,缺乏靈活性。缺點:貴2021-7-319簡介簡介l服務(wù)器硬盤設(shè)置l什么是RAID ?lRAID 技術(shù)的實現(xiàn)lRAID分級 lRAID數(shù)據(jù)恢復(fù) lRAID實例2021-7-3110RAID分級分級 lRAID分級取決于三個因素:分級取決于三個因素:l分條分條Stripingl數(shù)據(jù)鏡像數(shù)據(jù)鏡像Mirroringl奇

7、偶校驗奇偶校驗 Parity( Error Correction )2021-7-3111RAID分級分級分條分條l分條Striping: 將數(shù)據(jù)分散到不同物理硬盤上,使讀寫數(shù)據(jù)時可以同時訪問多塊硬盤。 2021-7-3112RAID分級數(shù)據(jù)鏡像分級數(shù)據(jù)鏡像l數(shù)據(jù)鏡像Mirroring:將同一數(shù)據(jù)寫在兩塊不同硬盤上,從而產(chǎn)生該數(shù)據(jù)兩個副本。 2021-7-3113RAID分級分級奇偶校驗奇偶校驗l奇偶校驗Parity (Error Correction ):通過數(shù)學方法而不是單純重復(fù)寫同樣數(shù)據(jù)來實現(xiàn)數(shù)據(jù)保護。 e.g. 獨立磁盤奇偶校驗:校驗信息單獨存在磁盤上,一旦出現(xiàn)磁盤損壞,用校驗值減去其

8、它磁盤上對應(yīng)位置的值,就能找回數(shù)據(jù)。2021-7-3114檢錯和糾錯編碼的基本原理檢錯和糾錯編碼的基本原理l編碼是指在一個所有可能的字集W中(或符號集中),只有其中的一個子集C代表有效信息。這個有效子集稱為碼字集。海明距離的提出海明距離的提出-1l一位碼表示信息:信息U用“1”表示,信息V用“0”表示l無法檢測錯誤l二位碼表示信息:A=“11”,B=“00”,可能的組合是“00,01,10,11”。這四個碼的集是W,碼字集為C=A+B。由此可知,C的編碼規(guī)則是“兩位相等”。l可以檢測單位錯,不能檢測兩位錯l不能糾錯海明距離的提出海明距離的提出-2l三位碼表示信息:W=“000,001,010,

9、011,100,101,110,111”,C=“000,111”l可以檢測一位錯,l可以檢測二位錯l糾正一位錯l四位碼表示信息:W=“0000,0001,0010,0011,0100,0101,0110,0111,1000,1001,1010,1011,1100,1101,1110,1111”,C=“0000,1111”l可以檢測一位錯l可以檢測二位錯l可以檢測三位錯l可以糾正一位錯海明距離的提出海明距離的提出-具體分析具體分析1l可以檢測一位錯l任意兩個碼對應(yīng)的相異的位數(shù)為2海明距離的提出海明距離的提出-具體分析具體分析2l可以檢測一位錯,部分錯誤碼可以糾正l任意兩個碼對應(yīng)的相異的位數(shù)為2海

10、明距離的提出海明距離的提出-具體分析具體分析3l可以檢測一位錯,可以糾正一位錯l任意兩個碼對應(yīng)的相異的位數(shù)為3n在所有合格碼的集合中,兩個碼之間對應(yīng)位相異的位數(shù)以及代碼分布,決定了該編碼技術(shù)的檢錯和糾錯能力。n這就是海明距離所要研究的內(nèi)容海明距離海明距離-1l兩個代碼對應(yīng)位不同的位數(shù)稱為海明距離,簡稱為碼距,用D表示l有兩個n位代碼:A=anan-1 a1, B=bnbn-1 b1,則有l(wèi)在一個多代碼的碼系里,所有兩個代碼鍵的碼距最小值稱為最小碼距,用Dmin表示niiiiibabaBAD1)(),(海明距離海明距離-2l海明距離 編碼檢錯和糾錯能力的理論依據(jù)在n位代碼中,如果要求能檢測出e位

11、錯,則如果要求能糾正n位代碼的t位錯,則如果要求對n位代碼能檢測e位錯,糾正t位錯1min eD12min tD1minteD2021-7-31231111)(1)(aaaaAPaaaaAPinninn奇校驗偶校驗l按照代碼中“1”的格式保持為奇數(shù)或偶數(shù)為基準的編碼技術(shù)稱為奇偶編碼l如果在一個代碼上增加一定數(shù)量的冗余位之后,使所有位“1”的個數(shù)為奇數(shù),則稱此碼為奇校驗碼l如果“1”的個數(shù)為偶數(shù),則稱為偶校驗碼)(1234APaaaafn奇偶檢測器l代價:二多種奇偶校驗方案n交織奇偶校驗n可以檢出多位錯n對全0全1錯有很高的覆蓋率n適合對于總線和存儲器的檢測l代價:n片交織奇偶校驗n檢測多位錯n

12、可用于控制信號的檢測n代價:n片組交織奇偶校驗n將錯誤定位在芯片上n代價 數(shù)據(jù)冗余:h/b 校驗樹的數(shù)目:h 校驗樹的位數(shù):h+1 檢測延遲:) 1(log2hn水平-垂直奇偶校驗碼n可以檢測多位錯n可以檢測一定數(shù)量個偶數(shù)位錯n加法運算中的奇偶預(yù)測n執(zhí)行A+B=Y運算,選用偶校驗n加法的奇偶預(yù)測示意圖奇校驗與偶校驗的比較(代碼中包括校驗位)l奇偶校驗是一種簡單易行的監(jiān)測方法,其覆蓋率比較高。目前比較多地應(yīng)用到存儲器的代碼檢測上,也有計算機用奇偶校驗來檢測總線錯。RAID分級分級lRAID0 單純依靠分條提高I/O性能,無數(shù)據(jù)保護。適用 :I/O量大但不需要數(shù)據(jù)保護的應(yīng)用 e.g.圖像處理 20

13、21-7-3138RAID分級分級lRAID1 通過數(shù)據(jù)鏡像提升容錯性。同一數(shù)據(jù)寫在不同硬盤上??梢猿惺芤粔K甚至幾塊硬盤同時壞掉,但不優(yōu)化讀取性能。l適用 :數(shù)據(jù)安全可靠性要求非常高的應(yīng)用 e.g. 人事會計系統(tǒng) 2021-7-3139RAID分級分級lRAID01鏡像的分條。數(shù)據(jù)鏡像的分條。數(shù)據(jù)先被分條,再鏡像,一旦一塊硬先被分條,再鏡像,一旦一塊硬盤壞掉,級數(shù)下降成盤壞掉,級數(shù)下降成RAID0,恢,恢復(fù)起來較復(fù)起來較RAID1+0麻煩麻煩 。v RAID10分條的鏡像。數(shù)據(jù)分條的鏡像。數(shù)據(jù)先被鏡像,再分條,數(shù)據(jù)恢復(fù)簡先被鏡像,再分條,數(shù)據(jù)恢復(fù)簡單,迅速。單,迅速。2021-7-3140RA

14、ID分級分級lRAID2 帶海明碼的RAID(超算中應(yīng)用較多,不做詳細討論。)2021-7-3141ECC校驗校驗lECC一般每256字節(jié)原始數(shù)據(jù)生成3字節(jié)ECC校驗數(shù)據(jù),這三字節(jié)共24比特分成兩部分:6比特的列校驗和16比特的行校驗,多余的兩個比特置1。2021-7-3142ECC容錯能力容錯能力2021-7-3143將從OOB區(qū)中讀出的原ECC校驗和新ECC校驗和按位異或,若結(jié)果為0,則表示不存在錯(或是出現(xiàn)了ECC無法檢測的錯誤);若3個字節(jié)異或結(jié)果中存在11個比特位為1,表示存在一個比特錯誤,且可糾正;若3個字節(jié)異或結(jié)果中只存在1個比特位為1,表示OOB區(qū)出錯;其他情況均表示出現(xiàn)了無法

15、糾正的錯誤RAID分級分級lRAID3 通過分條提高性能,利用奇偶校驗提升容錯性通過分條提高性能,利用奇偶校驗提升容錯性。在存儲普通的信息的硬盤以外,。在存儲普通的信息的硬盤以外, 用一塊專門的硬盤存儲用一塊專門的硬盤存儲校驗信息校驗信息 。2021-7-3144RAID分級分級lRAID4 通過分條提高性能,利用奇偶校驗提升容錯性通過分條提高性能,利用奇偶校驗提升容錯性。在存儲普通的信息的硬盤以外,。在存儲普通的信息的硬盤以外, 用一塊專門的硬盤存儲用一塊專門的硬盤存儲校驗信息。校驗信息。但允許某一數(shù)據(jù)單元(但允許某一數(shù)據(jù)單元(block)可以從單塊磁盤)可以從單塊磁盤中讀寫,而無需訪問整個

16、條帶,所以數(shù)據(jù)讀取的速度高。中讀寫,而無需訪問整個條帶,所以數(shù)據(jù)讀取的速度高。 2021-7-3145RAID分級分級lRAID5 通過分條提高性能,利用奇偶校驗提升容錯性。允許某通過分條提高性能,利用奇偶校驗提升容錯性。允許某一數(shù)據(jù)單元(一數(shù)據(jù)單元(block)可以從單塊磁盤中讀寫,而無需訪問整個條帶)可以從單塊磁盤中讀寫,而無需訪問整個條帶。校驗信息分布在所有磁盤上。比。校驗信息分布在所有磁盤上。比RAID4寫性能好,容易恢復(fù)。寫性能好,容易恢復(fù)。2021-7-3146RAID分級分級lRAID6基本與基本與RAID5一樣,但引入第二校驗元素應(yīng)對兩塊磁盤一樣,但引入第二校驗元素應(yīng)對兩塊磁盤

17、同時失效的情況。兩個獨立的奇偶系統(tǒng)使用不同的算法,數(shù)據(jù)的可靠同時失效的情況。兩個獨立的奇偶系統(tǒng)使用不同的算法,數(shù)據(jù)的可靠性非常高,即使兩塊磁盤同時失效也不會影響數(shù)據(jù)的使用。寫代價也性非常高,即使兩塊磁盤同時失效也不會影響數(shù)據(jù)的使用。寫代價也因此比因此比RAID5高,恢復(fù)也比高,恢復(fù)也比RAID5耗時長。耗時長。2021-7-3147RAID比較比較RAID最少磁盤數(shù)最少磁盤數(shù)磁盤利用率磁盤利用率開銷開銷讀性能讀性能(較單磁盤)(較單磁盤)寫性能寫性能(較單磁盤)(較單磁盤)數(shù)據(jù)恢復(fù)時間數(shù)據(jù)恢復(fù)時間RAID02100低低很好很好很好很好N/ARAID1250高高較好較好較好較好快快RAID33n

18、-1/n中中隨機讀較好隨機讀較好順序讀很好順序讀很好較好較好較好較好RAID43n-1/n中中隨機讀很好隨機讀很好順序讀較好順序讀較好較好較好較好較好RAID53n-1/n中中隨機讀很好隨機讀很好順序讀較好順序讀較好較好較好優(yōu)于優(yōu)于RAID3,RAID4,RAID6RAID64n-2/n中中隨機讀很好隨機讀很好順序讀較好順序讀較好較好較好較快較快RAID10RAID01450%高高很好很好較好較好快快* n為磁盤數(shù)目為磁盤數(shù)目2021-7-3148RAID動畫展示動畫展示lraid.exe2021-7-3149簡介簡介l服務(wù)器硬盤設(shè)置l什么是RAID ?lRAID 技術(shù)的實現(xiàn)lRAID分級 l

19、RAID數(shù)據(jù)恢復(fù) lRAID實例2021-7-3150數(shù)據(jù)恢復(fù)數(shù)據(jù)恢復(fù) 熱備份(熱備份(Hot Spare)l熱備份指的是RAID陣列中用于臨時替代RAID集中故障硬盤的備用硬盤(一個陣列中可以有多個熱備用盤),熱備可以設(shè)置為自動自動或用戶發(fā)起。不同RAID使用不同方法從熱備中恢復(fù)數(shù)據(jù):l如果采用校驗RAID,則按照RAID集中的校驗值和幸存盤上的數(shù)據(jù)重建 l如果采用鏡像RAID,則從存活鏡像上復(fù)制數(shù)據(jù) 2021-7-3151數(shù)據(jù)恢復(fù)數(shù)據(jù)恢復(fù) 熱拔插熱拔插 (Hot Plug )l熱拔插指在使用數(shù)據(jù)保護性RAID陣列時,在開機狀況下用新硬盤替換原來的故障硬盤。即在開機狀況拔出故障硬盤,安裝新硬

20、盤。2021-7-3152簡介簡介l服務(wù)器硬盤設(shè)置l什么是RAID ?lRAID 技術(shù)的實現(xiàn)lRAID分級 lRAID數(shù)據(jù)恢復(fù) lRAID實例2021-7-3153RAID實例實例RAID卡卡需要考慮:需要考慮:主板兼容性主板兼容性RAID控制器性能控制器性能磁盤接口磁盤接口支持支持RAID級別級別HighPoint Rocket SATA RAID 3120 帶Input/Output Processor,128MB DDR II內(nèi)存。2個SATA接口,可支持2個硬盤的RAID 0,1,JBOD。品牌品牌:AdaptecHighpointLSI Logic2021-7-3154RAID實例實

21、例RAID卡卡RAID通常支持通常支持RAID級別級別價格價格性能性能SCSI RAIDSAS RAIDRAID0到到RAID6高高100硬件硬件RAID接口速度快:接口速度快:160MBps-320Mbps有獨立控制芯片,低主機有獨立控制芯片,低主機CPU占占用率,用率,支持熱拔插,在線擴展,后臺初支持熱拔插,在線擴展,后臺初始化始化SATA RAID RAID0到到RAID6中中磁盤讀寫不如磁盤讀寫不如SCSI RAID,支持熱拔插支持熱拔插IDE RAIDRAID0, RAID1低低 SCSI30%50硬件硬件 50軟件軟件RAID有獨立控制芯片,但只包括簡單有獨立控制芯片,但只包括簡單

22、操作,高主機操作,高主機CPU占用率占用率不支持熱拔插,在線擴展,后臺不支持熱拔插,在線擴展,后臺初始化初始化注:注: SCSI, IDE, SATA, SAS為磁盤驅(qū)動接口,將在第五講直接儲存中進一步介紹。為磁盤驅(qū)動接口,將在第五講直接儲存中進一步介紹。2021-7-3155RAID實例配置實例配置陣列通常是通過磁盤陣列卡的 BIOS工具進行配置。例子:在HP服務(wù)器上,用五塊磁盤建立RAID5和一個熱備盤。開機啟動2021-7-3156RAID實例配置實例配置出現(xiàn)如下菜單時按F8,進入陣列配置菜單2021-7-3157RAID實例配置實例配置進入Create Logical Drive菜單2

23、021-7-3158RAID實例配置實例配置四塊硬盤raid5的建立:同時選中4塊硬盤,建成raid5。2021-7-3159RAID實例配置實例配置當確認配置完畢后,按enter鍵確認,再按F8鍵保存配置2021-7-3160RAID實例配置實例配置按回車,再次進入Create Logical Drive菜單2021-7-3161RAID實例配置實例配置熱備盤建立:選擇最后一塊硬盤,建成熱備。2021-7-3162RAID實例配置實例配置當確認配置完畢后,按enter鍵確認,再按F8鍵保存配置2021-7-3163系統(tǒng)可靠性的數(shù)學模型系統(tǒng)可靠性的數(shù)學模型l一個計算機系統(tǒng)是由許多個子系統(tǒng)組成的

24、,而一個子系統(tǒng)則由大量的元、器件所組成。為了定量的得出系統(tǒng)的可靠度,一般從元器件的可靠度到子系統(tǒng)的可靠度,進而到整個系統(tǒng)的可靠度。因此根據(jù)系統(tǒng)與系統(tǒng)內(nèi)部的各子系統(tǒng)的相互關(guān)系建立可靠度的數(shù)學模型十分必要的。n可靠性框圖與邏輯框圖n一、串聯(lián)可靠性系統(tǒng)的可靠性模型niistRtR1)()()()(tRtRisniis1niisMTBF111 可見,串聯(lián)系統(tǒng)平均無故障運行時間小于子系統(tǒng)的平均無故障運行時間n考慮一種特殊情況)()()(.)()(021tRtRtRtRtRninMTBFnMTBFnetRtRsstnns00001)()(0n二、并聯(lián)可靠性系統(tǒng)可靠性模型niiStRtR1)(1 1)()(

25、)(tRtRiSn考慮一種特殊情況tnietRtRtRtRtR0)()()(.)()(021ntnsetRtR)1 (1)(11)(0001100)1(1)(MTBFiidttRMTBFniniSSn假設(shè)一個系統(tǒng)由兩個子系統(tǒng)組成,即n=2nMTBF提高了1.5倍00123)1(MTBFiMTBFniSn三、串、并聯(lián)混合系統(tǒng)可靠性模型可分為三種形式n串-并聯(lián)可靠性系統(tǒng)n并-串聯(lián)可靠性系統(tǒng)n復(fù)雜的可靠性系統(tǒng)n1、串-并聯(lián)可靠性系統(tǒng)minjijStRtR11)(11)(n若各模塊可靠度相等mnSijtRtRtRtR)(11)()()(00n2、并-串聯(lián)可靠性系統(tǒng)njmiijStRtR11)(11)(

26、l若各模塊可靠度相等nmSijtRtRtRtR)(11)()()(00n串并聯(lián)與并串聯(lián)系統(tǒng)的可靠度比較nn=m=2Ra0.95串串-并聯(lián)并聯(lián)Rs0.7390.8700.9630.991并并-串聯(lián)串聯(lián)Rs0.8280.9210.980.995Fault Detection&IsolationFault Detection&IsolationFault Detection&IsolationFault Detection&IsolationRedundantI/ORedundantCPU/Memoryn3、復(fù)雜的可靠性系統(tǒng)nStratus nftserver 2300n可靠性框圖

27、2)1 (1IOCMRRRn結(jié)構(gòu)改進:邏輯結(jié)構(gòu)Fault Detection&IsolationFault Detection&IsolationFault Detection&IsolationFault Detection&Isolationn分解計算n1、Switch失效)1()1 (1 21SIOCMRRRRn分解計算n2、Switch正常工作n分解計算n2、Switch正常工作SIOCMRRRR)1 (1)1 (1 222n綜合計算SIOCMSIOCMRRRRRRRRR)1 (1)1 (1 )1()1 (1 22221RAID開放性思考問題開放性思考問題(作業(yè)作業(yè))l 有了RAID我

28、們還需要備份系統(tǒng)嗎?l說明RAID0+1和RAID1+0誰更好(以4塊具有相同可靠度硬盤為例說明)?l在什么情況下RAID10比RAID5更適用?l我們還可以如何提高RAID的性能?2021-7-3186智能存儲系統(tǒng)智能存儲系統(tǒng)2021-7-3187概述概述l關(guān)鍵性的業(yè)務(wù)應(yīng)用對性能、可用性、安全性以及可擴展性都有很高的要求。l硬盤是存儲的核心組成部分,決定了存儲系統(tǒng)的性能。lRAID技術(shù)的出現(xiàn)很大程度提升了存儲系統(tǒng)的性能和可靠性。然而,單靠硬盤仍然無法滿足應(yīng)用需求。l智能存儲系統(tǒng)是一種功能豐富的RAID陣列,提供了高度優(yōu)化的I/O處理能力。2021-7-3188智能存儲系統(tǒng)的組成智能存儲系統(tǒng)的

29、組成l四個核心部分:前端、緩存、后端、物理磁盤l一個來自主機的I/O請求首先到達前端端口,然后經(jīng)過緩存和后端的處理,最終在物理磁盤上存儲或獲取數(shù)據(jù)。如果被請求的數(shù)據(jù)已經(jīng)保存在緩存中,那么請求可以直接在緩存中完成。2021-7-3189前端前端l前端提供了存儲系統(tǒng)與主機之間的接口l它由兩部分組成:前端端口和前端控制器l每個前端端口都擁有相應(yīng)傳輸協(xié)議的處理邏輯,這些協(xié)議包括:lSCSI、FC、iSCSI等l為了獲取更高的可用性,一般在前端提供冗余的端口l前端控制器通過內(nèi)部數(shù)據(jù)總線把數(shù)據(jù)傳入緩存或從緩存?zhèn)鞒鰯?shù)據(jù)l當緩存收到寫入的數(shù)據(jù)后,控制器向主機發(fā)出一個應(yīng)答消息??刂破饔妹铌犃兴惴▉韮?yōu)化I/O處

30、理。2021-7-3190前端命令隊列前端命令隊列l(wèi)前端命令隊列在前端控制器上實現(xiàn)l控制器對收到的命令的執(zhí)行順序進行決策,以減少不必要的驅(qū)動器磁頭移動,改善磁盤性能。l有了命令隊列,就可以根據(jù)數(shù)據(jù)在磁盤上的組織方式并發(fā)的執(zhí)行命令,而不是按照這些命令的達到順序執(zhí)行。2021-7-3191命令隊列算法命令隊列算法l先進先出算法(First In First Out, FIFO)l從性能角度看它是最差的l尋道時間優(yōu)化算法l訪問時間優(yōu)化算法2021-7-3192高速緩存高速緩存l緩存是智能存儲系統(tǒng)用來提高I/O性能的重要環(huán)節(jié)l緩存是半導(dǎo)體存儲器l為了減少完成主機I/O請求所需的時間,數(shù)據(jù)被暫存在緩存中

31、l物理磁盤是智能存儲系統(tǒng)中最慢的組件,緩存可以將主機與磁盤的機械延遲隔離開,從而提升系統(tǒng)的性能2021-7-3193帶有緩存的讀操作帶有緩存的讀操作l每當主機發(fā)出一個讀請求,前端控制器會通過查詢請求的數(shù)據(jù)是否保存在緩存中。l如果在緩存中找到請求的數(shù)據(jù),則發(fā)生一次讀緩存命中,數(shù)據(jù)被直接送到主機,無需任何磁盤操作。l如果沒有在緩存中找到請求數(shù)據(jù),稱為發(fā)生了一次緩存未命中,數(shù)據(jù)必須從硬盤讀取。2021-7-3194帶有緩存的讀操作帶有緩存的讀操作l后端控制器負責訪問相應(yīng)的磁盤并讀取請求的數(shù)據(jù)。隨后,數(shù)據(jù)被保存到緩存中并最終通過前端控制器送到主機。l緩存未命中增加了I/O響應(yīng)時間。2021-7-319

32、5Pre-readl如果讀請求是順序的,可以采用預(yù)取或者稱為預(yù)讀的算法。l這一過程顯著的減少了主機的響應(yīng)時間l讀命中率的提高帶來性能上的提升2021-7-3196帶有緩存的寫操作帶有緩存的寫操作l帶有緩存的寫操作提供了比直接寫磁盤更好的性能。l一個I/O被寫入緩存并得到響應(yīng)比直接寫入磁盤所用的時間要少得多。l多個小的順序?qū)懖僮骺梢员缓喜⒊纱蟮膶懖僮?,在有緩存的情況下使得我們有機會對順序?qū)懖僮髯鰞?yōu)化。2021-7-3197帶有緩存的寫操作的實現(xiàn)帶有緩存的寫操作的實現(xiàn)l回寫緩存l數(shù)據(jù)被存入緩存,主機立即得到響應(yīng)。一段時間后多個寫操作的數(shù)據(jù)被一起提交到磁盤。l如果遇到故障,未被提交的數(shù)據(jù)有丟失的風險

33、l直接寫緩存l數(shù)據(jù)被存入緩存并立即寫到磁盤中l(wèi)因為需要磁盤操作,寫響應(yīng)時間比較長2021-7-3198跳過緩存寫的情況跳過緩存寫的情況l在特定的情況下緩存可以被跳過l比如要寫入極大量的數(shù)據(jù)時。這時,如果一個I/O請求的大小超過了預(yù)先定義的值(稱為寫旁入大?。瑢懭氩僮鞅恢苯影l(fā)送到磁盤以防這些寫入占用大量的緩存區(qū)域。l有限的緩存要用在小的、隨機的I/O訪問中,這樣才更有效。l好鋼用在刀刃上2021-7-3199緩存實現(xiàn)緩存實現(xiàn)l緩存實現(xiàn)分為專用緩存和全局緩存l專用緩存:讀操作和寫操作分別使用單獨的內(nèi)存l全局緩存:讀寫操作都可以使用任意空閑的內(nèi)存l全局緩存的管理更有效率,因為只需管理一組全局的地址

34、2021-7-31100緩存管理緩存管理l緩存是昂貴、有限的資源,需要合適的管理l緩存管理算法l最近最少訪問算法(Least Recently Used, LRU)l假設(shè):如果一個頁面剛剛被訪問過了,它就不太可能再被訪問l最近最多訪問算法(Most Recently Used, MRU)l假設(shè):如果一個頁面剛剛被訪問過了,它還可能被經(jīng)常訪問2021-7-31101緩存數(shù)據(jù)保護緩存數(shù)據(jù)保護l緩存是易失性存儲器,電源故障或者其他緩存故障都會使得還沒有來得及保存到磁盤上的數(shù)據(jù)丟失。l保護方法l電池供電:將緩存中的數(shù)據(jù)保存到磁盤l緩存鏡像:在互相獨立的內(nèi)存條不同位置保存兩份l緩存跳躍:用一組物理硬盤在

35、停電時轉(zhuǎn)存緩存中的數(shù)據(jù)?;謴?fù)供電時,數(shù)據(jù)從轉(zhuǎn)存磁盤讀到緩存,再寫回對應(yīng)的磁盤中。2021-7-31102后端后端l后端提供了緩存和物理磁盤之間的接口l兩部分組成:后端端口和后端控制器l后端控制器在做讀寫操作時與磁盤進行交流,同時也提供有限的、臨時的數(shù)據(jù)存儲。l磁盤端口冗余可以進一步增強可靠性l情況罕見2021-7-31103物理磁盤物理磁盤lSCSIlFClIDE/ATAlSASlSATA2021-7-31104固態(tài)驅(qū)動器固態(tài)驅(qū)動器l固態(tài)硬盤的存儲介質(zhì)分為兩種l一種是采用閃存(FLASH芯片)作為存儲介質(zhì)l另外一種是采用DRAM作為存儲介質(zhì)(需要獨立電源來保護數(shù)據(jù)安全)l沒有機械運動部件l帶來

36、了更短的響應(yīng)時間和更低的電量消耗l在陣列中,閃存存儲器存儲1TB的數(shù)據(jù)消耗的能量比傳統(tǒng)磁盤驅(qū)動器少38%l30個15K轉(zhuǎn)速的FC盤才能達到一個閃存驅(qū)動器的性能l在性能相同的情況下,閃存驅(qū)動器能節(jié)能98%2021-7-31105SSDl固態(tài)硬盤的優(yōu)點固態(tài)硬盤的優(yōu)點1.啟動快2.不用磁頭,快速隨機讀取,讀延遲極小3.相對固定的讀取時間4.基于DRAM的固態(tài)硬盤寫入速度極快5.無噪音6.能耗和發(fā)熱量較低7.內(nèi)部不存在任何機械活動部件,不會發(fā)生機械故障,也不怕碰撞、沖擊、振動8.工作溫度范圍更大9.體積小、重量輕l固態(tài)硬盤的缺點固態(tài)硬盤的缺點1.成本高。每單位容量價格是傳統(tǒng)硬盤的510倍(基于閃存),

37、甚至200300倍(基于DRAM)。2.容量低3.易受到某些外界因素的不良影響。如斷電(基于DRAM的固態(tài)硬盤尤甚)、磁場干擾、靜電等。4.寫入壽命有限(基于閃存)5.數(shù)據(jù)損壞后難以恢復(fù)6.基于DRAM的固態(tài)硬盤在任何時候的能耗都高于傳統(tǒng)硬盤2021-7-31106邏輯單元編號邏輯單元編號l邏輯單元編號:Logical Unit Number, LUNl物理驅(qū)動器或一組RAID保護的驅(qū)動器可以被分為若干個邏輯卷,這些邏輯卷用LUN統(tǒng)一尋址。l一個邏輯設(shè)備實際上是RAID組中的一個分區(qū),但卻被主機看作是一個物理磁盤。l在RAID情況下,這些邏輯設(shè)備是RAID組的一部分,分布在所有屬于該RAID組的磁盤上。lLU

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論