磁盤陣列整理手冊(打?。?doc_第1頁
磁盤陣列整理手冊(打?。?doc_第2頁
磁盤陣列整理手冊(打?。?doc_第3頁
磁盤陣列整理手冊(打?。?doc_第4頁
磁盤陣列整理手冊(打?。?doc_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

磁盤陣列相關(guān)參考資料一、磁盤陣列綜述2二、磁盤陣列進化歷程3三、硬件陣列、軟件陣列、物理硬盤、邏輯硬盤4四、磁盤陣列原理54.1 raid 064.2 raid 174.3 raid 294.4 raid 394.5 raid 4104.6 raid 5114.7 raid 10124.8 raid 30134.9 raid 5013五、raid對比14六、選擇raid級別的方法流程15七、磁盤陣列的額外容錯功能:spare or standby driver15八、硬件磁盤陣列與軟件磁盤陣列16九、ide磁盤陣列與scsi磁盤陣列16十、磁盤陣列卡與磁盤陣列控制器17十一、服務(wù)器的raid卡及服務(wù)器硬盤17111 服務(wù)器raid卡17112 服務(wù)器硬盤18十二、raid5建立過程(軟模式)20一、磁盤陣列綜述二、磁盤陣列進化歷程目前改進磁盤存取速度的的方式主要有兩種。一是磁盤快取控制(disk cache controller),它將從磁盤讀取的數(shù)據(jù)存在快取內(nèi)存(cache memory)中以減少磁盤存取的次數(shù),數(shù)據(jù)的讀寫都在快取內(nèi)存中進行,大幅增加存取的速度,如要讀取的數(shù)據(jù)不在快取內(nèi)存中,或要寫數(shù)據(jù)到磁盤時,才做磁盤的存取動作。這種方式在單工環(huán)境(single-tasking environment)如dos之下,對大量數(shù)據(jù)的存取有很好的性能(量小且頻繁的存取則不然),但在多工(multi-tasking)環(huán)境之下(因為要不停的作數(shù)據(jù)交換(swapping)的動作)或數(shù)據(jù)庫(database)的存取(因為每一記錄都很小)就不能顯示其性能。這種方式?jīng)]有任何安全保障。 其二是使用磁盤陣列的技術(shù)。磁盤陣列是把多個磁盤組成一個陣列,當(dāng)作單一磁盤使用,它將數(shù)據(jù)以分段(striping)的方式儲存在不同的磁盤中,存取數(shù)據(jù)時,陣列中的相關(guān)磁盤一起動作,大幅減低數(shù)據(jù)的存取時間,同時有更佳的空間利用率。磁盤陣列所利用的不同的技術(shù),稱為raid level,不同的level針對不同的系統(tǒng)及應(yīng)用,以解決數(shù)據(jù)安全的問題。一般高性能的磁盤陣列都是以硬件的形式來達(dá)成,進一步的把磁盤快取控制及磁盤陣列結(jié)合在一個控制器(raid controller)或控制卡上,針對不同的用戶解決人們對磁盤輸出入系統(tǒng)的四大要求:(1)增加存取速度,(2)容錯(fault tolerance),即安全性(3)有效的利用磁盤空間;(4)盡量的平衡cpu,內(nèi)存及磁盤的性能差異,提高電腦的整體工作性能。三、硬件陣列、軟件陣列、物理硬盤、邏輯硬盤3.1 硬件陣列3.2 軟件陣列3.3 物理硬盤物理硬盤既是物理驅(qū)動器,目前所提供的硬盤容量有9gb、18gb、36gb、72gb等3.4 邏輯硬盤邏輯硬盤由物理硬盤的一部分或幾個物理硬盤結(jié)合在一起組成3.5 備注四、磁盤陣列原理磁盤陣列中針對不同的應(yīng)用使用的不同技術(shù),稱為raid level, raid是redundant array of inexpensive disks的縮寫,而每一level代表一種技術(shù),目前業(yè)界公認(rèn)的標(biāo)準(zhǔn)是raid 0raid 5。這個level并不代表技術(shù)的高低,level 5并不高于level 3,level 1也不低過level 4,至于要選擇那一種raid level的產(chǎn)品,純視用戶的操作環(huán)境(operating environment)及應(yīng)用(application)而定,與level的高低沒有必然的關(guān)系。raid 0及raid 1適用于pc及pc相關(guān)的系統(tǒng)如小型的網(wǎng)絡(luò)服務(wù)器(network server)及需要高磁盤容量與快速磁盤存取的工作站等,因為比較便宜,但因一般人對磁盤陣列不了解,沒有看到磁盤陣列對他們的價值,市場尚未打開;raid 2及raid 3適用于大型電腦及影像、cad/cam等處理;raid 5多用于oltp,因有金融機構(gòu)及大型數(shù)據(jù)處理中心的迫切需要,故使用較多而較有名氣,但也因此形成很多人對磁盤陣列的誤解,以為磁盤陣列非要raid 5不可;raid 4較少使用,因為兩者有其共同之處,而raid 4有其先天的限制。其他如raid 6,raid 7,乃至raid 10等,都是廠商各做各的,并無一致的標(biāo)準(zhǔn),在此不作說明。介紹各個raid level之前,先看看形成磁盤陣列的兩個基本技術(shù):譯為磁盤延伸,能確切的表示disk spanning這種技術(shù)的含義。如下圖所示,dftraid 磁盤陣列控制器,聯(lián)接了四個磁盤:這四個磁盤形成一個陣列(array),而磁盤陣列的控制器(raid controller)是將此四個磁盤視為單一的磁盤,如dos環(huán)境下的c:盤。這是disk spanning的意義,因為把小容量的磁盤延伸為大容量的單一磁盤,用戶不必規(guī)劃數(shù)據(jù)在各磁盤的分布,而且提高了磁盤空間的使用率。dftraid的scsi磁盤陣列更可連接幾十個磁盤,形成數(shù)十gb到數(shù)百gb的陣列,使磁盤容量幾乎可作無限的延伸;而各個磁盤一起作取存的動作,比單一磁盤更為快捷。很明顯的,有此陣列的形成而產(chǎn)生raid的各種技術(shù)。我們也可從上圖看出inexpensive(便宜)的意義,因為四個250mbbytes的磁盤比一個1gbytes的磁盤要便宜,尤其以前大磁盤的價格非常昴貴,但在磁盤越來越便宜的今天,inexpensive已非磁盤陣列的重點,雖然對于需要大磁盤容量的系統(tǒng),仍是考慮的要點。磁盤 因為磁盤陣列是將同一陣列的多個磁盤視為單一的虛擬磁盤(virtual disk),所以其數(shù)據(jù)是以分段(block or segment)的方式順序存放在磁盤陣列中,如下圖:磁盤0 磁盤1磁盤2磁盤3a0-a1b0-b1c0-c1d0-d1a2-a3b2-b3c2-c3d2-d3a4-a5b4-b5c4-c5d4-c5a6-a7b6-b7c6-c7d6-d7數(shù)據(jù)按需要分段,從第一個磁盤開始放,放到最後一個磁盤再回到第一個磁盤放起,直到數(shù)據(jù)分布完畢。至于分段的大小視系統(tǒng)而定,有的系統(tǒng)或以1kb最有效率,或以4kb,或以6kb,甚至是4mb或8mb的,但除非數(shù)據(jù)小于一個扇區(qū)(sector,即521bytes),否則其分段應(yīng)是512byte的倍數(shù)。因為磁盤的讀寫是以一個扇區(qū)為單位,若數(shù)據(jù)小于512bytes,系統(tǒng)讀取該扇區(qū)后,還要做組合或分組(視讀或?qū)懚?的動作,浪費時間。從上圖我們可以看出,數(shù)據(jù)以分段于在不同的磁盤,整個陣列的各個磁盤可同時作讀寫,故數(shù)據(jù)分段使數(shù)據(jù)的存取有最好的效率,理論上本來讀一個包含四個分段的數(shù)據(jù)所需要的時間約=(磁盤的access time +數(shù)據(jù)的transfer time)x4次,現(xiàn)在只要一次就可以完成。若以n表示磁盤的數(shù)目,r表示讀取,w表示寫入,s表示可使用空間,則數(shù)據(jù)分段的性能為:r:n(可同時讀取所有磁盤)w:n(可同時寫入所有磁盤)s:n(可利用所有的磁盤,并有最佳的使用率)4.1 raid 0 disk striping 也稱為raid 0, 很多人以為raid 0沒有甚么,其實這是非常錯誤的觀念,因為raid 0使磁盤的輸出入有最高的效率。而磁盤陣列有更好效率的原因除數(shù)據(jù)分段外,它可以同時執(zhí)行多個輸出入的要求,因為陣列中的每一個磁盤都能獨立動作,分段放在不同的磁盤,不同的磁盤可同時作讀寫,而且能在快取內(nèi)存及磁盤作并行存取(parallel access)的動作,但只有硬件的磁盤陣列才有此性能表現(xiàn)。從上面兩點我們可以看出,disk spanning定義了raid的基本形式,提供了一個便宜、靈活、高性能的系統(tǒng)結(jié)構(gòu),而disk striping解決了數(shù)據(jù)的存取效率和磁盤的利用率問題,raid 1至raid 5是在此基礎(chǔ)上提供磁盤安全的方案。沒有任何額外的磁盤或空間作安全準(zhǔn)備,所以一般人不重視它,這是誤解,其實它有最好的效率及空間利用率,對于追求效率的應(yīng)用,非常理想,可同時用其他的raid level或其他的備份方式以補其不足,保護重要的數(shù)據(jù)。4.2 raid 1raid 1是使用磁盤鏡像(disk mirroring)的技術(shù)。磁盤鏡像應(yīng)用在raid 1之前就在很多系統(tǒng)中使用,它的方式是在工作磁盤(working disk)之外再加一額外的備份磁盤(backup disk),兩個磁盤所儲存的數(shù)據(jù)完全一樣,數(shù)據(jù)寫入工作磁盤的同時亦寫入備份磁盤。磁盤鏡像不見得就是raid 1,如novell netware亦有提供磁盤鏡像的功能,但并不表示netware有了raid 1的功能。一般磁盤鏡像和raid 1有二點最大的不同:raid 1無工作磁盤和備份磁盤之分,多個磁盤可同時動作而有重疊(overlapping)讀取的功能,甚至不同的鏡像磁盤可同時作寫入的動作,這是一種最佳化的方式,稱為負(fù)載平衡(load-balance)。例如有多個用戶在同一時間要讀取數(shù)據(jù),系統(tǒng)能同時驅(qū)動互相鏡像的磁盤,同時讀取數(shù)據(jù),以減輕系統(tǒng)的負(fù)載,增加i/o的性能。raid 1的磁盤是以磁盤延伸的方式形成陣列,而數(shù)據(jù)是以數(shù)據(jù)分段的方式作儲存,因而在讀取時,它幾乎和raid 0有同樣的性能。從raid的結(jié)構(gòu)就可以很清楚的看出raid 1和一般磁盤鏡像的不同。下圖為raid 1,每一筆數(shù)據(jù)都儲存兩份磁盤0 磁盤1磁盤0磁盤1a0a2a4b1a1a3b0b2a0a2a4b1a1a3b0b2從上圖可以看出:r:n(可同時讀取所有磁盤)w:n/2(同時寫入磁盤數(shù))s:n/2(利用率)讀取數(shù)據(jù)時可用到所有的磁盤,充分發(fā)揮數(shù)據(jù)分段的優(yōu)點;寫入數(shù)據(jù)時,因為有備份,所以要寫入兩個磁盤,其效率是n/2,磁盤空間的使用率也只有全部磁盤的一半。很多人以為raid 1要加一個額外的磁盤,形成浪費而不看好raid 1,事實上磁盤越來越便宜,并不見得造成負(fù)擔(dān),況且raid 1有最好的容錯(fault tolerance)能力,其效率也是除raid 0之外最好的。我們可視應(yīng)用的不同,在同一磁盤陣列中使用不同的raid level,如華藝科技公司的dftraid系列都可同一磁盤陣列中定義八個邏輯磁盤(logic disk),分別使用不同的raid level,分為c:,d:及e:三個邏輯磁盤(或lun0,lun1,lun2).raid 1完全做到了容錯包括不停機(non-stop),當(dāng)某一磁盤發(fā)生故障,可將此磁盤拆下來而不影向其他磁盤的操作;待新的磁盤換上去之后,系統(tǒng)即時做鏡像,將數(shù)據(jù)重新復(fù)上去,raid 1在容錯及存取的性能上是所有raid level之冠。在磁盤陣列的技術(shù)上,從raid 1到raid 5,不停機的意思表示在工作時如發(fā)生磁盤故障,系統(tǒng)能持續(xù)工作而不停頓,仍然可作磁盤的存取,正常的讀寫數(shù)據(jù);而容錯則表示即使磁盤故障,數(shù)據(jù)仍能保持完整,可讓系統(tǒng)存取到正確的數(shù)據(jù),而scsi的磁盤陣列更可在工作中抽換磁盤,并可自動重建故障磁盤的數(shù)據(jù)。磁盤陣列之所以能做到容錯及不停機,是因為它有冗余的磁盤空間可資利用,這也就是redundant的意義。有最佳的安全性,100%不停機,即使有一個磁盤損壞也能照常作業(yè)而不影向其效能(對能并行存取的系統(tǒng)稍有影響),因為數(shù)據(jù)是作重復(fù)儲存。raid1的并行讀取幾乎有raid 0的性能,因為可同時讀取相互鏡像的磁盤;寫入也只比raid 0略遜,因為同時寫入兩個磁盤并沒有增加多少工作。雖然raid 1要增加一倍的磁盤做鏡像,但作為采用磁盤陣列的進入點,它是最便宜的一個方案,是新設(shè)磁盤陣列的用戶之最佳選擇。4.3 raid 2raid 2是把數(shù)據(jù)分散為位元(bit)或塊(block),加入海明碼hamming code,在磁盤陣列中作間隔寫入(interleaving)到每個磁盤中,而且地址(address)都一樣,也就是在各個磁盤中,其數(shù)據(jù)都在相同的磁道(cylinder or track)及扇區(qū)中。raid 2的設(shè)計是使用共軸同步(spindle synchronize)的技術(shù),存取數(shù)據(jù)時,整個磁盤陣列一起動作,在各作磁盤的相同位置作平行存取,所以有最好的存取時間(access time),其總線(bus)是特別的設(shè)計,以大帶寬(band wide)并行傳輸所存取的數(shù)據(jù),所以有最好的傳輸時間(transfer time)。在大型檔案的存取應(yīng)用,raid 2有最好的性能,但如果檔案太小,會將其性能拉下來,因為磁盤的存取是以扇區(qū)為單位,而raid 2的存取是所有磁盤平行動作,而且是作單位元的存取,故小于一個扇區(qū)的數(shù)據(jù)量會使其性能大打折扣。raid 2是設(shè)計給需要連續(xù)且大量數(shù)據(jù)的電腦使用的,如大型電腦(mainframe to supercomputer)、作影像處理或cad/cam的工作站(workstation)等,并不適用于一般的多用戶環(huán)境、網(wǎng)絡(luò)服務(wù)器(network server),小型機或pc。raid 2的安全采用內(nèi)存陣列(memory array)的技術(shù),使用多個額外的磁盤作單位錯誤校正(single-bit correction)及雙位錯誤檢測(double-bit detection);至于需要多少個額外的磁盤,則視其所采用的方法及結(jié)構(gòu)而定,例如八個數(shù)據(jù)磁盤的陣列可能需要三個額外的磁盤,有三十二個數(shù)據(jù)磁盤的高檔陣列可能需要七個額外的磁盤。4.4 raid 3raid 3的數(shù)據(jù)儲存及存取方式都和raid 2一樣,但在安全方面以奇偶校驗(parity check)取代海明碼做錯誤校正及檢測,所以只需要一個額外的校檢磁盤(parity disk)。奇偶校驗值的計算是以各個磁盤的相對應(yīng)位作xor的邏輯運算,然后將結(jié)果寫入奇偶校驗磁盤,任何數(shù)據(jù)的修改都要做奇偶校驗計算,如下圖:磁盤0 磁盤1磁盤2磁盤3磁盤4a0a4b3c2a1b0b4c3a2a1c0c4a3a2c1d0pppp如某一磁盤故障,換上新的磁盤后,整個磁盤陣列(包括奇偶校驗磁盤)需重新計算一次,將故障磁盤的數(shù)據(jù)恢復(fù)并寫入新磁盤中;如奇偶校驗磁盤故障,則重新計算奇偶校驗值,以達(dá)容錯的要求.較之raid 1及raid 2,raid 3有85%的磁盤空間利用率,其性能比raid 2稍差,因為要做奇偶校驗計算;共軸同步的平行存取在讀檔案時有很好的性能,但在寫入時較慢,需要重新計算及修改奇偶校驗磁盤的內(nèi)容。raid 3和raid 2有同樣的應(yīng)用方式,適用大檔案及大量數(shù)據(jù)輸出入的應(yīng)用,并不適用于pc及網(wǎng)絡(luò)服務(wù)器。4.5 raid 4raid 4也使用一個校驗磁盤,但和raid 3不一樣,如下圖:磁盤0 磁盤1磁盤2磁盤3磁盤4a0-a1b3-b4d1-d2e4-f0a2-a3c0-c1d3-d4f1-f2a4-b0c2-c3b0-b1f3-f4b1-b2c4-d0b2-b3g0-g1ppppraid 4是以扇區(qū)作數(shù)據(jù)分段,各磁盤相同位置的分段形成一個校驗磁盤分段(parity block),放在校驗磁盤。這種方式可在不同的磁盤平行執(zhí)行不同的讀取命今,大幅提高磁盤陣列的讀取性能;但寫入數(shù)據(jù)時,因受限于校驗磁盤,同一時間只能作一次,啟動所有磁盤讀取數(shù)據(jù)形成同一校驗分段的所有數(shù)據(jù)分段,與要寫入的數(shù)據(jù)做好校驗計算再寫入。即使如此,小型檔案的寫入仍然比raid 3要快,因其校驗計算較簡單而非作位(bit level)的計算;但校驗磁盤形成raid 4的瓶頸,降低了性能,因有raid 5而使得raid 4較少使用。4.6 raid 5raid5避免了raid 4的瓶頸,方法是不用校驗磁盤而將校驗數(shù)據(jù)以循環(huán)的方式放在每一個磁盤中,如下圖:磁盤0 磁盤1磁盤2磁盤3磁盤4pb3-b4d1-d2e4-f0a0-a1pd3-d4f1-f2a2-b3c0-c1pf3-f4a4-b0c2-c3b0-b1pb2-b2c4-d0b2-b3g0-g1磁盤陣列的第一個磁盤分段是校驗值,第二個磁盤至后一個磁盤再折回第一個磁盤的分段是數(shù)據(jù),然后第二個磁盤的分段是校驗值,從第三個磁盤再折回第二個磁盤的分段是數(shù)據(jù),以此類推,直到放完為止。圖中的第一個parity block是由a0,a1.,b1,b2計算出來,第二個parity block是由b3,b4,.,c4,d0計算出來,也就是校驗值是由各磁盤同一位置的分段的數(shù)據(jù)所計算出來。這種方式能大幅增加小檔案的存取性能,不但可同時讀取,甚至有可能同時執(zhí)行多個寫入的動作,如可寫入數(shù)據(jù)到磁盤1而其parity block在磁盤2,同時寫入數(shù)據(jù)到磁盤4而其parity block在磁盤1,這對聯(lián)機交易處理(oltp, on-line transaction processing)如銀行系統(tǒng)、金融、股市等或大型數(shù)據(jù)庫的處理提供了最佳的解決方案(solution),因為這些應(yīng)用的每一筆數(shù)據(jù)量小,磁盤輸出入頻繁而且必須容錯。事實上raid 5的性能并無如此理想,因為任何數(shù)據(jù)的修改,都要把同一parity block的所有數(shù)據(jù)讀出來修改后,做完校驗計算再寫回去,也就是rmw cycle(read-modify-write cycle,這個cycle沒有包括校驗計算);正因為牽一而動全身,所以:r:n(可同時讀取所有磁盤)w:1(可同時寫入磁盤數(shù))s:n-1(利用率)raid 5的控制比較復(fù)雜,尤其是利用硬件對磁盤陣列的控制,因為這種方式的應(yīng)用比其他的raid level要掌握更多的事情,有更多的輸出入需求,既要速度快,又要處理數(shù)據(jù),計算校驗值,做錯誤校正等,所以價格較高;其應(yīng)用最好是oltp,至于用于pc等,不見得有最佳的性能。在不停機及容錯的表現(xiàn)都很好,但如有磁盤故障,對性能的影響較大,大容量的快取內(nèi)存有助于維持性能,但在oltp的應(yīng)用上,因為每一筆數(shù)據(jù)或記錄(record)都很小,對磁盤的存取頻繁,故有一定程度的影響。某一磁盤故障時,讀取該磁盤的數(shù)據(jù)需把共用同一parity block的所有數(shù)據(jù)及校驗值讀出來,再把故障磁盤的數(shù)據(jù)計算出來;寫入時,除了要重覆讀取的程序外,還要再做校驗值的計算,然后再寫入更新的數(shù)據(jù)及校驗值;等換上新的磁盤,系統(tǒng)要計算整個磁盤陣列的數(shù)據(jù)以回復(fù)故障磁盤的數(shù)據(jù),時間要很長,如系統(tǒng)的工作負(fù)載很重的話,有很多輸出入的需求在排隊等候時,會把系統(tǒng)的性能拉下來。但如使用硬件磁盤陣列的話,其性能就可以得到大幅度的改進,因為硬件磁盤陣列如dftraid系列本身有內(nèi)置的cpu與主機系統(tǒng)并行運作,所有存取磁盤的輸出入工作都在磁盤陣列本身完成,不花費主機的時間,配合磁盤陣列的快取內(nèi)存的使用,可以提高系統(tǒng)的整體性能,而優(yōu)越的總線控制更能增加數(shù)據(jù)的傳輸速率,即使在磁盤故障的情況下,主機系統(tǒng)的性能也不會有明顯的降低。raid 5要做的事情太多,所以價格較貴,不適于小系統(tǒng),但如果是大系統(tǒng)使用大的磁盤陣列的話,raid 5卻是最便宜的方案??偠灾?raid 0及raid 1最適合pc及圖形工作站的用戶,提供最佳的性能及最便宜的價格,所以raid 0及raid 1多是使用ide界面,以低成本符合pc市埸的需求。raid 2及raid 3適用于大檔案且輸入輸出需求不頻繁的應(yīng)用如影像處理及cad/cam等;而raid 5則適用于銀行、金融、股市、數(shù)據(jù)庫等大型數(shù)據(jù)處理中心的oltp應(yīng)用;raid 4與raid 5有相同的特性及應(yīng)用方式,但有其先天的限制,所以并不受推薦。4.7 raid 104.8 raid 304.9 raid 50五、raid對比下面幾個表列是raid的一些性質(zhì):操作工作模式最少硬盤需求量可用容量raid 0磁盤延伸和數(shù)據(jù)分布2traid 1數(shù)據(jù)分布和鏡像2t/2raid 2共軸同步,并行傳輸,ecc(糾錯碼)3t*(n-1)/nraid 3共軸同步,并行傳輸,parity3t*(n-1)/nraid 4數(shù)據(jù)分布,固定parity3t*(n-1)/nraid 5數(shù)據(jù)分布,分布parity(奇偶)3t*(n-1)/n六、選擇raid級別的方法流程七、磁盤陣列的額外容錯功能:spare or standby driver事實上容錯功能已成為磁盤陣列最受青睞的特性,為了加強容錯的功能以及使系統(tǒng)在磁盤故障的情況下能迅速的重建數(shù)據(jù),以維持系統(tǒng)的性能,一般的磁盤陣列系統(tǒng)都可使用熱備份(hot spare or hot standby driver)的功能,所謂熱備份是在建立(configure)磁盤陣列系統(tǒng)的時候,將其中一磁盤指定為后備磁盤,此一磁盤在平常并不操作,但若陣列中某一磁盤發(fā)生故障時,磁盤陣列即以后備磁盤取代故障磁盤,并自動將故障磁盤的數(shù)據(jù)重建(rebuild)在后備磁盤之上,因為反應(yīng)快速,加上快取內(nèi)存減少了磁盤的存取,所以數(shù)據(jù)重建很快即可完成,對系統(tǒng)的性能影響不大。對于要求不停機的大型數(shù)據(jù)處理中心或控制中心而言,熱備份更是一項重要的功能,因為可避免晚間或無人持守時發(fā)生磁盤故障所引起的種種不便。另一個額外的容錯功能是壞扇區(qū)轉(zhuǎn)移(bad sector reassignment)。壞扇區(qū)是磁盤故障的主要原因,通常磁盤在讀寫時發(fā)生壞扇區(qū)的情況即表示此磁盤故障,不能再作讀寫,甚至有很多系統(tǒng)會因為不能完成讀寫的動作而死機,但若因為某一扇區(qū)的損壞而使工作不能完成或要更換磁盤,則使得系統(tǒng)性能大打折扣,而系統(tǒng)的維護成本也未免太高了。壞扇區(qū)轉(zhuǎn)移是當(dāng)磁盤陣列系統(tǒng)發(fā)現(xiàn)磁盤有壞扇區(qū)時,以另一空白且無故障的扇區(qū)取代該扇區(qū),以延長磁盤的使用壽命,減少壞磁盤的發(fā)生率以及系統(tǒng)的維護成本。所以壞扇區(qū)轉(zhuǎn)移功能使磁盤陣列具有更好的容錯性,同時使整個系統(tǒng)有最好的成本效益比。其他如可外接電池備援磁盤陣列的快取內(nèi)存,以避免突然斷電時數(shù)據(jù)尚未寫回磁盤而損失;或在raid 1時作寫入一致性的檢查等,雖是小技術(shù),但亦不可忽視。八、硬件磁盤陣列與軟件磁盤陣列市面上有所謂硬件磁盤陣列與軟件磁盤陣列之分,因為軟件磁盤陣列是使用一塊scsi卡與磁盤連接,一般用戶誤以為是硬件磁盤陣列。以上所述主要是針對硬件磁盤陣列,其與軟件磁盤陣列有幾個最大的區(qū)別:l 一個完整的磁盤陣列硬件與系統(tǒng)相接。l 內(nèi)置cpu,與主機并行運作,所有的i/o都在磁盤陣列中完成,減輕主機的工作負(fù)載,增加系統(tǒng)整體性能。l 有卓越的總線主控(bus mastering)及dma(direct memory access)能力,加速數(shù)據(jù)的存取及傳輸性能。l 與快取內(nèi)存結(jié)合在一起,不但增加數(shù)據(jù)的存取及傳輸性能,更因減少對磁盤的存取而增加磁盤的壽命。l 能充份利用硬件的特性,反應(yīng)快速。軟件磁盤陣列是一個程序,在主機執(zhí)行,透過一塊scsi卡與磁盤相接形成陣列,它最大的優(yōu)點是便宜,因為沒有硬件成本(包括研發(fā)、生產(chǎn)、維護等),而scsi卡很便宜(亦有的軟件磁盤陣列使用指定的很貴的scsi卡);它最大的缺點是使主機多了很多進程(process),增加了主機的負(fù)擔(dān),尤其是輸出入需求量大的系統(tǒng)。目前市面上的磁盤陣列系統(tǒng)大部份是硬件磁盤陣列,軟件磁盤陣列較少。九、ide磁盤陣列與scsi磁盤陣列目前使用在磁盤輸出入的界面主要有兩種:1. ide (integrated drive electronics)是廣泛使用在pc上的磁盤驅(qū)動器界面,一般而言,其傳輸速度從磁盤到磁盤緩沖器(medium to drive buffer)是1.5-2.5mb/sec,從緩沖器到界面(drive buffer to drive interface)約4.0-6.0mb/sec,而且新的設(shè)計其速率有大幅的改進,如增強型ide界面(mode 4)在pci(peripheral component interconnect)總線上的傳輸速率可達(dá)33mb/sec。2. scsi (small computer standard interface)scsi是較高級(high level)的界面,可用于主機,磁盤,磁帶,打印機等,因為是高階的界面,規(guī)格較為復(fù)雜,一般自帶控制器,也較為復(fù)雜,這就是scsi磁盤為什么比ide磁盤費的原因。但scsi界面能較有效的利用硬件特性而提高其速度。其控制器還能對主機發(fā)給scsi磁盤的命令進行緩沖、排隊,并進行優(yōu)化處理(命令隊列)?,F(xiàn)在較流行的是標(biāo)準(zhǔn)scsi-2和scsi-3。有兩種規(guī)格,fast scsi(scsi-2)的同步傳輸速率為10mb/sec,數(shù)據(jù)傳輸寬度為8 bit, wide scsi的數(shù)據(jù)傳輸寬度可達(dá)16-bit。ultra scsi(scsi-3)的同步傳輸速率為20mb/sec,ultra wide scsi的同步傳輸速率為40mb/sec,數(shù)據(jù)傳輸寬度可達(dá)32-bit。scsi磁盤有雖有較高的傳輸速度,但受限于磁盤的存取速度及磁盤至scsi界面的傳輸速度而不能充分發(fā)揮其性能(因為磁盤的機械動作難于有大幅度的改進);其命令分析程序(command phase)也較復(fù)雜。對單機來言,磁盤數(shù)量越多,主機找到特定的數(shù)據(jù)的時間越長,但對磁盤陣列來言,由于是多個磁盤一起并行處理,則表現(xiàn)為磁盤數(shù)量越多,速度越快。以上界面的直接反應(yīng)是單任務(wù)時ide比scsi快,多任務(wù)時scsi較快,這可從用ide盤和scsi盤做多用戶、多任務(wù)的操作系統(tǒng)(如unix、windows/nt等)的系統(tǒng)盤時的啟動時間的差別中明顯看出。在單機時則不一定。我們看一個界面是否較快,不應(yīng)只看其傳崐輸速度的高低而應(yīng)就整個輸入/輸出的流程看,因為磁盤存取的機械動作比不上電腦的傳輸速率。ide界面簡單,反應(yīng)快速,用于pc單機的小型的磁盤陣列其效果可能比scsi為佳;但較大型的磁盤陣列就非scsi界面莫屬,因為陣列中的各個磁盤一起作存取的動作,能充分發(fā)揮scsi的傳輸速率快及多工的特點。此外ide因為其配線規(guī)格的關(guān)系,不能作熱插拔(hot swap),也就是不能在工作中帶電插拔磁盤,而其線纜即使是增強型ide也只有18寸,不能接在機箱之外,難于形成大的陣列,也就是只適用于pc低層次的用戶。scsi纜線在差分傳輸模式(differential transmission mode)下最大長度為25米,單端傳輸模式(single-ended transmission mode)時最大長度為6米,而一條scsi總線可連接8臺系統(tǒng)或各種不同的裝置,擴充性很強,可形成很大的磁盤陣列空間;scsi規(guī)格完備,容錯能力很好,可帶電插拔磁盤,是外接式裝置無可取代的界面。十、磁盤陣列卡與磁盤陣列控制器磁盤陣列控制卡一般用于小系統(tǒng),供單機使用。與主機共用電源,在關(guān)閉主機電源時存在丟失cache中的數(shù)據(jù)的的危險。磁盤陣列控制卡只有常用總線方式的接口,其驅(qū)動程序與主機、主機所用的操作系統(tǒng)都有關(guān)系,有軟、硬件兼容性問題并潛在地增加了系統(tǒng)的不安定因素。在更換磁盤陣列卡時要冒磁盤損壞,資料失落,隨時停機的風(fēng)險。獨立式磁盤陣列控制一般用于較大型系統(tǒng),可分為兩種:單通道磁盤陣列和多通道式磁盤陣列,單通道磁盤陣列只能接一臺主機,有很大的擴充限制。多通道磁盤陣列可接多個系統(tǒng)同時使用,以群集(cluster)的方式共用磁盤陣列,這使內(nèi)接式陣列控制及單接式磁盤陣列無用武之地。dft數(shù)據(jù)容錯公司的dftraid rack mount和dftraid tower等系統(tǒng),都是獨立形式的磁盤陣列子系統(tǒng),其本身與主機系統(tǒng)的硬件及操作環(huán)境無關(guān),只通過scsi線纜與主機相接,主機把它當(dāng)作一般的磁盤,所有的輸出入動作都在磁盤陣列上完成,與主機的操作無關(guān),所以可接任何可使用scsi界面的主機。dftraid rack mount和dftraid tower兩系統(tǒng)最多可有六個scsi通道,可同時連接5臺主機;而dftraid 5000系列則有9個通道,可同時連接多達(dá)8臺主機,使之一起共用磁盤陣列子系統(tǒng)。這種方式的磁盤陣列既可給單機使用,又可給群集多機使用,對用戶對增加陣列中的磁盤數(shù)量限制較小,并可用于備援及并行的容錯電腦系統(tǒng),特別適合較大的系統(tǒng)用戶,使這些用戶可從封閉的環(huán)境中解放出來。十一、服務(wù)器的raid卡及服務(wù)器硬盤111 服務(wù)器raid卡 在服務(wù)器上實施raid(冗余磁盤陣列)是保護數(shù)據(jù)不受硬件故障影響的必要手段。raid是英文redundant array of independent disks的縮寫,翻譯成中文即為獨立磁盤冗余陣列,或簡稱磁盤陣列。簡單的說,raid是一種把多塊獨立的硬盤(物理硬盤)按不同方式組合起來形成一個硬盤組(邏輯硬盤),從而提供比單個硬盤更高的存儲性能和提供數(shù)據(jù)冗余的技術(shù)。 組成磁盤陣列的不同方式成為raid級別(raid levels)。raid技術(shù)經(jīng)過不斷的發(fā)展,現(xiàn)在已擁有了從 raid 0 到 6 七種基本的raid級別。另外,還有一些基本raid級別的組合形式,如raid 10(raid 0與raid 1的組合),raid 50(raid 0與raid 5的組合)等。不同raid 級別代表著不同的存儲性能、數(shù)據(jù)安全性和存儲成本。 raid卡就是用來實現(xiàn)raid功能的板卡,通常是由i/o處理器、scsi控制器、scsi連接器和緩存等一系列零組件構(gòu)成的。不同的raid卡支持的raid功能不同。raid卡第一個功能是可以讓很多磁盤驅(qū)動器同時傳輸數(shù)據(jù),而這些磁盤驅(qū)動器在邏輯上又是一個磁盤驅(qū)動器,所以使用raid可以達(dá)到單個的磁盤驅(qū)動器幾倍、幾十倍甚至上百倍的速率。第二個重要功能就是其可以提供容錯功能。 這里注意,接口是指raid卡支持的硬盤接口。目前主要有三類:ide接口、sata接口和scsi接口。 1ide接口:ide的英文全稱為“integrated drive electronics”(即電子集成驅(qū)動器),ide這一接口技術(shù)從誕生至今就一直在不斷發(fā)展,性能也不斷的提高,其擁有的價格低廉、兼容性強的特點,綜合這些因素,使其造就了其它類型硬盤無法替代的地位。 ide代表著硬盤的一種類型,但在實際的應(yīng)用中,人們也習(xí)慣用ide來稱呼最早出現(xiàn)ide類型硬盤ata-1,這種類型的接口隨著接口技術(shù)的發(fā)展已經(jīng)被淘汰了,而其后發(fā)展分支出更多類型的硬盤接口,比如ata、ultra ata、dma、ultra dma等接口都屬于ide硬盤。 2sata接口 使用sata(serial ata)口的硬盤又叫串口硬盤,是未來pc機硬盤的趨勢。2001年,由intel、apt、dell、ibm、希捷、邁拓這幾大廠商組成的serial ata委員會正式確立了serial ata1.0規(guī)范。 serial ata采用串行連接方式,串行ata總線使用嵌入式時鐘信號,具備了更強的糾錯能力,與以往相比其最大的區(qū)別在于能對傳輸指令(不僅僅是數(shù)據(jù))進行檢查,如果發(fā)現(xiàn)錯誤會自動矯正,這在很大程度上提高了數(shù)據(jù)傳輸?shù)目煽啃?。串行接口還具有結(jié)構(gòu)簡單、支持熱插拔的優(yōu)點。 3scsi接口 scsi的英文全稱為“small computer system interface”(小型計算機系統(tǒng)接口),是同ide完全不同的接口。scsi接口具有應(yīng)用范圍廣、多任務(wù)、帶寬大、cpu占用率低,以及支持熱插拔等優(yōu)點,但較高的價格使得它很難如ide硬盤般普及,因此scsi硬盤主要應(yīng)用于中、高端服務(wù)器和高檔工作站中。112 服務(wù)器硬盤 服務(wù)器硬盤,顧名思義,就是服務(wù)器上使用的硬盤(hard disk)。如果說服務(wù)器是網(wǎng)絡(luò)數(shù)據(jù)的核心,那么服務(wù)器硬盤就是這個核心的數(shù)據(jù)倉庫,所有的軟件和用戶數(shù)據(jù)都存儲在這里。對用戶來說,儲存在服務(wù)器上的硬盤數(shù)據(jù)是最寶貴的,因此硬盤的可靠性是非常重要的。為了使硬盤能夠適應(yīng)大數(shù)據(jù)量、超長工作時間的工作環(huán)境,服務(wù)器一般采用高速、穩(wěn)定、安全的scsi硬盤。 現(xiàn)在的硬盤從接口方面分,可分為ide硬盤與scsi硬盤(目前還有一些支持pcmcia接口、ieee 1394接口、sata接口、usb接口和fc-al(fibrechannel-arbitrated loop)光纖通道接口的產(chǎn)品,但相對來說非常少);ide硬盤即我們?nèi)粘K玫挠脖P,它由于價格便宜而性能也不差,因此在pc上得到了廣泛的應(yīng)用。 目前個人電腦上使用的硬盤絕大多數(shù)均為此類型硬盤。另一類硬盤就是scsi硬盤了(scsi即small computer system interface小型計算機系統(tǒng)接口),由于其性能好,因此在服務(wù)器上普遍均采用此類硬盤產(chǎn)品,但同時它的價格也不菲,所以在普通pc上不??吹絪csi的蹤影。 同普通pc機的硬盤相比,服務(wù)器上使用的硬盤具有如下四個特點: 1、速度快 服務(wù)器使用的硬盤轉(zhuǎn)速快,可以達(dá)到每分鐘7200或10000轉(zhuǎn),甚至更高;它還配置了較大(一般為2mb或4mb)的回寫式緩存;平均訪問時間比較短;外部傳輸率和內(nèi)部傳輸率更高,采用ultra wide scsi、ultra2 wide scsi、ultra160 scsi、ultra320 scsi等標(biāo)準(zhǔn)的scsi硬盤,每秒的數(shù)據(jù)傳輸率分別可以達(dá)到40mb、80mb、160mb、320mb。2、可靠性高 因為服務(wù)器硬盤幾乎是24小時不停地運轉(zhuǎn),承受著巨大的工作量??梢哉f,硬盤如果出了問題,后果不堪設(shè)想。所以,現(xiàn)在的硬盤都采用了s.m.a.r.t技術(shù)(自監(jiān)測、分析和報告技術(shù)),同時硬盤廠商都采用了各自獨有的先進技術(shù)來保證數(shù)據(jù)的安全。為了避免意外的損失,服務(wù)器硬盤一般都能承受300g到1000g的沖擊力。 3、多使用scsi接口 多數(shù)服務(wù)器采用了數(shù)據(jù)吞吐量大、cpu占有率極低的scsi硬盤。scsi硬盤必須通過scsi接口才能使用,有的服務(wù)器主板集成了scsi接口,有的安有專用的scsi接口卡,一塊scsi接口卡可以接7個scsi設(shè)備,這是ide接口所不能比擬的。 4、可支持熱插拔 熱插拔(hot swap)是一些服務(wù)器支持的硬盤安裝方式,可以在服務(wù)器不停機的情況下,拔出或插入一塊硬盤,操作系統(tǒng)自動識別硬盤的改動。這種技術(shù)對于24小時不間斷運行的服務(wù)器來說,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論