DELL POWEREDGE R510 RAID恢復(fù)與常見問題解決.doc_第1頁
DELL POWEREDGE R510 RAID恢復(fù)與常見問題解決.doc_第2頁
DELL POWEREDGE R510 RAID恢復(fù)與常見問題解決.doc_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

DELL POWEREDGE R510 RAID恢復(fù)與常見問題解決1 備份您重要的數(shù)據(jù),以免導(dǎo)致數(shù)據(jù)的丟失。2 重新啟動您的服務(wù)器,按下ctrm(這是raid 卡的bios),進(jìn)入raid bios3 選擇object(目標(biāo)對象),回車進(jìn)入4 選擇physical driver(物理硬盤),在物理硬盤這個菜單中,你可以看到各種硬盤的狀態(tài):主要有(online(在線)/fail(失敗)/rebuild(重建)/ready(預(yù)備)。通常情況下ready表示您的機(jī)器硬盤處于預(yù)備狀態(tài),硬盤沒有任何數(shù)據(jù)。Fail表示您的機(jī)器這個硬盤脫離了您的陣列,這個時候有可能硬盤壞了,也可能僅僅脫離陣列,您需要在每個硬盤上按一下F2鍵,檢查一下是否有media error (媒質(zhì)錯誤),other error(其他錯誤)如果錯誤超過10個就需要更換硬盤。如果錯誤全部是0,僅僅需要rebuild(重建)就可以。在經(jīng)過5小時后硬盤會從rebuild(重建)狀態(tài)改變?yōu)閛nline(在線),就是raid 回復(fù)正常。有關(guān)RAID的常見問題1. 為什么硬盤會掉線?SCSI的通訊采用的是并行總線技術(shù),當(dāng)SCSI鏈路中出現(xiàn)沖突,設(shè)備故障或通訊干擾,就會造成總線無法釋放,在此期間SCSI控制器可能無法正確識別到某些磁盤的狀態(tài),因此會將這些磁盤置為離線狀態(tài)。SCSI控制器會嘗試通過總線的復(fù)位來釋放總線。SCSI鏈路中的任何一個設(shè)備的故障都會造成SCSI總線通信故障,它包括下面這些部件:l SCSI線纜l 硬盤背板l 硬盤l SCSI控制器或RAID卡l 有缺陷的SCSI設(shè)備固件l SCSI終結(jié)器l EMM卡2. 為什么診斷工具可以發(fā)現(xiàn)硬盤故障,而硬盤本身卻沒有報警?硬盤在工作一段時間后,可能因各種原因會產(chǎn)生一些介質(zhì)錯誤,但硬盤廠商對這些介質(zhì)錯誤都有設(shè)定一個報警閥值,當(dāng)硬盤的介質(zhì)錯誤超過預(yù)設(shè)的報警閥值,硬盤firmware將觸發(fā)報警,并反映到硬盤報警燈,但有時硬盤雖然產(chǎn)生了介質(zhì)錯誤,但這些錯誤并沒達(dá)到報警預(yù)設(shè)閥值,所以硬盤報警燈可能會沒有提示。3. 為什么硬盤可以rebuild成功,但卻經(jīng)常掉線?Rebuilding的操作是一個RAID數(shù)據(jù)冗余性重新同步的過程,rebuilding成功僅反應(yīng)出磁盤介質(zhì)在同步過程中無讀寫錯誤。硬盤離線通常跟SCSI總線的穩(wěn)定性有關(guān)(參見問題1)。4. 什么原因?qū)е翿ebuilding失敗?l Double fault:由于多快磁盤故障,導(dǎo)致數(shù)據(jù)的冗余性丟失。l 錯誤的操作:在更換硬盤時,如果該硬盤本身并沒有離線,應(yīng)該使用prepare remove功能通知RAID卡,以便系統(tǒng)更新磁盤狀態(tài)。否則,系統(tǒng)可能不會接納更換的硬盤,從而導(dǎo)致不能rebuild,另外,建議熱更換故障硬盤。l 新?lián)Q磁盤上存在不正確的RAID配置信息(僅針對Apaptec公司的RAID卡)l 更換的硬盤物理容量比故障硬盤的小或存在介質(zhì)故障。l RAID卡故障。l SCSI總線不穩(wěn)定。5. RAID卡Firmware有什么作用?RAID卡的功能都是由firmware決定的,不同版本的firmware會有不同實(shí)現(xiàn)方式,高版本的firmware總是提供更多的功能以及修復(fù)早期版本的缺陷。6. 如何維護(hù)RAID數(shù)據(jù)?定期執(zhí)行check consistency和啟用RAID卡的patrol功能是一個良好的維護(hù)習(xí)慣。通常磁盤的介質(zhì)會隨著時間的推移出現(xiàn)讀寫故障。當(dāng)一個寫操作遇到壞塊 (RAID卡會將其標(biāo)記,并存放在RAID卡及磁盤的NVRAM中,如果該表中的值到達(dá)預(yù)設(shè)閥值時,硬盤firmware將觸發(fā)故障告警),該寫操作不能完成,但RAID卡會嘗試將該數(shù)據(jù)寫到其它健康的塊上。當(dāng)一個正常的讀操作遇到壞塊,那么數(shù)據(jù)是可以通過校驗(yàn)信息重新得到,RAID卡將得到的信息放到一個健康的塊上,并將先前的壞塊標(biāo)記出來。有時我們可能會遭遇double fault(即數(shù)據(jù)存放于多個有壞塊的的硬盤上),為了防止這些錯誤的出現(xiàn),我們必須進(jìn)行維護(hù)。7. 什么是consistency check ?一致性校驗(yàn)是磁盤陣列控制器的一種高級維護(hù)功能。它可以預(yù)先檢查陣列上的數(shù)據(jù),以保證它們的一致性,即數(shù)據(jù)是正確的、沒有被破壞。對于有奇偶校驗(yàn)值的陣列(RAID-5),一致性校驗(yàn)通過數(shù)據(jù)的奇偶校驗(yàn),并且和存校驗(yàn)值的盤上的校驗(yàn)值進(jìn)行比較,確定并糾正數(shù)據(jù)的一致性。對于鏡像盤,一致性校驗(yàn)比較RAID-1上2塊硬盤的數(shù)據(jù)是否完全一致。不一致的需要進(jìn)行同步處理。對于剩余空間的磁盤介質(zhì)consistency check一樣會進(jìn)行讀校驗(yàn)。8. 為什么要進(jìn)行一致性校驗(yàn)?系統(tǒng)崩潰、意外斷電或者硬盤出現(xiàn)壞道,都可能導(dǎo)致陣列上的數(shù)據(jù)被破壞或不一致。根據(jù)硬盤的原廠家的數(shù)據(jù),平均每進(jìn)行1,000,000,000,000,000次的比特位(bit)數(shù)據(jù)傳輸,就會產(chǎn)生一個不可恢復(fù)的數(shù)據(jù)錯誤。以36GB硬盤為例,平均每進(jìn)行3000次的全盤讀操作,就會產(chǎn)生1個錯誤字節(jié)(byte)。如果在陣列不一致的狀態(tài)時,發(fā)生硬盤故障,RAID控制器就無法通過奇偶校驗(yàn)計(jì)算出正確的數(shù)據(jù),陣列將無法rebuild成功。9. 什么是RAID卡的Patrol功能Patrol功能是基于磁盤介質(zhì)的,RAID卡firmware會在后臺按照設(shè)定的計(jì)劃定期對磁盤介質(zhì)進(jìn)行讀校驗(yàn),類似于SCSI卡的verify, 當(dāng)發(fā)現(xiàn)壞塊時會對壞塊進(jìn)行標(biāo)記及搬移。Patrol功能不對RAID數(shù)據(jù)進(jìn)行校驗(yàn)。10. 什么是Media errorMedia Error一般是指RAID卡發(fā)現(xiàn)的磁盤讀寫錯誤。通過這個指標(biāo)我們可以簡單的判斷磁盤介質(zhì)的情況,有media error并不意味者磁盤一定需要更換,因?yàn)榇疟P的firmware會對壞塊進(jìn)行屏蔽及遷移。但應(yīng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論