版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
6.1信息存儲與管理概述
6.2數據中心環(huán)境
6.3數據保護:RAID
6.4智能存儲系統(tǒng)6.1信息存儲與管理概述6.1.1數據和信息概述信息對企業(yè)的重要性、企業(yè)對信息的依賴性以及信息的數量也在以驚人的速度提高。企業(yè)需要以快速、可靠的方式獲取對成功至關重要的信息。隨著企業(yè)對信息的依賴性日益提高,數據存儲、保護和管理方面的挑戰(zhàn)也隨之增大。與數據可用性和保護相關的法律、法規(guī)和合同業(yè)務進一步增加了這些挑戰(zhàn)。隨著計算機和通信技術的進步,數據生成和共享的速率呈指數級增長。以下是導致數字數據增長的一些因素:(1)?數據處理能力的提高?,F代計算機的處理和存儲功能顯著提高,使得各種類型的內容和介質能夠從常規(guī)格式轉換為數字格式。(2)?數字存儲成本的降低。技術進步以及存儲設備成本的降低提供了低成本存儲解決方案,這一成本優(yōu)勢提高了數字數據生成和存儲的速率。(3)?價格合理、速度更快的通信技術的發(fā)展。(4)?應用程序和智能設備的劇增。智能手機、平板電腦和更新的數字設備以及智能應用程序極大地促進了數字內容的生成。根據數據的存儲和管理方式,數據可分為結構化數據和非結構化數據,如圖6.1所示。結構化數據以嚴格定義的格式按行和列進行組織,以使應用程序能夠有效地進行檢索和處理。結構化數據通常使用數據庫管理系統(tǒng)(DBMS)進行存儲。如果數據的元素不能按行和列存儲,因而難以通過應用程序進行查詢和檢索,則這樣的數據就是非結構化數據。鑒于這些數據的非結構化性質,難以使用傳統(tǒng)的客戶關系管理應用程序對其進行檢索。如今所創(chuàng)建的絕大多數新數據都是非結構化數據。采用新的體系結構、技術、技巧和技能存儲、管理、分析來自眾多源的非結構化數據和從中實現價值會給行業(yè)帶來挑戰(zhàn)。大數據是一個不斷變化的新概念,是指大小超出常用軟件工具,在可接受時間限制內具備捕獲、存儲、管理和處理能力的數據集。它包括各種源生成的結構化和非結構化數據。這些數據集通常需要實時捕獲或更新以便進行分析、預測建模和決策制訂。傳統(tǒng)的IT基礎架構以及數據處理工具和方法不足以應對大數據的數據量、多樣性、動態(tài)性和復雜性。實時分析大數據需要高性能、大規(guī)模的并行處理(MPP)數據平臺以及對數據集進行高級分析的新技術、體系結構和工具。數據科學是一門新興學科,它使組織能夠從大數據中獲得業(yè)務價值。數據科學是幾門現有學科的綜合,它使數據專家能夠開發(fā)先進的算法來分析大量信息,從而推動創(chuàng)造新價值并做出更多數據驅動的決策。當前希望采用數據科學技術的一些行業(yè)和市場包括醫(yī)療和科研、醫(yī)療保健、公共管理、欺詐檢測、社會媒體、銀行、保險公司以及其他受益于大數據分析的基于數字信息的實體。大數據所需的存儲體系結構管理應簡單、高效且便宜,可同時提供對多個平臺和數據源的訪問。6.1.2存儲概述在計算環(huán)境中,用來存儲數據的設備稱為存儲設備,簡稱存儲。存儲類型取決于數據的類型及其創(chuàng)建速度和使用頻率。有多種數據存儲方式可供企業(yè)選擇,包括內部硬盤、外部磁盤陣列和磁帶。以往,組織都將計算機(大型機)和信息存儲設備(磁帶盤和磁盤組)集中放在其數據中心內。隨著開放系統(tǒng)的演變,其成本合理性和易部署性使得各業(yè)務部門有機會擁有自己的服務器和存儲設備。在開放系統(tǒng)的早期實施中,存儲設備通常內置于服務器之中。這些存儲設備無法與其他任何服務器共享。此方法稱為以服務器為中心的存儲體系結構。在此體系結構中,每臺服務器具有有限數量的存儲設備,且任何管理任務都可能會導致信息不可用。企業(yè)中部門服務器的激增導致信息支離破碎,且缺乏保護和管理,因而增加了資本性支出和運營成本。為應對這些難題,存儲從以服務器為中心的體系結構演變?yōu)橐孕畔橹行牡捏w系結構,如圖6.2所示。6.1.3數據中心概述組織通過數據中心向整個企業(yè)提供集中式數據處理功能。數據中心擁有并管理大量數據。數據中心基礎架構包括硬件組件、軟件組件、環(huán)境控制系統(tǒng)。大型組織通常維護多個數據中心,以便分散數據處理工作負載并在發(fā)生災難時提供備份。一個數據中心要實現基本功能,必須要有以下五個核心部件。應用程序:為計算操作提供邏輯的計算機程序。數據庫管理系統(tǒng)(DBMS):提供結構化存儲方式,可將數據存儲在相互關聯并按邏輯組織的多個表中。主機/計算:運行應用程序和數據庫的計算平臺(硬件、固件和軟件)。網絡:便于在各種網絡設備之間進行通信的數據路徑。存儲裝置:持久存儲數據供后續(xù)使用的設備。這些核心元素通常被作為單獨的實體來查看和管理,但所有這些元素必須協(xié)同工作,才能滿足數據處理需求。圖6.3展示了一個在線訂單處理系統(tǒng),其中包含五個核心部件以及它們在商業(yè)處理中的應用。數據中心的無中斷運營對于企業(yè)的生存和成功至關重要。因此,很有必要利用可靠的存儲基礎設施來保證數據隨時可訪問。圖6.4所示的是對數據中心基礎設施的所有部件都適用的基本要求。管理數據中心涉及許多任務。關鍵的管理活動包括以下內容:(1)?監(jiān)視:收集有關數據中心中運行的各種元素和服務的信息的持續(xù)過程。監(jiān)視的數據中心的各個方面包括安全、性能、可用性和容量。(2)?報告:對資源性能、容量和利用率定期執(zhí)行報告。報告任務有助于建立業(yè)務合理性以及對與數據中心操作關聯的成本進行計費。(3)?資源調配:提供運行數據中心所需硬件、軟件和其他資源的過程。資源調配活動主要包括可滿足容量、可用性、性能和安全要求的資源管理。虛擬化和云計算極大地改變了數據中心基礎架構資源的調配和管理方式。組織正在對數據中心的各種元素快速部署虛擬化以優(yōu)化其利用率。此外,持續(xù)的IT成本壓力和隨需應變數據處理需求也促進了云計算的采用。6.1.4虛擬化概述虛擬化是指抽象化物理資源(如計算、存儲和網絡)并讓其顯示為邏輯資源的技術。虛擬化已在IT行業(yè)中以不同形式存在數年。常見的虛擬化應用有計算系統(tǒng)中使用的虛擬內存和原始磁盤的分區(qū)。虛擬化支持共用物理資源以及提供物理資源功能的聚合視圖。通過計算虛擬化,可將共用物理服務器的CPU容量視為所有CPU處理能力的聚合。虛擬化還支持集中化管理共用資源??筛鶕灿梦锢碣Y源創(chuàng)建和調配虛擬資源。這些虛擬資源共享共用物理資源,這樣可提高物理資源的利用率。根據業(yè)務需求,可向虛擬資源中添加容量或從中刪除容量,而不會中斷應用程序或影響用戶。隨著IT資產利用率的提高,組織將節(jié)省與采購和管理新物理資源關聯的成本。此外,減少物理資源意味著降低空間和能源消耗,這將帶來更高的經濟價值和實現綠色計算。除此之外,還有應用程序虛擬化和桌面虛擬化。應用程序虛擬化打破了應用程序與底層平臺(OS和硬件)之間的相關性,可在虛擬化容器中封裝應用程序和所需的OS資源。此技術支持部署應用程序,而無須對在其中部署應用程序的底層OS、文件系統(tǒng)或計算平臺的注冊表進行任何更改。由于虛擬化應用程序在單獨環(huán)境中運行,因此可保護底層OS和其他應用程序免遭潛在損壞。在許多方案中,如果多個應用程序或同一應用程序的多個版本安裝在同一計算平臺上,則可能會發(fā)生沖突。應用程序虛擬化可通過隔離不同版本的應用程序和關聯的O/S資源來消除此沖突。桌面虛擬化是一項支持從終端設備斷開用戶狀態(tài)、操作系統(tǒng)(OS)和應用程序的技術。它打破了硬件與其OS、應用程序、用戶配置文件和設置之間的相關性,使IT員工能夠獨立更改、更新和部署這些元素。臺式機位于數據中心且在虛擬機上運行,而用戶會從各種客戶端設備中遠程訪問這些臺式機。應用程序執(zhí)行和數據存儲在數據中心集中執(zhí)行。由于臺式機作為虛擬機在組織的數據中心中運行,因此可降低數據泄露和竊取的風險。它還有助于執(zhí)行集中化備份和簡化遵從性程序。虛擬桌面易于維護,因為應用修補程序、部署應用程序和OS以及集中調配或刪除用戶都很簡單。計算虛擬化是一項掩蔽物理硬件并將其從操作系統(tǒng)中抽象出來的技術。它支持對單個或群集物理機并行運行多個操作系統(tǒng)。此技術支持創(chuàng)建便攜式虛擬計算系統(tǒng),稱為虛擬機(VM)。每臺虛擬機均以隔離方式運行操作系統(tǒng)和應用程序實例。計算虛擬化通過位于硬件和虛擬機之間的虛擬化層來實現。這一層也稱為虛擬機管理程序。該虛擬機管理程序可提供硬件資源,如所有虛擬機的CPU、內存和網絡。在物理服務器中,可以創(chuàng)建大量虛擬機,具體取決于物理服務器的硬件功能。虛擬機是邏輯實體,但對于操作系統(tǒng)而言就像物理主機一樣,包括其自身的CPU、內存、網絡控制器和磁盤。但是,所有虛擬機均以隔離方式共享相同的基本物理硬件。從虛擬機管理程序角度看,虛擬機是包括虛擬機配置文件、數據文件等的獨立文件集合。6.2數據中心環(huán)境6.2.1數據中心的關鍵部件一個數據中心的關鍵部件包括集中管理的主機、存儲、連接(或網絡)、應用和數據庫管理系統(tǒng)。1.?主機用戶通過應用程序存儲和檢索數據,運行這些應用程序的計算機稱為主機或計算系統(tǒng)。主機可以是物理機,也可以是虛擬機。計算虛擬化軟件可以在一個物理計算架構上創(chuàng)建多個虛擬機。物理機包括桌面計算機、服務器或服務器群集、虛擬服務器、筆記本電腦和移動設備。主機包含CPU、內存、I/O設備和軟件集合,可執(zhí)行計算操作。軟件包括操作系統(tǒng)、文件系統(tǒng)、邏輯卷管理器、設備驅動程序等。這些軟件可以分別安裝,也可以成為操作系統(tǒng)的一部分。2.?存儲存儲是數據中心內的核心元素。存儲設備可使用磁介質、光學介質或固態(tài)介質。例如,磁盤、磁帶和軟盤使用磁介質,CD/DVD光盤使用光學介質,可移動閃存或閃存驅動器使用固態(tài)介質。過去,磁帶是備份最常用的存儲設備,因為其成本很低。但是,磁帶在性能和管理方面具有各種限制,由于這些限制以及磁盤驅動器的實用性,磁帶不再是企業(yè)級數據中心備份目標的首選。光盤存儲適用于小型的單用戶計算場合,還可用于小型應用程序(如游戲)的分發(fā),或者用于將少量數據從一臺計算機轉移到另一臺計算機。能夠一次寫入、多次讀取(WORM)是光盤存儲器的優(yōu)點。光盤在一定程度上可以保證其內容未經修改。因此,對于在創(chuàng)建后不會更改、數量相對較少的固定內容,光盤可用作成本低廉的長期存儲設備。組成陣列的光盤集合稱作光盤機,仍然用作固定內容存儲。其他形式的光盤包括CD-RW、Blue-ray(藍光)磁盤和各種各樣的DVD。光盤的缺點是容量和速度有限,不適用于業(yè)務數據存儲。閃存驅動器(或固態(tài)驅動器,SSD)使用半導體介質,可提供高性能、低功耗。它擁有極高的性能,能滿足性能敏感型應用的需求。閃存驅動器使用基于半導體的固態(tài)存儲(閃存)來存取數據。與傳統(tǒng)的機械磁盤相比,閃存驅動器不含移動部件,因此沒有尋道時間和旋轉延遲。另外,因為是基于半導體的設備,所以閃存驅動器比機械磁盤更省電。3.?連接連接是指主機之間或主機與外圍設備(如打印機或存儲設備)之間的互連。這里著重討論主機與存儲設備之間的連接。主機與存儲設備之間的連接與通信通過物理組件和接口協(xié)議來實現。1)?物理組件物理組件是將主機與存儲設備連接起來的硬件。連接主機與存儲設備的三個物理組件為主機接口設備、端口和纜線。主機接口設備(或主機適配器)可將主機連接到其他主機和存儲設備,主機接口設備包括主機總線適配器(HBA)和網絡接口卡(NIC)。HBA是特定于應用程序的集成電路(ASIC)板,在主機與存儲設備之間發(fā)揮I/O接口作用,從而為CPU減輕了其他I/O處理負擔。一臺主機通常包含多個HBA。端口是支持主機與外部設備之間連接的特殊出口。HBA可以包含一個或多個用于將主機連接到存儲設備的端口。纜線使用銅纜或光纜介質將主機連接到內部或外部設備。2)?接口協(xié)議接口協(xié)議用于支持主機與存儲設備之間的通信。主機與存儲設備之間通信的常用接口協(xié)議有集成的設備電子系統(tǒng)/高級技術附件(IDE/ATA)、小型計算機系統(tǒng)接口(SCSI)、光纖通道(FC)和Internet協(xié)議(IP)。4.?應用應用是指提供計算操作邏輯的計算機程序。應用程序通過向底層操作系統(tǒng)發(fā)送請求來對存儲設備執(zhí)行讀/寫(R/W)操作。應用程序可分層放在數據庫中,數據庫再使用操作系統(tǒng)服務對存儲設備執(zhí)行讀/寫操作。數據中心環(huán)境中部署的應用程序通常分為業(yè)務應用程序、基礎架構管理應用程序、數據保護應用程序和安全應用程序。這些應用程序包括電子郵件、企業(yè)資源規(guī)劃(ERP)、決策支持系統(tǒng)(DSS)、資源管理、備份、身份驗證和反病毒應用程序等。應用程序生成的I/O(輸入/輸出)特性會影響存儲系統(tǒng)的整體性能和存儲解決方案設計。應用程序的常見I/O特性包括:I/O的大小、特點及其在工作峰值產生的I/O數量。5.?數據庫管理系統(tǒng)數據庫是一種結構化存儲方式,可將數據存儲在相互關聯并按邏輯組織的多個表中。數據庫有助于優(yōu)化數據的存儲和檢索。DBMS可控制數據庫的創(chuàng)建、維護和使用,以及處理應用程序的數據請求并指示操作系統(tǒng)從存儲中傳輸相應的數據。6.2.2磁盤驅動器組件和磁盤的結構1.?磁盤驅動器組件硬盤驅動器主要由盤片、磁盤軸、讀/寫磁頭、傳動臂組件和控制器組成,如圖6.5所示。2.?磁盤的結構磁盤的結構如圖6.6所示,磁盤上的數據記錄在磁道上。磁道是盤片上以磁盤軸為中心的同心環(huán),以零開始從盤片外邊緣進行編號。盤片上每英寸的磁道數(TPI)稱為磁道密度,用來衡量盤片上磁道排布的緊密程度。6.2.3磁盤驅動器的性能磁盤驅動器是決定存儲系統(tǒng)環(huán)境總體性能的電子機械設備。1.?磁盤服務時間磁盤服務時間是指磁盤完成一個I/O請求所花費的時間。影響磁盤服務時間的因素有3個:尋道時間、旋轉延遲和數據傳輸速度。1)?尋道時間尋道時間用于描述通過徑向移動在盤片上定位讀/寫磁頭所用的時間。尋道時間具有以下規(guī)范:(1)?全程:讀/寫磁頭移動磁盤全寬(從最內側的磁道到最外側的磁道)這一距離所用的時間。(2)?平均:讀/寫磁頭從一個隨機磁道移至另一隨機磁道平均使用的時間,通常為全程尋道時間的1/3。(3)?道間:讀/寫磁頭在相鄰的兩個磁道間移動所用的時間。上述每項規(guī)范都以毫秒為單位度量。磁盤的尋道時間通常由驅動器制造商指定?,F代磁盤的平均尋道時間通常在3~15ms的范圍內。尋道時間對隨機磁道的I/O操作有較大影響。為了最大限度地縮短尋道時間,只能將數據寫入一部分可用柱面。這會導致驅動器的可用容量低于其實際容量,這稱作對驅動器采用短行程技術。2)?旋轉延遲為訪問數據,傳動臂會將讀/寫磁頭從盤片上移至特定磁道,同時盤片會進行旋轉以將所請求的扇區(qū)置于讀/寫磁頭下。盤片通過旋轉將數據置于讀/寫磁頭下所用的時間稱作旋轉延遲。此延遲取決于磁盤軸的旋轉速度,以毫秒為單位度量。平均旋轉延遲是旋轉一周所用時間的一半。與尋道時間相似,旋轉延遲對磁盤上隨機扇區(qū)的讀取/寫入產生的影響大于對相鄰扇區(qū)上的相同操作產生的影響。驅動器的旋轉延遲按以下公式計算:3)?數據傳輸速率數據傳輸速率(也稱作傳輸速度)是指單位時間驅動器可以向HBA輸送的平均數據量。在讀取操作中,數據先從磁盤盤片移至讀/寫磁頭,再移至驅動器的內部緩沖區(qū),最后通過接口從緩沖區(qū)移至主機HBA。在寫入操作中,數據通過驅動器的接口從HBA移至磁盤驅動器的內部緩沖區(qū),隨后從緩沖區(qū)移至讀/寫磁頭,最后從讀/寫磁頭移至盤片。讀/寫操作中的數據傳輸速率用內部傳輸速率和外部傳輸速率加以衡量,如圖6.7所示。2.?磁盤I/O控制器的利用率磁盤I/O控制器的利用率對I/O響應時間具有顯著影響。將磁盤視為一個包含隊列和磁盤I/O控制器的黑匣子。隊列是用于存放等待I/O控制器處理的I/O請求,磁盤I/O控制器用來處理在隊列中等待的I/O請求。I/O到達速度、隊列長度以及I/O控制器處理每個請求所用的時間決定了I/O響應時間。如果控制器處于忙狀態(tài)或利用率很高,則隊列大小會很大且響應時間會很長??刂破骼寐逝c平均響應時間之間的關系滿足以下公式:當利用率達到100%(即I/O控制器達到飽和)時,響應時間會接近于無窮大。實質上,飽和的組件(即瓶頸)會強制序列化I/O請求,這意味著每個I/O請求必須等待它前面的I/O請求完成。圖6.8顯示了利用率與響應時間的關系。該圖表明,隨著利用率提高,響應時間的變化是非線性的。當平均隊列大小很小時,響應時間保持在較短水平;隨著隊列負荷的增加,響應時間緩慢增加;當利用率超過70%時,響應時間呈指數級增加。因此,對于性能敏感型應用程序,磁盤的利用率通常低于其I/O服務功能的70%。6.2.4基于應用程序的需求和磁盤性能的存儲設計應用程序的存儲需求分析通常都是從確定存儲容量開始的。這可以根據文件系統(tǒng)的大小和數量,以及應用程序將要使用的數據庫部件來評估確定。要確定應用程序的存儲要求,首先要確定所需的存儲容量和I/O性能。可通過應用程序使用的文件系統(tǒng)以及數據庫組件的大小和數量輕松估計容量。應用程序在工作負載高峰時生成的I/O大小、I/O特性和I/O數量是影響性能、I/O響應時間和存儲系統(tǒng)設計的主要因素。I/O的磁盤服務時間(TS)是磁盤性能的一個關鍵指標;TS和磁盤利用率(U)可確定應用程序的I/O響應時間。如前所述,總磁盤服務時間是尋道時間、旋轉延遲和傳輸時間之和。TS可確定I/O控制器為I/O提供服務所用的時間,因此,每秒提供服務的I/O即IOPS的最大值為1/TS。上面計算的IOPS是在較高I/O控制器利用率(接近100%)下實現的。如果應用程序需要縮短響應時間,則磁盤利用率應保持在70%以下。應用程序所需的磁盤總數?=Max(為滿足容量所需的磁盤,為滿足性能所需的磁盤)為滿足應用程序的容量需求,所需的磁盤數量(DC):為滿足應用程序性能需求所需的磁盤數量(DP):根據磁盤服務時間,由磁盤提供服務的IOPS(TS):TS是I/O提供服務所用的時間,因此,由磁盤提供服務的IOPS值等于1/?TS。對于性能敏感型應用程序,有所以,應用程序所需的磁盤數量?=Max(DC,DP)。6.2.5閃存驅動器簡介閃存驅動器又稱為固態(tài)驅動器(SSD),是用于性能敏感型應用程序的超高性能的新一代驅動器。它的關鍵組件包括控制器、I/O接口、大容量存儲(存儲芯片的集合)和緩存。閃存驅動器使用基于半導體的固態(tài)內存(閃存)存儲和檢索數據。與傳統(tǒng)機械磁盤驅動器不同,閃存驅動器不包含運動部件,因此,它們沒有尋道和旋轉延遲。閃存驅動器可提供較高的IOPS,且響應時間非常短。另外,作為基于半導體的設備,相比機械磁盤驅動器,閃存驅動器耗電更少。閃存驅動器尤其適用于數據塊大小較小的應用程序和需要持續(xù)較低(低于1ms)響應時間的隨機讀取工作負載,以及需要快速處理大量信息的應用程序(如貨幣兌換、電子交易系統(tǒng)和實時數據源處理)等場合。總體來說,閃存驅動器可降低總體擁有成本(TCO)。利用閃存驅動器,企業(yè)可使用更少的驅動器滿足應用程序性能要求。這樣不但可以節(jié)約驅動器成本,而且可以節(jié)省電力、冷卻和空間消耗。驅動器的數量減少,管理存儲的成本也隨之降低了。6.3數據保護:RAID6.3.1RAID的實現方式RAID有兩種實現方式:硬件RAID和軟件RAID。在軟件RAID實現中,主機中的軟件提供RAID功能并由操作系統(tǒng)實現。該方式具有成本較低和簡單直觀的優(yōu)點,但是存在以下限制:(1)?軟件RAID會影響系統(tǒng)整體性能。這是因為需要額外的CPU周期來執(zhí)行RAID計算。(2)?軟件RAID并不支持所有的RAID級別。(3)?軟件RAID需與主機操作系統(tǒng)綁定,因此,對軟件RAID或操作系統(tǒng)升級進行兼容性驗證,會降低數據處理的靈活性。在硬件RAID實現中,可在主機或陣列中實現專用硬件控制器??刂破骺≧AID是基于主機的硬件RAID實現方式,專用RAID控制器安裝在主機上,并且所有磁盤驅動器均與主機相連;也可將RAID控制器集成到主板上。在包含大量主機的數據中心環(huán)境下基于主機的RAID控制器不是高效的解決方案。外部RAID控制器是基于陣列的硬件RAID,它充當主機與磁盤之間的接口,將存儲卷提供給主機,主機將這些存儲卷作為物理驅動器進行管理。RAID控制器的主要功能包括:管理與控制磁盤聚合、轉換邏輯磁盤和物理磁盤之間的I/O請求、在磁盤出故障時重新生成數據。6.3.2RAID陣列的組成如圖6.9所示,RAID陣列是一個包含大量磁盤驅動器的存儲模塊,它支持通過硬件實現RAID。對RAID陣列中的磁盤子集進行組合,可以形成一個稱為“邏輯陣列”的邏輯關聯,也可以將其稱為RAID集或RAID組。6.3.3RAID技術分條、數據鏡像和奇偶校驗等RAID技術構成了RAID分級的基礎,決定了RAID集的數據可用性和性能特點。1.?分條分條是一項跨越多個驅動器傳播數據以并行使用驅動器的技術。與從單個磁盤進行讀取和寫入相比,所有讀/寫磁頭同時工作,從而允許在較短時間內處理更多數據并提升性能。在RAID集的每個磁盤中,既定數量的連續(xù)編址磁盤塊定義為條塊??缭絉AID集中所有磁盤的一組對齊的條塊稱為條帶。條塊大小描述條塊中的數據塊數量,也是可以從集合中的單個磁盤讀取和寫入的最大數據量(。一個條帶中的所有條塊都具有相同的數據塊數。具有較小的條塊大小意味著在磁盤上分布數據時會將數據分成更小的部分。條帶大小是條塊大小與RAID集中數據磁盤數的乘積。條帶寬度是指條帶中數據條的數量。如果未使用奇偶校驗或鏡像,分條RAID不會提供任何數據保護。2.?數據鏡像鏡像是一項將相同數據存儲在兩臺不同的磁盤驅動器上,從而生成兩個數據拷貝的技術。如果一臺磁盤驅動器出現故障,那么正常運行的磁盤驅動器上的數據將完好無損,并且控制器可繼續(xù)通過鏡像對中仍正常運行的磁盤來滿足主機的數據請求。在用新磁盤替換故障磁盤后,控制器會從鏡像對中仍正常運行的磁盤上拷貝數據。該過程對主機是透明的。除了提供完善的數據冗余外,鏡像還支持從磁盤故障中快速恢復數據。但是,磁盤鏡像只提供數據保護,而不能代替數據備份。鏡像會不斷捕獲數據更改,而備份則捕獲數據在某個時間點的映像。鏡像涉及數據復制,因而所需的存儲容量是存儲數據量的兩倍。因此,鏡像的成本較高,比較適合不能承擔任何數據丟失風險的任務關鍵型應用程序。鏡像可提高讀取性能,因為有兩臺磁盤可以處理讀取請求,但是寫入性能稍弱于單個磁盤的性能,因為每個寫入請求在磁盤驅動器上都表現為兩次寫入。鏡像無法與分條RAID提供相同級別的寫入性能。3.?奇偶校驗奇偶校驗是一種既能為分條RAID提供數據保護,又能避免鏡像所需開銷的方法,是一項無須維護整個重復數據集即可保護數據的冗余技術。奇偶校驗計算是RAID控制器的一項功能。奇偶校驗信息可以存儲在單獨的專用磁盤驅動器上,也可以在RAID集中的所有驅動器上進行發(fā)布。圖6.10中的前4個磁盤(D1~D4)用于存儲數據,第5個磁盤(P)用于存儲奇偶校驗信息。如果其中一個數據磁盤出現故障,則可通過從奇偶校驗值中減去剩余元素的總和,計算缺失值。為簡單起見,此處奇偶校驗的計算表示為數據的數學運算。實際上奇偶校驗計算是一種XOR位運算。與鏡像相比,奇偶校驗大幅降低了與數據保護相關的成本。圖6.10中,奇偶校驗只需25%的額外磁盤空間,而鏡像則需要100%的額外磁盤空間。使用奇偶校驗的缺點是,奇偶校驗信息是由數據磁盤上的數據生成的,一旦數據發(fā)生更改就要重新計算奇偶校驗。這種重新計算十分耗時,并且會影響RAID陣列的性能。對于奇偶校驗RAID,條帶大小計算不包括奇偶校驗條塊。6.3.4RAID級別在選擇RAID級別時,應考慮應用的性能、數據可用性需求及成本等因素。分條、鏡像和校驗技術是RAID級別的基礎,RAID級別可使用一項技術,也可使用多項技術。表6.1列出了常用的RAID級別。6.3.5RAID級別對磁盤性能的影響在選擇RAID級別時,必須考慮它對磁盤性能和應用程序IOPS的影響。在鏡像和奇偶校驗RAID配置中,每次寫入操作都會轉換為磁盤的多項I/O開銷,這種開銷稱為寫性能損失。在RAID?1實現中,必須在配置為鏡像對的2塊磁盤上執(zhí)行每次寫入操作,而在RAID5實現中,寫入操作可能表現為4次I/O操作。在配置為使用RAID5的磁盤上執(zhí)行I/O操作時,控制器必須針對每次數據寫入操作讀取、重新計算和寫入奇偶校驗段。如圖6.11所示,為對一組包含5塊磁盤的RAID5執(zhí)行單次寫入操作??刂破靼匆韵路绞接嬎闫媾夹r?P):CP=C1+C2+C3+C4(XOR運算)只要控制器執(zhí)行一次寫入I/O,就必須通過從磁盤讀取舊奇偶校驗(CP舊)和舊數據(C4舊)來計算奇偶校驗,這意味著兩次讀取I/O。然后,新奇偶校驗(CP新)的計算方式如下:CP新=Cp舊–C4舊+C4新(XOR運算)計算完新的奇偶校驗后,控制器會通過將新數據和新奇偶校驗寫入磁盤來完成寫入I/O,這相當于2次寫入I/O。因此,對于每次寫入操作,控制器都會執(zhí)行2次磁盤讀取和2次磁盤寫入,而寫性能損失為4。在保持雙奇偶校驗的RAID6中,一次磁盤寫入需要執(zhí)行3次讀取操作:2次奇偶校驗和1次數據讀取。計算完2個新奇偶校驗后,控制器會執(zhí)行3次寫入操作:2次奇偶校驗和1次I/O操作。因此,在RAID6實現中,控制器對于每次寫I/O會執(zhí)行6次I/O操作,寫性能損失為6。6.3.6熱備盤熱備盤是指RAID陣列中會通過接管故障磁盤驅動器的標識來暫時代替故障磁盤驅動器的備用驅動器。熱備盤可根據RAID執(zhí)行以下數據恢復方法:(1)?如果使用奇偶校驗RAID,則根據RAID集中仍正常運行磁盤驅動器上的奇偶校驗信息和數據,在熱備盤上重建數據。(2)?如果使用鏡像,則將仍正常運行鏡像上的數據拷貝到熱備盤上。向系統(tǒng)中添加新磁盤驅動器時,會向其中拷貝熱備盤上的數據。熱備盤返回其空閑狀態(tài),準備替換下一個故障驅動器。此外,熱備盤會永久代替故障磁盤驅動器。這意味著它不再是熱備盤,必須在陣列上配置新的熱備盤。熱備盤的大小應該大到足以容納故障驅動器中的數據。某些系統(tǒng)配置了多個熱備盤,以提高數據可用性??蓪醾浔P配置為自動啟動或由用戶啟動,以便在磁盤出故障時指定它的使用方式。在自動配置中,當磁盤可恢復錯誤數超過既定閾值時,磁盤子系統(tǒng)會自動嘗試將數據從故障磁盤拷貝到熱備盤。如果在損壞磁盤發(fā)生故障前完成該任務,則子系統(tǒng)會切換到熱備盤,并將故障磁盤標記為不可用;否則,它會使用奇偶校驗或鏡像磁盤來恢復數據。在用戶啟動的配置中,管理員具有重建過程的控制權。例如,重建可以在夜間進行,以避免引起系統(tǒng)性能的下降。但是,如果其他磁盤出現故障,則系統(tǒng)將面臨數據丟失的風險。6.4智能存儲系統(tǒng)6.4.1智能存儲系統(tǒng)的組成部分智能存儲系統(tǒng)由以下四個關鍵組件組成:前端、緩存、后端和物理磁盤。如圖6.12所示,前端端口從主機收到的I/O請求通過緩存和后端進行處理,以將數據存儲到物理磁盤或從物理磁盤中檢索數據。如果在緩存中找到了所請求的數據,那么讀請求可以直接在緩存中完成。在現代智能存儲系統(tǒng)中,前端、緩存和后端通常集成在一個板上(稱為存儲處理器或存儲控制器)。6.4.2存儲資源調配存儲資源調配是根據主機上運行的應用程序的容量、可用性和性能要求向主機分配存儲資源的過程。存儲資源調配可采用兩種方式執(zhí)行:傳統(tǒng)和虛擬。虛擬資源調配指利用虛擬技術來調配應用程序的存儲。在傳統(tǒng)存儲資源調配中,物理磁盤以邏輯方式進行分組,在組中應用了必需的RAID級別,以形成一個集,稱為RAID集。RAID集的可用性、容量和性能由RAID集中的驅動器數和RAID級別確定。根據同一類型、速度和容量的驅動器創(chuàng)建RAID集,可以確保最大可用容量、可靠性和性能一致性。如果在RAID集中混合了不同容量的驅動器,則集中的每個磁盤都只會使用同最小驅動器相同的容量,以形成RAID集的總體容量。較大驅動器的剩余容量會保持未使用狀態(tài)。同樣,將每分鐘轉數(RPM)更高的驅動器與RPM較低的驅動器混合會降低RAID集的總體性能。RAID集通常具有較大的容量,因為它們結合了集中各個驅動器的總容量。邏輯單元是從RAID集中通過將可用容量分區(qū)(被視為RAID集的切片)為更小的單元來創(chuàng)建的。然后,這些單元會根據其存儲要求分配到主機。邏輯單元分布在屬于該集的所有物理磁盤上。從RAID集創(chuàng)建的每個邏輯單元都分配有一個唯一的ID,稱為邏輯單元號(LUN)。LUN會在主機中隱藏RAID集的組織和組成方式。傳統(tǒng)存儲資源調配方法創(chuàng)建的LUN也稱為非精簡LUN,用于與虛擬資源調配方法創(chuàng)建的LUN區(qū)分開。在虛擬化主機環(huán)境中,LUN分配到虛擬機管理程序,后者會將其識別為原始磁盤。使用虛擬機管理程序文件系統(tǒng)配置此磁盤,然后在其上創(chuàng)建虛擬磁盤。虛擬磁盤是虛擬機管理程序文件系統(tǒng)上的文件,然后將虛擬磁盤分配到虛擬機,并將其顯示為虛擬機的原始磁盤。為使虛擬磁盤用于虛擬機,需要執(zhí)行與非虛擬化環(huán)境中類似的步驟。這里,多臺虛擬機可能會同時共享和訪問LUN空間。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 課程設計論文網站
- 地震監(jiān)測單位聘用合同模板
- 食堂工業(yè)通風課程設計
- 航線配船課程設計折現率
- 礦山工程師聘用協(xié)議書勞動合同
- 農村耕地租賃合同:農業(yè)研究
- 2024建設借款合同范文
- 學校衛(wèi)生事件護理應急預案
- 金融工程學課課程設計
- 2024電梯安裝施工合同范本
- 意識形態(tài)工作責任制落實情況專題匯報
- 《珍愛生命》主題班會
- 四川阿壩汶川縣機關事業(yè)單位選(考)調工作人員45人55筆試參考題庫答案解析版
- 社區(qū)矯正人員心得體會
- 2020財務管理學真題及答案
- 人教版高中地理必修一《土壤》PPT
- GB/T 22838.5-2009卷煙和濾棒物理性能的測定第5部分:卷煙吸阻和濾棒壓降
- T 1463纖維增強塑料密度和相對密度試驗方法
- 引導式銷售課件
- 組合體的尺寸標注(最新)課件
- 小學科學課程標準
評論
0/150
提交評論