數(shù)據(jù)庫的講義存儲與文件結(jié)構(gòu) 課件_第1頁
數(shù)據(jù)庫的講義存儲與文件結(jié)構(gòu) 課件_第2頁
數(shù)據(jù)庫的講義存儲與文件結(jié)構(gòu) 課件_第3頁
數(shù)據(jù)庫的講義存儲與文件結(jié)構(gòu) 課件_第4頁
數(shù)據(jù)庫的講義存儲與文件結(jié)構(gòu) 課件_第5頁
已閱讀5頁,還剩45頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、存儲與文件結(jié)構(gòu)存儲與文件結(jié)構(gòu)物理存儲介質(zhì)概述磁盤RAID第三級存儲存儲訪問文件組織文件中的記錄組織物理存儲介質(zhì)的分類數(shù)據(jù)存取的速度每單位數(shù)據(jù)的成本可靠性系統(tǒng)故障或者電源故障造成的數(shù)據(jù)丟失存儲設(shè)備的物理故障可以將存儲介質(zhì)分為:易失存儲:當(dāng)電源關(guān)閉時(shí),所存儲的內(nèi)容就會丟失非易失存儲:即便在電源關(guān)閉時(shí),存儲內(nèi)容也不會丟失包括輔助存儲和第三級存儲,以及具有后備電源的主存儲器物理存儲介質(zhì)高速緩存 最快和最昂貴的存儲介質(zhì);是易失的;由計(jì)算機(jī)操作系統(tǒng)管理。主存儲器快速存取 (10到100納秒;1納秒= 109 秒)通常太?。ɑ蛘咛F)而不能存儲整個(gè)數(shù)據(jù)庫容量可達(dá)數(shù)G字節(jié),當(dāng)前得到了廣泛的應(yīng)用其容量不斷上升,

2、而每一字節(jié)的購買成本卻在穩(wěn)定而快速的下降(大約每2至3年下降一倍)易失的 如果發(fā)生電源故障或者系統(tǒng)故障,主存儲器中的內(nèi)容通常會丟失。物理存儲介質(zhì)(續(xù))閃存在電源故障時(shí)能夠?qū)?shù)據(jù)保存下來數(shù)據(jù)可以被擦除和寫入只能支持有限次的寫入和擦除操作。擦除數(shù)據(jù)時(shí),必須擦除整個(gè)閃存中的數(shù)據(jù)讀速度與主存儲器一樣快但寫速度很慢(需要幾個(gè)微秒),擦除速度則更慢單位存儲成本與主存儲器大致相當(dāng)廣泛應(yīng)用于嵌入設(shè)備如數(shù)字相機(jī)中也稱為EEPROM (Electrically Erasable Programmable Read-Only Memory)物理存儲介質(zhì)(續(xù))磁盤數(shù)據(jù)存儲在旋轉(zhuǎn)的盤片上,通過電磁方式讀寫是用于長期保存

3、數(shù)據(jù)的主要介質(zhì);通常能夠存儲整個(gè)數(shù)據(jù)庫在存取數(shù)據(jù)時(shí)需要把數(shù)據(jù)從磁盤移動到主存儲器,修改完畢后還需要將數(shù)據(jù)寫回磁盤與主存儲器相比,磁盤的存取速度要慢的多直接存取 與磁帶不同,磁盤可以以任意順序讀取盤片上的數(shù)據(jù)硬盤與軟盤現(xiàn)在,磁盤的容量可達(dá)100 GB與主存儲器和閃存相比,磁盤在容量上要大得多,而每字節(jié)代價(jià)卻小得多隨著技術(shù)的進(jìn)步,磁盤的性能仍然在穩(wěn)定和快速的提高 (大約每2至3年增長一倍)在電源故障和系統(tǒng)故障時(shí)不會丟失數(shù)據(jù)磁盤故障會毀壞數(shù)據(jù),但這種情況很少發(fā)生物理存儲介質(zhì)(續(xù))光存儲器非易失的,使用激光器從旋轉(zhuǎn)的盤片上讀取數(shù)據(jù)最常見的形式是:CD-ROM( 640 MB)和DVD (4.7到17

4、GB)使用只能寫一次,但能多次讀的光盤來歸檔數(shù)據(jù) (CD-R和DVD-R)也存在可以多次寫的光盤 (CD-RW,DVD-RW和DVD-RAM)與磁盤相比,光盤的讀寫速度都更慢光盤柜系統(tǒng),使用大量可移動的盤片,少數(shù)驅(qū)動器和自動裝載和卸載盤片的機(jī)構(gòu)來存儲大量的數(shù)據(jù)物理存儲介質(zhì)(續(xù))磁帶存儲器非易失的,主要用來備份(以便對磁盤故障進(jìn)行恢復(fù))和歸檔數(shù)據(jù)順序存取 比磁盤的速度要慢得多非常高的容量(40到300 GB)可以從磁帶驅(qū)動器中移出磁帶 磁帶存儲的代價(jià)遠(yuǎn)低于磁盤磁帶庫可以用來存儲海量的數(shù)據(jù)從數(shù)百TB (1TB = 109 字節(jié))到PB (1PB = 1012 字節(jié))存儲設(shè)備層次結(jié)構(gòu)存儲設(shè)備層次結(jié)構(gòu)

5、(續(xù))基本存儲:最快的存儲介質(zhì)但卻是易失的(包括高速緩存、主存儲器)輔助存儲器:下一層存儲介質(zhì),非易失的,存取速度較快,也稱為聯(lián)機(jī)存儲設(shè)備例如:閃存,磁盤第三級存儲:層次的最低一級,非易失的,存取速度較慢,也稱為脫機(jī)存儲設(shè)備例如:磁帶,光盤硬盤工作原理圖磁盤讀寫頭位置與盤片表面非常接近(幾乎挨到)以電磁方式讀或者寫信息盤片的表面劃分為圓形的磁道在通常的硬盤上每個(gè)盤片上有超過16,000條磁道每個(gè)磁道又劃分為多個(gè)扇區(qū)扇區(qū)是讀寫的最小數(shù)據(jù)單位扇區(qū)的大小通常為512個(gè)字節(jié)每條磁道通常包含:200(在內(nèi)側(cè)磁道) 到 400(在外側(cè)磁道)個(gè)扇區(qū)要讀寫扇區(qū)磁盤臂要通過擺動將磁頭定位到正確的磁道上隨著盤片的

6、不斷旋轉(zhuǎn),當(dāng)扇區(qū)從磁頭下經(jīng)過時(shí),就可以對數(shù)據(jù)進(jìn)行讀寫磁頭和磁盤的組合方式多個(gè)磁盤盤片安裝在一個(gè)軸上(通常是2到4個(gè)磁盤)每個(gè)盤片一個(gè)磁頭,安裝在同一個(gè)磁盤臂上柱面 i由所有盤片的第 i 條磁道構(gòu)成磁盤(續(xù))早期的磁盤容易產(chǎn)生磁頭故障早期磁盤的表面覆蓋著一層金屬氧化涂層,這層涂層會在磁頭故障中碎裂,并毀壞磁盤上的所有數(shù)據(jù)現(xiàn)在的磁盤很少會發(fā)生這樣災(zāi)難性的故障,盡管某些扇區(qū)還是可能損毀的磁盤控制器 計(jì)算機(jī)系統(tǒng)和磁盤驅(qū)動器硬件之間的接口能夠接受對扇區(qū)進(jìn)行讀寫的高級命令能夠進(jìn)行一些操作,例如將磁盤臂移動到右側(cè)磁道,并讀寫數(shù)據(jù)能夠?yàn)槊總€(gè)扇區(qū)計(jì)算和附加校驗(yàn)和來驗(yàn)證讀取的數(shù)據(jù)是否是正確的如果數(shù)據(jù)損壞了,在大多

7、數(shù)情況下,重新計(jì)算的校驗(yàn)和與存儲的校驗(yàn)和都是不匹配的在寫完數(shù)據(jù)后,重新讀回?cái)?shù)據(jù)以確保寫操作是正確的對壞扇區(qū)進(jìn)行映射磁盤子系統(tǒng)多個(gè)磁盤通過一個(gè)控制器連接到計(jì)算機(jī)系統(tǒng)控制器的功能(求校驗(yàn)和,進(jìn)行壞扇區(qū)映射)通常是由各個(gè)磁盤來完成的,以便減少磁盤控制器的負(fù)擔(dān)。磁盤接口標(biāo)準(zhǔn)簇ATA (AT adaptor) 系列標(biāo)準(zhǔn)SCSI (Small Computer System Interconnect) 系列標(biāo)準(zhǔn)上述各個(gè)標(biāo)準(zhǔn)的一些變化形式 (在速度和容量上有所不同)磁盤的性能度量存取時(shí)間 從發(fā)出讀寫請求到數(shù)據(jù)開始傳輸之間的時(shí)間,由:尋道時(shí)間 將磁盤臂重定位到正確的磁道上所花費(fèi)的時(shí)間平均尋道時(shí)間是最壞情況下尋

8、道時(shí)間的1/2在通常的磁盤上為4到10 毫秒旋轉(zhuǎn)等待時(shí)間 等待被存取的扇區(qū)出現(xiàn)在磁頭下的時(shí)間平均旋轉(zhuǎn)等待時(shí)間是最壞情況下旋轉(zhuǎn)等待時(shí)間的1/2在通常的磁盤上為4到11 毫秒 (每分鐘5400到15000轉(zhuǎn))數(shù)據(jù)傳輸率 是從磁盤獲取數(shù)據(jù)或者向磁盤存儲數(shù)據(jù)的速率通常為 4到8 MB每秒由于多個(gè)磁盤可能會共用同一個(gè)控制器,所以控制器的速率也是很重要的例如:ATA-5: 66 MB/秒,SCSI-3: 40 MB/秒,光纖通道: 256 MB/秒磁盤的性能度量(續(xù))平均故障時(shí)間 (MTTF) 磁盤在不出現(xiàn)故障的情況下可以持續(xù)運(yùn)行的平均期望時(shí)間通常為3到5年新磁盤出現(xiàn)故障的可能性非常低,其理論MTTF為3

9、0,000到1,200,000小時(shí)磁盤塊存取的優(yōu)化磁盤塊 一條磁道上連續(xù)的幾個(gè)扇區(qū)構(gòu)成的序列數(shù)據(jù)在磁盤和主存儲器之間以塊為單位進(jìn)行傳輸塊的大小從512字節(jié)到幾KB不等磁盤塊越小,需要傳輸?shù)拇螖?shù)越多磁盤塊越大,被浪費(fèi)的空間越多,因?yàn)榇嬖谠S多沒有被填滿的塊現(xiàn)在,磁盤塊的大小一般為4到16KB磁盤臂調(diào)度算法對等待中的磁道訪問請求進(jìn)行調(diào)度安排,使磁盤臂移動的距離最小化電梯算法:向一個(gè)方向移動磁盤臂(從外側(cè)磁道到內(nèi)側(cè)磁道或者相反),處理下一個(gè)與磁盤臂移動方向相同的請求,直到?jīng)]有該方向的請求為止,然后向反方向移動,并重復(fù)上述步驟磁盤塊存取的優(yōu)化(續(xù))文件組織 根據(jù)對文件的存取方式來組織磁盤塊,從而優(yōu)化磁盤

10、塊的存取時(shí)間例如,將相關(guān)的信息存儲在同一個(gè)或者鄰近的柱面上隨著時(shí)間的流逝,文件會變得碎片化例如,對文件進(jìn)行插入、刪除數(shù)據(jù)的操作或者磁盤上空閑的磁盤塊是分散的,那么新創(chuàng)建的文件所包含的磁盤塊就會分散在整個(gè)磁盤上對碎片化的文件進(jìn)行順序存取會增加磁盤臂的移動一些系統(tǒng)具有能夠減少文件系統(tǒng)碎片的應(yīng)用程序,以便加快文件的存取速度磁盤塊存取的優(yōu)化(續(xù))非易失寫緩沖區(qū) 通過將塊立即寫入非易失的RAM緩沖區(qū)來加速磁盤寫操作非易失RAM:具有后備電源的RAM或者閃存即使電源故障,當(dāng)電源恢復(fù)時(shí)仍然可以安全地將數(shù)據(jù)寫回到磁盤當(dāng)磁盤沒有其他請求時(shí)或者請求已經(jīng)等待了一段時(shí)間,控制器就會將數(shù)據(jù)寫入到磁盤那些需要首先將數(shù)據(jù)安

11、全地保存才可以繼續(xù)執(zhí)行的數(shù)據(jù)庫操作,現(xiàn)在就可以不必等待將數(shù)據(jù)寫入磁盤了可以對寫操作進(jìn)行重新排序,以最小化磁盤臂的移動磁盤日志 將對于塊的修改按照順序記錄在一個(gè)專門的磁盤上可以像非易失RAM那樣使用因?yàn)椴恍枰獙さ?,寫日志磁盤的速度是非常快的不需要特殊的硬件 (NV-RAM)文件系統(tǒng)通常通過對寫操作進(jìn)行重新排序來提高性能基于日志的文件系統(tǒng):將數(shù)據(jù)以安全的順序?qū)懭?NV-RAM或者日志磁盤如果不采用日志的方式記錄數(shù)據(jù),就會冒文件系統(tǒng)數(shù)據(jù)損壞的風(fēng)險(xiǎn)RAIDRAID: Redundant Arrays of Independent Disks(廉價(jià)磁盤冗余陣列)一種對大量磁盤進(jìn)行管理,并提供單個(gè)磁盤視圖

12、的磁盤組織技術(shù)通過并行使用多個(gè)磁盤從而達(dá)到高速度和高容量通過數(shù)據(jù)的冗余存儲,即使在磁盤故障的情況下也可以恢復(fù)數(shù)據(jù)N個(gè)磁盤組成的集合中的一些磁盤出現(xiàn)故障的幾率遠(yuǎn)高于特定的單個(gè)磁盤發(fā)生故障的幾率例如,對于一個(gè)擁有100個(gè)磁盤,每個(gè)磁盤的MTTF為100,000小時(shí) (約11年)的系統(tǒng),其系統(tǒng)MTTF為1000小時(shí)(約41天)對于擁有大量磁盤的系統(tǒng)來說,使用冗余的技術(shù)避免數(shù)據(jù)丟失是非常重要的RAID最初是作為大而昂貴的磁盤的替代方法而提出的RAID 的I最初代表 “inexpensive現(xiàn)在RAID被采用的原因是因?yàn)槠涓叩目煽啃院蛶扲AID 的I 現(xiàn)在的含義是“independent”通過冗余提

13、高可靠性冗余 存儲額外的信息以便在磁盤故障時(shí)重建信息例如,鏡像技術(shù)(或影像技術(shù))復(fù)制每一個(gè)磁盤,邏輯磁盤由兩個(gè)物理磁盤組成寫數(shù)據(jù)時(shí)需要同時(shí)對兩塊磁盤進(jìn)行寫操作讀數(shù)據(jù)時(shí)只需要對其中一塊磁盤進(jìn)行讀操作如果兩個(gè)磁盤中的一個(gè)出現(xiàn)故障,另外一個(gè)磁盤上的數(shù)據(jù)仍然可用只有當(dāng)一個(gè)磁盤出現(xiàn)故障,而且在系統(tǒng)修復(fù)前其鏡像磁盤也出現(xiàn)故障的情況下,才會出現(xiàn)數(shù)據(jù)丟失除了火災(zāi)、建筑倒塌或者電源故障等情況以外,發(fā)生上述情況的可能性非常小平均的數(shù)據(jù)丟失時(shí)間取決于平均的故障時(shí)間和平均的修復(fù)時(shí)間例如,如果一對鏡像的磁盤(假定磁盤故障之間是相互獨(dú)立的)的MTTF為100,000小時(shí),平均修復(fù)時(shí)間為10小時(shí),則平均數(shù)據(jù)丟失時(shí)間為500

14、*106小時(shí)(或者57,000年)通過并行性提高性能磁盤系統(tǒng)中的并行有兩個(gè)目的:對多個(gè)小的存取操作進(jìn)行負(fù)載平衡以提高吞吐量并行執(zhí)行大的存取操作,以減少大的存取操作的響應(yīng)時(shí)間可以通過拆分?jǐn)?shù)據(jù)并將其分布到多個(gè)磁盤上以提高數(shù)據(jù)傳輸率比特級拆分 將每個(gè)字節(jié)按比特拆開并分布到多個(gè)磁盤上在八個(gè)磁盤構(gòu)成的陣列中,將每個(gè)字節(jié)的第i個(gè)比特位寫到第i個(gè)磁盤上每次存取所讀取的數(shù)據(jù)量是單個(gè)磁盤的八倍塊級拆分 對于 n個(gè)磁盤的陣列,文件的第i 塊將存放到第(i mod n) + 1塊磁盤上如果所請求的數(shù)據(jù)塊保存在不同的磁盤上,就可以并行地存取這些塊當(dāng)對很長的、順序排列的塊進(jìn)行存取時(shí)可以并行的存取所有的磁盤RAID的級別

15、通過使用磁盤拆分與奇偶校驗(yàn)位相結(jié)合的方法,以低成本提供數(shù)據(jù)冗余的模式不同的RAID級別,具有不同的成本、性能和可靠性特征RAID 0級:使用塊級拆分;沒有冗余為一些不關(guān)心數(shù)據(jù)丟失風(fēng)險(xiǎn)的高性能應(yīng)用程序所使用RAID 1級:使用塊級拆分的鏡像磁盤提供最佳的寫性能通常為類似于存儲數(shù)據(jù)庫系統(tǒng)中日志文件的應(yīng)用程序所使用RAID的級別(續(xù))RAID 2級:內(nèi)存風(fēng)格的糾錯(cuò)碼與比特拆分技術(shù)RAID 3級:位交叉的奇偶校驗(yàn)單個(gè)奇偶校驗(yàn)位足以進(jìn)行糾錯(cuò),而不僅僅是檢測錯(cuò)誤,因?yàn)槲覀冎滥膫€(gè)比特發(fā)生故障了在寫數(shù)據(jù)時(shí),必須計(jì)算相應(yīng)的奇偶校驗(yàn)位,并將奇偶校驗(yàn)位寫入磁盤要恢復(fù)毀壞磁盤上的數(shù)據(jù),需要對其他磁盤(包括存儲奇偶校

16、驗(yàn)位的磁盤)上的比特進(jìn)行XOR運(yùn)算RAID的級別(續(xù))RAID 3級(續(xù))比單個(gè)磁盤更快的數(shù)據(jù)傳輸率,但由于每個(gè)磁盤都必須參加每一次I/O,所以每秒的I/O次數(shù)相對較少包容了RAID 2級(具有2級所有的優(yōu)點(diǎn),但成本更低)RAID 4級:塊交叉奇偶校驗(yàn);使用塊級拆分,并將一個(gè)獨(dú)立的磁盤上為其他N塊磁盤上對應(yīng)的塊保留一個(gè)奇偶校驗(yàn)塊在寫數(shù)據(jù)塊的時(shí)候,必須計(jì)算相應(yīng)塊的奇偶校驗(yàn)位,并寫入奇偶校驗(yàn)磁盤要找出毀壞的塊的值,可以對其他盤(包括奇偶校驗(yàn)磁盤)上相應(yīng)的塊的位進(jìn)行XOR運(yùn)算RAID的級別(續(xù))RAID 4級(續(xù))相對于3級,讀取獨(dú)立的塊時(shí)具有較高的I/O速率讀塊時(shí)只需讀取單個(gè)磁盤,所以存儲在不同塊

17、上的塊可以被并行讀取在讀取多個(gè)塊時(shí),比不使用拆分技術(shù)的情況具有更高的傳輸率在寫一個(gè)塊之前,必須計(jì)算奇偶校驗(yàn)數(shù)據(jù)需要讀取舊的奇偶校驗(yàn)塊,當(dāng)前塊的舊值,當(dāng)前塊的新值來進(jìn)行計(jì)算(兩次塊讀取+兩次塊寫入)奇偶校驗(yàn)塊成為獨(dú)立塊寫操作的瓶頸,因?yàn)槊看螌懘疟P塊時(shí),都要寫入奇偶校驗(yàn)磁盤RAID的級別(續(xù))RAID 5級:塊交叉的分布奇偶校驗(yàn);將數(shù)據(jù)和奇偶校驗(yàn)位都分布在所有N + 1個(gè)磁盤上,而不是將數(shù)據(jù)存儲在N個(gè)磁盤上,奇偶校驗(yàn)位存儲在另外一個(gè)磁盤上。例如,具有5個(gè)磁盤的陣列,第n組磁盤塊的奇偶校驗(yàn)塊存儲在第 (n mod 5) + 1個(gè)磁盤上,而數(shù)據(jù)塊存儲在其他四個(gè)磁盤上。RAID的級別(續(xù))RAID 5級

18、(續(xù))比4級的I/O速率高如果塊和他們的奇偶校驗(yàn)塊存放在不同的磁盤上,就可以進(jìn)行并行寫操作。包容了4級:與之具有相同的優(yōu)點(diǎn),但卻避免了奇偶校驗(yàn)磁盤造成的瓶頸RAID 6級:P+Q冗余模式;與5級類似,但存儲了額外的冗余信息以防止多個(gè)磁盤出現(xiàn)故障。以更高的成本換取了比5級更好的可靠性;使用并不廣泛。RAID級別的選擇選擇RAID既別的因素費(fèi)用 性能:每秒鐘的I/O操作數(shù),以及在正常操作情況下的帶寬故障期間的性能在重建故障磁盤期間的性能包括重建故障磁盤需要花費(fèi)的時(shí)間只有當(dāng)數(shù)據(jù)安全性并不重要的情況下,才使用用RAID 0例如,可以從其它數(shù)據(jù)源快速恢復(fù)數(shù)據(jù)的情況下2級和4級從沒有被使用過,因?yàn)樗鼈円呀?jīng)

19、為3級和5級所包容3級也不再使用了,因?yàn)楸忍丶壊鸱衷谧x單個(gè)塊時(shí)也需要存取所有磁盤,浪費(fèi)了磁盤臂移動的時(shí)間,而塊級拆分(5級)可以避免這種情況。6級很少被使用,因?yàn)閷缀跛袘?yīng)用程序來說, 1級和5級已經(jīng)能夠提供充分的安全性了。所以,只需要在1級和5級之間進(jìn)行選擇即可RAID級別的選擇(續(xù))1級比5級具有更好的寫性能5級在寫單個(gè)塊的時(shí)候,至少需要讀取兩個(gè)塊和寫入兩個(gè)塊。而1級只需要寫入兩個(gè)塊。1級更適合用在更新頻率高的環(huán)境中,如日志磁盤1級比5級具有更高的存儲成本在磁盤驅(qū)動器容量正在快速增大(50%/year)的同時(shí),磁盤存取時(shí)間卻減少的很慢(每10年增快3倍),I/O的需求已經(jīng)有了巨大的增長,

20、例如,對于 Web服務(wù)器當(dāng)購買了足夠多的磁盤滿足所需的I/O 率的時(shí)候,它們通常都擁有空余的磁盤空間,因而通常并不需要額外花費(fèi)金錢來實(shí)現(xiàn)1級5級適合用于具有很大的數(shù)據(jù)量,但只具有較低更新率的場合1級則適用于所有其他情況硬件問題軟件RAID:RAID的實(shí)現(xiàn)完全通過軟件來實(shí)現(xiàn),不需要特殊的硬件支持硬件RAID:需要使用特殊的硬件來實(shí)現(xiàn)RAID使用非易失的來記錄正在被執(zhí)行的寫操作注意:在寫操作期間的電源故障可能會導(dǎo)致磁盤上的數(shù)據(jù)損壞例如,在一個(gè)鏡像系統(tǒng)中,如果在寫完第一個(gè)塊之后,和第二個(gè)塊之前發(fā)生電源故障當(dāng)電源恢復(fù)時(shí),必須對類似這樣損壞的數(shù)據(jù)檢查 恢復(fù)損壞數(shù)據(jù)的過程類似于恢復(fù)故障磁盤的過程 NV-R

21、AM有助于有效地檢測潛在的損壞的塊否則,就必須讀取磁盤上所有的塊,并與鏡像或者奇偶校驗(yàn)塊進(jìn)行比較硬件問題(續(xù))熱對換:在系統(tǒng)正在運(yùn)行的情況下替換磁盤,而無需關(guān)閉電源為一些硬件RAID系統(tǒng)所支持減少恢復(fù)時(shí)間,并極大地提高可用性許多系統(tǒng)保有一些在線的空閑磁盤,在檢測到故障時(shí),將立即用這些磁盤來替換故障磁盤極大地減少了恢復(fù)時(shí)間許多硬件RAID系統(tǒng)通過使用以下技術(shù)來保證在單點(diǎn)失效的情況下系統(tǒng)不停止工作具有后備電池組的冗余電源供應(yīng)具有多個(gè)控制器和互連通路以防止控制器和交互連接出現(xiàn)故障光盤只讀光盤存儲器:Compact disk-read only memory (CD-ROM)可以向驅(qū)動器裝入或者移出盤

22、片很高的存儲容量( 每張盤片640 MB )很高的尋道時(shí)間,大約100毫秒與磁盤相比,光盤具有較高的延遲( 3000 RPM) )和較低的數(shù)據(jù)傳輸率( 3-6 MB/s )數(shù)字視頻光盤:Digital Video Disk (DVD)DVD-5的容量為4.7 GB,而DVD-9的容量為8.5 GBDVD-10和DVD-18是雙面的,容量分別為9.4 GB和17 GB其他特征類似于CD-ROMCD-R和DVD-R只能寫一次,現(xiàn)在日益流行數(shù)據(jù)只能寫一次,不能被擦除高容量和長的生命周期;用于進(jìn)行歸檔存儲現(xiàn)在還出現(xiàn)了可以多次寫的CD-RW,DVD-RW和DVD-RAM磁帶可以保存大量的數(shù)據(jù)和提供高的數(shù)

23、據(jù)傳輸率DAT (Digital Audio Tape) 格式的容量為數(shù)個(gè) GB, DLT (Digital Linear Tape) 各式的容量為10-40 GB, Ultrium格式的容量為100 GB以上傳輸率從幾MB到幾十MB每秒是當(dāng)前最廉價(jià)的存儲介質(zhì)磁帶的價(jià)格很低,但驅(qū)動器的價(jià)格非常高與磁盤和光盤相比,磁帶的存取時(shí)間非常慢因?yàn)榇艓琼樞虼嫒≈饕糜趥浞?,保存不常用到的信息,和從一個(gè)系統(tǒng)向另外一個(gè)系統(tǒng)導(dǎo)數(shù)據(jù)時(shí)的脫機(jī)介質(zhì)磁盤庫可以用來提供非常巨大的容量從TB( 1012字節(jié))到PB(1015字節(jié))存儲訪問數(shù)據(jù)庫文件可以被分成多個(gè)固定長度的存儲單元,稱為塊。塊是存儲分配和數(shù)據(jù)傳輸?shù)幕締挝?/p>

24、數(shù)據(jù)庫系統(tǒng)的一個(gè)目標(biāo)就是使在磁盤和內(nèi)存之間傳輸?shù)膲K數(shù)量最小化。我們可以通過將盡可能多的塊保存在內(nèi)存中來減少磁盤訪問的次數(shù)緩沖區(qū) 主存儲器的一部分,用于存儲磁盤塊的拷貝緩沖區(qū)管理器 負(fù)責(zé)在主存儲器中分配緩沖區(qū)空間的子系統(tǒng)緩沖區(qū)管理器當(dāng)程序需要從磁盤上讀取塊時(shí),就調(diào)用緩沖區(qū)管理器如果需要的塊已經(jīng)在緩沖區(qū)中,就會向發(fā)出請求的程序返回塊在主存儲器中的地址如果塊不在緩沖區(qū)中緩沖區(qū)管理器在緩沖區(qū)中為該塊分配空間,如果需要的話,替換(或者移出) 其它一些塊,以便為新塊騰出空間如果被移出的塊被修改過,將會把它寫回到磁盤一旦在緩沖區(qū)中分配好了空間,緩沖區(qū)管理器就會將塊從磁盤上讀到緩沖區(qū)中,并將該塊在主存儲器中的

25、地址傳遞給發(fā)出請求的程序緩沖區(qū)替換策略大多數(shù)操作系統(tǒng)采用最近最少使用法來進(jìn)行塊替換(least recently used ,LRU)隱藏在LRU后面的思想 使用過去的塊引用模式來推測未來的引用查詢具有定義良好的存取模式(例如順序掃描),并且數(shù)據(jù)庫系統(tǒng)使用用戶查詢的信息來預(yù)測未來的引用對于某些存取模式(包括對數(shù)據(jù)的反復(fù)掃描),LRU可能是一種壞的策略例如,當(dāng)對兩個(gè)關(guān)系r和s通過嵌套循環(huán)來進(jìn)行連接操作時(shí),for each tuple tr of r dofor each tuple ts of s doif the tuples tr and ts match 緩沖區(qū)替換策略(續(xù))釘住的塊 不允

26、許些回到磁盤的內(nèi)存塊立即丟棄策略 只要處理完塊中的最后一個(gè)元組就立即釋放塊所占用的空間最近最常使用策略(Most recently used,MRU) 系統(tǒng)必須釘住當(dāng)前被處理的塊。當(dāng)處理完塊中最后一個(gè)元組后,不再釘住該塊,該塊成為最近最常使用的塊.緩沖區(qū)管理器可以使用有關(guān)請求將會引用某個(gè)特別關(guān)系的可能性的統(tǒng)計(jì)信息例如,數(shù)據(jù)字典是被頻繁存取的。啟發(fā)式規(guī)則:應(yīng)當(dāng)將數(shù)據(jù)字典塊保存在主存儲器緩沖區(qū)中緩沖區(qū)管理器也強(qiáng)迫輸出塊以便進(jìn)行恢復(fù)文件組織數(shù)據(jù)庫是存儲在一個(gè)文件集合之中的,每個(gè)文件是記錄的序列。記錄時(shí)字段的序列一種途徑:假定記錄的大小是固定的每個(gè)文件只保護(hù)一種特定類型的記錄用不同的文件來存儲不同的關(guān)

27、系 這是最容易實(shí)現(xiàn)的途徑;后面我們將討論可變長紀(jì)錄定長記錄簡單的方法:將記錄i保存在距離文件開頭n (i 1)字節(jié)的地方,其中,n是每個(gè)記錄的大小記錄存取是簡單的,但記錄可能會跨塊修正:不允許記錄跨塊的邊界刪除記錄I:將第i + 1, . . ., n條記 錄移動到第i, . . . , n 1 條記錄將記錄n移動到 i不移動記錄,而是將所有 空閑的記錄鏈接到一個(gè) 空閑列表空閑列表將第一條被刪除的記錄的地址存儲在文件頭使用上述第一條被刪除的記錄來存儲第二條被刪除的記錄,依此類推可以把這些存儲的地址看作指針,因?yàn)樗鼈冎赶蛄擞涗浀奈恢酶哂锌臻g效率的的表示方法:重用空閑記錄的屬性空間來存儲指針(在正在使用的記錄中不會存儲指針)可變長記錄可變長記錄出現(xiàn)在數(shù)據(jù)庫系統(tǒng)的下列情況下:在一個(gè)文件中存儲多種類型的記錄記錄類型允許一個(gè)或者多個(gè)字段是變長的記錄

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論