chn10 文件組織與數(shù)據(jù)存儲_第1頁
chn10 文件組織與數(shù)據(jù)存儲_第2頁
chn10 文件組織與數(shù)據(jù)存儲_第3頁
chn10 文件組織與數(shù)據(jù)存儲_第4頁
chn10 文件組織與數(shù)據(jù)存儲_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

文件管理之

文件組織與數(shù)據(jù)存儲陳鶴年

2014.116.3文件組織與數(shù)據(jù)存儲6.3.1文件的存儲6.3.2文件的邏輯結(jié)構(gòu)6.3.3文件的物理結(jié)構(gòu)6.3.1文件的存儲1.存儲介質(zhì):通用存儲介質(zhì)有磁盤、磁帶、光盤、U盤。2.卷:是存儲介質(zhì)的物理單位,一張光盤、一卷磁帶、一個(gè)磁盤分區(qū)都稱為一卷。3.塊:是一塊連續(xù)區(qū)域,也稱為物理記錄。塊是主存與外村交換信息的單位。即:存取信息是按塊進(jìn)行存(寫)或讀(?。瑔右淮蜪/O可以完成一塊或若干塊信息的讀寫。塊的大小決于用戶意愿、傳輸速率、設(shè)備屬性。不同類型的存儲介質(zhì),塊的長短常常各不相同;同一類型的存儲介質(zhì),塊的長短也可以不同。磁盤物理塊一般是512B.4.縫隙:由于設(shè)備機(jī)械屬性,相鄰塊之間留有縫隙,不能存儲數(shù)據(jù)。

6.3.1文件的存儲5.內(nèi)存里的文件與磁盤文件文件邏輯示意圖

6.3.2文件的邏輯結(jié)構(gòu)

(1)文件組織:指文件中信息的組織配置和構(gòu)造方式。分為文件的邏輯結(jié)構(gòu)和組織和文件的物理結(jié)構(gòu)組織。(2)文件的邏輯結(jié)構(gòu)和組織:是從用戶觀點(diǎn)出發(fā),研究用戶概念中的信息組織方式,這是用戶能觀察到,不考慮設(shè)備屬性可對獨(dú)立對數(shù)據(jù)集合進(jìn)行處理。(3)文件的邏輯結(jié)構(gòu)基本形式有:①流式文件;②記錄文件;1.流式文件和記錄文件(4)流式文件:是一串有序的字節(jié)信息集合,在流文件里,每個(gè)字節(jié)建立一個(gè)索引,從0開始編號,打開文件是讀取位置是首字節(jié)。根據(jù)具體情況,每次讀取如干字節(jié)。①流文件是無結(jié)構(gòu)文件,數(shù)據(jù)不再組成記錄,但可以看成是只有一個(gè)記錄的記錄式文件。

②文件常按長度來讀取所需信息,也可用插入特殊字符作為分界。

③文件系統(tǒng)提供read、write和seek結(jié)構(gòu)進(jìn)行讀取定位。6.3.2文件的邏輯結(jié)構(gòu)

1.流式文件和記錄文件(5)記錄式文件:文件由若干記錄構(gòu)成,包含若干邏輯記錄,邏輯記錄是文件中按信息在邏輯上的獨(dú)立含意劃分的信息單位。記錄大小是各字段取值之和;記錄是記錄文件的最小信息單位,每次只能進(jìn)行一條記錄的操作;記錄文件是有結(jié)構(gòu)文件,記錄按照記錄差生順序編號。(6)記錄文件的組織方法:①記錄式順序文件:②記錄式索引順序文件:6.3.2文件的邏輯結(jié)構(gòu)

下面是一個(gè)典型的記錄式文件中的內(nèi)容:090601010羅小寧女1988年5月江蘇連云港090601011王朔男1989年8月江蘇南京……

……

……

……

……1.流式文件和記錄文件2.

成組和分解:解決記錄是如何存儲在磁盤上以及邏輯記錄和磁盤塊的關(guān)系是什么?(1)成組操作:為了節(jié)約空間和減少I/O啟動次數(shù)。邏輯記錄是按信息在邏輯上的獨(dú)立劃分的單位,塊是存儲介質(zhì)上連續(xù)信息所組成的區(qū)域。一條邏輯記錄被存放到文件存儲器的存儲介質(zhì)上時(shí),可能占用一塊或多塊,也可以一個(gè)物理塊包含多個(gè)邏輯記錄。(2)成組:若干記錄合并在一起寫入在一個(gè)塊中。成組過程在緩沖區(qū)里完成,緩沖滿了就啟動一次I/O,完場寫一次。6.3.2文件的邏輯結(jié)構(gòu)

邏輯記錄1邏輯記錄2邏輯記錄3物理記錄即物理塊邏輯記錄用戶緩沖區(qū)系統(tǒng)緩沖區(qū)2.

成組和分解:

(3)

塊因子:每塊存儲記錄的個(gè)數(shù)。

例題:下圖表示一個(gè)物理塊存放3條邏輯記錄,即成塊因子是3,這樣啟動1次I/O可以讀寫3條邏輯記錄。6.3.2文件的邏輯結(jié)構(gòu)

一塊物理記錄邏輯1邏輯2邏輯32.

成組和分解:(4)分解:把一個(gè)物理塊讀入系統(tǒng)緩沖區(qū)后,把該塊中包含的若干記錄分離出來的操作。6.3.2文件的邏輯結(jié)構(gòu)

3.記錄格式記錄格式就是數(shù)據(jù)項(xiàng)在記錄里的排列方式,它影響著數(shù)據(jù)讀寫效率。記錄長度是一條記錄數(shù)據(jù)項(xiàng)的總字節(jié)長度,也影響讀寫。根據(jù)記錄長度把記錄分為:(1)定長記錄,易控制,但費(fèi)空間,最后一塊記錄不超過成組因子。(2)變長記錄:各條記錄長度不一,控制難,但是省空間。讀取時(shí)需要登記字節(jié)個(gè)數(shù)和相應(yīng)信息。(3)跨塊記錄,當(dāng)處理變長記錄是可能產(chǎn)生一條邏輯記錄超過物理塊大小,即存儲跨快。需要OS分段處理。6.3.2文件的邏輯結(jié)構(gòu)

6.3.2文件的邏輯結(jié)構(gòu)

?記錄鍵,標(biāo)示不同記錄的關(guān)鍵字。主鍵,次鍵單鍵記錄,多鍵記錄4.記錄鍵6.3.3文件的物理結(jié)構(gòu)

1.物理文件:文件的物理結(jié)構(gòu)和組織是指邏輯文件在物理存儲空間中存放方法和組織關(guān)系,即文件邏輯結(jié)構(gòu)在存儲物理設(shè)備上形成的物理塊集合。

2.文件物理存儲結(jié)構(gòu)影響因素:

(1)存儲設(shè)備;

(2)塊的劃分、記錄的排列、索引的組織、信息的搜索,其優(yōu)劣直接影響文件系統(tǒng)的性能。第一類計(jì)算法:通過映射算法把邏輯記錄與物理記錄建立對應(yīng)關(guān)系,其中能直接尋址、計(jì)算尋址、順序等的文件都屬于。常用于目錄文件、順序文件常采用此方法。第二類指針法:借用指針實(shí)現(xiàn)。常用于索引文件、索引順序文件、連接文件等。文件物理結(jié)構(gòu)的確定取決于用戶的意圖和物理設(shè)備的屬性。

3.文件物理結(jié)構(gòu)的構(gòu)造方法6.3.3文件的物理結(jié)構(gòu)(1)順序物理文件(連續(xù)文件)文件中邏輯上連續(xù)的信息存放到存儲介質(zhì)的依次相鄰的塊上便形成順序文件。FCB中保存第一物理塊地址和文件物理總塊數(shù)。用于磁帶文件、打印文件等。邏輯記錄順序和物理記錄順序完全一致的文件,通常記錄按出現(xiàn)的次序被讀出或修改。順序文件的優(yōu)點(diǎn)/缺點(diǎn)有點(diǎn):存取速度快、適應(yīng)系統(tǒng)文件;缺點(diǎn):要預(yù)判文件長度,以后不易插入、修改,不適應(yīng)變長記錄。6.3.3文件的物理結(jié)構(gòu)4.文件物理結(jié)構(gòu)的組織(形式)方法連續(xù)存儲文件連續(xù)存儲文件示意圖共5個(gè)文件(2)連接文件(串聯(lián)文件)結(jié)構(gòu)示意圖文件目錄項(xiàng)……06.3.3文件的物理結(jié)構(gòu)4.文件物理結(jié)構(gòu)的組織(形式)方法連接文件存儲連接文件示意圖鏈接文件分區(qū)表

連接文件使用連接字,又叫指針來表示文件中各個(gè)記錄之間的關(guān)系連接結(jié)構(gòu)的優(yōu)缺點(diǎn):分散存儲,易擴(kuò)充6.3.3文件的物理結(jié)構(gòu)3.2連接文件(串聯(lián)文件)特點(diǎn)4.文件物理結(jié)構(gòu)的組織(形式)方法(3)直接文件(哈希文件)記錄的關(guān)鍵字與其地址間可通過某種方式建立對應(yīng)關(guān)系,利用這種關(guān)系實(shí)現(xiàn)存取的文件叫直接文件。它首先把文件名轉(zhuǎn)換成FCB所在磁盤地址索引,根據(jù)目錄索引找到相應(yīng)物理塊,然后讀入緩沖區(qū);逐項(xiàng)比較找到需要的FCB。6.3.3文件的物理結(jié)構(gòu)4.文件物理結(jié)構(gòu)的組織(形式)方法(4)索引文件索引結(jié)構(gòu)是實(shí)現(xiàn)非連續(xù)存儲的另一種方法,適用于數(shù)據(jù)記錄保存有隨機(jī)存取存儲設(shè)備上的文件。使用索引表,每個(gè)表目包含一個(gè)記錄的鍵及其記錄數(shù)據(jù)的存儲地址,這類文件稱索引文件。6.3.3文件的物理結(jié)構(gòu)記錄鍵數(shù)據(jù)塊地址4.文件物理結(jié)構(gòu)的組織(形式)方法索引文件存儲索引文件示意圖

索引文件索引順序文件索引順序文件是順序文件的擴(kuò)展,各記錄本身在介質(zhì)上也順序排列,有直接處理和修改記錄的能力。索引順序文件能象順序文件一樣進(jìn)行快速順序處理,既允許按物理存放次序(記錄出現(xiàn)的次序);也允許按邏輯順序(由記錄主鍵決定的次序)進(jìn)行處理。多級索引文件二級索引。二級索引表的表項(xiàng)列出一級索引表每一塊最后一個(gè)索引項(xiàng)的鍵值及該索引表區(qū)的地址,若干個(gè)記錄的索引本身也是一種記錄。查找時(shí)先查看二級索引表找到某鍵所在的索引表區(qū)地址,再搜索一級索引表找出數(shù)據(jù)記錄。三級索引。多級文件索引示意圖U

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論