




已閱讀5頁,還剩56頁未讀, 繼續(xù)免費閱讀
(計算機軟件與理論專業(yè)論文)基于元數(shù)據(jù)的檔案集管理程序的設(shè)計與實現(xiàn).pdf.pdf 免費下載
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
基于元數(shù)據(jù)的檔案集管理程序的設(shè)計與實現(xiàn)中山大學(xué)碩士生學(xué)位論文 基于元數(shù)據(jù)的檔案集管理程序的設(shè)計與實現(xiàn) 專業(yè):計算機軟件與理論 碩士生:劉云贊 指導(dǎo)老師:倪德明副教授 摘要 本論文討論了大規(guī)模數(shù)據(jù)集備份的情形下,利用嵌入歸檔文件頭部的自描述 元數(shù)據(jù)信息對散落的歸檔文件集合實施有效管理的方案,并進行了詳細(xì)設(shè)計與實 現(xiàn)。 在通常的備份歸檔系統(tǒng)中,會遺留下大量散落的歸檔文件,只有對歸檔文件 實施有效的管理才能使其成為有意義的可恢復(fù)數(shù)據(jù)。并且隨著歸檔集合規(guī)模的增 大,對歸檔的操作變得愈加復(fù)雜,需要靈活簡便的工具來幫助管理人員實施管理。 論文探討了對檔案文件集合的分類管理需求,建立了由元數(shù)據(jù)構(gòu)建得到的多 級分類的樹狀檔案集合模型。論文討論了元數(shù)據(jù)集合、元數(shù)據(jù)劃分、元數(shù)據(jù)分類 樹等模型的若干性質(zhì),給出了由元數(shù)據(jù)節(jié)點組織為分類樹的方法。對這些模型給 出了半形式化的描述。 在元數(shù)據(jù)分類樹的基礎(chǔ)之上,論文定義了通過樹結(jié)構(gòu)視圖在歸檔集合上進行 的選擇擴展、級聯(lián)刪除、遷移、驗證、搜索等操作并給出了相關(guān)算法。還討論了 針對不同的歸檔類型的情形下一致的集合操作語義。 在模型討論基礎(chǔ)之上,本文設(shè)計了元數(shù)據(jù)的分散存儲、樹結(jié)構(gòu)的組織生成。 實現(xiàn)了分類樹類與歸檔管理類等可重用組件,設(shè)計實現(xiàn)了一套命令行工具框架和 一組命令行u i 類體系,使得創(chuàng)建、擴展命令行工具更簡便清晰,輸入輸出結(jié)構(gòu) 化信息更具語義特性。 本文在歸檔集的分布式元數(shù)據(jù)管理基礎(chǔ)上適當(dāng)引入集中元數(shù)據(jù)緩存的思想, 設(shè)計實現(xiàn)了元數(shù)據(jù)與分類樹緩存機制,利用歸檔極少改動的特點在大規(guī)模歸檔集 的情形下能夠保持良好的性能。 基于元數(shù)據(jù)的檔案集管理程序的設(shè)計與實現(xiàn)中山大學(xué)碩士生學(xué)位論文 筆者實現(xiàn)了滿足管理需求的命令行工具,采用一致的命令行子命令、參數(shù)與 選項格式,并且產(chǎn)生結(jié)構(gòu)化輸出,適合腳本批處理應(yīng)用。定義統(tǒng)一的檔案文件集 合操作接口,使得擴展的插件可以對不同類型的檔案進行一致的操作。 對元數(shù)據(jù)分類樹模型的討論、管理操作的定義與實現(xiàn)、不同歸檔類型的一致 集合操作的討論為歸檔系統(tǒng)的通用性的提出奠定了基礎(chǔ)。元數(shù)據(jù)存儲設(shè)計、緩存 機制設(shè)計、命令行工具的構(gòu)建,給備份系統(tǒng)的歸檔管理提供了一個簡便易行、可 擴展的方案。命令行輸出的結(jié)構(gòu)化設(shè)計為腳本的編寫提供了可能,并在此基礎(chǔ)上 封裝實現(xiàn)了圖形界面工具,使得管理人員可以通過圖形界面管理遠(yuǎn)端主機的命令 行工具與歸檔集合。 關(guān)鍵詞:歸檔管理,元數(shù)據(jù),分類樹 基于元數(shù)據(jù)的檔案集管理程序的設(shè)計與實現(xiàn)中山大學(xué)碩士生學(xué)位論文 t h ed e s i g na n di m p l e m e n t a t i o no fa r c h i v es e tm a n a g e m e n t p r o g r a mb a s e do nm e t a d a t a m a jo r :c o m p u t e rs o f t w a r ea n dt h e o r y n a m e :l i uy u n y u n s u p e r v i s o r :a s s o c i a t ep r - o d e m i n gn i a b s t r a c t t h et h e s i sd i s c u s s e dt h ea v a i l a b l em a n a g e m e n ts o l u t i o no fl a r g es e to fa r c h i v ef i l e s u s i n gm e t a d a t a , a n df i n i s h e dt h ed e t a i ld e s i g na n di m p l e m e n t a t i o n i nr e g u l a rb a c k u p - a r c h i v i n gs y s t e m s ,al a r g en u m b e ro fa r c h i v ef i l e sw o u l db e p r o d u c e da n dl e a v e d i ti sc o u l db e c o m eu s e f u la n dr e a d y - t o r e c o v e r i e dd a t at h a to n l y w h e np e r f o r m i n ge f f i c i e n tm a n a g e m e n t so na r c h i v e s i th a sai n c r e a s i n gc o m p l e x i t y a st h ei n c r e a s i n go fa r c h i v es e t af l e x i b l em f l i t yi sn e e d e dt oh e l pa r c h i v em a n a g e r t 1 l i st h e s i sd i s c u s s e dt h ed e m a n do fa r c h i v e sm a n a g e m e n t ,b u i l dam o d u l eo f t r a n s f e r r i n gf r o mm e t a d a t as e tt om u l t i l e v e l e dc l a s s i f i e dt r e e t l l ec h a r a c t e r so f m o d u l e sa sm e t a d a t as e t ,m e t a d a t ac l a s s i f i c a t i o n , a n dc l a s s i f i e dt r e ew e r ed i s c u s s e d t h e s i sp r e s e n t e dt h ea l g o r i t h mo fo r g a n i z i n gm e t a d a t an o d e st oac l a s s i f i e dt r e e ,a n d p r e s e n t e dt h ef o r md e s c r i p t i o no f t h e s em o d u l e s b a s e do nt h em e t a d a t ac l a s s i f i e dt r e e ,t h e s i sd e f i n e dt h eo p e r a t i o n sa ss e l e c t 、 e x p a n s i o n , d e l e t e ,m i g r a t e ,v a l i d a t e ,a n ds e a r c ha n dd i s c u s s e dt h ei d e n t i c a ls e t o p e r a t i n gs e m a n t i c su n d e rd i f f e r e ma r c h i v et y p e s b a s e do nt h ed i s c u s s i o no fm o d u l e s ,t h e s i sd e s i g n e dt h ed i s t r i b u t e ds t o r a g eo f m e t a d a t a , a n dt h eo r g a n i z a t i o no ft r e es t r u c t u r e ,i m p l e m e n t e dr e u s a b l ec o m p o n e n t sa s c l a s s i f i e dt r e ec l a s sa n dm a n a g e m e n tc l a s s i td e s i g n e das u i to fc o m m a n dl i n eu t i l i t y f r a m e w o r ka n das u i to fc o m m a n dl i n e1 0c l a s sf r a m e w o r k ,w h i c hm a k eb u i l d i n g c o m m a n dl i n em o r ec o n v e n i e n t i n t r o d u c i n gt h o u g h t so fc e n t r a l i z e dm a n a g e m e n tp r o p e r l yi n t ot h ed i s t r i b u t e d l l i s t o r a g eo fm e t a d a t a , t h e a r t i c l ei m p l e m e n t e dam e t a d a t ac a c h es y s t e m s i n c et h e a r c h i v e sn e a r l yn e v e rb em o d i f i e d ,t h ep r o g r a mc o u l dp e r f o r mw e l lw h e nd a t a s e t i n c r e a s i n g a u t h o ri m p l e m e n t e dc o m m a n dl i n eu t i l i t i e st h a tm e e tt h em a n a g e m e n td e m a n d t h eu t i l i t i e su s e si d e n t i c a ls u b - c o m m a n d s ,o p t i o n s , a n da r g u m e n t sf o r m a t ,a n d p r o d u c e s s t r u c t u r a l o u t p u t ,s u i t a b l e f o rb a t c hs c r i p t i n ga p p l i c a t i o n a ni d e n t i c a l s e t - o p e r a t i n gi n t e r f a c e w a sd e f i n e da n di ta l l o w sf u n c t i o n se x t e n s i b l et oo p e r a t e d i f f e r e n tt y p e so fa r c h i v e s i ti st h ed i s c u s s i o no fc l a s s i f i e dt r e em o d u l e ,t h ei m p l e m e n t a t i o no fm a n a g e m e n t o p e r a t i o n s ,a n dt h ed i s c u s s i o no fi d e n t i c a li n t e r f a c et od i f f e r e n t a r c h i v et y p e st h a t e s t a b l i s h e dt h eb a s e m e n to fa r c h i v em a n a g e m e n tg e n e r a l i z a t i o n i ti s t h em e t a d a t a s t o r a g ed e s i g n , c a c h ed e s i g n , a n du t i l i t i e sb u i l d i n gt h a tp r o v i d e d aa v a i l a b l ea n d e x t e n s i b l es o l u t i o n i ti st h es t r u c t u r a lc o m m a n do u t p u tt h a tm a k ep o s s i b l et os c r i p t i n g , a n dt h ef u r t h e rd e v e l o p m e n t ag u it o o lw a si m p l e m e n t e db a s e do nc o m m a n dl i n e t o o l s ,a n dt h eg u it o o lc o u l dm a n a g er e m o t ec o m m a n d l i n et o o l sa n da r c h i v e s k e yw o r d s :a r c h i v em a n a g e m e n t ,m e t a d a t a , c l a s s i f i e dt r e e i v 論文原創(chuàng)性聲明 本人鄭重聲明:所呈交的學(xué)位論文,是本人在導(dǎo)師的指導(dǎo)下,獨立進 行研究工作所取得的成果。除文中已經(jīng)注明引用的內(nèi)容外,本論文不 包含任何其他個人或集體已經(jīng)發(fā)表或撰寫過的作品成果。對本文的研 究作出重要貢獻(xiàn)的個人和集體,均已在文中以明確方式標(biāo)明。本人完 全意識到本聲明的法律結(jié)果由本人承擔(dān)。 學(xué)位論文作者簽名:3 12 0 零 i 日期:知氣年廠月妁日 學(xué)位論文使用授權(quán)聲明 本人完全了解中山大學(xué)有關(guān)保留、使用學(xué)位論文的規(guī)定,即:學(xué) 校有權(quán)保留學(xué)位論文并向國家主管部門或其指定機構(gòu)送交論文的電 子版和紙質(zhì)版,有權(quán)將學(xué)位論文用于非贏利目的的少量復(fù)制并允許論 文進入學(xué)校圖書館、院系資料室被查閱,有權(quán)將學(xué)位論文的內(nèi)容編入 有關(guān)數(shù)據(jù)庫進行檢索,可以采用復(fù)印、縮印或其他方法保存學(xué)位論文。 學(xué)位論文作者簽名:1j ,嘍 日期:硒年廠月2 6 日 導(dǎo)師簽名:償院硐 日期:m 宕年廠月瀝日 基于元蠹據(jù)白年擋寰集管理程序盼設(shè)計與實現(xiàn)中山大孝碉d = 生季梗論文 1 1 背景 第一章引言帚一早ji 百 以信息技術(shù)尤其是網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,使得公司與企業(yè)組織的運作越來越 依賴于i t 系統(tǒng)。大量有關(guān)生產(chǎn)、銷售的業(yè)務(wù)信息數(shù)據(jù)維系著整個組織的生存和 發(fā)展,它們是珍貴無比的無形資產(chǎn)。這些數(shù)據(jù)一旦因為存儲系統(tǒng)遭受意外而被丟 失、篡改、物理損害或者遭遇其他不可避免的自然災(zāi)害,造成大量數(shù)據(jù)丟失,對 于所有的組織來說,都無疑是一場災(zāi)難,因為它除了會給企業(yè)帶來重大的經(jīng)濟損 失以外,甚至有可能動搖企業(yè)的生存基礎(chǔ)。所以,加大保護數(shù)據(jù)安全的力度,已 經(jīng)成為了越來越多企業(yè)的共識。 歸檔管理是備份中的一個重要環(huán)節(jié),也是和最終用戶直接交互最多的環(huán)節(jié)。 在大量、長期的備份工作中,會留存下大數(shù)據(jù)量的歸檔集,他們可能來自于不同 的主機、操作系統(tǒng),具有不同的數(shù)據(jù)資源類型、備份類型、時態(tài)特性。散落無組 織的歸檔數(shù)據(jù)是無意義的,不可管理的,難于恢復(fù)的。只有通過精心設(shè)計的技術(shù) 手段,將歸檔數(shù)據(jù)集有效的組織起來,使用一定的視角和方法學(xué)將其納入特定的 管理體系,才能使得大量的歸檔數(shù)據(jù)集可控、可管理,恢復(fù)時候方能發(fā)揮巨大作 用。所以,日益膨脹的數(shù)據(jù)量和精準(zhǔn)的備份恢復(fù)操作要求都對歸檔集的管理提 出了新的考驗。如何在復(fù)雜大量的歸檔集上進行有效的數(shù)據(jù)管理,是存儲備份 領(lǐng)域的熱點問題。 1 2 現(xiàn)有工作基礎(chǔ) 中山大學(xué)軟件研究所和廣州威騰網(wǎng)絡(luò)科技有限公司合作的數(shù)據(jù)備份系統(tǒng)項 目,著力研究數(shù)據(jù)備份領(lǐng)域的關(guān)鍵問題和技術(shù),并建立了理論模型、備份通用模 型和存儲模型等。并研制誕生了優(yōu)秀的企業(yè)數(shù)據(jù)容災(zāi)備份產(chǎn)品n e t b u n k e r 3 1 。在 基于元數(shù)據(jù)的檔案集管理程序鶴圣計與實現(xiàn)中山大學(xué)硬士生學(xué)位論文 這些成果的基磕e ,開發(fā)了新的個人數(shù)據(jù)備份工具p r 嘣缸抑憫r v ,并提供了相應(yīng) 的歸檔管理方案。本文內(nèi)容即是在此歸檔管理方案的研制過程中的一些工作。 p r o r e c o v e r y 采用插件式結(jié)構(gòu)處理流式備份數(shù)據(jù),在磁盤上寫入備份歸檔。 保存的歸檔的頭部寫入了由威騰公司定義的歸檔文件的通用頭結(jié)構(gòu)u d s ( u n i f i e dd a t as t r u c t u r e ) 記錄了關(guān)于此歸檔的來源類型時態(tài)基本屬性等翔實的元 信息,并制定了此頭結(jié)構(gòu)的類型、大小、讀寫方式等基本規(guī)范。 1 3 本文的工作 對元數(shù)據(jù)在數(shù)據(jù)管理中的應(yīng)用的研究,多見于電子商務(wù)文件管理、電子政務(wù)、 單位檔案管理等領(lǐng)域【1 1 2 1 。而在備份領(lǐng)域鮮有專門提及,但是實際使用相當(dāng)廣泛。 日常用的歸檔軟件如r a t , z i p ,t a r ,僅具有為文件壓縮打包功能,成為散落無組 織的數(shù)據(jù)。大型備份存儲軟件( 如v e r i t a s ) 管理界面略顯繁瑣不明晰,并且缺少 對時態(tài)信息的有效表達(dá)。一些小型備份軟件( 如s q l s r v ) 有強烈的時態(tài)信息, 但只能管理單一來源的數(shù)據(jù)。 p r o r e c o v e r y 采用的u d s 頭結(jié)構(gòu)為管理多來源、多類型、時態(tài)特征明顯的大 歸檔集提供了可能。本文即在此結(jié)構(gòu)基礎(chǔ)之上,進行適當(dāng)?shù)臄U展,作為本文研究 的基本數(shù)據(jù)結(jié)構(gòu)。 本文的主要工作有: 1 對歸檔環(huán)境中的元數(shù)據(jù)、元數(shù)據(jù)分類樹做了半形式化的歸納描述。 2 對由分類樹表示的歸檔集合上進行的各種操作進行了總結(jié),并給出了相 應(yīng)的算法描述。提出了歸檔系統(tǒng)管理的通用特性。 3 設(shè)計了實際操作歸檔集合的軟件工具a r c h m n g ,進行了如下工作: 幻類體系設(shè)計,設(shè)計了分類樹數(shù)據(jù)結(jié)構(gòu)、歸檔管理類等可重用組件, 設(shè)計實現(xiàn)了一套命令行工具框架和一組命令行u i 類體系,使得創(chuàng)建、 擴展命令行工具更簡便清晰,輸入輸出結(jié)構(gòu)化信息更具語義特性。 b ) 緩存策略設(shè)計。在歸檔集的分布式元數(shù)據(jù)管理基礎(chǔ)上適當(dāng)引入集中 元數(shù)據(jù)緩存的思想,設(shè)計實現(xiàn)了元數(shù)據(jù)與分類樹緩存機制,利用歸 檔極少改動的特點在大規(guī)模歸檔集的情形下能夠保持良好的性能。 2 基于元數(shù)據(jù)的檔案集管理程序的設(shè)計與實理 中i i 畎:學(xué)磺士生季位論文 4 實現(xiàn)了a r e l l m t l g 命令行工具,設(shè)計了結(jié)構(gòu)化的命令行輸出,使得工具適 用于腳本編寫、圖形界面封裝。 5 在命令行基礎(chǔ)上封裝實現(xiàn)了圖形界面管理工具a r c t m l w i n ,完全利用命 令行工具獲得功能,而不具體操作歸檔。并且可以執(zhí)行遠(yuǎn)程命令行。 本文在厘清了若干基本內(nèi)容與現(xiàn)狀( 第二章) 之后,在第三章針對檔案集管 理的需求提出了元數(shù)據(jù)模型,總結(jié)了一般的元數(shù)據(jù)組織模型。對元數(shù)據(jù)的組織、 管理、元數(shù)據(jù)樹進行了建模。重點探討了元數(shù)據(jù)分類樹的若干性質(zhì),并提出了元 數(shù)據(jù)樹的分類方法和生成算法,以及形式化了分類、刪除、遷移、驗證、搜索等 常用操作。最后指出了對于不同歸檔類型的操作一致性并討論了其形式化意義。 第四章敘述了在前述模型指導(dǎo)下程序工具的詳細(xì)設(shè)計和實現(xiàn),分析了元數(shù)據(jù)的存 儲與組織形式,并設(shè)計了元數(shù)據(jù)現(xiàn)場組織與緩存的策略,介紹了一個通用的元數(shù) 據(jù)樹管理命令行框架并設(shè)計了其插件結(jié)構(gòu),實現(xiàn)了其圖形界面的包裝。第五章對 討論進行了總結(jié)并指出檔案管理系統(tǒng)的一般特性。 3 基于元羹蠡晦欄宴集管理程亭白譬設(shè)計與宴琨中山大學(xué)碩士生學(xué)位論文 第二章基本概念、背景與現(xiàn)狀 2 1 數(shù)據(jù)備份的發(fā)展歷程 從數(shù)據(jù)備份的發(fā)展過程而言,一句話可以概括為,備份的發(fā)展貫穿了計算機 的發(fā)展史,備份發(fā)展史是計算機發(fā)展史的縮影,它經(jīng)歷了三個階段【4 】: 1 單機備份:多以“單機處理,軟盤交流”的個人行為為主,無計劃,隨機性 很大,備份沒有得到重視;備份的形式通常就是對要備份的文件復(fù)制到硬盤 的另一個位置或者軟盤上,數(shù)據(jù)得不到有效的保護。 2 局域網(wǎng)環(huán)境備份:數(shù)據(jù)共享顯得日益重要,數(shù)據(jù)備份得到了應(yīng)有的重視,成 為系統(tǒng)管理員或應(yīng)用操作員日常工作的一部分;備份的數(shù)據(jù)是網(wǎng)絡(luò)中整個企 業(yè)的數(shù)據(jù),介質(zhì)以磁帶為主,不再是以前的盤對盤的備份,但依然是系統(tǒng)管 理員的手工作業(yè),通常是通過備份工具或是備份命令腳本進行人機交互執(zhí) 行,效率不高,成為系統(tǒng)管理員工作領(lǐng)域中繁重的負(fù)擔(dān);還沒有出現(xiàn)商業(yè)化 備份軟件,研究性備份系統(tǒng)開始誕生。 3 基于i n t c m e t i n t r a n e t 的應(yīng)用環(huán)境下的備份:典型表現(xiàn)是整個企業(yè)業(yè)務(wù)流程依 賴于i n t e m e t i n t r a n e t 網(wǎng)絡(luò)環(huán)境;網(wǎng)絡(luò)應(yīng)用更加復(fù)雜化,數(shù)據(jù)種類增加,異種 數(shù)據(jù)庫、多種文件系統(tǒng)和操作平臺呈現(xiàn)在異構(gòu)的企業(yè)計算機網(wǎng)絡(luò)中:數(shù)據(jù)量 劇增,存儲空間增大;數(shù)據(jù)存儲位置變得分散;出現(xiàn)n a s 和s a n 存儲機制, 備份技術(shù)在結(jié)構(gòu)上也得到了長足的發(fā)展,從l a nf r e e 備份到無服務(wù)器備份, 基本工作機制也逐步得到更新。 網(wǎng)絡(luò)環(huán)境和應(yīng)用系統(tǒng)的日趨復(fù)雜化,計算機數(shù)據(jù)處理出現(xiàn)了許多的問題: 口 數(shù)據(jù)管理工作難以形成制度化,數(shù)據(jù)丟失現(xiàn)象難以避免; 口 數(shù)據(jù)分散在不同的主機、應(yīng)用系統(tǒng)上,管理分散,安全性得不到保障; 口 難以實現(xiàn)數(shù)據(jù)庫數(shù)據(jù)的高效在線備份; 口 運行著的系統(tǒng)使得維護人員寸步難離,業(yè)務(wù)人員工作效率下降; 口 存儲介質(zhì)管理困難; 4 基于元數(shù)據(jù)的檔案集管理程序的設(shè)計與實現(xiàn)中l(wèi) i 西焉蛹瞄學(xué):位論文 口 歷史數(shù)據(jù)保存困難; 口 非計算機系統(tǒng)因素的隱患。 尤其應(yīng)用環(huán)境發(fā)生了革命性的變化,數(shù)據(jù)備份工作隨之變革的結(jié)果就是企業(yè) 級備份軟件的出現(xiàn)。備份軟件針對上述問題,需要適應(yīng)新環(huán)境下的備份需求: 口 需要克服數(shù)據(jù)的分散給備份帶來的困難; 口 需要應(yīng)付種類繁多的數(shù)據(jù)類型; 口 需要大容量的存儲介質(zhì)并對存儲介質(zhì)進行更好的管理; 口 備份不能影響企業(yè)應(yīng)用系統(tǒng)的可用性; 口 備份日志信息應(yīng)能有效管理并在此基礎(chǔ)上的提供報表分析功能; 口 備份操作應(yīng)該簡單易行。 2 2 基本定義 世界著名的數(shù)據(jù)備份專家wc u r t i sp r e s t o n 在其名著( u n i xb a c k u pa n d r e c o v e r y 一書中對備份作出如下定義【5 】: 備份= 拷貝+ 管理 這個簡潔的公式,表明了數(shù)據(jù)備份中的主要問題,所謂拷貝,就是對數(shù)據(jù)執(zhí) 行移動,復(fù)制等,所謂管理,就是對備份數(shù)據(jù)進行索引。 在參考文獻(xiàn)6 中,對網(wǎng)絡(luò)數(shù)據(jù)備份系統(tǒng)給出了更加詳細(xì)和準(zhǔn)確的定義【6 】,即: 備份= 拷貝+ 變換+ 傳輸+ 存儲+ 管理 換句話說,備份系統(tǒng)的功能就是對各種需要備份的資源使用對應(yīng)的方式進行 拷貝,然后根據(jù)需要對原始數(shù)據(jù)進行一系列數(shù)據(jù)變換,通過不同層次的網(wǎng)絡(luò)傳輸 協(xié)議和通道技術(shù)傳輸?shù)浇橘|(zhì),最后以適當(dāng)?shù)拇鎯Y(jié)構(gòu)存儲在選定的介質(zhì)上,并且 整個流程以及相關(guān)的資源都處于備份中心的集中管理調(diào)度之下。 在p r o r e c o v c r y 系統(tǒng)中,為了方便界面的陳述和對備份機制與流程的規(guī)范化, 我們對備份語境下的若干基本概念做了界定: 【定義】備份對象是指一系列備份目標(biāo)資源,如文件系統(tǒng)、數(shù)據(jù)庫等,他們 通常是一個選定的可備份資源子集。 在一個企業(yè)i t 基礎(chǔ)設(shè)施構(gòu)架的環(huán)境中,首先,備份對象可能來自于不同的 5 基于元素?fù)?jù)盼擋寨集管理程序煎置計與實琨 中山大學(xué)碩士生學(xué)位論文 很多主機,典型情況下都是處在同一個局域網(wǎng)或者v p n 內(nèi)的主機。其次,各份 對象具有多種類型,常見的例如文件系統(tǒng),例如數(shù)據(jù)庫表,數(shù)據(jù)庫日志,o u t l o o k 郵件等。再次,一個特定類型的備份對象,是由用戶選定的這個主機中具有這個 類型的資源一個子集。例如用戶可以選定名為d a t a s r v 的主機上文件系統(tǒng)中 h o m e d a t a o p 目錄、e t c c o n f 目錄這兩個目錄一起作為一個備份對象。 【定義】在備份操作中,實際的備份對象表現(xiàn)為一個邏輯上具有組織結(jié)構(gòu)的 集合被操作( 選擇、運算、存儲) ,稱作備份集。備份集可以有全備、差備等類 型。 備份對象與備份集的差異在于,備份對象指的是備份前存在于主機上需要被 操作的數(shù)據(jù),而備份集是將備份對象的數(shù)據(jù)在指定的操作中與結(jié)果后形成的數(shù)據(jù) 集。關(guān)于備份集的全備差備增備的類型差別在后節(jié)有詳細(xì)討論。 【定義】歸檔文件是備份集經(jīng)過備份操作后存儲下來的實際物理形式,具體 可以表現(xiàn)為磁帶記錄、光盤內(nèi)容、磁盤文件等。 歸檔文件是動態(tài)的備份集最終形成的持久化形態(tài)。在p r o r e c o v e r y 系統(tǒng)中, 根據(jù)其針對個人備份的需求,一律采用了磁盤文件的歸檔形式。下文中除非特別 指出,也一律指磁盤文件形式的歸檔文件。根據(jù)所存儲的備份集類型,歸檔文件 相應(yīng)的也有全備差備之分。 2 3 數(shù)據(jù)備份的分類 按照備份操作的方式分類,備份可分為完全備份和增量備份,差異備份【7 1 。 完全備份用于復(fù)制所有選定的文件,并且在備份后標(biāo)記每個文件( 即清除存 檔屬性) 。也就是說,正常備份是復(fù)制所有要備份的文件,并且在備份后清除所 有文檔的存檔”屬性,這樣在下次備份時,備份軟件會認(rèn)為這些文件都還沒有被 備份。 增量備份則是另一種形式,它僅備份自上次正常或增量備份以來創(chuàng)建或更改 的文件,并且將這些文件標(biāo)記為已經(jīng)備份。舉例來說,當(dāng)?shù)谝淮芜M行完全備份后, 所有文檔的“存檔”屬性被清除,而在新建或修改這些文件后,文件重新被加上存 檔”屬性,增量備份就是備份這些文件,并且在備份后將這些文件的“存檔”屬性 6 基于元數(shù)據(jù)的檔案集管理程序的設(shè)計與實現(xiàn)中i l 慶學(xué)碩士生學(xué)位論文 清除,以保證下次不再備份這些文件。 差異備份用于復(fù)制自上次正?;蛟隽總浞菀詠硭鶆?chuàng)建或更改的文件。它不將 文件標(biāo)記為已經(jīng)備份( 即沒有清除存檔屬性) 。完全或增量備份去掉了文件的“存 檔”屬性,在新文件創(chuàng)建或舊文件被修改后,文件重新被加上了“存檔”屬性,差 異備份就是備份這類文件。在備份完畢后,差異備份并不會清除這類文件的“存 檔”屬性,這樣的話,在下次運行差異備份的時候,只要在此期間上次差異備份 的文件沒有被更改,則它們還會包含在備份集中,將被再次備份。 三種方式各有各的優(yōu)勢,正常備份和差異備份恢復(fù)容易,增量備份則占用空 間小和花費時間短。 按照備份數(shù)據(jù)對現(xiàn)有應(yīng)用產(chǎn)生的影響程度,可分為離線備份和在線備份。離 線備份( o f f - l i n eb a c k u p ) ,它是在進行備份操作時,服務(wù)器不再接受來自用戶或 應(yīng)用對數(shù)據(jù)的更新。離線備份可以很好地解決在備份過程中數(shù)據(jù)的完整性的問 題,是防止破壞、敵意病毒襲擊、應(yīng)用失誤等的有效方式。在線備份( o n - l i n e b a c k u p ) ,就是用戶和應(yīng)用正在更新數(shù)據(jù)時系統(tǒng)能夠進行備份。在線備份最大的 難點是如何保持?jǐn)?shù)據(jù)的完整性。為了保護數(shù)據(jù)的完整性,可以采用兩種技術(shù):鎖 和快照。鎖技術(shù)就是系統(tǒng)在備份某一文件時拒絕對該文件和目錄的任何修改命 令,因而鎖技術(shù)會對數(shù)據(jù)可用性產(chǎn)生一定的影響,在應(yīng)用持續(xù)的同時進行備份不 可避免地降低了系統(tǒng)性能??煺帐峭ㄟ^內(nèi)存作為緩沖區(qū)( 快照c a c h e ) ,由軟件提 供系統(tǒng)磁盤存儲的即時數(shù)據(jù)映像。目前,在線備份大多采用快照技術(shù)。 根據(jù)備份數(shù)據(jù)所處的位置可分為本地備份和遠(yuǎn)程備份。本地備份,即通過存 儲網(wǎng)絡(luò)將數(shù)據(jù)備份在局域網(wǎng)范圍內(nèi)的備份。這種方式可利用現(xiàn)有的各種資源和技 術(shù)來達(dá)到高速的備份。它的性能可以很好地滿足實際需要,如數(shù)據(jù)一致性、容錯 等要求,而且性能是最高的。遠(yuǎn)程備份,在數(shù)據(jù)高可用性的網(wǎng)絡(luò)環(huán)境中,異地數(shù) 據(jù)備份是一個必不可少的手段。當(dāng)本地應(yīng)用受到災(zāi)難性破壞時,通過遠(yuǎn)程備份和 容災(zāi),來保護和恢復(fù)數(shù)據(jù),使損失降低到最小。在遠(yuǎn)程備份過程中,數(shù)據(jù)傳輸要 跨越校園網(wǎng)、城域網(wǎng)甚至廣域網(wǎng),這時,網(wǎng)絡(luò)的傳輸速度對備份性能的影響是關(guān) 鍵的因素。延遲也是影響遠(yuǎn)程備份性能的重要因素,特別是廣域網(wǎng)的數(shù)據(jù)庫備份, 可以通過異步的方式來解決。另外,在遠(yuǎn)程備份中還要解決數(shù)據(jù)的完整性和一致 性問題,解決這個問題比較成熟的技術(shù)是采用快照和鏡像相結(jié)合的方法。 7 基于元象據(jù)酶擋案集管理程亭疇霞計與宴理中t l r - & 季碩士生學(xué)位論文 在p m r o c o v e r y 中歸擋類型均采用全備與增備的方式。 【定義】對一個特定的備份對象的一次全備與到下一次全備之間的所有增備 形成一個生命周期。 在一個生命周期內(nèi)的歸檔文件,是可以將備份對象恢復(fù)到某一個確定時刻所 需要的歸檔集合的閉包。生命周期之外的歸檔對于本次恢復(fù)無用。 2 4 已有的數(shù)據(jù)備份產(chǎn)品簡介 在國際上,。目前有成熟的企業(yè)級備份軟件,有相當(dāng)多大規(guī)模的獨立軟件供應(yīng) 商,而且從事備份軟件研發(fā)的公司和機構(gòu)組織也有很多。目前備份軟件市場主要 被c a 、v e r i t a s 、l e g a t o 三大公司所占領(lǐng),另外還有i b m 、h p 、c o m p a r e 這些硬件廠商也推出了自己的備份軟件。其中c a 、v e r i t a s 、l e g a t o 和i b m 四 家公司的備份系統(tǒng)在目前來說占有了相當(dāng)大的市場份額?,F(xiàn)對它們逐一做個簡單 介紹【4 】: ( i ) c a 公司的產(chǎn)品主要有兩個系列:a r c s e r v e l t 系列和b r i g h t s t o r e 系列。 這兩個系列提供高性能、易于管理性和卓越的可靠性。 ( 2 ) v e r i t a s 主要有n e t b a c k u p 與b a c k u p e x e e 等產(chǎn)品。n e t b a c k u p 軟件是一 個功能強大的企業(yè)級數(shù)據(jù)備份管理軟件,它為w i n d o w sn t 、u n i x 和n e t w a r e 環(huán)境提供了完整的數(shù)據(jù)保護機制,具有保護企業(yè)中從工作組到企業(yè)級服務(wù)器的所 有數(shù)據(jù)的能力。b a c k u pe x e e 軟件是一種多線程、多任務(wù)的存儲管理解決方案, 專為在單一的或多節(jié)點的w m d o w s2 0 0 0 n t 企業(yè)環(huán)境中進行數(shù)據(jù)備份、恢復(fù)、 災(zāi)難恢復(fù)而設(shè)計,使用于單機w i n d o w s2 0 0 0 n t 工作站、小型局域網(wǎng)以及異構(gòu) 的企業(yè)網(wǎng)絡(luò)。 ( 3 ) l e g a t o 研制開發(fā)的n e t w o r k e r 數(shù)據(jù)存儲管理系統(tǒng)采用多服務(wù)器網(wǎng)絡(luò)環(huán)境 平行作業(yè)處理技術(shù),完全支持關(guān)鍵備份服務(wù)器集群、n a s 文件服務(wù)器的本地和 三向備份以及l(fā) a n f r e e 備份,并支持多種應(yīng)用和數(shù)據(jù)庫的在線備份和恢復(fù)。 ( 4 ) i b m 的t i v o l i 管理環(huán)境是一個用于網(wǎng)絡(luò)計算管理的集成的產(chǎn)品家族。它 可以將數(shù)據(jù)的備份和歸檔拷貝存放在離線的存儲介質(zhì)上,從而保護組織的數(shù)據(jù)免 受硬件故障和其它錯誤操作的破壞。 基于元煎據(jù)的檔案集管理程序的設(shè)計與實琨 中i i 睜:學(xué)碩士生學(xué)位論文 其他的備份存儲廠商還有b a 齜,昆聘等。以及相關(guān)的歸檔軟件如 p e t a - s e r v e 、s t o r n e x t - s a n 、a 加笛s 、d i 5 j 旺x t 臣d 、s a m f s 、v 茁i t a sh s m 等。 這些國外的比較成熟的備份軟件產(chǎn)品占據(jù)備份的高端市場,提供大而全的功 能,對資源的配置條件要求較高,對我國當(dāng)前的中小企業(yè)的來說購買這些產(chǎn)品的 成本投資比較大,不適合國內(nèi)中小企業(yè)的具體情況。 國內(nèi)推出了自主開發(fā)的具有一定的市場占有率的備份軟件的軟件企業(yè)規(guī)模 有限。除了一些自由軟件之外,大部分企業(yè)都選擇前述的三大公司的備份軟件產(chǎn) 品。國內(nèi)在該領(lǐng)域的軟件大部分都是較小規(guī)模公司制作的備份系統(tǒng),優(yōu)勢和強度 以及技術(shù)含量并不明顯。 國內(nèi)在備份軟件開發(fā)領(lǐng)域起步較晚,在有效的備份服務(wù)器和介質(zhì)服務(wù)器的設(shè) 備管理方面的研究還有待走到深入的階段。 2 5p r o r e c o v e r y 簡介 p r o r e e o v e r y 數(shù)據(jù)備份軟件是廣州威騰網(wǎng)絡(luò)科技公司( v i t o n ) 自主研發(fā), 獨立定義了備份數(shù)據(jù)存儲結(jié)構(gòu)和一套算子運行框架的數(shù)據(jù)備份軟件,可應(yīng)用于本 地和網(wǎng)絡(luò)數(shù)據(jù)備份。該軟件最大的特點是把數(shù)據(jù)備份和還原操作插件化,插件接 口協(xié)議化,提供了一部分?jǐn)?shù)據(jù)處理功能,實現(xiàn)了算子的升級和校驗。 2 5 1p r o r e c o v e r y 系統(tǒng)運行框架 本文所討論的歸檔由p r o r e c o v e r y 數(shù)據(jù)備份系統(tǒng)產(chǎn)生,討論實現(xiàn)的工具作為 p r o r e e o v e r y 的輔助管理工具。首先介紹該系統(tǒng)的體系結(jié)構(gòu)和運行框架i s 。 9 基于元妻據(jù)蜉苣蹇集管理程序疇圣計與宴理中山大學(xué)硬士生學(xué)位論文 主攔程哆 數(shù)據(jù)激 圖2 1 p r o r e e o v e r y 是一個基于流式數(shù)據(jù)的數(shù)據(jù)備份系統(tǒng),備份系統(tǒng)的處理對象是 一條數(shù)據(jù)流,數(shù)據(jù)流由讀算子從數(shù)據(jù)源讀出,經(jīng)過主控程序的規(guī)劃,依次流過數(shù) 據(jù)處理算子鏈,受到算子的數(shù)據(jù)處理“指令”,數(shù)據(jù)經(jīng)過處理后成為一個備份集, 最后由寫算子寫入備份介質(zhì)的一種機制。 2 5 2p r o r e c o v e r y 備份系統(tǒng)的備份集結(jié)構(gòu) p r o r e e o v e r y 系統(tǒng)的數(shù)據(jù)備份集結(jié)構(gòu)為u d s ( u n i v e r s a ld a t as t r u e t u r e ) 結(jié)構(gòu)t 9 1 , 簡單來說,u d s 結(jié)構(gòu)就是備份集的數(shù)據(jù)結(jié)構(gòu),其結(jié)構(gòu)圖如下: 圖2 2 如圖所示,一個完整的備份集由g h ,d a t a 和g t 組成,其中,g h 代表 u d s 的頭結(jié)構(gòu),存放用于備份恢復(fù)代理和變換模型需要的數(shù)據(jù);備份恢復(fù)代理 在調(diào)用變換模型的時候,填充好代理相關(guān)的元數(shù)據(jù)部分,而與變換模型相關(guān)的部 分,由變換模型根據(jù)相關(guān)信息進行填充。具體說來,與變換模型相關(guān)的元數(shù)據(jù)包 括:所使用的算子的名稱、版本號、參數(shù),加載算子的順序等。 i o 基于元螽據(jù)的擋案集管理程序的設(shè)計與實現(xiàn)中i i 時擷士生學(xué)位論文 d a t a 是實體數(shù)據(jù),是指那些描述數(shù)據(jù)流信息和變換處理信息的數(shù)據(jù),實體 數(shù)據(jù)是備份恢復(fù)的數(shù)據(jù)對象本身,是無結(jié)構(gòu)的渣序列。 g t 表示尾結(jié)構(gòu),用于變換模型,主要存放算子處理后的結(jié)果信息,包括副 作用數(shù)據(jù)和一些統(tǒng)計信息等。尾結(jié)構(gòu)在算子對數(shù)據(jù)塊進行處理后,由變換模型填 寫。 g h 和g t 統(tǒng)稱為元數(shù)據(jù),元數(shù)據(jù)使數(shù)據(jù)流在一定程度上實現(xiàn)自描述,他的 最主要作用是恢復(fù)數(shù)據(jù)時的索引重建。而本文所討論的元數(shù)據(jù),就位于u d s 的 g h 部分。 基于元敦?fù)?jù)白孽擋案集管理程序舶圣計與實理中山大學(xué)碩士生學(xué)位論文 3 1 元數(shù)據(jù)概述 第三章元數(shù)據(jù)管理模型 3 1 1 元數(shù)據(jù)的通用定義 根據(jù)電子文件歸檔與管理規(guī)范這一國家標(biāo)準(zhǔn),電子文件的元數(shù)據(jù)m e t a d a t a 被定義為【1 0 】:“描述電子文件數(shù)據(jù)屬性的數(shù)據(jù),包括文件的格式、編排結(jié)構(gòu)、硬 件和軟件環(huán)境、文件處理軟件、字處理軟件和圖形處理軟件、字符集等數(shù)據(jù)?!?因此,元數(shù)據(jù)實際上就是對數(shù)據(jù)進行著錄而得到的著錄信息,這些著錄信息專門 用于電子文件的管理,以保證電子文件的真實性、可靠性,元數(shù)據(jù)就是為了提高 電子文件的憑證性而提出來的。 元數(shù)據(jù)最本質(zhì),最抽象的定義為:d a t aa b o u td a t a ( 關(guān)于數(shù)據(jù)的數(shù)據(jù)) 。它是一 種廣泛存在的現(xiàn)象,在許多領(lǐng)域有其具體的定義和應(yīng)用。在軟件構(gòu)造頂域,元數(shù) 據(jù)被定義為:在程序中不是被加工的對象,而是通過其值的改變來改變程序的行 為的數(shù)據(jù)。它在運行過程中起著以解釋方式控制程序行為的作用。在程序的不同 位置配置不同值的元數(shù)據(jù),就可以得到與原來等價的程序行為。 隨著數(shù)字信息環(huán)境的發(fā)展,元數(shù)據(jù)的性質(zhì)、范圍和作用也不斷深入。對元數(shù) 據(jù)最為權(quán)威的衍生定義有兩個【l l 】: 第一個是國際標(biāo)準(zhǔn)組織制定的國際標(biāo)準(zhǔn)( d s o i e c l l l 7 9l 信息技術(shù)一元 數(shù)據(jù)注冊一一第一部分:數(shù)據(jù)元素的說明及標(biāo)準(zhǔn)化框架中所定義的:“元數(shù) 據(jù)是定義和描述其他數(shù)據(jù)或過程的數(shù)據(jù)”。 第二個是國際著名的元數(shù)據(jù)標(biāo)準(zhǔn)化機構(gòu)都柏林元數(shù)據(jù)機構(gòu)制定的都 柏林核心元數(shù)據(jù)應(yīng)用中所定義的:“元數(shù)據(jù)是關(guān)于數(shù)據(jù)的結(jié)構(gòu)化數(shù)據(jù)”。 1 2 基于元致?lián)膿醢讣芾沓绦蚯霸O(shè)計與實現(xiàn)中l(wèi) ir 大季碩士生學(xué)位論文 3 1 2 元數(shù)據(jù)的適用性質(zhì) 從元數(shù)據(jù)在組織信息資源的功篦上區(qū)分,元數(shù)據(jù)有以下四種類型【1 2 】: 管理型元數(shù)據(jù):用來管理與支配信息資源的元數(shù)據(jù),如信息收集、版權(quán)與 翻版跟蹤、排架信息、數(shù)字化標(biāo)準(zhǔn)選擇、版本控制等 描述型元數(shù)據(jù):用來描述與識別信息資源的元數(shù)據(jù),如記錄編目、尋找?guī)?助、專題索引、資源鏈接、用戶注釋等。 保存型元數(shù)據(jù):與信息資源保存管理有關(guān)的元數(shù)據(jù),如資源的物質(zhì)條件、 數(shù)字資源的保存行為( 數(shù)據(jù)更改與遷移) 。 技術(shù)型元數(shù)據(jù):與系統(tǒng)怎樣運行有關(guān)的元數(shù)據(jù),如硬件與軟件、數(shù)字化信 息的格式、壓縮比率、定標(biāo)例程、系統(tǒng)響應(yīng)跟蹤、數(shù)據(jù)驗證與安全( 如加密鍵、 密碼) 等。 2 0 0 1 年頒布的國際標(biāo)準(zhǔn)x 5 0 1 5 4 8 9 信息與文獻(xiàn)文件管理所定義的電 子文件管理元數(shù)據(jù)是【l l 】:“在文件管理領(lǐng)域,元數(shù)據(jù)是指自始至終地描述文件的 背景、內(nèi)容、結(jié)構(gòu)及其管理的數(shù)據(jù)”。電子文件管理元數(shù)據(jù)是一個結(jié)構(gòu)化的標(biāo)準(zhǔn) 體系,其目的是對電子文件進行組織、管理、發(fā)現(xiàn)、識別、選擇、定位、開發(fā)、 利用和評價,追蹤電子文件在管理和使用過程中的變化,有助于實現(xiàn)電子文件信 息資源的憑證價值、集成整合與長期保存。 電子文件管理元數(shù)據(jù)通過對電子文件的“背景、內(nèi)容、結(jié)構(gòu)、管理”的控 制,來確保電子文件具有如下特性【l l 】: 1 真實性:即具有背景、結(jié)構(gòu)和內(nèi)容的文件其原始特征自始至終地保持一致, 文件就是文件的本身; 2 可靠性:即文件作為可靠憑證的性質(zhì),文件作為證據(jù)的權(quán)威性和可信賴 性; 3 完整性:即文件是完全的,并且未作任何改變; 4 可使用性:即定位、檢索、顯示和說明文件的性質(zhì)。 而電子文件只有具備了以上這些特征之后,才能被稱為真正意義上的具有檔 案憑證價值的電子文件。電子文件管理元數(shù)據(jù)的“控制”機理,是使電子文件 免于失去“真實性、可靠性、完整性和可使用性的保證,是防范威脅這些本 質(zhì)特征的風(fēng)險產(chǎn)生的關(guān)鍵措施。 1 3 基于元重蠡晦直塞集管理程撇計與實現(xiàn)中山大學(xué)硬士生學(xué)位論文 3 2 歸檔的分類管理需求與特點 在局域網(wǎng)多數(shù)據(jù)源的環(huán)境中,各種備份集生成的歸檔文件來源于不同的主 機、具有不同的數(shù)據(jù)源類型,包含不同的數(shù)據(jù)源集合,從屬于各自的生命周期, 生命周期中的歸檔具有相互依賴的關(guān)系。所以歸檔文件除了自身的備份數(shù)據(jù)外, 還隱含有豐富的描述自身屬性的信息。傳統(tǒng)的備份環(huán)境下的人工標(biāo)簽、介質(zhì)實體 的分類存放等就表達(dá)了這樣的自描述信息。在歸檔文件中即利用元數(shù)據(jù)來記錄其 自身信息。相較于電子公文、企業(yè)商務(wù)文件、多媒體影音資料、圖書館資料等元 數(shù)據(jù)常見應(yīng)用領(lǐng)域,備份歸檔管理有其固有的特點。通過分析這些管理特點,可 以將元數(shù)據(jù)更有目的的應(yīng)用于歸檔管理之中。歸檔管理的元數(shù)據(jù)特點分析如下: 1 自描述性。歸檔文件的元數(shù)據(jù)信息獲取應(yīng)該僅僅需要歸檔文件本身,而 不需要依賴外部的數(shù)據(jù)來源,才能在大規(guī)模的歸檔管理中靈活擴展,方 便遷移與維護數(shù)據(jù)一致性。因此元數(shù)據(jù)應(yīng)該在歸檔文件內(nèi)部提供,使得 歸檔文件具有自描述的性質(zhì)。 r 一一一 im c t al i i 圖3 1 2 只讀性。備份歸檔的意義在于保留一個特定歷史時刻數(shù)據(jù)的狀態(tài),所以 歸檔文件在產(chǎn)生之后通常是一次寫入極少更改?!皹O少的更改 一般發(fā)生 1 4 基于元敦?fù)?jù)嗚擋塞集管理程序白瑩設(shè)計與實現(xiàn)中l(wèi) l r 大學(xué)碩士生學(xué)位論文 在標(biāo)記刪除、歸擋合并、內(nèi)部資源增減等操作。因此歸檔數(shù)據(jù)具有相當(dāng) 的持久穩(wěn)定性。無雷考慮大量的寫入操作,而需要考慮大量的讀操作, 故會引入緩存策略。 圖孓2 3 真實有效性。真實性包含兩個方面:一是歸檔數(shù)據(jù)需要保證真實可靠, 恢復(fù)之后是有效可用的。二是歸檔自帶的元數(shù)據(jù)自描述信息確實是反映 了其后歸檔數(shù)據(jù)的真實情況。因為有了上述的只讀性,所以可以方便的 在歸檔產(chǎn)生時以及少數(shù)的修改時產(chǎn)生維護校驗碼從而隨時進行一致性校 驗,有效的防止歸檔文件與數(shù)據(jù)的仿冒、篡改。 4 結(jié)構(gòu)規(guī)范。歸檔元數(shù)據(jù)的挑選、格式、數(shù)據(jù)類型、含義都是經(jīng)過事先仔 細(xì)定義的,歸檔文件、讀寫雙方都遵守這個定義。 5 級聯(lián)性。全備與差備的歸檔之間有相互依賴的關(guān)系。在元數(shù)據(jù)中應(yīng)當(dāng)體 現(xiàn)這種關(guān)系。對于刪除、遷移等操作來說,應(yīng)該考慮級聯(lián)操作的因素。 使得一個生命周期的歸檔文件集合的有效性具有原子性。 1 5 基于元妻據(jù)的檔案集管理程序的設(shè)計與實琨中山大學(xué)硬士生學(xué)位論文 對單個門擋操作 !歸檔分屬不問的生命蒯! 期、資添類型等分類 圖3 3 6 樹形結(jié)構(gòu)【4 】。任意系統(tǒng)中的所有備份對象皆可做按劃分關(guān)系做分組, 個分組內(nèi)部可以按照進一步的指標(biāo)劃分。有限次數(shù)的分組的結(jié)果是: 有備份對象呈樹狀分布,樹的每一個結(jié)點都表示一個分組。 圖3 - 4 1 6 基于元蒙蛋白售欄妻集管理程序煎圣計與實現(xiàn) 中山大孝碩士生學(xué)位論文 3 3 擋案管理中的元數(shù)據(jù) 在歸檔文件中也利用了元數(shù)據(jù)來描述檔案自有的信息。作為電子數(shù)據(jù)嵌入在 歸檔文件頭部。具體的組織格式和讀寫方式在后面章節(jié)詳述。下面給出這樣組織 元數(shù)據(jù)的若干形式化描述: 【定義】元數(shù)據(jù)是由元數(shù)據(jù)項( 簡稱項) 組成的集合,一個元數(shù)據(jù)項是一個 - 元組。k e y 表示項的名稱( 鍵) ,v a l u e 表示項值。 元數(shù)據(jù)m ( a ) 可表示為集合 , , ) 。k 。,k :, t 是指定的一組元數(shù)據(jù)項鍵,嵋表示在a 歸檔中n 處項的值。 例如可以指定一個元數(shù)據(jù)項鍵為h o s t
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 深信服aES產(chǎn)品技術(shù)白皮書-V1.5
- 3.3汽化和液化 說課稿2025年初中人教版物理八年級上冊
- 我奮斗我幸福心得體會
- 積極心理學(xué)理論下護理在細(xì)菌性陰道炎患者中的應(yīng)用
- 《會計信息系統(tǒng)應(yīng)用》課件 學(xué)習(xí)情境5 薪資管理系統(tǒng)應(yīng)用
- 餐廚垃圾收運合作協(xié)議書
- 二零二五圖書倉儲與倉儲物流信息化合同樣本
- 二零二五年度辦公大樓自來水供應(yīng)與智能抄表服務(wù)合同
- 健康飲食規(guī)劃實踐指南
- 三農(nóng)村資源利用優(yōu)化方案設(shè)計
- 倉庫收貨流程圖快速指導(dǎo)倉庫新入職人員熟悉收貨流程
- 毛澤東思想和中國特色社會主義理論體系概論智慧樹知到答案章節(jié)測試2023年山東大學(xué)(威海)
- 教學(xué)資源 音樂女駙馬教案
- 幼兒園春季傳染病預(yù)防知識課件
- GB/T 11067.1-2006銀化學(xué)分析方法銀量的測定氯化銀沉淀-火焰原子吸收光譜法
- GA 857-2009貨物運輸微劑量X射線安全檢查設(shè)備通用技術(shù)要求
- 學(xué)校食堂食品安全自查自評表
- 管道防腐檢驗批質(zhì)量驗收記錄
- 出口商業(yè)發(fā)票范本
- (本科)東南亞經(jīng)濟與貿(mào)易全套教學(xué)課件完整版PPT
- 《村級財務(wù)管理培訓(xùn)》PPT課件
評論
0/150
提交評論