版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第2章數(shù)字圖書館的體系結(jié)構(gòu)
2.1數(shù)字圖書館的基本體系結(jié)構(gòu)2.2數(shù)字圖書館的信息體系結(jié)構(gòu)2.3數(shù)字圖書館的技術(shù)體系結(jié)構(gòu)2.4數(shù)字圖書館的系統(tǒng)體系結(jié)構(gòu)2.5數(shù)字圖書館體系結(jié)構(gòu)比較研究第2章數(shù)字圖書館的體系結(jié)構(gòu)
隨著對數(shù)字圖書館研究的逐步深入,國內(nèi)外建立了很多基于各種框架和體系的數(shù)字圖書館,數(shù)字化已經(jīng)成為圖書館發(fā)展的方向。而數(shù)字圖書館主要是研究如何組織數(shù)字化信息,解決各個信息倉儲的互操作,從而形成數(shù)字圖書館基礎(chǔ)體系結(jié)構(gòu),來有效地操作大規(guī)模的、分布的數(shù)字化信息。其目標是實現(xiàn)跨倉儲的統(tǒng)一檢索,為用戶提供一個虛擬的、統(tǒng)一的信息網(wǎng)絡(luò)。因此,數(shù)字圖書館的體系結(jié)構(gòu)是我們在建設(shè)數(shù)字圖書館的過程中考慮和解決的首要問題。而數(shù)字圖書館體系結(jié)構(gòu)解決的主要問題是數(shù)字對象的信息組織結(jié)構(gòu)和分布式信息倉儲的組織結(jié)構(gòu)。本章將分別闡述數(shù)字圖書館的基本體系結(jié)構(gòu)及信息體系結(jié)構(gòu)與技術(shù)、系統(tǒng)體系結(jié)構(gòu),并對數(shù)字圖書館的體系結(jié)構(gòu)進行了詳細的分析比較。2.1數(shù)字圖書館的基本體系結(jié)構(gòu)
數(shù)字圖書館要為用戶提供各種簡單易用,功能強大的知識服務(wù),通常從功能上可將數(shù)字圖書館劃分為:資源庫、命名系統(tǒng)、索引/搜索系統(tǒng)、用戶界面等部分。數(shù)字圖書館的建設(shè)含括各種數(shù)字資源的創(chuàng)建、管理、查詢、利用、存儲的整個過程。自從WilliamY.Arms等于1997年提出了數(shù)字圖書館的信息體系結(jié)構(gòu)以來,數(shù)字圖書館的體系結(jié)構(gòu)也在不斷完善和發(fā)展,并通過許多試驗項目在不斷改進。下面圖2-1代表了數(shù)字圖書館的基本體系結(jié)構(gòu)。2.1數(shù)字圖書館的基本體系結(jié)構(gòu)
圖2-1數(shù)字圖書館的基本體系結(jié)構(gòu)用戶界面命名系統(tǒng)索引/搜索資源庫2.1數(shù)字圖書館的基本體系結(jié)構(gòu)
(1)資源庫。資源庫的功能是存儲和管理各種數(shù)字對象。(2)命名系統(tǒng)。命名系統(tǒng)是針對長期標識符的分配、管理及解析的一個綜合系統(tǒng)。(3)索引/搜索系統(tǒng)。索引可能是由機器的自動掃描、手工錄入和干預(yù)創(chuàng)建的,或者是這二者的結(jié)合。(4)通過用戶界面來實現(xiàn)的。一般情況下,數(shù)字圖書館借助通用的Web瀏覽器作為其用戶界面工具。2.2數(shù)字圖書館的信息體系結(jié)構(gòu)
2.2.1信息體系結(jié)構(gòu)的基礎(chǔ)2.2.2數(shù)字對象集和服務(wù)集2.2數(shù)字圖書館的信息體系結(jié)構(gòu)
數(shù)字圖書館的信息體系結(jié)構(gòu)是指在數(shù)字圖書館中組織信息的結(jié)構(gòu),研究如何有效、靈活地在數(shù)字圖書館中表現(xiàn)豐富多樣的數(shù)字化收藏信息,并使計算機軟件理解數(shù)字信息的結(jié)構(gòu),執(zhí)行用戶所期望的交互式的通用解決方案。信息體系結(jié)構(gòu)是數(shù)字圖書館的一個關(guān)鍵設(shè)計問題,直接影響著數(shù)字圖書館中數(shù)字化資源的存儲、管理和檢索方式,是數(shù)字圖書館體系結(jié)構(gòu)的核心部分2.2.1信息體系結(jié)構(gòu)的基礎(chǔ)
數(shù)字圖書館的信息體系結(jié)構(gòu)就是研究數(shù)字圖書館中數(shù)字信息的組織,首先要對數(shù)字圖書館中的數(shù)字信息有一個基本認識。2.2.1.1數(shù)字信息的概念傳統(tǒng)圖書館不僅收藏有大量的印刷型文本信息,還包括迅速發(fā)展的非文本信息(如照片、圖片、藝術(shù)作品)、視頻音頻資料(如音樂帶、電視電影片、動畫游戲資料)、多維圖像和數(shù)據(jù)(如全息圖像)、數(shù)字流信息(如衛(wèi)星信息、宇宙數(shù)據(jù))及加工成的各種信息庫或數(shù)據(jù)庫等,表明了圖書館信息的豐富性和多樣化。數(shù)字圖書實質(zhì)上就是將上述各種文獻轉(zhuǎn)換成計算機可識別的二進制序列的數(shù)字化信息,其形式如一篇文章、一幅圖片、一首MP3歌曲或一段影像等。數(shù)字化信息的類型是多樣化的。對于不同類型的數(shù)字化信息,均要求按照描述數(shù)字對象或數(shù)字對象集的條例和規(guī)則加以描述,即每種對象用什么標識符,對象集的每個數(shù)字對象及相關(guān)的元數(shù)據(jù)的內(nèi)部結(jié)構(gòu)如何構(gòu)成,數(shù)字對象如何命名及相關(guān)元數(shù)據(jù)如何組成數(shù)字對象集等,從而使計算機能夠和諧理解信息的結(jié)構(gòu),完成用戶的各種查詢要求。
數(shù)字信息的特征(1)相關(guān)性。是指本對象與其他對象的相關(guān)性。(2)數(shù)字格式。同一項目可能用幾種數(shù)字格式進行存儲。(3)數(shù)字對象的變化。數(shù)字對象容易改變,數(shù)字對象應(yīng)該能夠反映這種變化。(4)權(quán)限和許可證。數(shù)字對象的每一個元素都有與之相關(guān)的不同權(quán)限和許可證。2.2.1.3信息體系結(jié)構(gòu)設(shè)計的標準數(shù)字圖書館的信息體系結(jié)構(gòu)是以三個簡單概念為依據(jù)的,即數(shù)據(jù)類型、結(jié)構(gòu)元數(shù)據(jù)和元對象。(1)數(shù)據(jù)類型,數(shù)據(jù)的每一個項目都有一個相關(guān)的數(shù)據(jù)類型,用以描述數(shù)據(jù)的技術(shù)性質(zhì),如格式、處理方法等。(2)結(jié)構(gòu)元數(shù)據(jù),它是指描述資料的類型、標題、著者、版本、相關(guān)關(guān)系和數(shù)字資料的其他特性的元數(shù)據(jù)。它是一種不可再分的元數(shù)據(jù)。如機讀目錄MARC就是一種結(jié)構(gòu)元數(shù)據(jù)。(3)元對象它提供對數(shù)字對象集的引用,最簡單的元對象是一個指向其他數(shù)字對象的調(diào)度碼的列表。(4)數(shù)據(jù)規(guī)范原則為規(guī)范描述結(jié)構(gòu)元數(shù)據(jù)和元對象,應(yīng)制定規(guī)范說明書。該說明書符合下述原則:2.2.1.3信息體系結(jié)構(gòu)設(shè)計的標準1)每一個數(shù)據(jù)項都有一個明確的數(shù)據(jù)類型,類型指定了數(shù)據(jù)的格式和可施加的操作。例如,數(shù)據(jù)的壓縮采用JPEG格式,應(yīng)用特殊方法處理。2)所有的元數(shù)據(jù)都要有明確的編碼。3)每個具有知識產(chǎn)權(quán)的單獨項均應(yīng)賦予句柄標識。4)元對象可用于連接數(shù)據(jù)對象。5)調(diào)度碼可以用于識別元對象中的項目。2.2.2數(shù)字對象集和服務(wù)集
在數(shù)字圖書館建設(shè)中,信息資源的有效組織是一個非常關(guān)鍵的設(shè)計課題。數(shù)字圖書館的信息資源有很多種不同的類型,如何將這些數(shù)字化的信息有效地組織起來首先得建立信息體系結(jié)構(gòu),因此我們數(shù)字圖書館的信息體系結(jié)構(gòu)是將分散在異地的數(shù)字化信息統(tǒng)一起來,構(gòu)成一個虛擬的而且具有優(yōu)化結(jié)構(gòu)的相關(guān)有機實體,為數(shù)字圖書館的應(yīng)用提供統(tǒng)一的資源訪問,并且能方便地對資源進行管理。數(shù)字圖書館的信息體系結(jié)構(gòu)具有開放性,它將數(shù)字圖書館的整個功能劃分為一組定義明確的服務(wù),每一種服務(wù)都通過一種定義明確的協(xié)議來訪問.這種結(jié)構(gòu)為數(shù)字圖書館提供了其必須具備的基本功能,即一組核心服務(wù),是有效管理的數(shù)字對象集(內(nèi)容)和服務(wù)集(功能)的統(tǒng)一。2.2.2.1數(shù)字對象系統(tǒng)(1)數(shù)字對象數(shù)字對象是以一定的結(jié)構(gòu)的數(shù)字形式來表達信息的一種方法,也是網(wǎng)絡(luò)環(huán)境下的數(shù)字材料和數(shù)字圖書館體系結(jié)構(gòu)中存儲信息的基本邏輯單位和實體。一般來說,它是由元數(shù)據(jù)、數(shù)字資料、句柄(調(diào)度碼)組成。數(shù)字對象是由數(shù)字資料(或數(shù)據(jù))和其惟一的標識符——句柄組成的,其中關(guān)于數(shù)據(jù)的信息稱作元數(shù)據(jù)。2.2.2.1數(shù)字對象系統(tǒng)(2)數(shù)字對象集它是同類數(shù)字對象的組合,可用來表示一組有關(guān)聯(lián)的對象,如不同版本的程序、不同格式的文本或不同演奏的音樂作品,或者是平常所說的“報告”、“程序”和音樂作品等,它們常常對應(yīng)于數(shù)字圖書館中的很多對象,可以用數(shù)字對象集來表示。數(shù)字對象集包括組合對象和元對象兩種,組合對象的內(nèi)容包含一組對象,元對象的內(nèi)容包含一組對象的句柄。數(shù)字圖書館的各種信息被描述為數(shù)字對象或數(shù)字對象集時都需要遵循各自的規(guī)則和協(xié)議,這些規(guī)則和協(xié)議規(guī)定了數(shù)字對象逐個描述信息或數(shù)字對象集組合描述信息的方法,明確了每個數(shù)字對象的內(nèi)部結(jié)構(gòu),關(guān)聯(lián)元數(shù)據(jù)以及命名數(shù)字對象的約定等。2.2.2.2倉儲服務(wù)系統(tǒng)倉儲服務(wù)系統(tǒng)的基本存儲單元是數(shù)字對象,整個系統(tǒng)就是為了存儲、訪問、管理數(shù)字對象而設(shè)計的。倉儲也叫數(shù)據(jù)倉庫或資源庫,是一種專門類別的倉庫,特別適于保存含有價值信息的材料,主要是分布式信息倉儲,基本存儲單元是數(shù)字對象。存放數(shù)字信息的倉儲有多種類型,如FTP文檔、Web服務(wù)器、在線數(shù)據(jù)庫等。倉儲是一種可通過網(wǎng)絡(luò)訪問的存儲系統(tǒng),其中存儲的數(shù)字對象可以被存取和檢索。倉儲的實現(xiàn)采用倉儲外殼(接口層)、對象管理層、永久存儲層三層結(jié)構(gòu):2.2.2.2倉儲服務(wù)系統(tǒng)(1)接口層接口層提供用戶接口網(wǎng)關(guān)和倉儲服務(wù)系統(tǒng)的接口,即倉儲訪問協(xié)議的基本服務(wù),此外還提供倉儲服務(wù)系統(tǒng)與名錄服務(wù)系統(tǒng)的接口。(2)對象管理層它是中間管理層,它提供數(shù)字對象中與內(nèi)容無關(guān)的服務(wù)。(3)永久存儲層倉儲中的信息永久保存在對象存儲層中。在這一層實現(xiàn)了數(shù)字對象在倉儲存儲的細節(jié)。而從上一層看,其細節(jié)完全是透明的,這樣就可以提高系統(tǒng)的可擴充性。在這一層中,有三個抽象概念,即分發(fā)器抽象描述(DisseminatorSignature)、分發(fā)器服務(wù)小程序(DisseminatorServer)和訪問管理器服務(wù)小程序(AccessManagerServer)。
2.2.2.3名錄服務(wù)系統(tǒng)又稱命名系統(tǒng),是針對長期標識符即數(shù)字對象名字的分配、管理及解析的綜合系統(tǒng)。名錄服務(wù)系統(tǒng)包括開放的句柄協(xié)議、名域空間和句柄協(xié)議的具體實現(xiàn)。通過句柄協(xié)議,分布式的計算機系統(tǒng)可以存儲數(shù)字資源的名字或者句柄,并且可以將句柄解析成資源所在倉儲的地址信息,從而使用戶可以通過句柄訪問和使用資源。2.2.2.4索引服務(wù)系統(tǒng)索引服務(wù)系統(tǒng)是數(shù)字圖書館信息體系結(jié)構(gòu)的重要組成部分,提供了使用戶通過查詢能夠很容易地從館藏中尋找和發(fā)現(xiàn)所需數(shù)字對象的機制。為了進行聯(lián)合資源發(fā)現(xiàn),數(shù)字圖書中的索引服務(wù)系統(tǒng)主要是由索引服務(wù)器和索引管理器組成。(1)索引服務(wù)器索引服務(wù)器主要是收集關(guān)于數(shù)字對象的信息。(2)索引管理器為了選擇執(zhí)行查詢的索引服務(wù)器,索引管理器必須了解各個索引服務(wù)器的資源。因此,索引管理器必須定期更新索引服務(wù)器中的源列表以及描述源的元數(shù)據(jù)和內(nèi)容摘要.
2.2.2.5用戶接口網(wǎng)關(guān)提供以用戶為中心的數(shù)字圖書館功能接入點。用戶接口網(wǎng)關(guān)負責向用戶提供查詢界面,接受用戶的檢索請求,然后將用戶的檢索請求進行語義規(guī)范和語法轉(zhuǎn)換,選擇合適的館藏服務(wù)進行搜索和訪問,并對返回的命中結(jié)果根據(jù)相關(guān)性、資源類型、數(shù)據(jù)格式等進行過濾、排序或做其他顯示處理。2.3數(shù)字圖書館的技術(shù)體系結(jié)構(gòu)
2.3.1數(shù)字圖書館的網(wǎng)絡(luò)基礎(chǔ)設(shè)施2.3.2資源加工系統(tǒng)2.3.3異構(gòu)資源庫整合系統(tǒng)2.3.4數(shù)字資源的管理與存儲系統(tǒng)2.3.5資源調(diào)度系統(tǒng)2.3.6聯(lián)合編目和館際互借系統(tǒng)2.3.7用戶查詢和服務(wù)系統(tǒng)2.3.8安全認證系統(tǒng)2.3.9版權(quán)保護與電子商務(wù)系統(tǒng)2.3數(shù)字圖書館的技術(shù)體系結(jié)構(gòu)
數(shù)字圖書館的技術(shù)體系結(jié)構(gòu)是建設(shè)數(shù)字圖書館系統(tǒng)的基礎(chǔ),是數(shù)字圖書館在網(wǎng)絡(luò)和計算機技術(shù)上的具體實現(xiàn),是未來信息社會處理、存儲和應(yīng)用數(shù)字化信息的基本構(gòu)架。它的發(fā)展目標是符合下一代互聯(lián)網(wǎng)的發(fā)展趨勢,成為一個高度開放、方便可用的體系結(jié)構(gòu)。在數(shù)字圖書館的建設(shè)中,如何采用國際先進技術(shù),對實現(xiàn)數(shù)字圖書館的體系結(jié)構(gòu)、信息組織方法、系統(tǒng)實現(xiàn)模型和開發(fā)技術(shù)是非常重要的,即建設(shè)網(wǎng)絡(luò)環(huán)境下的開放、廣布、跨平臺的數(shù)字圖書館技術(shù)系統(tǒng)。2.3.1數(shù)字圖書館的網(wǎng)絡(luò)基礎(chǔ)設(shè)施
數(shù)字圖書館發(fā)展的基礎(chǔ)是計算機通信網(wǎng)絡(luò)的發(fā)展,尤其是因特網(wǎng)的發(fā)展,計算機網(wǎng)絡(luò)是數(shù)字圖書館傳輸數(shù)字信息的通道。數(shù)字圖書館網(wǎng)絡(luò)基礎(chǔ)設(shè)施的建設(shè)要綜合考慮網(wǎng)絡(luò)應(yīng)用模式、網(wǎng)絡(luò)操作系統(tǒng)、網(wǎng)絡(luò)組建方案、網(wǎng)絡(luò)管理系統(tǒng)、網(wǎng)絡(luò)技術(shù)選擇及網(wǎng)絡(luò)安全等多方面的問題,解決廣域網(wǎng)的連接和局域網(wǎng)的規(guī)劃。(1)網(wǎng)絡(luò)應(yīng)用模式計算機網(wǎng)絡(luò)應(yīng)用模式的發(fā)展經(jīng)過三個階段:第一階段是以大型機為中心的集中式的應(yīng)用模式;第二階段是以服務(wù)器為中心的計算模式;第三階段是C/S應(yīng)用模式,基于網(wǎng)絡(luò)的分成式應(yīng)用,網(wǎng)絡(luò)的主要作用是通信和資源共享,并且在分布式應(yīng)用中用來支持應(yīng)用進程的協(xié)同工作,完成共同的應(yīng)用任務(wù)。2.3.1數(shù)字圖書館的網(wǎng)絡(luò)基礎(chǔ)設(shè)施
(2)網(wǎng)絡(luò)操作系統(tǒng)平臺及組建方案負責管理整個網(wǎng)絡(luò)資源和方便網(wǎng)絡(luò)用戶的軟件的集合。(3)網(wǎng)絡(luò)技術(shù)的選擇ATM(AsynchronousTransferMode,異步傳輸模式)網(wǎng)絡(luò)具有寬帶、高速、提供服務(wù)品質(zhì)等服務(wù)的多種優(yōu)點,能夠在一個高容量的網(wǎng)絡(luò)結(jié)構(gòu)下將傳輸字符、圖像、音頻和視頻的各種局域網(wǎng)、廣域網(wǎng)和公眾電信網(wǎng)連接在一起。ATM與以前的網(wǎng)絡(luò)技術(shù)的區(qū)別在于它不局限于特定類型的網(wǎng)絡(luò)或特定類型的傳輸。(4)網(wǎng)絡(luò)安全2.3.2資源加工系統(tǒng)數(shù)字資源加工系統(tǒng)要實現(xiàn)對文本、圖像、音頻和視頻等信息及知識的數(shù)字化采集、加工、處理。實現(xiàn)對上述資源進行一次加工,多次使用,適應(yīng)應(yīng)用系統(tǒng)今后的擴展需要。數(shù)字資源采集加工系統(tǒng)主要用于數(shù)字圖書館信息資源庫的建設(shè)。而數(shù)字圖書館中數(shù)字資源的來源主要有兩種途徑:一是將大量現(xiàn)已存在的以不同形式和載體存儲的模擬信息。二是提供直接生成的數(shù)字化信息,以便計算機直接使用.數(shù)字資源加工系統(tǒng)的主要功能是完成對已經(jīng)數(shù)字化的圖書、期刊、古籍、靜止圖像、音頻、視頻、網(wǎng)上資源以及其他的數(shù)字化資源等數(shù)字化信息及知識的組織、加工與處理,實現(xiàn)對數(shù)字化信息資源的深層加工,支持以標準化和規(guī)?;纳a(chǎn)方式進行資源加工,加工的數(shù)字化資源要能夠被多次使用,適應(yīng)數(shù)字圖書館應(yīng)用系統(tǒng)今后的擴展需要。2.3.3異構(gòu)資源庫整合系統(tǒng)
在數(shù)字圖書館建設(shè)前期,各文獻擁有單位已經(jīng)建設(shè)了一批高質(zhì)量的數(shù)據(jù)庫,指導這些數(shù)據(jù)庫整合到數(shù)字圖書館系統(tǒng)中,無疑將極大地豐富了數(shù)字圖書館的內(nèi)容。異構(gòu)資源整合系統(tǒng)不僅要全面整合某一部門原有的分布在不異構(gòu)平臺的高質(zhì)量的數(shù)字資源,還要整合分布在若干不同部門多個系統(tǒng)中的各種類型的數(shù)字資源庫。但從技術(shù)來看,實現(xiàn)這樣的整合系統(tǒng)具有相當高的難度,一方面原有數(shù)據(jù)庫的內(nèi)容是多方面的,其數(shù)據(jù)構(gòu)成形式上有很大的差異;另一方面,原有數(shù)據(jù)庫的實現(xiàn)從系統(tǒng)平臺到應(yīng)用軟件等不盡相同。因此,現(xiàn)在還沒有完全成熟的系統(tǒng)方案可用,參照國外在這方面已經(jīng)進行的工作,建議采用XML技術(shù)封裝,以及異構(gòu)間的協(xié)議將其與數(shù)字圖書館系統(tǒng)連接,使這引起數(shù)據(jù)庫作為數(shù)字圖書的資源得到有效的利用。2.3.4數(shù)字資源的管理與存儲系統(tǒng)
數(shù)字圖書館的數(shù)字資源由元數(shù)據(jù)和對象數(shù)據(jù)構(gòu)成,而數(shù)字資源的管理與存儲是數(shù)字圖書館的核心功能。原則上,元數(shù)據(jù)相對而言集中存放,對象數(shù)據(jù)分布存放。大規(guī)模資源管理與存儲系統(tǒng)要實現(xiàn)所有數(shù)字資源的存儲管理,包括根據(jù)國內(nèi)外相關(guān)標準和規(guī)范定義的元數(shù)據(jù)和數(shù)字對象的存儲格式、存儲協(xié)議、維護元數(shù)據(jù)和數(shù)字對象的完整性和一致性,以及在分布式網(wǎng)絡(luò)環(huán)境下提供大規(guī)模數(shù)字快速有關(guān)鍵所在的存取支持等。目前,數(shù)字圖書館主要采用的是“瀏覽器/Web服務(wù)器/數(shù)據(jù)庫服務(wù)器”的模式結(jié)構(gòu)來進行數(shù)據(jù)的存儲與管理。數(shù)字圖書館Web服務(wù)器與數(shù)據(jù)庫連接存取接口,可采用CGI的公共網(wǎng)關(guān)接口,通過API應(yīng)用程序接口和ODBC開放式數(shù)據(jù)庫互聯(lián)標準接口訪問數(shù)據(jù)庫,利用JAVA機制設(shè)計標準SQL數(shù)據(jù)庫連接接口JDBC訪問數(shù)據(jù)庫等三種技術(shù)途徑從而實現(xiàn)。2.3.5資源調(diào)度系統(tǒng)
調(diào)試系統(tǒng)的目標是通過一個標識來確定數(shù)字圖書館中有數(shù)字資源的規(guī)則,建立一個管理所有數(shù)字圖書館數(shù)字資源的系統(tǒng),在資源環(huán)境發(fā)生變化時,在數(shù)字圖書館環(huán)境中,只要把惟一標識所指向的對應(yīng)值做相應(yīng)的修改,就可以保證服務(wù)的正常運行,這樣就大大支持了數(shù)字資源的共建共享,防止重復(fù)建設(shè)。實現(xiàn)調(diào)度系統(tǒng)首先得建立一個完善的調(diào)度碼體系,為此要有一個資源統(tǒng)一命名規(guī)則。其次,要建立一個調(diào)度機制。除了建立調(diào)度碼體系和調(diào)度機制以外,調(diào)度系統(tǒng)還必須為資源加式和用戶服務(wù)提供服務(wù)功能。2.3.6聯(lián)合編目和館際互借系統(tǒng)
書目數(shù)據(jù)是傳統(tǒng)圖書館自動化系統(tǒng)的主要內(nèi)容,在數(shù)字圖書館系統(tǒng)中,作為一種類型的元數(shù)據(jù),書目數(shù)據(jù)仍然有著重要的作用。通過Z39.50協(xié)議,用戶可以通過同樣的檢索界面去訪問任何遵循該協(xié)議的目標數(shù)據(jù)庫,傳統(tǒng)的書目系統(tǒng)也可以直接為數(shù)字圖書館系統(tǒng)提供元數(shù)據(jù),但數(shù)字圖書館應(yīng)用系統(tǒng)的子數(shù)據(jù)庫不僅限于書目數(shù)據(jù)。因此,在條件允許的情況下,應(yīng)該把各單位的書目系統(tǒng)轉(zhuǎn)換為基于網(wǎng)絡(luò)環(huán)境的元數(shù)據(jù)共建共享系統(tǒng)。同樣,對于館際互借系統(tǒng),也要從以傳統(tǒng)介質(zhì)為主的方式過渡到兼顧傳統(tǒng)介質(zhì)和數(shù)字資源兩個方面。2.3.7用戶查詢和服務(wù)系統(tǒng)
數(shù)字圖書館用戶查詢和服務(wù)系統(tǒng)要實現(xiàn)數(shù)字化信息和知識的發(fā)布與利用。用戶通過統(tǒng)一的應(yīng)用界面進入系統(tǒng),根據(jù)檢索子數(shù)據(jù)庫得到資源的標識,再經(jīng)過調(diào)度系統(tǒng),由數(shù)字資源管理系統(tǒng)獲取以分布形式存儲的對象數(shù)據(jù)庫中的資源。而構(gòu)成用戶查詢和服務(wù)系統(tǒng),主要有三個部分:應(yīng)用界面系統(tǒng);元數(shù)據(jù)系統(tǒng);數(shù)字資源存取系統(tǒng)。此外,資源的使用還須通過調(diào)度系統(tǒng),其邏輯組成如圖2-2所示:2.3.7用戶查詢和服務(wù)系統(tǒng)
圖2-2用戶查詢與服務(wù)系統(tǒng)應(yīng)用界面系統(tǒng)資源存取系統(tǒng)調(diào)度系統(tǒng)搜索系統(tǒng)調(diào)度碼元數(shù)據(jù)資源庫2.3.8安全認證系統(tǒng)
為確保系統(tǒng)運行的安全,確保各類知識資源為各種層次人員高速取用,數(shù)字圖書館體系結(jié)構(gòu)中需要高有安全認證系統(tǒng)。2.3.9版權(quán)保護與電子商務(wù)系統(tǒng)
數(shù)字圖書館的資源建設(shè)應(yīng)遵守國家有關(guān)法律法規(guī),協(xié)調(diào)解決有關(guān)版權(quán)事宜。為保證數(shù)字圖書館能夠持續(xù)有關(guān)鍵有效地發(fā)展,需對部分資源使用進行有償服務(wù),在技術(shù)體系中,需要對數(shù)字圖書館分布式資源跨單位、跨庫服務(wù)模式下的版權(quán)保護與電子商務(wù)(包括安全性)系統(tǒng)給以支持.2.4數(shù)字圖書館的系統(tǒng)體系結(jié)構(gòu)
2.4.1用戶界面2.4.2查詢系統(tǒng)2.4.3調(diào)度系統(tǒng)2.4.4圖書館服務(wù)器2.4.5對象庫2.4.6制作系統(tǒng)2.4數(shù)字圖書館的系統(tǒng)體系結(jié)構(gòu)
在數(shù)字圖書館中,由于數(shù)字化的信息可以通過超文本技術(shù)把它們有機地結(jié)合在一起,其數(shù)據(jù)結(jié)構(gòu)可以按其本身的邏輯關(guān)系組成互相聯(lián)系的網(wǎng)狀結(jié)構(gòu),利用標準通用置標語言建成分布式的對象數(shù)據(jù)庫。綜合美國國家數(shù)字圖書館計劃的試驗?zāi)P秃臀覈鲌D書館試驗?zāi)P鸵约拔覈膶嶋H情況,所試圖構(gòu)建一個數(shù)字圖書館的結(jié)構(gòu)是:在網(wǎng)絡(luò)環(huán)境下,是一個面向?qū)ο蟮摹⒎植际降木W(wǎng)絡(luò)結(jié)構(gòu)模式組成的數(shù)字圖書館系統(tǒng)的結(jié)構(gòu)模型,通常它可以適應(yīng)多種不同的計算機系統(tǒng)。一個數(shù)字圖書館的構(gòu)成,主要包含用戶界面、查詢系統(tǒng)、調(diào)度系統(tǒng)(預(yù)處理系統(tǒng))、圖書館服務(wù)器、對象庫系統(tǒng)和制作系統(tǒng)六部分組成。2.4.1用戶界面
數(shù)字圖書館的資源提供給用戶使用時,應(yīng)該具備直觀友好的用戶界面。而用戶界面是用戶與數(shù)字圖書館的接口,數(shù)字圖書館向用戶提供所查的資源及最終服務(wù)都是通過用戶界面去實現(xiàn)的。通常用戶界面有兩種類型:一種是供圖書館用戶(讀者)使用的,而另一種是供圖書館工作人員使用的。用戶界面與客戶機服務(wù)器相連,該服務(wù)器管理數(shù)字對象間的關(guān)系、數(shù)字對象信息的組織、管理用戶使用情況等。圖書館工作人員使用的用戶界面,要設(shè)計成一種管理工具,它能生成一種編輯器,可存取、增加、刪除數(shù)字對象。目前,數(shù)字圖書館也借助通用的Web瀏覽器及超文本傳輸協(xié)議/超文本置標語言(HTTP/HTML)的用戶訪問協(xié)議,使得用戶界面變得更加的靈活、實用,用戶只需在HTML網(wǎng)頁的圖形上按一下,,就能存取數(shù)字對象。因此,用戶界面應(yīng)有如下功能或特點:2.4.1用戶界面
①可支持Netscape在任何計算機上運行;②提供管理接口,以生成、編輯、查詢、刪除數(shù)字對象(圖書館員專用);③可操作復(fù)雜的數(shù)字對象,把數(shù)字對象間的聯(lián)系變換為HtmlHyperlinks的模式;④能處理調(diào)度碼,識別數(shù)字對象的調(diào)度碼(圖書館員專用);⑤對元數(shù)據(jù)可查重,以便存入新對象(圖書館專用);⑥允許用戶查詢含有其他數(shù)字對象的信息;⑧用戶可自由使用調(diào)度碼的基本條款和條件或者查詢方法,熟悉理解調(diào)度碼的識別功能等;⑨設(shè)置各種瀏覽器接口。2.4.2查詢系統(tǒng)
查詢系統(tǒng)又名檢索系統(tǒng),它可以有多種,但只要可以和調(diào)度碼結(jié)合起來確認數(shù)字資源對象,傳統(tǒng)的信息檢索系統(tǒng)和書目系統(tǒng)都可以作為查詢系統(tǒng)。而查詢系統(tǒng)由查詢協(xié)議、用戶接口(API)、檢索引擎和索引組成,并與客戶機、服務(wù)器、對象庫相連。在數(shù)字圖書館系統(tǒng)中,在檢索某一對象庫前,必須選查目錄或索引。因此,整個檢索路徑是:用戶提問—用戶服務(wù)器—調(diào)度系統(tǒng)—用戶服務(wù)器—檢索系統(tǒng)—對象庫—用戶服務(wù)器—用戶網(wǎng)頁顯示。但很明顯這種檢索過程是很慢的,而且復(fù)雜,一般說來,在建立數(shù)字對象庫前在查詢系統(tǒng)中建立一套對象的索引或目錄,實現(xiàn)快速的全自動的查詢。關(guān)鍵的問題就是如何建立數(shù)字對象的鍵元數(shù)據(jù)字索引或書目,其次就是如何選擇查詢引擎和查詢協(xié)議。2.4.3調(diào)度系統(tǒng)
數(shù)字圖書館是由各種成份構(gòu)成的,它們包括人員(用戶與圖書館員)、電腦、網(wǎng)絡(luò)、對象庫(包括原有各種數(shù)據(jù)庫)、檢索查詢系統(tǒng)、Web服務(wù)器、數(shù)字對象、對象的元數(shù)據(jù)和書目記錄等。而這些成份是通過調(diào)度碼和調(diào)度系統(tǒng)對其進行管理和識別的。(1)調(diào)度碼在數(shù)字圖書館系統(tǒng)中,通常是用調(diào)度碼去識別數(shù)字對象和對象庫。(2)調(diào)度系統(tǒng)調(diào)度碼是需要長期使用的名稱,需要一個權(quán)威機構(gòu)制定命名規(guī)則和命名。2.4.4圖書館服務(wù)器
圖書館服務(wù)器是用來運行圖書館自動化集成系統(tǒng)的,可采用客戶機/服務(wù)器模式,它是一個以圖書館內(nèi)部業(yè)務(wù)為主體的書目服務(wù)系統(tǒng),提供采訪、編目、流通、報刊管理、參考咨詢和檢索等功能的服務(wù)。在數(shù)字圖書館中,通過Web服務(wù)器與圖書館服務(wù)器連接,使圖書館服務(wù)器成為數(shù)字圖書館的一個組成部分。如圖2-3所示:2.4.4圖書館服務(wù)器
書商系統(tǒng)國家書目系統(tǒng)web服務(wù)器務(wù)WEBEBWE采編流刊參OPAC接口C/S系統(tǒng)2.4.4圖書館服務(wù)器
我們認為圖書館的自動化系統(tǒng)應(yīng)并入數(shù)字圖書館中,因此,圖書館的讀者(用戶)既可從書目數(shù)據(jù)庫查找書刊資料線索而獲得原書、原刊、也可直接檢索數(shù)字對象庫,獲得多媒體資料。從軟件角度來說,數(shù)字對象庫既可存儲二次文獻的數(shù)字對象,也可以存儲全文、圖像、圖片等多媒體資料。2.4.5對象庫
對象庫是用來存儲和管理數(shù)字對象及相關(guān)信息,是一個基于網(wǎng)絡(luò)的一些數(shù)字對象的存儲與訪問系統(tǒng)。一個數(shù)字圖書館有許多不同形式、種類的對象庫,它可分別存儲數(shù)字化文本、圖像、視頻、音頻信息及其他二進制位編碼,而且是按數(shù)字對象的每個元素的數(shù)據(jù)類型進行存儲。數(shù)字圖書館系統(tǒng)中描述對象庫及原型對象庫的接口被稱為庫訪問協(xié)議(RAP:RepositoryAccessProtocol),其特點是可以清晰地去識別權(quán)限,并在一個客戶可以存取數(shù)字對象前允許滿足其需要,支持多個數(shù)字對象在非通用范圍內(nèi)的傳播,并具有良好的定義多個接口的開放體系結(jié)構(gòu)。2.4.5對象庫
(1)對象庫結(jié)構(gòu),對象庫一般由下列層次構(gòu)成:對象庫外層、永久存儲層和對象庫管理層。(2)實現(xiàn)方法,對象庫的三層結(jié)構(gòu)之間的聯(lián)系接口是采用通常的廣泛應(yīng)用程序API實現(xiàn)的,這種結(jié)構(gòu)實際上是一個面向?qū)ο蟮慕Y(jié)構(gòu)。(3)對象庫訪問協(xié)議,所有與訪問對象庫有關(guān)的操作活動,都要先執(zhí)行對象庫訪問協(xié)議。(4)對象庫的識別,它是通過給每個對象庫和每個數(shù)字對象一個調(diào)度碼來識別的。(5)對象庫的安全,安全是對象庫設(shè)計和對象庫訪問協(xié)議的一個組成部分,知識產(chǎn)權(quán)和允許使用權(quán)是與對象庫及其所存儲的數(shù)字對象相關(guān)聯(lián)的。2.4.6制作系統(tǒng)
制作系統(tǒng)是為圖書館工作人員和管理人員所使用的,主要用于選擇數(shù)字對象的數(shù)據(jù)內(nèi)容,即確定數(shù)據(jù)類型、建立數(shù)據(jù)模型、規(guī)范數(shù)據(jù)格式、確定數(shù)據(jù)相互關(guān)系及加工處理和管理,包括數(shù)據(jù)的采集、掃描處理、數(shù)據(jù)的編輯、標識數(shù)據(jù)的存儲與管理、系統(tǒng)的創(chuàng)建、維護與服務(wù)等事務(wù)處理與流程管理。因此,制作系統(tǒng)關(guān)系到數(shù)字圖書館數(shù)據(jù)庫建立的成敗。2.5數(shù)字圖書館體系結(jié)構(gòu)比較研究
2.5.1基于三層客戶機/服務(wù)器模式的數(shù)字圖書館的體系結(jié)構(gòu)2.5.2分布式數(shù)字圖書館的體系結(jié)構(gòu)2.5.3基于代理協(xié)作式的數(shù)字圖書館的體系結(jié)構(gòu)2.5.4Interspace的體系結(jié)構(gòu)2.5.5基于網(wǎng)格式的數(shù)字圖書館的體系結(jié)構(gòu)2.5.6數(shù)字圖書館體系結(jié)構(gòu)的評價標準2.5數(shù)字圖書館體系結(jié)構(gòu)比較研究
在體系結(jié)構(gòu)上,數(shù)字圖書館可劃分為基于三層層客戶機/服務(wù)器模式的數(shù)字圖書館、分布式圖書館和基于代理協(xié)作的數(shù)字圖書館及基于網(wǎng)格的數(shù)字圖書館等幾種類型如按數(shù)字資源是否進行集中,可分為集中式體系結(jié)構(gòu)和分布式體系結(jié)構(gòu)兩種類型的數(shù)字圖書館。而網(wǎng)格具有代表性的有BRICKS、COLIATE、DILIGENT、DELOS等,分布式數(shù)字圖書館結(jié)構(gòu)因其具有高性能、易管理維護、對象重用、數(shù)據(jù)網(wǎng)絡(luò)有效利用及高開發(fā)效率等諸多優(yōu)點,而基于網(wǎng)格技術(shù)的數(shù)字圖書館體系結(jié)構(gòu)提供分布式數(shù)字資源松散耦合與集中管理,能夠推動用戶之間協(xié)作和數(shù)據(jù)共享,也能夠解決數(shù)字圖書館里面的某些復(fù)雜和計算密集型的服務(wù),促進共享資源的控制管理等,從而進一步促進數(shù)字圖書館的發(fā)展。2.5.1基于三層客戶機/服務(wù)器模式的數(shù)字圖書館的體系結(jié)構(gòu)2.5.1.1三層體系結(jié)構(gòu)的概述2.5.1.2三層體系結(jié)構(gòu)的優(yōu)點2.5.1.3數(shù)字圖書館的三角體系結(jié)構(gòu)2.5.1.1三層體系結(jié)構(gòu)的概述三層結(jié)構(gòu)指的是組成一個應(yīng)用構(gòu)件的三個邏輯層面。三層結(jié)構(gòu)將一個應(yīng)用分成三個部分:顯示邏輯層(第一層)、Web服務(wù)器/業(yè)務(wù)邏輯層(第二層)和數(shù)據(jù)存取邏輯層(第三層)。一個具體應(yīng)用可能是由多個這三種類型的構(gòu)件組成的。數(shù)字圖書館的應(yīng)用構(gòu)件可以被其它的應(yīng)用系統(tǒng)所共享。應(yīng)用構(gòu)件可能被多個物理系統(tǒng)所使用,應(yīng)用構(gòu)件之間使用一種隱蔽內(nèi)部功能的抽象接口來通信。2.5.1.2三層體系結(jié)構(gòu)的優(yōu)點(1)性能提高(2)易于管理維護(3)對象重用(4)數(shù)據(jù)和網(wǎng)絡(luò)的使用更加有效(5)通過專門化提高開發(fā)效率(6)有利于Web的移植2.5.1.3數(shù)字圖書館的三角體系結(jié)構(gòu)圖書館客戶或稱信息用戶,包括讀者和圖書館員,具有不同的權(quán)限;圖書館服務(wù)器是數(shù)字圖書館中的管理核心,用來管理數(shù)據(jù)的索引和查詢;信息對象服務(wù)器是數(shù)字圖書館中存儲信息對象的地方,用于管理數(shù)字化的對象,是信息源。用戶通過因特網(wǎng)發(fā)出查詢請求,經(jīng)Web服務(wù)器處理后傳遞給圖書館服務(wù)器,圖書館服務(wù)器將查詢結(jié)果通知對象服務(wù)器,并由對象服務(wù)器取出最終結(jié)果傳遞給用戶。2.5.1.3數(shù)字圖書館的三角體系結(jié)構(gòu)圖2-4數(shù)字圖書館的三角型體系結(jié)構(gòu)Libraryclient圖書館客戶登記、提問LibraryServer圖書館服務(wù)器ObjectServer對象服務(wù)器返回結(jié)果轉(zhuǎn)移提問2.5.1.3數(shù)字圖書館的三角體系結(jié)構(gòu)圖2-4所示的是三層體系結(jié)構(gòu)的一種變形,三角形的體系結(jié)構(gòu)采用了C/S模型,服務(wù)器由圖書館服務(wù)器和對象服務(wù)器組合承擔。數(shù)據(jù)層的數(shù)據(jù)直接返回客戶端,無需中間的傳遞過程,用戶只能訪問圖書館服務(wù)器,保證了數(shù)據(jù)的安全性,同時減少了數(shù)據(jù)復(fù)制和傳輸?shù)拇螖?shù),提高了系統(tǒng)的性能。在數(shù)字圖書館系統(tǒng)中,圖像、音頻和視頻等數(shù)字對象的數(shù)據(jù)量比較大,數(shù)據(jù)量大及頻繁使用的數(shù)字對象可以放置在接近用戶的地方,以減少數(shù)字對象復(fù)制和傳送的次數(shù),減少網(wǎng)絡(luò)的數(shù)據(jù)傳送量,提高系統(tǒng)的性能。圖書館服務(wù)器和對象服務(wù)器分離有利于系統(tǒng)各部分的獨立性,也有利于系統(tǒng)的擴展性。少量的數(shù)字對象使用一臺對象服務(wù)器就可滿足系統(tǒng)的要求,當數(shù)字對象持續(xù)增加時,只要增加相應(yīng)的對象服務(wù)器即可,而不影響系統(tǒng)的體系結(jié)構(gòu)。2.5.2分布式數(shù)字圖書館的體系結(jié)構(gòu)
2.5.2.1基于數(shù)字對象的分布式的數(shù)字圖書館的體系結(jié)構(gòu)2.5.2.2基于外部協(xié)調(diào)的分布式的數(shù)字圖書館的體系結(jié)構(gòu)2.5.2.1基于數(shù)字對象的分布式的數(shù)字圖書館的體系結(jié)構(gòu)(1)NSDL,國家科學、技術(shù)、工程和數(shù)學教育數(shù)字圖書館(NationalScience,Technology,Engineering,andMathematics,EducationDigitalLibrary,簡稱NSDL)是NSF資助的、由多家單位實施的數(shù)字圖書館項目,共包括64個子項目,其目的是支持科學、技術(shù)、工程和數(shù)學教育,提供廣泛接入和方便使用的分布式資源網(wǎng)絡(luò)和學習機制。NSDL一期工程已于2002年底為公眾提供服務(wù),它是目前規(guī)模最大的數(shù)字圖書館項目。
2.5.2.1基于數(shù)字對象的分布式的數(shù)字圖書館的體系結(jié)構(gòu)圖2-5NSDL體系結(jié)構(gòu)OAI收集OAI直接輸入元數(shù)據(jù)庫搜索發(fā)現(xiàn)用戶門戶用戶資源2.5.2.1基于數(shù)字對象的分布式的數(shù)字圖書館的體系結(jié)構(gòu)元數(shù)據(jù)庫-NSDL體系結(jié)構(gòu)的關(guān)鍵部分是元數(shù)據(jù)庫。元數(shù)據(jù)庫存儲所有藏品的元數(shù)據(jù),并通過OAI協(xié)議把它們提供給服務(wù)商,服務(wù)商通過元數(shù)據(jù)可以開發(fā)出各種服務(wù)。在NSDL中,元數(shù)據(jù)庫可能分布在多個服務(wù)器上,并有多個鏡像。NSDL早期采用分布式元數(shù)據(jù)庫,現(xiàn)在改成集中式。這是因為分布式元數(shù)據(jù)庫在檢索時會因為其中的一個元數(shù)據(jù)庫的失敗或響應(yīng)較慢,而造成整個檢索的失敗或長時間的響應(yīng),而集中式數(shù)據(jù)庫可以避免這種現(xiàn)象。
NSDL的互操作性的問題:
NSDL的互操作性采用三種方式來實現(xiàn):①聯(lián)合;②OAI采集;③搜集;
NSDL主要通過OAI元數(shù)據(jù)采集來實現(xiàn)互操作。2001年初,NSDL確定支持8種標準元數(shù)據(jù)格式,這8種元數(shù)據(jù)之間的互換通過DublinCore元數(shù)據(jù)核心集作為過渡。2.5.2.1基于數(shù)字對象的分布式的數(shù)字圖書館的體系結(jié)構(gòu)(2)NCSTRL,NCSTRL(NetworkedComputerScienceTechnicalResearchLibrary,網(wǎng)絡(luò)化計算機科學技術(shù)研究圖書館)是一個以Dienst體系結(jié)構(gòu)為基礎(chǔ),用于搜集計算機科學研究資料,特別是技術(shù)報告的分布式圖書館,有160多家學術(shù)機構(gòu)參與了該項目。它也是另一個代表性的數(shù)字圖書館項目,其規(guī)模僅次于NSDL,它是由DARPA資助的,其體系結(jié)構(gòu)的重要特征就是分布式搜索。在NCSTRL的早期項目中,用戶的查詢式被直接提交到所有的索引服務(wù)器,但隨著參與機構(gòu)的增多,檢索時同樣會因為其中的一個元數(shù)據(jù)庫的查詢失敗或響應(yīng)較慢,而造成整個檢索的失敗或長時間的響應(yīng),為了解決這一問題,NCSTRL引入了路由器的概念。2.5.2.2基于外部協(xié)調(diào)的分布式的數(shù)字圖書館的體系結(jié)構(gòu)總線式的InfoBus總線式的InfoBus斯坦福大學的數(shù)字圖書館項目。InfoBus是用圖書館服務(wù)代理這樣一種CORBA(公共對象請求代理結(jié)構(gòu))對象進行的在線服務(wù),由圖書館服務(wù)代理器、信息資源、信息處理服務(wù)、圖書館服務(wù)和用戶界面五部分組成分布式對象系統(tǒng)。其主要目的是解決現(xiàn)存系統(tǒng)的互操作問題,一方面,頒布的、互異的倉儲和服務(wù)只要遵循共同的協(xié)議就能相互交互,合作起來向用戶提供一致的接口,屏蔽各倉儲和服務(wù)間的差別,實現(xiàn)聯(lián)系檢索與服務(wù);另一方面,各倉儲仍由本地自治地維護,各種服務(wù)亦無須改變,各顯特色。InfoBus(InformationBus)是一個軟“總線”結(jié)構(gòu),異構(gòu)的倉儲、服務(wù)和用戶界面如同插件一樣插入到InfoBus中,集成在一起(如圖2-6所示)。2.5.2.2基于外部協(xié)調(diào)的分布式的數(shù)字圖書館的體系結(jié)構(gòu)圖2-6InfoBus的體系結(jié)構(gòu)
PM
PM
PM
PM
PM
LS
LSICIC
IPS
IPS
ISIS
IS2.5.2.2基于外部協(xié)調(diào)的分布式的數(shù)字圖書館的體系結(jié)構(gòu)InfoBus的關(guān)鍵技術(shù)有以下幾點:①分布式對象技術(shù)②互操作協(xié)議③封裝和代理④文檔對象化InfoBus為數(shù)字圖書館提供了一個靈活的、可擴展的框架,一方面,已有的信息倉儲和信息服務(wù)無需改變便可插入到系統(tǒng)中;另一方面,InfoBus為吸收未來的倉儲和服務(wù)留下了空間。InfoBus的信息總線結(jié)構(gòu)具有語言的獨立性和平臺的獨立性,它把任務(wù)分散到分布的對象上,提高了系統(tǒng)的可靠性。但是,InfoBus的實現(xiàn)過于復(fù)雜,在大范圍內(nèi)其效率難以保障,特別是當成員的數(shù)量龐大時。2.5.3基于代理協(xié)作式的數(shù)字圖書館的體系結(jié)構(gòu)數(shù)字圖書館的發(fā)展日新月異,在技術(shù)進步和用戶需求提高的推動下,會不斷出現(xiàn)新的信息資源和信息服務(wù)。這就要求數(shù)字圖書館的體系結(jié)構(gòu)具有開放性、靈活性和可擴展性。正如密歇根大學數(shù)字圖書館(UniversityofMichiganDigitalLibrary,UMDL)是一個基于代理協(xié)作的數(shù)字圖書館,實質(zhì)上它是一由信息倉儲、信息服務(wù)和用戶接口都實現(xiàn)為分布的、自治的代理,代理們能自動組合,互相協(xié)作地完成種種任務(wù)。任何一個成員都可以隨時進入或撤出,不會影響到整個系統(tǒng)的工作。代理是一個自治的、可重用的軟件模塊,完成一項專門的任務(wù)。所有的代理具有一致的通信接口,代理們通過協(xié)商組成協(xié)作小組共同完成任務(wù)。UMDL中的代理主要有三類,如圖2-7所示:2.5.3基于代理協(xié)作式的數(shù)字圖書館的體系結(jié)構(gòu)圖2-7代理的三種類型資料來源:王軍.2002.數(shù)字圖書館體系結(jié)構(gòu)比較研究.大學圖書館學報.(6):5~12
UMDL體系結(jié)構(gòu)用戶接口代理中介代理收藏收藏接口代理2.5.3基于代理協(xié)作式的數(shù)字圖書館的體系結(jié)構(gòu)(1)用戶接口代理(UIAs)管理用戶到倉儲的接口,提供用戶接口的通信封裝。其主要的功能有:表達用戶需求,維護用戶檔案、定制查詢結(jié)果,管理用戶可利用的資源。(2)倉儲接口代理(CIAs)管理倉儲的接口,除了其他的通信任務(wù),CIAs負責將倉儲的內(nèi)容和功能等信息發(fā)布在注冊機構(gòu)中。(3)中介代理(Mediator)提供中介信息服務(wù),它在各個代理間聯(lián)絡(luò),主要責任是:將查詢從UIA指引到能滿足它的倉儲,監(jiān)視查詢的進展情況,傳遞處理結(jié)果,轉(zhuǎn)換數(shù)據(jù)格式,費用記帳等。2.5.4Interspace的體系結(jié)構(gòu)
Interspace是受美國國家科學基金資助的數(shù)字圖書館創(chuàng)始計劃(DLI)工程中的一個研究項目,是由伊利諾依大學的科學家Schatz主持。Interspace是一個互聯(lián)的信息空間的集合,每個成員信息空間包含了一個社區(qū)或一個領(lǐng)域的知識。每個信息空間又是一個互聯(lián)的對象IU(InformationUnit)的集合。IU是Interspace中比較重要的一個概念,它是Interspace的基本構(gòu)造單位,系統(tǒng)中的所有構(gòu)件都是用IU來實現(xiàn)的,包括索引器、搜索器、數(shù)據(jù)轉(zhuǎn)換器、數(shù)據(jù)倉儲器等。
2.5.4Interspace的體系結(jié)構(gòu)
Interspace實現(xiàn)為一個層次結(jié)構(gòu):應(yīng)用層負責和用戶交互;應(yīng)用編程環(huán)境包含實現(xiàn)各種應(yīng)用所需要的通用服務(wù);系統(tǒng)編程環(huán)境是Interspace的內(nèi)核層,包含信息空間和IU的各種基本功能。內(nèi)核層之下的是服務(wù)層,該層包含內(nèi)核層所需要的關(guān)鍵功能模塊:包括域管理器、語義索引與檢索、全文搜索、詞語轉(zhuǎn)換等。底層是一個分布式的數(shù)據(jù)存儲層,負責常駐數(shù)據(jù)的管理。圖2-8Interspace的體系結(jié)構(gòu)資料來源:王軍.2002.數(shù)字圖書館體系結(jié)構(gòu)比較研究.大學圖書館學報.(6):5~122.5.4Interspace的體系結(jié)構(gòu)
Interspace分析環(huán)境應(yīng)用層系統(tǒng)開發(fā)環(huán)境
IU服務(wù)域管理器知識分類-類目圖生成知識檢索-概念空間檢索-詞語檢索-全文查找知識索引-概念空間生成-概念賦予外部服務(wù)概念抽象層數(shù)據(jù)存儲層2.5.4Interspace的體系結(jié)構(gòu)
從圖2-8中可以看出,在此基礎(chǔ)上,Interspace在應(yīng)用層為用戶提供一個“分析環(huán)境”。所謂的“分析”是把分析查詢請求和查詢結(jié)果,知道用戶真正想查的,發(fā)現(xiàn)用戶真正想要的。如讓用戶指定查詢的概念與被查詢的信息倉儲間的關(guān)系,根據(jù)這個關(guān)系所反映的檢索模式自動到其他的信息倉儲中發(fā)現(xiàn)相關(guān)的內(nèi)容;主動向用戶提供候選檢索詞,輔助用戶構(gòu)造查詢表達式等等。所謂“環(huán)境”是指用戶能把來自系統(tǒng)內(nèi)外的各種信息檢索工具和信息倉儲組合在一起,形成自己的信息環(huán)境。分析環(huán)境還是一個協(xié)作的環(huán)境,使得用戶能在一個龐大的、復(fù)雜的網(wǎng)絡(luò)信息環(huán)境中互相協(xié)作地完成任務(wù)。2.5.5基于網(wǎng)格式的數(shù)字圖書館的體系結(jié)構(gòu)
隨著數(shù)字圖書館概念逐步深入人心,各種各樣的數(shù)字圖書館系統(tǒng)紛紛建立并各自獨立地發(fā)展。然而,這些數(shù)字圖書館就好像Internet世界上一個個孤島。因此,需要建立一種有效的數(shù)據(jù)管理體系,將分布各處的數(shù)字資源和用戶、超級計算機的數(shù)值計算能力和數(shù)字圖書館的數(shù)據(jù)處理以及發(fā)布能力有機連接起來,及時地為數(shù)字圖書館實施資源發(fā)掘和信息發(fā)掘,并進行高效的數(shù)據(jù)訪問提供有力支持。而網(wǎng)絡(luò)技術(shù)的發(fā)展和應(yīng)用,從技術(shù)手段上為數(shù)字圖書館的這一夢想提供了實現(xiàn)的可能性,成為支撐數(shù)字圖書館應(yīng)用服務(wù)的新的體系結(jié)構(gòu)。2.5.5基于網(wǎng)格式的數(shù)字圖書館的體系結(jié)構(gòu)
基于網(wǎng)格技術(shù)的數(shù)字圖書館的體系結(jié)構(gòu)提供分布式數(shù)字資源松散耦合與集中管理,能夠推動用戶之間的協(xié)作和數(shù)據(jù)共享,能夠解決數(shù)字圖書館里面的某些復(fù)雜的和計算密集型的服務(wù),能夠為數(shù)字圖書館提供復(fù)雜的負載平衡策略,能夠促進共享資源的控制管理等,從而進一步促進數(shù)字圖書館的發(fā)展。目前,基于網(wǎng)格技術(shù)的數(shù)字圖書館的基礎(chǔ)體系結(jié)構(gòu)主要有三種,即P2P結(jié)構(gòu)、網(wǎng)格結(jié)構(gòu)、面向服務(wù)的結(jié)構(gòu)。這三種結(jié)構(gòu)其側(cè)重點不同,在具體的應(yīng)用上也是各有特色。2.5.5.1P2P結(jié)構(gòu)P2P的全稱為“Peer-to-Peer”,即對等互聯(lián)網(wǎng)格技術(shù)(點對點網(wǎng)格技術(shù)),其目的是使得任何網(wǎng)絡(luò)設(shè)備可以為其他網(wǎng)絡(luò)設(shè)備提供服務(wù)。P2P系統(tǒng)中的任何一個節(jié)點(peer)之間都能通過直接交換信息來進行信息和服務(wù)的共享,而不需要經(jīng)過其它的中間實體。P2P最根本的思想在于網(wǎng)絡(luò)中的節(jié)點既可以獲取其它節(jié)點的資源或服務(wù),同時又是資源或服務(wù)的提供者,即兼具客戶機和服務(wù)器雙重身份。因此,P2P是一種分散的、分布式的資源管理模型。P2P系統(tǒng)已經(jīng)成功地應(yīng)用于文件共享(如Gnutella和Ka
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 【正版授權(quán)】 ISO/TS 19144-3:2024 EN Geographic information - Classification systems - Part 3: Land Use Meta Language (LUML)
- 企業(yè)開業(yè)慶典致辭范文
- 九月學校迎新致辭(7篇)
- 主持人大賽策劃書
- 測量實習報告范文十篇
- 中秋節(jié)國旗下的講話稿(15篇)
- 壯族課件教學課件
- 3D立體風立體商務(wù)模板
- 文書模板-診所負責人與診所法人的免責協(xié)議書
- 影響和諧校園建設(shè)的負面因素調(diào)查方案
- 電梯保養(yǎng)年度作業(yè)計劃表格
- 醫(yī)院月考核指標及評價辦法
- 監(jiān)理例會記錄表
- 阿米巴經(jīng)營課件
- 二年級(上)音樂第四單元 單元分析
- 道路運輸企業(yè)職業(yè)安全健康管理工作臺帳(全版通用)參考模板范本
- 中國小學生生命教育調(diào)查問卷
- 通用模板-封條模板
- 集團公司后備人才選拔培養(yǎng)暫行辦法
- 第五章旅游餐飲設(shè)計ppt課件
- 從馬克思主義視角看當前高房價
評論
0/150
提交評論