面向數(shù)字圖書館的多級混合存儲(chǔ)技術(shù)分析獲獎(jiǎng)科研報(bào)告_第1頁
面向數(shù)字圖書館的多級混合存儲(chǔ)技術(shù)分析獲獎(jiǎng)科研報(bào)告_第2頁
面向數(shù)字圖書館的多級混合存儲(chǔ)技術(shù)分析獲獎(jiǎng)科研報(bào)告_第3頁
面向數(shù)字圖書館的多級混合存儲(chǔ)技術(shù)分析獲獎(jiǎng)科研報(bào)告_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

面向數(shù)字圖書館的多級混合存儲(chǔ)技術(shù)分析獲獎(jiǎng)科研報(bào)告【摘

要】圖書館作為我國重要的社會(huì)基礎(chǔ)機(jī)構(gòu),承擔(dān)著為群眾提供閱讀服務(wù)以及社會(huì)教育職能。在現(xiàn)代信息技術(shù)快速發(fā)展的背景下,數(shù)字圖書館建設(shè)不斷完善,是當(dāng)前圖書館的主要發(fā)展方向,通過數(shù)字圖書館建設(shè)能夠?yàn)槿藗兲峁╇娮踊喿x服務(wù),從而促進(jìn)圖書館服務(wù)質(zhì)量提高。但是在數(shù)字圖書館建設(shè)過程中,對于存儲(chǔ)能力要求較高,必須采用穩(wěn)定的存儲(chǔ)方式將圖書館館藏資源進(jìn)行數(shù)字化存儲(chǔ)。因此,本文將對面向數(shù)字圖書館的多級混合存儲(chǔ)技術(shù)進(jìn)行深入地研究與分析,并提出一些合理的意見和措施,旨在進(jìn)一步促進(jìn)我國數(shù)字圖書館建設(shè)質(zhì)量提升。

【關(guān)鍵詞】數(shù)字圖書館;存儲(chǔ)能力;存儲(chǔ)技術(shù);多級混合存儲(chǔ)技術(shù);優(yōu)化措施

在人們閱讀方式轉(zhuǎn)變的背景下,傳統(tǒng)圖書館的服務(wù)模式已經(jīng)不能滿足群眾現(xiàn)代閱讀需求,所以近些年來數(shù)字圖書館建設(shè)取得很大發(fā)展,能夠?yàn)樽x者提供更加優(yōu)質(zhì)的電子化、網(wǎng)絡(luò)化閱讀服務(wù)。在數(shù)字圖書館的存儲(chǔ)方式中,傳統(tǒng)的機(jī)械硬盤存儲(chǔ)方式雖然成本較低,但是速度較慢,固態(tài)硬盤存儲(chǔ)速度較快,但是綜合成本較高,內(nèi)存虛擬硬盤存儲(chǔ)速度最快,但是存儲(chǔ)成本最高,且如果發(fā)生斷電就會(huì)出現(xiàn)數(shù)據(jù)丟失問題。因此,如何將多種存儲(chǔ)方式混合使用,是當(dāng)前數(shù)字圖書館建設(shè)需要考慮的主要內(nèi)容。

1當(dāng)前數(shù)字圖書館主要存儲(chǔ)方式分析

1.1傳統(tǒng)機(jī)械硬盤存儲(chǔ)

傳統(tǒng)的機(jī)械硬盤存儲(chǔ)是采用磁盤高速旋轉(zhuǎn)的方式,將磁頭在硬盤中讀取數(shù)據(jù)的模式,隨著數(shù)據(jù)量逐漸增加,磁盤的碎片也會(huì)提升,磁頭讀取數(shù)據(jù)所需要花費(fèi)的時(shí)間也會(huì)隨之延長,存儲(chǔ)速率就會(huì)降低。例如常用的FC機(jī)械硬盤,內(nèi)部傳輸速率相比于普通硬盤更高,采用高密度的磁盤技術(shù),持續(xù)性數(shù)據(jù)傳輸率能夠達(dá)到171MB/s,在數(shù)字圖書館存儲(chǔ)中具有重要的作用[1]。

1.2固態(tài)硬盤存儲(chǔ)

固態(tài)硬盤是指采用固態(tài)電子存儲(chǔ)芯片陣列而制作的硬盤,內(nèi)部結(jié)構(gòu)主要包括控制單元、存儲(chǔ)單元,在數(shù)字圖書館存儲(chǔ)中有著廣泛地應(yīng)用,固態(tài)硬盤在外形與尺寸方面有傳統(tǒng)機(jī)械硬盤基本相同,但是相較于機(jī)械硬盤能夠?qū)崿F(xiàn)耕地成本、更大容量,相比于機(jī)械硬盤各方面表現(xiàn)更為出色,但是綜合成本造價(jià)較高。

1.3內(nèi)存虛擬硬盤存儲(chǔ)

內(nèi)存虛擬硬盤存儲(chǔ)管理和使用較為簡單,能夠降低服務(wù)器運(yùn)行壓力,數(shù)據(jù)讀寫和存儲(chǔ)速度較快,具有許多優(yōu)勢。但是,存儲(chǔ)數(shù)據(jù)為普通數(shù)據(jù)網(wǎng)絡(luò)傳輸模式,容易受到其他流量的影響,當(dāng)網(wǎng)絡(luò)中數(shù)據(jù)流量較大時(shí),其系統(tǒng)性能將會(huì)受到影響,且因?yàn)椴捎闷胀ňW(wǎng)絡(luò)傳輸模式,容易發(fā)生系統(tǒng)數(shù)據(jù)泄漏和丟失問題,對于數(shù)字圖書館系統(tǒng)穩(wěn)定性和安全性要求較高。

2數(shù)字圖書館數(shù)字資源基本特征分析

單體讀者訪問數(shù)字圖書館資源時(shí)具有隨機(jī)性和無序性特征,但是圖書館不能要求讀者按照數(shù)字圖書館建設(shè)訪問資源,因?yàn)椴煌x者的閱讀方向不同,但是從大量的讀者訪問數(shù)據(jù)來看,其熱點(diǎn)數(shù)據(jù)具有一定的規(guī)律性,將數(shù)字圖書館資源根據(jù)其訪問熱度進(jìn)行劃分,在一定時(shí)間范圍內(nèi)根據(jù)相應(yīng)的條件進(jìn)行數(shù)據(jù)遷移,則能夠提高數(shù)字圖書館多級存儲(chǔ)能力[2]。在數(shù)字圖書館正常運(yùn)行時(shí),讀者會(huì)在任何時(shí)間訪問數(shù)字圖書館內(nèi)部資源,在同一時(shí)間內(nèi)有幾率訪問同一資源,但是數(shù)字資源的寫入并不是隨時(shí)能夠進(jìn)行,例如,傳統(tǒng)數(shù)字圖書館的電子期刊比如知網(wǎng)、維普等,在本地鏡像時(shí)以年為時(shí)間單位對其進(jìn)行內(nèi)部更新,后期更新速度較為緩慢。對于傳統(tǒng)圖書館而言,數(shù)字圖書館資源以頻繁讀取為主要模式,偶爾會(huì)出現(xiàn)大量數(shù)據(jù)寫入的問題。因此,采用多級存儲(chǔ)方式的數(shù)字圖書館局部與傳統(tǒng)數(shù)字圖書館相似,讀者讀取數(shù)據(jù)按照數(shù)據(jù)優(yōu)先訪問規(guī)律開展數(shù)據(jù)遷移,但是因?yàn)镃ACHE、SSD等價(jià)格相比于傳統(tǒng)機(jī)械硬盤價(jià)格更高,且容量較小,所以在數(shù)字圖書館多級存儲(chǔ)方式中占比較小。

3數(shù)字圖書館多級混合存儲(chǔ)技術(shù)應(yīng)用分析

3.1熱點(diǎn)數(shù)據(jù)遷移模式

數(shù)字圖書館作為一個(gè)大規(guī)模的數(shù)據(jù)資源庫,有收藏、推新以及推熱的基本功能,電子期刊、電子圖書以及影視資料等數(shù)據(jù)將新的資源移動(dòng)的到高速存儲(chǔ)介質(zhì)中,將舊有資源或訪問量較少的數(shù)字資源移動(dòng)到低速存儲(chǔ)介質(zhì)中,通過對數(shù)據(jù)遷移進(jìn)行合理化配置,根據(jù)遷移配置模型能夠使數(shù)字圖書館多級混合存儲(chǔ)技術(shù)的應(yīng)用效果最大化發(fā)揮。當(dāng)前,數(shù)字圖書館熱點(diǎn)數(shù)據(jù)遷移中有存儲(chǔ)卷遷移和文件遷移兩種主要模式,大部分新型儲(chǔ)存器都帶有存儲(chǔ)卷遷移功能,存儲(chǔ)器會(huì)將存儲(chǔ)磁盤拆分成為若干個(gè)卷,存儲(chǔ)器中的程序會(huì)根據(jù)卷的熱點(diǎn)程度進(jìn)行遷移,而不是采用單體數(shù)據(jù)文件的形式,所以適合采用存儲(chǔ)卷遷移模式。數(shù)據(jù)遷移模式主要包括:人機(jī)交互平臺(tái)已手工的方式根據(jù)要求將資源存儲(chǔ)到對應(yīng)的多機(jī)存儲(chǔ)區(qū)域,還可以采用軟件進(jìn)行數(shù)據(jù)遷移,根據(jù)相應(yīng)的算法采用自動(dòng)化數(shù)據(jù)遷移方式[3]。通過對數(shù)字圖書館熱點(diǎn)數(shù)據(jù)遷移模式的優(yōu)化,成本最高的存儲(chǔ)器主要用于訪問較為頻繁、熱點(diǎn)程度較高且價(jià)值最好的數(shù)字資源存儲(chǔ),成本適中的用于存儲(chǔ)訪問頻率中等且價(jià)值一般的數(shù)字資源存儲(chǔ),傳統(tǒng)機(jī)械硬盤用于存儲(chǔ)冷門數(shù)據(jù)和價(jià)值較低的數(shù)據(jù)存儲(chǔ),從而能夠?qū)?shù)字圖書館資源存儲(chǔ)進(jìn)行優(yōu)化,發(fā)揮出多級混合存儲(chǔ)技術(shù)的最優(yōu)效果,提高數(shù)字圖書館存儲(chǔ)系統(tǒng)穩(wěn)定性和實(shí)用性。

3.2數(shù)據(jù)庫建設(shè)

圖書館中的數(shù)字資源主要包括電子圖書資源、音頻資源、食品資源以及期刊論文資源等幾個(gè)類別。因?yàn)閭鹘y(tǒng)的紙質(zhì)閱讀方式已經(jīng)不能滿足當(dāng)前讀者的閱讀需要,所以數(shù)字圖書資源是其建設(shè)的主要核心,需要考慮到圖書資源的基本信息,根據(jù)信息建立相應(yīng)的數(shù)據(jù)庫。通過建設(shè)數(shù)字圖書館數(shù)據(jù)庫的方式,建立數(shù)據(jù)庫模型,將數(shù)字圖書資源根據(jù)其基本信息進(jìn)行數(shù)據(jù)遷移,并根據(jù)資源類型的不同,采用不同的數(shù)據(jù)庫建設(shè)方式,圖書基本表中的信息主要包括:ID號、內(nèi)部或出版圖書表示、電子圖書書名、作者名、出版單位、出版時(shí)間、ISBN編號、頁碼、出版次第、裝幀、開本、書籍分類、附件大小、下載次數(shù)、下載地址、錄入者、錄入日期、閱讀次數(shù)、熱點(diǎn)因子、遷移目標(biāo)位置以及存儲(chǔ)介質(zhì)等。根據(jù)圖書基本信息,將其分類錄入到數(shù)字圖書館的資源庫中,形成規(guī)范化、制度化、標(biāo)準(zhǔn)化的數(shù)據(jù)庫,從而能夠?qū)⒍嗉壔旌洗鎯?chǔ)技術(shù)優(yōu)勢最大化發(fā)揮,提升數(shù)字圖書館存儲(chǔ)系統(tǒng)穩(wěn)定性和經(jīng)濟(jì)性。

3.3多級存儲(chǔ)混合技術(shù)應(yīng)用流程

1.電子圖書基本表、音頻/食品數(shù)據(jù)基礎(chǔ)表、期刊論文基本表中存儲(chǔ)的信息,根據(jù)表中的瀏覽頻率、下載次數(shù)以及讀者在線調(diào)查等作為熱點(diǎn)選擇依據(jù),按照數(shù)據(jù)熱點(diǎn)不同,采用不同的存儲(chǔ)技術(shù)。

2.電子圖書輔助表、音頻/視頻數(shù)據(jù)輔助表、期刊論文輔助表,根據(jù)圖書館的實(shí)體銷售與網(wǎng)絡(luò)數(shù)據(jù),收集熱門數(shù)據(jù),按照數(shù)據(jù)熱點(diǎn)不同,采用不同的存儲(chǔ)技術(shù)。

3.根據(jù)輔助表中的數(shù)據(jù)引入技術(shù),將其與基本表進(jìn)行比對,如果輔助表中的數(shù)據(jù)都可以在基本表中體現(xiàn),則將基本表中的熱點(diǎn)因子進(jìn)行調(diào)整,如果沒有對應(yīng)表現(xiàn),則需要在輔助表中記錄,將其作為圖書館下一步數(shù)字資源的主要內(nèi)容。

4.根據(jù)文件大小對文件系統(tǒng)基本表中的熱點(diǎn)因子進(jìn)行修正,文件

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論