版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、招標(biāo)標(biāo)段編號:HBDL-KJ-0907-01河北省電力公司2009年科技項目第一批設(shè)備材料招標(biāo)河北省電力公司培訓(xùn)檔案管理信息系統(tǒng)研發(fā)投 標(biāo) 文 件(技術(shù)部分)河北新遠(yuǎn)方科技公司二00九年九月一、 前言1.1總體簡紹自九十年代初以來,各行業(yè)單位便開展了檔案管理信息化的推進(jìn)工作,十幾年來,檔案管理信息化的工作也取得了較大的進(jìn)步,檔案信息化管理的發(fā)展歷程及趨勢可以分為如下幾個階段:l 條目級管理階段(單機(jī)階段):在這個階段,所有軟件所使用的開發(fā)平臺及操作系統(tǒng)本身都還需要比較落后,只能實現(xiàn)對檔案數(shù)據(jù)的索引管理,無法實現(xiàn)對檔案數(shù)據(jù)原文的管理。更無法實現(xiàn)檔案數(shù)據(jù)的網(wǎng)絡(luò)化管理。l 原文管理階段(單機(jī)階段):
2、在這個階段,大家已經(jīng)開始將檔案索引信息所對應(yīng)的原文進(jìn)行掃描,并掛接入系統(tǒng),已實現(xiàn)對檔案數(shù)據(jù)的全文管理。并且已經(jīng)開始嘗試進(jìn)行檔案數(shù)據(jù)的網(wǎng)絡(luò)化管理嘗試。但仍以單機(jī)管理為主。l 網(wǎng)絡(luò)化管理階段:在本階段,建立單位內(nèi)部的檔案管理網(wǎng)絡(luò)化系統(tǒng)已成為共識,有條件的單位開始在本單位內(nèi)部進(jìn)行檔案的網(wǎng)絡(luò)化管理,并取得了初步的成功。l 集成化管理階段:在本階段,用戶對檔案網(wǎng)絡(luò)系統(tǒng)的要求更加嚴(yán)格,希望檔案系統(tǒng)不要成為單位內(nèi)部的系統(tǒng)孤島,要求將檔案系統(tǒng)與各種信息化系統(tǒng)進(jìn)行對接,已實現(xiàn)集成化的管理,將需要?dú)w檔的數(shù)據(jù)通過集成處理直接歸入檔案管理系統(tǒng)中來,以減少檔案人員的工作量,提高工作效率。目前檔案行業(yè)正處于本階段。l 數(shù)
3、字檔案管理系統(tǒng)階段:到了這個階段,用戶對檔案網(wǎng)絡(luò)化的要求更高,除了滿足前述集成化管理的要求,還要求將其行業(yè)或下屬單位的所有數(shù)據(jù)進(jìn)行全面的整合,利用現(xiàn)代的網(wǎng)絡(luò)技術(shù)、安全技術(shù)、搜索引擎等技術(shù),實現(xiàn)分布式的、虛擬的、統(tǒng)一管理、統(tǒng)一利用的檔案管理信息平臺。目前國內(nèi)外均已對此進(jìn)行了大量的研究,國家檔案局十一五規(guī)劃中也明確提出要進(jìn)行數(shù)字檔案管理系統(tǒng)系統(tǒng)的建設(shè)與推進(jìn)工作。l 知識管理階段:在實現(xiàn)了數(shù)字檔案管理系統(tǒng)系統(tǒng)功能后,人們對檔案管理的要求將會從“重管理、輕利用”向“重管理、更重利用”發(fā)展,真正體現(xiàn)“管理檔案不是目的,利用才是目的”這一指導(dǎo)思想,檔案的概念將更加模糊,檔案管理的范疇將更加寬泛,只要是對單
4、位有用的信息,都將成為單位的知識而進(jìn)行管理與利用,而做為單位內(nèi)部最大的一部分知識:檔案,必然會成為知識管理系統(tǒng)中的重中之重。目前,國外如寶馬、西門子等國際知名企業(yè)均已開始知識管理系統(tǒng)的研制與推進(jìn)工作。1.2建立數(shù)字檔案管理系統(tǒng)的必要性1.2.1 什么是數(shù)字檔案管理系統(tǒng)我國的檔案信息化建設(shè)從20世紀(jì)80年代末,國內(nèi)使用小型計算機(jī)管理檔案機(jī)讀目錄開始起步,之后發(fā)展到使用微型計算機(jī)利用關(guān)系型數(shù)據(jù)庫開展中大規(guī)模的信息檢索,再到利用多媒體、網(wǎng)絡(luò)技術(shù)開展現(xiàn)代意義的信息服務(wù)利用,檔案信息化建設(shè)經(jīng)歷了摸索實踐、建立理論、逐步深入的復(fù)雜過程,為今后的發(fā)展奠定了信息資源基礎(chǔ)和技術(shù)基礎(chǔ)。隨著我國信息化建設(shè)和國家數(shù)字
5、圖書館工程建設(shè)的開展,檔案工作者們發(fā)現(xiàn),檔案與圖書及其他文獻(xiàn)之間在信息屬性上的差別將隨著信息技術(shù)的發(fā)展而逐步淡化,并由數(shù)字圖書館引發(fā)了對檔案信息化建設(shè)的思考,從而提出了數(shù)字檔案管理系統(tǒng)的建設(shè)目標(biāo)。對于數(shù)字檔案管理系統(tǒng),國際和國內(nèi)都有著許多不同的看法和理解,即使在國家檔案局2000年立項的各地數(shù)字檔案管理系統(tǒng)的建設(shè)過程中,對于建設(shè)目標(biāo)也經(jīng)過了多次轉(zhuǎn)變。經(jīng)過摸索和實踐,國內(nèi)對數(shù)字檔案管理系統(tǒng)的認(rèn)識基本統(tǒng)一為:數(shù)字檔案管理系統(tǒng)是采用現(xiàn)代高新技術(shù)所建立的數(shù)字檔案信息系統(tǒng),是檔案信息的組織模式,代表的是一種信息環(huán)境和基礎(chǔ)設(shè)施構(gòu)建,是超大規(guī)模的、便于使用的、沒有時空限制的知識信息中心。我們認(rèn)為,既然數(shù)字檔
6、案管理系統(tǒng)是檔案信息化建設(shè)的發(fā)展方向,那么就必須站在信息技術(shù)和檔案工作發(fā)展的高度進(jìn)行深入分析和思考。數(shù)字檔案管理系統(tǒng)是國家機(jī)關(guān)、企事業(yè)單位按照行政隸屬關(guān)系或業(yè)務(wù)指導(dǎo)關(guān)系,通過本部門政務(wù)網(wǎng)或其他基礎(chǔ)網(wǎng)絡(luò),將檔案館及立檔單位檔案室結(jié)合起來,以統(tǒng)一的數(shù)據(jù)庫標(biāo)準(zhǔn)、軟硬件平臺和安全控制手段為基礎(chǔ),為各級各類工作人員提供綜合信息服務(wù)的虛擬的檔案館(室)集群。這種意義上的數(shù)字檔案管理系統(tǒng)建設(shè)是國家數(shù)字檔案管理系統(tǒng)的信息基礎(chǔ),具有時效性和現(xiàn)實性,與本部門的信息化建設(shè)聯(lián)系緊密,便于實施。我們提出的數(shù)字檔案管理系統(tǒng)建設(shè)即以此為出發(fā)點進(jìn)行規(guī)劃。數(shù)字檔案管理系統(tǒng)表現(xiàn)出如下一些特點:l 首先,它一定是利用現(xiàn)有計算機(jī)技術(shù)
7、建立起來的一套信息化系統(tǒng),它與當(dāng)今眾多利用信息技術(shù)建立起來的其它應(yīng)用系統(tǒng)一樣,需要考慮大量的存儲、利用、安全、傳輸加密、身份認(rèn)證等諸多問題;所以,只有在充分考慮并利用了這些技術(shù)的基礎(chǔ)上,才可能建成我們理想中的數(shù)字檔案管理系統(tǒng);l 其次,數(shù)字檔案管理系統(tǒng)系統(tǒng)即為數(shù)字檔案信息集成系統(tǒng),它完全不同于傳統(tǒng)意義上的檔案館,它所管理的不再是傳統(tǒng)的紙質(zhì)文件,而是數(shù)字信息;所以,這就要求如果要建立數(shù)字檔案管理系統(tǒng)則必須將現(xiàn)有的紙質(zhì)文件進(jìn)行數(shù)字化,并需將數(shù)字化后的檔案信息完全納入數(shù)字檔案管理系統(tǒng)信息系統(tǒng)中,沒有信息數(shù)據(jù),就不可能稱其為數(shù)字檔案管理系統(tǒng),所建立的數(shù)字檔案管理系統(tǒng)也是沒有任何意義的;l 第三,數(shù)字檔
8、案管理系統(tǒng)一定是利用信息技術(shù)建立起來的虛擬的檔案館,完全不同于傳統(tǒng)意義上的檔案館,它是沒有地理概念與時空概念的檔案館,是一種全新意義上的檔案館;所以,為了建成數(shù)字檔案管理系統(tǒng),保障其正常運(yùn)行,必須得投入人力物力進(jìn)行各種標(biāo)準(zhǔn)及規(guī)范的制定與建立,如“數(shù)字檔案信息管理與存儲規(guī)范”、“數(shù)字檔案管理系統(tǒng)計算機(jī)信息系統(tǒng)安全防護(hù)策略”、“數(shù)字檔案管理系統(tǒng)信息交換標(biāo)準(zhǔn)”等;l 第四,數(shù)字檔案管理系統(tǒng)一定是一種分布式的檔案館,即數(shù)字檔案管理系統(tǒng)一定是多個數(shù)字化檔案館的集群,簡單的將某一個檔案館的檔案資料進(jìn)行數(shù)字化并進(jìn)行發(fā)布利用,我們只能稱其為數(shù)字化檔案館,而不能稱其為數(shù)字檔案管理系統(tǒng),這也是與目前數(shù)字圖書館有較
9、大區(qū)別的地方;所以,在數(shù)字檔案管理系統(tǒng)的建立過程中,一定不應(yīng)該只考慮主管部門本身,而應(yīng)該將所有的下屬單位的檔案管理與利用一并納入到數(shù)字檔案管理系統(tǒng)的總體方案中,可以在主管機(jī)關(guān)建立超級服務(wù)終端,同時應(yīng)在下屬單位設(shè)立多處分終端;l 第五,數(shù)字檔案管理系統(tǒng)的利用一定是以基于現(xiàn)代網(wǎng)絡(luò)技術(shù)、沒有時間限制的、利用起來非常方便的應(yīng)用系統(tǒng),能夠讓利用人員真正做到隨時隨地調(diào)用其想查找的檔案資料;所以,要想建成數(shù)字檔案管理系統(tǒng),必須有完備的網(wǎng)絡(luò)硬件基礎(chǔ),能夠?qū)⑺邢聦賳挝煌耆B接起來,這樣,就能夠保證可以將數(shù)字檔案信息在專網(wǎng)中進(jìn)行發(fā)布,當(dāng)然,也可以有選擇地將部分檔案信息進(jìn)行基于WEB的發(fā)布而向公眾公開,以提高有價
10、值檔案的利用率;l 第六,數(shù)字檔案管理系統(tǒng)所管理的對象不僅僅是歷史檔案,現(xiàn)行檔案也應(yīng)納入整個數(shù)字檔案管理系統(tǒng)的建設(shè)體系中來,有時,甚至要超越檔案的范疇,凡是對現(xiàn)行工作有參考意義的資料、信息,均可以采集到數(shù)字檔案管理系統(tǒng)系統(tǒng)中來,以提供利用; l 第七,數(shù)字檔案管理系統(tǒng)不僅僅是一套檔案館管理系統(tǒng),各級、各單位所使用的單位檔案管理系統(tǒng)也應(yīng)是數(shù)字檔案管理系統(tǒng)的有機(jī)組成部分,其管理的信息也應(yīng)可以適時的通過各服務(wù)終端進(jìn)行網(wǎng)絡(luò)發(fā)布而提供利用,同時,各單位所使用的檔案管理系統(tǒng)應(yīng)與服務(wù)終端保持定期的數(shù)據(jù)交換,從而實現(xiàn)數(shù)字檔案信息的遠(yuǎn)程傳輸與接收,即檔案資料的網(wǎng)上移交;l 第八,數(shù)字檔案管理系統(tǒng)不是一個完全獨(dú)立
11、的系統(tǒng),它會與其它的應(yīng)用系統(tǒng)發(fā)生大量的聯(lián)系,如OA系統(tǒng)、ERP系統(tǒng)等,這些應(yīng)用系統(tǒng)中會產(chǎn)生大量的需要?dú)w檔的信息,而這些信息應(yīng)該通過接口系統(tǒng)直接歸入各級、各單位所使用的檔案管理系統(tǒng)中去,再通過網(wǎng)絡(luò)發(fā)布機(jī)制及電子文件的網(wǎng)上傳輸與接收機(jī)制進(jìn)行網(wǎng)絡(luò)發(fā)布利用及向主管部門進(jìn)行定期的數(shù)據(jù)移交;所以,從這個意義說,數(shù)字檔案管理系統(tǒng)同時也應(yīng)是單位信息化系統(tǒng)建設(shè)的不可忽缺的組成部分。l 第九,數(shù)字檔案管理系統(tǒng)系統(tǒng)應(yīng)該具有工作流、郵件及消息管理功能,能夠?qū)崿F(xiàn)數(shù)據(jù)接收、管理、利用的審批。1.2.2 為什么要建立數(shù)字檔案管理系統(tǒng)(一)建設(shè)數(shù)字檔案管理系統(tǒng)是實現(xiàn)信息共享,提高信息綜合服務(wù)效率和質(zhì)量的根本途徑。隨著各企、事
12、業(yè)單位的信息化建設(shè)的不斷深入,將在各級機(jī)構(gòu)和部門建立包含公文、檔案、資料在內(nèi)的多種數(shù)據(jù)庫,但正是由于機(jī)構(gòu)行政分工或技術(shù)分工的不同,將會導(dǎo)致信息之間的聯(lián)系可能被人為地割斷,而無法快速利用信息的全部內(nèi)容,這也就是我們常說的“信息孤島”問題。而數(shù)字檔案管理系統(tǒng)建設(shè)區(qū)別于傳統(tǒng)的檔案自動化最根本的一點,就是利用網(wǎng)絡(luò)和數(shù)據(jù)庫的開放接口,實現(xiàn)跨部門、跨系統(tǒng)的信息資源共享。因此,我們通過建設(shè)數(shù)字檔案,依托單位的辦公系統(tǒng)平臺,通過統(tǒng)一信息利用標(biāo)準(zhǔn),在安全保密的條件下,實現(xiàn)各系統(tǒng)中數(shù)據(jù)庫的互聯(lián)互通,為本單位人員提供有效、快捷的信息獲取渠道,實現(xiàn)本單位信息資源的高度共享,從根本上提高信息綜合服務(wù)效率和質(zhì)量,充分發(fā)揮
13、文檔信息在領(lǐng)導(dǎo)決策和科研工作中的服務(wù)作用。(二)建設(shè)數(shù)字檔案管理系統(tǒng)可以統(tǒng)一全行業(yè)檔案管理標(biāo)準(zhǔn),統(tǒng)一管理。目前本單位及各下屬單位均已實現(xiàn)了檔案管理的自動化,但是由于相互之間所使用系統(tǒng)的獨(dú)立性,使得各下屬單位均按各自的想法與要求去定制各自使用的系統(tǒng),而主管部門也無法及時了解各單位的檔案軟件定制情況,無法執(zhí)行統(tǒng)一的檔案管理標(biāo)準(zhǔn),通過建設(shè)數(shù)字檔案管理系統(tǒng)系統(tǒng),所有的標(biāo)準(zhǔn)、規(guī)范均可以統(tǒng)一定制到一套系統(tǒng)中,全行業(yè)統(tǒng)一使用一套系統(tǒng),有利于檔案管理標(biāo)準(zhǔn)化的推進(jìn)。通過這種方式,有利于全行業(yè)檔案的統(tǒng)一管理,極大的提高檔案管理水平。(三)建設(shè)數(shù)字檔案管理系統(tǒng)可以實現(xiàn)全行業(yè)檔案信息資源的互聯(lián)互通。目前各下屬單位的檔
14、案信息資料均單獨(dú)保管,各自利用,這樣不利于充分發(fā)揮檔案信息在領(lǐng)導(dǎo)決策和科研工作中的服務(wù)作用,不利于檔案信息資源的利用最大化,不能實現(xiàn)檔案信息資源在本行業(yè)的互聯(lián)互通,通過建設(shè)數(shù)字檔案管理系統(tǒng)即可以很好地解決這一問題。1.2.3 目前數(shù)字檔案管理系統(tǒng)在國內(nèi)外的發(fā)展 據(jù)了解,美、英等發(fā)達(dá)國家在90年代中期已經(jīng)開展了數(shù)字檔案管理系統(tǒng)的研究和實踐。通過NARA(美國檔案文件署)網(wǎng)站,可以檢索到包括10個總統(tǒng)圖書館在內(nèi)的200多個檔案館的數(shù)字化檔案。國家檔案局從1996年對數(shù)字檔案管理系統(tǒng)進(jìn)行了一系列的研究。1999年,國家檔案局和深圳市檔案館提出了建立數(shù)字檔案管理系統(tǒng)的構(gòu)想。2000年又把“數(shù)字檔案管理
15、系統(tǒng)工程研究與開發(fā)”作為全國重點檔案科技攻關(guān)計劃下達(dá)給深圳市檔案局與國家檔案局科研所共同承擔(dān),并將其列入國家檔案局的“十五”規(guī)劃,同時在深圳開展試點工作。目前在國內(nèi)還沒有一家建成真正意義上的數(shù)字檔案管理系統(tǒng)。1.2.4數(shù)字檔案管理系統(tǒng)建設(shè)的主要內(nèi)容 數(shù)字檔案管理系統(tǒng)建設(shè)的主要內(nèi)容包括:標(biāo)準(zhǔn)規(guī)范體系的建設(shè)、數(shù)字信息資源建設(shè)、基礎(chǔ)平臺建設(shè)、基礎(chǔ)設(shè)施建設(shè)、信息安全體系建設(shè)和人才隊伍建設(shè)六個方面。(一)標(biāo)準(zhǔn)規(guī)范體系建設(shè)。標(biāo)準(zhǔn)規(guī)范體系建設(shè)是數(shù)字檔案管理系統(tǒng)工程的重要支撐。在數(shù)字檔案管理系統(tǒng)建設(shè)過程中,如何將多元化的檔案信息資源協(xié)調(diào)組織起來,通過網(wǎng)絡(luò)互聯(lián)互通,實現(xiàn)信息共建和共享,以及數(shù)字信息的長期保存和遷
16、移,其關(guān)鍵就在于標(biāo)準(zhǔn)化。因此,我們必須按照先進(jìn)性、完整性和可調(diào)整性的原則,借鑒和采用國內(nèi)外成熟、相關(guān)的標(biāo)準(zhǔn)和規(guī)范,研究制定切實可行的標(biāo)準(zhǔn)規(guī)范體系。主要包括管理性標(biāo)準(zhǔn)規(guī)范、業(yè)務(wù)性標(biāo)準(zhǔn)規(guī)范和技術(shù)性標(biāo)準(zhǔn)規(guī)范,尤其是元數(shù)據(jù)標(biāo)準(zhǔn)。(二)數(shù)字信息資源建設(shè)。數(shù)字信息資源是數(shù)字檔案管理系統(tǒng)得以生存發(fā)展的基礎(chǔ)和核心。信息資源不僅涵蓋原有的傳統(tǒng)意義的檔案信息,并且其信息采集的范圍將進(jìn)一步擴(kuò)大到現(xiàn)行文件、各信息系統(tǒng)的專業(yè)數(shù)據(jù)庫和專題數(shù)據(jù)庫以及從互聯(lián)網(wǎng)、政務(wù)網(wǎng)等各方面收集的與本單位相關(guān)的各類信息。正是考慮到數(shù)字信息資源的多樣性和非結(jié)構(gòu)性等特點,我們將在建設(shè)過程中引入OAIS(開放檔案信息系統(tǒng))參考模型,解決數(shù)字信息資
17、源長期保護(hù)問題和維護(hù)數(shù)字信息的可存取性。在這個模型中,我們將采用對象分類法來標(biāo)識和區(qū)分用來支持?jǐn)?shù)字信息保存的不同種類的元數(shù)據(jù),并把每種信息和它的元數(shù)據(jù)作為一個“信息包”捆綁在一起。一個信息包由“內(nèi)容信息”和“保存描述信息”兩部分組成。內(nèi)容信息包含了各種數(shù)字資源或數(shù)據(jù)對象,保存描述信息則包含了各種描述元數(shù)據(jù)。這樣,無論信息技術(shù)發(fā)展到何種程度,當(dāng)用戶提出信息利用請求時,系統(tǒng)會同時提供可以讀取該信息的工具和便于用戶理解的各種描述信息,確保信息的有效利用。數(shù)字信息資源建設(shè)包括傳統(tǒng)的館藏檔案的數(shù)字化信息、直接接收的數(shù)字信息、通過其它信息系統(tǒng)及其它分支業(yè)務(wù)網(wǎng)絡(luò)收集的各種類型電子文件及其元數(shù)據(jù)、通過互聯(lián)網(wǎng)或
18、其它本部門之外的專用網(wǎng)絡(luò)搜集的信息以及直接采購的與本單位有關(guān)的行業(yè)數(shù)據(jù)庫和專題數(shù)據(jù)庫。(三)基礎(chǔ)平臺建設(shè)。數(shù)字檔案管理系統(tǒng)基礎(chǔ)平臺是一個動態(tài)的、可擴(kuò)展的信息網(wǎng)絡(luò)系統(tǒng),在整個數(shù)字檔案管理系統(tǒng)體系中起著承上啟下的聯(lián)接作用。一方面可以按照相關(guān)技術(shù)標(biāo)準(zhǔn)與現(xiàn)有各應(yīng)用系統(tǒng)完整結(jié)合,獲取各方面信息,豐富數(shù)字信息資源;另一方面,通過良好的人機(jī)交互,為用戶提供跨地域、跨部門的信息服務(wù)。數(shù)字檔案管理系統(tǒng)基礎(chǔ)平臺主要包括文檔一體化系統(tǒng)數(shù)據(jù)接口、信息采集系統(tǒng)、檔案信息管理系統(tǒng)、檔案信息利用服務(wù)系統(tǒng)和運(yùn)行維護(hù)跟蹤管理系統(tǒng)。(四)基礎(chǔ)設(shè)施建設(shè)?;A(chǔ)設(shè)施建設(shè)包括網(wǎng)絡(luò)建設(shè)、硬件設(shè)施建設(shè)和軟件建設(shè)。1、網(wǎng)絡(luò)建設(shè)是數(shù)字檔案管理系
19、統(tǒng)的通信保障,包括單位總部的網(wǎng)絡(luò)建設(shè)和下屬單位檔案室的網(wǎng)絡(luò)建設(shè),并通過統(tǒng)一的網(wǎng)絡(luò)軟硬件環(huán)境,依托現(xiàn)有的政務(wù)網(wǎng)構(gòu)成虛擬數(shù)字檔案管理系統(tǒng)基礎(chǔ)網(wǎng)絡(luò)。2、硬件設(shè)施建設(shè)包括檔案館(室)開展信息化建設(shè)所必需的網(wǎng)絡(luò)設(shè)備、數(shù)字加工設(shè)備、海量存儲設(shè)備以及計算機(jī)和輸出設(shè)備。3、軟件建設(shè)除運(yùn)行必需的各類操作系統(tǒng)軟件外,還應(yīng)包含自行研制開發(fā)的通信軟件、郵件服務(wù)器、系統(tǒng)管理軟件、安全管理軟件等系統(tǒng)。(五)信息安全體系建設(shè)。在數(shù)字檔案管理系統(tǒng)的建設(shè)和運(yùn)行過程中,如何確保信息的安全保密是提供信息服務(wù)的前提和保證,必須通過信息安全體系的建設(shè),確保信息的可用性、保密性、完整性和抗抵賴性,同時還必須滿足系統(tǒng)的可靠性、可控性和穩(wěn)定
20、性。信息安全體系建設(shè)包括:建立完善的信息安全保密制度、采用切實有效的安全保密措施和進(jìn)行安全監(jiān)控與審計。(六)人才隊伍建設(shè)。數(shù)字檔案管理系統(tǒng)的建設(shè)不僅為我們帶來了技術(shù)上的巨大進(jìn)步和工作效率的極大提高,并且從客觀上對各級檔案部門工作人員的科技素質(zhì)的提出了較高的要求。我們在進(jìn)行數(shù)字檔案管理系統(tǒng)建設(shè)的同時,必須堅持以人為本的原則,把培養(yǎng)人才、建設(shè)隊伍、提高素質(zhì)放在第一位,培養(yǎng)和造就一支具有良好的職業(yè)道德、較高水平的信息工作能力和較全面的知識結(jié)構(gòu)的復(fù)合型人才隊伍,并通過院校教育、在職培訓(xùn)、引進(jìn)人才等方式保持人才隊伍的先進(jìn)性,使信息技術(shù)不斷與實際工作相結(jié)合,為數(shù)字檔案管理系統(tǒng)建設(shè)創(chuàng)造發(fā)展基礎(chǔ)。二、 檔案管
21、理系統(tǒng)建設(shè)方案2.1建設(shè)目標(biāo)本項目將開發(fā)一套河北省電力公司培訓(xùn)檔案管理系統(tǒng),實現(xiàn)系統(tǒng)內(nèi)所有職工培訓(xùn)檔案管理的信息化,實現(xiàn)各種培訓(xùn)數(shù)據(jù)的自動計算、匯總、查詢和報表等功能,提供了“一體化”的多部門應(yīng)用模式和職能型綜合管理方案,實現(xiàn)公司領(lǐng)導(dǎo)、人力資源部、送培單位、培訓(xùn)中心從決策層、管理層、業(yè)務(wù)層的信息共享,從而實現(xiàn)教學(xué)培訓(xùn)檔案管理一體化,信息流統(tǒng)一化的良好管理模式。在企業(yè)的多種信息化應(yīng)用系統(tǒng)中,電子文件的數(shù)量在不斷的增大,電子文件的格式在不斷的增多,不同格式電子文件的存儲方式及打開方式不同。隨著系統(tǒng)硬件、操作系統(tǒng)、運(yùn)行環(huán)境、應(yīng)用軟件的不斷變化、更新,電子文件的長期保存、及利用的問題必將成為檔案信息化
22、管理迫切需要解決的首要問題。隨著現(xiàn)代企業(yè)的分支機(jī)構(gòu)不斷增加,檔案應(yīng)用系統(tǒng)的負(fù)載和數(shù)據(jù)量也日趨龐大,如果將所有的檔案數(shù)據(jù)都集中到一個文件服務(wù)器或數(shù)據(jù)庫服務(wù)器,這必然導(dǎo)致檔案數(shù)據(jù)管理、保存、利用的性能及效率的降低。培訓(xùn)檔案館管理系統(tǒng)建設(shè)目標(biāo):l 建立基于J2EE平臺的標(biāo)準(zhǔn)化、可擴(kuò)展、多部門協(xié)同的分布式數(shù)字檔案管理系統(tǒng)系統(tǒng);l 具有檔案信息獲取、管理、存儲、利用、交換和服務(wù)等一系列功能;l 向檔案利用者提供一站式、無縫集成的、個性化的檔案查詢服務(wù)以及其他相關(guān)服務(wù);l 向所有的檔案用戶提供基于WEB的界面,包括:用戶提交界面、搜索界面、系統(tǒng)管理界面等各種界面。利用Java虛擬機(jī)和Java服務(wù)器技術(shù),系
23、統(tǒng)允許用戶通過瀏覽器訪問系統(tǒng);l 采用強(qiáng)大的工作流引擎建立檔案管理工作相關(guān)業(yè)務(wù)的審批流程。2.2設(shè)計原則培訓(xùn)檔案管理系統(tǒng)基于J2EE平臺的分布式數(shù)字化檔案館系統(tǒng),系統(tǒng)的所有代碼均使用JAVA語言開發(fā)。系統(tǒng)的后臺數(shù)據(jù)庫系統(tǒng)采用關(guān)系型數(shù)據(jù)庫系統(tǒng),支持ORACLE、SQLSERVER、DB2、SYBASE、MYSQL等多種數(shù)據(jù)庫系統(tǒng)。系統(tǒng)中的所有配置采用XML技術(shù)。系統(tǒng)的通訊協(xié)議采用HTTP,TCP/IP,SSL。根據(jù)檔案管理的特點,檔案的應(yīng)用程序、處理的數(shù)據(jù)及實際的計算多廣泛的分布于網(wǎng)絡(luò)中,為了平衡這種分布,采用RMI技術(shù)實現(xiàn)系統(tǒng)的分布式計算,RMI是遠(yuǎn)程方法調(diào)用(Remote Method In
24、vocation)。RMI技術(shù)可以實現(xiàn)檔案業(yè)務(wù)所涉及的數(shù)據(jù)移交,即檔案組織的下級機(jī)構(gòu)的數(shù)據(jù)可以主動或被動的通過網(wǎng)絡(luò)傳輸遷移至組織的上級機(jī)構(gòu)。技術(shù)架構(gòu)如下圖所示: 整個系統(tǒng)被劃分成五個相對分開的邏輯層面:1)展現(xiàn)層:采用Struts框架實現(xiàn)MVC模式的展現(xiàn)層。是展現(xiàn)給系統(tǒng)所有用戶的圖形界面,它包括HTML、JSP、Servlet、Java Applet。采用MVC模式的優(yōu)勢在于:代碼重用性,MVC可以使用多種用戶圖形界面而系統(tǒng)核心處理功能無需改變;提高開發(fā)工作的協(xié)同性,并且圖形界面的變更不會導(dǎo)致核心處理功能的變化;因為顯示功能與處理功能的分開,所以在不需要重新編譯核心處理功能的情況下可以修改系統(tǒng)
25、的圖形界面。2)應(yīng)用層:實現(xiàn)所有的檔案管理業(yè)務(wù)邏輯。包括所有的檔案管理功能,如檔案的攝取、管理、保存、利用、訪問等。工作流引擎貫穿整個系統(tǒng)的功能及業(yè)務(wù)流程,使各個相對獨(dú)立或有先后次序的功能可以有機(jī)的結(jié)合起來,功能之間有相互調(diào)用的接口。3)服務(wù)層:作為整個系統(tǒng)的服務(wù)總線,為整體系統(tǒng)提供面向服務(wù)架構(gòu)的開發(fā)工具包。其原理是將基礎(chǔ)功能合并到開發(fā)工具包中,統(tǒng)一提供API接口供"應(yīng)用層"調(diào)用,例如JavaMail為所有的模塊提供郵件服務(wù)。這些開發(fā)工具包有:郵件服務(wù)類、消息服務(wù)類、文件處理類、FTP處理類、XML處理類、字符集轉(zhuǎn)換類、唯一主鍵生成器、分頁處理類、數(shù)據(jù)類型轉(zhuǎn)換類、樹型結(jié)構(gòu)處
26、理類、報表處理類、采用RSA算法的文件加/解密類、Enterprise Service(企業(yè)注冊服務(wù))等。其中,Enterprise Service(企業(yè)注冊服務(wù))允許開發(fā)人員擴(kuò)展現(xiàn)有的服務(wù)基礎(chǔ),例如注冊不同的服務(wù)將信息包引擎產(chǎn)生的"信息包"轉(zhuǎn)換為特定的數(shù)據(jù)結(jié)構(gòu)提供給不同模塊。4)信息包引擎:信息包引擎層是進(jìn)行邏輯包與物理存貯包之間的轉(zhuǎn)換層。它完成從信息包數(shù)據(jù)到數(shù)據(jù)庫、文件系統(tǒng)、外部各種數(shù)據(jù)源之間的交互與存取功能,并提供統(tǒng)一的訪問接口。本層向上提供訪問接口,包括定義、查詢和更新三方面的功能接口,向上層提供以DOM形式的信息數(shù)據(jù)包,將經(jīng)過服務(wù)接口從各類數(shù)據(jù)源中獲取到的數(shù)據(jù)轉(zhuǎn)換
27、為信息包、將數(shù)據(jù)修改命令轉(zhuǎn)換為標(biāo)準(zhǔn)格式提交給服務(wù)接口執(zhí)行。實現(xiàn)服務(wù)接口的跟各種數(shù)據(jù)源的鏈接的可獨(dú)立發(fā)布的java bean程序包,如與數(shù)據(jù)庫的接口程序、與文件系統(tǒng)的接口程序等。數(shù)據(jù)庫接口使用hibernate 數(shù)據(jù)對象持久層技術(shù)實現(xiàn)。Xml文件訪問使用w3c標(biāo)準(zhǔn)格式定義的xml文件系統(tǒng)作為數(shù)據(jù)源訪問。也提供到CORBA、EJB、soap、web service等的數(shù)據(jù)訪問接口。5)數(shù)據(jù)層:存放系統(tǒng)的應(yīng)用數(shù)據(jù),是上層的數(shù)據(jù)源。數(shù)據(jù)源可以是關(guān)系型的數(shù)據(jù)庫系統(tǒng),如Oracle、MS Sqlserver、Mysql等;也可以是XML文檔集(按照XML規(guī)范存放的數(shù)據(jù));還可以是如輕量級目錄訪問協(xié)議(LD
28、AP)服務(wù)器的目錄服務(wù)。 其系統(tǒng)構(gòu)架如下圖所示:2.2.1 建立基于OAIS參考模型的數(shù)字檔案管理系統(tǒng)系統(tǒng) 什么是OAIS1995年,在國際標(biāo)準(zhǔn)化組織(ISO)的請求下,空間數(shù)字系統(tǒng)咨詢委員會(Consultative Committee for Space Data Systems,CCSDS)開始開發(fā)一個存檔標(biāo)準(zhǔn)以支持?jǐn)?shù)字形式存在的數(shù)據(jù)的長期保存。CCSDS的這一工作導(dǎo)致1999年5月開放檔案信息系統(tǒng)(Open Archival Information System ,OAIS)參考模型的發(fā)布。這一參考模型針對數(shù)字信息的長期保存和維護(hù)的檔案系統(tǒng)提供一個概念性的框架,描述了一個
29、檔案系統(tǒng)存在的環(huán)境、檔案系統(tǒng)的功能組織以及支持檔案處理的信息基礎(chǔ)結(jié)構(gòu)。這一參考模型作為ISO的推薦草案得到了廣泛的評閱,經(jīng)過擴(kuò)充,適用于圖書館、檔案館及其它文化傳承機(jī)構(gòu)、政府部門和私有機(jī)構(gòu)。新的OAIS于2001年7月發(fā)布。 建立數(shù)字檔案管理系統(tǒng)系統(tǒng)為什么要采用OAIS參考模型自O(shè)AIS發(fā)布以來,很多數(shù)字檔案的研究和開發(fā)的項目都以O(shè)AIS作為一個優(yōu)先遵守的標(biāo)準(zhǔn)規(guī)范。OAIS參考模型同時支持?jǐn)?shù)字化的和物理存在的存檔信息。它特別對數(shù)字化信息給予了較多關(guān)注,這些數(shù)字信息或者是作為檔案的主體,或者是作為對數(shù)字化資源以及物理存檔資源的支持信息存在。在OAIS參考模型中,提供了一個完整的檔案
30、信息保存功能,它包括攝入、檔案存儲、數(shù)據(jù)管理、存取和分發(fā)。它同時論述了數(shù)字信息從一種媒體或格式到另一媒體或格式的移植、信息表示的數(shù)據(jù)模型、信息保存中軟件的作用、檔案系統(tǒng)之間數(shù)字信息的交換等。它還確立了各個檔案功能內(nèi)部和外部的接口,以及一系列在這些接口之上的高層服務(wù)。在CCSDS和ISO的推動下,OAIS參考模型成為了數(shù)字檔案系統(tǒng)普遍遵從的標(biāo)準(zhǔn)規(guī)范,來自圖書館、檔案館、科學(xué)數(shù)據(jù)、文化傳承等領(lǐng)域的相關(guān)項目和系統(tǒng)都紛紛以其為準(zhǔn),進(jìn)行系統(tǒng)的規(guī)劃和設(shè)計。飛揚(yáng)數(shù)字檔案管理系統(tǒng)系統(tǒng)建設(shè),也將遵循OAIS參考模型。 OAIS參考模型在國內(nèi)外的應(yīng)用(1)CEDARS(CURL Exemplars
31、in Digital ARchives)Cedars是英國的三個CURL機(jī)構(gòu)在1998年4月到2002年3月間進(jìn)行的一個研究項目。Cedars項目關(guān)注5個方面的研究內(nèi)容:保存元數(shù)據(jù)、知識產(chǎn)權(quán)、數(shù)字館藏管理、技術(shù)策略和分布式數(shù)字檔案原型系統(tǒng)。其中分布式數(shù)字檔案原型系統(tǒng)是Cedars項目為了驗證Cedars項目中提出的長期保存方法的有效性而創(chuàng)建的一個系統(tǒng),并且通過它證明了數(shù)字保存是一個可以解決的問題。Cedars的分布式數(shù)字檔案原型系統(tǒng)的目標(biāo)并不是解決所有的“數(shù)字保存問題”,而是從一個更加實用的角度,來考慮數(shù)字資源的保存。對于一個特定的數(shù)字資源,這一原型系統(tǒng)希望能夠達(dá)到的目標(biāo)是:使數(shù)字資源能夠在長
32、期保存的存儲體系中能夠持續(xù)存在;確保被保存的數(shù)字對象能夠被找到;使這些被保存資源在一段時間之后仍然能夠被理解。Cedars的原型系統(tǒng)以O(shè)AIS為基礎(chǔ),OAIS參考模型中所描述的功能和特點都不同程度地在Cedars分布式數(shù)字檔案原型系統(tǒng)中得到了實現(xiàn)。Cedars提出的分布式數(shù)字檔案原型系統(tǒng)是一個“聯(lián)邦的”數(shù)字檔案解決方案。它實現(xiàn)了一個包括協(xié)作、互聯(lián)和分布式檔案存儲的體系架構(gòu)。在實際中,Cedars原型系統(tǒng)是由地理上相互隔離的3個站點組成的、包括三個數(shù)字檔案的分布式框架。(2)NEDLIB及DSEP(Deposit System for Electronic Publications )NEDLI
33、B開始于1998年,到2000年結(jié)束,該項目由歐洲國家圖書館聯(lián)合會常設(shè)委員會發(fā)起,由歐洲委員會電信應(yīng)用項目支助,歐洲8個國家的圖書館、一個檔案館、兩個ICT組織和三個主要的出版商參與了這個項目。NEDLIB項目的一項重要工作是做數(shù)字資源保存的功能說明和DSEP的全面設(shè)計。主要目的是確定所有保存機(jī)構(gòu)的共有的功能需求,從而使DSEP的設(shè)計可以達(dá)到一個高層次,可以作為單個機(jī)構(gòu)保存資源時的基礎(chǔ)架構(gòu)而存在。項目的目的還包括長期保存問題的研究。該項目對長期保存不同方面進(jìn)行了研究,包括性價比、法律限制、與出版商的協(xié)議、用戶訪問需求、保存策略的選擇等。NEDLIB主要致力于保存的技術(shù)問題的研究。除了制定抽象模
34、型和實驗性保存戰(zhàn)略外,NEDLIB還非常重視程序設(shè)計和結(jié)果的重用。該項目保存所有的推薦標(biāo)準(zhǔn)、技術(shù)解決方法、實踐經(jīng)驗、技術(shù)框架和組織方法,從而為使用DSEP時提供實踐指導(dǎo)。NEDLIB提出了基于仿真的長期保存方法,其中主要的組成部件是仿真器說明(emulator specifications)、仿真說明解釋程序(emulator specification interpreter program)和仿真虛擬機(jī)(emulation virtual machine)。NEDLIB在保存機(jī)構(gòu)需求與OAIS間建立映射,然后將OAIS模型細(xì)化為DSEP,這樣DSEP可以執(zhí)行OAIS標(biāo)準(zhǔn)。NEDLIB將從數(shù)
35、字資源的選擇到最終用戶訪問的工作流分為13個步驟,并將這13個步驟映射為OAIS功能實體集合。(3)e-Depot的DIAS系統(tǒng)e-Depot系統(tǒng)是一個完全自動化的、專注于長期存儲和大規(guī)模存檔的自動化系統(tǒng),是荷蘭國家圖書館針對長期保存和持久存取荷蘭電子出版物的需要而提出。2002年12月12日, 由IBM開發(fā)的e-Depot的核心數(shù)字信息存檔系統(tǒng)(Digital Information and Archiving System,DIAS)完成開發(fā)。e-Depot提出需要將長期保存功能從出版物的生產(chǎn)者中分離出來,構(gòu)建大型受控存檔環(huán)境的設(shè)想,并且這一受控存檔環(huán)境還必須符合OAIS參考模型。在e-d
36、epot中,這一存取和維護(hù)數(shù)字對象的大型受控存檔環(huán)境就是IBM所開發(fā)的DIAS系統(tǒng)。E-depot采用了將仿真和遷移相結(jié)合來實現(xiàn)對特定數(shù)字對象的保存,提出了統(tǒng)一虛擬計算機(jī)(UVC)的方法和在保存系統(tǒng)中管理媒體移植的方法。(4)目前國內(nèi)尚沒有一整套的完全基于OAIS參考模型而開發(fā)的數(shù)字檔案管理系統(tǒng)系統(tǒng)。三、 省電力培訓(xùn)檔案管理系統(tǒng)功能設(shè)計方案整個系統(tǒng)將由三大中心及一個門戶構(gòu)成,即:“接收中心”、“管理中心”、“利用中心”及“門戶”;以完成從信息的采集、管理、保存、利用的全過程管理。如下圖所示:3.1 系統(tǒng)功能模型圖3.2管理中心管理中心主要是完成對已收集進(jìn)行的數(shù)據(jù)進(jìn)行各種管理操作,如生成存儲信息
37、包(AIP),進(jìn)行信息的整理歸類、進(jìn)行檔案數(shù)據(jù)的長期保存規(guī)劃、包括與接收中心、利用中心通過工作流管理進(jìn)行信息的審批交互等工作。3.2.1 工作流管理工作流的管理是有別于傳統(tǒng)檔案軟件的核心標(biāo)志之一,它將流程的審批工作貫穿于整個數(shù)字檔案檔案館系統(tǒng)中,在接收下屬單位數(shù)據(jù)、進(jìn)行檔案數(shù)據(jù)的鑒定、存儲、檔案查詢的臨時賦權(quán)、預(yù)約檔案查詢及排位管理時均需要使用此功能。它的實現(xiàn),將有助于將檔案管理從靜態(tài)管理向動態(tài)的管理發(fā)展。3.2.2 長期保存規(guī)劃 通過分析國外相關(guān)的項目和實踐,并參考專家學(xué)者的研究成果,將數(shù)字資源長期保存的方法歸納如下:(1)多重備份與適時遷移功能多重備份的基本思想類似于數(shù)據(jù)庫管理中的數(shù)據(jù)備份
38、,盡量避免因不可避免的因素而造成的數(shù)據(jù)損失。目前,各類數(shù)字資源保存系統(tǒng)多采用Cache技術(shù),采用分布式架構(gòu),在位于異地的多臺機(jī)器上分別緩存資源,一旦一方數(shù)據(jù)發(fā)生損失,可以迅速從其他緩存點恢復(fù)數(shù)據(jù)。適時遷移是根據(jù)軟件、硬件的發(fā)展將數(shù)字資源遷移到不同的軟件或硬件環(huán)境下,從而保證數(shù)字資源可以在發(fā)展的環(huán)境中被識別、使用和檢索。根據(jù)遷移條件的不同,遷移可以分為硬件遷移、軟件遷移、載體遷移、格式遷移、版本遷移和訪問點遷移。硬件遷移主要是由于硬件更新而引起的,是將數(shù)字資源存儲到新的硬件環(huán)境下。硬件遷移往往適用于數(shù)字保存單位硬件條件升級或提高的情況。軟件遷移主要是由于使用的軟件發(fā)生變化而引起的,是將數(shù)字資源轉(zhuǎn)
39、移到新的軟件環(huán)境下,以保證數(shù)字資源在新的軟件環(huán)境下的可用性。載體遷移主要是由于數(shù)字資源存儲載體的變化而引起的,是將數(shù)字資源轉(zhuǎn)移到新的載體環(huán)境下。如將以光盤為載體的數(shù)字資源保存到硬盤中。版本遷移主要是由于軟件更新或升級而引起的,是將數(shù)字資源轉(zhuǎn)移到新的軟件版本環(huán)境下,以保證數(shù)字資源在新的版本環(huán)境下的可用性。如將Word6環(huán)境下的文檔轉(zhuǎn)移到Word2000環(huán)境下。格式遷移是將數(shù)字資源從一種格式轉(zhuǎn)換成另外一種格式,以適應(yīng)新的環(huán)境下對數(shù)字格式的要求。如將HTML格式轉(zhuǎn)換成XML格式。訪問點遷移是指訪問入口點的改變。如從客戶端方式改為從WEB瀏覽器方式。(2)開放描述功能、建立元數(shù)據(jù)標(biāo)準(zhǔn)開放描述是目前流行
40、的一種數(shù)字資源長期保存中數(shù)據(jù)可讀性與互操作性的解決方案。所謂開放描述指信息系統(tǒng)通過計算機(jī)可識別的開放語言和規(guī)范方式來描述自己系統(tǒng)各個層次內(nèi)容。尤其是自己的數(shù)據(jù)格式、組織體系和管理機(jī)制。所形成的描述文件及其定義語言置于本系統(tǒng)公知位置、或遞交公共登記系統(tǒng),第二方系統(tǒng)可以對這些描述文件進(jìn)行搜尋,按照開放語言規(guī)則進(jìn)行解析,從而使第三方系統(tǒng)能識別、理解本系統(tǒng)的格式和規(guī)則,并在此基礎(chǔ)上實現(xiàn)系統(tǒng)間的互操作。數(shù)字資源的開放描述可以將數(shù)字資源的存儲、描述、組織、傳遞方式以第三方可以獲取的形式描述,從而實現(xiàn)第三方或未來對該類資源的使用。開放描述與登記機(jī)制包括文件格式登記、描述登記和服務(wù)登記。文件格式登記一般實現(xiàn)文
41、件格式登記、格式識別、格式有效性檢查、格式轉(zhuǎn)換等功能。描述登記是對數(shù)字資源描述的一種開放性描述與注冊方式,通過該種方式第三方可以了解數(shù)字資源的具體描述方式、方法、解析方法等內(nèi)容,從而方便地使用該資源。目前流行的描述登記有元數(shù)據(jù)登記、持久標(biāo)識符登記等。服務(wù)登記的目的是以一種開放的描述方法描述服務(wù),第三方可以通過服務(wù)注冊中心發(fā)現(xiàn)需要的服務(wù),并通過服務(wù)請求調(diào)用等方式完成服務(wù)調(diào)用,從而實現(xiàn)需要的服務(wù)。目前流行的Web服務(wù)就是采用的這種方式,其中UDDI是該技術(shù)方法的統(tǒng)一描述、發(fā)現(xiàn)和集成中心,它可以完成服務(wù)的注冊、服務(wù)發(fā)現(xiàn)與服務(wù)綁定。(3)模擬環(huán)境與環(huán)境封裝功能模擬環(huán)境是在新的環(huán)境下模擬原有的數(shù)字資源保
42、存、運(yùn)行環(huán)境,實現(xiàn)在新的環(huán)境下的資源的利用,如在Windows環(huán)境下模擬DOS環(huán)境運(yùn)行DOS程序。環(huán)境封裝是在對數(shù)字資源進(jìn)行包裝過程中,將該數(shù)字資源所需的運(yùn)行環(huán)境,如動態(tài)鏈接庫、運(yùn)行環(huán)境等一起打包,從而實現(xiàn)在其它環(huán)境下運(yùn)行該程序包,如在JAVA程序中加入J2SDK,從而保證在新的環(huán)境下的JAVA環(huán)境要求??梢詣?chuàng)建在原始硬件環(huán)境下運(yùn)行原始數(shù)據(jù)所需軟件的軟件模擬器來完成在未來的環(huán)境中運(yùn)行原始數(shù)據(jù)的工作。這種模擬原始環(huán)境的方法可以有效地解決在數(shù)字檔案管理系統(tǒng)中原始資源的長期保存問題。 環(huán)境封裝包括在XML中包含原始文件、在描述文件中包含指向軟件的鏈接、包含軟件本身三種情況。包含軟件本身往往是保存與數(shù)
43、字資源有關(guān)的所有內(nèi)容,如文件本身、文件的上下文信息、文件運(yùn)行的軟件、硬件環(huán)境等。(4)數(shù)據(jù)恢復(fù)與數(shù)據(jù)考古數(shù)據(jù)恢復(fù)與數(shù)據(jù)考古是從原始的字節(jié)流中恢復(fù)數(shù)字資源的原貌,并保證數(shù)字資源的可讀性和可用性。數(shù)據(jù)恢復(fù)包括數(shù)據(jù)災(zāi)難恢復(fù)、數(shù)據(jù)格式恢復(fù)等。數(shù)據(jù)恢復(fù)是具有技術(shù)挑戰(zhàn)性的技術(shù)方法,值得注意的是,如果已經(jīng)無法獲取數(shù)字資源的原貌,就無法評估數(shù)據(jù)恢復(fù)的成果。因此在正常的圖書館數(shù)字資源保存過程中,不贊成使用這種方法作為長期保存的技術(shù)方法,而應(yīng)該采用更為實際的運(yùn)作方法。該方法僅在其他長期保存方法無法發(fā)揮作用時使用。(5)技術(shù)框架與整體解決方案技術(shù)解決是數(shù)字資源長期保存的根本性方法,但單純地采用技術(shù)方法并不能解決數(shù)字
44、資源長期保存的全部問題,因此,許多研究項目試圖從數(shù)據(jù)資源保存、管理、檢索等宏觀角度考慮數(shù)字資源的保存問題,長期保存技術(shù)方法的選擇已不局限于某一種技術(shù)方法的使用,而是從國家宏觀戰(zhàn)略角度考慮資源的長期保存問題,技術(shù)方法的選擇更加趨向綜合,并根據(jù)資源類型的不同采用不同的整體解決方案。技術(shù)與框架研究成為目前數(shù)字資源保存方法研究中的重要組成部分。3.2.3 檔案存儲管理對各種途徑采集到的數(shù)字檔案信息必須進(jìn)行安全有序的存儲,保證用戶隨時對數(shù)字檔案信息的有效利用,這是數(shù)字檔案管理系統(tǒng)建設(shè)的一個關(guān)鍵環(huán)節(jié)。數(shù)字檔案管理系統(tǒng)的核心是建立以檔案資料目錄數(shù)據(jù)庫為基礎(chǔ),包含其所對應(yīng)的各種類型的檔案原文數(shù)據(jù)、電子文件元數(shù)
45、據(jù)的數(shù)據(jù)庫集合以及與之關(guān)聯(lián)的索引集合等。各類數(shù)據(jù)庫的建立與維護(hù)管理:(1) 建立目錄數(shù)據(jù)庫。一方面要按照國家相關(guān)標(biāo)準(zhǔn)、規(guī)范和本單位制定的規(guī)定、規(guī)范建立文書檔案、科技檔案、聲像和照片檔案、實物檔案、資料等信息的目錄數(shù)據(jù)庫并進(jìn)行主題詞和分類標(biāo)引(可自動進(jìn)行);另一方面,要建立與本單位工作和日常檔案利用工作相關(guān)的專題數(shù)據(jù)庫,如著名人物、重點工程項目檔案數(shù)據(jù)庫。(2) 建立原文數(shù)據(jù)庫。以目錄數(shù)據(jù)庫為基礎(chǔ)和出發(fā)點,通過掃描、聲像數(shù)字化、網(wǎng)絡(luò)接收、網(wǎng)絡(luò)自動采集等多種手段建立與目錄對應(yīng)的包括靜態(tài)圖像、動態(tài)圖像、文本以及其他格式文件的多種類型的原文數(shù)據(jù)庫。(3) 建立元數(shù)據(jù)庫。依照國家相關(guān)標(biāo)準(zhǔn)和本單位自身工作
46、特點,建立與原文數(shù)據(jù)庫中數(shù)字化信息相對應(yīng)的元數(shù)據(jù)信息數(shù)據(jù)庫。包括數(shù)字化加工的技術(shù)背景信息、電子文件產(chǎn)生的背景信息、授權(quán)及數(shù)字簽名信息和相關(guān)軟件(分為編輯軟件和查看軟件兩類)等。(4) 建立索引。數(shù)字檔案管理系統(tǒng)所需要的信息索引分為兩類。一類是用于檔案館自身數(shù)據(jù)庫管理和查詢的正序索引,一般由計算機(jī)系統(tǒng)自動完成;另一類是根據(jù)網(wǎng)絡(luò)用戶利用信息的需要,如全文檢索、主題關(guān)聯(lián)檢索、分類關(guān)聯(lián)檢索等,而建立的倒序索引或復(fù)合索引,一般可通過人為干預(yù)隨時建立。在本模塊中,主要實現(xiàn)以下幾大功能:數(shù)據(jù)接收功能、存儲層次管理功能、媒體替換功能、錯誤檢測功能、災(zāi)難恢復(fù)功能、提供數(shù)據(jù)功能。如下圖所示:基于OAIS參考模型,
47、檔案信息的存儲管理流程及其輔助功能模型如下圖所示;具體功能及其實現(xiàn)過程描述如下:(1) Receive data(數(shù)據(jù)接收功能):數(shù)據(jù)接收功能從獲取功能接收一個存儲請求及一個AIP信息包并且將AIP信息包移至檔案中長久保存。為存儲AIP選擇適當(dāng)?shù)拇鎯υO(shè)備或媒體介質(zhì),傳輸請求可能需要指出由AIP組成的數(shù)據(jù)對象的預(yù)期利用頻率。這個功能將選擇媒體類型,準(zhǔn)備設(shè)備或卷,并且執(zhí)行物理移動至檔案存儲卷。在完成傳輸后,這個功能向INGEST發(fā)送存儲確認(rèn)信息。(2) Manage Storage hierarchy(存儲層次管理):存儲層次管理的位置,通過命令(指令)、基于存儲管理策略的適當(dāng)?shù)拿襟w介質(zhì)上的AIP
48、s的內(nèi)容、操作統(tǒng)計、或者是從Ingest向數(shù)據(jù)接收發(fā)送存儲請求的方向。它將遵循任何特殊級別的AIP必需的服務(wù),或者遵循任何特殊的安全測量,并且確保AIP的適當(dāng)保護(hù)級別。這些包括在線的、離線的或接近在線的存儲,必需的吞吐率、最大限度允許的BIT錯誤率、或者是特殊處理,或者是備份程序。它監(jiān)控錯誤日志以確保AIP在傳輸過程中不被破壞。這個功能采用統(tǒng)計學(xué)原理,為管理功能統(tǒng)計媒體的總?cè)萘?、統(tǒng)計在不同存儲層次上的有效存儲容量。(3) Replace Media(媒體替換):媒體替換功能提供對過時AIPS信息包的再生能力。在媒體替換功能內(nèi)部,內(nèi)容信息與保存描述信息不能被修改。然而,組成信息包的數(shù)據(jù)可能發(fā)生改
49、變,但只要它繼續(xù)執(zhí)行相同的功能并且一直向前的執(zhí)行,那么就不會導(dǎo)致信息的丟失。移動策略必須選擇一種存儲介質(zhì),必須重視各種媒體介質(zhì)的錯誤發(fā)生率,它們的性能及價格。如果由媒體決定的屬性(例如:錄音帶的塊大小、CD ROM的容量信息)被包含在內(nèi)容信息中,成為內(nèi)容信息的一部份,那么當(dāng)數(shù)據(jù)移植到具有更高容量的存儲體系時必須找到保存此信息的解決辦法。這個功能也許只是簡單的完成“復(fù)制”,“重新包裝(封裝)”。舉個例子,如“重新包裝”,是移植到新的操作系統(tǒng)和文件系統(tǒng)下的媒體,內(nèi)容信息與檔案保存描述信息不會受到新的文件系統(tǒng)的約束。無論如何,在管理模塊通過檔案信息更新功能的監(jiān)管下,“重新包裝”與所有的轉(zhuǎn)換合并在一起
50、執(zhí)行,以確保信息的保存。(4) Error Checking(錯誤檢測):錯誤檢測功能提供統(tǒng)計上的可接受的保證,它保證AIP的組成部分在內(nèi)部任何的檔案存儲數(shù)據(jù)轉(zhuǎn)換期間不會被破壞。這個功能要求檔案中的所有硬件和軟件提供潛在的錯誤通知,并且這些錯誤可以發(fā)送到被檔案存儲模塊檢測出來的標(biāo)準(zhǔn)的錯誤日志。PDI(關(guān)于保存的描述信息)中的固定信息為AIP被移動或存取時不會被修改提供保障。類似的信息需要保護(hù)PDI本身。一種用于跟蹤和校驗檔案中的所有數(shù)據(jù)對象合法性的標(biāo)準(zhǔn)機(jī)制也可能會被使用。舉個例子,CRCs循環(huán)冗余碼校驗可以維護(hù)每一個單獨(dú)的數(shù)據(jù)文件。一種高級別的服務(wù),比如Reed-Solomon 譯碼支持組合錯
51、誤檢測及修正,可能會提供。存儲工序應(yīng)該提供采用CRCs或其他錯誤檢測工具進(jìn)行任意驗證數(shù)據(jù)對象完整性的機(jī)制。(5) Disaster Recovery(災(zāi)難恢復(fù)):災(zāi)難恢復(fù)為復(fù)制檔案數(shù)字內(nèi)容及存儲在物理隔離設(shè)備上的副本提供一種機(jī)制。這個功能通常通過復(fù)制檔案內(nèi)容信息到一些可移動存儲設(shè)備上(如直列磁帶機(jī)、密集光盤機(jī))完成。也可能通過硬件傳輸或網(wǎng)絡(luò)數(shù)據(jù)傳輸來執(zhí)行。(6) Provide Data (提供數(shù)據(jù)):提供數(shù)據(jù)功能提供已經(jīng)存儲的AIPs副本以便訪問。這個功能接收一個AIP請求,識別被請求的AIPs且在被請求的媒體類型上提供這些AIP或者將它們傳輸?shù)椒侄螀^(qū)域。3.2.4 檔案管理檔案管理主要負(fù)責(zé)
52、檔案保存描述信息(PDI)的著錄、維護(hù)、電子文件的掛接、數(shù)據(jù)的打印輸出。包括維護(hù)管理數(shù)據(jù)庫數(shù)據(jù)的完整性。這些數(shù)據(jù)不僅包含描述信息還包含系統(tǒng)信息。描述信息標(biāo)識并描述檔案的館藏情況,系統(tǒng)信息用于支持檔案業(yè)務(wù)的運(yùn)作。負(fù)責(zé)創(chuàng)建所有表定義必須的所有數(shù)據(jù)管理功能;提供創(chuàng)建、維護(hù)、訪問檔案存儲內(nèi)容的用戶自定義視圖的能力。 執(zhí)行數(shù)據(jù)的更新,包括數(shù)據(jù)的增加、刪除、修改。并且接收來自訪問模塊的查詢請求,執(zhí)行查詢,然后將查詢結(jié)果集返回給查詢者。 元數(shù)據(jù)管理元數(shù)據(jù)管理系統(tǒng)。它是整個系統(tǒng)的重要組成部分,其基本功能是為系統(tǒng)的運(yùn)行建立基礎(chǔ)。元數(shù)據(jù)管理系統(tǒng)的結(jié)構(gòu)包括6個組成部分:(1)基準(zhǔn)元數(shù)據(jù)系統(tǒng)。是指某個標(biāo)
53、準(zhǔn)的元數(shù)據(jù)系統(tǒng)。它的作用是:作為基準(zhǔn)元數(shù)據(jù),組織標(biāo)識數(shù)字化信息資源;以標(biāo)準(zhǔn)形式描述用戶的查詢提問;為各種網(wǎng)絡(luò)信息發(fā)掘工具提供數(shù)字化信息。(2)元數(shù)據(jù)字典。是一種用于各種元數(shù)據(jù)體系到系統(tǒng)基準(zhǔn)元數(shù)據(jù)系統(tǒng)相互轉(zhuǎn)換的對照表,它描述了各種元數(shù)據(jù)的基本特征,構(gòu)建了各種元數(shù)據(jù)與基準(zhǔn)元數(shù)據(jù)系統(tǒng)的對應(yīng)關(guān)系。其基本作用是為系統(tǒng)的轉(zhuǎn)換模塊提供轉(zhuǎn)換依據(jù)。(3)數(shù)據(jù)屬性集。是指存儲數(shù)據(jù)的屬性總和。元數(shù)據(jù)管理系統(tǒng)可通過數(shù)據(jù)屬性集將數(shù)據(jù)結(jié)構(gòu)和基準(zhǔn)元數(shù)據(jù)相對照,保障它們之間的可互換性。(4)數(shù)字化信息資源集。它描述的對象是信息源。系統(tǒng)可以通過信息源特征集來確定個信息源所采用的元數(shù)據(jù)體系,將用基準(zhǔn)元數(shù)據(jù)表達(dá)的查詢式轉(zhuǎn)換成各個信
54、息源所采用的元數(shù)據(jù)表達(dá)式,從而決定各個信息源的檢索方法并解釋檢索結(jié)構(gòu)。(5)轉(zhuǎn)換模塊。提供了實現(xiàn)各種元數(shù)據(jù)之間相互轉(zhuǎn)換、翻譯的方法。(6)維護(hù)模塊??梢詫Ω鞣N對照表進(jìn)行添加、刪除、修改等動態(tài)管理,保證元數(shù)據(jù)管理系統(tǒng)的可擴(kuò)展性和可維護(hù)性。預(yù)歸檔管理預(yù)歸檔管理主要管理立檔單位本身的公文(收發(fā)文)及在立卷歸檔前的文件數(shù)據(jù)。用戶根據(jù)本單位文件(公文)管理的實際情況即根據(jù)需要管理的所有的預(yù)歸檔類型定義其庫結(jié)構(gòu),及相關(guān)的報表、排序規(guī)則等。負(fù)責(zé)預(yù)歸檔庫數(shù)據(jù)的完整性;執(zhí)行數(shù)據(jù)的更新,包括數(shù)據(jù)的增加、刪除、修改;并且接收來自訪問模塊的查詢請求,執(zhí)行查詢,然后將查詢結(jié)果集返回給查詢者。還包括文件的分
55、發(fā)功能,這個功能主要用于立檔單位的文件保管部門對已經(jīng)形成的正式文件進(jìn)行分發(fā)處理(文件的內(nèi)發(fā)、傳閱、外發(fā))。采用JMS及JAVA MAIL技術(shù)對文件進(jìn)行實時的網(wǎng)絡(luò)傳輸。預(yù)歸檔管理的業(yè)務(wù)流程圖如下所示:立卷管理立卷是將若干文件按形成規(guī)律和有機(jī)聯(lián)系組成案卷的過程。立卷過程中,系統(tǒng)可以自動生成檔案保存描述信息(PDI)中的固定信息,如檔號、案卷號等元數(shù)據(jù);系統(tǒng)可以根據(jù)組織提供的規(guī)范的歸檔范圍標(biāo)準(zhǔn),自動的生成分類號、保管期限等元數(shù)據(jù)。檔案本身的多元性特點導(dǎo)致了不同行業(yè)的組織的立卷方式不一樣,系統(tǒng)可以允許組織選擇符合自己要求的立卷方式。系統(tǒng)還可以根據(jù)用戶預(yù)先定義的檔案實體的存放結(jié)構(gòu),自動生成
56、檔案實體的物理存放位置(庫位號),這樣,真正做到了從文件鑒定,立卷,歸檔,到實體存放的自動一體化管理。統(tǒng)計管理統(tǒng)計管理包括檔案通用統(tǒng)計、館藏統(tǒng)計、操作日志統(tǒng)計、年報處理,四個主要功能。l 通用統(tǒng)計:數(shù)據(jù)來源是檔案的保存描述信息(PDI),對一種類型的檔案信息收集(AIC)的PDI統(tǒng)計。1、檔案管理員對選擇的檔案類型進(jìn)行統(tǒng)計;2、檔案管理員對選擇的某個檔案類型下的檔案庫進(jìn)行統(tǒng)計;3、統(tǒng)計列可以由檔案管理員自定義;4、統(tǒng)計方案可以自定義,包括求和、最大值、最小值、平均值等;l 館藏統(tǒng)計:數(shù)據(jù)來源也是檔案的保存描述信息(PDI),統(tǒng)計檔案的館藏情況,可以同時對一個或更多的檔案信息收集(
57、AIC)進(jìn)行統(tǒng)計。1、統(tǒng)計列可以自定義;2、統(tǒng)計條件可以自定義,即可以由用戶確定需要統(tǒng)計的數(shù)據(jù)范圍;3、參與統(tǒng)計的檔案門類可以自定義;4、可以自定義統(tǒng)計任務(wù)(作業(yè)),即可以保存每次與統(tǒng)計相關(guān)的所有設(shè)置;5、可以打印統(tǒng)計報表;6、統(tǒng)計報表的格式可以自定義。l 操作日志統(tǒng)計:數(shù)據(jù)來源是系統(tǒng)的所有用戶,包括管理員、一般檔案查詢?nèi)藛T登陸系統(tǒng)后的操作信息,如登陸的時間、登出時間、進(jìn)入的模塊、使用的功能等。統(tǒng)計的方式一般是固定的方,即對操作的描述信息進(jìn)行統(tǒng)計,而操作的描述信息是由本系統(tǒng)確定的。l 年報處理:檔案管理員對本全宗的檔案情況作總體描述、統(tǒng)計后以表格的方式向上級檔案機(jī)構(gòu)提交報表,包括本全宗人員情況
58、、人員結(jié)構(gòu)、利用情況、檔案庫房情況、檔案實體情況、檔案移交接受情況等數(shù)據(jù)項。 1、系統(tǒng)可以利用本身現(xiàn)有的數(shù)據(jù)自動統(tǒng)計年報中的部分?jǐn)?shù)據(jù)項:如室存檔案數(shù)量(卷、件數(shù))、 年度檔案利用人次、年度檔案利用情況等;2、系統(tǒng)可以根據(jù)年報各數(shù)據(jù)項之間的邏輯關(guān)系對用戶錄入的數(shù)據(jù)進(jìn)行自動校驗;3、系統(tǒng)可以接收下級單位的年報數(shù)據(jù);4、系統(tǒng)可以向上級單位報送年報數(shù)據(jù);編研管理1、檔案編研工作定義:是以館(室)藏檔案文獻(xiàn)為主要物質(zhì)對象,以主動提供或報道檔案信息內(nèi)容,滿足社會利用位主要目的,在深入研究檔案內(nèi)容的基礎(chǔ)上,按專題對檔案文件進(jìn)行收集、篩選、加工,使之轉(zhuǎn)化為不同形式的編研成果的一種專業(yè)工作。2、檔案編研工作在本系統(tǒng)中的體現(xiàn):檔案管理員通過跨類檢索工具檢索到檔案條目,可以將檢索結(jié)果集轉(zhuǎn)入到檔案編研庫中,形成檔案專題目錄3、編研工作人員可以通過全文檢索查找檔案信息,并可以將全文檢索的結(jié)果集轉(zhuǎn)入
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 維生素c課程設(shè)計
- 蓋板零件課程設(shè)計
- 保險行業(yè)會計職責(zé)總結(jié)
- 海底動物創(chuàng)意課程設(shè)計
- 咨詢行業(yè)的營銷工作總結(jié)
- 火葬場衛(wèi)生整治工作總結(jié)
- 2024年西雙版納職業(yè)技術(shù)學(xué)院單招職業(yè)適應(yīng)性測試題庫含答案
- 水務(wù)領(lǐng)域數(shù)字經(jīng)濟(jì)發(fā)展的研究計劃
- 2024年認(rèn)識圖形二教案
- 2024年秋天的信教案模板
- (2024年)長歌行漢樂府古詩PPT語文課件
- GB/T 43674-2024加氫站通用要求
- 倉庫班長年終總結(jié)及工作計劃
- 部編人教版二年級勞動教育上冊期末試卷(帶答案)
- 肛門手術(shù)的鎮(zhèn)痛研課件
- 中山醫(yī)院報告查詢app
- 檢驗科質(zhì)控總結(jié)匯報
- 《如何做好中層》課件
- 破產(chǎn)法培訓(xùn)課件銀行
- 山東大學(xué)《高級語言程序設(shè)計》2022-2023學(xué)年期末試卷
- 智能陽臺種菜項目計劃書
評論
0/150
提交評論