大數(shù)據(jù)服務(wù)檔案文化建設(shè)的問題與對(duì)策_(dá)第1頁(yè)
大數(shù)據(jù)服務(wù)檔案文化建設(shè)的問題與對(duì)策_(dá)第2頁(yè)
大數(shù)據(jù)服務(wù)檔案文化建設(shè)的問題與對(duì)策_(dá)第3頁(yè)
大數(shù)據(jù)服務(wù)檔案文化建設(shè)的問題與對(duì)策_(dá)第4頁(yè)
已閱讀5頁(yè),還剩2頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 大數(shù)據(jù)服務(wù)檔案文化建設(shè)的問題與對(duì)策 尹哲Summary:在大數(shù)據(jù)時(shí)代的影響之下,各行各業(yè)都受到嚴(yán)重的沖擊,發(fā)生了翻天覆地的改變,檔案工作也概莫能外。本文總結(jié)了大數(shù)據(jù)服務(wù)檔案文化建設(shè)的必要性,并分析了檔案大數(shù)據(jù)在服務(wù)檔案文化建設(shè)中存在的主要問題及其原因,提出了大數(shù)據(jù)服務(wù)檔案文化建設(shè)的三點(diǎn)對(duì)策,對(duì)未來(lái)通過大數(shù)據(jù)技術(shù)推動(dòng)檔案文化建設(shè)創(chuàng)新發(fā)展做出了預(yù)期。Key:大數(shù)據(jù)檔案文化建設(shè)專題數(shù)據(jù)庫(kù)隨著大數(shù)據(jù)時(shí)代的到來(lái),各地檔案部門和專家學(xué)者紛紛加入到大數(shù)據(jù)研究的隊(duì)伍中來(lái),檔案大數(shù)據(jù)是大數(shù)據(jù)理念和技術(shù)與檔案工作各個(gè)領(lǐng)域的深度融合。在新歷史階段提出的發(fā)展要求下,各級(jí)檔案館均重視檔案文化建設(shè),對(duì)如何利用大數(shù)據(jù)服務(wù)

2、好檔案文化建設(shè)提出了更高的要求。從目前來(lái)看,檔案大數(shù)據(jù)雖然為檔案文化建設(shè)提供了有力的支持,但在實(shí)際工作過程中仍存在許多問題。一、大數(shù)據(jù)服務(wù)檔案文化建設(shè)的必要性(一)大數(shù)據(jù)是檔案文化建設(shè)的源泉和基礎(chǔ)檔案文化建設(shè)是檔案事業(yè)在新時(shí)代新階段所面臨的一項(xiàng)重要工作。檔案具備記錄歷史傳承文化的優(yōu)勢(shì),我們可以依托館藏檔案數(shù)字資源,重新整理歷史文化發(fā)展脈絡(luò),充分挖掘檔案背后的文化內(nèi)涵。隨著互聯(lián)網(wǎng)以及大數(shù)據(jù)相關(guān)技術(shù)的發(fā)展,大數(shù)據(jù)正逐漸成為檔案文化建設(shè)信息來(lái)源的重要組成部分。(二)大數(shù)據(jù)是檔案文化建設(shè)的重要展現(xiàn)形式檔案數(shù)字資源中所包含的照片、音視頻等數(shù)字化形式正在廣泛地應(yīng)用于檔案文化建設(shè)中,并通過互聯(lián)網(wǎng)門戶網(wǎng)站、政

3、務(wù)微博、政務(wù)微信等多種方式展現(xiàn)文化建設(shè)的成果。(三)大數(shù)據(jù)是檔案文化建設(shè)重要的繼承方式開展檔案文化建設(shè)過程中所形成的各類檔案及建設(shè)成果本身,又成為檔案大數(shù)據(jù)的一部分。它既然成為檔案數(shù)字資源,就必須得到長(zhǎng)期有效的保存,保證其始終處于一種可供利用的狀態(tài)。二、大數(shù)據(jù)服務(wù)檔案文化建設(shè)存在的問題及成因筆者在近年來(lái)的實(shí)際工作中發(fā)現(xiàn),檔案數(shù)字資源雖然在檔案文化建設(shè)中起到了巨大作用,但是也存在著一些問題。總體而言,這些問題的出現(xiàn),是多年來(lái)檔案館利用信息化手段對(duì)檔案資源開發(fā)利用不足導(dǎo)致的,具體表現(xiàn)在以下三個(gè)方面。(一)檔案數(shù)字資源缺乏隨著各地檔案數(shù)字化工作的開展,各級(jí)國(guó)家檔案館中各門類檔案數(shù)字化率迅速提升,個(gè)別

4、檔案館已經(jīng)實(shí)現(xiàn)館藏檔案全部數(shù)字化的目標(biāo),但在實(shí)際利用過程中仍然不能滿足文化建設(shè)的全部需求,出現(xiàn)了數(shù)據(jù)雖多但不知道如何利用的現(xiàn)象。這主要表現(xiàn)在以下三點(diǎn):一是檔案數(shù)字資源形式多以紙質(zhì)檔案數(shù)字化副本為主,照片和音像檔案數(shù)字化副本由于館藏量少或開展難度相對(duì)較高而相對(duì)缺乏;二是檔案館館際之間檔案數(shù)字資源缺乏有效共享;三是文書、照片、錄音、錄像等檔案數(shù)據(jù)資源之間的關(guān)聯(lián)程度較低,甚至出現(xiàn)因?yàn)椴惶幱谕幌到y(tǒng)中而導(dǎo)致數(shù)據(jù)無(wú)法及時(shí)、有效地被檢索利用的情況。(二)檔案數(shù)字資源缺少專題和精品各級(jí)檔案館內(nèi)館藏?cái)?shù)字資源多以全宗為單位組織,目錄數(shù)據(jù)庫(kù)多按照文書、照片、音視頻、實(shí)物等門類進(jìn)行建設(shè)。而檔案文化建設(shè)的主題性非常強(qiáng)

5、,普遍缺少一些專題類數(shù)據(jù)庫(kù)以供編研或展陳部門使用,有時(shí)即使抽取了部分內(nèi)容形成專題,但由于題名著錄不規(guī)范或錯(cuò)誤等原因,造成可利用率降低。(三)檔案數(shù)據(jù)形式單一從檔案數(shù)據(jù)中發(fā)掘?qū)ξ幕ㄔO(shè)有價(jià)值的素材,通常采取的方法是通過目錄數(shù)據(jù)庫(kù)對(duì)檔案題名進(jìn)行檢索,從中發(fā)現(xiàn)可以利用的內(nèi)容。但是這種僅通過檔案“題名”字段進(jìn)行檢索的方法,存在著較大的局限性:一方面存在很多檔案的題名著錄不規(guī)范,甚至有錯(cuò)誤的現(xiàn)象,不能很好地揭示檔案的內(nèi)容;另一方面,數(shù)據(jù)檢索的范圍,往往也只限于對(duì)結(jié)構(gòu)化數(shù)據(jù)的檢索,而對(duì)半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)的檢索與深入挖掘很少。三、大數(shù)據(jù)服務(wù)檔案文化建設(shè)的對(duì)策(一)豐富數(shù)字資源,開展資源共享首先,各級(jí)檔案

6、部門應(yīng)該進(jìn)一步加強(qiáng)對(duì)檔案數(shù)字資源建設(shè)工作的重視,實(shí)現(xiàn)統(tǒng)一收集、集中管理、分類處理、定期維護(hù),不斷完善數(shù)字資源體系。檔案數(shù)字資源門類需要更加豐富,不僅要對(duì)紙質(zhì)檔案開展數(shù)字化工作,而且對(duì)照片、音視頻檔案也應(yīng)加快數(shù)字化步伐,同時(shí)還要建立各門類檔案數(shù)字化成果的關(guān)聯(lián)關(guān)系,以方便查閱和利用。檔案部門應(yīng)突破傳統(tǒng)的不同媒介采用不同管理系統(tǒng)的限制,實(shí)現(xiàn)集中統(tǒng)一的數(shù)字檔案館系統(tǒng);規(guī)范檔案數(shù)據(jù)庫(kù)及音視頻、圖片等非結(jié)構(gòu)化數(shù)據(jù)的標(biāo)準(zhǔn)體系,制定統(tǒng)一的數(shù)據(jù)共享機(jī)制,以便于檔案資源的開發(fā)和利用。其次,各級(jí)檔案部門應(yīng)該探索建立、共享檔案數(shù)字資源庫(kù)。檔案部門可以突破地域的局限,例如以省級(jí)或市級(jí)檔案館為單位,構(gòu)建數(shù)據(jù)集中、格式規(guī)范

7、、可供共享的檔案數(shù)字資源庫(kù),集成各檔案館館藏?cái)?shù)據(jù)資源建立檔案合集,突破時(shí)空和地域界限,達(dá)到信息共享的目的。正如中國(guó)人民大學(xué)馮惠玲教授提出的構(gòu)建“以數(shù)字資源為主體,以文本、圖片、音頻、視頻等為形式,為中華民族集體記憶的建構(gòu)和傳承提供文獻(xiàn)支撐的中國(guó)記憶數(shù)字資源庫(kù)”,是時(shí)代賦予我們的目標(biāo)與使命。1最后,利用云計(jì)算平臺(tái)和處理技術(shù)構(gòu)建檔案數(shù)據(jù)資源網(wǎng),既可以用于檔案數(shù)據(jù)的在線實(shí)時(shí)接收,也可以對(duì)數(shù)據(jù)進(jìn)行離線和非實(shí)時(shí)性處理,成為各類檔案部門提供服務(wù)的平臺(tái)。當(dāng)前我國(guó)信息化發(fā)展戰(zhàn)略提出的加快推行電子政務(wù),加強(qiáng)信息資源的開發(fā)利用,建設(shè)先進(jìn)的網(wǎng)絡(luò)文化,為檔案大數(shù)據(jù)應(yīng)用提供了重要的發(fā)展機(jī)遇。構(gòu)建檔案云計(jì)算網(wǎng)絡(luò)必將是搭建

8、檔案大數(shù)據(jù)應(yīng)用平臺(tái)的基礎(chǔ)工作之一。(二)構(gòu)建檔案專題數(shù)據(jù)庫(kù)檔案專題數(shù)據(jù)庫(kù)是基于各類檔案資源,通過數(shù)據(jù)采集,按照特定專題內(nèi)容通過分析、篩選、加工、整理而成的,具有特定利用價(jià)值的各類檔案數(shù)據(jù)集合,是系統(tǒng)性的檔案數(shù)字資源綜合開發(fā)成果,在提供檔案利用方面具有較強(qiáng)的針對(duì)性和實(shí)用性。2構(gòu)建專題數(shù)據(jù)庫(kù),有助于更好地管理各類檔案信息資源,有效地發(fā)揮對(duì)于信息的組織和管理能力,可以為檔案文化建設(shè)提供強(qiáng)有力的基礎(chǔ)保障。傳統(tǒng)的檔案數(shù)據(jù)庫(kù)信息通常是分散、凌亂、不規(guī)范的,針對(duì)一些具體的管理需求和編研需求,我們可以對(duì)這些信息資源進(jìn)行數(shù)據(jù)分析和重組,按照某種聯(lián)系歸類排序,轉(zhuǎn)化為系統(tǒng)的、有序的、深層次的檔案信息。我們可以針對(duì)不

9、同的專題數(shù)據(jù)庫(kù)制定規(guī)范的數(shù)據(jù)庫(kù)字段和數(shù)據(jù)格式標(biāo)準(zhǔn),對(duì)于收集到的不同類型的數(shù)據(jù)進(jìn)行規(guī)范化處理,對(duì)內(nèi)容進(jìn)行篩查辨析,以確保數(shù)據(jù)的可用性、規(guī)范性和可共享性。專題數(shù)據(jù)庫(kù)建設(shè)不僅要包含案卷級(jí)、文件級(jí)的目錄數(shù)據(jù)庫(kù)建設(shè),還要開發(fā)檔案全文數(shù)據(jù)庫(kù),涵蓋文本、圖形圖像、實(shí)物和多媒體等多種形式。各地檔案部門可以根據(jù)各自實(shí)際情況,搭建各自具有特點(diǎn)的專題數(shù)據(jù)庫(kù),以便于深入挖掘檔案資源。專題數(shù)據(jù)庫(kù)是對(duì)數(shù)據(jù)進(jìn)行清理、整合、集成并存儲(chǔ),按照不同門類構(gòu)建的數(shù)據(jù)庫(kù),因此可以減少數(shù)據(jù)查詢和訪問的時(shí)間,提高數(shù)據(jù)檢索速度。通過專題數(shù)據(jù)庫(kù)的形式對(duì)信息進(jìn)行整合,可以更加完整和準(zhǔn)確地揭示主題。專題數(shù)據(jù)庫(kù)在來(lái)源上,可以更加廣泛,不僅局限于館藏

10、,還可以通過數(shù)據(jù)挖掘等技術(shù)補(bǔ)充發(fā)掘相關(guān)的數(shù)據(jù),滿足開發(fā)利用的需求。(三)深入挖掘檔案數(shù)字資源大數(shù)據(jù)處理的關(guān)鍵是對(duì)數(shù)據(jù)分析整合,對(duì)于檔案數(shù)據(jù)的深入挖掘和充分利用是檔案大數(shù)據(jù)未來(lái)發(fā)展的核心,也是各級(jí)檔案部門服務(wù)創(chuàng)新面臨的挑戰(zhàn)。3我們可以深入挖掘檔案數(shù)字資源,提取有用的信息內(nèi)容,在查詢檔案信息時(shí)進(jìn)行與之相關(guān)聯(lián)的內(nèi)容提取和推薦,例如在查詢某著名抗戰(zhàn)將領(lǐng)的檔案信息時(shí),可以通過數(shù)據(jù)分析挖掘與其相關(guān)的革命歷史專題信息、抗戰(zhàn)專題信息。另外,我們依靠自然語(yǔ)言處理、深度學(xué)習(xí)等統(tǒng)計(jì)文本挖掘算法,在用戶提出查詢需求時(shí),使系統(tǒng)自動(dòng)從檔案信息資源中捕獲相關(guān)聯(lián)的信息,通過大數(shù)據(jù)運(yùn)算、分析、挖掘,實(shí)現(xiàn)數(shù)據(jù)自動(dòng)組織、自動(dòng)推薦的

11、目標(biāo)。我們利用大數(shù)據(jù)技術(shù)除了可以掌握用戶歷史上和正在進(jìn)行的數(shù)據(jù)檢索需求,還可以對(duì)用戶未來(lái)的數(shù)據(jù)需求進(jìn)行分析預(yù)測(cè),深度挖掘數(shù)據(jù)內(nèi)在關(guān)聯(lián),促進(jìn)資源整合,實(shí)現(xiàn)檔案數(shù)據(jù)資源深層次的開發(fā)利用服務(wù)。我們可以借助大數(shù)據(jù)技術(shù)手段探究用戶的行為,有效發(fā)現(xiàn)用戶的潛在訴求,基于用戶行為分析并進(jìn)行個(gè)性化推送。4例如,針對(duì)不同的用戶,產(chǎn)生動(dòng)態(tài)的推薦鏈接列表,甚至建立以用戶名為單位的個(gè)性化數(shù)據(jù)庫(kù),采用“收藏夾”或“檔案籃”的形式放入用戶想要的信息、挖掘分析結(jié)果。四、結(jié)語(yǔ)新時(shí)代的檔案文化建設(shè)要求我們要做好各類檔案資源的開發(fā)利用,推出有參考價(jià)值、有檔案特色的文化產(chǎn)品。我們應(yīng)加強(qiáng)對(duì)檔案資源的深度開發(fā),通過大數(shù)據(jù)技術(shù)科學(xué)整合、加工、編研,由簡(jiǎn)單檢索向?qū)n}研究提升,更好地為檔案文化建設(shè)服務(wù);積極探索“互聯(lián)網(wǎng)+”時(shí)代服務(wù)管理模式,對(duì)傳統(tǒng)的檔案文化建設(shè)方式進(jìn)行改進(jìn),推動(dòng)檔案服務(wù)方式向智能化、精細(xì)化、網(wǎng)絡(luò)化轉(zhuǎn)型。隨著檔案管理創(chuàng)新的不斷推進(jìn),數(shù)據(jù)挖掘、數(shù)據(jù)分析技術(shù)將在檔案管理中得到更加深入地運(yùn)用,檔案大數(shù)據(jù)技術(shù)將真正落實(shí)到檔案文化建設(shè)的各個(gè)方面,真正實(shí)現(xiàn)檔案事業(yè)的“業(yè)務(wù)提檔、服務(wù)升級(jí)、戰(zhàn)略轉(zhuǎn)型”。Reference:1馮惠玲.檔案記憶觀、資源

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論