版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、檔案數(shù)字化掃描中的問題及對策社會學(xué)院 劉婷 程熙指導(dǎo)教師:張照余 摘要 本文通過大量實驗,發(fā)現(xiàn)檔案數(shù)字化掃描中存在的問題,提出具有理 論及應(yīng)用價值的檔案數(shù)字化掃描對策,為各檔案部門數(shù)字化工作提供 可行性建議,以提高檔案數(shù)字化掃描工作的質(zhì)量。 關(guān)鍵詞 檔案數(shù)字化 掃描 問題 對策Absrtact This paper is based on a large number of archives scanning experiments ,in which we have discovered some problems. According to these ,we propose severa
2、l valuable and feasible suggestions to benefit the efficiency of archival departments' scanning work and improve the quality of entire archive program.Key words archival digitalization scan problems measures檔案數(shù)字化是檔案信息化建設(shè)的重要內(nèi)容, 而掃描是紙質(zhì)檔案數(shù)字化中的關(guān) 鍵環(huán)節(jié),掃描工作的好壞影響著整個數(shù)字化工作的質(zhì)量。 目前,我國各級各類檔 案館大量珍貴、 重要和利用頻繁的紙
3、質(zhì)檔案亟待通過數(shù)字化方式來保護(hù)、 備存和 提供網(wǎng)絡(luò)利用, 任務(wù)十分繁重。 因此, 本文旨在針對檔案數(shù)字化掃描中遇到的問 題提出可行性解決方案, 為各級檔案單位在數(shù)字化掃描工作提供建議, 以便更好 地共享檔案信息資源,滿足檔案信息的利用需求。1 檔案數(shù)字化掃描存在的問題筆者通過大量的文獻(xiàn)調(diào)研 , 以及進(jìn)行多次的數(shù)字化掃描實驗, 同時實地參與 蘇州大學(xué)資產(chǎn)評估科數(shù)字化掃描項目, 發(fā)現(xiàn)數(shù)字化掃描中存在著許多亟待解決的 問題,這些問題主要表現(xiàn)在以下幾方面:1.1 軟、硬件基礎(chǔ)設(shè)施配套不齊全軟硬件基礎(chǔ)設(shè)施是檔案數(shù)字化建設(shè)過程中必不可缺的基本條件, 目前,很多 單位沒有成立專門的檔案館,檔案由組織或人事部
4、門分管,并不配備專門檔案人 員負(fù)責(zé),同時經(jīng)費不能及時到位,造成所需的一些檔案數(shù)字化軟、硬件基礎(chǔ)設(shè)施 配備不齊全,主要表現(xiàn)在:就硬件而言,在信息采集設(shè)備中,一般的掃描儀大多是適合A3、A4甚至更小的紙張,而實際工作中存在一些紙張較大的檔案文件,設(shè)備配備并不能滿足本館實際檔案的尺寸要求,這樣的結(jié)果會造成掃描圖殘缺不全。信息存儲設(shè)備的要 求相對采集設(shè)備對本館要求更高,沒有相應(yīng)的設(shè)備容量,檔案進(jìn)行數(shù)字化過程將 受到限制,直接導(dǎo)致圖像達(dá)不到規(guī)定的像素與清晰度要求。信息利用設(shè)備的配備 不足會局限數(shù)字檔案的利用,使得相當(dāng)一部分?jǐn)?shù)字化的檔案無法識別。就軟件而言,整體上,目前我國還沒有建立一個達(dá)到數(shù)據(jù)交換的機(jī)讀
5、目錄檔 案系統(tǒng),軟件系統(tǒng)使用的層次不一,規(guī)范性、開發(fā)性、服務(wù)性、共享性較差,不 能適應(yīng)檔案信息資源共享的要求。 縱觀當(dāng)前各檔案館、室所用檔案管理軟件,信 息管理功能與信息通用功能的缺失是共有的弱點。現(xiàn)在檔案部門所使用的計算機(jī) 型號不一,規(guī)格各異,各自開發(fā)、購置的軟件不能通用,并且沒有一個既適用于 文件檢索又可用于檔案信息管理的計算機(jī)管理軟件系統(tǒng)。1.2 紙質(zhì)檔案數(shù)字化掃描成本過高在大量的紙質(zhì)檔案掃描過程中,各級檔案部門都不同程度地遇到了掃描成本 過高的問題,掃描成本的增加必然會影響到整個檔案數(shù)字化進(jìn)程,進(jìn)而阻礙檔案信息的交流和共享,制約了檔案部門的高效運轉(zhuǎn)。掃描成本存在于掃描過程中的 經(jīng)濟(jì)成本
6、與時間成本方面,具體表現(xiàn)在:(1)經(jīng)濟(jì)成本增加。掃描中的經(jīng)濟(jì)成本包括兩方面,一是設(shè)備購置和維修 成本,國內(nèi)比較先進(jìn)的掃描儀每臺在10000元左右,檔案卸裝訂設(shè)備每臺在20000 元左右,如果將設(shè)備的維修、維護(hù)及耗材的定期更換費用計算在內(nèi),其費用之高 并非一般檔案部門可以承受;二是人力掃描工資成本,按目前市場價格(掃描和輸入0.250.4元/頁)來計算,以區(qū)(縣)檔案館為例,一般區(qū)(縣)檔案館館藏 量在1215萬卷,按每卷檔案50頁計算,大約共600750萬頁。如果將這些 檔案全文數(shù)字化,一個區(qū)(縣)級檔案館全文數(shù)字化將需投入150200萬元。 鄭鷗.關(guān)于檔案全文數(shù)字化工作的思考J.中國檔案,2
7、007(2) : 46-47(2)時間成本過大。影響紙質(zhì)檔案掃描時間的因素有很多, 如硬件設(shè)備(掃 描儀、計算機(jī)、存儲設(shè)備等),軟件設(shè)備,人員操作熟練程度等。在軟硬件設(shè)備 和人員配備條件不變的情況下,以縣級檔案館為例,據(jù)統(tǒng)計,兩人兩臺掃描儀全 文掃描年掃3千卷(卷/100面)需要27年。如此漫長的時間相對于我國檔案 事業(yè)所提出的“十一五”規(guī)劃還有相當(dāng)大的差距,也不符合檔案部門工作科學(xué)化、 規(guī)范化、信息化的整體發(fā)展要求。1.3 紙質(zhì)檔案掃描過程不規(guī)范紙質(zhì)檔案全文掃描錄入工作流程主要包括以下幾個環(huán)節(jié):檔案整理、掃描準(zhǔn)備、正式掃描、圖像處理。其中,檔案整理和正式掃描環(huán)節(jié)是最容易出現(xiàn)問題的 兩個環(huán)節(jié),
8、整理的不規(guī)范性直接降低了掃描的速度,并且?guī)砺吲c重復(fù)掃描的 問題。正式掃描這一環(huán)節(jié)中參數(shù)設(shè)置的不規(guī)范性也會導(dǎo)致計算機(jī)存儲空間與錄入 圖像的清晰度之間的不平衡。檔案整理與正式掃描過程中對檔案原件處理不當(dāng)也 會對檔案造成一定程度的損害。(1)漏掃、多掃與重復(fù)掃描問題數(shù)字化掃描中的漏掃多掃與重復(fù)掃描問題主要表現(xiàn)在:第一,漏掃描檔案文件資料、大圖紙的大量信息。有的檔案頁面折字遮字,信息沒有全部掃描出來; 有的統(tǒng)計報表漏掃描信息,如在一套表中兩組數(shù)據(jù)的信息只掃描了一組;第二, 對列為不進(jìn)行數(shù)字化處理的對象進(jìn)行掃描,如正式文本中的定稿(文件處理簽及定稿中有領(lǐng)導(dǎo)人親筆批示和審改內(nèi)容的除外)、成批統(tǒng)計報表中
9、的重復(fù)性填表說 明文字、有正式轉(zhuǎn)發(fā)件(發(fā)文)的被轉(zhuǎn)發(fā)件(收文)等無須列入數(shù)字化處理的對象, 實際上進(jìn)行了掃描;第三,重復(fù)掃描同一份檔案文件。由于檔案整理不規(guī)范, 在掃描時掃描人員為了追求掃描速度很容易忽視掃描原件的內(nèi)容,對已經(jīng)案卷內(nèi)存在的重復(fù)檔案進(jìn)行掃描。(2)參數(shù)設(shè)置問題目前,我國已出臺了電子文件歸檔與管理規(guī)范(GB/T18894-2002)和紙 質(zhì)檔案數(shù)字化技術(shù)規(guī)范(DA/T31-2005),各地也相繼出臺了一些相關(guān)標(biāo)準(zhǔn),如蘇州市紙質(zhì)檔案數(shù)字化加工標(biāo)準(zhǔn)(試行)和天津市檔案資料數(shù)字化加工指 南(試行)等。雖然這些規(guī)范標(biāo)準(zhǔn)對紙質(zhì)檔案掃描的色彩模式、分辨率等參數(shù) 閻朝科.走出檔案數(shù)字化困境的嘗試
10、J.檔案時空,2005(10) : 26 吳緒成,陳素萍.檔案數(shù)字化質(zhì)量的規(guī)范處理J.中國檔案,2007(2): 48-49 設(shè)置方面給出了原則性的規(guī)定, 但這些規(guī)定均是粗線條的, 例如紙質(zhì)檔案數(shù)字 化技術(shù)規(guī)范中提出“特殊情況下,如文字偏小、密集、清晰度較差等,可適當(dāng) 提高分辨率?!比欢跈n案部門實際掃描的工作中,文字大小、密集、及清晰 程度都需要掃描工作人員的主觀判斷, 并且“適當(dāng)提高” 多少分辨率也是需要各 單位根據(jù)自己的實際情況“量體裁衣”的。(3)數(shù)字化過程中對原件的損害問題 實施檔案數(shù)字化的操作過程,須對原有檔案進(jìn)行撤架、拆封、編號、標(biāo)記、 掃描、還原等一系列的處理工作, 此過程如
11、操作不當(dāng)會對檔案有一定的損害, 主 要是:第一,檔案盒、案卷排列順序、文件順序、卷內(nèi)文件紙張因檔案數(shù)字化加 工,會造成損害與混亂;第二,數(shù)字化工作人員在登記、標(biāo)注時,書寫字體偏大 過重,易破壞檔案的原貌,尤其是脆弱紙張,受損程度更大;第三,工作人員在 掃描過程中對檔案原件壓制用力, 翻頁時動作幅度較大, 也容易對檔案原件造成 損傷。1.4 檔案數(shù)字化后期管理不力檔案的數(shù)字化是一項工作繁瑣、 環(huán)環(huán)相扣的工作, 掃描工作量大, 而檔案數(shù) 字化后的管理工作至關(guān)重要, 影響到整個數(shù)字化工程的質(zhì)量。 因檔案數(shù)字化的后 期管理工作主要體現(xiàn)在對掃描件的檢測與檔案的還原兩個方面, 后期管理不力將 造成數(shù)字化檔
12、案的不規(guī)范性, 也會減損原有檔案的憑證價值與歷史價值。 其間出 現(xiàn)的問題具體表現(xiàn)在:(1)數(shù)字化掃描件與原件不符 檔案數(shù)字化掃描工作的性質(zhì)決定了在檔案數(shù)字化掃描過程中掃描件混亂、 缺 少、失真等情況時常發(fā)生, 因此后期管理工作極其重要。 如紙張比較大的檔案需 掃描多次, 再經(jīng)后期處理合成, 稍有不慎會造成數(shù)字化合成檔案混亂, 又如批量 處理的檔案,會造成少數(shù)檔案失真。 后期處理不當(dāng), 會導(dǎo)致出現(xiàn)數(shù)字化掃描件與 原件對比時發(fā)生遺漏與缺失現(xiàn)象。(2)檔案重新裝訂與原貌不符 有些數(shù)字檔案工作人員并不注重檔案的后期還原工作, 還原后的檔案經(jīng)重新 裝訂與封裝, 序號混亂、紙張破損等現(xiàn)象時有發(fā)生。 工作人
13、員以為完成前期掃描 工作便可, 損害了檔案的原貌, 同時也直接造成了檔案憑證價值與史料價值的缺損,這種行為犯了本末倒置的錯誤, 沒有抓住數(shù)字化的根本目的, 將手段與目的 混為一談。2. 做好檔案數(shù)字化掃描的對策2.1 加強(qiáng)現(xiàn)代化基礎(chǔ)設(shè)施建設(shè),降低掃描成本 軟、硬件基礎(chǔ)設(shè)施是檔案信息化建設(shè)不可缺少的基本條件, 是檔案信息資源 開發(fā)利用和信息技術(shù)應(yīng)用的基礎(chǔ)。 先進(jìn)齊全的軟硬件基礎(chǔ)設(shè)施能夠在很大程度上 降低掃描成本。各檔案部門在制定數(shù)字化掃描方案中應(yīng)考慮到其所使用的數(shù)據(jù)庫 管理系統(tǒng)和各種高中低檔的掃描設(shè)備的兼容性問題, 逐步減少在技術(shù)上各自為戰(zhàn) 的情況,提高軟硬件系統(tǒng)的統(tǒng)一性和通用性。因此,在硬件方
14、面,檔案部門應(yīng)配備先進(jìn)的計算機(jī)、掃描儀等成套設(shè)備,使 之適應(yīng)系統(tǒng)中大量數(shù)據(jù)的快速處理, 文字圖片的掃描及聲像資料的錄入、 網(wǎng)絡(luò)系 統(tǒng)的建設(shè)等;軟件方面,投入一定的經(jīng)費,開發(fā)一套功能強(qiáng)大的信息系統(tǒng)軟件, 引進(jìn)統(tǒng)一的檔案計算機(jī)系統(tǒng)軟件。 只有軟、 硬件基礎(chǔ)設(shè)施同時具備, 才能實現(xiàn)檔 案數(shù)字化的標(biāo)準(zhǔn)建設(shè),才能符合檔案信息化建設(shè)的基本要求。在總體上,檔案數(shù)字化掃描工作要采取逐步推進(jìn)、 有的放矢、 部分優(yōu)先的原 則,在有限的資金和時間投入下,優(yōu)先掃描損毀度高、利用頻率高、保存價值較 高的檔案, 對于那些不太重要的檔案可以延后掃描, 有效地節(jié)省時間、 人力和財 力投入,提高掃描的效率,加快數(shù)字化進(jìn)程。2.
15、2 規(guī)范掃描過程(1)加強(qiáng)檔案整理工作,提高工作人員水平造成檔案文件漏掃、 多掃、重掃的主要原因包括以下兩方面: 一是檔案整理 工作不規(guī)范; 二是掃描過程中掃描人員人為失誤。 因此,必須在掃描之前做好檔 案整理工作, 領(lǐng)卷人員要檢查案卷完整性并簽字確認(rèn); 掃描過程中, 掃描人員要 提高其專業(yè)水平, 從主觀上徹底消除掃描中因失誤而造成的漏掃、 多掃和重掃的 問題。(2)明確設(shè)置掃描參數(shù)針對不同類型的檔案采用不同的分辨率、 色彩模式及存儲格式, 使得不同紙 質(zhì)檔案經(jīng)掃描后圖像的清晰度與存儲大小達(dá)到最佳平衡點, 既有利于節(jié)省計算機(jī) 存儲空間,又能夠清晰完整地保存圖像,方便檔案信息資源的傳輸、存儲、共
16、享 和利用。經(jīng)過大量的實驗,以A4幅面為例,我們?yōu)榧堎|(zhì)檔案數(shù)字化掃描的參數(shù)設(shè)置 提出以下建議:丫1:文字較少,無底色的文字型文件;丫2: 般情況下無底色的文字型文件;丫3:文字偏?。ㄎ逄栆韵拢⒚芗蚴謱憻o底色的文字型文件;Y4:文字較大(五號以上),有底色的文字型文件;丫5: 般情況下有底色的文字型文件;丫6:文字偏小、密集或手寫的有色文字型文件;丫7:底色發(fā)黃、年代久遠(yuǎn)的文件材料;Y8:包含有照片的現(xiàn)代報紙;樣本分辨率(dpi)色彩模式大小存儲格式Y(jié)1150黑白二值276KBTIFFY2200黑白二值499KBTIFFY3200黑白二值114KBTIFFY410024位真彩128KBJPE
17、GY515024位真彩192KBJPEGY615024位真彩436KBJPEGY715024位真彩475KBJPEGY815024位真彩385KBJPEG(3)加強(qiáng)數(shù)字化過程中檔案的保護(hù)紙質(zhì)檔案掃描前將進(jìn)行一系列準(zhǔn)備工作, 其間在紙質(zhì)檔案上做標(biāo)記時,筆跡 不宜過重,字體不宜過大,在標(biāo)記便于辨認(rèn)與后期去除標(biāo)記之間求得平衡,以免傷害紙張;翻動紙張時,不要用力過度,注意保護(hù)脆弱紙張;此外,還要選擇適 當(dāng)?shù)难b備,采用科學(xué)的掃描方法。在紙張過大,而掃描儀比較小的情況下,需采用分塊掃描,然后后期利用 Photoshop及其他的圖像處理軟件進(jìn)行合并。在這一過程中要注意以下幾點:首 先,過大的紙張不宜折疊,保
18、護(hù)檔案原件;其次,掃描過程中,儀器蓋壓制檔案 時要輕放輕拿, 不要因為用力過猛損害原件; 再次, 掃描的文件放在一個文件夾 中,作為原來文件夾的子項, 掃描圖像應(yīng)具有相同的屬性與相近的像素大小, 便 于后期制作; 最后, 保證分塊掃描的每一塊有一定距離的重合, 才能確保拼接中 檔案原文件的信息完整。2.3 做好后期管理,保質(zhì)保量2.3.1 掃描案卷的檢查,校對掃描內(nèi)容將掃描后的圖像內(nèi)容與檔案原件進(jìn)行校對, 這是一項不可缺少的工作。 制定 檔案數(shù)字化后的二?;蛉Y|(zhì)檢規(guī)定, 校對工作要根據(jù)加工進(jìn)度按階段進(jìn)行, 絕 不能在最后階段集中突擊校驗。首先,核對案卷原件與數(shù)字化后的檔案內(nèi)容,保證圖像質(zhì)量。 第一,檢查掃描文件的清晰度。 由于掃描文件在計算機(jī)上檢索時整版圖像已 被縮略,需要進(jìn)一步查閱具體數(shù)據(jù)時就需要放大, 如果分辨率很低, 圖像放大畫 面就不清晰, 所以,對按已確定分辨率掃描的圖像, 必須提高分辨率并重新掃描 加工。第二,檢查掃描圖像是否有歪斜現(xiàn)象,進(jìn)行糾錯及糾偏處理。在掃描過程 中,由于有些檔案原件本身就是復(fù)印件或紙張陳舊、 色澤明暗不均、 局部有污點 等原因,在掃描的圖像上出現(xiàn)重度陰影, 掃描后就需要由數(shù)字化工作人員對其進(jìn) 行潔凈處理,圖像歪斜的進(jìn)行糾偏, 重度陰影的需將陰影部分利用軟件加以處理。其次,數(shù)字化工作人員對數(shù)字化合成的圖像逐項核對,確
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度個人房產(chǎn)買賣綠色環(huán)保裝修合同3篇
- 遠(yuǎn)足活動課程設(shè)計
- 安全用電運行管理制度模版(2篇)
- 2025年影劇院消防安全管理制度(2篇)
- 2024年青島版六三制新必修5語文下冊階段測試試卷
- 二零二五年度承包土地種植與農(nóng)業(yè)電商平臺合作協(xié)議2篇
- 2025年投資公司年度工作計劃范文(2篇)
- 二零二五年度交通基礎(chǔ)設(shè)施PPP項目合同2篇
- 2025年外研版三年級起點九年級化學(xué)下冊階段測試試卷
- 二零二五年度國際貿(mào)易財務(wù)擔(dān)保合同示范(國際貿(mào)易保障)
- 石化行業(yè)八大高風(fēng)險作業(yè)安全規(guī)范培訓(xùn)課件
- 村老支書追悼詞
- DB3302T 1131-2022企業(yè)法律顧問服務(wù)基本規(guī)范
- 2022年自愿性認(rèn)證活動獲證組織現(xiàn)場監(jiān)督檢查表、確認(rèn)書
- 中南大學(xué)年《高等數(shù)學(xué)上》期末考試試題及答案
- 付款通知確認(rèn)單
- 2022年中國城市英文名稱
- 小龍蝦高密度養(yǎng)殖試驗基地建設(shè)項目可行性研究報告
- 《橋梁工程計算書》word版
- 中考《紅星照耀中國》各篇章練習(xí)題及答案(1-12)
- 舒爾特方格55格200張?zhí)岣邔W⒘4紙直接打印版
評論
0/150
提交評論