紙質(zhì)檔案掃描參數(shù)的設定_第1頁
紙質(zhì)檔案掃描參數(shù)的設定_第2頁
紙質(zhì)檔案掃描參數(shù)的設定_第3頁
紙質(zhì)檔案掃描參數(shù)的設定_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、紙質(zhì)檔案掃描參數(shù)的設定蘇州大學檔案學專業(yè) 許呈辰 指導教師 張照余【摘要】本文通過實驗探討了紙質(zhì)檔案掃描工作中分辨率、色彩模式和亮度三個主要參數(shù)的設定,分析了其限制條件及其對檔案掃描質(zhì)量與工作效率的影響,并通過實驗給出了可靠數(shù)據(jù)與合理建議?!娟P鍵詞】紙質(zhì)檔案 掃描 參數(shù)紙質(zhì)檔案掃描是紙質(zhì)檔案數(shù)字化的主要方式,其原理是利用掃描儀對紙質(zhì)檔案進行一系列的光/ 電轉(zhuǎn)換,最終形成計算機能識別的數(shù)字信號,在計算機內(nèi)重組成數(shù)字化圖像文件,并經(jīng)各種處理,通過顯示器加以顯示的過程。數(shù)字檔案較傳統(tǒng)紙質(zhì)檔案來說可以為人們提供更多的利用途徑,對原件損害較小,查閱起來更加便捷、快速,是信息社會檔案的發(fā)展趨勢。目前全國各

2、地檔案館館藏仍以紙質(zhì)為主,紙質(zhì)檔案數(shù)字化工作是今后一段時期檔案工作的重要內(nèi)容。紙質(zhì)檔案掃描既要保證質(zhì)量,又要高效。如何保質(zhì)保量地完成掃描工作,關鍵在于合理設置掃描參數(shù),其中最重要的三個參數(shù)是分辨率、色彩模式和亮度。一、分辨率的設定分辨率是用來衡量掃描儀對圖像細節(jié)表現(xiàn)能力的參數(shù),通常用每英寸掃描圖像上所含像素點的個數(shù)來表示,記做dpi( dot per inch)。參考文獻: 徐健、婁紅、曲麗艷:如何把好檔案掃描質(zhì)量關,山東檔案,2005(2),P32。 分辨率是整個掃描過程中最重要的參數(shù),直接決定了圖像的清晰程度。在一定限度內(nèi),分辨率越高,每英寸掃描圖像上所含的像素點越多,圖像越清晰。但是,這

3、并不代表分辨率越高越好,片面追求分辨率,只會適得其反。1. 分辨率對文件大小的影響分辨率越高,所產(chǎn)生的圖像文件越大。實驗顯示,一張A4文件以黑白二值掃描為TIF圖像,若分辨率設定為150dpi,文件大小僅18K左右;為200dpi時,約29K;為300dpi時,約46K,是150dpi的2倍多。而以24位真彩(C24)模式掃描為JPEG圖像時,分辨率對文件大小的影響更明顯,當設定為150dpi時,大小約290K;為200dpi時,約452K;為300dpi時,約871K,是150dpi的3倍。2. 分辨率對掃描速度的影響分辨率提高會降低掃描速度。一張A4文件,若采用黑白二值掃描,分辨率對掃描速

4、度的影響并不明顯,但若采用24位真彩(C24)模式掃描,分辨率僅僅提高50dpi,就會對掃描速度產(chǎn)生較明顯的影響。分辨率翻倍,掃描時間也會跟著翻倍。假設某掃描人員一天掃描1000張紙(這還是保守估計),若由于分辨率而使每張紙的掃描時間多花3秒,那么一天累計下來就要多花3000秒,即50分鐘,將近一小時。3. 分辨率對圖像質(zhì)量的影響分辨率對圖像質(zhì)量的影響是遞減的。這有點類似于經(jīng)濟學中的邊際效用遞減規(guī)律。每增加一定分辨率,圖像質(zhì)量會有所提高,但隨著分辨率越來越高,質(zhì)量提高的幅度越來越小,到達某一臨界點后,分辨率對圖像質(zhì)量幾乎沒有影響,甚至出現(xiàn)反效果。此時,再提高分辨率毫無意義,而該臨界點,便是紙質(zhì)

5、檔案掃描的最佳分辨率。4. 分辨率對后期操作的影響分辨率過高會影響圖像的后期處理和掛接速度,甚至出現(xiàn)死機現(xiàn)象,即使勉強掛接上,在打開文件閱讀時計算機運行速度依然緩慢,更不用說遠程傳輸了,存在較大風險。5. 其他設備對分辨率的限制分辨率需要和輸出設備,即打印機的分辨率相吻合,如果掃描儀的分辨率超過圖像放大系數(shù)×打印機的分辨率/打印機噴頭色數(shù),則再清晰的圖像都不可能打印出同樣的效果來。 張照余:檔案信息網(wǎng)絡化建設研究,北京:中國檔案出版社,P131、132??傊直媛蕸]有“最大”或“最小”,只有“最合適”。掃描分辨率參數(shù)大小的選擇,原則上以掃描圖像清晰、完整、不影響圖像的利用效果為準。

6、采用黑白二值、灰度、彩色幾種模式對檔案進行掃描時,其分辨率一般均建議選擇大于或等于l00dpi。特殊情況下,如文字偏小、密集、清晰度較差等,可適當提高分辨率。需要進行OCR漢字識別的檔案,掃描分辨率建議選擇大于或等于200dpi。 檔案行業(yè)標準:紙質(zhì)檔案數(shù)字化技術規(guī)范(DA/T31-2005),第6.3.13條。 實驗表明,一般情況下,對于黑白二值掃描的檔案,宜采用200dpi;對于24位真彩(C24)模式掃描的檔案,考慮到色彩、文件大小等因素的影響,宜采用150dpi。而以300dpi分辨率掃描形成的文本圖像,在用OCR自動識別時錯誤率最低。 二、色彩模式的選擇色彩模式又稱色彩分辨率、色彩位

7、數(shù),是表示掃描儀分辨色彩或灰度細膩程度的指標。理論上說,色彩分辨率越高,顏色越逼真。 朱錚:檔案數(shù)字化研究,蘇州大學2006屆碩士學位論文,P12。 早期掃描儀的色彩分辨率多是24位的,后來有了30位、36位,現(xiàn)在48位的掃描儀也比比皆是,于是色彩模式就有了黑白二值、灰度、24位真彩(C24)、36位彩色、48位彩色等。由于后三種彩色模式的圖像受到顯示器和人眼本身分辨能力限制,幾乎看不出差異,所以實際檔案掃描工作中,一般只用到前三種色彩模式,更多的位數(shù)也是多余。1. 黑白二值模式黑白二值模式是只以黑、白二色(即1個二進制位)來表示圖像的模式。對于黑白文件,自然應采用黑白二值模式掃描。由于顏色少

8、,所以生成的文件非常小,既節(jié)約了存儲空間,又提高了運行速度。適用范圍:頁面非黑即白,字跡清晰、不帶插圖的票據(jù)、文書等文字稿、線條圖等。由于大多數(shù)的紙質(zhì)檔案是黑白文稿,因此,黑白二值掃描是最常用的模式。 張照余:檔案信息化理論與實踐,北京:中國檔案出版社,P251。如果要進行OCR識別,采用黑白二值掃描的圖像,其識別速度和正確率比灰度、24位真彩(C24)模式掃描的圖像都高,這是因為文本通常只用到黑白二色,過多的顏色只會變成干擾信息。2. 灰度模式灰度模式是以8個二進制位來表示像素顏色的模式,在黑白二色之間加入了灰色元素,使圖像呈現(xiàn)出明暗變化,其效果就像以前的“黑白照片”。但此模式現(xiàn)在一般不怎么

9、采用,因為其色彩失真度實在太大,有色文件一般都應采用24位真彩(C24)模式,以保障檔案的原真性。這就好比過去條件差,不得已才拍黑白照片,現(xiàn)在有了彩色相機,基本就都拍彩色照片一樣。不過,對于一些有點“歲數(shù)”,紙張微微泛黃的檔案,若想節(jié)約存儲空間,也可采用灰度模式。而黑白二值模式是萬萬不可取的,因為圖像背景會出現(xiàn)黑點,甚至黑塊。3. 24位真彩(C24)模式24位真彩(C24)模式以24個二進制位來表示像素顏色的模式,最多可表示224種顏色。對于有色文件,應采用該模式。生成的圖像色彩豐富,能較好地保持檔案的原真性,但是文件較大,掃描速度也較慢,因此,若非必要,盡量不要使用。適用范圍:紅頭文件,有

10、插圖、照片的文件、報紙、學籍檔案,紙張嚴重泛黃的檔案等??傊?,掃描同一幅圖片,用黑白二色模式,圖像文件只有數(shù)十KB,用灰度模式是數(shù)百KB,而選擇彩色模式的話,文件就達數(shù)十上百兆,因此,選擇掃描色彩模式時必須謹慎,以最小的容量容納質(zhì)量最高的圖像。三、 亮度的調(diào)節(jié)亮度是表現(xiàn)掃描圖像明暗程度的參數(shù),適當調(diào)節(jié)掃描儀的亮度參數(shù),可以更好地保證圖像的質(zhì)量,且能夠提高OCR文字識別的正確率。亮度調(diào)節(jié)應控制在一定范圍內(nèi),亮度太亮,文字筆劃斷裂殘缺不全;亮度太暗,文字筆劃相互粘連而黑成一團。 饒宗政:淺談文書檔案數(shù)字化,四川檔案,2002(5),P33。注釋:*本文系蘇州大學本科生創(chuàng)新課題檔案數(shù)字化不同技術模式的比較及其適用性研究項目編號:57315961的研究成果之一。 因此,在實際工作中,對于底色較淺或紙張光面的書刊、雜志,可適當調(diào)低亮度;而對于底色較深的報紙,則宜增加亮度。就檔案所包含的文字來說,對于字體較小或筆劃較粗的黑體字、楷體字,可適當調(diào)高亮

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論