檔案數(shù)字化整體解決方案(精編版)_第1頁(yè)
檔案數(shù)字化整體解決方案(精編版)_第2頁(yè)
檔案數(shù)字化整體解決方案(精編版)_第3頁(yè)
已閱讀5頁(yè),還剩20頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、檔案室、檔案館館藏檔案掃描、數(shù)字化加工整體解決方案武漢 xx 數(shù)字科技有限公司目錄第一節(jié)質(zhì)數(shù)字化加工作業(yè)前期準(zhǔn)備1 一、數(shù)字化工作人員準(zhǔn)備1 二、數(shù)字化工作軟件、硬件準(zhǔn)備4 三、確定數(shù)字化內(nèi)容、數(shù)量及用戶需求5 第二節(jié)數(shù)字化加工流程及主要技術(shù)方案6 一、入庫(kù)提卷、拆卷6 二、標(biāo)引著錄7 三、檔案掃描8 四、圖像處理11 五、全文 ocr、生成雙層 pdf、板式還原及格式 12 六、總質(zhì)檢14 七、批量掛接15 八、還卷及數(shù)據(jù)備份提交15 第三節(jié)質(zhì)量控制方案和保證措施17 一、加工質(zhì)量保障措施17 二、多環(huán)節(jié),多層次的質(zhì)量檢查體系17 三、階段性驗(yàn)收與終驗(yàn)相結(jié)合的嚴(yán)格驗(yàn)收程序是質(zhì)量控制的終級(jí)保障

2、19 第四節(jié)安全保密控制 21 保密協(xié)議 22 第五節(jié)售后服務(wù)24 項(xiàng)目背景隨著全國(guó)文化信息資源共享工程與中國(guó)數(shù)字圖書(shū)館工程的起動(dòng),信息化已成為國(guó)際潮流,信息資源建設(shè)成為當(dāng)務(wù)之急。信息資源建設(shè)的重點(diǎn)是電子文獻(xiàn)、各類數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)資源、電子檔案、電子圖書(shū)等新型數(shù)字化信息資源的建設(shè)。在數(shù)字化信息資源建設(shè)中,很大的一個(gè)需求是將現(xiàn)有的紙介質(zhì)印刷品數(shù)字化,使之成為能夠用計(jì)算機(jī)閱讀、理解、查詢、檢索的電子文件,最終將其應(yīng)用于數(shù)據(jù)庫(kù)存儲(chǔ),或通過(guò)cd-rom、internet網(wǎng)進(jìn)行出版,或上傳數(shù)字檔案館供用戶使用。以傳統(tǒng)紙張為載體的保存方式,占據(jù)了大量的空間,需要特殊的環(huán)境,而且不方便查詢,隨著時(shí)間的推移,還面

3、臨著腐蝕、老化等問(wèn)題。而將紙介質(zhì)文件信息進(jìn)行電子化處理,保存到光盤(pán)上,具有存儲(chǔ)、管理、共享等功能,還可以減少文件庫(kù)房占地,節(jié)省保管設(shè)備和人員方面開(kāi)支,又方便統(tǒng)計(jì)和進(jìn)行遠(yuǎn)程查詢。因此,將檔案、期刊、文件等資料通過(guò)掃描儀,掃描成圖像文件,再通過(guò)處理轉(zhuǎn)換成電子文檔,建立目錄和索引,制作成電子文件,已是當(dāng)務(wù)之急。公司簡(jiǎn)介武漢 xx 數(shù)字科技有限責(zé)任公司 (前身是湖北華新職業(yè)學(xué)院數(shù)字科研中心)成立于 1994 年,是在原國(guó)家科委的支持下, 為推進(jìn)建設(shè)國(guó)家 “工程”高等學(xué)校中英文圖書(shū)數(shù)字化國(guó)際合作計(jì)劃(china-america digital academic library ) “cadal ”項(xiàng)目而

4、成立的一家高新技術(shù)企業(yè)。公司擁有先進(jìn)的ocr (雙層光學(xué)字符識(shí)別)技術(shù),圖像掃描處理系統(tǒng)、生產(chǎn)流程管理系統(tǒng),實(shí)現(xiàn)工廠化流水作業(yè),智能化質(zhì)量控制與管理的具有國(guó)際領(lǐng)先水平的信息數(shù)字化工廠技術(shù)??赏瑫r(shí)為圖書(shū)館、檔案館、政府、企業(yè)提供信息管理系統(tǒng)和信息資源數(shù)字化加工服務(wù)。經(jīng)過(guò)六年的不斷探索和實(shí)踐,公司建立了一套完善的服務(wù)于各領(lǐng)域的業(yè)務(wù)體系,檔案館:檔案綜合管理系統(tǒng),檔案、古籍、期刊、論文、文獻(xiàn)資料數(shù)字化加工,檔案著錄、 ocr ,數(shù)據(jù)制作、檔案館設(shè)備及耗材提供等。政府機(jī)關(guān):數(shù)字檔案管理系統(tǒng),歷史陳舊檔案數(shù)字化加工。醫(yī)療、保險(xiǎn)金融領(lǐng)域: 病歷、保單等數(shù)字化加工,數(shù)據(jù)錄入服務(wù),全文等。第一節(jié)數(shù)字化加工作業(yè)

5、前期準(zhǔn)備一數(shù)字化工作人員準(zhǔn)備1 . 甲方人員職務(wù):現(xiàn)場(chǎng)交接管理人員人數(shù)要求:一名專業(yè)要求:為學(xué)校檔案館負(fù)責(zé)檔案管理工作的技術(shù)或管理人員。職責(zé)范圍:. 負(fù)責(zé)與乙方的檔案提卷和還卷等交接工作,協(xié)同甲方人員作好交接清單記錄并簽字。. 負(fù)責(zé)監(jiān)督乙方規(guī)范化加工。隨時(shí)把握乙方加工進(jìn)度并進(jìn)行協(xié)調(diào)。. 及時(shí)關(guān)注并抽查乙方加工質(zhì)量代表甲方與乙方進(jìn)行及時(shí)的溝通及問(wèn)題協(xié)調(diào),確保項(xiàng)目順利完工。2 乙方人員2.1 管理人員主要為:熟悉現(xiàn)場(chǎng)加工管理,熟悉數(shù)字化整體作業(yè)流程,具有較強(qiáng)組織能力和現(xiàn)場(chǎng)管理及溝通能力的乙方負(fù)責(zé)人。2.2 工程技術(shù)人員主要為:熟悉計(jì)算機(jī)軟、硬件技術(shù),了解檔案數(shù)據(jù)庫(kù)標(biāo)準(zhǔn)和系統(tǒng)開(kāi)發(fā)。了解檔案管理等相關(guān)

6、專業(yè)知識(shí)的乙方技術(shù)部技術(shù)支持工程師。2.3 數(shù)據(jù)采集作業(yè)員主要為:了解檔案數(shù)據(jù)庫(kù)數(shù)據(jù)標(biāo)準(zhǔn)和計(jì)算機(jī)軟件應(yīng)用等相關(guān)知識(shí)的乙方數(shù)字化制作部工作人員。人員安排見(jiàn)表 3-1 二 . 數(shù)字化工作軟、硬件準(zhǔn)備1配備硬件數(shù)量及檔次要視數(shù)據(jù)采集工作情況及數(shù)據(jù)量大小。2甲方提供 pc機(jī) 4-6 臺(tái)給乙方作為采集作業(yè)使用,其他硬件設(shè)備由乙方自行解職務(wù)職責(zé)人員備注管理人員項(xiàng)目負(fù)責(zé)人1負(fù)責(zé)人員,資源的調(diào)配工作。2負(fù)責(zé)施工組織設(shè)計(jì)、管理。3負(fù)責(zé)施工條件的保障及與甲乙雙方關(guān)于項(xiàng)目進(jìn)展?fàn)顟B(tài)的匯報(bào)和協(xié)調(diào)工作。1 人項(xiàng)目負(fù)責(zé)人不 一 定 要 常 駐現(xiàn)場(chǎng),但要通過(guò)一 切 通 訊 手 段和 定 期 到 現(xiàn) 場(chǎng)的督導(dǎo),切實(shí)做到 對(duì) 該

7、 項(xiàng) 目 加工 進(jìn) 度 和 加 工質(zhì)量的掌控現(xiàn)場(chǎng)主管1.負(fù)責(zé)與乙方的檔案提卷和還卷等交接工作2.負(fù)責(zé)現(xiàn)場(chǎng)的人員管理和加工管理3.負(fù)責(zé)數(shù)據(jù)的終驗(yàn)和掛接4.配合項(xiàng)目負(fù)責(zé)人做好與乙方的溝通協(xié)調(diào)工作。1 人數(shù)據(jù)采集人員著錄人員負(fù)責(zé)將檔案卷內(nèi)目錄及其它索引信息進(jìn)行手工錄入為電子數(shù)據(jù)信息并校對(duì)1 人掃描人員負(fù)責(zé)按制定的技術(shù)規(guī)范將檔案資料掃描1 人圖像處理人員1.去污:將掃描獲取的圖像進(jìn)行圖像去污;去黑邊及去雜點(diǎn)等;2.糾偏:將偏斜的圖像進(jìn)行糾正處理; 3.文字處理:將不清楚的文字進(jìn)行加深或變淺;4.拼接:將頁(yè)面較大的圖像進(jìn)行拼接處理;1 人在進(jìn)行圖像處理的時(shí)候, 肯定是逐頁(yè)處理, 所以要留意每一頁(yè)掃描的質(zhì)

8、量,發(fā)現(xiàn)掃描質(zhì)量問(wèn)題立即發(fā)還上一工序重掃并作好記錄。圖像矢量化人員1.負(fù)責(zé)將處理好的圖像進(jìn)行全文識(shí)別、2.校對(duì)、板式還原和格式轉(zhuǎn)換3.對(duì)已經(jīng)產(chǎn)生的成品數(shù)據(jù)進(jìn)行初驗(yàn)后移交給現(xiàn)場(chǎng)主管終驗(yàn)并掛接。1-3人矢量化人員最終定員需結(jié)合矢量化的圖形數(shù)量和采集難度。決。3場(chǎng)地 : 甲方提供。4辦公用具:甲方提供打印機(jī)(以實(shí)際用量為標(biāo)準(zhǔn))辦公桌椅檔案資料的裝訂及打印機(jī)所用的全部耗材。5. 其他條件:提供電力和飲水。軟硬件準(zhǔn)備詳見(jiàn)表3-2 表 3-2 軟、硬件配備列表軟、硬件名稱數(shù)量詳細(xì)配置響應(yīng)時(shí)間提供方綜合檔案管理系統(tǒng)一套1需支持全文檢索使用功能。2支持 tiff 和pdf 格式數(shù)據(jù)的批量掛接功能。項(xiàng)目開(kāi)始需到

9、位甲方數(shù)字化流程管理和加工軟件、 ocr 軟件全套能 滿 足 本 加工 項(xiàng) 目 所 有 的技術(shù)要求項(xiàng)目開(kāi)始需到位乙方服務(wù)器一臺(tái)項(xiàng)目開(kāi)始需到位甲方掃描儀( a3 幅面)一臺(tái)富士通 a3 幅面fi-4750c(adf) 項(xiàng)目開(kāi)始需到位乙方掃描儀( a4 幅面)一臺(tái)a4 幅面虹光-fb6030 (平板) 項(xiàng)目開(kāi)始需到位乙方計(jì)算機(jī)4-6 套pc 機(jī)項(xiàng)目開(kāi)始需到位甲方三. 確定數(shù)字化內(nèi)容、數(shù)量及用戶需求在數(shù)據(jù)采集之前,首先要客觀真實(shí)統(tǒng)計(jì)數(shù)字化內(nèi)容和數(shù)量,確定用戶使用需求,然后制定對(duì)應(yīng)方案和技術(shù)控制以便準(zhǔn)確地進(jìn)行施工安排。表 3-3 三峽大學(xué)檔案館檔案數(shù)字化用戶需求調(diào)研表檔案類型檔案數(shù)量數(shù)字化準(zhǔn)備情況紙張

10、及保存情況用戶需求備注招生名冊(cè)約件約面很好一般較差很差影像化矢量化學(xué)籍檔案約件約面很好一般較差很差影像化矢量化學(xué)生成績(jī)約件約面很好一般較差很差影像化矢量化黨群檔案約件約面很好一般較差很差影像化矢量化基建檔案約件約面很好一般較差很差影像化矢量化科研檔案約件約面很好一般較差很差影像化矢量化其它:約件約面很好一般較差很差影像化矢量化填表人職務(wù)第二節(jié)數(shù)字化加工流程及主要技術(shù)方案檔案數(shù)字化加工主要流程包括:提卷-拆卷- 檔案著錄 -掃描- 圖像處理 -ocr-校對(duì)-版式還原 -轉(zhuǎn)雙層 pdf-終驗(yàn)-掛接。檔案裝訂檔案著錄檔案整理排序檔案裝訂檔案著錄檔案整理排序檔案裝訂檔案著錄檔案整理排序檔案裝訂檔案著錄

11、檔案整理排序檔案裝訂檔案著錄檔案整理排序檔案裝訂檔案著錄檔案整理排序檔案裝訂檔案著錄檔案整理排序圖一檔案數(shù)字化加工流程圖一、入庫(kù)提卷、拆卷1. 從檔案室移交檔案,嚴(yán)格執(zhí)行原始檔案的交接手續(xù),使用雙方項(xiàng)目負(fù)責(zé)人確認(rèn)的檔案交接清單(完成清點(diǎn)登記) 。2. 檔案整理:編寫(xiě)頁(yè)碼、核對(duì)紙質(zhì)檔案頁(yè)碼、對(duì)可拆釘?shù)奈募霾疳斕幚硪赃m應(yīng)掃描的要求、對(duì)需要修復(fù)的檔案進(jìn)行歸并整理(如果發(fā)現(xiàn)破損嚴(yán)重,無(wú)法直接進(jìn)行掃描的檔案,應(yīng)先進(jìn)行技術(shù)修復(fù)、折皺不平影響掃描質(zhì)量的原件應(yīng)先進(jìn)行相應(yīng)處理后再進(jìn)行掃描,發(fā)現(xiàn)破損嚴(yán)重的檔案須立即報(bào)知項(xiàng)目相關(guān)負(fù)責(zé)人)制作卷內(nèi)目錄,掃描文件抽取3 按照掃描處理量明確交接周期和檔案交接量(雙方項(xiàng)目

12、負(fù)責(zé)人簽字, 以保在施工過(guò)程中檔案不損失、不丟失。 )4 裝訂案卷應(yīng)保證裝訂牢固,案卷整齊,卷內(nèi)材料不松動(dòng),脫落,保持與原案卷一致。圖二二、標(biāo)引著錄按要求將文件所需信息錄入到軟件數(shù)據(jù)庫(kù)里,標(biāo)引著錄按照國(guó)家檔案局有關(guān)標(biāo)準(zhǔn)結(jié)合用戶檔案著錄的具體要求進(jìn)行。1. 錄入方式采用手工錄入的方式2. 校對(duì)方式校對(duì)以軟件校對(duì)和打印輸出、對(duì)比校對(duì)相結(jié)合,錯(cuò)誤率在萬(wàn)分之二以下。案卷目錄和卷內(nèi)目錄按照檔案的原始數(shù)據(jù)錄入。卷案目錄和卷內(nèi)目錄的樣式經(jīng)用戶同意可做相應(yīng)調(diào)整。對(duì)檔案目錄數(shù)據(jù)修改和補(bǔ)充的數(shù)據(jù),須填寫(xiě)更改資料、更改資料放入原案卷內(nèi),卷內(nèi)目錄及其他不全的需補(bǔ)充完整。三、檔案掃描1. 掃描方式:根據(jù)檔案幅面的大小選

13、擇相應(yīng)規(guī)格的掃描儀或?qū)I(yè)掃描儀進(jìn)行掃描。大幅面檔案可采用加長(zhǎng)式掃描或者圖像拼接處理方式處理,同一頁(yè)面有兩個(gè)以上文件,需分別掃描。2.掃描色彩模式:以黑白二值掃描為主,附有灰度(彩色)照片及原件分明度很低的檔案,可視情況采取灰度和24位真彩色掃描。然后以黑白二值保存。例:藍(lán)底招生名冊(cè),此種檔案長(zhǎng)見(jiàn)為a3幅面、紙張很薄,底色與文字的分明度很低。實(shí)物檔案查看時(shí)都顯吃力,此種檔案如果用黑白二值掃描,則會(huì)出現(xiàn)大幅暗面,文字顯現(xiàn)不清;如果使用彩色掃描,文字部分明度很低。只有使用灰度掃描,效果相對(duì)好一些,如圖三。掃描后的圖像再輔以黑白二值保存,則最大限度的提高了圖像質(zhì)量,如圖四。圖三 灰度掃描效果圖四 保存

14、為黑白值后的效果3.分辨率:無(wú)全文檢索需求的文檔分辨率調(diào)整為200dpi 最為合適。需要全文檢索而做 ocr 識(shí)別的文檔, 黑白二值掃描分辨率最佳為400dpi,此分辨率下識(shí)別成功率最高。 24 位真彩色掃描分辨率標(biāo)準(zhǔn)為200dpi。4圖像文件的大小:黑白二值掃描a3 頁(yè)面:20k40k;灰度或彩色掃描a3 頁(yè)面:100150k。5如遇字間距和行間距過(guò)密、原件本身是復(fù)印件等字跡不清楚的情況,可適當(dāng)增加掃描的分辨率,但要保證圖像清晰的同時(shí),又不影響遠(yuǎn)程查詢和瀏覽的速度。6清晰度:掃描圖像字跡清晰、顏色恰當(dāng),不宜過(guò)淺或過(guò)深,并且不得出現(xiàn)字跡筆畫(huà)殘缺或字跡筆畫(huà)疊合而影響閱讀的情況,即使原檔案存在銹斑

15、變質(zhì)、顏色過(guò)淺或深淺不一致,也保證掃描圖像可讀,掃描留下的墨跡寬度不得超過(guò)0.5 厘米,并且指印和黑線不能覆蓋或影響正文內(nèi)容。7根據(jù)檔案實(shí)體情況,在檔案電子文件中相對(duì)應(yīng)目錄設(shè)置“復(fù)制件”、 “原件不清”標(biāo)志。目錄以原有檔案目錄為準(zhǔn),在實(shí)際處理過(guò)程中著有未歸類的新目錄。可根據(jù)情況修改目錄,增加或調(diào)整標(biāo)準(zhǔn)目錄,對(duì)檔案原目錄數(shù)據(jù)修改或補(bǔ)充的數(shù)據(jù),需填寫(xiě)更改資料,更改資料放入原案卷內(nèi),能實(shí)現(xiàn)一條目錄對(duì)應(yīng)多個(gè)圖像和一個(gè)圖像對(duì)應(yīng)多條目錄的編目。8圖像內(nèi)容:8.1實(shí)時(shí)在屏幕上監(jiān)控掃描全過(guò)程,遇有漏掃、 重張,圖像黑邊、偏斜、折角、不清晰等情況,則進(jìn)行重掃或補(bǔ)掃。8.2檢查掃描件是否合乎要求,掃描圖像必須與原

16、圖頁(yè)面一一對(duì)應(yīng),不得出現(xiàn)顛倒、缺頁(yè)、重頁(yè)或錯(cuò)頁(yè)情況,不能有遺漏、重復(fù),掃錯(cuò)的現(xiàn)象8.3掃描的頁(yè)面內(nèi)容居中顯示,不可出現(xiàn)明顯偏左或偏右的現(xiàn)象,正文內(nèi)容、頁(yè)眉、頁(yè)腳、反面印章、附件、手寫(xiě)注釋等信息完整;圖像內(nèi)容與書(shū)本面完全對(duì)應(yīng),不得出現(xiàn)書(shū)頁(yè)內(nèi)容殘缺或?qū)⑴赃呿?yè)面信息掃入本頁(yè)的現(xiàn)象。(對(duì)圖像黑邊、偏斜、折角、不清晰等情況進(jìn)行處理,以達(dá)到用戶需求)8.4紙張較差檔案掃描方案:由于進(jìn)行數(shù)字化的檔案會(huì)有部分為歷史檔案,紙張質(zhì)量比較差,對(duì)于這部分紙張質(zhì)量較差的歷史檔案掃描,我們本著以下原則:8.4.1 保證檔案安全。紙張較差的檔案多為破損檔案,對(duì)于破損檔案更應(yīng)該在生產(chǎn)流程中加以特殊對(duì)待,不能造成二次破壞。 保

17、證檔案的安全是第一要?jiǎng)?wù)。 因此,在處理紙張較差的檔案時(shí), 不允許使用蘸水防滑等有破壞檔案可能性的操作方法。8.4.2 保證掃描質(zhì)量。歷史檔案之所以進(jìn)行檔案數(shù)字化,其中最主要的目的之一就是搶救這部分歷史檔案,今后在應(yīng)用這部分檔案時(shí),盡量避免人為翻閱歷史檔案而給檔案造成二次傷害,而應(yīng)使用電子系統(tǒng),使用掃描件。這樣檔案掃描的質(zhì)量要盡可能的清晰、干凈,盡可能的恢復(fù)歷史原貌,這對(duì)掃描質(zhì)量的要求很高。8.4.3高效高質(zhì)的完成任務(wù)。9. 掃描登記:認(rèn)真填寫(xiě)紙質(zhì)檔案數(shù)字化轉(zhuǎn)換過(guò)程交接登記表單,登記掃描的頁(yè)數(shù),核對(duì)每份文件的實(shí)際掃描頁(yè)數(shù)與檔案整理時(shí)填寫(xiě)的文件頁(yè)數(shù)是否一致,不一致時(shí)應(yīng)注明具體原因和處理方法。四、圖

18、像處理1. 逐張檢查圖像質(zhì)量(包括黑邊、折角、圖像偏斜度、清晰度、失真度等進(jìn)行檢查,發(fā)現(xiàn)不符合圖像質(zhì)量要求時(shí),應(yīng)重新進(jìn)行圖像處理),檔案順序(頁(yè)號(hào))是否正確,有無(wú)漏掃、重張等情況(發(fā)現(xiàn)文件漏掃時(shí),應(yīng)及時(shí)補(bǔ)掃并正確插入圖像。發(fā)現(xiàn)掃描圖像的排列順序與檔案原件不一致時(shí),應(yīng)及時(shí)進(jìn)行調(diào)整。)2. 糾偏:圖像整體傾斜不得超過(guò)1 度,不得出現(xiàn)圖像的一部分傾斜或扭曲而影響閱讀的現(xiàn)象。如果檔案頁(yè)面存在部分傾斜的,以頁(yè)面中標(biāo)題糾正為準(zhǔn)。3 去污:所有掃描留下的黑線、指印、陰影或污點(diǎn)都必須清除干凈(在放大50%的情況下)由于印刷質(zhì)量或紙張質(zhì)量等造成的頁(yè)面上有零星的污點(diǎn)和反面倒映文字污點(diǎn)比較多,如果在頁(yè)面視圖下看不清

19、楚,或該污點(diǎn)嵌在文本行中無(wú)法清除,可以不清除,但應(yīng)盡量保證圖像可讀。4 全文頁(yè)面及局部文字的加深和變淺的處理:原始檔案的清晰度較低時(shí), 可提高圖像的清晰度,修正原資料中存在的字間距和行間距過(guò)密,文字較深或較淺,字跡不清楚的缺陷,確保文字及圖像信息清晰可辨。5 圖像拼接:對(duì)大幅面檔案進(jìn)行分區(qū)掃描形式的多幅圖像,應(yīng)進(jìn)行拼接處理,合并為一個(gè)完整的圖像,以保證檔案數(shù)字化圖像的整體性和數(shù)字化檔案的準(zhǔn)確可讀。6 照片頁(yè)處理: 必要時(shí)采用專業(yè)的圖像處理軟件進(jìn)行處理,確保照片的清晰度。7 圖像存儲(chǔ):存儲(chǔ)格式以 g-4 壓縮 tiff 格式保存。a4 幅面檔案保存文件不得大于 100k;其他幅面檔案掃描形成文件

20、在保證影像質(zhì)量的前提下,盡量縮小文件占用空間。掃描文件存儲(chǔ)命名必須與條目檔案號(hào)一一對(duì)應(yīng)。五、全文識(shí)別( ocr)及生成雙層 pdf、版式還原及格式轉(zhuǎn)換將掃描處理完成后的文檔利用專業(yè)的識(shí)別軟件進(jìn)行全文ocr ,如甲方對(duì)識(shí)別成功率有嚴(yán)格要求的,還需另外進(jìn)行人工校對(duì),校對(duì)結(jié)束后將版式還原及轉(zhuǎn)換成雙層 pdf文件格式。根據(jù)用戶對(duì)識(shí)別率的要求,可選擇性進(jìn)行人工校對(duì)。進(jìn)行人工校對(duì)和不進(jìn)行校對(duì)的優(yōu)缺點(diǎn)對(duì)比:1不進(jìn)行人工校對(duì):其原理是在單層pdf 的基礎(chǔ)上利用計(jì)算機(jī)軟件進(jìn)行全文 ocr 識(shí)別后生成雙層pdf文件。從而激活了圖片中所反映的文字,而達(dá)到提取文字和利用原文所包含的文字進(jìn)行檢索的目的。但是不進(jìn)行人工校

21、對(duì)和版式還原,識(shí)別的準(zhǔn)確率取決于原始資源的情況及保存現(xiàn)狀。優(yōu)點(diǎn):效率高、成本低、能利用原文檢索瀏覽速度快。缺點(diǎn):識(shí)別準(zhǔn)確率取決于原件的質(zhì)量,所以準(zhǔn)確率不穩(wěn)定。適應(yīng)范圍:、原件版面干凈及保存完好的資源。 (準(zhǔn)確率可達(dá) 95%以上)、原文中只含部份核心檢索內(nèi)容的資源。 (如學(xué)籍檔案,檢索的重點(diǎn)只是圍繞學(xué)生的身份信息)2進(jìn)行人工校對(duì):其原理是在ocr 的基礎(chǔ)上,為了確保識(shí)別的準(zhǔn)確率而增加了人工校對(duì)和版式還原的工序。可實(shí)現(xiàn)無(wú)障礙的全文檢索。優(yōu)點(diǎn):全文檢索無(wú)差錯(cuò),準(zhǔn)確率可達(dá)99%,且文本層和圖像層一一對(duì)應(yīng)。缺點(diǎn):效率極低、成本極高、因?yàn)檫M(jìn)行了版式還原,所以原真率不到98%,而且存儲(chǔ)空間很大而致瀏覽速度降

22、低。適應(yīng)范圍:、所載信息珍貴且使用頻率很高的資源。、數(shù)字化項(xiàng)目資金預(yù)算充裕且項(xiàng)目實(shí)施時(shí)間寬松的資源。、有很好的硬件環(huán)境支持的數(shù)字化項(xiàng)目。六、總質(zhì)檢1. 對(duì)掃描處理完成后的圖像頁(yè)進(jìn)行檢驗(yàn),對(duì)檔案拆分、掃描、修正、去污、插圖、照片的處理以及文本和圖像頁(yè)的匹配等質(zhì)量進(jìn)行全面檢驗(yàn),對(duì)于質(zhì)量達(dá)不到要求的進(jìn)行重掃、補(bǔ)掃等操作。2. 對(duì)文本域錄入與文本錄入域的標(biāo)引、文件的頁(yè)號(hào)和頁(yè)數(shù)進(jìn)行對(duì)比,對(duì)掃描前圖像頁(yè)的標(biāo)引與掃描后的圖像頁(yè)的編號(hào)與頁(yè)數(shù)進(jìn)行對(duì)比,發(fā)現(xiàn)不合格的登記清單重新處理。3. 對(duì)圖像質(zhì)量的檢查,確保圖像版面清晰,干凈,大小一致,方向一致。4主要質(zhì)檢標(biāo)準(zhǔn):4.1加工后的電子影像在總數(shù)量、完整性、清晰度上

23、與源文件保持一致。4.2案卷著錄、按文件的屬性著錄數(shù)據(jù)庫(kù)字段,檢查“文件路徑”字段與文件實(shí)際存儲(chǔ)位置一致,差錯(cuò)率控制在千分之五以內(nèi)。4.3電子影像檔案件信息定義數(shù)據(jù)差錯(cuò)率控制在百分之二以內(nèi)。4.4電子影像檔案卷內(nèi)頁(yè)碼差錯(cuò)率控制在千分之一以內(nèi)。4.5每頁(yè)電子影像左右端正度控制在三度以內(nèi)。4.6電子影像漏掃,壓邊率控制在千分之一以內(nèi)。4.7電子檔案與條目數(shù)據(jù)的掛接一致,差錯(cuò)率小于千分之一以內(nèi)。七、批量掛接1 掃描處理后的圖像成品,按年度、機(jī)構(gòu)上傳至檔案專用服務(wù)器,利用檔案管理軟件中的對(duì)應(yīng)掛接功能將掃描圖像信息與錄入到檔案管理軟件系統(tǒng)中的目錄進(jìn)行對(duì)應(yīng)掛接,確保目錄與原文的一一對(duì)應(yīng)。2 掛接到檔案管理

24、系統(tǒng)中區(qū),進(jìn)行再次的成品驗(yàn)收。八、還卷及數(shù)據(jù)備份提交1原始檔案還原工作嚴(yán)格按照國(guó)家檔案局規(guī)定的相關(guān)標(biāo)準(zhǔn)和實(shí)際情況進(jìn)行有序的還原,將還原的檔案資料逐卷精心檢查,確實(shí)沒(méi)有落頁(yè)、掉頁(yè)、折頁(yè)等問(wèn)題后再歸還檔案管理人員,經(jīng)雙方仔細(xì)核實(shí)無(wú)誤后,在還卷交接單上簽字確認(rèn)。2在數(shù)據(jù)化加工過(guò)程中的各項(xiàng)工作記錄,在數(shù)據(jù)轉(zhuǎn)移完成后、提交給用戶方。3為了有效地保護(hù)數(shù)據(jù),因此建立數(shù)據(jù)備份制度,在數(shù)字化加工項(xiàng)目工作結(jié)束,并經(jīng)用戶在終驗(yàn)報(bào)告上簽字確認(rèn)后,將通過(guò)驗(yàn)收后的數(shù)據(jù)利用用戶軟件的光盤(pán)制作功能刻錄成光盤(pán),刻錄到dvd光盤(pán)中,刻錄完成后再制作一個(gè)光盤(pán)備份,或用移動(dòng)硬盤(pán)等存儲(chǔ)介質(zhì),將所有成品數(shù)據(jù)備份,提交給用戶。4刻錄光盤(pán)要

25、求:4.1 、光盤(pán)制作兩份,制作成檔案數(shù)據(jù)格式為多頁(yè)tiff 的光盤(pán)單盤(pán)調(diào)閱。4.2 、同一份文件不跨越二片dvd 片號(hào)(同一份文件頁(yè)數(shù)需在同一dvd 內(nèi))4.3 、電子檔案存在于符合標(biāo)準(zhǔn)的單片包裝光盤(pán)4.4 、光盤(pán)標(biāo)示光盤(pán)編號(hào),單片包裝盒上注明光盤(pán)內(nèi)主要信息4.5 、在光盤(pán)刻錄完成后,與硬盤(pán)系統(tǒng)中電子檔案進(jìn)行一次比對(duì),確保檔案資料無(wú)遺漏及正確性。4.6 、制作光盤(pán)人員對(duì)于所有光盤(pán)序號(hào)進(jìn)行標(biāo)記,并提交相應(yīng)表格。第三節(jié)質(zhì)量控制方案和保證措施項(xiàng)目加工總體質(zhì)量目標(biāo):保證合格、爭(zhēng)創(chuàng)優(yōu)良!一、加工質(zhì)量保障措施1嚴(yán)格遵照?qǐng)?zhí)行我方簽定的不分包、轉(zhuǎn)包三峽大學(xué)檔案數(shù)字化項(xiàng)目承諾書(shū) ,避免項(xiàng)目轉(zhuǎn)包、分包引起的管理

26、混亂和質(zhì)量風(fēng)險(xiǎn)。2嚴(yán)格按照我方制定的人員和設(shè)備投入計(jì)劃進(jìn)場(chǎng)加工,確保人員設(shè)備供應(yīng),為項(xiàng)目進(jìn)度和質(zhì)量提供保障。3在該項(xiàng)目加工過(guò)程中,我方所有現(xiàn)場(chǎng)加工人員均受我公司數(shù)字化作業(yè)人員質(zhì)量考核制度的約束,并承擔(dān)相應(yīng)獎(jiǎng)罰結(jié)果。二、多環(huán)節(jié),多層次的質(zhì)量檢查體系。1. 對(duì)檔案簽收和屬性數(shù)據(jù)錄入的質(zhì)量檢查,主要內(nèi)容:檔案簽收的準(zhǔn)確性,完整性和即時(shí)性;數(shù)據(jù)內(nèi)容齊全,屬性數(shù)據(jù)輸入準(zhǔn)確;與數(shù)據(jù)校對(duì)的檔案交接。2. 對(duì)數(shù)據(jù)校對(duì)處理的質(zhì)量檢查, 主要內(nèi)容:校對(duì)后的數(shù)據(jù)內(nèi)容齊全, 正確;紙質(zhì)檔案實(shí)體完整,還案及時(shí)無(wú)誤。3. 對(duì)數(shù)據(jù)遷移的質(zhì)量檢查,主要內(nèi)容:遷移后的數(shù)據(jù)的完整性準(zhǔn)確性;對(duì)數(shù)據(jù)進(jìn)行組合查詢并且結(jié)果正確;對(duì)數(shù)據(jù)進(jìn)

27、行匯總統(tǒng)計(jì)并輸出標(biāo)準(zhǔn)表格,試運(yùn)行無(wú)死機(jī)現(xiàn)象。4. 在完成以上每個(gè)環(huán)節(jié)后,檢查人員將其數(shù)據(jù)再次進(jìn)行一遍全面的復(fù)查,尤其對(duì)檢查記錄單上更正后的錯(cuò)誤進(jìn)行仔細(xì)的檢查,確保掃描得來(lái)的數(shù)據(jù)與源文件內(nèi)容完全一致。5. 實(shí)施項(xiàng)目負(fù)責(zé)人對(duì)成品數(shù)據(jù)進(jìn)行百分之十的抽查,在抽查時(shí)將該查數(shù)據(jù)的年度、保管期限、全宗號(hào)、卷號(hào)、卷內(nèi)順序號(hào)等目錄信息是否準(zhǔn)確無(wú)誤,再對(duì)獲取圖像數(shù)據(jù)的亮度、歪斜、是否錯(cuò)頁(yè)等方面進(jìn)行抽查,如有不合格的數(shù)據(jù)及時(shí)進(jìn)行統(tǒng)計(jì)和修正,確保最終數(shù)據(jù)的準(zhǔn)確無(wú)誤。三、階段性驗(yàn)收與終驗(yàn)相結(jié)合的嚴(yán)格驗(yàn)收程序是質(zhì)量控制的終極保障。階段驗(yàn)收?qǐng)?bào)告項(xiàng)目名稱項(xiàng)目編號(hào)報(bào)告人時(shí)間項(xiàng)目負(fù)責(zé)人所處階段項(xiàng)目狀態(tài)參數(shù)監(jiān)控情況項(xiàng)目狀態(tài)計(jì)劃情況

28、實(shí)際情況偏差掃描糾正措施項(xiàng)目進(jìn)度項(xiàng) 目 工 作 量(人時(shí))項(xiàng)目規(guī)模項(xiàng) 目 外 工 作量 情 況 描 述( 非 項(xiàng) 目 工作)其他工作中遇到問(wèn)題及困難:需要用戶支持與配合:用戶意見(jiàn):用戶簽字:簽字日期:終驗(yàn)報(bào)告項(xiàng)目名稱項(xiàng)目編號(hào)報(bào)告人時(shí)間項(xiàng)目負(fù)責(zé)人第()階段本階段項(xiàng)目完成情況驗(yàn)收項(xiàng)目完成情況備注檔案整理(卷)檔案掃描( a4 頁(yè), a3 頁(yè),其他頁(yè))圖像處理(卷頁(yè))索引目錄錄入(條)全文 ocr 所有報(bào)表輸出(卷)資料裝訂(卷,件)內(nèi)部驗(yàn)收(頁(yè))目錄與圖像文件的銜接數(shù)據(jù)是否上傳到服務(wù)器數(shù)據(jù)備份本階段驗(yàn)收結(jié)論:雙方于年月日,進(jìn)行了檔案數(shù)字化工作的第階段的成品驗(yàn)收,乙方所提供的數(shù)據(jù)基本滿足甲方的要求,

29、甲方同意通過(guò)驗(yàn)收,進(jìn)入下一個(gè)工作階段。用戶簽字:日期:項(xiàng)目經(jīng)理簽字:日期:第四節(jié)安全保密控制一、為了確保采集數(shù)據(jù)不外泄,在開(kāi)始進(jìn)行數(shù)字化加工后,我公司將不允許加工人員攜帶任何存儲(chǔ)介質(zhì)進(jìn)出加工現(xiàn)場(chǎng)。二、為避免采集數(shù)據(jù)在硬盤(pán)上的物理磁道上被還原外泄,我公司將使用乙方提供的電腦用于數(shù)據(jù)采集作業(yè)。三、電腦上所有的可以讀寫(xiě)存儲(chǔ)介質(zhì)的接口,自進(jìn)場(chǎng)之日起即貼上封條,直到工程完工。四、為避免數(shù)據(jù)采集過(guò)程中數(shù)據(jù)通過(guò)網(wǎng)絡(luò)外泄,我公司在加工期間將關(guān)閉外網(wǎng),只使用局域網(wǎng)完成數(shù)字化作業(yè)。五、為了建立并嚴(yán)格落實(shí)安全保密制度,保證檔案資料的安全保密性,做到絕對(duì)不外泄任何信息。保密協(xié)議將同加工合同同時(shí)簽定并成為合同不可分割的一部分。見(jiàn)附件。附件:保密協(xié)議保密協(xié)議甲方:地址:乙方:武漢 xx 數(shù)字科技有限公司地址:武漢市武昌區(qū)街道口阜華大廈b 座 1702 鑒于甲方委托乙方承擔(dān)其檔案資料的數(shù)字化加工服務(wù),乙方可能接觸到甲方某些非公開(kāi)的,涉密的文件、檔案和資料,為了維護(hù)甲方資料的安全,保守國(guó)家秘密,乙方同意在整理

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論