版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、 采用掃描儀等設(shè)備對紙質(zhì)檔案進行數(shù)字化加工,使其轉(zhuǎn)化為存儲在磁帶、 磁盤、光盤等載體上的數(shù)字圖像,并按照紙質(zhì)檔案的內(nèi)在聯(lián)系,建立起目錄 數(shù)據(jù)與數(shù)字圖像關(guān)聯(lián)關(guān)系的處理過程。 采用掃描儀或數(shù)碼相機等數(shù)碼設(shè)備對紙質(zhì)檔案進行數(shù)字化加工,將其轉(zhuǎn) 化為存儲在磁帶、磁盤、光盤等載體上并能被計算機識別的數(shù)字圖像或數(shù)字 文本的處理過程(DAT/31-2005)。 一、確保傳統(tǒng)載體檔案實體安全一、確保傳統(tǒng)載體檔案實體安全 檔案數(shù)字化后,檔案利用以數(shù)字資源(電子目錄+掃描圖像)為主, 檔案實體可以少動或者不動,從而大大減少對檔案實體的各種人為損害 或自然侵害。 二、提高檔案現(xiàn)代化管理水平二、提高檔案現(xiàn)代化管理水平
2、檔案數(shù)字化前,必須進行手工檢索紙質(zhì)目錄,逐卷逐件查找檔案內(nèi)容, 數(shù)字化后,利用檔案管理軟件,可以實時檢索檔案電子目錄,通過OCR技術(shù), 可以實現(xiàn)檔案的全文檢索,檔案的查全率查準(zhǔn)率得到極大的提升。同時檔案 數(shù)字化也可以帶動檔案基礎(chǔ)工作的全面完成,使檔案管理狀況得到全面改善, 是檔案管理水平得到全面提升。 三、降低工作強度,提升工作效率三、降低工作強度,提升工作效率 檔案數(shù)字化后,閱覽、編研、舉辦展覽等利用檔案實體的工作,都不需 要到庫房提調(diào)檔案,也不用檔案歸還入庫時逐件逐頁清點,降低了檔案管理 工作的強度,避免了反復(fù)印制資料而造成的紙張和人員的浪費。檔案實體封 存后,節(jié)省很多檔案的日常管理工作,
3、提升了工作效率,同時檔案由于年代 久遠(yuǎn),表面附著大量有毒有害灰塵,越老的檔案有毒有害灰塵越多,檔案封 存減少了與檔案實體的接觸,側(cè)面保護了檔案工作者的健康。 。 數(shù)字檔案室建設(shè)應(yīng)當(dāng)遵循“資源為先,標(biāo)準(zhǔn)規(guī)范,整體推進,確 保安全”的原則,資源建設(shè)是數(shù)字檔案室建設(shè)的根本。數(shù)字檔案室應(yīng) 堅持“資源為王”,著眼于數(shù)字檔案資源建設(shè),各級檔案室的現(xiàn)存檔 案,目前大多還是傳統(tǒng)載體而非數(shù)字形態(tài),因此,數(shù)字檔案室建設(shè)的 首要任務(wù),就是要把傳統(tǒng)載體的檔案數(shù)字化,而絕大多數(shù)傳統(tǒng)載體檔 案均為紙質(zhì)檔案。 數(shù)字檔案室:數(shù)字檔案室:是指機關(guān)在履行職能過程中,運用現(xiàn)代信息技術(shù)對 電子檔案和傳統(tǒng)載體檔案數(shù)字副本等數(shù)字檔案信息
4、進行采集、整理、 存儲、管理,并通過不同類型網(wǎng)絡(luò)提供共享利用和有限公共檔案信息 服務(wù)的檔案信息集成管理平臺。 5 數(shù)字檔案資源 具有憑證、查考和具有憑證、查考和 保存價值并歸檔保保存價值并歸檔保 存的電子文件。電存的電子文件。電 子檔案應(yīng)真實、可子檔案應(yīng)真實、可 靠、完整、可用??俊⑼暾?、可用。 電子檔案電子檔案 傳統(tǒng)載體檔案經(jīng)過傳統(tǒng)載體檔案經(jīng)過 數(shù)字化處理后形成數(shù)字化處理后形成 的數(shù)字圖像。應(yīng)保的數(shù)字圖像。應(yīng)保 證其一致性、完整證其一致性、完整 性、可用性。性、可用性。 檔案數(shù)字化檔案數(shù)字化 數(shù)字檔案資源數(shù)字檔案資源 6 數(shù)字檔案資源應(yīng)用分類數(shù)字檔案資源應(yīng)用分類 檔案前 處理 檔案數(shù) 據(jù)鑒定
5、 電子文 件采集 目錄數(shù) 據(jù)建庫 發(fā)布利 用 生成電 子檔案 檔案生 成數(shù)字 圖像 數(shù)據(jù)挖 掘 數(shù)據(jù)檢 查及整 理 數(shù)據(jù)檢 查及整 理掛接 數(shù)字化 成果接 收 實時歸 檔 數(shù)據(jù)分 級存儲 管理 (在線/離線) 歸檔數(shù) 據(jù)管理 歸檔數(shù) 據(jù)管理 室藏 檔案 數(shù)字 化 電 子 檔 案 發(fā) 布 利 用 數(shù)據(jù)安 全防護 館(室)藏檔案數(shù)字化工作是數(shù)字檔案館(室)資源體系建設(shè)的重要手段 和方式,國家檔案局對檔案數(shù)字化工作十分重視。 2002年年 國家檔案局中央檔案館關(guān)于印發(fā)全國檔案信息化建設(shè)實施綱要 (檔發(fā)【2002】8號)的通知中要求各地綜合檔案館在“十五”期間以檔案信 息資源建設(shè)為核心,以擴大檔案信息
6、資源開發(fā)利用為目標(biāo),加強檔案目錄數(shù)據(jù) 庫建設(shè),積極推進檔案全文數(shù)據(jù)庫和多媒體數(shù)據(jù)庫建設(shè),以現(xiàn)實需要為前提, 分階段、分步驟實施檔案數(shù)字化進程。 2010年年 國家檔案局印發(fā)數(shù)字檔案館建設(shè)指南,指出傳統(tǒng)載體檔案數(shù)字 化是現(xiàn)階段數(shù)字檔案資源建設(shè)的一個重要途徑。應(yīng)當(dāng)統(tǒng)籌規(guī)劃,分步實施。 應(yīng)當(dāng)通過數(shù)字化工作,對館藏檔案進行全面的梳理。如果對館藏檔案無法一次 性全面數(shù)字化,可以按照特殊載體優(yōu)先、重要程度優(yōu)先、共享性強優(yōu)先等原則 分布實施。 2013年年10月月 時任國家檔案局局長楊冬權(quán)在全國數(shù)字檔案館(室)建設(shè)推 進會上的講話,要求數(shù)字檔案館(室)建設(shè)的首要任務(wù),就是要把紙質(zhì)檔案、 音像檔案等傳統(tǒng)載體的
7、檔案數(shù)字化。不完成這項任務(wù),檔案館(室)就不能實 現(xiàn)轉(zhuǎn)型升級,就必然要在大數(shù)據(jù)時代落伍,就肯定不能跨進現(xiàn)代化的門檻。 (DA/T31-2005) 國家檔案局出臺了紙質(zhì) 檔案數(shù)字化技術(shù)規(guī)范( DA/T31-2005) (征求意見稿) 國家下發(fā)了紙質(zhì)檔 案數(shù)字化技術(shù)規(guī)范 (征求意見稿) (DA/T31-2017) 2018年1月1日正式實施 2015年年2017年年2005年年 Step 4Step 4 Step 3Step 3 Step 2Step 2 Step 1Step 1 檔案數(shù)據(jù)挖掘 檔案全文識別處理 檔案掃描和文件級著錄 檔案掃描和案卷級著錄 檔案數(shù)字化的四個層級 檔案掃描及案卷級著錄
8、檔案掃描及案卷級著錄 檔案掃描及案卷級著錄檔案掃描及案卷級著錄 檔案掃描及案卷級著錄檔案掃描及案卷級著錄 檔案掃描及文件級著錄檔案掃描及文件級著錄 檔案掃描及文件級著錄檔案掃描及文件級著錄 檔案全文識別處理檔案全文識別處理 檔案全文識別處理檔案全文識別處理 檔案數(shù)據(jù)挖掘檔案數(shù)據(jù)挖掘 總體架構(gòu)示意圖 文本 數(shù)據(jù) 挖掘算法 本體 人物 時間 地點 事件 特點 元數(shù)據(jù) 關(guān)聯(lián) 網(wǎng)絡(luò) 地圖 展示 檔案數(shù)據(jù)挖掘檔案數(shù)據(jù)挖掘 胡適(1891年12月17日-1962年2月24日),原 名嗣穈,學(xué)名洪骍,字希疆,筆名胡適,字適之。 著名思想家、哲學(xué)家?;罩菘兿耍猿珜?dǎo)“白話 文、領(lǐng)導(dǎo)新文化運動聞名于世?!庇啄?/p>
9、就讀于家鄉(xiāng) 私塾,19歲考取庚子賠款官費生,留學(xué)美國,師從 哲學(xué)家約翰杜威,1917年夏回國,受聘為北京大 學(xué)教授。 民間傳說中,唐末,天下大亂,各路英雄爭雄,逐鹿于中原。黃巢農(nóng)民起 義異軍突起,天秸元年(904)八月,朱全忠殺唐昭宗,第二年唐昭宗的遺腹子李 昌翼出生,在徽州婺源考水被一個叫胡三的人收為義子,改姓胡。昌翼長大后, 于五代后唐同光三年(925)中明經(jīng)科及第,故其后裔稱明經(jīng)胡氏,因其是李姓后 裔,明經(jīng)胡氏忌與李氏通婚。明經(jīng)胡氏人才輩出,最著名的有二支,即宋元時 期的婺源胡炳文家族和近代績溪胡適、胡雪巖家族。 這些數(shù)據(jù)講了什么 樣的故事? 胡李不通婚的家規(guī) 是真的嗎? 從唐末至明初,
10、真 的沒有一人娶過姓 李的姑娘! 如果你是上川明經(jīng) 胡氏的后人,娶一 位姓曹的女紙吧 男性成員8915人 配偶共4733人 基于數(shù)據(jù)統(tǒng)計分析知識的可視化 檔案數(shù)據(jù)挖掘檔案數(shù)據(jù)挖掘 適用于采用掃描設(shè)備對紙質(zhì)檔案的數(shù)字化加工過程的管理 檔案數(shù)字化工作原則:檔案數(shù)字化工作原則: 遵循符合國家法律法規(guī)的原則 價值性原則 滿足社會利用的原則 過程管理原則 保證數(shù)字化質(zhì)量原則 保證檔案及檔案信息安全原則 檔案數(shù)字化工作流程:檔案數(shù)字化工作流程: 確定數(shù)字化對象與制定總體方案 檔案出庫 數(shù)字化前處理 建立數(shù)據(jù)庫 檔案掃描 圖像處理 檔案入庫 數(shù)字化成果驗收 確定數(shù)字化對象與制定總體方案確定數(shù)字化對象與制定總
11、體方案 確定數(shù)字化對象與制定總體方案要從機構(gòu)及人員、基礎(chǔ)設(shè)施、制定工 作方案、工作流程控制、管理制度、工作文件管理、檔案數(shù)字化外包等方 面具體考慮。 (一)機構(gòu)及人員(一)機構(gòu)及人員 應(yīng)建立完善的紙質(zhì)檔案數(shù)字化工作組織機構(gòu),對紙質(zhì)檔案數(shù)字化工作 進行統(tǒng)籌規(guī)劃、組織實施、協(xié)調(diào)管理、安全保障、技術(shù)保障、監(jiān)督檢查、 成果驗收等,確保紙質(zhì)檔案數(shù)字化工作的順利開展。 應(yīng)配備具備相應(yīng)素質(zhì)的管理和技術(shù)人員。通過科學(xué)規(guī)范的管理制度對 此項工作進行規(guī)范化管理。為加強紙質(zhì)檔案數(shù)字化工作的安全保障,應(yīng)加 強對外聘工作人員的審核。 確定數(shù)字化對象與制定總體方案確定數(shù)字化對象與制定總體方案 (二)基礎(chǔ)設(shè)施(二)基礎(chǔ)設(shè)施
12、 應(yīng)配備專用加工場地,要求布局合理,要有檔案存放、數(shù)字化前處理、 檔案目錄建庫、檔案掃描、圖像處理、質(zhì)量檢查、后期整理等工作區(qū)域。 場地要滿足檔案實體的保護要求。應(yīng)配備可覆蓋全部場地的防火、防水、 防有害生物、防盜報警、視頻監(jiān)控等安全管理系統(tǒng)。 應(yīng)配備掃描儀、計算機等檔案數(shù)字化設(shè)施設(shè)備,確保設(shè)施設(shè)備安全、先 進,能夠滿足紙質(zhì)檔案數(shù)字化工作的需要。 (三)制定工作方案(三)制定工作方案 工作方案應(yīng)綜合考慮確定數(shù)字化對象、數(shù)字化目的、檔案狀況、設(shè)備情 況、是否外包、費用等,確保紙質(zhì)檔案數(shù)字化工作達(dá)到預(yù)期目標(biāo)。 工作方案中應(yīng)包括工作目標(biāo)、工作內(nèi)容、成本核算、技術(shù)方法和主要技 術(shù)指標(biāo)、驗收依據(jù)、人員安
13、排、責(zé)任分工、進度要求、安全管理措施、外包 要求等內(nèi)容。 工作方案應(yīng)經(jīng)相關(guān)領(lǐng)導(dǎo)審批后嚴(yán)格執(zhí)行。 確定數(shù)字化對象:要考慮檔案的珍貴程度、開放程度、利用率、亟待搶 救程度、數(shù)字化資金情況等因素。 確定數(shù)字化對象與制定總體方案確定數(shù)字化對象與制定總體方案 (四)工作流程控制(四)工作流程控制 制定的工作流程和各環(huán)節(jié)操作規(guī)范等,可對數(shù)字化全過程進行有效的控 制。比如,及時對檔案掃描、圖像處理等各個環(huán)節(jié)產(chǎn)生的工作數(shù)據(jù)進行備份; 應(yīng)建立完善的問題反饋機制,對紙質(zhì)檔案數(shù)字化工作過程中發(fā)現(xiàn)的問題及時 進行反饋和完善,確保數(shù)字化成果質(zhì)量。 (五)管理制度(五)管理制度 要求從崗位管理、人員管理、場地管理、設(shè)備管
14、理、數(shù)據(jù)管理等方面制 定科學(xué)、規(guī)范的管理制度,并在數(shù)字化工作過程中嚴(yán)格執(zhí)行,以便使紙質(zhì)檔 案數(shù)字化工作質(zhì)量和檔案安全得以有效保障。 崗位管理制度崗位管理制度主要規(guī)定數(shù)字化工作各崗位的目標(biāo)和職責(zé),形成明確的崗 位業(yè)務(wù)流程規(guī)范、考核標(biāo)準(zhǔn)、獎懲辦法等;人員管理制度人員管理制度主要對人員的安全 保密、日常行為、外聘人員信息審核及管理、非工作人員來訪登記等進行規(guī) 范;場地管理制度場地管理制度主要對工作場地內(nèi)基礎(chǔ)設(shè)施及環(huán)境、網(wǎng)絡(luò)、監(jiān)控設(shè)施、現(xiàn) 場物品及證件等的管理進行規(guī)范;設(shè)備管理制度設(shè)備管理制度主要對數(shù)字化工作各環(huán)節(jié)涉 及的全部設(shè)備的管理進行規(guī)范,確保設(shè)備安全、科學(xué)、高效運行;數(shù)據(jù)管理數(shù)據(jù)管理 制度制度
15、主要對數(shù)字化各環(huán)節(jié)所產(chǎn)生的數(shù)據(jù)的管理進行規(guī)范。 確定數(shù)字化對象與制定總體方案確定數(shù)字化對象與制定總體方案 (六)工作文件管理(六)工作文件管理 應(yīng)針對數(shù)字化全過程建立完善的管理工作文件,以此加強對數(shù)字化工作 的管理和監(jiān)控。主要包括數(shù)字化工作方案、紙質(zhì)檔案數(shù)字化審批書、檔案出 入庫交接單、紙質(zhì)檔案數(shù)字化流程單、質(zhì)量檢查情況登記單、數(shù)據(jù)驗收單、 驗收報告、數(shù)字化成果移交清單等。并要求在數(shù)字化工作各環(huán)節(jié)準(zhǔn)確、完整 地填寫各種工作表單。 采取數(shù)字化外包的,還應(yīng)包括項目招標(biāo)文件、投標(biāo)文件、中標(biāo)通知書、 項目合同、保密協(xié)議等。 對數(shù)字化工作各環(huán)節(jié)形成的這些工作文件包括表單等,應(yīng)加強管理,檔 案數(shù)字化工作完
16、成后要進行整理、歸檔、移交。 確定數(shù)字化對象與制定總體方案確定數(shù)字化對象與制定總體方案 (七)檔案數(shù)字化外包(七)檔案數(shù)字化外包 檔案數(shù)字化項目實施過程中,數(shù)字化實施單位應(yīng)指派本單位工作人員參 與檔案數(shù)字化工作,進行數(shù)字化工作的監(jiān)督、指導(dǎo)。也可采用第三方監(jiān)理協(xié) 助完成質(zhì)量監(jiān)控、進度監(jiān)控、投資監(jiān)控、安全監(jiān)控和協(xié)調(diào)溝通等方面的工作。 數(shù)字化實施單位應(yīng)從企業(yè)性質(zhì)、股東組成、安全保密、企業(yè)規(guī)模、注冊 資金情況等方面嚴(yán)格審查數(shù)字化企業(yè)的相關(guān)資質(zhì);按照GB/T 20530-2006第5 章的要求考察數(shù)字化企業(yè)的技術(shù)能力;從規(guī)章制度的建立健全程度等方面考 查企業(yè)的管理能力;遵照政府采購法相關(guān)要求確定紙質(zhì)檔案
17、數(shù)字化項目承擔(dān) 企業(yè)。 2014年12月,國家檔案局發(fā)布了檔案數(shù)字化外包安全管理規(guī)范,該 規(guī)范從檔案部門的安全管理、數(shù)字化服務(wù)機構(gòu)的安全管理、數(shù)字化場所的安 全管理、數(shù)字化加工設(shè)備、網(wǎng)絡(luò)環(huán)境與數(shù)據(jù)載體的安全管理、檔案實體的安 全管理、檔案數(shù)字化成果移交接收與設(shè)備處理的安全管理7個方面作了具體的 要求。 檔案保管部門應(yīng)按照紙質(zhì)檔案數(shù)字化工作方案確定的數(shù)字化對象開展檔 案調(diào)取、清點、登記等前期準(zhǔn)備工作,并提交檔案出庫申請,經(jīng)相關(guān)責(zé)任人 批準(zhǔn)后,嚴(yán)格按照檔案庫房管理規(guī)定為數(shù)字化對象辦理出庫相關(guān)手續(xù),并與 數(shù)字化部門共同清點無誤后,對檔案進行交接出庫。 紙質(zhì)檔案數(shù)字化過程中,應(yīng)設(shè)置距離數(shù)字化加工場所較
18、近的保管庫用以 臨時存放紙質(zhì)檔案,并對紙質(zhì)檔案的領(lǐng)取與歸還進行嚴(yán)格管理,認(rèn)真做好檢 查、清點、登記等工作,確保紙質(zhì)檔案的安全。 紙質(zhì)檔案數(shù)字化前處理是數(shù)字化工作的重點和關(guān)鍵,紙質(zhì)檔案數(shù)字化前 處理包括確定掃描范圍、編制頁號、拆除裝訂、規(guī)范目錄、技術(shù)修復(fù)等幾個 方面。 (一)確定掃描范圍(一)確定掃描范圍 紙質(zhì)檔案數(shù)字化工作應(yīng)特別注意保持紙質(zhì)檔案數(shù)字圖像的完整性,原則 上應(yīng)將確定為數(shù)字化對象的紙質(zhì)檔案全部掃描,不宜進行挑掃。對確定不需 掃描的,要在數(shù)字化結(jié)果中加上標(biāo)記。 (二)編制頁號(二)編制頁號 應(yīng)對沒有頁號或頁號不正確的檔案重新編制頁號。 應(yīng)在統(tǒng)一位置書寫頁號,且不壓蓋檔案內(nèi)容。頁號應(yīng)從“
19、1”開始連續(xù)編 制。 書寫頁號所使用的筆、墨等不應(yīng)破壞檔案原件或?qū)n案長期保存造成影 響。 應(yīng)將破損頁面、缺頁等特殊情況進行登記。 (四)拆除裝訂(四)拆除裝訂 應(yīng)以對紙質(zhì)檔案的保護為原則確定是否拆除裝訂。如需拆除裝訂物,應(yīng) 注意保護檔案不受損害,并對排列順序不準(zhǔn)確的檔案進行重排。特殊裝訂且 拆除裝訂后需恢復(fù)的檔案,在拆除裝訂物時應(yīng)采用拍照等方式記錄檔案原貌, 以便于恢復(fù)。 (三)目錄數(shù)據(jù)準(zhǔn)備(三)目錄數(shù)據(jù)準(zhǔn)備 紙質(zhì)檔案數(shù)字化過程中,應(yīng)進一步完善檔案原件的排列、編目等工作。 應(yīng)按照紙質(zhì)檔案基本整理單位對檔案進行精確劃分,同時,對照檔案原件對 目錄內(nèi)容進行修改、補充,為在后續(xù)工作中建立目錄數(shù)據(jù)庫
20、做好準(zhǔn)備。 需要在利用過程中特別處理的頁面,在目錄中進行標(biāo)識,并在后續(xù)工作 中采集入數(shù)據(jù)庫中,以便在利用時進行有針對性地處理。 (五)技術(shù)修復(fù)(五)技術(shù)修復(fù) 破損嚴(yán)重、無法直接進行掃描的檔案,應(yīng)先由專業(yè)技術(shù)人員采用科學(xué)的 技術(shù)方法進行技術(shù)修復(fù)。折皺不平影響掃描質(zhì)量的原件應(yīng)先進行壓平或熨平 等相應(yīng)處理。平整頁面時不得破壞檔案原件固有形態(tài),不得強行撕破檔案頁 面。 按照DAT 18-1999檔案著錄規(guī)則的要求確定檔案目錄數(shù)據(jù)的著錄項。 將紙質(zhì)檔案數(shù)字化前處理工作中對紙質(zhì)檔案目錄進行修改、補充的結(jié)果 錄入數(shù)據(jù)庫,形成準(zhǔn)確、完整的目錄數(shù)據(jù)。 數(shù)據(jù)庫選擇應(yīng)考慮可轉(zhuǎn)換為通用數(shù)據(jù)格式,以便于數(shù)據(jù)交換。 數(shù)據(jù)
21、庫結(jié)構(gòu)的設(shè)計應(yīng)特別注意保持檔案的內(nèi)在聯(lián)系,有利于紙質(zhì)檔案數(shù) 字化成果的管理和利用。 可采用計算機自動校對與人工校對相結(jié)合的方式,對目錄數(shù)據(jù)的質(zhì)量進 行檢查,包括著錄項目的完整性、著錄內(nèi)容的規(guī)范性和準(zhǔn)確性等。發(fā)現(xiàn)不合 格的數(shù)據(jù)應(yīng)及時進行修改。 (一)基本要求(一)基本要求 檔案掃描應(yīng)根據(jù)紙質(zhì)檔案原件實際情況、數(shù)字化目的、數(shù)字化規(guī)模、計 算機網(wǎng)絡(luò)和存儲條件等選擇相應(yīng)的掃描設(shè)備,和進行相關(guān)參數(shù)的設(shè)置和調(diào)整。 參數(shù)的設(shè)置和調(diào)整應(yīng)保證掃描后數(shù)字圖像清晰、完整、不失真,圖像效果最 接近檔案原貌。 (二)掃描設(shè)備(二)掃描設(shè)備 掃描設(shè)備的選擇應(yīng)特別注意對檔案實體的保護,盡量采用對檔案實體破 壞性小的掃描設(shè)備
22、進行數(shù)字化。 超出所使用掃描儀掃描尺寸的檔案可采用更大幅面掃描儀進行掃描,也 可以采用小幅面掃描儀分幅掃描后進行圖像拼接的方式處理。分幅掃描時, 相鄰圖像之間應(yīng)留有足夠的重疊,并且采用標(biāo)板等方式明確說明分幅方法; 若后期采用軟件自動拼接的方式,重疊尺寸建議不小于單幅圖像對應(yīng)原件尺 寸的1/3。 對于極其珍貴且尺寸不規(guī)則的檔案,為方便直觀顯示原件大小,可采用標(biāo) 板、標(biāo)尺等方式標(biāo)識原件大小等信息。 應(yīng)遵循相關(guān)設(shè)備的使用規(guī)律進行定期維護、保養(yǎng)。 (三)掃描色彩模式(三)掃描色彩模式 掃描色彩模式的選擇,應(yīng)綜合考慮檔案原件情況、檔案數(shù)字化規(guī)模、計 算機網(wǎng)絡(luò)條件、存儲條件、利用目的等多種因素選擇掃描色彩
23、模式。為最大 限度保留檔案原件信息,建議采用彩色模式進行掃描。 (四)掃描分辨率(四)掃描分辨率 掃描分辨率的選擇,應(yīng)保證掃描后圖像清晰、完整,并綜合考慮數(shù)字圖 像后期利用方式等因素。 掃描分辨率應(yīng)不小于200dpi。如文字偏小、密集、清晰度較差時,建議 掃描分辨率不小于300dpi。 如有COM輸出、仿真復(fù)制、印刷出版等其他用途時,可根據(jù)需要調(diào)整掃描 分辨率。需要進行COM輸出的檔案,掃描分辨率建議不小于300 dpi;需要進 行高精度仿真復(fù)制的檔案,掃描分辨率建議不小于600 dpi;需要進行印刷出 版的檔案,可結(jié)合檔案幅面、印刷出版幅面、印刷精度要求等選擇合適的分 辨率。 (五)存儲格式
24、(五)存儲格式 紙質(zhì)檔案數(shù)字圖像長期保存格式為TIFF、JPEG或JPEG2000等通用格式, 圖像壓縮率的選擇可根據(jù)實際應(yīng)用的需求而定。 紙質(zhì)檔案數(shù)字圖像利用時,也可從網(wǎng)絡(luò)瀏覽速度、易操作性、存儲空間 占用等方面進行綜合考慮,將圖像轉(zhuǎn)換為OFD、PDF等其他格式。 同一批檔案應(yīng)采用相同的存儲格式。 (六)圖像文件命名(六)圖像文件命名 應(yīng)依據(jù)檔號為圖像文件命名,確保圖像文件名的唯一性。 掃描后的圖像存儲為單頁文件時,可按檔號與圖像流水號的組合對圖像 文件命名。 掃描后的圖像存儲為多頁文件時,可采用該檔案的檔號對圖像文件命名。 應(yīng)科學(xué)建立紙質(zhì)檔案數(shù)字副本的存儲路徑,確保數(shù)據(jù)掛接的準(zhǔn)確性。 (一
25、)圖像拼接(一)圖像拼接 對大幅面檔案進行分幅掃描形成的多幅圖像,應(yīng)進行拼接處理,合并成 一個完整的圖像,以保證檔案數(shù)字圖像的整體性。拼接時應(yīng)確保拼接處平滑 地融合,拼接后整幅圖像無明顯拼接痕跡。 (二)旋轉(zhuǎn)及糾偏(二)旋轉(zhuǎn)及糾偏 對不符合閱讀方向的圖像應(yīng)進行旋轉(zhuǎn)還原。 對出現(xiàn)偏斜的圖像應(yīng)進行糾偏處理,以達(dá)到視覺上基本不感覺偏斜為準(zhǔn)。 (三)裁邊(三)裁邊 如需對數(shù)字圖像進行裁邊處理,應(yīng)在距頁邊最外延至少2至3毫米處裁剪 數(shù)字圖像,不得裁掉紙質(zhì)檔案原有頁邊,包括破損、歪斜頁邊。 (四)去污(四)去污 如需去污處理,以去除在掃描過程中產(chǎn)生的污點、污線、黑邊等影響圖 像質(zhì)量的雜質(zhì);應(yīng)嚴(yán)格遵循展現(xiàn)檔
26、案原貌的原則,不得去除檔案頁面原有的 紙張褪變斑點、水漬、污點、裝訂孔等。 (五)圖像質(zhì)量檢查(五)圖像質(zhì)量檢查 在檢查時發(fā)現(xiàn)圖像不完整、無法清晰識別或圖像失真的,應(yīng)重新掃描。 對于漏掃、重掃、多掃等情況,應(yīng)及時糾正。 掃描圖像的排列順序與檔案原件不一致時,應(yīng)進行調(diào)整。 對圖像拼接、旋轉(zhuǎn)、糾偏、裁邊、去污等處理情況進行檢查,發(fā)現(xiàn)不符 合圖像質(zhì)量要求時,應(yīng)重新進行圖像處理。 應(yīng)借助相關(guān)軟件對數(shù)據(jù)庫中的目錄數(shù)據(jù)與其對應(yīng)的紙質(zhì)檔案數(shù)字圖像進 行掛接,以實現(xiàn)目錄數(shù)據(jù)與數(shù)字圖像的關(guān)聯(lián)。 逐條對掛接結(jié)果進行檢查,包括目錄數(shù)據(jù)與紙質(zhì)檔案數(shù)字圖像對應(yīng)的準(zhǔn) 確性、已掛接數(shù)字圖像與實際掃描數(shù)量的一致性、數(shù)字圖像是
27、否能正常打開 等,發(fā)現(xiàn)錯誤及時進行糾正。 (一)驗收方式(一)驗收方式 檔案部門應(yīng)成立專門的數(shù)字化成果驗收組對數(shù)字化成果進行驗收。 應(yīng)采用計算機自動檢驗與人工檢驗相結(jié)合的方式對紙質(zhì)檔案數(shù)字化成果進行 檢查驗收。 (二)驗收內(nèi)容(二)驗收內(nèi)容 紙質(zhì)檔案數(shù)字化成果包括數(shù)字圖像、檔案目錄數(shù)據(jù)、元數(shù)據(jù)、數(shù)字化工 作中產(chǎn)生的工作文件、存儲載體等。 應(yīng)對目錄數(shù)據(jù)進行驗收,主要包括數(shù)據(jù)庫中各條目的內(nèi)容、格式等的準(zhǔn) 確程度、必填項是否填寫等。 應(yīng)對元數(shù)據(jù)進行驗收,主要包括元數(shù)據(jù)元素的完整性和賦值規(guī)范性等。 應(yīng)對數(shù)字圖像進行驗收,主要包括數(shù)字化參數(shù)、存儲路徑、命名的準(zhǔn)確 性、圖像的完整性、排列順序的準(zhǔn)確性、圖像質(zhì)量等。 應(yīng)對數(shù)據(jù)掛接進行驗收,主要包括目錄數(shù)據(jù)與其對應(yīng)的數(shù)字圖像的掛接的準(zhǔn) 確性等。 應(yīng)對工作文件進行驗收,主要包括工作文件的完整性、規(guī)范性等。 應(yīng)對存儲載體進行驗收,主要包括載體的可用性、有無病毒等。 (三)驗收指標(biāo)(三)驗收指標(biāo) 能夠采用計算機自動檢驗的項目應(yīng)采用計算機自動檢驗的方式進行100% 檢驗,檢驗合格率應(yīng)為100%。對于無法用計算機自動檢驗的項目,可根據(jù)情 況以件或卷為單位采用抽檢的方式進行人工檢驗。抽檢比率不得低于5%,對 于數(shù)據(jù)庫條目與數(shù)字圖像內(nèi)容對應(yīng)的準(zhǔn)確性,抽檢合格率應(yīng)為100%,其他內(nèi) 容的抽檢合格率應(yīng)不低于95%。 (四)驗收指標(biāo)(四)驗收指標(biāo) 每批紙質(zhì)檔案數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 共情領(lǐng)導(dǎo)力-數(shù)字化時代智能組織管理的新挑戰(zhàn)
- 視頻安全課件教學(xué)課件
- ESD培訓(xùn)課件教學(xué)課件
- 二年級數(shù)學(xué)計算題專項練習(xí)1000題匯編集錦
- 餛飩店勞務(wù)合同(2篇)
- 《數(shù)學(xué)物理方法》第2章測試題
- 南京工業(yè)大學(xué)浦江學(xué)院《外國稅制》2023-2024學(xué)年第一學(xué)期期末試卷
- 南京工業(yè)大學(xué)浦江學(xué)院《商務(wù)禮儀》2023-2024學(xué)年第一學(xué)期期末試卷
- 對外開放說課稿
- 《坐井觀天》說課稿
- 籃球社團教案
- 喪葬費家庭協(xié)議書范文范本
- 公司對公司走賬協(xié)議書范文模板
- 中小學(xué)119消防宣傳月活動方案3篇
- 部編版五年級語文上冊快樂讀書吧測試題及答案
- 中匯富能排矸場設(shè)計
- 大學(xué)生職業(yè)生涯規(guī)劃成品
- 人教版2024新版八年級全一冊信息技術(shù)第1課 開啟物聯(lián)網(wǎng)之門 教學(xué)設(shè)計
- 2024新人教版道法一年級上冊第二單元:過好校園生活大單元整體教學(xué)設(shè)計
- 2024年度中國AI大模型場景探索及產(chǎn)業(yè)應(yīng)用調(diào)研報告-2024
- DL∕T 796-2012 風(fēng)力發(fā)電場安全規(guī)程
評論
0/150
提交評論