




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
XX市檔案局檔案數(shù)字化加工項目第頁方正國際軟件有限公司方正國際軟件有限公司方正集團IT產(chǎn)業(yè)集信息技術(shù)之大成,提供IT服務、軟件、硬件和數(shù)據(jù)運營在內(nèi)的綜合解決方案。FounderGroup'sITsectorisaleaderininformationtechnology,providingcomprehensivesolutions,includingITservices,software,hardware,anddata北京市海淀區(qū)北四環(huán)西路52號中芯大廈18層10008018F,E-CenterBuilding,No52BeisihuanWestRoad,HaidianDistrict,Beijing,China100080,P.R.China.Tel:+861082179084
Fax:+861082179001XX市檔案局檔案數(shù)字化加工解決方案方正國際軟件有限公司
目錄1. 項目需求分析 41.1. 項目概述 41.2. 項目建設(shè)內(nèi)容 41.3. 項目服務標準 52. 現(xiàn)場加工管理方案 62.1. 現(xiàn)場人員管理 62.2. 現(xiàn)場設(shè)備管理 62.3. 實時監(jiān)控 73. 技術(shù)方案一:制作PDF格式文件 83.1. 生產(chǎn)流程配置 83.2. 資料提取和歸檔 93.3. 規(guī)范庫和工程信息庫建設(shè) 93.3.1. 規(guī)范庫建設(shè) 93.3.2. 工程信息庫建設(shè) 93.4. 數(shù)字化內(nèi)容組織 103.5. 檔案整理 113.6. 檔案掃描 123.7. 圖像處理 143.7.1. 圖像數(shù)據(jù)質(zhì)量檢驗 143.7.2. 圖像精細化處理 153.7.3. 補掃 163.8. 圖像版面分析和基礎(chǔ)信息提取 163.8.1. 工作內(nèi)容 163.8.2. 制作標準 163.8.3. 實現(xiàn)方法 163.8.4. 輸出數(shù)據(jù) 173.9. 全文識別和編改 173.9.1. 工作內(nèi)容 173.9.2. 制作標準 173.9.3. 實現(xiàn)方法 183.9.4. 輸出數(shù)據(jù) 203.10. 檔案目錄著錄 203.10.1. 數(shù)據(jù)格式選擇 203.10.2. 標引著錄 203.10.3. 錄入方式 213.10.4. 校對方式 213.11. 單層純圖像PDF文件生成 213.11.1. 工作內(nèi)容 213.11.2. 制作標準 213.11.3. 實現(xiàn)方法 213.11.4. 輸出數(shù)據(jù) 223.12. 雙層PDF文件生成 223.12.1. 工作內(nèi)容 223.12.2. 制作標準 223.12.3. 實現(xiàn)方法 233.12.4. 輸出數(shù)據(jù) 243.13. 數(shù)據(jù)存儲 243.13.1. 存儲格式 243.13.2. 存儲文件的命名 253.14. 數(shù)據(jù)掛接 253.15. 數(shù)據(jù)驗收 253.16. 數(shù)據(jù)備份 263.17. 數(shù)字化成果管理 273.18. 檔案歸檔 273.19. 成品數(shù)據(jù) 274. 技術(shù)方案二:只制作JPEG格式文件 294.1. 生產(chǎn)流程配置 294.2. 資料提取和歸檔 304.3. 規(guī)范庫和工程信息庫建設(shè) 304.4. 數(shù)字化內(nèi)容組織 304.5. 檔案整理 314.6. 檔案掃描 314.7. 圖像處理 314.8. 檔案目錄著錄 314.9. 數(shù)據(jù)存儲 314.9.1. 存儲格式 324.9.2. 存儲文件的命名 324.10. 數(shù)據(jù)掛接 324.11. 數(shù)據(jù)驗收 334.12. 數(shù)據(jù)備份 334.13. 數(shù)字化成果管理 344.14. 檔案歸檔 344.15. 成品數(shù)據(jù) 345. 項目服務方案 365.1. 服務承諾 365.2. 數(shù)據(jù)交付和驗收 365.2.1. 方正自檢部分 365.2.2. 合格數(shù)據(jù)驗收 375.3. 項目實施進度安排和資源配置 375.3.1. 工期要點 375.3.2. 本項目掃描儀等設(shè)備的配備數(shù)量(暫定) 385.3.3. 任務的劃分(暫定) 395.3.4. 掃描生產(chǎn)計劃(暫定) 405.4. 售后服務 405.4.1. 實時遠程技術(shù)支持服務 405.4.2. 熱線電話 415.4.3. 技術(shù)服務網(wǎng)站支持 415.4.4. 現(xiàn)場技術(shù)支持服務 415.5. 培訓 415.5.1. 數(shù)據(jù)管理維護培訓 415.5.2. 相關(guān)技術(shù)培訓 42附錄一:公司介紹 43(1)公司總體情況 43(2)方正數(shù)據(jù)處理中心介紹 44(3)公司資質(zhì)與榮譽 45(4)方正的優(yōu)勢 46附錄二:成功案例 48(1)國禮-中華數(shù)字書苑 48(2)新聞出版總署 49(3)國家圖書館地方志第四期數(shù)字化加工方案介紹 49(4)天一閣 50(5)民國期刊庫 50(6)國學要覽數(shù)據(jù)庫 51附錄三:方正博通數(shù)字檔案管理平臺 52(1)目前產(chǎn)品版本 52(2)方正博通數(shù)字檔案管理平臺軟件概述 52(3)方正博通應用領(lǐng)域 53(4)方正博通產(chǎn)品優(yōu)勢 63(5)產(chǎn)品運行環(huán)境 63(6)硬件部署建議 64項目需求分析項目概述XX市檔案局十分重視檔案資源建設(shè)。截止目前,館藏檔案全宗達到100個,計37637卷冊,排架長度560米,其中包括革命歷史檔案和建市以來的文書檔案、專業(yè)檔案、特色檔案、榮譽檔案及寄存檔案等。館藏檔案的來源,一是定期接收市直機關(guān)、團體及部分企業(yè)單位應進館檔案及撤銷單位檔案;二是收集、征集散存于社會的有深存價值的檔案;三是通過館際交流從其它檔案館復制的與XX市有關(guān)的檔案材料??蛻艉喗榭蛻艉喗闉檫M一步提高檔案服務水平,完善信息化建設(shè),XX市檔案局推出了本次“檔案數(shù)字化加工項目”的規(guī)劃建設(shè),通過項目的實施,實現(xiàn)一般人員基礎(chǔ)的調(diào)閱功能、研究機構(gòu)和管理部門深層次的調(diào)查研究和管理應用的功能,提高辦事效率和服務水平,具有十分重要的科技創(chuàng)新意義。項目建設(shè)內(nèi)容本項目建設(shè)目標是對XX市檔案局的檔案資料進行數(shù)字化應用開發(fā),接入方正提供的方正博通數(shù)字檔案管理平臺實現(xiàn)檔案數(shù)字化系統(tǒng)應用。關(guān)于方正博通數(shù)字檔案管理平臺的詳細介紹請參見附錄三:方正博通數(shù)字檔案管理平臺。方正提供數(shù)字檔案管理平臺方正提供數(shù)字檔案管理平臺針對本項目,方正提出兩種解決方案,一是通過圖像識別編改制作PDF格式文件,最終提供的成品數(shù)據(jù)有PDF格式文件、JPEG格式文件、XML文件及TIF文件;二是只制作JPEG格式文件,不提供PDF格式文件,最終提供的成品數(shù)據(jù)有JPEG格式文件、XML文件及TIF文件。提供兩種解決方案供選擇提供兩種解決方案供選擇項目服務標準檔案數(shù)字化的基本原則是使檔案信息資源準確、方便、快捷地提供利用,以滿足采購方對檔案利用的需求。檔案的數(shù)字化,必須符合國家檔案開放規(guī)定以及有關(guān)規(guī)定,如《中華人民共和國檔案行業(yè)標準DA/T31—2005檔案數(shù)字化技術(shù)規(guī)范》、《中華人民共和國檔案法》、《檔案著錄規(guī)則》(DA/T18—1999)、《檔案分類標引規(guī)則》(GB/T15418—94)等。加強檔案數(shù)字化各環(huán)節(jié)的安全保密管理機制,確保檔案原件和數(shù)字化檔案信息的安全。檔案數(shù)字化的各個環(huán)節(jié)均應進行詳細的登記,并及時整理、匯總,裝訂成冊,在數(shù)字化工作完成的同時建立起完整、規(guī)范的記錄?,F(xiàn)場加工管理方案本項目按照XX市檔案局保密要求采取現(xiàn)場加工的生產(chǎn)模式。XX市檔案局提供必要的辦公場所和電力等工作條件,方正提供人員、加工設(shè)備和軟件平臺,并按照XX市檔案局的保密、安全要求去進行設(shè)備處理及網(wǎng)絡布線,以及數(shù)字化加工中的軟硬件,網(wǎng)絡的維護工作。遵照CMMI和ISO/IEC27001-2005對信息安全管理的要求并結(jié)合XX市檔案局檔案加工保密特性,方正簽訂保密協(xié)議,在XX市檔案局的檔案數(shù)字化加工過程中履行信息安全保密責任,具體體現(xiàn)在人員管理、設(shè)備管理和實時監(jiān)控三方面?,F(xiàn)場人員管理現(xiàn)場服務人員資料在XX市檔案局備檔,辦理加工場地現(xiàn)場出入證明?,F(xiàn)場服務人員不得攜帶任何帶有存儲、照相功能的設(shè)備進入現(xiàn)場?,F(xiàn)場服務人員需簽訂XX市檔案局檔案數(shù)字化生產(chǎn)加工保密協(xié)議,明確工作人員的保密義務和責任?,F(xiàn)場設(shè)備管理XX市檔案局檔案數(shù)字化生產(chǎn)加工過程中現(xiàn)場所使用的掃描設(shè)備,按涉密設(shè)備進行管理和使用,不使用無保密保障的掃描設(shè)備。XX市檔案局檔案數(shù)字化生產(chǎn)加工所使用的計算機及其存儲介質(zhì),應當嚴格遵守計算機有關(guān)保密管理規(guī)定。服務區(qū)域內(nèi)網(wǎng)絡與其他網(wǎng)絡完全物理隔離。不得安裝具有無線互聯(lián)功能的硬件模塊和聯(lián)接無線鼠標、鍵盤等無線互聯(lián)的外圍設(shè)備。任務完成后,應當繼續(xù)按涉密計算機使用、管理,或者拆除硬盤。使用的移動硬盤、U盤、光盤等存儲介質(zhì),按涉密載體進行管理,不得在非涉密計算機及其網(wǎng)絡上使用。實時監(jiān)控按照信息安全管理體系ISO27001的要求,對加工現(xiàn)場實施24小時實時監(jiān)控,及時掌握現(xiàn)場加工狀態(tài),保證現(xiàn)場加工信息安全。技術(shù)方案一:制作PDF格式文件生產(chǎn)流程配置參考《中華人民共和國檔案法》、《檔案數(shù)字化技術(shù)規(guī)范》(DA/T31-2005)和《電子文件歸檔與管理規(guī)范》(GB/T18894-2002)等檔案數(shù)字化加工國家法律法規(guī),同時按照本項目檔案資料特點,結(jié)合XX市檔案局要求和方正多年數(shù)字化經(jīng)驗,方正專門配置的生產(chǎn)加工流程,力求做到掃描效率高、圖像掃描清晰、數(shù)據(jù)不丟失、檔案不凌亂、不損壞恢復原樣、安全。其加工流程如下:以上是根據(jù)數(shù)字化加工需求所配置的流程,在此基礎(chǔ)上根據(jù)數(shù)據(jù)規(guī)格和加工質(zhì)量要求,將對基本環(huán)節(jié)的工藝進行進一步配置,方正按照以上加工要求定制一套生產(chǎn)加工流程并配置生產(chǎn)流程軟件系統(tǒng)。以下為詳細介紹:資料提取和歸檔方正到用戶指定地點下架提取需加工檔案,登記明細并打包運至指定的加工場地,提供現(xiàn)場加工服務。檔案提取登記表:序號檔號卷數(shù)借出日期借卷人還卷日期檔案接收人備注1001-010102009.1.1張三2009.1.3李老師2011-020102009.1.1張三2009.1.3劉老師3021-030102009.1.1張三2009.1.3李老師方正在檔案數(shù)字加工過程中,對掃描檔案進行編號和批次處理,形成基本的核對流程,杜絕漏掃或重復掃描情況出現(xiàn)。所有檔案保證做到不損壞、不損失、原樣歸還。方正將已加工完成后的檔案按照批次及時歸還。規(guī)范庫和工程信息庫建設(shè)規(guī)范庫建設(shè)針對需進行加工的檔案,建立基本屬性對應的著錄項目,并生成基本目錄規(guī)范數(shù)據(jù),同時為規(guī)范數(shù)據(jù)建立相應的代碼識別體系,該代碼識別體系將貫穿整個工程的信息交換和數(shù)據(jù)交換,避免出現(xiàn)信息和數(shù)據(jù)不一致的情況。結(jié)合目錄規(guī)范數(shù)據(jù)并通過智能檢測模塊可以有效的避免在數(shù)字化過程中可能出現(xiàn)的漏掃、重掃等情況。工程信息庫建設(shè)通過對檔案進行歸類整理,在規(guī)范庫基礎(chǔ)上,根據(jù)工程各環(huán)節(jié)所需要公用的基礎(chǔ)信息,將檔案的基礎(chǔ)著錄項目抽取成為資料內(nèi)部特征,建立信息標引配置數(shù)據(jù)庫和相關(guān)流水線工藝文檔,制定項目評價標準和環(huán)節(jié)控制標準等。工程信息庫與方正業(yè)務流程管理系統(tǒng)掛接,工程信息庫在整個工程實施中會圍繞基礎(chǔ)信息,隨著數(shù)據(jù)流轉(zhuǎn)不斷增加相關(guān)的信息,通過方正業(yè)務流程管理系統(tǒng),可以實時的掌握每一批次、每卷檔案的生產(chǎn)進展和所處環(huán)節(jié),也能掌握到數(shù)據(jù)的狀態(tài)、收發(fā)時間、生產(chǎn)責任人等相關(guān)信息。數(shù)字化內(nèi)容組織內(nèi)容組織按照生產(chǎn)模式,多卷檔案可以形成一個批次,每個批次都有一個唯一的編號。每卷檔案在加工過程中也要形成一個唯一標識號。檔案以整卷為單位進行數(shù)字化處理,形成對應的各種過程數(shù)據(jù)和結(jié)果數(shù)據(jù),如掃描影像數(shù)據(jù)、圖像屬性數(shù)據(jù)、索引信息XML文檔等各類文檔。所有檔案案卷都包含檔案編號等著錄項目必備的相關(guān)屬性信息。卷內(nèi)文件按照目錄數(shù)據(jù)著錄。對照檔案原件,著錄卷內(nèi)文件索引信息的所有項,同時可以根據(jù)采購方的需要建立其他自定義的索引項。數(shù)據(jù)命名圖像存儲文件(PDF格式、JPEG格式、TIF格式)、索引信息格式文件(XML文件)命名規(guī)則描述如下:PDF格式文件、JPEG格式文件、TIF格式文件:PDF文件、JPEG文件、TIF文件的命名以每卷案卷目錄的目錄項順序統(tǒng)一編頁后,每個文件都用唯一的頁碼標識。著錄索引信息XML格式文件:一個圖像文件對應一個索引信息文件,所以索引信息文件的命名同樣以每卷案卷目錄的目錄項順序統(tǒng)一編頁后,每個索引信息文件和圖像文件同名。存放規(guī)則檔案加工過程中的文件存放規(guī)則是按照每卷檔案為一個根目錄文件夾,文件夾內(nèi)存放按照案卷目錄排序的所有圖像文件和索引信息文件。以下是部分重要的數(shù)據(jù)加工環(huán)節(jié)介紹:檔案整理目錄數(shù)據(jù)準備按照檔案整理辦法的相關(guān)要求,規(guī)范檔案中的目錄。核對案卷信息,包括基本目錄項信息以及其他可自定義目錄項信息。按照《檔案著錄規(guī)則》(DA/T18)等的要求,規(guī)范檔案中的目錄內(nèi)容。包括確定檔案目錄的著錄項、字段長度和內(nèi)容要求。如有錯誤或不規(guī)范的案卷題名、文件名、責任者、起止頁號和頁數(shù)等,應進行修改。區(qū)分掃描件和非掃描件在案卷領(lǐng)取交接后,將檔案分類為加急掃描和普通掃描兩種,一般流程設(shè)定下,加急檔案3小時內(nèi)完成掃描任務,普通檔案24小時內(nèi)完成任務。在掃描之前,根據(jù)檔案管理情況,按下述步驟對檔案進行適當整理,并視需要做出標識,確保檔案數(shù)字化質(zhì)量。頁面處理破損嚴重、無法直接進行掃描的檔案,由XX市檔案局專業(yè)人員先進行技術(shù)修復,折皺不平影響掃描質(zhì)量的原件,按照檔案管理規(guī)定先進行相應處理(壓平或燙平等)后再進行掃描。檔案整理登記確認檔案袋內(nèi)目錄的記錄是否與檔案資料相符;對檔案袋的資料按照案卷目錄上的目錄項進行排序,并統(tǒng)一進行頁碼的編排;如有目錄與檔案資料不符的情況,修改錯誤并進行相關(guān)信息記錄。檔案掃描參照國家檔案局頒布的《檔案數(shù)字化技術(shù)規(guī)范》中關(guān)于檔案掃描的要求,方正制定以下掃描方案。掃描分辨率及色彩模式按項目要求,選擇合適的掃描分辨率及色彩模式。圖像文件采用300DPI分辨率的彩色掃描模式,其余檔案采用300DPI分辨率的黑白掃描模式。掃描方式掃描設(shè)備為平板式掃描儀或高速掃描儀。紙張狀況較差,過薄、過軟或超厚的檔案,通過使用平板掃描方式確保不損壞原始檔案,對于紙張較好的檔案用高速掃描儀進行掃描。對于紙質(zhì)太薄出現(xiàn)透字現(xiàn)象的要采用襯紙的方式進行掃描,保證圖像的清晰度。掃描登記對同一檔案編號的文件及其附件,按目錄號進行存儲,不亂序,不混檔,與目錄進行掛接;不允許有折疊或缺損,保證圖像的完整、端正、無扭曲;填寫檔案掃描過程交接登記表單,登記掃描的頁數(shù),核對每份文件的實際掃描頁數(shù)與檔案整理時填寫的文件頁數(shù)是否一致,不一致時應注明具體原因和處理方法。注:因客戶資料不能公開,遵照ISO27001的信息安全管理要求和與客戶簽訂的數(shù)據(jù)保密協(xié)議,以下圖片均經(jīng)過處理?!緳n案掃描界面】【檔案掃描設(shè)置界面】圖像處理參照國家檔案局頒布的《檔案數(shù)字化技術(shù)規(guī)范》中關(guān)于檔案掃描的要求,方正制定以下圖像處理方案。圖像數(shù)據(jù)質(zhì)量檢驗圖像數(shù)據(jù)質(zhì)量檢驗是掃描過程中重要環(huán)節(jié)。檢驗人員通過對檔案原件與掃描影像的比較,對掃描影像的清晰、位置、格式、完整、次序等做出判斷,提交改正或通過。三級校對管理軟件避免了日后的錯誤。質(zhì)量管理是本軟件生產(chǎn)平臺的最大亮點。掃描時員工必須按照正確方法進行掃描:張數(shù)不對,無法通過;質(zhì)量不好無法通過。否則系統(tǒng)提示無法提交下一步工序。在質(zhì)量檢驗中,必須通過嚴格的三級質(zhì)量檢驗,否則打回重掃,再校對,最終通過總檢,方可進入數(shù)據(jù)庫。質(zhì)量管理軟件如下圖所示:注:因客戶資料不能公開,遵照ISO27001的信息安全管理要求和與客戶簽訂的數(shù)據(jù)保密協(xié)議,以下圖片均經(jīng)過處理。圖像精細化處理糾斜后的圖像四角成90度,圖像內(nèi)容居中;調(diào)整明暗度或?qū)Ρ榷?,去除版面污點,達到所有版芯外的污跡都去除掉;去圖像黑邊,裁邊等;盡可能達到好的色彩、對比度還原等要求;對大幅面檔案進行分區(qū)掃描形成的多幅圖像后進行拼接處理,合并為一個完整的圖像;對案卷中遺漏編目的頁面進行合頁處理,確保掃描好的影像頁數(shù)與原案卷頁數(shù);保證掃描圖像字跡清晰、顏色恰當,正文文字可以看清楚。將通過精細加工的原始掃描圖像壓縮成300DPI的JPG格式,存儲成單頁JPG,并將封裝好的文件存儲到相應文件夾中。填寫檔案數(shù)字化轉(zhuǎn)換過程交接登記表單,登記掃描的頁數(shù),核對每份文件的實際掃描頁數(shù)與檔案整理時填寫的文件頁數(shù)是否一致,若原檔案有殘缺、污損等影響閱讀的情況,若掃描處理無法解決時,需要在相應版面處添加說明,同時需在readme.txt文件中記錄說明,并及時與用戶聯(lián)系協(xié)商處理辦法。注:因客戶資料不能公開,遵照ISO27001的信息安全管理要求和與客戶簽訂的數(shù)據(jù)保密協(xié)議,以下圖片均經(jīng)過處理?!緢D像處理前后情況示意圖】補掃圖像掃描整個加工過程需要通過三級校對環(huán)節(jié),對個別被判定不合格的影像文件打回重掃,直至通過總檢,合格備份。圖像版面分析和基礎(chǔ)信息提取工作內(nèi)容對圖像處理環(huán)節(jié)完成的檔案圖像文件進行版面分析和信息提取工作,主要標注檔案版面文字塊、圖像塊、紋飾塊和顏色信息等等版面信息,為后期版面識別和版面合成提供數(shù)據(jù)基礎(chǔ)。制作標準分類標準版面畫框根據(jù)文字區(qū)域、插圖區(qū)域和紋飾區(qū)域進行畫框字體標注對于版面中的不同字體詳細標注字號標注對于版面中的不同字號詳細標注圖像屬性標注標注圖像的精度、圖像模式(黑白、彩色)實現(xiàn)方法運行方正標引程序,將檔案圖像文件根據(jù)需求依次進行版面分析,以達到能夠讓識別程序進行正確識別,且識別出來的文字,閱讀順序正確。要求:版面分析準確,欄目層次分明,文章主題明確,清楚文章的閱讀順序。版面分析操作一定要規(guī)范,避免出現(xiàn)漏標(指整篇文章、一段文字或一行文字)、多標、錯標、重框、壓框(壓圖片、壓表格、壓字等)等問題。標引內(nèi)容:從前往后標(正文不標引);若遇到下轉(zhuǎn)、上接的文章時,注意文章閱讀順序完整。需要標引內(nèi)容:包括文件名、案卷號、順序號、文號、責任者、題名、日期、頁號、保管期限、頁密級等。輸出數(shù)據(jù)帶有版式信息的中間文件,根據(jù)XX市檔案局的要求輸出AMF文件前置文件GNS文件。全文識別和編改工作內(nèi)容將檔案圖像版面分析后生成的過程文件直接導入識別軟件進行全文識別,全文識別是個批量處理的工作,識別后文件對文字進行編改校對,生僻字進行著錄和造字后導入方正自主研發(fā)的XML制作工具生成本項目要求的XML文件。制作標準檔案XML文件標準文字要求文字準確,造字、特殊符號用“■”代替表格要求表格在XML文件中不體現(xiàn)公式要求公式在XML文件中不體現(xiàn)段落要求段落之間只能有上一段落的回車和下一段落的兩個全角空格,不能有其他內(nèi)容。換行的回車需要去除文章開始處要求文章內(nèi)容每個段落開始要求有兩個全角空格,結(jié)束要求有回車文字正確率要求文章XML綜合差錯率不超過萬分之一實現(xiàn)方法本環(huán)節(jié)根據(jù)全文內(nèi)容進行自動文本識別處理,并依據(jù)質(zhì)量規(guī)范對識別后的文本進行編改和校對處理,保證文字的準確性。全文識別采用方正自主知識產(chǎn)權(quán)的識別核心,并結(jié)合其他的識別技術(shù),采用復雜的集成投票判別算法,大幅度降低OCR的誤判率,提高自動辨識效果,確保文字質(zhì)量可控。全文識別在版面分析的基礎(chǔ)上,對于各個制定的文字區(qū)域進行自動識別。在初次識別結(jié)果上,進行系統(tǒng)一級的優(yōu)化處理,提煉出識別相似度較低、易錯字、或無法識別的文字,進行加擾處理并組合后進入校對環(huán)節(jié)。對于系統(tǒng)判定識別正確度文字,進行另外的組合進入檢查環(huán)節(jié)。錄入全文識別軟件對于無法識別的內(nèi)容,提供與原圖對照錄入的功能,提高錄入效率,并可以原圖上標記識別困難的模糊字、無法輸入的冷僻字(缺字)和認同字。將每幅圖像內(nèi)所顯示的文字,由人工利用方正新典碼輸入法輸入在與圖像文件同名的指定格式文檔中。編改在本項目中按照所要求的文字錯誤率標準,設(shè)置生產(chǎn)線并制定強化環(huán)節(jié)控制和增加校對批數(shù),以保障全局的文字質(zhì)量。除中文之間的標點符號為全角,其它全部在英文狀態(tài)下輸入(原則是規(guī)定為分割符號的必須半角,其他的以原內(nèi)容為準)。編改中打不出來的字用‘■’代替,并要記錄,記錄要統(tǒng)一。為有效地隨時監(jiān)控校對效果和校對質(zhì)量,在校對系統(tǒng)中還內(nèi)置了一套校對質(zhì)量智能分析模型,可以自動地甄別基本的工作質(zhì)量?!臼纠翰捎眯|(zhì)量智能分析,隨時掌握校對過程、智能查錯等】對于質(zhì)量要求更高的內(nèi)容,可重新配置工藝,設(shè)立多層次的質(zhì)量保證體系,包括采用多人不同方法同時處理、電腦校驗、多人采取不同方法同時核對等手段杜絕全部錯誤。校對方法包括:語義智能機器校對、字形自動比對、人工易錯字/詞校對、OCR易錯字/詞校對、地名/人名/詞語校對等。為了保證作業(yè)在第一時間就符合質(zhì)量要求,利用信息系統(tǒng)支持流水線作業(yè)的特點,對員工在文字校對作業(yè)環(huán)節(jié)進行嚴格的強化培訓,使他們能夠達到很高的準確率水平。同時,方正還充分利用技術(shù)手段通過處理系統(tǒng)內(nèi)部內(nèi)置的程序進行質(zhì)量控制,依據(jù)質(zhì)量指標要求設(shè)置系統(tǒng)參數(shù),在校對環(huán)節(jié)不達標時系統(tǒng)拒接回收提交的數(shù)據(jù)。導出XML文件通過自主研發(fā)的AMF轉(zhuǎn)XML工具,將全部的檔案AMF文件批量轉(zhuǎn)換成XML文件,如下圖所示:輸出數(shù)據(jù)包含有文章著錄項的每份檔案XML文件。檔案目錄著錄數(shù)據(jù)格式選擇目錄建庫應選擇通用的數(shù)據(jù)格式。所選定的數(shù)據(jù)格式應能直接或間接通過XML文檔進行數(shù)據(jù)交換。標引著錄標引著錄為了方便查閱與管理,打印制作檔案目錄及檔案封面,對文字錄入的準確性要求較高,但要錄的文本域并不是完全統(tǒng)一的在某一頁面上,一些文本域要在多個文件中選擇,所以錄入時需要相關(guān)學部專家進行指導,確保文本域錄入的準確率。對所需錄入的文本進行標引、或?qū)Σ煌悇e的檔案錄入特征制作相應的《文字錄入說明》,供錄入員和校對人員參考。錄入方式由于文本類型不一,有印刷體、手寫體、有表格內(nèi)的也有表格外的文本信息,所以采用手工錄入和OCR軟件相結(jié)合的方式錄入。即手寫體或不清晰的印刷體采用手工錄入,較規(guī)整的印刷體采用OCR技術(shù)的錄入方式。校對方式校對以軟件校對和打印輸出對比校對相結(jié)合的方式,即對手工錄入和OCR自動錄入的文本打印輸出進行對比校對的一校、二校、抽查校對,確保索引信息錯誤率達到出版質(zhì)量萬分之一以下。單層純圖像PDF文件生成工作內(nèi)容將經(jīng)過圖像處理后的單頁圖像文件加工后制作生成單層純圖像PDF文件。制作標準分類標準PDF圖像要求純圖像PDF文件所使用彩色為300dpi初始設(shè)置PDF初始放大率設(shè)置為“適合頁面”實現(xiàn)方法將圖像處理完成并符合質(zhì)量要求的圖像文件整理分類后,通過PDF批量轉(zhuǎn)換工具生成單層純圖像PDF文件。【示例:采用PDF還原系統(tǒng)還原PDF版面數(shù)據(jù)】輸出數(shù)據(jù)本環(huán)節(jié)加工完成后生成每張圖像文件的單層純圖像PDF文件。雙層PDF文件生成工作內(nèi)容將經(jīng)過全文識別和編改后的檔案圖像文件加工后制作生成雙層PDF文件。制作標準分類標準PDF圖像要求圖像所使用的圖片格式為JPG,精度為300dpi,要求保證圖片顯示比例200%以內(nèi)清晰的基礎(chǔ)上進行壓縮,壓縮后符合JBIG2、JPEG2000標準的最大壓縮比PDF完整性PDF的數(shù)據(jù)要完整,保證無缺頁、重頁,頁碼順序顛倒的情況發(fā)生PDF圖像與文字對位雙層PDF文件的圖像層和文字層的文字對位準確,反顯區(qū)域與文字區(qū)域相差1毫米PDF圖像質(zhì)量打開一份電子檔案閱覽并對文字放大時,保證在放大到百分之二百的時候,字跡清晰,筆畫連續(xù),無斷裂、缺塊的現(xiàn)象初始設(shè)置PDF初始放大率設(shè)置為“適合頁面”PDF文字部分通過版式還原以代碼格式顯示,不以圖片形式展示,并保持與原檔案一致的排版格式。文字所使用的字體以“已嵌入子集”方式嵌入PDF文件。缺字用矢量造字補缺,對應文本統(tǒng)一為“■”PDF表格、公式、格式等特殊符號檔案中特殊符號、復雜數(shù)學公式以圖片形式展示。特殊符號對應文本統(tǒng)一為“■”,數(shù)學公式對應文本為計算機通??奢斎氲谋磉_式,如公式中存在一些無法輸入的符號按特殊符號處理綜合差錯率每個PDF綜合差錯率小于萬分之一PDF文字處理PDF版面文字的字體、字號、字間距和行間距與原檔案保持一致實現(xiàn)方法采用專用的軟件,對修整后的檔案圖像進行自動文字識別和編改,合成一個完整的雙層PDF文件,圖像在下,文字在上,文字層采用透明屬性。完成雙層PDF版面還原的基礎(chǔ)工作后,建立對應檔案的獨立PDF文件。該PDF文件名稱與檔案標識號規(guī)則定義一致,便于調(diào)閱。將PDF文字層所使用的字體以“已嵌入子集”方式嵌入PDF文件。對在版面分析后生成的XML文件、版面插圖文件和版面紋飾文件采用方正專用的軟件,對合格圖像、文字等文件全部綜合打版合成一個完整的檔案雙層PDF文件。打版工具如下圖所示:PDF文件的行距和字間距進行檢測和調(diào)整后完全和原檔案一致。對PDF文件中的文字字體和字號進行定位檢測和調(diào)整。設(shè)置PDF文件初始設(shè)置為“適合頁面”。PDF版面中字體嵌入,效果如下:輸出數(shù)據(jù)本環(huán)節(jié)加工結(jié)束后生成檔案的雙層PDF文件。數(shù)據(jù)存儲參照XX市檔案局要求及國家檔案局頒布的《檔案數(shù)字化技術(shù)規(guī)范》中關(guān)于檔案掃描圖像的存儲格式及命名要求并結(jié)合方正博通數(shù)字檔案管理平臺的入庫文件定義,方正制定以下數(shù)據(jù)存儲及命名方案。存儲格式圖像文件在保證掃描的圖像清晰可讀的前提下,存儲格式采用JPEG格式、PDF格式及TIF格式存儲檔案圖像。存儲文件的命名JPEG文件、PDF文件、TIF文件的命名以每卷案卷目錄的目錄項順序統(tǒng)一編頁后,每個文件都用唯一的頁碼標識命名。數(shù)據(jù)掛接(1)匯總掛接檔案數(shù)字化轉(zhuǎn)換過程中形成的目錄數(shù)據(jù)庫與圖像數(shù)據(jù)庫,通過質(zhì)檢環(huán)節(jié)確認為“合格”后,通過網(wǎng)絡及時加載到數(shù)據(jù)服務器端匯總。通過編制程序或借助相應軟件,可實現(xiàn)目錄數(shù)據(jù)對相關(guān)聯(lián)的數(shù)字圖像的自動搜索、加入對應的電子地址信息等,實現(xiàn)批量、快速掛接。(2)數(shù)據(jù)關(guān)聯(lián)以檔案目錄數(shù)據(jù)庫為依據(jù),將每一份檔案文件掃描所得的一個或多個圖像存儲為一份圖像文件。將圖像文件存儲到相應文件夾時,認真核查每一份圖像文件的名稱與檔案目錄數(shù)據(jù)庫中該份文件的檔號是否相同,圖像文件的頁數(shù)與檔案目錄數(shù)據(jù)庫中該份文件的頁數(shù)是否一致,圖像文件的總數(shù)與目錄數(shù)據(jù)庫中文件的總數(shù)是否相同等。通過每一份圖像文件的文件名與檔案目錄數(shù)據(jù)庫中該份文件的檔號的一致性和唯一性,建立起一一對應的關(guān)聯(lián)關(guān)系,為實現(xiàn)檔案目錄數(shù)據(jù)庫與圖像文件的批量掛接提供條件。(3)數(shù)據(jù)入庫根據(jù)XX市檔案局電子檔案管理要求,將驗收后的檔案數(shù)據(jù)(包括PDF文件、圖像數(shù)據(jù)、XML著錄文件等)批量導入方正博通數(shù)字檔案管理平臺,實現(xiàn)檔案數(shù)據(jù)與系統(tǒng)的無縫鏈接。數(shù)據(jù)驗收數(shù)據(jù)抽檢以抽檢的方式檢查已完成數(shù)字化轉(zhuǎn)換的所有數(shù)據(jù),包括目錄數(shù)據(jù)庫、PDF文件、圖像文件及數(shù)據(jù)掛接的總體質(zhì)量。驗收指標檔案裝訂:大于10%抽檢,檢查所有檔案的裝訂還原情況,要求所有抽檢檔案實體資料完整,裝訂順序無差錯,無漏、跳編頁碼,保持同一份文件的完整,托裱、平整和去釘。掃描圖像檢查:大于10%抽檢,要求所有抽檢檔案無漏掃、多掃。圖像質(zhì)量檢查:大于10%抽檢,要求所有抽檢圖像四角成90度,影像清晰整潔,分辨率合適。檢索檢查:大于10%抽檢,目錄與圖像掛接錯誤率小于1%。目錄名稱檢查:大于10%抽檢,要求所有數(shù)據(jù)目錄著錄準確。頁密級檢查:大于10%抽檢,要求所有文件頁密級準確。(3)驗收審核驗收“通過”的結(jié)論,必須經(jīng)分管領(lǐng)導審核、簽字后方有效。數(shù)據(jù)備份備份范圍將經(jīng)驗收合格的完整數(shù)據(jù)及時進行備份,包括以下各類數(shù)據(jù):原始掃描圖像文件卷內(nèi)目錄信息文件JPEG格式存儲圖像單層純圖像PDF文件、雙層PDF文件XML文件備份方式為保證數(shù)據(jù)安全,備份載體選擇硬盤和光盤,采用在線、離線相結(jié)合的方式實現(xiàn)多套備份,并實現(xiàn)異地保存。伴隨工程進行,隨時進行多套500G規(guī)格硬盤數(shù)據(jù)備份階段性DVD光盤刻錄備份數(shù)據(jù)檢驗備份數(shù)據(jù)也應進行檢驗。備份數(shù)據(jù)的檢驗的內(nèi)容主要包括備份數(shù)據(jù)能否打開、數(shù)據(jù)信息是否完整、文件數(shù)量是否準確等。備份標簽數(shù)據(jù)備份后應在相應的備份介質(zhì)上做好標簽,以便查找和管理。備份登記填寫檔案數(shù)字化備份管理登記表單。數(shù)字化成果管理參照國家檔案局頒布的《檔案數(shù)字化技術(shù)規(guī)范》對數(shù)字化成果進行管理:加強對檔案數(shù)字化成果的管理,確保其安全、完整和長期可用。檔案數(shù)字化成果提供網(wǎng)上檢索利用時,有制作單位的電子標識,并根據(jù)具體情況分別采用可下載或不可下載的數(shù)據(jù)格式。檔案歸檔在檔案實施數(shù)字化過程中,方正將根據(jù)國家檔案文件保護的相關(guān)規(guī)定對每道工序嚴格把關(guān),責任到人,加強對檔案的保護,保持檔案的原樣歸還。數(shù)字化加工結(jié)束后,方正將嚴格遵守加工管理控制流程并參照《檔案數(shù)字化技術(shù)規(guī)范》,嚴格按照相關(guān)流程歸還檔案,并嚴格填寫《檔案處理結(jié)果》表等完成歸檔交接手續(xù)。成品數(shù)據(jù)數(shù)據(jù)建設(shè)文檔管理:包括數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)樣板、數(shù)據(jù)處理流程和規(guī)范、數(shù)據(jù)維護方法等。測試文檔管理:對于數(shù)據(jù)質(zhì)量、完整性、規(guī)范性、一致性、格式化等不同內(nèi)容的測試文檔及報告等。實施培訓和服務文檔管理:數(shù)字化工程實施文檔,根據(jù)工程建設(shè)及發(fā)展要求整理的培訓和維護文檔等。按照數(shù)字化工程最終的交付要求,整合各工程環(huán)節(jié)的文檔,并整理出向用戶提交的完整內(nèi)容,包括成品數(shù)據(jù):JPEG文件、PDF文件、TIF文件:按要求提交JPEG文件、PDF文件、TIF文件。檔案圖像XML文件:內(nèi)容包括檔案編號等卷內(nèi)文件索引信息項,同時還包括用戶自定義的信息項。存放形式,成品數(shù)據(jù)全部用不低于500G的硬盤存儲,存儲方式如下根目錄:硬盤根目錄下存放有序的若干文件夾,按照一張DVD光盤的容量,每個文件夾都能獨立的刻錄到一張DVD光盤;二級目錄由若干以案卷編號命名的文件夾及一張記錄這些案卷資料基本信息的電子表格組成;三級目錄存放各案卷資料的JPEG文件、PDF文件、TIF文件,文件的命名按照統(tǒng)一要求命名。技術(shù)方案二:只制作JPEG格式文件生產(chǎn)流程配置參考《中華人民共和國檔案法》、《檔案數(shù)字化技術(shù)規(guī)范》(DA/T31-2005)和《電子文件歸檔與管理規(guī)范》(GB/T18894-2002)等檔案數(shù)字化加工國家法律法規(guī),同時按照本項目檔案資料特點,結(jié)合XX市檔案局要求和方正多年數(shù)字化經(jīng)驗,方正專門配置的生產(chǎn)加工流程,力求做到掃描效率高、圖像掃描清晰、數(shù)據(jù)不丟失、檔案不凌亂、不損壞恢復原樣、安全。其加工流程如下:以上是根據(jù)數(shù)字化加工需求所配置的流程,在此基礎(chǔ)上根據(jù)數(shù)據(jù)規(guī)格和加工質(zhì)量要求,將對基本環(huán)節(jié)的工藝進行進一步配置,方正按照以上加工要求定制一套生產(chǎn)加工流程并配置生產(chǎn)流程軟件系統(tǒng)。以下為詳細介紹:資料提取和歸檔參見3.2規(guī)范庫和工程信息庫建設(shè)參見3.3數(shù)字化內(nèi)容組織內(nèi)容組織按照生產(chǎn)模式,多卷檔案可以形成一個批次,每個批次都有一個唯一的編號。每卷檔案在加工過程中也要形成一個唯一標識號。檔案以整卷為單位進行數(shù)字化處理,形成對應的各種過程數(shù)據(jù)和結(jié)果數(shù)據(jù),如掃描影像數(shù)據(jù)、圖像屬性數(shù)據(jù)、索引信息XML文檔等各類文檔。所有檔案案卷都包含檔案編號等著錄項目必備的相關(guān)屬性信息。卷內(nèi)文件按照目錄數(shù)據(jù)著錄。對照檔案原件,著錄卷內(nèi)文件索引信息的所有項,同時可以根據(jù)采購方的需要建立其他自定義的索引項。數(shù)據(jù)命名圖像存儲文件(JPEG格式、TIF格式)、索引信息格式文件(XML文件)命名規(guī)則描述如下:JPEG格式文件、TIF格式文件:JPEG文件、TIF文件的命名以每卷案卷目錄的目錄項順序統(tǒng)一編頁后,每個文件都用唯一的頁碼標識。著錄索引信息XML格式文件:一個圖像文件對應一個索引信息文件,所以索引信息文件的命名同樣以每卷案卷目錄的目錄項順序統(tǒng)一編頁后,每個索引信息文件和圖像文件同名。存放規(guī)則檔案加工過程中的文件存放規(guī)則是按照每卷檔案為一個根目錄文件夾,文件夾內(nèi)存放按照案卷目錄排序的所有圖像文件和索引信息文件。以下是部分重要的數(shù)據(jù)加工環(huán)節(jié)介紹:檔案整理參見3.5檔案掃描參見3.6圖像處理參見3.7檔案目錄著錄參見3.10數(shù)據(jù)存儲參照XX市檔案局要求及國家檔案局頒布的《檔案數(shù)字化技術(shù)規(guī)范》中關(guān)于檔案掃描圖像的存儲格式及命名要求并結(jié)合方正博通數(shù)字檔案管理平臺的入庫文件定義,方正制定以下數(shù)據(jù)存儲及命名方案。存儲格式圖像文件在保證掃描的圖像清晰可讀的前提下,存儲格式采用JPEG格式及TIF格式存儲檔案圖像。存儲文件的命名JPEG文件、TIF文件的命名以每卷案卷目錄的目錄項順序統(tǒng)一編頁后,每個文件都用唯一的頁碼標識命名。數(shù)據(jù)掛接(1)匯總掛接檔案數(shù)字化轉(zhuǎn)換過程中形成的目錄數(shù)據(jù)庫與圖像數(shù)據(jù)庫,通過質(zhì)檢環(huán)節(jié)確認為“合格”后,通過網(wǎng)絡及時加載到數(shù)據(jù)服務器端匯總。通過編制程序或借助相應軟件,可實現(xiàn)目錄數(shù)據(jù)對相關(guān)聯(lián)的數(shù)字圖像的自動搜索、加入對應的電子地址信息等,實現(xiàn)批量、快速掛接。(2)數(shù)據(jù)關(guān)聯(lián)以檔案目錄數(shù)據(jù)庫為依據(jù),將每一份檔案文件掃描所得的一個或多個圖像存儲為一份圖像文件。將圖像文件存儲到相應文件夾時,認真核查每一份圖像文件的名稱與檔案目錄數(shù)據(jù)庫中該份文件的檔號是否相同,圖像文件的頁數(shù)與檔案目錄數(shù)據(jù)庫中該份文件的頁數(shù)是否一致,圖像文件的總數(shù)與目錄數(shù)據(jù)庫中文件的總數(shù)是否相同等。通過每一份圖像文件的文件名與檔案目錄數(shù)據(jù)庫中該份文件的檔號的一致性和唯一性,建立起一一對應的關(guān)聯(lián)關(guān)系,為實現(xiàn)檔案目錄數(shù)據(jù)庫與圖像文件的批量掛接提供條件。(3)數(shù)據(jù)入庫根據(jù)XX市檔案局電子檔案管理要求,將驗收后的檔案數(shù)據(jù)(包括圖像數(shù)據(jù)、XML著錄文件等)批量導入方正博通數(shù)字檔案管理平臺,實現(xiàn)檔案數(shù)據(jù)與系統(tǒng)的無縫鏈接。數(shù)據(jù)驗收數(shù)據(jù)抽檢以抽檢的方式檢查已完成數(shù)字化轉(zhuǎn)換的所有數(shù)據(jù),包括目錄數(shù)據(jù)庫、圖像文件及數(shù)據(jù)掛接的總體質(zhì)量。驗收指標檔案裝訂:大于10%抽檢,檢查所有檔案的裝訂還原情況,要求所有抽檢檔案實體資料完整,裝訂順序無差錯,無漏、跳編頁碼,保持同一份文件的完整,托裱、平整和去釘。掃描圖像檢查:大于10%抽檢,要求所有抽檢檔案無漏掃、多掃。圖像質(zhì)量檢查:大于10%抽檢,要求所有抽檢圖像四角成90度,影像清晰整潔,分辨率合適。檢索檢查:大于10%抽檢,目錄與圖像掛接錯誤率小于1%。目錄名稱檢查:大于10%抽檢,要求所有數(shù)據(jù)目錄著錄準確。頁密級檢查:大于10%抽檢,要求所有文件頁密級準確。驗收審核驗收“通過”的結(jié)論,必須經(jīng)分管領(lǐng)導審核、簽字后方有效。數(shù)據(jù)備份備份范圍將經(jīng)驗收合格的完整數(shù)據(jù)及時進行備份,包括以下各類數(shù)據(jù):原始掃描圖像文件卷內(nèi)目錄信息文件JPEG格式存儲圖像XML文件備份方式為保證數(shù)據(jù)安全,備份載體選擇硬盤和光盤,采用在線、離線相結(jié)合的方式實現(xiàn)多套備份,并實現(xiàn)異地保存。伴隨工程進行,隨時進行多套500G規(guī)格硬盤數(shù)據(jù)備份階段性DVD光盤刻錄備份數(shù)據(jù)檢驗備份數(shù)據(jù)也應進行檢驗。備份數(shù)據(jù)的檢驗的內(nèi)容主要包括備份數(shù)據(jù)能否打開、數(shù)據(jù)信息是否完整、文件數(shù)量是否準確等。備份標簽數(shù)據(jù)備份后應在相應的備份介質(zhì)上做好標簽,以便查找和管理。備份登記填寫檔案數(shù)字化備份管理登記表單。數(shù)字化成果管理參見3.17檔案歸檔參見3.18成品數(shù)據(jù)數(shù)據(jù)建設(shè)文檔管理:包括數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)樣板、數(shù)據(jù)處理流程和規(guī)范、數(shù)據(jù)維護方法等。測試文檔管理:對于數(shù)據(jù)質(zhì)量、完整性、規(guī)范性、一致性、格式化等不同內(nèi)容的測試文檔及報告等。實施培訓和服務文檔管理:數(shù)字化工程實施文檔,根據(jù)工程建設(shè)及發(fā)展要求整理的培訓和維護文檔等。按照數(shù)字化工程最終的交付要求,整合各工程環(huán)節(jié)的文檔,并整理出向用戶提交的完整內(nèi)容,包括成品數(shù)據(jù):JPEG文件、TIF文件:按要求提交JPEG文件、TIF文件。檔案圖像XML文件:內(nèi)容包括檔案編號等卷內(nèi)文件索引信息項,同時還包括用戶自定義的信息項。存放形式,成品數(shù)據(jù)全部用不低于500G的硬盤存儲,存儲方式如下根目錄:硬盤根目錄下存放有序的若干文件夾,按照一張DVD光盤的容量,每個文件夾都能獨立的刻錄到一張DVD光盤;二級目錄由若干以案卷編號命名的文件夾及一張記錄這些案卷資料基本信息的電子表格組成;三級目錄存放各案卷資料的JPEG文件、TIF文件,文件的命名按照統(tǒng)一要求命名。項目服務方案服務承諾針對本次檔案項目,遵照ISO/IEC27001信息安全管理體系和ISO9001質(zhì)量管理體系的要求,方正在檔案掃描服務項目中保證做到以下幾點:認真規(guī)劃,做到流程科學、管理科學,高質(zhì)量、高速度地做好項目實施的落實工作。保證不拷貝檔案信息,不泄密檔案內(nèi)容。嚴格按照信息安全管理規(guī)范執(zhí)行,確保檔案資料和數(shù)據(jù)的安全。積極配合委托方實現(xiàn)數(shù)字化檔案與電子檔案系統(tǒng)的無縫銜接入庫。對我方提供掃描的檔案做長期跟蹤服務。項目結(jié)束后,保持7x24小時電話支持服務。數(shù)據(jù)交付和驗收方正自檢部分對項目組準備提交的合格數(shù)據(jù),方正提前檢查驗收。數(shù)據(jù)的抽查不低于30%,抽查的數(shù)據(jù)影像合格100%。對存在的問題較小時提出整改通知,對質(zhì)量問題嚴重時責令停產(chǎn)整頓。在數(shù)據(jù)交付前,組織質(zhì)量檢驗的同時,再次掛接檢查,保證條目、影像的關(guān)聯(lián)。每月上交一次數(shù)據(jù)。成立數(shù)據(jù)交付小組,配合XX市檔案局驗收。合格數(shù)據(jù)驗收對于已經(jīng)完成全部工序的影像數(shù)據(jù)、著錄數(shù)據(jù),以抽檢的方式檢查總體質(zhì)量。一個全宗的檔案,數(shù)據(jù)驗收時抽檢的比率不得低于5%。目錄數(shù)據(jù)庫與圖像文件掛接錯誤碼,或目錄數(shù)據(jù)庫、圖像文件之一出現(xiàn)不完整、不清晰、有錯誤等質(zhì)量問題時,抽檢標記為“不合格”。一個全宗的檔案,數(shù)字化轉(zhuǎn)換質(zhì)量抽檢的合格率達到99%以上時,給予驗收“通過”。合格率:抽檢合格率需達到100%。驗收審核:驗收“通過”的結(jié)論,必須經(jīng)分管領(lǐng)導審核、簽字后方有效。驗收登記:認真填寫檔案數(shù)字化驗收登記表單。項目實施進度安排和資源配置工期要點掃描工作是一項人員較多的手工、腦力為一體的頻繁操作工作,因為員工的長時間疲勞、反應滯后、粗心等錯誤操作,非常容易產(chǎn)生文件掃描錯誤。然而每頁文件對應一個影像文件、一個條目,一旦錯誤得不到解決,導入數(shù)據(jù)庫,就無法得到準確查閱,甚至造成整個項目的失敗。如何做到掃描質(zhì)量達標、按時完成進度,確保項目的成功實施,管理工作起著決定因素。為達到以上標準,我們推出工廠式流水線管理方式,結(jié)合軟件管理流程,從而對項目全過程實行科學控制。從設(shè)計每條流水線操作過程的開始階段,到數(shù)據(jù)安全入庫,做到責任到人嚴格檢查,如實記錄,并及時根據(jù)需要調(diào)整流程。在實施中,方正更注重于實際工作,配備了各種掃描設(shè)備。員工針對檔案紙張大小、檔案材質(zhì)、字跡、色澤深淺不勻等情況應用不同設(shè)備采用不同的掃描方案,并嚴格執(zhí)行掃描流程。加強檔案的保護工作,作業(yè)中配備檔案箱等必要的工具,既保證檔案不受損壞,又控制了作業(yè)流程的順序。3.3人員的配備(暫定)根據(jù)我們對檔案情況的掌握及XX市檔案局對生產(chǎn)周期的要求,并結(jié)合我們長期掃描生產(chǎn)經(jīng)驗,我們安排本次實施人員分工如下表:合計12人,其中調(diào)檔、裝訂、還檔工作由項目指揮兼職負責,維修、安全、后勤等人員由上述人員兼職。方正可根據(jù)實際的生產(chǎn)任務量和進度要求,隨時調(diào)整人員數(shù)量,以滿足任務進度要求。本項目掃描儀等設(shè)備的配備數(shù)量(暫定)由三臺高端機(平板、高速兩用機型)掃描儀,電腦、服務器等組成。如圖:將掃描儀分成三個分隊,由三臺高端掃描儀、電腦等組成。1234561234561、2號機為彩色(高速、平板)文件掃描儀和計算機,用于A3、A4檔案文件掃描、處理;3號機為大幅面檔案用掃描儀及計算機,用于大幅面檔案掃描;4號機用于標引文本制作;5號機用于數(shù)據(jù)質(zhì)檢;6號機為文件備份服務器。若干臺維修及備用機器不含在內(nèi)。以上掃描儀機型均為黑白、灰度、彩色三用機器,可根據(jù)XX市檔案局需要選擇掃描方式。任務的劃分(暫定)平均日產(chǎn)能:日產(chǎn)能9000~9500,可以根據(jù)實際進度進行調(diào)配:序號工作環(huán)節(jié)人員數(shù)量資質(zhì)或職責1檔案調(diào)檔1負責從檔案室調(diào)檔,專人負責2檔案整理4檔案整理工作3檔案掃描、檔案處理3檔案掃描工作4著錄、打印2檔案目錄信息制作、打印5質(zhì)檢2獨立的質(zhì)檢部門人員負責質(zhì)量檢驗6裝訂1整理完成的檔案按照檔案原貌裝訂7還檔1由調(diào)檔人員負責還檔,專人負責8數(shù)據(jù)備份3實施過程數(shù)據(jù)“三地”備份,保證數(shù)據(jù)安全9項目指揮1項目組織、協(xié)調(diào),保證項目正常進行方正的人員和設(shè)備配備完全能夠勝任該次檔案信息化工程,特別是在項目實施過程中,我們堅信的是:速度的快與慢更多的取決于人而不是機器,方正將更加發(fā)揮的是員工的整體智慧。掃描生產(chǎn)計劃(暫定)根據(jù)XX市檔案局要求,以及我們對檔案的初步掌握情況,為此,我們準備按時間要求完成任務,不作提前完成計劃,重點放在掃描等數(shù)字化質(zhì)量上。我們計劃一班作業(yè):上班時間:與XX市檔案局同步。每天完成檔案掃描數(shù)量約9100頁影像文件,一個月約21萬頁。說明:項目已考慮人員休息、設(shè)備維修、法定假日等一系列問題。售后服務在最終驗收合格后,方正提供3年的售后服務期,以保證所提供數(shù)字化成果的正常應用。數(shù)據(jù)應用中,若出現(xiàn)非人為因素或不可抗力因素導致的數(shù)據(jù)破壞,我方提供應急技術(shù)支持服務,承諾在8小時之內(nèi)響應。實時遠程技術(shù)支持服務實時遠程技術(shù)支持服務、即時在線通訊等多種服務手段。支持信箱:bposupport@;可以通過E-Mail的形式和我們的技術(shù)服務人員溝通,方正技術(shù)支持信箱的最長答復時間為24小時。熱線電話熱線電話支持:(010)-82179066,有效時間為:9:00~18:00/工作日。方正的技術(shù)服務人員將熱心解答問題,提供解決方案。技術(shù)服務網(wǎng)站支持方正集多年在應用軟件系統(tǒng)領(lǐng)域的開發(fā)、設(shè)計、實施經(jīng)驗,為保證項目的實施,我方將建立專用的技術(shù)服務支持網(wǎng)站。為用戶提供在線的免費技術(shù)支持,解答系統(tǒng)使用中的常見問題。 技術(shù)支持網(wǎng)站:/現(xiàn)場技術(shù)支持服務當用戶系統(tǒng)發(fā)生故障時,用戶方面及時通知方正,電話解決無效時,方正將派出工程師在第一時間到達用戶現(xiàn)場進行支持。培訓在工程實施后期,開始安排相關(guān)的數(shù)據(jù)維護技術(shù)培訓工作,培訓內(nèi)容主要有以下方面:數(shù)據(jù)管理維護培訓、相關(guān)技術(shù)培訓。數(shù)據(jù)管理維護培訓對此次數(shù)字化結(jié)果數(shù)據(jù)的維護和管理培訓;各種數(shù)據(jù)格式的轉(zhuǎn)換培訓;數(shù)據(jù)備份管理培訓;對今后新增數(shù)據(jù)的管理培訓;培訓對象:數(shù)據(jù)管理員、數(shù)據(jù)維護人員;人數(shù):2人;時間:2個工作日;培訓人:方正數(shù)據(jù)中心培訓部教師。相關(guān)技術(shù)培訓XML基礎(chǔ)培訓;培訓對象:數(shù)據(jù)管理員或系統(tǒng)維護人員;人數(shù):2人;時間:2個工作日;培訓人:數(shù)據(jù)庫系統(tǒng)工程師、數(shù)字化工程主要技術(shù)負責人。附錄一:公司介紹(1)公司總體情況方正國際軟件有限公司,是在方正軟件(蘇州)有限公司、北京方正國際軟件有限公司、武漢方正國際軟件有限公司的基礎(chǔ)上合并組建起來的,隸屬于方正集團,注冊資本一億五千萬元人民幣。是國家認定的高新技術(shù)企業(yè)、國家規(guī)劃布局內(nèi)重點軟件企業(yè)、軟件出口骨干企業(yè)、軟件企業(yè)出口聯(lián)盟的成員、軟件進出口工作委員會理事單位。公司定位于業(yè)務流程外包服務供應商,提供專業(yè)的數(shù)據(jù)外包服務,依靠集團的雄厚實力,以及方正集團在BPO和ITO等高科技產(chǎn)業(yè)領(lǐng)域的豐富資源,已組建起包括檔案管理、專業(yè)數(shù)據(jù)外包、軟件系統(tǒng)分析、軟件開發(fā)、配置、過程改進、測試、品保,以及政府、事業(yè)單位派遣定制人員在內(nèi)的強大技術(shù)隊伍。面向國內(nèi)外事業(yè)單位、企業(yè)和合作伙伴已開展資源數(shù)字化“現(xiàn)場”服務、軟件開發(fā)“離岸”服務、“項目整體外包”核心內(nèi)容服務和IT應用進出口業(yè)務。方正國際由一支經(jīng)驗豐富的管理團隊領(lǐng)導,管理團隊主要成員都有歐美日項目管理背景,在該行業(yè)有著15年以上的行業(yè)管理經(jīng)驗,具備較強的經(jīng)營管理能力,他們以全新的理念為客戶創(chuàng)造價值,為員工提供持續(xù)發(fā)展的機會。目前公司已組建起包括項目管理、軟件系統(tǒng)分析、軟件開發(fā)、配置、過程改進、測試、品質(zhì)保障,資料數(shù)字化生產(chǎn)工藝改進與發(fā)布管理、呼叫中心系統(tǒng)等軟件研發(fā)隊伍,并建有優(yōu)質(zhì)的呼叫中心系統(tǒng),為廣大用戶提供電子商務、呼叫中心運維及外包服務。目前公司擁有700多人的隊伍,其中高級技術(shù)人才200多人,將在五年內(nèi)發(fā)展成為一家5000人以上的大型軟件及數(shù)據(jù)加工企業(yè)。作為一家國際型企業(yè),方正國際軟件有限公司著眼于軟件及數(shù)據(jù)加工服務,致力于開拓國內(nèi)、日本、歐美的業(yè)務流程外包、高端數(shù)據(jù)服務以及軟件外包服務,已在美國、加拿大、日本、上海、北京、杭州、南京、武漢、江陰設(shè)立辦事處,吸收海外優(yōu)秀的管理與開發(fā)人員,在國際市場開拓方面取得突破成果,并形成了穩(wěn)定的業(yè)務渠道以及廣泛的海外業(yè)務資源。在國內(nèi),我們已全面具備數(shù)字化領(lǐng)域最高端的古籍文獻全文數(shù)字化加工工藝、一般紙質(zhì)檔案文獻全文數(shù)字化加工工藝及各類排版文件全真解析轉(zhuǎn)換技術(shù),并以此保障方正集團為合作伙伴提供的每年超過15萬種電子書、250萬版數(shù)字報紙、80億字全文識別的圖書及檔案數(shù)據(jù)業(yè)務處理服務。(2)方正數(shù)據(jù)處理中心介紹從數(shù)據(jù)中心創(chuàng)立至今,我們一直堅持依靠科技進步來提高生產(chǎn)力,以自主開發(fā)的數(shù)據(jù)資源處理加工工具為核心,依托于長期以來大量的實踐經(jīng)驗,建立了國內(nèi)先進的資源加工流水線。自主研發(fā)的全文數(shù)據(jù)庫加工流水線每天處理1500萬字(折合簡體、十萬分之一誤碼率)的數(shù)據(jù),甚至可以達到十萬分之三或更低的錯誤率,向用戶提供XML、HTML、CEB/PDF、TXT、DOC等用戶所需的文檔格式。數(shù)據(jù)中心的目標是通過不懈努力,為中國數(shù)字出版的基礎(chǔ)建設(shè)服務,成為價格優(yōu)、質(zhì)量高、服務好的專業(yè)數(shù)據(jù)加工隊伍。數(shù)據(jù)中心已完成幾十萬種數(shù)據(jù)的加工任務,另外累計處理文字量超過百億字。我們愿以數(shù)據(jù)中心的精誠服務推動社會信息化發(fā)展,為我國數(shù)字出版建設(shè)做出應有的貢獻。(1)數(shù)據(jù)中心理念技術(shù)推動,效率管理,合作態(tài)度。(2)數(shù)據(jù)中心宗旨客戶需求,即我們的價值。(3)服務范圍向用戶提供XML、HTML、CEB/PDF、TXT、DOC等用戶所需的各種文檔格式及相關(guān)軟件。建立數(shù)據(jù)庫系統(tǒng)、光盤檢索系統(tǒng)。加工制作相應電子版,并根據(jù)客戶要求以光盤Internet或其他載體形式提供,支持單機/局域網(wǎng)/Internet/Intranet。(3)公司資質(zhì)與榮譽CMMI3認證雙軟認證企業(yè)高新技術(shù)企業(yè)江蘇省服務外包重點企業(yè)十佳科技創(chuàng)新明星企業(yè)ISO9001:2008管理體系認證證書ISO27001信息安全管理體系江蘇省信息化協(xié)會常務理事單位方正博通公文檔案一體化管理系統(tǒng)測評等級:優(yōu)秀計算機軟件著作權(quán)登記證書數(shù)字資產(chǎn)保護技術(shù)獲國家重大科技進步獎中共中央、國務院使用方正數(shù)字資產(chǎn)加密保護技術(shù)承擔國家級項目國禮-中華數(shù)字書苑【溫總理饋贈劍橋大學國禮】【習近平副主席向魯汶大學贈送“中華數(shù)字書苑”】新聞出版總署-中國共產(chǎn)黨思想理論資源數(shù)據(jù)庫與傳播工程(4)方正的優(yōu)勢專業(yè)的圖書數(shù)字化加工能力方正的數(shù)據(jù)處理技術(shù)是完全自主開發(fā)的,是在長達10年,歷經(jīng)數(shù)百億字的加工錘煉逐漸成熟起來的,能夠高效高質(zhì)量地處理各種多語種、復雜版式資料的數(shù)字化加工項目。擁有了成熟的數(shù)字化加工處理工藝還不能代表全面的加工水平,還必須具備優(yōu)秀的管理工藝,能夠有效地進行需求分析、任務分解、工藝定制、環(huán)節(jié)調(diào)度、質(zhì)量監(jiān)控、進度監(jiān)控等。優(yōu)秀的管理工藝是大規(guī)模數(shù)字化加工處理的基本保障,其本身具有很高的技術(shù)含量。管理工藝的成熟與數(shù)字化工藝的成熟有直接的相互促進關(guān)系,通過對數(shù)字化工藝的監(jiān)管,能夠及時總結(jié)各類問題,完善數(shù)字化工藝,并不斷提高管理工藝和水平。方正經(jīng)過長期的發(fā)展,已經(jīng)形成了一套與數(shù)字化工藝配套的優(yōu)秀的管理工藝,充分保障了數(shù)字化加工處理的有效實施。持續(xù)的開發(fā)支持方正公司下設(shè)有方正研究院近3000人的專業(yè)研發(fā)技術(shù)隊伍,為我們項目的實施提供著堅實的開發(fā)技術(shù)支持,同時結(jié)合方正在多個項目的加工經(jīng)驗,我們敢于為客戶承諾提供完全符合要求的數(shù)據(jù),滿足客戶個性化管理平臺的應用需求。專業(yè)的字庫技術(shù)二十年字庫的技術(shù)沉淀,方正字庫全面支持方正系統(tǒng)和第三方系統(tǒng),前端顯示和后端輸出保持一致,做到“所見即所得”,產(chǎn)品系列化、標準化、通用化,開放性產(chǎn)品跨平臺使用。通過使用方正字庫,實現(xiàn)了圖書真正意義上的原版原式。對于生僻字,方正采用補字造字方法,依據(jù)一定的編碼標準形成規(guī)范字庫。解決圖書加工中生僻字無法實現(xiàn)數(shù)字化的問題。完善的版權(quán)控制方正通過數(shù)字版權(quán)保護技術(shù)(DigitalRightsManagement,即DRM)和CEB版式文件技術(shù)來防止數(shù)據(jù)的非法拷貝,不僅為用戶實現(xiàn)了版權(quán)的維護和管理,還加快了圖書資源在大型內(nèi)容庫中獲取或續(xù)訂許可證的過程,從而開拓了一個潛力無限的受用范圍,提高了用戶對在線服務的滿意度。附錄二:成功案例(1)國禮-中華數(shù)字書苑2009年1月27日至2月2日隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,信息的傳播突破了時間和空間的限制,數(shù)字出版物的出現(xiàn)更是為人類不同文明之間的交流變得更為暢通。此次總理出訪選擇了電子書庫“中華數(shù)字書苑”饋贈劍橋大學,就是希望通過其收錄的中國出版的20萬種、內(nèi)容涉及中國政治、經(jīng)濟、歷史、文化等各個領(lǐng)域的電子圖書,讓劍橋大學師生、讓世界更好地了解中國。中華數(shù)字書苑所有內(nèi)容的制作都采用了本方案所描述的數(shù)字化技術(shù)及方正數(shù)字出版技術(shù),是目前國內(nèi)最高水平的數(shù)字化應用方案。(2)新聞出版總署人民出版社2009年10月雙層PDF加工制造項目形成一套完整的標準化的電子數(shù)據(jù)。具體包括:①掃描的圖像文件。圖像文件指的是從封面到封底,一本書所包含的所有頁的掃描圖。書內(nèi)頁插圖、圖表等非文本信息單獨提供掃描圖。②文本文件。文本文件指的是掃描的圖像文件經(jīng)OCR識別及人工校對后,識別錯誤率為萬分之一以內(nèi)的XML文件。圖書章節(jié)目錄單獨制作XML文件。③PDF文件。將圖像和文本制成雙層PDF文件,圖在上,文本在下。同時制作單層純圖像PDF文件,黑白圖片精度為600dpi,灰度和彩色為300dpi,可供按需印刷使用。④書目數(shù)據(jù)。提供所加工圖書的書目信息。⑤排版文件。與PDF完全一致的可進行修改并能夠重新生成PDF的排版文件或加工文件。(3)國家圖書館地方志第四期數(shù)字化加工方案介紹《國家圖書館地方志》第四期數(shù)字化加工項目內(nèi)容:完成國家圖書館館藏的地方志中50萬筒子頁的數(shù)字化加工。數(shù)字化加工的特點:針對圖書印刷品影像開發(fā)的自動版面分析工具,自動記錄版面信息。系統(tǒng)采用方正超大字符集,符合GB18030-2005標準,并具有UNICODE5.0的轉(zhuǎn)換工具,采用五筆字型輸入法和方正的典碼輸入法進行漢字錄入,對常用漢字采用五筆字型進行錄入,對生僻字采用方正典碼輸入法進行錄入,實現(xiàn)效率和功能有效結(jié)合。采用雙工雙錄計算機自動比對及縱向校對和橫向校對等措施進行校對,在保證操作效率的前提下降低差錯率。對生僻字、替代字提供批量修整功能,以保證成品隨著操作技能的提高的質(zhì)量不斷改進。自動化版面還原,根據(jù)版面分析結(jié)果實現(xiàn)版面自動還原,大大提高了操作效率。一體化作業(yè)管理系統(tǒng),管理從前端工序到后端產(chǎn)品輸出的整個操作過程,保證操作過程的有效管理和高效率。(4)天一閣《天一閣古籍數(shù)字化系統(tǒng)》天一閣藏書樓是我國現(xiàn)存歷史最久的私家藏書樓,也是世界上現(xiàn)存最早的三個私家藏書樓之一?,F(xiàn)藏各類古籍近30萬卷,其中珍槧善本8萬卷,尤以明代地方志和科舉錄最為珍貴。天一閣古籍數(shù)字化項目正式啟動始于今年4月,第一部走上數(shù)字化“變身”平臺的古籍是銅活字版的《古今圖書集成》,這是一部罕見的大書,全書共10040卷,天一閣保存至今的有8700多卷。08年年底,方正中標了“寧波天一閣博物館古籍數(shù)字化加工、系統(tǒng)軟件開發(fā)、系統(tǒng)集成項目”。幫助天一閣完成150萬筒子頁古籍數(shù)字化加工項目。天一閣古籍數(shù)字化系統(tǒng)建設(shè)的目的是通過數(shù)字加工將館藏古籍轉(zhuǎn)換成影像數(shù)據(jù)和全文數(shù)據(jù),制作古籍文獻書目數(shù)據(jù)庫和古籍全文數(shù)據(jù)庫等數(shù)字資源,使古籍資源得到再生性保護。(5)民國期刊庫《民國期刊》特色資源建設(shè)《民國期刊》特色資源庫的建設(shè),方正幫助用戶完成了600余種、2萬余期的民國期刊和報紙的數(shù)字化加工和應用,為研究民國時期的政治、經(jīng)濟、文化教育、工業(yè)、農(nóng)業(yè)、商業(yè)等各方面提供強大的文獻保障。《民國期刊》特色資源庫不僅僅完成了數(shù)字化加工的任務,同時通過對原刊原樣影印制作,給讀者帶來的不僅是各種民國期刊的原貌展示、讓讀者了解那一時期社會生活和人文風貌;還可以同時對所有書中的每一篇文章標題進行檢索、幫助讀者快速找到需要的內(nèi)容。(1)收錄內(nèi)容:千余種有價值的民國期刊、幾十種有價值的民國報紙、其他有價值的民國出版物(2)涵蓋范圍:民國期刊庫以政治法律、文化教育、歷史地理為主,經(jīng)濟、文學等為輔,收錄有價值的民國期刊。從1902年出版的《大路報》,到1954年結(jié)束發(fā)行的《當代日報》,跨度52年,是當時歷史社會的最真實紀錄,傳承再現(xiàn)了中華民族深刻的思想淵源和歷史文化底蘊。(6)國學要覽數(shù)據(jù)庫方正國學要覽庫完成了6千余種、5萬多卷古籍內(nèi)容的數(shù)字化,其中包括義理之學、考據(jù)之學、辭章之學、經(jīng)世之學、科技之學在內(nèi)的,承載著中國傳統(tǒng)文明精髓的古籍圖書。國學要覽數(shù)據(jù)庫根據(jù)由北京大學鉆研古籍圖書的專家編制分類方法完成其應用分類,在古籍常用的四部分類法基礎(chǔ)上,向目前在中國圖書館界影響最大的《中國圖書館圖書分類法》靠攏,按照社會科學、自然科學、綜合性圖書的序列安排類目,總共分為二十二個一級分類,大類下又分若干二級分類。方便讀者檢索和應用。附錄三:方正博通數(shù)字檔案管理平臺(1)目前產(chǎn)品版本產(chǎn)品名稱版本通用版本解決方案方正博通數(shù)字檔案管理平臺軟件(館版)V3.1方正博通數(shù)字檔案管理平臺軟件(處室版)V3.1方正博通現(xiàn)行文件中心(江蘇推廣版)V1.0方正博思文檔采集工具軟件V2.0方正銳思文字識別工具軟件V2.0行業(yè)版本解決方案出入境檢驗檢疫行業(yè)檔案管理系統(tǒng)V3.0公安行業(yè)檔案管理系統(tǒng)V3.0檢察院行業(yè)檔案管理系統(tǒng)V2.5法院行業(yè)檔案管理系統(tǒng)V3.1.1煤炭行業(yè)檔案管理系統(tǒng)V3.1軍隊后勤檔案信息綜合管理系統(tǒng)V3.1.1核工業(yè)檔案及新聞宣傳綜合資源一體化管理系統(tǒng)一期V3.0;二期V3.1(2)方正博通數(shù)字檔案管理平臺軟件概述集文檔一體化、館室一體化、館網(wǎng)一體化的統(tǒng)一平臺B/S結(jié)構(gòu)有效滿足檔案信息資源遠程服務和利用數(shù)字化檔案與傳統(tǒng)檔案并存的統(tǒng)一管理模式開放的編目體系架構(gòu)可靈活擴展跨庫檢索,跨不同種類信息資源檢索真正意義的數(shù)字檔案館(3)方正博通應用領(lǐng)域方正博通數(shù)字檔案一體化管理平臺適用于國家各級綜合檔案館、專業(yè)檔案館,政府機構(gòu),軍隊、國家科研、教育等事業(yè)單位的檔案館、檔案室、機要室(保密室),企業(yè)檔案館和檔案處(室)。方正博通采用方正博思內(nèi)容管理平臺作為基礎(chǔ)數(shù)據(jù)管理平臺,利用方正博思對文字、圖片、視音頻等各種形式數(shù)字化內(nèi)容的管理優(yōu)勢,結(jié)合傳統(tǒng)檔案管理業(yè)務,以文檔一體化為原則,構(gòu)建成既能同時管理各種格式的電子公文、電子檔案、多媒體資料,又能夠?qū)n案采集、管理、利用提供支持的強大的數(shù)字檔案管理平臺。其目標通過對館藏檔案數(shù)字化、增量檔案電子化,數(shù)字檔案管理規(guī)范化、自動化實現(xiàn)檔案信息資源廣泛利用和高度共享。博通檔案應用架構(gòu)圖方正博通數(shù)字檔案管理平臺結(jié)構(gòu)圖方正博通數(shù)字檔案管理平臺軟件為了滿足檔案館和檔案室不同層次用戶需求,產(chǎn)品劃分為檔案處(室)版和數(shù)字檔案館版兩個版本。方正博通檔案處(室)版方正博通檔案處(室)適用于政府、軍隊、企事業(yè)單位內(nèi)部各級立檔單位的檔案處(室)。實現(xiàn)立檔單位對電子文檔的接收、轉(zhuǎn)換,檔案管理與存儲及檔案移交到上級檔案館的全流程管理。產(chǎn)品功能特點真正的文檔一體化,全面覆蓋文件生命周期管理開放式的體系架構(gòu)和數(shù)據(jù)標準,實現(xiàn)OA系統(tǒng)文件向檔案管理系統(tǒng)的自動歸檔支持國務院辦公廳、中央辦公廳采用的公文傳輸系統(tǒng)和標準電子公文格式,全面實現(xiàn)文件生命周期管理數(shù)字化檔案管理,實現(xiàn)全文檢索可同時管理檔案目錄和各種類型的電子檔案原文。不必記憶復雜的目錄信息,輕松實現(xiàn)跨檔案庫的全文檢索全文檢索百萬記錄級數(shù)據(jù),查詢數(shù)據(jù)響應速度不超過1秒多種便捷的檢索途徑,方便遠程借閱利用突破目錄檢索的限制和不便,實現(xiàn)電子檔案全文檢索、跨庫自由檢索、模糊檢索、高級檢索支持檔案網(wǎng)絡借閱、網(wǎng)上移交,實現(xiàn)檔案信息廣泛利用、提高管理效率電子檔案安全保護屏障可將包括AUTOCAD在內(nèi)的各種格式電子文檔自動轉(zhuǎn)換成符合國家檔案局標準的安全電子檔案格式,統(tǒng)一瀏覽器調(diào)閱。對電子檔案提供文檔級安全保護,有效防篡改、防擴散加強內(nèi)部審計,數(shù)據(jù)日志自動記錄每份檔案數(shù)據(jù)的操作方正博通數(shù)字檔案管理平臺檔案處(室)版架構(gòu)圖方正博通數(shù)字檔案館版方正博通檔案館版適用于國家各級綜合檔案館、專業(yè)檔案館,政府部門、事業(yè)單位、大中型集團企業(yè)的檔案館。以檔案信息資源服務為中心,實現(xiàn)傳統(tǒng)檔案管理上的數(shù)字檔案管理。涵蓋檔案的數(shù)字化創(chuàng)建、檔案管理及存儲、檢索利用和檔案發(fā)布四個階段。可集成現(xiàn)行文件中心,促進政務公開,發(fā)揮現(xiàn)行文件服務公眾的作用。方正文檔、圖片數(shù)字化處理模塊提供對紙質(zhì)文檔、圖片的掃描、管理、修版、著錄、入庫的數(shù)字化創(chuàng)建全過程應用。方正銳思文字識別軟件檔案版在完成文字識別功能的同時實現(xiàn)自動入庫。數(shù)據(jù)轉(zhuǎn)換功能提供了對用記歷史數(shù)據(jù)的安全遷移方面的應用。檔案管理及存儲集中檔案業(yè)務管理和系統(tǒng)管理以及存儲策略等方面的管理功能。檔案利用通過多種高效的檢索工具實現(xiàn)靈活便捷的借閱服務和強大的跨媒體的檔案發(fā)布功能。實現(xiàn)互聯(lián)網(wǎng)站、政務門戶網(wǎng)站的動態(tài)實時發(fā)布、光盤數(shù)據(jù)發(fā)布等。并不斷通過系統(tǒng)良好的擴展性來滿足更多新技術(shù)的功能,實現(xiàn)未來檔案發(fā)布及呈現(xiàn)模式。方正博通數(shù)字檔案管理平臺檔案館版架構(gòu)圖產(chǎn)品功能特點高效的檔案數(shù)字化創(chuàng)建專為檔案數(shù)字化加工量身設(shè)計,集掃描、管理、修版、圖像壓縮、著錄、自動入庫于一體的檔案數(shù)字化加工工具,實現(xiàn)與檔案管理平臺的無縫連接。針對不同類型檔案特點,分別提供紙制文檔、圖片、聲像的專業(yè)檔案數(shù)字化創(chuàng)建工具,并做到與硬件無關(guān)提供自動著錄和在線OCR文字識別,極大減輕檔案管理者的工作量。多頁掃描文檔自動合成PDF或CEB,符合國家檔案局規(guī)定的檔案圖像存儲格式采用先進的多媒體圖像壓縮技術(shù),實現(xiàn)大文件數(shù)據(jù)高壓縮比不失真,便于網(wǎng)絡發(fā)布和瀏覽促進檔案管理規(guī)范化、自動化先進的工作流引擎技術(shù),圖形化界面靈活定制各項檔案業(yè)務流程,實現(xiàn)業(yè)務自動處理規(guī)范業(yè)務管理,實現(xiàn)業(yè)務流程實時監(jiān)控數(shù)字化與傳統(tǒng)檔案管理模式的完美結(jié)合基于先進的內(nèi)容管理技術(shù),在傳統(tǒng)檔案管理流程下,實現(xiàn)各類數(shù)字化檔案的“收、管、用”支持傳統(tǒng)案卷管理與簡化立卷管理并存可集成現(xiàn)行文件中心,促進政務公開目前許多政府部門的檔案館都有一個社會職能,就是保存并管理現(xiàn)行文件,并向社會公眾提供現(xiàn)行文件查詢檢索服務。集成現(xiàn)行文件中心,促進政府、企業(yè)信息資源的開發(fā)利用。實現(xiàn)對現(xiàn)行文件的集中管理,涵蓋各種格式電子文件的實時收集、整理、審核、檢索、自動歸檔、發(fā)布利用、統(tǒng)計分析的高效管理。全面提升檔案信息服務水平實現(xiàn)跨媒體的檔案發(fā)布服務-網(wǎng)絡借閱、網(wǎng)站信息發(fā)布、光盤發(fā)布、檔案網(wǎng)絡征集等多種信息服務途徑可集成檔案信息服務網(wǎng)站發(fā)布、現(xiàn)行文件網(wǎng)站發(fā)布,實現(xiàn)館、網(wǎng)一體化。更好地為公眾提供信息服務,提高政府、企業(yè)信息資源開發(fā)利用水平提供符合國際標準的通用開發(fā)接口,方便其他應用系統(tǒng)共享信息資源可靠的海量數(shù)據(jù)存儲管理支持TB級海量數(shù)據(jù)的集中/分布式存儲、集中/分布式管理,提高海量數(shù)據(jù)訪問效率支持在線、近線、離線多級存儲管理,磁盤陣列、光盤庫、磁帶庫的存儲介質(zhì)以及SAN、NAS等存儲架構(gòu)數(shù)字版權(quán)保護加強電子檔案安全統(tǒng)一身份管理實現(xiàn)統(tǒng)一權(quán)限管理、安全訪問控制和單點登錄數(shù)字水印保護電子檔案發(fā)布的版權(quán)和防篡改電子檔案安全瀏覽器可對檔案信息瀏覽、下載、打印進行嚴格授權(quán)功能描述公文處理系統(tǒng)提供了簡單的電子文件公文庫,可以實現(xiàn)收文、發(fā)文的一般操作,實現(xiàn)簡單的OA公文流轉(zhuǎn)功能。公文打印系統(tǒng)提供常用的收發(fā)文模版,可以按照類別、日期等條件進行檢索打印。文件收集文件收集模塊專門用于接收OA系統(tǒng)、現(xiàn)行文件中心或者其他需要變成檔案的文件。這些文件可以經(jīng)過加入新卷或者已有卷,審批歸檔后進入正式的檔案庫;或者經(jīng)過簡化立卷后進入正式的檔案庫。也可以將一些資料性的文件轉(zhuǎn)成資料;對于不合格的文件,檔案管理員還可以進行刪除操作,也可以進行重新修改。紙質(zhì)檔案數(shù)字化部分館藏檔案是指對利用率高的紙質(zhì)檔案、圖片檔案等以及珍貴的歷史檔案,對它們進行數(shù)字化加工,并將數(shù)字化信息的圖文數(shù)據(jù)庫存儲到海量存儲載體中,采用OCR技術(shù),實現(xiàn)掃描結(jié)果的文本轉(zhuǎn)化。數(shù)字化采集與轉(zhuǎn)換后的電子文件格式符合國家《電子文件歸檔與管理規(guī)范》要求。掃描形成的電子文檔(主要記錄文章內(nèi)容),可以方便實現(xiàn)全文檢索,并且執(zhí)行效率高。系統(tǒng)還提供文本數(shù)字化上載工具,自動提取部分元數(shù)據(jù)信息。檔案接收本模塊管理是館藏系統(tǒng)重要的功能,主要是在線接收或者離線接收各個立檔單位的電子數(shù)據(jù)和實體數(shù)據(jù),并能夠根據(jù)接收的情況自動進行各種數(shù)據(jù)的統(tǒng)計和管理。著錄編目可以著錄各種館藏檔案數(shù)據(jù),包含建國前、建國后和革命歷史時期的各種類型的館藏檔案,是館藏軟件中較為重要的數(shù)據(jù)采集窗口。檔案保管本模塊用于記錄、控制、統(tǒng)計庫房溫濕度的采集情況,記錄檔案的存放位置以及打印檔案存放位置索引,并可記載庫房檢查情況。檔案鑒定對保管期限已到的文件級/案卷級檔案進行鑒定,以決定是否有繼續(xù)保存的價值,如果有則修改保管期限及記載修改情況,繼續(xù)保存,否則進行銷毀。同時本模塊也可鑒定檔案是否開放、是否控制,達到開放鑒定的功能,系統(tǒng)支持單卷、單件開放,也支持批量開放。檔案統(tǒng)計統(tǒng)計是以表冊或數(shù)字的形式,揭示檔案和檔案工作中諸現(xiàn)象的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 5 觀察一瓶水教學設(shè)計-2023-2024學年科學一年級下冊教科版
- 標識項目制作合同范本
- 4 保溫和散熱 教學設(shè)計-2023-2024學年科學五年級上冊人教鄂教版
- Unit 1 Lesson 5 Where Is Danny(教學設(shè)計)-2024-2025學年冀教版(三起)英語四年級下冊
- 布料加工合同范本
- 法律合作建房合同范本
- 蜜餞工廠轉(zhuǎn)讓合同范本
- 20 美麗的小興安嶺 教學設(shè)計-2024-2025學年三年級語文上冊統(tǒng)編版
- 維修閥門合同范本
- 成華區(qū)租房合同范本
- 軌道機車制動系統(tǒng)智能產(chǎn)業(yè)化基地項目可行性研究報告
- 殘疾人就業(yè)困境及其破解對策
- 【攜程公司的戰(zhàn)略環(huán)境PEST探析和SWOT探析7500字】
- 《油液分析技術(shù)》課件
- 運動療法技術(shù)學
- 塔吊租賃(大型機械)-招標文件模板(完整版)2021.5.13
- 物品移交接收單(模板)
- 肺透明膜病課件
- 四川省政府采購專家考試試題
- 消防工程擬投入主要施工設(shè)備機具表
- 《戰(zhàn)國策》教學講解課件
評論
0/150
提交評論