票據(jù)OCR在銀行事后后督系統(tǒng)的應(yīng)用_第1頁
票據(jù)OCR在銀行事后后督系統(tǒng)的應(yīng)用_第2頁
票據(jù)OCR在銀行事后后督系統(tǒng)的應(yīng)用_第3頁
票據(jù)OCR在銀行事后后督系統(tǒng)的應(yīng)用_第4頁
票據(jù)OCR在銀行事后后督系統(tǒng)的應(yīng)用_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、票據(jù)OCR在銀行后督系統(tǒng)的應(yīng)用北京文通科技有限公司2014-08-111 第一章引言 銀行業(yè)競爭日趨激烈,隨著銀行不斷擴(kuò)大自己的業(yè)務(wù)范圍,產(chǎn)生了越來越 多的紙質(zhì)憑證,傳統(tǒng)人工稽核票據(jù)模式在海量的憑證到來時(shí)已讓銀行稽核部門 不堪重負(fù)。長期以來,銀行檔案管理工作因管理手段落后而造成的一系列麻煩和困 惑,一直困擾著銀行界,在票據(jù)處理方面,多數(shù)銀行仍停留在 “人工分散處理 + 紙質(zhì)庫房保存 +人工查詢 ”的階段,成為阻礙金融電子化的薄弱環(huán)節(jié)。因此,建 設(shè)“集中、統(tǒng)一、規(guī)范、高效 ”的電子化票據(jù)處理中心,已成為銀行亟待解決的 問題。北京文通公司憑借多年在OCR領(lǐng)域的絕對優(yōu)勢,應(yīng)用文通銀行票據(jù)識別系 統(tǒng),

2、結(jié)合銀行實(shí)際工作特點(diǎn),和銀行業(yè)內(nèi)系統(tǒng)集成商密切合作,推出 銀行 票據(jù)事后監(jiān)督解決方案。使票據(jù)處理達(dá)到 “自動集中處理 +電子安全保存 +數(shù)據(jù)有 效應(yīng)用 ”的目標(biāo),不但保留了原始單據(jù)的圖像文件,而且對圖像文件進(jìn)行識別后 自動建立索引文件,進(jìn)一步完成原始數(shù)據(jù)與單據(jù)的勾對工作,快速找出有問題 的單據(jù),并能根據(jù)建立的索引很快找出原始圖像,進(jìn)行查詢和審核;能高效、 快捷準(zhǔn)確的完成事后監(jiān)督的工作 .2 第二章系統(tǒng)概述對于大型商業(yè)銀行以地、市級分行為單位,集中全轄業(yè)務(wù)檔案,采用中高 速掃描儀,批量錄入文檔影像 ,根據(jù)銀行的具體需求可以選用不同檔次的掃描 儀。根據(jù)不同檔案的特點(diǎn)、規(guī)范程度及查詢需求,分別采用人

3、工錄入、版面自 動分類、條碼識別、精確要素識別等手段,為檔案影像建立逐筆精確索引或小 批量精確索引 ,可大大減少手工錄入的工作量。在直轄市或省會城市分行,在本地建立電子檔案中心。以日期為單位,將 檔案電子影像和索引數(shù)據(jù)刻錄并保存至光盤,放入大容量光盤庫中。銀行管理 部門、業(yè)務(wù)部門、營業(yè)網(wǎng)點(diǎn)可通過網(wǎng)絡(luò),在被允許的授權(quán)范圍內(nèi),訪問光盤 庫,自動查詢相關(guān)的業(yè)務(wù)檔案影像。其他地市級城市分行,可由省級管理部門牽頭,建立區(qū)域性電子檔案中 心。地市分行完成檔案掃描以后,通過網(wǎng)絡(luò),將檔案影像及索引數(shù)據(jù)發(fā)送到區(qū) 域電子檔案中心,集中刻錄光盤,設(shè)置大容量光盤庫,集中歸檔存儲,自動受 理來自轄內(nèi)各分行的檔案影像查詢

4、請求。該模式適應(yīng)了當(dāng)前國內(nèi)銀行業(yè)由分散 處理向集中處理發(fā)展的趨勢。對于中小商業(yè)銀行,電子化水平起點(diǎn)高,數(shù)據(jù)集中程度高,網(wǎng)絡(luò)基礎(chǔ)好, 為建立全行電子檔案中心提供了有利條件。以分行為單位,集中全轄業(yè)務(wù)檔案,采用中高速掃描儀、平板掃描儀或攝 像系統(tǒng),批量錄入文檔影像。根據(jù)不同檔案的特點(diǎn)、規(guī)范程度及查詢需求,分 別采用人工錄入、版面自動分類、條碼識別、精確 3 要素識別等手段,為檔案 影像建立逐筆精確索引或小批量精確索引。在總行(或異地)建立統(tǒng)一的電子檔案中心。分行完成檔案錄入以后,通 過網(wǎng)絡(luò),將檔案影像及索引數(shù)據(jù)發(fā)送到電子檔案中心,集中刻錄光盤,設(shè)置大 容量光盤庫,集中歸檔存儲??傂泄芾聿块T、業(yè)務(wù)部

5、門、分行及營業(yè)網(wǎng)點(diǎn),可 通過網(wǎng)絡(luò),在被允許的授權(quán)范圍內(nèi),訪問電子檔案中心的光盤庫,自動查詢并 得到相關(guān)的業(yè)務(wù)檔案影像。該模式適應(yīng)了當(dāng)前國內(nèi)銀行業(yè)由分散處理向集中處 理發(fā)展的趨勢。建立電子檔案中心以后,可充分發(fā)揮電子影像記錄準(zhǔn)確、精度高、質(zhì)量 好、信息存儲量大、節(jié)省空間、規(guī)格統(tǒng)一的優(yōu)點(diǎn),便于信息交流、傳遞和收 集,并可更好地保護(hù)原始檔案,減少因原始檔案保管不當(dāng)而引發(fā)的潛在風(fēng)險(xiǎn)。對部分重要客戶,銀行可開放查詢接口??蛻粼谑跈?quán)范圍內(nèi),可自行訪問 和查閱到自己的業(yè)務(wù)憑證影像。 4 第三章系統(tǒng)結(jié)構(gòu)3.1 系統(tǒng)結(jié)構(gòu)票據(jù)圖像經(jīng)光刻機(jī)刻錄成光盤后放入光盤庫,供保管和查詢光盤庫中心服務(wù)器光刻機(jī)光盤服務(wù)器掃描儀采

6、用掃描方式,利用OCR識別系統(tǒng),自動完成儲蓄事后監(jiān)督和建立逐筆XX。掃描儀米用掃描方式,利用OCR識別系統(tǒng),自動完成儲蓄事后監(jiān)督和建立逐筆索 引。銀行內(nèi)部網(wǎng)絡(luò)查詢工作站各網(wǎng)點(diǎn)可查詢票據(jù)圖像、報(bào)表及其它數(shù)據(jù)、經(jīng)授權(quán)可打印。查詢工作站系統(tǒng)結(jié)構(gòu)分為兩層,全部票據(jù)集中在分行進(jìn)行處理,并集中保存縮微圖像 (部分票據(jù)可根據(jù)情況返還支行),各網(wǎng)點(diǎn)通過銀行內(nèi)部網(wǎng)絡(luò)進(jìn)行查詢。掃描儀主要處理儲蓄業(yè)務(wù)票據(jù),結(jié)合 OCR自動識別技術(shù),實(shí)現(xiàn)5 自動儲蓄事后監(jiān)督。中心服務(wù)器負(fù)責(zé)整個(gè)系統(tǒng)的運(yùn)行,光刻機(jī)負(fù)責(zé)縮微圖像的光盤刻錄工作, 光盤服務(wù)器負(fù)責(zé)縮微數(shù)據(jù)的存儲與管理。(二)、OCR識別流程及說明自動識別票據(jù)要素、自動勾對流水

7、,自動建立圖像索引,達(dá)到減員增效的 目的。其運(yùn)行如下圖所示:否人工補(bǔ)錄并勾對票據(jù)快速掃描OCR識別處理是否通過7/ 7OCR識別是自動勾對流水是否通過流水勾對是自動建立 xx 否特別處理說明:1快速掃描儀獲取圖像并進(jìn)行縮微處理,縮微后的票據(jù)提供給OCR識別系統(tǒng)進(jìn)行自動識別。2.OCR識別系統(tǒng)確定票據(jù)種類。63通過OCR技術(shù),提取票面信息,如日期、帳號、金額等,與復(fù)核文本進(jìn) 行核對(為保障OCR識別速度,需要較高的硬件配置)。4. 核對通過后,建立票據(jù) xx。5. 對于識別失敗的票據(jù),系統(tǒng)會自動將圖像發(fā)送到補(bǔ)錄機(jī)上,由人工依照票 據(jù)圖像進(jìn)行補(bǔ)錄,再與復(fù)核文本進(jìn)行勾對。第四章文通銀行票據(jù)識別系統(tǒng)特

8、性文通銀行票據(jù)識別系統(tǒng)是北京文通公司 在TH-OCR識別核心的基礎(chǔ)上開發(fā)的表格識別軟件,其不僅可以完成金融領(lǐng)域風(fēng) 險(xiǎn)監(jiān)督系統(tǒng)中銀行票據(jù)影像的 OCR識別,并且可以實(shí)現(xiàn)其它表格類影像的自動 識別(如各種申請表、測評表、定單、保險(xiǎn)單等)。票據(jù)識別系統(tǒng)有兩部份組 成:表格模板編輯器和表格分類識別核心。其中表格模板編輯器完成表格模板 的定制工作,并由識別模板指導(dǎo)識別核心進(jìn)行影像分類和識別。4.1 模板分類精細(xì)、準(zhǔn)確率高:模板分類的準(zhǔn)確率達(dá)到 98%左右,規(guī)范憑證模板分類準(zhǔn)確率超過 99%;字 段識別率高,單流水字段的識別率高于 90%。銀行票據(jù)識別系統(tǒng)不僅可以完成 一種憑證打印同一種交易的模板分類,并

9、可以完成同一種憑證打印多種交易以 及同一種憑證分多聯(lián)的憑證分類。本系統(tǒng)充分利于了憑證的標(biāo)題、框線、打印 文本等多種特征進(jìn)行模板的區(qū)分。4.2 支持多種字符類型的識別: 印刷體漢字、印刷體英文數(shù)字、手寫漢字、手寫數(shù)字、磁碼、復(fù)選框、條碼識別(一維條碼支持:Code39,7Code128, Code32, EAN-128, EAN-13 and JAN, EAN-8, UPC-A, UPC-E,Add2, Add5,BCD Matrix等;二維條碼支持:PDF417和 DataMatrix)等。4.3 模板編輯器便捷高效: 可以很便捷的制作出高識別率的模板。 第五章文通銀行票據(jù)識別系統(tǒng)功能5.1

10、模板編輯器5.1.1 文通銀行票據(jù)識別系統(tǒng)提供了便捷的模板制作工具: 模板編輯器。模板為識別過程提供指導(dǎo),包括分類標(biāo)識、定位標(biāo)識、識別要素等詳細(xì)信息。分類標(biāo)識信息包括: 圖像大小、版面特征文件、框線信息、標(biāo)題信息、文本信息等多種分類信息。在識別過程中具體采用的分類算法可以通過模板編輯器在主模板中配置。 識別區(qū)域支持多種字符類型:包括: 印刷體漢字、印刷體英文數(shù)字、手寫漢字、手寫數(shù)字、磁碼、復(fù)選框、條碼識別等,可以快速靈活配置識別單元的類型。5.1 .2票據(jù)分類功能強(qiáng)大: 系統(tǒng)同時(shí)支持表格框線(位置、顏色)分類、標(biāo)題單元(標(biāo)題內(nèi)容、標(biāo)題顏色)分類、文本區(qū)域(文本內(nèi)容、文本顏色)分類等,以最大限度

11、發(fā)掘不同憑證之間的差異。如框線顏色、標(biāo)題顏色均可以用來區(qū)分多聯(lián)憑證的不同聯(lián);文本內(nèi)容可以區(qū)分同一憑證打印多種交易的影像;文本顏色可以用來區(qū)分同一 種憑證分多聯(lián)并且不同聯(lián)之間框線顏色和標(biāo)題顏色均相同的影像。 85.2 識別預(yù)處理功能5.2.1 文通銀行票據(jù)識別系統(tǒng)在對影像進(jìn)行識別前做了多項(xiàng)預(yù)處理操作,以 為之后識別輸出最優(yōu)的圖像質(zhì)量,具體有糾偏、偏色校正、濾色、降噪、二值 化、增強(qiáng)識別單元對比度等功能。這些預(yù)處理功能均可通過參數(shù)靈活配置、自 由組合。5.3 識別性能5.3.1 適應(yīng)性強(qiáng):文通銀行票據(jù)識別系統(tǒng)簡體中文識別核心支持常用的宋體、仿宋、楷體、 黑體、隸書、幼圓等漢字字體。印刷體英文和數(shù)字同樣支持多種字體包括常見 的:Arial、 Times New Roman、AvantGarde、BookmanOldStyle、Helvetica、 Verdana 等多種字體。通過對銀行的幾輪測試對橫縱向壓縮后的數(shù)字識別有很好 的適應(yīng)性,能取得較高的識別率。5.3.2 票據(jù)分類精準(zhǔn):文通銀行票據(jù)識別系統(tǒng)有很強(qiáng)的版面區(qū)分能力,充分利于框線、框線顏 色、標(biāo)題內(nèi)容、標(biāo)題顏色、文本內(nèi)容、文本顏色等多種特征來進(jìn)行版面的區(qū) 分,版面識別的準(zhǔn)確率在 99%以上。5.3.3 識別類型豐富:系統(tǒng)支持印刷漢字識別、印刷英文識別、印刷數(shù)字識別、手寫漢字識別、 手寫英文識別、手寫數(shù)字識別、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論