



下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、手寫數(shù)字識(shí)別的流程:1對(duì)所給出的圖像進(jìn)行預(yù)處理使得方面后面的數(shù)字識(shí)別操作,包括圖像的二值化等2對(duì)圖像進(jìn)行圖像的形態(tài)學(xué)操作,讓數(shù)字變得閉合,方便進(jìn)行數(shù)學(xué)形態(tài)學(xué)的計(jì)算3用鼠標(biāo)提取每個(gè)數(shù)字的圖像,并對(duì)每個(gè)數(shù)字圖像作出包含連通區(qū)域的矩陣4根據(jù)數(shù)字的歐拉數(shù)和每個(gè)數(shù)字的其他不同特征識(shí)別數(shù)字5最后把識(shí)別的數(shù)字保存起來下面分別進(jìn)行論述:1數(shù)字圖像的二值化原圖如下:2圖像的形態(tài)學(xué)操作,讓數(shù)字中未閉合的數(shù)字6、8、9閉合處理后的圖像如下:3用鼠標(biāo)提取每個(gè)數(shù)字的圖像,并對(duì)每個(gè)數(shù)字圖像作出包含連通區(qū)域的矩陣在提取圖像時(shí)要注意,盡量用最小的矩形包括這個(gè)數(shù)字,并且不要遺漏數(shù)字的任何部分在外面,這一步對(duì)后面的識(shí)別至關(guān)重要,
2、會(huì)非常影響數(shù)字的識(shí)別。提取出來二值圖像后,并把它變換成一個(gè)數(shù)字矩陣,這個(gè)矩陣會(huì)對(duì)圖像中不同的連通區(qū)域作出不同的標(biāo)記,這樣方便下面進(jìn)行數(shù)字矩陣的特征提取。4根據(jù)數(shù)字的歐拉數(shù)和每個(gè)數(shù)字的其他不同特征識(shí)別數(shù)字識(shí)別數(shù)字8,只有8的歐拉數(shù)為2識(shí)別數(shù)字1,其離心率最大(0.9),并且它的最小外包矩形的長(zhǎng)度大于寬度的兩倍對(duì)數(shù)字6,其歐拉數(shù)為1,用一條水平掃描線從上半部分進(jìn)行掃描,有兩個(gè)交點(diǎn)對(duì)數(shù)字4,其歐拉數(shù)為1,用距離右邊框幾個(gè)象素的垂直線與它相交,有兩個(gè)象素,即可識(shí)別對(duì)數(shù)字0,其歐拉數(shù)為1,用一條水平掃描線從中間與它相交,有兩個(gè)交點(diǎn),用一條垂直掃描線從中間與它相交,也有兩個(gè)交點(diǎn),即可識(shí)別對(duì)數(shù)字9,其歐拉數(shù)
3、為1,用一條水平掃描線從下半部分進(jìn)行掃描,有兩個(gè)交點(diǎn),與6相反對(duì)數(shù)字2,其歐拉數(shù)為0,用距上邊框十幾個(gè)象素的水平線與它相交,有4個(gè)交點(diǎn)對(duì)3,用距中間位置的垂直線與它相交,有3個(gè)交點(diǎn),且歐拉數(shù)為0對(duì)數(shù)字7,其歐拉數(shù)為0,從中間位置垂直掃描,有兩個(gè)交點(diǎn)剩下的就是數(shù)字5了試驗(yàn)結(jié)果分析:總共進(jìn)行了五組的試驗(yàn),試驗(yàn)結(jié)果如下:b=1234567895b=1534567890b=5534567855b=1535557895b=1555565895從以上的試驗(yàn)結(jié)果可以看出:如果用鼠標(biāo)提取圖像時(shí),仔細(xì)小心的提取,會(huì)取得不錯(cuò)的試驗(yàn)效果,但是對(duì)于數(shù)字2和數(shù)字0,往往會(huì)有一定的誤差。后三組試驗(yàn),在提取數(shù)字時(shí)有意的將數(shù)
4、字區(qū)域擴(kuò)大或者縮小,可以看出這樣對(duì)試驗(yàn)結(jié)果的影響很大,會(huì)造成很大的誤差,這種識(shí)別方法的識(shí)別率大大降低。手寫數(shù)字識(shí)別的原理及應(yīng)用一、引言手寫數(shù)字識(shí)別是“光學(xué)字符識(shí)別技術(shù)”(簡(jiǎn)稱OCR)的一個(gè)分支,它研究的對(duì)象是:如何利用電子計(jì)算機(jī)自動(dòng)辨認(rèn)人手寫在紙張上的阿拉伯?dāng)?shù)字。在整個(gè)OCR領(lǐng)域中,最為困難的就是脫機(jī)手寫字符的識(shí)別。到目前為止,盡管人們?cè)诿摍C(jī)手寫英文、漢字識(shí)別的研究中已取得很多可喜成就,但距實(shí)用還有一定距離。而在手寫數(shù)字識(shí)別這個(gè)方向上,經(jīng)過多年研究,研究工作者已經(jīng)開始把它向各種實(shí)際應(yīng)用推廣,為手寫數(shù)據(jù)的高速自動(dòng)輸入提供了一種解決方案。二、研究的實(shí)際背景字符識(shí)別處理的信息可分為兩大類:一類是文字
5、信息,處理的主要是用各國(guó)家、各民族的文字(如:漢字、英文等)書寫或印刷的文本信息,目前在印刷體和聯(lián)機(jī)手寫方面技術(shù)已趨向成熟,并推出了很多應(yīng)用系統(tǒng);另一類是數(shù)據(jù)信息,主要是由阿拉伯?dāng)?shù)字及少量特殊符號(hào)組成的各種編號(hào)和統(tǒng)計(jì)數(shù)據(jù),如:郵政編碼、統(tǒng)計(jì)報(bào)表、財(cái)務(wù)報(bào)表、銀行票據(jù)等等,處理這類信息的核心技術(shù)是手寫數(shù)字識(shí)別。這幾年來我國(guó)開始大力推廣的“三金”工程在很大程度上要依賴數(shù)據(jù)信息的輸入,如果能通過手寫數(shù)字識(shí)別技術(shù)實(shí)現(xiàn)信息的自動(dòng)錄入,無疑會(huì)促進(jìn)這一事業(yè)的進(jìn)展。因此,手寫數(shù)字的識(shí)別研究有著重大的現(xiàn)實(shí)意義,一旦研究成功并投入應(yīng)用,將產(chǎn)生巨大的社會(huì)和經(jīng)濟(jì)效益。三、研究的理論意義手寫數(shù)字識(shí)別作為模式識(shí)別領(lǐng)域的一個(gè)
6、重要問題,也有著重要的理論價(jià)值:1、阿拉伯?dāng)?shù)字是唯一的被世界各國(guó)通用的符號(hào),對(duì)手寫數(shù)字識(shí)別的研究基本上與文化背景無關(guān),這樣就為各國(guó)、各地區(qū)的研究工作者提供了一個(gè)施展才智的大舞臺(tái)。在這一領(lǐng)域大家可以探討,比較各種研究方法。2、由于數(shù)字識(shí)別的類別數(shù)較小,有助于做深入分析及驗(yàn)證一些新的理論。這方面最明顯的例子就是人工神經(jīng)網(wǎng)絡(luò),相當(dāng)一部分的人工神經(jīng)網(wǎng)絡(luò)模型都以手寫數(shù)字識(shí)別作為具體的實(shí)驗(yàn)平臺(tái),驗(yàn)證理論的有效性,評(píng)價(jià)各種方法的優(yōu)缺點(diǎn)。3、盡管人們對(duì)手寫數(shù)字的識(shí)別已從事了很長(zhǎng)時(shí)間的研究,并已取得了很多成果,但到目前為止機(jī)器的識(shí)別本領(lǐng)還無法與人的認(rèn)知能力相比,這仍是一個(gè)有難度的開放問題。4、手寫數(shù)字的識(shí)別方法
7、很容易推廣到其它一些相關(guān)問題,一個(gè)直接的應(yīng)用是對(duì)英文這樣的拼音文字的識(shí)別。事實(shí)上,很多學(xué)者就是把數(shù)字和英文字母的識(shí)別放在一塊兒研究的。四、基于手寫數(shù)字識(shí)別的典型應(yīng)用手寫數(shù)字識(shí)別有著極為廣泛的應(yīng)用前景,這也正是它受到世界各國(guó)的研究工作者重視的一個(gè)主要原因。下面我們將介紹基于手寫數(shù)字識(shí)別的應(yīng)用系統(tǒng)的特殊要求,以及一些以手寫數(shù)字識(shí)別技術(shù)為基礎(chǔ)的典型應(yīng)用。(一)手寫數(shù)字識(shí)別在大規(guī)模數(shù)據(jù)統(tǒng)計(jì)中的應(yīng)用在大規(guī)模的數(shù)據(jù)統(tǒng)計(jì)(如:行業(yè)年鑒、人口普查等)中,需要輸入大量的數(shù)據(jù),以前完全要手工輸入則需要耗費(fèi)大量的人力和物力。近年來在這類工作中采用OCR技術(shù)已成為一種趨勢(shì)。因?yàn)樵谶@種應(yīng)用中,數(shù)據(jù)的錄入是集中組織的,所
8、以往往可以通過專門設(shè)計(jì)表格和對(duì)書寫施加限制以便于機(jī)器的自動(dòng)識(shí)別。目前國(guó)內(nèi)的大多數(shù)實(shí)用系統(tǒng)都要求用戶按指定規(guī)范在方格內(nèi)填寫。另外,這些系統(tǒng)往往采用合適的用戶界面對(duì)識(shí)別結(jié)果做全面的檢查,最終保證結(jié)果正確無誤??梢钥闯?,這是一類相對(duì)容易的應(yīng)用,對(duì)識(shí)別核心算法的要求比較低,是目前國(guó)內(nèi)很多單位應(yīng)用開發(fā)的熱點(diǎn)。(二)手寫數(shù)字識(shí)別在財(cái)務(wù)、稅務(wù)、金融領(lǐng)域中的應(yīng)用財(cái)務(wù)、稅務(wù)、金融是手寫數(shù)字識(shí)別大有可為的又一領(lǐng)域。隨著我國(guó)經(jīng)濟(jì)的迅速發(fā)展,每天等待處理的財(cái)務(wù)、稅務(wù)報(bào)表、支票、付款單等越來越多。如果能把它們用計(jì)算機(jī)自動(dòng)處理,無疑可以節(jié)約大量的時(shí)間金錢和勞力。與上面提到的統(tǒng)計(jì)報(bào)表處理相比,在這個(gè)領(lǐng)域的應(yīng)用難度更大,原因
9、有:1、對(duì)識(shí)別的精度要求更高;2、處理的表格往往不止一種,一個(gè)系統(tǒng)應(yīng)能智能地同時(shí)處理若干種表格;3、由于處理貫穿于整個(gè)日常工作之中,書寫應(yīng)盡量按一般習(xí)慣(如:不對(duì)書寫者的寫法做限定,書寫時(shí)允許寫連續(xù)的字串,而不是在固定的方格內(nèi)書寫),這樣對(duì)識(shí)別及預(yù)處理的核心算法要求也提高了。(三)手寫數(shù)字識(shí)別在郵件分揀中的應(yīng)用隨著人們生活水平的提高,經(jīng)濟(jì)活動(dòng)的發(fā)展,通信聯(lián)系的需求使信函的互換量大幅度增加,我國(guó)函件業(yè)務(wù)量也在不斷增長(zhǎng),預(yù)計(jì)到2000年,一些大城市的中心郵局每天處理量將高達(dá)幾百萬件,業(yè)務(wù)量的急劇上升使得郵件的分揀自動(dòng)化成為大勢(shì)所趨。在郵件的自動(dòng)分揀中,手寫數(shù)字識(shí)別(OCR)往往與光學(xué)條碼識(shí)別、人工輔助識(shí)別等手段相結(jié)合,完成郵政編碼的閱讀。目前使用量最大的OVCS分揀機(jī)的性能指標(biāo):OCR拒分率30%,OCR分揀差錯(cuò)率1.1%.五、手寫數(shù)字識(shí)別技術(shù)展望隨
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 全國(guó)粵教版信息技術(shù)八年級(jí)下冊(cè)第二單元第十五課《數(shù)碼顯示與無線通信的實(shí)現(xiàn)》教學(xué)設(shè)計(jì)
- 云南經(jīng)貿(mào)外事職業(yè)學(xué)院《社會(huì)問題與對(duì)策》2023-2024學(xué)年第二學(xué)期期末試卷
- 遼寧建筑職業(yè)學(xué)院《中學(xué)生物學(xué)課程標(biāo)準(zhǔn)與教材研究》2023-2024學(xué)年第二學(xué)期期末試卷
- 重慶移通學(xué)院《精細(xì)化工綜合實(shí)訓(xùn)》2023-2024學(xué)年第二學(xué)期期末試卷
- 廣西體育高等專科學(xué)?!斗b美學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 南昌交通學(xué)院《電子科學(xué)與技術(shù)專業(yè)創(chuàng)新課程》2023-2024學(xué)年第二學(xué)期期末試卷
- 克拉瑪依職業(yè)技術(shù)學(xué)院《新能源汽車檢測(cè)與維修》2023-2024學(xué)年第二學(xué)期期末試卷
- 濱州學(xué)院《酒店電子商務(wù)》2023-2024學(xué)年第二學(xué)期期末試卷
- 重慶工程職業(yè)技術(shù)學(xué)院《現(xiàn)代傳感器技術(shù)及虛擬儀器》2023-2024學(xué)年第二學(xué)期期末試卷
- 福建農(nóng)業(yè)職業(yè)技術(shù)學(xué)院《會(huì)計(jì)學(xué)基礎(chǔ)》2023-2024學(xué)年第二學(xué)期期末試卷
- DZ∕T 0399-2022 礦山資源儲(chǔ)量管理規(guī)范(正式版)
- 幼兒園強(qiáng)制報(bào)告制度培訓(xùn)
- GB/T 43700-2024滑雪場(chǎng)所的運(yùn)行和管理規(guī)范
- 魯迅《社戲》原文+賞析
- 幼兒教師之《幼兒游戲與指導(dǎo)》考試題庫(通用版)
- 中國(guó)建設(shè)銀行養(yǎng)老金融模式發(fā)展問題研究
- 關(guān)于布郎芬布倫納發(fā)展心理學(xué)生態(tài)系統(tǒng)理論
- 我們身邊的法律故事課件
- 執(zhí)行律師服務(wù)方案
- GB 24544-2023墜落防護(hù)速差自控器
- 2023年11月上海市教育委員會(huì)教育技術(shù)裝備中心公開招考3名工作人員筆試歷年高頻考點(diǎn)(難、易錯(cuò)點(diǎn)薈萃)附帶答案詳解
評(píng)論
0/150
提交評(píng)論