手寫數(shù)字識(shí)別系統(tǒng)_第1頁(yè)
手寫數(shù)字識(shí)別系統(tǒng)_第2頁(yè)
手寫數(shù)字識(shí)別系統(tǒng)_第3頁(yè)
手寫數(shù)字識(shí)別系統(tǒng)_第4頁(yè)
手寫數(shù)字識(shí)別系統(tǒng)_第5頁(yè)
已閱讀5頁(yè),還剩10頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、基于SVM的手寫數(shù)字識(shí)別系統(tǒng)2150230509文 成軟件工程Introduction手寫數(shù)字識(shí)別系統(tǒng)手寫數(shù)字識(shí)別系統(tǒng): 手寫數(shù)字識(shí)別是符號(hào)識(shí)別的一個(gè)分支,雖然只是識(shí)別簡(jiǎn)單的10個(gè)數(shù)字,但卻有著非常大的實(shí)用價(jià)值。 在我們的日常生活中,每天都要進(jìn)行大量的文檔處理工作,稅單、銀行支票、匯款單、信用卡賬單的處理,以及郵局信函的分檢等等,如何利用計(jì)算機(jī)字符識(shí)別和文檔處理技術(shù),使人們從這些繁重的手工勞動(dòng)中解放出來(lái)已成為一個(gè)迫切需要解決的問(wèn)題。另外隨著平板電腦和觸摸屏手機(jī)的普及,手寫輸入成為了很多人的主要輸入方式。 手寫數(shù)字雖然只有10個(gè)種類,但很多情況下對(duì)識(shí)別的精度要求非常高,而且每個(gè)人都有不同的字跡,

2、要做到準(zhǔn)確地識(shí)別還是有一定難度的。況且在實(shí)際應(yīng)用中,手寫數(shù)字識(shí)別的精確度要求要比漢字嚴(yán)格的多,因?yàn)閿?shù)字識(shí)別經(jīng)常用在財(cái)務(wù)、金融等領(lǐng)域。Literature review目前解決該問(wèn)題的技術(shù)已經(jīng)相當(dāng)成熟。包括我們手機(jī)上的大部分輸入法不僅支持?jǐn)?shù)字的識(shí)別,而且支持漢字的識(shí)別,而且準(zhǔn)確度也比較高。手寫識(shí)別常見的例子:“SoGou拼音輸入法”Proposed methodSVM 支持向量機(jī)支持向量機(jī)(是借助最優(yōu)化方法來(lái)解決機(jī)器學(xué)習(xí)問(wèn)題的新工具,是克服“維數(shù)災(zāi)難”和“過(guò)學(xué)習(xí)等傳統(tǒng)困難的有力手段”)機(jī)理 來(lái)源于解決分類問(wèn)題:系統(tǒng)隨機(jī)產(chǎn)生一個(gè)超平面,通過(guò)訓(xùn)練移動(dòng)它,直到訓(xùn)練集合中不同的類別正好位于該超平面的不同

3、側(cè)面。 支持向量機(jī)的機(jī)理是:尋找一個(gè)滿足分類要求的最優(yōu)分類超平面,即兩側(cè)空白空間最大化。L1L2H1H2HSVM的特點(diǎn)與不足的特點(diǎn)與不足特點(diǎn):(1)非線性映射是SVM方法的理論基礎(chǔ),SVM利用內(nèi)積核函數(shù)代替向高維空間的非線性映射;(2)對(duì)特征空間劃分的最優(yōu)超平面是SVM的目標(biāo),最大化分類邊際的思想是SVM方法的核心;(3)支持向量是SVM的訓(xùn)練結(jié)果,在SVM分類決策中起決定作用的是支持向量。(4)SVM 的最終決策函數(shù)只由少數(shù)的支持向量所確定,計(jì)算的復(fù)雜性取決于支持向量的數(shù)目,而不是樣本空間的維數(shù),這在某種意義上避免了“維數(shù)災(zāi)難”。(5)少數(shù)支持向量決定了最終結(jié)果,這不但可以幫助我們抓住關(guān)鍵樣

4、本、“剔除”大量冗余樣本,而且注定了該方法不但算法簡(jiǎn)單(6) SVM(6) SVM在小樣本訓(xùn)練集上能夠得到比其它算法好很多的結(jié)果。在小樣本訓(xùn)練集上能夠得到比其它算法好很多的結(jié)果。兩個(gè)不足:(1) SVM(1) SVM算法對(duì)大規(guī)模訓(xùn)練樣本難以算法對(duì)大規(guī)模訓(xùn)練樣本難以實(shí)施實(shí)施(由于SVM是借助二次規(guī)劃來(lái)求解支持向量,而求解二次規(guī)劃將涉及m階矩陣的計(jì)算(m為樣本的個(gè)數(shù)),當(dāng)m數(shù)目很大時(shí)該矩陣的存儲(chǔ)和計(jì)算將耗費(fèi)大量的機(jī)器內(nèi)存和運(yùn)算時(shí)間。)(2) (2) 用用SVMSVM解決多分類問(wèn)題存在解決多分類問(wèn)題存在困難困難(經(jīng)典的支持向量機(jī)算法只給出了二類分類的算法,而在數(shù)據(jù)挖掘的實(shí)際應(yīng)用中,一般要解決多類的分

5、類問(wèn)題??梢酝ㄟ^(guò)多個(gè)二類支持向量機(jī)的組合來(lái)解決。)訓(xùn)練集訓(xùn)練集:MNIST手寫數(shù)字圖片庫(kù)(https:/ + SVM 實(shí)現(xiàn)/建立訓(xùn)練樣本Mat trainingDataMat(x, x, CV_32FC1, trainingData); Mat labelsMat (x, x, CV_32FC1, labels);/設(shè)置SVM參數(shù)CvSVMParams params; params.svm_type = CvSVM:C_SVC; params.kernel_type = CvSVM:LINEAR; params.term_crit = cvTermCriteria(CV_TERMCRIT_IT

6、ER, 100, 1e-6);/訓(xùn)練支持向量機(jī)CvSVM SVM; SVM.train(trainingDataMat, labelsMat, Mat(), Mat(), params);測(cè)試樣本預(yù)處理壓縮10*10實(shí)驗(yàn)演示(Windows)實(shí)現(xiàn):C+、Opencv + SVM實(shí)驗(yàn)演示(Android)實(shí)驗(yàn)結(jié)果分析當(dāng)手寫字體比較正式的情況下,其識(shí)別效果較好,但當(dāng)手寫字比較隨意時(shí),識(shí)別效果比較差。比如右圖橫著寫的8和加了噪音的3。這存在多個(gè)方面因素,一方面是由于訓(xùn)練樣本中不存在歪曲的樣本,另一方面用SVM解決多分類問(wèn)題存在困難。還有圖像預(yù)處理時(shí)將原圖像映射成10*10的,存在精度丟失。每個(gè)數(shù)字 100

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論