版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
手寫體數(shù)字識別第一章緒論 3課題研究的意義 3國內(nèi)外究動態(tài)目前水平 4手寫體數(shù)字識別簡介 4識別的技術(shù)難點 5主要研究工作 5第二章手寫體數(shù)字識別基本過程: 6手寫體數(shù)字識別系統(tǒng)結(jié)構(gòu) 6分類器設(shè)計 7特征空間優(yōu)化設(shè)計問題 7分類器設(shè)計準(zhǔn)則 7分類器設(shè)計基本方法 8判別函數(shù) 9訓(xùn)練與學(xué)習(xí) 10第三章貝葉斯方法應(yīng)用于手寫體數(shù)字識別 10貝葉斯由來 10貝葉斯公式 11貝葉斯公式Bayes決策理論: 12貝葉斯應(yīng)用于的手寫體數(shù)字理論部分: 15特征描述: 153.4.2最小錯誤分類器進(jìn)行判別分類 17第四章手寫體數(shù)字識別的設(shè)計流程及功能的具體實現(xiàn) 18手寫體數(shù)字識別的流程圖 18具體功能實現(xiàn)方法如下: 19結(jié)束語 25致謝詞 25參考文獻(xiàn) 26附錄 27摘要前景。果。10設(shè)計流程及功能的具體實現(xiàn),并對實驗結(jié)果做出簡單的分析。關(guān)鍵詞:手寫體數(shù)字識別 分類器 貝葉斯 vc++6.0錯誤!未找到引用源。ABSTRACTThedigitalrecognitionresearcheshowtotreatwithandrecognizepatternautomaticallythroughcomputerwithmatharithmetic.Alongwiththedevelopmentofcomputertechnology,humanneedmoreadvanceddigitalrecognitiontechnology.largenumbersofprinteddataandmanuscript,theautomaticrecognitindinpuofChinesecharacteecomesastringeasktherefohedigitalrecognitionwillhaveabroadapplicationprospectonliteratureretrieval,automation,postalservicesystem,bankbillprocessing.Inordertorecognizdigitharacterhefirstaskwehavetodoisfeatureextractifamap,aftethawehavetostorthefeaturinthecomputerThisprocesiscalle"thetraininghisprocescomparesthelfeatureandthestoredfeaturesinthecomputer.Thispapermainlybasicrecognitionandthedsalizationprocessoftenhand-writtendigitalsystem.TheconceptsrelatedtothedigitalrecognitioandthisdisciplinedvelopmentconditionThesecondchapterintroducethedigitarecognitionpocessThethirchaptemainlyintroducesdigitarecognitiowithBayes.Thefourtchapteintroducedesignprocesandfunctionscarriedout,theexperimentalresultandthesimpleanalysisKewords:Hand-WrittenDigitalRocognition Classification vc++6.0第一章 緒論課題研究的意義2010BarReading),人工輔助識別等手段OVCS1.1%動錄入,將會促進(jìn)這一事業(yè)的進(jìn)展。手寫體數(shù)字識別的研究不僅有很大的應(yīng)用價值,而且有重要的理論價值,由ANN國內(nèi)外究動態(tài)目前水平2070“光學(xué)字符別機(jī)(OCR2070OCR207080OCR2080OCR207080CCDBPLvQ)等。一般來說,各類特征各有優(yōu)勢。例如,使用統(tǒng)計特征的分類器易于訓(xùn)練,而且對于使用統(tǒng)計特征的分類器,在給定訓(xùn)練集上能夠得到相對較高識別率;而結(jié)構(gòu)特征的主要優(yōu)點之一是能描述字符的結(jié)構(gòu),在識別過程中能有效的結(jié)合幾何和結(jié)構(gòu)的知識,因此能夠得到可靠性較高的識別結(jié)果。神經(jīng)網(wǎng)絡(luò)具有自學(xué)習(xí)、容錯性、分類能力強(qiáng)和并行處理等特點。手寫體識別目前的研究方向是:特征提取問題,這個方面一是在現(xiàn)有基礎(chǔ)上進(jìn)行組合,另一個是引入新的特征技術(shù);分類器研究,一是多分類器繼集成,另一個方向是研究新的分類器。、手寫體數(shù)字識別簡介手寫體數(shù)字識別是指利用電子計算機(jī)自動辨認(rèn)手寫體阿拉伯?dāng)?shù)字的一種技(OCR)的范疇手寫體數(shù)字識別又分為聯(lián)機(jī)識別(on-line)和脫機(jī)識別(off-line)數(shù)字識別技術(shù)的研究是非常有價值的,它具有廣闊的應(yīng)用前景。手寫體數(shù)字識別系統(tǒng)性能的評價方法字識別的特點進(jìn)行修改和補(bǔ)充。對一個手寫數(shù)字識別系統(tǒng),可以用兩方面的指標(biāo)表征系統(tǒng)的性能:識別率A正確識別樣本數(shù)/全部樣本數(shù)誤識率S誤識樣本/全部樣本數(shù)*100%兩者的關(guān)系A(chǔ)+S=100%別的字符中,正確識別的比例,表示如下::識別精度:P=A/(A+S)*100%一個理想的系統(tǒng)應(yīng)是S盡量小,然而A盡可能大。識別的技術(shù)難點手寫體數(shù)字識別的研究是一項具有相當(dāng)難度的工作,此項工作的難點主要在于以下幾方面:分某些數(shù)字相當(dāng)困難。要識別的數(shù)字雖然只有十種,而且筆劃簡單,但同一數(shù)字寫法千差萬別,字識別系統(tǒng)。在實際應(yīng)用中,對數(shù)字的單字識別正確率的要求要比文字要苛刻得多。這而且數(shù)字識別經(jīng)常涉及的財會、金融領(lǐng)域,其嚴(yán)格性更是不言而喻的。因此,用戶的要求不是單純的高正確率,更重要的是極低的誤識率。大批量數(shù)據(jù)處理對系統(tǒng)速度又有相當(dāng)?shù)囊?,許多理論上很完美但速度過是具有重要意義的。主要研究工作本論文主要介紹了手寫體數(shù)字識別的一些基本知識和發(fā)展概況,然后介紹了貝葉斯理論分類器原理,及貝葉斯分類器應(yīng)用關(guān)于手寫體數(shù)字識別的設(shè)計原理,最后本文敘述了利用貝葉斯原理識別數(shù)字的開發(fā)過程。第二章 手寫體數(shù)字識別基本過程:手寫體數(shù)字識別系統(tǒng)結(jié)構(gòu)2-1所示,由數(shù)據(jù)獲取、預(yù)處理、特征確定分類器的具體參數(shù),完成分類器的設(shè)計。而分類決策在識別過程中起作用,對待識別的樣品進(jìn)行分類決策。未知類別模式的分類未知類別模式的分類分類結(jié)果獲取數(shù)據(jù)預(yù)處理特征提取分類決策訓(xùn)練樣本預(yù)處理特征選擇確定判別函數(shù)分類器設(shè)計改進(jìn)判別函數(shù)誤差檢驗圖2-1 手寫體數(shù)字識別系統(tǒng)結(jié)數(shù)字識別組成單元功能介紹如下。據(jù)類型有以下幾種。二維圖像:文字、指紋、臉譜照片等。一維波形:腦電圖、心電圖、季節(jié)震動波形等。物理參量和邏輯值:體溫、化驗數(shù)據(jù)、參量正確與否的描述。提取有用信息。較高的測量空間轉(zhuǎn)變?yōu)榫S數(shù)較低的特征空間。分類決策。在特征空間中用模式識別方法把被識別的對象歸為某一類。進(jìn)判別函數(shù)和誤差檢驗。分類器設(shè)計特征空間優(yōu)化設(shè)計問題的設(shè)計方法也無法提高分類器的準(zhǔn)確性。是特征的優(yōu)化組合。1、特征選擇2、特征提取假設(shè)已有D維特征向量空間,Y{y,y,...y},特征的組合優(yōu)化問題涉1 2 nD維特征空間中刪去一d維空X{xx,...x},d<DXY的一個子集,1 2 nxixi=yj特征提取則是找到一個映射關(guān)系:A:Y X (3.1)使新樣品特征描述維數(shù)比原維數(shù)低。其中每個分量xi是原特征向量各分量的函數(shù),即xi=xi(y1,y2,…,yD) (3.2)因此這兩種降維的基本方法是不同的。在實際應(yīng)用中可將兩者結(jié)合起來使用,比如先進(jìn)行特征選擇,即從原有的D維特征空間,刪去一些特征描述量,從而得到精簡后的特征空間,然后再進(jìn)一步特征提取,或反過來。在特征維數(shù)減少到同等水平時,其分類性能最佳。分類器設(shè)計準(zhǔn)則中去。具體步驟如下:第一步:建立特征空間中的訓(xùn)練集,已知訓(xùn)練集里每個點所屬類別。型。第三步:根據(jù)訓(xùn)練集中的樣品確定模型中的參數(shù)。別的點應(yīng)該屬于哪一類。有以下幾種。1、最小錯分率準(zhǔn)則小。2、最小風(fēng)險準(zhǔn)則基于最小風(fēng)險的貝葉斯決策規(guī)則是為了體現(xiàn)這一點而產(chǎn)生的。3、近鄰準(zhǔn)則均值距離,判斷距離哪個類近就屬于哪個類。4、Fisher準(zhǔn)則Fisher算法要解決的基本問題。5、感知準(zhǔn)則的基礎(chǔ)。分類器設(shè)計基本方法d準(zhǔn)則,使用什么方法,將已確定的d維特征空間劃分為決策域的問題。分類器設(shè)計有兩種基本方法:模板匹配法和判別函數(shù)法。1、模板匹配法(為近鄰,就按最近似的模板的類別作為自己的類別。2、判別函數(shù)法法。①直接使用Bayes驗概率及類條件概率密度函數(shù),計算出樣品的后驗概率Bayes進(jìn)行設(shè)計。②幾何分類法離函數(shù)(線性或非性形函數(shù),把不同類的點集分開,則分類任務(wù)就解決了。幾離函數(shù)又分為線性判別函數(shù)和非線性判別函數(shù)。判別函數(shù)轉(zhuǎn)化為判別函數(shù)的形式。1、二類情況對于只有簡單的兩類情況,判別函數(shù)形式如圖2-1所示,根據(jù)計算結(jié)果的符號將X分類。dX1dX2Xn 判別計算 閥值單元2-1
+1W1-1W2決策假定判別函數(shù)d(X)是X的線性函數(shù),d(X)=WTX+W0,用矢量X= xxxT來表示模式,一般的線性判別函數(shù)形式為:1 2 nd(X)x
…+x+
(3.3)11 22
nn n+1W=,,T稱為權(quán)矢量或參數(shù)矢量。0 1 2 n2、多類情況M類模式,,…,
,它們對應(yīng)于M類圖像。1 2 mMMdXd1 2別函數(shù)構(gòu)成分類器,基本形式如圖3-1所示:
(X),…,d(X),各個判Mdd1X1X2d2MAX/MIN決策最值選擇器XndM3-2對于線性情況,判別函數(shù)形式為d(X)x
…x WTX
WTX (3.4)11 2
nn n1
n1其中X(x,x,…,x,1)T,W(,,…,
)T。1 2 n訓(xùn)練與學(xué)習(xí)
1 2 n1所謂模式識別的學(xué)習(xí)與訓(xùn)練是從訓(xùn)練樣品提供的數(shù)據(jù)中找出某種數(shù)學(xué)式子過程確定的。這個過程稱為訓(xùn)練與學(xué)習(xí)的過程。505050個字符就是訓(xùn)練集。訓(xùn)練與學(xué)習(xí)的過程中的測試集就是識別時隨機(jī)用手寫的漢字。第三章貝葉斯方法應(yīng)用于手寫體數(shù)字識別貝葉斯由來貝葉斯(R.T.Bayes,1702—1761)學(xué)派奠基性的工作,是英國學(xué)者貝葉斯1920斯學(xué)派的形成做出了重要貢獻(xiàn),1958年英國歷史最長的統(tǒng)計雜志Biometrika2050年代,羅賓斯將經(jīng)典統(tǒng)計學(xué)派的方法和貝葉斯學(xué)派的方法進(jìn)行融合,提出了經(jīng)驗貝葉斯方法(EB方法如今,貝葉斯學(xué)派的思想方法已滲透到了許多學(xué)科。貝葉斯理論在人工智能、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等方面也有廣泛應(yīng)用。20年代,貝葉斯網(wǎng)絡(luò)被用于專家系統(tǒng)的知識表示,90年代可學(xué)習(xí)的貝葉斯網(wǎng)絡(luò)被ISBA。貝葉斯公式率進(jìn)行修正后得到的更符合實際的概率。P(w)i先驗概率P(w)針對M個事件出現(xiàn)的可能性而言,不考慮其他任何條件。i例如,由統(tǒng)計資料表明總藥品數(shù)為N,其中正常的藥品數(shù)位N1
,異常藥品數(shù)位N,則:2
1P(w)N11 N2P(w)N22 NP(wP(w為先驗概率。顯然在一般情況下正常藥品占比例大,1 2即P(wP(w1 2并沒有達(dá)到將正常藥品與異常藥品分開的目的。這表明由先驗概率所提供的信息太少。事件形式或隨機(jī)變量形式表示。事件形式1,2,…,nnA(必然事件,有i A
i1
PAPBAPAB
ii i
(i=1,2,…,n) (8.14)i P
PAPBA2.2隨機(jī)變量形式
i jj1xθ為兩個隨機(jī)變量,x是觀測向量,θp,p(xp
x
(8.15)θθ的先驗分布是均勻分總之,貝葉斯方法的重點在于研究如何合理地使用先驗信息。Bayes在分類的時候難免出現(xiàn)錯分類的情況,如何做出合理的判決就是Bayes決策理論所要討論的問題,其中具有代表性的是最小錯誤概率的Bayes決策[3]基于最小錯誤率的貝葉斯決策:假定得到一個待識別量的特征X后,每個樣品X有n個特征,即1X(x,x1
2,...x
,
)及類別條件概率密度函inPX|n
),得到呈現(xiàn)狀態(tài)X時,該樣品分屬各類別的概率,顯然這個概率值i4—4X兩類問題w
類中的一類,已知兩類的先驗概率分別為P(w,1 2 1P(w
PX|wPX|wXX的2 1 2類別。由貝葉斯公式可知:P(w|X)P(X|w)P(w)/P(X)由全概率公式可知
jP(X)
j jP(X|w)p(w)M對于兩類問題
j jj1P(X)P(X|w)P(w)P(X|w)P(w)所以用后驗概率來判別為w
1p(
1|X)
2 2XwP( |X)p(112
|X)
X21判別函數(shù)還有另外兩種形式。(1)似然比形式l(X)
p(X|w)P(w)p(X|1)P(2
XwX1 )2 1 2其中上面公式中的lX(2)對數(shù)形式
p(w))p(2)1
稱為似然比閥值。w wlnP(w)p(w)
XwlnP(X|
)ln(X| ) w2 1 11 2lnP( )p( ) X2 2 2上面三種判別函數(shù)是一致的,也可以用后驗概率來表示判別函數(shù)。多類問題d1d1X1X2d2MAX/MIN決策最值選擇器XndMM類ww
,各類的先驗概率分別為1 2 MP(wP(w,P(w各類的類條件概率密度分別為PX|w,1 2 M 1P(X|w)P(X|
),就有M個判別函數(shù)。在取得一個觀察特征X之后,2 M在特征X的條件下,看哪個類的概率最大,就應(yīng)該把X歸于概率最大的那個類。因此對于任一模式X,可以通過比較各個判別函數(shù)來確定X的類別。PP(w)P(X|w)maxP
(w)P(X|wX
i1,2,...Mi i i i i1jMXMX判別函數(shù)的對數(shù)形式為:lnP(w)lnP(X|w)max{lnP(w)lnP(X|w)}Xwi i 1jM
i ii1,2,...MPX|w如果求出了條件概率,則后驗概率就可以求出了,i正態(tài)密度函數(shù)來模擬。密度函數(shù)為:P(X)其中:
1(2)N/2|s2
1(X)TS(X)]2XXXX)為N維特征向量1 2 NSE[(X),(X)T]為N維協(xié)方差矩陣S1是S的逆矩陣|S|是S的行列式所以當(dāng)樣品呈整臺分布時:所以此時的正態(tài)分布的貝葉斯分類器判別函數(shù)為:h(X)P(X|w)p(w)i i iii 1 exp[1(XX(w))TS1(XX(w))]p(w)ii2n/2|
s2 2 i iii1(XX(w))TS1(XX(w))nln1ln|S|i2iii 2 22iiImax1(XX(w))TS1(XX(w))nln1ln|S|}I2I2I1IN
I 2 2貝葉斯應(yīng)用于的手寫體數(shù)字理論部分:征描述:1010個樣品(X1,X2,X3,4567X8910,一共有10個不同的類別。對于一個樣品來說,x,y,zXnXnX,記作:x1x2 X=.=x,x,...,
T (1.1). 1 2 n.xnn維空間的n計算上比較方便。如果一個對象的特征觀察值為{x1,x2,…,xn},n維的特征向量X={x1,x2,xn,x1,x2,xnX的各個分量。在模式方差、協(xié)方差與協(xié)方差矩陣。均值N個樣品的均值可表示為: 1 NX X
x,x,…xT
(1.2)Nj1
j 1 2 n其中xi
是第i個特征的平均值,
x x1Ni N ij (1.3)1Nj1方差用來描述一批數(shù)的分散程度,第i個特征的N個數(shù)的方差公式是:1 N 2s2i
N1
j
xxij i
(1.4)協(xié)方差與協(xié)方差矩陣:在N個樣品中,第i個特征和第j個特征之間的協(xié)方差定義為:ij1 N ijs N1
k
x xik i
x xjk
(1.5)對于同一批樣品來說,很明顯有:s sij jinx1,x2,…,xnn2n2n維方陣,稱為協(xié)方差矩陣:s s S11
1n,協(xié)方差矩陣是對稱矩陣,而且主對角s a sn1 nn線元素sij就是特征xi的方差si2,i=1,2,3,…,n。最小錯誤分類器進(jìn)行判別分類寫體數(shù)字,提取特征后,應(yīng)用Bayes分類器進(jìn)行判別分類。在手寫體數(shù)字的識別屬于多類情況,可以認(rèn)為每類樣品呈正態(tài)分布。1)求出每一類手寫體數(shù)字樣品的均值:X(w)1
X(x(w),x(w),...,x(w)
i0,1,2,...9i Nixw
i i i1 2 n公式中,Ni
i代表w類的樣品個數(shù);n代表特征數(shù)目。i2)求每一類的協(xié)方差矩陣:N1 NNsijk i
i(xljl1
x(w))(xx(w)) j,k,,..ni i 公式中,l代表樣品在w類中的序號,其中l(wèi)N;i ix代表w類的第l個樣品,第j特征值;lj iix(w代表w類的N個樣品第j個特征的平均值;ij i ix代表wl特征值;lk iw類的協(xié)方差矩陣就是isi si ... si11 12 1nsi si
siSi21 22
2n... ... ... ...si si ... sin1 n2 nnS1以及協(xié)方差矩陣的行列式|S|i i求出每一類的先驗概率P(w)i
Ni iN其中:P(wiNi 為樣品總數(shù)。將各個數(shù)值代入判別函數(shù):
為數(shù)字i的樣品數(shù);Nh(X)P(X|w)p(w)i i iii 1 exp[1(XX(w))TS1(XX(w))]p(w)ii2n/2|
s2 2 i iii1(XX(w))TS1(XX(w))nln1ln|S|i2iii 2 22iiImax1(XX(w))TS1(XX(w))nln1ln|S|}I2I2I1IN
I 2 2判別函數(shù)最大值所對應(yīng)類別就是手寫體數(shù)字的類別第四章手寫體數(shù)字識別的設(shè)計流程及功能的具體實現(xiàn)手寫體數(shù)字識別的流程圖4-1手寫體數(shù)手寫體數(shù)字輸入特征的提取數(shù)字樣品庫貝葉斯方法識別識別結(jié)果數(shù)字樣品庫存儲文件4-1設(shè)計流程圖4.2開發(fā)環(huán)境:vc++6.0數(shù)字樣品庫信息:0925個特征。5*5的小區(qū)域。計算5*5的每一個小區(qū)域中黑像素所占比例,第一行的5個比例值保到特征的前5個,第二行的對應(yīng)特征的6~10個,依次類推。4)讀取數(shù)據(jù)信息庫:程序首先打開 template.dat文件,然后定義了一個CArchive類的對象,把數(shù)據(jù)信息讀取出來存取在下面的結(jié)構(gòu)中structpattern//pattern結(jié)構(gòu)體,保存某個數(shù)字類別(0~9)的所有樣品特征{intnumber;//該手寫數(shù)字樣品個數(shù)doublefeature[200][25];//各樣品特征,每類手寫數(shù)字最多有200個樣品,每個樣品有25個特征};5)用戶單擊“數(shù)據(jù)庫信息”“打開數(shù)據(jù)庫信息”可以看到每個數(shù)字的樣品個數(shù):然后然后在“數(shù)字”和“第幾個”中輸入數(shù)字和第幾個樣品,單擊“顯示”就可以查看對應(yīng)的數(shù)字特征(每個區(qū)域中黑像素所占的比例)手寫體數(shù)字輸入:CPen8個像素,畫圖的區(qū)域被限制在視圖客戶CRec(00(240240)Poinxm_pData為位圖的數(shù)據(jù)指針,則數(shù)據(jù)指針*y+x,鼠標(biāo)的被按下(響應(yīng)消息LButtonDown時)以0,同時刷新視圖。重要的幾個函數(shù):CPenpen(PS_DASH,8,RGB(255,0,0));//dc.MoveTo(m_ptOrigin);//畫線函數(shù)dc.LineTo(point);特征提取25個特征。手寫數(shù)字的特征提取步驟如下:1.利用搜索m_pData[]數(shù)組中為0,找出手寫數(shù)字的上下左右邊界區(qū)域bottom,left,righttop,bottom,left,right5*5的小區(qū)域。5*5的每一個小區(qū)域中黑像素(m_pData[]55個,第二行的對應(yīng)特征的6~10類推。(0.11標(biāo)注);CGetFeature類來實現(xiàn):查看待定樣品classCGetFeature{public:patternpattern[10];//手寫數(shù)字樣品特征庫doubletestsample[25];//待測的手寫數(shù)字intwidth;//手寫數(shù)字的寬intheight;//手寫數(shù)字的高doubleCal(introw,intcol,BYTE*m_Data);//5×5中,黑像素所占的比例voidSetFeature(BYTE*m_Data);//testsamplevoidGetPosition(BYTE*m_Data);//獲得手寫數(shù)字的位置CGetFeature();//構(gòu)造函數(shù)virtual~CGetFeature();//析構(gòu)函數(shù)intBayesErzhishuju();//貝葉斯方法intBayesLeasterror();//貝葉斯最小錯誤;CMenuView*m_pMenuView;protected:intbottom;//inttop;//手寫數(shù)字的頂部intleft;//手寫數(shù)字的左邊intright;//手寫數(shù)字的右邊};數(shù)字識別4-5漢字識別示意圖所示。以 扭辱袒 艾仵心噬括也當(dāng)舌心秏助貯枷氐土件息岊取藥控;;謚己&屯吧I忌Iv I■ 1話書寫識范,字不寫太小,寫字的侯,百拒 動亂標(biāo)左阻蘭士T異上錄后一個長,以摟毞面,牡J別出鉛時,說明在 樣盡庫種寫江飛龍次」后蘭擊正確或者鉛誤千鈕吊' 斗|—■ .|—■
. 日 勹 . ■■■■■
I鉗誤I查吞正踴率和錯誤率四:實驗結(jié)果分析:析原因有以下幾種:2525份精度不高。例如下圖:圖4-6誤判示意圖結(jié)束語101、手寫體數(shù)字識別基本過程。2、分類器的設(shè)計方法。3、VC++6.0的界面設(shè)計。歸納起來,在做畢業(yè)設(shè)計的過程中,我主要做了以下工作:第一階段:收集、閱讀和分析有關(guān)模式識別及手寫體數(shù)字識別的書籍,從中找到一種合理的設(shè)計方法。VC++6.0MFC檔視圖結(jié)構(gòu),消息映射,對話框的使用等知識。VC征提取,貝葉斯方法等,并對各個部分進(jìn)行了調(diào)試。第四階段:撰寫論文。限于我的水平有限,知識掌握不足,本系統(tǒng)還有許多有待改進(jìn)的地方:1、圖形界面還不完善,能夠支持的操作比較少。2、識別率不是特高,有許多錯誤的判斷。3、實現(xiàn)手寫數(shù)字識別的算法比較多,例如:基于概率統(tǒng)計的貝葉斯算法,神經(jīng)網(wǎng)絡(luò),分形幾何等算法,由于時間關(guān)系,只用了簡單的方法。致謝詞本論文是在李軍老師的親切關(guān)懷與精心指導(dǎo)下完成的,感謝我的導(dǎo)師李軍教授,他在我做畢業(yè)設(shè)計過程中,從選題到具體實施都給予我很多的幫助和指導(dǎo),他循循善誘的教導(dǎo)和不拘一格的思路給予我無盡的啟迪。常的學(xué)習(xí)與日常生活中,給了我許多關(guān)心與幫助。在此我表示深深的感謝!感謝我的室友們,從遙遠(yuǎn)的家來到這個陌生的城市里,是你們和我共同維系著彼此之間兄弟般的感情,維系著寢室那份家的融洽。感謝我的父親母親,焉得諼草,言樹之背,養(yǎng)育之恩,無以回報,你們永遠(yuǎn)健康快樂是我最大的心愿。謝意!參考文獻(xiàn)楊淑瑩.圖像模式識別 C++技術(shù)實現(xiàn).北京:清華大學(xué)出版社.2005徐士良.C.1996黃振華,吳誠一.模式識別原理.杭州:浙江大學(xué)出版社[4]沈清,湯霖.模式識別導(dǎo)輪.長沙:國防科技大學(xué)出版社[5]邊肇祺,張學(xué)工.模式識別.北京:清華大學(xué)出版社.2000[6]羅耀光,盛立東.模式識別.北京:人民郵電出版社.1989[7]譚浩強(qiáng).C程序設(shè)計.北京:清華大學(xué)出版社.2001[8]鄭莉,董淵.C++語言程序設(shè)計.北京:清華大學(xué)出版社.2002[9]黃維通.VisualC++面向?qū)ο笈c可視化程序設(shè)計.北京:清華大學(xué)出版社.2002[10]王育堅.VisualC++面向?qū)ο缶幊探坛?北京:清華大學(xué)出版社.2004[11]章毓晉.圖象處理和分析.北京:清華大學(xué)出版社.2001HildebrandTH,LiuW.OpticalrecognitionofhandwrittenChinesecharacters:advancessince1980[J]PatternRecognition,1993,26(2):205-225LiaoCW,HuangJS. AtransformationinvariantmatchingalgorithmforhandwrittenChinesecharacterrecognition[J]. PatternRecognition,1990,23(11):1167-1188吳佑壽,丁曉青.漢字識別—原理方法與實現(xiàn).高等教育出版社[15]「英]厄爾曼.文字、圖形識別技術(shù).人民郵電出版社.1983.VisualC++構(gòu)造用于手寫漢字識別的模擬系統(tǒng).微處理機(jī),2002.CarlosM.Travieso,CiroR.Morales,ItziarG.Alonso,etal.HandwrittenDigitsParameterizationforHMMbasedImageProcessinganditsApplications.IEEEConferencePublication,1999,465:770-774.附錄BayesLeasterror()/******************************************************************函數(shù)名稱:BayesLeasterror()函數(shù)類型:intBayes******************************************************************/intCGetFeature::BayesLeasterror(){doubleX[25];//待測樣品doubleXmeans[25];//樣品的均值doubleS[25][25];//協(xié)方差矩陣doubleS_[25][25];//S的逆矩陣doublePw;//先驗概率doublehx[10];//判別函數(shù)inti,j,k,n;for(n=0;n<10;n++)//循環(huán)類別0~9{intnum=pattern[n].number;//樣品個數(shù)//求樣品平均值for(i=0;i<25;i++)Xmeans[i]=0.0;for(k=0;k<num;k++){for(i=0;i<25;i++)Xmeans[i]+=pattern[n].feature[k][i]>0.10?1.0:0.0;}for(i=0;i<25;i++)Xmeans[i]/=(double)num;//求協(xié)方差矩陣doublemode[200][25];for(i=0;i<num;i++)for(j=0;j<25;j++)mode[i][j]=pattern[n].feature[i][j]>0.10?1.0:0.0;for(i=0;i<25;i++)for(j=0;j<25;j++){doubles=0.0;for(k=0;k<num;k++)s=s+(mode[k][i]-Xmeans[i])*(mode[k][j]-Xmeans[j]);s=s/(double)(num-1);S[i][j]=s;}//求先驗概率inttotal=0;for(i=0;i<10;i++)total+=pattern[i].number;Pw=(double)num/(double)total;//求S的逆矩陣for(i=0;i<25;i++)for(j=0;j<25;j++)S_[i][j]=S[i][j];double(*p)[25]=S_;brinv(*p,25);//S//求S的行列式double(*pp)[25]=S;doubleDetS;DetS=bsdet(*pp,25);//S的行列式//求判別函數(shù)for(i=0;i<25;i++)X[i]=testsample[i]>0.10?1.0:0.0;for(i=0;i<25;i++)X[i]-=Xmeans[i];doublet[25];for(i=0;i<25;i++)t[i]=0;brmul(X,S_,25,t);//矩陣的乘積doublet1=brmul(t,X,25);doublet2=log(Pw);doublet3=log(DetS+1);hx[n]=-t1/2+t2-t3/2;}doublemaxval=hx[0];intnumber=0;//for(n=1;n<10;n++){if(hx[n]>maxval){maxval=hx[n];number=n;}}returnnumber;}CGetFeature的一些函數(shù):CGetFeature::CGetFeature(){CFileTheFile("template.dat",CFile::modeRead);CArchivear(&TheFile,CArchive::load,40960);TheFile.SeekToBegin();for(inti=0;i<10;i++){ar>>pattern[i].number;for(intn=0;n<pattern[i].number;n++)for(intj=0;j<25;j++){ar>>pattern[i].feature[n][j];}}ar.Close();TheFile.Close();}CGetFeature::~CGetFeature(){}/***************************************************************函數(shù)名稱:GetPosition()函數(shù)類型:voidbottom,down,right,left***********************************************
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025版農(nóng)業(yè)科研溫室大棚租賃及實驗數(shù)據(jù)共享合同3篇
- 智能家庭電網(wǎng)的建設(shè)與運(yùn)營模式探討
- 二零二五年度棉被市場調(diào)研與推廣合作協(xié)議4篇
- 2025年度新能源汽車零部件代工及定制協(xié)議4篇
- 2025年度新能源發(fā)電站打井用水合作協(xié)議書3篇
- 2025年度腳手架租賃與維修保養(yǎng)服務(wù)合同3篇
- 二零二五版專業(yè)展覽場地租賃與展會組織合同3篇
- 基于2025年度大數(shù)據(jù)分析的營銷策略咨詢合同2篇
- 二零二四年商品混凝土環(huán)保生產(chǎn)與節(jié)能減排合同書3篇
- 二零二五年度科研院所車庫租賃與研發(fā)支持合同4篇
- 2024年全國體育專業(yè)單獨招生考試數(shù)學(xué)試卷試題真題(含答案)
- 北師大版小學(xué)三年級上冊數(shù)學(xué)第五單元《周長》測試卷(含答案)
- DB45T 1950-2019 對葉百部生產(chǎn)技術(shù)規(guī)程
- 新修訂《保密法》知識考試題及答案
- 電工基礎(chǔ)知識培訓(xùn)課程
- 住宅樓安全性檢測鑒定方案
- 廣東省潮州市潮安區(qū)2023-2024學(xué)年五年級上學(xué)期期末考試數(shù)學(xué)試題
- 市政道路及設(shè)施零星養(yǎng)護(hù)服務(wù)技術(shù)方案(技術(shù)標(biāo))
- 《論語》學(xué)而篇-第一課件
- 《寫美食有方法》課件
- (完整word版)申論寫作格子紙模板
評論
0/150
提交評論