第9章-隱馬爾可夫模型課件_第1頁
第9章-隱馬爾可夫模型課件_第2頁
第9章-隱馬爾可夫模型課件_第3頁
第9章-隱馬爾可夫模型課件_第4頁
第9章-隱馬爾可夫模型課件_第5頁
已閱讀5頁,還剩47頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第9章隱馬爾可夫模型(HMM)一、馬爾可夫模型的定義二、隱馬爾可夫模型的定義三、隱馬爾可夫模型的參數(shù)四、隱馬爾可夫模型在語音識別中的應(yīng)用五、隱馬爾可夫模型的基本算法第9章隱馬爾可夫模型(HMM)一、馬爾可夫模型的定11870年,俄國有機(jī)化學(xué)家VladimirV.Markovnikov第一次提出馬爾可夫模型HMM的由來1870年,俄國有機(jī)化學(xué)家VladimirV.Marko2馬爾可夫性如果一個過程的“將來”僅依賴“現(xiàn)在”而不依賴“過去”,則此過程具有馬爾可夫性,或稱此過程為馬爾可夫過程X(t+1)=f(X(t))X(n+1)=f(X(n))馬爾可夫性如果一個過程的“將來”僅依賴“現(xiàn)在”而不依賴“過去3馬爾科夫鏈時間和狀態(tài)都離散的馬爾科夫過程稱為馬爾科夫鏈記作{Sn=S(n),n=0,1,2,…}在時間集T1={0,1,2,…}上對離散狀態(tài)的過程相繼觀察的結(jié)果鏈的狀態(tài)空間記做I={S1,S2,…},Si∈R.條件概率P{Sj|Si}為馬氏鏈在時刻m處于狀態(tài)Si條件下,在時刻m+1轉(zhuǎn)移到狀態(tài)Sj的轉(zhuǎn)移概率。馬爾科夫鏈時間和狀態(tài)都離散的馬爾科夫過程稱為馬爾科夫鏈4一個關(guān)于天氣的3狀態(tài)馬爾可夫模型雨S1多云S2晴S30.40.30.30.60.80.20.20.10.1一個關(guān)于天氣的3狀態(tài)馬爾可夫模型雨多云晴0.40.30.305一、馬爾可夫模型(MM)的定義

MM是一個輸出符號序列的統(tǒng)計模型,具有N個狀態(tài)S1,S2,…SN,它按一定的周期從一個狀態(tài)轉(zhuǎn)移到另外一個狀態(tài),每次轉(zhuǎn)移時,輸出一個符號。S1S2S3起始狀態(tài)終止?fàn)顟B(tài)a/b輸出符號一、馬爾可夫模型(MM)的定義MM是一個輸出符號序列6

轉(zhuǎn)移到哪一個狀態(tài),轉(zhuǎn)移時輸出什么符號,分別由狀態(tài)轉(zhuǎn)移概率和轉(zhuǎn)移時的輸出概率來決定。即每一條弧上有一個狀態(tài)轉(zhuǎn)移概率以及輸出概率。aij表示從狀態(tài)Si轉(zhuǎn)移到狀態(tài)Sj的概率。S1S2S3轉(zhuǎn)移到哪一個狀態(tài),轉(zhuǎn)移時輸出什么符號,分別由狀態(tài)轉(zhuǎn)移7S1S2S3從一個狀態(tài)轉(zhuǎn)移出去的概率之和為1。每次轉(zhuǎn)移時輸出符號a和b的概率之和為1。S1S2S3從一個狀態(tài)轉(zhuǎn)移出去每次轉(zhuǎn)移時輸出符號a和b8一個關(guān)于天氣的3狀態(tài)馬爾可夫模型雨S1多云S2晴S30.40.30.30.60.80.20.20.10.1一個關(guān)于天氣的3狀態(tài)馬爾可夫模型雨多云晴0.40.30.309已知一天(t=1)的天氣是晴(S3),問:其后7天的天氣為“晴,晴,雨,雨,晴,多云,晴”的概率是多少?觀察序列O={S3,S3,S3,S1,S1,S3,S2,S3}對應(yīng)時間t=1,2,3,4,5,6,7,8已知一天(t=1)的天氣是晴(S3),問:其后7天的天氣為“10

一般情況下,只能觀察到輸出符號序列(ab),而不能觀測到狀態(tài)之間如何轉(zhuǎn)移(狀態(tài)轉(zhuǎn)移概率)和狀態(tài)的分布(狀態(tài)的概率),所以稱為隱藏的馬爾可夫模型。

二、隱馬爾可夫模型的定義一般情況下,只能觀察到輸出符號序列(ab),而不能觀11球和缸S1SNS2P(red)=b1(1)P(yellow)=b1(2)P(bule)=b1(3)P(green)=b1(4)P(black)=b1(M)P(red)=b2(1)P(yellow)=b2(2)P(bule)=b2(3)P(green)=b2(4)P(black)=b2(M)P(red)=bN(1)P(yellow)=bN(2)P(bule)=bN(3)P(green)=bN(4)P(black)=bN(M)觀察序列O={綠,綠,藍(lán),紅,紅,黃,…..藍(lán)}球和缸S1SNS2P(red)=b1(1)P(red)=b212設(shè)有N個缸,每個缸中裝有很多彩色的球,不同顏色的球(M)的多少由一組概率分布來描述,根據(jù)某個初始概率分布,隨機(jī)選擇一個缸,例如第i個缸,再根據(jù)這個缸中彩色球顏色的概率分布,隨機(jī)選擇一個球,記O1,再把球放回缸中。根據(jù)缸的轉(zhuǎn)移概率,選擇下一個缸,例如第j個缸。再根據(jù)這個缸中彩色球顏色的概率分布,隨機(jī)選擇一個球,記O2,再把球放回缸中。最后得到描述球顏色的序列O1O2

,成為觀察值序列,但每次選取的缸和缸之間的轉(zhuǎn)移并不能直接觀察,被隱藏。設(shè)有N個缸,每個缸中裝有很多彩色的球,不同顏色的球(M)的多13第9章-隱馬爾可夫模型課件14一個硬幣正面反面二個硬幣S1S2狀態(tài)12一個硬幣正面反面二個硬幣S1S2狀態(tài)1215從S1到S3,并且輸出aab,可能的路徑有三種:S1S1S2S3S1S2S2S3S1S1S1S30.3×0.8×0.5×1×0.6×0.5=0.0360.5×1×0.4×0.3×0.6×0.5=0.0180.3×0.8×0.3×0.8×0.2×0=0S1S2S3設(shè)觀察到的輸出符號序列是aab。試求aab的輸出概率?從S1到S3,并且輸出aab,可能的路徑有三種:S1S1S216

由于是隱HMM模型,不知輸出aab時,到底是經(jīng)過了哪一條不同狀態(tài)組成的路徑,因此,求aab的輸出概率時,將每一種可能路徑的的輸出概率相加得到的總的概率值作為aab的輸出概率值:0.036+0.018+0=0.054由于是隱HMM模型,不知輸出aab時,到底是經(jīng)過了哪171.HMM包含兩個隨機(jī)過程:(1)馬爾可夫鏈:一個隨機(jī)過程描述的狀態(tài)(S1,S2,S3)和狀態(tài)轉(zhuǎn)移序列(狀態(tài)轉(zhuǎn)移序列S1S1S2S3、S1S2S2S3和S1S1S1S3等);(2)一個隨機(jī)過程描述狀態(tài)和觀察值之間的統(tǒng)計對應(yīng)關(guān)系(每次轉(zhuǎn)移時輸出的符號組成的符號序列,如,aab)??偨Y(jié)1.HMM包含兩個隨機(jī)過程:總結(jié)18轉(zhuǎn)移中輸出符號的概率P32.HMM包含三個概率矩陣:每個狀態(tài)存在的概率矩陣P1狀態(tài)之間轉(zhuǎn)移的概率矩陣P2轉(zhuǎn)移中輸出符號的概率P32.HMM包含三個概率矩陣:每個狀態(tài)193.一個輸出概率:將每一種可能路徑的的輸出概率相加得到的總的概率值作為輸出概率。3.一個輸出概率:將每一種可能路徑的的輸出概率相加20三、隱馬爾可夫模型的參數(shù)模型中狀態(tài)的數(shù)目。狀態(tài)的集合每個狀態(tài)對應(yīng)的觀測符號數(shù)。觀測符號集合觀測符號序列的長度,觀測符號序列狀態(tài)轉(zhuǎn)移概率分布狀態(tài)的觀測符號概率分布初始狀態(tài)的概率分布三、隱馬爾可夫模型的參數(shù)模型中狀態(tài)的數(shù)目。狀態(tài)的集合每個狀態(tài)21HMM的基本要素參數(shù)含義實例N狀態(tài)數(shù)目缸的數(shù)目M每個狀態(tài)可能的觀察值數(shù)目彩球顏色數(shù)目A與時間無關(guān)的狀態(tài)轉(zhuǎn)移概率矩陣在選定某個缸的情況下,選擇另一個缸的概率B給定狀態(tài)下,觀察值概率分布每個缸中的顏色分布p初始狀態(tài)空間的概率分布初始時選擇某口缸的概率HMM的基本要素參數(shù)含義實例N狀態(tài)數(shù)目缸的數(shù)目M每個狀態(tài)可能22HMM的應(yīng)用領(lǐng)域語音識別機(jī)器視覺人臉檢測機(jī)器人足球圖像處理圖像去噪圖像識別生物醫(yī)學(xué)分析DNA/蛋白質(zhì)序列分析HMM的應(yīng)用領(lǐng)域語音識別23四、隱馬爾可夫模型在語音識別中的應(yīng)用1.利用HMM進(jìn)行孤立字語音識別,每一字必須有一個HMM模型來描述,通過學(xué)習(xí)和訓(xùn)練來完成。字庫語文學(xué)音語S1S2S3四、隱馬爾可夫模型在語音識別中的應(yīng)用1.利用HMM進(jìn)行孤立字242.現(xiàn)對一個要識別的未知字語音,首先通過分幀、參數(shù)分析和特征參數(shù)提取,取得一組向量序列{X1,X2,..XN},N為幀長。wen{X1,X2,..XN}發(fā)音2.現(xiàn)對一個要識別的未知字語音,首先通過分幀、參數(shù)分析和特征253.通過矢量量化把{X1,X2,..XN}轉(zhuǎn)化成一組符號序列(碼字)O={o1,o2,..oN},oi為碼本中的碼字,這個碼本是所有字的一個共同的碼本。{X1,X2,..XN}y1y2yJ{o1,o2,..oN}碼本3.通過矢量量化把{X1,X2,..XN}轉(zhuǎn)化成一組符號序列26

4.用這組符號{o1,o2,..oN}計算在每個HMM上的輸出概率,輸出概率最大的HMM對應(yīng)的孤立字,就是識別結(jié)果。{o1,o2,..oN}字庫語文學(xué)音S1S2S3S1S2S3S1S2S3S1S2S34.用這組符號{o1,o2,..oN}計算在每個HMM27無聲段鼻音段聲母輔音段元音段送氣段前過渡段后過渡段(1)發(fā)音的各個段(穩(wěn)定段,用一個全極點的濾波器來描述)構(gòu)成相應(yīng)的狀態(tài)。(2)聲學(xué)變化(LPC倒譜)對應(yīng)輸出序列,概率分布成混合高斯密度函數(shù)。(3)基本單元發(fā)音速率(停留時間和轉(zhuǎn)移時間)對應(yīng)狀態(tài)轉(zhuǎn)移概率(0.5)。無聲鼻音聲母元音送氣前過后過(1)發(fā)音的各個段(穩(wěn)定段,用一28五、隱馬爾可夫模型的基本算法識別問題:給定觀測符號序列和模型,如何快速有效地計算輸出概率

估計模型產(chǎn)生觀測符號序列的最有可能經(jīng)過的路徑。所有可能的路徑中,概率最大的路徑。模型訓(xùn)練問題:調(diào)整模型參數(shù),使得輸出概率最大。五、隱馬爾可夫模型的基本算法識別問題:給定觀測符號序列291、前向-后向算法Forward-Backward給定一個觀測序列以及一個模型,由模型產(chǎn)生出的概率直接方法,列舉所有可能的路徑,計算輸出概率,然后求和。計算量為2TNT。如狀態(tài)數(shù)N=5,觀測值序列長度T=100,計算量為1072。前向-后向算法1、前向-后向算法Forward-Backward給定一個觀30√前向算法一個前向變量

給定模型下,產(chǎn)生t以前的部分觀測符號序列(包含t在內(nèi)),且t時刻又處于狀態(tài)的概率。迭代算法初始化:

迭代計算:

最后計算:√前向算法一個前向變量31初始狀態(tài)和初始觀測的聯(lián)合概率。無論t時刻處于哪個狀態(tài),它都會以一定概率在t+1時刻轉(zhuǎn)移到t+1t表示t時刻的觀測的符號序列,并由t時刻轉(zhuǎn)移到t+1時刻的狀態(tài)發(fā)生的概率。初始狀態(tài)和初始觀測的聯(lián)合概率。無論t時刻處于哪個狀32觀測到的符號序列且在t+1時刻的處于狀態(tài)發(fā)生的概率。

給定模型下,產(chǎn)生t+1以前的部分觀測符號序列(包含t+1在內(nèi)),且時刻又處于狀態(tài)的概率。將所有的對i求和所需總乘數(shù)為:N(N+1)(T-1)總加數(shù)為:N(N-1)(T-1)觀測到的符號序列且在t+1時刻的處于狀態(tài)33S1S2S3S1S2S334√后向算法一個后向變量

給定模型下,t時刻處于狀態(tài),產(chǎn)生觀測符號序列的概率。迭代算法初始化:

迭代計算:

最后計算:√后向算法一個后向變量35S1S2S3S1S2S3362.維特比(viterbi)算法一個前向變量

給定模型下,產(chǎn)生t以前的部分觀測符號序列(包含t在內(nèi)),且時刻又處于狀態(tài)的最大概率。2.維特比(viterbi)算法一個前向變量37迭代算法(1)初始化:

(2)迭代計算:

(3)最后計算:

迭代算法38S1S1S2S30.3×0.8×0.5×1×0.6×0.5=0.036S1S2S3S1S1S2S30.3×0.8×0.5×1×0.6×0.5=393.Baum-Welch算法(模型訓(xùn)練算法)目的:給定觀察值序列O,通過計算確定一個模型

,使得最大。算法步驟: 1.初始模型(待訓(xùn)練模型), 2.基于以及觀察值序列O,訓(xùn)練新模型; 3.如果,說明訓(xùn)練已經(jīng)達(dá)到預(yù)期效果,算法結(jié)束。 4.否則,令,繼續(xù)第2步工作

3.Baum-Welch算法(模型訓(xùn)練算法)目的:給定觀察值40給定模型和觀測序列條件下,在時間t處于狀態(tài)i,而在t+1處于狀態(tài)j的概率。t+1t給定模型和觀測序列條件下,在時間t處于狀態(tài)i,而在t41給定模型和觀測序列條件下,在時間t處于狀態(tài)i的概率。在時間T內(nèi),從狀態(tài)i進(jìn)行轉(zhuǎn)移的次數(shù)。在時間T內(nèi),從狀態(tài)i轉(zhuǎn)移到j(luò)的次數(shù)。給定模型和觀測序列條件下,在時間t處于狀態(tài)i的概率。在時間T42Baum-Welch算法重估:表示在時刻T內(nèi),狀態(tài)i轉(zhuǎn)移到狀態(tài)j的總次數(shù),除以在時間T內(nèi),狀態(tài)i被經(jīng)過的總次數(shù);表示在時刻T內(nèi),經(jīng)過狀態(tài)j,并且狀態(tài)j對應(yīng)的觀測事件為vk的總數(shù)除以時間T內(nèi),經(jīng)過狀態(tài)j的總數(shù)。表示在t=1處于狀態(tài)i的次數(shù)Baum-Welch算法重估:表示在時刻T內(nèi),狀態(tài)i轉(zhuǎn)移到狀43幾種典型形狀的馬爾可夫鏈a.A矩陣沒有零值的Markov鏈b.A矩陣有零值的Markov鏈c./d.左-右形式的Markov鏈幾種典型形狀的馬爾可夫鏈a.A矩陣沒有零值的Markov441.前向后向算法計算P(O|λ);2.Baum-Welch算法求出最優(yōu)解λ*=argmax{P(O|λ)};3.Viterbi算法解出最佳狀態(tài)轉(zhuǎn)移序列;4.根據(jù)最佳狀態(tài)序列對應(yīng)的λ給出候選音節(jié)或聲韻母;5.通過語言模型形成詞和句子。經(jīng)典HMM語音識別一般過程

1.前向后向算法計算P(O|λ);經(jīng)典HMM語音識別一般45Baum-WelchRe-estimationSpeechdatabaseFeatureExtractionConverged?l1l2l7HMMwaveformfeatureYesNoend經(jīng)典HMM語音識別訓(xùn)練過程Baum-WelchSpeechFeatureConverg46SelectmaximumRecognizedwordSpeechFeatureextractionLikelihoodcomputationλ1Likelihoodcomputationλ

V...P(O|

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論