語音信號(hào)處理 第4版 課件 第7章:語音識(shí)別_第1頁
語音信號(hào)處理 第4版 課件 第7章:語音識(shí)別_第2頁
語音信號(hào)處理 第4版 課件 第7章:語音識(shí)別_第3頁
語音信號(hào)處理 第4版 課件 第7章:語音識(shí)別_第4頁
語音信號(hào)處理 第4版 課件 第7章:語音識(shí)別_第5頁
已閱讀5頁,還剩25頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

南京郵電大學(xué)

通信與信息工程學(xué)院

第7章語音識(shí)別孤立字(詞)識(shí)別系統(tǒng)連續(xù)語音識(shí)別系統(tǒng)4語音識(shí)別原理和識(shí)別系統(tǒng)的組成語音識(shí)別系統(tǒng)的性能評測7.1語音識(shí)別原理和識(shí)別系統(tǒng)的組成—概述語音識(shí)別:主要指讓機(jī)器聽懂人說的話,即在各種情況下,準(zhǔn)確地識(shí)別出語音的內(nèi)容,從而根據(jù)其信息,執(zhí)行人的各種意圖。步驟:(1)系統(tǒng)“學(xué)習(xí)”或“訓(xùn)練”階段,該階段的任務(wù)是建立識(shí)別基本單元的聲學(xué)模型以及進(jìn)行文法分析的語言模型等。(2)“識(shí)別”或“測試”階段,根據(jù)識(shí)別系統(tǒng)的類型選擇能夠滿足要求的一種識(shí)別方法,采用語音分析方法分析出這種識(shí)別方法所要求的語音特征參數(shù),按照一定的準(zhǔn)則和測度與系統(tǒng)模型進(jìn)行比較,通過判決得出識(shí)別結(jié)果。語音識(shí)別系統(tǒng):建立在一定的硬件平臺(tái)和操作系統(tǒng)之上的一套應(yīng)用軟件系統(tǒng)。語音識(shí)別技術(shù)加上各種外圍技術(shù)的組合,才能構(gòu)成一個(gè)完整的實(shí)際應(yīng)用的語音識(shí)別系統(tǒng)。從語音識(shí)別系統(tǒng)的各個(gè)功能劃分的角度出發(fā),語音識(shí)別系統(tǒng)可分為語音信號(hào)的預(yù)處理部分、語音識(shí)別系統(tǒng)的核心算法部分以及語音識(shí)別系統(tǒng)的基本數(shù)據(jù)庫等幾部分。

7.1語音識(shí)別原理和識(shí)別系統(tǒng)的組成—概述一般語音識(shí)別系統(tǒng)框圖7.1語音識(shí)別原理和識(shí)別系統(tǒng)的組成—預(yù)處理和參數(shù)分析語音信號(hào)預(yù)處理部分包括:語音信號(hào)的電壓放大、反混疊濾波、自動(dòng)增益控制、模/數(shù)轉(zhuǎn)換、去除聲門激勵(lì)及口唇輻射的影響等(這些內(nèi)容已在前面章節(jié)中介紹過,這里僅對個(gè)別需要注意的地方做一些介紹)(1)傳聲器自適應(yīng)和輸入電平的設(shè)定輸入語音信號(hào)的品質(zhì)對語音識(shí)別性能的影響很大,因此,對傳聲器的耐噪聲性能要求很高。但是,傳聲器的性能差異很大,因此選擇好的傳聲器,不僅能提高輸入語音質(zhì)量,還有助于提高整個(gè)系統(tǒng)的魯棒性。同時(shí),不同種類的傳聲器以及前端設(shè)備的聲學(xué)特性是不同的,這會(huì)使輸入語音產(chǎn)生變化。因此,為了保持識(shí)別性能穩(wěn)定,必須具備對傳聲器以及前端設(shè)備性能的測定以及根據(jù)測試結(jié)果對輸入語音的變形進(jìn)行校正的功能。為了保持高精度的語音分析,A/D轉(zhuǎn)換的電平必須正確設(shè)定。同時(shí)還要通過自動(dòng)增益控制來自動(dòng)調(diào)整輸入電平放大的倍數(shù)或者通過對于輸入數(shù)據(jù)進(jìn)行規(guī)整處理來控制語音數(shù)據(jù)幅度的變化。7.1語音識(shí)別原理和識(shí)別系統(tǒng)的組成—預(yù)處理和參數(shù)分析(2)抗噪聲

環(huán)境噪聲雖然可以通過高性能傳聲器的抗噪聲特性加以抑制,但是不可能完全消除。特別是對于手自由的語音識(shí)別,傳聲器與嘴有一定距離的時(shí)候,以及在汽車?yán)锘驊敉獾戎車h(huán)境噪聲大的時(shí)候必須對輸入信號(hào)進(jìn)行降噪處理。這種噪聲可以是平穩(wěn)噪聲也可以是非平穩(wěn)噪聲,可以是來自環(huán)境等的加性噪聲也可以是由輸入和傳輸電路系統(tǒng)引起的乘法性噪聲。對于平穩(wěn)噪聲,傳統(tǒng)的譜相減降噪聲技術(shù)是有效的,對于非平穩(wěn)噪聲也有通過兩個(gè)傳聲器分別輸入語音和噪聲相互抵消加以消除的方法。(3)語音區(qū)間的端點(diǎn)檢測

端點(diǎn)檢測的目的是從包含語音的一段信號(hào)中確定出語音的起點(diǎn)以及終點(diǎn),相關(guān)內(nèi)容在前面章節(jié)已經(jīng)有所說明。有效的端點(diǎn)檢測不僅能使處理時(shí)間減到最小,而且能排除無聲段的噪聲干擾,從而使識(shí)別系統(tǒng)具有良好的識(shí)別性能。傳統(tǒng)的端點(diǎn)檢測方法是將語音信號(hào)的短時(shí)能量與過零率相結(jié)合加以判斷的。但這種端點(diǎn)檢測算法如果運(yùn)用不好,將會(huì)發(fā)生漏檢或虛檢的情況。為了克服傳統(tǒng)端點(diǎn)檢測算法的缺點(diǎn),已有很多改進(jìn)方法被提出來。例如,可以考慮采用基于相關(guān)性的語音端點(diǎn)檢測算法。7.1語音識(shí)別原理和識(shí)別系統(tǒng)的組成—預(yù)處理和參數(shù)分析(4)語音參數(shù)分析經(jīng)過預(yù)處理后的語音信號(hào),就要對其進(jìn)行特征參數(shù)分析,其目的是抽取語音特征,以使在語音識(shí)別時(shí)類內(nèi)距離盡量小,類間距離盡量大。特征參數(shù)提取是語音識(shí)別的關(guān)鍵問題,特征參數(shù)選擇的好壞直接影響到語音識(shí)別的精度。

識(shí)別參數(shù)可以選擇下面的某一種或幾種的組合:平均能量、過零數(shù)或平均過零數(shù)、頻譜、共振峰、倒譜、線性預(yù)測系數(shù)、偏自相關(guān)系數(shù)、聲道形狀的尺寸函數(shù),以及音長、音高、聲調(diào)等超聲短信息函數(shù)。此外,Mel倒譜參數(shù)也是常用的語音識(shí)別特征參數(shù)。一般這些參數(shù)都是用10~15維的特征矢量的時(shí)間序列來表示。除了這些靜態(tài)參數(shù)以外,上述參數(shù)的時(shí)間變化反映了語音特征的動(dòng)態(tài)特性,作為動(dòng)態(tài)參數(shù)也常常被用于語音識(shí)別當(dāng)中。

提取的語音特征參數(shù)有時(shí)還要進(jìn)行進(jìn)一步的變換處理,如正交變換、主元素分析、最大可分性變換等,以達(dá)到進(jìn)一步的壓縮處理和模式可分性變換,節(jié)省模式存儲(chǔ)容量和識(shí)別運(yùn)算量,提高識(shí)別性能的目的。識(shí)別參數(shù)的選擇也與正識(shí)率及復(fù)雜度的矛盾有關(guān)。因?yàn)樵谕ǔG闆r下,參數(shù)中包含的信息越多,則分析或提取的復(fù)雜度也越大。7.1語音識(shí)別原理和識(shí)別系統(tǒng)的組成—預(yù)處理和參數(shù)分析(4)語音參數(shù)分析經(jīng)過預(yù)處理后的語音信號(hào),就要對其進(jìn)行特征參數(shù)分析,其目的是抽取語音特征,以使在語音識(shí)別時(shí)類內(nèi)距離盡量小,類間距離盡量大。特征參數(shù)提取是語音識(shí)別的關(guān)鍵問題,特征參數(shù)選擇的好壞直接影響到語音識(shí)別的精度。

識(shí)別參數(shù)可以選擇下面的某一種或幾種的組合:平均能量、過零數(shù)或平均過零數(shù)、頻譜、共振峰、倒譜、線性預(yù)測系數(shù)、偏自相關(guān)系數(shù)、聲道形狀的尺寸函數(shù),以及音長、音高、聲調(diào)等超聲短信息函數(shù)。此外,Mel倒譜參數(shù)也是常用的語音識(shí)別特征參數(shù)。一般這些參數(shù)都是用10~15維的特征矢量的時(shí)間序列來表示。除了這些靜態(tài)參數(shù)以外,上述參數(shù)的時(shí)間變化反映了語音特征的動(dòng)態(tài)特性,作為動(dòng)態(tài)參數(shù)也常常被用于語音識(shí)別當(dāng)中。

提取的語音特征參數(shù)有時(shí)還要進(jìn)行進(jìn)一步的變換處理,如正交變換、主元素分析、最大可分性變換等,以達(dá)到進(jìn)一步的壓縮處理和模式可分性變換,節(jié)省模式存儲(chǔ)容量和識(shí)別運(yùn)算量,提高識(shí)別性能的目的。識(shí)別參數(shù)的選擇也與正識(shí)率及復(fù)雜度的矛盾有關(guān)。因?yàn)樵谕ǔG闆r下,參數(shù)中包含的信息越多,則分析或提取的復(fù)雜度也越大。7.1語音識(shí)別原理和識(shí)別系統(tǒng)的組成—語音識(shí)別系統(tǒng)構(gòu)成語音識(shí)別模塊的定義:是語音識(shí)別系統(tǒng)的核心部分,其除了包括語音的聲學(xué)模型以及相應(yīng)的語言模型的建立、參數(shù)匹配方法、搜索算法、話者自適應(yīng)算法,還包括增添新詞的功能、數(shù)據(jù)庫管理和友好的人機(jī)交互界面等。(1)語音模型

語音模型一般指的是用于參數(shù)匹配的聲學(xué)模型。而語言模型一般是指在匹配搜索時(shí)用于字詞和路徑約束的語言規(guī)則。語音聲學(xué)模型的好壞對語音識(shí)別的性能影響很大,現(xiàn)在公認(rèn)的較好的概率統(tǒng)計(jì)模型是HMM模型。因?yàn)镠MM可以吸收環(huán)境和話者引起的特征參數(shù)的變動(dòng),實(shí)現(xiàn)非特定人的語音識(shí)別。(2)連續(xù)語音的自動(dòng)分段

連續(xù)語音的自動(dòng)分段,是指從語音信號(hào)流中自動(dòng)地分割出識(shí)別基元。它用數(shù)字處理技術(shù)來找出語音信號(hào)中的各種段落(如:音素、音節(jié)詞素、詞等)的始點(diǎn)和終點(diǎn)的位置。把連續(xù)的語音信號(hào)分成對應(yīng)于各音的區(qū)間叫作分割,分割的結(jié)果產(chǎn)生的區(qū)間叫作分割區(qū)間,給分割區(qū)間賦予表示音種的符號(hào)叫作符號(hào)化。7.1語音識(shí)別原理和識(shí)別系統(tǒng)的組成—語音識(shí)別系統(tǒng)構(gòu)成(3)語音識(shí)別方法當(dāng)今語音識(shí)別技術(shù)的主流算法,主要有基于參數(shù)模型的隱馬爾可夫模型(HMM)的方法和基于非參數(shù)模型的矢量量化(VQ)的方法。另外,基于人工神經(jīng)網(wǎng)絡(luò)(ANN)的語音識(shí)別方法,也得到了很好的應(yīng)用。此外,還可使用混合方法,如ANN/HMM法、VQ/HMM法等。傳統(tǒng)的基于動(dòng)態(tài)時(shí)間規(guī)整的算法(DTW),在連續(xù)語音識(shí)別中仍然是主流方法。同時(shí),在小詞匯量、孤立字(詞)識(shí)別系統(tǒng)中,也已有許多改進(jìn)的DTW算法被提出。(4)計(jì)算量和存儲(chǔ)量的削減

對于在有限的硬件和軟件資源下動(dòng)作的語音識(shí)別系統(tǒng),降低識(shí)別處理的計(jì)算量和存儲(chǔ)量非常重要。當(dāng)用HMM作為識(shí)別模型時(shí),特征矢量的輸出概率計(jì)算以及輸入語音和語音模型的匹配搜索將占用很大的時(shí)間和空間。為了減少計(jì)算量和存儲(chǔ)量,可以進(jìn)行語音或者標(biāo)準(zhǔn)模式的矢量量化和聚類運(yùn)算分析,利用代表語音特征的中心值進(jìn)行匹配。7.1語音識(shí)別原理和識(shí)別系統(tǒng)的組成—語音識(shí)別系統(tǒng)構(gòu)成(5)拒識(shí)別處理

由于用戶發(fā)音的錯(cuò)誤,可能出現(xiàn)系統(tǒng)詞匯表以外的單詞或者句子,同時(shí),在噪聲環(huán)境下由噪聲引起的語音區(qū)間檢測錯(cuò)誤也可能產(chǎn)生許多誤識(shí)別的結(jié)果。所以在實(shí)際語音識(shí)別系統(tǒng)中,對信賴度低的識(shí)別結(jié)果的拒絕處理也是一個(gè)很重要的課題??梢钥紤]利用音節(jié)識(shí)別得到的得分補(bǔ)償?shù)姆绞竭M(jìn)行拒識(shí)別處理,在這種方式中,利用在不限定識(shí)別對象的條件下求得的參考得分來補(bǔ)償?shù)淖R(shí)別結(jié)果,并用補(bǔ)償過的識(shí)別得分進(jìn)行拒識(shí)別判定。

(6)識(shí)別結(jié)果確認(rèn),候補(bǔ)選擇為了避免由于誤識(shí)別而產(chǎn)生的誤動(dòng)作,可以讓用戶對識(shí)別結(jié)果進(jìn)行確定,或者給用戶提供多個(gè)識(shí)別結(jié)果候選,讓用戶自己選擇正確的結(jié)果。(7)用戶設(shè)定

一臺(tái)識(shí)別系統(tǒng)如果可被多個(gè)用戶使用,那么系統(tǒng)必須具有記憶和選擇每個(gè)用戶特定模型的功能。同時(shí),每個(gè)用戶可以隨時(shí)在自己的詞典里增加或刪減單詞的功能,以及系統(tǒng)根據(jù)一定的特征信息自動(dòng)進(jìn)行不同用戶間的識(shí)別程序的切換功能。孤立字(詞)識(shí)別系統(tǒng)連續(xù)語音識(shí)別系統(tǒng)4語音識(shí)別原理和識(shí)別系統(tǒng)的組成語音識(shí)別系統(tǒng)的性能評測7.2孤立字(詞)識(shí)別系統(tǒng)孤立字(詞)識(shí)別系統(tǒng)定義:顧名思義是識(shí)別孤立發(fā)音的字或詞。由于在孤立字(詞)識(shí)別中,單詞之間有停頓,可使識(shí)別問題簡化;單詞之間的端點(diǎn)檢測比較容易;單詞之間的協(xié)同發(fā)音影響較小;一般對孤立單詞的發(fā)音都比較認(rèn)真等。所以這種系統(tǒng)存在的問題較少,較容易實(shí)現(xiàn)。7.2孤立字(詞)識(shí)別系統(tǒng)—基于改進(jìn)的二次分類函數(shù)的漢語塞音語音識(shí)別系統(tǒng)

7.2孤立字(詞)識(shí)別系統(tǒng)—基于改進(jìn)的二次分類函數(shù)的漢語塞音語音識(shí)別系統(tǒng)當(dāng)輸入待識(shí)別語音可以用矢量的時(shí)間序列表示時(shí),可表示為如果

較大的話,則計(jì)算較復(fù)雜,所以有必要尋找一種近似方法來進(jìn)行。最簡單的方法是把所有的Xi看成相互獨(dú)立的情況,這時(shí)則有上述方法的近似只是把特征發(fā)生的事實(shí)作為問題來考慮,關(guān)于它的時(shí)間順序信息沒有被用到。要改進(jìn)這種缺點(diǎn),有一種方法就是利用一階或者二階的馬爾可夫鏈。為簡化問題,令下列寫法成立則有7.2孤立字(詞)識(shí)別系統(tǒng)—基于改進(jìn)的二次分類函數(shù)的漢語塞音語音識(shí)別系統(tǒng)在基于Bayes判別準(zhǔn)則的語音識(shí)別法中,二次判別函法(QDF)和修正型二次判別函數(shù)(MQDF)是經(jīng)常被使用的方法。QDF:MQDF:7.2孤立字(詞)識(shí)別系統(tǒng)—基于動(dòng)態(tài)時(shí)間規(guī)整的孤立字(詞)識(shí)別系統(tǒng)DTW定義:是把時(shí)間規(guī)整和距離測度計(jì)算結(jié)合起來的一種非線性規(guī)整技術(shù)。動(dòng)態(tài)時(shí)間規(guī)整示意圖設(shè)測試語音參數(shù)共有I幀矢量,而參考模板共有J幀矢量,且I≠J,則動(dòng)態(tài)時(shí)間規(guī)整就是要尋找一個(gè)時(shí)間歸整函數(shù)j=ω(i),它將測試矢量的時(shí)間軸i非線性地映射到模板的時(shí)間軸j上,并使該函數(shù)ω滿足:由于DTW不斷地計(jì)算兩矢量的距離以尋找最優(yōu)的匹配路徑,所以得到的是兩矢量匹配時(shí)累積距離最小的規(guī)整函數(shù),這就保證了它們之間存在最大的聲學(xué)相似特性。7.2孤立字(詞)識(shí)別系統(tǒng)—基于概率尺度識(shí)別方法的孤立字(詞)識(shí)別系統(tǒng)傳統(tǒng)的DP方法只能適用于特定人的語音識(shí)別系統(tǒng)。為了使基于DP的語音識(shí)別裝置也能適用于非特定人的語音識(shí)別,可以利用概率尺度的DP進(jìn)行識(shí)別的方法。例如對于下圖所示的非對稱型DP路徑,具有概率尺度的DP方法的遞推公式可以用下面式子來表示。上述的概率尺度DP方法,實(shí)際上相當(dāng)于把語音樣本的每一幀看作一個(gè)模型狀態(tài)的連續(xù)狀態(tài)HMM。因?yàn)槿绻麉⒖紭颖臼莿t其特征矢量的時(shí)間序列是一個(gè)馬爾可夫過程,如果把每一個(gè)特征矢量看作馬爾可夫過程的一個(gè)狀態(tài),同時(shí)把輸入信號(hào)看作觀察時(shí)間序列并應(yīng)用Viterb算法,則HMM法和概率尺度DP方法具有同一關(guān)系式。由于連續(xù)狀態(tài)HMM能較好地描述語音特征矢量的幀間相關(guān)信息,改善HMM的動(dòng)態(tài)特性,可望得到較好的識(shí)別性能。7.2孤立字(詞)識(shí)別系統(tǒng)—基于概率尺度識(shí)別方法的孤立字(詞)識(shí)別系統(tǒng)7.2孤立字(詞)識(shí)別系統(tǒng)—基于概率尺度識(shí)別方法的孤立字(詞)識(shí)別系統(tǒng)(1)條件概率的確定假定在狀態(tài)j觀測到的Xi是符合(μj,Σj)的高斯分布,則條件概率由下式給定:(2)狀態(tài)轉(zhuǎn)移概率的確定為了計(jì)算狀態(tài)轉(zhuǎn)移概率,各個(gè)學(xué)習(xí)數(shù)據(jù)和核心樣本進(jìn)行DP匹配時(shí),計(jì)下各時(shí)刻選擇的路徑情況,學(xué)習(xí)完畢后,假定在時(shí)刻j三個(gè)路徑被選擇的總數(shù)分別是,則此時(shí)的三個(gè)狀態(tài)轉(zhuǎn)移概率可由下式給定:(3)識(shí)別方法識(shí)別時(shí)對于輸入語音信號(hào)序列,利用DP方法的遞推公式和各個(gè)模型進(jìn)行DP匹配。給出最高得分的模型所對應(yīng)的類別即為識(shí)別結(jié)果。7.2孤立字(詞)識(shí)別系統(tǒng)—基于隱馬爾可夫模型的孤立字(詞)識(shí)別系統(tǒng)利用HMM進(jìn)行孤立字(詞)語音識(shí)別時(shí),主要分為兩個(gè)階段:訓(xùn)練階段和識(shí)別階段。

假設(shè)總共有G個(gè)待識(shí)別的孤立字(詞),在訓(xùn)練階段,對于每一個(gè)孤立字(詞)g,將經(jīng)過預(yù)處理和特征提取步驟之后得到的語音信號(hào)的特征矢量序列的集合作為觀察值序列O(g),利用第3章介紹的HMM的基本算法———Baum-Welch算法估計(jì)出與當(dāng)前孤立字(詞)對應(yīng)的HMM的參數(shù)在識(shí)別階段,對于任一待識(shí)別的語音,首先將其進(jìn)行預(yù)處理和特征提取,得到對應(yīng)的特征矢量序列(如果選用的是離散型的HMM,則需要進(jìn)行矢量量化。然后利用HMM的基本算法———前向-后向算法計(jì)算該特征矢量序列在訓(xùn)練好的每個(gè)孤立字(詞)HMM上的輸出概率,把輸出概率最大的HMM所對應(yīng)的孤立字(詞)作為識(shí)別結(jié)果。7.2孤立字(詞)識(shí)別系統(tǒng)—基于隱馬爾可夫模型的孤立字(詞)識(shí)別系統(tǒng)基于離散型HMM的孤立字(詞)識(shí)別孤立字(詞)識(shí)別系統(tǒng)連續(xù)語音識(shí)別系統(tǒng)4語音識(shí)別原理和識(shí)別系統(tǒng)的組成語音識(shí)別系統(tǒng)的性能評測在連續(xù)語音識(shí)別系統(tǒng)中,一段語音信號(hào)(例如一個(gè)句子)經(jīng)特征提取后,得到一個(gè)特征矢量的時(shí)間序列,假設(shè)該特征矢量序列可能包含的一個(gè)詞序列為,那么連續(xù)語音識(shí)別的任務(wù)就是找到對應(yīng)觀測矢量序列A的最可能的詞序列

。這個(gè)過程如果按照貝葉斯準(zhǔn)則就是

在連續(xù)語音識(shí)別系統(tǒng)中利用語言模型的目的是找出符合句法約束的最佳單詞序列,并且減少觀測矢量序列A和詞序列W的匹配搜索范圍,提高識(shí)別效率。7.3

連續(xù)語音識(shí)別系統(tǒng)7.3

連續(xù)語音識(shí)別系統(tǒng)在連續(xù)語音識(shí)別方法中,較好的方法應(yīng)該是把句法分析的語言處理過程結(jié)合進(jìn)語音識(shí)別過程中,實(shí)現(xiàn)幀同步的語音-語言處理的統(tǒng)合。當(dāng)然,這樣實(shí)現(xiàn)起來就復(fù)雜得多,一般采用的方法是把聲學(xué)模型和語言模型結(jié)合在一個(gè)有限狀態(tài)自動(dòng)機(jī)的框架里進(jìn)行處理。一般來說,一個(gè)連續(xù)語音識(shí)別系統(tǒng)主要由特征參數(shù)分析部、語音識(shí)別部、句法分析和單詞預(yù)測部等三大部分組成。在特征參數(shù)分析部,求取輸入語音信號(hào)的識(shí)別用特征參數(shù)。在語音識(shí)別部,根據(jù)文法分析部提供的被預(yù)測單詞,按照文法字典(詞匯表)由基元模型自動(dòng)組成單詞的標(biāo)準(zhǔn)模型(因?yàn)榫浞ǚ治龅膯挝皇菃卧~)。然后利用DP算法、LevelBuilding算法或OnePassDP法等和單詞的標(biāo)準(zhǔn)模型同步地和輸入語音進(jìn)行單詞的識(shí)別匹配,并進(jìn)一步利用搜索方法,由單詞模型的連接求得最佳單詞序列。在句法分析部,采用語言模型來描述待識(shí)別語句的句法構(gòu)造,并利用句法分析器來進(jìn)行句法分析和預(yù)測單詞。孤立字(詞)識(shí)別系統(tǒng)連續(xù)語音識(shí)別系統(tǒng)4語音識(shí)別原理和識(shí)別系統(tǒng)的組成語音識(shí)別系統(tǒng)的性能評測7.4語音識(shí)別系統(tǒng)的性能評測—性能評測指標(biāo)語音識(shí)別系統(tǒng)的評價(jià)研究就是要研究一套公認(rèn)的評價(jià)標(biāo)準(zhǔn)和科學(xué)合理的評測方法,來衡量、評定不同識(shí)別系統(tǒng)和不同處理方法之間的優(yōu)劣,預(yù)測在不同使用條件下的系統(tǒng)性能。1.系統(tǒng)識(shí)別率指標(biāo)連續(xù)語音識(shí)別系統(tǒng)中一般采用音素、音節(jié)或單詞的識(shí)別率來評測系統(tǒng)性能。這時(shí)除了有正確率的指標(biāo),錯(cuò)誤率中還必須考慮置換率、插入率和脫落率各占多少。一般常用的系統(tǒng)指標(biāo)有如下所示的、錯(cuò)誤率和識(shí)別精度:7.4語音識(shí)別系統(tǒng)的性能評測—性能評測指標(biāo)2.任務(wù)復(fù)雜性度指標(biāo)表示在語言模型規(guī)定下的系統(tǒng)識(shí)別任務(wù)復(fù)雜性的測度主要有系統(tǒng)靜態(tài)分支度FS和平均輸出數(shù)FA、系統(tǒng)識(shí)別任務(wù)的和識(shí)別單位的分支度等。(1)系統(tǒng)靜態(tài)分支度和平均輸出設(shè)語言L是由有限狀態(tài)自動(dòng)機(jī)描述的。π(j)是狀態(tài)j的出現(xiàn)概率、n(j)表示在狀態(tài)j輸出的識(shí)別單

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論