




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、9.1 9.1 概述概述v語(yǔ)音識(shí)別(語(yǔ)音識(shí)別(Speech RecognitionSpeech Recognition)主要指讓機(jī)器聽(tīng)懂人說(shuō)的)主要指讓機(jī)器聽(tīng)懂人說(shuō)的話(huà),即在各種情況下,準(zhǔn)確地識(shí)別出語(yǔ)音的內(nèi)容,從而根據(jù)話(huà),即在各種情況下,準(zhǔn)確地識(shí)別出語(yǔ)音的內(nèi)容,從而根據(jù)其信息,執(zhí)行人的各種意圖。它是一門(mén)涉及面很廣的交叉學(xué)其信息,執(zhí)行人的各種意圖。它是一門(mén)涉及面很廣的交叉學(xué)科,與計(jì)算機(jī)、通信、語(yǔ)音語(yǔ)言學(xué)、數(shù)理統(tǒng)計(jì)、信號(hào)處理、科,與計(jì)算機(jī)、通信、語(yǔ)音語(yǔ)言學(xué)、數(shù)理統(tǒng)計(jì)、信號(hào)處理、神經(jīng)生理學(xué)、神經(jīng)心理學(xué)和人工智能等學(xué)科都有著密切的關(guān)神經(jīng)生理學(xué)、神經(jīng)心理學(xué)和人工智能等學(xué)科都有著密切的關(guān)系。系。 一般語(yǔ)音
2、識(shí)別系統(tǒng)按不同的角度有下面幾種分類(lèi)方法。一般語(yǔ)音識(shí)別系統(tǒng)按不同的角度有下面幾種分類(lèi)方法。v孤立詞、連接詞、連續(xù)語(yǔ)音識(shí)別系統(tǒng)以及語(yǔ)音理解和會(huì)話(huà)系孤立詞、連接詞、連續(xù)語(yǔ)音識(shí)別系統(tǒng)以及語(yǔ)音理解和會(huì)話(huà)系統(tǒng)。統(tǒng)。v大詞匯、中詞匯和小詞匯量語(yǔ)音識(shí)別系統(tǒng)。大詞匯、中詞匯和小詞匯量語(yǔ)音識(shí)別系統(tǒng)。 v特定人和非特定人語(yǔ)音識(shí)別系統(tǒng)。特定人和非特定人語(yǔ)音識(shí)別系統(tǒng)。v語(yǔ)音識(shí)別所采用的方法也可以作為語(yǔ)音識(shí)別系統(tǒng)分類(lèi)的依據(jù),語(yǔ)音識(shí)別所采用的方法也可以作為語(yǔ)音識(shí)別系統(tǒng)分類(lèi)的依據(jù),因此,也有從識(shí)別方法上來(lái)對(duì)語(yǔ)音識(shí)別系統(tǒng)進(jìn)行分類(lèi)的。語(yǔ)因此,也有從識(shí)別方法上來(lái)對(duì)語(yǔ)音識(shí)別系統(tǒng)進(jìn)行分類(lèi)的。語(yǔ)音識(shí)別方法一般有模板匹配法、隨機(jī)模型法和概
3、率語(yǔ)法分析音識(shí)別方法一般有模板匹配法、隨機(jī)模型法和概率語(yǔ)法分析法三種。法三種。v實(shí)用語(yǔ)音識(shí)別研究中存在的幾個(gè)主要問(wèn)題和困難如下:實(shí)用語(yǔ)音識(shí)別研究中存在的幾個(gè)主要問(wèn)題和困難如下:v(1 1)語(yǔ)音識(shí)別的一種重要應(yīng)用是自然語(yǔ)言的識(shí)別和理解。)語(yǔ)音識(shí)別的一種重要應(yīng)用是自然語(yǔ)言的識(shí)別和理解。v(2 2)語(yǔ)音信息的變化很大。)語(yǔ)音信息的變化很大。v(3 3)語(yǔ)音的模糊性。)語(yǔ)音的模糊性。v(4 4)單個(gè)字母及單個(gè)詞語(yǔ)發(fā)音時(shí)語(yǔ)音特性受上下文環(huán)境的)單個(gè)字母及單個(gè)詞語(yǔ)發(fā)音時(shí)語(yǔ)音特性受上下文環(huán)境的影響,使相同字母有不同的語(yǔ)音特性。影響,使相同字母有不同的語(yǔ)音特性。v(5 5)環(huán)境的噪聲和干擾對(duì)語(yǔ)音識(shí)別有嚴(yán)重影響
4、。)環(huán)境的噪聲和干擾對(duì)語(yǔ)音識(shí)別有嚴(yán)重影響。 9.2 9.2 語(yǔ)音識(shí)別原理和識(shí)別系統(tǒng)的組成語(yǔ)音識(shí)別原理和識(shí)別系統(tǒng)的組成v語(yǔ)音識(shí)別系統(tǒng)是建立在一定的硬件平臺(tái)和操作系統(tǒng)之上的一語(yǔ)音識(shí)別系統(tǒng)是建立在一定的硬件平臺(tái)和操作系統(tǒng)之上的一套應(yīng)用軟件系統(tǒng)。套應(yīng)用軟件系統(tǒng)。v語(yǔ)音識(shí)別一般分兩個(gè)步驟。第一步是系統(tǒng)語(yǔ)音識(shí)別一般分兩個(gè)步驟。第一步是系統(tǒng)“學(xué)習(xí)學(xué)習(xí)”或或“訓(xùn)練訓(xùn)練”階段。第二步是階段。第二步是“識(shí)別識(shí)別”或或“測(cè)試測(cè)試”階段。階段。 v語(yǔ)音識(shí)別技術(shù)加上各種外圍技術(shù)的組合,才能構(gòu)成一個(gè)完整語(yǔ)音識(shí)別技術(shù)加上各種外圍技術(shù)的組合,才能構(gòu)成一個(gè)完整的實(shí)際應(yīng)用的語(yǔ)音識(shí)別系統(tǒng)。從語(yǔ)音識(shí)別系統(tǒng)的各個(gè)功能劃的實(shí)際應(yīng)用的語(yǔ)音
5、識(shí)別系統(tǒng)。從語(yǔ)音識(shí)別系統(tǒng)的各個(gè)功能劃分的角度出發(fā),語(yǔ)音識(shí)別系統(tǒng)可分為語(yǔ)音信號(hào)的預(yù)處理部分、分的角度出發(fā),語(yǔ)音識(shí)別系統(tǒng)可分為語(yǔ)音信號(hào)的預(yù)處理部分、語(yǔ)音識(shí)別系統(tǒng)的核心算法部分以及語(yǔ)音識(shí)別系統(tǒng)的基本數(shù)據(jù)語(yǔ)音識(shí)別系統(tǒng)的核心算法部分以及語(yǔ)音識(shí)別系統(tǒng)的基本數(shù)據(jù)庫(kù)等幾部分。庫(kù)等幾部分。v一般語(yǔ)音識(shí)別系統(tǒng)框圖一般語(yǔ)音識(shí)別系統(tǒng)框圖 9.2.1 9.2.1預(yù)處理和參數(shù)分析預(yù)處理和參數(shù)分析v語(yǔ)音信號(hào)預(yù)處理部分包括:語(yǔ)音信號(hào)的電壓放大、反混疊濾語(yǔ)音信號(hào)預(yù)處理部分包括:語(yǔ)音信號(hào)的電壓放大、反混疊濾波、自動(dòng)增益控制、模數(shù)變換、去除聲門(mén)激勵(lì)及口唇輻射波、自動(dòng)增益控制、模數(shù)變換、去除聲門(mén)激勵(lì)及口唇輻射的影響等。這里僅對(duì)個(gè)別需
6、要注意的地方做一些介紹。的影響等。這里僅對(duì)個(gè)別需要注意的地方做一些介紹。v話(huà)筒自適應(yīng)和輸入電平的設(shè)定話(huà)筒自適應(yīng)和輸入電平的設(shè)定:輸入語(yǔ)音信號(hào)的品質(zhì)對(duì)語(yǔ)音:輸入語(yǔ)音信號(hào)的品質(zhì)對(duì)語(yǔ)音識(shí)別性能的影響很大,因此,對(duì)話(huà)筒的耐噪聲性能要求很高。識(shí)別性能的影響很大,因此,對(duì)話(huà)筒的耐噪聲性能要求很高。選擇好的麥克風(fēng),不僅能提高輸入語(yǔ)音質(zhì)量,而且,還有助選擇好的麥克風(fēng),不僅能提高輸入語(yǔ)音質(zhì)量,而且,還有助于提高整個(gè)系統(tǒng)的魯棒性。為了保持高精度的語(yǔ)音分析,于提高整個(gè)系統(tǒng)的魯棒性。為了保持高精度的語(yǔ)音分析,A/DA/D變換的電平必需正確的設(shè)定。同時(shí)還要通過(guò)變換的電平必需正確的設(shè)定。同時(shí)還要通過(guò)AGCAGC來(lái)自動(dòng)的來(lái)
7、自動(dòng)的調(diào)整輸入電平放大的倍數(shù)或者通過(guò)對(duì)于輸入數(shù)據(jù)進(jìn)行規(guī)整處調(diào)整輸入電平放大的倍數(shù)或者通過(guò)對(duì)于輸入數(shù)據(jù)進(jìn)行規(guī)整處理來(lái)控制語(yǔ)音數(shù)據(jù)幅度的變化。理來(lái)控制語(yǔ)音數(shù)據(jù)幅度的變化。v抗噪聲抗噪聲:環(huán)境噪聲不可能完全消除。對(duì)于手自由的語(yǔ)音識(shí)別:環(huán)境噪聲不可能完全消除。對(duì)于手自由的語(yǔ)音識(shí)別(Hand-FreeHand-Free),話(huà)筒與嘴有一定距離的時(shí)候,以及在汽車(chē)),話(huà)筒與嘴有一定距離的時(shí)候,以及在汽車(chē)?yán)锘驊?hù)外等周?chē)h(huán)境噪聲大的時(shí)候必須對(duì)輸入信號(hào)進(jìn)行降噪里或戶(hù)外等周?chē)h(huán)境噪聲大的時(shí)候必須對(duì)輸入信號(hào)進(jìn)行降噪處理。對(duì)于平穩(wěn)噪聲,傳統(tǒng)的譜相減(處理。對(duì)于平穩(wěn)噪聲,傳統(tǒng)的譜相減(SSSS)降噪聲技術(shù)是有)降噪聲技術(shù)是
8、有效的,對(duì)于非平穩(wěn)噪聲也有通過(guò)兩個(gè)話(huà)筒分別輸入語(yǔ)音和噪效的,對(duì)于非平穩(wěn)噪聲也有通過(guò)兩個(gè)話(huà)筒分別輸入語(yǔ)音和噪聲相互抵消加以消除的方法。聲相互抵消加以消除的方法。v語(yǔ)音區(qū)間的端點(diǎn)檢測(cè)語(yǔ)音區(qū)間的端點(diǎn)檢測(cè): :端點(diǎn)檢測(cè)的目的是從包含語(yǔ)音的一段端點(diǎn)檢測(cè)的目的是從包含語(yǔ)音的一段信號(hào)中確定出語(yǔ)音的起點(diǎn)以及終點(diǎn)。有效的端點(diǎn)檢測(cè)不僅能信號(hào)中確定出語(yǔ)音的起點(diǎn)以及終點(diǎn)。有效的端點(diǎn)檢測(cè)不僅能使處理時(shí)間減到最小,而且能排除無(wú)聲段的噪聲干擾,從而使處理時(shí)間減到最小,而且能排除無(wú)聲段的噪聲干擾,從而使識(shí)別系統(tǒng)具有良好的識(shí)別性能。傳統(tǒng)的端點(diǎn)檢測(cè)方法是將使識(shí)別系統(tǒng)具有良好的識(shí)別性能。傳統(tǒng)的端點(diǎn)檢測(cè)方法是將語(yǔ)音信號(hào)的短時(shí)能量與過(guò)
9、零率相結(jié)合加以判斷的。但這種端語(yǔ)音信號(hào)的短時(shí)能量與過(guò)零率相結(jié)合加以判斷的。但這種端點(diǎn)檢測(cè)算法如果運(yùn)用不好,將會(huì)發(fā)生漏檢或虛檢的情況。為點(diǎn)檢測(cè)算法如果運(yùn)用不好,將會(huì)發(fā)生漏檢或虛檢的情況。為了克服傳統(tǒng)端點(diǎn)檢測(cè)算法的缺點(diǎn),已有很多改進(jìn)方法被提出了克服傳統(tǒng)端點(diǎn)檢測(cè)算法的缺點(diǎn),已有很多改進(jìn)方法被提出來(lái)。例如,可以考慮采用基于相關(guān)性的語(yǔ)音端點(diǎn)檢測(cè)算法。來(lái)。例如,可以考慮采用基于相關(guān)性的語(yǔ)音端點(diǎn)檢測(cè)算法。 v語(yǔ)音參數(shù)分析語(yǔ)音參數(shù)分析: :經(jīng)過(guò)預(yù)處理后的語(yǔ)音信號(hào),就要對(duì)其進(jìn)行特經(jīng)過(guò)預(yù)處理后的語(yǔ)音信號(hào),就要對(duì)其進(jìn)行特征參數(shù)分析,其目的是抽取語(yǔ)音特征,以使在語(yǔ)音識(shí)別時(shí)類(lèi)征參數(shù)分析,其目的是抽取語(yǔ)音特征,以使在語(yǔ)音
10、識(shí)別時(shí)類(lèi)內(nèi)距離盡量小,類(lèi)間距離盡量大。識(shí)別參數(shù)可以選擇下面的內(nèi)距離盡量小,類(lèi)間距離盡量大。識(shí)別參數(shù)可以選擇下面的某一種或幾種的組合:平均能量、過(guò)零數(shù)或平均過(guò)零數(shù)、頻某一種或幾種的組合:平均能量、過(guò)零數(shù)或平均過(guò)零數(shù)、頻譜、共振峰、倒譜、線(xiàn)性預(yù)測(cè)系數(shù)、譜、共振峰、倒譜、線(xiàn)性預(yù)測(cè)系數(shù)、PARCORPARCOR系數(shù)(偏自相關(guān)系數(shù)(偏自相關(guān)系數(shù))、聲道形狀的尺寸函數(shù),以及音長(zhǎng)、音高、聲調(diào)等超系數(shù))、聲道形狀的尺寸函數(shù),以及音長(zhǎng)、音高、聲調(diào)等超聲短信息函數(shù)。聲短信息函數(shù)。 v現(xiàn)在,經(jīng)過(guò)現(xiàn)在,經(jīng)過(guò)FFTFFT變換或者變換或者LPCLPC得到功率譜以后再經(jīng)過(guò)對(duì)數(shù)變換得到功率譜以后再經(jīng)過(guò)對(duì)數(shù)變換和傅立葉反變換得
11、到的倒譜參數(shù)是常用的語(yǔ)音識(shí)別特征參數(shù)。和傅立葉反變換得到的倒譜參數(shù)是常用的語(yǔ)音識(shí)別特征參數(shù)。 9.2.2 9.2.2 語(yǔ)音識(shí)別語(yǔ)音識(shí)別v語(yǔ)音識(shí)別是語(yǔ)音識(shí)別系統(tǒng)的核心部分。除包括語(yǔ)音的聲學(xué)模語(yǔ)音識(shí)別是語(yǔ)音識(shí)別系統(tǒng)的核心部分。除包括語(yǔ)音的聲學(xué)模型以及相應(yīng)的語(yǔ)言模型的建立、參數(shù)匹配方法、搜索算法、型以及相應(yīng)的語(yǔ)言模型的建立、參數(shù)匹配方法、搜索算法、話(huà)者自適應(yīng)算法,還包括增添新詞的功能、數(shù)據(jù)庫(kù)管理和友話(huà)者自適應(yīng)算法,還包括增添新詞的功能、數(shù)據(jù)庫(kù)管理和友好的人機(jī)交互界面等等。好的人機(jī)交互界面等等。v語(yǔ)音模型語(yǔ)音模型: :語(yǔ)音模型一般指的是用于參數(shù)匹配的聲學(xué)模型。語(yǔ)音模型一般指的是用于參數(shù)匹配的聲學(xué)模型。
12、語(yǔ)音聲學(xué)模型的好壞對(duì)語(yǔ)音識(shí)別的性能影響很大,現(xiàn)在公認(rèn)語(yǔ)音聲學(xué)模型的好壞對(duì)語(yǔ)音識(shí)別的性能影響很大,現(xiàn)在公認(rèn)的較好的概率統(tǒng)計(jì)模型是的較好的概率統(tǒng)計(jì)模型是HMMHMM模型。因?yàn)槟P?。因?yàn)镠MMHMM可以吸收環(huán)境和可以吸收環(huán)境和話(huà)者引起的特征參數(shù)的變動(dòng),實(shí)現(xiàn)非特定人的語(yǔ)音識(shí)別。話(huà)者引起的特征參數(shù)的變動(dòng),實(shí)現(xiàn)非特定人的語(yǔ)音識(shí)別。 識(shí)別模型的基元單位的選擇對(duì)于識(shí)別性能也有很大的影識(shí)別模型的基元單位的選擇對(duì)于識(shí)別性能也有很大的影響。對(duì)于日語(yǔ)和英語(yǔ),以半音節(jié)、環(huán)境依存音素為模型的研響。對(duì)于日語(yǔ)和英語(yǔ),以半音節(jié)、環(huán)境依存音素為模型的研究例子較多。對(duì)于漢語(yǔ),則可用究例子較多。對(duì)于漢語(yǔ),則可用“聲母聲母-韻母韻母”
13、,也可用,也可用音節(jié)字、詞等識(shí)別基元。音節(jié)字、詞等識(shí)別基元。v連續(xù)語(yǔ)音的自動(dòng)分段連續(xù)語(yǔ)音的自動(dòng)分段: :連續(xù)語(yǔ)音的自動(dòng)分段,是指從語(yǔ)音信連續(xù)語(yǔ)音的自動(dòng)分段,是指從語(yǔ)音信號(hào)流中自動(dòng)地分割出識(shí)別基元的問(wèn)題。號(hào)流中自動(dòng)地分割出識(shí)別基元的問(wèn)題。把連續(xù)的語(yǔ)音信號(hào)分把連續(xù)的語(yǔ)音信號(hào)分成對(duì)應(yīng)于各音的區(qū)間叫做分割(成對(duì)應(yīng)于各音的區(qū)間叫做分割(SegmentationSegmentation),分割的結(jié)),分割的結(jié)果產(chǎn)生的區(qū)間叫做分割區(qū)間(果產(chǎn)生的區(qū)間叫做分割區(qū)間(SegmentSegment),給分割區(qū)間付與),給分割區(qū)間付與表示音種的符號(hào)叫做符號(hào)化。表示音種的符號(hào)叫做符號(hào)化。漢語(yǔ)自動(dòng)分段是指根據(jù)漢語(yǔ)特漢語(yǔ)自
14、動(dòng)分段是指根據(jù)漢語(yǔ)特點(diǎn)及其參數(shù)的統(tǒng)計(jì)規(guī)律,設(shè)置某些參數(shù)的閾值,用計(jì)算機(jī)程點(diǎn)及其參數(shù)的統(tǒng)計(jì)規(guī)律,設(shè)置某些參數(shù)的閾值,用計(jì)算機(jī)程序自動(dòng)的進(jìn)行分段。序自動(dòng)的進(jìn)行分段。通??捎玫膮?shù)有:幀平均能量、幀平通??捎玫膮?shù)有:幀平均能量、幀平均過(guò)零數(shù)、線(xiàn)性預(yù)測(cè)的第一個(gè)反射系數(shù)或其殘差序列、音調(diào)均過(guò)零數(shù)、線(xiàn)性預(yù)測(cè)的第一個(gè)反射系數(shù)或其殘差序列、音調(diào)值等。從簡(jiǎn)單、快速的要求而言,最好采用前兩種時(shí)域參數(shù)值等。從簡(jiǎn)單、快速的要求而言,最好采用前兩種時(shí)域參數(shù)即幀平均能量即幀平均能量FNFN和幀平均過(guò)零數(shù)和幀平均過(guò)零數(shù)ZNZN。 v語(yǔ)音識(shí)別方法語(yǔ)音識(shí)別方法: :當(dāng)今語(yǔ)音識(shí)別技術(shù)的主流算法,主要有基于當(dāng)今語(yǔ)音識(shí)別技術(shù)的主流
15、算法,主要有基于參數(shù)模型的隱馬爾可夫模型(參數(shù)模型的隱馬爾可夫模型(HMMHMM)的方法和基于非參數(shù)模)的方法和基于非參數(shù)模型的矢量量化(型的矢量量化(VQVQ)的方法。另外,基于人工神經(jīng)網(wǎng)絡(luò))的方法。另外,基于人工神經(jīng)網(wǎng)絡(luò)(ANN)(ANN)的語(yǔ)音識(shí)別方法,也得到了很好的應(yīng)用。的語(yǔ)音識(shí)別方法,也得到了很好的應(yīng)用。 傳統(tǒng)的基于動(dòng)態(tài)時(shí)間伸縮的算法(傳統(tǒng)的基于動(dòng)態(tài)時(shí)間伸縮的算法(DTWDTW),在連續(xù)語(yǔ)音),在連續(xù)語(yǔ)音識(shí)別中仍然是主流方法。同時(shí),在小詞匯量、孤立字(詞)識(shí)別中仍然是主流方法。同時(shí),在小詞匯量、孤立字(詞)識(shí)別系統(tǒng)中,也已有許多改進(jìn)的識(shí)別系統(tǒng)中,也已有許多改進(jìn)的DTWDTW算法被提出
16、。算法被提出。 用于語(yǔ)音識(shí)別的距離測(cè)度有多種,如歐氏距離及其變形用于語(yǔ)音識(shí)別的距離測(cè)度有多種,如歐氏距離及其變形的歐氏距離測(cè)度、似然比測(cè)度、加權(quán)的識(shí)別測(cè)度等。選擇什的歐氏距離測(cè)度、似然比測(cè)度、加權(quán)的識(shí)別測(cè)度等。選擇什么樣的距離測(cè)度與識(shí)別系統(tǒng)采用什么語(yǔ)音特征參數(shù)和什么樣么樣的距離測(cè)度與識(shí)別系統(tǒng)采用什么語(yǔ)音特征參數(shù)和什么樣的識(shí)別模型有關(guān),的識(shí)別模型有關(guān), v計(jì)算量和存儲(chǔ)量的削減計(jì)算量和存儲(chǔ)量的削減:對(duì)于在有限的硬件和軟件資源下動(dòng):對(duì)于在有限的硬件和軟件資源下動(dòng)作的語(yǔ)音識(shí)別系統(tǒng),降低識(shí)別處理的計(jì)算量和存儲(chǔ)量非常重作的語(yǔ)音識(shí)別系統(tǒng),降低識(shí)別處理的計(jì)算量和存儲(chǔ)量非常重要。當(dāng)用要。當(dāng)用HMMHMM作為識(shí)別
17、模型時(shí),特征矢量的輸出概率計(jì)算以作為識(shí)別模型時(shí),特征矢量的輸出概率計(jì)算以及輸入語(yǔ)音和語(yǔ)音模型的匹配搜索將占用很大的時(shí)間和空間。及輸入語(yǔ)音和語(yǔ)音模型的匹配搜索將占用很大的時(shí)間和空間。為了減少計(jì)算量和存儲(chǔ)量,可以進(jìn)行語(yǔ)音或者標(biāo)準(zhǔn)模式的矢為了減少計(jì)算量和存儲(chǔ)量,可以進(jìn)行語(yǔ)音或者標(biāo)準(zhǔn)模式的矢量量化和聚類(lèi)運(yùn)算分析,利用代表語(yǔ)音特征的中心值進(jìn)行匹量量化和聚類(lèi)運(yùn)算分析,利用代表語(yǔ)音特征的中心值進(jìn)行匹配。在配。在HMMHMM語(yǔ)音識(shí)別系統(tǒng)中,識(shí)別運(yùn)算時(shí)輸出概率計(jì)算所消語(yǔ)音識(shí)別系統(tǒng)中,識(shí)別運(yùn)算時(shí)輸出概率計(jì)算所消耗的計(jì)算量較大,所以可以在輸出概率計(jì)算上采用快速算法。耗的計(jì)算量較大,所以可以在輸出概率計(jì)算上采用快速算
18、法。另外為了提高搜索效率,可以采用線(xiàn)搜索方法以及向前向后另外為了提高搜索效率,可以采用線(xiàn)搜索方法以及向前向后的組合搜索法等。的組合搜索法等。 v拒識(shí)別處理拒識(shí)別處理:由于用戶(hù)發(fā)音的錯(cuò)誤,可能出現(xiàn)系統(tǒng)詞匯表以:由于用戶(hù)發(fā)音的錯(cuò)誤,可能出現(xiàn)系統(tǒng)詞匯表以外的單詞或者句子,同時(shí),在噪聲環(huán)境下由噪音引起的語(yǔ)音外的單詞或者句子,同時(shí),在噪聲環(huán)境下由噪音引起的語(yǔ)音區(qū)間檢測(cè)錯(cuò)誤也可能產(chǎn)生許多誤識(shí)別的結(jié)果。所以在實(shí)際語(yǔ)區(qū)間檢測(cè)錯(cuò)誤也可能產(chǎn)生許多誤識(shí)別的結(jié)果。所以在實(shí)際語(yǔ)音識(shí)別系統(tǒng)中,對(duì)信賴(lài)度低的識(shí)別結(jié)果的音識(shí)別系統(tǒng)中,對(duì)信賴(lài)度低的識(shí)別結(jié)果的RejectionRejection處理也處理也是一個(gè)很重要的課題,可以
19、考慮利用音節(jié)識(shí)別得到的得分補(bǔ)是一個(gè)很重要的課題,可以考慮利用音節(jié)識(shí)別得到的得分補(bǔ)償?shù)姆绞竭M(jìn)行拒識(shí)別處理,在這種方式中,利用在不限定識(shí)償?shù)姆绞竭M(jìn)行拒識(shí)別處理,在這種方式中,利用在不限定識(shí)別對(duì)象的條件下求得的參考得分來(lái)補(bǔ)償?shù)淖R(shí)別結(jié)果,并用補(bǔ)別對(duì)象的條件下求得的參考得分來(lái)補(bǔ)償?shù)淖R(shí)別結(jié)果,并用補(bǔ)償過(guò)的識(shí)別得分進(jìn)行拒識(shí)別判定。償過(guò)的識(shí)別得分進(jìn)行拒識(shí)別判定。 v識(shí)別結(jié)果確認(rèn),候補(bǔ)選擇識(shí)別結(jié)果確認(rèn),候補(bǔ)選擇:為了避免由于誤識(shí)別而產(chǎn)生的:為了避免由于誤識(shí)別而產(chǎn)生的ApplicationApplication的誤動(dòng)作,可以讓用戶(hù)對(duì)識(shí)別結(jié)果進(jìn)行確定,的誤動(dòng)作,可以讓用戶(hù)對(duì)識(shí)別結(jié)果進(jìn)行確定,或者給用戶(hù)提供復(fù)數(shù)個(gè)識(shí)別
20、結(jié)果侯選,讓用戶(hù)自己選擇正確或者給用戶(hù)提供復(fù)數(shù)個(gè)識(shí)別結(jié)果侯選,讓用戶(hù)自己選擇正確的結(jié)果。的結(jié)果。 v用戶(hù)設(shè)定:用戶(hù)設(shè)定:一臺(tái)識(shí)別系統(tǒng)被多個(gè)用戶(hù)使用的場(chǎng)合。系統(tǒng)必須一臺(tái)識(shí)別系統(tǒng)被多個(gè)用戶(hù)使用的場(chǎng)合。系統(tǒng)必須具有記憶和選擇每個(gè)用戶(hù)特定模型的功能。同時(shí),每個(gè)用戶(hù)具有記憶和選擇每個(gè)用戶(hù)特定模型的功能。同時(shí),每個(gè)用戶(hù)可以隨時(shí)在自己的詞典里增加或刪減單詞的功能,以及系統(tǒng)可以隨時(shí)在自己的詞典里增加或刪減單詞的功能,以及系統(tǒng)根據(jù)一定的特征信息自動(dòng)進(jìn)行不同用戶(hù)間的根據(jù)一定的特征信息自動(dòng)進(jìn)行不同用戶(hù)間的ApplicationApplication識(shí)識(shí)別程序的切換的功能。別程序的切換的功能。 9.2.3 9.2.3
21、 語(yǔ)音識(shí)別系統(tǒng)的基本數(shù)據(jù)庫(kù)語(yǔ)音識(shí)別系統(tǒng)的基本數(shù)據(jù)庫(kù) 語(yǔ)音識(shí)別系統(tǒng)中包括大量的控制參數(shù)信息,這些參數(shù)以語(yǔ)音識(shí)別系統(tǒng)中包括大量的控制參數(shù)信息,這些參數(shù)以數(shù)據(jù)庫(kù)的方式存儲(chǔ)在計(jì)算機(jī)內(nèi)數(shù)據(jù)庫(kù)的方式存儲(chǔ)在計(jì)算機(jī)內(nèi), ,構(gòu)成了語(yǔ)音識(shí)別系統(tǒng)的基本構(gòu)成了語(yǔ)音識(shí)別系統(tǒng)的基本數(shù)據(jù)庫(kù)。它們是通過(guò)數(shù)據(jù)庫(kù)。它們是通過(guò)“訓(xùn)練訓(xùn)練”(或叫(或叫“學(xué)習(xí)學(xué)習(xí)”)的方法,從)的方法,從單講話(huà)者或多講話(huà)者的多次重復(fù)發(fā)音的語(yǔ)音參數(shù)以及大量的單講話(huà)者或多講話(huà)者的多次重復(fù)發(fā)音的語(yǔ)音參數(shù)以及大量的語(yǔ)法規(guī)則中,經(jīng)過(guò)長(zhǎng)時(shí)間的訓(xùn)練而聚類(lèi)得到的。語(yǔ)法規(guī)則中,經(jīng)過(guò)長(zhǎng)時(shí)間的訓(xùn)練而聚類(lèi)得到的。 需要指出的是,一個(gè)成功的語(yǔ)音識(shí)別系統(tǒng)的建立,一定需要指出的是,一個(gè)成功的語(yǔ)音識(shí)別系統(tǒng)的建立,一定要結(jié)合其具體的應(yīng)用背景,選擇不同的識(shí)別策略、以及硬件要結(jié)合其具體的應(yīng)用背景,選擇不同的識(shí)別策略、以及硬件平臺(tái)和軟件平臺(tái)。另外,更應(yīng)注意的是,語(yǔ)音識(shí)別系統(tǒng)的建平臺(tái)和軟件平臺(tái)。另外,更應(yīng)注意的是,語(yǔ)音識(shí)別系統(tǒng)的建立應(yīng)當(dāng)結(jié)合語(yǔ)言的自然特點(diǎn),否則,將很難達(dá)到較高的水平。立應(yīng)當(dāng)結(jié)合語(yǔ)言的自然特點(diǎn),否則,將很難達(dá)到較高的水平。v單詞詞典和文法單詞詞典和文法:一般來(lái)說(shuō),在多任務(wù)環(huán)境中,對(duì)于一個(gè):一般來(lái)說(shuō),在多任務(wù)環(huán)境中,對(duì)于一個(gè)ApplicationApplication,要定義相應(yīng)的單詞集合,根據(jù)識(shí)別結(jié)果或,要定義相應(yīng)的單詞集合,根據(jù)識(shí)別
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 加油站現(xiàn)場(chǎng)安全管理考核試卷
- 工業(yè)控制計(jì)算機(jī)在智能建筑管理系統(tǒng)中的作用考核試卷
- D城市模型構(gòu)建與應(yīng)用考核試卷
- 機(jī)床功能部件在深海探測(cè)設(shè)備中的抗壓性能考核試卷
- 數(shù)字出版物的市場(chǎng)趨勢(shì)與用戶(hù)需求分析考核試卷
- 招標(biāo)投標(biāo)居間合同范本
- 業(yè)務(wù)提成附加合同范本
- 養(yǎng)殖合同魚(yú)塘養(yǎng)殖合同范本
- 加工鐵筐合同范本
- 細(xì)菌群體感應(yīng)系統(tǒng)及其應(yīng)用課件
- 司法鑒定程序通則(試行)
- 內(nèi)襯修復(fù)用HTPO管材企標(biāo)
- 部編教材一年級(jí)下冊(cè)生字筆順筆畫(huà)
- 通達(dá)信指標(biāo)——江恩輪
- 二維火收銀使用手冊(cè)
- 神經(jīng)電生理檢查ppt課件
- 管路滑脫風(fēng)險(xiǎn)評(píng)估表
- 塑鋼板樁專(zhuān)項(xiàng)施工方案
- EN12680.3中文
- 歐科模塊化風(fēng)冷冷水熱泵機(jī)組報(bào)警代碼和維修步驟
評(píng)論
0/150
提交評(píng)論