基于語音識別系統(tǒng)性能影響的噪音場景分析_第1頁
基于語音識別系統(tǒng)性能影響的噪音場景分析_第2頁
基于語音識別系統(tǒng)性能影響的噪音場景分析_第3頁
基于語音識別系統(tǒng)性能影響的噪音場景分析_第4頁
基于語音識別系統(tǒng)性能影響的噪音場景分析_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、基于語音識別系統(tǒng)性能影響的噪音場景分析摘要:噪音場景分析對提高語音識別系統(tǒng)在復(fù)雜環(huán)境下的魯棒性具有重要的意義。本文介紹了一種基于語音識別系統(tǒng)性能影響的噪音場景聚類分析方法,是采用數(shù)理統(tǒng)計(jì)學(xué)方法分析噪音場景對于語音識別系統(tǒng)性能的影響效應(yīng),依據(jù)效應(yīng)分析來實(shí)現(xiàn)對噪音場景的聚類。基于方差分析法的統(tǒng)計(jì)模型能夠?qū)⒃胍魣鼍皩π阅艿挠绊懶?yīng)分解為訓(xùn)練、測試的單獨(dú)效應(yīng)以及二者的交互效應(yīng)這三個(gè)部分并準(zhǔn)確地估計(jì)這三種效應(yīng),進(jìn)而實(shí)現(xiàn)對噪音場景的聚類。最后通過識別實(shí)驗(yàn)對聚類合理性進(jìn)行驗(yàn)證。關(guān)鍵字:語音識別;方差分析;析因設(shè)計(jì);噪音聚類。analysis of background noise based on perf

2、ormance influence for speech recognition systemabstract: noise scenes analysis technique plays a very important role for improving the adaptation of speech recognition system in noise background. a new clustering analysis method based on performance influence for speech recognition system has been i

3、ntroduced. by means of statistical analysis methods, it analysis the influence of scene noises on system performance and get the similarity for clustering. a statistical model based on anova was proposed to decompose the effect on system performance into three parts: effect of training data, test da

4、ta and their interaction, and each path is considered dependent on scene noises. finally verify reasonableness of clustering by means of speech recognition experiments.keywords: speech recognition; anova; factorial design; noise clustering.1 引言目前關(guān)于提高語音識別系統(tǒng)在真實(shí)環(huán)境下的魯棒性問題已經(jīng)成為了語音識別技術(shù)的研究熱點(diǎn)123。目前的語音識別系統(tǒng)只能在

5、一定的限制條件下獲得滿意的性能,或者說只能應(yīng)用于某些特定的場合。影響語音識別系統(tǒng)在復(fù)雜環(huán)境下性能的主要*基金項(xiàng)目:國家“863”計(jì)劃基金資助項(xiàng)目(2004aa114010)原因有兩個(gè):一是背景噪音影響了語音信號的質(zhì)量;二是訓(xùn)練數(shù)據(jù)與識別環(huán)境不匹配。針對影響系統(tǒng)性能的這兩個(gè)主要原因,研究者們采取的主要措施一個(gè)是研究抗噪算法,另一個(gè)就是進(jìn)行加噪訓(xùn)練。研究抗噪算法是為了消除背景噪音對話音的影響,提高語音信號的質(zhì)量。加噪訓(xùn)練是為了使訓(xùn)練數(shù)據(jù)和識別環(huán)境更加匹配。由于真實(shí)環(huán)境里噪音的種類繁多,對每一種噪音都去研究抗噪算法或者用每一種噪音來進(jìn)行加噪訓(xùn)練都是不合適的。因此我們有必要把各種噪音場景聚成有限的幾類

6、,用這幾個(gè)大類中的典型噪音去代表所有的噪音,從而可以更有針對性地研究抗噪算法,同時(shí)也可以更方便地進(jìn)行加噪訓(xùn)練。所以對噪音場景的分析對于語音識別來說是非常有意義的。通常的音頻場景分析大都是采用基于聲學(xué)特征的分析,需要先對音頻進(jìn)行聲學(xué)特征的提取,將從不同場景中提取的音頻信號特征作為研究對象,通過不同的方法進(jìn)行音頻場景分析。提取的特征通常有短時(shí)過零率和能量特征,頻域和倒譜域的特征45,以及線性譜頻率lsf6等等一些其他特征。目前用的最廣泛的特征是梅爾倒譜系數(shù)mfcc。本文提出了一種新穎的噪音場景聚類分析方法。區(qū)別于其他傳統(tǒng)的聚類方法78,它沒有聲學(xué)特征的提取,而是采用是數(shù)理統(tǒng)計(jì)學(xué)方法分析噪音場景對于

7、語音識別系統(tǒng)性能的影響效應(yīng),依據(jù)效應(yīng)分析來實(shí)現(xiàn)對噪音場景的聚類。該方法對比于其他基于聲學(xué)特征的聚類方法,是完全從系統(tǒng)性能角度出發(fā),要將復(fù)雜繁多的噪音場景歸納為幾個(gè)典型大類,使得類內(nèi)場景對系統(tǒng)性能影響不顯著,類間場景對系統(tǒng)性能影響顯著。而基于聲學(xué)特征的聚類有可能不能完全反映噪音場景對系統(tǒng)性能的影響,因?yàn)榭赡艽嬖诼晫W(xué)特征類似的噪音對系統(tǒng)性能影響顯著,而聲學(xué)特征不同的噪音卻對系統(tǒng)性能影響不顯著。具體步驟為:1.首先進(jìn)行語音識別實(shí)驗(yàn),利用htk工具搭建的大詞匯連續(xù)語音識別系統(tǒng)lvcsr和國家863基礎(chǔ)語音庫完成加噪訓(xùn)練并測試,得到分析數(shù)據(jù);2.然后利用統(tǒng)計(jì)學(xué)方法和試驗(yàn)優(yōu)化方法分析實(shí)驗(yàn)結(jié)果,研究各種噪音

8、場景對語音識別系統(tǒng)性能的影響效應(yīng);3.最后根據(jù)效應(yīng)分析結(jié)果對噪音場景數(shù)據(jù)進(jìn)行聚類分析。該方法的總體流程圖如圖1所示。另外需要說明的是,本文用的語音識別系統(tǒng)是由劍橋大學(xué)開發(fā)的htk工具搭建的。 htk是基于hmm的語音識別工具,是目前比較通用和公認(rèn)的一個(gè)工具,大多數(shù)的語音識別系統(tǒng)都是在它基礎(chǔ)上搭建的。所以利用由它搭建而來的這個(gè)基線系統(tǒng)進(jìn)行我們的研究是比較有代表性和通用性的。聚類有效性驗(yàn)證效應(yīng)分析噪音聚類n法水平分組系統(tǒng)聚類效應(yīng)的顯著性驗(yàn)證n法水平分組效應(yīng)估計(jì)系統(tǒng)聚類噪音聚類圖1 方法總體流程圖2 數(shù)理統(tǒng)計(jì)學(xué)方法介紹2.1析因設(shè)計(jì)首先介紹幾個(gè)基本概念,將影響語音識別系統(tǒng)性能的語音數(shù)據(jù)屬性稱為因素。

9、如噪音場景、信噪比(snr)、說話人性別、說話人口音、語速等。因素的取值或分類稱為因素的水平,如“說話人性別”有兩個(gè)水平:“男”和“女”。析因設(shè)計(jì)也叫做全因子實(shí)驗(yàn)設(shè)計(jì),是根據(jù)因素的全組合安排試驗(yàn)的試驗(yàn)優(yōu)化設(shè)計(jì)方法。析因設(shè)計(jì)就是實(shí)驗(yàn)中所涉及到的全部實(shí)驗(yàn)因素的各個(gè)水平的全面組合形成不同的實(shí)驗(yàn)條件,在每個(gè)實(shí)驗(yàn)條件下進(jìn)行兩次或兩次以上的獨(dú)立重復(fù)實(shí)驗(yàn)。析因設(shè)計(jì)的最大優(yōu)點(diǎn)是所獲得的信息量很多,可以準(zhǔn)確地估計(jì)各實(shí)驗(yàn)因素的主效應(yīng)的大小,還可估計(jì)因素之間各級交互作用效應(yīng)的大小。本文采用析因設(shè)計(jì)方法來安排語音識別實(shí)驗(yàn)。2.2方差分析方差分析(analysis of variance,簡稱anova)又稱變異數(shù)分析

10、或f檢驗(yàn),其目的是推斷兩組或多組資料的總體均數(shù)是否相同,檢驗(yàn)兩個(gè)或多個(gè)樣本均數(shù)的差異是否有統(tǒng)計(jì)學(xué)意義,是進(jìn)行假設(shè)檢驗(yàn)的一種很有效的方法。方差分析在一個(gè)或多個(gè)因素的不同水平或水平組合下測量一個(gè)定量反應(yīng)變量,將對這個(gè)反應(yīng)變量的總效應(yīng)分解為由各因素引起的效應(yīng)或因素的組合產(chǎn)生的交互效應(yīng)以及隨機(jī)誤差效應(yīng);同時(shí)將總自由度分解為對應(yīng)各部分自由度之和。例如在單因素方差分析中,統(tǒng)計(jì)量為f值,在一定的顯著水平下如果f值大于f界值,說明該因素有統(tǒng)計(jì)學(xué)意義,即由它引起的效應(yīng)是顯著的,這就是方差分析的基本思想。方差分析的基本應(yīng)用條件是各樣本是相互獨(dú)立的,各樣本數(shù)據(jù)必須滿足正態(tài)性和方差齊性。雙因素方差分析的模型可以由如下

11、公式描述: (1)表示第一個(gè)因素的第個(gè)水平,表示第二個(gè)因素的第個(gè)水平,表示第k次實(shí)驗(yàn)當(dāng)?shù)谝粋€(gè)因素取水平,第二個(gè)因素取水平時(shí)的性能指標(biāo)值。表示第一個(gè)因素取水平時(shí)對性能指標(biāo)的效應(yīng)。表示第二個(gè)因素取水平對性能指標(biāo)的效應(yīng)。表示兩個(gè)因素間交互作用的效應(yīng)。表示第k次實(shí)驗(yàn)的隨機(jī)實(shí)驗(yàn)誤差。噪音場景對于系統(tǒng)性能的影響主要表現(xiàn)在訓(xùn)練數(shù)據(jù)、測試數(shù)據(jù)和兩者交互作用(一致性)三個(gè)部分的效應(yīng)。本文中將訓(xùn)練當(dāng)成第一個(gè)因素,測試當(dāng)成第二個(gè)因素,應(yīng)用方差分析模型進(jìn)行如下假設(shè)檢驗(yàn)考察三者的效應(yīng)。對場景因素,檢驗(yàn):對信噪比因素,檢驗(yàn):對交互作用,檢驗(yàn):方差分析采用分離偏差平方和以及自由度的方法,采用f分布檢驗(yàn)以上幾個(gè)原假設(shè)是否成立

12、。本文主要運(yùn)用方差分析法對噪音場景進(jìn)行效應(yīng)分析。3 效應(yīng)分析基于識別系統(tǒng)性能影響的噪音場景聚類分析方法,其原理是依據(jù)噪音場景對系統(tǒng)性能的影響效應(yīng)來對噪音場景進(jìn)行聚類分析。在語音識別訓(xùn)練和測試數(shù)據(jù)上的分別加上不同的背景噪音形成不同的訓(xùn)練集和測試集,然后進(jìn)行語音識別實(shí)驗(yàn),得到的系統(tǒng)性能會有差異。這種差異主要是由于訓(xùn)練和測試數(shù)據(jù)不同造成的,本質(zhì)上是由于所加的背景噪音不同造成的。我們運(yùn)用統(tǒng)計(jì)學(xué)方法分析噪音場景對系統(tǒng)性能的影響效應(yīng)。 首先要驗(yàn)證效應(yīng)的顯著性,即驗(yàn)證由于噪音場景不同造成的系統(tǒng)性能的差異是顯著的,訓(xùn)練和測試都存在影響系統(tǒng)性能的效應(yīng)并且這兩種效應(yīng)都是顯著的。并且通過分析我們會發(fā)現(xiàn):噪音場景因素

13、對性能的影響作用不僅表現(xiàn)在訓(xùn)練和測試的效應(yīng)上,還表現(xiàn)在訓(xùn)練和測試的一致性對性能的影響,即訓(xùn)練和測試還存在交互作用,交互效應(yīng)同樣也是顯著的。其次作效應(yīng)估計(jì)判別出效應(yīng)的強(qiáng)弱。為了分析不同噪音間的訓(xùn)練、測試的效應(yīng)以及訓(xùn)練與測試的交互效應(yīng),我們需要進(jìn)行語音識別實(shí)驗(yàn),通過給原始無噪數(shù)據(jù)加上各種不同的噪音形成不同的訓(xùn)練集和測試集,產(chǎn)生實(shí)驗(yàn)結(jié)果來研究由于噪音數(shù)據(jù)的不同導(dǎo)致的訓(xùn)練和測試的不同對于系統(tǒng)性能的影響效應(yīng)。語音識別工具是利用劍橋大學(xué)開發(fā)的htk開源工具搭建的大詞匯連續(xù)語音識別系統(tǒng)lvcsr;聲學(xué)模型采用三音子的隱馬爾可夫模型,聲學(xué)特征采用mfcc特征。語言模型采用二元語法。由于我們要考察的是噪音場景對

14、于系統(tǒng)性能的影響,所以系統(tǒng)沒有采取如語音增強(qiáng)等噪音魯棒技術(shù),可以排除其他可能會對性能造成影響的因素。原始無噪音訓(xùn)練數(shù)據(jù)是863基礎(chǔ)語音庫,原始無噪音測試數(shù)據(jù)是來自于北方音庫,都是標(biāo)準(zhǔn)普通話發(fā)音。具體信息如表1所示。語音數(shù)據(jù)按16khz采樣頻率數(shù)字化,各個(gè)采樣點(diǎn)用16位進(jìn)行量化,都是pcm wav編碼格式。表1. 原始無噪音訓(xùn)練和測試數(shù)據(jù)集說話人個(gè)數(shù)總時(shí)長單句個(gè)數(shù)男女訓(xùn)練集100100100小時(shí)71639測試集10101小時(shí)1200噪音數(shù)據(jù):文章采集的噪音場景數(shù)據(jù)包括室內(nèi)、室外及交通工具各種場景,都是現(xiàn)場錄音。錄入設(shè)備采用ibm筆記本電腦外加sound blaster audigy 2 zs專業(yè)

15、聲卡,錄入軟件采用cool edit pro 2.0,按16khz采樣頻率數(shù)字化,各個(gè)采樣點(diǎn)用16位進(jìn)行量化,存儲到計(jì)算機(jī)中。3.1 四種典型噪音場景的效應(yīng)分析首先驗(yàn)證效應(yīng)的顯著性。運(yùn)用析因設(shè)計(jì)方法安排語音識別實(shí)驗(yàn),選擇四種人耳感覺有明顯差異的噪音場景數(shù)據(jù)作為訓(xùn)練和測試的四個(gè)水平(factory、restaurant、taxi、white)。把四個(gè)噪音數(shù)據(jù)按相同的信噪比(10db)線性疊加到原始無噪訓(xùn)練集和測試集,得到四個(gè)訓(xùn)練集和四個(gè)測試集。采用lvcsr系統(tǒng),分別用四個(gè)訓(xùn)練集訓(xùn)練,得到四個(gè)識別系統(tǒng),再用四個(gè)測試集對這四個(gè)識別系統(tǒng)分別進(jìn)行測試,得到16組識別結(jié)果。每個(gè)測試集按不同說話人分成20

16、個(gè)子集,作為20次重復(fù)試驗(yàn)統(tǒng)計(jì)字錯(cuò)誤率。然后采用直觀分析法以及假設(shè)檢驗(yàn)法對識別結(jié)果進(jìn)行分析。圖2列出的是4種訓(xùn)練與測試集兩兩交叉實(shí)驗(yàn)統(tǒng)計(jì)出的總字錯(cuò)誤率。圖2. 四種典型噪音場景的語音識別實(shí)驗(yàn)測試結(jié)果直觀分析法:作圖,對測試的每一個(gè)水平分別作訓(xùn)練因素和指標(biāo)的關(guān)系圖,如圖3所示。從圖中可看出,四條折線不平行有交叉,說明訓(xùn)練和測試有交互作用;并且每一條同色折線都與其他三條不同色折線有交點(diǎn),說明訓(xùn)練和測試對于任意兩種噪音之間都存在交互作用;并且每條折線的最低處總是在訓(xùn)練與測試水平一致的時(shí)候,說明這種交互作用表現(xiàn)在當(dāng)訓(xùn)練和測試數(shù)據(jù)一致的時(shí)候,性能要好。圖3四場景的訓(xùn)練和測試兩因素的關(guān)系圖假設(shè)檢驗(yàn)法:利用

17、sas統(tǒng)計(jì)軟件9對16組測試結(jié)果(每組統(tǒng)計(jì)20個(gè)字錯(cuò)誤率)進(jìn)行假設(shè)檢驗(yàn),結(jié)果如圖4所示,三個(gè)因素的pr值都小于顯著性水平0.05,在統(tǒng)計(jì)學(xué)上通常認(rèn)為當(dāng)pr=20)個(gè)不同的噪音數(shù)據(jù)文件分別對原始無噪訓(xùn)練數(shù)據(jù)和原始無噪測試數(shù)據(jù)作線性疊加。信噪比為10db,形成n個(gè)不同訓(xùn)練集和測試集。對訓(xùn)練和測試兩因素作析因設(shè)計(jì),不同的場景類型看作訓(xùn)練和測試的不同水平,訓(xùn)練和測試都有n個(gè)水平,因而要用lvcsr系統(tǒng)作nn的實(shí)驗(yàn),并分別根據(jù)不同說話人統(tǒng)計(jì)字錯(cuò)誤率。按表2方案選取實(shí)驗(yàn)得到的數(shù)據(jù),兩兩考察噪音場景之間的訓(xùn)練效應(yīng),取兩個(gè)不同的訓(xùn)練場景,作為因素一來考察,它有兩水平(訓(xùn)練場景a和訓(xùn)練場景b),另一個(gè)因素是測試

18、因素(它有n個(gè)水平,對應(yīng)n種不同測試場景)。雙因素方差分析法考察訓(xùn)練因素的顯著性作用。測試訓(xùn)練表2. 雙因素方差分析示例場景1場景2場景3場景n場景adataa1dataa2dataa3dataan場景bdatab1datab2datab3databndataij (i=a,b; j=1,2n)是用trai數(shù)據(jù)訓(xùn)練tesj數(shù)據(jù)測試的在20個(gè)不同說話人情況下的20個(gè)分錯(cuò)誤率,作為重復(fù)試驗(yàn)結(jié)果。運(yùn)用matlab或sas對數(shù)據(jù)進(jìn)行雙因素方差分析,可以得出訓(xùn)練場景兩兩之間的對系統(tǒng)性能的影響效應(yīng)有些是顯著性的,有些是不顯著的。比如工廠和出租車內(nèi)兩種噪音場景對系統(tǒng)性能的影響是顯著的,如表3所示,訓(xùn)練因素(

19、rows)的pr值為0.0006 顯著性水平0.05。我們用估計(jì)出的各訓(xùn)練場景之間的非顯著性概率pr值作為不同場景兩兩之間的相似度。不同噪音場景兩兩之間的相似度越大,說明兩種噪音對系統(tǒng)性能的顯著性影響越小,從而兩個(gè)場景聚為同一類的可能性就越大。最后用系統(tǒng)聚類法可對不同場景進(jìn)行聚類。表3 matlab雙因素方差分析表(工廠和出租車)sourcefprobfcolumns7.6560rows11.9270.000587interaction10.39270表4 matlab雙因素方差分析表(超市和食堂)sourcefprobfcolumns10.82950rows0.0764880.7822int

20、eraction0.0977414 基于訓(xùn)練效應(yīng)的聚類基于訓(xùn)練效應(yīng)的噪音場景聚類就是對依據(jù)噪音場景的訓(xùn)練效應(yīng)對噪音場景進(jìn)行聚類。我們用了單因素方差分析和雙因素方差分析兩種方式進(jìn)行訓(xùn)練效應(yīng)分析,進(jìn)而分別運(yùn)用n法和系統(tǒng)聚類法進(jìn)行聚類。4.1 聚類方法(1)n法(水平分組)適用于單因素方差分析,其思想是首先將各水平均值按大小次序排列,計(jì)算相鄰兩水平均值之差;其次根據(jù)公式2計(jì)算t檢驗(yàn)中的判別尺度,并與每個(gè)均值差進(jìn)行比較,凡比大的地方就劃分為不同的兩個(gè)組;最后判斷在組內(nèi)離組內(nèi)均值距離最遠(yuǎn)的那個(gè)水平均值是否該留在組內(nèi),如果留在組內(nèi),這組似乎不需要再分;如果最遠(yuǎn)的均值不能留在組內(nèi),將它從該組剔出,對剩下的均

21、值繼續(xù)進(jìn)行考察,直至沒有一個(gè)均值能剔出為止。判斷能否剔除的統(tǒng)計(jì)量為,如公式3所示。近于正態(tài)分布,用正態(tài)表的臨界值來進(jìn)行判斷,如果就將該組中與總均值離的最遠(yuǎn)的那個(gè)均值剔出這個(gè)組。 (2) (3)表示同一水平試驗(yàn)的重復(fù)數(shù);表示試驗(yàn)誤差的均方;表示試驗(yàn)誤差的自由度;是顯著性水平通常取0.05;是查t表上的值。表示該組的水平個(gè)數(shù);表示該組個(gè)均值與總平均之差最大者。(2)系統(tǒng)聚類依據(jù)雙因素方差分析對訓(xùn)練效應(yīng)的估計(jì)值(相似度),采用自底向上的系統(tǒng)聚類方法對數(shù)據(jù)進(jìn)行聚類,合并的過程為選擇相似度最大的兩類進(jìn)行合并,直到任意類之間的相似度小于我們給定的顯著性水平為止。這個(gè)顯著性水平通常取0.01,這樣做可以降低

22、犯第一類錯(cuò)誤的概率11。4.2 聚類結(jié)果表5. 聚類結(jié)果及各種不同場景訓(xùn)練下相同測試集識別下得到的識別正確率對照表n法聚類結(jié)果加噪訓(xùn)練的噪音場景系統(tǒng)聚類結(jié)果加噪訓(xùn)練的噪音場景識別正確率類別1白噪聲類別1白噪聲7.26%類別2飛機(jī)場飛機(jī)場12.69%類別3工廠類別2工廠21.93%不加噪訓(xùn)練不加噪訓(xùn)練22.70%辦公室辦公室23.27%類別4商場類別3商場28.82%羽毛球場羽毛球場29.40%人群人群29.93%教室教室29.95%超市超市30.64%食堂食堂31.03%庭院庭院31.07%餐廳餐廳31.73%類別5大街上類別4大街上33.34%汽車內(nèi)汽車內(nèi)34.05%出租車內(nèi)出租車內(nèi)34.7

23、9%十字路口籃球場35.28%籃球場十字路口35.92%公交車站公交車站36.32%公交車內(nèi)公交車內(nèi)36.94%5 聚類合理性驗(yàn)證從表6聚類結(jié)果與識別正確率的對照表中可以直觀看出類內(nèi)性能差別不大,而類間性能差別較大?,F(xiàn)通過識別實(shí)驗(yàn)對噪音場景聚類結(jié)果合理性進(jìn)行客觀驗(yàn)證。從各類中隨機(jī)抽選1種場景,每種場景按固定比例對原始訓(xùn)練數(shù)據(jù)進(jìn)行疊加,形成一個(gè)訓(xùn)練集。重復(fù)四次得到四個(gè)訓(xùn)練集,分別進(jìn)行語音識別訓(xùn)練,得到四個(gè)訓(xùn)練模型,再用同一個(gè)測試集(包含各種不同噪音場景)進(jìn)行測試。測試結(jié)果如表6所示。運(yùn)用方差分析法對測試結(jié)果進(jìn)行假設(shè)檢驗(yàn),分析結(jié)果如表7所示。得到四個(gè)模型之間的非顯著性概率pr=0.814420.0

24、5,即四個(gè)模型的系統(tǒng)性能是不顯著的。從而驗(yàn)證了類內(nèi)場景對于系統(tǒng)性能的影響是不顯著的。由于不同類間的任意兩個(gè)場景對于系統(tǒng)性能的影響都是顯著的(對應(yīng)pr值都小于0.05),從而也驗(yàn)證了類間場景對于系統(tǒng)性能的影響是顯著的。通過實(shí)驗(yàn),本文對于噪音場景的聚類分析方法的合理性和有效性得到了驗(yàn)證。表6 測試結(jié)果訓(xùn)練模型字錯(cuò)誤率1:factorytaxirestaurantwhite60.08%2:factorybuseaterycockpit61.35%3:officevehicleyardwhite62.29%4:officetaxisupermarketcockpit60.81%表7 matlab單因素

25、方差分析表sourcessdfmsfprobfcolumns0.005656630.00188550.315090.81442error0.45479760.0059841total0.46045796 總結(jié)本文是基于噪音場景對于語音識別系統(tǒng)性能的影響,實(shí)現(xiàn)對于噪音場景的聚類分析。本文對基于語音識別系統(tǒng)性能影響的噪音場景分析方法進(jìn)行了比較全面的介紹,包括如何運(yùn)用數(shù)理統(tǒng)計(jì)學(xué)方法對噪音場景進(jìn)行效應(yīng)分析以及依據(jù)效應(yīng)分析實(shí)現(xiàn)聚類。該方法對比于其他基于聲學(xué)特征的聚類方法,是完全從系統(tǒng)性能角度出發(fā),將復(fù)雜繁多的噪音場景歸納為幾個(gè)典型大類,使得類內(nèi)噪音場景對系統(tǒng)性能影響不顯著,類間噪音場景對系統(tǒng)性能影響顯著

26、。而基于聲學(xué)特征的聚類有可能不能完全反映噪音場景對系統(tǒng)性能的影響,并且基于聲學(xué)特征的聚類分析方法會根據(jù)選取不同的聲學(xué)特征而得到不同的聚類結(jié)果。基于本文的方法可以得到唯一的聚類結(jié)果。該方法同樣還可以用于分析其他影響系統(tǒng)性能的因素,如信噪比、口音等等。參考文獻(xiàn)1 劉加. 漢語大詞匯量連續(xù)語音識別系統(tǒng)的研究進(jìn)展j. 電子學(xué)報(bào), 2000,28(1):85-91.2 俞鐵城. 語音識別的發(fā)展現(xiàn)狀j. 通訊世界, 2006(2):56.3 楊大利, 徐明星, 吳文虎. 噪音環(huán)境下的語音識別研究j. 計(jì)算機(jī)工程與應(yīng)用, 2003,39(20):1-4.4 魏宇虹, 韓紀(jì)慶, 張磊. 一種基于hmm模型的音頻場景分析技術(shù)j. 計(jì)算機(jī)工程與應(yīng)用, 2003,39(20):85-86,191.5 韓紀(jì)慶, 徐希利. 一種基于矢量量化的音頻場景分析方法j. 電聲技術(shù), 2002(3):8-10.6 k. el-maleh, a. samouelian and p. kabal, frame level noise classification in mobile environmentsc. proceeding

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論