下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 摘 要 本文提出了一種基于MFCC(Mel Frequency Cepstral Coefficients)和LSP(Line Spectrum Pair)的混合語(yǔ)音特征參數(shù),有效地彌補(bǔ)了單純使用MFCC的不足,實(shí)驗(yàn)中利用加權(quán)的歐幾里德距離計(jì)算特征矢量的失真距離,結(jié)果表明新的特征矢量能夠很好的表征語(yǔ)音信號(hào)的特征信息,能有效降低系統(tǒng)的誤識(shí)率。 關(guān)鍵字 特征提取; MFCC; LSP; 歐幾里德距離 1 引言
2、 隨著教學(xué)制度的深入改革,在英語(yǔ)教學(xué)中,人們?cè)絹?lái)越注重“聽”“說(shuō)”這一類的實(shí)際交流能力,口語(yǔ)測(cè)試環(huán)節(jié)已經(jīng)得到越來(lái)越多教育專家的關(guān)注,我們清醒地認(rèn)識(shí)到,說(shuō)的能力實(shí)際上也包括了對(duì)于聽和讀的能力訓(xùn)練。在現(xiàn)代計(jì)算機(jī)多媒體技術(shù)與網(wǎng)絡(luò)技術(shù)飛速發(fā)展的前提下,很多英語(yǔ)教學(xué)系統(tǒng)的設(shè)置已經(jīng)越來(lái)越科學(xué)化人性化,利用計(jì)算機(jī)輔助設(shè)計(jì),評(píng)估英語(yǔ)發(fā)音者口語(yǔ)發(fā)聲質(zhì)量已經(jīng)成為教學(xué)中的重要一環(huán)。除了應(yīng)用于教育背景之下,目前也有一些跨國(guó)公司,在招聘員工面試時(shí)采用了一種名為PhonePass SET的機(jī)制,就是通過一部電話機(jī),在短短幾分鐘內(nèi),由機(jī)器對(duì)面試者的外語(yǔ)口語(yǔ)進(jìn)行一次綜合測(cè)評(píng)。由此可見,口語(yǔ)測(cè)評(píng)已成為實(shí)
3、用外語(yǔ)中一項(xiàng)不可缺少的工作。 口語(yǔ)測(cè)試的評(píng)分一般分為兩種:一種是自動(dòng)評(píng)分,一種為專家評(píng)分。目前我們進(jìn)行的大量研究工作都是針對(duì)前一種的,希望盡可能脫離人的主觀因素對(duì)口語(yǔ)測(cè)試者的發(fā)音客觀評(píng)分,評(píng)分的客觀性表現(xiàn)在給出的分?jǐn)?shù)只由被測(cè)者個(gè)人的表現(xiàn)決定,不會(huì)受到評(píng)分專家對(duì)于測(cè)試者的個(gè)人印象,特定環(huán)境下單個(gè)被測(cè)群體的平均水平限制,以及發(fā)音的個(gè)體性差異等因素影響。這就對(duì)我們的計(jì)算機(jī)輔助設(shè)計(jì)提出了很高的要求。我們主要用到的技術(shù)是語(yǔ)音識(shí)別和統(tǒng)計(jì)模型的相關(guān)理論,通過提取被測(cè)者語(yǔ)音信號(hào)的特征參數(shù),計(jì)算機(jī)對(duì)其經(jīng)過一系列數(shù)字信號(hào)處理,從而在統(tǒng)計(jì)模型中對(duì)它進(jìn)行分析測(cè)評(píng)。因此,提取特征參數(shù)
4、的類型就顯得尤為重要了,目前應(yīng)用最為廣泛的特征系數(shù)是Mel頻率倒譜參數(shù)(MFCC)。已經(jīng)有大量實(shí)驗(yàn)表明,較之其它類型參數(shù),它能夠更好的反映人耳聽覺肌理的特征1。本文中以非線性的特征參數(shù)MFCC為主,結(jié)合了語(yǔ)音信號(hào)的另一個(gè)重要參數(shù)線譜對(duì)參數(shù)LSP,提出了一種語(yǔ)音特征參數(shù)的混合使用方法(M/L),使發(fā)音質(zhì)量判決系統(tǒng)的正確率有所改進(jìn)。2 特征提取 特征參量的選擇和提取對(duì)于實(shí)現(xiàn)語(yǔ)音識(shí)別系統(tǒng)有關(guān)鍵的意義,理想的特征參數(shù)必須用較少的特征維數(shù)包含盡可能多的語(yǔ)音特征信息。 2.1 MFCC特征參數(shù) MFCC系數(shù)是基
5、于人耳的聽覺特性,所謂Mel 頻率尺度,它的值大體上對(duì)應(yīng)于實(shí)際頻率的對(duì)數(shù)關(guān)系。其與實(shí)際頻率的具體關(guān)系如下: (2-1) 其中實(shí)際頻率f 的單位為Hz 。根據(jù)Zwicker 的工作,臨界頻帶寬隨著頻率的變換而變化,并與Mel 頻率的增長(zhǎng)一致。在1000 Hz 以下,大致呈線性分步,帶寬為100 Hz 左右;在1000 Hz 以上呈對(duì)數(shù)增長(zhǎng)。類似于臨界帶的劃分,可以將語(yǔ)音頻率劃分為一系列三角形的濾波器序列,即美爾濾波器組。在Mel 濾波器的選擇中
6、,濾波器組的選擇一般都選擇三角形濾波器,可以根據(jù)不同的應(yīng)用選擇其他的形狀如矩形、正弦形的濾波器組。濾波器的個(gè)數(shù)一般取24。當(dāng)信號(hào)通過濾波器組時(shí),取每個(gè)三角形濾波器頻率帶寬內(nèi)所有信號(hào)幅度加權(quán)和作為每個(gè)帶通濾波器的輸出,然后對(duì)所有濾波器輸出做對(duì)數(shù)運(yùn)算,最后進(jìn)一步通過離散余弦變換降低特征矢量的維數(shù),得到的參數(shù)就是美爾頻率倒譜參數(shù)(MFCC)2。 (2-2) 由于MFCC 更好的反映了人耳的聽覺系統(tǒng)的非線性特性,在參數(shù)的抗噪聲性能和提高系統(tǒng)的識(shí)別率方面具有優(yōu)勢(shì),在實(shí)際應(yīng)用中
7、還可以將MFCC 和其差分參數(shù)結(jié)合起來(lái)作為一組特征矢量進(jìn)行訓(xùn)練,進(jìn)一步提高系統(tǒng)的抗噪聲性能。2.2 線譜對(duì)參數(shù)LSP 語(yǔ)音信號(hào)的譜特性,除了音調(diào)周期外,全部包含在線性預(yù)測(cè)系數(shù)LPC(Linear Predictor Analysis)里面了3。LSP即是線性預(yù)測(cè)系數(shù)的一種推演參數(shù),定義為如下多項(xiàng)式的根: (2-3)
8、0;(2-4)各個(gè)根的頻率在單位圓上相互交錯(cuò)排列,分布為:0<1<1<<p/z<p/z<, i和i分別為P(z)和Q(z)的第i個(gè)零點(diǎn),它們總是成對(duì)的出現(xiàn),且反映信號(hào)的頻譜特性,因此稱為線譜對(duì)??傊?,線譜對(duì)分析是用p個(gè)離散頻率i和i的分布密度來(lái)表示語(yǔ)音信號(hào)頻譜特性的一種方法。LSP參數(shù)能夠反映聲道幅度譜的特點(diǎn),在幅度大的地方分布較密,反之較疏,這樣就相當(dāng)于反映出了幅度譜中的共振峰特征,在一定程度上可以起到特征補(bǔ)償作用。 近年來(lái)聲碼器研究實(shí)踐表明,LSP是一種具有良好的量化特性和插值特性的參數(shù),因此,在中低速語(yǔ)音編碼和語(yǔ)音識(shí)別等領(lǐng)域中已經(jīng)得到廣泛的應(yīng)用。 2.
9、3 M/L特征參數(shù) 前面已經(jīng)有學(xué)者為了進(jìn)一步提高識(shí)別率,提出過MFCC/FORMANTS(共振峰)參數(shù)也有很好的識(shí)別性能5,但是求解共振峰的算法相對(duì)復(fù)雜。而且在求解共振峰的過程中,我們經(jīng)常會(huì)采用的一種方法,就是利用LPC模型分析,提取LPC譜包絡(luò)線的重要信息來(lái)獲得。所以,我們很容易就想到用一種同樣能夠表征共振峰特性,而計(jì)算相對(duì)簡(jiǎn)單的LPC推演參數(shù)LSP來(lái)取代共振峰參數(shù)。并且,也有文獻(xiàn)指出,LSP參數(shù)已經(jīng)可以輔助MFCC參數(shù),應(yīng)用于對(duì)說(shuō)話認(rèn)識(shí)別的判決性條件1?;谝陨系睦碚摚谔崛×薓FCC一階差分系數(shù)和線譜對(duì)系數(shù)的基礎(chǔ)上,用MFCC來(lái)表征語(yǔ)音信號(hào)
10、的非線性特征,而用線譜對(duì)系數(shù)來(lái)輔助表征語(yǔ)音的線性特征,計(jì)算二者歸一化后的數(shù)值,并將它作為最終衡量語(yǔ)音信號(hào)失真的標(biāo)準(zhǔn),是本文的重要思想。3 實(shí)驗(yàn)分析及其結(jié)果3.1 檢驗(yàn)方法 在本文中,我們主要采取了加權(quán)的歐幾里德距離來(lái)度量?jī)山M特征矢量間的距離5。X=(x1,x2,xk)為參考模型的特征矢量,K代表參數(shù)的維數(shù),Y=(y1,y2,yk)表示維數(shù)為K的被測(cè)模型特征矢量。標(biāo)準(zhǔn)的加權(quán)歐幾里德距離可用下式表示: (3-1
11、)Wk為加權(quán)系數(shù), 。3.2 語(yǔ)音訓(xùn)練數(shù)據(jù)庫(kù) 本實(shí)驗(yàn)基于一個(gè)自行開發(fā)的口語(yǔ)測(cè)試平臺(tái),將語(yǔ)音識(shí)別的相關(guān)理論運(yùn)用其中。我們利用了東方背單詞4和金山詞霸2005的單詞發(fā)音,分別建立了訓(xùn)練庫(kù)中的兩個(gè)標(biāo)準(zhǔn)模板,實(shí)驗(yàn)中的語(yǔ)音數(shù)據(jù)使用的采樣頻率為8000Hz,精度16位,單聲道,這三個(gè)參數(shù)在整個(gè)系統(tǒng)的實(shí)現(xiàn)過程中是一直不變的。 3.3 實(shí)驗(yàn)分析 口語(yǔ)測(cè)試開發(fā)平臺(tái)的功能和原理簡(jiǎn)述如下:口語(yǔ)測(cè)試者在語(yǔ)音訓(xùn)練庫(kù)中,可任意選取語(yǔ)音樣本,根據(jù)聽到樣本的標(biāo)準(zhǔn)發(fā)音進(jìn)行跟讀。系統(tǒng)在運(yùn)行過程中,分別提取二者的特征信息,進(jìn)行比對(duì),通過計(jì)算標(biāo)準(zhǔn)模板和訓(xùn)練模板特征參數(shù)之間的歐幾里德距離,判決發(fā)音質(zhì)量。要求檢測(cè)系統(tǒng)能夠客觀、真實(shí)地對(duì)口語(yǔ)訓(xùn)練者的發(fā)音質(zhì)量做出評(píng)價(jià),盡量降低誤判率。 依據(jù)以上的原
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度杭州新能源車輛銷售合同3篇
- 2025年度物流配送行業(yè)勞動(dòng)保障監(jiān)察與配送服務(wù)質(zhì)量合同3篇
- 電子商務(wù)平臺(tái)大數(shù)據(jù)驅(qū)動(dòng)的營(yíng)銷策略
- 2024年銷售促銷合作協(xié)議3篇
- 智慧城市項(xiàng)目建設(shè)與運(yùn)營(yíng)合作框架
- 物流運(yùn)輸方式的課程設(shè)計(jì)
- 素描線條繪畫課程設(shè)計(jì)
- 2024橋梁梁板運(yùn)輸安裝工程綠色施工與環(huán)保驗(yàn)收合同3篇
- 藝術(shù)品創(chuàng)作培訓(xùn)課程設(shè)計(jì)
- 形近字課程設(shè)計(jì)
- 顫病(帕金森?。┲嗅t(yī)護(hù)理常規(guī)
- 豬場(chǎng)名詞及指標(biāo)講義
- 果膠項(xiàng)目商業(yè)計(jì)劃書(模板范本)
- 旋挖鉆成孔掏渣筒沉渣處理施工工藝
- T∕CHTS 10040-2021 公路無(wú)機(jī)結(jié)合料穩(wěn)定粒料基層振動(dòng)法施工技術(shù)指南
- 集團(tuán)后備人才培養(yǎng)方案
- 腦卒中偏癱患者早期康復(fù)護(hù)理現(xiàn)狀(一)
- 國(guó)家開放大學(xué)電大本科《機(jī)電控制工程基礎(chǔ)》2023-2024期末試題及答案(試卷代號(hào):1116)
- 個(gè)體診所藥品清單
- 急救技術(shù)-洗胃術(shù) (2)
- 混凝土配合比檢測(cè)報(bào)告
評(píng)論
0/150
提交評(píng)論