基于自相關(guān)法的語(yǔ)音基音周期估計(jì)_第1頁(yè)
基于自相關(guān)法的語(yǔ)音基音周期估計(jì)_第2頁(yè)
基于自相關(guān)法的語(yǔ)音基音周期估計(jì)_第3頁(yè)
基于自相關(guān)法的語(yǔ)音基音周期估計(jì)_第4頁(yè)
基于自相關(guān)法的語(yǔ)音基音周期估計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、綜合實(shí)驗(yàn)報(bào)告自相關(guān)法及其變種學(xué) 院 電子與信息學(xué)院 專 業(yè) 信息與信號(hào)處理 學(xué)生姓名 學(xué)生學(xué)號(hào) 提交日期 2013年7月10日 一、實(shí)驗(yàn)?zāi)繕?biāo)1.1 了解語(yǔ)音基音周期估計(jì)方法,掌握自相關(guān)法估計(jì)基音周期的原理,分析其變種。二、實(shí)驗(yàn)基礎(chǔ)知識(shí)2.1 基音與基音周期估計(jì)人在發(fā)音時(shí),根據(jù)聲帶是否震動(dòng)可以將語(yǔ)音信號(hào)分為清音跟濁音兩種。濁音又稱有聲語(yǔ)言,攜帶者語(yǔ)言中大部分的能量,濁音在時(shí)域上呈現(xiàn)出明顯的周期性;而清音類似于白噪聲,沒(méi)有明顯的周期性。發(fā)濁音時(shí),氣流通過(guò)聲門(mén)使聲帶產(chǎn)生張弛震蕩式振動(dòng),產(chǎn)生準(zhǔn)周期的激勵(lì)脈沖串。這種聲帶振動(dòng)的頻率稱為基音頻率,相應(yīng)的周期就成為基音周期?;糁芷诘墓烙?jì)稱謂基音檢測(cè),基音檢

2、測(cè)的最終目的是為了找出和聲帶振動(dòng)頻率完全一致或盡可能相吻合的軌跡曲線。基因周期作為語(yǔ)音信號(hào)處理中描述激勵(lì)源的重要參數(shù)之一,在語(yǔ)音合成、語(yǔ)音壓縮編碼、語(yǔ)音識(shí)別和說(shuō)話人確認(rèn)等領(lǐng)域都有著廣泛而重要的問(wèn)題,尤其對(duì)漢語(yǔ)更是如此。漢語(yǔ)是一種有調(diào)語(yǔ)言,而基因周期的變化稱為聲調(diào),聲調(diào)對(duì)于漢語(yǔ)語(yǔ)音的理解極為重要。因?yàn)樵跐h語(yǔ)的相互交談中,不但要憑借不同的元音、輔音來(lái)辨別這些字詞的意義,還需要從不同的聲調(diào)來(lái)區(qū)別它,也就是說(shuō)聲調(diào)具有辨義作用;另外,漢語(yǔ)中存在著多音字現(xiàn)象,同一個(gè)字的不同的語(yǔ)氣或不同的詞義下具有不同的聲調(diào)。因此準(zhǔn)確可靠地進(jìn)行基音檢測(cè)對(duì)漢語(yǔ)語(yǔ)音信號(hào)的處理顯得尤為重要。2.2 基音周期估計(jì)的現(xiàn)有方法到目前為

3、止,基音檢測(cè)的方法大致上可以分為三類:1)時(shí)域估計(jì)法,直接由語(yǔ)音波形來(lái)估計(jì)基音周期,常見(jiàn)的有:自相關(guān)法、并行處理法、平均幅度差法、數(shù)據(jù)減少法等;2)變換法,它是一種將語(yǔ)音信號(hào)變換到頻域或者時(shí)域來(lái)估計(jì)基音周期的方法,首先利用同態(tài)分析方法將聲道的影響消除,得到屬于激勵(lì)部分的信息,然后求取基音周期,最常用的就是倒譜法,這種方法的缺點(diǎn)就是算法比較復(fù)雜,但是基音估計(jì)的效果卻很好;3)混合法,先提取信號(hào)聲道模型參數(shù),然后利用它對(duì)信號(hào)進(jìn)行濾波,得到音源序列,最后再利用自相關(guān)法或者平均幅度差法求得基因音周期。三、實(shí)驗(yàn)原理3.1 自相關(guān)函數(shù)能量有限的語(yǔ)音信號(hào)x(n)的短時(shí)自相關(guān)函數(shù)定義為:此公式表示一個(gè)信號(hào)和延

4、遲m點(diǎn)后該信號(hào)本身的相似性。如果信號(hào)x(n)具有周期性,那么它的自相關(guān)函數(shù)也具有周期性,而且周期與信號(hào)x(n)的周期性相同。自相關(guān)函數(shù)提供了一種獲取周期信號(hào)周期的方法。在周期信號(hào)周期的整數(shù)倍上,它的自相關(guān)函數(shù)可以達(dá)到最大值,因此可以不考慮起始時(shí)間,而從自相關(guān)函數(shù)的第一個(gè)最大值的位置估計(jì)出信號(hào)的基音周期,這使自相關(guān)函數(shù)成為信號(hào)基音周期估計(jì)的一種工具。3.2 短時(shí)自相關(guān)函數(shù)法語(yǔ)音信號(hào)是非穩(wěn)態(tài)信號(hào)它的特征是隨時(shí)間變化的,但在一個(gè)很短的時(shí)間段內(nèi)可以認(rèn)為具有相對(duì)穩(wěn)定的特征即 短時(shí)平穩(wěn)性。因此語(yǔ)音具有短時(shí)自相關(guān)性。這個(gè)時(shí)間段約5ms-50ms。為其統(tǒng)計(jì)特性和頻譜特性都是對(duì)短時(shí)段而言的。這使得要對(duì)語(yǔ)音信號(hào)作

5、數(shù)字處理必須先按短時(shí)段對(duì)語(yǔ)音信號(hào)分幀。這樣每一幀信號(hào)都具有短時(shí)平穩(wěn)性從而進(jìn)行短時(shí)相關(guān)分析。能量有限的語(yǔ)音信號(hào)s(n)的短時(shí)自相關(guān)函數(shù)定義為:一般要求一幀至少包含2個(gè)以上的周期。而且相鄰幀之間要有足夠的重疊。3.3 自相關(guān)方法變種 中心削波由于語(yǔ)音信號(hào)與聲道特性影響有關(guān),有的情況下即使窗長(zhǎng)已選得足夠長(zhǎng),第一最大峰值點(diǎn)與基音仍不一致,這就是聲道特性的共振峰特性造成的“干擾”。實(shí)際上影響從自相關(guān)函數(shù)中正確提取基音周期的最主要的因素就是聲道響應(yīng)部分。當(dāng)基音的周期性和共振峰的周期性混疊在一起時(shí),被檢測(cè)出來(lái)的峰值就會(huì)偏離原來(lái)峰值的真實(shí)位置。另外,某些濁音中,第一共振峰頻率可能會(huì)等于或低于基音頻率。此時(shí),如

6、果其幅度很高,它就可能在自相關(guān)函數(shù)中產(chǎn)生一個(gè)峰值,而該峰值又可以同基音頻率的峰值相比擬,從而給基音檢測(cè)帶來(lái)誤差。為了提高基音周期檢測(cè)的可靠性,采用中心削波法對(duì)原始信號(hào)進(jìn)行預(yù)處理。 其中削波電平 CL 一般取最大信號(hào)幅度的 60%70%。圖1給出了中心削波處理后的結(jié)果。中心削波后,再用自相關(guān)檢測(cè)出基音頻率,錯(cuò)判為倍頻或分頻的情況就可以大大減少了。中心削波法實(shí)質(zhì)上是對(duì)信號(hào)做非線性處理,它消除語(yǔ)音信號(hào)的低幅值部分,而保留高振幅的峰值,從而能有利于信號(hào)的基音周期估計(jì)。圖1 中心削波處理經(jīng)過(guò)中心削波后的信號(hào),削去了大部分與聲道響應(yīng)有關(guān)的波動(dòng),只保留了超過(guò)削波電平的部分。對(duì)中心削波后的語(yǔ)音信號(hào)計(jì)算自相關(guān)函

7、數(shù),這樣在基音周期位置呈現(xiàn)大而尖的峰值,而其余的次要峰值幅度都很小。 三電平削波由自相關(guān)函數(shù)表達(dá)式可知,自相關(guān)需要大量的乘法運(yùn)算,算法的運(yùn)行效率低。結(jié)合自相關(guān)函數(shù)法和中心削波法對(duì)信號(hào)做基音周期估計(jì),并在不影響基音周期估計(jì)準(zhǔn)確性的前提下,用兩個(gè)信號(hào)的互相關(guān)序列代替自相關(guān)序列而避免了大量的乘法運(yùn)算,有效地提高了算法的運(yùn)行效率。 圖2 顯示的是經(jīng)過(guò)三電平削波后的信號(hào)。經(jīng)過(guò)三電平削波后的信號(hào)原始輸入的語(yǔ)音信號(hào)圖2 經(jīng)過(guò)三電平削波后的信號(hào)顯然 x(n)只有-1,0,1 三種可能的取值。自相關(guān)中的乘法運(yùn)算都變成了加減運(yùn)算,使得算法的效率得到大幅度的提高。 基于時(shí)域自相關(guān)平方函數(shù)第一峰值點(diǎn)的位置非常重要,峰

8、值越尖銳則確定的位置就越準(zhǔn)確。求短時(shí)自相關(guān)函數(shù)的平方:它們周期一致,但平方后在峰值處波形尖銳尤為明顯。圖3示為某女性發(fā)元音a的波形/短時(shí)自相關(guān)函數(shù)及短時(shí)自相關(guān)平方函數(shù)波形.圖3 某女性發(fā)元音a的波形/短時(shí)自相關(guān)函數(shù)及短時(shí)自相關(guān)平方函數(shù)波形 3.4 短時(shí)能量分析語(yǔ)音信號(hào)x(n)的某幀信號(hào)的短時(shí)平均能量En的定義為:式中,w(n)為窗函數(shù),N為窗長(zhǎng),h(n)= w2(n),則有 由上式表明,短時(shí)平均能量En相當(dāng)于將語(yǔ)音信號(hào)的平方通過(guò)一個(gè)單位沖激響應(yīng)為h(n)的線性濾波器的輸出。實(shí)驗(yàn)統(tǒng)計(jì)發(fā)現(xiàn),語(yǔ)音中濁音段的短時(shí)平均能量遠(yuǎn)遠(yuǎn)大于清音段的短時(shí)平均能量。因此,短時(shí)平均能量的計(jì)算給出了區(qū)分清音段與濁音段的依

9、據(jù),即En(濁)>En(清)。根據(jù)E由高到低的跳變可定出濁音變?yōu)榍逡粽Z(yǔ)音的時(shí)刻,E由低向高的跳變可定出清音變?yōu)闈嵋粽Z(yǔ)音的時(shí)刻,又由于只有濁音才有基音周期,清音的基音周期為零,這樣就可判別出清、濁音。圖4 男聲“確定”的語(yǔ)音波形及其局部短時(shí)能量四、結(jié)果與分析檢測(cè)流程如下:我們先通過(guò)Matlab實(shí)現(xiàn),然后再通過(guò)C+實(shí)現(xiàn)。圖5 基于自相關(guān)函數(shù)的基因周期檢測(cè)流程實(shí)驗(yàn)采用一段男聲讀“播放”兩個(gè)字的聲音wav文件,其為16KHz采樣率,16bit量化。整段語(yǔ)音長(zhǎng)656.7ms,節(jié)點(diǎn)共10508個(gè)。圖6 男聲讀“播放”兩個(gè)字的聲音文件4.1 濾波將濾波器低端截止頻率設(shè)為60Hz,這是因?yàn)榭梢砸种?0Hz電源工頻的干擾;高端截止頻率設(shè)為900Hz既可除去大部分共振峰影響,又可以當(dāng)基音最高頻率為450Hz時(shí)仍能保留其一二次諧波。圖7 經(jīng)過(guò)濾波器后的語(yǔ)音信號(hào)4.2 不同幀長(zhǎng)窗口長(zhǎng)度至少要大于基音周期的兩倍。一般,基頻最低50Hz,故周期最長(zhǎng)為20ms,再根據(jù)采樣率確定幀長(zhǎng)。圖8 截取不同幀長(zhǎng)的語(yǔ)音信號(hào)4.3 清濁音區(qū)分這里我們通過(guò)計(jì)算短時(shí)能量來(lái)區(qū)分清濁音,結(jié)果如圖9所示。圖9 清、濁音短時(shí)能量圖4.4 平滑 去除野點(diǎn)。圖10 平滑后的結(jié)果五、總結(jié)通過(guò)本次課程實(shí)驗(yàn)設(shè)計(jì),我們從中學(xué)習(xí)了語(yǔ)音信號(hào)處理的一些基本知識(shí),了解了基音周期的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論