語(yǔ)音信號(hào)處理實(shí)驗(yàn)報(bào)告_第1頁(yè)
語(yǔ)音信號(hào)處理實(shí)驗(yàn)報(bào)告_第2頁(yè)
語(yǔ)音信號(hào)處理實(shí)驗(yàn)報(bào)告_第3頁(yè)
語(yǔ)音信號(hào)處理實(shí)驗(yàn)報(bào)告_第4頁(yè)
語(yǔ)音信號(hào)處理實(shí)驗(yàn)報(bào)告_第5頁(yè)
已閱讀5頁(yè),還剩1頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

語(yǔ)音信號(hào)處理實(shí)驗(yàn)報(bào)告——語(yǔ)音信號(hào)分析實(shí)驗(yàn)實(shí)驗(yàn)?zāi)康募霸碚Z(yǔ)音信號(hào)分析是語(yǔ)音信號(hào)處理的前提和基礎(chǔ),只有分析出可表示語(yǔ)音信號(hào)本質(zhì)特征的參數(shù),才有可能利用這些參數(shù)進(jìn)行高效的語(yǔ)音通信、語(yǔ)音合成和語(yǔ)音識(shí)別等處理,并且語(yǔ)音合成的音質(zhì)好壞和語(yǔ)音識(shí)別率的高低,都取決于對(duì)語(yǔ)音信號(hào)分析的準(zhǔn)確性和精確性。貫穿語(yǔ)音分析全過(guò)程的是“短時(shí)分析技術(shù)”。因?yàn)閺恼w來(lái)看,語(yǔ)音信號(hào)的特性及表征其本質(zhì)特征的參數(shù)均是隨時(shí)間變化的,所以它是一個(gè)非平穩(wěn)態(tài)過(guò)程,但是在一個(gè)短時(shí)間范圍內(nèi)(一般認(rèn)為在10~30ms的時(shí)間內(nèi)),其特性基本保持不變,即相對(duì)穩(wěn)定,可將其看做一個(gè)準(zhǔn)穩(wěn)態(tài)過(guò)程,即語(yǔ)音信號(hào)具有短時(shí)平穩(wěn)性。所以要將語(yǔ)音信號(hào)分幀來(lái)分析其特征參數(shù),幀長(zhǎng)一般取為10ms~30ms。實(shí)驗(yàn)過(guò)程系統(tǒng)結(jié)構(gòu)語(yǔ)音信號(hào)語(yǔ)音信號(hào)數(shù)字化數(shù)字化編碼采樣模/數(shù)轉(zhuǎn)換編碼采樣模/數(shù)轉(zhuǎn)換帶通濾波器增益控制加窗分幀預(yù)加重預(yù)處理加窗分幀預(yù)加重預(yù)處理短時(shí)能量分析/短短時(shí)能量分析/短時(shí)過(guò)零率分析/短時(shí)相關(guān)分析時(shí)域分析頻域分析頻域分析倒頻域分析倒頻域分析線性預(yù)測(cè)分析線性預(yù)測(cè)分析仿真結(jié)果時(shí)域分析男聲及女聲(藍(lán)色為時(shí)域信號(hào),紅色為每一幀的能量,綠色為每一幀的過(guò)零率)某一幀的自相關(guān)函數(shù)頻域分析=1\*GB3①一幀信號(hào)的倒譜分析和FFT及LPC分析對(duì)應(yīng)的LPC預(yù)測(cè)系數(shù):1,對(duì)應(yīng)的LPC預(yù)測(cè)系數(shù):1,-0.1,-0.02,-0.4,-0.27,……對(duì)應(yīng)的倒譜系數(shù):119.2,-7.6895,……=2\*GB3②男聲和女聲的倒譜分析一幀語(yǔ)音波形一幀語(yǔ)音的倒譜原語(yǔ)音波形一幀語(yǔ)音波形一幀語(yǔ)音的倒譜原語(yǔ)音波形=3\*GB3③濁音和清音的倒譜分析=4\*GB3④濁音和清音的FFT分析和LPC分析(紅色為FFT圖像,綠色為L(zhǎng)PC圖像)實(shí)驗(yàn)結(jié)果分析時(shí)域分析實(shí)驗(yàn)中采用的是漢明窗,窗的長(zhǎng)度對(duì)能否由短時(shí)能量反應(yīng)語(yǔ)音信號(hào)的變化起著決定性影響。這里窗長(zhǎng)合適,En能夠反應(yīng)語(yǔ)音信號(hào)幅度變化。同時(shí),從圖像可以看出,En可以作為區(qū)分濁音和清音的特征參數(shù)。短時(shí)過(guò)零率表示一幀語(yǔ)音中語(yǔ)音信號(hào)波形穿過(guò)橫軸(零電平)的次數(shù)。從圖中可以看出,短時(shí)能量和過(guò)零率可以近似為互補(bǔ)的情況,短時(shí)能量大的地方過(guò)零率小,短時(shí)能量小的地方過(guò)零率較大。從濁音和清音的時(shí)域分析可以看出,清音過(guò)零率高,濁音過(guò)零率低。從男聲女聲的時(shí)域信號(hào)對(duì)比圖中可以看出,女音信號(hào)在高頻率分布得更多,女聲信號(hào)在高頻段的能量分布更多,并且女聲有較高的過(guò)零率,這是因?yàn)檎Z(yǔ)音信號(hào)中的高頻段有較高的過(guò)零率。頻域分析這里對(duì)信號(hào)進(jìn)行快速傅里葉變換(FFT),可以發(fā)現(xiàn),當(dāng)窗口函數(shù)不同,傅里葉變換的結(jié)果也不相同。根據(jù)信號(hào)的時(shí)寬帶寬之積為一常數(shù)這一性質(zhì),可以知道窗口寬度與主瓣寬度成反比,N越大,主瓣越窄。漢明窗在頻譜范圍中的分辨率較高,而且旁瓣的衰減大,具有頻譜泄露少的有點(diǎn),所以在實(shí)驗(yàn)中采用的是具有較小上下沖的漢明窗。為了使頻域信號(hào)的頻率分辨率較高,所取的DFT及相應(yīng)的FFT點(diǎn)數(shù)應(yīng)該足夠多,但時(shí)域信號(hào)的長(zhǎng)度受到采樣率和和短時(shí)性的限制,這里可以采用補(bǔ)零的辦法,對(duì)補(bǔ)零后的序列進(jìn)行FFT變換。從實(shí)驗(yàn)仿真圖可以看出濁音的頻率分布比清音高。倒譜分析通過(guò)實(shí)驗(yàn)可以發(fā)現(xiàn),倒譜的基音檢測(cè)與語(yǔ)音加窗的選擇也是有關(guān)系的。如果窗函數(shù)選擇矩形窗,在許多情況下倒譜中的基音峰將變得不清晰,窗函數(shù)選擇漢明窗較為合理,可以發(fā)現(xiàn),加漢明窗的倒譜基音峰較為突出。在典型的濁音清音倒譜對(duì)比中,理論上濁音倒譜基音峰應(yīng)比較突出,而清音不出現(xiàn)這種尖峰,只是在倒譜的低時(shí)域部分包含關(guān)于聲道沖激響應(yīng)的信息。實(shí)驗(yàn)仿真的圖形不是很理想。線性預(yù)測(cè)分析從實(shí)驗(yàn)中可以發(fā)現(xiàn),LPC譜估計(jì)具有一個(gè)特點(diǎn),在信號(hào)能量較大的區(qū)域即接近譜的峰值處,LPC譜和信號(hào)譜很接近;而在信號(hào)能量較低的區(qū)域即接近譜的谷底處,則相差比較大。在濁音清音對(duì)比中,可以發(fā)現(xiàn),對(duì)呈現(xiàn)諧波特征的濁音語(yǔ)音譜來(lái)說(shuō)這個(gè)特點(diǎn)很明顯,就是在諧波成分處LPC譜匹配信號(hào)譜的效果要遠(yuǎn)比諧波之間好得多。在實(shí)驗(yàn)中,當(dāng)P值增加到一定程度,預(yù)測(cè)平方誤差的改善就不很明顯了,而且會(huì)增加計(jì)算量,一般取為8~14,這里P取為10?;糁芷诠烙?jì)=1\*GB3①自互相關(guān)函數(shù)法=2\*GB3②短時(shí)平均幅度差法=3\*GB3③倒譜分

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論