工學(xué)chpart頻域分析_第1頁
工學(xué)chpart頻域分析_第2頁
工學(xué)chpart頻域分析_第3頁
工學(xué)chpart頻域分析_第4頁
工學(xué)chpart頻域分析_第5頁
已閱讀5頁,還剩53頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

工學(xué)chpart頻域分析第1頁/共58頁§3.4.1短時(shí)(加窗)傅立葉變換的定義ShortTimeFourierTransform-STFT一、定義兩種解釋:1)n固定

FT2)固定

LinearFilter第2頁/共58頁x(m)w(n-m)w(m)mmn

透過位于n處的窗口所觀察到的語音短段的傅立葉變換。n取不同值時(shí),窗w(n-m)沿時(shí)間軸滑到不同位置,取出不同的語音段,故不僅是的函數(shù),還是時(shí)間n的函數(shù)。第3頁/共58頁短時(shí)幅度譜的計(jì)算過程第4頁/共58頁短時(shí)幅度譜得出的參數(shù)第5頁/共58頁二、移動(dòng)窗形狀對(duì)的影響元音[a]的短時(shí)幅度譜(n=512)rectangularwindowhammingwindow第6頁/共58頁

從短時(shí)頻譜圖中可知:(1)快速變化,由激勵(lì)信號(hào)引起的;(2)慢速變化,聲道濾波器的共振峰特性引起的(3)采用漢明窗得到的短時(shí)頻譜較矩形窗平滑,因而在語音分析中漢明窗用得較普遍。hammingwindow第7頁/共58頁Vowel/a:/(a)50ms包含6個(gè)周期,基音周期頻率為120Hz。(b)30msrectangularwindow(c)15msrectangular(d)30mshammingwindow(e)15mshamming第8頁/共58頁(a)50ms包含10個(gè)周期,基音周期頻率為200Hz。(b)30msrectangularwindow(c)15msrectangular(d)30mshammingwindow(e)15mshammingVowel/a:/第9頁/共58頁漢明窗矩形窗語音的短時(shí)對(duì)數(shù)幅度譜語音的短時(shí)對(duì)數(shù)幅度譜第10頁/共58頁矩形窗漢明窗第11頁/共58頁三、窗寬對(duì)的影響

窗寬為64點(diǎn)(10kHz)元音[a]的短時(shí)頻譜圖短窗的頻率分辨率下降,頻譜圖中丟失了關(guān)于語音基音周期的信息,只保留慢變化。矩形窗漢明窗第12頁/共58頁語譜圖(Spectrogram)

語音的時(shí)域分析和頻域分析是語音分析的兩種重要的方法,但是這兩種方法均有局限性:時(shí)域分析對(duì)語音信號(hào)的頻率特性沒有直觀的了解;而頻域特性中又沒有語音信號(hào)隨時(shí)間的變化關(guān)系。因此人們致力于研究將時(shí)域分析和頻域相結(jié)合,將時(shí)間依賴于傅立葉分析的顯示圖形稱作為語譜圖,橫坐標(biāo)為時(shí)間,縱坐標(biāo)為頻率,譜的色調(diào)的濃淡表示聲音的強(qiáng)弱。它綜合了頻譜圖和時(shí)域波形的優(yōu)點(diǎn),明顯得展示了語音頻譜隨時(shí)間的變化情況。第13頁/共58頁Band-passfilter1Band-passfilter2Band-passfilterNSpeechtimefrequencyThetwo-dimensionalfunctioniscalledthespectrogram.第14頁/共58頁EverysaltbreezecomesformtheseaWidebandnarrowband第15頁/共58頁Matlab命令:specgramWidebandspectrogram:給出共振峰頻率Narrowbandspectrogram:基音周期及其諧波

specgramcomputesthewindoweddiscrete-timeFouriertransformofasignalusingaslidingwindow.Thespectrogramisthemagnitudeofthisfunction.第16頁/共58頁第17頁/共58頁第18頁/共58頁N=1024hammingwindow幅度譜

第19頁/共58頁N=2048hammingwindow幅度譜

第20頁/共58頁

歡迎使用微軟中國研究院中文語音合成系統(tǒng)的時(shí)域波形和語譜圖第21頁/共58頁第22頁/共58頁短時(shí)譜的卷積形式語音信號(hào)x(m)的頻譜

窗函數(shù)w(m)的頻譜窗函數(shù)w(n-m)的頻譜第23頁/共58頁“畢業(yè)”第24頁/共58頁§3.4.2短時(shí)傅立葉變換的性質(zhì)一、由得出當(dāng)n=m時(shí),且第25頁/共58頁絕對(duì)值濾波器h(n)x(m)w(n-m)mnxn(m)第26頁/共58頁二.短時(shí)譜的卷積形式語音信號(hào)x(m)的頻譜

窗函數(shù)w(m)的頻譜窗函數(shù)w(n-m)的頻譜第27頁/共58頁用代替

為了使能夠與具有相同的性質(zhì),則要求是一個(gè)沖激函數(shù)。窗長N越長,的主瓣越狹窄尖銳,則越逼近于。但窗長N太大,窗選信號(hào)不滿足語音的短時(shí)平穩(wěn)特性,不能正確反映短時(shí)語音的頻譜了。為此,必須要合理選擇窗長N。第28頁/共58頁第29頁/共58頁三.短時(shí)功率譜和短時(shí)譜的關(guān)系四.短時(shí)功率譜和短時(shí)自相關(guān)函數(shù)的關(guān)系第30頁/共58頁

男聲“深圳廣州珠海”的短時(shí)功率譜統(tǒng)計(jì)。在采樣頻率為22050Hz的情況下,取20ms作為一幀,幀長為441點(diǎn),一共統(tǒng)計(jì)了180幀。短時(shí)功率譜原始語音第31頁/共58頁(2).利用短時(shí)功率譜的統(tǒng)計(jì)進(jìn)行有聲和無聲的檢測(cè)

含噪語音信號(hào)的短時(shí)功率譜統(tǒng)計(jì),對(duì)每一幀輸入信號(hào),通過與預(yù)先設(shè)定的一系列門限值比較來判斷該幀是信號(hào)幀還是噪聲幀。第32頁/共58頁§3.4.3短時(shí)傅立葉變換的線性濾波實(shí)現(xiàn)一、

的另一種解釋當(dāng)將看成一個(gè)參變量,就只是n的函數(shù)。w(n)短時(shí)頻譜的線性濾波表示第33頁/共58頁w(n)w(n)短時(shí)頻譜的線性濾波實(shí)現(xiàn)第34頁/共58頁w(n)w(n)是窄帶低通濾波器假設(shè)

將x(n)的頻譜向左搬移了,或等效將頻率上的頻譜搬移到了零頻率處。因此為使輸出端有:w(n)是窄帶低通濾波器第35頁/共58頁第36頁/共58頁令令2.實(shí)數(shù)運(yùn)算實(shí)現(xiàn)短時(shí)譜的線性濾波表示窄帶帶通濾波器第37頁/共58頁第38頁/共58頁

+++-

實(shí)數(shù)運(yùn)算實(shí)現(xiàn)短時(shí)譜的線性濾波表示第39頁/共58頁§3.4.4短時(shí)傅立葉變換的取樣時(shí)域取樣n頻域取樣一、時(shí)域取樣n(線性濾波實(shí)現(xiàn))w(m)帶寬為B帶寬也為B取樣頻率

由窗的主瓣寬度來決定。矩形窗為1,漢明窗為2。第40頁/共58頁二、頻域取樣每幀中語音信號(hào)個(gè)數(shù)為窗長N第41頁/共58頁三、時(shí)域和頻域的總?cè)赢?dāng)時(shí)

的取樣率和的取樣率之比:

(過取樣比)第42頁/共58頁§3.4.5語音的短時(shí)合成技術(shù)

離散短時(shí)傅立葉反變換

離散短時(shí)傅立葉變換

離散短時(shí)傅立葉反變換在什么條件下由y(n)=x(n)第43頁/共58頁一、濾波器組相加法窄帶帶通濾波器假設(shè)第44頁/共58頁用帶通濾波器組進(jìn)行短時(shí)傅立葉分析N個(gè)中心頻率處于的濾波器組成的濾波器組第45頁/共58頁第46頁/共58頁1.時(shí)域條件若Nw<N,上式總成立;若Nw>=N,只要w(rN)=0,r=…,-2,-1,1,2,…N2NNw-1N-1第47頁/共58頁2.頻域條件第48頁/共58頁第49頁/共58頁0第50頁/共58頁

由于是寬度為N的有限時(shí)寬序列,而的頻率取樣在為N個(gè)。根據(jù)的周期性,故:第51頁/共58頁二、疊接相加法(Overlap-AddMethod)IFT如果窗移為R,也就是可以相繼恢復(fù)出各個(gè)窗口內(nèi)的各N個(gè)取樣值第52頁/共58頁1.臨界帶特征矢量的意義二、語音的短時(shí)譜的臨界帶特征矢量

符合人耳的聽覺特征的頻率分布是按臨界帶頻率分布的,反映出人耳對(duì)頻率高低的非線性心理感覺角度,短時(shí)譜按實(shí)際頻率分布的頻譜作為語音特征,不符合人耳的聽覺特征將會(huì)降低語音信號(hào)處理系統(tǒng)的性能。往往要求將實(shí)際的頻譜轉(zhuǎn)化為臨界帶頻譜特征的方法。第53頁/共58頁2.臨界帶頻譜特征矢量的求法(1)求出一幀加窗語音xn(m)的短時(shí)譜(2)在f=0~fs/2中確定若干各臨界帶頻率分割點(diǎn)臨界點(diǎn)頻率(Hz)第54頁/共58頁第1臨

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論