語(yǔ)音信號(hào)處理課件-第04章短時(shí)傅里葉分析_第1頁(yè)
語(yǔ)音信號(hào)處理課件-第04章短時(shí)傅里葉分析_第2頁(yè)
語(yǔ)音信號(hào)處理課件-第04章短時(shí)傅里葉分析_第3頁(yè)
語(yǔ)音信號(hào)處理課件-第04章短時(shí)傅里葉分析_第4頁(yè)
語(yǔ)音信號(hào)處理課件-第04章短時(shí)傅里葉分析_第5頁(yè)
已閱讀5頁(yè),還剩41頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第4章短時(shí)傅立葉分析14.1短時(shí)傅立葉變換--概述24.2.1短時(shí)傅立葉變換--定義定義:短時(shí)傅立葉變換也叫短時(shí)譜(加窗的方式)短時(shí)譜的特點(diǎn):1)時(shí)變性:既是角頻率ω的函數(shù)又是時(shí)間n的函數(shù)2)周期性:是關(guān)于ω的周期函數(shù),周期為2π短時(shí)傅立葉變換主要用于語(yǔ)音分析合成系統(tǒng),由其逆變換可以精確地恢復(fù)語(yǔ)音波形;3短時(shí)傅里葉變換是窗選語(yǔ)音信號(hào)的標(biāo)準(zhǔn)傅里葉變換。下標(biāo)n區(qū)別于標(biāo)準(zhǔn)的傅里葉變換。w(n-m)是窗口函數(shù)序列。不同的窗口函數(shù)序列,將得到不同的傅里葉變換的結(jié)果。短時(shí)傅里葉變換有兩個(gè)自變量:n和ω,所以它既是關(guān)于時(shí)間n的離散函數(shù),又是關(guān)于角頻率ω的連續(xù)函數(shù)。與離散傅里葉變換和連續(xù)傅里葉變換的關(guān)系一樣,若令ω=2πk/N,則得離散的短時(shí)傅里葉變換,它實(shí)際上是在頻域的取樣。4.2.1短時(shí)傅立葉變換--定義4這兩個(gè)公式都有兩種解釋:①當(dāng)n固定不變時(shí),它們是序列w(n-m)x(m)(-∞<m<∞)的標(biāo)準(zhǔn)傅里葉變換或標(biāo)準(zhǔn)的離散傅里葉變換。此時(shí)與標(biāo)準(zhǔn)傅里葉變換具有相同的性質(zhì),而Xn(k)與標(biāo)準(zhǔn)的離散傅里葉變換具有相同的特性。②當(dāng)ω或k固定時(shí),和Xn(k)看做是時(shí)間n的函數(shù)。它們是信號(hào)序列和窗口函數(shù)序列的卷積,此時(shí)窗口的作用相當(dāng)于一個(gè)濾波器。

4.2.1短時(shí)傅立葉變換--定義54.2.2短時(shí)傅立葉變換--標(biāo)準(zhǔn)傅里葉變換的解釋短時(shí)傅里葉變換可寫為

當(dāng)n取不同值時(shí)窗w(n-m)沿著x(m)序列滑動(dòng),所以w(n-m)是一個(gè)“滑動(dòng)的”窗口。由于窗口是有限長(zhǎng)度的,滿足絕對(duì)可和條件,所以這個(gè)變換是存在的。與序列的傅里葉變換相同,短時(shí)傅里葉變換隨著ω作周期變化,周期為2π。64.2.2短時(shí)傅立葉變換--標(biāo)準(zhǔn)傅里葉變換的解釋74.2.2短時(shí)傅立葉變換--標(biāo)準(zhǔn)傅里葉變換的解釋根據(jù)功率譜定義,可以寫出短時(shí)功率譜與短時(shí)傅里葉變換之間的關(guān)系

式中*表示復(fù)共軛運(yùn)算。同時(shí)功率譜是短時(shí)自相關(guān)函數(shù)

的傅里葉變換。下面將短時(shí)傅里葉變換寫為另一種形式。設(shè)信號(hào)序列和窗口序列的標(biāo)準(zhǔn)傅里葉變換為

均存在。當(dāng)n取固定值時(shí),w(n-m)的傅里葉變換為

84.2.2短時(shí)傅立葉變換--標(biāo)準(zhǔn)傅里葉變換的解釋根據(jù)傅里葉變換的頻域卷積定理,有將改為-,得9用波形乘以窗函數(shù),不僅為了在窗口邊緣兩端不引起急劇變化,使波形緩慢降為零,而且還相當(dāng)于對(duì)信號(hào)譜與窗函數(shù)的傅里葉變換進(jìn)行卷積。為此窗函數(shù)應(yīng)具有如下特性:

①頻率分辨率高,即主瓣狹窄、尖銳;(矩形窗)②通過(guò)卷積,在其他頻率成分產(chǎn)生的頻譜泄漏少,即旁瓣衰減大。(海明窗)這兩個(gè)要求實(shí)際上相互矛盾,不能同時(shí)滿足。窗口寬度N、取樣周期T和頻率分辨率Δf之間存在下列關(guān)系Δf=1/NT可見(jiàn):窗口寬度↑→頻率分辨率↑時(shí)間分辨率↓窗口寬度↓→頻率分辨率↓時(shí)間分辨率↑,因而二者是矛盾的。4.2.2短時(shí)傅立葉變換--標(biāo)準(zhǔn)傅里葉變換的解釋104.2.2短時(shí)傅立葉變換--標(biāo)準(zhǔn)傅里葉變換的解釋第一個(gè)零點(diǎn)位置為2π/N,顯然它與窗口寬度成反比。矩形窗,雖然頻率分辨率很高,但由于第一旁瓣的衰減只有13.2dB,所以不適合用于頻譜成分動(dòng)態(tài)范圍很寬的語(yǔ)音分析中。海明窗在頻率范圍中的分辨率較高,而且由于旁瓣的衰減大于42dB,具有頻譜泄漏少的優(yōu)點(diǎn),頻譜中高頻分量弱、波動(dòng)小,因而得到較平滑的譜。漢寧窗是高次旁瓣低,第一旁瓣衰減只有30dB。直角窗11頻率分辨率Δf、取樣周期T、加窗寬度N三者關(guān)系:窗形狀對(duì)短時(shí)傅立葉變換的影響 -矩形窗——主瓣窄,衰減慢; -漢明窗——主瓣寬,衰減快;

-海明窗——主瓣窄,衰減快;窗寬對(duì)短時(shí)頻譜的影響-窗寬長(zhǎng)——頻率分辨率高,能看到頻譜快變化;-窗寬短——頻率分辨率低,看不到頻譜的快變化;4.2.2短時(shí)傅立葉變換--標(biāo)準(zhǔn)傅里葉變換的解釋12對(duì)語(yǔ)音波形乘以海明窗,壓縮了接近窗兩端的部分波形,等效于用作分析的區(qū)間縮短40%左右,因此,頻率分辨率下降40%左右。所以,即使在基音周期性明顯的濁音頻譜分析中,乘以合適的窗函數(shù),也能抑制基音周期與分析區(qū)間的相對(duì)相位關(guān)系的變動(dòng)影響,從而得到穩(wěn)定的頻譜。因?yàn)槌艘源昂瘮?shù)將導(dǎo)致分幀區(qū)間縮短,所以為跟蹤隨時(shí)間變化的頻譜,要求一部分區(qū)間重復(fù)移動(dòng)。4.2.2短時(shí)傅立葉變換--標(biāo)準(zhǔn)傅里葉變換的解釋134.2.2短時(shí)傅立葉變換--標(biāo)準(zhǔn)傅里葉變換的解釋14其中圖(a)是海明窗的窗選信號(hào),圖(b)是其對(duì)數(shù)功率譜;圖(c)是矩形窗下的窗選信號(hào),圖(d)是其對(duì)數(shù)功率譜。從圖(a)可以明顯看出時(shí)間波形的周期性,此周期性同樣在圖(b)中表現(xiàn)出來(lái)。圖中基頻及其諧波在頻譜中表現(xiàn)為等頻率間隔的窄峰。圖(b)中的頻譜大約在300~400Hz附近有較強(qiáng)的第一共振峰,而約在2000Hz附近有一個(gè)對(duì)應(yīng)于第二、三共振峰的寬峰。此外,還能在3800Hz附近看到第四個(gè)共振峰。最后,由于聲門脈沖譜的高頻衰減特性,頻譜在高頻部分表現(xiàn)出下降的趨勢(shì)。給出了N=500時(shí)(取樣率10kHz,窗持續(xù)時(shí)間50ms)時(shí)直角窗及海明窗下濁音語(yǔ)音的頻譜。4.2.2短時(shí)傅立葉變換--標(biāo)準(zhǔn)傅里葉變換的解釋15給出了N=500時(shí)(取樣率10kHz,窗持續(xù)時(shí)間50ms)時(shí)直角窗及海明窗下濁音語(yǔ)音的頻譜。4.2.2短時(shí)傅立葉變換--標(biāo)準(zhǔn)傅里葉變換的解釋將圖(b)和圖(d)比較可看出它們?cè)诨糁C波、共振峰結(jié)構(gòu)以及頻譜粗略形狀上的相似性,同樣也能看到其頻譜之間的差別。最明顯的是圖(d)中基音諧波尖銳度增加,這主要是由于矩形窗頻率分辨率較高。另一差別是矩形窗較高的旁瓣產(chǎn)生了一個(gè)類似于噪聲的頻譜。這是由于相鄰諧波的旁瓣在諧波間隔內(nèi)的相互作用(有時(shí)加強(qiáng)有時(shí)抵消),因而在諧波間產(chǎn)生了隨機(jī)變化。這種相鄰諧波間不希望有的“泄漏”抵消了其主瓣較窄的優(yōu)點(diǎn)。因此在語(yǔ)音頻譜分析中極少采用矩形窗。16圖4-3給出了N=50的比較結(jié)果(取樣率與圖4-2中相同,因而窗口持續(xù)時(shí)間為5ms)。由于窗口很短,因而時(shí)間序列(圖(a)和(c))及信號(hào)頻譜(圖(b)和(d))均不能反映信號(hào)的周期性。與圖4-2相反,圖4-3只大約在400、1400及2200Hz頻率上有少量較寬的峰值。它們與窗內(nèi)語(yǔ)音段的前三個(gè)共振峰相對(duì)應(yīng)。比較圖4-3(b)及(d)的頻譜后,再次表明矩形窗可以得到較高的頻率分辨率。

4.2.2短時(shí)傅立葉變換--標(biāo)準(zhǔn)傅里葉變換的解釋給出了N=50時(shí)(取樣率10kHz,窗持續(xù)時(shí)間5ms)時(shí)直角窗及海明窗下濁音語(yǔ)音的頻譜。17結(jié)論:窗口寬度與短時(shí)傅里葉變換特性之間的關(guān)系用窄窗可得到好的時(shí)間分辨率用寬窗可以得到好的頻率分辨率。但由于采用窗的目的是要限制分析的時(shí)間以使其中波形的特性沒(méi)有顯著變化,因而要折衷考慮。

4.2.2短時(shí)傅立葉變換--標(biāo)準(zhǔn)傅里葉變換的解釋18w(n)----------一個(gè)濾波器的單位函數(shù)響應(yīng)

-----該濾波器的輸出x(n)------濾波器的輸入過(guò)程:調(diào)制+濾波4.2.3短時(shí)傅立葉變換--濾波器的解釋一圖4-4短時(shí)傅里葉變換濾波器解釋的第一種形式(a)復(fù)數(shù)運(yùn)算194.2.3短時(shí)傅立葉變換--濾波器的解釋一用線性濾波實(shí)現(xiàn)短時(shí)傅立葉變換的第一種形式204.2.3短時(shí)傅立葉變換--濾波器的解釋一圖4-4短時(shí)傅里葉變換濾波器解釋的第一種形式

(b)只有實(shí)數(shù)運(yùn)算21

w(n)w(n)是窄帶低通濾波器假設(shè)

將x(n)的頻譜向左搬移了,或等效將頻率上的頻譜搬移到了零頻率處。因此為使輸出端有:w(n)是窄帶低通濾波器4.2.3短時(shí)傅立葉變換--濾波器的解釋一224.2.3短時(shí)傅立葉變換--濾波器的解釋一23令2.復(fù)數(shù)運(yùn)算實(shí)現(xiàn)短時(shí)譜的線性濾波表示窄帶帶通濾波器4.2.3短時(shí)傅立葉變換--濾波器的解釋二24實(shí)數(shù)運(yùn)算實(shí)現(xiàn)短時(shí)譜的線性濾波表示4.2.3短時(shí)傅立葉變換--濾波器的解釋二

+++-3.實(shí)數(shù)運(yùn)算實(shí)現(xiàn)短時(shí)譜的線性濾波表示25

為窄帶低通濾波器。第一種形式為低通濾波器;由于第二種形式中的濾波器單位函數(shù)響應(yīng)為,所以它為帶通濾波器。4.2.3短時(shí)傅立葉變換--濾波器的解釋26如果將w(n)的濾波運(yùn)算除外,短時(shí)傅里葉變換實(shí)際上是對(duì)信號(hào)的幅度調(diào)制。第一種形式是在輸入端進(jìn)行調(diào)制,x(n)乘以相當(dāng)于將x(n)的頻譜從ω移到零頻處;而w(n)(直角窗或海明窗等)為窄帶低通濾波器。后一種形式是在輸出端進(jìn)行調(diào)制,此時(shí)先對(duì)信號(hào)進(jìn)行帶通濾波,濾波器的單位函數(shù)響應(yīng)為w(n),而調(diào)制后輸出的是中心頻率為ω的短時(shí)譜。4.2.3短時(shí)傅立葉變換--濾波器的解釋27恢復(fù)出x(n)的過(guò)程稱為短時(shí)傅里葉反變換,是由短時(shí)譜合成語(yǔ)音信號(hào)的問(wèn)題由于是n和ω的二維函數(shù),因而必須對(duì)在所涉及的兩個(gè)變量,即時(shí)域及頻域內(nèi)進(jìn)行取樣,取樣率的選取應(yīng)保證不產(chǎn)生混疊失真,從而能夠恢復(fù)原始語(yǔ)音信號(hào)x(n)。4.3短時(shí)傅立葉變換的取樣率28當(dāng)ω為固定值時(shí),是一個(gè)單位函數(shù)響應(yīng)為w(n)的低通濾波器的輸出。設(shè)低通濾波器的帶寬為BHz,則具有與窗相同的帶寬。根據(jù)取樣定理,的取樣率至少為2B才不致混疊。低通濾波器的帶寬由w(n)的傅里葉變換的第一個(gè)零點(diǎn)位置ω01決定,因而B(niǎo)值取決于窗的形狀與長(zhǎng)度。

4.3短時(shí)傅立葉變換的取樣率---時(shí)間取樣率29正弦序列的表達(dá)式為幅值A(chǔ)、初相φ的含義與模擬正弦信號(hào)相同正弦序列的數(shù)字角頻率Ω0的含義與一般模擬信號(hào)模擬角頻率ω0的概念不同。離散信號(hào)數(shù)字角頻Ω0=ω0T,模擬角頻率ω0的單位是rad/s,數(shù)字角頻Ω0的單位為rad/s·s=rad。Ω0表示相鄰兩個(gè)樣值間弧度的變化量。4.3短時(shí)傅立葉變換的取樣率---時(shí)間取樣率30以直角窗和海明窗為例,其第一個(gè)零點(diǎn)位置分別為2π/N和4π/N數(shù)字角頻率與模擬頻率F之間的關(guān)系為ω=2πFT=2πF/fs(其中T是信號(hào)取樣周期,fs是取樣率),因而用模擬頻率表示的的帶寬為4.3短時(shí)傅立葉變換的取樣率---時(shí)間取樣率2231每幀中語(yǔ)音信號(hào)個(gè)數(shù)為窗長(zhǎng)N4.3短時(shí)傅立葉變換的取樣率---時(shí)間取樣率324.3短時(shí)傅立葉變換的取樣率---總?cè)勇?34.3短時(shí)傅立葉變換的取樣率---總?cè)勇?44.4語(yǔ)音信號(hào)的短時(shí)綜合--濾波器組求和法離散短時(shí)傅立葉變換離散短時(shí)傅立葉反變換354.4.1濾波器組相加法窄帶帶通濾波器假設(shè)4.4語(yǔ)音信號(hào)的短時(shí)綜合--濾波器組求和法36用帶通濾波器組進(jìn)行短時(shí)傅立葉分析N個(gè)中心頻率處于的濾波器組成的濾波器組4.4語(yǔ)音信號(hào)的短時(shí)綜合--濾波器組求和法372.頻域條件4.4語(yǔ)音信號(hào)的短時(shí)綜合--濾波器組求和法384.4語(yǔ)音信號(hào)的短時(shí)綜合--快速傅里葉變換求和法394.4語(yǔ)音信號(hào)的短時(shí)綜合--快速傅里葉變換求和法404.4語(yǔ)音信號(hào)的短時(shí)綜合--快速傅里葉變換求和法41語(yǔ)音的時(shí)域分析和頻域分析是語(yǔ)音分析的兩種重要方法。這兩種方法均有局限性:時(shí)域分析對(duì)語(yǔ)音信號(hào)的頻率特性沒(méi)有直觀的了解;頻域特性中又沒(méi)有語(yǔ)音信號(hào)隨時(shí)間的變化關(guān)系。時(shí)間依賴于傅里葉分析的顯示圖形稱為語(yǔ)譜圖。語(yǔ)譜圖中顯示了大量的與語(yǔ)音的語(yǔ)句特性有關(guān)的信息,它綜合了頻譜圖和時(shí)域波形的優(yōu)點(diǎn),明顯地顯示出語(yǔ)音頻譜隨時(shí)間的變化情況。4.5語(yǔ)譜圖42語(yǔ)譜圖實(shí)際上是一種動(dòng)態(tài)的頻譜。語(yǔ)譜圖的縱軸為頻率,橫軸為時(shí)間。任一給定頻率成分在給定時(shí)刻的強(qiáng)弱用點(diǎn)的黑白度來(lái)表示,頻譜值大則記錄得濃黑一些,反之則淺淡一些。用語(yǔ)譜圖分析語(yǔ)音又稱為語(yǔ)譜分析,記

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論