第5章 語音信號的同態(tài)分析.ppt_第1頁
第5章 語音信號的同態(tài)分析.ppt_第2頁
第5章 語音信號的同態(tài)分析.ppt_第3頁
第5章 語音信號的同態(tài)分析.ppt_第4頁
第5章 語音信號的同態(tài)分析.ppt_第5頁
已閱讀5頁,還剩35頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第5章語音信號的同態(tài)分析 5.1概述 語音的數(shù)學模型:由準周期脈沖(濁音)或白噪聲(清音) 激勵一個線性時變系統(tǒng)產(chǎn)生的輸出。 時變性:在一幀內(nèi)認為是不變的。 一幀語音信號 = 激勵源 (卷積) 線性時不變系統(tǒng)的沖激響應 語音分析的目的:將激勵源與線性時不變系統(tǒng)的沖激響應分 開來分別進行研究(即解卷積問題)。 激勵源:區(qū)分清音和濁音(濁音時還應確定基音頻率)。 線性時不變系統(tǒng):了解聲道 特性、諧振參數(shù)。,兩類解卷積算法: 參數(shù)解卷:為線性系統(tǒng)建立模型,用估計的模型參數(shù)表示 。 線性預測分析就屬于參數(shù)解卷算法。 非參數(shù)解卷:無需建立線性系統(tǒng)模型的一類方法。 同態(tài)濾波就是其中的一種技術。 同態(tài)濾波是

2、一種非線性濾波,服從廣義疊加原理。 分離非加性組合信號(如乘性、卷積性組合),常采用同態(tài)濾波技術。 本章內(nèi)容:廣義疊加原理、卷積同態(tài)系統(tǒng), 復倒譜分析及其應用,第5章語音信號的同態(tài)分析 5.2廣義疊加原理 線性系統(tǒng):是由疊加原理定義的, 同態(tài)系統(tǒng):由廣義疊加原理來定義。 疊加原理是廣義疊加原理的特例。 廣義疊加原理: H :系統(tǒng)變換; :系統(tǒng)的輸入矢量之間的運算,(加法、乘法、卷積等) : 標量與輸入矢量之間的運算,(乘法、冪、開方等) 和:系統(tǒng)的輸出矢量空間中系統(tǒng)的相應運算。 若下式成立,稱系統(tǒng)H 滿足廣義疊加原理。 定義:滿足廣義疊加原理的系統(tǒng)為同態(tài)系統(tǒng)。,分類:同態(tài)系統(tǒng)以輸入、輸出矢量空

3、間中的運算來分類。 例:輸入運算、輸出運算的同態(tài)系統(tǒng)稱為,同態(tài)系統(tǒng) 本章只討論輸入和輸出運算相同的同態(tài)系統(tǒng), 例:卷積同態(tài)系統(tǒng),輸入和輸出運算都為卷積運算。 線性系統(tǒng):同態(tài)系統(tǒng)的特例。 ,為矢量加法運算, ,為標量與矢量乘。 圖5.1:輸入運算,、輸出運算,的同態(tài)系統(tǒng)框圖。 系統(tǒng)變換H :從輸入到輸出的矢量空間的代數(shù)線性變換。 線性矢量空間理論應用于同態(tài)系統(tǒng),輸入、輸出運算需滿足矢量加法和標量乘法的代數(shù)公設。,圖5.2:同態(tài)系統(tǒng)的規(guī)范形式。 同態(tài)系統(tǒng)表示成三個子系統(tǒng)(皆同態(tài)系統(tǒng))級聯(lián)。 服從下列的廣義疊加原理: 式中,,運算的特征系統(tǒng),運算的特征系統(tǒng)的逆系統(tǒng),線性系統(tǒng),決定該同態(tài)系統(tǒng)的特性.設

4、計的重點,第5章語音信號的同態(tài)分析 5.3卷積同態(tài)系統(tǒng) 卷積同態(tài)系統(tǒng):運算和為卷積運算的同態(tài)系統(tǒng)。 圖5.3:卷積同態(tài)系統(tǒng)的規(guī)范形式。 將卷積組合信號分離,分別處理后,再組合成卷積運算。 組成:卷積特征系統(tǒng)(固定特性) 線性系統(tǒng)(與系統(tǒng)性能有關) 卷積特征系統(tǒng)的逆系統(tǒng)(固定特性),卷積特征系統(tǒng)(固定特性)(圖5.4a): 將卷積運算變?yōu)榧臃ㄟ\算,即: 式中, X1(z), X2(z) 分別為x1(n), x2(n)的z變換; 分別為 ln X1(z), ln X2(z)的反z變換。 作用:將卷積運算組合信號轉換成它們的復倒譜之和。 (復倒譜的定義見下節(jié)),線性系統(tǒng) L : 依應用領域的不同要求

5、和復倒譜 的特點設計: 或加強其中之一,削弱另一個信號; 或取出其中之一同時濾掉另一個信號。 對 進行線性濾波,即: 式中, 經(jīng)線性系統(tǒng)L 濾波后的輸出。,卷積特征系統(tǒng)的逆系統(tǒng)(固定特性) (圖5.4b): 將加法運算變?yōu)榫矸e運算,即: 式中, 為 的z變換; 為 的反z變換。,介紹兩種卷積同態(tài)系統(tǒng)的典型應用實例: 語音信號分析 解混響。 語音信號分析 語音等于激勵源與聲道沖激響應的卷積(數(shù)字模型): 分析目的:由語音信號估計激勵源和聲道沖激響應參數(shù)。 卷積同態(tài)系統(tǒng)適于這種分析。 解混響 混響環(huán)境中錄音,記錄下有用信號和若干回波信號,即: 式中,nk 第 k 個回波相對于有用信號 s(n) 的

6、時延; ak 第 k 個反射系數(shù); 回響特性。,僅討論疊加一個回波信號的簡單情況, 相關表達式: 若 n1 小于 s(n) 的持續(xù)時間,采用卷積同態(tài)濾波器去掉回波。 將上式代人模型式,然后兩邊求 z 變換后再取對數(shù),得: 兩邊再求反 z 變換,最后得: 式中, 濾除回波,設計梳形濾波器(特性如圖5.5所示) 經(jīng)梳形濾波器過濾,留下信號 ; 經(jīng)圖5.4的卷積特征系統(tǒng)的逆系統(tǒng)處理,得到有用信號s(n) 。,幅度迅速衰減的沖激序列,相鄰沖激之間相隔為n1 。,第5章語音信號的同態(tài)分析 5.4復倒譜和倒譜 定義: x(n) 的復倒譜(Cepstrurn)為: 時間序列的復倒譜是時間序列。 實序列的復倒

7、譜是一個實的時間序列。 復倒譜:也稱為復倒頻譜或對數(shù)復倒譜。 復倒譜的英文原文為Complex Cepstrum, Cepstrurn是詞,由Spectrum的前四個字母倒置而成。 有時,稱 所處的時域為“復倒譜域”。 定義: x(n) 的倒頻譜(對數(shù)倒頻譜)為 復倒譜:復對數(shù)運算;倒譜:實對數(shù)運算。 倒譜(復倒譜)量綱:quefrency(倒頻),新詞。,注意比較,復倒譜和倒譜的異同: 定義式:復倒譜 倒 譜 關系式:設 則 一個信號序列經(jīng)正、反兩個特征系統(tǒng)變換后, 復倒譜時,能還原信號序列; 倒譜時,不能還原信號序列。因計算時,丟失相位信息。 復倒譜涉及兩個待解 決的理論問題, 復對數(shù)的多

8、值性; 復對數(shù)的解析性。,復對數(shù)的多值性和解析性: x(n) 的 z 變換表示為: 因 ( k 為整數(shù))是周期函數(shù),故有: 即:X(z) 對應于無窮多個 。不滿足變換的唯一性。 解決辦法:取主值,將幅角對取模得到主值相位,即 式中, 表示對求模運算。 復倒譜式可改寫為: 上式滿足唯一性,但單位圓上不是的連續(xù)函數(shù), 與 的解析性相違復對數(shù)的。,關于 的連續(xù)性: 為使 是的連續(xù)函數(shù),要求 X(z) 在單位圓上無零、極點。 為了避免復對數(shù)的多值性,采用了主值相位ARG X(ej),致使的連續(xù)性得不到保證。 可在黎曼曲面上,重新定義復對數(shù),幅角在(-,+ )范圍內(nèi)可以連續(xù)取值而無間斷點。(細節(jié)參見數(shù)學

9、教科書),第5章語音信號的同態(tài)分析 5.5類語音信號的復倒譜分析 兩類序列的復倒譜:有理 z 變換序列、周期脈沖序列。 5.5.1有理 z 變換序列 一類序列的有理 z 變換: 在單位圓上無零極點。 A 系數(shù),假定為正。 z-r 序列相對于時間原點的延時,假定該項可估計并去掉 將上式求復對數(shù),得:(見下頁),取對數(shù): 對數(shù)展開式: 利用對數(shù)展開式,改寫上式為 z 的冪級數(shù)的形式, 其系數(shù)為逆 z 變換。 因此,可得與有理 X(z) 有關的復倒譜:(見下頁),有理 z 變換序列的復倒譜: 的結論: 雙邊序列,定義(-,+)。 衰減序列, 隨 的增大而減小。 衰減的速度至少比 快。 故, 比 更集

10、中于原點附近(更具短時性)。 用短時窗提取聲道響應序列的復倒譜是很有效的。 最小相位序列的復倒譜是因果序列。 若 x(n) 是最小相位序列(零極點均在 z 平面單位圓內(nèi))。 此時,n0,有值(因果序列)。 最大相位序列的復倒譜是反因果序列。 若x(n) 是最大相位序列,(零極點均在 z 平面單位圓外)。 此時, n 0,有值(反因果序列),5.5.2脈沖序列 脈沖序列:加權值變化的等間距單位抽樣脈沖串 式中,m,k,N正整數(shù),k幅度因子; 求 p(n) 的復倒譜:先進行 z 變換 若 p(n) 是最小相位,假定, 利用對數(shù)展開式 ,上式改寫為:,對上式進行逆 z 變換,得到復倒譜: 上式是間隔

11、 N 個樣點的單位抽樣無限長右邊序列。 可證:非最小相位序列,其復倒譜是均勻間隔的雙邊脈沖串。 結論:間隔 N 的沖激序列的復倒譜是間隔為 N 的沖激序列。,第5章語音信號的同態(tài)分析 5.6復倒譜的計算方法 計算復倒譜的方法:按定義計算、最小相位序列計算、導數(shù)計算、遞推計算等。 5.6.1按復倒譜定義計算 圖5.6:用復倒譜定義計算的方框圖。 用DFT代替 z 變換。 x(n)是 N 長時間序列, X(k)x(n)的N 點DFT, N 長序列, 由于 是 在一個周期內(nèi) N 個等間隔頻點的樣本, 其逆DFT(IDFT)是 以 N 為周期的延拓序列, 用 表示:,由于 是 在一個周期內(nèi) N 個等間

12、隔頻點的樣本, 其逆DFT(IDFT)是 以 N 為周期的延拓序列, 用 表示: 圖5.6:計算得不到真正的復倒譜,是復倒譜周期延拓。 有混疊失真。 由于 的幅度衰減很快(至少以 的速度衰減), 當 N 值較大時混疊失真很小。 若 N 值不夠大,可在序列后面添加零樣本, 以使 能夠較好地逼近 。,按定義計算復倒譜時需注意問題: (1) DFT、IDFT常用FFT算法,以提高速度。 (2)相位展開。設 則: 幅角主值間斷,需恢復瞬時相位 (相位展開),相位展開方法很多; 瞬時相位是的連續(xù)函數(shù), 圖5.7:主值相位疊加校正相位法。 簡單分析,可得下頁的校正方法, 推導過程(略)。,相位展開公式:

13、(3)符號校正。計算復倒譜時,需判明 A 的符號。 計算式為: 推導過程(略)。,(4)線性相位的貢獻有規(guī)律,為簡化計算,常將其移去。 方法:得到 X(k) 后乘以 ,即 需確定 r 值,經(jīng)推導可得(過程略): 綜上,按定義 計算復倒譜的 方框圖如圖5.8。,5.6.2最小相位序列的復倒譜的計算 信號為最小相位序列時,按定義計算復倒譜法可簡化。 設 x(n) 是實最小相位序列,則其復倒譜必為實因果序列。 將序列 表示成偶序列和奇序列之和,即: 式中, 由于 是因果的,即 ;因此,可得 ,式中 可由其偶序列或奇序列(包含 在內(nèi))恢復出。,設 的Fourier變換用 表示,顯然有: 由Fourie

14、r變換性質知, 與 構成Fourier變換對。 圖5.9:給出最小相位序列時的復倒譜計算方法。 各計算式為: 式中,,注:用DFT計算, 不同于 , 因而 不同于 。 差別: 由連續(xù)函數(shù)變換得到, 是由離散序列 求IDFT得到的, 是在等間隔頻率點上對 取樣得到, 所以, 是 以周期 N 進行延拓結果,即 必產(chǎn)生混疊失真。 由于 隨 n 值增加而迅速衰減,只要 N 值選擇得足夠大, 則混疊失真可忽略。 是近似解。,5.6.3復對數(shù)求導數(shù)計算法 對定義式 的兩端求導數(shù)并乘以 z,得: 由時域序列的線性加權與 z 域導數(shù)的關系及對上式右邊用圍線積分法求逆 z 變換,得: 于是有: 式中,c 是收斂

15、域中的閉合曲線。 若收斂域包括單位圓,則有:,由于 ,令n = 0,得: 綜上,計算復倒譜的步驟歸納如下: (1) 計算 (2) 計算 (3) 計算,在應用中,x(n) 是有限長序列,要用DFT代替Fourier變換。 設x(n)是長為 N 的序列,上面的計算步驟改變?nèi)缦拢?(1) 計算 (2) 計算 (3) 計算 算法避免了計算復對數(shù),代價是產(chǎn)生了更嚴重的混疊失真。 可證,這種方法的計算結果是: 結論:若精確計算相位特性,用定義法計算復倒譜,性能好。,5.6.4遞推計算方法 上節(jié)式 改寫成: 考慮到 z 變換的關系式 及 z 域乘等于時域卷積的性質,對上式兩邊取逆 z 變換,得: 由上式可導

16、出遞推計算方法。分: 最小相位序列的復倒譜遞推計算; 最大相位序列的復倒譜遞推計算 。,最小相位序列的復倒譜遞推計算 最小相位序列為因果序列,則 代入上頁遞推式,得 結合式 ,由上式可解出:,最大相位序列的復倒譜遞推計算 采用與最小相位的類似推導方法,可得最大相位的 遞推公式:,mi+mo+1長的有限長序列,其 z 變換為: 采用類似的推導方法,可得遞推公式: 可以證明(略),只需求出的前 mi+mo+1 個值就足以代表x(n)。,5.7語音信號的倒譜分析 圖5.10:濁音的同態(tài)處理實例(10kHz取樣, 256樣點Hamming窗) 該段語音的基音周期為45樣點。 圖5.11:(同樣條件下)清音的同態(tài)處理示例。 結論: 濁

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論