語音信號數(shù)字處理:6 語音信號的線性預測分析_第1頁
語音信號數(shù)字處理:6 語音信號的線性預測分析_第2頁
語音信號數(shù)字處理:6 語音信號的線性預測分析_第3頁
語音信號數(shù)字處理:6 語音信號的線性預測分析_第4頁
語音信號數(shù)字處理:6 語音信號的線性預測分析_第5頁
已閱讀5頁,還剩69頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第6章語音信號的線性預測分析6.2LPC的基本原理6.1概述6.4格型法及其改進6.3LPC分析的解法6.5LPC的頻域特性6.6線譜對分析6.7LPC的幾種推演參數(shù)第6章語音信號的線性預測分析(LPA)6.1概述 1947年美國科學家N.Wiener提出線性預測理論,創(chuàng)立了控制論。 1948年美國科學家C.E.Shannon提出信息的測度理論,創(chuàng)立了信息論。線性預測(縮寫:LP)線性預測分析(縮寫:LPA)LP理論:一種適用廣泛的數(shù)學理論,應用于許多領域;1967年日本學者Itakura(板倉)等將LP技術應用于語音分析和語音合成,數(shù)字語音技術獲得巨大的發(fā)展。第6章語音信號的線性預測分析 6

2、.1概述C.E.Shannon1916-2001N.Wiener1894-1964線性預測已普遍地應用于語音信號處理的各個方面。參數(shù)估計:基音周期、共振峰頻率、譜特征、聲道截面積比函數(shù)等特點:LPC能精確估計語音參數(shù),用少量參數(shù)有效表示語音,計算LPC參數(shù)較簡單。LPC基本思想:利用信號間相關性,用過去值預測現(xiàn)在或未來的值,即用過去若干個取樣值的線性組合逼近當前或將來的取樣值。在某種測度準則下,通過使實際的取樣值與預測值之間的差別達最小,確定唯一的一組預測系數(shù)。語音的LPC系數(shù):可于語音編碼、語音合成和語音識別等。LPC的基本原理和語音信號數(shù)字模型密切相關 本章內(nèi)容:LPC基本原理、計算方法以

3、及應用問題。 第6章語音信號的線性預測分析 6.1概述第6章語音信號的線性預測分析6.2LPC的基本原理 6.2.1信號模型時間序列可模型化為白噪聲序列作用于數(shù)字濾波器H(z)的輸出。H(z)通常為有理分式的形式: ,模型參數(shù):ai,bi 系數(shù), , G 增益因子。圖6.1:信號x(n)的模型化。 x(n)、X(z) 模型化的信號和其 z 變換, u(n)、U(z) 模型的激勵和其 z 變換。 z 域關系式: 時域關系式:物理意義: x(n)由其過去值及模型輸入的線性組合來預測得到。第6章語音信號的線性預測分析 6.2LPC的基本原理圖6.1信號x(n)的模型化 H(z)x(n)u(n)x(n

4、) 為零均值的隨機信號時, 系統(tǒng)的輸出、輸入關系可用相關函數(shù)或功率譜來表征 : 式中,Rxx(z) 信號 x(n) 的自相關函數(shù)的 z 變換; Ruu(z) 輸入 u(n) 的自相關函數(shù)的 z 變換。 通常,u(n) 是零均值、 方差白噪聲序列,因此有: 假設 ,則本頁第一式的變換寫成功率譜形式,有: 上式表明,信號 x(n) 的功率譜完全由濾波器的幅頻響應決定。 即系統(tǒng) H(z) 確實可以用來模型化信號 x(n)。上式是用模型參數(shù)分析法估計隨機信號的理論依據(jù)。第6章語音信號的線性預測分析 6.2LPC的基本原理信號模型分三種(按濾波器的有理分式): ARMA模型:傳遞函數(shù)含有極點和零點(零極

5、點模型) 。 (自回歸滑動平均模型) ARMA模型產(chǎn)生的序列稱為ARMA過程序列。 AR模型:傳遞函數(shù)的分子多項式為常數(shù)(全極點模型)。 (自回歸模型) 輸出只取決于過去的信號值。 AR模型產(chǎn)生的序列稱為AR過程序列。 MA模型:傳遞函數(shù)的分母多項式為常數(shù)(全零點模型)。 (滑動平均模型) 輸出只由模型的輸入來決定。 MA模型產(chǎn)生的序列稱為MA過程序列。ARMA模型是AR模型和MA模型的混合結構。 第6章語音信號的線性預測分析 6.2LPC的基本原理求解模型參數(shù)的過程通常是一個逼近過程(有精度問題)。方法是先確定極點和零點的個數(shù),然后將 u(n) 送入系統(tǒng), 得到的輸出將是 x(n) 的近似值

6、 。采用某種逼近準則,使 逼近 x(n) 。 語音信號處理中最常用的模型是全極點模型。語音信號處理中使用全極點模型的理論依據(jù): (1) 不考慮鼻音和摩擦音,則聲道傳遞函數(shù)是全極點模型; 若考慮鼻音和摩擦音,則聲道傳遞函數(shù)有極、零點。 一個零點可以用多個極點來近似,依據(jù)為: (2) 用LPC法估計全極點模型參數(shù),求解線性方程組; 而模型中含有限個零點時,則求解非線性方程組。 第6章語音信號的線性預測分析 6.2LPC的基本原理6.2.2LPC誤差濾波p 個極點的全極點模型的傳遞函數(shù)H(z): 輸入和輸出之間滿足差分方程:定義線性預測值為: 式中,a1,a2,ap LPC系數(shù)。上式稱為線性預測器,

7、預測器的階數(shù)為 p 階。 p 階線性預測器的傳遞函數(shù)有如下形式: 第6章語音信號的線性預測分析 6.2LPC的基本原理LPC誤差e(n) :信號值 x(n) 與線性預測值 之差。 e(n) 是 x(n) 通過如下系統(tǒng)轉移函數(shù)的系統(tǒng)的輸出: 稱系統(tǒng) A(z) 為LPC誤差濾波器,如圖6.2所示。 A(z) 是 AR(p) 模型 H(z) 的逆濾波器, 關系式為:設計預測誤差濾波器 A(z) 就是求解預測系數(shù), 使誤差在某個預定的準則下最小,稱為LPC分析。常用的誤差準則:均方誤差最小準則。第6章語音信號的線性預測分析 6.2LPC的基本原理圖6.2線性預測誤差濾波器 A(z)e(n)x(n) 求

8、解LPC預測系數(shù) 將方均誤差 Ee2(n) 對各個系數(shù) ai 求偏導,并令為零,得 代入 ,可推得: 將上式 代入第一式,得:上式為LPC中的重要結果,稱為正交方程。正交方程表明:預測誤差 e(n) 與信號 x(n) 的過去 p 個取樣值x(n-1), x(n-2), x(n-p) 是正交的。 第6章語音信號的線性預測分析 6.2LPC的基本原理正交方程推導正交方程的另一種形式。將 代入正交方程,整理得: 改寫為: 式中, 上式為LPC中的一個重要結果,稱為標準方程式。 p 個預測系數(shù)a1,a2,ap可通過解標準方程式得到, 求得的 p 個預測系數(shù)將使 預測誤差濾波器的輸出方均值或者輸出功率最

9、小。 第6章語音信號的線性預測分析 6.2LPC的基本原理標準方程式正向預測誤差功率:最佳預測時,誤差的最小方均值,即 因 ,代入上式,得 即:注:上式成立條件,最佳預測系數(shù)時。合并標準方程式和上式,最后得到: 稱為標準方程??山獬?p+1個未知數(shù)a1, a2, , ap, Ep。第6章語音信號的線性預測分析 6.2LPC的基本原理標準方程,p+1個線性方程,已知信號的相關函數(shù)c(j,i)。特殊情況:若信號恰為一個 p 階的過程序列, 其信號模型的傳遞函數(shù): 模型的時域 差分方程: 其中,輸入的激勵信號u(n) 是零均值、方差為 1 的白噪聲序列。改寫差分方程為: (*) 式(*) 兩邊乘 x

10、(n-j),求平均值,因Eu(n)x(n-j)=0 ,有: 式(*) 兩邊乘x(n),求平均值,類似地有: 比較上兩式與式 , 可發(fā)現(xiàn)預測系數(shù)和信號模型參數(shù)滿足相同的方程組,G2=Ep。第6章語音信號的線性預測分析 6.2LPC的基本原理結論: (1)已知模型階數(shù) p 的AR過程序列,按LPC設計A(z)時, 所得預測系數(shù)和該模型相應的模型參數(shù)有相同的值; (2)未知模型階數(shù) p ,或過程模型含零點時, 可認為LPC提供了該過程信號模型的一個估計。 LPC分析是估計隨機信號功率譜的一種有效方法。 p=有限值,預測濾波器A(z)為FIR濾波器,只有零點。 與AR(p)模型對應。p=,預測濾波器A

11、(z)有下面形式: 對應于信號模型中的ARMA過程。 第6章語音信號的線性預測分析 6.2LPC的基本原理6.2.3語音信號的LPC分析 語音序列為緩變的隨機序列,可近似用信號模型化方法分析。圖6.3:信號模型化的思想建立的語音信號的產(chǎn)生模型。將輻射、聲道、聲門激勵的譜效應簡化為時變數(shù)字濾波器, 其穩(wěn)態(tài)系統(tǒng)函數(shù)為: 語音信號x(n)被模型化 為一個過程序列。濁音激勵為準周期沖激序列,清音激勵為白噪聲序列。H(z)稱為合成濾波器。模型參數(shù):濁/清音判決、 基音周期、增益常數(shù)G、 數(shù)字濾波器參數(shù)a1,a2,ap。 第6章語音信號的線性預測分析 6.2LPC的基本原理圖6.3語音信號產(chǎn)生模型數(shù)字脈沖

12、序列發(fā)生器偽隨機噪聲產(chǎn)生器基音周期時變數(shù)字濾波器增益控制聲道參數(shù)數(shù)字語音序列x(n)求解濾波器參數(shù)和增益常數(shù)的過程稱為語音信號的LPC分析。 基本問題是從語音信號序列確定一組LPC系數(shù)。 預測系數(shù)的估計須在一短段(幀)語音信號的范圍內(nèi)進行。 激勵源問題: 清音:用模型合成語音時,產(chǎn)生的序列與和被分析序列 有相同的譜包絡特性。 濁音:激勵源 u(n) 的譜是一組幅度相同的諧波線譜, 與模型化中的信號源假設有所不同。 但激勵源 u(n) 的大部分時間的值非常?。阒担?, 由于方均預測誤差最小準則使預測誤差e(n)逼近于u(n) , 與u(n)能量很小這一事實并不矛盾。 因此,為不使問題復雜化,認為

13、模型適于清音、濁音。第6章語音信號的線性預測分析 6.2LPC的基本原理使用全極點模型進行語音信號LPC分析的主要缺點: (1) 理論上,語音是極零點模型(特別是清音和鼻音), 應該用 ARMA模型; (2) 模型中,對于濁音時,激勵源不滿足白噪聲的假設條件。近期研究,努力解決這些問題。 全極點模型求解方便,在相當廣泛的條件適于工程, 在數(shù)字語音信號處理的眾多領域得到了非常成功的應用。 第6章語音信號的線性預測分析 6.2LPC的基本原理第6章語音信號的線性預測分析6.3LPC分析的解法 求信號模型參數(shù)可以通過LPC完成; LPC系數(shù)以及預測誤差功率可從下式標準方程解出: 解線性方程組的方法有

14、多種, 以系數(shù)矩陣的特殊性質可簡化解法。標準方程的系數(shù)矩陣中, 的值取決于求數(shù)學期望的方法。 c(j,i)的定義不同,導致不同的LPC解法。經(jīng)典解法:自相關法、協(xié)方差法。第6章語音信號的線性預測分析 6.3LPC分析的解法 6.3.1自相關法假定 x(n) 在 0 n N-1以外為零( N 長加窗截取)。 截取序列為:x(0),x(1), x(N-1) ; c(j,i)是加窗的信號序列x(n)的自相關函數(shù) r(j-i),即: 將r(j,i)代入標準方程中,寫成矩陣形式,得: 式中,預測系數(shù) ai 用 ap,i代替(p 特指是 p 階預測系數(shù))。上式稱為YuleWalker(尤利沃爾克)方程。

15、第6章語音信號的線性預測分析 6.3LPC分析的解法 特點:主對角線和與主對角線平行的斜對角線上, 該方程組的系數(shù)矩陣的元素相同,具有這樣性質的矩陣稱為Toeplitz(托普利茲)矩陣;同時該系數(shù)矩陣是對稱矩陣。 利用對稱Toeplitz矩陣性質,YuleWalker方程可用LevinsonDurbin(萊文遜杜賓)遞推算法高效地求解。 算法的計算復雜度為 O(p2)(一般解法復雜度為 O(p3))。設已知 p-1 階YuleWalker方程的解為: 則有:由方程的系數(shù)矩陣的對稱特點知,將 p 階和 p-1 階兩方程中 后面兩個列矢量倒置,再代入到原方程中,等式保持不變。第6章語音信號的線性預

16、測分析 6.3LPC分析的解法 由方程的系數(shù)矩陣的對稱特點知,將 p 階和 p-1 階兩方程中 后面兩個列矢量倒置,再代入到原方程中,等式保持不變。第6章語音信號的線性預測分析 6.3LPC分析的解法 設 p 階方程的解為 p-1 階方程解的一種線性組合:第6章語音信號的線性預測分析 6.3LPC分析的解法 并代入 p階方程,得:p階方程為第6章語音信號的線性預測分析 6.3LPC分析的解法 則可得求解方法:必須有:且第6章語音信號的線性預測分析 6.3LPC分析的解法 要使左式為待求方程式(見上頁)的解,要求下式右邊的矢量,除第一個元素外,均為零。需通過選擇 kp,使其滿足 q-kpEp-1

17、=0 即: kp=q/Ep-1 。由上頁結果,可推出: 將上式代入解表達式得LPC系數(shù)的遞推公式為: 第6章語音信號的線性預測分析 6.3LPC分析的解法 計算量:乘法 (p2-p)/2 次, 除法 p 次。計算量:乘法 (p2-p)/2 次。比較上面兩個方程,知:在每次遞推求解過程中,系數(shù) ki, i=1,2,p 起到關鍵作用。理論分析:ki 為無損級聯(lián)聲管的反射系數(shù)或偏相關系數(shù)。以上三式是LevinsonDurbin的遞推公式。LevinsonDurbin的計算量:乘法 p2 次,除法 p 次。第6章語音信號的線性預測分析 6.3LPC分析的解法 計算量:乘法 p 次。由上頁結果,可推出:

18、 將上式代入解表達式(見上頁),得LPC系數(shù)的遞推公式為: 比較上面兩個方程,知:在每次遞推求解過程中,系數(shù) ki, i=1,2,p 起到關鍵作用。理論分析:ki 為無損級聯(lián)聲管的反射系數(shù)或偏相關系數(shù)。以上三式是LevinsonDurbin的遞推公式。LevinsonDurbin的計算量:乘法 p2 次,除法 p 次。第6章語音信號的線性預測分析 6.3LPC分析的解法 計算量:乘法 (p2-p)/2 次, 除法 p 次。計算量:乘法 (p2-p)/2 次。計算量:乘法 p 次。LevinsonDurbin算法的遞推步驟: (1) 初始化: ; (2) 已知p-1階預測器的參數(shù): ; (3)

19、計算 p 階預測器的反射系數(shù): (4) 計算 p 階預測器的預測參數(shù)和誤差能量: (5) 返回第(2)步。 當遞推過程達到指定的階數(shù)時,終止計算。計算得三類結果:各階預測器的預測系數(shù); 各階預測器的反射系數(shù); 各階預測器的預測誤差功率 。第6章語音信號的線性預測分析 6.3LPC分析的解法 從式 可以得到:結論:(1) 最小預測誤差能量 Ep 0,且隨階數(shù) p 增大而減小。 (2)反射系數(shù) ki 滿足: (3) 時,系統(tǒng)穩(wěn)定;H(z) 的根在單位圓內(nèi)。第6章語音信號的線性預測分析 6.3LPC分析的解法 6.3.2協(xié)方差法自相關法定義 c(j,i) 為: 需 N 個 x(n) 樣本:x(0),

20、 x(1), , x(N-1), 可加窗;協(xié)方差法定義 c(j,i) 為: 需 N+p 個 x(n) 樣本: x(-p), x(-p+1), , x(N-1) 或定義 c(j,i) 為: 需 N 個 x(n) 樣本:x(0), x(1), , x(N-1); 此時,預測誤差在 p, N-1 范圍內(nèi)為最小。嚴格講,協(xié)方差法定義的 c(j,i) 是: 兩個相似的信號序列段間的互相關函數(shù)。相關函數(shù)的微小的不同,使LPC方程組解法有很大不同。第6章語音信號的線性預測分析 6.3LPC分析的解法 將標準方程 寫成矩陣形式: 協(xié)方差法不需要加窗,計算精度大大提高。缺點:不保證 ,即不保證系統(tǒng)的穩(wěn)定性; 進

21、行線性預測時,需隨時判定 H(z) 的極點位置, 并加以修正,才能得到穩(wěn)定的結果。第6章語音信號的線性預測分析 6.3LPC分析的解法 對稱系數(shù)矩陣,不具有Toeplitz性質。自相關法的求解捷徑無效,而需要新的解法。 Choleskey(喬里斯基)分解法解協(xié)方差方程: 將標準方程式 中的第一個寫成矩陣形式: 式中,C 是 pp 階正定對稱矩陣,A 和 B 是列矢量:正定性的系數(shù)矩陣 C 可分解為: 式中,V 是下三角矩陣,主對角元素=1;D 是對角矩陣:第6章語音信號的線性預測分析 6.3LPC分析的解法 令式 兩邊的第 (i, j) 項元素相等,可得: 解得: 確定矩陣 V 和 D 后,分

22、兩步確定列矢量 A。 由 得: , 令: , 有: 或:第6章語音信號的線性預測分析 6.3LPC分析的解法 利用該組式,可得遞推解法。 (1) 由 解得矢量 Y 元素: (2) 由 ,解得矢量 A 元素: 上兩式與下式構成Choleskey分解法的計算過程。分析計算量:以上三式均需1/di,計算一次需 p 次除法; 分析乘法量:Choleskey分解法的計算量:乘法 (p3+9p2-10p)/6 次, 除法 p 次。第6章語音信號的線性預測分析 6.3LPC分析的解法 計算量:乘法 (p2-p)/2 次。計算量:乘法 (p3+3p2-4p)/2 次。計算量:乘法 (p2-p)/2 次。6.3

23、.3自相關法與協(xié)方差法的比較自相關法適應于平穩(wěn)信號,協(xié)方差法適用于非平穩(wěn)信號。由經(jīng)驗可知,對摩擦音,自相關法較好; 對于周期性語音,協(xié)方差法較好。 LevinsonDurbin和Choleskey均可有效求解相關方程。自相關法略微簡單一些。 自相關法時需要用窗函數(shù)截取信號,引入了誤差, 求解精度不高,這是自相關法本質性的缺點。協(xié)方差法無需加窗處理,計算精度大大提高,所得到的協(xié)方差系數(shù)能更精確地代表語音信號。協(xié)方差法的主要缺點:可能會產(chǎn)生不穩(wěn)定的逆濾波器。 第6章語音信號的線性預測分析 6.3LPC分析的解法 第6章語音信號的線性預測分析6.4格型法及其改進 1970年代初,板倉(Itakura

24、)提出預測逆濾波器的格型結構。格型法特點:在運算中不需要窗函數(shù)加權,同時保證解的 穩(wěn)定性,較好解決了精度和穩(wěn)定性間的矛盾。提出正向預測和反向預測概念,增加了選擇方均誤差準則的 靈活性,衍生出系列格型結構的新的LPC算法。Burg從最大熵譜分析的觀點也得到了相似和等價的結果。格型法運算量:比自相關法或協(xié)方差法大 4 倍左右。Makhoul提出改進的協(xié)方差格型法: 該方法可使運算量恢復到自相關法或協(xié)方差法的水平, 同時保持較高的精度和解的穩(wěn)定性。 第6章語音信號的線性預測分析 6.4格型法及其改進 6.4.1格型法基本原理定義:正向預測和反向預測的概念。LevinsonDurbin算法遞推到第 p

25、 階的預測系數(shù):定義: p 階LPC誤差濾波器為: Ap(z) 的輸入信號為x(n),輸出預測誤差為 e(n)= ep(n),有: 時域關系: z 域關系:第6章語音信號的線性預測分析 6.4格型法及其改進 由LevinsonDurbin遞推算法知, p 階預測器的遞推解可寫為: (見前面推導) 式兩邊左乘 ,得: 即:將上式代入式 中,得:式中,Bp(z) 及其逆 z 變換 bp(n) 為: 第6章語音信號的線性預測分析 6.4格型法及其改進 定義:正向預測誤差 fp(n)的 z 變換為Fp(z)= Ep(z)。定義:反向預測誤差 注:f,F 表示正向, b,B 表示反向。 圖6.4:兩種預

26、測示意圖。第6章語音信號的線性預測分析 6.4格型法及其改進 圖6.4前向預測和反向預測的圖示正向預測用于正向預測的 p 個樣本用于反向預測的 p 個樣本反向預測推導格型濾波器的結構。由前面知: Fp(z)的逆 z 變換為:將式 (將變換 z 用 z-1 替代) 代入式 ,得: Bp(z)的逆 z 變換為:當 p=0時,由正向預測誤差和反向預測誤差的定義式,得:注:上面三個綠色公式是構造格型濾波器的關鍵式。第6章語音信號的線性預測分析 6.4格型法及其改進 綜合上頁三個關系式,得遞推關系:上式是構造格型(分析)濾波器的重要表達式。圖6.5:格型分析濾波器的結構。波濾器的輸入為信號 x(n),

27、輸出為正向預測誤差x(n) ,亦即預測誤差 e(n) 。第6章語音信號的線性預測分析 6.4格型法及其改進 圖6.5格型分析濾波器輸入x(n) b0(n) b1(n) b2(n) bp1(n) f0(n) f1(n) f2(n) fp1(n) 誤差k1k1z1k2k2z1z1kpe(n)=fp(n)上頁三個關系式可改寫為:上式是構造格型(合成)濾波器的重要表達式。圖6.6:格型合成濾波器的結構。 格型合成濾波器可用于數(shù)字語音模型中的合成濾波器 H(z)。格型濾波器由 p 節(jié)構成,關鍵參數(shù)僅為反射系數(shù) ki。第6章語音信號的線性預測分析 6.4格型法及其改進 圖6.6格型合成濾波器z-1z-1z

28、-1語音輸出x(n)輸入u(n)=fp(n) bp-1(n) b2(n) b1(n) b0(n)-k1k1-k2k2kp fp-1(n) f2(n) f1(n) f0(n)6.4.2格型法求解可設計出多種最優(yōu)準則(規(guī)則)求解反射系數(shù), 衍生出多種格型法求解算法。根據(jù)格型的結構形式特點,分別定義: 正向方均誤差: 反向方均誤差: 交叉方均誤差: 依據(jù)三種方均誤差定義,所衍生出的幾種常用的格型法: 1正向格型法 4Burg(伯格)法 2反向格型法 5協(xié)方差格型法 3幾何平均格型法第6章語音信號的線性預測分析 6.4格型法及其改進 1正向格型法逼近準則:使第 p 節(jié)正向方均誤差 epf(n) 為最小

29、。令 ,利用正向預測誤差定義式 得: 即:在實際運算時總是用時間平均近似代替集合平均。 為提高計算精度,可不限制 x(n) 的長度范圍,上式可寫成:第6章語音信號的線性預測分析 6.4格型法及其改進 2反向格型法逼近準則:使第 p 節(jié)反向方均誤差 epb(n) 為最小。令 ,利用反向預測誤差定義式 得: 即:在實際運算時總是用時間平均近似代替集合平均。 為提高計算精度,也不限制 x(n) 的長度范圍,上式可寫成:第6章語音信號的線性預測分析 6.4格型法及其改進 3幾何平均格型法該方法不采用逼近準則,而采用逼近規(guī)則。定義:反射系數(shù)為epf(n) 和epb(n)的幾何平均值: 整理得: 式中,s

30、gn(x) 是取 x 的符號函數(shù)。 這種方法確定的反射系數(shù)保證合成系統(tǒng)是穩(wěn)定的??勺C明: 第6章語音信號的線性預測分析 6.4格型法及其改進 4 Burg(伯格)法逼近準則:使第 p 節(jié)epf(n)+epb(n)為最小。令 ,利用正、反向預測誤差式,得: 即: 或:這種方法確定的反射系數(shù)將保證合成系統(tǒng)是穩(wěn)定的??勺C明:第6章語音信號的線性預測分析 6.4格型法及其改進 5協(xié)方差格型法格型法計算量:大(約為自相關法或協(xié)方差法的4倍以上 ) 需要算:fp(n)、bp(n)、kp、LPC系數(shù)。 特點:多次調用相同的語音取樣值,可簡化計算的可能。協(xié)方差格型法:格型法的改進算法,可減少運算量。改進思路:

31、去掉 c(i,j) 中冗余計算,化簡預測誤差的計算。 仍可以不同誤差準則求解,既保持格型法的靈活性、 解的穩(wěn)定性和精確性,又使運算量與自相關法相當。第6章語音信號的線性預測分析 6.4格型法及其改進 協(xié)方差c(i,j)的定義式: 或:考慮對稱性,約定僅使用 c(i,j),ij。利用 c(i,j) 與 c(i-1,j-1) 之間的關系,減少計算量。當信號 x(n) 的長度定義在 -p n N-1內(nèi)時,有: 得:當信號 x(n) 的長度定義在0 n N-1內(nèi)時,有: 得:結合上面兩綠式,得 c(i,j) 與 c(i-1,j-1) 之間的關系式見下面第6章語音信號的線性預測分析 6.4格型法及其改進

32、 兩式相減兩式相減將上式分別代入各預測誤差表達式,化簡后得: 第6章語音信號的線性預測分析 6.4格型法及其改進 協(xié)方差格型法的求解分為四個主要步驟:(1) 利用式 由輸入信號 x(n) 計算所需要的協(xié)方差c(i,j);(2) 利用下式計算預測誤差:(3) 利用格型法求解反射系數(shù):ki;(4) 計算LPC系數(shù):ap,i。協(xié)方差格型法的實際運算量可以大幅度下降。第6章語音信號的線性預測分析 6.4格型法及其改進 6.4.3各種LPC分析方法的比較分析:(經(jīng)分析) 運算量:協(xié)方差法的運算量略高于自相關法。 格型法的運算量與協(xié)方差法相近。 穩(wěn)定性:自相關法、格型法可保穩(wěn)定,協(xié)方差法不保穩(wěn)定。 實際參

33、數(shù)時,協(xié)方差法基本保穩(wěn)定。第6章語音信號的線性預測分析 6.4格型法及其改進 表6.1LPC分析方法的性能比較性 能自相關法協(xié)方差法格型法協(xié)方差格型法窗口函數(shù)需要不需要不需要不需要穩(wěn)定性可以保證不能保證可以保證可以保證有限字長時的穩(wěn)定性不能保證不能保證可以保證可以保證計算相關函數(shù)乘法運算量pNpN解其它參數(shù)乘法運算量p23p2/2+p3/65pNpN+2p2+p3/2解其它參數(shù)除法運算量pppp參數(shù)精度最差最好很好很好第6章語音信號的線性預測分析6.5LPC的頻域特性 6.5.1最小預測誤差的頻域解釋 x(n) 語音信號, e(n)預測誤差; A(z), A(ej) 預測誤差濾波器; H(z)

34、,H(ej) 合成濾波器; 則有:設:X(ej) = F x(n), E(ej) = F e(n)。 由Parseval定理,得:第6章語音信號的線性預測分析 6.5LPC的頻域特性 因 是用全極點模型求得的語音譜 的估計 ,即有:上頁式寫成: min Ee2(n) 等效于語音譜與全極點模型估計譜的 比值的積分值最小。頻域上,LPC的原理:給定語音信號的譜 , 期望用一個 p 階全極點濾波器作為其模型, 該模型輸出的譜 使其比值的積分最小。第6章語音信號的線性預測分析 6.5LPC的頻域特性 定義:預測誤差信號的譜平坦度:譜平坦度 f 是指譜的幾何均值與算術均值之比,0 f 1。 恒定譜的平坦

35、度等于 1。min Ee2(n) 可以看成是使 Ee2(n) 的譜最平坦, 或者說具有最大的譜平坦度。第6章語音信號的線性預測分析 6.5LPC的頻域特性 6.5.2LPC譜估計LPC分析:可看成用全極點譜逼近語音信號譜的譜匹配問題, 也是用全極點模型估計語音信號的譜的譜估計問題。LPC分析:是求解信號模型參數(shù)的有效的方法, 也是估計隨機信號功率譜的有效方法。語音模型的 H(z) 是聲道響應、聲門激勵及輻射組合效應的 模型,它使用全極點形式。若語音信號 x(n) 確實是一個 p 階AR過程,則LPC分析的預測系數(shù)恰好等于 H(z) 的參數(shù),且有: 式中, H(ej) 是模型 H(z) 的頻率響

36、應,簡稱為LPC譜。第6章語音信號的線性預測分析 6.5LPC的頻域特性 語音信號并非 p 階AR過程,LPC應理解為語音的譜估計。 多數(shù)輔音(清音)和鼻音,應用極零點模型表示; 一個零點能夠用無窮多個極點來逼近, 即極零模型可用無窮高階的全極點模型來逼近。語音信號應為ARMA過程,但階數(shù)足夠大,全極點模型譜則以任意小的誤差逼近語音信號譜,即: 注:p,表明成立式: 因相位的因素,但不一定成立式:圖6.6:元音 ou 的LPC譜實例。第6章語音信號的線性預測分析 6.5LPC的頻域特性 圖6.7元音ou的信號功率譜和LPC譜圖6.8:元音段 的LPC譜和語音信號譜的比較。 信號譜由FFT分析得

37、到; LPC譜: Hamming窗, 14 階,自相關法; 該信號的譜有很好的諧波結構; 在信號譜的峰值處,LPC譜和信號譜匹配良好; 在信號譜的谷底處,LPC譜和信號譜匹配較差;濁音語音譜,在諧波成分處 匹配效果要遠比諧波之間好得多。原因:源于方均誤差最小的準則, 譜值大時誤差要小。第6章語音信號的線性預測分析 6.5LPC的頻域特性 圖6.8LPC譜與實際譜的比較階數(shù) p 的選擇:從譜估計精度、計算量、存儲量等綜合考慮, 與LPC求解方法無關。 一般原則:先保證足夠的極點模擬聲道響應的諧振結構。 通常,每kHz兩個極點(或共軛極點)表征聲道響應, 需 34 個極點逼近可能的零點、聲門激勵和

38、輻射效應。 10 kHz取樣時,要求1224階數(shù)。圖6.9:歸一化預測誤差與 p 的變化曲線。 p 增加,預測誤差趨于下降, p=1214 時,誤差變化基本趨于平緩。 清音比濁音的歸一化預測誤差高得多, 即濁音時估計精確。 p 增加,LPC譜有更多的信號譜細節(jié)。若譜估計關注聲道諧振特性,取 p=1214。第6章語音信號的線性預測分析 6.5LPC的頻域特性 圖6.9歸一化預測誤差與階數(shù) p 的變化關系4 8 12 14 16 p1.00.80.60.40.20歸一化預測誤差清音濁音幀長 N 的選擇: (N 小,則求解LPC參數(shù)的計算量?。┳韵嚓P法:一般 N 不低于兩個基音周期,為 20 30

39、ms。協(xié)方差法和斜格法: 因無需加窗,理論上幀長小到什么程度沒有實際限制, 但是估計譜的精度隨著 N 的增加而提高。一般,幀長 N 取 23 個基音周期才是合理的 語音信號譜的高頻分量小,常采用預加重提高之。第6章語音信號的線性預測分析 6.5LPC的頻域特性 6.5.3LPC倒譜聲道模型的系統(tǒng)函數(shù)H(z): H(z) 的激勵響應為 h(n)。先求序列 h(n) 的倒譜 。根據(jù)同態(tài)處理方法,有: 因 H(z) 是最小相位的(單位圓內(nèi)解析),故 可展開: 即存在 的逆變換 ,且 。將 對 z-1 求導數(shù),考慮到上 3 式,經(jīng)整理得:由恒等式,得:第6章語音信號的線性預測分析 6.5LPC的頻域特

40、性 倒譜的遞推公式,基于 LPC 預測系數(shù)推得,稱為 LPC 倒譜。利用了最小相位特性,避免相位卷繞問題。 分析倒譜,可分別估計語音信號短時譜包絡和聲門激勵參數(shù)。估計語音信號的短時譜包絡的方法有:(1) 按式 ,從LPC系數(shù)估計短時譜包絡;(2) 對信號作FFT、對數(shù)變換,后求逆FFT,用適當?shù)妮o助因子 獲得倒譜,并用低時窗取出譜包絡信息。(3) 從LPC倒譜求短時譜包絡。 圖6.10:三種短時譜包絡的實例。 FFT和LPC倒譜法的頻譜包絡接近, 后者比前者更好地重現(xiàn)譜的峰值。它們都比直接從LPC系數(shù)導出 的頻譜包絡要平滑得多。LPC倒譜法運算量小。第6章語音信號的線性預測分析 6.5LPC的

41、頻域特性 圖6.10不同方法求得的頻譜包絡比較LPC系數(shù)求得的譜包絡LPC倒譜求得的譜包絡FFT倒譜求得的譜包絡短時譜 相對幅度第6章語音信號的線性預測分析6.6線譜對分析 線譜頻率(LSF):與LPC系數(shù)、反射系數(shù)等價的另一種 系數(shù)。也稱為線譜對(LSP)。 LSP 是頻域參數(shù),與語音信號譜包絡的峰有更緊密的聯(lián)系。 LSP優(yōu)點:其合成濾波器與反射系數(shù)一樣,易保證穩(wěn)定性, 而參數(shù)的量化和內(nèi)插特性均優(yōu)于反射系數(shù), 使相同質量的合成語音所需的數(shù)碼率得以降低。LSP缺點: 運算量較大。 第6章語音信號的線性預測分析 6.6線譜對分析 6.6.1線譜對分析原理p 階LPC誤差濾波器的傳遞函數(shù)為:定義:

42、 p+1 階多項式: 則:不難看出,P(z) 相當于 kp+1=-1 時的 Ap+1(z), Q(z) 相當于 kp+1=1 時的 Ap+1(z)??勺C明:A(z) 的零點在 z 平面單位圓內(nèi)時, P(z)和Q(z)的零點 都在單位圓上,并且沿單位圓上隨 的增加交替出現(xiàn)。第6章語音信號的線性預測分析 6.6線譜對分析 P(z)是對稱實系數(shù)的 p+1 階 多項式,以-1為根; Q(z)是反對稱實系數(shù)的 p+1 階多項式,以+1為根。即:設: 易得系數(shù)間的關系為: 若 p 是偶數(shù),設 P(z) 的零點為 , Q(z) 的零點為 , 則 P(z) 和 Q(z) 可寫成因式分解形式: i、i 的值排列

43、為: i和 i 成對出現(xiàn),反映了譜的特性,稱之為線譜對(LSP)。第6章語音信號的線性預測分析 6.6線譜對分析 P(z)、Q(z)的系數(shù)也是對稱的;且0=0=0。為共軛復根:其基本因式:當 p 為奇數(shù)時,可以同樣求得LSP參數(shù)的表達式。 P(z)、Q(z)的零點互相分離,是合成濾波器穩(wěn)定的充要條件;即:在單位圓上, P(z) 和 Q(z)不可能同時為零。LSP參數(shù)和語音譜特性之間有密切的聯(lián)系。 語音譜可由LPC模型譜來估計,而LPC譜可以寫成: 若i 和 i 很靠近,則當 接近這些頻率時, 變小, 顯強諧振特性,語音譜包絡在這些頻率處出現(xiàn)峰值。LSP分析是用 p 個離散頻率 i 和 i 的分

44、布密度 表示語音信號譜特性的一種方法。第6章語音信號的線性預測分析 6.6線譜對分析 分析: 1. 當 接近 0 或 i,i=1,2,.時,括號內(nèi)的第一項接近于零; 2. 當 接近 或 i,i=1,2,.時,括號中第二項接近于零。一般不直接利用LSP參數(shù)去構成聲道模型參數(shù)。 主要原因: 用LPC系數(shù)構成聲道模型參數(shù)比較容易, LSP參數(shù)與聲道模型的 z 域表示是隱性關系, LPC系數(shù)到LSP參數(shù)的轉換是可逆的。 LPC參數(shù)廣泛應用于各種語音編碼、語音合成和語音識別等應用領域中。實驗表明:表達LPC參數(shù)的最有效方式為LSP參數(shù)。 一個LSP參數(shù)的誤差僅僅影響全極點模型中鄰近這個參數(shù) 對應頻率處的語音譜,而不影響其他地方。 對敏感頻率段對應的LSP參數(shù)分配較多的比特數(shù), 對

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論