第七講VQ語(yǔ)音信號(hào)處理第4章_第1頁(yè)
第七講VQ語(yǔ)音信號(hào)處理第4章_第2頁(yè)
第七講VQ語(yǔ)音信號(hào)處理第4章_第3頁(yè)
第七講VQ語(yǔ)音信號(hào)處理第4章_第4頁(yè)
第七講VQ語(yǔ)音信號(hào)處理第4章_第5頁(yè)
已閱讀5頁(yè),還剩36頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

回顧失真測(cè)度最佳矢量量化器和碼本設(shè)計(jì)降低復(fù)雜度的矢量量化系統(tǒng)語(yǔ)音參數(shù)的矢量量化第四章矢量量化回顧矢量量化(VQ,VectorQuantization)是一種極其重要的信號(hào)壓縮方法。VQ在語(yǔ)音信號(hào)處理中占十分重要的地位。廣泛應(yīng)用于語(yǔ)音編碼、語(yǔ)音識(shí)別和語(yǔ)音合成等領(lǐng)域。凡是要用量化的地方都可以采用矢量量化。矢量量化研究的目的?

針對(duì)特定的信息源和矢量維數(shù),設(shè)計(jì)出一種最優(yōu)化的量化器,在R(量化速率)一定的情況下,給出的量化失真盡可能接近D(R)(最小量化失真)。術(shù)語(yǔ)碼本Codebook碼字CodeWord碼本大小CodebookSizeVoronoiCell胞腔矢量量化研究的目的?

針對(duì)特定的信息源和矢量維數(shù),設(shè)計(jì)出一種最優(yōu)化的量化器,在R(量化速率)一定的情況下,給出的量化失真盡可能接近D(R)(最小量化失真)。圖7-2矢量量化系統(tǒng)的組成4.3矢量量化的失真測(cè)度

失真測(cè)度(距離測(cè)度):是將輸入矢量Xi用碼本重構(gòu)矢量Yi來表征時(shí)所產(chǎn)生的誤差或失真的度量方法,它可以描述兩個(gè)或多個(gè)模型矢量間的相似程度。

失真測(cè)度是矢量量化和模式識(shí)別中一個(gè)十分重要的問題,選擇合適與否直接影響系統(tǒng)的性能。失真度選擇必須具備的特性必須在主觀評(píng)價(jià)上有意義,即小的失真應(yīng)該對(duì)應(yīng)于好的主觀語(yǔ)音質(zhì)量;必須是易于處理的,即在數(shù)學(xué)上易于實(shí)現(xiàn),這樣可以用于實(shí)際的矢量量化器的設(shè)計(jì);平均失真存在并且可以計(jì)算;易于硬件實(shí)現(xiàn)失真測(cè)度主要有均方誤差失真測(cè)度(即歐氏距離)、加權(quán)的均方誤差失真測(cè)度、板倉(cāng)-齋藤(Itakura-Saito)距離,似然比失真測(cè)度等,還有人提出的所謂的“主觀的”失真測(cè)度。一、歐氏距離-均方誤差

設(shè)輸入信號(hào)的某個(gè)K維矢量X,與碼書中某個(gè)K維矢量Y進(jìn)行比較,xi,yi分別表示X和Y中的各元素,則定義均方誤差為歐氏距離:幾種其他常用的歐氏距離:r方平均誤差

2.r平均誤差3.絕對(duì)值平均誤差4.最大平均誤差二、線性預(yù)測(cè)失真測(cè)度用全極模型表示的線性預(yù)測(cè)方法,廣泛應(yīng)用于語(yǔ)音信號(hào)處理中。它在分析時(shí)得到的是模型的預(yù)測(cè)系數(shù).僅由預(yù)測(cè)系數(shù)的差值,不能完全表征這兩個(gè)語(yǔ)音信息的差別。應(yīng)該直接由這些系數(shù)所描述的信號(hào)模型的功率譜來進(jìn)行比較。當(dāng)預(yù)測(cè)器的階數(shù),信號(hào)與模型完全匹配時(shí),信號(hào)功率譜為:信號(hào)的功率譜預(yù)測(cè)誤差能量預(yù)測(cè)逆濾波器的頻率響應(yīng)相應(yīng)的,設(shè)碼書中某重構(gòu)矢量的功率譜為則定義Itakura-Saito距離為這種失真測(cè)度是針對(duì)線性預(yù)測(cè)模型、用最大似然準(zhǔn)則推導(dǎo)出來,所以特別適用于LPC參數(shù),描述語(yǔ)音信號(hào)的情況,常用于LPC編碼中。我們由此又推導(dǎo)出兩種線性預(yù)測(cè)色失真測(cè)度,他們比上述具有更好的性能,即對(duì)比似然比失真測(cè)度模型失真測(cè)度注:這兩種失真測(cè)度都僅僅比較兩矢量的功率譜,而沒有考慮其他能量信息。三、識(shí)別失真測(cè)度失真測(cè)度的定義加權(quán)因子輸入信號(hào)矢量的歸一化能量碼書重構(gòu)矢量的歸一化能量當(dāng)兩矢量的能量接近時(shí)(即),忽略能量差異引起的影響;當(dāng)兩矢量能量相差很大時(shí),即進(jìn)行線性加權(quán);而當(dāng)能量差超過門限時(shí),則為固定值4.4

最佳矢量量化器和碼本的設(shè)計(jì)最佳設(shè)計(jì)就是使失真最小1、最佳劃分2、最佳碼書一、矢量量化器最佳設(shè)計(jì)的兩個(gè)條件最佳矢量量化器滿足的兩個(gè)必要條件1)Voronoi分割條件(最近鄰準(zhǔn)則)對(duì)信號(hào)空間的分割應(yīng)滿足根據(jù)該條件可以對(duì)信號(hào)空間進(jìn)行最佳劃分,得到的稱為一個(gè)胞腔2)Centroid質(zhì)心條件子空間分割固定后,Voronoi胞元的質(zhì)心就是量化器的碼字對(duì)于一般的失真測(cè)度和信源分布,很難找到質(zhì)心的計(jì)算方法,但對(duì)于一般的分布和常用的均方失真測(cè)度,可以證明是中包含的矢量個(gè)數(shù)二、LBG算法K-meansclusteringalgorithm1980年由Linde,Buzo和Gray提出,它是標(biāo)量量化器中Lloyd算法的推廣,在矢量量化中是一個(gè)基本算法。LBG算法由于其理論上的嚴(yán)密性、應(yīng)用上的簡(jiǎn)便性以及較好的設(shè)計(jì)效果,得到了廣泛的應(yīng)用,并常被作為各種改進(jìn)算法的基礎(chǔ)LBG算法步驟第一步:初始化給出訓(xùn)練VQ碼書所需的全部參考矢量X,X的集合用S表示;設(shè)定量化級(jí)數(shù),失真控制門限,算法最大迭代次數(shù)L以及初始碼書;設(shè)總失真;迭代次數(shù)的初始化為m=1第二步:迭代2)計(jì)算失真:1)根據(jù)最近鄰準(zhǔn)則將S分成N個(gè)子集,,┅,,即當(dāng)時(shí),下式成立:4)計(jì)算相對(duì)失真改進(jìn)量:3)計(jì)算新碼字將與失真門限值進(jìn)行比較。若則轉(zhuǎn)入6)否則轉(zhuǎn)入5);5)若則轉(zhuǎn)至6),否則m加1,轉(zhuǎn)至1)第三步:結(jié)束6)得到最終的訓(xùn)練碼書,并輸出總失真為了避免迭代算法無(wú)限制循環(huán)下去,這里設(shè)置了兩個(gè)閾值參數(shù):最大迭代次數(shù)L和失真控制門限。的值設(shè)得遠(yuǎn)小于1,當(dāng)時(shí),表明再進(jìn)行迭代運(yùn)算失真得減小是有限的、可以停止運(yùn)算。L是限制迭代次數(shù)的參數(shù),防止設(shè)置較低時(shí)迭代次數(shù)過多三、初始碼書的選擇隨機(jī)選取法分裂法分裂法0.01~0.05降低復(fù)雜度的矢量量化系統(tǒng)()知識(shí)擴(kuò)展)矢量量化系統(tǒng)主要由編碼器和譯碼器組成:編碼器主要由碼書搜索算法和碼書構(gòu)成譯碼器由查表方法和碼書構(gòu)成

矢量量化器的研究主要圍繞降低速率、減少失真和降低復(fù)雜度展開。

降低復(fù)雜度的設(shè)計(jì)方法大致分為兩類:一類是無(wú)記憶的矢量量化器另一類是有記憶的矢量量化器一、無(wú)記憶的矢量量化系統(tǒng)無(wú)記憶矢量量化是指量化每一個(gè)矢量時(shí)都不依賴于此矢量前面的其他矢量,即每一個(gè)矢量都是獨(dú)立量化的。1、全搜索矢量量化器

前面我們介紹的LBG算法,在進(jìn)行VQ編碼時(shí),采用的就是全搜索法,即對(duì)于每個(gè)輸入矢量,比較它與每一個(gè)碼書中的碼字的失真,并將失真最小的碼字標(biāo)號(hào)作為輸出2.樹形搜索的矢量量化系統(tǒng)樹形搜索是減少矢量量化計(jì)算量的一種重要方法。

它又分為二叉樹和多叉樹兩種:

碼字不象普通的碼字那樣隨意放置,而是排列在一棵樹的接點(diǎn)上,如圖所示,碼本尺寸為M=8的二叉樹,它的碼本中共包含14個(gè)碼字。輸入矢量X先與Y0和Y1比較,計(jì)算出失真d(X,Y0)和d(X,Y1)。如果后者較小,則走下面支路,同時(shí)送出“1”,同理,如果最后達(dá)到Y(jié)101,則送出的輸出角標(biāo)101。這就是矢量量化的過程。表7-1二叉樹與全搜索的比較失真運(yùn)算量比較運(yùn)算量存儲(chǔ)容量最佳程度全搜索M=8M=8M=8全體二叉樹2log2M=62log2M=32(M-1)=14局部二叉樹搜索的主要優(yōu)點(diǎn)是計(jì)算量有很大減少而性能下降并不多,但存儲(chǔ)量增加。2.多級(jí)矢量量化系統(tǒng)多級(jí)矢量量化器由若干級(jí)矢量量化器級(jí)聯(lián)而成,因而又稱級(jí)聯(lián)矢量量化器。多級(jí)矢量量化不僅可以減少計(jì)算量還可以減少存儲(chǔ)量。多級(jí)矢量量化器由若干個(gè)小碼書構(gòu)成。圖7-5兩級(jí)矢量量化系統(tǒng)工作框圖及碼書訓(xùn)練先采用一個(gè)小的碼書,其長(zhǎng)度為M1,用它來逼近輸入信號(hào)矢量;然后再用第二個(gè)小碼書,其長(zhǎng)度為M2,用它來對(duì)第一次的誤差進(jìn)行編碼;輸入矢量與第一級(jí)匹配,得到其地址編號(hào)i,然后在第二級(jí)碼書中搜索與這個(gè)誤差矢量最佳匹配的矢量,得到其地址編號(hào)j,將和同時(shí)發(fā)送出去,在接受端根據(jù)和

來恢復(fù)原來的矢量,由于每本碼書的體積較小,所以采用全搜索法二、有記憶的矢量量化系統(tǒng)在量化每一個(gè)輸入時(shí),不僅與此矢量本身有關(guān),而且也與前面的矢量有關(guān)。有記憶矢量量化系統(tǒng)反饋矢量量化自適應(yīng)矢量量化分類:預(yù)測(cè)矢量量化PVQ(PredictiveVQ)有限狀態(tài)矢量量化FSVQ(Finite-StateVQ)自適應(yīng)矢量量化(AdaptiveVQ)是采用多個(gè)碼書,量化時(shí)根據(jù)輸入矢量的不同特征采用不同的碼書。實(shí)際例子:語(yǔ)音參數(shù)的矢量量化語(yǔ)音參數(shù)的矢量量化——將語(yǔ)音信號(hào)經(jīng)過分析,得到各種參數(shù),然后再將這些按幀分析所得的參數(shù)構(gòu)成矢量,進(jìn)行矢量量化。線性預(yù)測(cè)系數(shù)的矢量量化是人們最關(guān)心的問題。例:線性預(yù)測(cè)編碼的矢量量化器(VQLPC)聲碼器。圖7-7800b/s的VQLPC聲碼器框圖對(duì)線性預(yù)測(cè)系數(shù)采用了矢量量化,而其余參數(shù)均采用差值標(biāo)量量化(了解)模糊c均值聚類算法目標(biāo)函數(shù)為如下式所示:

式4-33根據(jù)目標(biāo)函數(shù)的模糊c均值類聚算式如下:

式4-34模糊矢量量化碼本估計(jì)的步驟如下:1)設(shè)定初始碼本和每個(gè)碼字的初始隸屬度函數(shù),為了方便可以令每個(gè)碼字的初始隸屬度函數(shù)為相等的值;2)對(duì)于訓(xùn)練觀察矢量序列,利用式(4-34)計(jì)算新的聚類中心及新的隸屬度函數(shù);3)利用式(4-33)的目標(biāo)函數(shù),判斷迭代計(jì)算是否收斂。如果前后差值小于某個(gè)閾值,則迭代計(jì)算結(jié)束,由新的聚類中心和隸屬度函數(shù)集組成重估后的新碼本;否則繼續(xù)進(jìn)行下一輪迭代計(jì)算。模糊矢量量化的步驟如下:1)對(duì)于待矢量量化的輸入矢量,模糊矢量量化不是通過矢量量化把輸入矢量量化成為某個(gè)碼字,而是把輸入矢量量化成由隸屬度函數(shù)組成的矢量

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論