信息論與編碼信息率失真函數(shù)與限失真編碼市公開(kāi)課一等獎(jiǎng)百校聯(lián)賽特等獎(jiǎng)?wù)n件_第1頁(yè)
信息論與編碼信息率失真函數(shù)與限失真編碼市公開(kāi)課一等獎(jiǎng)百校聯(lián)賽特等獎(jiǎng)?wù)n件_第2頁(yè)
信息論與編碼信息率失真函數(shù)與限失真編碼市公開(kāi)課一等獎(jiǎng)百校聯(lián)賽特等獎(jiǎng)?wù)n件_第3頁(yè)
信息論與編碼信息率失真函數(shù)與限失真編碼市公開(kāi)課一等獎(jiǎng)百校聯(lián)賽特等獎(jiǎng)?wù)n件_第4頁(yè)
信息論與編碼信息率失真函數(shù)與限失真編碼市公開(kāi)課一等獎(jiǎng)百校聯(lián)賽特等獎(jiǎng)?wù)n件_第5頁(yè)
已閱讀5頁(yè),還剩93頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1第5章信息率失真函數(shù)

與限失真編碼信道編碼定理即使告訴我們,有噪聲信道無(wú)失真編碼似乎是可能,不過(guò),這里無(wú)失真只能無(wú)限迫近于0,而無(wú)法到達(dá)0,除非編碼分組長(zhǎng)度是無(wú)窮大,所以從這個(gè)角度,有噪聲信道無(wú)失真要求也是不可能。然而在實(shí)際生活中,人們普通并不要求完全無(wú)失真恢復(fù)信息,通常要求在確保一定質(zhì)量(一定確保度)條件下再現(xiàn)原來(lái)消息,也就是說(shuō)允許失真存在。學(xué)習(xí)得來(lái)終覺(jué)淺,絕知此事要自悟第1頁(yè)2

第5章信息率失真函數(shù)

與限失真編碼

不一樣要求允許不一樣大小失真存在,完全無(wú)失真通信既不可能也無(wú)必要,有必要進(jìn)行將失真控制在一定程度內(nèi)壓縮編碼,我們稱為限失真編碼。

信息率失真理論是進(jìn)行量化、數(shù)模轉(zhuǎn)換、頻帶壓縮和數(shù)據(jù)壓縮理論基礎(chǔ)。本章主要介紹信息率失真理論基本內(nèi)容及相關(guān)編碼方法。第2頁(yè)第5章信息率失真函數(shù)

與限失真編碼怎樣進(jìn)行這種限失真編碼呢?考慮我們前面提出問(wèn)題,假如要將有10萬(wàn)位小數(shù)1-100之間數(shù)字進(jìn)行壓縮,我們能夠采取四舍五入方法,將這個(gè)數(shù)轉(zhuǎn)換為只有10位小數(shù)數(shù)值,因?yàn)樾?shù)點(diǎn)10位之后數(shù)值都是微不足道,所以這種壓縮帶來(lái)失真并不大。我們能夠了解為將一個(gè)集合中元素映射為另外一個(gè)集合中壓縮,或者是映射為原集合中一部分元素。第3頁(yè)5.1失真測(cè)度5.1.1系統(tǒng)模型5.1.2失真度與平均失真度第4頁(yè)5.1.1系統(tǒng)模型經(jīng)過(guò)前面例子和討論,我們能夠建立研究限失真信源編碼(有損壓縮)系統(tǒng)模型:信源發(fā)出消息X經(jīng)過(guò)有失真信源編碼輸出為Y,因?yàn)槭怯惺д婢幋a,所以X和Y元素不存在一一對(duì)應(yīng)關(guān)系,我們能夠假設(shè)X經(jīng)過(guò)一個(gè)信道輸出Y,這種假想信道我們稱為試驗(yàn)信道。這么,我們就能夠經(jīng)過(guò)研究信道互信息來(lái)研究限失真編碼,而X和Y關(guān)系也能夠用轉(zhuǎn)移概率矩陣(信道矩陣)來(lái)表示。第5頁(yè)5.1.1系統(tǒng)模型圖5-1限失真編碼模型除了描述輸入輸出關(guān)系外,我們還關(guān)心怎樣才能限制失真問(wèn)題,因?yàn)檫@一切都是建立在限失真要求之上,既然要限制失真,就需要相關(guān)于失真度量。第6頁(yè)5.1.2失真度與平均失真度怎樣來(lái)度量失真呢?我們先從最為簡(jiǎn)單單個(gè)符號(hào)信源失真度量(distortionmeasure)開(kāi)始,然后以此為基礎(chǔ)來(lái)建立更多符號(hào)失真度量。1.單個(gè)符號(hào)失真度設(shè)有離散無(wú)記憶信源信源符號(hào)經(jīng)過(guò)信道傳送到接收端Y,信道轉(zhuǎn)移概率矩陣第7頁(yè)對(duì)于每一對(duì)(xi,yj),指定一個(gè)非負(fù)函數(shù)d(xi,yj)為單個(gè)符號(hào)失真度或失真函數(shù)(distortion-function)。用它來(lái)表示信源發(fā)出一個(gè)符號(hào)xi,而在接收端再現(xiàn)yj所引發(fā)誤差或失真。失真函數(shù)是依據(jù)人們實(shí)際需要和失真引發(fā)損失、風(fēng)險(xiǎn)、主觀感覺(jué)上差異大小等原因人為要求。有時(shí)候未必能夠證實(shí)為何采取這個(gè)函數(shù)是合理,其它函數(shù)沒(méi)有它好。我們假設(shè)發(fā)出一個(gè)符號(hào),假如收到也是它,則失真為0,假如收到不是它,而是其它符號(hào),則存在失真,失真函數(shù)大于0,即有:失真度還可表示成矩陣形式:[D]稱為失真矩陣。它是n×m階矩陣。(5-1)第8頁(yè)9均方失真:

相對(duì)失真:誤碼失真:絕對(duì)失真:前三種失真函數(shù)適合用于連續(xù)信源,后一個(gè)適合用于離散信源。最慣用失真函數(shù)

第9頁(yè)5.2信息率失真函數(shù)及其性質(zhì) 前面我們經(jīng)過(guò)簡(jiǎn)單分析指出,要進(jìn)行最大程度壓縮,依據(jù)香農(nóng)第一定理,壓縮極限為H(Y)=I(X;Y)。不過(guò),我們必須考慮信息壓縮造成失真是在一定程度內(nèi),所以,這個(gè)平均互信息量應(yīng)該在我們?cè)试S失真范圍內(nèi)盡可能小。從直觀感覺(jué)可知,若允許失真越大,信息傳輸率可越小;若允許失真越小,信息傳輸率需越大。所以信息傳輸率與信源編碼所引發(fā)失真(或誤差)是相關(guān),對(duì)信息進(jìn)行壓縮效果與失真也是相關(guān)。第10頁(yè)5.2信息率失真函數(shù)及其性質(zhì)5.2.1信息率失真函數(shù)定義5.2.2信息率失真函數(shù)性質(zhì)第11頁(yè)125.2.1

信息率失真函數(shù)定義

為了討論在允許一定失真D情況下,信源能夠壓縮極限應(yīng)該是一個(gè)與失真相關(guān)函數(shù),我們能夠定義信息率失真函數(shù)(informationratedistortionfunction)為這一極限,簡(jiǎn)稱率失真函數(shù),記為R(D)。第12頁(yè)5.2.1

信息率失真函數(shù)定義在信源概率分布(P(X)給定)和失真度D給定以后,PD是滿足保真度準(zhǔn)則試驗(yàn)信道集合,即我們把X和Y當(dāng)做信道輸入輸出話,這個(gè)信道集合中信道決定性參數(shù)就是信道傳遞(轉(zhuǎn)移)概率p(yj|xi)。第13頁(yè)5.2.1

信息率失真函數(shù)定義在信源和失真度給定以后,信道輸入和輸出平均互信息I(X;Y)是信道傳遞概率p(yj|xi)下凸函數(shù),所以在這些滿足保真度準(zhǔn)則PD集合中一定能夠找到某個(gè)試驗(yàn)信道,使I(X;Y)到達(dá)最小,而這個(gè)最小值能夠從直觀上了解為,而且能夠被證實(shí)為在保真度準(zhǔn)則下信源壓縮極限,即信息率失真函數(shù)R(D),所以(5-12)第14頁(yè)5.2.1

信息率失真函數(shù)定義或者能夠直接地表述為:其中,R(D)單位是奈特/信源符號(hào)或比特/信源符號(hào)。關(guān)于上面定義式子為限失真編碼壓縮極限證實(shí),能夠利用漸進(jìn)等分性來(lái)證實(shí),本章后面部分會(huì)給出證實(shí)。信息率失真函數(shù)這一命名也表達(dá)了信息壓縮極限是與允許失真D相對(duì)應(yīng)一個(gè)函數(shù),所以下面我們將會(huì)討論這個(gè)函數(shù)性質(zhì)。假如說(shuō)試驗(yàn)信道說(shuō)法可能會(huì)難于了解話,我們能夠?qū)⒃囼?yàn)信道了解為限失真信源編碼器輸入X和輸出Y之間一個(gè)概率上映射關(guān)系,或者直接了解為概率p(yj|xi)。第15頁(yè)5.2.1

信息率失真函數(shù)定義 在離散無(wú)記憶平穩(wěn)信源情況下,可證得序列信源信息率失真函數(shù):(5-13)從數(shù)學(xué)上來(lái)看,平均互信息是輸入信源概率分布∩型上凸函數(shù),而平均互信息是信道傳遞概率p(yj|xi)U型下凸函數(shù)。所以,能夠認(rèn)為信道容量C和信息率失真函數(shù)含有對(duì)偶性。第16頁(yè)5.2.1

信息率失真函數(shù)定義 研究信道容量C是為了處理在已知信道中傳送最大信息量。為了充分利用已給信道,使傳輸信息量最大而錯(cuò)誤概率任意小,就是普通信道編碼問(wèn)題。研究信息率失真函數(shù)是為了處理在已知信源和允許失真度D條件下,使信源必須傳送給用戶信息量最小。這個(gè)問(wèn)題就是在能夠接收失真度D條件下,盡可能用最少碼符號(hào)來(lái)傳送信源消息,是信源信息盡快地傳送出去來(lái)提升通信有效性。這是信源編碼問(wèn)題。第17頁(yè)它們之間對(duì)應(yīng)關(guān)系下表5-1所表示:表5-1信道容量C和R(D)比較

信道容量C率失真函數(shù)R(D)研究對(duì)象信道信源給定條件信道轉(zhuǎn)移概率p(yj|xi)信源分布p(x)選擇參數(shù)(變動(dòng)參數(shù))

信源分布p(x)試驗(yàn)信道轉(zhuǎn)移概率或者信源編碼器映射關(guān)系p(yj|xi)結(jié)論求I(X;Y)最大值求I(X;Y)最小值概念上固定信道,改變信源,使信息率最大固定信源,改變信道,使信息率最小(反應(yīng))(信道傳輸能力)(信源可壓縮程度)通信上當(dāng)使得錯(cuò)誤概率Pe→0限制下,使傳輸信息量最大——信道編碼在給定D限制下,用盡可能少碼符號(hào)傳送——信源編碼對(duì)應(yīng)定理有噪信道編碼定理限失真信源編碼定理第18頁(yè)5.2.2

信息率失真函數(shù)性質(zhì)

下面我們來(lái)討論函數(shù)R(D)性質(zhì),作為一個(gè)函數(shù),其函數(shù)值處決于自變量,所以我們首先討論關(guān)于它自變量取值范圍,即定義域。1.信息率失真函數(shù)定義域R(D)自變量是允許平均失真度D,它是人們要求平均失真度上限值。這個(gè)值是否能夠任意選取呢?其實(shí)不然。因?yàn)槠骄д娑戎凳鞘苤萍s,而且失真度與平均失真度均為非負(fù)值,顯然滿足下式:(5-14)(5-15)以上最小值計(jì)算方法都是直接求各個(gè)失真度最小值,然后按照概率加權(quán)平均,是否正確,為何?第19頁(yè)1)最小值對(duì)于離散信源,在普通情況下能夠采取我們前面定義,當(dāng)X和Y一一對(duì)應(yīng)時(shí)候,此時(shí)平均失真度為0,而平均失真度顯然不可能小于0,所以Dmin為0,此時(shí),R(Dmin)=R(0)=H(X)。對(duì)于連續(xù)信源,Dmin趨向于0時(shí),R(Dmin)=R(0)=Hc(X)=∞。連續(xù)信源無(wú)失真時(shí)候,傳輸信息量是無(wú)窮大,實(shí)際信道容量總是有限,無(wú)失真?zhèn)魉瓦@種連續(xù)信息是不可能。只有當(dāng)允許失真(R(D)為有限值),傳送才是可能。第20頁(yè)2)最大值信源最大平均失真度Dmax:必須信息率越小,容忍失真就越大。當(dāng)R(D)等于0時(shí),對(duì)應(yīng)平均失真最大,也就是函數(shù)R(D)定義域上界值Dmax最大。因?yàn)樾畔⒙适д婧瘮?shù)是平均互信息極小值,平均互信息量大于等于0,當(dāng)R(D)=0時(shí),即平均互信息極小值等于0。滿足信息率為0D值可能存在多個(gè),不過(guò)鑒于我們總是希望失真度最小,存在各種選擇時(shí)候,總是選擇最小值,所以這里定義當(dāng)R(D)=0時(shí),D最小值為R(D)定義域上限,即Dmax是使R(D)=0最小平均失真度。第21頁(yè)R(D)=0時(shí),X和Y相互獨(dú)立,所以,滿足X和Y相互獨(dú)立試驗(yàn)信道有許多,對(duì)應(yīng)地可求出許多平均失真值,這類平均失真值下界就是Dmax。(5-16)令則(5-17)第22頁(yè) 上式是用不一樣概率分布{p(yj)}對(duì)Dj求數(shù)學(xué)期望,取數(shù)學(xué)期望當(dāng)中最小一個(gè),作為Dmax。實(shí)際上是用p(yj)對(duì)Dj進(jìn)行線性分配,使線性分配結(jié)果最小。當(dāng)p(xi)和失真矩陣已給定時(shí),必可計(jì)算出Dj。Dj隨j改變而改變。p(yj)是任選,只需滿足非負(fù)性和歸一性。若Ds是全部Dj當(dāng)中最小一個(gè),我們可取p(ys)=1,其它p(yj)為零,此時(shí)Dj線性分配值(或數(shù)學(xué)期望)必定最小,即有(5-18)第23頁(yè) 通俗地說(shuō),當(dāng)我們要進(jìn)行最大程度壓縮時(shí)候,極端情況就是將輸出端符號(hào)壓縮為一個(gè),我們能夠?qū)⑷我庑旁捶?hào)xi都轉(zhuǎn)換為一個(gè)相同符號(hào)ys,因?yàn)閷?duì)方接收到符號(hào)是確定,所以,能夠無(wú)需傳遞任何信息,或者說(shuō)傳遞信息量為0。對(duì)于不一樣ys,會(huì)帶來(lái)不一樣失真度,我們當(dāng)然會(huì)選擇失真度最小一個(gè)。實(shí)際上,不是有意去進(jìn)行理性選擇,平均失真度值是能夠超出這一值。因?yàn)镽(D)是非負(fù)函數(shù),因?yàn)镽(D)是用從中選出求得最小平均互信息,所以當(dāng)D增大時(shí),范圍增大,所求最小值小于范圍擴(kuò)大前最小值,所以R(D)為D非增函數(shù)。當(dāng)D增大時(shí),R(D)可能減小,直到減小到R(D)=0,此時(shí)對(duì)應(yīng)著。假如當(dāng)D>Dmax時(shí),依然為零。第24頁(yè)我們有下面結(jié)論:當(dāng)且僅當(dāng)失真矩陣每一行最少有一個(gè)零元素時(shí),,普通情況下失真矩陣均滿足此條件;可適當(dāng)修改失真函數(shù)使得;和僅與和相關(guān)。第25頁(yè)例5-1設(shè)試驗(yàn)信道輸入符號(hào)集,各符號(hào)對(duì)應(yīng)概率分別為1/3,1/3,1/3,失真矩陣以下所表示,求和以及對(duì)應(yīng)試驗(yàn)信道轉(zhuǎn)移概率矩陣。解:第26頁(yè)令對(duì)應(yīng)最小失真度,其它為“0”,可得對(duì)應(yīng)試驗(yàn)信道轉(zhuǎn)移概率矩陣為上式中第二項(xiàng)最小,所以令,,可得對(duì)應(yīng)試驗(yàn)信道轉(zhuǎn)移概率矩陣為第27頁(yè)5.3離散無(wú)記憶信源信息率失真函數(shù)5.3.1*離散無(wú)記憶信源信息率失真函數(shù)5.3.2*連續(xù)無(wú)記憶信源信息率失真函數(shù)第28頁(yè)5.3.1*離散無(wú)記憶信源信息率失真函數(shù) 已知信源概率分布P(X)和失真函數(shù)d(x,y),就可求得信源R(D)函數(shù);標(biāo)準(zhǔn)上它與信道容量一樣,即在有約束條件下求極小值問(wèn)題。也就是適當(dāng)選取試驗(yàn)信道P(y|x)使平均互信息最小化:(5-20)第29頁(yè)

其約束條件除了保真度準(zhǔn)則外,還包含轉(zhuǎn)移概率必定滿足一些基本條件,比如非負(fù)性、歸一化條件:第30頁(yè) 求解這類極值有好幾個(gè)方法:如變分法、拉氏乘子(拉格朗日乘子,Lagrangemultiplier)法、凸規(guī)劃方法等等。應(yīng)用上述方法,嚴(yán)格地說(shuō)能夠求出解來(lái),不過(guò),假如要求得到顯著解析表示式,則比較困難,通常只能用參量形式來(lái)表示。這種非顯式表示式依然不能直接求解信息率失真函數(shù),必須采取收斂迭代算法求解信息率失真函數(shù)。 假如信源和失真矩陣存在某種對(duì)稱性,則能夠大大簡(jiǎn)化信息率失真函數(shù)計(jì)算。這里我們先討論一些簡(jiǎn)單情形下信息率失真函數(shù)計(jì)算。 以上求解思緒是否能夠處理全部問(wèn)題?得到解就是進(jìn)行限失真編碼時(shí),某一失真度限制下最合理解嗎?第31頁(yè) 對(duì)于等概、對(duì)稱失真信源,存在一個(gè)與失真矩陣含有相同對(duì)稱性轉(zhuǎn)移概率矩陣分布到達(dá)信息率失真函數(shù)值。對(duì)于n元等概率信源,各個(gè)信源符號(hào)概率均為1/n,當(dāng)失真函數(shù)對(duì)稱時(shí),即第32頁(yè)

定理5-1設(shè)信源概率分布為P={p(a1),p(a2),…,p(ar)},失真矩陣為{d(ai,bj)}r×s。π為{1,2,…,r}上一個(gè)置換,使得p(ai)=pπ(ai),i=1,2,…,r,ρ為{1,2,…,s}上一個(gè)置換,使得d(ai,bj)=d(π(ai),ρ(bj)),i=1,2,…,r,j=1,2,…,s,則存在一個(gè)到達(dá)信息率失真函數(shù)信道轉(zhuǎn)移概率分布Q={q(bj|ai)含有與{d(ai,bj)}r×s相同對(duì)稱性,即q(bj|ai)=q(ρ(bj)|π(ai))。該定理證實(shí)略。第33頁(yè) 利用這種性質(zhì)我們能夠降低信道轉(zhuǎn)移概率矩陣未知參數(shù),便于求解。當(dāng)然,以上定理依然顯得復(fù)雜,為了確保信源概率分布重排后一定能夠與原排列一一對(duì)應(yīng)相等,我們能夠直接要求信源等概率分布。此時(shí)假如失真矩陣對(duì)稱,則滿足上述定理?xiàng)l件。 我們還能夠發(fā)覺(jué),漢明失真含有對(duì)稱性,當(dāng)信源等概率分布,且失真矩陣為漢明失真矩陣時(shí),即: 顯然滿足上述條件,能夠利用以上定理來(lái)簡(jiǎn)化問(wèn)題。第34頁(yè)例5-5有一個(gè)二元等概率平穩(wěn)無(wú)記憶信源U={0,1},接收符號(hào)集V={0,1,3},失真矩陣為

試求其信息率失真函數(shù)R(D)。解:求定義域因?yàn)樾旁吹雀怕史植迹д婢仃嚭袑?duì)稱性,所以存在著與失真矩陣含有一樣對(duì)稱性轉(zhuǎn)移概率分布到達(dá)信息率失真函數(shù)。由為了運(yùn)算方便,取上式中,因?yàn)樾旁吹雀怕剩裕ㄔ试S失真)給定。第35頁(yè)則一一對(duì)應(yīng),要失真為有限值,兩個(gè)無(wú)窮∞對(duì)應(yīng)概率必定為0,轉(zhuǎn)移概率矩陣與失真矩陣對(duì)應(yīng)關(guān)系為0對(duì)應(yīng)A,1對(duì)應(yīng)B,考慮歸一性,B=1-A,∞對(duì)應(yīng)0,所以依據(jù)對(duì)應(yīng)關(guān)系,可得代入上述公式,有再將它代入轉(zhuǎn)移概率公式中:第36頁(yè)由:接收端概率分布,得:三個(gè)概率則:平均失真度D一定時(shí)候,第37頁(yè)

圖5-4信息率失真函數(shù)曲線第38頁(yè)5.3.2*連續(xù)無(wú)記憶信源信息率失真函數(shù)補(bǔ)充知識(shí):設(shè)為實(shí)數(shù)有界集合。若:(1)每一個(gè)滿足不等式;(2)對(duì)于任何,存在有,使,則數(shù)稱為集合X下確界。通俗地了解:假如有最小值m,則其最小值就是其下確界,假如其集合中較小值大于m,且無(wú)限地趨向于m,則m也是其下確界。與這類似,有上確界概念。第39頁(yè)連續(xù)信源信息量為無(wú)限大(取值無(wú)限),假如要進(jìn)行無(wú)失真信源編碼,編碼長(zhǎng)度為無(wú)窮大,所以連續(xù)信源無(wú)法進(jìn)行無(wú)失真編碼,而必定采取限失真編碼。連續(xù)信源信息率失真函數(shù)定義與離散信源信息率失真函數(shù)相類似,不過(guò)需要對(duì)應(yīng)地將只需將概率換為概率密度,因?yàn)檫B續(xù)性,需要將求和換為積分(本質(zhì)上是一個(gè)求和形式),而失真表示也表示為連續(xù)形式,離散信源下最小值替換為下確界。假設(shè)連續(xù)信源為X,試驗(yàn)信道輸出為連續(xù)隨機(jī)變量Y,連續(xù)信源平均失真度定義為:(5-21)經(jīng)過(guò)試驗(yàn)信道取得平均互信息為:一樣,確定一允許失真度D,凡滿足平均失真小于D全部試驗(yàn)信道集合記為PD,則連續(xù)信源信息率失真函數(shù)定義為:(5-22)第40頁(yè)嚴(yán)格地說(shuō),連續(xù)信源情況下,可能不存在極小值,不過(guò)下確界是存在,如我們上面討論無(wú)限趨向于下確界。連續(xù)信源信息率失真函數(shù)依然滿足前面信息率失真函數(shù)性質(zhì)(針對(duì)于離散信源討論)。對(duì)于N維連續(xù)隨機(jī)序列平均失真度和信息率失真函數(shù)也能夠類似進(jìn)行定義。連續(xù)信源信息率失真函數(shù)計(jì)算依然是求極值問(wèn)題,一樣能夠采取拉格朗日乘子法進(jìn)行,較為復(fù)雜。這里討論較為簡(jiǎn)單高斯信源情形,對(duì)高斯信源,在普通失真函數(shù)下,其率失真函數(shù)是極難求得,但在平方誤差失真度量下,其率失真函數(shù)有簡(jiǎn)單封閉表示式。對(duì)平方誤差失真,試驗(yàn)信道輸入符號(hào)和輸出符號(hào)之間失真為:對(duì)應(yīng)平均失真度為:第41頁(yè)在平方誤差失真下,設(shè)允許失真為D,則高斯信源率失真函數(shù)為:(5-23)其曲線以下列圖5-6所表示。圖5-6高斯信源在均方誤差準(zhǔn)則下R(D)函數(shù)第42頁(yè)實(shí)際上,我們還能夠證實(shí)在平均功率受限條件下,正態(tài)分布R(D)函數(shù)值最大,它是其它一切分布上限值,也是信源壓縮比中最小,所以人們往往將它作為連續(xù)信源壓縮比中最保守預(yù)計(jì)值。詳細(xì)見(jiàn)下面定理。第43頁(yè)定理5-2:對(duì)任一連續(xù)非正態(tài)信源,若已知其方差為,熵為,并要求失真函數(shù)為,則其R(D)滿足以下不等式:(正態(tài)是上限)(5-24)第44頁(yè)5.4保真度準(zhǔn)則下信源編碼定理5.4.1*失真ε經(jīng)典序列5.4.2*保真度準(zhǔn)則下信源編碼定理證實(shí)5.4.3*保真度準(zhǔn)則下信源編碼逆定理證實(shí)第45頁(yè)5.4保真度準(zhǔn)則下信源編碼定理 信息率失真函數(shù)R(D)是滿足保真度準(zhǔn)則(D)時(shí)所必須含有最小信息率,在進(jìn)行信源壓縮之類處理時(shí),R(D)就成為一個(gè)界限,不能讓實(shí)際信息率低于R(D)。把相關(guān)結(jié)論用定理形式給出,即限失真信源編碼定理,又稱為保真度準(zhǔn)則下信源編碼定理,也就是通常所說(shuō)香農(nóng)第三編碼定理。 本節(jié)中,我們將闡述相關(guān)定理,而且從數(shù)學(xué)上嚴(yán)格證實(shí)。為了簡(jiǎn)化問(wèn)題,這里我們討論限于離散無(wú)記憶平穩(wěn)信源,不過(guò)所述定理能夠推廣到連續(xù)信源,有記憶信源等普通情況。定理通俗形式以下:第46頁(yè)

定理5-3:設(shè)離散無(wú)記憶平穩(wěn)信源信息率失真函數(shù)為R(D),只要滿足R<R(D),而且失真度是有限,當(dāng)信源系列長(zhǎng)度L足夠長(zhǎng)時(shí),一定存在一個(gè)編碼方法,其譯碼失真小于或等于D+ε,其中ε是任意小正數(shù);反過(guò)來(lái),若R<R(D),則不論采取什么樣編碼方法,其譯碼失真必大于D。第47頁(yè) 該定理包含兩部分:R>R(D)情形稱為正定理,R<R(D)情形稱為逆定理。經(jīng)過(guò)正逆定理說(shuō)明這個(gè)R(D)不大不小,恰好是限失真信源編碼界。 另外,該定理與香農(nóng)第二編碼定理(即信道編碼定理)一樣,只是碼存在性定理。正定理告訴我們,R>R(D)時(shí),譯碼失真小于或等于D+ε碼必定存在,但定理本身并未通知碼詳細(xì)結(jié)構(gòu)方法。普通來(lái)說(shuō),要找到滿足條件碼,只能用優(yōu)化思緒去尋求,迄今為止,尚無(wú)適當(dāng)系統(tǒng)編碼方法來(lái)靠近香農(nóng)給出界R(D)。反定理告訴我們,R<R(D)時(shí),譯碼失真必大于D,必定找不到滿足條件碼,所以用不著浪費(fèi)時(shí)間和精力。第48頁(yè) 總結(jié)起來(lái),香農(nóng)信息論三個(gè)基本概念——信源熵、信道容量和信息率失真函數(shù),都是臨界值,是從理論上衡量通信能否滿足要求主要極限。對(duì)應(yīng)這三個(gè)基本概念是香農(nóng)三個(gè)基本編碼定理——無(wú)失真信源編碼定理、信道編碼定理和限失真信源編碼定理,分別又稱為香農(nóng)第一、第二和第三編碼定理,或第一、第二、第三極限定理。這是三個(gè)理想編碼存在性定理,它們并不能直接得出對(duì)應(yīng)編碼方法,不過(guò)對(duì)編碼含有指導(dǎo)意義。第49頁(yè)為便于后續(xù)證實(shí),將正定理和逆定理分別轉(zhuǎn)換為嚴(yán)格數(shù)學(xué)形式:定理5-4保真度準(zhǔn)則下(限失真)信源編碼正定理:設(shè)R(D)為一離散無(wú)記憶信源信息率失真函數(shù),而且有有限失真測(cè)度。對(duì)于任意以及任意足夠長(zhǎng)碼長(zhǎng)n,則一定存在一個(gè)信源編碼C,其碼字個(gè)數(shù)為:(5-25)而編碼后平均失真度,其中R(D)以h為底,h為編碼進(jìn)制數(shù)。假如用二元編碼,且R(D)計(jì)算以二為底,即以bit為單位,則:。它告訴我們,對(duì)于任何失真度,只要碼長(zhǎng)n足夠長(zhǎng),總能夠找到一個(gè)編碼C,使編碼后每個(gè)信源符號(hào)信息傳輸率,即。而碼平均失真度。定理說(shuō)明在允許失真D條件下,信源最小、可到達(dá)信息傳輸率是信源。第50頁(yè)定理5-5保真度準(zhǔn)則下(限失真)信源編碼逆定理:不存在平均失真度為D,而平均信息傳輸率,任何信源碼。即對(duì)任意碼長(zhǎng)為n信源碼C,若碼字個(gè)數(shù),一定有:逆定理告訴我們:假如編碼后平均每個(gè)信源符號(hào)信息傳輸率小于信息率失真函數(shù),就不能在保真度準(zhǔn)則下再現(xiàn)信源消息,即失真必定超出D。第51頁(yè)5.4.1*失真ε經(jīng)典序列 正定理證實(shí)也可采取聯(lián)合經(jīng)典序列及聯(lián)合漸近等分割性。利用當(dāng)序列長(zhǎng)度趨向于無(wú)窮大時(shí)候表達(dá)出來(lái)大數(shù)定律性質(zhì)。當(dāng)序列長(zhǎng)度趨向于無(wú)窮長(zhǎng)時(shí)候,有些序列表達(dá)出均等化性質(zhì),而且這些序列概率和趨向于1,我們稱為經(jīng)典序列,而其它序列概率則趨向于0,能夠忽略,限失真編碼壓縮就表達(dá)在對(duì)這些非經(jīng)典序列忽略上。在對(duì)于限失真編碼討論中新增了失真測(cè)度條件。所以,在證實(shí)定理前,我們先給出失真經(jīng)典序列和證實(shí)定理所需用到定義、結(jié)論。第52頁(yè)定義:設(shè)單符號(hào)空間聯(lián)合概率分布為P(x,y)。其失真度為d(x,y)。若任意>0,有n長(zhǎng)序列對(duì)滿足:(5-26)(5-27)(5-28)(5-29)則稱為失真ε經(jīng)典序列或簡(jiǎn)稱失真經(jīng)典序列。第53頁(yè)序列信源單個(gè)符號(hào)失真度:(5-30)序列聯(lián)合概率等于單個(gè)符號(hào)聯(lián)合概率累積結(jié)果=(5-31)所以,依據(jù)大數(shù)定律,以概率(也稱為依概率)收斂于單個(gè)隨機(jī)變量均值第54頁(yè)引理5-1:設(shè)隨機(jī)序列和,它們各分量之間都是相互統(tǒng)計(jì)獨(dú)立且同分布,而且滿足=當(dāng),則(5-32)引理5-2:對(duì)全部,有(5-33)香農(nóng)第三定理證實(shí)中要用到下面一個(gè)有趣不等式。引理5-3:對(duì)于,有(5-34)說(shuō)明:其中e為自然常數(shù)e=2.71828……。第55頁(yè)5.4.2*保真度準(zhǔn)則下信源編碼定理證實(shí) 定義了失真經(jīng)典序列后,我們能夠來(lái)證實(shí)信源編碼定理,證實(shí)R(D)是在允許失真D條件下信源最大信息傳輸率。第56頁(yè)證實(shí):設(shè)信源序列是統(tǒng)計(jì)獨(dú)立等同分布隨機(jī)序列,其概率分布為。又設(shè)此單個(gè)符號(hào)信源失真測(cè)度為,信源率失真函數(shù)為。設(shè)到達(dá)試驗(yàn)信道為,在這試驗(yàn)信道中?,F(xiàn)需證實(shí),對(duì)于任意時(shí),存在一個(gè)信源符號(hào)信息傳輸率為信源編碼。其平均失真度小于或等于。第57頁(yè)對(duì)于某固定碼書C和>0,我們將信源序列空間中信源序列分成兩大類型:(1)信源序列:在碼書中存在一個(gè)碼字,使其。這是因?yàn)?,與是組成失真經(jīng)典序列對(duì),所以它們是親密相關(guān),而且滿足<則得又因這些失真經(jīng)典序列總體出現(xiàn)概率靠近等于1,所以這些失真經(jīng)典序列對(duì)平均失真度貢獻(xiàn)最多等于(2)另一類信源序列:在碼書中不存在一個(gè)碼字,使與組成失真經(jīng)典序列對(duì)。即,。設(shè)這些序列總體出現(xiàn)概率為。因?yàn)槊總€(gè)信源序列最大失真為,所以這類信源序列對(duì)平均失真貢獻(xiàn)最多是。所以,由得(5-37)以上提到,為了讓失真滿足保真度準(zhǔn)則,就需要趨向于0。第58頁(yè)計(jì)算:為了計(jì)算,我們?cè)O(shè)為碼中最少有一個(gè)碼字與信源序列組成失真經(jīng)典序列正確全部信源序列集合,即(5-38)所以,是因?yàn)橐l(fā),則(5-39)上式表示,全部不能用碼字來(lái)描述那些信源序列概率對(duì)全部可能產(chǎn)生隨機(jī)碼書進(jìn)行統(tǒng)計(jì)平均,對(duì)上式(5-39)交換求和號(hào)。這么能夠解釋為,選擇沒(méi)有碼字能描述信源序列隨機(jī)碼書出現(xiàn)概率對(duì)全部信源序列進(jìn)行統(tǒng)計(jì)平均。則(5-40)定義函數(shù)(5-41)第59頁(yè)碼書C中碼字是在空間中依據(jù)概率來(lái)隨即地選取。對(duì)于在中隨機(jī)選取某個(gè)碼字不與信源序列組成失真經(jīng)典序列正確概率應(yīng)等于=(5-42)碼書C中共有個(gè)碼字,而且是獨(dú)立地、隨機(jī)地選擇。所以,碼書中沒(méi)有碼字能描述信源序列隨機(jī)碼書出現(xiàn)概率為(5-43)將上式代入式(5-40)得(5-44)利用引理5-2得(5-45)代入式(5-44)得(5-46)第60頁(yè)又依據(jù)引理5-3,將中n用代替,x用代替,y用代替,得(5-47)代入式(5-46)得(5-48)觀察上式(5-48)中最終一項(xiàng),當(dāng)選擇另若我們選取試驗(yàn)信道恰好是使平均互信息到達(dá)試驗(yàn)信道,所以,。所以,當(dāng),足夠小時(shí),時(shí),最終一項(xiàng)趨于零。第61頁(yè)式(5-48)中前兩項(xiàng)是聯(lián)合概率分布為序列對(duì)不是失真經(jīng)典序列正確概率。由引理5-1得,當(dāng)n足夠大時(shí)(5-49)所以,適當(dāng)?shù)剡x擇和可使盡可能地小。總而言之,對(duì)全部隨機(jī)編碼碼書C當(dāng),任意選取,只要選擇足夠大,及適當(dāng)小,可使(5-50)所以,最少存在一個(gè)碼書C,其碼字個(gè)數(shù),即信源符號(hào)信息傳輸率,而碼平均失真度。第62頁(yè)5.4.3*保真度準(zhǔn)則下信源編碼逆定理證實(shí)逆定理是一個(gè)不可能形式,顯然我們直接去證實(shí)極難著手,對(duì)于這種結(jié)論,普通用反證法先假設(shè)其成立,然后得出矛盾來(lái)證實(shí)。第63頁(yè)證實(shí):假設(shè)存在一個(gè)信源編碼C,有M個(gè)碼字,,而且M個(gè)碼字是從空間中選取序列,它能使得。編碼方法仍采取前面所述方法,將全部信源序列映射成碼字,而使。依據(jù)失真經(jīng)典序列定義,與是組成失真經(jīng)典序列,所以她們是彼此經(jīng)常聯(lián)合出現(xiàn)序列對(duì)。而且又滿足<,所以它們之間失真。這種編碼方法可看成一個(gè)特殊試驗(yàn)信道:(5-51)依據(jù)假設(shè)則在這個(gè)試驗(yàn)信道中,可得又因在這信道中=0,所以平均互信息(5-52)上式(5-52)中不等式是因?yàn)樵诰幋a范圍內(nèi),最多只有M個(gè),所以空間最大熵值為。又因?yàn)樾旁词请x散無(wú)記憶信源,所以有(5-53)第64頁(yè)設(shè)以平均失真再現(xiàn),則必有又依據(jù)信息率失真函數(shù)U型凸?fàn)钚院蛦握{(diào)遞減性得(5-54)上式最終一項(xiàng)是依據(jù)離散無(wú)記憶平穩(wěn)信源求得。所以得或者這個(gè)結(jié)果與定理假設(shè)相矛盾,所以逆定理成立。(5-55)第65頁(yè)正如前面所述,保真度準(zhǔn)則下信源編碼定理及其逆定理是有失真信源壓縮理論基礎(chǔ)。這兩個(gè)定理證實(shí)了允許失真D確定后,總存在一個(gè)編碼方法,使編碼信息傳輸率,那么編碼平均失真度將大于D。假如用二元碼符號(hào)來(lái)進(jìn)行編碼話,在允許一定量失真D情況下,平均每個(gè)信源符號(hào)所需二元碼符號(hào)下限值就是R(D)??梢?jiàn),從香農(nóng)第三定理可知,R(D)確實(shí)是允許失真度為D情況下信源信息壓縮下限值。比較香農(nóng)第一定理和第三定理可知,當(dāng)信源給定后,無(wú)失真信源壓縮極限值是信源熵H(S);而有失真信源壓縮極限值是信息率失真函數(shù)R(D)。在給定某D后,普通R(D)<H(S)。無(wú)失真信源編碼能夠看成是限失真編碼一個(gè)特例,依據(jù)我們對(duì)失真正常定義,普通當(dāng)輸入和輸出符號(hào)一一對(duì)應(yīng)時(shí),失真才為0,此時(shí),R(0)=H(S),能夠經(jīng)過(guò)限失真信源編碼定理來(lái)證實(shí)無(wú)失真信源編碼定理。5.5限失真信源編碼定理實(shí)用意義第66頁(yè)5.5限失真信源編碼定理實(shí)用意義類似于無(wú)失真信源編碼利用信源熵來(lái)衡量編碼效率一樣,信息率失真函數(shù)能夠用來(lái)度量限失真編碼在某一失真下編碼效率。信源R(D)函數(shù)能夠作為衡量各種壓縮編碼方法性能優(yōu)劣一個(gè)尺度。但香農(nóng)第三定理一樣只給出了一個(gè)存在定理。至于怎樣尋找這種最正確壓縮編碼方法,定理中并沒(méi)有給出。在實(shí)際應(yīng)用中,該理論主要存在著幾類問(wèn)題。在實(shí)際應(yīng)用中,該定理主要存在以下兩大類問(wèn)題:第一類問(wèn)題是符合實(shí)際信源R(D)函數(shù)計(jì)算相當(dāng)困難。(1)需要對(duì)實(shí)際信源統(tǒng)計(jì)特征有確切數(shù)學(xué)描述,即概率分布明確;(2)需要對(duì)符合主客觀實(shí)際失真給與正確度量,不然不能求得符號(hào)主客觀實(shí)際R(D)函數(shù)。比如,通常采取均方誤差來(lái)表示信源平均失真度。但對(duì)于圖像信源來(lái)說(shuō),均方誤差較小編碼方法,而人們視覺(jué)感到失真較大。所以,人們?nèi)圆扇≈饔^觀察來(lái)評(píng)價(jià)編碼方法好壞。所以,怎樣定義符合主觀和客觀實(shí)際情況失真測(cè)度就是件較困難事。(3)即便對(duì)實(shí)際信源有了確切數(shù)學(xué)描述,又有符合主客觀實(shí)際情況失真測(cè)度,而失真率函數(shù)R(D)計(jì)算也還較困難。第67頁(yè) 第二類問(wèn)題是即便求得了符合實(shí)際信息率失真函數(shù),還需研究采取何種實(shí)用最正確編碼方法才能到達(dá)極限值R(D)。當(dāng)前,這兩方面工作都有進(jìn)展。尤其是對(duì)實(shí)際信源各種壓縮方法,如對(duì)語(yǔ)音信號(hào)、電視信號(hào)和遙感圖像等信源各種壓縮方法有了較大進(jìn)展。 第三類問(wèn)題是信息率失真函數(shù)求解是在給定試用信道輸入輸出及其失真矩陣情況下計(jì)算,當(dāng)輸出符號(hào)集未定時(shí)候,我們不能確定到底怎么樣符號(hào)集才是最優(yōu),即使得信息率失真函數(shù)值最低。5.5限失真信源編碼定理實(shí)用意義第68頁(yè)在信息論中,尤其是信息熵中,許多時(shí)候?qū)⒏鱾€(gè)信源符號(hào)一視同仁地對(duì)待,不過(guò)實(shí)際上,各個(gè)符號(hào)有它們語(yǔ)義和語(yǔ)用,在數(shù)值上是不一樣。這當(dāng)然帶來(lái)對(duì)應(yīng)不足,信息率失真函數(shù)中失真度量,實(shí)際上能夠認(rèn)為是一個(gè)很好補(bǔ)充,用于填補(bǔ)對(duì)于語(yǔ)義和語(yǔ)用度量缺失,比如,陰天、晴天、大雨、中雨、小雨所代表降雨量、陽(yáng)光強(qiáng)弱是不一樣,且是有不一樣幅度差異?,F(xiàn)在信息率失真函數(shù)也用于度量損失和信息價(jià)值,實(shí)際上還能夠做深入推廣。5.5限失真信源編碼定理實(shí)用意義第69頁(yè)5.6限失真信源編碼限失真信源編碼定理指出:在允許一定失真度D情況下,信源輸出信息傳輸率可壓縮到R(D)值,這就從理論上給出了信息傳輸率與允許失真之間關(guān)系,奠定了信息率失真理論基礎(chǔ)。不過(guò)它并沒(méi)有告訴我們?cè)鯓舆M(jìn)行編碼能夠到達(dá)這一極限值。普通情況下信源編碼可分為離散信源編碼,連續(xù)信源編碼和相關(guān)信源編碼三類。前兩類編碼方法主要討論獨(dú)立信源編碼問(wèn)題,后一類編碼方法討論非獨(dú)立信源編碼問(wèn)題。離散信源可做到無(wú)失真編碼,而連續(xù)信源則只能做到限失真信源編碼,通常我們將限失真信源編碼簡(jiǎn)稱限失真編碼。無(wú)失真編碼和限失真編碼本身也含有相通之處,有些方法和思想本質(zhì)上能夠同時(shí)用于限失真編碼和無(wú)失真編碼。采取限失真編碼采取方法主要有矢量量化、預(yù)測(cè)編碼和變換編碼。第70頁(yè)5.6限失真信源編碼5.6.1矢量量化編碼5.6.2預(yù)測(cè)編碼5.6.3變換編碼第71頁(yè)5.6.1矢量量化編碼 量化(Quantization)就是把經(jīng)過(guò)抽樣得到瞬時(shí)值將其幅度離散,即用一組要求電平,把瞬時(shí)抽樣值用最靠近電平值來(lái)表示。量化普通用于連續(xù)信源編碼,不過(guò)它也能夠用于離散信源編碼。對(duì)小數(shù)、實(shí)數(shù)進(jìn)行四舍五入,就是一個(gè)最為簡(jiǎn)單通俗例子,比如經(jīng)過(guò)四舍五入取整,會(huì)將區(qū)間[1.5,2.5)數(shù)值都量化為2。 按照量化級(jí)劃分方式分,有均勻量化(uniformquantization)和非均勻量化。其中最為簡(jiǎn)單是均勻量化,也稱為線性量化,它將輸入信號(hào)取值域等間隔分割量化。反之,則稱為非均勻量化,其范圍劃分不均勻,普通用類似指數(shù)曲線進(jìn)行量化。非均勻量化是針對(duì)均勻量化提出,為了適應(yīng)幅度大輸人信號(hào),同時(shí)又要滿足精度要求,就需要增加樣本位數(shù)。不過(guò),對(duì)話音信號(hào)來(lái)說(shuō),大信號(hào)出現(xiàn)機(jī)會(huì)并不多,增加樣本位數(shù)沒(méi)有充分利用。為了克服這個(gè)不足,出現(xiàn)了非均勻量化方法,這種方法也叫做非線性量化。非均勻量化基本想法是,對(duì)輸人信號(hào)進(jìn)行量化時(shí),大輸入信號(hào)(概率?。┎扇〈罅炕g隔,小輸入信號(hào)采取小量化間隔。這么就能夠在滿足精度要求情況下,用較少位數(shù)來(lái)表示。聲音數(shù)據(jù)還原時(shí),采取相同規(guī)則。常見(jiàn)非均勻量化有A律和μ率等,它們區(qū)分在于量化曲線不一樣。均勻量化好處就是編解碼很輕易,但要到達(dá)相同信噪比占用帶寬要大。當(dāng)代通訊系統(tǒng)中都用非均勻量化。第72頁(yè)5.6.1矢量量化編碼 按照量化維數(shù)分,量化分為標(biāo)量量化(scalarquantization,SQ)和矢量量化(vectorquantization,VQ)...。標(biāo)量量化是一維量化,一個(gè)幅度值對(duì)應(yīng)一個(gè)量化結(jié)果。而矢量量化是二維甚至多維量化,兩個(gè)或兩個(gè)以上幅度值作為一個(gè)整體決定一個(gè)量化結(jié)果。以二維情況為例,兩個(gè)幅度決定了平面上一點(diǎn)。而這個(gè)平面事先按照概率已經(jīng)劃分為N個(gè)小區(qū)域,每個(gè)區(qū)域?qū)?yīng)著一個(gè)輸出結(jié)果。由輸入確定那一點(diǎn)落在了哪個(gè)區(qū)域內(nèi),矢量量化器就會(huì)輸出那個(gè)區(qū)域?qū)?yīng)碼字。無(wú)失真信源編碼中我們能夠看到,對(duì)單個(gè)符號(hào)進(jìn)行對(duì)應(yīng)信源編碼壓縮效果比對(duì)序列進(jìn)行信源編碼效果要差,類似地,矢量量化因?yàn)榭紤]將一個(gè)序列當(dāng)做整體來(lái)對(duì)待,能夠消除序列內(nèi)部相關(guān)性影響,普通會(huì)比標(biāo)量量化效率更高。 矢量量化中碼書碼字越多,維數(shù)越大,失真就越小。只要適當(dāng)?shù)剡x擇碼字?jǐn)?shù)量,就能控制失真量不超出某一給定值,所以碼書控制著矢量大小。第73頁(yè)5.6.1矢量量化編碼 試驗(yàn)證實(shí),即使各信源符號(hào)相互獨(dú)立,多維量化通常也可壓縮信息率。因而矢量量化引發(fā)人們興趣而成為當(dāng)前連續(xù)信源編碼一個(gè)熱點(diǎn)??墒钱?dāng)維數(shù)較大時(shí),矢量量化尚無(wú)解析方法,只能求援于數(shù)值計(jì)算;而且聯(lián)合概率密度也不易測(cè)定,還需采取諸如訓(xùn)練序列方法。普通來(lái)說(shuō),高維矢量聯(lián)合是很復(fù)雜,雖已經(jīng)有不少方法,但其實(shí)現(xiàn)還有不少困難,有待深入研究。第74頁(yè)5.6.2預(yù)測(cè)編碼慣用解除相關(guān)性辦法是預(yù)測(cè)和變換,其實(shí)質(zhì)都是進(jìn)行序列一個(gè)映射。普通來(lái)說(shuō),預(yù)測(cè)編碼有可能完全解除序列相關(guān)性,但必需確知序列概率特征;變換編碼普通只解除矢量?jī)?nèi)部相關(guān)性,但它可有許多可供選擇變換方法,以適應(yīng)不一樣信源特征。下面介紹預(yù)測(cè)編碼普通理論與方法。第75頁(yè)5.6.2預(yù)測(cè)編碼預(yù)測(cè)編碼(predictioncoding)是數(shù)據(jù)壓縮三大經(jīng)典技術(shù)(統(tǒng)計(jì)編碼,預(yù)測(cè)編碼,變換編碼)之一,它是建立在信源數(shù)據(jù)相關(guān)性之上,由信息理論可知,對(duì)于相關(guān)性很強(qiáng)信源,條件熵可遠(yuǎn)小于無(wú)條件熵,所以人們常采取盡可能解除相關(guān)性方法,使信源輸出轉(zhuǎn)化為獨(dú)立序列,以利于深入壓縮碼率。我們能夠從預(yù)測(cè)這個(gè)名字上來(lái)了解預(yù)測(cè)編碼,假如一個(gè)序列后面符號(hào)由前面若干個(gè)符號(hào)決定,我們能夠認(rèn)為前面符號(hào)能夠預(yù)測(cè)后面符號(hào),這么,我們只需要發(fā)送前面符號(hào),后面符號(hào)完全能夠預(yù)測(cè)出來(lái)。顯而易見(jiàn),這種可預(yù)測(cè)性是因?yàn)榉?hào)之間含有相關(guān)性。這是一個(gè)極端情況,實(shí)際上,序列之間相關(guān)性可能存在,不過(guò)它不足以完全決定后面符號(hào),可能只是能夠降低后面符號(hào)不確定性,此時(shí)從信息論角度來(lái)說(shuō),前面符號(hào)提供了后面符號(hào)信息,利用這種相關(guān)性也能夠進(jìn)行預(yù)測(cè)。再舉一個(gè)例子,一個(gè)單一正弦波形,一旦知道了一個(gè)周期之內(nèi)波形,就能夠依據(jù)周期性重復(fù)這個(gè)波形來(lái)預(yù)測(cè)后面波形。一樣是這個(gè)例子,經(jīng)過(guò)波形中若干點(diǎn)能夠確定整個(gè)波形,所以,我們能夠利用這些點(diǎn)完全地預(yù)測(cè)后面各個(gè)位置波形。第76頁(yè)5.6.2預(yù)測(cè)編碼預(yù)測(cè)編碼基本思想是經(jīng)過(guò)提取與每個(gè)信源符號(hào)相關(guān)新信息,并對(duì)這些新信息進(jìn)行編碼來(lái)消除信源符號(hào)之間相關(guān)性。實(shí)際中慣用新信息為信源符號(hào)當(dāng)前值與預(yù)測(cè)值差值,這里正是因?yàn)樾旁捶?hào)間存在相關(guān)性,所以才使預(yù)測(cè)成為可能,對(duì)于獨(dú)立信源,預(yù)測(cè)就沒(méi)有可能。預(yù)測(cè)理論基礎(chǔ)主要是預(yù)計(jì)理論。所謂預(yù)計(jì)就是用試驗(yàn)數(shù)據(jù)組成一個(gè)統(tǒng)計(jì)量作為某一物理量估值或預(yù)測(cè)值,若估值數(shù)學(xué)期望等于原來(lái)物理量,就稱這種預(yù)計(jì)為無(wú)偏預(yù)計(jì);若估值與原物理量之間均方誤差最小,就稱之為最正確預(yù)計(jì),基于這種方法進(jìn)行預(yù)測(cè),就稱為最小均方誤差預(yù)測(cè),所以也就認(rèn)為這種預(yù)測(cè)是最正確。第77頁(yè)5.6.2預(yù)測(cè)編碼在詳細(xì)預(yù)測(cè)編碼實(shí)現(xiàn)過(guò)程中,編碼器和譯碼器都存貯有過(guò)去信號(hào)值,并以此來(lái)預(yù)測(cè)或預(yù)計(jì)未來(lái)信號(hào)值。在編碼器發(fā)出不是信源信號(hào)本身,而是信源信號(hào)與預(yù)測(cè)值之差;在譯碼端,譯碼器將接收到這一差值與譯碼器預(yù)測(cè)值相加,從而恢復(fù)信號(hào)。要實(shí)現(xiàn)最正確預(yù)測(cè)就是要找到計(jì)算預(yù)測(cè)值預(yù)測(cè)函數(shù)。這個(gè)函數(shù)依據(jù)數(shù)據(jù)相關(guān)性來(lái)決定。第78頁(yè)5.6.2預(yù)測(cè)編碼設(shè)有信源序列,k階預(yù)測(cè)就是由前k個(gè)數(shù)據(jù)來(lái)預(yù)測(cè)??闪铑A(yù)測(cè)值為:式中函數(shù)是待定預(yù)測(cè)函數(shù)。要使預(yù)測(cè)值含有最小均方誤差,必須確知k個(gè)變量聯(lián)合概率密度函數(shù),這在普通情況下較難得到,因而慣用比較簡(jiǎn)單線性預(yù)測(cè)方法。線性預(yù)測(cè)(linearprediction)是取預(yù)測(cè)函數(shù)為各已知信源符號(hào)線性函數(shù),即取預(yù)測(cè)值為:(5-56)其中為預(yù)測(cè)系數(shù)。最簡(jiǎn)單預(yù)測(cè)是令 ,稱為前值預(yù)測(cè),慣用差值預(yù)測(cè)就屬于這類。第79頁(yè)5.6.2預(yù)測(cè)編碼 利用預(yù)測(cè)值來(lái)編碼方法可分為兩類:一類是對(duì)實(shí)際值與預(yù)測(cè)值之差進(jìn)行編碼,也叫差值預(yù)測(cè)編碼;另一類方法是依據(jù)差值大小,決定是否需傳送該信源符號(hào)。比如,可要求某一閾值T,當(dāng)差值小于T時(shí)可不傳送,對(duì)于相關(guān)性很強(qiáng)信源序列,常有很長(zhǎng)一串符號(hào)差值能夠不傳送,此時(shí)只需傳送這串符號(hào)個(gè)數(shù),這么能大量壓縮碼率。這類方法普通是按信宿要求來(lái)設(shè)計(jì),也就是壓縮碼率引發(fā)失真應(yīng)能滿足信宿需求。 實(shí)現(xiàn)預(yù)測(cè)編碼要深入考慮3個(gè)方面問(wèn)題: ⑴預(yù)測(cè)誤差準(zhǔn)則選取,比如采取使預(yù)測(cè)誤差均方值到達(dá)最小作為準(zhǔn)則,或者絕對(duì)誤差均值最小等。 ⑵預(yù)測(cè)函數(shù)選??; ⑶預(yù)測(cè)器輸入數(shù)據(jù)選取。第80頁(yè)5.6.3變換編碼預(yù)測(cè)編碼認(rèn)為冗余度是數(shù)據(jù)固有,經(jīng)過(guò)對(duì)信源建模來(lái)盡可能準(zhǔn)確地預(yù)測(cè)源數(shù)據(jù),去除數(shù)據(jù)時(shí)間冗余度。不過(guò)冗余度有時(shí)與不一樣表示方法也有很大關(guān)系,變換編碼是將原始數(shù)據(jù)“變換”到另一個(gè)更為緊湊表示空間,去除數(shù)據(jù)空間冗余度,可得到比預(yù)測(cè)編碼更高數(shù)據(jù)壓縮。能量集中是指對(duì)N維矢量信號(hào)進(jìn)行變換后,最大方差見(jiàn)集中在前M個(gè)低次分量之中(M<N)。第81頁(yè)5.6.3變換編碼變換編碼(transformcoding)基本原理是將原來(lái)在空間(時(shí)間)域上描述信號(hào),經(jīng)過(guò)一個(gè)數(shù)學(xué)變換(比如傅里葉變換等),將信號(hào)變到變換域(比如頻域等)中進(jìn)行描述,在變換域中,變換系數(shù)之間相關(guān)性經(jīng)常顯著下降,并常有能量集中于低頻或低序系數(shù)區(qū)域特點(diǎn),這么就輕易實(shí)現(xiàn)碼率壓縮,并還可大大降低數(shù)據(jù)壓縮難度。第82頁(yè)5.6.3變換編碼高性能變換編碼方法不但能使輸出壓縮信源矢量中各分量之間相關(guān)性大大減弱,而且使能量集中到少數(shù)幾個(gè)分量上,在其它分量上數(shù)值很小,甚至為"0"。所以在對(duì)變換后分量(系數(shù))進(jìn)行量化再編碼時(shí),因?yàn)樵诹炕蟮扔?0"系數(shù)能夠不傳送,所以在一定保真度準(zhǔn)則下可到達(dá)壓縮數(shù)據(jù)率目標(biāo),量化參數(shù)選取主要依據(jù)保真度要求或恢復(fù)信號(hào)主觀評(píng)價(jià)效果來(lái)確定。第83頁(yè)5.6.3變換編碼 下面我們首先介紹變換編碼基本原理,然后介紹變換編碼中慣用幾個(gè)變換。 1.正交變換編碼基本原理 設(shè)信源連續(xù)發(fā)出兩個(gè)信源符號(hào)s1與s2之間存在相關(guān)性,假如均為3比特量化,即它們各有八種可能取值,那么s1與s2之間相關(guān)特征可用圖5-7表示。第84頁(yè)圖5-7s1與s2之間相關(guān)特征圖圖5-7中橢圓區(qū)域表示s1與s2相關(guān)程度較高區(qū)域,此相關(guān)區(qū)關(guān)于s1軸和s2軸對(duì)稱。顯然假如s1與s2相關(guān)性越強(qiáng),則橢圓形狀越扁長(zhǎng),而且變量s1與s2幅度取值相等可能性也越大,二者方差近似相等,即 。第85頁(yè)假如我們將s1與s2坐標(biāo)軸逆時(shí)針旋轉(zhuǎn)45°,變成平面,則橢圓區(qū)域長(zhǎng)軸落在 軸上,此時(shí)當(dāng) 取值變動(dòng)較大時(shí),所受影響很小,說(shuō)明 與之間相關(guān)性大大減弱。同時(shí)由圖5-7能夠看出:隨機(jī)變量與能量分布也發(fā)生了很大改變,在相關(guān)區(qū)域內(nèi)大部分點(diǎn)上方差均大于方差,即 。另外,因?yàn)辄c(diǎn)與坐標(biāo)原點(diǎn)o距離不變,所以坐標(biāo)變換不會(huì)使總能量發(fā)生改變,所以有:=(5-57)由此可見(jiàn),經(jīng)過(guò)上述坐標(biāo)變換,使變換后得到新變量,展現(xiàn)兩個(gè)主要特點(diǎn):(1)變量間相關(guān)性大大減弱,如其中一個(gè)改變時(shí),另外一個(gè)幾乎不變;(2)能量更集中,即 ,且小到幾乎可忽略。這兩個(gè)特點(diǎn)正是變換編碼能夠?qū)崿F(xiàn)數(shù)據(jù)壓縮主要依據(jù),即數(shù)據(jù)能夠忽略。第86頁(yè)上述坐標(biāo)旋轉(zhuǎn)對(duì)應(yīng)變換方程為:因?yàn)樗?,坐?biāo)旋轉(zhuǎn)變換矩陣是一個(gè)正交矩陣,由正交矩陣決定變換稱為正交變換。進(jìn)行正交變換目標(biāo)是使得變換后各個(gè)分量相互獨(dú)立。按照均方誤差最小準(zhǔn)則來(lái)計(jì)算相關(guān)參數(shù),如θ,得到一個(gè)正交變換叫做K-L變換,不過(guò)使用KL變換需要知道信源協(xié)方差矩陣,再求出協(xié)方差矩陣特征值和特征矢量,然后據(jù)此結(jié)構(gòu)正交變換矩陣;但求特征值和特征矢量是相當(dāng)困難,尤其是在高維信源情況下,甚至求不出來(lái)。即使借助于計(jì)算機(jī)求解,也難于滿足實(shí)時(shí)處理要求。第87頁(yè)

K-L變換含有以下特征:(1)去相關(guān)特征。K-L變換是變換后矢量信號(hào)Y分量互不相關(guān)。(2)使得能量集中于個(gè)別分量中。(3)最正確特征。K-L變換是在均方誤差測(cè)度下,失真最小一個(gè)變換,其失真為被略去各分量之和。因?yàn)檫@一特征,K-L變換被稱為最正確變換。許多其它變換都將K-L變換作為性能上比較參考標(biāo)準(zhǔn)。除了用于數(shù)據(jù)壓縮,利用K-L變換還能夠進(jìn)行人臉圖象識(shí)別和人臉圖象合成。這些功效與K-L變換冗余控制能力和提取關(guān)鍵信息能力顯然是相關(guān)。人臉圖象識(shí)別步驟簡(jiǎn)述為:首先搜集要識(shí)別人人臉圖像,建立人臉圖像庫(kù),然后利用K-L變換確定對(duì)應(yīng)人臉基圖像,再反過(guò)來(lái)用這些基圖像對(duì)人臉圖像庫(kù)中有些人臉圖像進(jìn)行K-L變換,從而得到每幅圖像參數(shù)向量并將每幅圖參數(shù)向量存起來(lái)。在識(shí)別時(shí),先對(duì)一張所輸入臉圖像進(jìn)行必要規(guī)范化,再進(jìn)行K-L變換分析,得到其參數(shù)向量。將這個(gè)參數(shù)向量與庫(kù)中

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論