信息處理編碼信源編碼_第1頁(yè)
信息處理編碼信源編碼_第2頁(yè)
信息處理編碼信源編碼_第3頁(yè)
信息處理編碼信源編碼_第4頁(yè)
信息處理編碼信源編碼_第5頁(yè)
已閱讀5頁(yè),還剩136頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第五章信源編碼

目的:提高通信系統(tǒng)有效性,實(shí)現(xiàn)信源與通信系統(tǒng)間的統(tǒng)計(jì)匹配。

§5-1無(wú)失真信源編碼

一〕首先,我們研究離散、無(wú)失真、無(wú)記憶信源編碼的一般模型:假設(shè)不考慮信源統(tǒng)計(jì)特性:應(yīng)滿(mǎn)足:相互矛盾!由 ----①

〔一〕離散、無(wú)失真、無(wú)記憶信源編碼的一般模型〔續(xù)〕結(jié)論:①當(dāng)n=m時(shí),K≥L不有效。②當(dāng)K=L時(shí),m≥n,亦不滿(mǎn)足有效性。解決方法:引入信源統(tǒng)計(jì)特性??紤]信源統(tǒng)計(jì)特性:即無(wú)需對(duì)全部組合的n的L次方種信息一一編碼,而僅需對(duì)其中少數(shù)大概率事件集合中元素進(jìn)行編碼即可。這時(shí),我們可以修改①式為:K/L≥H(U)/logm----②即考慮信源不等概率,而碼字為等概率,這就是等長(zhǎng)碼的仙農(nóng)無(wú)失真信源編碼定理:對(duì)離散,無(wú)記憶、平穩(wěn)、遍歷信源其符號(hào)序列:U=(U1,U2…..UL),可用K個(gè)符號(hào)C=(C1,C2….Ck)進(jìn)行等長(zhǎng)編碼,對(duì)任意ε>0,δ>0,只要滿(mǎn)足:(K/L)logm≥H(U)+ε----③那么當(dāng)L足夠大時(shí),可使譯碼過(guò)失小于δ,反之,當(dāng)(K/L)logm≤H(U)-2ε----④時(shí),譯碼一定出錯(cuò)。這就是等長(zhǎng)碼信源編碼定理?!惨弧畴x散、無(wú)失真、無(wú)記憶信源編碼的一般模型〔續(xù)〕〔一〕離散、無(wú)失真、無(wú)記憶信源編碼的一般模型〔續(xù)〕定理證明,主要引用了序列信源中的隨機(jī)序列的漸近等同分割A(yù).E.P特性.所謂A.E.P是指任何一個(gè)離散隨機(jī)序列信源當(dāng)序列長(zhǎng)度L→∝時(shí),信源序列會(huì)產(chǎn)生兩極分化.大概率事件集合與小概率事件集合,即nL=∪對(duì)于有性質(zhì):①

(信源熵)(大概率事件熵)③

(等概率)對(duì)于有性質(zhì):〔一〕離散、無(wú)失真、無(wú)記憶信源編碼的一般模型〔續(xù)〕由此可見(jiàn),信源編碼只需對(duì)信源中少數(shù)落入典型大概率事件的集合的符號(hào)進(jìn)行編碼即可。而對(duì)大多數(shù)屬于非典型小概率事件集合中的信源符號(hào)無(wú)需編碼,且。由A.P.E推出的輔助不等式:

選典型序列中個(gè)u編碼,即

為此,有以下變長(zhǎng)碼熵匹配編碼定理形式:其次,再討論變長(zhǎng)碼,這時(shí)公式②可進(jìn)一步修改為:

〔一〕離散、無(wú)失真、無(wú)記憶信源編碼的一般模型〔續(xù)〕-------⑤

對(duì)于二進(jìn)制,可進(jìn)一步簡(jiǎn)化為:

-------⑥故稱(chēng)它為熵匹配編碼。它就是變長(zhǎng)碼信源編碼定理??梢?jiàn),上述無(wú)失真信源編碼定理,不僅是存在性定理,而且是構(gòu)造性定理。

例:設(shè)有一簡(jiǎn)單離散信源:L=1,n=4對(duì)其進(jìn)行近似于無(wú)失真的等長(zhǎng)編碼,假設(shè)要求其編碼效率為95%,過(guò)失率低于10-6,試求符號(hào)聯(lián)合編碼長(zhǎng)度L=?解:,σ2=0.6875bit2由編碼效率:

即:可見(jiàn),需要100萬(wàn)個(gè)信源符號(hào)聯(lián)合編碼,才能到達(dá)上述要求,這顯然是不現(xiàn)實(shí)的.下面,假設(shè)進(jìn)行變長(zhǎng)編碼又如何呢?再由:變長(zhǎng)碼010110111

可見(jiàn),假設(shè)采用變長(zhǎng)編碼,逐位〔L=1〕即可到達(dá)100%效率,當(dāng)然這里僅是一個(gè)特例,不過(guò)它已足以說(shuō)明變長(zhǎng)碼的優(yōu)越性。如何譯碼?有兩類(lèi)方法:①加標(biāo)志信息②尋找內(nèi)在規(guī)律下面,我們給出幾種類(lèi)型的信源編碼:其中編碼Ⅰ為等長(zhǎng)碼,碼長(zhǎng)K=2,但與pi不匹配,編碼Ⅱ至Ⅴ為變長(zhǎng)碼,但是編碼Ⅱ的U1和U2均編為“0〞,編碼不單義〔奇異〕不能用;信源概率pi編碼Ⅰ編碼Ⅱ編碼Ⅲ編碼Ⅳ編碼ⅤU11/2000000U21/401011001U31/810100110011U41/81110111110111編碼

Ⅲ,發(fā)(編碼)單義,但是收(譯碼)不單義,比如收到“00”可能譯為亦不能用。編碼Ⅳ與Ⅴ,收、發(fā)均滿(mǎn)足單義,故可用,但是兩者是有差別的。雖然都是唯一可譯碼,但是編碼Ⅳ是一類(lèi)實(shí)時(shí)唯一可譯碼,又稱(chēng)為異前置碼或非延長(zhǎng)碼。

所謂異前置是指某一碼組的后面向前面看:比方u4=111,被采用后,其前面的任意組合比方11,或1均不能再采用;所謂非延長(zhǎng)碼,那么是某一碼組的前面向后面看:比方u1=0,被采用后,那么從0以后的任何延長(zhǎng)出去組合,比方00、01、001等均不能再用。它是最正確變長(zhǎng)碼。編碼Ⅴ也是滿(mǎn)足唯一可譯性,但不滿(mǎn)足異前置或非延長(zhǎng)特性,譯碼時(shí),需要延時(shí)判決,所以它不是實(shí)時(shí)可譯碼。比方收到“0〞不立即判決,而是延遲一位,根據(jù)收到的第二位在判決第一位假設(shè)為“00〞那么判第一位為0,即u1;假設(shè)為“01〞仍不能判,再觀(guān)察第三位,假設(shè)為“010〞,那么判“01〞為u2,假設(shè)為“011〞再觀(guān)察第四位,假設(shè)為“0110〞判為“011〞為u3,假設(shè)為“0111〞判為u4。下面,進(jìn)一步研究實(shí)時(shí)唯一可譯碼的碼字可別離條件,它可引用很直觀(guān)的“碼樹(shù)〞概念來(lái)說(shuō)明:將變長(zhǎng)碼與碼樹(shù)建立“一一對(duì)應(yīng)〞關(guān)系:樹(shù)根碼字起點(diǎn)樹(shù)枝數(shù)碼的進(jìn)制數(shù)節(jié)點(diǎn)碼字或碼字的一局部終止節(jié)點(diǎn)碼字節(jié)數(shù)碼長(zhǎng)非滿(mǎn)樹(shù)變長(zhǎng)碼滿(mǎn)樹(shù)等長(zhǎng)碼下面,我們尋找一種與上述“樹(shù)圖〞等效的解析式表達(dá)式----Kraft不等式。分析起來(lái)特別對(duì)含有很多符號(hào)種類(lèi)的復(fù)雜信源更方便。定理:長(zhǎng)度為Ki〔i=1,2,…,n〕的m進(jìn)制異前置碼存在的充要條件為:----⑦。證明,下面僅給出必要性證明,充分性見(jiàn)書(shū),若設(shè)碼樹(shù)共有K節(jié),則總碼枝數(shù)為mk個(gè)。若某個(gè)長(zhǎng)度為Ki的碼枝被選用,則自該支第Ki節(jié)點(diǎn)以后所有碼枝不能再選用,即有碼枝不能再選用。由于Ki中i是任意的(i=1,2,…,n),所以全樹(shù)中不能再選用的總碼枝數(shù)應(yīng)為:

,顯然其值一定要小于全樹(shù)總碼枝數(shù)mk,即有

編碼規(guī)那么:1)

將信源消息U按概率大小排序〔由大至小〕。2)從最小兩個(gè)概率開(kāi)始編碼,并賦予一定規(guī)那么,如下支路小概率為“1〞,上支路大概率為“0〞。假設(shè)兩支路概率相等,仍為下支為“1〞上支為“0〞。3)將已編碼兩支路概率合并,重新排隊(duì),編碼。4)重復(fù)步驟3〕直至合并概率歸一時(shí)為止。5)從概率歸一端沿樹(shù)圖路線(xiàn)逆行至對(duì)應(yīng)消息編碼,如U3為“110〞。例2〔續(xù)〕例三〔續(xù)〕可見(jiàn),編成的碼C和C’不一樣,這說(shuō)明哈夫曼編碼并不唯一,這是由于哈夫曼編碼是與信源統(tǒng)計(jì)特性相匹配的編碼,而不是某個(gè)信源固定特性相匹配,不唯一性是明顯的,但是只要在編碼和譯碼過(guò)程中遵守同一規(guī)則,譯碼是唯一的。雖然C和C’不一樣,但是兩者都是哈夫曼編碼,并且碼長(zhǎng)相等。

Kc’=0.4×1+0.2×2+0.2×3+2×0.1×4=2.2Kc=0.4×2+0.2×2×2+0.1×3×2=2.2但是,若從二階矩來(lái)看,即方差來(lái)看,C’的方差大,C的方差小,所以C優(yōu)于C’例三〔續(xù)〕下面討論哈夫曼編碼應(yīng)用中的一些問(wèn)題:1)首先討論誤差擴(kuò)散:哈夫曼編碼是一種無(wú)失真信源最正確編碼,但是在實(shí)際信道中是有失真的。噪聲的引入必然要破壞長(zhǎng)碼結(jié)構(gòu),而且是變長(zhǎng)碼,錯(cuò)誤不但影響受干擾位,還要進(jìn)一步擴(kuò)散。目前對(duì)擴(kuò)散還沒(méi)有很有效的方法,工程上克服方法有兩種:一是限制哈夫曼碼僅能應(yīng)用于優(yōu)質(zhì)信道〔<=10-6〕以限制擴(kuò)散的可能性;二是采用定期清洗,防止擴(kuò)散區(qū)域增大。但是它是靠犧牲有效性換取的。2)其次是速率匹配問(wèn)題:由于絕大多數(shù)信源是不等概率的,由它編成的碼長(zhǎng)度與速率是可變的。然而實(shí)際信道那么要求其輸入端速率是固定的。所以信源與信道之間還存在一個(gè)速率匹配問(wèn)題。在工程上解決這一問(wèn)題的方法是在兩者之間加一個(gè)類(lèi)似與水庫(kù)的緩存器,它變速入,恒速出,以解決兩者速率的匹配。3)第三是與信源統(tǒng)計(jì)特性匹配的問(wèn)題。其中:〔1〕、小消息〔符號(hào)〕集信源不易匹配可采用信源消息集不斷擴(kuò)展的方法來(lái)解決,但是太復(fù)雜。〔2〕、信源統(tǒng)計(jì)特性未知時(shí),怎么辦?可采用所謂通用編碼的方法來(lái)解決。上一節(jié)我們利用樹(shù)圖的理論尋找出一類(lèi)唯一可譯的變長(zhǎng)碼的編譯碼方法。即:〔同構(gòu)〕樹(shù)的生成結(jié)構(gòu)規(guī)律唯一可譯碼變長(zhǎng)〔樹(shù)圖理論〕〔一一對(duì)應(yīng)〕編、譯碼方法這一節(jié)中我們利用數(shù)學(xué)中最簡(jiǎn)單的算術(shù)規(guī)律來(lái)構(gòu)造一類(lèi)無(wú)失真的信源編碼。 〔同構(gòu)〕算術(shù)規(guī)律 非分組的信源編碼〔一一對(duì)應(yīng)〕算術(shù)編碼

下面,首先從一個(gè)PCM編碼例子入手:

000→0×20+0×21+0×22→0→0→0×2–1+0×2-2+0×2-3001→1×20+0×21+0×22→1→1/8→0×2–1+0×2–2+1×2–3010→0×20+1×21+0×22→2→2/8→0×2–1+1×2–2+0×2–3011→1×20+1×21+0×22→3→3/8→0×2–1+1×2–2+1×2–3100→0×20+0×21+1×22→4→4/8→1×2–1+0×2–2+0×2–3101→1×20+0×21+1×22→5→5/8→1×2–1+0×2–2+1×2–3110→0×20+1×21+1×22→6→6/8→1×2–1+1×2–2+0×2–3111→1×20+1×21+1×22→7→7/8→1×2–1+1×2–2+1×2-3PCM碼編碼公式對(duì)應(yīng)量化層歸一化編碼公式上面例子是一個(gè)簡(jiǎn)單的三位PCM的例子其編碼可表示為:〔簡(jiǎn)單算術(shù)表達(dá)式〕⑧

三位碼共有八層:

……

可見(jiàn),這時(shí)信源編碼過(guò)程就可以看作是上述對(duì)應(yīng)二進(jìn)制小數(shù)作移位相加的過(guò)程。故稱(chēng)它為算術(shù)編碼。

仔細(xì)分析,上述例子僅是一個(gè)特例,因?yàn)樗鼪](méi)有考慮信源的統(tǒng)計(jì)特性,〔它認(rèn)為信源是遵從等概率分布的〕所以編出的碼字是等長(zhǎng)碼,而對(duì)應(yīng)的算術(shù)運(yùn)算那么是簡(jiǎn)單的整數(shù)項(xiàng)相加?!布碖i為整數(shù)〕。為了解決對(duì)一般的具有統(tǒng)計(jì)特性的信源的算術(shù)編碼問(wèn)題,需要將上述算術(shù)編碼方式進(jìn)一步拓廣,并要解決信源統(tǒng)計(jì)特性與編出的碼字相匹配。其中最關(guān)鍵的是要將算術(shù)編碼與信源的符號(hào)概率及累積概率建立一一對(duì)應(yīng)關(guān)系。算術(shù)編碼就是基于這一思路。不過(guò),在引入統(tǒng)計(jì)特性后的算術(shù)編碼中,每次移位的位數(shù)可以是非整數(shù)〔精度有限的有理數(shù)〕,正是由于這種非整數(shù)的引入使算數(shù)編碼變成了非分組碼。更確切地說(shuō),在每步編碼運(yùn)算中除了實(shí)際移動(dòng)的某一整數(shù)位以外,還以?xún)?nèi)部狀態(tài)形式保存了應(yīng)該移動(dòng)的“分?jǐn)?shù)〞位,并將其累積到下一步編碼運(yùn)算中。這樣,只要非整數(shù)的精度足夠高,那么就可以與信源消息匹配到任意良好的程度。下面,從一個(gè)單消息〔符號(hào)〕信源入手,簡(jiǎn)述算術(shù)編碼原理及編碼方程的建立:設(shè)信源序列為:S=S1S2…Si…其中Si∈{1,2,…,j,…,N},即有N種類(lèi)型,下面,首先將信源符號(hào)按對(duì)應(yīng)概率大小排隊(duì):S1S2…Sj…SN即:對(duì)應(yīng)累計(jì)概率=由于信源是由單個(gè)符號(hào)組成并相互獨(dú)立,假設(shè)設(shè)信源序列為:S=S1S3S2S3=S’S3P(S)=p(S1)+p(S1)p(S3)+p(S1)p(S3)p(S2)+p(S1)p(S3)p(S2)p(S3)=p(S1S2S3)+p(S1)p(S3)p(S2)p(S3)=p(S’)+p(S’)p(S3)---------⑨其中p(S’)=p(S1)p(S3)p(S2)=[p(S1)p(S3)]·p(S2)推廣之:p(S)=[p(S1)p(S3)p(S2)]·p(S3)=p(S’)·p(S3)----------⑩這樣,將一定精度數(shù)值作為序列的算術(shù)編碼,完全可類(lèi)似于上述歸一化分層的整數(shù)算術(shù)編碼。在數(shù)學(xué)上看,它實(shí)質(zhì)上是一個(gè)分割單位區(qū)間的過(guò)程。完成它必須兩個(gè)遞推過(guò)程:一個(gè)代表碼字C(·),另一個(gè)代表狀態(tài)空間A(·).假設(shè)采用累積概率Ps表示碼字C(s),符號(hào)概率P(s)表示狀態(tài)區(qū)間A(s),由公式⑨⑩可求得:其中sx表示s的后續(xù)〔增長(zhǎng)〕序列。公式⑾的遞推公式是算術(shù)編碼的根底。----------------⑾

例:假設(shè)有一單消息〔符號(hào)〕信源,含四種符號(hào):a、b、c、d,構(gòu)成一序列S=abda且:。試說(shuō)明算術(shù)編碼及其具體編、譯碼過(guò)程。解:假設(shè)起始狀態(tài)為空序列Ф,且令A(yù)(Ф)=1,C(Ф)=0下面,首先給出以下符號(hào),符號(hào)概率pi,累積概率Pj如下:由上述概率表與公式⑾,可計(jì)算出以下一系列數(shù)值:符號(hào)符號(hào)概率pi符號(hào)累積概率Pjabcd0.100(1/2)0.010(1/4)0.001(1/8)0.001(1/8)0.0000.1000.1100.111C(Φa)=C(Φ)+A(Φ)Pa=0+1×0=0A(Φa)=A(Φ)pa=1×0.1=0.1C(ab)=C(a)+A(a)Pb=0+0.1×0.1=0.01A(ab)=A(a)pb=0.1×0.01=0.001C(abd)=C(ab)+A(ab)Pd=0.01+0.001×0.111=0.010111A(abd)=A(ab)pd=0.001×0.001=0.000001C(abda)=C(abd)+A(abd)Pa=0.010111+0.00001×0=0.010111A(abda)=A(abd)pa=0.000001×0.1=0.0000001上面,我們給出了整個(gè)編碼過(guò)程,實(shí)際上它可以看作是對(duì)以下單位區(qū)間的劃分過(guò)程:算術(shù)編碼的譯碼過(guò)程如下:根據(jù)編碼后的數(shù)值大小比較來(lái)進(jìn)行,即判斷碼字C〔s〕落在哪一個(gè)區(qū)間就可以得出一個(gè)相應(yīng)的符號(hào)序列。具體步驟如下:1.

C〔abda〕=0.010111<0.1

可譯出第一符號(hào)為a;2.

去掉被乘概率加權(quán)因子:C〔abda〕×2=0.010111×10=0.10111在[0.1,0.11]

間,第二個(gè)符號(hào)譯為b;3.

去掉累積概率后再去掉被乘加權(quán)因子:0.10111-0.1=0.001110.00111×4=0.00111×100=0.111在[0.111,1]之間,第三個(gè)符號(hào)譯為d;4.同上0.111-0.111=0.000.00×8=0.00×1000=0.00在[0,0.1]之間,第四個(gè)符號(hào)譯為a。綜上所述,譯碼后的總輸出為:S*=abda=S〔發(fā)送的原序列〕在實(shí)際應(yīng)用時(shí),信源不是簡(jiǎn)單的單消息〔符號(hào)〕信源,而是符號(hào)序列信源,這時(shí)上述遞推公式⑾應(yīng)修改為:并設(shè)所有序列從空序列開(kāi)始,即A()=1,C()=L()=0若x表示子序列S后面的待編碼符號(hào)。若P(x/S)<1/2稱(chēng)為小概率符號(hào),且記x為l,否則記x=h

公式中L表示碼長(zhǎng),[]表示截短后的有限精度.矢量量化是一維標(biāo)量量化的拓廣,是對(duì)多個(gè)樣值進(jìn)行的聯(lián)合量化.標(biāo)量量化是對(duì)逐個(gè)樣點(diǎn)值進(jìn)行的量化,而矢量量化那么是對(duì)每K個(gè)樣點(diǎn)值為一組進(jìn)行的多維聯(lián)合量化處理.它在數(shù)學(xué)上可看作K維空間中的映射:矢量量化編碼

其中u為K維空間(歐氏)中的一個(gè)連續(xù)矢量,ul為K維空間(歐氏)中的一個(gè)離散量化矢量.對(duì)于每個(gè)l,在K維空間中有一個(gè)區(qū)域Cl,它作為K維空間劃分的一個(gè)子空間.且當(dāng)u∈Cl就判別它為ul,人們稱(chēng)這種分割矢量空間的方法為Voroni(胞腔)子空間法。可見(jiàn),矢量量化可以理解為K維歐氏空間Rk中的一種映射變換。它將Rk中的連續(xù)矢量u變換成離散的量化矢量ul,且稱(chēng)量化矢量ul為碼本和重建碼本,而l=1,2,……,L,L那么表示碼本的尺寸〔大小〕。Log2L為碼本信息量,即碼本的二進(jìn)制碼元數(shù),對(duì)于矢量量化:可以實(shí)現(xiàn),這點(diǎn)在一維標(biāo)量量化時(shí)是不可能到達(dá)的,主要原因是由于矢量量化充分利用了信源樣點(diǎn)間統(tǒng)計(jì)關(guān)聯(lián)特性。顯然有:

⒀為了便于理解,可將上述矢量量化過(guò)程按以下圖形分解為編、譯碼兩個(gè)子過(guò)程如下:ulullu編碼器(u)理想信道譯碼器(l)l重建碼本碼本圖中的碼本是按照一定的失真度量準(zhǔn)那么,通過(guò)事先進(jìn)行大量的訓(xùn)練而建立,并含有所有可能量化矢量值ul,l=1,2……L,這時(shí),信道既不直接傳送K維連續(xù)樣值u,也不傳送離化量化矢量ul,傳送的是在碼本中挑選失真最小的那個(gè)量化矢量的編號(hào)值l,接收端,由l通過(guò)譯碼器在重建碼本中再挑選失真最小量化矢量ul作為恢復(fù)矢量值。即:QK:ul=β(l)=β[(u)] ⒁在某種失真準(zhǔn)那么下,可以認(rèn)為:β·α=1那么:ul=β[α(u)]=u顯然當(dāng)K=1時(shí),即為簡(jiǎn)單的標(biāo)量量化。⒂

1)

矢量度量準(zhǔn)那么的選取2)

多維空間的劃分3)

最正確量化器的設(shè)計(jì)4)

算法研究矢量量化中的幾個(gè)主要問(wèn)題是:下面,我們給出一類(lèi)典型矢量量化實(shí)現(xiàn)方案:

碼本序號(hào)l訓(xùn)練數(shù)據(jù)群聚迭代建立碼本碼本矢量量化編碼輸入連續(xù)矢量u

ul可見(jiàn),矢量量化器發(fā)送端主要包括兩局部:碼本設(shè)計(jì)與矢量量化編碼。碼本設(shè)計(jì)需要大量的反復(fù)的輸入訓(xùn)練數(shù)據(jù)進(jìn)行群聚迭代設(shè)計(jì),反復(fù)計(jì)算質(zhì)心,因此要消耗大量的時(shí)間,然而碼本設(shè)計(jì)并不要求實(shí)時(shí),它可以事先預(yù)制。矢量量化編碼那么嚴(yán)格要求實(shí)時(shí)實(shí)現(xiàn)。因此在量化器中的運(yùn)算量以及決定它的算法,就變得極為關(guān)鍵,這就是說(shuō),矢量量化器能否實(shí)際應(yīng)用關(guān)鍵在于算法。近些年來(lái)算法研究進(jìn)展很大,各種類(lèi)型最正確全搜索快速算法以及準(zhǔn)最正確的各類(lèi)快速算法不斷提出,同時(shí),由于大規(guī)模集成電路技術(shù)的飛速開(kāi)展,促使矢量量化技術(shù)已逐步走向?qū)嵱没?。它是一?lèi)有記憶信源的限失真編碼。有記憶信源最主要的是解除信源的相關(guān)性,而預(yù)測(cè)編碼主要是從時(shí)域來(lái)解除相關(guān)性,壓縮信息率。預(yù)測(cè)編碼

〈一〉預(yù)測(cè)編碼的根本原理信源輸出預(yù)測(cè)器量化編碼輸出它不直接對(duì)信源輸出ui進(jìn)行量化編碼,而是對(duì)其差值:進(jìn)行量化編碼。其中為預(yù)測(cè)值。

由信息論:

差值熵:

由信源熵匹配編碼有:(16)

其中表示預(yù)測(cè)前信源編碼平均碼長(zhǎng)其中表示預(yù)測(cè)后信源編碼平均碼長(zhǎng)從概率觀(guān)點(diǎn)看,預(yù)測(cè)可理解為:

由于信息熵是概率分布的泛函數(shù),預(yù)測(cè)前,信源分布越不均勻,熵越大;預(yù)測(cè)后,預(yù)測(cè)越準(zhǔn)確,分布越集中,熵值就越小。即。通過(guò)預(yù)測(cè)后,信源數(shù)據(jù)壓縮的倍數(shù)就越大。實(shí)現(xiàn)預(yù)測(cè)編碼要進(jìn)一步研究如下三個(gè)問(wèn)題:1〕

預(yù)測(cè)函數(shù)的選取;2〕

預(yù)測(cè)誤差準(zhǔn)那么的選取;3〕

預(yù)測(cè)器輸入數(shù)據(jù)源的選取。第2〕個(gè)問(wèn)題決定預(yù)測(cè)器質(zhì)量的標(biāo)準(zhǔn),第1〕、3〕兩個(gè)問(wèn)題那么主要決定預(yù)測(cè)質(zhì)量的好壞。下面,我們首先討論預(yù)測(cè)函數(shù)的選取:

在工程上一般是采用容易實(shí)現(xiàn)的線(xiàn)性預(yù)測(cè),這時(shí):可見(jiàn),當(dāng)預(yù)測(cè)函數(shù)f確定為線(xiàn)性函數(shù)以后,預(yù)測(cè)精度主要決定于K值大小:K越大,預(yù)測(cè)越準(zhǔn)確,但設(shè)備也越復(fù)雜;

K越小,預(yù)測(cè)越不準(zhǔn)確,設(shè)備也就越簡(jiǎn)化。

其次,討論預(yù)測(cè)誤差準(zhǔn)那么的選取:目前大致有以下四種類(lèi)型:MMSE〔最小均方誤差〕準(zhǔn)那么;PSEM〔功率包絡(luò)匹配〕準(zhǔn)那么;PCIV〔預(yù)測(cè)系數(shù)不變性〕準(zhǔn)那么;ME〔最大誤差〕準(zhǔn)那么。其中最常用的是MMSE準(zhǔn)那么,PCIV主要特點(diǎn)是與輸入信號(hào)統(tǒng)計(jì)特性無(wú)關(guān),它可對(duì)多種混合信號(hào)進(jìn)行有效預(yù)測(cè)。而ME準(zhǔn)那么那么主要用于遙測(cè)數(shù)據(jù)壓縮。最后,討論預(yù)測(cè)器輸入數(shù)據(jù)流的選取,它可以劃分為三類(lèi):<二>預(yù)測(cè)編碼的根本類(lèi)型1〕△PCM型ui-1ui-2…ui-Kα1α2αk…量化編碼器DPCM中預(yù)測(cè)系數(shù)的計(jì)算線(xiàn)性預(yù)測(cè)值為,為過(guò)去p個(gè)樣值的線(xiàn)性組合,為預(yù)測(cè)系數(shù)假設(shè)選擇均方誤差準(zhǔn)那么假設(shè)信源輸出廣義平穩(wěn)r(m)為樣值un的相關(guān)函數(shù),上式對(duì)ai求偏導(dǎo)r(m)可通過(guò)估算將r(m)代入,可得ai求預(yù)測(cè)系數(shù)的線(xiàn)性方程稱(chēng)作正態(tài)方程,Yule-Walker方程。Levinson和Durbin提出一種算法能有效的解上述方程。Levinson-Durbin算法Levinson-Durbin算法是一種用來(lái)確定線(xiàn)性方程組解的階遞歸算法。其中是一個(gè)階Toeplitz矩陣。是預(yù)測(cè)器系數(shù)向量,可表示為是一個(gè)p維向量,其元素為對(duì)于一階()預(yù)測(cè)器,我們得解一階預(yù)測(cè)器的剩余均方誤差(MSE)為一般的,可以用m-1階預(yù)測(cè)器的系數(shù)來(lái)表示m階預(yù)測(cè)器系數(shù)的解。于是,把表示為兩個(gè)向量之和,即式中,向量和標(biāo)量待定。于是,還可以表示為式中,剛好是反序的向量現(xiàn)在由上式可以得到兩個(gè)方程。第一個(gè)方程為如下矩陣方程從而上式可以簡(jiǎn)化為這個(gè)方程的解為剛好是反序。從而,上式的解就是反序的乘以,即(1)由前式得到的第二個(gè)方程為如下標(biāo)量方程利用前式(1),可從上式消去。結(jié)果的方程給出,即式中是剩余MSE,由下式確定用前式(1)代替最小MSE也可以遞歸計(jì)算,于是得到如下遞歸關(guān)系及在上式中利用遞歸關(guān)系,得到上式中方括號(hào)內(nèi)的項(xiàng)就是前式中的分子,因此它可簡(jiǎn)化為

量化…線(xiàn)性預(yù)測(cè)器線(xiàn)性預(yù)測(cè)器uiyi

xi

ei

這是一類(lèi)最簡(jiǎn)單的線(xiàn)性預(yù)測(cè)器。其預(yù)測(cè)器輸入直接來(lái)自信源輸出,預(yù)測(cè)函數(shù)為線(xiàn)性加權(quán)和,其預(yù)測(cè)精度主要決定于預(yù)測(cè)項(xiàng)數(shù)K。其主要缺點(diǎn)是量化噪聲較大。

1〕△PCM型〔續(xù)〕2〕DPCM型:uieixi量化器線(xiàn)性預(yù)測(cè)器線(xiàn)性預(yù)測(cè)器yiDPCM與△PCM比較,不同點(diǎn)有:①線(xiàn)性預(yù)測(cè)器的輸入數(shù)據(jù)源來(lái)自輸出反響端②對(duì)于量化器而言,△PCM是開(kāi)環(huán)型而DPCM是閉環(huán)型。可利用反響環(huán)進(jìn)一步壓低量化誤差。從而進(jìn)一步提高DPCM的預(yù)測(cè)性能。<二>預(yù)測(cè)編碼的根本類(lèi)型〔續(xù)〕--延時(shí)延時(shí)濾波DPCM的特例ΔM:

2〕DPCM型〔續(xù)〕若將量化等級(jí)定為2,即差值為正時(shí),用”1”代表;差值為負(fù)時(shí),用”0”代表;而每個(gè)差值只需1比特,這時(shí)DPCM即為ΔM,又稱(chēng)它為增量調(diào)制.為了減少量化誤差,一般要增加取樣頻率,不能再來(lái)用常用的最高頻率的2倍,即

>2fm.在收端,譯碼是編碼的反變換,即規(guī)定一個(gè)增量Δ值,當(dāng)收到一個(gè)“1”則在前一個(gè)值中加一個(gè)Δ,收到一個(gè)“0”,則減去一個(gè)Δ值。2〕DPCM型〔續(xù)〕3〕噪聲反響編碼(NFC)<二>預(yù)測(cè)編碼的根本類(lèi)型〔續(xù)〕NFC是吸取△PCM與DPCM的優(yōu)點(diǎn),即在△PCM結(jié)構(gòu)簡(jiǎn)單的根底上,改進(jìn)其量化噪聲大的缺點(diǎn),將量化器設(shè)計(jì)在另外增加的一個(gè)反響環(huán)內(nèi),以到達(dá)進(jìn)一步壓減量化誤差的目標(biāo)。這一點(diǎn)上類(lèi)似于DPCM.可見(jiàn)NFC是△PCM與DPCM的混合改進(jìn)型.<二>預(yù)測(cè)編碼的根本類(lèi)型〔續(xù)〕4)預(yù)測(cè)誤差門(mén)限型(非線(xiàn)形)

設(shè)信源輸出序列為:若僅采用前一位作為后一樣值的預(yù)測(cè)值,則預(yù)測(cè)誤差若,不傳送;

若,傳送.4)預(yù)測(cè)誤差門(mén)限型(非線(xiàn)形)〔續(xù)〕其中是允許誤差的門(mén)限值,即可接受的最大誤差,在上述圖形中雖然有,前四個(gè)應(yīng)傳送,不傳送。若選擇的預(yù)測(cè)值不僅僅是前一位,而是前n位的線(xiàn)性加權(quán)和,則可構(gòu)成高階預(yù)測(cè)誤差門(mén)限型,其原理同上,實(shí)現(xiàn)方框圖如下:

顯然這一類(lèi)型中線(xiàn)性預(yù)測(cè)器與前三類(lèi)是一致的,但是由于引入了非線(xiàn)性門(mén)限比較器,所以它實(shí)質(zhì)上是一類(lèi)非線(xiàn)性預(yù)測(cè)器。<二>預(yù)測(cè)編碼的根本類(lèi)型〔續(xù)〕下面我們給出四種類(lèi)型中最常用的一種DPCM的性能分析:線(xiàn)性預(yù)測(cè)可表示為:

其Z變換為:可見(jiàn)線(xiàn)性預(yù)測(cè)器的響應(yīng)為:

式中αj為第i項(xiàng)加權(quán)系數(shù),N為預(yù)測(cè)階次。由DPCM接收部分框圖??汕蟮茫汗剩?/p>

<二>預(yù)測(cè)編碼的根本類(lèi)型〔續(xù)〕可見(jiàn),線(xiàn)性預(yù)測(cè)器為一全極點(diǎn)濾波器。故又稱(chēng)為全極點(diǎn)模型。下面再分析一下DPCM的幾個(gè)主要關(guān)系式:

預(yù)測(cè)誤差:經(jīng)量化后:其中qi為量化噪聲引入的誤差。經(jīng)無(wú)過(guò)失傳輸后接受端恢復(fù)后的重建信號(hào)為:可見(jiàn),進(jìn)一步性能分析可參見(jiàn)教材。

變換編碼是從廣域頻域〔或空域〕解除信源相關(guān)性的一種有效的手段。主要數(shù)學(xué)工具是正交和準(zhǔn)正交變換。變換編碼下面,首先從一維信源輸出開(kāi)始分析:設(shè)信源輸出:,變換后輸出:則有:由正交性有:如果,通過(guò)正交變換只傳送M<n個(gè)樣值,而將n-M個(gè)較小樣值丟棄。于是有:這時(shí)接收端恢復(fù)的信號(hào)為:

變換編碼〔續(xù)〕這里,所以問(wèn)題可以歸結(jié)為如何選擇正交矩陣A,使經(jīng)正交變換后M值較小,且被丟棄的n-M個(gè)值是足夠小的。為了更清晰,我們進(jìn)一步引入二維分析:

其中為的協(xié)方差矩陣。為的數(shù)學(xué)期望。為x的協(xié)方差。則:

變換編碼〔續(xù)〕可見(jiàn)經(jīng)正交矩陣A變換后,使信源的協(xié)方差矩陣變換成純對(duì)角線(xiàn)矩陣,且對(duì)角線(xiàn)上元素能按順序由大到小排列。下面,我們首先尋求正交變換|A|矩陣形式,即在最小均方誤差下準(zhǔn)則MMSE下尋求最佳的正交變換。即:

變換編碼〔續(xù)〕首先求最正確bi值:求得:此取bi為xi的數(shù)學(xué)期望值,其次再求最佳a(bǔ)i值:

求得:或

變換編碼〔續(xù)〕最后求得:

,其中

此為一理想對(duì)角線(xiàn)矩陣,它完全消除了信源的相關(guān)性,稱(chēng)它為Karhunan-loeve(K-L)變換,這時(shí),最小均方誤差值為:最小項(xiàng).變換編碼〔續(xù)〕上述最正確的K-L變換實(shí)際上很少應(yīng)用而僅將它作為理論上最優(yōu)值得一個(gè)參數(shù)標(biāo)準(zhǔn),其原因有1.最正確A矩陣顯然與信源統(tǒng)計(jì)特性φ密切相關(guān),不同的φ值應(yīng)有不同的最正確A矩陣,這顯然是不現(xiàn)實(shí)的.2.K-L變換目前尚沒(méi)找到相應(yīng)的快速算法.正因?yàn)閷?shí)現(xiàn)最正確不現(xiàn)實(shí),因此人們將眼光轉(zhuǎn)向準(zhǔn)最正確變換,何謂準(zhǔn)最正確變換并沒(méi)有確切的定義,而只是指能找到一類(lèi)在數(shù)學(xué)上經(jīng)線(xiàn)行代數(shù)中相似變換后的Jordan標(biāo)準(zhǔn)型.即:變換編碼〔續(xù)〕在上,下對(duì)角線(xiàn)區(qū)域內(nèi)僅會(huì)有少數(shù)不為0得元素1.目前已找到一批滿(mǎn)足上述特性的準(zhǔn)最正確變換(不唯一).大致可以劃分為兩類(lèi):變換編碼〔續(xù)〕可見(jiàn),由線(xiàn)性代數(shù)理論,由相似變換,總能找到一非奇異矩陣A,使,并稱(chēng)與相似,同時(shí)由于變換后的Jordan型無(wú)確切定義,因此可以找到一批滿(mǎn)足上述標(biāo)準(zhǔn)最佳變換。

下面將分別介紹這些準(zhǔn)最正確變換,設(shè)U為信源消息矩陣,X為經(jīng)變換后的信號(hào)矩陣,在一般情況下有:原那么上,A與B可以是不同類(lèi)型矩陣,實(shí)際上差不多都是同一類(lèi)型、同一階次矩陣,即A=B。由于上述變換是隨機(jī)矩陣變換,所以通常給出其二階矩陣形式的協(xié)方差矩陣的等效形式:變換編碼〔續(xù)〕1〕離散付氏變換DFT:這里:其中下面討論不同形式A:變換編碼〔續(xù)〕變換編碼〔續(xù)〕變換編碼〔續(xù)〕例:以n=4DFT為例;假設(shè)顯然,它是一個(gè)非常好的準(zhǔn)最正確變換,互相關(guān)均為零,自相關(guān)由大而小遞降型。但是,也可以看出,ADF與Φu密切相關(guān),假設(shè)換一個(gè)Φu類(lèi)型,就不會(huì)有這么好的結(jié)果。2〕離散沃爾什—哈德瑪變換WHT由于沃爾什—哈德瑪矩陣由許多類(lèi)似之處,比方他們都是以1和-1為元素,其變換運(yùn)算只有加減而沒(méi)有乘除,且兩類(lèi)矩陣之間的關(guān)系是簡(jiǎn)單的初等變換關(guān)系。所以我們將兩者歸為一類(lèi)來(lái)研究。并首先從Hardmard矩陣開(kāi)始:這里:

5〕離散余弦變換DCT:由于前面在付氏變換中引入了復(fù)數(shù),帶來(lái)了運(yùn)算上的不方便,DCT正是針對(duì)這一缺點(diǎn)而進(jìn)行的改進(jìn)。根據(jù)離散付氏變換的公式,只需將信源數(shù)據(jù)長(zhǎng)度再擴(kuò)張一倍,并保證對(duì)稱(chēng)性即可求得DCT。DCT根據(jù)對(duì)稱(chēng)性不同還可劃分為兩類(lèi),〔奇〕ODCT與〔偶〕EDCT,前者將數(shù)據(jù)擴(kuò)展為2N-1并以M=0為中心點(diǎn),兩側(cè)各N-1個(gè);后者將數(shù)據(jù)擴(kuò)展為2N,并以M=0與M=1之間為中心點(diǎn)。且:

以上各類(lèi)離散準(zhǔn)最正確變換編碼各具特色。如果僅從解除相關(guān)性的性能上看:KLT>DCT〔平穩(wěn)馬氏鏈〕>DFT>WHT>HrTST但是如果從復(fù)雜性,計(jì)算復(fù)雜度上來(lái)看,上述順序正好相反:HrT>WHT>DFT>DCT>KLTST通用編碼Huffman編碼能產(chǎn)生最優(yōu)信源編碼,但需要知道所有信源符號(hào)的發(fā)生概率。在有記憶離散信源情況下,那么Huffman編碼必須知道所有長(zhǎng)度n≧2的所有信源符號(hào)組合的聯(lián)合概率。對(duì)于實(shí)際信源,聯(lián)合概率的計(jì)算復(fù)雜度非常高,結(jié)果Huffman編碼在許多實(shí)際的有記憶信源中往往無(wú)法實(shí)現(xiàn)。Lampel-Ziv(LZ)通用信源編碼與Huffman編碼不同,LZ編碼算法與信源統(tǒng)計(jì)特性無(wú)關(guān),屬于通用信源編碼范疇,是一種將變長(zhǎng)碼段映射為等長(zhǎng)碼字的算法,編碼方法可以描述為:在LZ算法中,離散信源的輸出序列分解成長(zhǎng)度可變的分組,稱(chēng)為碼段(phrases)。每當(dāng)信源輸出字符組在最后位置加上一個(gè)字符后與前面的已有碼段都不相同時(shí),把它作為一種新的碼段引入。將這些碼段列入一個(gè)位置字典,用來(lái)記載已有碼段的位置。在對(duì)一個(gè)新的碼段編碼時(shí),只要指出字典中現(xiàn)有碼段的位置,把新字符附在后面即可。LZ算法舉例:考慮二進(jìn)制序列

按上述編碼方式序列可以分解為如下碼段:1,0,10,11,01,00,100,111,010,1000,011,001,110,101,10001,1011序列中的每一個(gè)碼段是前面某一個(gè)碼段加上一個(gè)新的信源輸出字符構(gòu)成的。為了編碼,需要構(gòu)造位置字典。字典位置

字典內(nèi)容

碼字

100011000012001000000030011100001040100110001150101010010160110000010070111100001108100011101001LZ算法的字典LZ算法的字典(續(xù))910010100101010101010000111011101101101011121100001011011311011100100014111010100111151111100011010116101111101LZ算法的信源譯碼器是編碼的逆過(guò)程,根據(jù)碼字的特點(diǎn),首先可以構(gòu)造出編碼字典,然后對(duì)接收序列作相應(yīng)的解碼。需要指出,上述例如中,將44位信源比特編碼成16個(gè)碼字,每個(gè)碼字5比特,總共是80位碼字。因此這種算法沒(méi)有提供任何數(shù)據(jù)壓縮。本例編碼效率低下的原因是由于所考慮的序列非常短。隨著序列長(zhǎng)度的增加,LZ算法的效率越來(lái)越高,可以實(shí)現(xiàn)信源輸出序列的壓縮。如何選擇字典列表的總長(zhǎng)度是LZ算法實(shí)際應(yīng)用的重要問(wèn)題。一般而言,無(wú)論表有多大,總有可能溢出。為了解決溢出問(wèn)題,信源編譯碼器必須協(xié)調(diào)一致,將無(wú)用的碼段從各自的字典中刪除,在它們留下的位置上換上新的碼段。Ziv和Lampel證明,將LZ編碼應(yīng)用于遍歷平穩(wěn)離散信源時(shí),其壓縮比可以以概率1收斂于該信源的仙農(nóng)信息熵。LZ編碼壓縮比可以到達(dá)信源熵率這一結(jié)論一方面說(shuō)明LZ編碼的有效性,但也說(shuō)明通用編碼不能做的比Huffman編碼更好。LZ算法已經(jīng)廣泛應(yīng)用于計(jì)算機(jī)文件的壓縮。Unix操作系統(tǒng)中的“compress〞、“uncompress〞以及Windows操作系統(tǒng)中的Winzip、Winrar等文件壓縮軟件中采用的算法就是LZ算法的不同變種。實(shí)用化與純理論上的要求之間存在著一定差異:首先:實(shí)際比理論要復(fù)雜,理論分析時(shí)往往認(rèn)為信源平穩(wěn)遍歷的,是遵從某一個(gè)分布特征,……等等,實(shí)際上是辦不到的,最多是近似上大致滿(mǎn)足;其次:理論上追求是性能越優(yōu)良越好,追求最正確,實(shí)際上是要更側(cè)重可實(shí)現(xiàn)性,追求性能與可實(shí)現(xiàn)性之間的折衷,追求準(zhǔn)最正確。第三:理論上往往分析各種單一最正確化方法與性能,實(shí)際上往往是實(shí)用主義,采用多種組合準(zhǔn)最正確化。這一點(diǎn),以后在圖像信源編碼中表達(dá)更明顯。實(shí)用型信源編碼

下面,我們分別討論三類(lèi)代表性信源:1〕文件信源〔無(wú)失真信源編碼〕;2〕語(yǔ)音信源〔限失真信源編碼〕3〕圖像信源〔限失真信源編碼〕實(shí)用型信源編碼〔續(xù)〕1>文件傳真信源編碼:關(guān)于文件傳真的一些有關(guān)知識(shí):(1)CCITT建議的文件傳真的兩種分辨率:A行分辨率:1728相素/行(即8樣點(diǎn)/mm),

列分辨率:3.85行/mm;B行分辨率:8樣點(diǎn)/mm,

列分辨率:7.7行/mm;

〔2〕我國(guó)標(biāo)準(zhǔn):A行分辨率:8樣點(diǎn)/mm,列分辨率:4行/mm;B行分辨率:8樣點(diǎn)/mm,列分辨率:8行/mm;以上是對(duì)A4文件制定的〔210*297mm〕。如果采用各個(gè)像素按0.1直接編碼,一頁(yè)A4文件,分辨率為5樣點(diǎn)/mm〔行,列〕那么需傳送:,用2400b/s(或4800b/s)那么需11(5.5)分鐘,假設(shè)文件壓縮中僅能利用文件信源的一維概率特征,據(jù)測(cè)試有:pw=93.3%,pB=6.7%,1>文件信源編碼〔續(xù)〕那么H〔U〕=-pwlogpw–pBlogpB=-0.933log0.933–0.677log0.677=0.3546bit一維熵編碼理論壓縮比KO為:可見(jiàn)壓縮比不高。假設(shè)二維信元符號(hào)〔消息〕改成“0〞,“1〞游程,即連“0〞,連“1〞的游程為單元,那么可得1>文件信源編碼〔續(xù)〕由二進(jìn)制〔m=2〕信源編碼定理,有對(duì)平均每個(gè)像素有:其中

1>文件信源編碼〔續(xù)〕假設(shè)定義:那么可求得:再定義:那么可求得:1>文件信源編碼〔續(xù)〕這時(shí),黑、白游程混合編碼條件下,平均每個(gè)像素的信源編碼定理。(即像素熵編碼定理)最終可求得:理論上極限壓縮比為:對(duì)A4文件,中文七種樣張統(tǒng)計(jì)特性如下:

1>文件信源編碼〔續(xù)〕例:將無(wú)失真信源編碼理論用于編碼。目前第三類(lèi)機(jī)采用的就是修正的哈夫曼碼或者是算術(shù)碼。修正主要有三點(diǎn):1〕被編碼的消息〔符號(hào)〕不是簡(jiǎn)單的“0〞和“1〞;而是“0〞串〔0游程〕“1〞串〔1游程〕的不同長(zhǎng)度。2〕信源制定碼表的依據(jù)。不是實(shí)時(shí)的實(shí)際信源,而是采用8種〔7種〕典型樣張可測(cè)得的統(tǒng)計(jì)特性來(lái)近似代表實(shí)際信源的統(tǒng)計(jì)特性。3〕將對(duì)整個(gè)一維1728像素的統(tǒng)計(jì)特性碼表,在制定碼表的分解、簡(jiǎn)化為兩類(lèi)碼表的合成,即將黑白游程長(zhǎng)度分解為:其中K為根本游程長(zhǎng)度〔0~63位〕的整數(shù)倍,由它可構(gòu)成一個(gè)構(gòu)造碼表,而R其長(zhǎng)度為0至63,稱(chēng)為結(jié)尾碼,它是根本游程碼的碼表。1>文件信源編碼〔續(xù)〕下面舉一個(gè)例子說(shuō)明:某一A4文件中一段特性如下:編碼前總碼長(zhǎng):

LW1=131LB1=4LW2=6LB2=65L=lW1+lB1+lW2+lB2=131+4+6+65=206位將它進(jìn)行修正哈夫曼編碼〔MH〕,分別查黑〔B〕、白〔W〕游程4的結(jié)尾碼表,構(gòu)造碼表有:lW1=131=2*64+3=128+3,查白游程構(gòu)造碼表:128=>10010查白游程結(jié)尾碼表:3=>1000故經(jīng)哈夫曼編碼后為:100101000共9位1>文件信源編碼〔續(xù)〕同理:lB1=4,查黑游程結(jié)尾碼表:4=>011〔3位〕lW2=6,查白游程結(jié)尾碼表:6=>1110〔4位〕lB2=65=64+1:64=>00000011111=>010Huffman碼:0000001111010〔13位〕Huffman編碼后總長(zhǎng)為:9+3+4+13=29。實(shí)際壓縮比:所以上述截?cái)嗍綄?shí)際編碼修正方法對(duì)信源統(tǒng)計(jì)特性影響不大。工程上可實(shí)用。

1>文件信源編碼〔續(xù)〕實(shí)際統(tǒng)計(jì)分析說(shuō)明:對(duì)于A(yíng)4文件,對(duì)中文七類(lèi)樣張的統(tǒng)計(jì)平均壓縮比這一結(jié)論在前面已計(jì)算過(guò)。1>文件信源編碼〔續(xù)〕2>語(yǔ)音編碼

〔1〕混合編碼:以參量編碼為主,以波形編碼為輔。在滿(mǎn)足根本質(zhì)量前提下,盡可能提高壓縮率。下面,我們首先從理論上來(lái)分析各類(lèi)語(yǔ)音編碼的潛力。首先分析波形編碼:引用R(D)函數(shù)理論,假設(shè)語(yǔ)音近似遵從正態(tài)分布〔實(shí)際上為近似Gamma分布〕是一個(gè)滿(mǎn)足短時(shí)廣義平穩(wěn)的一階正態(tài)馬氏鏈。其相關(guān)矩陣為R(τ)=σ2ρ│τ│,其中σ2為方差,ρ為相關(guān)系數(shù),在均方誤差保真度準(zhǔn)那么下,由信息論可求得:R(D)=1/2log2σ2(1-ρ2)/D其中:σ2/D為信噪比,且波形編碼取樣點(diǎn)間的相關(guān)系數(shù)ρ≈0.96,那么可算得:信噪比(dB)35322825232017R(D)(bit)43.52.52.3421.51壓縮倍數(shù)k22.283.23.4245.382>語(yǔ)音編碼〔續(xù)〕〔1〕混合編碼〔續(xù)〕上述表格繪出的R(D)值是最保守的估計(jì)值,原因是:其一:正態(tài)分布R(D)值大于其他一切分布R(D)值,故語(yǔ)音實(shí)際分布的R(D)值大于上述R(D)估計(jì)值.其二:接收語(yǔ)音最終是人耳,計(jì)算中未算入人耳的主觀(guān)性能引入的R(D)值變化,故實(shí)際上R(D)還要求按照一般能進(jìn)入公用移動(dòng)網(wǎng),大致要求其信噪比為24-25dB,從表中可查出壓縮倍數(shù)k≈3.5,再考慮上述兩個(gè)因素,一般可認(rèn)為k≈4左右.其次,在分析參量編碼,由語(yǔ)音分析,可認(rèn)為語(yǔ)音最基本組成單元為音素.例如英語(yǔ)為例:其音素大約有個(gè),同時(shí)按照通常講話(huà)速率,每秒大約發(fā)出10個(gè)音素。這時(shí)英語(yǔ)語(yǔ)音信源給出的信息率為:

僅從可懂度看,它與目前PCM標(biāo)準(zhǔn)速率64kb/s相比,可求得壓縮比方下:〔1〕混合編碼〔續(xù)〕可見(jiàn)其潛力很大,目前實(shí)驗(yàn)室聲碼器〔參量編碼〕已可做到600bit/s左右,尚相差7-8倍。實(shí)際上,除了保密通信以及一些特殊的軍事通信以外很少采用這類(lèi)低質(zhì)量的參量編碼〔聲碼器〕。目前,在移動(dòng)通信等領(lǐng)域,已將信源編碼的焦點(diǎn)轉(zhuǎn)移至混合編碼的方向。自八十年代以來(lái),CCITT與現(xiàn)在的ITU—T等國(guó)際組織制定了一系列混合編碼的標(biāo)準(zhǔn)如下:

標(biāo)準(zhǔn)編碼傳輸速率質(zhì)量(mos)備注G711PCM64Kbit/s4.2

G722

64,56或48bit/s

G726ADPCM40,32,24,16Kbit/s4.1

G727

同上4.1

G728LD-CELP16Kbit/s4.1

G729CS-ACELP8Kbit/s4.1

寬帶語(yǔ)音編碼〔1〕混合編碼〔續(xù)〕標(biāo)準(zhǔn)編碼傳輸速率質(zhì)量(mos)備注G723-1

6.3-5.3Kbit/s4-3.6

GSM-SRRPELD13Kbit/s3.6

GSM-ER

13Kbit/s4

IS-96(Ⅱ)

13Kbit/s4.1

IS-641

8Kbit/s4

IS-54

8Kbit/s3.6

IS-96(Ⅰ)

8Kbit/s3.4

GSM-HR

6.5Kbit/s3.6

FS-1016

4.8Kbit/s3.2

FS-1015

2.4Kbit/s2.4

用于多媒體低比特率〔1〕混合編碼〔續(xù)〕決定混合編碼的主要技術(shù)指標(biāo):混合編碼的綜合性能=f(比特率、質(zhì)量、時(shí)延、復(fù)雜度)下面分別討論這四個(gè)指標(biāo):〔1〕比特率〔b/s〕:數(shù)量指標(biāo),取決于信源的壓縮率。比特率越低,一般質(zhì)量也會(huì)相應(yīng)降低,為了補(bǔ)救質(zhì)量往往又可以采用提高復(fù)雜度〔硬、軟件〕,但是他又會(huì)帶來(lái)處理時(shí)延的增大。因此要考慮綜合優(yōu)化。降低比特率另一措施是將固定速率改變?yōu)榭勺兯俾蔍S—95中就采用了基于不同背景噪聲電平的1、1/2、1/4、1/8四類(lèi)不同語(yǔ)音速率。這樣可以大大降傳送語(yǔ)音的平均速率?!?〕混合編碼〔續(xù)〕〔2〕

質(zhì)量:目前語(yǔ)音質(zhì)量的評(píng)估方法是采用CCITT建議的5級(jí)評(píng)分的“平均評(píng)價(jià)得分MOS“方法,4-5分列為高質(zhì)量可達(dá)參加公用網(wǎng)要求;3-4分為根本達(dá)標(biāo),一般可入移動(dòng)網(wǎng)要求;3分以下為不合格。評(píng)分測(cè)試條件:無(wú)背景噪聲,無(wú)傳輸過(guò)失、無(wú)模擬轉(zhuǎn)接與二次編碼。顯然這些條件過(guò)于理想化?!?〕時(shí)延:語(yǔ)音為實(shí)時(shí)通信系統(tǒng)對(duì)時(shí)延很敏感,時(shí)延主要包括:算法時(shí)延、處理時(shí)延和傳輸時(shí)延。三類(lèi)時(shí)延之和稱(chēng)為單向系統(tǒng)時(shí)延,如果無(wú)回波,它最大允許值為400ms,最好在200ms以下,又回波,僅允許25ms?!?〕混合編碼〔續(xù)〕〔4〕復(fù)雜度:語(yǔ)音編碼通常是采用DSP來(lái)實(shí)現(xiàn)的。這些芯片往往可采用每秒計(jì)算百萬(wàn)條信令的速度〔mips〕,隨機(jī)存儲(chǔ)器〔RAM〕,和只讀存儲(chǔ)器〔ROM〕來(lái)描述。目前一般將小于15mips的語(yǔ)音編碼為低復(fù)雜度編碼,而將大于30mips的語(yǔ)音編碼為高復(fù)雜度編碼。在一個(gè)芯片上裝有越多的RAM和ROM,芯片價(jià)格就越高,體積就越大,所以復(fù)雜度越高,性能越好,但同時(shí)受到本錢(qián),功耗,時(shí)延等因素制約?!?〕混合編碼〔續(xù)〕以下表格給出這些年來(lái),ITU建議的四個(gè)標(biāo)準(zhǔn):G729,G729A以及兩類(lèi)G723—1的四大指標(biāo)量級(jí):

G729G729-AG723-1G723-1比特率(kb/s)886.35.3話(huà)音質(zhì)量(MOS得分)4.14.14.13.6幀長(zhǎng)(ms)10101030子幀長(zhǎng)(ms)557.57.5算法延時(shí)(ms)151537.537.5復(fù)雜度MIPS(定點(diǎn)DSP)2010.514.616RAM(16bit字長(zhǎng))2.7k2k2.2k2.2k〔1〕混合編碼〔續(xù)〕ADPCM是在DPCM的根底上開(kāi)展起來(lái)的。而DPCM前面已討論過(guò)。由于預(yù)測(cè)誤差的幅度變化范圍遠(yuǎn)小于原始信號(hào)〔預(yù)測(cè)前〕幅度變化范圍,因此在相同量化噪聲條件下DPCM量化比特?cái)?shù)要遠(yuǎn)少于PCM。從而到達(dá)語(yǔ)音壓縮編碼的目的。ADPCM與DPCM相比,主要區(qū)別在于A(yíng)DPCM中的量化囂和預(yù)測(cè)囂采用了自適應(yīng)控制,同時(shí)在譯碼囂中多了一個(gè)同步編碼調(diào)整,其作用是為了在同步級(jí)連時(shí)不產(chǎn)生誤差積累。八十年代以來(lái)32kb/sADPCM已日趨成熟。它具有與PCM相近的質(zhì)量。下面,給出G721ADPCM編、譯碼框圖:2>語(yǔ)音編碼〔續(xù)〕〔2〕波形編碼ADPCM根本原理〔2〕波形編碼ADPCM根本原理〔續(xù)〕<32kb/sADPCM編碼系統(tǒng)S>

<32kb/sADPCM譯碼系統(tǒng)S>

〔2〕波形編碼ADPCM根本原理〔續(xù)〕由圖可見(jiàn),在編碼器中,輸入將八位非線(xiàn)性PCMc‘(n)變換成12位的線(xiàn)性碼X〔n〕,再由16電平自適應(yīng)量化器將差值信號(hào)d〔n〕轉(zhuǎn)化成四位二進(jìn)制碼c〔n〕,同時(shí)為了適應(yīng)不同的輸入信號(hào)采用了自適應(yīng)參數(shù)來(lái)控制量化階距大小,它是由定標(biāo)因子自適應(yīng)和自適應(yīng)速度控制兩局部組成。譯碼系統(tǒng)中的大局部與編碼器電路相同。主要是多了一個(gè)同步編碼調(diào)整電路,其作用是為了在同步級(jí)聯(lián)工作時(shí),不產(chǎn)生誤差積累?!?〕波形編碼ADPCM根本原理〔續(xù)〕參量編碼出發(fā)點(diǎn)是跟蹤波形產(chǎn)生過(guò)程,傳送好產(chǎn)生波形的參量,而不是波形本身。在收端通過(guò)發(fā)聲模型綜合成人工合成語(yǔ)言。固有時(shí)稱(chēng)它為生碼器。語(yǔ)音產(chǎn)生模型如下:

2>語(yǔ)音編碼〔續(xù)〕〔3〕參量編碼的線(xiàn)性預(yù)測(cè)人工合成語(yǔ)音的15個(gè)主要參量:12個(gè)時(shí)變?yōu)V波器鼓勵(lì)參數(shù):{α}i=1,2…..12;音調(diào)周期p〔基音周期〕;清濁音判決u/v;增益控制參量G;下面給出現(xiàn)線(xiàn)性預(yù)測(cè)LPC原理框圖如下:〔3〕參量編碼的線(xiàn)性預(yù)測(cè)〔續(xù)〕線(xiàn)性預(yù)測(cè)目前仍是混合編碼中聲碼器實(shí)現(xiàn)的主流,近些年來(lái),以下三方面值得注意:1〕提高合成語(yǔ)音質(zhì)量措施:采用余數(shù)鼓勵(lì)聲碼器RELP;多脈沖鼓勵(lì)聲碼器MELP;聲道參數(shù)模型的改善;2

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論