信息論-無(wú)失真信源編碼

上傳人：p*** IP屬地：浙江上傳時(shí)間：2023-04-16 格式：PPTX 頁(yè)數(shù)：78 大小：1.29MB 積分：25 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩73頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

信息論_無(wú)失真信源編碼第一頁(yè)，共78頁(yè)。信源編碼：以提高通信有效性為目的的編碼。通常通過(guò)壓縮信源的冗余度來(lái)實(shí)現(xiàn)。采用的一般方法是壓縮每個(gè)信源符號(hào)的平均比特?cái)?shù)或信源的碼率。即同樣多的信息用較少的碼率傳送，使單位時(shí)間內(nèi)傳送的平均信息量增加，從而提高通信的有效性。信道編碼：是以提高信息傳輸?shù)目煽啃詾槟康牡木幋a。通常通過(guò)增加信源的冗余度來(lái)實(shí)現(xiàn)。采用的一般方法是增大碼率/帶寬。與信源編碼正好相反。密碼：是以提高通信系統(tǒng)的安全性為目的的編碼。通常通過(guò)加密和解密來(lái)實(shí)現(xiàn)。從信息論的觀點(diǎn)出發(fā)，“加密”可視為增熵的過(guò)程，“解密”可視為減熵的過(guò)程。第一節(jié)引言第二頁(yè)，共78頁(yè)。信源編碼理論是信息論的一個(gè)重要分支，其理論基礎(chǔ)是信源編碼的兩個(gè)定理。無(wú)失真信源編碼定理：是離散信源/數(shù)字信號(hào)編碼的基礎(chǔ)；限失真信源編碼定理：是連續(xù)信源/模擬信號(hào)編碼的基礎(chǔ)。信源編碼的分類：離散信源編碼、連續(xù)信源編碼和相關(guān)信源編碼三類。離散信源編碼：獨(dú)立信源編碼，可做到無(wú)失真編碼；連續(xù)信源編碼：獨(dú)立信源編碼，只能做到限失真信源編碼；相關(guān)信源編碼：非獨(dú)立信源編碼。第一節(jié)引言第三頁(yè)，共78頁(yè)。第二節(jié)碼的分類編碼器可以看作這樣一個(gè)系統(tǒng)，它的輸入端為原始信源S，其符號(hào)集為；而信道所能傳輸?shù)姆?hào)集為編碼器的功能是用符號(hào)集X中的元素，將原始信源的符號(hào)變換為相應(yīng)的碼字符號(hào)，所以編碼器輸出端的符號(hào)集為

稱為碼字，為碼字的碼元個(gè)數(shù)，稱為碼字的碼字長(zhǎng)度，簡(jiǎn)稱碼長(zhǎng)。編碼器第四頁(yè)，共78頁(yè)。1、二元碼：碼符號(hào)集X={0,1}，如果要將信源通過(guò)二元信道傳輸，必須將信源編成二元碼，這也是最常用的一種碼。2、等長(zhǎng)碼：若一組碼中所有碼字的長(zhǎng)度都相同，稱為等長(zhǎng)碼。3、變長(zhǎng)碼：若一組碼中所有碼字的長(zhǎng)度各不相同，稱為變長(zhǎng)碼。4、非奇異碼：若一組碼中所有碼字都不相同，稱為非奇異碼。第二節(jié)碼的分類第五頁(yè)，共78頁(yè)。5、奇異碼：若一組碼中有相同的碼字，稱為奇異碼。6、碼的N次擴(kuò)展：若碼，碼則稱碼B為碼C的N次擴(kuò)展碼。7、唯一可譯碼：若碼的任意一串有限長(zhǎng)的碼符號(hào)序列只能被唯一的譯成所對(duì)應(yīng)的信源符號(hào)序列，則稱此碼為唯一可譯碼。第二節(jié)碼的分類第六頁(yè)，共78頁(yè)。例：如果有四個(gè)信源符號(hào){s1，s2，s3，s4}，采用二元編碼，l=2，則可以編成s1=00，s2=01，s3=10，s4=11。第三節(jié)等長(zhǎng)信源編碼定理如果我們要對(duì)信源的N次擴(kuò)展信源進(jìn)行編碼，也必須滿足，兩邊取對(duì)數(shù)得：表示平均每個(gè)信源符號(hào)所需的碼符號(hào)個(gè)數(shù)。若對(duì)信源進(jìn)行等長(zhǎng)編碼，則必須滿足其中，l是碼長(zhǎng)，r是碼符號(hào)集中的碼元數(shù)，q信源符號(hào)個(gè)數(shù)。第七頁(yè)，共78頁(yè)。第二節(jié)等長(zhǎng)碼例：對(duì)英文電報(bào)得32個(gè)符號(hào)進(jìn)行二元編碼，根據(jù)上述關(guān)系：我們繼續(xù)討論上面得例子，我們已經(jīng)知道英文的極限熵是1.4bit,遠(yuǎn)小于5bit，也就是說(shuō)，5個(gè)二元碼符號(hào)只攜帶1.4bit的信息量，實(shí)際上，5個(gè)二元符號(hào)最多可以攜帶5bit信息量。我們可以做到讓平均碼長(zhǎng)縮短，提高信息傳輸率第八頁(yè)，共78頁(yè)。第二節(jié)等長(zhǎng)碼我們舉例說(shuō)明：

設(shè)信源而其依賴關(guān)系為：第九頁(yè)，共78頁(yè)。第二節(jié)等長(zhǎng)碼若不考慮符號(hào)間的依賴關(guān)系，可得碼長(zhǎng)l＝2若考慮符號(hào)間的依賴關(guān)系，則對(duì)此信源作二次擴(kuò)展可見(jiàn)，由于符號(hào)間依賴關(guān)系的存在，擴(kuò)展后許多符號(hào)出現(xiàn)的概率為0，此信源只有4個(gè)字符，可得碼長(zhǎng)，但平均每個(gè)信源符號(hào)所需碼符號(hào)為第十頁(yè)，共78頁(yè)。第二節(jié)等長(zhǎng)碼我們?nèi)砸杂⑽碾妶?bào)為例，在考慮了英文字母間的相關(guān)性之后，我們對(duì)信源作N次擴(kuò)展，在擴(kuò)展后形成的信源（也就是句子）中，有些句子是有意義的，而有些句子是沒(méi)有意義的，我們可以只對(duì)有意義的句子編碼，而對(duì)那些沒(méi)有意義的句子不進(jìn)行編碼，這樣就可以縮短每個(gè)信源符號(hào)所需的碼長(zhǎng)。等長(zhǎng)信源編碼定理給出了進(jìn)行等長(zhǎng)信源編碼所需碼長(zhǎng)的極限值。第十一頁(yè)，共78頁(yè)。定理4.3（等長(zhǎng)信源編碼定理）一個(gè)熵為H(S)的離散無(wú)記憶信源，若對(duì)其N次擴(kuò)展信源進(jìn)行等長(zhǎng)r元編碼，碼長(zhǎng)為l，對(duì)于任意大于0，只要滿足當(dāng)N無(wú)窮大時(shí)，則可以實(shí)現(xiàn)幾乎無(wú)失真編碼，反之，若：則不可能實(shí)現(xiàn)無(wú)失真編碼，當(dāng)N趨向于無(wú)窮大是，譯碼錯(cuò)誤率接近于1。第三節(jié)等長(zhǎng)信源編碼定理第十二頁(yè)，共78頁(yè)。定理4.3的條件式可寫成：左邊表示長(zhǎng)為的碼符號(hào)所能載荷的最大信息量，而右邊代表長(zhǎng)為N的序列平均攜帶的信息量。因此，只要碼字傳輸?shù)男畔⒘看笥谛旁葱蛄袛y帶的信息量，總可以實(shí)現(xiàn)無(wú)失真編碼。第三節(jié)等長(zhǎng)信源編碼定理定理4.3的條件式也可寫成：令：稱之為編碼信息率?？梢?jiàn)，編碼信息率大于信源的熵，才能實(shí)現(xiàn)無(wú)失真編碼。第十三頁(yè)，共78頁(yè)。最佳編碼效率為：第三節(jié)等長(zhǎng)信源編碼定理為了衡量編碼效果，引進(jìn)稱為編碼效率。第十四頁(yè)，共78頁(yè)。例：設(shè)離散無(wú)記憶信源：若采用等長(zhǎng)二元編碼，要求編碼效率，允許錯(cuò)誤率，則：也就是長(zhǎng)度要達(dá)到4130萬(wàn)以上。第三節(jié)等長(zhǎng)信源編碼定理第十五頁(yè)，共78頁(yè)。1、唯一可譯變長(zhǎng)碼與及時(shí)碼信源符號(hào)出現(xiàn)概率碼1碼2碼3碼4s1s2s3s41/21/41/81/80110011010000111010010001010010001第四節(jié)變長(zhǎng)信源編碼定理第十六頁(yè)，共78頁(yè)。第五節(jié)變長(zhǎng)碼碼1是一個(gè)奇異碼，不是唯一可譯碼；碼2也不是唯一可譯碼，因?yàn)槭盏揭淮蛄惺?，無(wú)法唯一譯出對(duì)應(yīng)的原符號(hào)序列，如0100，即可譯作s4s3s1,也可譯作s4s1s3,s1s2s3或s1s2s1s1；碼3和碼4都是唯一可譯的。但碼3和碼4也不太一樣，碼4稱作逗點(diǎn)碼，只要收到1，就可以立即作出譯碼；而碼3不同，當(dāng)受到一個(gè)或幾個(gè)碼是，必須參考后面的碼才能作出判斷。

定義，在唯一可譯碼中，有一類碼，它在譯碼是無(wú)須參考后面的碼字就可以作出判斷，這種碼稱為即時(shí)碼。第十七頁(yè)，共78頁(yè)。定義：如果一個(gè)碼組中的任一個(gè)碼字都不是另一個(gè)碼字的續(xù)長(zhǎng)，或者說(shuō)，任何一個(gè)碼字后加上若干碼元后都不是碼組中另一個(gè)碼字，則稱為即時(shí)碼。所有的碼非奇異碼唯一可譯碼即時(shí)碼第四節(jié)變長(zhǎng)信源編碼定理第十八頁(yè)，共78頁(yè)。2、即時(shí)碼的樹圖構(gòu)造法我們可以用樹圖的形式構(gòu)造即時(shí)碼，如01001111010010001碼4的樹圖10110000101001000碼3的樹圖第四節(jié)變長(zhǎng)信源編碼定理樹根——碼字的起點(diǎn)樹枝數(shù)——碼的數(shù)節(jié)點(diǎn)數(shù)——碼字的一部分節(jié)數(shù)——碼長(zhǎng)端點(diǎn)——碼字滿樹——等長(zhǎng)碼非滿樹——變長(zhǎng)碼第十九頁(yè)，共78頁(yè)。在每個(gè)節(jié)點(diǎn)上都有r個(gè)分枝的樹稱為整樹，否則稱為非整樹。即時(shí)碼的樹圖還可以用來(lái)譯碼第四節(jié)變長(zhǎng)信源編碼定理第二十頁(yè)，共78頁(yè)。3、克拉夫特（Kraft）不等式定理4.4對(duì)于碼符號(hào)為的任意即時(shí)碼，所對(duì)應(yīng)的碼長(zhǎng)為，則必定滿足：反之，若碼長(zhǎng)滿足上式，則一定存在這樣的即時(shí)碼?？梢愿鶕?jù)即時(shí)碼的樹圖構(gòu)造法來(lái)證明。后來(lái)，B.McMillan證明了對(duì)于唯一可譯碼也必須滿足上面的不等式，第四節(jié)變長(zhǎng)信源編碼定理第二十一頁(yè)，共78頁(yè)。定理4.6若存在一個(gè)碼長(zhǎng)為唯一可譯碼，則一定存在一個(gè)同樣長(zhǎng)度的即時(shí)碼。這說(shuō)明，其他唯一可譯碼在碼長(zhǎng)方面并不比即時(shí)碼占優(yōu)。所以在討論唯一可譯碼時(shí)，只需要討論即時(shí)碼就可以了。第四節(jié)變長(zhǎng)信源編碼定理第二十二頁(yè)，共78頁(yè)。設(shè)信源編碼后的碼字為：碼長(zhǎng)為：則這個(gè)碼的平均長(zhǎng)度為：平均每個(gè)碼元攜帶的信息量即編碼后的信息傳輸率為：若有一個(gè)唯一可譯碼，它的平均碼長(zhǎng)小于其他唯一可譯碼的長(zhǎng)度，則稱此碼為緊致碼或最佳碼，無(wú)失真信源編碼的基本問(wèn)題就是尋找緊致碼。第四節(jié)變長(zhǎng)信源編碼定理第二十三頁(yè)，共78頁(yè)。定理4.8無(wú)失真變長(zhǎng)信源編碼定理（香農(nóng)第一定理）離散無(wú)記憶信源S的N次擴(kuò)展信源，其熵為，并且編碼器的碼元符號(hào)集為A：對(duì)信源進(jìn)行編碼，總可以找到一種編碼方法，構(gòu)成單義可譯碼，使信源S中每個(gè)符號(hào)si所需要的平均碼長(zhǎng)滿足當(dāng)則得：第四節(jié)變長(zhǎng)信源編碼定理第二十四頁(yè)，共78頁(yè)。這個(gè)定理是香農(nóng)信息論中非常重要得一個(gè)定理，它指出，要做到無(wú)失真得信源編碼，信源每個(gè)符號(hào)所需要的平均碼元數(shù)就是信源的熵值，如果小于這個(gè)值，則唯一可譯碼不存在，可見(jiàn)，熵是無(wú)失真信源編碼的極限值。定理還指出，通過(guò)對(duì)擴(kuò)展信源進(jìn)行編碼，當(dāng)N趨向于無(wú)窮時(shí)，平均碼長(zhǎng)可以趨進(jìn)該極限值。還可以證明，如果我們不確切知道信源的概率分布，我們用估計(jì)的概率分布去進(jìn)行編碼時(shí)，平均碼長(zhǎng)會(huì)加長(zhǎng)，但是如果估計(jì)的偏差不大的話，平均碼長(zhǎng)也不會(huì)增加太多（定理4.9的內(nèi)容）。第四節(jié)變長(zhǎng)信源編碼定理第二十五頁(yè)，共78頁(yè)。由得：就是編碼后每個(gè)信源符號(hào)所攜帶的平均信息量第一定理可以表述如下：若就存在唯一可譯變長(zhǎng)碼，若則不存在唯一可譯變長(zhǎng)碼。第四節(jié)變長(zhǎng)信源編碼定理定義：若從信道角度講，信道的信息傳輸率因?yàn)椋核援?dāng)平均碼長(zhǎng)達(dá)到極限值時(shí)，編碼后信道的信息傳輸率為：第二十六頁(yè)，共78頁(yè)。無(wú)噪信道編碼定理若信道的信息傳輸率R不大于信道容量C，總能對(duì)信源的輸出進(jìn)行適當(dāng)?shù)木幋a，使的在無(wú)噪無(wú)損信道上能無(wú)差錯(cuò)的以最大信息傳輸率C傳輸信息，若R小于C，則無(wú)差錯(cuò)傳輸是不可能的。第四節(jié)變長(zhǎng)信源編碼定理編碼效率：碼的剩余度：在二元無(wú)噪無(wú)損信道中：在二元無(wú)噪無(wú)損信道中信息傳輸率：第二十七頁(yè)，共78頁(yè)。例：其熵為：H(S)=0.811我們令s1=0，s2=1，這時(shí)平均碼長(zhǎng)，編碼的效率為。第四節(jié)變長(zhǎng)信源編碼定理二次擴(kuò)展信源進(jìn)行編碼：即時(shí)碼s1s19/160s1s23/1610s2s13/16110s2s21/16111第二十八頁(yè)，共78頁(yè)。第五節(jié)香農(nóng)編碼設(shè)離散無(wú)記憶信源二進(jìn)制香農(nóng)碼的編碼步驟如下：將信源符號(hào)按概率從大到小的順序排列，為方便起見(jiàn)，令p(x1)≥p(x2)≥…≥p(xn)令p(x0)=0，用pa(xj)，j=i+1表示第i個(gè)碼字的累加概率，則：確定滿足下列不等式的整數(shù)ki，并令ki為第i個(gè)碼字的長(zhǎng)度－log2

p(xn)≤ki<－log2

p(xn)+1將pa(xj)用二進(jìn)制表示，并取小數(shù)點(diǎn)后ki位作為符號(hào)xi的編碼。第二十九頁(yè)，共78頁(yè)。第五節(jié)香農(nóng)編碼例有一單符號(hào)離散無(wú)記憶信源對(duì)該信源編二進(jìn)制香農(nóng)碼。其編碼過(guò)程如下表所示。第三十頁(yè)，共78頁(yè)。第五節(jié)香農(nóng)編碼計(jì)算出給定信源香農(nóng)碼的平均碼長(zhǎng)若對(duì)上述信源采用等長(zhǎng)編碼，要做到無(wú)失真譯碼，每個(gè)符號(hào)至少要用3個(gè)比特表示。相比較，香農(nóng)編碼對(duì)信源進(jìn)行了壓縮。由離散無(wú)記憶信源熵定義，可計(jì)算出：對(duì)上述信源采用香農(nóng)編碼的信息率為編碼效率為信源熵和信息率之比。則可以看出，編碼效率并不是很高。第三十一頁(yè)，共78頁(yè)。第六節(jié)費(fèi)諾編碼費(fèi)諾編碼也是一種常見(jiàn)的信源編碼方法。編碼步驟如下：將概率按從大到小的順序排列，令p(x1)≥p(x2)≥…≥p(xn)按編碼進(jìn)制數(shù)將概率分組，使每組概率盡可能接近或相等。如編二進(jìn)制碼就分成兩組，編m進(jìn)制碼就分成m組。給每一組分配一位碼元。將每一分組再按同樣原則劃分，重復(fù)步驟2和3，直至概率不再可分為止。第三十二頁(yè)，共78頁(yè)。第六節(jié)費(fèi)諾編碼例設(shè)有一單符號(hào)離散信源對(duì)該信源編二進(jìn)制費(fèi)諾碼。編碼過(guò)程如下表。第三十三頁(yè)，共78頁(yè)。第六節(jié)費(fèi)諾編碼該信源的熵為平均碼長(zhǎng)為編碼效率為本例中費(fèi)諾編碼有較高的編碼效率。費(fèi)諾碼比較適合于每次分組概率都很接近的信源。特別是對(duì)每次分組概率都相等的信源進(jìn)行編碼時(shí)，可達(dá)到理想的編碼效率。第三十四頁(yè)，共78頁(yè)。第六節(jié)費(fèi)諾編碼題中碼字還可用碼樹來(lái)表示，如圖所示。第三十五頁(yè)，共78頁(yè)。第七節(jié)霍夫曼編碼霍夫曼(Huffman)編碼是一種效率比較高的變長(zhǎng)無(wú)失真信源編碼方法。編碼步驟二進(jìn)制哈夫曼編碼m進(jìn)制哈夫曼編碼第三十六頁(yè)，共78頁(yè)。第七節(jié)霍夫曼編碼——編碼步驟將信源符號(hào)按概率從大到小的順序排列，令p(x1)≥p(x2)≥…≥p(xn)給兩個(gè)概率最小的信源符號(hào)p(xn-1)和p(xn)各分配一個(gè)碼位“0”和“1”，將這兩個(gè)信源符號(hào)合并成一個(gè)新符號(hào)，并用這兩個(gè)最小的概率之和作為新符號(hào)的概率，結(jié)果得到一個(gè)只包含(n－1)個(gè)信源符號(hào)的新信源。稱為信源的第一次縮減信源，用S1表示。將縮減信源S1的符號(hào)仍按概率從大到小順序排列，重復(fù)步驟2，得到只含(n－2)個(gè)符號(hào)的縮減信源S2。重復(fù)上述步驟，直至縮減信源只剩兩個(gè)符號(hào)為止，此時(shí)所剩兩個(gè)符號(hào)的概率之和必為1。然后從最后一級(jí)縮減信源開始，依編碼路徑向前返回，就得到各信源符號(hào)所對(duì)應(yīng)的碼字。第三十七頁(yè)，共78頁(yè)。第七節(jié)霍夫曼編碼——二進(jìn)制哈夫曼編碼例設(shè)單符號(hào)離散無(wú)記憶信源如下，要求對(duì)信源編二進(jìn)制霍夫曼碼。編碼過(guò)程如下圖（后頁(yè)）。在圖中讀取碼字的時(shí)候，一定要從后向前讀，此時(shí)編出來(lái)的碼字才是可分離的異前置碼。若從前向后讀取碼字，則碼字不可分離。第三十八頁(yè)，共78頁(yè)。第七節(jié)霍夫曼編碼——二進(jìn)制哈夫曼編碼第三十九頁(yè)，共78頁(yè)。第七節(jié)霍夫曼編碼——二進(jìn)制哈夫曼編碼將上圖左右顛倒過(guò)來(lái)重畫一下，即可得到二進(jìn)制哈夫曼碼的碼樹。第四十頁(yè)，共78頁(yè)。信源熵為：平均碼長(zhǎng)為編碼效率為若采用定長(zhǎng)編碼，碼長(zhǎng)K=3，則編碼效率可見(jiàn)哈夫曼的編碼效率提高了12.7%。第七節(jié)霍夫曼編碼——二進(jìn)制哈夫曼編碼第四十一頁(yè)，共78頁(yè)。第七節(jié)霍夫曼編碼——二進(jìn)制哈夫曼編碼注意：哈夫曼的編法并不惟一。每次對(duì)縮減信源兩個(gè)概率最小的符號(hào)分配“0”和“1”碼元是任意的，所以可得到不同的碼字。只要在各次縮減信源中保持碼元分配的一致性，即能得到可分離碼字。不同的碼元分配，得到的具體碼字不同，但碼長(zhǎng)ki不變，平均碼長(zhǎng)也不變，所以沒(méi)有本質(zhì)區(qū)別；縮減信源時(shí)，若合并后的新符號(hào)概率與其他符號(hào)概率相等，從編碼方法上來(lái)說(shuō)，這幾個(gè)符號(hào)的次序可任意排列，編出的碼都是正確的，但得到的碼字不相同。不同的編法得到的碼字長(zhǎng)度ki也不盡相同。第四十二頁(yè)，共78頁(yè)。例：?jiǎn)畏?hào)離散無(wú)記憶信源，用兩種不同的方法對(duì)其編二進(jìn)制哈夫曼碼。siliWi概率s1s2s3s4s512344101000001000110.40.20.20.10.10.40.20.20.20.40.40.20.60.4010101方法一：合并后的新符號(hào)排在其它相同概率符號(hào)的后面。第七節(jié)霍夫曼編碼——二進(jìn)制哈夫曼編碼第四十三頁(yè)，共78頁(yè)。siliWi概率s1s2s3s4s512344101000001000110.40.20.20.10.10.40.20.20.20.40.40.20.60.4010101這兩種編碼哪一種更好呢，我們來(lái)計(jì)算一下二者的碼長(zhǎng)。方法二：合并后的新符號(hào)排在其它相同概率符號(hào)的前面。第七節(jié)霍夫曼編碼——二進(jìn)制哈夫曼編碼第四十四頁(yè)，共78頁(yè)。兩種編碼的平均碼長(zhǎng)是一樣的，都是2.2，那一種更好呢，我們可以計(jì)算一下平均碼長(zhǎng)的方差。定義碼字長(zhǎng)度的方差σ2：第七節(jié)霍夫曼編碼——二進(jìn)制哈夫曼編碼第四十五頁(yè)，共78頁(yè)。第七節(jié)霍夫曼編碼——二進(jìn)制哈夫曼編碼可見(jiàn)：第二種編碼方法的碼長(zhǎng)方差要小許多。意味著第二種編碼方法的碼長(zhǎng)變化較小，比較接近于平均碼長(zhǎng)。第一種方法編出的5個(gè)碼字有4種不同的碼長(zhǎng)；第二種方法編出的碼長(zhǎng)只有兩種不同的碼長(zhǎng)；顯然，第二種編碼方法更簡(jiǎn)單、更容易實(shí)現(xiàn)，所以更好。結(jié)論：在哈夫曼編碼過(guò)程中，對(duì)縮減信源符號(hào)按概率由大到小的順序重新排列時(shí)，應(yīng)使合并后的新符號(hào)盡可能排在靠前的位置，這樣可使合并后的新符號(hào)重復(fù)編碼次數(shù)減少，使短碼得到充分利用。第四十六頁(yè)，共78頁(yè)。第七節(jié)霍夫曼編碼——m進(jìn)制哈夫曼編碼“全樹”概念定義：碼樹圖中每個(gè)中間節(jié)點(diǎn)后續(xù)的枝數(shù)為m時(shí)稱為全樹；若有些節(jié)點(diǎn)的后續(xù)枝數(shù)不足m，就稱為非全樹。二進(jìn)制碼不存在非全樹的情況，因?yàn)楹罄m(xù)枝數(shù)是一時(shí)，這個(gè)枝就可以去掉使碼字長(zhǎng)度縮短。對(duì)m進(jìn)制編碼：若所有碼字構(gòu)成全樹，可分離的碼字?jǐn)?shù)（信源個(gè)數(shù)）必為m+k(m－1)。k為信源縮減次數(shù)。若信源所含的符號(hào)數(shù)n不能構(gòu)成m進(jìn)制全樹，必須增加s個(gè)不用的碼字形成全樹。顯然s<m－1，若s=m－1，意味著某個(gè)中間節(jié)點(diǎn)之后只有一個(gè)分枝，為了節(jié)約碼長(zhǎng)，這一分枝可以省略。第四十七頁(yè)，共78頁(yè)。第七節(jié)霍夫曼編碼——m進(jìn)制哈夫曼編碼在編m進(jìn)制哈夫曼碼時(shí)為了使平均碼長(zhǎng)最短，必須使最后一步縮減信源有m個(gè)信源符號(hào)。非全樹時(shí)，有s個(gè)碼字不用：第一次對(duì)最小概率符號(hào)分配碼元時(shí)就只取(m－s)個(gè)，分別配以0,1,…,m－s－1，把這些符號(hào)的概率相加作為一個(gè)新符號(hào)的概率，與其它符號(hào)一起重新排列。以后每次就可以取m個(gè)符號(hào)，分別配以0,1,…,m－1；…；如此下去，直至所有概率相加得1為止，即得到各符號(hào)的m進(jìn)制碼字。第四十八頁(yè)，共78頁(yè)。第七節(jié)霍夫曼編碼——m進(jìn)制哈夫曼編碼例：對(duì)如下單符號(hào)離散無(wú)記憶信源(例5.4.1)編三進(jìn)制哈夫曼碼。這里：m=3，n=8令k=3，m+k(m－1)=9，則s=9－n=9－8=1所以第一次取m－s=2個(gè)符號(hào)進(jìn)行編碼。第四十九頁(yè)，共78頁(yè)。第七節(jié)霍夫曼編碼——m進(jìn)制哈夫曼編碼第五十頁(yè)，共78頁(yè)。第七節(jié)霍夫曼編碼——m進(jìn)制哈夫曼編碼平均碼長(zhǎng)為：信息率為：編碼效率為：可見(jiàn)：哈夫曼的編碼效率相當(dāng)高，對(duì)編碼器的要求也簡(jiǎn)單得多。第五十一頁(yè)，共78頁(yè)。一些結(jié)論香農(nóng)碼、費(fèi)諾碼、哈夫曼碼都考慮了信源的統(tǒng)計(jì)特性，使經(jīng)常出現(xiàn)的信源符號(hào)對(duì)應(yīng)較短的碼字，使信源的平均碼長(zhǎng)縮短，從而實(shí)現(xiàn)了對(duì)信源的壓縮；香農(nóng)碼有系統(tǒng)的、惟一的編碼方法，但在很多情況下編碼效率不是很高；費(fèi)諾碼和哈夫曼碼的編碼方法都不惟一；費(fèi)諾碼比較適合于對(duì)分組概率相等或接近的信源編碼；哈夫曼碼對(duì)信源的統(tǒng)計(jì)特性沒(méi)有特殊要求，編碼效率比較高，對(duì)編碼設(shè)備的要求也比較簡(jiǎn)單，因此綜合性能優(yōu)于香農(nóng)碼和費(fèi)諾碼。第五十二頁(yè)，共78頁(yè)。第八節(jié)游程編碼、算術(shù)編碼香農(nóng)編碼、費(fèi)諾編碼、哈夫曼編碼主要是針對(duì)無(wú)記憶信源。當(dāng)信源有記憶時(shí)上述編碼效率不高；游程編碼對(duì)相關(guān)信源編碼更有效；香農(nóng)編碼、費(fèi)諾編碼、哈夫曼編碼屬于無(wú)失真信源編碼；游程編碼屬于限失真信源編碼。第五十三頁(yè)，共78頁(yè)。第八節(jié)游程編碼、算術(shù)編碼、冗余編碼游程：數(shù)字序列中連續(xù)出現(xiàn)相同符號(hào)的一段。二元序列的游程：只有“0”和“1”兩種符號(hào)。連“0”這一段稱為“0”游程，它的長(zhǎng)度稱為游程長(zhǎng)度L(0)；連“1”這一段稱為“1”游程，它的游程長(zhǎng)度用L(1)表示。游程編碼①二元獨(dú)立序列游程長(zhǎng)度概率若規(guī)定二元序列總是從“0”開始。對(duì)于隨機(jī)序列，游程長(zhǎng)度是隨機(jī)的其取值可為1,2,3,…，直至無(wú)窮。游程長(zhǎng)度序列/游程序列：用交替出現(xiàn)的“0”游程和“1”游程長(zhǎng)度表示任意二元序列。游程變換：是一種一一對(duì)應(yīng)的變換，也是可逆變換。例如：二元序列：0001…，可變換成如下游程序列：第五十四頁(yè)，共78頁(yè)。第八節(jié)游程編碼、算術(shù)編碼、冗余編碼游程變換減弱了原序列符號(hào)間的相關(guān)性。游程變換將二元序列變換成了多元序列；這樣就適合于用其他方法，如哈夫曼編碼，進(jìn)一步壓縮信源，提高通信效率。編碼方法：首先測(cè)定“0”游程長(zhǎng)度和“1”游程長(zhǎng)度的概率分布，即以游程長(zhǎng)度為元素，構(gòu)造一個(gè)新的信源；對(duì)新的信源（游程序列）進(jìn)行哈夫曼編碼。游程編碼第五十五頁(yè)，共78頁(yè)。第八節(jié)游程編碼、算術(shù)編碼、冗余編碼②二元獨(dú)立序列游程長(zhǎng)度的熵若二元序列的概率特性已知，由于二元序列與游程變換序列的一一對(duì)應(yīng)性，可計(jì)算出游程序列的概率特性。令“0”和“1”的概率分別為p0和p1，則“0”游程長(zhǎng)度L(0)的概率為p[L(0)]=p0L(0)－1p1式中L(0)=1,2,…,在計(jì)算p[L(0)]時(shí)必然已有“0”出現(xiàn)，否則就不是“0”游程，若下一個(gè)符號(hào)是“1”，則游程長(zhǎng)度為1，其概率是p1=1－p0；若下一個(gè)符號(hào)為“0”、再下一個(gè)符號(hào)為“1”，則游程長(zhǎng)度為2，其概率將為p0p1；依此類推。游程編碼第五十六頁(yè)，共78頁(yè)。第八節(jié)游程編碼、算術(shù)編碼、冗余編碼游程編碼游程長(zhǎng)度至少是1，理論上，游程長(zhǎng)度可以是無(wú)窮，但很長(zhǎng)的游程實(shí)際出現(xiàn)的概率非常小。同理可得“1”游程長(zhǎng)度L(1)的概率為：P[L(1)]=p1L(1)-1p0“0”游程長(zhǎng)度的熵：第五十七頁(yè)，共78頁(yè)。第八節(jié)游程編碼、算術(shù)編碼、冗余編碼③二元獨(dú)立序列的平均游程長(zhǎng)度“0”游程序列的平均游程長(zhǎng)度同理可得“1”游程長(zhǎng)度的熵和平均游程長(zhǎng)度游程編碼第五十八頁(yè)，共78頁(yè)。第八節(jié)游程編碼、算術(shù)編碼、冗余編碼游程編碼④二元獨(dú)立序列的熵“0”游程序列的熵與“1”游程長(zhǎng)度的熵之和除以它們的平均游程長(zhǎng)度之和，即為對(duì)應(yīng)原二元序列的熵H(X)游程變換后符號(hào)熵沒(méi)有變。因?yàn)橛纬套儞Q是一一對(duì)應(yīng)的可逆變換，所以變換后熵值不變。第五十九頁(yè)，共78頁(yè)。第八節(jié)游程編碼、算術(shù)編碼、冗余編碼游程變換有較好的去相關(guān)效果，因而對(duì)游程序列進(jìn)行哈夫曼編碼可獲得較高的編碼效率。假設(shè)“0”游程長(zhǎng)度的哈夫曼編碼效率為η0，“1”游程長(zhǎng)度的哈夫曼編碼效率為η1，由編碼效率的定義和式(5.4.9)可得對(duì)應(yīng)二元序列的編碼效率（信源熵和信息率之比為編碼效率η=H(X)/R）當(dāng)“0”游程和“1”游程的編碼效率都很高時(shí)，采用游程編碼的效率也很高，至少不會(huì)低于較小的那個(gè)效率。要想編碼效率盡可能高，應(yīng)盡可能提高熵值較大的游程編碼效率。游程編碼第六十頁(yè)，共78頁(yè)。第八節(jié)游程編碼、算術(shù)編碼、冗余編碼算術(shù)編碼算術(shù)編碼不同于哈夫曼碼，它是非分組（非塊）碼。它從全序列出發(fā)，考慮符號(hào)之間的關(guān)系來(lái)進(jìn)行編碼。算術(shù)編碼利用了累積概率的概念。算術(shù)碼主要的編碼方法是計(jì)算輸入信源符號(hào)序列所對(duì)應(yīng)的區(qū)間。因?yàn)樵诰幋a過(guò)程中，每輸入一個(gè)符號(hào)要進(jìn)行乘法和加法運(yùn)算，所以稱此編碼方法為算術(shù)編碼。二元序列的算術(shù)編碼可用于黑白圖像的編碼，例如傳真。第六十一頁(yè)，共78頁(yè)。第八節(jié)游程編碼、算術(shù)編碼、冗余編碼算術(shù)編碼設(shè)信源符號(hào)集A={a1,a2,…,an}，其相應(yīng)概率分布為P(ai)，P(ai)>0(i=1,2,…,n)信源符號(hào)的累積分布函數(shù)為：所得累積分布函數(shù)為每臺(tái)級(jí)的下界值，則其區(qū)間為[0,1)左閉右開區(qū)間。

F(a1)=0

F(a2)=P(a1)

F(a3)=P(a1)+P(a2)…當(dāng)A={0,1}二元信源時(shí)：F(0)=0，F(xiàn)(1)=P(0)第六十二頁(yè)，共78頁(yè)。第八節(jié)游程編碼、算術(shù)編碼、冗余編碼算術(shù)編碼計(jì)算二元無(wú)記憶信源序列的累積分布函數(shù)初始時(shí)：在[0,1)區(qū)間內(nèi)由F(1)劃分成二個(gè)子區(qū)間[0,F(1))和[F(1),1)，F(xiàn)(1)=P(0)。子區(qū)間[0,F(1))的寬度為A(0)=P(0)，對(duì)應(yīng)于信源符號(hào)“0”；子區(qū)間[F(1),1)的寬度為A(1)=P(1)，對(duì)應(yīng)于信源符號(hào)“1”；若輸入符號(hào)序列的第一個(gè)符號(hào)為s=“0”，落入[0,F(1))區(qū)間，得累積分布函數(shù)F(s=“0”)=F(0)=0；

第六十三頁(yè)，共78頁(yè)。第八節(jié)游程編碼、算術(shù)編碼、冗余編碼算術(shù)編碼輸入第二個(gè)符號(hào)為“1”，s=“01”s=“01”所對(duì)應(yīng)的區(qū)間是在區(qū)間[0,F(1))中進(jìn)行分割；符號(hào)序列“00”對(duì)應(yīng)的區(qū)間寬度為:A(00)=A(0)P(0)=P(0)P(0)=P(00)；對(duì)應(yīng)的區(qū)間為[0,F(s=“01”))。符號(hào)序列“01”對(duì)應(yīng)的區(qū)間寬度為A(01)=A(0)P(1)=P(0)P(1)=P(01)=A(0)－A(00)；對(duì)應(yīng)的區(qū)間為[F(s=“01”),F(1))。累積分布函數(shù)F(s=“01”)=P(00)=P(0)P(0)第六十四頁(yè)，共78頁(yè)。第八節(jié)游程編碼、算術(shù)編碼、冗余編碼算術(shù)編碼第六十五頁(yè)，共78頁(yè)。第八節(jié)游程編碼、算術(shù)編碼、冗余編碼算術(shù)編碼輸入第三個(gè)符號(hào)為“1”：輸入序列可記做s1=“011”（若第三個(gè)符號(hào)輸入為“0”，可記做s0=“010”）；現(xiàn)在，輸入序列s1=“011”對(duì)應(yīng)的區(qū)間是對(duì)區(qū)間[F(s),F(1))進(jìn)行分割；序列s0=“010”對(duì)應(yīng)的區(qū)間寬度為A(s=“010”)=A(s=“01”)P(0)=A(s)P(0)其對(duì)應(yīng)的區(qū)間為[F(s),F(s)+A(s)P(0))；序列s1=“011”對(duì)應(yīng)的區(qū)間寬度為

A(s=“011”)=A(s)P(1)=A(s=“01”)－A(s=“010”)=A(s)－A(s0)其對(duì)應(yīng)的區(qū)間為[F(s)+A(s)P(0),F(1))；符號(hào)序列s1=“011”的累積分布函數(shù)為F(s1)=F(s)+A(s)P(0)；若第三個(gè)符號(hào)輸入為“0”，符號(hào)序列s0=“010”的區(qū)間下界值仍為F(s)，得符號(hào)序列s0=“010”的累積分布函數(shù)為F(s0)=F(s)。第六十六頁(yè)，共78頁(yè)。第八節(jié)游程編碼、算術(shù)編碼、冗余編碼算術(shù)編碼歸納當(dāng)已知前面輸入符號(hào)序列為s，若接著再輸入一個(gè)符號(hào)“0”，序列s0的累積分布函數(shù)為：F(s0)=F(s)對(duì)應(yīng)區(qū)間寬度為：A(s0)=A(s)P(0)若接著輸入的一個(gè)符號(hào)是“1”，序列的累積分布函數(shù)為：F(s1)=F(s)+A(s)P(0)對(duì)應(yīng)區(qū)間寬度為：A(s1)=A(s)P(1)=A(s)－A(s0)第六十七頁(yè)，共78頁(yè)。第八節(jié)游程編碼、算術(shù)編碼、冗余編碼算術(shù)編碼符號(hào)序列對(duì)應(yīng)的區(qū)間寬度A(s=“0”)=P(0)A(s=“1”)=1－A(s=“0”)=P(1)A(s=“00”)=P(00)=A(0)P(0)=P(0)P(0)A(s=“01”)=A(s=“0”)－A(s=“00”)=P(01)=A(0)P(1)=P(0)P(1)A(s=“10”)=P(10)=A(1)P(0)=P(1)P(0)A(s=“11”)=A(s=“1”)－A(s=“10”)=P(11)=A(s=“1”)P(1)=P(1)P(1)A(s=“010”)=A(s=“01”)P(0)=P(01)P(0)＝P(010)A(s=“011”)=A(s=“01”)-A(s=“010”)=A(s=“01”)P(1)=P(01)P(1)=P(011)

信源符號(hào)序列s所對(duì)應(yīng)區(qū)間的寬度等于符號(hào)序列s的概率P(s)。第六十八頁(yè)，共78頁(yè)。第八節(jié)游程編碼、算術(shù)編碼、冗余編碼算術(shù)編碼二元信源符號(hào)序列的累積分布函數(shù)的遞推公式F(sr)=F(s)+P(s)F(r)(r=0,1)

sr表示已知前面信源符號(hào)序列為s，接著再輸入符號(hào)為rF(0)=0，F(xiàn)(1)=P(0)F(s0)=F(s)F(s1)=F(s)+P(s)F(1)=F(s)+P(s)P(0)A(sr)=P(sr)=P(s)P(r)(r=0,1)A(s0)=P(s0)=P(s)P(0)A(s1)=P(s1)=P(s)P(1)第六十九頁(yè)，共78頁(yè)。第八節(jié)游程編碼、算術(shù)編碼、冗余編碼算術(shù)編碼舉例：已輸入二元符號(hào)序列為s=“011”，接著再輸入符號(hào)為“1”，得序列累積分布函數(shù)為：

F(s1)=F(0111)=F(s=“011”)+P(011)P(0)=F(s=“01”)+P(01)P(0)+P(011)P(0)=F(s=“0”)+P(0)P(0)+P(01)P(0)+P(011)P(0)=0+P(00)+P(010)+P(0110)對(duì)應(yīng)的區(qū)間寬度為A(s1)=P(s=“011”)P(1)=P(011)P(1)=P(0111)上述整個(gè)分析過(guò)程可用圖5.6.1描述式(5.6.1)和(5.6.2)是可遞推運(yùn)算，在實(shí)際中，只需兩個(gè)存儲(chǔ)器，把P(s)和F(s)存下來(lái)，然后，根據(jù)輸入符號(hào)和式(5.6.1)、(5.6.2)更新兩個(gè)存儲(chǔ)器中的數(shù)值

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

信息論-無(wú)失真信源編碼

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

信息論-無(wú)失真信源編碼

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔