信息傳輸基礎(chǔ)07課件_第1頁
信息傳輸基礎(chǔ)07課件_第2頁
信息傳輸基礎(chǔ)07課件_第3頁
信息傳輸基礎(chǔ)07課件_第4頁
信息傳輸基礎(chǔ)07課件_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、4 統(tǒng)計編碼統(tǒng)計編碼主要內(nèi)容1基本原理基本原理2霍夫曼編碼3游程編碼4算術(shù)編碼5基于字典的編碼6哥倫布編碼4.2 霍夫曼編碼 1925-1999 戴維霍夫曼,數(shù)學(xué)家,計算機科學(xué)領(lǐng)域的先驅(qū)?;舴蚵簧凶鞒龅闹匾暙I有:有限狀態(tài)機,開關(guān)切換電路,綜合程序,信號設(shè)計等。 霍夫曼在MIT一直工作到1967年。之后他轉(zhuǎn)入加州大學(xué)的Santa Cruz分校,是該校計算機科學(xué)系的創(chuàng)始人,19701973年任系主任。1994年霍夫曼退休?;舴蚵a的編碼定理 【定理4.3】 在變長編碼中,若各碼字長度嚴(yán)格按照所對應(yīng)符號出現(xiàn)概率的大小逆序排序,則其平均長度為最小。 按上述定理可得霍夫曼碼的編碼步驟: 1)將信源

2、符號出現(xiàn)概率按照減小的順序排列; 2)將兩個最小的概率進行組合相加,并繼續(xù)這一步驟,始終將較高的概率分支放在上部,直到概率達到1.0為止; 對每對組合中的上邊一個指定為1,下邊一個指定為0(霍相反,對上邊一個指定為0,對下邊一個指定為1); 畫出由每個信源符號概率到1.0處的路徑,記下沿路徑的0和1; 對于每個信源符號都寫出1、0序列,則從右到左就得到了霍夫曼碼例4-6 對一個7符號信源 ,其霍夫曼編碼如圖4-6127,Aa aa另例關(guān)鍵在每一步,總是將最低概率的兩個符號構(gòu)成一對關(guān)鍵在每一步,總是將最低概率的兩個符號構(gòu)成一對兩種霍夫曼編碼的異同 對一個5符號信源 ,其霍夫曼編碼如下圖所示 請使

3、用霍夫曼碼進行編碼 采用兩種方式進行編碼; 求其平均碼長;125,Aa aa12345()0.10.1XaaaaaP X兩種霍夫曼編碼的異同 引入碼字長度偏離平均碼長的方差的概念: 方差小的編碼方法得到的碼字結(jié)構(gòu)更緊湊,碼的變化小, 22521iiiiElLp alL霍夫曼碼的編法并不唯一 每次對縮減信源兩個概率最小的符號分配“0”和“1”碼元是任意的,所以可以得到不同的碼字。 不同的碼元分配,得到的具體碼字不同,但是平均碼長不變4.2.2 信源編碼基本定理 例4-7:對于二值圖像,如傳真機,輸出非“黑”即“白”,有 ,其概率與所傳文件有關(guān),假設(shè)對某頁文件,有12,Xx x

4、白,黑10.9P x20.1P x不考慮信號間的關(guān)聯(lián)時,其信息熵為:0.9 log0.90.1 log0.10.469H Xbit pel 此時霍夫曼編碼無壓縮作用1146.9%H Xl編碼效率為基本途徑之四: 如果把X延長后在對K元組(K為延長長度)進行編碼,那么只要K足夠大,則代表每消息單元X的平均符號個數(shù) 可以任意趨向于小界l K【定理4.4(信源編碼的基本定理)】設(shè)如果要求碼字單義可譯,則也叫作無失真編碼的基本定理 121212,;,1,2, ;mKnKnKiiiAa aaXXx xxWWw wwlP wP xP WP win的延長;的延長,其平均長度為 ;,()1loglogH Xl

5、H XmKmK例4-8 把例4-7中的碼元延長到X2,此時可以獲得圖4.7 2單元延長信號的最佳編碼P(x1, x1) = P(x1)P( x1) =0.81P(x1, x2) = P(x1)P( x2) =0.09P(x2, x1) = P(x2)P( x1) =0.09P(x2, x2) = P(x2)P( x2) =0.00111000W 2 010110111W 2平均長度為:l2 =0.81+0.092+0.093+0.013=1.29 bit/pelW 2的每一個元素代表兩個消息單元,因此平均每一個消息單元的符號個數(shù)是:l2 /2 = 1.29/2 = 0.

6、645 bit/pel2 =H(X)/ l2=72.7 %編碼效率提高到:圖4.8 3單元延長信號的最佳編碼P(x1, x1, x1) =0.729P(x1, x1, x2) =0.081P(x1, x2, x1) =0.081P(x2, x1, x1) =0.0810.0100.109111000P(x1, x2, x2) =0.009P(x2, x1, x2) =0.009P(x2, x2, x1) =0.009P(x2, x2, x2) =0.0010.0180.0280.1620.2711.0000111001W 3111111111011101110101100011100把把 X

7、延長到延長到 X 3 ,有圖有圖4.8所示所示 X 3 的最佳編碼:的最佳編碼:W 3平均長度為:l3 =0.729+0.08133 +5( 30.09+0.001)=1.598 bit/pelW 3的每一個元素代表三個消息單元, 因此平均每一個消息單元的符號個數(shù)是:l3 /3 = 1.598/3 = 0.5327 bit/pel3 =H(X)/ l3=88.0 %編碼效率提高到:還能經(jīng)一步壓縮碼?還能經(jīng)一步壓縮碼?H(X, Y )H(X)+H(Y)(3.2-13)H(X | Y )H(X)(3.2-11b)或:要求知道P(X), P(X,Y) 或 P(X|Y) 才能進行最佳編碼。信源編碼理論

8、 給定消息單元集合X、符號集合A和X的概率分布P(X), 可以采用最佳編碼,使代碼W 的平均長度滿足; 如果把X 延長至 X K ,則不必考慮信號前后的關(guān)聯(lián)性, 就可以是代表一個消息單元的符號個數(shù) l /K 任意接近 下限 H(X)/logm; 如果利用延長信號X K的前后關(guān)聯(lián),可使下限減小。1log)(,log)(mXHmXHl靜態(tài)統(tǒng)計模型 在編碼前統(tǒng)計要編碼的信息中所有字符的出現(xiàn)概率,然后根據(jù)統(tǒng)計出的信息建立編碼樹,進行編碼 。 對數(shù)據(jù)量較大的信息,靜態(tài)統(tǒng)計要消耗大量的時間; 必須保存統(tǒng)計出的結(jié)果以便解碼時構(gòu)造相同的編碼樹,或者直接保存編碼樹本身,而且,對于每次靜態(tài)統(tǒng)計,都有不同的結(jié)果,必

9、須分別予以保存,這要消耗大量的空間(這意味著壓縮效率的下降); 靜態(tài)統(tǒng)計模型統(tǒng)計出的頻率是字符在整個文件中的出現(xiàn)頻率,往往反映不出字符在文件中不同局部出現(xiàn)頻率的變化情況,使用這一頻率進行壓縮,大多數(shù)情況下得不到太好壓縮效果,文件有時甚至在壓縮后反而增大了。缺點 If Youth,throughout all history, had a champion to stand up for it; to show a doubting world that a child can think;and, possibly, do it practically; you wouldnt constan

10、tly run across folks today who claim that a child dont know anything. - Gadsby by E.V.Wright, 1939. 無需為解壓縮預(yù)先保存任何信息,整個編碼是在壓縮和解壓縮過程中動態(tài)創(chuàng)建的,而且自適應(yīng)編碼由于其符號頻率是根據(jù)信息內(nèi)容的變化動態(tài)得到的,更符合符號的局部分布規(guī)律,因此在壓縮效果上比靜態(tài)模型好許多。自適應(yīng)模型將自適應(yīng)模型與霍夫曼編碼結(jié)合起來的問題是重建霍夫曼樹是一個非常昂貴的過程。為了讓自適應(yīng)方案高效,有必要在每一個字符出現(xiàn)之后調(diào)整霍夫曼編碼。直到霍夫曼編碼第一次開發(fā)的 20 年之后,執(zhí)行自適應(yīng)霍夫曼自

11、適應(yīng)霍夫曼編碼編碼的算法都沒有發(fā)布。即使在現(xiàn)在,最好的自適應(yīng)霍自適應(yīng)霍夫曼編碼夫曼編碼算法仍然相當(dāng)耗時間和金錢。主要內(nèi)容1基本原理基本原理2霍夫曼編碼3游程編碼4算術(shù)編碼5基于字典的編碼6哥倫布編碼4.3 游程編碼游程長度(RL: Run Length,簡稱游程或游長): 由字符(或信號采樣值)構(gòu)成的數(shù)據(jù)流中各字符重復(fù)出現(xiàn)而形成的字符串的長度。用二進制碼字給出形成串的字符、串的長度及串的位置等信息,以此來恢復(fù)出原來的數(shù)據(jù)流。是在控制論中對于二值圖像而言是一種編碼方法,對連續(xù)的黑、白像素數(shù)(游程)以不同的碼字進行編碼。 游程長度編碼(RLC):基本的RLC壓縮方法:最初出現(xiàn)在 IBM 3780

12、BYSYNC (Binary Synchronous Communication)通信協(xié)議中?;镜腞LC數(shù)據(jù)結(jié)構(gòu):XScRL數(shù) 據(jù) 流圖4.9 基本的RLC數(shù)據(jù)結(jié)構(gòu)游程編碼的壓縮效能平均重復(fù)長度重復(fù)出現(xiàn)10次的壓縮比重復(fù)出現(xiàn)20次的壓縮比重復(fù)出現(xiàn)30次的壓縮比重復(fù)出現(xiàn)40次的壓縮比重復(fù)出現(xiàn)50次的壓縮比41.0101.0201.0311.0421.05351.0201.0421.0641.0731.11161.0311.0641.0991.1361.17671.0421.0871.1361.1901.25081.0531.1111.1761.2501.33391.0641.1361.2201.3161.429101.0751.1631.2661.3841.538表4.2 基本的游程編碼壓縮比二值圖像的編碼過程 先對圖像進行統(tǒng)計分別得出白長為 i 的 概率 PiW 和黑長為 i 的概率 PiB, 然后根據(jù)霍夫曼原則按RL出現(xiàn)概率來分 配碼字。二值圖像的RLC實為霍夫曼碼的具體應(yīng)用修正霍夫曼編碼MH編碼規(guī)則: (見表4.3) RL=063,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論