數(shù)字壓縮技術(shù)

上傳人：0*** IP屬地：湖北上傳時(shí)間：2022-03-23 格式：PPT 頁(yè)數(shù)：41 大小：628.50KB 積分：35 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩36頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第六章數(shù)據(jù)壓縮技術(shù)I 信息的數(shù)據(jù)量和壓縮的必要性數(shù)字化了的圖像、視頻、音頻等信息數(shù)據(jù)量很大。數(shù)據(jù)壓縮的可能性原始信源數(shù)據(jù)存在很大冗余度視覺(jué)掩蓋效應(yīng)(對(duì)亮度敏感,對(duì)邊緣急劇人的生理特性變化不敏感) 聽(tīng)覺(jué)：對(duì)部分頻率信號(hào)不敏感壓縮去掉冗余信息和一些不敏感信息。無(wú)損壓縮：源壓縮存儲(chǔ)傳輸解壓目的（源與目的信息一模一樣。）有損壓縮：源與目的信息有差別。數(shù)據(jù)冗余的概念和分類（1）冗余的基本概念信息量與數(shù)據(jù)量的關(guān)系可由下式給出: I=D-du I : 信息量 D: 數(shù)據(jù)量 du : 冗余量例:讀一篇文稿,每分鐘180字,一個(gè)漢字占兩個(gè)字節(jié)（內(nèi) 碼）,每分鐘文本數(shù)據(jù)量 360

2、b；若對(duì)語(yǔ)言直接錄音, 4K28=64Kb/s (8b) 每分鐘數(shù)據(jù)量: 480Kb （2）數(shù)據(jù)冗余的類別空間冗余規(guī)則物體和規(guī)則背景的表面物理特性具有相關(guān)性。時(shí)間冗余連續(xù)播放的畫面，前后幾幀背景基本無(wú)變化。例如：小車行駛，外型無(wú)變化。（只需小車運(yùn)動(dòng)矢量）。統(tǒng)計(jì)冗余。空間、時(shí)間冗余，把圖象信號(hào)看作概率信號(hào)時(shí)所反映出的統(tǒng)計(jì)特性。結(jié)構(gòu)冗余。物體表面紋理等結(jié)構(gòu)。（規(guī)則圖形，冗余量大）信息熵冗余。熵定義：1k0i2PilogPiEiP ：在S中出現(xiàn)的概率，表示包含在中的信息量，也就是編碼所需要的位數(shù)。但難預(yù)估，取位數(shù)為最多信息所需位數(shù)，帶來(lái)信息熵冗余。 i2PL

3、OGiSiSiS1K0PP視覺(jué)冗余人類視覺(jué)系統(tǒng)特點(diǎn)：對(duì)圖象場(chǎng)的注意是非均勻和非線性的。 a. 對(duì)亮度比對(duì)色度敏感 b. 并非圖象任何變化均能感知。分辨能力：灰度等級(jí) 一般圖象量化采用灰度等級(jí)6282知識(shí)冗余。人有先驗(yàn)知識(shí)：圖象的結(jié)構(gòu)等，但在計(jì)算機(jī)存儲(chǔ)時(shí)未考慮。其他冗余。圖象的空間非定常特性帶來(lái)的冗余。數(shù)據(jù)壓縮的編碼方法 1、數(shù)據(jù)壓縮方法的分類編碼過(guò)程：對(duì)原始數(shù)據(jù)經(jīng)過(guò)編碼進(jìn)行壓縮解碼過(guò)程：對(duì)編碼數(shù)據(jù)進(jìn)行解碼、還原壓縮處理過(guò)程（1）可逆編碼（無(wú)損壓縮）信息非丟失型編碼無(wú)損壓縮解碼圖象與原始圖象嚴(yán)格相同。基于信息熵原理，如哈夫曼編碼、算術(shù)編碼、游程編碼。壓縮能力：與所處理圖

4、象的信息熵有關(guān)，壓縮比不太大。應(yīng)用：要求不丟失信息（醫(yī)療、衛(wèi)星圖象通信系統(tǒng)等）。（2）不可逆編碼（有損壓縮）信息丟失型編碼還原圖象與原始圖象存在一定誤差。 (3) 對(duì)稱壓縮壓縮算法與解壓算法一樣收發(fā)雙方以同一種速度操作，適用于實(shí)時(shí)應(yīng)用場(chǎng)合 2、常用的壓縮編碼預(yù)測(cè)編碼：以相鄰的且已被編碼的點(diǎn)對(duì)目前點(diǎn)進(jìn)行預(yù)測(cè)估計(jì)。基礎(chǔ)：同幀圖象的相鄰像素點(diǎn)之間相關(guān)性比較強(qiáng)。(4)不對(duì)稱壓縮壓縮與解壓縮速率不同如：視頻光盤針對(duì)統(tǒng)計(jì)冗余進(jìn)行的壓縮。變換編碼：將圖象光強(qiáng)矩陣(時(shí)域信號(hào)) 系數(shù)空間(頻域) 上進(jìn)行處理。針對(duì)統(tǒng)計(jì)冗余進(jìn)行的壓縮。變換信息熵編碼：概率大的信息用短碼字表示。概率小的信息用長(zhǎng)碼字表示

5、。分頻帶編碼：時(shí)域頻域，按頻率分帶，用不同的量化器進(jìn)行量化。量化與向量量化編碼：模擬數(shù)字，量化。一次量化多個(gè)點(diǎn)：向量量化。結(jié)構(gòu)編碼：結(jié)構(gòu)特征抽?。ㄟ吔?、輪廓、紋理），保存參數(shù)。基于知識(shí)的編碼：利用人的知識(shí)形成規(guī)則庫(kù)，用參數(shù)描述，實(shí)現(xiàn)圖象編碼和解碼。某一事件信息量定義： 0P i 1 Pi 為第i個(gè)事件的概率 i2iPLOGI22LOG NiiILOG P 2、信源S的熵的定義一、香農(nóng)-范諾編碼 1、熵的概念熵是信息量的度量方法，它表示某一事件出現(xiàn)的消息越多，事件發(fā)生的可能性就越小，也就是概率越小。特例：某信息源有N個(gè)事件，且任一事件概率均相等，為1/N，則：所傳輸?shù)南⒘渴?/p>

6、其出現(xiàn)概率的單調(diào)下降函數(shù)。例：如果從256個(gè)數(shù)中猜一個(gè)數(shù)，最少提問(wèn)幾次一定可以猜到？第一次，“是否大于128？” 消去一半可能共8次也就是說(shuō)，每次提問(wèn)會(huì)得到1b的信息量。因此，在256個(gè)數(shù)中選定某一個(gè)數(shù)所需要的信息量為： b8256log2信息量是指從N個(gè)相等可能事件中選出一個(gè)事件所需要的信息度量或含量，也就是在辨識(shí)N個(gè)事件中特定的一個(gè)事件的過(guò)程中所需提問(wèn)“是或否”的最少次數(shù)。根據(jù)香農(nóng)理論，信源S的熵的定義：是在S中出現(xiàn)的概率。是包含在中的信息量，也是編碼所需位數(shù)。例1：一幅圖象用256級(jí)灰度表示，若每一個(gè)像素點(diǎn)灰度概率為：則編碼每個(gè)像素點(diǎn)需要8位。)P/1 (LOGi2

7、iSiS2561)(iSPNiiiNiiiNiiiSPLOGSPPLOGPPLOGPSH121212)()()/1 ()()(iSPiS例2、一幅灰度圖象有40個(gè)像素組成，灰度共5級(jí)，分別用符號(hào) A、B、C、D、E表示，40個(gè)像素中出現(xiàn)灰度A的像素?cái)?shù)有 15個(gè)，灰度B的有7個(gè)，C的有7個(gè)，D的有6個(gè)，E的有5個(gè)，若用3位表示5個(gè)等級(jí)的灰度值，編碼這幅圖象總共需要 120 位，用香農(nóng)理論，圖象熵為： )7/40(LOG)40/7()15/40(LOG)40/15()X(H22196. 2)5/40(LOG)40/5(2若平均每個(gè)灰度用2.196位表示,則圖象總共需要87.84位。用香農(nóng)范諾算法

8、編碼：首先，將灰度概率從大到小排列出現(xiàn)次數(shù)（）分配的代碼需要的位數(shù) A15 （0.375) 1.4150 00 30 B7 (0.175) 2.5145 01 14 C7 (0.175) 2.5145 10 14 D 6 (0.150) 2.7369 110 18 E5 （0.125) 3.0000 111 15總位數(shù):91iP壓縮比：1.3 : 1ABCDE00111100)P/ 1 (LOGi2二、霍夫曼編碼以前舉的例2：一幅圖象5個(gè)灰度等級(jí)，40個(gè)像素。代碼出現(xiàn)次數(shù)位數(shù)A 0 15 15B 100 7 21C 101 7 21D 110 6 18E 111 5 15 共90位（

9、1）霍夫曼編碼步驟 P.234100.275 概率A 0.375B 0.175C 0.175D 0.150E 0.125 00.35001101壓縮比：1.33 : 1 （2）霍夫曼編碼特點(diǎn) 碼不唯一。碼字變長(zhǎng)（硬件實(shí)現(xiàn)不大方便）,但不需要另外附加同步代碼。（在壓縮文件中查找或調(diào)用內(nèi)容困難）。概率分布不同，編碼效率不同。（效率比香農(nóng)-范諾編碼高）（概率分布不均勻,效率高；概率分布均勻,效率低，一般不用） Huffman編碼表解碼要用傳輸要考慮編碼表所占比特率數(shù) 若編碼基于大量概率統(tǒng)計(jì)，傳輸可省去Huffman編碼表使用缺省的Huffman編碼表霍夫曼碼沒(méi)有錯(cuò)誤保護(hù)功能三、算術(shù)

10、編碼在圖象數(shù)據(jù)壓縮標(biāo)準(zhǔn)（JPEG等）中扮演重要角色。消息：用01之間實(shí)數(shù)進(jìn)行編碼。算術(shù)編碼參數(shù)：符號(hào)的概率和它的編碼間隔。（1）例：假設(shè)信源符號(hào)為 00, 01, 10, 11 其相應(yīng)概率分別為 0.1, 0.4, 0.2 , 0.3 根據(jù)概率把間隔0,1)分成 0，0.10），0.1，0.5），0.5，0.7），0.7，1） 4個(gè)子間隔。符號(hào) 概率初始編碼間隔 00 0.1 0, 0.1) 01 0.4 0.1, 0.5) 10 0.2 0.5, 0.7) 11 0.3 0.7, 1)二進(jìn)制消息序列 10 00 11 00 10 11 01.第一個(gè)符號(hào)為10,它的編碼范圍:

11、0.5, 0.7)第二個(gè)符號(hào)為00,它的編碼范圍: 0 , 0.1),它的間隔取 0.5, 0.7)的第一個(gè)十分之一作為新間隔 0.5,0.52)第三個(gè)符號(hào)為11,它的編碼范圍: 0.7, 1),它的間隔取 0.5, 0.52)的最后三個(gè)的1/10 , 新間隔 0.514,0.52) 0.020.7=0.014 0.020.7+0.50.20.1+(0.20.1) 依次類推輸出的消息編碼：最后一個(gè)間隔中的任意數(shù)。從 0.5143876 , 0.514402)中,選一個(gè)數(shù)作為輸出。取0.5143876譯碼過(guò)程譯碼符號(hào) 間隔0.5143876在間隔0.5, 0.7) 10 0.5, 0.7)

12、0.5143876在間隔0.5, 0.7)的第一個(gè)1/10 00 0.5, 0.52)0.5143676在間隔0.5, 0.52)的第7個(gè)1/10 11 0.514, 0.52) .譯碼消息: 10 00 11 00 10 11 01 (2)編碼算法:一個(gè)有M個(gè)符號(hào) (i=1,2,3 ,M)的字符集,假定概率ianX輸入符號(hào)用表示,第n個(gè)子間隔范圍用以下公式表示:,)(iiPaP1PPP)a (PM21iM1iii1ii1ni1i1i1n1nnnnPdlPdl rl I），），1-n且和表示間隔左邊界的值，表示間隔右邊界的值，表示間隔長(zhǎng)度。則編碼按以下步驟進(jìn)行：首先在1和0之間

13、給每個(gè)符號(hào)分配一個(gè)初始間隔，子間隔的長(zhǎng) 度等于它的概率。初始子間隔的范圍用右式表示：令，L= 和R=1d, 0l00, 0P0nlnrnnnlrd)PP)r ,l Ii1ii1ii, 1i111111lrd1l1rL和R的二進(jìn)制表達(dá)式分別表示為： 1u若，不發(fā)送任何數(shù)據(jù)，轉(zhuǎn)到步驟。若 = ，就發(fā)送二進(jìn)制符號(hào) 。1kkk2uL和1kkk2vR其中和等于“0”或“1”。 kukv比較和1u1u1v1u1v1v2u2v2uinaX 若，不發(fā)送任何數(shù)據(jù)，轉(zhuǎn)到步驟若，就發(fā)送二進(jìn)制符號(hào) 比較直到兩個(gè)符號(hào)不相同，然后轉(zhuǎn)入步驟n+1，讀下一個(gè)符號(hào)。假設(shè)第n個(gè)輸入符號(hào)為，按照以前的步驟把

14、這個(gè)間隔分成如下子間隔：令，，然后轉(zhuǎn)到步驟例：輸入序列：，， i1ii1n1ni1i1i1n1nn,nn)PdI ,PdI )rl InlL nrR nnlrdnX2a1a3a比較和22vu22vu輸入的第一個(gè)符號(hào): , 則 i =2, 定義初始間隔：符號(hào)概率初始編碼間隔 =0.5 0, 0.5) =0.25 0.5, 0.75) =0.125 0.75, 0.875) =0.125 0.875, 1)1a2a3a4a1p2p3p4p21ax i1ii1ii1i1, 11),75. 0 , 5 . 0)p,p)rl I則知。25. 0d1左、右邊界二進(jìn)制表示：L=0.5

15、=0.1(B) R=0.75=0.11(B)。按步驟，，發(fā)送1，轉(zhuǎn)到步驟 22vu11vu 輸入第三個(gè)字符：， i =3, 子間隔：33ax i1ii1ii111i112, 22),625. 0 , 5 . 0)pdl ,pdl )rl I 得。125. 0d2L=0.5=0.100(B) R=0.625=0.101(B)。發(fā)送0，轉(zhuǎn)到步驟0vu2233vu 輸入第二個(gè)字符：， i =1, 子間隔：12axi1ii1ii221i22333),609375. 0 ,59375. 0)pdl ,pdl )r ,l I015625. 0d3L=0.59375=0.10011(B) R=

16、0.609375=0.100111(B)。發(fā)送0，，發(fā)送1，發(fā)送1，，轉(zhuǎn)到步驟.0vu3366vu 1vu441vu55發(fā)送編碼: 10011+結(jié)束符。特點(diǎn): 1) 對(duì)整個(gè)消息只產(chǎn)生一個(gè)碼字(0，1）中的一個(gè)實(shí) 數(shù)），譯碼器需接收所有位才能譯碼。 2）對(duì)錯(cuò)誤敏感。一位錯(cuò)，整個(gè)消息譯錯(cuò)。 3）精度問(wèn)題。不可能無(wú)限長(zhǎng)。 12位、32位、64位精度，比例縮放。四、行程編碼（Run length encoding ，RLE）長(zhǎng)度編碼，游程編碼。（無(wú)損壓縮）相同灰度值相鄰像元長(zhǎng)度為：“行程”。如：一幅灰度圖象，第n行像素11552200000735238 用RLE編碼方法得到代碼70

17、31 525 31 80 變長(zhǎng)行程編碼（070 031 525 031 080 定長(zhǎng)行程編碼）編碼前：73個(gè)代碼，編碼后：11個(gè)代碼。壓縮比：7：1。壓縮比主要取決于圖象本身特點(diǎn)。圖象中相同顏色圖象塊越大，壓縮比越高，反之，壓縮比越小。對(duì)顏色豐富的圖象，一行上具有相同連續(xù)像素很少，若仍用 RLE編碼，則可能圖象數(shù)據(jù)反而更大。解決方法：與其它壓縮編碼技術(shù)聯(lián)合應(yīng)用。 RLE對(duì)差錯(cuò)敏感（一位符號(hào)出錯(cuò)會(huì)改變行程編碼的長(zhǎng)度，從而使整個(gè)圖象出現(xiàn)偏移）。解決方法：加行同步，列同步。五、詞典編碼（無(wú)損壓縮）dictionary encoding 有些場(chǎng)合，開(kāi)始事先不一定知道數(shù)據(jù)統(tǒng)計(jì)特性對(duì)這些

18、數(shù)據(jù)壓縮通用編碼技術(shù) 詞典編碼無(wú)損壓縮（1）詞典編碼的思想根據(jù)：數(shù)據(jù)包含重復(fù)代碼（文本文件等）兩種想法：查找正在壓縮的字符序列在以前輸入的數(shù)據(jù) 中是否出現(xiàn)過(guò)，若已出現(xiàn)過(guò)，只輸出指向以前此字符串的 “指針”。從輸入的數(shù)據(jù)中創(chuàng)建一個(gè)“短語(yǔ)詞典”，短語(yǔ)可以為任意字符組合，（不一定有具體意義，如：嚴(yán)謹(jǐn)、求實(shí)）。編碼數(shù)據(jù)中出現(xiàn)已在詞典中的短詞時(shí)，編碼器輸出這個(gè)詞典中的“短語(yǔ)”索引號(hào)。 LZW壓縮算法（J.ziv 與A.Lempel研究), welch winzip使用此法. (2)LZ77算法術(shù)語(yǔ):輸入數(shù)據(jù)流：要被壓縮的字符序列。字符：輸入數(shù)據(jù)流中的基本單元。編碼位置：輸入數(shù)據(jù)流中當(dāng)前

19、要編碼的字符位置。前向緩沖存儲(chǔ)器：存放從編碼位置到輸入數(shù)據(jù)流結(jié)束的字符序列的存儲(chǔ)器。窗口：包含W個(gè)字符的窗口，字符從編碼位置開(kāi)始向后數(shù)。指針：指向窗口中的匹配串且含長(zhǎng)度的指針。算法步驟：把編碼位置設(shè)到輸入數(shù)據(jù)流開(kāi)始位置。查找窗口中最長(zhǎng)的匹配串。以（Pointer Length） Characters的格式輸出。匹配串指針匹配字符長(zhǎng)度不匹配的第一個(gè)字符如果前向緩沖存儲(chǔ)器是不空，把編碼位置位窗口向前移（Length +1）個(gè)字符，然后返回到步驟（3）LZSS算法 LZ77不足：空指針冗余，編碼器輸出字符可能包含在下一匹配串中。 LZSS算法：如果匹配串長(zhǎng)度比指針本身大

20、，輸出指針；否則輸出真實(shí)字符。區(qū)分指針與字符，需要額外ID位。步驟：把編碼位置于數(shù)據(jù)流的開(kāi)始位置。在前向緩沖存儲(chǔ)器中查找與窗口中最長(zhǎng)匹配串。 Pointer =匹配串指針，Length =匹配串長(zhǎng)度。判斷匹配串長(zhǎng)度Length是否大于等于最小匹配串長(zhǎng)度。（LengthMINLENGTH）是：輸出指針，把編碼位置前移Length個(gè)字符。否：輸出前向緩沖存儲(chǔ)器第一個(gè)字符，然后把編碼器位置向前移動(dòng)一個(gè)字符。如果前向緩沖存儲(chǔ)器非空，返回步驟。例： LZSS比LZ77（在相同計(jì)算機(jī)環(huán)境下）可獲得較高的壓縮比。譯碼同樣簡(jiǎn)單。LZSS成為開(kāi)發(fā)新算法的基礎(chǔ)。文檔壓縮程序許多使用LZSS

21、的思想，如ARJ,PKZip,ZOO等。 ARJ：LZSS與哈夫曼編碼聯(lián)用。PKZip 與香農(nóng)-范諾聯(lián)用（4）LZ78算法術(shù)語(yǔ)：字符流：要被編碼的數(shù)據(jù)序列。字符：字符同LZ77。前綴：在一個(gè)字符之前的字符序列。綴符串：前綴+字符。碼字：碼字流中的基本數(shù)據(jù)單元，代表詞典中的一串字符。碼字流：碼字和字符組成的序列，是編碼器輸出。詞典：綴符串表。當(dāng)前前綴：當(dāng)前正處理的前綴（P表示）。當(dāng)前字符：當(dāng)前前綴之后的字符（C表示）。當(dāng)前碼字：譯碼算法中，正處理的碼字，用W 表示當(dāng)前碼字，string. W表示當(dāng)前碼字的綴符串。編碼步驟：開(kāi)始時(shí)，詞典和當(dāng)前前綴P為空。當(dāng)前字符C為字符流中下一個(gè)字符。判斷P+C是否在詞典中，是：P=P+C 否：輸出當(dāng)前前綴對(duì)應(yīng)碼字和當(dāng)前字符C，把字符串P+C添加到詞典中，令P=空。判斷字符流中是否還有字符需編碼，是：轉(zhuǎn) ；否：若當(dāng)前前綴P非空，輸出P對(duì)應(yīng)碼字，結(jié)束編碼。例：譯碼步驟：開(kāi)始詞典為空，（譯碼詞典在譯碼過(guò)程中從碼字流中重構(gòu)）。當(dāng)前字符W為碼字流

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

數(shù)字壓縮技術(shù)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

數(shù)字壓縮技術(shù)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔