多媒體技術(shù)好資源第03講多媒體數(shù)據(jù)壓縮基礎(chǔ)_第1頁(yè)
多媒體技術(shù)好資源第03講多媒體數(shù)據(jù)壓縮基礎(chǔ)_第2頁(yè)
多媒體技術(shù)好資源第03講多媒體數(shù)據(jù)壓縮基礎(chǔ)_第3頁(yè)
多媒體技術(shù)好資源第03講多媒體數(shù)據(jù)壓縮基礎(chǔ)_第4頁(yè)
多媒體技術(shù)好資源第03講多媒體數(shù)據(jù)壓縮基礎(chǔ)_第5頁(yè)
已閱讀5頁(yè),還剩55頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第3章多媒體數(shù)據(jù)壓縮基礎(chǔ)3.1

媒體元素的特點(diǎn)3.2數(shù)據(jù)壓縮編碼簡(jiǎn)介3.3統(tǒng)計(jì)編碼3.4預(yù)測(cè)編碼

3.5變換編碼

第一頁(yè),共六十頁(yè)。

媒體元素的特點(diǎn)3.11.文本——是以文字和各種專用符號(hào)表達(dá)的信息形式,它是現(xiàn)實(shí)生活中使用得最多的一種信息存儲(chǔ)和傳遞方式。用文本表達(dá)信息給人充分的想象空間,它主要用于對(duì)知識(shí)的描述性表示,如闡述概念、定義、原理和問(wèn)題以及顯示標(biāo)題、菜單等內(nèi)容。2.圖形——是指由外部輪廓線條構(gòu)成的矢量圖。即由計(jì)算機(jī)繪制的直線、圓、矩形、曲線、圖表等。3.圖像——是多媒體中最重要的信息表現(xiàn)形式之一,它是決定一個(gè)多媒體軟件視覺(jué)效果的關(guān)鍵因素。

4.視頻——指將一系列的靜態(tài)影像以電信號(hào)方式加以捕捉,紀(jì)錄,處理,儲(chǔ)存,傳送,與重現(xiàn)的各種技術(shù)。5.音頻——按表達(dá)形式,聲音分為講解、音樂(lè)、效果三類。

6.動(dòng)畫——?jiǎng)赢嬍抢萌说囊曈X(jué)暫留特性,快速播放一系列連續(xù)運(yùn)動(dòng)變化的圖形圖像,也包括畫面的縮放、旋轉(zhuǎn)、變換、淡入淡出等特殊效果。

第二頁(yè),共六十頁(yè)。數(shù)據(jù)壓縮編碼簡(jiǎn)介(1)數(shù)據(jù)壓縮的必要性

圖像信號(hào):黑白480×360,8bit; 大小是480×360÷1024=168.45KB 彩色大小是480×360×3÷1024=506.25KB 視頻:PAL制每秒數(shù)據(jù)量506.25KB×25幀/秒=12.36MB/s(2)數(shù)據(jù)壓縮的可能性

空間冗余 時(shí)間冗余結(jié)構(gòu)冗余視覺(jué)冗余知識(shí)冗余信息熵冗余3.2第三頁(yè),共六十頁(yè)。數(shù)據(jù)壓縮的可能性P16●[1]空間冗余——規(guī)則物體的物理相關(guān)性[2]時(shí)間冗余——視頻與動(dòng)畫畫面間的相關(guān)性[3]統(tǒng)計(jì)冗余——具有空間冗余和時(shí)間冗余[6]視覺(jué)冗余——視覺(jué)、聽覺(jué)敏感度和非線性感覺(jué)[7]知識(shí)冗余——憑借經(jīng)驗(yàn)識(shí)別[4]結(jié)構(gòu)冗余——規(guī)則紋理、相互重疊的結(jié)構(gòu)表面[5]信息熵冗余——編碼冗余,數(shù)據(jù)與攜帶的信息10110001110010110001110001011010101010111100010111111010224色28色聲音頻率文字組句色彩漸變主觀意識(shí)::教學(xué)進(jìn)程第四頁(yè),共六十頁(yè)。(1)空間冗余靜態(tài)圖像中存在的最主要的一種數(shù)據(jù)冗余在同一幅圖像中,規(guī)則物體和規(guī)則背景的表面物理特性具有相關(guān)性即對(duì)同一景物表面上采樣點(diǎn)的顏色之間存在著空間連貫性例如:圖像中一片連續(xù)的區(qū)域,其像素為相同的顏色—空間冗余數(shù)據(jù)壓縮的可能性P16●第五頁(yè),共六十頁(yè)。(2)時(shí)間冗余序列圖像(電視圖像、動(dòng)畫)和語(yǔ)音數(shù)據(jù)中所經(jīng)常包含的冗余一組連續(xù)的畫面之間往往存在著時(shí)間和空間的相關(guān)性例如:唱歌的歌手、兩人談話時(shí)背景一致等數(shù)據(jù)壓縮的可能性P16●第六頁(yè),共六十頁(yè)。(3)統(tǒng)計(jì)冗余是空間冗余和時(shí)間冗余的總稱。在數(shù)據(jù)處理時(shí),往往采用統(tǒng)計(jì)事件出現(xiàn)概率的辦法來(lái)鑒別空間冗余和時(shí)間冗余,因此空間冗余和時(shí)間冗余具有統(tǒng)計(jì)特性。數(shù)據(jù)壓縮的可能性P16●第七頁(yè),共六十頁(yè)。(4)結(jié)構(gòu)冗余在某些場(chǎng)景中,存在著明顯的分布模式——結(jié)構(gòu)結(jié)構(gòu)可以通過(guò)特定的過(guò)程來(lái)生成例如:方格狀的地板,蜂窩,磚墻等數(shù)據(jù)壓縮的可能性P16●第八頁(yè),共六十頁(yè)。(5)信息熵冗余信息熵:一組數(shù)據(jù)所攜帶的信息量。冗余的產(chǎn)生是因?yàn)椋涸谛旁捶?hào)的表示過(guò)程中未遵循信息論下最優(yōu)編碼而造成。通過(guò)熵編碼進(jìn)行壓縮數(shù)據(jù)壓縮的可能性P16●第九頁(yè),共六十頁(yè)。(6)視覺(jué)冗余可以根據(jù)這些視覺(jué)特性來(lái)對(duì)圖象信息進(jìn)行取舍人類的視覺(jué)系統(tǒng)對(duì)圖像場(chǎng)的敏感性:非均勻和非線性的對(duì)亮度變化敏感,而對(duì)色度的變化相對(duì)不敏感在高亮度區(qū),人眼對(duì)亮度變化敏感度下降對(duì)物體邊緣敏感,內(nèi)部區(qū)域相對(duì)不敏感對(duì)整體結(jié)構(gòu)敏感,而對(duì)內(nèi)部細(xì)節(jié)相對(duì)不敏感數(shù)據(jù)壓縮的可能性P16●第十頁(yè),共六十頁(yè)。(7)知識(shí)冗余有許多圖像的理解與某些基礎(chǔ)知識(shí)有相當(dāng)大的相關(guān)性這類規(guī)律性的結(jié)構(gòu)可以由先驗(yàn)知識(shí)和背景知識(shí)得到例如:人臉的圖像知識(shí)冗余是模型編碼的基礎(chǔ)數(shù)據(jù)壓縮的可能性P16●第十一頁(yè),共六十頁(yè)?!穸嗝襟w數(shù)據(jù)壓縮的性能指標(biāo)●壓縮比●壓縮性能常常用壓縮比定義(輸入數(shù)據(jù)和輸出數(shù)據(jù)比)例:512×480,24bit/pixel(bpp)輸出15000byte輸入=737280byte壓縮比=737280/15000=49教學(xué)進(jìn)程節(jié)省圖象或視頻的存儲(chǔ)容量,增加訪問(wèn)速度,使數(shù)字視頻能在PC機(jī)上實(shí)現(xiàn),需要進(jìn)行視頻和圖象的壓縮。有三個(gè)關(guān)鍵參數(shù)評(píng)價(jià)一個(gè)壓縮系統(tǒng):壓縮比、圖象質(zhì)量、壓縮和解壓的速度,第十二頁(yè),共六十頁(yè)?!駢嚎s質(zhì)量●壓縮方法分為無(wú)損壓縮和有損壓縮,對(duì)于有損壓縮:失真情況很難量化,只能對(duì)測(cè)試的圖象進(jìn)行估計(jì)。模擬圖象質(zhì)量的指標(biāo):信噪比、分辨率、顏色錯(cuò),但必須在觀察了實(shí)際圖象以后。教學(xué)進(jìn)程●壓縮和解壓縮速度●在許多應(yīng)用中,壓縮和解壓可能不同時(shí)用,在不同的位置不同的系統(tǒng)中。所以,壓縮、解壓速度分別估計(jì)。靜態(tài)圖象中,壓縮速度沒(méi)有解壓速度嚴(yán)格;動(dòng)態(tài)圖象中,壓縮、解壓速度都有要求,因?yàn)樾鑼?shí)時(shí)地從攝像機(jī)或VCR中抓取動(dòng)態(tài)視頻?!穸嗝襟w數(shù)據(jù)壓縮的性能指標(biāo)第十三頁(yè),共六十頁(yè)。(3)數(shù)據(jù)壓縮編碼分類無(wú)損壓縮指使用壓縮后的數(shù)據(jù)進(jìn)行重構(gòu)(或者叫做還原,解壓縮),重構(gòu)后的數(shù)據(jù)與原來(lái)的數(shù)據(jù)完全相同。無(wú)損壓縮算法一般壓縮比2~4。常用的無(wú)損壓縮算法有霍夫曼(Huffman)算法和LZW(Lenpel-Ziv&Welch)壓縮算法。有損壓縮指使用壓縮后的數(shù)據(jù)進(jìn)行重構(gòu),重構(gòu)后的數(shù)據(jù)與原來(lái)的數(shù)據(jù)有所不同,但不影響人對(duì)原始資料表達(dá)的信息造成誤解。圖像和聲音的壓縮就可以采用有損壓縮,因?yàn)槠渲邪臄?shù)據(jù)往往多于我們的視覺(jué)系統(tǒng)和聽覺(jué)系統(tǒng)所能接收的信息,丟掉一些數(shù)據(jù)而不至于對(duì)聲音或者圖像所表達(dá)的意思產(chǎn)生誤解,但可大大提高壓縮比。3.2數(shù)據(jù)壓縮編碼簡(jiǎn)介第十四頁(yè),共六十頁(yè)。壓縮技術(shù)分類通用數(shù)據(jù)壓縮(均為無(wú)損壓縮)多媒體數(shù)據(jù)壓縮(無(wú)損和有損壓縮)基于統(tǒng)計(jì)模型的壓縮技術(shù)基于字典模型的壓縮技術(shù)Huffman編碼算術(shù)編碼LZ77LZ78LZW圖像壓縮音頻和視頻壓縮MPEG等二值圖像CCITTJBIG等灰度圖像FELICSJPEG等彩色圖像RLE編碼JPEG等矢量圖像PostScriptWMFCAD等第十五頁(yè),共六十頁(yè)。壓縮技術(shù)的應(yīng)用電報(bào)、傳真(CCITT)通訊(Modem/網(wǎng)絡(luò)協(xié)議)存儲(chǔ)(壓縮池)文件系統(tǒng)(壓縮扇區(qū))圖像(GIF/TIFF/JPEG)音頻(MP3)視頻(MPEG/RM)數(shù)據(jù)庫(kù)(B+樹)歸檔(TAR/ZIP)密碼學(xué)(消除數(shù)據(jù)的原始特征)全文索引(倒排索引表)編譯(JAVA)程序設(shè)計(jì)(算法/空間和時(shí)間效率)人工智能(專家系統(tǒng)/知識(shí)樹)第十六頁(yè),共六十頁(yè)。壓縮編碼分類(按長(zhǎng)度)等長(zhǎng)編碼ASCII編碼 不等長(zhǎng)編碼編碼長(zhǎng)度是不等長(zhǎng)的常見(jiàn)編碼如Huffman編碼第十七頁(yè),共六十頁(yè)。等長(zhǎng)與不等長(zhǎng)編碼例如:符號(hào)序列x=“aa

bb

cccc

dddd

eeeeeeee”采用ASCII編碼:a=01100001b=01100010c=01100011d=01100100e=01100101空=00100000等長(zhǎng)編碼:24*8=192bit如用后3位進(jìn)行編碼只需要3*24=72bit壓縮比為:72/192=第十八頁(yè),共六十頁(yè)。等長(zhǎng)與不等長(zhǎng)編碼不等長(zhǎng)編碼方法字符次數(shù)概率碼字 字長(zhǎng)E 8 1/3 0 1D 4 1/6 100 3C 4 1/6 101 3空 4 1/6 110 3a 2 1/12 1110 4B 2 1/12 1111 4需要空間:1*8+3*4+3*4+3*4+2*4+2*4=60平均碼長(zhǎng)=總位數(shù)/字符出現(xiàn)次數(shù)=60/24=2.5第十九頁(yè),共六十頁(yè)。不等長(zhǎng)碼唯一性問(wèn)題字符 碼1 碼2 碼3 A 0 0 0B 10 10 01C 110 11 011D 1110 01 111對(duì)序列010110譯碼碼1 abc碼2 daca或ddb或abca碼3 bca第二十頁(yè),共六十頁(yè)。3.3統(tǒng)計(jì)編碼

(1)信息熵與信息量 信息量是指從N個(gè)相等的可能事件中選出一個(gè)事件所需要的信息度量或含量,也就是在辨識(shí)N個(gè)事件中特定的一個(gè)事件的過(guò)程中所需要提問(wèn)“是或否”的最少次數(shù)。 設(shè)從N個(gè)數(shù)中選定任一個(gè)數(shù)xj的概率為p(xj),假定選定任意一個(gè)數(shù)的概率都相等,即p(xj)=1/N,因此定義其信息量為:

P(xj)是信源X發(fā)出xj的概率。I(xj)的含義是,信源X發(fā)出xj這個(gè)消息(隨機(jī)事件)后,接收端收到信息量的量度。第二十一頁(yè),共六十頁(yè)。(1)信息熵與信息量 來(lái)源于40年代由ClaudeShannon創(chuàng)立的信息論中的一條定理,這一定理借用了熱力學(xué)中的名詞“熵”(Entropy)來(lái)表示一條信息中真正需要編碼的信息量。信源S發(fā)出的xj(j=1,2,…,n)共n個(gè)隨機(jī)事件的自信息統(tǒng)計(jì)平均,即

H(X)稱為信源X的“熵”,即信源X發(fā)出任意一個(gè)隨機(jī)變量的平均信息量。其中:等概率事件的熵最大,為:當(dāng)P(x1)=1時(shí),P(x2)=P(x3)=…=P(xj)=0,由(4-6)式得此時(shí)熵為由上可得熵的范圍為:3.3統(tǒng)計(jì)編碼

第二十二頁(yè),共六十頁(yè)。平均碼長(zhǎng)與熵關(guān)系 在編碼中用熵值來(lái)衡量是否為最佳編碼。若以Lc表示編碼器輸出碼字的平均碼長(zhǎng),則當(dāng) Lc≥H(S)有冗余,不是最佳。 Lc<H(S)不可能。 Lc=H(S)最佳編碼(Lc稍大于H(S))。 熵值為平均碼長(zhǎng)Lc的下限。平均碼長(zhǎng)Lc的計(jì)算公式為其中:P(xj)是信源X發(fā)出xj的概率,L(xj)為xj的編碼長(zhǎng)。(j=1,2,…,n)3.3統(tǒng)計(jì)編碼

第二十三頁(yè),共六十頁(yè)。熵的計(jì)算范例例:對(duì)信息aabbaccbaa,字符串長(zhǎng)度為10,字符a、b、c分別出現(xiàn)了5、3、2次,則Ia=-log2(0.5)=1Ib=-log2(0.3)=1.737Ic=-log2(0.2)=2.322H(S)=0.5Ia+0.3Ib+0.2Ic=1.4855如采用等長(zhǎng)編碼,則每個(gè)字符需要2位;總的碼長(zhǎng):L=5*2+3*2+2*2

=20位對(duì)比一下,我們用ASCII編碼表示該信息需要80位第二十四頁(yè),共六十頁(yè)。統(tǒng)計(jì)編碼(熵)統(tǒng)計(jì)編碼是根據(jù)消息出現(xiàn)概率的分布特性而進(jìn)行的壓縮編碼在消息和碼字間找到明確的一一對(duì)應(yīng)關(guān)系,以便恢復(fù)時(shí)能準(zhǔn)確無(wú)誤再現(xiàn)出來(lái)第二十五頁(yè),共六十頁(yè)。技術(shù)準(zhǔn)備:編碼通過(guò)模型,我們可以確定對(duì)某一個(gè)符號(hào)該用多少位二進(jìn)制數(shù)進(jìn)行編碼?,F(xiàn)在的問(wèn)題是,如何設(shè)計(jì)一種編碼方案,使其盡量精確地用模型計(jì)算出來(lái)的位數(shù)表示某個(gè)符號(hào)。前綴編碼規(guī)則:任何一個(gè)符號(hào)的編碼都不是另一個(gè)符號(hào)編碼的前綴。最簡(jiǎn)單的前綴編碼字符編碼A0B10C110D1110E1111011110111100010DABBDCEAAB第二十六頁(yè),共六十頁(yè)。Shannon-Fano編碼采用從上到下的方法進(jìn)行編碼。仙農(nóng)-范諾(Shannon-Fano)算法:首先按照符號(hào)出現(xiàn)的頻度或概率排序,使用遞歸方法分成兩個(gè)部分,每一部分具有近似相同的次數(shù)(概率)當(dāng)概率和為1,進(jìn)行編碼第二十七頁(yè),共六十頁(yè)。Shannon-Fano編碼例1有一幅40個(gè)象素組成的灰度圖像,灰度共有5級(jí),分別用符號(hào)A、B、C、D和E表示,40個(gè)象素中出現(xiàn)灰度A的象素?cái)?shù)有15個(gè),出現(xiàn)灰度B的象素?cái)?shù)有7個(gè),出現(xiàn)灰度C的象素?cái)?shù)有7個(gè)等等。如果用3個(gè)位表示5個(gè)等級(jí)的灰度值,也就是每個(gè)象素用3位表示,編碼這幅圖像總共需要120位。符號(hào)ABCD

E出現(xiàn)的次數(shù)157765H(S)=(15/40)*

(40/15)+(7/40)*

(40/7)+…

+(5/40)*

(40/5)=2.196

這就是說(shuō)每個(gè)符號(hào)用2.196位表示,40個(gè)象素需用87.84位第二十八頁(yè),共六十頁(yè)。Shannon-Fano編碼例1符號(hào)出現(xiàn)的次數(shù)(

)

分配的代碼需要的位數(shù)A15(0.375)1.41500030B7(0.175)2.51450114C7(0.175)2.51451014D6(0.150)2.736911018E5(0.125)3.000011115第二十九頁(yè),共六十頁(yè)。Shannon-Fano編碼例2例題:cabcedeacacdeddaaabaababaaabbacdebaceada例子中的信息編碼為:1000011011111011100100010......碼長(zhǎng)共91位,而使用ASCII編碼表示上述信息共需要320位a–16b–7c–6d–6e-5a–16b–7---------c–6-----d–6e-5a–00b–01c–10d–110e–111root0010111abcde0第三十頁(yè),共六十頁(yè)。3.3統(tǒng)計(jì)編碼-霍夫曼編碼 依據(jù)信源字符出現(xiàn)的概率大小來(lái)構(gòu)造代碼,對(duì)出現(xiàn)概率較大的信源字符,給予較短碼長(zhǎng),而對(duì)于出現(xiàn)概率較小的信源字符,給予較長(zhǎng)的碼長(zhǎng),最后使得編碼的平均碼字最短。第三十一頁(yè),共六十頁(yè)。3.3統(tǒng)計(jì)編碼-霍夫曼編碼(2) 編碼過(guò)程——出現(xiàn)頻率高的數(shù)據(jù)編碼長(zhǎng)度短,反之亦然[1]信號(hào)源的數(shù)據(jù)按照出現(xiàn)概率遞減的順序排列[2]合并兩個(gè)最小出現(xiàn)概率,作為新數(shù)據(jù)出現(xiàn)概率[3]重復(fù)進(jìn)行[1][2],直至概率相加為1為止[4]合并運(yùn)算時(shí),概率大者取0,概率小者取1[5]記錄概率為1處到信號(hào)源的0、1序列編碼特點(diǎn)[1]編碼長(zhǎng)度可變,壓縮與解壓縮較慢[2]硬件實(shí)現(xiàn)困難[3]編碼效率取決于信號(hào)源的數(shù)據(jù)出現(xiàn)概率第三十二頁(yè),共六十頁(yè)。例4-1:設(shè)輸入圖像的灰度級(jí){a1,a2,a3,a4,a5,a6}出現(xiàn)的概率分別是0.4、0.2、0.12、0.15、0.1、0.03。試進(jìn)行哈夫曼編碼,并計(jì)算編碼效率、壓縮比、冗余度。

編碼步驟:(1)初始化,根據(jù)符號(hào)概率的大小按由大到小順序?qū)Ψ?hào)進(jìn)行排序,如圖4-2所示。(2)把概率小的兩個(gè)符號(hào)組成一個(gè)節(jié)點(diǎn),如圖4-2中的a5、a6組成節(jié)點(diǎn)P1。(3)重復(fù)步驟2,得到節(jié)點(diǎn)P2、P3、P4、P5,形成一棵“樹”,其中P5為根節(jié)點(diǎn)。(4)從根節(jié)點(diǎn)P5開始到相應(yīng)于每個(gè)符號(hào)的“樹葉”,從上到下標(biāo)上1(上枝)或者0(下枝),至于哪個(gè)為1哪個(gè)為0則無(wú)關(guān)緊要,最后的結(jié)果僅僅是分配的代碼不同,而代碼的平均長(zhǎng)度是相同的。最終編碼結(jié)果為:a1=1,a2=000, a3=011,a4=001,a5=0100, a6=0101

第三十三頁(yè),共六十頁(yè)。由公式可求得圖像信源熵是:H(X)=

=-(0.4×log20.4+0.2×log20.2+0.12×log20.12+ 0.15×log20.15+0.1×log20.1+0.03×log20.03) =2.25bit根據(jù)哈夫曼編碼過(guò)程圖給出的結(jié)果,由公式(4-7)可求出它的平均碼字長(zhǎng)度:Lc=0.4×1+0.2×3+0.15×3+0.12×3+0.1×4+0.03×4=2.33壓縮之前8個(gè)符號(hào)需要3個(gè)比特量化,經(jīng)過(guò)壓縮之后的平均碼字長(zhǎng)度為2.33,由公式(4-10)得其壓縮比為:第三十四頁(yè),共六十頁(yè)。Huffman編碼例題2:cabcedeacacdeddaaabaababaaabbacdebaceada

例子中的信息編碼為:101010010111111011101010101......碼長(zhǎng)88位,比Shannon-Fano編碼略短一些a–16b–7c–6d–6e-5a–0b–100c–101d–110e–111root00111abcde001第三十五頁(yè),共六十頁(yè)。整數(shù)位編碼與信息熵cabcedeacacdeddaaabaababaaabbacdebaceada該信息的熵經(jīng)計(jì)算可知為86.601位符號(hào)理想位數(shù)(熵)S-F編碼需要位數(shù)Huffman編碼需要位數(shù)a1.32221b2.51523c2.73723d2.73733e3.00033總計(jì)86.6019188第三十六頁(yè),共六十頁(yè)。3.3統(tǒng)計(jì)編碼-算術(shù)編碼 假設(shè)某個(gè)字符的出現(xiàn)概率為80%,該字符事實(shí)上只需要-log2(0.8)=0.322個(gè)二進(jìn)制位進(jìn)行編碼 難道真的能只輸出0.322個(gè)0或0.322個(gè)1嗎?算術(shù)編碼的輸出是:一個(gè)小數(shù) 算術(shù)編碼對(duì)整條信息(無(wú)論信息有多么長(zhǎng)),其輸出僅僅是一個(gè)數(shù),而且是一個(gè)介于0和1之間的二進(jìn)制小數(shù)。 例如算術(shù)編碼對(duì)某條信息的輸出為1010001111,那么它表示小數(shù)0.1010001111,也即十進(jìn)制數(shù)0.64第三十七頁(yè),共六十頁(yè)。算術(shù)編碼(arithmeticcodingAC)是利用0和1之間的間隔來(lái)表示信源編碼的一種方法,其編碼值是間隔的上、下限包含的相同二進(jìn)制。編碼過(guò)程中的間隔決定了符號(hào)壓縮后的輸出。算術(shù)編碼用到兩個(gè)基本的參數(shù):符號(hào)的概率和它的編碼間隔。

信源符號(hào)的概率決定壓縮編碼的效率,也決定編碼過(guò)程中信源符號(hào)的間隔,而這些間隔包含在0到1之間。3.3統(tǒng)計(jì)編碼-算術(shù)編碼第三十八頁(yè),共六十頁(yè)。算術(shù)編碼計(jì)算方法Low=low+range*range_low(symbol)high=low+range*range_high(symbol)其中:Low是前一個(gè)符號(hào)的最低值;range是之前所有符號(hào)的概率積;range_low和range_high分別是當(dāng)前符號(hào)的上下值;一般編碼取最小值,采用乘2取整得到二進(jìn)制編碼。第三十九頁(yè),共六十頁(yè)。例假設(shè)信源符號(hào)為{A,B,C,D},這些符號(hào)的概率分別為{0.1,0.4,0.2,0.3},根據(jù)這些概率可把間隔[0,1]分成4個(gè)子間隔:[0,0.1],[0.1,0.5],[0.5,0.7],[0.7,1],如表符號(hào)ABCD概率0.10.40.20.3初始編碼間隔[0,0.1][0.1,0.5][0.5,0.7][0.7,1]表信源符號(hào)、概率和初始編碼間隔如果消息序列的輸入為:CADACDB,其編碼過(guò)程如下:首先輸入的符號(hào)是C,找到它的編碼范圍是[0.5,0.7];由于消息中第2個(gè)符號(hào)A的編碼范圍是[0,0.1],因此它的間隔就取[0.5,0.7]的第一個(gè)1/10作為新間隔[0.5,0.52];編碼第3個(gè)符號(hào)D時(shí)取新間隔為[0.514,0.52];編碼第4個(gè)符號(hào)A時(shí),取新間隔為[0.514,0.5146],…。第四十頁(yè),共六十頁(yè)。消息的編碼輸出可以是最后一個(gè)間隔中的任意數(shù),整個(gè)編碼過(guò)程如圖。最后在[0.5143876,0.514402]中選擇一個(gè)數(shù)作為編碼輸出值:0.5143876解碼時(shí),解碼器由編碼輸出值:0.5143876,可馬上解得一個(gè)字符為C,然后依次得到唯一解A,D,A,C,D,B。第四十一頁(yè),共六十頁(yè)。3.3統(tǒng)計(jì)編碼

-行程編碼是一個(gè)針對(duì)包含有順序排列的多次重復(fù)的數(shù)據(jù)的壓縮方案。其原理就是把一系列的重復(fù)值用一個(gè)單獨(dú)的值再加上一個(gè)計(jì)數(shù)值來(lái)取代,行程長(zhǎng)度就是連續(xù)且重復(fù)的單元數(shù)目。如果想得到原始數(shù)據(jù),只需展開這個(gè)編碼就可以了。例如,計(jì)算機(jī)制作圖像中,常常具有許多顏色相同的圖塊,而且在行上都具有相同的顏色,或者在一行上有許多連續(xù)的像素都具有相同的顏色值。這時(shí),就不需要存儲(chǔ)每一個(gè)像素的顏色值,而僅存儲(chǔ)一個(gè)像素的顏色值以及具有相同顏色的像素?cái)?shù)目就可以,或者存儲(chǔ)一個(gè)像素的顏色值,以及具有相同顏色值的行數(shù),這種壓縮編碼稱為行程編碼。具有相同顏色的連續(xù)的像素?cái)?shù)目稱為行程長(zhǎng)度。第四十二頁(yè),共六十頁(yè)。十進(jìn)制小數(shù)0.6875轉(zhuǎn)換為二進(jìn)制小數(shù)是?方法是?答案是?0.1011第四十三頁(yè),共六十頁(yè)。假定一幅灰度圖像,第n行的像素值為:用RLE編碼方法得到的代碼為:3150841160。代碼斜黑體表示的數(shù)字是行程長(zhǎng)度,黑體字后面的數(shù)字代表像素的顏色值。例如黑體字50代表有連續(xù)50個(gè)像素具有相同的顏色值,它的顏色值是8。對(duì)比RLE編碼前后的代碼數(shù)可以發(fā)現(xiàn),在編碼前要用73個(gè)代碼表示這一行的數(shù)據(jù),而編碼后只要用10個(gè)代碼表示代表原來(lái)的73個(gè)代碼,壓縮前后的數(shù)據(jù)量之比約為7:1,即壓縮比為7:1。這說(shuō)明RLE確實(shí)是一種壓縮技術(shù),而且編碼技術(shù)實(shí)用。3.3統(tǒng)計(jì)編碼

-行程編碼第四十四頁(yè),共六十頁(yè)。RLE的性能好壞主要取決于圖像本身的特點(diǎn)。RLE壓縮編碼尤其適用于計(jì)算機(jī)生成的圖像,對(duì)減少圖像文件的存儲(chǔ)空間非常有效。然而,由于顏色豐富的自然圖像在同一行上具有相同顏色的連續(xù)像素往往很少,而連續(xù)幾行都具有相同顏色值的連續(xù)行數(shù)就更少,如果仍然使用RLE編碼方法,不僅不能壓縮圖像數(shù)據(jù),反而可能使原來(lái)的圖像數(shù)據(jù)變得更大。譯碼時(shí)按照與編碼時(shí)采用的相同規(guī)則進(jìn)行,還原后得到的數(shù)據(jù)與壓縮前的數(shù)據(jù)完全相同。因此,RLE屬于無(wú)損壓縮技術(shù)。3.3統(tǒng)計(jì)編碼

-行程編碼第四十五頁(yè),共六十頁(yè)。詞典編碼屬于無(wú)損壓縮技術(shù),其根據(jù)是數(shù)據(jù)本身包含有重復(fù)代碼序列這個(gè)特性。詞典編碼的種類較多,歸納起來(lái)有兩類:第一類詞典編碼的基本思想是查找正在壓縮的字符序列是否在前面輸入的數(shù)據(jù)中出現(xiàn)過(guò),如果是,則用指向早期出現(xiàn)過(guò)的字符串的“指針”替代重復(fù)的字符串。3.3統(tǒng)計(jì)編碼

–詞典編碼第四十六頁(yè),共六十頁(yè)。3.3LZW詞典編碼例:待編碼數(shù)據(jù)流ABBCABBBC第四十七頁(yè),共六十頁(yè)。源碼鍵輸出字典字符串1A2B3CNILAAB14ABBB25BBBC26BCCA37CAAB(A)BB48ABBBB(B)BC59BBCCEOF3第四十八頁(yè),共六十頁(yè)。源碼后碼輸出字典字符串1A2B3CAB14ABBC25BCCA36CAAB(A)BA47ABAABBA(AB)AA78ABAAAEOF1ABCABABAA第四十九頁(yè),共六十頁(yè)。3.4

預(yù)測(cè)編碼-脈沖編碼調(diào)制3.23.92.83.41.24.2343314011100011011001100原始信號(hào)PAM脈沖(采樣)PCM脈沖(量化)有量化差錯(cuò)1001100PCM輸出(編碼)第五十頁(yè),共六十頁(yè)。

3.4

預(yù)測(cè)編碼-脈沖編碼調(diào)制第五十一頁(yè),共六十頁(yè)。3.4

預(yù)測(cè)編碼-量化(1)均勻量化如果采用相等的量化間隔對(duì)采樣得到的信號(hào)作量化,那么這種量化稱為均勻量化。均勻量化就是采用相同的“等分尺”來(lái)度量采樣得到的幅度,也稱為線性量化,如圖3-08所示。量化后的樣本值Y和原始值X的差E=Y-X稱為量化誤差或量化噪聲。第五十二頁(yè),共六十頁(yè)。(2)非均勻量化

無(wú)論對(duì)大的輸入信號(hào)還是小的輸入信號(hào)一律都采用相同的量化間隔。但是,對(duì)話音信號(hào)來(lái)說(shuō),大信號(hào)出現(xiàn)的機(jī)會(huì)并不多,增加的樣本位數(shù)就沒(méi)有充分利用。為了克服這個(gè)不足,就出現(xiàn)了非均勻量化的方法,這種方法也叫做非線性量化。非線性量化的基本想法是,對(duì)輸入信號(hào)進(jìn)行量化時(shí),大的輸入

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論