![《光電圖像處理》06-圖像編碼_第1頁(yè)](http://file4.renrendoc.com/view/8117f00c44c8009fd3ca23bcf8ac8754/8117f00c44c8009fd3ca23bcf8ac87541.gif)
![《光電圖像處理》06-圖像編碼_第2頁(yè)](http://file4.renrendoc.com/view/8117f00c44c8009fd3ca23bcf8ac8754/8117f00c44c8009fd3ca23bcf8ac87542.gif)
![《光電圖像處理》06-圖像編碼_第3頁(yè)](http://file4.renrendoc.com/view/8117f00c44c8009fd3ca23bcf8ac8754/8117f00c44c8009fd3ca23bcf8ac87543.gif)
![《光電圖像處理》06-圖像編碼_第4頁(yè)](http://file4.renrendoc.com/view/8117f00c44c8009fd3ca23bcf8ac8754/8117f00c44c8009fd3ca23bcf8ac87544.gif)
![《光電圖像處理》06-圖像編碼_第5頁(yè)](http://file4.renrendoc.com/view/8117f00c44c8009fd3ca23bcf8ac8754/8117f00c44c8009fd3ca23bcf8ac87545.gif)
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、光電圖像處理 (六)圖像編碼電子工程學(xué)院光電子技術(shù)系16.1 圖像編碼概述 6.2 哈夫曼編碼6.3 香農(nóng)-范諾編碼6.4 行程編碼6.5 LZW編碼 6.6 算術(shù)編碼6.7 預(yù)測(cè)編碼6.8 圖像編碼的國(guó)際標(biāo)準(zhǔn)主 要 內(nèi) 容26.1 圖像編碼概述 6.2 哈夫曼編碼6.3 香農(nóng)-范諾編碼6.4 行程編碼6.5 LZW編碼 6.6 算術(shù)編碼6.7 預(yù)測(cè)編碼6.8 圖像編碼的國(guó)際標(biāo)準(zhǔn)主 要 內(nèi) 容36.1 圖像編碼概述 6.1.1 圖像編碼技術(shù)的研究背景 6.1.2 圖像編碼基本原理 6.1.3 圖像編碼的方法 6.1.4 圖像編碼新技術(shù) 6.1.5 圖像編碼評(píng)價(jià)4 6.1.1 圖像編碼技術(shù)的研究
2、背景通信方式的改變文字+語(yǔ)音圖像+文字+語(yǔ)音通信對(duì)象的改變?nèi)伺c人人與機(jī)器,機(jī)器與機(jī)器1. 信息傳輸方式發(fā)生了很大的改變5 (a)彩色視頻信息 對(duì)于電視畫(huà)面的分辨率640 480的彩色圖像,每秒30幀,則一秒鐘的數(shù)據(jù)量為: 640 480 24 30 = 221.12Mbit 所以播放時(shí),需要221Mbps的通信回路。 參考數(shù)據(jù):寬帶網(wǎng)為512K,電話(huà)線(xiàn)為56K。 存儲(chǔ)時(shí),1張CD可存640M,則僅可以存放2.89秒的數(shù)據(jù)。2. 圖像傳輸與存儲(chǔ)需要的信息量空間6 (b)傳真數(shù)據(jù) 如果只傳送2值圖像,以200dpi的分辨率傳輸,一張A4稿紙的內(nèi)容的數(shù)據(jù)量為:3888768bit 按目前14.4K的
3、電話(huà)線(xiàn)傳輸速率,需要傳送的時(shí)間是:270秒(4.5分) 按每分鐘4元計(jì)算:18元 由于通信方式和通信對(duì)象的改變帶來(lái)的最大問(wèn)題是: 傳輸帶寬、速度、存儲(chǔ)器容量的限制。 給我們帶來(lái)的一個(gè)難題,也給了我們一個(gè)機(jī)會(huì): 如何用軟件的手段來(lái)解決硬件上的物理極限。7圖像信息源圖像預(yù)處理圖像信源編碼信道編碼調(diào)制信道傳輸解調(diào)信道解碼圖像信源解碼顯示圖像圖像通信系統(tǒng)模型81. 數(shù)字圖像的冗余的概念6.1.2 圖像編碼基本原理 你的妻子,Helen,將于明天晚上6點(diǎn)零5分在上海的虹橋機(jī)場(chǎng)接你。 (232+10=56個(gè)半角字符) 你的妻子將于明天晚上6點(diǎn)零5分在虹橋機(jī)場(chǎng)接你。 (202+3=43個(gè)半角字符) Hele
4、n將于明晚6點(diǎn)在虹橋接你。 (102+7=27個(gè)半角字符)結(jié)論:只要接收端不會(huì)產(chǎn)生誤解,就可以減少承載信息的數(shù)據(jù)量。9描述語(yǔ)言(1) “這是一幅 22的圖像,圖像的第一個(gè)像素是紅的,第二個(gè)像素是紅的,第三個(gè)像素是紅的,第四個(gè)像素是紅的”。 (2) “這是一幅22的圖像,整幅圖都是紅色”。 由此我們知道,整理圖 像的描述方法可以達(dá)到 壓縮的目的。10圖像冗余無(wú)損壓縮的原理RGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGB16RGB從原來(lái)的1638=384bits 壓縮為:(1+3)8=32bits11圖像冗余有損壓縮的原理36353434343434
5、32343433373034343434343434343534343134343434343434343434343434343434343434343434343434253412 空間冗余:圖像內(nèi)部相鄰像素之間存在較強(qiáng)的相關(guān)性 所造成的冗余。 時(shí)間冗余: 視頻圖像序列中的不同幀之間的相關(guān)性 所造成的冗余。 視覺(jué)冗余: 是指人眼不能感知或不敏感的那部分圖 像信息。2. 數(shù)字圖像冗余的分類(lèi)13信息熵冗余: 也稱(chēng)編碼冗余,如果圖像中平均每個(gè)像素使用 的比特?cái)?shù)大于該圖像的信息熵,則圖像中存在冗余,這種冗余稱(chēng)為信息熵冗余。結(jié)構(gòu)冗余: 是指圖像中存在很強(qiáng)的紋理結(jié)構(gòu)或自相似性。知識(shí)冗余: 是指在有些圖
6、像中還包含與某些先驗(yàn)知識(shí)有關(guān)的信 息。圖像編碼的目的:充分利用圖像中存在的各種冗余信息,特別是空間冗余、時(shí)間冗余以及視覺(jué)冗余,以盡量少的比特?cái)?shù)來(lái)表示圖像。14有損壓縮:存在信息損耗,不能精確重建原始圖像,存在一定程度的失真。包括哈夫曼編碼、行程編碼和算術(shù)編碼無(wú)損壓縮:不存在信息損失,解壓縮時(shí)能夠從壓縮數(shù)據(jù)精確地恢復(fù)原始圖像。包括預(yù)測(cè)編碼、變換編碼等等。6.1.3 圖像編碼的方法1. 根據(jù)編碼過(guò)程是否存在信息損耗15熵編碼:基于信號(hào)統(tǒng)計(jì)特性的編碼技術(shù),無(wú)損編碼。基本原理是給出現(xiàn)概率較大的符號(hào)賦予一個(gè)短碼字,而給出現(xiàn)概率較小的符號(hào)賦予一個(gè)長(zhǎng)碼字,從而使得最終的平均碼長(zhǎng)很小。包括行程編碼(Run L
7、ength Encoding)、哈夫曼編碼和算術(shù)編碼等。預(yù)測(cè)編碼:基于圖像數(shù)據(jù)的空間或時(shí)間冗余特性,用相鄰的已知像素(或像素塊)來(lái)預(yù)測(cè)當(dāng)前像素(或像素塊)的取值,然后再對(duì)預(yù)測(cè)誤差進(jìn)行量化和編碼??煞譃閹瑑?nèi)預(yù)測(cè)和幀間預(yù)測(cè),常用的預(yù)測(cè)編碼有差分脈碼調(diào)制(Differential Pulse Code Modulation, DPCM)和運(yùn)動(dòng)補(bǔ)償法。2. 根據(jù)編碼原理16變換編碼:是將空間域上的圖像經(jīng)過(guò)正交變換映射到另一變換域上,使變換后的系數(shù)之間的相關(guān)性降低。圖像變換本身并不能壓縮數(shù)據(jù),但變換后圖像的大部分能量只集中到少數(shù)幾個(gè)變換系數(shù)上,采用適當(dāng)?shù)牧炕挽鼐幋a就可以有效地壓縮圖像?;旌暇幋a:混合編
8、碼是指綜合了熵編碼、變換編碼或預(yù)測(cè)編碼的編碼方法,如JPEG標(biāo)準(zhǔn)和MPEG標(biāo)準(zhǔn)。17信息保持編碼: 也稱(chēng)無(wú)失真編碼, 它要求在編解碼過(guò)程中保證圖像信息不丟失,從而可以完整地重建圖像。保真度編碼:利用人眼的視覺(jué)特性,在允許的失真(Lossy)條件下或一定的保真度準(zhǔn)則下,最大限度地壓縮圖像。特征提取: 在圖像識(shí)別、分析和分類(lèi)等技術(shù)中,往往并不需要全部圖像信息,而只要對(duì)感興趣的部分特征信息進(jìn)行編碼即可壓縮數(shù)據(jù)。3. 根據(jù)對(duì)壓縮編碼后的圖像進(jìn)行重建的準(zhǔn)確程度186.1.4 圖像編碼新技術(shù)分形編碼(Fractal Coding):最大限度地利用了圖像在空間域上的自相似性(即局部與整體之間存在某種相似性)
9、,通過(guò)消除圖像的幾何冗余來(lái)壓縮數(shù)據(jù)。小波編碼(Wavelet Coding):經(jīng)過(guò)小波變換后的圖像,具有良好的空間方向選擇性,而且是多分辨率的,能夠保持原圖像在各種分辨率下的精細(xì)結(jié)構(gòu),與人的視覺(jué)特性十分吻合。模型編碼(Model Based Coding ):在編、解碼兩端分別建立起相同的模型,編碼時(shí)利用先驗(yàn)?zāi)P统槿D像中的主要信息并用模型參數(shù)的形式表示,解碼時(shí)則利用所接收的模型參數(shù)重建圖像。 196.1.5 圖像編碼評(píng)價(jià)1. 算法的編碼效率2. 編碼圖像的質(zhì)量3. 算法的適用范圍4. 算法的復(fù)雜程度 一般來(lái)說(shuō),評(píng)價(jià)圖像壓縮算法的優(yōu)劣主要有以下4個(gè)參數(shù):20R平均碼字長(zhǎng)度r圖像的壓縮比(rat
10、e)bps每秒鐘所需的傳輸比特?cái)?shù)(bits per second)圖像熵與平均碼長(zhǎng)之比1. 算法的編碼效率21 設(shè)一幅灰度級(jí)為N的圖像,圖像中第k級(jí)灰度出現(xiàn)的概率為Pk, 圖像大小為NxNy,每個(gè)像素用d比特表示,每?jī)蓭瑘D像間隔t。 對(duì)于一種圖像編碼方法,設(shè)第k級(jí)灰度的碼字長(zhǎng)度為Bk,則該圖像的平均碼字長(zhǎng)度R為: 則按信息論中信息熵的定義,則數(shù)字圖像的熵H為:由此可見(jiàn),圖像熵H表示各灰度級(jí)比特?cái)?shù)的統(tǒng)計(jì)平均值。22編碼效率為: 每秒鐘所需的傳輸比特?cái)?shù)bps為 :壓縮比r為: 由于同一壓縮算法對(duì)不同圖像的編碼效率會(huì)有所不同,因此常需定義一些“標(biāo)準(zhǔn)圖像”,一般通過(guò)測(cè)量不同壓縮算法對(duì)同一組“標(biāo)準(zhǔn)圖像”
11、的編碼性能來(lái)評(píng)價(jià)各圖像壓縮算法的編碼效率。 232. 編碼圖像的質(zhì)量圖像質(zhì)量評(píng)價(jià)可分為:客觀(guān)質(zhì)量評(píng)價(jià)和主觀(guān)質(zhì)量評(píng)價(jià)。最常用的客觀(guān)質(zhì)量評(píng)價(jià)指標(biāo)是:均方誤差(MSE)和峰值信噪比(PSNR)。24 主觀(guān)質(zhì)量評(píng)價(jià)是指:由一批觀(guān)察者對(duì)編碼圖像進(jìn)行觀(guān)察并打分,然后綜合所有人的評(píng)判結(jié)果,給出圖像的質(zhì)量評(píng)價(jià)。客觀(guān)質(zhì)量評(píng)價(jià)能夠快速有效地評(píng)價(jià)編碼圖像的質(zhì)量,但符合客觀(guān)質(zhì)量評(píng)價(jià)指標(biāo)的圖像不一定具有較好的主觀(guān)質(zhì)量。主觀(guān)質(zhì)量評(píng)價(jià)能夠與人的視覺(jué)效果相匹配,但其評(píng)判過(guò)程緩慢費(fèi)時(shí)。 25 特定的圖像編碼算法具有其相應(yīng)的適用范圍, 并不對(duì)所有圖像都有效。一般說(shuō)來(lái), 大多數(shù)基于圖像信息統(tǒng)計(jì)特性的壓縮算法具有較廣的適用范圍, 而
12、一些特定的編碼算法的適用范圍較窄, 如分形編碼主要用于自相似性高的圖像。 3. 算法的適用范圍26 算法的復(fù)雜度即指完成圖像壓縮和解壓縮所需的運(yùn)算量和硬件實(shí)現(xiàn)該算法的難易程度。優(yōu)秀的壓縮算法要求有較高的壓縮比,壓縮和解壓縮快,算法簡(jiǎn)單,易于硬件實(shí)現(xiàn),還要求解壓縮后的圖像質(zhì)量較好。選用編碼方法時(shí)一定要考慮圖像信源本身的統(tǒng)計(jì)特性、多媒體系統(tǒng)(硬件和軟件產(chǎn)品)的適應(yīng)能力、 應(yīng)用環(huán)境以及技術(shù)標(biāo)準(zhǔn)。 4. 算法的復(fù)雜程度276.1 圖像編碼概述 6.2 哈夫曼編碼6.3 香農(nóng)-范諾編碼6.4 行程編碼6.5 LZW編碼 6.6 算術(shù)編碼6.7 預(yù)測(cè)編碼6.8 圖像編碼的國(guó)際標(biāo)準(zhǔn)主 要 內(nèi) 容286.2
13、哈夫曼編碼 1. 哈夫曼編碼的理論基礎(chǔ) RH總可設(shè)計(jì)出一種無(wú)失真編碼。RH時(shí),表明該編碼方法效率很低; R等于或很接近于H時(shí)最佳編碼,無(wú)失真R 0)時(shí),采用香農(nóng)-范諾編碼同樣能夠達(dá)到100%的編碼效率。香農(nóng)-范諾編碼的理論基礎(chǔ)是符號(hào)的碼字長(zhǎng)度Ni完全由該符號(hào)出現(xiàn)的概率來(lái)決定,即 式中,D為編碼所用的數(shù)制。 44香農(nóng)-范諾編碼的步驟如下: (1) 將信源符號(hào)按其出現(xiàn)概率從大到小排序; (2) 計(jì)算出各概率對(duì)應(yīng)的碼字長(zhǎng)度Ni; (3) 計(jì)算累加概率Ai,即Ai=Ai-1+Pi-1 i=1, 2, , N-1; A0=0 (4)把各個(gè)累加概率Ai由十進(jìn)制轉(zhuǎn)化為二進(jìn)制,取該二進(jìn)制數(shù)的前Ni位作為對(duì)應(yīng)信
14、源符號(hào)的碼字。 45香農(nóng)-范諾編碼 46二分法香農(nóng)-范諾編碼方法: (1) 首先統(tǒng)計(jì)出每個(gè)符號(hào)出現(xiàn)的概率; (2) 對(duì)上述概率從大到小排序; (3)從這個(gè)概率集合中的某個(gè)位置將其分為兩個(gè)子集合,并盡量使兩個(gè)子集合的概率和近似相等,給前面一個(gè)子集合賦值為0, 后面一個(gè)子集合賦值為1; (4) 重復(fù)步驟3,直到各個(gè)子集合中只有一個(gè)元素為止; (5) 將每個(gè)元素所屬的子集合的值依次串起來(lái),即可得到各個(gè)元素的香農(nóng)-范諾編碼。 47二分法香農(nóng)-范諾編碼 486.1 圖像編碼概述 6.2 哈夫曼編碼6.3 香農(nóng)-范諾編碼6.4 行程編碼6.5 LZW編碼 6.6 算術(shù)編碼6.7 預(yù)測(cè)編碼6.8 圖像編碼的
15、國(guó)際標(biāo)準(zhǔn)主 要 內(nèi) 容496.4 行 程 編 碼 將具有相同值的連續(xù)串用其串長(zhǎng)和一個(gè)代表值來(lái)代替, 該連續(xù)串就稱(chēng)為行程,串長(zhǎng)稱(chēng)為行程長(zhǎng)度。 例如 aaaa bbb cc d eeeee fffffff (共228=176 bits) 4a3b2c1d5e7f (共128=96 bits) 1. 行程編碼基本原理和方法行程編碼行程長(zhǎng)度編碼(Run Length Encoding, RLE)50 定長(zhǎng)編碼:編碼的行程長(zhǎng)度所用的二進(jìn)制位數(shù)固定。 變長(zhǎng)行程編碼:對(duì)不同范圍的行程長(zhǎng)度使用不同位數(shù)的二進(jìn)制位進(jìn)行編碼。使用變長(zhǎng)行程編碼需要增加標(biāo)志位來(lái)表明所使用的二進(jìn)制位數(shù)。 2. 行程編碼的分類(lèi)3. 行程編
16、碼的應(yīng)用 1) 行程編碼比較適合于二值圖像的編碼,一般用于量化后出現(xiàn)大量零系數(shù)連續(xù)的場(chǎng)合,用行程來(lái)表示連零碼。 2) 如果圖像是由很多塊顏色或灰度相同的大面積區(qū)域組成的,那么采用行程編碼可以達(dá)到很高的壓縮比。 3) 如果圖像中的數(shù)據(jù)非常分散,則行程編碼不但不能壓縮數(shù)據(jù),反而會(huì)增加圖像文件的大小。這時(shí)一般和其他編碼結(jié)合使用。51傳真件中一般都是白色比較多,而黑色相對(duì)比較少。所以可能常常會(huì)出現(xiàn)如下的情況: 600w 3b 100w 12b 4w 3b 200w 上面的行程編碼所需用的字節(jié)數(shù)為:7 因?yàn)椋?126001024 所以:計(jì)數(shù)值必須用10bit來(lái)表示 107=70bit在傳真中的應(yīng)用52
17、現(xiàn)在我們就希望對(duì)其有一個(gè)改善。 白色:10bit,黑色:4bit 600W 3b 100w 12b 4w 3b 200w 所需字節(jié)數(shù)為: 410+34=52bit 比原來(lái)的方式107=70bit減少了18bit53 PCX文件:文件頭圖像壓縮數(shù)據(jù)256色調(diào)色板。 文件頭全長(zhǎng)128字節(jié),包含了圖像的大小和顏色以及PCX文件的版本標(biāo)識(shí)等信息 圖像壓縮數(shù)據(jù)緊跟在文件頭之后。按顏色平面和掃描行存儲(chǔ)。 如果沒(méi)有使用調(diào)色板, 那么圖像壓縮數(shù)據(jù)存儲(chǔ)的是實(shí)際像素值;否則,存儲(chǔ)的是調(diào)色板的索引值。4. PCX文件中的行程編碼PCX格式是ZSOFT公司在開(kāi)發(fā)圖像處理軟件Paintbrush時(shí)開(kāi)發(fā)的一種格式,基于P
18、C的繪圖程序的專(zhuān)用格式,一般的桌面排版、圖形藝術(shù)和視頻捕獲軟件都支持這種格式。PCX支持256色調(diào)色板或全24位的RGB,圖像大小最多達(dá)64K64K像素。不支持CMYK或HSI顏色模式,photoshop等多種圖像處理軟件均支持PCX格式。 PCX壓縮屬于無(wú)損壓縮。 54 1) 圖像數(shù)據(jù)以字節(jié)為單位進(jìn)行編碼的,每行填充到偶數(shù)字節(jié). 2) Pcx文件規(guī)定編碼時(shí)的最大行程長(zhǎng)度為63,如果行程長(zhǎng)度大于63,則必須分多次存儲(chǔ)。對(duì)于長(zhǎng)度大于1的行程,編碼時(shí)先存入其行程長(zhǎng)度(長(zhǎng)度L加上192即0 xC0),再存入該行程的代表值,行程長(zhǎng)度和行程的代表值分別占一字節(jié)。 3) 如果遇到不重復(fù)的像素值,如果該像素
19、值小于等于0 xC0,則直接存入該像素值。否則首先存入一個(gè)0 xC1,然后再存入該像素值。這樣做是為了避免該像素值被誤認(rèn)為是數(shù)據(jù)長(zhǎng)度。 4) 對(duì)于連續(xù)重復(fù)的像素值,統(tǒng)計(jì)其連續(xù)出現(xiàn)的次數(shù)iCount(最大取值為63),先存入長(zhǎng)度信息(iCount | 0 xC0),然后再存入像素值。如果連續(xù)次數(shù)超過(guò)63次,則必須分多次處理。例如,連續(xù)132個(gè)0 x98,編碼時(shí)必須分三次處理,編碼結(jié)果為:0 xFF 0 x98 0 xFF 0 x98 0 xC6 0 x98。編碼原則:55從壓縮數(shù)據(jù)部分讀取一個(gè)字節(jié),判斷該值是否大于0 xC0如果大于0 xC0 ,則表明該字節(jié)是行程長(zhǎng)度信息, 取其低六位(相當(dāng)于減
20、去0 xC0)作為行程長(zhǎng)度L,讀取下一個(gè)字節(jié)作為像素值并重復(fù)L次存入圖像數(shù)據(jù)緩沖區(qū)如果小于等于0 xC0,直接將該字節(jié)存入圖像數(shù)據(jù)緩沖區(qū)。256色PCX文件解碼:雖然幾乎所有的圖像應(yīng)用軟件都支持PCX文件格式,但由于它的壓縮比不高, 因而現(xiàn)在用得不是很多。566.1 圖像編碼概述 6.2 哈夫曼編碼6.3 香農(nóng)-范諾編碼6.4 行程編碼6.5 LZW編碼 6.6 算術(shù)編碼6.7 預(yù)測(cè)編碼6.8 圖像編碼的國(guó)際標(biāo)準(zhǔn)主 要 內(nèi) 容576.5 LZW編碼 LZW(Lempel-Ziv & Welch)又稱(chēng)字串表編碼, 無(wú)損編碼。 LZW編碼與行程編碼類(lèi)似,也是對(duì)字符串進(jìn)行編碼從而實(shí)現(xiàn)壓縮,但它在編碼
21、的同時(shí)還生成了特定字符串以及與之對(duì)應(yīng)的索引字符串表。 58對(duì)文件進(jìn)行編碼的同時(shí),生成了特定字符序列的表以及它們對(duì)應(yīng)的代碼。比如8位圖像編成12位碼,除了256代表原來(lái)8位字符,其他代碼分配給在壓縮過(guò)程中出現(xiàn)的字符串。(如字符對(duì))當(dāng)表中沒(méi)有的字符串第一次出現(xiàn)的時(shí)候,原樣保存,同時(shí)將分配它的代碼也一起保存。只有如果這個(gè)字符串再次出現(xiàn),只存儲(chǔ)代碼。字符串表在壓縮中動(dòng)態(tài)生成,而且也不用存儲(chǔ),解壓時(shí)可以由壓縮文件中信息重構(gòu)它。LZW編碼原則:59 GIF(Graphics Interchange Format)是由CompuServe公司開(kāi)發(fā)的一種壓縮位圖格式。它可支持多達(dá) 256 種的顏色,具有極佳的
22、壓縮效率,已成為Internet 上一種流行的文件格式。GIF圖像文件采用的是一種改良的LZW壓縮算法, 通常稱(chēng)為GIF-LZW壓縮算法。GIF-LZW壓縮編碼60S1、S2兩個(gè)存放字符串的臨時(shí)變量LZW_CLEAR字符表初始化標(biāo)志LZW_EOI編碼結(jié)束標(biāo)志設(shè):(1) 根據(jù)圖像中使用的顏色數(shù)初始化一個(gè)字串表,字串表中的每個(gè)顏色對(duì)應(yīng)一個(gè)索引。在初始字串表的末尾再添加兩個(gè)符號(hào)(LZW_CLEAR和LZW_EOI)的索引。設(shè)置字符串變量S1、 S2并初始化為空。(2) 接著輸出LZW_CLEAR在字串表中的索引。編碼步驟:61(3)從圖像數(shù)據(jù)流中第一個(gè)字符(假設(shè)數(shù)據(jù)以字符串表示)開(kāi)始, 每次讀取一個(gè)
23、字符,將其賦給字符串變量S2。(4)判斷“S1+S2”是否已存在于字串表中。如果字串表中存在“S1+S2”,則S1=S1+S2;否則,輸出S1在字串表中的索引, 并在字串表末尾為“S1+S2”添加索引,同時(shí),S1=S2。 (5)重復(fù)第3和第4步, 直到所有字符讀完為止。(6)輸出S1中的字符串在字串表中的索引, 然后輸出結(jié)束標(biāo)志LZW_EOI的索引,編碼完畢。62GIF-LZW解碼流程 63 設(shè)有一來(lái)源于4色(以a、b、c、d表示)圖像的數(shù)據(jù)流aabcabbbbd,現(xiàn)對(duì)其進(jìn)行LZW編碼。編碼過(guò)程如下: 編碼前,首先需要初始化一個(gè)字符串表。 LZW編碼實(shí)例字符串 索引 a 0 H b1 H c2
24、 H d3 H LZW_CLEAR 4 H LZW_EOI 5 H 64GIF-LZW編碼過(guò)程 b編碼結(jié)果:4001271B35(十六進(jìn)制表示)65GIF-LZW解碼過(guò)程 666.1 圖像編碼概述 6.2 哈夫曼編碼6.3 香農(nóng)-范諾編碼6.4 行程編碼6.5 LZW編碼 6.6 算術(shù)編碼6.7 預(yù)測(cè)編碼6.8 圖像編碼的國(guó)際標(biāo)準(zhǔn)主 要 內(nèi) 容676.6 算 術(shù) 編 碼 基于信源概率統(tǒng)計(jì)特性的固定編碼模式 針對(duì)未知信源概率模型的自適應(yīng)模式基本原理:將被編碼的數(shù)據(jù)序列表示成0和1之間的一個(gè)間隔(即一個(gè)小數(shù)范圍),該間隔的位置與輸入數(shù)據(jù)的概率分布有關(guān)。 算術(shù)編碼有兩種模式:68例:設(shè)一待編碼的數(shù)據(jù)
25、序列(即信源)為“dacab”, 信源中各符號(hào)出現(xiàn)的概率依次為P(a)=0.4,P(b)=0.2,P(c)=0.2, P(d)=0.2。 首先,數(shù)據(jù)序列中的各數(shù)據(jù)符號(hào)在區(qū)間0, 1內(nèi)的間隔(賦值范圍)設(shè)定為a=0, 0.4), b=0.4, 0.6), c=0.6, 0.8), d=0.8, 1.0)StartN=StartB+LeftCL EndN=StartB+RightCL 69 第一個(gè)被壓縮的符號(hào)為“d”,其初始間隔為0.8, 1.0); 第二個(gè)被壓縮的符號(hào)為“a”,由于前面的符號(hào)“d”的取值區(qū)間被限制在0.8, 1.0)范圍內(nèi),所以“a”的取值范圍應(yīng)在前一符號(hào)間隔0.8, 1.0)的
26、0, 0.4)子區(qū)間內(nèi), 根據(jù)上式可知 :StartN=0.8+0(1.0-0.8)=0.8EndN=0.8+0.4(1.0-0.8)=0.88 即“a”的實(shí)際編碼區(qū)間在0.8, 0.88)之間。 70 第三個(gè)被壓縮的符號(hào)為“c”, 其編碼取值范圍應(yīng)在0.8, 0.88)區(qū)間的0.6, 0.8)的子區(qū)間內(nèi),據(jù)上式可知 第四個(gè)被壓縮的符號(hào)為“a”,其編碼取值范圍應(yīng)在0.848, 0.864)區(qū)間的0, 0.4)的子區(qū)間內(nèi)StartN=0.848+0(0.864-0.848)=0.848EndN=0.848+0.4(0.864-0.848)=0.8544 71 第五個(gè)被壓縮的符號(hào)為“b”,其編碼取
27、值范圍應(yīng)在 0.848 , 0.8544 )區(qū)間的0.4, 0.6)的子區(qū)間內(nèi)StartN=0.848+0.4(0.8544-0.848)=0.85056EndN=0.848+0.6(0.8544-0.848)=0.85184 至此,數(shù)據(jù)序列“dacab”已被描述為一個(gè)實(shí)數(shù)區(qū)間0.85056, 0.85184,或者說(shuō)在此區(qū)間內(nèi)的任一實(shí)數(shù)值都惟一對(duì)應(yīng)該數(shù)據(jù)序列。這樣,就可以用一個(gè)實(shí)數(shù)表示這一數(shù)據(jù)序列。我們把區(qū)間0.85056, 0.85184用二進(jìn)制形式表示為0.110110011011, 0.110110100001。 72 在這個(gè)區(qū)間中,0.1101101位于這個(gè)區(qū)間內(nèi)并且其編碼最短, 故把
28、其作為數(shù)據(jù)序列“dacab”的編碼輸出??紤]到算術(shù)編碼中任一數(shù)據(jù)序列的編碼都含有“0.”,所以在編碼時(shí),可以不考慮“0.”,于是把1101101作為本例中的數(shù)據(jù)序列的算術(shù)編碼。由此可見(jiàn),數(shù)據(jù)序列“dacab”用7比特的二進(jìn)制代碼就可以表示,平均碼長(zhǎng)為1.4比特字符。 736.1 圖像編碼概述 6.2 哈夫曼編碼6.3 香農(nóng)-范諾編碼6.4 行程編碼6.5 LZW編碼 6.6 算術(shù)編碼6.7 預(yù)測(cè)編碼6.8 圖像編碼的國(guó)際標(biāo)準(zhǔn)主 要 內(nèi) 容746.7 預(yù)測(cè)編碼預(yù)測(cè):根據(jù)過(guò)去時(shí)刻的樣本序列,采用一種模型預(yù)測(cè)當(dāng)前的樣本值;預(yù)測(cè)編碼的基本思想:通過(guò)僅提取每個(gè)象素中的新信息并對(duì)它們編碼來(lái)消除象素間的相關(guān)
29、性和冗余性。1個(gè)象素的新信息該象素的當(dāng)前或現(xiàn)實(shí)值與預(yù)測(cè)值的差。前提:象素間具有相關(guān)性。1. 無(wú)損預(yù)測(cè)編碼2. 有損預(yù)測(cè)編碼75輸入圖像預(yù)測(cè)器整數(shù)舍入符號(hào)編碼器fn+-en壓縮圖像1. 無(wú)損預(yù)測(cè)編碼預(yù)測(cè)器符號(hào)解碼器fn+en壓縮圖像+解壓圖像762. 有損預(yù)測(cè)編碼輸入圖像預(yù)測(cè)器符號(hào)編碼器fn+-en壓縮圖像量化器+預(yù)測(cè)器符號(hào)編碼器+壓縮圖像+解壓圖像776.1 圖像編碼概述 6.2 哈夫曼編碼6.3 香農(nóng)-范諾編碼6.4 行程編碼6.5 LZW編碼 6.6 算術(shù)編碼6.7 預(yù)測(cè)編碼6.8 圖像編碼的國(guó)際標(biāo)準(zhǔn)主 要 內(nèi) 容786.8 圖像編碼的國(guó)際標(biāo)準(zhǔn)1. 靜止圖像壓縮標(biāo)準(zhǔn)JPEG2. 運(yùn)動(dòng)圖像壓
30、縮標(biāo)準(zhǔn) MPEG 近十年來(lái),圖像編碼技術(shù)得到了迅速發(fā)展和廣泛應(yīng)用,并且日臻成熟,其標(biāo)志就是幾個(gè)圖像壓縮國(guó)際標(biāo)準(zhǔn)的制定。即關(guān)于靜止圖像的編碼標(biāo)準(zhǔn)JPEG和JPEG2000、關(guān)于電話(huà)/會(huì)議電視的視頻編碼標(biāo)準(zhǔn)H.261,H.263和關(guān)于活動(dòng)圖像的編碼標(biāo)準(zhǔn)MPEG-1,MPEG-2, MPEG-4 和 H.264等。 JPEG (Joint Photographic Expert Group); MPEG (Motion Picture Experts Group)79圖像壓縮國(guó)際標(biāo)準(zhǔn)標(biāo)準(zhǔn) 標(biāo)題 起止日期 目標(biāo)比特率應(yīng)用場(chǎng)合 主要編碼技術(shù) JPEG 連續(xù)色調(diào)靜態(tài)圖像1986.31992.10 壓縮比為
31、230因特網(wǎng)數(shù)字照相圖像/視頻 編輯 DCT知覺(jué)量化霍夫曼編碼算術(shù)編碼 JPEG2000新一代靜態(tài)圖像編碼標(biāo)準(zhǔn) 1996.22000.12 壓縮比為250因特網(wǎng)移動(dòng)通信數(shù)字照相遙感傳真數(shù)字圖書(shū)館JPEG所有技術(shù)小波變換EBCOTROI編碼可擴(kuò)展編碼80標(biāo)準(zhǔn) 標(biāo)題 目標(biāo)比特率應(yīng)用場(chǎng)合 主要編碼技術(shù) MPEG-1 運(yùn)動(dòng)圖像及其伴音不超過(guò)1.5Mb/s 光盤(pán)存儲(chǔ)VCD 視頻監(jiān)控 JPEG所有技術(shù)自適應(yīng)量化運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)MPEG-2 運(yùn)動(dòng)圖像及其伴音1.535Mb/s 數(shù)字高清 晰度電視高品質(zhì)視頻衛(wèi)星/有線(xiàn)電視地面廣播MPEG-1所有技術(shù)基于幀/場(chǎng)的 運(yùn)動(dòng)補(bǔ)償擴(kuò)展編碼容錯(cuò)編碼 81標(biāo)準(zhǔn) 標(biāo)題 目標(biāo)比特率
32、應(yīng)用場(chǎng)合 主要編碼技術(shù) MPEG-4音視頻對(duì)象的通用編碼 8kb/s35Mb/s 因特網(wǎng)交互式視頻2D/3D計(jì)算機(jī)圖形移動(dòng)通信 MPEG-2所有技術(shù)小波變換運(yùn)動(dòng)估計(jì)/補(bǔ)償可擴(kuò)展編碼位圖形狀編碼對(duì)象編碼動(dòng)態(tài)網(wǎng)絡(luò)編碼 MPEG-7多媒體描述接口多媒體數(shù)據(jù)庫(kù)等 MPEG-21多媒體框架 82標(biāo)準(zhǔn) 標(biāo)題 目標(biāo)比特率應(yīng)用場(chǎng)合 主要編碼技術(shù) H.261 P64kb/s的音視頻服務(wù)P64kb/s(P取值:130) ISDN視頻會(huì)議 DCT自適應(yīng)量化運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)運(yùn)動(dòng)估計(jì)霍夫曼編碼H.263低比特率通信的視頻編碼 8kb/s1.5Mb/s POTS視頻電話(huà)桌面視頻電話(huà)移動(dòng)視頻電話(huà) H.261所有技術(shù)雙向運(yùn)動(dòng)補(bǔ)償
33、半像素運(yùn)動(dòng)估計(jì)高級(jí)運(yùn)動(dòng)估計(jì)重疊運(yùn)動(dòng)補(bǔ)償算術(shù)編碼 83JPEG(joint picture expert group)面向靜態(tài)圖像編碼的標(biāo)準(zhǔn)。在相同圖像質(zhì)量條件下,JPEG文件擁有比其他圖像文件格式更高的壓縮比。JPEG目前被廣泛應(yīng)用于多媒體和網(wǎng)絡(luò)程序中,是現(xiàn)今萬(wàn)維網(wǎng)中使用最廣泛的兩種圖像文件格式之一。JPEG是一種有損壓縮, 即在壓縮過(guò)程中會(huì)丟失數(shù)據(jù),每次編輯JPEG圖像后,圖像就會(huì)被重復(fù)壓縮一次,損失就會(huì)有所增加。 1. 靜止圖像壓縮標(biāo)準(zhǔn)JPEG84 1)順序式(Sequential)DCT方式 2)漸進(jìn)式(Progressive)DCT方式 JPEG允許的四種編碼模式: 頻譜選擇法 逐次逼
34、近法 3)無(wú)失真(Lossless)方式 4)分層(Hierarchical)方式851) 順序式(Sequential)DCT方式:從左到右、從上到下對(duì)圖像順序進(jìn)行基于離散余弦變換(DCT)的編碼。DCT理論上是可逆的,但在計(jì)算時(shí)存在誤差,因而基于DCT的編碼模式是一種有損編碼。2) 漸進(jìn)式(Progressive)DCT方式:基于DCT,對(duì)圖像分層次進(jìn)行處理,從模糊到清晰地傳輸圖像(與GIF文件的交錯(cuò)方式類(lèi)似)。有兩種實(shí)現(xiàn)方法,一種是頻譜選擇法,即按Z形掃描的序號(hào)將DCT量化序數(shù)分成幾個(gè)頻段,每個(gè)頻段對(duì)應(yīng)一次掃描, 每塊均先傳送低頻掃描數(shù)據(jù),得到原圖概貌,再依次傳送高頻掃描數(shù)據(jù),使圖像逐漸
35、清晰;另一種是逐次逼近法,即每次掃描全部DCT量化序數(shù),但每次的表示精度逐漸提高。863) 無(wú)失真(Lossless)方式: 使用線(xiàn)性預(yù)測(cè)器,如DPCM, 而不是基于DCT。 4) 分層(Hierarchical)方式:在空間域?qū)⒃磮D像以不同的分辨率表示,每個(gè)分辨率對(duì)應(yīng)一次掃描, 處理時(shí)可以基于DCT或預(yù)測(cè)編碼,可以是漸進(jìn)式,也可以是順序式。87 1)基本系統(tǒng)(Baseline System) 2)擴(kuò)展系統(tǒng)(Extended System) 3)無(wú)失真壓縮系統(tǒng)(Lossless System) 一個(gè)符合JPEG標(biāo)準(zhǔn)的編解碼器至少要滿(mǎn)足基本系統(tǒng)的技術(shù)指標(biāo)。 基本的JPEG算法屬于變換類(lèi)編碼,下面
36、針對(duì)基于DCT的順序式基本系統(tǒng)編碼來(lái)說(shuō)明JPEG的編碼方法。 JPEG定義了三種系統(tǒng):88JPEG 編碼/解碼的流程圖 89 1) 數(shù)據(jù)分塊 將圖像從RGB空間轉(zhuǎn)換到Y(jié)CbCr空間。 將每個(gè)分量圖像分割成不重疊的88像素塊DU(Data Unit)。 在YCbCr空間中壓縮圖像的每個(gè)彩色分量。 二次采樣采用不同的采樣頻率對(duì)圖像采樣。由于亮度比色彩更重要,因而對(duì)Y分量的采樣頻率可高于對(duì)Cb、Cr的采樣頻率,這樣有利于節(jié)省存儲(chǔ)空間。90把采樣頻率最低的分量圖像中一個(gè)DU所對(duì)應(yīng)的像區(qū)上覆蓋的所有各分量上的DU按順序編組為一個(gè)最小編碼單元(MCU)。 對(duì)灰度圖像而言,只有一個(gè)Y分量,MCU就是一個(gè)數(shù)據(jù)
37、單元。 對(duì)彩色圖像而言,以4:1:1的采樣方案為例,則一個(gè)MCU由4個(gè)Y分量的DU、1個(gè)Cb分量的DU和1個(gè)Cr分量的DU組成。91 以MCU為單位順序?qū)U進(jìn)行二維離散余弦變換。 對(duì)以無(wú)符號(hào)數(shù)表示的具有P位精度的輸入數(shù)據(jù), 在DCT前要減去2P-1,轉(zhuǎn)換成有符號(hào)數(shù),而在IDCT后,應(yīng)加上2P-1,轉(zhuǎn)換成無(wú)符號(hào)數(shù)。 對(duì)每個(gè)88的數(shù)據(jù)塊DU進(jìn)行DCT后, 得到的64個(gè)系數(shù)代表了該圖像塊的頻率成分,其中低頻分量集中在左上角, 高頻分量分布在右下角。系數(shù)矩陣左上角的叫做直流(DC)系數(shù),它代表了該數(shù)據(jù)塊的平均值,其余63個(gè)叫交流(AC)系數(shù)。 2) DCT處理92 在DCT處理中得到的64個(gè)系數(shù)中,
38、低頻分量包含了圖像亮度等主要信息。在從空間域到頻域的變換中,圖像中的緩慢變化比快速變化更易引起人眼的注意,所以在重建圖像時(shí),低頻分量的重要性高于高頻分量。因而在編碼時(shí)可以忽略高頻分量,從而達(dá)到壓縮的目的,這也是量化的根據(jù)和目的。 3) 系數(shù)量化93亮度量化表 色度量化表94 DCT系數(shù)量化后,構(gòu)成一個(gè)稀疏矩陣,用Z(Zigzag)形掃描將其變成一維數(shù)列,將有利于熵編碼。Z形掃描的順序如圖所示。 DCT系數(shù)的Z形掃描順序 4) Z形掃描95 DC系數(shù)反映了一個(gè)88數(shù)據(jù)塊的平均亮度,一般與相鄰塊有較大的相關(guān)性。 JPEG對(duì)DC系數(shù)作差分編碼,即用前一數(shù)據(jù)塊的同一分量的DC系數(shù)作為當(dāng)前塊的預(yù)測(cè)值,再
39、對(duì)當(dāng)前塊的實(shí)際值與預(yù)測(cè)值的差值作哈夫曼編碼。 5) DC系數(shù)編碼96 若DC系數(shù)的動(dòng)態(tài)范圍為-1024+1024,則差值的動(dòng)態(tài)范圍為-2047+2047。如果為每個(gè)差值賦予一個(gè)碼字, 則碼表過(guò)于龐大。 采用“前綴碼(SSSS)+尾碼”來(lái)表示。 前綴碼指明了尾碼的有效位數(shù)B, 可以根據(jù)DIFF(DC系數(shù)的差值)從對(duì)應(yīng)表中查出前綴碼對(duì)應(yīng)的哈夫曼編碼。 尾碼的取值取決于DC系數(shù)的差值和前綴碼。如果DC系數(shù)的差值DIFF大于等于0,則尾碼的碼字為DIFF的B位原碼;否則,取DIFF的B位反碼。 97 經(jīng)Z形排列后的AC系數(shù),更有可能出現(xiàn)連續(xù)0組成的字符串, 行程編碼將有利于壓縮數(shù)據(jù)。 JPEG將一個(gè)非
40、零DC系數(shù)及其前面的0行程長(zhǎng)度(連續(xù)0的個(gè)數(shù))的組合稱(chēng)為一個(gè)事件。將每個(gè)事件編碼表示為“NNNN/SSSS+尾碼”, NNNN0行程的長(zhǎng)度 SSSS尾碼的有效位數(shù)B(即當(dāng)前非0系數(shù)所占的比特?cái)?shù)),如果非零AC系數(shù)大于等于0, 則尾碼的碼字為該系數(shù)的B位原碼, 否則, 取該系數(shù)的B位反碼。 6) AC系數(shù)編碼98 2. 運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn) H.261:主要為電視會(huì)議等應(yīng)用制訂。也稱(chēng)P64標(biāo)準(zhǔn)??稍试S通過(guò)T1線(xiàn)路(帶寬為1.544Mbit/s)以小于150ms的延遲傳輸運(yùn)動(dòng)視頻。 MPEG-1:娛樂(lè)質(zhì)量的視頻壓縮標(biāo)準(zhǔn),主要用于數(shù)字媒體上壓縮圖像數(shù)據(jù)的儲(chǔ)存和提取。 MPEG-2:用于視頻傳輸?shù)膲嚎s標(biāo)準(zhǔn)
41、,適用于從普通電視直到高清晰度電視的帶寬范圍。 MPEG-4:適應(yīng)在窄帶寬上對(duì)動(dòng)態(tài)圖像進(jìn)行傳輸?shù)囊?。可?duì)各種音頻視頻AV進(jìn)行有效的編碼,同時(shí)支持固定碼流和變碼流。99一、MPEG-1視頻壓縮標(biāo)準(zhǔn) MPEG-1是由ISO/IEC 于1991 年提出的,正式名稱(chēng)為“用于數(shù)字存儲(chǔ)媒體的1.5 Mbit/s 以下的活動(dòng)圖像及相關(guān)音頻編碼”(ISO/IEC 11172)。其中的數(shù)字存儲(chǔ)媒體包括光盤(pán)(CD),視頻光盤(pán)(VCD),其中分配比特的方案是在1.5Mbps 的數(shù)據(jù)傳輸中1.2Mbps用于編碼視頻,256Kbps 用于立體聲。MPEG-1包括五個(gè)部分:系統(tǒng)、視頻、音頻、一致性、及軟件。 在MPEG
42、-1只采用逐行掃描方式,采用4 :2 :0的亞采樣格式,其源輸入格式是SIF,有 352 288 25 和 352 288 30 兩種格式。100MPEG-1采用兩種壓縮方法:幀內(nèi)壓縮算法: 采用與JPEG壓縮算法大致相同的方法,即基于DCT的變換編碼技術(shù),用以減少空間冗余信息。幀間壓縮算法: 采用運(yùn)動(dòng)補(bǔ)償算法、預(yù)測(cè)編碼方法、以及差補(bǔ)法等編碼方法。幀間編碼技術(shù)可以減少時(shí)間冗余信息。101MPEG1視頻壓縮編碼算法 在MPEG-1 編碼中,為了支持隨機(jī)訪(fǎng)問(wèn)與高效壓縮的要求,定義了四種編碼類(lèi)型: I幀圖像編碼(幀內(nèi)圖像)、 P幀圖像編碼(預(yù)測(cè)圖像)、 B幀圖像編碼(差補(bǔ)圖或雙向預(yù)測(cè)圖像)。 D幀圖
43、像編碼(直流分量圖像) 這四種類(lèi)型的幀按某種方式組織在一起就構(gòu)成了GOP。102I 幀圖像的編碼 I幀圖像是利用圖像的空間相關(guān)性進(jìn)行壓縮,其壓縮編碼采用類(lèi)似JPEG壓縮算法,同時(shí)I幀圖像又是P幀圖像和B幀圖像的參考圖像,所以I幀圖像壓縮率不高,壓縮倍數(shù)在8倍左右。 幀內(nèi)圖像I不參照任何過(guò)去的或者將來(lái)的其它圖像幀,壓縮編碼采用類(lèi)似JPEG壓縮算法:如果電視圖像是用RGB空間表示的,則首先把它轉(zhuǎn)換成YCrCb空間表示的圖像。每個(gè)圖像平面分成88的圖塊,對(duì)每個(gè)圖塊進(jìn)行離散余弦變換DCT。DCT變換后經(jīng)過(guò)量化的交流分量系數(shù)后進(jìn)行Z掃描,然后再使用無(wú)損壓縮技術(shù)進(jìn)行編碼。103 DCT變換后經(jīng)過(guò)量化的直流
44、分量系數(shù)采用差分脈沖編碼DPCM,交流分量系數(shù)采用游程編碼RLE,然后再采用霍夫曼(Huffman)編碼或者用算術(shù)編碼。104P 幀圖像的編碼 P幀圖像是參考過(guò)去的I幀圖像(幀內(nèi)圖像)或者過(guò)去的預(yù)測(cè)得到P幀圖像用運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)技術(shù)進(jìn)行編碼,這些預(yù)測(cè)圖像通常作為進(jìn)一步預(yù)測(cè)的參考幀,預(yù)測(cè)圖像的編碼效率較高。 P幀圖像的編碼也是以圖像宏塊為基本編碼單元。預(yù)測(cè)編碼的基礎(chǔ)是運(yùn)動(dòng)估值,它將直接影響到整個(gè)系統(tǒng)的編碼效率和壓縮性能,因此希望找到一種預(yù)測(cè)精度高同時(shí)計(jì)算量又小的運(yùn)動(dòng)估值算法。105 P幀編碼時(shí),編碼器需要對(duì)每一個(gè)宏塊作以下選擇:(1)決定是否作運(yùn)動(dòng)補(bǔ)償(MC/No-MC),即是將運(yùn)動(dòng)矢量發(fā)送出去,還
45、是設(shè)其為0。在許多 情況下,使用非零的運(yùn)動(dòng)矢量并不比使用零值的運(yùn)動(dòng)矢量所形成的誤差少多少。而非零運(yùn)動(dòng)矢量需要額外的編碼比特,因此這 時(shí)可設(shè)運(yùn)動(dòng)矢量為0,這樣可以提高編碼效率。(2)決定采用幀內(nèi)編碼還是幀間編碼,即是采用幀內(nèi)宏塊編碼還是利用運(yùn)動(dòng)矢量預(yù)測(cè)編碼。在許多情況下,某些宏塊采用幀內(nèi)編碼方式也許會(huì)用更少的比特。這通常發(fā)生在由于運(yùn)動(dòng)十分劇烈而導(dǎo)致運(yùn)動(dòng)估計(jì)失敗的情況。106(3)決定宏塊要不要編碼。有時(shí)在量化后,宏塊中所有的DCT系數(shù)都是0,這種宏塊就不需要被編碼。在對(duì)這種宏塊解碼時(shí),只需要從過(guò)去的幀中把對(duì)應(yīng)的宏塊復(fù)制到這個(gè)宏塊就行了。(4)決定量化等級(jí)是否符合要求,是否需要改變。107 B 幀
46、圖像的編碼 B幀圖像(或稱(chēng)雙向圖)在預(yù)測(cè)時(shí),既可使用前向預(yù)測(cè)方式,也可使用后向預(yù)測(cè)方式,或同時(shí)使用雙向預(yù)測(cè)后取平均方式(雙向幀間預(yù)測(cè)),取決于哪一種方式下表示該宏塊所需的信息量為最少。使用雙向預(yù)測(cè)后,可以使那些在前一幀中預(yù)測(cè)不到的內(nèi)容很好地在后一幀中預(yù)測(cè)到,而且通過(guò)預(yù)測(cè)后取平均,非常有效地減少了預(yù)測(cè)噪聲的影響。它的壓縮效率最高,但雙向預(yù)測(cè)圖像不作為預(yù)測(cè)的參考圖像。108類(lèi)似于P幀,B幀在編碼前同樣要作一系列的決定,其流程如下:(1)決定運(yùn)動(dòng)補(bǔ)償模式,即前向,后向及插值 運(yùn)動(dòng)補(bǔ)償中哪個(gè)能達(dá)到最佳。 宏塊運(yùn)動(dòng)補(bǔ)償模式的選擇是基于代價(jià)函數(shù)的最小值。代價(jià)函數(shù)是運(yùn)動(dòng)補(bǔ)償宏塊和當(dāng)前宏塊的亮度差的均方誤差。
47、解碼器通過(guò)一種簡(jiǎn)單的方法為前向運(yùn)動(dòng)補(bǔ)償計(jì)算最佳運(yùn)動(dòng)補(bǔ)償宏塊。然后再為后向運(yùn)動(dòng)補(bǔ)償計(jì)算最佳運(yùn)動(dòng)補(bǔ)償宏塊。最后再求兩種運(yùn)動(dòng)補(bǔ)償宏塊的均值,從而產(chǎn)生宏塊的插值。然后再選擇它與當(dāng)前宏塊均方誤差最小的方式。如果找不出最小值,就選取宏塊插值方式。109(2)決定采用幀內(nèi)/幀間編碼。 即宏塊類(lèi)型是幀內(nèi)編碼還是使用運(yùn)動(dòng)矢量作運(yùn)動(dòng)補(bǔ)償編碼。計(jì)算方法和P幀的類(lèi)似,解碼器計(jì)算差分宏塊和當(dāng)前宏塊的變化。如果兩者的變化相同則選擇非幀內(nèi)編碼(參考該節(jié)的流程序圖分析)。(3)如果宏塊類(lèi)型是非幀內(nèi)宏塊,則要決定這個(gè)宏塊是否編碼,即殘差是否大得足以采用DCT變換。解碼器根據(jù)量化的結(jié)果選擇編碼與否,當(dāng)所有量化系數(shù)都為零時(shí),則這個(gè)塊不用編碼.如果宏塊中沒(méi)有編碼的塊,則這個(gè)宏塊不需編碼 ,否則該宏塊需要編碼。(4)決定量化尺寸是否滿(mǎn)足要求,是否需要改變尺寸。11
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年企業(yè)合伙合同(五篇)
- 2025年個(gè)人果園承包合同(三篇)
- 2025年二年級(jí)德育工作總結(jié)例文(2篇)
- 2025年二手車(chē)汽車(chē)買(mǎi)賣(mài)合同(五篇)
- 2025年代理證券賬戶(hù)業(yè)務(wù)協(xié)議范文(2篇)
- 2025年企業(yè)與個(gè)人合作經(jīng)營(yíng)協(xié)議(三篇)
- 快遞行業(yè)節(jié)假日運(yùn)輸協(xié)議
- 2025年度全國(guó)性安全產(chǎn)品銷(xiāo)售代表合作協(xié)議
- 賓館大堂鋼結(jié)構(gòu)改造合同
- 冰場(chǎng)全包裝修合同樣本
- 贏(yíng)在團(tuán)隊(duì)執(zhí)行力課件
- 北京理工大學(xué)應(yīng)用光學(xué)課件第四章
- 陰道鏡幻燈課件
- 現(xiàn)代漢語(yǔ)詞匯學(xué)精選課件
- PCB行業(yè)安全生產(chǎn)常見(jiàn)隱患及防范措施課件
- 上海音樂(lè)學(xué)院 樂(lè)理試題
- SAP中國(guó)客戶(hù)名單
- DB32∕T 186-2015 建筑消防設(shè)施檢測(cè)技術(shù)規(guī)程
- 2022年福建泉州中考英語(yǔ)真題【含答案】
- 淺談固定資產(chǎn)的審計(jì)
- WZCK-20系列微機(jī)直流監(jiān)控裝置使用說(shuō)明書(shū)(v1.02)
評(píng)論
0/150
提交評(píng)論