數(shù)字圖像處理與Python實(shí)現(xiàn)-課件 第八章-圖像壓縮_第1頁(yè)
數(shù)字圖像處理與Python實(shí)現(xiàn)-課件 第八章-圖像壓縮_第2頁(yè)
數(shù)字圖像處理與Python實(shí)現(xiàn)-課件 第八章-圖像壓縮_第3頁(yè)
數(shù)字圖像處理與Python實(shí)現(xiàn)-課件 第八章-圖像壓縮_第4頁(yè)
數(shù)字圖像處理與Python實(shí)現(xiàn)-課件 第八章-圖像壓縮_第5頁(yè)
已閱讀5頁(yè),還剩35頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)字圖像處理2022-2023-2課程內(nèi)容入門(mén)認(rèn)識(shí)第8章圖像壓縮第7章圖像分割基本操作應(yīng)用第9章圖像水印第10章指紋識(shí)別第11章深度學(xué)習(xí)綜合案例第八章圖像壓縮8.1圖像壓縮基礎(chǔ)8.2常見(jiàn)的壓縮編碼技術(shù)8.3小結(jié)一幅24位高清圖像,分辨率為1920×1080,所占空間為()。1920×1080×24/8=6220800byte=6075KB≈5.93MB1920×1080×24/1024/1024≈49.76MB1920×1080×24/8/1024/1024≈5.93M1920×1080×24/1024=48600MB1920×1080×24/8/1024=6072MBABCD提交單選題1分一段時(shí)長(zhǎng)1分鐘、24位色、分辨率為1920*1080、幀頻為30fps的高清視頻。1920*1080*24*30*60/8/1024/1024/1024≈10.428GB。若沒(méi)有壓縮,所占存儲(chǔ)容量大約是:圖像壓縮:以較少的比特有損或無(wú)損地表示原來(lái)的像素矩陣的技術(shù),

也稱(chēng)圖像編碼。圖像和視頻在存儲(chǔ)、傳輸、處理等過(guò)程所需資源呈現(xiàn)爆炸式增長(zhǎng),所以對(duì)數(shù)字圖像和視頻數(shù)據(jù)進(jìn)行壓縮是非常必要。8.1.1數(shù)據(jù)冗余相關(guān)概念壓縮率(又稱(chēng)壓縮比),表示壓縮后數(shù)據(jù)量與壓縮前數(shù)據(jù)量的比值:

數(shù)據(jù)冗余,表示壓縮減少的數(shù)據(jù)量占?jí)嚎s前數(shù)據(jù)量的比值:

8.1.1數(shù)據(jù)冗余相關(guān)概念數(shù)字圖像冗余形式:編碼冗余、空間冗余、時(shí)間冗余、視覺(jué)冗余等。編碼冗余(又稱(chēng)信息熵冗余):圖像中平均每個(gè)像素使用的比特?cái)?shù)大于圖像的信息熵,比如,灰度圖中用于表示灰度的8比特編碼往往要多于表示灰度所需要的比特?cái)?shù)??臻g冗余(又稱(chēng)幾何冗余:由圖像內(nèi)部相鄰像素之間存在較強(qiáng)的相關(guān)性造成的冗余。比如,一幅圖像中存在一片連續(xù)的像素顏色相同的區(qū)域,則空間冗余較多。時(shí)間冗余(又稱(chēng)幀間冗余):視頻圖像序列中由相鄰幀之間相關(guān)性造成的冗余。比如,同一鏡頭內(nèi),相鄰視頻序列過(guò)渡比較緩慢,相鄰幀具有極大的相似性。視覺(jué)冗余:人眼敏感度較低或者不能感知的那部分圖像信息。8.1.2數(shù)據(jù)壓縮模型編碼器負(fù)責(zé)把原圖像進(jìn)行編碼壓縮;解碼器負(fù)責(zé)將壓縮后的圖像進(jìn)行解碼操作。映射器:減少圖像空間和時(shí)間冗余,是可逆操作;量化器:根據(jù)映射器輸出的精確度進(jìn)一步降低映射器輸出的精度,排除無(wú)關(guān)信息;符號(hào)編碼器:將量化器輸出的頻率高的值賦予短位數(shù)編碼,達(dá)到減少編碼冗余的目的。8.1.3圖像格式和壓縮標(biāo)準(zhǔn)常見(jiàn)的圖像格式有:BMP、TIFF、JPEG、GIF等,

在本書(shū)第一章中已有介紹;常用的壓縮標(biāo)準(zhǔn)主要有:JPEG、JEPG2000、DV、H.261、H.262、H.263、H.264、MPEG-1、MPEG-2、MPEG-4、MPEG-4AVC等。1.JPEG編碼JPEG(JointPhotographicExpertsGroup)是最常用的圖像文件格式,后綴名為.jpg或.jpeg,其是JPEG標(biāo)準(zhǔn)的產(chǎn)物。JPEG標(biāo)準(zhǔn)是面向連續(xù)色調(diào)靜止圖像的一種壓縮標(biāo)準(zhǔn),由國(guó)際標(biāo)準(zhǔn)化組織(ISO)制訂。JPEG文件格式在本書(shū)第一章中已有介紹。常見(jiàn)的實(shí)現(xiàn)編碼算法有基于圖像塊的變換編碼、哈夫曼(Huffman)編碼、行程編碼等。8.1.3圖像格式和壓縮標(biāo)準(zhǔn)由國(guó)際標(biāo)準(zhǔn)化組織(ISO)制訂;最常用的圖像文件格式,后綴名為.jpg或.jpeg,其是JPEG標(biāo)準(zhǔn)的產(chǎn)物;面向連續(xù)色調(diào)靜止圖像的一種壓縮標(biāo)準(zhǔn);常見(jiàn)的編碼算法:

基于圖像塊的變換編碼、哈夫曼(Huffman)編碼、行程編碼等。1.JPEG編碼(JointPhotographicExpertsGroup)8.1.3圖像格式和壓縮標(biāo)準(zhǔn)MPEG:是ISO與IEC(國(guó)際電工委員會(huì),InternationalElectrotechnicalCommission)于1988年成立的專(zhuān)門(mén)針對(duì)運(yùn)動(dòng)圖像和語(yǔ)音壓縮制定國(guó)際標(biāo)準(zhǔn)的組織;MPEG標(biāo)準(zhǔn)主要有:MPEG-1、MPEG-2、MPEG-3、MPEG-4等。編碼技術(shù)主要利用了具有運(yùn)動(dòng)補(bǔ)償?shù)膸g壓縮編碼技術(shù)以減小時(shí)間冗余度,利用DCT技術(shù)以減小圖像的空間冗余度,利用熵編碼在信息表示方面減小統(tǒng)計(jì)冗余度。這些技術(shù)的綜合運(yùn)用,大大提高了壓縮性能。2.MPEG編碼(MovingPictureExpertsGroup)8.1.3圖像格式和壓縮標(biāo)準(zhǔn)由ITU-T視頻編碼專(zhuān)家組(VCEG)和MPEG聯(lián)合組成的聯(lián)合視頻組(JVT,JointVideoTeam)提出。以高壓縮高質(zhì)量和支持多種網(wǎng)絡(luò)的流媒體傳輸被廣泛使用。在ITU的標(biāo)準(zhǔn)里稱(chēng)為H.264,在MPEG的標(biāo)準(zhǔn)里為MPEG-4Part10,又稱(chēng)AVC(AdvancedVideoCodec)。因此H.264也常常稱(chēng)為MPEG-4或AVC。壓縮方法主要包括:幀內(nèi)預(yù)測(cè)壓縮,解決空域數(shù)據(jù)冗余問(wèn)題;幀間預(yù)測(cè)壓縮(運(yùn)動(dòng)估計(jì)與補(bǔ)償),解決時(shí)域數(shù)據(jù)冗余問(wèn)題;整數(shù)離散余弦變換,將空間上的相關(guān)性變?yōu)轭l域上無(wú)關(guān)的數(shù)據(jù),然后再進(jìn)行量化。3.H.2648.1.4圖像壓縮編碼技術(shù)分類(lèi)(1)有損編碼(不可逆編碼)1.根據(jù)壓縮過(guò)程有無(wú)信息損失:壓縮時(shí)部分信息丟失,導(dǎo)致解碼重新構(gòu)造的圖像存在一定失真。有損壓縮多用于數(shù)字電視、靜止圖像通信等領(lǐng)域。代表性算法包括有損預(yù)測(cè)編碼、變換編碼等。壓縮過(guò)程沒(méi)有信息的損失,解壓后的還原圖像與原始圖像完全相同。常用于工業(yè)檢測(cè)、醫(yī)學(xué)圖像、存檔圖像等領(lǐng)域的圖像壓縮中。代表性算法包括哈夫曼編碼、游程編碼、無(wú)損預(yù)測(cè)編碼等。(2)無(wú)損編碼(可逆編碼)8.1.4圖像壓縮編碼技術(shù)分類(lèi)(1)統(tǒng)計(jì)編碼2.根據(jù)圖像壓縮編碼原理進(jìn)行劃分:出現(xiàn)概率高的事件用短碼表示,出現(xiàn)概率低的事件用長(zhǎng)碼表示。常見(jiàn)的統(tǒng)計(jì)編碼方法有哈夫曼編碼和算術(shù)編碼。利用空間和時(shí)間高度相關(guān)性,以近鄰像素值為參考,預(yù)測(cè)當(dāng)前像素值,然后量化、編碼預(yù)測(cè)誤差。應(yīng)用于運(yùn)動(dòng)圖像、視頻編碼中,如數(shù)字電視、視頻電話(huà)等。(2)預(yù)測(cè)編碼(3)變換編碼空域數(shù)據(jù)經(jīng)正交轉(zhuǎn)換到另一個(gè)變換域(頻率域),然后對(duì)系數(shù)進(jìn)行編碼處理第八章圖像壓縮8.1圖像壓縮基礎(chǔ)8.2常見(jiàn)的壓縮編碼技術(shù)8.3小結(jié)8.2.1霍夫曼編碼1.算法原理根據(jù)符號(hào)的出現(xiàn)概率構(gòu)建一棵二叉樹(shù):出現(xiàn)概率越高的符號(hào)離根節(jié)點(diǎn)越近,出現(xiàn)概率越低的符號(hào)離根節(jié)點(diǎn)越遠(yuǎn)。每個(gè)葉子節(jié)點(diǎn),構(gòu)建一個(gè)編碼,由從根節(jié)點(diǎn)到該葉子節(jié)點(diǎn)的路徑上的所有邊構(gòu)成。出現(xiàn)概率高的符號(hào)就用較短的編碼表示,出現(xiàn)概率低的符號(hào)則需要較長(zhǎng)的編碼表示。(1925-1999)個(gè)人成就:(1)霍夫曼編碼,

(2)霍夫曼算法,二叉最優(yōu)搜索樹(shù)算法效率最高,

是動(dòng)態(tài)規(guī)劃的一個(gè)范例(3)獲得計(jì)算機(jī)先驅(qū)獎(jiǎng),

IEEE的McDowell獎(jiǎng)(4)加州大學(xué)的SantaCruz分校計(jì)算機(jī)科學(xué)系的創(chuàng)始人無(wú)損編碼8.2.1霍夫曼編碼1.算法原理在圖像壓縮中,圖像由若干個(gè)像素值組成,統(tǒng)計(jì)每個(gè)像素值的出現(xiàn)頻率,將其轉(zhuǎn)化為概率分布。根據(jù)概率分布構(gòu)建霍夫曼樹(shù),得到每個(gè)像素值的哈夫曼編碼。將每個(gè)像素值替換成對(duì)應(yīng)的哈夫曼編碼,即可實(shí)現(xiàn)對(duì)圖像的壓縮。8.2.1霍夫曼編碼2.算法步驟(1)統(tǒng)計(jì)像素值出現(xiàn)的頻率:統(tǒng)計(jì)每個(gè)像素值出現(xiàn)的次數(shù)。(2)根據(jù)頻率建立哈夫曼樹(shù):使用像素值出現(xiàn)的頻率作為權(quán)值,建立哈夫曼樹(shù)。(3)對(duì)每個(gè)像素值進(jìn)行編碼:從哈夫曼樹(shù)根節(jié)點(diǎn)向下遍歷,可設(shè)定左子樹(shù)編碼為0,右子樹(shù)編碼為1,直到葉子節(jié)點(diǎn)。(4)生成編碼表:將每個(gè)像素值對(duì)應(yīng)的編碼保存到編碼表中。(5)壓縮圖像:根據(jù)編碼表將像素值轉(zhuǎn)換為對(duì)應(yīng)的哈夫曼編碼,拼接起來(lái),得到壓縮后數(shù)據(jù)。(6)存儲(chǔ)壓縮數(shù)據(jù):將壓縮后的數(shù)據(jù)保存到文件中,同時(shí)保存編碼表。(7)解壓縮:

讀取壓縮數(shù)據(jù)和編碼表,根據(jù)編碼表轉(zhuǎn)換為像素值,將所有像素值拼接得到解壓縮圖像。8.2.1霍夫曼編碼3.具體實(shí)現(xiàn)(1)統(tǒng)計(jì)各符號(hào)出現(xiàn)概率,并由大到小排隊(duì)。(2)編碼:從最小概率的兩符號(hào)開(kāi)始,選其中一個(gè)支路為0,另一支路為1。(3)將已編碼的兩支路的概率合并,并重新排隊(duì).(4)多次重復(fù)使用上述方法,直至合并概率歸一時(shí)為止。8.2.1霍夫曼編碼4.

Python實(shí)現(xiàn)編碼之后的圖像數(shù)據(jù)量與原始圖像數(shù)據(jù)量之比為0.9968.2.2算術(shù)編碼1.算法原理將區(qū)間[0,1)連續(xù)劃分成多個(gè)子區(qū)間,每個(gè)字符區(qū)間代表一個(gè)字符,區(qū)間大小與這個(gè)字符出現(xiàn)的概率成正比。消息越長(zhǎng),編碼表示它的間隔就越小,表示這一間隔所需的二進(jìn)制位就越多。在保留字符排列順序的同時(shí),對(duì)于更高頻出現(xiàn)的字符,賦予更大的小數(shù)區(qū)間。無(wú)損編碼8.2.2算術(shù)編碼2.算法步驟(1)以二進(jìn)制的方式讀取文件,計(jì)算出文件中不同字節(jié)的頻數(shù)和累計(jì)頻數(shù);(2)按照不同字節(jié)出現(xiàn)的頻率,將[0,1)區(qū)間劃分成若干個(gè)子區(qū)間,每個(gè)子區(qū)間代表一個(gè)上述字節(jié),區(qū)間的大小正比于這個(gè)字節(jié)出現(xiàn)的頻率,且所有的子區(qū)間加起來(lái)正好是[0,1);(3)編碼從初始區(qū)間[0,1)開(kāi)始,不斷讀入原始數(shù)據(jù)的字符,每讀入一個(gè)信號(hào),找到該字符所在區(qū)間,然后把該區(qū)間作為新的區(qū)間間隔,然后按照字符出現(xiàn)的頻率將字符等比例的縮小到最新得到的間隔中;(4)在最新的區(qū)間中重復(fù)步驟(3),繼續(xù)將該區(qū)間進(jìn)行劃分,不斷重復(fù)這個(gè)過(guò)程,直到最后信號(hào)中的信源信號(hào)全部讀完為止,最后將得到的區(qū)間中任意一個(gè)小數(shù)以二進(jìn)制形式輸出即得到編碼的數(shù)據(jù)。8.2.2算術(shù)編碼3.算法實(shí)現(xiàn)假設(shè)存在四種信源信號(hào)分別為A、B、C、D,概率分別為:0.2、0.3、0.4和0.1。對(duì)字符串ACBD進(jìn)行算術(shù)編碼的過(guò)程:8.2.2算術(shù)編碼4.解碼算法假設(shè)存在四種信源信號(hào)分別為A、B、C、D,概率分別為:0.2、0.3、0.4和0.1。根據(jù)編碼值0.154判斷其所在的原始區(qū)間在[0,0.2)內(nèi),可以得到其首位字符為A;按照信源信號(hào)概率分布進(jìn)一步劃定“新的區(qū)間”,并判斷編碼值落在“新的區(qū)間”中的位置,得到第二位字符;重復(fù)以上步驟,直到編碼長(zhǎng)度達(dá)到要求為止。如果編碼長(zhǎng)度不限制的話(huà),可以一直編碼下去,可以無(wú)損還原出原始信息。8.2.2算術(shù)編碼5.

Python實(shí)現(xiàn)顯示壓縮比為0.7388.2.3行程編碼1.算法原理又稱(chēng)游程編碼、變動(dòng)長(zhǎng)度編碼或行程長(zhǎng)度編碼等,是一種統(tǒng)計(jì)編碼。在數(shù)據(jù)圖像的編碼中尋找連續(xù)的重復(fù)數(shù)值,并用出現(xiàn)次數(shù)和顏色編號(hào)取代這些連續(xù)的值。例如,一串字母表示的數(shù)據(jù)為“aaaaabbcccddddccddbb”,

經(jīng)過(guò)行程編碼處理后可表示為“5a2b3c4d2c2d2b”。8.2.3行程編碼1.算法原理數(shù)字圖像而言,同一幅圖像某些連續(xù)的區(qū)域顏色相同,即圖像中,同一掃描行中許多連續(xù)的像素都具有同樣的顏色值。只要存儲(chǔ)像素的顏色值、相同顏色像素的位置以及相同顏色的像素?cái)?shù)目即可,把具有相同灰度值(顏色值)的相連像素序列稱(chēng)為一個(gè)行程。8.2.3行程編碼2.算法分類(lèi)行程編碼分為:定長(zhǎng)行程編碼和變長(zhǎng)行程編碼兩種。(1)定長(zhǎng)行程編碼:編碼的行程所使用的二進(jìn)制位數(shù)固定。如果灰度連續(xù)相等的像素個(gè)數(shù)超過(guò)了固定二進(jìn)制位數(shù)所能表示的最值,則進(jìn)行下一輪行程編碼。(2)變長(zhǎng)行程編碼:對(duì)不同范圍的行程使用不同位數(shù)的二進(jìn)制位數(shù)進(jìn)行編碼,需要增加標(biāo)志位來(lái)表明所使用的二進(jìn)制位數(shù)。8.2.3行程編碼(RunLengthEncoding,RLE)3.算法特點(diǎn)相當(dāng)直觀和經(jīng)濟(jì),運(yùn)算簡(jiǎn)單,解壓縮速度很快。譯碼規(guī)則與編碼時(shí)相同,還原后得到的數(shù)據(jù)與壓縮前的數(shù)據(jù)完全相同。RLE所能獲得的壓縮比有多大,取決于圖像本身的特點(diǎn)。RLE一般不直接應(yīng)用于顏色豐富的自然圖像(多灰度圖像),但適合于二值圖像的編碼。無(wú)損編碼8.2.3行程編碼(RunLengthEncoding,RLE)3.算法特點(diǎn)有時(shí)行程編碼與其他一些編碼方法混合使用。8.2.3行程編碼(RunLengthEncoding,RLE)5.算法缺點(diǎn)缺點(diǎn):(1)對(duì)傳輸差錯(cuò)很敏感,如果其中一位符號(hào)發(fā)生錯(cuò)誤,就會(huì)影響整個(gè)編碼序列的正確性,使行程編碼無(wú)法還原回原始數(shù)據(jù),一般要用行同步、列同步的方法,把差錯(cuò)控制在一行一列之內(nèi)。(2)像ABCDBACADB使用這種算法文件會(huì)增大,就是1A1B1C1D1B1A1C1A1D1B了,達(dá)不到壓縮的效果。8.2.3行程編碼(RunLengthEncoding,RLE)6.算法實(shí)現(xiàn)壓縮比為0.50478.2.4小波圖像編碼1.子帶編碼小波變換在20世紀(jì)90年代初期已較成熟8.2.4小波圖像編碼S.Mallat于1988年提出了多分辨率分析的概念,從空間上形象地說(shuō)明了小波的多分辨率的特性,提出了正交小波的構(gòu)造方法和快速算法,稱(chēng)為Mallat算法。1.多分辨率編碼8.2.4小波圖像編碼1.多分辨率編碼8.2.4小波圖像編碼2.小波圖像編碼小波變換符號(hào)編碼器符號(hào)解碼器小波反變換量化器壓縮后圖像解碼后圖像原圖像(1)對(duì)圖像進(jìn)行多級(jí)小波分解,得到相應(yīng)的小波系數(shù);(2)對(duì)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論