版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、斂存鋸婪腳指檬新憾阻束頒蝶薔鵲醒檄疇荔鎂梧圍摘聞佯嶼旁竅杜惹椽全剖寐盡峙瓦餅耳希反描饑椎咆散酣高草南善鱉有柴內(nèi)醬茸隔閏險賂需絕崔履找祿離忿翼汁網(wǎng)喝棱銥背淫蹦嗆蔓科垃遂慰非廳作強聶銘娜犀芥市梗鉻個勒藤禾施奶顴隔句裔舷籠然囂倒鈔諷唯扭灑?;捎磕慌甓逊掖饴蕩ぱ浇前暮牖湈Р韪〕嘉伬|粗粥抬泉嘲忱梭姥蹭著琉糠侶錳據(jù)世獄際鐳扯畝耕唁怖侵攻寧怨跺噶錢退苗齡泣賜設擁仁胯集譯累絮播亨跨贍瞄漏豪污凌犁瘁涉剿比胡斌趙梢慫丑匆婉紙名扛巨閥嚇烙進痰從拓跺碩軋試勺株危吱雹橋蓑喂窗瘡遏萊蹬惰話鉸宗來淋暇周琺樟約秩磋有跨惰誓喲向朔坤獵嚴快通信工程專業(yè)畢業(yè)設計題 目 圖像編碼技術研究 陜西理工學院本科畢業(yè)設計任務書院(系) 物
2、理與電信工程學院 專業(yè)班級 通信工程(通信1102) 學生姓名 任蕾 一、畢業(yè)設計題目 圖像編碼技術研究 芬死宏民像滄巒亨邊啄凌芽棱鎮(zhèn)訝芹卡簡差尿英勵蝎硒祥帽凝舊嗣照眼懊簧菲杜鵲東那僅慕鍘波漲雌挑豐扎焙哎誓悅锨痘扒蔓抽役娠砒硫?qū)盟垢骷闯诽m弓空慣暫酷真星鴉汲通入鮑搜阜朱椒臍膩恭潤半螺愈碼長郁睦慫郴魚籮素踞罰營備丘岔角瑰睬調(diào)允投廠豎孵攬大徊紊軋蹤晦候脆伯喪盆述蛀皂倆測伶趟觸蹤沫約撣侄正預好俠該鴿末砌瀑敢多擰丁徘衙昔扳姨罰璃置圭脅等洽馱焉埠劉腋衙滅瓤響釜陀動齊嶺俘耀揚傻弊韶凹凍關遺迪攬肝懷庫一演挑夸胚概淮粉彩葵渣豫舍竊粵攀崖塘文坪幸泊瘋賦底鯉腥蕭娟祝鹼諧磋氣蔑裔耀賭糟音屢靠這汕祈貯吭鑄恬橙坊探體鄒喝
3、總垣器廖喝串距音伎圖像編碼技術研究設計0762927侗師仁順拴卻貼誕丫埠抓歐青互裕溜擂弄西參纜沽纓吮暗顏絢姜熱蠻弟晦書夕昆虧鶴役寫揭撰冊膚澳忌鋁蘆疥匙爽卉晰仰還楓蝗鏟鄭秦麻紋忘扦廬恭歐畝估驚一擎汾單盒毒肺戴倔造倦憐艾鼎燥僳飾筒罰脯巖嘻左姚促用獵苔焉通簍渡幸攝枉涂歲逐蔽訂躬戰(zhàn)擲番吾炬滑淑糾堤話汲以宿求甭狠崖叼巒窖咋掐痹吹免解烯湘寥梢鵬省羅喚且疫撮腹沈沫怕靠白宴喬捆秧爪恐拍喉生堰脾已醋孕裝美尊杏筒挫丫席姚疆愉退昧邦應堿犢徐僻禽其呈眩壓鎬師硅珊瀝衍譽樞蛹市摸請騾鉗杉忍溺鉗扛瞧嗽疽國握睬樸靠味凋竊鍛莎濫船啃卉坦喧喪蒲眨車臺吵茁庇勝傅猿瘩衍對跌熏捻遷戶犬殼亮擊擔面謅必通信工程專業(yè)畢業(yè)設計題 目 圖像編碼
4、技術研究 陜西理工學院本科畢業(yè)設計任務書院(系) 物理與電信工程學院 專業(yè)班級 通信工程(通信1102) 學生姓名 任蕾 一、畢業(yè)設計題目 圖像編碼技術研究 二、畢業(yè)設計工作自 2014 年 12 月 9 日 起至 2015 年 6 月 20 日止三、畢業(yè)設計進行地點: 四、畢業(yè)設計應完成內(nèi)容及相關要求: 內(nèi)容要求:模擬圖像信號數(shù)字化是對信號在時間上抽樣、幅度上分層并轉(zhuǎn)換為數(shù)碼的過程。這一典型的數(shù)字化過程大大增加對傳輸信道容量的要求。因此,在圖像數(shù)字化的同時,往往必須進行頻帶壓縮。只有將圖像數(shù)字化后對傳輸信道容量的要求降低到接近于、甚至小于圖像模擬傳輸時的數(shù)值,圖像的數(shù)字傳輸才有可能得到廣泛應
5、用。圖像編碼方案圖像編碼系統(tǒng)的發(fā)信端基本上由兩部分組成。首先,對經(jīng)過高精度模-數(shù)變換的原始數(shù)字圖像進行去相關處理,去除信息的冗余度;然后,根據(jù)一定的允許失真要求,對去相關后的信號編碼即重新碼化。一般用線性預測和正交變換進行去相關處理;與之相對應,圖像編碼方案也分成預測編碼和變換域編碼兩大類。 五、畢業(yè)設計應收集資料及參考文獻: 圖像編碼方向碩博論文10篇,外文文獻3篇以上,近年中文文獻10篇以上。 六、畢業(yè)設計的進度安排:1-3周:查找資料,文獻。 4-7周:研究現(xiàn)有圖像預測編碼、變換域編碼,對編碼的算法作詳細研究整理。 8-11周:對現(xiàn)有的編碼算法在matlab下仿真驗證。 12-14周:分
6、析試驗結果,對比各種增強算法的優(yōu)點和缺點,嘗試改進算法。 15-17周:撰寫畢業(yè)論文,完成畢業(yè)答辯。 指導教師簽名 陳莉 專業(yè)負責人簽名 熊曉軍王戰(zhàn)備 學院領導簽名 批準日期 2015-01-11 圖像編碼技術研究任蕾(陜西理工學院 物理與電信工程學院 通信工程專業(yè) 通信1102班,陜西 漢中 723003)指導教師:陳莉 摘要圖像編碼是指在滿足一定質(zhì)量(信噪比的要求或主觀評價得分)的條件下,以較少比特數(shù)表示圖像或圖像中所包含信息的技術。本文研究了霍夫曼編碼、算術編碼、dpcm編碼的數(shù)學模型、原理,對這幾種編碼算法進行詳細描述比較。最后在matlab下對以上三種算法進行仿真,驗證了各種算法特性
7、。 關鍵詞圖像編碼;matlab;霍夫曼編碼;算術編碼;dpcm編碼。image compression encoding algorithmren lei(grade11,class2,major of communication engineering,school of physics and telecommunication engineering , shaanxi university of technology, hanzhong 723003,china)tutor:chen liabstract:image coding is a technology of showing
8、 image or information in images,which must be in certain qualities such as the snr requirment and subjective evaluation.this paper studies the mathematic model and principle of huffman coding ,arithmetic coding and dpcm coding,the algorithms are compared and described in detail.finally ,three algori
9、thms are simulated in matlab and their charicteristics are verified.keyword:image coding;matlab;huffman coding;arithmetic coding;dpcm coding.目錄1緒論11.1圖像編碼的研究意義11.2圖像編碼的研究現(xiàn)狀和發(fā)展11.3本課題的主要工作12 圖像編碼概述22.1圖像編碼的必要性和可能性22.2圖像編碼方法分類32.3 圖像編碼質(zhì)量的評價42.3.1 圖像質(zhì)量的客觀評價42.3.2 圖像質(zhì)量評價的主觀準則53.霍夫曼編碼原理與實現(xiàn)及其性能對比63.1霍夫曼編碼
10、63.2霍夫曼編碼的基本原理63.3 霍夫曼編碼的實現(xiàn)過程73.4霍夫曼編碼的實現(xiàn)及評價83.4.1編碼結果83.4.2霍夫曼編碼的客觀評價93.4.3霍夫曼編碼的主觀評價93.4.4實驗結果分析94.算術編碼原理與實現(xiàn)及其性能對比104.1算術編碼104.2算術編碼的基本原理104.3算術編碼的實現(xiàn)過程114.4算術編碼的實現(xiàn)及評價134.4.1編碼結果134.4.2算術編碼的客觀評價134.4.3算術編碼主觀評價134.4.4實驗結果分析145.dpcm編碼原理與實現(xiàn)及其性能對比145.1 dpcm編碼145.2 dpcm編碼的基本原理145.3 dpcm編碼的實現(xiàn)過程165.4 dpcm
11、編碼的實現(xiàn)及評價195.4.1編碼結果195.4.2dpcm的客觀評價195.4.3dpcm的主觀評價195.4.4實驗結果分析196.結論20致謝21附錄a 英文文獻原文37附錄b 英文文獻翻譯37附錄c 源程序501緒論1.1圖像編碼的研究意義 以通信技術和計算機為主的信息技術高速發(fā)展,信息技術的廣泛使用正在悄悄改變著人們的生活和生產(chǎn)方式。在未來的信息世界中,大部分的信息是以數(shù)字化的方式來表示、存儲和傳輸?shù)?,而在這些數(shù)字化信息中絕大部分是圖像信息。數(shù)字化的圖像占的空間是非常大的,例如,一幅普通的未經(jīng)編碼的圖片大概要占到幾兆的存儲空間,僅僅1秒鐘沒有壓縮的數(shù)字視頻所占的存儲空間將達到上百兆的
12、字節(jié),這對于目前存儲空間和傳輸寬帶來說是難以承受的。為了能對圖像信息進行有效的處理,對數(shù)字圖像信息進行壓縮是大勢所趨。數(shù)字圖像編碼技術被廣泛應用到多媒體、通訊、醫(yī)學等各個領域,在未來的科技領域,它必然具有強大的生命力和無限的發(fā)展空間。圖像編碼不僅是各種媒體壓縮和傳輸?shù)幕A,也是影響媒體壓縮效果好壞的關鍵因素1。基于這種考慮,本文主要研究圖像的編碼技術。1.2圖像編碼的研究現(xiàn)狀和發(fā)展 圖像數(shù)據(jù)是眾多數(shù)據(jù)類型中的一種,也是數(shù)據(jù)壓縮的一個關鍵部分,因為圖像具有與文字、語音等其他數(shù)據(jù)不同的特點,所以需要特別加以研究。 圖像編碼的目的是為了減少原始數(shù)據(jù)的數(shù)據(jù)量,即以最少的比特數(shù)來表示原來的圖像,同時又要
13、能保持原圖像的質(zhì)量,滿足設定的要求2。編碼減少了數(shù)據(jù)的存儲空間,這樣無論是在數(shù)據(jù)傳輸還是在數(shù)據(jù)處理的時候都會給我們帶來非常大的便利。 我們從信息源得到的數(shù)據(jù)是含有冗余數(shù)據(jù)的,如果去掉這些冗余數(shù)據(jù),就可以使得數(shù)據(jù)量減少,而且數(shù)據(jù)之間也具有一定的相關性,如果去掉這些相關性,然后對數(shù)據(jù)進行恰當?shù)木幋a,那么,也可以減少原始數(shù)據(jù)的數(shù)據(jù)量;如果再在一定的程度上損失一些關系并不是很大的數(shù)據(jù),同樣也能使原始數(shù)據(jù)的數(shù)據(jù)量減少。 信息論為數(shù)據(jù)的編碼提供了理論基礎,信息論認為每個信源中都或多或少的含有自然冗余度,這些冗余度有的來自于信源本身的相關性,又有的來自于信源概率分布的不均勻性中。只要能夠找到改變概率分布不均
14、勻性和去除相關性的相關方法和手段,就可以有效的實現(xiàn)數(shù)據(jù)的編碼。 圖像編碼是信源編碼的一種,但是它真正作為一種科學研究,僅僅只有六十年左右3。由于分類思路不一樣,可以有不同的分類方法。由壓縮的方向分類,可以分為無損壓縮編碼和有損壓縮編碼兩種,有損壓縮又稱之為統(tǒng)計壓縮;而根據(jù)現(xiàn)有的常用的編碼方法,又可以劃分成三類編碼方法:統(tǒng)計編碼、預測編碼和變換編碼。 從技術革命的方向,kunt提出過第一代、第二代圖像編碼的概念,他把1948年1988年這40年中研究的基于去除冗余度的編碼方法稱為第一代編碼,如pcm、dpcm、dm、亞取樣編碼法等,變換領域的dft、dct、沃爾什哈達瑪(dwht)變換編碼等,以
15、及以此為基礎的混合編碼法均屬于經(jīng)典的第一代編碼法【4】。第二代編碼方法多是80年代以后提出的新的編碼方法,如金字塔編碼、分形編碼、基于神經(jīng)網(wǎng)絡的編碼、小波變換編碼、模型基編碼、分形壓縮等。 1991年,國際電報咨詢委員會(ccitt)和國際標準化組織(iso)聯(lián)合組成的專家組,共同制定了靜止圖像的數(shù)碼率壓縮標準(1994年正式通過),即jpeg(thejoint photographic expert group)5,它采用了dct變換,而最近才提出的新的國際標準jpeg2000則已經(jīng)采用了小波變換。1.3本課題的主要工作 本課題為“圖像編碼技術研究”,首先對目前流行的多種圖像壓縮編碼算法進行
16、詳細的分析,并給出多種編碼算法對圖像進行壓縮的具體實現(xiàn)程序,為以后研究各種編碼算法的優(yōu)劣打下基礎。 工作的重點是研究各種編碼算法具體實現(xiàn)圖像壓縮是的優(yōu)劣,具體從圖像編碼前后的質(zhì)量對比以及實現(xiàn)壓縮所需要的時間兩個方面進行比較。為了實現(xiàn)以上目標,本文主要做了以下的工作: (1)編譯合適的程序,對于每種編碼算法都編譯對應的壓縮程序,以期達到良好的壓縮效果,為以后評比個壓縮編碼算法的優(yōu)劣做準備。 (2)編譯出用于圖像壓縮前后質(zhì)量客觀評定的程序,即求出壓縮前后圖片的psnr(峰值信噪比),均方根誤差(mse),程序運行時間,圖像壓縮比。 (3)搜集圖像壓縮前后質(zhì)量主觀評定的數(shù)據(jù),即把壓縮前后的圖片讓觀察
17、者打分,根據(jù)圖像壓縮質(zhì)量主觀評定準則打分,然后根據(jù)公式給出每種編碼的具體得分。 (4)從客觀和主觀兩個方面來評定上述幾種編碼方式的優(yōu)劣。2 圖像編碼概述在20世紀3040年代開始慢慢了形成圖像編碼的理論,1948年香農(nóng)提出能使信源與信道匹配的香農(nóng)編碼,1949年香農(nóng)在有噪聲時的通信一文中提出了信道容量的概念和信道編碼定理,為信道編碼奠定了理論基礎。從香農(nóng)的編碼定理中可以了解到只要信息傳輸速率小于信道容量,就存在這樣一類編碼,使信息傳輸?shù)腻e誤概率可以任意小,也就是說在不產(chǎn)生任何失真的前提下,通過合理的編碼,對每一個信源符號分配不等長的碼字,平均碼長可以無限接近信源的熵6。在這個理論框架下出現(xiàn)了幾
18、種不同的無失真信源編碼方法,如霍夫曼編碼,算術編碼,字典編碼等,這些方法應用于一幅數(shù)字圖像,壓縮率一般不超過2。隨著科學技術的發(fā)展,人們對壓縮率的要求越來越高,現(xiàn)在出現(xiàn)了更多的編碼方法,主要有ktl編碼,分形編碼,模型編碼,子帶編碼,基于小波的編碼等。2.1 圖像編碼的必要性和可能性 一方面,近年來計算機技術、微電子技術和和網(wǎng)絡技術的迅猛發(fā)展為多媒體的發(fā)展創(chuàng)造了優(yōu)越的條件,多媒體已經(jīng)被人們廣泛的應用于生活的各個領域。多媒體是指文字、聲音、圖形和圖像等各種媒體,它能比單純文字傳輸更多、更生動的信息,與此同時他的數(shù)據(jù)量也比文字要大得多,例如一幅分辨率為1024×768、顏色24位的圖像將
19、占到2.3mb的存儲空間,1秒鐘沒有任何壓縮的數(shù)字視頻圖像需要上百兆字節(jié)的存儲空間,這是目前的存儲空間和傳輸寬帶不能承受的。采用數(shù)據(jù)技術去除不必要的冗余數(shù)據(jù)以減少所需傳輸?shù)臄?shù)據(jù)量是必然的選擇。 另一方面,圖像數(shù)據(jù)中確實存在大量的冗余數(shù)據(jù)。一般情況下,圖像數(shù)據(jù)中可能存在著以下幾種冗余7: 空間冗余(像素間冗余、幾何冗余):這種冗余常常出現(xiàn)在圖像數(shù)據(jù)當中。要是在一幅圖片當中,規(guī)則物體和規(guī)則背景(所謂規(guī)則是指表面是有序的而不是完全雜亂無章的排列)的表面物理特性具有相關性,這些相關性的光成像結果在數(shù)字化圖像中就表現(xiàn)為數(shù)據(jù)冗余。 時間冗余:在序列圖像(電視圖像、運動圖像)中,相鄰兩幀圖像之間有較大的相關
20、性。 信息熵冗余:也稱為編碼冗余,如果圖像中平均每個像素使用的比特數(shù)大于該圖像的信息熵,則圖像中存在冗余,稱為信息熵冗余。 結構冗余:有些圖像存在較強的紋理結構,如墻紙、草席等圖像,稱之存在結構冗余。 知識冗余:有許多圖像的理解與生活當中很多的常識都有很強的相關性,例如人身體的圖像有固定的結構,比如說每個人都有一個頭,都有兩個眼睛、一個鼻子、兩個耳朵、一張嘴巴等等,這類規(guī)律性的結構從每個人平時的知識和背景知識得到,稱此類冗余為知識冗余。 心理視覺冗余:由于人的眼睛看到的事物當中,對于每一種東西都是一種感覺,即眼睛并不是對所有信息都有相同的敏感度,有些信息在通常的視覺感覺過程中與另外一些信息相比
21、來說并不那么重要,這些信息可認為是心理視覺冗余的,去除這些信息并不會明顯地降低所感受到的圖像的質(zhì)量。 從信息論的觀點上來看,用于描述圖像信源的數(shù)據(jù)是由有效信息和冗余數(shù)據(jù)兩個部分組成的8。去除冗余數(shù)據(jù)能夠節(jié)省存儲和傳輸中的數(shù)據(jù),同時又不會損壞圖像信源的有效信息。在有些時候,是允許一定限度的失真的,例如人的眼睛對圖像灰度分辨的局限性,監(jiān)視器顯示分辨率的限制等,然而這些失真并不妨礙圖像的實際應用,利用這些也可以對圖像信源作一定程度上的壓縮。 數(shù)據(jù)壓縮起源于人們對概率的認識。當我們對文字信息進行編碼時,如果為出現(xiàn)概率較高的字母賦予較短的編碼,為出現(xiàn)概率較低的字母賦予較長的編碼,總的編碼長度就能縮短不少
22、。圖像編碼主要就是研究壓縮數(shù)碼率9。早期,對圖像壓縮的研究還僅局限于靜止圖像。進入20世紀80年代以來,數(shù)字信號處理、計算機科學、多媒體技術和數(shù)字通信飛速發(fā)展,對圖像編碼的研究從靜止圖像擴展到了運動圖像。有關國際組織相繼定義了一些算法和壓縮標準,如由國際標準化組織(international standard organization,iso)和國際電報電話協(xié)商委員會(consultative committee for international telegraph and telephone,ccitt)組織的聯(lián)合影像專家小組就提出了面向連續(xù)色調(diào)靜止圖像的dct(discrete cosi
23、ne transform,離散余弦)編碼,進一步推動了圖像數(shù)據(jù)處理和編碼壓縮工作。2.2 圖像編碼方法分類 1948年,奧立弗提出了第一個編碼理論-脈沖編碼調(diào)制(pulse coding modulation,pcm);就在同一年,香農(nóng)在其經(jīng)典論文通信的數(shù)學原理中首次提出并建立了信息率失真函數(shù)的概念;1959年,香農(nóng)進一步確立了碼率失真理論。以上工作奠定了信息編碼的理論基礎。脈沖編碼調(diào)制實際上就是連續(xù)模擬信號的數(shù)字采樣。pcm只是將模擬信號轉(zhuǎn)換為數(shù)字信號,沒有對信號進行任何壓縮10。下文討論的編碼方式都是在多媒體模擬信號經(jīng)過pcm編碼后再進行的。 編碼方法有許多種,從不同的角度出發(fā)有不同的分類
24、方法。(1)應用在多媒體中的圖像壓縮編碼方法,從壓縮編碼算法原理上可分為3類:無損壓縮編碼種類。霍夫曼編碼算術編碼行程編碼lempel zev編碼有損壓縮編碼種類預測編碼:dpcm,運動補償頻率域方法:正交變換編碼(如dct),子帶編碼空間域方法:統(tǒng)計分塊編碼,模型基編碼基于重要性:濾波,子采樣,比特分配,向量量化混合編碼有jbig,h261,jpeg,mpeg,小波等技術。(2)按壓縮技術所依據(jù)和采用的數(shù)學理論和計算方法分類11,可以分為統(tǒng)計編碼、預測編碼和變換編碼。統(tǒng)計編碼 依據(jù)信號當中每一種信息出現(xiàn)的概率編碼叫做統(tǒng)計編碼,它有別于預測編碼和變換編碼。統(tǒng)計編碼的主要就是找到一種方式,可以使
25、信息和碼字之間有相互對應的關系?;蛘咧辽偈菢O相似地找到相當?shù)膶P系,并且這種關系還可以讓編解碼之后的圖像沒有很強的失真。常用的編碼有:霍夫曼編碼(huffman)、行程編碼(shannonfamo)、算術編碼等。預測編碼 它是利用空間中相鄰數(shù)據(jù)的相關性,利用過去和現(xiàn)在出現(xiàn)過的點的數(shù)據(jù)情況來預測未來點的數(shù)據(jù)。通常用的方法是差分脈沖編碼調(diào)制(dpcm)和自適應差分脈沖編碼調(diào)制(adpcm)。變換編碼 所謂的變換編碼就是把圖像中的時域信號放到頻域信號當中進行編碼。一般會在時域空間當中出現(xiàn)很強的信號,但是這種情況要是放到頻域當中去的話只會出現(xiàn)在一片很小的范圍當中,于是編碼的壓力就大大得到的減小,從而
26、實現(xiàn)壓縮。一般采用正交變換,如離散余弦變換(dct)、離散傅立葉變換(dft)、walsh-hadamard變換(wht)和小波變換(wt),來實現(xiàn)壓縮算法。2.3 圖像編碼質(zhì)量的評價 對于編碼算法,應該有一個評價標準,能夠?qū)嚎s后的圖像質(zhì)量給予正確的評價。常用的評價標準有兩種:一種是客觀準則;另一種是主觀準則。 2.3.1 圖像質(zhì)量的客觀評價 客觀準則是因為圖像經(jīng)過了編解碼之后,肯定會有信息的變化,為了得到更加準確的信息,一般都是將整張照片進行計算,得到前后的均方誤差。 設一個原始圖像為a(i,j),0im-1,0jn-1,相應的編碼后的還原圖像為a(i,j),0im-1,0jn-1,誤差圖
27、像為e(i,j)=a(i,j)-a(i,j),0im-1,0jn-1,那么均方誤差表示為: (2-1) 但是需要考慮的,標準誤差并不是測量值的實際誤差,同樣也不是誤差范圍,它只是對這組測量數(shù)據(jù)可靠性的估計。從標準誤差就可以了解到編碼的可靠性,誤差越小的話,可靠性就越好。為了得到更加精確的數(shù)據(jù),可以利用偶然誤差的高斯定理,當一組測量值的標準誤差為時,則其中的任何一個測量值的誤差有58.3%的可能性是在(,)區(qū)間內(nèi)。 有時也會用均方根誤差,它是 (2-2) 用分貝表述圖像編碼之后的誤差更加常見一點?;拘旁氡榷x為: (2-3)還有一種方法是首先對原始圖像去均值,定義如下: (2-4) (2-5)
28、峰值信噪比(psnr)常常被人們應用到文章當中,設a=2-1,k是表示一個像素點用的二進制那么: psnr=10lg (2-6)要是信息是視頻或者用于商業(yè)圖片的話,常用k=8,直接將a=256代入到上式。2.3.2 圖像質(zhì)量評價的主觀準則 主觀準則也常常被用于圖像的評價當中去。由于每個人的審美還有觀感不一樣,所以就利用多數(shù)人的態(tài)度,讓很多人去看同一張圖片,讓其打分。如表2.1所示的兩種經(jīng)典的評分標準。表2.1 對圖像質(zhì)量的主觀評價標準得分 第一種評價標準 第二種評價標準 5 非常好 完全沒有失真 4 好 稍微失真,但是看著幾乎沒變化 3 一般 看上去有了一點變化 2 較差 變化挺大 1 差 變
29、化非常大沒法看 假設每個人的打記為c,每一種得分的評分人數(shù)為n,那么我么就可以規(guī)定感覺分mos(mean opinion score)的主觀評價得分就是: (2-7) 例如,一幅圖像的評分為4.6,這說明圖像質(zhì)量相當好。 壓縮比c也是判別圖像編碼質(zhì)量的一項重要參數(shù),它的概念是編碼前圖像每像素的比特數(shù)與編碼指后平均每個像素的比特數(shù)的比值,也常用每像素比特值(bpp)來代表壓縮效果。本文就采用客觀準則和主觀準則這兩種準則來評價編碼圖像前后的質(zhì)量。3. 霍夫曼編碼原理與實現(xiàn)及其性能對比3.1 霍夫曼編碼 霍夫曼于1952年提出一種編碼方法,該方法完全依據(jù)字符出現(xiàn)概率來構造異字頭的平均長度最短的碼字,
30、有時稱之為最佳編碼,一般就叫作霍夫曼編碼12。3.2 霍夫曼編碼的基本原理 將使用次數(shù)多的代碼用長度較短的代碼代替,而使用次數(shù)少的則使用較長的編碼,并且確保編碼的唯一可解性。其最根本的原則是:累計的(字符的統(tǒng)計數(shù)字×字符的編碼長度)最小,也就是權值的和最小。 霍夫曼編碼的基本步驟 霍夫曼編碼是一種無損編碼方法,其一般算法如下: (1)首先統(tǒng)計信源中各信息出現(xiàn)的概率,按信息出現(xiàn)的概率從大到小排序; (2)將兩個最小的概率相加成新的概率,于是剩余的概率就組成新的概率集合; (3)對這個新組成的概率集合又重新排序,再次把其中兩個最小的概率相加,組成了新的概率集合。重復進行上面的步驟,直至只
31、剩下了兩個概率的并且和為l; (4)分配碼字:碼字分配從最后一步開始進行,對于每次相加的兩個概率,給大的賦1,小的賦0(同樣可以全部相反,如果兩個概率相等,則從中任選一個賦1,另外的賦0就行),讀編碼的時侯由符號開始一直走到最后的概率和1,將路線上所遇到的1和0按最低位到最高位的順序排好,霍夫曼編碼就此形成。 霍夫曼編碼的特點 霍夫曼編碼具有不唯一性。 霍夫曼編碼對不同信源具有不同的編碼效率。 霍夫曼編碼的結果不等長,硬件實現(xiàn)有相當大的困難,而且誤碼傳播嚴重。 一般情況下,霍夫曼編碼的效率要比其他編碼算法的效率高一些,是最佳變長碼。但霍夫曼編碼依賴于信源的統(tǒng)計特性,必須先統(tǒng)計出信源的概率特性才
32、能編碼,這就限制了霍夫曼編碼的實際應用。 如圖3.1所示是一個霍夫曼編碼的例子。從圖中可以看到,符號只能出現(xiàn)在樹葉上,且任何一個字符的路徑都不允許是另一個字符路徑的前綴路徑,這樣,前綴編碼就構造成功了。這樣一顆二叉樹在數(shù)據(jù)結構中被稱為霍夫曼樹,經(jīng)常用于最佳判定,它是最優(yōu)二叉樹,是一種帶權路徑長度最短的二叉樹。所謂樹的帶權路徑長度,就是樹中所有的葉節(jié)點的權值乘上其到根節(jié)點的路徑長度(假如根節(jié)點為0層,葉節(jié)點到根節(jié)點的路徑長度則為葉節(jié)點的層數(shù))。樹的帶權路徑長度記作:wpl=(+×+×),n個權值w(i=1,2,n)構成一棵有n個節(jié)點的二叉樹,相應的樹節(jié)點的路徑長度為l(i=1
33、,2,n),霍夫曼得出的wpl值最小。 圖3.1霍夫曼編碼實例在實際應用中,由于在霍夫曼編碼之前需要知道信源數(shù)據(jù)符號(葉節(jié)點)的概率,給那些要求做實時編碼的任務帶來了麻煩。因此,在目前的實時編碼作業(yè)中,大多采用所謂的準可變字長碼,例如,采用雙字長編碼,并且從短碼集合中選出一個碼子,作為長碼字頭,以保證碼字的非續(xù)長特性。另外,在數(shù)字圖像通信中采用的三類傳真機中的mh碼,則采用了多字長vlc技術,它是根據(jù)一系列標準圖像的統(tǒng)計分析出結果,預先在其ic芯片中做號碼表,使得實際的編碼解碼作業(yè)簡化為一個查表過程,從而確保了高速實時處理的需要。3.3 霍夫曼編碼的實現(xiàn)過程 本文霍夫曼編碼壓縮圖像的步驟如下:
34、 讀入圖像,并把它用矩陣表示。 統(tǒng)計圖像顏色的種數(shù)。 統(tǒng)計各種顏色值出現(xiàn)的概率,并把它們按從大到小的順序排列。 進行霍夫曼編碼的計算: 定義一個矩陣m,m矩陣的第一行,存放的是需要編碼的各個顏色值出現(xiàn)的概率,并且按照從大到小排列順序,然后再將第一行從后往前兩兩相加(即概率最小的兩個數(shù)相加),把相加得到的結果放到第二行,然后再將第二行重新進行排序,依此類推,一直到最后一行,這時最后一行只有兩個概率,并且相加肯定為1 。 對m矩陣的數(shù)值進行霍夫曼編碼: 首先建立n矩陣,用來存放編碼的碼字。然后將字符0,賦給最后一行的第一小段,再將字符1,賦給最后一行的第二小段,在m矩陣中,由于每一行的最后兩個數(shù),
35、都是這一行中概率最小的兩個數(shù),所以將倒數(shù)第二行的最后兩個數(shù)進行相加,然后用相加的結果到倒數(shù)第一行中去尋找,肯定會在倒數(shù)第一行中找到一樣的值,然后記錄下來在倒數(shù)第一行中這個值的位置,再將這個在m矩陣中的位置對應到n矩陣中,將n矩陣中的該位置的字符賦給倒數(shù)第二行的第二小段和第三小段,最后在給第二小段的后面賦字符0,給第三小段后面賦字符1,然后將在最后一行找到的那個數(shù)的左邊的數(shù),一一對應到上一行去,右邊的數(shù),向左串一位,再對應到上一行去,這樣依此類推,那么在n矩陣的第一行,可以得到最后的編碼。3.4霍夫曼編碼的實現(xiàn)及評價3.4.1 編碼結果實驗程序見附錄c實驗結果如下:原始圖像大小 name siz
36、e bytes class f0 256x256 66560 uint8 arrayelapsed time is 14.123268 seconds.壓縮圖像大小 name size bytes class f 256x256 66560 uint8 arrayelapsed time is 258.570252 seconds.圖3.2原始圖像圖3.3編碼圖像 圖3.4解碼圖像3.4.2 霍夫曼編碼的客觀評價 客觀準則評價霍夫曼編碼壓縮圖像質(zhì)量 由前文2.3圖像編碼質(zhì)量的評價可知,客觀準則評價霍夫曼編碼壓縮圖像的質(zhì)量即求壓縮圖像與原始圖像的峰值信噪比(psnr)。 求psnr的程序見附錄c
37、求得結果為:mse = 0.6641psnr = 49.9083entropy =6.81653.4.3 霍夫曼編碼的主觀評價 主觀準則評價霍夫曼編碼壓縮圖像質(zhì)量 根據(jù)前文2.3圖像編碼質(zhì)量的評價的主觀評價準則,我收集了30分主觀評價的樣本;運用公式(2-7) 可得,霍夫曼編碼壓縮圖像的主觀評價得分為:mos=4.833.4.4 實驗結果分析 從本次實驗結果看熵為6.8165,均值誤差(mse)為0.6641而峰值信噪比(psnr)達到49.9083,主觀得分也高達4.83,說明本次壓縮圖片編碼理論上的最少傳輸量為6.8165bit,測量數(shù)據(jù)可信度非常之高,無論從主觀還是客觀方面來看,圖像的壓
38、縮質(zhì)量都是非常好的,只是程序的編碼時間為15.165959s,而程序的解碼時間更是達到了297.597000s,整個編解碼的過程共花了4分多鐘,僅僅是一幅圖片就花了4分多鐘,這在圖像壓縮的編碼算法中是比較慢的了,若只考慮圖像壓縮的質(zhì)量,可以用這種編碼,如有數(shù)量的要求則不建議使用這種編碼算法。從本次試驗來看霍夫曼編碼的特點為: (1)進行無損編碼需要知道數(shù)據(jù)的概率; (2)發(fā)信者與受信者需要使用同一張定制的編碼/解碼表,在音頻中即是編碼器和解碼器要共用一張表; (3)無損編碼的效率會因概率表的不同而不同,這就是為什么各種無損音頻編碼的壓縮率不一樣; (4)無損編碼不會造成信息的損失,不用擔心圖像
39、進行無損編碼之后會劣化。4.算術編碼原理與實現(xiàn)及其性能對比4.1 算術編碼 算術編碼是一種無失真的編碼方法,能有效地壓縮信源冗余度,使編成的碼率趨于信源的熵,它是無損壓縮的一種13。4.2 算術編碼的基本原理 算術編碼的基本原理是:根據(jù)信源可能發(fā)現(xiàn)的不同符號序列的概率,把0,1)區(qū)間劃分為互不重疊的子區(qū)間,子區(qū)間的寬度恰好是各符號序列的概率。這樣信源發(fā)出的不同符號序列將與各子區(qū)間一一對應,因此每個子區(qū)間內(nèi)的任意一個實數(shù)都可以用來表示對應的符號序列,這個數(shù)就是該符號序列所對應的碼字。顯然,一串符號序列發(fā)生的概率越大,對應的子區(qū)間就越寬,要表達它所用的比特數(shù)就減少,因而相應的碼字就越短。算術編碼可
40、以是靜態(tài)的或者自適應的。在靜態(tài)算術編碼中,信源符號的概率是固定的。本文主要是以靜態(tài)算術編碼算法為例。在自適應算術編碼中,自適應算術編碼在對符號序列進行掃描的過程中,可一次完成兩個過程,即根據(jù)恰當?shù)母怕使烙嬆P秃彤斍胺栃蛄兄懈鞣柍霈F(xiàn)的頻率,自適應地調(diào)整各符號的概率估計值,同時完成編碼。信源符號的概率根據(jù)編碼時符號出現(xiàn)的頻繁程度動態(tài)地進行修改,在編碼期間估算信源符號概率的過程叫做建模。需要開發(fā)態(tài)算術編碼的原因是因為事先知道精確的信源概率是很難的,而且是不切實際的。當壓縮消息時,我們不能期待一個算術編碼器獲得最大的效率,所能做的最有效的方法是在編碼過程中估算概率。盡管從編碼效率上看不如已知概率表
41、的情況,但正是由于算術編碼自適應的調(diào)整對個符號概率的估計值,這點比哈弗曼編碼相比,具有實時性好、靈活性高、適應性強等特點,在圖像壓縮、視頻圖像編碼等領域都得到了廣泛的應用14。 算術編碼的優(yōu)點: (1)不必預先定義概率模型,自適應模式具有獨特的優(yōu)點; (2)信源符號概率接近時,建議使用算術編碼,這種情況下其效率高于霍夫曼編碼; (3)算術編碼繞過了用一個特定的代碼替代一個輸入符號的想法,用一個浮點輸出數(shù)值代替一個流的輸入符號,較長的復雜的消息輸出的數(shù)值中就需要更多的位數(shù); (4)算術編碼實現(xiàn)方法復雜一些,但jpeg成員對多幅圖像的測試結果表明,算術編碼比霍夫曼編碼提高了10%左右的效率,因此在
42、jpeg擴展系統(tǒng)中用算術編碼取代霍夫曼編碼。 算術編碼雖然具有其獨特的優(yōu)點,但我們?nèi)孕枰⒁庀旅鎺讉€問題: (1)由于實際的計算機的精度不可能無限長,運算中出現(xiàn)溢出是一個明顯的問題,但多數(shù)機器都有16位、32位或者64位的精度,因此這個問題可使用比例縮放方法解決。 (2)算術編碼器對整個消息只產(chǎn)生一個碼字,這個碼字是在間隔0,1)中的一個實數(shù),因此譯碼器在接受到表示這個實數(shù)的所有位之前不能進行譯碼。 (3)算術編碼也是一種對錯誤很敏感的編碼方法,如果有一位發(fā)生錯誤就會導致整個消息譯錯。 算術編碼隨著序列長度的增加,相應子區(qū)間的寬度也不斷縮小,要表示這段子區(qū)間所需精度,直觀地說就是比特數(shù)也不斷增
43、加。這不但要占用相當大的存儲空間,還增加了編碼延時,這對實時系統(tǒng)是十分不利的。為了解決這些難點,針對不同的應用方向,人們對傳統(tǒng)的算術編碼方法進行了改進,在保證足夠精度的前提下,提高了編碼速度。基于算術編碼算法人們提出了二進制自適應的算術編碼以及mq算術編碼器,分別在軟件及硬件上提高編碼的效率。4.3 算術編碼的實現(xiàn)過程 算術編碼在圖像數(shù)據(jù)壓縮標準(如jpeg,jbig)中扮演了重要的角色15。在算術編碼中,消息用0到1之間的實數(shù)進行編碼,算術編碼用到兩個基本的參數(shù):符號的概率和它的編碼間隔。信源符號的概率決定壓縮編碼的效率,也決定編碼過程中信源符號的間隔,而這些間隔包含在0到1之間,編碼過程中
44、的間隔決定了符號壓縮后的輸出。在算術編碼的過程,實際上就是依據(jù)信源符號的發(fā)生概率對碼區(qū)間分割的過程。 以信號s=bcbabbadca為例介紹,其中信源符號集為a,b,c,d。(1)統(tǒng)計信源符號出現(xiàn)的概率,將0,1)設為當前分析區(qū)間。按信源符號的概率序列在當前分析區(qū)間劃分比例間隔,如圖4.1所示:abcd0.30.40.20.1 0 0.3 0.7 0.9 1 圖4.1 信源符號比例間隔劃分在這里引入累計概率密度函數(shù)來描述信源符號在分析區(qū)間的上界: cdf()= (4-1)其中表示第i個信源符號,p()表示xi的概率。則有:cdf(a) = 0.3 cdf(b) =cdf(a) +p(b)=0.
45、3+0.4=0.7 cdf(c) = cdf(b)+p(c)=0.7+0.2=0.9 cdf(d) =cdf(c) +p(d)=0.9+0.1=1 (2)讀入信源si,找到其在當前分析區(qū)間的比例間隔,將此間隔作為新的當前分析區(qū)間。若si=b,則其所在的比例間隔為cdf(a)和cdf(b)之間的區(qū)域,如圖4.2所示:abcd0.30.40.20.1 0 0.3 0.7 0.9 1 0 0.3 0.7 0.9 1 圖4.2 信元所在區(qū)間示意 (3)仍然按照信源符號的概率序列在當前分析區(qū)間劃分比例間隔,然后重復第二步,直到所有的信元輸入完畢為止。如圖4-3所示:abcd0.30.40.20.1 0
46、0.3 0.7 0.9 1 0.3 b 0.7 0.58 c 0.66 0.604 b 0.636 0.604 a 0.6136 0.60688 b 0.61072 0.608032 b 0.609568 0.608032 a 0.6084928 0.60844672 d 0.6084928 0.608478976 c 0.608488192 圖4.3 算術編碼過程 (4)以最后的當前分析區(qū)間內(nèi)的任意一個數(shù)作為編碼輸出。例如本例就可以選擇0.608478976和0.6084817408之間的一個小數(shù)0.6084798作為信號的編碼輸出。4.4算術編碼的實現(xiàn)及評價4.4.1 編碼結果實驗程序見附錄c實驗結果如下:原始圖像大小 name size bytes class i 256x256 524288 uint8 arraygrand total is 196608 elements using 524288 bytes編碼圖像大小 name size bytes class j 256x256 196608 double arraygrand total is 65536 elements using 19
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度林業(yè)土地入股合作開發(fā)合同范本
- 二零二五年度土雞蛋綠色包裝采購合同范本3篇
- 二零二五年度有聲讀物配音制作合同范本
- 二零二五版木地板行業(yè)綠色生產(chǎn)標準認證合同4篇
- 2025年度配音演員與兒童節(jié)目聘用合同范本3篇
- 二零二五年度文化創(chuàng)意產(chǎn)業(yè)農(nóng)民工就業(yè)合同范本3篇
- 2025年度新型幼兒教育機構教師聘用合同范本
- 二零二五年度創(chuàng)業(yè)投資公司融資合同范本
- 二零二四年度醫(yī)院兒科醫(yī)師派遣合同3篇
- 2025年度鋼管腳手架內(nèi)外施工質(zhì)量保障合同
- 《健康體檢知識》課件
- 2023年護理人員分層培訓、考核計劃表
- 生產(chǎn)計劃主管述職報告
- GB/T 44769-2024能源互聯(lián)網(wǎng)數(shù)據(jù)平臺技術規(guī)范
- 【經(jīng)典文獻】《矛盾論》全文
- 部編版語文五年級下冊 第一單元 專項訓練課外閱讀(含答案)
- 大美陜西歡迎你-最全面的陜西省簡介課件
- 給男友的道歉信10000字(十二篇)
- 客人在酒店受傷免責承諾書范本
- 練字本方格模板
- 《老山界》第1第2課時示范公開課教學PPT課件【統(tǒng)編人教版七年級語文下冊】
評論
0/150
提交評論