



版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、信息論與編碼技術(shù)論文【關(guān)鍵詞】信息 編碼技術(shù)數(shù)字圖像1 引言數(shù)字圖像處理又稱為計算機圖像處理,它是指將圖像信號轉(zhuǎn)換成數(shù)字信號并利用計算機對其進行處理的過程。早期圖像處理的目的是改善圖像的質(zhì)量,它以人為對象,以改善人的視覺效果為目的。圖像處理中,輸入的是質(zhì)量低的圖像,輸出的是改善質(zhì)量后的圖像。常見的圖像處理有圖像數(shù)字化、圖像編碼、圖像增強、圖像復原、圖像分割與圖像分析等。圖像編碼是對圖像信息進行編碼,可以壓縮圖像的信息量,以便滿足傳輸與存儲的要求。本研究主要介紹了圖像編碼的基本原理和技術(shù)方法。一幅二維數(shù)字圖像可以由一個二維亮度函數(shù)通過采樣和量化后而得到的一個二維數(shù)組表示。這樣一個二維數(shù)組的數(shù)據(jù)量
2、通常很大,從而對存儲、處理和傳輸都帶來了許多問題,提出了許多新的要求。為此人們試圖采用對圖像新的表達方法以減少表示一幅圖像需要的數(shù)據(jù)量,這就是圖像編碼所要解決的主要問題。壓縮數(shù)據(jù)量的主要方法是消除冗余數(shù)據(jù),從數(shù)學角度來講是要將原始圖像轉(zhuǎn)化為從統(tǒng)計角度看盡可能不相關(guān)的數(shù)據(jù)集。這個轉(zhuǎn)換要在圖像進行存儲、處理和傳輸之前進行,然后將壓縮了的圖像解壓縮以重建原始圖像,即通常所稱的圖像編碼和圖像解碼。圖 1 給出了一個通用的圖像編碼系統(tǒng)模型,這個模型主要包括 2 個通過信道級連接的結(jié)構(gòu)模塊:編碼器和解碼器。當一幅輸入圖像送入編碼器后,編碼器根據(jù)輸入數(shù)據(jù)進行信源編碼產(chǎn)生一組信號,這組信號在進一步被信道編碼器
3、編碼后進入信道。通過信道傳輸后的碼被送入信道解碼器和信源解碼器,解碼器重建輸入的圖像。一般來說,輸出圖是輸入圖的精確復制,那么系統(tǒng)是無失真的或者信息保持型的;否則,稱系統(tǒng)是信息損失的。信源編碼器的作用是減少或消除輸入圖像中的編碼冗余、像素間冗余及心理視覺冗余。盡管信源編碼器的結(jié)構(gòu)與具體應(yīng)用和對保真度的要求有關(guān),但一般情況下信源編碼器包括順序的3 個獨立操作,而對應(yīng)的信源解碼器包含反序的2 個獨立操作 ( 圖 2) 。在信源編碼器中,映射器將輸入數(shù)據(jù)變換以減少表達圖像的數(shù)據(jù),這與具體編碼技術(shù)有關(guān)。量化器根據(jù)給定的保真度準則減少映射器輸出的精確度。這個操作可以減少心理冗余,但不可翻轉(zhuǎn)。符號編碼器產(chǎn)
4、生表達量化器輸出的碼本,并根據(jù)碼本輸出。符號編碼器編碼為了減少冗余,這個操作是可以反轉(zhuǎn)的。當信道是有噪聲的或者容易產(chǎn)生誤差時,信道編碼器和信道解碼器對這個編解碼過程是非常重要的。由于信源編碼器的輸出數(shù)據(jù)一般只有很少的冗余,所以他們對傳輸噪聲很敏感。信道編碼器通過把可控制的冗余加入信源編碼器后的碼字以減少信道噪聲的影響。2 傳統(tǒng)編碼方法傳統(tǒng)的編碼方法可以分成兩大類,預測編碼方法( 對應(yīng)空域方法 ) 和變換編碼方法 ( 對應(yīng)頻域編碼方法 ) 。預測編碼方法的優(yōu)點是:算法一般較簡單,易于用硬件實現(xiàn);缺點是:壓縮比不夠大,承受誤碼的能力較差。由于它采用的最小均方誤差準則不能反映人眼的視覺心理特性,近年
5、來已較少單獨采用,而是與其他方法混合使用。另外,由于 DPCM編碼系統(tǒng)會引起斜率過載、界線繁忙、顆粒噪聲和輪廓噪聲,在使用中應(yīng)加以考慮。變換編碼方法的優(yōu)點是:壓縮比高、承受誤碼能力強;缺點是:算法較復雜。3 現(xiàn)代編碼方法31 第二代圖像編碼方法第二代圖像編碼方法 2是針對傳統(tǒng)編碼方法中沒有考慮人眼對輪廓、邊緣的特殊敏感性和方向感知特性而提出的。它認為傳統(tǒng)的第一代編碼技術(shù)以信息論和數(shù)字信號處理技術(shù)為理論基礎(chǔ),出發(fā)點是消除圖像數(shù)據(jù)的統(tǒng)計冗余信息,包括信息熵冗余、空間冗余和時間冗余。其編碼壓縮圖像數(shù)據(jù)的能力已接近極限,壓縮比難以提高。第二代圖像編碼方法充分利用人眼視覺系統(tǒng)的生理和心理視覺冗余特性以及
6、信源的各種性質(zhì)以期獲得高壓縮比,這類方法一般要對圖像進行預處理,將圖像數(shù)據(jù)根據(jù)視覺敏感性進行分割。按處理方法的不同,第二代圖像編碼方法可分為兩種典型的編碼技術(shù)3:一種是基于分裂合并的方法,先將圖像分為紋理和邊緣輪廓,然后各自采用不同的方法編碼;另一種是基于各向異性濾波器的方法,先對圖像進行方向性濾波,得到不同方向的圖像信息,再根據(jù)人眼的方向敏感性對各個通道采用特定的方法單獨編碼。32 分形圖像編碼分形圖像編碼是在分形幾何理論的基礎(chǔ)上發(fā)展起來的一種編碼方法。分形理論是歐氏幾何相關(guān)理論的擴展,是研究不規(guī)則圖形和混沌運動的一門新科學。它描述了自然界物體的自相似性,這種自相似性可以是確定的,也可以是統(tǒng)
7、計意義上的。這一理論基礎(chǔ)決定了它只有對具備明顯自相似性或統(tǒng)計自相似性的圖像,例如海岸線、云彩、大樹等才有較高的編碼效率。而一般圖像不具有這一特性,因此編碼效率與圖像性質(zhì)學特性有關(guān),而且分形圖像編碼方法實質(zhì)上是通過消除圖像的幾何冗余來壓縮數(shù)據(jù)的,根本沒有考慮人眼視覺特性的作用。33 基于模型的圖像編碼基于模型的圖像編碼技術(shù) 4是近幾年發(fā)展起來的一種很有前途的編碼方法。它利用了計算機視覺和計算機圖形學中的方法和理論,其基本出發(fā)點是在編、解碼兩端分別建立起相同的模型,針對輸入的圖像提取模型參數(shù),或根據(jù)模型參數(shù)重建圖像。模型編碼方法的核心是建模和提取模型參數(shù),其中模型的選取、描述和建立是決定模型編碼質(zhì)
8、量的關(guān)鍵因素。為了對圖像數(shù)據(jù)建模,一般要求對輸入圖像要有某些先驗知識?;谀P偷膱D像編碼方法是利用先驗模型來抽取圖像中的主要信息,并以模型參數(shù)的形式表示它們,因此可以獲得很高的壓縮比。然而在模型編碼方法的研究中還存在很多問題,例如: ?模型法需要先驗知識,不適合一般的應(yīng)用; ?對不同的應(yīng)用所建模型是不一樣的; ?在線框模型中控制點的個數(shù)不易確定,還未找到有效的方法能根據(jù)圖像內(nèi)容來選??; ?由于利用模型法壓縮后復原圖像的大部分是用圖形學的方法產(chǎn)生的,因此看起來不夠自然; ?傳統(tǒng)的誤差評估準則不適合用于對模型編碼的評價。34 神經(jīng)網(wǎng)絡(luò)圖像編碼在圖像編碼的各種方法中,除信息保持型編碼方法外,其余所有
9、方法始終沒有解決好如何充分利用人的視覺特性這個問題,神經(jīng)網(wǎng)絡(luò)圖像編碼 5試圖在此有所突破,現(xiàn)在直接用于圖像壓縮的神經(jīng)網(wǎng)絡(luò)主要有BP網(wǎng)絡(luò)和自組織映射神經(jīng)網(wǎng)絡(luò)。采用BP網(wǎng)絡(luò)實現(xiàn)數(shù)據(jù)壓縮好比是強迫數(shù)據(jù)通過細腰型網(wǎng)絡(luò)的瓶頸,并期望在網(wǎng)絡(luò)的瓶頸處能獲得較緊湊的數(shù)據(jù)表示。圖 3 給出了 BP網(wǎng)絡(luò)進行數(shù)據(jù)壓縮的原理,這是一nmn型三層 BP神經(jīng)網(wǎng)絡(luò)。輸入層有 n 個神經(jīng)元,通過 BP訓練算法,在網(wǎng)絡(luò)的學習過程中調(diào)整網(wǎng)絡(luò)的權(quán)重,使訓練集圖像的重建誤差E=X- Z2均值達到最小 (X 為輸入層樣本集, Z 為輸出層樣本集 ) ,或者說,使重建圖像在均方誤差意義上盡可能地相似于原始圖像。訓練后的神經(jīng)網(wǎng)絡(luò)便可用來進
10、行圖像壓縮,隱層神經(jīng)元矢量Y 為壓縮結(jié)果。自組織映射神經(jīng)網(wǎng)絡(luò)中的神經(jīng)元可以自動地根據(jù)外部刺激的興奮點來調(diào)整自己在由外界信號決定的參數(shù)空間中的位置。以一種雙層神經(jīng)網(wǎng)絡(luò)為例:其中輸入層神經(jīng)元(x1,x2,x3,xn) 簡單地反映著外部刺激,在輸出層中, M個神經(jīng)元排布成二維網(wǎng)絡(luò),其中每個神經(jīng)元j 接收兩類輸入:來自輸入層神經(jīng)元 i 的輸入 xi( 權(quán)重為 Wij) 和來自輸出層神經(jīng)元的固定權(quán)重。對每一個外界輸入矢量 X=(x1,x2,x3,xn) ,只有一個同該輸入的距離d1=f(X,Wj),Wj=(W1j,W2j,W3j,Wnj)為最小的神經(jīng)元j 才被激發(fā)。其中,距離函數(shù) f(X,Wj) 反映了
11、在某一準則 ( 一般為平方誤差準則 ) 下,矢量 X 與 Wj 之間的距離。在網(wǎng)絡(luò)的訓練中我們只需要提供輸入矢量 X,通過調(diào)整從公共的外部輸入到每個神經(jīng)元 j 的連接權(quán)重 Wj,權(quán)重矢量將逐漸指向輸入矢量空間的聚類。從而實現(xiàn)了輸入空間的維數(shù)壓縮,完成了類似于矢量量化的功能。35 小波圖像編碼一維連續(xù)小波變換可看成原始信號和一組不同尺度的小波帶通濾波器的濾波運算,從而可把信號分解到一系列頻帶上進行分析處理。將其離散化后即為離散小波變換。小波變換圖像編碼壓縮 6的核心問題是要對子帶圖像進行小波分解系數(shù)的量化和編碼。低頻子帶圖像包含原圖像的大部分能量,即包含圖像的基本特性。它在圖像重構(gòu)算法中起主導作
12、用,對重建圖像的質(zhì)量有很大影響,因此這部分信號應(yīng)精確保留。高頻子圖像的系數(shù)分布符合廣義高斯分布,對其系數(shù)進行粗量化編碼較為有效。這也完全符合人的視覺特性,根據(jù)對人眼視覺系統(tǒng)的研究可知,人眼視覺靈敏度具有明顯的低通特性,而且對不同方向上的敏感度也不一樣,尤其是對傾斜方向的刺激不太敏感,如人眼對對角線方向子圖像系數(shù)誤差敏感度較低,因此可對對角線方向子圖像進行粗量化高壓縮。小波變換后的能量主要集中在低頻系數(shù)分量,而其他高頻系數(shù)分量大多為零值,這為高倍率壓縮提供了可能。通過選擇合適的具有平滑特性小波基,就可消除重建圖像中出現(xiàn)的方塊效應(yīng),減小量化噪聲,獲得較好的重建圖像質(zhì)量。小波變換圖像編碼壓縮方法可分
13、為如下兩大類:基于傳統(tǒng)的圖像編碼方法和基于分形理論的小波變換圖像編碼方法?;趥鹘y(tǒng)的圖像編碼方法 7包括:零樹小波編碼、基于塔式網(wǎng)絡(luò)矢量量化的小波變換編碼、基于 LBG算法的小波變換編碼、基于標量量化的小波變換編碼等。由于不同分辨率級子圖像之間存在著相似性,因此,利用此相似性,可提高壓縮比 8。采用零樹自嵌套編碼方法,對小波分解系數(shù)進行壓縮,在 PSNR=27.54dB的情況下,獲得壓縮比為 128?1。這是最著名的一種小波變換圖像編碼壓縮方法。該方法的優(yōu)點是:與傳統(tǒng)的 DCT編碼相比,它既可以克服方塊效應(yīng),又可以在低比特率下獲得較好的圖像主觀質(zhì)量。缺點是:由于它對各子帶采用相同的門限量化,因
14、此不能充分利用人眼的視覺特性,限制了圖像壓縮比的進一步提高。對此,A.Said 等人提出了改進算法。針對分形圖像編碼尚存在的缺點,如編碼算法的耗時、自然圖像不一定具有嚴格的分形結(jié)構(gòu)而無法達到預期的高壓縮比、高壓縮倍率時的方塊效應(yīng)等,有人提出了基于小波變換的分形編碼9。它具有以下特點: ?采用平滑小波可去除傳統(tǒng)分形變換中存在的方塊效應(yīng);?小波表示使圖像的四叉樹分割十分自然;?可將零樹算法看成是該算法的一個特例。圖像經(jīng)過金字塔形離散小波變換后的系數(shù)在小波域內(nèi)可組成分層樹狀數(shù)據(jù)結(jié)構(gòu)小波樹。這些跨越不同分辨率的小波樹之間存在一定的相似性,可通過分形變換來描述。基于小波變換的分形壓縮過程就是一個由分層樹
15、狀結(jié)構(gòu)的頂部開始一層層地向下預測其余系統(tǒng)的過程,而這個由上至下、由粗至細的預測過程是通過分形編碼來實現(xiàn)的?;谛〔ㄗ儞Q的圖像編碼壓縮的特點是 10:壓縮比高、壓縮速度快,壓縮后能保持信號與圖像的特征不變,且在傳遞過程中就可以抗干擾。從現(xiàn)在的研究結(jié)果可看到,該方法已獲得了較好的編碼效果,是現(xiàn)代圖像壓縮技術(shù)研究的熱點之一,也是十分有前途的一種方法。4 結(jié)束語本研究介紹了圖像編碼的基本原理,傳統(tǒng)的圖像編碼方法和幾種比較新的編碼方法。第二代圖像編碼將視覺特性引入到圖像編碼技術(shù),分形圖像編碼是以分形幾何理論為基礎(chǔ),基于模型的圖像編碼是利用了計算機視覺和計算機圖形學中的理論,而小波變換圖像編碼則引入了小波分析理論。盡管它們理論基礎(chǔ)不同,但它們均在不同情況下不同程度地提高了編碼質(zhì)量。相比之下,小波變換圖像編碼是一
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 課題申報書課題進度
- 前臺薪資合同范本模板
- 廈門 代建合同范本
- 公司頂層設(shè)計合同范本
- 傷殘賠償合同范本
- 品牌使用授權(quán)合同范本
- 保安與個人合同范本
- 廠房墻面翻新合同范例
- 樂器維修采購合同范例
- 合同范本合作期限
- 品管圈PDCA改善案例-降低住院患者跌倒發(fā)生率
- 財務(wù)會計(對外經(jīng)濟貿(mào)易大學)知到智慧樹章節(jié)測試課后答案2024年秋對外經(jīng)濟貿(mào)易大學
- 分布式計算平臺設(shè)計與實現(xiàn)
- 護理總帶教老師講課
- 護膚課件教學課件
- 中小學校財務(wù)制度知識培訓
- GB/T 12996-2024電動輪椅車
- T-JYBZ 020-2022《校園急救設(shè)施設(shè)備配備規(guī)范(試行)》
- 認識誠信課件教學課件
- 人教版物理八年級下冊 專項訓練卷 (一)力、運動和力(含答案)
- 房地產(chǎn)市場報告-印度尼西亞經(jīng)濟及地產(chǎn)市場簡介 202411
評論
0/150
提交評論