01拉普拉斯金字塔壓縮圖像編碼_第1頁
01拉普拉斯金字塔壓縮圖像編碼_第2頁
01拉普拉斯金字塔壓縮圖像編碼_第3頁
01拉普拉斯金字塔壓縮圖像編碼_第4頁
01拉普拉斯金字塔壓縮圖像編碼_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、拉普拉斯金字塔壓縮圖像編碼摘要:我們描述一種圖像編碼技術(shù),以與多尺度運算相同形狀的算子作為基本函數(shù)。與已建立的技術(shù)不同,該表示方法的代碼元素在頻域和空域同時建立。像素間的相關(guān)性,通過從圖像自身減去一個通過了低通濾波器的該圖像黨的副本而去除。由于差異或誤差的存在,結(jié)果是一個凈數(shù)據(jù)壓縮,圖像具有較低的方差、熵,低通濾波過的圖像可能代表了減少后的采樣密度。進一步的數(shù)據(jù)壓縮是通過對差分圖像的量化獲得的。重復這些步驟對通過低通濾波器的圖象進一步壓縮。在迭代的過程適當?shù)貙Τ叨冗M行擴大就得到了金字塔數(shù)據(jù)結(jié)構(gòu)。該編碼過程相當于對圖像進行拉普拉斯多尺度運算抽樣,因此,該代碼往往加強顯著的圖像特征。另外一個優(yōu)點是

2、現(xiàn)在的編碼適合許多圖像分析任務,對圖像壓縮同樣適用。文中也給出了該算法的快速算法的編解碼過程。簡介圖像一個共同的特點就是相鄰像素間具有很強的相關(guān)性。因此,用像素值來表示圖像效率是非常差的。大部分的編碼信息是多余的。首要的任務就是設計一個高效的、壓縮編碼就是要找到一種表示方,有效地去除圖像像素間的相關(guān)性。這通過預測編碼和變換技術(shù)已經(jīng)達到。在預測編碼中,在一個柵格格式里像素采用順序編碼。然而,每一個像素編碼之前,先對它的編碼值進行預測,而這種預測是通過前述的同一柵格線中先前的預測編碼的像素得到的。預測的像素值代表了冗余信息,實際像素減去該預測的像素值,只對差異或者是預測誤差進行編碼。因為以前只有編

3、碼像素用于預測每個象素的值,這個過程被說成是因果關(guān)系。限制因果預測解碼便捷行的因素是:給定像素其預測像素值是由已經(jīng)編碼了的相鄰像素反復計算得到的,增加了存儲的預測誤差。非因果預測中,基于相鄰像素的對稱性,每個像素均為中心,應該得到更加準確的預測值和更大的數(shù)據(jù)壓縮量。然而,這種方法不允許簡單的順序編碼。非因果預測圖像編碼方法通常涉及到圖像變換或是解決大數(shù)量的聯(lián)立方程。與順序編碼方式不同,該技術(shù)采用一次性編碼或是分塊編碼。預測和變換技術(shù)都具有自己的優(yōu)點。前者的實現(xiàn)相對簡單,適應當?shù)氐膱D像特征。后者通常適用于大的數(shù)據(jù)壓縮,但是計算量相當?shù)拇?。這里我們將描述一種新的用于去除圖像特征相關(guān)性的技術(shù),該技術(shù)

4、結(jié)合了預測和變換方法的特點。這項技術(shù)是非因果的,但計算相對簡單一般。每個像素值的預測值的計算由加權(quán)平均法計算,該方法集中在像素本身使用單峰類高斯(或雙峰相關(guān))權(quán)函數(shù)。首先對圖像和權(quán)重函數(shù)進行卷積得到了所有像素的預測值。結(jié)果得到一個低通濾波圖像,然后從源圖像中減去。設為原始圖像,是應用了適當?shù)牡屯V波器后的結(jié)果,預測誤差可由下式得到:我們不對進行編碼,而對和進行編碼。結(jié)果得到的是凈數(shù)據(jù)壓縮原因:a)是大范圍不相關(guān)的,所以描述像素比所用的比特數(shù)少;b)是經(jīng)過低通濾波的,所以采用了降低了的采樣速率來進行編碼。數(shù)據(jù)的進一步壓縮是通過迭代過程獲得的。通過低通濾波產(chǎn)生g2同時得到第二個誤差圖像。重復這些步

5、驟,我們獲得了一個二維序列。由于采樣密度的減小,我們實現(xiàn)的數(shù)據(jù)每一個都比其前一個減少了1 / 2個尺度因數(shù)?,F(xiàn)在,如果我們想象這些數(shù)組中的數(shù)據(jù)一個在另一個上面疊加,結(jié)果就是一個逐漸變細的金字塔數(shù)據(jù)結(jié)構(gòu)。金字塔中各節(jié)點的值代表兩類高斯函數(shù)之間的差異或與原始圖像相卷積的相關(guān)函數(shù)。這兩個函數(shù)的不同之處類似于常用在圖像增強中的“拉普拉斯”算子。因此,我們提出了圖像壓縮拉普拉斯金字塔代碼。上面概述的編碼方案只適用于可以進行有效的濾波計算的算法中。一個合適的快速算法已經(jīng)發(fā)展完善,將在下一節(jié)中進行描述。高斯金字塔拉普拉斯金字塔編碼的第一步就是將原始圖像進行低通濾波得到圖像。因為分辨率和采樣密度的降低所以我們

6、說是減少了的版本。類似的我們從得到減少的版本,一次這樣下去。濾波相當于一個與一族對稱的加權(quán)函數(shù)進行卷積的程序。這個家族中重要成員與高斯概率分布相似,所以圖像序列被稱為高斯金字塔。在下一子部分中將會介紹高斯金字塔產(chǎn)生的快速算法。我們在接下來的子部分中對同一算法如何通過采樣點插值法來擴展圖像序列進行。這種裝置在這里用來幫助實現(xiàn)高斯金字塔各層原件的可視化,在下一節(jié)里定義了拉普拉斯金字塔。高斯金字塔的產(chǎn)生假設原始圖像由c行r列的像素數(shù)組組成。每個像素用介于0和k 1之間的整數(shù)代表在相應的圖像點的光強度。這幅圖像成為高斯金字塔底部或零水平。金字塔的一級包含圖像,該圖像是降低的或通過低通濾波版的圖像。每個

7、1級內(nèi)部的值都是在一個的窗口內(nèi)經(jīng)過加權(quán)平均計算的值。代表g2圖像的2級中,每個值都是由一級的各值采用同樣的權(quán)重模式獲得的。圖1給出了這一過程的一維圖形表示法。權(quán)函數(shù)的大小并不統(tǒng)一。我們選出了的模板,因為它以較低的計算代價提供足夠的濾波效果。這種由層到層得過程稱為reduce操作:那么,就可以得到在層中,點,其中,的值為:n代表金字塔的層數(shù),是第層得維數(shù)。如圖1,在一維中采樣點的密度減少了一半,或是說二維中層與層之間減少到了。原始圖像的維數(shù)與金字塔的結(jié)構(gòu)是相適應的,存在這樣的整數(shù)滿足:(例如,如果都是3,n=5,則圖像為97*97像素)。的維數(shù)是。高斯金字塔圖1 代表高斯金字塔生成過程的一維圖形

8、。每一橫排點代表在金字塔同一層中的節(jié)點。在零層中每個節(jié)點的值只是圖像相關(guān)像素的灰度級。高層中各節(jié)點的值是相鄰低層中節(jié)點值的加權(quán)平均。注意,隨層數(shù)的增加節(jié)點間距以2n變化,但是使用同一權(quán)重模型或“生成核”來生成所有的層。生成核注意我們使用權(quán)重為的模型來生成金字塔,這個權(quán)重模型稱之為生成核,滿足一些限制條件:可分離性:一維,長為5,歸一化函數(shù):對稱性:另外一個附加條件叫做等值貢獻,必須保證給定層的節(jié)點會為高一層的節(jié)點貢獻相同的權(quán)重值。設這種情況下等值貢獻需要滿足。當滿足這3個限制條件時:等權(quán)值函數(shù)金字塔的迭代產(chǎn)生等價于圖像與一系列的等權(quán)值函數(shù)進行卷積:或者圖2 高斯金字塔的第1,2,3和無限多層的

9、節(jié)點等權(quán)值函數(shù)。為了增加對比度用因子2對坐標軸范圍進行調(diào)節(jié)。這里的生成核參數(shù)a是0.4,產(chǎn)生的等權(quán)函數(shù)與高斯分布的概率密度函數(shù)相似。等權(quán)值函數(shù)的值每一層都是上一層的2倍,采樣間隔也同樣每一層是上一層的2倍。圖2所示高斯金字塔的等權(quán)值函數(shù)的1,2,3層。當a=0.4 時,等值函數(shù)的圖形迅速收斂為一個具有連續(xù)更高層金字塔的特征形式,所以只有范圍上的變化。然而,這種形狀的選擇取決于生成核的參數(shù)a。圖3為4個不同a參數(shù)下的特征形狀。需要注意的是,尤其gaussian-like等價權(quán)函數(shù)當一個= 0.4。當一個= 0.5的形狀是三角形;當一= 0.3它就是奉承和更廣闊的比高斯。用= 0.6中央的正離子模

10、式正急劇尖頂,兩側(cè)是負葉小。當a=0.4時等權(quán)值函數(shù)的形狀與高斯函數(shù)最相似;a=0.5時等權(quán)值函數(shù)是三角形的;a=0.3時它的圖形比高斯函數(shù)圖形寬,胖;a=0.6時中央位置的模型是陡而尖的,兩側(cè)只有小的負葉。快速傅里葉變換圖像和等價權(quán)函數(shù)卷積的效果就是對圖像進行低通濾波,使圖像變的模糊。金字塔算法通過層與層間的八倍頻程降低了濾波器的帶寬限制和采樣間隔。這是一種速度非??斓乃惴?僅僅需要比用快速傅里葉變換計算單一濾波的圖像更少的計算步驟來計算一系列的濾波圖像。例:圖四展示了當a=0.4時指定高斯金字塔的各級分量。左邊第一個的原始圖像,可以分為257257的度量形式。這就是第0級金字塔。由于樣本灰

11、度的降低,每一個更高層次的數(shù)組在大小上都是前者的一半。圖3 等權(quán)值函數(shù)的形狀由參數(shù)a的值決定。當a=0.5,函數(shù)呈三角狀;當a=0.4,函數(shù)接近高斯圖形;當a=0.3,函數(shù)比高斯函數(shù)更加平緩;當a=0.6,函數(shù)呈三峰狀。高斯金字塔內(nèi)插法現(xiàn)在定義一個與壓縮函數(shù)作用相反的擴展函數(shù)。這個函數(shù)的作用是通過在給定(m+1)(n+1)矩陣中的任意兩個數(shù)之間添加新的數(shù)值,形成一個新的(2m+1)(2n+1)矩陣。如此一來,對高斯金字塔中的擴展將會得到一個與同樣大小的。假設是擴展了n次的結(jié)果,那么得到: 通過擴展得到:,其中,這個公式只有在(i-m)/2及(j-n)/2都為整數(shù)的情況下才成立。如果對擴張了次,

12、就會得到與初始圖像相同尺寸的。雖然在圖像編碼中不會使用充分的擴展,還是可以在金字塔結(jié)構(gòu)內(nèi)利用擴展來促使各種不同矩陣的成分變得直觀。圖5的第一行展示了通過對圖四中各級金字塔擴展所得到的圖像,高斯金字塔的低通濾波效應在此處得到了很好的體現(xiàn)。拉普拉斯金字塔回顧前文,本文目的是建立能夠預測原始圖像g0的預測像素值的壓縮圖像g1。為得到壓縮表達式,將誤差圖像進行編碼,該誤差圖像由擴展的g1減去g0得到,為拉普拉斯金字塔的最底層。由同樣方法將g1編碼得到下一層?,F(xiàn)在定義拉普拉斯金字塔,然后分析其特點。構(gòu)建拉普拉斯金字塔拉普拉斯金字塔是誤差圖像l0,l1l,ln的序列,每個值是高斯金字塔兩層之間的差值。對于

13、0 = l n,由于不存在gn的預測圖像gn+1,所以令等價權(quán)重函數(shù)拉普拉斯金字塔的每個值是兩個等價權(quán)值函數(shù)與原始圖像卷積后的差值,這類似于用一個適當大小的拉普拉斯權(quán)重函數(shù)與圖像卷積。通過這種方法可以直接獲得節(jié)點值,但計算復雜度較大。我們可以把高斯金字塔看做是原始圖像經(jīng)過低通濾波器的結(jié)果,把拉普拉斯金字塔看作是原始圖像經(jīng)過帶通濾波器的結(jié)果。每一層拉普拉斯算子規(guī)模都是上一層的兩倍,而帶通濾波器的中心頻率會逐次減小一個倍頻程。為了得到拉普拉斯金字塔的具體內(nèi)容,可在樣本點之間進行插值,這可以由高斯插值得到。設為公式(2)得到的擴展n次的結(jié)果。是原始圖像的大小。圖4中的擴展拉普拉斯金字塔等級顯示在圖5

14、的底層。注意到如邊緣和條狀等圖形特征出現(xiàn)增強。擴展的特征按照大小分類:突出細節(jié),在更高層的圖像中這些特征逐步粗糙。解碼可以通過擴展恢復出原始圖像,然后將拉普拉斯金字塔各層相加:一個更有效的步驟是擴展ln并將結(jié)果與ln-1相加,然后再次擴展并與ln-2相加,重復這步知道第0蹭,g0便得到恢復。該過程是拉普拉斯金字塔產(chǎn)生的逆過程。由公式(3)可得:對于,熵如果我們假設描述圖像像素的值在統(tǒng)計上是獨立的,那么,圖像單位像素精確解碼所需的最小比特數(shù)就可以通過像素值分布熵給出。該優(yōu)化可以通過類似變長編碼的技術(shù)實現(xiàn)。lady圖像像素值的直方圖在圖6(a)中顯示。如果我們設這些觀察到的每一灰度級的發(fā)生頻率是在

15、這個及其他類似的圖像中發(fā)生概率的估計值,那么改進的熵值可由下式給出: 圖6 在編碼過程的不同階段像素的灰度值分布。原始圖像的直方圖如圖(a)。(b)-(e)給出了a=0.6時laplacian金字塔 0 3級的直方圖。量化后每一層的直方圖在f-i中顯示。注意,拉普拉斯金字塔中的像素值集中在近零區(qū)域,允許通過可變長度編碼和縮短進行數(shù)據(jù)壓縮。實質(zhì)性上,進一步壓縮通過量化(尤其在金字塔低層)和降低采樣密度(金字塔高層)。當原始圖像灰度級為256,所有的灰度級基本同等可能的情況下得到圖像的最大熵為8。實際的lady圖像的熵略小,為7.57。在拉普拉斯金字塔中,從每個圖像像素減去預測值的技術(shù),移除大部分

16、像素間的相關(guān)性。去相關(guān)同時導致像素值在0范圍的集中,因此降低方差和熵。這些措施將在何種程度上減少取決于金字塔產(chǎn)生中參數(shù)值a的值(見圖7)。我們發(fā)現(xiàn)在我們的例子中a=0.6時減少的最多。高斯金字塔的級別在這一直時變得比其他較小的值如0.4時明快。而當a=0.4時能夠得到更好的類高斯等權(quán)值函數(shù)。因此,選擇a= 0.6不僅感性上計算上也有優(yōu)點。前四層拉普拉斯金字塔融合算法和他們的直方圖如圖6(b)-(e)。每一層的方差和熵也在圖中顯示。通常,,發(fā)現(xiàn)這些物理量逐層增加,如例所示。量化對拉普拉斯金字塔每一層的像素值進行量化可以大幅度降低其熵值。這引入了量化誤差,但通過選擇合適的量化電平的數(shù)量和分布,可以

17、將誤差降低到觀察者幾乎難以察覺出來。這個用統(tǒng)一的量化算法來分析這一過程。像素值的范圍分為n個插值,像素的量化值是包含在內(nèi)的插值的中間值:,量化圖像通過擴展和步驟(4)中用c值代替l值的加和進行重建。lady圖像的量化結(jié)果如圖6f-i。每一層的插值通過增加n值直到能夠在大于圖像寬度(像素間距約為3微?。┪灞兜木嚯x外察覺到圖像降級為止。注意插值的大小在高層(低空間頻率)變小。給定金字塔塔層插值的大小反映了人類觀察者對該層空間頻帶上相對誤差的敏感程度。人類對低和中等空間頻率的相對擾動相當敏感,但對高空間頻率的擾動相對不敏感3,4和7。上面提到的方法中數(shù)據(jù)方差的增加導致觀察者靈敏度也隨之增加,這意味著

18、高層金字塔的量化等級必須比低層金字塔中多。幸運的是, 由于低的采樣密度,這些像素對整個圖像的比特率起不了太大作用。低層(高頻)像素,經(jīng)過了細致取樣,可以進行粗糙量化。結(jié)論編碼、量化和重建的最后結(jié)果如圖8。原先的lady圖像顯示出如圖8(a);編碼視圖顯示如圖8(b),效率為1.58bits/像素。我們假設變長碼字編碼用來代替非均勻分布的點的值,所以對于一個給定的金字塔層來說比特率是其水平估計樣本熵乘以它的采樣密度,圖像比特率是所有層的總和。對沃爾特圖像進行同樣的程序處理,原圖像如圖8(c),如圖8(d)是在0.73比特/像素效率編碼的視圖。這兩種情況下,在前文所述的瀏覽狀態(tài)下,經(jīng)編碼的圖像幾乎

19、與原圖像是區(qū)分不開的。漸進式傳輸從文中我們還應該能看出,拉普拉斯金字塔融合算法代碼尤其適合循序漸進圖像傳輸。在這種類型的傳輸圖像的一個粗略譯碼是首先傳送給接收者的影像內(nèi)容的一個早期印象,然后后續(xù)的傳輸提供了具有更細分辨率的影像細節(jié)5。只要圖像的內(nèi)容被識別或者是可以明顯看出圖像不是所需要的,觀察者可以終止圖像的傳輸。為了達到漸進式傳輸,金字塔最頂層水平的代碼是首先傳送,并且在金字塔的接收過程中被擴大了,形成一個初步、粗略的圖像。下一層次隨后被傳送,被擴大,并且被添加到第一個等等。在接收過程結(jié)束的時候,最初的圖像就顯得很模糊,但是逐漸變得清晰。這個漸進的過程正如圖9中,從左至右所示。值得注意的是,雖然

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論