小波圖像壓縮方法的研究_第1頁
小波圖像壓縮方法的研究_第2頁
小波圖像壓縮方法的研究_第3頁
小波圖像壓縮方法的研究_第4頁
小波圖像壓縮方法的研究_第5頁
已閱讀5頁,還剩66頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

小波圖像壓縮方法的研究(完整版)實用資料(可以直接使用,可編輯完整版實用資料,歡迎下載)

小波圖像壓縮方法的研究小波圖像壓縮方法的研究(完整版)實用資料(可以直接使用,可編輯完整版實用資料,歡迎下載)(工程技術學院光子信息工程系電子科學與技術張曉牧)(學號:2000301054)內容提要:短時傅立葉變換作為傅立葉變換的一個重要發(fā)展,它能夠通過外加窗口展示局部信號,這對信號處理和圖象壓縮有著重要意義。以短時傅立葉變換為引導,介紹小波變換的基本原理,及其在圖像壓縮中的應用。闡述小波圖壓像縮編碼的基本原理,進行簡單的數(shù)值模擬計算,使用MATLAB軟件進行模擬實驗。關鍵詞:小波變換圖像壓縮圖像編碼教師點評:本文研究小波變換用于圖像壓縮,從理論到實現(xiàn)都有難度。論文論述清晰、分析透徹、文理通順,較好地達到了畢業(yè)設計的目的和要求,給予優(yōu)秀成績。(點評教師:曹建章,副教授)1引言自1882年傅立葉發(fā)表《熱傳導解析理論》一文以來,傅立葉變換作為信號處理領域中最完美、效果最好的一種分析手段得到了最廣泛的應用。但是傅立葉變換只是一種純頻域的分析方法,它在頻域的定位性是完全準確的,具有最高的頻域分辨率,而在時域卻無任何定位性。傅立葉變換所反映的是整個信號全部時間下的整體頻域特征,而不能提供任何局部時間段上的頻域信息。而與此相反當一個函數(shù)用脈沖函數(shù)展開時,它在時間域的定位性是完全準確的,而在頻域卻無任何定位性,就是說脈沖函數(shù)分析所反映的只是信號在全部頻率上的整體時域特征,而不能夠提供任何頻率段所對應的時間信息。對于時變信號進行分析,通常需要提取某一時段的頻域信息或某一頻段所對應的時間信息,此時傅立葉變化就不再適用了。傅立葉變換在壓縮和分析包含瞬態(tài)或局部化成分的信號與圖像時得不到最佳表示。1946年Gabor提出了加窗傅立葉變換,其基本思想為:取時間函數(shù)作為窗口函數(shù),用g(t-τ與分析函數(shù)f(t相乘,然后再作傅立葉變換。(21/4/2tgteπ??=(1在Gabor變換的基礎上為了適應不同具體問題的需要,人們還構造了多種形式的窗口函數(shù)。這一類的加窗傅立葉變換統(tǒng)稱為短時傅立葉變換(ShortTimeFourierTransform,簡稱STFT)。STFT變換雖然可以描述任一局部時間段上的頻率信息,但是由于其時頻窗口Vt與Vw不隨頻率ω和τ的變化而變化,則對于一個時變的非穩(wěn)態(tài)信號就很難找到一個“好的”時間窗口來同時適合不同的時間段,人們用一組連續(xù)變化的伸縮平移基,(atτφ來代替STFT中的窗口函數(shù),((jwtgtgteωττ?′=?,使它的時頻域窗口均隨頻率的變化而變化,以實現(xiàn)對低頻分量采用大時窗,對高頻分量采用小時窗的符合自然規(guī)律的分析方法。這種基函數(shù)在頻率和位置上同時變化著的具有有限寬度的波被稱為小波,基于它們的變換被稱為小波變換。2小波變換的基本原理小波即為小區(qū)域的波,它的寬度為有限值。小波函數(shù)的確切定義為:設(tφ為一平方可積函數(shù),也即2((tLRφ∈,若其傅立葉變換(ψω滿足條件:2(Rdωωω<∞∫(5則稱(tφ為一個基本小波或小波母函數(shù)。式(5稱為小波的可容許性條件。1)連續(xù)小波變換將小波母函數(shù)(tφ進行伸縮與平移,設其尺度因子為a,平移因子為τ,令其變換后的函數(shù)為,(atτφ則有:2,((attaaττφφ?=a>0,Rτ∈(6稱,(atτφ為依賴參數(shù)a,τ的小波基函數(shù),由于尺度因子a,平移因子τ是取連續(xù)變化的值,因此稱,(atτφ為連續(xù)小波基函數(shù),它們?yōu)橛赏荒负瘮?shù)經伸縮平移后得到的一組函數(shù)系。函數(shù)f(t以小波(tφ為基的連續(xù)小波變換即為:,,(,(,(((faaWTafttfttdtdtτττφφ∞?∞===∫(7)由連續(xù)小波的再生核方程可知,任意一個隨機信號,其連續(xù)小波變換系數(shù)在小波變換相平面上都具有一定的相關關系,相關區(qū)域大小由再生核方程給出,且隨著尺度的減小,其相關區(qū)域減小。任意函數(shù)的小波變換系數(shù)在aτ?域都必須滿足再生核方程。2)離散小波變換將小波基函數(shù)2,((attaaττφφ?=的a,τ限制在一些離散點上取值,一種最常用的離散方法就是將尺度函數(shù)按冪級數(shù)進行離散化,即取0mmaa=(m為整數(shù),0a≠1。當a=02=1時,,((attτφφτ=?。任意函數(shù)(ft的離散小波變換為:dttnmtfnmWTRf(,(,(φ∫(10離散小波變換和連續(xù)不同,在尺度——位移相平面上,它對應的是一些離散的點,因此稱之為離散小波變換。一個合理的離散小波變換,必須對所有的2(fLR∈滿足以下條件:222,,,mnmnAffBfφ≤≤∑,ABR+∈(11滿足式(11的離散函數(shù)序列,{;,}mnmnZφ∈在數(shù)學上稱為“框架”。離散小波變換實際上仍然是一系列帶通濾波器,只是帶通濾波器的中心頻率與帶寬由于a的離散采樣而成為一系列的離散值。從其再生核方程看來離散小波也具有冗余性,由于離散小波框架,{(}jktφ存在冗余性,所以離散小波變換是冗余采樣,但當框架A=B=1時,{(}jktφ就成了2(LR中的正交基。這時信號(ft的離散小波變換相當于正交分解,稱為正交離散小波變化,它是無冗余性的。3小波變換在圖像壓縮中的應用圖像是一種二維連續(xù)函數(shù),即它的亮度點是其位置的連續(xù)函數(shù),在計算機中進行數(shù)據(jù)處理,首先要在空間與亮度上對圖像進行數(shù)字化,此過程稱之為采樣,而亮度上的數(shù)字化是將所得到的圖像亮度離散為整數(shù)值,此過程稱為量化?;谛〔ㄗ儞Q的圖像壓縮方法的核心問題,其一是如何對系數(shù)矩陣進行量化,其二是如何對量化結果進行編碼,而無論何種編碼方法,都必須明顯的或隱含的表示出小波系數(shù)的位置信息(稱MapInformation)和符號、幅值信息(稱DataInformation),事實上。只要這兩者一旦確定,小波系數(shù)矩陣就確定了。圖像壓縮包括編碼和解碼兩個過程,圖像分解也就是圖像變換,其目的就是將相關性強的圖像數(shù)據(jù)變換成相關性弱的數(shù)據(jù),即變換后數(shù)據(jù)的能量盡可能的集中在少許系數(shù)上,圖像變換一般是線性變換,如小波變換等,其逆變換一定存在,圖像重構小波編碼使用的是嚴格的完全重構濾波器,并且符合正則性條件。小波編碼的基本思想為:將原始圖像經二維小波變換后轉換成小波域上的小波系數(shù),然后對小波系數(shù)進行量化編碼。離散小波變換在圖像壓縮領域的廣泛應用,其方法理論的迅速發(fā)展,主要依賴三大技術:(1)濾波器族理論。(2)分辨率或多尺度分析理論。(3)子帶編碼技術。多分辨率分析又稱為多尺度分析,是建立在函數(shù)空間概念上的理論,該理論不僅為正交小波基的構造提供了一種簡單的方法,而且為正交小波變換的快速算法提供了理論依據(jù),其思想又同多采樣濾波器族相吻合,使我們可以將小波變換同數(shù)字濾波器的理論結合起來。對于函數(shù)2(ftL∈,可以看作某一逐級逼近的極限,每級都是用某一個低通濾波函數(shù)(tφ為(ft作平滑的結果,同時逐級逼近的低通濾波函數(shù)(tφ也作逐漸伸縮,也既是說用不同的分辨率或不同的尺度來逐級逼近(ft,這就是多分辨率或多尺度分析的基本思想。子帶編碼的基本思想是,將原始信號通過一組濾波,其濾波后并抽取成若干個包含有限頻帶寬度的子帶,然后對每一個子帶根據(jù)其不同的頻率分布特性采取不同的編碼方案。在子帶編碼中,為了減小相位偏差和量化的影響,我們希望使用的是線性相位濾波器。抽取、濾波和插值是構成子帶變換的三個基本要素。圖像的子帶分解與塔式算法:對于二維信號,正交鏡像濾波器可設計為可分離的,所以我們可以直接在兩個方向上分別進行一維濾波,這是圖像的子帶編碼中常用的方法。如果在第一個方向上的濾波完成后立即進行亞采樣,則可減少另一個方向上的濾波所需要的計算量。在此基礎上Burt和Adelson曾引入了一個基本高斯函數(shù)的金字塔編碼策略。首先對圖像高斯脈沖響應作低通濾波,濾波后的結果從原圖像減去。圖像的高頻細節(jié)保留在差值圖像里,然后對低通濾波后的圖像行間隔采樣,細節(jié)也就不會因此而丟失。1989年Mallat提出了多分辨率分析的概念,在泛函分析的框架下,統(tǒng)一了在此之前的各種具體小波構造方法。給出了構造正交小波基的一般方法和對應于FFT的快速小波算法。并將其用于圖像分解和重建,這是小波變換理論和應用的一個突破性進展。該算法中,主要是重復采用子帶分解方法,從下往上建立小波變換,即先計算小尺度系數(shù),再計算大尺度系數(shù)。N點的信號序列經第一級子帶分解和亞取樣后,輸出N/2點的低子帶信號作為下一級的輸入繼續(xù)進行子帶分解,而另一個N/2點的高子帶信號則留作最終的小尺度系數(shù)。可以一直如此下去,直至得到只有一個點的低子帶信號,變換系數(shù)就是該點信號和各個高子帶信號的全部。4實驗和分析:MATLAB軟件是由美國Mathworks公司推出的用于數(shù)值計算和圖形處理的科學計算系統(tǒng)環(huán)境。MATLAB是英文MATrixLABoratory(短陣實驗室的縮寫。它的第1版(DoS版本1.0發(fā)行于1984年,經過10余年的不斷改進,現(xiàn)今已推出它的6.5版。新的版本集中了日常數(shù)學處理中的各種功能,包括高效的數(shù)值計算、矩陣運算、信號處理和圖形生成等功能。在MATLAB環(huán)境下,用戶可以集成地進行程序設計、數(shù)值計算、圖形繪制、輸入輸出、文件管理等各項操作。下面就通過調用matlab的小波工具箱中的wdencmp函數(shù),對一圖像進行壓縮變換。通過以上實驗,我們可知,應用小波變換進行圖像壓縮時,在理論上可以獲得任意壓縮比的圖像,且實現(xiàn)起來也較為簡單。小波變換在圖像壓縮方面顯示出了他們的特性:即為圖像從空間域變換到時間域變換提供了一種非常有效的方法,其作用與專門用于圖像壓縮的離散余弦變換,傅立葉變換等類似。5結束語小波變換作為信號處理的一種手段,在許多應用中取得了顯著的效果,它同傳統(tǒng)的處理方法相比,有了質的飛躍。小波技術做一種調和分析方法,具有十分巨大的生命力和廣闊的應用前景。小波變換作為一種數(shù)學理論和方法在科學技術界引起了越來越多的關注和重視??梢灶A見在今后,它將成為科技工作者手中一個銳利的數(shù)學工具,會極大的促進科技工程應用的各個領域的新發(fā)展。參考文獻:[1]秦前清,楊宗凱,實用小波分析,西安電子科技大學出版社,1994。[2]李世雄,小波變換及其應用,高等教育出版社,1997。[3]彭玉華,小波變換與工程應用,科學出版社,1999。[4]李建平,唐遠炎,小波分析方法的應用,重慶大學出版社,1999。[5]劉貴忠,邸雙亮,小波分析及其應用,西安電子科技大學出版社,1992。[6]鄭宏興等,MATLAB5.x工具箱使用技巧與實例,華中科技大學出版社,2001。[7]鄭治真等,小波變換及其MATLAB工具的應用,地震出版社,2001。[8]徐長發(fā),李國寬,實用小波方法,華中理工大學出版社,2001。[9]陳武凡,小波分析及其在圖像處理中的應用,科學出版社,2002。[10]飛思科技產品研發(fā)中心,MATLAB6.5輔助小波分析與應用,電子工業(yè)出版社,2003。[11]王立濤,丁勇,基于小波變換的圖像處理技術,遼寧工程技術大學學報,2000,20(3):344—347。[12]何業(yè)軍,陳永泰,數(shù)據(jù)編碼與壓縮技術,電信快報2001,6:37—40。[13]孫海威,談新權,基于離散小波分形的圖像壓縮編碼,華中科技大學學報,2001,29(2):31—32。[14]王玲,宋國鄉(xiāng),多小波的預處理及其在圖像壓縮中的應用,電子學報,2001,29(10):1418—1420。[15]陳善學,一種基于小波變換的圖象壓縮方法,重慶郵電學院學報,2001,13(3):46-48[16]馬社祥,劉貴忠,尚趙偉,基于小波變換的圖像可視頻壓縮編碼,工程數(shù)學學報,2001,18(5)(小波???7--30。[17]唐良瑞,小波圖象編碼技術的研究,北方工業(yè)大學學報,2001,13(3):9—17。[18]李春華,張雨生,戚銀城,王彥駿,小波變換在圖像壓縮研究中的現(xiàn)狀和趨勢,華北電力大學學報,2001,28(2):87—91。[19]WEIPei-yong,ZHUChang-chun,LIUjun-huaRealizationofWaveletTransformUsingSAWDevicesSemiconductorPhotonicsandTechnology,2001,7(2:104—108。[20]ZHENGJianbinZHANGHongquanWavelet-Fourierself-deconvolutionSCIENCEINCHINA2000,43(1:1—9。(指導老師曹建章副教授)1997年第2期廣東教育學院學報利用小波變換原理進行圖像處理孟月萍摘要小波變換(WaveletTransform是80年代開始發(fā)展的一項較新理論,它的應用十分廣泛。本文根據(jù)小波變換原理,利用Mallat算法,探討在計算機上對彩色圖像實現(xiàn)塔式分解及圖像鑲嵌、拼接、去噪等方面的應用。關鍵詞圖像處理數(shù)據(jù)壓縮函數(shù)糸算法11引言小波分析理論自80年代末成為國際上十分活躍的研究領域,它已被廣泛應用于圖像處理、石油勘探、數(shù)據(jù)壓縮、CT成像、分形幾何等許多領域。本文主要探討基于小波分析原理,利用Mallat算法實現(xiàn)對圖像的處理。21小波變換的定義定義:設ψ∈L2∩L1,且^ψ(0=0,若滿足允許條件:dω<+∞(1Cψ=Θ+∞-∞|^ψ(ω|2|ω|我們則把ψ叫做允許小波或叫做基本小波。按如下的伸縮和平移方式生成的函數(shù)ψs,uψ(x=sψ(s(x-uu∈R,s∈R+(2s,u稱為連續(xù)小波函數(shù)。其中S為尺度函數(shù),U為平移參數(shù)。對于任意函數(shù)f(x∈L2(R,可按照函數(shù)系{Sψ(s(x-u}(s,u∈R2展開。函數(shù)f(x∈L2(R的小波變換定義為:Wf(s,u=Θ+∞-∞f(xsψ(s(x-udx(3這樣,函數(shù)f(x可按函數(shù)系{ψs(x-u}(s,u∈R2進行分解,函數(shù)ψs(X和函數(shù)ψ(x類型相同,只相差一個因子S。小波函數(shù)ψ(X的Fourier變換^ψ(ω滿足^ψ(0=0。因此小波函數(shù)ψ(x可以被解釋為帶通濾波器的脈沖響應。對函數(shù)ψ(x進行歸一化,假設它的能量為1,令ψs(x=ψs(-x,則在點u以及尺度S上的小波變換可寫為卷積的形式:Wf(s,u=f3ψs(u(4因此,小波變換可以看成是脈沖響應為ψs(x的帶通濾波器對f(x的濾波。由于小波變換引入尺度參數(shù)S,使得在時間域和頻率域內分辨率隨著S而變化。由此可見,小波變換最突出的優(yōu)點是能夠精細刻劃突變信號。31Mallat算法Mallat在Burt和Adelson[2]的圖像分解和重構的塔式算法啟發(fā)下,基于多尺度分析的框架,提出了一種塔式分解算法,叫做Mallat算法,它在小波分析中占有重要地位。設Vj是給定的多尺度分析,φ和ψ分別是相應的尺度函數(shù)和小波函數(shù),對于給定的離散信號{Sk}k∈Z∈V0(這里對應分辨率為j=0,V0空間的伸縮平移系為{φj,k,K∈Z},我們可以在V0空間構造一個函數(shù)f(u∈V0f(u=∑K∈ZS0Kφ0,K(u(5由于V0=V1W1,所以f(u可分解為;f(u=∑K∈ZS1Kφ1,K(u+∑K∈Zd1kψ1,k(u(6其中(6式第一部分是f(u在V1上的投影,第二部分是f(u在W1上的投影。由于V1=V2W2,式中第一部分可進一步分解,分別投影到V2和W2空間上去,依次類推,就得到了信號的塔式分解。其分解遞推公式為:Sj+1k=∑n∈Zhn-2kSjndj+1k=∑n∈Zgn-2kSjn(7我們把Sjk稱作為f(u在2j分辨率下的離散逼近,即低頻成份;djk稱為f(u在2j分辨率下的離散細節(jié),即高頻成份。式(6第一項可以理解為函數(shù)f(u的頻率不超過2-j的成份;第二項可理解為f(u的頻率介于2-j到2-j+1之間的成份。因此,按上面的塔式分解算法將函數(shù)f(u分解成了不同的頻率通道成份。合成是上述的逆過程,合成公式為Sj-1k=∑n∈Zhk-2nSjn+∑n∈Zgk-2ndjn(8這種塔式分解算法同樣適合2維情況。41小波變換在圖像處理中的應用411圖像分解對于有限支集的正交小波集,函數(shù)φ(x所滿足的雙尺度差分方程是有限形式的φ(x=2∑2N-1K=0hkφ(2x-k令:gk=(-1k-1h2N-k-1K=0,1,2,…2N-1則離散信號的分解與合成都是有限變換公式。取N=3或N=5可以得到有限形式對應的遞推和合成公式。N的大小與所選用小波函數(shù)的光滑度有關,N選擇小,小波函數(shù)光滑度就差,但運算量小;N選擇大,小波函數(shù)光滑度就好,但是它的運算量大。實驗證明選擇N=3或N=5從恢復圖像質量來看幾乎沒有差別,因此,我們選擇N=3即可以滿足要求。分解后所得到的系數(shù)圖像,其總的數(shù)據(jù)量與原圖像的數(shù)據(jù)量相等(注:數(shù)據(jù)量指的是圖像對應的象素個數(shù),而每一級系數(shù)圖像數(shù)據(jù)都反映了圖像不同頻帶的高頻成份,具有一定的特征。由于原始圖像每種顏色是5比特,共32個灰度級,若灰度級變化,即使增加1或減少1,對視覺都是敏感的,而分解后的系數(shù)值和低頻圖像的像素值都是實數(shù),這就會引起量化誤差。因此,為了保證解碼后的圖像質量,我們必須考慮盡量去減少量化誤差。412圖像的鑲嵌與拼接圖像鑲嵌與拼接是圖像處理中的一項重要內容,其技術問題就是如何使拼接的兩幅圖像在拼接后不出現(xiàn)明顯的拼接縫,且不讓人明顯感到是由兩幅圖像拼接而成的。在實際成像過程中,被拼接的圖像在拼接邊界上灰度的差別是不可避免的,這就需要一種技術能修正兩幅圖像在接縫處的灰度值,使拼接后的圖像在接縫處有一光滑的過渡。而采用簡單函數(shù)光滑的方法會導致圖像模糊不清,利用小波變換能較好地對圖像進行拼接。由于小波變換實際上是一個帶通濾波器,在不同尺度下的小波變換分量實際上代表一定的頻帶寬度,因此,每個小波分量所具有的頻寬是不大的,我們可先將拼接的兩幅圖像按Mallat算法分解為不同頻帶的小波分量,然后,在不同的尺度下選擇不同的拼接寬度,按各自的方法先拼接起來,再用合成算法恢復整個圖像。這樣得到的拼接圖像可以很好地兼顧清晰度和光滑度兩方面要求。413去噪處理去噪處理也是圖像處理中比較重要的工作。例如一幅圖像被噪聲點污黑了若干小塊,如果直接去除污點就會留下痕跡。利用小波變換可以對圖像進行多尺度分解,除去在各個尺度小波分量上的污點所對應的邊緣,再恢復就不會有任何痕跡了。邊緣檢測的主要任務是找出信號突變部分的位置,這在數(shù)學上常表示為間斷點、尖點等。而在圖像信號上,這些奇異點就是圖像的邊緣點。由于實際圖像的空間頻率成份十分復雜,用普通的方法直接提取邊緣往往不十分有效。而用小波變換可以將圖像分解成不同頻率成份的小波分量,然后再從這些不同層次的小波分量中找出信號本身的特征以提取邊緣就比較有效了。51結束語小波分析的理論在不斷地發(fā)展,從小波分析的理論來看,小波包(waveletpacket的應用具有它明顯的優(yōu)點,它能把圖像進行更精細的正交分解。即在塔式分解的基礎上,對得到的高頻系數(shù)圖像再進行分解,使得最后分解得到的高頻系統(tǒng)圖像的頻帶劃分的更精細。然后再對得到的一系列系數(shù)圖像進行優(yōu)化組合,這樣可以針對頻帶較細劃分的高頻系數(shù)圖像,采取相應的措施,比如對人眼不敏感的高頻系數(shù)圖像進行處理或干脆去掉某些高頻系數(shù)分量,有利于在圖像處理中的應用。參考文獻11CharlesK1chui,wareletAnalysisandItsApplications,TexasA&MUniversity,CollegeStation,Texas,199121S1Mallatm,Atheoryformultiresolutionsignaldecomposition:thewaveletrepresntation,IEEETrars1PAMI,p674~693,July1989(上接第81頁產。513辣椒留種用懸掛法緩慢風干脫水干燥,并以果實內種子宿存保存,得到果皮蠟質密封具有抗微生物侵入的功能,可以維持種子較長的生活力,劣度較慢;為了較長時間保存種子,可用密閉容器、膠袋,抽去其中空氣,造成高度缺氧狀態(tài),存放在0°—4°c的低溫環(huán)境中,抑制種子的呼吸和微生物的生長,在本研究條件下可保持四、五年,有生產應用價值。514本研究操作簡易、老少咸宜,為一般個體蔬菜專業(yè)戶,有低溫(普通冰箱、冰柜、食品冷庫一角等條件和密封條件的家庭、工廠都能做到能自留、自繁、自貯、自用良種,降低生產成本,減少損失,提高效益,也可作各地中小學生因地置宜開展生物科學實驗的一個項目。參考文獻11黃學林等,種子生理實驗手冊,農業(yè)出版社,199021孫文基等,天然藥物成分提取分離與制備,中國醫(yī)學科技出版社,199331畢辛華等,種子學,農業(yè)出版社,1993年1引言隨著計算機網絡和多媒體信息處理技術的發(fā)展,使得方便快捷地制作、編輯、復制和傳輸各種無失真的數(shù)字化產品成為可能,如數(shù)字化的圖像、視頻、音頻、軟件、圖形、動畫和文本等。這給人們帶來很大便利,也同時帶來了許多嚴重的安全問題。例如,數(shù)字媒體產品的版權保護、軟件產品的盜版、數(shù)字文檔的非法拷貝、各種數(shù)字信息的篡改等。對于上述問題,人們最初的想法是求助于密碼學。密碼學是保護數(shù)字媒體內容最常用的方法。數(shù)字內容在發(fā)送之前先進行加密,合法的用戶可以利用密鑰來解密加密文件。對于非法用戶來說,沒有密鑰文件毫無用處。然而,密碼系統(tǒng)可以保護內容的傳輸,卻無法跟蹤合法消費者怎樣處理解密后的內容。此外,加密后的文件因為不可理解而妨礙了數(shù)字化信息的傳播。由此可知,加密手段存在著一定的缺陷。為此,人們開始尋找新的解決辦法來補充密碼系統(tǒng),使內容在解密后,仍可以得到保護。隨著對這些問題的深入研究,數(shù)字水印(DigitalWatermarking)技術產生了,它屬于信息隱藏技術(DataHiding)的范圍[1-6],最初的目的是作為保護數(shù)字版權的補充辦法[7]。由于水印信息置于所保護的內容之中,在正常使用時也不會被去掉,因此水印技術可能滿足上述要求。數(shù)字水印技術利用多媒體信息中存在的冗余信息及人類感知系統(tǒng)的特性,在不影響原始多媒體信息格式和質量的前提下把額外的信息(即水印)隱藏到多媒體信息中。數(shù)字水印是一個多學科高度交叉的新興研究領域,它涉及了信號處理、密碼學、數(shù)學理論、通信理論、編碼理論、數(shù)據(jù)壓縮和人類聽視覺理論等多門學科。數(shù)字水印的提出是為了保護版權,然而隨著水印技術的發(fā)展,人們已經發(fā)現(xiàn)了水印更多更廣的應用。目前,數(shù)字水印技術的應用大體上可以分為版權保護、數(shù)字指紋、認證和完整性校驗、內容標識和隱藏標識、使用控制、隱蔽通信等幾個方面。水印水印原始信號密鑰編碼器嵌入水印后信息原始水印待測信息密鑰解碼器檢測結果或提出兵水印圖1水印信號嵌入系統(tǒng)模型圖2水印信號檢測系統(tǒng)模型2數(shù)字水印的一般原理數(shù)字水印技術包含水印的嵌入、提取/檢測兩個過程。數(shù)字作品擁有的特定信息,如數(shù)字序列、數(shù)字標識、文本或圖像等,按某種算法嵌入到數(shù)字作品中,在需要時,通過相應的算法提取出該水印,從而能夠驗證數(shù)字作品的合法性。為了給攻擊者增加去除水印的難度,目前大多數(shù)水印制作方案都采用密碼學中的加密體系來加強安全性,在水印的嵌入和提取/檢測時采用一種密鑰,甚至幾種密鑰聯(lián)合使用。數(shù)字水印的嵌入過程如圖1所示,數(shù)字水印的提取/檢測過程如圖2所示。2.1數(shù)字水印技術的基本要求數(shù)字水印必須具有隱蔽性、魯棒性、安全性等基本特性。其中,隱蔽性和魯棒性是一對相互對立的要求,提高魯棒性就會降低水印的隱蔽性,提高水印的隱蔽性又會減弱水印的魯棒性。因此一個好的數(shù)字水印算法,必須合理地均衡二者之間的矛盾,在一定范圍內尋求一種最佳的平衡。1.安全性:數(shù)字水印的信息應是安全的,難以篡改或偽造,同時,應當有較低的誤檢測率,當原內容發(fā)生變化時,數(shù)字水印應當發(fā)生變化,從而可以檢測原始數(shù)據(jù)的變更;當然數(shù)字水印同樣對重復添加有強的抵抗性。2.隱蔽性:數(shù)字水印應是不可知覺的,而且應不影響被保護數(shù)據(jù)的正常使用;不會降質。3.魯棒性:是指在經歷多種無意或有意的信號處理過程后,數(shù)字水印仍能保持部分完整性并能被準確鑒別??赡艿男盘柼幚磉^程包括信道噪聲、濾波、數(shù)/模與模/數(shù)轉換、重采樣、剪切、位移、尺度變化以及有損壓縮編碼等。4.確定性:水印應能為受到保護的數(shù)字作品的真?zhèn)位驓w屬提供確定、可靠且具有法律效力的證據(jù),這也是發(fā)展數(shù)字水印技術的基本動力。5.不可檢測性:指水印信息與原始載體數(shù)據(jù)具有一致的特性,且水印信息本身具有不可統(tǒng)計性,使攻擊者無法通過信息分析手段判斷多媒體數(shù)據(jù)中是否存在水印。6.自恢復性:水印信息經過一些操作或變換后,可能會使原始載體數(shù)據(jù)產生較大的破壞,但可以由留下的片斷數(shù)據(jù)恢復出隱藏信號,且恢復過程不需要宿主信號。2.2數(shù)字水印的分類數(shù)字水印的分類方式很多,下面對現(xiàn)有的各種水印算法按照不同的分類標準得到不同的分類結果。常用的分類思路主要包括如下幾種:(1)按特征劃分,分為魯棒型水印和脆弱型水印。魯棒型水印主要用于數(shù)字產品的版權保護,它必須保證對原始版權的準確無誤的標識。因為數(shù)字水印時刻面臨著用戶或侵權者無意或惡意的破壞。因此,魯棒型水印技術必須保證在宿主信號可能發(fā)生的各種失真變換下,以及各種惡意攻擊下都具備很高的抵抗能力。與此同時,由于要求保證原始信號的感知效果盡可能不被破壞,因此對魯棒型水印的不可見性也有很高的要求。脆弱型水印主要用于數(shù)據(jù)的真?zhèn)舞b別和完整性鑒定,又稱為認證。該水印技術在原始信號中嵌入某種標記信息,通過鑒別這些標記信息的改動,達到對原始數(shù)據(jù)完整性檢驗的目的。因此,與魯棒型水印不同的是,脆弱型水印應隨著主信號的變動而做出相應的改變,即體現(xiàn)出脆弱性。但是,脆弱型水印的脆弱性并不是絕對的。對主信號的某些必要性操作,如濾波或壓縮,脆弱型水印也應體現(xiàn)出一定的魯棒性,從而將這些不影響主信號最終可信度的操作與那些蓄意破壞操作區(qū)分開來[60]。另一方面,對脆弱型水印的不可見性和所嵌入數(shù)據(jù)量的要求與魯棒型水印是相似的。(2)從水印所嵌入的載體劃分,可分為圖像水印、音頻水印、視頻水印、文本水印、軟件水印、數(shù)據(jù)庫水印以及用于三維網格模型的網格水印等。隨著數(shù)字技術的發(fā)展,會有更多種類的數(shù)字媒體出現(xiàn),同時也會產生相應的水印技術。(3)從水印檢測過程劃分,可分為明文水印和盲水印。明文水印在檢測過程中需要原始數(shù)據(jù),而盲水印的檢測不需要原始數(shù)據(jù)。一般來說,明文水印的魯棒性比較強,但其應用受到存儲成本的限制。目前學術界研究的數(shù)字水印大多是盲水印。(4)從水印的嵌入位置劃分,可分為時(空)域水印和變換域水印。時(空)域的水印嵌入可以通過直接修改時(空)域信號采樣值的幅度實現(xiàn),這種方法無需對原始信號進行變換,計算簡單,效率較高,但魯棒性較差。變換域數(shù)字水印則分別是在DCT、DFT等頻域、時/頻變換域、小波變換域上嵌入水印。變換域數(shù)字水印能較好地利用人類視覺、聽覺系統(tǒng)的特性,具有較強的魯棒性。隨著數(shù)字信號處理技術的發(fā)展,信號變換也不再局限于上述4種。應該說,只要構成一種信號變換,就有可能在其變換空間上隱藏水印。(5)按用途劃分。不同的應用需求造就了不同的水印技術。按水印的用途,可以將數(shù)字水印劃分為證件防偽水印、版權標識水印、篡改提示水印等。證件防偽水印是一類比較特殊的水印,主要用于身份證、護照、畢業(yè)證、學位證等證明文檔的防偽??紤]到快速檢測的要求,用于證件防偽的數(shù)字水印算法不能太復雜,而且要能抗打印掃描過程引起的幾何失真和像素值失真。版權標識水印是目前研究最多的一類數(shù)字水印。數(shù)字作品既是商品又是知識作品,這種雙重性決定了版權標識水印主要強調隱蔽性和魯棒性,而對數(shù)據(jù)量的要求相對較小。篡改提示水印是一種脆弱水印,其目的是標識宿主信號的完整性和真實性。(6)按內容劃分,分為有意義水印和無意義水印。有意義水印是指水印本身也是某個數(shù)字圖像(如商標圖像)或數(shù)字音頻片斷的編碼;無意義水印則只對應于一個序列號。有意義水印的優(yōu)勢在于,如果由于受到攻擊或其他原因致使解碼后的水印破損,人們仍然可以通過視覺或聽覺確認是否存在水印。但對于無意義水印來說,如果解碼后的水印序列有若干碼元錯誤,則只能通過統(tǒng)計決策來確定信號中是否含有水印。(7)按外觀上劃分,可分為可見水印和不可見水印。更確切地說應該是可察覺水印和不可察覺水印??梢娝∽畛R姷睦邮怯芯€電視頻道上所特有的半透明標識(Logo),其主要目的在于明確標識版權,防止非法的使用,雖然降低了資料的商用價值,卻無損于所有者的使用。而不可見水印將水印隱藏,視覺上不可見(嚴格的說無法察覺),目的是為了將來起訴非法使用者,作為起訴的證據(jù),以增加起訴非法使用者的成功率,保護原創(chuàng)者和所有者的版權。不可見水印往往出現(xiàn)在商業(yè)用的高質量圖像上,而且往往配合數(shù)據(jù)解密技術一同使用。不可見水印根據(jù)穩(wěn)健性可再細分為魯棒的不可見水印和脆弱的不可見水印。3數(shù)字圖像水印本章提出一種以圖案作水印、且提取時不需原圖的盲數(shù)字水印嵌入算法。這個算法是基于變換的一種算法,經過研究知道:在小波變換后,紋理和邊緣特征一般集中在高頻子帶LH1、HL1和HH1中,如把水印信息加在低頻系數(shù)LL上,則人眼不易察覺,可以加大水印的嵌入量。由于經過一般的圖像處理以后,高頻上的信息容易丟失,其魯棒性不夠強。但是,一般情況下在嵌入的水印信息的量是較少的,本文為了增強水印的魯棒性,在嵌入的水印信息量較少的情況下,就把水印信息嵌入到低頻系數(shù)上,這樣水印的魯棒性將會大大增強。3.1圖像水印典型算法近幾年來,數(shù)字水印技術研究取得了很大的進步[2,7,10-25],本文對一些典型的算法進行分析,除特別指明,這些算法主要針對圖象數(shù)據(jù)(某些算法也適合視頻和音頻數(shù)據(jù))。(1)空域算法:該類算法包括文本水印算法、Schyndel算法和Patchwork算法等。其中Schyndel算法[10]被認為是一篇具有歷史價值的文獻,它是第一篇在主要會議上發(fā)表的關于數(shù)字水印的文章,文中闡明了一些關于水印的重要概念和魯棒水印檢測的通用方法(相關性檢測方法),此算法首先把一個密鑰輸入一個m-序列(maximum-lengthrandomsequence)發(fā)生器來產生水印信號,然后此m-序列被重新排列成2維水印信號,并按象素點逐一插入到原始圖象象素值的最低位。由于水印信號被安排在了最低位上,它是不可見的,基于同樣的原因,它可以輕易地被移去,因此也是不強壯的;Patchwork[2,12]提出了一種基于改變圖象數(shù)據(jù)統(tǒng)計特性的水印算法,該算法首先隨機選取N對象素點,然后通過增加象素對中一個點的亮度值,而相應降低另一個點的亮度值的調整來隱藏信息。為增加其水印的魯棒性,文中還把象素對擴展為小塊的象素區(qū)域(如8x8),通過增加一個區(qū)域中的所有象素點的亮度值而相應減少對應區(qū)域中所有象素點的亮度值的調整來隱藏信息。但該算法嵌入碼低,且對串謀攻擊抵抗力弱。(2)變換域算法:文獻[16]提出了一種DCT域數(shù)字水印算法,其方法是首先把圖象分成8x8的不重疊象素塊,在經過分塊DCT變換,得到由DCT系數(shù)組成的頻率塊,然后隨機選取一些頻率塊,將水印信號嵌入到由密鑰控制選擇的一些DCT系數(shù)中。該算法是通過對選定的DCT系數(shù)進行微小變換以滿足特定的關系,來表示一個比特的信息。在水印信號提取時,則選取相同的DCT系數(shù),并根據(jù)系數(shù)之間的關系抽取比特信息。其思想類似于擴展頻譜通訊中的跳頻(frequencyhopping)技術,特點是數(shù)據(jù)改變幅度較小,且透明性好,但是其抵抗幾何變換等攻擊的能力較弱。另外基于DFT和DWT算法與上述算法具有相似的原理。這種以變換域算法為代表的通用算法普遍采用變換技術,以便在頻率域實現(xiàn)水印信號疊加,并借鑒擴展頻譜通訊等技術對水印信號進行有效的編碼,從而提高了透明性和魯棒性,同時還適當利用濾波技術對水印信號引入的高頻噪聲進行了消除,從而增加了對低頻濾波攻擊的抵抗力。(3)壓縮域算法[13,14]基于JPEG、MPEG標準的壓縮域數(shù)字水印系統(tǒng)不僅節(jié)省了大量的完全解碼和重新編碼過程,而且在數(shù)字電視廣播及VOD(VideoonDemand)中有很大的實用價值。相應地,水印檢測與提取也可直接在壓縮域數(shù)據(jù)中進行。文獻[13]提出了一種針對MPEG-2壓縮視頻數(shù)據(jù)流的數(shù)字水印方案。雖然MPEG-2數(shù)據(jù)流語法允許把用戶數(shù)據(jù)加到數(shù)據(jù)流中,但是這種方案并不適合數(shù)字水印技術,因為用戶數(shù)據(jù)可以簡單地從數(shù)據(jù)流中去掉,同時,在MPEG-2編碼視頻數(shù)據(jù)流中增加用戶數(shù)據(jù)會加大位率,使之不適用固定帶寬的應用,所以關鍵是如何把水印信號加到數(shù)據(jù)信號中,即即加入到表示視頻幀的數(shù)據(jù)流中。對于輸入的MPEG-2數(shù)據(jù)流而言,它可分為數(shù)據(jù)頭信息、運動向量(用于運動補償)和DCT編碼信號塊3部分,在Hartung方案中只有MPEG-2數(shù)據(jù)流最后一部分數(shù)據(jù)被改變,其原理是首先對DCT編碼數(shù)據(jù)塊中每一輸入的Huffman碼進行解碼和逆量化,得到當前數(shù)據(jù)塊的一個DCT系數(shù),其次把相應水印信號塊的變換系數(shù)與之相加,得到水印疊加的DCT系數(shù),再重新進行量化和Huffman編碼,最后對新的Huffman碼字的位數(shù)n1與原來的無水印系數(shù)的碼字n0進行比較,只在n1不大于n0的時候才傳輸水印碼字,否則傳輸原碼字,這就保證了不增加視頻數(shù)據(jù)流位率。但該方法有一個問題值得考慮,即水印信號的引入是一種引起降質的誤差信號,而基于運動補償?shù)木幋a方案會將一個誤差擴散和累積起來,為解決此問題,該算法采取了漂移補償?shù)姆桨竵淼窒⌒盘柕囊胨鸬囊曈X變形。(4)NEC算法[7,17,19,20]該算法由NEC實驗室的COX等人提出,該算法在數(shù)字水印算法中占有重要地位,其實現(xiàn)方法是首先以密鑰為種子來產生偽隨機序列,該序列具有高斯N(0,1)分布,密鑰一般由作者的標識碼和圖象的哈希值組成,其次對圖象做DCT變換,最后用偽隨機高斯序列來調制(疊加)該圖象除直流(DC)分量外的1000個最大的DCT系數(shù)。該算法具有較強的魯棒性、安全性、透明性等。由于采用特殊的密鑰,因此可防止IBM攻擊,而且該算法還提出了增強水印魯棒性和抗攻擊算法的重要原則即水印信號應該嵌入源數(shù)據(jù)中對人感覺最重要的部分;水印信號由獨立同分布隨機實數(shù)序列構成,該實數(shù)序列應該具有高斯分布N(0,1)分布的特征。隨后Podilchuk等[5,21]利用人類視覺模型對該算法進行了改進,從而提高了該算法的魯棒性、透明性等。(5)生理模型算法[8,21-25]人的生理模型包括人類視覺系統(tǒng)HVS(HumanVisualSystem)和人類聽覺系統(tǒng)HAS。該模型不僅被多媒體數(shù)據(jù)壓縮系統(tǒng)所利用,同樣可以供數(shù)字水印系統(tǒng)所利用。利用視覺模型,文獻[23,24]實現(xiàn)了一個基于分塊DCT框架的數(shù)字水印系統(tǒng);文獻[22]實現(xiàn)了一個基于小波分解框架的數(shù)字水印系統(tǒng);文獻[25,]實現(xiàn)了一個空域數(shù)字水印系統(tǒng)。它們的基本思想均是利用從視覺模型導出的JND(JustNoticeableDifference)描述來確定在圖象的各個部分所能容忍的數(shù)字水印信號的最大強度,從而能避免破壞視覺質量。也就是說,利用視覺模型來確定與圖象相關的調制掩模,然后再利用其來插入水印。這一方法同時具有好的透明性和強健性。3.2水印攻擊分析所謂水印攻擊分析,就是對現(xiàn)有的數(shù)字水印系統(tǒng)進行攻擊,以檢驗其魯棒性,通過分析其弱點所在及其易受攻擊的原因,以便在以后數(shù)字水印系統(tǒng)的設計中加以改進。攻擊的目的在于使相應的數(shù)字水印系統(tǒng)的檢測工具無法正確地恢復水印信號,或不能檢測到水印信號的存在。這和傳統(tǒng)密碼學中的加密算法設計和密碼分析是相對應的。下面我們對一些典型的攻擊方法進行分析[1-9,26-27]。IBM攻擊這是針對可逆、非盲(non-oblivious)水印算法而進行的攻擊。其原理為設原始圖象為I,加入水印WA的圖象為IA=I+WA。攻擊者首先生成自己的水印WF,然后創(chuàng)建一個偽造的原圖IF=IA-WF,也即IA=IF+WF。此后,攻擊者可聲稱他擁有IA的版權。因為攻擊者可利用其偽造原圖IF從原圖I中檢測出其水印WF;但原作者也能利用原圖從偽造原圖IF中檢測出其水印WA。這就產生無法分辨與解釋的情況。防止這一攻擊的有效辦法就是研究不可逆水印嵌入算法,如哈希過程。StirMark攻擊Stirmark是英國劍橋大學開發(fā)的水印攻擊軟件,它采用軟件方法,實現(xiàn)對水印載體圖象進行的各種攻擊,從而在水印載體圖象中引入一定的誤差,我們可以以水印檢測器能否從遭受攻擊的水印載體中提取/檢測出水印信息來評定水印算法抗攻擊的能力。如StirMark可對水印載體進行重采樣攻擊,它可模擬首先把圖象用高質量打印機輸出,然后再利用高質量掃描儀掃描重新得到其圖象這一過程中引入的誤差。另外,StirMark還可對水印載體圖象進行幾何失真攻擊,即它可以以幾乎注意不到的輕微程度對圖象進行拉伸、剪切、旋轉等幾何操作。StirMark還通過一個傳遞函數(shù)的應用,模擬非線性的A/D轉換器的缺陷所帶來的誤差,這通常見于掃描儀或顯示設備。馬賽克攻擊其攻擊方法是首先把圖象分割成為許多個小圖象,然后將每個小圖象放在HTML頁面上拼湊成一個完整的圖象。一般的Web瀏覽器都可以在組織這些圖象時在圖象中間不留任何縫隙,并且使其看起來這些圖象的整體效果和原圖一模一樣,從而使得探測器無法從中檢測到侵權行為。這種攻擊方法主要用于對付在Internet網上開發(fā)的自動侵權探測器,該探測器包括一個數(shù)字水印系統(tǒng)和一個所謂的Web爬行者。但這一攻擊方法的弱點在于,一旦當數(shù)字水印系統(tǒng)要求的圖象最小尺寸較小時,則需要分割成非常多的小圖象,這樣將使生成頁面的工作會非常繁瑣。串謀攻擊所謂串謀攻擊就是利用同一原始多媒體數(shù)據(jù)集合的不同水印信號版本,來生成一個近似的多媒體數(shù)據(jù)集合,以此來逼近恢和復原始數(shù)據(jù),其目的是使檢測系統(tǒng)無法在這一近似的數(shù)據(jù)集合中檢測出水印信號的存在,其最簡單的一種實現(xiàn)就是平均法。跳躍攻擊跳躍攻擊主要用于對音頻信號數(shù)字水印系統(tǒng)的攻擊,其一般實現(xiàn)方法是在音頻信號上加入一個跳躍信號(jitter),即首先將信號數(shù)據(jù)分成500個采樣點為一個單位的數(shù)據(jù)塊,然后在每一數(shù)據(jù)塊中隨機復制或刪除一個采樣點,來得到499或501個采樣點的數(shù)據(jù)塊,然后將數(shù)據(jù)塊按原來順序重新組合起來。實驗表明,這種改變對古典音樂信號數(shù)據(jù)也幾乎感覺不到,但是卻可以非常有效地阻止水印信號的檢測定位,以達到難以提取水印信號的目的。類似的方法也可以用來攻擊圖象數(shù)據(jù)的數(shù)字水印系統(tǒng),其實現(xiàn)方法也非常簡單,即只要隨機地刪除一定數(shù)量的象素列,然后用另外的象素列補齊即可,該方法雖然簡單,但是仍然能有效破壞水印信號存在的檢驗。3.3小波域數(shù)字圖像水印基于小波域的水印算法越來越多,現(xiàn)在人們對小波的熱情非常高。在小波域嵌入水印的原因是:可以防止由于JPEG2000有損壓縮而造成的水印消除;可以利用信源編碼領域對圖像失真的可見性研究成果來控制水印的嵌入位置和強度;可以實現(xiàn)在壓縮域直接嵌入水印。此外,利用小波多分辨率分析可以更好地控制水印在宿主中的分布,更好地解決魯棒性和可見性之間的矛盾。Kundur等人描述了一種基于小波融合的水印嵌入方法。他的方式是在不同的分辨率水平下將水印和圖像的小波系數(shù)相加。在相加之前,水印的小波系數(shù)使用一種人類視覺模型約束進行調制。Xia等人提出一種基于小波變換的分層水印提取過程,分層提取的目的是當水印圖像失真不嚴重時節(jié)約計算時間。基本思想是用離散小波變換將接收到的圖像和原始圖像分解成4個子帶(即一層分解),然后計算加在HH子帶中的水印和接收圖像與原始圖像小波系數(shù)之差間的互相關。如果互相關中有一個峰值,則認為檢測到水??;否則,考慮同一層上的其他子帶,如果仍檢測不到水印,則計算下一層DWT(即第二層分解),再檢測水印。該過程一直執(zhí)行到檢測到水印或計算到最后一層DWT。目前基于DWT的算法層出不窮。3.3.1小波變換的數(shù)字水印算法(1)嵌入位置的選擇將圖像進行2級離散小波變換,得到不同層次的小波系數(shù)。經過分解之后,邊緣細節(jié)部分集中在HH、HL、LH子帶,這些子帶中較大系數(shù)往往表示圖像的邊緣,因此把水印嵌入到其中之后的不可感知性比較好,但是這些子帶的系數(shù)在量化時被丟掉的概率相對比較大,為此考慮將水印嵌入到低頻系數(shù)中。圖1三級小波分解圖2圖像經離散小波變換的三層多分辨率分解示意圖(2)水印的嵌入強度為了在宿主圖像中嵌入盡可能大的水印信息量,但又不能使宿主圖像產生明顯的失真,必須對嵌入強度進行加權。另外考慮到人類視覺特性,嵌入水印強度因子k分別為:0.007。(3)水印的嵌入第1步:將原始圖像I進行一級離散小波變換,選取低頻部分的子帶進行嵌入操作。第二步:將水印圖像在原始圖像大小上進行按塊排列W:將水印信息進行延拓將水印信息進行延拓第2步:將水印圖像W進行一級小波變換,取LL低頻子圖像得W1:第3步:在得到W1后判斷W(I,j)是否為0,若為0則a=-0.1否則為a=0.1;將水印嵌入到原始圖像I的一級小波變換后的低頻子圖像中。水印的嵌入方式為:fi,j=fi,j+a*kifW1(I,j)=0,a=-0.1fi,j=fi,j-a*kifW1(I,j)=1,a=0.1第4步:對嵌入水印的圖像進行逆離散小波變換,便得到嵌入水印的圖像I'。(4)水印的提取第1步:將加入水印的圖像減去原始圖像,然后對其進行二值化處理。f(i,j)=255;iff(i,j)>0f(i,j)=0;iff(i,j)<0第2步:對得到的圖像進行水印嵌入中第二步的反操作得W2,再對W2進行處理:W3=W2/8,這樣就得到了水印圖像W3:疊加后求平均疊加后求平均3.3.2實驗結果及分析實驗分別采用大小為64*64畫面內容MCK二值圖像,宿主圖像采用512*512的灰度圖baboon.bmp。實驗結果如下:圖像嵌入水印信息后,與原始圖像比較起來,很難看出差別,沒有帶來明顯的失真,不可感知性非常好。此算法不具備抵抗攻擊性,在受到攻擊時將無法提取水印。此算法的性能評價:信噪比為55.4015。誤碼率為211圖4bird.bmp加入水印前后(1)原始圖像(2)水印(3)加入水印后圖像(4)提取的水印圖像3.4基于DCT變換的數(shù)字圖像水印DCT域圖像水印離散余弦變換(DCT)是數(shù)字信號處理技術中最常用的線性變換之一,存在快速算法。離散余弦變換是實變換,具有很好的能量壓縮能力和去相關能力,在數(shù)字音頻信號壓縮和圖像壓縮等領域得到廣泛應用。特別是數(shù)字圖像的JPEG壓縮標準就是建立數(shù)字水印的在離散余弦變換基礎上的。基于JPEG壓縮標準模型的水印嵌入算法可以增強水印抵抗JPEG壓縮的能力,因此離散余弦變換在數(shù)字水印處理技術中受到普遍重視。在DCT域,不同的DCT系數(shù)作為水印載體對水印的穩(wěn)健性有不同的影響。為了使水印具有較好的穩(wěn)健性,用來嵌入水印的DCT系數(shù)應滿足如下條件:(1)在經過常見信號處理和噪聲干擾后仍能很好地保留,即這些DCT系數(shù)不應過多地為信號處理和噪聲干擾所改變。第一個要求是為了保證水印在嵌入圖像后有較好的穩(wěn)健性。當加入水印的DCT系數(shù)被改變較小時,水印便更可能被保留,這是顯然的。第二個要求是同時針對不可見性和穩(wěn)健性而提出。較大的感覺容量意味著在主觀視覺效果不變的前提下有較大的改變裕度。這也意味著可以嵌入較強的水印信號。根據(jù)這二個要求,低頻AC系數(shù)作為嵌入水印的位置的較好選擇已被逐漸采用,并得到共識.然而被人們忽視的一個事實是,DC分量比任何AC分量更適合嵌入水印信號。這個事實有二方面的理由:(1)與AC系數(shù)相比DC系數(shù)的振幅大得多。圖1顯示了幾幅常用的圖像(均為256×256×8bits)在經過分塊8×8DCT變換后在不同的空間頻率上系數(shù)的平均值(平均振幅)。在圖像中嵌入水印可視為在強背景下迭加一個弱信號。根據(jù)Weber定律和視覺系統(tǒng)的照度掩蔽(luminancemasking)特性,背景亮度越亮(DC系數(shù)值越大),嵌入信號的可見性檢測門限就越高,即DC系數(shù)(代表圖像塊的平均亮度)的感覺容量越大。圖1表明,DC系數(shù)的值通常比最大的AC系數(shù)值還要大幾十倍。甚至上百倍以上??臻g頻率越高,系數(shù)的平均振幅越小.分析和實驗結果表明,與AC系數(shù)相比,盡管DC系數(shù)可以被改變的比例不如AC系數(shù)大,但可改變的絕對值卻比AC系數(shù)大得多。這意味著DC系數(shù)具有比AC系數(shù)更大的感覺容量。(2)根據(jù)信號處理理論,嵌入水印的圖像最有可能遭遇到的信號處理過程,如數(shù)據(jù)壓縮、低通濾波、次抽樣、插值、D/A和A/D轉換等,對DC分量的保護比AC分量要好。實驗結果表明,Gaussian噪聲干擾對DC分量和AC分量的影響程度大致相同。圖2比較了嵌入DC分量和低頻AC分量的水印在JPEG壓縮和Gaussian噪聲干擾下的穩(wěn)健性能??v軸表示從失真的水印圖像中抽取的水印W3與原始水?。簭膱D2可以看出嵌入DC分量比低頻AC分量的水印在JPEG壓縮和Gaussian噪聲干擾下的穩(wěn)健性能更好。水印的嵌入和提取數(shù)字水印的嵌入:水印嵌入就是把水印信號W={w(k)}嵌入到原始圖像X0(k)={x0(k)}中。水印嵌入過程如圖1所示。水印嵌入準則分為:加法準則:x(K)=x0(K)+a*w(k)乘法準則:x(K)=x0(K)*{1+a*w(k)}a為強度因子,為了保證在水印不可見的前提下,盡可能提高嵌入水印的強度。a的選擇必須考慮圖像的性質和視覺系統(tǒng)的特性?;贒CT域的數(shù)字水印嵌入的具體算法:設X是M*N大小的原始圖像,W是水印圖像,大小為P*Q,M和N分別是P和Q的偶數(shù)倍。把水印w加載到圖像X中,算法分以下幾步進行:將X分解為個8*8大小的方塊BX(m,n),同時,將W也分解為(M/8)*(N/8)個(8·P/M)*(8·Q/N)大小的方塊BW(m,n),1=<m<=M/8,1=<n<=N/8;對每一個BX(m,n)進行DCT變換:=DCT(BX(m,n));對每一個和BW(m,n),si為從的中頻選出的加載的位置,l=<i<=(8·P/M)*(8·Q/N),ti為水印BW(m,n)的位置坐標l=<i<=(8·P/M)*(8·Q/N);=a*Bw(m,n)(ti),其中a是加權系數(shù),用來代替得到加載水印后的圖像;對以上得到的每一個進行逆DCT變換:。并將各方塊IDBX(m,n)合并為一個整圖。即加載了水印的新圖像。水印的提?。涸谀承┧∠到y(tǒng)中,水印可以被精確地提取出來,這一過程被稱作水印提取。例如在完整性確認的應用中,必須能夠精確地提取出嵌入的水印,并且通過水印的完整性來確認多媒體數(shù)據(jù)的完整性。如果提取出的水印發(fā)生了部分的變化,最好還能夠通過變化的水印的位置來確定原始數(shù)據(jù)被篡改的位置。水印在提取時可以需要原始圖像的參與,也可以不需要原始圖像的參與。圖2是水印提取的框圖。虛線部分表示在提取或判斷水印信號時原始圖像不是必需的?;贒CT域的數(shù)字水印提取的具體算法:讀取原始圖像和黑白水印圖像到二維數(shù)組I與J;將原像I分割為互不覆蓋的圖像塊,1=<x,y<=8,L=1,2…M*M/64,對進行DCT變換,得到;取黑白水印圖像中的一個元素J(p,q).嵌入原始圖像塊的DCT的低頻系數(shù)中;對嵌入水印信息后的圖像塊進行反DCT變換;得到;合并圖像塊,得到嵌入黑白水印后的圖像。水印檢測:水印在檢測時可以需要原始圖像的參與,也可以不需要原始圖像的參與。但將水印技術用于圖像的網絡發(fā)布和傳播時,如果檢測時需要使用原始圖像則是個缺陷,因此,當前大多數(shù)的水印檢測算法不需要原始圖像的參與。圖3分別是水印檢測的框圖.虛線部分表示在提取或判斷水印信號時原始圖像不是必需的。水印攻擊測試:由于數(shù)字水印在實際應用中可能會遭到各種各樣的攻擊,因此對算法進行攻擊測試是衡量一個水印算法優(yōu)劣的重要手段。首先對嵌入水印后的圖像進行JPEG壓縮(一種水印攻擊),而后從壓縮的圖像中提取出水印,看到DCT域的水印算法抵抗JPEG壓縮攻擊的效果是比較好的。本章算法及實驗結果分析 本實驗采用把DCT變換的直流分量作為水印載體嵌入提取對策,提升了數(shù)字水印的品質。本實驗采用嵌入準則采用乘法準則:x(K)=x0(K)*{1+a*w(k)}其中a取0.003。采用圖像大小256*256如圖6,水印圖像大小為32*32如圖7。圖8實驗結果從上圖中可明顯看出:嵌入水印信息后,原圖與嵌入水印信息后的圖像在視覺效果上沒有明顯分別,用肉眼幾乎分辨不出,這說明這種算法充分利用了人眼的視覺冗余特性,水印的不可見性相當好,圖像在嵌入水印前后視覺效果改變不大,不影響圖像的正常使用。另外嵌入水印后的圖像經過JPEG壓縮后,還能從中提取出比較清晰的水印信息,可見,這種嵌入算法的抗攻擊性較好,而且檢測和提取易于實現(xiàn),具有很好的實用性。圖8實驗結果4小波變換在數(shù)字音頻水印中的應用隨著MP3、MPEG、AC-3等新一代壓縮標準的廣泛應用,對數(shù)字音頻作品的知識產權保護顯得越來越重要。特別是隨著新一代音頻壓縮標準MPEG4的提出,使得基于小波變換的音頻水印技術越來越突顯其良好的多分辨率表示、時頻局部分析的優(yōu)勢,成為當前的一個重要的課題。目前在數(shù)字水印和信息隱藏中,已經出現(xiàn)一些優(yōu)秀的基于小波變換的算法,并且多數(shù)要優(yōu)于相同條件下基于FFT、DCT等傳統(tǒng)變換的算法。4.1數(shù)字音頻水印系統(tǒng)的評價標準數(shù)字音頻水印是永久嵌入在音頻信號(宿主數(shù)據(jù))中的具有可鑒別性的數(shù)字信號。一般來說,數(shù)字音頻水印的主要性能指標包括:不可感知性、穩(wěn)健性和水印的容量。這三者互相牽制,他們之間相互依存又互為矛盾[2]。一般來說,水印的容量越大,穩(wěn)健性越好,但是其不可感知性也越差。要同時獲得水印好的穩(wěn)健性和不可察覺性,就只能減少水印嵌入的信息量。因此在實際運用中要根據(jù)需求,在上述三者之間尋求一個平衡。(1)不可感知性不可感知性就是要求水印嵌入后,不影響原始音頻的質量,即聽覺上不可感知。一般分為主觀和客觀標準。①主觀評價標準由于含有保密信息的音頻信號最終接收者是人,所以主觀評價標準是最終的,也是可靠的。音頻水印中常用的主觀標準稱為平均觀點分(MeanOpinionScore,MOS)。測試者根據(jù)音質好壞來打分,一般是五分制,得分為5或者越接近5,就意味著2個音頻數(shù)據(jù)之間幾乎沒有差別。②客觀評價標準信噪比(SNR)是一個質量評估標準,公式如下:(3)其中,和分別為原始音頻信號和含水印的音頻信號。早期音頻水印算法一般采用信噪比來計算原始音頻與加入了水印的音頻之間的SNR。國際留聲機聯(lián)盟(IFPI)要求水印音頻至少可以提供20dB或者更高的SNR。由于基于SNR的評價標準沒有考慮到人類聽覺系統(tǒng)特性,如一個微小的線性伸縮在主觀上聽覺質量幾乎沒有任何變化,但SNR會降得很低。ITU-R推薦的BS.1387由于其考慮到了人類聽覺系統(tǒng)特性,被認為是很好的客觀聽覺質量評價標準用于音頻水印技術。(2)穩(wěn)健性穩(wěn)健性又稱魯棒性用以衡量水印抗攻擊的能力,即要求水印本身應能經受得住各種有意無意的攻擊。典型的攻擊有添加噪聲、數(shù)據(jù)壓縮、濾波、重采樣、A/D-D/A轉換、統(tǒng)計攻擊等。文獻[5]中用分級的形式來表示水印的穩(wěn)健性,從零級到最高級,零級表示無穩(wěn)健型。實際運用中,常用的衡量水印抗攻擊能力的是誤碼率(BitErrorRate,BER)。1)位錯誤率(BER:BitErrorRate)定義:假設嵌入某載體的保密信息為位,在某種提取策略下,從隱藏有保密信息的載體中或受到某種攻擊的隱秘載體中提取了與隱藏時相同長度的保密信息序列,則定義為:即在收到各種攻擊后提取得到的水印與原始水印之間不同比特所占的百分率。2)歸一化相關系數(shù)(NormalizedCorrelationCoefficient)為了消除觀測者的經驗、身體條件、實驗條件和設備等多種主、客觀因素的影響,通常采用歸一化相關系數(shù)對提取的保密信息序列和原始信息序列的相似性進行定理評價,定義為:IFPI也做出了關于音頻水印穩(wěn)健型的定義,要求穩(wěn)健音頻水印滿足加性或乘性噪聲、MP3壓縮、2個連續(xù)的D/A和A/D轉換、時間拉伸、重采樣、重量化、濾波等。(3)水印數(shù)據(jù)嵌入量水印數(shù)據(jù)嵌入量,也叫水印帶寬,指單位長度的音頻中可嵌入的信息量,通常用比特率表示。IFPI要求嵌入水印的數(shù)據(jù)信道至少要有20bit/s。對于版權保護通常認為只需要幾十比特的水印信息即可。除了上述3個相互依存且矛盾的指標,數(shù)字音頻水印還應該滿足:水印算法必須具備某種同步機制,以對抗時域上的同步攻擊;水印應易于提取,嵌入和檢測的計算量要低;水印檢測不應需要原始音頻,即實現(xiàn)盲檢測;水印算法應該公開,安全性最好依賴于密鑰而不是算法的秘密性。4.2DWT域音頻水印算法小波變換的基本思想是將原始信號經伸縮及平移(將原始信號用一組不同尺度的帶通濾波器進行濾波)后,將信號分解為一系列具有不同空間分辨率(不同通道)、不同頻率特性和方向特性的子帶信號,這些子帶信號具有良好的時域、頻域等局部特性,這些特征可用來表示原始信號局部特征,進而實現(xiàn)對信號時間、頻率的局部化分析。本文介紹一種基于小波變換的水印隱藏和檢測算法,小波變換將信號分解到時域和尺度域上,不同的尺度對應不同的頻率范圍,因此對于語音信號這樣的時變信號而言,小波變換是一種很適合的工具.水印隱藏算法描述如下:·選擇適當?shù)男〔ɑ鶎υ颊Z音信號進行3級分解,對前L級的差別分量保留,不予處理,對第3級的詳細分量進行后面的處理.(L=3)·假設需要隱藏的水印信號的長度為N,選擇中絕對值最大的前N個值,水印隱藏算法采用如下公式:=。·用小波反變換恢復隱藏了水印的語音信號.語音信號在傳輸過程中可能經過各種處理,如受到噪聲的干擾,經過各種濾波處理,語音的有損壓縮,D/A,A/D變換,采樣率改變等等.好的水印隱藏算法應該在各種干擾的情況下都可以準確地判斷出水印的存在。在水印檢測端(作者本人或第三方認證機構),原始的語音信號以及水印信號需保留以備檢測時用。水印檢測算法描述如下:·對接收到的信號進行同樣的小波變換。·對第3級的詳細分量,利用原始語音信號找到隱藏了N個隨機數(shù)的位置,求出?!で笈c的相關.從這個相關函數(shù)中就可以判斷是不是有正確的水印信號存在.這一算法的優(yōu)點首先在于其算法簡單,利用了小波變換快速、簡單的特點;第二,這一算法的抗干擾能力很強因為水印信號隱藏在信號第3級的詳細分量中,即是把水印信號放在語音信號能量最大的部分——低頻部分,如果這一部分信號受到較大的改變,還原出語音的音質將會嚴重下降,所以一般信號處理(如濾波、壓縮、變換等),為了保留原始語音信號的音質等特點,影響的大部分是語音的高頻部分,即使水印信號受到影響,但還是能夠檢測出它的存在.因此這一算法的主要特點就是,把水印信號與語音信號的能量最大部分捆綁在一起,一方面語音信號遮蓋了水印的影響,使其不易被發(fā)覺;另一方面即使音質受到一定的破壞,只要語音信號有一定的可懂度,水印信號就可以檢測出來.這一點是優(yōu)于其它算法的。總的來說,變換域水印方法與時域水印方法相比較,具有如下優(yōu)點:1)在變換域中嵌入的水印信號能量可以散步到空間域的所有位置上,有利于保證水印的不可察覺性。2)在變換域,人類視覺系統(tǒng)和聽覺系統(tǒng)的某些特征(如頻率掩蔽效應)可以更方便地結合到水印的編碼過程中。3)變換域的方法可與數(shù)據(jù)壓縮標準相兼容,從而實現(xiàn)在壓縮域內的水印算法,同時,也能抵抗相應的有損壓縮。4.3DCT域音頻水印算法離散余弦變換(DiscreteCosineTransform)簡稱DCT,離散余弦變換是數(shù)字信號處理技術中最常用的線性變換之一,不僅具有很好的能量壓縮能力,而且去相關能力也較強。語音信號經過DCT變換后,大部分能量都集中在低頻部分。聽覺系統(tǒng)最重要的分量上對應于DCT域中的中、低頻系數(shù),所以把水印信號嵌入在中、低頻的算法一般都具有較好的抗JPEG壓縮、MPEG壓縮和抗縮放重采樣等特性。在大多數(shù)早期的水印算法中,為了保證水印的不可聽性,在原始音頻采樣點的最低有效位(LSB)上嵌入水印。在DCT域,與LSB方法等效的做法是把水印嵌入到高頻系數(shù)中。這對音頻水印載體的聽覺質量非常有利,但由于音頻信號的高頻區(qū)對常見的信號處理和噪聲比較敏感,這些算法所產生的水印魯棒性較差。為提高魯棒性,Cox等人提出水印應放在聽覺系統(tǒng)最重要的分量上(對應于DCT域中的低頻系數(shù)),其理由是聽覺上重要的分量是音頻信號的主要成分,攜帶較多的信號能量,在音頻信號有一定失真的情況下仍能保留主要成分。因此,若水印嵌入到聽覺重要的分量上,則魯棒性較好。同時,為了保證不可聽性,對聽覺上重要的分量的改變應小心進行。一些學者則進行了折衷,把水印放在DCT域的中頻系數(shù)上。將中頻系數(shù)定義為每一段的第2個DCT系數(shù),從而將水印嵌入到音頻載體信號的中頻系數(shù)上。針對圖像水印,黃繼武等人提出DC的DC分量比AC分量有更大的感覺容量,水印應該更多的嵌入在DCT的DC分量上。而在音頻水印中,還沒有研究者提出一個統(tǒng)一的、定量的標準來確定嵌入位置的選擇策略。水印隱藏算法描述如下:讀入原始水印圖像;讀入原始音頻信號,對其進行分段離散余弦變換(DCT變換)得到,步長k=1000;對每段DCT系數(shù)排序找出中頻系數(shù);通過修改中頻系數(shù)來實現(xiàn)水印圖像的嵌入,水印嵌入算法采用如下公式:(9)并記錄被修改的系數(shù)和序號;對其進行DCT反變換,得到嵌入水印的音頻信號;7)水印的提取,利用式(9)的逆運算即可提取。4.4實驗結果分析DWT域算法嵌入水印前后波形的對比如下圖所示:DCT域算法嵌入水印前后波形的對比如下圖所示:原始音頻嵌入水印后的音頻圖中看不出嵌入水印對音頻信號波形產生的影響,從聽覺上也感覺不出嵌入水印后音頻質量的變化。DCT域算法DWT域算法SNR/db161.9129126.1354由上表可知,DCT域算法的不可感知性比DWT域音頻水印算法好,但相差不是很大,人耳不能分辨出差別。DCT域算法DWT域算法原始水印提取水印BER000.99951實驗結果表明,DCT和DWT算法都有較好的水印不可見性,具有很較好的魯棒性。但從算法實現(xiàn)方法上來看,DWT算法和DCT算法各有靈活性。從效果上來看,DWT算法明顯好于DCT算法。這都預示著DWT算法在數(shù)字水印領域有著更廣闊的發(fā)展前景。怎樣評價算法的性能,目前還沒有一個標準可供參考,比如水印的不可見性評價只是一個十分模糊的概念,為了衡量其不可見性,就需要建立一種與視覺特性相匹配的標準,這并不是一件容易的工作。同樣,水印的魯棒性評價也缺乏一個通用標準。5視頻水印概述及算法分析5.1視頻水印的分類對于視頻水印技術可以作如下分類。根據(jù)水印技術與數(shù)字視頻編碼系統(tǒng)結合方式的不同對視頻水印算法主要分為兩類,即基于原始域視頻水印算法和基于壓縮域視頻水印算法。基于原始域視頻水印技術大多來自較為成熟的靜止圖像水印技術,按照水印嵌入過程可分為兩類方案,一種是利用空間域圖像自身特性直接在空間域內完成水印信息的嵌入:另一種是在變換域內進行水印信息嵌入?;趬嚎s域視頻水印技術又可以分為內置式水印算法和后置式水印算法。前者要與視頻壓縮編碼算法整合,在水印嵌入過程中,此類算法具有能夠主動利用編碼過程中產生的各種信息對水印信息嵌入進行實時動態(tài)調控的優(yōu)勢;后置式水印可以不需要完全進行視頻解碼和重編碼的過程,所以能滿足實際應用中水印嵌入不可能在視頻壓縮編碼過程中進行的需求(如視頻點播系統(tǒng)的用戶追蹤,它需要在發(fā)送給不同用戶的視頻碼流中嵌入不同的水印)。另外,此類算法相當于視頻壓縮編碼系統(tǒng)加入的后處理功能,因此幾乎不會影響現(xiàn)有視頻壓縮編碼系統(tǒng)的正常運作,可最大限度的利用現(xiàn)有硬件資源。根據(jù)水印的抗攻擊性可以分為魯棒水印和脆弱水印兩種。魯棒水印能夠抵抗各種有意或無意的攻擊;脆弱水印則對攻擊比較敏感,主要用于篡改提示。本文主要研究魯棒水印。根據(jù)水印的可見性可以分為可見水印和不可見水印。一般研究的是不可見水印。6程序附錄基于小波變換圖像水印(1)clearall;closeall;clc;[filename1,pathname]=uigetfile('*.*','selecttheimage');image1=imread(num2str(filename1));subplot(2,2,1);imshow(image1);title('originalimage');%orginalimageforwatermarkingimage1=double(image1);[row,col]=size(image1);imagew=imread('dmg2.tif');subplot(2,2,2);imshow(imagew);title('watermark');%??ó???è?oˉêyμ÷ó?[marked]=blockdwt2(image1,imagew);%generatesthewatermarkedimage%markedmax=max(marked(:));%markscale=marked/markedmax*255;subplot(2,2,3);colormap(gray(256));image(marked);title('Watermarkedimage');%showsthewatermarkedimageimwrite(marked,gray(256),'marked_image.bmp');%savesthewatermarkedimageasabmpfile%*******??ó?ìáè?1y3ì********watermark=marked-image1;%imageadaptivewatermark%watermark=watermark*255/max(watermark(:))fori=1:row%thresholdingforj=1:colifwatermark(i,j)>0watermark(i,j)=255;endifwatermark(i,j)<0watermark(i,j)=0;endendend[w2h2]=size(watermark);[w3h3]=size(imagew);p=1;q=1;mark=zeros(size(imagew));fori=1:w3:w2forj=1:h3:h2mark=mark+watermark(i:p*w3,j:q*h3);q=q+1;endp=p+1;q=1;endmark=mark/8;subplot(2,2,4);colormap(gray(256));image(mark);title('watermark');%showstheimageadaptivewatermarkimwrite(mark,gray(256),'watermark.bmp');%savestheimageadaptivewatermarkasabmpfile%%%%%%%%%%%%D??ü?à??%%%%%%%%%%%%%image1=imread(num2str(filename1));x0=image1;im

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論