畢業(yè)論文-以數(shù)字圖像為載體的隱寫分析研究進(jìn)展_第1頁
畢業(yè)論文-以數(shù)字圖像為載體的隱寫分析研究進(jìn)展_第2頁
畢業(yè)論文-以數(shù)字圖像為載體的隱寫分析研究進(jìn)展_第3頁
畢業(yè)論文-以數(shù)字圖像為載體的隱寫分析研究進(jìn)展_第4頁
畢業(yè)論文-以數(shù)字圖像為載體的隱寫分析研究進(jìn)展_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

PAGEPAGE4以數(shù)字圖像為載體的隱寫分析研究進(jìn)展摘要:隱寫和反隱寫的對抗是關(guān)系到信息安全的重要課題。本文針對常用隱寫載體之一即數(shù)字圖像,回顧反隱寫技術(shù)的最新進(jìn)展。根據(jù)隱寫技術(shù)快速發(fā)展對反隱寫研究提出的挑戰(zhàn),對近幾年提出的新方法和新思路進(jìn)行梳理和歸納,給出系統(tǒng)和扼要的評述,供隱寫和反隱寫研究者參考。重點(diǎn)圍繞三方面展開討論:對于克服了統(tǒng)計不對稱性的LSB匹配嵌入法如何進(jìn)行有效的檢測或嵌入率估計;對于小嵌入率隱寫進(jìn)行分析的研究中有哪些進(jìn)展;面對層出不窮的隱寫新方法,如何實現(xiàn)不針對具體嵌入算法的通用隱寫分析。對于反隱寫研究的發(fā)展趨勢和面臨的新問題也作了討論。關(guān)鍵詞:隱寫,隱寫分析,LSB匹配,隱寫嵌入率,通用隱寫分析1.引言自上世紀(jì)90年代初以來,信息隱藏作為信息安全中的重要課題引起了國際學(xué)術(shù)界的重視。首先是對保護(hù)多媒體產(chǎn)品版權(quán)的數(shù)字水印研究急劇升溫,公開發(fā)表的論文呈指數(shù)規(guī)律逐年上升,不少開發(fā)數(shù)字水印產(chǎn)品的公司應(yīng)運(yùn)而生。目前數(shù)字水印技術(shù)的發(fā)展勢頭有增無已。對信息隱藏另一重要領(lǐng)域即數(shù)字隱寫(steganography)的研究也隨之跟上,很早就出現(xiàn)了一些簡單的隱寫方法[1]。到世紀(jì)之交開始了對這一領(lǐng)域的廣泛探索。隱寫是以表面上正常的數(shù)字載體如圖像、音頻和視頻等作為掩護(hù),在其中嵌入秘密信息,隱藏的數(shù)據(jù)既不改變載體信號的視聽覺效果,也不改變計算機(jī)文件的大小和格式,因而可實現(xiàn)不為人知的隱蔽通信。含密媒體通常與大量正常媒體資料混在一起,通過各種渠道特別是互聯(lián)網(wǎng)傳播。不同于傳統(tǒng)密碼通信的是,“正在進(jìn)行通信”這一事實本身也被隱藏起來了,因而可用于重要消息的安全傳遞。隨著信息隱藏技術(shù)的快速發(fā)展,大量隱寫方法涌現(xiàn)出來,人們可以方便地獲取和使用多種隱寫工具。然而對這些工具的濫用卻嚴(yán)重威脅著網(wǎng)絡(luò)信息安全,因此研究反隱寫技術(shù)是有關(guān)領(lǐng)域研究者面臨的緊迫任務(wù)。最重要的反隱寫技術(shù)是隱寫分析(stegananalysis),也就是根據(jù)載體的統(tǒng)計特性判斷其中是否含有額外的隱蔽信息。隱寫分析也可以包括“定量分析”(quantitativesteganalysis)或“主動分析”(activesteganalysis)[2],即除了檢測秘密信息的存在性,還要估計嵌入的秘密信息量[3]、估計密鑰[4]、識別所用的隱寫工具、截獲隱蔽信息等。隱蔽信息的截獲被認(rèn)為是隱寫分析的終極目標(biāo),但目前關(guān)于這方面的研究進(jìn)展報道非常罕見。以檢測有無可疑嵌入信息、估計嵌入數(shù)據(jù)量為基本目標(biāo)的隱寫分析迄今為止仍是最重要的反隱寫措施。實際上對隱寫的有效分析要比隱寫本身更困難,這是因為各類數(shù)字載體數(shù)量巨大,嵌入方法千變?nèi)f化,從中搜尋隱蔽信息猶如大海撈針。隱寫存在性檢測的重要意義在于:一旦數(shù)字媒體中含有隱蔽信息的事實受到懷疑,隱寫行為即告失敗。成功的隱寫分析是追蹤信息源頭、切斷敵對隱蔽信道的前提。另外還可以根據(jù)檢測結(jié)果實施主動攻擊(activeattack),刪除嵌入信息或使之不能被提取,達(dá)到阻止隱蔽通信的目的。隱寫和反隱寫的對抗是網(wǎng)絡(luò)時代信息戰(zhàn)的重要內(nèi)容之一[5],在這一相對年輕的研究領(lǐng)域中已涌現(xiàn)了大量的成果。歷年來人們從不同的角度對前期研究情況進(jìn)行過概括和綜述[6-11],提供了有價值的參考資料。由于相關(guān)研究的發(fā)展速度很快,有必要對近幾來的最新研究情況進(jìn)行歸納和梳理,著重討論一些重要的發(fā)展方向,供研究者參考。我們根據(jù)隱寫技術(shù)的新發(fā)展對反隱寫研究提出的挑戰(zhàn),探討隱寫分析中針對若干難題的最新研究動態(tài)??捎糜陔[寫的載體中,以數(shù)字圖像的使用最為廣泛。本文主要討論以圖像為載體的隱寫分析問題,其中包括未經(jīng)壓縮和曾經(jīng)過JPEG壓縮而又保存為非壓縮格式的情況。對JPEG格式圖像的隱寫分析涉及較少,有關(guān)問題將另外單獨(dú)考慮。第2節(jié)簡要回顧早期隱寫分析方法,第3~5節(jié)討論近年來具有代表性的新進(jìn)展,分別考慮對LSB匹配嵌入的分析技術(shù)、對小嵌入量的隱寫分析、不針對具體嵌入方法的通用檢測這三個主要問題。近年來在隱寫技術(shù)的改進(jìn)和實際應(yīng)用方面還出現(xiàn)了一些新的動向和新的思路,向反隱寫研究者提出了亟待解決的新課題,我們將在第6節(jié)對此進(jìn)行扼要的闡述。第7節(jié)是本文小結(jié)。2.早期隱寫分析研究概況早期隱寫方法(如簡單LSB替換、EzStego、J-Steg、JPHide&Seek、OutGuess、Jpeg-Jsteg、F5等)大多可保證優(yōu)良的含密圖像視覺質(zhì)量,通過視覺無法察覺疑點(diǎn)。但由于對統(tǒng)計特性考慮較少,這些方法很快就被證明在嵌入量足夠大的情況下在統(tǒng)計上是不安全的。簡單LSB替換方法雖然僅對載體圖像進(jìn)行微小的修改,但仍會在最低位面產(chǎn)生某些異常特性而容易被識別出來。這首先是因為圖像最低位并不總是0和1的均勻隨機(jī)分布,在某些區(qū)域呈現(xiàn)與內(nèi)容有關(guān)的結(jié)構(gòu),LSB替換會破壞這種結(jié)構(gòu)。不僅如此,簡單地用隱蔽數(shù)據(jù)替換LSB還會引入統(tǒng)計上的不對稱性,為分析者提供了可靠檢測的線索。很早就出現(xiàn)了針對LSB嵌入法的有效檢測方法。例如Westfeld等[12]不僅對某些隱寫圖像的最低位面方法進(jìn)行了視覺檢測,還提出直方圖分析法,利用信息嵌入后每一對象素灰度、顏色指數(shù)、變換系數(shù)值分布趨于均勻的性質(zhì)設(shè)計2檢驗,對有無隱寫進(jìn)行判斷,并估計隱蔽數(shù)據(jù)長度。雖然通過改進(jìn)設(shè)計嵌入方法能保持像素對的值不變從而挫敗這種分析[13],但很快就又被成功地檢測出來[14]。Fridrich等人的RS分析法[15][16]利用圖像空間相關(guān)性導(dǎo)出靈敏的雙重統(tǒng)計量。他們指出圖像LSB可在一定程度上由其它位面預(yù)測,篡改LSB會削弱這種可預(yù)測性,從而導(dǎo)致有效的隱寫分析。研究還表明,在JPEG圖像中進(jìn)行空域嵌入會改變量化引起的數(shù)據(jù)統(tǒng)計結(jié)構(gòu),因而容易被識破[17]。LSB隱寫不僅可直接修改像素本身,也可在變換域?qū)崿F(xiàn),因此也適用于JPEG圖像。常用的J-Steg是對JPEG圖像中分塊DCT的某些量化系數(shù)值進(jìn)行LSB嵌入,因此也可用類似的分析方法進(jìn)行成功的檢測。研究者又指出,在DCT量化系數(shù)上進(jìn)行LSB隱寫會增加塊效應(yīng),通過構(gòu)造參考圖像可估計原始DCT系數(shù)直方圖[14]。針對一種經(jīng)過多次改進(jìn)的JPEG圖像隱寫方法F5[18],在水平和垂直兩個方向分別剪裁4個像素,用原來的量化表對重新得到的88分塊進(jìn)行量化,通過與待檢測圖像的比較,判斷DCT量化系數(shù)的直方圖是否收縮實現(xiàn)了成功的分析[19]。張濤和平西建于2003年提出基于差分圖像直方圖的檢測方法[20],他們將待測圖像的LSB位面置0,將其差分直方圖與待檢測圖像的差分直方圖相比較,可由某一轉(zhuǎn)換系數(shù)導(dǎo)出用于判斷LSB是否被秘密信息替換過的物理量,而且這個量與嵌入數(shù)據(jù)量之間存在一定的關(guān)系,因而可以估計出隱蔽信息的長度。一種對LSB嵌入法的改進(jìn)是位面復(fù)雜度分割(BPCS),將載體多個位面分成大小相等的塊,用復(fù)雜度高的位面小塊承載秘密信息[21]。但含密圖像的位面小塊復(fù)雜度直方圖存在兩個明顯的不連續(xù)點(diǎn),據(jù)此可實現(xiàn)對BPCS隱寫的分析[22],由復(fù)雜度直方圖的不連續(xù)性可判斷秘密信息存在性,并確定秘密信息塊的復(fù)雜度范圍,測算秘密信息嵌入量。該方法也適用于變換域位面復(fù)雜度分割隱寫。調(diào)色板圖像也是常用隱寫載體,調(diào)整調(diào)色板中的顏色可降低隱寫失真,但調(diào)色板異常會引起監(jiān)控者的懷疑[23][24]。另一種方法是不改變調(diào)色板,而將顏色進(jìn)行奇偶分配用以代表秘密數(shù)據(jù)[25],但通過最低位面混亂度和逆嵌入操作后的奇異顏色像素個數(shù)可察覺秘密信息的存在[26]。另外還可用一種稱為PairAnalysis的高階統(tǒng)計量方法對典型的調(diào)色板圖像隱寫工具EzStego進(jìn)行分析并估計信息嵌入量,可檢測的最小信息量為每像素0.1比特,性能優(yōu)于過去提出的2法和RS法[27]。早期簡單隱寫方法所產(chǎn)生的統(tǒng)計不對稱性、直方圖異常、調(diào)色板異常等現(xiàn)象已能被多種方法檢測出來,因此在某種意義上這些方法早已不再安全。但是隨著反隱寫研究的發(fā)展,改進(jìn)的嵌入方法很快地出現(xiàn),克服了早期技術(shù)的明顯缺陷。例如用匹配嵌入的方法消除LSB替換所引入的統(tǒng)計不對稱性就使統(tǒng)計分析更為困難。即使最簡單的LSB替換,當(dāng)嵌入量很小時,要可靠檢測還是一個難題。解決這一難題仍有現(xiàn)實意義,因為LSB替換極容易實現(xiàn),有研究者指出只需一條Unix命令而不必求助于任何隱寫工具就可以進(jìn)行LSB嵌入[28]。另外,嵌入方法層出不窮使得針對具體嵌入技術(shù)設(shè)計分析方法的反隱寫方捉襟見肘,難以應(yīng)付。所有這些都促使隱寫分析技術(shù)不斷地深入發(fā)展。3.針對LSB匹配隱寫的分析LSB替換的主要安全漏洞在于僅存在2i和2i1之間的轉(zhuǎn)換,而不存在2i和2i1之間的轉(zhuǎn)換,這就導(dǎo)致了具有成對灰度值的像素數(shù)趨于相等的現(xiàn)象。避免這種統(tǒng)計異常性的最簡單方法就是LSB匹配嵌入[29]:當(dāng)嵌入的比特與像素值最低位相同時,像素值不變;不同時隨機(jī)選擇1或1。于是上述兩種轉(zhuǎn)換以相等的概率出現(xiàn),統(tǒng)計不對稱現(xiàn)象不再存在,而引起的圖像失真卻不變。嵌入信息的提取和簡單LSB替換時一樣,只要取出最低位面就可以了。LSB匹配嵌入又常被稱為1隱寫。本節(jié)著重討論對像素域LSB匹配嵌入的分析,包括圖像是否曾經(jīng)被JPEG壓縮過兩種情況。Westfeld提出了一種基于統(tǒng)計相鄰顏色數(shù)的分析方法[30],可檢測經(jīng)過JPEG壓縮的彩色圖像中的LSB匹配隱寫。兩個顏色[r1,g1,b1]和[r2,g2,b2],若滿足|r1r2|1,|g1g2|1,|b1b2|1,則稱為相鄰顏色,每種顏色最多有26種相鄰顏色。JPEG載體圖像中相鄰顏色較少,平均為4~5種,通常最多不超過9種。用LSB匹配法嵌入數(shù)據(jù)會產(chǎn)生大量相鄰顏色,許多顏色甚至?xí)_(dá)到26種相鄰色的極限值。計算相鄰顏色的平均數(shù),例如對于載體圖像是2.20,在嵌入量為100%(每一彩色像素嵌入3比特)時上升到5.58。若以最大相鄰顏色數(shù)為統(tǒng)計檢驗量[28],則對于任何經(jīng)JPEG壓縮過的圖像,即使嵌入率低到1%也能可靠檢測。但是對于從未進(jìn)行過JPEG壓縮的圖像,或者Harmsonetal.[31]將圖像直方圖hC(n)的離散Fourier變換HC(k)稱為直方圖特征函數(shù)(histogramcharacteristicfunction,HCF)。他們認(rèn)為含密圖像可看作載體圖像與加性噪聲之和,因此含密圖像的直方圖hS(n)是hC(n)和噪聲概率分布函數(shù)f(n)的卷積。無論是LSB替換還是LSB匹配嵌入,引入的噪聲均具有下列概率分布: (1)其離散Fourier變換F(k)=cos2(k/N)在k=0,1,...,N/2內(nèi)從1單調(diào)下降至0,因此含密圖像的HCF總是小于載體圖像的HCF: (2)下標(biāo)C表示載體,S表示隱寫。k是“直方圖譜”的自變量,物理意義不直觀??紤]k[0,1,...,N/2]的總效果,定義HCF的質(zhì)心(centerofmass,COM)如下: (3)可利用下列不等式實現(xiàn)對含密圖像的檢測: (4)直方圖特征函數(shù)(HCF)及其質(zhì)心(COM)的概念建立在加性噪聲模型上,可成為檢測LSB匹配隱寫的基礎(chǔ)。Ker在此基礎(chǔ)上發(fā)展了一組有效的方法,以下著重討論Ker的分析技術(shù)。Ker在[32]中指出,Harmsen的方法直接用于對灰度圖像LSB匹配隱寫的盲檢測并不成功,這是因為不同載體圖像之間的C[H]差異太大,通常超過載體和含密圖像C[H]之間的差異(見圖1),在沒有原始載體圖像的情況下檢測器是無法知道C[HC]的。圖1嵌入數(shù)據(jù)前(圓點(diǎn))后(叉形)圖像的C[H]值變化[32]為此,Ker通過計算22像素塊的平均值將載體圖像和含密圖像分別縮小到原來的1/4。載體圖像縮小后C[HC]總體上沒有變化。對于用LSB匹配嵌入的含密圖像,C[H*S]還是小于C[H*C],只是變小的程度有所下降(上標(biāo)星號表示亞取樣縮小圖像)。由于C[HC]/C[H*C]對不同載體圖像基本一致,因此用C[H]/C[H*]作隱寫檢測的統(tǒng)計量便實現(xiàn)了對COM的校正,消除了不同載體的影響。由于灰度圖像僅有256種不同的灰度值(遠(yuǎn)少于彩色圖像中的顏色種類),因此直方圖十分稀疏,使得基于HCF的方法效果不佳。Ker引入的第二項改進(jìn)是計算相鄰像素的二維直方圖: (5)相應(yīng)地用二維DFT定義HCF和COM。經(jīng)改進(jìn),對LSB匹配的檢測性能(receiveoperatingcharacteristic,ROC)如圖2示[32],其中左圖由20,000幅曾經(jīng)JPEG壓縮的圖像得到,右圖由3,000幅從未壓縮過的圖像得到,嵌入率均為100%。淺色實線為HCFCOM方法,帶圓點(diǎn)的淺色線為經(jīng)校正的HCFCOM法,深色實線為基于二維直方圖的HCFCOM方法,帶圓點(diǎn)的深色線為經(jīng)過校正并用二維直方圖的HCFCOM方法??梢娫谔摼怕市∮?0%的條件下,校正的二維直方圖HCFCOM性能最佳。由圖2可知,對于曾經(jīng)JPEG壓縮過的圖像,當(dāng)LSB匹配嵌入量很大時已能可靠檢測,對從未壓縮過的圖像也能進(jìn)行檢測,不過性能較差。由于是基于加性噪聲模型的,該方法也可對其他隱寫方法產(chǎn)生的含密圖像進(jìn)行檢測,但對于小嵌入量無效。圖2隱寫分析性能:橫軸為虛警概率,縱軸為檢測概率[32]在應(yīng)用HCFCOM檢測彩色圖像中的LSB匹配隱寫時遇到了計算復(fù)雜度的困難[30],因為涉及到的顏色數(shù)量為2563,DFT的計算時間復(fù)雜度為O(N3logN),將這種基本的HCFCOM方法記為C13D。為了降低計算復(fù)雜度,Harmsen曾建議分別考慮RGB三色,計算3個一維HCF,由3個COM構(gòu)成三維統(tǒng)計檢驗向量(記為C31D),時間復(fù)雜度下降為O(NlogN);或者將3種顏色兩兩組合成RG、GB、BR,計算3個二維直方圖的DFT,將3個二維COM組合成6維統(tǒng)計檢驗向量(記為C32D),時間復(fù)雜度為O(N2logN)[33]。Ker對這幾種不同的HCFCOM實現(xiàn)方法進(jìn)行了大量測試比較,發(fā)現(xiàn)C31D的性能很差,而C32D則接近于基本的C13D,這幾種方法均能有效檢測嵌入量為30%~100%的曾經(jīng)JPEG壓縮圖像,也能檢測JPEG后又重新采樣的圖像,對從未壓縮過的圖像則只能檢測接近100%嵌入率的圖像??梢娺@種方法優(yōu)于Westfeld[30]的早期方法。在[28]中,Ker將對Harmsen方法的改進(jìn)(COM的載體圖像校正和二維直方圖[32])擴(kuò)展到彩色圖像。由于計算平均顏色時引入的舍入誤差使得用于黑白圖像的22像素組平均法對于彩色圖像效果不佳,因此改為水平方向的圖像“壓扁”: (6)顯然,在對壓扁的圖像C'計算HCFCOM時,涉及的灰度值范圍會加倍,使DFT的計算量大增。Ker將三個顏色通道相加成為一維信號,因為他認(rèn)為LSB匹配嵌入使各顏色分量獨(dú)立地加入了同樣強(qiáng)度的噪聲。實驗表明,這種檢測器能有效檢測5%的嵌入率,對于JPEG壓縮后又改變尺寸的圖像,可檢測50%的嵌入率,但是對從未壓縮過的圖像檢測效果不佳。對于未經(jīng)過JPEG壓縮的圖像檢測難度明顯高于經(jīng)過JPEG的圖像,是此類隱寫分析技術(shù)的共性。綜上所述,由于HCF可反映因隱寫嵌入而導(dǎo)致的直方圖變化,所以可用于檢測。從最初的HCFCOM,到通過亞取樣實現(xiàn)對COM的校正,克服了無法設(shè)定閾值的困難,進(jìn)而考慮二維直方圖重新定義HCFCOM,檢測性能逐步得到提高。但是基于校正和二維直方圖的HCFCOM方法計算復(fù)雜度過高,為此將顏色分量進(jìn)行適當(dāng)?shù)慕M合,使該方法可有效地用于對彩色圖像的隱寫分析。對于LSB匹配嵌入的另一種分析方法是將LSB匹配嵌入看成兩個集合序列之間的狀態(tài)轉(zhuǎn)移[34]。對于一幅可能含密的待分析圖像,用自適應(yīng)小波降噪法估計其原始載體,計算待檢測圖像和估計的載體圖像平滑區(qū)域的狀態(tài)轉(zhuǎn)移參數(shù),根據(jù)Kullback-Leibler距離可估計嵌入率。4.小嵌入量隱寫分析近年來對于LSB匹配嵌入法的檢測已經(jīng)取得了較大的進(jìn)展,特別是對曾經(jīng)過JPEG壓縮的圖像,即使嵌入量較低也能實現(xiàn)有效的檢測。但是與此同時,隱寫嵌入方法也在不斷改進(jìn)。研究者在LSB匹配隱寫中引入了各種編碼方法,使嵌入相同數(shù)據(jù)量對載體所作的修改量減小。例如通過不同的編碼技術(shù)利用LSB匹配嵌入中的隨機(jī)1嵌入額外信息,使每一像素的秘密信息承載量從1比特提高到log23比特[35-39];進(jìn)一步利用次最低位而不增加嵌入引起的失真可進(jìn)一步增加嵌入量[40]等。這些新方法的出現(xiàn)進(jìn)一步提高了分析的難度,研究更為有效的檢測方法是對隱寫分析研究者提出的新課題。實際上,即使是簡單的LSB替換嵌入,對于低嵌入率的隱寫分析仍十分困難。第3節(jié)已提到的Westfeld方法具有檢測極低嵌入率的能力,但僅限于對曾經(jīng)JPEG壓縮而且后來未經(jīng)縮放等處理的彩色圖像[28][30]。近年對小嵌入率的隱寫分析有了新的進(jìn)展。在早期RS和2分析等方法之后,陸續(xù)提出了一些基于像素對的隱寫分析方法[20][27][41][42],這些方法都利用了LSB嵌入法中像素組合的結(jié)構(gòu)特性,其中最典型的是[41]的樣本對分析法(samplepairanalysis,SPA)和隨后提出的對SPA的改進(jìn)[42]。SPA作為LSB分析的有效方法明顯優(yōu)于RS法,引起了研究者的關(guān)注。隨后即出現(xiàn)了對SPA的推廣和拓展,這方面的工作以Ker的研究最具代表性。下面以此為線索討論近年來圍繞小嵌入率隱寫分析所取得的進(jìn)展。Ker將這些基于像素對的方法推廣為以g個像素(樣本)為一組,建立了樣本組分析的一般框架,并且具體討論了g=3的情況[43],將它稱為“三元分析”(triplesanalysis,簡稱Triples)。沿水平方向取三個相鄰像素為一組(包含垂直方向像素的方法給出類似結(jié)果),實驗表明這種基于一般框架的三元分析在嵌入率較低時給出了優(yōu)于SPA的結(jié)果。圖3是對3,000幅曾經(jīng)JPEG壓縮(Q=75)的圖像用Triples和RS、SPA估計嵌入率的結(jié)果,在不同嵌入率p下計算估值的標(biāo)準(zhǔn)差,橫軸表示嵌入率p,實驗中p從0到1的取值間隔為0.05。三種方法對p的估計都是無偏的,但在小嵌入率時Triples估值的標(biāo)準(zhǔn)差大大低于RS和SPA。當(dāng)嵌入率大時Triples的性能不理想。圖3對LSB嵌入率估計的標(biāo)準(zhǔn)差,小嵌入率時Triples具有明顯優(yōu)勢[43]Ker在此前發(fā)表的論文[44]表明,將嵌入率估計器(定量隱寫分析)用于判斷有無嵌入信息(二元隱寫分析)時性能不一定是最佳的,因此需根據(jù)應(yīng)用要求選擇適當(dāng)?shù)姆椒?,?gòu)成檢測器或估計器。將Triples法用于檢測圖像中有無隱蔽信息時,需要消除載體圖像之間差異對檢測的影響。用Triples檢測器對3,000幅曾經(jīng)JPEG壓縮(Q=75)的圖像在嵌入率為2%時進(jìn)行檢測,得到的ROC見圖4中帶黑點(diǎn)的曲線。圖中同時給出的是將Triples估計器(光滑曲線)和RS估計器(帶三角的曲線)用于檢測時的ROC,以及另外兩種基于像素對的檢測器[45]性能(帶方塊和星號的曲線)。若以[44]中提出的單一參數(shù)即漏檢率為50%時的虛警概率大小來衡量,Triples檢測器相對于其他方法的優(yōu)勢十分明顯。此時RS估計器的虛警概率高達(dá)40%,說明已完全無效。圖4嵌入率為2%時的Triples檢測器ROC,性能最好的帶黑點(diǎn)曲線為Triples檢測器結(jié)果[43]進(jìn)一步擴(kuò)展到4個像素一組時,盡管檢測性能略有提高,但計算復(fù)雜度卻大幅度增加[45]。由于4階方法可提供對載體圖像特性的更好描述,預(yù)計采用4階檢測器將可提供最優(yōu)性能,但繼續(xù)向更高階的分析發(fā)展則意義不大。用SPA和Triples等方法估計隱寫嵌入率時,估計誤差的起伏往往很大,而且受到載體圖像特性差異的嚴(yán)重影響。對這種誤差的深入研究可望給出嵌入率估計置信度,從而有效地改進(jìn)估計器性能。針對SPA[41]方法的最小二乘(LMS)變種[42],Ker將它用于分析簡單的LSB替換法,導(dǎo)出了對載體圖像的估計結(jié)果分布,并由此構(gòu)建了改進(jìn)的加權(quán)最小二乘估計器。B?hme和Ker對隱寫嵌入率估計誤差進(jìn)行了實驗研究[46],并針對LMS估計法進(jìn)行了理論研究[47]。他們將估計誤差分為兩部分:由嵌入數(shù)據(jù)引起的圖像內(nèi)誤差和由載體圖像引起的圖像間誤差。關(guān)于誤差模型將在第6節(jié)討論。對誤差的研究表明,LMS/SPA對嵌入率的估計誤差呈現(xiàn)輕微的負(fù)偏差,對不同載體圖像,分布函數(shù)有明顯偏高的尾部,說明有較多的估計結(jié)果誤差較大?;贚MS的分析方法在理論上導(dǎo)出了載體圖像模型以及嵌入率估計的概率分布,對于改進(jìn)LMS估計器有重要意義,其成果就是加權(quán)的最小二乘估計(WLMS),包括用于像素對的Couples/WLMS,以及推廣到Triples估計器的Triples/WLMS方法[48]。實驗所比較的5種估計器為:1)等價于SPA的Couples方法;2)等價于SPA/LMS的Couples/LMS方法;3)Couples/WLMS;4)Triples/LMS;5)Triples/WLMS。圖5是文獻(xiàn)[48]給出的對兩組各3,000幅圖像的部分實驗結(jié)果(對WLMS估計器進(jìn)行了偏差校正),可見Triples/WLMS估計結(jié)果具有最小的標(biāo)準(zhǔn)差,因而性能最優(yōu)。對黑白圖像得到的結(jié)果與此類似。實驗中比較了7種檢測器:1)標(biāo)準(zhǔn)RS檢測器;2)Couples檢測器;3)Couples/LSM;4)無偏差校正的Couples/WLSM;5)標(biāo)準(zhǔn)化Couples/WLSM;6)Triples/LMS;7)Triples/WMLS。對4組各3,000幅圖像進(jìn)行檢測,表1列出了能被可靠檢測的最小嵌入率,精確到0.001。所謂可靠檢測是指虛警概率5%和漏檢概率50%。同樣可見Triples/WMLS的性能最優(yōu)。總之,通過將SPA中僅考慮基于像素對(即二元組)的分析,推廣到三元組,對于小嵌入率時隱蔽信息嵌入量估計的質(zhì)量明顯提高了。進(jìn)而推廣到四元組,性能略有提高但計算量劇增,因此采用三元組是合適的。隨后的進(jìn)一步工作涉及對隱寫嵌入率估計的誤差進(jìn)行研究,同樣驗證了三元組法的優(yōu)勢。以上所討論的隱寫檢測器或嵌入率估計器都是針對空域LSB方法的,載體圖像是彩色或黑白位圖,它們有可能曾經(jīng)被JPEG壓縮過,也可能從未被壓縮過。近來Barbier等人提出了一種針對JPEG圖像的隱寫分析方法,可檢測用OutGuess、F5、HideandSeek進(jìn)行極小嵌入量隱寫所生成的含密圖像[49]。該方法根據(jù)JPEG編碼中無損壓縮環(huán)節(jié)(游程編碼和Huffman編碼)的所謂“雪崩準(zhǔn)則”[50]提出新的統(tǒng)計特征,這一統(tǒng)計量與嵌入率無關(guān),而對圖像中是否含有嵌入數(shù)據(jù)異常敏感,因而可利用隱寫嵌入引起壓縮數(shù)據(jù)熵的明顯變化來判斷圖像是否含有隱寫嵌入信息。具體的檢測是通過Fisher分類器來實現(xiàn)的,據(jù)報道甚至可檢測低到105的隱寫嵌入率。(a)載體為從未壓縮過的3,000幅彩色圖像(b)載體為曾經(jīng)JPEG壓縮過的3,000幅彩色圖像圖5比較5種估計器:橫軸是嵌入率,左側(cè)為不同嵌入率下的估計偏差,右側(cè)為估計的標(biāo)準(zhǔn)差[48]表1對7種隱寫檢測器的性能比較從未壓縮過的BMP曾經(jīng)JPEG壓縮過黑白彩色黑白彩色RS0.0360.0540.0230.283Couples0.0360.0520.0180.220Couples/LMS0.0450.0600.0220.068Couples/WLMS0.0400.0560.0160.063標(biāo)準(zhǔn)化Couples/WLMS0.0600.0370.0800.156Triples/LMS0.0330.0410.0140.026Triples/WLMS0.0280.0350.0110.0255.通用隱寫分析我們可將隱寫分析技術(shù)分為兩大類:1)針對特定隱寫工具或某一類嵌入技術(shù),根據(jù)隱寫所引起的載體數(shù)據(jù)統(tǒng)計特性異常來設(shè)計檢測器或估計器;2)并不針對某一特定的隱寫方法,而是對未知隱寫工具所產(chǎn)生的含密媒體進(jìn)行檢測,構(gòu)建通用檢測器。第二類面向未知隱寫工具的通用分析有時又被稱為“盲檢測”,但這里的“盲”不應(yīng)與僅根據(jù)待檢測載體的Stego-only隱寫分析相混。以上兩節(jié)中Harmsen和Ker等人根據(jù)隱寫的加性噪聲模型進(jìn)行的分析實際上并不針對特定嵌入方法,因此也可歸為“通用”檢測一類。但目前大多數(shù)通用隱寫分析都是建立在特征提取和設(shè)計分類器的基礎(chǔ)上的,本節(jié)圍繞此類方法討論近年來提出的一些代表性成果。最早用分類器方法進(jìn)行通用隱寫檢測的工作是Memonetal.在2001~2003年期間發(fā)表的[51-53]。他們同時考慮面對主動攻擊的數(shù)字水印和面對被動檢測的隱寫,認(rèn)為不論用什么方法嵌入的額外信息在載體中均會留下統(tǒng)計異常,使圖像質(zhì)量受到輕微的損傷。他們用質(zhì)量測度和多變量回歸分析進(jìn)行通用隱寫檢測,基于方差分析(analysisofvariance,ANOVA)提取質(zhì)量參數(shù)作為特征集用于區(qū)分載體圖像和含密圖像,用對原始圖像的估計進(jìn)行訓(xùn)練。選擇適當(dāng)?shù)木嚯x測度,使得在特征空間里載體與參考圖像之間的距離明顯區(qū)別于含密圖像和參考圖像之間的距離。參考圖像由不含密的載體圖像經(jīng)Gauss低通濾波得到。研究表明該方法對不同的隱寫技術(shù)有適應(yīng)性,在未知嵌入方法的情況下對圖像中是否含有秘密信息具有鑒別能力。表2是[53]給出的實驗結(jié)果,可見早期通用檢測方法效果并不理想。表2基于圖像質(zhì)量測度的通用隱寫分析性能嵌入工具或方法虛警漏檢正確檢測正確率%Digimarc2/102/1016/2080PGS2/101/1017/2085Cox4/102/1014/2070Pooledwatermarking3/103/1014/2070用Gigimarc訓(xùn)練,用PGS和Cox測試5/102/1013/2065Steganos2/51/57/1070Stools4/101/1015/2075Jsteg3/103/1014/2070Pooledsteganography5/100/1015/2075用Steganos和Stools訓(xùn)練,用Jsteg測試3/103/1014/2070Pooledwatermarking和steganography5/101/1014/2070用Digimarc,PGS,Steganos,Stools訓(xùn)練,用Cox和Jsteg測試4/103/1013/2065另一種早期技術(shù)由Farid等人提出,他們用類似于小波的正交鏡像濾波器[54](quadraturemirrorfilters,QMF)將圖像分解為多尺度水平、垂直、對角方向和低頻分量,使用最佳線性預(yù)測器,計算預(yù)測誤差的前4階矩:均值、方差、偏斜、峭度。用Fisher線性分類器(FLD)[55][56]和支持向量機(jī)(SVM)[57]進(jìn)行分類以區(qū)分載體和含密圖像,見圖6。用1,800幅大小為640480的載體圖像和1,800幅以各種方法嵌入數(shù)據(jù)的含密圖像進(jìn)行訓(xùn)練。測試圖像不在訓(xùn)練集內(nèi)。對JPEG圖像用Jsteg和OutGuess,對GIF圖像用EzStego,對TIFF圖像用LSB進(jìn)行隱寫,GIF圖像和TIFF圖像由JPEG圖像轉(zhuǎn)換得到。在使用FLD和線性SVM時均選擇適當(dāng)?shù)膮?shù)使虛警概率保持為1%。檢測結(jié)果表明兩種分類器性能相近。用非線性SVM時性能有所改進(jìn)。檢測結(jié)果見圖7,縱軸為檢測概率,(a)-(c)分別為FLD、線性SVM、非線性SVM,虛警為1%時的結(jié)果,(d)為非線性SVM虛警為0的結(jié)果。橫軸下的數(shù)字表示嵌入數(shù)據(jù)量??梢娺@種通用檢測器可用于檢測多種隱寫工具產(chǎn)生的含密圖像,但不同情況下性能有較大差異??偟膩碚f,對JPEG圖像的檢測效果較好,非線性SVM的性能優(yōu)于其他分類器。由于新的隱寫方法不斷出現(xiàn),通用隱寫分析的重要性日益突出,因此近幾年對這一類方法的研究明顯加強(qiáng),出現(xiàn)了許多有效的方法。Fridrich提出了一種基于特征的隱寫分析法用來檢測JPEG圖像[58],其目的是檢驗JPEG隱寫算法性能,評價嵌入機(jī)制。她的檢測方法用載體和含密圖像訓(xùn)練線性分類器,由含密圖像的DCT系數(shù)邊緣統(tǒng)計特性和聯(lián)合統(tǒng)計特性計算一系列特征量(Fridrich稱之為泛函,functional),包括17個一階量(5個DCT低頻系數(shù)直方圖,全局DCT直方圖,11個DCT系數(shù)對直方圖)、4個二階量(系數(shù)方差和由共生矩陣導(dǎo)出的3個量,反映塊間DCT系數(shù)的依賴性)、2個分快特征量(空域中沿88塊邊界的跳變量之和)。然后對圖像進(jìn)行解壓縮、幾個像素的輕微剪裁、再用同一量化矩陣重新壓縮來估計載體圖像的特征量。由兩組統(tǒng)計量之間的差異得到特征量,可根據(jù)求得的特征判斷隱寫嵌入對圖像影響的可檢測性。由于JPEG圖像的DCT域?qū)﹄[寫嵌入最為敏感,該方法可望導(dǎo)致對JPEG圖像進(jìn)行隱寫分析的良好性能。QMFQMF圖像分解均值、方差偏斜、峭度支持向量機(jī)分類器Fisher線性分類器或圖6Farid的通用隱寫檢測器圖7用FLD、線性和非線性SVM的檢測結(jié)果[58]應(yīng)用上述基于DCT的特征,Pevnu和Fridrich又構(gòu)造了應(yīng)用Gauss核的非線性SVM分類器,用于對JPEG圖像進(jìn)行隱寫檢測[59]。測試對象是3,436個不同來源的35,000幅原始圖像,用質(zhì)量因子75進(jìn)行JPEG壓縮產(chǎn)生載體圖像。包括兩種情況:1)二元檢測,區(qū)分無嵌入數(shù)據(jù)的載體圖像和以下幾種隱寫算法之一:F5,MB1,OutGuess分別嵌入100%、50%、25%,MB2嵌入率為MB1容量的30%,以及JPHide嵌入圖像尺寸的10%,測試結(jié)果見表3;2)用n(n1)/2次二元檢測組合成多元檢測,以判斷含密圖像是哪一種嵌入方法產(chǎn)生的,結(jié)果見表4??梢妼κ欠窈艿臋z測結(jié)果令人滿意,對不同嵌入工具具有較好的鑒別能力。對未參與訓(xùn)練的JPHide,大部分判為F5和MB1,反映它們的嵌入機(jī)制具有一定的相似性。測試結(jié)果發(fā)現(xiàn)基于DCT的方法優(yōu)于使用72個特征的小波方法[60],這是因為在DCT域提取JPEG圖像特征最為匹配,而小波則適合于更普遍的情況。根據(jù)[59]的作者觀察,誤判與圖像噪聲較強(qiáng)有一定的聯(lián)系。表3非線性SVM二元分類器性能嵌入算法默認(rèn)閾值調(diào)整閾值使虛警1%判為載體判為含密判為載體判為含密F5100%25325529MB1100%35303530OutGuess100%35315529F550%25327527MB150%25314529OutGuess50%35314530MB230%2750673460F525%54480149385MB125%3849590443OutGuess25%552910524JPHide652810524載體515195277表4非線性SVM多元分類器性能嵌入算法載體F5MB1MB2OutGuessF5100%2531100MB1100%3052613OutGuess100%2000532F550%4500710MB150%37506125OutGuess50%3130527MB230%814174922F525%1746327261MB125%1626411755OutGuess25%471623484JPHide9334158276載體51054150早期通用分析對JPEG圖像頻域隱寫工具的檢測性能較好,但對空域法的分析能力不理想,并嚴(yán)重依賴所用的訓(xùn)練圖像和測試圖像。Holotyak和Fridrich等人[61]于2005年提出用小波域高階統(tǒng)計量進(jìn)行分類的三步框架:估計隱寫信號,提取特征,分類。將含密圖像看成載體與隱寫信號之和: (7)其中g(shù)為嵌入算法,s為嵌入的秘密信息,K為密鑰。將含密圖像的小波變換看成非平穩(wěn)Gauss載體和隱寫信號的混合。為了用閉合形式來表示,將隱寫信號近似描述為平穩(wěn)Gauss過程N(yùn)(0,2)。應(yīng)用小波變換來估計g(s,K),目的是獲得對隱寫敏感的信號成分而盡量降低載體對檢測的影響。特征提取是關(guān)鍵步驟。從隱寫成分g中提取的特征具有對隱寫敏感而對圖像內(nèi)容不敏感的優(yōu)點(diǎn)。對載體圖像和含密圖像計算g(s,K)的一級小波分量,其直方圖如圖8。圖中虛線和實線分別對應(yīng)于載體圖像和由1嵌入產(chǎn)生的隱寫圖像,可見載體和含密圖像在直方圖(概率密度函數(shù)PDF)的尾部有明顯差異。將兩個直方圖映射至適當(dāng)?shù)膮?shù)空間可計算其歐氏距離而不必知道PDF的具體形式。研究表明,最低的幾階偶數(shù)矩不能區(qū)分載體和含密圖像,只有高階矩才能反映PDF尾部的差異。圖8載體圖像(虛線)和1隱寫圖像(實線)的一級小波分解直方圖,縱軸取對數(shù)尺度[61]圖9(a)是用FLD進(jìn)行分類時的正確率與矩的階數(shù)之間的關(guān)系??梢婋S著階數(shù)的提高,正確分出載體圖像的概率下降,而檢測含密圖像的概率則增加,直到18階以后這一概率也逐漸下降。圖9(b)是將兩個正確檢測概率相乘(聯(lián)合概率),可知獲得最佳檢測效果的最低階數(shù)為12。取聯(lián)合概率大于0.5(即優(yōu)于隨機(jī)猜測)的所有偶數(shù)矩構(gòu)成33階特征向量,用PCA降至4~5維。圖9階數(shù)與檢測精度的關(guān)系[61]。(a)載體圖像(實線)和含密圖像(虛線)的正確檢測率;(b)聯(lián)合正確概率。由500幅原始圖像用1隱寫和LSB隱寫平均而得,嵌入率12.5%~50%。用LSB匹配法在從未壓縮過的圖像中以不同的嵌入率25%,50%,75%,100%嵌入數(shù)據(jù),對它們進(jìn)行檢測得到圖10所示ROC。其中(a)是對22種不同數(shù)字照相機(jī)拍攝的2,567幅1百萬像素以上非壓縮照片的測試結(jié)果,包括48比特彩色TIFF圖像和24比特彩色BMP圖像,全部轉(zhuǎn)為8比特黑白。(b)是2,375幅15002100高分辨率掃描圖像,轉(zhuǎn)為黑白。實驗所用圖像庫與[28][30]相同。掃描中引入的噪聲使隱寫分析性能下降。對于JPEG壓縮過的圖像進(jìn)行實驗,即使在25%嵌入率時也能完全正確檢測。實驗還表明,單一照相機(jī)拍攝的圖像比多來源圖像更容易檢測。上述方法不久又被進(jìn)一步改進(jìn)[62],一方面仍從小波域的噪聲分量提取特征以提高信噪比(隱寫信號與殘余載體信號之比),另一方面,不再用很高階的偶次矩,而是計算1到9階的絕對非歸一化矩,稱為小波絕對矩分析法(waveletabsolutemoment,WAM)。其中前4階矩在概念上與Farid的預(yù)測誤差[57]一樣,但用不同的小波使預(yù)測質(zhì)量較好,而且采用絕對矩而并不按方差進(jìn)行歸一化,避免使用很高階的矩。圖11是對KodakDC290相機(jī)拍攝的未經(jīng)壓縮灰度圖像測試結(jié)果,其中(a)是用[59]的FLD分類器得到的,(b)是WAM的性能。用隨機(jī)1嵌入法進(jìn)行隱寫,WAM在小嵌入量時有明顯優(yōu)勢。文獻(xiàn)[60]的作者進(jìn)而研究先驗邊信息(例如已知相機(jī)型號、JPEG質(zhì)量因子、圖像處理情況等)對提高隱寫分析性能的作用,用22種不同相機(jī)拍攝,檢測性能明顯比單一相機(jī)差,但WAM仍優(yōu)于FLD。比較了幾種新的嵌入策略:隨機(jī)1與三元嵌入法相結(jié)合、局部自適應(yīng)三元嵌入、在將每種顏色16比特的圖像轉(zhuǎn)換為8比特灰度圖像時的擾動量化。用WAM確定哪一種方法較為安全,結(jié)果發(fā)現(xiàn)第三種方法最難被檢測出來,其次是自適應(yīng)三元嵌入。圖10用FLD分類的ROC[61] (a)FLD (b)WAM圖11WAM與FLD的性能比較,橫軸為虛警率,縱軸為檢測率[62]Farid等人在[55]-[57]的早期工作基礎(chǔ)上,又于2004年將他們的統(tǒng)計模型擴(kuò)展到彩色圖像,提出了所謂“單類SVM”(OC-SVM)以簡化分類器的訓(xùn)練過程[63],雖然其性能略遜于“兩類SVM”,卻只需用容易得到的載體圖像進(jìn)行訓(xùn)練,具有潛力可將檢測算法推廣到能檢測分類器從未見過的隱寫工具。接著他們又?jǐn)U展其統(tǒng)計模型,將相位統(tǒng)計特性也包括進(jìn)來[64]。在[64]中Farid指出,用多尺度和多方向圖像分解得到的幅度及相位的一階和高階統(tǒng)計量,對于大量圖像具有良好的一致性,而對隱寫嵌入的數(shù)據(jù)靈敏度較高。他們?nèi)杂肣MF[54]提取幅度統(tǒng)計量,優(yōu)點(diǎn)是能得到最小的空域混迭,并采用一種局部角度諧波分解(localangularharmonicdecomposition,LAHD)估計局部相位,該方法通過向一組角度Fourier基函數(shù)投影得到。然后采用SVM進(jìn)行分類。實驗中使用40,000幅自然圖像,JPEG壓縮質(zhì)量因子平均90%,典型尺寸為600400,統(tǒng)一取圖像中部256256區(qū)域進(jìn)行測試,計算432維的幅度和相位統(tǒng)計量。使用了5種隱寫工具生成含密圖像:Jsteg、OutGuess、Steghide、Jphide、F5,用同樣的質(zhì)量因子以避免二次JPEG壓縮效應(yīng)。對每一組圖像,32,000幅用于訓(xùn)練,8,000幅用于測試。圖12是用非線性SVM進(jìn)行檢測的性能,隱蔽數(shù)據(jù)嵌入率分別為100%、78%、20%、5%,在橫坐標(biāo)下標(biāo)出。圖中白點(diǎn)是用線性SVM得到的結(jié)果。可見該方法可對嵌入率較高的隱寫實現(xiàn)通用檢測,而當(dāng)嵌入率低時性能不佳。另一項近期成果是Wang和Moulin的優(yōu)化特征提取[65]。他們指出,在既不知道圖像統(tǒng)計特性又不知道隱寫算法的情況下,采用有監(jiān)督的訓(xùn)練是實現(xiàn)通用檢測的有效方法。他們從三方面來解決特征提取這一關(guān)鍵問題:尋求在區(qū)分有無隱寫方面優(yōu)于常規(guī)小波分解的圖像子帶表示;分析兩類概率密度函數(shù)(PDF)的特征經(jīng)驗矩和PDF特征函數(shù)的經(jīng)驗矩,并比較它們各自的優(yōu)點(diǎn);討論特征空間的降維。在虛警概率固定為1%的條件下,對含密圖像的檢測率至少超過其它方法15%到50%。他們引入下列了單一性能測度,即ROC曲線下的面積AUC用于評價檢測性能: (8)其中PFA為虛警概率,PD為檢測概率。圖13(a)是用前3階矩共39個特征量的檢測結(jié)果,將優(yōu)化特征與Harmsenetal.[31]、Goljanetal.[62]、Farid[56]比較的結(jié)果。用擴(kuò)譜法[66]進(jìn)行100%隱寫嵌入,這4種檢測方法的AUC分別為0.9905、0.9875、0.9166、0.5551。圖12用非線性SVM分類器對5種隱寫工具的檢測結(jié)果[64]。橫軸標(biāo)出的是嵌入率百分?jǐn)?shù),縱軸是正確檢測率,左側(cè)的灰色矩形條說明對載體圖像的正確判斷率大于99%(虛警率小于1%)進(jìn)一步將優(yōu)化特征結(jié)合順序前向浮動選擇(sequentialforwardfloatingselection,SFFS)、優(yōu)化特征結(jié)合閾值選擇與Xuanetal.的方法[67](對Harmsenetal.方法[31]的改進(jìn))和Farid方法[56]進(jìn)行比較,分別用擴(kuò)譜法、LSB、F5在圖像種嵌入數(shù)據(jù)。圖13(b)是用LSB嵌入時的性能比較。4種情況下的AUC分別為0.9484、0.9365、0.8901、0.7122。 (a) (b)圖13優(yōu)化特征法與其他方法性能比較[65]。(a)檢測100%擴(kuò)譜法嵌入,優(yōu)化特征(粗實線)與Harmsen(虛線)、Goljian(帶點(diǎn)細(xì)線)、擴(kuò)譜法(細(xì)實線)比較;(b)檢測LSB嵌入的性能比較,優(yōu)化特征和SFFS(虛線)、優(yōu)化特征和閾值選擇(粗實線)、Xuan(細(xì)實線帶方塊)、Farid(細(xì)實線帶圓圈)Lieetal.[68]提出基于空域和DCT域的兩個統(tǒng)計特性來實現(xiàn)未知嵌入方法的盲檢測,采用非線性神經(jīng)分類器。對2,088幅載體圖像和用6種隱寫工具產(chǎn)生的含密圖像組成圖像庫進(jìn)行廣泛測試,實現(xiàn)90%以上的檢測率,有效性不限于一種特定隱寫方法,可檢測低達(dá)每像素0.01比特的嵌入量,并可考慮低通濾波、銳化、JPEG壓縮。在以上所討論的基于特征和分類的通用隱寫分析技術(shù)中,從早期根據(jù)隱寫造成載體失真的判斷來構(gòu)成分類器,到利用線性預(yù)測誤差的各階矩,以及利用小波變換的高階矩,特征向量的階數(shù)有逐漸升高的趨勢。但是近期的研究又表明,階數(shù)提高并不一定能給出更好的結(jié)果,因此在這一方面還需深入探索。通用分析方法具有適應(yīng)性強(qiáng)的明顯優(yōu)點(diǎn),但是其檢測性能與專用檢測器相比有不小的差距。訓(xùn)練工作量大,使用不便,也是此類方法在實際應(yīng)用中的瓶頸。研究僅需載體圖像即可進(jìn)行訓(xùn)練的分類法是改善通用隱寫分析法實用性的有效途徑之一。6.隱寫和隱寫分析研究動態(tài)近年來針對LSB嵌入仍有一些新方法,如Rochaetal.[69]使待檢測圖像最低位逐步隨機(jī)化,得到一系列LSB有差異的圖像,每步得到一幅LSB熵逐漸增加的可能含密圖像,實質(zhì)上是2和UeliMaurer檢驗[70]的結(jié)合,卻克服了2僅能檢測順序嵌入的不足。采用線性分類器和SVM,性能優(yōu)于早期Westfeld[12]和Provos[13]方法,以及Farid的通用檢測法[56][57]。該方法可望用于被動認(rèn)證和圖像檢索。Dumitrescuetal.[71]利用高階統(tǒng)計量建立了LSB隱寫檢測新框架,他們利用數(shù)字媒體樣本的內(nèi)在相關(guān)性計算存在于LSB中的秘密信息長度的穩(wěn)健估計。該方法的一個特點(diǎn)是可用于靜止圖像、視頻、音頻等多種數(shù)字媒體。深入了解嵌入率估計誤差的統(tǒng)計特性對于提高定量隱寫分析的性能具有重要意義,這是以往被忽視的一個問題。Ker在接連的兩篇論文中對此進(jìn)行了廣泛的實驗研究[46]和理論研究[47]。B?hme和Ker進(jìn)行了多達(dá)2億次以上的實驗。他們從下載的NRCS圖像庫()的合格TIFF圖像中隨機(jī)選出800幅,統(tǒng)一用雙三次重采樣變成640480尺寸,分別取出其亮度成分和紅色分量用于灰度圖像和彩色圖像的實驗。對每一幅圖像采用LSB替換法分別以嵌入率p{0.01,0.05,0.1,0.2,0.4,0.6,0.8,1}嵌入200種不同的隨機(jī)序列。使用的隱寫方法包括RS[15]、WS[72]、SPA[41]、SPA/LMS[42]、Triples[43]。對每一幅圖像的亮度分量和紅色分量在未壓縮和Q=80的JPEG壓縮兩種情況下進(jìn)行測試。最后為了觀察圖像尺寸和縮放的影響,分別采用隨機(jī)剪裁和下采樣至原圖像的75%、50%、25%進(jìn)行測試。他們的研究結(jié)論包括由兩種主要來源構(gòu)成的誤差模型: (9)其中下標(biāo)i代表載體,j代表嵌入的隱蔽數(shù)據(jù),pi,j為隱蔽信息量。隨機(jī)變量X表示載體和隱蔽信息之間相關(guān)性而引入的估計誤差,即圖像內(nèi)(within-image)誤差,服從Gauss分布N(i,i);Z表示載體模型不準(zhǔn)確引入的估計誤差,即圖像間(between-image)誤差。圖像間誤差服從t分布,參數(shù)和也可能受pi,j和載體影響,對給定的圖像集假定它們是固定的。研究表明,以往被忽視的隱蔽信息所引起的嵌入量估值誤差甚至大于載體圖像特性差異的影響,故應(yīng)在隱寫分析研究中加以注意。不同的隱寫分析方法受圖像內(nèi)和圖像間兩種因素的影響是不同的,這對于理解為什么某一估計器在某些情況下效果不佳是有所啟發(fā)的。估計器性能還受到載體圖像的影響,其因素包括局部方差和飽和度。此項研究提供了計算嵌入率估值置信度的可能性。對于誤差特性的研究首次建立了隱寫分析誤差理論模型,使隱寫分析者能精確計算有無隱蔽信息的二元假設(shè)檢驗的嵌入率值。對估計誤差的研究將有利于改進(jìn)檢測器。直到不久以前,隱寫基本上只限于在一幅圖像中嵌入隱蔽數(shù)據(jù),隱寫分析也是對單幅圖像的分析。為了對抗隱寫分析需要降低圖像中的嵌入信息量,因此可將待傳輸?shù)臄?shù)據(jù)分散嵌入到一組圖像中,這就是所謂批量嵌入(batchsteganography)。如果對每一幅圖像進(jìn)行單獨(dú)分析,隱寫的安全性顯然正比于分散的程度。對抗這種分散的批量隱寫可采用組合分析法(pooledsteganalysis)。Ker通過實驗[73]和理論研究[74]發(fā)現(xiàn),將信息分散在多個載體中,安全性并不隨分散程度線性增長。用組合式隱寫分析可使安全性僅以較慢的平方根速度上升。文獻(xiàn)[75]研究了多種隱寫分析方法所得統(tǒng)計特征的融合問題。將隱寫分析中涉及的統(tǒng)計特征歸結(jié)為載體數(shù)據(jù)的“固有特征”和隱寫所產(chǎn)生的“引入特征”,提出基于整體性思想的特征提取及融合方法,經(jīng)過篩選,對性能較好的多種方法進(jìn)行適當(dāng)修正,用得到的特征組成特征集合進(jìn)行判決,取得的效果良好。隱寫分析的另一項內(nèi)容是估計隱寫時所用的密鑰。Trivedi和Chandramouli[4]通過檢測含密媒體統(tǒng)計特性的突變,對擴(kuò)譜法順序隱寫嵌入進(jìn)行了密鑰估計??紤]到平穩(wěn)和非平穩(wěn)載體信號的不同信噪比,導(dǎo)出了低信噪比條件下的局部最強(qiáng)力隱寫分析檢測器。在DCT域中高頻嵌入的情況下,密鑰估計準(zhǔn)確性良好,但在低頻分量中嵌入時估計性能較差。過去搜索密鑰均采用窮舉法,在提取的數(shù)據(jù)中尋找可識別的模式,代價很高。對于許多隱寫方法,F(xiàn)ridrichetal.[76]證明搜索密鑰的復(fù)雜度僅與密鑰空間有關(guān),而與加密算法無關(guān),可根據(jù)沿嵌入路徑樣本統(tǒng)計性質(zhì)進(jìn)行窮盡搜索,正確的密鑰由偏差大的樣本分布(outliersampledistribution)給出。該方法對各種隱寫方法有效,但該文集中研究JPEG圖像。接著又對這一方法進(jìn)行了擴(kuò)展,提供了更一般的理論描述,并應(yīng)用于空域[77]。他們基于2檢驗來判別密鑰,提出一種從多幅圖像中提取密鑰的方法。在空域中利用降噪濾波得到圖像中的噪聲成分可提高密鑰搜索效率。用1嵌入法進(jìn)行實驗,在很低嵌入量時仍可搜索。密鑰估計對于數(shù)字取證具有重要意義。在對LSB隱寫提取密鑰時,可在“已知載體”和“載體被重復(fù)使用”條件下得到恢復(fù)LSB隱寫術(shù)密鑰的計算復(fù)雜度[78]。然后在“載體被重復(fù)使用”條件下針對空域LSB隱寫得到一種密鑰恢復(fù)算法,借鑒密碼分析中的“分別征服攻擊”思想有效降低計算復(fù)雜度。另外還可利用嵌入率估計器[74],通過碰撞攻擊實現(xiàn)隱寫密鑰的恢復(fù)[79]。理論分析表明這種攻擊的復(fù)雜度主要由所需的樣本量決定。用混合Gauss模型給出估計最小樣本量的方法,對HideandSeek進(jìn)行實驗,嵌入消息長度L未知時,當(dāng)嵌入率在5.3%至94.5%時能進(jìn)行成功的攻擊。如果知道L,則能成功進(jìn)行攻擊的嵌入率范圍擴(kuò)大到1.1%至98.4%。碰撞攻擊法的計算速度比[77]的2法快,但只適用于LSB替換,而2法還適用于LSB匹配隱寫。以上主要討論了近年來圖像隱寫分析的研究進(jìn)展,在對抗其他數(shù)字媒體的隱寫方面也有許多研究成果。例如在數(shù)字音頻隱寫方面提出了基于音頻質(zhì)量測度并利用分類器的檢測技術(shù)[80][81]。對于文本中的信息隱藏近年來也有很多研究,例如Winstein提出了基于詞典的隱寫方法WinsteinK,LexicalsteganographythroughadaptivemWinsteinK,Lexicalsteganographythroughadaptivemodulationofthewordchoicehash,2000IntelScienceTalentSearchTopTenWinners,/~keithw/tlex/lsteg.pdf含有隱寫嵌入信息的數(shù)字媒體常通過互聯(lián)網(wǎng)傳播,今后對隱寫的檢測和估計應(yīng)考慮網(wǎng)上信息量巨大的特點(diǎn),降低計算復(fù)雜度,提高分析效率。此外與互聯(lián)網(wǎng)應(yīng)用更緊密結(jié)合的隱寫技術(shù)也開始出現(xiàn),例如在利用VoIP的隱寫技術(shù)方面已有一些研究[83][84],而對此的分析檢測工作尚未見報道。近期還出現(xiàn)了利用互聯(lián)網(wǎng)多媒體共享業(yè)務(wù)進(jìn)行秘密信息傳輸?shù)碾[藏文件管理系統(tǒng)CovertFS[85]。該系統(tǒng)建立在圖像共享業(yè)務(wù)之上,對網(wǎng)上分享圖像中的隱藏文件進(jìn)行管理,可保證文件的機(jī)密性,用戶可自由選擇含密圖像的分享范圍,并否認(rèn)隱蔽文件的存在性。業(yè)務(wù)提供商也不可能知道這些隱蔽文件的存在。此類技術(shù)構(gòu)成了對安全的威脅,對抗措施亟待跟上。7.結(jié)束語隱寫分析在對抗新型隱寫方法的過程中不斷發(fā)展,反過來又促使隱寫技術(shù)的改進(jìn)。在隱寫-反隱寫對抗中,反隱寫一方總是處于被動的防御地位,盡管它常被稱為對隱寫的“攻擊”。本文著重討論了近年來在反隱寫幾個難題方面所取得的進(jìn)展,即對LSB匹配嵌入的檢測、小嵌入率的檢測和估計、不依賴嵌入方法的通用隱寫分析。對于今后隱寫分析研究的進(jìn)一步發(fā)展可考慮以下幾個方面:1)早期隱寫已能被許多方法成功檢測,但是對很小的嵌入率進(jìn)行可靠檢測仍是難題。根據(jù)隱寫分析的難易可將載體圖像分成三類,從易到難是:曾經(jīng)被JPEG壓縮過、JPEG壓縮后又被縮放處理的、從未被壓縮過。圖像分辨率很高和尺寸很小這兩種極端情況也較難檢測,前者因為數(shù)字照相機(jī)的普及而成為便于獲取的隱寫載體,后者則因為容易通過防火墻而可能被隱寫者優(yōu)先考慮。2)新的隱寫方法不斷出現(xiàn),研究獨(dú)立于嵌入方法的通用分析技術(shù)十分重要。目前主要方法可歸為兩類,一類是根據(jù)加性噪聲模型的分析,如HCF;另一類是“預(yù)處理+特征提?。诸悺?。后一類方法受到較多關(guān)注,由于涉及到用巨大的圖像庫進(jìn)行訓(xùn)練,如何用于實際尚待進(jìn)一步研究。3)由于含密圖像總是可以與海量的正常數(shù)字媒體共存,要在有限時間里確定可疑對象就必須進(jìn)行快速檢測,因此降低隱寫分析的計算復(fù)雜度是研究者面臨的重要課題。4)隱寫技術(shù)的新應(yīng)用向反隱寫研究者提出了新的課題,例如第6節(jié)提到的文本隱寫和網(wǎng)絡(luò)應(yīng)用。需要超越目前面向孤立文件的檢測方式,在系統(tǒng)層面考慮反隱寫的問題。不同來源載體對隱寫分析的影響等問題也應(yīng)進(jìn)行研究。5)隱寫分析的目的在于發(fā)現(xiàn)隱蔽信息的存在,最終提取隱蔽信息。迄今為止在檢測有無可疑嵌入信息和估計嵌入量方面已進(jìn)行了大量研究,而在提取嵌入信息方面進(jìn)展較慢。在實現(xiàn)嵌入信息提取之前,有必要對嵌入算法進(jìn)行估計[86],在此基礎(chǔ)上如能恢復(fù)密鑰,也就相當(dāng)于獲取了嵌入內(nèi)容。若提取的信息為密文,還要進(jìn)一步恢復(fù)加密密鑰以破譯密文,這就不屬于隱寫分析的工作了。實現(xiàn)隱蔽信息的正確截獲乃至破譯是一項長期任務(wù)。參考文獻(xiàn):JohnsonNF,JajodiaS,Exploringsteganography:seeingtheunseen,IEEEComputer,1998,31(2),26-3ChandramouliR,Amathematicalframeworkforactivesteganalysis,MultimediaSystems,2003,9(3),303-311TrivediS,andChandramouliR,Activesteganalysisofsequentialsteganography,Proc.SPIE,2003,5020-13,123-130TrivediS,andChandramouliR,Secretkeyestimationinsequentialsteganography,IEEETransactionsonSignalProcessing,2005,53(2),Pt.2,746-757WangH,andWangS,Cyberwarfare:steganographyvs.steganalysis,CommunicationofACM,2004,47(10),76-82ProvosN,andHoneymanP,Hideandseek:anintroductiontosteganography,IEEESecurityandPrivacyMagazine,2003,1(3),32-44KesslerGC,Anoverviewofsteganographyforthecomputerforensicsexaminer,FBIForensicScienceCommunications,2004,6(3),1-29ChandramouliR,andSubbalakshmiKP,Currenttrendsinsteganalysis:acriticalsurvey,Proceedingsof8thControl,Automation,RoboticsandVisionConference(ICARCV2004),Kunming,China,Dec6-9,2004,2LiangX,HeJ,LiJ,andHuangJ,Steganalysisprinciple,actualityandprospect,ActaScientiarumNaturaliumUniversitatisSunyatseni,2004,43(6),93-96(inChinese)梁小萍,何軍輝,李健乾,黃繼武,隱寫分析-原理、現(xiàn)狀與展望,中山大學(xué)學(xué)報,2004,43(6),93-96KharraziM,SencarHT,andMemonN,Imagesteganography:conceptsandpractice,LectureNoteSeries,InstituteforMathematicalSciences,NationalUniversityofSingapore,Singapore,2004LiuX,andNiuS,Reviewofsteganalysis,JournalofBeijingElectronicScienceandTechnologyInstitute,2005,13(4),90-94(inChinese)劉歆,牛少彰,信息隱藏的檢測算法研究綜述,北京電子科技學(xué)院學(xué)報,2005,13(4),90-94WestfeldA,andPfitzmannA,Attacksonsteganographicsystems,LectureNotesinComputerScience,1768,61-76,1999ProvosN,Defendingagainststatisticalsteganalysis,inProceedingsofthe10thUSENIXSecuritySymposium,August13–17,2001.Washington,D.C.,USA,Aug.13-17,2001,FridrichJ,GoljanMandDuR,AttackingtheOutGuess,ProceedingsoftheACMWorkshoponMultimediaandSecurity,Juan-les-Pins,France,Dec2002,3-6FridrichJ,GoljanM,andDuR,DetectingLSBsteganographyincolorandgray-scaleImages,IEEEMultimedia,2001,8(4),22-28FridrichJ,andGoljanM,Practicalsteganalysisofdigitalimages–stateoftheart,Proc.SPIE,2002,4675,1-13FridrichJ,GoljanM,andDuR,SteganalysisbasedonJPEGcompatibility,SPIEMultimediaSystemsandApplicationsIV,Denver,CO,USA,August20-24,2001,275-280WestfeldA,F5asteganographicalgorithm,LectureNotesinComputerScience,2001,2137,FridrichJ,GoljanM,andHogeaD,SteganalysisofJPEGimage:breakingtheF5algorithm,in5thInternationalWorkshoponInformationHiding,Noordwijkerhout,Netherlands,2002ZhangT,andPingX,AnewapproachtoreliabledetectionofLSBsteganographyinnaturalimages,SignalProcessing,2003,83(10),2085-2093KawaguchiK,andEasonRO,PrincipleandapplicationofBPCSsteganography,MultimediaSystemsandApplications,ProceedingsofSPIE,1998,3528,Boston,464-472ZhangX,andWangS,StatisticalanalysisagainstspatialBPCSsteganography,JournalofComputerAidedDesignandComputerGraphics,2005,17(7),1625-1629(inChinese)張新鵬,王朔中,對空域BPCS密寫的統(tǒng)計分析,計算機(jī)輔助設(shè)計與圖形學(xué)學(xué)報,2005,17(7),1625-1629WuM,HoY,andLeeJ,Aniterativemethodofpalette-basedimagesteganography,PatternRecognitionLetters,2004,25,301-309BrisbaneG,Safavi-NainiR,andOqunbonaP,High-capacitysteganographyusingasharedcolourpalette,IEEProceedings-Vision,ImageandSignalProcessing,2005,152,787-792FridrichJ,andRuiD,Securesteganographicmethodsforpaletteimages,The3rdInformationHidingWorkshop,LectureNotesinComputerScience,2000,1768,47-66ZhangX,andWangS,Analysisofparityassignmentsteganographyinpaletteimages,Knowledge-BasedIntelligentInformationandEngineeringSystems,LectureNotesinArtificialIntelligence,2005,3683,1025-1031FridrichJ,GoljanM,andSoukalD,Higher-orderstatisticalsteganalysisofpaletteimages,inProc.SPIE/IS&T,5020,SecurityandWatermarkingofMultimediaContentsV,SantaClara,CA,USA,2003,178-190KerAD,ResamplingandthedetectionofLSBmatchingincolourbitmaps.ProceedingsoftheSPIE,5681,Security,Steganography,andWatermarkingofMultimediaContentsVII,2005,1-15SharpT,Animplementationofkey-baseddigitalsignalsteganography,Proc.InformationHidingWorkshop,LectureNotesinComputerScience,2001,2137,13-26WestfeldA,Detectinglowembeddingrates,inProc.InformationHidingWorkshop,LectureNotesinComputerScience,2002,2578,324-339HarmsenJ,andPearlmanW,Steganalysisofadditive-noisemodelableinformationhiding,inProc.SPIE,SecurityWatermarkingMultimediaContents,2003,5020,131-142KerAD,SteganalysisofLSBmatchingingrayscaleimages,IEEESignalProcessingLetters,2005,12(6),441-444HarmsenJ,BowersK,andPearlmanW,Fastadditivenoisesteganalysis,Security,Steganography,andWatermarkingofMultimediaContentsVI,ProceedingsoftheSPIE,2004,5306,489-495WongPW,ChenH,andTangZ,Onsteganalysisofplus-minusoneembeddingofcontinuoustoneimage,ProceedingsofSPIE,2005,5681,643-652WillemsF,andDijkM,Capacityandcodesforembeddinginformationingray-scalesignals,”IEEETransactionsonInformationTheory,2005,51(3),1209-1214ZhangX,andWangS,Efficientsteganographicembeddingbyexploitingmodificationdirection,IEEECommunicationsLetters,2006,10(11),781-783MielikainenJ,LSBmatchingrevisited,IEEESignalProcessingLetters,2006,13(5),285-287ZhangX,ZhangWandWangS,Efficientdouble-layeredsteganographicembedding,ElectronicsLetters,43(8),2007,482-483FridrichJ,andLison?kP,Gridcoloringinsteganography,IEEETransactionsonInformationTheory,2007,53(4),1547-1549ZhangW,ZhangX,andWangS,Adoublelayered“plus-minusone”dataembeddingscheme,IEEESignalProcessingLetters,2007,14(11),848-851DumitrescuS,WuX,andWangZ,DetectionofLSBsteganographyviasamplepairanalysis,IEEETransactionsonSignalProcessing,2003,51(7),1995-2007LuP,LuoX,TangQ,and

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論