BP神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)圖像壓縮_第1頁(yè)
BP神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)圖像壓縮_第2頁(yè)
BP神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)圖像壓縮_第3頁(yè)
BP神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)圖像壓縮_第4頁(yè)
BP神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)圖像壓縮_第5頁(yè)
已閱讀5頁(yè),還剩14頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、LOGO機(jī)器學(xué)習(xí)(ML第11組) 圖像壓縮圖像壓縮(BP神經(jīng)網(wǎng)絡(luò))神經(jīng)網(wǎng)絡(luò)應(yīng)用神經(jīng)網(wǎng)絡(luò)應(yīng)用手寫數(shù)字識(shí)別手寫數(shù)字識(shí)別(概率神經(jīng)網(wǎng)絡(luò))求解最優(yōu)策略求解最優(yōu)策略(利用基于值迭代的MDP算法求解最優(yōu)策略)馬爾科夫決策過(guò)程馬爾科夫決策過(guò)程應(yīng)用應(yīng)用 MLBP神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)圖像壓縮神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)圖像壓縮唐 璇 E13201073羅威亞 E13201055LOGOContents問(wèn)題背景1BP神經(jīng)網(wǎng)絡(luò)建模2BP神經(jīng)網(wǎng)絡(luò)壓縮的實(shí)現(xiàn)3結(jié)果與分析4LOGO問(wèn)題背景v常見(jiàn)的文件壓縮軟件如WinZip、WinRAR等采用的是無(wú)損壓縮,能夠完全完全恢復(fù)原文件內(nèi)容。v多媒體信息具有信息量大、冗余信息多的特點(diǎn),往往采用有損壓縮技

2、術(shù)。JPEG壓縮(變換編碼與熵編碼)基于小波變換的圖像壓縮算法分形壓縮編碼矢量量化壓縮編碼圖像壓縮算法圖像壓縮算法LOGO問(wèn)題背景vBP神經(jīng)網(wǎng)絡(luò)是一種多層前向神經(jīng)網(wǎng)絡(luò),是整個(gè)人工神經(jīng)網(wǎng)絡(luò)體系中的精華,廣泛應(yīng)用于分類識(shí)別、逼近、回歸和壓縮。實(shí)際應(yīng)用中80%的神經(jīng)網(wǎng)絡(luò)模型采取了BP網(wǎng)絡(luò)或者BP的變化形式。vBP神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)圖像壓縮,依賴BP網(wǎng)絡(luò)的非線性映射能力非線性映射能力進(jìn)行數(shù)據(jù)壓縮。v實(shí)驗(yàn)結(jié)果表明,采用BP神經(jīng)網(wǎng)絡(luò)對(duì)灰度圖像進(jìn)行壓縮,在保證較好峰值信噪比(PSNRPSNR)的情況下,達(dá)到了較高的壓縮比。LOGOBP神經(jīng)網(wǎng)絡(luò)建模(模型的壓縮原理)BP神經(jīng)網(wǎng)絡(luò)用于壓縮的網(wǎng)絡(luò)模型構(gòu)建:v 采用一個(gè)隱

3、含層,則整體構(gòu)成一個(gè)三層的網(wǎng)絡(luò)。v 把一組輸入模式通過(guò)少量的隱含層單元映射到一組輸出模式,并使輸出模式盡可能等于輸入模式。(隱含層神經(jīng)元的值和相應(yīng)的權(quán)值向量可以輸出一個(gè)與原輸入模式相同的向量)輸入層輸入層隱含層隱含層輸出層輸出層 解碼解碼 編碼編碼補(bǔ)充:理論已經(jīng)證明,單個(gè)隱含層單個(gè)隱含層的網(wǎng)絡(luò)可以通過(guò)適當(dāng)增加神經(jīng)元節(jié)點(diǎn)的個(gè)數(shù)實(shí)現(xiàn)任意非線任意非線性映射性映射。所以,單個(gè)隱含層可滿足大部分應(yīng)用需要。壓縮原理壓縮原理:當(dāng)隱含層神經(jīng)元的個(gè)數(shù)較少時(shí),就意味著隱含層隱含層能用更少更少的數(shù)來(lái)表現(xiàn)輸入模式的數(shù)來(lái)表現(xiàn)輸入模式,而這,實(shí)際上就是壓縮壓縮。LOGOBP神經(jīng)網(wǎng)絡(luò)建模(壓縮解壓過(guò)程)v 假設(shè)網(wǎng)絡(luò)的輸入層

4、和輸出層均有M個(gè)神經(jīng)元組成,隱含層包含I個(gè)神經(jīng)元,且IM,則輸入模式必須進(jìn)行壓縮編碼,結(jié)果保存在隱含層。v 輸入層到隱含層的變換相當(dāng)于壓縮的編碼過(guò)程;隱含層到輸出層的變換相當(dāng)于壓縮的解碼過(guò)程。編碼編碼結(jié)果編碼結(jié)果解碼輸入層,M個(gè)神經(jīng)元隱含層,I個(gè)神經(jīng)元,IM輸出層,M個(gè)神經(jīng)元輸入數(shù)據(jù)重建數(shù)據(jù)LOGOBP神經(jīng)網(wǎng)絡(luò)建模(圖像壓縮編碼)v 輸入圖像數(shù)據(jù):假設(shè)圖像為像素NN大小,以KK為單位進(jìn)行劃分,將圖像細(xì)分為一個(gè)個(gè)圖像塊。圖像塊中每一個(gè)像素點(diǎn)與一個(gè)輸入或輸出神經(jīng)元相對(duì)應(yīng),如下模型。v 樣本學(xué)習(xí):網(wǎng)絡(luò)隨機(jī)地抽取圖像中各KK圖像塊作為學(xué)習(xí)模式,使用反向傳播算法進(jìn)行學(xué)習(xí),通過(guò)調(diào)整網(wǎng)絡(luò)中神經(jīng)元之間的連接權(quán)

5、值,使訓(xùn)練集圖像的重建誤差E=f-g的均值達(dá)到最小。訓(xùn)練好的網(wǎng)絡(luò)隱含層神經(jīng)元矢量隱含層神經(jīng)元矢量便是數(shù)據(jù)壓縮的結(jié)果,而輸出層神經(jīng)元矢量輸出層神經(jīng)元矢量便是重建后的數(shù)據(jù)。原始圖像重建圖像KKKKLOGOBP神經(jīng)網(wǎng)絡(luò)建模vBP網(wǎng)絡(luò)的計(jì)算模型wij,bjx2x3xM y1y2y3yMwji,bihjx1編碼過(guò)程解碼過(guò)程I1 ,fhM1jjbxwijiijM1 ,gyI1iibhwiijji隱含層第j個(gè)神經(jīng)元輸出值:輸出層第i個(gè)神經(jīng)元輸出值:LOGOBP神經(jīng)網(wǎng)絡(luò)壓縮的實(shí)現(xiàn)圖像塊劃分歸一化BP網(wǎng)絡(luò)訓(xùn)練保存結(jié)果將圖像的二維矩陣分成KK的一個(gè)個(gè)塊,輸出K2N矩陣(樣矩陣)除以255,得數(shù)據(jù)位于01之間。(這

6、樣能提高壓縮率,灰度圖像的灰度值0255)l采用神經(jīng)網(wǎng)絡(luò)工具箱函數(shù)feedforward創(chuàng)建前向BP網(wǎng)絡(luò)l采用LM訓(xùn)練法(收斂快)lnet的權(quán)值lnet的閾值l每個(gè)圖像塊對(duì)應(yīng)的隱含層單元的輸出壓縮步驟:256256164096LOGOBP神經(jīng)網(wǎng)絡(luò)壓縮的實(shí)現(xiàn)load 圖像塊重建(BP網(wǎng)絡(luò)解碼)反歸一化圖像塊恢復(fù)l載入壓縮文件的數(shù)據(jù)l預(yù)處理for i=1:4096 Y(:,i)=com.lw*(com.d(:,i) +com.b;end乘上255164096矩陣的每一列抽取出來(lái),重新排列44矩陣,并對(duì)44矩陣按行排列以恢復(fù)圖像。PSNRRATE解壓縮步驟:LOGO結(jié)果BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練(N=4):

7、程序設(shè)計(jì):兩個(gè)函數(shù)vblock_divide函數(shù),用于圖像塊劃分,形成K2*N矩陣vre_divide函數(shù),用于圖像塊恢復(fù)v腳本文件vbp_imageCompress.m腳本負(fù)責(zé)壓縮lena.bmp圖像(需要調(diào)用block_divide圖像劃分函數(shù)),壓縮結(jié)果保存于comp.mat中vbp_imageRecon.m腳本負(fù)責(zé)解壓comp.mat(需要調(diào)用re_divide圖像塊恢復(fù)函數(shù))訓(xùn)練函數(shù)確定了輸入輸出層向量的維數(shù)LOGO結(jié)果原始圖像lena.bmp:重建圖像:塊與塊之間差異較大,即出現(xiàn)塊效應(yīng)現(xiàn)象。PSNR: 32.4148rate: 0.1465LOGO分析v 現(xiàn)象:正如剛剛所看到的,塊

8、與塊之間差異較大,即出現(xiàn)塊效應(yīng)現(xiàn)象。這是由于設(shè)計(jì)的算法將圖像強(qiáng)行分割為44的塊,并分別進(jìn)行訓(xùn)練,所以出現(xiàn)塊效應(yīng)現(xiàn)象。v 壓縮比率:由于后續(xù)沒(méi)有進(jìn)行熵編碼等原因,算法的壓縮比率(14%)并不高。v 圖像質(zhì)量:峰值信噪比(PSNR)為32.4148,其實(shí)修改算法的參數(shù)(如改變隱含層神經(jīng)元個(gè)數(shù))可以調(diào)節(jié)圖像壓縮的質(zhì)量。LOGOTablePSNRrateN=130.87960.0507N=231.81810.0897N=432.41180.1465N=631.99620.2030N=831.10150.2512N=1030.74710.3158N=1228.20560.3219N=1431.90630.4148壓縮比提高,但圖像質(zhì)量降低LOGO重建效果對(duì)比(部分)N=1:N=2:N=4:N=10:壓縮率最高重

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論