胡學龍《數字圖像處理》課后習題答案_第1頁
胡學龍《數字圖像處理》課后習題答案_第2頁
胡學龍《數字圖像處理》課后習題答案_第3頁
胡學龍《數字圖像處理》課后習題答案_第4頁
胡學龍《數字圖像處理》課后習題答案_第5頁
已閱讀5頁,還剩93頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

胡學龍、許開宇編著《數字圖像處理》

思考題與習題參考答案

第1章概述

1.1連續(xù)圖像和數字圖像如何相互轉換?

答:數字圖像將圖像看成是許多大小相同、形狀一致的像素組成。這樣,

數字圖像可以

用二維矩陣表示。將自然界的圖像通過光學系統(tǒng)成像并由電子器件或系統(tǒng)

轉化為模擬圖像

(連續(xù)圖像)信號,再由模擬/數字轉化器(ADC)得到原始的數字圖像信

號。圖像的數字

化包括離散和量化兩個主要步驟。在空間將連續(xù)坐標過程稱為離散化,而

進一步將圖像的幅

度值(可能是灰度或色彩)整數化的過程稱為量化。

1.2采用數字圖像處理有何優(yōu)點?

答:數字圖像處理與光學等模擬方式相比具有以下鮮明的特點:

1.具有數字信號處理技術共有的特點。(1)處理精度高。(2)重現性能

好。(3)靈活

性高。

2.數字圖像處理后的圖像是供人觀察和評價的,也可能作為機器視覺的

預處理結果。

3.數字圖像處理技術適用面寬。

4.數字圖像處理技術綜合性強。

1.3數字圖像處理主要包括哪些研究內容?

答:圖像處理的任務是將客觀世界的景象進行獲取并轉化為數字圖像、進

行增強、變換、

編碼、恢復、重建、編碼和壓縮、分割等處理,它將一幅圖像轉化為另一

幅具有新的意義的

圖像。

1.4討論數字圖像處理系統(tǒng)的組成。列舉你熟悉的圖像處理系統(tǒng)并分析它

們的組成和功能。

答:如圖1.8,數字圖像處理系統(tǒng)是應用計算機或專用數字設備對圖像信

息進行處理的

信息系統(tǒng)。圖像處理系統(tǒng)包括圖像處理硬件和圖像處理軟件。圖像處理硬

件主要由圖像輸入

設備、圖像運算處理設備(微計算機)、圖像存儲器、圖像輸出設備等組

成。軟件系統(tǒng)包括

操作系統(tǒng)、控制軟件及應用軟件等。

圖1.8數字圖像處理系統(tǒng)結構圖

1.5常見的數字圖像處理開發(fā)工具有哪些?各有什么特點?

答.目前圖像處理系統(tǒng)開發(fā)的主流工具為VisualC++(面向對象可視化集

成工具)和

MATLAB的圖像處理工具箱(ImageProcessingToolbox)。兩種開發(fā)工具

各有所長且有相互

間的軟件接口。

Microsoft公司的VC++是一種具有高度綜合性能的面向對象可視化集成工

具,用它開發(fā)

出來的Win32程序有著運行速度快、可移植能力強等優(yōu)點。VC++所提供

的Microsoft基礎

類庫MFC對大部分與用戶設計有關的Win32應用程序接口API進行了封

裝,提高了代碼

的可重用性,大大縮短了應用程序開發(fā)周期,降低了開發(fā)成本。由于圖像

格式多且復雜,為

了減輕程序員將主要精力放在特定問題的圖像處理算法上,VC++6.0提供

的動態(tài)鏈接庫

ImageLoad.dll支持BMP、JPG、TIF等常用6種格式的讀寫功能。

MATLAB的圖像處理工具箱MATLAB是由MathWorks公司推出的用于數值計

算的有

力工具,是一種第四代計算機語言,它具有相當強大的矩陣運算和操作功

能,力求使人們擺

脫繁雜的程序代碼。MATLAB圖像處理工具箱提供了豐富的圖像處理函數,

靈活運用這些

函數可以完成大部分圖像處理工作,從而大大節(jié)省編寫低層算法代碼的時

間,避免程序設計

中的重復勞動。MATLAB圖像處理工具箱涵蓋了在工程實踐中經常遇到的圖

像處理手段和

算法,如圖形句柄、圖像的表示、圖像變換、二維濾波器、圖像增強、四

叉樹分解域邊緣檢

測、二值圖像處理、小波分析、分形幾何、圖形用戶界面等。但是,MATLAB

也存在不足

之處限制了其在圖像處理軟件中實際應用。首先,強大的功能只能在安裝

有MATLAB系統(tǒng)

的機器上使用圖像處理工具箱中的函數或自編的m文件來實現。其次,

MATLAB使用行解

釋方式執(zhí)行代碼,執(zhí)行速度很慢。第三,MATLAB擅長矩陣運算,但對于循

環(huán)處理和圖形

界面的處理不及C++等語言。為此,通應用程序接口API和編譯器與其他

高級語言(如C、

C++、Java等)混合編程將會發(fā)揮各種程序設計語言之長協(xié)同完成圖像處

理任務。API支持

MATLAB與外部數據與程序的交互。編譯器產生獨立于MATLAB環(huán)境的程序,

從而使其他

語言的應用程序使用MATLABo

1.6常見的數字圖像應用軟件有哪些?各有什么特點?

答:圖像應用軟件是可直接供用戶使用的商品化軟件。用戶從使用功能出

發(fā),只要了解

軟件的操作方法就可以完成圖像處理的任務。對大部分用戶來說,商品化

的圖像應用軟件無

需用戶進行編程,操作方便,功能齊全,已經能滿足一般需求,因而得到

廣泛應用。常用圖

像處理應用軟件有以下幾種:

1.PHOTOSHOP:當今世界上一流的圖像設計與制作工具,其優(yōu)越性能令其

產品望塵

莫及。PHOTOSHOP已成為出版界中圖像處理的專業(yè)標準。高版本的

PHOTOSHOP支持多

達20多種圖像格式和TWAIN接口,接受一般掃描儀、數碼相機等圖像輸

入設備采集的圖

像。PHOTOSHOP支持多圖層的工作方式,只是PHOTOSHOP的最大特色。使

用圖層功能

可以很方便地編輯和修改圖像,使平面設計充滿創(chuàng)意。利用PHOTOSHOP還

可以方便地對

圖像進行各種平面處理、繪制簡單的幾何圖形、對文字進行藝術加工、進

行圖像格式和顏色

模式的轉換、改變圖像的尺寸和分辨率、制作網頁圖像等。

2.CorelDRAW:一種基于矢量繪圖、功能強大的圖形圖像制作與設計軟件。

位圖式圖像

是由象素組成的,與其相對,矢量式圖像以幾何、色彩參數描述圖像,其

內容以線條和色塊

為主??梢?,采用不同的技術手段可以滿足用戶的設計要求。位圖式圖像

善于表現連續(xù)、豐

富色調的自然景物,數據量較大;而矢量式圖像強于表現線條、色塊的圖

案,數據量較小。

合理的利用兩種不同類型的圖像表現方式,往往會收到意想不到的藝術效

果。CorelDraw是

當今流行的圖像處理軟件中為數不多的特點明顯、功能強大的基于矢量繪

圖的軟件包。利用

它,可以方便地制作精美的名片、賀卡、書簽、圖書封面、廣告、宣傳畫

等作品。

3.ACDSee:快速、高性能的看圖程序,是目前最享盛名的圖片瀏覽器。

它能廣泛應

用于圖片的獲取、管理、瀏覽和優(yōu)化,支持BMP、GIF、JPG、TGA、TIF等

超過50種常見

的圖形文件格式,圖片打開速度極快,可以直接查看動畫GIF,處理如Mpeg

之類常用的視

頻文件,還可以為每一個目錄建立一個相冊。ACDSee可以從數碼相機和掃

描儀高效獲取圖

片,并進行便捷的查找、組織和預覽。ACDSee還是得心應手的圖片編輯工

具,輕松處理數

碼影像,擁有去紅眼、剪切圖像、銳化、浮雕特效、曝光調整、旋轉、鏡

像等功能,還能進

行批量處理。

1.7討論數字圖像處理的主要應用。進一步查找資料,寫一篇關于你感興

趣的應用方面

的短文。

答:圖像處理的應用幾乎滲透科學研究、工程技術和人類社會生活的各

個領域。教師可

以分組對學生布置以下6個方面的課題,通過閱讀參考文獻、網絡資源等

手段寫數字圖像處

理的主要應用的短文,并安排交流機會。

1.航天和航空技術方面的應用

2.生物醫(yī)學工程方面的應用

3.通信工程方面的應用

4.工業(yè)自動化和機器人視覺方面的應用

5.軍事和公安方面的應用

6.生活和娛樂方面的應用

第2章圖像的數字化與顯示

2.1設圖像的大小為32X32的圖標,每個像素有16種顏色,共有多少種

不同的圖標?

如果每100萬個可能的圖標中有一個有意義,識別一個有意義的圖標需要

1秒鐘,則選出所

有有意義的圖標需要多長時間?

解:1632X32/106=161024/106=1.044X101227s

可見隨機圖像的復雜度是非常高的。

2.2掃描儀的光學分辨率是600X1200線,一個具有5000個感光單元的

CCD器件,用

于A4幅面掃描儀,A4幅面的紙張寬度是&3英寸,該掃描儀的光學分辨

率是多少dpi?

解:(1)600X1200線,其中前一個數字代表掃描儀的橫向分辨率,后一

數字則代表縱

向分辨率。

(2)dpi是指單位面積內像素的多少,也就是掃描精度,目前國際上都

是計算一英寸

面積內像素的多少。光學分辨率是掃描儀的光學部件在每平方英寸面積內

所能捕捉到的實際

的光點數,是指掃描儀CCD的物理分辨率,也是掃描儀的真實分辨率,它

的數值是由CCD

的像素點除以掃描儀水平最大可掃尺寸得到的數值。

每一個感光單元對應一個像素。由于CCD感光單元個數為5000,

5000/8.3=602(dpi)

第3章圖像變換

3.1二維傅里葉變換的分離性有什么實際意義?

解:該性質表明,一個二維傅里葉變換可由連續(xù)兩次一維傅里葉變換來實

現。實現的方

法如下圖所示:

3.2圖像處理中正交變換的目的是什么?圖像變換主要用于那些方面?

解:正交變換可以使得圖像能量主要集中分布在低頻率成分上,邊緣和線

信息反映在高

頻率成分上。因此正交變換廣泛應用在圖像增強、圖像恢復、特征提取、

圖像編碼壓縮和形

狀分析等方面。

3.3在MATLAB環(huán)境中,實現一幅圖像的傅里葉變換。

解:MATLAB程序如下:

A=imread(,rice,tif');

imshow(A);

A2=fft2(A);

A2=fftshift(A2);

figure,imshow(log(abs(A2)+1),[010]);

3.4利用MATLAB對一幅512X512的圖像進行DCT變換,并保留256X256

個DCT

變換系數進行重構圖像,比較重建圖像與原始圖像的差異。

解:MATLAB程序如下:

RGB=imreadCpout512.bmp');

I=rgb2gray(RGB);

J=dct2(I);

J(l:512,256:512)=0;

J(256:512,1:256)=0;

K=idct2(J);

imshow(I),figure,imshow(K,[0255])

3.5離散的沃爾什變換與哈達瑪變換之間有那些異同?

解:哈達瑪(Hadamard)變換和沃爾什(Walsh)變換的變換核都是由1,一

1組成的正交

方陣。它們不同的地方在于變換矩陣的行列排列次序不同。哈達瑪變換每

行的列率排列是沒

有規(guī)則的,沃爾什變換的列率是由小到大。

3.6求N=4對應的沃爾什變換核矩陣。

解:

111111111U11111H..

3.7什么是小波?小波基函數和傅里葉變換基函數有何區(qū)別?

解:小波信號的非零點是有限的。它與傅里葉變換的基函數(三角函數、

指數信號)是

不同的,傅里葉變換的基函數從負無窮到正無窮都是等幅振蕩的。

3.8為何稱小波變換為信號的“電子顯微鏡”,如何實現該功能?

解:小波變換的伸縮因子的變化,使得可以在不同尺度上觀察信號,所以

又稱電子顯微

鏡。實現小波變換可以應用Mallat的快速算法。

3.9應用MATLAB設計小波變換程序,該程序能夠讀入一幅BMP格式的圖

像,顯示

該圖像和小波變換系數。

解:由讀者思考。

3.10傅里葉變換、加窗傅里葉變換和小波變換的時間一頻率特性有什么

不同?

解:傅里葉變換使得時間信號變成了頻域信號,加窗傅里葉變換使得時間

信號變成了時

頻信號,但是窗口是固定的,小波變換同樣變成了視頻信號,但是時頻的

窗口是變化的。

3.11利用MATLAB進行圖像的小波變換,觀察小波系數特點。

解:MATLAB程序如下:

X=imread('rice.tif,);

[cAl,clll,cVl,cDl]=dwt2(X,'bior3.7');

subplot(2,2,1);imshow(cAl,[0900]);

titleCApproximationAl')

subplot(2,2,2);imshow(cHl);

title('HorizontalDetailHl')

subplot(2,2,3);imshow(cVl);

titleCVerticalDetailVI')

subplot(2,2,4);imshow(cDl);

第4章圖像增強

4.1圖像增強的目的是什么,它包含那些內容?

解:圖像增強是指對圖像的某些特征,如邊緣、輪廓、對比度等進行強調

或銳化,以

便于顯示、觀察或進一步分析與處理。圖像增強所包含的主要內容如書圖

4.lo

4.2已知灰度圖像f(x,y)為如下矩陣所示,求經過反轉變換后圖像g

(x,y)。反轉

變換g=G(f)如圖a所示。

圖a

解:

101111101

4.3直方圖均衡,若一個64X64的離散圖像,灰度分成8層,其灰度rk

的值和分布情況

如下:請繪制該圖像的直方圖,并求經過直方圖均衡后的圖像的直方圖。

k

0

1

2

3

4

5

6

7

kr

0

71

72

73

74

75

76

1

kn

560

920

1046

705

356

267

170

72

解:

k

0

1

2

3

4

5

6

7

kr

0

71

72

73

74

75

76

1

kn

560

920

1046

705

356

267

170

72

)(krrp

0.14

0.22

0.26

0.17

0.09

0.07

0.04

0.02

kS

0.14

0.36

0.62

0.79

0.88

0.95

0.99

1

ff

kS

71

73

74

76

76

1

1

1

kS

71

73

74

1

ksn

560

920

1046

1061

509

)(krsp

0.14

0.22

0.26

0.26

0.13

4.4分析說明為什么對數字圖像進行直方圖均衡化后,通常并不能產生完

全平坦的直

方圖。

解:直方圖均衡中:()()OrrsTrprdr==/

對于上式積分來講s=l,但是在實際中,不是連續(xù)的,所以直方圖均衡并

不會

產生完全平坦的直方圖。

)(rpr

4.5設對一幅圖像進行了均衡化處理,試證明第二次采用直方圖均衡化處

理的結果與

第一次的結果相同。

解:設第二次直方圖均衡后灰度用表示,kw

22==

kiikiskknnnnSTWiOO)(

所以第二次的結果和第一次結果相同。

4.6什么是圖像平滑?試述均值濾波的基本原理。

解:為了去除或減弱圖像中的噪聲,可以對圖像進行平滑處理,稱為圖像

平滑。大部分

的噪聲都可以看作是隨機信號,它們對圖像的影響可以看作是孤立的。對

于某一像素而言,

如果它與周圍像素點相比,有明顯的不同,我們就認為該點被噪聲感染了。

基于這樣的分析,

我們可以用求均值的方法,來判斷每一點是否含有噪聲,并用適當的方法

消除所發(fā)現的噪聲。

4.7設圖像如下表a所示,分別求經過鄰域平滑和高通算子銳化的結果。

其中邊緣點

保持不變,鄰域平滑掩碼取3X3矩陣,即

11110111181H,高通算子取3X3矩陣,即:

111181111H

表a

解:鄰域平滑的結果:

1

1

3

4

5

2

21/8

26/8

35/8

5

2

22/8

25/8

32/8

5

3

29/8

27/8

25/8

2

4

5

4

1

1

1

1

3

4

5

2

-13

6

5

5

2

2

15

0

5

3

-13

-4

-1

2

4

5

4

1

1

4.8什么是中值濾波,有何特點?

解:中值濾波是非線性的處理方法,在去噪的同時可以兼顧到邊界信息的

保留。

中值濾波首先選一個含有奇數點的窗口W,將這個窗口在圖像上掃描,把

該窗口中所含的

像素點按灰度級的升(或降)序排列,取位于中間的灰度值,來代替該點

的灰度值。

4.9設原圖像為:24743546444,求經過中值濾波后的值,中

濾波取一維的模板如下圖b所示,待處理像素的灰度取這個模板中的灰度

的中值。邊界點保

持不變。

解:2444444444

4.10試分析中值濾波及各種差分算子濾波的計算量、優(yōu)缺點和適用范圍。

解:由讀者思考。

4.11應用MATLAB設計bmp文件格式的圖像讀取、顯示和直方圖統(tǒng)計程序。

解:由讀者思考。

4.12應用MATLAB設計圖像銳化的程序。

解:由讀者思考。

4.13在MATLAB環(huán)境中,完成圖像的增亮、變暗處理。

解:MATLAB程序如下:

A=imreadCpout.tif");%讀入圖像

imshow(A);%顯示圖像

figure,imhist(A);%顯示圖像的直方圖

Jl=imadjust(A,[0.30.7],[]);

%將圖像在0.3X255~0.7X255灰度之間的值通過線性變換映射到0~255

之間

figure,imshow(Jl);%輸出圖像效果圖

figure,imhist(J1)%輸出圖像的直方圖

J2=imadjust(A,[],[00.7]);

%使用此函數,將圖像灰度通過線性變換映射到0~255X0.7之間

figure,imshow(J2);%輸出圖像效果圖

figure,imhist(J2)%輸出圖像的直方圖

4.14在MATLAB環(huán)境中,對圖像進行去噪處理。

解:參見例4.4

4.15在MATLAB環(huán)境中,對圖像進行直方圖均衡處理,分析結果。

解:參見例4.3

第5章圖像編碼與壓縮

5.1從哪些方面說明數據壓縮的必要性?

答:采用數字技術會使信號處理的性能大為提高,但其數據量的增加也是

十分驚人的。

圖像數據更是多媒體、網絡通信等技術重點研究的壓縮對象。不加壓縮的

圖像數據是計算機

的處理速度、通信信道的容量等所無法承受的。

這樣的數據率是與當前信息存儲介質的容量、計算機的總線速度以及網絡

的傳輸率不相

匹配的。盡管人們在存儲介質、總線結構和網絡性能等方面不斷有新的突

破,但數據量的增

長速度遠超過硬件設施的提高水平,以上的矛盾仍然無法緩解。

如果將上述圖像信號壓縮幾倍、十幾倍,甚至上百倍,將十分有利于圖像

的傳輸和存儲。

可見,在現有硬件設施條件下,對圖像信號本身進行壓縮是解決上述矛盾

的主要出路。

5.2討論圖像壓縮方法的分類及其各自的特點。

答:一般數據壓縮按信息損失的程度來分類。見教材圖5.2:常見數據壓

縮技術的分類。

無損壓縮:Huffman編碼和Shannon編碼根據概率分布特性確定碼長;游

程編碼根據連

續(xù)灰度的游程來確定編碼;算術編碼隨信源數據不斷縮小的實數區(qū)間,然

后用一個與實數對

應的二進制碼代表被編碼的信息;輪廓編碼根據相同灰度的區(qū)域邊界線進

行編碼。

有損壓縮:預測編碼根據相鄰像素相關性來確定后繼像素的預測值,若用

差值進行編碼

則可以壓縮數據量;變換編碼對原始圖像進行正交變換,在變換域進行抽

樣達到壓縮的目的;

混合編碼將兩種編碼方法結合起來,如將預測編碼與變換編碼相結合,以

取得更好的效果。

在現代壓縮編碼方法中,分形編碼利用宏觀與微觀的相似性來壓縮數據

量,可以獲得極

大的壓縮比。該方法壓縮過程的計算量較大,但解壓縮很快,適用于圖像

數據的存儲和重現。

模型基編碼:一種新型壓縮方法。該方法在發(fā)送端利用已知且變化慢的場

景得到數據量

不大的模型參數,在接收端利用綜合模型參數恢復原始圖像。這一編碼方

法對于實時實現電

視會議等具有顯著意義。

圖5.2常見數據壓縮技術的分類

5.3數據沒有冗余度能否壓縮?為什么?

答:圖像數據量大,同時冗余數據也是客觀存在的。一般圖像中存在著以

下數據冗余因

素:(1)編碼冗余;(2)像素間的相關性形成的冗余;(3)視覺特性和顯

示設備引起的冗余。

理論上,數據沒有冗余度是不壓縮的,否則無法解碼出原始數據。但在大

部分應用場合

下采用有損壓縮,數據沒有冗余度也可以進行壓縮。

5.4如何衡量圖像編碼壓縮方法的性能?

答:一般地,圖像壓縮應能做到壓縮比大、算法簡單、易于用硬件和軟件

實現、壓縮和

解壓縮實時性好、解壓縮恢復的圖像失真小等。但這些指標對同一壓縮方

法很難統(tǒng)一,在實

際系統(tǒng)中往往需要抓住主要矛盾,全面權衡。常用的圖像壓縮技術指標有:

(1)圖像螭與平

均碼長;(2)圖像冗余度與編碼效率;(3)壓縮比;(4)客觀評價SNR;

(5)主觀評價。圖

像的主客觀兩種評價之間存在著密切的聯系。但一般來說,客觀評價高的

主觀評價也高,因

此在圖像編碼的質量評價時,首先作客觀評價,以主觀評價為參考。

5.5一圖像大小為640X480,256色。用軟件工具SEA(version1.3)將

其分別轉成24

位色BMP,24位色JPEG,GIF(只能轉成256色)壓縮格式,24位色TIFF

壓縮格式,24

位色TGA壓縮格式,得到的文件大小分別為:921,654字節(jié);17,707字節(jié);

177,152字節(jié);

923,044字節(jié);768,136字節(jié)。分別計算每種壓縮圖像的壓縮比。

解:不計算較小的文件頭和彩色查找表(LTU)的數據量,原始圖像的數

據量為:

640X480X1byte=307,200byte。

經轉換后各種格式的壓縮比如下:

24位色BMP格式:307,200/921,654=0.333(增加了冗余度)

24位色JPEG格式:307,200/17,707=17.35

GIF壓縮格式:307,200/177,152=1.73

24位色TIFF壓縮格式:307,200/923,044=0.333(增加了冗余度)

24位色TGA壓縮格式:307,200/768,136=0.400(增加了冗余度)

5.6大部分視頻壓縮方法是有損壓縮還是無損壓縮?為什么?

答:視頻比靜態(tài)圖像數據量更大,同時可壓縮的冗余信息更多。大部分視

頻壓縮方法是

以人眼感覺無明顯失真為依據的,因此采用有損壓縮。事實上,視頻可以

看成是一幅幅不同

但相關的靜態(tài)圖像的時間序列。因此,靜態(tài)圖像的壓縮技術和標準可以直

接應用于視頻的單

幀圖像。另外,利用視頻幀間信息的冗余可以大大提高視頻的壓縮比。

5.7若圖像上任意兩像素點的亮度電平值相等或者任意兩時刻同一位置

上的像素的亮

度電平值相等,能夠說明上述兩種情況下像素相關嗎?為什么?

答:不能。像素的空間相關性和時間相關性是以空間和時間的相鄰性為基

礎的。因此,

圖像上任意兩像素點的亮度電平值相等或者任意兩時刻同一位置上的像

素的亮度電平值相

等帶有偶然性,不能說明兩像素相關。

5.8根據JPEG算法說明JPEG圖像顯示時會出現馬賽克現象的原因。

答:由于JPEG算法將整幅圖像分成若干個8X8的子塊,解碼也是以子塊

為單位的,所

以塊間的解碼誤差可能反映為方塊效應,在視覺上會出現馬賽克現象。

5.9討論混合編碼的優(yōu)點。

答:混合編碼一般指將預測編碼與變換編碼相結合進行編碼的方法。預測

編碼根據相鄰

像素相關性來確定后繼像素的預測值,若用差值進行編碼則可以壓縮數據

量;變換編碼對原

始圖像進行正交變換,在變換域進行抽樣達到壓縮的目的;混合編碼將兩

種編碼方法結合起

來,可以發(fā)揮兩種編碼方法的優(yōu)點,取得更好的效果。

5.10有了離散傅里葉及其快速算法FFT,為什么還要提出離散余弦算法

DCT及其快

速算法?為什么許多視頻國際標準將DCT作為幀內編碼的基本壓縮算法?

答:在所有的變換編碼方案中,離散K-L變換是最佳變換,理論價值較高,

常常作為

對其他變換特性進行評價的標準。但此變換沒有快速算法,在工程應用中

受到限制。在次最

佳變換算法中,DFT和DCT都是常用的變換編碼方法,它們分別有快速算

法:FFT和FCT。

這兩種方法相比較,DFT涉及到復數運算,而DCT是實數變換具有十分吸

引人的一些特點:

它是一種實數變換,計算量較小,其變換矩陣的基向量很好地描述了人類

視覺的相關性,且

對于大多數圖像來說,該變換的壓縮性能很接近離散K-L變換,而且其變

換矩陣與圖像內

容無關,另外由于它構造對稱的數據序列,避免了在圖像邊界處的跳躍及

所引起的Gibbs

效應,并且也有快速算法,因而得到廣泛的應用。作為準最佳變換,它已

成為一些靜態(tài)圖像、

視頻壓縮國際標準(或建議)中的基本處理模塊。JPEG制定了基于DCT的

有失真靜止圖像

壓縮標準。在MPEG視頻編碼器中幀內圖像(I圖像)采用DCT的編碼方法。

5.11為什么二維DCT可以轉換成兩次一維DCT計算?

答:參考第3章圖像變換。二維變換可以分解成兩次變換,如先進行變換,

再進行列變

換,或反之。

5.12Huffman編碼有何優(yōu)缺點?

答:Huffman編碼在無失真的編碼方法中效率優(yōu)于其他編碼方法,是一種

最佳變長碼,

其平均碼長接近于燧值。但當信源數據成分復雜時,龐大的信源集致使

Huffman碼表較大,

碼表生成的計算量增加,編譯碼速度相應變慢;另外不等長編碼致使硬件

譯碼電路實現困難。

上述原因致使Huffman編碼的實際應用受到限制。

5.13Huffman編碼是最佳編碼,為什么還要研究算術編碼等其他燃編碼算

法?

答:題5.12中討論了Huffman編碼的優(yōu)缺點,其他嫡編碼方法可以在某

些性能上克服

Huffman編碼的不足。如,雖然算術編碼的硬件實現比Huffman編碼方法

復雜,但對圖像的

編碼測試結果表明,在信源符號概率接近的條件下,算術編碼效率高于

Huffman編碼。

5.14算術編碼有何優(yōu)點?舉例說明其適用范圍。

答:在信源符號概率接近的條件下,算術編碼效率高于Huffman編碼。因

此,在擴展

的JPEG系統(tǒng)中用算術編碼取代了Huffman編碼。另外,算術編碼除了常

見的基于概率統(tǒng)計

的模式外,還有自適應模式。在這種模式下,各個符號的初始概率相同,

它們依據出現的符

號而發(fā)生變化。這種模式特別適用于不便于進行符號概率統(tǒng)計的實際場合

中。

5.15用JPEG標準,對于576行X720列的CCIR601建議分辨率的彩色圖

像,其亮度

分量可分割成多少個子塊,而兩個色差分量可分別分割成多少子塊?

解:對于576行X720列的CCIR601建議分辨率的彩色圖像,JPEG將其

亮度分量分割成

(576/8)X(720/8)=6480塊。兩個色差分量都可分割成兩組:(576/8)

X(360/8)=3240塊。

5.16JPEG為什么要進行彩色空間轉換?

答:JPEG算法處理的是單獨的彩色分量圖像,所以來自其他彩色空間的圖

像數據要以

JPEG格式保存,需要進行彩色空間的轉換,如將RGB空間、YCRCB空間或

轉換為YUV空間等。

5.17JPEG的量化表有何作用?

答:量化的目的是為了壓縮數據,同時也是圖像質量下降的主要原因。所

以設計合理的

量化器十分重要。在保證圖像質量的前提下,為了獲得較高的壓縮比,JPEG

量化器利用人

眼的空間視覺特性,相對于高頻成分對低頻成分采用較小的量化間隔和較

少的比特數。又根

據人眼對亮度信號比色度信號敏感的原理,對圖像的亮度分量和圖像的色

差分量使用不同的

量化表——亮度量化表和色差量化表。量化表的元素即為量化間隔。對于

CCIR601標準電

視圖像,JPEG標準提供了最佳的亮度和色度量化表。根據不同的應用需要,

用戶還可以設

計或選擇其他的量化表。

5.18JPEG算法中DCT系數采用Z字形重排有何作用?

答:DCT系數左上角(第1行第1歹U)為直流分量(DC系數),對8義8子

塊矩陣進行

Z字形編排則可將其余的交流分量(AC系數)按“頻率”從低到高排列,

形成1X64的矢

量。這樣排列可以增加“0”系數的游程長度,提高壓縮效率。

第6章圖像復原

6.1引起圖像退化的原因有哪些?

答:造成圖像退化的原因很多,大致可分為以下幾個方面:

(1)射線輻射、大氣湍流等造成的照片畸變。

(2)模擬圖像數字化的過程中,由于會損失部分細節(jié),造成圖像質量下

降。

(3)鏡頭聚焦不準產生的散焦模糊。

(4)成像系統(tǒng)中始終存在的噪聲干擾。

(5)拍攝時,相機與景物之間的相對運動產生的運動模糊。

(6)底片感光、圖像顯示時會造成記錄顯示失真。

(7)成像系統(tǒng)的像差、非線性畸變、有限帶寬等造成的圖像失真。

(8)攜帶遙感儀器的飛行器運動的不穩(wěn)定,以及地球自轉等因素引起的

照片幾何失真。

6.2常見的圖像退化模型包含哪些種類?

答:從圖像信號的產生形式來看,可將退化模型分為連續(xù)圖像退化模型

和連續(xù)圖像退化

模型。

(1)連續(xù)圖像退化的一般模型如圖所示。輸入圖像f(x,y)經過一個退化

系統(tǒng)或退化算子

H(X,y)后考慮加性噪聲的影響產生的退化圖像g(x,y)可以表示為:

g(x,y)=H[f(x,y)]+n(x,y)

如果噪聲是乘法性噪聲,可以通過對數運算轉化為加性噪聲的形式,通過

同態(tài)濾波可

以則退化圖像可恢復原來的圖像。

H(x,y)f(x,y)g(x,y)

n(x,y)

圖圖像退化一般模型

(2)數字圖像處理系統(tǒng)處理的圖像是離散圖像,所以對連續(xù)退化模型的

離散化即形成

離散圖像退化模型。這種模型通常用矩陣代數求解。

根據降質系統(tǒng)的傳遞函數主要有:

(1)空間非相干成像系統(tǒng)由于衍射限制造成的圖像退化模型。

(2)照相機與被攝景物之間的相對運動造成的圖像退化模型。

(3)大氣湍流造成的圖像退化模型。

(4)由于成像系統(tǒng)的非線性、飛行器的姿態(tài)、高度和速度變化等引起的

不穩(wěn)定與不可

預測的幾何失真,造成的幾何畸變模型。

6.3用維納濾波的方法進行圖像復原,不同的PSF對復原效果有什么影

響?

解:用維納濾波的方法進行圖像復原,不同的PSF參數值對復原效果影響

較大。模糊

函數可能是高斯函數或運動模糊函數等。教材中以運動模糊為例,對不同

的PSF參數值產

生的復原效果進行比較。復原結果見教材圖6.3(a)。實際應用過程中,

真實的PSF通常是

未知的,需要根據一定的先驗知識對它進行估計,再將估計值作為參數進

行圖像復原。圖

6.3分別顯示了使用較“長”和較“陡峭”的PSF后所產生的復原效果,

由此可見PSF的重要性。

6.4用約束最小二乘方濾波復原時,不同的噪聲強度、拉氏算子的搜索范

圍和約束算

子對復原效果有何影響?

解:DECONVREG函數提供了使用平滑約束最小二乘濾波算法對圖像去卷積

的功能。

調用格式如下:[JLAGRA]=DECONVREG(I,PSF,NP,LRANGE,REGOP)。其中,

I假設為真

實場景圖像在PSF的作用下并附加噪聲的圖像,NP為噪聲強度,J為去模

糊的復原圖像。

LRANGE(拉氏算子的搜索范圍)、REGOP(約束算子)為改善復原效果的可

選參數。LRANGE

指定搜索最佳拉氏算子的范圍,缺省值為[10-9,109]。返回值LAGRA為

在搜索范圍的Lagrange

乘子。如果LRANGE為標量,則該算法假定LAGRA已經給定且等于LRANGE,

因而NP值

可以不予考慮。REG0P的缺省值為平滑約束Laplacian算子。教材例6.2

說明采用平滑約束的

最小二乘復原的具體實現方法。不同的復原圖像效果比較見圖6.5、圖6.6、

圖6.7o通過這

些圖像可以分析各個參數對圖像復原質量的影響。實際應用中,讀者可以

根據這些經驗來選

擇最佳的參數進行圖像復原。

6.5盲去卷積方法中,如何選擇一個合適的PSF值?

解:對具有加性噪聲的模糊圖像作盲圖像復原的方法一般有兩種:直接測

量法和間接估

計法。MATLAB提供了DECONVBLIND函數進行盲圖像復原。該函數采用最大

似然算法

對模糊圖像進行去卷積處理,返回去模糊的圖像和相應的點擴散函數PSFo

6.6除了本書所介紹的圖像復原方法,還有哪些新興的圖像復原技術?

答:二維卡爾曼濾波圖像復原、在小波變換域內實現圖像的超分辨率復原、

基于偏微分

方程圖像復原技術等。

6.7對于一些常用的圖像復原方法,如何用MATLAB去實現?

解:參見教材附錄B中表B-5提供的4個圖像復原函數。

第7章圖像分割

7.1什么是閾值分割技術?該技術適用于什么場景下的圖像分割?

解:可用一個灰度級閾值T進行分割,分割出目標區(qū)域與背景區(qū)域,這種

方法我們稱

為灰度閾值分割方法。通常用于圖像中目標和背景具有不同的灰度集合:

目標灰度集合與背

景灰度集合。

7.2邊緣檢測的理論依據是什么?有哪些方法?各有什么特點?

解:邊緣檢測這是基于幅度不連續(xù)性進行的分割方法。通常采用差分、梯

度、拉普拉斯

算子及各種高通濾波處理方法對圖像進行邊緣檢測。

7.3基于圖像邊緣的算子分割技術的理論根據是什么?

解:通過差分、梯度、拉普拉斯算子及各種高通濾波處理方法對圖像邊緣

進行增強,然

后再進行一次門限化的處理,便可以將邊緣增強的方法用于邊緣檢測,最

后根據邊緣來進行

圖像分割。

7.4什么是區(qū)域?什么是圖像分割?

解:區(qū)域可以認為是圖像中具有相互連通、一致屬性的像素集合,圖像分

割就是指把圖

像分成互不重疊的區(qū)域并提取出感興趣目標的技術。

7.5什么是Hough變換?試述采用Hough變換檢測直線的原理。

解:霍夫變換的基本思想是點一線的對偶性。圖像變換前在圖像空間,變

換后在參數空

間。在圖像空間中的直線上的每一個點都會映射到參數空間中的相同參

數,所以只要找到這

個參數就可以找到圖像空間中的直線。Hough變換就是根據這個原理檢測

直線的。

7.6對下面的圖像采用基于區(qū)域灰度差進行區(qū)域增長,給出灰度差值T①

=1;T②=2;

T③二3三種情況下的分割圖像。

1

0

4

7

5

1

0

4

7

7

0

1

5

5

5

2

0

5

6

5

2

2

5

6

4

解:

1

1

2

3

4

1

1

2

3

3

1

1

2

2

2

1

1

2

2

2

1

1

2

2

2

1

1

2

2

2

1

1

2

2

2

1

1

2

2

2

1

1

2

2

2

1

1

2

2

2

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

7.7應用Matlab語言編寫對一幅灰度圖像進行邊緣檢測、二值化的程序

(檢測和二值

化的方法可以根據實際圖像進行選擇)。

解:由讀者思考。

7.8用4連通或8連通準則,判斷如下圖像中的目標。

11100000

11101100

11001100

11000110

01000010

10100010

11100110

11100000

解:四鄰域:L4=

11100000

11103300

11003300

11000330

01000030

20200030

22200330

22200000

八鄰域:L8=

11100000

11102200

11002200

11000220

01000020

10100020

11100220

11100000

7.9Hough變換檢測直線時,為什么不采用y=kx+b的表示形式?

解:使用等式y(tǒng)=px+q表示一條直線帶來的問題是,當直線接近垂直時,

直線的斜率接

近無限大。解決這一難點的一種方法是使用極坐標直線方程:

96Psincosyx+=

7.10設計一個利用Sobel算子、Roberts算子、高斯算子與形態(tài)算子進行

邊界檢測的程

序,比較各邊界檢測算子檢測的視覺效果與運算量。

解:由讀者思考。

第8章彩色圖像處理

8.1如何表示圖像中一點的彩色值?顏色模型起什么作用?

答:圖像中一點的彩色值顏色三維空間中的一個點來表示,每個點有三個

分量,不同的

顏色空間各分量的含義不同。

顏色模型規(guī)定了顏色的建立、描述和觀察方式。顏色模型都是建立在三維

空間中的,所

以與顏色空間密不可分。

8.2色調、色飽和度和亮度的定義是什么?在表征圖像一點顏色時,各起

什么作用?

答:HSV模型由色度(H),飽和度(S),亮度(V)三個分量組成的,與人

的視覺特

性比較接近。HSV顏色模型用Munsell三維空間坐標系統(tǒng)表示。

色調(H)表示顏色的種類,用角度來標定,用-1800?1800或00~3600

度量。

色飽和度(S)表示顏色的深淺,在徑向方向上的用離開中心線的距離表

示。用百分比

來度量,從0%到完全飽和的100%。

亮度(V)表示顏色的明亮程度,用垂直軸表示。也通常用百分比度量,

從0%(黑)

到100%(白。

8.3為什么有時需要將一種顏色數據表示形式轉換為另一種形式?如何

由RGB數值

計算HSV數值?

答:實際應用中常用的顏色空間很多,有RGB、HSV、HSI、YUV、YIQ等。

目前常

用的顏色空間可分為兩類,一類是面向硬設備的,比方說彩色顯示器、打

印機等,另一類面

向以彩色處理為目的的應用,面向硬設備的最常用的顏色空間是RGB顏色

空間,而面向顏

色處理的最常用顏色空間是HSI顏色空間以及HSV顏色空間。針對不同的

應用目的采用不

同的彩色空間可能更合適,因此,有時需要將一種顏色數據表示形式轉換

為另一種形式。

由RGB數值計算HSV數值的方法,參見教材公式(8.2)~(8.2)。

8.4當R=0,G=0,B=1時,在HSI空間求H和S值。

解:根據公式(8.8)有:

12narccos()4.189(rad)

2H=..=,S=l,131=

8.5什么是彩色的減性模型和加性模型?哪一種模型更適合用于顯示、圖

片和打印場

合?

答:由三基色混配各種顏色通常有兩種方法:相加混色法和相減混色法。

相加混色和相

減混色的主要區(qū)別表現在以下三個方面:

(1)相加混色是由發(fā)光體發(fā)出的光相加而產生的各種顏色,而相減混色

是先有白色光,

然后從中減去某些成份(吸收)得到各種顏色。

(2)相加混色的三基色是紅、綠、藍,而相減混色的三基色是黃、青、

品紅。也就是

說,相加混色的補色就是相減混色的基色。

(3)相加混色和相減混色有不同的規(guī)律。

彩色電視機顯示的顏色是通過相加混色產生的。而彩色電影和幻燈片等與

繪畫原料、打

印機打印圖片等是通過相減混色產生各種顏色的。

8.6哪個顏色空間最接近人的視覺系統(tǒng)的特點?

答:在許多實用系統(tǒng)中,大量應用的是HSV模型,這個模型是由色度(H),

飽和度(S),

亮度(V)三個分量組成的,與人的視覺特性比較接近。該模型的重要性

在于:一方面消除

了亮度成分V在圖像中與顏色信息的聯系,另一方面色調H和飽和度S分

量與人的視覺感

受密切相關?;谌说囊曈X系統(tǒng)的顏色感覺特性,這些特征使HSV模型成

為一個研究圖像

處理的重要工具。

8.7為什么在某些場合下要進行彩色量化?彩色圖像的量化的依據是什

么?

答:彩色空間的連續(xù)空間。如果對連續(xù)空間進行適當的量化后再計算,則

計算量要少得

多。如在實際處理中,需要將HSV三個分量進行量化以減少特征值的數量。

8.8抖動技術是如何利用只能顯示較少顏色的設備重現含有豐富色彩圖

像的?

答:抖動法是一種利用僅能重現較少顏色種類的設備來顯示含有豐富色彩

圖像的有效的

方法。產生抖動圖像可以有多種方式,但是基本原理都是一樣的:采用能

直接顯示其色彩的

像素模式來替換那些其色彩不能直接顯示的像素。抖動技術利用了空間混

色原理——人的肉

眼能將兩種不同顏色的相鄰像素融合成第三種顏色。

8.9討論偽彩色在云圖繪制和顯示等氣象領域的應用。

解:衛(wèi)星云圖是地面接受到的來自氣象衛(wèi)星的云況圖片。按氣象衛(wèi)星取得

云況的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論