多媒體技術(shù)第二章_第1頁
多媒體技術(shù)第二章_第2頁
多媒體技術(shù)第二章_第3頁
多媒體技術(shù)第二章_第4頁
多媒體技術(shù)第二章_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、第二章第二章 圖像處理技術(shù)圖像處理技術(shù)2.12.1圖像的數(shù)據(jù)表示圖像的數(shù)據(jù)表示 人眼能識別的自然景象或圖像源是一種模擬信號,人眼能識別的自然景象或圖像源是一種模擬信號,為了使計算機能夠記錄和處理圖像,必須首先使其為了使計算機能夠記錄和處理圖像,必須首先使其數(shù)字化。數(shù)字化。 數(shù)字化后的圖像成為數(shù)字圖像。數(shù)字圖像可以定數(shù)字化后的圖像成為數(shù)字圖像。數(shù)字圖像可以定義為一個二維函數(shù)義為一個二維函數(shù)f(x,y),其中,其中x 和和y是空間坐標(biāo),在是空間坐標(biāo),在(x,y)坐標(biāo)處的幅度值坐標(biāo)處的幅度值f稱為圖像在該點稱為圖像在該點坐標(biāo)的強度坐標(biāo)的強度或或灰度值灰度值,該值的大小由圖像本身決定。,該值的大小由圖

2、像本身決定。 灰度信息數(shù)字化數(shù)字化像素11244211127887211585586116856861168754211584166114831661126111112.1.12.1.1數(shù)字圖像的基本參數(shù)數(shù)字圖像的基本參數(shù)一、分辨率一、分辨率 經(jīng)常遇到的分辨率有兩種:顯示分辨率和圖像分辨率。經(jīng)常遇到的分辨率有兩種:顯示分辨率和圖像分辨率。1、顯示分辨率、顯示分辨率 指顯示屏上能夠顯示出的像素數(shù)目。例如,顯示分辨指顯示屏上能夠顯示出的像素數(shù)目。例如,顯示分辨率為率為640*480表示顯示屏分成表示顯示屏分成480行,每行顯示行,每行顯示640個像個像素,整個顯示屏就含有素,整個顯示屏就含有640

3、*480=307200個顯像點。個顯像點。 屏幕能夠顯示的像素越多,說明設(shè)備的分辨率越高,屏幕能夠顯示的像素越多,說明設(shè)備的分辨率越高,顯示的圖像質(zhì)量也越高。顯示的圖像質(zhì)量也越高。2 2、圖像分辨率、圖像分辨率 圖像分辨率是指組成一幅圖像的像素密度的度量方法。圖像分辨率是指組成一幅圖像的像素密度的度量方法。對于同樣大小的一幅圖,如果組成該圖的圖像像素越多,對于同樣大小的一幅圖,如果組成該圖的圖像像素越多,則說明圖像的分辨率越高,看起來越逼真。則說明圖像的分辨率越高,看起來越逼真。1024*1024512*512256*256128*12864*6432*32二、圖像深度與顏色類型二、圖像深度與

4、顏色類型1 1、圖像深度、圖像深度 是指存儲每個像素所用的位數(shù),圖像深度決定了彩色是指存儲每個像素所用的位數(shù),圖像深度決定了彩色圖像的每個像素可能有的顏色數(shù),或者確定灰度圖像的圖像的每個像素可能有的顏色數(shù),或者確定灰度圖像的每個像素可能有的灰度等技術(shù)。每個像素可能有的灰度等技術(shù)。 例:深度為例:深度為1 1位的圖像只能有兩種顏色(一般為白色位的圖像只能有兩種顏色(一般為白色或黑色)。對于彩色圖像,每個像素用或黑色)。對于彩色圖像,每個像素用RGBRGB三個分量表三個分量表示,若每個分量用示,若每個分量用8 8位,那么一個像素共用位,那么一個像素共用2424位,每個位,每個像素可以是像素可以是2

5、 22424=16 777 216=16 777 216種顏色中的一種。種顏色中的一種。 表示一個像素的位數(shù)越多,它能表達的顏色數(shù)目就越表示一個像素的位數(shù)越多,它能表達的顏色數(shù)目就越多,它的圖像深度就越深。多,它的圖像深度就越深。 2、顏色類型、顏色類型 圖像深度與顏色的映射關(guān)系主要有真彩色、偽彩色和圖像深度與顏色的映射關(guān)系主要有真彩色、偽彩色和直接色三種。即在最常用的直接色三種。即在最常用的RGB顏色空間中,顏色類顏色空間中,顏色類型可以劃分為型可以劃分為真彩色,偽彩色和直接色真彩色,偽彩色和直接色三種。三種。 (1 1)真彩色:)真彩色:圖像中的每個像素值都分成圖像中的每個像素值都分成R

6、R、G G、B B三個基三個基色分量色分量,每個基色分量直接決定其基色的強度,這樣得,每個基色分量直接決定其基色的強度,這樣得到的顏色可以反映原圖的真實顏色。到的顏色可以反映原圖的真實顏色。 圖像的深度是圖像的深度是8 8* *3=243=24,圖像可容納,圖像可容納2 28 8 * *2 28 8* * 2 28 8 =16M =16M種。種。 (2 2)偽彩色)偽彩色 偽彩色圖像的每個像素值實際上是一個偽彩色圖像的每個像素值實際上是一個索引值或代碼索引值或代碼,該代碼值作為顏色查找表中某一項的入口地址,根據(jù)該該代碼值作為顏色查找表中某一項的入口地址,根據(jù)該地址可查找出包含實際地址可查找出包

7、含實際R R、G G、B B的強度值。的強度值。 彩色查找表是一個事先做好的表。彩色查找表是一個事先做好的表。例如:例如:256256種顏色種顏色的查找表,的查找表,0 0號索引對應(yīng)黑色,。,號索引對應(yīng)黑色,。,255255號對應(yīng)白色。號對應(yīng)白色。代碼代碼R R G G B B 顏色名稱顏色名稱 效果效果 0 0 0 0 黑(Black) 1 0 0 128 深藍(Navy) 2 0 128 0 深綠(Dark Green) 3 0 128 128 深青(Dark Cyan) 4 128 0 0 深紅(Maroon) 5 128 0 128 紫(Purple) 6 128 128 0 橄欖綠(

8、Olive) 7 192 192 192 灰白(Light gray) 8 128 128 128 深灰(Dark gray) 9 0 0 255 藍( blue) 10 0 255 0 綠( green) 11 0 255 255 青(cyan) 12 255 0 0 紅( red) 13 255 0 255 品紅( magenta) 14 255 255 0 黃(Yellow) 15 255 255 255 白(white) 16色標(biāo)準(zhǔn)VGA調(diào)色板 (3 3)直接色)直接色 直接色的獲取是通過直接色的獲取是通過每個像素點的每個像素點的RGBRGB分量分別作為分量分別作為單獨的索引值進行變換

9、單獨的索引值進行變換,經(jīng)相應(yīng)的顏色變換表找出各自,經(jīng)相應(yīng)的顏色變換表找出各自的基色強度,用變換后的的基色強度,用變換后的RGBRGB強度值產(chǎn)生的顏色。強度值產(chǎn)生的顏色。 直接色與偽彩色相比,相同之處是都采用查找表,不直接色與偽彩色相比,相同之處是都采用查找表,不同之處是前者同之處是前者對對RGBRGB分量分別進行查找變換分量分別進行查找變換,后者是把,后者是把整個像素當(dāng)作查找的索引進行查找變換。整個像素當(dāng)作查找的索引進行查找變換。 直接色與真彩色相比,相同之處是都采用直接色與真彩色相比,相同之處是都采用R,G,BR,G,B分量分量來決定基色強度,不同之處是前者的基色強度是有來決定基色強度,不同

10、之處是前者的基色強度是有R,G,BR,G,B經(jīng)變換得到的,后者是直接用經(jīng)變換得到的,后者是直接用R,G,BR,G,B決定。決定。 3 3、顯示深度、顯示深度 顯示深度:緩存中記錄屏幕上一個點的位數(shù),也即顯示深度:緩存中記錄屏幕上一個點的位數(shù),也即顯顯示器可以顯示的顏色數(shù)示器可以顯示的顏色數(shù)。顯示深度和圖像深度的關(guān)系:顯示深度和圖像深度的關(guān)系:(1 1)顯示深度大于圖像深度顯示深度大于圖像深度: 顯示的顏色完全取決于圖像的顏色定義。顯示的顏色完全取決于圖像的顏色定義。(2 2)顯示深度等于圖像深度顯示深度等于圖像深度: 可能較真實地反映圖像文件的顏色效果,也有可可能較真實地反映圖像文件的顏色效果

11、,也有可能會出現(xiàn)失真。能會出現(xiàn)失真。(3 3)顯示深度小于圖像深度顯示深度小于圖像深度: 顯示的顏色會出現(xiàn)失真。顯示的顏色會出現(xiàn)失真。4、圖像數(shù)據(jù)的容量、圖像數(shù)據(jù)的容量 圖像數(shù)據(jù)量圖像數(shù)據(jù)量 圖像的總像素圖像的總像素圖像深度圖像深度 / 8 (Byte) 一幅一幅640480、真彩色的圖像,、真彩色的圖像,文件大小約為:文件大小約為: 64048024/ 8 1 M (Bytes) 2.1.2 2.1.2 圖像數(shù)據(jù)冗余的基本概念圖像數(shù)據(jù)冗余的基本概念 圖像數(shù)據(jù)的數(shù)據(jù)量是相當(dāng)大的,但這些數(shù)據(jù)量并不完圖像數(shù)據(jù)的數(shù)據(jù)量是相當(dāng)大的,但這些數(shù)據(jù)量并不完全等于它們所攜帶的信息量。全等于它們所攜帶的信息量。

12、 數(shù)據(jù)量中有多余的數(shù)據(jù)稱為冗余。數(shù)據(jù)量中有多余的數(shù)據(jù)稱為冗余。 信息量與數(shù)據(jù)量的關(guān)系可表示為:信息量與數(shù)據(jù)量的關(guān)系可表示為:eRDII 表示信息量表示信息量 D 表示數(shù)據(jù)量表示數(shù)據(jù)量 Re 表示冗余量表示冗余量圖像冗余的類型有以下幾種:圖像冗余的類型有以下幾種:(1 1)空間冗余:像素采樣沒有利用景物表面顏色的空間)空間冗余:像素采樣沒有利用景物表面顏色的空間連貫性,從而產(chǎn)生的冗余,是靜態(tài)圖像存在的最主要的連貫性,從而產(chǎn)生的冗余,是靜態(tài)圖像存在的最主要的一種數(shù)據(jù)冗余。一種數(shù)據(jù)冗余。(2 2)信息熵冗余:數(shù)據(jù)包含的信息量少于數(shù)據(jù)本身)信息熵冗余:數(shù)據(jù)包含的信息量少于數(shù)據(jù)本身。(3 3)結(jié)構(gòu)冗余:

13、圖像表面存在著非常強的紋理結(jié)構(gòu),圖)結(jié)構(gòu)冗余:圖像表面存在著非常強的紋理結(jié)構(gòu),圖像的像素值存在著明顯的分布模式。像的像素值存在著明顯的分布模式。(4 4)知識冗余:對圖像的理解與某些基礎(chǔ)知識有相當(dāng)大)知識冗余:對圖像的理解與某些基礎(chǔ)知識有相當(dāng)大的相關(guān)性的相關(guān)性 。(5 5)視覺冗余:)視覺冗余:1 1)人類視覺系統(tǒng)對)人類視覺系統(tǒng)對亮度的敏感度亮度的敏感度遠遠高于對遠遠高于對色彩度的敏色彩度的敏感度感度;2 2)隨著亮度的增加,視覺系統(tǒng)對量化誤差的敏感度降低。)隨著亮度的增加,視覺系統(tǒng)對量化誤差的敏感度降低。在高亮度區(qū),灰度值的量化可以更粗糙點。在高亮度區(qū),灰度值的量化可以更粗糙點。3 3)人

14、眼的視覺系統(tǒng))人眼的視覺系統(tǒng)把圖像的邊緣和非邊緣區(qū)域分開來處把圖像的邊緣和非邊緣區(qū)域分開來處理理。邊緣地區(qū)是灰度值劇烈變化的地方。邊緣地區(qū)是灰度值劇烈變化的地方。 2.2 多媒體數(shù)據(jù)壓縮的必要性多媒體數(shù)據(jù)壓縮的必要性 數(shù)字化了的視頻、音頻信號數(shù)據(jù)量非常大:數(shù)字化了的視頻、音頻信號數(shù)據(jù)量非常大:(1)一頁印在)一頁印在B5紙上的文件,若以中等分辨率的掃紙上的文件,若以中等分辨率的掃描儀進行采樣,其數(shù)據(jù)量約描儀進行采樣,其數(shù)據(jù)量約6.61MB/頁。頁。(2)雙通道立體聲激光唱盤)雙通道立體聲激光唱盤(CD-A),采樣頻率為,采樣頻率為44.1kHz,采樣精度采樣精度16位位/樣本。一秒鐘時間內(nèi)的采

15、樣樣本。一秒鐘時間內(nèi)的采樣位數(shù)為位數(shù)為0.172Mbit/s。(3)數(shù)字音頻磁帶()數(shù)字音頻磁帶(DAT),采樣頻率采樣頻率48kHz,采采樣精度樣精度16位位/樣本,一秒鐘時間內(nèi)的采樣位數(shù)樣本,一秒鐘時間內(nèi)的采樣位數(shù)為為768Kbit/s。(4)數(shù)字電視圖像:)數(shù)字電視圖像:SIF (source input format)格式,格式,NTSC制、彩制、彩色、色、4:4:4采樣。采樣。 每幀數(shù)據(jù)量為每幀數(shù)據(jù)量為352*240*3=253KB; 每秒數(shù)據(jù)量(比特率):每秒數(shù)據(jù)量(比特率):253*30=7.59MB/s; 一片一片CD-ROM可存幀數(shù):可存幀數(shù):650/0.253=2.569K

16、幀幀/片片; 一片一片CD-ROM可存節(jié)目時間可存節(jié)目時間:(650/7.59)/60=1.42分分/片片;(4)數(shù)字電視圖像:)數(shù)字電視圖像:ICCR (International Consultative Committee for Radio)格式,格式,PAL制、制、 4:4:4采樣。采樣。 每幀數(shù)據(jù)量:每幀數(shù)據(jù)量:720*576*3=1.24MB; 每秒數(shù)據(jù)量:每秒數(shù)據(jù)量:1.24*25=31.3MB/s; 一片一片CD-ROM可存幀數(shù):可存幀數(shù):650/1.24=0.524K幀幀/片;片; 一片一片CD-ROM可存節(jié)目時間:可存節(jié)目時間:650/31.1=20.9秒秒/片;片;(5

17、)陸地衛(wèi)星的水平、垂直分辨率分別為)陸地衛(wèi)星的水平、垂直分辨率分別為2340和和3240,四波段,采樣精度為,四波段,采樣精度為7位,這樣一幅位,這樣一幅圖像的數(shù)據(jù)量為圖像的數(shù)據(jù)量為2340*3240*7*4=212Mbit,若,若每天每天30幅,則每天的數(shù)據(jù)量為幅,則每天的數(shù)據(jù)量為212*30=6.36Gbit,每年數(shù)據(jù)量為,每年數(shù)據(jù)量為2300Gbit。2.3 2.3 數(shù)據(jù)壓縮的技術(shù)基礎(chǔ)數(shù)據(jù)壓縮的技術(shù)基礎(chǔ) 數(shù)據(jù)壓縮起源于數(shù)據(jù)壓縮起源于2020世紀(jì)世紀(jì)4040年代由年代由Claude ShannonClaude Shannon首創(chuàng)首創(chuàng)的信息論。的信息論。 數(shù)據(jù)壓縮的基本理論:數(shù)據(jù)壓縮的基本理

18、論:研究信息究竟能被壓縮到多小研究信息究竟能被壓縮到多小。 借用了熱力學(xué)中的名詞借用了熱力學(xué)中的名詞“熵熵”來表示一條信息中真正來表示一條信息中真正需要編碼的信息量。需要編碼的信息量。 1、信息量、信息量(1) 某個事件的信息量可表示如下,其中某個事件的信息量可表示如下,其中 pi是第是第i個個事件的概率,其中事件的概率,其中0 pi=1,2、熵的概念、熵的概念(1)熵是信息量的度量方法,含義是)熵是信息量的度量方法,含義是信源信源S發(fā)出任意發(fā)出任意一個隨機變量的平均信息量。一個隨機變量的平均信息量。(2)根據(jù)香農(nóng)理論,信源)根據(jù)香農(nóng)理論,信源S的熵定義為:的熵定義為: 3、平均碼長:、平均碼

19、長: 熵值可以理解為最佳平均碼長。熵值可以理解為最佳平均碼長。 4、熵的作用:衡量編碼是否為最佳編碼。、熵的作用:衡量編碼是否為最佳編碼。 對于任何一種無損數(shù)據(jù)壓縮,對于任何一種無損數(shù)據(jù)壓縮,最終的數(shù)據(jù)量一定大于信息熵,最終的數(shù)據(jù)量一定大于信息熵,數(shù)據(jù)量越接近于熵值,說明其壓縮效果越好。數(shù)據(jù)量越接近于熵值,說明其壓縮效果越好。 5、例子、例子 40個像素組成的個像素組成的5級灰度圖像(級灰度圖像(15個個A、7個個B、7個個C、6個個D、5個個E),用),用3位來表示每個像素點,位來表示每個像素點,共需要共需要120位,經(jīng)計算這幅圖像的熵是位,經(jīng)計算這幅圖像的熵是2.196,40個個像素需用像

20、素需用87.84位。位。通常的數(shù)據(jù)壓縮過程:通常的數(shù)據(jù)壓縮過程:輸入數(shù)據(jù)輸入數(shù)據(jù)編碼器編碼器(壓縮)(壓縮)存儲或網(wǎng)存儲或網(wǎng)絡(luò)傳輸絡(luò)傳輸解碼解碼(解壓縮)(解壓縮)輸出數(shù)據(jù)輸出數(shù)據(jù)2.4常用的無損壓縮方法常用的無損壓縮方法多媒體數(shù)據(jù)壓縮編碼方法可分為兩大類:多媒體數(shù)據(jù)壓縮編碼方法可分為兩大類:(1)無損壓縮法;)無損壓縮法;(2)有損壓縮法。)有損壓縮法。香農(nóng)香農(nóng)- -范諾編碼范諾編碼(1 1)采用從上到下構(gòu)造一棵二叉樹的方法進行編碼。)采用從上到下構(gòu)造一棵二叉樹的方法進行編碼。(2 2)方法:)方法: 將給定符號按照其頻率從大到小排序;將給定符號按照其頻率從大到小排序; 將序列分成上下兩部分,使得上部頻率總和盡可將序列分成上下兩部分,使得上部頻率總和盡可能接近下部頻率總和;能接近下部頻率總和; 把第二步中劃分出的上部作為二叉樹的左子樹,把第二步中劃分出的上部作為二叉樹的左子樹,記記0 0;下部作為二叉樹的右子樹,記;下部作為二叉樹的右子樹,記1 1; 分別對左右子樹重復(fù)分別對左右子樹重復(fù)2 2、3 3兩步,直到所有的符號兩步,直到所有的符號都稱為二叉樹的樹葉為止。都稱為二叉樹的樹葉為止。 2.4.1哈夫曼編碼哈夫曼編碼(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論