多媒體技術課件 ch5_第1頁
多媒體技術課件 ch5_第2頁
多媒體技術課件 ch5_第3頁
多媒體技術課件 ch5_第4頁
多媒體技術課件 ch5_第5頁
已閱讀5頁,還剩48頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、多媒體技術基礎第四章:彩色數(shù)字圖像基礎多媒體技術基礎,2006年中山大學信息科學與技術學院主要內容視覺系統(tǒng)對顏色的感知圖像的顏色模型圖像的基本屬性圖像的分類伽馬()校正常用圖像文件格式多媒體技術,2006年中山大學信息科學與技術學院視覺系統(tǒng)對顏色的感知可見光的波長范圍為380nm780nm,大多數(shù)自然光都是由不同波長的光組合而成。眼睛本質上是一個照相機。人的視網膜(human retina)通過神經元來感知外部世界的顏色,每個神經元或者是一個對顏色敏感的錐體(cone),或者是一個對顏色不敏感的桿狀體(rod)。人的視網膜有對紅、綠、藍顏色敏感程度不同的三種錐體細胞,另外還有一種在光功率極端低

2、的條件下才起作用的桿狀體細胞,因此顏色只存在于眼睛和大腦中。顏色是視覺系統(tǒng)對可見光的感知結果。紅、綠和藍三種錐體細胞對不同頻率的光的感知程度不同,對不同亮度的感知程度也不同,因此不同組成成分的可見光就呈現(xiàn)出不同的顏色多媒體技術,2006年中山大學信息科學與技術學院視覺系統(tǒng)對顏色的感知視覺系統(tǒng)對顏色和亮度的響應特性曲線(各個波長的光的強度相等)多媒體技術,2006年中山大學信息科學與技術學院視覺系統(tǒng)對顏色的感知上面的顏色響應曲線表明,人類眼睛對藍光的靈敏度遠遠低于對紅光和綠光的靈敏度。亮度響應曲線表明人眼對波長為550nm左右的黃綠色最為敏感。多媒體技術,2006年中山大學信息科學與技術學院視覺

3、系統(tǒng)對顏色的感知許多具有不同光譜分布的光產生的視覺效果(顏色)是一樣的。即光譜與顏色的對應是多對一的。光譜分布不同而看上去相同的兩種顏色稱為條件等色(匹配等色)。絕大部分可見光譜對眼睛的刺激效果都可以用紅(700nm)、綠(546.1)、藍(435.8nm)三色光按不同比例和強度的混合來等效表示。(三刺激理論)多媒體技術,2006年中山大學信息科學與技術學院視覺系統(tǒng)對顏色的感知匹配任意可見光所需的三原色光比例曲線多媒體技術,2006年中山大學信息科學與技術學院視覺系統(tǒng)對顏色的感知多媒體技術,2006年中山大學信息科學與技術學院視覺系統(tǒng)對顏色的感知從人的主觀感覺角度,顏色包含三個要素:1、色調(

4、hue):色調反映顏色的類別,如紅色、綠色、藍色等。色調大致對應光譜分布中的主波長。多媒體技術,2006年中山大學信息科學與技術學院視覺系統(tǒng)對顏色的感知2、飽和度(Saturation) 飽和度是指彩色光所呈現(xiàn)顏色的深淺或純潔程度。對于同一色調的彩色光,其飽和度越高,顏色就越深,或越純;而飽和度越小,顏色就越淺,或純度越低。高飽和度的彩色光可因摻入白光而降低純度或變淺,變成低飽和度的色光。100%飽和度的色光就代表完全沒有混入白光的純色光。多媒體技術,2006年中山大學信息科學與技術學院視覺系統(tǒng)對顏色的感知3、明亮度(luminance) 明亮度是光作用于人眼時引起的明亮程度的感覺。一般來說,

5、彩色光能量大則顯得亮,反之則暗。 大量試驗表明,人的眼睛能分辨128種不同的色調,1030種不同的飽和度,而對亮度非常敏感。人眼大約可以分辨35萬種顏色。多媒體技術,2006年中山大學信息科學與技術學院顏色模型顏色模型(color model)是用來精確標定和生成各種顏色的一套規(guī)則和定義。某種顏色模型所標定的所有顏色就構成了一個顏色空間。顏色空間通常用三維模型表示,空間中的顏色通常使用代表三個參數(shù)的三維坐標來指定對于人來說,可以通過色調、飽和度和亮度來定義顏色(HSL顏色模型);對于顯示設備來說,可以用紅、綠、藍磷光體的發(fā)光量來描述顏色(RGB顏色模型);對于打印設備來說,可以使用青色、品紅、

6、黃色和黑色顏料的用量來指定顏色(CMYK顏色模型)。多媒體技術,2006年中山大學信息科學與技術學院 理論上絕大部分可見光譜都可用紅、綠和藍 (RGB) 三色光按不同比例和強度的混合來表示。顏色CR(紅色的百分比)G(綠色的百分比) B(藍色的百分比) RGB模型稱為相加混色模型,用于光照、視頻和顯示器。例如,顯示器通過紅、綠和藍熒光粉發(fā)射光線產生彩色。RGB顏色模型多媒體技術,2006年中山大學信息科學與技術學院CMYK顏色模型在理論上,絕大多數(shù)顏色都可以用三種基本顏料(青色cyan、品紅magenta、和黃色yellow)按一定比例混合得到。理論上,青色、品紅和黃色三種基本色素等量混合能得

7、到黑色。但實際上,因為所有打印油墨都會包含一些雜質,這三種油墨混合實際上產生一種土灰色,必須與黑色 (K) 油墨混合才能產生真正的黑色,所以再加入黑色作為基本色形成CMYK顏色模型。CMYK模型稱為相減混色模型。多媒體技術,2006年中山大學信息科學與技術學院相加色與相減色的關系多媒體技術,2006年中山大學信息科學與技術學院RGB模型到CMYK模型的轉換分色算法(F代表白色)多媒體技術,2006年中山大學信息科學與技術學院顏色模型的空間表示RGB彩色空間和CMY彩色空間的表示法多媒體技術,2006年中山大學信息科學與技術學院HSL顏色模型在HSL模型中,H定義色調;S定義顏色的深淺程度或飽和

8、度;L定義亮度。RGB模型和CMYK模型主要是面向設備的,而HSL模型更容易被人理解和控制。多媒體技術,2006年中山大學信息科學與技術學院顏色的輸入多媒體技術,2006年中山大學信息科學與技術學院圖像的分類矢量圖與點位圖 矢量圖是用一系列計算機指令來表示一幅圖,如畫點、畫線、畫曲線、畫圓、畫矩形等。這種方法實際上是用數(shù)學方法來描述一幅圖。 矢量圖的優(yōu)點是:(1)縮放、旋轉、移動時圖像不會失真。(2)存儲和傳輸時數(shù)據(jù)量較小。 矢量圖的缺點是:(1)圖像顯示時花費時間比較長。(2)真實世界的彩色圖像難以轉化為矢量圖。多媒體技術,2006年中山大學信息科學與技術學院圖像的分類矢量圖與點位圖 點位圖

9、是將一副圖像在空間上離散化,即將圖像分成許許多多的像素,每個象素用若干個二進制位來指定該像素的顏色或灰度值。 點位圖的優(yōu)點是:(1)顯示速度快。(2)真實世界的圖像可以通過掃描儀、數(shù)碼相機、攝像機等設備方便的轉化為點位圖。 點位圖的缺點是: (1)存儲和傳輸時數(shù)據(jù)量比較大。(2)縮放、旋轉時算法復雜且容易失真。多媒體技術,2006年中山大學信息科學與技術學院圖像的分類矢量圖點位圖多媒體技術,2006年中山大學信息科學與技術學院圖像的分類灰度圖標準單色圖 標準灰度圖多媒體技術,2006年中山大學信息科學與技術學院圖像的分類彩色圖256色標準圖像 24位標準圖像多媒體技術,2006年中山大學信息科

10、學與技術學院圖像的基本屬性1、分辨率 顯示分辨率:指顯示屏上能夠顯示出的象素數(shù)目。同樣大小顯示屏能夠顯示的象素越多,說明顯示設備的分辨率越高,顯示的圖像質量也就越高。(640480,1024 768) 圖像分辨率:指組成一副圖像的像素的密度,一般用單位長度上包含像素的個數(shù)來衡量。常用單位為DPI(dots per inch),即每英寸多少點。多媒體技術,2006年中山大學信息科學與技術學院圖像的基本屬性2、像素深度 像素深度是指存儲每個像素所用的位數(shù)。像素深度決定彩色圖像每個像素可能有的顏色數(shù),或者確定灰度圖像每個像素可能有的灰度級數(shù)。3、調色板 一個彩色圖像假如只包含24位真彩色空間中的16

11、個離散的點(16色圖),則可以建立一個顏色查找表,表中的每一行記錄一組RGB值,實際像素的值用來指定該點顏色在查找表中的索引值,這樣就可以大大縮小存儲量。這個顏色查找表就叫做調色板。多媒體技術,2006年中山大學信息科學與技術學院圖像的基本屬性4、真彩色、偽彩色與直接色 真彩色:真彩色是指在組成一幅彩色圖像的每個像素值中,有R,G,B三個基色分量,每個基色分量直接決定顯示設備的基色強度,這樣產生的彩色稱為真彩色。 偽彩色:每個像素的顏色不是由每個基色分量的數(shù)值直接決定,而是把像素值當作彩色查找表(調色板)的表項入口地址,去查找一個顯示圖像時使用的R,G,B強度值,用查找出的R,G,B強度值產生

12、的彩色稱為偽彩色。 直接色:每個像素值分成R,G,B分量,每個分量作為單獨的索引值對它做變換。也就是通過相應的彩色變換表找出基色強度,用變換后得到的R,G,B強度值產生的彩色稱為直接色。多媒體技術,2006年中山大學信息科學與技術學院伽馬()校正一個圖像系統(tǒng)中一般包含輸入設備(掃描儀、攝像機、數(shù)碼相機)、存儲設備(膠片、磁盤)和輸出設備三大模塊。各種涉及到光電轉換的設備的輸入輸出特性曲線一般是非線性的,且表現(xiàn)為冪函數(shù)的形式: yxn 輸出(輸入) (按照慣例,“輸入”和“輸出”都縮放到01之間)。所以整個圖像系統(tǒng)的傳遞函數(shù)是一個冪函數(shù)。 12n一個圖像系統(tǒng)追求的目標:真實的再現(xiàn)原始場景。多媒體

13、技術,2006年中山大學信息科學與技術學院伽馬()校正為了真實地再現(xiàn)原始場景,如果圖像再現(xiàn)環(huán)境為明亮環(huán)境則必須時整個圖像系統(tǒng)的1;如果為暗淡環(huán)境,則必須使整個系統(tǒng)的1.25;如果為黑暗環(huán)境,則必須使系統(tǒng)的1.5。實際圖像系統(tǒng)的值并非符合我們要求的值,且是不能隨意改變的。所有要求我們加入一個中間環(huán)節(jié)來校正整個系統(tǒng)的值,即補償系統(tǒng)的非特性曲線,使之接近于應用環(huán)境所要求的值。這個過程就叫做伽馬()校正。多媒體技術,2006年中山大學信息科學與技術學院伽馬()校正Photoshop 中提供的Gamma校正功能多媒體技術,2006年中山大學信息科學與技術學院 位圖文件(Bitmap-File,BMP)格

14、式是Windows采用的圖像文件存儲格式,在Windows環(huán)境下運行的所有圖像處理軟件都支持這種格式。BMP位圖文件默認的文件擴展名是bmp或者dib。BMP圖像文件格式 BMP文件大體上分為四個部分:位圖文件頭BITMAPFILEHEADER位圖信息頭BITMAPINFOHEADER調色板Palette實際的位圖數(shù)據(jù)ImageData多媒體技術,2006年中山大學信息科學與技術學院BMP圖像文件格式typedef struct tagBITMAPFILEHEADER WORD bfType; /* 說明文件的類型 */ DWORD bfSize; /* 說明文件的大小,用字節(jié)為單位 */ W

15、ORD bfReserved1; /* 保留,設置為0 */ WORD bfReserved2; /* 保留,設置為0 */ DWORD bfOffBits; /* 說明從BITMAPFILEHEADER結構 開始到實際的圖像數(shù)據(jù)之間的字 節(jié) 偏移量 */ BITMAPFILEHEADER;多媒體技術,2006年中山大學信息科學與技術學院BMP圖像文件格式typedef struct tagBITMAPINFOHEADER DWORD biSize; /* 說明結構體所需字節(jié)數(shù) */ LONG biWidth; /* 以像素為單位說明圖像的寬度 */ LONG biHeight; /* 以像素

16、為單位說明圖像的高速 */ WORD biPlanes; /* 說明位面數(shù),必須為1 */ WORD biBitCount; /* 說明位數(shù)/像素,1、2、4、8、24 */ DWORD biCompression; /* 說明圖像是否壓縮及壓縮類型 */ DWORD biSizeImage; /* 以字節(jié)為單位說明圖像大小 */ LONG biXPelsPerMeter; /* 說明水平分辨率,像素/米 */ LONG biYPelsPerMeter; /* 說明垂直分辨率,像素/米 */ DWORD biClrUsed; /* 說明圖像實際用到的顏色數(shù),如果為0 則顏色數(shù)為2的biBitC

17、ount次方 */ DWORD biClrImportant; /*說明對圖像顯示有重要影響的顏色 索引的數(shù)目,如果是0,表示都重要。*/ BITMAPINFOHEADER;多媒體技術,2006年中山大學信息科學與技術學院BMP圖像文件格式 調色板實際上是一個數(shù)組,它所包含的元素與位圖所具有的顏色數(shù)相同,決定于biClrUsed和biBitCount字段。數(shù)組中每個元素的類型是一個RGBQUAD結構。typedef struct tagRGBQUAD BYTE rgbBlue; /*指定藍色分量*/ BYTE rgbGreen; /*指定綠色分量*/ BYTE rgbRed; /*指定紅色分量

18、*/ BYTE rgbReserved; /*保留,指定為0*/ RGBQUAD;多媒體技術,2006年中山大學信息科學與技術學院BMP圖像文件格式 緊跟在彩色表之后的是圖像數(shù)據(jù)字節(jié)陣列。圖像的每一掃描行由表示圖像像素的連續(xù)的字節(jié)組成,每一行的字節(jié)數(shù)取決于圖像的顏色數(shù)目和用像素表示的圖像寬度。掃描行是由底向上存儲的,這就是說,陣列中的第一個字節(jié)表示位圖左下角的像素,而最后一個字節(jié)表示位圖右上角的像素。 多媒體技術,2006年中山大學信息科學與技術學院 GIF(Graphics Interchange Format)格式由CompuServe公司于87年開發(fā),版本號GIF87a,89年擴充后版本

19、號為GIF89a。 GIF圖像文件以塊(block)為單位存儲信息。一個GIF文件由表示圖形/圖像的數(shù)據(jù)塊、數(shù)據(jù)子塊以及顯示圖形/圖像的控制信息塊組成,稱為GIF數(shù)據(jù)流(Data Stream)。數(shù)據(jù)流中的所有控制信息塊和數(shù)據(jù)塊都必須在文件頭(Header)和文件結束塊(Trailer)之間。GIF圖像文件格式多媒體技術,2006年中山大學信息科學與技術學院GIF圖像文件格式1HeaderGIF文件頭2Logical Screen Descriptor邏輯屏幕描述塊3Gloabal Color Table全局顏色表。擴展模塊(任選)4Image Descriptor圖像描述塊5Local Co

20、lor Table局部顏色表可6Table Based Image Data表基壓縮圖像數(shù)據(jù)重7Graphic Control Extension圖像控制擴展塊復8Plain Text Extension無格式文本擴展塊n9Comment Extension注釋擴展塊次10Application Extension應用程序擴展塊。擴展模塊(任選)11GIF TrailerGIF文件結束快多媒體技術,2006年中山大學信息科學與技術學院GIF圖像文件格式GIF文件采用了LZW無損壓縮算法來存儲圖像數(shù)據(jù)。GIF文件允許設置背景的透明屬性。GIF文件格式可在一個文件中存放多幅彩色圖像并且制作出幻燈片

21、或者動畫效果。GIF文件支持圖像數(shù)據(jù)的交叉存儲方式,這樣一個大的圖像可以逐步顯示,讓用戶首先看到圖像概貌,然后逐步清晰。GIF文件定義的圖像中可以加入文本。GIF文件格式的特點:多媒體技術,2006年中山大學信息科學與技術學院算法概要 JPEG(Joint Photographic Experts Group) 是一個由 ISO和CCITT兩個組織機構聯(lián)合組成的一個圖像專家小組,負責制定靜態(tài)的數(shù)字圖像數(shù)據(jù)壓縮編碼標準,這個專家組開發(fā)的算法稱為JPEG算法,并且成為國際上通用的標準。JPEG是一個適用范圍很廣的靜態(tài)圖像數(shù)據(jù)壓縮標準,既可用于灰度圖像又可用于彩色圖像。JPEG不僅適于靜止圖像的壓縮

22、,電視圖像的幀內圖像的壓縮編碼,也常采用此算法。JPEG標準還可以大范圍地調節(jié)圖像壓縮率及其保真度。 標準主要采用了兩種基本的壓縮算法,一種是采用以離散余弦變換(DCT)為基礎的有損壓縮算法,另一種是采用以預測技術為基礎的DPCM無損壓縮算法。JPEG編碼標準多媒體技術,2006年中山大學信息科學與技術學院JPEG編碼標準基于DPCM的無損編碼模式:壓縮比可以達到2:1?;贒CT的有損順序編碼模式:壓縮比可以達到10:1以上?;贒CT的遞增編碼模式基于DCT的分層編碼模式JPEG規(guī)定了4種運行模式,以滿足不同需要:多媒體技術,2006年中山大學信息科學與技術學院JPEG有損順序編碼算法的主

23、要計算步驟如下:1. 將源圖像分成幾個顏色平面(分量圖像)。2. 分成88數(shù)據(jù)塊進行正向離散余弦變換(FDCT)。 2. 量化(quantization)。 3. Z字形排列量化結果(zigzag scan)。 4. 使用差分脈沖編碼調制(differential pulse code modulation,DPCM)對直流系數(shù)(DC)進行編碼。 5. 使用行程長度編碼(run-length encoding,RLE)對 交流系數(shù)(AC)進行編碼。 6. 熵編碼(entropy coding)。JPEG編碼標準多媒體技術,2006年中山大學信息科學與技術學院JPEG編碼標準多媒體技術,2006

24、年中山大學信息科學與技術學院譯碼或者叫做解壓縮的過程與壓縮編碼過程正好相反。IDCTJPEG編碼標準多媒體技術,2006年中山大學信息科學與技術學院正向離散余弦變換 對每個單獨的彩色圖像分量,把整個分量圖像分成88的圖像塊,如圖所示,并作為兩維離散余弦變換DCT的輸入。通過DCT變換,把能量集中在少數(shù)幾個系數(shù)上。DCT變換使用下式計算逆變換使用下式計算JPEG編碼標準多媒體技術,2006年中山大學信息科學與技術學院量化 對于有損壓縮算法,JPEG算法使用如圖所示的均勻量化器進行量化,量化步距是按照系數(shù)所在的位置和每種顏色分量的色調值來確定。 JPEG編碼標準多媒體技術,2006年中山大學信息科

25、學與技術學院量化 因為人眼對亮度信號比對色差信號更敏感,因此使用了兩種量化表:亮度量化值和色差量化值。此外,由于人眼對低頻分量的圖像比對高頻分量的圖像更敏感,因此圖中的左上角的量化步距要比右下角的量化步距小。JPEG編碼標準多媒體技術,2006年中山大學信息科學與技術學院DC系數(shù)DPCM編碼和AC系數(shù)Z形排列之后采用RLE編碼JPEG編碼標準多媒體技術,2006年中山大學信息科學與技術學院熵編碼 使用熵編碼還可以對DPCM編碼后的直流DC系數(shù)和RLE編碼后的交流AC系數(shù)作進一步的壓縮。 JPEG標準規(guī)定了兩種熵編碼算法:哈夫曼編碼和自適應算術編碼。哈夫曼編碼采用的一般是固定的哈夫曼編碼表,而不是臨時統(tǒng)計出來的,并且對亮度分量和色度分量采用了不同的哈夫曼表。JPEG編碼標準多媒體技術,2006年中山大學信息科學與技術學院基于DPCM的無損編碼模式:主要采用了三鄰域二維預測編碼和熵編碼。無失真編碼器源圖像數(shù)據(jù)壓縮的圖像數(shù)據(jù)預測器熵編碼器表說明DPCM預測編碼框圖JPEG編碼標準多媒體技術,2006年中山大學信息科學與技術學院JPEG編碼標準基于DCT的遞增編碼模式: 此模式與順序模式編碼

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論