




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、1.1 多媒體的基本概念1.2 音頻信息處理基礎(chǔ)1.3 圖像信息處理基礎(chǔ)1.4 視頻信號(hào)的數(shù)字化1.5 MATALAB在圖像處理中的應(yīng)用第1章 多媒體信息處理基礎(chǔ)熟悉多媒體及多媒體技術(shù)的基本概念及特征。了解聲音的基本特性及主觀感覺。熟悉音頻、圖像、視頻信號(hào)數(shù)字化的過程,掌握均勻量化的原理。掌握彩色三要素、三基色原理及混色方法等色度學(xué)基本知識(shí)。理解RGB、YUV、YIQ、YCbCr、HSI/HSV等顏色空間的表示及轉(zhuǎn)換。熟悉ITU-R BT.601建議的主要內(nèi)容。了解MATLAB在圖像處理和分析領(lǐng)域的應(yīng)用。本章學(xué)習(xí)目標(biāo)1.1.1 媒體的概念1.1.2 多媒體與多媒體技術(shù)1.1 多媒體的基本概念1
2、.媒體(medium)按傳統(tǒng)的說法,媒體指的是信息的載體,如:報(bào)紙、雜志、電視、廣播、因特網(wǎng)在計(jì)算機(jī)領(lǐng)域有兩種含義:信息的存儲(chǔ)實(shí)體,如磁盤、光盤、磁帶、半導(dǎo)體存儲(chǔ)器等,中文常譯為媒質(zhì)或媒介;傳遞信息的基本元素,如文字、聲音、圖形、動(dòng)畫和圖像等。1.1.1 媒體的概念2. 媒體的分類國際電話電報(bào)咨詢委員會(huì)( CCITT )把媒體分成如下5類。(1)感知媒體(Perception Medium)感知媒體就是指能直接作用于人的感覺器官,使人直接產(chǎn)生感覺(視、聽、嗅、味、觸覺)的一類媒體,如語言、音樂、圖形、動(dòng)畫、數(shù)據(jù)、文字、文件等都是感知媒體。(2)表示媒體(Representation Mediu
3、m)表示媒體是為了更有效地加工、處理和傳輸感知媒體而人為研究和構(gòu)造出來的一種媒體。它包括上述感知媒體的各種編碼,諸如語言編碼、靜止和活動(dòng)圖像編碼,以及文本編碼等。(3)呈現(xiàn)媒體(Presentation Medium)呈現(xiàn)媒體是感知媒體與用于通信的電信號(hào)之間在轉(zhuǎn)換中用于信息輸入和輸出的媒體??煞譃檩斎氤尸F(xiàn)媒體(如鍵盤、攝像機(jī)、話筒、掃描儀等)和輸出呈現(xiàn)媒體(如顯示器、揚(yáng)聲器、打印機(jī)等)兩種。(4)存儲(chǔ)媒體(Storage Medium)存儲(chǔ)媒體用于存儲(chǔ)表示媒體,即存放感知媒體數(shù)字化后的代碼的媒體稱為存儲(chǔ)媒體,如磁盤、光盤、磁帶、半導(dǎo)體存儲(chǔ)器等。(5)傳輸媒體(Transmission Medi
4、um)傳輸媒體是指用來將表示媒體從一處傳遞到另一處的物理傳輸介質(zhì),如同軸電纜、雙絞線、光纖及其他通信信道。 在多媒體技術(shù)中所說的媒體一般指感知媒體。常見的感知媒體包括: (1)視覺媒體:圖像、圖形、符號(hào)、視頻、動(dòng)畫等。(2)聽覺媒體:聲音、語音、音樂和音響。 (3)觸覺媒體:通過直接或間接與人體接觸,使人能感覺到對象的位置、大小、方向、方位、質(zhì)地等性質(zhì)。 圖像 圖像(Image):是指由輸入設(shè)備捕捉的實(shí)際場景畫面,或以數(shù)字化形式存儲(chǔ)的任意畫面。靜止的圖像可用一個(gè)矩陣來表示,矩陣列中的各個(gè)元素用來描述構(gòu)成圖像的各個(gè)點(diǎn)(稱為像素 pixel )的強(qiáng)度與顏色等信息。這種圖像也稱為位圖( Bitmap
5、)。圖像由像素組成位圖(bitmap,bit-mapped image )對位圖進(jìn)行操作時(shí),只能對圖中的像素進(jìn)行操作,而不能把位圖中的物體作為獨(dú)立實(shí)體進(jìn)行操作。畫位圖或編輯位圖的軟件稱為畫圖程序;存放位圖的格式稱為位圖格式;存儲(chǔ)的內(nèi)容是描述像素的數(shù)值。位圖的獲取通常用掃描儀、數(shù)碼相機(jī)和相關(guān)的數(shù)字化設(shè)備。位圖文件占據(jù)的存儲(chǔ)空間比較大,影響位圖文件大小的因素圖像分辨率:分辨率越高,表示組成一幅圖的像素就越多,圖像文件就越大像素深度:像素深度越深,表達(dá)單個(gè)像素的顏色和亮度的位數(shù)越多,圖像文件就越大 灰度圖像(gray-scale image或intensity image):只有明暗不同的像素而沒有
6、彩色像素組成的圖像。按灰度級的數(shù)目來劃分:單色圖像(二值圖像):只有黑白兩種顏色的圖像。每個(gè)像素的像素值用1bit存儲(chǔ),其值是“0”或“1”灰度圖像:如果每個(gè)像素的像素值用一個(gè)字節(jié)表示,灰度值級數(shù)就等于256級,每個(gè)像素可以是0255之間的任何一個(gè)值。單色圖像灰度圖像彩色圖像(color image)每個(gè)像素包含顏色信息的圖像。可按照顏色的數(shù)目劃分:256色圖像:每個(gè)像素的R、G和B值用一個(gè)字節(jié)來表示,一幅640480的彩色圖像需要300 KB的存儲(chǔ)空間真彩色圖像:每個(gè)像素的R、G、B分量分別用一個(gè)字節(jié)表示,一幅640480的真彩色圖像需要900 KB的存儲(chǔ)空間256色圖像 24位真彩色圖像
7、視頻視頻(Video):是動(dòng)態(tài)的圖像序列,由一系列連續(xù)的畫面序列(幀)組成 ,這些畫面以一定的速率(幀頻)連續(xù)地投射在屏幕上,使觀察者具有圖像連續(xù)運(yùn)動(dòng)的感覺。一幀電視畫面xytF(u,v)k-1幀k+1幀k幀k-1幀圖形 圖形(Graphic):是一種抽象化的圖像,一般指用計(jì)算機(jī)繪制(draw)的幾何圖(包含彩色圖),如直線、圓、圓弧、矩形、任意曲線和圖表等。 在幾何學(xué)中,圖形一般使用矢量表示,因此也稱矢量圖(Vector Graphics)。矢量圖是用一組指令集合來描述圖形的內(nèi)容,這些指令用來描述構(gòu)成該圖形的所有直線、圓、圓弧、矩形、曲線等圖元的位置、維數(shù)和形狀等。 在計(jì)算機(jī)屏幕上顯示矢量圖
8、形要有專門的軟件,如AutoCAD、Corel Draw、Adobe Illustrator等,這些軟件將描述圖形的指令轉(zhuǎn)換成在屏幕上顯示的形狀和顏色,也可產(chǎn)生和操作矢量圖形的各成分,并對矢量圖形進(jìn)行移動(dòng)、縮放、旋轉(zhuǎn)和扭曲等變換。動(dòng)畫(Animation):是動(dòng)態(tài)圖像的一種,與視頻不同之處在于,動(dòng)畫中的圖像采用的是計(jì)算機(jī)產(chǎn)生出來或人工繪制的圖像或圖形,而視頻中的圖像則是真實(shí)的圖像。也就是說,動(dòng)畫是活動(dòng)的畫面,實(shí)質(zhì)是一幅幅靜態(tài)圖形的連續(xù)播放。動(dòng)畫 計(jì)算機(jī)設(shè)計(jì)動(dòng)畫有兩種: 幀動(dòng)畫:是由一幅幅位圖組成的連續(xù)的畫面,就如電影膠片或視頻畫面一樣要分別設(shè)計(jì)每屏幕顯示的畫面。造型動(dòng)畫:是對每一個(gè)運(yùn)動(dòng)的物體分
9、別進(jìn)行設(shè)計(jì),賦予每個(gè)動(dòng)元一些特征,然后用這些動(dòng)元構(gòu)成完整的幀畫面。動(dòng)元的表演和行為是由制作表組成的腳本來控制。幀動(dòng)畫 文本文本(Text):分為非格式化文本文件和格式化文本文件。非格式化文本文件:只有文本信息沒有其他任何有關(guān)格式信息的文件,又稱為純文本文件。如“.TXT ”文件。格式化文本文件:帶有各種文本排版信息等格式信息的文本文件。如“.DOC ”文件。音頻(Audio)可分為波形聲音、語音和音樂。 波形聲音包含了所有的聲音形式自然界中的各種聲音,包括人的說話聲、音樂、天空的驚雷等,可以用一種模擬的連續(xù)波形表示。 音頻語音:不僅是一種波形聲音,而且還具有內(nèi)在的語言、語音學(xué)內(nèi)涵,可以經(jīng)由特殊
10、的方法而提取。波形聲音也可以表現(xiàn)和記錄語音,但常把語音作為一種特殊的聽覺媒體。音頻音樂:符號(hào)化了的聲音。這種符號(hào)就是樂譜。音樂與語音相比,形式更為規(guī)范。在多媒體計(jì)算機(jī)中,MIDI就是一種樂譜數(shù)字化描述的規(guī)范。1多媒體關(guān)于多媒體(Multimedium)的定義或說法多種多樣,從不同的角度出發(fā)對多媒體給出了不同的描述,目前仍沒有統(tǒng)一的標(biāo)準(zhǔn)。通常所說的多媒體就是各種媒體的綜合,也就是聲音、圖像、動(dòng)畫、視頻、文本等各種媒體的綜合?!岸嗝襟w”常被當(dāng)作“多媒體技術(shù)”的同義詞。 2多媒體技術(shù)多媒體技術(shù)就是利用計(jì)算機(jī)技術(shù)把文本、圖像、圖形、動(dòng)畫、音頻及視頻等多種媒體有機(jī)地集成起來,使人們能以更加自然的方式使用
11、信息,并與計(jì)算機(jī)進(jìn)行交互,且使表現(xiàn)的信息圖、文、聲并茂。簡言之,多媒體技術(shù)就是計(jì)算機(jī)綜合處理聲、文、圖信息的技術(shù),具有集成性、實(shí)時(shí)性和交互性。1.1.2 多媒體與多媒體技術(shù)1.1 多媒體的基本概念1.2 音頻信息處理基礎(chǔ)1.3 圖像信息處理基礎(chǔ)1.4 視頻信號(hào)的數(shù)字化1.5 MATALAB在圖像處理中的應(yīng)用第1章 多媒體信息處理基礎(chǔ)1.2.1 聲音的基本特性1.2.2 聲音的主觀感覺1.2.3 音頻信號(hào)的數(shù)字化 1.2 音頻信息處理基礎(chǔ)聲音是機(jī)械振動(dòng)或氣流振動(dòng)引起周圍傳播媒質(zhì)(氣體、液體、固體等)發(fā)生波動(dòng)的現(xiàn)象,通常將產(chǎn)生聲音的發(fā)聲體稱為聲源。當(dāng)聲源產(chǎn)生振動(dòng)時(shí),引起鄰近空氣的振動(dòng)。這樣空氣就隨
12、著聲源體所振動(dòng)幅度的不同,而產(chǎn)生密或稀的振動(dòng),空氣的這種振動(dòng)被稱為聲波。聲波可以用一條連續(xù)的曲線來表示,它可以分解成一系列正弦波的線性疊加。1.2.1 聲音的基本特性1.頻率單位時(shí)間內(nèi)信號(hào)振動(dòng)的次數(shù),單位是赫茲(Hz)。聲音的音調(diào)由頻率決定。聲音尖細(xì)表示頻率高,聲音低粗表示頻率低。1.2.1 聲音的基本特性次聲波音頻信號(hào)超聲波20 000Hz聲音信號(hào)按頻率劃分:2.頻譜 聲音信號(hào)按頻率成分組成來分,可分為:純音:頻率單一、振幅隨時(shí)間按正弦函數(shù)規(guī)律變化的聲音復(fù)音:由不同頻率和不同振幅的聲波組合而成的聲音基音:復(fù)音中頻率最低的成分(分音)諧音:復(fù)音中頻率與基音成整數(shù)倍的分音 聲音的頻譜結(jié)構(gòu)是用基音
13、、諧音數(shù)目、各諧音振幅大小及相位關(guān)系來描述的。聲音的音色就是由其頻譜成分決定的。 1.2.1 聲音的基本特性聲壓由聲波引起的交變壓強(qiáng)稱為聲壓,一般用P表示,單位是帕(Pa)。聲壓的大小反映了聲音振動(dòng)的強(qiáng)弱,同時(shí)也決定了聲波的幅度大小。聲壓級 用聲壓的相對大?。ǚQ聲壓級或聲強(qiáng))來表示聲壓的強(qiáng)弱。聲壓級用符號(hào)SPL 表示,單位是分貝(dB): 式中,P為聲壓有效值;Pref為參考聲壓,一般取 Pa,這個(gè)數(shù)值是人耳所能聽到的1kHz聲音的最低聲壓,低于這一聲壓,人耳就無法覺察出聲波的存在了。3.聲壓及聲壓級 1.2.1 聲音的基本特性 人對聲音的感知有響度、音調(diào)和音色三個(gè)主觀聽感要素。響度:與聲波振
14、動(dòng)的幅度有關(guān)音調(diào):取決于聲波的基音頻率音色:由聲波的的頻譜成分決定1.2.2 聲音的主觀感覺1.響度:是人耳對聲音強(qiáng)弱的主觀感覺程度。在客觀的度量中,聲音的強(qiáng)弱是由聲波的振幅(聲壓)決定的。但響度與聲波的振幅并不完全一致。響度不僅取決于振幅的大小,還取決于頻率的高低。響度用符號(hào)N表示,單位是宋(sone)。國際上規(guī)定,頻率為1kHz的純音在聲壓級為40dB時(shí)的響度為1宋(sone)。另外,響度的大小與距聲源的距離有關(guān),同一聲音離聲源越近,響度越大。 1.2.2 聲音的主觀感覺2.響度級:人耳對聲音強(qiáng)弱的主觀感覺還可以用響度級來表示。響度級的單位為方(phon)。規(guī)定1kHz純音聲壓級的分貝數(shù)定
15、義為響度級的數(shù)值。響度sone1248163264128256聲壓級dB405060708090100110120響度級phon405060708090100110120表1-1 聲壓級與響度、響度級的關(guān)系1.2.2 聲音的主觀感覺3.等響度曲線1.2.2 聲音的主觀感覺4.聽閾與痛閾聽閾:當(dāng)聲音減弱到人耳剛剛可以聽見時(shí),此時(shí)的聲音強(qiáng)度稱為最小可聽閾值,簡稱為“聽閾”或“聞閾” 。一般以1kHz純音為準(zhǔn)進(jìn)行測量,人耳剛能聽到的聲壓級為0dB(通常大于0.3dB即有感受)。痛閾:當(dāng)聲音增強(qiáng)到使人耳感到疼痛時(shí),這個(gè)聽覺閾值稱為“痛閾”。仍以1kHz純音為準(zhǔn)來進(jìn)行測量,使人耳感到疼痛時(shí)的聲壓級約達(dá)到
16、130140dB左右。1.2.2 聲音的主觀感覺5.音調(diào)音調(diào)也稱音高,表示人耳對聲音調(diào)子高低的主觀感受。聲音越低沉,音調(diào)越低;聲音越尖細(xì),音調(diào)越高。音調(diào)的高低是由發(fā)聲體振動(dòng)的頻率決定的,頻率越高,音調(diào)越高;頻率越低,音調(diào)越低。物體的振動(dòng)頻率與發(fā)聲體的結(jié)構(gòu)有關(guān),一般而言,大而長的物體振動(dòng)頻率低,小而短的物體振動(dòng)頻率高;物體繃得越緊,振動(dòng)頻率越高;物體越薄、越細(xì),振動(dòng)頻率越高。音調(diào)單位是“美(Mel)”。頻率為1kHz、聲壓級為40 dB的純音所產(chǎn)生的音調(diào)就定義為1 Mel。音調(diào)大體上與頻率的對數(shù)成正比。1.2.2 聲音的主觀感覺5.音色音調(diào)也稱音高,表示人耳對聲音調(diào)子高低的主觀感受。聲音越低沉,
17、音調(diào)越低;聲音越尖細(xì),音調(diào)越高。音調(diào)的高低是由發(fā)聲體振動(dòng)的頻率決定的,頻率越高,音調(diào)越高;頻率越低,音調(diào)越低。物體的振動(dòng)頻率與發(fā)聲體的結(jié)構(gòu)有關(guān),一般而言,大而長的物體振動(dòng)頻率低,小而短的物體振動(dòng)頻率高;物體繃得越緊,振動(dòng)頻率越高;物體越薄、越細(xì),振動(dòng)頻率越高。音調(diào)單位是“美(Mel)”。頻率為1kHz、聲壓級為40 dB的純音所產(chǎn)生的音調(diào)就定義為1 Mel。音調(diào)大體上與頻率的對數(shù)成正比。1.2.2 聲音的主觀感覺1.2.3 音頻信號(hào)的數(shù)字化聲源聲波傳聲器模擬電信號(hào)數(shù)字聲音模/數(shù)轉(zhuǎn)換聲音信號(hào)是典型的連續(xù)信號(hào),不僅在時(shí)間上是連續(xù)的,而且在幅度上也是連續(xù)的。數(shù)字化實(shí)際上就是對模擬信號(hào)進(jìn)行采樣、量化和
18、編碼。模/數(shù)轉(zhuǎn)換11011100 11001101把聲音(模擬量)按照固定時(shí)間間隔,轉(zhuǎn)換成有限個(gè)數(shù)字表示的離散序列1.2.3 音頻信號(hào)的數(shù)字化采樣(Sampling):每隔一定的時(shí)間間隔,抽取信號(hào)的一個(gè)瞬時(shí)幅度值(樣本值),即在時(shí)間上將模擬信號(hào)進(jìn)行離散化。采樣后所得到的一系列在時(shí)間上離散的樣本值稱為樣值序列。奈奎斯特(Nyquist)采樣定理:只要采樣頻率大于或等于聲音信號(hào)最高頻率的兩倍( fs2fmax ),就可以通過理想低通濾波器,從樣值序列中無失真地恢復(fù)原始模擬信號(hào)。也就是說,在滿足奈奎斯特采樣定理的條件下,在時(shí)間上離散的樣值序列包含有采樣前模擬信號(hào)的全部信息。常用音頻采樣頻率:8kHz
19、、11.025kHz、22.05kHz、32kHz、44.1kHz、48kHz、96kHz1.2.3 音頻信號(hào)的數(shù)字化量化(Quantization):對每個(gè)樣值的連續(xù)幅度進(jìn)行離散化,即用有限個(gè)幅度值近似原來連續(xù)變化的幅度值,把模擬信號(hào)的連續(xù)幅度變?yōu)橛邢迶?shù)量、有一定間隔的離散值。均勻量化(線性量化):量化器的每個(gè)量化間隔都相等,量化電平取各量化區(qū)間的中間值。非均勻量化(非線性量化):量化器的各個(gè)量化間隔是不相等的。1.2.3 音頻信號(hào)的數(shù)字化編碼(Encoding):采樣、量化后的信號(hào)還不是數(shù)字信號(hào),需要把它轉(zhuǎn)換成數(shù)字編碼脈沖,這一過程稱為編碼。最簡單的編碼方式是二進(jìn)制編碼。具體說來,就是用n
20、比特二進(jìn)制碼來表示已經(jīng)量化了的樣值,每個(gè)二進(jìn)制數(shù)對應(yīng)一個(gè)量化電平,然后把它們排列,得到由二值脈沖組成的數(shù)字信息流。1.2.3 音頻信號(hào)的數(shù)字化模/數(shù)轉(zhuǎn)換11011100 11001101把聲音(模擬量)按照固定時(shí)間間隔,轉(zhuǎn)換成有限個(gè)數(shù)字表示的離散序列質(zhì)量等級采樣頻率/kHz量化精度/bit聲道數(shù)數(shù)碼率/ kbit/s頻帶/ Hz電話話音88單聲道642003400AM11.0258單聲道88.2507000FM22.0516雙聲道705.62015000CD44.116雙聲道1411.2 2020000DAT4816雙聲音質(zhì)量與數(shù)碼率的關(guān)系1.2.3 音頻信號(hào)的數(shù)字化
21、1.1 多媒體的基本概念1.2 音頻信息處理基礎(chǔ)1.3 圖像信息處理基礎(chǔ)1.4 視頻信號(hào)的數(shù)字化1.5 MATALAB在圖像處理中的應(yīng)用第1章 多媒體信息處理基礎(chǔ)1.3.1 光的顏色與彩色三要素1.3.2 三基色原理1.3.3 典型的顏色空間模型及轉(zhuǎn)換關(guān)系1.3.4 圖像信號(hào)的數(shù)字化 1.3 圖像信息處理基礎(chǔ) 光是一種電磁波。 電磁輻射的波長范圍很寬,按波長從長到短的順序排列,依次是無線電波、紅外線、可見光、紫外線、X射線和宇宙射線等。 圖1-3是按波長的順序排列的電磁波譜。 1.3.1 光的顏色與彩色三要素圖1-3 電磁波譜波長在380780nm范圍內(nèi)的電磁波能夠使人眼產(chǎn)生顏色感覺,稱為可見
22、光。可見光在整個(gè)電磁波譜中只占極小的一段。1.3.1 光的顏色與彩色三要素描述一種色彩需要用亮度、色調(diào)和色飽和度三個(gè)基本參量,這三個(gè)參量稱為彩色三要素。亮度反映光的明亮程度。彩色光輻射的功率越大,亮度越高,反之亮度越低。不發(fā)光物體的亮度取決于它反射光功率的大小。若照射物體的光強(qiáng)度不變,物體的反射性能越好,物體越明亮,反之越暗。對于一定的物體,照射光越強(qiáng), 物體越明亮,反之越暗。 1.3.1 光的顏色與彩色三要素 色調(diào)反映彩色的類別,例如紅、橙、黃、綠、青、藍(lán)、紫等不同顏色。發(fā)光物體的色調(diào)由光的波長決定,不同波長的光呈現(xiàn)不同的色調(diào);不發(fā)光物體的色調(diào)由照明光源和該物體的吸收、反射或透射特性共同決定
23、。 色飽和度反映彩色光的深淺程度。同一色調(diào)的彩色光,會(huì)給人以深淺不同的感覺,深紅、 粉紅是兩種不同飽和度的紅色,深紅色飽和度高,粉紅色飽和度低。 1.3.1 光的顏色與彩色三要素1.3.2 三基色原理根據(jù)人眼的視覺特性,在電視機(jī)中重現(xiàn)圖像時(shí)并不要求完全重現(xiàn)原景物反射或透射光的光譜成分,而應(yīng)獲得與原景物相同的彩色感覺。因此仿效人眼三種錐狀細(xì)胞,可以選擇三種基色,將它們按不同比例進(jìn)行組合,可得到自然界中絕大多數(shù)的彩色。這三種基色必須是相互獨(dú)立的,即任一種基色都不能由其他兩種基色混合得到。自然界中絕大多數(shù)的彩色可以分解為三基色,三基色按一定比例混合,可得到自然界中絕大多數(shù)彩色。混合色的色調(diào)和飽和度由
24、三基色的混合比例決定,混合色的亮度等于三種基色亮度之和。因?yàn)槿搜鄣娜N錐狀細(xì)胞對紅光、綠光和藍(lán)光最敏感,所以在紅色、綠色和藍(lán)色光譜區(qū)中選擇三個(gè)基色按適當(dāng)比例混色可得到較多的彩色。在彩色電視中,選用了紅、 綠、 藍(lán)作為三基色,分別用R、 G、 B來表示。波長為700 nm的紅光為紅基色R(紅)波長為546.1nm的綠光為綠基色G(綠)波長為435.8nm的藍(lán)光為藍(lán)基色B(藍(lán))1. RGB顏色空間模型在RGB模型中,顏色空間里所有的顏色都是由R、G、B (紅、綠、藍(lán))三種光依不同的比例相加而成。RGB的每一色光,含有亮度成分,例如R的成分越多,表示越紅越亮。各色光混合后,會(huì)比原來單獨(dú)的色光還亮,稱
25、為相加混色;適合在以主動(dòng)光源顯示影像的場合使用,如電視、電腦、投影等。綠(0,1,0)青(0,1,1)黃(1,1,0)黑(0,0,0)藍(lán)(0,0,1)品紅(1,0,1)白(1,1,1)紅(1,0,0)相加混色RGB顏色000黑001藍(lán)010綠011青100紅101品紅110黃111白2. CMY/CMYK顏色空間模型在彩色印刷、彩色膠片和繪畫中的混色采用相減混色。彩色印刷或彩色打印的紙張是不能發(fā)射光線的,因而印刷機(jī)或彩色打印機(jī)就只能使用一些能夠吸收特定的光波而反射其他光波的油墨或顏料。任何一種由顏料呈現(xiàn)的顏色都可以用青(Cyan)、品紅(Magenta)和黃(Yellow)這三種基色按不同的比
26、例混合而成,我們稱這種顏色空間為CMY顏色空間。由于彩色墨水和顏料的化學(xué)特性,用等量的CMY三基色得到的黑色不是真正的黑色,因此在印刷術(shù)中常加一種真正的黑色墨水(Black Ink),于是CMY顏色空間也稱為CMYK顏色空間。CYMRGB相減混色C(青色)M(品紅)Y(黃色)顏色000白001黃010品紅011紅100青101綠110藍(lán)111黑 RGB CMYRGB和CMY值都?xì)w一到0,1YUV是PAL(Phase Alternating Line,逐行倒相)制彩色電視系統(tǒng)所采用的一種顏色空間模型,其中Y表示亮度,U表示藍(lán)色色差(即B-Y ), V代表紅色色差(R-Y)。 采用YUV色彩空間的
27、重要性:亮度信號(hào)Y和色度信號(hào)U、V是分離的,解決彩色電視和黑白電視兼容的問題??梢岳萌搜蹖Σ噬拿舾卸鹊陀趯α炼鹊拿舾卸鹊囊曈X特性,用較窄的頻帶傳送U、V信號(hào),優(yōu)化彩色電視信號(hào)的傳輸。3. YUV顏色空間模型 RGB YUV YIQ顏色空間是由YUV推導(dǎo)而來,是NTSC 制彩色電視系統(tǒng)所采用的一種顏色空間模型; I代表“同相”,Q代表“正交”,它們指的是用于發(fā)射顏色信息的調(diào)制方法; I、Q是通過將U、V軸逆時(shí)針旋轉(zhuǎn)33度獲得的。優(yōu)點(diǎn):由人眼彩色視覺的特性表明,人眼分辨紅、黃之間顏色變化的能力最強(qiáng),而分辨藍(lán)、紫之間顏色變化的能力最弱。通過一定的變化,I對應(yīng)于人眼最敏感的色度,而Q對應(yīng)于人眼最不
28、敏感的色度。這樣,傳送Q可以用較窄的頻帶,而傳送分辨率較強(qiáng)的I信號(hào)時(shí),可以用較寬的頻帶。 4. YIQ顏色空間模型 RGB YIQ由YUV顏色空間派生的一種顏色空間模型。主要用于數(shù)字電視系統(tǒng),是YUV顏色空間的縮放和偏移版本。5. YCbCr顏色空間模型HSV(hue, saturation and value)的縮寫A. R. Smith根據(jù)顏色的直觀特性于1978年創(chuàng)建的, 也稱六角錐體模型(hexcone model)HSV的表示方法色調(diào)(H):用角度度量,0360。紅色為0,按逆時(shí)針方向計(jì)算,綠色為120,藍(lán)色為240飽和度(S):取值范圍為0.01.0亮度值(V):取值范圍為0.0(
29、黑色)1.0(白色) HSV和RGB之間沒有轉(zhuǎn)換矩陣,但可對它們之間的轉(zhuǎn)換算法進(jìn)行描述6. HSV顏色空間模型圖1-7 HSV顏色空間 HSL/HSB (hue, saturation and lightness/brightness)的縮寫利用三條軸定義顏色,用六角形錐體表示用于臺(tái)式機(jī)圖形程序定義顏色HSL 與HSVHSL用光亮度(lightness)作坐標(biāo),HSV用亮度(luminance)作坐標(biāo)HSL顏色飽和度最高時(shí)的光亮度L定義為0.5,而HSV則為1.0 7. HSL/HSB/HSI顏色空間模型RGB HSI對任何3個(gè)0, 1范圍內(nèi)的R、G、B值,其對應(yīng)HSI模型中的H 、 I、S分
30、量的計(jì)算公式為當(dāng)S0時(shí)對應(yīng)的是無色彩的中心點(diǎn),這時(shí)H就沒有意義,此時(shí)定義H為0。當(dāng)I0時(shí),S也沒有意義。假設(shè)S、I的值在0,1之間,R、G、B的值也在0,1之間,則HSI轉(zhuǎn)換為RGB的公式為(分成3段以利用對稱性):(1)當(dāng)H在0,120之間 (2) 當(dāng)H在120,240之間 (3) 當(dāng)H在240,360之間 彩色圖像信號(hào)一般表示為 式中, x、y、z 表示空間某個(gè)點(diǎn)的坐標(biāo);為光的波長;t為時(shí)間軸坐標(biāo)。當(dāng) t=t0 (常數(shù)) 時(shí),則表示靜態(tài)圖像;當(dāng) z=z0 (常數(shù))時(shí),則表示二維圖像;當(dāng)=0 (常數(shù))時(shí),則表示單色圖像。 由三基色原理知, 其中 1.3.4 圖像信號(hào)的數(shù)字化1. 圖像信號(hào)的表
31、示1.3.4 圖像信號(hào)的數(shù)字化2. 圖像信號(hào)的采樣 圖像采樣就是將二維空間上模擬的連續(xù)亮度(即灰度)或彩色信息,轉(zhuǎn)化為一系列有限的離散數(shù)值來表示。由于圖像是一種二維分布的信息,所以采樣就是對圖像在水平方向和垂直方向上進(jìn)行等間隔的采樣,每個(gè)采樣點(diǎn)組成圖像的基本單位,稱為像素(pixel),如圖1-8所示。被分割的圖像若水平方向上有N個(gè)采樣點(diǎn),垂直方向上有M個(gè)采樣點(diǎn),則一幅圖像畫面就被表示成MN個(gè)像素構(gòu)成的離散像素點(diǎn)的集合,MN表示圖像的空間分辨率。在進(jìn)行采樣時(shí),采樣點(diǎn)間隔的選取是一個(gè)重要的問題,它決定了采樣后的圖像是否能真實(shí)地反映原圖像的程度。一般來說,采樣間隔越大,所得圖像像素?cái)?shù)越少,空間分辨
32、率低,圖像質(zhì)量差,嚴(yán)重時(shí)出現(xiàn)馬賽克效應(yīng);采樣間隔越小,所得圖像像素?cái)?shù)越多,空間分辨率高,圖像質(zhì)量好,但數(shù)據(jù)量大。 (a) 256256 (b)128128 (c) 3232 (d) 1616 采樣點(diǎn)數(shù)與圖像質(zhì)量之間的關(guān)系模擬圖像經(jīng)過采樣后,在時(shí)間和空間上離散化為像素。但采樣所得的像素值(灰度級)仍是一個(gè)有無窮多個(gè)取值的連續(xù)量。量化是指將具有無限多個(gè)取值的樣值用有限個(gè)離散值來表示的過程。3. 圖像信號(hào)的量化 用有限個(gè)離散灰度值表示無窮多個(gè)連續(xù)灰度的量必然引起誤差,稱為量化誤差,有時(shí)也稱為量化噪聲。量化分層越多,則量化誤差越小。對于不同的圖像,量化方法分為兩種:等間隔量化(均勻量化或線性量化)非等
33、間隔量化 等間隔量化就是簡單地把采樣值的灰度范圍等間隔地分割并進(jìn)行量化。 對于像素灰度級在黑-白范圍分布較均勻的圖像,這種量化方法可以得到較小的量化誤差。一幅圖像在采樣時(shí),行、列的采樣點(diǎn)與量化時(shí)每個(gè)像素量化的級數(shù),既影響數(shù)字圖像的質(zhì)量,也影響到該數(shù)字圖像數(shù)據(jù)量的大小。假定圖像取MN個(gè)采樣點(diǎn),每個(gè)像素量化后的灰度二進(jìn)制位數(shù)為Q,一般Q總是取為2的整數(shù)冪,即Q=2k, 則存儲(chǔ)一幅數(shù)字圖像所需的字節(jié)數(shù)B為 4. 采樣與量化精度對圖像質(zhì)量的影響 對一幅圖像,當(dāng)量化級數(shù)Q一定時(shí),采樣點(diǎn)數(shù)MN對圖像質(zhì)量有著顯著的影響。采樣點(diǎn)數(shù)越多,圖像質(zhì)量越好;當(dāng)采樣點(diǎn)數(shù)減少時(shí),圖上的塊狀效應(yīng)就逐漸明顯。 (a) 256
34、256 (b)128128 (c) 3232 (d) 1616 采樣點(diǎn)數(shù)與圖像質(zhì)量之間的關(guān)系同理,當(dāng)圖像的采樣點(diǎn)數(shù)一定時(shí),采用不同量化級數(shù)的圖像質(zhì)量也不一樣。量化級數(shù)越多,所得圖像層次越豐富,圖像質(zhì)量越好,但數(shù)據(jù)量大;量化級數(shù)越少, 圖像層次欠豐富,圖像質(zhì)量越差,會(huì)出現(xiàn)假輪廓現(xiàn)象,但數(shù)據(jù)量小。量化級數(shù)最小的極端情況就是二值圖像(即非黑即白,灰度級沒有中間過渡的圖像)。5. 數(shù)字圖像的表示 從數(shù)字圖像的獲取過程可以知道,一幅采樣圖像由M(行)、N(列)個(gè)采樣點(diǎn)組成,每個(gè)采樣點(diǎn)(像素)是組成圖像的基本單位。黑白圖像的像素只有1個(gè)亮度值,彩色圖像的像素是矢量,它由多個(gè)彩色分量組成,一般有3個(gè)分量:R
35、(紅)、G(綠)、B(藍(lán)),因此,采樣圖像在計(jì)算機(jī)中的表示方法是:單色圖像用一個(gè)矩陣來表示;彩色圖像用一組(一般是3個(gè))矩陣來表示,矩陣的行數(shù)稱為圖像的垂直分辨率,列數(shù)稱為圖像的水平分辨率,矩陣中的元素是像素顏色分量的亮度值,使用整數(shù)表示。 一幅 MN 的數(shù)字圖像可用矩陣表示為 數(shù)字圖像中的每個(gè)像素都對應(yīng)于矩陣中相應(yīng)的元素。把數(shù)字圖像表示成矩陣的優(yōu)點(diǎn)在于,能應(yīng)用矩陣?yán)碚搶D像進(jìn)行分析處理。5. 數(shù)字圖像的表示 (a) 256級灰度圖象 (b) 子圖 (c) 子圖對應(yīng)的量化數(shù)據(jù) 數(shù)字圖像實(shí)例1.1 多媒體的基本概念1.2 音頻信息處理基礎(chǔ)1.3 圖像信息處理基礎(chǔ)1.4 視頻信號(hào)的數(shù)字化1.5 M
36、ATALAB在圖像處理中的應(yīng)用第1章 多媒體信息處理基礎(chǔ)1.4.1 視頻信號(hào)的基本概念1.4.2 彩色電視的信號(hào)類型1.4.3 彩色電視的制式1.4.4 ITU-R BT.601建議1.4 視頻信號(hào)的數(shù)字化視頻是動(dòng)態(tài)的序列圖像一幀電視畫面xytF(u,v)k-1幀k+1幀k幀k-1幀1.4.1 視頻信號(hào)的基本概念活動(dòng)圖像利用人的眼睛有視覺暫留特性我國電視每秒放送25幅圖像(幀) 把每幀畫面分先后兩次來放送,這樣,光亮度變化的次數(shù)就增加到50次秒 具體的做法就是隔行掃描 1.4.1 視頻信號(hào)的基本概念電視掃描指顯示圖像的方式。掃描有隔行掃描和逐行掃描之分。在逐行掃描中,電子束從顯示屏的左上角一行
37、接一行地掃到右下角,在顯示屏上掃一遍就顯示一幅完整的圖像。1.4.1 視頻信號(hào)的基本概念場 (Field)幀(Frame)奇數(shù)場 (Odd Field) 偶數(shù)場(Even Field)掃描行數(shù):電視圖像的掃描行數(shù)通常指水平行的數(shù)目。掃描行數(shù)也稱為垂直分辨率(Vertical Resolution),掃描行數(shù)越多,電視清晰度越高。我國的電視制式(PAL)規(guī)定水平掃描行數(shù)為625。1.4.1 視頻信號(hào)的基本概念同步:在傳送電視節(jié)目的過程中,接收端與發(fā)送端按照相同的步調(diào)(順序)掃描像素時(shí),才能重顯完整而穩(wěn)定的圖像,這叫做收發(fā)兩端同步。接收與發(fā)送兩端同步包含水平和垂直兩個(gè)方向的掃描同步。行同步:當(dāng)掃描
38、時(shí),在每一行使收發(fā)兩端同步稱為水平同步,或叫做行同步場同步 :在每一場使收發(fā)兩端同步稱為垂直同步,也叫做場同步1.4.1 視頻信號(hào)的基本概念光柵 在電視機(jī)顯像管的熒光屏上涂有熒光物質(zhì),高速運(yùn)動(dòng)的電子束轟擊熒光屏?xí)r,就能發(fā)出光來。當(dāng)電子束受水平和垂直兩個(gè)方向的綜合控制而迅速掃描熒光屏?xí)r,即可出現(xiàn)由一行一行的亮線組成的矩形發(fā)光圖案,通常稱為光柵。 幀頻:每秒鐘傳送的電視圖像幀數(shù)場頻:每秒鐘傳送的電視圖像場數(shù),場頻通常是幀頻的2倍,對應(yīng)于25Hz幀頻時(shí)的場頻為50Hz 1.4.1 視頻信號(hào)的基本概念根據(jù)不同的信號(hào)源,電視接收機(jī)的輸入、輸出信號(hào)有如下4種類型。射頻(Radio Frequency, R
39、F )信號(hào)復(fù)合視頻(Composite Video)信號(hào)分離視頻( S-Video )信號(hào)分量視頻(Component Video)信號(hào)1.4.2 彩色電視的信號(hào)類型 1.4.3 彩色電視的制式實(shí)現(xiàn)電視的特定方式,稱為電視的制式制式的區(qū)分主要在于其幀頻(場頻)、分解率、信號(hào)帶寬以及載頻、色彩空間的轉(zhuǎn)換關(guān)系不同等 NTSC(National Television System Committee)PAL(Phase Alternation Line)SECAM(法文:Sequential Coleur Avec Memoire) 對彩色電視信號(hào)的數(shù)字化處理主要有分量數(shù)字編碼和復(fù)合數(shù)字編碼兩種方式
40、。復(fù)合數(shù)字編碼:首先用一個(gè)高速A/D轉(zhuǎn)換器對彩色全電視信號(hào)進(jìn)行數(shù)字化,然后在數(shù)字域中進(jìn)行亮、色分離,以獲得所希望的YCbCr,或RGB分量數(shù)據(jù)。分量數(shù)字編碼:首先把模擬的彩色全電視信號(hào)分離成YUV、YIQ或RGB彩色空間中的分量信號(hào),然后用三個(gè)A/D轉(zhuǎn)換器分別對它們進(jìn)行數(shù)字化。1.4.4 ITU-R BT.601建議分量數(shù)字編碼優(yōu)點(diǎn):避免了復(fù)合數(shù)字編碼時(shí)因反復(fù)解碼所引起的質(zhì)量損傷和器件的浪費(fèi),而且編碼幾乎與電視制式無關(guān)。后期制作的處理方便。時(shí)分復(fù)用方式,不會(huì)像復(fù)合數(shù)字編碼那樣因頻分復(fù)用帶來亮、色串?dāng)_,可獲得高質(zhì)量的圖像。亮度信號(hào)和色度信號(hào)的帶寬根據(jù)需要取不同值。1.4.4 ITU-R BT.6
41、01建議對彩色電視圖像進(jìn)行采樣時(shí),可以采用兩種方法。一種是使用相同的采樣頻率對圖像的亮度信號(hào)和色差信號(hào)進(jìn)行采樣,另一種是對亮度信號(hào)和色差信號(hào)分別采用不同的采樣頻率進(jìn)行采樣。如果對色差信號(hào)使用的采樣頻率比對亮度信號(hào)使用的采樣頻率低,這種采樣就稱為圖像亞采樣(subsampling)。 1.4.4 ITU-R BT.601建議圖像亞采樣格式: 4:4:4 指在每條掃描線上每4個(gè)連續(xù)的采樣點(diǎn)取4個(gè)亮度Y樣本、4個(gè)紅色差Cr樣本和4個(gè)藍(lán)色差Cb樣本,這就相當(dāng)于每個(gè)像素用3個(gè)樣本表示。4:2:2 在每條掃描線上每4個(gè)連續(xù)的采樣點(diǎn)取4個(gè)亮度Y樣本、2個(gè)紅色差Cr樣本和2個(gè)藍(lán)色差Cb樣本,平均每個(gè)像素用2個(gè)樣本表示。4:1:1 在每條掃描線上每4個(gè)連續(xù)的采樣點(diǎn)取4個(gè)亮度Y樣本、1個(gè)紅色差Cr樣本和1個(gè)藍(lán)色差Cb樣本,平均每個(gè)像素用1.5個(gè)樣本表示。4:2:0 在水平和垂直方向上每4個(gè)連續(xù)的采樣點(diǎn)上取4個(gè)亮度Y樣本、1個(gè)紅色差Cr樣本和1個(gè)藍(lán)色差Cb樣本,平均每個(gè)像素用1.5個(gè)樣本表示。 1.4.4 ITU-R BT.601建議1.4.4 ITU-R BT.601建議表1-3 ITU-R BT.601建議的主要參數(shù) 參 量 NTSC制 ( 525行/60場 ) PAL制(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《貴州漢諾礦業(yè)有限公司興仁市新龍場鎮(zhèn)興昌煤礦(變更)礦產(chǎn)資源綠色開發(fā)利用方案(三合一)》評審意見
- 峨邊永利達(dá)礦業(yè)有限公司楊河鉛鋅礦二合一方案情況
- 三年級數(shù)學(xué)下冊9總復(fù)習(xí)第2課時(shí)年月日小數(shù)的初步認(rèn)識(shí)教案新人教版
- 腰痛治療方法
- 2025年和田c1貨運(yùn)從業(yè)資格證模擬考試
- 2025年南京貨運(yùn)從業(yè)資格證考試模擬考試題庫及答案大全
- 2025年烏魯木齊年貨運(yùn)從業(yè)資格證考試試題及答案
- 2025年伊犁貨運(yùn)從業(yè)資格證模擬考試保過版
- 第一單元第3課 互聯(lián)網(wǎng)影響新體驗(yàn) 教學(xué)設(shè)計(jì)2024-2025學(xué)年人教版(2024)初中信息科技七年級上冊
- 2024-2025學(xué)年湖南省永州市高一(上)期末質(zhì)量檢測物理試卷【含解析】
- (2025春新教材)部編版七年級語文下冊全冊教案
- 5《水污染》教學(xué)設(shè)計(jì)-2023-2024學(xué)年科學(xué)六年級下冊冀人版
- 2025年安徽電氣工程職業(yè)技術(shù)學(xué)院高職單招職業(yè)技能測試近5年??及鎱⒖碱}庫含答案解析
- 統(tǒng)編版歷史 選擇性必修二第12課 《水陸交通的變遷》課件(共27張)
- 幼兒園開學(xué)教職工安全教育培訓(xùn)
- 小學(xué)生雙擁活動(dòng)國防教育
- 酒店建設(shè)項(xiàng)目施工總承包合同
- 《得勝的基督新婦》課件
- 煙囪拆除工程施工方案設(shè)計(jì)及安全措施
- 2025年湖南省煙草專賣局系統(tǒng)招聘336人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 交通安全勸導(dǎo)講座課件
評論
0/150
提交評論