




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1.1多媒體的基本概念1.2音頻信息處理基礎(chǔ)1.3圖像信息處理基礎(chǔ)1.4MATALAB在圖像處理中的應(yīng)用第1章多媒體信息處理基礎(chǔ)熟悉多媒體及多媒體技術(shù)的基本概念及特征。了解聲音的基本特性及主觀感覺。熟悉音頻、圖像、視頻信號數(shù)字化的過程,掌握均勻量化的原理。掌握彩色三要素、三基色原理及混色方法等色度學(xué)基本知識。理解RGB、YUV、YIQ、YCbCr、HSI/HSV等顏色空間的表示及轉(zhuǎn)換。熟悉ITU-RBT.601建議的主要內(nèi)容。了解MATLAB在圖像處理和分析領(lǐng)域的應(yīng)用。本章學(xué)習(xí)目標(biāo)1.1.1媒體的概念1.1.2多媒體與多媒體技術(shù)1.1多媒體的基本概念1.媒體(medium)按傳統(tǒng)的說法,媒體指的是信息的載體,如:報(bào)紙、雜志、電視、廣播、因特網(wǎng)…在計(jì)算機(jī)領(lǐng)域有兩種含義:信息的存儲實(shí)體,如磁盤、光盤、磁帶、半導(dǎo)體存儲器等,中文常譯為媒質(zhì)或媒介;傳遞信息的基本元素,如文字、聲音、圖形、動畫和圖像等。1.1.1媒體的概念2.媒體的分類國際電話電報(bào)咨詢委員會(CCITT)把媒體分成如下5類。(1)感知媒體(PerceptionMedium)感知媒體就是指能直接作用于人的感覺器官,使人直接產(chǎn)生感覺(視、聽、嗅、味、觸覺)的一類媒體,如語言、音樂、圖形、動畫、數(shù)據(jù)、文字、文件等都是感知媒體。(2)表示媒體(RepresentationMedium)表示媒體是為了更有效地加工、處理和傳輸感知媒體而人為研究和構(gòu)造出來的一種媒體。它包括上述感知媒體的各種編碼,諸如語言編碼、靜止和活動圖像編碼,以及文本編碼等。(3)呈現(xiàn)媒體(PresentationMedium)呈現(xiàn)媒體是感知媒體與用于通信的電信號之間在轉(zhuǎn)換中用于信息輸入和輸出的媒體??煞譃檩斎氤尸F(xiàn)媒體(如鍵盤、攝像機(jī)、話筒、掃描儀等)和輸出呈現(xiàn)媒體(如顯示器、揚(yáng)聲器、打印機(jī)等)兩種。(4)存儲媒體(StorageMedium)存儲媒體用于存儲表示媒體,即存放感知媒體數(shù)字化后的代碼的媒體稱為存儲媒體,如磁盤、光盤、磁帶、半導(dǎo)體存儲器等。(5)傳輸媒體(TransmissionMedium)傳輸媒體是指用來將表示媒體從一處傳遞到另一處的物理傳輸介質(zhì),如同軸電纜、雙絞線、光纖及其他通信信道。
在多媒體技術(shù)中所說的媒體一般指感知媒體。常見的感知媒體包括:(1)視覺媒體:圖像、圖形、符號、視頻、動畫等。(2)聽覺媒體:聲音、語音、音樂和音響。(3)觸覺媒體:通過直接或間接與人體接觸,使人能感覺到對象的位置、大小、方向、方位、質(zhì)地等性質(zhì)。
圖像
圖像(Image):是指由輸入設(shè)備捕捉的實(shí)際場景畫面,或以數(shù)字化形式存儲的任意畫面。 靜止的圖像可用一個矩陣來表示,矩陣列中的各個元素用來描述構(gòu)成圖像的各個點(diǎn)(稱為像素pixel)的強(qiáng)度與顏色等信息。這種圖像也稱為位圖(Bitmap)。圖像由像素組成位圖(bitmap,bit-mappedimage)對位圖進(jìn)行操作時,只能對圖中的像素進(jìn)行操作,而不能把位圖中的物體作為獨(dú)立實(shí)體進(jìn)行操作。畫位圖或編輯位圖的軟件稱為畫圖程序;存放位圖的格式稱為位圖格式;存儲的內(nèi)容是描述像素的數(shù)值。位圖的獲取通常用掃描儀、數(shù)碼相機(jī)和相關(guān)的數(shù)字化設(shè)備。位圖文件占據(jù)的存儲空間比較大,影響位圖文件大小的因素圖像分辨率:分辨率越高,表示組成一幅圖的像素就越多,圖像文件就越大像素深度:像素深度越深,表達(dá)單個像素的顏色和亮度的位數(shù)越多,圖像文件就越大
灰度圖像(gray-scaleimage或intensityimage):只有明暗不同的像素而沒有彩色像素組成的圖像。按灰度級的數(shù)目來劃分:單色圖像(二值圖像):只有黑白兩種顏色的圖像。每個像素的像素值用1bit存儲,其值是“0”或“1”灰度圖像:如果每個像素的像素值用一個字節(jié)表示,灰度值級數(shù)就等于256級,每個像素可以是0~255之間的任何一個值。單色圖像灰度圖像彩色圖像(colorimage)每個像素包含顏色信息的圖像??砂凑疹伾臄?shù)目劃分:256色圖像:每個像素的R、G和B值用一個字節(jié)來表示,一幅640×480的彩色圖像需要300KB的存儲空間真彩色圖像:每個像素的R、G、B分量分別用一個字節(jié)表示,一幅640×480的真彩色圖像需要900KB的存儲空間256色圖像24位真彩色圖像
色彩深度1位:黑白8位:灰階8位:256色15/16位:高彩24位:真彩30/36/48位:全彩視頻視頻(Video):是動態(tài)的圖像序列,由一系列連續(xù)的畫面序列(幀)組成,這些畫面以一定的速率(幀頻)連續(xù)地投射在屏幕上,使觀察者具有圖像連續(xù)運(yùn)動的感覺。一幀電視畫面xytF(u,v)k-1幀k+1幀k幀k-1幀圖形
圖形(Graphic):一般指用計(jì)算機(jī)繪制(draw)的幾何圖(包含彩色圖)。在幾何學(xué)中,圖形一般使用矢量表示,因此也稱矢量圖(VectorGraphics)。矢量圖是用一組指令集合來描述圖形的內(nèi)容。AutoCAD、CorelDraw、AdobeIllustrator-對矢量圖進(jìn)行處理:顏色,形狀、位置等動畫(Animation):是動態(tài)圖像的一種動畫中的圖像采用的是計(jì)算機(jī)產(chǎn)生出來或人工繪制的圖像或圖形動畫是活動的畫面,實(shí)質(zhì)是一幅幅靜態(tài)圖形的連續(xù)播放。
動畫
計(jì)算機(jī)設(shè)計(jì)動畫有兩種:
幀動畫:是由一幅幅位圖組成的連續(xù)的畫面,就如電影膠片或視頻畫面一樣要分別設(shè)計(jì)每屏幕顯示的畫面。
造型動畫:是對每一個運(yùn)動的物體分別進(jìn)行設(shè)計(jì),賦予每個動元一些特征,然后用這些動元構(gòu)成完整的幀畫面。動元的表演和行為是由制作表組成的腳本來控制。
幀動畫
文本
文本(Text):分為非格式化文本文件和格式化文本文件。
非格式化文本文件:只有文本信息沒有其他任何有關(guān)格式信息的文件,又稱為純文本文件。如“.TXT”文件。
格式化文本文件:帶有各種文本排版信息等格式信息的文本文件。如“.DOC”文件。音頻(Audio)可分為波形聲音、語音和音樂。
波形聲音包含了所有的聲音形式自然界中的各種聲音,包括人的說話聲、音樂、天空的驚雷等,可以用一種模擬的連續(xù)波形表示。音頻語音:不僅是一種波形聲音,而且還具有內(nèi)在的語言、語音學(xué)內(nèi)涵,可以經(jīng)由特殊的方法而提取。波形聲音也可以表現(xiàn)和記錄語音,但常把語音作為一種特殊的聽覺媒體。音頻音樂:符號化了的聲音。這種符號就是樂譜。音樂與語音相比,形式更為規(guī)范。在多媒體計(jì)算機(jī)中,MIDI(MusicalInstrumentDigitalInterface
)就是一種樂譜數(shù)字化描述的規(guī)范。1.多媒體關(guān)于多媒體(Multimedium)的定義或說法多種多樣,從不同的角度出發(fā)對多媒體給出了不同的描述,目前仍沒有統(tǒng)一的標(biāo)準(zhǔn)。通常所說的多媒體就是各種媒體的綜合,也就是聲音、圖像、動畫、視頻、文本等各種媒體的綜合?!岸嗝襟w”常被當(dāng)作“多媒體技術(shù)”的同義詞。2.多媒體技術(shù)多媒體技術(shù)就是利用計(jì)算機(jī)技術(shù)把文本、圖像、圖形、動畫、音頻及視頻等多種媒體有機(jī)地集成起來,使人們能以更加自然的方式使用信息,并與計(jì)算機(jī)進(jìn)行交互,且使表現(xiàn)的信息圖、文、聲并茂。簡言之,多媒體技術(shù)就是計(jì)算機(jī)綜合處理聲、文、圖信息的技術(shù),具有集成性、實(shí)時性和交互性。1.1.2多媒體與多媒體技術(shù)1.2.1聲音的基本特性1.2.2聲音的主觀感覺1.2.3音頻信號的數(shù)字化
1.2音頻信息處理基礎(chǔ)聲音是機(jī)械振動或氣流振動引起周圍傳播媒質(zhì)(氣體、液體、固體等)發(fā)生波動的現(xiàn)象,通常將產(chǎn)生聲音的發(fā)聲體稱為聲源。當(dāng)聲源產(chǎn)生振動時,引起鄰近空氣的振動。這樣空氣就隨著聲源體所振動幅度的不同,而產(chǎn)生密或稀的振動,空氣的這種振動被稱為聲波。聲波可以用一條連續(xù)的曲線來表示,它可以分解成一系列正弦波的線性疊加。1.2.1聲音的基本特性1.頻率單位時間內(nèi)信號振動的次數(shù),單位是赫茲(Hz)。聲音的音調(diào)由頻率決定。聲音尖細(xì)表示頻率高,聲音低粗表示頻率低。1.2.1聲音的基本特性次聲波音頻信號超聲波<20Hz20~20000Hz>20000Hz聲音信號按頻率劃分:2.頻譜
聲音信號按頻率成分組成來分,可分為:純音:頻率單一、振幅隨時間按正弦函數(shù)規(guī)律變化的聲音復(fù)音:由不同頻率和不同振幅的聲波組合而成的聲音基音:復(fù)音中頻率最低的成分(分音)諧音:復(fù)音中頻率與基音成整數(shù)倍的分音聲音的頻譜結(jié)構(gòu)是用基音、諧音數(shù)目、各諧音振幅大小及相位關(guān)系來描述的。聲音的音色就是由其頻譜成分決定的。1.2.1聲音的基本特性聲壓由聲波引起的交變壓強(qiáng)稱為聲壓,一般用P表示,單位是帕(Pa)。聲壓的大小反映了聲音振動的強(qiáng)弱,同時也決定了聲波的幅度大小。聲壓級
用聲壓的相對大?。ǚQ聲壓級或聲強(qiáng))來表示聲壓的強(qiáng)弱。聲壓級用符號SPL
表示,單位是分貝(dB):
式中,P為聲壓有效值;Pref為參考聲壓,一般取Pa,這個數(shù)值是人耳所能聽到的1kHz聲音的最低聲壓,低于這一聲壓,人耳就無法覺察出聲波的存在了。3.聲壓及聲壓級
1.2.1聲音的基本特性
人對聲音的感知有響度、音調(diào)和音色三個主觀聽感要素。響度:與聲波振動的幅度有關(guān)音調(diào):取決于聲波的基音頻率音色:由聲波的的頻譜成分決定1.2.2聲音的主觀感覺1.響度:是人耳對聲音強(qiáng)弱的主觀感覺程度。在客觀的度量中,聲音的強(qiáng)弱是由聲波的振幅(聲壓)決定的。但響度與聲波的振幅并不完全一致。響度不僅取決于振幅的大小,還取決于頻率的高低。響度用符號N表示,單位是宋(sone)。國際上規(guī)定,頻率為1kHz的純音在聲壓級為40dB時的響度為1宋(sone)。另外,響度的大小與距聲源的距離有關(guān),同一聲音離聲源越近,響度越大。
1.2.2聲音的主觀感覺2.響度級:人耳對聲音強(qiáng)弱的主觀感覺還可以用響度級來表示。響度級的單位為方(phon)。規(guī)定1kHz純音聲壓級的分貝數(shù)定義為響度級的數(shù)值。響度/sone1248163264128256聲壓級/dB405060708090100110120響度級/phon405060708090100110120表1-1聲壓級與響度、響度級的關(guān)系1.2.2聲音的主觀感覺3.聽閾與痛閾聽閾:當(dāng)聲音減弱到人耳剛剛可以聽見時,此時的聲音強(qiáng)度稱為最小可聽閾值,簡稱為“聽閾”或“聞閾”。一般以1kHz純音為準(zhǔn)進(jìn)行測量,人耳剛能聽到的聲壓級為0dB(通常大于0.3dB即有感受)。痛閾:當(dāng)聲音增強(qiáng)到使人耳感到疼痛時,這個聽覺閾值稱為“痛閾”。仍以1kHz純音為準(zhǔn)來進(jìn)行測量,使人耳感到疼痛時的聲壓級約達(dá)到130~140dB左右。1.2.2聲音的主觀感覺5.音調(diào)音調(diào)也稱音高,表示人耳對聲音調(diào)子高低的主觀感受。聲音越低沉,音調(diào)越低;聲音越尖細(xì),音調(diào)越高。音調(diào)的高低是由發(fā)聲體振動的頻率決定的,頻率越高,音調(diào)越高;頻率越低,音調(diào)越低。物體的振動頻率與發(fā)聲體的結(jié)構(gòu)有關(guān),一般而言,大而長的物體振動頻率低,小而短的物體振動頻率高;物體繃得越緊,振動頻率越高;物體越薄、越細(xì),振動頻率越高。音調(diào)單位是“美(Mel)”。頻率為1kHz、聲壓級為40dB的純音所產(chǎn)生的音調(diào)就定義為1Mel。音調(diào)大體上與頻率的對數(shù)成正比。1.2.2聲音的主觀感覺5.音色音調(diào)也稱音高,表示人耳對聲音調(diào)子高低的主觀感受。聲音越低沉,音調(diào)越低;聲音越尖細(xì),音調(diào)越高。音調(diào)的高低是由發(fā)聲體振動的頻率決定的,頻率越高,音調(diào)越高;頻率越低,音調(diào)越低。物體的振動頻率與發(fā)聲體的結(jié)構(gòu)有關(guān),一般而言,大而長的物體振動頻率低,小而短的物體振動頻率高;物體繃得越緊,振動頻率越高;物體越薄、越細(xì),振動頻率越高。音調(diào)單位是“美(Mel)”。頻率為1kHz、聲壓級為40dB的純音所產(chǎn)生的音調(diào)就定義為1Mel。音調(diào)大體上與頻率的對數(shù)成正比。1.2.2聲音的主觀感覺1.2.3音頻信號的數(shù)字化聲源聲波傳聲器模擬電信號數(shù)字聲音模/數(shù)轉(zhuǎn)換聲音信號是典型的連續(xù)信號,不僅在時間上是連續(xù)的,而且在幅度上也是連續(xù)的。數(shù)字化實(shí)際上就是對模擬信號進(jìn)行采樣、量化和編碼。模/數(shù)轉(zhuǎn)換1101110011001101把聲音(模擬量)按照固定時間間隔,轉(zhuǎn)換成有限個數(shù)字表示的離散序列1.2.3音頻信號的數(shù)字化采樣(Sampling):每隔一定的時間間隔,抽取信號的一個瞬時幅度值(樣本值),即在時間上將模擬信號進(jìn)行離散化。采樣后所得到的一系列在時間上離散的樣本值稱為樣值序列。1.2.3音頻信號的數(shù)字化OriginalVoiceSampled1Sampled2Sampled3Sampled4奈奎斯特(Nyquist)采樣定理:只要采樣頻率大于或等于聲音信號最高頻率的兩倍(fs≥2fmax
),就可以通過理想低通濾波器,從樣值序列中無失真地恢復(fù)原始模擬信號。也就是說,在滿足奈奎斯特采樣定理的條件下,在時間上離散的樣值序列包含有采樣前模擬信號的全部信息。常用音頻采樣頻率:8kHz、11.025kHz、22.05kHz、32kHz、44.1kHz、48kHz、96kHz量化(Quantization):對每個樣值的連續(xù)幅度進(jìn)行離散化,即用有限個幅度值近似原來連續(xù)變化的幅度值,把模擬信號的連續(xù)幅度變?yōu)橛邢迶?shù)量、有一定間隔的離散值。均勻量化(線性量化):量化器的每個量化間隔都相等,量化電平取各量化區(qū)間的中間值。非均勻量化(非線性量化):量化器的各個量化間隔是不相等的。1.2.3音頻信號的數(shù)字化編碼(Encoding):采樣、量化后的信號還不是數(shù)字信號,需要把它轉(zhuǎn)換成數(shù)字編碼脈沖,這一過程稱為編碼。最簡單的編碼方式是二進(jìn)制編碼。具體說來,就是用n比特二進(jìn)制碼來表示已經(jīng)量化了的樣值,每個二進(jìn)制數(shù)對應(yīng)一個量化電平,然后把它們排列,得到由二值脈沖組成的數(shù)字信息流。1.2.3音頻信號的數(shù)字化模/數(shù)轉(zhuǎn)換1101110011001101把聲音(模擬量)按照固定時間間隔,轉(zhuǎn)換成有限個數(shù)字表示的離散序列質(zhì)量等級采樣頻率/kHz量化精度/bit聲道數(shù)數(shù)碼率/kbit/s頻帶/Hz電話話音88單聲道64200~3400AM11.0258單聲道88.250~7000FM22.0516雙聲道705.620~15000CD44.116雙聲道1411.220~20000DAT4816雙聲道153620~20000聲音質(zhì)量與數(shù)碼率的關(guān)系1.2.3音頻信號的數(shù)字化1.1多媒體的基本概念1.2音頻信息處理基礎(chǔ)1.3圖像信息處理基礎(chǔ)1.4MATALAB在圖像處理中的應(yīng)用第1章多媒體信息處理基礎(chǔ)1.3.1光的顏色與彩色三要素1.3.2三基色原理1.3.3典型的顏色空間模型及轉(zhuǎn)換關(guān)系1.3.4圖像信號的數(shù)字化
1.3圖像信息處理基礎(chǔ)
光是一種電磁波。電磁輻射的波長范圍很寬,按波長從長到短的順序排列,依次是無線電波、紅外線、可見光、紫外線、X射線和宇宙射線等。圖1-3是按波長的順序排列的電磁波譜。
1.3.1光的顏色與彩色三要素圖1-3電磁波譜波長在380~780nm范圍內(nèi)的電磁波能夠使人眼產(chǎn)生顏色感覺,稱為可見光??梢姽庠谡麄€電磁波譜中只占極小的一段。1.3.1光的顏色與彩色三要素◆描述一種色彩需要用亮度、色調(diào)和色飽和度三個基本參量,這三個參量稱為彩色三要素?!袅炼确从彻獾拿髁脸潭?。彩色光輻射的功率越大,亮度越高,反之亮度越低。不發(fā)光物體的亮度取決于它反射光功率的大小。若照射物體的光強(qiáng)度不變,物體的反射性能越好,物體越明亮,反之越暗。對于一定的物體,照射光越強(qiáng),物體越明亮,反之越暗。
1.3.1光的顏色與彩色三要素
◆色調(diào)反映彩色的類別,例如紅、橙、黃、綠、青、藍(lán)、紫等不同顏色。發(fā)光物體的色調(diào)由光的波長決定,不同波長的光呈現(xiàn)不同的色調(diào);不發(fā)光物體的色調(diào)由照明光源和該物體的吸收、反射或透射特性共同決定。
◆色飽和度反映彩色光的深淺程度。同一色調(diào)的彩色光,會給人以深淺不同的感覺,深紅、粉紅是兩種不同飽和度的紅色,深紅色飽和度高,粉紅色飽和度低。
1.3.1光的顏色與彩色三要素1.3.2三基色原理三種基色必須是相互獨(dú)立的,即任一種基色都不能由其他兩種基色混合得到。自然界中絕大多數(shù)的彩色可以分解為三基色,三基色按一定比例混合,可得到自然界中絕大多數(shù)彩色?;旌仙纳{(diào)和飽和度由三基色的混合比例決定,混合色的亮度等于三種基色亮度之和。因?yàn)槿搜鄣娜N錐狀細(xì)胞對紅光、綠光和藍(lán)光最敏感,所以在紅色、綠色和藍(lán)色光譜區(qū)中選擇三個基色按適當(dāng)比例混色可得到較多的彩色。在彩色電視中,選用了紅、
綠、
藍(lán)作為三基色,分別用R、
G、
B來表示。波長為700nm的紅光為紅基色——R(紅)波長為546.1nm的綠光為綠基色——G(綠)波長為435.8nm的藍(lán)光為藍(lán)基色——B(藍(lán))1.RGB顏色空間模型在RGB模型中,顏色空間里所有的顏色都是由R、G、B
(紅、綠、藍(lán))三種光依不同的比例相加而成。RGB的每一色光,含有亮度成分,例如R的成分越多,表示越紅越亮。各色光混合后,會比原來單獨(dú)的色光還亮,稱為相加混色;適合在以主動光源顯示影像的場合使用,如電視、電腦、投影等。綠(0,1,0)青(0,1,1)黃(1,1,0)黑(0,0,0)藍(lán)(0,0,1)品紅(1,0,1)白(1,1,1)紅(1,0,0)相加混色RGB顏色000黑001藍(lán)010綠011青100紅101品紅110黃111白2.CMY/CMYK顏色空間模型在彩色印刷、彩色膠片和繪畫中的混色采用相減混色。彩色印刷或彩色打印的紙張是不能發(fā)射光線的,因而印刷機(jī)或彩色打印機(jī)就只能使用一些能夠吸收特定的光波而反射其他光波的油墨或顏料。任何一種由顏料呈現(xiàn)的顏色都可以用青(Cyan)、品紅(Magenta)和黃(Yellow)這三種基色按不同的比例混合而成,我們稱這種顏色空間為CMY顏色空間。由于彩色墨水和顏料的化學(xué)特性,用等量的CMY三基色得到的黑色不是真正的黑色,因此在印刷術(shù)中常加一種真正的黑色墨水(BlackInk),于是CMY顏色空間也稱為CMYK顏色空間。CYMRGB相減混色C(青色)M(品紅)Y(黃色)顏色000白001黃010品紅011紅100青101綠110藍(lán)111黑
RGB
CMYRGB和CMY值都?xì)w一到[0,1]YUV是PAL制彩色電視系統(tǒng)所采用的一種顏色空間模型,其中Y表示亮度,U表示藍(lán)色色差(即B-Y),V代表紅色色差(R-Y)。
采用YUV色彩空間的重要性:亮度信號Y和色度信號U、V是分離的,解決彩色電視和黑白電視兼容的問題??梢岳萌搜蹖Σ噬拿舾卸鹊陀趯α炼鹊拿舾卸鹊囊曈X特性,用較窄的頻帶傳送U、V信號,優(yōu)化彩色電視信號的傳輸。3.YUV顏色空間模型
RGBYUV
YIQ顏色空間是由YUV推導(dǎo)而來,是NTSC制彩色電視系統(tǒng)所采用的一種顏色空間模型;I代表“同相”,Q代表“正交”:指的是用于發(fā)射顏色信息的調(diào)制方法;I、Q是通過將U、V軸逆時針旋轉(zhuǎn)33度獲得的。4.YIQ顏色空間模型YIQ顏色空間模型優(yōu)點(diǎn)由人眼彩色視覺的特性表明,人眼分辨紅、黃之間顏色變化的能力最強(qiáng),而分辨藍(lán)、紫之間顏色變化的能力最弱。I對應(yīng)于人眼最敏感的色度,而Q對應(yīng)于人眼最不敏感的色度。這樣,傳送Q可以用較窄的頻帶,而傳送分辨率較強(qiáng)的I信號時,可以用較寬的頻帶。
RGBYIQ由YUV顏色空間派生的一種顏色空間模型。主要用于數(shù)字電視系統(tǒng),是YUV顏色空間的縮放和偏移版本。5.YCbCr顏色空間模型
彩色圖像信號一般表示為式中,x、y、z
表示空間某個點(diǎn)的坐標(biāo);λ為光的波長;t為時間軸坐標(biāo)。當(dāng)
t=t0(常數(shù))時,則表示靜態(tài)圖像;當(dāng)
z=z0
(常數(shù))時,則表示二維圖像;當(dāng)λ=λ0(常數(shù))時,則表示單色圖像。由三基色原理知,其中
1.3.4圖像信號的數(shù)字化1.圖像信號的表示1.3.4圖像信號的數(shù)字化2.圖像信號的采樣圖像采樣就是將二維空間上模擬的連續(xù)亮度(即灰度)或彩色信息,轉(zhuǎn)化為一系列有限的離散數(shù)值來表示。采樣就是對圖像在水平方向和垂直方向上進(jìn)行等間隔的采樣,每個采樣點(diǎn)組成圖像的基本單位,稱為像素(pixel)。在進(jìn)行采樣時,采樣點(diǎn)間隔的選取是一個重要的問題,它決定了采樣后的圖像是否能真實(shí)地反映原圖像的程度。一般來說,采樣間隔越大,所得圖像像素?cái)?shù)越少,空間分辨率低,圖像質(zhì)量差,嚴(yán)重時出現(xiàn)馬賽克效應(yīng);采樣間隔越小,所得圖像像素?cái)?shù)越多,空間分辨率高,圖像質(zhì)量好,但數(shù)據(jù)量大。(a)256×256(b)128×128(c)32×32(d)16×16
采樣點(diǎn)數(shù)與圖像質(zhì)量之間的關(guān)系模擬圖像經(jīng)過采樣后,在時間和空間上離散化為像素。
p.s.采樣所得的像素值(灰度級)仍是一個有無窮多個取值的連續(xù)量。量化是指將具有無限多個取值的樣值用有限個離散值來表示的過程。3.圖像信號的量化
用有限個離散灰度值表示無窮多個連續(xù)灰度的量必然引起誤差,稱為量化誤差,有時也稱為量化噪聲。量化分層越多,則量化誤差越小。對于不同的圖像,量化方法分為兩種:等間隔量化(均勻量化或線性量化)非等間隔量化
等間隔量化就是簡單地把采樣值的灰度范圍等間隔地分割并進(jìn)行量化。對于像素灰度級在黑-白范圍分布較均勻的圖像,這種量化方法可以得到較小的量化誤差。一幅圖像在采樣時,行、列的采樣點(diǎn)與量化時每個像素量化的級數(shù),既影響數(shù)字圖像的質(zhì)量,也影響到該數(shù)字圖像數(shù)據(jù)量的大小。假定圖像取M×N個采樣點(diǎn),每個像素量化后的灰度二進(jìn)制位數(shù)為Q,一般Q總是取為2的整數(shù)冪,即Q=2k,則存儲一幅數(shù)字圖像所需的字節(jié)數(shù)B為4.采樣與量化精度對圖像質(zhì)量的影響
對一幅圖像,當(dāng)量化級數(shù)Q一定時,采樣點(diǎn)數(shù)M×N對圖像質(zhì)量有著顯著的影響。采樣點(diǎn)數(shù)越多,圖像質(zhì)量越好;當(dāng)采樣點(diǎn)數(shù)減少時,圖上的塊狀效應(yīng)就逐漸明顯。(a)256×256(b)128×128(c)32×32(d)16×16
采樣點(diǎn)數(shù)與圖像質(zhì)量之間的關(guān)系同理,當(dāng)圖像的采樣點(diǎn)數(shù)一定時,采用不同量化級數(shù)的圖像質(zhì)量也不一樣。量化級數(shù)越多,所得圖像層次越豐富,圖像質(zhì)量越好,但數(shù)據(jù)量大;量化級數(shù)越少,圖像層次欠豐富,圖像質(zhì)量越差,會出現(xiàn)假輪廓現(xiàn)象,但數(shù)據(jù)量小。量化級數(shù)最小的極端情況就是二值圖像(即非黑即白,灰度級沒有中間過渡的圖像)。5.數(shù)字圖像的表示
從數(shù)字圖像的獲取過程可以知道,一幅采樣圖像由M(行)、N(列)個采樣點(diǎn)組成,每個采樣點(diǎn)(像素)是組成圖像的基本單位。黑白圖像的像素只有1個亮度值,彩色圖像的像素是矢量,它由多個彩色分量組成,一般有3個分量:R(紅)、G(綠)、B(藍(lán)),因此,采樣圖像在計(jì)算機(jī)中的表示方法是:單色圖像用一個矩陣來表示;彩色圖像用一組(一般是3個)矩陣來表示,矩陣的行數(shù)稱為圖像的垂直分辨率,列數(shù)稱為圖像的水平分辨率,矩陣中的元素是像素顏色分量的亮度值,使用整數(shù)表示。
一幅M×N的數(shù)字圖像可用矩陣表示為
數(shù)字圖像中的每個像素都對應(yīng)于矩陣中相應(yīng)的元素。把數(shù)字圖像表示成矩陣的優(yōu)點(diǎn)在于,能應(yīng)用矩陣?yán)碚搶D像進(jìn)行分析處理。5.數(shù)字圖像的表示
(a)256級灰度圖象(b)子圖(c)子圖對應(yīng)的量化數(shù)據(jù)
數(shù)字圖像實(shí)例如果看到的都是灰色,怎么辦?NeilHarbisson1.1多媒體的基本概念1.2音頻信息處理基礎(chǔ)1.3圖像信息處理基礎(chǔ)1.4MATALAB在圖像處理中的應(yīng)用第1章多媒體信息處理基礎(chǔ)1.4.1MATALAB簡介1.4.2MATALAB中圖像文件的基本操作1.4.3MATALAB編程實(shí)例1.4MATALAB在圖像處理中的應(yīng)用
Matlab是MatrixLaboratory的縮寫,是當(dāng)今很流行的科學(xué)計(jì)算軟件。信
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 跨平臺整合提高品牌營銷效率的關(guān)鍵
- 2025年02月江蘇宿遷沭陽縣事業(yè)單位公開招聘工作人員103人筆試歷年典型考題(歷年真題考點(diǎn))解題思路附帶答案詳解
- 防火設(shè)備的使用及維護(hù)超市消防器材培訓(xùn)重點(diǎn)
- 浙江國企招聘2024嘉興海寧上塘水務(wù)有限公司高品質(zhì)管道飲用水工作辦公室招聘4人筆試參考題庫附帶答案詳解
- 食品藥品行業(yè)行政法規(guī)的嚴(yán)格性與透明度
- 高中物理1.2時間位移練習(xí)2含解析人教版必修第一冊
- 財(cái)務(wù)軟件報(bào)表制作與數(shù)據(jù)分析技巧
- 跨學(xué)科融合下的學(xué)校與社區(qū)教育合作實(shí)踐研究
- 金融科技背景下的財(cái)務(wù)團(tuán)隊(duì)能力提升
- 財(cái)務(wù)風(fēng)險(xiǎn)管理團(tuán)隊(duì)的組建與培訓(xùn)
- 數(shù)字化消防管理解決方案
- 二類汽修廠汽車維修管理新規(guī)制度匯編
- 人教PEP版英語五年級下冊第四單元全部課件
- 硬筆書法 社團(tuán)教案
- 中國膿毒癥及膿毒性休克急診治療指南
- 工序標(biāo)準(zhǔn)工時及產(chǎn)能計(jì)算表
- 人教版體育與健康四年級-《障礙跑》教學(xué)設(shè)計(jì)
- DB32-T 2860-2015散裝液體化學(xué)品槽車裝卸安全作業(yè)規(guī)范-(高清現(xiàn)行)
- 福利院裝修改造工程施工組織設(shè)計(jì)(225頁)
- 部編版六年級下冊語文課后詞語表(拼音)
- 現(xiàn)代寫作教程筆記
評論
0/150
提交評論