版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第二章數(shù)字圖像識(shí)別技術(shù)2.1數(shù)字圖像信息的基本知識(shí)2.1.1圖像人類傳遞信息渠道:語(yǔ)言文字圖:“圖”是物體透射或反射光的分布,“像”是人的視覺(jué)系統(tǒng)對(duì)圖的接收在大腦中形成的印象或認(rèn)識(shí)。特性:客觀存在的,像是人的感覺(jué),圖像則是二者的結(jié)合,因此,是客觀實(shí)體的原型.包含了巨大的信息量圖像的傳播雖然比語(yǔ)言文字的傳播要復(fù)雜得多,但它能提供比較直觀的模型,這不是語(yǔ)言文字的描述所能達(dá)到的。圖像的產(chǎn)生:
如工程技術(shù)人員以直尺和圓規(guī)來(lái)繪制各種圖紙,美術(shù)家用畫(huà)筆來(lái)復(fù)制客觀世界,電視用畫(huà)面來(lái)反映實(shí)地場(chǎng)景。
識(shí)別:直接由人工或識(shí)別系統(tǒng)識(shí)別:經(jīng)過(guò)處理,改善質(zhì)量或提取出圖像的某些數(shù)據(jù)特征后才能識(shí)別。2.1.2數(shù)字圖像處理發(fā)展概況1.數(shù)字圖像處理(DigitalImageProcessing)含義:
又稱為計(jì)算機(jī)圖像處理,它是指將圖像信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)并利用計(jì)算機(jī)對(duì)其進(jìn)行處理的過(guò)程。2.發(fā)展最早出現(xiàn)于20世紀(jì)50年代:計(jì)算機(jī)來(lái)處理圖形學(xué)科大約形成于20世紀(jì)60年代初期。首次獲得實(shí)際成功應(yīng)用是美國(guó)噴氣推進(jìn)實(shí)驗(yàn)室1972年英國(guó)EMI公司用于頭顱診斷的X射線計(jì)算機(jī)斷層攝影裝置,也就是我們通常所說(shuō)的CT(ComputerTomograph)---1979年,這項(xiàng)無(wú)損傷診斷技術(shù)獲得了諾貝爾獎(jiǎng).從70年代中期開(kāi)始理論和應(yīng)用研究:視覺(jué)計(jì)算理論
左邊是嫦娥一號(hào)衛(wèi)星傳回的第一幅月面圖像。右邊是第一幅月面圖像的飛行效果圖。航天和航空技術(shù)方面的應(yīng)用數(shù)字圖像處理技術(shù)第一幅月面圖像就是我們對(duì)月球的直觀感受和初步認(rèn)識(shí)。一、圖像信息處理基礎(chǔ)知識(shí)2.1.3數(shù)字圖像處理的應(yīng)用12.1.3數(shù)字圖像處理的應(yīng)用“嫦娥一號(hào)”第一幅月面圖像處理的過(guò)程如下:航天和航空技術(shù)方面的應(yīng)用數(shù)字圖像處理技術(shù)遙感和航空測(cè)量遙感:主要用于資源、礦藏勘探、國(guó)土規(guī)劃、高速公路選線、災(zāi)害調(diào)查、農(nóng)作物估產(chǎn)、氣象預(yù)報(bào)以及軍事目標(biāo)監(jiān)視等。氣象衛(wèi)星云圖土地變化監(jiān)測(cè)圖云南省大理州森林火災(zāi)的遙感圖二、數(shù)字圖像處理的應(yīng)用2.1.3數(shù)字圖像處理的應(yīng)用生物醫(yī)學(xué)領(lǐng)域應(yīng)用三維快速血管造影成像頭部CT主要應(yīng)用如X射線層析攝影(CT)、核磁共振(MRI)、超聲成像、血管造影、細(xì)胞和染色體自動(dòng)分類等。這些技術(shù)和設(shè)備大大提高了治療診斷水平,減輕了病人的痛苦。22.1.3數(shù)字圖像處理的應(yīng)用以下是一個(gè)將圖像處理應(yīng)用于臨床醫(yī)學(xué)的例子――CT腦血管醫(yī)學(xué)圖像三維重建。重建的腦血管三維圖像加入對(duì)比劑腦血管掃描圖像依次為第1層,第2層,第3層腦血管腦血管邊緣提取依次為第1層,第2層,第3層腦血管生物醫(yī)學(xué)領(lǐng)域應(yīng)用22.1.3數(shù)字圖像處理的應(yīng)用通信工程常見(jiàn)的數(shù)字圖像和數(shù)字視頻設(shè)備如可視電話、會(huì)議電視、衛(wèi)星電視、數(shù)字電視、高清晰度電視、VCD、DVD等會(huì)議電視終端可視電話衛(wèi)星電視接收器32.1.3數(shù)字圖像處理的應(yīng)用基于H.323標(biāo)準(zhǔn)的遠(yuǎn)程教學(xué)組網(wǎng)圖二、數(shù)字圖像處理的應(yīng)用2.1.3數(shù)字圖像處理的應(yīng)用工業(yè)與交通應(yīng)用該領(lǐng)域的應(yīng)用從70年代起取得了迅速的發(fā)展,主要有產(chǎn)品質(zhì)量檢測(cè)、生產(chǎn)過(guò)程的自動(dòng)控制、CAD/CAM等。檢查瓶裝液體容量是否合格智能交通控制42.1.3數(shù)字圖像處理的應(yīng)用汽車牌照識(shí)別系統(tǒng)圖2.1.3數(shù)字圖像處理的應(yīng)用交通視頻監(jiān)控系統(tǒng)圖2.1.3數(shù)字圖像處理的應(yīng)用軍事公安軍事目標(biāo)的偵察、制導(dǎo)和警戒系統(tǒng)、自動(dòng)滅火器的控制及反偽裝等等都需要用到圖像處理技術(shù);公安部門的現(xiàn)場(chǎng)照片、指紋、虹膜、面部、手跡、印章等的處理和辨識(shí)也要借助圖像處理。導(dǎo)彈制導(dǎo)指紋門鎖52.1.3數(shù)字圖像處理的應(yīng)用虹膜識(shí)別系統(tǒng)框圖二、數(shù)字圖像處理的應(yīng)用2.1.3數(shù)字圖像處理的應(yīng)用生物識(shí)別技術(shù)的重要分支――自動(dòng)指紋識(shí)別系統(tǒng)下圖是指紋圖像預(yù)處理各階段的結(jié)果:指紋原始圖像濾波后圖像二值化圖像細(xì)化圖像二、數(shù)字圖像處理的應(yīng)用2.1.3數(shù)字圖像處理的應(yīng)用機(jī)器視覺(jué)
機(jī)器視覺(jué)主要用于軍事偵察、危險(xiǎn)環(huán)境的自主機(jī)器人,郵政、醫(yī)院和家庭服務(wù)的智能機(jī)器人,裝配線工件識(shí)別、定位,太空機(jī)器人的自動(dòng)操作等。
ASIMO踢球ASIMO上樓梯62.1.3數(shù)字圖像處理的應(yīng)用虛擬現(xiàn)實(shí)當(dāng)人們通過(guò)虛擬現(xiàn)實(shí)瀏覽、觀賞時(shí)就如身臨其境一般,并且可以選擇任一角度,觀看任一范圍內(nèi)的場(chǎng)景或選擇觀看物體的任一角度。虛擬漫游技術(shù)是虛擬現(xiàn)實(shí)(VR)技術(shù)的重要分支,在建筑、旅游、游戲、航空航天、醫(yī)學(xué)等多種行業(yè)發(fā)展很快。VR的相關(guān)設(shè)備72.1.3數(shù)字圖像處理的應(yīng)用故宮VR——《紫禁城?天子的宮殿》中的一景
2.1.3數(shù)字圖像處理的應(yīng)用電腦游戲中的建筑場(chǎng)景漫游2.1.3數(shù)字圖像處理的應(yīng)用2.1.4數(shù)字圖像處理主要研究的內(nèi)容圖像變換圖像編碼壓縮圖像增強(qiáng)和復(fù)原圖像分割圖像描述圖像分類(識(shí)別)(1)圖像變換傅里葉變換、沃爾什變換、離散余弦變換等間接處理技術(shù),將空間域的處理變換為變換域處理。將空間域的圖像通過(guò)變換轉(zhuǎn)換到頻率域
(2)圖像編碼壓縮圖像編碼壓縮技術(shù)可減少描述圖像的數(shù)據(jù)量,以便節(jié)省圖像傳輸、處理時(shí)間和減少所占用的存儲(chǔ)器空間。(3)圖像增強(qiáng)和復(fù)原圖像編碼壓縮技術(shù)可減少描述圖像的數(shù)據(jù)量,以便節(jié)省圖像傳輸、處理時(shí)間和減少所占用的存儲(chǔ)器空間。
彩色圖像增強(qiáng)舉例左圖:原始圖像,細(xì)節(jié)不清晰,偏色右圖:增強(qiáng)后的圖像圖像復(fù)原舉例被正弦噪聲污染的圖像;(b)圖(a)的頻譜;(c)巴特沃斯帶阻濾波器;(d)濾波效果。圖像復(fù)原(4)圖像分割圖像分割是將圖像中有意義的特征部分提取出來(lái),其有意義的特征有圖像中的邊緣、區(qū)域等,這是進(jìn)一步進(jìn)行圖像識(shí)別、分析和理解的基礎(chǔ)。醫(yī)學(xué)圖像處理—銳化影視圖像處理
—由黑白圖像轉(zhuǎn)換的偽彩色圖像(5)圖像描述圖像描述是圖像識(shí)別和理解的必要前提。一般圖像的描述方法采用二維描述,他有邊界描述和區(qū)域描述。(6)圖像識(shí)別圖像分類(識(shí)別)屬于模式識(shí)別的范疇,其主要內(nèi)容是圖像經(jīng)過(guò)某些預(yù)處理后,進(jìn)行圖像分割和特征提取,從而進(jìn)行判決分類。視頻字幕識(shí)別舉例:圖像識(shí)別
圖5-12美國(guó)警方采用圖像識(shí)別系統(tǒng)辨別罪犯,該系統(tǒng)每分鐘以1500萬(wàn)畫(huà)面的速率進(jìn)行面部匹配舉例:人臉識(shí)別2.1.5數(shù)字圖像處理的基本特點(diǎn)信息量大數(shù)字圖像處理占用的頻帶較寬數(shù)字圖像中各個(gè)像素相關(guān)性大主觀性2.1.6數(shù)字圖像處理的優(yōu)點(diǎn)再現(xiàn)性好處理精度高適用面寬靈活性高2.2數(shù)字圖像處理基礎(chǔ)
為了方便地處理數(shù)字圖像,根據(jù)數(shù)字圖像的特性將其分成不同的類型。靜態(tài)圖像可分為矢量(Vector)圖和位圖(Bitmap),位圖也稱為柵格圖像。
矢量圖是用一系列繪圖指令來(lái)表示一幅圖,如AutoCAD中的繪圖語(yǔ)句。這種方法的本質(zhì)是用數(shù)學(xué)(更準(zhǔn)確地說(shuō)是幾何學(xué))公式描述一幅圖像。圖像中每一個(gè)形狀都是一個(gè)完整的公式,稱為一個(gè)對(duì)象。對(duì)象是一個(gè)封閉的整體,所以定義圖像上對(duì)象的變化和對(duì)象與其他對(duì)象的關(guān)系對(duì)計(jì)算機(jī)來(lái)說(shuō)是簡(jiǎn)單的,所有這些變化都不會(huì)影響到圖像中的其他對(duì)象。公式化表示圖像使得矢量圖具有兩個(gè)優(yōu)點(diǎn):一是它的文件數(shù)據(jù)量很?。欢菆D像質(zhì)量與分辨率無(wú)關(guān),這意味著無(wú)論將圖像放大或縮小了多少次,圖像總是以顯示設(shè)備允許的最大清晰度顯示。在計(jì)算機(jī)計(jì)算與顯示一幅圖像時(shí),也往往能看到畫(huà)圖的過(guò)程。但是,矢量圖有一個(gè)明顯的缺點(diǎn),就是不易制作色調(diào)豐富或色彩變化太多的圖像,而且繪出來(lái)的圖像不是很逼真,同時(shí)也不易在不同的軟件間交換文件。
位圖是通過(guò)許多像素點(diǎn)表示一幅圖像,每個(gè)像素具有顏色屬性和位置屬性。位圖可以從傳統(tǒng)的相片、幻燈片上制作出來(lái)或使用數(shù)字相機(jī)得到,也可以利用Windows的畫(huà)筆(Painbrush)用顏色點(diǎn)填充網(wǎng)格單元來(lái)創(chuàng)建位圖。位圖又可以分成如下四種:線畫(huà)稿(LineArt)、灰度圖像(GrayScale)、索引顏色圖像(IndexColor)和真彩色圖像(TrueColor)。
1.線畫(huà)稿
線畫(huà)稿只有黑白兩種顏色,這種形式通常也稱為“黑白藝術(shù)”、“位圖藝術(shù)”、“一位元藝術(shù)”。用掃描儀掃描圖像,當(dāng)設(shè)置成LineArt格式時(shí),掃描儀以一位顏色模式來(lái)看待圖像。若樣點(diǎn)顏色為黑,則掃描儀將相應(yīng)的像素位元置為0,否則置為1。線畫(huà)稿適合于由黑白兩色構(gòu)成而沒(méi)有灰度陰影的圖像。
2.灰度圖像在灰度圖像中,像素灰度級(jí)用8bit表示,所以每個(gè)像素都是介于黑色和白色之間的256(28=256)種灰度中的一種?;叶葓D像只有灰度顏色而沒(méi)有彩色。我們通常所說(shuō)的黑白照片,其實(shí)包含了黑白之間的所有灰度色調(diào)。從技術(shù)上來(lái)說(shuō),就是具有從黑到白的256種灰度色域的單色圖像。不同空間分辨率圖像(灰度級(jí)為8比特)1024×1024;(b)~(f)的原始空間分辨率依次為512×512,256×256,128×128,64×64,32×32像素。(a)453×374,256灰度級(jí)圖像;(b)~(d)保持空間分辨率不變,以灰度級(jí)為128,64和32顯示的圖像(續(xù))(e)~(h)以16,8,4和2灰度級(jí)顯示的圖像
3.索引圖像
在介紹索引圖像之前,我們首先了解PC機(jī)是如何處理顏色的。大多數(shù)掃描儀都是以24位模式對(duì)圖像進(jìn)行采樣,用這種方式獲得的顏色通常稱為RGB顏色。顏色深度為每像素24位的數(shù)字圖像是目前所能獲取、瀏覽和保存的顏色信息最豐富的彩色圖像,由于它所表達(dá)的顏色遠(yuǎn)遠(yuǎn)超出了人眼所能辨別的范圍,故將其稱為“真彩色”。在真彩色出現(xiàn)之前,由于技術(shù)上的原因,計(jì)算機(jī)在處理時(shí)并沒(méi)有達(dá)到每像素24位的真彩色水平,為此人們創(chuàng)造了索引顏色。索引顏色通常也稱為映射顏色,在這種模式下,顏色都是預(yù)先定義的,并且可供選用的一組顏色也很有限,索引顏色的圖像最多只能顯示256種顏色。一幅索引顏色圖像在圖像文件里定義,當(dāng)打開(kāi)該文件時(shí),構(gòu)成該圖像具體顏色的索引值就被讀入程序里,然后根據(jù)索引值找到最終的顏色。
4.真彩色圖像真彩色圖像將像素的色彩能力推向了頂峰?!罢娌噬笔荝GB顏色的另一種流行的叫法。從技術(shù)角度考慮,真彩色是指寫到磁盤上的圖像類型,而RGB顏色是指顯示器的顯示模式。RGB圖像的顏色是非映射的,它可以從系統(tǒng)的“顏色表”里自由獲取所需的顏色,這種圖像文件里的顏色直接與PC機(jī)上的顯示顏色相對(duì)應(yīng)。在真彩色圖像中,每一個(gè)像素由紅、綠和藍(lán)三個(gè)字節(jié)組成,每個(gè)字節(jié)為8bit,表示0到255之間的不同的亮度值,這三個(gè)字節(jié)組合可以產(chǎn)生1670萬(wàn)種不同的顏色。索引圖像、RGB彩色圖像位圖的有關(guān)術(shù)語(yǔ)
1.像素(Pixel)、點(diǎn)(Dot)和樣點(diǎn)(Sample)在計(jì)算機(jī)中,圖像是由顯示器上許多光點(diǎn)組成的,將顯示在顯示器上的這些點(diǎn)(光的單元)稱為像素。像素的分割有不同的方法,實(shí)際常用正方形網(wǎng)格點(diǎn)陣分割方案,這是因?yàn)槠湎袼鼐W(wǎng)格點(diǎn)陣規(guī)范,易于在圖像輸入、輸出設(shè)備上實(shí)現(xiàn)。在計(jì)算機(jī)圖像處理中,還常用到點(diǎn)和樣點(diǎn)這些術(shù)語(yǔ)。像素、點(diǎn)和樣點(diǎn)是在計(jì)算機(jī)上對(duì)不同階段的圖像進(jìn)行度量的稱謂,這幾個(gè)術(shù)語(yǔ)很容易混淆,故特一一做介紹。
首先說(shuō)明樣點(diǎn)和點(diǎn)的概念。掃描一幅圖像時(shí),需設(shè)置掃描儀的分辨率(Resolution),分辨率決定了掃描儀從源圖像里每英寸取多少個(gè)樣點(diǎn)。掃描儀將源圖像看成由大量的網(wǎng)格組成,然后在每一個(gè)網(wǎng)格里取出一點(diǎn),用該點(diǎn)的顏色值來(lái)代表這一網(wǎng)格里所有點(diǎn)的顏色值,這些被選中的點(diǎn)就是樣點(diǎn)。掃描儀的分辨率單位為dpi(每英寸點(diǎn)數(shù)),但激光打印機(jī)的dpi與掃描儀的dpi(樣點(diǎn))是不同的。實(shí)際上,以150dpi分辨率掃描的圖像,它的效果相當(dāng)于激光打印機(jī)的1200dpi的效果。像素并不像“克”和“厘米”那樣是絕對(duì)的度量單位,而是可大可小的。如果獲取圖像時(shí)的分辨率較低(如50dpi),則顯示該圖像時(shí),每英寸所顯示的像素個(gè)數(shù)也很少,這樣就會(huì)使像素變得較大。
2.分辨率1)圖像分辨率
圖像分辨率是指每英寸圖像含有多少個(gè)點(diǎn)或像素,分辨率的單位為dpi。例如,250dpi表示的就是該圖像每英寸含有250個(gè)點(diǎn)或像素。在數(shù)字圖像中,分辨率的大小直接影響到圖像的質(zhì)量。分辨率越高,圖像細(xì)節(jié)越清晰,但產(chǎn)生的文件尺寸大,同時(shí)處理的時(shí)間也就越長(zhǎng),對(duì)設(shè)備的要求也就越高。所以在制作圖像時(shí)要根據(jù)需要來(lái)選擇分辨率。另外,圖像的尺寸、圖像的分辨率和圖像文件的大小三者之間有著密切的聯(lián)系。圖像的尺寸越大,圖像的分辨率越高,圖像文件也就越大。所以,調(diào)整圖像的大小和分辨率即可改變圖像文件的大小。圖一:30ppi 圖二:300ppi 圖三:偽300ppi思考:為什么要用高分辨率的數(shù)碼相機(jī)
2)屏幕分辨率
顯示器上每單位長(zhǎng)度顯示的像素或點(diǎn)的數(shù)量稱為屏幕分辨率。通常以每英寸點(diǎn)數(shù)(ppi)來(lái)表示。屏幕分辨率取決于顯示器的大小及其像素設(shè)置。屏幕分辨率由計(jì)算機(jī)的顯示卡決定,標(biāo)準(zhǔn)的VGA顯示卡的分辨率是640×480,即水平方向640點(diǎn)(像素),垂直方向480點(diǎn)(像素)?,F(xiàn)在高性能的顯示卡已支持2560×1600點(diǎn)以上的分辨率。
3)打印機(jī)分辨率
打印機(jī)分辨率又稱輸出分辨率,是指打印機(jī)輸出圖像時(shí)每英寸的點(diǎn)數(shù)(dpi)。打印機(jī)分辨率也決定了輸出圖像的質(zhì)量,打印機(jī)分辨率越高,可以減少打印的鋸齒邊緣,在灰度的半色調(diào)表現(xiàn)上也會(huì)較為平滑。打印機(jī)的分辨率可達(dá)300dpi,甚至720dpi(需用特殊紙張);而較老機(jī)型的激光打印機(jī)分辨率通常在300~360dpi之間,由于超微細(xì)碳粉技術(shù)的成熟,新的激光打印機(jī)的分辨率可達(dá)600~1200dpi,作為專業(yè)排版輸出已經(jīng)綽綽有余了。
4)掃描儀分辨率
掃描儀分辨率的表示方法與打印機(jī)相類似,一般也用dpi表示,不過(guò)這里的點(diǎn)是樣點(diǎn),與打印機(jī)的輸出點(diǎn)是不同的。一般掃描儀提供的方式是水平分辨率要比垂直分辨率高。臺(tái)式掃描儀的分辨率可以分為光學(xué)分辨率和輸出分辨率。光學(xué)分辨率是指掃描儀硬件所真正掃描到的圖像分辨率,目前市場(chǎng)上的產(chǎn)品,其光學(xué)分辨率可達(dá)800~1200dpi以上。輸出分辨率是通過(guò)軟件強(qiáng)化以及內(nèi)插補(bǔ)點(diǎn)之后產(chǎn)生的分辨率,大約為光學(xué)分辨率的3~4倍。所以當(dāng)你見(jiàn)到號(hào)稱分辨率高達(dá)4800dpi或6400dpi的掃描儀時(shí),這一定指的是輸出分辨率。顯示與文件的對(duì)應(yīng)關(guān)系若圖像分辨率比顯示分辨率高,則顯示出的圖像比實(shí)際圖像大。若圖像分辨率比顯示分辨率低,則顯示出的圖像比實(shí)際圖像小。圖片1:640像素*480像素*72ppi(22.58cm*16.93cm)圖片2:320像素*240像素*36ppi(22.58cm*16.93cm)利用photoshop軟件對(duì)比圖片1和圖片2。(請(qǐng)課后實(shí)驗(yàn)之)2.2.2圖像數(shù)字化技術(shù)圖像處理方法模擬式:原理數(shù)字式:
過(guò)程:采樣量化
1采樣圖像在空間上的離散化稱為采樣。也就是用空間上部分點(diǎn)的灰度值代表圖像,這些點(diǎn)稱為采樣點(diǎn)。由于圖像是一種二維分布的信息,為了對(duì)它進(jìn)行采樣操作,需要先將二維信號(hào)變?yōu)橐痪S信號(hào),再對(duì)一維信號(hào)完成采樣。具體做法是,先沿垂直方向按一定間隔從上到下順序地沿水平方向直線掃描,取出各水平線上灰度值的一維掃描。而后再對(duì)一維掃描線信號(hào)按一定間隔采樣得到離散信號(hào),即先沿垂直方向采樣,再沿水平方向采樣這兩個(gè)步驟完成采樣操作。對(duì)于運(yùn)動(dòng)圖像(即時(shí)間域上的連續(xù)圖像),需先在時(shí)間軸上采樣,再沿垂直方向采樣,最后沿水平方向采樣由這三個(gè)步驟完成。圖5-13圖像采樣就是在水平方向和垂直方向上等間隔地將圖像分割成矩形網(wǎng)狀結(jié)構(gòu)圖5-14不同采樣精度所獲得的圖像分辨率不同對(duì)一幅圖像采樣時(shí),若每行(即橫向)像素為M個(gè),每列(即縱向)像素為N個(gè),則圖像大小為M×N個(gè)像素。在進(jìn)行采樣時(shí),采樣點(diǎn)間隔的選取是一個(gè)非常重要的問(wèn)題,它決定了采樣后圖像的質(zhì)量,即忠實(shí)于原圖像的程度。采樣間隔的大小選取要依據(jù)原圖像中包含的細(xì)微濃淡變化來(lái)決定。一般,圖像中細(xì)節(jié)越多,采樣間隔應(yīng)越小。根據(jù)一維采樣定理,若一維信號(hào)g(t)的最大頻率為ω,以T≤1/2ω為間隔進(jìn)行采樣,則能夠根據(jù)采樣結(jié)果g(iT)(i=…,-1,0,1,…)完全恢復(fù)g(t),即式中圖2-2采樣示意圖2量化模擬圖像經(jīng)過(guò)采樣后,在時(shí)間和空間上離散化為像素。但采樣所得的像素值(即灰度值)仍是連續(xù)量。把采樣后所得的各像素的灰度值從模擬量到離散量的轉(zhuǎn)換稱為圖像灰度的量化。圖2-3(a)說(shuō)明了量化過(guò)程。若連續(xù)灰度值用z來(lái)表示,對(duì)于滿足zi≤z≤zi+1的z值,都量化為整數(shù)qi。qi稱為像素的灰度值,z與qi的差稱為量化誤差。一般,像素值量化后用一個(gè)字節(jié)8bit來(lái)表示。如圖2-3(b)所示,把由黑—灰—白的連續(xù)變化的灰度值,量化為0~255共256級(jí)灰度值,灰度值的范圍為0~255,表示亮度從深到淺,對(duì)應(yīng)圖像中的顏色為從黑到白。圖2-3量化示意圖(a)量化;(b)量化為8bit連續(xù)灰度值量化為灰度級(jí)的方法有兩種,一種是等間隔量化,另一種是非等間隔量化。等間隔量化就是簡(jiǎn)單地把采樣值的灰度范圍等間隔地分割并進(jìn)行量化。對(duì)于像素灰度值在黑—白范圍較均勻分布的圖像,這種量化方法可以得到較小的量化誤差。該方法也稱為均勻量化或線性量化。為了減小量化誤差,引入了非均勻量化的方法。非均勻量化是依據(jù)一幅圖像具體的灰度值分布的概率密度函數(shù),按總的量化誤差最小的原則來(lái)進(jìn)行量化。具體做法是對(duì)圖像中像素灰度值頻繁出現(xiàn)的灰度值范圍,量化間隔取小一些,而對(duì)那些像素灰度值極少出現(xiàn)的范圍,則量化間隔取大一些。由于圖像灰度值的概率分布密度函數(shù)因圖像不同而異,所以不可能找到一個(gè)適用于各種不同圖像的最佳非等間隔量化方案。因此,實(shí)用上一般都采用等間隔量化。3采樣與量化參數(shù)的選擇一幅圖像在采樣時(shí),行、列的采樣點(diǎn)與量化時(shí)每個(gè)像素量化的級(jí)數(shù),既影響數(shù)字圖像的質(zhì)量,也影響到該數(shù)字圖像數(shù)據(jù)量的大小。假定圖像取M×N個(gè)樣點(diǎn),每個(gè)像素量化后的灰度二進(jìn)制位數(shù)為Q,一般Q總是取為2的整數(shù)冪,即Q=2k,則存儲(chǔ)一幅數(shù)字圖像所需的二進(jìn)制位數(shù)b為(2-2)字節(jié)數(shù)B為(2-3)對(duì)一幅圖像,當(dāng)量化級(jí)數(shù)Q一定時(shí),采樣點(diǎn)數(shù)M×N對(duì)圖像質(zhì)量有著顯著的影響。如圖2-4所示,采樣點(diǎn)數(shù)越多,圖像質(zhì)量越好;當(dāng)采樣點(diǎn)數(shù)減少時(shí),圖上的塊狀效應(yīng)就逐漸明顯。同理,當(dāng)圖像的采樣點(diǎn)數(shù)一定時(shí),采用不同量化級(jí)數(shù)的圖像質(zhì)量也不一樣。如圖2-5所示,量化級(jí)數(shù)越多,圖像質(zhì)量越好,當(dāng)量化級(jí)數(shù)越少時(shí),圖像質(zhì)量越差,量化級(jí)數(shù)最小的極端情況就是二值圖像,圖像出現(xiàn)假輪廓。圖2-4不同采樣點(diǎn)數(shù)對(duì)圖像質(zhì)量的影響(a)原始圖像(256×256);(b)采樣圖像1(128×128);(c)采樣圖像2(64×64);(d)采樣圖像3(32×32);(e)采樣圖像4(16×16);(f)采樣圖像5(8×8)圖2-5不同量化級(jí)別對(duì)圖像質(zhì)量的影響(a)原始圖像(256色);(b)量化圖像1(64色);(c)量化圖像2(32色);(d)量化圖像3(16色);(e)量化圖像4(4色);(f)量化圖像5(2色)1973年的夏天,美國(guó)南加州大學(xué)信號(hào)與圖像處理研究所里,年輕的助理教授亞歷山大(AlexanderSawchuk)和研究員威廉(WilliamPratt)低bit量化的偽輪廓現(xiàn)象示意圖低采樣率導(dǎo)致圖像細(xì)節(jié)丟失一般,當(dāng)限定數(shù)字圖像的大小時(shí),為了得到質(zhì)量較好的圖像可采用如下原則:(1)對(duì)緩變的圖像,應(yīng)該細(xì)量化,粗采樣,以避免假輪廓。(2)對(duì)細(xì)節(jié)豐富的圖像,應(yīng)細(xì)采樣,粗量化,以避免模糊(混疊)。對(duì)于彩色圖像,是按照顏色成分——紅(R)、綠(G)、藍(lán)(B)分別采樣和量化的。若各種顏色成分均按8bit量化,即每種顏色量級(jí)別是256,則可以處理256×256×256=16777216種顏色。4圖像數(shù)字化設(shè)備將模擬圖像數(shù)字化成為數(shù)字圖像,需要某種圖像數(shù)字化設(shè)備。常見(jiàn)的數(shù)字化設(shè)備有數(shù)字相機(jī)、掃描儀、數(shù)字化儀等。
1.圖像數(shù)字化設(shè)備的組成如前所述,采樣和量化是數(shù)字化一幅圖像的兩個(gè)基本過(guò)程。即把圖像劃分為若干圖像元素(像素)并給出它們的地址(采樣);度量每一像素的灰度,并把連續(xù)的度量結(jié)果量化為整數(shù)(量化);最后將這些整數(shù)結(jié)果寫入存儲(chǔ)設(shè)備。為完成這些功能,圖像數(shù)字化設(shè)備必須包含以下五個(gè)部分:
(1)采樣孔(Samplingaperture):使數(shù)字化設(shè)備能夠單獨(dú)地觀測(cè)特定的圖像元素而不受圖像其他部分的影響。
(2)圖像掃描機(jī)構(gòu):使采樣孔按照預(yù)先確定的方式在圖像上移動(dòng),從而按順序觀測(cè)每一個(gè)像素。
(3)光傳感器:通過(guò)采樣檢測(cè)圖像的每一像素的亮度,通常采用CCD陣列。
(4)量化器:將傳感器輸出的連續(xù)量轉(zhuǎn)化為整數(shù)值。典型的量化器是A/D轉(zhuǎn)換電路,它產(chǎn)生一個(gè)與輸入電壓或電流成比例的數(shù)值。
(5)輸出存儲(chǔ)裝置:將量化器產(chǎn)生的灰度值按適當(dāng)格式存儲(chǔ)起來(lái),以用于計(jì)算機(jī)后續(xù)處理。
2.圖像數(shù)字化設(shè)備的性能雖然各種數(shù)字化設(shè)備的組成不相同,但可從如下幾個(gè)方面對(duì)其性能進(jìn)行比較。
1)像素大小采樣孔的大小和相鄰像素的間距是兩個(gè)重要的性能指標(biāo)。如果數(shù)字化設(shè)備是在一個(gè)放大率可變的光學(xué)系統(tǒng)上,那么對(duì)應(yīng)于輸入圖像平面上的采樣點(diǎn)大小和采樣間距也是可變的。
2)圖像大小圖像大小即數(shù)字化設(shè)備所允許的最大輸入圖像的尺寸。
3)線性度對(duì)光強(qiáng)進(jìn)行數(shù)字化時(shí),灰度正比于圖像亮度的實(shí)際精確程度是一個(gè)重要的指標(biāo)。非線性的數(shù)字化設(shè)備會(huì)影響后續(xù)過(guò)程的有效性。能將圖像量化為多少級(jí)灰度也是非常重要的參數(shù)。圖像的量化精度經(jīng)歷了早期的黑白二值圖像、灰度圖像及現(xiàn)在的彩色及真彩色圖像。當(dāng)然,量化精度越高,存儲(chǔ)像素信息需要的字節(jié)數(shù)也越大。
4)噪聲數(shù)字化設(shè)備的噪聲水平也是一個(gè)重要的性能參數(shù)。例如,數(shù)字化一幅灰度值恒定的圖像,雖然輸入亮度是一個(gè)常量,但是數(shù)字化設(shè)備中固有的噪聲卻會(huì)使圖像的灰度發(fā)生變化。因此數(shù)字化設(shè)備所產(chǎn)生的噪聲是圖像質(zhì)量下降的根源之一,應(yīng)當(dāng)使噪聲小于圖像內(nèi)的反差點(diǎn)(即對(duì)比度)?;叶葓D像顯示位平面抖動(dòng)技術(shù)2.2.3圖像數(shù)字化設(shè)備的功能圖像輸入設(shè)備主要有:(1)基于CCD光電耦器件的輸入設(shè)備A、攝像機(jī)、數(shù)字?jǐn)z像機(jī)B、數(shù)字相機(jī)C、平板掃描儀基于光電倍增管的輸入設(shè)備
--滾筒掃描儀采樣孔(aperturesampleing)圖像掃描機(jī)構(gòu)光傳感器量化器:A/D轉(zhuǎn)換電路輸出存儲(chǔ)裝置2.2.4數(shù)字圖像的圖像文件格式國(guó)際標(biāo)準(zhǔn):TIF(TagImageFileFormat)、JPEG(JointPhotographer’sExpertsGroup)互聯(lián)網(wǎng)用:GIF(GraphicsInterchangeFormat)、JPEG、PNG印刷用:TIF、JPG、TAG、PCX2.2.4.1BMP圖像文件格式BMP文件結(jié)構(gòu)第一部分為位圖文件頭BITMAPFILEHEADER,它是一個(gè)結(jié)構(gòu)體,其定義如下:
typedefstructtagBITMAPFILEHEADER{WORD bfType;DWORD bfSize;WORD bfReserved1;WORD bfReserved2;DWORD bfOffBits;}BITMAPFILEHEADER;這個(gè)結(jié)構(gòu)的長(zhǎng)度是固定的,為14個(gè)字節(jié)(WORD為無(wú)符號(hào)16位二進(jìn)制整數(shù),DWORD為無(wú)符號(hào)32位二進(jìn)制整數(shù))。第二部分為位圖信息頭BITMAPINFOHEADER,也是一個(gè)結(jié)構(gòu),其定義如下:typedefstructtagBITMAPINFOHEADER{DWORD biSize;LONG biWidth;LONG biHeight;WORD biPlanes;WORD biBitCount;DWORD biCompression;DWORD biSizeImage;LONG biXPelsPerMeter;LONG biYPelsPerMeter;DWORD biClrUsed;DWORD biClrImportant;}BITMAPINFOHEADER;這個(gè)結(jié)構(gòu)的長(zhǎng)度是固定的,為40個(gè)字節(jié)(LONG為32位二進(jìn)制整數(shù))。其中,biCompression的有效值為BI_RGB、BI_RLE8、BI_RLE4、BI_BITFIELDS,這都是一些Windows定義好的常量。由于RLE4和RLE8的壓縮格式用的不多,今后僅討論biCompression的有效值為BI_RGB,即不壓縮的情況。第三部分為調(diào)色板(Palette),當(dāng)然,這里是對(duì)那些需要調(diào)色板的位圖文件而言的。真彩色圖像是不需要調(diào)色板的,BITMAPINFOHEADER后直接是位圖數(shù)據(jù)。調(diào)色板實(shí)際上是一個(gè)數(shù)組,共有biClrUsed個(gè)元素(如果該值為零,則有2的biBitCount次方個(gè)元素)。數(shù)組中每個(gè)元素的類型是一個(gè)RGBQUAD結(jié)構(gòu),占4個(gè)字節(jié),其定義如下:typedefstructtagRGBQUAD{BYTErgbBlue; //該顏色的藍(lán)色分量
BYTErgbGreen; //該顏色的綠色分量
BYTErgbRed; //該顏色的紅色分量
BYTErgbReserved; //保留值}RGBQUAD;第四部分就是實(shí)際的圖像數(shù)據(jù)。對(duì)于用到調(diào)色板的位圖,圖像數(shù)據(jù)就是該像素顏色在調(diào)色板中的索引值,對(duì)于真彩色圖像,圖像數(shù)據(jù)就是實(shí)際的R、G、B值。下面就2色、16色、256色和真彩色位圖分別介紹。對(duì)于2色位圖,用1位就可以表示該像素的顏色(一般0表示黑,1表示白),所以一個(gè)字節(jié)可以表示8個(gè)像素。對(duì)于16色位圖,用4位可以表示一個(gè)像素的顏色,所以一個(gè)字節(jié)可以表示2個(gè)像素。對(duì)于256色位圖,一個(gè)字節(jié)剛好可以表示1個(gè)像素。2.2.4.2其他文件格式
1.TIF圖像文件格式標(biāo)記圖像文件格式TIF(TagImageFileFormat),它是現(xiàn)存圖像文件格式中最復(fù)雜的一種,它提供存儲(chǔ)各種信息的完備的手段,可以存儲(chǔ)專門的信息而不違反格式宗旨,是目前流行的圖像文件交換標(biāo)準(zhǔn)之一。TIF格式文件的設(shè)計(jì)考慮了擴(kuò)展性、方便性和可修改性,因此非常復(fù)雜,要求用更多的代碼來(lái)控制它,結(jié)果導(dǎo)致文件讀寫速度慢,TIF代碼也很長(zhǎng)。TIF文件由文件頭、參數(shù)指針表與參數(shù)域、參數(shù)數(shù)據(jù)表和圖像數(shù)據(jù)4部分組成。如表2-2~表2-4所示。1)文件頭表2-2TIF文件文件頭結(jié)構(gòu)2)參數(shù)指針表2-3TIF文件參數(shù)指針表由一個(gè)2字節(jié)的整數(shù)和其后的一系列12字節(jié)參數(shù)域構(gòu)成,最后以一個(gè)長(zhǎng)整型數(shù)結(jié)束。若最后的長(zhǎng)整型數(shù)為0,表示文件的參數(shù)指針表到此為至,否則該長(zhǎng)整數(shù)為指向下一個(gè)參數(shù)指針表的偏移。3)參數(shù)塊結(jié)構(gòu)表2-4TIF文件參數(shù)塊結(jié)構(gòu)TIFF文件格式
2.GIF圖像文件格式
CompuServe開(kāi)發(fā)的圖形交換文件格式GIF(GraphicsInterchangeFormat),目的是在不同的系統(tǒng)平臺(tái)上交流和傳輸圖像。它是在Web及其他聯(lián)機(jī)服務(wù)上常用的一種文件格式,用于超文本標(biāo)記語(yǔ)言(HTML)文檔中的索引顏色圖像,但圖像最大不能超過(guò)64M,顏色最多為256色。GIF圖像文件采取LZW壓縮算法,存儲(chǔ)效率高,支持多幅圖像定序或覆蓋,交錯(cuò)多屏幕繪圖以及文本覆蓋。GIF主要是為數(shù)據(jù)流而設(shè)計(jì)的一種傳輸格式,而不是作為文件的存儲(chǔ)格式。換句話說(shuō),它具有順序的組織形式。GIF有五個(gè)主要部分以固定順序出現(xiàn),所有部分均由一個(gè)或多個(gè)塊(block)組成。每個(gè)塊第一個(gè)字節(jié)中存放標(biāo)識(shí)碼或特征碼標(biāo)識(shí)。這些部分的順序?yàn)椋何募?biāo)志塊、邏輯屏幕描述塊、可選的“全局”色彩表塊(調(diào)色板)、各圖像數(shù)據(jù)塊(或?qū)S玫膲K)以及尾塊(結(jié)束碼)。GIF圖像文件格式如表2-5所示。GIF文件格式
3.PCX文件
PCX文件格式由ZSoft公司設(shè)計(jì),最早使用的圖像文件格式之一,由各種掃描儀掃描得到的圖像幾乎都能保存成PCX格式。PCX支持256種顏色,不如TARGA或TIF等格式功能強(qiáng),但結(jié)構(gòu)較簡(jiǎn)單,存取速度快,壓縮比適中,適合于一般軟件的使用。
PCX格式常用于IBMPC兼容計(jì)算機(jī)。大多數(shù)PC軟件支持PCX格式的第5版。第3版文件使用標(biāo)準(zhǔn)的VGA調(diào)色板,不支持自定義調(diào)色板。
PCX格式支持RGB、索引顏色、灰度和位圖顏色模式,但不支持alpha通道。PCX支持RLE壓縮方法,圖像顏色的位數(shù)可以是1、4、8或24。
PCX圖像文件由三個(gè)部分組成:文件頭、圖像數(shù)據(jù)和256色調(diào)色板。PCX的文件頭有128個(gè)字節(jié),它包括版本號(hào),被打印或掃描的圖像的分辨率(dpi)及大小(單位為像素),每掃描行的字節(jié)數(shù),每像素包含的位數(shù)據(jù)和彩色平
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年版房地產(chǎn)買賣合同模板
- 2024年港口疏浚及堤壩修建合同3篇
- 勞動(dòng)合同書(shū)電子版
- 水甲苯精餾塔課程設(shè)計(jì)
- 插班課程設(shè)計(jì)案例分析
- 管道課程設(shè)計(jì)小結(jié)
- 航空物流課程設(shè)計(jì)
- 航天研學(xué)課程設(shè)計(jì)
- 烘焙網(wǎng)絡(luò)營(yíng)銷課程設(shè)計(jì)
- 機(jī)械小車課程設(shè)計(jì)
- 中國(guó)鋁業(yè)股份有限公司河南分公司鞏義市山川鋁土礦礦山地質(zhì)環(huán)境保護(hù)與土地復(fù)墾方案
- 工商企業(yè)管理畢業(yè)論文范文六篇
- 二十五項(xiàng)反措檢查表優(yōu)質(zhì)資料
- 保密辦主任工作總結(jié)保密辦主任工作總結(jié)八篇
- 新生兒沐浴及撫觸護(hù)理
- 機(jī)械原理課程設(shè)計(jì)-壓床機(jī)構(gòu)的設(shè)計(jì)
- 教學(xué)案例 英語(yǔ)教學(xué)案例 市賽一等獎(jiǎng)
- 四川省2023職教高考英語(yǔ)試題
- JJG 913-2015浮標(biāo)式氧氣吸入器
- GB/T 12190-2006電磁屏蔽室屏蔽效能的測(cè)量方法
- 2020年貴州專升本高等數(shù)學(xué)真題及答案
評(píng)論
0/150
提交評(píng)論