圖像處理綜述_第1頁(yè)
圖像處理綜述_第2頁(yè)
圖像處理綜述_第3頁(yè)
圖像處理綜述_第4頁(yè)
圖像處理綜述_第5頁(yè)
已閱讀5頁(yè),還剩58頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

圖像處理綜述第一頁(yè),共六十三頁(yè),編輯于2023年,星期五1.1數(shù)字圖像處理及其特點(diǎn)1.1.1數(shù)字圖像與數(shù)字圖像處理1.數(shù)字圖像用計(jì)算機(jī)進(jìn)行圖像處理的前提是圖像必須以數(shù)字格式存儲(chǔ),我們把以數(shù)字格式存放的圖像稱(chēng)之為數(shù)字圖像。常見(jiàn)的各種照片、圖片、海報(bào)、廣告畫(huà)等均屬模擬圖像,要將模擬圖像數(shù)字化后生成數(shù)字圖像,需要利用數(shù)字化設(shè)備。目前,將模擬圖像數(shù)字化的主要設(shè)備是掃描儀,將視頻畫(huà)面數(shù)字化的設(shè)備有圖像采集卡。當(dāng)然,也可以利用數(shù)碼照相機(jī)直接拍攝以數(shù)字格式存放的數(shù)字圖像。模擬圖像經(jīng)掃描儀進(jìn)行數(shù)字化或由數(shù)碼照相機(jī)拍攝的自然景物圖像,在計(jì)算機(jī)中均是以數(shù)字格式存儲(chǔ)的。既然是數(shù)字,計(jì)算機(jī)當(dāng)然可以方便地進(jìn)行各種處理,以達(dá)到視覺(jué)效果和特殊效果。第二頁(yè),共六十三頁(yè),編輯于2023年,星期五

在計(jì)算機(jī)中,圖像被分割成圖1-1所示的像素(Pixel),各像素的灰度值用整數(shù)表示。一幅M×N個(gè)像素的數(shù)字圖像,其像素灰度值可以用M行、N列的矩陣G表示:(1-1)第三頁(yè),共六十三頁(yè),編輯于2023年,星期五圖1-1數(shù)字圖像第四頁(yè),共六十三頁(yè),編輯于2023年,星期五

2.數(shù)字圖像處理

1)數(shù)字圖像處理數(shù)字計(jì)算機(jī)最擅長(zhǎng)的莫過(guò)于處理各種數(shù)據(jù),數(shù)字化后的圖像可以看成是存儲(chǔ)在計(jì)算機(jī)中的有序數(shù)據(jù),當(dāng)然可以通過(guò)計(jì)算機(jī)對(duì)數(shù)字圖像進(jìn)行處理。我們把利用計(jì)算機(jī)對(duì)圖像進(jìn)行去除噪聲、增強(qiáng)、復(fù)原、分割、提取特征等的理論、方法和技術(shù)稱(chēng)為數(shù)字圖像處理(DigitalImageProcessing)。一般,圖像處理是用計(jì)算機(jī)和實(shí)時(shí)硬件實(shí)現(xiàn)的,因此也稱(chēng)之為計(jì)算機(jī)圖像處理(ComputerImageProcessing)。第五頁(yè),共六十三頁(yè),編輯于2023年,星期五

在日常生活中,圖像處理已經(jīng)得到廣泛應(yīng)用。例如,電腦人像藝術(shù),電視中的特殊效果,自動(dòng)售貨機(jī)鈔票的識(shí)別,郵政編碼的自動(dòng)識(shí)別和利用指紋、虹膜、面部等特征的身份識(shí)別等。在醫(yī)學(xué)領(lǐng)域,很早以前就采用X射線(xiàn)透視、顯微鏡照片等來(lái)診斷疾病?,F(xiàn)在,計(jì)算機(jī)圖像處理已成為疾病診斷的重要手段,用一般攝影方法不能獲取的身體內(nèi)部的狀況,也能由特殊的圖像處理裝置獲取,最具有代表性的就是X射線(xiàn)CT(ComputedTomograph,計(jì)算機(jī)斷層攝像)。第六頁(yè),共六十三頁(yè),編輯于2023年,星期五

2)數(shù)字圖像處理的重要意義數(shù)字圖像處理的產(chǎn)生和迅速發(fā)展主要受如下三個(gè)方面的影響。一是計(jì)算機(jī)的發(fā)展。早期的計(jì)算機(jī)無(wú)論在計(jì)算速度或存儲(chǔ)容量方面,難于滿(mǎn)足對(duì)龐大圖像數(shù)據(jù)進(jìn)行實(shí)時(shí)處理的要求。隨著計(jì)算機(jī)硬件技術(shù)及數(shù)字化技術(shù)的發(fā)展,計(jì)算機(jī)、內(nèi)存及外圍設(shè)備的價(jià)格急劇下降,而其性能卻有了大幅度的提高。過(guò)去只能用大型計(jì)算機(jī)完成的龐大處理,現(xiàn)在,在個(gè)人計(jì)算機(jī)(PC機(jī))上也能夠輕而易舉地實(shí)現(xiàn)。二是數(shù)學(xué)的發(fā)展,特別是離散數(shù)學(xué)理論的創(chuàng)立和完善,為數(shù)字圖像處理奠定了理論基礎(chǔ)。第七頁(yè),共六十三頁(yè),編輯于2023年,星期五

三是軍事、醫(yī)學(xué)和工業(yè)等方面應(yīng)用需求的不斷增長(zhǎng)。自20世紀(jì)20年代,圖像處理首次應(yīng)用于改善倫敦和紐約之間海底電纜發(fā)送的圖片質(zhì)量以來(lái),經(jīng)過(guò)幾十年的研究與發(fā)展,數(shù)字圖像處理的理論和方法進(jìn)一步完善,應(yīng)用范圍更加廣闊,已經(jīng)成為一門(mén)新興的學(xué)科,并在向更高級(jí)的方向發(fā)展。如在景物理解和計(jì)算機(jī)視覺(jué)(機(jī)器視覺(jué))方面,圖像處理已由二維處理發(fā)展到三維理解或解釋。特別是在景物理解和機(jī)器視覺(jué)方面,圖像也已由二維處理變成三維解釋。近幾年來(lái),隨著計(jì)算機(jī)和各個(gè)相關(guān)領(lǐng)域研究的迅速發(fā)展,科學(xué)計(jì)算可視化、多媒體技術(shù)等研究和應(yīng)用的興起,數(shù)字圖像處理從一個(gè)專(zhuān)門(mén)領(lǐng)域的學(xué)科,變成了一種新型的科學(xué)研究和人機(jī)界面的工具。第八頁(yè),共六十三頁(yè),編輯于2023年,星期五1.1.2數(shù)字圖像處理的特點(diǎn)數(shù)字圖像處理是利用計(jì)算機(jī)的計(jì)算,實(shí)現(xiàn)與光學(xué)系統(tǒng)模擬處理相同效果的過(guò)程。數(shù)字圖像處理具有如下特點(diǎn):(1)處理精度高,再現(xiàn)性好。利用計(jì)算機(jī)進(jìn)行圖像處理,其實(shí)質(zhì)是對(duì)圖像數(shù)據(jù)進(jìn)行各種運(yùn)算。由于計(jì)算機(jī)技術(shù)的飛速發(fā)展,計(jì)算精度和計(jì)算的正確性勿庸置疑;另外,對(duì)同一圖像用相同的方法處理多次,也可得到完全相同的效果,具有良好的再現(xiàn)性。(3)處理的多樣性。由于圖像處理是通過(guò)運(yùn)行程序進(jìn)行的,因此,設(shè)計(jì)不同的圖像處理程序,可以實(shí)現(xiàn)各種不同的處理目的。第九頁(yè),共六十三頁(yè),編輯于2023年,星期五

(4)圖像數(shù)據(jù)量龐大。圖像中包含有豐富的信息,可以通過(guò)圖像處理技術(shù)獲取圖像中包含的有用的信息,但是,數(shù)字圖像的數(shù)據(jù)量巨大。一幅數(shù)字圖像是由圖像矩陣中的像素(Pixel)組成的,通常每個(gè)像素用紅、綠、藍(lán)三種顏色表示,每種顏色用8bit表示灰度級(jí)。則一幅1024×1024不經(jīng)壓縮的真彩色圖像,數(shù)據(jù)量達(dá)3MB(即1024×1024×8bit×3=24Mb)。X射線(xiàn)照片一般用64~256Kb的數(shù)據(jù)量,一幅遙感圖像為3240×2340×4=30Mb。如此龐大的數(shù)據(jù)量給存儲(chǔ)、傳輸和處理都帶來(lái)巨大的困難。如果精度及分辨率再提高,所需處理時(shí)間將大幅度增加。第十頁(yè),共六十三頁(yè),編輯于2023年,星期五

(5)處理費(fèi)時(shí)。由于圖像數(shù)據(jù)量大,因此處理比較費(fèi)時(shí)。特別是處理結(jié)果與中心像素鄰域有關(guān)的處理過(guò)程(如第四章介紹的區(qū)處理方法)花費(fèi)時(shí)間更多。(6)圖像處理技術(shù)綜合性強(qiáng)。數(shù)字圖像處理涉及的技術(shù)領(lǐng)域相當(dāng)廣泛,如通信技術(shù)、計(jì)算機(jī)技術(shù)、電子技術(shù)、電視技術(shù)等,當(dāng)然,數(shù)學(xué)、物理學(xué)等領(lǐng)域更是數(shù)字圖像處理的基礎(chǔ)。第十一頁(yè),共六十三頁(yè),編輯于2023年,星期五1.2數(shù)字圖像處理的目的和主要內(nèi)容1.2.1數(shù)字圖像處理的目的一般而言,對(duì)圖像進(jìn)行加工和分析主要有如下三方面的目的:(1)提高圖像的視感質(zhì)量,以達(dá)到賞心悅目的目的。如去除圖像中的噪聲,改變圖像的亮度、顏色,增強(qiáng)圖像中的某些成份、抑制某些成份,對(duì)圖像進(jìn)行幾何變換等,從而改善圖像的質(zhì)量,以達(dá)到或真實(shí)的、或清晰的、或色彩豐富的、或意想不到的藝術(shù)效果。第十二頁(yè),共六十三頁(yè),編輯于2023年,星期五

(2)提取圖像中所包含的某些特征或特殊信息,以便于計(jì)算機(jī)分析,例如,常用作模式識(shí)別、計(jì)算機(jī)視覺(jué)的預(yù)處理等。這些特征包括很多方面,如頻域特性、灰度/顏色特性、邊界/區(qū)域特性、紋理特性、形狀/拓?fù)涮匦砸约瓣P(guān)系結(jié)構(gòu)等。(3)對(duì)圖像數(shù)據(jù)進(jìn)行變換、編碼和壓縮,以便于圖像的存儲(chǔ)和傳輸。第十三頁(yè),共六十三頁(yè),編輯于2023年,星期五1.2.2數(shù)字圖像處理的主要內(nèi)容不管圖像處理是何種目的,都需要用計(jì)算機(jī)圖像處理系統(tǒng)對(duì)圖像數(shù)據(jù)進(jìn)行輸入、加工和輸出,因此數(shù)字圖像處理研究的內(nèi)容主要有以下7個(gè)過(guò)程。

1.圖像獲取、表示和表現(xiàn)(ImageAcquisition,RepresentationandPresentation)該過(guò)程主要是把模擬圖像信號(hào)轉(zhuǎn)化為計(jì)算機(jī)所能接受的數(shù)字形式,以及把數(shù)字圖像顯示和表現(xiàn)出來(lái)(如打印)。這一過(guò)程主要包括攝取圖像、光電轉(zhuǎn)換及數(shù)字化等幾個(gè)步驟。第十四頁(yè),共六十三頁(yè),編輯于2023年,星期五

2.圖像復(fù)原(ImageRestoration)當(dāng)造成圖像退化(圖像品質(zhì)下降)的原因已知時(shí),復(fù)原技術(shù)可以對(duì)圖像進(jìn)行校正。圖像復(fù)原最關(guān)鍵的是對(duì)每種退化都需要有一個(gè)合理的模型。例如,掌握了聚焦不良成像系統(tǒng)的物理特性,便可建立復(fù)原模型,而且對(duì)獲取圖像的特定光學(xué)系統(tǒng)的直接測(cè)量也是可能的。退化模型和特定數(shù)據(jù)一起描述了圖像的退化,因此,復(fù)原技術(shù)是基于模型和數(shù)據(jù)的圖像恢復(fù),其目的是消除退化的影響,從而產(chǎn)生一個(gè)等價(jià)于理想成像系統(tǒng)所獲得的圖像。第十五頁(yè),共六十三頁(yè),編輯于2023年,星期五3.圖像增強(qiáng)(ImageEnhancement)圖像增強(qiáng)是對(duì)圖像質(zhì)量在一般意義上的改善。當(dāng)無(wú)法知道圖像退化有關(guān)的定量信息時(shí),可以使用圖像增強(qiáng)技術(shù)較為主觀地改善圖像的質(zhì)量。所以,圖像增強(qiáng)技術(shù)是用于改善圖像視感質(zhì)量所采取的一種方法。因?yàn)樵鰪?qiáng)技術(shù)并非是針對(duì)某種退化所采取的方法,所以很難預(yù)測(cè)哪一種特定技術(shù)是最好的,只能通過(guò)試驗(yàn)和分析誤差來(lái)選擇一種合適的方法。有時(shí)可能需要徹底改變圖像的視覺(jué)效果,以便突出重要特征的可觀察性,使人或計(jì)算機(jī)更易觀察或檢測(cè)。在這種情況下,可以把增強(qiáng)理解為增強(qiáng)感興趣特征的可檢測(cè)性,而非改善視感質(zhì)量。電視節(jié)目片頭或片尾處的顏色、輪廓等的變換,其目的是得到一種特殊的藝術(shù)效果,增強(qiáng)動(dòng)感和力度。第十六頁(yè),共六十三頁(yè),編輯于2023年,星期五

4.圖像分割(ImageSegmentation)把圖像分成區(qū)域的過(guò)程就是圖像分割。圖像中通常包含多個(gè)對(duì)象,例如,一幅醫(yī)學(xué)圖像中顯示出正常的或有病變的各種器官和組織。圖像處理為達(dá)到識(shí)別和理解的目的,幾乎都必須按照一定的規(guī)則將圖像分割成區(qū)域,每個(gè)區(qū)域代表被成像的一個(gè)物體(或部分)。圖像自動(dòng)分割是圖像處理中最困難的問(wèn)題之一。人類(lèi)視覺(jué)系統(tǒng)的優(yōu)越性,使得人類(lèi)能夠?qū)⑺^察的復(fù)雜場(chǎng)景中的對(duì)象分開(kāi),并識(shí)別出每個(gè)物體。但對(duì)計(jì)算機(jī)來(lái)說(shuō),這卻是一個(gè)難題。目前,大部分圖像的自動(dòng)分割還需要人工提供必需的信息來(lái)幫助,只有一部分領(lǐng)域(如印刷字符自動(dòng)識(shí)別(OCR)、指紋識(shí)別等)開(kāi)始使用。由于解決和分割有關(guān)的基本問(wèn)題是特定領(lǐng)域中圖像分析實(shí)用化的關(guān)鍵一步,因此,將各種方法融合在一起并使用知識(shí)來(lái)提高處理的可靠性和有效性是圖像分割的研究熱點(diǎn)。第十七頁(yè),共六十三頁(yè),編輯于2023年,星期五

5.圖像分析圖像處理應(yīng)用的目標(biāo)幾乎均涉及到圖像分析,即對(duì)圖像中的不同對(duì)象進(jìn)行分割、特征提取和表示,從而有利于計(jì)算機(jī)對(duì)圖像進(jìn)行分類(lèi)、識(shí)別和理解。在工業(yè)產(chǎn)品零件無(wú)缺陷且正確裝配檢測(cè)中,圖像分析是對(duì)圖像中的像素轉(zhuǎn)化成一個(gè)“合格”或“不合格"的判定。在有的應(yīng)用中,如醫(yī)學(xué)圖像處理,不僅要檢測(cè)出物體(如腫瘤)的存在,而且還要檢查物體的大小。第十八頁(yè),共六十三頁(yè),編輯于2023年,星期五

6.圖像重建圖像重建與上述的圖像增強(qiáng)、圖像復(fù)原等不同。圖像增強(qiáng)、圖像復(fù)原的輸入是圖像,處理后輸出的結(jié)果也是圖像,而圖像重建是指從數(shù)據(jù)到圖像的處理,即輸入的是某種數(shù)據(jù),而經(jīng)過(guò)處理后得到的結(jié)果是圖像,CT就是圖像重建處理的典型應(yīng)用實(shí)例。目前,圖像重建與計(jì)算機(jī)圖形學(xué)相結(jié)合,把多個(gè)二維圖像合成三維圖像,并加以光照模型和各種渲染技術(shù),能生成各種具有強(qiáng)烈真實(shí)感的高質(zhì)量圖像。第十九頁(yè),共六十三頁(yè),編輯于2023年,星期五

7.圖像壓縮編碼數(shù)字圖像的特點(diǎn)之一是數(shù)據(jù)量龐大。盡管現(xiàn)在有大容量的存貯器,但仍不能滿(mǎn)足對(duì)圖像數(shù)據(jù)(尤其是動(dòng)態(tài)圖像、高分辨率圖像)處理的需要,因此在實(shí)際應(yīng)用中圖像壓縮是必需的。如果數(shù)據(jù)不壓縮,則在存儲(chǔ)和傳輸中就需要占很大的容量和帶寬,因而增加了成本。圖像壓縮的目的就是壓縮數(shù)據(jù)量。第二十頁(yè),共六十三頁(yè),編輯于2023年,星期五

圖像編碼主要是利用圖像信號(hào)的統(tǒng)計(jì)特性及人類(lèi)視覺(jué)的生理學(xué)及心理學(xué)特性,對(duì)圖像信號(hào)進(jìn)行高效編碼,即研究數(shù)據(jù)壓縮技術(shù),目的是在保證圖像質(zhì)量的前提下壓縮數(shù)據(jù),便于存儲(chǔ)和傳輸,以解決數(shù)據(jù)量大的矛盾。一般來(lái)說(shuō),圖像編碼的目的有三個(gè):①減少數(shù)據(jù)存儲(chǔ)量;②降低數(shù)據(jù)率以減少傳輸帶寬;③壓縮信息量,便于特征提取,為后續(xù)識(shí)別作準(zhǔn)備。第二十一頁(yè),共六十三頁(yè),編輯于2023年,星期五

從編碼技術(shù)發(fā)展來(lái)看,Kunt提出第一代、第二代編碼的概念。第一代編碼是以去除冗余為基礎(chǔ)的編碼方法,如PCM、DPCM、ΔM、亞取樣編碼法、DFT、DCT、W-H變換編碼法以及以此為基礎(chǔ)的混合編碼法。第二代編碼法多為20世紀(jì)80年代以后提出的,如金字塔編碼法、Fractal編碼法、小波變換編碼法、基于神經(jīng)網(wǎng)絡(luò)的編碼法、模型基編碼法等。這些編碼方法有如下特點(diǎn):①充分考慮人的視覺(jué)特性;②恰當(dāng)?shù)乜紤]對(duì)圖像信號(hào)的分解與表述;③采用圖像的合成與識(shí)別方案壓縮數(shù)據(jù)。第二十二頁(yè),共六十三頁(yè),編輯于2023年,星期五1.3圖像工程與相關(guān)學(xué)科1.3.1圖像工程的內(nèi)涵圖像工程的內(nèi)容非常豐富,根據(jù)抽象程度和研究方法等的不同,可分為圖像處理、圖像分析和圖像理解三個(gè)層次,如圖1-2所示。換句話(huà)說(shuō),圖像工程是既有聯(lián)系又有區(qū)別的圖像處理、圖像分析及圖像理解三者的有機(jī)結(jié)合,另外還包括它們的工程應(yīng)用。第二十三頁(yè),共六十三頁(yè),編輯于2023年,星期五圖1-2圖像工程三層次示意圖第二十四頁(yè),共六十三頁(yè),編輯于2023年,星期五

2.圖像分析圖像分析主要是對(duì)圖像中感興趣的目標(biāo)進(jìn)行檢測(cè)和測(cè)量,以獲得它們的客觀信息,從而建立對(duì)圖像的描述。如果說(shuō)圖像處理是一個(gè)從圖像到圖像的過(guò)程,則圖像分析就是一個(gè)從圖像到數(shù)據(jù)的過(guò)程。這里的數(shù)據(jù)可以是目標(biāo)特征的測(cè)量結(jié)果,或是基于測(cè)量的符號(hào)表示,它們描述了目標(biāo)的特點(diǎn)和性質(zhì)。第二十五頁(yè),共六十三頁(yè),編輯于2023年,星期五

3.圖像理解圖像理解的重點(diǎn)是在圖像分析的基礎(chǔ)上,進(jìn)一步研究圖像中各目標(biāo)的性質(zhì)和它們之間的相互聯(lián)系,并得出對(duì)圖像內(nèi)容含義的理解以及對(duì)原來(lái)客觀場(chǎng)景的解釋?zhuān)瑥亩笇?dǎo)決策。如果說(shuō)圖像分析主要是以觀察者為中心研究客觀世界,那么圖像理解在一定程度上就是以客觀世界為中心,借助知識(shí)、經(jīng)驗(yàn)等來(lái)把握整個(gè)客觀世界(包括沒(méi)有直接觀察到的事物)。第二十六頁(yè),共六十三頁(yè),編輯于2023年,星期五

可見(jiàn),圖像處理、圖像分析和圖像理解是處在三個(gè)抽象程度和數(shù)據(jù)量各有特點(diǎn)的不同層次上。圖像處理是比較低層的操作,它主要在圖像像素級(jí)上進(jìn)行處理,處理的數(shù)據(jù)量非常大。圖像分析則進(jìn)入了中層,分割和特征提取把原來(lái)以像素描述的圖像轉(zhuǎn)變成比較簡(jiǎn)潔的非圖像形式的描述。圖像理解主要是高層操作,基本上是對(duì)從描述抽象出來(lái)的符號(hào)進(jìn)行運(yùn)算,其處理過(guò)程和方法與人類(lèi)的思維推理有許多類(lèi)似之處。根據(jù)本課程的任務(wù)和目標(biāo),本書(shū)重點(diǎn)放在圖像處理上,并學(xué)習(xí)圖像分析的基本理論和方法。第二十七頁(yè),共六十三頁(yè),編輯于2023年,星期五1.3.2相關(guān)學(xué)科和領(lǐng)域圖像工程是一門(mén)系統(tǒng)地研究各種圖像理論、技術(shù)和應(yīng)用的交叉學(xué)科。從它的研究方法來(lái)看,它可以與數(shù)學(xué)、物理學(xué)、生理學(xué)、心理學(xué)、電子學(xué)、計(jì)算機(jī)科學(xué)等許多學(xué)科相互借鑒。從它的研究范圍來(lái)看,它與模式識(shí)別、計(jì)算機(jī)視覺(jué)、計(jì)算機(jī)圖形學(xué)等多個(gè)專(zhuān)業(yè)互相交叉。另外,圖像工程的研究進(jìn)展與人工智能、神經(jīng)網(wǎng)絡(luò)、遺傳算法、模糊邏輯等理論和技術(shù)都有密切的聯(lián)系,它的發(fā)展應(yīng)用與醫(yī)學(xué)、遙感、通信、文檔處理和工業(yè)自動(dòng)化等許多領(lǐng)域也是密不可分的。第二十八頁(yè),共六十三頁(yè),編輯于2023年,星期五

圖像工程與計(jì)算機(jī)圖形學(xué)(ComputerGraphics)、模式識(shí)別(PatternRecognition)、計(jì)算機(jī)視覺(jué)(ComputerVision)等的關(guān)系如圖1[CD*2]3所示。計(jì)算機(jī)圖形學(xué)研究的是用計(jì)算機(jī)技術(shù)生成圖形的理論、方法和技術(shù),即由非圖像形式的數(shù)據(jù)描述來(lái)生成逼真的圖像。它可以生成現(xiàn)實(shí)世界中已經(jīng)存在的物體的圖形,也可以生成虛構(gòu)物體的圖形,它和圖像分析的對(duì)象和輸出結(jié)果正好對(duì)調(diào)。圖像模式識(shí)別與圖像分析則比較相似,只是前者試圖把圖像分解成可用符號(hào)較抽象地描述的類(lèi)別。計(jì)算機(jī)視覺(jué)主要強(qiáng)調(diào)用計(jì)算機(jī)實(shí)現(xiàn)人的視覺(jué)功能,要用到圖像工程三個(gè)層次的許多技術(shù),但目前的研究?jī)?nèi)容主要與圖像理解相結(jié)合。第二十九頁(yè),共六十三頁(yè),編輯于2023年,星期五圖1-3圖像工程與相關(guān)學(xué)科的聯(lián)系和區(qū)別第三十頁(yè),共六十三頁(yè),編輯于2023年,星期五1.4數(shù)字圖像處理系統(tǒng)1.4.1數(shù)字圖像處理系統(tǒng)硬件早期的數(shù)字圖像處理系統(tǒng)為了提高處理速度、增加容量都采用大型機(jī)。隨著計(jì)算機(jī)性?xún)r(jià)比(性能價(jià)格比)日新月異的提高,以小型機(jī)為主的微型圖像處理系統(tǒng)得到發(fā)展。主機(jī)為PC機(jī),配以圖像采集卡及顯示設(shè)備就構(gòu)成了最基本的微型圖像處理系統(tǒng)。目前,國(guó)產(chǎn)的CA540、VP32、FGCT11010N8、CA-CPE-1000、CA-CPE-3000等圖像板研制成功并已商品化。微型圖像處理系統(tǒng)成本低、應(yīng)用靈活、便于推廣。特別是微型計(jì)算機(jī)的性能逐年提高,使得微型圖像處理系統(tǒng)的性能也不斷升級(jí),加之軟件配置豐富,使其更具實(shí)用意義。第三十一頁(yè),共六十三頁(yè),編輯于2023年,星期五圖1-4圖像處理系統(tǒng)示意圖第三十二頁(yè),共六十三頁(yè),編輯于2023年,星期五

1)電視攝像機(jī)(VideoCamera)

電視攝像機(jī)是目前使用最廣泛的圖像獲取設(shè)備。電視攝像機(jī)的核心部件是光電轉(zhuǎn)換裝置,也稱(chēng)為固態(tài)陣。目前大多數(shù)感光基元多為電荷耦合器件CCD(ChargeCoupledDevice),CCD可以將照射在其上的光信號(hào)轉(zhuǎn)換為對(duì)應(yīng)的電信號(hào)。該設(shè)備小巧、速度快、成本低、靈敏度高,多作為實(shí)時(shí)圖像輸入設(shè)備應(yīng)用。但灰度層次較差、非線(xiàn)性失真較大、有黑斑效應(yīng),在使用中需要校正。目前,CCD攝像機(jī)可達(dá)1920×1035的高分辨率,快門(mén)速度可達(dá)10-4s。第三十三頁(yè),共六十三頁(yè),編輯于2023年,星期五

2)掃描儀(Scanner)掃描儀是將各種形式的圖像信息(如圖片、照片、膠片及文稿資料等)輸入計(jì)算機(jī)的重要工具,特點(diǎn)是精度和分辨率高。目前,1200DPI(DotPerInch)以上精度的掃描儀很常見(jiàn)。而且掃描儀的成本很低,一臺(tái)平板式掃描儀的價(jià)格在千元左右。由于掃描儀良好的精度和低廉的價(jià)格,已成為當(dāng)今應(yīng)用最為廣泛的圖像數(shù)字化設(shè)備。但用掃描儀獲取圖像信息速度較慢,不能實(shí)現(xiàn)實(shí)時(shí)輸入。第三十四頁(yè),共六十三頁(yè),編輯于2023年,星期五3)數(shù)碼照相機(jī)(DigitalCamera)數(shù)碼照相機(jī)也叫數(shù)字相機(jī),是一種能夠進(jìn)行景物拍攝,并以數(shù)字格式存放拍攝圖像的特殊照相機(jī)。它的核心部件是CCD圖像傳感器,主流機(jī)型分辨率已在400萬(wàn)像素以上。數(shù)碼照相機(jī)的感光器件也是CCD陣列。CCD可以對(duì)亮度進(jìn)行分級(jí),但并不能識(shí)別顏色。為此,數(shù)碼照相機(jī)用紅、綠和藍(lán)三個(gè)彩色濾鏡,當(dāng)光線(xiàn)從紅、綠、藍(lán)濾鏡中穿過(guò)時(shí),就可以得到每種色光的反應(yīng)值,再通過(guò)軟件對(duì)得到的數(shù)據(jù)進(jìn)行處理,從而確定每一個(gè)像素點(diǎn)的顏色。CCD生成的數(shù)字圖像被傳送到照相機(jī)的一塊內(nèi)部芯片上。該芯片負(fù)責(zé)把圖像轉(zhuǎn)換成相機(jī)內(nèi)部的存儲(chǔ)格式(通常為JPEG格式)。最后,把生成的圖像保存在存儲(chǔ)卡中。數(shù)碼照相機(jī)可通過(guò)USB接口與計(jì)算機(jī)相連,將拍攝的圖像下載到計(jì)算機(jī)中,以便處理或插到文檔/Web頁(yè)面中,或用彩色打印機(jī)輸出。第三十五頁(yè),共六十三頁(yè),編輯于2023年,星期五

4)遙感圖像獲取設(shè)備遙感中常用的圖像獲取設(shè)備有光學(xué)攝影設(shè)備,如攝像機(jī)、多光譜像機(jī)等;紅外攝影設(shè)備,如紅外輻射計(jì)、紅外攝像儀、多通道紅外掃描儀、多光譜掃描儀(MSS);微波設(shè)備,如微波輻射計(jì)、側(cè)視雷達(dá)、真空孔徑雷達(dá)、合成孔徑雷達(dá)(SAR)。第三十六頁(yè),共六十三頁(yè),編輯于2023年,星期五

2.圖像輸入卡(采集卡)

通常圖像輸入卡安裝于計(jì)算機(jī)主板擴(kuò)展槽中,主要包括圖像存儲(chǔ)器單元、顯示查找表(LUT)單元、CCD攝像頭接口(A/D)、監(jiān)視器接口(D/A)和PC機(jī)總線(xiàn)接口單元。工作過(guò)程如下:攝像頭實(shí)時(shí)或準(zhǔn)實(shí)時(shí)采集圖像數(shù)據(jù),經(jīng)A/D變換后將圖像存放在圖像存儲(chǔ)單元的一個(gè)或三個(gè)通道中,D/A變換電路自動(dòng)將圖像顯示在監(jiān)視器上。通過(guò)主機(jī)發(fā)出指令,將某一幀圖像靜止在存儲(chǔ)通道中,即采集或捕獲一幀圖像,然后可對(duì)圖像進(jìn)行處理或存盤(pán)。高檔卡還包括卷積濾波、FFT(快速傅立葉變換)等圖像處理專(zhuān)用的快速部件。現(xiàn)在有的圖像采集卡將圖像和圖形功能合為一體,如北京大恒圖像視覺(jué)有限公司開(kāi)發(fā)的VIDEO-PCI-C真彩色圖像采集卡。該卡基于PCI總線(xiàn)設(shè)計(jì),它將圖像和VGA的圖形功能合為一體,可在計(jì)算機(jī)屏幕上實(shí)時(shí)顯示彩色活動(dòng)圖像,其分辨率為768×576。第三十七頁(yè),共六十三頁(yè),編輯于2023年,星期五

3.顯示卡顯示卡是記憶和保存圖像的地方,通常,存貯的圖像要隨時(shí)顯示在顯示器上。PC機(jī)多采用800×600或1024×768個(gè)像素點(diǎn)。通常在圖像處理裝置中,灰度值紅(R)、綠(G)、藍(lán)(B)各占8位(bit),共計(jì)24位,可以表示1670萬(wàn)種顏色,這種顯示卡稱(chēng)為真彩色顯示卡。第三十八頁(yè),共六十三頁(yè),編輯于2023年,星期五

4.計(jì)算機(jī)圖像處理的主要特點(diǎn)是數(shù)據(jù)量大、運(yùn)算時(shí)間長(zhǎng),因而對(duì)系統(tǒng)硬件配置要求較高。目前,在PC機(jī)上配置奔騰P42.4G以上CPU、512MB內(nèi)存、80G以上硬盤(pán)的計(jì)算機(jī)已屬常見(jiàn),計(jì)算速度大幅度提高,可與幾年前的大型機(jī)媲美。為了加快圖像的顯示和處理速度,用于圖像處理的PC機(jī)配置應(yīng)盡可能高一些。當(dāng)然,有條件時(shí)最好采用圖形工作站進(jìn)行圖像處理。第三十九頁(yè),共六十三頁(yè),編輯于2023年,星期五

5.圖像存貯裝置圖像數(shù)據(jù)量龐大,早期其存儲(chǔ)成為問(wèn)題。到目前為止,除了大容量磁盤(pán)可供存儲(chǔ)圖像數(shù)據(jù)之外,MO、CD、DVD等光學(xué)存儲(chǔ)裝置以及SAN、NAS等網(wǎng)絡(luò)存儲(chǔ)系統(tǒng),為存儲(chǔ)海量圖像數(shù)據(jù)提供了極好的支持。第四十頁(yè),共六十三頁(yè),編輯于2023年,星期五1.4.2高速圖像處理卡實(shí)用圖像處理系統(tǒng)分為在線(xiàn)處理系統(tǒng)和離線(xiàn)處理系統(tǒng)兩種形式。在研究中,多采用離線(xiàn)圖像處理系統(tǒng),主要用于開(kāi)發(fā)和驗(yàn)證圖像處理與分析的算法。在線(xiàn)圖像處理系統(tǒng)除上述設(shè)備外,還需用圖像處理專(zhuān)用硬件代替圖像采集卡,以構(gòu)成自動(dòng)處理系統(tǒng),可以對(duì)生產(chǎn)現(xiàn)場(chǎng)采集的圖像進(jìn)行實(shí)時(shí)處理,并對(duì)其處理結(jié)果進(jìn)行監(jiān)控。下面簡(jiǎn)要介紹夏普公司研發(fā)的GPB-K高速圖像處理卡。第四十一頁(yè),共六十三頁(yè),編輯于2023年,星期五GPB-K可以安裝在計(jì)算機(jī)的PCI擴(kuò)展槽上,是一種高速、高性能的圖像處理板卡。操作系統(tǒng)為WindowsNT或MS-DOS。圖像的輸入可從圖像文件調(diào)用,也可由攝像機(jī)輸入。板卡上的視頻輸入端有6路,最多可同時(shí)輸入3路信號(hào),可通過(guò)函數(shù)進(jìn)行選擇。當(dāng)輸入視頻圖像時(shí),可選擇GPB-K的內(nèi)部和外部的輸入同步信號(hào),輸出圖像能在標(biāo)準(zhǔn)的VGA監(jiān)視器上顯示,輸入和輸出與GPB-K的其他處理不必同步,所以對(duì)攝像機(jī)的幀頻也沒(méi)有限制。GPB-K在板卡上固化了包含約300個(gè)函數(shù)的圖像處理庫(kù)。GPB-K函數(shù)由MicrosoftVC++5.0版本做成。對(duì)于像素灰度為8bit的灰度圖像而言,能處理的圖像最大尺寸為1024×1024,但處理視頻圖像的最大尺寸為640×480。GPB-K可以根據(jù)目標(biāo)區(qū)域ROI(RegionOfInterest)來(lái)指定處理的區(qū)域。處理區(qū)域設(shè)定得越小,處理時(shí)間相應(yīng)就越短。第四十二頁(yè),共六十三頁(yè),編輯于2023年,星期五GPB-K中使用了夏普公司的通用圖像處理大規(guī)模集成電路SALA,具有高速、高性能的特點(diǎn),圖像處理的速度達(dá)一個(gè)像素/40ns??梢酝ㄟ^(guò)硬件實(shí)現(xiàn)圖像灰度變換、圖像間的運(yùn)算、濾波處理、特征提取等。圖1-5給出了GPB-K的整體硬件結(jié)構(gòu)方框圖。GPB-K板卡由SALA-LSI,攝像機(jī)的輸入、顯示、擴(kuò)展連接、模板匹配(MAP)、各單元的圖像存儲(chǔ)器及PCI總線(xiàn)組成,由于各個(gè)單元分別與4根8bit的圖像總線(xiàn)連接,因此可處理圖像數(shù)據(jù)。

GPB-K主要應(yīng)用于制造業(yè)的檢測(cè)等領(lǐng)域,例如,尺寸的測(cè)量(導(dǎo)桿寬度、螺距),外觀檢查(裂紋檢查、根據(jù)顏色判別優(yōu)劣),文字識(shí)別(制造年月日、產(chǎn)品批號(hào)),印刷電路板檢查(跨接線(xiàn)、過(guò)孔、焊盤(pán))等。第四十三頁(yè),共六十三頁(yè),編輯于2023年,星期五圖1-5GPB-K硬件結(jié)構(gòu)方框圖第四十四頁(yè),共六十三頁(yè),編輯于2023年,星期五1.4.3圖像處理系統(tǒng)軟件微型圖像處理系統(tǒng)既包含硬件設(shè)備,也需要一定的軟件環(huán)境支持。目前,圖像處理系統(tǒng)平臺(tái)多為MicrosoftWindows或X-Windows,開(kāi)發(fā)的主流工具為Microsoft公司的VC++。這是因?yàn)閂C++是一種具有高度綜合性能的軟件開(kāi)發(fā)工具,用它開(kāi)發(fā)出來(lái)的程序有著運(yùn)行速度快、可移植能力強(qiáng)等優(yōu)點(diǎn)。本書(shū)中實(shí)例也是在Windows平臺(tái)下,用VC++6.0實(shí)現(xiàn)的。此外,各國(guó)的科學(xué)家和研究機(jī)構(gòu)開(kāi)發(fā)了不少專(zhuān)用的圖像處理軟件環(huán)境,下面僅對(duì)主要的幾種作一簡(jiǎn)單介紹。第四十五頁(yè),共六十三頁(yè),編輯于2023年,星期五

1.MATLAB的圖像處理工具箱

MATLAB是由美國(guó)MathWorks公司推出的用于數(shù)值計(jì)算的有力工具,它具有相當(dāng)強(qiáng)大的矩陣運(yùn)算和操作功能,并且MATLAB圖像處理工具箱提供了豐富的圖像處理函數(shù),靈活運(yùn)用這些函數(shù)幾乎可以完成所有的圖像處理工作,從而大大節(jié)省編寫(xiě)低層算法代碼的時(shí)間,避免程序設(shè)計(jì)中的重復(fù)勞動(dòng),達(dá)到事半功倍的效果。但是,MATLAB強(qiáng)大的功能只能在安裝有MATLAB系統(tǒng)的機(jī)器上使用圖像處理工具箱中的函數(shù)或自編的m文件來(lái)實(shí)現(xiàn),實(shí)際應(yīng)用極為不便,且MATLAB使用行解釋方式執(zhí)行代碼,執(zhí)行速度很慢。第四十六頁(yè),共六十三頁(yè),編輯于2023年,星期五

為將MATLAB的強(qiáng)大功能融入各種應(yīng)用程序中,通過(guò)高級(jí)語(yǔ)言編譯器編譯為二進(jìn)制代碼已逐漸成為研究熱點(diǎn)。MathTools公司推出的MatCom可以把MATLAB語(yǔ)言翻譯成為C或C++語(yǔ)言,但其翻譯的代碼不夠簡(jiǎn)捷。更直接的方法是利用MatCom提供的Matrix<LIB>C++庫(kù)實(shí)現(xiàn)MATLAB與C++的接口。該方法細(xì)節(jié)請(qǐng)參考本書(shū)第七章。第四十七頁(yè),共六十三頁(yè),編輯于2023年,星期五

2.AVS和SPIDER1)AVS(ApplicationVisualizationSystem)AVS是對(duì)龐大的數(shù)據(jù)量進(jìn)行可視化處理的通用系統(tǒng)之一。最初,該系統(tǒng)是為了對(duì)科學(xué)計(jì)算的結(jié)果進(jìn)行可視化(ScientificVisualization)處理而開(kāi)發(fā)的系統(tǒng),現(xiàn)在已經(jīng)在如下領(lǐng)域中廣泛使用。

·醫(yī)學(xué)圖像、有限元法分析、流體力學(xué)、檢測(cè)/實(shí)驗(yàn)結(jié)果的表示;

·資源探索、環(huán)境科學(xué)、遙感、一般圖像處理;

·量子力學(xué)、分子設(shè)計(jì)、CAD數(shù)據(jù)表示、OR分析;

·金融數(shù)據(jù)分析、一般科學(xué)分析。第四十八頁(yè),共六十三頁(yè),編輯于2023年,星期五AVS作為應(yīng)用軟件具有如下強(qiáng)大的功能:·數(shù)據(jù)顯示:Pointer和Clicker類(lèi)型數(shù)據(jù)的可視化應(yīng)用?!缀物@示:可以進(jìn)行人機(jī)對(duì)話(huà)的三維幾何數(shù)據(jù)的顯示?!D像顯示:可以進(jìn)行人機(jī)對(duì)話(huà)的二維圖像的顯示?!D形顯示:完成畫(huà)圖功能?!こ瘮?shù):圖像處理、聲音波形圖。第四十九頁(yè),共六十三頁(yè),編輯于2023年,星期五

2)SPIDERViewerSPIDER(SubroutinePackageforImageDataEnhancementandRecognition)是由日本通產(chǎn)省工業(yè)技術(shù)院電子技術(shù)綜合研究所開(kāi)發(fā)的圖像處理程序庫(kù),如表1-1所示。它包含了圖像處理領(lǐng)域中的基本算法和實(shí)現(xiàn)方法,因此得到了很高的評(píng)價(jià),之后又追加了基本的圖像分析算法,立體圖像、距離圖像、文本、畫(huà)面處理等領(lǐng)域的算法,稱(chēng)之為SPIDERII,目前已經(jīng)得到了廣泛的應(yīng)用。第五十頁(yè),共六十三頁(yè),編輯于2023年,星期五第五十一頁(yè),共六十三頁(yè),編輯于2023年,星期五第五十二頁(yè),共六十三頁(yè),編輯于2023年,星期五第五十三頁(yè),共六十三頁(yè),編輯于2023年,星期五3.IUE

對(duì)圖像處理和圖像理解算法優(yōu)劣的評(píng)價(jià)是非常困難的。為此,世界范圍內(nèi)的圖像工程科研人員就評(píng)價(jià)問(wèn)題進(jìn)行了研討,以構(gòu)建可重復(fù)利用的軟件開(kāi)發(fā)環(huán)境。IUE(ImageUnderstandingEnvironment)就是以美國(guó)為主,日本和歐洲共同參加開(kāi)發(fā)的圖像處理系統(tǒng)。該系統(tǒng)可以實(shí)現(xiàn)圖像理解計(jì)算模型的確立,進(jìn)行嚴(yán)密的幾何學(xué)描述,能應(yīng)用于各種類(lèi)型的圖像,從而提高研究效率,促進(jìn)技術(shù)積累和技術(shù)轉(zhuǎn)移。針對(duì)上述目標(biāo),IUE有效利用現(xiàn)有軟件,開(kāi)發(fā)了運(yùn)行在UNIX工作站上(SunOS、Linux)的面向?qū)ο蟮某绦?C++),并從LaTeX自動(dòng)生成C++源代碼,以滿(mǎn)足實(shí)際需要。第五十四頁(yè),共六十三頁(yè),編輯于2023年,星期五IUE不僅提供函數(shù)庫(kù)和數(shù)據(jù)庫(kù),為了能正確地描述有關(guān)光源、物體、傳感器等幾何學(xué)和光學(xué)的關(guān)系,還提供了類(lèi)的分層結(jié)構(gòu)關(guān)系。并且也提供了坐標(biāo)系和坐標(biāo)變換的類(lèi),它是用矢量圖來(lái)表示的。這種類(lèi)有600個(gè),還有400個(gè)模板及類(lèi)成員,可以說(shuō)它是一個(gè)巨大的資源庫(kù)。IUE系統(tǒng)不單是圖像處理系統(tǒng),而且還是由輸入圖像轉(zhuǎn)換為三維場(chǎng)景描述的圖像理解的信息環(huán)境。在此環(huán)境中,可以處理圖像數(shù)據(jù),線(xiàn)段、區(qū)域、面等幾何數(shù)據(jù),以及對(duì)于認(rèn)識(shí)、理解的高級(jí)處理時(shí)的知識(shí)表達(dá)、幾何數(shù)據(jù)之間關(guān)系的符號(hào)數(shù)據(jù)等。第五十五頁(yè),共六十三頁(yè),編輯于2023年,星期五1.5數(shù)字圖像處理的應(yīng)用

數(shù)字圖像處理主要應(yīng)用于下面的幾個(gè)領(lǐng)域。

1)通訊通訊包括圖像傳輸、電視電話(huà)、電視會(huì)議等,主要是進(jìn)行圖像壓縮甚至理解基礎(chǔ)上的壓縮。

2)宇宙探測(cè)由于太空技術(shù)的發(fā)展,需要用數(shù)字圖像處理技術(shù)處理大量的星體照片。第五十六頁(yè),共六十三頁(yè),編輯于2023年,星期五

3)遙感航空遙感和衛(wèi)星遙感圖像需要用數(shù)字技術(shù)加工處理,并提取有用的信息。主要用于地形地質(zhì),礦藏探查,森林、水利、海洋、農(nóng)業(yè)等資源調(diào)查,自然災(zāi)害預(yù)測(cè)預(yù)報(bào),環(huán)境污染監(jiān)測(cè),氣象衛(wèi)星云圖處理以及地面軍事目標(biāo)的識(shí)別。第五十七頁(yè),共六十三頁(yè),編輯于2023年,星期五4)生物醫(yī)學(xué)領(lǐng)域中的應(yīng)用圖像處理在醫(yī)學(xué)界的應(yīng)用非常廣泛,無(wú)論是臨床診斷還是病理研究都大量采用圖像處理技術(shù)。它的直觀、無(wú)創(chuàng)傷、安全方便等優(yōu)點(diǎn)備受青睞。圖像處理首先應(yīng)用于細(xì)胞分類(lèi)、染色體分類(lèi)和放射圖像等。70年代數(shù)字圖像處理在醫(yī)學(xué)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論