已閱讀5頁,還剩62頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
.,數(shù)字圖像處理相關(guān)基本知識主講:吳發(fā)根,.,圖像處理的內(nèi)容相當豐富,涉及的相關(guān)知識和領(lǐng)域也非常寬廣。本章從應(yīng)用的角度介紹一些與圖像和數(shù)字處理密切相關(guān)的圖像的基本知識,為后續(xù)各章內(nèi)容的學(xué)習(xí)做準備。,.,第二章圖像的基本知識,2.1圖像的概念2.2圖像信息的分類2.3圖像的獲取及圖像函數(shù)2.4圖像的數(shù)字化和圖像描述2.5圖像的統(tǒng)計特性2.6常用的圖像文件格式2.7計算機圖像數(shù)據(jù)處理2.8圖像質(zhì)量評價2.9彩色圖像簡介,.,2.1圖像的概念,“圖像”一詞在漢語中很難給出一個明確的定義。三個與圖像有關(guān)的英語詞:“Picture”、“image”和“Pattern”?!癙icture”畫、圖畫、圖像、圖片、電影等等;“image”像、圖像、景像、映像、影像、映射等;“Pattern”模型、式樣、樣本、圖案、圖、圖形等。,.,三個詞大致可做如下區(qū)分:“Picture”是指與照片等相似的用手工描繪的人物或景物,其中側(cè)重于手工描繪的一類“畫”。,.,“image”是指用鏡頭等科技手段得到的視覺形象。一般來講可定義為“以某一技術(shù)手段被再現(xiàn)于二維畫面上的視覺信息”。通俗的說就是指那些用技術(shù)手段把目標(Object)原封不動的一模一樣的再現(xiàn)的景物。它包含用計算機等機器產(chǎn)生的景物。,.,“Pattern”指的是圖形,在拉丁語中指裁衣服的紙樣。因此,它主要是指圖案、曲線、圖形。綜上所述我們所說的圖像處理應(yīng)是“ImageProcessing”。這里要處理的主要是屬于照片、復(fù)印圖、電視、傳真、計算機顯示的一類圖像。,.,2.2圖像信息的分類:,圖像信息的種類是多種多樣的,這里就常見的圖像信息進行簡單的分類。概括起來,圖像信息大致可分成三類,即:符號信息景物信息情緒信息。,.,(1)符號圖像信息一般是用文字、符號、圖形等表示的具體的或抽象的事物。例如文字,利用文字可組成文章,可以看成是用二值圖像的形式攜帶這篇文章的寓意。最有代表意義的符號圖像信息是電路圖、機械圖、建筑圖等,它們都是用二值圖像的形式向人們提供信息的。符號信息是以某一規(guī)則排列的記號,因此,在傳送及處理中只要能表達清楚就可以了,它允許有較大的壓縮。,.,(2)景物圖像信息這是一種能給人以主觀感覺但并不取決于人本身的客觀場景信息。一般來講它包含有豐富的內(nèi)容,所含的信息量也較多。其特點是景物畫面的內(nèi)容比較復(fù)雜,在傳輸和處理中做到較大的壓縮比較困難,在人機識別中需要較大的信息量。但在事先設(shè)定某種條件的情況下,是有可能在任何情況下保證正確判斷的。,.,(3)、情緒圖像信息這是一類依賴于受信者的圖像信息,它不僅能給人以直觀感覺,而能以其特殊的藝術(shù)內(nèi)容刺激人的感官,使受信者“觸景生情”引起感情上的波動和情緒上的共鳴。因此,它包含有更多的信息。這類圖像信息不僅取決于圖像本身的內(nèi)容而且還與受信者的經(jīng)歷、文化修養(yǎng)、年齡、嗜好以及此時此刻的心境情緒有密切關(guān)系。因此,這類圖像不僅無法考慮其概率模型,而且明確其信息量也是極其困難的。,.,以上是從圖像所攜帶的信息的種類出發(fā)進行簡單分類的。當然還可以從其他角度出發(fā)進行分類。如把圖像分成靜止圖像和活動圖像、單色圖像和彩色圖像等。在我們數(shù)字圖像處理中所涉及到的是一些最普通類型的圖像,它們的突出特點是都具有特殊的統(tǒng)計特性,并且有專門的應(yīng)用。它包括:,.,TV型的自然風(fēng)景:常見有的圖片,如肖象、風(fēng)景畫、建筑物照片等??臻g攝影照片和地球資源探測圖片:這類圖片的特點是往往沒有適宜的方向,構(gòu)圖不十分明顯,除了海岸線外,沒有可區(qū)別的形狀。電子顯微鏡照片和標準的顯微鏡照片:這是一類在冶金學(xué)、生物學(xué)、醫(yī)學(xué)以及石油探測等都很感興趣的一類照片。文本:這是指一類打印或手寫的記號圖像。圖樣:它們通常就是簡單地由線段和圖形構(gòu)成的單色二值圖像。專用圖像:如:X射線照片、微波照片、紅外熱象或超聲波圖像等。這些圖像各有特點,與在可見光下得到的圖像有所不同。注:在今后講課中所提到的一些圖像只是極少數(shù)的有代表性而又實用的圖像。這些圖像經(jīng)過研究大部分可以找到較為近似的模型和規(guī)律,這對方便處理和深入研究來講無疑都是十分有利的。,.,圖像是由照射源和形成圖像的場景元素對光能的反射或吸收相結(jié)合而產(chǎn)生的。,照射源:可由傳統(tǒng)光源引起如可見光等,也可由非傳統(tǒng)光源引起如超聲波等;,場景:可以是人們?nèi)粘?梢姷奈矬w,也可以是分子等。,獲取圖像的要素:,2.3圖像的獲取及圖像函數(shù)(1)圖像獲取,.,圖2-1顯示了用來把照射能量變?yōu)閿?shù)字圖像的三種主要傳感器裝置。其原理是:利用對特殊類型能源敏感的傳感器材料,把輸入能源轉(zhuǎn)換變?yōu)檩敵鲭妷翰ㄐ?,然后將其?shù)字化,從而得到數(shù)字圖像信息。,.,2-1(c)傳感器陣列,輸出電壓波形,能量,濾光器,電源輸入,外殼,敏感材料,2-1(a)單個成像傳感器,b),2-1(b)帶狀傳感器,.,a.用單個傳感器獲取圖像為用單個傳感器獲取二維圖像,傳感器和場景對象之間必須在x和y方向有相對位移。下圖顯示了一個高精度掃描裝置(鼓形掃描或光電滾筒掃描器)。,.,工作原理為:,把一張圖片裝在一個滾筒上,滾筒由相應(yīng)的裝置驅(qū)動其轉(zhuǎn)動,使傳感器相對于圖像做垂直方向運動。傳感器安裝在引導(dǎo)螺桿上,它可以在水平方向上移動。,.,其工作過程為:,圖像,傳感器,電壓信號,數(shù)字圖像,.,優(yōu)點:,b.用帶狀傳感器獲取圖像,在獲取數(shù)字圖像中更常用的是由單個傳感器按線狀排列而形成的帶狀傳感器或傳感器帶,如下圖,b),缺點:,是得到高分辨率圖像的廉價方法,速度太慢,.,傳感器帶在一個方向上提供成像單元。相對于傳感器帶垂直方向的運動在另一方向上成像,如下圖所示:,這是大多數(shù)平板掃描儀所用的裝置。成像傳感器帶一次輸出一幅圖像的一行,隨著傳感器帶的運動完成二維圖像的獲取。,線性移動,.,傳感器帶也可以安裝成圓環(huán)形狀,稱為傳感器環(huán)或環(huán)形傳感器帶它主要用于醫(yī)學(xué)和工業(yè)成像,以得到三維物體的橫斷截面(切片)圖像,如右圖所示:,一個旋轉(zhuǎn)的X射線源提供照射,而相對于射線源的傳感器部分接受通過物體的X射線能量。,.,c.用傳感器陣列獲取圖像將各個傳感器以二維陣列形式排列就形成了傳感器陣列。這是在數(shù)字攝像機上常見的主要結(jié)構(gòu)。如右圖:,.,下圖是用傳感器陣列獲取數(shù)字圖像的過程,照射(能)源,成像系統(tǒng),(內(nèi)部)圖像平面,輸出(數(shù)字化后的)圖像,場景元素,.,右圖所示的傳感器陣列是二維的,主要優(yōu)點是把圖形能量聚焦到陣列表面一次就能得到完整的圖像。,.,(2)圖像函數(shù),圖像是用某一技術(shù)手段獲得的、能為人的視覺系統(tǒng)所感受的信息形式。圖像的實質(zhì):客觀世界反射或透射某種物質(zhì)能量的分布圖,這種物質(zhì)可能是可見光、X射線、紅外線、超聲波等。,.,(2)數(shù)字圖像的描述,.,實際上,一幅自然的、模擬的圖像經(jīng)過數(shù)字化進入計算機后,一般都是用點位圖來表示和描述的。一幅圖像由許許多多描述每個像素的數(shù)據(jù)組成,這些數(shù)據(jù)通常稱為圖像數(shù)據(jù),而這些數(shù)據(jù)通常是作為一個文件來存儲的,這種文件又稱為圖像文件。點位圖的獲取通常用掃描儀、攝像機、激光視盤與視頻信號數(shù)字化卡一類設(shè)備,通過這些設(shè)備把模擬的圖像信號變成數(shù)字圖像數(shù)據(jù)。,.,影響點位圖文件大小的因素:,圖像分辨率:分辨率越高,就是組成一幅圖的像素越多,則圖像文件越大。,像素深度:像素深度越深,就是表達單個像素的顏色和亮度的位數(shù)越多,圖像文件越大。,點位圖表示和描述的模式可分為:黑白圖像、灰度圖像、彩色圖像。,.,a.黑白圖像,定義:只有黑白兩種顏色的圖像稱為黑白圖像或單色圖像,是指圖像的每個像素只能是黑或者白,沒有中間的過渡,故又稱為二值圖像。特點:二值圖像的像素值只能為0和1,圖像中的每個像素值用1位存儲。,.,b.灰度圖像,定義:灰度圖像是指每個像素的信息由一個量化的灰度級來描述的圖像。如果每個像素的灰度值用一個字節(jié)表示,灰度值級數(shù)就等于256級,每個像素可以是0255之間的任何一個數(shù)。,特點:它只有亮度信息,沒有顏色信息。占據(jù)存儲空間較黑白圖像要大。,.,圖2-9黑白圖像,圖2-10灰度圖像,.,c.彩色圖像,定義:彩色圖像除有亮度信息外,還包含有顏色信息。,特點:彩色圖像的表示與所采用的彩色空間,即彩色的表示模型有關(guān)。同一幅彩色圖像如果采用不同的彩色空間表示,對其的描述可能會有很大不同。,.,舉例:以RGB(紅綠藍)彩色空間為例來簡要說明彩色圖像。在RGB彩色空間中,一幅彩色數(shù)字圖像的各個像素的信息由RGB三原色信息構(gòu)成,其中R(紅)、G(綠)、B(藍)是由不同的灰度級來描述的,三者共同決定了像素的亮度和色彩。彩色圖像可按照顏色的數(shù)目來劃分。例如,256色圖像和真彩色圖像(2的16次方216777216種顏色)等。,.,圖23幀差值信號分布密度特性,由圖可見,變化劇烈的圖像與變化緩慢的圖像其差值的分布是不一樣的。,對于電視信號來說,除了像素間的差值外,還存在幀間差值。對幀間差值信號的分布密度特性測定的結(jié)果如圖23所示。,.,2.6常用的圖像文件格式,常用的靜態(tài)圖像文件格式,BMP,GIF,TIFF,JPEG,數(shù)字圖像在計算機中是以圖像文件的形式存放的,圖像文件的格式一般包含文件數(shù)據(jù)的存儲形式、大小、起止位置等內(nèi)容。,.,(1)BMP文件格式,定義:BMP文件又稱為位圖文件(bitmap,簡稱BMP),是一種與設(shè)備無關(guān)的圖像文件格式。,特點:是一種位映射的存儲形式。,BMP文件的劃分:,分四個域,位圖文件參數(shù)頭域,位圖參數(shù)頭域,調(diào)色板域,位圖數(shù)據(jù)域,.,位圖文件參數(shù)頭域包含關(guān)于這個文件的信息,例如從哪里開始是位圖數(shù)據(jù)的定位信息。位圖參數(shù)頭域含有關(guān)這幅圖像的信息,例如以像素為單位的寬度和高度、位圖的彩色、壓縮方法等。調(diào)色板域中有圖像顏色的RGB值定義。位圖數(shù)據(jù)域是圖像數(shù)據(jù),用BYTE數(shù)據(jù)結(jié)構(gòu)。其數(shù)據(jù)取決于壓縮方法。,.,(2)GIF文件格式定義:即圖形交換格式,GraphicsInterchangeFormat,簡稱GIF。特點:GIF文件格式支持216M種顏色,單個文件的多重圖像,按行掃描的快速解碼、有效地壓縮以及硬件無關(guān)性。GIF圖像文件以數(shù)據(jù)塊(Block)為單位來存儲圖像的相關(guān)信息。數(shù)據(jù)塊的分類如下:,.,控制塊,專用塊,圖形描繪塊,GIF文件頭,邏輯屏幕描述塊,圖形控制擴展塊,文件結(jié)束塊,圖像描述塊,無格式文件擴展塊,注釋擴展塊,應(yīng)用擴展塊,包含有用來控制數(shù)據(jù)流或者設(shè)置硬件參數(shù)的信息,包含有用來描繪在顯示設(shè)備上顯示圖形的信息和數(shù)據(jù),包含有與圖像處理無關(guān)的信息,.,(3)TIFF文件格式,定義:標記圖像文件格式(TagImageFileFormat,簡稱TIFF)是基于標志域的圖像文件格式。有關(guān)圖像的所有信息都存儲標志域中,如圖像的大小、所用計算機型號、制造商、圖像的作者、說明、軟件及數(shù)據(jù)。,特點:TIFF文件是一種極其靈活易變的格式,它可以支持多種壓縮方法,TIFF文件一般比較大。,存儲形式:圖像數(shù)據(jù)以“條狀”形式存儲,可以通過圖像文件目錄中的登記項找到需要的圖像數(shù)據(jù)。,.,(4)JPEG文件格式,定義:JPEG是JointPhotographicExpertsGroup(聯(lián)合圖像專家組)的縮寫,是用于連續(xù)色調(diào)靜態(tài)圖像壓縮的一種標準。其主要方法是采用預(yù)測編碼(DPCM)、離散余弦變換(DCT)以及熵編碼,以去除冗余的圖像和彩色數(shù)據(jù),屬于有損壓縮方式。,.,特點:JPEG是一種高效率的24位圖像文件壓縮格式,同樣一幅圖像,用JPEG格式存儲的文件是其他類型文件的1/10-1/20,通常只有幾十KB,而顏色仍然是24位,其質(zhì)量損失非常小,基本上無法看出.,擴展名:jpg或jpeg。,.,JPEG文件的由下面8個部分組成:1)圖像開始SOI標記。2)APPO標記。長度、表識符、版本號、X和Y的密度單位(units=0;無單位;units=1;點數(shù)/英寸;units=2;點數(shù)/厘米)、X方向像素密度、Y方向像素密度、縮略圖水平像素數(shù)目、縮略圖垂直像素數(shù)目、縮略圖RGB位圖。3)APPn標記,其中n=1-15(任選)。包括:APPn長度。,.,4)一個或者多個量化表。包括:量化表長度、量化表數(shù)目、量化表。5)楨圖像開始SOFO。包括:楨開始長度、精度、每個顏色分量每個像素位數(shù)、圖像高度、圖像寬度、顏色分量數(shù)、對每個顏色分量的ID、垂直方向的樣本因子、水平方向的樣本因子、量化表號。6)一個或者多個霍夫曼表DHT。包括:霍夫曼表的長度、類型、AC或者DC、索引、位表、值表。,.,7)掃描開始SOS。包括:掃描開始長度、顏色分量數(shù)、每個顏色分量的ID、交流系數(shù)表號直流系數(shù)表號、壓縮圖像數(shù)據(jù)。8)圖像結(jié)束EOI。,.,在圖像編碼、圖像增強和圖像復(fù)原等處理中經(jīng)常要進行圖像質(zhì)量評價。,圖像編碼的目的是要在保持必要圖像質(zhì)量的條件下,以盡可能少的編碼符號傳輸或存儲圖像;,圖像增強的設(shè)計目標是要提高圖像的視覺質(zhì)量;,圖像復(fù)原則補償圖像質(zhì)量退化,使重建圖像接近于無退化成像系統(tǒng)理想圖像。,2.8圖像質(zhì)量的評價,.,這三種應(yīng)用的共同因素是圖像質(zhì)量,即要保持、提高或恢復(fù)圖像質(zhì)量。,圖像品質(zhì)可以細分為兩類:圖像逼真度和圖像可理解度。,已處理圖像,標準圖像,圖像可理解度,圖像逼真度,.,主觀評價有兩種不同的方式:絕對方式和比較方式。,絕對方式:讓觀察者觀看一幅圖像,請他們按照預(yù)先規(guī)定的評價標準判斷圖像質(zhì)量,有時給觀察者配備一套標準參考圖像,以便評定時進行主觀校準,有時觀察者不得不只根據(jù)以往的觀察經(jīng)驗進行判斷。,比較方式:請觀察者平定一套圖像,比較某一特定圖組中圖像的優(yōu)劣。,.,主觀評價測試可分為三種。,.,將接受的信號與一K指數(shù)刻度板擬合,確定出指數(shù)K,其數(shù)值大小就反映了波形失真和圖像質(zhì)量下降的程度。這樣就可將波形失真和圖像質(zhì)量退化聯(lián)系起來,用統(tǒng)一標準的一套指數(shù)進行評價。幾何畸變、光亮度值線性和空間度等指標,都可以用適當?shù)碾娮訙y試信號在電視顯示器上進行測試。,.,彩色可用亮度、色調(diào)和飽和度來描述。人眼看到任一彩色光都是這三個特性的綜合效果。,2.8彩色圖像簡介,亮度,定義:亮度是光作用于人眼時所引起的明亮程度的感覺,相關(guān)因素:觀察物體的發(fā)光強度,人類視覺系統(tǒng)的視敏函數(shù),色調(diào),.,定義:色調(diào)是當人眼看到一種或多種波長的光時所產(chǎn)生的彩色感覺,實質(zhì):它反映顏色的種類,是決定顏色的基本特性。,飽和度,定義:飽和度是顏色的純度,即摻入白光的程度,指顏色的深淺程度。,通常把色調(diào)和飽和度通稱為色度。亮度表示某彩色光的明暗程度,而色度則表示顏色的類別與深淺程度。,.,(2)彩色空間(彩色模型)a.RGB彩色空間計算機中的數(shù)字圖像,用的最多的是RGB彩色空間。由于計算機彩色監(jiān)視器的輸入需要RGB三個彩色分量,通過三個分量的不同比例,在顯示屏幕上合成所需要的任意顏色,所以不管用什么形式的彩色空間,最后輸出一定要轉(zhuǎn)化成RGB彩色空間。,.,三基色原理自然界常見的各種顏色光,都可由紅(R)、綠(G)、藍(B)三種顏色光按不同的比例相配而成,同樣絕大多數(shù)顏色也可以分解成紅、綠、藍三種顏色光,這就是色度學(xué)中最基本的原理三基色原理。由于人眼對紅、綠、藍三種光最敏感,因此由這三種顏色相配所得的彩色范圍也最廣,所以一般都選這三種顏色作為基色(原色)。,.,把三種基色光按不同的比例相加稱之為相加混色。由紅、綠、藍三基色進行相加的情況如下:,紅色,藍色,綠色,黃色,洋紅,青色,白色,紅色,青色,綠色,洋紅,藍色,黃色,白色,.,黃色、洋紅和青色稱為相加二次色,青色、洋紅和黃色也稱為紅、綠、藍三色的補色。相加混色的三基色及其補色如圖2-16所示。RGB彩色空間可用圖2-17所示的彩色立方體表示。,圖2-16相加混色的三基色及其補色圖2-17RGB彩色空間示意圖,.,b.HIS彩色空間HIS彩色空間用H、I、S三個參數(shù)描述顏色特性。,H是色調(diào),表示顏色,與波長有關(guān);,S是飽和度,表示色純度,即單色光中摻入白光的程度;,I是強度,表示人眼感知顏色的強弱程度,它和能量大小及人眼對不同波長的感知能力有關(guān)。,.,用圖2-18a所示的一個三維空間的立體圖,可以把HIS彩色空間的三個參數(shù)的特性更加形象地表示出來。在圖2-18a所示的棗核形立體圖中,垂直軸表示光的亮度變化,頂部最亮表示白色,低部最暗表示黑色,中間是介于白黑之間深淺不同的灰度。在與黑白軸垂直的水平面圓周上,如圖2-18b所示的色環(huán),各點代表光譜上各種不同的色調(diào),如紅、黃、綠、青、藍、洋紅等,構(gòu)成閉合的圓環(huán)。,.,0,紅,藍,240,綠,120,H,S,黃,青,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024版星巴克加盟店設(shè)備維護合同
- 個人影視作品版權(quán)轉(zhuǎn)讓合同(2024版)3篇
- 2024示范文本:二手車買賣合同車輛安全檢測規(guī)范2篇
- 2024試乘試駕活動電子合同范本12篇
- 2025年度二手吊車評估與交易中介合同3篇
- 項目建議書(含設(shè)計任務(wù)書)及可行性研究報告編制技術(shù)咨詢合同模板
- 2025年度碼頭船舶??颗c貨物倉儲一體化租賃合同4篇
- 2025年度臨時醫(yī)療護理人員派遣服務(wù)合同4篇
- 2025年稅務(wù)顧問服務(wù)合同協(xié)議書適用于企業(yè)集團6篇
- 眾維重工2025年度鋼結(jié)構(gòu)建筑工程智能化控制系統(tǒng)采購合同2篇
- 《穿越迷宮》課件
- 《C語言從入門到精通》培訓(xùn)教程課件
- 2023年中國半導(dǎo)體行業(yè)薪酬及股權(quán)激勵白皮書
- 2024年Minitab全面培訓(xùn)教程
- 社區(qū)電動車棚新(擴)建及修建充電車棚施工方案(純方案-)
- 項目推進與成果交付情況總結(jié)與評估
- 鐵路項目征地拆遷工作體會課件
- 醫(yī)院死亡報告年終分析報告
- 建設(shè)用地報批服務(wù)投標方案(技術(shù)方案)
- 工會工作人年度考核個人總結(jié)
- 上海民辦楊浦實驗學(xué)校初一新生分班(摸底)語文考試模擬試卷(10套試卷帶答案解析)
評論
0/150
提交評論