第二章視覺特性及圖像制式

上傳人：6*** IP屬地：湖北上傳時間：2023-02-04 格式：PPT 頁數(shù)：100 大?。?.55MB 積分：28 舉報 版權(quán)申訴

已閱讀5頁，還剩95頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第二章

視覺特性與圖像制式信息工程學(xué)院管張均2.1圖像的表示圖像信號：圖像是一種可視化的信息，圖像信號是圖像信息的理論描述方法。圖像景物在某種成像介質(zhì)上再現(xiàn)的視覺信息圖：物體透射或反射光的分布像：人的視覺系統(tǒng)對圖的接收并在大腦形成的印象或認(rèn)識具有明暗和色彩變化的許多單個像素信息的集合，以及接收者的感覺和心理狀態(tài)圖形？圖像？視頻？圖形是用幾何要素和操作過程（點(diǎn)、線、長方、橢圓、指定點(diǎn)填充等等）描述的圖，即由計算機(jī)繪制的直線、圓、矩形、曲線、圖表等。圖像是掃描儀、攝像機(jī)等輸入設(shè)備捕捉實際畫面產(chǎn)生的，用具有一定灰度級的點(diǎn)陣描述的圖。靜止圖像是與時間無關(guān)的相片圖像。運(yùn)動圖像指的是人們所能見到的活動圖像（如電視、電影、錄像等）。由于要使圖像運(yùn)動起來，需要每秒鐘內(nèi)有足夠多的幀數(shù)（如PAL制式電視每秒25幀，電影每秒24幀）。每一幀就是一幅單獨(dú)的靜止圖像。圖形：物理單元：點(diǎn)、直線、曲線等基本的幾何對象屬性：線寬、填充色、填充模式、對象間的空域關(guān)系等文件格式：PHIGS、GKS、IDS、EPS等圖像：

物理單元：像素屬性：編碼屬性---像素深度（pixeldepth）

顯示屬性---分辨率、尺寸等文件格式：GIF、TIFF、BMP、JPEG、PNG等視頻：物理單元：像素（pixel）、幀（frame）屬性：編碼屬性---像素深度顯示屬性---分辨率、尺寸、幀率等文件格式：M-JPEG、MPEG、WMV、ASF、AVI等2.2圖像的數(shù)字化傳統(tǒng)的遠(yuǎn)程通信系統(tǒng)中，所傳送的信息一般是以模擬形式出現(xiàn)的，表現(xiàn)為一種時間連續(xù)的信號。而在計算機(jī)通信中，信號的傳送方式采用數(shù)字方式，把連續(xù)變化的模擬信號轉(zhuǎn)換為離散的數(shù)字信號。信號的數(shù)字化主要包括取樣、量化和編碼三大部分。數(shù)字化后的信號一般稱為PCM信號（脈沖編碼調(diào)制）。取樣是實現(xiàn)空間上的離散化。量化是實現(xiàn)幅度上的離散化。編碼是實現(xiàn)把離散化了的幅度用二進(jìn)制碼型表示。圖像的數(shù)字化

電視信號的數(shù)字化和復(fù)原

（a）A/D變換（b）D/A變換

又稱抽樣或取樣，它把時間上連續(xù)的模擬信號變成時間上離散的有限個樣值的信號。這是模擬信號數(shù)字化過程中的第一步處理措施。采樣采樣定理根據(jù)傅立葉變換原理，在一定條件下，一個時間函數(shù)f(t)可以變換成一個相應(yīng)的頻率函數(shù)F(w)。采樣定理是選擇采樣頻率的理論依據(jù)。其主要內(nèi)容為：對于一個最高頻率為f0的模擬信號，當(dāng)選擇的取樣頻率fs滿足fs>=2f0時，經(jīng)過取樣后的離散信號能夠包含原模擬信號的全部信息。并且，經(jīng)過低通濾波和反變換，可以不失真地回復(fù)出原模擬信號。圖像的采樣

將物理圖像按行列掃描劃分后，每個小塊區(qū)域稱為像素（pixel）。測量每個像素位置上的值就稱為采樣。二維采樣定理圖像在采樣時，必須滿足二維采樣定理，確保無失真或有限失真地恢復(fù)原圖像。如果二維圖像信號f(x,y)的頻譜F(u,v)滿足其中Uc和Vc

為頻域最高截止頻率。則采樣圖像的頻譜為二維采樣定理當(dāng)采樣周期Δx和Δy滿足通過采樣信號f(mΔx,nΔy)能唯一地恢復(fù)原圖像信號f(x,y)，且有二維采樣定理（a）原圖像的頻譜（b）采樣信號的頻譜采樣信號的頻譜量化在時間軸上已變?yōu)殡x散的樣值脈沖，在幅度軸上仍會在動態(tài)范圍內(nèi)有連續(xù)值，即在幅度軸上仍是模擬信號的性質(zhì)，故還必須用有限個電平等級來代表實際量值。量化是幅度上把連續(xù)值的模擬信號變?yōu)殡x散值的數(shù)字信號，也就是對每個樣點(diǎn)值數(shù)字化，使其和有限個可能電平中的一個對應(yīng)。

另外，人的耳朵或眼睛都不可能辨別出微小的信號變化，所以也沒有必要對很小的幅度差別如實地傳送。這就是說，量化對于實現(xiàn)數(shù)字化不僅是必要的，而且也是可能的。目標(biāo)：當(dāng)幅值的概率分布為p(z)，量化值為qi時，總誤差平方為最小時失真最小。圖像的量化量化可分為兩種：均勻量化非均勻量化

在輸入信號的動態(tài)范圍內(nèi)，量化間距處處相等的量化稱為均勻量化或線性量化。均勻量化時信噪比隨輸入信號動態(tài)幅度的增加而增加。采用均勻量化，在強(qiáng)信號時固然可把噪聲淹沒掉，但在弱信號時，噪聲的干擾就十分顯著。為改善弱信號時的信噪比，量化間距應(yīng)隨輸入信號幅度而變化，大信號時進(jìn)行粗量化，小信號時進(jìn)行細(xì)量化，也就是采用非均勻量化。

如圖所示，設(shè)信號的整個動態(tài)變化范圍為A，共分為M個量化等級；每個量化層距為?A，采用均勻量化，則有：?A＝A/M。量化等級通常用二進(jìn)制的位數(shù)b表示，它與十進(jìn)制數(shù)M之間的關(guān)系為：M＝2b或b＝log2M。b通常稱為量化位數(shù)。例如，對于8位量化，相應(yīng)的十進(jìn)制量化等級M為：M＝2b＝256。MA?A123均勻量化將[z0,zk)均分成k個子區(qū)間后，每個區(qū)間的長度各子區(qū)間以它的中心位置作為量化值當(dāng)待量化值在[z0,zk)區(qū)間內(nèi)均勻分布時主要思想：p(z)不等于常數(shù)，使總誤差平方最小；樣本值在某個取值范圍內(nèi)較頻繁出現(xiàn)，而在另外一些范圍內(nèi)出現(xiàn)不多；可對樣本值較頻繁出現(xiàn)的取值范圍采用較小的量化區(qū)間，而在其它地方用較大的量化區(qū)間；這樣就可在不增加量化級數(shù)k的條件下，降低平均誤差，減少量化噪聲。非均勻量化為使總誤差最小，令其對zi和qi的偏導(dǎo)數(shù)為0，可得步驟：初始化所有的量化電平qi；更新所有的判決電平zi，并計算總誤差的初始值；更新所有的量化電平qi；再次計算總誤差的值；如果兩次計算的總誤差之差小于某個閾值，則算法停止，否則轉(zhuǎn)入第2步。LloydMax量化器Max量化器在誤差平方和最小的意義上是最優(yōu)的。取樣點(diǎn)數(shù)和量化級數(shù)的選取假定一幅圖像取M×N個采樣點(diǎn)，對樣點(diǎn)值進(jìn)行Q級分檔取整。那么對M、N和Q如何取值呢？首先，Q一般總是取2的整數(shù)次冪，如Q=2b，b為正整數(shù)，通常稱為對圖像進(jìn)行b比特量化。

M、N可以相等，也可以不等。若取相等，則圖像距陣為方陣，分析運(yùn)算方便一些。其次，量化過程相當(dāng)于由輸入值找到它所在的區(qū)間號，反量化過程相當(dāng)于由量化區(qū)間號得到對應(yīng)的量化電平值。量化處理是把一批輸入量化到一個輸出級上，量化區(qū)間總數(shù)遠(yuǎn)遠(yuǎn)小于輸入值的總數(shù)，所以量化能實現(xiàn)數(shù)據(jù)壓縮。很明顯，反量化后并不能保證得到原來的值，因此量化過程是一個不可逆過程，用量化的方法來進(jìn)行壓縮編碼是一種非信息保持型編碼。通常這兩個過程均可用查表法實現(xiàn)。對b來講，取值越大，量化區(qū)間總數(shù)越接近于輸入值總數(shù)，所引起的量化失真就越小。在實際應(yīng)用中，如果圖像的總比特數(shù)M×N×b給定，對M×N和b的分配往往是根據(jù)圖像的內(nèi)容和應(yīng)用要求以及系統(tǒng)本身的技術(shù)指標(biāo)來選定的。例如，若圖像中有大面積灰度變化緩慢的平滑區(qū)域（如人的特寫照片等），則M×N取樣點(diǎn)可以少些，而量化比特數(shù)b多些，這樣可使重建圖像灰度層次多些。若b太少，在圖像平滑區(qū)往往會出現(xiàn)“假輪廓”。反之，對于復(fù)雜景物圖像，如群眾場面的照片等，量化比特數(shù)b可以少些，而取樣點(diǎn)數(shù)M×N要多些，這樣就不會丟失圖像的細(xì)節(jié)。究竟M×N和b如何組合才能獲得滿意的結(jié)果很難講出一個統(tǒng)一的方案。不同采樣點(diǎn)數(shù)對圖像質(zhì)量的影響（a）256×256（b）128×128（c）64×64（d）32×32（e）16×16（f）8×8不同量化級別對圖像質(zhì)量的影響（a）256色

（b）64色

（c）32色（d）16色

（e）4色

（f）2色圖像處理時要考慮三個因素：分辨率、圖像深度和顯示深度。分辨率指圖像的清晰度。有屏幕分辨率、圖像分辨率和像素分辨率。屏幕分辨率：指計算機(jī)顯示器屏幕顯示圖像的最大顯示區(qū)，以水平和垂直像素點(diǎn)表示。圖像分辨率：指數(shù)字化的圖像的大小，以水平和垂直像素點(diǎn)個數(shù)表示。例如：在640×480屏幕上顯示320×240個像素點(diǎn)的圖像。

像素分辨率：指像素的寬高比，一般為1：1。2.3圖像的基本屬性2.3圖像的基本屬性圖像深度（顏色深度）：表示數(shù)字位圖圖像中每個像素上用于表示顏色的二進(jìn)制數(shù)字位數(shù)。目前黑白圖像為8比特，彩色為24比特。顯示深度：表示顯示器上每個點(diǎn)用于顯示顏色的二進(jìn)制數(shù)字位數(shù)。若顯示深度小于圖像深度，則圖像失真。圖像文件大小的計算（Byte）：圖像數(shù)據(jù)量大小=像素總數(shù)×圖像深度÷8例如：一幅640×480的256色圖像為：

640×480×8÷8=307200Bytes2.3圖像的基本屬性真彩（Truecolor）彩色圖像直接采用包含R、G、B三基色分量的像素值。偽彩（Pseudocolor）Colorlook-uptable，原圖像的灰度值按一定的數(shù)學(xué)關(guān)系同各種顏色對應(yīng)起來獲得彩色圖像的色調(diào)。直接色每個像素值分為R、G、B分量，這些分量再作為單獨(dú)索引值，通過相應(yīng)的彩色變換表找出基本色調(diào)。這樣產(chǎn)生的RGB強(qiáng)度值構(gòu)成的彩色稱為直接色。用這種系統(tǒng)產(chǎn)生顏色與真彩色系統(tǒng)相比，相同之處是都采用RGB分量決定基色強(qiáng)度，不同之處是后者的基色強(qiáng)度直接用RGB決定，而前者的基色強(qiáng)度由RGB經(jīng)變換后決定。因而這兩種系統(tǒng)產(chǎn)生的顏色就有差別。試驗結(jié)果表明，使用直接色在顯示器上顯示的彩色圖像看起來更真實自然。2.4數(shù)字圖像種類表達(dá)方法矢量圖（vectorgraphics）（圖形）點(diǎn)陣圖（bitmappedgraphics）

（圖像）

利用點(diǎn)、線、矩形、多邊形、圓和弧線等描述；采用數(shù)學(xué)計算方式，通過計算機(jī)語言編程表達(dá)簡單、小塊圖像時有效，適合做各種變換

用像素表示像素具有顏色、亮度和屬性掃描儀、攝像機(jī)、錄像機(jī)、激光視盤、視頻信號數(shù)字卡等獲得優(yōu)點(diǎn)：適合表現(xiàn)大量的圖像細(xì)節(jié)，可以很好的反映明暗的變化、復(fù)雜的場景和顏色，表現(xiàn)逼真的圖像效果。缺點(diǎn)：文件比較大，放大時清晰度會降低并出現(xiàn)鋸齒。

通過數(shù)學(xué)公式計算獲得描述圖形的直線和曲線，文件一般較小，例如文字、線條。優(yōu)點(diǎn)：無論放大、縮小或旋轉(zhuǎn)等都不會失真。缺點(diǎn)：難以表現(xiàn)色彩層次豐富的逼真圖像效果，而且顯示矢量圖也需要花費(fèi)一些時間。矢量圖點(diǎn)陣圖亮度等級二值圖像灰度圖像色調(diào)等級黑白圖像彩色圖像空間的維數(shù)平面二維圖像立體三維圖像2.4數(shù)字圖像種類灰度圖（gray-scaleimage）

256級灰度圖，每個像素1Byte二值圖，每個像素1bit256色彩色圖及其轉(zhuǎn)換的256級灰度圖24位真彩色圖及其轉(zhuǎn)換的256級灰度圖

彩色圖（colorimage）2.5彩色圖像信號的表示和編碼彩色的三參量（HIS）是視覺系統(tǒng)對一個區(qū)域呈現(xiàn)的顏色的感覺，即對物體輻射或者反射的光波波長的感覺。有一千萬種以上，顏色專業(yè)人士可辨認(rèn)出三百至四百種顏色?；旌舷噜忣伾珪r，可以獲得在這兩種顏色之間連續(xù)變化的色調(diào)。色調(diào)（hue）：表征各顏色（具有不同頻率或波長）飽和度是指色彩的鮮艷程度，即顏色的純潔性。當(dāng)一種顏色滲入其它光（比如白光）成分愈多時，顏色愈不飽和。飽和度為零時，圖像變成一灰度圖像。飽和度（saturation）：表征顏色的濃度亮度是視覺系統(tǒng)對可見物體輻射或者發(fā)光多少的感知屬性。

亮度是主觀感覺，例如，一根點(diǎn)燃的蠟燭在黑暗中看起來要比白熾光下亮。亮度的單位是坎德拉/平方米（cd/m2）亮度是用反映視覺特性的光譜敏感函數(shù)加權(quán)之后得到的輻射功率。亮度（intensity或brightness）：表征總能量，明暗效果，與顏色無關(guān)。另外一個常見概念－－對比度對比度指不同顏色之間的差異，對比度越大，兩種顏色之間的反差就越大。比如對一幅灰度圖像，提高對比度會更加黑白分明，反之，則得到一幅灰色的圖像。HIS顏色圓錐空間模型2.5.1彩色圖像信號的分量表示黑白圖像信號（灰度級，8比特，人眼對灰度的最大分辨力為26。）

彩色視頻信號（彩色的三基色原理，RGB混合而成，24比特，不便于傳輸和存儲。）

利用人的視覺特性降低彩色圖像的數(shù)據(jù)量，將RGB轉(zhuǎn)換到別的彩色空間，轉(zhuǎn)換后每一種彩色都產(chǎn)生一個亮度分量和兩個色度分量信號。

RGB

YUV，YIQ，YCbCr顏色空間（彩色空間）RGB型/計算機(jī)圖形顏色空間電視機(jī)和計算機(jī)的顏色顯示系統(tǒng)CMY型/彩色印刷及打印模型與RGB三基色互補(bǔ)YUV型/電視系統(tǒng)顏色空間（Luminanceandchrominance）廣播電視需求，以壓縮色度信息有效傳輸電視圖像

YCbCr（數(shù)字電視采用的顏色空間）XYZ型/CIE顏色空間國際照明委員會定義的國際性顏色空間標(biāo)準(zhǔn)，是YUV的前身RGB彩色空間

在多媒體計算機(jī)中，用得最多的是RGB彩色空間表示，因為顯示器的輸入需要RGB三個彩色分量。不管多媒體系統(tǒng)中使用什么彩色空間，最后輸出一定要轉(zhuǎn)換為RGB。配色方程：F=r[R]+g[G]+b[B]，r、g、b為三色系數(shù)。白光的亮度公式：PAL，Y=0.22[R]+0.707[G]+0.071[B]NTSC，Y=0.299[R]+0.587[G]+0.114[B]系數(shù)不同是因為三基色波長選擇不同。RGB彩色空間

彩色圖像描述示例RGB彩色空間

自然界中任何一種光都可由R、G、B三基色按不同的比例相加混合而成，當(dāng)三基色分量都為0（最弱）時混合為黑色光，當(dāng)三基色分量都為k（最強(qiáng)）時混合為白色光。任一顏色F是這個三維坐標(biāo)中的一點(diǎn)，調(diào)整三色系數(shù)r、g、b中的任一系數(shù)都會改變F的坐標(biāo)值，也即改變了F的色值。RGB顏色空間采用物理三基色表示，因而物理意義很清楚，適合彩色顯像管工作。然而這一體制并不適應(yīng)人的視覺特點(diǎn)，因而產(chǎn)生了其他不同的顏色空間表示法。

RGB圖像亮度信號Y和色差信號U、V亮度信號表示了單位面積上反射光線的強(qiáng)度色差信號（所謂色差信號，就是指基色信號中的三個分量信號R、G、B與亮度信號之差）決定了彩色圖像信號的色調(diào)。最后發(fā)送端將Y、U、V三個信號進(jìn)行編碼，用同一信道發(fā)送出去，這就是在PAL（德、英、中、朝）彩色電視制式中使用的YUV彩色空間。YUV彩色空間úúú?ùêêê?éúúú?ùêêê?é----=úúú?ùêêê?éBGRVUY100.0515.0615.0436.0289.0147.0114.0587.0299.0YUV與RGB彩色空間變換Y=0.299[R]+0.587[G]+0.114[B]Y和U、V相互獨(dú)立。即黑白灰度圖與單色圖是相互獨(dú)立的，因此可以對這些單色圖分別進(jìn)行編碼。這也解決了彩色電視機(jī)與黑白電視機(jī)的兼容問題。降低數(shù)字彩色圖像數(shù)據(jù)量。利用人眼視覺特性可把幾個相鄰像素不同的色彩值當(dāng)做相同的色彩值來處理（即大面積著色原理），從而減少了所需的數(shù)據(jù)量。在PAL彩色電視制式中，亮度信號的帶寬為4.43MHz，用以保證足夠的清晰度，而把色差信號的帶寬壓縮為1.3MHz，達(dá)到了減少帶寬的目的。優(yōu)點(diǎn)視頻采集卡得到的圖像Y和U、V分別采用不同的采樣頻率。目前常用的Y、U、V采樣頻率的比例有4∶4∶4、4∶2∶2、4：1：1、4：2：0。如要存儲RGB彩色圖像，每分量用8個比特表示，圖像的大小為640×480像素，那么所需要的存儲容量為640×480×3×8/8＝921600字節(jié)；如果用Y∶U∶V＝4∶1∶1來表示，對于Y每個像素仍用8比特表示，而對于色差信號U、V，每4個像素用8比特表示，則存儲量變?yōu)?40×480×(8+2+2)/8＝460800字節(jié)。盡管數(shù)據(jù)量減少了一半，但人眼察覺不出有明顯變化。YUV圖像在NTSC彩色電視制式中選用YIQ彩色空間，其中Y表示亮度，I、Q是兩個彩色分量。

I、Q與U、V是不相同的。人眼的彩色視覺特性表明，人眼對紅、黃之間顏色變化的分辨能力最強(qiáng)；而對藍(lán)、紫之間顏色變化的分辨能力最弱。所以把相角為123度的橙色（紅黃之間的顏色）及其相反相角303度的青色定義為I軸。與I正交的色度信號軸叫Q軸。即色彩信號I表示人眼最敏感的色軸，Q表示人眼最不敏感的色軸。YIQ彩色空間úúú?ùêêê?éúúú?ùêêê?é---=úúú?ùêêê?éBGRQIY311.0523.0212.0321.0275.0596.0114.0587.0299.0YIQ與RGB彩色空間變換的對應(yīng)關(guān)系：在NTSC制式（美、加）中，傳送人眼分辨能力較強(qiáng)的I信號時，用較寬的頻帶（1.3～1.5MHz）；而傳送人眼分辨能力較弱的Q信號時，用較窄的頻帶（0.5MHz）。Y分量的帶寬是4.2MHz。YCbCr彩色空間是由ITU-R（國際電聯(lián)無線標(biāo)準(zhǔn)部，原國際無線電咨詢委員會CCIR）制定的彩色空間。按照CCIR601-2標(biāo)準(zhǔn)，將非線性的RGB信號編碼成（數(shù)字化）YCbCr，編碼過程開始是先采用符合SMPTE-CRGB（它定義了三種熒光粉，即一種參考白光，應(yīng)用于演播室監(jiān)視器及電視接收機(jī)標(biāo)準(zhǔn)的RGB）的基色作為r校正信號。YCbCr彩色空間YCbCr與RGB彩色空間變換的對應(yīng)關(guān)系如下所示。YCbCr是針對數(shù)字圖像壓縮提出的彩色空間。實際上很多時候，我們是把YUV和YIQ/YCrCb模型混為一談的。YUV模型用于PAL制式的電視系統(tǒng)，Y表示亮度，UV并非任何單詞的縮寫。YIQ模型與YUV模型類似，用于NTSC制式的電視系統(tǒng)。YIQ顏色空間中的I和Q分量相當(dāng)于將YUV空間中的UV分量做了一個33度的旋轉(zhuǎn)。YCbCr顏色空間是由YUV顏色空間派生的一種顏色空間，主要用于數(shù)字電視系統(tǒng)中。從RGB到Y(jié)CbCr的轉(zhuǎn)換中，輸入、輸出都是8位二進(jìn)制格式。úúú?ùêêê?é+úúú?ùêêê?é-----=úúú?ùêêê?éBG081.0419.0500.0500.0331.0169.0114.0587.0299.0RCCYrbúúú?ùêêê?é1281280CMY顏色空間彩色印刷或彩色打印的紙張是不能發(fā)射光線的，因而印刷機(jī)或彩色打印機(jī)就只能使用一些能夠吸收特定的光波而反射其他光波的油墨或顏料。油墨或顏料的三基色是青（Cyan）、品紅（Magenta）和黃（Yellow），簡稱為CMY。青色對應(yīng)藍(lán)綠色，品紅對應(yīng)紫紅色。理論上說，任何一種由顏料表現(xiàn)的顏色都可以用這三種基色按不同的比例混合而成，這種顏色表示方法稱為CMY顏色空間表示法。彩色打印機(jī)和彩色印刷系統(tǒng)都采用CMY顏色空間。CMY顏色空間相減混色：它減少了為視覺系統(tǒng)識別顏色所需要的反射光。在CMY相減混色中，三基色等量相減時得到黑色；等量黃色（Y）和品紅（M）相減而青色（C）為0時，得到紅色（R）；等量青色（C）和品紅（M）相減而黃色（Y）為0時，得到藍(lán)色（B）；等量黃色（Y）和青色（C）相減而品紅（M）為0時，得到綠色（G）。RGB空間與CMY空間的互補(bǔ)關(guān)系CMY空間正好與RGB空間互補(bǔ)，也即用白色減去RGB空間中的某一顏色值就等于同樣顏色在CMY空間中的值。2.5.2彩色圖像信號編碼對于彩色圖像信號數(shù)字壓縮編碼，可以采用兩種不同的編解碼方案：一種是復(fù)合編碼，它直接對復(fù)合圖像信號進(jìn)行采樣、編碼和傳輸；另一種是分量編碼，它首先把復(fù)合圖像中的亮度和色度信號分離出來，然后分別進(jìn)行取樣、編碼和傳輸。分量編碼是圖像信號壓縮編碼的主流（圖像壓縮國際標(biāo)準(zhǔn)）。Q：什么是彩色的三參量，什么是彩色的三基色，RGB、YUV、YIQ、CMY等彩色空間那些實現(xiàn)了亮色分離？彩色圖像信號分量編碼系統(tǒng)的基本框圖為了便于國際節(jié)目的交換及數(shù)字設(shè)備的互操作，CCIR（ITU－R）頒布了分量電視信號數(shù)字編碼標(biāo)準(zhǔn)ITU-RBT.601（CCIR601）（俗稱D1，標(biāo)清）。組成：亮度、色差信號8比特均勻量化采樣頻率13.5MHZPAL：fs=625（行/幀）25（幀/s）864（樣點(diǎn)數(shù)/行）NTSC：fs=52529.97858每一行有效樣本數(shù)均為720個2.6數(shù)字視頻的分量傳輸ITU-RBT.601推薦亮度采樣結(jié)構(gòu)2.6.1圖像子采樣4：2：2（ITU-RBT.601推薦）Y：Cb：Cr：取樣點(diǎn)的位置：525行系統(tǒng)：

M=720，N=480，60Hz刷新頻率Y=720480，Cb=Cr=360480625行系統(tǒng)：

M=720，N=576，50Hz刷新頻率

Y=720576，Cb=Cr=36057612345M水平像素123N垂直像素像素

電視演播室應(yīng)用的國際標(biāo)準(zhǔn)4：2：0123N垂直像素12345M水平像素像素與4:2:2具有相同亮度分辨率，色度分辨率降低為前者一半隔行掃描用于數(shù)字廣播電視525行系統(tǒng)：Y=720480，Cb=Cr=360240625行系統(tǒng)：Y=720576，Cb=Cr=360288問題：這兩種采樣格式下，彩色電視信號數(shù)字化后，存儲每幀所需的存儲容量及1小時電視/電影所需的存儲容量？SIF（源中間格式）水平和垂直分辨率為4:2:0格式的一半（亞取樣）刷新速率（時間分辨率）減半：30/25Hz接收時進(jìn)行插值計算主要用于存儲CIF（通用中間格式）結(jié)合625行系統(tǒng)的空間分辨率、525行系統(tǒng)的時間分辨率Y=352288，Cb=Cr=176144，30Hz取樣點(diǎn)與SIF同主要用于電視會議為轉(zhuǎn)換到CIF格式，則525行系統(tǒng)需要行頻轉(zhuǎn)換器，而625行系統(tǒng)需要幀頻轉(zhuǎn)換器。QCIF（四分之一通用中間格式）水平和垂直分辨率為CIF的1/2時間分辨率為CIF的1/2或1/4Y=176144，Cb=Cr=8872，15Hz/7.5Hz用于可視電話S-QCIF（標(biāo)準(zhǔn)四分之一通用中間格式）更低分辨率用于調(diào)制解調(diào)器和PSTN提供的信道Y=12896，Cb=Cr=64482.7.1傅里葉變換二維連續(xù)傅里葉變換定義：設(shè)f(x,y)是獨(dú)立變量x和y的函數(shù)，且在±∞上絕對可積，則定義積分為二維連續(xù)函數(shù)f(x,y)的傅里葉變換，并定義

為F(u,v)的逆變換。f(x,y)和F(u,v)為傅里葉變換對。2.7圖像信號變換2.7.1傅里葉變換二維離散傅里葉變換尺寸為M×N的離散圖像函數(shù)f(x,y)的DFT反變換可以通過對F(u,v)求IDFT獲得

2.7.1傅里葉變換二維離散傅里葉變換

F(u,v)即為f(x,y)的頻譜，通常是復(fù)數(shù)：幅度譜

相位譜

2.7.1傅里葉變換幅度譜的特點(diǎn)

①頻譜的直流成分為，說明在頻譜原點(diǎn)的傅里葉變換F(0,0)等于圖像的平均灰度級。②幅度譜|F(u,v)|關(guān)于原點(diǎn)對稱，即

。③圖像f(x,y)平移后，幅度譜不發(fā)生變化，僅有相位發(fā)生變化。2.7.1傅里葉變換

（a）原始圖像（b）圖像的頻譜圖（c）中心化的頻譜圖傅里葉變換2.7.2離散余弦變換一維離散余弦變換

保證變換基的規(guī)范正交性，引入常量C(k)，定義：其中DCT逆變換為2.7.2離散余弦變換

二維離散余弦變換

正變換：逆變換：線性組合2.7.2離散余弦變換二維離散余弦變換

（a）wpeppers2圖像（b）wpeppers2圖像的DCT系數(shù)

離散余弦變換

2.7.3沃爾什-哈達(dá)瑪變換

哈達(dá)瑪矩陣：元素僅由＋1和－1組成的正交方陣。正交方陣：指它的任意兩行（或兩列）都彼此正交，或者說它們對應(yīng)元素之和為零。哈達(dá)瑪變換要求圖像的大小為N＝2n

。一維哈達(dá)瑪變換核為其中，bk(z)代表z的二進(jìn)制表示的第k位值。2.7.3沃爾什-哈達(dá)瑪變換

一維哈達(dá)瑪正變換一維哈達(dá)瑪逆變換二維哈達(dá)瑪正變換二維哈達(dá)瑪逆變換2.7.3沃爾什-哈達(dá)瑪變換

正反變換都可通過兩個一維變換實現(xiàn)。高階哈達(dá)瑪矩陣可以通過如下遞推公式求得：N＝8的哈達(dá)瑪矩陣為2.8.1基本統(tǒng)計分析量2.8圖像的統(tǒng)計特性圖像熵圖像的灰度平均值（mean）2.8.2直方圖2.8圖像的統(tǒng)計特性直方圖的橫坐標(biāo)是圖像的各灰度級，縱坐標(biāo)是各個灰度出現(xiàn)的像素個數(shù)。歸一化的直方圖（histogram）定義為灰度級出現(xiàn)的相對頻率。即

式中，N表示像素的總數(shù)；nk表示灰度級為k的像素的數(shù)目。2.8.2直方圖2.8圖像的統(tǒng)計特性直方圖（a）lena圖像（b）lena圖像的直方圖2.9.1空域增強(qiáng)2.9圖像增強(qiáng)技術(shù)灰度分段線性變換對整個灰度區(qū)間進(jìn)行分段，采用分段線性函數(shù)進(jìn)行變換。這種變換突出了感興趣的目標(biāo)或灰度區(qū)間，相對抑制那些不感興趣的灰度區(qū)間。常用的是三段線性變換。三段線性變換為了將圖像灰度級的整個范圍或一段范圍擴(kuò)展或壓縮到記錄或顯示設(shè)備的動態(tài)范圍內(nèi)，可以采用灰度變換方法，使圖像動態(tài)范圍增大，圖像對比度擴(kuò)展。2.9.1空域增強(qiáng)2.9圖像增強(qiáng)技術(shù)灰度分段線性變換對灰度區(qū)間[a,b]進(jìn)行了線性拉伸，而灰度區(qū)間[0,a]和[b,fmax]則被壓縮。調(diào)整折線拐點(diǎn)的位置并控制分段直線的斜率，可以對圖像的任一灰度區(qū)間進(jìn)行拉伸或壓縮。在遙感圖像分類中，感興趣的地貌特征可能有明顯的灰度變化，而那些過黑或過白的像素往往對應(yīng)于玄武巖、水、冰等。2.9.1空域增強(qiáng)2.9圖像增強(qiáng)技術(shù)灰度分段線性變換三段線性變換實例

（a）原始圖像（b）增強(qiáng)效果2.9.1空域增強(qiáng)2.9圖像增強(qiáng)技術(shù)灰度非線性變換

當(dāng)用某些非線性函數(shù)如對數(shù)、指數(shù)函數(shù)等作為映射函數(shù)時，可實現(xiàn)灰度的非線性變換。對數(shù)變換的一般表達(dá)式為：

=a+clg(f+1)對數(shù)變換可以增強(qiáng)低灰度級的像素，擴(kuò)展低灰度區(qū)，壓制高灰度級的像素，使灰度分布與人的視覺特性相匹配。2.9.1空域增強(qiáng)2.9圖像增強(qiáng)技術(shù)灰度非線性變換

對數(shù)變換后的Couple圖像2.9.1空域增強(qiáng)2.9圖像增強(qiáng)技術(shù)直方圖均衡化

通過對原圖像進(jìn)行某種變換，使得圖像的直方圖變?yōu)榫鶆蚍植嫉闹狈綀D?；叶燃夁B續(xù)的灰度圖像：當(dāng)變換函數(shù)是原圖像直方圖的累積分布函數(shù)時，能達(dá)到直方圖均衡化的目的。對于灰度級離散的數(shù)字圖像，用頻率來代替概率。2.9.1空域增強(qiáng)2.9圖像增強(qiáng)技術(shù)直方圖均衡化

直方圖均衡2.9.1空域增強(qiáng)2.9圖像增強(qiáng)技術(shù)均值濾波

大部分的噪聲都可以看作是隨機(jī)信號，對圖像的影響可以看作是孤立的。某一像素，如果它與周圍像素點(diǎn)相比，有明顯的不同，則可以認(rèn)為該點(diǎn)被噪聲感染了。圖像f(x,y)鄰域S的平均g(x,y)可以表示為

2.9.1空域增強(qiáng)2.9圖像增強(qiáng)技術(shù)均值濾波

3×3模板平滑處理示意圖2.9.1空域增強(qiáng)2.9圖像增強(qiáng)技術(shù)均值濾波

常用的模板

2.9.1空域增強(qiáng)2.9圖像增強(qiáng)技術(shù)均值濾波

平滑處理的實例

（a）原始圖像（b）有噪聲的圖像（c）用

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

第二章視覺特性及圖像制式

文檔簡介

溫馨提示

最新文檔

評論

第二章 視覺特性及圖像制式

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔

第二章視覺特性及圖像制式