版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
本章內容簡介視覺感知數(shù)字圖像的概念與描述圖像的數(shù)字化數(shù)字圖像的存儲格式灰度直方圖1目前一頁\總數(shù)五十頁\編于二十點2.1視覺感知圖像處理的研究需要了解人類視覺機理:人們能夠區(qū)分的光強度差別有多大?我們眼睛的空間清晰度是多少?對運動的感覺如何?我們估計和比較距離和面積的精度是多少?人類特性視覺的光譜是怎樣的?人的視覺中彩色起什么作用?人類是如何獲得視覺感知,如何認知周圍事物的?人們對于自己視覺機構的生物、生理、物理過程的了解,以及神經(jīng)、精神方面的了解還處于低級階段,認識還很不完善,還有很大的局限性。2目前二頁\總數(shù)五十頁\編于二十點人眼構造3目前三頁\總數(shù)五十頁\編于二十點視桿細胞與視錐細胞視網(wǎng)膜上有桿狀細胞和錐狀細胞兩類視覺接收器;視桿細胞(Rodcell):細長而薄,數(shù)量上約1.2億個,它們提供暗視(ScotopicVision),即在低幾個數(shù)量級亮度時的視覺響應,其光靈敏度高。視錐細胞(Conecell):結構上短而粗,數(shù)量少,約600萬~700萬,光靈敏度較低,它們提供明視(PhotopicVision),其響應光亮度范圍比視桿細胞要高5~6個數(shù)量級。在中間亮度范圍是兩種視覺細胞同時起作用。視錐體集中分布在視網(wǎng)膜中心。4目前四頁\總數(shù)五十頁\編于二十點視覺感知視覺感知是視覺的內在表象。視覺感知包括兩個不同的感知層次:視覺的低級感知層次視覺的高級感知層次5目前五頁\總數(shù)五十頁\編于二十點視覺低級感知層次視覺系統(tǒng)從外界獲取圖像。眼睛視網(wǎng)膜上獲得周圍世界的光學信號,然后視覺接收器發(fā)生光電化學反應(桿狀細胞和錐狀細胞在視網(wǎng)膜上作為視覺接收器),產生視神經(jīng)脈沖,從而將光圖像信息轉化為視網(wǎng)膜的神經(jīng)活動電信息,最后通過視神經(jīng)纖維,把這些圖像信息傳送入大腦,由大腦獲得圖像感知。視覺系統(tǒng)的可視波長范圍為=380nm~780nm;視覺系統(tǒng)的可響應的亮度范圍是:1~10個量級的幅度范圍。6目前六頁\總數(shù)五十頁\編于二十點視覺高級感知層次大腦對視神經(jīng)纖維傳送來的圖像信息進行分析和理解,通過圖像獲得對周圍世界感知的信息和知識。人們對大腦的高級感知層次至今知之甚少,仍是生理學、神經(jīng)科學、生物物理學、生物化學研究的重要課題。7目前七頁\總數(shù)五十頁\編于二十點視覺和視覺感知“視覺是一個信息處理過程。它能從外部世界的圖像中得到一個即對觀察者有用又不受無關信息干擾的描述。”“視覺感知又是和過去留存于記憶中的同類活動有關,視覺儲積起大量的視覺意象。記憶形象可用于對知覺對象的辨認,解釋和補充?!笔褂嬎銠C具有人類視覺能力,研究人類的視覺感知,模仿人類的視覺感知,是研究工作的重要途徑。8目前八頁\總數(shù)五十頁\編于二十點視覺特性視覺特性是視覺的外在表現(xiàn);圖像是周圍世界的一種映射,對于運動圖像,空間座標x,y,z都是時間t的函數(shù),若在連續(xù)的不同時間獲取圖像,可以獲得序列圖像對于按不同波段獲取圖像,可獲得彩色圖像或不同波段的圖像信號(如遙感圖像,醫(yī)學圖像等)。對于按不同視角,即不同的x,y,z間相互關系,可以得到不同視角的不同圖像。因此,視覺特性包括有視覺對光強,對各種波長、彩色的光譜效應,對物體邊緣等空間頻率變化的響應,以及視覺對時間瞬時變化運動的響應。9目前九頁\總數(shù)五十頁\編于二十點相對視敏函數(shù)人眼對不同波長的光有不同的敏感度,不同波長而幅射功率相同的光不僅給人以不同的色彩感覺,而且亮度感覺也不同。視敏函數(shù):描述人眼視敏特性的物理量為視敏函數(shù)和相對視敏函數(shù)。在相同亮度感覺的條件下,不同波長光輻射功率的倒數(shù)用來衡量人眼對各波長光明亮感覺的敏感程度。對于人眼,是鐘形曲線。10目前十頁\總數(shù)五十頁\編于二十點相對視敏曲線視桿細胞和視錐細胞的相對視敏曲線有所不同,對視錐細胞情況,在=555nm時綠光亮度最敏感,對視桿細胞暗視情況,則=505nm時綠光最敏感。
11目前十一頁\總數(shù)五十頁\編于二十點對比靈敏度在均勻照度背景I上,有一照度為I+△I的光斑,稱眼睛剛好能分辨出的照度差△I與I的比(△I/I)為對比靈敏度;由于背景亮度I增大,△I也需要增大,因此在相當寬的強度范圍內,對比靈敏度是一個常數(shù),約等于0.02,這個比值稱為韋伯比(Weber比)。亮度很強(弱)時不為常數(shù)。12目前十二頁\總數(shù)五十頁\編于二十點同時對比度在相同亮度的刺激下,由于背景亮度不同,人眼所感受到的主觀亮度不同,這種效應稱為同時對比度。由于同時對比是由亮度差別引起的,故也稱為亮度對比。相對應的還有色度對比。
13目前十三頁\總數(shù)五十頁\編于二十點馬赫帶Mach在1865年討論了“Mach帶”現(xiàn)象“Mach帶”一條有均勻黑的區(qū)域和均勻白的區(qū)域每級階躍的灰度差相同“Mach帶”,人們在觀察現(xiàn)象:每個條帶內灰度是不均勻的每級階梯的右邊比左邊更暗14目前十四頁\總數(shù)五十頁\編于二十點人類視覺感知能力的特點人類視覺系統(tǒng)在對物體的識別上有特殊強大的功能;但在對灰度、距離和面積的絕對的估計上卻有某些欠缺;以傳感器單元的數(shù)目比較:視網(wǎng)膜包含接近1.3億個光接收器,這極大的大于CCD片上的傳感器單元數(shù);和它每次執(zhí)行運算的數(shù)目比較:和計算機的時鐘頻率相比,神經(jīng)處理單元的開關時間將比之大約慢倍;不論這慢的定時和大量的接收器,人類的視覺系統(tǒng)是比計算機視覺系統(tǒng)要強大得多。它能實時分析復雜的景物以使我們能即時的反應。目前十五頁\總數(shù)五十頁\編于二十點2.2數(shù)字圖像的概念與描述所謂的數(shù)字圖像的描述是指如何用一個數(shù)值方式來表示一個圖像。數(shù)字圖像是圖像的數(shù)字表示,像素是其最小的單位??梢杂镁仃噥砻枋鰯?shù)字圖像。描述數(shù)字圖像的矩陣目前采用的是整數(shù)陣,即每個像素的亮暗,用一個整數(shù)來表示。16目前十六頁\總數(shù)五十頁\編于二十點數(shù)字圖像的概念與描述
——
圖像的坐標系矩陣是按照行列的順序來定位數(shù)據(jù)的,但是圖像是在平面上定位數(shù)據(jù)的,所以有一個坐標系定義上的特殊性。為了實現(xiàn)方便起見,這里以矩陣坐標系來定義圖像的坐標。行(i)列(j)矩陣A(i,j)矩陣坐標系X軸(i)Y軸(j)圖像f(i,j)直角坐標系17目前十七頁\總數(shù)五十頁\編于二十點數(shù)字圖像的概念與描述
——
黑白圖像黑白圖像是指圖像的每個像素只能是黑或者白,沒有中間的過渡,故又稱為2值圖像。2值圖像的像素值為0、1。18目前十八頁\總數(shù)五十頁\編于二十點數(shù)字圖像的概念與描述
——
灰度圖像灰度圖像是指每個像素的信息由一個量化的灰度級來描述的圖像,沒有彩色信息。19目前十九頁\總數(shù)五十頁\編于二十點數(shù)字圖像的概念與描述
——
彩色圖像彩色圖像是指每個像素的信息由RGB三原色構成的圖像,其中RGB是由不同的灰度級來描述的。彩色圖像不能用一個矩陣來描述了,一般是用三個矩陣同時來描述。20目前二十頁\總數(shù)五十頁\編于二十點2.3圖像的數(shù)字化我們日常生活中見到的圖像一般是連續(xù)形式的模擬圖像,可由一個二維連續(xù)函數(shù)f(x,y)來描述。其中:
(x,y)是圖像平面上任意一個二維坐標點,f(x,y)則是該點顏色的深淺。數(shù)字圖像處理的一個先決條件就是將連續(xù)圖像經(jīng)采樣、量(離散)化,轉換為數(shù)字圖像。21目前二十一頁\總數(shù)五十頁\編于二十點圖像的數(shù)字化數(shù)字化的過程也稱為A/D轉換:是將光電傳感器產生的模擬量轉換為數(shù)字量,以便計算機處理;轉換過程:采樣、量化、編碼;轉換精度:ADC位數(shù);轉換速度:采樣速率;量化誤差。22目前二十二頁\總數(shù)五十頁\編于二十點圖像的數(shù)字化經(jīng)數(shù)字化的圖像方可用計算機來處理。圖像f(x,y)必須在空間上和在顏色深淺的幅度上都進行數(shù)字化:空間坐標(x,y)的數(shù)字化被稱為圖像采樣;顏色深淺幅度的數(shù)字化被稱為灰度級量化。23目前二十三頁\總數(shù)五十頁\編于二十點圖像的數(shù)字化
——采樣間隔采樣時的注意點是:采樣間隔的選取。采樣間隔太小,則增大數(shù)據(jù)量;采樣間隔太大,則會發(fā)生信息的混疊,導致細節(jié)無法辨認。24目前二十四頁\總數(shù)五十頁\編于二十點圖像的數(shù)字化
——采樣指標分辨率分辨率
是指映射到圖像平面上的單個像素的景物元素的尺寸。單位:像素/英寸,像素/厘米
(如:三星智能手機GALAXYS4顯示屏為441ppi)
分辨率
或者是指要精確測量和再現(xiàn)一定尺寸的圖像所必需的像素個數(shù)。
單位:像素×像素
(如:數(shù)碼相機指標1210萬像素(4000×3000))25目前二十五頁\總數(shù)五十頁\編于二十點圖像的數(shù)字化
——量化概念量化是將各個像素所含的明暗信息離散化后,用數(shù)字來表示。一般的量化值為整數(shù)。充分考慮到人眼的識別能力之后,目前非特殊用途的圖像均為8bit量化,即采用0~255的整數(shù)來描述“從黑到白”。在3bit以下的量化,會出現(xiàn)偽輪廓現(xiàn)象。26目前二十六頁\總數(shù)五十頁\編于二十點圖像的數(shù)字化
——量化方法量化可分為均勻量化和非均勻量化。均勻量化是簡單地在灰度范圍內等間隔量化。非均勻量化是對像素出現(xiàn)頻度少的部分量化間隔取大,而對出現(xiàn)頻度大的部分量化間隔取小。
一般情況下,對灰度變化比較平緩的部分用比較多的量化級。27目前二十七頁\總數(shù)五十頁\編于二十點圖像質量的確定數(shù)字化時,關鍵是要決定:采樣點數(shù)M×N
(行和列)量化級別G
(灰度級數(shù))為了便于處理,采樣點數(shù)N與量化級別G都為2的冪次方,即M=2m,N=2n
,G=2k
(m,n,k均為正整數(shù))。記錄一幅圖像所需的字節(jié)(byte)B可由下式計算:
B=M×N×k÷8實際上:M、N一般取64、128、256、640、1024、1240等值;k一般取1、4、8、16、24、32等值。一般地說,圖像質量隨M、N和k的增加而增高。28目前二十八頁\總數(shù)五十頁\編于二十點采樣傳感器采樣傳感器CCD(ChargeCoupleDevice):電荷耦合器件;CMOS(ComplementaryMetalOxideSemiconductor):互補性金屬氧化物半導體。29目前二十九頁\總數(shù)五十頁\編于二十點CCDCCD是20世紀70年代初發(fā)展起來的半導體器件。CCD以電荷為信號,而不是以電壓為信號。CCD利用感光二極管(photodiode)進行光電轉換,將圖像轉換為數(shù)字數(shù)據(jù).CCD的基本功能是電荷的產生、存儲和轉移。其基本原理是:通過光學系統(tǒng)將景物成像在CCD象敏面上,象敏面將照在每一個象敏單元上的光照強度轉換為電荷存儲在象敏單元中,然后再轉移到CCD的移位寄存器中,在驅動脈沖的作用下順序移出器件,形成強弱不同的電信號。30目前三十頁\總數(shù)五十頁\編于二十點CCD的三層結構第一層“微型鏡頭”:CCD成像的關鍵是在于其感光層,為了擴展CCD的采光率,必須擴展單一像素的受光面積,增加感光面積。第二層“分色濾色片”:有兩種分色方式,一是RGB原色分色法,另一個則是CMYK補色分色法。這兩種方法各有優(yōu)缺點。第三層感光層:主要是負責將穿過濾色層的光源轉換成電子信號,并將信號傳送到影像處理芯片,將影像還原。目前三十一頁\總數(shù)五十頁\編于二十點線陣CCD:單元數(shù)有:256,1024,2048,4096等;面陣CCD:目前三十二頁\總數(shù)五十頁\編于二十點CMOSCMOS和CCD一樣都是可用來感受光線變化的半導體。CMOS是利用硅和鍺兩種元素做成的半導體,通過CMOS上帶負電和帶正電的晶體管來實現(xiàn)基本功能的。產生的電流即可被處理芯片紀錄和解讀成影像。CMOS針對CCD最主要的優(yōu)勢是價格低廉、制造工藝較簡單且非常省電,其耗電量只有普通CCD的1/3左右。CMOS傳感器可以在每個像素基礎上進行信號放大,采用這種方法可以進行快速數(shù)據(jù)掃描;CMOS主要問題是在處理快速變化的影像時,由于電流變化過于頻繁而過熱。但是現(xiàn)在CMOS絕非只局限于簡單的應用,也在發(fā)展高清系列。33目前三十三頁\總數(shù)五十頁\編于二十點2.4數(shù)字圖像的存儲格式數(shù)字圖像是由排成矩形點陣的像素組成的。圖像有不同的編碼方式:無壓縮、無損壓縮、有損壓縮。圖像文件通常與操作系統(tǒng)有關:Windows、Linux、Mac;把一幅圖像記錄進文件時,必須同時記錄下各像素在點陣中的位置及像素的灰度值。實際上我們可以利用各像素在文件中的記錄位置來表示其在圖像點陣中的位置,這樣就可以省去記錄像素位置坐標的數(shù)據(jù)量,而各像素的數(shù)據(jù)只用來記錄其灰度值。34目前三十四頁\總數(shù)五十頁\編于二十點數(shù)字圖像的存儲格式(二)圖像的尺寸(長與寬,均以像素為單位)通常記錄在文件頭(header)中。文件頭是有關圖像整體的信息數(shù)據(jù)塊,除記錄圖像的尺寸外,還記錄諸如像素的位長、圖像的顏色表等有關信息。文件頭之后才是圖像的數(shù)據(jù)流。因此,圖像數(shù)據(jù)文件是文件頭加數(shù)據(jù)流。35目前三十五頁\總數(shù)五十頁\編于二十點數(shù)字圖像的存儲格式(三)圖像數(shù)據(jù)的文件格式隨著圖像的各種信息的內容取舍與記錄次序的不同而異。其中,關于圖像數(shù)據(jù)的記錄方式基本相同,主要的差異在于header的內容。應用較廣,比較常見的靜態(tài)圖像文件格式有:RAW、BMP/DIB、JPEG、Tiff、Gif、WMF。常見的動態(tài)圖像文件格式有:MPEG4、SWF(ShockwaveFormat)、AVI、nAVI、rm、rmvb、MOV、MKV……36目前三十六頁\總數(shù)五十頁\編于二十點數(shù)字圖像的存儲----位圖文件Bmp是MicrosoftWindows設備無關位圖(MicrosoftDeviceIndependentBitmap)文件,又稱為DIB。是Windows操作系統(tǒng)的標準文件格式。Bmp可以包含每個像素1位、4位、8位或24位的圖像。其中1、4和8位圖形有彩色映像(調色板),而24位元圖像則是全彩(TrueColor)。優(yōu)點:在MicrosoftWindows下得到廣泛使用。缺點:除了MicrosoftWindows外,無法在其他環(huán)境下使用。37目前三十七頁\總數(shù)五十頁\編于二十點數(shù)字圖像的存儲位圖文件
——文件的總體結構
文件頭
BITMAPFILEHEADER
信息頭
BITMAPINFOHEADER
調色板
RGBQUAD
數(shù)據(jù)區(qū)
文件頭
BITMAPFILEHEADER
信息頭
BITMAPINFOHEADER
數(shù)據(jù)區(qū)
像素的RGB值
像素的調色板索引值真彩色模式索引色模式38目前三十八頁\總數(shù)五十頁\編于二十點數(shù)字圖像的存儲位圖文件
——文件頭信息
文件頭BITMAPFILEHEADERbfType文件類型標識“BM”bfSize文件總字節(jié)數(shù)(包括文件頭的14字節(jié))bfOffBits從文件頭到實際的位圖數(shù)據(jù)的偏移字節(jié)數(shù)39目前三十九頁\總數(shù)五十頁\編于二十點數(shù)字圖像的存儲位圖文件
——信息頭信息biSize信息頭結構體長度,為40biWidth圖像寬度,單位是像素
biHeight圖像高度,單位是像素
biPlanes必須為1,暫無意義
biCompression指定位圖是否壓縮
biSizeImage實際位圖數(shù)據(jù)所占字節(jié)數(shù)
biXperlsPerMeter位圖水平分辨率,每米像素數(shù)
biYperlsPerMeter位圖垂直分辨率,每米像素數(shù)
信息頭
BITMAPINFOHEADER40目前四十頁\總數(shù)五十頁\編于二十點數(shù)字圖像的存儲位圖文件
——索引色模式的調色板
調色板RGBQUAD索引值RGB1R1G1B12R2G2B2
::::NRNGNBN41目前四十一頁\總數(shù)五十頁\編于二十點數(shù)字圖像的存儲位圖文件
——索引色模式的數(shù)據(jù)區(qū)索引值RGB1R1G1B12R2G2B2
::::NRNGNBN
數(shù)據(jù)區(qū)像素的調色板索引值42目前四十二頁\總數(shù)五十頁\編于二十點矢量圖矢量(Vector)圖:亦稱向量圖,是用稱之為矢量的直線、曲線、多邊形和填充的色塊來描繪圖形的??梢詿o限放大圖形中的細節(jié),不用擔心會造成失真和色塊。矢量圖文件比點陣圖文件存儲空間要小很多。一般地,矢量圖是圖形。A類型:line起點坐標xx.xxx,yy.yyyy終點坐標xx.xxx,yy.yyyy顏色、線型、線寬類型:文字起點坐標xx.xxx,yy.yyyy顏色、字體、字型、字號43目前四十三頁\總數(shù)五十頁\編于二十點常見的靜態(tài)圖像文件格式(一)JPEG全稱為(JointPhotographicExptrsGroup,聯(lián)合圖像專家組),是24位的圖像文件格式。JPEG文件格式是面向連續(xù)色調靜止圖像的一種壓縮標準。
JPEG格式是目前網(wǎng)絡上最流行的圖像格式。JPEG壓縮技術十分先進,它用有損壓縮方式去除冗余的圖像數(shù)據(jù)。JPEG格式壓縮的主要是高頻信息,對色彩的信息保留較好,適合應用于互聯(lián)網(wǎng),可減少圖像的傳輸時間。JPEG是一種很靈活的格式,具有調節(jié)圖像質量的功能,允許用不同的壓縮比例對文件進行壓縮,支持多種壓縮級別,壓縮比率通常在10:1到40:1之間,壓縮比越大,品質就越低;相反地,品質就越高。44目前四十四頁\總數(shù)五十頁\編于二十點常見的靜態(tài)圖像文件格式(二)TIFF――TagImageFileFormat,標簽圖像文件格式。是一種跨平臺的位圖格式,不針對某個特定的操作平臺,可用于多種操作平臺和應用軟件。數(shù)據(jù)結構是可變的,文件具有可改寫性,程序員可以修改原始
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 建筑鋼管租賃合同模板
- 2024年檢測服務合作協(xié)議模板版
- 木方庫房轉讓合同模板
- 餐飲連鎖用工合同模板
- 電商英文合同模板
- 新舊購房合同模板區(qū)別大
- 采購倉儲設備合同模板
- 裝修拉圾運輸合同模板
- 基金備案律師合同模板
- 應聘中介勞務合同模板
- 2024年浙江中煙工業(yè)限責任公司公開招聘136人高頻難、易錯點500題模擬試題附帶答案詳解
- GB/T 5510-2024糧油檢驗谷物及制品脂肪酸值的測定
- 小學勞動教育一年級下冊第二單元第3課《削果皮》課件
- GB/T 22838.6-2024卷煙和濾棒物理性能的測定第6部分:硬度
- 第三單元數(shù)一數(shù)與乘法《兒童樂園》(教學設計)-2024-2025學年北師大版數(shù)學二年級上冊
- 部編2024版歷史七年級上冊第三單元《第13課 東漢的興衰》教案
- 英語雅思8000詞匯表
- 2024年小工廠入股合作協(xié)議書范文模板
- 2024人教版道法七年級上冊第二單元:成長的時空大單元整體教學設計
- 職業(yè)技能大賽-網(wǎng)站設計與開發(fā)競賽理論知識題庫(附參考答案)
- 教科版二年級上冊期中檢測科學試卷
評論
0/150
提交評論