版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
視覺感知與圖像的基本概念詳解演示文稿現(xiàn)在是1頁\一共有49頁\編輯于星期二(優(yōu)選)視覺感知與圖像的基本概念現(xiàn)在是2頁\一共有49頁\編輯于星期二32.1視覺感知圖像處理的研究需要了解人類視覺機理:人們能夠區(qū)分的光強度差別有多大?我們眼睛的空間清晰度是多少?對運動的感覺如何?我們估計和比較距離和面積的精度是多少?人類特性視覺的光譜是怎樣的?人的視覺中彩色起什么作用?人類是如何獲得視覺感知,如何認知周圍事物的?人們對于自己視覺機構(gòu)的生物、生理、物理過程的了解,以及神經(jīng)、精神方面的了解還處于低級階段,認識還很不完善,還有很大的局限性。現(xiàn)在是3頁\一共有49頁\編輯于星期二4人眼構(gòu)造現(xiàn)在是4頁\一共有49頁\編輯于星期二5視桿細胞與視錐細胞視網(wǎng)膜上有桿狀細胞和錐狀細胞兩類視覺接收器;視桿細胞(Rodcell):細長而薄,數(shù)量上約1.2億個,它們提供暗視(ScotopicVision),即在低幾個數(shù)量級亮度時的視覺響應(yīng),其光靈敏度高。視錐細胞(Conecell):結(jié)構(gòu)上短而粗,數(shù)量少,約600萬~700萬,光靈敏度較低,它們提供明視(PhotopicVision),其響應(yīng)光亮度范圍比視桿細胞要高5~6個數(shù)量級。在中間亮度范圍是兩種視覺細胞同時起作用。視錐體集中分布在視網(wǎng)膜中心?,F(xiàn)在是5頁\一共有49頁\編輯于星期二視覺感知視覺感知是視覺的內(nèi)在表象。視覺感知包括兩個不同的感知層次:視覺的低級感知層次視覺的高級感知層次6現(xiàn)在是6頁\一共有49頁\編輯于星期二視覺低級感知層次視覺系統(tǒng)從外界獲取圖像。眼睛視網(wǎng)膜上獲得周圍世界的光學信號,然后視覺接收器發(fā)生光電化學反應(yīng)(桿狀細胞和錐狀細胞在視網(wǎng)膜上作為視覺接收器),產(chǎn)生視神經(jīng)脈沖,從而將光圖像信息轉(zhuǎn)化為視網(wǎng)膜的神經(jīng)活動電信息,最后通過視神經(jīng)纖維,把這些圖像信息傳送入大腦,由大腦獲得圖像感知。視覺系統(tǒng)的可視波長范圍為=380nm~780nm;視覺系統(tǒng)的可響應(yīng)的亮度范圍是:1~10個量級的幅度范圍。7現(xiàn)在是7頁\一共有49頁\編輯于星期二8視覺高級感知層次大腦對視神經(jīng)纖維傳送來的圖像信息進行分析和理解,通過圖像獲得對周圍世界感知的信息和知識。人們對大腦的高級感知層次至今知之甚少,仍是生理學、神經(jīng)科學、生物物理學、生物化學研究的重要課題?,F(xiàn)在是8頁\一共有49頁\編輯于星期二9視覺和視覺感知“視覺是一個信息處理過程。它能從外部世界的圖像中得到一個即對觀察者有用又不受無關(guān)信息干擾的描述?!薄耙曈X感知又是和過去留存于記憶中的同類活動有關(guān),視覺儲積起大量的視覺意象。記憶形象可用于對知覺對象的辨認,解釋和補充?!笔褂嬎銠C具有人類視覺能力,研究人類的視覺感知,模仿人類的視覺感知,是研究工作的重要途徑。現(xiàn)在是9頁\一共有49頁\編輯于星期二10視覺特性視覺特性是視覺的外在表現(xiàn);圖像是周圍世界的一種映射,對于運動圖像,空間座標x,y,z都是時間t的函數(shù),若在連續(xù)的不同時間獲取圖像,可以獲得序列圖像對于按不同波段獲取圖像,可獲得彩色圖像或不同波段的圖像信號(如遙感圖像,醫(yī)學圖像等)。對于按不同視角,即不同的x,y,z間相互關(guān)系,可以得到不同視角的不同圖像。因此,視覺特性包括有視覺對光強,對各種波長、彩色的光譜效應(yīng),對物體邊緣等空間頻率變化的響應(yīng),以及視覺對時間瞬時變化運動的響應(yīng)?,F(xiàn)在是10頁\一共有49頁\編輯于星期二11相對視敏函數(shù)人眼對不同波長的光有不同的敏感度,不同波長而幅射功率相同的光不僅給人以不同的色彩感覺,而且亮度感覺也不同。視敏函數(shù):描述人眼視敏特性的物理量為視敏函數(shù)和相對視敏函數(shù)。在相同亮度感覺的條件下,不同波長光輻射功率的倒數(shù)用來衡量人眼對各波長光明亮感覺的敏感程度。對于人眼,是鐘形曲線?,F(xiàn)在是11頁\一共有49頁\編輯于星期二相對視敏曲線視桿細胞和視錐細胞的相對視敏曲線有所不同,對視錐細胞情況,在=555nm時綠光亮度最敏感,對視桿細胞暗視情況,則=505nm時綠光最敏感。
12現(xiàn)在是12頁\一共有49頁\編輯于星期二13對比靈敏度在均勻照度背景I上,有一照度為I+△I的光斑,稱眼睛剛好能分辨出的照度差△I與I的比(△I/I)為對比靈敏度;由于背景亮度I增大,△I也需要增大,因此在相當寬的強度范圍內(nèi),對比靈敏度是一個常數(shù),約等于0.02,這個比值稱為韋伯比(Weber比)。亮度很強(弱)時不為常數(shù)?,F(xiàn)在是13頁\一共有49頁\編輯于星期二14同時對比度在相同亮度的刺激下,由于背景亮度不同,人眼所感受到的主觀亮度不同,這種效應(yīng)稱為同時對比度。由于同時對比是由亮度差別引起的,故也稱為亮度對比。相對應(yīng)的還有色度對比。
現(xiàn)在是14頁\一共有49頁\編輯于星期二馬赫帶Mach在1865年討論了“Mach帶”現(xiàn)象“Mach帶”一條有均勻黑的區(qū)域和均勻白的區(qū)域每級階躍的灰度差相同“Mach帶”,人們在觀察現(xiàn)象:每個條帶內(nèi)灰度是不均勻的每級階梯的右邊比左邊更暗15現(xiàn)在是15頁\一共有49頁\編輯于星期二人類視覺感知能力的特點人類視覺系統(tǒng)在對物體的識別上有特殊強大的功能;但在對灰度、距離和面積的絕對的估計上卻有某些欠缺;以傳感器單元的數(shù)目比較:視網(wǎng)膜包含接近1.3億個光接收器,這極大的大于CCD片上的傳感器單元數(shù);和它每次執(zhí)行運算的數(shù)目比較:和計算機的時鐘頻率相比,神經(jīng)處理單元的開關(guān)時間將比之大約慢倍;不論這慢的定時和大量的接收器,人類的視覺系統(tǒng)是比計算機視覺系統(tǒng)要強大得多。它能實時分析復(fù)雜的景物以使我們能即時的反應(yīng)?,F(xiàn)在是16頁\一共有49頁\編輯于星期二172.2數(shù)字圖像的概念與描述所謂的數(shù)字圖像的描述是指如何用一個數(shù)值方式來表示一個圖像。數(shù)字圖像是圖像的數(shù)字表示,像素是其最小的單位??梢杂镁仃噥砻枋鰯?shù)字圖像。描述數(shù)字圖像的矩陣目前采用的是整數(shù)陣,即每個像素的亮暗,用一個整數(shù)來表示。現(xiàn)在是17頁\一共有49頁\編輯于星期二18數(shù)字圖像的概念與描述
——
圖像的坐標系矩陣是按照行列的順序來定位數(shù)據(jù)的,但是圖像是在平面上定位數(shù)據(jù)的,所以有一個坐標系定義上的特殊性。為了實現(xiàn)方便起見,這里以矩陣坐標系來定義圖像的坐標。行(i)列(j)矩陣A(i,j)矩陣坐標系X軸(i)Y軸(j)圖像f(i,j)直角坐標系現(xiàn)在是18頁\一共有49頁\編輯于星期二19數(shù)字圖像的概念與描述
——
黑白圖像黑白圖像是指圖像的每個像素只能是黑或者白,沒有中間的過渡,故又稱為2值圖像。2值圖像的像素值為0、1。現(xiàn)在是19頁\一共有49頁\編輯于星期二20數(shù)字圖像的概念與描述
——
灰度圖像灰度圖像是指每個像素的信息由一個量化的灰度級來描述的圖像,沒有彩色信息?,F(xiàn)在是20頁\一共有49頁\編輯于星期二21數(shù)字圖像的概念與描述
——
彩色圖像彩色圖像是指每個像素的信息由RGB三原色構(gòu)成的圖像,其中RGB是由不同的灰度級來描述的。彩色圖像不能用一個矩陣來描述了,一般是用三個矩陣同時來描述。現(xiàn)在是21頁\一共有49頁\編輯于星期二222.3圖像的數(shù)字化我們?nèi)粘I钪幸姷降膱D像一般是連續(xù)形式的模擬圖像,可由一個二維連續(xù)函數(shù)f(x,y)來描述。其中:
(x,y)是圖像平面上任意一個二維坐標點,f(x,y)則是該點顏色的深淺。數(shù)字圖像處理的一個先決條件就是將連續(xù)圖像經(jīng)采樣、量(離散)化,轉(zhuǎn)換為數(shù)字圖像?,F(xiàn)在是22頁\一共有49頁\編輯于星期二23圖像的數(shù)字化數(shù)字化的過程也稱為A/D轉(zhuǎn)換:是將光電傳感器產(chǎn)生的模擬量轉(zhuǎn)換為數(shù)字量,以便計算機處理;轉(zhuǎn)換過程:采樣、量化、編碼;轉(zhuǎn)換精度:ADC位數(shù);轉(zhuǎn)換速度:采樣速率;量化誤差?,F(xiàn)在是23頁\一共有49頁\編輯于星期二24圖像的數(shù)字化經(jīng)數(shù)字化的圖像方可用計算機來處理。圖像f(x,y)必須在空間上和在顏色深淺的幅度上都進行數(shù)字化:空間坐標(x,y)的數(shù)字化被稱為圖像采樣;顏色深淺幅度的數(shù)字化被稱為灰度級量化?,F(xiàn)在是24頁\一共有49頁\編輯于星期二25圖像的數(shù)字化
——采樣間隔采樣時的注意點是:采樣間隔的選取。采樣間隔太小,則增大數(shù)據(jù)量;采樣間隔太大,則會發(fā)生信息的混疊,導致細節(jié)無法辨認。現(xiàn)在是25頁\一共有49頁\編輯于星期二26圖像的數(shù)字化
——采樣指標分辨率分辨率
是指映射到圖像平面上的單個像素的景物元素的尺寸。單位:像素/英寸,像素/厘米
(如:三星智能手機GALAXYS4顯示屏為441ppi)
分辨率
或者是指要精確測量和再現(xiàn)一定尺寸的圖像所必需的像素個數(shù)。
單位:像素×像素
(如:數(shù)碼相機指標1210萬像素(4000×3000))現(xiàn)在是26頁\一共有49頁\編輯于星期二27圖像的數(shù)字化
——量化概念量化是將各個像素所含的明暗信息離散化后,用數(shù)字來表示。一般的量化值為整數(shù)。充分考慮到人眼的識別能力之后,目前非特殊用途的圖像均為8bit量化,即采用0~255的整數(shù)來描述“從黑到白”。在3bit以下的量化,會出現(xiàn)偽輪廓現(xiàn)象?,F(xiàn)在是27頁\一共有49頁\編輯于星期二28圖像的數(shù)字化
——量化方法量化可分為均勻量化和非均勻量化。均勻量化是簡單地在灰度范圍內(nèi)等間隔量化。非均勻量化是對像素出現(xiàn)頻度少的部分量化間隔取大,而對出現(xiàn)頻度大的部分量化間隔取小。
一般情況下,對灰度變化比較平緩的部分用比較多的量化級。現(xiàn)在是28頁\一共有49頁\編輯于星期二29圖像質(zhì)量的確定數(shù)字化時,關(guān)鍵是要決定:采樣點數(shù)M×N
(行和列)量化級別G
(灰度級數(shù))為了便于處理,采樣點數(shù)N與量化級別G都為2的冪次方,即M=2m,N=2n
,G=2k
(m,n,k均為正整數(shù))。記錄一幅圖像所需的字節(jié)(byte)B可由下式計算:
B=M×N×k÷8實際上:M、N一般取64、128、256、640、1024、1240等值;k一般取1、4、8、16、24、32等值。一般地說,圖像質(zhì)量隨M、N和k的增加而增高?,F(xiàn)在是29頁\一共有49頁\編輯于星期二30采樣傳感器采樣傳感器CCD(ChargeCoupleDevice):電荷耦合器件;CMOS(ComplementaryMetalOxideSemiconductor):互補性金屬氧化物半導體?,F(xiàn)在是30頁\一共有49頁\編輯于星期二31CCDCCD是20世紀70年代初發(fā)展起來的半導體器件。CCD以電荷為信號,而不是以電壓為信號。CCD利用感光二極管(photodiode)進行光電轉(zhuǎn)換,將圖像轉(zhuǎn)換為數(shù)字數(shù)據(jù).CCD的基本功能是電荷的產(chǎn)生、存儲和轉(zhuǎn)移。其基本原理是:通過光學系統(tǒng)將景物成像在CCD象敏面上,象敏面將照在每一個象敏單元上的光照強度轉(zhuǎn)換為電荷存儲在象敏單元中,然后再轉(zhuǎn)移到CCD的移位寄存器中,在驅(qū)動脈沖的作用下順序移出器件,形成強弱不同的電信號?,F(xiàn)在是31頁\一共有49頁\編輯于星期二CCD的三層結(jié)構(gòu)第一層“微型鏡頭”:CCD成像的關(guān)鍵是在于其感光層,為了擴展CCD的采光率,必須擴展單一像素的受光面積,增加感光面積。第二層“分色濾色片”:有兩種分色方式,一是RGB原色分色法,另一個則是CMYK補色分色法。這兩種方法各有優(yōu)缺點。第三層感光層:主要是負責將穿過濾色層的光源轉(zhuǎn)換成電子信號,并將信號傳送到影像處理芯片,將影像還原?,F(xiàn)在是32頁\一共有49頁\編輯于星期二線陣CCD:單元數(shù)有:256,1024,2048,4096等;面陣CCD:現(xiàn)在是33頁\一共有49頁\編輯于星期二34CMOSCMOS和CCD一樣都是可用來感受光線變化的半導體。CMOS是利用硅和鍺兩種元素做成的半導體,通過CMOS上帶負電和帶正電的晶體管來實現(xiàn)基本功能的。產(chǎn)生的電流即可被處理芯片紀錄和解讀成影像。CMOS針對CCD最主要的優(yōu)勢是價格低廉、制造工藝較簡單且非常省電,其耗電量只有普通CCD的1/3左右。CMOS傳感器可以在每個像素基礎(chǔ)上進行信號放大,采用這種方法可以進行快速數(shù)據(jù)掃描;CMOS主要問題是在處理快速變化的影像時,由于電流變化過于頻繁而過熱。但是現(xiàn)在CMOS絕非只局限于簡單的應(yīng)用,也在發(fā)展高清系列。現(xiàn)在是34頁\一共有49頁\編輯于星期二352.4數(shù)字圖像的存儲格式數(shù)字圖像是由排成矩形點陣的像素組成的。圖像有不同的編碼方式:無壓縮、無損壓縮、有損壓縮。圖像文件通常與操作系統(tǒng)有關(guān):Windows、Linux、Mac;把一幅圖像記錄進文件時,必須同時記錄下各像素在點陣中的位置及像素的灰度值。實際上我們可以利用各像素在文件中的記錄位置來表示其在圖像點陣中的位置,這樣就可以省去記錄像素位置坐標的數(shù)據(jù)量,而各像素的數(shù)據(jù)只用來記錄其灰度值?,F(xiàn)在是35頁\一共有49頁\編輯于星期二36數(shù)字圖像的存儲格式(二)圖像的尺寸(長與寬,均以像素為單位)通常記錄在文件頭(header)中。文件頭是有關(guān)圖像整體的信息數(shù)據(jù)塊,除記錄圖像的尺寸外,還記錄諸如像素的位長、圖像的顏色表等有關(guān)信息。文件頭之后才是圖像的數(shù)據(jù)流。因此,圖像數(shù)據(jù)文件是文件頭加數(shù)據(jù)流?,F(xiàn)在是36頁\一共有49頁\編輯于星期二37數(shù)字圖像的存儲格式(三)圖像數(shù)據(jù)的文件格式隨著圖像的各種信息的內(nèi)容取舍與記錄次序的不同而異。其中,關(guān)于圖像數(shù)據(jù)的記錄方式基本相同,主要的差異在于header的內(nèi)容。應(yīng)用較廣,比較常見的靜態(tài)圖像文件格式有:RAW、BMP/DIB、JPEG、Tiff、Gif、WMF。常見的動態(tài)圖像文件格式有:MPEG4、SWF(ShockwaveFormat)、AVI、nAVI、rm、rmvb、MOV、MKV……現(xiàn)在是37頁\一共有49頁\編輯于星期二38數(shù)字圖像的存儲----位圖文件Bmp是MicrosoftWindows設(shè)備無關(guān)位圖(MicrosoftDeviceIndependentBitmap)文件,又稱為DIB。是Windows操作系統(tǒng)的標準文件格式。Bmp可以包含每個像素1位、4位、8位或24位的圖像。其中1、4和8位圖形有彩色映像(調(diào)色板),而24位元圖像則是全彩(TrueColor)。優(yōu)點:在MicrosoftWindows下得到廣泛使用。缺點:除了MicrosoftWindows外,無法在其他環(huán)境下使用?,F(xiàn)在是38頁\一共有49頁\編輯于星期二39數(shù)字圖像的存儲位圖文件
——文件的總體結(jié)構(gòu)
文件頭
BITMAPFILEHEADER
信息頭
BITMAPINFOHEADER
調(diào)色板
RGBQUAD
數(shù)據(jù)區(qū)
文件頭
BITMAPFILEHEADER
信息頭
BITMAPINFOHEADER
數(shù)據(jù)區(qū)
像素的RGB值
像素的調(diào)色板索引值真彩色模式索引色模式現(xiàn)在是39頁\一共有49頁\編輯于星期二40數(shù)字圖像的存儲位圖文件
——文件頭信息
文件頭BITMAPFILEHEADERbfType文件類型標識“BM”bfSize文件總字節(jié)數(shù)(包括文件頭的14字節(jié))bfOffBits從文件頭到實際的位圖數(shù)據(jù)的偏移字節(jié)數(shù)現(xiàn)在是40頁\一共有49頁\編輯于星期二41數(shù)字圖像的存儲位圖文件
——信息頭信息biSize信息頭結(jié)構(gòu)體長度,為40biWidth圖像寬度,單位是像素
biHeight圖像高度,單位是像素
biPlanes必須為1,暫無意義
biCompression指定位圖是否壓縮
biSizeImage實際位圖數(shù)據(jù)所占字節(jié)數(shù)
biXperlsPerMeter位圖水平分辨率,每米像素數(shù)
biYperlsPerMeter位圖垂直分辨率,每米像素數(shù)
信息頭
BITMAPINFOHEADER現(xiàn)在是41頁\一共有49頁\編輯于星期二42數(shù)字圖像的存儲位圖文件
——索引色模式的調(diào)色板
調(diào)色板RGBQUAD索引值RGB1R1G1B12R2G2B2
::::NRNGNBN現(xiàn)在是42頁\一共有49頁\編輯于星期二43數(shù)字圖像的存儲位圖文件
——索引色模式的數(shù)據(jù)區(qū)索引值RGB1R1G1B12R2G2B2
::::NRNGNBN
數(shù)據(jù)區(qū)像素的調(diào)色板索引值現(xiàn)在是43頁\一共有49頁\編輯于星期二44矢量圖矢量(Vector)圖:亦稱向量圖,是用稱之為矢量的直線、曲線、多邊形和填充的色塊來描繪圖形的??梢詿o限放大圖形中的細節(jié),不用擔心會造成失真和色塊。矢量圖文件比點陣圖文件存儲空間要小很多。一般地,矢量圖是圖形。A類型:line起點坐標xx.xxx,yy.yyyy終點坐標xx.xxx,yy.yyyy顏色、線型、線寬類型:文字起點坐標xx.xxx,yy.yyyy顏色、字體、字型、字號現(xiàn)在是44頁\一共有49頁\編輯于星期二常見的靜態(tài)圖像文件格式(一)JPEG全稱為(JointPhotographicExptrsGroup,聯(lián)合圖像專家組),是24位的圖像文件格式。JPEG文件格式是面向連續(xù)色調(diào)靜止圖像的一種壓縮標準。
JPEG格式是目前網(wǎng)絡(luò)上最流行的圖像格式。JPEG壓縮技術(shù)十分先進,它用有損壓縮方式去除冗余的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 國際學校教師職稱評定方案
- 建筑行業(yè)無機纖維噴涂方案
- 航空運輸安全生產(chǎn)管理方案
- 園林綠化施工保護措施方案
- 幼兒園兒童發(fā)展評估方案
- 草原環(huán)境保護與鹽堿化治理方案
- 客運碼頭用戶體驗提升方案
- 建筑企業(yè)稅務(wù)籌劃風險分析
- 居家養(yǎng)老責任制服務(wù)方案
- 工業(yè)園區(qū)消防監(jiān)控與防護方案
- 高三一模動員主題班會-課件(PPT演示)
- 車轍的形成原因及預(yù)防措施
- 風電場升壓站建筑工程主要施工方案
- 第五講新聞評論的結(jié)構(gòu)與節(jié)奏
- 護士長競聘演講ppt
- 從PK-PD看抗菌藥物的合理應(yīng)用
- 加熱爐施工方案
- 意象對話放松引導詞2[生活經(jīng)驗]
- 高速公路安全生產(chǎn)標準化指南1
- 學科融合課題研究實施方案
- 生物質(zhì)壓塊機使用說明書
評論
0/150
提交評論