《機器視覺》全套教學(xué)課件_第1頁
《機器視覺》全套教學(xué)課件_第2頁
《機器視覺》全套教學(xué)課件_第3頁
《機器視覺》全套教學(xué)課件_第4頁
《機器視覺》全套教學(xué)課件_第5頁
已閱讀5頁,還剩850頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

機器視覺機器視覺_第1章-概述機器視覺_第2章-圖像獲取機器視覺_第3章-圖像處理機器視覺_第4章-圖像分割與描述機器視覺_第5章-特征檢測與匹配機器視覺_第6章-運動估計與濾波機器視覺_第7章-單目位姿測量與標定機器視覺_第8章-多視圖幾何與三維重建機器視覺_第9章_視覺系統(tǒng)實現(xiàn)機器視覺_第10章-機器視覺應(yīng)用實例全套可編輯PPT課件

本課件是可編輯的正常PPT課件機器視覺:1.概述本課件是可編輯的正常PPT課件機器視覺應(yīng)用機器視覺發(fā)展簡史機器視覺任務(wù)

內(nèi)容組織與教學(xué)建議

機器視覺的定義本課件是可編輯的正常PPT課件機器視覺的定義什么是機器視覺本課件是可編輯的正常PPT課件1.1什么是機器視覺Part15“百聞不如一見”:視覺占感知信息的75%-80%讓機器具有像人一樣的智能,能夠通過視覺感知和理解環(huán)境,是人類長久以來的夢想。機器視覺:讓機器如何“看到”的科學(xué)本課件是可編輯的正常PPT課件1.1什么是機器視覺Part16從圖像看視覺的直觀定義畫面里都有什么?人、車和房子在什么位置?目標在做什么?目標間有什么關(guān)系?本課件是可編輯的正常PPT課件1.1什么是機器視覺Part17目標的分割和識別;目標的三維位置信息;行為理解與分析;語義理解與推理。上述問題對應(yīng)了視覺從底層到高層的不同認知層次:本課件是可編輯的正常PPT課件機器視覺任務(wù)正式定義基本任務(wù)本課件是可編輯的正常PPT課件2.1機器視覺的正式定義Part29機器視覺是使用光學(xué)器件進行非接觸感知,自動獲取和解釋一個真實場景的圖像,以獲取信息和(/或)控制機器或過程。SME(美國制造工程師協(xié)會)關(guān)于機器視覺的定義:機器視覺系統(tǒng)的輸入是外界環(huán)境圖像或圖像序列(視頻),輸出則是視覺處理后的信息,這些信息可作為最終結(jié)果直接反饋給人類或輸出至其他設(shè)備,作為最終控制及決策的依據(jù)。根據(jù)這一定義:本課件是可編輯的正常PPT課件2.2機器視覺基本任務(wù)Part210在制造業(yè)中,機器視覺的基本任務(wù)包括測量、檢測、定位與識別。10本課件是可編輯的正常PPT課件2.2機器視覺基本任務(wù)Part211機器視覺基本任務(wù)——測量11本課件是可編輯的正常PPT課件2.2機器視覺基本任務(wù)Part212機器視覺基本任務(wù)——檢測12外觀缺陷檢測本課件是可編輯的正常PPT課件2.2機器視覺基本任務(wù)Part213機器視覺基本任務(wù)——定位13坐標輸出定位內(nèi)部特征定位本課件是可編輯的正常PPT課件2.2機器視覺基本任務(wù)Part214機器視覺基本任務(wù)——識別14光學(xué)字符識別顏色識別本課件是可編輯的正常PPT課件2.2機器視覺基本任務(wù)Part215除制造領(lǐng)域外,機器視覺還在消費電子、自動駕駛、醫(yī)療、能源等領(lǐng)域有廣泛應(yīng)用,包括視覺引導(dǎo)機器人、視覺跟蹤系統(tǒng)、視覺輔助導(dǎo)航、自動駕駛、能源生產(chǎn)過程自動化等。15本課件是可編輯的正常PPT課件機器視覺發(fā)展簡史相關(guān)學(xué)科相關(guān)學(xué)科發(fā)展機器視覺發(fā)展本課件是可編輯的正常PPT課件3.1機器視覺相關(guān)學(xué)科Part317和如下學(xué)科密切相關(guān):視覺神經(jīng)生理學(xué)人工智能與機器學(xué)習(xí)數(shù)字圖像處理神經(jīng)生理學(xué)圖像處理機器學(xué)習(xí)人工智能機器視覺本課件是可編輯的正常PPT課件3.2相關(guān)學(xué)科發(fā)展Part3181958年,美國DavidHubel和TorstenWiesel在JohnHopkins大學(xué)通過測試貓的視皮質(zhì)細胞,發(fā)現(xiàn)視皮質(zhì)細胞只對視網(wǎng)膜上的圖像的某些特定細節(jié)有反應(yīng),并且這些細胞似乎會自然映射到不同角度(1981年獲諾貝爾生理學(xué)獎)視覺神經(jīng)生理學(xué)本課件是可編輯的正常PPT課件3.2相關(guān)學(xué)科發(fā)展Part319人的視覺系統(tǒng)采用分級信息處理方式,對應(yīng)不同層次處理的細胞呈層狀排列,即視覺皮層。視覺神經(jīng)生理學(xué)本課件是可編輯的正常PPT課件3.2相關(guān)學(xué)科發(fā)展Part320初級視覺系統(tǒng)中的神經(jīng)元感受野較小,可實現(xiàn)高分辨率的視覺處理。每個感受野的時空結(jié)構(gòu)可視為對圖像的給定屬性進行局部濾波的處理單元。隨著處理向高層移動,感受野越來越大,特征復(fù)雜度不斷增加。對象識別是視覺層次化處理的一個典型示例,可通過多層協(xié)同作用構(gòu)造感受野的計算模型。視覺神經(jīng)生理學(xué)本課件是可編輯的正常PPT課件3.2相關(guān)學(xué)科發(fā)展Part3211956年,在由達特茅斯學(xué)院舉辦的一次會議上,JohnMcCarthy等科學(xué)家聚在一起,在討論中提出“人工智能”(ArtificialIntelligence)一詞,人工智能就此誕生。人工智能與機器學(xué)習(xí)本課件是可編輯的正常PPT課件3.2相關(guān)學(xué)科發(fā)展Part322五十年代末到六十年代初是人工智能早期迅速發(fā)展的時期1986年Hinton發(fā)明BP算法,人工智能進入了第二次高潮期2016年,AlphaGo戰(zhàn)勝圍棋世界冠軍,人工智能進入新的階段人工智能與機器學(xué)習(xí)本課件是可編輯的正常PPT課件3.2相關(guān)學(xué)科發(fā)展Part323通過人工智能方法,機器視覺一方面可以解決更為復(fù)雜的問題,如根據(jù)視頻自動生成描述字幕,在復(fù)雜環(huán)境中輔助人類進行自動駕駛等;另一方面,可針對不同的問題建立共性的處理方法,如機器學(xué)習(xí)分類算法、深度學(xué)習(xí)等,為機器視覺的研究開辟了新的思路。人工智能與機器學(xué)習(xí)本課件是可編輯的正常PPT課件3.2相關(guān)學(xué)科發(fā)展Part324對已有的圖像進行變換、分析、重構(gòu),得到的仍是圖像。機器視覺是給定圖像,從圖像提取信息,包括景象的三維結(jié)構(gòu),運動檢測,識別物體等。數(shù)字圖像處理2007年11月5日,我國嫦娥1號探月衛(wèi)星使用CCD相機拍攝的第一張月球表面圖像本課件是可編輯的正常PPT課件3.3機器視覺發(fā)展Part325孕育期(20世紀70年代前):早期機器視覺相關(guān)工作啟蒙期(20世紀80-90年代):機器視覺誕生,并產(chǎn)生主要分支探索期(20世紀90年代中期-2012):機器視覺+機器學(xué)習(xí)爆發(fā)期(2012-至今):卷積神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)機器視覺的發(fā)展大致經(jīng)歷了四個階段:本課件是可編輯的正常PPT課件3.3機器視覺發(fā)展Part326早期的工作圍繞統(tǒng)計模式識別和視覺理解基礎(chǔ)工作展開機器視覺的發(fā)展——孕育期本課件是可編輯的正常PPT課件3.3機器視覺發(fā)展Part3271963年,LarryRoberts發(fā)表“三維固體的機器感知”論文,視覺世界被簡化為簡單的幾何形狀,而Larry試圖從圖像中解析出這些邊緣和形狀1966年,MIT的Minsky指導(dǎo)本科生G.Sussman“在暑期將攝像機連接到計算機上,讓計算機來描述他所看到的東西”。這一研究被認為是機器視覺的開創(chuàng)工作機器視覺的發(fā)展——孕育期本課件是可編輯的正常PPT課件3.3機器視覺發(fā)展Part3281982Marr的“Vision:Acomputationalinvestigationintothehumanrepresentationandprocessingofvisualinformation”,標志著機器視覺的誕生。機器視覺的發(fā)展——啟蒙期本課件是可編輯的正常PPT課件3.3機器視覺發(fā)展Part329Marr認為從二維圖像恢復(fù)三維物體,經(jīng)歷了自下而上的三個階段機器視覺的發(fā)展——啟蒙期本課件是可編輯的正常PPT課件3.3機器視覺發(fā)展Part330此后,很多重要的數(shù)學(xué)工具被引入機器視覺,并建立分支圖像尺度空間表達機器視覺的發(fā)展——啟蒙期本課件是可編輯的正常PPT課件3.3機器視覺發(fā)展Part331此后,很多重要的數(shù)學(xué)工具被引入機器視覺,并建立分支基于馬爾科夫隨機場模型(MarkovRandomField,MRF)視覺處理機器視覺的發(fā)展——啟蒙期a)含噪圖像b)去噪圖像本課件是可編輯的正常PPT課件3.3機器視覺發(fā)展Part332此后,很多重要的數(shù)學(xué)工具被引入機器視覺,并建立分支基于攝影幾何理論的多視幾何機器視覺的發(fā)展——啟蒙期本課件是可編輯的正常PPT課件3.3機器視覺發(fā)展Part333此后,很多重要的數(shù)學(xué)工具被引入機器視覺,并建立分支偏微分方程(PDE)及變分法應(yīng)用機器視覺的發(fā)展——啟蒙期基于Snake活動輪廓模型的圖像分割本課件是可編輯的正常PPT課件3.3機器視覺發(fā)展Part33420世紀90年代中后期開啟的特征工程時代重點圍繞復(fù)雜場景視覺識別、分類等任務(wù),機器學(xué)習(xí)等技術(shù)與機器視覺結(jié)合日益緊密。機器視覺的發(fā)展——探索期本課件是可編輯的正常PPT課件3.3機器視覺發(fā)展Part335基于深度學(xué)習(xí)的處理方法的效果已全面超越傳統(tǒng)算法,并在實際中開始廣為應(yīng)用機器視覺的發(fā)展——爆發(fā)期本課件是可編輯的正常PPT課件3.3機器視覺發(fā)展Part336我國機器視覺產(chǎn)業(yè)起步相對較晚,近年來隨著國家大力推進制造業(yè)轉(zhuǎn)型和智能制造,國內(nèi)制造業(yè)升級轉(zhuǎn)型和國產(chǎn)化替代的趨勢明顯加快,市場規(guī)??焖偬嵘?017年至2022年,我國機器視覺市場規(guī)模由59億元增長至225億元,復(fù)合增長率達30.7%。隨著宏觀環(huán)境的改善、機器視覺技術(shù)的成熟及下游領(lǐng)域的拓寬,我國機器視覺行業(yè)將持續(xù)快速發(fā)展。機器視覺的發(fā)展——爆發(fā)期本課件是可編輯的正常PPT課件機器視覺應(yīng)用本課件是可編輯的正常PPT課件機器視覺應(yīng)用Part438機器視覺已滲透到了人類日常生活中的幾乎每個方面本課件是可編輯的正常PPT課件4.1機器人視覺分揀Part439機器視覺可以輔助機器人對傳送帶上的目標進行識別和跟蹤,并將相應(yīng)信息反饋給控制器,引導(dǎo)機械手臂完成自動分揀任務(wù)。本課件是可編輯的正常PPT課件4.1機器人視覺分揀Part440基于視覺識別的機器人智能分揀工作流程:本課件是可編輯的正常PPT課件4.1機器人視覺分揀Part441實際機器人智能分揀系統(tǒng)本課件是可編輯的正常PPT課件4.2智能視頻監(jiān)控Part4421.對視頻內(nèi)容按照語義關(guān)系,采用目標分割、圖像識別、分類、跟蹤等處理,將信息濃縮為結(jié)構(gòu)化文本或可視化圖像/視頻摘要信息。本課件是可編輯的正常PPT課件4.2智能視頻監(jiān)控Part4432.智能交通監(jiān)控系統(tǒng)是智能視頻監(jiān)控的另一重要應(yīng)用。本課件是可編輯的正常PPT課件4.3表面缺陷檢測Part444采用通過機器視覺技術(shù),對鋰電池表面的露鋁、凹痕、劃痕、凹坑、針孔等缺陷進行自動檢測。本課件是可編輯的正常PPT課件4.4機器人視覺同時定位與建圖Part445采用視覺傳感器,在機器人操作的過程中對自己本身位姿進行估計,并且能夠建立環(huán)境的信息。本課件是可編輯的正常PPT課件4.4機器人視覺同時定位與建圖Part446算法在某室內(nèi)辦公室數(shù)據(jù)集上運行效果:本課件是可編輯的正常PPT課件內(nèi)容組織與教學(xué)建議本課件是可編輯的正常PPT課件5.1內(nèi)容組織Part548教材內(nèi)容組織本課件是可編輯的正常PPT課件5.2教學(xué)建議Part549(以下根據(jù)情況選擇)本科本課件是可編輯的正常PPT課件5.2教學(xué)建議Part550(以下根據(jù)情況選擇)研究生本課件是可編輯的正常PPT課件感謝各位的聆聽!本課件是可編輯的正常PPT課件機器視覺:2.圖像獲取本課件是可編輯的正常PPT課件圖像量化與表達視覺信息獲取照明和顏色

圖像壓縮與視頻壓縮

人類視覺感知本課件是可編輯的正常PPT課件人類視覺感知什么是機器視覺本課件是可編輯的正常PPT課件1.1人眼結(jié)構(gòu)Part155人眼可感知來自直接來自太陽等光源發(fā)射或被其它物體反射的光子。具體來說,可感知380至720nm(420–790THz)部分輻射的電磁波人眼在光譜的綠色區(qū)域具有555nm左右的峰值靈敏度,這主要因為地表生活區(qū)域綠植覆蓋人眼在可感知的亮度范圍內(nèi)以近似對數(shù)而非線性的方式感知亮度本課件是可編輯的正常PPT課件1.1人眼結(jié)構(gòu)Part156人眼結(jié)構(gòu):將人眼類比為相機,則晶狀體、瞳孔和視網(wǎng)膜就是鏡頭、光圈和成像傳感器。本課件是可編輯的正常PPT課件1.1人眼結(jié)構(gòu)Part157視網(wǎng)膜中通常有大約1.3億個傳感器細胞,包括1.25億個視桿細胞和6-7百萬個視錐細胞。這些分布如圖2-3所示。其中視桿細胞主要負責暗視覺,視錐細胞則主要負責明視覺和色覺。本課件是可編輯的正常PPT課件1.1人眼結(jié)構(gòu)Part158有三類視錐細胞,分別對應(yīng)三種不同顏色的感應(yīng):其中約65%對應(yīng)紅色,33%對應(yīng)綠色,2%對應(yīng)藍色,其歸一化吸收曲線如圖。人眼可識別的電磁波長大約為380-780nm。本課件是可編輯的正常PPT課件1.2視覺特性Part159(1)視覺關(guān)注在復(fù)雜場景中,人類視覺能快速定位重要區(qū)域并進行準確分析,對其它區(qū)域則有意忽視,這種主動選擇的機制稱為視覺關(guān)注視覺關(guān)注包括客觀內(nèi)容驅(qū)動的自底向上關(guān)注模型和主觀命令指導(dǎo)的自頂而下關(guān)注模型。自底向上關(guān)注主要跟圖像內(nèi)容的顯著性相關(guān);那些與周圍區(qū)域具有較大差異性的目標更容易得到視覺關(guān)注。自頂而下關(guān)注則受意識支配,可將視覺關(guān)注強行轉(zhuǎn)移到某一特定區(qū)域本課件是可編輯的正常PPT課件1.2視覺特性Part160

本課件是可編輯的正常PPT課件1.2視覺特性Part161(3)視覺掩蓋對比度掩蓋:由于邊緣存在強烈的亮度變化,人眼對邊緣輪廓敏感,而對邊緣的亮度誤差不敏感紋理掩蓋:圖像紋理區(qū)域存在較大的亮度以及方向變化,人眼對該區(qū)域信息的分辨率下降運動掩蓋:視頻序列相鄰幀間內(nèi)容的劇烈變動(如目標運動或者場景變化),導(dǎo)致人眼分辨率的劇烈下降在很暗的環(huán)境中人眼敏感顏色的錐狀細胞將失去作用,視覺功能由桿狀細胞產(chǎn)生,此時人眼僅能敏感灰度本課件是可編輯的正常PPT課件1.2視覺特性Part162(4)視覺內(nèi)在推導(dǎo)機制對于待識別的輸入場景,人類視覺系統(tǒng)會根據(jù)大腦中的記憶信息,來推導(dǎo)、預(yù)測其視覺內(nèi)容,同時那些無法理解的不確定信息將會被丟棄本課件是可編輯的正常PPT課件照明和顏色照明模型顏色模型本課件是可編輯的正常PPT課件2.1照明模型Part

264

本課件是可編輯的正常PPT課件Part

265以下列出光通量的一些典型值光源光通量說明太陽3.566×1028lm燭光12.56lm光通量的定義白熾燈/鹵鎢燈12~24

lm/W鹵鎢燈效率高于白織燈熒光燈和氣體放電燈50~120

lm/W氣體放電燈如鈉燈、汞燈和金屬鹵化物燈等LED燈110~150lm/W2.1照明模型本課件是可編輯的正常PPT課件Part

266

2.1照明模型本課件是可編輯的正常PPT課件Part

267照度指投射到一平表面上的輻射通量密度。指到達一表平面上,單位時間,單位面積上的輻射能以符號E表示,常用單位是lux(勒克斯)1

lux

=1lm/m22.1照明模型本課件是可編輯的正常PPT課件Part

268以下列出輻照度的一些典型值場景照度(lux)說明黑夜0.001~0.02月夜則是0.02~0.3陰天室內(nèi)5~50陰天室外50~500晴天室內(nèi)100~1000晴天室外1000~10000適合閱讀300~750閱讀書刊時需50~60家用攝像機標準照度14002.1照明模型本課件是可編輯的正常PPT課件Part

269

2.1照明模型本課件是可編輯的正常PPT課件Part

270以下列出一些常用表面的反射系數(shù)表面材質(zhì)反射系數(shù)純黑體0黑天鵝絨0.01粗糙的混凝土0.20~0.30不銹鋼0.65白雪0.93理想鏡面12.1照明模型本課件是可編輯的正常PPT課件2.2顏色與顏色模型Part

271色彩與三原色本課件是可編輯的正常PPT課件2.2顏色模型Part

272

本課件是可編輯的正常PPT課件2.2顏色模型Part

273RGB顏色模型本課件是可編輯的正常PPT課件2.2顏色模型Part

274RGB顏色模型本課件是可編輯的正常PPT課件4.2顏色模型Part

475HSI顏色模型色調(diào)H是描述純色的屬性(如紅色、黃色等)飽和度S表示的是一種純色被白光稀釋的程度的度量亮度體現(xiàn)了無色的光強度概念,是一個主觀的描述本課件是可編輯的正常PPT課件4.2顏色模型Part

476YUV與YCbCr顏色模型YUV模型是另一類將亮度分量與色度分量分離表達的顏色模型,其中Y為亮度通道,U和V為色度通道。YUV顏色模型在彩色電視信號傳輸中使用,可以很好的解決彩色與黑白電視機的兼容問題YCbCr則是YUV一種變體,目前在數(shù)字圖像和視頻表達中廣為使用。其中Y表示亮度,Cb反映的是RGB輸入信號藍色部分與RGB信號亮度值之間的差值,Cr則反映的是紅色部分與亮度之間的差值。本課件是可編輯的正常PPT課件視覺信息獲取CMOS與CCD傳感器彩色傳感器深度傳感器本課件是可編輯的正常PPT課件3.1CCD與CMOS傳感器Part378CCD傳感器由二維傳感器陣列組成,每個最小構(gòu)成單元是一個二極管,對應(yīng)一個像素??梢源鎯邮盏降墓庾?,將到達的光信號轉(zhuǎn)換為電信號;最后將各單元存儲的電荷輸出。本課件是可編輯的正常PPT課件3.1CCD與CMOS傳感器Part379CMOS傳感器在光檢測方面和CCD相同,都利用了硅的光電效應(yīng)原理,不同點在于光產(chǎn)生電荷的讀出方式。本課件是可編輯的正常PPT課件3.1CCD與CMOS傳感器Part380傳感器的主要參數(shù):(1)傳感器尺寸(2)分辨率(3)靈敏度(4)動態(tài)范圍本課件是可編輯的正常PPT課件3.2彩色圖像傳感器Part381為獲得彩色圖像,需要同時敏感顏色空間的不同分量,實際中在常規(guī)傳感器表面覆蓋一個含特定圖案排列的含紅綠藍三色單元的濾膜,再加上對其輸出信號的處理算法,可實現(xiàn)圖像傳感器輸出彩色圖像數(shù)字信號。彩色圖像傳感器原理本課件是可編輯的正常PPT課件3.2彩色圖像傳感器Part382彩色濾色片陣列也稱為拜爾(Bayer)濾色鏡,排列在感光區(qū)上方。一般Bayer濾色鏡包含50%綠色、25%紅色和25%藍色陣列;這與人眼對綠色敏感度高的機制相一致。像素缺失的不同顏色分量可按插值計算。彩色圖像傳感器的Bayer模式本課件是可編輯的正常PPT課件3.3深度圖像傳感器Part383(1)雙目視覺是一類最常用的深度圖像感知方式,成像原理類似人眼,過兩個相隔一定距離的像機同時獲取同一場景的兩幅圖像。被動傳感深度圖像傳感器本課件是可編輯的正常PPT課件3.3深度圖像傳感器Part384(2)光場成像是一類較新的深度成像方式,目前最為普及的是基于微透鏡陣列的光場相機。被動傳感深度圖像傳感器本課件是可編輯的正常PPT課件3.3深度圖像傳感器Part385(2)光場成像宏觀上類似傳統(tǒng)成像結(jié)果,但將其中小圖像塊放大后可看到,其均由在每一個微透鏡下成的像構(gòu)成,元素圖像與微透鏡一一對應(yīng)。被動傳感深度圖像傳感器本課件是可編輯的正常PPT課件3.3深度圖像傳感器Part386(1)ToF(飛行時間)成像通過光發(fā)射裝置向目標場景發(fā)射連續(xù)的脈沖激光信號,然后用傳感器接收物體反射回的光脈沖?;诩す鉁y距原理,利用發(fā)射和接收脈沖信號的時間差,可測量被測物體表面各位置的距離信息。主動傳感深度圖像傳感器本課件是可編輯的正常PPT課件3.3深度圖像傳感器Part387(1)ToF(飛行時間)成像成像效果展示:以彩色形式展示,顏色越靠近紅色表示到相機距離越近。主動傳感深度圖像傳感器本課件是可編輯的正常PPT課件3.3深度圖像傳感器Part388(2)結(jié)構(gòu)光成像將產(chǎn)生的結(jié)構(gòu)光投射至被測物體上,進一步通過圖像傳感器采集帶有結(jié)構(gòu)光的圖案,根據(jù)模式圖像在圖像中的位置以及在物體表面的形變程度,利用三角原理計算即可得到場景中各點的深度信息。主動傳感深度圖像傳感器本課件是可編輯的正常PPT課件3.3深度圖像傳感器Part389不同類型深度圖像傳感器對比傳感類型ToF雙目光場成像結(jié)構(gòu)光測距方式主動式被動式被動式主動式測量精度mm~cm級,與距離基本無關(guān)與距離相關(guān),精度近距可達mm級與距離相關(guān),mm~cm級與距離相關(guān),精度近距可達mm級測量范圍由激光功率決定,幾米~幾十米內(nèi)由基線長度決定,一般為幾米以內(nèi)一般幾十厘米至幾米一般幾米以內(nèi)影響因素不受光照變化和物體紋理影響,受多重反射影響。受光照和物體紋理影響大,夜晚和無紋理物體表面無法使用受光照和物體表面材質(zhì)影響,夜晚無法使用。基本不受光照變化和物體紋理影響,但受反光和強光影響。本課件是可編輯的正常PPT課件圖像采集和量化采集與量化Gamma校正數(shù)字表達本課件是可編輯的正常PPT課件4.1采集和量化Part491圖像采樣圖像采樣實現(xiàn)對圖像空間坐標的離散化。采樣的過程相當于用一個網(wǎng)格把原始圖像覆蓋,然后通過采樣算法計算格子的值;采樣網(wǎng)格如何選取決定了圖像的空間分辨率。本課件是可編輯的正常PPT課件4.1采集和量化Part492圖像采樣下面演示對原始圖像進行采樣的過程。本課件是可編輯的正常PPT課件4.1采集和量化Part493圖像量化

本課件是可編輯的正常PPT課件4.1采集和量化Part494圖像量化圖像量化過程。本課件是可編輯的正常PPT課件4.2Gamma校正Part495非線性亮度感知圖像傳感器輸出圖像的亮度與真實光強呈線性關(guān)系,但人眼感受到的亮度與真實光強之間的關(guān)系是非線性的。本課件是可編輯的正常PPT課件4.2Gamma校正Part496Gamma校正由于傳感輸出與人類感知亮度的不一致性,通常在圖像傳感器輸出時對其進行Gamma校正。本課件是可編輯的正常PPT課件4.2Gamma校正Part497不同系數(shù)對應(yīng)的Gamma校正效果

本課件是可編輯的正常PPT課件4.3圖像的數(shù)字表達Part498圖像可以用一個二維矩陣來表示

本課件是可編輯的正常PPT課件4.3圖像的數(shù)字表達Part499灰度圖像數(shù)字表示示意本課件是可編輯的正常PPT課件4.3圖像的數(shù)字表達Part4100彩色圖像數(shù)字表示示意,具有RGB三個顏色分量本課件是可編輯的正常PPT課件4.3圖像的數(shù)字表達Part4101數(shù)字圖像采用二維矩陣表達,但計算機內(nèi)存及硬盤等存儲器等均為一維線性組織,因此在圖像處理時需要將圖像轉(zhuǎn)換為線性表達。為此,可按照從左至右、從上至下的順序?qū)D像進行Z字形掃描,形成一維線性字節(jié)數(shù)據(jù)本課件是可編輯的正常PPT課件壓縮圖像與壓縮視頻CMOS與CCD傳感器彩色傳感器深度傳感器本課件是可編輯的正常PPT課件5.1圖像壓縮Part5103JPEG壓縮在1994年成為國際靜態(tài)圖像壓縮標準,編碼過程如圖。本課件是可編輯的正常PPT課件5.1圖像壓縮Part5104JPEG不同壓縮率結(jié)果對比本課件是可編輯的正常PPT課件5.2視頻壓縮Part5105視頻壓縮圖像幀內(nèi)部和相鄰視頻幀之間存在大量冗余,因此可對視頻進行壓縮,以便于視頻存儲和傳輸。本課件是可編輯的正常PPT課件5.2視頻壓縮Part5106不同視頻壓縮率結(jié)果對比本課件是可編輯的正常PPT課件5.2視頻壓縮Part5107常見視頻壓縮格式名稱及壓縮前后的數(shù)據(jù)碼率比較序號名稱分辨率(像素)未壓縮碼率(bps)壓縮數(shù)據(jù)碼率(H.264,bps)壓縮數(shù)據(jù)碼率(H.265,bps)1D1(4CIF)704×5760.27G1.5M0.9M2720P1280×7201.24G3M1.8M31080P1920×10802.78G5M3M43M2048×15364.22G7M4.2M54M2560×14404.94G8M4.8M64K3840×216011.12G16M9.6M本課件是可編輯的正常PPT課件5.3視頻壓縮標準Part5108視頻壓縮標準演化本課件是可編輯的正常PPT課件5.3視頻壓縮標準Part5109H.26x(1)H.261:用于傳輸數(shù)據(jù)速率為64kbps及其整數(shù)倍的視頻信號(2)H.263:專為低數(shù)據(jù)速率傳輸設(shè)計(3)H.264:提供比H.263、MPEG-2和MPEG-4等現(xiàn)有標準更低的比特率(4)H.265:以較低的比特率提供更高的編碼容量本課件是可編輯的正常PPT課件5.3視頻壓縮標準Part5110MPEG-x(1)MPEG-1:以1.5Mbits/s的最大允許比特率壓縮視頻質(zhì)量(2)MPEG-2:在電視廣播信號中實現(xiàn)高壓縮比,目標壓縮率為4–30Mbps(3)MPEG-4:在較低帶寬通道中高質(zhì)量地傳輸視頻信號,常見壓縮比為100:1本課件是可編輯的正常PPT課件感謝各位的聆聽!本課件是可編輯的正常PPT課件機器視覺:3.圖像處理本課件是可編輯的正常PPT課件數(shù)字形態(tài)學(xué)濾波邊緣檢測圖像濾波

圖像的傅里葉變換本課件是可編輯的正常PPT課件圖像的傅里葉變換頻域與時域典型的二維信號傅里葉變換本課件是可編輯的正常PPT課件1.1頻域與時域Part1115時域即時間域,自變量是時間,因變量是信號的變化,其動態(tài)信號描述信號在不同時刻的取值。頻域即頻率域,自變量是信號的頻率,因變量是信號的幅值,反映了信號幅值與頻率的關(guān)系。頻域與時域的定義本課件是可編輯的正常PPT課件1.1頻域與時域Part1116時域表達簡潔且直觀,例如,正弦波信號只需要幅值、頻率、相位三個特征量就可以進行表達,但對形狀相似的非正弦波信號很難加以區(qū)分。頻域表達更加深刻簡練,無論是正弦波信號還是非正弦波信號,都可以通過傅里葉積分或傅里葉變換將其分解為各次諧波,從而可以用各次諧波的幅值、頻率和相位來表示信號。頻域與時域的特點本課件是可編輯的正常PPT課件1.1頻域與時域Part1117以方波信號進行傅里葉展開為例,它等于多個不同頻率的正弦信號的疊加傅里葉展開示意圖本課件是可編輯的正常PPT課件1.1頻域與時域Part1118當我們對信號進行時域分析時,往往不能得到信號的所有特征,因為信號不僅與時間相關(guān),還與頻率分布、相位分布等因素有關(guān)。因此,還需要對信號的頻率分布進行分析,也就需要在頻域內(nèi)對信號進行表示。信號從時域到頻域的變換是通過傅里葉級數(shù)和傅里葉積分實現(xiàn)的,傅里葉級數(shù)是針對周期函數(shù)信號的變換,傅里葉積分是針對非周期函數(shù)信號的變換。頻域與時域的聯(lián)系與轉(zhuǎn)換本課件是可編輯的正常PPT課件1.2典型的二維信號Part1119沖激信號線性系統(tǒng)和傅里葉變換研究的核心是沖激及其取樣特性,連續(xù)變量t在t=0處的單位沖激函數(shù)表示為:限制條件:

本課件是可編輯的正常PPT課件1.2典型的二維信號Part1120沖激信號物理上,如果我們把t解釋為時間,那么一個沖激函數(shù)可以看成幅值無限、持續(xù)時間為0、具有單位面積的尖峰信號。一個沖激函數(shù)具有關(guān)于如下積分形式的采樣特性:

本課件是可編輯的正常PPT課件1.2典型的二維信號Part1121沖激信號假設(shè)f(t)在t=0處連續(xù),則采樣特性得到函數(shù)f(t)在沖激位置的函數(shù)值。采樣特性的一種更為一般的情況是在t=t0處采樣,對應(yīng)的單位沖激函數(shù)表示為。此時采樣特性變?yōu)椋?/p>

本課件是可編輯的正常PPT課件1.2典型的二維信號Part1122連續(xù)信號的單位階躍信號的表達式為:令x表示一個離散變量。單位階躍信號u(x)在離散系統(tǒng)中定義如下:階躍信號本課件是可編輯的正常PPT課件1.2典型的二維信號Part1123階躍信號(a)單位連續(xù)階躍函數(shù)(b)單位離散階躍函數(shù)本課件是可編輯的正常PPT課件1.3傅里葉變換Part1124傅里葉變換的實質(zhì)是將信號表示為無窮多個各次諧波的疊加,利用直接測量得到的原始信號,進行多次諧波信號疊加來得到正弦波信號的頻率、振幅和相位。與之對應(yīng)的是傅里葉反變換,是將多次諧波的正弦波信號疊加為一個信號。傅里葉變換原理本課件是可編輯的正常PPT課件1.3傅里葉變換Part1125傅里葉變換將某些難以處理的時域信號轉(zhuǎn)換為易于處理與分析的頻域信號。隨后利用一些頻域分析方法對頻域信號進行處理和加工。最后再進行傅里葉反變換將處理后的頻域信號轉(zhuǎn)換為時域信號。傅里葉變換原理本課件是可編輯的正常PPT課件1.3傅里葉變換Part1126單變量連續(xù)函數(shù)

的單變量連續(xù)函數(shù)

定義為:若給出

,則其傅里葉反變換

的定義為:一維連續(xù)型傅里葉變換及其反變換本課件是可編輯的正常PPT課件1.3傅里葉變換Part1127二維連續(xù)函數(shù)的傅里葉變換定義為:若給定

,則其傅里葉反變換

的定義為:二維連續(xù)型傅里葉變換及其反變換本課件是可編輯的正常PPT課件1.3傅里葉變換Part1128單變量離散函數(shù)

的傅里葉變換

定義為:若給出

,則其傅里葉反變換

的定義為:一維離散型傅里葉變換(DFT)及其反變換本課件是可編輯的正常PPT課件1.3傅里葉變換Part1129二維離散函數(shù)的傅里葉變換定義為:若給定

,則其傅里葉反變換

的定義為:二維離散型傅里葉變換及其反變換本課件是可編輯的正常PPT課件1.3傅里葉變換Part1130a)一維傅里葉變換的極坐標表示

幅值或頻率譜為:其中和分別是的實部和虛部

相角或相位譜為:傅里葉變換的極坐標表示本課件是可編輯的正常PPT課件1.3傅里葉變換Part1131b)二維DFT的極坐標表示

幅值或頻率譜為:其中和分別是的實部和虛部

相角或相位譜為:傅里葉變換的極坐標表示本課件是可編輯的正常PPT課件1.3傅里葉變換Part1132傅里葉變換的頻率譜和相位譜(c)相位譜(a)原圖(b)頻率譜本課件是可編輯的正常PPT課件1.3傅里葉變換Part1133圖像的頻率是表征圖像中灰度變化劇烈程度的指標,是灰度在平面空間上的梯度。灰度變化得快頻率就高,灰度變化得慢頻率就低。傅里葉變換在圖像處理中的作用本課件是可編輯的正常PPT課件1.3傅里葉變換Part1134從物理效果看,傅立葉變換是將圖像從空間域轉(zhuǎn)換到頻率域,將圖像的灰度分布函數(shù)變換為圖像的頻率分布函數(shù)。傅里葉反變換是將圖像從頻率域轉(zhuǎn)換到空間域,將圖像的頻率分布函數(shù)變換為灰度分布函數(shù)。傅里葉變換在圖像處理中的作用本課件是可編輯的正常PPT課件1.3傅里葉變換Part1135傅立葉頻譜圖上明暗不一的區(qū)域,實質(zhì)上是圖像上某一像素點與其鄰域像素點的灰度值差異,也就是梯度。梯度越大,頻率越高,能量越低,在頻譜圖上就越暗;反之梯度越小,頻率越低,能量越高,在頻譜圖上越亮。傅里葉變換在圖像處理中的作用本課件是可編輯的正常PPT課件圖像濾波線性濾波非線性濾波頻域濾波本課件是可編輯的正常PPT課件Part2137圖像濾波的操作過程為一個濾波模板(又稱濾波器、鄰域算子)在待處理圖像上移動,對每個濾波器覆蓋的區(qū)域進行點乘求和,得到的值作為中心像素點的輸出值。圖像濾波的基本思想2圖像濾波本課件是可編輯的正常PPT課件Part2138對于圖像的邊緣像素處,可以選擇對圖像邊緣進行擴充,例如,使用3x3的濾波器時,可以用0在原始圖像周圍增加一層像素。圖像濾波的基本思想2圖像濾波本課件是可編輯的正常PPT課件2.1線性濾波Part2139線性濾波器中心點的像素值與其他鄰域像素值存在線性關(guān)系,常見的線性濾波方法有方框濾波、均值濾波、高斯濾波。設(shè)濾波器大小為NxN,濾波器所在區(qū)域圖像的像素值為f(x,y),其中x,y=1,2,3…,N。本課件是可編輯的正常PPT課件2.1線性濾波Part2140方框濾波:中心點的像素值為濾波器所在區(qū)域圖像的像素值之和,即均值濾波:該方法中心點的像素值為濾波器所在區(qū)域像素之和的平均值本課件是可編輯的正常PPT課件2.1線性濾波Part2141方框濾波的效果(a)原圖(b)加高斯噪聲(c)方框濾波后本課件是可編輯的正常PPT課件2.1線性濾波Part2142均值濾波的效果(a)原圖(b)加高斯噪聲(c)均值濾波后本課件是可編輯的正常PPT課件2.1線性濾波Part2143前兩種濾波方法認為不同位置上的噪聲是基本相同的,但是實際中不同位置上的噪聲存在差異,而常見的噪聲符合高斯分布,因此可以采用高斯濾波器進行濾波處理。高斯濾波考慮了像素離濾波器中心距離的影響,根據(jù)高斯分布公式和每個像素點距離中心像素點的位置計算出濾波器每個位置上的數(shù)值,從而形成一個高斯濾波器。二維高斯分布公式為:高斯濾波

本課件是可編輯的正常PPT課件2.1線性濾波Part2144以σ=1.5為例,可以得到模糊半徑為1的高斯模板高斯濾波本課件是可編輯的正常PPT課件2.1線性濾波Part2145為了保證九個點之和為1,要對得到的高斯模板進行歸一化操作,最終得到3x3高斯濾波器模板。高斯濾波本課件是可編輯的正常PPT課件2.1線性濾波Part2146高斯濾波的效果(a)原圖(b)加高斯噪聲(c)高斯濾波后本課件是可編輯的正常PPT課件2.1線性濾波Part2147三種濾波效果對比方框濾波均值濾波高斯濾波本課件是可編輯的正常PPT課件2.1線性濾波Part2148除了上述幾種常用的線性濾波,還可以根據(jù)實際任務(wù)需要,自定義一個濾波器的系數(shù)來實現(xiàn)自定義濾波。自定義濾波本課件是可編輯的正常PPT課件2.2非線性濾波Part2149線性濾波是對所有像素值的線性組合得到濾波的結(jié)果,因此含有噪聲的像素點也會被考慮進去,并且噪聲像素點會以更加柔和的方式存在于圖像中。非線性濾波可以利用邏輯判斷將噪聲像素點過濾掉,從而實現(xiàn)更好的濾波效果。其計算過程可能包括排序、邏輯計算等,常見的非線性濾波方法有中值濾波和雙邊濾波。本課件是可編輯的正常PPT課件2.2非線性濾波Part2150首先將濾波器范圍內(nèi)的所有像素值按照從小到大的順序排序,然后選取排好序的序列中值作為濾波后濾波器中心點的像素值,后面操作同線性濾波,即移動濾波器重復(fù)進行排序取中值操作。中值濾波本課件是可編輯的正常PPT課件2.2非線性濾波Part2151中值濾波能在濾除噪聲的同時保留圖像的邊緣信息,因此得到了廣泛的應(yīng)用。但中值濾波過程中的數(shù)據(jù)排序費時較多,尤其是對尺寸較大的圖像,需要進行大量的像素值比較,耗時較長,不利于圖像濾波處理的實時性;同時也容易產(chǎn)生圖像模糊的現(xiàn)象。中值濾波的優(yōu)缺點本課件是可編輯的正常PPT課件2.2非線性濾波Part2152中值濾波的效果(a)原圖(b)加高斯噪聲(c)中值濾波后本課件是可編輯的正常PPT課件2.2非線性濾波Part2153前面幾種方法都會造成圖像模糊,使邊緣信息消失或減弱。為了保護邊緣信息在圖像濾波過程中不會損失,產(chǎn)生了邊緣保護濾波算法,其中最常用的邊緣保護濾波算法就是雙邊濾波。前面介紹的高斯濾波只關(guān)注位置信息,即距離中心點越近濾波器系數(shù)越大,距離越遠系數(shù)越小。而雙邊濾波是在高斯濾波的基礎(chǔ)上加入像素值差異指標,即同時考慮像素點的距離因素和像素值的差異,像素值差異越小系數(shù)越大,差異越大系數(shù)越小雙邊濾波本課件是可編輯的正常PPT課件2.2非線性濾波Part2154雙邊濾波原理本課件是可編輯的正常PPT課件2.2非線性濾波Part2155空間位置距離濾波器系數(shù)的生成公式為其中(k,l)為濾波器中心像素點的坐標;(i,j)為濾波器鄰域像素點的坐標;σd為距離標準差。雙邊濾波公式本課件是可編輯的正常PPT課件2.2非線性濾波Part2156像素值差異濾波器系數(shù)的生成公式為其中,函數(shù)f(i,j)表示要處理的圖像在(i,j)處的像素值,f(k,l)表示圖像在(k,l)處的像素值;σr為灰度標準差。雙邊濾波公式本課件是可編輯的正常PPT課件2.2非線性濾波Part2157上述兩式相乘,得到雙邊濾波器系數(shù)的生成公式距離標準差σd和灰度標準差σr是雙邊濾波器的重要參數(shù),σd越大圖像越模糊,σr越大細節(jié)越模糊,所以可以根據(jù)3σ原則來選取合適的濾波器尺寸。雙邊濾波公式本課件是可編輯的正常PPT課件2.2非線性濾波Part2158雙邊濾波的效果(a)原圖(b)加高斯噪聲(c)雙邊濾波后本課件是可編輯的正常PPT課件2.3頻域濾波Part2159圖像濾波除在空間域進行外,還可以在頻域進行。頻域濾波主要分為低通濾波和高通濾波。在頻域上,低頻部分表示輪廓,高頻部分表示細節(jié),因此可以使用低通濾波和高通濾波分別對圖像進行平滑和銳化處理。頻域濾波本課件是可編輯的正常PPT課件2.3頻域濾波Part2160頻域濾波過程本課件是可編輯的正常PPT課件2.3頻域濾波Part2161低通濾波器分為理想低通濾波器、高斯低通濾波器和Butterworth低通濾波器三種。理想低通濾波器的濾波非常尖銳,而高斯低通濾波器的濾波則非常平滑。Butterworth低通濾波器則介于兩者之間,當Butterworth低通濾波器的階數(shù)較高時,接近理想低通濾波器;階數(shù)較低時,則接近高斯低通濾波器。低通濾波本課件是可編輯的正常PPT課件2.3頻域濾波Part2162理想低通濾波器工作原理是,無衰減地通過以原點為圓心、D0為半徑的圓內(nèi)所有頻率,而截斷圓外所有的頻率,圓心的頻率最低,為變換的直流分量。理想低通濾波器的函數(shù)表達式為理想低通濾波器本課件是可編輯的正常PPT課件2.3頻域濾波Part2163理想低通濾波器的過渡非常急劇,會產(chǎn)生振鈴現(xiàn)象。理想低通濾波器徑向橫截面圖像形式傳遞函數(shù)的透視圖本課件是可編輯的正常PPT課件2.3頻域濾波Part2164理想低通濾波器的效果原圖原圖的頻譜處理后的圖像處理后的頻譜本課件是可編輯的正常PPT課件2.3頻域濾波Part2165高斯低通濾波器的函數(shù)表達式見下式,從圖中可看出過渡特性非常平緩,因此不會產(chǎn)生振鈴現(xiàn)象。高斯低通濾波器(a)傳遞函數(shù)的透視圖(b)圖像形式(c)徑向橫截面本課件是可編輯的正常PPT課件2.3頻域濾波Part2166理想高斯低通濾波器的效果原圖原圖的頻譜處理后的圖像處理后的頻譜本課件是可編輯的正常PPT課件2.3頻域濾波Part2167Butterworth低通濾波器的函數(shù)表達式見下,n為階次Butterworth低通濾波器的過渡是理想低通濾波器和高斯低通濾波器的折中。同時,隨著階數(shù)的增加,過渡越來越劇烈,越接近理想低通濾波器;隨著階數(shù)的減少,過渡越來越平緩,越接近高斯低通濾波器。Butterworth低通濾波器本課件是可編輯的正常PPT課件2.3頻域濾波Part2168高斯低通濾波器的函數(shù)表達式見下式,從圖中可看出過渡特性非常平緩,因此不會產(chǎn)生振鈴現(xiàn)象。Butterworth低通濾波器(a)傳遞函數(shù)的透視圖(b)圖像形式(c)徑向橫截面本課件是可編輯的正常PPT課件2.3頻域濾波Part2169Butterworth低通濾波器的效果原圖原圖的頻譜處理后的圖像處理后的頻譜本課件是可編輯的正常PPT課件2.3頻域濾波Part2170高通濾波與低通濾波正好相反,通過過濾或者大幅度衰減低頻成分,同時利用高頻成分來實現(xiàn)圖像銳化操作。為了得到高通濾波器,通??梢酝ㄟ^用1減去對應(yīng)的低通濾波器來實現(xiàn)。高通濾波器可分為理想高通濾波器、高斯高通濾波器和Butterworth高通濾波器三種。高通濾波本課件是可編輯的正常PPT課件2.3頻域濾波Part2171二維理想高通濾波器的函數(shù)表達式為理想高通濾波器(a)傳遞函數(shù)的透視圖(b)圖像形式(c)徑向橫截面本課件是可編輯的正常PPT課件2.3頻域濾波Part2172理想高通濾波器的效果原圖原圖的頻譜處理后的圖像處理后的頻譜本課件是可編輯的正常PPT課件2.3頻域濾波Part2173二維高斯高通濾波器的函數(shù)表達式為其中σ是關(guān)于中心的擴展度的度量高斯高通濾波器(a)傳遞函數(shù)的透視圖(b)圖像形式(c)徑向橫截面本課件是可編輯的正常PPT課件2.3頻域濾波Part2174理想高斯高通濾波器的效果原圖原圖的頻譜處理后的圖像處理后的頻譜本課件是可編輯的正常PPT課件2.3頻域濾波Part2175n階Butterworth高通濾波器的函數(shù)表達式為Butterworth高通濾波器(a)傳遞函數(shù)的透視圖(b)圖像形式(c)徑向橫截面

本課件是可編輯的正常PPT課件2.3頻域濾波Part2176Butterworth高通濾波器的效果原圖原圖的頻譜處理后的圖像處理后的頻譜本課件是可編輯的正常PPT課件邊緣檢測邊緣檢測原理邊緣檢測線性算子本課件是可編輯的正常PPT課件3.1邊緣檢測原理Part3178物體邊緣是圖像中非常重要的信息,提取圖像的邊緣信息有利于分析圖像中的內(nèi)容,進而實現(xiàn)圖像中的物體分割、定位等操作。圖像的邊緣是指圖像中像素值發(fā)生突變的區(qū)域。圖像中像素值的變化趨勢,可以用圖像函數(shù)的導(dǎo)數(shù)表示,導(dǎo)數(shù)絕對值較大的區(qū)域就是圖像的邊緣區(qū)域。邊緣檢測原理本課件是可編輯的正常PPT課件3.1邊緣檢測原理Part3179但在像素值變化90°的區(qū)域,其導(dǎo)數(shù)為無窮大,遠遠超出計算機的數(shù)據(jù)范圍。而微分dy是將導(dǎo)數(shù)乘以一個無窮小量dx得到的,即。這樣就避免超出計算機數(shù)據(jù)范圍的問題,因此我們選擇微分來表示像素值的變化情況。邊緣檢測原理

本課件是可編輯的正常PPT課件3.1邊緣檢測原理Part3180微分只適用于連續(xù)信號,而現(xiàn)實中的圖像是離散信號,因此常常利用差分來代替微分,差分是用臨近的兩個像素值的差來表示像素值函數(shù)變化的導(dǎo)數(shù)。使用時必須使差分的方向和邊緣的方向相垂直,這就需要對圖像進行多方向差分運算,一般包括水平x方向、垂直y方向差分可分為前向差分和后向差分邊緣檢測原理本課件是可編輯的正常PPT課件3.1邊緣檢測原理Part3181前向差分是當前像素與下一個像素值的差,對于x方向的像素值函數(shù)變化的導(dǎo)數(shù)為后向差分則是當前像素與上一個像素值的差,x方向的像素值函數(shù)變化的導(dǎo)數(shù)為邊緣檢測原理本課件是可編輯的正常PPT課件3.1邊緣檢測原理Part3182無論是前向差分還是后向差分,其求導(dǎo)的結(jié)果都接近于兩個像素中間未知的梯度,而兩個像素中間沒有任何像素。想要表示某一像素處的梯度,需要采取其他差分方式,最接近的方式是用下一個像素值與上一個像素值的差來表示,即邊緣檢測原理本課件是可編輯的正常PPT課件3.2邊緣檢測線性算子Part3183先對算子與圖像的每個像素值做卷積和運算,再選取合適的閾值來提取圖像的邊緣。常見的有Roberts邊緣算子、Prewitt算子、Sobel算子和Scharr算子。一階導(dǎo)數(shù)的邊緣算子本課件是可編輯的正常PPT課件3.2邊緣檢測線性算子Part3184Roberts邊緣算子是一個2x2的模板,其像素梯度計算公式為故在點(i,j)處的水平與豎直邊緣檢測Roberts邊緣算子為一階導(dǎo)數(shù)的邊緣算子—Roberts算子本課件是可編輯的正常PPT課件3.2邊緣檢測線性算子Part3185該算子采用的是對角方向相鄰的兩個像素之差,通過局部差分計算檢測邊緣線條,常用來處理陡峭的低噪聲圖像。當圖像邊緣接近45°時,該算法處理效果更理想,但是檢測到的邊緣線條較粗,定位精度不高。一階導(dǎo)數(shù)的邊緣算子—Roberts算子邊緣檢測效果

(a)原圖本課件是可編輯的正常PPT課件3.2邊緣檢測線性算子Part3186Prewitt利用周圍鄰域8個點的灰度值來估計中心的梯度,它的梯度計算公式如下:Prewitt算子模板為:一階導(dǎo)數(shù)的邊緣算子—Prewitt算子本課件是可編輯的正常PPT課件3.2邊緣檢測線性算子Part3187Prewitt算子采用3x3模板對區(qū)域內(nèi)的像素值進行計算,Robert算子的模板為2x2,故Prewitt算子的邊緣檢測結(jié)果在水平方向和垂直方向上均比Robert算子更加明顯。Prewitt算子適合用來識別噪聲較多、灰度漸變的圖像。一階導(dǎo)數(shù)的邊緣算子—Prewitt算子邊緣檢測效果(a)原圖

本課件是可編輯的正常PPT課件3.2邊緣檢測線性算子Part3188

一階導(dǎo)數(shù)的邊緣算子—Sobel算子本課件是可編輯的正常PPT課件3.2邊緣檢測線性算子Part3189一階導(dǎo)數(shù)的邊緣算子—Sobel算子邊緣檢測效果(a)原圖

本課件是可編輯的正常PPT課件3.2邊緣檢測線性算子Part3190雖然Sobel算子可以有效的提取圖像邊緣,但是對圖像中較弱的邊緣提取效果較差。為了有效地提取較弱的邊緣,需要將像素之間的差距拉大,于是引入了Scharr算子,其算子模板為:一階導(dǎo)數(shù)的邊緣算子—Scharr算子

本課件是可編輯的正常PPT課件3.2邊緣檢測線性算子Part3191一階導(dǎo)數(shù)的邊緣算子—Scharr算子邊緣檢測效果(a)原圖

本課件是可編輯的正常PPT課件3.2邊緣檢測線性算子Part3192根據(jù)二階導(dǎo)數(shù)過零點來檢測邊緣,常見的有Laplacian算子和LaplacianofGaussian(LOG)算子二階導(dǎo)數(shù)的邊緣算子本課件是可編輯的正常PPT課件3.2邊緣檢測線性算子Part3193對于圖像的二階微分可以用Laplacian算子來表示:在像素點f(x,y)的3x3領(lǐng)域內(nèi),有如下差分近似關(guān)系:二階導(dǎo)數(shù)的邊緣算子—Laplacian算子本課件是可編輯的正常PPT課件3.2邊緣檢測線性算子Part3194Laplacian算子模板為:Laplacian算子檢測邊緣的步驟分為兩步,第一步是用Laplacian算子模板與圖像進行卷積操作,第二步是對卷積后圖像,取像素值為0的像素點。二階導(dǎo)數(shù)的邊緣算子—Laplacian算子本課件是可編輯的正常PPT課件3.2邊緣檢測線性算子Part3195Laplacian算子雖然方法簡單,但是對噪聲十分敏感,同時也沒有提供邊緣的方向信息。為了抑制噪聲的干擾,Marr等人提出了LOG的方法,LOG算子首先采用高斯低通濾波器對圖像進行濾波處理,隨后再對圖像濾波結(jié)果進行二階微分運算二階導(dǎo)數(shù)的邊緣算子—LOG算子本課件是可編輯的正常PPT課件3.2邊緣檢測線性算子Part3196Laplacian算子和LOG算子邊緣檢測的效果(a)原圖(b)Laplacian算子(c)LOG算子本課件是可編輯的正常PPT課件3.2邊緣檢測線性算子Part3197上述兩類均是通過微分算子來檢測圖像邊緣,而Canny算子是在滿足一定約束條件下推導(dǎo)出來的邊緣檢測最優(yōu)化算子。算法流程如下圖所示:Canny邊緣檢測本課件是可編輯的正常PPT課件3.2邊緣檢測線性算子Part3198a)濾波降噪處理,一般采用高斯濾波來去除噪聲。b)差分計算幅值和方向。首先利用邊緣差分算子計算水平和垂直方向的差分Gx和Gy,然后計算其梯度幅值G和方向θCanny邊緣檢測的具體操作本課件是可編輯的正常PPT課件3.2邊緣檢測線性算子Part3199c)非極大值抑制。對圖像進行梯度計算后,僅基于梯度值提取到的邊緣仍舊模糊。不滿足最優(yōu)邊緣檢測特征中的最小響應(yīng)要求,而非極大值抑制則可以將局部最大值之外的剩余梯度值抑制為0,可以大大增強圖像的邊緣信息。Canny邊緣檢測的具體操作本課件是可編輯的正常PPT課件3.2邊緣檢測線性算子Part3200d)雙閾值檢測。在非極大值抑制之后,余下像素可以較準確地表示圖像中的邊緣信息,但是,仍然存在由于噪聲和顏色變化等因素造成的一些錯誤邊緣像素。Canny邊緣檢測的具體操作本課件是可編輯的正常PPT課件3.2邊緣檢測線性算子Part3201e)抑制孤立低閾值點。經(jīng)過雙閾值檢測,被標記為強邊緣的像素點已經(jīng)確定為邊緣,但對于弱邊緣像素卻不一定,因為這些像素既可能從真實邊緣提取也可能是因噪聲或顏色變化引起的。為了獲得準確的結(jié)果,應(yīng)該抑制由后者引起的弱邊緣。通常認為真實邊緣引起的弱邊緣點和強邊緣點是連通的,而由噪聲引起的弱邊緣點則不會。Canny邊緣檢測的具體操作本課件是可編輯的正常PPT課件3.2邊緣檢測線性算子Part3202故可以通過查看弱邊緣像素的8個鄰域像素,只要其中一個為強邊緣像素,則該弱邊緣點就可以保留為真實的邊緣,否則去除該像素點。Canny邊緣檢測的具體操作本課件是可編輯的正常PPT課件3.2邊緣檢測線性算子Part3203Canny邊緣檢測的效果(a)原圖(b)低閾值Canny邊緣檢測(c)高閾值Canny邊緣檢測本課件是可編輯的正常PPT課件數(shù)字形態(tài)學(xué)濾波數(shù)字形態(tài)學(xué)濾波基礎(chǔ)數(shù)字形態(tài)學(xué)運算本課件是可編輯的正常PPT課件4.1數(shù)字形態(tài)學(xué)濾波基礎(chǔ)Part4205數(shù)字形態(tài)學(xué)是一種特殊的數(shù)字圖象處理方法和理論,不同于空間域和頻率域算法,數(shù)學(xué)形態(tài)學(xué)以圖像的形態(tài)特征為研究對象,通過設(shè)計一整套變換、概念和算法,用以描述圖像的基本特征。概述本課件是可編輯的正常PPT課件4.1數(shù)字形態(tài)學(xué)濾波基礎(chǔ)Part4206利用數(shù)學(xué)形態(tài)學(xué)可以對圖像進行增強、分割、邊緣檢測、形態(tài)分析、骨架化等處理。數(shù)學(xué)形態(tài)學(xué)最基本的變換是膨脹和腐蝕。需要注意的是在數(shù)學(xué)形態(tài)學(xué)變換之前,需要將圖像轉(zhuǎn)化為灰度圖像,再經(jīng)過二值化轉(zhuǎn)化為二值圖像概述本課件是可編輯的正常PPT課件4.1數(shù)字形態(tài)學(xué)濾波基礎(chǔ)Part4207膨脹(dilated)是圖像中的高亮部分進行膨脹,領(lǐng)域擴張,效果圖擁有比原圖更大的高亮區(qū)域。具體操作是將結(jié)構(gòu)元素覆蓋范圍內(nèi)的最大值賦給中心點,也就是求局部最大值;膨脹與腐蝕本課件是可編輯的正常PPT課件4.1數(shù)字形態(tài)學(xué)濾波基礎(chǔ)Part4208腐蝕是圖像中的高亮部分被腐蝕掉,領(lǐng)域縮減,效果圖擁有比原圖更小的高亮區(qū)域。具體操作是將最小值賦給中心點,即求局部最小值。膨脹與腐蝕本課件是可編輯的正常PPT課件4.1數(shù)字形態(tài)學(xué)濾波基礎(chǔ)Part4209膨脹的效果(a)原圖(b)膨脹后本課件是可編輯的正常PPT課件4.1數(shù)字形態(tài)學(xué)濾波基礎(chǔ)Part4210腐蝕的效果(a)原圖(b)腐蝕后本課件是可編輯的正常PPT課件4.2數(shù)字形態(tài)學(xué)運算Part4211圖像腐蝕可以去除掉細小的噪聲區(qū)域,但是圖像主要區(qū)域的面積會縮小,使得主要區(qū)域形狀發(fā)生改變。圖像膨脹可以填充較小的空洞,但也會增加噪聲的面積。概述本課件是可編輯的正常PPT課件4.2數(shù)字形態(tài)學(xué)運算Part4212根據(jù)腐蝕和膨脹不同的特性,我們可以將兩者進行結(jié)合,便可以既去除細小噪聲,又不會減少圖像的主要區(qū)域;既填充較小空洞,又不會增加噪聲區(qū)域。以腐蝕和膨脹這兩種基本運算為基礎(chǔ),可以得到其他幾個常用的數(shù)學(xué)形態(tài)運算:開運算、閉運算、頂帽運算、黑帽運算、擊中、細化和粗化等,下面對這些常用數(shù)學(xué)形態(tài)運算進行詳細闡述。概述本課件是可編輯的正常PPT課件4.2數(shù)字形態(tài)學(xué)運算Part4213

(1)開運算

本課件是可編輯的正常PPT課件4.2數(shù)字形態(tài)學(xué)運算Part4214如所示,設(shè)目標圖像為A,如左圖,其中白色部分代表背景,灰色代表目標X;右圖為結(jié)構(gòu)元素B,其中紅色為原點位置(1)開運算本課件是可編輯的正常PPT課件4.2數(shù)字形態(tài)學(xué)運算Part4215首先進行腐蝕操作,腐蝕過程(左圖)及結(jié)果(右圖)如所示。(1)開運算本課件是可編輯的正常PPT課件4.2數(shù)字形態(tài)學(xué)運算Part4216再進行膨脹操作,如所示,遍歷處理過程如左圖,膨脹后結(jié)果如右圖。(1)開運算本課件是可編輯的正常PPT課件4.2數(shù)字形態(tài)學(xué)運算Part4217圖像開運算可以去除圖像中的噪聲,消除較小的連通域,保留較大的連通域,同時能夠在兩個物體較細的連接處將兩個物體分離,并且在不改變較大連通域面積的同時能夠平滑連通域的邊界。(1)開運算本課件是可編輯的正常PPT課件4.2數(shù)字形態(tài)學(xué)運算Part4218(1)開運算的效果(a)原圖(b)開運算后本課件是可編輯的正常PPT課件4.2數(shù)字形態(tài)學(xué)運算Part4219如所示,設(shè)目標圖像為A,如左圖,其中白色部分代表背景,灰色代表目標X;右圖為結(jié)構(gòu)元素B,其中橘黃色為原點位置。(2)閉運算本課件是可編輯的正常PPT課件4.2數(shù)字形態(tài)學(xué)運算Part4220首先進行膨脹操作,如所示,腐蝕過程(左圖)及結(jié)果(右圖)如下(2)閉運算本課件是可編輯的正常PPT課件4.2數(shù)字形態(tài)學(xué)運算Part4221再進行腐蝕操作,遍歷處理過程如左圖,膨脹后結(jié)果如右圖(2)閉運算本課件是可編輯的正常PPT課件4.2數(shù)字形態(tài)學(xué)運算Part4222圖像閉運算可以去除連通域內(nèi)的小型空洞,平滑物體輪廓,連接兩個相鄰的連通域。(2)閉運算本課件是可編輯的正常PPT課件4.2數(shù)字形態(tài)學(xué)運算Part4223(2)閉運算的效果(a)原圖(b)閉運算后本課件是可編輯的正常PPT課件4.2數(shù)字形態(tài)學(xué)運算Part4224圖像頂帽運算是由原始圖像減去圖像開運算得到的結(jié)果,目的是為了獲取圖像的噪聲信息。(3)頂帽運算本課件是可編輯的正常PPT課件4.2數(shù)字形態(tài)學(xué)運算Part4225(3)頂帽運算的效果(a)原圖(b)頂帽運算后本課件是可編輯的正常PPT課件4.2數(shù)字形態(tài)學(xué)運算Part4226圖像黑帽運算是由圖像閉運算操作減去原始圖像得到的結(jié)果,目的是獲取圖像內(nèi)部的小孔,或者前景色中的小黑點。(4)黑帽運算本課件是可編輯的正常PPT課件4.2數(shù)字形態(tài)學(xué)運算Part4227(4)黑帽運算的效果(a)原圖(b)黑帽運算后本課件是可編輯的正常PPT課件4.2數(shù)字形態(tài)學(xué)運算Part4228擊中擊不中變換是比圖像腐蝕要求更加嚴格的一種形態(tài)學(xué)運算,圖像腐蝕只需要圖像能夠?qū)⒔Y(jié)構(gòu)元素中所有的非零元素包含,但是擊中擊不中變換在圖像腐蝕基礎(chǔ)上還要求包含零元素。換句話說,只有當結(jié)構(gòu)元素與其覆蓋的圖像區(qū)域完全相同時,中心像素的值才會被置為1,否則為0。(5)擊中擊不中變換本課件是可編輯的正常PPT課件4.2數(shù)字形態(tài)學(xué)運算Part4229(5)擊中擊不中變換原理示意圖本課件是可編輯的正常PPT課件4.2數(shù)字形態(tài)學(xué)運算Part4230(5)擊中擊不中變換的效果(a)原圖(b)擊中擊不中變換后本課件是可編輯的正常PPT課件4.2數(shù)字形態(tài)學(xué)運算Part4231圖像細化是將圖像的線條寬度所占像素減少,又稱“骨架化”或“中軸變換”。圖像細化一般要求保證細化后的連通性、能夠盡可能保留圖像的細節(jié)信息、線條的端點保持完好同時線條交叉點不能發(fā)生畸變。(6)圖像細化與粗化本課件是可編輯的正常PPT課件4.2數(shù)字形態(tài)學(xué)運算Part4232圖像細化主要適用于由線條形狀構(gòu)成的物體,例如圓環(huán)、文字等。圖像的粗化與細化相反,其實現(xiàn)過程是通過對圖像的二值化補集進行細化后得到。(6)圖像細化與粗化本課件是可編輯的正常PPT課件4.2數(shù)字形態(tài)學(xué)運算Part4233(6)圖像細化的效果(b)細化后進一步二值化(a)原圖本課件是可編輯的正常PPT課件總結(jié)本課件是可編輯的正常PPT課件5總結(jié)Part5235首先介紹了圖像傅里葉變換的基礎(chǔ)知識,包括頻域與時域的區(qū)別與聯(lián)系,傅里葉變換的原理與圖像處理中的應(yīng)用。然后,介紹了空間域和頻率域的圖像濾波方法,其中空間域濾波又包括線性濾波和非線性濾波,線性濾波主要包括方框濾波、均值濾波、高斯濾波等,非線性濾波主要包括中值濾波、雙邊濾波。頻域濾波主要包括低通濾波和高通濾波。本課件是可編輯的正常PPT課件5總結(jié)Part5236此外,本章介紹了如何通過濾波得到圖像的邊緣信息,重點介紹了一、二階導(dǎo)數(shù)的邊緣算子和Canny邊緣算子,其中一階導(dǎo)數(shù)的邊緣算子包括Roberts算子、Sobel算子和Prewitt算子,二階導(dǎo)數(shù)的邊緣算子包括Laplacian算子和LaplacianofGaussian(LOG)算子。最后,本章還介紹了數(shù)學(xué)形態(tài)學(xué)濾波,包括圖像膨脹、腐蝕的基本變換和開運算、閉運算、頂帽運算、黑帽運算、擊中、細化和粗化等常用運算。本課件是可編輯的正常PPT課件感謝各位的聆聽!本課件是可編輯的正常PPT課件機器視覺:4.圖像分割與描述本課件是可編輯的正常PPT課件活動輪廓與Snake模型分水嶺分割算法基于區(qū)域生長的圖像分割

圖像標記

圖像直方圖與閾值分割圖像描述本課件是可編輯的正常PPT課件圖像直方圖與閾值分割圖像直方圖閾值分割局部閾值分割本課件是可編輯的正常PPT課件圖像直方圖與閾值分割Part

1241對一幅灰度圖進行圖像分割,首先想到的就是基于像素的灰度值進行分割。對一幅灰度圖來說,圖像中各個物體區(qū)域內(nèi)部的灰度值往往是相似且連續(xù)的,而不同區(qū)域之間的灰度值存在較大差別。如果將一幅灰度圖劃分為目標和背景兩個部分,通常來說,目標的灰度值處于不同區(qū)間?;谶@種特性,可使用基于閾值的圖像分割方法,即設(shè)定一個基準的灰度值,高于該值的設(shè)定為一個區(qū)域,低于該值的設(shè)定為另一個區(qū)域。設(shè)輸入圖像為f,閾值分割后的輸出圖像為g,閾值為T,則閾值分割過程可表示為:本課件是可編輯的正常PPT課件圖像直方圖與閾值分割Part

1242(a)原始灰度圖(c)閾值過高時的分割效果(b)閾值合適時的分割效果(d)閾值過低時的分割效果本課件是可編輯的正常PPT課件圖像直方圖與閾值分割Part

1243本節(jié)介紹幾種常用的閾值選取方法,包括基于圖像直方圖的閾值選取及自適應(yīng)的閾值選取方法,這兩種方法都屬于全局閾值分割。此外,對于某些圖像,我們很難用一個統(tǒng)一的閾值將整幅圖像的目標和背景正確分離出來,可使用基于局部閾值分割的方法。本課件是可編輯的正常PPT課件1.1圖像直方圖Part

1244圖像直方圖——直方圖的定義圖像直方圖是一種用于描述數(shù)字圖像灰度分布情況的圖形統(tǒng)計工具。通俗來說,直方圖就是將圖像中所有像素的亮度或顏色值按照一定的間隔進行統(tǒng)計從而形成的一種統(tǒng)計圖形。在視覺處理中,它是一種常用工具,用來分析圖像的灰度特征、對比度、亮度均衡、顏色分布等。圖像直方圖通常以灰度值為橫坐標,以像素數(shù)量或像素占比為縱坐標。對于彩色圖像而言,可以分別計算各個通道(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論