版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第四章計(jì)算機(jī)視覺CONTENTS目錄計(jì)算機(jī)視覺應(yīng)用場(chǎng)景01計(jì)算機(jī)視覺基礎(chǔ)與應(yīng)用開發(fā)02案例體驗(yàn)03計(jì)算機(jī)視覺應(yīng)用場(chǎng)景4.1概述01應(yīng)用場(chǎng)景02概述計(jì)算機(jī)視覺(ComputerVision,CV):是一門研究如何使機(jī)器“看”的科學(xué)。用攝影機(jī)和電腦代替人眼對(duì)目標(biāo)進(jìn)行識(shí)別、跟蹤和測(cè)量等機(jī)器視覺,并進(jìn)一步做圖形處理成為更適合人眼觀察或儀器檢測(cè)的圖像。對(duì)人類而言,通過視覺輸入的信息占據(jù)各種感官信息的75%以上。我們常說“百聞不如一見”;西方人常說"Onepictureisworthtenthousandwords"。01人眼可見光處理是計(jì)算機(jī)視覺的很重要一部分;除此之外,計(jì)算機(jī)視覺可以感知人眼所看不到的很多信息。從伽馬射線、X射線、紫外、可見光、紅外、雷達(dá)、毫米波、無線電波等各種電磁波的成像,都可以用于計(jì)算機(jī)視覺分析。概述01/s?id=1551073604060130&wfr=spider&for=pc可見光X射線伽馬射線紅外線微波無線電波概述01應(yīng)用場(chǎng)景02人臉檢測(cè)文字識(shí)別自動(dòng)駕駛圖像識(shí)別應(yīng)用場(chǎng)景02研究方向應(yīng)用場(chǎng)景物體和生命體的狀態(tài)和屬性能夠通過它們表面的溫度分布圖像來衡量。熱成像是記錄地球上任何物體釋放的紅外波光波,并且對(duì)其成像的技術(shù)。熱成像的應(yīng)用領(lǐng)域非常廣泛,例如工業(yè)、安防、軍事、科研等。熱成像技術(shù)提供了一種安全、無損傷的數(shù)據(jù)獲取手段;在醫(yī)學(xué)、生態(tài)學(xué)、動(dòng)物學(xué)等領(lǐng)域已有大量的應(yīng)用。/showarticle.asp?id=45310498602自然科學(xué)應(yīng)用場(chǎng)景醫(yī)學(xué)影像是臨床疾病篩查、診斷、治療引導(dǎo)和評(píng)估的重要工具。常規(guī)的影像診斷依賴于閱片醫(yī)生的水平和經(jīng)驗(yàn),存在著主觀性強(qiáng)、重復(fù)性低以及定量分析不夠等問題,迫切需要新的智能技術(shù)介入,幫助醫(yī)生提升診斷的準(zhǔn)確性和閱片效率,同時(shí)也能進(jìn)一步拓展醫(yī)學(xué)影像在臨床診療中的應(yīng)用。隨著深度學(xué)習(xí)技術(shù)發(fā)展,智慧醫(yī)療已經(jīng)成為人工智能最為重要的應(yīng)用領(lǐng)域之一,并成為解決醫(yī)療行業(yè)如下兩大痛點(diǎn)的有效途徑之一:1)醫(yī)療供需不平衡,影像醫(yī)生短缺與臨床影像數(shù)據(jù)大量增長(zhǎng)之間的矛盾;2)影像醫(yī)生水平參差不齊且資源分布不均。與醫(yī)學(xué)影像相關(guān)的醫(yī)學(xué)成像系統(tǒng)和醫(yī)學(xué)圖像處理與分析是智慧醫(yī)療最為典型的應(yīng)用場(chǎng)景。02醫(yī)療領(lǐng)域應(yīng)用場(chǎng)景臨床常用的4大影像技術(shù):X射線、超聲波、計(jì)算機(jī)斷層掃描(CT)和磁共振成像(MRI)
;計(jì)算機(jī)視覺主要應(yīng)用于圖像重建、病灶檢測(cè)、圖像分割、圖像配準(zhǔn)和計(jì)算機(jī)輔助診斷(CAD)。醫(yī)學(xué)影像中做心臟和大血管圖像分割02醫(yī)療領(lǐng)域應(yīng)用場(chǎng)景/landing/vision/pr_3d_robot_vision.jsp?aw=gabaidukcvisials200630067人工視覺檢測(cè)很大程度上取決于檢驗(yàn)員的能力、經(jīng)驗(yàn)、專心程度,容易導(dǎo)致遺漏、分類錯(cuò)誤等問題。右圖機(jī)械手臂檢測(cè)和抓取合格零件的應(yīng)用,計(jì)算機(jī)視覺能夠通過三維視覺成像及檢測(cè)分析,自動(dòng)計(jì)算出適合的機(jī)械手動(dòng)作。因?yàn)橛袑?shí)時(shí)三維視覺分析,機(jī)械手臂抓取不受工件位置或朝向的影響,能實(shí)現(xiàn)穩(wěn)定檢測(cè)。02工業(yè)領(lǐng)域應(yīng)用場(chǎng)景02農(nóng)業(yè)領(lǐng)域在農(nóng)作物生長(zhǎng)過程中,作物的葉、莖桿、果實(shí)的顏色、外觀形態(tài)、紋理等特征時(shí)刻發(fā)生變化,實(shí)時(shí)動(dòng)態(tài)地監(jiān)測(cè)作物形態(tài)變化,研究外界環(huán)境對(duì)作物生長(zhǎng)狀況產(chǎn)生的影響和作物生長(zhǎng)機(jī)制具有重要意義。基于深度學(xué)習(xí)的植物生長(zhǎng)模型庫:通過智能攝像頭的應(yīng)用,實(shí)時(shí)采集、監(jiān)測(cè)、分析、診斷,建立植物生長(zhǎng)模型,應(yīng)用深度神經(jīng)網(wǎng)絡(luò)算法,實(shí)現(xiàn)植物生長(zhǎng)狀態(tài)判斷與預(yù)測(cè),自動(dòng)生成執(zhí)行控制系統(tǒng)的決策、建議。植物模型應(yīng)用科研系統(tǒng)呈現(xiàn)及遠(yuǎn)程控制云平臺(tái)大數(shù)據(jù)5G通信服務(wù)溫室控制系統(tǒng)應(yīng)用場(chǎng)景02安防領(lǐng)域平安城市:隨著計(jì)算機(jī)視覺技術(shù)、網(wǎng)絡(luò)技術(shù)的日趨普及與成熟,“高清化、網(wǎng)絡(luò)化、智能化”已經(jīng)成為平安城市建設(shè)的一種必然趨勢(shì)。構(gòu)建“立體化”城市防控體系,滿足公安各個(gè)業(yè)務(wù)警種實(shí)戰(zhàn)應(yīng)用的平安城市系統(tǒng),推出了新一代平安城市解決方案,為公安機(jī)關(guān)治安防控、犯罪打擊、視頻偵查、指揮調(diào)度、保衛(wèi)任務(wù)等各警種實(shí)戰(zhàn)應(yīng)用提供支撐與保障。/solutions/id-322/接入?yún)R聚與數(shù)據(jù)中心應(yīng)用場(chǎng)景02安防領(lǐng)域公安視頻偵查平臺(tái):運(yùn)用行為分析技術(shù)對(duì)實(shí)時(shí)視頻進(jìn)行智能分析,支持穿越警戒面、進(jìn)入/離開區(qū)域、區(qū)域入侵、非法停車、物品遺留、物品丟失、人員徘徊、快速移動(dòng)、人員聚集等多種事件的分析檢測(cè);支持行為排查、人員排查和車輛排查功能,快速定位目標(biāo)視頻片段,提高視頻查看效率;支持自動(dòng)報(bào)警,提高監(jiān)控的效率,實(shí)現(xiàn)智能化監(jiān)控防范。/solutions/id-322/應(yīng)用場(chǎng)景02無人駕駛在無人駕駛中,車輛在行駛時(shí)需要實(shí)時(shí)地去感知周圍的環(huán)境,包括行駛在哪里、周圍有什么障礙物、當(dāng)前交通信號(hào)怎樣等。就像我們?nèi)祟愅ㄟ^眼睛去觀察世界,無人車也需要這樣一種“眼睛”,這就是傳感器。傳感器有很多種,例如激光雷達(dá)、攝像頭、夜視攝像頭、超聲波傳感器、遠(yuǎn)程雷達(dá)、近程雷達(dá);每種傳感器都有自己的特點(diǎn)的作用。http://3/iche/yxa-2595593.html計(jì)算機(jī)視覺基礎(chǔ)與應(yīng)用開發(fā)4.2圖像基礎(chǔ)原理01圖像處理技術(shù)02應(yīng)用開發(fā)流程0301圖像基礎(chǔ)原理人眼成像:人眼包括角膜、晶狀體、玻璃體和視網(wǎng)膜。外界物體的反射光線,經(jīng)過角膜、房水,由瞳孔進(jìn)入眼球內(nèi)部,再經(jīng)過晶狀體和玻璃體的折射作用,在視網(wǎng)膜上能形成清晰的物像,物像刺激了視網(wǎng)膜上的感光細(xì)胞,這些感光細(xì)胞產(chǎn)生的神經(jīng)沖動(dòng),沿著視神經(jīng)傳到大腦皮層的視覺中樞,就形成視覺。視網(wǎng)膜上所形成的圖像是倒立的,通過大腦處理,我們感受到的圖像才是正常的。照相機(jī)成像原理與人眼基本類似,照相機(jī)的鏡頭相當(dāng)于角膜和晶狀體,而照相機(jī)的底片相當(dāng)于視網(wǎng)膜。數(shù)字相機(jī)、攝像機(jī)等成像系統(tǒng)首先得到模擬圖像,經(jīng)過采樣和量化即得到數(shù)字圖像。01圖像基礎(chǔ)原理黑白圖像灰度圖像彩色圖像01圖像基礎(chǔ)原理圖像數(shù)據(jù)黑白圖像灰度圖像黑白圖像:只有黑白兩種顏色,存儲(chǔ)數(shù)據(jù)只有0或255,一般0表示黑色,255表示白色。灰度圖像:是灰度值介于0-255的數(shù)據(jù),計(jì)算機(jī)中一般按照二維矩陣存儲(chǔ)。01圖像基礎(chǔ)原理彩色圖像每個(gè)像素的顏色由存儲(chǔ)在該位置的紅藍(lán)綠色共同決定,分別占用8位,每個(gè)像素包含24(8*3)位顏色信息圖像的主要參數(shù)01圖像基礎(chǔ)原理圖像數(shù)據(jù)Blue-ChannelGreen-ChannelRed-Channel彩色圖像:一般按照紅綠藍(lán)三色通道存儲(chǔ)BGR(RGB),圖像處理時(shí)一般按照三維矩陣存儲(chǔ)。01圖像基礎(chǔ)原理圖像壓縮方式:有損壓縮:經(jīng)過有損壓縮,重建后的圖像和原始圖像有一定偏差,但是不影響人們對(duì)圖像含義的正確理解。適合于自然的圖像,例如一些應(yīng)用中圖像的微小損失是可以接受的(有時(shí)無法感知的)。無損壓縮:經(jīng)過無損壓縮以后的數(shù)據(jù)進(jìn)行圖像復(fù)原(解壓),重建的圖像與原始圖像完全相同。繪制的技術(shù)圖、圖標(biāo)或者漫畫優(yōu)先使用無損壓縮;醫(yī)療圖像或者用于存檔的掃描圖像等這些有價(jià)值的內(nèi)容的壓縮也盡量選擇無損壓縮方法。01圖像基礎(chǔ)原理常見的圖像存儲(chǔ)格式:名稱壓縮編碼方法性質(zhì)典型應(yīng)用開發(fā)公司BMPRLE(行程長(zhǎng)度編碼)無損Windows應(yīng)用程序MicrosoftTIFRLE,LZW(字典編碼)無損桌面、出版Aldus,MicrosoftGIFLZW(字典編碼)無損因特網(wǎng)CompuServeGPEGDCT(離散余弦變化)
Huffman編碼支持有損/無損因特網(wǎng)、數(shù)碼相機(jī)等ISO/IEC01圖像基礎(chǔ)原理圖像壓縮編碼:RLE(行程長(zhǎng)度編碼):行程長(zhǎng)度編碼把圖像分成兩種情況:連續(xù)的重復(fù)數(shù)據(jù)塊,連續(xù)不重復(fù)的數(shù)據(jù)塊,把連續(xù)重復(fù)的色塊按照重復(fù)次數(shù)加色塊的方式存儲(chǔ),比如自然圖像中的天空。LZW(字典編碼):基于表查詢算法把文件壓縮成小文件的壓縮方法,又叫串標(biāo)壓縮算法。除了用于圖像數(shù)據(jù)處理以外,LZW壓縮技術(shù)還被用于文本程序等數(shù)據(jù)壓縮領(lǐng)域。JJJJJJAAAAVVVVAAAAAA6J4A4V6ARLEABABABABAB01223LZWStepPSymbol1nullnull2A03B14AB25ABAB301圖像基礎(chǔ)原理位圖與矢量圖:位圖(bitmap):也稱為點(diǎn)陣圖,是使用像素陣列來表示的圖像,當(dāng)放大位圖時(shí),可以看見賴以構(gòu)成整個(gè)圖像的無數(shù)個(gè)單個(gè)方塊。放大01圖像基礎(chǔ)原理放大位圖與矢量圖:矢量圖(vector):是指用一系列計(jì)算指令來表示的圖,這些圖的元素是一些點(diǎn)、線、矩形、多邊形、圓和弧形等等,它們都是通過數(shù)學(xué)公式計(jì)算獲得的。通常的存儲(chǔ)文件是SVG格式。01圖像基礎(chǔ)原理顏色深度(像素深度)存儲(chǔ)每個(gè)像素的顏色(或亮度)信息所占用的二進(jìn)制位數(shù)。色深色彩種類示例1bit21=2色8bit28=256色12bit24*24*24=212=4096色24bit28*28*28=224=16777色01圖像基礎(chǔ)原理圖像分辨率:是確定組成一幅圖像的像素?cái)?shù)目;圖像分辨率是一幅圖片中像素的組成數(shù)量。圖像分辨率單位:ppi、水平像素?cái)?shù)*垂直像素?cái)?shù)(1024*768)。不同圖像分辨率的相同圖像在同樣大小顯示區(qū)域的顯示情況01圖像基礎(chǔ)原理圖像的大小(數(shù)據(jù)量)是指在磁盤上存儲(chǔ)整幅圖像所占用的字節(jié)數(shù)。可按下面的公式計(jì)算:圖像文件的字節(jié)數(shù)=圖像分辨率╳量化位數(shù)/8例如:一幅分辨率為640╳480的黑白圖像,文件的大小為:(640╳480)/8=38400(B)=37.5(KB)一幅同樣分辨率的圖像,圖像深度為8位。則圖像文件的大小為:(640╳480)╳8/8=307200(B)=300(KB)一幅同樣大小的真彩色圖像,則圖像文件的大小為:(640╳480)╳24/8=921600(B)=900(KB)01圖像基礎(chǔ)原理OpenCV概述OpenCV是一個(gè)基于BSD許可(開源)發(fā)行的跨平臺(tái)計(jì)算機(jī)視覺庫,可以運(yùn)行在Linux、Windows、Android和MacOS操作系統(tǒng)上。輕量級(jí)而且高效——由一系列C函數(shù)和少量C++類構(gòu)成,同時(shí)提供了Python、Ruby、MATLAB等語言的接口。OpenCV實(shí)現(xiàn)了圖像處理和計(jì)算機(jī)視覺方面的很多通用算法,已成為計(jì)算機(jī)視覺領(lǐng)域最有力的研究工具。OpenCV可以解決的問題:人機(jī)交互、機(jī)器人視覺、運(yùn)動(dòng)跟蹤、圖像分類、人臉識(shí)別、物體識(shí)別、特征檢測(cè)、視頻分析、深度圖像等。官網(wǎng):/圖像處理技術(shù)02圖像基本操作采用cv2.imread(),cv2.imshow(),cv2.imwrite()加載圖片,顯示圖片,保存圖片。圖片在計(jì)算機(jī)中的表示電腦上的彩色圖是以RGB(紅-綠-藍(lán),Red-Green-Blue)顏色模式顯示的,但OpenCV中彩色圖是以B-G-R通道順序存儲(chǔ)的,灰度圖只有一個(gè)通道。圖像坐標(biāo)的起始點(diǎn)是在左上角,所以行對(duì)應(yīng)y,列對(duì)應(yīng)x:圖像處理技術(shù)02圖像處理技術(shù)02閾值分割閾值分割法是一種基于區(qū)域的圖像分割技術(shù),原理是把圖像象素點(diǎn)分為若干類。閾值分割特別適用于目標(biāo)和背景占據(jù)不同灰度級(jí)范圍的圖像。它不僅可以極大的壓縮數(shù)據(jù)量,而且也大大簡(jiǎn)化了分析和處理步驟;是進(jìn)行圖像分析、特征提取與模式識(shí)別之前的必要的圖像預(yù)處理過程。一般流程:通過判斷圖像中每一個(gè)像素點(diǎn)的特征屬性是否滿足閾值的要求,來確定圖像中的該像素點(diǎn)是屬于目標(biāo)區(qū)域還是背景區(qū)域,從而將一幅灰度圖像轉(zhuǎn)換成二值圖像。圖像處理技術(shù)02閾值分割的幾種方法:(1)固定閾值法:也就是我們自己根據(jù)需要處理的圖像的先驗(yàn)知識(shí),對(duì)圖像中的目標(biāo)與背景進(jìn)行分析。通過對(duì)像素的判斷,圖像的分析,選擇出閾值所在的區(qū)間,并通過實(shí)驗(yàn)進(jìn)行對(duì)比,最后選擇出比較好的閾值。(2)OpenCV通過cv2.threshold()函數(shù)用來實(shí)現(xiàn)固定閾值分割:
ret,th=cv2.threshold(img,127,255,cv2.THRESH_BINARY),其中:參數(shù)1:要處理的原圖,一般是灰度圖;參數(shù)2:設(shè)定的閾值;參數(shù)3:對(duì)于THRESH_BINARY、THRESH_BINARY_INV閾值方法所選用的最大閾值,一般為255;參數(shù)4:閾值的方式,主要有5種(cv2.THRESH_BINARY、cv2.THRESH_BINARY_INV、cv2.THRESH_TRUNC、cv2.THRESH_TOZERO、cv2.THRESH_TOZERO_INV)。返回值:ret是returnvalue縮寫,代表當(dāng)前的閾值。th指的是閾值分割以后的圖像。閾值分割圖像處理技術(shù)02importcv2#灰度圖讀入img=cv2.imread('gradient.jpg',0)#閾值分割ret,th=cv2.threshold(img,127,255,cv2.THRESH_BINARY)cv2.imshow('thresh',th)cv2.waitKey(0)cv2.destroyAllWindows()閾值分割示例代碼:圖像處理技術(shù)02固定閾值的5種方式:?cv2.THRESH_BINARY(二值化)?cv2.THRESH_BINARY_INV(二值反轉(zhuǎn))?cv2.THRESH_TRUNC(截?cái)啵?cv2.THRESH_TOZERO(零化)?cv2.THRESH_TOZERO_INV(零化反轉(zhuǎn))閾值分割圖像處理技術(shù)02閾值分割自適應(yīng)閾值法:自適應(yīng)閾值會(huì)每次取圖片的一小部分計(jì)算閾值,圖片不同區(qū)域的閾值就不盡相同。固定閾值是在整幅圖片上應(yīng)用一個(gè)閾值進(jìn)行分割,并不適用于明暗分布不均的圖片。OpenCV通過cv2.adaptiveThreshold()實(shí)現(xiàn)自動(dòng)閾值分割,th2=cv2.adaptiveThreshold(img,255,cv2.ADAPTIVE_THRESH_MEAN_C,cv2.THRESH_BINARY,101,4),其中:參數(shù)1:要處理的原圖;參數(shù)2:最大閾值,一般為255;參數(shù)3:小區(qū)域閾值的計(jì)算方式;ADAPTIVE_THRESH_MEAN_C:小區(qū)域內(nèi)取均值;ADAPTIVE_THRESH_GAUSSIAN_C:小區(qū)域內(nèi)加權(quán)求和,權(quán)重是個(gè)高斯核;參數(shù)4:閾值方法,只能使用THRESH_BINARY、THRESH_BINARY_INV;參數(shù)5:圖片中分塊的大小,如11塊就是11*11的小塊;參數(shù)6:閾值計(jì)算方法中的常數(shù)項(xiàng),最終閾值等于小區(qū)域計(jì)算出的閾值再減去此值。
圖像處理技術(shù)02importcv2img=cv2.imread('lena.jpg',cv2.IMREAD_GRAYSCALE)ret,th1=cv2.threshold(img,127,255,cv2.THRESH_BINARY)#固定閾值#平均值法th2=cv2.adaptiveThreshold(img,255,cv2.ADAPTIVE_THRESH_MEAN_C,cv2.THRESH_BINARY,101,4)#加權(quán)平均(高斯核)th3=cv2.adaptiveThreshold(img,255,cv2.ADAPTIVE_THRESH_GAUSSIAN_C,cv2.THRESH_BINARY,101,4)imgs=[img,th1,th2,th3]titles=['Original','ThreshHoldConst','AdaptiveMean','AdaptiveGauss']foriinrange(4):dWindow(titles[i],v2.WINDOW_AUTOSIZE)cv2.imshow(titles[i],imgs[i])cv2.waitKey(0)cv2.destroyAllWindows()閾值分割示例代碼:圖像處理技術(shù)02原圖固定閾值自動(dòng)閾值-Mean自動(dòng)閾值-Gauss閾值分割圖像處理技術(shù)02(3)最大類間方差法(OTSU):OTSU是一種使用最大類間方差自動(dòng)確定閾值的方法。是一種基于全局的二值化算法,它是根據(jù)圖像的灰度特性,將圖像分為前景和背景兩個(gè)部分。當(dāng)取最佳閾值時(shí),兩部分之間的差別應(yīng)該是最大的,在OTSU算法中所采用的衡量差別的標(biāo)準(zhǔn)就是較為常見的最大類間方差。前景和背景之間的類間方差如果越大,就說明構(gòu)成圖像的兩個(gè)部分之間的差別越大,當(dāng)部分目標(biāo)被錯(cuò)分為背景或部分背景被錯(cuò)分為目標(biāo),都會(huì)導(dǎo)致兩部分差別變小,當(dāng)所取閾值的分割使類間方差最大時(shí)就意味著錯(cuò)分概率最小。閾值分割#otsu閾值ret2,th2=cv2.threshold(img,0,255,cv2.THRESH_BINARY+cv2.THRESH_OTSU)#先進(jìn)行高斯濾波,再使用otsu閾值法blur=cv2.GaussianBlur(img,(5,5),0)ret3,th3=cv2.threshold(blur,0,255,cv2.THRESH_BINARY+cv2.THRESH_OTSU)示例代碼:圖像處理技術(shù)02針對(duì)雙峰圖片(指圖片的灰度直方圖上有兩個(gè)峰值,直方圖就是每個(gè)值(0~255)的像素點(diǎn)個(gè)數(shù)統(tǒng)計(jì)),Otsu算法假設(shè)這幅圖片由前景色和背景色組成,通過統(tǒng)計(jì)學(xué)方法(最大類間方差)選取一個(gè)閾值,將前景和背景盡可能分開。閾值分割圖像處理技術(shù)02邊緣(edge):是指圖像局部強(qiáng)度變化最顯著的部分。主要存在于目標(biāo)與目標(biāo)、目標(biāo)與背景、區(qū)域與區(qū)域(包括不同色彩)之間,是圖像分割、紋理特征和形狀特征等圖像分析的重要基礎(chǔ)。圖像邊緣檢測(cè):是圖像處理和計(jì)算機(jī)視覺中的基本問題,其目的是標(biāo)識(shí)數(shù)字圖像中亮度變化明顯的點(diǎn)。圖像屬性中的顯著變化通常反映了屬性的重要事件和變化,主要包括深度上的不連續(xù)、表面方向不連續(xù)、物質(zhì)屬性變化和場(chǎng)景照明變化。邊緣檢測(cè)是圖像處理和計(jì)算機(jī)視覺中,尤其是特征提取中的一個(gè)重要研究領(lǐng)域。圖像邊緣檢測(cè)可以大幅度減少數(shù)據(jù)量,剔除可以認(rèn)為不相關(guān)的信息,只保留圖像中重要的結(jié)構(gòu)屬性。邊緣檢測(cè)圖像處理技術(shù)02一般的步驟:1.濾波:邊緣檢測(cè)算法主要是基于圖像強(qiáng)度的一階和二階導(dǎo)數(shù),但是導(dǎo)數(shù)對(duì)于噪聲很敏感,因此需要采用濾波器來改善與噪聲有關(guān)的邊緣檢測(cè)器的性能。2.增強(qiáng):增強(qiáng)邊緣的基礎(chǔ)是確定圖像各點(diǎn)鄰域強(qiáng)度的變化值。增強(qiáng)算法可以將灰度點(diǎn)鄰域強(qiáng)度值有顯著變化的點(diǎn)凸顯出來。3.檢測(cè):鄰域中有很多的點(diǎn)的梯度值較大,但是在特定的應(yīng)用中,這些點(diǎn)并不是要找的邊緣點(diǎn),需要取舍。邊緣檢測(cè)圖像處理技術(shù)02Canny邊緣檢測(cè)算法是JohnF.Canny于1986年開發(fā)出來的一個(gè)多級(jí)邊緣檢測(cè)算法。
Canny邊緣檢測(cè):使用cv2.Canny()檢測(cè)物體的邊緣。Canny邊緣檢測(cè)方法常被譽(yù)為邊緣檢測(cè)的最優(yōu)方法。cv2.Canny()進(jìn)行邊緣檢測(cè),參數(shù)2、3表示最低、高閾值Canny(image,threshold1,threshold2[,edges[,apertureSize[,L2gradient]]])->edges邊緣檢測(cè)圖像處理技術(shù)02先閾值分割后再邊緣檢測(cè)效果會(huì)更好邊緣檢測(cè)圖像處理技術(shù)02例如,要檢測(cè)眼睛,因?yàn)檠劬隙ㄔ谀樕?,所以感興趣的只有臉這部分,可以單獨(dú)把臉截取出來,以大大節(jié)省計(jì)算量,提高運(yùn)行速度。感興趣區(qū)域ROI(RegionofInterest):ROI圖像處理技術(shù)02圖像亮度:以灰度圖像為例,圖像亮度指的是圖像的明暗程度,圖像的像素值整體越接近于255,圖像越亮,反之越接近于0,圖像越暗。圖像對(duì)比度:假設(shè)灰度圖像的像素值的范圍為[a,b],如果b-a的值越接近于255,圖像對(duì)比度越大,看上去圖像更清晰;反之越接近于0,圖像越不清晰。
OpenCV中亮度和對(duì)比度應(yīng)用這個(gè)公式來修改:g(x)=αf(x)+β。
其中:α(>0):控制圖片的對(duì)比度;β:常稱為增益與偏置值,控制圖片亮度。亮度對(duì)比度調(diào)節(jié)圖像處理技術(shù)02增加圖像的亮度(β):
亮度對(duì)比度調(diào)節(jié)圖像處理技術(shù)02增加圖像對(duì)比度(α):
亮度對(duì)比度調(diào)節(jié)圖像處理技術(shù)02彩色圖像調(diào)整亮度和對(duì)比度:g(x)=αf(x)+β=1.5*f(x)+30
亮度對(duì)比度調(diào)節(jié)圖像采集圖像清洗圖像標(biāo)注模型創(chuàng)建訓(xùn)練模型評(píng)估發(fā)布調(diào)用應(yīng)用現(xiàn)場(chǎng)圖像采集(拍照、掃描)、網(wǎng)絡(luò)爬取、開源數(shù)據(jù)集獲取圖像尺寸、灰度圖清洗、損壞圖像清洗等LabelMe等常用的圖像標(biāo)注工具可以選擇的成熟模型、自己訓(xùn)練模型等準(zhǔn)確率、精確率、召回率平臺(tái)API、自建模型應(yīng)用調(diào)用流程03應(yīng)用開發(fā)流程圖像采集訓(xùn)練是人工智能的根基,需要大量的數(shù)據(jù),能夠覆蓋各種可能的場(chǎng)景,這樣才能得到一個(gè)優(yōu)良的算法模型,開發(fā)更加有效的智能應(yīng)用出來。而數(shù)據(jù)作為人工智能這艘火箭的燃料,可以通過各種途徑采集獲取,常見的有現(xiàn)場(chǎng)圖像采集(拍照、掃描)、網(wǎng)絡(luò)爬取、開源數(shù)據(jù)集獲取。網(wǎng)絡(luò)爬取開源數(shù)據(jù)集現(xiàn)場(chǎng)采集03應(yīng)用開發(fā)流程計(jì)算機(jī)視覺應(yīng)用開發(fā)中,數(shù)據(jù)處理占據(jù)工作量的70%。
圖像數(shù)據(jù)的質(zhì)量(準(zhǔn)確性、完整性、時(shí)效性、可解釋),直接決定了模型的預(yù)測(cè)和泛化能力。真實(shí)圖像數(shù)據(jù)中,存在缺失值、噪音、異常點(diǎn),不利于算法模型訓(xùn)練。圖像清洗分析與挖掘數(shù)據(jù)收集結(jié)果呈現(xiàn)與評(píng)價(jià)探索與預(yù)處理應(yīng)用開發(fā)流程03圖像標(biāo)注(ImageCaptioning):有人工數(shù)據(jù)標(biāo)注、自動(dòng)數(shù)據(jù)標(biāo)注和外包數(shù)據(jù)標(biāo)注。人工數(shù)據(jù)標(biāo)注的優(yōu)點(diǎn)是標(biāo)注結(jié)果比較可靠,自動(dòng)數(shù)據(jù)標(biāo)注一般都需要二次復(fù)核,避免程序錯(cuò)誤。人工數(shù)據(jù)標(biāo)注的標(biāo)注工具可分為客戶端與WEB端標(biāo)注工具,在線的WEB端標(biāo)注工具面臨數(shù)據(jù)流失風(fēng)險(xiǎn)。常用的圖像標(biāo)注工具:LabelImg、Labelme、RectLabel、OpenCV/CVAT圖像分類標(biāo)注語義分割標(biāo)注JSON文件03應(yīng)用開發(fā)流程圖像標(biāo)注/easydl/app/1/100/models/new03應(yīng)用開發(fā)流程創(chuàng)建模型03應(yīng)用開發(fā)流程訓(xùn)練模型03應(yīng)用開發(fā)流程模型部署03應(yīng)用開發(fā)流程創(chuàng)建應(yīng)用03應(yīng)用開發(fā)流程調(diào)用應(yīng)用案例體驗(yàn)4.3案例體驗(yàn)1:人臉檢測(cè)01案例體驗(yàn)2:邊緣檢測(cè)0201案例體驗(yàn)1:人臉檢測(cè)目標(biāo)
完成圖片多人臉檢測(cè)功能的應(yīng)用開發(fā)。
效果如圖所示:
CascadeClassifier是OpenCV用來做目標(biāo)檢測(cè)的一個(gè)級(jí)聯(lián)分類器。并且可以使用Haar和LBP兩種特征。Haar特征是一種反映圖像灰度變化,通過像素分模塊求差值的一種特征。Haar特征包括四種特征描述方式:邊緣特征、線性特征、中心特征和對(duì)角線特征。臉部的一些特征能由矩形特征簡(jiǎn)單的描述,如:眼睛要比臉頰顏色要深,嘴巴比周圍顏色要深等。02案例體驗(yàn)1:人臉檢測(cè)分析
#人臉檢測(cè)模型應(yīng)用-圖片人臉檢測(cè)fromcv2importcv2#讀取待處理圖像img=cv2.imread('facedetect2.jpg',cv2.IMREAD_COLOR)#加載正面人臉檢測(cè)分類器face_data=cv2.CascadeClassifier('haarcascade_frontalface_default.xml')#檢測(cè)人臉faces=face_data.detectMultiScale(img,1.3,2)#根據(jù)返回繪制人臉矩形框forx,y,w,hinfaces:cv2.rectangle(img,(x,y),(x+w,y+h),(0,255,0),1)#顯示圖像cv2.imshow('img',img)cv2.waitKey(0)cv2.destroyAllWindows()02案例體驗(yàn)1:人臉檢測(cè)實(shí)現(xiàn)
Haar特征采用了矩陣積分圖來加速矩陣計(jì)算。02案例體驗(yàn)1:人臉檢測(cè)知識(shí)點(diǎn)
CascadeClassifier人臉檢測(cè)。調(diào)用CascadeClassifier中的detectMultiScale(image,scaleFactor,minNeighbors)函數(shù)進(jìn)行人臉檢測(cè)參數(shù)1為image,代碼中img為輸入的圖像;參數(shù)2為scaleFactor,表示在前后兩次相繼的掃描中,搜索窗口的比例系數(shù);參數(shù)3為minNeighbors,表示構(gòu)成檢測(cè)目標(biāo)的相鄰矩形的最小個(gè)數(shù)(默認(rèn)為3個(gè))。02案例體驗(yàn)1:人臉檢測(cè)知識(shí)點(diǎn)
矩形框繪制通過cv2.rectangle(img,pt1,pt2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年管涵施工與建筑廢棄物處理合同3篇
- 二零二五年度集裝箱購(gòu)置與綠色港口運(yùn)營(yíng)合同3篇
- 二零二五年度集資房項(xiàng)目審計(jì)與財(cái)務(wù)報(bào)表編制合同3篇
- 2024年海南經(jīng)貿(mào)職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試歷年參考題庫含答案解析
- 二零二五年戶外廣告安裝工程量清單及結(jié)算合同3篇
- 吉林省農(nóng)安縣九年級(jí)物理全冊(cè)182電功率課件新版新人教版
- 2024年河南質(zhì)量工程職業(yè)學(xué)院高職單招職業(yè)技能測(cè)驗(yàn)歷年參考題庫(頻考版)含答案解析
- 2024年河南工業(yè)和信息化職業(yè)學(xué)院高職單招職業(yè)技能測(cè)驗(yàn)歷年參考題庫(頻考版)含答案解析
- 2024年河北政法職業(yè)學(xué)院高職單招職業(yè)技能測(cè)驗(yàn)歷年參考題庫(頻考版)含答案解析
- 中國(guó)能源展望2060(2025年版)
- 2024年年第三方檢測(cè)行業(yè)分析報(bào)告及未來五至十年行業(yè)發(fā)展報(bào)告
- 李四光《看看我們的地球》原文閱讀
- GA/T 1740.2-2024旅游景區(qū)安全防范要求第2部分:湖泊型
- 華為公司戰(zhàn)略發(fā)展規(guī)劃匯報(bào)
- 2024年全國(guó)“紀(jì)檢監(jiān)察”業(yè)務(wù)相關(guān)知識(shí)考試題庫(附含答案)
- 2025年社區(qū)工作者考試試題庫及答案
- 2025蛇年春節(jié)放假通知假期溫馨提示模板
- DB32T 2305-2013 內(nèi)陸水域魚類資源調(diào)查規(guī)范
- 采購(gòu)經(jīng)理年終述職報(bào)告
- 《陋室銘》(過關(guān)檢測(cè))(原卷版)-2024年中考語文課內(nèi)39篇文言文閱讀
評(píng)論
0/150
提交評(píng)論