




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
研究人員在研究圖像處理算法時(shí)提出了CNN(卷積神經(jīng)網(wǎng)絡(luò))的概念。傳統(tǒng)的全連接網(wǎng)絡(luò)是一種黑盒子-它接收所有輸入并通過每個(gè)值傳遞到一個(gè)dense網(wǎng)絡(luò),然后再傳遞給一個(gè)熱輸出。這似乎適用于少量的輸入。當(dāng)我們處理1024x768像素的圖像時(shí),我們輸入3x1024x768=2359296個(gè)數(shù)字(每個(gè)像素的RGB值)。使用2359296個(gè)數(shù)字的輸入向量的dense多層神經(jīng)網(wǎng)絡(luò)在第一層中每個(gè)神經(jīng)元至少具有2359296個(gè)權(quán)重-第一層的每個(gè)神經(jīng)元具有2MB的權(quán)重。對(duì)于處理器以及RAM,在20世紀(jì)90年代和2000年除,這幾乎是不可能的。這導(dǎo)致研究人員想知道是否有更好的方法來完成這項(xiàng)工作。任何圖像處理(識(shí)別)中的第一個(gè)也是最重要的任務(wù)通常是檢測(cè)邊緣和紋理。接下來是識(shí)別和處理真實(shí)對(duì)象。很明顯要注意檢測(cè)紋理和邊緣實(shí)際上并不依賴于整個(gè)圖像。人們需要查看給定像素周圍的像素以識(shí)別邊緣或紋理。此外,用于識(shí)別邊緣或紋理的算法在整個(gè)圖像中應(yīng)該是相同的。我們不能對(duì)圖像的中心或任何角落或側(cè)面使用不同的算法。檢測(cè)邊緣或紋理的概念必須相同。我們不需要為圖像的每個(gè)像素學(xué)習(xí)一組新參數(shù)。這種理解導(dǎo)致了卷積神經(jīng)網(wǎng)絡(luò)。網(wǎng)絡(luò)的第一層由掃描圖像的小塊神經(jīng)元組成-一次處理幾個(gè)像素。通常這些是9或16或25像素的正方形。CNN非常有效地減少了計(jì)算量。小的“filter/kernel”沿著圖像滑動(dòng),一次處理一小塊。整個(gè)圖像所需的處理非常相似,因此非常有效。雖然它是為圖像處理而引入的,但多年來,CNN已經(jīng)在許多其他領(lǐng)域中得到應(yīng)用。一個(gè)例子現(xiàn)在我們已經(jīng)了解了CNN的基本概念,讓我們了解數(shù)字的工作原理。正如我們所看到的,邊緣檢測(cè)是任何圖像處理問題的主要任務(wù)。讓我們看看CNN如何用于解決邊緣檢測(cè)問題。左邊是16x16單色圖像的位圖。矩陣中的每個(gè)值表示相應(yīng)像素的亮度。我們可以看到,這是一個(gè)簡單的灰色圖像,中間有一個(gè)方塊。當(dāng)我們嘗試將其用2x2filter(中圖)進(jìn)行卷積時(shí),我們得到一個(gè)14x14的矩陣(右圖)。我們選擇的filter可以突出顯示圖像中的邊緣。我們可以在右邊的矩陣中看到,原始圖像中與邊緣對(duì)應(yīng)的值是高的(正的或負(fù)的)。這是一個(gè)簡單的邊緣檢測(cè)filter。研究人員已經(jīng)確定了許多不同的filter,可以識(shí)別和突出圖像的各個(gè)不同方面。在典型的卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型開發(fā)中,我們讓網(wǎng)絡(luò)自己學(xué)習(xí)和發(fā)現(xiàn)這些filters。重要概念以下是我們?cè)谶M(jìn)一步使用CNN之前應(yīng)該了解的一些重要概念。Padding卷積filter的一個(gè)明顯問題是每一步都通過減小矩陣大小來減少“信息”-縮小輸出?;旧?,如果原始矩陣是N×N,并且filter是F×F,則得到的矩陣將是(N-F+1)×(N-F+1)。這是因?yàn)檫吘壣系南袼乇葓D像中間的像素少。如果我們?cè)谒羞吷习矗‵-1)/2像素填充圖像,則將保留N×N的大小。因此,我們有兩種類型的卷積,即ValidConvolution和SameConvolution。Valid實(shí)質(zhì)上意味著沒有填充。因此每個(gè)卷積都會(huì)導(dǎo)致尺寸減小。SameConvolution使用填充,以便保留矩陣的大小。在計(jì)算機(jī)視覺中,F(xiàn)通常是奇數(shù)。奇數(shù)F有助于保持圖像的對(duì)稱性,也允許一個(gè)中心像素,這有助于在各種算法中應(yīng)用均勻偏差。因此,3x3,5x5,7x7filter是很常見的。我們還有1x1個(gè)filter。Strided我們上面討論的卷積是連續(xù)的,因?yàn)樗B續(xù)掃描像素。我們也可以使用strides-通過在圖像上移動(dòng)卷積filter時(shí)跳過s像素。因此,如果我們有nxn圖像和fxffilter并且我們用strides和paddingp進(jìn)行卷積,則輸出的大小為:((n+2p-f)/s+1)x((n+2p-f)/s+1)。卷積v/s互相關(guān)互相關(guān)基本上是在底部對(duì)角線上翻轉(zhuǎn)矩陣的卷積。翻轉(zhuǎn)會(huì)將關(guān)聯(lián)性添加到操作中。但在圖像處理中,我們不會(huì)翻轉(zhuǎn)它。RGB圖像上的卷積現(xiàn)在我們有一個(gè)nxnx3圖像,我們用fxfx3filter進(jìn)行卷積。因此,我們?cè)谌魏螆D像及其filter中都有高度,寬度和通道數(shù)。任何時(shí)候,圖像中的通道數(shù)量與filter中的通道數(shù)量相同。這個(gè)卷積的輸出有寬度和高度(n-f+1)和1通道。多個(gè)filters一個(gè)3通道圖像與一個(gè)3通道filter卷積得到一個(gè)單一通道輸出。但我們并不局限于一個(gè)filter。我們可以有多個(gè)filters——每個(gè)filter都會(huì)產(chǎn)生一個(gè)新的輸出層。因此,輸入中的通道數(shù)應(yīng)該與每個(gè)filter中的通道數(shù)相同。filters的數(shù)量和輸出通道的數(shù)量是一樣的。因此,我們從3個(gè)通道的圖像開始,并在輸出中以多個(gè)通道結(jié)束。這些輸出通道中的每一個(gè)都表示圖像的某些特定方面,這些方面由相應(yīng)的filter拾取。因此,它也被稱為特征而不是通道。在一個(gè)真正的深層網(wǎng)絡(luò)中,我們還添加了一個(gè)偏差和一個(gè)非線性激活函數(shù),如RelU。池化層池化基本上是將值組合成一個(gè)值。我們可以有平均池,最大池化,最小化池等。因此,使用fxf池化的nxn輸入將生成(n/f)x(n/f)輸出。它沒有需要學(xué)習(xí)的參數(shù)。最大池化CNN架構(gòu)典型的中小型CNN模型遵循一些基本原則。典型的CNN架構(gòu)交替卷積和池化層逐漸減小frame大小并增加frame數(shù)朝向末端的Flat和全連接層對(duì)所有隱藏層激活RelU,然后為最終層激活softmax隨著我們轉(zhuǎn)向大型和超大型網(wǎng)絡(luò),事情變得越來越復(fù)雜。研究人員為我們提供了更多可以在這里使用的具體架構(gòu)(如:ImageNet,GoogleNet和VGGNet等)。Python實(shí)現(xiàn)通常實(shí)現(xiàn)CNN模型時(shí),先進(jìn)行數(shù)據(jù)分析和清理,然后選擇我們可以開始的網(wǎng)絡(luò)模型。我們根據(jù)網(wǎng)絡(luò)數(shù)量和層大小及其連接性的布局提供架構(gòu)-然后我們?cè)试S網(wǎng)絡(luò)自己學(xué)習(xí)其余部分。然后我們可以調(diào)整超參數(shù)來生成一個(gè)足以滿足我們目的的模型。讓我們看一個(gè)卷積網(wǎng)絡(luò)如何工作的簡單例子。導(dǎo)入模塊我們首先導(dǎo)入所需的Python庫。獲取數(shù)據(jù)下一步是獲取數(shù)據(jù)。我們使用構(gòu)建到Keras模塊中的機(jī)器學(xué)習(xí)數(shù)據(jù)集——MNIST數(shù)據(jù)集。在現(xiàn)實(shí)生活中,這需要更多的處理。我們加載訓(xùn)練和測(cè)試數(shù)據(jù)。我們r(jià)eshape數(shù)據(jù),使其更適合卷積網(wǎng)絡(luò)。基本上,我們將其reshape為具有60000(記錄數(shù))大小為28x28x1的4D數(shù)組(每個(gè)圖像的大小為28x28)。這使得在Keras中構(gòu)建Convolutional層變得容易。如果我們想要一個(gè)dense神經(jīng)網(wǎng)絡(luò),我們會(huì)將數(shù)據(jù)reshape為60000x784-每個(gè)訓(xùn)練圖像的1D記錄。但CNN是不同的。請(qǐng)記住,卷積的概念是2D-因此沒有必要將其flattening為1維數(shù)組。我們還將標(biāo)簽更改為分類的one-hot數(shù)組,而不是數(shù)字分類。最后,對(duì)圖像數(shù)據(jù)進(jìn)行歸一化處理,以降低梯度消失的可能性。構(gòu)建模型Keras庫為我們提供了準(zhǔn)備使用API來構(gòu)建我們想要的模型。我們首先創(chuàng)建Sequential模型的實(shí)例。然后,我們將層添加到模型中。第一層是卷積層,處理28x28的輸入圖像。我們將核大小定義為3并創(chuàng)建32個(gè)這樣的核-創(chuàng)建32frames?的輸出-大小為26x26(28-3+1=26)。接下來是2x2的最大池化層。這將尺寸從26x26減小到13x13。我們使用了最大池化,因?yàn)槲覀冎绬栴}的本質(zhì)是基于邊緣-我們知道邊緣在卷積中顯示為高值。接下來是另一個(gè)核大小為3x3的卷積層,并生成24個(gè)輸出frames。每frame的大小為22x22。接下來是卷積層。最后,我們將這些數(shù)據(jù)flatten并將其輸入到dense層,該層具有對(duì)應(yīng)于10個(gè)所需值的輸出。訓(xùn)練模型最后,我們用我們擁有的數(shù)據(jù)訓(xùn)練機(jī)器學(xué)習(xí)模型。五個(gè)epoc
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 4 月相變化的規(guī)律 教學(xué)設(shè)計(jì)-2023-2024學(xué)年科學(xué)三年級(jí)下冊(cè)教科版
- 2024級(jí)語文上冊(cè)習(xí)作我有一個(gè)想法教學(xué)設(shè)計(jì)
- (公開課教案)五年級(jí)上冊(cè)語文《通往廣場(chǎng)路不止一條》教學(xué)設(shè)計(jì)
- 2023-2024學(xué)年高中英語 Unit 1 Cultural Heritage Reading for writing 教學(xué)實(shí)錄 新人教版必修第二冊(cè)
- 2023一年級(jí)數(shù)學(xué)上冊(cè) 5 6~10的認(rèn)識(shí)和加減法第4課時(shí) 解決問題1教學(xué)實(shí)錄 新人教版
- 12 慧眼看交通(教學(xué)設(shè)計(jì))2023-2024學(xué)年統(tǒng)編版道德與法治三年級(jí)下冊(cè)
- 9古詩三首 秋夜將曉出籬門迎涼有感 教學(xué)設(shè)計(jì)-2023-2024學(xué)年語文五年級(jí)下冊(cè)統(tǒng)編版
- 2024-2025學(xué)年高中歷史 專題6 杰出的中外科學(xué)家 一 中國科技之光教學(xué)實(shí)錄 人民版選修4
- 2023一年級(jí)語文上冊(cè) 第二單元 4 d t n l配套教學(xué)實(shí)錄 新人教版
- 9 生物與非生物 教學(xué)設(shè)計(jì)-2023-2024學(xué)年科學(xué)四年級(jí)下冊(cè)人教鄂教版
- 制造產(chǎn)品運(yùn)營方案
- 人工智能技術(shù)的應(yīng)用前景與發(fā)展趨勢(shì)
- 小手拉大手-城管送法進(jìn)校園
- 防詐騙銀行知識(shí)講座
- 血站質(zhì)量管理和質(zhì)量控制
- 2023年11月全總文工團(tuán)編制外人員招考聘用筆試歷年高頻考點(diǎn)(難、易錯(cuò)點(diǎn)薈萃)附帶答案詳解
- 卷煙創(chuàng)新營銷活動(dòng)
- PEP 六年級(jí)Unit2 Story time教學(xué)反思
- 國企74個(gè)風(fēng)險(xiǎn)點(diǎn)防控手冊(cè)
- DB41-T 2530-2023 水工閘門啟閉機(jī)及鋼絲繩檢查養(yǎng)護(hù)技術(shù)規(guī)程
- 集王羲之圣教序
評(píng)論
0/150
提交評(píng)論