項目7- 圖像識別_第1頁
項目7- 圖像識別_第2頁
項目7- 圖像識別_第3頁
項目7- 圖像識別_第4頁
項目7- 圖像識別_第5頁
已閱讀5頁,還剩34頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

信息技術(shù)與人工智能基礎(chǔ)項目7

圖像識別01項目背景02思維導圖03思政聚焦04項目相關(guān)知識05項目任務目錄CONTENTS06項目小結(jié)與展望01項目背景圖像識別背景介紹伴隨著圖片成為互聯(lián)網(wǎng)中的主要信息載體,難題隨之出現(xiàn)。當信息由文字記載時,我們可以通過關(guān)鍵詞搜索輕易找到所需內(nèi)容并進行任意編輯,而當信息由圖片記載時,我們卻無法對圖片中的內(nèi)容進行檢索,從而影響了我們從圖片中找到關(guān)鍵內(nèi)容的效率。圖片給我們帶來了快捷的信息記錄和分享方式,卻降低了我們的信息檢索效率。在這個環(huán)境下,借助計算機實現(xiàn)圖像主體的識別技術(shù)就顯得尤為重要。計算機視覺應用----圖像識別圖像識別,指利用計算機對圖像進行處理、分析和理解,以識別圖像中各種不同模式的目標和對象的技術(shù)。通俗地講,圖像識別是讓計算機像人一樣讀懂圖片的內(nèi)容,識別出圖像中有什么物體,并報告出這個物體在圖像中的位置和方向。02思維導圖思維導圖03課程思政圖像識別技術(shù)應用在互聯(lián)網(wǎng)的海量圖片、視頻資料中,不少涉政敏感信息、暴力、低俗等內(nèi)容的圖片充斥其中,這些圖片嚴重影響著國家安全和網(wǎng)絡(luò)文明。在圖像識別還未發(fā)展成熟以前,需要人工隨機抽取圖片對圖片內(nèi)容進行審核。借助人工智能、深度學習和大數(shù)據(jù)樣本等技術(shù),這一問題得到了很好地解決。當然,智能圖片鑒別模型并不能完全取代人工鑒別,相比人工審核,機器還很難理解內(nèi)容背后的深意。最佳的審核方式是智能為主,人工為輔。先由智能圖片鑒別模型將可疑的圖片篩選出來,再由人工審核一遍,這樣既能保證效率又能保證準確率。圖像識別技術(shù)應用網(wǎng)絡(luò)上的內(nèi)容并不都是文明和健康的,我們應該要懂得文明上網(wǎng),取其精華,去其糟粕。對于個人而言,不得在網(wǎng)上發(fā)布和傳播虛假信息、低俗或暴力信息;不得在網(wǎng)上通過發(fā)帖、評論等方式攻擊、謾罵他人;不得在網(wǎng)上從事其他違背公序良俗、損害他人合法權(quán)益的活動;不去瀏覽一些負面新聞,更不應該去瀏覽一些低俗、暴力的網(wǎng)站,讓自己自覺抵制不良內(nèi)容;不參與網(wǎng)絡(luò)敏感話題,對于一些敏感的或者反動的話題,要及時制止,不參與,不散播。04項目相關(guān)知識圖像識別人類和計算機是如何識別這張圖片的呢?圖像識別的任務劃分

a)分類

b)分類+定位

c)多目標檢測圖像識別任務劃分分類的相關(guān)技術(shù)圖像分類的流程包括訓練階段和測試階段名詞解釋:訓練集、測試集、獨熱編碼、置信率4種類別的訓練圖片圖像的原始特征表示形式萊娜灰度圖圖像的原始特征表示形式(a)彩色萊娜圖

(b)紅色分量

(c)綠色分量

(d)藍色分量彩色萊娜圖及其紅色、綠色、藍色分量圖像的預處理平移:把我們感興趣的、圖中的對象移到圖像的中間位置,便于盡可能準確地、定量地分析圖像的特征縮放:一個數(shù)組越大,計算機處理該數(shù)組時消耗的內(nèi)存越大、花費的時間越長,因而可以根據(jù)需要對圖像大小進行調(diào)整填充:為了使待處理圖片符合分類模型對圖像像素尺寸的要求,用特定的像素值對圖片的長或?qū)挼南袼財?shù)量進行補充傳統(tǒng)分類算法特征提?。海?)顏色直方圖、局部二值模式、方向梯度直方圖特征、尺度不變特征變換、Gabor特征、區(qū)域協(xié)方差描述符

(2)主成分分析(PrincipalComponentAnalysis,PCA)、線性判別分析(lineardiscriminantanalysis,LDA)、流形學習(manifoldlearning)和稀疏編碼(SparseCoding,SC)分類器:K近鄰(K-NearestNeighbor,KNN)、支持向量機(SupportVectorMachine,SVM)、決策樹、樸素貝葉斯、邏輯回歸等傳統(tǒng)分類算法KNN分類器原理示意圖深度學習算法深度學習算法的特點優(yōu)勢:在訓練集數(shù)量充足的情況下準確率高局限性:(1)大數(shù)據(jù)集花費昂貴且耗時,并不容易獲得

(2)訓練階段對硬件要求高目標檢測相關(guān)技術(shù)滑動窗口檢測示意圖目標檢測相關(guān)技術(shù)預測框的交并比說明非極大值抑制(Non-MaximumSuppression,NMS):當邊框預測環(huán)節(jié)生成了大量建議邊框后,接著要為每個矩形框做類別分類概率,最后需要判別哪些矩形框是沒用的。所謂的非極大值抑制就是根據(jù)分類器類別分類概率做排序,從小到大排序,先拿最大概率候選框與其他框計算重疊度IOU,丟棄高于閾值的建議框。然后從沒有被丟棄的建議框中再找最大概率建議框,重復上述操作,直到找到所有被保留下來的建議框?;胺ǜ倪MYOLO算法示意圖1.兩步檢測算法:R-CNN2.一步檢測算法:YOLO圖像識別的局限性1.多視角和尺度:同一個物體的圖像,它的角度和尺度是多變的,獲取到的這個物體的圖片也是多樣的;2.遮擋:目標物體可能被擋住,圖片中只有目標物體的一小部分;3.光照條件:在像素層面上,光照對圖片的影響非常大;4.類內(nèi)差異:同一類別的個體之間有許多不同的對象,每個個體都有自己的外形。圖像識別的優(yōu)勢1.在大數(shù)據(jù)時代,人類獲取的圖片資料越來越多,人們需要借助計算機去承擔這些復雜沉重的工作,否則這些工作將由人類負擔。2.在一些極端環(huán)境下,比如水下、嚴寒或酷暑的環(huán)境下的圖像識別,如果工作由人工智能來完成,人類面臨的危險、傷害和壓力將有所減輕。3.人類判斷物體類別的準確率總體上會比機器的識別率高,但在一些要求精密度的識別,比如缺陷識別、醫(yī)學圖片等識別,人類的優(yōu)勢可能會相應降低。在這類場合,通過機器替代人來實現(xiàn)圖像識別,能夠減少錯誤和缺陷。圖像識別的應用1.光學字符識別2.圖片識別分析3.工業(yè)瑕疵檢測4.視頻監(jiān)控分析5.醫(yī)療影像診斷04項目任務任務1:數(shù)字識別1、任務描述手寫數(shù)字識別是常見的圖像識別任務。不同人的手寫體風格迥異,大小不一,造成了計算機對手寫數(shù)字識別任務的一些困難。任務1實踐的主要目的是了解數(shù)字識別的基本原理與過程。首先通過查看數(shù)字圖像的像素表達,了解圖像到數(shù)字的轉(zhuǎn)化過程,再通過手寫數(shù)字的識別了解手寫體識別的功能。2、任務實現(xiàn)2、任務實現(xiàn)2、任務實現(xiàn)任務2:目標檢測1、任務描述目標檢測是一個典型的計算機視覺任務,主要是完成圖像中的物體的識別。與圖像分類不同的是,圖像分類是預測圖像屬于哪一種類別,而目標檢測則是對圖像中的一個或多個對象進行定位和分類。如果是視頻,則通過不斷的讀取視頻中的每一幀作為一幅幅圖像來進行檢測。任務2實踐的主要目的是了解目標檢測的基本原理與過程,通過上傳圖片來驗證和實踐目標檢測中的圖像預處理、目標定位與分類的各個步驟。2、任務實現(xiàn)2、任務實現(xiàn)2、任務實現(xiàn)04項目小結(jié)與展望項目小結(jié)

人類感覺信息中的80%都是視覺信息,圖像是人類獲取和交換信息的主要來源。機器視覺之于人工智能的意義就是視覺之于人類的意義,而決定著機器視覺技術(shù)之一就是圖像識別技術(shù)。隨著計算機技術(shù)的不斷發(fā)展,圖像識別技術(shù)也在不斷地優(yōu)化,其算法也在不斷地改進。在某些應用場景,機器視覺比人類的生理視覺更具優(yōu)勢,它更加準確、客觀和穩(wěn)定。利用計算機代替人類實現(xiàn)圖像識別,能夠盡量縮短時間并減少資源。項目展望

人們一直致力于開發(fā)各種智能工具輔助人們的生產(chǎn)生活,比如機器人的研制,但是要想使得機器人可以像人一樣運動,輔助人們的工作生活,那么前提是機器人必須具備類似于人的視覺系統(tǒng),能夠識別物體以及場景,真正的智能工具應該要具備“視覺”。目前的圖像識別技術(shù)是作為一個工具來幫助我們與外部世界進行交互,為我們自身的視覺提供強有力的輔

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論