機器人視覺技術及應用

上傳人：秋*** IP屬地：陜西上傳時間：2024-10-06 格式：PPTX 頁數：715 大?。?1.96MB 積分：60 舉報 版權申訴

已閱讀5頁，還剩710頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

第1章機器視覺概述知識目標了解機器視覺技術的發(fā)展和行業(yè)應用熟悉機器視覺系統(tǒng)的基本概念和特點掌握機器視覺系統(tǒng)的組成及各部分功能技能目標能夠理解和掌握機器視覺技術的相關概念能夠理解和認知機器視覺相關工業(yè)應用機器視覺概述項目1

機器視覺行業(yè)背景項目2

機器視覺系統(tǒng)概念項目3

機器視覺系統(tǒng)組成項目4

機器視覺系統(tǒng)的應用場景機器視覺技術概述1機器視覺行業(yè)背景1.11.31.2機器視覺的起源與發(fā)展機器視覺的行業(yè)應用機器視覺面臨的問題機器視覺技術概述1.1機器視覺的起源與發(fā)展計算機視覺的歷史是從60年代初開始的，由LarryRoberts撰寫的作品《BlockWorld》，被公認為計算機視覺的第一篇博士論文。1966年，麻省理工大學（MIT）開展了暑期視覺項目，目的是為了構建視覺系統(tǒng)的重要組成部分。MIT的視覺科學家DavidMarr提出了使得計算機識別視覺世界的算法。他指出，為了獲取視覺世界完整的3D圖像，需要經歷幾個階段：第一個階段是原始草圖，得到大部分邊緣、端點和虛擬線條；第二階段是David

Marr所說的“2.5維草圖”；最后一個階段是將所有的內容放在一起，組成一個3D模型。1機器視覺的起源為工業(yè)增智

為教育賦能1.1機器視覺的起源與發(fā)展機器視覺，起源于20世紀50年代，早期研究主要是從統(tǒng)計模式識別開始，工作主要集中在二維圖像分析與識別上；20世紀60年代的研究前沿是以理解三維場景為目的的三維機器視覺；1977年，David

Marr教授在麻省理工大學的人工智能實驗室領導一個以博士生為主體的研究小組，于1977年提出了不同于“積木世界”分析方法的計算視覺理論；20世紀80年代到20世紀90年代中期，機器視覺獲得蓬勃的發(fā)展，新概念，新方法，新理論不斷涌現。2機器視覺的發(fā)展為工業(yè)增智

為教育賦能1.1機器視覺的起源與發(fā)展在中國，視覺技術的應用開始于20世紀90年代，但在各行業(yè)的應用幾乎一片空白。到21世紀，視覺技術開始在自動化行業(yè)成熟應用

現代工業(yè)自動化技術日趨成熟，越來越多的制造企業(yè)考慮如何采用機器視覺來幫助生產線實現檢查、測量和自動識別等功能，以提高效率并降低成本，從而實現生產效益最大化。機器視覺作為新興技術被寄予厚望，被認為是自動化行業(yè)一個具備光明前景的細分市場。機器視覺由于技術本身存在的優(yōu)越性在許多領域有很好的發(fā)展前景。為工業(yè)增智

為教育賦能1.1機器視覺的起源與發(fā)展從全球范圍看，由于下游消費電子、汽車、半導體、醫(yī)藥等行業(yè)規(guī)模持續(xù)擴大，全球機器視覺市場規(guī)模呈快速增長趨勢，2017年已突破80億美元，并預計到2020年全球市場規(guī)模

將達到125億美元，2025年將超過192億美元。從長遠的潛在市場規(guī)模來看，當前只有5%的潛在用戶使用了機器視覺，也就是還有95%的潛在用戶需要但還沒有用上機器視覺，全部潛力發(fā)揮出來后，全球的市場可達到1200億美元。為工業(yè)增智

為教育賦能1.1機器視覺的起源與發(fā)展國內方面，受益于配套基礎設施不斷完善、制造業(yè)總體規(guī)模持續(xù)擴大、智能化水平不斷提高、政策利好等因素，中國機器視覺市場需求不斷增長。2018年中國機器視覺市場規(guī)模首次超過100億元。隨著行業(yè)技術提升、產品應用領域更廣泛，未來機器視覺市場將進一步擴大，預計2019年市場規(guī)模將近125億元，2023年將達到197億元，2019-2023年復合增長率超12%。為工業(yè)增智

為教育賦能1.2機器視覺的行業(yè)應用目前，機器視覺已成功地應用于工業(yè)檢測領域，大幅度地提高了產品的質量和可靠性，保證了生產的速度。主要有1）引導和定位：上下料使用機器視覺來定位，引導機械手臂準確抓取。2）外觀檢測：檢測生產線上產品有無質量問題，該環(huán)節(jié)也是取代人工最多的環(huán)節(jié)。3）高精度檢測：有些產品的精密度較高，達到0.01～0.02m，甚至μ級，是人眼無法檢測出來的，必須使用機器來完成。4）識別：數據的追溯和采集，在汽車零部件、食品、藥品等應用較多。例如產品包裝印刷質量的檢測、飲料行業(yè)的容器質量檢測、飲料填充檢測、飲料品封口檢測、木材

廠木料檢測、半導體集成塊封裝質量檢測、卷鋼質量檢測和水果分級檢測等。在制藥

生產線上，使用機器視覺技術可以對藥品包裝進行檢測，以確定是否裝入正確的藥粒。1機器視覺在工業(yè)檢測中的應用為工業(yè)增智

為教育賦能1.2機器視覺的行業(yè)應用在醫(yī)學領域，機器視覺用于輔助醫(yī)生進行醫(yī)學影像的分析，主要利用數字圖像處理技術、信息融合技術對X射線透視圖、核磁共振圖像、CT圖像進行分析或對其它醫(yī)學影像數據的統(tǒng)計和分析。不同醫(yī)學影像設備得到是不同特性的生物組織的圖像。例如，X射線反映的是骨骼組織，核磁共振影像反映的是有機組織圖像，而醫(yī)生往往需要考慮骨骼與有機組織的關系，因而需要利用數字圖像處理技術將兩種圖像適當地疊加起來，以便于醫(yī)學分析。2機器視覺在醫(yī)學中應用為工業(yè)增智

為教育賦能1.2機器視覺的行業(yè)應用對放射圖像、顯微圖像、醫(yī)學圖像、遙感多波段圖像、合成孔徑雷達圖像、航天航測圖像等的自動判讀理解。由于近年來技術的發(fā)展，圖像的種類和數量飛速增長，圖像的自動理解已成為解決信息膨脹問題的重要手段。3圖像自動解釋應用為工業(yè)增智

為教育賦能1.2機器視覺的行業(yè)應用軍事領域是對新技術最渴望、最敏感的領域，對于機器視覺同樣也不例外。最早的視覺和圖像分析系統(tǒng)就是用于偵察圖像的處理分析和武器制導。機器視覺廣泛應用于航空著陸姿勢、起飛狀態(tài)；彈道/火箭噴射、子彈出膛、火炮發(fā)射；爆破分析炮彈爆炸、破片分析、爆炸防御；撞擊、分離以及各種武器性能測試分析，點火裝置工作過程等。4軍事應用為工業(yè)增智

為教育賦能1.3機器視覺面臨的問題為工業(yè)增智

為教育賦能對于人的視覺來說，由于人的大腦和神經的高度發(fā)展，其目標識別能力很強。但是人的視覺也同樣存在障礙。例如，即時具有敏銳視覺和高度發(fā)達頭腦的人，一旦置身于某種特殊環(huán)境，其目標識別能力也會急劇下降。將人的視覺引入機器視覺中，機器視覺也存在著這樣的障礙。它主要表現在三個方面：一是如何準確、高速（實時）地識別出目標；二是如何有效地增大存儲容量，以便容納下足夠細節(jié)的目標圖像；三是如何有效地構造和組織出可靠的識別算法，并順利地實現。前兩者相當于人的大腦這樣的物質基礎，這期待著高速的陣列處理單元，以及算法的新突破，用極少的計算量及高度的并行性實現功能。另外，由于當前對人類視覺系統(tǒng)和機理、人腦心理和生理的研究還不夠，目前人們所建立的各種視覺系統(tǒng)絕大多數是只適用于某一特定環(huán)境或應用場合的專用系統(tǒng)，而要建立一個可與人類的視覺系統(tǒng)相比擬的通用視覺系統(tǒng)是非常困難的。正因為如此，賦予機器以人類視覺功能是幾十年來人們不懈追求和奮斗的目標。隨著“中國制造2025”戰(zhàn)略計劃的實施，我國將進一步深化產業(yè)結構調整，推進制造業(yè)的科技創(chuàng)新，提高智能制造水平，著力從要素驅動向創(chuàng)新驅動的根本轉變。產業(yè)結構的轉型升級和制造業(yè)的進一步智能化為機器視覺技術的發(fā)展應用帶來了巨大的機遇和挑戰(zhàn)。2機器視覺系統(tǒng)概念2.1機器視覺系統(tǒng)概念機器視覺技術概述2.1機器視覺系統(tǒng)概念機器視覺系統(tǒng)是通過機器視覺產品（即圖像攝取裝置）將被攝取目標轉換成圖像信號，傳

送給專用的圖像處理系統(tǒng)，得到被攝目標的形態(tài)信息，根據像素分布的亮度、顏色等信息，轉變成數字化信號。圖像系統(tǒng)對這些信號進行各種運算來抽取目標的特征，進而根據判別

的結果來控制現場的設備動作。簡單說來，機器視覺就是用機器代替人眼來做測量和判斷。相對人類視覺，機器視覺在速度、感光范圍、觀測精度、環(huán)境要求等方面都存在顯著優(yōu)勢機器視覺系統(tǒng)概念為工業(yè)增智

為教育賦能2.1機器視覺系統(tǒng)概念機器視覺是機器人自主行動的前提，能夠實現計算機系統(tǒng)對于外界環(huán)境的觀察、識別以及判斷等功能，對于人工智能的發(fā)展具有極其重要的作用，是人工智能范疇最重要的前沿分支之一，機器視覺技術在國內外人工智能企業(yè)應用技術中占比超過40%，其中國內占比達到了46%。作為人工智能技術的重要分支，機器視覺正在快速發(fā)展。機器視覺是實現自動化技術的重要的基礎技術之一，能夠實現儀器設備的基準控制，提升生產制造過程的自動化、智能化，極大提高工作效率和準確率，其應用范圍不僅限于外界信息的輸入，通常還擴展為信息的進一步處理以及執(zhí)行機構（機械臂，傳送帶等）的聯動控制。為工業(yè)增智

為教育賦能3機器視覺系統(tǒng)組成3.13.33.53.43.2為工業(yè)增智

為教育賦能機器視覺系統(tǒng)圖像處理信號與執(zhí)行機構光源照明技術與光學鏡頭CCD攝像機圖像采集卡與視覺傳感器機器視覺技術概述3.1機器視覺系統(tǒng)機器視覺系統(tǒng)概念機器視覺是一項綜合性的技術，綜合了光學，機械，電子，計算機軟硬件等方面的技術。一個典型的機器視覺系統(tǒng)包括以下產品：相機、光源、圖像采集卡/視覺處理器板、獨立于硬件產品的視覺軟件、接口和線纜和其他視覺配件。為工業(yè)增智

為教育賦能3.1機器視覺系統(tǒng)此外，還有以智能相機為中心的機器視覺系統(tǒng)形態(tài)，將照明、成像、處理內置于相機內部，一臺相機即可完成機器視覺系統(tǒng)的全部功能。為工業(yè)增智

為教育賦能3.2光源照明技術與光學鏡頭1光源照明技術在目前的機器視覺應用系統(tǒng)中，好的光源與照明方案往往是整個系統(tǒng)成敗的關鍵，起著非常重要的作用，并不是簡單的照亮物體而已。在機器視覺應用系統(tǒng)中一般使用透射光和反射光。對于反射光情況應充分考慮光源和光學鏡頭的相對位置、物體表面的紋理，物體的幾何形狀等要素。光源設備的選擇必須符合所需的幾何形狀，照明亮度、均勻度、發(fā)光的光譜特性也必須符合實際的要求，同時還要考慮光源的發(fā)光效率和使用壽命。下表列出了主要幾種光源的相關特性。為工業(yè)增智

為教育賦能3.2光源照明技術與光學鏡頭綜合比較來看LED光源因其顯色性好，光譜范圍寬，能覆蓋可見光的整個范圍，且發(fā)光強度高，穩(wěn)定時間長，近年來隨著LED制造工藝和技術的不斷發(fā)展成熟，價格逐步降低，其在機器視覺領域正得到越來越廣泛的應用為工業(yè)增智

為教育賦能3.2光源照明技術與光學鏡頭光學鏡頭一般稱為攝像頭或攝影鏡頭，簡稱鏡頭，光學鏡頭是機器視覺系統(tǒng)中必不可少的部件，直接影響成像質量的優(yōu)劣，影響算法的實現和效果。其功能就是光學成像，相當于人眼的晶狀體，在機器視覺系統(tǒng)中非常重要。2光學鏡頭（1）什么是光學鏡頭為工業(yè)增智

為教育賦能3.2光源照明技術與光學鏡頭（2）光學鏡頭的分類①.鏡頭的種類按焦距可分為：廣角鏡頭、標準鏡頭、長焦距鏡頭；②.按動作方式可分為：手動鏡頭、電動鏡頭；③.按安裝方式可分為：普通安裝鏡頭、隱蔽安裝鏡頭；④.按光圈可分為：手動光圈、自動光圈；⑤.按聚焦方式可分為：手動聚焦、電動聚焦、自動聚焦；⑥.按變焦倍數可分為：2倍變焦、6倍變焦、

10倍變焦、20倍變焦等。為工業(yè)增智

為教育賦能3.2光源照明技術與光學鏡頭（3）光學鏡頭的性能參數與選型鏡頭的主要性能指標有焦距、光闌系數、倍率、接口等。根據被測目標的狀態(tài)應優(yōu)先選用定焦鏡頭。鏡頭選擇應注意：焦距、目標高度、影像高度、放大倍數、影像至目標的距離、中心點等。當然，鏡頭與攝像機的安裝接口也是應考慮的一個重要因素。鏡頭焦距f視野范圍W相機靶面m工作距離d為工業(yè)增智

為教育賦能f=m*d/W3.3

CCD攝像機CCD攝像機目前CCD攝像機以其小巧、可靠、清晰度高等特點在

商用與工業(yè)領域都得到了

廣泛地使用。CCD攝像機

按照其使用的CCD器件可

以分為線陣式（卷簾快門）和面陣式（全局快門）兩大類。為工業(yè)增智

為教育賦能3.3

CCD攝像機為工業(yè)增智

為教育賦能線陣CCD攝像機一次只能獲得圖像的一行信息，被拍攝的物體必須以直線形式從攝像機前

移過，才能獲得完整的圖像。它主要用于檢測條狀、筒狀產品，例如布匹、鋼板、紙張等。面陣攝像機可以一次獲得整幅圖像的信息。CCD攝像機由于其具有靈敏度高、抗強光、畸變小、體積小、壽命長、抗震動等優(yōu)點而得到了廣泛的使用。3.4圖像采集卡與視覺傳感器圖像采集卡圖像采集卡又稱為圖像卡，它將攝像機的圖像視頻信號送到計算機的內存，供計算機處理、存儲、顯示和傳輸等使用。其主要模塊組成及功能如下：①.A/D轉換模塊，將圖像信號放大和數字化；②.相機控制模塊，負責提供相機的設置及實現異步重置拍照、定時拍照；③.總線接口及控制模塊，主要通過PCI總線完成數字圖像數據的傳輸；④.數字輸入/輸出模塊，本模塊允許圖像采集卡通過TTL信號與外部裝置進行通信，用于控制和響應外部事件。為工業(yè)增智

為教育賦能3.4圖像采集卡與視覺傳感器視覺傳感器基于PC機的機器視覺系統(tǒng)結構沒有模塊化，安裝不方便，可移植性差，特別是與工業(yè)廣泛使用的PLC接口比較麻煩。從軟件和硬件開發(fā)兩個方面來考慮，都需要一種更適合工業(yè)需求的機器視覺組件。目前國外已經開發(fā)出了一種叫做視覺傳感器的模塊化部件，這種視覺傳感器集成了光源、攝像頭、圖像處理器、標準的控制與通訊接口，自成為一個智能圖像采集與處理單元，內部程序存儲器可存儲圖像處理算法，并能使用PC機，利用專用組態(tài)軟件編制各種算法下載到視覺傳感器的程序存儲器中。視覺傳感器將PC的靈活性，PLC的可靠性、分布式網絡技術結合在一起。用

這樣的視覺傳感器和PLC可以更容易地構成機器視覺系統(tǒng)。為工業(yè)增智

為教育賦能3.5圖像信號處理與執(zhí)行機構圖像信號處理圖像信號的處理是機器視覺系統(tǒng)的核心。視覺信息的處理技術主要依賴于圖像處理方法，它包括圖像變換、數據編碼壓縮、圖像增強復原、平滑、邊緣銳化、分割、特征抽取、圖像識別與理解等內容。隨著計算機技術、微電子技術以及大規(guī)模集成電路的發(fā)展，為了提高系統(tǒng)的實時性，圖像處理的很多工作都可以借助硬件完成，如DSP芯片、專用圖像信號處理卡等，軟件主要完成算法中非常復雜、不太成熟或尚需不斷探索和改進的部分。處理時間上，要求處理速度必須大于等于采集速度，才能保證目標圖像無遺漏，完成實時處理。為工業(yè)增智

為教育賦能3.5圖像信號處理與執(zhí)行機構執(zhí)行機構機器視覺系統(tǒng)的最終功能的實現還需執(zhí)行機構來完成。不同的應用場合，執(zhí)行機構可能不同，比如機電系統(tǒng)、液壓系統(tǒng)、氣動系統(tǒng)，無論哪一種，除了要嚴格保證其加工制造和裝配的精度外，在設計時還應對動態(tài)特性，尤其是快速性和穩(wěn)定性給予充分重視。為工業(yè)增智

為教育賦能4機器視覺系統(tǒng)的應用場景4.1機器視覺的應用場景機器視覺技術概述4.1機器視覺的應用場景機器視覺的應用場景機器視覺讓機器擁有了像人一樣的視覺功能，能更好地實現各種檢測、測量、識別和判斷

功能。隨著各類技術的不斷完善，機器視覺下游應用領域也不斷拓寬，從最開始主要用于

電子裝配檢測，已發(fā)展到在識別、檢測、測量和機械手定位等越來越廣泛的工業(yè)應用領域。速度快、信息量大、功能多也日益成為機器視覺技術的主要特點。為工業(yè)增智

為教育賦能4.1機器視覺的應用場景機器視覺可說是工業(yè)自動化系統(tǒng)的靈魂之窗，從物件/條碼辨識、產品檢測、外觀尺寸量測到機械手臂/傳動設備定位，都是機器視覺技術可以發(fā)揮的舞臺，因此它的應用范圍十分廣泛，行業(yè)應用領域更是多到令人眼花繚亂機器視覺的應用場景圖像識別應用圖像檢測應用視覺定位應用物體測量應用物體分揀應用為工業(yè)增智

為教育賦能4.1機器視覺的應用場景1

PCB板錫膏缺陷檢測視覺系統(tǒng)檢測PCB板上錫膏點面積大小，每一塊PCB板上大概有400個錫膏點，在

涂錫后會有大小、位置上的缺陷。此工位若使用目檢的話會對效率、準確率有極大影響。因此在這過程中使用了視覺系統(tǒng)進行檢測。該案例視覺系統(tǒng)軟件采用定制開發(fā)，功能強大，包含數據庫系統(tǒng)，用戶分級管理，一鍵換型，圖像拼接等功能，識別準確率達99.99%以上。為工業(yè)增智

為教育賦能4.1機器視覺的應用場景2電阻缺陷檢測電阻生產過程中會生成一些缺陷，包括絲印字符缺陷，電極寬度，高度不符合要求以及臟污等。此類型視覺檢測方案可擴展應用于電感、電容等被動元器件的測包機、封裝機的缺陷檢測應用。為工業(yè)增智

為教育賦能4.1機器視覺的應用場景3牛奶包裝識別乳制品行業(yè)一般應用油墨形式來進行生產標簽的噴印。噴碼機會經常進行清洗更換，導致每次噴印的字符大小、形態(tài)、位置會發(fā)生變化。字符位置的波動會導致字符打印在包裝線、黑色噴碼區(qū)域框上，傳統(tǒng)方式難以適應包裝線的影響，因此引用深度學習的方式來解決行業(yè)難題。難點：點陣字符（傳統(tǒng)方式難以分割準確），較高的識別率要求（99.95%），字符大小、形態(tài)、位置會發(fā)生變化，包裝線、噴碼區(qū)域框的影響。為工業(yè)增智

為教育賦能4.1機器視覺的應用場景4太陽能電池片定位與檢測太陽能電池片的質量是影響太陽能電池組件發(fā)電效率的主要因素之一，所以加強對太陽能電池片質量的檢測是生產中一個必不可少的環(huán)節(jié)。太陽能電池片在多個生產環(huán)節(jié)都需要定位電池片，用于抓取電池片進行上下料、再加工等工序。同時還要檢測是否存在崩邊破角等現象，有些環(huán)節(jié)還需要測量柵線的尺寸或檢測是否存在露白等。為工業(yè)增智

為教育賦能機器視覺系統(tǒng)是通過機器視覺產品（即圖像攝取裝置）將被攝取目標轉換成圖像信號，傳送給專用的圖像處理系統(tǒng)，得到被攝目標的形態(tài)信息，根據像素分布的亮度、顏色等信息，轉變成數字化信號。圖像系統(tǒng)對這些信號進行各種運算來抽取目標的特征，進而根據判別的結果來控制現場的設備動作。簡單說來，機器視覺就是用機器代替人眼來做測量和判斷。機器視覺是一項綜合性的技術，綜合了光學，機械，電子，計算機軟硬件等方面的技術。一個典型的機器視覺系統(tǒng)包括以下產品：相機、光源、圖像采集卡/視覺處理器板、獨立于硬件產品的視覺軟件、接口和線纜和其他視覺配件。機器視覺讓機器擁有了像人一樣的視覺功能，能更好地實現各種檢測、測量、識別和判斷功能。隨著各類技術的不斷完善，機器視覺下游應用領域也不斷拓寬，從最開始主要用于電子裝配檢測，已發(fā)展到在識別、檢測、測量和機械手定位等越來越廣泛的工業(yè)應用領域。速度快、信息量大、功能多也日益成為機器視覺技術的主要特點。為工業(yè)增智

為教育賦能機器視覺技術概述1、機器視覺是一項綜合技術包括

、機械工程技術、

、電光源照明、光學成像、傳感器、

、

等。2、相對人類視覺，機器視覺在

、

等方面都存在顯著優(yōu)勢，特別在

下或

下。3、機器視覺是機器人

的前提，能夠實現計算機系統(tǒng)對于外界環(huán)境的

、

以及

等功能，對于

的發(fā)展具有極其重要的作用。4、從原理上機器視覺系統(tǒng)主要由三部分組成：

、

。5、—個典型的機器視覺系統(tǒng)應該包括

、

、圖像數字化模塊、

、智能判斷決策模塊和機械控制執(zhí)行模塊。6、機器視覺是一項綜合技術。其中包括

、機械工程技術、控制技術、

、光學成像技術、

、模擬與數字視頻技術、計算機軟硬件技術、人機接口技術等。機器視覺概述第2章數字圖像處理基礎知識目標掌握數字圖像處理技術相關名詞術語掌握圖像采樣、量化、增強等處理技術的常見方法熟悉數字圖像處理相關的數學模型與公式技能目標能夠理解和掌握數字圖像處理的主要技術和相應處理方法能夠掌握一般圖像處理的數學方程計算方法與思路能夠基于Matlab工具進行圖像的簡單處理數字圖像處理基礎為工業(yè)增智

為教育賦能圖像的感知和獲取圖像的采樣和量化項目1

數字圖像處理概述項目2項目3項目4

空間域圖像處理項目5

頻域圖像處理項目6

彩色圖像處理項目7

形態(tài)學圖像處理為工業(yè)增智

為教育賦能機器視覺技術概述1數字圖像處理概述1.11.31.51.41.2為工業(yè)增智

為教育賦能圖像的概念技術發(fā)展趨勢數字圖像與數字圖像處理圖像分析和圖像理解數字圖像處理系統(tǒng)及其主要研究內容數字圖像處理基礎1.1圖像的概念“圖”是物體投射或反射光的分布，“像”是人的視覺系統(tǒng)對圖的接受在大腦中形成的印象或反映。是客觀和主觀的結合。1圖像的概念為工業(yè)增智

為教育賦能1.2數字圖像與數字圖像處理1數字圖像數字圖像是指由被稱作像素的小塊區(qū)域組成的二維矩陣。將物理圖象行列劃分后，每個小塊區(qū)域稱為像素（pixel）。每個像素包括兩個屬性：位置和灰度。對于單色即灰度圖像而言，每個象素的亮度用一個數值來表示，通常數值范圍在0到255之間，即可用一個字節(jié)來表示，0表示黑、255表示白，而其它表示灰度級別。為工業(yè)增智

為教育賦能1.2數字圖像與數字圖像處理彩色圖象可以用紅、綠、藍三元組的二維矩陣來表示。通常，三元組的每個數值也是在0到255之間，0表示相應的基色在該象素中取得最小值，而255則代表相應的基色在該象素中

取得最大值，這種情況下每個象素可用三個字節(jié)來表示。為工業(yè)增智

為教育賦能1.2數字圖像與數字圖像處理數字圖像處理就是利用計算機系統(tǒng)對數字圖像進行各種目的的處理：對連續(xù)圖像f（x，y）進行數字化：空間上，圖像抽樣；幅度上，灰度級量化。x方向，抽樣M行。y方向，每行

抽樣N點。整個圖像共抽樣M×N個像素點，一般取M=N=2n=64，128，256，512，1024，2048。數字圖像常用矩陣來表示：f(i,j)=0~255，灰度級為256，設灰度量化為

8bit。1數字圖像處理為工業(yè)增智

為教育賦能1.3圖像分析和圖像理解圖像分析是指對圖像中感興趣的目標進行提取和分割，獲得目標的客觀信息（特點或性質），建立對圖像的描述。圖像分析一般利用數學模型并結合圖像處理的技術來分析底層特征和上層結構，從而提取具有一定智能性的信息。圖像分析是一個從圖像到數據的過程。1圖像分析為工業(yè)增智

為教育賦能1.3圖像分析和圖像理解圖像理解是指研究圖像中各目標的性質和它們之間的相互聯系，得出對圖像內容含義的理解及原來客觀場景的解釋。圖像理解以客觀世界為中心，借助知識、經驗來推理、認識客觀世界，屬于高層操作（符號運算）。2圖像理解為工業(yè)增智

為教育賦能1.4數字圖像處理系統(tǒng)及其主要研究內容1數字處理系統(tǒng)數字圖象處理系統(tǒng)由圖象數字化設備、圖象處理計算機和圖象輸出設備組成。輸入及數字化設備：攝象機、鼓式掃描器、平臺式光密度計、視頻卡、掃描儀、數碼相機、

DV等。顯示及記錄設備：圖象顯示器、鼓式掃描器、圖象拷貝機、繪圖儀、激光打印機、噴墨打印機等。為工業(yè)增智

為教育賦能1.4數字圖像處理系統(tǒng)及其主要研究內容（2）圖像壓縮編碼圖像壓縮編碼技術可以減少描述圖像的數據量，以便節(jié)約圖像存儲的空間，減少圖像的傳輸和處理時間。圖像壓縮有無損壓縮和有損壓縮兩種方式，編碼是壓縮技術中最重要的方法，在圖像處理技術中是發(fā)展最早和應用最成熟的技術。主要方法：熵編碼，預測編碼，變換編碼，二值圖像編碼、分形編碼2數字處理系統(tǒng)只要研究內容圖像變換圖像變換方法主要包含：傅立葉變換/沃爾什變換/離散余弦變換/小波變換，采用各種圖像變換方法對圖像進行間接處理，有利于減少計算量并進一步獲得更有效的處理。為工業(yè)增智

為教育賦能1.4數字圖像處理系統(tǒng)及其主要研究內容圖像的增強和復原圖像增強和復原的目的是為了改善圖像的視覺效果，如去除圖像噪聲，提高圖像的清晰度等。圖像增強不考慮圖像降質的原因，突出圖像中感興趣的部分。圖像復原要求對圖像降質的原因有所了解，根據圖像降質過程建立“退化模型”，然后采用濾波的方法重建或恢復原來的圖像。主要方法：灰度修正、平滑、幾何校正、圖像銳化、濾波增強、維納濾波圖像分割圖像分割是數字圖像處理中的關鍵技術之一。圖像分割將圖像中有意義的特征（物體的邊緣、區(qū)域）提取出來，它是進行進一步圖像識別、分析和圖像理解的基礎。雖然目前已研究出了不少邊緣提取、區(qū)域分割的方法，但還沒有一種普遍適用于各種圖像

的有效方法。對圖像分割的研究還在不斷的深入中，是目前圖像處理研究的熱點方向之一。主要方法：圖像邊緣檢測、灰度閾值分割、基于紋理分割、區(qū)域增長為工業(yè)增智

為教育賦能1.4數字圖像處理系統(tǒng)及其主要研究內容圖像描述圖像描述是圖像分析和理解的必要前提。圖像描述是用一組數字或符號（描述子）來表征圖像中被描述物體的某些特征。主要方法：二值圖像的幾何特征、簡單描述子、形狀數、傅立葉描述子，紋理描述圖像識別圖像識別是人工智能的一個重要領域，是圖像處理的最高境界。一副完整的圖像經預處理、分割和描述提取有效特征之后，進而由計算機系統(tǒng)對圖像加以判決分類。圖像隱藏圖像隱藏是指將秘密信息隱藏在圖像格式文件中，使其在貌似正常的圖像文件的掩飾下，達到秘密信息的保存和傳遞。常見的方法有數字水印、圖像的信息偽裝等。為工業(yè)增智

為教育賦能1.5技術發(fā)展趨勢（1）結合網絡和Internet技術需求而發(fā)展起來的新技術，比如網上圖像、視頻的傳輸、點播和新的瀏覽、查詢手段。（2）高級圖像處理技術，結合最新的數學進展，諸如小波、分形、形態(tài)學等技術。（3）智能化，圖象自動分析、識別與理解。技術發(fā)展趨勢為工業(yè)增智

為教育賦能2圖像的感知和獲取2.1為工業(yè)增智

為教育賦能圖像的感知和獲取數字圖像處理基礎2.1圖像的感知和獲取圖像感知和獲取人類感知只限于電磁波譜的視覺波段，成像機器則可以覆蓋幾乎全部電磁波譜。各類圖像都是由“照射”源和形成圖像的“場景”元素對光能的反射或吸收相結合而產生的。人眼看到室外綠色的四葉草：太陽就是“照射源”，它是發(fā)光體。四葉草就是“場景元素”，它是吸收+反光體。之所以人眼看到四葉草是綠色的，是因為它把其他人眼可捕捉的頻率電磁波都吸收了，只有綠光譜被它反射了。為工業(yè)增智

為教育賦能2.1圖像的感知和獲取第一張倫琴射線照片：陰極射線管就是“照射源”，他是X射線的發(fā)射體。倫琴夫人的手就是“場景元素”，它是吸收體。X射線穿過手組織，打到了感光底片上。手掌中的骨骼和其他組織對X射線的吸收率不同，導致最終到達感光底片的X射線的量不同形成圖像。為工業(yè)增智

為教育賦能2.1圖像的感知和獲取拋開“照射源”和“場景元素”，還有一個重要的感知元素，獲取圖像的傳感器。如上面兩個例子中，圖像傳感器分別是人眼和感光膠片。圖像傳感器，或稱感光元件，通過將輸入的電能和對特殊能源敏感的傳感器材料相結合，把輸入能源變成電壓。輸出電壓波形是傳感器的響應，通過把傳感器響應數字化，從每一個傳感器得到一個數字量。簡單理解就是可以把輸入的模擬能量轉化成數字信號的裝備，這里面有兩個步驟。光（輸入能量）<->傳感器（光電轉換）<->AD轉換（采樣、量化）。為工業(yè)增智

為教育賦能2.1圖像的感知和獲取圖像傳感器的結構主要有有CCD與CMOS兩種，CCD是“電荷耦合器件”(ChargeCoupled

Device)的簡稱，而CMOS是“互補金屬氧化物半導體”(ComplementaryMetal

Oxide

Semiconductor)的簡稱。其基本差異為像素單元的電荷讀取方式不同。CCD光電成像器件存貯的電荷信息，需要在二相或三相或四相時鐘驅動脈沖的控制下，一位一位地實施轉移后逐行順序讀取。而CMOS光電成像器件的光學圖像信息經光電轉換后產生電流或電壓信號，這個電信號不需要像CCD那樣逐行讀取，而是從CMOS晶體管開關

陣列中直接讀取的，可增加取像的靈活性。而CCD絕無此功能。CCD直接讀取為工業(yè)增智

為教育賦能CMOS轉換后讀取2.1圖像的感知和獲取為工業(yè)增智

為教育賦能CCD需在同步信號控制下由三組不同的電源相配合才能輸出和轉移電荷信息，整個電路較為復雜而且速度較慢。而CMOS傳感器經光電轉換后直接產生電流（或電壓）信號，信號讀取十分簡單，還能同時處理各單元的圖像信息，速度也比CCD快很多。CCD制作技術起步早，技術成熟，采用PN結構或二氧化硅（SiO2）隔離層隔離噪聲，成像質量相對

CMOS有一定優(yōu)勢。由于CMOS集成度高，各光電傳感元件、電路之間距離很近，相互之間的光、電、磁干擾較嚴重，噪聲對圖像質量影響很大。近幾年，隨著CMOS電路消噪技術的不斷發(fā)展，CMOS的性能已經可以與CCD媲美了。3圖像的采樣和量化3.1圖像采樣3.2圖像采樣分類3.3圖像插值算法3.4圖像的量化為工業(yè)增智

為教育賦能數字圖像處理基礎3.1圖像的采樣圖像的采樣在取樣時，若橫向的像素數（列數）為M，縱向的像素數（行數）為N，則圖像總像素數為M*N個像素。一般來說，采樣間隔越大，所得圖像像素數越少，空間分辨率低，質量差，嚴重時出現馬賽克效應；采樣間隔越小，所得圖像像素數越多，空間分辨率高，圖像質量好，但數據量大。為工業(yè)增智

為教育賦能3.2圖像的采樣分類下采樣縮小圖像（或稱為下采樣（subsampled）或降采樣（downsampled））的主要目的有兩個：一個是使得圖像符合顯示區(qū)域的大??；另一個是生成對應圖像的縮略圖。下采樣原理：對于一幅圖像P尺寸為M*N，對其進行s倍下采樣，即得到(M/s)*(N/s)尺寸的得分辨率圖像，當然s應該是M和N的公約數才行，上述可理解為把原始圖像s*s窗口內的圖像或者s2個像素點變成一個像素，這個像素點的值可以為該窗口內所有像素的均值或最大值或隨機值等。對應卷積網絡提取技術中的平均值采樣（mean-pooling），最大值采樣（max-pooling），隨機區(qū)域采樣和區(qū)域采樣等方法。為工業(yè)增智

為教育賦能3.2圖像的采樣分類（2）上采樣放大圖像（或稱為上采樣（upsampling）或圖像插值（interpolating））的主要目的是放大原圖像，從而可以顯示在更高分辨率的顯示設備上。對圖像的縮放操作并不能帶來更多關于該圖像的信息，因此圖像的質量將不可避免地受到影響。然而，確實有一些縮放方法能夠增加圖像的信息，從而使得縮放后的圖像質量超過原圖質量的。上采樣原理：圖像放大幾乎都是采用內插值方法，即在原有圖像像素的基礎上在像素點之間采用合適的插值算法插入新的元素。為工業(yè)增智

為教育賦能3.3圖像的插值算法1傳統(tǒng)插值算法鄰插值較簡單，容易實現，早期的時候應用比較普遍。但是，該方法會在新圖像中產生明顯的鋸齒邊緣和馬賽克現象。雙線性插值法具有平滑功能，能有效地克服鄰法的不足，但會退化圖像的高頻部分，使圖像細節(jié)變模糊。在放大倍數比較高時，高階插值，如雙三次和三次樣條插值等比低階插值效果好。這些插值算法可以使插值生成的像素灰度值延續(xù)原圖像灰度變化的連續(xù)性，從而使放大圖像濃淡變化自然平滑。但是在圖像中，有些像素與相鄰像素間灰度值存在突變，即存在灰度不連續(xù)性。這些具有灰度值突變的像素就是圖像中描述對象的輪廓或紋理圖像的邊緣像素。在圖像放大中，對這些具有不連續(xù)灰度特性的像素，如果采用常規(guī)的插值算法生成新增加的像素，勢必會使放大圖像的輪廓和紋理模糊，降低圖像質量。為工業(yè)增智

為教育賦能3.3圖像的插值算法2基于邊緣的圖像插值算法為了克服傳統(tǒng)方法的不足，提出了許多邊緣保護的插值方法，對插值圖像的邊緣有一定的

增強，使得圖像的視覺效果更好，邊緣保護的插值方法可以分為兩類：基于原始低分辨圖

像邊緣的方法和基于插值后高分辨率圖像邊緣的方法?；谠嫉头直媛蕡D像邊緣的方法。首先，檢測低分辨率圖像的邊緣，然后根據檢測的邊緣將像素分類處理，對于平坦區(qū)域的

像素，采用傳統(tǒng)方法插值；對于邊緣區(qū)域的像素，設計特殊插值方法，以達到保持邊緣細

節(jié)的目的。其次，基于插值后高分辨率圖像邊緣的方法這類插值方法：首先采用傳統(tǒng)方法

插值低分辨率圖像，然后檢測高分辨率圖像的邊緣，最后對邊緣及附近像素進行特殊處理，以去除模糊，增強圖像的邊緣。為工業(yè)增智

為教育賦能3.3圖像的插值算法3基于區(qū)域的圖像插值算法首先將原始低分辨率圖像分割成不同區(qū)域，然后將插值點映射到低分辨率圖像，判斷其所屬區(qū)域，最后根據插值點的鄰域像素設計不同的插值公式，計算插值點的值。為工業(yè)增智

為教育賦能3.4圖像的量化圖像的量化量化就是把采樣點上對應的亮度連續(xù)變化區(qū)間轉換為單個特定數碼的過程。量化后，圖像就被表示成一個整數矩陣。每個像素具有兩個屬性：位置和灰度。位置由行、列表示?；叶缺硎驹撓袼匚恢蒙狭涟党潭鹊恼麛?。此數字矩陣M×N就作為計算機處理的對象了?；叶燃壱话銥?－255（8bit量化）。為工業(yè)增智

為教育賦能3.4圖像的量化在現實生活中，采集到的圖像都需要經過離散化變成數字圖像后才能被計算機識別和處理。為工業(yè)增智

為教育賦能3.4圖像的量化圖像空間分辨率（采樣）N：隨著空間分辨率的下降圖像會出現馬賽克效果。圖像幅度分辨率（灰度級）k：隨著幅度分辨率的下降會出現“虛假輪廓效應”。一般出現在過渡比較平滑的區(qū)域。（1）圖像質量一般隨N和k的增加而增加。在極少情況下對固定的N，減少k能改進質量。最有可能是減少k?？稍黾訄D像看起來的反差（對比度增加）——二值化處理。（2）對具有大量細節(jié)的圖像常只需很少的灰度級數就可較好地表示——人眼分辨率能力有限。（3）b(存儲一幅圖像所需的位數bit：b=

k)為常數的一系列圖像主觀看起

來可以有較大的差異——采樣和灰度級之間存在某種合理的分配。為工業(yè)增智

為教育賦能4空間域圖像處理4.1空間域的概念4.2空間域濾波4.3常見的灰度變換4.4直方圖為工業(yè)增智

為教育賦能數字圖像處理基礎4.1空間域的概念空間域的概念“空間域”指圖像平面本身，即：圖像中的每個像素單元?！翱臻g域”主要是為了區(qū)別于

“變換域”，“變換域”是將圖像轉換到其他的域（如頻率域），在變換域做完處理之后再通過反變換的方式轉換回來。“空間域”圖像處理主要包括“灰度變換”和“空間域濾波”。濾波名詞出自于信號系統(tǒng)，從圖像來說，圖像是二維數據，二維數據傳輸的時候是逐行傳輸的，對應于信號處理，就是一個連續(xù)的波形，對波形做一些處理，按預期過濾掉波形中的某些成分，所以形象地表示為“濾波”。所謂濾波就是對圖像進行處理，比如：降噪，平滑等操作。為工業(yè)增智

為教育賦能4.2空間域濾波空間域濾波空間域濾波就是在圖像平面上對像素進行操作。空間域濾波大體分為兩類：平滑濾波、銳化濾波。平滑濾波：模糊處理，用于減小噪聲，實際上是低通濾波，典型的濾波器是高斯濾波。銳化濾波：提取邊緣突出邊緣及細節(jié)、彌補平滑濾波造成的邊緣模糊。實際上是高通濾波。空間域處理可由下式表示：g

(

)

[

(

)

]式中，f(x,y)是輸入圖像，g(x,y)是處理后的圖像，T是在點(x,y)的鄰域上定義的關于f的一種算子，算子可應用于單幅圖像或圖像集合。為工業(yè)增智

為教育賦能4.2空間域濾波空間濾波器由一個鄰域（通常是一個較小的矩形）和對該鄰域所包圍圖像像素執(zhí)行的預定義操作組成。濾波產生一個新像素，新像素的坐標等于鄰域中心的坐標，像素的值是濾波操作的結果。濾波器的中心訪問輸入圖像中的每個像素后，就生成了出了（濾波）后的圖像。如果在圖像像素上執(zhí)行的是線性操作，則該濾波器稱為線性空間濾波器，否則，濾波器就稱為非線性空間濾波器。一般來說，使用大小為m×n的濾波器對大小為M×N的圖像進行線性空間濾波，可由下式表示：為工業(yè)增智

為教育賦能4.2空間域濾波式中，x和y是可變的，以便w中的每個像素可訪問f中的每個像素。如圖所示，使用大小為3×3的濾波器模板的線性空間濾波過程。表示濾波器模板系數的坐標所選擇的形式簡化了線性濾波的表達式。為工業(yè)增智

為教育賦能4.3常見的灰度變換1圖像翻轉使用這種方式反轉一副圖像的灰度級，可得到等效的照片底片。為工業(yè)增智

為教育賦能4.3常見的灰度變換反對數變換的形式為式中c是常數，并假設r≥0。圖中對數曲線的形狀表明，該變換將輸入中范圍較窄的低灰度值映射為輸出中范圍較寬的灰度值，或將輸入中范圍較寬的高灰度值映射為輸出中范圍較窄的灰度值。2對數變換對數變換的通用形式為為工業(yè)增智

為教育賦能4.3常見的灰度變換由于對數本身上凸的性質，它可以把低灰度（較暗）部分的亮度提高，v越大，灰度提高越明顯，即圖像越來越亮。為工業(yè)增智

為教育賦能4.3常見的灰度變換式中c和γ為正常數。Gamma變換其實就是冪指數校正，目的是將灰度較窄的區(qū)域拉伸為較寬的區(qū)域。3

Gamma變換Gamma變換的基本形式為為工業(yè)增智

為教育賦能4.3常見的灰度變換4直方圖直方圖，是圖像的一個信息，就是將像素的分布以圖的形式展現出來，即每一個灰度級別有多少個像素值。比如，一幅圖像有100個灰度為200的點，那么在灰度為200的直方圖的值就為100。將每一個灰度值所包含的點集進行加和就得到了直方圖。直方圖均衡化的原理就是將本來分布較為分散的灰度值進行均勻化，使每個級別的像素所含有基本的像素點。處理前為工業(yè)增智

為教育賦能處理后4.3常見的灰度變換下圖是做均衡化前后的Lena圖像的對比，可以看出圖像清晰了很多處理前為工業(yè)增智

為教育賦能處理后4.3常見的灰度變換此外，直方圖還用在圖像識別領域中，它表示了圖像的一定的信息。比如相同大小圖像的一個十字和一個圓圓的直方圖十字的直方圖此外，直方圖還用在圖像識別領域中，它表示了圖像的一定的信息。比如相同大小圖像的一個十字和一個圓為工業(yè)增智

為教育賦能5頻域圖像處理5.1頻域處理5.2二維傅里葉變換5.3卷積相關知識介紹為工業(yè)增智

為教育賦能數字圖像處理基礎5.1頻域處理頻域處理頻域處理是指根據一定的圖像模型，對圖像頻譜進行不同程度修改的技術，通常作如下假設：（1）引起圖像質量下降的噪聲占頻譜的高頻段；（2）圖像邊緣占高頻段；（3）圖像主體或灰度緩變區(qū)域占低頻段?；谶@些假設，可以在頻譜的各個頻段進行有選擇性的修改。為工業(yè)增智

為教育賦能5.1頻域處理在頻率域研究圖像增強的考慮：（1）可以利用頻率成分和圖像外表之間的對應關系。一些在空間域表述困難的增強任務，在頻率域中變得非常普通。（2）濾波在頻率域更為直觀，它可以解釋空間域濾波的某些性質。（3）可以在頻率域指定濾波器，做反變換，然后在空間域使用結果濾波器作為空間域濾波器的指導。（4）一旦通過頻率域試驗選擇了空間濾波，通常實施都在空間域進行。為工業(yè)增智

為教育賦能5.2二維傅里葉變換二維傅里葉變換由于圖像的頻率是表征圖像中灰度變化劇烈程度的指標，是灰度在平面空間上的梯度。傅

立葉變換在實際中的物理意義，設f是一個能量有限的模擬信號，則其傅立葉變換就表示f的譜。從純粹的數學意義上看，傅立葉變換是將一個函數轉換為一系列周期函數來處理的。從物理效果看，傅立葉變換是將圖像從空間域轉換到頻率域，其逆變換是將圖像從頻率域轉換到空間域。換句話說，傅立葉變換的物理意義是將圖像的灰度分布函數變換為圖像的頻率分布函數，傅立葉逆變換是將圖像的頻率分布函數變換為灰度分布函數。為工業(yè)增智

為教育賦能5.2二維傅里葉變換（1）二維連續(xù)傅里葉變換如果二維連續(xù)函數f(x,y)滿足狄里赫萊條件，則將有下面的傅立葉變換對存在：為工業(yè)增智

為教育賦能5.2二維傅里葉變換與一維傅立葉變換類似，二維傅立葉變換的傅立葉譜和相位譜為：式中：F(u,v)是幅度譜；是相位譜；E(u,v)是能量譜。為工業(yè)增智

為教育賦能5.2二維傅里葉變換（2）二維離散傅里葉變換一個M×N大小的二維函數f(x,y)，其離散傅立葉變換對為：其中，其中，在數字圖像處理中，圖像一般取樣為方形矩陣，即N×N，則其傅立葉變換及其逆變?yōu)椋簽楣I(yè)增智

為教育賦能5.2二維傅里葉變換（3）二維離散傅里葉變換的性質離散傅里葉變換主要有以下性質：平移性質、分配律、尺度變換（縮放）、旋轉性、周期性和共軛對稱性、平均值、可分性、卷積、相關性。這里主要簡述周期性。離散傅里葉變換有如下周期性性質：反變換也是周期性的：頻譜也是關于原點對稱的：這些等式的有效性是建立在二維離散傅里葉變換公式基礎上的。圖像的周期性在圖像處理中有非常重要的作用，下面會在卷積部分繼續(xù)闡述周期性的相關內容。為工業(yè)增智

為教育賦能5.3卷積相關知識介紹（2）頻域卷積定理給定兩個時間函數：已知：則：即兩個時間函數頻譜的卷積等效于各個時間函數的乘積（乘以系數1/

）。為工業(yè)增智

為教育賦能6彩色圖像處理6.16.36.56.46.2為工業(yè)增智

為教育賦能彩色基礎彩色平衡及其matlab實現彩色模型全彩圖像處理基礎彩色補償及其matlab實現數字圖像處理基礎6.1色彩基礎色彩基礎彩色定義：彩色是物體的一種屬性，他依賴于以下三個方面的因素。（1）光源——照射光的譜性質或譜能量分布（2）物體——被照射物體的反射性質（3）成像接收器（眼睛或成像傳感器）——光譜能量吸收性質為工業(yè)增智

為教育賦能6.2色彩模型1色彩模型分類①彩色模型彩色模型也稱彩色空間或彩色系統(tǒng)，是用來精確標定和生成各種顏色的一套規(guī)則和定義，它的用途是在某些標準下用通常可接受的方式簡化彩色規(guī)范。彩色模型通?？梢圆捎米鴺讼到y(tǒng)來描述，而位于系統(tǒng)中的每種顏色都可由坐標空間中的單個點來表示。②RGB模型RGB模型：該模型是工業(yè)界的一種顏色標準，是通過對紅綠藍三個顏色亮度的變化以及他們相互之間的疊加來得到各種各樣的顏色的，該標準幾乎包括了人類視覺所能感知的所有顏色，是目前運用最廣的顏色模型之一。③CMY模型CMY模型：采用青、品紅、黃色三種基本原色按一定比例合成顏色的方法。由于色彩的顯示不是直接來自于光線的色彩，而是光線被物體吸收掉一部分之后反射回來的剩余光線所產生的，因此CMY模型又稱減色法混合模型為工業(yè)增智

為教育賦能6.2色彩模型④

HSI模型HSI模型：HSI模型是從人的視覺系統(tǒng)出發(fā)，直接使用顏色三要素——色調（hue）、飽和度（Sturation）和亮度（Intensity，有時也翻譯作密度或灰度）來描述顏色。HSV模型HSV模型：是人們用來從調色板或顏色輪中挑選顏色（例如顏料、墨水等）所采用的的彩色系統(tǒng)之一。HSV表示色調、飽和度和數值。該系統(tǒng)比RGB更接近于人們的經驗和對彩色的感知。⑥

YUV模型YUV模型：Y代表亮度、U、V代表色差，是構成彩色的兩個分量。采用YUV模型的一個主

要優(yōu)勢是它的亮度信號Y和色度信號U、V是分離的。如果只有Y信號分量而沒有U、V分量，那圖像就是黑白灰度圖。為工業(yè)增智

為教育賦能6.2色彩模型⑦

YIQ模型YIQ模型：是北美NTSC彩色制式，主要用于美國的電視系統(tǒng)。這種形式和歐洲的YUV模式

有相同的優(yōu)勢：灰度信息和彩色信息是分離的。其中亮度表示灰度，而色調和飽和度則存儲彩色信息。⑧

Lab模型Lab模型：是由CIE（國際照明委員會）制定的一種彩色模式，這種模型與設備無關，它彌補了RGB模型和CMY模型必須依賴于設備顏色特性的不足。此外，自然界中任何色彩都可

在Lab空間表達出來，這就意味著RGB以及CMY所能描述的顏色信息在Lab中都能得以映射。其中L代表亮度；a的整數代表紅色，負端代表綠色；b的正數代表黃色，負端代表藍色。為工業(yè)增智

為教育賦能6.2色彩模型2基本屬性亮度是指人感覺光的明暗程度。光的能量越大，亮度越大。色調是彩色最重要的屬性，決定顏色的本質，由物體反射光線中占優(yōu)勢的波長來決定，不同的波長產生不同的顏色感覺。飽和度是指顏色的深淺和濃淡程度，飽和度越高，顏色越深。飽和度的深淺和白色的比例有關，白色比例越多，飽和度越低。為工業(yè)增智

為教育賦能6.2色彩模型3模型之間的轉換①

RGB與CMY之間的轉換：在matlab中可以通過imcomplement（）函數方便的實現

RGB和CMY之間的相互轉換。cmy=imcomplement(rgb);rgb=imcomplement(cmy);②

從RGB到HSI的彩色轉換及其實現。figure;subplot(1,2,1);rgb=imread('plane.bmp’);imshow(rgb);title('rgb’);subplot(1,2,2);hsi=rgb2hsi(rgb);imshow(hsi);title('hsi');為工業(yè)增智

為教育賦能6.2色彩模型③

從HSI到RGB的彩色轉換及其實現。figuresubplot(1,2,1);hsi=imread('plane.bmp’);imshow(hsi);title('hsi’);subplot(1,2,2);rgb=hsi2rgb(hsi);imshow(rgb);title('rgb');為工業(yè)增智

為教育賦能6.2色彩模型為工業(yè)增智

為教育賦能④

從RGB到HSV的轉換及其實現：輸入的RGB圖像可以是uint8、uint16或double類型的，輸出圖像HSV為M*N*3的double類型。6.3全彩色圖像處理基礎全彩色圖像處理基礎全彩色圖像處理技術總的可以分為兩大類：（1）對3個平面分量單獨處理，然后將分別處理過的三個分量合成彩色圖像，對每個分量的處理技術可以應用到對灰度圖像處理的技術上。（2）直接對彩色像素進行處理。因為全彩色圖像至少有3個分量，彩色像素實際上是一個向量，直接處理就是同時對所有分量進行無差別的處理。為工業(yè)增智

為教育賦能6.4彩色補償及其matlab實現有些圖像處理任務的目標是根據顏色分離出不同類型的物體。但由于常用的彩色成像設備具有較寬且相互覆蓋的光譜敏感區(qū)，加之待拍攝圖像的染色是變化的，所以很難再3個分量圖中將物體分離出來，這種現象稱為顏色擴散。彩色補償的作用就是通過不同的顏色通道提取不同的目標物。彩色補償及其matlab實現演示代碼im=double(imread('plane.bmp'));subplot(1,2,1);imshow(uint8(im));title('原始圖');[m,n,p]=size(im);[h1,k1]=min(255-im(:,:,1)+im(:,:,2)+im(:,:,3));[j1,minx]=min(h1);i1=k1(j1);%提取圖像中最接近紅色的點，其在im中的坐標為i1,j1r1=im(i1,j1,1);g1=im(i1,j1,2);b1=im(i1,j1,3);R=0.30*r1+0.59*g1+0.11*b1;為工業(yè)增智

為教育賦能6.4彩色補償及其matlab實現[h2,k2]=min(255-im(:,:,2)+im(:,:,1)+im(:,:,3));[j2,minx]=min(h2);i2=k2(j2);%提取圖像中最接近綠色的點，其在im中的坐標為i2,j2r2=im(i2,j2,1);g2=im(i2,j2,2);b2=im(i2,j2,3);G=0.30*r2+0.59*g2+0.11*b2;[h3,k3]=min(255-im(:,:,3)+im(:,:,1)+im(:,:,2));[j3,minx]=min(h3);i3=k3(j3);%提取圖像中最接近綠色的點，其在im中的坐標為i2,j2r3=im(i3,j3,1);g3=im(i3,j3,2);b3=im(i3,j3,3);[B=0.30*r3+0.59*g3+0.11*b3;A1=[r1

r3g1

g3b1

b3];A2=[R

B];C=A1*inv(A2);for

i=1:mfor

j=1:nimR=im(i,j,1);imG=im(i,j,2);imB=im(i,j,3);temp=inv(C)*[imR;imG;imB];S(i,j,1)=temp(1);S(i,j,2)=temp(2);S(i,j,3)=temp(3);endend為工業(yè)增智

為教育賦能6.4彩色補償及其matlab實現S=uint8(S);subplot(1,2,2);imshow(S);title('補償后');為工業(yè)增智

為教育賦能6.5彩色平衡及其matlab實現衡。彩色平衡及其matlab實現一幅彩色圖像數字化后，在顯示時顏色經?？雌饋碛行┎徽?。這是顏色通道的不同敏感度、增光因子和偏移量等原因導致的，稱其為三基色不平衡。將之校正的過程就是彩色平演示代碼im=double(imread('plane.bmp'));[m,n,p]=size(im);F1=im(1,1,:);F2=im(1,2,:);F1_(1,1,1)=F1(:,:,2);F1_(1,1,2)=F1(:,:,2);F1_(1,1,3)=F1(:,:,2);F2_(1,1,1)=F1(:,:,2);F2_(1,1,2)=F1(:,:,2);F2_(1,1,3)=F1(:,:,2);K1=(F1_(1,1,1)-F2_(1,1,1))/(F1(1,1,1)-F2(1,1,1));K2=F1_(1,1,1)-K1*F1(1,1,1);L1=(F1_(1,1,3)-F2_(1,1,3))/(F1(1,1,3)-F2(1,1,3));L2=F1_(1,1,3)-L1*F1(1,1,3);for

i=1:mfor

j=1:nnew(i,j,1)=K1*im(i,j,1)+K2;new(i,j,2)=im(i,j,2);new(i,j,3)=L1*im(i,j,3)+L2;endend為工業(yè)增智

為教育賦能6.5彩色平衡及其matlab實現im=uint8(im);new=uint8(new);subplot(1,2,1);imshow(im);title('原始圖');subplot(1,2,2);imshow(new);title('平衡后');為工業(yè)增智

為教育賦能7形態(tài)學圖像處理7.1膨脹7.2腐蝕7.3開操作和閉操作為工業(yè)增智

為教育賦能數字圖像處理基礎7.1膨脹膨脹膨脹是在二值圖像中“加長”或“變粗”的操作。這種特殊的方式和變粗的程度由一個稱為結構元素的集合控制。實際就是將結構元素的原點與二值圖像中的1重疊，將二值圖像中重疊部分不是1的值變?yōu)?，完成膨脹。公式：A和B是兩個集合，A被B膨脹定義為：為工業(yè)增智

為教育賦能7.1膨脹公式解釋：（1）B的反射進行平移與A的交集不為空。（2）B的反射：相對于自身原點的映象。（3）B的平移：對B的反射進行位移為工業(yè)增智

為教育賦能7.1膨脹其中：（1）膨脹運算只要求結構元素的原點在目標圖像的內部平移，換句話說，當結構元素在目標圖像上平移時，允許結構元素中的非原點像素超出目標圖像的范圍。（2）膨脹運算具有擴大圖像和填充圖像中比結果元素小的成分的作用，因此在實際應用中可以利用膨脹運算連接相鄰物體和填充圖像中的小孔和狹窄的縫隙。代碼示例：A=imread('D:\數字圖像處理\Fig0906(a).tif');B=[0

0;1

1;0

0];%指定結構元素由0和1組成的矩陣A2=imdilate(A,B);

%二值圖像subplot(1,2,1),imshow(A);title('原圖像');subplot(1,2,2),imshow(A2);title('膨脹處理后圖像');運行結果為工業(yè)增智

為教育賦能7.2腐蝕腐蝕與膨脹相反，對二值圖像中的對象進行“收縮”或“細化”。實際上將結構元素的原點覆蓋在每一個二值圖像的1上，只要二值圖像上有0和結構元素的1重疊，那么與原點重疊的值為0，同樣由集合與結構元素完成。具體如圖2-33所示。公式：A和B是兩個集合，A被B腐蝕定義為：為工業(yè)增智

為教育賦能7.3開操作和閉操作開操作與閉操作開閉操作都是由膨脹和腐蝕復合而成，開操作是先腐蝕后膨脹，閉操作是先膨脹后腐蝕。一般來說，開操作使圖像的輪廓變得光滑，斷開下載的連接和消除細毛刺。閉操作同樣使得輪廓變得光滑，但是與開操作相反，它通常能夠彌合狹窄的間斷，填充小的孔洞下圖所示，分別是原始圖、閉運算后、開運算后。為工業(yè)增智

為教育賦能7.2腐蝕其中：（1）被B腐蝕是包含在A中的B由z平移的所有點z的集合。（2）B包含在A中的聲明相當于B不共享A背景的任何元素。為工業(yè)增智

為教育賦能7.2腐蝕為工業(yè)增智

為教育賦能其中：（1）當結構元素中原點位置不為1（也即原點不屬于結構元素時），也要把它看作是1，也就是說，當在目標圖像中找與結構元素B相同的子圖像時，也要求子圖像中與結構元素B的原點對應的那個位置的像素的值是1。（2）腐蝕運算要求結構元素必須完全包括在被腐蝕圖像內部：換句話說，當結構元素在目標圖像上平移時，結構元素中的任何元素不能超過目標圖像范圍。（3）腐蝕運算的結果不僅與結構元素的形狀選取有關，而且還與原點位置的選取有關。（4）腐蝕運算具有縮小圖像和消除圖像中比結構元素小的成分的作用，因此在實際應用中，可以利用腐蝕運算去除物體之間的粘連，消除圖像中的小顆粒噪聲。7.2腐蝕;代碼示例：f=imread('D:\數字圖像處理\Fig0908(a).tif');se=strel('disk',10);g

imerode(f,

se);se

strel('disk',

5);g1

imerode(f,

se);g2

imerode(f,

strel('disk',

20));subplot(2,2,1),imshow(f);title('(a)原圖像')subplot(2,2,2),imshow(g);title('腐蝕(結構元半徑為5)處理后圖像');subplot(2,2,3),imshow(g1);title('腐蝕(結構元半徑為10)處理后圖像');subplot(2,2,4),imshow(g2);title('腐蝕(結構元半徑為20)處理后圖像');運行結果為工業(yè)增智

為教育賦能“圖”是物體投射或反射光的分布，“像”是人的視覺系統(tǒng)對圖的接受在大腦中形成的印象或反映。是客觀和主觀的結合。數字圖像是指由被稱作像素的小塊區(qū)域組成的二維矩陣。將物理圖象行列劃分后，每個小塊區(qū)域稱為像素（pixel）。每個像素包括兩個屬性：位置和灰度。對于單色即灰度圖像而言，每個象素的亮度用一個數值來表示，通常數值范圍在0到255之間，即可用一個字節(jié)來表示，0表示黑、255表示白，而其它表示灰度級別。彩色圖象可以用紅、綠、藍三元組的二維矩陣來表示。通常，三元組的每個數值也是在0到255之間，0表示相應的基色在該象素中取得最小值，而255則代表相應的基色在該象素中取得最大值，這種情況下每個象素可用三個字節(jié)來表示。數字圖像處理就是利用計算機系統(tǒng)對數字圖像進行各種目的的處理：對連續(xù)圖像f（x，

y）進行數字化：空間上，圖像抽樣；幅度上，灰度級量化。x方向，抽樣M行。y方向，每行抽樣N點。整個圖像共抽樣M×N個像素點，一般取M=N=2n=64，128，256，512，1024，2048。數字圖像常用矩陣來表示：f(i,j)=0~255，灰度級為256，設灰度量化為8bit。為工業(yè)增智

為教育賦能數字圖像處理基礎數字圖像處理的主要研究內容包含很多方面，請列出并簡述其中的4種。什么是圖像識別與理解?簡述數字圖像處理的至少3種主要研究內容。簡述圖像幾何變換與圖像變換的區(qū)別。為工業(yè)增智

為教育賦能數字圖像處理基礎第3章視覺系統(tǒng)硬件選型知識目標熟悉機器視覺系統(tǒng)的主要硬件構成掌握機機器視覺系統(tǒng)主要硬件的工作原理與性能掌握機器視覺系統(tǒng)硬件解決方案的選型技能目標能夠對相機、鏡頭、光源的硬件選型進行性能指標公式計算學會對一般工業(yè)應用進行視覺系統(tǒng)硬件方案選型視覺系統(tǒng)硬件選型為工業(yè)增智

為教育賦能項目1

工業(yè)相機介紹項目2

鏡頭介紹項目3

光源介紹為工業(yè)增智

為教育賦能視覺系統(tǒng)硬件選型1工業(yè)相機介紹1.1工業(yè)相機介紹1.2Sensor介紹1.3數據接口介紹1.4相機主要參數1.5工業(yè)相機選型為工業(yè)增智

為教育賦能視覺系統(tǒng)硬件選型1.1工業(yè)相機簡介機器視覺系統(tǒng)是由圖像采集、圖像處理以及信息綜合分析處理三個模塊構成。而工業(yè)相機則是機器視覺系統(tǒng)當中圖像采集模塊的核心部件，對于機器視覺系統(tǒng)選型來說是至關重要的。在工業(yè)相機選型時，也會涉及到相機的類型、定位、參數、傳輸接口、光學接口等各個方面的信息和內容。1引言為工業(yè)增智

為教育賦能1.1工業(yè)相機簡介一般來說，工業(yè)相機主要由圖像傳感器、內部處理電路、數據接口、IO接口、光學接口等幾個基本模塊組成。當相機在進行拍攝時，光信號首先通過鏡頭到達圖像傳感器，然后被轉化為電信號，再由內部處理電路對圖像信號進行算法處理，最終按照相關標準協議通過數據接口向上位機傳輸數據。IO接口則提供相機與上下游設備的信號交互，如可以使用輸入信號觸發(fā)相機拍照，相機輸出頻閃信號控制光源亮起等2工業(yè)相機簡介為工業(yè)增智

為教育賦能1.1工業(yè)相機簡介結合工業(yè)相機構成的幾大基本模塊及不同的選型維度來看，工業(yè)相機一般可按以下標準分類：①傳感器類型：面陣相機/線陣相機，彩色相機/黑白相機，CCD相機/CMOS相機等。②

數據接口類型：網口相機/USB

3相機/萬兆網口相機/Camera

Link相機/CoaXPress相機等。③

光學接口類型：C口/CS口/M12口/F口/M58口等。為工業(yè)增智

為教育賦能1.2

Sensor介紹Sensor介紹目前，市面上主流的傳感器廠商包括Sony，ONSemi，Gpixel，AMS等。機器視覺制造商

將圖像傳感器與各具特色的硬件電路集成起來，開發(fā)了圖像處理功能，為用戶提供了豐富的選擇。依據不同的分類標準，行業(yè)也針對不同類型的傳感器做出了技術區(qū)分。傳感器類型一般來說，相機傳感器按元器件類型不同，可分為CCD（Charged

Coupled

Device，電荷耦合元件）和CMOS（Complementary

Metal-Oxide

Semiconductor，金屬氧化物半

導體元件）兩類。其中，CCD的工作原理是將光信號轉換成電信號，并按順序傳送到一個共同輸出結構，然后把電荷轉換成電壓，接著再將這些信號送到緩沖器并存儲到芯片外。而CMOS芯片是將光信號轉化成電信號，并直接集成在芯片表面，因此電子元件能夠快速地讀取成像數據。一般來說，CMOS讀取速度比CCD更快。為工業(yè)增智

為教育賦能1.2

Sensor介紹為工業(yè)增智

為教育賦能CCD與CMOS在不同的應用場景下各有優(yōu)勢。CCD由于其特有的工藝，具備低照度效果好、

信噪比高、通透感強、色彩還原能力佳等優(yōu)點，可廣泛應用在屏幕檢測、交通、醫(yī)療等高端領域中；但同時由于其成本高、功耗大也制約了其市場發(fā)展的空間。隨著CMOS工藝和

技術的不斷提升，以及高端CMOS價格的不斷下降，在機器視覺行業(yè)中，CMOS將占據越來越重要的地位。對比項CCDCMOS設計技術單一感光器感光器連接放大器靈敏度較高感光開口小，靈敏度低成本線路品質影響程度高，成本

人人文庫> 全部分類> 應用文書 > 技術指導

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 人人文庫網僅提供信息存儲空間，僅對用戶上傳內容的表現方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

機器人視覺技術及應用

文檔簡介

溫馨提示

最新文檔

評論

機器人視覺技術及應用

文檔簡介

溫馨提示

最新文檔

評論

相關文檔