機(jī)器人視覺技術(shù)及應(yīng)用_第1頁
機(jī)器人視覺技術(shù)及應(yīng)用_第2頁
機(jī)器人視覺技術(shù)及應(yīng)用_第3頁
機(jī)器人視覺技術(shù)及應(yīng)用_第4頁
機(jī)器人視覺技術(shù)及應(yīng)用_第5頁
已閱讀5頁,還剩710頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第1章機(jī)器視覺概述知識(shí)目標(biāo)了解機(jī)器視覺技術(shù)的發(fā)展和行業(yè)應(yīng)用熟悉機(jī)器視覺系統(tǒng)的基本概念和特點(diǎn)掌握機(jī)器視覺系統(tǒng)的組成及各部分功能技能目標(biāo)能夠理解和掌握機(jī)器視覺技術(shù)的相關(guān)概念能夠理解和認(rèn)知機(jī)器視覺相關(guān)工業(yè)應(yīng)用機(jī)器視覺概述項(xiàng)目1

機(jī)器視覺行業(yè)背景項(xiàng)目2

機(jī)器視覺系統(tǒng)概念項(xiàng)目3

機(jī)器視覺系統(tǒng)組成項(xiàng)目4

機(jī)器視覺系統(tǒng)的應(yīng)用場(chǎng)景機(jī)器視覺技術(shù)概述1機(jī)器視覺行業(yè)背景1.11.31.2機(jī)器視覺的起源與發(fā)展機(jī)器視覺的行業(yè)應(yīng)用機(jī)器視覺面臨的問題機(jī)器視覺技術(shù)概述1.1機(jī)器視覺的起源與發(fā)展計(jì)算機(jī)視覺的歷史是從60年代初開始的,由LarryRoberts撰寫的作品《BlockWorld》,被公認(rèn)為計(jì)算機(jī)視覺的第一篇博士論文。1966年,麻省理工大學(xué)(MIT)開展了暑期視覺項(xiàng)目,目的是為了構(gòu)建視覺系統(tǒng)的重要組成部分。MIT的視覺科學(xué)家DavidMarr提出了使得計(jì)算機(jī)識(shí)別視覺世界的算法。他指出,為了獲取視覺世界完整的3D圖像,需要經(jīng)歷幾個(gè)階段:第一個(gè)階段是原始草圖,得到大部分邊緣、端點(diǎn)和虛擬線條;第二階段是David

Marr所說的“2.5維草圖”;最后一個(gè)階段是將所有的內(nèi)容放在一起,組成一個(gè)3D模型。1機(jī)器視覺的起源為工業(yè)增智

為教育賦能1.1機(jī)器視覺的起源與發(fā)展機(jī)器視覺,起源于20世紀(jì)50年代,早期研究主要是從統(tǒng)計(jì)模式識(shí)別開始,工作主要集中在二維圖像分析與識(shí)別上;20世紀(jì)60年代的研究前沿是以理解三維場(chǎng)景為目的的三維機(jī)器視覺;1977年,David

Marr教授在麻省理工大學(xué)的人工智能實(shí)驗(yàn)室領(lǐng)導(dǎo)一個(gè)以博士生為主體的研究小組,于1977年提出了不同于“積木世界”分析方法的計(jì)算視覺理論;20世紀(jì)80年代到20世紀(jì)90年代中期,機(jī)器視覺獲得蓬勃的發(fā)展,新概念,新方法,新理論不斷涌現(xiàn)。2機(jī)器視覺的發(fā)展為工業(yè)增智

為教育賦能1.1機(jī)器視覺的起源與發(fā)展在中國,視覺技術(shù)的應(yīng)用開始于20世紀(jì)90年代,但在各行業(yè)的應(yīng)用幾乎一片空白。到21世紀(jì),視覺技術(shù)開始在自動(dòng)化行業(yè)成熟應(yīng)用

現(xiàn)代工業(yè)自動(dòng)化技術(shù)日趨成熟,越來越多的制造企業(yè)考慮如何采用機(jī)器視覺來幫助生產(chǎn)線實(shí)現(xiàn)檢查、測(cè)量和自動(dòng)識(shí)別等功能,以提高效率并降低成本,從而實(shí)現(xiàn)生產(chǎn)效益最大化。機(jī)器視覺作為新興技術(shù)被寄予厚望,被認(rèn)為是自動(dòng)化行業(yè)一個(gè)具備光明前景的細(xì)分市場(chǎng)。機(jī)器視覺由于技術(shù)本身存在的優(yōu)越性在許多領(lǐng)域有很好的發(fā)展前景。為工業(yè)增智

為教育賦能1.1機(jī)器視覺的起源與發(fā)展從全球范圍看,由于下游消費(fèi)電子、汽車、半導(dǎo)體、醫(yī)藥等行業(yè)規(guī)模持續(xù)擴(kuò)大,全球機(jī)器視覺市場(chǎng)規(guī)模呈快速增長趨勢(shì),2017年已突破80億美元,并預(yù)計(jì)到2020年全球市場(chǎng)規(guī)模

將達(dá)到125億美元,2025年將超過192億美元。從長遠(yuǎn)的潛在市場(chǎng)規(guī)模來看,當(dāng)前只有5%的潛在用戶使用了機(jī)器視覺,也就是還有95%的潛在用戶需要但還沒有用上機(jī)器視覺,全部潛力發(fā)揮出來后,全球的市場(chǎng)可達(dá)到1200億美元。為工業(yè)增智

為教育賦能1.1機(jī)器視覺的起源與發(fā)展國內(nèi)方面,受益于配套基礎(chǔ)設(shè)施不斷完善、制造業(yè)總體規(guī)模持續(xù)擴(kuò)大、智能化水平不斷提高、政策利好等因素,中國機(jī)器視覺市場(chǎng)需求不斷增長。2018年中國機(jī)器視覺市場(chǎng)規(guī)模首次超過100億元。隨著行業(yè)技術(shù)提升、產(chǎn)品應(yīng)用領(lǐng)域更廣泛,未來機(jī)器視覺市場(chǎng)將進(jìn)一步擴(kuò)大,預(yù)計(jì)2019年市場(chǎng)規(guī)模將近125億元,2023年將達(dá)到197億元,2019-2023年復(fù)合增長率超12%。為工業(yè)增智

為教育賦能1.2機(jī)器視覺的行業(yè)應(yīng)用目前,機(jī)器視覺已成功地應(yīng)用于工業(yè)檢測(cè)領(lǐng)域,大幅度地提高了產(chǎn)品的質(zhì)量和可靠性,保證了生產(chǎn)的速度。主要有1)引導(dǎo)和定位:上下料使用機(jī)器視覺來定位,引導(dǎo)機(jī)械手臂準(zhǔn)確抓取。2)外觀檢測(cè):檢測(cè)生產(chǎn)線上產(chǎn)品有無質(zhì)量問題,該環(huán)節(jié)也是取代人工最多的環(huán)節(jié)。3)高精度檢測(cè):有些產(chǎn)品的精密度較高,達(dá)到0.01~0.02m,甚至μ級(jí),是人眼無法檢測(cè)出來的,必須使用機(jī)器來完成。4)識(shí)別:數(shù)據(jù)的追溯和采集,在汽車零部件、食品、藥品等應(yīng)用較多。例如產(chǎn)品包裝印刷質(zhì)量的檢測(cè)、飲料行業(yè)的容器質(zhì)量檢測(cè)、飲料填充檢測(cè)、飲料品封口檢測(cè)、木材

廠木料檢測(cè)、半導(dǎo)體集成塊封裝質(zhì)量檢測(cè)、卷鋼質(zhì)量檢測(cè)和水果分級(jí)檢測(cè)等。在制藥

生產(chǎn)線上,使用機(jī)器視覺技術(shù)可以對(duì)藥品包裝進(jìn)行檢測(cè),以確定是否裝入正確的藥粒。1機(jī)器視覺在工業(yè)檢測(cè)中的應(yīng)用為工業(yè)增智

為教育賦能1.2機(jī)器視覺的行業(yè)應(yīng)用在醫(yī)學(xué)領(lǐng)域,機(jī)器視覺用于輔助醫(yī)生進(jìn)行醫(yī)學(xué)影像的分析,主要利用數(shù)字圖像處理技術(shù)、信息融合技術(shù)對(duì)X射線透視圖、核磁共振圖像、CT圖像進(jìn)行分析或?qū)ζ渌t(yī)學(xué)影像數(shù)據(jù)的統(tǒng)計(jì)和分析。不同醫(yī)學(xué)影像設(shè)備得到是不同特性的生物組織的圖像。例如,X射線反映的是骨骼組織,核磁共振影像反映的是有機(jī)組織圖像,而醫(yī)生往往需要考慮骨骼與有機(jī)組織的關(guān)系,因而需要利用數(shù)字圖像處理技術(shù)將兩種圖像適當(dāng)?shù)丿B加起來,以便于醫(yī)學(xué)分析。2機(jī)器視覺在醫(yī)學(xué)中應(yīng)用為工業(yè)增智

為教育賦能1.2機(jī)器視覺的行業(yè)應(yīng)用對(duì)放射圖像、顯微圖像、醫(yī)學(xué)圖像、遙感多波段圖像、合成孔徑雷達(dá)圖像、航天航測(cè)圖像等的自動(dòng)判讀理解。由于近年來技術(shù)的發(fā)展,圖像的種類和數(shù)量飛速增長,圖像的自動(dòng)理解已成為解決信息膨脹問題的重要手段。3圖像自動(dòng)解釋應(yīng)用為工業(yè)增智

為教育賦能1.2機(jī)器視覺的行業(yè)應(yīng)用軍事領(lǐng)域是對(duì)新技術(shù)最渴望、最敏感的領(lǐng)域,對(duì)于機(jī)器視覺同樣也不例外。最早的視覺和圖像分析系統(tǒng)就是用于偵察圖像的處理分析和武器制導(dǎo)。機(jī)器視覺廣泛應(yīng)用于航空著陸姿勢(shì)、起飛狀態(tài);彈道/火箭噴射、子彈出膛、火炮發(fā)射;爆破分析炮彈爆炸、破片分析、爆炸防御;撞擊、分離以及各種武器性能測(cè)試分析,點(diǎn)火裝置工作過程等。4軍事應(yīng)用為工業(yè)增智

為教育賦能1.3機(jī)器視覺面臨的問題為工業(yè)增智

為教育賦能對(duì)于人的視覺來說,由于人的大腦和神經(jīng)的高度發(fā)展,其目標(biāo)識(shí)別能力很強(qiáng)。但是人的視覺也同樣存在障礙。例如,即時(shí)具有敏銳視覺和高度發(fā)達(dá)頭腦的人,一旦置身于某種特殊環(huán)境,其目標(biāo)識(shí)別能力也會(huì)急劇下降。將人的視覺引入機(jī)器視覺中,機(jī)器視覺也存在著這樣的障礙。它主要表現(xiàn)在三個(gè)方面:一是如何準(zhǔn)確、高速(實(shí)時(shí))地識(shí)別出目標(biāo);二是如何有效地增大存儲(chǔ)容量,以便容納下足夠細(xì)節(jié)的目標(biāo)圖像;三是如何有效地構(gòu)造和組織出可靠的識(shí)別算法,并順利地實(shí)現(xiàn)。前兩者相當(dāng)于人的大腦這樣的物質(zhì)基礎(chǔ),這期待著高速的陣列處理單元,以及算法的新突破,用極少的計(jì)算量及高度的并行性實(shí)現(xiàn)功能。另外,由于當(dāng)前對(duì)人類視覺系統(tǒng)和機(jī)理、人腦心理和生理的研究還不夠,目前人們所建立的各種視覺系統(tǒng)絕大多數(shù)是只適用于某一特定環(huán)境或應(yīng)用場(chǎng)合的專用系統(tǒng),而要建立一個(gè)可與人類的視覺系統(tǒng)相比擬的通用視覺系統(tǒng)是非常困難的。正因?yàn)槿绱耍x予機(jī)器以人類視覺功能是幾十年來人們不懈追求和奮斗的目標(biāo)。隨著“中國制造2025”戰(zhàn)略計(jì)劃的實(shí)施,我國將進(jìn)一步深化產(chǎn)業(yè)結(jié)構(gòu)調(diào)整,推進(jìn)制造業(yè)的科技創(chuàng)新,提高智能制造水平,著力從要素驅(qū)動(dòng)向創(chuàng)新驅(qū)動(dòng)的根本轉(zhuǎn)變。產(chǎn)業(yè)結(jié)構(gòu)的轉(zhuǎn)型升級(jí)和制造業(yè)的進(jìn)一步智能化為機(jī)器視覺技術(shù)的發(fā)展應(yīng)用帶來了巨大的機(jī)遇和挑戰(zhàn)。2機(jī)器視覺系統(tǒng)概念2.1機(jī)器視覺系統(tǒng)概念機(jī)器視覺技術(shù)概述2.1機(jī)器視覺系統(tǒng)概念機(jī)器視覺系統(tǒng)是通過機(jī)器視覺產(chǎn)品(即圖像攝取裝置)將被攝取目標(biāo)轉(zhuǎn)換成圖像信號(hào),傳

送給專用的圖像處理系統(tǒng),得到被攝目標(biāo)的形態(tài)信息,根據(jù)像素分布的亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號(hào)。圖像系統(tǒng)對(duì)這些信號(hào)進(jìn)行各種運(yùn)算來抽取目標(biāo)的特征,進(jìn)而根據(jù)判別

的結(jié)果來控制現(xiàn)場(chǎng)的設(shè)備動(dòng)作。簡單說來,機(jī)器視覺就是用機(jī)器代替人眼來做測(cè)量和判斷。相對(duì)人類視覺,機(jī)器視覺在速度、感光范圍、觀測(cè)精度、環(huán)境要求等方面都存在顯著優(yōu)勢(shì)機(jī)器視覺系統(tǒng)概念為工業(yè)增智

為教育賦能2.1機(jī)器視覺系統(tǒng)概念機(jī)器視覺是機(jī)器人自主行動(dòng)的前提,能夠?qū)崿F(xiàn)計(jì)算機(jī)系統(tǒng)對(duì)于外界環(huán)境的觀察、識(shí)別以及判斷等功能,對(duì)于人工智能的發(fā)展具有極其重要的作用,是人工智能范疇最重要的前沿分支之一,機(jī)器視覺技術(shù)在國內(nèi)外人工智能企業(yè)應(yīng)用技術(shù)中占比超過40%,其中國內(nèi)占比達(dá)到了46%。作為人工智能技術(shù)的重要分支,機(jī)器視覺正在快速發(fā)展。機(jī)器視覺是實(shí)現(xiàn)自動(dòng)化技術(shù)的重要的基礎(chǔ)技術(shù)之一,能夠?qū)崿F(xiàn)儀器設(shè)備的基準(zhǔn)控制,提升生產(chǎn)制造過程的自動(dòng)化、智能化,極大提高工作效率和準(zhǔn)確率,其應(yīng)用范圍不僅限于外界信息的輸入,通常還擴(kuò)展為信息的進(jìn)一步處理以及執(zhí)行機(jī)構(gòu)(機(jī)械臂,傳送帶等)的聯(lián)動(dòng)控制。為工業(yè)增智

為教育賦能3機(jī)器視覺系統(tǒng)組成3.13.33.53.43.2為工業(yè)增智

為教育賦能機(jī)器視覺系統(tǒng)圖像處理信號(hào)與執(zhí)行機(jī)構(gòu)光源照明技術(shù)與光學(xué)鏡頭CCD攝像機(jī)圖像采集卡與視覺傳感器機(jī)器視覺技術(shù)概述3.1機(jī)器視覺系統(tǒng)機(jī)器視覺系統(tǒng)概念機(jī)器視覺是一項(xiàng)綜合性的技術(shù),綜合了光學(xué),機(jī)械,電子,計(jì)算機(jī)軟硬件等方面的技術(shù)。一個(gè)典型的機(jī)器視覺系統(tǒng)包括以下產(chǎn)品:相機(jī)、光源、圖像采集卡/視覺處理器板、獨(dú)立于硬件產(chǎn)品的視覺軟件、接口和線纜和其他視覺配件。為工業(yè)增智

為教育賦能3.1機(jī)器視覺系統(tǒng)此外,還有以智能相機(jī)為中心的機(jī)器視覺系統(tǒng)形態(tài),將照明、成像、處理內(nèi)置于相機(jī)內(nèi)部,一臺(tái)相機(jī)即可完成機(jī)器視覺系統(tǒng)的全部功能。為工業(yè)增智

為教育賦能3.2光源照明技術(shù)與光學(xué)鏡頭1光源照明技術(shù)在目前的機(jī)器視覺應(yīng)用系統(tǒng)中,好的光源與照明方案往往是整個(gè)系統(tǒng)成敗的關(guān)鍵,起著非常重要的作用,并不是簡單的照亮物體而已。在機(jī)器視覺應(yīng)用系統(tǒng)中一般使用透射光和反射光。對(duì)于反射光情況應(yīng)充分考慮光源和光學(xué)鏡頭的相對(duì)位置、物體表面的紋理,物體的幾何形狀等要素。光源設(shè)備的選擇必須符合所需的幾何形狀,照明亮度、均勻度、發(fā)光的光譜特性也必須符合實(shí)際的要求,同時(shí)還要考慮光源的發(fā)光效率和使用壽命。下表列出了主要幾種光源的相關(guān)特性。為工業(yè)增智

為教育賦能3.2光源照明技術(shù)與光學(xué)鏡頭綜合比較來看LED光源因其顯色性好,光譜范圍寬,能覆蓋可見光的整個(gè)范圍,且發(fā)光強(qiáng)度高,穩(wěn)定時(shí)間長,近年來隨著LED制造工藝和技術(shù)的不斷發(fā)展成熟,價(jià)格逐步降低,其在機(jī)器視覺領(lǐng)域正得到越來越廣泛的應(yīng)用為工業(yè)增智

為教育賦能3.2光源照明技術(shù)與光學(xué)鏡頭光學(xué)鏡頭一般稱為攝像頭或攝影鏡頭,簡稱鏡頭,光學(xué)鏡頭是機(jī)器視覺系統(tǒng)中必不可少的部件,直接影響成像質(zhì)量的優(yōu)劣,影響算法的實(shí)現(xiàn)和效果。其功能就是光學(xué)成像,相當(dāng)于人眼的晶狀體,在機(jī)器視覺系統(tǒng)中非常重要。2光學(xué)鏡頭(1)什么是光學(xué)鏡頭為工業(yè)增智

為教育賦能3.2光源照明技術(shù)與光學(xué)鏡頭(2)光學(xué)鏡頭的分類①.鏡頭的種類按焦距可分為:廣角鏡頭、標(biāo)準(zhǔn)鏡頭、長焦距鏡頭;②.按動(dòng)作方式可分為:手動(dòng)鏡頭、電動(dòng)鏡頭;③.按安裝方式可分為:普通安裝鏡頭、隱蔽安裝鏡頭;④.按光圈可分為:手動(dòng)光圈、自動(dòng)光圈;⑤.按聚焦方式可分為:手動(dòng)聚焦、電動(dòng)聚焦、自動(dòng)聚焦;⑥.按變焦倍數(shù)可分為:2倍變焦、6倍變焦、

10倍變焦、20倍變焦等。為工業(yè)增智

為教育賦能3.2光源照明技術(shù)與光學(xué)鏡頭(3)光學(xué)鏡頭的性能參數(shù)與選型鏡頭的主要性能指標(biāo)有焦距、光闌系數(shù)、倍率、接口等。根據(jù)被測(cè)目標(biāo)的狀態(tài)應(yīng)優(yōu)先選用定焦鏡頭。鏡頭選擇應(yīng)注意:焦距、目標(biāo)高度、影像高度、放大倍數(shù)、影像至目標(biāo)的距離、中心點(diǎn)等。當(dāng)然,鏡頭與攝像機(jī)的安裝接口也是應(yīng)考慮的一個(gè)重要因素。鏡頭焦距f視野范圍W相機(jī)靶面m工作距離d為工業(yè)增智

為教育賦能f=m*d/W3.3

CCD攝像機(jī)CCD攝像機(jī)目前CCD攝像機(jī)以其小巧、可靠、清晰度高等特點(diǎn)在

商用與工業(yè)領(lǐng)域都得到了

廣泛地使用。CCD攝像機(jī)

按照其使用的CCD器件可

以分為線陣式(卷簾快門)和面陣式(全局快門)兩大類。為工業(yè)增智

為教育賦能3.3

CCD攝像機(jī)為工業(yè)增智

為教育賦能線陣CCD攝像機(jī)一次只能獲得圖像的一行信息,被拍攝的物體必須以直線形式從攝像機(jī)前

移過,才能獲得完整的圖像。它主要用于檢測(cè)條狀、筒狀產(chǎn)品,例如布匹、鋼板、紙張等。面陣攝像機(jī)可以一次獲得整幅圖像的信息。CCD攝像機(jī)由于其具有靈敏度高、抗強(qiáng)光、畸變小、體積小、壽命長、抗震動(dòng)等優(yōu)點(diǎn)而得到了廣泛的使用。3.4圖像采集卡與視覺傳感器圖像采集卡圖像采集卡又稱為圖像卡,它將攝像機(jī)的圖像視頻信號(hào)送到計(jì)算機(jī)的內(nèi)存,供計(jì)算機(jī)處理、存儲(chǔ)、顯示和傳輸?shù)仁褂?。其主要模塊組成及功能如下:①.A/D轉(zhuǎn)換模塊,將圖像信號(hào)放大和數(shù)字化;②.相機(jī)控制模塊,負(fù)責(zé)提供相機(jī)的設(shè)置及實(shí)現(xiàn)異步重置拍照、定時(shí)拍照;③.總線接口及控制模塊,主要通過PCI總線完成數(shù)字圖像數(shù)據(jù)的傳輸;④.數(shù)字輸入/輸出模塊,本模塊允許圖像采集卡通過TTL信號(hào)與外部裝置進(jìn)行通信,用于控制和響應(yīng)外部事件。為工業(yè)增智

為教育賦能3.4圖像采集卡與視覺傳感器視覺傳感器基于PC機(jī)的機(jī)器視覺系統(tǒng)結(jié)構(gòu)沒有模塊化,安裝不方便,可移植性差,特別是與工業(yè)廣泛使用的PLC接口比較麻煩。從軟件和硬件開發(fā)兩個(gè)方面來考慮,都需要一種更適合工業(yè)需求的機(jī)器視覺組件。目前國外已經(jīng)開發(fā)出了一種叫做視覺傳感器的模塊化部件,這種視覺傳感器集成了光源、攝像頭、圖像處理器、標(biāo)準(zhǔn)的控制與通訊接口,自成為一個(gè)智能圖像采集與處理單元,內(nèi)部程序存儲(chǔ)器可存儲(chǔ)圖像處理算法,并能使用PC機(jī),利用專用組態(tài)軟件編制各種算法下載到視覺傳感器的程序存儲(chǔ)器中。視覺傳感器將PC的靈活性,PLC的可靠性、分布式網(wǎng)絡(luò)技術(shù)結(jié)合在一起。用

這樣的視覺傳感器和PLC可以更容易地構(gòu)成機(jī)器視覺系統(tǒng)。為工業(yè)增智

為教育賦能3.5圖像信號(hào)處理與執(zhí)行機(jī)構(gòu)圖像信號(hào)處理圖像信號(hào)的處理是機(jī)器視覺系統(tǒng)的核心。視覺信息的處理技術(shù)主要依賴于圖像處理方法,它包括圖像變換、數(shù)據(jù)編碼壓縮、圖像增強(qiáng)復(fù)原、平滑、邊緣銳化、分割、特征抽取、圖像識(shí)別與理解等內(nèi)容。隨著計(jì)算機(jī)技術(shù)、微電子技術(shù)以及大規(guī)模集成電路的發(fā)展,為了提高系統(tǒng)的實(shí)時(shí)性,圖像處理的很多工作都可以借助硬件完成,如DSP芯片、專用圖像信號(hào)處理卡等,軟件主要完成算法中非常復(fù)雜、不太成熟或尚需不斷探索和改進(jìn)的部分。處理時(shí)間上,要求處理速度必須大于等于采集速度,才能保證目標(biāo)圖像無遺漏,完成實(shí)時(shí)處理。為工業(yè)增智

為教育賦能3.5圖像信號(hào)處理與執(zhí)行機(jī)構(gòu)執(zhí)行機(jī)構(gòu)機(jī)器視覺系統(tǒng)的最終功能的實(shí)現(xiàn)還需執(zhí)行機(jī)構(gòu)來完成。不同的應(yīng)用場(chǎng)合,執(zhí)行機(jī)構(gòu)可能不同,比如機(jī)電系統(tǒng)、液壓系統(tǒng)、氣動(dòng)系統(tǒng),無論哪一種,除了要嚴(yán)格保證其加工制造和裝配的精度外,在設(shè)計(jì)時(shí)還應(yīng)對(duì)動(dòng)態(tài)特性,尤其是快速性和穩(wěn)定性給予充分重視。為工業(yè)增智

為教育賦能4機(jī)器視覺系統(tǒng)的應(yīng)用場(chǎng)景4.1機(jī)器視覺的應(yīng)用場(chǎng)景機(jī)器視覺技術(shù)概述4.1機(jī)器視覺的應(yīng)用場(chǎng)景機(jī)器視覺的應(yīng)用場(chǎng)景機(jī)器視覺讓機(jī)器擁有了像人一樣的視覺功能,能更好地實(shí)現(xiàn)各種檢測(cè)、測(cè)量、識(shí)別和判斷

功能。隨著各類技術(shù)的不斷完善,機(jī)器視覺下游應(yīng)用領(lǐng)域也不斷拓寬,從最開始主要用于

電子裝配檢測(cè),已發(fā)展到在識(shí)別、檢測(cè)、測(cè)量和機(jī)械手定位等越來越廣泛的工業(yè)應(yīng)用領(lǐng)域。速度快、信息量大、功能多也日益成為機(jī)器視覺技術(shù)的主要特點(diǎn)。為工業(yè)增智

為教育賦能4.1機(jī)器視覺的應(yīng)用場(chǎng)景機(jī)器視覺可說是工業(yè)自動(dòng)化系統(tǒng)的靈魂之窗,從物件/條碼辨識(shí)、產(chǎn)品檢測(cè)、外觀尺寸量測(cè)到機(jī)械手臂/傳動(dòng)設(shè)備定位,都是機(jī)器視覺技術(shù)可以發(fā)揮的舞臺(tái),因此它的應(yīng)用范圍十分廣泛,行業(yè)應(yīng)用領(lǐng)域更是多到令人眼花繚亂機(jī)器視覺的應(yīng)用場(chǎng)景圖像識(shí)別應(yīng)用圖像檢測(cè)應(yīng)用視覺定位應(yīng)用物體測(cè)量應(yīng)用物體分揀應(yīng)用為工業(yè)增智

為教育賦能4.1機(jī)器視覺的應(yīng)用場(chǎng)景1

PCB板錫膏缺陷檢測(cè)視覺系統(tǒng)檢測(cè)PCB板上錫膏點(diǎn)面積大小,每一塊PCB板上大概有400個(gè)錫膏點(diǎn),在

涂錫后會(huì)有大小、位置上的缺陷。此工位若使用目檢的話會(huì)對(duì)效率、準(zhǔn)確率有極大影響。因此在這過程中使用了視覺系統(tǒng)進(jìn)行檢測(cè)。該案例視覺系統(tǒng)軟件采用定制開發(fā),功能強(qiáng)大,包含數(shù)據(jù)庫系統(tǒng),用戶分級(jí)管理,一鍵換型,圖像拼接等功能,識(shí)別準(zhǔn)確率達(dá)99.99%以上。為工業(yè)增智

為教育賦能4.1機(jī)器視覺的應(yīng)用場(chǎng)景2電阻缺陷檢測(cè)電阻生產(chǎn)過程中會(huì)生成一些缺陷,包括絲印字符缺陷,電極寬度,高度不符合要求以及臟污等。此類型視覺檢測(cè)方案可擴(kuò)展應(yīng)用于電感、電容等被動(dòng)元器件的測(cè)包機(jī)、封裝機(jī)的缺陷檢測(cè)應(yīng)用。為工業(yè)增智

為教育賦能4.1機(jī)器視覺的應(yīng)用場(chǎng)景3牛奶包裝識(shí)別乳制品行業(yè)一般應(yīng)用油墨形式來進(jìn)行生產(chǎn)標(biāo)簽的噴印。噴碼機(jī)會(huì)經(jīng)常進(jìn)行清洗更換,導(dǎo)致每次噴印的字符大小、形態(tài)、位置會(huì)發(fā)生變化。字符位置的波動(dòng)會(huì)導(dǎo)致字符打印在包裝線、黑色噴碼區(qū)域框上,傳統(tǒng)方式難以適應(yīng)包裝線的影響,因此引用深度學(xué)習(xí)的方式來解決行業(yè)難題。難點(diǎn):點(diǎn)陣字符(傳統(tǒng)方式難以分割準(zhǔn)確),較高的識(shí)別率要求(99.95%),字符大小、形態(tài)、位置會(huì)發(fā)生變化,包裝線、噴碼區(qū)域框的影響。為工業(yè)增智

為教育賦能4.1機(jī)器視覺的應(yīng)用場(chǎng)景4太陽能電池片定位與檢測(cè)太陽能電池片的質(zhì)量是影響太陽能電池組件發(fā)電效率的主要因素之一,所以加強(qiáng)對(duì)太陽能電池片質(zhì)量的檢測(cè)是生產(chǎn)中一個(gè)必不可少的環(huán)節(jié)。太陽能電池片在多個(gè)生產(chǎn)環(huán)節(jié)都需要定位電池片,用于抓取電池片進(jìn)行上下料、再加工等工序。同時(shí)還要檢測(cè)是否存在崩邊破角等現(xiàn)象,有些環(huán)節(jié)還需要測(cè)量柵線的尺寸或檢測(cè)是否存在露白等。為工業(yè)增智

為教育賦能機(jī)器視覺系統(tǒng)是通過機(jī)器視覺產(chǎn)品(即圖像攝取裝置)將被攝取目標(biāo)轉(zhuǎn)換成圖像信號(hào),傳送給專用的圖像處理系統(tǒng),得到被攝目標(biāo)的形態(tài)信息,根據(jù)像素分布的亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號(hào)。圖像系統(tǒng)對(duì)這些信號(hào)進(jìn)行各種運(yùn)算來抽取目標(biāo)的特征,進(jìn)而根據(jù)判別的結(jié)果來控制現(xiàn)場(chǎng)的設(shè)備動(dòng)作。簡單說來,機(jī)器視覺就是用機(jī)器代替人眼來做測(cè)量和判斷。機(jī)器視覺是一項(xiàng)綜合性的技術(shù),綜合了光學(xué),機(jī)械,電子,計(jì)算機(jī)軟硬件等方面的技術(shù)。一個(gè)典型的機(jī)器視覺系統(tǒng)包括以下產(chǎn)品:相機(jī)、光源、圖像采集卡/視覺處理器板、獨(dú)立于硬件產(chǎn)品的視覺軟件、接口和線纜和其他視覺配件。機(jī)器視覺讓機(jī)器擁有了像人一樣的視覺功能,能更好地實(shí)現(xiàn)各種檢測(cè)、測(cè)量、識(shí)別和判斷功能。隨著各類技術(shù)的不斷完善,機(jī)器視覺下游應(yīng)用領(lǐng)域也不斷拓寬,從最開始主要用于電子裝配檢測(cè),已發(fā)展到在識(shí)別、檢測(cè)、測(cè)量和機(jī)械手定位等越來越廣泛的工業(yè)應(yīng)用領(lǐng)域。速度快、信息量大、功能多也日益成為機(jī)器視覺技術(shù)的主要特點(diǎn)。為工業(yè)增智

為教育賦能機(jī)器視覺技術(shù)概述1、機(jī)器視覺是一項(xiàng)綜合技術(shù)包括

、機(jī)械工程技術(shù)、

、電光源照明、光學(xué)成像、傳感器、

等。2、相對(duì)人類視覺,機(jī)器視覺在

、

、

、

等方面都存在顯著優(yōu)勢(shì),特別在

下或

下。3、機(jī)器視覺是機(jī)器人

的前提,能夠?qū)崿F(xiàn)計(jì)算機(jī)系統(tǒng)對(duì)于外界環(huán)境的

以及

等功能,對(duì)于

的發(fā)展具有極其重要的作用。4、從原理上機(jī)器視覺系統(tǒng)主要由三部分組成:

、

、

。5、—個(gè)典型的機(jī)器視覺系統(tǒng)應(yīng)該包括

、

、圖像數(shù)字化模塊、

、智能判斷決策模塊和機(jī)械控制執(zhí)行模塊。6、機(jī)器視覺是一項(xiàng)綜合技術(shù)。其中包括

、機(jī)械工程技術(shù)、控制技術(shù)、

、光學(xué)成像技術(shù)、

、模擬與數(shù)字視頻技術(shù)、計(jì)算機(jī)軟硬件技術(shù)、人機(jī)接口技術(shù)等。機(jī)器視覺概述第2章數(shù)字圖像處理基礎(chǔ)知識(shí)目標(biāo)掌握數(shù)字圖像處理技術(shù)相關(guān)名詞術(shù)語掌握?qǐng)D像采樣、量化、增強(qiáng)等處理技術(shù)的常見方法熟悉數(shù)字圖像處理相關(guān)的數(shù)學(xué)模型與公式技能目標(biāo)能夠理解和掌握數(shù)字圖像處理的主要技術(shù)和相應(yīng)處理方法能夠掌握一般圖像處理的數(shù)學(xué)方程計(jì)算方法與思路能夠基于Matlab工具進(jìn)行圖像的簡單處理數(shù)字圖像處理基礎(chǔ)為工業(yè)增智

為教育賦能圖像的感知和獲取圖像的采樣和量化項(xiàng)目1

數(shù)字圖像處理概述項(xiàng)目2項(xiàng)目3項(xiàng)目4

空間域圖像處理項(xiàng)目5

頻域圖像處理項(xiàng)目6

彩色圖像處理項(xiàng)目7

形態(tài)學(xué)圖像處理為工業(yè)增智

為教育賦能機(jī)器視覺技術(shù)概述1數(shù)字圖像處理概述1.11.31.51.41.2為工業(yè)增智

為教育賦能圖像的概念技術(shù)發(fā)展趨勢(shì)數(shù)字圖像與數(shù)字圖像處理圖像分析和圖像理解數(shù)字圖像處理系統(tǒng)及其主要研究內(nèi)容數(shù)字圖像處理基礎(chǔ)1.1圖像的概念“圖”是物體投射或反射光的分布,“像”是人的視覺系統(tǒng)對(duì)圖的接受在大腦中形成的印象或反映。是客觀和主觀的結(jié)合。1圖像的概念為工業(yè)增智

為教育賦能1.2數(shù)字圖像與數(shù)字圖像處理1數(shù)字圖像數(shù)字圖像是指由被稱作像素的小塊區(qū)域組成的二維矩陣。將物理圖象行列劃分后,每個(gè)小塊區(qū)域稱為像素(pixel)。每個(gè)像素包括兩個(gè)屬性:位置和灰度。對(duì)于單色即灰度圖像而言,每個(gè)象素的亮度用一個(gè)數(shù)值來表示,通常數(shù)值范圍在0到255之間,即可用一個(gè)字節(jié)來表示,0表示黑、255表示白,而其它表示灰度級(jí)別。為工業(yè)增智

為教育賦能1.2數(shù)字圖像與數(shù)字圖像處理彩色圖象可以用紅、綠、藍(lán)三元組的二維矩陣來表示。通常,三元組的每個(gè)數(shù)值也是在0到255之間,0表示相應(yīng)的基色在該象素中取得最小值,而255則代表相應(yīng)的基色在該象素中

取得最大值,這種情況下每個(gè)象素可用三個(gè)字節(jié)來表示。為工業(yè)增智

為教育賦能1.2數(shù)字圖像與數(shù)字圖像處理數(shù)字圖像處理就是利用計(jì)算機(jī)系統(tǒng)對(duì)數(shù)字圖像進(jìn)行各種目的的處理:對(duì)連續(xù)圖像f(x,y)進(jìn)行數(shù)字化:空間上,圖像抽樣;幅度上,灰度級(jí)量化。x方向,抽樣M行。y方向,每行

抽樣N點(diǎn)。整個(gè)圖像共抽樣M×N個(gè)像素點(diǎn),一般取M=N=2n=64,128,256,512,1024,2048。數(shù)字圖像常用矩陣來表示:f(i,j)=0~255,灰度級(jí)為256,設(shè)灰度量化為

8bit。1數(shù)字圖像處理為工業(yè)增智

為教育賦能1.3圖像分析和圖像理解圖像分析是指對(duì)圖像中感興趣的目標(biāo)進(jìn)行提取和分割,獲得目標(biāo)的客觀信息(特點(diǎn)或性質(zhì)),建立對(duì)圖像的描述。圖像分析一般利用數(shù)學(xué)模型并結(jié)合圖像處理的技術(shù)來分析底層特征和上層結(jié)構(gòu),從而提取具有一定智能性的信息。圖像分析是一個(gè)從圖像到數(shù)據(jù)的過程。1圖像分析為工業(yè)增智

為教育賦能1.3圖像分析和圖像理解圖像理解是指研究圖像中各目標(biāo)的性質(zhì)和它們之間的相互聯(lián)系,得出對(duì)圖像內(nèi)容含義的理解及原來客觀場(chǎng)景的解釋。圖像理解以客觀世界為中心,借助知識(shí)、經(jīng)驗(yàn)來推理、認(rèn)識(shí)客觀世界,屬于高層操作(符號(hào)運(yùn)算)。2圖像理解為工業(yè)增智

為教育賦能1.4數(shù)字圖像處理系統(tǒng)及其主要研究內(nèi)容1數(shù)字處理系統(tǒng)數(shù)字圖象處理系統(tǒng)由圖象數(shù)字化設(shè)備、圖象處理計(jì)算機(jī)和圖象輸出設(shè)備組成。輸入及數(shù)字化設(shè)備:攝象機(jī)、鼓式掃描器、平臺(tái)式光密度計(jì)、視頻卡、掃描儀、數(shù)碼相機(jī)、

DV等。顯示及記錄設(shè)備:圖象顯示器、鼓式掃描器、圖象拷貝機(jī)、繪圖儀、激光打印機(jī)、噴墨打印機(jī)等。為工業(yè)增智

為教育賦能1.4數(shù)字圖像處理系統(tǒng)及其主要研究內(nèi)容(2)圖像壓縮編碼圖像壓縮編碼技術(shù)可以減少描述圖像的數(shù)據(jù)量,以便節(jié)約圖像存儲(chǔ)的空間,減少圖像的傳輸和處理時(shí)間。圖像壓縮有無損壓縮和有損壓縮兩種方式,編碼是壓縮技術(shù)中最重要的方法,在圖像處理技術(shù)中是發(fā)展最早和應(yīng)用最成熟的技術(shù)。主要方法:熵編碼,預(yù)測(cè)編碼,變換編碼,二值圖像編碼、分形編碼2數(shù)字處理系統(tǒng)只要研究內(nèi)容圖像變換圖像變換方法主要包含:傅立葉變換/沃爾什變換/離散余弦變換/小波變換,采用各種圖像變換方法對(duì)圖像進(jìn)行間接處理,有利于減少計(jì)算量并進(jìn)一步獲得更有效的處理。為工業(yè)增智

為教育賦能1.4數(shù)字圖像處理系統(tǒng)及其主要研究內(nèi)容圖像的增強(qiáng)和復(fù)原圖像增強(qiáng)和復(fù)原的目的是為了改善圖像的視覺效果,如去除圖像噪聲,提高圖像的清晰度等。圖像增強(qiáng)不考慮圖像降質(zhì)的原因,突出圖像中感興趣的部分。圖像復(fù)原要求對(duì)圖像降質(zhì)的原因有所了解,根據(jù)圖像降質(zhì)過程建立“退化模型”,然后采用濾波的方法重建或恢復(fù)原來的圖像。主要方法:灰度修正、平滑、幾何校正、圖像銳化、濾波增強(qiáng)、維納濾波圖像分割圖像分割是數(shù)字圖像處理中的關(guān)鍵技術(shù)之一。圖像分割將圖像中有意義的特征(物體的邊緣、區(qū)域)提取出來,它是進(jìn)行進(jìn)一步圖像識(shí)別、分析和圖像理解的基礎(chǔ)。雖然目前已研究出了不少邊緣提取、區(qū)域分割的方法,但還沒有一種普遍適用于各種圖像

的有效方法。對(duì)圖像分割的研究還在不斷的深入中,是目前圖像處理研究的熱點(diǎn)方向之一。主要方法:圖像邊緣檢測(cè)、灰度閾值分割、基于紋理分割、區(qū)域增長為工業(yè)增智

為教育賦能1.4數(shù)字圖像處理系統(tǒng)及其主要研究內(nèi)容圖像描述圖像描述是圖像分析和理解的必要前提。圖像描述是用一組數(shù)字或符號(hào)(描述子)來表征圖像中被描述物體的某些特征。主要方法:二值圖像的幾何特征、簡單描述子、形狀數(shù)、傅立葉描述子,紋理描述圖像識(shí)別圖像識(shí)別是人工智能的一個(gè)重要領(lǐng)域,是圖像處理的最高境界。一副完整的圖像經(jīng)預(yù)處理、分割和描述提取有效特征之后,進(jìn)而由計(jì)算機(jī)系統(tǒng)對(duì)圖像加以判決分類。圖像隱藏圖像隱藏是指將秘密信息隱藏在圖像格式文件中,使其在貌似正常的圖像文件的掩飾下,達(dá)到秘密信息的保存和傳遞。常見的方法有數(shù)字水印、圖像的信息偽裝等。為工業(yè)增智

為教育賦能1.5技術(shù)發(fā)展趨勢(shì)(1)結(jié)合網(wǎng)絡(luò)和Internet技術(shù)需求而發(fā)展起來的新技術(shù),比如網(wǎng)上圖像、視頻的傳輸、點(diǎn)播和新的瀏覽、查詢手段。(2)高級(jí)圖像處理技術(shù),結(jié)合最新的數(shù)學(xué)進(jìn)展,諸如小波、分形、形態(tài)學(xué)等技術(shù)。(3)智能化,圖象自動(dòng)分析、識(shí)別與理解。技術(shù)發(fā)展趨勢(shì)為工業(yè)增智

為教育賦能2圖像的感知和獲取2.1為工業(yè)增智

為教育賦能圖像的感知和獲取數(shù)字圖像處理基礎(chǔ)2.1圖像的感知和獲取圖像感知和獲取人類感知只限于電磁波譜的視覺波段,成像機(jī)器則可以覆蓋幾乎全部電磁波譜。各類圖像都是由“照射”源和形成圖像的“場(chǎng)景”元素對(duì)光能的反射或吸收相結(jié)合而產(chǎn)生的。人眼看到室外綠色的四葉草:太陽就是“照射源”,它是發(fā)光體。四葉草就是“場(chǎng)景元素”,它是吸收+反光體。之所以人眼看到四葉草是綠色的,是因?yàn)樗哑渌搜劭刹蹲降念l率電磁波都吸收了,只有綠光譜被它反射了。為工業(yè)增智

為教育賦能2.1圖像的感知和獲取第一張倫琴射線照片:陰極射線管就是“照射源”,他是X射線的發(fā)射體。倫琴夫人的手就是“場(chǎng)景元素”,它是吸收體。X射線穿過手組織,打到了感光底片上。手掌中的骨骼和其他組織對(duì)X射線的吸收率不同,導(dǎo)致最終到達(dá)感光底片的X射線的量不同形成圖像。為工業(yè)增智

為教育賦能2.1圖像的感知和獲取拋開“照射源”和“場(chǎng)景元素”,還有一個(gè)重要的感知元素,獲取圖像的傳感器。如上面兩個(gè)例子中,圖像傳感器分別是人眼和感光膠片。圖像傳感器,或稱感光元件,通過將輸入的電能和對(duì)特殊能源敏感的傳感器材料相結(jié)合,把輸入能源變成電壓。輸出電壓波形是傳感器的響應(yīng),通過把傳感器響應(yīng)數(shù)字化,從每一個(gè)傳感器得到一個(gè)數(shù)字量。簡單理解就是可以把輸入的模擬能量轉(zhuǎn)化成數(shù)字信號(hào)的裝備,這里面有兩個(gè)步驟。光(輸入能量)<->傳感器(光電轉(zhuǎn)換)<->AD轉(zhuǎn)換(采樣、量化)。為工業(yè)增智

為教育賦能2.1圖像的感知和獲取圖像傳感器的結(jié)構(gòu)主要有有CCD與CMOS兩種,CCD是“電荷耦合器件”(ChargeCoupled

Device)的簡稱,而CMOS是“互補(bǔ)金屬氧化物半導(dǎo)體”(ComplementaryMetal

Oxide

Semiconductor)的簡稱。其基本差異為像素單元的電荷讀取方式不同。CCD光電成像器件存貯的電荷信息,需要在二相或三相或四相時(shí)鐘驅(qū)動(dòng)脈沖的控制下,一位一位地實(shí)施轉(zhuǎn)移后逐行順序讀取。而CMOS光電成像器件的光學(xué)圖像信息經(jīng)光電轉(zhuǎn)換后產(chǎn)生電流或電壓信號(hào),這個(gè)電信號(hào)不需要像CCD那樣逐行讀取,而是從CMOS晶體管開關(guān)

陣列中直接讀取的,可增加取像的靈活性。而CCD絕無此功能。CCD直接讀取為工業(yè)增智

為教育賦能CMOS轉(zhuǎn)換后讀取2.1圖像的感知和獲取為工業(yè)增智

為教育賦能CCD需在同步信號(hào)控制下由三組不同的電源相配合才能輸出和轉(zhuǎn)移電荷信息,整個(gè)電路較為復(fù)雜而且速度較慢。而CMOS傳感器經(jīng)光電轉(zhuǎn)換后直接產(chǎn)生電流(或電壓)信號(hào),信號(hào)讀取十分簡單,還能同時(shí)處理各單元的圖像信息,速度也比CCD快很多。CCD制作技術(shù)起步早,技術(shù)成熟,采用PN結(jié)構(gòu)或二氧化硅(SiO2)隔離層隔離噪聲,成像質(zhì)量相對(duì)

CMOS有一定優(yōu)勢(shì)。由于CMOS集成度高,各光電傳感元件、電路之間距離很近,相互之間的光、電、磁干擾較嚴(yán)重,噪聲對(duì)圖像質(zhì)量影響很大。近幾年,隨著CMOS電路消噪技術(shù)的不斷發(fā)展,CMOS的性能已經(jīng)可以與CCD媲美了。3圖像的采樣和量化3.1圖像采樣3.2圖像采樣分類3.3圖像插值算法3.4圖像的量化為工業(yè)增智

為教育賦能數(shù)字圖像處理基礎(chǔ)3.1圖像的采樣圖像的采樣在取樣時(shí),若橫向的像素?cái)?shù)(列數(shù))為M,縱向的像素?cái)?shù)(行數(shù))為N,則圖像總像素?cái)?shù)為M*N個(gè)像素。一般來說,采樣間隔越大,所得圖像像素?cái)?shù)越少,空間分辨率低,質(zhì)量差,嚴(yán)重時(shí)出現(xiàn)馬賽克效應(yīng);采樣間隔越小,所得圖像像素?cái)?shù)越多,空間分辨率高,圖像質(zhì)量好,但數(shù)據(jù)量大。為工業(yè)增智

為教育賦能3.2圖像的采樣分類下采樣縮小圖像(或稱為下采樣(subsampled)或降采樣(downsampled))的主要目的有兩個(gè):一個(gè)是使得圖像符合顯示區(qū)域的大小;另一個(gè)是生成對(duì)應(yīng)圖像的縮略圖。下采樣原理:對(duì)于一幅圖像P尺寸為M*N,對(duì)其進(jìn)行s倍下采樣,即得到(M/s)*(N/s)尺寸的得分辨率圖像,當(dāng)然s應(yīng)該是M和N的公約數(shù)才行,上述可理解為把原始圖像s*s窗口內(nèi)的圖像或者s2個(gè)像素點(diǎn)變成一個(gè)像素,這個(gè)像素點(diǎn)的值可以為該窗口內(nèi)所有像素的均值或最大值或隨機(jī)值等。對(duì)應(yīng)卷積網(wǎng)絡(luò)提取技術(shù)中的平均值采樣(mean-pooling),最大值采樣(max-pooling),隨機(jī)區(qū)域采樣和區(qū)域采樣等方法。為工業(yè)增智

為教育賦能3.2圖像的采樣分類(2)上采樣放大圖像(或稱為上采樣(upsampling)或圖像插值(interpolating))的主要目的是放大原圖像,從而可以顯示在更高分辨率的顯示設(shè)備上。對(duì)圖像的縮放操作并不能帶來更多關(guān)于該圖像的信息,因此圖像的質(zhì)量將不可避免地受到影響。然而,確實(shí)有一些縮放方法能夠增加圖像的信息,從而使得縮放后的圖像質(zhì)量超過原圖質(zhì)量的。上采樣原理:圖像放大幾乎都是采用內(nèi)插值方法,即在原有圖像像素的基礎(chǔ)上在像素點(diǎn)之間采用合適的插值算法插入新的元素。為工業(yè)增智

為教育賦能3.3圖像的插值算法1傳統(tǒng)插值算法鄰插值較簡單,容易實(shí)現(xiàn),早期的時(shí)候應(yīng)用比較普遍。但是,該方法會(huì)在新圖像中產(chǎn)生明顯的鋸齒邊緣和馬賽克現(xiàn)象。雙線性插值法具有平滑功能,能有效地克服鄰法的不足,但會(huì)退化圖像的高頻部分,使圖像細(xì)節(jié)變模糊。在放大倍數(shù)比較高時(shí),高階插值,如雙三次和三次樣條插值等比低階插值效果好。這些插值算法可以使插值生成的像素灰度值延續(xù)原圖像灰度變化的連續(xù)性,從而使放大圖像濃淡變化自然平滑。但是在圖像中,有些像素與相鄰像素間灰度值存在突變,即存在灰度不連續(xù)性。這些具有灰度值突變的像素就是圖像中描述對(duì)象的輪廓或紋理圖像的邊緣像素。在圖像放大中,對(duì)這些具有不連續(xù)灰度特性的像素,如果采用常規(guī)的插值算法生成新增加的像素,勢(shì)必會(huì)使放大圖像的輪廓和紋理模糊,降低圖像質(zhì)量。為工業(yè)增智

為教育賦能3.3圖像的插值算法2基于邊緣的圖像插值算法為了克服傳統(tǒng)方法的不足,提出了許多邊緣保護(hù)的插值方法,對(duì)插值圖像的邊緣有一定的

增強(qiáng),使得圖像的視覺效果更好,邊緣保護(hù)的插值方法可以分為兩類:基于原始低分辨圖

像邊緣的方法和基于插值后高分辨率圖像邊緣的方法?;谠嫉头直媛蕡D像邊緣的方法。首先,檢測(cè)低分辨率圖像的邊緣,然后根據(jù)檢測(cè)的邊緣將像素分類處理,對(duì)于平坦區(qū)域的

像素,采用傳統(tǒng)方法插值;對(duì)于邊緣區(qū)域的像素,設(shè)計(jì)特殊插值方法,以達(dá)到保持邊緣細(xì)

節(jié)的目的。其次,基于插值后高分辨率圖像邊緣的方法這類插值方法:首先采用傳統(tǒng)方法

插值低分辨率圖像,然后檢測(cè)高分辨率圖像的邊緣,最后對(duì)邊緣及附近像素進(jìn)行特殊處理,以去除模糊,增強(qiáng)圖像的邊緣。為工業(yè)增智

為教育賦能3.3圖像的插值算法3基于區(qū)域的圖像插值算法首先將原始低分辨率圖像分割成不同區(qū)域,然后將插值點(diǎn)映射到低分辨率圖像,判斷其所屬區(qū)域,最后根據(jù)插值點(diǎn)的鄰域像素設(shè)計(jì)不同的插值公式,計(jì)算插值點(diǎn)的值。為工業(yè)增智

為教育賦能3.4圖像的量化圖像的量化量化就是把采樣點(diǎn)上對(duì)應(yīng)的亮度連續(xù)變化區(qū)間轉(zhuǎn)換為單個(gè)特定數(shù)碼的過程。量化后,圖像就被表示成一個(gè)整數(shù)矩陣。每個(gè)像素具有兩個(gè)屬性:位置和灰度。位置由行、列表示?;叶缺硎驹撓袼匚恢蒙狭涟党潭鹊恼麛?shù)。此數(shù)字矩陣M×N就作為計(jì)算機(jī)處理的對(duì)象了?;叶燃?jí)一般為0-255(8bit量化)。為工業(yè)增智

為教育賦能3.4圖像的量化在現(xiàn)實(shí)生活中,采集到的圖像都需要經(jīng)過離散化變成數(shù)字圖像后才能被計(jì)算機(jī)識(shí)別和處理。為工業(yè)增智

為教育賦能3.4圖像的量化圖像空間分辨率(采樣)N:隨著空間分辨率的下降圖像會(huì)出現(xiàn)馬賽克效果。圖像幅度分辨率(灰度級(jí))k:隨著幅度分辨率的下降會(huì)出現(xiàn)“虛假輪廓效應(yīng)”。一般出現(xiàn)在過渡比較平滑的區(qū)域。(1)圖像質(zhì)量一般隨N和k的增加而增加。在極少情況下對(duì)固定的N,減少k能改進(jìn)質(zhì)量。最有可能是減少k??稍黾訄D像看起來的反差(對(duì)比度增加)——二值化處理。(2)對(duì)具有大量細(xì)節(jié)的圖像常只需很少的灰度級(jí)數(shù)就可較好地表示——人眼分辨率能力有限。(3)b(存儲(chǔ)一幅圖像所需的位數(shù)bit:b=

M

x

N

x

k)為常數(shù)的一系列圖像主觀看起

來可以有較大的差異——采樣和灰度級(jí)之間存在某種合理的分配。為工業(yè)增智

為教育賦能4空間域圖像處理4.1空間域的概念4.2空間域?yàn)V波4.3常見的灰度變換4.4直方圖為工業(yè)增智

為教育賦能數(shù)字圖像處理基礎(chǔ)4.1空間域的概念空間域的概念“空間域”指圖像平面本身,即:圖像中的每個(gè)像素單元。“空間域”主要是為了區(qū)別于

“變換域”,“變換域”是將圖像轉(zhuǎn)換到其他的域(如頻率域),在變換域做完處理之后再通過反變換的方式轉(zhuǎn)換回來。“空間域”圖像處理主要包括“灰度變換”和“空間域?yàn)V波”。濾波名詞出自于信號(hào)系統(tǒng),從圖像來說,圖像是二維數(shù)據(jù),二維數(shù)據(jù)傳輸?shù)臅r(shí)候是逐行傳輸?shù)?,?duì)應(yīng)于信號(hào)處理,就是一個(gè)連續(xù)的波形,對(duì)波形做一些處理,按預(yù)期過濾掉波形中的某些成分,所以形象地表示為“濾波”。所謂濾波就是對(duì)圖像進(jìn)行處理,比如:降噪,平滑等操作。為工業(yè)增智

為教育賦能4.2空間域?yàn)V波空間域?yàn)V波空間域?yàn)V波就是在圖像平面上對(duì)像素進(jìn)行操作??臻g域?yàn)V波大體分為兩類:平滑濾波、銳化濾波。平滑濾波:模糊處理,用于減小噪聲,實(shí)際上是低通濾波,典型的濾波器是高斯濾波。銳化濾波:提取邊緣突出邊緣及細(xì)節(jié)、彌補(bǔ)平滑濾波造成的邊緣模糊。實(shí)際上是高通濾波。空間域處理可由下式表示:g

(

x

,

y

)

=

T

[

f

(

x

,

y

)

]式中,f(x,y)是輸入圖像,g(x,y)是處理后的圖像,T是在點(diǎn)(x,y)的鄰域上定義的關(guān)于f的一種算子,算子可應(yīng)用于單幅圖像或圖像集合。為工業(yè)增智

為教育賦能4.2空間域?yàn)V波空間濾波器由一個(gè)鄰域(通常是一個(gè)較小的矩形)和對(duì)該鄰域所包圍圖像像素執(zhí)行的預(yù)定義操作組成。濾波產(chǎn)生一個(gè)新像素,新像素的坐標(biāo)等于鄰域中心的坐標(biāo),像素的值是濾波操作的結(jié)果。濾波器的中心訪問輸入圖像中的每個(gè)像素后,就生成了出了(濾波)后的圖像。如果在圖像像素上執(zhí)行的是線性操作,則該濾波器稱為線性空間濾波器,否則,濾波器就稱為非線性空間濾波器。一般來說,使用大小為m×n的濾波器對(duì)大小為M×N的圖像進(jìn)行線性空間濾波,可由下式表示:為工業(yè)增智

為教育賦能4.2空間域?yàn)V波式中,x和y是可變的,以便w中的每個(gè)像素可訪問f中的每個(gè)像素。如圖所示,使用大小為3×3的濾波器模板的線性空間濾波過程。表示濾波器模板系數(shù)的坐標(biāo)所選擇的形式簡化了線性濾波的表達(dá)式。為工業(yè)增智

為教育賦能4.3常見的灰度變換1圖像翻轉(zhuǎn)使用這種方式反轉(zhuǎn)一副圖像的灰度級(jí),可得到等效的照片底片。為工業(yè)增智

為教育賦能4.3常見的灰度變換反對(duì)數(shù)變換的形式為式中c是常數(shù),并假設(shè)r≥0。圖中對(duì)數(shù)曲線的形狀表明,該變換將輸入中范圍較窄的低灰度值映射為輸出中范圍較寬的灰度值,或?qū)⑤斎胫蟹秶^寬的高灰度值映射為輸出中范圍較窄的灰度值。2對(duì)數(shù)變換對(duì)數(shù)變換的通用形式為為工業(yè)增智

為教育賦能4.3常見的灰度變換由于對(duì)數(shù)本身上凸的性質(zhì),它可以把低灰度(較暗)部分的亮度提高,v越大,灰度提高越明顯,即圖像越來越亮。為工業(yè)增智

為教育賦能4.3常見的灰度變換式中c和γ為正常數(shù)。Gamma變換其實(shí)就是冪指數(shù)校正,目的是將灰度較窄的區(qū)域拉伸為較寬的區(qū)域。3

Gamma變換Gamma變換的基本形式為為工業(yè)增智

為教育賦能4.3常見的灰度變換4直方圖直方圖,是圖像的一個(gè)信息,就是將像素的分布以圖的形式展現(xiàn)出來,即每一個(gè)灰度級(jí)別有多少個(gè)像素值。比如,一幅圖像有100個(gè)灰度為200的點(diǎn),那么在灰度為200的直方圖的值就為100。將每一個(gè)灰度值所包含的點(diǎn)集進(jìn)行加和就得到了直方圖。直方圖均衡化的原理就是將本來分布較為分散的灰度值進(jìn)行均勻化,使每個(gè)級(jí)別的像素所含有基本的像素點(diǎn)。處理前為工業(yè)增智

為教育賦能處理后4.3常見的灰度變換下圖是做均衡化前后的Lena圖像的對(duì)比,可以看出圖像清晰了很多處理前為工業(yè)增智

為教育賦能處理后4.3常見的灰度變換此外,直方圖還用在圖像識(shí)別領(lǐng)域中,它表示了圖像的一定的信息。比如相同大小圖像的一個(gè)十字和一個(gè)圓圓的直方圖十字的直方圖此外,直方圖還用在圖像識(shí)別領(lǐng)域中,它表示了圖像的一定的信息。比如相同大小圖像的一個(gè)十字和一個(gè)圓為工業(yè)增智

為教育賦能5頻域圖像處理5.1頻域處理5.2二維傅里葉變換5.3卷積相關(guān)知識(shí)介紹為工業(yè)增智

為教育賦能數(shù)字圖像處理基礎(chǔ)5.1頻域處理頻域處理頻域處理是指根據(jù)一定的圖像模型,對(duì)圖像頻譜進(jìn)行不同程度修改的技術(shù),通常作如下假設(shè):(1)引起圖像質(zhì)量下降的噪聲占頻譜的高頻段;(2)圖像邊緣占高頻段;(3)圖像主體或灰度緩變區(qū)域占低頻段?;谶@些假設(shè),可以在頻譜的各個(gè)頻段進(jìn)行有選擇性的修改。為工業(yè)增智

為教育賦能5.1頻域處理在頻率域研究圖像增強(qiáng)的考慮:(1)可以利用頻率成分和圖像外表之間的對(duì)應(yīng)關(guān)系。一些在空間域表述困難的增強(qiáng)任務(wù),在頻率域中變得非常普通。(2)濾波在頻率域更為直觀,它可以解釋空間域?yàn)V波的某些性質(zhì)。(3)可以在頻率域指定濾波器,做反變換,然后在空間域使用結(jié)果濾波器作為空間域?yàn)V波器的指導(dǎo)。(4)一旦通過頻率域試驗(yàn)選擇了空間濾波,通常實(shí)施都在空間域進(jìn)行。為工業(yè)增智

為教育賦能5.2二維傅里葉變換二維傅里葉變換由于圖像的頻率是表征圖像中灰度變化劇烈程度的指標(biāo),是灰度在平面空間上的梯度。傅

立葉變換在實(shí)際中的物理意義,設(shè)f是一個(gè)能量有限的模擬信號(hào),則其傅立葉變換就表示f的譜。從純粹的數(shù)學(xué)意義上看,傅立葉變換是將一個(gè)函數(shù)轉(zhuǎn)換為一系列周期函數(shù)來處理的。從物理效果看,傅立葉變換是將圖像從空間域轉(zhuǎn)換到頻率域,其逆變換是將圖像從頻率域轉(zhuǎn)換到空間域。換句話說,傅立葉變換的物理意義是將圖像的灰度分布函數(shù)變換為圖像的頻率分布函數(shù),傅立葉逆變換是將圖像的頻率分布函數(shù)變換為灰度分布函數(shù)。為工業(yè)增智

為教育賦能5.2二維傅里葉變換(1)二維連續(xù)傅里葉變換如果二維連續(xù)函數(shù)f(x,y)滿足狄里赫萊條件,則將有下面的傅立葉變換對(duì)存在:為工業(yè)增智

為教育賦能5.2二維傅里葉變換與一維傅立葉變換類似,二維傅立葉變換的傅立葉譜和相位譜為:式中:F(u,v)是幅度譜;是相位譜;E(u,v)是能量譜。為工業(yè)增智

為教育賦能5.2二維傅里葉變換(2)二維離散傅里葉變換一個(gè)M×N大小的二維函數(shù)f(x,y),其離散傅立葉變換對(duì)為:其中,其中,在數(shù)字圖像處理中,圖像一般取樣為方形矩陣,即N×N,則其傅立葉變換及其逆變?yōu)椋簽楣I(yè)增智

為教育賦能5.2二維傅里葉變換(3)二維離散傅里葉變換的性質(zhì)離散傅里葉變換主要有以下性質(zhì):平移性質(zhì)、分配律、尺度變換(縮放)、旋轉(zhuǎn)性、周期性和共軛對(duì)稱性、平均值、可分性、卷積、相關(guān)性。這里主要簡述周期性。離散傅里葉變換有如下周期性性質(zhì):反變換也是周期性的:頻譜也是關(guān)于原點(diǎn)對(duì)稱的:這些等式的有效性是建立在二維離散傅里葉變換公式基礎(chǔ)上的。圖像的周期性在圖像處理中有非常重要的作用,下面會(huì)在卷積部分繼續(xù)闡述周期性的相關(guān)內(nèi)容。為工業(yè)增智

為教育賦能5.3卷積相關(guān)知識(shí)介紹(2)頻域卷積定理給定兩個(gè)時(shí)間函數(shù):已知:則:即兩個(gè)時(shí)間函數(shù)頻譜的卷積等效于各個(gè)時(shí)間函數(shù)的乘積(乘以系數(shù)1/

)。為工業(yè)增智

為教育賦能6彩色圖像處理6.16.36.56.46.2為工業(yè)增智

為教育賦能彩色基礎(chǔ)彩色平衡及其matlab實(shí)現(xiàn)彩色模型全彩圖像處理基礎(chǔ)彩色補(bǔ)償及其matlab實(shí)現(xiàn)數(shù)字圖像處理基礎(chǔ)6.1色彩基礎(chǔ)色彩基礎(chǔ)彩色定義:彩色是物體的一種屬性,他依賴于以下三個(gè)方面的因素。(1)光源——照射光的譜性質(zhì)或譜能量分布(2)物體——被照射物體的反射性質(zhì)(3)成像接收器(眼睛或成像傳感器)——光譜能量吸收性質(zhì)為工業(yè)增智

為教育賦能6.2色彩模型1色彩模型分類①彩色模型彩色模型也稱彩色空間或彩色系統(tǒng),是用來精確標(biāo)定和生成各種顏色的一套規(guī)則和定義,它的用途是在某些標(biāo)準(zhǔn)下用通??山邮艿姆绞胶喕噬?guī)范。彩色模型通常可以采用坐標(biāo)系統(tǒng)來描述,而位于系統(tǒng)中的每種顏色都可由坐標(biāo)空間中的單個(gè)點(diǎn)來表示。②RGB模型RGB模型:該模型是工業(yè)界的一種顏色標(biāo)準(zhǔn),是通過對(duì)紅綠藍(lán)三個(gè)顏色亮度的變化以及他們相互之間的疊加來得到各種各樣的顏色的,該標(biāo)準(zhǔn)幾乎包括了人類視覺所能感知的所有顏色,是目前運(yùn)用最廣的顏色模型之一。③CMY模型CMY模型:采用青、品紅、黃色三種基本原色按一定比例合成顏色的方法。由于色彩的顯示不是直接來自于光線的色彩,而是光線被物體吸收掉一部分之后反射回來的剩余光線所產(chǎn)生的,因此CMY模型又稱減色法混合模型為工業(yè)增智

為教育賦能6.2色彩模型④

HSI模型HSI模型:HSI模型是從人的視覺系統(tǒng)出發(fā),直接使用顏色三要素——色調(diào)(hue)、飽和度(Sturation)和亮度(Intensity,有時(shí)也翻譯作密度或灰度)來描述顏色。HSV模型HSV模型:是人們用來從調(diào)色板或顏色輪中挑選顏色(例如顏料、墨水等)所采用的的彩色系統(tǒng)之一。HSV表示色調(diào)、飽和度和數(shù)值。該系統(tǒng)比RGB更接近于人們的經(jīng)驗(yàn)和對(duì)彩色的感知。⑥

YUV模型YUV模型:Y代表亮度、U、V代表色差,是構(gòu)成彩色的兩個(gè)分量。采用YUV模型的一個(gè)主

要優(yōu)勢(shì)是它的亮度信號(hào)Y和色度信號(hào)U、V是分離的。如果只有Y信號(hào)分量而沒有U、V分量,那圖像就是黑白灰度圖。為工業(yè)增智

為教育賦能6.2色彩模型⑦

YIQ模型YIQ模型:是北美NTSC彩色制式,主要用于美國的電視系統(tǒng)。這種形式和歐洲的YUV模式

有相同的優(yōu)勢(shì):灰度信息和彩色信息是分離的。其中亮度表示灰度,而色調(diào)和飽和度則存儲(chǔ)彩色信息。⑧

Lab模型Lab模型:是由CIE(國際照明委員會(huì))制定的一種彩色模式,這種模型與設(shè)備無關(guān),它彌補(bǔ)了RGB模型和CMY模型必須依賴于設(shè)備顏色特性的不足。此外,自然界中任何色彩都可

在Lab空間表達(dá)出來,這就意味著RGB以及CMY所能描述的顏色信息在Lab中都能得以映射。其中L代表亮度;a的整數(shù)代表紅色,負(fù)端代表綠色;b的正數(shù)代表黃色,負(fù)端代表藍(lán)色。為工業(yè)增智

為教育賦能6.2色彩模型2基本屬性亮度是指人感覺光的明暗程度。光的能量越大,亮度越大。色調(diào)是彩色最重要的屬性,決定顏色的本質(zhì),由物體反射光線中占優(yōu)勢(shì)的波長來決定,不同的波長產(chǎn)生不同的顏色感覺。飽和度是指顏色的深淺和濃淡程度,飽和度越高,顏色越深。飽和度的深淺和白色的比例有關(guān),白色比例越多,飽和度越低。為工業(yè)增智

為教育賦能6.2色彩模型3模型之間的轉(zhuǎn)換①

RGB與CMY之間的轉(zhuǎn)換:在matlab中可以通過imcomplement()函數(shù)方便的實(shí)現(xiàn)

RGB和CMY之間的相互轉(zhuǎn)換。cmy=imcomplement(rgb);rgb=imcomplement(cmy);②

從RGB到HSI的彩色轉(zhuǎn)換及其實(shí)現(xiàn)。figure;subplot(1,2,1);rgb=imread('plane.bmp’);imshow(rgb);title('rgb’);subplot(1,2,2);hsi=rgb2hsi(rgb);imshow(hsi);title('hsi');為工業(yè)增智

為教育賦能6.2色彩模型③

從HSI到RGB的彩色轉(zhuǎn)換及其實(shí)現(xiàn)。figuresubplot(1,2,1);hsi=imread('plane.bmp’);imshow(hsi);title('hsi’);subplot(1,2,2);rgb=hsi2rgb(hsi);imshow(rgb);title('rgb');為工業(yè)增智

為教育賦能6.2色彩模型為工業(yè)增智

為教育賦能④

從RGB到HSV的轉(zhuǎn)換及其實(shí)現(xiàn):輸入的RGB圖像可以是uint8、uint16或double類型的,輸出圖像HSV為M*N*3的double類型。6.3全彩色圖像處理基礎(chǔ)全彩色圖像處理基礎(chǔ)全彩色圖像處理技術(shù)總的可以分為兩大類:(1)對(duì)3個(gè)平面分量單獨(dú)處理,然后將分別處理過的三個(gè)分量合成彩色圖像,對(duì)每個(gè)分量的處理技術(shù)可以應(yīng)用到對(duì)灰度圖像處理的技術(shù)上。(2)直接對(duì)彩色像素進(jìn)行處理。因?yàn)槿噬珗D像至少有3個(gè)分量,彩色像素實(shí)際上是一個(gè)向量,直接處理就是同時(shí)對(duì)所有分量進(jìn)行無差別的處理。為工業(yè)增智

為教育賦能6.4彩色補(bǔ)償及其matlab實(shí)現(xiàn)有些圖像處理任務(wù)的目標(biāo)是根據(jù)顏色分離出不同類型的物體。但由于常用的彩色成像設(shè)備具有較寬且相互覆蓋的光譜敏感區(qū),加之待拍攝圖像的染色是變化的,所以很難再3個(gè)分量圖中將物體分離出來,這種現(xiàn)象稱為顏色擴(kuò)散。彩色補(bǔ)償?shù)淖饔镁褪峭ㄟ^不同的顏色通道提取不同的目標(biāo)物。彩色補(bǔ)償及其matlab實(shí)現(xiàn)演示代碼im=double(imread('plane.bmp'));subplot(1,2,1);imshow(uint8(im));title('原始圖');[m,n,p]=size(im);[h1,k1]=min(255-im(:,:,1)+im(:,:,2)+im(:,:,3));[j1,minx]=min(h1);i1=k1(j1);%提取圖像中最接近紅色的點(diǎn),其在im中的坐標(biāo)為i1,j1r1=im(i1,j1,1);g1=im(i1,j1,2);b1=im(i1,j1,3);R=0.30*r1+0.59*g1+0.11*b1;為工業(yè)增智

為教育賦能6.4彩色補(bǔ)償及其matlab實(shí)現(xiàn)[h2,k2]=min(255-im(:,:,2)+im(:,:,1)+im(:,:,3));[j2,minx]=min(h2);i2=k2(j2);%提取圖像中最接近綠色的點(diǎn),其在im中的坐標(biāo)為i2,j2r2=im(i2,j2,1);g2=im(i2,j2,2);b2=im(i2,j2,3);G=0.30*r2+0.59*g2+0.11*b2;[h3,k3]=min(255-im(:,:,3)+im(:,:,1)+im(:,:,2));[j3,minx]=min(h3);i3=k3(j3);%提取圖像中最接近綠色的點(diǎn),其在im中的坐標(biāo)為i2,j2r3=im(i3,j3,1);g3=im(i3,j3,2);b3=im(i3,j3,3);[B=0.30*r3+0.59*g3+0.11*b3;A1=[r1

r2

r3g1

g2

g3b1

b2

b3];A2=[R

0

00

G

00

0

B];C=A1*inv(A2);for

i=1:mfor

j=1:nimR=im(i,j,1);imG=im(i,j,2);imB=im(i,j,3);temp=inv(C)*[imR;imG;imB];S(i,j,1)=temp(1);S(i,j,2)=temp(2);S(i,j,3)=temp(3);endend為工業(yè)增智

為教育賦能6.4彩色補(bǔ)償及其matlab實(shí)現(xiàn)S=uint8(S);subplot(1,2,2);imshow(S);title('補(bǔ)償后');為工業(yè)增智

為教育賦能6.5彩色平衡及其matlab實(shí)現(xiàn)衡。彩色平衡及其matlab實(shí)現(xiàn)一幅彩色圖像數(shù)字化后,在顯示時(shí)顏色經(jīng)常看起來有些不正常。這是顏色通道的不同敏感度、增光因子和偏移量等原因?qū)е碌?,稱其為三基色不平衡。將之校正的過程就是彩色平演示代碼im=double(imread('plane.bmp'));[m,n,p]=size(im);F1=im(1,1,:);F2=im(1,2,:);F1_(1,1,1)=F1(:,:,2);F1_(1,1,2)=F1(:,:,2);F1_(1,1,3)=F1(:,:,2);F2_(1,1,1)=F1(:,:,2);F2_(1,1,2)=F1(:,:,2);F2_(1,1,3)=F1(:,:,2);K1=(F1_(1,1,1)-F2_(1,1,1))/(F1(1,1,1)-F2(1,1,1));K2=F1_(1,1,1)-K1*F1(1,1,1);L1=(F1_(1,1,3)-F2_(1,1,3))/(F1(1,1,3)-F2(1,1,3));L2=F1_(1,1,3)-L1*F1(1,1,3);for

i=1:mfor

j=1:nnew(i,j,1)=K1*im(i,j,1)+K2;new(i,j,2)=im(i,j,2);new(i,j,3)=L1*im(i,j,3)+L2;endend為工業(yè)增智

為教育賦能6.5彩色平衡及其matlab實(shí)現(xiàn)im=uint8(im);new=uint8(new);subplot(1,2,1);imshow(im);title('原始圖');subplot(1,2,2);imshow(new);title('平衡后');為工業(yè)增智

為教育賦能7形態(tài)學(xué)圖像處理7.1膨脹7.2腐蝕7.3開操作和閉操作為工業(yè)增智

為教育賦能數(shù)字圖像處理基礎(chǔ)7.1膨脹膨脹膨脹是在二值圖像中“加長”或“變粗”的操作。這種特殊的方式和變粗的程度由一個(gè)稱為結(jié)構(gòu)元素的集合控制。實(shí)際就是將結(jié)構(gòu)元素的原點(diǎn)與二值圖像中的1重疊,將二值圖像中重疊部分不是1的值變?yōu)?,完成膨脹。公式:A和B是兩個(gè)集合,A被B膨脹定義為:為工業(yè)增智

為教育賦能7.1膨脹公式解釋:(1)B的反射進(jìn)行平移與A的交集不為空。(2)B的反射:相對(duì)于自身原點(diǎn)的映象。(3)B的平移:對(duì)B的反射進(jìn)行位移為工業(yè)增智

為教育賦能7.1膨脹其中:(1)膨脹運(yùn)算只要求結(jié)構(gòu)元素的原點(diǎn)在目標(biāo)圖像的內(nèi)部平移,換句話說,當(dāng)結(jié)構(gòu)元素在目標(biāo)圖像上平移時(shí),允許結(jié)構(gòu)元素中的非原點(diǎn)像素超出目標(biāo)圖像的范圍。(2)膨脹運(yùn)算具有擴(kuò)大圖像和填充圖像中比結(jié)果元素小的成分的作用,因此在實(shí)際應(yīng)用中可以利用膨脹運(yùn)算連接相鄰物體和填充圖像中的小孔和狹窄的縫隙。代碼示例:A=imread('D:\數(shù)字圖像處理\Fig0906(a).tif');B=[0

1

0;1

1

1;0

1

0];%指定結(jié)構(gòu)元素由0和1組成的矩陣A2=imdilate(A,B);

%二值圖像subplot(1,2,1),imshow(A);title('原圖像');subplot(1,2,2),imshow(A2);title('膨脹處理后圖像');運(yùn)行結(jié)果為工業(yè)增智

為教育賦能7.2腐蝕腐蝕與膨脹相反,對(duì)二值圖像中的對(duì)象進(jìn)行“收縮”或“細(xì)化”。實(shí)際上將結(jié)構(gòu)元素的原點(diǎn)覆蓋在每一個(gè)二值圖像的1上,只要二值圖像上有0和結(jié)構(gòu)元素的1重疊,那么與原點(diǎn)重疊的值為0,同樣由集合與結(jié)構(gòu)元素完成。具體如圖2-33所示。公式:A和B是兩個(gè)集合,A被B腐蝕定義為:為工業(yè)增智

為教育賦能7.3開操作和閉操作開操作與閉操作開閉操作都是由膨脹和腐蝕復(fù)合而成,開操作是先腐蝕后膨脹,閉操作是先膨脹后腐蝕。一般來說,開操作使圖像的輪廓變得光滑,斷開下載的連接和消除細(xì)毛刺。閉操作同樣使得輪廓變得光滑,但是與開操作相反,它通常能夠彌合狹窄的間斷,填充小的孔洞下圖所示,分別是原始圖、閉運(yùn)算后、開運(yùn)算后。為工業(yè)增智

為教育賦能7.2腐蝕其中:(1)被B腐蝕是包含在A中的B由z平移的所有點(diǎn)z的集合。(2)B包含在A中的聲明相當(dāng)于B不共享A背景的任何元素。為工業(yè)增智

為教育賦能7.2腐蝕為工業(yè)增智

為教育賦能其中:(1)當(dāng)結(jié)構(gòu)元素中原點(diǎn)位置不為1(也即原點(diǎn)不屬于結(jié)構(gòu)元素時(shí)),也要把它看作是1,也就是說,當(dāng)在目標(biāo)圖像中找與結(jié)構(gòu)元素B相同的子圖像時(shí),也要求子圖像中與結(jié)構(gòu)元素B的原點(diǎn)對(duì)應(yīng)的那個(gè)位置的像素的值是1。(2)腐蝕運(yùn)算要求結(jié)構(gòu)元素必須完全包括在被腐蝕圖像內(nèi)部:換句話說,當(dāng)結(jié)構(gòu)元素在目標(biāo)圖像上平移時(shí),結(jié)構(gòu)元素中的任何元素不能超過目標(biāo)圖像范圍。(3)腐蝕運(yùn)算的結(jié)果不僅與結(jié)構(gòu)元素的形狀選取有關(guān),而且還與原點(diǎn)位置的選取有關(guān)。(4)腐蝕運(yùn)算具有縮小圖像和消除圖像中比結(jié)構(gòu)元素小的成分的作用,因此在實(shí)際應(yīng)用中,可以利用腐蝕運(yùn)算去除物體之間的粘連,消除圖像中的小顆粒噪聲。7.2腐蝕;代碼示例:f=imread('D:\數(shù)字圖像處理\Fig0908(a).tif');se=strel('disk',10);g

=

imerode(f,

se);se

=

strel('disk',

5);g1

=

imerode(f,

se);g2

=

imerode(f,

strel('disk',

20));subplot(2,2,1),imshow(f);title('(a)原圖像')subplot(2,2,2),imshow(g);title('腐蝕(結(jié)構(gòu)元半徑為5)處理后圖像');subplot(2,2,3),imshow(g1);title('腐蝕(結(jié)構(gòu)元半徑為10)處理后圖像');subplot(2,2,4),imshow(g2);title('腐蝕(結(jié)構(gòu)元半徑為20)處理后圖像');運(yùn)行結(jié)果為工業(yè)增智

為教育賦能“圖”是物體投射或反射光的分布,“像”是人的視覺系統(tǒng)對(duì)圖的接受在大腦中形成的印象或反映。是客觀和主觀的結(jié)合。數(shù)字圖像是指由被稱作像素的小塊區(qū)域組成的二維矩陣。將物理圖象行列劃分后,每個(gè)小塊區(qū)域稱為像素(pixel)。每個(gè)像素包括兩個(gè)屬性:位置和灰度。對(duì)于單色即灰度圖像而言,每個(gè)象素的亮度用一個(gè)數(shù)值來表示,通常數(shù)值范圍在0到255之間,即可用一個(gè)字節(jié)來表示,0表示黑、255表示白,而其它表示灰度級(jí)別。彩色圖象可以用紅、綠、藍(lán)三元組的二維矩陣來表示。通常,三元組的每個(gè)數(shù)值也是在0到255之間,0表示相應(yīng)的基色在該象素中取得最小值,而255則代表相應(yīng)的基色在該象素中取得最大值,這種情況下每個(gè)象素可用三個(gè)字節(jié)來表示。數(shù)字圖像處理就是利用計(jì)算機(jī)系統(tǒng)對(duì)數(shù)字圖像進(jìn)行各種目的的處理:對(duì)連續(xù)圖像f(x,

y)進(jìn)行數(shù)字化:空間上,圖像抽樣;幅度上,灰度級(jí)量化。x方向,抽樣M行。y方向,每行抽樣N點(diǎn)。整個(gè)圖像共抽樣M×N個(gè)像素點(diǎn),一般取M=N=2n=64,128,256,512,1024,2048。數(shù)字圖像常用矩陣來表示:f(i,j)=0~255,灰度級(jí)為256,設(shè)灰度量化為8bit。為工業(yè)增智

為教育賦能數(shù)字圖像處理基礎(chǔ)數(shù)字圖像處理的主要研究內(nèi)容包含很多方面,請(qǐng)列出并簡述其中的4種。什么是圖像識(shí)別與理解?簡述數(shù)字圖像處理的至少3種主要研究內(nèi)容。簡述圖像幾何變換與圖像變換的區(qū)別。為工業(yè)增智

為教育賦能數(shù)字圖像處理基礎(chǔ)第3章視覺系統(tǒng)硬件選型知識(shí)目標(biāo)熟悉機(jī)器視覺系統(tǒng)的主要硬件構(gòu)成掌握機(jī)機(jī)器視覺系統(tǒng)主要硬件的工作原理與性能掌握機(jī)器視覺系統(tǒng)硬件解決方案的選型技能目標(biāo)能夠?qū)ο鄼C(jī)、鏡頭、光源的硬件選型進(jìn)行性能指標(biāo)公式計(jì)算學(xué)會(huì)對(duì)一般工業(yè)應(yīng)用進(jìn)行視覺系統(tǒng)硬件方案選型視覺系統(tǒng)硬件選型為工業(yè)增智

為教育賦能項(xiàng)目1

工業(yè)相機(jī)介紹項(xiàng)目2

鏡頭介紹項(xiàng)目3

光源介紹為工業(yè)增智

為教育賦能視覺系統(tǒng)硬件選型1工業(yè)相機(jī)介紹1.1工業(yè)相機(jī)介紹1.2Sensor介紹1.3數(shù)據(jù)接口介紹1.4相機(jī)主要參數(shù)1.5工業(yè)相機(jī)選型為工業(yè)增智

為教育賦能視覺系統(tǒng)硬件選型1.1工業(yè)相機(jī)簡介機(jī)器視覺系統(tǒng)是由圖像采集、圖像處理以及信息綜合分析處理三個(gè)模塊構(gòu)成。而工業(yè)相機(jī)則是機(jī)器視覺系統(tǒng)當(dāng)中圖像采集模塊的核心部件,對(duì)于機(jī)器視覺系統(tǒng)選型來說是至關(guān)重要的。在工業(yè)相機(jī)選型時(shí),也會(huì)涉及到相機(jī)的類型、定位、參數(shù)、傳輸接口、光學(xué)接口等各個(gè)方面的信息和內(nèi)容。1引言為工業(yè)增智

為教育賦能1.1工業(yè)相機(jī)簡介一般來說,工業(yè)相機(jī)主要由圖像傳感器、內(nèi)部處理電路、數(shù)據(jù)接口、IO接口、光學(xué)接口等幾個(gè)基本模塊組成。當(dāng)相機(jī)在進(jìn)行拍攝時(shí),光信號(hào)首先通過鏡頭到達(dá)圖像傳感器,然后被轉(zhuǎn)化為電信號(hào),再由內(nèi)部處理電路對(duì)圖像信號(hào)進(jìn)行算法處理,最終按照相關(guān)標(biāo)準(zhǔn)協(xié)議通過數(shù)據(jù)接口向上位機(jī)傳輸數(shù)據(jù)。IO接口則提供相機(jī)與上下游設(shè)備的信號(hào)交互,如可以使用輸入信號(hào)觸發(fā)相機(jī)拍照,相機(jī)輸出頻閃信號(hào)控制光源亮起等2工業(yè)相機(jī)簡介為工業(yè)增智

為教育賦能1.1工業(yè)相機(jī)簡介結(jié)合工業(yè)相機(jī)構(gòu)成的幾大基本模塊及不同的選型維度來看,工業(yè)相機(jī)一般可按以下標(biāo)準(zhǔn)分類:①傳感器類型:面陣相機(jī)/線陣相機(jī),彩色相機(jī)/黑白相機(jī),CCD相機(jī)/CMOS相機(jī)等。②

數(shù)據(jù)接口類型:網(wǎng)口相機(jī)/USB

3相機(jī)/萬兆網(wǎng)口相機(jī)/Camera

Link相機(jī)/CoaXPress相機(jī)等。③

光學(xué)接口類型:C口/CS口/M12口/F口/M58口等。為工業(yè)增智

為教育賦能1.2

Sensor介紹Sensor介紹目前,市面上主流的傳感器廠商包括Sony,ONSemi,Gpixel,AMS等。機(jī)器視覺制造商

將圖像傳感器與各具特色的硬件電路集成起來,開發(fā)了圖像處理功能,為用戶提供了豐富的選擇。依據(jù)不同的分類標(biāo)準(zhǔn),行業(yè)也針對(duì)不同類型的傳感器做出了技術(shù)區(qū)分。傳感器類型一般來說,相機(jī)傳感器按元器件類型不同,可分為CCD(Charged

Coupled

Device,電荷耦合元件)和CMOS(Complementary

Metal-Oxide

Semiconductor,金屬氧化物半

導(dǎo)體元件)兩類。其中,CCD的工作原理是將光信號(hào)轉(zhuǎn)換成電信號(hào),并按順序傳送到一個(gè)共同輸出結(jié)構(gòu),然后把電荷轉(zhuǎn)換成電壓,接著再將這些信號(hào)送到緩沖器并存儲(chǔ)到芯片外。而CMOS芯片是將光信號(hào)轉(zhuǎn)化成電信號(hào),并直接集成在芯片表面,因此電子元件能夠快速地讀取成像數(shù)據(jù)。一般來說,CMOS讀取速度比CCD更快。為工業(yè)增智

為教育賦能1.2

Sensor介紹為工業(yè)增智

為教育賦能CCD與CMOS在不同的應(yīng)用場(chǎng)景下各有優(yōu)勢(shì)。CCD由于其特有的工藝,具備低照度效果好、

信噪比高、通透感強(qiáng)、色彩還原能力佳等優(yōu)點(diǎn),可廣泛應(yīng)用在屏幕檢測(cè)、交通、醫(yī)療等高端領(lǐng)域中;但同時(shí)由于其成本高、功耗大也制約了其市場(chǎng)發(fā)展的空間。隨著CMOS工藝和

技術(shù)的不斷提升,以及高端CMOS價(jià)格的不斷下降,在機(jī)器視覺行業(yè)中,CMOS將占據(jù)越來越重要的地位。對(duì)比項(xiàng)CCDCMOS設(shè)計(jì)技術(shù)單一感光器感光器連接放大器靈敏度較高感光開口小,靈敏度低成本線路品質(zhì)影響程度高,成本

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論