版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
數(shù)字圖像處理綜述1.數(shù)字圖像處理簡介1.1數(shù)字圖像處理的概念一幅圖像可定義為一個二維函數(shù)f(x,y),這里x和y是空間坐標,而在任何一對空間坐標f(x,y)上的幅值f稱為該點圖像的強度或灰度。當x,y和幅值f為有限的、離散的數(shù)值時,稱該點是由有限的元素組成的,沒一個元素都有一個特定的位置和幅值,這些元素稱為圖像元素、畫面元素或象素。象素是廣泛用于表示數(shù)字圖像元素的詞匯。在第二章,將用更正式的術(shù)語研究這些定義。視覺是人類最高級的感知器官,所以,毫無疑問圖像在人類感知中扮演著最重要的角色。然而,人類感知只限于電磁波譜的視覺波段,成像機器則可覆蓋幾乎全部電磁波譜,從伽馬射線到無線電波。它們可以對非人類習慣的那些圖像源進行加工,這些圖像源包括超聲波、電子顯微鏡及計算機產(chǎn)生的圖像。因此,數(shù)字圖像處理涉及各種各樣的應(yīng)用領(lǐng)域。圖像處理涉及的范疇或其他相關(guān)領(lǐng)域(例如,圖像分析和計算機視覺)的界定在初創(chuàng)人之間并沒有一致的看法。有時用處理的輸人和輸出內(nèi)容都是圖像這一特點來界定圖像處理的范圍。我們認為這一定義僅是人為界定和限制。例如,在這個定義下,甚至最普通的計算一幅圖像灰度平均值的工作都不能算做是圖像處理。另一方面,有些領(lǐng)域(如計算機視覺)研究的最高目標是用計算機去模擬人類視覺,包括理解和推理并根據(jù)視覺輸人采取行動等。這一領(lǐng)域本身是人工智能的分支,其目的是模仿人類智能。人工智能領(lǐng)域處在其發(fā)展過程中的初期階段,它的發(fā)展比預(yù)期的要慢得多,圖像分析(也稱為圖像理解)領(lǐng)域則處在圖像處理和計算機視覺兩個學科之間。從圖像處理到計算機視覺這個連續(xù)的統(tǒng)一體內(nèi)并沒有明確的界線。然而,在這個連續(xù)的統(tǒng)一體中可以考慮三種典型的計算處理(即低級、中級和高級處理)來區(qū)分其中的各個學科。低級處理涉及初級操作,如降低噪聲的圖像預(yù)處理,對比度增強和圖像尖銳化。低級處理是以輸人、輸出都是圖像為特點的處理。中級處理涉及分割〔把圖像分為不同區(qū)域或目標物)以及縮減對目標物的描述,以使其更適合計算機處理及對不同日標的分類(識別)。中級圖像處理是以輸人為圖像,但輸出是從這些圖像中提取的特征(如邊緣、輪廓及不同物體的標識等)為特點的。最后,高級處理涉及在圖像分析中被識別物體的總體理解,以及執(zhí)行與視覺相關(guān)的識別函數(shù)(處在連續(xù)統(tǒng)一體邊緣)等。根據(jù)上述討論,我們看到,圖像處理和圖像分析兩個領(lǐng)域合乎邏輯的重疊區(qū)域是圖像中特定區(qū)域或物體的識別這一領(lǐng)域。這樣,在本書中,我們界定數(shù)字圖像處理包括輸人和輸出均是圖像的處理,同時也包括從圖像中提取特征及識別特定物體的處理。舉一個簡單的文本自動分析方面的例子來具體說明這一概念。在自動分析文本時首先獲取一幅包含文本的圖像,對該圖像進行預(yù)處理,提取(分割)字符,然后以適合計算機處理的形式描述這些字符,最后識別這些字符,而所有這些操作都在本書界定的數(shù)字圖像處理的范圍內(nèi)。理解一頁的內(nèi)容可能要根據(jù)理解的復(fù)雜度從圖像分析或計算機視覺領(lǐng)域考慮問題。這樣,本書定義的數(shù)字圖像處理的概念將在有特殊社會和經(jīng)濟價值的領(lǐng)域內(nèi)通用。在以下各章展開的概念是那些應(yīng)用領(lǐng)域所用方法的基礎(chǔ)。1.2數(shù)字圖像處理的發(fā)展20世紀20年代,圖像處理首次應(yīng)用于改善倫敦和紐約之間海底電纜發(fā)送的圖片質(zhì)量。到20世紀50年代,數(shù)字計算機發(fā)展到一定的水平后,數(shù)字圖像處理才真正引起人們的興趣。1964年美國噴氣推進實驗室用計算機對“徘徊者七號”太空船發(fā)回的大批月球照片進行處理,收到明顯的效果。20世紀60年代末,數(shù)字圖像處理具備了比較完整的體系,形成了一門新興的學科。20世紀70年代,數(shù)字圖像處理技術(shù)得到迅猛的發(fā)展,理論和方法進一步完善,應(yīng)用范圍更加廣泛。在這一時期,圖像處理主要和模式識別及圖像理解系統(tǒng)的研究相聯(lián)系,如文字識別、醫(yī)學圖像處理、遙感圖像的處理等。20世紀70年代后期到現(xiàn)在,各個應(yīng)用領(lǐng)域?qū)?shù)字圖像處理提出越來越高的要求,促進了這門學科向更高級的方向發(fā)展。特別是在景物理解和計算機視覺(即機器視覺)方面,圖像處理已由二維處理發(fā)展到三維理解或解釋。近年來,隨著計算機和其它各有關(guān)領(lǐng)域的迅速發(fā)展,例如在圖像表現(xiàn)、科學計算可視化、多媒體計算技術(shù)等方面的發(fā)展,數(shù)字圖像處理已從一個專門的研究領(lǐng)域變成了科學研究和人機界面中的一種普遍應(yīng)用的工具。
圖像處理工具箱提供一套全方位的參照標準算法和圖形工具,用于進行圖像處理、分析、可視化和算法開發(fā)??捎闷鋵τ性雸D像或退化圖像進行去噪或還原、增強圖像以獲得更高清晰度、提取特征、分析形狀和紋理以及對兩個圖像進行匹配。工具箱中大部分函數(shù)均以開放式MATLAB語言編寫。這意味著可以檢查算法、修改源代碼和創(chuàng)建自定義函數(shù)。圖像處理工具箱在生物測定學、遙感、監(jiān)控、基因表達、顯微鏡技術(shù)、半導體測試、圖像傳感器設(shè)計、顏色科學及材料科學等領(lǐng)域為工程師和科學家提供支持。它也促進了圖像處理技術(shù)的教學。2.數(shù)字圖像處理的研究方法2.1數(shù)字圖像處理的基本特點(1)目前,數(shù)字圖像處理的信息大多是二維信息,處理信息量很大。如一幅256×256低分辨率黑白圖像,要求約64kbit的數(shù)據(jù)量;對高分辨率彩色512×512圖像,則要求768kbit數(shù)據(jù)量;如果要處理30幀/秒的電視圖像序列,則每秒要求500kbit~22.5Mbit數(shù)據(jù)量。因此對計算機的計算速度、存儲容量等要求較高。(2)數(shù)字圖像處理占用的頻帶較寬。與語言信息相比,占用的頻帶要大幾個數(shù)量級。如電視圖像的帶寬約5.6MHz,而語音帶寬僅為4kHz左右。所以在成像、傳輸、存儲、處理、顯示等各個環(huán)節(jié)的實現(xiàn)上,技術(shù)難度較大,成本亦高,這就對頻帶壓縮技術(shù)提出了更高的要求。(3)數(shù)字圖像中各個像素是不獨立的,其相關(guān)性大。在圖像畫面上,經(jīng)常有很多像素有相同或接近的灰度。就電視畫面而言,同一行中相鄰兩個像素或相鄰兩行間的像素,其相關(guān)系數(shù)可達0.9以上,而相鄰兩幀之間的相關(guān)性比幀內(nèi)相關(guān)性一般說還要大些。因此,圖像處理中信息壓縮的潛力很大。(4)由于圖像是三維景物的二維投影,一幅圖象本身不具備復(fù)現(xiàn)三維景物的全部幾何信息的能力,很顯然三維景物背后部分信息在二維圖像畫面上是反映不出來的。因此,要分析和理解三維景物必須作合適的假定或附加新的測量,例如雙目圖像或多視點圖像。在理解三維景物時需要知識導引,這也是人工智能中正在致力解決的知識工程問題。(5)數(shù)字圖像處理后的圖像一般是給人觀察和評價的,因此受人的因素影響較大。由于(3)通信工程方面的應(yīng)用當前通信的主要發(fā)展方向是聲音、文字、圖像和數(shù)據(jù)結(jié)合的多媒體通信。具體地講是將電話、電視和計算機以三網(wǎng)合一的方式在數(shù)字通信網(wǎng)上傳輸。其中以圖像通信最為復(fù)雜和困難,因圖像的數(shù)據(jù)量十分巨大,如傳送彩色電視信號的速率達100Mbit/s以上。要將這樣高速率的數(shù)據(jù)實時傳送出去,必須采用編碼技術(shù)來壓縮信息的比特量。在一定意義上講,編碼壓縮是這些技術(shù)成敗的關(guān)鍵。除了已應(yīng)用較廣泛的熵編碼、DPCM編碼、變換編碼外,目前國內(nèi)外正在大力開發(fā)研究新的編碼方法,如分行編碼、自適應(yīng)網(wǎng)絡(luò)編碼、小波變換圖像壓縮編碼等。(4)工業(yè)和工程方面的應(yīng)用在工業(yè)和工程領(lǐng)域中圖像處理技術(shù)有著廣泛的應(yīng)用,如自動裝配線中檢測零件的質(zhì)量、并對零件進行分類,印刷電路板疵病檢查,彈性力學照片的應(yīng)力分析,流體力學圖片的阻力和升力分析,郵政信件的自動分揀,在一些有毒、放射性環(huán)境內(nèi)識別工件及物體的形狀和排列狀態(tài),先進的設(shè)計和制造技術(shù)中采用工業(yè)視覺等等。其中值得一提的是研制具備視覺、聽覺和觸覺功能的智能機器人,將會給工農(nóng)業(yè)生產(chǎn)帶來新的激勵,目前已在工業(yè)生產(chǎn)中的噴漆、焊接、裝配中得到有效的利用。(5)軍事公安方面的應(yīng)用在軍事方面圖像處理和識別主要用于導彈的精確末制導,各種偵察照片的判讀,具有圖像傳輸、存儲和顯示的軍事自動化指揮系統(tǒng),飛機、坦克和軍艦?zāi)M訓練系統(tǒng)等;公安業(yè)務(wù)圖片的判讀分析,指紋識別,人臉鑒別,不完整圖片的復(fù)原,以及交通監(jiān)控、事故分析等。目前已投入運行的高速公路不停車自動收費系統(tǒng)中的車輛和車牌的自動識別都是圖像處理技術(shù)成功應(yīng)用的例子。(6)文化藝術(shù)方面的應(yīng)用目前這類應(yīng)用有電視畫面的數(shù)字編輯,動畫的制作,電子圖像游戲,紡織工藝品設(shè)計,服裝設(shè)計與制作,發(fā)型設(shè)計,文物資料照片的復(fù)制和修復(fù),運動員動作分析和評分等等,現(xiàn)在已逐漸形成一門新的藝術(shù)--計算機美術(shù)。(7)機器人視覺:機器視覺作為智能機器人的重要感覺器官,主要進行三維景物理解和識別,是目前處于研究之中的開放課題。機器視覺主要用于軍事偵察、危險環(huán)境的自主機器人,郵政、醫(yī)院和家庭服務(wù)的智能機器人,裝配線工件識別、定位,太空機器人的自動操作等。(8)視頻和多媒體系統(tǒng):目前,電視制作系統(tǒng)廣泛使用的圖像處理、變換、合成,多媒體系統(tǒng)中靜止圖像和動態(tài)圖像的采集、壓縮、處理、存貯和傳輸?shù)取?9)科學可視化:圖像處理和圖形學緊密結(jié)合,形成了科學研究各個領(lǐng)域新型的研究工具。(10)電子商務(wù):在當前呼聲甚高的電子商務(wù)中,圖像處理技術(shù)也大有可為,如身份認證、產(chǎn)品防偽、水印技術(shù)等。5.數(shù)字圖像處理的展望5.1數(shù)字圖像處理未來的發(fā)展經(jīng)過對數(shù)字圖像處理這門課程的學習,以及對數(shù)字圖像處理技術(shù)在各個領(lǐng)域中應(yīng)用的了解,我認為圖像處理技術(shù)未來的發(fā)展大致體現(xiàn)在以下四個方面(1)超高速、高分辨率、立體化、多媒體、智能化和標準化方向發(fā)展具體表現(xiàn)在:提高硬件速度,不僅提高計算機的速度,而且A/D和D/A的速度要實時化;提高分辨率,主要提高采集分辨率和顯示分辨率;立體化,圖像是二維信息,信息量更大的三維圖像將隨計算機圖形學和虛擬現(xiàn)實技術(shù)的發(fā)展將的到廣泛應(yīng)用;多媒體化,20世紀90年代出現(xiàn)的多媒體技術(shù),其關(guān)鍵就是圖像數(shù)據(jù)的壓縮。智能化,是計算機識別和理解按照人類的認識和思維方式工作,能夠考慮到主觀概率和非邏輯思維;標準化,以統(tǒng)一的標準來實現(xiàn)圖像的處理與傳輸。(2)圖像與圖形相結(jié)合朝著三維成像或多維成像的方向發(fā)展(3)新理論和新算法的研究圖像處理科學經(jīng)過初創(chuàng)造期、發(fā)展期、普及期和廣泛應(yīng)用期,近年來引入了一些新的理論提出了一些新的算法,如:Wavelet、Fractal、Mor-phology、遺傳算法和神經(jīng)網(wǎng)絡(luò)等,其中Fractal廣泛應(yīng)用于圖像處理、圖形處理、紋理分析,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度網(wǎng)絡(luò)劇主演聘請服務(wù)協(xié)議3篇
- 2025年度綠色家居建材供應(yīng)與服務(wù)合同4篇
- 2025年度苗木種植基地水資源管理與利用合同4篇
- 2025年度盤扣結(jié)構(gòu)設(shè)計咨詢服務(wù)合同
- 二零二五年度體育場館場地租用管理協(xié)議3篇
- 2025年雙眼皮膠項目投資可行性研究分析報告
- 2025年多畫面彩色電視燈項目投資可行性研究分析報告
- 2025年冷軋光亮帶鋼項目可行性研究報告
- 2025年電機端蓋壓鑄件項目投資可行性研究分析報告
- 2025年凍鲅魚段行業(yè)深度研究分析報告
- 我的家鄉(xiāng)瓊海
- (2025)專業(yè)技術(shù)人員繼續(xù)教育公需課題庫(附含答案)
- 《互聯(lián)網(wǎng)現(xiàn)狀和發(fā)展》課件
- 【MOOC】計算機組成原理-電子科技大學 中國大學慕課MOOC答案
- 2024年上海健康醫(yī)學院單招職業(yè)適應(yīng)性測試題庫及答案解析
- 2024年湖北省武漢市中考語文適應(yīng)性試卷
- 非新生兒破傷風診療規(guī)范(2024年版)解讀
- EDIFIER漫步者S880使用說明書
- 皮膚惡性黑色素瘤-疾病研究白皮書
- 從心理學看現(xiàn)代家庭教育課件
- C語言程序設(shè)計PPT(第7版)高職完整全套教學課件
評論
0/150
提交評論