數(shù)字圖像處理技術(shù)的現(xiàn)狀及其發(fā)展方向(筆記)_第1頁
數(shù)字圖像處理技術(shù)的現(xiàn)狀及其發(fā)展方向(筆記)_第2頁
數(shù)字圖像處理技術(shù)的現(xiàn)狀及其發(fā)展方向(筆記)_第3頁
數(shù)字圖像處理技術(shù)的現(xiàn)狀及其發(fā)展方向(筆記)_第4頁
數(shù)字圖像處理技術(shù)的現(xiàn)狀及其發(fā)展方向(筆記)_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

數(shù)字圖像處理技術(shù)的現(xiàn)狀及其發(fā)展方向(筆記)數(shù)字圖像處理技術(shù)的現(xiàn)狀及其發(fā)展方向(筆記)數(shù)字圖像處理技術(shù)的現(xiàn)狀及其發(fā)展方向(筆記)xxx公司數(shù)字圖像處理技術(shù)的現(xiàn)狀及其發(fā)展方向(筆記)文件編號:文件日期:修訂次數(shù):第1.0次更改批準審核制定方案設計,管理制度數(shù)字圖像處理技術(shù)的現(xiàn)狀及其發(fā)展方向數(shù)字圖像處理歷史發(fā)展數(shù)字圖像處理(DigitalImageProcessing)將圖像信號轉(zhuǎn)換成數(shù)字信號并利用計算機對其進行處理。1.起源于20世紀20年代。2.數(shù)字圖像處理作為一門學科形成于20世紀60年代初期,美國噴氣推進實驗室(JPL)推動了數(shù)字圖像處理這門學科的誕生。年英國EMI公司工程師Housfield發(fā)明了用于頭顱診斷的X射線計算機斷層攝影裝置即CT(ComputerTomograph),1975年EMI公司又成功研制出全身用的CT裝置,獲得了人體各個部位鮮明清晰的斷層圖像。4.從70年代中期開始,隨著計算機技術(shù)和人工智能、思維科學研究的迅速發(fā)展,數(shù)字圖像處理向更高、更深層次發(fā)展,人們已開始研究如何用計算機系統(tǒng)解釋圖像,實現(xiàn)類似人類視覺系統(tǒng)理解外部世界,其中代表性的成果是70年代末MIT的Marr提出的視覺計算理論。二、數(shù)字圖像處理的主要特點1.目前數(shù)字圖像處理的信息大多是二維信息,處理信息量很大,對計算機的計算速度、存儲容量等要求較高。2.數(shù)字圖像處理占用的頻帶較寬,在成像、傳輸、存儲、處理、顯示等各個環(huán)節(jié)的實現(xiàn)上,技術(shù)難度較大,成本也高,這就對頻帶壓縮技術(shù)提出了更高的要求。3.數(shù)字圖像中各個像素是不獨立的,其相關(guān)性大。因此,圖像處理中信息壓縮的潛力很大。4.由于圖像是三維景物的二維投影,一幅圖像本身不具備復現(xiàn)三維景物的全部幾何信息的能力,要分析和理解三維景物必須作合適的假定或附加新的測量。在理解三維景物時需要知識導引,這也是人工智能中正在致力解決的知識工程問題。5.一方面,數(shù)字圖像處理后的圖像一般是給人觀察和評價的,因此受人的因素影響較大,作為圖像質(zhì)量的評價還有待進一步深入的研究;另一方面,計算機視覺是模仿人的視覺,人的感知機理必然影響著計算機視覺的研究,這些都是心理學和神經(jīng)心理學正在著力研究的課題。三、數(shù)字圖像處理的優(yōu)點1.再現(xiàn)性好;圖像的存儲、傳輸或復制等一系列變換操作不會導致圖像質(zhì)量的退化。2.處理精度高;可將一幅模擬圖像數(shù)字化為任意大小的二維數(shù)組,現(xiàn)代掃描儀可以把每個像素的灰度等級量化為16位甚至更高。3.適用面寬;圖像可以來自多種信息源,圖像只要被變換為數(shù)字編碼形式后,均是用二維數(shù)組表示的灰度圖像組合而成,因而均可用計算機來處理。4.靈活性高;數(shù)字圖像處理不僅能完成線性運算,而且能實現(xiàn)非線性處理,即凡是可以用數(shù)學公式或邏輯關(guān)系來表達的一切運算均可用數(shù)字圖像處理實現(xiàn)。四、數(shù)字圖像處理過程及其主要進展常見的數(shù)字圖像處理有:圖像的采集、數(shù)字化、編碼、增強、恢復、變換、壓縮、存儲、傳輸、分析、識別、分割等。處理流程圖如下圖所示。圖1數(shù)字圖像處理流程圖主要的處理介紹如下:1.圖像數(shù)字化;通過取樣和量化將一個以自然形式存在的圖像變換為適合計算機處理的數(shù)字形式,圖像在計算機內(nèi)部被表示為一個數(shù)字矩陣,矩陣中每一元素稱為像素。2.圖像的編碼;編碼的目的是壓縮圖像的信息量(但圖像質(zhì)量幾乎不變),以滿足傳輸和存儲的要求。編碼方法可以對圖像逐點進行加工,也可以對圖像施加某種變換或基于區(qū)域、特征進行編碼。3.圖像增強;圖像增強目的是使圖像清晰或?qū)⑵滢D(zhuǎn)換為更適合人或機器分析的形式,常用的圖像增強方法有:灰度等級直方圖處理、干擾抵制、邊緣銳化、偽彩色處理等。4.圖像恢復;其目的是除去或減少在獲得圖像過程中因各種原因產(chǎn)生的退化。5.圖像分析;從圖像中抽取某些有用的度量、數(shù)據(jù)或信息,其目的是得到某種數(shù)值結(jié)果。圖像分析需要用圖像分割方法抽取出圖像的特征,然后對圖像進行符號化的描述,這種描述不僅能對圖像中是否存在某一特定對象作出回答,還能對圖像內(nèi)容作出詳細描述。五、數(shù)字圖像處理的主要研究進展一、圖像數(shù)字化歷史階段=1\*GB3①圖像提取技術(shù)源自于電影和視頻產(chǎn)品的發(fā)展,其中,最具影響力的研究是由Porter和Duff提出的通道概念,對圖像提取技術(shù)的離散特性進行了規(guī)范,為這一研究領(lǐng)域奠定了基礎,使其成為圖像處理領(lǐng)域一個較獨立的重要分支。=2\*GB3②20世紀60年代,各種各樣的處理技術(shù)和方法也相應而生,如四元組像素的提出以及Blinn對計算機領(lǐng)域所運用到的像素進行的全面詮釋。=3\*GB3③20世紀90年代初期,學者們開始考慮借助數(shù)學和概率統(tǒng)計學的原理來尋求更優(yōu)解,而不再強調(diào)最優(yōu)解??偨Y(jié),圖像提取技術(shù)的發(fā)展過程經(jīng)歷了以下4個發(fā)展階段:(1)萌芽階段;通過拍攝時的布景實現(xiàn)提取條件。(2)初期階段;以四元像素和數(shù)字化為基礎,建立了獨立的分支學科。(3)飛躍階段;以概率統(tǒng)計學原理為基礎的提取。(4)分化階段;認識到視頻中幀與幀之間存在相關(guān)性,產(chǎn)生了專門用于視頻提取的方案。但由于自然色彩分布的復雜性,至今沒有被廣泛認可的模型,也沒有系統(tǒng)的、統(tǒng)一的評價標準。所以說,圖像提取技術(shù)的成熟還有待時日,并依賴于其它學科及計算機硬件技術(shù)的發(fā)展。研究思路=1\*GB3①一種更注重提高A值的精確度,追求精確完美的效果;=2\*GB3②另一種則更注重提高提取的效率、實時性及自動化程度。研究活動=1\*GB3①拍攝設備、拍攝方法及技巧;=2\*GB3②分割技術(shù);=3\*GB3③人機交互操作接口;=4\*GB3④面向?qū)ο蟮奶崛〖夹g(shù);=5\*GB3⑤前景與背景間交界區(qū)域估計模型。二、圖像壓縮編碼歷史發(fā)展1.第1代圖像壓縮編碼階段(1985年以前)=1\*GB3①1939年Dudley研制了聲碼器,他把聲音頻譜的能量劃分為有限數(shù)目的頻帶,并且在每個頻帶內(nèi)傳輸相應的能級,因此能夠達到較高的壓縮。=2\*GB3②20世紀40年代初形成的信息論,如Huffman編碼。=3\*GB3③1977年以色列科學家JacobZiv和Abra-hamLempel提出了不同于以往的基于字典的壓縮編碼算法LZ77;1978年又推出了改進算法LZ78,把無損壓縮編碼算法的研究推向了一個全新的階段。=4\*GB3④近年來,采用BP網(wǎng)進行非線性預測的嘗試。2.第2代圖像壓縮編碼階段(1985年以后)=1\*GB3①1985年,多個分辨率下表示圖像的方案,利用不同類型的線性濾波器,將圖像分解到不同的頻帶中,然后對不同頻帶的系數(shù)采用不同的壓縮編碼方法。=2\*GB3②1987年,Mallat首次巧妙地將計算機視覺領(lǐng)域內(nèi)的多尺度分析思想引入到小波變換中,小波變換的圖像壓縮編碼算法已成為目前圖像壓縮研究領(lǐng)域的一個主要方向。=3\*GB3③1988年,Barnsley和Sloan共同提出了分形圖像編碼壓縮方案。三、圖像增強增強方法=1\*GB3①直方圖修改處理;=2\*GB3②圖像平滑化處理;=3\*GB3③圖像尖銳化處理;=4\*GB3④彩色處理技術(shù)。四、圖像恢復圖像恢復模型=1\*GB3①通用圖像模型;=2\*GB3②光學系統(tǒng)模型;=3\*GB3③攝影過程模型;=4\*GB3④離散圖像恢復模型?;謴图夹g(shù)=1\*GB3①傳感器和顯示點的非線性修正;=2\*GB3②連續(xù)圖像的空間濾波恢復;=3\*GB3③偽逆空間圖像恢復;=4\*GB3④SVD偽逆空間圖像恢復;=5\*GB3⑤統(tǒng)計學估計空間圖像恢復;=6\*GB3⑥約束圖像恢復;=7\*GB3⑦盲目圖像恢復。五、圖像分割1.基于區(qū)域的分割方法基本思想是將圖像分割成若干不重疊的區(qū)域,使各區(qū)域內(nèi)部特征的相似性大于區(qū)域間特征的相似性,各區(qū)域內(nèi)像素都滿足基于灰度、紋理等特征的某種相似性準則。=1\*GB3①閾值法;=2\*GB3②區(qū)域生長法;=3\*GB3③分裂合并法。2.基于邊緣的分割方法該方法首先檢出圖像中局部特性的不連續(xù)性或突變性,然后將它們連成邊界,這些邊界把圖像分成不同的區(qū)域。邊緣檢測算子有以下幾種:=1\*GB3①Robert算子;=2\*GB3②Sobel算子;=3\*GB3③Pre-witt算子;=4\*GB3④Canny算子;=5\*GB3⑤拉普拉斯算子。六、圖像分析圖像分析從圖像中抽取某些有用的度量、數(shù)據(jù)或信息,目的是得到某種數(shù)值結(jié)果,它主要是提供關(guān)于被分析圖像的一種描述。圖像描繪分類=1\*GB3①區(qū)域內(nèi)部描述;=2\*GB3②區(qū)域邊界描述;=3\*GB3③關(guān)系描述;紋理分析紋理研究方法:結(jié)構(gòu)法;統(tǒng)計法;頻譜法;模型法。六、存在的問題和未來的方向問題=1\*GB3①在提高精度的同時著重解決處理速度的問題,巨大的信息量和數(shù)據(jù)量和處理速度仍然是一對主要矛盾;=2\*GB3②加強軟件的研究和開發(fā)新的處理方法,重點是移植其他學科的技術(shù)和研究成果;=3\*GB3③邊緣學科的研究(如人的視覺特性、心理學特性的研究的突破)促進圖像處理技術(shù)的發(fā)展;=4\*GB3④理論研究已逐步形成圖像處理科學自身的理論體系;=5\*GB3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論