版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、摘要隨著計算機技術(shù)和網(wǎng)絡(luò)技術(shù)的發(fā)展,以及多媒體的推廣應(yīng)用,產(chǎn)生了大量的各式各樣的圖像。如何有效地對這些圖像進行分析、存儲和檢索是一個急待解決的問題?;趦?nèi)容的圖像檢索技術(shù)能有效地解決這一問題,成為研究的重點。圖像檢索的研究目的就是實現(xiàn)自動化、智能化的圖像查詢和管理方式,使查詢者可以實現(xiàn)方便、快速、準確地查找。紋理是圖像的一個主要視覺特征,也是基于內(nèi)容圖像檢索系統(tǒng)中的一個重要手段。本文對基于紋理特征的圖像檢索技術(shù)進行了研究,并通過實驗驗證了檢索算法的有效性。圖像的特征提取是圖像檢索的關(guān)鍵技術(shù)之一。本文將灰度共生矩陣用于圖像的紋理特征提取。設(shè)計并實現(xiàn)了一個基于紋理特征的圖像檢索系統(tǒng)。給出了系統(tǒng)的流
2、程圖,并介紹了系統(tǒng)的查詢模塊、特征提取模塊、匹配模塊和圖像顯示模塊及其各個模塊的功能。系統(tǒng)采用歐氏距離法作為圖像的相似性度量,采用灰度共生矩陣算法提取圖像的紋理特征。最后通過實驗對給定的圖像進行檢索。關(guān)鍵詞:圖像檢索,紋理特征,共生矩陣目 錄1 前言11.1 圖像檢索的發(fā)展現(xiàn)狀11.2 圖像檢索技術(shù)分類31.3 研究內(nèi)容與章節(jié)安排52 圖像檢索的基本原理62.1 檢索系統(tǒng)通用框架62.2 檢索系統(tǒng)關(guān)鍵技術(shù)72.2.1特征提取72.2.2高維索引92.3 檢索查詢方式102.3.1外部圖例查詢102.3.2內(nèi)部圖例查詢102.3.3草圖查詢112.4 圖像的相似性度量112.4.1概述112.4
3、.2相似性測度112.4.3非幾何相似性測度132.4.4小結(jié)142.5 本章小結(jié)153 基于紋理特征的圖像檢索算法研究163.1 紋理特征概述163.2 基于小波變換的紋理特征提取183.2.1圖像的小波變換183.2.2小波基的選擇203.2.3小波基的正則性階數(shù)213.2.4小波變換的級數(shù)223.3 基于灰度共生矩陣的紋理特征233.3.1灰度共生矩陣233.3.2灰度共生矩陣特征提取273.4 基于灰度一梯度共生矩陣的紋理特征273.4.1灰度一梯度共生矩陣273.4.2灰度一梯度共生矩陣特征提取283.5 本章小結(jié)294 圖像檢索系統(tǒng)設(shè)計與實現(xiàn)304.1 系統(tǒng)模塊和功能304.2 系
4、統(tǒng)流程314.3 主要算法說明314.3.1基于灰度共生矩陣的紋理特征提取算法314.3.2紋理特征計算的代碼344.4 實驗及結(jié)論394.4.1檢索系統(tǒng)的評價指標394.4.2實驗結(jié)果及分析404.4.3本章小結(jié)425 總結(jié)與展望435.1 總結(jié)435.2 展望43致謝44參考文獻45461 前言隨著互聯(lián)網(wǎng)技術(shù)向?qū)拵?、高速、多媒體方向的發(fā)展,人類正快速進入一個信息化的時代。各種信息工具、技術(shù)、載體等應(yīng)運而生。在眾多類型的信息資源中,圖像具有直觀、形象、易于理解和信息量大等特點,成為資源庫的重要組成部分。同網(wǎng)絡(luò)信息一樣,由于圖像數(shù)量巨大,種類繁多,加之排列方式錯綜復雜,這給圖像檢索帶來了困難。
5、近年來,基于內(nèi)容的圖像檢索技術(shù)有了長足的發(fā)展?;趦?nèi)容的圖像檢索能有效的對圖像進行管理和檢索,這項技術(shù)既充分體現(xiàn)了圖像的信息特點,又充分結(jié)合了傳統(tǒng)數(shù)據(jù)庫技術(shù),它的應(yīng)用對解決信息膨脹,有效快速地利用多媒體信息有很好的實用價值。圖像的內(nèi)容包括圖像的顏色、紋理、形狀等視覺特征和語義特征。其中,紋理特征作為最為顯著的視覺特征之一,它是一種不依賴于顏色或亮度反映圖像中同質(zhì)現(xiàn)象的視覺特征。紋理特征包含了物體表面結(jié)構(gòu)組織排列的重要信息,以及與周圍環(huán)境的聯(lián)系。因此在基于紋理的圖像檢索中得到了廣泛應(yīng)用。1.1 圖像檢索的發(fā)展現(xiàn)狀自90年代以來,基于內(nèi)容的圖像檢索已經(jīng)成為了一個非?;钴S的研究領(lǐng)域。從目前的研究現(xiàn)狀
6、來看,基于內(nèi)容的圖像檢索可分為3層。下層是基于顏色、紋理、形狀等反映圖像基本物理特征的檢索,是最直接也是最基本的層面,用到圖像信息處理、圖像分析和相似性匹配技術(shù)。中間層是基于圖像對象語義的檢索,如圖像中實體及實體之間的空間關(guān)系的檢索,對象級檢索技術(shù)建立在下層特征基礎(chǔ)上,并引入了對象模型庫、對象識別和人工智能等圖像理解技術(shù)。最上層是基于圖像概念級語義的檢索,其技術(shù)建立在對象層語義特征提取的基礎(chǔ)上,引入了對象和場景之間的邏輯、情感等高層語義的描述及識別,需要用到知識庫和更加有效的人工智能和神經(jīng)網(wǎng)絡(luò)技術(shù)。到目前為止,已有許多商業(yè)的或是用于研究的圖像檢索系統(tǒng)問世。QBIC(Query ByImage
7、Content)圖像檢索系統(tǒng)是IBM公司90年代開發(fā)制作的圖像和動態(tài)景象檢索系統(tǒng),是第一個基于內(nèi)容的商業(yè)化的圖像檢索系統(tǒng)。用戶無須提供文字檢索詞,只要輸入以圖像形式表達的圖像檢索要求就可以檢索出一系列相似的圖像。Virage是由Virage公司開發(fā)的基于內(nèi)容的圖像檢索引擎。同QBIC系統(tǒng)一樣,它也支持基于色彩、顏色、布局、紋理和結(jié)構(gòu)等視覺特征的圖像檢索。Jerry等人還進一步提出了圖像管理的一個開放式框架,將視覺特征分為通用特征(如顏色、紋理和形狀)和領(lǐng)域相關(guān)特征兩類。Photobook是美國麻省理工學院的多媒體實驗室所開發(fā)的用于圖像查詢和瀏覽的交互工具。它由兩個子系統(tǒng)組成,分別負責提取形狀、
8、紋理、面部特征。因此,用戶可以在這兩個子系統(tǒng)中分別進行基于形狀、基于紋理和基于面部特征的圖像檢索。VisualSEEK是基于視覺特征的檢索工具,WebSEEK是一種面向www的文本或圖像搜索引擎。這兩個檢索系統(tǒng)都是由哥倫比亞大學開發(fā)的。VisualSEEK同時支持基于視覺特征的查詢和基于空間關(guān)系的查詢。WebSEEK包括兩個主要模塊:圖像視頻采集模塊,主題分類和索引模塊、查找、瀏覽和檢索模塊。Netra系統(tǒng)是加利福尼亞大學的A1exandria數(shù)字化圖書館項目(AlexandriaDigital Library)中用于圖像檢索的原型系統(tǒng)。它從分割后的圖像區(qū)域中提取顏色、紋理、形狀和空間位置信息
9、,并依靠這些信息從數(shù)據(jù)庫中查找相似的區(qū)域。Netra在研究方面的主要特點包括:采用了基于Gabor濾波器的紋理特征:基于神經(jīng)網(wǎng)絡(luò)的“圖像詞典”的構(gòu)造和基于邊緣流的圖像分割。MARS(Multimedia AnalysiS and Retrieval System)是美國伊利諾斯大學開發(fā)的,它無論在研究角度還是應(yīng)用領(lǐng)域都和其他的圖像檢索系統(tǒng)有很大的差異。MARS是計算機視覺、數(shù)據(jù)庫管理系統(tǒng)以及傳統(tǒng)的信息檢索技術(shù)多個領(lǐng)域交叉的結(jié)果,它的主要特點包括:數(shù)據(jù)庫管理系統(tǒng)和信息檢索技術(shù)的結(jié)合;索引技術(shù)和檢索技術(shù)的融合以及計算機和人的融合。MARS系統(tǒng)的重點在于根據(jù)實際的應(yīng)用環(huán)境和用戶的需要,在檢索框架中動
10、態(tài)地組合和調(diào)整各種不同的圖像特征。MARS在圖像檢索領(lǐng)域正式提出了相關(guān)反饋的體系結(jié)構(gòu)。相關(guān)反饋技術(shù)在各種層次上融合到檢索的過程中,包括查詢向量的優(yōu)化,相似度算法的自動選擇,以及圖像特征權(quán)重的調(diào)整。國內(nèi)的一些研究單位已相繼開展了基于內(nèi)容的圖像檢索的研究工作,并開發(fā)了一些實驗系統(tǒng)。主要有清華大學在視頻檢索方面的研究,國防科大在多媒體數(shù)據(jù)庫檢索系統(tǒng)方面展開研究,浙江大學也于1995年開始了這方面的研究工作。西北大學可視化技術(shù)研究所從1998年開始研究基于內(nèi)容的圖像檢索,研究成果在醫(yī)學影像數(shù)據(jù)庫和數(shù)字考古博物館中已有應(yīng)用,理論研究和具體實踐都取得了可喜的進展。中科院計算機所智能信息處理重點實驗室智能科
11、學課題組開發(fā)的多媒體信息檢索系統(tǒng)Mires開始嘗試在藥植物數(shù)據(jù)庫、遙感圖像檢索系統(tǒng)等方面展開應(yīng)用。2002年,吳冬生、吳樂南提出對JPEG圖像的DCT系數(shù)利用多分辨率小波變換的形式進行重組,對整個數(shù)據(jù)庫中的所有圖像的DCT系數(shù)重組得到的若干子帶,分別建立子帶能量直方圖,而后采用Norton順序建立圖像的索引,并采用B樹結(jié)構(gòu)組織圖像數(shù)據(jù)庫用于圖像檢索。1.2 圖像檢索技術(shù)分類基于內(nèi)容的圖像檢索技術(shù)實際上是一種模糊查詢技術(shù),通過對圖像提取一定的特征,找出在特征空間中與查詢要求最接近的圖像?;趦?nèi)容的圖像檢索技術(shù)通常需要明確兩個問題:一、如何提取特征,二、特征如何匹配。圖像特征(即內(nèi)容)的提取是基于
12、內(nèi)容的圖像檢索(CBIRContent-Based ImageRetrieval)的基礎(chǔ)。對于基于內(nèi)容的檢索系統(tǒng),根據(jù)其處理的對象可以將其分為靜止圖像檢索和活動視頻檢索。本論文主要討論可視化靜態(tài)圖像特征的提取。根據(jù)所提取的特征不同,當前基于內(nèi)容的圖像檢索技術(shù)可以分為以下幾類:1基于顏色特征顏色是圖像內(nèi)容組成的基本要素,是人識別圖像的主要感知特征之一,相對與其它特征,顏色特征非常穩(wěn)定,對于圖像的平移、尺度、旋轉(zhuǎn)變化不敏感,具有很強的魯棒性,而且顏色特征計算簡單,因此基于顏色的查詢是基于內(nèi)容的圖像檢索中應(yīng)用最廣泛的方法。2基于紋理特征紋理是圖像的一個重要的特征。準確的紋理定義并不存在,一種定義認為
13、紋理是由紋理基元按某種確定性的規(guī)律或者只有某種統(tǒng)計規(guī)律排列組成的。另一種更為模糊的定義是紋理是由大量或多或少有序的相似基元或模式組成的一種結(jié)構(gòu)。使用數(shù)學或信息論的方法抽取的紋理度量稱為紋理特征,紋理特征可用來對圖像中的空間信息進行定量的描述。紋理分析的方法主要分為兩類:結(jié)構(gòu)方法和統(tǒng)計方法。結(jié)構(gòu)方法假定圖像由較小的紋理基元排列而成,只適用于規(guī)則的紋理結(jié)構(gòu)。統(tǒng)計方法又可進一步分為傳統(tǒng)的統(tǒng)計方法、基于模型的方法和基于頻譜分析的方法。傳統(tǒng)的統(tǒng)計分析方法始于20世紀70年代早期的二階灰度統(tǒng)計特征的共生矩陣方法。80年代開始,基于隨機場模型的技術(shù)被用于紋理分析。隨機場模型包括圓同步自回歸(Circular
14、 Simultaneous Autoregressive)模型和高斯馬爾可夫隨機場(GMRF,GaussianMarkov Random Field)模型。多尺度的思想促進了基于頻譜分析方法的發(fā)展,特別是基于Gabor濾波器的技術(shù)在紋理分析中被廣泛采用。在實際的檢索系統(tǒng)中應(yīng)用的紋理特征方法一般有:象素域法、共生矩陣法、視覺紋理特征表達法、分形編碼法、小波變換法等。3基于形狀特征基于對物體的形狀特征進行檢索是基于內(nèi)容檢索中最具挑戰(zhàn)性的問題之一,因為尋找符合人眼感知特性的形狀特征并不是件簡單的工作。形狀特征的重要原則是對位移、旋轉(zhuǎn)、尺度變換的不變性,人們出于識別和檢索的目的,總是趨向于忽略這種變化
15、。形狀特征的描述一般可分為兩類:基于邊界和基于區(qū)域。前者利用的是形狀的外邊界,后者利用的是整個形狀區(qū)域。描述方法有:邊界方向直方圖、傅立葉描述符、矩不變量、Chamfer匹配、Turning函數(shù)、小波描述算子以及2D,3D形狀表達等。傅立葉描述符用傅立葉變換后的邊界作為形狀特征,用較少的參數(shù)可以包納很復雜的邊界。矩不變量是使用基于區(qū)域的矩(與變換無關(guān))作為形狀特征。4基于邊緣草圖基于邊緣草圖的查詢是用戶提交一幅想要查詢的物體的大致輪廓,由系統(tǒng)找出與此輪廓相匹配的圖像。草圖的查詢可以通過計算圖像的邊緣圖來實現(xiàn),這種方法的缺點是沒有方向和尺度的不變性,類似的圖像可能因為方向和尺度的不同而被遺漏,這
16、種問題需要有復雜的邊緣表示和匹配算法來消除。5基于空間關(guān)系的對于包含多目標的圖像,目標之間的空間關(guān)系是又一種描述圖像內(nèi)容的特征。描述物體問的空間關(guān)系首先需要對圖像進行目標分割和識別,然后可將圖像轉(zhuǎn)化成采用2維串2D String)編碼的符號圖像,2維串描述物體間的關(guān)系是通過一系列算子(上、下、左、右等),圖像的檢索問題變成了一個2維串匹配的問題。2維串的匹配是基于一個簡單的分級方案,然而用于生成2維串的算法需要對象分割和識別,計算量相當大。6基于非視覺特征的現(xiàn)在運行的商用系統(tǒng)通常采用關(guān)系型數(shù)據(jù)庫,這些系統(tǒng)中圖像的屬性包括圖像來源、拍攝時間和地點、媒介類型、分辨率、輸入設(shè)備、壓縮方式、以及與圖片
17、相關(guān)的注釋信息,注釋信息對于用戶來說是非常自然的描述,然而這種特征描述因人而異,而且無法自動提取,給檢索系統(tǒng)帶來很大的困難。1.3 研究內(nèi)容與章節(jié)安排1 在前言中,主要介紹國內(nèi)外圖像檢索技術(shù)的歷史發(fā)展、最新進展及應(yīng)用狀況,最后介紹圖像檢索技術(shù)的分類。2 第二章介紹圖像檢索的基本原理。介紹檢索系統(tǒng)的通用框架,檢索系統(tǒng)的關(guān)鍵技術(shù)、檢索的查詢方式及其特點及圖像的相似性度量。3 第三章介紹基于紋理特征的圖像檢索算法。詳細介紹基于灰度共生矩陣的紋理特征提取算法。5 第四章介紹檢索系統(tǒng)設(shè)計與實現(xiàn)。介紹系統(tǒng)模塊和各模塊的功能,檢索系統(tǒng)的流程,并對主要算法進行詳細說明,最后通過實驗對給定的圖像進行檢索。6 第
18、五章總結(jié)與展望??偨Y(jié)論文,并提出了論文下一步的工作以及圖像檢索系統(tǒng)的發(fā)展方向。2 圖像檢索的基本原理基于內(nèi)容的圖像檢索遵循概率排隊的規(guī)則,根據(jù)用戶的查詢需要,對查詢樣本和庫中圖像分別計算相關(guān)特征,并比較特征的相似性,最后按相似性值由大到小排列庫中圖像,完成一個查詢過程。這一新的研究方向涉及圖像處理(Image Processing),圖像識別(Image Recognition)和圖像數(shù)據(jù)庫(Image Database)技術(shù),把這3個領(lǐng)域的研究成果進行有效的結(jié)合是該技術(shù)取得成功的基礎(chǔ)?;趦?nèi)容的圖像檢索技術(shù)由于能夠根據(jù)圖像的可視內(nèi)容產(chǎn)生查詢,從而方便了用戶,檢索時針對不同的具體應(yīng)用,使用一種
19、特征或組合幾個特征進行檢索?;诩y理特征的圖像檢索是基于內(nèi)容圖像檢索的一個方面,因此,本章將討論基于內(nèi)容的圖像檢索系統(tǒng)的通用框架、關(guān)鍵技術(shù)、檢索查詢方式及檢索特點。2.1 檢索系統(tǒng)通用框架基于內(nèi)容的圖像數(shù)據(jù)庫檢索系統(tǒng)是一種重要的多媒體信息處理技術(shù)。一般把基于內(nèi)容的圖像數(shù)據(jù)庫檢索系統(tǒng)看作是介于信息用戶和數(shù)據(jù)庫之間的一種信息服務(wù)系統(tǒng)。系統(tǒng)的通用框架如圖21所示。多 媒 體 數(shù) 據(jù) 庫信息用戶查詢描述匹配驗證提取圖2-1 基于內(nèi)容的圖像檢索系統(tǒng)通用框架(1)查詢模塊對用戶提供多樣的查詢手段,以支持用戶根據(jù)不同應(yīng)用進行各種類型的查詢工作。(2)描述模塊系統(tǒng)將用戶的查詢要求轉(zhuǎn)化為對圖像內(nèi)。容比較抽象的內(nèi)
20、部表達描述,即以一定的計算機可以方便表達的數(shù)據(jù)結(jié)構(gòu)描述給定圖像的內(nèi)容。這是基于內(nèi)容的圖像檢索系統(tǒng)的關(guān)鍵模塊,如何描述圖像,直接關(guān)系到檢索系統(tǒng)的性能。(3)匹配模塊將查詢描述與圖像庫中被查詢圖像進行內(nèi)容匹配和比較,以確定它們在內(nèi)容上一致性和相似性。這個匹配結(jié)果將傳給提取模塊。匹配模塊所使用的方法與描述方法密切相關(guān)。(4)提取模塊根據(jù)匹配的結(jié)果,在內(nèi)容匹配的基礎(chǔ)上將所有滿足給定條件的圖像自動地從圖像庫中提取出來。(5)驗證模塊提取的圖像是否滿足用戶要求還需驗證。如果驗證效果不滿意,新一輪的查詢可以通過修改查詢條件而重新開始。2.2 檢索系統(tǒng)關(guān)鍵技術(shù)基于內(nèi)容的圖像檢索系統(tǒng)的關(guān)鍵技術(shù)為:圖像的特征提取
21、和圖像數(shù)據(jù)索引結(jié)構(gòu)的構(gòu)造。下面分別介紹這兩個關(guān)鍵技術(shù)。2.2.1特征提取特征抽取是基于內(nèi)容的圖像檢索的基礎(chǔ),目前比較成熟的特征是顏色、紋理、形狀和物體間方位關(guān)系。這些特征具有計算簡單,性能穩(wěn)定的特點,但這些特征都有一定的局限性。1 顏色顏色是一種重要的視覺信息屬性,在圖像查詢與檢索中是種很有用的特征。相對于其它特征,顏色特征非常穩(wěn)定,對于旋轉(zhuǎn)、平移、尺度變化,甚至各種變形都不敏感,表現(xiàn)出相當強的魯棒性,而且顏色特征計算簡單,因此成為現(xiàn)有檢索系統(tǒng)中應(yīng)用最廣泛的特征。顏色檢索的基本思想是將圖像間的相似度歸結(jié)為顏色直方圖之問的距離。這方面奠基性的工作是Swain和Ballad提出的直方圖求交算法,它
22、計算兩幅圖像三維顏色直方圖的每一個顏色單位,并進行細致的比較。Mehtre等人提出距離算法和參考顏色表方法,實驗表明,每幅圖像只需保留很少幾種主要顏色就能得到很好的結(jié)果。為了得到與人的感覺類似的相似性度量,一些研究者還提出采用其它的顏色空間模型和距離測度。Zhang等人采用了符合人眼感覺的HSV(HueSaturation Value)模型,Baraldi等人在進行直方圖匹配時引入了二次型距離。另外,在提高檢索對于光照的穩(wěn)定性及空間分布信息的引入等方面,也出現(xiàn)了很多算法。2 紋理紋理是與物體表面材質(zhì)有關(guān)的圖像特征,目前也是基于內(nèi)容的圖像檢索系統(tǒng)中的一個重要手段。紋理分析一直是計算機視覺中的一個
23、重要研究方向,其方法主要分為兩類:結(jié)構(gòu)方法和統(tǒng)計方法。結(jié)構(gòu)方法假定圖像由較小的紋理基元排列而成,它采用句法分析方法,只適用于規(guī)則的結(jié)構(gòu)紋理。統(tǒng)計方法又可進一步分為傳統(tǒng)的統(tǒng)計方法、基于模型的方法,以及基于頻譜分析的方法。傳統(tǒng)的統(tǒng)計分析方法始于20世紀70年代早期,Haralick等人提出了基于二階灰度統(tǒng)計特征的共生矩陣方法。之后,Tamura以人的主觀心理度量為標準,提出了6個基本的紋理特征,這些特征與人的感受較一致,在許多圖像檢索系統(tǒng)中得到應(yīng)用。20世紀80年代,基于隨機場模型的技術(shù)被用于紋理分析中。Kashyap等人提出用CSAR模型提取旋轉(zhuǎn)不變的紋理特征。麻省理工大學的Photobook中
24、采用了隨機場的二維分解技術(shù),得到周期性、方向性和隨機性三種特征,用于紋理圖像檢索。多尺度的思想促進了基于頻譜分析方法的發(fā)展,特別是基于Gabor濾波器的技術(shù)在紋理分析中被廣泛采用,Gabor濾波器可以通過調(diào)整獲得圖像不同方向和尺度的紋理信息。Lee等人把它用于圖像檢索,并把它與小波變換方法作了比較。3 形狀形狀基于圖像內(nèi)物體形狀的檢索是基于內(nèi)容檢索當中一個最具挑戰(zhàn)性的問題之一,因為尋找符合人眼感知特性的形狀特征不是一件簡單的工作。首要的困難是要將不同物體從圖像中分割出來,這是計算機視覺中的一個困難問題。形狀的描述也是困難的問題,常用的方法有傅立葉描述子、矩不變量、各種簡單的形狀因子(如面積、圓
25、度、偏心度、主軸方向)等。除了這些全局特征以外,有時也用一些局部特征(如直線段、圓弧、角點、高曲率點等),來解決遮擋問題。除這些常規(guī)方法外,人們還提出了許多基于不變性和變換的方法。由于基于簡單特征的方法無法對形狀作細致的匹配,也不能解決廣泛存在的變形問題。因此實際系統(tǒng)中常常只用它們來作初步的過濾,最終的匹配結(jié)果由一些更復雜的方法給出,如變性模板、彈性匹配等。4 區(qū)域與目標由于顏色、紋理的檢索僅適合部分圖像檢索的情況,且檢索的正確率不高,而且在很多情況下,人們感興趣的并不是整幅圖像,而是圖像中的某些區(qū)域或目標。因此,近幾年來人們提出了基于區(qū)域或目標的圖像表示和檢索方法,在這類方法中通常需要完成圖
26、像分割,然后再利用感興趣部分的圖像信息進行檢索。2.2.2高維索引為了使基于內(nèi)容的圖像檢索能真正地適合于大規(guī)模的圖像集合,需要研究有效的多維索引技術(shù),這里有如下兩個難題需要解決。(1)高維度特征向量的維度通常具有10²的數(shù)量級。(2)非歐拉相似性度量計算由于歐拉度量可能不適合對某些視覺內(nèi)容的人類感知的仿真,因此需要支持其它的各種相似性度量方法,如直方圖求交等。為解決高維索引問題,一種有前途的方法是首先減少維度,然后使用能支持非歐拉相似性度量的多維索引技術(shù)。1 維度壓縮有兩種方法可用于維度壓縮:一種是KL變換,另一種是列向聚類。KL變換及其變種己廣泛用于人臉識別、特征圖像以及信息分析。
27、Ng等人采用特征圖像的方法來進行維度壓縮。Faloutsos等人提出了KL變換的快速近似算法進行維度壓縮,研究結(jié)果表明,大多數(shù)實際圖像集(視覺特征向量)可以作維度壓縮,而且在檢索質(zhì)量上不會引來明顯的退化。Chandrasekaran等人提出了一種低秩單值分解法,在執(zhí)行KL變換時非常有效,且在數(shù)值上是穩(wěn)定的。由于圖像檢索系統(tǒng)是一個動念系統(tǒng),新的圖像會不斷地添入到圖像集合之中,該算法具有處理動態(tài)的索引更新能力。除了KL變換之外,聚類是另一個進行維度壓縮的有力工具,聚類技術(shù)廣泛用于模式識別、語音分析和信息檢索之中。通常,相似的對象(模板、信號和文檔)被聚在一起以執(zhí)行識別或者分組,這種聚類稱為行向聚類
28、,當然也可進行列向聚類以達到維度壓縮的目的。2 多維索引技術(shù)多維索引技術(shù)的研究主要在3個領(lǐng)域,即計算幾何、數(shù)據(jù)庫和模式識別。最流行的多維索引技術(shù)有K-d樹,R樹及其變種R+樹、R樹,四叉樹,聚類法,神經(jīng)網(wǎng)絡(luò)法等。多維索引技術(shù)始于70年代中期,當時引入的方法是Kd樹和四叉樹,然而其性能遠不盡人意。由于地理信息系統(tǒng)和計算機輔助設(shè)計系統(tǒng)中對空間索引的迫切要求,Guttman提出了R樹的索引結(jié)構(gòu),之后R樹的多個變種被相繼提出。過去,大多數(shù)關(guān)于樹的索引技術(shù)是為傳統(tǒng)的庫查詢提出的,而不是為圖像檢索中的相似查詢提出的。因此,目前多維索引的重點集中在圖像檢索中新的特征和需求上,即如何標識與改進適合于表達高維度
29、特征向量的索引技術(shù),其中二種有前途的方法是聚類法和神經(jīng)網(wǎng)絡(luò)法。2.3 檢索查詢方式在不同的應(yīng)用環(huán)境中,用戶可能會進行不同類型的查詢工作。因此,由用戶的不同需求產(chǎn)生了多種查詢方式,下面分別介紹。2.3.1外部圖例查詢外部圖例查詢(Query by External Pictorial)中的示例圖像來源于檢索系統(tǒng)的外部,也就是說給定的圖像不是數(shù)據(jù)庫中存儲的圖像。用戶可以數(shù)字化一張照片,也可以在Internet或別的什么地方找到一幅質(zhì)量比較好的圖片作為示例,要求系統(tǒng)在數(shù)據(jù)庫中搜索相似的圖像。外部圖例查詢的優(yōu)點是易用性好,缺點是需要付出一定的努力向系統(tǒng)提供外部示例圖像。2.3.2內(nèi)部圖例查詢內(nèi)部圖例查
30、詢(Query by Internal Pictorial Example)中的示例圖片是從檢索系統(tǒng)的數(shù)據(jù)庫中選出的。當沒有可用的外部示例圖片時,用戶可以從可用的圖像集合中選擇查詢圖片。系統(tǒng)在其它方面的功能與外部示例圖片基本一致。內(nèi)部圖例查詢的優(yōu)點是用戶不再為獲得一個外部示例圖片而煩惱,缺點是仍然需要用戶付出努力在數(shù)據(jù)庫中找到一幅合適的示例圖片。2.3.3草圖查詢草圖查詢(Query by Sketch)是圖例查詢的一種形式,其中的示例圖像由用戶創(chuàng)建,用戶為他希望得到的圖像勾畫一張草圖。用戶在查詢畫布上組織或編輯一些預定義的圖片元素以創(chuàng)建一幅示例圖像。因此,檢索系統(tǒng)必須為用戶提供一些圖像部件和
31、畫圖工具。與自然圖像相比,人工創(chuàng)作的草圖具有更高的抽象性,用戶只需勾畫出他所尋找的圖片的重要部分,在這方面草圖查詢要比其它使用已有圖片的圖例查詢更具優(yōu)勢。草圖查詢的缺點是它要求用戶或多或少要有一些藝術(shù)才能,因此,草圖查詢在大多數(shù)的場合下僅用來指出圖像中對象的位置或一些對象的全局屬性。可見,草圖查詢的優(yōu)點是用戶可以根據(jù)需要指出最重要、最感興趣的圖像細節(jié),缺點是草圖的創(chuàng)建比較困難,而且很難建立草圖與圖像之間的映射關(guān)系。2.4 圖像的相似性度量2.4.1概述在基于內(nèi)容的圖像檢索中,兩幅圖像是否相似是指圖像的特征向量是否相似。常用的圖像相似性測度通常采用幾何模型,將圖像特征看作是向量空間中的點,通過計
32、算兩個點之間的接近程度來衡量圖像特征之間的相似度?;趦?nèi)容的圖像檢索算法主要有最鄰近查詢算法和區(qū)間查詢算法,它們都依賴于距離函數(shù)或者相似性度量。在基于內(nèi)容的圖像檢索中,例子圖像查詢是主要的查詢方式。圖像或者圖像片段可以用一系列包含有d個特征(x1,x2,.,xd)的集合來表示,這些特征包括紋理、形狀、顏色以及它們之間的組合。在d維特征空間中,把特征聚合成為一個特征向量,可以根據(jù)不同坐標軸來標記相應(yīng)的特征。為了支持最鄰近查詢和區(qū)間查詢,特征空間必須與一個度量或者相似性測度相匹配。在圖像相似性測度中,可以采用各種距離函數(shù)或者距離度量、統(tǒng)計學方法和非幾何相似性測度方法。2.4.2相似性測度假設(shè)在圖像
33、數(shù)據(jù)庫中,用特征向量來表示任何一個圖像特征,其中X和Y,分別是任意兩個特征向量,它們滿足圖像相似性度量中的自相似性、最小性、對稱性和三角不等性度量公理,它們之間的接近程度可以采用距離度量或者統(tǒng)計學方法來進行圖像相似性判斷。常見的距離度量有歐幾里德距離、Manhattan距離、Minkowsky距離、Mahalanobis距離等。(1)歐幾里德距離歐幾里德距離是一個應(yīng)用非常普遍的距離度量。它的計算簡單,并且與參考系統(tǒng)的旋轉(zhuǎn)不變量相關(guān)。它的定義如下: (2-1)當發(fā)生數(shù)據(jù)丟失或者當所有特征向量不具備相同的權(quán)重時,那么就不能使用歐幾里德距離來進行相似性測度。為了避免這種情況,在實際的應(yīng)用過程中可以對
34、歐幾罩德距離進行歸一化。歸一化歐幾里德距離的定義如下所示: (2-2) (2)Manhattan距離Manhattan距離又叫街區(qū)距離,它與歐幾里德距離具有相同的計算復雜度,它的定義如下: (2-3) (3)Minkowsky距離Minkowsky距離的定義如下: (2-4)Minkowsky距離是一個距離函數(shù)系列,它的參數(shù)為P。在個別維數(shù)中,利用非負權(quán)重可以進行不同的加權(quán)計算。它的數(shù)學表達式如下: (2-5) (4)Mahalanobis距離它是一個計算復雜的權(quán)重歐幾里德距離。它根據(jù)一個協(xié)方差矩陣C來定義,它的定義如下所示: (2-6) C-1是C的協(xié)方差式逆矩陣,如果C是恒等矩陣,那么Ma
35、halanobis距離就變成歐幾里德距離。當特征向量的分向量之間沒有相關(guān)性,可以對Mahalanobis距離進行簡化。(5)相關(guān)系數(shù)它的定義如下: (2-7)其中=是數(shù)據(jù)庫中所有向量的均值。如果把點X和Y,投影到單位半徑為的球面上,量化為22p(X,Y),它就是投影區(qū)間的歐幾里德距離。在投影區(qū)間中,對應(yīng)于搜索空間的尺度和旋轉(zhuǎn)不變量就是相關(guān)系數(shù)。它可以用于統(tǒng)計任意變量的偶合行為屬性。(6)相對熵它僅僅應(yīng)用于隨機分布,它的定義如下所示: (2-8)僅僅當元素X和Y非負并且具有實際意義。因為它不具備對稱性,也不滿足三角形不等式,所以它不是距離度量。當它應(yīng)用于圖像檢索的時候,可以把第一個獨立變量作為查
36、詢向量,第二個獨立變量作為數(shù)據(jù)庫向量。(7)距離它僅僅應(yīng)用于隨機分布,它的定義如下: (2-9)當且僅當元素X和Y非負并且具有實際意義。它在計算量和分裂上的耗費很大。2.4.3非幾何相似性測度在實踐過程中,許多人發(fā)現(xiàn)距離度量方法與人對相似性的感知判斷之間存在一定差距。相似性度量中的自相似性、最小性、對稱性和三角不等性度量公理也同樣存在一些爭議。根據(jù)莊越挺、潘云鶴和吳飛編著的網(wǎng)上多媒體信息分析與檢索介紹,在1977年,Tversky提出了著名的特征對比模型。在特征對比模型中,它不是把每個實體看作特征空間中的一個點,而是把每個實體用一個特征集合來表示。假設(shè)兩個實體a和b,它們對應(yīng)的特征集合分別用A
37、和B來表示,兩個特征集合之間滿足匹配性、單調(diào)性和獨立性假設(shè)。根據(jù)下述假設(shè),Tversky提出的對比模型定理可以歸納為:如果滿足匹配性、單調(diào)性和獨立性假設(shè)的度量函數(shù),一定存在一個相似性度量函數(shù)S和一個非負函數(shù)f,以及兩個常量>0,對于實體a,b,c,d和它們的特征集合A,B,C,D,有如下公式: (2-10)是一個反映特征顯著性的函數(shù),它用來衡量指定特征對相似度的貢獻,時,相似函數(shù)是不對稱的。2.4.4小結(jié)歐幾里德距離的優(yōu)點是當對坐標軸進行正交旋轉(zhuǎn)時,歐幾里德距離保持不變,樣本集合仍然能夠保持原來的相似性結(jié)構(gòu)。它的缺點是平方根的計算比較費時并且它的數(shù)值不是整數(shù)。Minkowsky距離的計算
38、比較簡單,應(yīng)用比較廣泛。Minkowsky距離受到特征向量的量綱影響很大。在圖像檢索過程中,必須對數(shù)據(jù)進行標準化處理以統(tǒng)一量綱,使它具備度量的可比性和一致性。Minkowsky距離包含了特征屬性的差異,可以從總體上估計可視化非相似性。當特征向量具有不同取值范圍,利用加Minkowsky距離來進行圖像相似性測度比較合適。Minkowsky距離沒有考慮特征差異的組合,同時也沒有考慮特征向量的多重相關(guān)性,特別是當兩個特征具有高度相關(guān)性的時候,可能會對相似性測度產(chǎn)生很大影響。Mahalanobis距離的優(yōu)點是它重視樣本的統(tǒng)計特征,排除了樣本間的相關(guān)性影響。Mahalanobis距離是Minkowsky
39、距離的改進,它對于一切線性變換都具有不變性,克服了Minkowsky距離受量綱影響的缺點。非幾何相似性度量吸收了幾何相似性度量的優(yōu)點,提出了一個廣泛的理論衡量方法。在實際應(yīng)用中,它只適用于具有明顯特征的對象,同時在具體應(yīng)用環(huán)境中還需要明確顯著性函數(shù)的表達式??傊瑘D像相似性測度一般采用幾何模型,它對某些人類感受的相似性比較合適,與基于內(nèi)容的特征描述比較相似。在很多情況下,基于幾何模型的相似性測度與人類感受的相似性還存在很大差距。2.5 本章小結(jié)本章對基于內(nèi)容的圖像檢索進行了一個簡要的概述。分析了基于內(nèi)容的圖像檢索系統(tǒng)的基本原理,介紹了基于內(nèi)容的圖像檢索系統(tǒng)的通用框架、關(guān)鍵技術(shù)、檢索查詢方式和檢
40、索特點,最后介紹了圖像的相似性度量。3 基于紋理特征的圖像檢索算法研究紋理是描述圖像時常用的一個概念,類似于顏色,也常取決于感知。紋理特征是一種不依賴于顏色或亮度的反映圖像中同質(zhì)現(xiàn)象的視覺特征。它是所有物體表面共有的內(nèi)在特性,例如,云彩、樹木、磚、織物等都有各自的紋理特征。紋理特征包含了物體表面結(jié)構(gòu)組織排列的重要信息,以及它們與周圍環(huán)境的聯(lián)系。正因如此,紋理特征在基于內(nèi)容的圖像檢索中得到了廣泛應(yīng)用,用戶可以通過提交包含某種紋理的圖像來查找含有相似紋理的其它圖像。本章首先對紋理進行了概述,然后根據(jù)紋理的空間性質(zhì)和頻域性質(zhì)對基于紋理特征的圖像檢索算法進行了研究,總結(jié)出有效的檢索算法。3.1 紋理特
41、征概述盡管紋理在影像分析中十分重要而又普遍,但是到目前為止,對紋理還沒有一個確切的定義。人對紋理的感受是與心理效果相結(jié)合的,所以用語言或文字來描述紋理通常很困難。紋理具有區(qū)域性的特點,一個紋理需要用一個向量來表示,或者說一個紋理可用一個多維特征空間中的一個點表示。紋理可認為是灰度在空間以一定的形式變化而產(chǎn)生的圖案,是真實圖像區(qū)域固有的特征之一。任何物體的表面,如果一直放大下去進行觀察的話,一定會顯現(xiàn)出紋理。從心理學的觀點考慮,人類觀察到的紋理特征有粒度(granularity)、方向性(directionality)和重復性 (repetitiveness)等。一般來說,紋理和圖像頻譜中高頻分
42、量是密切聯(lián)系的,光滑的圖像一般不認為是紋理圖像。紋理是模式識別中用來辨別圖像區(qū)域的概念。常使用區(qū)域的尺寸、可分辨灰度元素的數(shù)目以及這些灰度元素的相互關(guān)系來描述一個圖像中的紋理區(qū)域。要分析紋理,需要確定一定的尺度,一幅紋理圖像在較粗的尺度上可能看不出紋理來,需要到更細的尺度上觀察。一般來說,可以認為紋理是由許多相互接近的、互相編織的元素構(gòu)成。所以,紋理描述可提供圖像區(qū)域的平滑、稀疏、規(guī)則性等特征?;谝陨险f明,一般把紋理視為兩種:結(jié)構(gòu)紋理和統(tǒng)計紋理。定義1:紋理是在某一確定的圖像區(qū)域中,以近乎周期性的種類和方式重復其自身的局部基本模式。在這一定義下,紋理由基本模式及其規(guī)則排列構(gòu)成,這形成了結(jié)構(gòu)法
43、紋理分析的基本步驟。定義2:紋理是在某一確定的圖像區(qū)域中,相鄰像素的灰度(或色調(diào)、顏色)服從某種統(tǒng)計排列形成的一種空間分布。這一定義要求通過統(tǒng)計方法實現(xiàn)對紋理的描述。紋理分析指的是通過一定的圖像處理技術(shù)抽取出紋理特征,從而獲得紋理定量的或定性描述的處理過程。紋理分析包括檢測紋理基元和獲得相關(guān)紋理基元排列分布方式的消息兩大部分。在一個尺度上進行紋理的分析和測量,研究圖像在小范圍內(nèi)的不規(guī)則性,稱之為微紋理分析。紋理具有多尺度特性,不同的尺度可對應(yīng)不同的紋理結(jié)構(gòu),在多尺度或多分辨率上分析紋理,稱之為宏紋理分析。常用的紋理分析方法有三種:統(tǒng)計分析方法、結(jié)構(gòu)分析方法和頻譜分析方法。一般來說,統(tǒng)計分析方法
44、應(yīng)用于微紋理(micro-texture)圖像的效果較好,而對宏紋理(macro-texture)圖像需要結(jié)合統(tǒng)計和結(jié)構(gòu)兩類方法進行分析。頻譜分析方法借助于傅立葉頻譜的頻率特征來描述周期的或近乎周期的二維圖像模式的方向性。1.統(tǒng)計分析方法統(tǒng)計分析方法是最早在紋理分析中應(yīng)用的方法之一,也是目前研究較多、占主導地位的一種方法。它利用圖像的統(tǒng)計特性求出特征值,基于圖像特征空間一致性進行分析。主要包括通過自相關(guān)函數(shù)、灰度共生矩陣、濾波模板、隨機模型(Markov隨機場模型、Gibbs隨機場模型)、分形模型等來計算紋理圖像的特征值。此類方法通過計算圖像中每個點的局部特征,從特征的分布中推導出一些統(tǒng)計量來
45、刻畫紋理,所以存在計算量大、分割精度差、抗噪能力差等缺點。該方法適合于廣泛存在的自然紋理,也同樣適于描述人工紋理,是目前較為成熟、實用的一類方法,在紋理特征提取中占主導地位。2.結(jié)構(gòu)分析方法結(jié)構(gòu)紋理分析方法認為紋理是由許多紋理基元組成的某種“重復性”的分布規(guī)則。結(jié)構(gòu)分析方法的基本思想認為復雜的紋理可由一些簡單的紋理基元以一定的有規(guī)律的形式重復排列組合而成。當紋理基元大到足夠單獨的被分割和描述時,才有必要使用結(jié)構(gòu)分析法。紋理結(jié)構(gòu)分析通常分三步驟:一是圖像增強;二是基元提??;三是計算紋理基元的特征參數(shù)及構(gòu)成紋理的結(jié)構(gòu)參數(shù)。3.頻譜分析方法頻譜分析方法借助于傅立葉頻譜的頻率特征來描述周期的或近乎周期
46、的二維圖像模式的方向性。對一個給定的圖像,二維傅立葉變換顯然能包含其全部的紋理信息。因此,如同從物體本身導出紋理特征一樣,從頻譜導出紋理特征也是很有用的。小波變換和Gabor濾波器是目前紋理分析中應(yīng)用最為廣泛的方法。在紋理分析領(lǐng)域,人們開展了深入的研究,結(jié)合多通道Gabor濾波、小波變換、神經(jīng)網(wǎng)絡(luò)、MRF(隨機場)、分形學等數(shù)學方法,對紋理分析提出了大量創(chuàng)新和改進,很大程度上提高了紋理分析的精度。如采用適合紋理分析的小波基對紡織品紋理進行缺損檢測,Ajay Kumar和Granthan KH Pang等人將Gabor濾波用于有紋理現(xiàn)象的物體結(jié)構(gòu)缺損檢測,KNBhanu Prakash等人利用灰
47、度共生矩陣對母體內(nèi)胎兒的肺部超生圖像檢測其是否已到成熟期。近年來國內(nèi)外一些學者提出了利用遺傳算法、模糊集理論、分形理論和神經(jīng)網(wǎng)絡(luò)等進行紋理分析,也在某些領(lǐng)域獲得了比較好的實驗結(jié)果。從上述對紋理分析方法的發(fā)展和應(yīng)用的介紹可以看出,基于統(tǒng)計的方法是應(yīng)用最多的一種方法,小波變換、Gabor濾波法適應(yīng)了紋理本身的多尺度特性,是目前發(fā)展較快,應(yīng)用較多的方法。本文主要應(yīng)用灰度共生矩陣、小波變換和梯度灰度共生矩陣等數(shù)學方法進行紋理特征提取,并對基于紋理特征的圖像檢索進行討論和研究。3.2 基于小波變換的紋理特征提取3.2.1圖像的小波變換用小波變換的方法分析紋理圖像時,如果紋理尺寸較小或?qū)Ρ榷炔桓?,通常采?/p>
48、較高的分辨率;如果尺寸較大或?qū)Ρ葟?,只需要較低的分辨率。因此,當紋理尺寸大小不一、對比度有強有弱時,這種方法提取特征參數(shù)有較大的優(yōu)勢,也符合紋理識別的特點。小波在圖像處理上的應(yīng)用思路主要采用將空間或者時間域上的圖像信號(數(shù)據(jù))變換到小波域上,成為多層次的小波系數(shù),根據(jù)小波基的特性,分析小波系數(shù)的特點,針對不同需求,結(jié)合常規(guī)的圖像處理方法(算法)或提出更符合小波分析新方法來處理小波系數(shù),再對處理后的小波系數(shù)進行反交換(逆變換),將得到所需的目標圖像?;谛〔ǚ治黾捌渥儞Q的圖像處理過程可以用圖3-1所示。小波正變換圖像處理小波逆變換圖像輸入圖像輸出圖3-1 小波與圖像處理為了將小波變換應(yīng)用于圖像處
49、理,需要有二維的小波函數(shù)和尺度函數(shù)。采用可分離變量的方法可以由一維小波函數(shù)(x)和尺度函數(shù)(x)構(gòu)造所需要的二維小波函數(shù),即: (3-1) (3-2) (3-3) (3-4)其中,是二維尺度函數(shù),、是三個二維小波函數(shù)。每個小波上的H表示水平方向,V表示垂直方向,D表示對角線方向。由式給出的尺度函數(shù)和小波函數(shù),可以定義一個伸縮和平移的基函數(shù): (3-5) (3-6) (3-7) (3-8)利用這些基函數(shù)就可對圖像f(x,Y)進行分解。圖3-2為圖像的小波分解示意圖。其中LLL2 HL2 HL1LH2 HH2LH1 HH1 LL1 HL1 LH1 HH1L H 原圖像 圖3-2 圖像的小波分解示意
50、圖表示低頻,H表示高頻,下標1、2分別表示一層、二層分解。圖像在每個尺度上被分解成四個子帶,其中LL為低頻子帶,是原圖像的平滑逼近;LH是沿水平方向的高頻子帶,反映圖像的水平邊緣情況;HL是沿垂直方向的高頻子帶,反映圖像的垂直邊緣情況;HH是沿對角方向的高頻子帶,反映圖像的斜邊緣情況。圖3-2表示的是金字塔結(jié)構(gòu)的迭代分解情況,即在該結(jié)構(gòu)分解中,僅分解LL子帶來生成下一尺度的各頻帶輸出,而不分解其它子帶。因為小波變換后的能量主要集中在低頻子帶。3.2.2小波基的選擇從理論上講,任何實正交的小波對應(yīng)的濾波器組(H)均能實現(xiàn)圖像的分解與合成,但是,并不是任何分解均能滿足要求,同一幅圖像用不同的小波基
51、進行分解所得到的數(shù)據(jù)壓縮效果是不同的。由于小波變換是將原始圖像與小波基函數(shù)以及尺度函數(shù)進行內(nèi)積運算,1989年Daubechies基于離散濾波器迭代的方法構(gòu)造了緊支集的規(guī)范正交小波集,因而內(nèi)積運算轉(zhuǎn)換為信號和離散濾波器的卷積運算,小波變換中的小波基的選取轉(zhuǎn)換為正交鏡像濾波器QMF的選取。小波基不是唯一的,對于小波基的選取(相當于對QMF的選取)一般情況下需考慮以下幾個因素:(1)線性相位特性:以減少或消除重構(gòu)圖像在邊緣處的失真。(2)緊支集特性:支集越短,小波變換的計算復雜度越低,便于快速實現(xiàn)。(3)消失矩特性:即(H), n=1,2,3,k-1。一般來說,k越大,小波變換后能量越集中于低頻子
52、帶,而在高頻子帶中則會出現(xiàn)更多的0。(4)所處理圖像與小波基的相似性。(5)綜合考慮壓縮效果和計算復雜度。圖像小波分解后的各層小波系數(shù)都包含了圖像中目標的信息,合適的選擇小波基可使小波變換空間能量集中,這樣有利于選取主要成份作為特征。研究表明在正交小波中,Haar小波在時域是不連續(xù)的,頻域的局部衰減特性也較差;Shannon小波恰好相反,頻域是不連續(xù)的,時域衰減性不好;Daubechies小波不具有對稱性(即不具有線性相位),以樣條函數(shù)作尺度函數(shù),然后正交得到的Battle-Lemarie小波不是緊支集的。Daubechies已經(jīng)證明,既具有緊支集,又具有對稱性的正交小波是不存在的。在利用小波
53、對圖像處理時,為了減少處理后圖像的相位延遲,通常要求小波具有對稱性,為此采用雙正交小波。在圖像壓縮算法中應(yīng)用的線性相位雙正交小波基,有保留空間細節(jié)的位置和集中能量壓縮信息的特性。3.2.3小波基的正則性階數(shù)從子帶編碼概念出發(fā),將一維子帶分解推廣到二維,從而實現(xiàn)圖像二維子帶編碼,其分解過程是靠精確重建濾波器組來實現(xiàn)的。子帶編碼與小波變換編碼都屬于多分辨率編碼(Mufti-resolution),它們的分解都相同,都可以用Mallat算法實現(xiàn)多級分解的遞推運算。它們之間的重要區(qū)別是小波分解要求濾波器具有正交性,而子帶編碼卻不要求。正則性是函數(shù)光滑程度的一種描述,也是函數(shù)頻域能量集中的一種度量。函數(shù)
54、的正則性有Sobolev定義和Holder兩種定義形式。定義(sobolev)3.1 若則稱函數(shù)具有r階正則性。此定義用得非常廣泛,且r的值可由估算出,但它沒有表現(xiàn)的波形與正則性的關(guān)系且忽略了濾波器的相應(yīng)信息。定義(Holder)3.2 設(shè)0<a<1,若對任意t,有則稱的Holder的正則性階數(shù)為a。其中c是一個與t,無關(guān)的常數(shù)。若的N階導數(shù)滿足上式且r=N+a,則稱的Holder正則性階數(shù)為r。小波函數(shù)或尺度函數(shù)的正則性與低通濾波器在的過零點數(shù)相關(guān),但這種聯(lián)系并不明顯。尺度函數(shù)的正則性或多或少是其光滑度的測量,更為特殊的是,如果尺度函數(shù)是m次可微的,其m次導數(shù)是指數(shù)為a的Holder連續(xù),那么它是a+m次正則的。對應(yīng)的小波函數(shù)與尺度函數(shù)具有相同的正則性。小波的正則性與濾波器的長度成正比,濾波器越長,支集越大,正則性越好,光滑性越好,但小波
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 小紅書:小紅書官方直播間三招教你賬戶成長
- 九年級化學下冊 第九章 現(xiàn)在生活與化學9.2 化學合成材料說課稿 (新版)粵教版
- 2024秋九年級語文上冊 第六單元 22《范進中舉》教學設(shè)計 新人教版
- 八年級道德與法治下冊 第一單元 堅持憲法至上 第一課 維護憲法權(quán)威 第1框 公民權(quán)利的保障書教案 新人教版
- 2024-2025學年高中歷史 第四單元 雅爾塔體制下的“冷戰(zhàn)”與和平 第15課“冷戰(zhàn)”的形成(1)教學教案 岳麓版選修3
- 2024-2025學年高中語文 第四單元 古代人物傳記 第12課 蘇武傳教案 新人教版必修4
- 2023三年級英語下冊 Unit 1 Let's go to school Lesson 1教案 人教精通版(三起)
- 租賃橋面板合同(2篇)
- 頤和園課件 總結(jié)
- 蘇教版江蘇省東臺市2023-2024學年高二上學期期末數(shù)學試題
- 根的構(gòu)造課件
- 芍藥文化課件
- 法律法規(guī)符合性評價記錄
- 小學數(shù)學西南師大三年級上冊八分數(shù)的初步認識分數(shù)的初步認識教學設(shè)計1
- 市場主體遷移申請書
- 2023科室醫(yī)療質(zhì)量、安全管理持續(xù)改進記錄本
- (完整word)大學西門子plcs7-1200考試復習習題
- 中考數(shù)學復習微專題:有理數(shù)運算中的錯解及對策
- DB11-972-2013保險營業(yè)場所風險等級與安全防范要求
- 高中政治部編版教材高考雙向細目表
- 輪扣式模板支撐架安全專項施工方案
評論
0/150
提交評論