基于內(nèi)容的圖像檢索界面設(shè)計(jì)_第1頁
基于內(nèi)容的圖像檢索界面設(shè)計(jì)_第2頁
基于內(nèi)容的圖像檢索界面設(shè)計(jì)_第3頁
基于內(nèi)容的圖像檢索界面設(shè)計(jì)_第4頁
基于內(nèi)容的圖像檢索界面設(shè)計(jì)_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、目錄TOC o 1-5 h z摘要2Abstract3 HYPERLINK l bookmark4 第一章緒論4 HYPERLINK l bookmark6 1.1引言4 HYPERLINK l bookmark8 CBIR的研究目的及意義5 HYPERLINK l bookmark10 CBIR的研究現(xiàn)狀6 HYPERLINK l bookmark12 第二章CBIR系統(tǒng)環(huán)境及框架8 HYPERLINK l bookmark14 2.1前言8 HYPERLINK l bookmark16 CBIR的系統(tǒng)功能9 HYPERLINK l bookmark18 CBIR的實(shí)例系統(tǒng)11 HYPERL

2、INK l bookmark36 第三章基于Oracle數(shù)據(jù)庫的圖像檢索系統(tǒng)設(shè)計(jì)14 HYPERLINK l bookmark38 系統(tǒng)組織結(jié)構(gòu)14 HYPERLINK l bookmark48 數(shù)據(jù)庫的設(shè)計(jì)及系統(tǒng)調(diào)用方法15 HYPERLINK l bookmark64 系統(tǒng)交互界面的設(shè)計(jì)與實(shí)現(xiàn)18 HYPERLINK l bookmark66 第四章結(jié)束語20 HYPERLINK l bookmark68 工作總結(jié)20 HYPERLINK l bookmark70 進(jìn)一步的工作20致謝錯(cuò)誤!未定義書簽。 HYPERLINK l bookmark72 參考文獻(xiàn)21 摘要基于內(nèi)容的圖像檢索是9

3、0年代以來逐漸興起的一個(gè)新的研究方向。傳統(tǒng)的圖像檢索方法是以數(shù)據(jù)庫技術(shù)為基礎(chǔ)、以大工作量的人工標(biāo)注為代價(jià)的基于文本的檢索。而我們要研究的基于內(nèi)容的圖像檢索,就是要以計(jì)算機(jī)視覺技術(shù)為依托,根據(jù)圖像的視覺特征(內(nèi)容),以模式匹配的方法進(jìn)行以計(jì)算機(jī)為主導(dǎo)的圖像檢索。它大大減少了人工標(biāo)注的沉重負(fù)擔(dān),提高了檢索的速度和效率,為圖像檢索的應(yīng)用提供了更廣闊的前景。首先是構(gòu)建一個(gè)圖像檢索系統(tǒng)的最基本技術(shù),包括圖像的預(yù)處理,圖像的顏色、紋理特征的提取及表示,視覺特征相似度量及兩圖像間的距離計(jì)算。其次我們介紹了為提高系統(tǒng)效率而采用的性能優(yōu)化方法,它可以從提高檢索的準(zhǔn)確度和速度兩個(gè)角度考慮,分別對應(yīng)于將人的因素引入

4、檢索過程的自相關(guān)反饋方法和事先對圖像集進(jìn)行聚類以減少檢索的計(jì)算量的矢量量化方法??傊疚脑谥攸c(diǎn)分析我們系統(tǒng)的基礎(chǔ)上,還對國內(nèi)外其它的典型系統(tǒng)作了介紹;在介紹系統(tǒng)中用到的一些關(guān)鍵技術(shù)實(shí)現(xiàn)方法的同時(shí),詳細(xì)分析了其背景知識(shí)和理論依據(jù);描述了系統(tǒng)的總體結(jié)構(gòu)。關(guān)鍵詞:基于內(nèi)容的圖像檢索,顏色特征,紋理特征,數(shù)據(jù)庫。AbstractContentBasedImageRetrieval(CBIR)hasbeenaveryactiveresearchareasince1990s,withthethrustfromtwomajorresearchcommunities,DatabaseManagementan

5、dComputerVision.ThetraditionalapproachofImageRetrievalisbasedonthetechnologyofDatabaseManagementSystems(DBMS),withthecostofheavyburdenofmanualannotation.TheproposedContentBasedImageRetrieval,however,isanewapproachbasedonComputerVision,PatternRecognitionwhichperformthecomputer-centeredimageretrievala

6、ccordingtothecontentofimages.First,thebasictechniquesforestablishingthepraticalCBIRsystem,suchas,imageprocessing,theextractingofvisualfeaturesforimageandthecomputingofsimilaritybetweenvisualfeaturesofdifferentimagesandfurthermorethecomputingofdistancebetweenimages.Second,theadvancedapproachtoimprove

7、systemperformance.Theycanbedividedintotwocategories:oneforimprovingtheaccuracyofretrievalandtheotherforimprovingthespeedofretrieval,inoursystem,formermethodisrelevancefeedbackandthelatterisvectorquantitation.Lateron,usingsemanticfeatureofimagesinCBIRsystem.Themodelforcombiningsemanticfeatureandvisua

8、lfeaturesofimagesintoonesystemisproposedInconclusion,thepurposeofthispaperistryingtobeacomprehensivearticleforCBIRsystem:Besidesconcentrateonoursystem,weintroducedsomeotherfamoussystemstoo.Inadditiontopresentedsomeimportantmethodsusedinoursystem,wealsogettothebottomoftheirtheoreticaloriginationandba

9、ckgroundknowledge.Therearealsosomedetailedanalysesoftypicalalgorithmsandnecessaryexperimentresultsinthispaper.Keywords:ContentBasedImageRetrieval,Color,Texture,Database第一章緒論引言隨著互聯(lián)網(wǎng)的逐漸普及和相關(guān)應(yīng)用技術(shù)迅速發(fā)展,尤其是多媒體技術(shù)的迅速發(fā)展,人們正面對著越來越多日益增長的信息,而信息早已成為當(dāng)今生活中極其重要的一種資源,能否有效的對這種資源進(jìn)行利用也已經(jīng)成為人們最關(guān)注的問題之一。計(jì)算機(jī)信息檢索技術(shù)正是作為解決這一問題

10、的關(guān)鍵環(huán)節(jié)開始被人們所認(rèn)識(shí)和研究的。從20世紀(jì)60年代開始,便有越來越多的人逐漸投入到這項(xiàng)工作中來。到了80年代后期,基于自由文本的搜索技術(shù)發(fā)展已比較成熟,一定程度上使得我們能夠從互聯(lián)網(wǎng)和大型數(shù)據(jù)庫里檢索出期望的信息。除了技術(shù)成熟之外,文本檢索直觀方便,且實(shí)現(xiàn)簡單,具有得天獨(dú)厚得優(yōu)勢。在今天,基于文本的檢索仍然占據(jù)了信息檢索應(yīng)用的主要部分,并且可以預(yù)見在今后相當(dāng)長的時(shí)間里仍將如此。然而同時(shí),信息檢索的對象也在不斷的擴(kuò)展。多媒體信息已逐漸成為信息的主導(dǎo)形式,它融合包含了圖像、圖形、文本、聲音、視頻等的種種內(nèi)容,原本單純的文本檢索顯然已經(jīng)不能夠適用于多媒體信息檢索的各個(gè)方面,因此人們開始研究針對多

11、媒體信息的新的檢索技術(shù)。研究表明,視覺信息在多媒體信息中起著主導(dǎo)作用,其所包含的信息量很大,而且人的視覺系統(tǒng)的識(shí)別和處理能力也非常強(qiáng)大。在視覺信息系統(tǒng)中起著關(guān)鍵性作用的是圖像信息。人們在日常生活當(dāng)中會(huì)不斷的接收到大量的圖像信息。這些圖像信息除了包含靜態(tài)圖像之外,還包含視頻、圖形、動(dòng)畫,乃至各種符號文字。與此同時(shí),科學(xué)文化、商業(yè)、教育、娛樂、醫(yī)療等各個(gè)領(lǐng)域也都在不斷的產(chǎn)生著新的圖像數(shù)據(jù),如NASA的地球觀測系統(tǒng)每天就能產(chǎn)生約1TB左右的圖像數(shù)據(jù)。圖像信息所包含的內(nèi)容豐富多變,并且其內(nèi)容常因人們視覺主觀感受的不同而存在差別。傳統(tǒng)的圖像檢索和管理技術(shù)在圖像內(nèi)容描述和檢索方面往往會(huì)因缺乏靈活性而顯得過

12、于呆板,而且面對復(fù)雜應(yīng)用或大量不斷變化著圖像資源時(shí)效率低下。新的圖像檢索和管理技術(shù)已經(jīng)成為人們?nèi)粘9ぷ魃畹钠惹行枰F浼夹g(shù)根本在于對圖像內(nèi)容的獲取和管理,只有這樣,才能實(shí)現(xiàn)圖像系統(tǒng)的智能化和高效率。最終我們需要考慮的是一個(gè)綜合了多個(gè)研究領(lǐng)域,如數(shù)字圖像處理,圖像理解,數(shù)據(jù)庫,信息檢索,計(jì)算機(jī)視覺和人工智能等的圖像信息檢索及管理的方法。CBIR的研究目的及意義傳統(tǒng)的圖像檢索方法是使用文本信息來描述圖像的內(nèi)容.通過對文本關(guān)鍵字的檢索匹配達(dá)到檢索圖像的目的。這種方式直觀簡單,而且能夠從用戶角度表達(dá)圖像內(nèi)容的高層語義。早期的圖像數(shù)據(jù)庫如KodakPictureExchangeSystem(KPX),

13、ThePressLinkLibrary等都采用了這種檢索方式在圖像數(shù)據(jù)庫規(guī)模不大,圖像內(nèi)容相對簡單的時(shí)候,基于文本的檢索方式能夠達(dá)到令人滿意的效果。然而,隨著圖像數(shù)據(jù)庫規(guī)模越來越大,并且圖像中所包含的信息和內(nèi)容也越來越豐富,傳統(tǒng)的文本檢索方式己不能夠勝任。一方面,文本描述和關(guān)鍵字設(shè)定主要依靠人的工作,自動(dòng)化程度很低,費(fèi)時(shí)費(fèi)力:另一方面,對于復(fù)雜的圖像,不同的人有不同的主觀感受,因此可能造成文本信息的不穩(wěn)定,從而會(huì)影響檢索結(jié)果的準(zhǔn)確性和可靠性。上世紀(jì)90年代初,基于內(nèi)容的圖像檢索(Content-BasedImageRetrieval,CBIR)技術(shù)的出現(xiàn)突破了傳統(tǒng)圖像檢索方法的局限性。它利用圖

14、像處理,圖像理解等技術(shù)獲得圖像以及圖像中對象的內(nèi)容信息并加以表示,檢索則根據(jù)圖像的內(nèi)容語義和上文聯(lián)系進(jìn)行.基于內(nèi)容的圖像檢索提供了一種在海量圖像或視頻庫中進(jìn)行有效檢索的方法,因而在許多領(lǐng)域都有著重要的應(yīng)用價(jià)值,在某種程度上已經(jīng)實(shí)用或正處于研究階段的應(yīng)用方向士要包括:互聯(lián)網(wǎng)應(yīng)用主要包括多媒體搜索引擎,電子商務(wù),視頻點(diǎn)播等。生物醫(yī)學(xué)中的應(yīng)用主要包括癌細(xì)胞識(shí)別,顯微圖像、X光圖像及超聲圖像的分析處理。CT,MRI及Y射線圖像分析處理,病理組織切片分析,染色體分析,內(nèi)臟大小形狀及異常檢查,熱像分析和紅外像分析等。遙感航大中的應(yīng)用主要包括多光譜衛(wèi)星圖像分析,地形、地圖和國土普查,地質(zhì)礦藏勘探,森林資源勘

15、探、分類、防火,水利資源探查及洪水泛濫檢測,海洋及漁業(yè)資源監(jiān)測預(yù)報(bào),氣象及大氣預(yù)報(bào)圖的合成及分析預(yù)報(bào),大文探測和分析,道路交通檢測和管理等。工業(yè)應(yīng)用主要包括零件和產(chǎn)品的無損檢測,紡織、刺繡的花型和圖案設(shè)計(jì)等。軍事及公安領(lǐng)域的應(yīng)用主要包括軍事偵察、定位和引導(dǎo),目標(biāo)識(shí)別與制導(dǎo),雷達(dá)地形偵察,人像鑒定識(shí)別,印章鑒定識(shí)別等??傊?,CBIR技術(shù)是解決多媒體信息檢索的有效途徑。海量圖像數(shù)據(jù)庫的檢索是其主要的應(yīng)用方向。技術(shù)的不斷發(fā)展和新技術(shù)的產(chǎn)生為CBIR提供了廣闊的前景,人們?nèi)粘I詈凸ぷ鞯谋姸喾矫娑紩?huì)成為CBIR的應(yīng)用領(lǐng)域,CBIR也將為人們帶來新的體驗(yàn)和感受。CBIR的研究現(xiàn)狀自從基于內(nèi)容的圖像檢索誕

16、生之日起,技術(shù)的不斷進(jìn)步和美好前景使人們對其的關(guān)注也在與日俱增。今天,涉及到CBIR的各個(gè)方面的最大研究工作正在投入進(jìn)行中。這些工作主要包括以下幾個(gè)方面:1.圖像語義特征的提取和表示。圖像的語義特征可分為底層語義特征和高層語義特征。底層語義特征是從圖像視覺特征出發(fā)獲得的,包括顏色特征、形狀特征、紋理特征等等。對顏色特征而言。顏色直方圖是最早和目前采用最為廣泛的描述方式,由Swain和Ballard于1991年提出。除此之外,Stricker等提出了顏色矩的方法:Smith等還提出了顏色集的概念,Kankanhalli等則采用了顏色聚類的方法。顏色特征可作為全局特征和局部特征考慮,為了考查圖像的

17、局部特征,通常采用的方法是對圖像進(jìn)行分割或分塊。對形狀特征而言,較為成熟的播述方法有斜率直方圖邊緣點(diǎn)方向直方圖邊界鏈碼,形狀不變矩等。然而形狀特征的提取相對比較困難,一般只適用于簡單圖形或二值圖像。紋理特征可分為基于統(tǒng)計(jì)的紋理特征和基丁結(jié)構(gòu)的紋理特征。Haralick提出了灰度共生矩陣(Co-occurrenceMatrix)的概念,并由此提取其統(tǒng)計(jì)特征作為圖像紋理的描述中提出的Tamura紋理能較好的對應(yīng)于人類的視覺感知,引入了MRSAR(Multi-ResolutionSimultaneousAuto-RegressiveModel)模型:使用了樹式小波變換和Gabor小波變換來提取圖像紋

18、理特征圖像的高層語義特征往往與人的主觀認(rèn)識(shí)有關(guān),因此對其的表示和提取更加困難.2圖像數(shù)據(jù)庫的生成和索引。為了進(jìn)行基于內(nèi)容的檢索而提取的圖像特征矢量需要存放在數(shù)據(jù)庫中,以便管理和索引。這些特征矢量往往維數(shù)可高達(dá)數(shù)十維。在組合檢索時(shí)甚至是上百維,并且特征矢量之間需要進(jìn)行復(fù)雜的聯(lián)合、比對、以及成組的插入刪除等操作。如何有效的對圖像數(shù)據(jù)庫進(jìn)行組織和索引是關(guān)系到CBIR系統(tǒng)性能的重要因素。這涉及到高維索引技術(shù)以及數(shù)據(jù)庫技術(shù)。目前這方面的研究工作主要針對于對高維索引的降維方法和建立多維索引的方法,以及對關(guān)系數(shù)據(jù)庫的改進(jìn)以便給予多媒體數(shù)據(jù)更好的支持等等。3.CBIR系統(tǒng)結(jié)構(gòu)接口CBIR的應(yīng)用主要有兩類,一類

19、是面向特定領(lǐng)域的應(yīng)用,另一類是面向網(wǎng)絡(luò)的應(yīng)用。具體來說,不同場合和不同目的的CBIR系統(tǒng),其所擁有的功能,數(shù)據(jù)庫組織,系統(tǒng)環(huán)境和檢索機(jī)制等也不相同,因此需要有與之相匹配的系統(tǒng)結(jié)構(gòu)作為支撐,以發(fā)揮出CBIR的最大功效。目前,CBIR的各個(gè)功能模塊的劃分已得到普遍的認(rèn)可,進(jìn)而產(chǎn)生了擁有清晰層次結(jié)構(gòu)的系統(tǒng)框架。在系統(tǒng)環(huán)境方面,基于Web模式的CBIR系統(tǒng)因具有非常廣闊的應(yīng)用前景而受到人們越來越多的關(guān)注。另外,分布式的檢索系統(tǒng)能夠突破集中式體系結(jié)構(gòu)的局限,在系統(tǒng)相應(yīng)速度、檢索速度和穩(wěn)定性方面擁有更為良好的性能,因而也在人們的研究范圍之內(nèi)。第二章CBIR系統(tǒng)環(huán)境及框架前言實(shí)現(xiàn)基于內(nèi)容的圖像檢索的一個(gè)重要

20、方面是CBIR系統(tǒng)本身。作為技術(shù)和算法的實(shí)現(xiàn)平臺(tái)和載體,良好的系統(tǒng)構(gòu)架所提供的易維護(hù)性、可擴(kuò)充性和穩(wěn)定性等等是實(shí)現(xiàn)CBIR設(shè)計(jì)目標(biāo)的重要保證:另外,系統(tǒng)所提供的方便友好的用戶交互手段也是CBIR得以實(shí)用的必要條件。自從基于內(nèi)容的圖像檢索誕生以來,人們對CBIR系統(tǒng)應(yīng)用模式的研究也在不斷的進(jìn)行中。隨著互聯(lián)網(wǎng)的不斷發(fā)展和Internet上圖像數(shù)據(jù)的迅速增加,目前,設(shè)計(jì)和實(shí)現(xiàn)面向網(wǎng)絡(luò)環(huán)境的CBIR系統(tǒng)已經(jīng)成為該領(lǐng)域未來主要的發(fā)展方向.在網(wǎng)絡(luò)環(huán)境的應(yīng)用系統(tǒng)設(shè)計(jì)主要可遵循兩種模式,即Client/Server模式和Browser/Server模式,二者有各自的優(yōu)缺點(diǎn)和適用范圍。一般來說,C/S模式中客戶

21、端的計(jì)算資源能夠得到更好的利用,很多工作可以在客戶端完成,如:自定義的用戶界面,豐富多變的交互方式,用戶查詢要求的抽象表示及調(diào)整,以及檢索結(jié)果的組織、緩存和顯示等等;然而胖客戶所引發(fā)的諸如系統(tǒng)維護(hù)和更新困難等問題在C/S模式下很難得到解決,另外客戶端與用戶操作系統(tǒng)平臺(tái)的相關(guān)性也使得系統(tǒng)的應(yīng)用受到局限。相比之下,B/S模式使用遵循一系列統(tǒng)一標(biāo)準(zhǔn)的Browser作為客戶端,用戶可以跨平臺(tái)使用系統(tǒng)所提供的服務(wù)。同時(shí),由于應(yīng)用程序邏輯部分和絕大多數(shù)計(jì)算工作都由服務(wù)器端集中處理,因此整個(gè)系統(tǒng)的維護(hù)和更新任務(wù)也將能夠集中在服務(wù)器端進(jìn)行,從而使得這一過程變得更加簡單可靠。另一方面,Browser風(fēng)格的客戶端

22、能夠提供清晰統(tǒng)一的用戶界面,使得用戶的操作更加方便容易。除此之外,隨著Web技術(shù)的發(fā)展,目前大多數(shù)瀏覽器都通過對Java等的支持在一定程度上彌補(bǔ)了僅使用單純的Web頁面與用戶交互時(shí)的局限性。然而,CBIR系統(tǒng)的層次結(jié)構(gòu)相對復(fù)雜,因此無論是選擇C/S模式還是B/S模式,在進(jìn)行系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)時(shí)都應(yīng)當(dāng)對系統(tǒng)的可理解性,可擴(kuò)充性,可復(fù)用性以及負(fù)載平衡等方面給予充分的考慮,這需要軟件工程和軟件方法學(xué)等方面理論技術(shù)的指導(dǎo)。而在這一點(diǎn)上,Model/View/Controller(MVC)是被廣泛接納和采用的設(shè)計(jì)模式。MVC模式體現(xiàn)了問題分層的思想。傳統(tǒng)的MVC模式僅針對程序設(shè)計(jì)方法而言,隨著對問題認(rèn)識(shí)的

23、深入,MVC模式的含義也發(fā)生了變化,其涵蓋面得到了擴(kuò)展,從而成為了系統(tǒng)設(shè)計(jì)階段應(yīng)用程序框架構(gòu)建的一種指導(dǎo)方法。一般而言,Model指的是數(shù)據(jù)模型,也就是問題的表示,它代表了所處理的對象。模型可大可小,從一種數(shù)據(jù)結(jié)構(gòu)到整個(gè)應(yīng)用程序?qū)ο蠖伎梢宰鳛槟撤N意義上的模型,然而無論是哪種模型,都要求對其所表示對象進(jìn)行合理的封裝;View指的是Model的展示以及與用戶的交互方式,因此通常會(huì)涉及到系統(tǒng)的用戶界面,是應(yīng)用程序與用戶的接口部分。一個(gè)Model可能會(huì)擁有多個(gè)與之相關(guān)的View;Controller指的是應(yīng)用程序邏輯,它負(fù)責(zé)響應(yīng)用戶輸入和程序事件,改變Model的狀態(tài),并控制協(xié)調(diào)整個(gè)應(yīng)用程序的流程,維

24、持系統(tǒng)內(nèi)部邏輯的一致性。與C/S模式相比,B/S模式在實(shí)現(xiàn)時(shí)系統(tǒng)層次的劃分通常更加明確,這種層次劃分是由B/S模式中較為固定的系統(tǒng)框架原型所決定的。而B/S模式的系統(tǒng)框架往往與MVC模式的出發(fā)點(diǎn)有很多共通之處,因此,在B/S模式下MVC模式的引入會(huì)更加簡單自然。在設(shè)計(jì)和實(shí)現(xiàn)基于內(nèi)容的圖像檢索系統(tǒng)時(shí),首先要根據(jù)實(shí)際應(yīng)用情況權(quán)衡利弊,選擇適當(dāng)?shù)南到y(tǒng)環(huán)境;接下來需要充分考慮基于內(nèi)容檢索系統(tǒng)的功能要求,并對其進(jìn)行分解和模塊化工作:最后在此基礎(chǔ)上對各個(gè)模塊考慮采用適當(dāng)?shù)脑O(shè)計(jì)模式進(jìn)行實(shí)現(xiàn)。以上是CBIR系統(tǒng)環(huán)境和框架設(shè)計(jì)的主要方面。CBIR的系統(tǒng)功能一個(gè)完整的CBIR系統(tǒng)通常由兩個(gè)子系統(tǒng)構(gòu)成:即圖像數(shù)據(jù)庫

25、生成子系統(tǒng)和圖像查詢子系統(tǒng)。前者負(fù)責(zé)離線(Off-line)提取圖像特征并創(chuàng)建索引,后者負(fù)責(zé)在線(On-line)檢索圖像。每個(gè)子系統(tǒng)有可進(jìn)一步按功能劃分為相應(yīng)的子模塊,整個(gè)CBIR系統(tǒng)的功能框架如圖3.1所示,各部分的具體含義如下:圖像預(yù)處理在對圖像進(jìn)行特征提取之前,可能需要對圖像進(jìn)行一系列預(yù)處理的工作,如調(diào)整圖像的大小、去噪、圖像的增強(qiáng)等等。目的是統(tǒng)一圖像的尺寸或者提高圖像的質(zhì)量.以便接下來的處理能夠獲得更好的效果。對象的標(biāo)識(shí)除了預(yù)處理,某些情況下還可能需要對圖像做進(jìn)一步的標(biāo)識(shí),如圖像邊緣的檢測,圖像對象的分割等等。這些信息能夠有效的指導(dǎo)接下來特征提取任務(wù)的作用范圍和具體方法的選擇。尤其是

26、在對象分割明確的情況下,特征提取將能夠獲得關(guān)于圖像高層語義的更多信息。特征提取即針對圖像的局部(分塊或標(biāo)識(shí)出的對象)或全局,提取能夠表示圖像語義特征的數(shù)據(jù),并將所提取的特征與圖像關(guān)聯(lián)起來,保存在圖像庫中。圖像數(shù)據(jù)庫圖像數(shù)據(jù)庫可分為兩個(gè)部分:圖像庫和特征庫。圖像庫中存放的是圖像的原始數(shù)據(jù)及其對應(yīng)的基本信息;特征庫中存放的是圖像庫中圖像對應(yīng)的特征數(shù)據(jù)。一般而言,圖像原始數(shù)據(jù)可以直接利用諸如BLOB的數(shù)據(jù)類型存放在數(shù)據(jù)庫中,然而更常見的做法是利用文件系統(tǒng)保存,而數(shù)據(jù)庫中只存放相關(guān)的文件索引。特征庫中所存放的特征一般以向量的方式組織,對于高維的特征向量還可以利用樹、聚類等高維索引技術(shù)提高索引的效率。另

27、外,CBIR系統(tǒng)中所使用的輔助知識(shí)也可以組織成知識(shí)庫,保存在圖像數(shù)據(jù)庫中。用戶查詢接口用戶查詢接口的一個(gè)重要作用是提供讓用戶提交查詢需求的手段,如按示例檢索,按草圖檢索,隨機(jī)瀏覽等等;另外,用戶的查詢應(yīng)當(dāng)可以針對圖像不同的視覺特征,還應(yīng)當(dāng)可以針對圖像的某一局部或是全部等等。查詢接口的另一個(gè)重要作用是檢索結(jié)果的返回和顯示,這是實(shí)現(xiàn)檢索目的所必不可少的。用戶相關(guān)反饋相關(guān)反饋是提高檢索精度的有效手段。它需要用戶參與檢索的過程,通過評價(jià)每次檢索結(jié)果的方式來干預(yù)檢索引擎的行為,從而期望下一步檢索能夠得到更加滿意的結(jié)果。檢索引擎檢索引擎負(fù)責(zé)根據(jù)用戶的檢索需求,在圖像數(shù)據(jù)庫中通過特征匹配的方法進(jìn)行檢索。并將

28、檢索結(jié)果予以保存。檢索引擎可能包含了多種檢索策I略,它們各自使用不同的特征匹配方法,針對不同的檢索需求,檢索引擎選擇適當(dāng)?shù)臋z索策略。對象標(biāo)識(shí)*比特征提取1科檢索引華4囹像數(shù)據(jù)褲f圖喙斥、特W)j一_數(shù)據(jù)庫生成子系統(tǒng);劃像責(zé)詢于系統(tǒng)(Off-line):(On-line)圖2.1CBIR的功能框圖CBIR的實(shí)例系統(tǒng)基于內(nèi)容的圖像檢索從誕生至今,已經(jīng)吸引了大量研究機(jī)構(gòu)、人學(xué)、乃至企業(yè)的關(guān)注。人們在開展研究T作的同時(shí),也開發(fā)出了許多CBIR的原型系統(tǒng)。這些原型系統(tǒng)大都被安置在Internet上供演示和試用,然而,也有一些系統(tǒng)的成果已經(jīng)成功的實(shí)現(xiàn)了商業(yè)化,如在OracleTM810中提供了ImageD

29、ataCartridges和VirtuallmageRetrievalCartridges,采用的即是Virage公司的圖像查詢引擎.下面我們將對目前主要的CBIR實(shí)例系統(tǒng)做簡單的介紹:QBICQBIC(QueryByImageContent)是由IBMT.J.Watson研究中心于90年代開發(fā)的。它的出現(xiàn)對子CBIR系統(tǒng)框架和技術(shù)產(chǎn)生了深遠(yuǎn)的影響,因此最常被人們作為CBIR的原型系統(tǒng)而廣泛引用。QBIC提供對大型圖像和視頻數(shù)據(jù)庫的查詢檢索,支持多種混合的檢索方式,包括基于圖像顏色及其分布、紋理、形狀、用戶構(gòu)造的草圖、多對象(Multi-Object)以及基于示例圖像的查詢(QBE),同時(shí)也提

30、供了一組豐富的圖形用戶接口。QBIC中使用的顏色特征為k=64的顏色直方圖;紋理特征為Tamura紋理表示的一種改進(jìn),即粗糙度、對比度和方向的結(jié)合:形狀特征包括面積、圓形度、偏心度、主軸偏向和一組代數(shù)不變矩。QBIC是少數(shù)考慮了高維特征索引的系統(tǒng)之一,其索引模塊先使用K-L變換降低特征維數(shù),再利用R*樹構(gòu)造多維索引結(jié)構(gòu)OQBIC同時(shí)支持基于文本關(guān)鍵字的汽詢和基于圖像內(nèi)容相似性的查詢,并將二者結(jié)合在一起。VisualSeek/WebSeekVisualSeek是由美國哥倫比亞大學(xué)電子工程系與電信研究中心圖像和高級電視實(shí)驗(yàn)室共同開發(fā)的圖像檢索系統(tǒng),其姊妹系統(tǒng)WebSeek是面向WWW的文本和圖像搜

31、索工具。VisualSeek支持兩種CBIR技術(shù):基于顏色直方圖和基于顏色區(qū)域空間位置關(guān)系的查詢。系統(tǒng)使用的視覺特征包括顏色集(ColorSet)和基于小波變換的紋理特征。采用的索引結(jié)構(gòu)是基于二叉樹的索引結(jié)構(gòu)VirageVirage由美國Virage公司開發(fā),支持基于圖像顏色、顏色布局、紋理和結(jié)構(gòu)指對象的邊界信息)的可視化查詢Virage比QBIC更進(jìn)一步,支持由上述四個(gè)原子查詢的任意組合,其最大特點(diǎn)在于:用戶可以按自己的需要調(diào)整這些檢索特征的權(quán)值,從而可以控制檢索的方向。Virage還提出了圖像管理的一個(gè)開發(fā)式框架,將視覺特征稱為原語(Primitive),并按通用型(顏色、形狀和紋理等)和

32、領(lǐng)域相關(guān)型(如面部識(shí)別、癌細(xì)胞檢測等)分類。不同的“原語”可以按領(lǐng)域的要求加入開放式框架。MARSMARS(MultimediaAnalysisandRetirevalSystem)是由美國UUC(UniversityofIllinoisatUrbana-Champaign)大學(xué)開發(fā)的。它與其他系統(tǒng)在研究范圍和技術(shù)上都有不同,是對計(jì)算機(jī)視覺、數(shù)據(jù)庫管理系統(tǒng)和信息檢索三個(gè)領(lǐng)域進(jìn)行交又研究的結(jié)果MARS系統(tǒng)的研究重點(diǎn)在于如何把不同的視覺特征組織成為一個(gè)可以動(dòng)態(tài)適應(yīng)于不同應(yīng)用和不同用戶的、具有實(shí)際意義的檢索機(jī)制。MARS正式提出了針對圖像檢索的相關(guān)反饋(RelevenceFeedback)結(jié)構(gòu)。該結(jié)

33、構(gòu)通過用戶反饋對系統(tǒng)參數(shù)進(jìn)行調(diào)整,以求能滿足用戶的特定需求。PhotobookPhotobook是由美國MTr媒體實(shí)驗(yàn)室開發(fā)的用于圖像瀏覽和搜索的一套交互式工具。其檢索使用形狀、紋理和面部外形三種特征,同時(shí)還能結(jié)合文本關(guān)鍵字進(jìn)行查詢。在Photobook的最近的擴(kuò)展版本FourEyes中,考慮到?jīng)]有一個(gè)單獨(dú)的特征可以很好的表示一組任意的圖像集,提出了一個(gè)基于統(tǒng)計(jì)學(xué)習(xí)的“模型集”(SocietyofModels)概念,提供了基于用戶提供的圖像進(jìn)行特征的交互性學(xué)習(xí)的方法。該方法在交互式圖像注釋中很有效。除了以上介紹的CBIR系統(tǒng)之外,比較成功的類似系統(tǒng)還有:美國德克薩斯大學(xué)的CIRES系統(tǒng):美國斯

34、坦福大學(xué)的SIMPLIcity(Semantics-sensitiveIntergratedMatchingforPictureLibraries)系統(tǒng);UCSBAlexandriaDigitalLibrary的Netra原型系統(tǒng);UCBerkley大學(xué)的Chabot系統(tǒng)等。另外,國內(nèi)一些科研機(jī)構(gòu)和院校也設(shè)計(jì)實(shí)現(xiàn)了一些CBIR原型系統(tǒng):如浙江大學(xué)的基于圖像顏色的檢索系統(tǒng)PhotoNavigator:中科院計(jì)算機(jī)技術(shù)研究所的多媒體信息檢索系統(tǒng)MIRES;華中科技大學(xué)圖像處理和智能系統(tǒng)中心的PicSeeker原型系統(tǒng)等。第三章基于Oracle數(shù)據(jù)庫的圖像檢索系統(tǒng)設(shè)計(jì)3.1系統(tǒng)組織結(jié)構(gòu)實(shí)現(xiàn)一個(gè)基于O

35、racle數(shù)據(jù)庫的圖像檢索系統(tǒng),該系統(tǒng)運(yùn)行于MicrosoftWindowsXP/2000操作系統(tǒng)上,目前己有的功能是:圖像的順序?yàn)g覽、基于范例的圖像檢索。系統(tǒng)可分為以下幾個(gè)部分Oracle數(shù)據(jù)庫為了提高系統(tǒng)的效率及智能化程度,圖像及其特征信息必須加以保存,文件方式的保存方法由于使用不靈活以及不能很好的支持查詢,圖像檢索系統(tǒng)已經(jīng)很少用到;Oracle數(shù)據(jù)庫是全球用戶量最多的數(shù)據(jù)庫,具有使用靈活、穩(wěn)定可靠、及對存儲(chǔ)查詢的優(yōu)化方便等優(yōu)點(diǎn),又由于它是一個(gè)Window:和UNIX操作系統(tǒng)通用的數(shù)據(jù)庫系統(tǒng),可以很方便的在各個(gè)系統(tǒng)中移植,且在網(wǎng)絡(luò)支持方面已有很多的可利用資源,因此,為了使我們的系統(tǒng)能夠在將

36、來有更大的應(yīng)用空間,我們使用Oracle數(shù)據(jù)庫作為我們的圖像檢索系統(tǒng)的底層數(shù)據(jù)庫。系統(tǒng)與Oracle數(shù)據(jù)庫接口在定義好數(shù)據(jù)庫結(jié)構(gòu)后,系統(tǒng)與數(shù)據(jù)庫的接口部分就是我們開發(fā)人員所必須加以考慮的因素了,如何充分利用Oracle數(shù)據(jù)庫的各種數(shù)據(jù)支持,發(fā)掘其對多媒體數(shù)據(jù)及隨機(jī)查詢的強(qiáng)大支持,選擇一個(gè)高效的系統(tǒng)與數(shù)據(jù)庫接口方法是問題的關(guān)鍵在于。特征提取及圖像處理子系統(tǒng)在數(shù)據(jù)庫問題解決之后,基于內(nèi)容的圖像檢索的核心部分就浮出水面:如何選擇圖像的視覺特征,如何確定這些特征的表示方法,如何組織和歸整多種特征及特征表示以達(dá)到更好的圖像檢索效果,這些問題決定了一個(gè)圖像檢索系統(tǒng)的優(yōu)劣。同時(shí),為了提高系統(tǒng)效率以及方便用戶

37、的個(gè)性化查詢,還需要對圖像做一些預(yù)處理。圖像文本標(biāo)注及管理子系統(tǒng)盡管基于內(nèi)容的圖像檢索是當(dāng)前研究的主流,但基于文本的檢索同樣有其不可替代的優(yōu)點(diǎn),目前各種圖像檢索系統(tǒng)中無一例外地保留了文本檢索的功能。它具有方便Web方式的查詢,有利于用戶在沒有可用圖像作為范例時(shí)使用系統(tǒng),同時(shí)用層次化關(guān)鍵字結(jié)構(gòu)也可以方便大圖像數(shù)據(jù)庫的分類管理。統(tǒng)一的用戶界面在實(shí)現(xiàn)了基于圖像視覺特征和語義特征的檢索后,我們需要一個(gè)統(tǒng)一的用戶交互界面將兩種檢索功能結(jié)合起來,使用戶可以方便的從一種檢索轉(zhuǎn)到另一種檢索,同時(shí)兩種檢索的結(jié)果可以互相利用。下面是我們系統(tǒng)中上述五個(gè)部分的系統(tǒng)結(jié)構(gòu)圖:圖象視覺、語義特征相結(jié)合的統(tǒng)一用戸脊詢界面可視

38、化的用戶友好界面圖象文本標(biāo)注、存儲(chǔ)、特征提取及圖象處理子系統(tǒng)管理子系統(tǒng)tVC與Oracle接口TheOnicteObjectsforOLEC+Oracle數(shù)據(jù)庫圖象視覺特征庫、文本標(biāo)注庫圖象其他信息庫(文件名等)圖3.1系統(tǒng)結(jié)構(gòu)圖面將詳細(xì)講解系統(tǒng)的各個(gè)部分?jǐn)?shù)據(jù)庫的設(shè)計(jì)及系統(tǒng)調(diào)用方法由于我們使用了Microsoft公司的VisualC十十作為主要的系統(tǒng)開發(fā)工具,下面將詳細(xì)討論VC與Oracle數(shù)據(jù)庫的接口問題,這曾經(jīng)是我們系統(tǒng)開發(fā)的一個(gè)難點(diǎn),也是大家選擇不同公司的產(chǎn)品進(jìn)行系統(tǒng)開發(fā)經(jīng)常會(huì)碰到的問題。1.VC與Oracle數(shù)據(jù)庫的接口ORACLE公司自1979年推出基于SQL標(biāo)準(zhǔn)的關(guān)系數(shù)據(jù)庫產(chǎn)品到1

39、997年版本8的推出,ORACLE數(shù)據(jù)庫以其支持大數(shù)據(jù)庫、多用戶的高性能事務(wù)處理,對業(yè)界各項(xiàng)工業(yè)標(biāo)準(zhǔn)的支持,完整的安全和完整性控制,支持分布式數(shù)據(jù)庫和分布處理,具有可移植性、可兼容性和可連接性等突出優(yōu)點(diǎn)倍受用戶喜愛,根據(jù)MG1992年全球UNIX數(shù)據(jù)庫的市場報(bào)告,ORACLE占市場銷售量的50%。而在客戶端的開發(fā)工具方面,VisualC+也因其強(qiáng)大的功能和高度的靈活性等特點(diǎn)深受廣大程序員的喜愛,因此下面我們將介紹使用VisualC+開發(fā)基于ORACLE數(shù)據(jù)庫應(yīng)用程序的三種方法。使用PRO*C開發(fā)數(shù)據(jù)庫應(yīng)用工作原理:PRO系列是ORACLE公司提供的在第三代高級程序設(shè)計(jì)語言中嵌入SQL語句來訪問

40、數(shù)據(jù)庫的一套編譯程序。程序員用相應(yīng)的高級語言編寫嵌入SQL語句的PRO源程序后運(yùn)行相應(yīng)的預(yù)編譯程序。把嵌入的SQL語句轉(zhuǎn)換成標(biāo)準(zhǔn)的ORACLE調(diào)用并生成目標(biāo)源程序,即純高級語言格式的源程序,然后就可以將這些源程序加入用戶的程序中調(diào)用.在VC中使用PRO*C源文件一般有程序頭和程序體兩部分組成。程序頭包含宿主變量說明,通訊區(qū)定義和C外部表示符的說明等。程序體一般由若干函數(shù)組成。使用時(shí),先用PRO*C編寫所需的操作數(shù)據(jù)庫的子程序再運(yùn)PRO*C預(yù)編譯程序把PRO*C源程序轉(zhuǎn)換成相應(yīng)的CPP源程序,將該程序插入到用戶工程文件夾中并在需要對插入函數(shù)進(jìn)行調(diào)用的模塊中說明函數(shù),然后就可以在此模板中說明函數(shù),

41、然后就可以在此模塊中調(diào)用所需的函數(shù)。使用ODBC中間訪問數(shù)據(jù)庫工作原理:ODBC主要有驅(qū)動(dòng)程序和驅(qū)動(dòng)程序管理器組成,驅(qū)動(dòng)程序是一個(gè)用以支持ODBC函數(shù)調(diào)用的模塊,每個(gè)驅(qū)動(dòng)程序?qū)?yīng)于相應(yīng)的數(shù)據(jù)庫,當(dāng)應(yīng)用程序從基于一個(gè)數(shù)據(jù)庫系統(tǒng)移植到另一個(gè)時(shí),只需要改應(yīng)用程序中有ODBC管理程序設(shè)定的與相應(yīng)數(shù)據(jù)庫系統(tǒng)對應(yīng)的別名即可。驅(qū)動(dòng)程序管理器可連接到所有ODBC應(yīng)用程序中,他負(fù)責(zé)管理應(yīng)用程序中ODBC函數(shù)與DLL中函數(shù)的綁定。在VC中使用ODBC:VC+中提供了CDatabase。CRecordset,CRecordView,CBDException和CFieldExchange五個(gè)類,這些類封裝了ODBCS

42、DK函數(shù),從而使用戶可以無需了解SDK函數(shù)就可以很方便的操作支持ODBC的數(shù)據(jù)庫.CDatabase類:封裝了與數(shù)據(jù)庫建立連接,控制事物的提交和回滾及執(zhí)行SQL語句地方法。CRecordset類:封裝了大部分操作數(shù)據(jù)庫的方法,包括瀏覽,修改記錄等。CRecordView類:提供了與recoordset對象相連接的試,可以建立視中的控件與數(shù)據(jù)庫數(shù)據(jù)的對應(yīng)。CDBException類:提供了對數(shù)據(jù)庫操作的異常處理,可以獲得操作異常的相關(guān)返回代碼CFieldExchange類:提供了用戶變量與數(shù)據(jù)庫字段之間的數(shù)據(jù)交換,如果不需要使用自動(dòng)類型,你將不用直接調(diào)用該類的函數(shù)2OracleObjectfor

43、OLE開發(fā)數(shù)據(jù)庫應(yīng)用工作原理:他的類庫是一個(gè)提供編程接口訪問Oracle對象服務(wù)器的C+類庫,它是用OLE的方式實(shí)現(xiàn)的。Oracle提供的是一個(gè)在程服務(wù)器,也就是服務(wù)器將與應(yīng)用程序在同一個(gè)地址空間內(nèi),它以DLL方式提供。應(yīng)用程序在訪問數(shù)據(jù)庫之前必須先加載Oracle對象服務(wù)器,然后與Oracle對象服務(wù)器通信。Oracle不必關(guān)心怎麼和服務(wù)器通信,只管操作類庫就行。但必須有C+開發(fā)知識(shí)及開發(fā)環(huán)境,而且應(yīng)該有SQL的知識(shí)。在VC中使用OracleObjectForOLEC+ClassLibrary它的使用方法與使用微軟封裝后的ODBC基本一樣,再加入對象的類中,類庫提供一種允許控件能象文本和列表框一樣直接鏈接到一個(gè)數(shù)據(jù)庫的列上的類,這種類支持運(yùn)行時(shí)綁定。運(yùn)用OracleObjectForOLEC+ClassLibrary開發(fā)的步驟:1通過調(diào)用OStatup方法初始化類庫連接數(shù)據(jù)庫操縱數(shù)據(jù)庫斷開數(shù)據(jù)庫通過調(diào)用OShutdown方法卸載類庫系統(tǒng)交互界面的設(shè)計(jì)與實(shí)現(xiàn)人機(jī)交互界面作為一個(gè)獨(dú)立的重要的研究領(lǐng)域受到了世界各計(jì)算機(jī)廠家的關(guān)注,成為計(jì)算機(jī)行業(yè)的有一競爭領(lǐng)域。從計(jì)算機(jī)技術(shù)的發(fā)展過程來看,人機(jī)交互界面技術(shù)還引導(dǎo)了相關(guān)軟硬件技術(shù)的發(fā)展,是新時(shí)代計(jì)算機(jī)系統(tǒng)取得成

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論