



版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、項目編號: 2015007CALIS 全國農學文獻信息中心研究項目結題報告項目名稱:基于內容圖像檢索技術在數(shù)字圖書館中的應用項目關鍵詞:圖像檢索、數(shù)字圖書館、基于內容項目單位(蓋章):大連海洋大學圖書館通信地址 :大連市沙河口區(qū)黑石礁街52 號大連海洋大學項目主持人:邢旭峰聯(lián)系電話xf電子郵件:提交日期:2016年 5月 20 日項目結題驗收單1 專家驗收表項目名稱主持人所在單位專家意見基于內容圖像檢索技術在數(shù)字圖書館中的應用邢旭峰職務 /職稱中級(加蓋公章)本課題以圖像等多媒體信息檢索為研究方向,在收集并分析了目前已有的數(shù)字圖書館中使用的圖像檢索技術后,對圖像特征匹
2、配及相似度計算進行了研究,并以面向海量圖像數(shù)據的檢索技術作為研究重點,主要解決如何面向海量圖像數(shù)據實現(xiàn)圖像檢索。該部分研究包含了三個方面:圖像索引技術的研究、快速反饋處理方法的研究、圖像特征與文本信息相結合的快速檢索方法的研究。本課題通過對圖像索引技術的探索研究,目的是要解決如何在復雜的高維特征向量基礎上構建索引,并且所構建的索引能有效的提升圖像檢索速度。該研究可以在圖書館圖書的檢索、數(shù)字安全、版權保護等方面提供非常有利的支持,為數(shù)字圖書館的發(fā)展提供了有利的支持,特別是在大數(shù)據來臨的時代,數(shù)字圖像檢索技術可以有效的解決數(shù)字圖書館中圖片冗余、查找困難、管理困難等問題。聽取項目組匯報后, 驗收專家
3、組本著公正、 公平的原則對該項目進行了驗收,經審議一致通過?。ㄈ缧枰稍黾禹摂?shù))專家簽字郭顯久盧笑明王本欣張紅白麗杰職務/職稱第一章研究背景、目的及意義數(shù)字圖書館是伴隨著計算機技術、存儲技術和Internet技術的發(fā)展和普及而逐步興起的。在 20世紀 90年代 ,歐美發(fā)達國家逐步開始把數(shù)字圖書館列入發(fā)展計劃。數(shù)字圖書館是傳統(tǒng)圖書館在信息時代的發(fā)展,它不但包含了傳統(tǒng)圖書館的功能,向社會公眾提供相應的服務,還融合了博物館、檔案館等其他信息資源,提供綜合的公共信息訪問服務。數(shù)字圖書館將成為未來社會的公共信息中心和樞紐, 數(shù)字化將是未來圖書館的發(fā)展方向。數(shù)字圖書館不同于傳統(tǒng)意義上的圖書管理軟件系統(tǒng)。傳
4、統(tǒng)意義上的圖書管理軟件系統(tǒng)是典型的 MIS 軟件 , 由前臺和后臺組成,它負責保存、查詢圖書的庫存和借閱狀況, 統(tǒng)計圖書信息。其數(shù)據庫中的基本信息是指圖書的名稱、作者、出版社等圖書屬性, 而不是圖書內容。它僅僅為圖書管理人員提供了一種方便的管理手段,為讀者提供了一種方便的查詢圖書的手段,但不能替代紙介質圖書。 而數(shù)字圖書館從內容上講,具有傳統(tǒng)意義上的圖書管理和圖書的功能;從載體上看 , 不僅有傳統(tǒng)的紙介質書籍的內容, 而且可以包括圖像、音頻、視頻等多媒體信息。隨著存儲技術、 網絡技術發(fā)展 , 數(shù)字圖書館系統(tǒng)中的信息存儲不再是問題, 但多媒體信息的檢索仍是當前的技術難點。文本信息借助于傳統(tǒng)的關系
5、數(shù)據庫系統(tǒng)可以非常方便地實現(xiàn)圖書的查詢等管理,用戶可以輸入關鍵詞等方式實現(xiàn)信息的檢索。但圖像等多媒體信息很難通過關鍵詞方式實現(xiàn)準確的檢索。為了更好的服務于讀者、讓讀者在數(shù)字圖書館中快速、便捷的檢索到需要的信息,在數(shù)字圖書館中使用基于內容的圖像檢索技術勢在必行。直方圖作為圖像的特征2;曹莉華等人提出在對HSV色彩空間進行非均勻量化的基礎上建立 72 柄顏色直方圖進行圖像檢索3 ;目前最新研究是蘇小紅等人提出的基于凸包的顏色直方圖4 。在形狀特征提取方面, 早期的研究包括: 基于狹長度的形狀表示 5 ,邊界輪廓特征的提取 6 ,形狀背景描述符 7 ,形狀區(qū)域的劃分 8,及基于矩的特征表示 9等。目
6、前最新研究是, 基于 Rando變換來描述形狀特征10 。在紋理特征提取方面,早期研究包括:灰度共生矩陣方法11 、 Gabor濾波的應用12 、基于LBP 算法的特征表示13 等。目前該方向的最新研究主要是基于Wavelet特征表示和高斯分布的紋理圖像檢索 14 。除了以上三種常用的底層視覺特征之外,近年的研究更多集中于局部特征的提取 15 。局部特征的提取一般分為兩個步驟,首先進行興趣點檢測,其次在興趣點的基礎上提取特征描述。興趣點是指圖像中信息含量較高的點,這些點能很好的表示圖像的基本特征。傳統(tǒng)的興趣點檢測算法包括:Harris算法 16 ,KLT 算法 17 ,Loupias算法等。基
7、于興趣點的圖像檢索技術最新研究有:基于KLT 特征點匹配的檢索算法,Harris特征點與SIFT 特征相結合的檢索方法,多尺度特征點及其匹配技術等。(2) 、圖像特征匹配及相似度計算的研究:在提取圖像特征之后,通過特征匹配即可計算圖像間的相似度。常用的特征匹配方法一般有兩種,一是特征向量間的距離計算,所得到的距離值與圖像間相似度成反比關系;二是特征向量間的匹配程度計算,所得到的匹配程度與圖像間相似度成正比關系。在距離計算方面,傳統(tǒng)的方法有: Hafner 等人提出以顏色直方圖之間的二次距離作為圖像相似性度量的方法等;最新的方法有: Frome等人提出的局部距離函數(shù)及全局一致性的距離函數(shù);Wei
8、 Liu 等人提出了半監(jiān)督距離測量學習算法等。傳統(tǒng)方法主要優(yōu)點是簡單且容易實現(xiàn),缺點是精確性較差;最新方法主要是將反饋學習引入到距離測量中用來修正距離函數(shù),這樣將大大提高結果的精確性,但需要反饋過程。(3) 、用戶反饋處理的研究:在對底層視覺特征的提取與特征匹配的研究過程中,人們已開始逐漸認識到圖像底層特征與其上層語義之間存在一定鴻溝,從而有了“語義鴻溝”的概念。如何彌補“語義鴻溝”改善圖像檢索如何彌補“語義鴻溝”改善圖像檢索結果成為近幾年的研究熱點。在當前研究中,主流方法是通過引入用戶反饋機制來彌補 “語義鴻溝” 。所謂用戶反饋是指, 用戶在初次檢索結果中標示出哪些結果符合其查詢意圖,那些結
9、果為錯誤結果。將標示后的結果反饋給查詢系統(tǒng),系統(tǒng)可以根據這些結果對查詢方案進行修正,從而給出更加準確的檢索結果。近幾年在反饋處理問題上多采用機器學習的方法, 其中包括: 基于支持向量機的方法, 基于 EM算法的方法等。 目前最新研究主要集中在,如何構建有效的核函數(shù),從而使基于核的學習算法更加適用于反饋的處理。另外,目前關于檢索反饋的最新研究熱點主要集中在用戶反饋的表現(xiàn)形式。在檢索應用中若要求用戶直接提供較多的反饋信息,將大大降低用戶體驗。因此可針對用戶的點擊行為進行分析與挖掘,從而得到輔助信息來進一步精確檢索結果。目前該研究主要針對文本信息檢索,可以考慮將其遷移到圖像檢索方面。將數(shù)字圖書館與基
10、于內容的圖像檢索技術進行融合,勢必促進數(shù)字圖書館的大力發(fā)展,特別是在大數(shù)據來臨的時代,數(shù)字圖像檢索技術可以有效的解決數(shù)字圖書館中圖片冗余、查找困難、管理困難等問題。第二章研究內容及方法(思路、方法、具體內容)主要具體研究內容1. 基于內容的數(shù)字圖書館圖像數(shù)據庫數(shù)據模型結構設計:支持基于內容檢索的圖像數(shù)據庫系統(tǒng)的數(shù)據模型結構,由于研究的角度不同,可以分為圖像數(shù)據庫的體系結構和框架結構。較完善的圖像數(shù)據庫的體系結構是Chang SK 提出的五層結構 : 用戶視圖、語義特征視圖、圖像特征視圖、特征表達、特征的組織和檢索。但是由于數(shù)字圖書館的圖像數(shù)據有其自身的特點,所以應設計一套適應于數(shù)字圖書館的圖像
11、檢索數(shù)據模型。2. 面向海量圖像數(shù)據的檢索技術的研究:該部分工作屬于重點研究內容,主要解決如何面向海量圖像數(shù)據實現(xiàn)圖像檢索任務。該部分研究包含了三個方面:圖像索引技術的研究、快速反饋處理方法的研究、圖像特征與文本信息相結合的快速檢索方法的研究。圖像索引技術的研究主要是解決如何在復雜的高維特征向量基礎上構建索引,并且所構建的索引能有效的提升圖像檢索速度。3. 集成驗證平臺及典型應用的實現(xiàn):該部分工作主要是通過搭建集成驗證平臺來對研究中所得到的成果進行驗證與改進,并在最終研究成果基礎上構建典型應用系統(tǒng),從而為研究成果的進一步應用推廣打下堅實的基礎。將圖像檢索技術應用到實際中時,需要針對實際中的問題
12、進行進一步的研究。主要問題包括:異構圖像檢索技術的研究、基于輔助信息的圖像檢索技術研究。異構圖像檢索技術的研究,是指使用檢索服務的各式各樣終端的圖像捕獲能力是不同的,因此圖像質量也是不一樣的。為此需要檢索技術能有效的處理不同質量的圖像,且不會因為圖像質量不同而影響檢索結果?;谳o助信息的圖像檢索技術研究,是指在用戶使用檢索服務時,可以捕獲到例如地理位置信息、用戶偏好信息等相應的額外信息,通過這些信息可以進一步精確檢索結果。第三章結論與建議與傳統(tǒng)的數(shù)字圖書館數(shù)據檢索技術相比,基于內容的數(shù)字圖書館圖像管理系統(tǒng)所采用的新技術與所處的復雜的網絡環(huán)境對數(shù)據安全有著很高的要求和標準??梢哉f,基于內容的數(shù)字
13、圖書館圖像管理系統(tǒng)是未來數(shù)字圖書館的發(fā)展方向,也是未來智慧圖書館、數(shù)字圖書館以及移動圖書館所必須要依靠的技術之一。這項技術可以在圖書館圖書的檢索、數(shù)字安全、版權保護等方面提供非常有利的支持,未來的圖書館一定是智能化、小型化以及數(shù)字化的發(fā)展方向,本研究為數(shù)字圖書館的發(fā)展提供了有利的支持。第四章項目成果( 1) 提出了具備空間辨別力的詞袋模型 (Bag-of-Word) 海量圖像檢索算法傳統(tǒng)的 BoW 算法有很多的優(yōu)點,例如平移不變性、縮放不變性等,但是傳統(tǒng)的BoW 檢索模型也存在很多的問題,例如所提取的特征不具備空間信息、語義信息等。一般情況下,人們比較關心查詢圖像中的前景信息,希望弱化背景信息
14、在視覺詞匯表中的體現(xiàn)。但是傳統(tǒng)的BoW算法, 在整個圖像范圍內提取特征,這就忽略了人的視覺特性,以導致查全率、 查準率比較低。為了解決以上問題,我們提出一種具備空間辨別力的BoW海量圖像檢索算法。方法中首先提出了可以使用顯著性圖的方法提取出圖像中的前景信息,弱化圖像中的背景信息。在提取出了圖像中的前景信息后,所使用的sift特征主要集中在所提取出的前景中,這樣就弱化了背景信息或者是噪聲對檢索效果的影響( 如圖1) 。利用這樣的特征,重新利用顯著性值構建視覺詞匯表,取得了比較好的檢索結果。圖1( 2) 提出了具有自適應閾值的圖像感興趣區(qū)提取模型有效的提取出圖像中的感興趣區(qū)對于目標識別有著重要的意
15、義,現(xiàn)在國際上采用較多的方法是圖像分割技術,但目前圖像分割技術進展緩慢。為此,許多專家學者提出利用圖像的顯著性圖來感知圖像中的目標,但大多數(shù)的提取顯著性圖的方法都存在著許多問題,例如提取的顯著性圖不明顯,特別是圖像中背景過于復雜的情況下效果較差;提取的顯著性區(qū)域過于瑣碎,不能有效的突出圖像中的顯著性目標。為了解決以上問題,我們自己提出了一種新的顯著性圖提取方法。在這個方法中,我們設計了自適應閾值來區(qū)分圖像中的前景與背景,利用設定的閾值,可以有效的剔除圖像中的背景區(qū)域,目標區(qū)域的提取效果有顯著提高(如圖 2)。圖 2( 3) 提出了一種新的包含有多種特征的詞袋模型 (BoW) 視覺詞匯表目前大多
16、數(shù)的圖像檢索框架采用的是使用一個單獨特征來進行圖像匹配,特別是在詞袋模型中更為普遍。但是使用單獨的特征進行匹配,普遍產生的問題是,對于某一類圖像,效果較為理想,而相對于其他種類的圖像,則效果較差,魯棒性不高。因為不同的圖像對于不同的特征,圖像的相似度差異較大。為了解決這個問題,我們提出使用多種特征同時構造詞袋模型的視覺詞匯表,并利用自動閾值合理分配多種特征間的權重比例。大量實驗證明,重新構造的視覺詞匯表更能表示一幅圖像,并取得了不錯的實驗效果。(4)發(fā)表論文情況(1) Junfeng Wu ,Zhiyang Li ,Wenyu Qu,Yujie Xu,Yuanyuan Li,Image Ret
17、rieval via Discriminative Spatial Bag-of-Word Scheme, Journal of Multiple-Valued Logic and Soft Computing,2016(12),accepted(2) Junfeng Wu ,Zhiyang LI ,Wenyu Qu,Yuanyuan Li,A New Bag-of-Words ModelUsing Multi-cue Integration for Image Retrieval ,International Journal of Computational Science and Engi
18、neering,2016(6),accepted第五章參考文獻1 Arnold W.M. Smeulders, Marcel Worring, Simone Santini, Amarnath Gupta, and Ramesh Jain. Content-Based Image Retrieval at the End of the Early Years. IEEE Trans. Pattern Analysis and Machine Intelligence, V ol 22(12), 2000.2 Swain M J and Ballard D H. Color Indexing.
19、International Journal of Computer Vision, Vol.7(1),1991.3 曹莉華 , 柳偉 ,李國輝 . 基于多種主色調的圖像檢索算法研究與實現(xiàn) . 計算機研究與發(fā)展 , Vol.36(l), 1999.4 蘇小紅 ,丁進 , 馬培軍 . 用興趣點凸包和 SVM 加權反饋實現(xiàn)圖像檢索 . 計算機學報 , Vol.32(11),2009.5 鄔浩 ,潘云鶴等 . 基于對象形狀的圖像查詢技術. 軟件學報 , Vol.9(5), 1998.6 K.B. Sun, B.J. Super. Classification of Contour Shapes Usi
20、ng Class Segment Sets. Proceedings of Computer Vision and Pattern Recognition (CVPR), 2005.7 G. Mori, S. Belongie, J. Malik, Efficient Shape Matching Using Shape Contexts. IEEE Trans. Pattern Anal. Vol 27 2005.8 Feng Jing, Mingjing Li, Hong-Jiang Zhang, Bo Zhang. An Efficient and Effective Region-Ba
21、sed Image Retrieval Framework. IEEE Trans. Image Processing. V ol 13 2004.9 G.A. Papakostas, Y .S. Boutalis, D.A. Karras, B.G. Mertzios. A New Class of Zernike Moments forComputer Vision Applications. Information Science. Vol 177 (13) 2007.10 Nacereddine N, Tabbone S, Ziou D and HamamiL. Shape-Based
22、 Image Retrieval Using a NewDescriptor Based on the Radon and Wavelet Transforms. 20th InternationalConference on PatternRecognition. 2010.11 Gotlieb C C and Kreyszig H E. Texture Descriptors Based on Co-occurrence Matrices. Compute Vis Graph Image Process. Vol 51, 1990.12 Dunn D, Higgins W E. Optimal Gabor Filters for Texture Segmentation. IEEE Transcations on Image Processing Vol 4, 1995.13 Ojala T, Pietikainen M and Maenpaa T. Multiresolution Gray Sca
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 租賃商場場地合同
- 公司員工激勵演講稿
- 養(yǎng)老護理行業(yè)老年人照護需求評估
- 肉羊養(yǎng)殖購銷合同
- 生物醫(yī)藥領域新藥研發(fā)投資合同
- 有關個人向公司借款協(xié)議書
- 城市道路施工安全管理規(guī)定
- 好品質故事解讀
- 電影制作公司演員拍攝安全協(xié)議
- 2025年漢語拼音yw助力企業(yè)營銷策略分析
- 2025年黑龍江生態(tài)工程職業(yè)學院單招職業(yè)傾向性測試題庫1套
- 白介素6臨床意義
- 2025年充電樁場地租賃合同官方版模板
- DeepSeek的應用與部署
- 《彰化縣樂樂棒球》課件
- 2025-2030年墻體裂縫檢測與修復機器人行業(yè)深度調研及發(fā)展戰(zhàn)略咨詢報告
- 北京2025年01月全國婦聯(lián)所屬在京事業(yè)單位2025年度公開招考93名工作人員筆試歷年典型考題(歷年真題考點)解題思路附帶答案詳解
- 初中班會 《哪吒 2:勇戰(zhàn)困難伴夢前行》開學第一課主題班會 教案
- 《馬爾科夫過程介紹》課件
- 四川成都歷年中考語文現(xiàn)代文閱讀之非連續(xù)性文本閱讀4篇(截至2024年)
- 中國地圖填色圖(任何顏色可變)
評論
0/150
提交評論