第8章 多媒體數(shù)據(jù)庫_第1頁
第8章 多媒體數(shù)據(jù)庫_第2頁
第8章 多媒體數(shù)據(jù)庫_第3頁
第8章 多媒體數(shù)據(jù)庫_第4頁
第8章 多媒體數(shù)據(jù)庫_第5頁
已閱讀5頁,還剩32頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第8

多媒體數(shù)據(jù)庫引言8.1多媒體數(shù)據(jù)庫概述8.1.1傳統(tǒng)的數(shù)據(jù)庫技術(shù)8.1.2多媒體數(shù)據(jù)庫的特點8.1.3多媒體數(shù)據(jù)庫的功能8.2多媒體數(shù)據(jù)庫的管理8.2.1多媒體數(shù)據(jù)的管理8.2.2多媒體數(shù)據(jù)庫管理系統(tǒng)的體系結(jié)構(gòu)8.3多媒體數(shù)據(jù)庫的檢索8.3.1基于文本的多媒體數(shù)據(jù)庫檢索8.3.2基于內(nèi)容的多媒體數(shù)據(jù)檢索技術(shù)概述8.3.3基于內(nèi)容檢索的應用8.3.4多種類型媒體對象檢索的應用本章小結(jié)思考與練習引言與數(shù)值、字符等格式化數(shù)據(jù)不同,圖像、音頻、視頻等媒體信息所涉及的是非格式化數(shù)據(jù),并且數(shù)據(jù)量相對龐大,我們一般稱其為多媒體數(shù)據(jù)。

傳統(tǒng)的數(shù)據(jù)庫系統(tǒng)在多媒體數(shù)據(jù)的處理、存儲和檢索上顯得力不從心,因此需要研究和建立一種新型數(shù)據(jù)庫技術(shù)——多媒體數(shù)據(jù)庫技術(shù)。

本章首先介紹了傳統(tǒng)數(shù)據(jù)庫的一些基本知識,然后介紹了多媒體數(shù)據(jù)庫涉及的主要內(nèi)容,最后對多媒體數(shù)據(jù)庫中的一個重要的研究內(nèi)容:基于內(nèi)堂的數(shù)據(jù)檢索做了介紹。8.1多媒體數(shù)據(jù)庫概述數(shù)據(jù)庫(Database)是一個依照某種數(shù)據(jù)模型,組織、存儲和管理數(shù)據(jù)的數(shù)據(jù)集合。數(shù)據(jù)庫的兩層含義:1.數(shù)據(jù)庫基本概念是一個實體,能夠合理保管數(shù)據(jù)的“倉庫”,用戶在“倉庫”中存放要管理的事務數(shù)據(jù)。是數(shù)據(jù)管理的新方法和技術(shù),能更合適的組織數(shù)據(jù)、更方便的維護數(shù)據(jù)、更嚴密的控制數(shù)據(jù)和更有效的利用數(shù)據(jù)。8.1.1傳統(tǒng)的數(shù)據(jù)庫技術(shù)2.數(shù)據(jù)庫管理數(shù)據(jù)的特點數(shù)據(jù)結(jié)構(gòu)化:從全局整體觀點組織數(shù)據(jù)。描述數(shù)據(jù)時,既描述數(shù)據(jù)本身,又描述數(shù)據(jù)間關(guān)系;既考慮某個應用的數(shù)據(jù)結(jié)構(gòu),又考慮整個組織的數(shù)據(jù)結(jié)構(gòu)。數(shù)據(jù)具有高共享性、低冗余度:通過數(shù)據(jù)模型和數(shù)據(jù)控制機制提高數(shù)據(jù)共享性數(shù)據(jù)共享可以大大減少數(shù)據(jù)冗余數(shù)據(jù)和程序之間獨立性較高指數(shù)據(jù)的組織和存儲方法與應用程序互不依賴、彼此獨立包括物理數(shù)據(jù)的獨立性和邏輯數(shù)據(jù)的獨立性兩個方面。2.數(shù)據(jù)庫管理數(shù)據(jù)的特點數(shù)據(jù)的安全性和完整性較高數(shù)據(jù)庫系統(tǒng)通過數(shù)據(jù)保護措施防止數(shù)據(jù)破壞。數(shù)據(jù)庫系統(tǒng)能提供完整性檢查。數(shù)據(jù)可以并發(fā)使用并能保證數(shù)據(jù)的一致性數(shù)據(jù)庫系統(tǒng)提供并發(fā)機制和協(xié)調(diào)機制,允許在同一時間內(nèi),多個用戶同時對數(shù)據(jù)實現(xiàn)多路存取,而不產(chǎn)生任何沖突,數(shù)據(jù)不遭到破壞。數(shù)據(jù)庫的故障恢復提供一套方法及時發(fā)現(xiàn)故障和修復故障,從而防止數(shù)據(jù)不被丟失或破壞。數(shù)據(jù)庫的運行管理功能:核心功能,包括:多用戶環(huán)境下的并發(fā)控制安全性檢查和存取限制完整性條件檢查和執(zhí)行運行日志組織管理事務管理和自動恢復等數(shù)據(jù)庫操作功能:數(shù)據(jù)操作語言DML可進行增刪改查等操作數(shù)據(jù)定義功能:DBMS提供數(shù)據(jù)定義語言DDL提供建庫機制,可建立和修改庫結(jié)構(gòu)、存儲結(jié)構(gòu)、數(shù)據(jù)間聯(lián)系,定義數(shù)據(jù)的完整性約束條件和保證完整性的觸發(fā)機制等。3.數(shù)據(jù)庫管理系統(tǒng)的主要功能數(shù)據(jù)庫維護功能:包括:數(shù)據(jù)庫數(shù)據(jù)的載入、轉(zhuǎn)儲和恢復,數(shù)據(jù)庫的維護及數(shù)據(jù)庫的功能、性能分析和檢測等。數(shù)據(jù)庫通信功能:與操作系統(tǒng)的聯(lián)機處理、分時系統(tǒng)及遠程作業(yè)輸入的相關(guān)接口負責處理數(shù)據(jù)的傳送與網(wǎng)絡(luò)中其他軟件的通信以及數(shù)據(jù)庫之間的互操作3.數(shù)據(jù)庫管理系統(tǒng)的主要功能表示數(shù)據(jù)之間聯(lián)系的方法。先后經(jīng)歷了層次模型、網(wǎng)狀模型、關(guān)系模型和面向?qū)ο竽P偷入A段目前關(guān)系模型在實際應用中處于主導地位,而面向?qū)ο竽P凸烙嬙诓痪玫膶韺玫綇V泛的應用。4.數(shù)據(jù)模型滿足以下條件:有且僅有一個結(jié)點無父結(jié)點,這個結(jié)點稱為根結(jié)點。除根結(jié)點之外,其他結(jié)點有且僅有一個父結(jié)點。層次模型滿足以下條件:允許一個以上的結(jié)點無父結(jié)點。一個結(jié)點可以有多個父結(jié)點。網(wǎng)狀模型數(shù)據(jù):二維表中的元素,表格中每一行稱作一個元組,相當于一個記錄值;列:屬性值集,列的名字稱為屬性名。關(guān)鍵字(Key):能夠唯一識別一個元組的屬性。關(guān)系模型多媒體數(shù)據(jù)的數(shù)據(jù)量大,數(shù)據(jù)差異也大。媒體種類多,且每種媒體數(shù)據(jù)在又演變出幾十種不同的媒體格式。多媒體數(shù)據(jù)具有模糊性。難以表達和描述。多媒體數(shù)據(jù)的分布性。多媒體事務的處理時間比傳統(tǒng)事務要長。不同應用系統(tǒng)對多媒體數(shù)據(jù)的傳輸、表現(xiàn)和存儲方式的質(zhì)量要求不一樣。多媒體信息涉及的版本眾多,包括歷史版本和選擇版本。數(shù)據(jù)量大,8.1.2多媒體數(shù)據(jù)庫的特點1.多媒體數(shù)據(jù)的特點需要設(shè)計合適的數(shù)據(jù)庫的組織和存儲方法。多種媒體類型增加了數(shù)據(jù)處理的困難。數(shù)據(jù)庫的多解查詢。用戶接口的支持。多媒體信息的分布性影響多媒體數(shù)據(jù)庫體系。數(shù)據(jù)庫應增加處理長事務的能力。

對于不同應用的不同的服務質(zhì)量的要求,要根據(jù)的情況進行控制。版本控制的問題。2.多媒體數(shù)據(jù)對數(shù)據(jù)庫的影響8.1.3多媒體數(shù)據(jù)庫的功能能表達和處理多種復雜的數(shù)據(jù)類型。存儲技術(shù)具有數(shù)據(jù)壓縮和解壓等新功能。有能組織和管理各種媒體數(shù)據(jù)的特征和集成機制的時空關(guān)聯(lián)的方法。強調(diào)物理數(shù)據(jù)、邏輯數(shù)據(jù)和媒體數(shù)據(jù)獨立性。提供比傳統(tǒng)數(shù)據(jù)庫更強大的操作。提供網(wǎng)絡(luò)分布式數(shù)據(jù)功能。具有開放功能。提供事務和版本管理功能。多媒體數(shù)據(jù)庫的恢復和安全機制功能。8.2多媒體數(shù)據(jù)庫的管理8.2.1多媒體數(shù)據(jù)的管理實現(xiàn)多媒體數(shù)據(jù)管理的三種途徑:1、擴充關(guān)系數(shù)據(jù)庫2、面向?qū)ο髷?shù)據(jù)庫方式3、基于超文本和超媒體方式1.擴充關(guān)系數(shù)據(jù)庫主要有三種:擴展現(xiàn)有的數(shù)據(jù)類型。增加一種大二進制對象BLOB(BinarylargeObject)字段來支持對多媒體數(shù)據(jù)對象的存取。擴充用戶自定義的數(shù)據(jù)類型允許用戶自定義一個抽象數(shù)據(jù)類型作為另一關(guān)系的列的值,而不僅僅是采用系統(tǒng)己定義的數(shù)據(jù)類型。擴充嵌套語義,采用NF2數(shù)據(jù)模型

2.面向?qū)ο髷?shù)據(jù)庫方式更接近人類思維方式。面向?qū)ο髷?shù)據(jù)模式語義豐富,具有很強的抽象能力,具有良好的可擴充性,可以很好地滿足復雜的多媒體對象的各種表示需求。以非線性的信息組織方來管理多媒體對象,較符合人們的思維方式,較適合制作電子文檔或電子出版物,但不適合一般用戶的資料管理。3.基于超文本和超媒體的方式8.2.2多媒體數(shù)據(jù)庫管理系統(tǒng)的體系結(jié)構(gòu)針對每一種媒體建立一個獨立的數(shù)據(jù)庫管理系統(tǒng);這些數(shù)據(jù)庫通過相互通信來協(xié)調(diào)和執(zhí)行相應操作;對每種多媒體數(shù)據(jù)的管理是分開的。缺陷:當多種媒體的聯(lián)合操作時,增加了用戶的負擔。如果各種媒體數(shù)據(jù)庫設(shè)計時沒有按照標準化的原則進行,他們之間的通信和使用都會產(chǎn)生問題。1.組合型多媒體數(shù)據(jù)庫結(jié)構(gòu)各種類型的媒體統(tǒng)一建模,只用一個單一的多媒體數(shù)據(jù)庫進行管理,并只用一個多媒體數(shù)據(jù)庫管理系統(tǒng)對這些媒體信息進行操作,各種用戶需求被統(tǒng)一到一個多媒體用戶接口上,多媒體的查詢檢索結(jié)構(gòu)可以統(tǒng)一表現(xiàn)。缺陷:目前還沒有一個比較恰當而且高效的方法來管理所有的多媒體數(shù)據(jù),因此很難實現(xiàn)。2.集中型多媒體數(shù)據(jù)庫結(jié)構(gòu)多個數(shù)據(jù)庫管理系統(tǒng)組成的,每個數(shù)據(jù)庫管理系統(tǒng)之間沒有主從之分,只要求系統(tǒng)中每個數(shù)據(jù)庫管理系統(tǒng)能諧調(diào)地工作。缺陷:通信中必須首先解決每個成員多媒體數(shù)據(jù)庫系統(tǒng)的差異。3.協(xié)作型多媒體數(shù)據(jù)庫結(jié)構(gòu)適合網(wǎng)絡(luò)環(huán)境下的工作。系統(tǒng)對每一種媒體的操作各用一個服務器來實現(xiàn),所有服務的綜合和操作也用一個服務器完成,與用戶的接口采用客戶進程實現(xiàn)。客戶與服務器之間通過特定的中間系統(tǒng)連接。缺陷:要對服務器和客戶進行仔細的規(guī)劃和統(tǒng)一的考慮,采用標準化和開放的接口界面。4.客戶機-服務器型多媒體數(shù)據(jù)庫結(jié)構(gòu)8.3多媒體數(shù)據(jù)庫的檢索8.3.1基于文本的多媒體數(shù)據(jù)庫檢索利用人工對多媒體信息進行分析,并抽取反映該多媒體數(shù)據(jù)的物理特性和內(nèi)容特性的文本信息;對這些文本信息按照學科領(lǐng)域分類,或用關(guān)鍵字標引,并建立類似于文本文獻的標引著錄數(shù)據(jù)庫。用戶則通過輸入關(guān)鍵字,匹配查詢(關(guān)鍵字)和多媒體信息的注釋來搜索相關(guān)數(shù)據(jù)。1.基于文本的多媒體數(shù)據(jù)庫檢索流程利用文件擴展名和超文本標識。將多媒體文件名和文字解說中帶有的媒體信息作為關(guān)鍵詞。多媒體所在網(wǎng)頁的標題或多媒體數(shù)據(jù)附近的文本。人工選擇或指定的某些多媒體信息內(nèi)容的關(guān)鍵詞。2.檢索途徑優(yōu)點:利用關(guān)鍵字匹配的多媒體檢索技術(shù)成熟,查詢效率高。缺點:人工注釋工作量大,在海量系統(tǒng)中幾乎是不現(xiàn)實的;支持的查詢復雜程度完全取決于人工標注的詳盡程度,會出現(xiàn)同一對象描述程度不一的情況;人工標注信息帶有很大的主觀性;文本描述無法完全揭示和表達多媒體信息的實質(zhì)內(nèi)容和語義之間的關(guān)系,難以充分揭示和描述多媒體數(shù)據(jù)中有代表性的特征;對于實時廣播流媒體,人工處理是完全不可行的3.基于文本檢索的優(yōu)缺點“內(nèi)容”的概念:概念級內(nèi)容:表達對象的語義,一般用文本形式來描述,通過分類和目錄來組織層次瀏覽,用鏈來組織上下文關(guān)聯(lián)。感知特征:視覺特征,聽覺特征等。邏輯關(guān)系:音頻、視頻對象的時間和空間關(guān)系,語義和上下文關(guān)聯(lián)等。信號特征:通過信號處理方法獲得的明顯的媒體區(qū)分特征。特定領(lǐng)域的特征:與應用相關(guān)的媒體特征。8.3.2基于內(nèi)容的多媒體檢索技術(shù)概述特征抽取系統(tǒng)。將用戶或系統(tǒng)標明的媒體對象的特征提取出來??捎扇斯せ蛳到y(tǒng)自動完成;可以是全局性的或針對某個目標的。查詢系統(tǒng)。以示例查詢的方式向用戶提供檢索接口。主要是相似性檢索。1.基于內(nèi)容檢索系統(tǒng)的體系結(jié)構(gòu)(1)提交查詢要求。(2)相似性匹配。(3)返回候選結(jié)果。(4)特征調(diào)整。2.基于內(nèi)容檢索的過程(1)模式識別法用戶在查詢請求中給定圖像、聲音或視像數(shù)據(jù),系統(tǒng)用模式識別技術(shù),把該媒體對象與多媒體數(shù)據(jù)庫中存儲的同類媒體對象進行逐個匹配。(2)特征描述法給每個媒體對象附上一個特征描述數(shù)據(jù),用這種特征描述來表達媒體數(shù)據(jù)的內(nèi)容。關(guān)鍵問題是如何獲取這種特征描述數(shù)據(jù)。(3)特征向量法用圖像壓縮技術(shù)對圖像進行分解并向量化。3.基于內(nèi)容的檢索方法直接從媒體內(nèi)容中提取信息線索?;趦?nèi)容的檢索是一種近似匹配,這一點與常規(guī)數(shù)據(jù)庫檢索的精確匹配方法有明顯不同,基于內(nèi)容的檢索只能是一種相似度的檢索。在應用中要換取其他性能的提高(比如檢索速度),因此不要求查詢結(jié)果一定是多媒體數(shù)據(jù)庫中滿足相似度和檢索結(jié)果集合大小限制的所有對象,而允許有所遺漏。特征提取和索引建立可由計算機自動實現(xiàn),避免了人工描述的主觀性,也大大減少了工作量。4.基于內(nèi)容檢索的特點關(guān)鍵技術(shù)顏色特征的提取顏色特征表達方法有顏色直方圖、顏色矩、顏色集、顏色聚合向量以及顏色相關(guān)圖等,而顏色直方圖是最常用一種方法。紋理特征的提取紋理特征的提取方法主要有結(jié)構(gòu)分析方法、統(tǒng)計分析方法和頻譜分析方法。形狀特征的提取形狀表示:基于邊界的和基于區(qū)域的。前者典型方法是傅立葉描述子;后者典型方法有不變矩等。8.3.3基于內(nèi)容檢索的應用1.基于內(nèi)容的圖像檢索關(guān)鍵技術(shù)(1)鏡頭分割技術(shù)通過對鏡頭邊界的檢測將視頻分割為各個獨立的鏡頭。主要有基于全局特征的切變檢測、基于局部特征的切變檢測以及閩值法、光流法和模型法漸變檢測法。(2)關(guān)鍵幀提取技術(shù)有基于鏡頭邊界、基于圖像信息、基于運動分析、基于某種聚類算法等各種方法。(3)動態(tài)特征提取技術(shù)利用攝像機操作的表示來查詢鏡頭,可以利用運動方向和幅度特征來檢索運動的主體目標。2.基于內(nèi)容的視頻檢索分類:(1)語音檢索。語音檢索技術(shù)主要包括①基于關(guān)鍵詞檢出技術(shù)的語音檢索。②基于大詞表連續(xù)語音識別技術(shù)的語音檢索。③基于子詞基元的語音檢索。④基于說話人的語音檢索技術(shù)。(2)音樂檢索。可以采用哼唱、節(jié)拍拍打、演奏輸入、樂譜錄入等多種方式提交查詢請求進行檢索。(3)音頻例子檢索。可以分為兩種:一種是將某類音頻用一個模板表示出來,對于用戶提交查詢的音頻例子,先使用模板去進行匹配,判斷其屬于模板,然后將這類模板對應的音頻例子按序反饋給用戶;另一種是對每個音頻例子建立模板,然后進行相似匹配。3.基于內(nèi)容的音頻檢索查詢結(jié)果既能反映語義層次上的相似性,而能體

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論