




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、多媒體數(shù)據(jù)庫技術(shù)2022/9/71第1頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二傳統(tǒng)數(shù)據(jù)庫都是以數(shù)值和字符數(shù)據(jù)為管理對(duì)象,其應(yīng)用對(duì)象主要是一般商業(yè)或事務(wù)數(shù)據(jù),它通常不涉及到諸如圖像、聲音等多媒體數(shù)據(jù)。當(dāng)數(shù)據(jù)庫管理對(duì)象被擴(kuò)充到用來管理多媒體數(shù)據(jù),由于描述的數(shù)據(jù)結(jié)構(gòu)即數(shù)據(jù)模型不同,其性質(zhì)和功能都將出現(xiàn)重大變化,存儲(chǔ)結(jié)構(gòu)和存取機(jī)制出現(xiàn)基本差異,此時(shí)用以管理多媒體數(shù)據(jù)的數(shù)據(jù)庫管理系統(tǒng)就是多媒體數(shù)據(jù)庫管理系統(tǒng)(MDBMS)。經(jīng)過多年的研究與開發(fā),MDBMS在理論上取得了一定進(jìn)展,也由一些多媒體數(shù)據(jù)的DBMS出現(xiàn),當(dāng)還不夠完善與成熟。 2022/9/72第2頁,共78頁,2022年,5月2
2、0日,13點(diǎn)54分,星期二8.1.1多媒體數(shù)據(jù)1.媒體 信息的交換和傳播必須借助于一定的媒體, “媒體”(Media)就是信息得以表示或傳播的載體,其基本功能就是向人們傳遞各種信息。在計(jì)算機(jī)領(lǐng)域內(nèi),可以將媒體劃分為如下幾個(gè)部分。2022/9/73第3頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二 感覺媒體 表示媒體 存儲(chǔ)媒體 傳輸媒體 2022/9/74第4頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二2.多媒體 從詞源上看,“多媒體”一詞由前綴multi和字根media兩部分復(fù)合而成。Multi來源于拉丁字multus,其意為“大量的”;Media是拉丁字medium
3、的復(fù)數(shù)形式,表示“媒體”的意思。因此,從詞源上推斷,多媒體意為“多種媒介綜合體”。例如,電影是由音頻(Audio)和視頻(Video)綜合而成的一種信息表示和傳播的形式(載體),它是一種多媒體。2022/9/75第5頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二3.多媒體數(shù)據(jù) 在以計(jì)算機(jī)和網(wǎng)絡(luò)通信為基礎(chǔ)的信息時(shí)代,人們所指的多媒體大多是數(shù)字化的多媒體,即基于計(jì)算機(jī)技術(shù)的多媒體,稱之為計(jì)算機(jī)多媒體(Computer Multimedia)。多媒體數(shù)據(jù)是指由多種不同類型媒體綜合組成的,通常包括文本、圖形、圖像、聲音、視頻圖像和動(dòng)畫等媒體形式。只包含某種媒體的數(shù)據(jù)稱為單媒體。當(dāng)然,單媒體
4、可以看作是特殊的多媒體。2022/9/76第6頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二8.1.2多媒體數(shù)據(jù)分類多媒體數(shù)據(jù)按其特征可以分為以下6種。1.文本數(shù)據(jù)2.聲音數(shù)據(jù)3.圖像數(shù)據(jù)4.圖形數(shù)據(jù)5.影視數(shù)據(jù)6.生成媒體數(shù)據(jù)2022/9/77第7頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二8.1.3 多媒體數(shù)據(jù)特征與傳統(tǒng)的數(shù)據(jù)相比,多媒體數(shù)據(jù)具有如下幾種特性:1. 集成特性2. 獨(dú)立特性3.數(shù)據(jù)量大4.實(shí)時(shí)性強(qiáng)5.具有交互性6.非解釋特性7.非結(jié)構(gòu)特性2022/9/78第8頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二8.1.4 多媒體數(shù)據(jù)庫1.多媒體
5、數(shù)據(jù)庫傳統(tǒng)數(shù)據(jù)庫是以數(shù)字和字符數(shù)據(jù)為管理對(duì)象,其應(yīng)用對(duì)象主要是一般的商業(yè)或事務(wù)數(shù)據(jù),一般不涉及諸如圖像和聲音等,但當(dāng)數(shù)據(jù)庫管理對(duì)象被擴(kuò)充到用來管理多媒體數(shù)據(jù)之后,其性質(zhì)和功能都發(fā)生了重大變化。此時(shí)存儲(chǔ)結(jié)構(gòu)和存取結(jié)構(gòu)不同, 描述它們的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)模型也不同。由此產(chǎn)生的用于管理多媒體數(shù)據(jù)的數(shù)據(jù)庫管理系統(tǒng)就是多媒體數(shù)據(jù)庫管理系統(tǒng)(MDBMS),其對(duì)應(yīng)的數(shù)據(jù)庫系統(tǒng)就是多媒體數(shù)據(jù)庫系統(tǒng)(multimedia database,MD)。 2022/9/79第9頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二2.多媒體數(shù)據(jù)庫特征從多媒體數(shù)據(jù)庫管理系統(tǒng)的角度來看,多媒體數(shù)據(jù)庫具有如下特征。(1)多
6、媒體數(shù)據(jù)庫不同于經(jīng)典數(shù)據(jù)庫,在其處理數(shù)據(jù)對(duì)象、數(shù)據(jù)類型、數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)模型、應(yīng)用對(duì)象等方面都與經(jīng)典數(shù)據(jù)庫有著較大差異。 2022/9/710第10頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二2)多媒體數(shù)據(jù)庫存儲(chǔ)和處理的是現(xiàn)實(shí)世界中的復(fù)雜對(duì)象,這些對(duì)象往往通過多種形式的媒體來綜合表現(xiàn)自己,如動(dòng)態(tài)的視頻。經(jīng)典數(shù)據(jù)庫是對(duì)于格式化數(shù)據(jù)進(jìn)行存儲(chǔ)和處理,圖像或聲音媒體都作為無格式化數(shù)據(jù)而存在,而其存儲(chǔ)特征則是一類二進(jìn)制大對(duì)象,存儲(chǔ)對(duì)象變化使得存儲(chǔ)技術(shù)增加了新的內(nèi)容,需要進(jìn)行特殊處理,如進(jìn)行數(shù)據(jù)壓縮等。2022/9/711第11頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二(3)多
7、媒體數(shù)據(jù)庫是面向應(yīng)用的,其功能需求與應(yīng)用密切相關(guān),因此它并不是基于某一特定的數(shù)據(jù)類型,而是隨著應(yīng)用領(lǐng)域和對(duì)象而建立相應(yīng)的數(shù)據(jù)模型 ,如可以概括地劃分多媒體數(shù)據(jù)為簡單型、復(fù)雜型和智能型,用來表示不同類型的應(yīng)用。2022/9/712第12頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二3)多媒體數(shù)據(jù)庫從實(shí)用性要求出發(fā),強(qiáng)調(diào)媒體間的獨(dú)立性,其概念可以與經(jīng)典數(shù)據(jù)庫多要求的數(shù)據(jù)獨(dú)立性進(jìn)行類比,即多媒體數(shù)據(jù)庫用戶應(yīng)當(dāng)最大限度地忽略各媒體間的差別,從而實(shí)現(xiàn)對(duì)對(duì)媒體 數(shù)據(jù)的操作與管理。2022/9/713第13頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二(4)經(jīng)典數(shù)據(jù)模型概念更強(qiáng)調(diào)應(yīng)用
8、對(duì)象的邏輯結(jié)構(gòu)。而多媒體應(yīng)用則對(duì)于對(duì)象的物理表示和交付方式非常重視,多媒體系統(tǒng)的意義和作用就在于能將物理存儲(chǔ)的信息以多媒體形式向用戶表現(xiàn)和提供,因此多媒體數(shù)據(jù)庫更強(qiáng)調(diào)用戶界面的靈活性和多樣性。單媒體顯示相對(duì)容易,而混合媒體如聲像的表現(xiàn),由于涉及到媒體的同步和集成,因此要復(fù)雜得多。2022/9/714第14頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二(5)多媒體數(shù)據(jù)庫應(yīng)具有較強(qiáng)的對(duì)象訪問手段,從而使多媒體數(shù)據(jù)庫具有實(shí)用價(jià)值,訪問方式可包括通過多媒體對(duì)象類型和建立的對(duì)象聚集。對(duì)象概括訪問對(duì)象,通過多媒體關(guān)系,媒體特征進(jìn)行訪問,特征訪問主要用于對(duì)圖像和聲音等對(duì)象的訪問,這里還涉及到特征
9、抽取等問題。瀏覽訪問、近似性查詢、混合方式訪問都是多媒體數(shù)據(jù)庫特有的查詢方式。2022/9/715第15頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二8.1.5 多媒體數(shù)據(jù)庫主要技術(shù)1.大容量、高帶寬的存儲(chǔ)器系統(tǒng)文本的存儲(chǔ)和檢索技術(shù)早已成熟。多媒體存儲(chǔ)則是較新的課題。多媒體存儲(chǔ)需要考慮若干新的需要,例如巨大的存儲(chǔ)空間、大型對(duì)象、多個(gè)相關(guān)對(duì)象和對(duì)檢索的時(shí)間要求等。多媒體存儲(chǔ)和檢索最主要的特點(diǎn)是要考慮多媒體對(duì)象的龐大數(shù)據(jù)量及實(shí)時(shí)性的要求。2022/9/716第16頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二2.多媒體數(shù)據(jù)模型數(shù)據(jù)庫系統(tǒng)的一個(gè)核心問題就是如何表示和處理實(shí)體間
10、的聯(lián)系,而表示實(shí)體之間聯(lián)系的模型就是數(shù)據(jù)模型。數(shù)據(jù)模型可以用一種較為嚴(yán)格的定義表述為:數(shù)據(jù)模型(data model)是由數(shù)學(xué)上一組定義組成,這些概念可以用來表達(dá)數(shù)據(jù)密集型應(yīng)用中的靜態(tài)和動(dòng)態(tài)性質(zhì)。由于多媒體數(shù)據(jù)的來源緊密依賴于應(yīng)用,很難有統(tǒng)一的模型面向所有應(yīng)用需求,因此,討論多媒體數(shù)據(jù)模型實(shí)質(zhì)上只能提供若干有利于多媒體應(yīng)用的建模技術(shù)和方法,本章正是按照這個(gè)思路進(jìn)行研究。2022/9/717第17頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二3.元數(shù)據(jù)及其生成多媒體數(shù)據(jù)庫中存在有大量的二進(jìn)制位串、字符流等非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),要理解和查詢這類數(shù)據(jù),就必須對(duì)其進(jìn)行必要的描述和解釋。這
11、種描述和解釋的數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù),人們通常稱為多媒體元數(shù)據(jù)。多媒體元數(shù)據(jù)對(duì)于多媒體數(shù)據(jù)極端重要,它是多媒體數(shù)據(jù)的解釋與描述,更是用戶識(shí)別、選擇多媒體數(shù)據(jù)的基本依據(jù),因此,要進(jìn)行多媒體數(shù)據(jù)的查詢與管理,就要研究多媒體元數(shù)據(jù)及其生成。2022/9/718第18頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二4.查詢和索引技術(shù)數(shù)據(jù)查詢是任何一個(gè)數(shù)據(jù)庫系統(tǒng)最基本和最重要的功能之一,在多媒體數(shù)據(jù)庫中,數(shù)據(jù)查詢條件一般表示為元數(shù)據(jù)應(yīng)當(dāng)滿足的條件,而不是直接表示為媒體數(shù)據(jù)應(yīng)該滿足的條件,由此,帶來一些新的技術(shù)和方法問題需要處理。另外還有基于多媒體本身特性的多解查詢、基于媒體內(nèi)容的檢索技術(shù)(特征提
12、取、索引和查詢優(yōu)化)等基本課題也需要進(jìn)行研究。2022/9/719第19頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二8.2 多媒體數(shù)據(jù)模型目前,建立多媒體數(shù)據(jù)模型的方法大多是在關(guān)系數(shù)據(jù)模型和面向?qū)ο髷?shù)據(jù)模型基礎(chǔ)上進(jìn)行改進(jìn)。主要方法有如下兩種: 擴(kuò)展現(xiàn)有關(guān)系數(shù)據(jù)庫管理系統(tǒng)(RDBMS),用于支持類似于二進(jìn)制對(duì)象的各種多媒體對(duì)象。將RDBMS從基本的二進(jìn)制對(duì)象擴(kuò)展到繼承和類這一概念。 轉(zhuǎn)變?yōu)榘l(fā)展成熟的面向?qū)ο髷?shù)據(jù)庫,以支持SQL語言。將數(shù)據(jù)庫和應(yīng)用軟件轉(zhuǎn)變?yōu)槊嫦驅(qū)ο蟮臄?shù)據(jù)并使用面向?qū)ο蟮恼Z言,如C+,或使用對(duì)象的SQL來開發(fā)。2022/9/720第20頁,共78頁,2022年,5月2
13、0日,13點(diǎn)54分,星期二8.2.1 多媒體數(shù)據(jù)模型的層次多媒體數(shù)據(jù)模型是用來描述任何多媒體數(shù)據(jù)靜態(tài)特性和動(dòng)態(tài)特性的一組概念和定義,一般可以分為如下三個(gè)層次。 概念數(shù)據(jù)模型(conceptual data model,CDM) 邏輯數(shù)據(jù)模型(logical data model,LDM) 物理數(shù)據(jù)模型(physical data model,PDM) 2022/9/721第21頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二2022/9/722第22頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二按照應(yīng)用對(duì)象的復(fù)雜程度,可以將數(shù)據(jù)模型分為三種:簡單性、復(fù)雜型和智能型數(shù)據(jù)模型
14、。簡單型數(shù)據(jù)模型對(duì)應(yīng)于多媒體簡單應(yīng)用,其特征是涉及到的對(duì)象多為靜態(tài),結(jié)構(gòu)較為簡單,查詢比較確定。相對(duì)于簡單數(shù)據(jù)模型的就是簡單型多媒體數(shù)據(jù)庫 它主要完成對(duì)多媒體數(shù)據(jù)中的物理媒體數(shù)據(jù)的有效管理和存取,建立多媒體數(shù)據(jù)及其文本說明等屬性之間的相互關(guān)系。2022/9/723第23頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二復(fù)雜型多媒體數(shù)據(jù)模型表述一類結(jié)構(gòu)較為復(fù)雜、可以進(jìn)行某種意義上模糊查詢的多媒體應(yīng)用,其特征是具有復(fù)雜的結(jié)構(gòu),實(shí)體之間存在多重聯(lián)系,查詢方式多樣。相對(duì)于復(fù)雜數(shù)據(jù)模型的就是復(fù)雜型多媒體數(shù)據(jù)庫,它主要完成對(duì)多媒體中所包含的物理媒體數(shù)據(jù)、邏輯媒體數(shù)據(jù)的統(tǒng)一描述、有效存取和管理,能對(duì)
15、多媒體數(shù)據(jù)中包含的多種語義信息進(jìn)行描述、存取和管理。2022/9/724第24頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二智能型數(shù)據(jù)模型是指一類具有特殊復(fù)雜對(duì)象、應(yīng)用要求相當(dāng)復(fù)雜的系統(tǒng),其特征是對(duì)系統(tǒng)的描述具有很高的要求。相對(duì)于智能型數(shù)據(jù)模型的就是智能型多媒體數(shù)據(jù)庫,它不但能夠?qū)Χ喾N媒體數(shù)據(jù)進(jìn)行有效的存儲(chǔ)和管理,還能夠支持對(duì)多種媒體數(shù)據(jù)的理解以及從中進(jìn)行知識(shí)獲取。在知識(shí)引導(dǎo)下的查詢及其相應(yīng)智能化的操作和處理。 2022/9/725第25頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二8.2.2擴(kuò)展的關(guān)系數(shù)據(jù)模型傳統(tǒng)的關(guān)系數(shù)據(jù)模型缺少支持多媒體數(shù)據(jù)庫的能力。RDBMS只是
16、為管理表格字母數(shù)字形式的數(shù)據(jù)設(shè)計(jì)的,很難實(shí)現(xiàn)具有空間關(guān)系和時(shí)態(tài)關(guān)系的數(shù)據(jù),缺乏演繹和推理操作。最近,關(guān)系數(shù)據(jù)庫管理系統(tǒng)開始使用大二進(jìn)制對(duì)象(BLOB)來存儲(chǔ)和管理多媒體對(duì)象。BLOB可用于圖像或其他二進(jìn)制數(shù)據(jù)類型的對(duì)象。關(guān)系數(shù)據(jù)庫中包括BLOB的位置信息,這些信息實(shí)際存儲(chǔ)在數(shù)據(jù)庫之外的分離的圖像或視頻服務(wù)器上。通過訪問這些BLOB,為用戶顯示完整的數(shù)據(jù)集。2022/9/726第26頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二此外,盡管目前絕大多數(shù)關(guān)系數(shù)據(jù)庫都支持整型、浮點(diǎn)、字符串、貨幣、日期和布爾量等數(shù)據(jù)類型,有一些也增加了一些新特點(diǎn),如在BLOB中查詢超文本,但是還存在如下幾點(diǎn)
17、主要不足:2022/9/727第27頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二(1) 它們不支持如派生和聚合這樣的類關(guān)系。(2) 未加修改的關(guān)系模型不支持自動(dòng)管理數(shù)據(jù)的同步編輯,如版本管理等。(3) 關(guān)系數(shù)據(jù)庫的計(jì)算模型也不支持?jǐn)U展結(jié)構(gòu)的遍歷操作所需要的內(nèi)存駐留對(duì)象的概念。例如,在演示一個(gè)包含有圖像和全運(yùn)動(dòng)視頻剪輯的RTF文本時(shí)的操作。2022/9/728第28頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二(4) 關(guān)系模型不能進(jìn)行具有某種復(fù)雜度的長周期事務(wù)處理,例如需要對(duì)被多個(gè)用戶訪問的分布式多媒體對(duì)象進(jìn)行更新操作。所以,為了能在多媒體數(shù)據(jù)庫中使用關(guān)系數(shù)據(jù)模型,必須
18、對(duì)關(guān)系數(shù)據(jù)庫進(jìn)行必要的擴(kuò)充和改進(jìn)。2022/9/729第29頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二8.2.3面向?qū)ο竽P?0世紀(jì)90年代以來,面向?qū)ο竽P褪橇硪环N表達(dá)多媒體數(shù)據(jù)庫的主要方法,許多多媒體應(yīng)用中的數(shù)據(jù)管理都建立在面向?qū)ο竽P蜕稀?022/9/730第30頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二面向?qū)ο髷?shù)據(jù)庫模型類的概念對(duì)多媒體數(shù)據(jù)特別有用。一旦定義了類,所有類中的對(duì)象就被賦予了類的屬性。類定義在應(yīng)用軟件的開發(fā)速度上也有著明顯的優(yōu)勢(shì),并且有利于為開發(fā)和維護(hù)復(fù)雜多媒體應(yīng)用軟件提供更完善的功能及更廣泛的對(duì)象性能。此外,對(duì)象數(shù)據(jù)庫的功能,如消息傳遞、可
19、擴(kuò)展性、支持分層結(jié)構(gòu),對(duì)于多媒體系統(tǒng)來說也都是非常重要的。2022/9/731第31頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二但是,面向?qū)ο蟮臄?shù)據(jù)模型目前尚無一個(gè)統(tǒng)一的標(biāo)準(zhǔn),缺乏堅(jiān)實(shí)的理論基礎(chǔ),許多實(shí)際技術(shù)還不夠成熟。為了更好地滿足多媒體數(shù)據(jù)庫管理的需求,還需要做進(jìn)一步研究和改進(jìn)。例如增加反映多媒體對(duì)象之間時(shí)空關(guān)系的描述,描述多媒體對(duì)象間更深刻的語義。2022/9/732第32頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二8.3 多媒體元數(shù)據(jù)及其生成8.3.1多媒體元數(shù)據(jù)1.多媒體元數(shù)據(jù)概念多媒體數(shù)據(jù)往往由多種媒體組合而成。多媒體數(shù)據(jù)類型不同,表示方式也各不相同。不
20、同的表示形式,其存取方式和繪制方式等各不相同。因此,多媒體數(shù)據(jù)庫還應(yīng)包括處理不同對(duì)象的相關(guān)方法庫。多媒體數(shù)據(jù)庫與方法庫應(yīng)緊密相關(guān)聯(lián),以便進(jìn)行數(shù)據(jù)對(duì)象的組合、分解和變換等操作。所以,多媒體數(shù)據(jù)應(yīng)包括數(shù)據(jù)原始對(duì)象(也稱數(shù)據(jù)源)、數(shù)據(jù)對(duì)象的說明(元數(shù)據(jù)等)以及與對(duì)象相關(guān)聯(lián)的方法3部分 2022/9/733第33頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二2022/9/734第34頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二媒體對(duì)象,如音頻、圖像及視頻,是二進(jìn)制和非結(jié)構(gòu)化的,因此也不能簡單地用數(shù)學(xué)解析式表示。多媒體數(shù)據(jù)庫必須取得并存取基于這些媒體對(duì)象內(nèi)容的解釋,這些解釋就成
21、為元數(shù)據(jù)。元數(shù)據(jù)可以從媒體信息自動(dòng)地或者半自動(dòng)地(或者在一些情況下是手動(dòng)地)生成。 2022/9/735第35頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二元數(shù)據(jù)包含兩方面的內(nèi)容: 媒體內(nèi)部元數(shù)據(jù)處理媒體內(nèi)信息的解釋。 媒體相互間的元數(shù)據(jù)處理多個(gè)媒體和它們相互關(guān)系信息的解釋。2022/9/736第36頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二2.多媒體元數(shù)據(jù)分類一般來說,多媒體元數(shù)據(jù)可以分為如下3類:(1)內(nèi)容相關(guān)的元數(shù)據(jù)(2)內(nèi)容描述的元數(shù)據(jù)(3)內(nèi)容無關(guān)的元數(shù)據(jù)2022/9/737第37頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二8.3.2 多媒體
22、元數(shù)據(jù)生成1.文本元數(shù)據(jù)文本元數(shù)據(jù)可以表示為字符串(即由鍵盤輸入),也可以表示為圖像(由掃描儀輸入)。若用字符串表示,其最基本的元數(shù)據(jù)是文本邏輯結(jié)構(gòu)及其展示風(fēng)格的描述,描述的內(nèi)容一般可由作者提供,作者提供的不充分的某些部分仍需用自動(dòng)或半自動(dòng)的方法識(shí)別,例如子標(biāo)題邊界的確定和關(guān)鍵詞的提取等。如果文本數(shù)據(jù)是由掃描儀輸入,則生成元數(shù)據(jù)需要更多的自動(dòng)或半自動(dòng)處理,例如行、字、符號(hào)、圖和表的識(shí)別、段落邊界的確定、關(guān)鍵詞的提取等。2022/9/738第38頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二2.聲音元數(shù)據(jù)在聲音媒體中,語音是使用和研究得最多的一種媒體。有限制的語音識(shí)別逐步走向?qū)嵱没?/p>
23、從語音鑒別發(fā)言人、按照語調(diào)和語氣來區(qū)別語義和詞義也在研究之中。但在普遍情況下,既不限詞匯、不限發(fā)言人數(shù)、不限語法、不限環(huán)境和背景,語音識(shí)別的效果就不夠好,還不能實(shí)用化。2022/9/739第39頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二通過語音處理和識(shí)別,可以獲得語音數(shù)據(jù)的各種語義信息,這是最基本的依賴于內(nèi)容的語音單元。由于語音識(shí)別須要和大量樣板語音數(shù)據(jù)比較,空間和時(shí)間的開銷都很大。目前,用自動(dòng)半自動(dòng)方法提取語音元數(shù)據(jù)還有一定的困難。2022/9/740第40頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二3.圖像元數(shù)據(jù)圖像元數(shù)據(jù)與圖像類型和應(yīng)用領(lǐng)域有關(guān)。例如人像的元
24、數(shù)據(jù)主要包括人的自然和社會(huì)的屬性以及人的各部分的特征等;衛(wèi)星圖像元數(shù)據(jù)主要包括柵格結(jié)構(gòu)、地理位置、地貌特征、地域覆蓋(例如國域,省域等)、攝取時(shí)間;醫(yī)學(xué)圖像元數(shù)據(jù)主要包括病人屬性、檢查時(shí)間,結(jié)構(gòu)異常部位及特征。2022/9/741第41頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二4.影視元數(shù)據(jù)影視數(shù)據(jù)是由一系列幀組成的。影視元數(shù)據(jù)有些是屬于幀一級(jí)的,例如某一幀的顏色或灰度特征;有些是屬于幀系列級(jí)的。幀系列還可以分為多級(jí):即影視級(jí)(一部電影或電視節(jié)目)、情節(jié)級(jí)(表示影視中一段連貫的內(nèi)容),場景級(jí)(在一個(gè)地點(diǎn)或場地拍攝的內(nèi)容),鏡頭級(jí)(一次連續(xù)的拍攝)。每一級(jí)都可能有各自的元數(shù)據(jù),例
25、如某個(gè)鏡頭中物體移動(dòng)軌跡,2022/9/742第42頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二8.4 多媒體數(shù)據(jù)庫查詢數(shù)據(jù)庫查詢是數(shù)據(jù)庫系統(tǒng)最重要的功能之一。典型的查詢包括如下幾部分: 需要輸出的數(shù)據(jù)項(xiàng)。 可供查詢的信息庫。 查詢條件(查詢謂詞)。根據(jù)謂詞描述的內(nèi)容和謂詞被指定的方式可用不同的類型對(duì)多媒體數(shù)據(jù)庫進(jìn)行查詢。 2022/9/743第43頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二8.4.1多媒體數(shù)據(jù)庫查詢實(shí)例下面以電影點(diǎn)播(MOD)多媒體數(shù)據(jù)庫系統(tǒng)為例,列舉一些多媒體數(shù)據(jù)庫查詢的實(shí)例??蛻裟苓B接到VOD服務(wù)器,查詢服務(wù)器能提供的電影,下載和觀看電影。假
26、設(shè)VOD服務(wù)器能存放電影的如下信息:2022/9/744第44頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二(1) 電影的一個(gè)影像段。(2) 與影像段相關(guān)的聲音段。(3) 電影提取的兩個(gè)重要情節(jié)的畫面圖像。(4) 給出電影的導(dǎo)演、男演員、女演員和其他電影特征的文本。2022/9/745第45頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二客戶能用許多可能的方式查找VOD數(shù)據(jù)庫。舉例如下:查詢1:帶有計(jì)算機(jī)動(dòng)畫卡通的電影有哪些?VOD服務(wù)應(yīng)答器回應(yīng):VOD服務(wù)器顯示電影的細(xì)節(jié):“Who Framed Rabbit”和“Toy Story”。2022/9/746第46頁,共7
27、8頁,2022年,5月20日,13點(diǎn)54分,星期二查詢2:請(qǐng)顯示一個(gè)卡通主角講這個(gè)句子的電影的細(xì)節(jié)(這個(gè)聲音段為:“有人污染了海灣”)。VOD服務(wù)應(yīng)答器回應(yīng):服務(wù)器顯示出有卡通人物Wooody講過上述句子的電影“Toy Story”的片段。回應(yīng)包括影像和聲音的片段,并帶有宣傳畫和文本信息。2022/9/747第47頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二查詢3:顯示如下影像發(fā)生的電影片段:卡通人物Wooody給綠軍人員指派了一個(gè)監(jiān)視生日禮物的偵察任務(wù)。VOD服務(wù)應(yīng)答器回應(yīng):服務(wù)器顯示所需的電影“Toy Story”的片段,并提供相應(yīng)的聲音、宣傳畫和文本。2022/9/748第
28、48頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二查詢4:顯示這個(gè)電影宣傳畫面的電影細(xì)節(jié)(圖像描述了卡通人物Jessica Rabbit被扔出動(dòng)畫馬車的畫面)。VOD服務(wù)應(yīng)答器回應(yīng):服務(wù)器顯示相應(yīng)電影“Who Framed Roger Rabbit”的宣傳畫及其細(xì)節(jié)資料。客戶還能進(jìn)行以上查詢的組合查詢,不同組合的查詢返回的多媒體對(duì)象應(yīng)包括相應(yīng)的內(nèi)容。2022/9/749第49頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二8.4.2多媒體數(shù)據(jù)庫的查詢類型多媒體數(shù)據(jù)的查詢可以分為不同類型,主要方式如下。1. 基于多媒體信息內(nèi)容的查詢由于多媒體信息內(nèi)容已被多媒體對(duì)象相關(guān)的媒體
29、數(shù)據(jù)描述了。因此,這些查詢是通過對(duì)元數(shù)據(jù)和媒體對(duì)象的直接訪問進(jìn)行的。2022/9/750第50頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二2. 依據(jù)實(shí)例查詢(QBE)QBE查詢就是查找與指定實(shí)例對(duì)象相似對(duì)象的查詢過程。用戶處理器必須正確指定用戶要求匹配例子對(duì)象的特性。我們看看下面的查詢:“給我和這幅圖像相似的圖像”。這相似性匹配要求用戶必須指定紋理方面、顏色、空間特性(例子圖像內(nèi)的位置)或者圖像中提供的對(duì)象的形狀,也可以全部或部分匹配。對(duì)于部分匹配來說,查詢處理器必須指定匹配可容錯(cuò)程度。2022/9/751第51頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二3. 時(shí)間
30、索引查詢(Time Index queries)這些查詢用來處理媒體對(duì)象的時(shí)間特性,這些時(shí)間特性可用節(jié)段樹存儲(chǔ)。查詢處理器采用訪問索引信息(用節(jié)段樹存儲(chǔ))或其他的相似方法來處理時(shí)間索引查詢。2022/9/752第52頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二4. 空間查詢這些查詢可以去處理和對(duì)象有關(guān)的空間特性,這些特性可作為媒體信息生成。查詢處理器可訪問這些媒體數(shù)據(jù)信息并做出反應(yīng)。2022/9/753第53頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二5. 應(yīng)用程序指定查詢應(yīng)用程序指定描述可作為元數(shù)據(jù)信息存儲(chǔ)。查詢處理器可訪問這些信息并做出反應(yīng)。2022/9/754
31、第54頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二8.4.3查詢過程的選擇多媒體數(shù)據(jù)的查詢包括引用多媒體對(duì)象。對(duì)于首先訪問哪個(gè)多媒體數(shù)據(jù)庫查詢處理器有不同的選擇。例如下圖描述了一個(gè)簡單媒體文本的查詢過程。假定文本信息的元數(shù)據(jù)存在,那索引文件則首先被訪問。以文本文檔的選擇為根據(jù),通過訪問元數(shù)據(jù),查詢信息就會(huì)提供給用戶。2022/9/755第55頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二2022/9/756第56頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二當(dāng)查詢媒體超過一個(gè)時(shí),查詢的進(jìn)程就可以用不同的方式處理。圖8-5描述了多個(gè)媒體的查詢進(jìn)程的一種可能方
32、式:文本和圖像。假定圖像和文本元數(shù)據(jù)都是有效的,那查詢就可以用下面兩種不同的方式處理:2022/9/757第57頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二(1) 首先訪問和文本有關(guān)的索引文件并選擇一個(gè)原始的文檔集。然后檢測文檔集以確定文檔中是否有查詢指定的圖像對(duì)象。這個(gè)隱含文檔中包含有關(guān)圖像方面的信息。(2) 首先訪問和圖像信息有關(guān)的索引文件并選擇圖像集。然后監(jiān)測與圖像相關(guān)的信息以確定圖像是否是任何文檔的一部分。2022/9/758第58頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二2022/9/759第59頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二
33、2022/9/760第60頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二8.4.4 多媒體數(shù)據(jù)庫查詢語言作為用戶查詢的一部分,為了選擇某個(gè)對(duì)象還需要計(jì)算查詢謂詞。這些謂詞可以由一些布爾操作組成,例如:NOT、AND和OR。查詢語言是用來描述查詢謂詞的,對(duì)多媒體數(shù)據(jù)庫應(yīng)用程序來說,查詢語言需要有描述下面謂詞的特性: 時(shí)間謂詞。 空間謂詞。 描述舉例查詢的謂詞。 應(yīng)用程序指定謂詞。2022/9/761第61頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二除了需要描述不同謂詞的特性外,查詢語言還需要描述不同媒體對(duì)象的特性。多種查詢語言可用于多媒體數(shù)據(jù)庫應(yīng)用程序。 SQL和它的各
34、種版本提供了描述多媒體數(shù)據(jù)庫查詢的特性。然而,多媒體應(yīng)用程序有一個(gè)很大的需求范圍,因此,各類專家研究小組也對(duì)其他的查詢語言進(jìn)行了研究。查詢語言提供的特性有助于應(yīng)用程序的查詢描述。 2022/9/762第62頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二1. SQL/MM查詢語言SQL/MM查詢語言提供了新的數(shù)據(jù)類型如二進(jìn)制大對(duì)象(BLOBS)、新類型構(gòu)造器和面向?qū)ο蟮奶卣?。新的?nèi)部數(shù)據(jù)類型是作為抽象數(shù)據(jù)類型提供的。面向?qū)ο蟾郊犹匦允菫榱耸拐Z言更適合于多媒體數(shù)據(jù)庫應(yīng)用程序。SQL/MM定義的每個(gè)當(dāng)前狀態(tài)都由3部分組成:結(jié)構(gòu)框(FRAMEWORD)、全文本(FULL-TEXT)和空間部
35、分(SPATIAL)。下面,我們討論作為SQL/MM一部分而定義的抽象數(shù)據(jù)類型。2022/9/763第63頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二SQL/MM中定義的抽象數(shù)據(jù)類型可根據(jù)應(yīng)用程序的需要定義數(shù)據(jù)類型。在面向?qū)ο蟮南到y(tǒng)中,ADT和這種定義對(duì)象的方法相似。ADT的定義有兩種:結(jié)構(gòu)上和行為上的。結(jié)構(gòu)部分定義了ADT的數(shù)據(jù)結(jié)構(gòu),而行為部分則描述了對(duì)數(shù)據(jù)進(jìn)行的操作。作為行為部分的一部分,每個(gè)ADT都定義了內(nèi)部構(gòu)造函數(shù)。構(gòu)造函數(shù)初始化各種在數(shù)據(jù)結(jié)構(gòu)部分定義的數(shù)據(jù)結(jié)構(gòu)。每個(gè)ADT也有一個(gè)內(nèi)部析構(gòu)函數(shù),當(dāng)ADT被破壞時(shí)清除對(duì)象。2022/9/764第64頁,共78頁,2022年,
36、5月20日,13點(diǎn)54分,星期二2. PICQUERY+查詢語言PICQUERY+語言是一種用于圖示和字符數(shù)據(jù)庫管理系統(tǒng)的查詢語言。PICQUERY+在數(shù)據(jù)庫上的主要應(yīng)用是醫(yī)學(xué)應(yīng)用。醫(yī)學(xué)數(shù)據(jù)庫應(yīng)用程序的重要特性包括下面這些內(nèi)容。2022/9/765第65頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二醫(yī)學(xué)數(shù)據(jù)庫的這些特性描述了身體的某些器官是如何在一段時(shí)間內(nèi)發(fā)展的:(1) 進(jìn)化(發(fā)展):一個(gè)對(duì)象的特性是可以在某段時(shí)間內(nèi)發(fā)展的。(2) 混合:一個(gè)對(duì)象可以和其他的對(duì)象混合,形成一個(gè)具有區(qū)別于父母對(duì)象特性的一個(gè)新的對(duì)象。(3) 繁殖:一個(gè)對(duì)象可以分裂成兩個(gè)或多個(gè)單獨(dú)的對(duì)象。2022/9/7
37、66第66頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二時(shí)間特性描述了數(shù)據(jù)庫對(duì)象如下特性:(1) 兩個(gè)對(duì)象之間的時(shí)間關(guān)系(例如:一個(gè)事件跟在另一事件之后)。(2) 一個(gè)對(duì)象生存的時(shí)期或事件發(fā)生的時(shí)間。2022/9/767第67頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二PICQUERY+提供下面的查詢操作: 進(jìn)化謂詞指定和對(duì)象不同發(fā)展階段的有關(guān)約束條件。作為PICQUERY+一部分定義的0進(jìn)化操作包括:EVOLUES INTO、FUSES_INTO和SPLITS INTO。 作為時(shí)間謂詞,PICQUERY+指定下列操作:after、before、between、in、
38、overlaps、meets、equivalent、adjacent、follows和precedes。2022/9/768第68頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二對(duì)于描述和數(shù)據(jù)空間特性有關(guān)的查詢包括下面操作:INTERSECTS、CONTAINS,IS COLLINEAR,WITH,INFILTRATES,LEFTOF,RIGHTOF,ABOVE,BELOW,INFRONT OF,BEGIND。 對(duì)于描述模糊查詢,定義了SLMlLAR操作。2022/9/769第69頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二3. VIDEO SQLVIDEO SQL查詢語言是OVID系統(tǒng)提供的一種視頻對(duì)象檢索語言。VIDEO SQL有以下語句:2022/9/770第70頁,共78頁,2022年,5月20日,13點(diǎn)54分,星期二(1)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 遼寧鐵道職業(yè)技術(shù)學(xué)院《視頻拍攝與編輯》2023-2024學(xué)年第二學(xué)期期末試卷
- 漯河食品職業(yè)學(xué)院《學(xué)術(shù)英語寫作(雙語)》2023-2024學(xué)年第二學(xué)期期末試卷
- 馬鞍山職業(yè)技術(shù)學(xué)院《天人合和:中醫(yī)養(yǎng)生與亞健康》2023-2024學(xué)年第二學(xué)期期末試卷
- 湖北水利水電職業(yè)技術(shù)學(xué)院《英語在線閱讀2》2023-2024學(xué)年第二學(xué)期期末試卷
- 浙江特殊教育職業(yè)學(xué)院《食品加工與制造》2023-2024學(xué)年第二學(xué)期期末試卷
- 遵義醫(yī)藥高等專科學(xué)?!洞髮W(xué)英語D》2023-2024學(xué)年第二學(xué)期期末試卷
- 紹興文理學(xué)院《證據(jù)法》2023-2024學(xué)年第二學(xué)期期末試卷
- 孤獨(dú)的小螃蟹閱讀測試題及答案
- 公共交通服務(wù)設(shè)施維護(hù)制度
- 工作場所安全警示標(biāo)志
- 手機(jī)攝影教程全套課件
- 2025屆寧夏銀川一中高三上學(xué)期第五次月考英語試題及答案
- 基于核心素養(yǎng)的高中數(shù)學(xué)“教、學(xué)、評(píng)”一致性研究
- 空調(diào)原理培訓(xùn)課件
- 體育運(yùn)動(dòng)中的交流與合作 課件 2024-2025學(xué)年人教版(2024)初中體育與健康七年級(jí)全一冊(cè)
- 小學(xué)科學(xué)湘科版六年級(jí)下冊(cè)全冊(cè)同步練習(xí)含答案
- 反激式開關(guān)電源電子數(shù)據(jù)表格(自帶公式)
- 新HSK口語考試說明課件
- 3.1公民基本權(quán)利課件(20張PPT)
- T∕CGMA 033002-2020 壓縮空氣站節(jié)能設(shè)計(jì)指南
- 土建工程監(jiān)理實(shí)施細(xì)則(完整版)
評(píng)論
0/150
提交評(píng)論