![多媒體元數(shù)據(jù)研究_第1頁(yè)](http://file4.renrendoc.com/view/c4f9c969d9c36c5997d04a225a77d0a0/c4f9c969d9c36c5997d04a225a77d0a01.gif)
![多媒體元數(shù)據(jù)研究_第2頁(yè)](http://file4.renrendoc.com/view/c4f9c969d9c36c5997d04a225a77d0a0/c4f9c969d9c36c5997d04a225a77d0a02.gif)
![多媒體元數(shù)據(jù)研究_第3頁(yè)](http://file4.renrendoc.com/view/c4f9c969d9c36c5997d04a225a77d0a0/c4f9c969d9c36c5997d04a225a77d0a03.gif)
![多媒體元數(shù)據(jù)研究_第4頁(yè)](http://file4.renrendoc.com/view/c4f9c969d9c36c5997d04a225a77d0a0/c4f9c969d9c36c5997d04a225a77d0a04.gif)
![多媒體元數(shù)據(jù)研究_第5頁(yè)](http://file4.renrendoc.com/view/c4f9c969d9c36c5997d04a225a77d0a0/c4f9c969d9c36c5997d04a225a77d0a05.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
多媒體元數(shù)據(jù)研究多媒體元數(shù)據(jù)研究1、多媒體資源AudioVisualMetadataECHO(EuropeanChroniclesOn-line,歐洲編年史在線)MEPG-7MPEG-21VRACoreCategoriesEAD(編碼文檔描述)2、數(shù)字圖像資源MOA(theMakingofAmerican)2數(shù)字圖像元數(shù)據(jù)CDL數(shù)字圖像元數(shù)據(jù)Dig35NISO/CLIR/RLG的圖像技術(shù)元數(shù)據(jù)4、MPEG系列標(biāo)準(zhǔn)(1、2、4、7、21)
MPEG是專門從事多媒體音、視頻壓縮技術(shù)標(biāo)準(zhǔn)制定的國(guó)際組織,成員包括來(lái)自近30個(gè)國(guó)家、200多個(gè)公司的400多位專家。該組織自1988年以來(lái),已經(jīng)制定了一系列國(guó)際標(biāo)準(zhǔn),其中MPEG-1、MPEG-2已為人們所熟知,它們?yōu)閂CD、DVD及數(shù)字電視等產(chǎn)業(yè)的發(fā)展奠定了基礎(chǔ)。目前正在制定的MPEG-4、MPEG-7和MPEG-21將為多媒體數(shù)據(jù)壓縮和基于內(nèi)容檢索的數(shù)據(jù)庫(kù)應(yīng)用提供一個(gè)更為通用的平臺(tái),必將對(duì)下一代視、音頻系統(tǒng)和網(wǎng)絡(luò)應(yīng)用產(chǎn)生深遠(yuǎn)的影響。MPEG-1:存儲(chǔ)和回放
MPEG-1制定于1993年,是針對(duì)1.5Mbps以下數(shù)據(jù)傳輸率的數(shù)字存儲(chǔ)媒介運(yùn)動(dòng)圖像及其伴音編碼的國(guó)際標(biāo)準(zhǔn),主要用于在CD-ROM上存儲(chǔ)同步和彩色運(yùn)動(dòng)視頻信號(hào)。MPEG-2:數(shù)字電視
MPEG-2出臺(tái)于1995年,它是針對(duì)HDTV和DVD等制定的3Mbps~10Mbps的運(yùn)動(dòng)圖像及其伴音的編碼標(biāo)準(zhǔn)。它的出現(xiàn)使得基于CD-ROM的交互式電視和數(shù)字電視成為了可能。MPEG-4:基于對(duì)象的存取
MPEG-4于1999年成為國(guó)際標(biāo)準(zhǔn)。它和MPEG-1和MPEG-2的重點(diǎn)在于編碼效率上不同的是,MPEG-4的目標(biāo)是提出一種新的方式來(lái)傳輸、訪問和操作數(shù)字視聽數(shù)據(jù)。MPEG-4計(jì)劃為多種通訊規(guī)范提供一種普遍的技術(shù)解決方案,最終消除它們之間的差別。與MPEG-1和MPEG-2的另一點(diǎn)不同是,MPEG-1和MPEG-2是基于幀的規(guī)范,而MPEG-4則是基于對(duì)象的規(guī)范。
4.1MPEG-7:多媒體內(nèi)容描述隨著Internet的普及和網(wǎng)絡(luò)帶寬的增加,產(chǎn)生了大量的多媒體數(shù)據(jù),如何在浩如煙海的信息中快速、容易地獲得自己所需的內(nèi)容則成為當(dāng)前必須解決的問題。在此需求下,MPEG-7應(yīng)運(yùn)而出。MPEG-7力求能夠快速且有效地搜索出用戶所需的不同類型的多媒體信息。該標(biāo)準(zhǔn)主要致力于視聽數(shù)據(jù)的信息編碼表達(dá),換句話說也就是集中在對(duì)多媒體材料描述的通用接口的標(biāo)準(zhǔn)化上。MPEG-7的功能與其他MPEG標(biāo)準(zhǔn)互為補(bǔ)充。MPEG-1、MPEG-2和MPEG-4是內(nèi)容本身的表示,而MPEG-7是有關(guān)內(nèi)容的信息,是比特的比特。MPEG-7中的主要概念數(shù)據(jù)(Data)是用MPEG-7描述的視聽資料,不考慮它們的存儲(chǔ)、編碼、顯示、傳輸、媒介或技術(shù)。該定義非常廣泛,包含圖形、靜止圖像、視頻、影片、音樂、語(yǔ)音、聲音、文本和其他相關(guān)的AV媒體。----特征(Feature)指數(shù)據(jù)的特性。特征本身不能比較,而要用有意義的特征表示(描述子)和它的實(shí)例(描述值)。如圖像的顏色、語(yǔ)音的聲調(diào)、音頻的旋律等。----描述子(Descriptor,D)是特征的表示。它定義特征表示的句法和語(yǔ)義,可以賦予描述值。一個(gè)特征可能有多個(gè)描述子,如顏色特征可能的描述子有:顏色直方圖、頻率分量的平均值、運(yùn)動(dòng)的場(chǎng)描述、標(biāo)題文本等。----描述值(DescriptorValue)是描述子的實(shí)例。描述值與描述模式結(jié)合,形成描述。----
描述模式(DescriptionScheme,DS)說明其成員之間的關(guān)系結(jié)構(gòu)和語(yǔ)義。成員可以是描述子和描述模式。DS和D的區(qū)別是:D僅僅包含基本的數(shù)據(jù)類型,不引用其他D或DS。如對(duì)于影片,時(shí)間結(jié)構(gòu)化為場(chǎng)景和鏡頭,在場(chǎng)景級(jí)包括一些文本描述子,在鏡頭級(jí)包含顏色、運(yùn)動(dòng)和一些音頻描述子。----描述(Description)一個(gè)描述由一個(gè)描述模式(結(jié)構(gòu))和一組描述值組成。----編碼的描述(CodedDescription)是對(duì)已完成編碼的描述,滿足諸如壓縮效率、差錯(cuò)恢復(fù)和隨機(jī)存取的相關(guān)要求。----描述定義語(yǔ)言(DescriptionDefinitionLanguage,DDL)是一種允許產(chǎn)生新的描述模式和描述子的語(yǔ)言,允許擴(kuò)展和修改現(xiàn)有的描述機(jī)制。----
為了更好地理解這些術(shù)語(yǔ),請(qǐng)參看圖1。圖中解釋了MPEG-7在實(shí)際系統(tǒng)中的位置。圓角框表示處理工具,矩形框表示靜態(tài)元素,陰影部分包含MPEG-7標(biāo)準(zhǔn)的規(guī)范元素:DDL提供建立描述模式的機(jī)制,然后將描述模式作為基礎(chǔ),產(chǎn)生一個(gè)描述。MPEG-7的范圍下圖是MPEG-7處理鏈的一種高度抽象示意圖,用于解釋MPEG-7的范圍。它包括特征抽取(分析)、描述本身和搜索引擎(應(yīng)用)。MPEG-7對(duì)視覺數(shù)據(jù)的描述MPEG-7具體對(duì)視覺方面的描述子和描述模式有以下方面的要求:(1)特征類型----視覺描述允許以下特征(與查詢中使用的信息類型有關(guān)):顏色、視覺對(duì)象、紋理、輪廓(草圖)、形狀、靜止和動(dòng)態(tài)圖像、體積、空間關(guān)系(相對(duì)于圖像和圖像序列中的對(duì)象空間和拓?fù)潢P(guān)系,這個(gè)關(guān)系是空間合成關(guān)系)、運(yùn)動(dòng)(如視頻鏡頭中的運(yùn)動(dòng),用于利用時(shí)間合成信息來(lái)檢索等方面)、變形(如對(duì)象的彎曲)、視覺對(duì)象的源和它的特性(如源對(duì)象、源事件、源屬性、事件、事件屬性等)、模型(如MPEG-4SNHC)。
(2)利用描述進(jìn)行數(shù)據(jù)可視化----MPEG-7數(shù)據(jù)描述應(yīng)該容許被索引數(shù)據(jù)或多或少地粗略可視化。
(3)可視數(shù)據(jù)的格式----支持以下可視數(shù)據(jù)格式:數(shù)字視頻和電影(例如MPEG-1/2/4)、模擬視頻和電影、電子形式的靜態(tài)圖像(如JPEG)或紙上的圖像、圖形、3D模型以及與視頻關(guān)聯(lián)的編輯數(shù)據(jù)。(4)可視數(shù)據(jù)類型----可以是自然視頻、靜態(tài)圖像、圖形、動(dòng)畫、三維模型、編輯信息。MPEG-7對(duì)聽覺數(shù)據(jù)的描述(1)特征類型----頻率輪廓線、音頻對(duì)象、音色、和聲、頻率特征、振幅包絡(luò)、時(shí)間結(jié)構(gòu)(包括節(jié)奏)、文本內(nèi)容(語(yǔ)音或歌詞)、聲波近似值(通過哼唱一段旋律或發(fā)出一種聲音效果來(lái)生成)、原型聲音(典型的用于示例查詢)、空間結(jié)構(gòu)(用于多通道聲源,如立體聲、5.1通道等,每個(gè)聲道有特定的映像)、聲源和它的特性(例如源對(duì)象、源時(shí)間、源屬性、事件、事件屬性和典型的關(guān)聯(lián)場(chǎng)景)、模型(如MPEG-4SAOL)。----(2)描述數(shù)據(jù)的聽覺化----類似視覺數(shù)據(jù)的要求。----(3)聽覺數(shù)據(jù)格式----數(shù)字音頻(如MPEG-1音頻、CD)、模擬音頻(如錄音帶介質(zhì))、MIDI(包括一般的MIDI和Karaoke格式)、基于模型的音頻、產(chǎn)品數(shù)據(jù)。----(4)聽覺數(shù)據(jù)類----聲音軌跡(自然音頻場(chǎng)景)、音樂、原子聲音效果(如掌聲)、語(yǔ)音、符號(hào)音頻表示(MIDI、SNHC音頻)、混音信息(包括效果)。4.2MPEG-7的“拉”應(yīng)用1).視頻數(shù)據(jù)庫(kù)的存儲(chǔ)和檢索----電視和電影檔案中保存有大量的各種格式的多媒體資料,如數(shù)字、模擬磁帶和膠片、CD等,這些資料不一定有描述信息(元數(shù)據(jù)),即使有也大都是簡(jiǎn)單的文本描述,它們以專用的格式存儲(chǔ)在數(shù)據(jù)庫(kù)中,因此,需要按照國(guó)際標(biāo)準(zhǔn)格式進(jìn)行存儲(chǔ)和交換。另外,要對(duì)大量舊的模擬視聽資料進(jìn)行數(shù)字化,在數(shù)字化和壓縮階段,可以在數(shù)據(jù)庫(kù)中使其包含基于內(nèi)容的索引特征。對(duì)于新的視聽媒體,在視頻生產(chǎn)的各個(gè)階段可以把描述信息附加在視頻流上,從而極大地提高了用手工進(jìn)行有限詞匯注釋的質(zhì)量和生產(chǎn)率。
“拉”應(yīng)用2).專業(yè)媒體制作方面的圖片和視頻提交----演播室需要向電視頻道提交適當(dāng)?shù)囊曨l,另外還需要編輯一段庫(kù)中的視頻,如編輯記錄片和廣告片等。----在這個(gè)應(yīng)用中,用戶是專業(yè)性的。演播人員可以基于元數(shù)據(jù)和視頻片段來(lái)提交一個(gè)完整的視頻,可以基于客觀特性和主觀特性來(lái)查詢出想要的視頻片段并用于編輯。查詢也可以作用于分布數(shù)據(jù)庫(kù),以獲得視覺、版權(quán)和價(jià)格信息,以及源視頻資料的技術(shù)質(zhì)量數(shù)據(jù)。----在設(shè)計(jì)方面,靜止圖片也具有相似的應(yīng)用和需求。Web設(shè)計(jì)人員并不都是做新的設(shè)計(jì),有時(shí)也在網(wǎng)絡(luò)上選擇現(xiàn)有的圖片用于Web站點(diǎn)的設(shè)計(jì)。在網(wǎng)絡(luò)上,設(shè)計(jì)人員可以通過基于內(nèi)容的檢索方法挑選想要的素材。其他設(shè)計(jì)領(lǐng)域具有相似的可視搜索用途。
“拉”應(yīng)用3).商業(yè)音樂應(yīng)用(卡拉OK和音樂銷售)----卡拉OK在亞洲極其流行。一般是根據(jù)歌名和原唱者姓名檢索,但也常有記不清歌名的情況。這時(shí)可以利用音頻內(nèi)容檢索技術(shù),業(yè)余歌手哼幾句記憶的曲調(diào),讓計(jì)算機(jī)查找相應(yīng)的歌曲(或給出相似歌曲的列表)。----相似的與音樂銷售有關(guān)的應(yīng)用是把可選擇的音樂庫(kù)擴(kuò)展到用戶家里。人們可以容易地訪問在線數(shù)據(jù)庫(kù),用基于內(nèi)容的方式(結(jié)合歌手名、風(fēng)格、歌名、創(chuàng)作年代等),查找感興趣的歌曲和音樂作品,并付費(fèi)下載。
“拉”應(yīng)用4).聲音效果庫(kù)----對(duì)于要使用大容量聲音效果數(shù)據(jù)庫(kù)的藝術(shù)家和聲音設(shè)計(jì)人員,常規(guī)的數(shù)據(jù)庫(kù)管理和搜索方法是不夠的。一個(gè)聲音設(shè)計(jì)人員要求從聲音效果庫(kù)中選擇出要求的聲音效果,其選擇方式可能是由設(shè)計(jì)人員提供原型化的聲音和音頻特征,甚至可以發(fā)出類似要查找的聲音,通過擬聲方式查詢。-5).歷史語(yǔ)音數(shù)據(jù)庫(kù)----可以通過口頭關(guān)鍵詞、關(guān)鍵事件、說話人、地點(diǎn)、日期,或以上屬性的組合來(lái)搜索歷史數(shù)據(jù)庫(kù)中的音頻錄音和視聽演講。這種應(yīng)用也可以輔助教育或新聞業(yè)應(yīng)用。例如,用戶說一句關(guān)鍵詞:Ihaveadream,系統(tǒng)把語(yǔ)音轉(zhuǎn)換為文本關(guān)鍵詞,查找出馬丁·路德金的錄音和演講文本?!袄睉?yīng)用6).通過聽覺事件進(jìn)行電影場(chǎng)景檢索----許多視覺場(chǎng)景是與聲音事件相關(guān)的。例如在喜劇電影或電視場(chǎng)景中,人們可以通過記憶的對(duì)話和臺(tái)詞來(lái)檢索電影的場(chǎng)景。另外,還可以通過明顯的聲音事件來(lái)檢索,例如通過觀眾的歡呼聲和解說員的解說詞檢索足球進(jìn)球的場(chǎng)景,通過爆炸聲檢索戰(zhàn)斗和破壞場(chǎng)景等。音軌中的聽覺事件也同樣具有這樣的檢索能力。該應(yīng)用利用語(yǔ)音的描述和聲音效果的描述來(lái)實(shí)現(xiàn)檢索。7).商標(biāo)庫(kù)的注冊(cè)和檢索----通常情況下,商標(biāo)是二維圖像,包含文本、圖畫或圖片以及象征性的顏色。二維商標(biāo)可以分為三類:文字商標(biāo)(僅僅包含文字,適合用文本注釋來(lái)描述)、圖案商標(biāo)(僅僅包含圖形或象征性標(biāo)志,需要形狀描述)、組合形式的商標(biāo)(包含字符和圖形)。4.3MPEG-7的“推”應(yīng)用與以上的“拉”應(yīng)用相反,下面的“推”應(yīng)用類似于廣播和Web廣播?!巴啤睉?yīng)用用到“選擇”和“過濾”,而不是“索引”和“檢索”,因此有非常不同的要求。通常它們涉及到流描述,而不是存儲(chǔ)在數(shù)據(jù)庫(kù)中的靜態(tài)描述?!巴啤睉?yīng)用2).個(gè)人化電視服務(wù)--在廣播領(lǐng)域,內(nèi)容的描述可以輔助廣播數(shù)據(jù)的選擇,所選擇的廣播數(shù)據(jù)形式可以是即時(shí)的或以后要觀看的,或錄像形式的。對(duì)于個(gè)人化廣播,提供給用戶的數(shù)據(jù)可以按照用戶自己的喜好來(lái)對(duì)廣播流進(jìn)行過濾,其形式可以是自動(dòng)方式的,例如根據(jù)地理位置、年齡、性別或以前的選擇行為自動(dòng)選擇,或是半自動(dòng)方式(基于預(yù)定的設(shè)置)。結(jié)合NVOD(準(zhǔn)視頻點(diǎn)播)服務(wù),可以基于關(guān)鍵幀實(shí)現(xiàn)步進(jìn)/后退操作,加速節(jié)目的表現(xiàn)。對(duì)于未來(lái)的廣播服務(wù),與節(jié)目中特定事件相關(guān)的交互功能也很重要。3).智能多媒體表現(xiàn)----隨著可獲取信息的大量增加,人們正在尋找一種新的方式,自動(dòng)地表現(xiàn)這些數(shù)據(jù)。它可以通過把上下文、用戶、應(yīng)用和設(shè)計(jì)原則的知識(shí)與顯示信息的知識(shí)結(jié)合起來(lái)完成。靈活地應(yīng)用這些知識(shí),就可以設(shè)計(jì)一種智能多媒體表現(xiàn)系統(tǒng)?!巴啤睉?yīng)用4).個(gè)人化瀏覽、過濾和搜索----這種應(yīng)用背景是在消費(fèi)者的家里。使用一種靈巧裝置將瀏覽、過濾和搜索功能集于一體。平常,這個(gè)靈巧裝置按照主人的設(shè)置(愛好)自動(dòng)過濾廣播數(shù)據(jù),錄下感興趣的節(jié)目,等到主人有空的時(shí)候觀看。觀看過程中可以充分利用內(nèi)容描述能力,快速地基于內(nèi)容瀏覽,或搜索出感興趣的片段。5).特別的信息存取----這種應(yīng)用滿足殘疾人的信息存取要求,提供主動(dòng)的信息表現(xiàn)形式,可以幫助他們克服信息獲取的問題。關(guān)鍵問題是允許用多模態(tài)通信來(lái)表現(xiàn)信息。例如,一個(gè)搜索代理不僅為盲人排除圖像顯示,而且獲得MPEG7的元數(shù)據(jù)。在元數(shù)據(jù)的輔助下,可以通過發(fā)聲和觸覺的形式表現(xiàn)信息。相似的元數(shù)據(jù)可以幫助其他方面有障礙的殘疾人。4.4MPEG-7特殊的專業(yè)應(yīng)用和控制1).遠(yuǎn)程購(gòu)物----越來(lái)越多的商品是通過在線商品目錄銷售的。如果目錄限制為文本形式,效果就不好。視覺的印象要比文本的印象深刻得多。用常規(guī)的方法可以檢索到商品,但是對(duì)于要買的商品,往往是許多用戶僅僅知道一些模糊的概念,“看到了才知道”。因此,需要提供視覺查找方法,以及逐步調(diào)整搜索要求,最終找到所要的商品。例如,“我要查找棕色的鞋子,像這樣的鞋子,但是后跟要高一些”,或者是“我在找這種花樣的窗簾,但是顏色要更鮮艷一點(diǎn)”。這樣的可視搜索還適合地毯、布料、內(nèi)裝修、建筑等方面的商品選購(gòu)。它需要一種集中更新的圖像數(shù)據(jù)庫(kù)系統(tǒng)支持分布的銷售點(diǎn)的信息存取。2).生物醫(yī)學(xué)應(yīng)用----醫(yī)學(xué)是視覺識(shí)別技術(shù)的用武之地之一。醫(yī)學(xué)資料充滿了大量的圖像,以不同的縮放比例,表示身體各部分正常和病變的狀況。診斷中通常需要調(diào)用這些資料,而僅僅用基于文本的描述是不夠的。因此,需要能夠響應(yīng)圖像查詢的搜索引擎。醫(yī)生調(diào)用醫(yī)療數(shù)據(jù)庫(kù)中的病例記錄,比較X光照片以判斷病變組織。醫(yī)學(xué)中的3D成像技術(shù)越來(lái)越重要,因此,圖像查詢要能夠處理2D和3D數(shù)據(jù)。有些病例資料包含聲音描述,例如胸透X光照片結(jié)合咳嗽聲,這時(shí)需要交叉模型的搜索方法支持查詢。3).遙感應(yīng)用----遙感應(yīng)用基于衛(wèi)星圖像數(shù)據(jù)庫(kù)。數(shù)以百萬(wàn)計(jì)的圖像是按照全色、多頻譜、超頻譜等方法獲得的。直到現(xiàn)在,圖像庫(kù)中的搜索還是基于文本信息的,例如現(xiàn)場(chǎng)名、幾何、頻譜和地物信息。一種挑戰(zhàn)是為在線數(shù)據(jù)庫(kù)系統(tǒng)提供以下功能:文本查詢、基于整體和部分參考圖像(一個(gè)和多個(gè)頻譜邊帶)的圖像查詢、基于內(nèi)容的檢索和瀏覽、保密性和數(shù)據(jù)保護(hù)。4).半自動(dòng)多媒體編輯----在擁有足夠的內(nèi)容信息條件下,多媒體對(duì)象可以干些什么?擁有足夠的自身結(jié)構(gòu)信息,再結(jié)合操縱這些結(jié)構(gòu)的方法,一段“靈巧”的多媒體數(shù)據(jù)片段能夠自己編輯自己,以適應(yīng)鄰接的多媒體數(shù)據(jù)。例如,來(lái)自不同信息源的一段音樂和視頻片段可以自動(dòng)結(jié)合并同步在指定的同步點(diǎn)。5).教育應(yīng)用----在教育軟件中使用多媒體所面臨的挑戰(zhàn)是盡量利用媒體內(nèi)在的信息支持各種教學(xué)方法,諸如小結(jié)、問答、對(duì)錯(cuò)誤理解和非理解的反應(yīng)檢測(cè)等。通過提供對(duì)大型數(shù)據(jù)庫(kù)中視頻序列和圖像、圖形、動(dòng)畫媒體的基于內(nèi)容存取,MPEG7可以促進(jìn)教育領(lǐng)域采用音頻和視頻等媒體資料進(jìn)行形象直觀的教學(xué)和培訓(xùn)。應(yīng)用的方式主要是通過在線的視聽資料的檢索和比較,在課堂里生動(dòng)形象地展示教學(xué)內(nèi)容。例如歷史課、表演藝術(shù)課、音樂課等。6).監(jiān)測(cè)應(yīng)用----在監(jiān)測(cè)應(yīng)用中,攝像機(jī)監(jiān)視敏感區(qū)域,如果某事件發(fā)生,系統(tǒng)即觸發(fā)行動(dòng)。系統(tǒng)可以建立數(shù)據(jù)庫(kù),積累視頻數(shù)據(jù)和元數(shù)據(jù)信息。元數(shù)據(jù)的提取(在編碼器端)和元數(shù)據(jù)的使用(在解碼器端)采用相同的數(shù)據(jù)庫(kù)。對(duì)采集的數(shù)據(jù)庫(kù)可以進(jìn)行為指定的事件搜索音頻/視頻數(shù)據(jù)庫(kù)、查找相似的事件、判斷和決策。7).基于視覺的控制----在控制領(lǐng)域,基于視覺的控制不是用基于文本的方法控制程序,而是采用圖像、視覺對(duì)象和圖像序列來(lái)指定控制行為,形成完整的控制環(huán)。這里要求多媒體對(duì)象的描述中包含豐富的對(duì)象時(shí)空關(guān)系描述,以及任意對(duì)象之間的關(guān)系描述。在這些標(biāo)準(zhǔn)的關(guān)系描述基礎(chǔ)上可以實(shí)現(xiàn)基于視覺的控制系統(tǒng)。4.5MPEG-21多媒體框架標(biāo)準(zhǔn)數(shù)字圖書館是采用現(xiàn)代高新技術(shù)的數(shù)字信息資源系統(tǒng),它不受時(shí)間和空間的限制,是一個(gè)多功能、易于使用、超大規(guī)模的信息資源庫(kù)。在數(shù)字圖書館的資源建設(shè)中,多媒體信息占據(jù)了信息資源的很大一部分。如何獲取數(shù)字視頻/音頻及合成圖形等信息,如何傳送各種不同類型的媒體并為用戶提供透明的信息服務(wù),以及如何進(jìn)行內(nèi)容的管理、內(nèi)容的重定位、各種權(quán)利的保護(hù)、非授權(quán)存取和修改的保護(hù)等問題,日益受到數(shù)字圖書館建設(shè)者的重視。目前已經(jīng)建立的傳輸和數(shù)字媒體的基礎(chǔ)結(jié)構(gòu)、要素、規(guī)范之間還沒有一個(gè)明確的關(guān)系描述方法。如果有一種結(jié)構(gòu)或者框架能夠保證數(shù)字媒體消費(fèi)的簡(jiǎn)單性,并在一定的情況下自動(dòng)完成交易,那么它就能夠處理好數(shù)字項(xiàng)消費(fèi)中諸要素之間的關(guān)系。MPEG-21就是在這種背景下提出的。MPEG-21總體上來(lái)講是一個(gè)支持通過異構(gòu)網(wǎng)絡(luò)和設(shè)備使用戶透明而廣泛地使用多媒體資源的標(biāo)準(zhǔn),其目標(biāo)是建立一個(gè)交互的多媒體框架。MPEG-21是一個(gè)針對(duì)實(shí)現(xiàn)具有知識(shí)產(chǎn)權(quán)管理和保護(hù)能力的數(shù)字多媒體內(nèi)容的技術(shù)標(biāo)準(zhǔn)。MPEG-21的基本概念
MPEG-21是由通過數(shù)字而相互作用的用戶組成的。MPEG-21的行為主體是用戶,規(guī)范的動(dòng)作是“使用”,作用的客體是數(shù)字項(xiàng),MPEG-21作用的過程中形成了多媒體內(nèi)容傳送鏈和價(jià)值傳送鏈。以下是MPEG-21的三個(gè)基本概念。
1用戶(User)MPEG-21中的用戶是一個(gè)廣義的概念,可以是世界各地的個(gè)人、消費(fèi)者、團(tuán)體、組織、公司、政府以及其他標(biāo)準(zhǔn)化組織和主體。從技術(shù)上講,MPEG-21認(rèn)為內(nèi)容的提供者和消費(fèi)者同樣都是MPEG-21的用戶。用戶可以各種方式“使用”內(nèi)容,包括對(duì)內(nèi)容進(jìn)行發(fā)布、遞送和消費(fèi)等。
2使用(Use)MPEG-21提供了一個(gè)多媒體框架供一個(gè)用戶與另一用戶進(jìn)行以數(shù)字信息為目標(biāo)相互作用,相互作用所涉及的各方均為用戶。這里所指的相互作用即為對(duì)內(nèi)容的“使用”,它包括內(nèi)容創(chuàng)建、內(nèi)容提供、內(nèi)容存檔、內(nèi)容定級(jí)、內(nèi)容增強(qiáng)和遞送、內(nèi)容聚集、內(nèi)容傳輸、內(nèi)容發(fā)表、內(nèi)容零售、內(nèi)容消費(fèi)、內(nèi)容提交、內(nèi)容管制、以上各項(xiàng)交易的簡(jiǎn)化及管制等。
3數(shù)字項(xiàng)(DigitalItem)MPEG-21的數(shù)字項(xiàng)是一個(gè)結(jié)構(gòu)化的數(shù)字對(duì)象,是按標(biāo)準(zhǔn)進(jìn)行表達(dá)、標(biāo)記并帶有描述性的數(shù)據(jù)。數(shù)字項(xiàng)是數(shù)字資源及其相關(guān)內(nèi)容(圖像、JavaApplet、數(shù)據(jù)文件、音頻、視頻等)的集合。它是MPEG-21框架中傳送和交易的最基本單元,是用戶之間發(fā)生關(guān)系的目的。MPEG-21的結(jié)構(gòu)組成
MPEG-21多媒體框架是一個(gè)結(jié)構(gòu)化的框架,從結(jié)構(gòu)上可分成七大要素:a.數(shù)字項(xiàng)聲明(DigitalItemDeclaration):數(shù)字項(xiàng)聲明的目的是建立數(shù)字項(xiàng)統(tǒng)一和靈活的摘要和數(shù)字項(xiàng)的可互操作性方案。對(duì)于同一內(nèi)容有許多描述方法,因此希望能有一個(gè)強(qiáng)大的、方便的數(shù)字項(xiàng)模型來(lái)表示無(wú)數(shù)種形式中的數(shù)字項(xiàng)的描述。
b.內(nèi)容展現(xiàn)手法(ContentRepresentation):它是不同媒體的數(shù)據(jù)展現(xiàn)方式,如音頻、視頻的播放。MPEG-21提供的內(nèi)容表示可以通過分級(jí)的和錯(cuò)誤恢復(fù)方法有效地表示任何數(shù)據(jù)類型??蚣苤械膬?nèi)容可以編碼、描述、存儲(chǔ)、傳送、保護(hù)、交易、消費(fèi)等。在MPEG-21中,多媒體內(nèi)容表示可完成對(duì)MPEG-21基本對(duì)象的表示。
c.數(shù)字項(xiàng)的標(biāo)記和描述(DigitalItemIdentificationandDescription):這是對(duì)不同自然屬性、類型的數(shù)字項(xiàng)進(jìn)行統(tǒng)一標(biāo)記和描述的結(jié)構(gòu)。
d.內(nèi)容的管理和使用(ContentManagementandUsage):MPEG-21的目的是通過各種不同的網(wǎng)絡(luò)和設(shè)備透明地使用網(wǎng)絡(luò)內(nèi)容,所以對(duì)于內(nèi)容的檢索、定位、存檔、跟蹤、發(fā)布、使用顯得越來(lái)越重要。
e.知識(shí)產(chǎn)權(quán)的管理和保護(hù)(IntellectualPropertyManagementandProtection):MPEG-21可通過大范圍的網(wǎng)絡(luò)和設(shè)備對(duì)這些權(quán)利、興趣和認(rèn)定事項(xiàng)提供可靠的管理和保護(hù),同時(shí)在某種程度上獲得、編輯、發(fā)布相關(guān)的政策、法規(guī)、準(zhǔn)則。
f.終端和網(wǎng)絡(luò)(TerminalsandNetworks):MPEG-21通過屏蔽網(wǎng)絡(luò)和終端的安裝、管理和實(shí)現(xiàn)問題,使用戶能夠透明地操作和發(fā)布高級(jí)多媒體內(nèi)容。
g.事件報(bào)告(EventReporting):它可以使用戶準(zhǔn)確了解框架中所有可報(bào)告事件的接口和計(jì)量。事件報(bào)告將為用戶提供特定交互的執(zhí)行方法,同樣允許大量超范圍的處理,允許其他框架和模型與MPEG-21實(shí)現(xiàn)互操作。
MPEG-21的關(guān)鍵問題
1網(wǎng)絡(luò)部分的關(guān)鍵問題a.網(wǎng)絡(luò)傳送:包括傳送帶寬和速度、網(wǎng)絡(luò)的一致性和可靠性、數(shù)據(jù)流控制、延遲、差錯(cuò)率、存取時(shí)間、移動(dòng)性、性能價(jià)格比以及連通性等問題。
b.服務(wù)和設(shè)備的易用性:涉及到智能化、綜合連接、設(shè)備兼容、不同平臺(tái)之間的互操作性、國(guó)際間兼容性、設(shè)備設(shè)計(jì)上對(duì)民族文化的沖擊以及設(shè)備之間的分布式智能化等問題。
c.物理媒體格式的互操作性:包括與內(nèi)容無(wú)關(guān)的格式、后向兼容格式、媒體的壽命、不同平臺(tái)的標(biāo)準(zhǔn)存儲(chǔ)媒質(zhì)以及媒質(zhì)間的內(nèi)容傳輸?shù)取?/p>
d.多平臺(tái)的解碼和繪制:在不同類型或不同參數(shù)的平臺(tái)(設(shè)備)上回放內(nèi)容,并保證一定的質(zhì)量,另外還包括保證不同編解碼模式對(duì)用戶的透明性等問題。
2內(nèi)容和質(zhì)量方面的關(guān)鍵問題
a.服務(wù)質(zhì)量和靈活性:包括可靠性、質(zhì)量檢測(cè)、用戶感知的質(zhì)量、信息集成、評(píng)價(jià)、易用性、對(duì)用戶需求的動(dòng)態(tài)響應(yīng)、點(diǎn)播、有效平滑的繪制、可預(yù)測(cè)性和連續(xù)性,以及服務(wù)的可接入性等問題。MPEG-21的關(guān)鍵問題b.內(nèi)容表示的質(zhì)量:包括權(quán)限和完整性、保真性和用戶感知質(zhì)量(智能質(zhì)量)檢測(cè)、價(jià)格的一致性、真實(shí)性、持續(xù)性和時(shí)效性等問題。c.內(nèi)容藝術(shù)性方面的質(zhì)量:涉及品牌、來(lái)源、豐富性、評(píng)論、一致性等問題。d.內(nèi)容的過濾、定位、檢索和存儲(chǔ):包括一致的內(nèi)容標(biāo)記、描述和查詢的反應(yīng)時(shí)間、在內(nèi)容選擇上的個(gè)性化服務(wù)、搜索的完整性、有效性、可信性、內(nèi)容真實(shí)性的認(rèn)證、等級(jí)與分類、更新,以及對(duì)內(nèi)容的組織管理等方面問題。
3消費(fèi)者方面的關(guān)鍵問題a.付費(fèi)/訂購(gòu):包括服務(wù)、以收聽廣告或給出個(gè)人數(shù)據(jù)的服務(wù)、收費(fèi)的獎(jiǎng)賞模型、租借、分類付費(fèi)、獎(jiǎng)賞的復(fù)制件、點(diǎn)播、每項(xiàng)服務(wù)的簽署、簡(jiǎn)單明了的收費(fèi)模型、支付的驗(yàn)證等等;b.消費(fèi)者信息發(fā)布:包括內(nèi)容的保護(hù)和管理、自創(chuàng)內(nèi)容的可存取性、版權(quán)購(gòu)買等;
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- Unit2 An Accident(說課稿)-2024-2025學(xué)年北師大版(三起)英語(yǔ)六年級(jí)上冊(cè)
- 3-1《百合花》(說課稿)高一語(yǔ)文同步高效課堂(統(tǒng)編版 必修上冊(cè))
- 2023二年級(jí)數(shù)學(xué)上冊(cè) 七 分一分與除法第5課時(shí) 小熊開店說課稿 北師大版
- 3 天窗(說課稿)2023-2024學(xué)年部編版語(yǔ)文四年級(jí)下冊(cè)
- 《8和9的加、減法的應(yīng)用》(說課稿)-2024-2025學(xué)年一年級(jí)上冊(cè)數(shù)學(xué)人教版
- Unit 1 Art Using language 2 說課稿 -2023-2024學(xué)年高中英語(yǔ)人教版(2019)選擇性必修第三冊(cè)
- Unit 5 Colours Lesson 1(說課稿)-2024-2025學(xué)年人教新起點(diǎn)版英語(yǔ)一年級(jí)上冊(cè)
- 2023四年級(jí)數(shù)學(xué)上冊(cè) 1 大數(shù)的認(rèn)識(shí)第4課時(shí) 億以內(nèi)數(shù)的大小比較說課稿 新人教版
- 2024-2025學(xué)年新教材高中英語(yǔ) Unit 5 Working the Land Learning About Language(二)說課稿 新人教版選擇性必修第一冊(cè)
- 2025團(tuán)體人壽保險(xiǎn)合同
- 蘇教版四年級(jí)數(shù)學(xué)下冊(cè)第三單元第二課時(shí)《常見的數(shù)量關(guān)系》課件
- 2025年中考物理總復(fù)習(xí)《壓強(qiáng)》專項(xiàng)測(cè)試卷含答案
- SaaS服務(wù)具體應(yīng)用合同范本2024版版
- 殘疾人掛靠合作合同協(xié)議書范本
- 浙江省臺(tái)州市2021-2022學(xué)年高一上學(xué)期期末質(zhì)量評(píng)估政治試題 含解析
- 寧夏“8·19”較大爆燃事故調(diào)查報(bào)告
- 清代文學(xué)緒論
- 阿里云數(shù)字化轉(zhuǎn)型生態(tài)介紹課件
- 《控軋控冷》課件
- 高中英語(yǔ)選擇性必修三 Unit 2 Healthy Lifestyle Section B Learning about Language(教案)
- 煤礦瓦斯抽采達(dá)標(biāo)暫行規(guī)定
評(píng)論
0/150
提交評(píng)論