多媒體第一章教材_第1頁
多媒體第一章教材_第2頁
多媒體第一章教材_第3頁
多媒體第一章教材_第4頁
多媒體第一章教材_第5頁
已閱讀5頁,還剩82頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

多媒體通信技術

吳華怡2016-2-29wuhuayi@參考書1、多媒體通信技術基礎/蔡安妮等編著,第三版,電子工業(yè)出版社,2012

2、多媒體通信/徐作庭,李來勝編著,人民郵電出版社,2011.

緒論——2013年8月16日,國務院發(fā)布《關于促進信息消費擴大內(nèi)需的若干意見》——2014年3月,李克強總理在政府工作報告中進一步明確“把消費作為擴大內(nèi)需的主要著眼點,擴大服務消費,促進信息消費”。——2015年3月,李克強總理在政府工作報告中指出:制定“互聯(lián)網(wǎng)+”行動計劃,推動移動互聯(lián)網(wǎng)、云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)等與現(xiàn)代制造業(yè)結合,促進電子商務、工業(yè)互聯(lián)網(wǎng)和互聯(lián)網(wǎng)金融健康發(fā)展,引導互聯(lián)網(wǎng)企業(yè)拓展國際市場。2012通信行業(yè)分析報告預測一、通信行業(yè)將進入穩(wěn)步增長期預測二、把握終端制造鏈和內(nèi)容應用鏈的投資機遇預測三、行業(yè)拐點將至,關注電信聯(lián)通2014通信行業(yè)分析報告未來趨勢:一、4G正處于建設高峰期二、運營商面臨巨大考驗虛擬運營商、國家基站公司、電信業(yè)“營改增”2015年12月25日,中國信息通信研究院在北京召開“ICT深度觀察大型報告會暨白皮書發(fā)布會”,公開匯報年度重大研究成果,“中國信息通信行業(yè)2015年十大熱點及2016年十大趨勢”正式發(fā)布。

“信息通信領域2015年十大熱點”,分別是:“互聯(lián)網(wǎng)+”拓展網(wǎng)絡經(jīng)濟新空間,打造經(jīng)濟發(fā)展新動能;“提速降費”成為寬帶網(wǎng)絡發(fā)展的重要主題;分享經(jīng)濟構建移動互聯(lián)網(wǎng)時代的新型商業(yè)模式;4.5G繼續(xù)增強并橫向拓展,5G國際標準化拉開序幕;云計算發(fā)展進入2.0時代;應用基礎設施重塑網(wǎng)絡體系架構;

“中國制造2025”,工業(yè)互聯(lián)網(wǎng)是其關鍵基礎設施;智能終端產(chǎn)業(yè)進入手機升級和硬件創(chuàng)新雙重驅(qū)動時代;網(wǎng)絡安全立法全面推進,構筑我國網(wǎng)絡空間制度根基;國際“網(wǎng)絡中立”立法取得重大進展,歐美政策導向不同?!靶畔⑼ㄐ蓬I域2016年十大趨勢”,分別是:信息通信服務業(yè)收入突破2萬億元,歷史性轉(zhuǎn)折初現(xiàn);固定寬帶全面邁入高速光網(wǎng)時代;4G浪潮加速推進,為5G新紀元筑基;互聯(lián)網(wǎng)網(wǎng)絡架構優(yōu)化變革,轉(zhuǎn)型交換中心;SDN/NFV從數(shù)據(jù)中心走向廣域網(wǎng);物聯(lián)網(wǎng)邁向2.0時代,全球生態(tài)系統(tǒng)加速構建;工業(yè)互聯(lián)網(wǎng)引領全球新產(chǎn)業(yè)變革;人工智能步入快車道,孕育改變未來;“互聯(lián)網(wǎng)+”安全重要性凸顯,安全防御技術智能化演進;“互聯(lián)網(wǎng)+”大融合大變革,重塑監(jiān)管制度。第一章多媒體通信技術概述第二章音頻技術基礎第三章圖像技術基礎第四章視頻信息壓縮與處理第五章多媒體通信系統(tǒng)中的關鍵技術第六章多媒體通信網(wǎng)絡技術第七章多媒體數(shù)據(jù)的分布式處理第八章多媒體通信應用系統(tǒng)主要內(nèi)容第一章多媒體通信技術概述1.1多媒體技術的概念1.2多媒體通信系統(tǒng)的概念及主要特征1.3多媒體通信中的關鍵技術1.4多媒體通信的應用1.5多媒體通信技術的發(fā)展趨勢1.1多媒體通信的基本概念1.媒體

“媒體”是指信息傳遞和存儲的最基本的技術和手段,即信息的載體?!嗝襟w與媒體Multi+Media=Multimedia——傳統(tǒng)的四大媒體電視、廣播、報紙、網(wǎng)站從出現(xiàn)的先后順序來劃分,報紙刊物應為第一媒體,廣播應為第二媒體,電視應為第三媒體,互聯(lián)網(wǎng)則應被稱為第四媒體,移動網(wǎng)絡應為第五媒體什么是媒體?

媒體(Medium)在計算機領域中有兩種含義,一是指用以存儲信息的實體,如磁盤、磁帶、光盤和半導體存儲器;一是指信息的載體,如數(shù)字、文字、聲音、圖形圖像和視頻等。多媒體數(shù)據(jù)的多通道異步輸入過程媒體的定義和分類國際電話電報咨詢委員會CCITT(ConsultativeCommitteeonInternationalTelephoneandTelegraph,國際電信聯(lián)盟ITU的一個分會)把媒體分成如下5類:

感覺媒體(PerceptionMedium)

表示媒體(RepresentationMedium)

顯示媒體(PresentationMedium)

存儲媒體(StorageMedium)

傳輸媒體(TransmissionMedium)幾種媒體的關系CPUOutputDeviceStorageInputDevice表示媒體存儲媒體顯示媒體顯示媒體感覺媒體感覺媒體表示媒體傳輸媒體 (1)感覺媒體(perceptionmedium) 感覺媒體是指人類通過其感覺器官,如聽覺、視覺、嗅覺、味覺和觸覺器官等直接產(chǎn)生感覺(感知信息內(nèi)容)的一類媒體,包括:聲音、文字、圖像、氣味、冷熱等。 (2)表示媒體(representationmedium)

表示媒體是指用于數(shù)據(jù)交換的編碼表示,包括:圖像編碼、文本編碼、聲音編碼等。其目的是為了能有效地加工、處理、存儲和傳輸感覺媒體。 (3)顯示媒體(presentationmedium) 顯示媒體是指進行信息輸入和輸出的媒體。輸入媒體包括:鏈盤、鼠標、攝像頭、話筒、掃描儀、觸摸屏等,輸出媒體包括:顯示屏、打印機、揚聲器等。

(4)存儲媒體(storagemedium) 存儲媒體是指進行信息存儲的媒體。包括:硬盤、光盤、軟盤、磁帶、ROM、RAM等。 (5)傳輸媒體(transmissionmedium) 傳輸媒體是指承載信息,將信息進行傳輸?shù)拿襟w。包括:雙絞線、同軸電纜、光纜、無線電鏈路等。 在多媒體技術中的“多媒體”通常是指感覺媒體的組合,即聲音、文字、圖像、數(shù)據(jù)等各種媒體的組合。

2.多媒體(Multimedia)

“多媒體技術”的定義:所謂多媒體技術就是計算機交互式綜合處理多媒體媒體信息——文本、圖形、圖像和聲音,使多種信息建立邏輯連接,集成為一個系統(tǒng)并具有交互性。簡而言之,多媒體技術就是計算機綜合處理聲、文、圖信息的技術,具有集成性、實時性和交互性的特點。

多媒體技術最簡單的表現(xiàn)形式就是多媒體計算機。多媒體計算機相對于普通計算機的一個根本不同點在于在多媒體計算機中增加了對活動圖像(包括伴音在內(nèi))的處理、存儲和顯示的能力,其硬件配以聲卡、視頻采集卡等。其主要特征體現(xiàn)在它能夠有效地對電視圖像數(shù)據(jù)進行實時的壓縮和解壓縮,并能夠使在時間上有相關性的多種媒體保持同步。多媒體的定義“多媒體”譯自20世紀80年代初產(chǎn)生的英文詞“multimedia”,最早出現(xiàn)于美國麻省理工學院(MIT)遞交給國防部的一個項目計劃報告中。

多媒體是指信息表示媒體的多樣化,常見的多媒體有文字、圖形、圖像、聲音、音樂、視頻、動畫等多種形式。

多媒體技術是利用計算機技術把文本、聲音、視頻、動畫、圖形和圖像等多種媒體進行綜合處理,使多種信息之間建立邏輯連接,集成為一個完整的系統(tǒng)。

多媒體技術單一媒體:文本聲音視頻動畫圖形圖像…集成的多媒體系統(tǒng)綜合處理各種媒體,建立信息間的邏輯鏈接多媒體計算機技術及其發(fā)展歷史1941~1945美國政府為了準確計算導彈的彈道,秘密地進行全電子計算機PX計劃的開發(fā)

1945美國羅斯福總統(tǒng)的科學顧問Bush(1894~1974)在《大西洋月刊》上發(fā)表的“Aswemaythink”的著名論文,提出了采用設備或技術來幫助科學家檢索、記錄、分析及傳輸各種信息的新思路和名為“Memex”的一種工作站構想,影響著一大批最著名計算機科學家

1946美國賓夕法尼亞大學電機工程系科學家研制超過首部電子計算機ENIAC(ElectronicNumericalIntegratorAndComputer),它采用18000個電子管,體積達3000ft3

1947發(fā)明晶體管,為計算機的微型化打通道路1951美國RemingtonRand公司首次使用磁帶來存儲IBM商用計算機的資料,這種磁帶一直使用到20世紀60年代初期1959

發(fā)明集成電路1960-1970

美國空軍研究部門與IBM合作,研究中文處理方法,耗資6000多萬美元,但沒有成功1963

美國麻省理工學院Sutherland開創(chuàng)了計算機圖形學的新領域,并獲1988年ACM圖靈獎。他還在1968年開發(fā)了頭盔式立體顯示器,奠定了現(xiàn)代虛擬現(xiàn)實技術的重要基礎多媒體計算機技術及其發(fā)展歷史1963

美國斯坦福研究所的Engelbart發(fā)明了鼠標,當時它的外殼是用木頭做的。1968年12月9日,鼠標的使用在舊金山一次計算機展上得以示范;其后,施樂在其操作系統(tǒng)中加入了鼠標操作的設計1965

TedNelson提出Hypertext概念,它日后成為WWW的理論基礎1968

GordonMoore、RobertNoyce和葛羅夫成立Intel公司。“Intel”這個字是由“IntegratedElectronics”(集成電子)兩個英文單詞組合成的1969-05-01

AMD公司成立多媒體計算機技術及其發(fā)展歷史1971-11-13

Intel工程師成功開發(fā)出首枚微處理器,即4位的4004,它包含2300個晶體管1972

Intel推出8位的微處理器80081972-09

PHILIPS展示了長時間播放電視節(jié)目的光盤系統(tǒng),光盤上記錄的是模擬信號1975-07

蓋茨和愛倫成立了微軟公司1976

首部超級計算機問世。同年制成了沒有聲音、圖像、鍵盤和外殼的計算機AppleⅠ。1978-06-08

Intel推出16位的8086處理器,集成2900個晶體管,主頻為5MHz、8MHz和10MHz1979-06

Intel推出8088處理器,主頻為5MHz和8MHz多媒體計算機技術及其發(fā)展歷史多媒體計算機技術及其發(fā)展歷史1981-08-12

IBM推出首部PC,采用DOS1.0操作系統(tǒng)。從此,與PC兼容的計算機鋪天蓋地地發(fā)展起來1982

Intel推出16位的80286處理器,集成134000個晶體管,主頻為8MHz、10MHz、12MHz1982

SONY推出了世界上第一臺CD播放機CDP-101,并生產(chǎn)了第一張CD1983-11

微軟推出Windows操作系統(tǒng),只預裝在計算機里,不作零售。1985年11月,又推出1.0零售版1985-10-17

Intel推出首枚32位處理器80385DX,集成275000個晶體管,主頻16MHz、20MHz、25MHz和30MHz1985

PHILIPS和SONY定義了CD-ROM標準。1986

PHILIPS和SONY公司聯(lián)合推出了交互式緊湊光盤系統(tǒng),能夠?qū)⒙曇簟⑽淖?、圖形、圖像等數(shù)字化信息存儲到光盤上1987-03在國際第二屆CD-ROM年會上展出了世界上第一臺多媒體計算機多媒體計算機技術及其發(fā)展歷史1989

TimBerners-Lee在日內(nèi)瓦的CERN用HTML及HTTP開發(fā)了WWW網(wǎng),,隨后出現(xiàn)了各種瀏覽器(網(wǎng)絡用戶界面),使互聯(lián)網(wǎng)飛速發(fā)展起來1989-04-10

Intel推出80486處理器,集成120萬個晶體管,并首次內(nèi)置浮點運算器和8KB緩存,其速度比8088快50倍以上。1990-05-22

Windows3.0推出;1992年4月6日,經(jīng)過改進的Windows3.1推出,年銷量2700萬套,席卷全球。由微軟公司聯(lián)合一些主要PC廠商和多媒體產(chǎn)品開發(fā)商組成了MPC聯(lián)盟。并制定了第一代多媒體計算機標準--MPC1標準1991在日內(nèi)瓦確定HTML格式,為WWW發(fā)展奠定了基礎1992-08

Intel推出486DX2-66處理器1993-04

美國伊利諾州大學推出首個WWW瀏覽器Mosaic;次年,瀏覽器的主要設計員Marcandreessen和SiliconGraphics的創(chuàng)辦人JamesH.Clark合作創(chuàng)辦Netscape公司,同年10月14日推出Navigator瀏覽器測試版,12月推出正式版,到1995年,Navigator瀏覽器市場占有率達90%1993-05

Intel推出其第五代處理器,集成310萬個晶體管,并首次放棄以數(shù)字命名的方式,取名Pentium。同年,IBM、Motorola和蘋果公司合作開發(fā)PowerPC處理器,次年3月14日,蘋果公司推出的PowerMacintosh首次采用PowerPC處理器1993-05

MPC聯(lián)盟制定了第二代多媒體計算機標準--MPC2標準,該標準提高了基本部件的性能指標1994-10

IBM推出OS/2WARP3.0操作系統(tǒng),1996年10月,又推出WARP4版本,但仍無法扭轉(zhuǎn)微軟在PC操作系統(tǒng)的優(yōu)勢1995

Internet熱潮興起1995-06

MPC聯(lián)盟制定了第三代多媒體計算機標準--MPC3標準。該標準在進一步提高對基本部件的要求的基礎上,增加了全屏幕、全動態(tài)(30幀/秒)視頻及增強版的CD音質(zhì)的視頻和音頻硬件標準。MPC3指定了一個更新的操作平臺可以執(zhí)行增強的多媒體功能,首次將視頻播放的功能納入MPC標準1995-08-24

Windows95推出;微軟調(diào)動500名程序員開發(fā)的InternetExplorer(簡稱IE)瀏覽器推出1.0版本,1996年8月推出3.0版本,直接對Netscape公司造成威脅;IE不僅可以免費下載,更免費供應ISP,1998年則內(nèi)置在Windows98中,蠶食Navigator瀏覽器的市場1995-09

SONY和其他8家公司共同建立了DVD格式的統(tǒng)一標準1995-11-01

Intel推出其第六代處理器PentiumPRO,集成550萬個晶體管,出世一年半即被PentiumII取代1997Intel推出PentiumII,集成750萬個晶體管。5月,國際象棋大師卡斯帕羅夫被IBM深藍擊敗,在前一年2月,他曾戰(zhàn)勝過深藍,有人懷疑人類制造的機器是否會將人擊??;8月6日,蘋果公司宣布,微軟入股蘋果公司1.5億美元1999

Intel推出PentiumIIICPU,其中集成了2400萬個晶體管1999

ICQ和免費電子郵件的浪潮勢不可擋,吸引了數(shù)以千萬的用戶登記2000

Intel推出Pentium4CPU,其中集成了4200萬個晶體管2002-03-04.Intel發(fā)布Pentium4移動處理器Pentium4-M(簡稱P4-M)。P4-M采用NetBurst架構、0.13

m工藝流程生產(chǎn),芯片內(nèi)部集成5500萬個晶體管,共有512KB二級緩存,系統(tǒng)前端總線頻率達到400MHz2002-11-14Intel發(fā)布3.06GHzPentium4。這款具有創(chuàng)新意義的含超線程技術新款英特爾奔騰Pentium4處理器,主頻為3.06GHz,是世界上第一款采用業(yè)界最先進的0.13

m制造工藝、每秒計算速度超過30億次的量產(chǎn)微處理器2003-03-12

Intel正式發(fā)布名為迅馳(Centrino)的移動計算技術。迅馳是一項移動計算技術,它具有集成的無線局域網(wǎng)連接能力;突破性的移動計算性能;延長的電池使用時間;更輕、更薄的外形設計

3.多媒體通信

多媒體通信技術是多媒體技術、計算機技術、通信技術和網(wǎng)絡技術等相互結合和發(fā)展的產(chǎn)物。 多媒體通信系統(tǒng)同時具有以下三個特征:集成性交互性同步性除了以上三個特征,實際上多媒體還具有很多其它的特征,例如實時性,它主要指類似聲音和視頻這樣的媒體,它們具有很強的時間相關性。集成性:

主要是對各類信息進行存儲、傳輸、處理、顯現(xiàn)的能力。1)內(nèi)容數(shù)據(jù)信息:文本、圖形、靜止圖像與二值圖像、聲音、運動圖像。2)多媒體和超媒體信息:是結構化信息,由結構框架+內(nèi)容數(shù)據(jù)組成。3)腳本信息4)特定的應用信息5)多媒體集成性不僅是多種媒體的集成,而且還指多種業(yè)務的集成。

交互性:指的是在通信中使用者與系統(tǒng)之間的相互溝通的特性,它使用戶可以更有效地控制和使用信息,增加對信息的注釋和理解。交互性有兩個方面的內(nèi)容:人機接口:也就是人在使用系統(tǒng)的終端時,系統(tǒng)向用戶提供的操作界面。通信協(xié)議:用戶終端與系統(tǒng)之間的應用層通信協(xié)議。

多媒體信息空間中的交互性向用戶提供更加有效地控制和使用信息的手段,同時也為應用開辟了更廣闊的領域,交互可以增加對信息的注意和理解,延長保留的時間。同步性:多媒體通信終端上顯現(xiàn)的圖象、聲音和文字等信息是以同步方式工作。檢索“劉謙春晚”,顯示多媒體信息,各信息同步顯示。多媒體技術的應用視頻點播

電子出版物

CAI

游戲與娛樂

計算機視頻會議

多媒體展示和信息查詢系統(tǒng)

MIS與OA傳媒、廣告

講演輔助

聯(lián)機服務(On-lineservice)視頻點播電子出版游戲娛樂視頻會議多媒體信息查詢多媒體信息查詢經(jīng)過10多年的努力,許多學者試圖實現(xiàn)基于內(nèi)容的多媒體信息檢索技術,以彌補上述多媒體信息檢索技術的缺陷。國內(nèi)外有很多學者在積極研究基于內(nèi)容的多媒體信息檢索技術,其中包括對圖像(如圖1所示)、視頻和音頻等多媒體信息的內(nèi)容處理和分析(Parsing)、自動標注(Annotation)、構建索引(Indexing)和相似檢索(Retrieval)等。圖1基于內(nèi)容的圖像檢索系統(tǒng)——PicToSeek多媒體信息檢索技術管理信息系統(tǒng)與辦公自動化管理信息系統(tǒng)與辦公自動化傳媒聯(lián)機服務多媒體技術的發(fā)展趨勢計算機技術和網(wǎng)絡通信技術的結合為多媒體技術的進一步應用和發(fā)展提供了巨大的可能性,目前這種可能性已經(jīng)逐漸變?yōu)楝F(xiàn)實。多媒體技術的未來將朝著智能化和三維化兩個方向發(fā)展。

顯示視配器三大信息技術聯(lián)合計算機通信大眾傳媒數(shù)值計算數(shù)據(jù)處理圖形、圖象處理聲音處理視頻處理郵政電報電話傳真數(shù)據(jù)通信綜合業(yè)務(N-ISDN)多媒體書,刊,報紙廣播電影電視光盤出版物交互電視網(wǎng)絡出版支持寬帶綜合業(yè)務的數(shù)據(jù)通信網(wǎng)絡信息技術走向匯聚和融合多媒體的起源與發(fā)展計算機0,1通信大眾傳媒文本圖象圖形聲音視頻MPC郵政電報電話數(shù)字網(wǎng)ISDN信息高速報紙廣播電影電視HDTVITV多媒體時代通信大眾傳播計算機計算機和通信主動結合Multimedia-信息系統(tǒng)的融合計算機網(wǎng)公共通信網(wǎng)廣播網(wǎng)

光纖窄帶綜合業(yè)務數(shù)字有線數(shù)據(jù)網(wǎng)數(shù)字網(wǎng)電視網(wǎng)基于ATM交換的寬帶綜合業(yè)務數(shù)字網(wǎng)B-ISDN可移動的全球?qū)拵е悄軅€人綜合業(yè)務數(shù)字網(wǎng)BIP-ISDN

三網(wǎng)合一1.多媒體數(shù)據(jù)壓縮技術

數(shù)據(jù)壓縮的必要性和可能性。1.2多媒體通信中的關鍵技術多媒體信息的特點1.多媒體信息的類型文本、圖形、圖像、動畫、聲音、視頻2.常用多媒體處理軟件

CorelDrawIllustrator圖形類圖像類photoshopACDSee

多媒體信息的特點

動畫類·二維動畫FlashANIMO·三維動畫3dsmaxmayaCooleditproVEGAS聲音類影視編輯類交互演示類AuthorwaredirectorflashPremiereaftereffect編程類VbVCDelphiJava3.多媒體信息的特點多媒體數(shù)據(jù)類型復雜(多樣性)

多媒體數(shù)據(jù)種類繁多也決定了多媒體數(shù)據(jù)表示的復雜性多媒體數(shù)據(jù)的實時性由于在多媒體技術中新引入的復雜媒體類型大部份都含有與時間有關的信息,因此在許多場合都要求實時處理3.多媒體信息的特點多媒體數(shù)據(jù)的同步性另一由于引入與時間有關的媒體而形成的重要特點數(shù)據(jù)量大多媒體系統(tǒng)需要大量的存儲空間來存放復雜類型的數(shù)據(jù)多媒體數(shù)據(jù)的交互性碼率可變、突發(fā)性強人們講話時的停頓、所傳場景圖像中物體的運動等都會形成碼流速率的波動,而且這種波動往往呈現(xiàn)出極強的突發(fā)性。信息壓縮的必要性由于多媒體數(shù)據(jù)量非常大,造成計算機的存儲和網(wǎng)絡傳輸負擔若幀速率為25幀/秒,則1s的數(shù)據(jù)量大約為25MB,一個640MB的光盤只能存放大約25s的動態(tài)圖像一幅640×480分辨率的24位真彩色圖像的數(shù)據(jù)量約為900KB;一個100MB的硬盤只能存儲約100幅靜止圖像畫面解決辦法之一就是進行數(shù)據(jù)壓縮,壓縮后再進行存儲和傳輸,到需要時再解壓、還原。表1各種信號的特性和未壓縮速率信息壓縮的必要性從上圖可以看出:未進行任何形式編碼和壓縮的窄帶語音信號需要128kb/s的速率,即兩倍于普通電話的速率。信號未被壓縮的寬帶話音需要256kb/s的速率,未壓縮的雙聲道立體聲CD音頻需要1.41Mb/s的速率。在保持原始信號質(zhì)量的前提下,窄帶語音可以壓縮到4kb/s(30∶1的壓縮比),寬帶話音可以壓縮到約16kb/s(15∶1的壓縮比),CD音頻可以壓縮到64kb/s(22∶1的壓縮比)。顯然,多媒體信號在進行有效的存儲和傳輸之前,必須進行處理,而最關鍵的處理方法是進行數(shù)據(jù)壓縮。信息壓縮的可行性研究表明,一個文件所包含的數(shù)據(jù)量并不等于它所包含的信息量,數(shù)據(jù)中通常包含很大的冗余,其關系如:D=I+r其中D為數(shù)據(jù)量,I為信息量,r為冗余量。壓縮:在多媒體信息中包含大量冗余的信息,把這些冗余的信息去掉的過程。

信息壓縮的可行性音頻、圖像和視頻數(shù)據(jù)中存在的冗余主要有以下幾種:(1)空間冗余圖象本身的數(shù)據(jù)冗余在任何一幅圖像中,均有許多灰度或顏色都相同的鄰近像素組成的局部區(qū)域,它們形成了一個性質(zhì)相同的集合塊,即它們之間具有空間(或空域)上的強相關性,在圖像中就表現(xiàn)為空間冗余。空間冗余的壓縮方法:把這種局部區(qū)域集合塊當作一個整體,用極少的數(shù)據(jù)量來表示,從而節(jié)省存儲空間。這種壓縮方法叫空間壓縮或幀內(nèi)壓縮,它的基本點就在于減少鄰近像素之間的空間(或空域)相關性。信息壓縮的可行性該圖為一張俯視圖,圖中央的黑色是一塊表面均勻的積木塊,在圖中,黑色區(qū)域所有點的表示數(shù)據(jù)差不多都是相同的,因而黑色區(qū)域的數(shù)據(jù)表達有很大的冗余。信息壓縮的可行性(2)時間冗余序列圖像和語音數(shù)據(jù)中包含的冗余?;顒訄D像(視頻)中的兩幅相鄰圖像之間存在的相關性或一段時間內(nèi)連續(xù)音頻存在的相關性。信息壓縮的可行性(3)信息熵冗余信息熵冗余也稱為編碼冗余,它是指一塊數(shù)據(jù)所攜帶的信息量少于數(shù)據(jù)本身所產(chǎn)生的冗余。例如,利用等長碼表示信息就比不等長碼如Huffman編碼表示信息量存在冗余。(4)結構冗余指圖象各部分結構上的類似性所產(chǎn)生的冗余,例如物體表面圖象上的紋理結構。信息壓縮的可行性(5)知識冗余指某些圖象的結構可由這些圖象的先驗知識和背景知識獲得。例:汽車圖象的結構可由汽車的先驗知識和背景知識得到。這種冗余稱為知識冗余。例:人臉的圖像有固定的結構,嘴的上方有鼻子,鼻子的上方有眼睛,鼻子位于正臉圖像的中線上等等。這類規(guī)律的結構可由先驗知識和背景知識得到,因此這類信息對一般人來說是冗余信息。信息壓縮的可行性(6)視覺聽覺冗余視覺聽覺冗余是指人的視覺、聽覺分辨率低于實際圖象、音頻的分辨率所產(chǎn)生的冗余。例如,人的視覺對灰度等級的分辨率是2個等級,而一般圖象量化所采用灰度等級是2等級。例如,人的視覺對于圖像邊緣的急劇變化不敏感,對圖像的亮度信息敏感,對顏色的分辨率較弱等。因此,如果圖像經(jīng)壓縮或量化發(fā)生的變化(或稱引入了噪聲)不能被視覺所感覺,則認為圖像質(zhì)量是完好的或是夠好的,即圖像壓縮并恢復后仍有滿意的主觀圖像質(zhì)量。(7)其他冗余4.壓縮的種類無損壓縮也稱為冗余壓縮或無失真壓縮。冗余壓縮法去掉或者減少了數(shù)據(jù)中的冗余,但這些冗余數(shù)據(jù)是用特定的方法重新插入到數(shù)據(jù)中。冗余壓縮是可逆的,它能保證百分之百地恢復原始數(shù)據(jù)。在多媒體技術中,一般用于文本的壓縮。但這種方法壓縮比較低。常用的壓縮編碼方法有LZW編碼、行程編碼、霍夫曼(Huffman)編碼等,壓縮比一般在2:1~5:1之間。有損壓縮也稱為有失真壓縮或熵壓縮法。壓縮了熵,會減少信息量,而損失的信息量是不能恢復的,因此這種壓縮方法是不可逆的。這種方法適合對圖像、聲音、動態(tài)視頻等數(shù)據(jù)進行壓縮,對動態(tài)視頻的壓縮比可達到50:1~200:1。當然,對多媒體數(shù)據(jù)進行有損壓縮后,就涉及到壓縮質(zhì)量的問題,一般的要求是壓縮后的內(nèi)容不應該影響人們對信息的理解。數(shù)據(jù)壓縮的主要指標有較高的壓縮比、壓縮和解壓縮時間短、解壓縮后信息恢復質(zhì)量高是評價壓縮好壞的主要方面。1.有較高的壓縮比

即壓縮前后的數(shù)據(jù)量之比,如果文件的大小為1MB,經(jīng)過壓縮處理后變成0.5MB,那么壓縮比為2:1。高的壓縮比是數(shù)據(jù)壓縮的根本目的,無論從哪個角度看,在同樣壓縮效果的前提下,數(shù)據(jù)壓縮得越小越好。當然還要考慮多媒體數(shù)據(jù)壓縮后的輸入和輸出表示方式。數(shù)據(jù)壓縮的主要指標2.解壓縮后信息恢復質(zhì)量高

對于文本等文件,特別是是程序文件,是不允許在壓縮和解壓縮過程中丟失信息的。因此需要采用無損壓縮,不存在壓縮后恢復質(zhì)量的問題。對于圖像、聲音和視頻影像,數(shù)據(jù)經(jīng)過壓縮后允許信息的部分丟失。在這種情況下,信息經(jīng)解壓縮后不可能完全恢復,壓縮和解壓縮質(zhì)量就不能不考慮。因此,是否具有好的恢復質(zhì)量是數(shù)據(jù)壓縮的另一個重要指標。表2圖像主觀評價性能表

主觀評價分

質(zhì)量尺度

妨礙觀看尺度5

非常好

絲毫看不出圖像質(zhì)量變壞4

能看出圖像質(zhì)量變化,但不妨礙觀看3

一般

清楚地看出圖像質(zhì)量變壞,對觀看稍有妨礙2

對觀看有妨礙1

非常差

非常嚴重地妨礙觀看數(shù)據(jù)壓縮的主要指標3.壓縮和解壓縮時間短

數(shù)據(jù)的壓縮和解壓縮是在一定數(shù)學模型的基礎上,通過一系列數(shù)學運算實現(xiàn)的。計算方法的好壞直接關系到壓縮和解壓縮過程所需要的時間。數(shù)據(jù)壓縮的主要指標有較高的壓縮比、壓縮和解壓縮時間短、解壓縮后信息恢復質(zhì)量高是評價壓縮好壞的主要方面。1.有較高的壓縮比

即壓縮前后的數(shù)據(jù)量之比,如果文件的大小為1MB,經(jīng)過壓縮處理后變成0.5MB,那么壓縮比為2:1。高的壓縮比是數(shù)據(jù)壓縮的根本目的,無論從哪個角度看,在同樣壓縮效果的前提下,數(shù)據(jù)壓縮得越小越好。當然還要考慮多媒體數(shù)據(jù)壓縮后的輸入和輸出表示方式。1.2多媒體通信中的關鍵技術視頻壓縮

從圖像壓縮編碼的發(fā)展過程看,可以分為三個階段,即第一代、第二代、第三代圖像壓縮編碼方法。 第一代圖像壓縮編碼方法以仙農(nóng)信息論為基礎,考慮圖像信源的統(tǒng)計特性,采用預測編碼、變換編碼、矢量量化編碼、子帶編碼、小波變換編碼、神經(jīng)網(wǎng)絡編碼等方法。第一代圖像壓縮編碼方法于80年代初已趨于成熟,目前利用第一代技術對視頻圖像的壓縮可以得到8~48Kb/s的最低碼率。第二代圖像壓縮編碼方法充分考慮了人眼的視覺特性,從人類的主觀特性出發(fā),采用基于方向濾波的圖像編碼方法和基于圖像輪廓-紋理的編碼方法,利用第二代圖像壓縮編碼方法可以獲得極低碼率的圖像數(shù)據(jù),目前第二代技術尚未發(fā)展到成熟的階段。第三代圖像壓縮編碼方法考慮到了圖像傳遞的景物特征,采用分形編碼方法和基于模型的編碼方法,其中基于模型的壓縮編碼方法是目前最活躍的研究領域,代表著新一代的壓縮編碼方向。

有關圖像壓縮編碼的國際標準主要有:JPEG、H.261、H.263、MPEG-1、MPEG-2/H.262、MPEG-4等。MPEG-7和MPEG-21是MPEG系列標準中的新成員,MPEG-7的正式名稱為“多媒體內(nèi)容描述接口”,用于描述多媒體內(nèi)容數(shù)據(jù)。MPEG-21即“多媒體框架”,這一概念是在1999年10月的MPEG會議上提出的,它是一種用于協(xié)調(diào)處于不同地點、與不同類型的網(wǎng)絡相聯(lián)接的各種設備間進行多媒體信息交互的綜合性標準。音頻壓縮基本上與圖像壓縮編碼技術相同,不同之處在于圖像信號是二維信號,而音頻信號是一維信號。相比較而言,其數(shù)據(jù)壓縮難度較低。涉及的聲音壓縮編碼的國際標準主要有:G.711、G.721、G.722、G.728、G.729、G.723.1等。2.多媒體數(shù)據(jù)的獲取與顯示技術

多媒體數(shù)據(jù)的獲取與顯示主要指人機交互的界面,它介于用戶和計算機系統(tǒng)之間。用戶通過人機界面向系統(tǒng)提供命令、數(shù)據(jù)等輸入信息,系統(tǒng)則將輸出信息通過人機界面呈現(xiàn)給用戶。

字符界面,輸入工具是鍵盤

圖形化界面,輸入工具是鼠標、跟蹤球、電子筆、觸摸屏、攝像頭和視音頻采集卡等;輸出手段可采用聲音、圖形圖像以及活動視頻作為信息的顯示形式。文字識別技術語音識別技術

3.多媒體數(shù)據(jù)庫及其檢索技術

傳統(tǒng)的數(shù)據(jù)庫管理系統(tǒng)管理多媒體數(shù)據(jù)的方法的局限性,集中表現(xiàn)在以下三個方面。第一,多媒體數(shù)據(jù)所包含的信息量非常大,用人工注釋難以準確描述;第二,多媒體數(shù)據(jù)隨時變化,因而難以統(tǒng)計及預測;第三,多媒體數(shù)據(jù)內(nèi)部有各種復雜的時域、空域以及基于內(nèi)容的約束關系,傳統(tǒng)的數(shù)據(jù)庫系統(tǒng)未曾涉及到這些方面。由此開發(fā)出新的多媒體數(shù)據(jù)庫系統(tǒng),同時基于內(nèi)容的多媒體信息檢索研究方案也應運而生。

多媒體數(shù)據(jù)的內(nèi)容包括:

概念級內(nèi)容、感知特性(例如圖像的顏色、紋理,聲音的音色、音質(zhì)等)、邏輯關系(例如音視頻對象的時空關系等)、信號特征(通過信號處理方法例如小波變換獲得的媒體特征)、特定領域的特征(與應用相關,例如人的面部特征、指紋特征)等。

4.多媒體通信網(wǎng)絡技術 隨著視頻會議、視頻點播、遠程教育等多媒體網(wǎng)絡應用的開展,能夠滿足多媒體應用需要的通信網(wǎng)絡必須具有高帶寬、可提

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論