版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎一、預測編碼四、壓縮編碼應用綜述四、壓縮編碼應用綜述二、變換編碼三、統(tǒng)計編碼信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎1、聲音壓縮國際標準2、靜止圖像壓縮國際標準3、視頻壓縮國際標準信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎1 1、聲音壓縮國際標準、聲音壓縮國際標準2、靜止圖像壓縮國際標準3、視頻壓縮國際標準信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎語音300 - 3400 Hz會議電視50 - 7000 Hz高保真20 - 20000 Hz波波形形編編碼碼參數(shù)編碼
2、參數(shù)編碼混混合合編編碼碼算法算法名名 稱稱數(shù)據(jù)率數(shù)據(jù)率標準標準應用應用質(zhì)量質(zhì)量PCM均勻量化u(A)u(A)64kb/sG.711APCM 自適應量化DPCM差值量化ADPCM自適應差值量化32kb/sG.721SB-ADPCM子帶-自適應差值量化64kb/sG.722G.7235.3(6.3)公共網(wǎng)ISDN配音4.04.5LPC線性預測編碼 2.4kb/s保密話聲2.53.5CELPC13.2kb/s碼激勵LPC4.8kb/s移動通信VSELP矢量和激勵LPC 8kb/s語音郵件RPE-LTP長時預測規(guī)則碼激勵I(lǐng)SDNLD-CELP低延時碼激勵LPC16kb/sG.728G.7294.03.
3、7MPEG多子帶 感知編碼128kb/sCD5.0AC-3感知編碼音響5.0音頻標準性能指標信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎國際聲音標準比較國際聲音標準比較音頻信號 輸入發(fā)送器SB-ADPCM編碼器SB-ADPCM解碼器接收器音頻信號 輸出數(shù)據(jù)內(nèi)插裝置數(shù)據(jù)分解裝置輸入0,8,16kb/s輸出0,8,16kb/s64kb/s輸出64kb/s輸入音頻編碼音頻譯碼信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎G.722發(fā)送QMF高子帶ADPCM編碼器低子帶ADPCM編碼器MUX48kb/s16kb/s64kb/s信息論與編碼基礎信息論與編碼基礎信源壓
4、縮信源壓縮編碼基礎編碼基礎子帶編碼子帶編碼利用M個帶通濾波器把信號頻帶分解成若干子帶,通過移頻將各個子帶信號轉(zhuǎn)到基帶后按奈奎斯特速率重新采樣,再對采樣值進行通常的數(shù)字編碼并復合成一個統(tǒng)一的傳輸碼流。語音的SBS ( Subband Coding)是R.E.Crochiere等人在1976年引入的;1985年S.D.ONeil的碩士論文將SBC推廣用于圖像編碼;目前在典型的數(shù)字音頻壓縮實用方法中,SBC已經(jīng)成為主體技術(shù)框架。把音頻信號分成子帶后進行編碼的優(yōu)點: 1、碼位分配靈活 2、噪聲限在帶內(nèi) 在多媒體中,音頻有很多壓縮編碼標準:在多媒體中,音頻有很多壓縮編碼標準:1. MP31. MP3音頻
5、音頻 MP3 MP3的全名是的全名是MPEG Audio Layer-3MPEG Audio Layer-3,簡單地,簡單地說就是一種聲音文件的壓縮格式。是目前最普說就是一種聲音文件的壓縮格式。是目前最普及的音頻壓縮格式,是典型的有損壓縮。及的音頻壓縮格式,是典型的有損壓縮。 MPEG-1MPEG-1音頻壓縮標準里包括了三個使用高性音頻壓縮標準里包括了三個使用高性能音頻數(shù)據(jù)壓縮方法的感知編碼方案能音頻數(shù)據(jù)壓縮方法的感知編碼方案 ,按照壓,按照壓縮質(zhì)量縮質(zhì)量( (每每BitBit的聲音效果的聲音效果) )和編碼方案的復雜程和編碼方案的復雜程度分別是度分別是Layer1Layer1、Layer2L
6、ayer2、Layer3Layer3。信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎nMPEG-1音頻的層次與壓縮比率 Layer1(相當于384kbps立體聲信號)4:1Layer2(相當于192256kbps立體聲信號)6:18:1Layer3 (相當于112154kbps立體聲信號)10:112:1信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎 MP3MP3是利用是利用 MPEG Audio Layer 3 MPEG Audio Layer 3 的技術(shù),將音樂的技術(shù),將音樂以以1:10 1:10 甚至甚至 1:12 1:12 的壓縮率,壓縮成容量較小的
7、文的壓縮率,壓縮成容量較小的文件,換句話說,能夠在音質(zhì)丟失很小的情況下把文件件,換句話說,能夠在音質(zhì)丟失很小的情況下把文件壓縮到更小的程度。而且還非常好的保持了原來的音壓縮到更小的程度。而且還非常好的保持了原來的音質(zhì)。正是因為質(zhì)。正是因為MP3MP3體積小,音質(zhì)高的特點使得體積小,音質(zhì)高的特點使得MP3MP3格式格式幾乎成為網(wǎng)上音樂的代名詞。每分鐘音樂的幾乎成為網(wǎng)上音樂的代名詞。每分鐘音樂的MP3MP3格式格式只有只有1MB1MB左右大小,這樣每首歌的大小只有左右大小,這樣每首歌的大小只有3-43-4兆字節(jié)兆字節(jié)。使用。使用MP3MP3播放器對播放器對MP3MP3文件進行實時的解壓縮文件進行實
8、時的解壓縮( (解碼解碼) ),這樣,高品質(zhì)的,這樣,高品質(zhì)的MP3MP3音樂就播放出來了。音樂就播放出來了。信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎 2. MP3PRO2. MP3PRO MP3PROMP3PRO,它是,它是 Thomson MultimediaThomson Multimedia多媒體公司多媒體公司推出的一個推出的一個MP3MP3格式的升級版本,格式的升級版本,MP3PROMP3PRO可以把聲音可以把聲音文件壓縮到原有文件壓縮到原有MP3MP3格式的一半大小,但卻可以保持格式的一半大小,但卻可以保持相同的音質(zhì)。相同的音質(zhì)。 MP3Pro MP3Pro
9、制式是利用制式是利用低轉(zhuǎn)送速率技術(shù)低轉(zhuǎn)送速率技術(shù)(bit per bit per secsec),即平常一首),即平常一首MP3MP3的頻率大多是的頻率大多是128kbit128kbit,而,而MP3ProMP3Pro則固定于則固定于80kbit80kbit,降低碼率就可以降低文件大,降低碼率就可以降低文件大小小, ,把每首把每首MP3MP3所占空間減低到原有的所占空間減低到原有的5 5至至6 6成;但音質(zhì)成;但音質(zhì)卻絲毫無損。卻絲毫無損。 信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎 2. MP3PRO2. MP3PRO MP3PROMP3PRO文件在播放上完全與文件在播
10、放上完全與MP3MP3兼容,也就是說,兼容,也就是說,老的老的MP3MP3文件可以在新的文件可以在新的MP3PROMP3PRO播放器上進行播放,同播放器上進行播放,同時,新的時,新的MP3PROMP3PRO可以在標準的可以在標準的MP3MP3軟件和設備上播放,軟件和設備上播放,但效果可能較差,因為兩者錄制方式不同。但效果可能較差,因為兩者錄制方式不同。 信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎 3. OGG3. OGG OggOgg是一種先進的有損的音頻壓縮技術(shù),正式名稱是一種先進的有損的音頻壓縮技術(shù),正式名稱是是Ogg VorbisOgg Vorbis,是一種免費的開
11、源音頻格式。,是一種免費的開源音頻格式。OGGOGG編編碼格式遠比碼格式遠比9090年代開發(fā)成功的年代開發(fā)成功的MP3MP3先進,它可以在相先進,它可以在相對較低的數(shù)據(jù)速率下實現(xiàn)比對較低的數(shù)據(jù)速率下實現(xiàn)比MP3MP3更好的音質(zhì)。更好的音質(zhì)。 Ogg VorbisOgg Vorbis支持支持VBRVBR(可變比特率)和(可變比特率)和ABRABR(平均比(平均比特率)兩種編碼方式,特率)兩種編碼方式, OggOgg還具有比特率縮放功能,還具有比特率縮放功能,可以不用重新編碼便可調(diào)節(jié)文件的比特率。可以不用重新編碼便可調(diào)節(jié)文件的比特率。信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎
12、 3. OGG3. OGG OGGOGG格式可以對所有聲道進行編碼,支持多聲道格式可以對所有聲道進行編碼,支持多聲道模式,模式,而不像而不像MP3MP3只能編碼雙聲道只能編碼雙聲道。多聲道音樂會帶。多聲道音樂會帶來更多臨場感,欣賞電影和交響樂時更有優(yōu)勢,這場來更多臨場感,欣賞電影和交響樂時更有優(yōu)勢,這場革命性的變化是革命性的變化是MP3MP3無法支持的。在而且未來人們對無法支持的。在而且未來人們對音質(zhì)要求不斷提高,音質(zhì)要求不斷提高, OggOgg的優(yōu)勢將更加明顯。的優(yōu)勢將更加明顯。 信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎 4. WMA 4. WMA WMA (Wind
13、ows MediaAudio)WMA (Windows MediaAudio)格式是來自于微軟的格式是來自于微軟的重量級選手,后臺強硬,音質(zhì)要強于重量級選手,后臺強硬,音質(zhì)要強于MP3MP3格式,更遠勝格式,更遠勝于于RARA格式,它是以減少數(shù)據(jù)流量但保持音質(zhì)的方法來格式,它是以減少數(shù)據(jù)流量但保持音質(zhì)的方法來達到比達到比MP3MP3壓縮率更高的目的,壓縮率更高的目的,WMAWMA的壓縮率一般都可的壓縮率一般都可以達到以達到1 1:1818左右左右. . WMA WMA的另一個優(yōu)點是內(nèi)容提供商可以通過的另一個優(yōu)點是內(nèi)容提供商可以通過DRMDRM(DigitalcentersManagementD
14、igitalcentersManagement)方案如)方案如Windows Media Windows Media centersManager7centersManager7加入防拷貝保護。加入防拷貝保護。 信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎 4. WMA 4. WMA WMAWMA還支持音頻流技術(shù),適合在網(wǎng)絡上在線播放,還支持音頻流技術(shù),適合在網(wǎng)絡上在線播放,更方便的是不用象更方便的是不用象MP3MP3那樣需要安裝額外的播放器,而那樣需要安裝額外的播放器,而WindowsWindows操作系統(tǒng)和操作系統(tǒng)和WindowsMediaPlayerWindowsMe
15、diaPlayer的無縫捆綁讓的無縫捆綁讓你只要安裝了你只要安裝了windowswindows操作系統(tǒng)就可以直接播放操作系統(tǒng)就可以直接播放WMAWMA音音樂,新版本的樂,新版本的WindowsMediaPlayerWindowsMediaPlayer更是增加了直接把更是增加了直接把CDCD光盤轉(zhuǎn)換為光盤轉(zhuǎn)換為WMAWMA聲音格式的功能,在聲音格式的功能,在windowswindows操作系操作系統(tǒng)中,統(tǒng)中,WMAWMA是默認的編碼格式是默認的編碼格式 音質(zhì)好的可與音質(zhì)好的可與CDCD媲美,壓縮率較高媲美,壓縮率較高, ,可用于網(wǎng)絡廣可用于網(wǎng)絡廣播。播。信息論與編碼基礎信息論與編碼基礎信源壓縮信
16、源壓縮編碼基礎編碼基礎5 5、MP4MP4nMP4MP4并不是并不是MPEG-4MPEG-4或者或者MPEG-1Layer4MPEG-1Layer4,它的出現(xiàn)是針對,它的出現(xiàn)是針對MP3MP3的大眾化、無版權(quán)的一種保護格式。的大眾化、無版權(quán)的一種保護格式。nMP4MP4使用的是使用的是MPEG-2 AACMPEG-2 AAC技術(shù)也就是俗稱的技術(shù)也就是俗稱的a2ba2b或或AACAAC。其。其中,中,MPEG-2MPEG-2是是MPEGMPEG于于19941994年年1111月針對數(shù)碼電視月針對數(shù)碼電視( (數(shù)碼影像數(shù)碼影像) )提出的。它的特點就是,音質(zhì)更加完美而壓縮比更加大提出的。它的特點就
17、是,音質(zhì)更加完美而壓縮比更加大(1:15)(1:15)。MPEG-2 AAC(ISO/IEC 13818-7)MPEG-2 AAC(ISO/IEC 13818-7)在采樣率為在采樣率為8 896KHz96KHz下提供了下提供了1 14848個聲道可選范圍的高質(zhì)量音頻編碼。個聲道可選范圍的高質(zhì)量音頻編碼。AACAAC就是就是Advanced Audio Coding(Advanced Audio Coding(先進音頻編碼先進音頻編碼) )的意思,的意思,適用于從比特率在適用于從比特率在8kbit/s8kbit/s單聲道的電話音質(zhì)到單聲道的電話音質(zhì)到160kbit/s160kbit/s多聲道的超
18、高質(zhì)量音頻范圍內(nèi)的編碼,并且允許對多媒體多聲道的超高質(zhì)量音頻范圍內(nèi)的編碼,并且允許對多媒體進行編碼進行編碼/ /解碼。解碼。信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎nAACAAC與與MP3MP3相比,增加了諸如對立體聲的完美再現(xiàn)、比特流效相比,增加了諸如對立體聲的完美再現(xiàn)、比特流效果音掃描、多媒體控制、降噪優(yōu)異等果音掃描、多媒體控制、降噪優(yōu)異等MP3MP3沒有的特性,使得沒有的特性,使得在音頻壓縮后仍能完美的再現(xiàn)在音頻壓縮后仍能完美的再現(xiàn)CDCD音質(zhì)。音質(zhì)。n AACAAC技術(shù)主要由以下三個部分組成。技術(shù)主要由以下三個部分組成。 第一,第一,AT&TAT&
19、;T的音頻壓縮技術(shù)專利。它可以將的音頻壓縮技術(shù)專利。它可以將AACAAC壓縮比提高到壓縮比提高到20:120:1而不損失音質(zhì)。這樣,一首而不損失音質(zhì)。這樣,一首3 3分鐘的歌僅僅需要分鐘的歌僅僅需要2.25MB2.25MB,這在互聯(lián)網(wǎng)上的下載速度是很驚人的。這在互聯(lián)網(wǎng)上的下載速度是很驚人的。 第二、安全數(shù)據(jù)庫。它可以為你的第二、安全數(shù)據(jù)庫。它可以為你的AAC MusicAAC Music創(chuàng)建一個特定的創(chuàng)建一個特定的密鑰,將此密鑰存于其數(shù)據(jù)庫中。同時,只有密鑰,將此密鑰存于其數(shù)據(jù)庫中。同時,只有AACAAC的播放器的播放器才能播放含有這種密鑰的文件。才能播放含有這種密鑰的文件。 第三、協(xié)議認證。
20、這個認證包含了復制許可、允許復制副本數(shù)第三、協(xié)議認證。這個認證包含了復制許可、允許復制副本數(shù)目、歌曲總時間、歌曲可以播放時間以及售賣許可等信息。目、歌曲總時間、歌曲可以播放時間以及售賣許可等信息。信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎nMP4MP4技術(shù)的優(yōu)越性要遠遠高于技術(shù)的優(yōu)越性要遠遠高于MP3MP3,因為它更適合多媒體技,因為它更適合多媒體技術(shù)的發(fā)展以及視聽欣賞的需求。但是,術(shù)的發(fā)展以及視聽欣賞的需求。但是,MP4MP4是一種商品,是一種商品,它利用改良后的它利用改良后的MPEG-2 AACMPEG-2 AAC技術(shù)并強加上由出版公司直接技術(shù)并強加上由出版公司直接授
21、權(quán)的知識產(chǎn)權(quán)協(xié)議作為新的標準;而授權(quán)的知識產(chǎn)權(quán)協(xié)議作為新的標準;而MP3MP3是一種自由音是一種自由音樂格式,任何人都可以自由使用樂格式,任何人都可以自由使用。此外,。此外,MP4MP4實際上是由實際上是由音樂出版界聯(lián)合授意的官方標準;音樂出版界聯(lián)合授意的官方標準;MP3MP3則是廣為流傳的民則是廣為流傳的民間標準間標準。相比之下,。相比之下,MP3MP3的靈活和自由度要遠遠大于的靈活和自由度要遠遠大于MP4MP4,這使得音樂發(fā)燒友們更傾向于使用這使得音樂發(fā)燒友們更傾向于使用MP3MP3。更重要的一點是,。更重要的一點是,MP3MP3是目前最為流行的一種音樂格式,它占據(jù)著大量的網(wǎng)是目前最為流行
22、的一種音樂格式,它占據(jù)著大量的網(wǎng)絡資源,這使得絡資源,這使得MP4MP4的推廣普及難上加難。的推廣普及難上加難。 信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎 6. 6. WAVE WAV格式是微軟公司開發(fā)的一種聲音文件格式,格式是微軟公司開發(fā)的一種聲音文件格式,也叫波形聲音文件,是最早的數(shù)字音頻格式,被也叫波形聲音文件,是最早的數(shù)字音頻格式,被Windows平臺及其應用程序廣泛支持。平臺及其應用程序廣泛支持。WAV格式支持格式支持許多壓縮算法,支持多種音頻位數(shù)、采樣頻率和聲道許多壓縮算法,支持多種音頻位數(shù)、采樣頻率和聲道,采用,采用44.1kHz的采樣頻率,的采樣頻率,1
23、6位量化位數(shù),因此位量化位數(shù),因此WAV的音質(zhì)與的音質(zhì)與CD相差無幾,但相差無幾,但WAV格式對存儲空間需求太格式對存儲空間需求太大不便于交流和傳播大不便于交流和傳播 信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎1、聲音壓縮國際標準2 2、靜止圖像壓縮國際標準、靜止圖像壓縮國際標準3、視頻壓縮國際標準信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎qJPEG ( Joint Photographic Expert Group)1992年,聯(lián)合圖片專家組正式完成用于各種分辨率和格式的連續(xù)色調(diào)圖像的
24、ISO/IEC 10918標準,即JPEG標準。 JPEG標準支持漸進建立和順序建立兩種圖像建立模式,適合分辨率和格式的連續(xù)色調(diào)圖像;支持以下四種操作模式: 1、基于DCT的順序型操作模式; 2、基于DCT的漸進型操作模式; 3、基于DPCM的無損編碼(順序型)操作模式; 4、基于多分辨率編碼的(漸進型)操作模式; 1、基于DCT的順序型操作模式; 信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎qJPEG ( Joint Photographic Expert Group)順序模式信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎qJPEG ( Joint Ph
25、otographic Expert Group)漸進模式JPEG-DCT信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎8*8塊DCT量化器熵編碼器源圖像數(shù)據(jù)基于DCT的編碼器壓縮的圖像量化表熵編碼表基本系統(tǒng)qJPEG ( Joint Photographic Expert Group)信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎亮度量化表亮度量化表信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎信息論與編碼基礎信息
26、論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎qJPEG -LSJPEG組織從1994年開始征集新的無損/近無損壓縮算法提案,于1998年2月作為ITU-T建議T.87(草案)|國際標準ISO/IEC 14495-1正式公布。 上下文建模預 測誤差編碼游程模式數(shù)字源圖像數(shù)據(jù)信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎qJPEG -LS前一行當前行S6S3S2S4S7S5S1S0上下文的建模是基于局部梯度的計算:4SD1 = - 2S2SD2 = - 3S3SD3 = - 1S如果對i=1,2,3,都有:Di= 0對無損編碼|Di| NEAR對近無損編碼基于上下文建模信息論與編
27、碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎qJPEG 2000傳統(tǒng)JPEG標準:1)低碼率壓縮2)無損壓縮和有損壓縮3)計算機合成圖像與復合文檔的壓縮4)在噪聲環(huán)境中傳輸信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎qJPEG 20002000年12月,公布了JPEG2000的第1部分(核心編碼系統(tǒng))作為正式的國際標準,ISO/IEC 15444-1|ITU-T T.800。 JPEG2000的目標是對多種類型的靜止圖像(如自然圖像、計算機圖像、醫(yī)療圖像、遙感圖像以及復合文本等)實現(xiàn)高效壓縮,并要求壓縮碼流具有較好的抗誤碼性能,用戶可對圖像進行多種形式的漸進傳輸,
28、還可壓縮碼流進行隨機訪問和處理。 JPEG2000 標準可分為六大部分: Part 1:基本系統(tǒng); Part 2:基本系統(tǒng)的一些擴展功能; Part 3:“Motion JPEG 2000” ; Part 4:一致性測試; Part 5:實現(xiàn)Part 1 的參考軟件; Part 6:定義復合圖像文件格式JPM。 信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎qJPEG 2000JPEG 2000特征集 1)壓縮一次:多種解壓方式 集成了四種JPEG模式的優(yōu)點,由編碼器選擇最高分辨率或最大圖像尺寸,并決定最佳圖像質(zhì)量(包括無損壓縮質(zhì)量),而解碼器則可以從壓縮碼流中解出任何質(zhì)量或
29、尺寸的圖像,直到編碼端所選擇的最佳質(zhì)量。2)壓縮域圖像處理/編輯 可直接從JPEG 2000碼流中把感興趣的壓縮字節(jié)抽取出來,并重組成另一個兼容碼流。還有可能直接在壓縮域進行圖像的剪切、旋轉(zhuǎn)、反轉(zhuǎn)等幾何操作。3)漸進性JPEG 2000支持四維漸進傳輸:質(zhì)量、分辨率、空間位置和分量。質(zhì)量:通常只要接收到約相當于0.05bit/pel的碼字,即可辨認出一幅圖像分辨率:碼流的前幾個字節(jié)用于重現(xiàn)圖像的一個小縮略圖。隨著收到數(shù)據(jù)的增加,圖像分辨率(或尺寸)會以每邊倍乘2的速率增加,直至得到整幅圖像??臻g位置:收端能以近似光柵的形式接收圖像序列,由上而下。分量:支持16384分量的圖像,每個分量的位深可
30、為138bit。大多數(shù)超過4分量的圖像來自科學儀器。分量漸進性控制對應于不同分量數(shù)據(jù)解碼的順序。這種漸進性配合其他漸進性,可用來實現(xiàn)多種分量交織策略。4)低位深圖像JPEG2000也能壓縮二值圖像,把二值圖像看成是在單一分辨率下的單一位面。這樣則犧牲了在質(zhì)量上和分辨率上的可伸縮性,但保留了空間隨機訪問的能力。5)感興趣編碼區(qū)域ROI:在位面編碼前左移影響ROI內(nèi)像素的系數(shù),信息寫入碼流,解碼時用來重新對準(右移)相應的系數(shù)。信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎qJPEG2000正向預處理DWT量化熵編碼
31、碼流組織碼率控制反向預處理IDWT反量化熵解碼源圖像重構(gòu)圖像信道傳輸信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎JPEGJPEG2000418:1信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎JPEG與與JPEG 2000的性能比較的性能比較標準JPEGJPEG 2000主要編碼技術(shù)離散余弦變換(DCT)知覺量化Zigzag掃描霍夫曼編碼算術(shù)編碼離散小波變化(DWT)EBCOT核心算法ROI編碼空間可擴展編碼質(zhì)量可擴展編碼面向?qū)ο缶幋a位圖形狀編碼容錯編碼、TCQ、零數(shù)掃描壓縮比230250算法效率30:1以上急劇下降100:1以上急劇衰減速率失真特性比JP
32、EG提高30%應用場合Internet數(shù)字照相圖像視頻編輯Internet數(shù)字照相數(shù)字圖書館電子商務打印、掃描、傳真、遙感信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎1、聲音壓縮國際標準2、靜止圖像壓縮國際標準3 3、視頻壓縮國際標準、視頻壓縮國際標準信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎q視頻壓縮編碼標準的特點標準的演繹性傳統(tǒng)產(chǎn)業(yè)標準化的進程往往是在特定工業(yè)產(chǎn)品大量推出面市之后,并經(jīng)過緩慢的歸納過程形成的,最終建立具有評價性目標的標準體系。而以MPEG為代表的多媒體音視頻標準的制定則往往超前于市場需求,充分利用當時最先進的技術(shù)手段,給予技術(shù)發(fā)展充
33、裕的自由度,并與相關(guān)產(chǎn)業(yè)集團緊密聯(lián)系,使得技術(shù)標準能夠引領(lǐng)相關(guān)產(chǎn)品的發(fā)展。標準的通用性傳統(tǒng)的標準是使標準中定義的技術(shù)、功能與某些特定應用領(lǐng)域密切相關(guān)。多媒體音視頻壓縮編碼標準則往往具有擴展性。標準的開放性ITU和ISO/IEC所建立的各種音視頻編碼標準通常由三部分組成:一個壓縮編碼系統(tǒng)的體系結(jié)構(gòu);一套完整的視頻壓縮碼流數(shù)據(jù)結(jié)構(gòu)語法規(guī)則;一個通用解碼器算法描述。標準名稱 發(fā)布機構(gòu) 發(fā)布時間主要用途H.261ITU-T1990ISDN視頻會議、可視電話MPEG-1ISO/IEC1993CD-ROM視盤、視頻記錄MPEG-2ISO/IEC1995DVD、HDTV、視頻廣播H.263ITU-T1996
34、可視電話、移動可視電話、網(wǎng)絡視頻H.263+ITU-T1998H.263+ITU-T2002MPEG-4ISO/IEC2000Internet、交互視頻、視頻內(nèi)容管理H.264ITU-T2003網(wǎng)絡視頻、無線移動視頻信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎表 ITU和ISO/IEC制定的多媒體壓縮編碼標準信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎在標準體系構(gòu)造上在標準體系構(gòu)造上q兩大系列音視頻壓縮編碼標準比較H.26X系列標準更具針對性:僅僅涉及數(shù)字視頻壓縮編碼環(huán)節(jié)。MPEG系列則更系統(tǒng)化,標準涵蓋整個多媒體系統(tǒng)在具體應用系統(tǒng)模式上在具體應用系統(tǒng)模
35、式上H.26X系列標準主要圍繞各種電信網(wǎng)絡所構(gòu)成的信道而設計,力圖在有限的信道資源條件下,實現(xiàn)數(shù)字視頻信息的高效傳輸。MPEG系列更具開放性和延展性,注重和其他各種信號處理系統(tǒng)相結(jié)合,努力將其構(gòu)造成面向多種應用的多媒體信息處理的綜合性平臺。在整體編碼技術(shù)發(fā)展上在整體編碼技術(shù)發(fā)展上H.26X系列標準充分挖掘數(shù)字視頻系統(tǒng)中的技術(shù)潛力,進一步提高視頻系統(tǒng)的壓縮編碼性能。MPEG系列標準在確保音視頻信息高效壓縮的同時,結(jié)合當前多媒體信息發(fā)展的趨勢,更注重應用層面上各種功能的增加。信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎qH.261標準標準CCITT于1984年成立可視電話專家組
36、,在1988年提出H.261建議草案;主要用于ISDN的會議電視和可視電話應用系統(tǒng),該系統(tǒng)編解碼器必須符合以下要求:1)在很低的傳輸速率下(64kbps2Mbps)能傳送較高質(zhì)量的圖像和語音;2)能夠?qū)崿F(xiàn)雙向通信,視頻編碼器的處理延時150ms;3)為了實現(xiàn)國際聯(lián)網(wǎng),必須能兼容不同制式的圖像終端;4)既要能在準同步數(shù)字體系標準中運行,又要適應未來網(wǎng)絡的發(fā)展;5)視頻編解碼器成本較低。 1990年12月,ITU-T H.261正式頒布,是第一個數(shù)字視頻壓縮編碼標準。信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎qH.261標準標準編碼器框圖信息論與編碼基礎信息論與編碼基礎信源壓
37、縮信源壓縮編碼基礎編碼基礎qH.261標準標準運動補償與環(huán)路濾波: 引入幀間預測和運動補償來消除這一時間域相關(guān)性,以運動矢量信息和幀差信號替代原始信號進行傳遞,實現(xiàn)時間域冗余信息的壓縮 標準選擇運動預測匹配單位為16*16像素的宏塊,前向整像素精度運動補償,匹配搜索范圍-15,+15。 運動矢量限制在參考幀的重建圖像區(qū)域內(nèi) ,用于該宏塊中4個亮度塊;對于兩個色差分量,運動矢量減半。信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎qH.261標準標準運動補償與環(huán)路濾波:預測環(huán)路中引入一個簡單的二維環(huán)路濾波器,對運動補償?shù)念A測圖像中的每個8*8塊進行低通濾波,其作用在于消除預測參考
38、幀中的噪聲,從而減少預測誤差并降低預測圖像的塊效應。1/161/81/161/81/41/81/161/81/16nn-1n-2m-1mm-2 利用一個低通平滑濾波模板,對8*8圖像塊做加權(quán)平均處理,即用每一取樣值四周的9個取樣值按照右圖系統(tǒng)進行加權(quán)平均,取平均值輸出。信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎qH.261標準標準解碼器框圖信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎極低碼率視頻編碼標準H.263、H.263+、H.263+H.264MPEG4-10雙向預測編碼模式半像素精度運動補償運動矢量差分編碼機制約束碼率與圖像質(zhì)量延時限制差錯恢復
39、語法定義網(wǎng)絡友好性信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎qMPEG-1運動圖像專家組于1988年成立,1993年正式發(fā)布碼率低于1.5Mb/s用于數(shù)字存儲媒體的運動圖像及伴音的編碼標準(ISO/IEC 11172),即MPEG-1,其基本目標:1)編碼重建圖像質(zhì)量應高于電視電話的圖像質(zhì)量,達到或接近家用錄像機的畫面質(zhì)量2)壓縮數(shù)據(jù)能夠存儲在幾種通用存儲媒體上;3)傳輸碼率應符合當時計算機網(wǎng)絡的傳輸碼率,即1Mbps 1.5Mbps4)能適應多種網(wǎng)絡,如ISDN、局域網(wǎng)等;5)能滿足各種實時、非時實的系統(tǒng)要求;6)能夠?qū)崿F(xiàn)支持類似錄像機的基本交互功能。信息論與編碼基礎信
40、息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎qMPEG-1編碼器框圖信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎qMPEG-1雙向預測: 利用在時間序列上位于其前的圖像,或者位于其后的圖像,或者二者同時作為參考圖像,進行運動估計和運動補償。IBBBPBBBP量化:對I幀的量化過程中,引入量化矩陣,形成非線性量化處理。信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎qMPEG-2運動圖像專家組于1994年正式頒布了ISO 13818的運動圖像及伴音標準(MPEG-2)。支持目標碼率為4Mbps8Mbps的SDTV支持碼率為10Mbps15Mbps的HDTV提
41、出新的運動補償預測模式為幀內(nèi)、幀間編碼塊的DCT系數(shù)分別提供獨立的VLC碼表信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎qMPEG-2變換編碼基于DCT編碼模式,增加場DCT編碼模式。一個16*16宏塊的數(shù)據(jù)被重新排列為兩場,然后進行DCT變換。這種模式增加了垂直運動場景下編碼塊內(nèi)的相關(guān)性,從而提高編碼效率。量化仍采用幀內(nèi)編碼塊和幀間編碼塊兩個不同的非線性量化矩陣,將量化后幀內(nèi)模塊DC系數(shù)的精度從8 bit表示提高到11bit 表示。統(tǒng)計編碼 引入交替掃描模式,比zigzag掃描更先處理具有高垂直頻率的系數(shù);針對幀內(nèi)、幀間編碼塊DCT系數(shù)分別提供獨立VLC碼表。信息論與編碼
42、基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎場DCT變換塊重組示意圖信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎MPEG-2中的兩種掃描模式信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎qMPEG-490年代中后期,人們對未來的視聽產(chǎn)品的需求發(fā)生變化,體現(xiàn)如下:多媒體視聽資源來源的變化多媒體信息傳輸方式的變化多媒體信息消費方式的變化硬件和軟件技術(shù)發(fā)展帶來的變化信息論與編碼基礎信息論與編碼基礎信源壓縮信源壓縮編碼基礎編碼基礎qMPEG-41999年,ISO/IEC編號為ISO 14496的新一代音視頻對象編碼標準MPEG-4正式成為國際標準;2000
43、年,ISO/IEC再推出MPEG-4第二版。允許將已有AV對象組合以生成復合AV對象,并由此生成視聽場景;允許對AVOS的數(shù)據(jù)靈活地進行多路合成和同步,以便選擇合適的網(wǎng)絡來傳輸;允許用戶在接收端生成的AV場景中與AV對象進行交互操作支持AV對象知識產(chǎn)權(quán)的標識與保護。 MPEG-7 標準 MPEG-MPEG-7 7 是是“多媒體內(nèi)容描述接口多媒體內(nèi)容描述接口”,”, (Multimedia Content Description Interface) 。準確說來,準確說來, MPEG-7MPEG-7并不是一種壓縮編并不是一種壓縮編碼方法,繼碼方法,繼 MPEG-4MPEG-4之后,要解決的矛盾就是之后,要解決的矛盾就是對日漸龐大的圖像、對日漸龐大的圖像、聲音信息的管理和迅速搜索聲音信息的管理和迅速搜索。MPEG7MPEG7就是針對這個矛盾的解決方就是針對這個矛盾的解決方案。案。 其目標
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 教師述職報告范文職稱
- 總經(jīng)理辭職報告范文
- 2025年佛山a2貨運資格證考試題
- 2025建筑工程承包合同范文格式
- 2025年怒江從業(yè)資格證貨運模擬考試下載
- 2025年長沙貨運從業(yè)資格證試題庫和答案解析
- 2025金融企業(yè)勞動合同范本下載
- 2025裝卸搬運合同
- 上?,F(xiàn)代化工職業(yè)學院《企業(yè)經(jīng)營實務模擬》2023-2024學年第一學期期末試卷
- 上海外國語大學《渦輪發(fā)動機飛機結(jié)構(gòu)與系統(tǒng)》2023-2024學年第一學期期末試卷
- 勞動技能實操指導(勞動教育)學習通課后章節(jié)答案期末考試題庫2023年
- 惡性腹膜間皮瘤
- 回族做禮拜的念詞集合6篇
- 幼兒園大班美術(shù)型糊染教案
- 糧油廠安全現(xiàn)狀評價報告
- 國家開放大學《自動控制技術(shù)》形考任務1-4+綜合練習參考答案
- “牽手關(guān)愛行動”親情陪伴10次記錄表
- 籍貫對照表完整版
- 10、特種作業(yè)人員管理臺賬
- 機械基礎考試題庫及參考答案
- NY 5051-2001無公害食品淡水養(yǎng)殖用水水質(zhì)
評論
0/150
提交評論