ch5多媒體數(shù)據(jù)壓縮技術(shù)課件_第1頁(yè)
ch5多媒體數(shù)據(jù)壓縮技術(shù)課件_第2頁(yè)
ch5多媒體數(shù)據(jù)壓縮技術(shù)課件_第3頁(yè)
ch5多媒體數(shù)據(jù)壓縮技術(shù)課件_第4頁(yè)
ch5多媒體數(shù)據(jù)壓縮技術(shù)課件_第5頁(yè)
已閱讀5頁(yè),還剩50頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

本章內(nèi)容提要F多媒體數(shù)據(jù)的壓縮的可能性和必要性F壓縮基本原理F壓縮基本算法FJPEG編碼FMPEG編碼本章問(wèn)題設(shè)計(jì):為什么要進(jìn)行多媒體數(shù)據(jù)壓縮?如何壓縮?常見(jiàn)壓縮算法有哪些?影響壓縮算法的因素有哪些?本章教學(xué)目的要求:掌握多媒體數(shù)據(jù)壓縮的基本概念和常用算法。本章教學(xué)重點(diǎn):掌握多媒體數(shù)據(jù)壓縮的基本概念和基本原理?!?.1概述你想通過(guò)可視通信系統(tǒng)與親朋好友進(jìn)行“面對(duì)面”的通信嗎?

你想通過(guò)利用多媒體教學(xué)手段在家上學(xué)嗎?

你想在計(jì)算機(jī)上親自體念“海灣戰(zhàn)爭(zhēng)”嗎?

你進(jìn)入過(guò)國(guó)家圖書(shū)館的Internet多媒體閱覽室嗎?

你有過(guò)在Internet上看美國(guó)“9.11”事件的實(shí)時(shí)新聞報(bào)道嗎?

你有利用多媒體計(jì)算機(jī)來(lái)控制家中的所有電器的計(jì)劃嗎?無(wú)論你是否有這些想法、或經(jīng)歷,它們賴以實(shí)現(xiàn)的技術(shù)基礎(chǔ)都是多媒體數(shù)據(jù)的壓縮技術(shù)。多媒體數(shù)據(jù)壓縮的必要性⑴多媒體信息的數(shù)據(jù)量●文本:若1024×768顯示分辨率、16×16點(diǎn)陣文字、4Byte/字,則一屏漢字的總數(shù)據(jù)量為:

4×1024×768/(16×16)=12288Byte(12KB)●圖像:若采用800×600分辨率,則滿屏24位真彩色未經(jīng)壓縮的圖像的總數(shù)據(jù)量為

800×600×24/8=1440000Byte(1.37M)

監(jiān)測(cè)衛(wèi)星采用四波段、每天30幅的頻率發(fā)回上述分辨率的圖片,則每天未經(jīng)壓縮的文件數(shù)據(jù)量為:1.37×4×30=164.4M

一年的數(shù)據(jù)量為:

164.4×365=58.6G●音頻:存儲(chǔ)量=(采樣頻率×采樣精度×聲道數(shù)×?xí)r間)/8(B)未經(jīng)壓縮的1分鐘立體CD音樂(lè)所需的存儲(chǔ)量為:

(44.1×1000×16)×2×60/8=10584000(B)≈10.1(M)●視頻:320×233窗口中,以25幀/秒速度播放1分鐘顏色數(shù)為8bit的視頻信號(hào),其數(shù)據(jù)量為:

320×233×8×25×60/(8×1024×1024)≈107(M)⑵壓縮的必要性—海量數(shù)據(jù)的存儲(chǔ)與傳輸?shù)谋厝灰?/p>

在多媒體系統(tǒng)中圖像和動(dòng)態(tài)視頻信息數(shù)據(jù)量非常之巨大,所需要的存儲(chǔ)空間是十分驚人的。請(qǐng)計(jì)算1GB的容量能存儲(chǔ)約?分鐘的彩色電視信號(hào)數(shù)據(jù)。

一分鐘另外在通信網(wǎng)絡(luò)上,大多數(shù)遠(yuǎn)程通信網(wǎng)絡(luò)的速率都在幾兆位每秒以下,顯然,這樣大的數(shù)據(jù)量不僅超出了計(jì)算機(jī)的存儲(chǔ)和處理能力,更是當(dāng)前通信信道的傳輸速率所不及的。計(jì)算1G文件在2M帶寬下載時(shí)間。因此,為了使多媒體達(dá)到實(shí)用水平,除采用新技術(shù)手段增加存儲(chǔ)空間和通信寬帶外,對(duì)數(shù)據(jù)進(jìn)行有效壓縮是多媒體發(fā)展中最關(guān)鍵的技術(shù)之一。⑶數(shù)據(jù)冗余

數(shù)據(jù)是用來(lái)記錄和傳輸信息的,是視頻信息的載體。

信息量=數(shù)據(jù)量-冗余數(shù)據(jù)量

多媒體聲音信源數(shù)據(jù)有極強(qiáng)的相關(guān)性,存在大量冗余

信息,數(shù)據(jù)壓縮就是去掉冗余信息,減少各種數(shù)據(jù)之間的相關(guān)性?!袢哂嗷靖拍睢袢哂唷畔⑺哂械母鞣N性質(zhì)中多余的無(wú)用空間●冗余度——多余的無(wú)用空間的程度I=D-duI—信息量,D—數(shù)據(jù)量,du—冗余量包含在D中●信息量與冗余的關(guān)系●冗余舉例播音員——180字/分鐘,2Byte一個(gè)字,360Byte(合0.35KB/分鐘)音頻數(shù)據(jù)——8kHz采樣×8bit×60秒=3840KBit(合480KB/分鐘)[1]空間冗余——規(guī)則物體的物理相關(guān)性[2]時(shí)間冗余——視頻與動(dòng)畫(huà)畫(huà)面間的相關(guān)性,或語(yǔ)音也是一個(gè)連續(xù)和漸變的過(guò)程,而非完全時(shí)間上的獨(dú)立過(guò)程。[3]統(tǒng)計(jì)冗余——具有空間冗余和時(shí)間冗余[6]視覺(jué)冗余——視覺(jué)、聽(tīng)覺(jué)敏感度和非線性感覺(jué)[7]知識(shí)冗余——利用先驗(yàn)知識(shí)和背景知識(shí)得到[4]結(jié)構(gòu)冗余——從更大視角看存在規(guī)則紋理、相互重疊的結(jié)構(gòu)表面[5]信息熵冗余——編碼冗余,數(shù)據(jù)與攜帶的信息[8]其他冗余——上述7種以外的冗余。如圖像的空間非定常特性所帶來(lái)的冗余等。10110001110010110001110001011010101010111100010111111010224色28色聲音頻率文字組句色彩漸變主觀意識(shí)::⑷冗余的分類(lèi)多媒體數(shù)據(jù)中存在冗余的種類(lèi):

多媒體數(shù)據(jù)之所以能夠被壓縮,就是它存在上述冗余。數(shù)據(jù)壓縮條件——●數(shù)據(jù)傳輸與存儲(chǔ)空間的限制(壓縮→傳輸或存儲(chǔ)→解壓縮)■

44.1kHz/Stereo1.3MB■22.0kHz/Nomo0.3MB■Stop●數(shù)據(jù)存在冗余(重復(fù)數(shù)據(jù)、可忽略數(shù)據(jù))重復(fù)數(shù)據(jù)可忽略數(shù)據(jù)●不敏感因素(顏色、亮度、頻率、細(xì)節(jié))224顏色(16,777,216色)28顏色(256色)§2數(shù)據(jù)壓縮基本原理1前言

數(shù)據(jù)壓縮技術(shù)的理論基礎(chǔ)是信息論。根據(jù)信息論的原理,可以找到最佳數(shù)據(jù)壓縮編碼方法,數(shù)據(jù)壓縮的理論極限是信息熵。如果要求在編碼過(guò)程中不丟失信息量,即要求保存信息熵,這種信息保持編碼又叫做熵保存編碼,或者叫熵編碼。熵編碼是無(wú)損數(shù)據(jù)壓縮,用這種編碼結(jié)果經(jīng)解碼后可無(wú)失真地恢復(fù)出原貌。無(wú)損壓縮編碼——壓縮數(shù)據(jù)還原后,與原始數(shù)據(jù)一致,無(wú)損失有損壓縮編碼——壓縮后再還原的數(shù)據(jù)有損失

熵編碼是建筑在隨機(jī)過(guò)程的統(tǒng)計(jì)特性基礎(chǔ)上的。對(duì)于語(yǔ)音、靜圖像、運(yùn)動(dòng)圖像、文字等多媒體數(shù)據(jù)壓縮技術(shù),其信源編碼的輸入,均可認(rèn)為信源發(fā)出的是一個(gè)隨機(jī)信號(hào)序列。它們是時(shí)間、空間或時(shí)間空間混合變量的函數(shù)。2實(shí)現(xiàn)目標(biāo)統(tǒng)計(jì)編碼是根據(jù)信源出現(xiàn)概率的分布特性而進(jìn)行的壓縮編碼,它有別于預(yù)測(cè)編碼。這種編碼的宗旨在于,在消息和碼字之間找到明確的一一對(duì)應(yīng)關(guān)系,以便在恢復(fù)時(shí)能準(zhǔn)確無(wú)誤地再現(xiàn)出來(lái),或者至少是極相似地找到相當(dāng)?shù)膶?duì)應(yīng)關(guān)系,并把這種失真或不對(duì)應(yīng)概率限制到可容忍的范圍內(nèi)。但不管什么途徑,其最終目標(biāo)總是要使平均碼長(zhǎng)或碼率壓低到最低限度。最常用的方法是變長(zhǎng)碼。變長(zhǎng)編碼的信源符號(hào)與碼字是一一對(duì)應(yīng)的,因此再現(xiàn)也是準(zhǔn)確無(wú)誤的。它在編譯碼過(guò)程中并不損失任何信息,屬于冗余壓縮法。如電報(bào)碼。3引入“熵”值的作用在量化處理中,信源的概率分布、信息量和信息熵之間存在什么關(guān)系?在壓縮技術(shù)中引入“熵”值有什么重要意義?熵:就是信息量的度量方法,它表示某一事件出現(xiàn)的消息越多,時(shí)間發(fā)生的可能性,即概率就越大。下面以一個(gè)信源編碼器模型來(lái)說(shuō)明:信源S的熵的定義信源S={si|i=1,2,…,n}的熵定義為:H(S)=∑piLog2(1/pi)其中pi是符號(hào)si在信源S中出現(xiàn)的概率,Log2(1/pi)表示包含在si中的信息量,即是si所需要的位數(shù)。如一幅256色的圖像,如果每一種顏色的概率為1/256,則編碼每一像素點(diǎn)就需要8位。特別地,當(dāng)P(s1)=1時(shí),則P(s2)=P(s3)=…=P(sn)=0,此時(shí)熵為:熵值的提高對(duì)提高數(shù)據(jù)壓縮比是不利的。

高階的熵值總是低于低階的熵值,因此熵編碼中要實(shí)現(xiàn)高壓縮比例,必須設(shè)法降低熵值。例1有一幅40個(gè)像素組成的灰度圖像,灰度共有5級(jí),分別用符號(hào)A、B、C、D和E表示,40個(gè)像素中出現(xiàn)灰度A的像素有15個(gè),出現(xiàn)灰度B的像素有7個(gè),出現(xiàn)灰度C的像素有7個(gè)等。如果用3個(gè)位表示5個(gè)等級(jí)的灰度值,也就是每個(gè)像素用3位表示,編碼這幅圖像總共需要120位。試求此圖像的熵?

解答:按照熵的定義,可得H(S)=0概率為1的事件是必然事件,所以其熵等于0因此,這幅圖像每個(gè)符號(hào)用2.196位表示,40個(gè)像素需87.84位?!?數(shù)據(jù)壓縮算法經(jīng)過(guò)幾十年的數(shù)據(jù)壓縮研究,已經(jīng)產(chǎn)生了各種各樣針對(duì)不同用途的壓縮算法、壓縮手段和實(shí)現(xiàn)這些算法的大規(guī)模集成電路或計(jì)算機(jī)軟件,并逐漸趨于成熟,走向市場(chǎng)和應(yīng)用。現(xiàn)在成熟的數(shù)據(jù)壓縮方法種類(lèi)繁多,可以分為無(wú)損壓縮和有損壓縮兩大類(lèi)。在通常情況下,數(shù)據(jù)壓縮率越高,信息的損耗或失真也越大,需要進(jìn)行某種折衷,找出一個(gè)相對(duì)平衡點(diǎn)。在多媒體應(yīng)用中常用的壓縮方法有:PCM(脈沖編碼調(diào)制)、預(yù)測(cè)編碼、交換編碼、統(tǒng)計(jì)編碼、靜圖像編碼、電視編碼、其他編碼等。新一代的數(shù)據(jù)壓縮方法、如基于模型的壓縮方法、分形壓縮和小波變換方法等也已經(jīng)接近實(shí)用化水平。

數(shù)據(jù)壓縮實(shí)際上就是一種編碼,也稱為一種算法,即把數(shù)據(jù)表達(dá)成的一種壓縮編碼。編碼是源文到碼字的一個(gè)映射。數(shù)據(jù)壓縮技術(shù)的理論基礎(chǔ)是信息論。■無(wú)損壓縮編碼——壓縮數(shù)據(jù)還原后,與原始數(shù)據(jù)一致,無(wú)損失無(wú)損壓縮編碼(可逆編碼)霍夫曼編碼行程編碼算術(shù)編碼■有損壓縮編碼——壓縮后再還原的數(shù)據(jù)有損失有損壓縮編碼(不可逆編碼)全頻帶編碼PCM/ADPCM混合編碼JPEG/MPEG1多媒體壓縮技術(shù)的分類(lèi)2預(yù)測(cè)編碼①前言

預(yù)測(cè)編碼是數(shù)據(jù)壓縮理論的一個(gè)重要分支。它根據(jù)離散信號(hào)之間存在著一定關(guān)聯(lián)性的特點(diǎn),利用前面的一個(gè)或多個(gè)信號(hào)對(duì)下一個(gè)信號(hào)進(jìn)行預(yù)測(cè),然后對(duì)實(shí)際值和預(yù)測(cè)值的差(預(yù)測(cè)誤差)進(jìn)行編碼。如果預(yù)測(cè)比較準(zhǔn)確,那么誤差信號(hào)就會(huì)很小。這樣一來(lái),在同等精度要求的條件下,就可以用比較少的數(shù)碼進(jìn)行編碼,達(dá)到壓縮數(shù)據(jù)的目的。如果能夠準(zhǔn)確地預(yù)測(cè)作為時(shí)間函數(shù)的數(shù)據(jù)源的下一個(gè)輸出將是什么,或者數(shù)據(jù)源可以準(zhǔn)確地被一個(gè)數(shù)學(xué)模型表示,輸出數(shù)據(jù)總是和模型的輸出保持一致,則可以準(zhǔn)確地預(yù)測(cè)數(shù)據(jù)。然而實(shí)際信號(hào)源是不可能滿足這兩個(gè)條件的。因此,只能用一個(gè)預(yù)測(cè)器,預(yù)測(cè)下一個(gè)樣值,允許它有某些誤差。本節(jié)的預(yù)測(cè)編碼方法就是解決這樣問(wèn)題的。預(yù)測(cè)編碼方法在圖像數(shù)據(jù)壓縮和語(yǔ)音信號(hào)的數(shù)據(jù)壓縮中都得到廣泛的應(yīng)用和研究。預(yù)測(cè)器通常設(shè)計(jì)成用前面的幾個(gè)樣值來(lái)預(yù)測(cè)下一樣值,而不是利用整個(gè)數(shù)據(jù)信源模型。這是因?yàn)槟P吞珡?fù)雜,且是時(shí)變的,在大多數(shù)情況下預(yù)測(cè)幾乎不可能實(shí)現(xiàn)。預(yù)測(cè)可以是線性預(yù)測(cè)或非線性預(yù)測(cè),但絕大多數(shù)使用的是線性預(yù)測(cè)。

線性預(yù)測(cè)的基本問(wèn)題是:已知實(shí)際值和預(yù)測(cè)值之間差值的誤差函數(shù)和一個(gè)時(shí)序樣值集,對(duì)每一樣值求出加權(quán)常數(shù)因子以使建立在加權(quán)樣值線性和之上的預(yù)測(cè)能使誤差函數(shù)最小。通常使用的誤差函數(shù)是均方誤差(MSE):MSE=E[(S0-PS0)2]其中;E是數(shù)學(xué)期望,S0是下一樣值的實(shí)際值,PS0是下一樣值的預(yù)測(cè)值。上述公式只是常用的一種誤差函數(shù),在某些場(chǎng)臺(tái)下可能其它的誤差函數(shù)更適用。預(yù)測(cè)編碼中典型的壓縮方法有DPCM,ADPCM等,它們比較適合用于聲音、圖像數(shù)據(jù)的壓縮。因?yàn)檫@些數(shù)據(jù)均由采樣得到,相鄰樣值之間的差不會(huì)相差很大,可以用較少的位來(lái)表示差值。②基本原理在計(jì)算機(jī)多媒體系統(tǒng)中,聲、文、圖等多媒體信號(hào)的原始信號(hào),都是連續(xù)量。它們是以時(shí)間變量t和空間坐標(biāo)(x,y)為自變量的連續(xù)函數(shù),是隨機(jī)分布的。為了能讓計(jì)算機(jī)接收,并處理這些信號(hào),必須把連續(xù)模擬信號(hào)數(shù)字化(A/D變換)。數(shù)字化處理包括將連續(xù)時(shí)間變量t及連續(xù)空間坐標(biāo)(x,y)的離散化和幅度的數(shù)字化兩個(gè)內(nèi)容。預(yù)測(cè)編碼方法原理:是從相鄰像素之間有強(qiáng)的相關(guān)性特點(diǎn)考慮的,當(dāng)前信號(hào)值,可用前面已出現(xiàn)的信號(hào)值,進(jìn)行預(yù)測(cè)(估計(jì)),得到一個(gè)預(yù)測(cè)值(估計(jì)值),并將實(shí)際值與預(yù)測(cè)值求差,再對(duì)這個(gè)差值信號(hào)進(jìn)行編碼、傳送,這種編碼方法稱為預(yù)測(cè)編碼方法③分類(lèi)法(補(bǔ)充)⑴預(yù)測(cè)編碼方法分線性預(yù)測(cè)和非線性預(yù)測(cè)編碼兩種。線性預(yù)測(cè)編碼方法也稱差值脈沖編碼調(diào)制法,簡(jiǎn)稱DPCM。⑵DPCM中又可以分為可逆的無(wú)失真的DPCM編碼與不可逆的有失真的DPCM編碼。參見(jiàn)圖6-7(教材P106)不可逆的有失真的DPCM編碼:如果包含量化器,而量化器可能導(dǎo)致不可逆的信息損失,這時(shí)接收端,經(jīng)解碼恢復(fù)出的灰度信號(hào),就存在失真??梢?jiàn)引入量化器會(huì)引起一定程度的信息損失,使圖像質(zhì)量受損。但是,為了壓縮比特?cái)?shù),利用人眼的視覺(jué)特性,對(duì)圖像信息丟失不易覺(jué)察的特點(diǎn),帶有量化器有失真的DPCM編碼系統(tǒng)還是普遍被采用??赡娴臒o(wú)失真的DPCM編碼:如果不包含量化器,這時(shí)接收端,經(jīng)解碼恢復(fù)出的灰度信號(hào),就不存在失真。3數(shù)字音頻技術(shù)(復(fù)習(xí))⑴概述與文字比較、聲音所攜帶的信息量是不可比擬的。參見(jiàn)下表。聲音就是一種機(jī)械振動(dòng)波。聲音主要有兩個(gè)參數(shù):頻率和振幅。它可以用正弦波y=Asin(x)或余弦波y=Acos(x)來(lái)模擬表示。數(shù)字音頻:就是利用數(shù)字化形式表示的聲音信號(hào)。表示方式數(shù)據(jù)量表達(dá)的信息ASCII1Byte字符名稱點(diǎn)陣7Byte字符名稱、形狀聲音2000Byte字符名稱、讀音、音色、音調(diào)、情感等音頻可以根據(jù)不同方式劃分成不同的類(lèi)型:語(yǔ)音、音樂(lè)、音效等數(shù)字化聲波MIDI合成來(lái)源于聲音素材庫(kù)波形文件Wav、音頻文件MIDI、CD音頻文件等用途來(lái)源格式音頻類(lèi)型y=Asin(x)A聲波波形簡(jiǎn)圖數(shù)字音頻的優(yōu)點(diǎn):保真度好,動(dòng)態(tài)范圍大,便于計(jì)算機(jī)處理。⑵關(guān)鍵技術(shù)關(guān)鍵技術(shù)主要有:數(shù)字音頻、音樂(lè)合成、MIDI與音效。①數(shù)字音頻數(shù)字化音頻技術(shù)是把表示聲音強(qiáng)弱的模擬信號(hào)(電壓)用數(shù)字表示,數(shù)字音頻是通過(guò)采樣量化把模擬量表示的音頻信號(hào)轉(zhuǎn)換成許多二進(jìn)制1、0組成的數(shù)字音頻文件,實(shí)現(xiàn)數(shù)字化,為計(jì)算機(jī)處理奠定基礎(chǔ)。聲音/音頻模擬信號(hào)聲音/音頻數(shù)字信息1234采樣采樣:每隔一個(gè)時(shí)間間隔在模擬聲音波形上取一個(gè)幅度值。量化量化:在數(shù)字音頻技術(shù)中,把表示聲音強(qiáng)弱的模擬電壓用數(shù)字表示。而用數(shù)字來(lái)表示音頻幅度時(shí),只能把無(wú)窮多個(gè)電壓幅度用有限個(gè)數(shù)字表示。即把某一幅度范圍內(nèi)的電壓用一個(gè)數(shù)字表示。編輯編碼:即編輯,把量化數(shù)據(jù)寫(xiě)成計(jì)算機(jī)的數(shù)據(jù)格式,即二進(jìn)制格式模擬聲音在時(shí)間上是連續(xù)的,而以數(shù)字表示的聲音是一個(gè)數(shù)據(jù)序列,在時(shí)間上只能是離散的。數(shù)字聲音是一個(gè)數(shù)據(jù)序列抽樣周期:就是采樣的時(shí)間間隔。其倒數(shù)稱為采樣頻率,即每秒鐘所抽取聲波幅度值樣本的次數(shù),計(jì)算單位采用Hz(赫茲)。音頻模擬信號(hào)數(shù)字化處理流程簡(jiǎn)圖轉(zhuǎn)音頻信號(hào)轉(zhuǎn)換流程1模擬音頻信號(hào)2音頻信號(hào)的采樣3采樣信號(hào)的量化與編碼音頻數(shù)字化處理簡(jiǎn)圖影響數(shù)字音頻質(zhì)量主要有如下因素:

存儲(chǔ)量=(采樣頻率×采樣精度×聲道數(shù)×?xí)r間)/8(Byte/S)

采樣頻率:采樣頻率越高聲音失真越小,但用于存儲(chǔ)音頻的數(shù)據(jù)量也越大。采樣精度:其值大小決定了聲音的動(dòng)態(tài)范圍,因此,采樣精度越大音質(zhì)越好,數(shù)據(jù)量也越大。通道數(shù)量:?jiǎn)温暸c立體聲……4數(shù)字視頻技術(shù)(補(bǔ)充)數(shù)字視頻是基于數(shù)字技術(shù)以及其他更為拓展的圖像顯示標(biāo)準(zhǔn)。本書(shū)主要討論將模擬視頻信號(hào)輸入計(jì)算機(jī)進(jìn)行數(shù)字化視頻編輯,最后制成數(shù)字視頻產(chǎn)品的數(shù)字視頻技術(shù),即模擬視頻的數(shù)字化處理、存儲(chǔ)和輸出技術(shù)。其數(shù)字化過(guò)程如下:視頻模擬信號(hào)視頻數(shù)字信息1234采樣量化編輯5量化(補(bǔ)充)量化的目的:量化是降低數(shù)據(jù)量強(qiáng)有力的手段。⑴壓縮編碼的過(guò)程

數(shù)字視頻和音頻技術(shù)中實(shí)現(xiàn)A/D(模/數(shù))轉(zhuǎn)換的關(guān)鍵是將時(shí)間上連續(xù)變化的模擬信號(hào)轉(zhuǎn)變成時(shí)間上離散的數(shù)字信號(hào),這個(gè)過(guò)程主要包括采樣、量化、編碼三個(gè)步驟。視頻/音頻模擬信號(hào)視頻/音頻數(shù)字信息1234采樣量化量化:把某一幅度范圍內(nèi)的模擬信號(hào)用一個(gè)數(shù)字表示。編輯編碼:即編輯,把量化數(shù)據(jù)寫(xiě)成計(jì)算機(jī)的數(shù)據(jù)格式,即二進(jìn)制格式是一個(gè)數(shù)據(jù)序列視頻、音頻模擬信號(hào)數(shù)字化處理流程簡(jiǎn)圖⑵量化原理

在數(shù)據(jù)壓縮編碼中所指的量化,不是指摸/數(shù)轉(zhuǎn)換中的量化,而是指以PCM(均勻量化)碼作為輸入,經(jīng)正交變換、差分或預(yù)測(cè)處理后,在熵編碼之前,對(duì)正交變換系數(shù)、差分值或預(yù)測(cè)誤差值的量化處理。⑶量化研究對(duì)象

為了計(jì)算機(jī)處理的方便,在離散處理過(guò)程中,總是將量化級(jí)設(shè)定為一個(gè)有限整數(shù),但現(xiàn)實(shí)中為了更真實(shí)反映客觀世界,又需要越多的量化級(jí)別,因此,在量化處理過(guò)程中,必然會(huì)產(chǎn)生信息的丟失,也就是會(huì)引起量化誤差(量化噪聲)。

如何降低量化誤差就是量化需要研究的主要問(wèn)題。同時(shí),量化的處理過(guò)程是一個(gè)多對(duì)一的過(guò)程,是不可逆的,因此量化中丟失的信息是不可找回的。⑷量化器的設(shè)計(jì)①量化器的設(shè)計(jì)要求給定量化分層級(jí)數(shù),滿足量化誤差最小;限定量化誤差,確定分層級(jí)數(shù),滿足以盡量小的平均比特?cái)?shù),表示量化輸出。顯然這是一對(duì)“冤家”,因此在設(shè)計(jì)中只能根據(jù)不同目的需要,設(shè)計(jì)不同的量化器,并求得上述問(wèn)題的折中處理。②量化的方法和量化特性均勻量化:就是將輸入數(shù)據(jù)的振幅進(jìn)行等值均分,優(yōu)點(diǎn)是計(jì)算處理簡(jiǎn)單,缺點(diǎn)是量化誤差大;量化矢量量化標(biāo)量量化均勻量化非均勻量化自適應(yīng)量化非均勻量化:就是將輸入數(shù)據(jù)的振幅,按照其變化曲線的曲率大小進(jìn)行不等值劃分。優(yōu)點(diǎn)是量化誤差大,缺點(diǎn)是計(jì)算處理復(fù)雜,需要較多的比特?cái)?shù)。量化過(guò)程示意圖非均勻量化的兩種常用算法:采樣輸入信號(hào)幅度和量化輸出數(shù)據(jù)之間存在不同的對(duì)應(yīng)關(guān)系,常見(jiàn)的有μ律壓擴(kuò)算法和A律壓擴(kuò)算法。它們各有不同的特點(diǎn)和適應(yīng)不同的地區(qū)。自適應(yīng)量化:就是按照輸入數(shù)據(jù)的變化曲線的局部區(qū)域的特點(diǎn),自適應(yīng)地修改和調(diào)整量化器的箱寬。優(yōu)點(diǎn)是量化誤差小,缺點(diǎn)是計(jì)算處理復(fù)雜。

量化器的設(shè)計(jì)和量化特性的選擇,是數(shù)據(jù)壓縮技術(shù)中的一個(gè)關(guān)鍵問(wèn)題。由于量化是一個(gè)有信息丟失的不可逆轉(zhuǎn)過(guò)程,量化器的好壞不僅直接影響數(shù)據(jù)壓縮率,量化誤差對(duì)解壓后的恢復(fù)視頻/音頻的質(zhì)量存在極大的影響。④自適應(yīng)的差分脈碼調(diào)制(ADPCM)

進(jìn)一步改善量化性能或壓縮數(shù)據(jù)率的方法是采用自適應(yīng)量化或自適應(yīng)預(yù)測(cè),任一種采用自適應(yīng)的方法都叫做自適應(yīng)的差分脈碼調(diào)制(ADPCM)。1)自適應(yīng)量化為了在一定的量化組數(shù)下減少量化誤差或在同樣的誤差條件下壓縮數(shù)據(jù)率,根據(jù)信號(hào)分布不均勻的特點(diǎn),希望系統(tǒng)具有隨輸入信號(hào)的變化而改變量化區(qū)間大小,以保持輸入量化器的信號(hào)基本均勻的能力稱為自適應(yīng)量化。自適應(yīng)量化必須有對(duì)輸入信號(hào)的幅值進(jìn)行估計(jì)的能力,有了估值才能確定相應(yīng)的改變量。若估值在信號(hào)的輸入端進(jìn)行,稱前向饋送自適應(yīng);若在量化輸出端進(jìn)行,稱反饋?zhàn)赃m應(yīng)。信號(hào)的估值必須簡(jiǎn)單,占時(shí)間短,這樣才能達(dá)到實(shí)時(shí)處理的目的。2)自適應(yīng)預(yù)測(cè)預(yù)測(cè)參數(shù)的最佳化依賴于信源的統(tǒng)計(jì)特性,要得到最佳預(yù)測(cè)參數(shù)顯然是一件繁瑣的工作。而采用固定的預(yù)測(cè)參數(shù)往往又得不到較好的性能,為了既能使性能較佳,又不致于有太大的計(jì)算工作量,可以將上述兩種方法折衷考慮,采用自適應(yīng)預(yù)測(cè)。3霍夫曼編碼霍夫曼(Huffman)編碼是一種應(yīng)用十分廣泛的壓縮算法,其理論依據(jù)是變字長(zhǎng)編碼理論?;舴蚵幋a具有即時(shí)性和唯一可譯性,編碼具體步驟如下:對(duì)信源進(jìn)行概率統(tǒng)計(jì),求得n個(gè)不同概率的信源符號(hào);將n個(gè)信源符號(hào)的n個(gè)概率,按概率遞減順序排列;把n個(gè)概率中兩個(gè)最小概率相加,并作為新符號(hào)的概率,構(gòu)成n-1個(gè)概率重復(fù)步驟1)、2)直到概率和達(dá)到1為止(實(shí)際上要進(jìn)行n-2次后,可以得到只有兩個(gè)概率的序列);在每次合并概率時(shí),將被合并的消息賦以1和0或0和1;尋找從每一信源符號(hào)到概率為1處的路徑,記錄下路徑上的1和0;對(duì)每一符號(hào)寫(xiě)出1、0序列(從碼樹(shù)的根到終節(jié)點(diǎn))。最后,獲得了一棵用于編碼和譯碼的霍夫曼樹(shù)?!窬幋a特點(diǎn)[1]編碼長(zhǎng)度可變,壓縮與解壓縮較慢[2]硬件實(shí)現(xiàn)困難[3]編碼效率取決于信號(hào)源的數(shù)據(jù)出現(xiàn)概率[4]屬于無(wú)損壓縮霍夫曼(Huffman)編碼是一種應(yīng)用十分廣泛的壓縮算法,其理論依據(jù)是變字長(zhǎng)編碼理論。它是一種不等長(zhǎng)格式的編碼方案、在各編碼輸入信息符號(hào)出現(xiàn)的頻率不均勻的情況下,給輸出碼字分配不同的字長(zhǎng),如用最短的二進(jìn)制位表示出現(xiàn)頻率最高的碼字,用較長(zhǎng)的位表示出現(xiàn)頻率低的碼字,并且按照概率遞減順序排列,如此編碼方案,由最佳編碼定理可知,這樣輸出碼字的平均碼長(zhǎng)最短,與信源熵值接近,編碼方案最佳。實(shí)例:如下表是7個(gè)信源符號(hào)及其概率分布,請(qǐng)構(gòu)造其霍夫曼樹(shù)。解答:碼字的平均碼長(zhǎng)N采用如下公式計(jì)算=(0.35+0.20)×2+(0.15+0.10+0.10)×2+(0.06+0.04)×4=2.55(bits/pel)信源X={xi|I=1,2,…,7}的熵為=-(0.35*Log20.35+0.20*Log20.20+0.15*Log20.15+(0.10*Log20.10)×2+0.06*Log20.06+0.04*Log20.04)=2.13(bits/pel)0.0440.0640.1030.1030.1530.2020.352輸入概率碼長(zhǎng)X7X6X5X4X3X2X1信源符號(hào)霍夫曼編碼步驟1111411104110301130103102002碼字碼長(zhǎng)X7X6X5X4X3X2X1信源符號(hào)霍夫曼碼字的構(gòu)成對(duì)應(yīng)表)4算術(shù)編碼算術(shù)編碼把一個(gè)信源集合表示為實(shí)數(shù)線上的0到1之間的一個(gè)區(qū)間。這個(gè)集合中的每個(gè)元素都要用來(lái)縮短這個(gè)區(qū)間。信源集合的元素越多,所得到的區(qū)間就越小,當(dāng)區(qū)間變小時(shí),就需要更多的數(shù)位來(lái)表示這個(gè)區(qū)間,這就是區(qū)間作為代碼的原理。算術(shù)編碼首先假設(shè)一個(gè)信源的概率模型,然后用這些概率來(lái)縮小表示信源集的區(qū)間。優(yōu)點(diǎn):編碼方法比霍夫曼編碼等簡(jiǎn)單,它還有自適應(yīng)特點(diǎn)。5游程編碼(或行程編碼)游程編碼(簡(jiǎn)寫(xiě)為RLE或RLC)是一種十分簡(jiǎn)單的壓縮方法,它將數(shù)據(jù)流中連續(xù)出現(xiàn)的字符(稱為游程)用單一的記號(hào)來(lái)表示。例如,字符串a(chǎn)bacccbbaaaa,可以壓縮為aba3c2b4a游程編碼的壓縮效果不太好,但由于簡(jiǎn)單編碼/解碼的速度非常快,因此仍然得到廣泛的應(yīng)用。許多圖形和視頻文件,如BMP,TIF及AVI等,都使用了這種壓縮?!?JPEG編碼技術(shù)1什么是JPEG?國(guó)際標(biāo)準(zhǔn)化組織(ISO)和國(guó)際電報(bào)電話咨詢委員會(huì)(CCITT)聯(lián)合成立的“聯(lián)合照片專(zhuān)家組”JPEG經(jīng)過(guò)五年艱苦細(xì)致工作后,于1991-3提出了JPEG標(biāo)準(zhǔn)——JointPhotographicExpertsGroup的縮寫(xiě),此小組開(kāi)發(fā)研制出連續(xù)色調(diào)、多級(jí)灰度、靜止圖像的數(shù)字圖像壓縮編碼方法,也稱為JPEG算法,此算法后來(lái)被確定為JPEG壓縮標(biāo)準(zhǔn)。它適用于彩色和單色多灰度或連續(xù)色調(diào)靜止數(shù)字圖像的壓縮標(biāo)準(zhǔn)。JPEG專(zhuān)家開(kāi)發(fā)了包括采用以預(yù)測(cè)技術(shù)為基礎(chǔ)的無(wú)損壓縮,和基于離散余弦變換、Huffman編碼的有損壓縮兩個(gè)部分。前者不會(huì)產(chǎn)生失真,但壓縮比很小。后者算法進(jìn)行圖像壓縮時(shí),信息有損失但壓縮比可以很大。例如使用有損壓縮算法,在壓縮比為20:1~40:1倍時(shí),人眼基本上看不出失真。壓縮后還原得到的圖像與源圖像相比較,非圖像專(zhuān)家是難于找出它們之間的區(qū)別的,因此得到了廣泛的應(yīng)用。JPEG壓縮是有損壓縮?!馢PEG編碼——有損編碼●壓縮比——10:1~100:1(一般壓縮比≯40:1)●壓縮原理——采用無(wú)失真預(yù)測(cè)編碼、有失真DCT編碼等混合編碼方式●無(wú)失真預(yù)測(cè)編碼——線性預(yù)測(cè)編碼,壓縮比2:1●有失真DCT編碼——[1]離散余弦變換壓縮編碼,壓縮比40:1[2]霍夫曼編碼(增強(qiáng)型編碼)[3]自適應(yīng)算術(shù)編碼(增強(qiáng)型編碼)●特點(diǎn)[1]壓縮比可調(diào)[2]對(duì)CPU的響應(yīng)速度要求不高[3]壓縮算法復(fù)雜(可同時(shí)使用四種壓縮編碼方式)在保證圖像質(zhì)量的前提下為進(jìn)一步提高壓縮比,近年來(lái)JPEG專(zhuān)家組正在制定JPEG2000標(biāo)準(zhǔn),這個(gè)標(biāo)準(zhǔn)中將采用小波變換Wavelet算法(簡(jiǎn)稱WT)。

2JPEG的實(shí)現(xiàn)目標(biāo)達(dá)到或接近當(dāng)前壓縮比與圖像保真度的技術(shù)水平,能夠覆蓋較寬的圖像質(zhì)量等級(jí)范圍,能達(dá)到“很好”或“較好”的評(píng)估,與原始圖像比較,人的視覺(jué)難以分辨;能適用于任何種類(lèi)的連續(xù)色調(diào)的圖相,并且長(zhǎng)寬比都不受限制,同時(shí)也不受制于景物內(nèi)容、圖像的復(fù)雜程度和統(tǒng)計(jì)特性等;計(jì)算的復(fù)雜性是可控制的,其實(shí)現(xiàn)的軟件可在各種類(lèi)型的CPU上運(yùn)行,當(dāng)然算法也可用硬件實(shí)現(xiàn)。3JPEG的幾種操作方式DCT順序編碼。對(duì)一圖像分量按照從左到右、從上到下掃描,一次完成編碼;DCT累進(jìn)(遞增)編碼。對(duì)圖像分量在多次掃描中,實(shí)現(xiàn)從粗到細(xì)的漸進(jìn)式編碼過(guò)程;無(wú)失真編碼。保證編碼后能夠完全恢復(fù)源目標(biāo),顯然壓縮比低;分層編碼。對(duì)圖像在多個(gè)空間中采用不同的分辨率進(jìn)行編碼。比如在信道傳輸速率慢、接收端的顯示設(shè)備的分辨率低時(shí),只需要做低分辨率圖像解碼就可以了,而不需要進(jìn)行高分辨率的解碼運(yùn)算。JPEG壓縮算法的特點(diǎn)____P112圖像質(zhì)量

JPEG給出的幾個(gè)衡量壓縮編碼效果的準(zhǔn)則:0.25~0.5位/像素:中到好,足以滿足一些應(yīng)用;0.5~0.75位/像素:好到很好,足以滿足許多應(yīng)用;0.75~1.5位/像素:優(yōu)秀,足以滿足大多數(shù)應(yīng)用;1.5~2.0位/像素:難于與原圖象區(qū)別,足以滿足絕大多數(shù)應(yīng)用。說(shuō)明:位/像素(bit/pixel)=壓縮圖像總位數(shù)/亮度分量的樣本數(shù)2H.261標(biāo)準(zhǔn)1)什么是H.261標(biāo)準(zhǔn)?

是壓縮圖像編碼國(guó)際標(biāo)準(zhǔn)。它主要用于視頻電話和電視會(huì)議,是可用于傳輸率在n×64kb/s(其中n=1,2,……,30)的視聽(tīng)服務(wù)的視頻編碼器。特別地,當(dāng)n=1、2時(shí),傳輸率比較低,此時(shí)只適用于臺(tái)式面對(duì)面的可視通信,如可視電話;當(dāng)n≤6時(shí),傳輸率增加一些,可以較好地傳輸比較復(fù)雜的圖像,適用于電視會(huì)議。2)H.261標(biāo)準(zhǔn)H.261標(biāo)準(zhǔn)的主要目標(biāo)是通過(guò)除去冗余信息來(lái)減少位率,其編碼方式可采用源編碼(信源編碼)和熵編碼。其中源編碼又分為幀內(nèi)和幀間編碼。源編碼:是對(duì)原始圖像進(jìn)行處理,這步處理存在信息丟失,是有失真壓縮,其壓縮后存在圖像質(zhì)量降低的現(xiàn)象;幀內(nèi)編碼:由于第一幅圖像和景物變換后的第一幅圖像,它只除去一幅圖像中的空域冗余信息;幀間編碼:用于相似圖像的序列,包括運(yùn)動(dòng)圖像。它不僅除去一幅圖像中的空域冗余信息,而且還除去了幀間圖像的時(shí)域冗余信息;熵編碼:就是利用信號(hào)的統(tǒng)計(jì)特性減少比特?cái)?shù),以達(dá)到進(jìn)一步壓縮數(shù)據(jù)的目的。理論上它是無(wú)失真壓縮。3)H.261標(biāo)準(zhǔn)的視頻數(shù)據(jù)結(jié)構(gòu)定義一個(gè)科學(xué)的數(shù)據(jù)結(jié)構(gòu),以保證解碼器進(jìn)行解碼時(shí)不會(huì)產(chǎn)生二義性,這是H.261標(biāo)準(zhǔn)需要解決的一個(gè)重要問(wèn)題。3JPEG壓縮算法⑴無(wú)失真預(yù)測(cè)編碼無(wú)失真預(yù)測(cè)編碼是基于空間的線性預(yù)測(cè)技術(shù)(即差分脈沖編碼調(diào)制)算法,壓縮比一般2:1。優(yōu)點(diǎn)是硬件實(shí)現(xiàn)容易、還原的圖像基本能亂真,效果較好。一般采用DPCM、霍夫曼編碼算法。⑵有失真DCT編碼有失真DCT編碼是基于DCT——離散余弦變換壓縮算法,是屬于有損壓縮算法類(lèi)型的。壓縮比40:1,按照不同層次它通常被劃分成:①基本系統(tǒng)如霍夫曼編碼②增強(qiáng)型編碼如霍夫曼編碼,自適應(yīng)算術(shù)編碼。兩種工作模式:①順序操作②累進(jìn)操作基本JPEG算法的主要計(jì)算步驟(如圖所示):①正向離散余弦變換;②量化;③Z字形編碼;④差分編碼:用DPCM對(duì)直流系數(shù)DC進(jìn)行編碼;⑤量化表:用行程長(zhǎng)度編碼對(duì)交流系數(shù)AC進(jìn)行編碼;⑥熵編碼。實(shí)際上,基本JPEG算法操作可分成三個(gè)步驟:⑴顏色空間轉(zhuǎn)換上圖中第一步的顏色轉(zhuǎn)換是去除數(shù)據(jù)冗余量過(guò)程的組成部分,但它并不是JPEG算法的成分,JPEG目標(biāo)是獨(dú)立于色彩空間的。使用離散余弦變換(DCT)去除數(shù)據(jù)冗余。JPEG采用8×8子塊的二維離散余弦變換算法。在編碼器的輸入端,把原始圖像(對(duì)彩色圖像是每個(gè)顏色成分)順序地分割成一系列8×8的子塊。在8×8圖像塊中,像素值一般變化較平緩,因此具有較低的空間頻率。并將原始采樣數(shù)據(jù)的無(wú)符號(hào)整數(shù)轉(zhuǎn)換成符號(hào)整數(shù),即“正變換”過(guò)程。8×8圖像塊最終是用64個(gè)離散像素點(diǎn)構(gòu)成的,顯然是空間坐標(biāo)(x、y)的函數(shù)。DCT輸入時(shí)經(jīng)過(guò)正交變換,將這64個(gè)像素點(diǎn)分解成64個(gè)正交基信號(hào),而每個(gè)正交基信號(hào)對(duì)應(yīng)一個(gè)64個(gè)二維空間頻率中的一個(gè),這些二維空間頻率是由輸入信號(hào)的頻譜組成。DCT輸出的是64個(gè)基信號(hào)的幅度值,或者稱為DCT系數(shù),顯然DCT系數(shù)由64個(gè)像素點(diǎn)惟一確定。⑵DCT離散余弦變換DCT壓縮算法的實(shí)質(zhì)是:壓縮8×8圖像塊灰度樣本數(shù)據(jù)流。⑶DCT系數(shù)量化

為了達(dá)到壓縮數(shù)據(jù)的目的,對(duì)離散余弦變換DCT系數(shù)需作量化處理。量化的作用是在保持一定質(zhì)量的前提下,丟棄圖像中對(duì)視覺(jué)效果影響不大的信息。量化是多對(duì)一映射,是造成DCT編碼信息損失的根源。JPEG標(biāo)準(zhǔn)中采用線性均勻量化器,量化過(guò)程為對(duì)64個(gè)DCT系數(shù)除以量化步長(zhǎng)并四舍五入取整(見(jiàn)教材P114),量化步長(zhǎng)由量化表決定。因此,壓縮數(shù)據(jù)的關(guān)鍵是量化表。

量化表元素因DCT系數(shù)位置和彩色分量的不同而取不同值。量化表為8×8矩陣,與DCT變換系數(shù)一一對(duì)應(yīng)。量化表一般由用戶規(guī)定(JPEG標(biāo)準(zhǔn)中給出了參考值),可根據(jù)人類(lèi)視覺(jué)系統(tǒng)和壓縮圖像類(lèi)型的特點(diǎn)進(jìn)行優(yōu)化,并作為編碼器的一個(gè)輸入。量化表中元素為l~255之間的任意整數(shù),其值規(guī)定了所對(duì)應(yīng)DCT系數(shù)的量化步長(zhǎng)。DCT變換系數(shù)除以量化表中對(duì)應(yīng)位置的量化步長(zhǎng)并舍去小數(shù)部分后,多數(shù)變?yōu)榱悖瑥亩_(dá)到了壓縮的目的。

量化表:下面的表1和表2分別給出了JPEG標(biāo)準(zhǔn)所推薦的亮度量化表和色度量化表。12Z字型掃描和AC系數(shù)的游程編碼為了將相同頻率或近似頻率的系數(shù)排列在相近的位置,采用‘Z’字型排列編碼,這樣得到的AC系數(shù)——即DC系數(shù)經(jīng)過(guò)量化后的系數(shù),且AC系數(shù)序列中將包含有許多0系數(shù),并且許多0是連續(xù)的,因此就方便使用非常簡(jiǎn)單和直觀的游程長(zhǎng)度編碼方法。并且量化后的AC系數(shù)通常會(huì)有許多零值,而目零值通常是從左上角開(kāi)始沿對(duì)角線方向分布,因此,以Z字形路徑進(jìn)行游程編碼有效地增加了連續(xù)出現(xiàn)的零值(0游程)個(gè)數(shù)。問(wèn)題:對(duì)AC系數(shù)還可以再壓縮嗎?熵編碼

為了進(jìn)一步壓縮數(shù)據(jù),對(duì)DC碼和DC行程編碼的碼字再作基于統(tǒng)計(jì)特性的熵編碼,進(jìn)行進(jìn)一步的壓縮操作?!词窃鰪?qiáng)系統(tǒng)的JPEG算法。

JPEG標(biāo)準(zhǔn)建議使用的熵碼方法有霍夫曼編碼和自適應(yīng)二進(jìn)制算術(shù)編碼。例如,在JPEG有損壓縮算法中,使用霍夫曼編碼器來(lái)減少熵的理由是可以使用很簡(jiǎn)單的查表(Lookuptable)方法進(jìn)行編碼,并且壓縮數(shù)據(jù)符號(hào)時(shí),霍夫曼編碼器對(duì)出現(xiàn)頻度比較高的符號(hào)分配比較短的代碼,而對(duì)出現(xiàn)頻度較低的符號(hào)分配比較長(zhǎng)的代碼,這種可變長(zhǎng)度的霍夫曼碼表可以事先進(jìn)行定義?!?MPEG編碼技術(shù)全屏幕活動(dòng)視頻圖像是多媒體技術(shù)最終要達(dá)到的主要目標(biāo)之一,雖然目前這一目標(biāo)還遠(yuǎn)沒(méi)有實(shí)現(xiàn),但人們已經(jīng)提出了不少解決方案,以MPEG為核心的壓縮技術(shù)是其中最有希望的一種。1什么是MPEG(即運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn))

MPEG就是運(yùn)動(dòng)圖像的數(shù)字圖像壓縮編碼方法。MPEG標(biāo)準(zhǔn)分成兩個(gè)階段:第一個(gè)階段(MPEG-Ⅰ)是針對(duì)傳輸速率為1MB/s到15MB/s的普通電視質(zhì)量的視頻信號(hào)的壓縮;第二個(gè)階段(MPEG-II)目標(biāo)則是對(duì)每秒3O幀的72Ox572分辨率的視頻信號(hào)進(jìn)行壓縮;在擴(kuò)展模式下,MPEG-II可以對(duì)分辨率達(dá)144Oxll52高清晰度電視的信號(hào)進(jìn)行壓縮。MPEG標(biāo)準(zhǔn)的分類(lèi):MPEG視頻,MPEG音頻和視頻音頻。下圖是MPEG壓縮的實(shí)施框圖。2MPEG視頻要求通用的壓縮標(biāo)準(zhǔn)。但與H.261標(biāo)準(zhǔn)比較,它的頻帶范圍較窄,它是基于一個(gè)可以接受的視頻質(zhì)量,通過(guò)一個(gè)1.5Mb/s的帶寬得到。MPEG的存儲(chǔ)介質(zhì)和視頻應(yīng)用

MPEG視頻壓縮特點(diǎn)隨機(jī)存取;快速正向、逆向搜索;逆向重播;視聽(tīng)同步;容錯(cuò)性;編碼/解碼延遲。圖像分類(lèi)(P116)①幀內(nèi)圖像;②預(yù)測(cè)圖像;③雙向圖像。

3MPEG壓縮主要解決的問(wèn)題正確區(qū)分靜止與動(dòng)態(tài)的圖像;如何提取動(dòng)態(tài)圖像的活動(dòng)成分;進(jìn)行幀間預(yù)測(cè),提供壓縮依據(jù)。4幀間預(yù)測(cè)編碼兩種方法:

①條件像素補(bǔ)充法;

②運(yùn)動(dòng)補(bǔ)償法。

運(yùn)動(dòng)補(bǔ)償算法是當(dāng)前視頻圖像壓縮技術(shù)中使用最普遍的方法之一,是減少幀序列冗余信息的有效方法。由于幀序列的相鄰畫(huà)面之間的運(yùn)動(dòng)部分具有連續(xù)性,即當(dāng)前圓面上的圖像可以看成是前面某圖像的位移,位移的幅度值和方向在畫(huà)面各處可以不同,因此利用運(yùn)動(dòng)位移信息與前面某時(shí)刻的圖像就可以實(shí)現(xiàn)對(duì)當(dāng)前畫(huà)面圖像進(jìn)行預(yù)測(cè),此方法稱為前向預(yù)測(cè)。反之,根據(jù)某時(shí)刻的圖像與位移信息預(yù)測(cè)該時(shí)刻之前的圖像,稱為后向預(yù)測(cè)。如果根據(jù)某時(shí)段的平均值預(yù)測(cè)圖像的方法,稱為平均預(yù)測(cè)?;虿捎们?、后預(yù)測(cè)稱為雙向預(yù)測(cè)。參見(jiàn)圖6-14和6-15(P116)5MPEG標(biāo)準(zhǔn)與質(zhì)量編碼與解碼的一致性;分辨率、位率和質(zhì)量;6MPEG標(biāo)準(zhǔn)的進(jìn)展

MPEG是MovingPicturesExpertsGroup(動(dòng)態(tài)圖象專(zhuān)家組)的縮寫(xiě)。這個(gè)專(zhuān)家組始建于1988年,專(zhuān)門(mén)負(fù)責(zé)為CD建立視頻和音頻標(biāo)準(zhǔn),其成員均為視頻、音頻及系統(tǒng)領(lǐng)域的技術(shù)專(zhuān)家。MPEG的四個(gè)版本:MPEG-Ⅰ

、MPEG-Ⅱ、MPEG-Ⅲ

、MPEG-Ⅳ。由于MPEG-Ⅱ的出色性能表現(xiàn),已能適用于HDTV,使得原打算為HDTV設(shè)計(jì)的MPEG-Ⅲ,還沒(méi)出世就被拋棄了。MPEG-Ⅰ;MPEG-Ⅱ;MPEG-Ⅳ:MPEG-Ⅶ。新一代聲像編碼國(guó)際標(biāo)準(zhǔn),其應(yīng)用領(lǐng)域……7已經(jīng)和正在開(kāi)發(fā)的MPEG標(biāo)準(zhǔn)MPEG-1:數(shù)字電視標(biāo)準(zhǔn),1992年;MPEG-2:數(shù)字電視標(biāo)準(zhǔn);MPEG-3:92年合并到高清晰度電視工作組HDTV;MPEG-4:多媒體應(yīng)用標(biāo)準(zhǔn),99年;MPEG-5:至98年還未定義;MPEG-6:至98年還未定義;MPEG-7:多媒體內(nèi)容描述接口標(biāo)準(zhǔn),正在研究。其中MPEG-1、2標(biāo)準(zhǔn)已經(jīng)正式發(fā)布并且得到廣泛應(yīng)用。8MPEG-4標(biāo)準(zhǔn)的組成DMIF(TheDelliveryMultimediaIntegrationFramework)即多媒體傳送整體框架,它主要解決交互網(wǎng)絡(luò)中、廣

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論