《多媒體技術(shù)教程》-ch3_第1頁
《多媒體技術(shù)教程》-ch3_第2頁
《多媒體技術(shù)教程》-ch3_第3頁
《多媒體技術(shù)教程》-ch3_第4頁
《多媒體技術(shù)教程》-ch3_第5頁
已閱讀5頁,還剩81頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、高等學(xué)校21世紀教材多媒體技術(shù)教程高等學(xué)校21世紀教材多媒體技術(shù)教程 3.1 數(shù)據(jù)壓縮的 基本原理和方法3.1 數(shù)據(jù)壓縮的基本原理和方法 壓縮的必要性 音頻、視頻的數(shù)據(jù)量很大,如果不進行處理,計算機系統(tǒng)幾乎將無法對它進行存取和交換。文本文本:屏幕分辨率為 1024768,字符大小為 88 點陣,每個字符用兩個字節(jié)表示滿屏字符的數(shù)量為:(1024/8)(768/8)=12288(個)存儲空間(字節(jié))為:12288(28)=196688bit=24KB3.1 數(shù)據(jù)壓縮的基本原理和方法矢量圖形:一幅由 500條直線組成的矢量圖形,每條線的信息由起點X1,起點Y1,終點X2,終點Y2,屬性(線的顏色和

2、寬度等性質(zhì))等五個項目表示。設(shè)屏幕大小為 768512,屬性位用1字節(jié)表示。每條線的存儲空間為:1928=46bit 一幅圖形需要的存儲空間為:50046 = 2.8KB3.1 數(shù)據(jù)壓縮的基本原理和方法點陣圖:一個簡單的全屏點陣圖,設(shè)屏幕大小為 768512,每點是256色(位深為8位)一屏點陣圖需要的存儲空間為:7685128/8 384KB 將一張11英寸 8.5英寸的彩色照片掃描輸入計算機,掃描儀的分辨率設(shè)定為300dpi(點/英寸),每個像素的 R、G、B 分量分別為 8 位,掃描產(chǎn)生 24 位的真彩圖。存儲空間為:113008.530083/8 24.08MB3.1 數(shù)據(jù)壓縮的基本原

3、理和方法數(shù)字化聲音(語音):聲音的模擬帶寬為 4KHz,采樣位數(shù):8bit,采樣頻率:8kHz1s 聲音的存儲空間為:8k8= 64kbit= 8KB 數(shù)字化高質(zhì)量音頻:聲音的模擬帶寬為 22KHz,采樣位數(shù):32bit,采樣頻率:44KHz1s 音頻的存儲空間為:4432=1408kbit=176KB3.1 數(shù)據(jù)壓縮的基本原理和方法數(shù)字化視頻(PAL制式):視頻帶寬為5MHz,幀速率為25 幀/s,樣本寬是 24bit,采樣頻率為10MHz,因而存儲一幀數(shù)字化的 PAL 制式視頻圖像需要的空間為:102524=9.6Mbit=1.2MB一秒種 PAL 制式的視頻圖像需要的存儲空間為:1.22

4、5=30MB 數(shù)據(jù)冗余的類型1. 數(shù)據(jù)冗余的類型 (1)空間冗余 (2)時間冗余 (3)信息墑冗余 (4)視覺冗余 (5)聽覺冗余 (6)其他冗余結(jié)構(gòu)冗余、知識冗余節(jié)省圖象或視頻的存儲容量,增加訪問速度,使數(shù)字視頻能在PC機上實現(xiàn),需要進行視頻和圖象的壓縮。評價一個壓縮系統(tǒng)的三個關(guān)鍵參數(shù)l壓縮比l圖象質(zhì)量l壓縮和解壓的速度 另外也必須考慮每個壓縮算法所需的硬件和軟件。 1壓縮比 壓縮性能常常用壓縮比定義(輸入數(shù)據(jù)和輸出數(shù)據(jù)比) 例:512480, 24bit/pixel 輸入737280byte 輸出15000byte 壓縮比737280/15000492 2圖象質(zhì)量壓縮方法:無損壓縮(圖象質(zhì)

5、量不變) 有損壓縮有損壓縮:失真情況很難量化,只能對測試的圖象進行估計。模擬圖象質(zhì)量的指標:信噪比、分辨率、顏色錯,但必須在觀察了實際圖象以后。3解壓縮速度在許多應(yīng)用中,壓縮和解壓可能不同時用,在不同的位置不同的系統(tǒng)中。所以壓縮、解壓速度分別估計。靜態(tài)圖象中,壓縮速度沒有解壓速度嚴格;動態(tài)圖象中,壓縮、解壓速度都有要求,因為需實時地從攝像機或錄像機中抓取動態(tài)視頻。4 4硬軟件系統(tǒng)有些壓縮解壓工作可用軟件實現(xiàn)。設(shè)計系統(tǒng)時必須充分考慮:算法復(fù)雜 壓縮解壓過程長算法簡單 壓縮效果差目前有些特殊硬件可用于加速壓縮/解壓。 硬接線系統(tǒng)速度快,但各種選擇在初始設(shè)計時已確定,一般不能更改。因此在設(shè)計硬接線壓

6、縮/解壓系統(tǒng)時必須先將算法標準化。數(shù)據(jù)冗余的例子你的妻子,你的妻子,HelenHelen,將于明天晚上,將于明天晚上6 6點零點零5 5分在分在上海的虹橋機場接你。上海的虹橋機場接你。 (23(23* *2+10=562+10=56個半角字符個半角字符) )你的妻子將于明天晚上你的妻子將于明天晚上 6 6點零點零5 5分在虹橋機場分在虹橋機場接你。接你。 (20(20* *2+3=432+3=43個半角字符)個半角字符)HelenHelen將于明晚將于明晚6 6點在虹橋機場接你。點在虹橋機場接你。 (10(10* *2+7=272+7=27個半角字符)個半角字符)T描述語言1 “這是一幅 22

7、的圖像,圖像的第一個像素是紅的,第二個像素是紅的,第三個像素是紅的,第四個像素是紅的”。 2 “這是一幅22的圖像,整幅圖都是紅色的”整理圖像的描述方法可整理圖像的描述方法可以達到壓縮的目的以達到壓縮的目的圖像壓縮編碼的可能性圖像無損壓縮的原理RGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGB16RGB從原來的1638bit=284bit 壓縮為:(1+3)8bit=32bit圖像有損壓縮的原理363635353434 34343434343434343

8、232 34343434333337373030 34343434343434343434 34343434343435353434 343431 31343434343434343434343434343434343434343434343434343434343434343434343434343434343434343434343434343425253434實際圖像中冗余信息的表現(xiàn)(灰度圖)數(shù)據(jù)冗余信息分析結(jié)論由于一幅圖像存在數(shù)據(jù)冗余和主觀視覺冗余,壓縮方式從這兩方面著手來開展1)數(shù)據(jù)冗余:將圖像信息的描述方式改變之后,壓縮掉這些冗余。如統(tǒng)計冗余度、空域冗余度、時域冗余度等2)主觀視覺

9、冗余:忽略一些視覺不太明顯的微小差異,可以進行所謂的“有損”壓縮數(shù)據(jù)壓縮方法分類數(shù)據(jù)壓縮技術(shù)分類k根據(jù)解碼后數(shù)據(jù)與原始數(shù)據(jù)是否完全一致可以分為兩大類:k熵編碼(冗余壓縮法),也稱無損壓縮法、無失真壓縮法。由于不會失真,多用于文本、數(shù)據(jù)的壓縮,但也有例外,非線性編輯系統(tǒng)為了保證視頻質(zhì)量,有些高檔系統(tǒng)采用的是無失真壓縮方法。k熵壓縮法,也稱有損壓縮法、有失真壓縮法。大多數(shù)圖像、聲音、動態(tài)視頻等數(shù)據(jù)的壓縮是采用有失真壓縮。數(shù)據(jù)壓縮方法分類從信息語義角度分為“熵(平均信息量)編碼”和“源編碼”兩種: 熵 (平均信息量)編碼(Entropy Coding) 熵編碼是一種泛指那些不考慮被壓縮信息的性質(zhì)的編

10、碼和壓縮技術(shù)。它是基于平均信息量的技術(shù)把所有的數(shù)據(jù)當作比特序列,而不根據(jù)壓縮信息的類型優(yōu)化壓縮。 熵編碼分為: 重復(fù)序列消除編碼 (含:消零、行程編碼) 統(tǒng)計編碼數(shù)據(jù)壓縮方法分類 源編碼(Source Coding) 源編碼的冗余壓縮取決于初始信號的類型、前后的相關(guān)性、信號的語義內(nèi)容等。源編碼比嚴格的平均信息量編碼的壓縮率更高。 源編碼主要分為: 預(yù)測編碼 變換編碼 向量量化常用數(shù)據(jù)壓縮方法的基本原理1. 統(tǒng)計編碼 其方法是識別一個給定的流中出現(xiàn)頻率最高的比特或字節(jié)模式,并用比原始比特更少的比特數(shù)來對其編碼。若碼流中所有模式出現(xiàn)的概率相等,則平均信息量最大, 信源就沒有冗余。(1)行程編碼(R

11、un Length Coding)(2) LZW編碼(3) 哈夫曼編碼(4) 算術(shù)編碼(1)(1)行程編碼行程編碼( (Run Length Coding)Run Length Coding)行程編碼(行程編碼(RLE,Run-length encoding)是一種非常簡單的數(shù)據(jù)壓縮編碼形式。它是一種非常簡單的數(shù)據(jù)壓縮編碼形式。它基于簡單的編碼數(shù)據(jù)原則,這個原則就是,基于簡單的編碼數(shù)據(jù)原則,這個原則就是,重復(fù)的數(shù)據(jù)值序列(或稱為重復(fù)的數(shù)據(jù)值序列(或稱為“流流”)用一)用一個重復(fù)次數(shù)和單個數(shù)據(jù)值來代替。這里,個重復(fù)次數(shù)和單個數(shù)據(jù)值來代替。這里,重復(fù)的值稱為一個重復(fù)的值稱為一個“連續(xù)連續(xù)”(run

12、)。)。 Huffman Huffman 編碼編碼Huffman 編碼的步驟:(1)概率統(tǒng)計,得到n個不同概率的信息符號; (2)將n個信源信息符號的n個概率,按概率大小排序;(3)將n個概率中,最后兩個小概率相加,這時概率個數(shù)減為n-1個; (4)將n-1個概率,按大小重新排序; (5)重復(fù)(3),將新排序后的最后兩個小概率相加,相加和與其余概率再排序; (6)如此反復(fù)重復(fù)n-2次,得到只剩兩個概率序列; (7)以二進制碼元(0,1)賦值,構(gòu)成哈夫曼碼字,編碼結(jié)束。常用數(shù)據(jù)壓縮方法的基本原理霍夫曼編碼舉例 現(xiàn)在有7個待編碼的符號,它們的概率如下表所示,使用霍夫曼編碼算法求出7個符號所分配的代

13、碼。(寫出編碼樹)待編碼的符號X1X2X3X4X5X6X7概率0.35 0.200.150.100.100.06 0.04常用數(shù)據(jù)壓縮方法的基本原理2. 預(yù)測編碼(Prediction Coding) 預(yù)測編碼是指利用前面的一個或多個信號對下一個信號進行預(yù)測,然后對實際值和預(yù)測值的差進行編碼。典型的預(yù)測編碼有兩種:(1)差分脈碼調(diào)制(DPCM)(2)自適應(yīng)差分脈碼調(diào)制(ADPCM)差分脈碼調(diào)制(DPCM)在在PCM系統(tǒng)中,原始的模擬信號經(jīng)過采樣系統(tǒng)中,原始的模擬信號經(jīng)過采樣后得到的每一個樣值都被量化成為數(shù)字信后得到的每一個樣值都被量化成為數(shù)字信號。為了壓縮數(shù)據(jù),可以不對每一樣值都號。為了壓縮數(shù)

14、據(jù),可以不對每一樣值都進行量化,而是預(yù)測下一樣值,并量化實進行量化,而是預(yù)測下一樣值,并量化實際值與預(yù)測值之間的差值,這就是際值與預(yù)測值之間的差值,這就是DPCM(Differential Pulse Code Modulation,差,差分脈沖編碼調(diào)制)。分脈沖編碼調(diào)制)。1952年貝爾(年貝爾(Bell)實)實驗室的驗室的C. C. Cutler取得了差分脈沖編碼調(diào)取得了差分脈沖編碼調(diào)制系統(tǒng)的專利,奠定了真正實用的預(yù)測編制系統(tǒng)的專利,奠定了真正實用的預(yù)測編碼系統(tǒng)的基礎(chǔ)。碼系統(tǒng)的基礎(chǔ)。 預(yù)測編碼的基本原理預(yù)測編碼的基本原理 鄰近的鄰近的M個值預(yù)測當前值,當前值與預(yù)測值個值預(yù)測當前值,當前值與

15、預(yù)測值之差量化編之差量化編 碼碼常用數(shù)據(jù)壓縮方法的基本原理3.變換編碼(Transformation Coding) 在變換編碼時,初始數(shù)據(jù)要從初始空間或時間域進行數(shù)學(xué)變換,變換為一個更適于壓縮的抽象域。該過程是可逆的;即使用反變換可恢復(fù)原始數(shù)據(jù)。如將時域信號變換到頻域,因為聲音、圖像大部分信號都是低頻信號,在頻域中信號的能量較集中,再進行采樣、編碼就可以壓縮數(shù)據(jù)(1) 最佳變換(KL變換)(2) 離散余弦變換(DCT變換)DCT的原理 離散余弦變換(Discrete Cosine Transform,DCT)是一種實數(shù)域變換,其變換核為實數(shù)余弦函數(shù)。對一幅圖像進行離散余弦變換后,許多有關(guān)圖像

16、的重要可視信息都集中在DCT變換的一小部分系數(shù)中。因此,離散余弦變換(DCT)是有損圖像壓縮JPEG的核心,同時也是所謂“變換域信息隱藏算法”的主要“變換域(DCT域)”之一。因為圖像處理運用二維離散余弦變換,所以直接介紹二維DCT變換。 分析DCT系數(shù)的性質(zhì) 下面以下面以lenna圖像為例,利用圖像為例,利用DCT變換函數(shù)得到的變換函數(shù)得到的DCT系數(shù)的性質(zhì)。我們只取系數(shù)的性質(zhì)。我們只取R層的層的DCT系數(shù)矩陣進行系數(shù)矩陣進行分析。下圖顯示了變化的結(jié)果,其中分析。下圖顯示了變化的結(jié)果,其中DCT系數(shù)用光譜系數(shù)用光譜的形式給出,直觀的表明了低頻和高頻系數(shù)的分布規(guī)的形式給出,直觀的表明了低頻和高

17、頻系數(shù)的分布規(guī)律。律。 分析DCT系數(shù)的性質(zhì) 常用數(shù)據(jù)壓縮方法的基本原理典型的變換編碼系統(tǒng)框圖:典型的變換編碼系統(tǒng)框圖:信源信源序列序列變換變換變 換 域變 換 域采采 樣樣量化量化編碼編碼存 儲 或存 儲 或傳傳 輸輸譯碼譯碼填零填零反反 變變換換再現(xiàn)再現(xiàn)序列序列變換編碼系統(tǒng)壓縮數(shù)據(jù)的三個步驟變換編碼系統(tǒng)壓縮數(shù)據(jù)的三個步驟常用數(shù)據(jù)壓縮方法的基本原理4. 分析合成編碼 通過對原始數(shù)據(jù)分析,將其分解為一系列更適合于表示的基元或從中提取出更有本質(zhì)意義的參數(shù),僅對這些基本單元或者特征參數(shù)進行編碼,而解碼時則借助于一定的規(guī)則或者模型,按照一定的算法將這些基元或者參數(shù)再綜合成逼近原始數(shù)據(jù)的結(jié)果。j矢量量

18、化j小波變換編碼j分形編碼j子帶編碼高等學(xué)校21世紀教材多媒體技術(shù)教程 3.2 音頻的壓縮3.2 音頻的壓縮音頻頻率范圍 低頻聲音(Infra-sound): 0Hz20Hz 人類聽覺頻率范圍的聲音: 20Hz20kHz 高頻(Ultrasound): 20kHz1GHz 超聲波(Hypersound): 1GHz10THz不同音頻的帶寬 電話語音: 200Hz3.4kHz 調(diào)幅廣播: 50Hz7kHz 調(diào)頻廣播: 20Hz15kHz 寬帶音響: 20Hz20kHz3.2.1 音頻壓縮編碼的基本方法無失真壓縮無失真壓縮音頻壓縮方法音頻壓縮方法有失真壓縮有失真壓縮HuffmanHuffman編碼

19、編碼行程編碼行程編碼波形編碼波形編碼參數(shù)編碼參數(shù)編碼混合編碼混合編碼全頻帶編碼全頻帶編碼 PCM PCM DPCM DPCM ADPCM ADPCM子帶編碼子帶編碼 自適應(yīng)變換編碼自適應(yīng)變換編碼ATCATC 心理學(xué)模型心理學(xué)模型矢量量化矢量量化線性預(yù)測線性預(yù)測LPCLPC矢量和激勵線矢量和激勵線性預(yù)測性預(yù)測VSELPVSELP多脈沖線性多脈沖線性預(yù)測預(yù)測MP-LPCMP-LPC碼本激勵線碼本激勵線性預(yù)測性預(yù)測CELPCELP調(diào)幅廣播與調(diào)頻廣播介紹 隨著生活水平的提高,人們對只能收聽中波調(diào)幅廣播的收音機已經(jīng)不滿足了,在選購收音機時,要求具備調(diào)頻、調(diào)幅兩種功能的產(chǎn)品。那么電臺為什么要用調(diào)頻、調(diào)幅兩

20、種不同的方式進行廣播?調(diào)頻廣播與調(diào)幅廣播各有什么特點,又有什么區(qū)別? 無線電廣播是依靠空間的高頻電磁波來傳播節(jié)目的。高頻電磁波并不含有任何信息,只起了“運載工具”的作用。因此,又稱它為載波。平時講的中央人民廣播電臺的頻率為 540 千赫、上海人民廣播電臺的頻率為 990 千赫,就是載波的頻率。要傳送的廣播節(jié)目的頻率要比載波的頻率低得多,在 30 赫 15000 赫之間,稱為音頻信號或低頻信號。低頻信號是傳不遠的。必須設(shè)法把它與高頻載波疊加起來,才能達到遠傳的目的。這種疊加的過程,稱它為調(diào)制。常用的調(diào)制方式有兩種:當高頻振蕩的幅度隨著音頻信號的大小變化而變化,這種調(diào)制方式稱為調(diào)幅。如果被高頻振蕩

21、的頻率隨著音頻信號的大小變化而變化,這種調(diào)制方式稱為調(diào)頻。調(diào)幅的特點是載波的頻率始終不變,調(diào)幅的特點是載波的頻率始終不變,而載波幅度變化的形狀與音頻信號變而載波幅度變化的形狀與音頻信號變化的形態(tài)一樣。我們把幅度變化的軌化的形態(tài)一樣。我們把幅度變化的軌跡稱作包絡(luò)線。從圖跡稱作包絡(luò)線。從圖 1 1 中可以看出,包中可以看出,包絡(luò)線的形狀與音頻信號是相同的。被絡(luò)線的形狀與音頻信號是相同的。被音頻信號調(diào)制后的載波,稱已調(diào)波。音頻信號調(diào)制后的載波,稱已調(diào)波。 我國中波調(diào)幅廣播的頻率范圍為我國中波調(diào)幅廣播的頻率范圍為 535 535 1605 1605 千赫。千赫。 為了在有限的廣播頻率段中,既要防止臨為

22、了在有限的廣播頻率段中,既要防止臨近頻率電臺相互干擾,又要設(shè)置更多的電近頻率電臺相互干擾,又要設(shè)置更多的電臺數(shù)目,只能壓縮每個電臺的頻帶寬度。臺數(shù)目,只能壓縮每個電臺的頻帶寬度。國際上規(guī)定中波廣播的頻道間隔為國際上規(guī)定中波廣播的頻道間隔為 9 9 千赫。千赫。即每一電臺的頻帶寬度限制于即每一電臺的頻帶寬度限制于 9 9 千赫之內(nèi)。千赫之內(nèi)。調(diào)幅廣播的不足是抗干擾能力差調(diào)幅廣播的不足是抗干擾能力差. . 調(diào)頻的特點是載波的幅度始終不變,調(diào)頻的特點是載波的幅度始終不變,而它的頻率則隨著音頻信號大小在變而它的頻率則隨著音頻信號大小在變化。如圖化。如圖 所示:當音頻信號增強的時所示:當音頻信號增強的時

23、候,頻率變高,波形就密;當音頻信候,頻率變高,波形就密;當音頻信號減弱的時候,頻率變低,波形就疏。號減弱的時候,頻率變低,波形就疏。 調(diào)頻波的頻譜要比調(diào)幅波復(fù)雜得多。 每個電臺所占頻帶寬寬為 200 千赫所以調(diào)頻電臺的節(jié)目聽起來要比調(diào)幅廣播高音豐富、清晰、逼真。特別是在聆聽立體聲高保真音樂節(jié)目。 調(diào)頻廣播的另一個特點是抗干擾能力強。因為干擾主要是影響載波的幅度,對載波的頻率幾乎沒有影響。因此在接收機中用限幅器很容易將干擾消除掉。參見圖 。 3.2.2 電話質(zhì)量的語音壓縮標準ITU-TS建議的語音壓縮的標準kG.711:采用PCM(脈沖)編碼,采樣速率為8kHz,量化位數(shù)為8bit,對應(yīng)的比特流

24、速率為64kbit/skG.721: 將64Kbps的比特流轉(zhuǎn)換為32Kbps的流,它是基于 ADPCM (自適應(yīng)音頻脈沖編碼)技術(shù)。每個數(shù)值差分用4位編碼,其采樣率為8kHzkG.723:以24Kbps運行的基于 ADPCM的有損耗壓縮標準。其音質(zhì)不如非壓縮的 G.711PCM 標準以及基于 SB-ADPCM 的 G.722標準3.2.2 電話質(zhì)量的語音壓縮標準kG.728:采用低延遲代碼激勵線性預(yù)測(LD-CELP)的向量量化技術(shù)。其 比特率為16Kbps,帶寬限于3.4kHz。其音質(zhì)比 G.711或 G.722差得多kCELP是一種常用的語音壓縮技術(shù)。它用于美國聯(lián)邦標準1016,可將語音

25、壓縮至4.8Kbps。美國聯(lián)邦標準1015使用 CELP的一個簡本,稱為線性預(yù)測編碼(LPC)。 LPC-10E標準可以運行于2.4Kbps。采用了一種向量量化方法。聲音聽起來有點象機器在說話,但4.8Kbps與電話差不多3.2.3 調(diào)幅廣播質(zhì)量的音頻壓縮標準調(diào)幅廣播質(zhì)量:50Hz7kHz,稱“7kHz音頻信號”kG.722:基于子帶 ADPCM技術(shù)(SB-ADPCM),是將現(xiàn)有的帶寬分成兩個獨立的子帶信道分別采用差分脈碼調(diào)制算法G.722壓縮信號的帶寬范圍為50Hz到7kHz,而G.711 僅限于3.4kHz。其比特率為48、56、64Kbps,在標準模式下,采樣速率是16KHz,幅度深度為

26、14比特3.2.4 高保真立體聲音頻壓縮標準高質(zhì)量的聲音信號頻率范圍: 50Hz20kHzk目前國際上比較成熟的高質(zhì)量聲音壓縮標準為MPEG音頻kMPEG-1的音頻信號在ISO 11172-3文檔中的描述。MPEG音頻不是單個一種壓縮算法,而是3種音頻編碼和壓縮方案的一個系列 kMPEG聲音編碼分為:層-1、層-2、層-3。隨著層數(shù)的增加算法的復(fù)雜度也增大3.2.4 高保真立體聲音頻壓縮標準k所有3層都分級兼容。最復(fù)雜的譯碼器(即在層-3工作的譯碼器)也可對層-2或?qū)?l的碼流進行譯碼k所有3層均運用變換編碼和子帶編碼v 頻譜被分為32個子帶v 應(yīng)用快速博里葉變換來表示高頻域中的信號v 應(yīng)用心

27、理聲學(xué)模式來變換信號以估計剛能引起注意的噪音級k層 1、2 和 3主要在最后一個階段即量化階段的方式上有所區(qū)別,但不是唯一的差別。高等學(xué)校21世紀教材多媒體技術(shù)教程3.3 圖像和視頻的壓縮圖像和動畫的存儲方式是一個很重要的問圖像和動畫的存儲方式是一個很重要的問題。幸好我們有了數(shù)據(jù)壓縮,有了題。幸好我們有了數(shù)據(jù)壓縮,有了 JPEG 等多種壓縮存儲圖像的文件格式,我們今等多種壓縮存儲圖像的文件格式,我們今天才能夠拿著小小的一個存儲器,卻存上天才能夠拿著小小的一個存儲器,卻存上許多張色彩鮮艷的圖片。如果沒有圖像壓許多張色彩鮮艷的圖片。如果沒有圖像壓縮算法,也許我們的多媒體時代就會晚到縮算法,也許我們

28、的多媒體時代就會晚到來許多年。來許多年。3.3.1 圖像和視頻壓縮編碼的基本方法圖像和視頻壓縮方法圖像和視頻壓縮方法無失真壓縮無失真壓縮有失真壓縮有失真壓縮HuffmanHuffman編碼編碼行程編碼行程編碼算術(shù)編碼算術(shù)編碼LZWLZW編碼編碼預(yù)測編碼預(yù)測編碼運動補償運動補償變換編碼變換編碼DCTDCT變換變換小波變換小波變換子帶編碼子帶編碼模型編碼模型編碼分形編碼分形編碼基于重要性基于重要性濾波濾波子采樣子采樣矢量量化矢量量化混合編碼混合編碼JPEGJPEGMPEGMPEGH.261H.2613.3.2 靜止圖像壓縮標準k靜止圖像壓縮的國際標準:kISO制訂的JPEG標準、JBIG標準kIT

29、U-T的G3標準、G4標準kJPEG標準適用于黑白及彩色照片、彩色傳真和印刷圖片,可以支持很高的圖像分辨率和量化精度 3.3.2 靜止圖像壓縮標準1. JPEG壓縮標準l壓縮比高,圖像質(zhì)量保真程度好l適應(yīng)不同的數(shù)字圖像參數(shù)、大小、圖像內(nèi)容、彩色空間、統(tǒng)計特性等,但不包括二值圖像l用戶可以對壓縮比、質(zhì)量效果進行選擇l應(yīng)該滿足硬軟件實現(xiàn)的計算需求l支持多種操作方式JPEG 圖像存儲格式一個比較成熟的圖像壓縮格式,雖然一個圖片經(jīng)過轉(zhuǎn)化為 JPEG 圖像后,一些數(shù)據(jù)會丟失,但是,人眼是很不容易分辨出來這種差別的。也就是說, JPEG 圖像存儲格式既滿足了人眼對色彩和分辨率的要求,又適當?shù)娜コ藞D像中很

30、難被人眼所分辨出的色彩,在圖像的清晰與大小中 JPEG 找到了一個很好的平衡點。JPEG 文件的格式是分為一個一個的段來存文件的格式是分為一個一個的段來存儲的儲的,段的多少和長度并不是一定的。只要段的多少和長度并不是一定的。只要包含了足夠的信息,該包含了足夠的信息,該 JPEG 文件就能夠文件就能夠被打開,呈現(xiàn)給人們。被打開,呈現(xiàn)給人們。 JPEG 文件的每個文件的每個段都一定包含兩部分一個是段的標識,它段都一定包含兩部分一個是段的標識,它由兩個字節(jié)構(gòu)成:第一個字節(jié)是十六進制由兩個字節(jié)構(gòu)成:第一個字節(jié)是十六進制 0 xFF ,第二個字節(jié)對于不同的段,這個值,第二個字節(jié)對于不同的段,這個值是不同

31、的。是不同的。3.3.2 靜止圖像壓縮標準(1) JPEG的無損預(yù)測編碼算法 無損壓縮中采用一個簡單的預(yù)測器。預(yù)測器可以采用不同的預(yù)測方法,不同的預(yù)測方法將決定有哪些相鄰的象素將被用于預(yù)測下一個象素。常用的預(yù)測方法如三鄰域預(yù)測法。源圖像數(shù)據(jù)源圖像數(shù)據(jù)預(yù)測器預(yù)測器熵編碼器熵編碼器壓縮的圖像數(shù)據(jù)壓縮的圖像數(shù)據(jù)表說明表說明3.3.2 靜止圖像壓縮標準(2) JPEG基于DCT的有損編碼算法8 8* *8 8DCTDCT正變換正變換量化器量化器熵編熵編碼器碼器壓縮后壓縮后的圖像的圖像數(shù)據(jù)數(shù)據(jù)JPEG 編碼器編碼器表說明表說明表說明表說明塊準備塊準備源圖像源圖像數(shù)據(jù)數(shù)據(jù)3.3.2 靜止圖像壓縮標準 塊準

32、備:塊準備將一幀幀圖像分成88的數(shù)據(jù)塊 DCT變換:原始的圖像數(shù)據(jù)塊經(jīng)過DCT變換后,將每個數(shù)據(jù)塊的數(shù)據(jù)從空間域變換到頻率域,輸出64個DCT變換系數(shù) 量化:JPEG的量化采用線性均勻量化器 DCT系數(shù)的編碼:JPEG中對DC系數(shù)采用DPCM編碼,64個AC系數(shù)在JPEG算法中采用行程編碼 熵編碼:經(jīng)過DPCM編碼的直流項和經(jīng)過行程編碼的交流項再進行霍夫曼編碼或自適應(yīng)二進制算術(shù)編碼3.3.2 靜止圖像壓縮標準壓縮比和圖像質(zhì)量基于DCT(離散余弦變換)的JPEG標準的壓縮是有失真的,DCT變換后系數(shù)的量化是引起失真的主要原因壓縮效果與圖像內(nèi)容本身有較大的關(guān)系,對于中等復(fù)雜程度的彩色圖像,其壓縮比

33、與恢復(fù)圖像的質(zhì)量大致如下表所示 3.3.2 靜止圖像壓縮標準壓縮效果壓縮效果( (比特比特/ /象素象素) )質(zhì)量質(zhì)量0.250.50中好,滿足某些應(yīng)用中好,滿足某些應(yīng)用0.500.75好很好,滿足多數(shù)應(yīng)用好很好,滿足多數(shù)應(yīng)用0.751.5極好,滿足大多數(shù)應(yīng)用極好,滿足大多數(shù)應(yīng)用1.52.0與原始圖像幾乎分不出與原始圖像幾乎分不出3.3.2 靜止圖像壓縮標準2. JPEG2000簡介JPEG2000的原理 JPEG 2000 與傳統(tǒng) JPEG 最大的不同,在于它放棄了JPEG 所采用的以離散余弦轉(zhuǎn)換(Discrete Cosine Transform)為主的區(qū)塊編碼方式,而采用以小波轉(zhuǎn)換(Wa

34、velet transform)為主的多解析編碼方式。小波轉(zhuǎn)換的主要目的是要將圖像的頻率成分抽取出來3.3.2 靜止圖像壓縮標準JPEG2000的優(yōu)點的優(yōu)點1、壓縮率比 JPEG約高30% 左右2、同時支持有損和無損壓縮,適合保存重要圖片3、能實現(xiàn)漸進傳輸,這是其一個極其重要的特征。即 GIF 格式圖像的“漸現(xiàn)”特性。它先傳輸圖像的輪廓,然后逐步傳輸數(shù)據(jù),不斷提高圖像質(zhì)量,讓圖像由朦朧到清晰顯示,而不必是像現(xiàn)在的 JPEG 一樣,由上到下慢慢顯示4、支持所謂的“感興趣區(qū)域”特性,可以任意指定圖像上感興趣區(qū)域的壓縮質(zhì)量,還可以選擇指定的部份先解壓縮,可以很方便的突出重點3.3.2 靜止圖像壓縮標

35、準JPEG2000的應(yīng)用的應(yīng)用 JPEG 2000的應(yīng)用領(lǐng)域可概略分成兩部分,一為傳統(tǒng)JPEG的市場,如打印機,掃描儀,數(shù)碼相機等;一為新興應(yīng)用領(lǐng)域,如網(wǎng)絡(luò)傳輸,無線通訊,醫(yī)療圖像等 JPEG 2000和JPEG 相比優(yōu)勢明顯,且可向下兼容,取代傳統(tǒng)的JPEG格式 目前對 JPEG 2000 熱情最大的是那些數(shù)字照相機廠商 3.3.3 視頻壓縮標準k視頻壓縮的一個重要標準是MPEG(Motion Picture Experts Group),已推出了MPEG(或MPEG-)、MPEG-、MPEG-4等系列標準,新的標準MPEG-7、MPEG-21等標準也在醞釀之中k另一個重要標準是H系列,包括

36、H.261、H.263等標準,此外還有運動JPEG等壓縮標準 3.3.3 視頻壓縮標準1. MPEG-1壓縮標準 能夠傳輸用戶可以接受的視頻 能夠支持對稱或者非對稱的壓縮解壓應(yīng)用 根據(jù)需要可以支持隨機存取 根據(jù)需要支持快進、快倒、快放等多種工作方式 能夠支持視頻和音頻的同步工作 能夠避免出現(xiàn)大的障礙 可以控制壓縮解壓的延遲 可以具有編輯能力 能夠以靈活的格式支持窗口視頻演示 不排斥使用價格低廉又能夠?qū)崟r編碼的芯片3.3.3 視頻壓縮標準kMPEG-標準的目標是以約1.5 Mbps的速率傳輸電視質(zhì)量的視頻信號,亮度信號的分辨率為360240,色度信號的分辨率為180120,每秒30幀kMPEG-

37、標準包括: MPEG系統(tǒng)(ISO/IEC11172-1) MPEG視頻(ISO/IEC11172-2) MPEG音頻(ISO/IEC11172-3) 測試驗證(ISO/IEC11172-4)kMPEG涉及的問題是視頻壓縮、音頻壓縮及多種壓縮數(shù)據(jù)流的復(fù)合和同步問題MPEG-視頻壓縮技術(shù)以兩個基本技術(shù)為基礎(chǔ)的.一個是基于子塊的運動補償,可減少幀序列的時域冗余度。二是基于DCT的壓縮技術(shù),減少空域冗余度。運動補償一個視頻序列包含一定數(shù)量的圖片-通常稱為幀 相鄰的圖片通常很相似,包含了很多冗余。使用運動補償?shù)哪康氖峭ㄟ^消除這種冗余,來提高壓縮比。運動補償是一種描述相鄰幀差別的方法,具體來說是描述前面一

38、幀的每個小塊怎樣移動到當前幀中的某個位置去。 運動補償最早的運動補償?shù)脑O(shè)計只是簡單的從當前幀中減去參考幀,從而得到通常含有較少能量(或者稱為信息)的“殘差”,從而可以用較低的碼率進行編碼。解碼器可以通過簡單的加法完全恢復(fù)編碼幀。運動補償有兩種算法: 運動補償預(yù)測法 畫面上的運動部分在幀與幀之間必然有連續(xù)性,預(yù)測法根據(jù)這一特性,將當前的圖像畫面看作是前面某時刻圖像的位移,位移的幅度和方向在圖像畫面的各處可有不同。 運動補償插補法 用插補的方法進行運動的補償,可以大幅度地壓縮運動圖像的信息。 3.3.3 視頻壓縮標準2. MPEG -壓縮標準kMPEG-標準包括MPEG系統(tǒng)、MPEG視頻、MPEG音頻和一致性四大部分內(nèi)容,是運動圖像及其伴音的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論