版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
多媒體通信之編碼第1頁,共91頁,2023年,2月20日,星期四2第2章
數(shù)據(jù)編碼
數(shù)據(jù)壓縮概述
有損編碼無損編碼赫夫曼編碼
算術(shù)編碼
行程長度編碼詞典編碼
變換編碼
基于模型編碼
分形編碼
其他壓縮編碼
差錯檢測和校正編碼
第2頁,共91頁,2023年,2月20日,星期四3數(shù)據(jù)編碼數(shù)據(jù)編碼包括:信源編碼信道編碼信源編碼:為了表示和/或壓縮從信號源產(chǎn)生出來的信號而進(jìn)行的編碼,主要解決有效性問題。信道編碼:為了使處理過的信號在傳輸過程中不出錯或少出錯,以及即使出了錯也能自動檢錯或盡量糾錯而進(jìn)行的編碼,主要解決可靠性問題。第3頁,共91頁,2023年,2月20日,星期四42.1數(shù)據(jù)壓縮概述
多媒體數(shù)據(jù)的壓縮主要是對視頻數(shù)據(jù)和音頻數(shù)據(jù)的壓縮,二者使用的基本技術(shù)是相同的。
為什么要壓縮
數(shù)據(jù)的冗余性
壓縮和解壓縮過程壓縮評價和分類數(shù)據(jù)壓縮常常又稱為數(shù)據(jù)信源編碼,或簡稱為數(shù)據(jù)編碼。數(shù)據(jù)壓縮的逆過程稱為數(shù)據(jù)解壓縮,也稱為數(shù)據(jù)信源解碼,或簡稱為數(shù)據(jù)解碼。第4頁,共91頁,2023年,2月20日,星期四52.1.1為什么要壓縮
多媒體數(shù)據(jù)壓縮的目的:為了最有效地利用有限資源(例如存儲和傳輸資源)。一般來說,壓縮是信源信號(采樣和量化后數(shù)字信號),如語音、靜止圖像、音樂或電視等的有效的數(shù)字化表示。壓縮的任務(wù):保持信源信號在一個可以接受的狀況的前提下把需要的比特數(shù)減到最少程度,以減少存儲、處理和傳輸?shù)某杀尽?/p>
第5頁,共91頁,2023年,2月20日,星期四6信源存儲量電話(200Hz至3.4kHz)8000樣本/秒×12比特/樣本=96kbps寬帶語音(50Hz至7kHz)16000樣本/秒×14比特/樣本=224kbps寬帶音頻(20Hz至20kHz)44100樣本/秒×2通道×16比特/樣本=1.412Mbps圖像512×512像素彩色圖像×24比特/像素≈6.3兆比特/圖像視頻640×480像素彩色圖像×24比特/像素×30圖像/秒≈221Mbps高清晰度電視1280×720像素彩色圖像×60圖像/秒×24比特/像素≈1.3Gbps未壓縮信源的大致比特率第6頁,共91頁,2023年,2月20日,星期四72.1.2數(shù)據(jù)的冗余性
數(shù)據(jù)壓縮的前提:基本原始信源的數(shù)據(jù)存在著很大的冗余度(Redundant)。空間冗余時間冗余信息熵冗余結(jié)構(gòu)冗余知識冗余認(rèn)知(視覺聽覺)冗余其他冗余數(shù)據(jù)壓縮就是去掉信號數(shù)據(jù)的冗余性。第7頁,共91頁,2023年,2月20日,星期四82.1.2數(shù)據(jù)的冗余性
空間冗余在同一幅圖像中,規(guī)則物體和規(guī)則背景(所謂規(guī)則是指表面顏色分布是有序的而不是完全雜亂無章的)的表面物理特征具有相關(guān)性,這些相關(guān)性在數(shù)字化圖像中就表現(xiàn)為數(shù)據(jù)冗余。
第8頁,共91頁,2023年,2月20日,星期四92.1.2數(shù)據(jù)的冗余性時間冗余
圖像序列中的兩幅相鄰的圖像,后一幅圖像與前一幅圖像之間有較大的相關(guān)性,這反映為時間冗余。同理,在言語中,由于人在說話時發(fā)音的音頻是一連續(xù)的漸變過程,而不是一個完全在時間上獨立的過程,因而存在時間冗余。
第9頁,共91頁,2023年,2月20日,星期四102.1.2數(shù)據(jù)的冗余性信息熵冗余(編碼冗余)信息量I(xi)的概率平均值叫做信息熵,或簡稱熵。
熵是信息量的度量方法,定義了觀察到單個信源符號輸出時獲得的平均信息量。第10頁,共91頁,2023年,2月20日,星期四信息熵冗余信息熵冗余:信源編碼時,當(dāng)分配給第i個碼元類的比特數(shù)b(yi)=-logpi,才能使編碼后單位數(shù)據(jù)量等于其信源熵,即達(dá)到其壓縮極限。但實際中各碼元類的先驗概率很難預(yù)知,比特分配不能達(dá)到最佳。實際單位數(shù)據(jù)量d>H(S),即存在信息冗余熵。信息論認(rèn)為:若信源編碼的熵大于信源的實際熵,該信源中一定存在冗余度。11第11頁,共91頁,2023年,2月20日,星期四122.1.2數(shù)據(jù)的冗余性結(jié)構(gòu)冗余
有些圖像從大的區(qū)域上看存在著非常強(qiáng)的紋理結(jié)構(gòu),例如布紋圖像和草席圖像,我們說它們在結(jié)構(gòu)上存在冗余。
知識冗余有許多圖像的理解與某些基礎(chǔ)知識有相當(dāng)大的相關(guān)性。這類規(guī)律性的結(jié)構(gòu)可由先驗知識和背景知識得到,我們稱此類冗余為知識冗余。
第12頁,共91頁,2023年,2月20日,星期四132.1.2數(shù)據(jù)的冗余性認(rèn)知(視覺聽覺)冗余人類視覺系統(tǒng)對于圖像場的任何變化,并不是都能感知的。事實上人類視覺系統(tǒng)一般的分辨能力約為26灰度等級,而一般圖像量化采用28灰度等級,這類冗余我們稱為視覺冗余。對于聽覺,也存在類似的冗余。
其他冗余例如由圖像的空間非定常特性所帶來的冗余。
第13頁,共91頁,2023年,2月20日,星期四142.1.3壓縮和解壓縮過程
數(shù)據(jù)壓縮就是去掉信號數(shù)據(jù)的冗余性。數(shù)據(jù)壓縮常常又稱為數(shù)據(jù)信源編碼,或簡稱為數(shù)據(jù)編碼。與此對應(yīng),數(shù)據(jù)壓縮的逆過程稱為數(shù)據(jù)解壓縮,也稱為數(shù)據(jù)信源解碼,或簡稱為數(shù)據(jù)解碼。
第14頁,共91頁,2023年,2月20日,星期四152.1.3壓縮和解壓縮過程數(shù)據(jù)壓縮的典型操作包括預(yù)準(zhǔn)備、處理、量化和編碼等過程。第15頁,共91頁,2023年,2月20日,星期四162.1.3壓縮和解壓縮過程解壓縮是壓縮的逆過程具體的編碼器和解碼器以不同的方法構(gòu)成在對稱應(yīng)用中(如對話應(yīng)用),編碼和解碼代價應(yīng)基本相同在非對稱應(yīng)用中,解碼過程比編碼過程耗費的代價要小,這種技術(shù)用于以下情形:壓縮的過程僅一次,采樣的時間不限;解壓縮經(jīng)常用到并需要迅速完成。
第16頁,共91頁,2023年,2月20日,星期四172.1.4壓縮評價和分類衡量數(shù)據(jù)壓縮技術(shù)的三個重要指標(biāo):壓縮比:要大。
恢復(fù)效果:要好,要盡可能地恢復(fù)原始數(shù)據(jù)。
壓縮算法:要簡單,壓縮、解壓速度快,盡可能地做到實時壓縮、解壓。第17頁,共91頁,2023年,2月20日,星期四182.1.4壓縮評價和分類影響多媒體數(shù)據(jù)壓縮技術(shù)發(fā)展的因素:技術(shù)的使用目的面向存儲的技術(shù):要求實時,非??粗貕嚎s能力面向傳輸?shù)募夹g(shù):編解碼算法實現(xiàn)的實時性和成本卻是非常敏感的問題。壓縮算法的壓縮能力、實現(xiàn)復(fù)雜性與成本等方面進(jìn)行平衡與折中數(shù)據(jù)模型數(shù)據(jù)模型的選擇和參數(shù)優(yōu)化對于壓縮算法的進(jìn)步也十分關(guān)鍵第18頁,共91頁,2023年,2月20日,星期四19壓縮分類(1)根據(jù)壓縮過程中是否減少了熵,目前常用的壓縮編碼方法可以分為兩大類:無損壓縮編碼(Losslesscompressioncoding)壓縮是可逆的,也稱為無失真壓縮、冗余壓縮或熵編碼一般用于文本、數(shù)據(jù)以及應(yīng)用軟件的壓縮壓縮比較低,如LZ編碼、行程長度編碼、赫夫曼編碼的壓縮比一般在2:1至5:1之間
有損壓縮編碼(Losscompressioncoding)壓縮是不可逆的,也稱為熵壓縮法允許一定程度的失真,壓縮比高第19頁,共91頁,2023年,2月20日,星期四20常用壓縮編碼方法分類
第20頁,共91頁,2023年,2月20日,星期四有損壓縮與無損壓縮21冗余壓縮法:熵壓縮法:第21頁,共91頁,2023年,2月20日,星期四22壓縮分類(2)根據(jù)碼詞長度是否相等分類定長碼(fixed-lengthcode)采用相同的位數(shù)(bit)對數(shù)據(jù)進(jìn)行編碼大多數(shù)存儲數(shù)字信息的編碼系統(tǒng)都采用定長碼變長碼(variable-lengthcode)采用不相同的位數(shù)(bit)對數(shù)據(jù)進(jìn)行編碼,以節(jié)省存儲空間示例:赫夫曼編碼第22頁,共91頁,2023年,2月20日,星期四232.2赫夫曼編碼
赫夫曼(Huffman)在1952年提出的一種編碼方法從下到上的編碼方法,屬于變長碼類。赫夫曼編碼可區(qū)別的不同碼字的生成是基于不同符號出現(xiàn)的不同概率。自含同步碼,在編碼之后的碼串中都不需要另外添加標(biāo)記符號,即在譯碼時切分符號的特殊代碼?;谝环N稱為“編碼樹”(codingtree)的技術(shù)。得到廣泛應(yīng)用第23頁,共91頁,2023年,2月20日,星期四24赫夫曼編碼算法步驟(1)初始化,根據(jù)符號概率的大小按由大到小順序?qū)Ψ栠M(jìn)行排序。(2)把概率最小的兩個符號組成一個新符號(節(jié)點),即新符號的概率等于這兩個符號概率之和。(3)重復(fù)第2步,直到形成一個符號為止(樹),其概率最后等于1。(4)從編碼樹的根開始回溯到原始的符號,并將每一下分枝賦值為1,上分枝賦值為0。
第24頁,共91頁,2023年,2月20日,星期四25赫夫曼編碼例
編碼結(jié)果:w(A)=100,w(B)=0,w(C)=111,w(D)=101,w(E)=110
p(C)=0.09p(E)=0.11p(D)=0.13p(A)=0.16p(B)=0.51p(CE)=0.20p(AD)=0.29p(ADCE)=0.49p(ADCEB)=1.0010010101第25頁,共91頁,2023年,2月20日,星期四26改進(jìn)的赫夫曼編碼算法自適應(yīng)赫夫曼編碼(AdaptiveHuffmancode)根據(jù)符號概率的變化動態(tài)地改變碼字,產(chǎn)生的代碼比原始赫夫曼編碼更有效擴(kuò)展的赫夫曼編碼(ExtendedHuffmancode)允許編碼符號組而不是單個符號第26頁,共91頁,2023年,2月20日,星期四27采用赫夫曼編碼時的問題采用赫夫曼編碼時有兩個問題值得注意:差錯傳播(errorpropagation):赫夫曼碼沒有錯誤保護(hù)功能,在譯碼時,如果碼串中沒有錯誤,那么就能一個接一個地正確譯出代碼。但如果碼串中有錯誤,那怕僅僅是1位出現(xiàn)錯誤,也會引起一連串的錯誤。赫夫曼碼是可變長度碼,因此很難隨意查找或調(diào)用壓縮文件中間的內(nèi)容,然后再譯碼,這就需要在存儲代碼之前加以考慮。
第27頁,共91頁,2023年,2月20日,星期四282.3算術(shù)編碼
基本原理:將編碼的消息表示成實數(shù)0和1之間的一個間隔(Interval),消息越長,編碼表示它的間隔就越小,表示這一間隔所需的二進(jìn)制位就越多。
兩個基本的參數(shù):符號的概率和它的編碼間隔。
第28頁,共91頁,2023年,2月20日,星期四算術(shù)編碼過程舉例
符號ABCD
概率0.10.40.20.3
初始編碼間隔[0,0.1)[0.1,0.5)[0.5,0.7)[0.7,1)信源符號、概率和初始編碼間隔
第29頁,共91頁,2023年,2月20日,星期四30編碼過程步驟輸入符號編碼間隔編碼判決1C[0.5,0.7)符號的間隔范圍[0.5,0.7)2A[0.5,0.52)[0.5,0.7)間隔的第一個1/103D[0.514,0.52)[0.5,0.52)間隔的最后3個1/104A[0.514,0.5146)[0.514,0.52)間隔的第一個1/105C[0.5143,0.51442)[0.514,0.5146)間隔的第五個1/10開始,二個1/106D[0.514384,0.51442)[0.5143,0.51442)間隔的最后3個1/107B[0.5143836,0.514402)[0.514384,0.51442)間隔的4個1/10,從第1個1/10開始8從[0.5143876,0.514402]中選擇一個數(shù)作為輸出:0.5143876第30頁,共91頁,2023年,2月20日,星期四31譯碼過程步驟間隔譯碼符號譯碼判決1[0.5,0.7)C0.51439在間隔[0.5,0.7)2[0.5,0.52)A0.51439在間隔[0.5,0.7)的第1個1/103[0.514,0.52)D0.51439在間隔[0.5,0.52)的第7個1/104[0.514,0.5146)A0.51439在間隔[0.514,0.52)的第1個1/105[0.5143,0.51442)C0.51439在間隔[0.514,0.5146)的第5個1/106[0.514384,0.51442)D0.51439在間隔[0.5143,0.51442)的第7個1/107[0.51439,0.5143948)B0.51439在間隔[0.51439,0.5143948)的第1個1/108譯碼出來的消息:CADACDB第31頁,共91頁,2023年,2月20日,星期四32算術(shù)編碼需要注意的問題需要注意的問題:
溢出:由于實際的計算機(jī)的精度不可能無限長,運算中容易出現(xiàn)溢出。但多數(shù)機(jī)器都有16、32或者64位的精度,因此這個問題可使用比例縮放方法解決。
算術(shù)編碼器對整個消息只產(chǎn)生一個碼字,這個碼字是在間隔[0,1)中的一個實數(shù),因此譯碼器在接受到表示這個實數(shù)的所有位之前不能進(jìn)行譯碼。
對錯誤很敏感:如果有一位發(fā)生錯誤就會導(dǎo)致整個消息譯錯。第32頁,共91頁,2023年,2月20日,星期四332.4行程長度編碼行程長度編碼(RLE,Run-lengthencoding):非常簡單基于簡單的編碼數(shù)據(jù)原則:重復(fù)的數(shù)據(jù)值序列(或稱為“流”)用一個重復(fù)次數(shù)和單個數(shù)據(jù)值來代替。這里,重復(fù)的值稱為一個“順串”或“連續(xù)”(run)。
控制符重復(fù)次數(shù)
被重復(fù)字符
三字節(jié)碼字格式示例:RTAAAASDEEEEE經(jīng)RLE壓縮后為:RT*4ASD*5E第33頁,共91頁,2023年,2月20日,星期四34RLE算法應(yīng)用RLE算法是BMP、PCX、TIFF等圖像壓縮技術(shù)的一部分,在PDF文件格式中也得到應(yīng)用。存在著不同的實現(xiàn)技術(shù)和文件格式。零抑制:文本里的空白(space)字符壓縮CompuServe格式:1比特圖像的壓縮MSWindows的格式:用于4比特和8比特彩色圖像PDF和TIFF等第34頁,共91頁,2023年,2月20日,星期四352.5詞典編碼
詞典編碼分類
LZ77算法
LZSS算法
LZ78算法
LZW算法
第35頁,共91頁,2023年,2月20日,星期四362.5.1詞典編碼分類
詞典編碼的根據(jù):數(shù)據(jù)本身包含有重復(fù)代碼序列。屬于通用編碼技術(shù)和無損壓縮技術(shù)詞典編碼法分類
第一類詞典法:查找正在壓縮的字符序列是否在前面的輸入數(shù)據(jù)中出現(xiàn)過,如果是,則用指向早期出現(xiàn)過的字符串的“指針”替代重復(fù)的字符串。
第二類算法:從輸入的數(shù)據(jù)中創(chuàng)建一個“短語詞典(dictionaryofthephrases)”。編碼數(shù)據(jù)過程中當(dāng)遇到已經(jīng)在詞典中出現(xiàn)的“短語”時,編碼器就輸出這個詞典中的短語的“索引號”,而不是短語本身。
第36頁,共91頁,2023年,2月20日,星期四37第一類詞典法編碼概念
基本思想:查找正在壓縮的字符序列是否在前面的輸入數(shù)據(jù)中出現(xiàn)過,如果是,則用指向早期出現(xiàn)過的字符串的“指針”替代重復(fù)的字符串?!霸~典”是隱含的,指用以前處理過的數(shù)據(jù)。以AbrahamLempel和JakobZiv在1977年開發(fā)和發(fā)表的算法(稱為LZ77算法)為基礎(chǔ)。改進(jìn)算法是由Storer和Szymanski在1982年開發(fā)的,稱為LZSS算法。第37頁,共91頁,2023年,2月20日,星期四38第二類詞典法編碼概念
基本思想:從輸入的數(shù)據(jù)中創(chuàng)建一個“短語詞典(dictionaryofthephrases)”。編碼數(shù)據(jù)過程中當(dāng)遇到已經(jīng)在詞典中出現(xiàn)的“短語”時,編碼器就輸出這個詞典中的短語的“索引號”,而不是短語本身。A.Lempel和J.Ziv在1978年首次發(fā)表了介紹這種編碼方法的文章,稱為LZ78。TerryA.Welch在1984年改進(jìn)了這種算法。稱為LZW(Lempel-ZivWalch)壓縮編碼。
第38頁,共91頁,2023年,2月20日,星期四392.5.2LZ77算法
起源:1977年,JacobZiv和AbrahamLempel描述了一種基于滑動窗口緩存的技術(shù),該緩存用于保存最近剛處理的文本(J.ZivandA.Lempel,“AUniversalAlgorithmforSequentialDataCompression”,IEEETransactiononInformationTheory,May1977)。這個算法一般稱為IZ77?;舅枷耄涸谡牧髦性~匯和短語(GIF中的圖像模式)很可能會出現(xiàn)重復(fù)。當(dāng)出現(xiàn)一個重復(fù)時,重復(fù)的序列可以用一個短的編碼來代替。壓縮程序掃描這樣的重復(fù),同時生成編碼來代替重復(fù)序列。隨著時間的過去,編碼可以重用來捕獲新的序列。算法必須設(shè)計成解壓程序能夠在編碼和原始數(shù)據(jù)序列推導(dǎo)出當(dāng)前的映射。
第39頁,共91頁,2023年,2月20日,星期四LZ77算法40LZ77是一種普遍的無損壓縮方法。ZIP就是運用這種方法。舉例,比如要傳輸一串字符,如果使用定長二元碼AABCDBCDABCD000001101101101100011011這種編碼效率低下,因為--忽略了字符的模式--忽略了字符的頻率第40頁,共91頁,2023年,2月20日,星期四LZ77算法思想41如果我們可以嘗試用一段較短的代碼來代替重復(fù)的模式(字符串)代碼告訴解碼器應(yīng)該從歷史數(shù)據(jù)中的何處開始讀取多少位數(shù)據(jù),編碼者使用一個緩沖器來保存數(shù)據(jù),并嘗試在歷史信息中匹配信息。如果沒有匹配的,則輸出該字符如果有匹配,則按照(位置,長度)的形式輸出。第41頁,共91頁,2023年,2月20日,星期四LZ77算法思想42需要注意的問題
--每一次輸入的數(shù)據(jù)都要在歷史緩沖器搜索。
--使用最長的匹配。則剛才的字符串AABCDBCDABCD就變成AABCD(3,3)(2,4)第42頁,共91頁,2023年,2月20日,星期四LZ77算法思想43如果使用定長二元碼編碼需要12*2=24bit如果使用LZ77來進(jìn)行編碼,對字符仍然需要2bit,對3bit表示數(shù)字則需要5*2+4*3=22bit使用LZ77編碼效率略高于使用定長二元碼思考LZ77是否對于所有的多媒體信號都適用?第43頁,共91頁,2023年,2月20日,星期四442.6變換編碼
變換的基本原理
離散傅立葉變換
離散余弦變換
小波變換
第44頁,共91頁,2023年,2月20日,星期四452.6.1變換的基本原理
變換編碼:先對信號進(jìn)行某種函數(shù)變換,從一種信號(空間)變換到另一種(空間),然后再對信號進(jìn)行編碼。變換編碼系統(tǒng)中壓縮數(shù)據(jù)有變換、變換域采樣和量化三個步驟。
變換本身并不進(jìn)行數(shù)據(jù)壓縮,它只把信號映射到另一個域,使信號在變換域里容易進(jìn)行壓縮,變換后的樣值更獨立和有序。量化操作通過比特分配可以有效地壓縮數(shù)據(jù)。第45頁,共91頁,2023年,2月20日,星期四46變換編碼、解碼原理框圖
第46頁,共91頁,2023年,2月20日,星期四472.6.1變換的基本原理當(dāng)經(jīng)過正交變換后的協(xié)方差矩陣為一對角矩陣,且具有最小均方誤差時,該變換稱為最佳變換,也稱Karhunen-Loeve變換(K-L變換)。K-L變換的突出優(yōu)點是相關(guān)性好,是均方誤差(MSE,MeanSquareError)意義下的最佳變換,它在數(shù)據(jù)壓縮技術(shù)中占有重要地位。如果變換后的協(xié)方差矩陣接近對角矩陣,該類變換稱為準(zhǔn)最佳變換,典型的有DCT(離散余弦變換)、DFT(離散傅立葉變換)、DWT(離散小波變換)等。
第47頁,共91頁,2023年,2月20日,星期四482.6.2離散傅立葉變換
一個變量的周期函數(shù)g(x)能夠通過傅立葉級數(shù)表示出來:系數(shù)(A0、An和Bn)的值按照下面的公式計算:
第48頁,共91頁,2023年,2月20日,星期四49傅立葉變換傅立葉變換(FourierTransform)的物理意義:將信號從時間域(timedomain)變換到頻率域(frequencydomain)。第49頁,共91頁,2023年,2月20日,星期四50一維離散傅立葉變換(DFT)正變換:給定由N個信號樣本(均勻間隔){x(0),x(1),…,x(N-1)}組成的信號序列,離散傅立葉變換(DFT,DiscreteFourierTransform):
ω=0,1,2,…,N-1逆變換:
k=0,1,2,…,N-1
第50頁,共91頁,2023年,2月20日,星期四51二維離散傅立葉變換(DFT)正變換:給定一個二維信號的樣本序列{x(k,l),k=0,1,…,N-1,l=0,1,…,N-1},二維離散傅立葉變換(2D-DFT):
u,v=0,1,2,…,N-1逆變換:
k,l=0,1,2,…,N-1
第51頁,共91頁,2023年,2月20日,星期四522.6.2離散傅立葉變換傅立葉分析法是一個強(qiáng)有力的工具,它使許多非常困難的問題變得簡單和易于處理,傅立葉系數(shù)能夠被變換、存儲、傳送,并且還能夠被用做重建信號或者信號的函數(shù)。
已經(jīng)發(fā)展了一套快速傅立葉變換(FFT,F(xiàn)astFourierTransform)的計算機(jī)算法,促進(jìn)了它在信號處理中的應(yīng)用,特別是在語音處理中的應(yīng)用。
第52頁,共91頁,2023年,2月20日,星期四532.6.3離散余弦變換
一維離散余弦變換
二維離散余弦變換
修改的離散余弦變換
第53頁,共91頁,2023年,2月20日,星期四542.6.3.1一維離散余弦變換
p(x)的正離散余弦變換(DCT)逆離散余弦變換(IDCT)
第54頁,共91頁,2023年,2月20日,星期四552.6.3.2二維離散余弦變換
(二維逆DCT)像素的二維排列能夠通過水平和垂直方向的頻率項乘積表示出來:p(x,y)的二維DCT
第55頁,共91頁,2023年,2月20日,星期四562D-DCT第56頁,共91頁,2023年,2月20日,星期四57DCT和IDCT例
第57頁,共91頁,2023年,2月20日,星期四582.6.3.3修改的離散余弦變換
實際常常使用修改的離散余弦變換(MDCT,ModifiedDCT),使用一種稱為時域混疊消除(TDAC,timedomainaliasingcancellation)技術(shù),抗混疊(anti-aliasing)效果好。
第58頁,共91頁,2023年,2月20日,星期四2.6.3.4小波變換編碼小波變換是一個線性變換,能夠?qū)⒁粋€信號分解成對空間和時間、頻率的獨立貢獻(xiàn),同時又不失原信號所包含的信息。經(jīng)過小波變換后的圖像能量很集中,便于對不同的分量作不同的處理,達(dá)到較高的壓縮比。
小波變換的具體內(nèi)容在圖像編碼中詳細(xì)講解。第59頁,共91頁,2023年,2月20日,星期四602.7基于模型編碼
基于模型的編碼就是第二代編碼技術(shù)?;谀P头椒ǖ幕舅枷胧牵涸诎l(fā)送端,利用圖像分析模塊對輸入圖像提取緊湊和必要的描述信息,得到一些數(shù)據(jù)量不大的模型參數(shù);在接收端,利用圖像綜合模塊重建原圖像,是對圖像信息的合成過程。
第60頁,共91頁,2023年,2月20日,星期四61基于模型的圖像編碼基本原理框圖
圖像輸入圖像分析編碼器提取的模型參數(shù)圖像傳輸或存儲解碼器圖像綜合模型已量化的模型參數(shù)圖像輸出第61頁,共91頁,2023年,2月20日,星期四622.8其他壓縮編碼
子帶編碼
向量量化編碼
感知編碼
第62頁,共91頁,2023年,2月20日,星期四632.8.1子帶編碼
子帶編碼(SBC,SunbandCoding)是一種在頻率域中進(jìn)行數(shù)據(jù)壓縮的方法,它主要利用一些頻帶比另一些在感知上作用更大。在子帶編碼中,若各個子帶的帶寬ΔWk是相同的,則稱為等帶寬子帶編碼,否則,稱為變帶寬子帶編碼。
第63頁,共91頁,2023年,2月20日,星期四64子帶的概念
第64頁,共91頁,2023年,2月20日,星期四65子帶編碼器
第65頁,共91頁,2023年,2月20日,星期四66子帶解碼器
第66頁,共91頁,2023年,2月20日,星期四672.8.1子帶編碼對每個子帶分別編碼的好處是:
可以利用人耳(或人眼)對不同頻率信號感知靈敏度不同的特性,在人的聽覺(或視覺)不敏感的頻段采用較粗糙的量化,從而達(dá)到數(shù)據(jù)壓縮的目的。
各個子帶的量化噪聲都束縛在本子帶內(nèi),這就可以避免能量較小的頻帶內(nèi)的信號被其他頻帶中量化噪聲所掩蓋。
通過頻帶分裂,各個子帶的取樣頻率可以成倍下降。
第67頁,共91頁,2023年,2月20日,星期四682.8.1子帶編碼經(jīng)過分帶編碼、譯碼后合成的輸出音頻信號會有混迭效應(yīng)。采用正交鏡像濾波器(QMF,quandraturemirrorfilter)來劃分頻帶,混迭效應(yīng)在最后合成時可以抵消。
第68頁,共91頁,2023年,2月20日,星期四692.8.2向量量化編碼
在向量量化編碼中,則是把輸入數(shù)據(jù)幾個一組地分成許多組,成組地量化編碼,即將這些數(shù)看成一個k維向量,然后以向量為單位逐個向量進(jìn)行量化。向量量化是一種限失真編碼,其原理仍可用信息論中的率失真函數(shù)理論來分析。
第69頁,共91頁,2023年,2月20日,星期四向量量化編碼向量量化編碼是一種量化與壓縮相結(jié)合的方法。向量量化編碼由兩部分組成,1向量訓(xùn)練,2向量劃分。向量訓(xùn)練:在離線狀態(tài)下,通過訓(xùn)練達(dá)到最佳的量化空間劃分,盡量減少平均失真。已被量化的不重疊的空間稱為CodeBook(CB)代碼本向量劃分:將需要編碼的代碼看做向量,根據(jù)已有的CB進(jìn)行劃分到某一個空間中去。70第70頁,共91頁,2023年,2月20日,星期四VQtraining第71頁,共91頁,2023年,2月20日,星期四VQexample?GiventhefollowingCB(whichhasbeencalculatedviatrainingpreviously,findtheCBvector(andindex)thatminimimisesthedistortionfortheinputvectorx=[528]第72頁,共91頁,2023年,2月20日,星期四VQexample?Thedistortionforeachvectoris:?TheindexthatminimisesDisindex2andthequantisedvectoristhusy(2)=[238].第73頁,共91頁,2023年,2月20日,星期四74向量量化編碼原理框圖
第74頁,共91頁,2023年,2月20日,星期四752.8.2向量量化編碼衡量兩個向量之間接近程度的度量標(biāo)準(zhǔn)可以用均方誤差準(zhǔn)則:也可以用其他準(zhǔn)則。第75頁,共91頁,2023年,2月20日,星期四762.8.2向量量化編碼在向量量化編碼中,關(guān)鍵是碼本的建立和碼字搜索算法。
碼本的生成算法有兩種類型,一種是已知信源分布特性的設(shè)計算法;另一種是未知信源分布,但已知信源的一列具有代表性且足夠長的樣點集合(即訓(xùn)練序列)的設(shè)計算法。碼字搜索是向量量化中的一個最基本問題,向量量化過程本身實際上就是一個搜索過程,即搜索出與輸入最為匹配的碼字。
第76頁,共91頁,2023年,2月20日,星期四772.8.3感知編碼
感知編碼將感知知識應(yīng)用于編碼中。
感知編碼的主要步驟是:首先將輸入信號分解為各頻譜元素,再根據(jù)某個心理聽覺閾值和掩蔽門限進(jìn)行量化編碼,最后生成比特流。聽覺閾值和掩蔽門限的計算需要對輸入信號進(jìn)行頻域分解。
第77頁,共91頁,2023年,2月20日,星期四78感知編碼基本結(jié)構(gòu)框圖
第78頁,共91頁,2023年,2月20日,星期四2.9差錯檢測和校正編碼
放入附錄中,請同學(xué)們自行學(xué)習(xí)
79第79頁,共91頁,2023年,2月20日,星期四2.10音頻的壓縮音頻頻率范圍
低頻聲音(Infra-sound):0Hz-20Hz人類聽覺頻率范圍的聲音:20Hz-20kHz
高頻(Ultrasound):20kHz-1GHz超聲波(Hypersound):1GHz-10THz不同音頻的帶寬
電話語音:
200Hz-3.4kHz調(diào)幅廣播:50Hz-7kHz
調(diào)頻廣播:20Hz-15kHz寬帶音響:20Hz-20kHz第80頁,共91頁,2023年,2月20日,星期四2.10.1音頻壓縮編碼的基本方法無失真壓縮音頻壓縮方法有失真壓縮Huffman編碼行程編碼波形編碼參數(shù)編碼混合編碼全頻帶編碼PCMDPCMADPCM子帶編碼自適應(yīng)變換編碼ATC
心理學(xué)模型矢量量化線性預(yù)測LPC矢量和激勵線性預(yù)測VSELP多脈沖線性預(yù)測MP-LPC碼本激勵線性預(yù)測CELP第81頁,共91頁,2023年,2月20日,星期四2.10.2電話質(zhì)量的語音壓縮標(biāo)準(zhǔn)ITU—TS建議的語音壓縮的標(biāo)準(zhǔn)G.711:采用PCM編碼,采樣速率為8kHz,量化位數(shù)為8bit,對應(yīng)的比特流速率為64kbit/s。
G.721:ITU建議的G.721將64Kbps的比特流轉(zhuǎn)換為32Kbps的流,它是基于ADPCM技術(shù)。每個數(shù)值差分用4位編碼,其采樣率為8kHz。第82頁,共91頁,2023年,2月20日,星期四2.10.2電話質(zhì)量的語音壓縮標(biāo)準(zhǔn)
G.723:G.723是一種以24Kbps運行的基于ADPCM的有損耗壓縮標(biāo)準(zhǔn)。其音質(zhì)不如非壓縮的G.711PCM標(biāo)準(zhǔn)以及基于SB—ADPCM的G.722標(biāo)準(zhǔn)。G.723.1和G.723.2用于H.324標(biāo)準(zhǔn)。
G.728:它的比特率為16Kbps,帶寬限于3.4kHz。其音質(zhì)比G.711或G.722差得多。它基于一種稱為低延遲代碼激勵線性預(yù)測(LD—CELP)的向量量化技術(shù)。第83頁,共91頁,2023年,2月20日,星期四2.10.2電話質(zhì)量的語音壓縮標(biāo)準(zhǔn)
CELP是一種常用的語音壓縮技術(shù)。它用于美國聯(lián)邦標(biāo)準(zhǔn)1016,可將語音壓縮至4.8Kbps。美國聯(lián)邦標(biāo)準(zhǔn)1015使用CELP的一個簡本,稱為線性預(yù)測編碼(LPC)。LPC一10E標(biāo)準(zhǔn)可以運行于2.4Kbps。采用了一種向量量化方法。聲音聽起來有點象機(jī)器在說話,但4.8Kbps與電話差不多。第84頁,共91頁,2023年,2月20日,星期四2.10.3調(diào)幅廣播質(zhì)量的音頻壓縮標(biāo)準(zhǔn)
調(diào)幅廣播質(zhì)量:50Hz-7kHz,稱“7kHz音頻信號”。
G.722:G.722基于子帶ADPCM技術(shù)(SB—ADPCM),它是將現(xiàn)有的帶寬分成兩個獨立的子帶信道分別采用差分脈碼調(diào)制算法。G.722壓縮信號的帶寬范圍為50Hz到7kHz,而G.711僅限于3.4kHz。其比特率為48、56、64Kbps,在標(biāo)準(zhǔn)模
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年互利共贏合作協(xié)議書
- 2024年技術(shù)項目評估與審計協(xié)議
- 2024年技術(shù)研發(fā)與許可使用合同
- 2024年數(shù)據(jù)中心的云服務(wù)租賃合同
- 基礎(chǔ)卷-2023年小升初數(shù)學(xué)模擬卷三答案解析
- 個人試用期工作總結(jié)500字20篇
- 2024年快遞公司加盟協(xié)議
- 2024年技師培訓(xùn)合作框架
- 第七單元百分?jǐn)?shù)的應(yīng)用應(yīng)用篇其五利潤問題拓展版-2023-2024學(xué)年六年級數(shù)學(xué)上冊典型例題(原卷版)北師大版
- 2024年新產(chǎn)品研發(fā)合作協(xié)議
- 《公務(wù)員回避制度》課件
- 品質(zhì)管理與質(zhì)量控制提升產(chǎn)品品質(zhì)
- 四川省涼山州西昌市2023-2024學(xué)年四年級上學(xué)期期末數(shù)學(xué)試卷
- 康復(fù)護(hù)理的歷史發(fā)展
- 煙花爆竹從業(yè)人員安全培訓(xùn)試題
- 電梯使用現(xiàn)場類隱患專項排查清單
- 一例下肢靜脈潰瘍患者的個案護(hù)理論文
- 危巖穩(wěn)定性計算表格-滑移式-傾倒式-墜落式-完整版
- 直播運營團(tuán)隊組織架構(gòu)及崗位職責(zé)解析
- 肝膽外科運用PDCA循環(huán)縮短三四類手術(shù)患者術(shù)后留置導(dǎo)尿的時間
- JCT640-2010 頂進(jìn)施工法用鋼筋混凝土排水管
評論
0/150
提交評論