音響技術(shù)及家庭影院(2)_第1頁
音響技術(shù)及家庭影院(2)_第2頁
音響技術(shù)及家庭影院(2)_第3頁
音響技術(shù)及家庭影院(2)_第4頁
音響技術(shù)及家庭影院(2)_第5頁
已閱讀5頁,還剩35頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、數(shù)據(jù)壓縮 音響技術(shù)及家庭影院(二) 樓東武 2013-09-15QQ號碼的頻譜分析二話音波形的特性 發(fā)出的話音分成三種類型:濁音(voiced sounds),清音(unvoiced sounds)和爆破音(plosive sounds)。 PCM的概念 脈沖編碼調(diào)制(pulse code modulation,PCM)是概念上最簡單、理論上最完善的編碼系統(tǒng),是最早研制成功、使用最為廣泛的編碼系統(tǒng),但也是數(shù)據(jù)量最大的編碼系統(tǒng)。 PCM的編碼原理比較直觀和簡單。在這個編碼框圖中,它的輸入是模擬聲音信號,它的輸出是PCM樣本。圖中的“防失真濾波器”是一個低通濾波器,用來濾除聲音頻帶以外的信號;“波

2、形編碼器”可暫時理解為“采樣器”均勻量化 非均勻量化 PCM在通信中的應(yīng)用 (1) 頻分多路復(fù)用 (frequency-division multiplexing,F(xiàn)DM) (2) 時分多路復(fù)用(time-division multiplexing,TDM) 增量調(diào)制與自適應(yīng)增量調(diào)制 增量調(diào)制也稱調(diào)制(delta modulation,DM),它是一種預(yù)測編碼技術(shù),是PCM編碼的一種變形。PCM是對每個采樣信號的整個幅度進(jìn)行量化編碼,因此它具有對任意波形進(jìn)行編碼的能力;DM是對實際的采樣信號與預(yù)測的采樣信號之差的極性進(jìn)行編碼,將極性變成“0”和“1”這兩種可能的取值之一。 斜率過載,粒狀噪聲

3、壓縮的原因數(shù)據(jù)壓縮其實類似于美眉們的瘦身運動,數(shù)據(jù)壓縮其實類似于美眉們的瘦身運動,不外有兩大功用。不外有兩大功用。第一,可以節(jié)省空間。拿瘦身美眉來說,第一,可以節(jié)省空間。拿瘦身美眉來說,要是八個美眉可以擠進(jìn)一輛出租車?yán)?,要是八個美眉可以擠進(jìn)一輛出租車?yán)?,那該有多省錢啊!那該有多省錢??!第二,可以減少對帶寬的占用。第二,可以減少對帶寬的占用。 注:本課程部分內(nèi)容取自網(wǎng)絡(luò)上的王苯苯壓縮史,在此對作者表示感謝壓縮舉例最古老的壓縮之一 “班馬” “斑馬”?班固和司馬班固和司馬遷遷崇尚簡約的風(fēng)俗一直延續(xù)到了今天的 Internet 時代: 最現(xiàn)代的壓縮語言BS ATM 圖樣圖森破 不明覺歷ATM (Au

4、tomated Teller Machine) ATM意即異步傳輸模式(asynchronous transfer mode) 數(shù)據(jù)壓縮的起源-概率的認(rèn)識 當(dāng)我們對文字信息進(jìn)行編碼時,如果為出現(xiàn)概率較高的字母賦予較短的編碼,為出現(xiàn)概率較低的字母賦予較長的編碼,總的編碼長度就能縮短不少。著名的 Morse 電碼就已經(jīng)成功地實踐了這一準(zhǔn)則。在 Morse 碼表中,每個字母都對應(yīng)于一個唯一的點劃組合,出現(xiàn)概率最高的字母 e 被編碼為一個點“ . ”,而出現(xiàn)概率較低的字母 z 則被編碼為“ -. ”。顯然,這可以有效縮短最終的電碼長度。信息論之父 C. E. Shannon第一次用數(shù)學(xué)語言闡明了概率與

5、信息冗余度的關(guān)系。在 1948 年發(fā)表的論文“通信的數(shù)學(xué)理論( A Mathematical Theory of Communication )”中, Shannon 指出,任何信息都存在冗余,冗余大小與信息中每個符號(數(shù)字、字母或單詞)的出現(xiàn)概率或者說不確定性有關(guān)。信息熵Shannon 借鑒了熱力學(xué)的概念,把信息中排除了冗余后的平均信息量稱為“信息熵”,并給出了計算信息熵的數(shù)學(xué)表達(dá)式。這篇偉大的論文后來被譽為信息論的開山之作,信息熵也奠定了所有數(shù)據(jù)壓縮算法的理論基礎(chǔ)。從本質(zhì)上講,數(shù)據(jù)壓縮的目的就是要消除信息中的冗余,而信息熵及相關(guān)的定理恰恰用數(shù)學(xué)手段精確地描述了信息冗余的程度。利用信息熵公式

6、,人們可以計算出信息編碼的極限,即在一定的概率模型下,無損壓縮的編碼長度不可能小于信息熵公式給出的結(jié)果。D.A.Huffman 于 1952 年第一次發(fā)表了他的論文“最小冗余度代碼的構(gòu)造方法”(A Method for the Construction of Minimum Redundancy Codes)。從此,數(shù)據(jù)壓縮開始在商業(yè)程序中實現(xiàn)并被應(yīng)用在許多技術(shù)領(lǐng)域。在數(shù)據(jù)壓縮領(lǐng)域,Huffman 的這一論文事實上開創(chuàng)了數(shù)據(jù)壓縮技術(shù)一個值得回憶的時代,60 年代、70 年代乃至 80 年代的早期,數(shù)據(jù)壓縮領(lǐng)域幾乎一直被 Huffman 編碼及其分支所壟斷。(MIT的學(xué)生)算術(shù)編碼80 年代,數(shù)

7、學(xué)家們不滿足于 Huffman 編碼中的某些致命弱點,他們從新的角度入手,遵循 Huffman 編碼的主導(dǎo)思想,設(shè)計出另一種更為精確,更能接近信息論中“熵”極限的編碼方法算術(shù)編碼。憑借算術(shù)編碼的精妙設(shè)計和卓越表現(xiàn),算術(shù)編碼人們終于可以向著數(shù)據(jù)壓縮的極限前進(jìn)了??梢宰C明,算術(shù)編碼得到的壓縮效果可以最大地減小信息的冗余度,用最少量的符號精確表達(dá)原始信息內(nèi)容。當(dāng)然,算術(shù)編碼同時也給程序員和計算機(jī)帶來了新的挑戰(zhàn):要實現(xiàn)和運行算術(shù)編碼,需要更為艱苦的編程勞動和更加快速的計算機(jī)系統(tǒng)。也就是說,在同樣的計算機(jī)系統(tǒng)上,算術(shù)編碼雖然可以得到最好的壓縮效果,但卻要消耗也許幾十倍的計算時間。這就是為什么算術(shù)編碼不能

8、在我們?nèi)粘J褂玫膲嚎s工具中實現(xiàn)的主要原因。LZ算法直到 1977 年,數(shù)據(jù)壓縮的研究工作主要集中于熵、字符和單詞頻率以及統(tǒng)計模型等方面,研究者們一直在絞盡腦汁為使用 Huffman 編碼的程序找出更快、更好的改進(jìn)方法。1977 年,以色列人 Jacob Ziv 和 Abraham Lempel 發(fā)表了論文“順序數(shù)據(jù)壓縮的一個通用算法”(A Universal Alogrithem for Sequential Data Compression)。1978 年,他們發(fā)表了該論文的續(xù)篇“通過可變比率編碼的獨立序列的壓縮”(Compression of Individual Sequences vi

9、a Variable-Rate Coding)。在這兩篇論文中提出的兩個壓縮技術(shù)被稱為 LZ77 和 LZ78 (不知為什么,作者名字的首字母被倒置了)。簡單地說,這兩種壓縮方法的思路完全不同于從 Shannon 到 Huffman 到算術(shù)壓縮的傳統(tǒng)思路,人們將基于這一思路的編碼方法稱作“字典”式編碼。字典式編碼不但在壓縮效果上大大超過了 Huffman,而且,對于好的實現(xiàn),其壓縮和解壓縮的速度也異常驚人。LZW1984 年,Terry Welch 發(fā)表了名為“高性能數(shù)據(jù)壓縮技術(shù)”(A Technique for High-Performance Data Compression)的論文,他實

10、現(xiàn)了 LZ78 算法的一個變種 LZW。LZW 繼承了 LZ77 和 LZ78 壓縮效果好、速度快的優(yōu)點,而且在算法描述上更容易被人們接受,實現(xiàn)也比較簡單。ARJ和ZIP80 年代中期以后,人們對 LZ77 進(jìn)行了改進(jìn),隨之誕生了一批我們今天還在大量使用的壓縮程序。Haruyasu Yoshizaki(Yoshi) 的 LHarc 和 Robert Jung 的 ARJ 是其中兩個著名的例子。LZ77 得以和 LZ78、LZW 一起壟斷當(dāng)今的通用數(shù)據(jù)壓縮領(lǐng)域。目前,基于字典方式的壓縮已經(jīng)有了一個被廣泛認(rèn)可的標(biāo)準(zhǔn),從古老的 PKZip 到現(xiàn)在的 WinZip,特別是隨著 Internet 上文件

11、傳輸?shù)牧餍校琙IP 格式成為了事實上的標(biāo)準(zhǔn),沒有哪一種通用的文件壓縮、歸檔系統(tǒng)敢于不支持 ZIP 格式。有損壓縮對于生活中更加常見的,像素值在空間上連續(xù)變化的灰度或彩色圖像(比如數(shù)碼照片),通用壓縮算法的優(yōu)勢就不那么明顯了。幸運的是,科學(xué)家們發(fā)現(xiàn),如果在壓縮這一類圖像數(shù)據(jù)時允許改變一些不太重要的像素值,或者說允許損失一些精度。這一思想在數(shù)據(jù)壓縮領(lǐng)域具有革命性的地位:通過在用戶的忍耐范圍內(nèi)損失一些精度,我們可以把圖像(也包括音頻和視頻)壓縮到原大小的十分之一、百分之一甚至千分之一,這遠(yuǎn)遠(yuǎn)超出了通用壓縮算法的能力極限。也許,這和生活中常說的“退一步海闊天空”的道理有異曲同工之妙吧。 JPG在圖像壓

12、縮領(lǐng)域,著名的 JPEG 標(biāo)準(zhǔn)是有損壓縮算法中的經(jīng)典。 JPEG 標(biāo)準(zhǔn)由靜態(tài)圖像聯(lián)合專家組( Joint Photographic Experts Group , JPEG )于 1986 年開始制定, 1994 年后成為國際標(biāo)準(zhǔn)。 JPEG 以離散余弦變換( DCT )為核心算法,通過調(diào)整質(zhì)量系數(shù)控制圖像的精度和大小。對于照片等連續(xù)變化的灰度或彩色圖像, JPEG 在保證圖像質(zhì)量的前提下,一般可以將圖像壓縮到原大小的十分之一到二十分之一。JPEG2000JPEG 標(biāo)準(zhǔn)的最新進(jìn)展是 1996 年開始制定, 2001 年正式成為國際標(biāo)準(zhǔn)的 JPEG 2000 。與 JPEG 相比, JPEG 2

13、000 作了大幅改進(jìn),其中最重要的是用離散小波變換( DWT )替代了 JPEG 標(biāo)準(zhǔn)中的離散余弦變換。在文件大小相同的情況下, JPEG 2000 壓縮的圖像比 JPEG 質(zhì)量更高,精度損失更小。MPEG-1JPEG 標(biāo)準(zhǔn)中通過損失精度來換取壓縮效果的設(shè)計思想直接影響了視頻數(shù)據(jù)的壓縮技術(shù)。 CCITT 于 1988 年制定了電視電話和會議電視的 H.261 建議草案。 H.261 的基本思路是使用類似 JPEG 標(biāo)準(zhǔn)的算法壓縮視頻流中的每一幀圖像,同時采用運動補償?shù)膸g預(yù)測來消除視頻流在時間維度上的冗余信息。在此基礎(chǔ)上, 1993 年, ISO 通過了動態(tài)圖像專家組( Moving Pict

14、ure Experts Group , MPEG )提出的 MPEG-1 標(biāo)準(zhǔn)。 MPEG-1 可以對普通質(zhì)量的視頻數(shù)據(jù)進(jìn)行有效編碼。我們現(xiàn)在看到的大多數(shù) VCD 影碟,就是使用 MPEG-1 標(biāo)準(zhǔn)來壓縮視頻數(shù)據(jù)的。 MPEG-2為了支持更清晰的視頻圖像,特別是支持?jǐn)?shù)字電視等高端應(yīng)用, ISO 于 1994 年提出了新的 MPEG-2 標(biāo)準(zhǔn)(相當(dāng)于 CCITT 的 H.262 標(biāo)準(zhǔn))。 MPEG-2 對圖像質(zhì)量作了分級處理,可以適應(yīng)普通電視節(jié)目、會議電視、高清晰數(shù)字電視等不同質(zhì)量的視頻應(yīng)用。在我們的生活中,可以提供高清晰畫面的 DVD 影碟所采用的正是 MPEG-2 標(biāo)準(zhǔn)。 MPEG-4Int

15、ernet 的發(fā)展對視頻壓縮提出了更高的要求。在內(nèi)容交互、對象編輯、隨機(jī)存取等新需求的刺激下, ISO 于 1999 年通過了 MPEG-4 標(biāo)準(zhǔn)(相當(dāng)于 CCITT 的 H.263 和 H.263+ 標(biāo)準(zhǔn))。 MPEG-4 標(biāo)準(zhǔn)擁有更高的壓縮比率,支持并發(fā)數(shù)據(jù)流的編碼、基于內(nèi)容的交互操作、增強的時間域隨機(jī)存取、容錯、基于內(nèi)容的尺度可變性等先進(jìn)特性。 Internet 上新興的 DivX 和 XviD 文件格式就是采用 MPEG-4 標(biāo)準(zhǔn)來壓縮視頻數(shù)據(jù)的。H.264H.264,同時也是MPEG-4第十部分,是由ITU-T視頻編碼專家組(VCEG)和ISO/IEC動態(tài)圖像專家組(MPEG)聯(lián)合組

16、成的聯(lián)合視頻組(JVT,Joint Video Team)提出的高度壓縮數(shù)字視頻編解碼器標(biāo)準(zhǔn)。H.264是ITU-T以H.26x系列為名稱命名的標(biāo)準(zhǔn)之一,同時AVC是ISO/IEC MPEG一方的稱呼。這個標(biāo)準(zhǔn)通常被稱之為H.264/AVC(或者AVC/H.264或者H.264/MPEG-4 AVC或MPEG-4/H.264 AVC)而明確的說明它兩方面的開發(fā)者。 技術(shù)優(yōu)勢技術(shù)優(yōu)勢 H.264是在MPEG-4技術(shù)的基礎(chǔ)之上建立起來的,其編解碼流程主要包括5個部分:幀間和幀內(nèi)預(yù)測(Estimation)、變換(Transform)和反變換、量化(Quantization)和反量化、環(huán)路濾波(Lo

17、op Filter)、熵編碼(Entropy Coding)。H.264/MPEG-4 AVC(H.264)是1995年自MPEG-2視頻壓縮標(biāo)準(zhǔn)發(fā)布以后的新一代的視頻壓縮標(biāo)準(zhǔn)。通過該標(biāo)準(zhǔn),在同等圖象質(zhì)量下的壓縮效率比以前的標(biāo)準(zhǔn)(MPEG2)提高了2倍左右,因此,H.264被普遍認(rèn)為是最有影響力的行業(yè)標(biāo)準(zhǔn)。 聲音的壓縮自從 1939 年 H. Dudley 發(fā)明聲碼器以來,人們陸續(xù)發(fā)明了脈沖編碼調(diào)制( PCM )、線性預(yù)測( LPC )、矢量量化( VQ )、自適應(yīng)變換編碼( ATC )、子帶編碼( SBC )等語音分析與處理技術(shù)。這些語音技術(shù)在采集語音特征,獲取數(shù)字信號的同時,通常也可以起到

18、降低信息冗余度的作用。為獲得更高的編碼效率,大多數(shù)語音編碼技術(shù)都允許一定程度的精度損失。為了更好地用二進(jìn)制數(shù)據(jù)存儲或傳送語音信號,這些語音編碼技術(shù)在將語音信號轉(zhuǎn)換為數(shù)字信息之后又總會用 Huffman 編碼、算術(shù)編碼等通用壓縮算法進(jìn)一步減少數(shù)據(jù)流中的冗余信息。 MP3對于電腦和數(shù)字電器(如數(shù)碼錄音筆、數(shù)碼隨身聽)中存儲的普通音頻信息,我們最常使用的壓縮方法主要是 MPEG 系列中的音頻壓縮標(biāo)準(zhǔn)。例如, MPEG-1 標(biāo)準(zhǔn)提供了 Layer I 、 Layer II 和 Layer III 共三種可選的音頻壓縮標(biāo)準(zhǔn), MPEG-2 又進(jìn)一步引入了 AAC ( Advanced Audio Coding )音頻壓縮標(biāo)準(zhǔn), MPEG-4 標(biāo)準(zhǔn)中的音頻部分則同時支持合成聲音編碼和自然聲音編碼等不同類型的應(yīng)用。在這許多音頻壓縮標(biāo)準(zhǔn)中,聲名最為顯赫的恐怕要數(shù) MPEG-1 Layer III ,也就是我們常說的 MP3 音頻壓縮標(biāo)準(zhǔn)了。樂音的三個要素音高:頻率音長:長度音色:樂器不同的樂器,演奏相同的音符,那么他們的基準(zhǔn)頻率應(yīng)該相同音高:在樂音中,用音律來表示音高在上圖中,我們可以看到,樂音的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論