音頻編碼和解碼原理

上傳人：m*** IP屬地：天津上傳時間：2022-10-13 格式：DOCX 頁數(shù)：7 大?。?54.30KB 積分：15 舉報 版權(quán)申訴

已閱讀5頁，還剩2頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、每張CD光盤重放雙聲道立體聲信號可達(dá)74分鐘。VCD視盤機(jī)要同時重放聲音和圖像，圖像信號數(shù)據(jù)需要壓縮，其伴音信號數(shù)據(jù)也要壓縮，否則伴音信號難于存儲到VCD光盤中。一、伴音壓縮編碼原理伴音信號的結(jié)構(gòu)較圖像信號簡單一些。伴音信號的壓縮方法與圖像信號壓縮技術(shù)有相似性，也要從伴音信號中剔除冗余信息。人耳朵對音頻信號的聽覺靈敏度有其其規(guī)律性，對于不同頻段或不同聲壓級的伴音有其特殊的敏感特性。在伴音數(shù)據(jù)壓縮過程中，主要應(yīng)用了聽覺閾值及掩蔽效應(yīng)等聽覺心理特性。1、閾值和掩蔽效應(yīng)（1）閾值特性人耳朵對不同頻率的聲音具有不同的聽覺靈敏度，對低頻段（例如100Hz以下）和超高頻段（例如16KHZ以上）的聽覺靈敏度

2、較低，而在1K5KHZ的中音頻段時，聽覺靈敏度明顯提高。通常，將這種現(xiàn)象稱為人耳的閾值特性。若將這種聽覺特性用曲線表示出來，就稱為人耳的閾值特性曲線，閾值特性曲線反映該特性的數(shù)值界限。將曲線界限以下的聲音舍棄掉，對人耳的實際聽音效果沒有影響，這些聲音屬于冗余信息。在伴音壓縮編碼過程中，應(yīng)當(dāng)將閾值曲線以上的可聽頻段的聲音信號保留住，它是可聽頻段的主要成分，而那些聽覺不靈敏的頻段信號不易被察覺。應(yīng)當(dāng)保留強(qiáng)大的信號，忽略舍棄弱小的信號。經(jīng)過這樣處理的聲音，人耳在聽覺上幾乎察覺不到其失真。在實際伴音壓縮編碼過程中，也要對不同頻段的聲音數(shù)據(jù)進(jìn)行量化處理?？蓪θ硕幻舾蓄l段采用較粗的量化步長進(jìn)行量化，可舍

3、棄一些次要信息；而對人耳敏感頻段則采用較細(xì)小的量化步長，使用較多的碼位來傳送。（2）掩蔽效應(yīng)掩蔽效應(yīng)是人耳的另一個重要生理特征。如果在一段較窄的頻段上存在兩種聲音信號，當(dāng)一個強(qiáng)度大于另一個時，則人耳的聽覺閾值將提高，人耳朵可以聽到大音量的聲音信號，而其附近頻率小音量的聲音信號卻聽不到，好像是小音量信號被大音量信號掩蔽掉了。由于其它聲音信號存在而聽不到本聲音存在的現(xiàn)象，稱為掩蔽效應(yīng)。根據(jù)人耳的掩蔽特性，可將大音量附近的小音量信號舍棄掉，對實際聽音效果不會發(fā)生影響。既使保留這些小音量信號，人耳也聽不到它們的存在，它屬于伴音信號中的冗余信息。舍棄掉這些信號，可以進(jìn)一步壓縮伴音數(shù)據(jù)總量。經(jīng)仔細(xì)觀

4、察，掩蔽效應(yīng)分為兩大類，一類是同時掩蔽效應(yīng)，另一類是短時掩蔽效應(yīng)。其中，同時掩蔽效應(yīng) 是指同時存在一個弱信號和一個強(qiáng)信號，兩者頻率接近，強(qiáng)信號將提高弱信號的聽閾值，將弱信號的聽閾值提高到一定程度時，可使人耳聽不到弱信號。例如，同時出現(xiàn)A、B兩聲，若A聲的聽覺閾值為50dB，由于存在另一個不同頻率的B聲，將使A聲的閾值提高到6468dB，例如取68dB，那么數(shù)值（6850） dB=18dB，該值稱為掩蔽量。將強(qiáng)大的B聲稱為掩蔽聲，而較弱的A聲稱為被掩蔽聲。上述掩蔽現(xiàn)象說明，若僅有A聲時，其聲壓級50dB以上的聲音可以傳送出去，而50dB以下的聲音將聽不到；若同時出現(xiàn)B聲，B聲具有同時掩蔽

5、效應(yīng)，使得A聲在聲壓級68dB以下的聲音也聽不到了，即5068dB之間的A聲人耳也聽不到了，這些聲音不必傳送，即使傳送也聽不到，只須傳送聲壓級68dB以上的聲音?？?之，為了提高一個聲音的閾值，可以同時設(shè)置另一個聲音，使用這種辦法可以壓縮掉一部分聲音數(shù)據(jù)。在周圍十分安靜的環(huán)境下，人耳可以聽到聲壓級很低的各種頻率聲音，但對低頻聲和高頻聲的掩蔽閾值較高，即聽覺不靈敏。經(jīng)研究還發(fā)現(xiàn)，掩蔽聲越強(qiáng)，掩蔽作用越強(qiáng)；當(dāng)掩蔽聲與被掩蔽聲的頻率相差越小，掩蔽效果越明顯，兩者頻率相等時，掩蔽效果最佳；低頻聲（設(shè)為B）可有效地掩蔽高頻聲（設(shè)為A），而高頻聲（設(shè) 為B）幾乎不能掩蔽低頻聲（設(shè)為A）。因而輸入信

6、號時，在受掩蔽的頻帶內(nèi)加入更大的噪聲時，人耳也感覺不到與原始信號有所區(qū)別。上述的同時掩蔽效應(yīng)，又稱為頻域掩蔽效應(yīng)，它主要反映在頻域方面對掩蔽作用的影響。在聲音壓縮編碼中，更多地使用單頻聲音的掩蔽效應(yīng)。如果A聲和B聲不同時出現(xiàn)，也可發(fā)生掩蔽作用，稱它為短時掩蔽效應(yīng)。短時掩蔽又可分為兩種類型，作用仍可持續(xù)一段時間，即后向掩蔽和前向掩蔽。后向掩蔽是指掩蔽聲B消失后，其掩蔽作用仍可持續(xù)一段時間，一般可達(dá)0.52秒。掩蔽機(jī)理是人耳的存儲效應(yīng)所致。而前向掩蔽是指被掩蔽聲A出現(xiàn)一段時間后出現(xiàn)掩蔽聲B,只要A、B聲音隔不太大（一般在0.050.2秒以內(nèi)），B也可對A起掩蔽作用。掩蔽機(jī)理是A聲尚未被人耳感知

7、接受時，強(qiáng)大的B聲已來臨所致。在實踐中，后向掩蔽有較高的應(yīng)用價值。短時掩蔽效應(yīng)具有很強(qiáng)的時域結(jié)構(gòu)特性，故又稱為時域掩蔽效應(yīng)。在聲音壓縮編碼中，應(yīng)兼顧好人耳的頻域和時域兩種掩蔽效應(yīng)。2、子帶編碼原理（1）子帶編碼和解碼過程所謂子帶編碼技術(shù)，是將原始信號由時間域轉(zhuǎn)變?yōu)轭l率域，然后將其分割為若干個子頻帶，并對其分別進(jìn) 行數(shù)字編碼的技術(shù)。它是利用帶通濾波器（BPF）組把原始信號分割為若干（例如m個）子頻帶（簡稱子帶）。在接收端實現(xiàn)發(fā)送端的逆過程。輸入子帶編碼數(shù)據(jù)流，將各子帶信號分別送到相應(yīng)的數(shù)字解碼電路（共m個）進(jìn)行數(shù)字解調(diào)，經(jīng)過諸路低通濾波器（m路），并重新解調(diào)，可把各子帶頻域恢復(fù)為當(dāng)初原始信號的分

8、布狀態(tài)。最后，將各路子帶輸出信號送到同步相加器，經(jīng)過相加恢復(fù)為原始信號，該恢復(fù)的信號與原始信號十分相似。（2）子帶編碼的應(yīng)用子帶編碼技術(shù)具有突出的優(yōu)點。首先，聲音頻譜各頻率分量的幅度值各不相同，若對不同子帶分配以合適的比例系數(shù)，可以更合理地分別控制各子帶的量化電平數(shù)目和相應(yīng)的重建誤差，使碼率更精確地與各子帶的信號源特性相匹配。通常，在低頻基音附近，采用較大的比特數(shù)目來表示取樣值，而在高頻段則可分配以較小的編碼比特。其次，通過合理分配不同子帶的比特數(shù)，可控制總的重建誤差頻譜形狀，通過與聲學(xué)心理模型相結(jié)合，可將噪聲頻譜按人耳主觀噪聲感知特性來形成。于是，利用人耳聽覺掩蔽效應(yīng)可節(jié)省大量比特數(shù)。在采用

9、子帶編碼時，利用了聽覺的掩蔽效應(yīng)進(jìn)行處理。它對一些子帶信號予以刪除或大量減少比特數(shù)目，可明顯壓縮傳輸數(shù)據(jù)總量。比如，不存在信號頻率分量的子帶，被噪聲掩蔽的信號頻率的子帶，被鄰近強(qiáng)信號掩蔽的信號頻率分量子帶等，都可進(jìn)行刪除處理。另外，全系統(tǒng)的傳輸信息量與信號的頻帶范圍、動態(tài)范圍等均有關(guān)系，而動態(tài)范圍則決定于量化比特數(shù)，若對信號引入合理的比特數(shù)，可使不同子帶內(nèi)按需要給以不同的比特數(shù)，也可壓縮其信息量。二、MPEG-1音頻編碼方框圖1、MPEG-1音頻編碼的依據(jù)MPEG-1音頻壓縮編碼標(biāo)準(zhǔn)采用了心理學(xué)算法。利用感知模型刪去那些聽覺不靈敏的聲音數(shù)據(jù)，而使重建的聲音質(zhì)量無明顯下降。它采用子帶編碼技術(shù)，

10、根據(jù)心理聲學(xué)模型取得不同子帶的聽覺掩蔽閾值；對各子帶的取樣值進(jìn)行動態(tài)量化。它根據(jù)不同頻段上大音量信號所引起的小音量信號掩蔽閾值的變化規(guī)律，對不同頻段給以不同的量化步長，以便保留主要信號，而舍棄對聽覺效果影響很小的成分，經(jīng)過數(shù)據(jù)壓縮，可取得合理的比特流，將原來大約1.5Mbit/s的聲音傳輸碼率減少到0.3Mbit/s，即壓縮率可達(dá)到1/5。2、編碼流程圖2.3.2是基于MUSICAM(掩蔽模式通用子帶編碼和多路復(fù)用)的MPEG-1音頻壓縮編碼方框圖。輸入信號是經(jīng)過取樣的二進(jìn)制PCM數(shù)字音頻信號，取樣頻率可以取44.1KHz、48KHz或32KHz，該音頻數(shù)碼信號的碼值與原來采樣信號的幅

11、度、頻率成正比。數(shù)字音頻信號首先進(jìn)入數(shù)字濾波器組，它被分成等帶寬的32個子頻帶，可由數(shù)字濾波器輸出32個子帶數(shù) 據(jù)信號。這種處理方法與圖像編碼信號進(jìn)行DCT變換的作用相似，但不是像圖像信號那樣分為64種余弦頻率信息，這里僅分成32個子帶，即將音頻數(shù)據(jù)流改為32種頻率的組合。聲音的分解力低于圖像，這種處理方法是可行的。然后，對32個子帶的伴音數(shù)據(jù)進(jìn)行再量化，以便再壓縮數(shù)據(jù)量。對于各個子頻帶的量化步長不相同，量化步長是根據(jù)人耳的聽覺閾值和掩蔽效應(yīng)而確定的。經(jīng)過量化處理的已壓縮數(shù)據(jù)，保留了伴音信息的主體部分，而舍棄了聽覺效果影響較小的伴音信息。進(jìn)入編碼系統(tǒng)的輸入信號，分流部分信號送到并列的1

12、024點快速傅利葉變換器(FFT)進(jìn)行變換，它檢測輸入信號每一個瞬間取樣點在主頻譜分量頻域的分布的強(qiáng)度，經(jīng)變換的信號送到心理聲學(xué)模型控制單元。根據(jù)聽覺心理聲學(xué)測量統(tǒng)計結(jié)果，可以歸納出一個心理聲學(xué)控制對照表格，并按照此表格制成控制單元，而單元電路可以集中地反映出人耳的閾值特性和掩蔽特性。經(jīng)過量化的32個子頻帶數(shù)據(jù)已經(jīng)被壓縮，還要加上比例因子、位分配信息等輔助信息，共同加到1位流格式化單元，編碼成為兩個層次的伴音編碼信號。它既含有32個子頻帶的伴音數(shù)碼，又帶有這些數(shù)碼所對應(yīng)的位分配數(shù)據(jù)和不同頻帶數(shù)據(jù)的強(qiáng)弱比例因子。待將來數(shù)據(jù)解碼時，可根據(jù)各子頻帶的數(shù)據(jù)恢復(fù)聲音信號，以及壓縮時碼位分配和強(qiáng)弱比例情況

13、，在進(jìn)行反量化時，參照壓縮時的程序進(jìn)行還原?？梢姡橐舻膲嚎s編碼和圖像處理一樣，也要經(jīng)過變換、量化、碼位壓縮等處理過程，它運用了許多數(shù)學(xué)模型和心理聽覺測量的統(tǒng)計數(shù)據(jù)，對32個子頻帶和各個層次信號的處理也各有不相同的取樣速率。實際的心理聽覺模型和適時處理控制過程十分復(fù)雜。這些算法細(xì)節(jié)都已按硬件方式被固化在解碼芯片中，這些內(nèi)容不能再改變。3、伴音與圖像的同步圖像和聲音信號的壓縮方法有許多不同，圖像數(shù)據(jù)量又遠(yuǎn)遠(yuǎn)大于聲音數(shù)據(jù)量，兩者傳送的數(shù)據(jù)碼率大不相同。每傳送1415個視頻數(shù)據(jù)包才傳送1個音頻數(shù)據(jù)包，而播放聲音和圖像的內(nèi)容又必須作到良好同步，否則將無法保證視聽統(tǒng)一的效果。為了作到聲圖同步，MPE

14、G-1采用了獨立的系統(tǒng)時鐘（簡稱為STC）作為編碼的參照基準(zhǔn)，并將圖像和聲音的數(shù)據(jù)分為許多播放單元。例如，將圖像分為若干幀，將聲音分為若干段落。在數(shù)據(jù)編碼時，在每個播放單元前面加置一個展示時標(biāo)（PTS），或者加置一個解碼時標(biāo)（DTS）。當(dāng)這些時標(biāo)出現(xiàn)時，表示前一個播放單元已經(jīng)結(jié)束，一個新的圖像和聲音播放單元立即開始。在播放相互對應(yīng)的同一圖像單元和聲音單元時，可實現(xiàn)互相同步。為了使整個系統(tǒng)在時鐘在編碼和重放時，聲圖有共同的時鐘基準(zhǔn)，又引入系統(tǒng)參考時鐘SCR的概念。系統(tǒng)參考時鐘是一個實時時鐘，其數(shù)值代表聲圖的實際播放時間，用它作為參照基準(zhǔn)，以保證聲圖信號的傳輸時間保持一致。實時時鐘SCR必須與生活

15、中的真實時間一致，要求它的準(zhǔn)確度很高，否則可能發(fā)生聲音和圖像都播快或播慢的現(xiàn)象。為了使SCR時間基準(zhǔn)穩(wěn)定、準(zhǔn)確，MPEG-1采用了系統(tǒng)時鐘頻率SCF，以它作為定時信息的參照基礎(chǔ)。SCF系統(tǒng)時鐘的頻率是90KHz，頻率誤差為90KHz4.5KHz。聲圖信號以SCF為統(tǒng)一的基準(zhǔn)，其它定時信號SCR、PTS、DTS也是以它為基礎(chǔ)。三、其它MPEG標(biāo)準(zhǔn)的音頻編碼器1、MPEG-2音頻編碼方框圖MPEG-1是處理雙聲道立體聲信號，而MPEG-2是處理5聲道（或7聲道）環(huán)繞立體聲信號，它的重放效果更加逼真。圖2.3.3是MPEG-2音頻編碼方框圖。它輸入互相獨立的5聲道音頻信號，有前置左、右主聲道（L、R

16、），前置中央聲道（C），還有后置左、右環(huán)繞聲道（LS、RS）。各聲源經(jīng)過模一數(shù)轉(zhuǎn)化后，首先進(jìn)入子帶濾波器，每一聲道都要分割為32個子頻帶，各子帶的帶寬均為750Hz。為了兼容MPEG-1、普通雙聲道立體聲和環(huán)繞模擬立體聲等編碼方式，原來按MPEG-1編碼的立體聲道能夠擴(kuò)展為多聲道，應(yīng)當(dāng)包括所有5聲道的信息，為此設(shè)置了矩陣變換電路。該電路可生成兼容的傳統(tǒng)立體聲信號LO、RO,還有經(jīng)過加重”的左、中、右、左環(huán)繞、右環(huán)繞聲音信號（共5路）。對5路環(huán)繞立體聲信號進(jìn)行加重”處理的原因：當(dāng)計算兼容的立體聲信號（LO、RO）時，為了防止過載，已在編碼前對所有信號進(jìn)行了衰減，經(jīng)加重處理可以去失真；另外，矩陣轉(zhuǎn)

17、變中也包含了衰減因子和類似相移的處理。編碼器原始信號是5路，輸入通道是5個，經(jīng)過矩陣轉(zhuǎn)化處理后產(chǎn)生了7種聲音信號。應(yīng)當(dāng)設(shè)置通道選擇電路，它能夠根據(jù)需要，對7路信號進(jìn)行合理的選擇處理。該處理過程決定于解矩陣的過程，以及傳輸通道的分配信息；合理的通道選擇，有利于減弱人為噪聲加工而引起的噪聲干擾。此外，還設(shè)置了多聲道預(yù)測計算電路，用于減少各通道間冗余度。在進(jìn)行多聲道預(yù)測時，在傳輸通道內(nèi)的兼容信號LO、RO,可由MPEG-1數(shù)據(jù)計算出來。根據(jù)人耳生理聲學(xué)基子帶+，濾波器。子帶W 濾波器4于帶- 濾波器卜濾波器甘一預(yù)重化Q心理聲學(xué)卜模型Q通道選擇卜.預(yù)量化2濾波器卜預(yù)童化/通道轉(zhuǎn)換編碼。取樣值匕尤例

18、因t 子帶+，濾波器。子帶W 濾波器4于帶- 濾波器卜濾波器甘一預(yù)重化Q心理聲學(xué)卜模型Q通道選擇卜.預(yù)量化2濾波器卜預(yù)童化/通道轉(zhuǎn)換編碼。取樣值匕尤例因t 比特# 萍配數(shù)+動態(tài) 竺為容,道*動態(tài)時串活槿式預(yù)測信息預(yù)測選擇復(fù)接幀模塊,MPEG-2比特蒲礎(chǔ)，后級設(shè)置了動態(tài)串話電路，可在給定比特的情況下提高聲音質(zhì)量，或在要求聲音質(zhì)量的前提下降低比特率。但設(shè)置該電路增加了 MPEG-2解碼器的復(fù)雜程度。經(jīng)過編碼器產(chǎn)生了多種信息，主要有編碼取樣值，比例因子，比特分配數(shù)據(jù)，動態(tài)串話模式，多聲道預(yù)測信息，通道預(yù)測選擇信號等，諸信息傳遞給復(fù)接成幀模塊電路，最后以MPEG-2比特流形式輸出壓縮編碼信號。

19、MPEG-2解碼器基本上是編碼器的逆過程，其電路結(jié)構(gòu)簡單一些，運算量小一些。解碼器的解碼轉(zhuǎn)換矩陣可輸出5路信號，再經(jīng)過32分頻子帶濾波器處理，可輸出LS、L、C、R、RS信號；另外，經(jīng)過量化、SCF和子帶濾波器處理后，還可以取得前置立體聲LO、RO,共計可輸出7路音頻信號。2、MPEG-4音頻解碼MPEG-4音頻編碼和MPEG-4視頻編碼一樣，具有許多特點和功能，例如可分級性，有限時間音頻流，音頻變化/時間尺度變化，可編輯性，延遲性等。它具優(yōu)越的交互性能和高壓縮比。它不僅利用分級方法可對語言和音樂進(jìn)行編輯，也能解決合成語言和音樂問題，它將成為多媒體世界的一個主要格式，將成為全能”的系統(tǒng)。通過M

20、PEG-4音頻編碼，可以存儲、傳送多種音頻內(nèi)容。它具有高質(zhì)量的音頻信號（單聲道、立體聲和多通道）。它采用低碼率編碼，而聲音重放質(zhì)量很高。它可以傳送寬帶語言信號（例如7KHz寬的語音），也可傳送窄帶寬語言信號（例如長途電話）。可以傳輸、制作可理解的各種語音信號?？梢院铣烧Z言，例如進(jìn)行音素或其它記號為基礎(chǔ)的文本轉(zhuǎn)換；也可以合成音頻，例如支持音樂描述語言。四、杜比AC-3技術(shù)1、什么是杜比AC-3在杜比定向邏輯環(huán)繞聲技術(shù)的基礎(chǔ)上，于1990年杜比公司與日本先鋒公司合作，采用先進(jìn)的數(shù)位壓縮技術(shù)，推出新穎的全數(shù)字化杜比數(shù)碼環(huán)繞聲系統(tǒng)。它可使多聲道信號有更多的信息被壓縮到雙聲道中去，并將這種系統(tǒng)稱為AC-

21、3。AC是英語音頻感覺編碼系統(tǒng)的縮寫詞。AC-3技術(shù)首先應(yīng)用到電影院，后來又進(jìn)入普通家庭。杜比AC-3系統(tǒng)設(shè)置完全獨立的6個聲道，即全頻帶的左、中、右、左環(huán)繞和右環(huán)繞聲道，再加上一個超重低音聲道。由于這樣聲道的結(jié)構(gòu)，AC-3系統(tǒng)又稱為5.1聲道。2、杜比AC-3的基本原理（1）應(yīng)用聽覺掩蔽效應(yīng)開發(fā)出自適應(yīng)編碼系統(tǒng)AC-3技術(shù)的理論基礎(chǔ)，也是利用心理聲學(xué)中的聽覺閾值和掩蔽效應(yīng)，但具體技術(shù)上與MPEG標(biāo)準(zhǔn)又有所不同。對音頻信號進(jìn)行數(shù)據(jù)處理時，都要進(jìn)行數(shù)據(jù)壓縮，將沒有用途或用途不大的數(shù)據(jù)信息忽略掉。為此，可以應(yīng)用聽覺閾值和掩蔽規(guī)律，省略掉那些多余的數(shù)據(jù)信息。杜比公司除運用上述聲學(xué)原理外，還運用了它

22、擁有的杜比降噪技術(shù)，開發(fā)出數(shù)碼化的“自適應(yīng)編碼系統(tǒng)。這是一種極具選擇性和抑制噪聲能力的自適應(yīng)編碼體系。杜比公司依據(jù)音響心理學(xué)的基本原理，在未輸入音樂信號時，保持寧靜狀態(tài)；當(dāng)輸入音樂信號時，對復(fù)雜的音頻信號進(jìn)行分析和分解，用較強(qiáng)信號掩蔽噪聲，刪除聽覺界限以外，或由于頻率相近而音量小的信號，經(jīng)過這種處理方法，可以大大減少需要處理的數(shù)據(jù)信息。人耳的聽覺范圍是20Hz-20KHz，在如此寬闊的頻帶范圍內(nèi)，人耳對不同頻率的聽覺靈敏度具有極大的差異。杜比AC-3根據(jù)這個特性，將各聲道的音響頻道劃分為許多大小不等的狹窄頻帶，各個子頻帶與人耳臨界頻帶的寬度相接近，保留有效的音頻，將不同的噪聲頻率

23、緊跟每個聲道信號進(jìn)行編碼，即編碼噪聲只能存在于編碼音頻信號的頻帶內(nèi)。這樣能夠更陡峭地濾除掉編碼噪聲，將頻帶內(nèi)多余信號和無音頻信號的編碼噪聲降低或除掉，而將有用的音頻信號保留下來AC-3系統(tǒng)精確地運用了掩蔽效應(yīng)和公用位元群的設(shè)計方法，使數(shù)據(jù)壓縮效率大大提高，且具有很高水平的音質(zhì)。該系統(tǒng)的比特率是根據(jù)個別頻譜的需要，或者音源的動態(tài)狀況，再分配到每個窄頻段，它設(shè)計了內(nèi)置的聽覺掩蓋程序，可讓編碼器改變其頻率靈敏度和時間分解力，以確保有充足的比特被采用，掩蓋掉噪聲，而良好地記錄音樂信號。為了高效地利用有限的信息傳輸介質(zhì)（光盤、膠片等），它在壓縮音頻信號時與其它壓縮系統(tǒng)一樣，利用人耳的聽覺特性

24、，根據(jù)當(dāng)時的具體情況，將某些聲道的系數(shù)合并（這些聲道系數(shù)反映了那個頻帶的能量大?。?，以便提高壓縮率。并不是所有聲道都能進(jìn)行這種合并。編碼器可根據(jù)各聲道的信息特征自動決定和調(diào)整，只有相似的聲道才能混合在一起，若壓縮比不要求很高時也不必合并。一般情況下，合并的起始頻率越高，音質(zhì)就越好，但要求數(shù)據(jù)傳輸速率也越高。當(dāng)取樣頻率為48KHz時，合并的起始頻率應(yīng)為3.42MHz；若取樣頻率為44.1KHz時，起始頻率應(yīng)為3.14MHz。若硬件和軟件搭配適當(dāng)，AC-3的音質(zhì)可達(dá)到或接近 CD唱片的水平。（2）杜比AC-3解碼器簡易方框圖AC-3解碼器輸入信號是一組頻譜信號，它是由時域信號PCM數(shù)據(jù)經(jīng)過

25、時一頻變換而得到。該頻譜數(shù)據(jù)流分為指數(shù)部和尾數(shù)部兩部分，指數(shù)部分采用差分方式進(jìn)行編碼，編碼后的指數(shù)代表了整個信號的頻譜，可作為頻譜包絡(luò)的參數(shù)。其尾數(shù)部分按照比特分配的結(jié)果進(jìn)行量化。于是，量化尾數(shù)和頻譜包絡(luò)形成了 AC-3碼流的主要信息，連同其它輔助信號（例如比特分配等）構(gòu)成了 AC-3比特流。圖2.3.4是AC-3系統(tǒng)的解碼方框圖，它是AC-3編碼的逆過程。AC-3比特流首先進(jìn)入緩沖級，然后以幀為處理單元進(jìn)行誤碼糾錯，經(jīng)糾錯處理后對比特流中的固定數(shù)據(jù)（指數(shù)數(shù)據(jù)、匹配系數(shù)、模式符號等）解碼，使數(shù)據(jù)比特流恢復(fù)為原來的比特分配。然后，數(shù)據(jù)信號分為兩路。其中一路，將比特流恢復(fù)為原來的比特分配之后，確

26、定尾數(shù)部量化的大小，再對比特流中的可變數(shù)據(jù)解碼；再接著恢復(fù)高頻成分，為反頻率變換做好準(zhǔn)備。最后，將指數(shù)部數(shù)據(jù)和尾數(shù)部數(shù)據(jù)匯合，變換為固定小數(shù)點數(shù)據(jù)，再對它進(jìn)行頻率變換，以獲得時間軸數(shù)據(jù)。已經(jīng)恢復(fù)為時域的數(shù)據(jù)信號需進(jìn)行窗處理，進(jìn)行重疊加算，即可得到5.1環(huán)繞聲道的輸出信號。3、杜比AC-3的特點(1)配置5.1聲道將輸入的音頻信號解碼后，可以輸出5.1聲道信號，其中有3個前置聲道(L、C、R),還有2個后置環(huán)繞聲道(LS、RS)，它們互相獨立，頻響寬度都是全聲頻域，即20Hz 20KHz(0.5dB)及3Hz 20.3KHz(-3dB),各頻道的頻響十分寬闊。目前，廣泛應(yīng)用于音響系統(tǒng)的杜比定向邏輯環(huán)繞聲系統(tǒng)，無法和杜比A

人人文庫> 全部分類> 圖紙下載 > 畢業(yè)設(shè)計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

音頻編碼和解碼原理

文檔簡介

溫馨提示

最新文檔

評論

音頻編碼和解碼原理

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔