音頻壓縮編碼原理及標(biāo)準(zhǔn)

上傳人：6*** IP屬地：湖北上傳時(shí)間：2022-05-18 格式：PPT 頁(yè)數(shù)：67 大小：3.25MB 積分：28 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩62頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、音頻壓縮編碼的基本原理MPEG-1音頻壓縮編碼標(biāo)準(zhǔn)杜比AC-3音頻壓縮算法MPEG-2音頻壓縮編碼標(biāo)準(zhǔn)MPEG-4音頻壓縮編碼標(biāo)準(zhǔn)按照對(duì)聲音質(zhì)量的要求不同以及使用頻帶的寬窄按照對(duì)聲音質(zhì)量的要求不同以及使用頻帶的寬窄，將音頻信號(hào)分為以下，將音頻信號(hào)分為以下4類：類：窄帶語(yǔ)音：又稱電話頻帶語(yǔ)音，窄帶語(yǔ)音：又稱電話頻帶語(yǔ)音，300-3400Hz，用，用于各類電話通信，數(shù)字化時(shí)采樣頻率常用于各類電話通信，數(shù)字化時(shí)采樣頻率常用8kHz。寬帶語(yǔ)音：用于電話會(huì)議，視頻會(huì)議，寬帶語(yǔ)音：用于電話會(huì)議，視頻會(huì)議，50-7000Hz ，數(shù)字化時(shí)采樣頻率常用，數(shù)字化時(shí)采樣頻率常用16kHz。數(shù)字音頻廣播：數(shù)字音頻廣播

2、：20-15000Hz，數(shù)字化時(shí)采樣頻率，數(shù)字化時(shí)采樣頻率常用常用32kHz。高保真立體聲音頻信號(hào)：高保真立體聲音頻信號(hào)：20-20KHz，用于，用于VCD、DVD、CD等，數(shù)字化時(shí)采樣頻率常用等，數(shù)字化時(shí)采樣頻率常用44.1kHz 或或48kHz。巨大的數(shù)據(jù)量給存儲(chǔ)和傳輸帶來(lái)的壓力CD唱片F(xiàn)s=44.1KHz 量化精度 16bit 雙聲道數(shù)碼率？1.41Mbit/s1S信號(hào)所需存儲(chǔ)空間？176.4KB3.1 音頻壓縮編碼的基本原理音頻壓縮編碼的基本原理數(shù)字音頻信號(hào)中存在著大量冗余數(shù)字音頻信號(hào)中存在著大量冗余頻域冗余：頻域冗余：1. 低頻成分比高頻成分多低頻成分比高頻成分多2. 語(yǔ)音信號(hào)的共振

3、峰語(yǔ)音信號(hào)的共振峰時(shí)域冗余：時(shí)域冗余：1.小幅度樣本比大幅度樣值出現(xiàn)的概率大。小幅度樣本比大幅度樣值出現(xiàn)的概率大。2.相鄰樣值間的相關(guān)性相鄰樣值間的相關(guān)性3.信號(hào)周期的相關(guān)性信號(hào)周期的相關(guān)性4.長(zhǎng)時(shí)自相關(guān)長(zhǎng)時(shí)自相關(guān)5.話音間隙冗余話音間隙冗余聽(tīng)覺(jué)冗余：聽(tīng)覺(jué)冗余：利用人耳的感知特性，將聽(tīng)不到的信號(hào)壓縮掉。利用人耳的感知特性，將聽(tīng)不到的信號(hào)壓縮掉。聲音信號(hào)的頻率范圍？ 20Hz-20KHz聲音頻譜的特點(diǎn): 高頻段快速下降，高幅值大部分集中在中頻段，有的延伸到低頻段電平分布特點(diǎn)：聲音信號(hào)的電平存在冗余一個(gè)較弱的聲音（被掩蔽音）的聽(tīng)覺(jué)感受被另一個(gè)較強(qiáng)的聲音（掩蔽音）影響掩蔽量與掩蔽聲具有的聲壓級(jí)成

4、正比掩蔽量與掩蔽聲具有的聲壓級(jí)成正比掩蔽聲的聲壓級(jí)越高、掩蔽的頻率范圍隨之加寬掩蔽聲的聲壓級(jí)越高、掩蔽的頻率范圍隨之加寬被掩蔽聲的頻率越接近掩蔽聲，掩蔽效應(yīng)越顯著、掩蔽被掩蔽聲的頻率越接近掩蔽聲，掩蔽效應(yīng)越顯著、掩蔽量增大量增大掩蔽聲對(duì)于低于掩蔽聲頻率的聲音掩蔽效果弱，對(duì)于高掩蔽聲對(duì)于低于掩蔽聲頻率的聲音掩蔽效果弱，對(duì)于高于掩蔽聲頻率的聲音掩蔽效果顯著。于掩蔽聲頻率的聲音掩蔽效果顯著。利用聲音的掩蔽效應(yīng)，可以用有用的信號(hào)去掩蔽無(wú)用的信號(hào)只需把無(wú)用信號(hào)的聲壓級(jí)降至掩蔽域之下即可，無(wú)需消除無(wú)用分量人耳聽(tīng)力系統(tǒng) 帶通濾波器對(duì)某頻率的聲音信號(hào)的拾取會(huì)采用中心頻率接近此頻率對(duì)某頻率的聲音信號(hào)的拾取會(huì)采

5、用中心頻率接近此頻率的帶通濾波器，因此，只有通過(guò)該帶通濾波器的那部分的帶通濾波器，因此，只有通過(guò)該帶通濾波器的那部分噪聲才會(huì)對(duì)該信號(hào)產(chǎn)生影響噪聲才會(huì)對(duì)該信號(hào)產(chǎn)生影響臨界帶寬描述人耳的濾波特性如果在一頻帶內(nèi)噪聲的功率等于該純音的功率，且這時(shí)，如果在一頻帶內(nèi)噪聲的功率等于該純音的功率，且這時(shí)，純音剛好能被聽(tīng)到（臨界狀態(tài)），此純音附近的窄帶噪純音剛好能被聽(tīng)到（臨界狀態(tài)），此純音附近的窄帶噪聲帶寬的寬度便稱為臨界帶寬聲帶寬的寬度便稱為臨界帶寬通常認(rèn)為通常認(rèn)為20Hz20KHz內(nèi)有內(nèi)有24個(gè)臨界頻帶個(gè)臨界頻帶窄帶噪聲的掩蔽效應(yīng)要明顯于純音窄帶噪聲的掩蔽效應(yīng)要明顯于純音聲壓級(jí)較低時(shí)，掩蔽僅局限于中心頻率附

6、近較窄的頻率范圍聲壓級(jí)較低時(shí)，掩蔽僅局限于中心頻率附近較窄的頻率范圍隨著聲壓級(jí)的提高，掩蔽區(qū)的頻率范圍加寬隨著聲壓級(jí)的提高，掩蔽區(qū)的頻率范圍加寬隨著聲壓級(jí)的提高，對(duì)高于中心頻率的聲音掩蔽作用加強(qiáng)隨著聲壓級(jí)的提高，對(duì)高于中心頻率的聲音掩蔽作用加強(qiáng)時(shí)域掩蔽前向掩蔽：前向掩蔽：20ms，由于人耳的積累效應(yīng)，被掩蔽聲尚未，由于人耳的積累效應(yīng)，被掩蔽聲尚未被聽(tīng)到，掩蔽聲已經(jīng)出現(xiàn)，其掩蔽效果很差被聽(tīng)到，掩蔽聲已經(jīng)出現(xiàn)，其掩蔽效果很差后向掩蔽：后向掩蔽：100ms，由于人耳的存儲(chǔ)效應(yīng)，掩蔽聲雖已，由于人耳的存儲(chǔ)效應(yīng)，掩蔽聲雖已消失，掩蔽效應(yīng)仍然存在。消失，掩蔽效應(yīng)仍然存在。生理聲學(xué)研究聽(tīng)覺(jué)器官的構(gòu)造和聽(tīng)音機(jī)

7、理心理聲學(xué)研究聽(tīng)覺(jué)心理，研究主觀量與客觀量之間的關(guān)系。心理聲學(xué)模型中一個(gè)基本概念：聽(tīng)覺(jué)系統(tǒng)中存在一個(gè)聽(tīng)覺(jué)閾值電平，低于這個(gè)電平的音頻信號(hào)就聽(tīng)不到，因此就可以把這部分信號(hào)忽略掉，無(wú)需對(duì)它進(jìn)行編碼，而不影響聽(tīng)覺(jué)效果心理聲學(xué)模型要完成掩蔽閾值的估算，輸出信號(hào)-掩蔽比率（SMR）利用人耳的聽(tīng)覺(jué)感知特性，使用心理聲學(xué)模型，將人耳不能感知的聲音成分去掉，只保留人耳能感知的聲音成分。不為追求最小的量化噪聲，只要量化噪聲不被人耳感知即可。感知音頻編碼（感知音頻編碼（MPEG）原理）原理音頻編解碼器的性能指標(biāo)：重建的音頻質(zhì)量、數(shù)碼率、復(fù)雜度和時(shí)延。研究的基本問(wèn)題是：更好的音頻質(zhì)量，并盡可能小的編解碼時(shí)延和

8、算法復(fù)雜度；降低數(shù)碼率。重建音頻質(zhì)量的評(píng)價(jià)方法有客觀評(píng)價(jià)和主觀評(píng)價(jià)。分類方法一：時(shí)域編碼利用聲音信號(hào)在時(shí)間域內(nèi)幅度變化經(jīng)PAM后形成的樣本值，對(duì)不同樣本值實(shí)現(xiàn)二進(jìn)制碼替代，從而形成數(shù)據(jù)碼流頻域編碼將時(shí)域中的聲音信號(hào)進(jìn)行頻率變換，結(jié)合聲音的相關(guān)性及人的感知，選取量化比特?cái)?shù)進(jìn)行編碼統(tǒng)計(jì)編碼依據(jù)各個(gè)信號(hào)幅值出現(xiàn)的概率不同進(jìn)行概率匹配編碼音頻壓縮編碼的方法音頻壓縮編碼的方法分類方法二：波形編碼對(duì)音頻信號(hào)的時(shí)域或頻域波形采樣值進(jìn)行編碼。主要利用音頻樣值的幅度分布規(guī)律和相鄰樣值間的相關(guān)性進(jìn)行壓縮。參數(shù)編碼根據(jù)聲音形成機(jī)理的分析，以重建語(yǔ)音信號(hào)具有足夠可懂度的原則上，通過(guò)建立語(yǔ)音信號(hào)的產(chǎn)生模型，

9、提取代表語(yǔ)音信號(hào)特征的參數(shù)進(jìn)行編碼混合編碼上述兩種編碼的混合音頻壓縮編碼的方法音頻壓縮編碼的方法結(jié)合聲音幅度的出現(xiàn)概率來(lái)選取量化比特?cái)?shù)進(jìn)行編碼，在滿足一定的量化噪聲下壓縮數(shù)碼率，從而降低比特率。時(shí)域編碼時(shí)域編碼利用人耳聽(tīng)覺(jué)的聲掩蔽特性，在滿足一定量化噪聲下來(lái)壓縮碼率采用濾波和變化，在頻域內(nèi)將其能量較小的分量忽略，從而實(shí)現(xiàn)降低比特率頻域編碼頻域編碼子帶編碼：通過(guò)帶通濾波器分成許多頻帶子帶，分析每個(gè)子帶取樣的能量，依據(jù)心理聲學(xué)模型來(lái)編碼變換編碼：變換到頻域，根據(jù)心理聲學(xué)模型對(duì)變換系數(shù)進(jìn)行量化和編碼首先用一組帶通濾波器把輸入的音頻信號(hào)分成若干個(gè)連續(xù)的子帶，然后對(duì)每個(gè)子帶中的音頻信號(hào)單獨(dú)編碼，在接收

10、端將各子帶單獨(dú)譯碼，然后組合、還原成音頻信號(hào)。對(duì)每個(gè)子帶的采樣值分配不同的比特?cái)?shù)。低頻分配較多量化比特，高頻分配較少量化比特。利用聲音信號(hào)的頻譜特點(diǎn)及人耳的感知模型。聲音信號(hào)從時(shí)域變?yōu)轭l域，用頻率分量形式表示原信號(hào)，再對(duì)其頻譜系數(shù)進(jìn)行量化編碼量化編碼過(guò)程中，利用心理聲學(xué)模型，對(duì)頻譜系數(shù)進(jìn)行優(yōu)化，來(lái)實(shí)現(xiàn)對(duì)音頻數(shù)據(jù)進(jìn)行有效的壓縮時(shí)頻變化的方法：離散余弦變換DCT 、改進(jìn)的離散余弦變換MDCT離散余弦變換（DCT）時(shí)頻變換（DFT）變換時(shí)將PCM樣值分為N長(zhǎng)的一塊塊進(jìn)行變換塊長(zhǎng)：一塊中包含的樣本數(shù)N 窗長(zhǎng)：N （1/Fs）頻率分辨率：Fs/N 頻率軸上的所能得到的最小頻率間隔塊越長(zhǎng)，變化編

11、碼的頻率分辨率越高，但損失了時(shí)域分辨率塊越長(zhǎng)，變化編碼的頻率分辨率越高，但損失了時(shí)域分辨率逆變換逆變換離散余弦變換（DCT）將原信號(hào)沿負(fù)方向延拓定義域，并合理選擇對(duì)稱坐標(biāo)軸，使其正、負(fù)軸對(duì)稱，這樣信號(hào)變?yōu)閷?shí)軸對(duì)稱的偶函數(shù)，DFT變換后僅有余弦項(xiàng)而不存在正弦項(xiàng)，運(yùn)算量大為減小。原本的N個(gè)樣本，經(jīng)過(guò)對(duì)稱后變?yōu)?N個(gè) 2N為抽取的樣本值總數(shù)，為DCT變換的塊長(zhǎng)度。例：采樣為48KHz的PCM樣值進(jìn)行DCT變換，窗長(zhǎng)分別為21.33ms（相當(dāng)于1024個(gè)樣值），5.33ms（相當(dāng)于256個(gè)樣值），則頻率分辨率和時(shí)間分辨率分別為？時(shí)間分辨率：長(zhǎng)窗=2N （1/Fs）=42.68ms 短窗= 2N

12、（1/Fs）=10.66ms 頻率分辨率：長(zhǎng)窗=Fs/2N=23.43Hz 短窗= Fs/2N=93.75Hz 依據(jù)各個(gè)信號(hào)幅值出現(xiàn)的概率不同進(jìn)行概率匹配編碼熵編碼是依據(jù)聲音信號(hào)幅度的概率分布特點(diǎn)，通過(guò)合理的比特?cái)?shù)分配使得信號(hào)概率與比特?cái)?shù)之間相匹配，以達(dá)到降低平均碼長(zhǎng)的目的統(tǒng)計(jì)編碼統(tǒng)計(jì)編碼可變字長(zhǎng)編碼MPEG Moving Picture coding Experts Group 活動(dòng)圖像專家組1988年由國(guó)際標(biāo)準(zhǔn)化組織ISO和國(guó)際電工委員會(huì)IEC聯(lián)合成立的專家組，負(fù)責(zé)開(kāi)發(fā)電視圖像數(shù)據(jù)和聲音數(shù)據(jù)的編碼、解碼和它們的同步等標(biāo)準(zhǔn)。已經(jīng)開(kāi)發(fā)和正在開(kāi)發(fā)的MPEG標(biāo)準(zhǔn)有：MPEG-1：數(shù)字存儲(chǔ)媒體標(biāo)準(zhǔn)

13、，1992年正式發(fā)布。MPEG-2：數(shù)字電視標(biāo)準(zhǔn) ，1993年11月發(fā)布。 MPEG-4：多媒體應(yīng)用標(biāo)準(zhǔn)(1999年發(fā)布)。MPEG-7：多媒體內(nèi)容描述接口標(biāo)準(zhǔn)(1998年10月) MPEG21：開(kāi)放的多媒體傳輸和消費(fèi)的框架。（2002年6月）3.2 MPEG-1音頻壓縮編碼標(biāo)準(zhǔn)MPEG-1 音頻壓縮算法的特點(diǎn)l世界上第一個(gè)高保真音頻數(shù)據(jù)壓縮標(biāo)準(zhǔn)l輸入線性PCM信號(hào)，采樣頻率可以為32kHz，44.1KHz，48KHz，輸出數(shù)碼率32-384kbit/sl壓縮后的比特流可以是：單聲道模式/雙-單聲道模式/立體聲模式/聯(lián)合立體聲模式l提供3個(gè)獨(dú)立的壓縮層次：第1層（Layer1），第2層，第3

14、層MPEG-1 音頻壓縮算法的特點(diǎn)l可預(yù)先定義壓縮后的數(shù)碼率l編碼后的數(shù)據(jù)流支持循環(huán)冗余校驗(yàn)l支持?jǐn)?shù)據(jù)流中載帶附加信息MPEG-1 音頻壓縮編碼的基本原理lMPEG-1音頻壓縮的基礎(chǔ)是量化lMPEG-1使用感知音頻編碼來(lái)達(dá)到壓縮音頻數(shù)據(jù)又盡可能保證音質(zhì)的目的。l感知音頻編碼的理論依據(jù)是聽(tīng)覺(jué)系統(tǒng)的掩蔽特性?；舅枷胧窃诰幋a過(guò)程中，保留有用的信息而丟掉被掩蔽的信號(hào)。lMPEG-1提供3個(gè)獨(dú)立的壓縮層次，它們的基本模型相同。層1是最基礎(chǔ)的。任何MPEG-1音頻碼流幀結(jié)構(gòu)的同步頭中都有一個(gè)2bit的層代碼字段用來(lái)指出所用的是哪一個(gè)層次lMPEG-1按規(guī)定構(gòu)成“幀”格式，層1的每幀包含384個(gè)采樣值碼字

15、。384個(gè)采樣值來(lái)自32個(gè)子帶，每個(gè)子帶12個(gè)采樣值。層2和層3每幀包含1152個(gè)采樣值的碼字每個(gè)子帶包含36個(gè)采樣值。MPEG-1 層層1原理方框圖原理方框圖MPEG-1 層層11、子帶分析濾波器組將寬頻帶信號(hào)分割成32個(gè)子帶信號(hào) 子帶為等寬的均勻劃分2、標(biāo)定將每個(gè)子帶中12個(gè)采樣值歸并成一個(gè)塊找出12個(gè)采樣值中絕對(duì)值最大的樣本值根據(jù)其值的大小確定比例因子（查表得到，大于該絕對(duì)值的一系列值中的最小值定為比例因子）將12個(gè)采樣值用比例因子歸一化（標(biāo)定）比例因子用6個(gè)bit來(lái)表示每12采樣值并成的塊進(jìn)行一次比特分配，并記錄一個(gè)比例因子 MPEG-1 層層13、快速傅里葉變換（FFT

16、）信號(hào)從時(shí)域變換到頻域的過(guò)程使信號(hào)具有高的頻率分辨率，為心理聲學(xué)模型分析提供信號(hào)的頻譜特征4、心理聲學(xué)模型 MPEG-1 層1把音頻信號(hào)分到頻域子帶，然后根據(jù)每個(gè)子帶內(nèi)的量化噪聲的大小對(duì)每個(gè)子帶進(jìn)行量化。為了達(dá)到最大的壓縮比，應(yīng)求出每個(gè)子帶的量化級(jí)數(shù)使得量化噪聲恰好不被聽(tīng)到目標(biāo)：計(jì)算子帶的信號(hào)掩蔽比（SMR）數(shù)字音頻信號(hào)用傅里葉FFT變時(shí)域?yàn)轭l域確定每個(gè)子帶的聲壓級(jí)確定安靜狀態(tài)的閾值找出聲音信號(hào)中的純音和非純音成分單獨(dú)掩蔽域值的計(jì)算總體掩蔽閾值的計(jì)算每個(gè)子帶最小掩蔽閾值的確定每個(gè)子帶的信號(hào)-掩蔽比率的計(jì)算MPEG-1 層層15、動(dòng)態(tài)比特分配為了滿足數(shù)碼率和掩蔽特性的要求，比特分配器應(yīng)同

17、時(shí)考慮來(lái)自分析濾波器的輸出樣值及來(lái)自心理聲學(xué)模型的信號(hào)掩蔽比（SMR），來(lái)決定分配給各個(gè)子帶信號(hào)的量化比特?cái)?shù)，使量化噪聲低于掩蔽閾值。不同的子帶信號(hào)可分配不同的量化比特?cái)?shù)，但對(duì)于各個(gè)子帶信號(hào)而言，是線性量化。6、幀結(jié)構(gòu) 量化后的采樣值和格式標(biāo)記以及其他附加輔助數(shù)據(jù)按照規(guī)定的幀格式組裝成比特流數(shù)據(jù)MPEG-1 層1的幀結(jié)構(gòu)同步頭：用于同步和記錄幀信息 32bitCRC：用于檢驗(yàn)傳輸差錯(cuò)的循環(huán)冗余校驗(yàn)碼 16bit比特分配：描述比特分配信息的字段，每個(gè)子帶4bit比例因子：每個(gè)子帶6bit采樣值碼字：同一個(gè)子帶內(nèi)的每個(gè)采樣值用215bit表示可能的附加輔助數(shù)據(jù)：長(zhǎng)度未作規(guī)定MPEG-1 層層2

18、MPEG-1 層層2層層2和層和層1的不同的不同1、使用1024點(diǎn)的FFT，提高頻譜分辨率2、每幀包含1152個(gè)采樣值的碼字。每個(gè)子帶包含36個(gè)采樣值的碼字，按照3個(gè)塊進(jìn)行編碼，每塊12個(gè)采樣值。3、描述比特分配的字段長(zhǎng)度隨子帶的不同而不同。低頻段子帶用4bit描述，中頻段3個(gè)bit，高頻段2個(gè)bit4、編碼器可對(duì)一個(gè)子帶內(nèi)3塊采樣值使用3種不同的比例因子，傳輸時(shí)采用比例因子選擇信息（SCFSI）描述MPEG-1 層層2、lSCPSI 比例因子選擇信息為了降低傳送比例因子的碼率，信號(hào)平穩(wěn)變化時(shí)，只傳送其中1個(gè)或2個(gè)較大的比例因子；對(duì)于瞬態(tài)變化的信號(hào)，3個(gè)比例因子都傳遞。 00 傳送所有的3個(gè)

19、比例因子 01 傳送第1和第3個(gè)比例因子 10 傳送一個(gè)比例因子 11 傳送第1和第2個(gè)比例因子MPEG-1 層層1與層與層2參數(shù)比較參數(shù)比較參數(shù)參數(shù)MPEG-1層層1MPEG-1層層2幀長(zhǎng)3841152子帶3232子帶取樣1264FFT5121024比特分配每子帶4個(gè)24比例因子選擇信息無(wú)每子帶2個(gè)比例因子每子帶6個(gè)每子帶618個(gè)取樣組無(wú)每子帶3個(gè)MPEG-1 層層3 （MP3）MPEG-1 層層31、將PCM樣本分割成不等帶寬的子帶，子帶送至MDCT，對(duì)子帶進(jìn)行再采樣，其樣本經(jīng)MDCT映射到頻域，建立信號(hào)的頻域樣本。2、使用MDCT，指定兩種MDCT的塊長(zhǎng)：長(zhǎng)塊18個(gè)采樣值，短塊6個(gè)采樣

20、值，相鄰變換窗口之間有50%的重疊。所以窗長(zhǎng)大小分別為36和12個(gè)采樣值。對(duì)于給定的一幀音頻信號(hào)MDCT可全部采用長(zhǎng)塊或全部采用短塊，也可以長(zhǎng)、短塊混合使用。因?yàn)榈皖l段的分辨率對(duì)音質(zhì)的影響大，所以在混合模式下，MDCT對(duì)最低頻的2個(gè)子帶用長(zhǎng)塊，而其余30個(gè)子帶用短塊。這樣既能保證低頻的頻率分辨率，也不犧牲高頻的時(shí)間分辨率。3、熵編碼(哈弗曼編碼)立體聲重放 L、R兩個(gè)聲道利用人耳的雙耳效應(yīng)感受聲音的縱深感和寬度多聲道環(huán)繞聲重放三聲道重放4聲道環(huán)繞聲重放5聲道環(huán)繞聲重放多聲道格式還可以附加低頻增強(qiáng)（LFE）聲道。LFE聲道包含15-120Hz的信息，稱為0.1聲道，與5聲道構(gòu)成5.1聲道。

21、0.1聲道的采樣頻率是主聲道采樣頻率的1/96目前主要的環(huán)繞聲編碼方案有： MUSICAM環(huán)繞聲 MPEG-2音頻編碼的核心，是基于人耳聽(tīng)覺(jué)感知特性的子帶編碼算法杜比AC-3 美國(guó)HDTV伴音采用的算法Dolby AC-3 特點(diǎn)統(tǒng)一編碼：將5個(gè)分立的全頻帶聲道和1個(gè)低音聲道的信號(hào)實(shí)行統(tǒng)一編碼，成為單一的復(fù)合數(shù)據(jù)流采樣頻率支持32、44.1、48KHz兩個(gè)環(huán)繞聲道相互獨(dú)立輔助低音聲道的音量可獨(dú)立調(diào)整使用基于MDCT的自適應(yīng)變換編碼兼容性：解碼重放時(shí)，對(duì)單聲道、雙聲道及多聲道系統(tǒng)有兼容性分析濾波器組分析濾波器組將PCM采樣數(shù)據(jù)變換成頻域內(nèi)的一系列變換系數(shù)。數(shù)據(jù)分組成塊，每塊包含512個(gè)采樣

22、值，其中256個(gè)采樣值是新的，另外256個(gè)采樣值與上一塊相同。每個(gè)音頻的采樣值會(huì)出現(xiàn)在兩個(gè)塊中，采樣值數(shù)加倍。穩(wěn)態(tài)信號(hào)，可選用塊長(zhǎng)為512個(gè)采樣值；瞬態(tài)信號(hào)，可選用塊長(zhǎng)為256個(gè)采樣值。譜包絡(luò)編碼譜包絡(luò)編碼從變換得到的頻域變換系數(shù)被轉(zhuǎn)換為浮點(diǎn)數(shù)。所有變換系數(shù)的值都定標(biāo)為小于1.0。最后指數(shù)編碼的結(jié)果根據(jù)頻率分辨率的需要選擇一種頻譜包絡(luò)。比特分配比特分配按照譜包絡(luò)編碼輸出的信息確定尾數(shù)編碼所需要的比特?cái)?shù)，將可分配的比特按最佳的方式分配給各個(gè)尾數(shù)。尾數(shù)量化尾數(shù)量化按照比特分配程序確定的比特?cái)?shù)對(duì)尾數(shù)進(jìn)行量化。可查表得到。聲道組合聲道組合利用人耳對(duì)高頻定位的特性。重組矩陣重組矩陣左右聲

23、道具有相關(guān)性，利用“和”“差”的方法產(chǎn)生中間和邊聲道來(lái)代替左右聲道。2LRM2LRS動(dòng)態(tài)范圍控制動(dòng)態(tài)范圍控制每個(gè)音頻塊傳送一個(gè)動(dòng)態(tài)控制字。在信號(hào)響度高于對(duì)話電平時(shí)降低增益，在信號(hào)響度低于對(duì)話電平時(shí)提高增益，信號(hào)接近對(duì)話電平時(shí)不需調(diào)節(jié)增益。Dolby AC-3 編碼器AC-3幀格式 SI：同步頭，包含獲取和保持同步的信息 BSI：比特流信息頭，包含描述編碼的音頻業(yè)務(wù)的參數(shù) AB：音頻塊，6個(gè)編碼音頻塊，每塊由256個(gè)采樣值的碼字構(gòu)成。 AUX：輔助數(shù)據(jù)字段 CRC：循環(huán)冗余校驗(yàn)碼 MPEG-2BC 后向兼容多聲道音頻編碼（與MPEG-1兼容）MPEG-2 AAC MPEG-2高級(jí)音頻編碼（與

24、MPEG-1不兼容）MPEG-2 BC 后向兼容多聲道音頻編碼標(biāo)準(zhǔn) 增加采樣率16KHz、22.05KHz、24KHz增加5.1聲道和7.1聲道環(huán)繞聲輸出碼率為8-640kbit/s MPEG-2 AAC 是MPEG-2標(biāo)準(zhǔn)中的一種非常靈活的聲音感知編碼標(biāo)準(zhǔn)。就像所有感知編碼一樣，MPEG-2 AAC主要使用聽(tīng)覺(jué)系統(tǒng)的掩蔽特性來(lái)減少聲音的數(shù)據(jù)量，并且通過(guò)把量化噪聲分散到各個(gè)子帶中，用全局信號(hào)把噪聲掩蔽掉。 l與MPEG-1音頻算法不兼容l采樣頻率支持從8KHz96KHzl可支持48個(gè)主聲道，16個(gè)LFE聲道，16個(gè)多語(yǔ)言聲道，16個(gè)數(shù)據(jù)流l數(shù)據(jù)率比MP3低，但音質(zhì)更高。MPEG-2 AAC增益控制把輸入信號(hào)劃分到4個(gè)等帶寬的子帶中。分析濾波器組輸入信號(hào)從時(shí)域變換到頻域。采用MDCT。聽(tīng)覺(jué)系統(tǒng)感知模型心理聲學(xué)模型瞬時(shí)噪聲整形（TNS）控制量化噪聲的瞬時(shí)形狀，解決掩蔽閾值和量化噪聲的錯(cuò)誤匹配問(wèn)題。聲強(qiáng)/耦合和M/S編碼利用和、差方法產(chǎn)生中間和邊聲道代替原來(lái)的左右聲道。預(yù)測(cè) 在信號(hào)較平穩(wěn)的情況下，利用時(shí)域預(yù)測(cè)減小信號(hào)的冗余度。量化無(wú)損編碼采用Huffman編碼碼流打包組

人人文庫(kù)> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

音頻壓縮編碼原理及標(biāo)準(zhǔn)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

音頻壓縮編碼原理及標(biāo)準(zhǔn)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔