音頻壓縮編碼原理及標(biāo)準(zhǔn)_第1頁
音頻壓縮編碼原理及標(biāo)準(zhǔn)_第2頁
音頻壓縮編碼原理及標(biāo)準(zhǔn)_第3頁
音頻壓縮編碼原理及標(biāo)準(zhǔn)_第4頁
音頻壓縮編碼原理及標(biāo)準(zhǔn)_第5頁
已閱讀5頁,還剩62頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、音頻壓縮編碼的基本原理MPEG-1音頻壓縮編碼標(biāo)準(zhǔn)杜比AC-3音頻壓縮算法MPEG-2音頻壓縮編碼標(biāo)準(zhǔn)MPEG-4音頻壓縮編碼標(biāo)準(zhǔn)按照對聲音質(zhì)量的要求不同以及使用頻帶的寬窄按照對聲音質(zhì)量的要求不同以及使用頻帶的寬窄,將音頻信號分為以下,將音頻信號分為以下4類:類:窄帶語音:又稱電話頻帶語音,窄帶語音:又稱電話頻帶語音,300-3400Hz,用,用于各類電話通信,數(shù)字化時采樣頻率常用于各類電話通信,數(shù)字化時采樣頻率常用8kHz。寬帶語音:用于電話會議,視頻會議,寬帶語音:用于電話會議,視頻會議,50-7000Hz ,數(shù)字化時采樣頻率常用,數(shù)字化時采樣頻率常用16kHz。數(shù)字音頻廣播:數(shù)字音頻廣播

2、:20-15000Hz,數(shù)字化時采樣頻率,數(shù)字化時采樣頻率常用常用32kHz。高保真立體聲音頻信號:高保真立體聲音頻信號:20-20KHz,用于,用于VCD、DVD、CD等,數(shù)字化時采樣頻率常用等,數(shù)字化時采樣頻率常用44.1kHz 或或48kHz。巨大的數(shù)據(jù)量給存儲和傳輸帶來的壓力CD唱片F(xiàn)s=44.1KHz 量化精度 16bit 雙聲道數(shù)碼率?1.41Mbit/s1S信號所需存儲空間?176.4KB3.1 音頻壓縮編碼的基本原理音頻壓縮編碼的基本原理數(shù)字音頻信號中存在著大量冗余數(shù)字音頻信號中存在著大量冗余頻域冗余:頻域冗余:1. 低頻成分比高頻成分多低頻成分比高頻成分多2. 語音信號的共振

3、峰語音信號的共振峰時域冗余:時域冗余:1.小幅度樣本比大幅度樣值出現(xiàn)的概率大。小幅度樣本比大幅度樣值出現(xiàn)的概率大。2.相鄰樣值間的相關(guān)性相鄰樣值間的相關(guān)性3.信號周期的相關(guān)性信號周期的相關(guān)性4.長時自相關(guān)長時自相關(guān)5.話音間隙冗余話音間隙冗余聽覺冗余:聽覺冗余: 利用人耳的感知特性,將聽不到的信號壓縮掉。利用人耳的感知特性,將聽不到的信號壓縮掉。聲音信號的頻率范圍? 20Hz-20KHz聲音頻譜的特點(diǎn): 高頻段快速下降,高幅值大部分集中在中頻段,有的延伸到低頻段電平分布特點(diǎn): 聲音信號的電平存在冗余一個較弱的聲音(被掩蔽音)的聽覺感受被另一個較強(qiáng)的聲音(掩蔽音)影響掩蔽量與掩蔽聲具有的聲壓級成

4、正比掩蔽量與掩蔽聲具有的聲壓級成正比掩蔽聲的聲壓級越高、掩蔽的頻率范圍隨之加寬掩蔽聲的聲壓級越高、掩蔽的頻率范圍隨之加寬被掩蔽聲的頻率越接近掩蔽聲,掩蔽效應(yīng)越顯著、掩蔽被掩蔽聲的頻率越接近掩蔽聲,掩蔽效應(yīng)越顯著、掩蔽量增大量增大掩蔽聲對于低于掩蔽聲頻率的聲音掩蔽效果弱,對于高掩蔽聲對于低于掩蔽聲頻率的聲音掩蔽效果弱,對于高于掩蔽聲頻率的聲音掩蔽效果顯著。于掩蔽聲頻率的聲音掩蔽效果顯著。利用聲音的掩蔽效應(yīng),可以用有用的信號去掩蔽無用的信號只需把無用信號的聲壓級降至掩蔽域之下即可,無需消除無用分量人耳聽力系統(tǒng) 帶通濾波器 對某頻率的聲音信號的拾取會采用中心頻率接近此頻率對某頻率的聲音信號的拾取會采

5、用中心頻率接近此頻率的帶通濾波器,因此,只有通過該帶通濾波器的那部分的帶通濾波器,因此,只有通過該帶通濾波器的那部分噪聲才會對該信號產(chǎn)生影響噪聲才會對該信號產(chǎn)生影響臨界帶寬描述人耳的濾波特性如果在一頻帶內(nèi)噪聲的功率等于該純音的功率,且這時,如果在一頻帶內(nèi)噪聲的功率等于該純音的功率,且這時,純音剛好能被聽到(臨界狀態(tài)),此純音附近的窄帶噪純音剛好能被聽到(臨界狀態(tài)),此純音附近的窄帶噪聲帶寬的寬度便稱為臨界帶寬聲帶寬的寬度便稱為臨界帶寬通常認(rèn)為通常認(rèn)為20Hz20KHz內(nèi)有內(nèi)有24個臨界頻帶個臨界頻帶窄帶噪聲的掩蔽效應(yīng)要明顯于純音窄帶噪聲的掩蔽效應(yīng)要明顯于純音聲壓級較低時,掩蔽僅局限于中心頻率附

6、近較窄的頻率范圍聲壓級較低時,掩蔽僅局限于中心頻率附近較窄的頻率范圍隨著聲壓級的提高,掩蔽區(qū)的頻率范圍加寬隨著聲壓級的提高,掩蔽區(qū)的頻率范圍加寬隨著聲壓級的提高,對高于中心頻率的聲音掩蔽作用加強(qiáng)隨著聲壓級的提高,對高于中心頻率的聲音掩蔽作用加強(qiáng)時域掩蔽前向掩蔽:前向掩蔽:20ms,由于人耳的積累效應(yīng),被掩蔽聲尚未,由于人耳的積累效應(yīng),被掩蔽聲尚未被聽到,掩蔽聲已經(jīng)出現(xiàn),其掩蔽效果很差被聽到,掩蔽聲已經(jīng)出現(xiàn),其掩蔽效果很差后向掩蔽:后向掩蔽:100ms,由于人耳的存儲效應(yīng),掩蔽聲雖已,由于人耳的存儲效應(yīng),掩蔽聲雖已消失,掩蔽效應(yīng)仍然存在。消失,掩蔽效應(yīng)仍然存在。生理聲學(xué)研究聽覺器官的構(gòu)造和聽音機(jī)

7、理心理聲學(xué)研究聽覺心理,研究主觀量與客觀 量之間的關(guān)系。心理聲學(xué)模型中一個基本概念: 聽覺系統(tǒng)中存在一個聽覺閾值電平,低于這個電平的音頻信號就聽不到,因此就可以把這部分信號忽略掉,無需對它進(jìn)行編碼,而不影響聽覺效果心理聲學(xué)模型要完成掩蔽閾值的估算,輸出信號-掩蔽比率(SMR)利用人耳的聽覺感知特性,使用心理聲學(xué)模型,將人耳不能感知的聲音成分去掉,只保留人耳能感知的聲音成分。不為追求最小的量化噪聲,只要量化噪聲不被人耳感知即可。感知音頻編碼(感知音頻編碼(MPEG)原理)原理音頻編解碼器的性能指標(biāo):重建的音頻質(zhì)量、數(shù)碼率、復(fù)雜度和時延。研究 的基本問題是:更好的音頻質(zhì)量,并盡可能小的編解碼時延和

8、算法復(fù)雜度;降低數(shù)碼率。重建音頻質(zhì)量的評價方法有客觀評價和主觀評價。分類方法一:時域編碼 利用聲音信號在時間域內(nèi)幅度變化經(jīng)PAM后形成的樣本值,對不同樣本值實(shí)現(xiàn)二進(jìn)制碼替代,從而形成數(shù)據(jù)碼流頻域編碼 將時域中的聲音信號進(jìn)行頻率變換,結(jié)合聲音的相關(guān)性及人的感知,選取量化比特?cái)?shù)進(jìn)行編碼統(tǒng)計(jì)編碼 依據(jù)各個信號幅值出現(xiàn)的概率不同進(jìn)行概率匹配編碼音頻壓縮編碼的方法音頻壓縮編碼的方法分類方法二:波形編碼 對音頻信號的時域或頻域波形采樣值進(jìn)行編碼。 主要利用音頻樣值的幅度分布規(guī)律和相鄰樣值間的相關(guān)性進(jìn)行壓縮。參數(shù)編碼 根據(jù)聲音形成機(jī)理的分析,以重建語音信號具有足夠可懂度的原則上,通過建立語音信號的產(chǎn)生模型,

9、提取代表語音信號特征的參數(shù)進(jìn)行編碼混合編碼 上述兩種編碼的混合音頻壓縮編碼的方法音頻壓縮編碼的方法結(jié)合聲音幅度的出現(xiàn)概率來選取量化比特?cái)?shù)進(jìn)行編碼,在滿足一定的量化噪聲下壓縮數(shù)碼率,從而降低比特率。時域編碼時域編碼利用人耳聽覺的聲掩蔽特性,在滿足一定量化噪聲下來壓縮碼率采用濾波和變化,在頻域內(nèi)將其能量較小的分量忽略,從而實(shí)現(xiàn)降低比特率頻域編碼頻域編碼子帶編碼:通過帶通濾波器分成許多頻帶子帶,分析每個子帶取樣的能量,依據(jù)心理聲學(xué)模型來編碼變換編碼:變換到頻域,根據(jù)心理聲學(xué)模型對變換系數(shù)進(jìn)行量化和編碼首先用一組帶通濾波器把輸入的音頻信號分成若干個連續(xù)的子帶,然后對每個子帶中的音頻信號單獨(dú)編碼,在接收

10、端將各子帶單獨(dú)譯碼,然后組合、還原成音頻信號。對每個子帶的采樣值分配不同的比特?cái)?shù)。低頻分配較多量化比特,高頻分配較少量化比特。利用聲音信號的頻譜特點(diǎn)及人耳的感知模型。聲音信號從時域變?yōu)轭l域,用頻率分量形式表示原信號,再對其頻譜系數(shù)進(jìn)行量化編碼量化編碼過程中,利用心理聲學(xué)模型,對頻譜系數(shù)進(jìn)行優(yōu)化,來實(shí)現(xiàn)對音頻數(shù)據(jù)進(jìn)行有效的壓縮時頻變化的方法:離散余弦變換DCT 、改進(jìn)的離散余弦變換MDCT離散余弦變換(DCT) 時頻變換(DFT) 變換時將PCM樣值分為N長的一塊塊進(jìn)行變換 塊長:一塊中包含的樣本數(shù)N 窗長:N (1/Fs) 頻率分辨率:Fs/N 頻率軸上的所能得到的最小頻率間隔 塊越長,變化編

11、碼的頻率分辨率越高,但損失了時域分辨率塊越長,變化編碼的頻率分辨率越高,但損失了時域分辨率逆變換逆變換離散余弦變換(DCT) 將原信號沿負(fù)方向延拓定義域,并合理選擇對稱坐標(biāo)軸,使其正、負(fù)軸對稱,這樣信號變?yōu)閷?shí)軸對稱的偶函數(shù),DFT變換后僅有余弦項(xiàng)而不存在正弦項(xiàng),運(yùn)算量大為減小。 原本的N個樣本,經(jīng)過對稱后變?yōu)?N個 2N為抽取的樣本值總數(shù),為DCT變換的塊長度。 例:采樣為48KHz的PCM樣值進(jìn)行DCT變換,窗長分別為21.33ms(相當(dāng)于1024個樣值),5.33ms(相當(dāng)于256個樣值),則頻率分辨率和時間分辨率分別為? 時間分辨率:長窗=2N (1/Fs)=42.68ms 短窗= 2N

12、 (1/Fs)=10.66ms 頻率分辨率:長窗=Fs/2N=23.43Hz 短窗= Fs/2N=93.75Hz 依據(jù)各個信號幅值出現(xiàn)的概率不同進(jìn)行概率匹配編碼熵編碼是依據(jù)聲音信號幅度的概率分布特點(diǎn),通過合理的比特?cái)?shù)分配使得信號概率與比特?cái)?shù)之間相匹配,以達(dá)到降低平均碼長的目的統(tǒng)計(jì)編碼統(tǒng)計(jì)編碼可變字長編碼MPEG Moving Picture coding Experts Group 活動圖像專家組1988年由國際標(biāo)準(zhǔn)化組織ISO和國際電工委員會IEC聯(lián)合成立的專家組,負(fù)責(zé)開發(fā)電視圖像數(shù)據(jù)和聲音數(shù)據(jù)的編碼、解碼和它們的同步等標(biāo)準(zhǔn)。已經(jīng)開發(fā)和正在開發(fā)的MPEG標(biāo)準(zhǔn)有:MPEG-1:數(shù)字存儲媒體標(biāo)準(zhǔn)

13、,1992年正式發(fā)布。MPEG-2:數(shù)字電視標(biāo)準(zhǔn) ,1993年11月發(fā)布。 MPEG-4:多媒體應(yīng)用標(biāo)準(zhǔn)(1999年發(fā)布)。MPEG-7:多媒體內(nèi)容描述接口標(biāo)準(zhǔn)(1998年10月) MPEG21:開放的多媒體傳輸和消費(fèi)的框架。(2002年6月)3.2 MPEG-1音頻壓縮編碼標(biāo)準(zhǔn)MPEG-1 音頻壓縮算法的特點(diǎn)l世界上第一個高保真音頻數(shù)據(jù)壓縮標(biāo)準(zhǔn)l輸入線性PCM信號,采樣頻率可以為32kHz,44.1KHz,48KHz,輸出數(shù)碼率32-384kbit/sl壓縮后的比特流可以是: 單聲道模式/雙-單聲道模式/立體聲模式/聯(lián)合立體聲模式l提供3個獨(dú)立的壓縮層次:第1層(Layer1),第2層,第3

14、層MPEG-1 音頻壓縮算法的特點(diǎn)l可預(yù)先定義壓縮后的數(shù)碼率l編碼后的數(shù)據(jù)流支持循環(huán)冗余校驗(yàn)l支持?jǐn)?shù)據(jù)流中載帶附加信息MPEG-1 音頻壓縮編碼的基本原理lMPEG-1音頻壓縮的基礎(chǔ)是量化lMPEG-1使用感知音頻編碼來達(dá)到壓縮音頻數(shù)據(jù)又盡可能保證音質(zhì)的目的。l感知音頻編碼的理論依據(jù)是聽覺系統(tǒng)的掩蔽特性?;舅枷胧窃诰幋a過程中,保留有用的信息而丟掉被掩蔽的信號。lMPEG-1提供3個獨(dú)立的壓縮層次,它們的基本模型相同。層1是最基礎(chǔ)的。任何MPEG-1音頻碼流幀結(jié)構(gòu)的同步頭中都有一個2bit的層代碼字段用來指出所用的是哪一個層次lMPEG-1按規(guī)定構(gòu)成“幀”格式,層1的每幀包含384個采樣值碼字

15、。384個采樣值來自32個子帶,每個子帶12個采樣值。層2和層3每幀包含1152個采樣值的碼字每個子帶包含36個采樣值。MPEG-1 層層1原理方框圖原理方框圖MPEG-1 層層11、子帶分析濾波器組 將寬頻帶信號分割成32個子帶信號 子帶為等寬的均勻劃分2、標(biāo)定 將每個子帶中12個采樣值歸并成一個塊 找出12個采樣值中絕對值最大的樣本值 根據(jù)其值的大小確定比例因子(查表得到,大于該絕對值的一系列值中的最小值定為比例因子) 將12個采樣值用比例因子歸一化(標(biāo)定) 比例因子用6個bit來表示 每12采樣值并成的塊進(jìn)行一次比特分配,并記錄一個比例因子 MPEG-1 層層13、快速傅里葉變換(FFT

16、) 信號從時域變換到頻域的過程 使信號具有高的頻率分辨率,為心理聲學(xué)模型分析提供信號的頻譜特征4、心理聲學(xué)模型 MPEG-1 層1把音頻信號分到頻域子帶,然后根據(jù)每個子帶內(nèi)的量化噪聲的大小對每個子帶進(jìn)行量化。為了達(dá)到最大的壓縮比,應(yīng)求出每個子帶的量化級數(shù)使得量化噪聲恰好不被聽到 目標(biāo):計(jì)算子帶的信號掩蔽比(SMR)數(shù)字音頻信號用傅里葉FFT變時域?yàn)轭l域確定每個子帶的聲壓級確定安靜狀態(tài)的閾值找出聲音信號中的純音和非純音成分單獨(dú)掩蔽域值的計(jì)算總體掩蔽閾值的計(jì)算每個子帶最小掩蔽閾值的確定每個子帶的信號-掩蔽比率的計(jì)算MPEG-1 層層15、動態(tài)比特分配 為了滿足數(shù)碼率和掩蔽特性的要求,比特分配器應(yīng)同

17、時考慮來自分析濾波器的輸出樣值及來自心理聲學(xué)模型的信號掩蔽比(SMR),來決定分配給各個子帶信號的量化比特?cái)?shù),使量化噪聲低于掩蔽閾值。 不同的子帶信號可分配不同的量化比特?cái)?shù),但對于各個子帶信號而言,是線性量化。6、幀結(jié)構(gòu) 量化后的采樣值和格式標(biāo)記以及其他附加輔助數(shù)據(jù)按照規(guī)定的幀格式組裝成比特流數(shù)據(jù)MPEG-1 層1的幀結(jié)構(gòu)同步頭:用于同步和記錄幀信息 32bitCRC:用于檢驗(yàn)傳輸差錯的循環(huán)冗余校驗(yàn)碼 16bit比特分配:描述比特分配信息的字段 ,每個子帶4bit比例因子:每個子帶6bit采樣值碼字:同一個子帶內(nèi)的每個采樣值用215bit表示可能的附加輔助數(shù)據(jù):長度未作規(guī)定MPEG-1 層層2

18、MPEG-1 層層2層層2和層和層1的不同的不同1、使用1024點(diǎn)的FFT,提高頻譜分辨率2、每幀包含1152個采樣值的碼字。每個子帶包含36個采樣值的碼字,按照3個塊進(jìn)行編碼,每塊12個采樣值。3、描述比特分配的字段長度隨子帶的不同而不同。低頻段子帶用4bit描述,中頻段3個bit,高頻段2個bit4、編碼器可對一個子帶內(nèi)3塊采樣值使用3種不同的比例因子,傳輸時采用比例因子選擇信息(SCFSI)描述MPEG-1 層層2、lSCPSI 比例因子選擇信息 為了降低傳送比例因子的碼率,信號平穩(wěn)變化時,只傳送其中1個或2個較大的比例因子;對于瞬態(tài)變化的信號,3個比例因子都傳遞。 00 傳送所有的3個

19、比例因子 01 傳送第1和第3個比例因子 10 傳送一個比例因子 11 傳送第1和第2個比例因子MPEG-1 層層1與層與層2參數(shù)比較參數(shù)比較參數(shù)參數(shù)MPEG-1層層1MPEG-1層層2幀長3841152子帶3232子帶取樣1264FFT5121024比特分配每子帶4個24比例因子選擇信息無每子帶2個比例因子每子帶6個每子帶618個取樣組無每子帶3個MPEG-1 層層3 (MP3)MPEG-1 層層31、將PCM樣本分割成不等帶寬的子帶,子帶送至MDCT,對子帶進(jìn)行再采樣,其樣本經(jīng)MDCT映射到頻域,建立信號的頻域樣本。2、 使用MDCT,指定兩種MDCT的塊長:長塊18個采樣值,短塊6個采樣

20、值,相鄰變換窗口之間有50%的重疊。所以窗長大小分別為36和12個采樣值。 對于給定的一幀音頻信號MDCT可全部采用長塊或全部采用短塊,也可以長、短塊混合使用。 因?yàn)榈皖l段的分辨率對音質(zhì)的影響大,所以在混合模式下,MDCT對最低頻的2個子帶用長塊,而其余30個子帶用短塊。這樣既能保證低頻的頻率分辨率,也不犧牲高頻的時間分辨率。3、熵編碼(哈弗曼編碼)立體聲重放 L、R兩個聲道 利用人耳的雙耳效應(yīng)感受聲音的縱深感和寬度多聲道環(huán)繞聲重放三聲道重放4聲道環(huán)繞聲重放5聲道環(huán)繞聲重放多聲道格式還可以附加低頻增強(qiáng)(LFE)聲道。LFE聲道包含15-120Hz的信息,稱為0.1聲道,與5聲道構(gòu)成5.1聲道。

21、0.1聲道的采樣頻率是主聲道采樣頻率的1/96目前主要的環(huán)繞聲編碼方案有: MUSICAM環(huán)繞聲 MPEG-2音頻編碼的核心,是基于人耳聽覺感知特性的子帶編碼算法 杜比AC-3 美國HDTV伴音采用的算法Dolby AC-3 特點(diǎn)統(tǒng)一編碼: 將5個分立的全頻帶聲道和1個低音聲道的信號實(shí)行統(tǒng)一編碼,成為單一的復(fù)合數(shù)據(jù)流采樣頻率支持32、44.1、48KHz兩個環(huán)繞聲道相互獨(dú)立輔助低音聲道的音量可獨(dú)立調(diào)整使用基于MDCT的自適應(yīng)變換編碼兼容性:解碼重放時,對單聲道、雙聲道及多聲 道系統(tǒng)有兼容性分析濾波器組分析濾波器組將PCM采樣數(shù)據(jù)變換成頻域內(nèi)的一系列變換系數(shù)。 數(shù)據(jù)分組成塊,每塊包含512個采樣

22、值,其中256個采樣值是新的,另外256個采樣值與上一塊相同。每個音頻的采樣值會出現(xiàn)在兩個塊中,采樣值數(shù)加倍。穩(wěn)態(tài)信號,可選用塊長為512個采樣值;瞬態(tài)信號,可選用塊長為256個采樣值。譜包絡(luò)編碼譜包絡(luò)編碼 從變換得到的頻域變換系數(shù)被轉(zhuǎn)換為浮點(diǎn)數(shù)。 所有變換系數(shù)的值都定標(biāo)為小于1.0。 最后指數(shù)編碼的結(jié)果根據(jù)頻率分辨率的需要選擇一種頻譜包絡(luò)。比特分配比特分配 按照譜包絡(luò)編碼輸出的信息確定尾數(shù)編碼所需要的比特?cái)?shù),將可分配的比特按最佳的方式分配給各個尾數(shù)。尾數(shù)量化尾數(shù)量化 按照比特分配程序確定的比特?cái)?shù)對尾數(shù)進(jìn)行量化。 可查表得到。聲道組合聲道組合 利用人耳對高頻定位的特性。重組矩陣重組矩陣 左右聲

23、道具有相關(guān)性,利用“和”“差”的方法產(chǎn)生中間和邊聲道來代替左右聲道。2LRM2LRS動態(tài)范圍控制動態(tài)范圍控制 每個音頻塊傳送一個動態(tài)控制字。 在信號響度高于對話電平時降低增益,在信號響度低于對話電平時提高增益,信號接近對話電平時不需調(diào)節(jié)增益。Dolby AC-3 編碼器AC-3幀格式 SI:同步頭,包含獲取和保持同步的信息 BSI:比特流信息頭,包含描述編碼的音頻業(yè)務(wù)的參數(shù) AB:音頻塊,6個編碼音頻塊,每塊由256個采樣值的碼字構(gòu)成。 AUX:輔助數(shù)據(jù)字段 CRC:循環(huán)冗余校驗(yàn)碼 MPEG-2BC 后向兼容多聲道音頻編碼(與MPEG-1兼容)MPEG-2 AAC MPEG-2高級音頻編碼(與

24、MPEG-1不兼容)MPEG-2 BC 后向兼容多聲道音頻編碼標(biāo)準(zhǔn) 增加采樣率16KHz、22.05KHz、24KHz增加5.1聲道和7.1聲道環(huán)繞聲輸出碼率為8-640kbit/s MPEG-2 AAC 是MPEG-2標(biāo)準(zhǔn)中的一種非常靈活的聲音感知編碼標(biāo)準(zhǔn)。就像所有感知編碼一樣,MPEG-2 AAC主要使用聽覺系統(tǒng)的掩蔽特性來減少聲音的數(shù)據(jù)量,并且通過把量化噪聲分散到各個子帶中,用全局信號把噪聲掩蔽掉。 l與MPEG-1音頻算法不兼容l采樣頻率支持從8KHz96KHzl可支持48個主聲道,16個LFE聲道,16個多語言聲道,16個數(shù)據(jù)流l數(shù)據(jù)率比MP3低,但音質(zhì)更高。MPEG-2 AAC增益控制 把輸入信號劃分到4個等帶寬的子帶中。分析濾波器組 輸入信號從時域變換到頻域。采用MDCT。聽覺系統(tǒng)感知模型 心理聲學(xué)模型瞬時噪聲整形(TNS) 控制量化噪聲的瞬時形狀,解決掩蔽閾值和量化噪聲的錯誤匹配問題。 聲強(qiáng)/耦合和M/S編碼 利用和、差方法產(chǎn)生中間和邊聲道代替原來的左右聲道。預(yù)測 在信號較平穩(wěn)的情況下,利用時域預(yù)測減小信號的冗余度。量化無損編碼 采用Huffman編碼碼流打包組

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論