第5章音頻數(shù)據(jù)的壓縮編碼_第1頁(yè)
第5章音頻數(shù)據(jù)的壓縮編碼_第2頁(yè)
第5章音頻數(shù)據(jù)的壓縮編碼_第3頁(yè)
第5章音頻數(shù)據(jù)的壓縮編碼_第4頁(yè)
第5章音頻數(shù)據(jù)的壓縮編碼_第5頁(yè)
已閱讀5頁(yè),還剩21頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第5章音頻數(shù)據(jù)的壓縮編碼第5章音頻數(shù)據(jù)的壓縮編碼

明確人的聽(tīng)覺(jué)特性掌握音頻編碼的分類(lèi)及原理

掌握MPEG-1音頻編碼的原理和特點(diǎn)

了解MPEG-2音頻編碼學(xué)習(xí)目標(biāo)第5章音頻數(shù)據(jù)的壓縮編碼本章的主要內(nèi)容5.1概述5.2人的聽(tīng)覺(jué)特性5.3音頻信號(hào)的數(shù)字化5.4-5.85.9MPEG-1音頻編碼5.10MPEG-2音頻編碼5.12音頻壓縮編碼的國(guó)際標(biāo)準(zhǔn)小結(jié)5.1概述聲音是機(jī)械振動(dòng)在彈性介質(zhì)中傳播的機(jī)械波,稱(chēng)為聲波。聲音轉(zhuǎn)換為電信號(hào)時(shí),聲音的電信號(hào)在時(shí)間和幅度上都是連續(xù)的模擬信號(hào)。振幅周期●振幅—波的高低幅度,表示聲音的強(qiáng)弱●周期—兩個(gè)相鄰波之間的時(shí)間長(zhǎng)度●頻率—每秒鐘波振動(dòng)的次數(shù),單位是Hz●

聲音特性空氣、液體、固體●認(rèn)識(shí)聲音聲音的強(qiáng)度(響度或音量),與聲波振幅成正比;唱盤(pán)、CD盤(pán)等聲音載體中的音強(qiáng)不變,通過(guò)播放設(shè)備的音量控制可改變聆聽(tīng)時(shí)強(qiáng)度;音頻處理軟件可提高聲源音強(qiáng)聲音的特色,主要影響因素是復(fù)音;復(fù)音指具有不同頻率和不同振幅的混合聲音,其中最低頻率是“基音”,是聲音的基調(diào),其他頻率的聲音為“諧音(泛音)”代表聲音的高低,與頻率有關(guān);使用音頻處理軟件對(duì)聲音的頻率進(jìn)行調(diào)整時(shí),其音調(diào)也會(huì)隨之發(fā)生變化●聲音的三要素●音調(diào)——(高低)(高)(低)●音強(qiáng)——(強(qiáng)弱)(弱)(強(qiáng))(停)●音色——(特質(zhì))鋼琴吉他小號(hào)小提琴5.1概述音頻壓縮編碼研究的基本問(wèn)題在給定編碼速率的條件下,如何能夠得到盡量好的重建語(yǔ)音質(zhì)量;盡量減少編碼延時(shí);降低算法的復(fù)雜程度。音頻信號(hào)分為話(huà)音(人的說(shuō)話(huà)聲音)和一般聲音(如音樂(lè))兩類(lèi)。5.1概述音頻編碼分類(lèi)按照編碼速率來(lái)分:高速率(32kb/s以上)極低速率(1.2kb/s以下)中高速率(16-32kb/s)中速率(4.8-16kb/s)低速率(1.2-4.8kb/s)按照編碼方法來(lái)分:波形編碼參數(shù)編碼混合編碼5.2人的聽(tīng)覺(jué)特性聲音頻率是常用的描述聲音的參量,人耳所能感受到的聲音的頻率范圍在16HZ-16KHZ。聲壓及聲壓級(jí)SPL(SoundPressureLevel)也是常用的聲音描述參量。簡(jiǎn)單來(lái)說(shuō),聲壓就是聲音的壓力。5.2.1響度級(jí)和響度響度表征聲音的強(qiáng)弱響度的客觀(guān)測(cè)量單位聲壓dyn/cm(達(dá)因/平方厘米);聲強(qiáng)W/cm(瓦特/平方厘米)描述主觀(guān)聲音的強(qiáng)弱響度級(jí):方(phon);響度:宋(sone)225.2.1響度級(jí)和響度

人耳的等響度曲線(xiàn):實(shí)驗(yàn)表明,人耳感知的聲音強(qiáng)度是頻率和聲壓級(jí)的函數(shù),通過(guò)比較不同頻率和幅度的語(yǔ)音可以得到人耳的等響度曲線(xiàn)。圖5-1等響曲與聲強(qiáng)的關(guān)系5.2.2聽(tīng)覺(jué)靈敏度聽(tīng)閾:能引起人耳聽(tīng)到聲音時(shí)的聲壓稱(chēng)為聽(tīng)閾;聽(tīng)覺(jué)靈敏度:在給定頻率上,人耳能夠聽(tīng)到聲音的最小聲壓級(jí)。橫軸表示頻率,縱軸表示與這段信號(hào)相比其他頻率信號(hào)能被聽(tīng)到的強(qiáng)度,用分貝表示;從圖中看出,人耳對(duì)不同頻率的敏感程度差別很大,其中對(duì)2-4KHZ范圍的信號(hào)最為敏感,這個(gè)頻段以外,人耳的聽(tīng)覺(jué)靈敏度逐漸降低。5.2.3聽(tīng)覺(jué)掩蔽人耳聽(tīng)覺(jué)的掩蔽效應(yīng):

一個(gè)頻率聲音的聽(tīng)閾由于另一個(gè)聲音的存在而上升的現(xiàn)象稱(chēng)為掩蔽。在一個(gè)較強(qiáng)的聲音附近,相對(duì)較弱的聲音將不能被人耳察覺(jué),即被強(qiáng)音掩蔽。頻域掩蔽(同時(shí)掩蔽)當(dāng)音頻信號(hào)中存在多個(gè)信號(hào)時(shí),強(qiáng)信號(hào)會(huì)降低人耳對(duì)該信號(hào)頻域附近其他信號(hào)的敏感度,這種現(xiàn)象稱(chēng)為頻率掩蔽,也稱(chēng)同時(shí)掩蔽,是較強(qiáng)的掩蔽效應(yīng)。時(shí)域掩蔽(異時(shí)掩蔽)人耳聽(tīng)到一個(gè)強(qiáng)音后,會(huì)經(jīng)過(guò)一個(gè)短暫的延時(shí)才能聽(tīng)到較弱的聲音,稱(chēng)為時(shí)域掩蔽,也稱(chēng)異時(shí)掩蔽。超前掩蔽(5-20ms)滯后掩蔽(50-200ms)5.2.4臨界帶寬為了描述窄帶噪聲對(duì)純音信號(hào)的掩蔽效應(yīng),引入臨界帶寬的概念。臨界帶寬:一個(gè)純音可以被以它為中心頻率,并且有一定寬度的連續(xù)噪聲所掩蔽,如果在這一頻帶內(nèi)噪聲功率等于該純音的功率,這是該純音處于剛好能被聽(tīng)到的臨界狀態(tài),則稱(chēng)這一帶寬為臨界帶寬。

單位:巴克(Bark)1Bark=一個(gè)臨界帶寬5.3音頻信號(hào)數(shù)字化

轉(zhuǎn)換模擬信號(hào)數(shù)字信號(hào)采樣、量化、編碼5.3音頻信號(hào)數(shù)字化音頻信號(hào)頻率采樣頻率采樣量化保存為聲音文件開(kāi)始結(jié)束根據(jù)聲音頻帶、取樣頻率和樣本精度,通常把聲音分為五個(gè)等級(jí)(見(jiàn)表5-1)。由低到高為:電話(huà)、調(diào)幅(AM)廣播、調(diào)頻(FM)廣播、激光唱盤(pán)(CD)、數(shù)字錄音帶(DAT)5.4-5.8音頻編碼的分類(lèi)1.波形編碼

波形編碼是基于對(duì)語(yǔ)音信號(hào)波形的數(shù)字化處理,試圖使處理后重建的語(yǔ)音信號(hào)波形與原語(yǔ)音信號(hào)波形保持一致。

優(yōu)點(diǎn)是實(shí)現(xiàn)簡(jiǎn)單、語(yǔ)音質(zhì)量較好、適應(yīng)性強(qiáng)等。缺點(diǎn)是話(huà)音信號(hào)的壓縮程度不是很高,實(shí)現(xiàn)的碼速率比較高。常見(jiàn)的方法有:脈沖編碼調(diào)制PCM、差分脈沖編碼調(diào)制DPCM、自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)、子帶編碼(SBC)等。波形編碼的比特率一般在16至64KHZ之間,它有較好的話(huà)音質(zhì)量與成熟的技術(shù)實(shí)現(xiàn)方法。從第一個(gè)音頻編碼出現(xiàn)到現(xiàn)在,出現(xiàn)了很多壓縮編碼方法,可以將它們分為三類(lèi):波形編碼、參數(shù)編碼、混合編碼5.4-5.8音頻編碼的分類(lèi)2.參數(shù)編碼參數(shù)編碼又稱(chēng)聲源編碼,它是通過(guò)構(gòu)造一個(gè)人發(fā)聲的模型,以發(fā)音機(jī)制的模型作為基礎(chǔ),用一套模擬聲帶頻譜特性的濾波器系數(shù)和若干聲源參數(shù)來(lái)描述這個(gè)模型,在發(fā)送端從模擬語(yǔ)音信號(hào)中提取各個(gè)特征參量并對(duì)這些參量進(jìn)行量化編碼,以實(shí)現(xiàn)語(yǔ)音信息的數(shù)字化。

優(yōu)點(diǎn)是語(yǔ)音編碼速率較低,基本上在2kbit/s~9.6kbit/s之間。缺點(diǎn)合成語(yǔ)音質(zhì)量差,清晰度滿(mǎn)足要求而自然度不好,難以辨認(rèn)說(shuō)話(huà)人;電路實(shí)現(xiàn)復(fù)雜度比較高。常見(jiàn)的方法有:線(xiàn)性預(yù)測(cè)編碼LPC。

3.混和編碼

混和編碼將波形編碼和參量編碼結(jié)合起來(lái),力圖保持波形編碼話(huà)音的高質(zhì)量與參量編碼的低速率。

常見(jiàn)的方法有:碼激勵(lì)線(xiàn)性預(yù)測(cè)編碼器(CELP);感知編碼。

5.9MPEG-1音頻編碼--概述

MPEG-1音頻編碼是第一個(gè)高保真立體聲音頻壓縮標(biāo)準(zhǔn)。

為了保證其普遍性,MPEG-1提供了以下壓縮模式:

MPEG-1聲音標(biāo)準(zhǔn)規(guī)定其音頻信號(hào)采樣頻率可以有32kHz、44.1kHz或48kHz三種。應(yīng)用感知編碼和子帶編碼模型來(lái)對(duì)聲音數(shù)據(jù)進(jìn)行壓縮。音頻編碼提供三個(gè)獨(dú)立的壓縮層次:

Layer-1、Layer-2和Layer-3,使用戶(hù)可在復(fù)雜性和壓縮質(zhì)量之間權(quán)衡選擇。層次壓縮比輸出數(shù)據(jù)率算法應(yīng)用Layer14:1384kb/sMUSICAM簡(jiǎn)化版小型數(shù)字盒式磁帶Layer26:1-8:1192~256kb/sMUSICAM數(shù)字廣播音頻、數(shù)字音樂(lè)、VCDLayer310:1-12:164kb/sMUSICAM與ASPEC結(jié)合MP3、ISDN上的聲音傳輸5.9.2MPEG-1的心理聲學(xué)模型

5.9.3編碼層次1.第一層Layer-1的編碼Layer

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論