數(shù)字音頻設(shè)計(jì)4教材_第1頁(yè)
數(shù)字音頻設(shè)計(jì)4教材_第2頁(yè)
數(shù)字音頻設(shè)計(jì)4教材_第3頁(yè)
數(shù)字音頻設(shè)計(jì)4教材_第4頁(yè)
數(shù)字音頻設(shè)計(jì)4教材_第5頁(yè)
已閱讀5頁(yè),還剩83頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)字音頻壓縮編碼技術(shù)問題:什么使音頻的壓縮成為可能?音頻壓縮-音頻壓縮可行性壓縮的可行性:音頻信號(hào)存在冗余時(shí)域冗余/相關(guān)性頻域冗余/相關(guān)性,例如可以去除在聽閾之外的頻率聽覺冗余,例如各種掩蔽效應(yīng)這些冗余使音頻數(shù)據(jù)壓縮成為可能問題:音頻編碼技術(shù)有哪些?如何分類?音頻壓縮-音頻編碼技術(shù)的分類按照編碼方法分:基于音頻數(shù)據(jù)的統(tǒng)計(jì)特性的編碼基本目標(biāo)是紀(jì)錄重建波形所需要的信息。典型的是PCM(脈沖編碼調(diào)制)PCM沒有壓縮,數(shù)據(jù)量大,存貯和處理不方便,改進(jìn)型為DPCM(差分)、APCM(自適應(yīng)量化)、ADPCM(自適應(yīng)差分)特點(diǎn):音質(zhì)好、壓縮比不大、數(shù)據(jù)碼率高基于音頻聲學(xué)參數(shù)的編碼把聲源看成一個(gè)隨時(shí)間變化的時(shí)變?yōu)V波器,通過編碼在不同時(shí)刻這個(gè)濾波器的參數(shù)達(dá)到數(shù)據(jù)壓縮和編碼的目的MPE:multipulseexcited多脈沖激勵(lì)RPE:regularpulseexcited等間隔脈沖激勵(lì)CELP:codeexcitedlinearpredictive碼激勵(lì)線性預(yù)測(cè)特點(diǎn):壓縮比高、碼率低,但是音頻質(zhì)量差,自然度低基于人的聽覺特性的編碼利用人的心理聲學(xué)模型(掩蔽效應(yīng))來壓縮聲音,目的是紀(jì)錄“聽覺上不失真”的聲音MPEG、DolbyAC-3按照用途分:話音編碼主要針對(duì)話音speech,要求碼率低,便于傳輸,上面的2常用于話音編碼音頻編碼主要針對(duì)音頻audio部分進(jìn)行編碼,要求一定的保真度和聲音的感覺還原(空間感、深度感等)問題:語(yǔ)音編碼技術(shù)有哪些種類?音頻壓縮-語(yǔ)音編碼技術(shù)的分類波形編譯碼器(waveformcoder):不利用生成音頻的信號(hào)的任何知識(shí),將音頻視為一種普通的聲音,直接對(duì)波形信號(hào)進(jìn)行采樣和量化。例如PCM、DPCM、ADPCM等。音源編譯碼器(Sourcecoder):也叫參數(shù)編譯碼器、聲碼器(vocoder)。它從音頻波形信號(hào)中提取生成音頻的參數(shù),使用這些參數(shù)通過音頻生成模型重構(gòu)出音頻?;旌暇幾g碼器(Hybridcoder):綜合使用上述兩種技術(shù)。使用的激勵(lì)信號(hào)波形盡可能接近于原始音頻信號(hào)的波形。例如CELP音頻壓縮-

三種語(yǔ)音編碼譯碼器性能特點(diǎn)波形編譯碼器(waveformcodec):音頻質(zhì)量高,數(shù)據(jù)率也高音源編譯碼器:數(shù)據(jù)率低,音頻質(zhì)量一般混合編譯碼器:使用了前兩種編譯碼器的技術(shù),數(shù)據(jù)率和音質(zhì)介于前兩者之間。問題:波形編譯碼器如何實(shí)現(xiàn)?音頻壓縮-波形編譯碼器基本思想:不利用音頻的任何特別知識(shí),構(gòu)造一種重構(gòu)信號(hào),該信號(hào)和原始的音頻信號(hào)盡可能的一致。特點(diǎn):復(fù)雜程度低音頻質(zhì)量好數(shù)據(jù)率需在16kb/s以上,在此之下,音頻質(zhì)量迅速降低音頻壓縮-波形編碼器的實(shí)現(xiàn)方法PCM:pulsecodemodulation脈沖編碼調(diào)制原理:音頻-〉采樣-〉量化已知:音頻帶寬3400Hz約4KHz,采樣頻率為4*2=8KHz,每個(gè)樣本量化后用12位數(shù)據(jù)比表示,可得數(shù)據(jù)傳輸率為:96Kb/s由于數(shù)據(jù)傳輸率比較高,通常采用壓擴(kuò)技術(shù)來減小數(shù)據(jù)傳輸率(解釋)將樣本值取對(duì)數(shù)(對(duì)數(shù)量化器),這樣可以將數(shù)據(jù)傳輸率減小到64kb/s標(biāo)準(zhǔn)化的壓擴(kuò)量化器:北美:μ律壓擴(kuò)標(biāo)準(zhǔn)歐洲:A律壓擴(kuò)標(biāo)準(zhǔn)問題:什么是預(yù)測(cè)編碼技術(shù)?音頻壓縮-

預(yù)測(cè)編碼技術(shù)和差分脈沖編碼調(diào)制原理:利用過去的樣本值來預(yù)測(cè)下一個(gè)樣本值。由于音頻的相關(guān)性,預(yù)測(cè)值和新樣本值的差值幅度會(huì)小于樣本幅度,記錄這個(gè)差值而不是樣本值就是差分脈沖編碼調(diào)制DPCM(differentialpulsecodemodulation)。DPCM對(duì)急劇變化的信號(hào)會(huì)產(chǎn)生較大的噪聲(解釋)我們從增量調(diào)制說起,因?yàn)樗禽^簡(jiǎn)單的預(yù)測(cè)編碼技術(shù)音頻壓縮-增量調(diào)制(△M)增量調(diào)制(delta

modulation,DM)是一種預(yù)測(cè)編碼技術(shù),是對(duì)實(shí)際的采樣信號(hào)與預(yù)測(cè)的采樣信號(hào)之差的極性進(jìn)行編碼,將極性變成“0”和“1”這兩種可能的取值之一。如果實(shí)際的采樣信號(hào)與預(yù)測(cè)的采樣信號(hào)之差的極性為“正”,則用“1”表示;相反則用“0”表示。DM編碼系統(tǒng)又稱為“1位系統(tǒng)”。因?yàn)橹灰?位對(duì)話音信號(hào)進(jìn)行編碼。下圖假設(shè)開始時(shí)輸入信號(hào)為0,預(yù)測(cè)值為0,編碼輸出x[0]=1。斜率過載(slopoverload):由于每次輸出最大變化只能為△,當(dāng)采樣信號(hào)急速變化時(shí),量化就不能反映信號(hào)的變化粒狀噪聲:在信號(hào)變化緩慢的位置,量化后的信號(hào)卻以△大小上下?lián)u擺,造成噪音斜率過載要求加大△,同時(shí)粒狀噪聲改善需要較小的△,這本身是一對(duì)矛盾音頻壓縮-自適應(yīng)增量調(diào)制(ADM)基本原理:根據(jù)輸入信號(hào)的斜率自動(dòng)調(diào)整量化階△,信號(hào)變化快,加大△,反之減小△。例如:如果兩次量化輸出不變,量化階增大50%,如果兩次量化輸出不同,減小50%量化階為什么這樣可以克服斜率過載和粒狀噪聲?連續(xù)可變斜率增量調(diào)制(CVSD:continuouslyvariableslopedeltamodulation):如果編碼器的輸出連續(xù)出現(xiàn)三個(gè)相同的值,量化階就加上一個(gè)大的增量;反之,就加一個(gè)小的增量。Motorola公司的MC34XX,MC35XX系列芯片實(shí)現(xiàn)了CVSD算法音頻壓縮-

(自適應(yīng))差分脈沖編碼調(diào)制原理

AdaptiveDifferentialPulseCodeModulation計(jì)算:假設(shè)采樣頻率為8KHz,采樣精度為16位,求PCM碼率?8K*16=128Kb/s如果采用壓擴(kuò)算法,我們能夠?qū)⒘炕祲嚎s到8位,可知碼率為:64Kb/s差分編碼能夠在此基礎(chǔ)上更有效地壓縮音頻數(shù)據(jù)ADPCM編碼原理:利用樣本與樣本之間的信息冗余來壓縮數(shù)據(jù)。DPCM(差分編碼調(diào)制)不是對(duì)采樣信號(hào)進(jìn)行編碼,而是對(duì)實(shí)際信號(hào)與預(yù)測(cè)信號(hào)之間的差值進(jìn)行編碼。ADPCM可以做到自適應(yīng):小量化階編碼小的差值,大量化階編碼大的差值(量化器)使用過去樣本值計(jì)算下一個(gè)輸入樣本的預(yù)測(cè)值,使得得到的差分最小(預(yù)測(cè)器)音頻壓縮-

差分脈沖編碼調(diào)制實(shí)現(xiàn)S(K)為PCM樣本值輸入用S(k)以前預(yù)測(cè)的樣本值Se(k-1)求差,算出差值d’(k)量化器量化d’(k),得到d(k)編碼d(k)得到輸出I(k)用d(k)經(jīng)過逆量化器求出dq(k),和以前預(yù)測(cè)的樣本值Se(k-1)求和得到Sr(k)將Sr(k)輸入預(yù)測(cè)器,估計(jì)下一次的樣本值返回第一步注意:在譯碼端,我們最后得到的輸出實(shí)際上是Sr(k),由上面的分析可知誤差為:e(k)=S(k)-Sr(k)=Se(k-1)+d’(k)-dq(k)-Se(k-1)=d’(k)-dq(k)所以:總量化誤差只和差值信號(hào)量化誤差有關(guān),不會(huì)帶來誤差累積d’(k)其實(shí)就是根據(jù)以往的編碼預(yù)測(cè)下一個(gè)編碼預(yù)測(cè)值,并編碼預(yù)測(cè)值和實(shí)際值的差值音頻壓縮-

自適應(yīng)差分脈沖編碼調(diào)制實(shí)現(xiàn)量化器預(yù)測(cè)器S(k)d’kdkSr(k)Se(k-1)-自適應(yīng)預(yù)測(cè)逆量化器自適應(yīng)量化階Dq(k)產(chǎn)生誤差將歷次Sr(k)輸入預(yù)測(cè)器作線性組合,可以得到更精確的預(yù)測(cè)值S(k-1)將歷次Sr(k)輸入自適應(yīng)量化階模塊,可以改變量化階的大小,圖中為后向自適應(yīng)音頻壓縮-

自適應(yīng)差分脈沖編碼調(diào)制的預(yù)測(cè)方程式線性預(yù)測(cè):如果ai是常數(shù),則為時(shí)不變線性預(yù)測(cè),否則為自適應(yīng)線性預(yù)測(cè)最簡(jiǎn)單的預(yù)測(cè)方程:本次預(yù)測(cè)值就是上次譯碼端的還原值最簡(jiǎn)單的DPCMS0121123344Se0012112334d輸r=Se+d0121123344音頻壓縮-

自適應(yīng)差分脈沖編碼調(diào)制實(shí)現(xiàn)方式APCM是一種根據(jù)輸入信號(hào)幅度大小自動(dòng)改變量化階大小的一種波形編碼技術(shù)。兩種類型:前向自適應(yīng)(FrowardAdaptation):采用未量化樣本值的均方根值估算輸入信號(hào)電平,并根據(jù)結(jié)果動(dòng)態(tài)調(diào)整量化階后向自適應(yīng)(backwardadaptation):從量化器剛輸出過的過去樣本中來計(jì)算新的量化階一般而言,量化階每隔幾個(gè)樣本就會(huì)發(fā)生變化,以適應(yīng)話音的變化問題:波形編碼方法還有其他類型么?是什么工作原理?音頻壓縮-頻域里的波形編碼方法原理:可以將音頻看作多個(gè)不同頻帶的波的組合,利用帶通濾波器可以將音頻分為不同的頻帶。同時(shí)利用離散余弦變換亦可分成許多頻帶。然后再對(duì)頻帶進(jìn)行編碼。SBC:Sub-BandCodec子帶編碼劃分子帶,每個(gè)子帶音頻分別編碼優(yōu)點(diǎn):每個(gè)子帶的噪聲僅和本子帶相關(guān)、對(duì)各子帶按照聽覺重要性不同可按需分配編碼位數(shù)、可使用自適應(yīng)分配位數(shù)方案缺點(diǎn):復(fù)雜、時(shí)延ATC:adaptivetransformcoding,自適應(yīng)變換編碼,利用快速離散余弦變換將音頻分為許許多多頻帶,然后編碼變換系數(shù),可獲得16kb/s的低數(shù)據(jù)傳輸率音頻壓縮-

子帶編碼SBC:SunbandCoding

原理:是一種在頻率域中進(jìn)行數(shù)據(jù)壓縮的方法。在子帶編碼中,首先用一組帶通濾波器將輸入信號(hào)分成若干個(gè)在不同頻段上的子帶信號(hào)對(duì)每個(gè)子帶分別編碼組合個(gè)子帶編碼值譯碼端執(zhí)行其逆過程優(yōu)點(diǎn):各子帶可以具有不同的量化階,可以減小總體噪聲每個(gè)子帶分配不同的編碼位數(shù),適應(yīng)人的聽力特點(diǎn)

由于各子帶分配不同的編碼位數(shù),可以起到壓縮數(shù)據(jù)的目的問題:子帶編碼還有其他的類型么?其主要解決的問題是什么?音頻壓縮-雙子帶SBC雙子帶ADPCM得到了廣泛的應(yīng)用,原理如上圖由于SBC中帶通濾波器不是理想濾波器,因此音頻信號(hào)可能出現(xiàn)混疊效應(yīng)(串?dāng)_)。解決方案是使用正交鏡象濾波器(QMF,quandrature

mirrorfilter)來劃分頻帶,混疊效應(yīng)可以抵消,如右圖所示。音頻壓縮-SBADPCM子帶自適應(yīng)差分脈沖編碼調(diào)制SBADPCM右圖為G.722標(biāo)準(zhǔn)7KHzAudio-codingwith64kb/sSBADPCM編碼譯碼框圖:由于G.722主要針對(duì)寬帶話音,所有在低子帶的話音帶寬部分使用了較多的編碼位數(shù)據(jù)插入部件用于在編碼和話音一道傳輸?shù)母郊訑?shù)據(jù)數(shù)據(jù)抽取部件用于抽取傳送的附加數(shù)據(jù)音頻壓縮-混合編譯碼器目的:尋找波形編碼和音源編碼之間的間隔,找到比波形碼率更低,比音源編碼聲音品質(zhì)更高的編譯碼器原理:以Abs(analysisbysynthesis)時(shí)域合成分析編譯碼器為例,將音源分為許多幀,尋找合適參數(shù)的激勵(lì)信號(hào),使得激勵(lì)信號(hào)的波形和音源幀波形最接近。然后編碼激勵(lì)信號(hào)參數(shù)。歷史上出現(xiàn)的有:MPE:multipulseexcited多脈沖激勵(lì)RPE:regularpulseexcited等間隔脈沖激勵(lì)CELP:codeexcitedlinearpredictive碼激勵(lì)線性預(yù)測(cè)音頻壓縮-Abs編譯碼器的結(jié)構(gòu)通過調(diào)節(jié)激勵(lì)信號(hào)u(n)使重構(gòu)信號(hào)s’(n)與話音信號(hào)s(n)的差值e(n)最小,編碼激勵(lì)信號(hào)的參數(shù)問題:怎么使差值最小呢?如何減少計(jì)算量?音頻壓縮-Abs問題和改進(jìn)為使e(n)最小,需要測(cè)試數(shù)目巨大的激勵(lì)信號(hào),需要減少計(jì)算量MPE:對(duì)每幀采用固定數(shù)目的激勵(lì)信號(hào),需要計(jì)算每個(gè)脈沖的位置和幅度

10Kb/s可獲得較好的音頻RPE:使用固定間隔的脈沖,只需要確定第一個(gè)脈沖的間隔和脈沖的幅度

歐洲GSM移動(dòng)電話13Kb/s

音質(zhì)好于MPECELP:用量化矢量來描述激勵(lì)參數(shù),量化矢量放到矢量量化大碼簿中,碼簿項(xiàng)決定激勵(lì)序列,因此只需要計(jì)算需要使用哪個(gè)碼表項(xiàng)決定的激勵(lì)序列即可。這使編碼器由RPE的47位減少到32位。如:1024項(xiàng)的碼表-〉10位,增益5位-〉15位

碼速率:4.8-16kb/s之間問題:上述的都是話音編碼方法,對(duì)于配音,通常是Audio素材,在Audio上,有哪些編碼方法呢?音頻壓縮-MPEG簡(jiǎn)介MPEG(Moving

PictureExpertGroup)是在1988年由國(guó)際標(biāo)準(zhǔn)化組織(InternationalOrganizationforStandardization,ISO)和國(guó)際電工委員會(huì)(InternationalElectrotechnical

Commission,IEC)聯(lián)合成立的專家組,負(fù)責(zé)開發(fā)電視圖像數(shù)據(jù)和聲音數(shù)據(jù)的編碼、解碼和它們的同步等標(biāo)準(zhǔn)。專家組開發(fā)的標(biāo)準(zhǔn)稱為MPEG標(biāo)準(zhǔn),到目前為止,已經(jīng)開發(fā)和正在開發(fā)的MPEG標(biāo)準(zhǔn)有:MPEG-1:數(shù)字電視標(biāo)準(zhǔn),1992年正式發(fā)布。MPEG-2:數(shù)字電視標(biāo)準(zhǔn)。MPEG-3:已于1992年7月合并到高清晰度電視(High-DefinitionTV,HDTV)工作組。MPEG-4:多媒體應(yīng)用標(biāo)準(zhǔn)(1999年發(fā)布)。MPEG-5:notdefinedMPEG-6:notdefinedMPEG-7:多媒體內(nèi)容描述接口標(biāo)準(zhǔn)(正在研究)。問題:MPEG標(biāo)準(zhǔn)的制定過程是怎樣的?音頻壓縮-活動(dòng)圖像專家組MPEGMPEG嚴(yán)格遵守著一條規(guī)則:最大范圍內(nèi)統(tǒng)一意見和制定標(biāo)準(zhǔn),最低限度地降低單個(gè)或少數(shù)幾個(gè)所有者的主要受益。成立以來,MPEG已經(jīng)形成為一個(gè)相當(dāng)大的委員會(huì),包含11個(gè)分組。出席MPEG會(huì)議的專家現(xiàn)在達(dá)到300~400人,未出席會(huì)議的專家則更多。這種機(jī)制能夠制定出在短期內(nèi)廣泛被接受的標(biāo)準(zhǔn),如:MPEG-2音頻壓縮-MPEG標(biāo)準(zhǔn)產(chǎn)生過程工作文件(WorkingDraft,WD):工作組(WorkingGroup,WG)準(zhǔn)備的工作文件委員會(huì)草案(CommitteeDraft,CD):從工作組WG準(zhǔn)備好的工作文件WD提升上來的文件。這是ISO文檔的最初形式,它由ISO內(nèi)部正式調(diào)查研究和投票表決。國(guó)際標(biāo)準(zhǔn)草案(DraftInternationalStandard,DIS):投票成員國(guó)對(duì)CD的內(nèi)容和說明滿意之后由委員會(huì)草案CD提升上來的文件。國(guó)際標(biāo)準(zhǔn)(InternationalStandard,IS):由投票成員國(guó)、ISO的其他部門和其他委員會(huì)投票通過之后出版發(fā)布的文件。問題:MPEG各個(gè)標(biāo)準(zhǔn)的主要應(yīng)用是什么?音頻壓縮-MPEG1&2應(yīng)用MPEG-1和-2標(biāo)準(zhǔn)已經(jīng)正式發(fā)布,并且得到廣泛應(yīng)用。MPEG-1MPEG-2(基本型)標(biāo)準(zhǔn)化時(shí)間1992年1994年(DIS)主要應(yīng)用CD-ROM上的數(shù)字電視,VCD數(shù)字TV,DVD空間分辨率CIF格式(1/4TV),288×360像素TV,576×720像素時(shí)間分辨率25-30幀/秒50-60場(chǎng)/秒位速率1.5Mbit/s15Mbit/s質(zhì)量相當(dāng)于VHS相當(dāng)于NTSC/PAL電視壓縮率20~3030~40音頻壓縮-MPEG4應(yīng)用MPEG-4的目標(biāo)是在異構(gòu)網(wǎng)絡(luò)環(huán)境下能夠高度可靠地工作,并且具有很強(qiáng)的交互功能。它是為視聽(audio-visual)數(shù)據(jù)的編碼和交互播放開發(fā)算法和工具,是一個(gè)數(shù)據(jù)速率很低的多媒體通信標(biāo)準(zhǔn)MPEG-4引入了對(duì)象基表達(dá)(object-basedrepresentation)的概念,用來表達(dá)視聽對(duì)象(audio/visualobjects,AVO)MPEG-4擴(kuò)充了編碼的數(shù)據(jù)類型,由自然數(shù)據(jù)對(duì)象擴(kuò)展到計(jì)算機(jī)生成的合成數(shù)據(jù)對(duì)象,采用合成對(duì)象/自然對(duì)象混合編碼(Synthetic/NaturalHybridCoding,SNHC)算法在實(shí)現(xiàn)交互功能和重用對(duì)象中引入了組合、合成和編排等重要概念MPEG-4將應(yīng)用在移動(dòng)通信和公用電話交換網(wǎng)(publicswitchedtelephonenetwork,PSTN)上,并支持可視電話(videophone)、電視郵件(videomail)、電子報(bào)紙(electronicnewspapers)和其他低數(shù)據(jù)傳輸速率場(chǎng)合下的應(yīng)用音頻壓縮-MPEG7應(yīng)用MPEG-7目的是制定一套描述符標(biāo)準(zhǔn),用來描述各種類型的多媒體信息及它們之間的關(guān)系,以便更快更有效地檢索信息,包括:靜態(tài)圖像、圖形、3D模型、聲音、話音、電視、面部特性和個(gè)人特性的表達(dá)以及在多媒體演示中它們之間的組合關(guān)系MPEG-7的應(yīng)用領(lǐng)域包括:數(shù)字圖書館(Digitallibrary),例如圖像目錄、音樂詞典等;多媒體目錄服務(wù)(multimediadirectoryservices),例如黃頁(yè)(yellowpages);廣播媒體的選擇,例如無(wú)線電頻道,TV頻道等;多媒體編輯,例如個(gè)人電子新聞服務(wù),多媒體創(chuàng)作等等。潛在應(yīng)用的應(yīng)用領(lǐng)域包括:教育、娛樂、新聞、旅游、醫(yī)療、購(gòu)物等等問題:MPEG1或2是如何壓縮音頻的?音頻壓縮-MPEG聲音MPEG音頻壓縮主要利用了人的心理聲學(xué)模型:頻域掩蔽人的耳朵對(duì)不同頻率的信號(hào)的感知程度不同某頻率的信號(hào)會(huì)掩蔽和其同時(shí)發(fā)出的其他不同頻率的信號(hào),這種效應(yīng)相對(duì)于該信號(hào)的低頻較不明顯,相對(duì)于該信號(hào)的高頻較明顯時(shí)域掩蔽超前掩蔽滯后掩蔽超前掩蔽很短,只有大約5~20ms,而滯后掩蔽可以持續(xù)50~200ms音頻壓縮-MPEG聲音之

臨界頻帶(criticalband)為從感知上來統(tǒng)一度量聲音頻率,引入了“臨界頻帶(criticalband)”的概念在20Hz到16kHz范圍內(nèi)有24個(gè)臨界頻帶臨界頻帶的單位叫Bark(巴克),1Bark=一個(gè)臨界頻帶的寬度頻率<500Hz的情況下,1Bark?f/100

頻率>500Hz的情況下,1Bark?9+4log(f/1000)臨界頻帶是從感知上來度量聲音的頻帶的,在同一個(gè)臨界頻帶內(nèi),聲音的聽覺特性基本相同由于要利用心理聲學(xué)模型,在壓縮時(shí)采用臨界頻帶而不是等分音頻帶寬效果要好一些音頻壓縮-MPEGAudio與感知特性MPEGAudio標(biāo)準(zhǔn)MPEG-1Audio、MPEG-2Audio和MPEG-2AAC(advancedaudiocoding)處理10Hz~20000Hz范圍里的聲音數(shù)據(jù)壓縮的的主要依據(jù)是人耳朵的聽覺特性使用“心理聲學(xué)模型(psychoacousticmodel)”來達(dá)到壓縮聲音數(shù)據(jù)音頻壓縮-MPEG心理聲學(xué)模型聽覺閾值聽覺系統(tǒng)中存在一個(gè)聽覺閾值電平,低于這個(gè)電平的聲音信號(hào)就聽不到,因此就可以把這部分信號(hào)去掉大多數(shù)人的聽覺系統(tǒng)對(duì)2kHz~5kHz之間的聲音最敏感,因此需要分配較多的編碼位數(shù)一個(gè)人是否能聽到聲音取決于聲音的頻率及聲音的幅度(是否高于這種頻率下的聽覺閾值)聽覺掩飾特性意思是聽覺閾值電平是自適應(yīng)的,聽覺閾值電平會(huì)隨聽到的不同頻率的聲音而發(fā)生變化聲音壓縮算法也可以確立這種特性的模型來消除冗余數(shù)據(jù)問題:MPEGAudio編碼有哪些類型?音頻壓縮-MPEGAudio編碼MPEGAudio采納兩種感知編碼:感知子帶編碼(perceptualsubbandcoding)DolbyAC-3編碼都利用心理聲學(xué)模型壓縮數(shù)據(jù)區(qū)別聯(lián)系:都是感知編碼具體算法不同DolbyAC-3支持5個(gè)通道,并采用浮點(diǎn)數(shù)計(jì)算感知子帶用從模擬音頻開始進(jìn)行壓縮,DolbyAC-3從PCM樣本開始?jí)嚎s,且采樣頻率必須是32kHz,44.1kHz或48kHz感知子帶編碼音頻壓縮-DolbyAC-3編碼特點(diǎn):輸入是PCM樣本支持多達(dá)5個(gè)音頻通道位速率:32~640kbps用浮點(diǎn)二進(jìn)制指數(shù)和尾數(shù)表示頻率系數(shù)音頻壓縮-MPEG-1AudioMPEG-1Audio世界上第一個(gè)高保真聲音數(shù)據(jù)壓縮國(guó)際標(biāo)準(zhǔn),得到了極其廣泛的應(yīng)用MPEG聲音標(biāo)準(zhǔn)是MPEG標(biāo)準(zhǔn)的一部分,但它也完全可以獨(dú)立應(yīng)用編碼對(duì)象:20~20000Hz的寬帶聲音不局限于哪一種聲源壓縮數(shù)據(jù)的基礎(chǔ)是量化,通過量化減小樣本位數(shù)壓縮數(shù)據(jù)要求量化失真對(duì)于人耳感覺不到實(shí)驗(yàn)表明:在256kb/s時(shí),壓縮比為6:1專業(yè)測(cè)試員很難察覺聲音的變化音頻壓縮-MPEG1聲音主要性能碼率:MPEG編碼器的輸入信號(hào)為線性PCM信號(hào),采樣率為32,44.1或48kHz,輸出為32kb/s~384kb/s。音頻壓縮-MPEG1壓縮層次MPEG聲音標(biāo)準(zhǔn)提供三個(gè)獨(dú)立的壓縮層次:層1(Layer1)、層2(Layer2)和層3(Layer3)用戶對(duì)層次的選擇可在復(fù)雜性和聲音質(zhì)量之間進(jìn)行權(quán)衡編碼器的輸出數(shù)據(jù)率為384kb/s,主要用于小型數(shù)字盒式磁帶(digitalcompactcassette,DCC)。編碼器的輸出數(shù)據(jù)率為256kb/s~192kb/s,其應(yīng)用包括數(shù)字廣播聲音(digitalbroadcastaudio,DBA)、數(shù)字音樂、CD-I(compact

disc-interactive)和VCD(video

compactdisc)等。編碼器的輸出數(shù)據(jù)率為64kb/s,主要應(yīng)用于ISDN上的聲音傳輸。層次算法壓縮率立體聲信號(hào)所對(duì)應(yīng)的位率(kb/s)1MUSICAM*4:13842MUSICAM*6:1~8:1256~1923ASPEC**10:1~12:1128~112音頻壓縮-MPEG1層3性能音質(zhì)要求聲音帶寬(kHz)方式數(shù)據(jù)率(kb/s)壓縮比電話2.5單聲道896:1優(yōu)于短波5.5單聲道1648:1優(yōu)于調(diào)幅廣播7.5單聲道3224:1類似于調(diào)頻廣播11立體聲56~6426~24:1接近CD15立體聲9616:1CD>15立體聲112~12812~10:1音頻壓縮-子帶編碼MPEG-1使用子帶編碼壓縮聲音數(shù)據(jù)子帶編碼的理論根據(jù)是聽覺系統(tǒng)的掩蔽特性,并且主要是利用頻域掩蔽特性:編碼過程中保留可聽到信號(hào)的帶寬而扔掉被掩蔽信號(hào)解碼或者叫做重構(gòu)的聲音信號(hào)與編碼之前的聲音信號(hào)不相同人的聽覺系統(tǒng)很難感覺到聲音之間的差別,對(duì)聽覺系統(tǒng)來說這種壓縮是“無(wú)損壓縮”MPEG-1聲音編碼器的結(jié)構(gòu)圖聲音信號(hào)經(jīng)過一個(gè)“時(shí)間-頻率多相濾波器組”變換到頻域里的多個(gè)子帶輸入聲音信號(hào)同時(shí)經(jīng)過“心理聲學(xué)模型”計(jì)算掩蔽特性該模型計(jì)算以頻率為自變量的噪聲掩蔽閾值(maskingthreshold)查看輸入信號(hào)和子帶中的信號(hào)以確定每個(gè)子帶里的信號(hào)能量與掩蔽閾值的比率“量化和編碼”部分用信掩比(signal-to-maskratio,SMR)來決定分配給子帶信號(hào)的量化位數(shù),使量化噪聲低于掩蔽閾值通過“數(shù)據(jù)流幀包裝”將量化的子帶樣本和其他數(shù)據(jù)按照規(guī)定的稱為“幀(frame)”的格式組裝成位數(shù)據(jù)流。音頻壓縮-MPEG-1掩蔽閾值和SMR信掩比是指最大的信號(hào)功率與全局掩蔽閾值之比掩蔽閾值曲線下的聲音會(huì)被掩蔽音頻壓縮-MPEG-1解碼器結(jié)構(gòu)圖解碼端不需要心理聲學(xué)模型,比較簡(jiǎn)單音頻壓縮-MPEG-1多相濾波器組用來分割子帶,把輸入信號(hào)變換到32個(gè)頻域子帶中去子帶的劃分方法有兩種線性劃分聲音頻帶劃分成帶寬相等的子帶這種劃分就不能精確地反映人耳的聽覺特性非線性劃分以“臨界頻帶”來劃分在一個(gè)臨界頻帶之內(nèi),很多心理聲學(xué)特性都是一樣的如圖在低頻區(qū)域,一個(gè)子帶覆蓋好幾個(gè)臨界頻帶線性劃分某個(gè)子帶中量化器的比特分配就不能根據(jù)每個(gè)臨界頻帶的掩蔽閾值進(jìn)行分配,而要以其中最低的掩蔽閾值為準(zhǔn)

圖9-12濾波器組的帶寬與臨界頻帶帶寬的比較[1]

9.3.5編碼層MPEG聲音壓縮定義了3個(gè)分明的層次,它們的基本模型是相同的。層1是最基礎(chǔ)的,層2和層3都在層1的基礎(chǔ)上有所提高。每個(gè)后繼的層次都有更高的壓縮比,但需要更復(fù)雜的編碼解碼器。MPEG聲音的每一個(gè)層都自含SBC編碼器,其中包含如圖9-09所示的“時(shí)間-頻率多相濾波器組”、“心理聲學(xué)模型(計(jì)算掩蔽特性)”、“量化和編碼”和“數(shù)據(jù)流幀包裝”,而高層SBC可使用低層SBC編碼的聲音數(shù)據(jù)。MPEG的聲音數(shù)據(jù)分成幀(frame),層1每幀包含384個(gè)樣本的數(shù)據(jù),每幀由32個(gè)子帶分別輸出的12個(gè)樣本組成。層2和層3每幀為1152個(gè)樣本,如圖9-13所示。

圖9-13層1、2和層3的子帶樣本MPEG編碼器的輸入以12個(gè)樣本為一組,每組樣本經(jīng)過時(shí)間-頻率變換之后進(jìn)行一次比特分配并記錄一個(gè)比例因子(scalefactor)。比特分配信息告訴解碼器每個(gè)樣本由幾位表示,比例因子用6比特表示,解碼器使用這個(gè)6比特的比例因子乘逆量化器的每個(gè)輸出樣本值,以恢復(fù)被量化的子帶值。比例因子的作用是充分利用量化器的量化范圍,通過比特分配和比例因子相配合,可以表示動(dòng)態(tài)范圍超過120DB的樣本。1.層1層1和層2的比較詳細(xì)的框圖如圖9-14所示。層1的子帶是頻帶相等的子帶,它的心理聲學(xué)模型僅使用頻域掩蔽特性。層1的“時(shí)間-頻率多相濾波器組”使用類似于離散余弦變換DCT(discretecosinetransform)的分析濾波器組進(jìn)行變換,以獲得詳細(xì)的信號(hào)頻譜信息。根據(jù)信號(hào)的頻率、強(qiáng)度和音調(diào),濾波器組的輸出可用來找出掩蔽閾值,然后組合每個(gè)子帶的單個(gè)掩蔽閾值以形成全局的掩蔽閾值。使用這個(gè)閾值與子帶中的最大信號(hào)進(jìn)行比較,產(chǎn)生信掩比SMR之后再輸入到“量化和編碼器”?!傲炕途幋a器”首先檢查每個(gè)子帶的樣本,找出這些樣本中的最大的絕對(duì)值,然后量化成6比特,這個(gè)比特?cái)?shù)稱為比例因子(scalefactor)?!傲炕途幋a器”然后根據(jù)SMR確定每個(gè)子帶的比特分配(bitallocation),子帶樣本按照比特分配進(jìn)行量化和編碼。對(duì)被高度掩蔽的子帶自然就不需要對(duì)它進(jìn)行編碼。

圖9-14ISO/MPEGaudio層1和層2編碼器和解碼器的結(jié)構(gòu)“數(shù)據(jù)流幀包裝”按規(guī)定的幀格式進(jìn)行包裝,實(shí)際上就是一個(gè)多路復(fù)合器MUX。層1的幀結(jié)構(gòu)如圖9-15所示。每幀都包含:①用于同步和記錄該幀信息的同步頭,長(zhǎng)度為32比特,它的結(jié)構(gòu)如圖9-16所示,②用于檢查是否有錯(cuò)誤的循環(huán)冗余碼CRC(cyclicredundancycode),長(zhǎng)度為16比特,③用于描述比特分配的比特分配域,長(zhǎng)度為4比特,④比例因子域,長(zhǎng)度為6比特,⑤子帶樣本域,⑥有可能添加的附加數(shù)據(jù)域,長(zhǎng)度未規(guī)定。

圖9-15層1的幀結(jié)構(gòu)

圖9-16MPEG聲音比特流同步頭的格式2.層2層2對(duì)層1作了一些直觀的改進(jìn),相當(dāng)于3個(gè)層1的幀,每幀有1152個(gè)樣本。它使用的心理聲學(xué)模型除了使用頻域掩蔽特性之外還利用了時(shí)間掩蔽特性,并且在低、中和高頻段對(duì)比特分配作了一些限制,對(duì)比特分配、比例因子和量化樣本值的編碼也更緊湊。由于層2采用了上述措施,因此所需的比特?cái)?shù)減少了,這樣就可以有更多的比特用來表示聲音數(shù)據(jù),音質(zhì)也比層1更高。層1是對(duì)一個(gè)子帶中的一個(gè)樣本組(由12個(gè)樣本組成)進(jìn)行編碼,而層2和層3是對(duì)一個(gè)子帶中的三個(gè)樣本組進(jìn)行編碼。圖9-13也表示了層2和層3的分組方法。如圖9-17所示,層2使用與層1相同的同步頭和CRC結(jié)構(gòu),但描述比特分配的位數(shù)(即比特?cái)?shù))隨子帶不同而變化:低頻段的子帶用4比特,中頻段的子帶用3比特,高頻段的子帶用2比特。層2比特流中有一個(gè)比例因子選擇信息(scalefactorselectioninformation,SCFSI)域,解碼器根據(jù)這個(gè)域的信息可知道是否需要以及如何共享比例因子。

圖9-17層2比特流數(shù)據(jù)格式3.層3層3使用比較好的臨界頻帶濾波器,把聲音頻帶分成非等帶寬的子帶,心理聲學(xué)模型除了使用頻域掩蔽特性和時(shí)間掩蔽特性之外,還考慮了立體聲數(shù)據(jù)的冗余,并且使用了霍夫曼(Huffman)編碼器。層3編碼器的詳細(xì)框圖如圖9-18所示。

圖9-18ISO/MPEGaudio層3編碼器和解碼器的結(jié)構(gòu)層3使用了從ASPEC(AudioSpectralPerceptualEntropyEncoding)和OCF(OptimalCodingInTheFrequencydomain)導(dǎo)出的算法,比層1和層2都要復(fù)雜。雖然層3所用的濾波器組與層1和層2所用的濾波器組的結(jié)構(gòu)相同,但是層3還使用了改進(jìn)離散余弦變換(modifieddiscretecosinetransform,MDCT),對(duì)層1和層2的濾波器組的不足作了一些補(bǔ)償。MDCT把子帶的輸出在頻域里進(jìn)一步細(xì)分以達(dá)到更高的頻域分辨率。而且通過對(duì)子帶的進(jìn)一步細(xì)分,層3編碼器已經(jīng)部分消除了多相濾波器組引入的混迭效應(yīng)。層3指定了兩種MDCT的塊長(zhǎng):長(zhǎng)塊的塊長(zhǎng)為18個(gè)樣本,短塊的塊長(zhǎng)為6個(gè)樣本,相鄰變換窗口之間有50%的重疊。長(zhǎng)塊對(duì)于平穩(wěn)的聲音信號(hào)可以得到更高的頻域分辨率,而短塊對(duì)跳變的聲音信號(hào)可以得到更高的時(shí)域分辨率。在短塊模式下,3個(gè)短塊代替1個(gè)長(zhǎng)塊,而短塊的大小恰好是一個(gè)長(zhǎng)塊的1/3,所以MDCT的樣本數(shù)不受塊長(zhǎng)的影響。對(duì)于給定的一幀聲音信號(hào),MDCT可以全部使用長(zhǎng)塊或全部使用短塊,也可以長(zhǎng)短塊混合使用。因?yàn)榈皖l區(qū)的頻域分辨率對(duì)音質(zhì)有重大影響,所以在混合塊長(zhǎng)模式下,MDCT對(duì)最低頻的2個(gè)子帶使用長(zhǎng)塊,而對(duì)其余的30個(gè)子帶使用短塊。這樣,既能保證低頻區(qū)的頻域分辨率,又不會(huì)犧牲高頻區(qū)的時(shí)域分辨率。長(zhǎng)塊和短塊之間的切換有一個(gè)過程,一般用一個(gè)帶特殊長(zhǎng)轉(zhuǎn)短或短轉(zhuǎn)長(zhǎng)數(shù)據(jù)窗口的長(zhǎng)塊來完成這個(gè)長(zhǎng)短塊之間的切換。除了使用MDCT外,層3還采用了其他許多改進(jìn)措施來提高壓縮比而不降低音質(zhì)。雖然層3引入了許多復(fù)雜的概念,但是它的計(jì)算量并沒有比層2增加很多。增加的主要是編碼器的復(fù)雜度和解碼器所需要的存儲(chǔ)容量。CopyRight?Octopus2000

音頻壓縮-MPEG-1編碼層MPEG聲音壓縮定義了3個(gè)分明的層次層1是最基礎(chǔ)的,層2和層3都在層1的基礎(chǔ)上有所提高每個(gè)后繼的層次都有更高的壓縮比,但需要更復(fù)雜的編碼解碼器MPEG聲音的每一個(gè)層都自含SBC編碼器,而高層SBC可使用低層SBC編碼的聲音數(shù)據(jù)。MPEG的聲音數(shù)據(jù)分成幀(frame),層1每幀包含384個(gè)樣本的數(shù)據(jù),每幀由32個(gè)子帶分別輸出的12個(gè)樣本組成。層2和層3每幀為1152個(gè)樣本通過比特分配和比例因子相配合,可以表示動(dòng)態(tài)范圍超過120DB的樣本MPEG的聲音數(shù)據(jù)分成幀(frame)層1每幀包含384個(gè)樣本的數(shù)據(jù),每幀由32個(gè)子帶分別輸出的12個(gè)樣本組成層2和層3每幀為1152個(gè)樣本音頻壓縮-MPEG-1層1層1的子帶是頻帶相等的子帶僅使用頻域掩蔽特性“時(shí)間-頻率多相濾波器組”使用類似于離散余弦變換DCT(discrete

cosinetransform)的分析濾波器組進(jìn)行變換,以獲得詳細(xì)的信號(hào)頻譜信息根據(jù)信號(hào)的頻率、強(qiáng)度和音調(diào),濾波器組的輸出可用來找出掩蔽閾值組合每個(gè)子帶的單個(gè)掩蔽閾值以形成全局的掩蔽閾值使用這個(gè)閾值與子帶中的最大信號(hào)進(jìn)行比較,產(chǎn)生信掩比SMR之后再輸入到“量化和編碼器”音頻壓縮-MPEG-1層1的幀結(jié)構(gòu)①用于同步和記錄該幀信息的同步頭②用于檢查是否有錯(cuò)誤的循環(huán)冗余碼CRC(cyclic

redundancycode)③用于描述比特分配的比特分配域④比例因子域⑤子帶樣本域⑥有可能添加的附加數(shù)據(jù)域,長(zhǎng)度未規(guī)定音頻壓縮-MPEG-1層2層2對(duì)層1作了一些直觀的改進(jìn),相當(dāng)于3個(gè)層1的幀,每幀有1152個(gè)樣本使用頻域掩蔽特性、時(shí)間掩蔽特性在低、中和高頻段對(duì)比特分配作了一些限制比特分配、比例因子和量化樣本值的編碼更緊湊音質(zhì)也比層1更高層1是對(duì)一個(gè)子帶中的一個(gè)樣本組(由12個(gè)樣本組成)進(jìn)行編碼,而層2和層3是對(duì)一個(gè)子帶中的三個(gè)樣本組進(jìn)行編碼層2使用與層1相同的同步頭和CRC結(jié)構(gòu),但描述比特分配的位數(shù)(即比特?cái)?shù))隨子帶不同而變化:低頻段的子帶用4比特,中頻段的子帶用3比特,高頻段的子帶用2比特層2比特流中有一個(gè)比例因子選擇信息(scalefactorselectioninformation,SCFSI)域,解碼器根據(jù)這個(gè)域的信息可知道是否需要以及如何共享比例因子音頻壓縮-MPEG-1層3使用比較好的臨界頻帶濾波器,把聲音頻帶分成非等帶寬的子帶使用頻域掩蔽特性和時(shí)間掩蔽特性之外,還考慮了立體聲數(shù)據(jù)的冗余使用了霍夫曼(Huffman)編碼器使用了從ASPEC(Audio

SpectralPerceptualEntropyEncoding)和OCF(Optimal

CodingInTheFrequencydomain)導(dǎo)出的算法使用了改進(jìn)離散余弦變換(modifieddiscretecosinetransform,MDCT),對(duì)層1和層2的濾波器組的不足作了一些補(bǔ)償MDCT把子帶的輸出在頻域里進(jìn)一步細(xì)分以達(dá)到更高的頻域分辨率而且通過對(duì)子帶的進(jìn)一步細(xì)分,層3編碼器部分消除了多相濾波器組引入的混迭效應(yīng)

計(jì)算量并沒有比層2增加很多。增加的主要是編碼器的復(fù)雜度和解碼器所需要的存儲(chǔ)容量,因此解碼性能還是很好的,可以在較小的解碼CPU時(shí)間占用下解碼問題:MPEG1Audio和MPEG2Audio有哪些異同?音頻壓縮-MPEG-2AudioMPEG-2標(biāo)準(zhǔn)委員會(huì)定義了兩種聲音數(shù)據(jù)壓縮格式:MPEG-2Audio,或者稱為MPEG-2多通道(Multichannel)聲音又稱為MPEG-2BC(BackwardCompatible因?yàn)樗cMPEG-1Audio是兼容)可用MPEG1播放其中的立體聲聲道MPEG-2AAC(AdvancedAudioCoding)通常稱為非后向兼容MPEG-2NBC(Non-Backward-Compatible)(因?yàn)樗cMPEG-1聲音格式不兼容)音頻壓縮-MPEG2BCMPEG-2Audio(ISO/IEC1117-3)標(biāo)準(zhǔn)都使用相同種類的編譯碼器,層-1,-2和-3的結(jié)構(gòu)也相同與MPEG-1標(biāo)準(zhǔn)相比,做了如下擴(kuò)充:增加了16kHz,22.05kHz和24kHz采樣頻率擴(kuò)展了編碼器的輸出速率范圍,由32~384kb/s擴(kuò)展到8~640kb/s,增加了聲道數(shù),支持5.1聲道和7.1聲道的環(huán)繞聲。支持LinearPCM(線性PCM)和DolbyAC-3(AudioCodeNumber3)編碼音頻壓縮-MPEG25.1&7.1環(huán)繞聲也稱為“3/2-立體聲加LFE”“.1”就是指LFE聲道。它的含義是播音現(xiàn)場(chǎng)的前面可有3個(gè)喇叭聲道(左、中、右),后面可有2個(gè)環(huán)繞聲喇叭聲道LFE(low

frequencyeffects)是低頻音效的加強(qiáng)聲道7.1聲道環(huán)繞立體聲與5.1類似問題:MPEG2Audio如何實(shí)現(xiàn)向后兼容?音頻壓縮-MPEG2多聲道擴(kuò)展這個(gè)標(biāo)準(zhǔn)稱為MPEG-2后向兼容多聲道聲音編碼(MPEG-2backwardscompatiblemultichannelaudiocoding)標(biāo)準(zhǔn),簡(jiǎn)稱為MPEG-2BC問題:MPEG-2AAC有哪些突出功能,這些功能有哪些具體應(yīng)用?音頻壓縮-MPEG2AACMPEG-2AAC是MPEG-2標(biāo)準(zhǔn)中的一種非常靈活的聲音感知編碼標(biāo)準(zhǔn):AAC支持的采用頻率可從8kHz到96kHzAAC編碼器的音源可以是單聲道的、立體聲的和多聲道的聲音AAC標(biāo)準(zhǔn)可支持48個(gè)主聲道、16個(gè)低頻音效加強(qiáng)通道LFE(lowfrequencyeffects)、16個(gè)配音聲道(overdubchannel)或者叫做多語(yǔ)言聲道(multilingualchannel)和16個(gè)數(shù)據(jù)流MPEG-2AAC在壓縮比為11:1,即每個(gè)聲道的數(shù)據(jù)率為(44.1×16)/11=64kb/s5個(gè)聲道的總數(shù)據(jù)率為320kb/s的情況下,很難區(qū)分還原后的聲音與原始聲音之間的差別與MPEG的層2相比,MPEG-2AAC的壓縮率可提高1倍,而且質(zhì)量更高,與MPEG的層3相比,在質(zhì)量相同的條件下數(shù)據(jù)率是它的70%音頻壓縮-MPEG2AAC的配置開發(fā)方法不同:MPEGAudio模塊化的方法MPEG-2AAC采用的方法是對(duì)整個(gè)系統(tǒng)進(jìn)行標(biāo)準(zhǔn)化,把整個(gè)AAC系統(tǒng)分解成一系列模塊,用標(biāo)準(zhǔn)化的AAC工具(advancedaudiocodingtools)對(duì)模塊進(jìn)行定義MPEG-2AAC模塊AAC標(biāo)準(zhǔn)定義了三種配置:低復(fù)雜性配置(LowComplexityProfile):不使用預(yù)測(cè)模塊和預(yù)處理模塊,瞬時(shí)噪聲定形(temporalnoiseshaping,TNS)濾波器的級(jí)數(shù)也有限,這就使聲音質(zhì)量比基本配置的聲音質(zhì)量低,但對(duì)計(jì)算機(jī)的存儲(chǔ)器和處理能力的要求可明顯減少基本配置(MainProfile):除了“增益控制(GainControl)”模塊之外,AAC系統(tǒng)使用了圖中所示的所有模塊,在三種配置中提供最好的聲音質(zhì)量

可變采樣率配置(ScalableSamplingRateProfile):使用增益控制對(duì)信號(hào)作預(yù)處理,不使用預(yù)測(cè)模塊,TNS濾波器的級(jí)數(shù)和帶寬也都有限制,因此它比基本配置和低復(fù)雜性配置更簡(jiǎn)單,可用來提供可變采樣頻率信號(hào)

音頻壓縮-MPEG2AAC模塊-編碼器增益控制(Gaincontrol)用在可變采樣率配置中,把輸入信號(hào)分離到4個(gè)相等帶寬的頻帶中。濾波器組是把輸入信號(hào)從時(shí)域變換到頻域的轉(zhuǎn)換模塊,采用了改進(jìn)離散余弦變換MDCT,使用了一種稱為時(shí)域混迭取消TDAC(timedomainaliasingcancellation)技術(shù)瞬時(shí)噪聲定形TNS解決掩蔽閾值和量化噪聲的錯(cuò)誤

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論