數(shù)字電視 第五章 模擬電視的數(shù)字音頻技術(shù)_第1頁
數(shù)字電視 第五章 模擬電視的數(shù)字音頻技術(shù)_第2頁
數(shù)字電視 第五章 模擬電視的數(shù)字音頻技術(shù)_第3頁
數(shù)字電視 第五章 模擬電視的數(shù)字音頻技術(shù)_第4頁
數(shù)字電視 第五章 模擬電視的數(shù)字音頻技術(shù)_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

5.1模擬電視的數(shù)字音頻技術(shù)5.1.1音頻信號的特點1.聲音:指由空氣振動引起耳膜振動并被人耳所感知的機械振動波。2.音頻信號:指帶有語音、音樂和音效等聲波的頻率、幅度變化信息的載體,是聲音轉(zhuǎn)換成的電信號。音頻信號的三個要素:音調(diào)、音強和音色音強:音色:音調(diào):指音頻信號的基波頻率(最低頻率)。指音頻信號的振動幅度,又稱音量。指音頻信號的所頻率成分。1/13/20231信息工程系5.1.2音頻信號的數(shù)字化1.基本依據(jù)包括對模擬信號的取樣、量化和編碼過程。數(shù)字音頻信號具有高保真、抗干擾能力強等特點。但需增加存儲和傳輸信道容量。

據(jù)取樣定理,音頻信號頻率為20Hz~20kHz,其采樣頻率須在40kHz以上。如CD:其采樣頻率為44.1kHz,量化精度16bit,1分鐘立體聲音頻信號需約10MB存儲容量,記錄幾十分鐘音樂就需幾百兆。研究表明:音頻信號直接PCM數(shù)字化,產(chǎn)生的數(shù)字碼流存在非常大冗余度,無損條件下聲音數(shù)據(jù)至少可進行4∶1壓縮,即只用25%的數(shù)據(jù)量就可保存所有的信息,所以需音頻壓縮。1/13/20232信息工程系5.1.3模擬電視的數(shù)字音頻技術(shù)---數(shù)字麗音NICAM技術(shù)1.NICAM特點(NearInstantaneousCompandedAudiomultiplex)其數(shù)據(jù)傳輸率為728kb/s,NICAM技術(shù)既可用于地面廣播,也可用于衛(wèi)星電視廣播。既可傳送立體聲節(jié)目,也可傳送雙語節(jié)目和數(shù)字信息,具有傳送聲音動態(tài)范圍大、音質(zhì)好、信噪比高、串音小等優(yōu)點。準瞬時壓擴聲音多路復用1/13/20233信息工程系2.NICAM技術(shù)原理(1)NICAM信號調(diào)制與發(fā)射預加重使音頻信號在A/D變換和恢復等過程中產(chǎn)生的噪聲降低。低通濾波器濾波避免取樣時產(chǎn)生頻譜混疊對交織后數(shù)據(jù)流擾碼處理降低數(shù)字聲音信號調(diào)制載波能量對模擬聲音信號和圖像信號的干擾。圖5-1NICAM信號調(diào)制、疊加、發(fā)射方框圖1/13/20234信息工程系(2)NICAM信號解調(diào)經(jīng)調(diào)諧器和準分離聲音解調(diào)得到中心頻率為5.65MHz(PALD制NICAM)的數(shù)字載波信號。圖5-2NICAM信號解調(diào)方框圖1/13/20235信息工程系5.2數(shù)字音頻壓縮編碼技術(shù)5.2.1音頻壓縮的基本依據(jù)1.聲音信息存在多種冗余度(1)樣值間有極大相關(guān)性,相鄰樣值間有最大相關(guān)性。(2)話音間隙冗余。通常打電話時,只有一個人在說話,且說話時字、詞及句之間會出現(xiàn)停頓,存在話音間隙。(3)通話間隔時會出現(xiàn)大量低電平樣值,且小幅度樣值比大幅度樣值出現(xiàn)概率大,量化時存在冗余度。指對原始數(shù)字音頻信號流(PCM碼)運用適當數(shù)字信號處理技術(shù),在不損失有用信息量,或所引入損失可忽略的條件下,降低(壓縮)其碼率。1/13/20236信息工程系2.聽覺的掩蔽效應指強音掩蓋住弱音,使其聽音降低的現(xiàn)象。它既和頻率域有關(guān),也和時間域有關(guān)。掩蔽效應是聲音壓縮編碼的基礎。一個較強的聲音往往會掩蓋住一個較弱的聲音,特別是當這兩個聲音處于相同的頻率范圍時。對于純音,一般低音容易掩蔽高音,而高音較難掩蔽低音。聲壓強度大的聲音信號出現(xiàn)之前和之后的短暫時間內(nèi)已存在的弱音信號也會被強信號掩蔽掉,分別稱為前掩蔽和后掩蔽。1/13/20237信息工程系5.2.2聲音壓縮編碼方法1.波形壓縮編碼法(1)原理依據(jù)人類聽覺心理,從原始取樣數(shù)據(jù)中壓縮掉冗余成分,即去掉聽不到的頻率分量。適合高保真語音及音樂信號壓縮編碼。在較高碼率條件下,可獲高質(zhì)量音頻重建信號,還原后的聲音基本上保持原樣。DPCM、ADPCM等波形預測編碼技術(shù)是語音及音樂數(shù)據(jù)壓縮技術(shù)的主要方法。當比特率低于16kbit/s時,用波形編碼產(chǎn)生的聲音質(zhì)量將迅速下降,須采用其他編碼方法。(2)特點1/13/20238信息工程系2.分析合成編碼法(基于參數(shù)的編碼方法)(1)原理(2)特點在分析發(fā)音機理的基礎上,用電學模型和電氣參數(shù)模擬發(fā)音器官,利用特征提取方法提取必要的模型參數(shù)和激勵信號的信息,并對這些信號進行編碼,最后輸出合成語音原始信號。數(shù)據(jù)量小,但計算量很大。由于聲音從發(fā)聲模型出發(fā),不是從波形出發(fā)仿真,所以保真難度較大,適用于對語音質(zhì)量不高的窄帶應用場合。僅對特征參數(shù)進行編碼,壓縮比可做得很高。1/13/20239信息工程系3.混合編碼壓縮法(1)心理聲學模型:將上述兩種編碼方法結(jié)合起來的編碼方法,可在較低的數(shù)碼率上得到較高的音質(zhì)。其音頻數(shù)據(jù)率在4~10kpbs之間,數(shù)據(jù)處理比波形編碼要復雜,但能獲得良好的音質(zhì)。對音樂信號還有熵編碼、自適應變換編碼(頻域編碼)、心理聲學模型和子帶壓縮等技術(shù)。利用掩蔽效應對信息量加以壓縮。對不同頻率信號分量分配不同量化比特數(shù)的方法控制量化噪聲,使噪聲的能量低于掩蔽閾值,從而使得人耳感覺不到量化過程的存在。MPEGlayer2、3和AAC標準及DolbyAC-3標準中都采用了心理聲學模型。1/13/202310信息工程系(2)子帶壓縮技術(shù)以子帶編碼理論為基礎,將信號分解為若干子頻帶內(nèi)的分量之和,然后對各子帶分量根據(jù)其不同的分布特性采取不同的壓縮策略以降低碼率。應用了心理聲學中的聲音掩蔽模型和動態(tài)比特分配技術(shù),在一定的碼率條件下,子帶壓縮技術(shù)可達到“完全透明”的聲音質(zhì)量(EBU音質(zhì)標準)。子帶壓縮技術(shù)目前廣泛應用于數(shù)字聲音節(jié)目的存儲與制作和數(shù)字化廣播中,典型的代表是MPEG-1層Ⅰ、層Ⅱ(MUSICAM)。1/13/202311信息工程系5.2.3高保真音頻信號壓縮編碼標準1.MUSICAM(1)前向自適應比特分配編解碼(掩蔽型自適應通用子帶綜合編碼和復用)利用人耳聽覺特性,用QMF(正交鏡像濾波器)或多相濾波器把聲音信號分割為多個子帶(4~64個),以不同量化特性對各子帶加以量化。在MUSICAM編碼中采用前向自適應比特分配。

圖5-3前向自適應比特分配編解碼框圖1/13/202312信息工程系(2)MUSICAM編解碼器原理圖5-4MUSICAM編解碼器原理框圖

1/13/202313信息工程系2.MPEG音頻壓縮編碼標準(1)系統(tǒng)的基本框架

MEPG1和MPEG2第三部分均是音頻壓縮編碼標準。MPEG2的音頻壓縮編碼標準除兼容MPEG1外,主要服務于多聲道、多語種,將MPEG1音頻取樣頻率向下擴展(16kHz、22.05kHz及24kHz),以降低傳輸碼率。MEPG1和MPEG2音頻壓縮編碼標準的結(jié)構(gòu)、幀格式等基本相同。層次1:簡化的MUSICAM;層次2:等同MUSICAM(AdaptiveSpectralPerceptual

EntroyCoding)-自適應頻譜感知熵編碼;層次3:ASPEC算法結(jié)合MUSICAM算法,并對層次1、層次2向下兼容的一類算法。1/13/202314信息工程系(2)MPEG音頻幀格式表5-1MPEG音頻層次Ⅰ的簡化幀格式表5-2MPEG音頻層次Ⅱ的簡化幀格式1/13/202315信息工程系圖5-4MPEG音頻編碼器的簡化方框圖(3)MPEG音頻編碼/解碼器1)MPEG音頻編碼器①

濾波器組該編碼器主要采用了心理聲學算法,MPEG1音頻數(shù)據(jù)壓縮以子帶編碼為基礎。為編碼器提供基本的頻率分割,層次Ⅰ與層次Ⅱ濾波器組使用32個子帶,每個子帶內(nèi)有12或36個樣本,編為一組進行處理。而層次Ⅲ濾波器組的分辨率與信號有關(guān),可有6×32或18×32個頻率樣本。1/13/202316信息工程系②

心理聲學模型③比特或噪聲分配④

碼流格式化器計算每一頻帶內(nèi)的“剛辨噪聲電平”用于比特或噪聲分配,以確定實際的量化器及量化值。對濾波器組的輸出樣本和心理聲學模型輸出進行分析,以調(diào)節(jié)比特分配或噪聲分配同時滿足碼率的要求及掩蔽的要求。層次Ⅰ與層次Ⅱ?qū)γ恳蛔訋釉际褂霉潭ǖ腜CM編碼,而層次Ⅲ對量化的頻率樣元采用霍夫曼編碼。1/13/202317信息工程系2)MPEG音頻解碼器圖5-4MPEG音頻解碼器的簡化方框圖1/13/202318信息工程系3.杜比AC3數(shù)字音頻編碼AC-1:通過4-2-4多聲道矩陣方式把聲道數(shù)減半,然后采用增量調(diào)制技術(shù)進行數(shù)字編碼。AC-2:基于變換技術(shù),壓縮率加倍,但多聲道矩陣處理技術(shù)仍然保留著。AC-3:可把五個獨立的全頻帶和一個超低音通道的信號實行統(tǒng)一編碼,成為單一的復合數(shù)據(jù)流。通道間的隔離度比矩陣時大為改善,兩個環(huán)繞通道互相獨立實現(xiàn)立體聲化,超低音道的音量可獨立控制。

AC-3是在AC-1和AC-2基礎上發(fā)展的多通道編碼技術(shù)。1/13/202319信息工程系(1)AC3編解碼技術(shù)圖5-5AC3編碼器原理框圖分析濾波器應用TDAC(TimeDomainAliasingCancellation,時域混疊消除法)變換,將音頻信號從時域變換到頻域,可,完全消除由于塊處理引入的冗余度。圖5-6AC-3解碼器原理框圖1/13/202320信息工程系(2)AC3同步幀格式(3)MUSICAM和AC-3的比較1)濾波器組的實現(xiàn)

MUSICAM和AC-3均需通過濾波器組把時域信號變?yōu)轭l域信號。AC-3據(jù)輸入信號特性動態(tài)地改變?yōu)V波器組的長度,以達到最佳時間和頻率分辨率。而MUSICAM采用固定長度的濾波器組,實現(xiàn)比較容易,但有時與輸入信號特性不能最佳匹配。1/13/202321信息工程系2)自適應比特分配3)硬件實現(xiàn)

MUSICAM采用前向自適應比特分配方案,而AC-3采用混合前向/后向自適應比特分配方案。

MUSICAM采用前向自適應比特分配,編碼器把解碼器必不可少的比特分配信息全部提供給了解碼器,因此,解碼器實現(xiàn)起來非常簡單。1/13/202322信息工程系5.3數(shù)字音頻廣播DAB5.3.1數(shù)字音頻廣播的特點(DigitalAudioBroadcasting)(1)音質(zhì)純凈,音質(zhì)可達CD水平。(2)抗干擾能力強,特別是抗多徑傳播引起的衰落能力強,可保證信號無差錯接收。DAB適合便攜和移動接收。(3)每個廣播電臺使用頻帶窄,增加可利用頻率數(shù)量,且可工作于不同頻段(VHF、UEF和L波段)。(4)發(fā)射機可工作于相同頻率并同步運行,可降低同步網(wǎng)中發(fā)射機的功率。DAB采用的單頻網(wǎng)技術(shù)能讓收聽者在不同信號區(qū)塊間使用同樣頻率收聽。(5)能夠提供傳送數(shù)據(jù)等多種新業(yè)務,不僅可以聽,還可以看,達到聲色俱全、圖文并茂的境界。(6)能提供更多數(shù)據(jù)業(yè)務。1/13/202323信息工程系5.3.2DAB的調(diào)制方式1.數(shù)字調(diào)頻廣播(數(shù)字FM)圖5-7尤里卡-147系統(tǒng)原理圖1/13/202324信息工程系2.數(shù)字調(diào)幅廣播世界數(shù)字廣播DRM(DigitalRadioM

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論