第3講數(shù)字聲音編碼

上傳人：c*** IP屬地：江西上傳時(shí)間：2022-04-24 格式：PPT 頁(yè)數(shù)：45 大?。?.13MB 積分：20 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩40頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、2022年4月24日第3章數(shù)字聲音編碼1 of 49第第3章章數(shù)字聲音編碼目錄數(shù)字聲音編碼目錄3.1 聲音簡(jiǎn)介聲音簡(jiǎn)介3.1.1 聲音是什么3.1.2 聲音的頻率范圍3.2 聲音信號(hào)數(shù)字化聲音信號(hào)數(shù)字化3.2.1 從模擬過(guò)渡到數(shù)字3.2.2 模擬信號(hào)與數(shù)字信號(hào)3.2.3 聲音信號(hào)數(shù)字化3.2.4 聲音質(zhì)量與數(shù)據(jù)率3.3 聲音工具聲音工具3.3.1 Windows自帶的聲音工具3.3.2 聲音編輯工具Goldwave3.3.3 聲音編輯工具Adobe Audition3.4聲音質(zhì)量的聲音質(zhì)量的MOS評(píng)分標(biāo)準(zhǔn)評(píng)分標(biāo)準(zhǔn)3.5 脈沖編碼調(diào)制脈沖編碼調(diào)制(PCM)3.5.1 PCM的概念3.5.2

2、均勻量化3.5.3 非均勻量化3.6 PCM在通信中的應(yīng)用在通信中的應(yīng)用3.6.1 頻分多路復(fù)用3.6.2 時(shí)分多路復(fù)用3.6.3 數(shù)字通信線路的數(shù)據(jù)傳輸率3.7 增量調(diào)制與自適應(yīng)增量調(diào)制增量調(diào)制與自適應(yīng)增量調(diào)制3.7.1 增量調(diào)制(DM)3.7.2 自適應(yīng)增量調(diào)制(ADM)3.8 自適應(yīng)差分脈沖編碼調(diào)制自適應(yīng)差分脈沖編碼調(diào)制3.8.1 自適應(yīng)脈沖編碼調(diào)制(APCM)的概念3.8.2 差分脈沖編碼調(diào)制(DPCM)的概念3.8.3 自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)3.8.4 G.726 ADPCM編譯碼器3.9 G.722 SB-ADPCM編譯碼器編譯碼器3.9.1 子帶編碼(SBC)3.9

3、.2 子帶-自適應(yīng)差分脈沖編碼調(diào)制(SB-ADPCM)3.10 GSM聲音簡(jiǎn)介聲音簡(jiǎn)介3.11 話音編碼標(biāo)準(zhǔn)摘要話音編碼標(biāo)準(zhǔn)摘要3.11.1 編碼算法的性能3.11.2 話音編碼標(biāo)準(zhǔn)參考文獻(xiàn)和站點(diǎn)參考文獻(xiàn)和站點(diǎn) 2022年4月24日第3章數(shù)字聲音編碼2 of 493.2 聲音信號(hào)數(shù)字化聲音信號(hào)數(shù)字化n數(shù)字化的概念數(shù)字化的概念采樣和量化n連續(xù)時(shí)間的離散化通過(guò)采樣來(lái)實(shí)現(xiàn)，就是每隔相等的一段時(shí)間采樣一次，這種采樣稱為均勻采樣(uniform sampling)n連續(xù)幅度的離散化通過(guò)量化(quantization)來(lái)實(shí)現(xiàn)，就是把信號(hào)的強(qiáng)度劃分成一小段一小段，如果幅度的劃分是等間隔的，就稱為線性量化，

4、否則就稱為非線性量化。圖3-2表示了聲音數(shù)字化的概念圖3-2 聲音的采樣和量化2022年4月24日第3章數(shù)字聲音編碼3 of 493.2 聲音信號(hào)數(shù)字化聲音信號(hào)數(shù)字化(續(xù)續(xù)1)n采樣頻率采樣頻率采樣頻率由根據(jù)奈奎斯特理論(Nyquist theory)確定n奈奎斯特理論指出，采樣頻率不應(yīng)低于聲音信號(hào)最高頻率的兩倍，這樣就能把以數(shù)字表達(dá)的聲音還原成原來(lái)的聲音，這叫做無(wú)損數(shù)字化(lossless digitization)假設(shè)被采樣信號(hào)的最高頻率為fmax，則采樣定律可用公式表示為max2sff讀者可這樣來(lái)理解奈奎斯特理論n聲音信號(hào)可看成是由許多正弦波組成的，一個(gè)振幅為A、頻率為f的正弦波至少

5、需要兩個(gè)采樣樣本表示，因此，如果一個(gè)信號(hào)中的最高頻率為fmax ,采樣頻率最低要選擇2 fmax 。例如，話音信號(hào)的最高頻率約為3.4 kHz，采樣頻率就選為8 kHz 2022年4月24日第3章數(shù)字聲音編碼4 of 493.2 聲音信號(hào)數(shù)字化聲音信號(hào)數(shù)字化(續(xù)續(xù)2)n采樣精度采樣精度度量聲音波形幅度的精確程度，用每個(gè)聲音樣本的位數(shù)(即bps)表示n例如每個(gè)聲音樣本用16位表示，測(cè)得的聲音樣本值是在065535范圍里的數(shù)，它的精度是1/65536n精度是在模擬信號(hào)數(shù)字化過(guò)程中度量模擬信號(hào)的最小單位，因此也稱量化階(quantization step size)n01 V的電壓用256個(gè)數(shù)表示

6、時(shí)，量化階等于1/256 V樣本位數(shù)的大小影響到聲音的質(zhì)量，位數(shù)越多，聲音質(zhì)量越高，所需存儲(chǔ)空間也越多；位數(shù)越少，聲音質(zhì)量就越低，所需存儲(chǔ)空間也越少 2022年4月24日第3章數(shù)字聲音編碼5 of 493.2 聲音信號(hào)數(shù)字化聲音信號(hào)數(shù)字化(續(xù)續(xù)3)采樣精度的另一種表示方法是信號(hào)噪聲比，簡(jiǎn)稱為信噪比(signal-to-noise ratio，SNR)，并用下式計(jì)算210102()10 log 20 log()signalsignalnoisenoiseVVSNRVV 其中，Vsignal表示信號(hào)電壓，Vnoise表示量化噪聲電壓(模擬信號(hào)的采樣值和與它最接近的數(shù)字?jǐn)?shù)值之間的差值)，SNR的單

7、位為分貝(db) 2022年4月24日第3章數(shù)字聲音編碼6 of 493.2 聲音信號(hào)數(shù)字化聲音信號(hào)數(shù)字化(續(xù)續(xù)4)n聲音質(zhì)量和數(shù)據(jù)率聲音質(zhì)量和數(shù)據(jù)率質(zhì)量度量質(zhì)量度量質(zhì)量采樣頻率(kHz)樣本精度(bit/s)單道聲/立體聲(未壓縮的)數(shù)據(jù)率(kb/s)頻率范圍(Hz)電話*88單道聲64.0 2003 400AM11.0258單道聲88.22015000FM22.05016立體聲705.6507000CD44.116立體聲1411.22020000DAT4816立體聲1536.02020000*電話使用m律編碼，動(dòng)態(tài)范圍為13位，壓縮后的樣本精度為8位2022年4月24日第3章數(shù)字聲音

8、編碼7 of 493.3 聲音工具聲音工具聲音工具(audio tools)是用來(lái)錄制、播放、編輯和分析聲音文件的軟件，在音樂(lè)節(jié)目的后期制作、多媒體音效制作和視像配音等方面有重要作用聲音工具使用相當(dāng)普遍，可供選擇的聲音工具相當(dāng)多，它們的功能相差很大筆者試用過(guò)多種聲音工具，包括Windows自帶的聲音工具，Goldwave，Cool Edit 2000，Cool Edit Pro 2.0和Adobe Audition等，下面介紹其中的幾種 2022年4月24日第3章數(shù)字聲音編碼8 of 493.3 聲音工具聲音工具(續(xù)續(xù)1)n3.3.1 Windows自帶的聲音工具自帶的聲音工具 Windo

9、ws操作系統(tǒng)自帶兩種聲音工具n(1) 錄音機(jī)：它的功能非常簡(jiǎn)單，只有錄音、播放和簡(jiǎn)單的編輯功能，但對(duì)測(cè)試Windows環(huán)境下的聲音系統(tǒng)是否正常工作非常有效。錄音機(jī)在錄制和播放聲音時(shí)的界面如圖3-3 (a)所示n(2) 媒體播放器(Windows Media Player)：主要用于播放聲音和影視節(jié)目，沒(méi)有編輯功能，播放音樂(lè)時(shí)的界面如圖3-3 (b)所示 2022年4月24日第3章數(shù)字聲音編碼9 of 493.3 聲音工具聲音工具(續(xù)續(xù)2)(a) Windows錄音機(jī)的錄放界面(b) Windows Media Player播放音樂(lè)時(shí)的界面圖3-3 Windows自帶的聲音工具 2022年4月

10、24日第3章數(shù)字聲音編碼10 of 493.3 聲音工具聲音工具(續(xù)續(xù)3)n3.3.2 聲音編輯工具聲音編輯工具Goldwave Goldwave5是1993年首次對(duì)外發(fā)行的聲音編輯軟件，它將聲音的編輯、播放、錄制、分析和格式轉(zhuǎn)換等功能集成在一起，2007年的版本是v5.2Goldwave可支持多種聲音文件格式、內(nèi)含聲音數(shù)據(jù)的影視文件格式及其格式之間的轉(zhuǎn)換，包括AIF，AU，AVI，MAT，MOV，MP3，SDS，SMP，SND，VOC，VOX，WAV等。Goldwave內(nèi)含豐富的聲音特效處理功能，如回聲、混響、淡入和淡出Goldwave軟件的界面如圖3-4所示。右邊是控制和顯示界面，左邊是

11、主界面。主界面從上到下分成3大部分：最上面是菜單欄和命令按鈕，中間是波形顯示窗口，下面是聲音文檔屬性欄 2022年4月24日第3章數(shù)字聲音編碼11 of 493.3 聲音工具聲音工具(續(xù)續(xù)4)圖3-4 Goldwave的用戶界面2022年4月24日第3章數(shù)字聲音編碼12 of 493.3 聲音工具聲音工具(續(xù)續(xù)5)n3.3.3 聲音編輯工具聲音編輯工具Adobe Audition Adobe Audition6是Adobe Systems公司于2003年5月從美國(guó)Syntrillium Software公司購(gòu)買(mǎi)的多音軌的數(shù)字聲音編輯器，原名為Cool Edit Pro 2.0，用戶界面經(jīng)過(guò)

12、修改并添加功能后于同年8月以Adobe Audition的名稱發(fā)行。 Adobe Audition 2.0是2007年的軟件版本，其直觀的和操作方便的用戶界面見(jiàn)圖3-5 Adobe Audition 2.0是專業(yè)級(jí)的聲音工具，集成了錄音、混音、分析、編輯等和包括原版盤(pán)制作(mastering)在內(nèi)的多種功能。與Goldwave一樣，Adobe Audition可支持多種聲音文件格式、影視文件內(nèi)含的聲音格式及其格式之間的轉(zhuǎn)換，包括AIF，AU，AVI，MAT，MOV，MP3，SDS，SMP，SND，VOC，VOX，WAV等 2022年4月24日第3章數(shù)字聲音編碼13 of 493.3 聲音工具

13、聲音工具(續(xù)續(xù)6)圖3-5 Adobe Audition的用戶界面2022年4月24日第3章數(shù)字聲音編碼14 of 493.4 聲音質(zhì)量的聲音質(zhì)量的MOS評(píng)分標(biāo)準(zhǔn)評(píng)分標(biāo)準(zhǔn)n聲音質(zhì)量的衡量方法聲音質(zhì)量的衡量方法聲音帶寬法n等級(jí)由高到低依次是DAT、CD、FM、AM和數(shù)字電話客觀質(zhì)量度量n用信噪比(SNR)表示，詳細(xì)計(jì)算請(qǐng)參看林福宗和陸達(dá)編寫(xiě)的多媒體與CD-ROM，1995.3清華大學(xué)出版社出版主觀質(zhì)量度量n度量方法類(lèi)似于電視節(jié)目中的歌手比賽，由評(píng)委對(duì)每個(gè)歌手的表現(xiàn)進(jìn)行評(píng)分，然后求出平均值有時(shí)同時(shí)采取兩種方法評(píng)估，有時(shí)以主觀質(zhì)量度量為主2022年4月24日第3章數(shù)字聲音編碼15 of 493

14、.4 聲音質(zhì)量的聲音質(zhì)量的MOS評(píng)分標(biāo)準(zhǔn)評(píng)分標(biāo)準(zhǔn)(續(xù)續(xù))n主觀平均分主觀平均分(mean opinion score，MOS) 對(duì)聲音主觀質(zhì)量度量比較通用的標(biāo)準(zhǔn)是5分制，各檔次的評(píng)分標(biāo)準(zhǔn)見(jiàn)表3-2 分?jǐn)?shù)質(zhì)量等級(jí)失真級(jí)別5優(yōu)(Excellent)無(wú)察覺(jué)4良(Good)(剛)察覺(jué)但不討厭3中(Fair)(察覺(jué))有點(diǎn)討厭2差(Poor)討厭但不反感1劣(Bad)極討厭(令人反感)表3-2 聲音質(zhì)量MOS評(píng)分標(biāo)準(zhǔn)2022年4月24日第3章數(shù)字聲音編碼16 of 493.5 脈沖編碼調(diào)制脈沖編碼調(diào)制(PCM)n脈沖編碼調(diào)制脈沖編碼調(diào)制(PCM)的概念的概念 PCM是pulse code modulat

15、ion的縮寫(xiě)概念上最簡(jiǎn)單、理論上最完善、最早研制成功、使用最為廣泛、數(shù)據(jù)量最大的編碼系統(tǒng)圖3-3 PCM編碼原理框圖2022年4月24日第3章數(shù)字聲音編碼17 of 493.5 脈沖編碼調(diào)制脈沖編碼調(diào)制(續(xù)續(xù)1)n在圖在圖3-3中中輸入是模擬信號(hào)，輸出是PCM樣本。防失真濾波器：低通濾波器，用來(lái)濾除聲音頻帶以外的信號(hào)波形編碼器：可理解為采樣器量化器：可理解為“量化階大小(step-size)”生成器或者稱為“量化間隔”生成器nPCM實(shí)際上是模擬信號(hào)數(shù)字化實(shí)際上是模擬信號(hào)數(shù)字化模擬聲音數(shù)字化的兩個(gè)步驟：第一步是采樣，就是每隔一段時(shí)間間隔讀一次聲音的幅度第二步是量化，就是把采樣得到的聲音信號(hào)幅

16、度轉(zhuǎn)換成數(shù)字值2022年4月24日第3章數(shù)字聲音編碼18 of 493.5 脈沖編碼調(diào)制脈沖編碼調(diào)制(續(xù)續(xù)2)n量化的方法量化的方法主要有均勻量化和非均勻量化均勻量化n采用相等的量化間隔/等分尺度量采樣得到的信號(hào)幅度，也稱為線性量化。量化后的樣本值Y和原始值X的差E=Y-X稱為量化誤差或量化噪聲圖3-4 均勻量化2022年4月24日第3章數(shù)字聲音編碼19 of 493.5 脈沖編碼調(diào)制脈沖編碼調(diào)制(續(xù)續(xù)3)n非均勻量化非均勻量化大的輸入信號(hào)采用大的量化間隔，小的輸入信號(hào)采用小的量化間隔可在滿足精度要求的情況下用較少的位數(shù)來(lái)表示聲音數(shù)據(jù)還原時(shí)，采用相同的規(guī)則采樣輸入信號(hào)幅度和量化輸出數(shù)據(jù)之間

17、定義了兩種對(duì)應(yīng)關(guān)系n律壓擴(kuò)算法nA律壓擴(kuò)算法注：壓擴(kuò)(companding)圖3-5 非均勻量化2022年4月24日第3章數(shù)字聲音編碼20 of 493.6 PCM在通信中的應(yīng)用在通信中的應(yīng)用n時(shí)分多路復(fù)用時(shí)分多路復(fù)用 PCM編碼早期主要用于話音通信中的多路復(fù)用時(shí)分多路復(fù)用是在同一條通信線路上使用不同時(shí)段“同時(shí)”傳送多個(gè)獨(dú)立信號(hào)的通信方法時(shí)分多路復(fù)用的核心思想是將時(shí)間分成等間隔的時(shí)段，為每對(duì)用戶指定一個(gè)時(shí)間間隔，每個(gè)間隔傳輸信號(hào)的一部分例如，話音信號(hào)的采樣頻率f8000 Hz/s，它的采樣周期125 s，這個(gè)時(shí)間稱為1幀(frame)。在這個(gè)時(shí)間里可容納的話路數(shù)有兩種規(guī)格n24路制n30路制

18、 2022年4月24日第3章數(shù)字聲音編碼21 of 493.6 PCM在通信中的應(yīng)用在通信中的應(yīng)用(續(xù)續(xù)1)n24路制的重要參數(shù)如下：路制的重要參數(shù)如下：每秒鐘傳送8000幀，每幀125s12幀組成1復(fù)幀(用于同步)。每幀由24個(gè)時(shí)間片(信道)和1位同步位組成每個(gè)信道每次傳送8位代碼，1幀有24 8 1193位(位)數(shù)據(jù)傳輸率R80001931544 kb/s每一個(gè)話路的數(shù)據(jù)傳輸率80008=64 kb/s圖3-6 24路PCM的幀結(jié)構(gòu) 2022年4月24日第3章數(shù)字聲音編碼22 of 493.6 PCM在通信中的應(yīng)用在通信中的應(yīng)用(續(xù)續(xù)2)n30路制的重要參數(shù)如下：路制的重要參數(shù)如下：每

19、秒鐘傳送8000幀，每幀125 s16幀組成1復(fù)幀(用于同步)每幀由32個(gè)時(shí)間片(信道)組成每個(gè)信道每次傳送8位代碼數(shù)據(jù)傳輸率：R80003282048 kb/s每一個(gè)話路的數(shù)據(jù)傳輸率80008=64 kb/s n線路利用率線路利用率使用時(shí)分多路復(fù)用技術(shù)時(shí)，由于當(dāng)信道無(wú)數(shù)據(jù)傳輸時(shí)仍給那個(gè)信道分配時(shí)間槽，因此線路利用率較低為解決這個(gè)問(wèn)題，開(kāi)發(fā)了統(tǒng)計(jì)時(shí)分多路復(fù)用技術(shù)(statistical time division multiplexing, STDM)。STDM是按照每個(gè)傳輸信道的傳輸需要來(lái)分配時(shí)間間隔的時(shí)分多路復(fù)用技術(shù)，可提高傳輸線路的效率 2022年4月24日第3章數(shù)字聲音編碼23 of

20、 493.6 PCM在通信中的應(yīng)用在通信中的應(yīng)用(續(xù)續(xù)3)n數(shù)字通信線路的數(shù)據(jù)傳輸率數(shù)字通信線路的數(shù)據(jù)傳輸率為反映PCM信號(hào)復(fù)用的復(fù)雜程度，通常用“群(group)”這個(gè)術(shù)語(yǔ)來(lái)表示，也稱為數(shù)字網(wǎng)絡(luò)的等級(jí)傳輸容量由一次群(基群)的30路(或24路)，增加到二次群的120路(或96路)，三次群的480路(或384路)，圖3-7表示二次復(fù)用的示意圖。圖中的N表示話路數(shù)，無(wú)論N30還是N24，每個(gè)信道的數(shù)據(jù)率都是64 kb/s，經(jīng)過(guò)一次復(fù)用后的數(shù)據(jù)率就變成2048 kb/s(N30)或1544 kb/s(N24)在數(shù)字通信中n在北美，具有1544 kb/s數(shù)據(jù)率的線路叫做“T1遠(yuǎn)距離數(shù)字通信線路”，

21、提供這種數(shù)據(jù)率的服務(wù)級(jí)別稱為T(mén)1等級(jí)n在歐洲，具有2048 kb/s數(shù)據(jù)率的線路叫做“E1遠(yuǎn)距離數(shù)字通信線路”，提供這種數(shù)據(jù)率的服務(wù)級(jí)別稱為E1等級(jí)T1/E1，T2/E2，T3/E3，T4/E4和T5/E5的數(shù)據(jù)傳輸率見(jiàn)表3-32022年4月24日第3章數(shù)字聲音編碼24 of 493.6 PCM在通信中的應(yīng)用在通信中的應(yīng)用(續(xù)續(xù)4)時(shí)分多路復(fù)用示意圖時(shí)分多路復(fù)用示意圖圖3-7 二次復(fù)用示意圖 2022年4月24日第3章數(shù)字聲音編碼25 of 493.6 PCM在通信中的應(yīng)用在通信中的應(yīng)用(續(xù)續(xù)5)nT1/E1，T2/E2，T3/E3，T4/E4和和T5/E5的數(shù)據(jù)傳輸率的數(shù)據(jù)傳輸率注：在注

22、：在ITUITU的文件中，數(shù)據(jù)率用的文件中，數(shù)據(jù)率用kb/skb/s和和Mb/sMb/s做單位，因此該表沒(méi)有做單位，因此該表沒(méi)有用用kbpskbps和和MbpsMbps做單位做單位 2022年4月24日第3章數(shù)字聲音編碼26 of 493.7 增量調(diào)制與自適應(yīng)增量調(diào)制增量調(diào)制與自適應(yīng)增量調(diào)制n增量調(diào)制增量調(diào)制也稱調(diào)制(delta modulation，DM)，是一種預(yù)測(cè)編碼技術(shù)對(duì)實(shí)際的采樣信號(hào)與預(yù)測(cè)的采樣信號(hào)之差的極性進(jìn)行編碼。如果實(shí)際的采樣信號(hào)與預(yù)測(cè)的采樣信號(hào)之差的極性為“正”，則用“1”表示；相反則用“0”表示，或者相反由于DM編碼只須用1位對(duì)話音信號(hào)進(jìn)行編碼，所以DM編碼系統(tǒng)又稱為“1

23、位系統(tǒng)” n比較：PCM是對(duì)每個(gè)采樣信號(hào)的整個(gè)幅度進(jìn)行量化編碼圖3-8 DM波形編碼示意圖 2022年4月24日第3章數(shù)字聲音編碼27 of 493.7 增量調(diào)制與自適應(yīng)增量調(diào)制增量調(diào)制與自適應(yīng)增量調(diào)制(續(xù)續(xù))n自適應(yīng)增量調(diào)制自適應(yīng)增量調(diào)制(ADM) 根據(jù)輸入信號(hào)斜率的變化自動(dòng)調(diào)整量化階的大小，以使斜率過(guò)載和粒狀噪聲都減到最小。在檢測(cè)到斜率過(guò)載時(shí)開(kāi)始增大量化階，而在輸入信號(hào)的斜率減小時(shí)降低量化階n例如，宋(Song)在1971描述的ADM技術(shù)中提出：每當(dāng)輸出不變時(shí)量化階增大50%；每當(dāng)輸出值改變時(shí)，量化階減小50%n又如，由格林弗基斯(Greefkes)在1970年提出的連續(xù)可變斜率增量調(diào)制

24、(CVSD)的基本方法是：如果連續(xù)可變斜率增量調(diào)制器的輸出連續(xù)出現(xiàn)三個(gè)相同值時(shí)，量化階加一個(gè)大的增量，反之，就加一個(gè)小的增量。Motorola公司于20世界80年代初期開(kāi)發(fā)了實(shí)現(xiàn)CVSD算法的集成電路芯片，如MC3417/MC3517用于一般的數(shù)字通信，MC3418/MC3518用于數(shù)字電話。MC3417/MC3418用于民用，MC3517/MC3518用于軍用 2022年4月24日第3章數(shù)字聲音編碼28 of 493.8 自適應(yīng)差分脈沖編碼調(diào)制自適應(yīng)差分脈沖編碼調(diào)制n3.8.1 自適應(yīng)脈沖編碼調(diào)制自適應(yīng)脈沖編碼調(diào)制(APCM)的概念的概念 APCM是什么nadaptive pulse co

25、de modulation的縮寫(xiě)，中文術(shù)語(yǔ)為自適應(yīng)脈沖編碼調(diào)制n根據(jù)輸入信號(hào)幅度大小來(lái)改變量化階大小的一種波形編碼技術(shù)n自適應(yīng)n瞬時(shí)自適應(yīng)，即量化階的大小每隔幾個(gè)樣本就改變n音節(jié)自適應(yīng)，即量化階的大小在較長(zhǎng)時(shí)間里發(fā)生變化2022年4月24日第3章數(shù)字聲音編碼29 of 493.8 自適應(yīng)差分脈沖編碼調(diào)制自適應(yīng)差分脈沖編碼調(diào)制(續(xù)續(xù)1)改變量化階大小的方法(1)n前向自適應(yīng)(forward adaptation)：根據(jù)未量化的樣本值的均方根值來(lái)估算輸入信號(hào)的電平，以此來(lái)確定量化階的大小，并對(duì)其電平進(jìn)行編碼作為邊信息(side information)傳送到接收端n前向自適應(yīng)APCM的基本概念如

26、圖3-9 (a)所示S(k)Sr(k)緩沖器量化器量化階適配器逆量化器邊信道信道(a)前向自適應(yīng)圖3-9 APCM方塊圖 2022年4月24日第3章數(shù)字聲音編碼30 of 493.8 自適應(yīng)差分脈沖編碼調(diào)制自適應(yīng)差分脈沖編碼調(diào)制(續(xù)續(xù)2)改變量化階大小的方法(2)n后向自適應(yīng)(backward adaptation)：從量化器剛輸出的過(guò)去樣本中提取量化階信息。由于后向自適應(yīng)能在發(fā)收兩端自動(dòng)生成量化階，所以它不需要傳送邊信息。n后向自適應(yīng)APCM的基本概念如圖3-9 (b)所示Sr(k)信道量化器量化階適配器逆量化器S(k)量化階適配器(b)后向自適應(yīng)圖3-9 APCM方塊圖 2022年4月2

27、4日第3章數(shù)字聲音編碼31 of 493.8 自適應(yīng)差分脈沖編碼調(diào)制自適應(yīng)差分脈沖編碼調(diào)制(續(xù)續(xù)3)n3.8.2 差分脈沖編碼調(diào)制差分脈沖編碼調(diào)制(DPCM)的概念的概念 DPCM是什么nAPCM中文術(shù)語(yǔ)為差分脈沖編碼調(diào)制ndifferential pulse code modulation的縮寫(xiě)n利用樣本與樣本之間存在的信息冗余來(lái)進(jìn)行編碼的一種數(shù)據(jù)壓縮技術(shù)n基本思想：根據(jù)過(guò)去的樣本去估算下一個(gè)樣本信號(hào)的幅度大小，這個(gè)值稱為預(yù)測(cè)值，然后對(duì)實(shí)際信號(hào)值與預(yù)測(cè)值之差進(jìn)行量化編碼，從而就減少了表示每個(gè)樣本信號(hào)的位數(shù)n它與脈沖編碼調(diào)制(PCM)不同的是，PCM是直接對(duì)采樣信號(hào)進(jìn)行量化編碼，而DPCM是

28、對(duì)實(shí)際信號(hào)值與預(yù)測(cè)值之差進(jìn)行量化編碼，存儲(chǔ)或者傳送的是差值而不是幅度絕對(duì)值，這就降低了傳送或存儲(chǔ)的數(shù)據(jù)量。n可適應(yīng)大范圍變化的輸入信號(hào) 2022年4月24日第3章數(shù)字聲音編碼32 of 493.8 自適應(yīng)差分脈沖編碼調(diào)制自適應(yīng)差分脈沖編碼調(diào)制(續(xù)續(xù)4)DPCM原理n差分信號(hào)d(k)：離散輸入信號(hào)s(k)和預(yù)測(cè)器輸出的估算值se(k-1)之差n對(duì)d(k)進(jìn)行量化編碼，得到圖3-10 DPCM方塊圖 ( )d k2022年4月24日第3章數(shù)字聲音編碼33 of 493.8 自適應(yīng)差分脈沖編碼調(diào)制自適應(yīng)差分脈沖編碼調(diào)制(續(xù)續(xù)5)n3.8.3 自適應(yīng)差分脈沖編碼調(diào)制自適應(yīng)差分脈沖編碼調(diào)制(ADPC

29、M)ADPCM的中文術(shù)語(yǔ)為自適應(yīng)差分脈沖編碼調(diào)制adaptive difference pulse code modulation的縮寫(xiě)綜合了APCM的自適應(yīng)特性和DPCM系統(tǒng)的差分特性，是一種性能比較好的波形編碼技術(shù)它的核心想法是：n利用自適應(yīng)的思想改變量化階的大小，即使用小的量化階(step-size)去編碼小的差值，使用大的量化階去編碼大的差值n使用過(guò)去的樣本值估算下一個(gè)輸入樣本的預(yù)測(cè)值，使實(shí)際樣本值和預(yù)測(cè)值之間的差值總是最小2022年4月24日第3章數(shù)字聲音編碼34 of 493.8 自適應(yīng)差分脈沖編碼調(diào)制自適應(yīng)差分脈沖編碼調(diào)制(續(xù)續(xù)6)ADPCM編碼框圖n如圖3-11所示 n接收端

30、的譯碼器使用與發(fā)送端相同的算法，利用傳送來(lái)的信號(hào)來(lái)確定量化器和逆量化器中的量化階大小，并且用它來(lái)預(yù)測(cè)下一個(gè)接收信號(hào)的預(yù)測(cè)值圖3-11 ADPCM方塊圖 2022年4月24日第3章數(shù)字聲音編碼35 of 493.9 G.722 SB-ADPCM編譯碼器編譯碼器nG.722推薦標(biāo)準(zhǔn)推薦標(biāo)準(zhǔn)507000 Hz的話音稱為寬帶話音1988年CCITT制定的，稱為“數(shù)據(jù)率為64 kb/s的7 kHz聲音信號(hào)編碼(7 kHz Audio-coding with 64 kb/s)”910該標(biāo)準(zhǔn)把話音信號(hào)的質(zhì)量由電話質(zhì)量提高到AM無(wú)線電廣播質(zhì)量，而其數(shù)據(jù)傳輸率仍保持為64 kb/s在可懂度和自然度方面都比帶

31、寬為3003400 Hz的話音有明顯提高，也更容易識(shí)別對(duì)方的說(shuō)話人采用的技術(shù)n子帶編碼(SBC)n自適應(yīng)差分脈沖調(diào)制(ADPCM)編碼2022年4月24日第3章數(shù)字聲音編碼36 of 493.9 G.722 SB-ADPCM編譯碼器編譯碼器(續(xù)續(xù)1)n子帶編碼子帶編碼(sub-band coding，SBC)用一組帶通濾波器(band-pass filter，BPF)把輸入聲音信號(hào)的頻帶分成若干個(gè)連續(xù)的頻段，每個(gè)頻段稱為子帶。對(duì)每個(gè)子帶中的聲音信號(hào)采用單獨(dú)的編碼方案去編碼在信道上傳送時(shí)，將每個(gè)子帶的代碼復(fù)合在一起；在接收端譯碼時(shí)，將每個(gè)子帶的代碼單獨(dú)譯碼，然后把它們組合起來(lái)，還原成原來(lái)的聲音

32、信號(hào)好處有兩個(gè)n可對(duì)每個(gè)子帶信號(hào)分別進(jìn)行自適應(yīng)控制，量化階的大小可按照每個(gè)子帶的能量電平加以調(diào)節(jié)。具有較高能量電平的子帶用大的量化階去量化，以減少總的量化噪聲n可根據(jù)每個(gè)子帶信號(hào)在感覺(jué)上的重要性，對(duì)每個(gè)子帶分配不同的位數(shù)，用來(lái)表示每個(gè)樣本值。2022年4月24日第3章數(shù)字聲音編碼37 of 493.9 G.722 SB-ADPCM編譯碼器編譯碼器(續(xù)續(xù)2)n例如，在低頻子帶中，為了保護(hù)音調(diào)就要求用較小的量化階、較多的量化級(jí)數(shù)，即分配較多的位數(shù)來(lái)表示樣本值。而話音中的摩擦音和類(lèi)似噪聲的聲音，通常出現(xiàn)在高頻子帶中，對(duì)它分配較少的位數(shù)SBC的方塊圖如圖3-13所示，圖中的編碼/譯碼器可以采用ADP

33、CM，APCM或PCM BPF 1 BPF 2 編碼器 BPF N 編碼器編碼器譯碼器譯碼器譯碼器 BPF 1 BPF 2 BPF N 分解器復(fù) 合器編碼信道譯碼 x(n) x(n) 圖3-13 子帶編碼方塊圖 2022年4月24日第3章數(shù)字聲音編碼38 of 493.9 G.722 SB-ADPCM編譯碼器編譯碼器(續(xù)續(xù)3)n聲音頻帶的分割聲音頻帶的分割可用樹(shù)型結(jié)構(gòu)的式樣進(jìn)行劃分n首先把整個(gè)聲音信號(hào)帶寬分成兩個(gè)相等帶寬的子帶：高頻子帶和低頻子帶n然后對(duì)這兩個(gè)子帶用同樣的方法劃分，形成4個(gè)子帶n這個(gè)過(guò)程可按需要重復(fù)下去，以產(chǎn)生2k個(gè)子帶，K為分割的次數(shù)n用這種辦法可以產(chǎn)

34、生等帶寬的子帶，也可以生成不等帶寬的子帶n例如，對(duì)帶寬為4000 Hz的聲音信號(hào)，當(dāng)K=3時(shí)，可分為8個(gè)相等帶寬的子帶，每個(gè)子帶的帶寬為500 Hz；也可生成5個(gè)不等帶寬的子帶，分別為0,500),500,1000)，1000,2000),2000,3000)和3000，4000 采用正交鏡像濾波器(quadrature mirror filter，QMF)來(lái)劃分頻帶 2022年4月24日第3章數(shù)字聲音編碼39 of 493.9 G.722 SB-ADPCM編譯碼器編譯碼器(續(xù)續(xù)4)nSB-ADPCM編譯碼器方框圖編譯碼器方框圖圖3-17 7 kHz聲音信號(hào)64 kb/s數(shù)據(jù)率的編譯碼方塊

35、圖音頻信號(hào)輸入 outX 發(fā)送正交鏡象濾波器高子帶 ADPCM 編碼器低子帶 ADPCM 編碼器高子帶 ADPCM 譯碼器低子帶 ADPCM 譯碼器多路復(fù) 合器多路分解器數(shù) 據(jù) 插入部件數(shù) 據(jù) 抽出部件附加數(shù)據(jù) 0, 8, 16 kbps 附加數(shù)據(jù) 0, 8, 16 kbps 聲音數(shù)據(jù) 傳送部件聲音數(shù)據(jù) 傳送部件音頻信號(hào)輸出 inX HX LX HY LY HI HI LI LI 16 kbps 16 kbps 48 kbps 48 kbps 接收正交鏡象濾波器 2022年4月24日第3章數(shù)字聲音編碼40 of 493.10 GSM編

36、譯碼器簡(jiǎn)介編譯碼器簡(jiǎn)介nGSM編譯碼器簡(jiǎn)介編譯碼器簡(jiǎn)介 GSM是Global System for Mobile communications的縮寫(xiě)，可譯成全球數(shù)字移動(dòng)通信系統(tǒng)GSM算法是1992年柏林技術(shù)大學(xué)(Technical University Of Berlin)根據(jù)GSM協(xié)議開(kāi)發(fā)的，這個(gè)協(xié)議是歐洲最流行的數(shù)字蜂窩電話通信協(xié)議。除了ADPCM算法已經(jīng)得到普遍應(yīng)用之外，還有一種使用較普遍的波形聲音壓縮算法叫做GSM算法，使用這種算法的編碼器稱為GSM編碼器2022年4月24日第3章數(shù)字聲音編碼41 of 493.10 GSM編譯碼器簡(jiǎn)介編譯碼器簡(jiǎn)介(續(xù)續(xù))nGSM的性能的性能GSM的

37、輸入：數(shù)據(jù)分成幀(frame)，一幀(20毫秒)由帶符號(hào)的160個(gè)樣本組成，每個(gè)樣本為13位或16位的線性PCM(linear PCM)碼n使用的采樣頻率為8 kHz時(shí)，如果每個(gè)樣本為16位，那么未壓縮的話音數(shù)據(jù)率為128 kb/sGSM的輸出：一幀(16016位)的數(shù)據(jù)壓縮成260位的GSM幀，相當(dāng)于13 kb/s。由于260位不是8位的整數(shù)倍，因此編碼器輸出的GSM幀為264位的線性PCM碼n使用GSM壓縮后的數(shù)據(jù)率為：(264位8000樣本/秒)/160樣本=13.2 千位/秒GSM的壓縮比：128:13.2 = 9.7，近似于10:12022年4月24日第3章數(shù)字聲音編碼42 of

38、 493.11 話音編碼標(biāo)準(zhǔn)摘要話音編碼標(biāo)準(zhǔn)摘要編碼器編碼器MOSMOS分分64 kb/s脈沖編碼調(diào)制(PCM)4.332 kb/s自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)4.116 kb/s低時(shí)延碼激勵(lì)線性預(yù)測(cè)編碼(LD-CELP)4.08 kb/s碼激勵(lì)線性預(yù)測(cè)編碼(CELP)3.73.8 kb/碼激勵(lì)線性預(yù)測(cè)編碼(CELP)3.02.4 kb/s線性預(yù)測(cè)編碼(LPC)2.5n編碼算法的性能編碼算法的性能表3-5 部分編碼器的MOS分 2022年4月24日第3章數(shù)字聲音編碼43 of 49第3章數(shù)字聲音編碼參考文獻(xiàn)1.ITU G系列推薦標(biāo)準(zhǔn)文檔的下載網(wǎng)址：/rec/T-REC-G/en.2.Thomas J. Lynch, Ph.D. Data Compression Techniques and Application. Van Nostrand Reinhold Company，19853.Thomas W. Parson

人人文庫(kù)> 全部分類(lèi)> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

第3講數(shù)字聲音編碼

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

第3講 數(shù)字聲音編碼

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔

第3講數(shù)字聲音編碼