語音信號處理第五章課件_第1頁
語音信號處理第五章課件_第2頁
語音信號處理第五章課件_第3頁
語音信號處理第五章課件_第4頁
語音信號處理第五章課件_第5頁
已閱讀5頁,還剩122頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、1第5章 語音編碼25.1 概述概述1 5.2 語音編碼的分類及特性語音編碼的分類及特性 5.3 語音編碼性能的評價指標(biāo)語音編碼性能的評價指標(biāo)35.4 語音信號波形編碼語音信號波形編碼4 5.5 語音信號參數(shù)編碼語音信號參數(shù)編碼52第5章 語音編碼6 5.7 語音信號寬帶變速率編語音信號寬帶變速率編碼碼 7 5.6 語音信號混合編碼語音信號混合編碼35.1 概述 語音數(shù)字通信的優(yōu)越性主要體現(xiàn)在語音數(shù)字通信的優(yōu)越性主要體現(xiàn)在: 更好的話音質(zhì)量;更強(qiáng)的抗干擾性,易于進(jìn)行加更好的話音質(zhì)量;更強(qiáng)的抗干擾性,易于進(jìn)行加密;節(jié)省帶寬,更有效地利用網(wǎng)絡(luò)資源;更易于存儲密;節(jié)省帶寬,更有效地利用網(wǎng)絡(luò)資源;更易

2、于存儲和處理。和處理。 最簡單的數(shù)字化方法是直接對語音信號進(jìn)行模最簡單的數(shù)字化方法是直接對語音信號進(jìn)行模/數(shù)數(shù)轉(zhuǎn)換,只要滿足一定的采樣率和量化要求,就能夠得轉(zhuǎn)換,只要滿足一定的采樣率和量化要求,就能夠得到高質(zhì)量的數(shù)字語音。但這時語音的數(shù)據(jù)量仍舊非常到高質(zhì)量的數(shù)字語音。但這時語音的數(shù)據(jù)量仍舊非常大,因此在進(jìn)行傳輸和存儲之前,往往要對其進(jìn)行進(jìn)大,因此在進(jìn)行傳輸和存儲之前,往往要對其進(jìn)行進(jìn)行壓縮編碼,以減少其傳輸碼率或存儲量。行壓縮編碼,以減少其傳輸碼率或存儲量。4 傳輸碼率也稱為數(shù)碼率或編碼速率,表示傳輸傳輸碼率也稱為數(shù)碼率或編碼速率,表示傳輸每秒鐘語音信號所需的比特?cái)?shù)。每秒鐘語音信號所需的比特?cái)?shù)

3、。 語音編碼的目的:語音編碼的目的: 在保證語音音質(zhì)和可懂度的條件下,采用盡可在保證語音音質(zhì)和可懂度的條件下,采用盡可能少的比特?cái)?shù)來表示語音。能少的比特?cái)?shù)來表示語音。 通常所說的通常所說的“話音編碼話音編碼”,是特指通信傳輸系,是特指通信傳輸系統(tǒng)中代表口語發(fā)聲的統(tǒng)中代表口語發(fā)聲的300Hz3400Hz的信號。的信號。 本章以前面學(xué)習(xí)過的語音信號處理技術(shù)和方法本章以前面學(xué)習(xí)過的語音信號處理技術(shù)和方法為基礎(chǔ),介紹語音編碼基本原理和常用的編碼方法。為基礎(chǔ),介紹語音編碼基本原理和常用的編碼方法。55.2 語音編碼的分類及特性n 按編碼方式語音編碼分為三種:按編碼方式語音編碼分為三種:n 波形編碼波形編

4、碼n 參數(shù)編碼參數(shù)編碼n 混合編碼混合編碼6n 波形編碼是將時間域或變換域信號直接變波形編碼是將時間域或變換域信號直接變換為數(shù)字信號,力求使重建語音波形保持原始換為數(shù)字信號,力求使重建語音波形保持原始語音信號的波形形狀。語音信號的波形形狀。n 要求重建語音信號要求重建語音信號 的各個樣本盡可能的各個樣本盡可能地接近原始語音信號地接近原始語音信號s(n)的樣本值,因此在波形的樣本值,因此在波形編碼中,信噪比總是一個有用的性能評定標(biāo)準(zhǔn)。編碼中,信噪比總是一個有用的性能評定標(biāo)準(zhǔn)。n 5.2.1 波形編碼波形編碼)( ns7 波形編碼優(yōu)點(diǎn):波形編碼優(yōu)點(diǎn): 適應(yīng)能力強(qiáng),算法簡單,易于實(shí)現(xiàn),語音質(zhì)量好。適

5、應(yīng)能力強(qiáng),算法簡單,易于實(shí)現(xiàn),語音質(zhì)量好。 波形編碼缺點(diǎn):波形編碼缺點(diǎn): 編碼速率高,一般在編碼速率高,一般在16kbit/s64kbit/s之間。之間。 傳統(tǒng)的波形編碼方法分類:傳統(tǒng)的波形編碼方法分類: 脈沖編碼調(diào)制脈沖編碼調(diào)制(PCM) 自適應(yīng)增量調(diào)制自適應(yīng)增量調(diào)制(ADM) 自適應(yīng)差分脈沖編碼調(diào)制自適應(yīng)差分脈沖編碼調(diào)制(ADPCM) 8n脈沖編碼調(diào)制脈沖編碼調(diào)制PCM編碼速率編碼速率:64kbit/sn自適應(yīng)增量調(diào)制自適應(yīng)增量調(diào)制ADM編碼速率編碼速率:32kbit/s-16kbit/s n自適應(yīng)差分脈沖編碼調(diào)制自適應(yīng)差分脈沖編碼調(diào)制ADPCM編碼速編碼速率率:32kbit/s 9n5.

6、2.2 參數(shù)編碼參數(shù)編碼 n 參數(shù)編碼又稱聲碼器編碼,是將信源信參數(shù)編碼又稱聲碼器編碼,是將信源信號在頻域或其它變換域提取特征參數(shù),然后對號在頻域或其它變換域提取特征參數(shù),然后對這些特征參數(shù)進(jìn)行編碼和傳輸,在譯碼端再將這些特征參數(shù)進(jìn)行編碼和傳輸,在譯碼端再將接收到的數(shù)字信號譯成特征參數(shù),根據(jù)這些特接收到的數(shù)字信號譯成特征參數(shù),根據(jù)這些特征參數(shù)重建語音信號。征參數(shù)重建語音信號。n 這種編碼方法重建語音信號與原始語音這種編碼方法重建語音信號與原始語音信號樣本之間沒有一一對應(yīng)關(guān)系。信號樣本之間沒有一一對應(yīng)關(guān)系。n 合成語音的音質(zhì)好壞需要借助于主觀評合成語音的音質(zhì)好壞需要借助于主觀評定,缺少客觀的評定

7、標(biāo)準(zhǔn)。定,缺少客觀的評定標(biāo)準(zhǔn)。 n 10n 參數(shù)編碼優(yōu)點(diǎn)參數(shù)編碼優(yōu)點(diǎn):n 編碼速率低,且這類編碼器對講話環(huán)境編碼速率低,且這類編碼器對講話環(huán)境噪聲較敏感,需要安靜環(huán)境才能給出較高的可噪聲較敏感,需要安靜環(huán)境才能給出較高的可懂度。懂度。n 參數(shù)編碼器有:參數(shù)編碼器有:n 共振峰聲碼器共振峰聲碼器n 線性預(yù)測聲碼器線性預(yù)測聲碼器n 余弦聲碼器。余弦聲碼器。11n5.2.3 混合編碼混合編碼n 二十世紀(jì)二十世紀(jì)50年代產(chǎn)生混合編碼。年代產(chǎn)生混合編碼。n 優(yōu)點(diǎn):保留參數(shù)編碼技術(shù)精華,并引用波優(yōu)點(diǎn):保留參數(shù)編碼技術(shù)精華,并引用波形編碼準(zhǔn)則去優(yōu)化激勵源信號,克服了原有波形形編碼準(zhǔn)則去優(yōu)化激勵源信號,克服了

8、原有波形和參數(shù)編碼的弱點(diǎn),而吸取了它們各自的長處。和參數(shù)編碼的弱點(diǎn),而吸取了它們各自的長處。n 缺點(diǎn):算法復(fù)雜、運(yùn)算量很大。缺點(diǎn):算法復(fù)雜、運(yùn)算量很大。n 編碼速率:編碼速率:4kbit/s16kbit/sn 包括:多脈沖激勵線性預(yù)測編碼包括:多脈沖激勵線性預(yù)測編碼(MPELP)n 碼本激勵線性預(yù)測編碼碼本激勵線性預(yù)測編碼(CELP)125.2.4 語音壓縮編碼的依據(jù) n 語音編碼的目的:語音編碼的目的:n 在給定的編碼速率下,使編解碼后恢復(fù)在給定的編碼速率下,使編解碼后恢復(fù)出的重構(gòu)語音的質(zhì)量盡可能高。出的重構(gòu)語音的質(zhì)量盡可能高。n 提高語音編碼效率的基本途徑:提高語音編碼效率的基本途徑:n

9、充分利用語音信號冗余度和人耳的聽覺充分利用語音信號冗余度和人耳的聽覺特性。特性。n 語音的冗余度主要來源于兩個方面:語音的冗余度主要來源于兩個方面:n 語音信號幅度分布的非均勻性;語音信號幅度分布的非均勻性;n 語音樣點(diǎn)之間的相關(guān)性。語音樣點(diǎn)之間的相關(guān)性。13n 語音信號幅度統(tǒng)計(jì)特性:語音信號幅度統(tǒng)計(jì)特性:n 具有動態(tài)的、時變的、多維的暫態(tài)概率密具有動態(tài)的、時變的、多維的暫態(tài)概率密度分布的隨機(jī)過程。統(tǒng)計(jì)時間長度不同,它表現(xiàn)度分布的隨機(jī)過程。統(tǒng)計(jì)時間長度不同,它表現(xiàn)的概率密度分布形式不同。的概率密度分布形式不同。n 一般長時一般長時(幾十秒以上幾十秒以上)統(tǒng)計(jì)幅度特性接近統(tǒng)計(jì)幅度特性接近于于ga

10、mma分布分布,短時,短時(幾到幾十毫秒幾到幾十毫秒)統(tǒng)計(jì)幅度特統(tǒng)計(jì)幅度特性接近于性接近于高斯分布高斯分布。n 但無論哪種統(tǒng)計(jì)特性,語音信號總是小幅但無論哪種統(tǒng)計(jì)特性,語音信號總是小幅度出現(xiàn)概率大,大幅度出現(xiàn)概率小。度出現(xiàn)概率大,大幅度出現(xiàn)概率小。14n 語音信號具有冗余度的另一原因:語音語音信號具有冗余度的另一原因:語音樣點(diǎn)之間存在相關(guān)性。樣點(diǎn)之間存在相關(guān)性。n 利用語音信號的相關(guān)性,在時域上采用利用語音信號的相關(guān)性,在時域上采用短時和長時預(yù)測,在頻域上采用譜平整方法,短時和長時預(yù)測,在頻域上采用譜平整方法,可以達(dá)到壓縮編碼比特率的目的??梢赃_(dá)到壓縮編碼比特率的目的。15n 語音壓縮編碼的第

11、二個途徑是利用人耳語音壓縮編碼的第二個途徑是利用人耳的聽覺特性。的聽覺特性。n 人類聽覺有一個特點(diǎn):人類聽覺有一個特點(diǎn): “聽覺掩蔽效聽覺掩蔽效應(yīng)應(yīng)”,是指一個強(qiáng)音能抑制一個同時存在的弱,是指一個強(qiáng)音能抑制一個同時存在的弱音的聽覺。音的聽覺。n 聽覺掩蔽效應(yīng)在語音壓縮編碼中有非常聽覺掩蔽效應(yīng)在語音壓縮編碼中有非常重要的作用。重要的作用。16n 5.3 語音編碼性能的評價指標(biāo)語音編碼性能的評價指標(biāo)n n 評價一個語音編碼算法性能的基本指標(biāo)包評價一個語音編碼算法性能的基本指標(biāo)包括:括:n 編碼速率、語音質(zhì)量評價、編解碼延時以編碼速率、語音質(zhì)量評價、編解碼延時以及算法復(fù)雜度。及算法復(fù)雜度。n 這四個

12、因素之間有著密切的聯(lián)系,在具體這四個因素之間有著密切的聯(lián)系,在具體評價一種語音編碼算法的優(yōu)劣時,需要根據(jù)具體評價一種語音編碼算法的優(yōu)劣時,需要根據(jù)具體的實(shí)際情況,綜合考慮四個因素進(jìn)行性能評價。的實(shí)際情況,綜合考慮四個因素進(jìn)行性能評價。 n 175.3.1 編碼速率 n 編碼速率直接反映了語音編碼對語音信編碼速率直接反映了語音編碼對語音信息的壓縮程度。度量方法有:息的壓縮程度。度量方法有:n “比特比特/秒秒”(bit/s) :代表編碼的總速率,:代表編碼的總速率,一般用一般用I表示;表示;n “比特比特/樣點(diǎn)樣點(diǎn)”(bit/p):代表平均每個語:代表平均每個語音樣點(diǎn)編碼時所用的比特?cái)?shù),用音樣點(diǎn)

13、編碼時所用的比特?cái)?shù),用R表示。表示。n 平均每樣點(diǎn)比特?cái)?shù)平均每樣點(diǎn)比特?cái)?shù)R越高,語音質(zhì)量越越高,語音質(zhì)量越容易提高,對傳輸帶寬或存儲容量要求也就越容易提高,對傳輸帶寬或存儲容量要求也就越高。高。 18n 降低編碼速率是語音編碼的首要目標(biāo),根據(jù)編碼速降低編碼速率是語音編碼的首要目標(biāo),根據(jù)編碼速率和輸入語音的關(guān)系可將編碼器分成兩類:固定速率編碼率和輸入語音的關(guān)系可將編碼器分成兩類:固定速率編碼器和可變速率編碼器。器和可變速率編碼器。 n 現(xiàn)在大部分編碼標(biāo)準(zhǔn)都是固定速率編碼,其范圍為現(xiàn)在大部分編碼標(biāo)準(zhǔn)都是固定速率編碼,其范圍為0.5kbit/s64kbit/s。其中:。其中:n 保密電話的編碼速率為

14、:保密電話的編碼速率為:0.5kbit/s4.5kbit/sn 數(shù)字蜂窩移動電話和衛(wèi)星電話編碼器編碼速率為:數(shù)字蜂窩移動電話和衛(wèi)星電話編碼器編碼速率為: 3kbit/s13kbit/sn 蜂窩系統(tǒng)總的編碼速率達(dá)到:蜂窩系統(tǒng)總的編碼速率達(dá)到:20kbit/s30kbit/sn 普通電話網(wǎng)的編碼速率為:普通電話網(wǎng)的編碼速率為:16kbit/s64kbit/sn 寬帶編碼器編碼速率為:寬帶編碼器編碼速率為:45/56/64kbit/s19n 可變速率編碼是近年來出現(xiàn)的新技術(shù)??勺兯俾示幋a是近年來出現(xiàn)的新技術(shù)。根據(jù)統(tǒng)計(jì),兩方通話大約只有根據(jù)統(tǒng)計(jì),兩方通話大約只有40%的時間是真的時間是真正有聲音的,因

15、此一個自然的想法是采用通、正有聲音的,因此一個自然的想法是采用通、斷狀態(tài)編碼。通狀態(tài)對應(yīng)有聲期,采用固定編斷狀態(tài)編碼。通狀態(tài)對應(yīng)有聲期,采用固定編碼速率;斷狀態(tài)對應(yīng)無聲期,傳送極低速率信碼速率;斷狀態(tài)對應(yīng)無聲期,傳送極低速率信息(如背景噪聲特征等),甚至不傳送任何信息(如背景噪聲特征等),甚至不傳送任何信息。更復(fù)雜的多狀態(tài)編碼還可以根據(jù)網(wǎng)絡(luò)負(fù)荷、息。更復(fù)雜的多狀態(tài)編碼還可以根據(jù)網(wǎng)絡(luò)負(fù)荷、剩余存儲容量等外部因素調(diào)節(jié)其碼率。剩余存儲容量等外部因素調(diào)節(jié)其碼率。n 20n 可變速率編碼主要包括兩個算法:一是可變速率編碼主要包括兩個算法:一是話音激活檢測話音激活檢測(VAD),主要用于確定輸入信號,主要

16、用于確定輸入信號是語音還是背景噪聲;二是是語音還是背景噪聲;二是舒適噪聲的生成舒適噪聲的生成(CNG),主要用于接收端重建背景噪聲。,主要用于接收端重建背景噪聲。n 除以上兩種算法外,可變速率編碼還包除以上兩種算法外,可變速率編碼還包括 以 下 兩 個 關(guān) 鍵 技 術(shù) :括 以 下 兩 個 關(guān) 鍵 技 術(shù) : 速 率 判 決 技 術(shù)速 率 判 決 技 術(shù)(RDA,Rate Decision Algorithm)以及以及差錯隱藏。差錯隱藏。215.3.2 編碼質(zhì)量 n 編碼質(zhì)量評價是語音編碼性能的最根本指標(biāo),分為兩編碼質(zhì)量評價是語音編碼性能的最根本指標(biāo),分為兩類:主觀評價方法和客觀評價方法。類:

17、主觀評價方法和客觀評價方法。n 1語音質(zhì)量主觀評價方法語音質(zhì)量主觀評價方法 n 方法實(shí)現(xiàn):在一組測試者對原始語音和合成語音進(jìn)行方法實(shí)現(xiàn):在一組測試者對原始語音和合成語音進(jìn)行對比試聽的基礎(chǔ)上,根據(jù)某種事先約定的尺度來對語音質(zhì)量劃對比試聽的基礎(chǔ)上,根據(jù)某種事先約定的尺度來對語音質(zhì)量劃分等級。分等級。 常用的方法包括:常用的方法包括:n 平均意見得分平均意見得分MOS: Mean Opinion Score n 判斷韻字測試判斷韻字測試DRT:Diagnostic Rhyme Testn 判斷滿意度測量判斷滿意度測量DAM:Diagnostic Acceptabilityn Measure22n 主

18、觀評價方法符合人聽話時對語音質(zhì)量主觀評價方法符合人聽話時對語音質(zhì)量的感覺,目前得到了廣泛應(yīng)用。常用方法是平的感覺,目前得到了廣泛應(yīng)用。常用方法是平均意見得分均意見得分(Mean Opinion Score,簡稱,簡稱MOS得得分分)等。等。n MOS得分為五級評分標(biāo)準(zhǔn),如表得分為五級評分標(biāo)準(zhǔn),如表5.1所所示,多人收聽完測試語音后打分,求出平均值,示,多人收聽完測試語音后打分,求出平均值,為為MOS分。分。n 主觀評價方法一般都是由較大的通信組主觀評價方法一般都是由較大的通信組織來完成,個人很少采用??梺硗瓿?,個人很少采用。 n 23 MOS分分 質(zhì)量級別質(zhì)量級別 失真級別失真級別 5 優(yōu)優(yōu)不

19、覺察不覺察 4 良良剛有覺察剛有覺察 3 中中有覺察且稍覺可厭有覺察且稍覺可厭 2 差差明顯覺察且可厭但可忍明顯覺察且可厭但可忍受受 1 壞壞不可忍受不可忍受 242語音質(zhì)量客觀評價方法 n 該方法建立在原始語音和合成語音的數(shù)學(xué)對比之上,分為時該方法建立在原始語音和合成語音的數(shù)學(xué)對比之上,分為時域客觀評價和頻域客觀評價兩類。域客觀評價和頻域客觀評價兩類。n 時域客觀評價方法有信噪比、加權(quán)信噪比、平均分段信噪比等。時域客觀評價方法有信噪比、加權(quán)信噪比、平均分段信噪比等。n 頻域客觀評價方法有巴克譜失真測度頻域客觀評價方法有巴克譜失真測度BSD和和MEL譜測度等。譜測度等。n 特點(diǎn):特點(diǎn):計(jì)算簡單

20、、結(jié)果客觀、不受個人主觀因素的影響。計(jì)算簡單、結(jié)果客觀、不受個人主觀因素的影響。n 缺陷:缺陷:不能完全反映人類對語音的聽覺效果。不能完全反映人類對語音的聽覺效果。 25 分段分段SNR(SNRseg)評價法:評價法: 是把每隔是把每隔(10ms30ms)短時間所測定的短時間所測定的SNR的的dB值在長時間聲音區(qū)間取平均而得到的值來表示的值在長時間聲音區(qū)間取平均而得到的值來表示的方法,能夠反映出量化器對不同電平輸入段的量化方法,能夠反映出量化器對不同電平輸入段的量化質(zhì)量,具有與主觀值對應(yīng)比較好的特征。質(zhì)量,具有與主觀值對應(yīng)比較好的特征。 SNR是經(jīng)常采用的一種客觀評價方法。是經(jīng)常采用的一種客觀

21、評價方法。 265.45.4波形編碼波形編碼模擬信號數(shù)字化模擬信號數(shù)字化q 抽樣量化編碼抽樣量化編碼編碼方式編碼方式(1)波形編碼:時域波形變換為數(shù)字代碼序列。波形編碼:時域波形變換為數(shù)字代碼序列。n方法簡單方法簡單,重建信號的質(zhì)量好重建信號的質(zhì)量好,占用頻帶寬占用頻帶寬(2)參量編碼:參量編碼:-提取語音信號的特征參量提取語音信號的特征參量 ,再變,再變換為數(shù)字代碼。換為數(shù)字代碼。n方法復(fù)雜方法復(fù)雜,重建信號的質(zhì)量差重建信號的質(zhì)量差,占用頻帶窄占用頻帶窄27n數(shù)字化三步驟:抽樣、量化和編碼數(shù)字化三步驟:抽樣、量化和編碼抽樣信號抽樣信號量化信號t011011011100100100100編碼信

22、號28本節(jié)目錄n5.4.1 脈沖編碼調(diào)制脈沖編碼調(diào)制 (PCM)n5.4.2 差分脈碼調(diào)制差分脈碼調(diào)制 (DPCM)n5.4.3 增增 量量 調(diào)調(diào) 制制 ()295.4.1 脈沖編碼調(diào)制的基本原理nPCM是波形編碼中最重要的一種方式。是波形編碼中最重要的一種方式。q模擬信號為調(diào)制信號模擬信號為調(diào)制信號q二進(jìn)制脈沖序列為載波二進(jìn)制脈沖序列為載波q模擬信號的抽樣值改變脈沖序列的碼元取值,故模擬信號的抽樣值改變脈沖序列的碼元取值,故稱稱脈沖編碼調(diào)制(脈沖編碼調(diào)制(PCM)nPCM調(diào)制過程有抽樣、量化和編碼三個步驟。調(diào)制過程有抽樣、量化和編碼三個步驟。n電話語音信號的電話語音信號的PCM碼組由碼組由8

23、位二進(jìn)制碼組成。位二進(jìn)制碼組成。30 n脈沖編碼調(diào)制原理脈沖編碼調(diào)制原理q模擬信源模擬信源產(chǎn)生要傳輸?shù)哪.a(chǎn)生要傳輸?shù)哪M信號;擬信號;q預(yù)濾波器預(yù)濾波器為帶限濾波器;為帶限濾波器;q波形編碼器波形編碼器將模擬信號變將模擬信號變換成數(shù)字編碼信號;換成數(shù)字編碼信號;q信號經(jīng)傳輸?shù)竭_(dá)接收端,信號經(jīng)傳輸?shù)竭_(dá)接收端,在接收端再將數(shù)字編碼信在接收端再將數(shù)字編碼信號轉(zhuǎn)換成模擬信號。號轉(zhuǎn)換成模擬信號。31 1. 低通抽樣定理低通抽樣定理 抽樣定理:抽樣定理:一個頻帶限制在(一個頻帶限制在(0,fH)內(nèi)的連續(xù)信號)內(nèi)的連續(xù)信號x(t),如果抽樣頻率如果抽樣頻率fs大于或等于大于或等于2 fH ,則可以由樣值序列

24、,則可以由樣值序列x(nTs)無失真地重建原始信號無失真地重建原始信號x(n)。n通常進(jìn)行等間隔通常進(jìn)行等間隔T抽樣;抽樣;q理論上,抽樣過程理論上,抽樣過程 周期單位沖激脈沖周期單位沖激脈沖 模擬信號;模擬信號;q實(shí)際上,實(shí)際上,抽樣過程抽樣過程 周期性單位窄脈沖周期性單位窄脈沖 模擬信號;模擬信號; 5.4.2 抽樣32 n 時域中,抽樣信號可表示為:時域中,抽樣信號可表示為: 單位沖擊函數(shù)可表示為:單位沖擊函數(shù)可表示為: 故有:故有:n 頻域中,由于頻域中,由于 所以,有:所以,有:)()()(ttxtxTs)()(snTttnTssss( )( )( )( )()() ()Tnnx t

25、x ttx ttnTx nTtnT)2ssnTnT()()()()()()(sss121nXTXXnT)(ss1nXTn33 n 抽樣信號的時域與頻域?qū)φ眨撼闃有盘柕臅r域與頻域?qū)φ眨簳r域時域相乘相乘頻域頻域卷積卷積34 設(shè)理想低通傳遞函數(shù)為:設(shè)理想低通傳遞函數(shù)為: 則濾波器輸出為:則濾波器輸出為: 根據(jù)時域卷積定理,可獲得重建信號:根據(jù)時域卷積定理,可獲得重建信號:HH 0 1,)(HssHs1( )( )( )( ) rect(/2)( )XXHXXT)()()( thtxtxsnttTnTtnTxHHssssin1)()(nnTtnTtnTxT)()()(sHsHsssin1內(nèi)插公內(nèi)插公式

26、式35t恢復(fù)原信號的方法:恢復(fù)原信號的方法:頻域:頻域:當(dāng)當(dāng)fs 2fH時,用一個截止頻率為時,用一個截止頻率為fH的理想低通濾的理想低通濾波器就能夠從抽樣信號中分離出原信號。波器就能夠從抽樣信號中分離出原信號。時域:時域:當(dāng)用抽樣脈沖序列當(dāng)用抽樣脈沖序列通過通過此理想低通濾波器時,濾此理想低通濾波器時,濾波器的輸出就是一系列沖激響應(yīng)之和。這些沖激響應(yīng)之波器的輸出就是一系列沖激響應(yīng)之和。這些沖激響應(yīng)之和就構(gòu)成了原信號。和就構(gòu)成了原信號。n理想濾波器是不能實(shí)現(xiàn)的。實(shí)用濾波器的截止特性不可能理想濾波器是不能實(shí)現(xiàn)的。實(shí)用濾波器的截止特性不可能做到如此陡峭。所以,實(shí)用的抽樣頻率做到如此陡峭。所以,實(shí)用

27、的抽樣頻率fs必須比必須比2fH 大一些。大一些。q典型電話信號的最高頻率通常限制在典型電話信號的最高頻率通常限制在3400 Hz,而抽樣,而抽樣頻率通常采用頻率通常采用8000 Hz。365.4.3 量化n設(shè)模擬信號的抽樣值為設(shè)模擬信號的抽樣值為m(kT),其中,其中T是抽樣周期,是抽樣周期,k是整是整數(shù)。數(shù)。q此抽樣值仍然是一個取值連續(xù)的變量,有無窮多種取值。此抽樣值仍然是一個取值連續(xù)的變量,有無窮多種取值。n編碼時只能用有限種碼元來代表抽樣值。編碼時只能用有限種碼元來代表抽樣值。q若僅用若僅用N個不同的二進(jìn)制數(shù)字碼元來代表此抽樣值的大小,則個不同的二進(jìn)制數(shù)字碼元來代表此抽樣值的大小,則N

28、個個不同的二進(jìn)制碼元只能代表不同的二進(jìn)制碼元只能代表M = 2N個不同的抽樣值。個不同的抽樣值。n樣值無窮多種樣值無窮多種-編碼有限編碼有限-限制樣值的取值種類限制樣值的取值種類q必須將抽樣值的范圍劃分成必須將抽樣值的范圍劃分成M個區(qū)間,每個區(qū)間用一個電平表示。個區(qū)間,每個區(qū)間用一個電平表示。n共有共有M個離散電平,它們稱為個離散電平,它們稱為量化電平量化電平。n用這用這M個量化電平表示連續(xù)抽樣值的方法稱為個量化電平表示連續(xù)抽樣值的方法稱為量化量化。37 n用有限位數(shù)字表示抽樣值的過程即為量化。用有限位數(shù)字表示抽樣值的過程即為量化。q量化器的輸入輸出關(guān)系可表示為:量化器的輸入輸出關(guān)系可表示為:

29、 為量化電平,為量化電平, 為分層電平,為分層電平, 為量化間隔為量化間隔。1 , 1 2,kkkyQ xxxkL ,kykxkkkxx138 量化特性曲量化特性曲線線n圖圖a為均勻?yàn)榫鶆蛑猩?;中升型;n圖圖b為非均為非均勻中升型;勻中升型;n圖圖c為均勻?yàn)榫鶆蛑衅叫?;中平型;n圖圖d為非均為非均勻中平型。勻中平型。39 均勻量化特性和量化誤差均勻量化特性和量化誤差量化前的量化前的模擬信號模擬信號量化后的信量化后的信號:階梯波號:階梯波量化誤差:模擬量化誤差:模擬信號和量化信號信號和量化信號的差別的差別 40均勻量化的討論 n均勻量化器的應(yīng)用:均勻量化器的應(yīng)用:qA/D變換;變換;q遙控遙測

30、系統(tǒng)、儀表、圖像信號的數(shù)字化接口等;遙控遙測系統(tǒng)、儀表、圖像信號的數(shù)字化接口等;n均勻量化的不足:不適于數(shù)字電話的通信均勻量化的不足:不適于數(shù)字電話的通信q電話信號動態(tài)范圍大,采用均勻量化容易過載;電話信號動態(tài)范圍大,采用均勻量化容易過載;q動態(tài)范圍:滿足一定信噪比要求的信號取值范圍動態(tài)范圍:滿足一定信噪比要求的信號取值范圍q電話信號的信噪比要求要大于電話信號的信噪比要求要大于25dB,則需要,則需要12位編碼,位編碼,所需傳輸帶寬大;所需傳輸帶寬大;q語音信號取小信號的概率大,而均勻量化時信號幅度越語音信號取小信號的概率大,而均勻量化時信號幅度越小,小,SNR越低,通信質(zhì)量越差。越低,通信質(zhì)

31、量越差。n非均勻量化:小信號小階距量化,大信號大階距量化非均勻量化:小信號小階距量化,大信號大階距量化minmaxdBlg20R 保證通信質(zhì)量,減少編碼位數(shù),提高小信號的信噪比41例例5-1 5-1 正弦信號正弦信號 ,抽樣頻率,抽樣頻率 ,限定,限定抽樣時刻通過正弦波的零點(diǎn)。抽樣時刻通過正弦波的零點(diǎn)。 (1)(1)列出在正弦信號一個周期內(nèi)樣值序列列出在正弦信號一個周期內(nèi)樣值序列 的取值,畫出樣的取值,畫出樣值序列的時間波形圖;值序列的時間波形圖;(2)(2)樣值序列輸入如圖樣值序列輸入如圖5-13(b)5-13(b)所示的量化器,列出量化后所示的量化器,列出量化后 樣值序列,畫出量化后的樣值

32、序列的時間波形圖。樣值序列,畫出量化后的樣值序列的時間波形圖。解解 (1)(1)正弦信號的頻率正弦信號的頻率 ,抽樣頻率,抽樣頻率 ,在,在正弦信號的一個周期內(nèi)抽樣次數(shù)為正弦信號的一個周期內(nèi)抽樣次數(shù)為m,即,即抽樣的時間間隔為抽樣的時間間隔為 ,即,即相鄰樣值之間的相位間隔為相鄰樣值之間的相位間隔為 ,即,即 (36(36) ) ( )3.25sin(1600 )x tts8kHzf ( )x nq( )x n800Hzf s8kHzf 3s28 10108 10fmfcT)s(125108113scfT2 . 0101251600-642限定抽樣時刻通過正弦波的零點(diǎn),所以在正弦信號一個周期限

33、定抽樣時刻通過正弦波的零點(diǎn),所以在正弦信號一個周期內(nèi)內(nèi)x(n)的樣值序列可表示為的樣值序列可表示為V)(00sin25. 3)5()0( xxV)(88. 1)2 . 0sin(25. 3)4() 1 ( xxV)(08. 3)4 . 0sin(25. 3)3()2( xxV)(88. 1)2 . 1sin(25. 3)9()6( xxV)(08. 3)4 . 1sin(25. 3)8()7( xx樣值序列樣值序列x(n)的時間波形圖如圖的時間波形圖如圖5-17(a)5-17(a)所示。所示。(2)(2)量化器對樣值序列量化器對樣值序列x(n)進(jìn)行量化,量化后的樣值序列進(jìn)行量化,量化后的樣值序

34、列xq(n)為為V)(5 . 0)5()0(qq xxV)(5 . 1)4() 1 (qq xxV)(5 . 3)3()2(qq xxV)(5 . 3)8()7(qq xxV)(5 . 1)9()6(qq xx量化后的樣值序列的時間波形圖如圖量化后的樣值序列的時間波形圖如圖5-17(b)5-17(b)所示。所示??紤]到編碼的規(guī)則,在抽樣值的計(jì)算中均不進(jìn)行四舍五入的考慮到編碼的規(guī)則,在抽樣值的計(jì)算中均不進(jìn)行四舍五入的近似處理,直接將尾數(shù)舍去。近似處理,直接將尾數(shù)舍去。43圖圖5-17 例例5-1中的時間波形圖中的時間波形圖 (a) 樣值序列的時間波形圖樣值序列的時間波形圖 (b)量化后的樣值序列

35、的時間波形圖量化后的樣值序列的時間波形圖44 例例5-2 對頻率范圍為對頻率范圍為30 Hz 300 Hz的模擬信號進(jìn)行線性的模擬信號進(jìn)行線性PCM編碼。編碼。(1) 求最低抽樣頻率求最低抽樣頻率 ;(2) 若量化電平數(shù)若量化電平數(shù) L = 64,求,求PCM信號的信息速率信號的信息速率 。解:解:(1) 由模擬信號的頻率范圍可知,該信號應(yīng)作為低通信號由模擬信號的頻率范圍可知,該信號應(yīng)作為低通信號處理。最低抽樣頻率為處理。最低抽樣頻率為(2) 由量化電平由量化電平L可求出編碼位數(shù)可求出編碼位數(shù)n,即,即 PCM信號的信息速率為信號的信息速率為sfbR(Hz) 60030022Hsff664lo

36、glog22Lnbs60063 600 (bit/s)Rf n45 5.4.5 非均勻量化非均勻量化 為保證信號的為保證信號的SNR要求,又不能使編碼位數(shù)太要求,又不能使編碼位數(shù)太多。采用先壓縮后擴(kuò)張的非均勻量化方案,以減多。采用先壓縮后擴(kuò)張的非均勻量化方案,以減少編碼位數(shù)。少編碼位數(shù)。非線性變換,對信號非線性變換,對信號幅度范圍進(jìn)行壓縮幅度范圍進(jìn)行壓縮46非均勻量化的關(guān)鍵是非線性壓縮 n問題:非線性壓縮特性如何選擇?問題:非線性壓縮特性如何選擇?q目標(biāo):目標(biāo):獲得最佳壓縮特性獲得最佳壓縮特性n量化噪聲的平均功率最小量化噪聲的平均功率最小q量化噪聲的平均功率的基本公式量化噪聲的平均功率的基本公

37、式n對數(shù)壓縮特性對數(shù)壓縮特性q對數(shù)壓縮均勻量化對數(shù)量化對數(shù)壓縮均勻量化對數(shù)量化xxpyxxkxxLkkkd )()(212q147 5.4.6 對數(shù)量化及其折線近似對數(shù)量化及其折線近似nCCITT建議建議q對數(shù)壓縮特性:對數(shù)壓縮特性:A律;律;律律1. A律對數(shù)壓縮特性律對數(shù)壓縮特性 ( A law )q設(shè)量化器滿載電壓值為設(shè)量化器滿載電壓值為V, 信號幅度的歸一化信號幅度的歸一化值為值為qA律對數(shù)壓縮特性律對數(shù)壓縮特性nA為壓縮系數(shù),為壓縮系數(shù),A=1 時無壓縮,時無壓縮,A愈大壓縮效果愈明愈大壓縮效果愈明顯;顯;n0=x=1/A, 是線性函數(shù),特性曲線是一段直線是線性函數(shù),特性曲線是一段直

38、線n1/A=xf(it_)時,上升一個時,上升一個,發(fā),發(fā)“1”碼;碼;n 當(dāng)當(dāng)f(it)0,則,則Po(0)=1nt=t時,時, e(t)=f(t)-f(t_)0,則,則Po(t)=1nt=2t時,時,e(2t)=f(2t)-f(2t_)0,則,則Po(3t)=1;nt=4t時,時,e(4t)=f(4t)-f(4t_)0,則,則Po(5t)=1;nt=6t時,時,e(6t)=f(6t)-f(6t_)0,則,則Po(6t)=1;81 圖42 增量調(diào)制原理框圖f (t)抽 樣 判 決積 分 器f (t)T(t)e(t)Po(t)RC(a) 增 量 調(diào) 制 器 (編 碼 器 )框 圖(b) RC積

39、 分 器82n 以此類推,即可得到如圖以此類推,即可得到如圖43所示所示的波形。細(xì)心的讀者會發(fā)現(xiàn)圖的波形。細(xì)心的讀者會發(fā)現(xiàn)圖43中的中的f(t)和圖和圖41的波形不一樣。其實(shí),圖的波形不一樣。其實(shí),圖41的的階梯波只是為了形象地說明增量調(diào)制原理,階梯波只是為了形象地說明增量調(diào)制原理,而實(shí)際積分器的輸出波形如圖而實(shí)際積分器的輸出波形如圖43(d)所)所示。示。83圖43 增量調(diào)制過程示意圖 tt02t 3t 4t 5t 6t 7t 8t 9t10t11t12t13t14tT(t)(a) 抽 樣 脈 沖(b) 樣 值 信 號tt02t3t4t5t 6t 7t 8t 9t10t11t12t13t14

40、tf (t)f (t)84(d) 積分器輸出信號t110101111110000t02t 3t 4t 5t 6t 7t 8t 9t10t11t12t13t14tPo(t)t0f (t)圖43 增量調(diào)制過程示意圖 85n 4.1.3 M的解調(diào)原理的解調(diào)原理n 為了完成整個通信過程,發(fā)送端調(diào)為了完成整個通信過程,發(fā)送端調(diào)制出的信號必須在接收端通過解調(diào)恢復(fù)出制出的信號必須在接收端通過解調(diào)恢復(fù)出原始模擬信號。原始模擬信號。M信號的解調(diào)比較簡單,信號的解調(diào)比較簡單,用一個和本地解碼器一樣的積分器即可。用一個和本地解碼器一樣的積分器即可。在接收端和發(fā)送端的在接收端和發(fā)送端的積分器積分器一般都是一個一般都是

41、一個RC積分器。解調(diào)過程就是圖積分器。解調(diào)過程就是圖43中的積分中的積分過程。當(dāng)積分器輸入過程。當(dāng)積分器輸入“1”碼時,積分器輸碼時,積分器輸出產(chǎn)生一個正斜變的電壓并上升一個量化出產(chǎn)生一個正斜變的電壓并上升一個量化臺階臺階;而當(dāng)輸入;而當(dāng)輸入“0”碼時,積分器輸出電碼時,積分器輸出電壓就下降一個量化臺階壓就下降一個量化臺階。86n 為了保證解調(diào)質(zhì)量,對解碼器有兩個為了保證解調(diào)質(zhì)量,對解碼器有兩個要求:要求:n (1)每次上升或下降的大小要一致,)每次上升或下降的大小要一致,即正負(fù)斜率大小一樣。即正負(fù)斜率大小一樣。n (2)解碼器應(yīng)具有)解碼器應(yīng)具有“記憶記憶”功能,即功能,即輸入為連續(xù)輸入為連

42、續(xù)“1”或或“0”碼時,輸出能連續(xù)碼時,輸出能連續(xù)上升或下降。上升或下降。n 對積分器的輸出信號進(jìn)行低通濾波,對積分器的輸出信號進(jìn)行低通濾波,濾除波形中的高頻成分,即可得到與原始濾除波形中的高頻成分,即可得到與原始模擬信號十分近似的解調(diào)信號,如圖模擬信號十分近似的解調(diào)信號,如圖44所示。所示。87圖44 增量調(diào)制譯碼(解調(diào))示意圖積分器低通濾波Po(t)f (t)fo(t)(a) 增量解調(diào)器(譯碼器)框圖t0f (t)(b) 各點(diǎn)波形fo(t)88n 4.1.4 M調(diào)制存在的問題調(diào)制存在的問題n 增量調(diào)制盡管有前面所述的不少優(yōu)點(diǎn),但它增量調(diào)制盡管有前面所述的不少優(yōu)點(diǎn),但它也有兩個不足:一個是一

43、般量化噪聲問題也有兩個不足:一個是一般量化噪聲問題;另一個是過另一個是過載噪聲問題。兩者可統(tǒng)一稱為量化噪聲。載噪聲問題。兩者可統(tǒng)一稱為量化噪聲。n 觀察圖觀察圖41可以發(fā)現(xiàn),階梯曲線(調(diào)制曲線)可以發(fā)現(xiàn),階梯曲線(調(diào)制曲線)的最大上升和下降斜率是一個定值,只要增量的最大上升和下降斜率是一個定值,只要增量和時間和時間間隔間隔t給定,它們就不變。那么,如果原始模擬信號給定,它們就不變。那么,如果原始模擬信號的變化率超過調(diào)制曲線的最大斜率,則調(diào)制曲線就跟的變化率超過調(diào)制曲線的最大斜率,則調(diào)制曲線就跟不上原始信號的變化,從而造成誤差。我們把這種因不上原始信號的變化,從而造成誤差。我們把這種因調(diào)制曲線跟

44、不上原始信號變化的現(xiàn)象叫做過載現(xiàn)象,調(diào)制曲線跟不上原始信號變化的現(xiàn)象叫做過載現(xiàn)象,由此產(chǎn)生的波形失真或者信號誤差叫做過載噪聲。由此產(chǎn)生的波形失真或者信號誤差叫做過載噪聲。 89n 另外,由于增量調(diào)制是利用調(diào)制曲另外,由于增量調(diào)制是利用調(diào)制曲線和原始信號的差值進(jìn)行編碼,也就是利線和原始信號的差值進(jìn)行編碼,也就是利用增量進(jìn)行量化,因此在調(diào)制曲線和原始用增量進(jìn)行量化,因此在調(diào)制曲線和原始信號之間存在誤差,這種誤差稱為一般量信號之間存在誤差,這種誤差稱為一般量化誤差或一般量化噪聲。兩種噪聲示意圖化誤差或一般量化噪聲。兩種噪聲示意圖如圖如圖45所示。所示。90圖45 兩種量化噪聲示意圖 ttf (t)f

45、 (t)n(t)n(t)f (t)f (t)91n 仔細(xì)分析兩種噪聲波形我們發(fā)現(xiàn),仔細(xì)分析兩種噪聲波形我們發(fā)現(xiàn),兩種噪聲的大小與階梯波的抽樣間隔兩種噪聲的大小與階梯波的抽樣間隔t和增和增量量有關(guān)。我們定義有關(guān)。我們定義K為階梯波一個臺階的為階梯波一個臺階的斜率斜率sKft 式中,fs是抽樣頻率。該斜率被稱為最大跟蹤斜率。當(dāng)信號斜率大于跟蹤斜率時,稱為過載條件,此時就會出現(xiàn)過載現(xiàn)象;當(dāng)信號斜率等于跟蹤斜率時,稱為臨界條件;當(dāng)信號斜率小于跟蹤斜率時,稱為不過載條件。92n 可見,通過增大量化臺階(增量)可見,通過增大量化臺階(增量)進(jìn)而提高階梯波形的最大跟蹤斜率,就可進(jìn)而提高階梯波形的最大跟蹤斜率

46、,就可以減小過載噪聲;而降低以減小過載噪聲;而降低則可減小一般量則可減小一般量化噪聲。顯然,通過改變量化臺階進(jìn)行降化噪聲。顯然,通過改變量化臺階進(jìn)行降噪出現(xiàn)了矛盾,因此,噪出現(xiàn)了矛盾,因此,值必須兩頭兼顧,值必須兩頭兼顧,適當(dāng)選取。不過,利用增大抽樣頻率(即適當(dāng)選取。不過,利用增大抽樣頻率(即減小抽樣時間間隔減小抽樣時間間隔t),卻可以),卻可以“左右逢左右逢源源”,既能減小過載噪聲,又可降低一般,既能減小過載噪聲,又可降低一般量化噪聲。因此,實(shí)際應(yīng)用中,量化噪聲。因此,實(shí)際應(yīng)用中,M系統(tǒng)的系統(tǒng)的抽樣頻率要比抽樣頻率要比PCM系統(tǒng)高得多(一般在兩系統(tǒng)高得多(一般在兩倍以上,對于話音信號典型值為

47、倍以上,對于話音信號典型值為16kHz和和32kHz)。)。93n 【例題【例題41】 已知一個話音信號的已知一個話音信號的最高頻率分量最高頻率分量fH=3.4kHz,幅度為,幅度為A=1V。若。若抽樣頻率抽樣頻率fs=32kHz,求增量調(diào)制臺階,求增量調(diào)制臺階=?n 解解 首先要找出話音信號的最大斜率。首先要找出話音信號的最大斜率。若信號為單頻正弦型信號若信號為單頻正弦型信號f(t)=Asint,則其,則其斜率就是它的導(dǎo)數(shù),斜率就是它的導(dǎo)數(shù), n n , 最 大, 最 大斜率為斜率為K=A。把話音信號的最高頻率分量。把話音信號的最高頻率分量看成是一個正弦型信號,看成是一個正弦型信號, ( )

48、( )cosdf tk tAtdt94n 由式(由式(41)可知當(dāng))可知當(dāng)A2fHfs時,時,系統(tǒng)不過載。所以系統(tǒng)不過載。所以223.40.668( )32HsAfVf增量調(diào)制臺階為0.668V。 95n 另外,如果模擬信號為交流信號,另外,如果模擬信號為交流信號,且信號峰且信號峰-峰值小于峰值小于時,增量調(diào)制器的輸出時,增量調(diào)制器的輸出將不隨信號的變化而變化,只輸出將不隨信號的變化而變化,只輸出“1”和和“0”交替出現(xiàn)的數(shù)字序列。只有當(dāng)信號峰交替出現(xiàn)的數(shù)字序列。只有當(dāng)信號峰值大于值大于/2時,調(diào)制器才輸出隨交流信號的時,調(diào)制器才輸出隨交流信號的變化而變化的數(shù)字序列變化而變化的數(shù)字序列,因此,

49、把因此,把/2電平稱電平稱為增量調(diào)制器的起始編碼電平。為增量調(diào)制器的起始編碼電平。96n 5.7 語音信號參數(shù)編碼語音信號參數(shù)編碼 n 基于參數(shù)編碼理論的編碼器由于其數(shù)碼率比較低,基于參數(shù)編碼理論的編碼器由于其數(shù)碼率比較低,通常稱為聲碼器。通常稱為聲碼器。n 根據(jù)語音信號的共振峰模型提出了共振峰聲碼器,根據(jù)語音信號的共振峰模型提出了共振峰聲碼器,該聲碼器通過對語音信號整體進(jìn)行分析,提取共振峰的位該聲碼器通過對語音信號整體進(jìn)行分析,提取共振峰的位置、幅度、帶寬等參數(shù),構(gòu)成濁音和清音兩個聲道濾波器。置、幅度、帶寬等參數(shù),構(gòu)成濁音和清音兩個聲道濾波器。濁音濾波器采用全極點(diǎn)濾波器,由多個二階濾波器級聯(lián)

50、而濁音濾波器采用全極點(diǎn)濾波器,由多個二階濾波器級聯(lián)而成;清音濾波器一般采用一個極點(diǎn)和一個零點(diǎn)的數(shù)字濾波成;清音濾波器一般采用一個極點(diǎn)和一個零點(diǎn)的數(shù)字濾波器。這些濾波器的參數(shù)都是時變的。器。這些濾波器的參數(shù)都是時變的。97n 5.6.1 LPC聲碼器原理聲碼器原理n 在聲碼器中最具有代表性的是線性預(yù)測在聲碼器中最具有代表性的是線性預(yù)測(LPC)聲碼器及其改進(jìn)型。聲碼器及其改進(jìn)型。n LPC聲碼器是低速率語音編碼器,可以得聲碼器是低速率語音編碼器,可以得到很低的比特率到很低的比特率(2.4kbit/s以下以下);基于全極點(diǎn)聲;基于全極點(diǎn)聲道模型的假定,采用線性預(yù)測分析合成原理,對道模型的假定,采用

51、線性預(yù)測分析合成原理,對模型參數(shù)和激勵參數(shù)進(jìn)行編碼傳輸。模型參數(shù)和激勵參數(shù)進(jìn)行編碼傳輸。LPC聲碼器聲碼器遵循二元激勵假設(shè),聲碼器只需對遵循二元激勵假設(shè),聲碼器只需對LPC參數(shù)、基參數(shù)、基音周期、增益和清濁音信息進(jìn)行編碼。音周期、增益和清濁音信息進(jìn)行編碼。98LPC聲碼器工作原理如下圖所示n5.6 LPC聲碼器原理圖聲碼器原理圖 99n 雖然雖然LPC聲碼器與聲碼器與ADPCM一樣,都是一樣,都是基于線性預(yù)測分析來實(shí)現(xiàn)對語音信號的編碼壓基于線性預(yù)測分析來實(shí)現(xiàn)對語音信號的編碼壓縮,但是它們之間有著本質(zhì)的區(qū)別,縮,但是它們之間有著本質(zhì)的區(qū)別,LPC聲碼聲碼器不考慮重建信號波形是否與原來信號的波形器

52、不考慮重建信號波形是否與原來信號的波形相同,而努力使重建信號具有盡可能高的可懂相同,而努力使重建信號具有盡可能高的可懂度和清晰度,所以不必量化和傳輸預(yù)測殘差,度和清晰度,所以不必量化和傳輸預(yù)測殘差,只需傳輸只需傳輸LPC參數(shù)和重構(gòu)激勵信號的基音周期參數(shù)和重構(gòu)激勵信號的基音周期和清濁音信息。和清濁音信息。100n LPC聲碼器的缺點(diǎn)聲碼器的缺點(diǎn)n (1)損失了語音自然度。主要是由于過)損失了語音自然度。主要是由于過分簡單的二元激勵模型,不能完全代表豐富的語分簡單的二元激勵模型,不能完全代表豐富的語音信息。音信息。n (2)降低了方案的魯棒性。二元的清濁音)降低了方案的魯棒性。二元的清濁音判決及語

53、音譜中共振峰的作用使清濁音判決及基判決及語音譜中共振峰的作用使清濁音判決及基音提取方案變得很不準(zhǔn)確并易受噪聲的影響。音提取方案變得很不準(zhǔn)確并易受噪聲的影響。n (3)在)在LPC中,譜包絡(luò)中的共振峰位置及中,譜包絡(luò)中的共振峰位置及帶寬估計(jì)有時會產(chǎn)生很大的失真。帶寬估計(jì)有時會產(chǎn)生很大的失真。1015.6.2 LPC-10編碼器n LPC聲碼器在通信領(lǐng)域,尤其是軍事通聲碼器在通信領(lǐng)域,尤其是軍事通信領(lǐng)域得到了廣泛的應(yīng)用,利用信領(lǐng)域得到了廣泛的應(yīng)用,利用LPC聲碼器可聲碼器可以合成清晰、可懂的語音,但是抗噪聲能力和以合成清晰、可懂的語音,但是抗噪聲能力和自然度比較差。自自然度比較差。自1986年以來

54、,美國第三代保年以來,美國第三代保密電話裝置采用了速率為密電話裝置采用了速率為2.4kbit/s的的LPC-10e(LPC-10的增強(qiáng)型)作為語音處理手段。的增強(qiáng)型)作為語音處理手段。102圖圖8.9 LPC-10的編碼器框圖的編碼器框圖103 1. 編碼器n (1) 編碼器基本原理編碼器基本原理n 原始語音以原始語音以8kHz采樣率采樣率12bit量化得到量化得到數(shù)字化語音,然后每數(shù)字化語音,然后每180個采樣點(diǎn)個采樣點(diǎn)(22.5ms)為一為一幀,以幀為處理單元。編碼器分兩個支路同時幀,以幀為處理單元。編碼器分兩個支路同時進(jìn)行,其中一個支路用于提取基音周期進(jìn)行,其中一個支路用于提取基音周期T

55、和清濁和清濁音音U/V判決信息;另一支路用于提取聲道濾波器判決信息;另一支路用于提取聲道濾波器參數(shù)參數(shù)RC和增益因子和增益因子RMS。104n (2) 計(jì)算聲道濾波器參數(shù)計(jì)算聲道濾波器參數(shù)n 利用協(xié)方差法對利用協(xié)方差法對LPC分析濾波器計(jì)算分析濾波器計(jì)算l0階階LPC分析預(yù)測系數(shù),并轉(zhuǎn)換成反射系數(shù)分析預(yù)測系數(shù),并轉(zhuǎn)換成反射系數(shù)RC,或者部分相關(guān)系數(shù)或者部分相關(guān)系數(shù)PARCOR來代替預(yù)測系數(shù)來代替預(yù)測系數(shù)進(jìn)行量化編碼。理論上進(jìn)行量化編碼。理論上RC參數(shù)和參數(shù)和PARCOR參參數(shù)互為相反數(shù),數(shù)互為相反數(shù),105n (3) 增益因子增益因子RMS的計(jì)算的計(jì)算n 用如下公式計(jì)算用如下公式計(jì)算RMS:n

56、 式中式中x(i)是經(jīng)過預(yù)加重的數(shù)字語音;是經(jīng)過預(yù)加重的數(shù)字語音;N是分是分析幀的長度。析幀的長度。 )(N1RMS12ixNi106n (4) 基音周期提取和清基音周期提取和清/濁音檢測濁音檢測n 輸入數(shù)字語音經(jīng)低通濾波器濾波,再輸入數(shù)字語音經(jīng)低通濾波器濾波,再經(jīng)過二階逆濾波經(jīng)過二階逆濾波(逆濾波器的系數(shù)為前面逆濾波器的系數(shù)為前面LPC分析得到的短時譜參數(shù)分析得到的短時譜參數(shù))。把取樣頻率降低至。把取樣頻率降低至原來的原來的1/4,再計(jì)算延遲時間為,再計(jì)算延遲時間為20256個樣點(diǎn)個樣點(diǎn)的平均幅度差函數(shù)的平均幅度差函數(shù)AMDF,由,由AMDF的最小值的最小值確定基音周期。計(jì)算確定基音周期。計(jì)

57、算AMDF的公式為的公式為1301)()()(AMDFmkmxmxk107n (5) 參數(shù)編碼與解碼參數(shù)編碼與解碼n 在傳輸數(shù)據(jù)流中,將在傳輸數(shù)據(jù)流中,將10個反射系數(shù)、增個反射系數(shù)、增益因子益因子(RMS)、基音周期、基音周期T、清、清/濁音濁音U /V、同、同步信號步信號Sync編碼成每幀編碼成每幀54bit。由于傳輸速率。由于傳輸速率為為44.4幀幀/s ,因此,碼率為,因此,碼率為2.4kbit/s。同步信。同步信號采用相鄰幀號采用相鄰幀1、0碼交替的模式。表碼交替的模式。表8.5是濁是濁音幀和清音幀的比特?cái)?shù)分配。音幀和清音幀的比特?cái)?shù)分配。108表表5.5 LPC-10的比特?cái)?shù)分配的比

58、特?cái)?shù)分配(bit)清音清音濁音濁音T/Voicing77RMS55Sync11k155k255k355k455k54k64k74k84k93k102誤差校誤差校正正020總計(jì)總計(jì)54531092解碼器圖圖5.10 LPC-10解碼器框圖解碼器框圖110n 接收到的語音信號經(jīng)串接收到的語音信號經(jīng)串/并變換及同步后,并變換及同步后,利用查表法對數(shù)碼流進(jìn)行檢錯、糾錯。糾錯譯利用查表法對數(shù)碼流進(jìn)行檢錯、糾錯。糾錯譯碼后的數(shù)據(jù)經(jīng)參數(shù)解碼得到基音周期、清碼后的數(shù)據(jù)經(jīng)參數(shù)解碼得到基音周期、清/濁音濁音標(biāo)志、增益以及反射系數(shù)的數(shù)值,解碼結(jié)果延標(biāo)志、增益以及反射系數(shù)的數(shù)值,解碼結(jié)果延時一幀輸出。輸出數(shù)據(jù)在過去的

59、一幀、當(dāng)前幀時一幀輸出。輸出數(shù)據(jù)在過去的一幀、當(dāng)前幀和將來的一幀共和將來的一幀共3幀內(nèi)進(jìn)行平滑。由于每幀語幀內(nèi)進(jìn)行平滑。由于每幀語音只傳輸一組參數(shù),但一幀之內(nèi)可能有不止一音只傳輸一組參數(shù),但一幀之內(nèi)可能有不止一個基音周期,因此要對接收數(shù)值進(jìn)行由幀塊到個基音周期,因此要對接收數(shù)值進(jìn)行由幀塊到基音塊的轉(zhuǎn)換和插值?;魤K的轉(zhuǎn)換和插值。 111n (1) 參數(shù)插值原則參數(shù)插值原則 n 對數(shù)面積比參數(shù)值每幀插值兩次;對數(shù)面積比參數(shù)值每幀插值兩次;RMS參數(shù)值在對數(shù)域進(jìn)行基音同步插值;基參數(shù)值在對數(shù)域進(jìn)行基音同步插值;基音參數(shù)值用基音同步的線性插值;在濁音向清音參數(shù)值用基音同步的線性插值;在濁音向清音過渡

60、時對數(shù)面積比不插值。每個基音周期更音過渡時對數(shù)面積比不插值。每個基音周期更新一次預(yù)測系數(shù)、增益、基音周期、清新一次預(yù)測系數(shù)、增益、基音周期、清/濁音濁音等參數(shù),這個過程在幀塊到基音塊的轉(zhuǎn)換和插等參數(shù),這個過程在幀塊到基音塊的轉(zhuǎn)換和插值中完成。值中完成。 112n (2) 激勵源激勵源 n 清音幀用隨機(jī)數(shù)作為激勵源;濁音幀用周期性沖激序清音幀用隨機(jī)數(shù)作為激勵源;濁音幀用周期性沖激序列通過一個全通濾波器來生成激勵源,改善了合成語音的尖列通過一個全通濾波器來生成激勵源,改善了合成語音的尖峰性質(zhì)。語音合成濾波器輸入激勵的幅度保持恒定不變,輸峰性質(zhì)。語音合成濾波器輸入激勵的幅度保持恒定不變,輸出幅度受出

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論