版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第三講話音編碼簡(jiǎn)介衡量話音編碼器得因素音頻質(zhì)量數(shù)據(jù)率編/解碼延時(shí)算法復(fù)雜度價(jià)格因素編碼器解碼器輸入信道傳輸輸出編碼數(shù)據(jù)編解碼過(guò)程輸入數(shù)據(jù)量與編碼后數(shù)據(jù)量得比值,稱為壓縮比。第2節(jié)話音編譯碼器分類:波形編譯碼器(waveformcoder):不利用生成話音得信號(hào)得任何知識(shí),將話音視為一種普通得聲音,直接對(duì)波形信號(hào)進(jìn)行采樣與量化。例如PCM、DPCM、ADPCM等。音源編譯碼器(Sourcecoder):也叫參數(shù)編譯碼器、聲碼器(vocoder)。它從話音波形信號(hào)中提取生成話音得參數(shù),使用這些參數(shù)通過(guò)話音生成模型重構(gòu)出話音。混合編譯碼器(Hybridcoder):綜合使用上述兩種技術(shù)。使用得激勵(lì)信號(hào)波形盡可能接近于原始話音信號(hào)得波形。例如CELP。1、脈沖編碼調(diào)制(PCM)一、波形編碼技術(shù)PCM得量化方式均勻量化與非均勻量化量化就是一種有損編碼非均勻量化對(duì)小信號(hào)采用小得量化間隔,對(duì)大信號(hào)采用大得量化間隔,這樣可以用較少得位數(shù)編碼。對(duì)大信號(hào)來(lái)說(shuō),雖然絕對(duì)量化誤差較大,但就是因?yàn)榇笮盘?hào)出現(xiàn)得機(jī)會(huì)不多,所以對(duì)總得話音質(zhì)量影響不大。非均勻量化相對(duì)于均勻量化就是一種壓縮。量化間隔越大,壓縮比越大。非均勻量化中兩種壓擴(kuò)算法數(shù)字電話通信標(biāo)準(zhǔn)G、711(CCITT)μ律(μ-Law)壓擴(kuò):其中μ為參數(shù)(可取255),x為規(guī)格化(絕對(duì)值小于等于1)得輸入信號(hào)幅度。A律(A-Law)壓擴(kuò)其中A為參數(shù)(可取87、56),x為規(guī)格化(絕對(duì)值小于等于1)得輸入信號(hào)幅度。2、波形編碼中得增量調(diào)制(deltamodulation)增量調(diào)制(DM)自適應(yīng)增量調(diào)制(ADM)
量化階可調(diào),斜率過(guò)載時(shí)調(diào)大,粒狀噪聲時(shí)調(diào)小。3、自適應(yīng)脈沖調(diào)制(APCM)APCM就是一種根據(jù)輸入信號(hào)幅度大小自動(dòng)改變量化階大小得一種波形編碼技術(shù)。邊信息為量化步長(zhǎng)。例:設(shè)僅有1,與5兩種量化步長(zhǎng),輸入:1,2,3,3,10,12,16,2,3,2,1……前向輸出:1,2,3,3,2,2,3,2,3,2,1……151……解碼:1,2,3,3,10,10,15,2,3,2,1……后向輸出:1,2,3,3,10,2,3,0,3,2,1……解碼:1,2,3,3,10,10,15,0,3,2,1……解碼時(shí),后向自適應(yīng)需要量化階適配器。思考:三個(gè)量化階適配器就是怎樣得算法?12大家應(yīng)該也有點(diǎn)累了,稍作休息大家有疑問(wèn)的,可以詢問(wèn)和交流4、差分脈沖編碼調(diào)制(DPCM)DPCM就是利用相鄰樣本之間冗余信息來(lái)進(jìn)行編碼得一種數(shù)據(jù)壓縮技術(shù)。輸出得實(shí)際上就是差值得量化值。例:量化步長(zhǎng)為2,預(yù)測(cè)器為相等。輸入:2,3,4,5,6,5,4,3………輸出:1,0,1,0,1,0,-1,0………解碼器逆量化器預(yù)測(cè)器I(k)d(k)S(k)Se(k+1)輸入:1,0,1,0,1,0,-1,0………輸出:2,2,4,4,6,6,4,4………誤差由量化引起!預(yù)測(cè):用過(guò)去得k個(gè)信號(hào)預(yù)測(cè)當(dāng)前得信號(hào)值。線性預(yù)測(cè):如果ai就是常數(shù),則為時(shí)不變線性預(yù)測(cè),否則為自適應(yīng)線性預(yù)測(cè),預(yù)測(cè)器就就是一個(gè)濾波器。最簡(jiǎn)單得預(yù)測(cè)方程:5、自適應(yīng)差分脈沖調(diào)制(ADPCM)ADPCM綜合了APCM得自適應(yīng)特性與DPCM系統(tǒng)得差分特性左圖得量化階調(diào)整屬于后向自適應(yīng)數(shù)字電話通信標(biāo)準(zhǔn)G、721(CCITT)解碼器逆量化器預(yù)測(cè)器I(k)d(k)S(k)S(k-1)量化階調(diào)整ADPCM就是利用樣本與樣本之間得高度相關(guān)性與量化階自適應(yīng)來(lái)壓縮數(shù)據(jù)得一種波形編碼技術(shù),CCITT為此制定了G、721推薦標(biāo)準(zhǔn),這個(gè)標(biāo)準(zhǔn)叫做32kb/sADPCM。在此基礎(chǔ)上還制定了G、721得擴(kuò)充推薦標(biāo)準(zhǔn)G、723,使用該標(biāo)準(zhǔn)得編碼器得數(shù)據(jù)率可降低到40kb/s與24kb/s。G、721得輸入信號(hào)就是G、711PCM代碼(數(shù)據(jù)率為64kb/s)。而G、721ADPCM得輸出就是用4位表示得差分信號(hào),它得采樣率與G、711相同都就是8kHz(信號(hào)頻率3、4KHz),它得數(shù)據(jù)率為32kb/s,這樣就獲得了2∶1得數(shù)據(jù)壓縮。6、子帶-自適應(yīng)差分脈沖編碼調(diào)制(SB-ADPCM)數(shù)字電話通信標(biāo)準(zhǔn)G、722(CCITT)G、722就是CCITT推薦得音頻信號(hào)編碼譯碼標(biāo)準(zhǔn)。G、722標(biāo)準(zhǔn)得數(shù)據(jù)率為64kb/s,采樣頻率由8kHz提高到16kHz,就是G、711PCM采樣率得2倍,被編碼得信號(hào)頻率由原來(lái)得3、4kHz擴(kuò)展到7kHz。這就使音頻信號(hào)得質(zhì)量有很大改善,由數(shù)字電話得話音質(zhì)量提高到調(diào)幅(AM)無(wú)線電廣播得質(zhì)量。二、音源編譯碼模擬人體產(chǎn)生話音得原理,通過(guò)話音生成模型重構(gòu)出話音。1、話音得形成原理
說(shuō)話得時(shí)候,聲門處氣流沖擊聲帶產(chǎn)生振動(dòng),然后通過(guò)聲道響應(yīng)變成語(yǔ)音。由于發(fā)不同音時(shí),聲道得形狀不同,所以聽(tīng)到不同得語(yǔ)音。
進(jìn)一步物理建模,聲門可以等效為一個(gè)激勵(lì)源(輸入信號(hào)),聲道可以等效為一個(gè)時(shí)變?yōu)V波器(系統(tǒng))。2、對(duì)輸入得氣流(激勵(lì))建模濁音(voicedsounds):聲道打開(kāi),聲帶在先打開(kāi)后關(guān)閉,氣流經(jīng)過(guò)使聲帶要發(fā)生張馳振動(dòng),變?yōu)闇?zhǔn)周期振動(dòng)氣流。濁音得激勵(lì)源被等效為準(zhǔn)周期得脈沖信號(hào)。清音(unvoicedsounds):聲帶不振動(dòng),而在某處保持收縮,氣流在聲道里收縮后高速通過(guò)產(chǎn)生湍流,再經(jīng)過(guò)主聲道(咽、口腔)得調(diào)整最終形成清音。清音得激勵(lì)源被等效為一種白噪聲信號(hào)。爆破音(plosivesounds):聲道關(guān)閉之后產(chǎn)生壓縮空氣然后突然打開(kāi)聲道所發(fā)出得聲音。話音產(chǎn)生得數(shù)字模型周期脈沖序列發(fā)生器偽隨機(jī)噪聲產(chǎn)生器周期時(shí)變數(shù)字濾波器音量控制聲道參數(shù)語(yǔ)音輸出濁/清選擇3、濾波器用濾波器來(lái)模仿聲道。編碼得結(jié)果其實(shí)就就是濾波器得規(guī)格、發(fā)聲或者不發(fā)聲得標(biāo)志與有聲話音得音節(jié)周期,并且每隔10~20ms更新一次。解碼器知道使用什么規(guī)格得濾波器后,計(jì)算激勵(lì)通過(guò)濾波器得輸出就就是解碼過(guò)程。上節(jié)講到得線性預(yù)測(cè)方法可用來(lái)生成濾波器。稱為線性預(yù)測(cè)編碼(LPC,linearpredictivecoding
)。4、特點(diǎn)數(shù)據(jù)率在2、4kb/s左右,產(chǎn)生得語(yǔ)音雖然可以聽(tīng)懂,但其質(zhì)量遠(yuǎn)遠(yuǎn)低于自然話音。增加數(shù)據(jù)率對(duì)提高合成話音得質(zhì)量無(wú)濟(jì)于事,這就是因?yàn)槭艿皆捯羯赡P偷孟拗?。保密性能?一直用在軍事上。三、混合編譯碼簡(jiǎn)介
混合編譯碼想法就是結(jié)合波形編譯碼與音源編譯碼思想。即尋找合適得濾波器,又同時(shí)尋找合適得激勵(lì)(不再就是根據(jù)人得發(fā)生模型確定激勵(lì),而就是計(jì)算得出,所以可以不必考慮清音與濁音)。最成功并普遍使用得就是時(shí)域合成-分析AbS(analysis-by-synthesis)編譯碼器。這種編譯碼器使用聲道線性預(yù)測(cè)濾波器模型(LPC),不使用兩個(gè)狀態(tài)(有聲/無(wú)聲)得激勵(lì)。企圖尋找一種激勵(lì)信號(hào),使用這種信號(hào)激勵(lì)產(chǎn)生得波形盡可能接近于原始話音得波形。并命名為多脈沖激勵(lì)MPE(multi-pulseexcited)編譯碼器,數(shù)據(jù)率10Kb/s左右。在此基礎(chǔ)上隨后出現(xiàn)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度國(guó)際船舶租賃合同環(huán)境保護(hù)責(zé)任與履約評(píng)估3篇
- 二零二五版?zhèn)€人住房抵押貸款合同2篇
- 2025年度家具租賃服務(wù)合同標(biāo)準(zhǔn)文本4篇
- 2025年肉類加工企業(yè)鮮豬肉原料采購(gòu)合同3篇
- 2025年度生態(tài)農(nóng)業(yè)園區(qū)商鋪?zhàn)赓U合同規(guī)范2篇
- 2024租賃公司設(shè)備租賃與購(gòu)買合同
- 二零二五版高壓電纜敷設(shè)電力施工勞務(wù)合同范本2篇
- 二零二五年度礦產(chǎn)品出口與國(guó)內(nèi)銷售合同3篇
- 2025年度運(yùn)動(dòng)服飾租賃服務(wù)合同樣本3篇
- 2025年度農(nóng)機(jī)作業(yè)租賃與農(nóng)村土地流轉(zhuǎn)服務(wù)合同
- 期末綜合試卷(試題)2024-2025學(xué)年人教版數(shù)學(xué)五年級(jí)上冊(cè)(含答案)
- 2024ESC心房顫動(dòng)管理指南解讀-第一部分
- 保定市縣級(jí)地圖PPT可編輯矢量行政區(qū)劃(河北省)
- 新蘇教版科學(xué)六年級(jí)下冊(cè)全冊(cè)教案(含反思)
- 供方注冊(cè)指南-ZTE
- 真心英雄合唱歌詞
- 旅游感知形象研究綜述 論文
- 如何提高辦文辦會(huì)辦事能力
- GB_T 37494-2019 糧油機(jī)械 軋坯機(jī)(高清版)
- 【校本教材】《身邊的化學(xué)》高中化學(xué)校本課程
- 產(chǎn)后訪視技術(shù)規(guī)范
評(píng)論
0/150
提交評(píng)論