版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
線性預測聲碼器演示文稿目前一頁\總數(shù)四十八頁\編于九點(優(yōu)選)線性預測聲碼器目前二頁\總數(shù)四十八頁\編于九點第9章線性預測聲碼器9.1
概述
線性預測聲碼器是一種參數(shù)編碼方法。參數(shù)編碼利用生成模型,在幅度譜上逼近原語音,但重建語音的波形與原語音信號的波形較大差別。參數(shù)編碼實現(xiàn)語音通信的設備通常稱為聲碼器;◆例:通道聲碼器、共振峰聲碼器、同態(tài)聲碼器、LPC聲碼器;本章主要內(nèi)容:語音壓縮的原理與關鍵技術、
LPC聲碼器的基本原理、
LPC-10和LPC-10e標準、
混合激勵LPC聲碼器。第9章線性預測聲碼器9.1
概述同濟大學電子與信息工程學院-3-趙曉群
教授目前三頁\總數(shù)四十八頁\編于九點
語音壓縮的基本原理壓縮依據(jù):語音信號的冗余度和人的聽覺感知機理。語音信號中存在多種冗余度,可在時域和/或頻域中描述。
1.
時域冗余度
(1)
幅度非均勻分布。◆語音中,小幅值樣本出現(xiàn)的概率高。
(2)
語音信號樣本間的相關性很強?!粽Z音波形的最大相關性存在于鄰近的樣本之間?!?kHz取樣時,相鄰樣本間的相關系數(shù)
>0.85;相距10
個樣本,相關系在
0.3
左右?!衾眠@種較強的一維相關性進行預測編碼。第9章線性預測聲碼器9.1
概述同濟大學電子與信息工程學院-4-趙曉群
教授目前四頁\總數(shù)四十八頁\編于九點
(3)
濁語音具有準周期性。◆濁語音波形是對應于音調(diào)間隔周期的長期重復波形?!舸艘粽{(diào)間隔波形可用于預測編碼。
(4)
聲道的形狀及其變化比較緩慢?!粢暂^長的時間(如幾十秒)進行統(tǒng)計,可得長時自相關函數(shù);◆長時自相關函數(shù)的統(tǒng)計表明,8kHz
取樣的相鄰樣本間,
平均相關系數(shù)高達溝通0.9。
(5)
靜止系數(shù)(語音間隙)?!艚y(tǒng)計表明,話音間隙使全雙工話路的典型效率約為通話時間的40%(或靜止系數(shù)為0.6)?!粼捯糸g隙本身是一種冗余,可不傳或少傳靜止段信息。
第9章線性預測聲碼器9.1
概述同濟大學電子與信息工程學院-5-趙曉群
教授目前五頁\總數(shù)四十八頁\編于九點
2.頻域冗余度
(1)
非均勻的長時功率譜密度?!糸L時功率譜密度:長時段內(nèi)功率譜的統(tǒng)計平均,如圖9.1(a)?!糸L時功率譜密度呈現(xiàn)強烈的非平坦性?!艚y(tǒng)計觀點:未充分利用給定頻段,或者說存在著固定的冗余度。◆特點:功率譜的高頻能量較低,
直流分量并非最大。
(2)
特有的短時功率譜密度。◆圖9.1(b):語音的短時功率譜密度。◆存在共振峰頻率和谷值。◆前三個共振峰決定語音特征。◆特點:形成高次諧波結構。第9章線性預測聲碼器9.1
概述同濟大學電子與信息工程學院-6-趙曉群
教授圖9.1語音信號的功率譜密度函數(shù)f/kHz(a)長時功率譜f/kHz(b)短時功率譜目前六頁\總數(shù)四十八頁\編于九點
3.
聽覺感知機理
(1)
人類聽覺系統(tǒng)具有掩蔽效應?!粼诓煌晧?、不同頻率處,聲音的掩蔽效應是不同的?!粲醚诒翁匦钥梢种婆c信號共存的量化噪聲,降低編碼速率。
(2)
人耳對不同頻段聲音的敏感程度不同?!羧说穆犛X對低頻端比較敏感,而對高頻端不太敏感。即強的低頻音能妨礙同時存在的高頻音。
(3)
人耳對語音信號的相位變化不敏感。合適的分析表明:語音壓縮編碼的極限速率為80~100bit/s?!舸藭r,只能傳送句子內(nèi)容,講話者的音質(zhì)、音調(diào)等重要信息已全部丟失。第9章線性預測聲碼器9.1
概述同濟大學電子與信息工程學院-7-趙曉群
教授目前七頁\總數(shù)四十八頁\編于九點
語音編碼的關鍵技術關鍵技術包括:LPC分析、合成-分析法、感覺加權濾波器
1.
LPC
分析◆LPC
分析是常用技術,在語音識別、語音合成、語音編碼和
說話人識別等領域獲得成功的應用?!鬖PC
編碼基于跟蹤波形的產(chǎn)生過程,而不是波形本身,它傳送的是反映整個過程變化的參數(shù)?!鬖PC基于全極點模型、時域方均誤差最小準則估計模型參數(shù)?!魬眠@組模型參數(shù)能夠有效地降低語音信號的編碼速率。語音信號存在短時相關性和長時相關性兩種。利用LPC對語音進行這兩種相關性的去相關處理后,得到的是預測殘差信號。第9章線性預測聲碼器9.1
概述同濟大學電子與信息工程學院-8-趙曉群
教授目前八頁\總數(shù)四十八頁\編于九點圖9.2:含兩種相關性的語音生成模型示意圖?!舳虝r相關性的傳輸函數(shù)為:◆長時相關性(譜的精細結構)模型的傳輸函數(shù)為:
式中T——基音周期。
b-q,b-q+1,…,br——長時預測系數(shù),個數(shù)在1(q=r=0)到3(q=r=1)
之間;◆通常,長時預測系數(shù)的更新周期約為50~200
次/s。◆長時濾波是估算短時殘差信號中脈沖的周期、相位和增益,◆再去除這些脈沖,得到了
長時濾波殘差?!粼倬幋a,形成激勵信號。第9章線性預測聲碼器9.1
概述同濟大學電子與信息工程學院-9-趙曉群
教授圖9.2語音信號生成模型數(shù)激勵發(fā)生器合成語音目前九頁\總數(shù)四十八頁\編于九點
2.
合成-分析法在LPC
算法中,對殘差信號直接量化,且使其誤差最小,并不能使得原始語音信號和重建信號間的誤差最小。采用合成-分析法(AbS)來求得殘差信號的編碼量化值,才能使重建語音與原始語音的誤差最小。AbS是將綜合器引入到編碼器中,并與分析器結合,在編碼器中生成和解碼器端相同的重建合成語音?!舾鶕?jù)誤差原則,調(diào)整參數(shù)使合成語音與原始語音的誤差最小?!衾诰幋a器中將激勵信號輸入LPC
綜合濾波器,其合成語音和原始語音相比,從而求得使兩者方均差最小的激勵源?!粼摲椒ò严到y(tǒng)的輸出引入編碼端,也稱作閉環(huán)法。相應地,不將輸出引入編碼端的方法稱作開環(huán)法。第9章線性預測聲碼器9.1
概述同濟大學電子與信息工程學院-10-趙曉群
教授目前十頁\總數(shù)四十八頁\編于九點3.
感覺加權濾波器
人耳的掩蔽效應和聽覺敏感度不同,導致最小方均誤差準則評定合成語音的質(zhì)量時并非為最優(yōu)。低碼率編碼中,每個語音樣本量化的比特數(shù)不到1,故在編碼中,更需要利用人耳感知特性,以改進編碼性能。Atal
等提出了感知加權最小方均誤差準則,◆在高能量段,噪聲不易被感覺,允許誤差大一些?!粼诘湍芰慷危肼曇妆桓杏X,允許誤差小一些。◆導致:碼率不變時,音質(zhì)會提高;音質(zhì)不變時,碼率降低。引入頻域的感覺加權濾波器
W(z)
來衡量語音之間的誤差:式中——原始語音和重建語音的Fourier變換;
fs——取樣頻率。第9章線性預測聲碼器9.1
概述同濟大學電子與信息工程學院-11-趙曉群
教授目前十一頁\總數(shù)四十八頁\編于九點◆如果在高能量頻段使W(f)較小,在低能量頻段使W(f)較大,就可以抬高前者誤差的能量而降低后者誤差的能量。◆由此,感覺加權濾波器的傳遞函數(shù)為
式中,γ
=1時,W(z)=1,不加權;
γ
=0時,W(z)=A(z),得到的噪聲譜能量分布和
語音譜能量分布相同,但聽音效果不好。◆W(z)使實際誤差信號的譜不平坦,與語音信號譜包絡相似。◆掩蔽效應便產(chǎn)生較好的主觀聽覺效果?!魧嶒灡砻?,8kHz取樣時,γ
取0.8較為適宜。加權綜合濾波器為:第9章線性預測聲碼器9.1
概述同濟大學電子與信息工程學院-12-趙曉群
教授目前十二頁\總數(shù)四十八頁\編于九點第9章線性預測聲碼器9.2LPC聲碼器的基本原理基于全極點聲道模型,采用LPC
分析-合成原理,對模型參數(shù)和激勵參數(shù)進行編碼傳輸,編碼速率低。圖9.3:典型的LPC
聲碼器的原理框圖?!綦p重作用:波形編碼器的主要作用是用作預測器,
聲碼器的主要作用是建立模型。
傳輸參數(shù):預測系數(shù)、基音周期、清/濁音和增益。第9章線性預測聲碼器9.2
LPC
聲碼器的基本原理同濟大學電子與信息工程學院-13-趙曉群
教授圖9.3
LPC聲碼器原理框圖發(fā)送端(分析部分)接收端(合成部分)LPC分析器基音檢測器編碼器解碼器LPC合成器信道目前十三頁\總數(shù)四十八頁\編于九點直接量化預測系數(shù)不合適,因合成誤差大,甚至系統(tǒng)不穩(wěn)定。◆解決辦法:或用較多的bit
量化每個預測器系數(shù)。
或?qū)㈩A測器系數(shù)變換成其它參數(shù)形式。歸納起來,有以下幾種
(1)
反射系數(shù)k1,k2,…,kp?!舴治霰砻鳎涸趨^(qū)間[-1,1]對反射系數(shù)作線性量化是低效的;◆比特數(shù)應非均勻分配,k1
和k2
的比特數(shù)多些(5~6bit)。
(2)
對數(shù)面積比
g1,g2,…,gp。式中Ai,
Ai+1——聲管第i節(jié)和第i+1
節(jié)的截面積?!羯鲜接成?,使g呈相當均勻的幅度分布,可以采用均勻量化;
參數(shù)間相關性低,經(jīng)內(nèi)插產(chǎn)生的濾波器是穩(wěn)定的,◆需5~6bit量化。第9章線性預測聲碼器9.2
LPC
聲碼器的基本原理同濟大學電子與信息工程學院-14-趙曉群
教授目前十四頁\總數(shù)四十八頁\編于九點
(3)
預測多項式的根
k1,k2,…,kp
。◆對預測多項式
A(z)分解因式,有◆對預測多項式的根進行量化,易保證合成濾波器的穩(wěn)定性?!裘總€根平均用5bit
量化就能精確表示中包含的頻譜信息?!魡栴}:求根運算量大,計算效率低,故該算法少用。一幀典型的LPC
參數(shù)包括:
1
bit清/濁音信息、大約5
bit
增益常數(shù)、
6
bit
基音周期、
反射系數(shù)或?qū)?shù)面積比平均5~6
bit
量化(共有8~12個)
每幀共約60
bit。若25
ms幀,則編碼速率為2.4
kbit/s左右。
第9章線性預測聲碼器9.2
LPC
聲碼器的基本原理同濟大學電子與信息工程學院-15-趙曉群
教授目前十五頁\總數(shù)四十八頁\編于九點第9章線性預測聲碼器9.3LPC?10聲碼器LPC?10:美國1976年確定的2.4
kbit/s語音通信的標準技術。1981年公布作為聯(lián)邦政府標準FED-STD?1015。該算法可合成清晰、可懂的語音,但抗噪能力和自然度欠佳。LPC?10e:2.4
kbit/s
速率,LPC?10的增強型。自1986年以來,美國第三代保密電話裝置采用LPC?10e。本節(jié)主要包括:
發(fā)端編碼器
收端解碼器
LPC?10聲碼器存在的問題第9章線性預測聲碼器9.3
LPC-10
聲碼器同濟大學電子與信息工程學院-16-趙曉群
教授目前十六頁\總數(shù)四十八頁\編于九點
發(fā)端編碼器
1.
編碼器圖9.4:LPC?10編碼器框圖(幀180
個樣,幀長22.5ms)◆預加重濾波器的傳輸函數(shù):◆聲道濾波器參數(shù)RC、增益
RMS用準基音同步相位法計算。第9章線性預測聲碼器9.3
LPC-10
聲碼器同濟大學電子與信息工程學院-17-趙曉群
教授圖9.4
LPC-10發(fā)端編碼器框圖
數(shù)字語音輸出預加重計算分析相位預測器分析存儲器2階逆濾波清/濁檢測AMDF基音提取基音及清/濁音校正基音分析存儲低通濾波器100~3600Hz低通濾波8kHz12bitA/D變換原始語音輸入U/V參數(shù)編碼誤差校正和映射并/串變換及同步產(chǎn)生TRMSRC2幀參數(shù)存儲器計算預測系數(shù)計算RMS2幀參數(shù)存儲器目前十七頁\總數(shù)四十八頁\編于九點
2.
計算聲道濾波器參數(shù)
RC◆采用10
階LPC
分析濾波器,◆利用協(xié)方差法計算預測系數(shù):
a1,a2,…,a10,(用Cholesky
UV
分解法對系數(shù)矩陣求逆)轉換成反射系數(shù)
RC,或部分相關系數(shù)(PARCOR)。(理論上,RC
和PARCOR
互為相反數(shù))◆
LPC
分析采用半基音同步算法,即濁音幀長度取為130
個樣本以內(nèi)的基音周期整數(shù)倍值,來計算RC
和增益
RMS?!裘恳粋€基音周期都可以單獨用一組系數(shù)處理?!羟逡魩L度為22.5
ms
的整幀中點為中心的130
個樣本形成分析幀來計算RC和RMS。
第9章線性預測聲碼器9.3
LPC-10
聲碼器同濟大學電子與信息工程學院-18-趙曉群
教授目前十八頁\總數(shù)四十八頁\編于九點
3.計算增益
RMS◆用如下公式計算增益RMS:
式中x(i)——經(jīng)過預加重的數(shù)字語音;
N——分析幀的長度。第9章線性預測聲碼器9.3
LPC-10
聲碼器同濟大學電子與信息工程學院-19-趙曉群
教授目前十九頁\總數(shù)四十八頁\編于九點
4.提取基音周期和檢測清/濁音
輸入語音經(jīng)3
dB
截止頻率為800
Hz
的4階
Butterworth
低通濾波,濾波后信號再經(jīng)二階逆濾波。(逆濾波器的系數(shù)為前面LPC
分析得到的短時譜參數(shù))◆取樣頻率降低至原來的1/4,再計算延遲時間為20~156
個樣點的AMDF,◆基音周期:由AMDF的最小值確定?!粲嬎鉇MDF:公式為式中,τ
=20,21,22,…,40,42,44,…,80,84,88,…,156;相當于在50~400
Hz范圍內(nèi)計算60個AMDF值。第9章線性預測聲碼器9.3
LPC-10
聲碼器同濟大學電子與信息工程學院-20-趙曉群
教授目前二十頁\總數(shù)四十八頁\編于九點◆清/濁音判決:利用模式匹配技術,基于低帶能量、
AMDF
函數(shù)最大值與最小值之比、過零率作出的?!魧糁?、清/濁音判決結果用動態(tài)規(guī)劃算法:在3
幀范圍內(nèi)進行平滑和錯誤校正,從而給出當前幀的基音周期
T、清/濁音判決參數(shù)U/V?!裘繋?濁音判決結果用兩位碼表示四種狀態(tài):
00:穩(wěn)定的清音;01:清音向濁音轉換;
10:濁音向清音轉換;11:穩(wěn)定的濁音。
第9章線性預測聲碼器9.3
LPC-10
聲碼器同濟大學電子與信息工程學院-21-趙曉群
教授目前二十一頁\總數(shù)四十八頁\編于九點
5.
參數(shù)編碼與解碼◆LPC?10
的傳輸數(shù)據(jù)流含:
10
個反射系數(shù):k1,k2,…,k10
,增益
RMS、基音周期
T、
清/濁音U/V、同步信號Sync。
同步信號采用相鄰幀1、0
碼交替的模式。◆編碼成每幀54
bit?!魝鬏?4.4
幀/s,編碼速率為2.4
kbit/s。表9.1:濁音幀和清音幀的比特分配。第9章線性預測聲碼器9.3
LPC-10
聲碼器同濟大學電子與信息工程學院-22-趙曉群
教授表9.1
LPC?10
的bit
分配濁音清音濁音清音T/Voicing77k64RMS55k74Sync11k84k155k93k255k102k355誤差校正020k455總計5453k54目前二十二頁\總數(shù)四十八頁\編于九點
(1)
反射系數(shù)的編碼、解碼用對數(shù)面積比gi表示反射系數(shù)ki
方法編碼,其關系為:LPC?10,先將ki變換成gi,再查表量化。方法如下:①符號轉換:對于濁音,ki被向+1偏置。②k1和k2作對數(shù)面積比后,確定k1和k2的符號,負=1,正=0;對k1和k2的絕對值除以29,若≥63,取為63,否則取原值。查表9-2得4
bit碼字再附上符號位,得5bit碼為編碼輸出。第9章線性預測聲碼器9.3
LPC-10
聲碼器同濟大學電子與信息工程學院-23-趙曉群
教授表9.2對數(shù)面積比編碼對數(shù)面積比編碼對數(shù)面積比編碼對數(shù)面積比編碼對數(shù)面積比編碼0~5027~33449~52860126~12134~38553~559611313~19239~43656,5710621420~26344~48758,59116315注:PARCOR參數(shù)k的絕對值作為序號,負的k參數(shù)用2進制補碼運算。目前二十三頁\總數(shù)四十八頁\編于九點③濁音幀:k3~k10
取整后除以2,加上表9.3中對應的偏置數(shù),再乘上表9-4的比例因子后取整(其值在范圍-127~127
內(nèi)),用8
減去按表9-1分配的比特數(shù)的位數(shù)右移,剩下的比特數(shù)即為編碼輸出,其中含1
位符號位。④濁音幀:用表9.5(見下頁)對接收的k1
和k2解碼,對于k3~k10
加一個量化偏置以補償量化的影響,然后以發(fā)送端相反的相應操作去偏置和去比例因子,即乘以215,取整。第9章線性預測聲碼器9.3
LPC-10
聲碼器同濟大學電子與信息工程學院-24-趙曉群
教授表9.3
PARCOR參數(shù)的偏置表參數(shù)k3k4k5k6k7k8k9k10偏置-1152+2816+1536+3584+1280+2432-768+1920注:偏置加到參數(shù)帶符號移位14bit的值上。表9.4PARCOR參數(shù)的比例因子參數(shù)k3k4k5k6k7k8k9k10比例因子0.00560.00630.00680.00720.00740.00730.00840.0102注:k參數(shù)被比例因子擴展為6bit
分布。目前二十四頁\總數(shù)四十八頁\編于九點⑤非濁音幀(清音或過渡音):僅發(fā)送k1~k4;
(8,4)Hamming
擴展碼保護k1~k4
和RMS
的4個高有效位;設4
位信息碼為m=m0m1m2m3,發(fā)送碼字v=v0v1v2v3v4v5v6v7,則編碼方程為:(最低有效位未編碼)
第9章線性預測聲碼器9.3
LPC-10
聲碼器同濟大學電子與信息工程學院-25-趙曉群
教授表9.5對數(shù)面積比解碼表編碼對數(shù)面積比編碼對數(shù)面積比編碼對數(shù)面積比編碼對數(shù)面積比編碼對數(shù)面積比0262313431955256016727144620572761298301548215828623139331650225930634161036175223593163519113918542460注:接收k參數(shù)的絕對值向左移一位作為解碼序號。目前二十五頁\總數(shù)四十八頁\編于九點
(2)
RMS參數(shù)的編碼、解碼
RMS
參數(shù)用查表法進行編碼、解碼。表9.6:數(shù)值在2~512
之間的RMS
值用步長為0.773dB
的對數(shù)碼表進行編碼和解碼。第9章線性預測聲碼器9.3
LPC-10
聲碼器同濟大學電子與信息工程學院-26-趙曉群
教授表9.6
RMS
編碼表序號RMS值序號RMS值序號RMS值序號RMS值序號RMS值序號RMS值序號RMS值序號RMS值008416824163232406648135562751094178251733354172491475730021105189261934394279501645832831115191027213542438651176593594212620112823364644945219260392521362112292537514510353210614286314722133027385546113542306246873157231531303960471235525163512注:用對分法查表,在表內(nèi)找到序號后,序號除以2
即為發(fā)送比特,計算公式為:目前二十六頁\總數(shù)四十八頁\編于九點
(3)基音、清/濁音編碼、解碼
◆
60
個基音值和清/濁音編碼用7
bit編碼表示?!羟逡?過渡幀:用矢量0000000/1111111表示;◆
60
個基音值用碼字重量3
或4
的7bit
Gray
碼編碼;表9.7:編碼方案?!艚獯a時,收到的7
bit
矢量,若碼字重量為3
或4
時,按表9.7的基音周期編碼表解碼;若碼字重量為0或1
時,則判定接收幀為清音幀;第9章線性預測聲碼器9.3
LPC-10
聲碼器同濟大學電子與信息工程學院-27-趙曉群
教授表9.7基音周期編碼表Gray碼周期Gray碼周期Gray碼周期Gray碼周期Gray碼周期Gray碼周期0010011200001111300110101401011010601001101801110001120000101121000011131011000142101100062100100184111000012400110112201001113201100114410111006410010118811100101280011001230100110330110010461010100661001010921100010132001110124010111034011011048101011068100111O9611010101360010101250101010350110100501010010701000110100110100014000101112601010113601111005210100117210001111041101100144001011027010100137011100054101000174100001110811001001480011110280101101380111010561010101761100011112110010115200011102901001013900110105810001017811000011161001100156目前二十七頁\總數(shù)四十八頁\編于九點若碼字重量為7
或6
時,則判定接收幀為過渡幀;若碼字重量為2
或5
時,則判定接收幀為無效幀?!糇詈蟀幢?.8
的比特順序,組成發(fā)送比特流發(fā)往線路。第9章線性預測聲碼器9.3
LPC-10
聲碼器同濟大學電子與信息工程學院-28-趙曉群
教授表9.8發(fā)送比特流bit濁音清音bit濁音清音bit濁音清音Bit濁音清音1k1,0同左15T,2同左29k7,0k3,543k5,2k1,72k2,0同左16k4,1同左30k8,0R,544k6,2k2,73k3,0同左17k1,3同左31T,4同左45kl0,1D/c4T,0同左18k2,2同左32k4,4同左46k8,2R,75R,0同左19k3,3同左33k5,0k1,547T,6同左6k1,1同左20k4,2同左34k6,0k2,548k9,1k4,77k2,1同左21R,3同左35k7,lk3,649k5,3kl,88k3,1同左22k1,4同左36kl0,0k4,550k6,3k2,89T,1同左23k2,3同左37k8,1R,651k7,3k3,810R,1同左24k3,4同左38k5,1k1,652k9,2k4,811k1,2同左25k4,3同左39k6,1k2,653k8,3R,812k4,0同左26R,4同左40k7,2k3,754sync同左13k3,2同左27T,3同左41k9,0k4,614R,2同左28k2,4同左42T,5同左注:1.發(fā)送順序是從bit
1
到bit
54;2.T
是基音,R
是RMS,k
是反射系數(shù);3.參數(shù)“,”后的數(shù)字“,i”表示的是第i位bit。目前二十八頁\總數(shù)四十八頁\編于九點
收端編碼器圖9.5:
LPC-10
收端解碼器框圖?!艚邮招盘柦?jīng)串/并變換及同步后,用查表法進行檢錯、糾錯?!糇g碼后的數(shù)據(jù)經(jīng)參數(shù)解碼得:解碼參數(shù),結果延時一幀輸出。◆輸出數(shù)據(jù)在過去幀、當前幀和將來幀,共
3
幀內(nèi)平滑?!裘繋粋鬏斠唤M參數(shù),但一幀內(nèi)可有不止一個基音周期,因此,要對接收數(shù)值進行由幀塊到基音塊的轉換和插值。第9章線性預測聲碼器9.3
LPC-10
聲碼器同濟大學電子與信息工程學院-29-趙曉群
教授圖9.5
LPC-10收端解碼器框圖
合成語音輸出數(shù)字語音輸入RCTU/VRMS參數(shù)解碼串/并變換同步檢測誤差檢測校正解碼幀塊到基音塊轉換與插值噪聲產(chǎn)生基音產(chǎn)生反射系數(shù)轉換成預測系數(shù)清/濁音開關綜合器計算增益輸出存儲器去加重D/A變換3600Hz低通濾波目前二十九頁\總數(shù)四十八頁\編于九點
(1)
參數(shù)插值原則?!魧?shù)面積比參數(shù)值每幀插值兩次;◆
RMS
參數(shù)值在對數(shù)域進行基音同步插值;◆基音參數(shù)值用基音同步的線性插值;◆在濁音向清音過渡時對數(shù)面積比不插值?!裘總€基音周期更新一次預測系數(shù)、增益、基音周期、清/濁音等參數(shù),這個過程在幀塊到基音塊的轉換和插值中完成。
第9章線性預測聲碼器9.3
LPC-10
聲碼器同濟大學電子與信息工程學院-30-趙曉群
教授目前三十頁\總數(shù)四十八頁\編于九點
(2)
激勵源。◆根據(jù)基音周期和清/濁音標志決定要采用的激勵信號源。◆清音幀用隨機數(shù)作為激勵源;◆濁音幀用周期性沖激序列通過一個全通濾波器來生成激勵源,◆語音合成濾波器輸入激勵的幅度保持恒定不變,輸出幅度受RMS
參數(shù)加權。◆給出一組有41
個樣點的濁音激勵信號:若當前的基音周期不等于41個樣點,則將此激勵源截短或者填零,使之與基音周期等長。
第9章線性預測聲碼器9.3
LPC-10
聲碼器同濟大學電子與信息工程學院-31-趙曉群
教授目前三十一頁\總數(shù)四十八頁\編于九點
(3)
語音合成?!粲肔evinson
遞推算法將反射參數(shù)變換成預測系數(shù)?!羰斩撕铣善鲬弥苯有瓦f歸濾波器合成語音?!魧ζ漭敵鲞M行幅度校正、去加重,并變換為模擬信號,最后經(jīng)3600Hz
的低通濾波器后輸出模擬語音。第9章線性預測聲碼器9.3
LPC-10
聲碼器同濟大學電子與信息工程學院-32-趙曉群
教授目前三十二頁\總數(shù)四十八頁\編于九點第9章線性預測聲碼器9.3
LPC-10
聲碼器同濟大學電子與信息工程學院-33-趙曉群
教授
LPC?10
聲碼器存在的問題
(1)
損失了語音的自然度?!魧嶋H語音的殘差信號中,有部分既非周期脈沖又非隨機噪聲;或者低頻段是周期脈沖,高頻段是隨機噪聲?!舨捎枚畲鏆埐钚盘?,使合成語音聽起來不自然。
(2)
穩(wěn)健性(Robustness)差?!粼肼暛h(huán)境下,基音周期和清/濁音判決不易準確提取。◆噪聲較強時,系統(tǒng)性能顯著惡化。
(3)
共振峰位置及帶寬估值會有很大失真?!羰д娴脑蚴菨嵴Z音段時域上的周期重復信號使得短時語音譜形接近于線狀分布譜?!艋l較大,且與譜包絡中共振峰
f1相接近,即f1=1/T。
由于LPC譜估計力圖使模型譜逼近于信號譜包絡,在估計出的譜包絡中會出現(xiàn)極其尖銳的峰值。在合成語音中會出現(xiàn)尖峰或較大毛刺,從而影響語音質(zhì)量。目前三十三頁\總數(shù)四十八頁\編于九點第9章線性預測聲碼器9.4
增強型LPC?10聲碼器增強型
LPC?10
聲碼器(簡記為LPC?10e)是一種改進的,與LPC?10算法兼容的聲碼器。
LPC?10e的改進主要包括:
激勵源的改善
(1)
采用混合激勵代替簡單的二元激勵
(2)
激勵脈沖加抖動
(3)
單脈沖與碼書相結合的激勵模式
基音提取方法的改進
聲道濾波器參數(shù)量化的改進
LSF參數(shù)的矢量量化第9章線性預測聲碼器9.4
增強型LPC-10
聲碼器同濟大學電子與信息工程學院-34-趙曉群
教授目前三十四頁\總數(shù)四十八頁\編于九點
激勵源的改善
(1)
采用混合激勵代替簡單的二元激勵采用該技術,合成語音的質(zhì)量得到改善。圖9.6:LPC?10e
編碼器原理圖。第9章線性預測聲碼器9.4
增強型LPC-10
聲碼器同濟大學電子與信息工程學院-35-趙曉群
教授圖9.6
LPC-10e編碼器原理圖
數(shù)據(jù)輸出低通濾波器白化濾波器AMDF函數(shù)基音檢測計算能量設置清/濁音窗檢測過零率確定起始點預加重RMS計算清/濁音判決設置分析窗協(xié)方差分析參數(shù)編碼原始語音輸入◆經(jīng)二階LPC分析濾波器濾除共振峰后,得白化語音;◆再提取基音周期,精度可改善?!舴治龃暗钠瘘c為語音特征短時急劇變化處?!粼摯胧┨岣吡撕铣烧Z音的清晰度。目前三十五頁\總數(shù)四十八頁\編于九點◆起始點的計算:由預加重語音的平滑自相關函數(shù)值的變化確定。計算公式如下:式中N——幀長;
ri(0)
——i時刻幀長64的信號x(i)
的0位移自相關函數(shù)。
ri(1)——i時刻幀長64的信號x(i)
的1位移自相關函數(shù)?!羯鲜綖橐环N遞推計算式,可節(jié)省計算量。如果Y(i)以超過某個給定的閾值,則
i
點為起始點。第9章線性預測聲碼器9.4
增強型LPC-10
聲碼器同濟大學電子與信息工程學院-36-趙曉群
教授目前三十六頁\總數(shù)四十八頁\編于九點圖9.7:LPC?l0e
解碼器原理圖。第9章線性預測聲碼器9.4
增強型LPC-10
聲碼器同濟大學電子與信息工程學院-37-趙曉群
教授圖9.7
LPC-10e解碼器原理圖
合成語音輸出數(shù)據(jù)輸入共振峰展寬反射系數(shù)轉換成預測系數(shù)第一級合成第二級合成解碼去加重爆破脈沖發(fā)生器誤差校正噪聲生成器參數(shù)插值基音脈沖發(fā)生器⊕增益調(diào)整混合器為混合激勵,改善了音質(zhì)目前三十七頁\總數(shù)四十八頁\編于九點濁音的激勵源:經(jīng)低通濾波的周期脈沖序列與經(jīng)高通濾波的白噪聲相加而成,
混合比例隨輸入語音的濁化程度改變。清音的激勵源:白噪聲與位置很近且隨機的正、負脈沖形成的爆破脈沖對之和。◆爆破音時,脈沖對的幅度增大,與語音的突變成正比,反之則脈沖對的幅度很小?;旌霞罡纳屏撕铣烧Z音的金屬聲、重擊聲、音調(diào)噪聲等,同時對U/V
判決的敏感程度有所降低。共振峰由兩個級聯(lián)的綜合器形成,第一個是全零點濾波器,第二個是LPC
綜合濾波器。美國第三代保密電話采用LPC?l0e
聲碼器。第9章線性預測聲碼器9.4
增強型LPC-10
聲碼器同濟大學電子與信息工程學院-38-趙曉群
教授目前三十八頁\總數(shù)四十八頁\編于九點
(2)激勵脈沖加抖動二元激勵方案適于較準確的濁音幀/清音幀的判別。◆濁音的激勵信號具有周期和脈沖性質(zhì),適于強基音相關時?!艋糁械葟姸认嚓P時,或殘差信號中有大的峰值,應判定為抖動的濁音幀。生成抖動的濁音幀:使激勵信號中的周期脈沖的相位隨機地抖動?!舴椒ǎ簩γ總€基音周期的長度乘0.75~1.25
之間
均勻分布的隨機數(shù)??梢愿纳普Z音的自然度。
第9章線性預測聲碼器9.4
增強型LPC-10
聲碼器同濟大學電子與信息工程學院-39-趙曉群
教授目前三十九頁\總數(shù)四十八頁\編于九點
(3)
單脈沖與碼書相結合的激勵模式◆低比特率下,合成高質(zhì)量的語音的關鍵技術之一:有效、精確地表示激勵信號?!?/p>
LPC
殘差信號特點:
濁音時,往往存在以基音周期重復的大幅度尖脈沖,
清音時,往往類似于隨機噪聲。◆不同的語音段采用不同的激勵模式,可取得較好效果。即:脈沖+碼書激勵(見圖9.8
)。
周期性語音段,以基音周期重復的單脈沖為激勵源;
非周期性語音段用從碼書中選擇的隨機序列為激勵源。第9章線性預測聲碼器9.4
增強型LPC-10
聲碼器同濟大學電子與信息工程學院-40-趙曉群
教授圖9.8單脈沖與碼書激勵相結合的LPC綜合模型合成語音隨機碼書(非周期)幅度校正幅度校正全極點濾波器單脈沖(周期)U/V目前四十頁\總數(shù)四十八頁\編于九點
基音提取方法的改進采用LPC
的殘差信號或者語音信號的自相關函數(shù),利用動態(tài)規(guī)劃的平滑算法來更準確地提取基音周期?!?/p>
LPC
殘差信號經(jīng)低通后,求出所有可能的基音延時點上的歸一化自相關系數(shù),選出其中的L
個最大值,◆再用過去和將來相鄰3
幀的每幀L
個最大值,用動態(tài)規(guī)劃的算法求得最佳基音值。寬帶噪聲時,LPC
的殘差信號中的基音周期可能被破壞,這時可用低通的語音信號代替殘差信號,提取基音周期。第9章線性預測聲碼器9.4
增強型LPC-10
聲碼器同濟大學電子與信息工程學院-41-趙曉群
教授目前四十一頁\總數(shù)四十八頁\編于九點
聲道濾波器參數(shù)量化的改進(1)
LSF在數(shù)學上的量化特性
LSF有良好的量化特性,在現(xiàn)代聲碼器中應用越來越多。①LSF參數(shù)的有序有界性:◆若H(z)的極點在單位圓內(nèi),則P(z)和Q(z)的零點在單位圓上?!鬚(z)和Q(z)的零點(即LSF)更精確地反映頻率的性質(zhì)?!羝渑帕许樞驖M足:②LSF誤差相對獨立性:◆某頻點LSF偏差只對該頻率附近的語音頻譜產(chǎn)生影響,對其它LSF頻率上的語音頻譜影響不大;◆利于LSF的參數(shù)量化及插值。第9章線性預測聲碼器9.4
增強型LPC-10
聲碼器同濟大學電子與信息工程學院-42-趙曉群
教授目前四十二頁\總數(shù)四十八頁\編于九點(2)
LSF參數(shù)的標量量化
①求LSF參數(shù)的概率分布函數(shù)
◆對語音信號分幀、剔除無聲幀、隔直流、幀間疊接,◆計算各幀的LSF
參數(shù),組成一個足夠大的參數(shù)集合,以得到每個LSF參數(shù)的最低、最高頻率和概率分布函數(shù)。
②檢驗參數(shù)的合理性
◆利用LSF參數(shù)取值范圍及有序性的限制,檢驗求取的LSF參數(shù)是否準確合理;◆該措施保證系統(tǒng)穩(wěn)定。③失真測度及量化方法
◆失真測度用Euclid
距離;◆采用動態(tài)規(guī)劃算法進行非均勻的全局最佳量化。
第9章線性預測聲碼器9.4
增強型LPC-10
聲碼器同濟大學電子與信息工程學院-43-趙曉群
教授目前四十三頁\總數(shù)四十八頁\編于九點④量化器的設計
◆假定LSF參數(shù)ω、θ
統(tǒng)一排序為:ω1、ω2、…、ωp
Ni——ωi的量化階數(shù),Pi(ω)——ωi的概率密度函數(shù),
ωimin,ωimax——ωi的最低頻率和最高頻率(已知)。注:為方便起見,在公式中去掉表示第i個參數(shù)的下標i?!粼Oq(ω)是ω
的量化,則設計q(ω)是使量化畸變
D為最?。骸?/p>
N個判決(重建)頻率的量化器,是選擇重建頻率
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《模具設計與制造課程設計》教學大綱
- 建筑防火教研室教案
- 玉溪師范學院《數(shù)字電子技術》2021-2022學年期末試卷
- 數(shù)據(jù)終端設備賬務處理實例-做賬實操
- 冬季防火教育課件
- 房地產(chǎn) -宋風古城商業(yè)景觀氛圍營造設計
- 2024年礦業(yè)測量儀器項目綜合評估報告
- 2023年濕法加工合成云母粉項目評價分析報告
- 草坪地毯購買協(xié)議書范本
- 彩磚鋪設協(xié)議書
- 2024年國家公務員考試《行測》真題卷(行政執(zhí)法)答案和解析
- 消化內(nèi)科五年發(fā)展規(guī)劃
- 生豬屠宰獸醫(yī)衛(wèi)生檢驗人員理論考試題庫及答案
- 《陸上風電場工程設計概算編制規(guī)定及費用標準》(NB-T 31011-2019)
- 大蔥栽培技術.ppt
- 列管式冷卻器、GLC型冷卻器尺寸表(共3頁)
- 國家開放大學《數(shù)學思想與方法》形考任務參考答案
- SAPO_34分子篩表面酸性質(zhì)的研究
- 貨運證明范本
- 電機常用公差配合
- 幕墻使用、保養(yǎng)、維修說明書
評論
0/150
提交評論