




已閱讀5頁,還剩53頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
2 3語音的產(chǎn)生模型和LPC聲碼器 3 人的發(fā)聲系統(tǒng)由聲帶 聲門 聲道以及次聲門組成 次聲門又由肺和氣管等組成 是語音的激勵源 次聲門系統(tǒng)產(chǎn)生的氣流作用于聲帶 通過聲道后就產(chǎn)生聲音 根據(jù)發(fā)音機理 聲音信號可分為清音和濁音 一 語音信號的基本特性 4 一 語音信號的基本特性 當(dāng)聲帶震動產(chǎn)生一個準(zhǔn)周期空氣脈沖激勵聲道時就產(chǎn)生濁音 濁音具有明顯的準(zhǔn)周期性 聲帶震動的頻率稱為基音頻率 周期為基音周期 基音頻率一般在70 450Hz范圍內(nèi) 相當(dāng)于周期為2 15ms 基音周期是語音信號的主要特征之一 5 一 語音信號的基本特性 6 一 語音信號的基本特性 如果聲道在某處發(fā)生收縮 迫使空氣以高速沖過這一收縮部位而產(chǎn)生湍流 就得到清音 發(fā)清音時聲帶不振動 是由湍流建立的寬帶噪聲源激勵聲道而發(fā)聲 清音波形類似于白噪聲 7 一 語音信號的基本特性 8 一 語音信號的基本特性 9 一 語音信號的基本特性 語音信號的基本特性語音信號是非穩(wěn)態(tài)信號 特征隨時間變化 但在一個很短的時間段內(nèi) 約5ms 50ms 具有相對穩(wěn)定的特征 稱為準(zhǔn)平穩(wěn)信號 語音信號通??梢苑譃闈嵋?清音和混合音 濁音在時域上具有準(zhǔn)周期性 在頻域上 精細譜具有周期性起伏的諧波特性 譜包絡(luò)具有共振峰結(jié)構(gòu) 清音類似于隨機噪聲 其頻帶較寬 濁音段的信號能量要比清音段的能量高 這一特點可用于判斷區(qū)分清 濁音 10 一 語音信號的基本特性 11 激勵源等效為基音頻率的周期性脈沖或具有平坦頻譜的白噪聲 聲道等效為時變線性數(shù)字濾波器 當(dāng)激勵源采用周期脈沖源時 聲道輸出的是濁音 采用白噪聲源時 聲道輸出的是清音 二 語音信號的產(chǎn)生模型 12 二 語音信號的產(chǎn)生模型 13 二 語音信號的產(chǎn)生模型 14 產(chǎn)生語音信號s n 的參量清 濁音類型 基音周期TP 代表聲道的時變?yōu)V波器的系數(shù) aj 及濾波器階數(shù)p 增益系數(shù)G 說明 根據(jù)語音信號慢變化的特點 可以每隔10 30ms左右預(yù)測一次上述各參數(shù)的值 即以每10 30ms為一幀傳送一次參數(shù)樣值的編碼 并不傳送話音樣值的編碼 因此比特速率低得多 二 語音信號的產(chǎn)生模型 15 三 LPC聲碼器的工作原理 16 1 全極點數(shù)字濾波器參數(shù)的確定階數(shù)P模型階數(shù)P的選擇 應(yīng)該從頻譜估計精度 計算量 存儲量等多方面綜合進行考慮 P取很大值時 可以獲得很好的信號譜估計 但增加的計算量和存儲量代價太大 語音譜估計時主要關(guān)心的是聲道的諧振特性 P值過大 估計的譜中保留許多信號譜細節(jié) 反而使共振峰分析效果變壞 階數(shù)P的經(jīng)驗值在8 12之間 通常采用10個極點的濾波器 模型就能正確描述共振峰特性和譜的基本形狀 三 LPC聲碼器的工作原理 17 濾波器系數(shù) aj 三 LPC聲碼器的工作原理 設(shè)計的濾波器系數(shù) aj 就是使得誤差e n 在某個預(yù)定的準(zhǔn)則下最小 通常是根據(jù)最小均方誤差準(zhǔn)則求解 aj 在LPC模型中 信號s n 的估計誤差e n 為 18 三 LPC聲碼器的工作原理 根據(jù)最小均方誤差準(zhǔn)則通過求解P個方程來得到P個未知數(shù)aj 19 三 LPC聲碼器的工作原理 2 基音檢測根據(jù)語音信號的特性檢測基音周期的方法有 利用時域特性檢測 利用頻域特性檢測 同時利用時域和頻域特性檢測 這里只介紹利用時域特性檢測 20 基本原理 利用語音信號的時域波形的相似性 通過比較原始信號和它的移位信號的相似程度來尋找基音周期 如果移位的距離等于基音周期 則兩個信號之間將具有最大的相似性 常用方法 短時自相關(guān)函數(shù)和短時平均幅度差函數(shù)AMDF 利用時域特性檢測 三 LPC聲碼器的工作原理 21 三 LPC聲碼器的工作原理 基于求短時自相關(guān)函數(shù)的基音周期估計 22 三 LPC聲碼器的工作原理 sw n 的自相關(guān)函數(shù)稱為語音信號s n 的短時自相關(guān)函數(shù) 用Rw l 表示 如果s n 是濁音 其短時自相關(guān)函數(shù)Rw l 呈現(xiàn)出明顯的周期性 其周期等于s n 的基音周期 基音周期就是第一個峰值點到零點之間的距離 23 三 LPC聲碼器的工作原理 24 設(shè)sw n 是一段加窗的語音信號 它的非零區(qū)域為 n 0 N 1 sw n 的短時平均幅度差函數(shù)rw l 定義為 三 LPC聲碼器的工作原理 基于短時平均幅度差函數(shù) AMDF 的基音周期估計 25 三 LPC聲碼器的工作原理 如果s n 是濁音 其AMDF也呈現(xiàn)出明顯的周期性 其周期等于s n 的基音周期 與Rw l 不同的是在基音周期的各個整數(shù)倍點上 rw l 具有谷值而非峰值 要通過尋找最深谷值點的位置來確定基音周期 26 三 LPC聲碼器的工作原理 27 兩種基音周期估計方法比較AMDF方法計算簡單 只需減法和取幅度運算 不需要乘法運算 AMDF的動態(tài)范圍較小 易于算法的定點實現(xiàn) AMDF在基音周期點上 它的谷點銳度較之短時自相關(guān)函數(shù)的峰點銳度更尖銳 估值精度更高 更穩(wěn)健 但信號不夠平穩(wěn)時 這個特點不明顯 短時自相關(guān)函數(shù)法的特點是對相位不敏感 在信號有相位失真時能較好地檢測基音 三 LPC聲碼器的工作原理 28 窗長為了使較好地反映sw n 的周期性 窗長N至少應(yīng)大于兩個基音周期 一般取長度為10 30ms 克服共振峰特性造成的干擾由于共振峰的干擾 會出現(xiàn)Rw l 的第一最大峰值點或rw l 的第一最深谷值點與基音周期不一致的情況 當(dāng)基音周期性和共振峰周期性混在一起時 檢測出來的周期可能是Np Nf Np是基音周期 Nf是第一共振峰的周期 三 LPC聲碼器的工作原理 討論 29 克服上述干擾有兩種方法 用低通濾波器 60Hz 900Hz 對語音信號進行濾波 去除大部分共振峰的影響 基音頻率最高約450Hz 濾波后可以保留其一 二次諧波 先對語音信號進行非線性變換 例如 中心削波 然后再求Rw l 或rw l 這樣可以明顯地改善基音估計的效果 基音周期點上 峰值點或深谷值點比削波前得到的要尖銳 突出 三 LPC聲碼器的工作原理 30 中心削波中 為了保證表征基音周期的峰值不被削掉 削波電平CL的選擇很重要 由于語音信號的電平變化很大 不宜選擇固定電平 通常是找到語音幀的前1 3和最后1 3內(nèi)的最大幅度 選取二值中較小的幅值 削波電平取其60 80 即可 通常定為68 三 LPC聲碼器的工作原理 31 對于加窗的語音信號sw n 當(dāng)窗的起點n 0時 語音信號sw n 的短時能量用E表示 短時平均幅度用M表示 計算公式如下 三 LPC聲碼器的工作原理 3 濁音 清音及無聲的判別根據(jù)語音信號的短時能量 短時平均幅度和短時過零率來判斷當(dāng)前幀的語音信號是濁音 清音 還是無聲 32 語音信號的過零率用Z表示 它表示一幀語音信號中波形穿過橫軸 零電平 的次數(shù) 它可以用相鄰兩個取樣改變符號的次數(shù)來計算 三 LPC聲碼器的工作原理 33 濁音 V 的M最大而Z最低 當(dāng)采樣率為8kHz 幀長為20ms時 Z的平均值約為20 清音 U 的M居中而Z最高 當(dāng)采樣率為8kHz 幀長為20ms時 Z的平均值約為70 無聲 S 的M最低而Z居中 判斷當(dāng)前幀是濁音 清音 無聲的依據(jù)如下 三 LPC聲碼器的工作原理 34 三 LPC聲碼器的工作原理 在S U V三種情況下 短時平均幅度M和短時過零率Z的條件概率密度函數(shù)示意圖 35 四 LPC10聲碼器 復(fù)習(xí) LPC聲碼器的工作原理 36 1 LPC10聲碼器概況LPC 10聲碼器采用10階線性預(yù)測分析濾波器 編碼速率為2 4kb s 被美國在1981年作為聯(lián)邦標(biāo)準(zhǔn)FS 1015用于窄帶保密通信 其語音質(zhì)量清晰可懂 但抗噪聲的能力和自然度尚有欠缺 四 LPC10聲碼器 37 四 LPC10聲碼器 2 LPC10編碼器 38 LPC 10編碼器的特點 1 采樣采樣率8kHz 每個樣本量化為12bit得到數(shù)字化語音 每180個樣點分為一幀 22 5ms 以幀為處理單元 四 LPC10聲碼器 預(yù)加重的目的是加強語音譜中的高頻共振峰 使語音短時譜以及線性預(yù)測分析中的余數(shù) 殘差 頻譜變得更為平坦 從而提高了譜參數(shù)估值的精確性 2 預(yù)加重在提取聲道參數(shù)之前 先進行預(yù)加重 高頻提升 處理 預(yù)加重濾波器的傳輸函數(shù)Hpw z 為 39 傳輸函數(shù)Hpw z 的幅頻和相頻特性 四 LPC10聲碼器 40 3 聲道濾濾器參數(shù)RC該編碼方案中采用協(xié)方差法計算預(yù)測系數(shù) ai i 1 P P 10 預(yù)測系數(shù)不適于直接量化 因為它的微小變化會導(dǎo)致LP綜合濾波器極點位置很大的變化 很可能造成濾波器不穩(wěn)定 為了保證濾波器的穩(wěn)定性 要求有相當(dāng)高的量化精度 每個系數(shù)需要8 10bits 四 LPC10聲碼器 41 四 LPC10聲碼器 為了降低量化比特數(shù) 采用了在數(shù)學(xué)上完全等價的P個反射系數(shù) RC ReflectionCoefficient ki i 1 P代替預(yù)測系數(shù)進行量化編碼 濾波器穩(wěn)定的條件是參數(shù)ki滿足下式 此條件在量化時容易保證 可以通過Levinson Durbin算法求得部分相關(guān)系數(shù) PartialCorrelation 部分相關(guān)系數(shù)與RC在理論上是互為相反數(shù) 42 4 增益RMS增益RMS由下式計算 Si是經(jīng)過預(yù)加重后的數(shù)字語音信號樣本 N是分析幀長度 對于濁音幀 其分析幀長取為130個樣本以內(nèi)的基音周期整數(shù)倍值 對于清音幀 其分析幀長取為長度為22 5ms的整個幀的中點為中心的130個樣點 四 LPC10聲碼器 43 清 濁音判決是利用模式匹配技術(shù) 基于低帶能量 AMDF函數(shù)的最大值與最小值之比 過零率三個因素判別 最后對基音值 清濁音判決結(jié)果用動態(tài)規(guī)劃算法 在三幀范圍內(nèi)進行平滑和錯誤校正 從而給出當(dāng)前幀的基音周期 清濁音判決參數(shù)V U 5 提取基音周期和檢測清 濁音采用基于短時平均幅度差函數(shù) AMDF 法提取基音周期 四 LPC10聲碼器 44 6 參數(shù)編碼對10個反射系數(shù)RC 增益RMS 基音周期 U V判決標(biāo)志以及同步信號共編碼成每幀54bits 幀長22 5ms 因此編碼速率為2 4kb s 各比特分配如下表 四 LPC10聲碼器 45 四 LPC10聲碼器 46 四 LPC10聲碼器 3 LPC10譯碼器 47 LPC 10聲碼器的缺點 1 采用過分簡化的二元激勵 合成的語音自然度較低 2 穩(wěn)健性 Robustness 差 3 LPC 10的語音譜共振峰的位置以及帶寬估值有時會產(chǎn)生很大的失真 從而影響語音的質(zhì)量 當(dāng)濁音的基音頻率接近譜包絡(luò)中的第一共振峰時 LPC譜估計在共振峰位置上出現(xiàn)極其尖銳的峰值 估計失真 使得相應(yīng)得在合成語音中會出現(xiàn)尖峰或較大的毛刺 影響語音質(zhì)量 四 LPC10聲碼器 48 采用混合激勵代替簡單的二元激勵 使合成語音的質(zhì)量得到改善 激勵脈沖加抖動 對每個基音周期的長度乘上一個0 75 1 25之間均勻分布的隨機數(shù)以改善語音的自然度 4 LPC 10e聲碼器LPC 10e聲碼器采用針對LPC 10聲碼器的缺點加以改進的算法 并能與LPC 10聲碼器兼容 用于美國第三代保密電話 四 LPC10聲碼器 1 激勵源的改善 49 2 基音提取方法的改進LPC 10提取基音采用的是AMDF 它的顯著特點是不需要乘法 計算較小 LPC 10e中采用LPC的殘差信號或語音信號的短時自相關(guān)函數(shù) 利用動態(tài)規(guī)劃的平滑算法來更準(zhǔn)確地提取基音周期 四 LPC10聲碼器 50 3 聲道濾波器參數(shù)量化的改進線譜頻率LSF LineSpectrumFrequency 或稱為線譜對 LineSpectrumPair 是數(shù)學(xué)上與線性預(yù)測系數(shù) ai i 1 P 和反射系數(shù) ki i 1 P 完全等價的另一種表示方式 LSF參數(shù)集 i i 1 P 都在單位圓上 它們在頻域描述全極點濾波器H Z LSF在數(shù)學(xué)上有良好的量化特性 四 LPC10聲碼器 51 四 LPC10聲碼器 在求取LSF參數(shù)及量化過程中 如果保持LSF參數(shù)的有序有界性質(zhì) 即 就可以保證全極點濾波器H Z 是穩(wěn)定的 LSF參數(shù)有序有界性 52 LSF誤差相對獨立性某個頻率點的LSF偏差只對該頻率附近的語音頻譜產(chǎn)生影響 而對其它LSF頻率上的語音頻譜影響不大 這有利于LSF的參數(shù)量化和插值 四 LPC10聲碼器 53 LSF參數(shù)的量化在標(biāo)量量化時 通過設(shè)計最佳的LSF參數(shù)的非均勻標(biāo)量量化器 可以用較少的量化比特達到較高的量化精度 例如 對10個LSF參數(shù) 根據(jù)每個參數(shù)所起的作用 分配的量化比特數(shù)為 3 4 4
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 海水淡化處理中的蒸發(fā)技術(shù)應(yīng)用考核試卷
- 火力發(fā)電廠施工信息技術(shù)應(yīng)用考核試卷
- 電機在實驗儀器中的應(yīng)用考核試卷
- 裝飾材料企業(yè)產(chǎn)品創(chuàng)新與市場接受度考核試卷
- 營養(yǎng)食品在極端環(huán)境適應(yīng)中的研究考核試卷
- 物聯(lián)網(wǎng)智能電網(wǎng)數(shù)據(jù)分析考核試卷
- 輕質(zhì)建筑材料制造續(xù)考核試卷
- 稀土金屬提煉過程中的政策引導(dǎo)與市場機制構(gòu)建研究分析考核試卷
- 腫瘤表觀遺傳學(xué)研究進展
- 情感出軌方獨立承擔(dān)擔(dān)保責(zé)任及財產(chǎn)分割協(xié)議
- 2024-2025年遼寧省面試真題
- 2024年高考真題-地理(河北卷) 含答案
- 單位駕駛員勞務(wù)派遣投標(biāo)方案投標(biāo)文件(技術(shù)方案)
- 資本經(jīng)營-終結(jié)性考試-國開(SC)-參考資料
- 2024年浙江省中考科學(xué)試卷
- 拆除工程地坪拆除施工方案
- 軟件授權(quán)書范本
- 招聘筆試題與參考答案(某大型國企)2025年
- DB34∕T 2570-2015 祁紅香螺加工技術(shù)規(guī)程
- 安徽合肥濱湖投資控股集團有限公司招聘筆試題庫2024
- 2024年四年級英語下冊 Module 4 Things we enjoy Unit 12 The ugly duckling第3課時教案 牛津滬教版(三起)
評論
0/150
提交評論