




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、語音增強原理及應(yīng)用的討論內(nèi)容語音增強相關(guān)概念語音增強基本原理及應(yīng)用語音增強的定義 語音增強是指當(dāng)語音信號被各種各樣的噪聲干擾、甚至淹沒后,從噪聲背景中提取有用的語音信號,抑制、降低噪聲干擾的技術(shù)。一句話,從含噪語音中提取盡可能純凈的原始語音。語音增強的目標(biāo)改進語音質(zhì)量,消除背景噪音;提高語音可懂度!兩者往往不能兼得,所以實際應(yīng)用中總是視具體情況而有所側(cè)重的!語音噪聲類型 帶噪語音的噪聲類型按與信號關(guān)系可以分為加性噪聲和非加性噪聲。加性噪聲有寬帶的,窄帶的,平穩(wěn)的,非平穩(wěn)的,白噪聲,有色噪聲,等;非加性噪聲如乘性噪聲,卷積噪聲等。語音噪聲類型加性噪聲:一般指熱噪聲、散彈噪聲等,它們與信號的關(guān)系是
2、相加,不管有沒有信號,噪聲都存在,信號與噪聲是相互獨立的!加性噪聲來源一殷可以分為三方面:(1)人為噪聲;(2)自然噪聲;(3)內(nèi)部噪聲。語音噪聲類型乘性噪聲:一般由信道不理想引起,它們與信號的關(guān)系是相乘,信號在它在,信號不在他也就不在。一般通信中把加性隨機性看成是系統(tǒng)的背景噪聲; 而乘性隨機性看成系統(tǒng)的時變性(如衰落或者多普勒)或者非線性所造成的。其他常見噪聲名詞白噪聲:表示在全頻域內(nèi)單位頻域下都分布有相同的能量密度,在線性空間內(nèi)它具有平坦的頻譜。換句話說,一定頻域內(nèi)的白噪聲在其中任意給定的帶寬內(nèi)都具有相等的功率。隨機噪聲:噪聲波形是隨機的,不可預(yù)測的。平穩(wěn)噪聲:是指分布參數(shù)或者分布律隨時間
3、不發(fā)生變化的噪聲。 語音噪聲特性一般,語音增強處理的噪聲指環(huán)境中的噪聲,而這些噪聲主要是高斯白噪聲,這種噪聲一般符合如下的假設(shè):(1)噪聲是加性的。(2)噪聲是局部平穩(wěn)的。局部平穩(wěn)是指一段加噪語音中的噪聲,具有和語音段開始前那段噪聲相同的統(tǒng)計特性,且在整個語音段中保持不變。也就是說,可以根據(jù)語音開始前那段噪聲來估計語音中所疊加的噪聲統(tǒng)計特性。(3)噪聲與語音統(tǒng)計獨立或不相關(guān)。到底什么是傅立葉變換?有時信號在時域特征不明顯,我們通常的將它變換到頻域,這時會用到傅里葉變換,那么傅里葉變換到底是什么呢?傅里葉變換是將時域信號分解為不同頻率的正弦信號或余弦函數(shù)疊加之和。連續(xù)情況下要求原始信號在一個周期
4、內(nèi)滿足絕對可積條件。離散情況下,傅里葉變換一定存在。 到底什么是傅立葉變換?一個恰當(dāng)?shù)谋扔魇菍⒏道锶~變換比作一個玻璃棱鏡。棱鏡是可以將光分解為不同顏色的物理儀器,每個成分的顏色由波長(或頻率)來決定。傅里葉變換可以看作是數(shù)學(xué)上的棱鏡,將函數(shù)基于頻率分解為不同的成分。當(dāng)我們考慮光時,討論它的光譜或頻率譜。同樣, 傅立葉變換使我們能通過頻率成分來分析一個函數(shù)。到底什么是傅立葉變換?在頻域中,頻率越大說明原始信號變化速度越快;頻率越小說明原始信號越平緩。當(dāng)頻率為0時,表示直流信號,沒有變化。因此,頻率的大小反應(yīng)了信號的變化快慢。高頻分量解釋信號的突變部分,而低頻分量決定信號的整體形象。 l語音增強常
5、用方法根據(jù)語音和噪聲的特點,出現(xiàn)了很多種語音增強算法。語音增強方法有噪聲對消法、譜相減法、維納濾波法、卡爾曼濾波法,F(xiàn)IR自適應(yīng)濾波等。其中譜相減法、wiener濾波,卡爾曼濾波是常用增強方法,下面簡單介紹下其原理。維納濾波維納濾波卡爾曼濾波卡爾曼濾波的基本思想:采用信號與噪聲的狀態(tài)空間模型,利用前一時刻的估計值和當(dāng)前時刻的觀察值來更新對狀態(tài)變量的估計, 以求現(xiàn)時刻的估計值。其特點:無需采用全部過去的觀察值進行估計, 適合于實時處理。 用狀態(tài)方程和量測方程表示信號和噪聲, 采用遞推法進行計算, 適合于計算機求解。適用范圍廣:平穩(wěn)或非平穩(wěn), 時變或非時變系統(tǒng)。譜減法的基本原理將含噪語音信號和有聲
6、/無聲判別得到的純噪聲信號進行FFT變化,從含噪語音幅度譜的平方中減去純噪聲的幅度譜的平方,然后開方,得原始語音譜幅度的估值,再借用含噪語音的相位,進行IFFT變化,得到增強的語音。含噪語音純噪聲原始語音譜幅度的估值DFT插入相位DFTIDFT原始語音的頻譜的估值譜減法流程圖譜減法假設(shè)噪聲疊加;噪聲與語音不相關(guān);對純凈語音無先驗知識;對統(tǒng)計噪聲有先驗知識。 帶噪語音模型:y(n)=s(n)+v(n)式中,y(n)是帶噪語音,s(n)是純凈語音,v(n)是噪聲。譜減法對語音模型公式兩邊進行傅立葉變換,得Y(k)=X(k)+N(k)由于對噪聲的統(tǒng)計參數(shù)的未知,所以在實際應(yīng)用中,通常使用非語音段噪聲譜的均值來作為對噪聲譜N(k)的估計,譜減法則對純凈語音幅度譜的估量表示為譜減法實現(xiàn)步驟根據(jù)已知的平臺噪聲進行FFT,計算噪聲功率譜譜平均值N(k);對含噪語音進行FFT計算得到其功率譜X(k),保留含噪語音相位;用含噪語音功率譜X(k)減去噪聲功率譜N(k),得到原始語音的功率譜估計值S(k);利用S(k)以及含噪語音相位進行IFFT,這樣就得到原始語音的估計值。譜減法缺點由于噪聲的隨機分布的范圍廣,因此相減時,若該幀某頻率點上的噪聲幅度譜分量大時,就會有很大一部分殘留,在頻譜上呈現(xiàn)隨機起伏的尖峰。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度離職員工離職后保密協(xié)議及競業(yè)限制執(zhí)行監(jiān)督履行合同
- 中藥材智能分揀與包裝系統(tǒng)行業(yè)深度調(diào)研及發(fā)展戰(zhàn)略咨詢報告
- 2025年度韓式料理店品牌加盟及店鋪轉(zhuǎn)讓合同
- 2025年度水利工程款撥付及水質(zhì)監(jiān)測協(xié)議
- 2025年度金融信息服務(wù)營業(yè)執(zhí)照及業(yè)務(wù)許可轉(zhuǎn)讓合同
- 2025年度美食節(jié)目廚師嘉賓合作合同
- 二零二五年度名人房產(chǎn)權(quán)屬變更手續(xù)代理合同
- 2025年度電子產(chǎn)品品牌授權(quán)及售后服務(wù)合作協(xié)議
- 二零二五年度股東協(xié)議書:XX高科技企業(yè)研發(fā)投入及股權(quán)激勵協(xié)議
- 二零二五年度綠色農(nóng)業(yè)項目用地租賃合同
- 《食品衛(wèi)生與安全》課程標(biāo)準(zhǔn)
- 第7課《誰是最可愛的人》公開課一等獎創(chuàng)新教學(xué)設(shè)計-2
- 骨盆骨折小講課護理課件
- 2016-2023年江蘇衛(wèi)生健康職業(yè)學(xué)院高職單招(英語/數(shù)學(xué)/語文)筆試歷年考點試題甄選合集含答案解析
- 渣土車司機安全培訓(xùn)
- 燃?xì)夤鞠琅嘤?xùn)課件
- 成事的時間管理
- 江西省2023年高等職業(yè)院校單獨招生考試-江西電力職業(yè)技術(shù)學(xué)院-樣卷
- 汽油安全技術(shù)說明書(MSDS)
- 眼球摘除患者的護理病例討論
- SPC過程能力分析報告
評論
0/150
提交評論