




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
語音信號(hào)的特性及預(yù)處理技術(shù)分析綜述信息的載體包含文本和語音。語音是人們最自然、最方便的溝通方式,方便了人與人之間的溝通,和日常生活息息相關(guān),然而被不同類型的生活噪聲受到影響,語音增強(qiáng)理論的主要目的在于解決噪聲干擾情況。當(dāng)前公眾的生活中涉及到不同用途的設(shè)備,包括手機(jī)等移動(dòng)通信設(shè)備,還有語音助手、揚(yáng)聲器等不同的智能電子設(shè)備,均采用語音增強(qiáng)技術(shù)力量。本章節(jié)闡述了有關(guān)語音增強(qiáng)技術(shù)的理論知識(shí)。涉及到語音信號(hào)以及噪音信號(hào)具備的不同特征,描述了有關(guān)語音信號(hào)進(jìn)行實(shí)驗(yàn)的基本思路。1.1語音信號(hào)語音直觀上可以看成一種連續(xù)的波,想要研究語音處理技術(shù)有必要先了解語音的特性。接著介紹語音的部分特性:短時(shí)穩(wěn)定性,在短時(shí)間內(nèi)(10ms~30ms),語音信號(hào)的頻譜特性和一些物理特性比較穩(wěn)定,稱為短時(shí)穩(wěn)定性,這是分析和處理語音信號(hào)的一個(gè)基本特征。清音和濁音。聲帶在發(fā)聲過程中不會(huì)受氣流影響振動(dòng)發(fā)出的是清音,類似白噪聲,不會(huì)表現(xiàn)出明顯的性質(zhì)差異。語音增強(qiáng)中難以消除。濁音來自于聲帶振動(dòng)。由于二者的皆有周期性脈沖氣流產(chǎn)生,所以它們?cè)跁r(shí)域上呈現(xiàn)周期性特征。共振峰存在于頻域中,由一些凸點(diǎn)組成,因此濁音在語音增強(qiáng)中容易被消除。此外還有人耳感知特性:人耳對(duì)于語音幅度值的敏感度要大于對(duì)相位信息的,存在掩蔽效應(yīng),且具備雞尾酒會(huì)效應(yīng)——在眾多聲音中捕捉到自己感興趣的話題。1.2噪聲信號(hào)一般來說,語音增強(qiáng)的目的是盡可能地減少噪聲對(duì)語音的影響,需要掌握噪聲的相關(guān)知識(shí),屬于語音增強(qiáng)處理過程的基礎(chǔ)性標(biāo)準(zhǔn)。公眾的生活環(huán)境的不同場(chǎng)合皆有噪聲的存在,包括學(xué)校、飯店還有會(huì)議室等,考慮到物理學(xué)的理論知識(shí),噪聲具體為復(fù)雜的、破碎的、間歇的或數(shù)學(xué)上不規(guī)則的聲音振動(dòng)。噪音對(duì)聲音的影響有不同的形式,包括加性關(guān)系和乘性關(guān)系。時(shí)域和頻域加性噪聲與語音具有加性關(guān)系。在頻域中,它與語音呈乘法關(guān)系。這類噪聲被稱作乘性噪聲。因?yàn)樗木矸e反映在時(shí)域上,所以乘積噪聲或卷積噪聲也是它的別稱。日常生活中的噪音,例如雨水和汽車,經(jīng)常會(huì)污染目標(biāo)語音。因此本文主要研究加性噪聲。噪聲的種類由于時(shí)間的改變而變化,可大致分為緩變?cè)肼?、平穩(wěn)噪聲、脈沖噪聲和周期噪聲。緩變?cè)肼曂纳x,其變化比較平緩。平穩(wěn)噪聲不隨時(shí)間變化而變化。脈沖噪聲也被稱作沖擊噪聲,是指在時(shí)域中產(chǎn)生窄脈沖的瞬時(shí)動(dòng)作所產(chǎn)生的噪聲REF_Ref70835715\n\h[3]。周期噪聲一般是由于機(jī)械的周期性運(yùn)轉(zhuǎn)產(chǎn)生。本文主要研究如何減弱平穩(wěn)噪聲的影響。1.3語音信號(hào)的數(shù)學(xué)表示1.3.1時(shí)域波形語音最直接、明顯的描述就是它的時(shí)域波形。時(shí)域具體是指物理信號(hào)或者數(shù)學(xué)函數(shù)和時(shí)間之間存在的關(guān)系。包括信號(hào)的時(shí)域波形能夠在一定程度上反映信號(hào)因?yàn)闀r(shí)間產(chǎn)生的波動(dòng),并且是唯一的實(shí)域。1.3.2頻域表示語音的時(shí)域表示簡(jiǎn)單直接,但是不利于分析其特性。因此,一般采用頻域分析。語音特征的表征取決于基本參數(shù)——頻域,因?yàn)轭l域是聽覺器官的頻率響應(yīng)角度和語音器官的共振角度的完美體現(xiàn)。例如,共振峰是一個(gè)典型的頻域參數(shù),它決定了信號(hào)頻譜的整體輪廓或頻譜包絡(luò)。振動(dòng)過程比聲帶的運(yùn)動(dòng)過程快得多。因此,一般認(rèn)為語音信號(hào)是短時(shí)穩(wěn)定信號(hào),在很短的時(shí)間內(nèi)(10~30ms)相對(duì)穩(wěn)定,然而,語音信號(hào)的特性會(huì)在較長(zhǎng)的語音周期內(nèi)發(fā)生變化,這種變化的差異決定了語音的差異。根據(jù)語音的這一特性,可以通過分析語音信號(hào)的一小段在每個(gè)時(shí)刻接近某一時(shí)刻的情況得到一個(gè)頻譜。1.3.3語譜圖從上面介紹可以看出對(duì)語音進(jìn)行單獨(dú)的時(shí)域分析或頻域分析都無法同時(shí)兼顧語音的頻率特性以及隨時(shí)間的變化。由于語音信號(hào)是短時(shí)穩(wěn)定信號(hào),因此可以通過分析幾乎每個(gè)時(shí)刻的短時(shí)語音信號(hào)來獲得頻譜,可以通過連續(xù)分析語音信號(hào)來獲得三維頻譜,橫坐標(biāo)表示時(shí)間,縱坐標(biāo)表示頻率。每個(gè)像素的灰度值反映了相應(yīng)時(shí)間和頻率的能量REF_Ref70932446\n\h[17]。這種與時(shí)間序列相關(guān)的傅立葉分析顯示模式稱為頻譜圖或頻譜圖。它結(jié)合了頻譜特性和時(shí)域波形特性,可以明顯反映音頻頻譜隨時(shí)間的變化,即動(dòng)態(tài)頻譜。語音頻譜由語音光譜儀獲得。語音光譜儀中有兩種類型的帶通濾波器:窄帶濾波器和窄帶濾波器。窄帶為45Hz,寬帶為300Hz。窄帶譜圖具有良好的頻率分辨率,有利于顯示基音頻率及其諧波,但時(shí)間分辨率較差(約11ms),不利于觀察共振峰的變化;反之,寬帶譜圖的時(shí)間分辨率很好的(大約1.6ms),但頻率分辨率不佳。寬帶頻譜圖可以顯示語音的共振峰頻率和清晰輔音的能量集中區(qū),共振峰呈黑色條紋。1.4語音預(yù)處理方法1.4.1加重處理語音頻譜的高頻產(chǎn)生一定波動(dòng),信號(hào)時(shí)常出現(xiàn)失真的情況??偨Y(jié)語音信號(hào)的實(shí)際特征之前,必須進(jìn)行預(yù)處理具有必要性REF_Ref70835242\n\h[2]。對(duì)高頻部分進(jìn)行加重是一種常用的方法:采用一階FIR化可以實(shí)現(xiàn)預(yù)加重,過程通常是在高通數(shù)字濾波器上進(jìn)行,這個(gè)濾波器的表達(dá)函數(shù)如式(1.1):(1.1)這里,是預(yù)加重系數(shù)。若語音值是采樣第n時(shí)刻的,語音信號(hào)加重處理后為:.(1.2)1.4.2加窗處理環(huán)境、時(shí)間影響語音信號(hào)的參數(shù)、特征,因此語音信號(hào)是一種非平穩(wěn)信號(hào)。之前我們提過語音信號(hào)具有短時(shí)平穩(wěn)性。因此可以將語音信號(hào)具體劃分部分時(shí)長(zhǎng)較短的片段便于進(jìn)一步開展分析以及處理工作,REF_Ref70920492\h圖1能夠矩形內(nèi)出現(xiàn)的短時(shí)間的語音段屬于語音幀,并且將語音幀的長(zhǎng)度稱作幀長(zhǎng)。圖SEQ圖\*ARABIC1語音幀示意圖從理論上說,但語音在分幀時(shí)會(huì)考慮語音信號(hào)的流暢度,REF_Ref70922819\h圖2所示分幀方法——重合分幀被廣泛采用,幀和幀保留一定的。幀移就是重疊部分,幀移比幀長(zhǎng)的范圍是(0,0.5)。成幀操作一般使用移動(dòng)窗函數(shù)截取或分段完成分段。兩種窗函數(shù)一般被采用,一是矩形窗,二是是漢明窗。圖SEQ圖\*ARABIC2幀長(zhǎng)與幀移語音信號(hào)本是無周期性的,通過加窗會(huì)呈現(xiàn)周期性,這使得分幀后每一幀初始段和結(jié)束段連續(xù)、平滑。因此上述窗函數(shù)起到了加權(quán)作用。如公式(1.3)(1.3)下標(biāo)代表加窗處理,加窗處理后的信號(hào)是;第二項(xiàng)為原始未經(jīng)處理的信號(hào);第三項(xiàng)為窗函數(shù)。圖SEQ圖\*ARABIC3矩形窗圖窗函數(shù)的使用需要根據(jù)具體情況而定,因?yàn)閷?duì)信號(hào)頻譜來說,使用不同的窗函數(shù)會(huì)有不同的效果。如REF_Ref70925894\h圖3就是最易見的矩形窗,定義是式(1.4):(1.4)式中L代表幀長(zhǎng)。一般而言不加窗就代表通過矩形窗。圖SEQ圖\*ARABIC4漢明窗圖常用的窗函數(shù)如REF_Ref70926813\h圖4所示,Hamming窗口,數(shù)學(xué)表達(dá)式(1.5)(1.5)窗函數(shù)本身的寬度與語言信號(hào)有一點(diǎn)的關(guān)系,語音信號(hào)的平滑度與函數(shù)的寬度呈正相關(guān)。矩形窗的函數(shù)寬度非常小,因此會(huì)造成語言信號(hào)的失真。故實(shí)際應(yīng)用中常采用漢明窗。1.5短時(shí)傅立葉變換由于傅立葉變換反映了信號(hào)在頻域和時(shí)域間的聯(lián)系,語音處理的一個(gè)重要方法就是傅立葉變換。在實(shí)際處理中,標(biāo)準(zhǔn)的傅立葉變換也被稱為短時(shí)傅立葉變換(ShortTimeFourierTr
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 印染勞務(wù)派遣合同范本
- 廚房拆卸工程合同范例
- 農(nóng)村轉(zhuǎn)讓自建房合同范例
- 凈水漁業(yè)合同范本
- 廈門代建項(xiàng)目合同范本
- 廠房廢舊鋼鐵回收合同范例
- 企業(yè) 房租 合同范本
- 發(fā)熱電纜合同范本
- 醫(yī)療儀器合同范本
- 單項(xiàng)裝修合同范例
- 銀行存管三方協(xié)議書
- 2024年新人教版化學(xué)九年級(jí)上冊(cè)全冊(cè)課件(新版教材)
- 教科版 二年級(jí)科學(xué)上冊(cè)第一單元第6課《不同的季節(jié)》同步練習(xí)(附答案解析)
- 山東省東營(yíng)市2024年中考英語真題【附真題答案】
- 平安產(chǎn)險(xiǎn)產(chǎn)品定價(jià)模型優(yōu)化研究
- GB/T 12279.2-2024心血管植入器械人工心臟瓣膜第2部分:外科植入式人工心臟瓣膜
- JTG-3830-2018公路工程建設(shè)項(xiàng)目概算預(yù)算編制辦法
- 設(shè)備維護(hù)服務(wù)方案(2篇)
- 醫(yī)院檢驗(yàn)科實(shí)驗(yàn)室生物安全程序文件SOP
- 生物質(zhì)顆粒廠建設(shè)項(xiàng)目可行性研究報(bào)告
- 春新教科版四年級(jí)科學(xué)下冊(cè)《電路》單元解讀
評(píng)論
0/150
提交評(píng)論