行車噪聲環(huán)境下基于人耳頻率選擇特性的聲學特征提取方法_第1頁
行車噪聲環(huán)境下基于人耳頻率選擇特性的聲學特征提取方法_第2頁
行車噪聲環(huán)境下基于人耳頻率選擇特性的聲學特征提取方法_第3頁
行車噪聲環(huán)境下基于人耳頻率選擇特性的聲學特征提取方法_第4頁
行車噪聲環(huán)境下基于人耳頻率選擇特性的聲學特征提取方法_第5頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、行車噪聲環(huán)境下基于人耳頻率選擇特性的聲學特征提取方法行車噪聲環(huán)境下基于人耳頻率選擇特性的聲學特征提取方法引言聲學事件檢測AustiEventDetetin,AED就是檢測當前環(huán)境中發(fā)生的特定目的聲學事件,然后把檢測出的聲學事件轉(zhuǎn)換為人類或者智能設備可以理解的信號,為人類或者智能設備的決策提供信息。在聲學事件檢測研究中,研究者們做出了大量的奉獻。目前研究主要聚焦在提取合適檢測任務要求的聲學特征表示和聲學事件的分類算法方面。在聲學特征方面,研究者們嘗試了各種聲學特征,如:梅爾倒譜系數(shù)el-frequenyepstraleffiients,F(xiàn)1、線性預測倒譜系數(shù)Linearpreditinepstr

2、aleffiients,LP2、基頻Pith3、頻譜質(zhì)心Spetralentrid4等。在聲學事件的分類方法中,研究者們也嘗試了各種不同的方法,包括基于支持向量機SupprtVetrahine,SV方法、隱馬爾科夫模型Hiddenarkvdel,H方法、人工神經(jīng)網(wǎng)絡ArtifiialNeuralNetrk,ANN方法等。近幾年來,SV方法5和H方法6成為最主流的聲學事件分類方法。在本文的研究工作中,將會嘗試在行車噪聲環(huán)境下,檢測車輛周邊發(fā)生的各種目的聲學事件。由于行車中的聲學環(huán)境較為復雜,當車輛行駛速度較快或者路況較差等情況存在時,噪聲頻譜污染就較為嚴重,傳統(tǒng)的聲學特征,例如:F在中高頻局部的

3、濾波器分布較為稀疏且處此濾波環(huán)境下,而中高頻局部噪聲較強時,目的聲學事件的檢出率即會顯著下降。對強噪問題,研究者們通常采用降噪形式來增強目的聲音信號的方法,如:高斯模型假設下的維納濾波增強算法7、基于聽覺掩蔽效應的增強算法8、譜減法9等。綜合評析可知,基于高斯模型的濾波方法計算復雜度較高;基于聽覺掩蔽效應的語音增強算法那么不能充分地模擬人耳對于聲音的感知;而在降噪中普遍使用的譜減法卻存在音樂噪聲的問題,導致降噪后聲音信號的頻譜破壞較為嚴重,使得提取出的特征不能很好地刻畫聲音信號的目的聲學事件的頻譜特性。耳蝸是人類接收和處理外界聲音信號的主要器官,在提取可辨性的聲音特征,以及對背景噪聲的魯棒性方

4、面均表現(xiàn)出高強的才能。耳蝸生理學研究成果說明,耳蝸的這種才能主要來自于以下幾個方面:基底膜的頻率分析功能、外毛細胞/覆膜本文由論文聯(lián)盟.Ll.搜集整理的主動選擇性增益功能等10。其中,基底膜的主要功能是將接收到的聲音信號分解為各個頻率上的振動峰值,并將相應的振動傳遞給外毛細胞和內(nèi)毛細胞;外毛細胞/覆膜那么主要根據(jù)接收到的振動對特定頻率處的能量進展選擇性增益,影響相應位置處的內(nèi)毛細胞發(fā)放強度。針對傳統(tǒng)聲學事件檢測方法存在的問題以及人耳中耳蝸的聽覺感知特性,本文提出了一種模擬人耳聽覺感知的基于共振峰的el濾波器組的加權算法,通過模擬人耳的聽覺感知特性,加強了el濾波器組對中高頻的分辨才能,并采用加

5、權后的el濾波器組提取FFFrant-F,F(xiàn)F系數(shù)。實驗證明,F(xiàn)F對噪聲有更好的魯棒性,并且在目的聲學事件信號較弱時,也不會增加誤識率。1共振峰的提取聲音信號的倒譜可以通過先對信號做傅里葉變換、取模,得到信號的頻譜密度,然后求頻譜密度的對數(shù),最后求反傅里葉變換得到。根據(jù)參數(shù)模型功率譜估計的思想,可以將聲音信號看作一個輸入序列鼓勵一個全極點的系統(tǒng)而產(chǎn)生的輸出,系統(tǒng)的傳遞函數(shù)為:1其中,為常數(shù),為實數(shù),為模型的階數(shù)。由于頻率響應反映了被分析信號的頻譜包絡,因此用來代替頻譜密度,對求對數(shù)后,做傅里葉反變換求出的LP倒譜系數(shù),也被認為包含了信號頻譜的包絡信息,因此將其看作是對原始信號短時倒譜的一種近似

6、。的沖擊響應為。欲求的倒譜,根據(jù)同態(tài)分析法,因為是最小相位的,所以一定可以展開成級數(shù)的形式,即的逆變換是存在的,可得:.2因此,只要計算出線性預測系數(shù),就可以求出倒譜,通過對倒譜進展搜索,找到每一個共振峰所在的頻率,記為,其中表示共振峰的個數(shù)。2el濾波器組的加權2.1模擬頻率選擇性增益功能人耳的選擇性增益功能對人耳耳蝸的聽覺感知至關重要,人耳的選擇性增益機制主要包括:頻率相關的增益區(qū)間和增益函數(shù)??紤]到人耳覆膜的行波振動范圍有限,因此其頻率增益區(qū)間僅局限于中心頻率附近11;增益函數(shù)在頻域的對數(shù)尺度上近似于高斯函數(shù),在共振峰頻率處的增益幅度最大,而在共振峰頻率兩側的增益幅度迅速衰減。這即導致共

7、振處的頻率振幅能量在急劇增加的同時,兩側的頻率振幅能量急劇降低,表現(xiàn)出人耳的頻率選擇性增益功能。下面給出一種方法把LP譜估計法提取出的共振峰的信息應用到el濾波器組中,從而彌補el濾波器組在中高頻分辨率缺乏的問題。考慮到在頻率的對數(shù)尺度上,耳蝸的頻率增益曲線類似于高斯密度函數(shù),在共振峰處,耳蝸的頻率增益最大,而在共振峰所在頻率的兩側,耳蝸的增益幅度迅速衰減,根據(jù)以上分析,設計了如下函數(shù)來模擬耳蝸基底膜與覆膜之間的頻率選擇增益函數(shù):3其中,表示第個子帶的頻率中心,表示第個子帶的寬度,表示el濾波器組中包含的el子帶的個數(shù);表示檢測到的第個共振峰的頻率,表示第個共振峰的振幅在個共振峰的振幅總和中所

8、占的振幅能量的比例,該比例用來表示第個共振峰的強弱;是一個指示性函數(shù),假如共振峰的頻率在以為中心,以為寬度的第個el子帶中,那么返回1,否那么返回0。2.2el濾波器組的加權通過對每一幀中共振峰所處的el子帶對應的el濾波器系數(shù)進展加權,突出共振峰所在的el子帶的頻率,從而模擬人耳覆膜的頻率選擇映射,由此即彌補了el濾波器組在中高頻分辨率較低的缺乏,同時也增強了傳統(tǒng)F對噪聲的魯棒性。這符合人耳的聽覺感知機理,如在眾多嘈雜的背景環(huán)境噪聲中,要想別人聽清楚自己說話,必須進步聲音的分貝,掩蓋其他背景聲音。根據(jù)el濾波器組中每一個el子帶在對數(shù)頻率中的分布范圍,對目的聲學事件鳴笛的每一幀數(shù)據(jù)在對數(shù)頻域

9、上進展劃分,通過對分幀后的每一幀數(shù)據(jù)利用LP倒譜估計的方法來提取其中的共振峰信息。圖1中虛線為加權前的濾波器組系數(shù),實線即為加權后的濾波器組系數(shù);通過觀察可以看出:第7、9、11、13、14、16個el濾波器明顯得到了增強,解決了傳統(tǒng)的el濾波器的中高頻分辨率低的問題。圖1加權前后的濾波器組Fig.1FilterbankfEightsbefreandafter3基于加權后的el濾波器組的FF特征提取首先對采集的聲音信號進展預加重、分癥加窗等預處理,然后對每一幀的數(shù)據(jù)使用LP倒譜法提取共振峰的信息,接下來根據(jù)提取的共振峰信息以及el頻域子帶的劃分確定當前數(shù)據(jù)幀的每一個el濾波器的加權系數(shù),從而獲

10、得加權后的el濾波器組,此后對每個濾波器的輸出進展指數(shù)壓縮,再對經(jīng)過指數(shù)壓縮的能量譜進展離散余弦變換,并經(jīng)過升半正弦倒譜提升,最終得到FF特征。4實驗結果與分析根據(jù)本文提出的加權el濾波器組進展車載系統(tǒng)的鳴笛聲學事件的檢出實驗。在實驗中,搭載聲學事件檢測系統(tǒng)的車輛分別在不同的速度和不同的路況下對測試數(shù)據(jù)進展采集,測試數(shù)據(jù)中長鳴笛每一個長鳴笛時長大于1.5秒,包括100個,短鳴笛每一個短鳴笛時長小于1秒,包括為100個,笛語由不同的長、短鳴笛序列組成25個。基線系統(tǒng)使用的特征是傳統(tǒng)的F,而實驗系統(tǒng)使用的是加權后的el濾波器組提取的特征,詳細的實驗結果如表1所示。通過分析表1可以獲知,與傳統(tǒng)的F特

11、征相比,加權后的FF特征有著更高的召回率和更低的誤識率,因此FF更適應于行車噪聲環(huán)境下的聲學事件檢測。表1加權前后的檢測系統(tǒng)性能比照Tab.1parisnfdetetinsystesperfranefeightsbefreandafterAE指標長鳴笛短鳴笛笛語基線系統(tǒng)實驗系統(tǒng)基線系統(tǒng)實驗系統(tǒng)基線系統(tǒng)實驗系統(tǒng)R召回率75%86%72%80%63%75%D誤識率5.7%5.9%9.7%9.7%31.3%31.5%響應時間s125s139s125s139s150s169s加權前后的F特征魯棒性比照結果那么如圖2所示。通過圖2可以看出,隨著車內(nèi)噪聲的不斷加強,傳統(tǒng)的F的準確率明顯下降,而本文提出的FF卻只有少許下降,說明了FF對噪聲有較強魯棒性。圖2加權前后的F特征魯棒性比照Fig.2parisnfFsrbustnessfeightsbefr

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論