基于動(dòng)態(tài)時(shí)間規(guī)整的孤立咳嗽聲識(shí)別_第1頁(yè)
基于動(dòng)態(tài)時(shí)間規(guī)整的孤立咳嗽聲識(shí)別_第2頁(yè)
基于動(dòng)態(tài)時(shí)間規(guī)整的孤立咳嗽聲識(shí)別_第3頁(yè)
基于動(dòng)態(tài)時(shí)間規(guī)整的孤立咳嗽聲識(shí)別_第4頁(yè)
基于動(dòng)態(tài)時(shí)間規(guī)整的孤立咳嗽聲識(shí)別_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、基于動(dòng)態(tài)時(shí)間規(guī)整的孤立咳嗽聲識(shí)別摘要本文通過(guò)對(duì)咳嗽聲特性的分析,在對(duì)咳嗽聲進(jìn)展預(yù)處理后,提取咳嗽的el頻率倒譜系數(shù)作為特征參數(shù),建立咳嗽模板庫(kù)。采用基于動(dòng)態(tài)時(shí)間規(guī)整算法的模板匹配方法對(duì)特定人的孤立咳嗽進(jìn)展識(shí)別,實(shí)驗(yàn)證明,通過(guò)將咳嗽聲的特性和語(yǔ)音識(shí)別方法的結(jié)合,動(dòng)態(tài)時(shí)間規(guī)整算法在對(duì)孤立咳嗽聲識(shí)別中有很好的準(zhǔn)確性和可靠性。關(guān)鍵詞特征提??;el頻率倒譜系數(shù);動(dòng)態(tài)時(shí)間規(guī)整;咳嗽聲識(shí)別咳嗽是機(jī)體的一種保護(hù)性動(dòng)作,以消除呼吸道的分泌物、滲出物及侵入呼吸道的異物1。多數(shù)患者未能完好對(duì)自身的咳嗽特征進(jìn)展描繪,比方咳嗽的病癥、發(fā)作時(shí)間、頻率等,影響了咳嗽的及時(shí)診斷和合理治療。因此,有必要進(jìn)展咳嗽的實(shí)時(shí)監(jiān)測(cè)及其特

2、征的識(shí)別。至今這種對(duì)咳嗽嚴(yán)重性的評(píng)估,主要依靠主觀措施,如咳嗽反射敏感性、患者對(duì)自身病癥的感覺(jué)、咳嗽可視模擬測(cè)評(píng)、生活質(zhì)量問(wèn)卷、咳嗽病癥描繪和患者的日記等3。從而使大局部的咳嗽監(jiān)測(cè)器的診斷受到人為的影響較大。利用可靠的咳嗽檢測(cè)算法可以減少大量需人工分析的數(shù)據(jù),甚至可以做到去除人工分析的過(guò)程,因此,要進(jìn)步咳嗽聲識(shí)別系統(tǒng)的有效性,這就要求有一種算法可以識(shí)別出大局部在特定錄音中的咳嗽聲,同時(shí)又可以將它與其它的具有相似特性的聲音區(qū)分開(kāi)來(lái)。文章在參考了國(guó)內(nèi)外關(guān)于咳嗽聲識(shí)別的研究現(xiàn)狀,并比擬了咳嗽聲識(shí)別與語(yǔ)音識(shí)別的關(guān)系,提出使用動(dòng)態(tài)時(shí)間規(guī)整算法作為本文咳嗽聲識(shí)別的主要算法。2.1咳嗽發(fā)活力制咳嗽表現(xiàn)為深呼

3、吸氣后,聲門(mén)關(guān)閉,繼而以突然劇烈的呼氣,沖出狹窄的聲門(mén)裂隙產(chǎn)生咳嗽動(dòng)作和發(fā)出聲音2。2.2el頻率倒譜系數(shù)12(F)頻率f與el頻率B之間的轉(zhuǎn)換公式為:(1)F的提取及計(jì)算過(guò)程如圖1所示。(1)原始咳嗽聲信號(hào)y(n)通過(guò)預(yù)加重、分癥加窗處理后,得到每幀的時(shí)域信號(hào)x(n)。(2)將得到的每幀時(shí)域信號(hào)進(jìn)展離散傅立葉變換(DFT)。(2)其中,X(k)為線(xiàn)性頻譜,N為DFT的窗寬。(3)線(xiàn)性頻譜經(jīng)過(guò)el頻率濾波器組處理后為(t),然后對(duì)其進(jìn)展對(duì)數(shù)能量處理,得到結(jié)果為d()。圖1el頻率倒譜系數(shù)(F)提取過(guò)程圖2通過(guò)el頻率濾波器組得到el頻譜其中el頻率濾波器組為在語(yǔ)音的頻譜范圍內(nèi)設(shè)置的假設(shè)干個(gè)帶通

4、濾波器,為濾波器的個(gè)數(shù)。每個(gè)帶通濾波器的傳遞函數(shù)為:(3)f()可以用下面的方法定義:(4)其中,Ss為采樣頻率,而B(niǎo)-1為B的逆函數(shù):,而濾波器的頻率應(yīng)用范圍的最低頻率為f=100Hz和最高頻率為f=4000Hz,在實(shí)驗(yàn)中為了減少甚至消除交流電的影響,濾波器的個(gè)數(shù)取=26,即可以得到26維的F倒譜系數(shù)。考慮到讓得到的結(jié)果對(duì)噪聲和譜估計(jì)誤差有更好的魯棒性,將經(jīng)過(guò)el濾波器組得到的el頻譜取對(duì)數(shù)能量,其傳遞函數(shù)為:(5)(4)將上述對(duì)數(shù)頻譜d()經(jīng)過(guò)離散余弦變換(DT)變換到倒頻譜域,得到el頻率倒譜系數(shù)(F):(6)以上參數(shù)稱(chēng)為靜態(tài)參數(shù),為了描繪咳嗽聲幀之間的相關(guān)性,引入了動(dòng)態(tài)參數(shù)一階差分和二

5、階差分。2.3模版匹配技術(shù)12模版匹配法是形式識(shí)別中最常用的一種相似度計(jì)算與匹配方法,把具有不同人的咳嗽聲信號(hào)經(jīng)過(guò)特征提取變換后作為不同的模版,構(gòu)建一個(gè)基于模版匹配的簡(jiǎn)單的咳嗽聲識(shí)別系統(tǒng),如圖3所示,是該咳嗽聲識(shí)別系統(tǒng)的原理框圖。圖3基于模版匹配的咳嗽聲識(shí)別原理框圖2.3.1相似度度量在基于模板匹配的咳嗽聲識(shí)別系統(tǒng)中,對(duì)原始的咳嗽聲信號(hào)進(jìn)展訓(xùn)練得到一系列的特征模板,將其存儲(chǔ)于模板庫(kù)中。而在識(shí)別過(guò)程中采用相似度度量來(lái)進(jìn)展模板匹配,將特征模板庫(kù)中的各個(gè)模板稱(chēng)為參考模板,用R來(lái)表示;在模板庫(kù)建好后,又將待識(shí)別的輸入咳嗽聲信號(hào)通過(guò)預(yù)處理和特征提獲得到特征矢量序列,稱(chēng)為待檢測(cè)模板,用表示12。參考模板用

6、RR(1)、R(2)、R()、R()表示,其中為參考模板所包含的咳嗽幀的總數(shù),r為咳嗽幀的時(shí)序標(biāo)號(hào),R(r)為第幀的咳嗽特征矢量。待檢測(cè)模板用(1)、(2)、(n)、(N)表示,其中N為參考模板所包含的咳嗽幀的總數(shù),為咳嗽幀的時(shí)序標(biāo)號(hào),()為第n幀的咳嗽特征矢量。待檢測(cè)模板和參考模板之間的總體相似度可以用它們之間的失真來(lái)度量,從、R中的每個(gè)對(duì)應(yīng)幀之間的失真算起,假設(shè)r、為、R中的任意選擇幀號(hào),這兩幀之間的幀失真表示為D(),R(r)。2.3.2動(dòng)態(tài)時(shí)間規(guī)整(DT)考慮到咳嗽聲識(shí)別的過(guò)程中,進(jìn)展訓(xùn)練或者識(shí)別時(shí),即使每次盡量以同樣的方式去錄制一個(gè)咳嗽,其持續(xù)時(shí)間的長(zhǎng)度也會(huì)隨機(jī)改變,而且不同病人的咳

7、嗽相對(duì)時(shí)長(zhǎng)也時(shí)不可預(yù)測(cè)的。所以,需要對(duì)特征參數(shù)序列形式重新進(jìn)展時(shí)間的對(duì)準(zhǔn),為了有效的解決這個(gè)問(wèn)題,采用動(dòng)態(tài)時(shí)間規(guī)整算法(DT)。動(dòng)態(tài)時(shí)間規(guī)整算法是尋找一條通過(guò)各個(gè)穿插點(diǎn)的從起始點(diǎn)到終止點(diǎn)的幀失真度總和為最小的最正確途徑,其途徑搜索算法12:(1)初始化:在搜索的過(guò)程中途徑的選擇不是任意的,一般對(duì)途徑中各點(diǎn)處途徑的斜率的最大和最小做出了規(guī)定,最大斜率為2,最小斜率為0.5。設(shè)定途徑初始關(guān)系為(0,0),r=1,N,=1,。(2)當(dāng)時(shí),求:求所有可能的i,滿(mǎn)足限定條件:ri=i且(ri,i)R遍歷所有i,進(jìn)展以下各步計(jì)算:其中(3)由dN,即可得到途徑的總失真度;(4)由i=N時(shí)點(diǎn)(N,)向前回溯

8、,得到最正確途徑:假設(shè)在回溯過(guò)程中出現(xiàn),那么終止算法。首先針對(duì)特定人,采取了63個(gè)咳嗽聲樣本,運(yùn)用多模板平均訓(xùn)練算法,其算法如下:(1)設(shè)定最大模板失真閾值:a。(2)從采集的咳嗽聲樣本集中取出樣本,假設(shè)第一個(gè)咳嗽聲樣本形成的特征矢量序列為:Saple1=S11,S12,S1n,另一個(gè)特征序列為:Saple2=S21,S22,S2n,通過(guò)DT算法計(jì)算它們的失真度,假如小于a,那么那么轉(zhuǎn)(3),否那么轉(zhuǎn)(2)。(3)通過(guò)回溯法得到DT搜索的最優(yōu)途徑序列:(r1,1),(r2,2),(rt,t)。(4)新的模板取為Saple1、Saple2的時(shí)間規(guī)整后的平均,即:SapleSaple1,Saple

9、2,SapleL,SapleT,其中SapleL0.5(S1LS2L)(L1,2,T)。通過(guò)上述的算法,實(shí)驗(yàn)中用63個(gè)樣本來(lái)訓(xùn)練,獲得了7種類(lèi)型的咳嗽聲樣本的模板。在采集特定人的咳嗽聲樣本時(shí),也采集了其孤立的語(yǔ)音樣本33個(gè),同樣運(yùn)用這個(gè)算法訓(xùn)練20個(gè)樣本,得到3個(gè)語(yǔ)音模板。在識(shí)別時(shí),待識(shí)別的咳嗽聲信號(hào)矢量序列用DT算法分別求得與每個(gè)模板的總失真度,然后根據(jù)總失真度的大小來(lái)判斷待識(shí)別咳嗽聲接近哪個(gè)模板,即是屬于哪一類(lèi)咳嗽聲或者是非咳嗽聲。在實(shí)驗(yàn)中,采樣頻率為16000HZ,DFT的窗寬N=512,最大模板失真閾值a0.45。其中模板1模板7為咳嗽聲模板,模板8模板10是語(yǔ)音模板。如表1所示,輸入

10、待識(shí)別的信號(hào)為咳嗽聲時(shí),經(jīng)過(guò)DT算法后計(jì)算的得到失真度,選取最小的,即最接近模板1,是屬于跟模板1類(lèi)似的咳嗽。當(dāng)輸入的待識(shí)別信號(hào)為語(yǔ)音信號(hào)時(shí),如表2可以看到,運(yùn)用DT算法進(jìn)展比擬,得到結(jié)果是跟模板8比擬接近,即是屬于語(yǔ)音類(lèi)的信號(hào)。表1待識(shí)別信號(hào)為咳嗽聲的識(shí)別結(jié)果模板12345678910失真度1.31543.88264.26694.45244.41575.53854.90117.13924.90114.9011表2待識(shí)別信號(hào)為非咳嗽聲的識(shí)別結(jié)果模板12345678910失真度5.22753.83797.19477.81933.13957.92864.20222.144.20224.2022在實(shí)

11、驗(yàn)中,運(yùn)用動(dòng)態(tài)時(shí)間規(guī)整算法(DT)對(duì)從醫(yī)院病房采集同一個(gè)病人的96個(gè)咳嗽聲和33說(shuō)話(huà)聲音進(jìn)展訓(xùn)練和識(shí)別,其結(jié)果如表3所示。由于采集的咳嗽樣本存在比擬嚴(yán)重背景音的影響,因此識(shí)別率受到了的影響。表3DT算法識(shí)別結(jié)果模板類(lèi)型咳嗽聲類(lèi)說(shuō)話(huà)聲類(lèi)識(shí)別率89.5890.9雖然咳嗽聲的識(shí)別可以參考語(yǔ)音識(shí)別技術(shù),但咳嗽聲的識(shí)別與語(yǔ)音識(shí)別又有著不同。(1)根據(jù)語(yǔ)音產(chǎn)生的離散時(shí)域模型,語(yǔ)音識(shí)別主要區(qū)分清音與濁音。清音是氣流通過(guò)聲道中狹窄縫隙形成湍流,造成噪聲源;而濁音的聲源那么是氣流通過(guò)聲門(mén)時(shí)所產(chǎn)生的周期脈沖。由咳嗽的醫(yī)學(xué)定義,咳嗽聲是否更接近濁音,因其由大量氣流通過(guò)聲門(mén)而產(chǎn)生聲音,因此是否可以通過(guò)引入其它生理特征

12、信號(hào),如呼吸流量等,與咳嗽信號(hào)一起作為識(shí)別參數(shù),而得到更好的識(shí)別效果。(2)在語(yǔ)音識(shí)別中,不同語(yǔ)音由不同的濁音表征,而不同的濁音又是以聲道的不同來(lái)表征的。而咳嗽的機(jī)理原因是為把呼吸道的分泌物、滲出物及侵入呼吸道的異物排出,是否就可以判斷其聲道(即口腔)形狀也是應(yīng)相對(duì)固定,以使氣流順暢通過(guò),因此是否可以得出咳嗽的識(shí)別比語(yǔ)音的識(shí)別簡(jiǎn)單??人缘膹?qiáng)度及其發(fā)生的頻率在醫(yī)學(xué)上具有很高的診斷價(jià)值,自動(dòng)識(shí)別咳嗽聲的系統(tǒng)能幫助醫(yī)生更好地監(jiān)護(hù)病人。本文討論性地使用動(dòng)態(tài)時(shí)間規(guī)整算法來(lái)實(shí)現(xiàn)對(duì)咳嗽聲自動(dòng)識(shí)別。實(shí)驗(yàn)中使用了el頻率倒譜系數(shù)+el頻率倒譜系數(shù)一、二階差分的構(gòu)造來(lái)提取咳嗽的特征向量,然后使用動(dòng)態(tài)時(shí)間規(guī)整算法對(duì)

13、咳嗽進(jìn)展訓(xùn)練和識(shí)別,結(jié)果為:咳嗽的正確識(shí)別率為89.58%,非咳嗽的正確識(shí)別率為90.9%。由于我們的實(shí)驗(yàn)中訓(xùn)練數(shù)據(jù)缺乏,使得一些出現(xiàn)次數(shù)很少的觀察矢量沒(méi)有出如今訓(xùn)練數(shù)據(jù)中,從而直接影響了咳嗽的正確識(shí)別率。今后學(xué)習(xí)研究工作將集中在進(jìn)步咳嗽的正確識(shí)別率,一方面從醫(yī)院獲取更多的訓(xùn)練數(shù)據(jù),另一方面應(yīng)進(jìn)一步研究模型訓(xùn)練的方法和技術(shù),通過(guò)以上的方法來(lái)進(jìn)步咳嗽的正確識(shí)別率。最后建立計(jì)算機(jī)的專(zhuān)家系統(tǒng),能識(shí)別各種咳嗽特點(diǎn)的智能儀器,如分析刺激性咳嗽、喘息性咳嗽、上呼吸道疾病性咳嗽、下呼吸道疾病性咳嗽等,減少分析咳嗽對(duì)專(zhuān)家的依賴(lài)性。1EugeneBraunaldetal.Harrisnspriniplesfin

14、ternalediine-15thed.北京:人民衛(wèi)生出版社,20012陳文彬,潘祥林.診斷學(xué)(第六版).北京:人民衛(wèi)生出版社,20223楊行峻,遲惠生等.語(yǔ)音信號(hào)數(shù)字處理.北京:電子工業(yè)出版社,19954Q.Zhu,A.Alan.Nn-linearfeatureextratinfrrbustspeehregnitininstatinaryandnn-statinarynise.puterSpeehandLanguage,2022,381-4025S.B.Dais,P.eelstEin.parisnfparaetrirepresentatinsfnsyllabirdregnitininntin

15、uuslyspkensentenes.IEEETransatinsnSpeehandAudiPressing,1980,(28)4:357-3666J.ang,H.F.ang,Y.S.eng.hipdesignfFextratinfrspeehregnitin.Intergatjin,theVLSIjurnal,2002,32:111-1317H.Heransky.PereptuallinearPreditive(PLP)analysisfspeeh.JurnalfAustialSietyfAeria,1990,87(4):1738-17528.N.urthi,B.D.Ra.All-plede

16、lingfspeehbasedntheiniuvarianedistrtinlessrespnsespetru.IEEETransatinsnspeehandaudipressing,2000,8(3):221-2399S.Dharanipragada,B.D.Ra.VDR-basedfeatureextratinfrrbustspeehregnitin.InPr.IASSP,2001,309-31210U.H.Yapanel,J.H.L.Hansen.Aneperspetivenfeatureextratinfrrbustin-vehilespeehregnitin.Eurspeeh,2022,1281-128411Sergia

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論