![研二模式識別語音_第1頁](http://file4.renrendoc.com/view/5b6ef442ca99cc2dbc48aac2a1ba9eef/5b6ef442ca99cc2dbc48aac2a1ba9eef1.gif)
![研二模式識別語音_第2頁](http://file4.renrendoc.com/view/5b6ef442ca99cc2dbc48aac2a1ba9eef/5b6ef442ca99cc2dbc48aac2a1ba9eef2.gif)
![研二模式識別語音_第3頁](http://file4.renrendoc.com/view/5b6ef442ca99cc2dbc48aac2a1ba9eef/5b6ef442ca99cc2dbc48aac2a1ba9eef3.gif)
![研二模式識別語音_第4頁](http://file4.renrendoc.com/view/5b6ef442ca99cc2dbc48aac2a1ba9eef/5b6ef442ca99cc2dbc48aac2a1ba9eef4.gif)
![研二模式識別語音_第5頁](http://file4.renrendoc.com/view/5b6ef442ca99cc2dbc48aac2a1ba9eef/5b6ef442ca99cc2dbc48aac2a1ba9eef5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
DTW:語音信號;短時;MFCC;動態(tài)時間規(guī)近年來,語音識別已經(jīng)成為一個非常活躍的研究領(lǐng)域。在不遠的將來,語音識別技術(shù)有可能作為一種重要的人機交互,輔助甚至取代傳統(tǒng)的鍵盤、鼠標等輸入設備,在個人計算機上進行文為廣闊的發(fā)展前景2。在特定人孤立詞語音識別中,最為簡單有效的方法是采用DTW(DynamicTimeWar,動態(tài)時本文就是在基礎(chǔ)上來進行語音信號參數(shù)的分析與語音信號的識別的。語音信號是一種典型的非平穩(wěn)信號。但是,由于語音的形成過程是與發(fā)音的運動密切相關(guān)是最早使用,也是應用最廣泛的法,這種方法直接利用語音信號的時域波形。時域分析通常過零就是信號通過零值。對于連續(xù)語音信號,可以其時域波形通過時間軸的情況。對于離符號的次數(shù)。單位時間內(nèi)的過零數(shù)稱為平均過零數(shù)。短時過析通常用在端點偵測,特別是用來短時分析在運用離散時間變換分析語音信號的變化時,會遇到這樣的問題,即單一的變換并時間變化的頻譜信息,諸如時變峰和諧波。具體而言,通常將信號的每一時刻與其相鄰時刻信號的變換相聯(lián)系,這樣就可以及時信號的頻譜變化。語音信號的短時變換見程序所述??梢则炞C,在短時分析中對于同一種窗函數(shù)而言,其通帶寬度與窗長成反比。如果希望分析的時間分辨率和頻率分辨率是相互的,這是短時本身所固有的弱點。短時傅通過基于和短時頻域分析,能夠得出[7]:第一,長窗具有較高的頻率分辨率,但具有較低的時間分辨率。從一個周期到另一個周期,峰是要發(fā)生變化的,這一點即使從語音波形上振峰從一個周期到另一個周期所發(fā)生的變化。當然,激勵源的諧波結(jié)構(gòu)也從短時頻譜上了。第三,在對語音信號進行短時分析時,窗長需要折衷考慮。一方面,短窗具有較好的時間分辨夠較好反映短時語音信號的頻譜,窗越寬這種近越好。1所示:1DTW2通常,規(guī)整函數(shù)被限制在一個平行四邊形的網(wǎng)格內(nèi),如圖2所示。它的一條邊斜率為2,另一條1,終點為(N,M由于在模板匹配過程中限定了彎折的斜率,因此平行四邊形之外的格點對應的幀匹配距離是不3充分利用這兩個特點可以減少計算量和空間的需求W22(1xa(xa1,xxb,,其中:xa=(2M-N)/3,xaxbM和Nx軸上的每一幀不再yy軸上[ymin,ymax]間的幀進行比較,yminymax的計算為:2x+(M-2N),xb<x≤Nx/2+(M-N/2),xa<x≤N(1,xb(xb+1,xa(xa+1,Nxy軸上的幀數(shù)不同,但彎折特性是一樣的,累積距離D(x,y)=d(x,y)+min[D(x-1,y),D(x-1,y-1),D(x-1,y-驗語音數(shù)據(jù),是在條件下利用PC機錄制。采用8000kHz采樣頻率、16bit量化、單聲道的N256M128點。ω(n)=0.54-0.46cos(2πn/(N-1)),0≤n≤N-H(z)=1-0.937時能量設置2個門限ampl和amph,以及過零率閥值zcr。語音起始點從第11幀開始檢測,其流程3。語音結(jié)束點的檢測方法與檢測起點相似,但此時從后向前搜索。圖 本文選取能夠反映人對語音的感知特性的Mel頻率倒譜系數(shù)(MFCC)12。09的對軟件編程也有了一定的理解,為將來從事這方面的課題打下了堅實的基礎(chǔ)。:[1].語音編碼[M].西安:西安電子科技大學:
擴展編程
.實用語音識別基礎(chǔ)[M].:國防工業(yè) [4]初,等.語音信號處理[M].:國防工業(yè)[5].語音信號處理[M].哈爾濱:哈爾濱工業(yè)大學::[7],等.實用語音識別基礎(chǔ)[M].:國防工業(yè)
:[8]林波,.基于DTW改進算法的弧立詞識別系統(tǒng)的仿真與分析[J].,2006,30(4):56-:
[10].語音信號端點檢測算法研究[D].長沙:湖南師范大學fori=1:10[x1x2]=vad(x);fori=1:10 %采樣 %語音信 xlabel('Frequencyinrad/sample')ylabel('MagnitudeindB') xlabel('Frequencyinrad/sample')ylabel('Phaseindegrees') %變換% %FFT%title('fft變換后信號') %反變換%title('ifft后信號%短時變 % % %計算把數(shù)據(jù)x共分成多少段 %FFT的長度 fori=1:Tn %FFT變換 %0for %TFtitle('短時變換時頻圖')fori=1:10[x1x2]=vad(x);fori=1:10forfori=1:10fprintf('測試模板%d的識別結(jié)果為:%d\n',i-1,j-1);functiondist=dtw(t,r)fori=1:nforfori=2:nforj=1:mififj>2functionf=enframe(x,win,inc)if(nwin==len=win;len=if(nargin<3)inc=len;nf=fix((nx-len+inc)/inc);indf=inc*(0:(nf-1)).';inds=(1:len);f(:)=x(indf(:,ones(1,len))+inds(ones(nf,1),:));if(nwin>1)w=f=f.* function[x,mn,mx]=me ifnargin<6ifnargin<5ifnargin<4%converttofftbinnumberswith0forDCtermbl=n*((f0+fl)*exp([01pp+1]*lr)-f0);ifany(w=='y')r=[ones(1,b2)fpfp+1p*ones(1,fn2-b3)];c=[1:b3+1b2+1:fn2+1];v=2*[0.5ones(1,b2-1)1-pf+fppf-fpones(1,fn2-b3-1)0.5];
r=[fp(k2:k4)1+fp(1:k3)];c=[k2:k41:k3];v=2*[1-pm(k2:k4)pm(1:k3)];ifelseifany(w=='m')ifnargout>1function%mel %DTC系數(shù)fork=1:12xx=filter([1-%MFCCfori=1:size(xx,1)fori=3:size(m,1)-2%mfccmfccccc=[mfunctionmaxsilence=3;%3*10ms=30msminlen=15;%15*10ms=150ms%%amp=sum(abs(enframe(filter([1-forn=1:length(zcr)switch ifamp(n)>amp1確信進入語音段elseifamp(n)>amp2zcr(n)>zcr(2)可能處于語音段else%靜音狀態(tài)case
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 古鎮(zhèn)改造磚運輸協(xié)議模板
- 服裝服飾運輸合同
- 農(nóng)業(yè)抗旱物資運輸合同
- 學校建筑石材配送協(xié)議
- 產(chǎn)業(yè)基地自動扶梯裝修合同
- 文旅融合發(fā)展項目居間協(xié)議
- 丹陽六年級下數(shù)學試卷
- 橋梁液壓爬模專項施工方案
- 鐵路接觸網(wǎng)拆除施工方案
- 北海中學期末數(shù)學試卷
- 北京市豐臺區(qū)2024-2025學年九年級上學期期末語文試題(含答案)
- 二零二五年度能源行業(yè)員工勞動合同標準范本3篇
- 計劃供貨時間方案
- 2024年石柱土家族自治縣中醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫頻考點附帶答案
- 西藏事業(yè)單位c類歷年真題
- 2024人教新目標(Go for it)八年級英語下冊【第1-10單元】全冊 知識點總結(jié)
- 2025中國移動安徽分公司春季社會招聘高頻重點提升(共500題)附帶答案詳解
- 七年級英語下學期開學考試(深圳專用)-2022-2023學年七年級英語下冊單元重難點易錯題精練(牛津深圳版)
- 杭州市房地產(chǎn)經(jīng)紀服務合同
- 放射科護理常規(guī)
- 新時代中小學教師職業(yè)行為十項準則
評論
0/150
提交評論