![端點檢測課程報告_第1頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/9/5b6a704a-00c1-4371-9744-852106958dba/5b6a704a-00c1-4371-9744-852106958dba1.gif)
![端點檢測課程報告_第2頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/9/5b6a704a-00c1-4371-9744-852106958dba/5b6a704a-00c1-4371-9744-852106958dba2.gif)
![端點檢測課程報告_第3頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/9/5b6a704a-00c1-4371-9744-852106958dba/5b6a704a-00c1-4371-9744-852106958dba3.gif)
![端點檢測課程報告_第4頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/9/5b6a704a-00c1-4371-9744-852106958dba/5b6a704a-00c1-4371-9744-852106958dba4.gif)
![端點檢測課程報告_第5頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/9/5b6a704a-00c1-4371-9744-852106958dba/5b6a704a-00c1-4371-9744-852106958dba5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、信息工程系課程設(shè)計報告 課 程 MATLAB通信工程仿真 端點檢測 專 業(yè) 通信工程 班 級 2013級本科一班 學(xué)生姓名 學(xué)號1314學(xué)生姓名 學(xué)號1314學(xué)生姓名 學(xué)號1314學(xué)生姓名 學(xué)號1314 學(xué)生姓名 學(xué)號1314二一四年十二月目 錄目錄.- 1- . 摘要 .- 2- 關(guān)鍵詞.- 2 -1.程序描述.- 3-1.1程序功能.- 3-1.2基本原理.- 3-1.3端點檢測的過程與目的.- 3-2.程序?qū)崿F(xiàn).- 5-2.1代碼分析.- 6-2.2過零計算.- 7-2.3計算短時能量.- 8-2.4算法說明.- 9-3.實驗結(jié)果.- 13-參考文獻(xiàn).- 14-摘 要:通過本次課程設(shè)計,
2、主要訓(xùn)練學(xué)生對MATLAB通信系統(tǒng)建模與仿真設(shè)計的方法和技巧。作為一個完整的語音識別系統(tǒng),其最終實現(xiàn)及使用的效果不僅僅限于識別的算法,許多相關(guān)因素都直接影響著應(yīng)用系統(tǒng)的成功與否。語音識別的對象是語音信號,端點檢測的目的就是在復(fù)雜的應(yīng)用環(huán)境下的信號流中分辨出語音信號和非語音信號,并確定語音信號的開始及結(jié)束。關(guān)鍵詞:過零計算 短時能量計算 端點檢測1.程序描述1.1 程序功能: 從包含語音的一段信號中找出語音的起始點及結(jié)束點。1.2 基本原理: 整個端點檢測可分為四個階段:靜音段、過渡段、語音段、結(jié)束。使用一個變量表示當(dāng)前狀態(tài)。靜音段,如果能量或過零率超過低門限,就開始標(biāo)記起始點,進(jìn)入過渡段。過渡
3、段當(dāng)兩個參數(shù)值都回落到低門限以下,就將當(dāng)前狀態(tài)恢復(fù)到靜音狀態(tài)。而如果過渡段中兩個參數(shù)中的任一個超過高門限,即被認(rèn)為進(jìn)入語音段。處于語音段時,如果兩參數(shù)降低到門限以下,而且總的計時長度小于最短時間門限,則認(rèn)為是一段噪音,繼續(xù)掃描以后的語音數(shù)據(jù),否則標(biāo)記結(jié)束端點。1.3端點檢測的過程與目的: 一般的信號流都存在一定的背景聲,而語音識別的模型都是基于語音信號訓(xùn)練的,語音信號和語音模型進(jìn)行模式匹配才有意義。因此從信號流中檢測出語音信號是語音識別的必要的預(yù)處理過程。詳細(xì)說來,端點檢測有兩個過程:1基于語音信號的特征,用能量、過零率、商(entropy)、音高(pitch)等參數(shù)以及它們的衍生參數(shù),來判斷
4、信號流中的語音或非語音信號。2在信號流中檢測到語音信號后,判斷此處是否是語句的開始點或結(jié)束點。在商用語音系統(tǒng)中,由于信號多變的背景和自然對話模式而更容易使句中有停頓(非語音),特別是在爆發(fā)聲母前總會有無聲間隙。因此,這種開始或結(jié)束的判定尤為重要。此外端點檢測的目的還在于: 1減少識別器的數(shù)據(jù)處理量: 可以大量減少信號傳輸量及識別器的運(yùn)算負(fù)載,對于語音對話的實時識別有重要作用。 2拒絕非語音的信號:對非語音信號的識別不僅是一種資源浪費(fèi),而且有可能改變對話的狀態(tài),造成對用戶的困擾。 3在需要打斷(barge-in)功能的系統(tǒng)中,語音的起始點是必須的。在端點檢測找到語音的起始點時,系統(tǒng)將停止提示音的
5、播放。完成打斷功能。2. 程序?qū)崿F(xiàn) 語音信號的端點檢測程序流程圖: 輸出樣本端點檢測圖像 開始端點檢測 調(diào)整能量門限 計算短時能量和過零率 設(shè)置參數(shù) 幅度歸一化 輸入語音信號 2.1代碼分析第一部分:常數(shù)設(shè)置%常數(shù)設(shè)置FrameLen = 240;%指定幀長FrameInc = 80;%指定幀移,每一幀中未重疊的部分amp1 = 10; %初始短時能量高門限amp2 = 2; %初始短時能量低門限zcr1 = 10; %初始過零率高門限zcr2 = 5; %初始過零率低門限maxsilence = 8; % 8*10ms = 80ms 語音段中允許的最大靜音長度,如果語音段中的靜音幀數(shù)未超過此
6、值,則認(rèn)為語音還沒結(jié)束;如果超過了該值,則對語音段長度count進(jìn)行判斷,若count<minlen,則認(rèn)為前面的語音段為噪音,舍棄,跳到靜音狀態(tài)0;若count>minlen,則認(rèn)為語音段結(jié)束;minlen = 15; % 15*10ms = 150ms語音段的最短長度,若語音段長度小于此值,則認(rèn)為其為一段噪音 status = 0; %初始狀態(tài)為靜音狀態(tài) count = 0; %初始語音段長度為0 silence = 0; %初始靜音段長度為02.2 過零計算短時過零表示一幀語音信號波形穿過橫軸(零電平)的次數(shù)。過零分析是語音時域分析中最簡單的一種。對于連續(xù)語音信號,過零意味著
7、時域波形通過時間軸;而對于離散信號,如果相鄰的取樣值的改變符號稱為過零。過零率就是樣本改變符號次數(shù) tmp1 = enframe(x(1:end-1), FrameLen, FrameInc); %分幀處理,tmp1和tmp2為分幀后形成的二維數(shù)組 tmp2 = enframe(x(2:end) , FrameLen, FrameInc);語音信號是一種典型的非平穩(wěn)信號,但是語音信號具有短時平穩(wěn)性, 因此在處理中要對采樣的語音信號進(jìn)行分割成一幀一幀的短時語音序列。分幀處理有利于對語音信號進(jìn)行準(zhǔn)確的分析 并且能夠提高識別率 這時再分別求出每幀的短時能量和短時過零率signs = (tmp1.*t
8、mp2)<0;當(dāng) tmp1.*tmp <0 的時候,說明tmp1>0,tmp2<0 或tmp1<0,tmp2>0; 即信號過零點。 diffs = (tmp1 -tmp2)>0.02;當(dāng)信號過零點,而tmp1與tmp2距離又過近(<0.02)的話就認(rèn)為是噪音,舍去. zcr = sum(signs.*diffs, 2);定義語音信號Xn(m)的過零率為Zn,則Zn=2.3計算短時能量語音和噪聲的區(qū)別可以體現(xiàn)在它們的能量上,語音段的能量比噪聲段能量大,語音段的能量是噪聲段能量疊加語音聲波能量的和。在信噪比很高時,那么只要計算輸入信號的短時能量或短時
9、平均幅度就能夠把語音段和噪聲背景區(qū)分開amp = sum(abs(enframe(filter(1 -0.9375, 1, x), FrameLen, FrameInc), 2);過零率有兩類重要的應(yīng)用: 用于粗略地描述信號的頻譜特性,就是用將為若干個通道, 對各通道進(jìn)行短時平均過零率和短時能量的計算,即可粗略地估計頻譜特性; 用于判別清音和濁音、有話和無話。計算過零率容易受低頻干擾, 特別是50 Hz 交流干擾的影響。解決這個問題的辦法,一個是做高通濾波器或帶通濾波,減小隨機(jī)噪聲的影響(filter函數(shù)濾波器)%調(diào)整能量門限amp1 = min(amp1, max(amp)/4);amp2
10、= min(amp2, max(amp)/8);若第N幀音信號Xn(m)短時能量為En,則En=2.4算法說明for n=1:length(zcr)goto = 0;switch statusstatus是判斷語音在哪個狀態(tài)的函數(shù),當(dāng)status=0時,為靜音狀態(tài)status=1時,為可能開始狀態(tài);當(dāng)status=2時,為語音狀態(tài),當(dāng)status=3時,為結(jié)束狀態(tài); case 0,1 % 0 = 靜音, 1 = 可能開始 if amp(n) > amp1 % 確信進(jìn)入語音段 x1(end+1) = max(n-count-1,1); status = 2; %進(jìn)入語音段 silence
11、= 0; count = count + 1; elseif amp(n) > amp2 | . % 可能處于語音段從靜音段開始,當(dāng)amp(n)高于短時能量低門限時,可能進(jìn)入語音段,如果信號長度大于最短語音長度的話,即為語音段,否則為靜音段。在語音段的時候,當(dāng)amp(n)高于短時能量低門限時,將保持在語音段,當(dāng)amp(n)低于短時能量低門限時,進(jìn)入靜音段。 zcr(n) > zcr2 從靜音段開始,當(dāng)zcr(n)高于過零率低門限時,可能進(jìn)入語音段,如果信號長度大于最短語音長度的話,即為語音段,否則為靜音段。在語音段的時候,當(dāng)zcr(n)高于過零率低門限時,將保持在語音段,當(dāng)amp(
12、n)低于過零率低門限時,進(jìn)入靜音段。status = 1; count = count + 1;else % 靜音狀態(tài)status = 0; % 進(jìn)入靜音段count = 0;else % 語音結(jié)束status = 3; end endcase 3, status=0; x2(end+1)=x1(end)+count-silence/2-1; endend % count = count-silence/2;% v_count(i)=v_count(i)+v_count(i-1);% v_silence(i)=v_count(i)+v_silence(i);if length(x2)<l
13、ength(x1) x2(end+1)=length(zcr);endsubplot(311)(將多個圖畫到一個平面的工具。3是把圖排成3行,1是排成1列,1表示在圖中的位置,從左到右計數(shù))plot(x)(命令打開圖形窗口的工具,將x軸為橫坐標(biāo))axis(1 length(x) -1 1)( axis(xmin xmax ymin ymax ) -xmin和xmax分別表示在繪圖時x、 y軸的上下限 )ylabel(Speech);(ylabel是表明y軸的意義,定義y軸為Speech)for i=1:length(x2);line(x1(i)*FrameInc x1(i)*FrameInc,
14、 -1 1, 'Color', 'red');line(x2(i)*FrameInc x2(i)*FrameInc, -1 1, 'Color', 'green');End(當(dāng)line(a,b,c)時,相應(yīng)地會在三維圖中畫一條線。) % line(x1*FrameInc x1*FrameInc, -1 1, 'Color', 'red');% line(x2*FrameInc x2*FrameInc, -1 1, 'Color', 'red');subplot(312
15、)plot(amp);axis(1 length(amp) 0 max(amp)ylabel('Energy');for i=1:length(x2);line(x1(i) x1(i), min(amp),max(amp), 'Color', 'red');line(x2(i) x2(i), min(amp),max(amp), 'Color', 'green');endsubplot(313)plot(zcr);axis(1 length(zcr) 0 max(zcr)ylabel('ZCR');for
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年教育機(jī)構(gòu)加盟合作協(xié)議
- 2025年住房改善工程合同示范文本
- 商業(yè)物業(yè)管理有限公司合同范本2025
- 2025年便利店綜合物流服務(wù)承包框架協(xié)議
- 2025年上海出境旅游合同指南
- 2025年企業(yè)產(chǎn)品買賣合同范本
- 2025年債務(wù)重組策劃框架補(bǔ)充協(xié)議
- 2025年企業(yè)信息系統(tǒng)建設(shè)服務(wù)合同
- 2025年專利信息服務(wù)合作協(xié)議
- 2025年中學(xué)體育教練員的聘用協(xié)議
- 2024年廣西電力行業(yè)職工職業(yè)技能大賽電氣值班員(光伏發(fā)電運(yùn)維)理論試題庫(含答案)
- 燃?xì)夤芫W(wǎng)改造項目資金申請報告-超長期特別國債投資專項
- 肉類食品配送服務(wù)投標(biāo)方案(技術(shù)方案)
- DL∕ T 969-2005 變電站運(yùn)行導(dǎo)則
- 應(yīng)急小組成立通知
- 關(guān)于如何做好清單招標(biāo)控制價的幾點建議
- 地鐵前期工程交通疏解施工方案
- NB-T32019-2013太陽能游泳池加熱系統(tǒng)技術(shù)規(guī)范
- 小學(xué)升初中六年級數(shù)學(xué)考試試卷含答案(達(dá)標(biāo)題)
- 2024年長沙航空職業(yè)技術(shù)學(xué)院單招職業(yè)適應(yīng)性測試題庫完整
- 醫(yī)療器械市場部年終總結(jié)
評論
0/150
提交評論