




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 2015.10.141.介紹語音是人類相互交流和通信最方便快捷的手段。如何高效地實(shí)現(xiàn)語音傳輸、存儲(chǔ)或通過語音實(shí)現(xiàn)人機(jī)交互,是語音信號(hào)處理領(lǐng)域中的重要研究課題。語音信號(hào)處理涉及數(shù)字信號(hào)處理、語言學(xué)、語音學(xué)、生理學(xué)、心理學(xué)、計(jì)算機(jī)科學(xué)以及模式識(shí)別、人工智能等諸多學(xué)科領(lǐng)域,是目前信息科學(xué)技術(shù)學(xué)科中發(fā)展最為迅速的一個(gè)領(lǐng)域。在語音處理技術(shù)中,線性預(yù)測(cè)是第一個(gè)真正得到實(shí)際應(yīng)用的技術(shù),可以用于估計(jì)基本的語音參數(shù),如基因周期、共振峰頻率、頻譜特征及聲道面積函數(shù)等。線性預(yù)測(cè)的基本原理是把待分析的信號(hào)用一個(gè)模型表示出來,信號(hào)是這個(gè)模型的輸出,構(gòu)成這個(gè)模型的參數(shù)是這個(gè)信號(hào)的重要特征,稱為線性預(yù)測(cè)系數(shù)。一個(gè)語音取樣
2、的現(xiàn)在值可以用若干個(gè)語音取樣的過去值的加權(quán)線性組合來逼近。加權(quán)系數(shù)稱為預(yù)測(cè)系數(shù)。如果利用過去 p個(gè)樣點(diǎn)值來進(jìn)行預(yù)測(cè),稱為p 階線性預(yù)測(cè)。線性預(yù)測(cè)編碼就是利用過去的樣值對(duì)新鮮值進(jìn)行預(yù)測(cè),然后將樣值的實(shí)際值與其預(yù)測(cè)值相減得到一個(gè)誤差信號(hào),顯然誤差信號(hào)的動(dòng)態(tài)范圍小于原始語音信號(hào)的動(dòng)態(tài)范圍,對(duì)誤差信號(hào)進(jìn)行量化編碼,可大大減少量化所需的比特?cái)?shù),使編碼速率降低。通常情況下,隨著線性預(yù)測(cè)階數(shù)p的增大,預(yù)測(cè)誤差也將會(huì)越來越小,但是p也不是一直增加的,隨著線性預(yù)測(cè)階數(shù)p的增大,信號(hào)中的可預(yù)測(cè)部分也將越來越少,預(yù)測(cè)誤差的變化趨于平穩(wěn),誤差減小不再明顯。此時(shí),伴隨著預(yù)測(cè)階數(shù)p的增大,整個(gè)系統(tǒng)的計(jì)算量將會(huì)越來越大。為
3、此,對(duì)于不同的信號(hào),我們需要確定一個(gè)最優(yōu)的預(yù)測(cè)階數(shù)p,進(jìn)而進(jìn)行預(yù)測(cè)分析。在對(duì)原始語音信號(hào)進(jìn)行處理之前我們要對(duì)信號(hào)進(jìn)行預(yù)處理,語音信號(hào)的預(yù)處理也叫作前端處理,是指在特征提取之前,先對(duì)原始語音進(jìn)行處理,使處理后的信號(hào)更能滿足實(shí)際的需要,對(duì)提高處理精確度有重要的意義。一般預(yù)處理的步驟包括采樣、預(yù)加重、加窗分幀和去噪等,本文采取分幀去除直流分量后再剔除噪聲幀來進(jìn)行預(yù)處理,本文求閾值的方法就是求出語音信號(hào)中的高斯白噪聲,然后設(shè)置閾值,將沒幀信號(hào)和閾值進(jìn)行比較,如果比閾值小的就是噪聲幀,直接去除。預(yù)處理結(jié)束后,我們對(duì)語音信號(hào)進(jìn)行LPC分析,本文中通過Levinson-Durbin算法求出預(yù)測(cè)系數(shù),在通過不
4、同階數(shù)P的濾波器得到預(yù)測(cè)誤差從而找出最小誤差值下的最優(yōu)階數(shù)P,最后作出最小誤差與P的關(guān)系曲線圖。2.LPC基本原理(1)語音信號(hào)的樣值序列為s(n),n=1,2,3n,s(n)的預(yù)測(cè)值為 (1)線性誤差為e(n) (2)設(shè)計(jì)傳遞函數(shù)為A(z),為L(zhǎng)PC誤差濾波器,設(shè)計(jì)預(yù)測(cè)誤差濾波器A(z)就是求解預(yù)測(cè)系數(shù),使得誤差在預(yù)定準(zhǔn)則下最小 (3)(2)理論上常用的是均方誤差最小的準(zhǔn)則,對(duì)各個(gè)系數(shù)求偏導(dǎo),另其結(jié)果為0,得到 (4)S(n)的自相關(guān)序列為 (5)因?yàn)樗桥紝?duì)稱,因此 (6)所以上式可以表示為 , (7)設(shè),式子(7)的矩陣形式為,所以就可以求出P個(gè)線性預(yù)測(cè)系數(shù)。3. Levinson-Du
5、rbin算法杜賓算法是一種有效計(jì)算預(yù)測(cè)系數(shù)的算法,它主要是采用遞歸算法求解,基本思想是:遞歸解法分步進(jìn)行。在某一步已經(jīng)有了一個(gè)解,這是第(i-1)階預(yù)測(cè)器的系數(shù)。然后利用(i-1)階方程組的解來表示,(i-1)階方程組的解又可以用(i-2)階方程組的解表示,依此類推。因此只要解出任意一階方程的解,就可以通過遞推解出任意方程組的解。利用杜賓算法我們從最低階開始,從低階到高階逐階遞推。過程如下: (8) (9) (10) (11) (12) (13)上式(8)(13)對(duì)i=1,2,p進(jìn)行遞推求解,其最終解為 (14)在上面的一組式子中,i表示預(yù)測(cè)器階數(shù),如表示i階預(yù)測(cè)器的第j個(gè)預(yù)測(cè)系數(shù)。對(duì)于p階預(yù)
6、測(cè)器,在上述求解預(yù)測(cè)器系數(shù)的過程中,階數(shù)低于p的各個(gè)階預(yù)測(cè)器系數(shù)也同時(shí)得到。4.結(jié)果圖像分析 5.結(jié)論圖像結(jié)果最佳預(yù)測(cè)點(diǎn)P值如下表所示 語音文件最佳系數(shù)PBird26Dog14GirlEng13MaleChns9從上圖中我們可以看出來不同的語言信號(hào)在相同的算法下得到的最佳預(yù)測(cè)階數(shù)是不同的,鳥兒語音所要的階數(shù)是最高的,其余三個(gè)語音的階數(shù)相差不大。6.附加程序BIRD語音程序clear all;clc;filename='Bird'load Bird wavedata;%讀入語音 %對(duì)語音進(jìn)行分幀len=200;inc=80; %設(shè)置幀長(zhǎng),幀移wavesize=size(waved
7、ata,2);fsum=fix(wavesize-len+inc)/inc);%計(jì)算幀數(shù)f=zeros(fsum,len);%初始化i=1;n=1;while i<=fsum j=1; while j<=len f(i,j)=wavedata(1,n); n=n+1; j=j+1; end n=n+inc-len; i=i+1;end%去除噪聲幀if size(wavedata,1)<=1 %求出鳥鳴語音的直流量 dc=sum(wavedata(30000:34000)/4000;else a=wavedata(1,:); for i=2:size(wavedata,1) a
8、=cat(2,a,wavedata(i,:); end dc=sum(a(1:4000)/4000;end wavesize1=size(f,2);n=1;for i=1:size(f,1)fp=sum(f(1:wavesize1)-dc).2)/(wavesize1-1);%幀信號(hào)的平均能量eva=sum(wavedata(30000:34000)-dc).2)/4000;%鳥鳴語音求出高斯白噪聲的估計(jì)方差 threshold=2*wavesize1*eva*(erfcinv(10-3)2/(wavesize1-1);%求閾值if fp>=threshold%閾值進(jìn)行比較,比閾值大的就
9、是有效幀 wvalid(n,:)=f(i,:);%設(shè)置有效語音矩陣 n=n+1endendvs=n-1;%將有效幀的個(gè)數(shù)賦給vsfor k=1:vs ap(1:50,1:50,k),g(k,1:50),ep(k,1:50),r0(1,k)=levinson_durbin(wvalid(k,:),50,dc);%調(diào)用函數(shù)求得預(yù)測(cè)系數(shù),增益G,以及誤差值enddiv=zeros(2,50);for p=1:50 div(1,p)=sum(ep(1:vs,p)')./r0(1,1:vs)/vs;%使用方法一來獲取最小均方誤差與幀能量的比值end%繪制圖形plot(1:1:50),div(1,
10、:),'-*k');title('歸一化誤差與階數(shù)關(guān)系','(',filename,')');xlabel('線性預(yù)測(cè)階數(shù)p');ylabel('歸一化誤差')axis(1,50,0,1);grid on;杜賓算法函數(shù)function ap,g,ep,r0=levinson_durbin(waveframe,p,dc)fl =size(waveframe,2);%求幀信號(hào)的長(zhǎng)度r=zeros(1,p);%自相關(guān)序列wave=waveframe-dc;%幀信號(hào)減去直流量for k=1:fl r(k)
11、=wave(1:fl-k+1)*(wave(k:fl)'/fl; %求自相關(guān)函數(shù)的漸近無偏估計(jì)endk=zeros(1,p);%反射系數(shù)e=zeros(1,p);%最小均方誤差a=zeros(p,p);%線性預(yù)測(cè)系數(shù)矩陣k(1)=r(2)/r(1);%初始化e(1)=(1-k(1)2)*r(1);a(1,1)=k(1);for i=2:p%levinson_durbin遞推算法 k(i)=(r(i+1)-a(i-1,1:i-1)*fliplr(r(1+1:i)')/e(i-1); a(i,i)=k(i); for j=1:i-1 a(i,j)=a(i-1,j)-k(i)*a(i-1,i-j); end e(i)=(1-k(i)2)*e(i-1);endap=a;g=sqrt(e(1:p);ep=
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 建筑工程價(jià)格調(diào)整合同條款1-@-1
- 衛(wèi)生間吊頂木龍骨施工方案
- 網(wǎng)架拆除施工方案
- 石墻施工方案
- DB3709T 037-2025泰山茶 茶葉鮮葉采摘分級(jí)技術(shù)規(guī)范
- 博羅縣鋼板支護(hù)樁施工方案
- 海島燕屋年產(chǎn)2500噸高端滋補(bǔ)預(yù)制菜加工項(xiàng)目環(huán)境影響報(bào)告表環(huán)評(píng)報(bào)告表
- 配線架施工施工方案
- 水泥板拉木紋板施工方案
- 2025北京大興高一(上)期末生物(教師版)
- 2024年黑龍江哈爾濱“丁香人才周”(秋季)事業(yè)單位引才招聘2074人易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 2024年職工普法教育宣講培訓(xùn)課件
- 自編冷庫庫容制冷量設(shè)備對(duì)照表
- ISO22301新版標(biāo)準(zhǔn)翻譯(中英對(duì)照)
- “全員安全風(fēng)險(xiǎn)辨識(shí)”活動(dòng)實(shí)施方案
- 追覓科技在線測(cè)評(píng)邏輯題
- 凝中國(guó)心鑄中華魂鑄牢中華民族共同體意識(shí)-小學(xué)民族團(tuán)結(jié)愛國(guó)主題班會(huì)課件
- 第一編第3章 古希臘教育的興衰
- 女性更年期科普-健康科普課件
- 全過程工程咨詢管理服務(wù)方案投標(biāo)方案(技術(shù)方案)
- 2024年中考物理實(shí)驗(yàn)(全國(guó)版):探究光的反射定律(解析版)
評(píng)論
0/150
提交評(píng)論