




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、 2015.10.141.介紹語音是人類相互交流和通信最方便快捷的手段。如何高效地實(shí)現(xiàn)語音傳輸、存儲或通過語音實(shí)現(xiàn)人機(jī)交互,是語音信號處理領(lǐng)域中的重要研究課題。語音信號處理涉及數(shù)字信號處理、語言學(xué)、語音學(xué)、生理學(xué)、心理學(xué)、計算機(jī)科學(xué)以及模式識別、人工智能等諸多學(xué)科領(lǐng)域,是目前信息科學(xué)技術(shù)學(xué)科中發(fā)展最為迅速的一個領(lǐng)域。在語音處理技術(shù)中,線性預(yù)測是第一個真正得到實(shí)際應(yīng)用的技術(shù),可以用于估計基本的語音參數(shù),如基因周期、共振峰頻率、頻譜特征及聲道面積函數(shù)等。線性預(yù)測的基本原理是把待分析的信號用一個模型表示出來,信號是這個模型的輸出,構(gòu)成這個模型的參數(shù)是這個信號的重要特征,稱為線性預(yù)測系數(shù)。一個語音取樣
2、的現(xiàn)在值可以用若干個語音取樣的過去值的加權(quán)線性組合來逼近。加權(quán)系數(shù)稱為預(yù)測系數(shù)。如果利用過去 p個樣點(diǎn)值來進(jìn)行預(yù)測,稱為p 階線性預(yù)測。線性預(yù)測編碼就是利用過去的樣值對新鮮值進(jìn)行預(yù)測,然后將樣值的實(shí)際值與其預(yù)測值相減得到一個誤差信號,顯然誤差信號的動態(tài)范圍小于原始語音信號的動態(tài)范圍,對誤差信號進(jìn)行量化編碼,可大大減少量化所需的比特數(shù),使編碼速率降低。通常情況下,隨著線性預(yù)測階數(shù)p的增大,預(yù)測誤差也將會越來越小,但是p也不是一直增加的,隨著線性預(yù)測階數(shù)p的增大,信號中的可預(yù)測部分也將越來越少,預(yù)測誤差的變化趨于平穩(wěn),誤差減小不再明顯。此時,伴隨著預(yù)測階數(shù)p的增大,整個系統(tǒng)的計算量將會越來越大。為
3、此,對于不同的信號,我們需要確定一個最優(yōu)的預(yù)測階數(shù)p,進(jìn)而進(jìn)行預(yù)測分析。在對原始語音信號進(jìn)行處理之前我們要對信號進(jìn)行預(yù)處理,語音信號的預(yù)處理也叫作前端處理,是指在特征提取之前,先對原始語音進(jìn)行處理,使處理后的信號更能滿足實(shí)際的需要,對提高處理精確度有重要的意義。一般預(yù)處理的步驟包括采樣、預(yù)加重、加窗分幀和去噪等,本文采取分幀去除直流分量后再剔除噪聲幀來進(jìn)行預(yù)處理,本文求閾值的方法就是求出語音信號中的高斯白噪聲,然后設(shè)置閾值,將沒幀信號和閾值進(jìn)行比較,如果比閾值小的就是噪聲幀,直接去除。預(yù)處理結(jié)束后,我們對語音信號進(jìn)行LPC分析,本文中通過Levinson-Durbin算法求出預(yù)測系數(shù),在通過不
4、同階數(shù)P的濾波器得到預(yù)測誤差從而找出最小誤差值下的最優(yōu)階數(shù)P,最后作出最小誤差與P的關(guān)系曲線圖。2.LPC基本原理(1)語音信號的樣值序列為s(n),n=1,2,3n,s(n)的預(yù)測值為 (1)線性誤差為e(n) (2)設(shè)計傳遞函數(shù)為A(z),為LPC誤差濾波器,設(shè)計預(yù)測誤差濾波器A(z)就是求解預(yù)測系數(shù),使得誤差在預(yù)定準(zhǔn)則下最小 (3)(2)理論上常用的是均方誤差最小的準(zhǔn)則,對各個系數(shù)求偏導(dǎo),另其結(jié)果為0,得到 (4)S(n)的自相關(guān)序列為 (5)因?yàn)樗桥紝ΨQ,因此 (6)所以上式可以表示為 , (7)設(shè),式子(7)的矩陣形式為,所以就可以求出P個線性預(yù)測系數(shù)。3. Levinson-Du
5、rbin算法杜賓算法是一種有效計算預(yù)測系數(shù)的算法,它主要是采用遞歸算法求解,基本思想是:遞歸解法分步進(jìn)行。在某一步已經(jīng)有了一個解,這是第(i-1)階預(yù)測器的系數(shù)。然后利用(i-1)階方程組的解來表示,(i-1)階方程組的解又可以用(i-2)階方程組的解表示,依此類推。因此只要解出任意一階方程的解,就可以通過遞推解出任意方程組的解。利用杜賓算法我們從最低階開始,從低階到高階逐階遞推。過程如下: (8) (9) (10) (11) (12) (13)上式(8)(13)對i=1,2,p進(jìn)行遞推求解,其最終解為 (14)在上面的一組式子中,i表示預(yù)測器階數(shù),如表示i階預(yù)測器的第j個預(yù)測系數(shù)。對于p階預(yù)
6、測器,在上述求解預(yù)測器系數(shù)的過程中,階數(shù)低于p的各個階預(yù)測器系數(shù)也同時得到。4.結(jié)果圖像分析 5.結(jié)論圖像結(jié)果最佳預(yù)測點(diǎn)P值如下表所示 語音文件最佳系數(shù)PBird26Dog14GirlEng13MaleChns9從上圖中我們可以看出來不同的語言信號在相同的算法下得到的最佳預(yù)測階數(shù)是不同的,鳥兒語音所要的階數(shù)是最高的,其余三個語音的階數(shù)相差不大。6.附加程序BIRD語音程序clear all;clc;filename='Bird'load Bird wavedata;%讀入語音 %對語音進(jìn)行分幀len=200;inc=80; %設(shè)置幀長,幀移wavesize=size(waved
7、ata,2);fsum=fix(wavesize-len+inc)/inc);%計算幀數(shù)f=zeros(fsum,len);%初始化i=1;n=1;while i<=fsum j=1; while j<=len f(i,j)=wavedata(1,n); n=n+1; j=j+1; end n=n+inc-len; i=i+1;end%去除噪聲幀if size(wavedata,1)<=1 %求出鳥鳴語音的直流量 dc=sum(wavedata(30000:34000)/4000;else a=wavedata(1,:); for i=2:size(wavedata,1) a
8、=cat(2,a,wavedata(i,:); end dc=sum(a(1:4000)/4000;end wavesize1=size(f,2);n=1;for i=1:size(f,1)fp=sum(f(1:wavesize1)-dc).2)/(wavesize1-1);%幀信號的平均能量eva=sum(wavedata(30000:34000)-dc).2)/4000;%鳥鳴語音求出高斯白噪聲的估計方差 threshold=2*wavesize1*eva*(erfcinv(10-3)2/(wavesize1-1);%求閾值if fp>=threshold%閾值進(jìn)行比較,比閾值大的就
9、是有效幀 wvalid(n,:)=f(i,:);%設(shè)置有效語音矩陣 n=n+1endendvs=n-1;%將有效幀的個數(shù)賦給vsfor k=1:vs ap(1:50,1:50,k),g(k,1:50),ep(k,1:50),r0(1,k)=levinson_durbin(wvalid(k,:),50,dc);%調(diào)用函數(shù)求得預(yù)測系數(shù),增益G,以及誤差值enddiv=zeros(2,50);for p=1:50 div(1,p)=sum(ep(1:vs,p)')./r0(1,1:vs)/vs;%使用方法一來獲取最小均方誤差與幀能量的比值end%繪制圖形plot(1:1:50),div(1,
10、:),'-*k');title('歸一化誤差與階數(shù)關(guān)系','(',filename,')');xlabel('線性預(yù)測階數(shù)p');ylabel('歸一化誤差')axis(1,50,0,1);grid on;杜賓算法函數(shù)function ap,g,ep,r0=levinson_durbin(waveframe,p,dc)fl =size(waveframe,2);%求幀信號的長度r=zeros(1,p);%自相關(guān)序列wave=waveframe-dc;%幀信號減去直流量for k=1:fl r(k)
11、=wave(1:fl-k+1)*(wave(k:fl)'/fl; %求自相關(guān)函數(shù)的漸近無偏估計endk=zeros(1,p);%反射系數(shù)e=zeros(1,p);%最小均方誤差a=zeros(p,p);%線性預(yù)測系數(shù)矩陣k(1)=r(2)/r(1);%初始化e(1)=(1-k(1)2)*r(1);a(1,1)=k(1);for i=2:p%levinson_durbin遞推算法 k(i)=(r(i+1)-a(i-1,1:i-1)*fliplr(r(1+1:i)')/e(i-1); a(i,i)=k(i); for j=1:i-1 a(i,j)=a(i-1,j)-k(i)*a(i-1,i-j); end e(i)=(1-k(i)2)*e(i-1);endap=a;g=sqrt(e(1:p);ep=
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 臺州浙江臺州三門縣人民政府辦公室招聘編制外合同用工人員筆試歷年參考題庫附帶答案詳解
- 南充2025年四川南充市消防救援支隊招錄政府專職消防員82人(一)筆試歷年參考題庫附帶答案詳解
- 南京江蘇南京師范大學(xué)生命科學(xué)學(xué)院招聘筆試歷年參考題庫附帶答案詳解
- 代理招聘合同范本
- 2025福建福州市園開新筑開發(fā)建設(shè)有限公司招聘3人筆試參考題庫附帶答案詳解
- 2025河南新太行電源股份有限公司招聘4人筆試參考題庫附帶答案詳解
- MeCY5-NHS-ester-Sulfo-Cyanine5-NHS-ester-生命科學(xué)試劑-MCE
- AMPK-IN-6-生命科學(xué)試劑-MCE
- 4-Aminopyrazole-d2-生命科學(xué)試劑-MCE
- 中央2025年中國法學(xué)會所屬事業(yè)單位招聘出站博士后3人筆試歷年參考題庫附帶答案詳解
- 昆明撫仙湖鰭魚灣棋盤山度假娛樂旅游區(qū)總體規(guī)劃方案樣本
- 人教版一年級下冊數(shù)學(xué)第一單元單元作業(yè)設(shè)計
- 突發(fā)疾病時的安全駕駛方法
- 創(chuàng)魯班獎工程條件及評審要求XX4
- 交通法規(guī)常識課件
- 北師大版數(shù)學(xué)四年級下冊簡易方程練習(xí)200題及答案
- 課件:認(rèn)識鏡頭語言1:運(yùn)鏡方式和常用的鏡頭術(shù)語
- (完整版)三年級上冊口算題卡1400道
- 淘寶客服轉(zhuǎn)正述職報告
- 提升電子商務(wù)的發(fā)展邏輯
- 提升醫(yī)療質(zhì)量減少醫(yī)療糾紛
評論
0/150
提交評論