




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、信息工程學院數(shù)字信號處理課程設計數(shù) 字 信 號 處 理課程設計報告題目: 基于聲音的說話人身份識別技術(shù)研究 學院: 信 息 工 程 學 院 專業(yè): 通 信 工 程 指導教師: 符 茂 勝 指導時間: 2014.12 姓 名(學號)承 擔 任 務李治龍(2012013919)GUI界面制作夏梁站(2012013936)程序測試與修改雷超群(2012013918)實驗報告編寫劉怡(2012013923)PPT制作陸瑤(2012013924)語音庫采集、構(gòu)建張帝(2012013943)實驗程序編寫指導教師評價意見成績目錄1、背景- 4 -2、設計目的- 4 -3、設計原理- 5 -3.1 語音識別技
2、術(shù)的分類- 5 -3.2 Mel頻率倒譜系數(shù)- 6 -3.2.1 Mel頻率倒譜系數(shù)基本原理- 6 -3.2.2 MFCC的提取流程- 7 -3.3 矢量量化- 9 -3.3.1 矢量量化的簡單介紹- 9 -3.3.2 矢量量化的定義- 9 -3.3.3 矢量量化的基本原理- 10 -3.4 矢量量化的失真測度- 11 -3.4.1 歐氏距離-均方誤差- 11 -3.5 識別失真度- 12 -4、設計過程- 13 -4.1、實驗技術(shù)路線圖- 13 -4.2、實驗結(jié)果測試圖- 14 -5、實驗代碼與結(jié)果分析- 15 -5.1、MATLAB源程序- 15 -GUI界面:- 15 -測試程序- 17
3、 -Mel倒頻譜系數(shù)函數(shù)- 18 -庫函數(shù)- 19 -濾波程序- 20 -錄音程序- 20 -5.2、實驗結(jié)果分析- 21 -6、實驗體會和總結(jié)- 22 -7、文獻- 23 -1、背景 隨著信息化的迅速發(fā)展,人們對身份識別技術(shù)的需求越來越多,并對其安全性和可靠性的要求也越來越高。基于傳統(tǒng)密碼認證的身份識別技術(shù)在實際信息網(wǎng)絡應用中已經(jīng)暴露出許多不足之處,而基于生物特征辨別的身份識別技術(shù)近年來也日益成熟并在實際應用中展現(xiàn)出極大的優(yōu)越性。作為生物特征認證的一個重要分支,語音識別同指紋識別、人臉識別、虹膜識別一樣,一直以來都是研究者們關(guān)注和探索的熱點之一。 語音識別技術(shù)也成為了近年的研究熱點,有不少實
4、用化的技術(shù)成果被商家成功推向了市場,讓人們看到了它在PDA、智能家電、工業(yè)控制等領(lǐng)域的廣闊發(fā)展前景。例如現(xiàn)在國內(nèi)在語音方面做的最好的就是科大訊飛股份有限公司,科大訊飛作為中國最大的智能語音技術(shù)提供商,在智能語音技術(shù)領(lǐng)域有著長期的研究積累,并在語音合成、語音識別、口語評測、自然語言處理等多項技術(shù)上擁有國際領(lǐng)先的成果。語音識別技術(shù)有很大可能產(chǎn)生新的服務,給人們的工作和生活帶來非常可觀的方便。 我國語音識別研究工作起步于五十年代。近年來國內(nèi)研究水平也從實驗室逐步走向?qū)嵱?。我國語音識別技術(shù)的研究水平已經(jīng)基本上與國外同步,在漢語語音識別技術(shù)上還有自己的特點與優(yōu)勢,并達到國際先進水平。2、設計目的 每個人
5、都有自己特有的發(fā)音器官和特有的說話習慣,這些差異都式反映在說話人語音信號的波形中,且比較復雜,使得每個人的發(fā)音都伴有濃重的個人色彩,這是說話人識別得以實現(xiàn)的客觀保證。說話入識別涉及到人的發(fā)音器官、說話習慣、語言構(gòu)造和發(fā)聲原理等多方面的內(nèi)容,它綜合了生理學、語音學、數(shù)字信號處理、模式識別、人工智能等學科知識,有著廣闊的市場應用前景。通過說話人識別技術(shù),可以實現(xiàn)用語音信息進行說話人的身份鑒別。利用說話人識別技術(shù)還可以通過語音實現(xiàn)對一些服務的控制,例如語音撥號、電話銀行、數(shù)據(jù)庫訪問服務、信息服務和計算機的遠程訪問等等。而且,說話人識別技術(shù)有很大可能產(chǎn)生新的服務,給人們的工作和生活帶來非??捎^的方便,
6、本次試驗主要目的為提出和設計開發(fā)能夠快速準確識別不同個體的可行方案。3、設計原理3.1 語音識別技術(shù)的分類語音識別系統(tǒng)可以根據(jù)對輸入語音的限制加以分類。從說話者與識別系統(tǒng)的相關(guān)性考慮可以將識別系統(tǒng)分為3類:特定人語音識別系統(tǒng):僅考慮對于特定人的語音進行識別;非特定人語音系統(tǒng):識別的語音與人無關(guān),通常要用大量不同人的語音數(shù)據(jù)庫對識別系統(tǒng)進行學習;多人的識別系統(tǒng):通常能識別一組人的語音,或者成為特定組語音識別系統(tǒng),該系統(tǒng)僅要求對需要識別的那組人的語音進行訓練。從說話的方式考慮也可以將識別系統(tǒng)分為3類:孤立詞語音識別系統(tǒng):孤立詞識別系統(tǒng)要求輸入每個詞后要停頓;連接詞語音識別系統(tǒng):連接詞輸入系統(tǒng)要求對
7、每個詞都清楚發(fā)音,一些連音現(xiàn)象開始出現(xiàn);連續(xù)語音識別系統(tǒng):連續(xù)語音輸入是自然流利的連續(xù)語音輸入,大量連音和變音會出現(xiàn)。3.2 Mel頻率倒譜系數(shù)3.2.1 Mel頻率倒譜系數(shù)基本原理Mel頻率倒譜系數(shù)(MFCC),Mel頻率是基于人耳聽覺特性提出來的,它與Hz頻率成非線性對應關(guān)系。Mel頻率倒譜系數(shù)(MFCC)就是是利用它們之間的非線性對應關(guān)系,計算得到的Hz頻譜特征。LPC模型是基于發(fā)音模型建立的,LPCC系數(shù)是一種基于合成的參數(shù),這種參數(shù)沒有充分利用人耳的聽覺性。心理學研究表明,無論是純音還是語音,人們對于聲音音調(diào)的感受都不是線性的,新的頻率單位的劃分方法,都應該考慮到人耳聽覺的特性,這就
8、應該不同于物理學對頻率的描述。物理上的頻率是以Hz為單位的,而符合人聽覺特性的頻率是以Mel或Bark為單位的。臨界帶寬概念的引入是為了描述噪音對純音的遮蔽效應(masking effect): 一個純音可以被以該純音為中心頻率并且具有一定頻帶寬度的噪音所遮蔽,條件是臨界帶寬內(nèi)噪聲的功率大于純音。在一個相同的臨界帶寬內(nèi),如果噪音的聲壓保持恒定,無論噪音的帶寬是否延伸到了整個臨界帶寬,其響度都是相同的,可一旦超過了這個臨界帶寬,就可以察覺到響度的變化。從而得出結(jié)論:如果總功率相同,在一個相同臨界帶寬內(nèi),若干個不同頻率的聲音組成的混音,跟位于此臨界頻帶中央的單頻聲音具有相同的響度。如果混音聲音所處
9、的頻帶范圍超過了相應的臨界帶寬,混音會比純音聽起來更加響亮。通過實驗,我們已經(jīng)知道:當中心頻率在1000Hz以下時,臨界帶寬一般保持恒定,約為100Hz。且當中心頻率超過1000Hz時,隨著中心頻率的增長,臨界頻帶的帶寬呈線性增長。符合人的聽覺系統(tǒng)的頻率刻度劃分方法,應該滿足在低頻上具有較高的分辨率、在高頻上具有較低的分辨率,符合臨界帶寬的特性,以Mel為單位的頻率刻度正是符合這種特性的一種頻率刻度。由于基于Mel頻率的倒譜系數(shù)(Mel Frequency Cepstrum coefficient .簡稱MFCC)是將人耳的聽覺感知特性和語音的產(chǎn)生機制組合在一起,因此在語音識別和說話人識別系統(tǒng)
10、中得到廣泛的應用。Mel頻率尺度(mel-frequency scale),它的值大體上對應于實際頻率的對數(shù)分布關(guān)系。Mel頻率與實際頻率的具體關(guān)系: (1)下圖描述了Mel頻率與實際頻率之間的對應關(guān)系:如圖3.1 圖3.1 Mel頻率與實際頻率的對應關(guān)系3.2.2 MFCC的提取流程MFCC參數(shù)的提取包括以下幾個步驟:n 預濾波:CODEC前端帶寬為300-3400Hz的抗混疊濾波器。n A/D變換:8kHz的采樣頻率,12bit的線性量化精度。n 預加重:通過一個一階有限激勵響應高通濾波器,使信號的頻譜變得平坦,不易受到有限字長效應的影響。n 分幀:根據(jù)語音的短時平穩(wěn)特性,語音可以以幀為單
11、位進行處理,實驗中選取的語音幀長為32ms,幀疊為16ms。 加窗:采用哈明窗對一幀語音加窗,以減小吉布斯效應的影響。n 快速傅立葉變換(Fast Fourier Transformation, FFT):將時域信號變換成為信號的功率譜。三角窗濾波:用一組Mel頻標上線性分布的三角窗濾波器(共24個三角窗濾波器),對信號的功率譜濾波,每一個三角窗濾波器覆蓋的范圍都近似于人耳的一個臨界帶寬,以此來模擬人耳的掩蔽效應。n 求對數(shù):三角窗濾波器組的輸出求取對數(shù),可以得到近似于同態(tài)變換的結(jié)果。n 離散余弦變換(Discrete Cosine Transformation, DCT):去除各維信號之間的
12、相關(guān)性,將信號映射到低維空間。n 譜加權(quán):由于倒譜的低階參數(shù)易受說話人特性、信道特性等的影響,而高階參數(shù)的分辨能力比較低,所以需要進行譜加權(quán),抑制其低階和高階參數(shù)。n 倒譜均值減(Cepstrum Mean Subtraction, CMS):CMS可以有效地減小語音輸入信道對特征參數(shù)的影響。n 差分參數(shù):大量實驗表明,在語音特征中加入表征語音動態(tài)特性的差分參數(shù),能夠提高系統(tǒng)的識別性能。在本系統(tǒng)中,我們也用到了MFCC參數(shù)的一階差分參數(shù)和二階差分參數(shù)。n 短時能量:語音的短時能量也是重要的特征參數(shù),本系統(tǒng)中我們采用了語音的短時歸一化對數(shù)能量及其一階差分、二階差分參數(shù)。 如下圖3.2 MFCC提
13、取流程圖3.2 MFCC提取流程3.3 矢量量化3.3.1 矢量量化的簡單介紹矢量量化(VQ Vector Quantization)是70年代后期發(fā)展起來的一種數(shù)據(jù)壓縮技術(shù)基本思想:將若干個標量數(shù)據(jù)組構(gòu)成一個矢量,然后在矢量空間給以整體量化,從而壓縮了數(shù)據(jù)而不損失多少信息。矢量量化編碼也是在圖像、語音信號編碼技術(shù)中研究得較多的新型量化編碼方法,它的出現(xiàn)并不僅僅是作為量化器設計而提出的,更多的是將它作為壓縮編碼方法來研究的。在傳統(tǒng)的預測和變換編碼中,首先將信號經(jīng)某種映射變換變成一個數(shù)的序列,然后對其一個一個地進行標量量化編碼。而在矢量量化編碼中,則是把輸入數(shù)據(jù)幾個一組地分成許多組,成組地量化編
14、碼,即將這些數(shù)看成一個k維矢量,然后以矢量為單位逐個矢量進行量化。矢量量化是一種限失真編碼,其原理仍可用信息論中的率失真函數(shù)理論來分析。而率失真理論指出,即使對無記憶信源,矢量量化編碼也總是優(yōu)于標量量化。3.3.2 矢量量化的定義矢量量化是先把信號序列的每個連續(xù)樣點分成一組,形成維歐氏空間的一個矢量,然后對此矢量進行量化,具體定義如下:定義 3.3.2:維數(shù)為,尺寸為的矢量量化器定義為從維歐幾里德空間到一個包含個輸出(重構(gòu))點的有限集合的映射, 即 , 其中 集合做碼書(codebook)或碼本,其尺寸(大小)為,碼書的個元素稱為碼字(codeword)或碼矢量(code vector)。輸入
15、矢量空間通過尺寸為的量化器后,被分割成個互不重疊的區(qū)域或胞腔,這個過程被稱為輸入矢量空間的劃分。對,胞腔定義為(2)3.3.3 矢量量化的基本原理對于任一信源或圖樣樣值,若有個,我們可以把連續(xù)的一段樣值當作為一個整體,如我們稱之為矢量。各個矢量的維數(shù)一樣,設為。因此信源將構(gòu)成矢量集:(維歐幾里德空間),為正整數(shù)。再把無遺漏的劃分成個互不相交的子空間,即滿足完備正交條件: (3)并求出每個子空間的質(zhì)心,所得到的恢復矢量集就是量化器的輸出空間。在量化過程中,對于階維的矢量量化,實質(zhì)上是判斷輸入矢量屬于哪個子空間,然后輸出該子空間的代表矢量,也就是如下的映射關(guān)系: (4)從而我們用代替進行編碼,這就
16、是矢量量化的本質(zhì)。在矢量量化時,將維空間劃分為個區(qū)域邊界,然后將輸出矢量與這些邊界進行比較,并被量化為“距離”最小的區(qū)域邊界的中心矢量值。若要對一個矢量進行量化,首先要抽取一個合適的失真測度,而后用最小失真原理,分別計算量化矢量所帶來的失真。其中最小失真值所對應的那個量化矢量,就是矢量的重構(gòu)矢量(恢復矢量)?,F(xiàn)在主要有兩個問題:(1) 如何劃分個區(qū)域邊界。這需要用相當數(shù)量的輸入信號矢量,經(jīng)過統(tǒng)計實驗才能確定。此過程稱為“訓練”或建立碼書。(2) 如何確定兩個矢量在進行比較時的測度。這個測度就是兩矢量之間的距離,或以其中的某一矢量為基準時的失真度。它描述了當輸入矢量用碼書所對應的矢量來表征時所應
17、付出的代價。3.4 矢量量化的失真測度在矢量量化器的設計中,失真測度的選擇是很重要的,它是矢量量化和模式識別中一個相當重要的問題。失真測度選用的合適與否,直接影響系統(tǒng)的性能。要使所選擇的失真測度有實際意義,必須具備下面幾個特征:(1) 必須在主觀評價上有意義,即小的失真應該對應于好的主觀語音質(zhì)量;(2) 必須是方便處理的,就是在數(shù)學上比較容易實現(xiàn),這樣可以用于實際的矢量量化器的設計;(3) 平均失真存在并且是能夠計算的;(4) 方便硬件實現(xiàn)。失真測度主要有均方差失真測度(即歐氏距離),加權(quán)的均方失真測度等。另外,還有人提出所謂的“主觀的”失真測度。3.4.1 歐氏距離-均方誤差設輸入信號的某個
18、維矢量,與碼書中某個維矢量進行比較,必分別表示和中的各元素(),則定義均方誤差為歐氏距離,即有: (5)這里的下標2表示平方誤差。常用的歐氏距離有:方平均誤差。其定義為: (6)平均誤差。其定義為: (7)絕對值平均誤差。這相當于時的平均誤差,其定義式為: (8)此失真測度的主要好處是計算簡單、硬件易于實現(xiàn)。最大平均誤差。相當于是時的平均誤差,其定義式為: (9)歐氏距離測度是人們熟知的一種失真測度,它應用的范圍很寬泛。3.5 識別失真度將矢量量化技術(shù)用于語音識別時,對失真測度還應該有別的一些考慮。在此舉例說明,在使用LPC參數(shù)的似然比失真測度對兩矢量的功率譜進行比較時,還應該考慮到能量。研究
19、表明,頻譜與能量都攜帶有語音信號的信息,如果僅僅靠功率譜作為失真比較的參數(shù),則識別的性能將不夠理想。為此,可以采用如下的定義失真測度: (10)式中,及分別為輸入信號矢量和碼書重構(gòu)矢量的歸一化能量,可取為: (11)的作用是:當兩矢量的能量接近時,能量差引起的影響可以忽略不計,當兩矢量的能量差別比較大時,就是進行線性加權(quán),而當能量差超過門限時,則為某一固定值。式(10)中,為加權(quán)因子,這里、和要經(jīng)過測試來進行確定。4、設計過程4.1、實驗技術(shù)路線圖4.2、實驗結(jié)果測試圖5、實驗代碼與結(jié)果分析5.1、MATLAB源程序GUI界面:function varargout = testGUI(vara
20、rgin)% TESTGUI MATLAB code for testGUI.fig% TESTGUI, by itself, creates a new TESTGUI or raises the existing% singleton*.% H = TESTGUI returns the handle to a new TESTGUI or the handle to% the existing singleton*.% TESTGUI(CALLBACK,hObject,eventData,handles,.) calls the local% function named CALLBAC
21、K in TESTGUI.M with the given input arguments.% TESTGUI(Property,Value,.) creates a new TESTGUI or raises the% existing singleton*. Starting from the left, property value pairs are% applied to the GUI before testGUI_OpeningFcn gets called. An% unrecognized property name or invalid value makes proper
22、ty application% stop. All inputs are passed to testGUI_OpeningFcn via varargin.% *See GUI Options on GUIDEs Tools menu. Choose GUI allows only one% instance to run (singleton).% See also: GUIDE, GUIDATA, GUIHANDLES % Edit the above text to modify the response to help testGUI % Last Modified by GUIDE
23、 v2.5 27-Dec-2014 14:18:04 % Begin initialization code - DO NOT EDITgui_Singleton = 1;gui_State = struct(gui_Name, mfilename, . gui_Singleton, gui_Singleton, . gui_OpeningFcn, testGUI_OpeningFcn, . gui_OutputFcn, testGUI_OutputFcn, . gui_LayoutFcn, , . gui_Callback, );if nargin & ischar(varargin1) g
24、ui_State.gui_Callback = str2func(varargin1);end if nargout varargout1:nargout = gui_mainfcn(gui_State, varargin:);else gui_mainfcn(gui_State, varargin:);end% End initialization code - DO NOT EDIT% - Executes just before testGUI is made visible.function testGUI_OpeningFcn(hObject, eventdata, handles,
25、 varargin)% This function has no output args, see OutputFcn.% hObject handle to figure% eventdata reserved - to be defined in a future version of MATLAB% handles structure with handles and user data (see GUIDATA)% varargin command line arguments to testGUI (see VARARGIN)% Choose default command line
26、 output for testGUIhandles.output = hObject;% Update handles structureguidata(hObject, handles);% UIWAIT makes testGUI wait for user response (see UIRESUME)% uiwait(handles.figure1);% - Outputs from this function are returned to the command line.function varargout = testGUI_OutputFcn(hObject, eventd
27、ata, handles) % varargout cell array for returning output args (see VARARGOUT);% hObject handle to figure% eventdata reserved - to be defined in a future version of MATLAB% handles structure with handles and user data (see GUIDATA)% Get default command line output from handles structurevarargout1 =
28、handles.output;ha=axes(units,normalized,position,0 0 1 1); uistack(ha,bottom) II=imread(1.jpg);image(II) colormap gray set(ha,handlevisibility,off,visible,off); % - Executes on button press in pushbutton1.function pushbutton1_Callback(hObject, eventdata, handles)% hObject handle to pushbutton1 (see
29、GCBO)% eventdata reserved - to be defined in a future version of MATLAB% handles structure with handles and user data (see GUIDATA)global s;global a;測試程序s, fs = wavread(165.wav); v2 = mfcc(s, fs); % 對找到的文件取mfcc變換 for j=2:80 v( :,j)=v2(:,(j-1)*3); end a=v; b= load(matlab.mat) ; b0=b.yuyinku0; %姜昱涵 co
30、de1=b0; b1=b.yuyinku1; %李治龍 code2=b1; b2=b.yuyinku2; %楊帆 code3=b2; b3=b.yuyinku3; %劉洋洋 code4=b3; b4=b.yuyinku4; %劉怡 code5=b4; b5=b.yuyinku5; %張震 code6=b5; b6=b.yuyinku6; %陸瑤; code7=b6; b7=b.yuyinku7; %夏梁站 code8=b7; b8=b.yuyinku8; %朱清寧 code9=b8; b9=b.yuyinku9; %包雨晴; code10=b9; b10=b.yuyinku10; %陳燕 co
31、de11=b10; b11=b.yuyinku11; %龔媛媛 code12=b11; b12=b.yuyinku12; %沈亞萍 code13=b12; b13=b.yuyinku13; %肖月霞 code14=b13; b14=b.yuyinku14; %張婷婷 code15=b14; b15=b.yuyinku15; %趙禮慧; code16=b15; b16=b.yuyinku16; %黃玉乾 code17=b16; b17=b.yuyinku17; %張帝 code18=b17; b18=b.yuyinku18; %雷超群 code19=b18; dist = zeros(19,1)
32、;for i=1:19 dist(i,1) = dtwdist = zeros(19,1);for i=1:19 dist(i,1) = dtw2(a,codei) ; enddisp(結(jié)果為:)i,j= min(dist); if i3.0e+04 fprintf(測試人語音 %d 是庫內(nèi)人員編號為%d!n,165,j); else fprintf(測試人語音 %d 未被識別!n, 165); endguidata(hObject, handles); % - Executes on mouse press over axes background.function axes1_Button
33、DownFcn(hObject, eventdata, handles)% hObject handle to axes1 (see GCBO)% eventdata reserved - to be defined in a future version of MATLAB% handles structure with handles and user data (see GUIDATA)Mel倒頻譜系數(shù)函數(shù)function r = mfcc(s, fs)for i = 1:19 % 對數(shù)據(jù)庫中的代碼形成碼本 file = sprintf(%d.wav,i); disp(file); s,
34、fs = wavread(file);m = 100;n = 256;l = length(s);p=20;nbFrame = floor(l - n) / m) + 1; %沿-方向取整 nbFrame=4;%for i = 1:n for j = 1:nbFrameM(i,j)=s(j-1)*m)+i);%對矩陣M賦值 endendh = hamming(n); %加 hamming 窗,以增加音框左端和右端的連續(xù)性M2 = diag(h)* M;for i = 1:nbFrameframe(:,i) = fft(M2(:, i); %對信號進行快速傅里葉變換FFT endt = n /
35、2;tmax = l / fs;m = melfb(20, n, fs); %將上述線性頻譜通過Mel 頻率濾波器組得到Mel 頻譜,下面在將其轉(zhuǎn)化成對數(shù)頻譜矩形濾波器組f0 = 700 / fs;fn2 = floor(n/2);lr = log(1 + 0.5/f0) / (p+1);bl = n * (f0 * (exp(0 1 p p+1 * lr) - 1);%直接轉(zhuǎn)換為FFT的數(shù)字模型b1 = floor(bl(1) + 1;b2 = ceil(bl(2);b3 = floor(bl(3);b4 = min(fn2, ceil(bl(4) - 1;pf = log(1 + (b1:
36、b4)/n/f0) / lr;fp = floor(pf); pm = pf - fp;r = fp(b2:b4) 1+fp(1:b3);c = b2:b4 1:b3 + 1;v = 2 * 1-pm(b2:b4) pm(1:b3);m = sparse(r, c, v, p, 1+fn2);n2 = 1 + floor(n / 2);z = m * abs(frame(1:n2, :).2;r = dct(log(z); %將上述對數(shù)頻譜,經(jīng)過離散余弦變換(DCT)變換 到倒譜域,即可得到Mel 倒譜系數(shù)(MFCC參數(shù))end庫函數(shù)for i = 102:110 % 對數(shù)據(jù)庫中的代碼形成碼本
37、 file = sprintf(%d.wav,i); disp(file); s,fs = wavread(file); v1= mfcc(s, fs); % 計算 MFCCs 提取特征特征,返回值是Mel倒譜系數(shù), 是一個log的dct得到的 for j=2:80 v(:,j)=v1(:,(j-1)*3); end ku(:,:,i)= v; end yuyinku10(:,:,1)=(ku(:,:,102)+ku(:,:,103)+ ku(:,:,104)+ku(:,:,105)+ ku(:,:,106)+ku(:,:,107)+ ku(:,:,108)+ku(:,:,109)+ ku(:
38、,:,110)./9; figure(1); plot(yuyinku10);濾波程序function m = melfb(p, n, fs)f0 = 700 / fs;fn2 = floor(n/2);lr = log(1 + 0.5/f0) / (p+1);% convert to fft bin numbers with 0 for DC termbl = n * (f0 * (exp(0 1 p p+1 * lr) - 1);%直接轉(zhuǎn)換為FFT的數(shù)字模型b1 = floor(bl(1) + 1;b2 = ceil(bl(2);b3 = floor(bl(3);b4 = min(fn2,
39、 ceil(bl(4) - 1;pf = log(1 + (b1:b4)/n/f0) / lr;fp = floor(pf);pm = pf - fp; r = fp(b2:b4) 1+fp(1:b3);c = b2:b4 1:b3 + 1;v = 2 * 1-pm(b2:b4) pm(1:b3);m = sparse(r, c, v, p, 1+fn2);錄音程序clear all%x = load(C:UserslenovoDesktopMATLAByuyinku.mat);fs=11025;fprintf(Press any key to start %g seconds of reco
40、rding. n,5); pause; fprintf(Recording.n); y=wavrecord(5*fs, fs,uint8);fprintf(Finished recording.n); %plot(y);wavwrite(y,1.wav);%z = y(:,1);%z=fft(y);%stem(z,.);wavplay(y);5.2、實驗結(jié)果分析人員編號12345678910111213141516171819測試次數(shù)10101010101010101010101010101010101010正確數(shù)9589687796879697958錯誤數(shù)1521423314231413152正確率%90508090608070709060807090609070905080 由上述識別率表格可以看出,實驗結(jié)果的識別率的高低的波動還是有點大。因為實驗環(huán)境中存在一定的噪音,從而導致了識別率跟前面的比較有所下降。本組實驗中,識別率平均達到74.74%說明該小型簡易說話人識別系統(tǒng)在處理實驗中的語音段時,其
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 個人優(yōu)點總結(jié)20篇
- 下半年個人工作計劃
- 中醫(yī)康復治療技術(shù)模擬練習題(含參考答案)
- 游泳救生員初級題庫與參考答案
- 推拿治療學試題含答案
- 一通三防工作總結(jié)
- 買房同中介合同范本
- 口罩購銷合同范本模板
- 出售混凝土檁條合同范本
- 住宅小區(qū)車位轉(zhuǎn)讓合同范本
- 2025年棗莊科技職業(yè)學院高職單招語文2018-2024歷年參考題庫頻考點含答案解析
- 護苗行動安全教育課件
- 2024年山西同文職業(yè)技術(shù)學院高職單招職業(yè)適應性測試歷年參考題庫含答案解析
- 油品庫房管理規(guī)定(2篇)
- 礦山工程安全培訓課件
- 2025年月度工作日歷含農(nóng)歷節(jié)假日電子表格版
- 2024年長沙民政職業(yè)技術(shù)學院單招職業(yè)技能測試題庫及答案解析
- 2024年精對苯二甲酸市場分析報告
- 成人手術(shù)后疼痛評估與護理團體標準
- 2025年中考數(shù)學二輪專題復習 題型四-二次函數(shù)圖象與性質(zhì)綜合題
- 【數(shù)學】一元一次方程的應用第2課時盈不足問題課件-2024-2025學年北師大版數(shù)學七年級上冊
評論
0/150
提交評論