




已閱讀5頁(yè),還剩14頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
學(xué)習(xí)資料收集于網(wǎng)絡(luò),僅供參考 數(shù)字信號(hào)處理課程設(shè)計(jì)題 目: 基于MATLAB的說(shuō)話人語(yǔ)音識(shí)別 班 級(jí): 信號(hào)與信息處理 研一 學(xué) 號(hào): 2150130425 姓 名: 湛西羊 任課教師: 黃建軍 完成時(shí)間: 2015/12/31 目錄一、 系統(tǒng)設(shè)計(jì)任務(wù)及要求3二、 語(yǔ)音識(shí)別的簡(jiǎn)介3三、語(yǔ)音識(shí)別原理33.1語(yǔ)音識(shí)別系統(tǒng)總體框架43.2語(yǔ)音信號(hào)預(yù)處理4 3.3特征參數(shù)的提取6 3.4用矢量量化聚類法生成碼本7 3.5 VQ的說(shuō)話人識(shí)別 8三、 仿真實(shí)現(xiàn)95、 總結(jié)9附錄110附錄214一系統(tǒng)設(shè)計(jì)任務(wù)及要求1.用MATLAB實(shí)現(xiàn)50個(gè)特定人的語(yǔ)音識(shí)別功能; 2.語(yǔ)音識(shí)別的正確率在百分之九十以上;二語(yǔ)音識(shí)別的簡(jiǎn)介說(shuō)話人識(shí)別就是根據(jù)說(shuō)話人的語(yǔ)音信號(hào)來(lái)判別說(shuō)話人的身份。語(yǔ)音是人的自然屬性之一,由于說(shuō)話人發(fā)音器官的生理差異以及后天形成的行為差異,每個(gè)人的語(yǔ)音都帶有強(qiáng)烈的個(gè)人色彩,這就使得通過(guò)分析語(yǔ)音信號(hào)來(lái)識(shí)別說(shuō)話人成為可能。用語(yǔ)音來(lái)鑒別說(shuō)話人的身份有著許多獨(dú)特的優(yōu)點(diǎn),如語(yǔ)音是人的固有的特征,不會(huì)丟失或遺忘;語(yǔ)音信號(hào)的采集方便,系統(tǒng)設(shè)備成本低;利用電話網(wǎng)絡(luò)還可實(shí)現(xiàn)遠(yuǎn)程客戶服務(wù)等。因此,近幾年來(lái),說(shuō)話人識(shí)別越來(lái)越多的受到人們的重視。與其他生物識(shí)別技術(shù)如指紋識(shí)別、手形識(shí)別等相比較,說(shuō)話人識(shí)別不僅使用方便,而且屬于非接觸性,容易被用戶接受,并且在已有的各種生物特征識(shí)別技術(shù)中,是唯一可以用作遠(yuǎn)程驗(yàn)證的識(shí)別技術(shù)。因此,說(shuō)話人識(shí)別的應(yīng)用前景非常廣泛:今天,說(shuō)話人識(shí)別技術(shù)已經(jīng)關(guān)系到多學(xué)科的研究領(lǐng)域,不同領(lǐng)域中的進(jìn)步都對(duì)說(shuō)話人識(shí)別的發(fā)展做出了貢獻(xiàn)。說(shuō)話人識(shí)別技術(shù)是集聲學(xué)、語(yǔ)言學(xué)、計(jì)算機(jī)、信息處理和人工智能等諸多領(lǐng)域的一項(xiàng)綜合技術(shù),應(yīng)用需求將十分廣闊。說(shuō)話人識(shí)別系統(tǒng)設(shè)計(jì)中的根本問(wèn)題是如何從語(yǔ)音信號(hào)中提取表征人的基本特征。即語(yǔ)音特征矢量的提取是整個(gè)說(shuō)話人識(shí)別系統(tǒng)的基礎(chǔ),對(duì)說(shuō)話人識(shí)別的錯(cuò)誤拒絕率和錯(cuò)誤接受率有著極其重要的影響。同語(yǔ)音識(shí)別不同,說(shuō)話人識(shí)別利用的是語(yǔ)音信號(hào)中的說(shuō)話人信息,而不考慮語(yǔ)音中的字詞意思,它強(qiáng)調(diào)說(shuō)話人的個(gè)性。因此,單一的語(yǔ)音特征矢量很難提高識(shí)別率,所以語(yǔ)音信號(hào)的時(shí)候如何提取信號(hào)中關(guān)鍵的成分尤為重要。語(yǔ)音信號(hào)的特征參數(shù)的好壞直接導(dǎo)致了辨別的準(zhǔn)確性。系統(tǒng)在說(shuō)話人的識(shí)別中采用基于Mel的頻率倒譜系數(shù)的模板匹配的說(shuō)話人識(shí)別方法。具體的實(shí)現(xiàn)過(guò)程當(dāng)中,采用了matlab軟件來(lái)幫助完成這個(gè)項(xiàng)目。在matlab中實(shí)現(xiàn)采集,分析,特征提取,配對(duì),識(shí)別。三語(yǔ)音識(shí)別原理3.1 語(yǔ)音識(shí)別系統(tǒng)總體框架說(shuō)話人識(shí)別系統(tǒng)的總體結(jié)構(gòu)如圖1所示。首先通過(guò)語(yǔ)音的錄制作為輸入信號(hào),輸入的模擬語(yǔ)音信號(hào)要進(jìn)行預(yù)處理,包括預(yù)濾波、采樣和量化、加窗、端點(diǎn)檢測(cè)、預(yù)加重等等。經(jīng)過(guò)預(yù)處理后,接下來(lái)就是重要的一環(huán):特征參數(shù)提取。具體要求是:(1) 提取的特征參數(shù)要能有效地代表語(yǔ)音特征,具有很好的區(qū)分性。(2) 各階參數(shù)之間有良好的獨(dú)立性。訓(xùn)練識(shí)別參考 模塊識(shí)別結(jié)果語(yǔ)音輸入預(yù)處理特征提取測(cè)度估計(jì)模板庫(kù)識(shí)別決策專家知識(shí)(3) 特征參數(shù)要計(jì)算方便,最好有高效的計(jì)算方法,以保證語(yǔ)音識(shí)別的實(shí)時(shí)實(shí)現(xiàn)。圖1 說(shuō)話人語(yǔ)音識(shí)別系統(tǒng)總體框圖考慮到數(shù)據(jù)量、實(shí)時(shí)性以及識(shí)別率的問(wèn)題,本文采用基于矢量量化的方法識(shí)別語(yǔ)音。對(duì)于特征參數(shù)的選取,我們使用mfcc的方法來(lái)提取。3.2語(yǔ)音信號(hào)預(yù)處理3.2.1 濾波在模/數(shù)轉(zhuǎn)換之前,通常要進(jìn)行濾波處理,濾波的作用主要有兩個(gè):一是用高通濾波器抑制50Hz電源噪聲的干擾;二是用低通濾波器濾除語(yǔ)音信號(hào)中頻率分量超過(guò)采樣頻率一半的部分,防止采樣信號(hào)的混疊。3.2.2 模數(shù)轉(zhuǎn)換將原始采集得來(lái)的語(yǔ)音模擬信號(hào)轉(zhuǎn)換為計(jì)算機(jī)能夠處理的數(shù)字信號(hào),就需要對(duì)其進(jìn)行數(shù)字化,此過(guò)程成為數(shù)/模轉(zhuǎn)換,最常見(jiàn)的方式就是脈沖編碼調(diào)制(PalseCode Modulation ),它的過(guò)程分為采樣、量化和編碼;采樣是對(duì)模擬信號(hào)進(jìn)行周期性的掃描,將實(shí)際上連續(xù)變化的信號(hào)轉(zhuǎn)換為時(shí)間上離散的信號(hào),從而便于表示為計(jì)算機(jī)的語(yǔ)言。根據(jù)Nyquist采樣定理,當(dāng)采樣頻率高于信號(hào)最高頻率的一倍時(shí),原來(lái)的連續(xù)信號(hào)就可以從采樣樣本中完全重建出來(lái)。人耳可以分辨的聲音頻率范圍為(20Hz,20KHz),因此,當(dāng)采樣的頻率高于40KHz時(shí),采樣的過(guò)程就不會(huì)丟失信息,但考慮到設(shè)備的實(shí)際性能,且說(shuō)話人語(yǔ)音頻率主要集中在3.4KHz,故本系統(tǒng)以8KHz為采樣率。 量化就是把經(jīng)過(guò)采樣得到的瞬時(shí)值將其幅度離散,即用一組規(guī)定的電平,把瞬時(shí)抽樣值用最接近的電平值來(lái)表示出來(lái),最終用整數(shù)倍的數(shù)字表示的過(guò)程。經(jīng)過(guò)時(shí)間上的采樣后,連續(xù)的模擬信號(hào)變成了離散信號(hào),再經(jīng)過(guò)振幅的量化,把量化好的采樣值用二進(jìn)制代碼表示出來(lái),就轉(zhuǎn)換成了數(shù)字信號(hào)。編碼:就是用一組二進(jìn)制碼組來(lái)表示每一個(gè)有固定電平的量化值。然而,實(shí)際上量化是在編碼過(guò)程中同時(shí)完成的,故編碼過(guò)程也就稱為模/數(shù)轉(zhuǎn)換,該系統(tǒng)以實(shí)驗(yàn)者50人的聲音為分析樣本,將語(yǔ)音信號(hào)都保存為符合RIFF規(guī)范的wav文件格式,便于在windows環(huán)境下處理。語(yǔ)音信號(hào)是利用PC機(jī)錄制,音頻文件采用8000kHz采樣頻率、16bit量化、單聲道的PCM錄 音,用MATLAB本身wavread函數(shù)來(lái)讀取語(yǔ)音文件,直接將語(yǔ)音數(shù)據(jù)轉(zhuǎn)化為數(shù)字信號(hào)。 3.2.3預(yù)加重、分幀及加窗 預(yù)處理是指對(duì)語(yǔ)音信號(hào)的特殊處理:預(yù)加重,分幀處理。預(yù)加重的目的是提升高頻部分,使信號(hào)的頻譜變得平坦,以便于進(jìn)行頻譜分析或聲道參數(shù)分析。用具有 6dB/倍頻程的提升高頻特性的預(yù)加重?cái)?shù)字濾波器實(shí)現(xiàn)。雖然語(yǔ)音信號(hào)是非平穩(wěn)時(shí)變的,但是可以認(rèn)為是局部短時(shí)平穩(wěn)。故語(yǔ)音信號(hào)分析常分段或分幀來(lái)處理。在語(yǔ)音參數(shù)計(jì)算之前,一般要將其通過(guò)一個(gè)預(yù)加重濾波器,預(yù)加重目的是為了對(duì)語(yǔ)音的高頻部分進(jìn)行加重增加其高頻分辨率,其函數(shù)為:x=filter(1 -0.9375,1,x);“幀”,將語(yǔ)音信號(hào)截?cái)嗟倪^(guò)程稱之為“分幀”。為了保持幀之間的平滑過(guò)渡,常相鄰的兩幀之間有少部分的重疊,這些重疊的部分叫做幀移。在以后的語(yǔ)音信號(hào)識(shí)別過(guò)程中,都是依賴于每一幀多對(duì)應(yīng)的數(shù)據(jù)序列所描述的語(yǔ)音信號(hào)特征來(lái)處理。分幀操作主要是提取語(yǔ)音短時(shí)特性便于建模,一般取幀長(zhǎng)30ms,幀移10ms;在對(duì)語(yǔ)音信號(hào)進(jìn)行截?cái)嗵幚硇纬蓭螅ǔ?huì)產(chǎn)生泄露( Gibbs)現(xiàn)象,為了防止此種現(xiàn)象的發(fā)生,我們通常運(yùn)用一個(gè)長(zhǎng)度有限的窗函數(shù)w(n)對(duì)語(yǔ)音短段進(jìn)行變換或運(yùn)算。對(duì)于語(yǔ)音信號(hào)的每一幀來(lái)說(shuō),窗函數(shù)的寬度會(huì)影響語(yǔ)音信號(hào)的平滑性。越寬的窗函數(shù),對(duì)信號(hào)的平滑作用就會(huì)越顯著,效果越好,窗函數(shù)過(guò)窄,則基本對(duì)信號(hào)不起作用。語(yǔ)音信號(hào)經(jīng)過(guò)加窗處理后,兩端的坡度會(huì)減小,窗口邊緣兩端也不會(huì)引起急劇變化,截取出的語(yǔ)音波形兩端就會(huì)緩慢的過(guò)渡為零,這就有效的減小語(yǔ)音幀的截?cái)嘈?yīng)。因此對(duì)于語(yǔ)音信號(hào)時(shí)域分析來(lái)說(shuō),窗函數(shù)的選擇很重要,雖說(shuō)矩形窗平滑比較好,但是容易丟失波形細(xì)節(jié),并有可能造成泄漏現(xiàn)象。而Hamming窗可以有效的克服泄漏現(xiàn)象。所以在加窗方面常以Hamming窗為主,即:3.3特征參數(shù)的提取對(duì)于特征參數(shù)的選取,我們使用mfcc的方法來(lái)提取。MFCC(Mel-sealed Cepstrum Coefficients),即Mel頻率倒譜參數(shù),也叫做Mel尺度倒譜參數(shù)。MFCC參數(shù)是基于人的聽(tīng)覺(jué)特性利用人聽(tīng)覺(jué)的屏蔽效應(yīng),在Mel標(biāo)度頻率域提取出來(lái)的倒譜特征參數(shù)。 這個(gè)參數(shù)的提取是將語(yǔ)音從時(shí)域變換至倒譜域,通過(guò)構(gòu)造人的聽(tīng)覺(jué)模型,用濾波器組模仿人耳的濾波,語(yǔ)音通過(guò)濾波器組的輸出為語(yǔ)音基本特征參數(shù),然后做傅里葉變換在語(yǔ)音識(shí)別處理信號(hào)過(guò)程中,MFCC參數(shù)是按照幀計(jì)算的。其特征提取及計(jì)算過(guò)程如圖2所示。x(n)預(yù)加重、分幀、加窗端點(diǎn)檢測(cè)DFT/FFTMel頻率濾波器組log對(duì)數(shù)能量DCT求倒譜圖2 MFCC特征提取及計(jì)算流程MFCC參數(shù)的提取過(guò)程如下: 1. 對(duì)輸入的語(yǔ)音信號(hào)進(jìn)行分幀、加窗,然后作離散傅立葉變換,獲得頻譜分布信息。 設(shè)語(yǔ)音信號(hào)的DFT為:(1)其中式中x(n)為輸入的語(yǔ)音信號(hào),N表示傅立葉變換的點(diǎn)數(shù)。 2. 再求頻譜幅度的平方,得到能量譜。 3. 將能量譜通過(guò)一組Mel尺度的三角形濾波器組。 我們定義一個(gè)有M個(gè)濾波器的濾波器組(濾波器的個(gè)數(shù)和臨界帶的個(gè)數(shù)相近),采用的濾波器為三角濾波器,中心頻率為f(m),m=1,2,3,,M,本系統(tǒng)取M=100。4. 計(jì)算每個(gè)濾波器組輸出的對(duì)數(shù)能量。 (2)其中為三角濾波器的頻率響應(yīng)。 5. 經(jīng)過(guò)離散弦變換(DCT)得到MFCC系數(shù)。 MFCC系數(shù)個(gè)數(shù)通常取2030,常常不用0階倒譜系數(shù),因?yàn)樗从车氖穷l譜能量,故在一般識(shí)別系統(tǒng)中,將稱為能量系數(shù),并不作為倒譜系數(shù),本系統(tǒng)選取20階倒譜系數(shù)。3.4用矢量量化聚類法生成碼本 在識(shí)別(匹配)階段,我們用VQ方法計(jì)算平均失真測(cè)度(本系統(tǒng)在計(jì)算距離d時(shí),采用歐氏距離測(cè)度),從而判斷說(shuō)話人是誰(shuí)。基于VQ的說(shuō)話人識(shí)別系統(tǒng),矢量量化起著雙重作用。在訓(xùn)練階段,把每一個(gè)說(shuō)話者所提取的特征參數(shù)進(jìn)行分類,產(chǎn)生不同碼字所組成的碼本。我們將每個(gè)待識(shí)的說(shuō)話人看作是一個(gè)信源,用一個(gè)碼本來(lái)表征。碼本是從該說(shuō)話人的訓(xùn)練序列中提取的MFCC特征矢量聚類而生成。只要訓(xùn)練的序列足夠長(zhǎng),可認(rèn)為這個(gè)碼本有效地包含了說(shuō)話人的個(gè)人特征,而與講話的內(nèi)容無(wú)關(guān)。 本系統(tǒng)采用基于分裂的LBG的算法設(shè)計(jì)VQ碼本,為訓(xùn)練序列,B為碼本。 具體實(shí)現(xiàn)過(guò)程如下: 1. 取提取出來(lái)的所有幀的特征矢量的型心(均值)作為第一個(gè)碼字矢量B1。2. 將當(dāng)前的碼本Bm根據(jù)以下規(guī)則分裂,形成2m個(gè)碼字。 (4)其中m從1變化到當(dāng)前的碼本的碼字?jǐn)?shù),是分裂時(shí)的參數(shù),本文=0.01。 3. 根據(jù)得到的碼本把所有的訓(xùn)練序列(特征矢量)進(jìn)行分類,然后按照下面兩個(gè)公式計(jì)算訓(xùn)練矢量量化失真量的總和以及相對(duì)失真(n為迭代次數(shù),初始n=0,=,B為當(dāng)前的碼書),若相對(duì)失真小于某一閾值,迭代結(jié)束,當(dāng)前的碼書就是設(shè)計(jì)好的2m個(gè)碼字的碼書,轉(zhuǎn)。否則,轉(zhuǎn)下一步。 量化失真量和: (5)相對(duì)失真: (6) 4. 重新計(jì)算各個(gè)區(qū)域的新型心,得到新的碼書,轉(zhuǎn)第3步。 5. 重復(fù) , 和步,直到形成有M個(gè)碼字的碼書(M是所要求的碼字?jǐn)?shù)),其中D0=10000。3.5 VQ的說(shuō)話人識(shí)別 語(yǔ)音識(shí)別系統(tǒng)結(jié)構(gòu)框圖如圖3所示。設(shè)是未知的說(shuō)話人的特征矢量,共有T幀是訓(xùn)練階段形成的碼書,表示碼書第m個(gè)碼字,每一個(gè)碼書有M個(gè)碼字。再計(jì)算測(cè)試者的平均量化失真D,并設(shè)置一個(gè)閾值,若D小于此閾值,則是原訓(xùn)練者,反之則認(rèn)為不是原訓(xùn)練者。 (7)圖3 語(yǔ)音識(shí)別系統(tǒng)結(jié)構(gòu)框圖 四.仿真實(shí)現(xiàn)我們的系統(tǒng)分為兩部分:第一部分是先把50個(gè)人的聲音保存成.wav的格式,放在一個(gè)文件夾中,作為說(shuō)話人的聲音模板檢測(cè)的數(shù)據(jù)庫(kù)。第二部分是對(duì)檢測(cè)者實(shí)行識(shí)別對(duì)已經(jīng)保存的50個(gè)數(shù)字的語(yǔ)音提取mfcc特征者,進(jìn)行辨別和實(shí)時(shí)的判斷說(shuō)話人是否為同一人。在train.m調(diào)用Vqlbg.m獲取訓(xùn)練錄音的vq碼本,而vqlbg.m調(diào)用mfcc.m獲取單個(gè)錄音的mel倒譜系數(shù),接著mfcc.m調(diào)用melfb.m-將能量譜通過(guò)一組Mel尺度的三角形濾波器組。 在test.m函數(shù)文件中調(diào)用disteu.m計(jì)算訓(xùn)練錄音(提供vq碼本)與測(cè)試錄音(提供mfcc)mel倒譜系數(shù)的距離,即判斷兩聲音是否為同一錄音者提供。Disteu.m調(diào)用mfcc.m獲取單個(gè)錄音的mel倒譜系數(shù)。mfcc.m調(diào)用Melfb.m-將能量譜通過(guò)一組Mel尺度的三角形濾波器組。五 總結(jié)在matlab環(huán)境下實(shí)現(xiàn)基于矢量量化的說(shuō)話人識(shí)別系統(tǒng)。在實(shí)時(shí)錄音的情況下,利用該說(shuō)話人識(shí)別系統(tǒng),對(duì)不同的人的1s7s的語(yǔ)音進(jìn)行辨識(shí)。實(shí)現(xiàn)與文本無(wú)關(guān)的自動(dòng)說(shuō)話人確認(rèn)的實(shí)時(shí)識(shí)別。實(shí)驗(yàn)表明,該系統(tǒng)能較好地進(jìn)行語(yǔ)音的識(shí)別,識(shí)別正確率達(dá)90%以上。同時(shí),基于矢量量化技術(shù) (VQ)的語(yǔ)音識(shí)別系統(tǒng)具有分類準(zhǔn)確,存儲(chǔ)數(shù)據(jù)少,實(shí)時(shí)響應(yīng)速度快等綜合性能好的特點(diǎn)附錄1附錄2function M3 = blockFrames(s, fs, m, n)% blockFrames: % Puts the signal into frames 分幀函數(shù)% Inputs: % s contains the signal to analize 語(yǔ)音信號(hào)% fs is the sampling rate of the signal 語(yǔ)音采樣頻率% m is the distance between the beginnings of two frames 兩幀之間的距離% n is the number of samples per frame 每幀的采樣點(diǎn)數(shù)% Output:% M3 is a matrix containing all the frames 數(shù)組形式,包含了所有的幀l = length(s); %語(yǔ)音信號(hào)的長(zhǎng)度nbFrame = floor(l - n) / m) + 1; %幀數(shù)for i = 1:n for j = 1:nbFrame M(i, j) = s(j - 1) * m) + i); %逐幀掃描 endendh = hamming(n);M2 = diag(h) * M; %加漢明窗for i = 1:nbFrame M3(:, i) = fft(M2(:, i); %短時(shí)傅立葉變換Endfunction code = train(traindir, n)% 計(jì)算wav文件的VQ碼碼本% Speaker Recognition: Training Stage% Input:% traindir : string name of directory contains all train sound files% n : number of train files in traindir% Output:% code : trained VQ codebooks, codei for i-th speaker% Note:% Sound files in traindir is supposed to be: % s1.wav, s2.wav, ., sn.wav% Example:% code = train(C:datatrain, 8);k = 16; % number of centroids requiredfor i = 1:n % train a VQ codebook for each speaker file = sprintf(%ss%d.wav, traindir, i); disp(file); s, fs = wavread(file); v = mfcc(s, fs); % Compute MFCCs codei = vqlbg(v, k); % Train VQ codebookendfunction d = disteu(x, y)% DISTEU Pairwise Euclidean distances between columns of two matrices 測(cè)試失真度% Input:% x, y: Two matrices whose each column is an a vector data.% Output:% d: Element d(i,j) will be the Euclidean distance between two column vectors X(:,i) and Y(:,j)% Note:% The Euclidean distance D between two vectors X and Y is:% D = sum(x-y).2).0.5M, N = size(x);M2, P = size(y); if (M = M2) error(不匹配!)endd = zeros(N, P);if (N P) copies = zeros(1,P); for n = 1:N d(n,:) = sum(x(:, n+copies) - y) .2, 1); endelse copies = zeros(1,N); for p = 1:P d(:,p) = sum(x - y(:, p+copies) .2, 1); endendd = d.0.5;function m = melfb(p, n, fs)% MELFB Determine matrix for a mel-spaced filterbank% Inputs: p number of filters in filterbank 濾波器數(shù)% n length of fft FFT變換的點(diǎn)數(shù)% fs sample rate in Hz 采樣頻率% Outputs: x a (sparse) matrix containing the filterbank amplitudes% size(x) = p, 1+floor(n/2)% Usage: For example, to compute the mel-scale spectrum of a% colum-vector signal s, with length n and sample rate fs:% f = fft(s);% m = melfb(p, n, fs);% n2 = 1 + floor(n/2);% z = m * abs(f(1:n2).2;% z would contain p samples of the desired mel-scale spectrum% To plot filterbanks e.g.:% plot(linspace(0, (12500/2), 129), melfb(20, 256, 12500),% title(Mel-spaced filterbank), xlabel(Frequency (Hz); f0 = 700 / fs;fn2 = floor(n/2);lr = log(1 + 0.5/f0) / (p+1); % convert to fft bin numbers with 0 for DC termbl = n * (f0 * (exp(0 1 p p+1 * lr) - 1); b1 = floor(bl(1) + 1;b2 = ceil(bl(2);b3 = floor(bl(3);b4 = min(fn2, ceil(bl(4) - 1; pf = log(1 + (b1:b4)/n/f0) / lr;fp = floor(pf);pm = pf - fp; r = fp(b2:b4) 1+fp(1:b3);c = b2:b4 1:b3 + 1;v = 2 * 1-pm(b2:b4) pm(1:b3); m = sparse(r, c, v, p, 1+fn2);function r = mfcc(s, fs) % s聲音信號(hào)的向量 fs取樣頻率% MFCC% Inputs: s contains the signal to analize% fs is the sampling rate of the signal% Output: r contains the transformed signalm = 100;n = 256;l = length(s);nbFrame = floor(l - n) / m) + 1;for i = 1:n for j = 1:nbFrame M(i, j) = s(j - 1) * m) + i); endendh = hamming(n);M2 = diag(h) * M;for i = 1:nbFrame frame(:,i) = fft(M2(:, i);endt = n / 2;tmax = l / fs;m = melfb(20, n, fs);n2 = 1 + floor(n / 2);z = m * abs(frame(1:n2, :).2;r = dct(log(z);function r = vq
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 營(yíng)養(yǎng)缺乏與甲狀腺功能
- 企業(yè)培訓(xùn)年度總結(jié)課件
- 英語(yǔ)九年級(jí)全一冊(cè)作文范文(21篇)
- 餐飲行業(yè)品牌營(yíng)銷與技術(shù)合作合同
- 車輛借用與代駕服務(wù)協(xié)議合同
- 車輛抵押貸款合同爭(zhēng)議解決條款
- 餐飲廢棄物處理與城市景觀美化項(xiàng)目合同
- 草莓種子種植技術(shù)專利授權(quán)與銷售合同
- 車庫(kù)租賃與車位租賃合同模板
- 金融理財(cái)產(chǎn)品銷售代理合同參考文本
- 2025年新高考1卷(新課標(biāo)Ⅰ卷)英語(yǔ)試卷
- 河北省滄州市2023-2024學(xué)年七年級(jí)下學(xué)期期末數(shù)學(xué)試題(冀教版)
- 金屬與石材幕墻工程技術(shù)規(guī)范-JGJ133-2013含條文說(shuō)
- 一二年級(jí)-數(shù)獨(dú)游戲課件
- 問(wèn)題解決型護(hù)理品管圈QCC成果匯報(bào)之提高痰標(biāo)本采集合格率
- 物業(yè)公司戰(zhàn)略合作協(xié)議范本
- 電網(wǎng)公司項(xiàng)目管理標(biāo)準(zhǔn)手冊(cè)
- 中央空調(diào)多聯(lián)機(jī)系統(tǒng)施工組織設(shè)計(jì)
- 衛(wèi)生值日表格源碼文件可編輯可修改
- ASTM B344-20 電加熱元件用拉制或軋制鎳鉻及鎳鉻鐵合金標(biāo)準(zhǔn)規(guī)范
- 《石油化工企業(yè)儲(chǔ)運(yùn)罐區(qū)罐頂油氣連通安全技術(shù)要求》
評(píng)論
0/150
提交評(píng)論