非特定人語(yǔ)音識(shí)別_第1頁(yè)
非特定人語(yǔ)音識(shí)別_第2頁(yè)
非特定人語(yǔ)音識(shí)別_第3頁(yè)
非特定人語(yǔ)音識(shí)別_第4頁(yè)
非特定人語(yǔ)音識(shí)別_第5頁(yè)
已閱讀5頁(yè),還剩12頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

中國(guó)地質(zhì)大學(xué)(武漢)專業(yè)綜合實(shí)習(xí)報(bào)告基于非孤立人語(yǔ)音識(shí)別的MFCC特征識(shí)別及DTW算法姓名:王鈺龍1課題的背景和意義語(yǔ)音識(shí)別技術(shù),也被稱為自動(dòng)語(yǔ)音識(shí)別AutomaticSpeechRecognition,(ASR),其目標(biāo)是將人類的語(yǔ)音中的詞匯內(nèi)容轉(zhuǎn)換為計(jì)算機(jī)可讀的輸入。語(yǔ)音識(shí)別以語(yǔ)音為研究對(duì)象,它是語(yǔ)音信號(hào)處理的一個(gè)重要研究方向,是模式識(shí)別的一個(gè)分支。語(yǔ)音識(shí)別的研究涉及微機(jī)技術(shù)、人工智能、數(shù)字信號(hào)處理、模式識(shí)別、聲學(xué)、語(yǔ)言學(xué)和認(rèn)知科學(xué)等許多學(xué)科領(lǐng)域,是一個(gè)多學(xué)科綜合性研究領(lǐng)域。根據(jù)在不同限制條件下的研究任務(wù),產(chǎn)生了不同的研究領(lǐng)域。這些領(lǐng)域包括:根據(jù)對(duì)說(shuō)話人說(shuō)話方式的要求,可分為孤立字(詞)、連接詞和連續(xù)語(yǔ)音識(shí)別系統(tǒng);根據(jù)對(duì)說(shuō)話人的依賴程度,可分為特定人和非特定人語(yǔ)音識(shí)別系統(tǒng);根據(jù)詞匯量的大小,可分為小詞匯量、中等詞匯量、大詞匯量以及無(wú)限詞匯量語(yǔ)音識(shí)別系統(tǒng)。隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,語(yǔ)音識(shí)別技術(shù)也取得突破性的成就,人與機(jī)器用自然語(yǔ)言進(jìn)行對(duì)話的夢(mèng)想逐步接近實(shí)現(xiàn)。語(yǔ)音識(shí)別技術(shù)的應(yīng)用范圍極為廣泛,不僅涉及到日常生活的方方面面,在軍事領(lǐng)域也發(fā)揮著極其重要的作用。它是信息社會(huì)朝著智能化和自動(dòng)化發(fā)展的關(guān)鍵技術(shù),使人們對(duì)信息的處理和獲取更加便捷,從而提高人們的工作效率。同時(shí)語(yǔ)音識(shí)別最重要的技術(shù)就是如何在輸入信號(hào)中提取到正確的語(yǔ)音信號(hào),并正確的經(jīng)過(guò)匹配與比對(duì)從模板庫(kù)里找出最接近的信息顯示出來(lái)。本課題是研究非孤立人語(yǔ)音識(shí)別,不限制對(duì)象,詞匯量較少。課題從最基礎(chǔ)的識(shí)別孤立字開始,這是語(yǔ)音識(shí)別最基礎(chǔ)的部分,奠定了完整識(shí)別整個(gè)句子的基礎(chǔ)。本課題還解決了針對(duì)不同對(duì)象的語(yǔ)音識(shí)別技術(shù),符合大規(guī)模應(yīng)用的條件。課題中的MFCC(梅爾倒譜系數(shù))是常用的提取信號(hào)特征的一種算法,DTW(DynamicTimeWarping,動(dòng)態(tài)時(shí)間歸整)算法)更是很早就應(yīng)用與孤立字識(shí)別的一種比較完善的算法。將二者組合起來(lái)能完成非孤立字的語(yǔ)音識(shí)別。在說(shuō)話人識(shí)別系統(tǒng)中特征提取是最重要的一環(huán),特征提取就是從語(yǔ)音信號(hào)中提取出表示說(shuō)話人個(gè)性的基本特征,同時(shí)還要盡量去除語(yǔ)音信號(hào)中的噪聲信息,提高識(shí)別的精度。在理想情況下,這些特征應(yīng)該具有如下特點(diǎn):能夠有效地區(qū)分不同的說(shuō)話人,但又能在同一說(shuō)話人的語(yǔ)音發(fā)聲變化時(shí)相對(duì)保持穩(wěn)定;易于從語(yǔ)音信號(hào)中提??;不易被模仿;盡量不隨時(shí)間和空間變化。在人類的聽覺(jué)系統(tǒng)中,人耳中的耳蝸起了很關(guān)鍵的作用,其實(shí)質(zhì)上相當(dāng)于一個(gè)濾波器組。當(dāng)聲音傳入耳蝸時(shí),耳蝸內(nèi)流體壓強(qiáng)會(huì)發(fā)生變化,從而引起行波沿基底膜傳播,由于聲音的不同頻率沿著基底膜的分布是對(duì)數(shù)型的,因此耳蝸的濾波作用相當(dāng)于在一個(gè)非線性頻率尺度上進(jìn)行。耳蝸的這種非線性頻率尺度上的濾波作用,使人耳對(duì)低頻信號(hào)比對(duì)高頻信號(hào)更敏感。人耳的這種特性在語(yǔ)音識(shí)別中得到了廣泛的應(yīng)用。Mel頻標(biāo)倒譜參數(shù)(MelFrequencyCepstralCoefficient,簡(jiǎn)稱MFCC)特征是目前使用最廣泛的語(yǔ)音特征之一,具有計(jì)算簡(jiǎn)單、區(qū)分能力好等突出優(yōu)點(diǎn),因而常常成為許多實(shí)際識(shí)別系統(tǒng)的首選。2語(yǔ)音識(shí)別基礎(chǔ)原理語(yǔ)音信號(hào)分析可分為時(shí)域、頻域、倒譜域等方法。語(yǔ)音中最重要的感知特性反應(yīng)在其功率譜中,相位變化只起到很小的作用,所以更為有效的是圍繞頻域來(lái)進(jìn)行的。時(shí)域波形容易隨外界環(huán)境變化,但語(yǔ)音信號(hào)的頻譜對(duì)外界環(huán)境變化具有一定的頑健性,頻譜有非常明顯的聲學(xué)特性,利用頻域分析獲取的語(yǔ)音特征具有實(shí)際的物理意義。如共振峰參數(shù),基音周期。倒譜域是將對(duì)數(shù)功率譜進(jìn)行反傅里葉變換后得到,進(jìn)一步講聲道特性和激勵(lì)特性有效的分開,因此可以更好的解釋語(yǔ)音信號(hào)的特征。語(yǔ)音識(shí)別系統(tǒng)構(gòu)建過(guò)程整體上包括兩大部分:訓(xùn)練和識(shí)別。訓(xùn)練通常是離線完成的,對(duì)預(yù)先收集好的海量語(yǔ)音、語(yǔ)言數(shù)據(jù)庫(kù)進(jìn)行信號(hào)處理和知識(shí)挖掘,獲取語(yǔ)音識(shí)別系統(tǒng)所需要的“聲學(xué)模型”和“語(yǔ)言模型”。識(shí)別過(guò)程通常又可以分為“前端”和“后端”兩大模塊:“前端”模塊主要的作用是進(jìn)行端點(diǎn)檢測(cè)(去除多余的靜音和非說(shuō)話聲)、降噪、特征提取等;“后端”模塊的作用是利用訓(xùn)練好的“聲學(xué)模型”和“語(yǔ)言模型”對(duì)用戶說(shuō)話的特征向量進(jìn)行統(tǒng)計(jì)模式識(shí)別(又稱“解碼”),得到其包含的文字信息,此外,后端模塊還存在一個(gè)“自適應(yīng)”的反饋模塊,可以對(duì)用戶的語(yǔ)音進(jìn)行自學(xué)習(xí),從而對(duì)“聲學(xué)模型”和“語(yǔ)音模型”進(jìn)行必要的“校正”,進(jìn)一步提高識(shí)別的準(zhǔn)確率。本課題的研究過(guò)程如下圖(a)所示語(yǔ)音數(shù)據(jù)的錄入預(yù)加重端點(diǎn)檢測(cè)(VAD)特征參數(shù)的提取~nr~通用模板的建立~nr~DTW匹配~nr~識(shí)別結(jié)束圖(a)計(jì)評(píng)

EHigh計(jì)評(píng)

EHigh續(xù)幾廄明能井大3.VAD端點(diǎn)檢測(cè)語(yǔ)音活動(dòng)檢測(cè)(VoiceActivityDetection,VAD又稱語(yǔ)音端點(diǎn)檢測(cè),語(yǔ)音邊界檢測(cè)。目的是從聲音信號(hào)流里識(shí)別和消除長(zhǎng)時(shí)間的靜音期。在本課題中VAD檢測(cè)出語(yǔ)音段的起始幀與結(jié)束幀,為下一步的提取語(yǔ)音的MFCC參數(shù)提供便利??梢詫⒁欢握Z(yǔ)音片段分為靜音段、過(guò)度段、語(yǔ)音段、結(jié)束。比較常用的VAD技術(shù)是基于短時(shí)能量和過(guò)零率的雙門限端點(diǎn)檢測(cè)。分別對(duì)短時(shí)能量和過(guò)零率設(shè)置兩個(gè)門限值energy_low,energy_high和zcr_low,zcr_highenergy_high>energy_lowzcr_high>zcr_low計(jì)算一幀的短時(shí)能量enegry和過(guò)零率zcr若enegry>energy_low&&zcr>zcr_low,則進(jìn)入過(guò)度段計(jì)算一幀的短時(shí)能量和過(guò)零率,若enegry>energy_high&&zcr>zcr_high,此時(shí)還不能斷定語(yǔ)音開始,繼續(xù)計(jì)算幾幀短時(shí)能量和過(guò)零率,若enegry>energy_high&&zcr>zcr_high,則可判定語(yǔ)音開始。VAD語(yǔ)音端點(diǎn)檢測(cè)流程圖如下圖(b所示)<開始]220:82£62ArrayEditor-wdHart-4'220:82£62ArrayEditor-wdHart-4'AirrayEditor-wsdjend"sE電i色含■『■gk:|昭史二?杏向舊偉動(dòng)

3物或到用陶點(diǎn)茂疵i與念間陌小十杏圖(b)在做端點(diǎn)檢測(cè)之前要用漢明窗進(jìn)行分幀,同時(shí)分幀的幀長(zhǎng)和幀移必須要統(tǒng)實(shí)驗(yàn)結(jié)果

四:梅爾頻率倒譜系數(shù)(MFCC)耳蝸實(shí)質(zhì)上相當(dāng)于一個(gè)濾波器組,耳蝸的濾波作用是在對(duì)數(shù)頻率尺度上進(jìn)行的,在1000HZ下,人耳的感知能力與頻率成線性關(guān)系;而在1000HZ以上,人耳的感知能力與頻率不構(gòu)成線性關(guān)系,而更偏向于對(duì)數(shù)關(guān)系,這就使得人耳對(duì)低頻信號(hào)比高頻信號(hào)更敏感。Mel頻率的提出是為了方便人耳對(duì)不同頻率語(yǔ)音的感知特性的研究。頻率與Mel頻率的轉(zhuǎn)換公式為:F(mel)=2595*log10(1+f(hz)/700)(F(mel)=2595*log10(1+f(hz)/700)(如圖c)圖(c)MFCC在一定程度上模擬了人耳對(duì)語(yǔ)音的處理特點(diǎn),應(yīng)用了人耳聽覺(jué)感知方面的研究成果,采用這種技術(shù)語(yǔ)音識(shí)別系統(tǒng)的性能有一定提高。MFCC參數(shù)的提取的基本流程如圖(d)語(yǔ)音輸入—> 預(yù)加重 >分幀加窗 >語(yǔ)音輸入—> 預(yù)加重 >分幀加窗 >FFT變換 —>MEL濾波求對(duì)數(shù)能量一階差分合并得到最后的MFCC圖(d)1、 預(yù)加重處理預(yù)加重處理其實(shí)是一個(gè)高通濾波器,該高通濾波順的傳遞函數(shù)為:H(牛lSfVvW-*其中的取值為0.97,該高通濾波器作用是濾去低頻,使語(yǔ)音信號(hào)的高頻特性更加突現(xiàn)。2、 分幀及加窗處理由于語(yǔ)音信號(hào)只在較短的時(shí)間內(nèi)呈現(xiàn)平穩(wěn)性(一般認(rèn)為10-30ms),因此將語(yǔ)音信號(hào)劃分為一個(gè)一個(gè)的短時(shí)段即一幀。同時(shí)為避免丟失語(yǔ)音信號(hào)的動(dòng)態(tài)信息,相鄰幀之間要有一段重疊區(qū)域,重疊區(qū)域一段為幀長(zhǎng)的1/2或1/3。然后再將每幀乘上窗函數(shù),以增加每幀左端和右端的連續(xù)性。本次課題我們使用的是漢明窗3、 各幀信號(hào)的FFT變換對(duì)分幀加窗后的各幀信號(hào)進(jìn)行FFT變換得到各幀的頻譜。并對(duì)語(yǔ)音信號(hào)的頻譜取模平方得到語(yǔ)音信號(hào)的功率譜。4、 三角濾波器系數(shù)的求取定義若干個(gè)帶通三角濾波器(k),0<=m<=M,M為濾波器個(gè)數(shù),其中心頻率為f(m),且滿足Mel(f(m))-Mel(f(m-1))=Mel(f(m+1))-Mel(f(m))求得濾波系數(shù)為m(i),i=1,…,p,p為濾波器階數(shù)5、 三角濾波并進(jìn)行離散余弦變換DCTC(i)即為所要求提取的特征參數(shù)。實(shí)驗(yàn)截圖1*100矩陣的MFCC參數(shù)矩陣非孤立人相同發(fā)音內(nèi)容的MFCC參數(shù)矩陣

ZQ鼻處?1』A田ms□阜I234sb3aDTh1214ifi1713■:i.DfiazyaazdW朋邛心KM-■DLW?S■10FWMMTlMBA?制可-Z912ZZZ439TrPIWIEE31.9953anawHj■1K59-19Rid?gW4-M2D13^■5-IDUUIAaMW-1QM199Z7D3MOM7.7M1M>51■2.W313EQBZ5■1252W?由MX-mono丘頃&-1頊MQAU5■5MU5.1Q1*1J4跆汕34□洶auui-GL4I2&.1臨77心Ml-7.nas?7.371S煩寤4J51BOJS-£lU!H&相H11.^112-7.K27gm1.U54■<2224沁雌1.1izrnr-?1jS231■7-53Bmu-13JWW51d-■4W?-ijiaw■<DMJ53W9?g7■DLIZW4DIMI加g-1^4224?■慚aE■與如■4M1Z■MW!■<?JP也翊9H獎(jiǎng)中Z?2B9T37ZTSM-31S39QEM*?脾*-T.'STW玷河Z7HO-mW-342W?.7ZMMM?-MWDLKF-l.MK■ftiQg拓*-263^■UAt22MfiW■UMfll■&517*&瑚M-1W7J1.4*321.1416?2&5M-J.l10JaJCrU3皿計(jì)■40072.敏蹄1■2婭;?13皿&■a』辿“7,4725i&7制-7.23-S2A14M1漓a?i7-I.E?Q3;-iJ11非,渤皿跑-1&蘇14-7.K5J-15u4422-SJ77?■7.1646&召旺白lgaxs1?&7?1.1447-L734F-u12M.77%1HELI蟲IT-1Q.UKI-■ira&a■idjaam-S.-SWd?丑毋11■Aima.-swa口加di.auaELBE9TUUJD-I.MMi-1.1193M17BDli?-H5HI7■132371"ZM■MZ53■iFITBRD73T電1琳3JQ9-12G.7D9I■Mffl■mwDOBM-maaiw福ew434119■Z3WB-10ERM■17.WM山*并1.1MHIXWi??叫職■D.M21-H14SNJ?庠*■17J4K453:坨"中2.73MU7ii-1J154心統(tǒng)11.J541-aiMH2J-據(jù)枷1-JJ^5■1134412^1M瀏-WE-ae^u2.1總1742漩*0籃了泌-ueau-7J02T?DJ印1■1.H12-417S3旨1骯<4,心1網(wǎng)M最2JS.-5T5&-E-SfliSi-11.O3U-1L27D5-i.UBaa■d.T&TdHzan-1UKM6l.aias■1IfidTIJJ2T1■MTTi-I.EMd.l.£S?iaram3J1?4a-7.7U52SIM39-HWW-343ZI-IO-jOB!蚓J■awn-12311*MW-IBM】■awiT11971SC211931?B55O9-iami-&Z3MWW1-IDLW3D-ami?-7S3M--G43M■2.771M-DLD39ZT.sfire-1JE小做渤?10<143414岫6曜?女的沁?境m■0.IW1邱職.1H淘,-7.4J45.7.陷?!?.7(24?1114S4』是IM-1.425&D.t-230WSUfiiTJ-1112570.汕苗?21□枷L3111?幻俗6■1.K27.Zi^bi■332再-M133atH6£i.&47J7-a?im4kJwiimiifiIT3CT7A.Dcmn.1』V!3JIMK?5.a〔X.713CR.3■nmi.DRUD.*8fD3DT-AI77dcnviiFiYBTn3MUC.nru?D-HIWWnc非孤立人相同發(fā)音一段語(yǔ)音的MFCC參數(shù)5.DTW算法在非孤立人語(yǔ)音識(shí)別中的應(yīng)用DynamicTimeWarping(動(dòng)態(tài)時(shí)間歸整)是一種衡量?jī)蓚€(gè)長(zhǎng)度不同的時(shí)間序列的相似度的方法。應(yīng)用也比較廣,主要是在模板匹配中,比如說(shuō)用在孤立詞語(yǔ)音識(shí)別(識(shí)別兩段語(yǔ)音是否表示同一個(gè)單詞),手勢(shì)識(shí)別,數(shù)據(jù)挖掘和信息檢索等中。在非孤立人語(yǔ)音識(shí)別中DTW算法要?dú)G使用兩次。一次是對(duì)語(yǔ)音模板提取通用模板的時(shí)候使用,另一次就是測(cè)試語(yǔ)音的時(shí)候進(jìn)行DTW匹配。DTW的基本原理:假定一個(gè)孤立字(詞)語(yǔ)音識(shí)別系統(tǒng),利用模板匹配法進(jìn)行識(shí)別。這時(shí)一般是把整個(gè)單詞作為識(shí)別單元。在訓(xùn)練階段,用戶將詞匯表中的每一個(gè)單詞說(shuō)一遍,提取特征后作為一個(gè)模板,存入模板庫(kù)。在識(shí)別階段,對(duì)一個(gè)新來(lái)的需要識(shí)別的詞,也同樣提取特征,然后采用DTW算法和模板庫(kù)中的每一個(gè)模板進(jìn)行匹配,計(jì)算距離。求出最短距離也就是最相似的那個(gè)就是識(shí)別出來(lái)的字了。在時(shí)間序列中,需要比較相似性的兩段時(shí)間序列的長(zhǎng)度可能并不相等,在語(yǔ)音識(shí)別領(lǐng)域表現(xiàn)為不同人的語(yǔ)速不同。因?yàn)檎Z(yǔ)音信號(hào)具有相當(dāng)大的隨機(jī)性,即使同一個(gè)人在不同時(shí)刻發(fā)同一個(gè)音,也不可能具有完全的時(shí)間長(zhǎng)度。而且同一個(gè)單詞內(nèi)的不同音素的發(fā)音速度也不同,比如有的人會(huì)把“A”這個(gè)音拖得很長(zhǎng),或者把“i”發(fā)的很短。在這些復(fù)雜情況下,使用傳統(tǒng)的歐幾里得距離無(wú)法有效地求的兩個(gè)時(shí)間序列之間的距離(或者相似性)。例如圖所示,實(shí)線和虛線分別是同一個(gè)詞的兩個(gè)語(yǔ)音波形(在y軸上拉開了,以便觀察)??梢钥吹剿麄冋w上的波形形狀很相似,但在時(shí)間軸上卻是不對(duì)齊的。例如在第20個(gè)時(shí)間點(diǎn)的時(shí)候,實(shí)線波形的a點(diǎn)會(huì)對(duì)應(yīng)于虛線波形的b’點(diǎn),這樣傳統(tǒng)的通過(guò)比較距離來(lái)計(jì)算相似性很明顯不靠譜。因?yàn)楹苊黠@,實(shí)線的a點(diǎn)對(duì)應(yīng)虛線的b點(diǎn)才是正確的。而在圖B中,DTW就可以通過(guò)找到這兩個(gè)波形對(duì)齊的點(diǎn),這樣計(jì)算它們的距離才是正確的。0 10 20 30 40 50 60 70也就是說(shuō),大部分情況下,兩個(gè)序列整體上具有非常相似的形狀,但是這些形狀在x軸上并不是對(duì)齊的。所以我們?cè)诒容^他們的相似度之前,需要將其中一個(gè)(或者兩個(gè))序列在時(shí)間軸下warping扭曲,以達(dá)到更好的對(duì)齊。而DTW就是實(shí)現(xiàn)這種warping扭曲的一種有效方法。DTW通過(guò)把時(shí)間序列進(jìn)行延伸和縮短,來(lái)計(jì)算兩個(gè)時(shí)間序列性之間的相似性。假設(shè)測(cè)試和參考模板分別用T和R表示,為了比較它們之間的相似度,可以計(jì)算它們之間的距離D[T,R],距離越小則相似度越高。為了計(jì)算這一失真距離,應(yīng)從丁和R中各個(gè)對(duì)應(yīng)幀之間的距離算起。設(shè)n和m分別是T和R中任意選擇的幀號(hào),d[T(n),R(m)]表示這兩幀特征矢量之間的距離。為了描述這條路徑,假設(shè)路徑通過(guò)的所有格點(diǎn)依次為(n1,m1),,(n,mj),......,(nN,mM),其中(n1,m1)=(1,1),(nN,mM)=(N,M)。路徑可以用函數(shù)m=Oslash;(n)描述,其中n=i,i=1,2,..….,N,Ø(1)=1,Ø(N)=M。為了使路徑不至于過(guò)傾斜,可以約束斜率在0.5~2的范圍內(nèi),如果路徑已經(jīng)通過(guò)了格點(diǎn)(n,m),那么下一個(gè)通過(guò)的格點(diǎn)(n,m)只可能是下列三種情況之一:如圖表達(dá)為(n,m)=(n+1,m)(n,m)=(n+1,m+1)(n,m)=(n,m+1)用r表示上述三個(gè)約束條件。求最佳路徑的問(wèn)題可以歸結(jié)為滿足約束條件r時(shí),求最佳路徑函數(shù)m=Ø(n),使得沿路徑的積累距離達(dá)到最小值,即:搜索該路徑的方法如下:搜索從(n,m)點(diǎn)出發(fā),可以展開若干條滿足n的路徑,假設(shè)可計(jì)算每條路徑達(dá)到(n,m)點(diǎn)時(shí)的總的積累距離,具有最小累積距離者即為最佳路徑。易于證明,限定范圍的任一格點(diǎn)(n,m)只可能有一條搜索路徑通過(guò)。對(duì)于(ni,mi),其可達(dá)到該格點(diǎn)的

前一個(gè)格點(diǎn)只可能是(n,m)、(n,m-1)和(n,m-2),那么(n,m)一定選擇這3個(gè)距離之路徑延伸而通過(guò)(n,m),這時(shí)此路徑的積累距離為:D[(n,m)]=d[T(n),R(m)]+min{D(n+1,m),D(n+1,m+1),D(n,m+1)}這樣可以從(n,m)=(1,1)出發(fā)搜索(n,m),對(duì)每一個(gè)(n,m)都存儲(chǔ)相應(yīng)的距離,這個(gè)距離是當(dāng)前格點(diǎn)的匹配距離與前一個(gè)累計(jì)距離最小的格點(diǎn)(按照設(shè)定的斜率在三個(gè)格點(diǎn)中進(jìn)行比較)。搜索到(n,m)時(shí),只保留一條最佳路徑。如果有必要的話,通過(guò)逐點(diǎn)向前尋找就可以求得整條路徑。這套DP算法便是DTW算法。DTW算法可以直接按上面描述來(lái)實(shí)現(xiàn),即分配兩個(gè)NxM的矩陣,分別為積累距離矩陣D和幀匹配距離矩陣d,其中幀匹配距離矩陣d(i,j)的值為測(cè)試模板的第i幀與參考模板的第j幀間的距離。D(N,M)即為最佳匹配路徑所對(duì)應(yīng)的匹配距離。實(shí)驗(yàn)截圖:用DTW做完后提取的模板V-DriablirEdd^r-MUEANLUJ?■i如StacieBase[J?Ndvalidinletstar: ,d2J457占9ID11121314121,57654&康4如為-1|.?349■5^1565?1】&事■M955-12.1164^0.1361■11.M33■0.430525J743HL6(M235.1IB121.2435-nJM53-2J5W-^7<7B2.39^51022&3<19775J05WLI3&257.424Q54.31155.5376■。昭函-16.736£l-27^30-6.1SQ2山64如-4.117106.aM7-7.1(W71.7647flQ57449.1637網(wǎng).2明51.4&17心,叫a-12.57M-42299-1G.0036L.&249-16733-a.3fl554.5125?■W37-2W5W1l泌況倒訥位?9.1564-41933&4占婦-7.1522U泌-2.1a?ageeT.V舶-254fiG地后雙23.22945.12.45-畦印EC-9.9b£9-11J92W-2.753?W74-2.9&720J573■J.6&43-0.49&735.76792J.fi37fi23128-13.5543■1^5459-112.57541.9^95-5.2155fi.&osa-3.947052461-12237Z9D233.K3925.54^3.0354■15^557-62037-14SJ56?9朝9■QH137■7.^&5.3073-49&51孔(MS7-111474.011?3?,B23?對(duì)網(wǎng)-17,5774-7.26B1ZJ3B3fi.3B4g-579^1*5921■1X)5170L8B3ID.34網(wǎng)F35,5435■CJ0TD7-1B0T59-B.ZTU7-0.9^5?s.mg■QJS5WCL瑚1125.MX2IjDISS出-17.2T2D4.4T1S2-5.2K?3.5217-0^261M25121.52M-13.5761-7/5315-17.6M5-C.6675-7.&5107.G4262.拍31051430L744ia3&341241.6956書航做-12.O9&9?日湖酉-165觥-6.01as-1.335&■<171?瓦橢5-fi.*77O3.93C30.75S50頌14淪4洶31.2252-ilUtiffi!■95746-1豺頑-4.9049--2.8359'-&7714b.9?Sb-fi.12631皿】生!QJ9573153437513231700,1357■10.9E17-104B65-11619936-^3193■1.3116■£.3730fi.47O2-526615.126327676?021。16胡4235詛MS-11.5395-1M653-1401692J734-3.2O&3B.29-25-J9頓JI773129WI-0877不同發(fā)音內(nèi)容的非孤立人語(yǔ)音模板(42*24)矩陣6.LLE降維算法LLE(LocallyLinearEmbedding)算法,即局部線性嵌入算法。該算法是針對(duì)韭線性信號(hào)特征矢量維數(shù)的優(yōu)化方法,這種維數(shù)優(yōu)化并不是僅僅在數(shù)量上簡(jiǎn)單的約簡(jiǎn),而是在保持原始數(shù)據(jù)性質(zhì)不變的情況下,將高維空間的信號(hào)映射到低維空間上,即特征值的二次提取算法的第一步是計(jì)算出每個(gè)樣本點(diǎn)的k個(gè)近鄰點(diǎn)。把相對(duì)于所求樣本點(diǎn)距離最近的k個(gè)樣本點(diǎn)規(guī)定為所求樣本點(diǎn)的個(gè)近鄰點(diǎn)。k是一個(gè)預(yù)先給定值。SamT.Roweis和LawrenceK.Saul算法采用的是歐氏距離,則減輕復(fù)雜的計(jì)算。然而本文是假定高維空間中的數(shù)據(jù)是非線性分布的,采用了diijstra距離。Dijkstra距離是一種測(cè)地距離,它能夠保持樣本點(diǎn)之間的曲面特性,在ISOMAP算法中有廣泛的應(yīng)用。針對(duì)樣本點(diǎn)多的情況,普通的dijkstra算法不能滿足LLE算法的要求。LLE算法的第二步是計(jì)算出樣本點(diǎn)的局部重建權(quán)值矩陣。這里定義一個(gè)誤差函數(shù),如下所示:min£(礦)二旗灼其中為志的k個(gè)近鄰點(diǎn),是毛與孔之間的權(quán)值,且要滿足條件:。這里求取W矩陣,需要構(gòu)造一個(gè)局部協(xié)方差矩陣將上式與三J-L神i二1相結(jié)合,并采用拉格朗日乘子法,即可求出局部最優(yōu)化重建權(quán)值矩陣:在實(shí)際運(yùn)算中,0可能是一個(gè)奇異矩陣,此時(shí)必須正則化^',如下所示:其中r是正則化參數(shù),I是一個(gè)kxk的單位矩陣。LLE算法的最后一步是將所有的樣本點(diǎn)映射到低維空間中。映射條件滿足如下所示:皿說(shuō)礦>=、巧—里港為=-1j-i其中,或。為損失函數(shù)值,田是%的輸出向量,片"二1幻??才)是M的k個(gè)近鄰點(diǎn),且要滿足兩個(gè)條件,即:其中I是心網(wǎng)的單位矩陣。這里的心= 可以存儲(chǔ)在心N的稀疏矩陣w中,當(dāng)勺是%的近鄰點(diǎn)時(shí),用,廣,否則,吼廣'。則損失函數(shù)可重寫為:皿KF)=£三昭.5字其中M是一個(gè)"N的對(duì)稱矩陣,其表達(dá)式為:y時(shí)(人即)要使損失函數(shù)值達(dá)到最小,則取Y為M的最小m個(gè)非零特征值所對(duì)應(yīng)的特征向量。在處理過(guò)程中,將M的特征值從小到大排列,第一個(gè)特征值幾乎接近于零,那么舍去第一個(gè)特征值。通常取第2~既+1間的特征值所對(duì)應(yīng)的特征向量作為輸出結(jié)果。實(shí)驗(yàn)過(guò)程

EVjfuHhEdibar-X勺芝I心盜驢■SlBCla?■■■!■田%神!dQlm知心1叫,■田.e^rSSOObdM-daublv^1245E7ag祁li1213141S號(hào)Lllgti1C.H4長(zhǎng)10-.7726&的如-1.1574■iXMi?"巾必■1I.W7S4.'jC4i1S.1i4£;24542SB33,907319,71077.3939-ZH4?-1.M72a?i=e-Z33T3■39M-?皿網(wǎng)EM5力-IMZ2.1431ftwaz前4丘JJJjSOaS1心35?M泌IDOl油24.5484女91W11.15562.W77-2.4JCKI1e.Em■438.34^3137671S.3725-1C.ft3370L1.2I?“斗<^14i"J麗口73S56[j&UXi-it■5明騷網(wǎng)小叫17.MW-SDiMmraaTIJW昭岱-12091皿M-I.Z38J!-thwasax6約點(diǎn)段-10.&渤mm5.0730M&1420J13S■IJflQIluoasajaaeoe.海占731TI357ZT.iatJS14.374$-aaiia47M7印心5.91M■1JWZD\7爐TJ5QB-1.33H-O\B35a?9mum2*5^0113W4iI.TTSdnaAaiz3.9B4-5?,1*07■zjoeso47IIM-234B-l.TOT齡gM.泌1名航E1[2.M4a1.7724■a&422M郵£.412(}im曰血泌EllWa.s<Kii-I.??QEeIDmum的切113.W4ii.ma3.9&i-5B41Z0?,1107■ZJM3CIIFIM(?ei-234S■■TOTax113952B1-fl.375&1.7ZM-ft5-U2時(shí)就AMfif?■2J023O3泌a.woi-2.W4S-t.??asi212.>ldU-Q.57Mn.7724隊(duì)那EK<ua?t.7igD田海1-2.244£-I.??Ol受Umux13W4it.b?I.TOd<i5J0a3.9B45■ZJQB30■M3ZDITIIMG.M91丑394fl■■?tawVi擋點(diǎn)E1[跪*1.7724■A&42JM如E.412H<Mfi7I2J323Ot.FlBOa.saai-i.M7QEeT%3*5^-501-4.2750a.TTld2.3ai-5Q.d13UiLI?H712D33i3-DJ37Dd.TIMa.-UHi-J.74dD-i.raflTas1ismux254^501ia.w4iI.T734S9B45B域國(guó)<1*07■2X1250?,7IW(?9i-334B-■tTOTaw17自125E1■U.W4*1.7724■AM22E.412G<M87h.7160-i.MJQEeIB珥的皿112W4it.b?l.?72d-O.M22S9&1-541457-■ZJQ23CIIFIW(?si-2B34fl■'TOTax十夕44.7*53△ChO+W10■衲£巳A祁47mR,瑚&.o-m■tjM&O2^42?■3.?H922DW駐10>.7332-7.M422^4793L77SJ心gM沿湘瞎■tjas&o2.4-427L5回2&21婭m■3S25EH.M31-3.D537■aano耳airarT0^?Z1ZB7瞬日史3JCH35a.*w9z?2.9121■1.W59震罩22土涌沁a.7W3i.m-a14)106117誦騰4?1M創(chuàng)皿.■旺口CJ6842神#-E&fJ神12l£- -I需要做LLE降維的算法的數(shù)據(jù)(5500*24矩陣)當(dāng)我把數(shù)據(jù)進(jìn)行轉(zhuǎn)置并求取LLE降維的時(shí)候發(fā)現(xiàn)其是一個(gè)不可逆的矩陣,在做LLE變換的時(shí)候會(huì)產(chǎn)生奇異矩陣,因此我沒(méi)有轉(zhuǎn)置。雋電■■&ack:Bju>L^1Navdidplc^i^ar:dati2._十□fid^q吒1Ga24daubla?23156?*如111213M151。的叫林45-1JO-343心蜘D5952-02211-0S965!.?]?-DJ223-0.1944DJQ52C-Dj6551Mm-DJM21£?732-0.7364t>.?5220,泗化魏M4J網(wǎng)虹?昉-ajw?0.1244065580.3272-OJOI63-029??0JK22-2.54*&D-.W?OJ^Ki5-MW9-D.7&43-DJMW1J8W5OJM-I-1,7334-14312-DJ(MI2D.52OT1719?5305924254Jt0.14^7-D.I2(H0344J-0.74J1D.gi7io1JM4X:-2.I27U[F.IJ9I]_Z574-12123-D.IIC4W4-lasu:■P,身44D47351加日D.B75D44U0-蜘皿-D-3J37-Di5-MDJ2O3-LUiM口口掐913Q37ZZ22CDJ2446ftM75-1.1304-1J957]-24JM3-0.83702.IIW1就902iW-o■邸g-O.IMfl/"424-口州5-1.IW51J0顧-&^22商電0.WI1J2751.1TO8inui-□^71-D2472-D<jOT7GDXMJG-DZZ^J□^42-1.S4S3DZFOS□247S-DJ^73-D■.海■-WK4□3I6S-aXBJM9Emirs-n.ieoe1jM^0■0.34*3■0J0M4[EM*■024flC-1.7M3-O.I17T-O.lllil■ija-saDSIIJZ.7123145*5id-&J0W30212a■24211-&29-2ag押Mrt找0炭明林砧■22750144iW-0.75241404411■24753■Oflii?■0厘刊OotOC-0J6M4如軸■04JM704225waOfi2?307W05?M■&J0I71■0274212-U.75J3Dj3??-1^547-2jM-M1.1242?1KUDj577GDJJ24HSU-WUI1J0273DJQ447djssia1宓-D34I0r-a.^UM-1.4003221^-1.15^71.翊4-DjCBja-O.IJOI-1.ISTQDuOTTa-ixniaD.FI3Jn.TSTT1.55M-<h374fl■4-3Z492-3JI9IDA30S-0Z1I9O£05T-D.3M9[FJ339口刎。DJO33DJ2BIDJOOZDZ43IDjOMSDjMTa、0.5?化海-1D96I-1.9625-25770-1w79057i?-1D?3aD.547Q3泌「05543&.5o4C£>.54H'61J3XM1J3XM1J3XM1J3XM1J3XM1J3XM1J3XM1J3XMia?flia?fl1J3XM1J3XM1J3XM1J3XM1J3XM,-.16*24矩陣數(shù)據(jù)。K=8在參數(shù)設(shè)置中,近鄰點(diǎn)個(gè)數(shù)k和輸出維數(shù)d都只作為經(jīng)驗(yàn)參數(shù),并沒(méi)有提出很好的理論方法。參數(shù)k和d的選取對(duì)識(shí)別結(jié)果會(huì)有很大影響,如果k值取值太大,LLE算法不能體現(xiàn)局部線性的特性,如果k值取太小,則不能保持樣本點(diǎn)在低維空間的拓?fù)浣Y(jié)構(gòu);如果d選取太大,數(shù)據(jù)易受噪聲影響,如果d選取太小,則不能正確提取樣本數(shù)據(jù)的固有特征。因此在試驗(yàn)中我選取了如圖所示的實(shí)驗(yàn)值測(cè)試:S5 ??LLE■維,?訓(xùn)練款搖和刪試教精SS 禺LLE降維37 - data=temp:88 - datal=lle(data.,8,3):S9 %da-Lal=datal?;go - data2=Lle(data,8,L6):91 - data3=lle(data,5,16):S2

1231235a7m91D111211141的4E2-D*3&■O.Q321a嗎幻D.D1-02m洌也松5■fl.2194fl,EM33D.Q357-BN油-1X2535P-D1T3-&D533-D-P3970,0033<h?+sa<M灑1,5428}EMDs1237-1JS272.7793&27B7B.MM9-2.1^O.261&2.C8320.27034D.fi237-D.frSlB-D.3313-D.D3H2-D.Ti44D.cazs-D.CUTC-1.3MBDll124-a.7W5Oi115405-fi.1072-e.s&T僦曲上WlC.9104-1.7M20.的4-ii.ao7a.■1.575&-1.&525/細(xì)6-&.07G1-e.2545-D.97b6-tk?06a1.352ft-2.2447-C47S3^4763-2.泌1。衛(wèi)永7七.3445-0.66{^0.77110.6^75-1.

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論