數(shù)計(jì)系2023屆畢業(yè)設(shè)計(jì)(論文)模板_第1頁(yè)
數(shù)計(jì)系2023屆畢業(yè)設(shè)計(jì)(論文)模板_第2頁(yè)
數(shù)計(jì)系2023屆畢業(yè)設(shè)計(jì)(論文)模板_第3頁(yè)
數(shù)計(jì)系2023屆畢業(yè)設(shè)計(jì)(論文)模板_第4頁(yè)
數(shù)計(jì)系2023屆畢業(yè)設(shè)計(jì)(論文)模板_第5頁(yè)
已閱讀5頁(yè),還剩4頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

07級(jí)本科畢業(yè)設(shè)計(jì)(論文)題目:※※※※※※※※※※※※※※※系別:數(shù)學(xué)與計(jì)算機(jī)科學(xué)系班級(jí):07計(jì)算機(jī)科學(xué)與技術(shù)(嵌入式方向)學(xué)號(hào):200760861???姓名:※※※指導(dǎo)教師:※※※職稱(chēng)※※※起訖日期:2023年9月28日-2023年3月4日文檔文檔頁(yè)面設(shè)置約定:一律用A4紙規(guī)范打印,左邊距為2.8cm,右邊距為2.2cm,上邊距都為2.5cm,下邊距都為2.4cm。頁(yè)眉、頁(yè)腳邊距分別為1.7cm和1.5cm,奇數(shù)頁(yè)眉內(nèi)容為:××屆××專(zhuān)業(yè)畢業(yè)設(shè)計(jì)(論文),偶數(shù)頁(yè)眉的內(nèi)容為:×××(作者姓名):××××(論文題目),均采用宋體小五號(hào)居中。中、英文摘要各自單獨(dú)一頁(yè),置于目錄頁(yè)之前。頁(yè)碼從正文開(kāi)始編排。本模板未說(shuō)明的格式,參考《三明學(xué)院畢業(yè)設(shè)計(jì)(論文)撰寫(xiě)規(guī)范要求》。題目應(yīng)以簡(jiǎn)明、確切、有概括性的詞語(yǔ)反映文章內(nèi)容。字?jǐn)?shù)要適當(dāng),一般不宜超過(guò)20個(gè)漢字。題目應(yīng)以簡(jiǎn)明、確切、有概括性的詞語(yǔ)反映文章內(nèi)容。字?jǐn)?shù)要適當(dāng),一般不宜超過(guò)20個(gè)漢字。噪聲環(huán)境下語(yǔ)音特征參數(shù)魯棒性的研究張三(三明學(xué)院數(shù)學(xué)與計(jì)算機(jī)科學(xué)系*****專(zhuān)業(yè))摘要:隨著說(shuō)話人識(shí)別技術(shù)的發(fā)展,實(shí)用有效的說(shuō)話人識(shí)別系統(tǒng)越來(lái)越成為研究的重點(diǎn)。語(yǔ)音特征參數(shù)的魯棒性直接影響一個(gè)說(shuō)話人識(shí)別系統(tǒng)的具體性能,過(guò)去主要針對(duì)移動(dòng)通信環(huán)境下存在信道失真的問(wèn)題,研究差分倒譜的魯棒性。文中則主要在加性白噪聲環(huán)境下研究Mel倒譜參數(shù)、Mel差分倒譜參數(shù)的頑健性以及它們經(jīng)過(guò)倒譜系數(shù)零均值化(CMN)處理后識(shí)別性能的改進(jìn)。從仿真結(jié)果可以看出:在加性白噪聲環(huán)境下,差分倒譜參數(shù)具有很好的魯棒性;倒譜系數(shù)零均值化能有效的除去加性白噪聲。關(guān)鍵詞:魯棒性;Mel倒譜參數(shù);Mel差分倒譜;倒譜系數(shù)零均值化設(shè)計(jì)(論文)題目為四號(hào)黑體字,可以分為1或2行居中打??;設(shè)計(jì)(論文)題目下空一行打印作者姓名(單獨(dú)一行,小四號(hào)宋體,居中);下行打印“三明學(xué)院XX級(jí)XX專(zhuān)業(yè)”設(shè)計(jì)(論文)題目為四號(hào)黑體字,可以分為1或2行居中打印;設(shè)計(jì)(論文)題目下空一行打印作者姓名(單獨(dú)一行,小四號(hào)宋體,居中);下行打印“三明學(xué)院XX級(jí)XX專(zhuān)業(yè)”(五號(hào)宋體,居中);再下行打印摘要。[摘要]二字為小四號(hào)黑體,“摘要:”二字后空一格打印內(nèi)容(五號(hào)仿宋體);摘要內(nèi)容下空一行打印關(guān)鍵字,“關(guān)鍵字:”三字為小四號(hào)黑體,其后的內(nèi)容為五號(hào)宋體,每?jī)蓚€(gè)關(guān)鍵字之間空兩格。英文摘要題目和關(guān)鍵字全部采用小四號(hào)Arial字體,摘要內(nèi)容和關(guān)鍵字內(nèi)容均用五號(hào)Arial字體。英文摘要與關(guān)鍵字附文末。摘要字?jǐn)?shù)一般不超過(guò)400字。關(guān)鍵詞之間用分號(hào)隔開(kāi)。注:所有文字內(nèi)容僅做樣板。TheInvestigationoftheRobustofFeatureExtractedfromSpeechSignalsinAdditiveGaussianNoiseEnvironmentsZhangSan2006ComputerScienceandTechnologyMajor,DepartmentofMathematicsandComputerScience,SanmingUniversityAbstract:Withincreasingdemandforsecurityininformationsystem.thedevelopmentofeffectivespeakerrec.ognitiontechnologiesisveryimpo~ant.Therobustoffeatureextractedfromspeechsignalshasadirectinfluenceonrecognitionsystem.Inthepast,underthecircumstanceofchanneldistortion,deltacepstrumhasbeenwidelystudied.ThispaperfocusesontherobustoffeatureinadditiveGaussiannoiseenvironments.ExperimentsshowthatdeltacepstrumiSrobustfeaturesinadditiveGaussiannoiseenvironments.a(chǎn)ndthatCMN(cepstralmeannormaliza.tion)canefectivelyremovetheeffectsofadditiveGaussiannoise.Keywords:Robust;Melcepstrum;Meldeltacepstrum;Cepstralmeannormalizatio目錄第一章緒論11.1語(yǔ)音識(shí)別簡(jiǎn)介1什么是語(yǔ)音識(shí)別11.1.2語(yǔ)音識(shí)別的應(yīng)用及分類(lèi)11.2國(guó)內(nèi)外語(yǔ)音識(shí)別技術(shù)的發(fā)展歷史及現(xiàn)狀11.3語(yǔ)音識(shí)別面臨的問(wèn)題21.4本課題研究背景及內(nèi)容2第二章語(yǔ)音識(shí)別基礎(chǔ)理論42.1語(yǔ)音信號(hào)產(chǎn)生的機(jī)理[6]42.2語(yǔ)音信號(hào)的預(yù)處理42.2.1預(yù)濾波、采樣、A/D轉(zhuǎn)換42.2.2預(yù)加重52.2.3分幀加窗52.3端點(diǎn)檢測(cè)62.3.1短時(shí)能量62.3.2短時(shí)平均過(guò)零率7第三章常用的語(yǔ)音識(shí)別模型8第四章噪聲下語(yǔ)音特征參數(shù)的提取識(shí)別9第五章結(jié)論10致謝11參考文獻(xiàn):12目錄生成方法:使用“插入”菜單-“引用”-“索引和目錄”命令產(chǎn)生(前提:目錄生成方法:使用“插入”菜單-“引用”-“索引和目錄”命令產(chǎn)生(前提:正文中的各級(jí)標(biāo)題要使用樣式),目錄中的標(biāo)題、頁(yè)碼應(yīng)與正文對(duì)應(yīng)。目錄單獨(dú)一頁(yè),目錄二字用四號(hào)黑體字,下空二行為章、節(jié)、小節(jié)及其開(kāi)始頁(yè)碼,采用小四號(hào)宋體。頁(yè)碼放在行末,目錄內(nèi)容和頁(yè)碼之間用虛線連接。第一章緒論語(yǔ)言,是人類(lèi)進(jìn)行行為溝通和思想交流最重要的工具[1],也是人類(lèi)最重要的信息載體。隨著信息科技的快速發(fā)展,計(jì)算機(jī)的越來(lái)越便攜化和應(yīng)用的復(fù)雜化,在越來(lái)越多的領(lǐng)域有了讓計(jì)算機(jī)聽(tīng)懂人言的要求,這樣,就引出了語(yǔ)音處理技術(shù)這門(mén)交叉學(xué)科。語(yǔ)音識(shí)別技術(shù),是語(yǔ)音處理技術(shù)中的一個(gè)重要組成。各級(jí)標(biāo)題使用樣式進(jìn)行設(shè)置。每章標(biāo)題以小四號(hào)黑體字居中打??;“章”下空一行為“節(jié)各級(jí)標(biāo)題使用樣式進(jìn)行設(shè)置。每章標(biāo)題以小四號(hào)黑體字居中打印;“章”下空一行為“節(jié)”,以小四號(hào)黑體左起打??;“節(jié)”下空一行為“小節(jié)”,以五號(hào)宋體左起打印,換行打印設(shè)計(jì)(論文)正文。正文及參考文獻(xiàn)英文字體為T(mén)imesNewRoman.1.1.1什么是語(yǔ)音識(shí)別正文采用五號(hào)宋體字打印,行間距為固定值:20磅,字間距為默認(rèn)值;正文層次標(biāo)題序號(hào)依次為“1”、“1.1”正文采用五號(hào)宋體字打印,行間距為固定值:20磅,字間距為默認(rèn)值;正文層次標(biāo)題序號(hào)依次為“1”、“1.1”、“1.1.1語(yǔ)音識(shí)別的應(yīng)用及分類(lèi)語(yǔ)音識(shí)別的應(yīng)用范圍十分廣泛,遍及各行各業(yè)。如智能家居、語(yǔ)音撥號(hào)、信息通訊、自動(dòng)應(yīng)答系統(tǒng)、工業(yè)控制、機(jī)器人、交通導(dǎo)航等等。語(yǔ)音識(shí)別是一門(mén)新興的交叉性學(xué)科,它廣泛涉及聲學(xué)、語(yǔ)音學(xué)、語(yǔ)言學(xué)、數(shù)字信號(hào)處理、通信學(xué)、網(wǎng)絡(luò)技術(shù)、電子技術(shù)、計(jì)算機(jī)科學(xué)、模式識(shí)別和人工智能等眾多學(xué)科。如前所述,語(yǔ)音識(shí)別系統(tǒng)有廣義和狹義之分,這里所討論的語(yǔ)音識(shí)別分類(lèi)特針對(duì)狹義的語(yǔ)音識(shí)別而言。從不同角度,語(yǔ)音識(shí)別系統(tǒng)可以分為以下幾類(lèi):按詞匯量大小,可分為小詞匯量、中等詞匯量、大詞匯量及無(wú)限詞匯量語(yǔ)音識(shí)別系統(tǒng);按對(duì)說(shuō)話人的依賴(lài)程度可以分為特定人和非特定人語(yǔ)音識(shí)別系統(tǒng);按對(duì)說(shuō)話人說(shuō)話方式的要求,可以分為孤立詞語(yǔ)音識(shí)別系統(tǒng)、連接詞語(yǔ)音識(shí)別系統(tǒng)及連續(xù)語(yǔ)音識(shí)別系統(tǒng);按識(shí)別的目的來(lái)分,可以分為說(shuō)話人語(yǔ)音識(shí)別系統(tǒng)和語(yǔ)音內(nèi)容理解的語(yǔ)音識(shí)別系統(tǒng)。1.2國(guó)內(nèi)外語(yǔ)音識(shí)別技術(shù)的發(fā)展歷史及現(xiàn)狀語(yǔ)音識(shí)別的歷史可以追溯到20世紀(jì)50年代。1952年AT&TBell實(shí)驗(yàn)室的確K.H.Davis等人利用帶通濾波器進(jìn)行語(yǔ)音頻譜的分析和匹配,并成功用于對(duì)10個(gè)英文數(shù)字的識(shí)別,識(shí)別率達(dá)到98%。1960年P(guān).Denes等研制成功第一個(gè)計(jì)算機(jī)語(yǔ)音識(shí)別系統(tǒng),同年G.Fant提出了語(yǔ)音產(chǎn)生的聲源——濾波器模型,對(duì)語(yǔ)音識(shí)別工作起到了巨大的推動(dòng)作用。20世紀(jì)60年代末、70年代初線性預(yù)測(cè)(LinearPrediction,LP)技術(shù)和動(dòng)態(tài)時(shí)間規(guī)整算法(DynamicTimeWarping,DTW)被成功引入到語(yǔ)音信號(hào)處理中,有效地解決了語(yǔ)音的特征提取和不定長(zhǎng)匹配的動(dòng)態(tài)時(shí)間對(duì)準(zhǔn)問(wèn)題。此時(shí)期的研究以孤立字語(yǔ)音識(shí)別為主。20世紀(jì)80年代語(yǔ)音識(shí)別研究進(jìn)一步走向深入,其研究重點(diǎn)是連接詞語(yǔ)音識(shí)別,用于連接詞識(shí)別的分層構(gòu)筑技術(shù)(levelbuilding)得到發(fā)展。另一個(gè)重要的發(fā)展是語(yǔ)音識(shí)別算法從模板匹配技術(shù)發(fā)展到基于統(tǒng)計(jì)模型的技術(shù)。期間,美國(guó)CMU大學(xué)的J.K.Baker等人將隱馬爾可夫模型(HiddenMarkovModel,HMM)應(yīng)用到語(yǔ)音識(shí)別領(lǐng)域,在語(yǔ)音識(shí)別中獲得極大的成功,成為語(yǔ)音識(shí)別的主要方法。HMM模型的研究使大詞匯量連續(xù)語(yǔ)音識(shí)別系統(tǒng)的開(kāi)發(fā)成為可能。1988年,美國(guó)CMU大學(xué)用VQ(VectorQuantization)/HMM的方法實(shí)現(xiàn)了997個(gè)詞的非特定人連續(xù)語(yǔ)音識(shí)別系統(tǒng),其后,連續(xù)語(yǔ)音識(shí)別技術(shù)獲得長(zhǎng)足的發(fā)展。近年來(lái),人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetwork,ANN)以及支持向量機(jī)(SupportVectorMachine,SVM)由于其較強(qiáng)的自適應(yīng)性和學(xué)習(xí)能力而獲得了普遍的重視,并在語(yǔ)音識(shí)別中獲得了成功的應(yīng)用。國(guó)外的IBM、APPLE、MOTOROLA等公司也投入了漢語(yǔ)語(yǔ)音識(shí)別系統(tǒng)的開(kāi)發(fā)。IBM公司于1997年正式推出中文聽(tīng)寫(xiě)機(jī)系統(tǒng)ViaVoice,該系統(tǒng)對(duì)新聞?wù)Z音識(shí)別有較高的精度,是目前比較有代表性的漢語(yǔ)連續(xù)語(yǔ)音識(shí)別系統(tǒng)。國(guó)內(nèi)漢語(yǔ)語(yǔ)音識(shí)別的研究緊密跟蹤識(shí)別領(lǐng)域的最新研究成果并基本與之保持同步。目前,國(guó)內(nèi)一些研究機(jī)構(gòu)對(duì)大詞匯量連續(xù)語(yǔ)音識(shí)別系統(tǒng)的研究已經(jīng)接近國(guó)外最高水平[1],其中,具有代表性的研究單位為清華大學(xué)電子工程系與中科院自動(dòng)化研究所模式識(shí)別國(guó)家重點(diǎn)實(shí)驗(yàn)室。1.3語(yǔ)音識(shí)別面臨的問(wèn)題語(yǔ)音識(shí)別系統(tǒng)存在一些困難[3]:語(yǔ)音識(shí)別系統(tǒng)的適應(yīng)性差,對(duì)環(huán)境依賴(lài)性強(qiáng),即在一種環(huán)境下訓(xùn)練得到的語(yǔ)音識(shí)別系統(tǒng)只能在這種環(huán)境下得到最優(yōu)的性能;強(qiáng)噪聲環(huán)境下語(yǔ)音識(shí)別率急劇下降,語(yǔ)音信號(hào)在受到干擾后表現(xiàn)出多變性,必須尋找新的信號(hào)分析處理方法,提高語(yǔ)音識(shí)別的抗噪性;如何將語(yǔ)言模型、語(yǔ)法及詞法模型應(yīng)用到大詞匯量連續(xù)語(yǔ)音識(shí)別中去;人類(lèi)的聽(tīng)覺(jué)理解、知識(shí)積累和學(xué)習(xí)機(jī)制以及大腦神經(jīng)系統(tǒng)的控制機(jī)理等方面的認(rèn)識(shí),以及如何將這些知識(shí)應(yīng)用到語(yǔ)音識(shí)別中去。1.4本課題研究背景及內(nèi)容如前所提到的,語(yǔ)音識(shí)別系統(tǒng)目前還面臨著很多問(wèn)題,其中的噪聲干擾,是最常見(jiàn)也是影響最廣泛的一個(gè)難題。實(shí)際應(yīng)用中很多情況下是要求語(yǔ)音識(shí)別系統(tǒng)工作在噪聲環(huán)境下,因此一個(gè)高性能水平的語(yǔ)音識(shí)別系統(tǒng)必需要對(duì)不同類(lèi)型各強(qiáng)度的噪聲具有較強(qiáng)的魯棒性。盡管過(guò)去的研究對(duì)抗噪聲的語(yǔ)音識(shí)別技術(shù)做了大量工作,但到目前為止仍未能找到一種獨(dú)立于噪聲的可靠的識(shí)別算法[4]。語(yǔ)音識(shí)別系統(tǒng)在噪聲環(huán)境下性能下降的原因在于噪聲造成了訓(xùn)練環(huán)境與識(shí)別環(huán)境之間的不匹配,因此,必須盡量減少這種不匹配,以提高識(shí)別率。通常,可通過(guò)修改訓(xùn)練參數(shù)使之適應(yīng)識(shí)別環(huán)境,或用消除噪聲的方法來(lái)增強(qiáng)識(shí)別率?,F(xiàn)有的抗噪語(yǔ)音識(shí)別技術(shù)通常可分為以下三類(lèi)[5]:抗噪語(yǔ)音特征提取技術(shù)、語(yǔ)音增強(qiáng)技術(shù)和模型補(bǔ)償技術(shù)?;谶@樣的背景,本文提出了一個(gè)新的在噪聲環(huán)境下提取特征值的識(shí)別方法——分頻帶識(shí)別法。本法是在已有的識(shí)別方法基礎(chǔ)上,稍加一點(diǎn)改進(jìn)而來(lái)的。經(jīng)過(guò)實(shí)驗(yàn),發(fā)現(xiàn),其對(duì)噪聲環(huán)境下的語(yǔ)音識(shí)別還是有效果的。但是目前只是初期研究,我相信,此法應(yīng)該會(huì)有廣闊的發(fā)展,有待于我們進(jìn)一步探討?!?.1)公式公式:公式應(yīng)另起一行寫(xiě)在稿紙中央。一行寫(xiě)不完的長(zhǎng)公式,最好在等號(hào)處轉(zhuǎn)行,如做不到這一點(diǎn),可在數(shù)學(xué)符號(hào)(如“+”、“-”號(hào))處轉(zhuǎn)行。公式的編號(hào)用圓括號(hào)括起,放在公式右邊行末,在公式和編號(hào)之間不加虛線。公式可按全文統(tǒng)編序號(hào),也可按章單獨(dú)立序號(hào),如(3)或(4.2),采用哪一種序號(hào)應(yīng)和稿中的圖序、表序編法一致。夾在文字中公式的分子和分母平列在一行而用斜線分開(kāi),請(qǐng)注意避免含義不清。例如,a/bcosx就會(huì)既可能被認(rèn)為是a/(bcosx),也可能被認(rèn)為是(a/b)cosx。公式中分式的橫線要寫(xiě)清楚。連分?jǐn)?shù)(即分子、分母也出現(xiàn)分?jǐn)?shù)時(shí))更要注意分線的長(zhǎng)短,并把主要分?jǐn)?shù)和等號(hào)對(duì)齊。公式書(shū)寫(xiě)應(yīng)在文中另起一行,居中書(shū)寫(xiě)。公式的編號(hào)加圓括號(hào),放在公式右邊行末,公式和編號(hào)之間不加虛線。公式后應(yīng)注明編號(hào),該編號(hào)按章順序編排。不引用的簡(jiǎn)短公式一般隨文寫(xiě),但較復(fù)雜的無(wú)編號(hào)公式也可另行居中。第二章語(yǔ)音識(shí)別基礎(chǔ)理論2.1語(yǔ)音信號(hào)產(chǎn)生的機(jī)理[6]人類(lèi)的發(fā)音器官包括肺、氣管、喉(包括聲帶)、咽、鼻和口等。這些器官共同形成一條形狀復(fù)雜的管道,其中喉以上的部分稱(chēng)為聲道,隨著發(fā)出聲音的不同形狀是變化的;面喉的部分稱(chēng)為聲門(mén)。人的發(fā)聲是由于肺部的收縮,壓迫氣流由支氣管經(jīng)過(guò)聲門(mén)和聲道引起音頻振蕩而產(chǎn)生的。聲道截面積是隨縱向位置而變的函數(shù),稱(chēng)為聲道截面積函數(shù),聲道的共振峰特性主要取決于聲道截面積函數(shù),聲道的共振峰特性決定所發(fā)聲音的頻譜特性,即音色。人類(lèi)發(fā)音過(guò)程有三類(lèi)不同的激勵(lì)方式,因而能產(chǎn)生三種不同的聲音,即濁音、清音和爆破音。當(dāng)氣流通過(guò)聲門(mén)時(shí)聲帶的張力剛好使聲帶發(fā)生較低頻率的張弛震蕩,形成準(zhǔn)周期的空氣脈沖,這些空氣脈沖激勵(lì)聲道變小產(chǎn)生濁音;如果聲道中某處面積很小,氣流高速?zèng)_過(guò)此處時(shí)產(chǎn)生湍流,當(dāng)氣流速度與橫截面積之比大于某個(gè)門(mén)限時(shí)便產(chǎn)生摩擦音,即清音。如果聲道某處完全閉合建立起氣壓,然后突然釋放而產(chǎn)生的聲音就是爆破音。語(yǔ)音的產(chǎn)生機(jī)理可以由圖2一1來(lái)描述。沖擊序列發(fā)生器Z沖擊序列發(fā)生器Z聲門(mén)脈沖模型G(Z)隨機(jī)噪聲發(fā)生器聲道模型聲道參數(shù)輻射模型圖2-1語(yǔ)音產(chǎn)生機(jī)理2.2語(yǔ)音信號(hào)的預(yù)處理系統(tǒng)要想獲得一個(gè)比較理想的處理對(duì)象,對(duì)原始信號(hào)進(jìn)行預(yù)處理是必要的。在語(yǔ)音信號(hào)處理中,預(yù)處理包括預(yù)濾波、采樣、A/D轉(zhuǎn)換、分幀加窗、預(yù)加重及端點(diǎn)檢測(cè)。2.2.1預(yù)濾波、采樣、A/D轉(zhuǎn)換預(yù)濾波的目的有兩個(gè):(1)抑制輸入信號(hào)各頻域分量中頻率超出/2的所有分量(為采樣頻率),以防止混疊干擾。(2)抑制50Hz的電源工頻干擾。這樣,預(yù)濾波必須是一個(gè)帶通濾波器,設(shè)其上、下截止頻率分別是,和,則對(duì)于絕大多數(shù)語(yǔ)音編譯碼器,=3400Hz,=60~100Hz,采樣頻率為=8kHz;而對(duì)于語(yǔ)音識(shí)別而言,當(dāng)用于用戶(hù)時(shí),指標(biāo)與語(yǔ)音編譯碼器相同。當(dāng)使用要求較高或很高的場(chǎng)合時(shí),=4500Hz或8000Hz,=60Hz,=10kHz或20kHz。語(yǔ)音信號(hào)經(jīng)預(yù)濾波和采樣后,由A/D轉(zhuǎn)換器轉(zhuǎn)換為二進(jìn)制數(shù)字碼。2.2.2預(yù)加重由于語(yǔ)音信號(hào)的平均功率譜受聲門(mén)激勵(lì)和口鼻輻射的影響,語(yǔ)音信號(hào)從嘴唇輻射后,高頻端大約在800Hz以上按6dB/倍頻程跌落[7],即語(yǔ)音信號(hào)的頻譜產(chǎn)生高頻衰落現(xiàn)象。所以系統(tǒng)得到語(yǔ)音信號(hào)頻譜時(shí),頻率越高響應(yīng)的成分越少,高頻部分的頻譜比低頻部分的難求。因此,為抵消這種影響,就在對(duì)語(yǔ)音信號(hào)分析前進(jìn)行預(yù)加重(Pre-emphasis)處理。預(yù)加重的目的是提升高頻部分,使信號(hào)的頻譜變得平坦,保持在低頻到高頻整個(gè)頻帶中,能用同樣的信噪比求頻譜,以便于頻譜分析或聲道參數(shù)分析。預(yù)加重一般是在語(yǔ)音信號(hào)數(shù)字化之后、參數(shù)分析之前在計(jì)算機(jī)里用具有提升高頻特性的預(yù)加重?cái)?shù)字濾波器來(lái)實(shí)現(xiàn),它一般是一個(gè)一階的數(shù)字濾波器,其函數(shù)為:(2.1)其中,為預(yù)加重濾波器的系數(shù),決定截止頻率,取值范圍一般在0.94~0.97,本文的取值為0.95。圖2-2為數(shù)字3的原始語(yǔ)音信號(hào)與預(yù)加重后的信號(hào)對(duì)照?qǐng)D,其語(yǔ)音采樣頻率為16K。從圖中可以看出,預(yù)加重后,清音段的能量得到了提升,甚至接近濁音段的能量。圖2-2數(shù)字“3”的原始語(yǔ)音信號(hào)與預(yù)加重后的信號(hào)對(duì)照2.2.3分幀加窗語(yǔ)音信號(hào)是一種非平穩(wěn)信號(hào),但其具有短時(shí)平穩(wěn)的特點(diǎn)。因此,為了能對(duì)語(yǔ)音信號(hào)進(jìn)行處理,我們需將語(yǔ)音信號(hào)劃分為一個(gè)一個(gè)的短時(shí)段,每一個(gè)短時(shí)段稱(chēng)為一幀。通過(guò)對(duì)語(yǔ)音的分幀操作,可以撮其適時(shí)特性,便于模型的建立。數(shù)據(jù)幀長(zhǎng)一般可取為20~30ms,前一幀與后一幀的交疊部分稱(chēng)為幀移,幀移與幀長(zhǎng)的比例一般取為0~0.5。分幀可用移動(dòng)的有限窗口進(jìn)行加權(quán)的方法來(lái)實(shí)現(xiàn)的,從……2.3端點(diǎn)檢測(cè)端點(diǎn)檢測(cè)在語(yǔ)音識(shí)別中有著重要的作用。其目的是從包含語(yǔ)音的一段信號(hào)中檢測(cè)出語(yǔ)音信號(hào)段和噪聲段,確定語(yǔ)音段的起點(diǎn)和終點(diǎn)。準(zhǔn)確的端點(diǎn)檢測(cè)不僅可以減少計(jì)算量,而且能排除無(wú)聲段的噪聲干擾,從而提高系統(tǒng)的識(shí)別率。下面,簡(jiǎn)單介紹幾種目前常用的檢測(cè)方法。2.3.1短時(shí)能量能量是語(yǔ)音的一個(gè)重要特性,清音的能量較小,濁音的能量較大。由于語(yǔ)音信號(hào)的能量隨時(shí)間而變化,靜音段和語(yǔ)音段之間的能量差別明顯,靜音段的能量很小,而語(yǔ)音段的能量明顯增大。因此,可以考慮用信號(hào)的能量作為特征,區(qū)分靜音段和語(yǔ)音段。只要設(shè)定一個(gè)門(mén)限,當(dāng)信號(hào)的幅度超過(guò)該門(mén)限的時(shí)候,就認(rèn)為語(yǔ)音開(kāi)始,當(dāng)幅度降低到門(mén)限以下時(shí),就認(rèn)為語(yǔ)音結(jié)束。語(yǔ)音信號(hào)的短時(shí)能量定義如下:(2.2)其中為窗函數(shù),N為窗長(zhǎng)。計(jì)算短時(shí)能量之前,要將語(yǔ)音信號(hào)進(jìn)行預(yù)加重,目的是提升語(yǔ)音信號(hào)的清音部分。圖2-3為數(shù)字“3”的原始語(yǔ)音信號(hào)與預(yù)加重后的信號(hào)及信號(hào)短時(shí)能量的對(duì)照?qǐng)D??梢?jiàn),清音部分的能量提高了。圖2-3數(shù)字“3”的原始語(yǔ)音信號(hào)與預(yù)加重后的信號(hào)及信號(hào)短時(shí)能量的對(duì)照?qǐng)D2-4數(shù)字“3”插圖:畢業(yè)設(shè)計(jì)(論文)的插圖必須精心制作,線條要?jiǎng)驖嵜烙^。插圖應(yīng)與正文呼應(yīng),不得與正文無(wú)關(guān)或與正文脫節(jié)。圖的內(nèi)容安排要適當(dāng),不要過(guò)于密實(shí)。內(nèi)容的多少和圖的大小應(yīng)符合這樣一條原則:當(dāng)你把插圖放在桌上,你站著看時(shí)能方便地看清楚圖上的每一條線和每一個(gè)符號(hào)。每幅插圖應(yīng)有題目和序號(hào),全文的插圖可以統(tǒng)一編序,也可以逐章單獨(dú)編序,但圖序必須連續(xù),不重復(fù),不跳缺。各類(lèi)線條圖應(yīng)在描圖紙或潔白圖紙上用墨線繪成,墨色要濃,線條要光滑。一般不使用方格坐標(biāo)紙或有色紙畫(huà)圖。制圖標(biāo)準(zhǔn):插圖應(yīng)符合國(guó)家標(biāo)準(zhǔn)及專(zhuān)業(yè)標(biāo)準(zhǔn)。插圖:畢業(yè)設(shè)計(jì)(論文)的插圖必須精心制作,線條要?jiǎng)驖嵜烙^。插圖應(yīng)與正文呼應(yīng),不得與正文無(wú)關(guān)或與正文脫節(jié)。圖的內(nèi)容安排要適當(dāng),不要過(guò)于密實(shí)。內(nèi)容的多少和圖的大小應(yīng)符合這樣一條原則:當(dāng)你把插圖放在桌上,你站著看時(shí)能方便地看清楚圖上的每一條線和每一個(gè)符號(hào)。每幅插圖應(yīng)有題目和序號(hào),全文的插圖可以統(tǒng)一編序,也可以逐章單獨(dú)編序,但圖序必須連續(xù),不重復(fù),不跳缺。各類(lèi)線條圖應(yīng)在描圖紙或潔白圖紙上用墨線繪成,墨色要濃,線條要光滑。一般不使用方格坐標(biāo)紙或有色紙畫(huà)圖。制圖標(biāo)準(zhǔn):插圖應(yīng)符合國(guó)家標(biāo)準(zhǔn)及專(zhuān)業(yè)標(biāo)準(zhǔn)。機(jī)械工程圖:采用第一角投影法,嚴(yán)格按照GB4457~4460-84,GB131-83《機(jī)械制圖》標(biāo)準(zhǔn)規(guī)定。電氣圖:圖形符號(hào)、文字符號(hào)等應(yīng)符合有關(guān)標(biāo)準(zhǔn)的規(guī)定。流程圖:原則上應(yīng)采用結(jié)構(gòu)化程序并正確運(yùn)用流程框圖。對(duì)無(wú)規(guī)定符號(hào)的圖形應(yīng)采用該行業(yè)的常用畫(huà)法。圖題若采用中英文對(duì)照時(shí),其英文字體為五號(hào)正體,中文字體為五號(hào)宋體。引用圖應(yīng)在圖題的左上角標(biāo)出文獻(xiàn)來(lái)源,圖號(hào)按章順序編寫(xiě),如:圖3—1為第三章第一圖。如圖中含有幾個(gè)不同部分應(yīng)將分圖號(hào)標(biāo)注在分圖的左上角,并在圖題下列出各部分內(nèi)容,圖題放在圖下方,用五號(hào)宋體字。顧名思義,過(guò)零就是指時(shí)域波形穿過(guò)坐標(biāo)軸,即當(dāng)離散信號(hào)的相鄰兩個(gè)取樣值具有不同的符號(hào)時(shí),便出現(xiàn)過(guò)零現(xiàn)象。單位時(shí)間內(nèi)過(guò)零發(fā)生的次數(shù)稱(chēng)作短時(shí)過(guò)零率。圖2-5為數(shù)字“3”的原始語(yǔ)音信號(hào)與過(guò)零率對(duì)照?qǐng)D。過(guò)零率2-7其中,sgn[x]是取符號(hào)函數(shù),它和窗函數(shù)w(n)的定義如下2-8圖2-5數(shù)字“3”的原始語(yǔ)音信號(hào)與過(guò)零率對(duì)照第三章常用的語(yǔ)音識(shí)別模型※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※第四章噪聲下語(yǔ)音特征參數(shù)的提取識(shí)別※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※表4-1各SNR低頻噪聲環(huán)境下兩種識(shí)別方法識(shí)別率比較方法-5db時(shí)的識(shí)別率0db時(shí)的識(shí)別率5db時(shí)的識(shí)別率10db時(shí)的識(shí)別率傳統(tǒng)法56%86%96%98%分頻帶法88%96%96%96%表格表格:表格必須與方案敘述有直接聯(lián)系,表格中的內(nèi)容在技術(shù)上不得與正文矛盾,原則上一律使用“三線表”表格形式。每個(gè)表格都應(yīng)有自己的序號(hào)和標(biāo)題,逐章單獨(dú)編序,如表3-1為第三章第一表,表序必須連續(xù),不得跳缺。正文中引用時(shí),“表”字在前,序號(hào)在后,如寫(xiě)“表3-1”,后空一格接寫(xiě)標(biāo)題,標(biāo)題末尾不加標(biāo)點(diǎn)。標(biāo)題宋體五號(hào),放在表上方,表中文字宋體小五號(hào)表格允許下頁(yè)接寫(xiě),接寫(xiě)時(shí)表題省略,表頭應(yīng)重復(fù)書(shū)寫(xiě),并在右上方寫(xiě)“續(xù)表xx”。表格應(yīng)寫(xiě)在離正文首次出現(xiàn)處最近的地方,不應(yīng)超前和過(guò)分拖后。

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論