




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、2014屆本科畢業(yè)論文(設計)題 目: 系 別: 信息工程學院 班 級: 2010級計算機科學與技術(嵌入式技術方向) 學 號: 201060861? 姓 名: 指導教師: 職 稱 起訖日期: 2013年10月16日-2014年5月31日 文檔頁面設置約定:一律用A4紙規(guī)范打印,左邊距為2.8cm,右邊距為2.2cm,上邊距都為2.5cm,下邊距都為2.4cm。頁眉、頁腳邊距分別為1.7cm和1.5cm,行間距均為固定行距22磅,文中公式均為單倍行距.字間距為默認值奇數(shù)頁眉內容為:××屆××專業(yè)畢業(yè)設計(論文),偶數(shù)頁眉的內容為:××
2、×(作者姓名):××××(論文題目),均采用宋體小五號居中。中、置于目錄頁之前。頁碼從正文開始編排。英文摘要單獨一頁置于正文參考文獻后,致謝語單獨一頁置于英文摘要后,英文摘要、致謝語不需要頁眉、頁腳。題目黑體四號字,應以簡明、確切、有概括性的詞語反映文章內容。字數(shù)要適當,一般不宜超過20個漢字。姓名:宋體小四號字。噪聲環(huán)境下語音特征參數(shù)魯棒性的研究張三豐三明學院 信息工程學院 2010級計算機科學與技術(嵌入式技術方向)摘要:實用有效的說話人識別系統(tǒng)越來越成為研究的重點。語音特征參數(shù)的魯棒性直接影響一個說話人識別系統(tǒng)的具體性能,過去主要針對移動
3、通信環(huán)境下存在信道失真的問題,研究差分倒譜的魯棒性。文中則主要在加性白噪聲環(huán)境下研究Mel倒譜參數(shù)、Mel差分倒譜參數(shù)的頑健性以及它們經(jīng)過倒譜系數(shù)零均值化(CMN)處理后識別性能的改進。從仿真結果可以看出:在加性白噪聲環(huán)境下,差分倒譜參數(shù)具有很好的魯棒性;倒譜系數(shù)零均值化能有效的除去加性白噪聲。關鍵詞:語音識別;魯棒性;Mel倒譜參數(shù);Mel差分倒譜;倒譜系數(shù)零均值化摘要以簡要文字介紹研究課題的目的、方法、內容及主要成果,中文摘要字數(shù)一般不超過400字。 關鍵詞是表述畢業(yè)論文(設計)主題內容信息的單詞或術語,應盡量從漢語主題詞表中選取,第一關鍵詞應能體現(xiàn)出文章的學科分類。關鍵詞數(shù)量一般為35個
4、。論文中英文字體均用Times New Roman字體。注:所有文字內容僅做樣板。1. 設計(論文)題目為四號黑體字,可以分為1或2行居中打??;設計(論文)題目下空一行打印作者姓名(單獨一行,小四號宋體,居中);下行打印“三明學院 信息工程學院 XX級XX專業(yè)”(五號宋體,居中);再下行打印摘要。2. 摘要二字為小四號黑體,“摘要:”二字后打印內容(五號宋體);摘要內容下空一行打印關鍵字,“關鍵詞:”三字為小四號黑體,其后的內容為五號宋體,關鍵詞之間用分號隔開, 3. 英文摘要題目和關鍵字全部采用小四號Times New Roman字體,摘要內容和關鍵字內容均用五號Times New Roma
5、n字體。目 錄第一章 緒論11.1 語音識別簡介11.1.1什么是語音識別11.1.2 語音識別的應用及分類11.2 國內外語音識別技術的發(fā)展歷史及現(xiàn)狀11.3 語音識別面臨的問題21.4 本課題研究背景及內容2第二章 語音識別基礎理論32.1 語音信號產(chǎn)生的機理32.2 語音信號的預處理42.2.1 預濾波、采樣、A/D轉換42.2.2 預加重42.2.3 分幀加窗52.3 端點檢測52.3.1 短時能量6 2.3.2 短時平均過零率7第三章 常用的語音識別模型8第四章 噪聲下語音特征參數(shù)的提取識別9第五章 結論10參考文獻11附件 語音“0”的各狀態(tài)頻譜圖132014屆計算機科學與技術(嵌
6、入式技術方向)專業(yè)畢業(yè)論文(設計)第一章 緒論語言,是人類進行行為溝通和思想交流最重要的工具1,也是人類最重要的信息載體。隨著信息科技的快速發(fā)展,計算機的越來越便攜化和應用的復雜化,在越來越多的領域有了讓計算機聽懂人言的要求,這樣,就引出了語音處理技術這門交叉學科。語音識別技術,是語音處理技術中的一個重要組成。1. 各級標題使用樣式進行設置。每章標題以四號黑體字居中打?。弧罢隆毕乱恍袨椤肮?jié)”,以小四號黑體左起打?。弧肮?jié)”下空一行為“小節(jié)”,以五號黑體左起打印,換行打印設計(論文)正文。2. 論文中的英文字體、數(shù)字均為Times New Roman .3. 引用文獻標示方式應全文統(tǒng)一,并采用所在
7、學科領域內通用的方式,用上標的形式置于所引內容最末句的右上角,用5號字體。所引文獻編號用阿拉數(shù)字置于方括號中,如:“成果1”。當提及的參考文獻為文中直接說明時,其序號應該用5號字與正文排齊,如“由文獻8, 10-14可知”。不得將引用文獻標示置于各級標題處,引用文獻應按文中引用出現(xiàn)的順序列全。1.1 語音識別簡介 1.1.1什么是語音識別 所謂的語音識別是指利用計算機自動識別語音的技術,有狹義和廣義之分。狹義的語音識別特指利用計算機識別出語音信號所表達的內容,其目的是要準確地理解語音所蘊含的含義,例如將語音轉換成其所對應的文字。而廣義的語音識別則泛指利用語音信號識別出其中所包含的“任何感興趣”
8、的內容的一種技術,例如利用語音信號中所包含的特定人的信息進行說話人身份辨認的說話人識別技術2。1.1.2 語音識別的應用及分類正文采用五號宋體字打印,行間距均為固定行距22磅,文中公式均為單倍行距.字間距為默認值;正文層次標題序號依次為“1”、“1.1”、“1.1.1”等,一律頂格,后空一格寫標題,第四層次用(1)、(2)等,后空一格寫標題。 語音識別的應用范圍十分廣泛,遍及各行各業(yè)。如智能家居、語音撥號、信息通訊、自動應答系統(tǒng)、工業(yè)控制、機器人、交通導航等等。語音識別是一門新興的交叉性學科,它廣泛涉及聲學、語音學、語言學、數(shù)字信號處理、通信學、網(wǎng)絡技術、電子技術、計算機科學、模式識別和人工智
9、能等眾多學科。如前所述,語音識別系統(tǒng)有廣義和狹義之分,這里所討論的語音識別分類特針對狹義的語音識別而言3。 由文獻4, 5-8可知“從不同角度,語音識別系統(tǒng)可以分為以下幾類:按詞匯量大小,可分為小詞匯量、中等詞匯量、大詞匯量及無限詞匯量語音識別系統(tǒng);按對說話人的依賴程度可以分為特定人和非特定人語音識別系統(tǒng);按對說話人說話方式的要求,可以分為孤立詞語音識別系統(tǒng)、連接詞語音識別系統(tǒng)及連續(xù)語音識別系統(tǒng);按識別的目的來分,可以分為說話人語音識別系統(tǒng)和語音內容理解的語音識別系統(tǒng)”。1.2 國內外語音識別技術的發(fā)展歷史及現(xiàn)狀語音識別的歷史可以追溯到20世紀50年代。1952年AT&T Bell實驗
10、室的確K.H.Davis等人利用帶通濾波器進行語音頻譜的分析和匹配,并成功用于對10個英文數(shù)字的識別,識別率達到98%。1960年P.Denes等研制成功第一個計算機語音識別系統(tǒng),同年G.Fant提出了語音產(chǎn)生的聲源濾波器模型,對語音識別工作起到了巨大的推動作用。20世紀80年代語音識別研究進一步走向深入,其研究重點是連接詞語音識別,用于連接詞識別的分層構筑技術(level building)得到發(fā)展。另一個重要的發(fā)展是語音識別算法從模板匹配技術發(fā)展到基于統(tǒng)計模型的技術。期間,美國CMU大學的J. K. Baker等人將隱馬爾可夫模型(Hidden Markov Model, HMM)應用到語
11、音識別領域,在語音識別中獲得極大的成功,成為語音識別的主要方法。HMM模型的研究使大詞匯量連續(xù)語音識別系統(tǒng)的開發(fā)成為可能。1988年,美國CMU大學用VQ(Vector Quantization)/ HMM的方法實現(xiàn)了997個詞的非特定人連續(xù)語音識別系統(tǒng),其后,連續(xù)語音識別技術獲得長足的發(fā)展。近年來,人工神經(jīng)網(wǎng)絡(Artificial Neural Network, ANN)以及支持向量機(Support Vector Machine, SVM)由于其較強的自適應性和學習能力而獲得了普遍的重視,并在語音識別中獲得了成功的應用。國外的IBM、APPLE、MOTOROLA等公司也投入了漢語語音識別
12、系統(tǒng)的開發(fā)。 IBM 公司于 1997 年正式推出中文聽寫機系統(tǒng)Via Voice,該系統(tǒng)對新聞語音識別有較高的精度,是目前比較有代表性的漢語連續(xù)語音識別系統(tǒng)。國內漢語語音識別的研究緊密跟蹤識別領域的最新研究成果并基本與之保持同步。目前,國內一些研究機構對大詞匯量連續(xù)語音識別系統(tǒng)的研究已經(jīng)接近國外最高水平1,其中,具有代表性的研究單位為清華大學電子工程系與中科院自動化研究所模式識別國家重點實驗室。1.3 語音識別面臨的問題語音識別系統(tǒng)存在一些困難3:語音識別系統(tǒng)的適應性差,對環(huán)境依賴性強,即在一種環(huán)境下訓練得到的語音識別系統(tǒng)只能在這種環(huán)境下得到最優(yōu)的性能;強噪聲環(huán)境下語音識別率急劇下降,語音信
13、號在受到干擾后表現(xiàn)出多變性,必須尋找新的信號分析處理方法,提高語音識別的抗噪性;如何將語言模型、語法及詞法模型應用到大詞匯量連續(xù)語音識別中去;人類的聽覺理解、知識積累和學習機制以及大腦神經(jīng)系統(tǒng)的控制機理等方面的認識,以及如何將這些知識應用到語音識別中去。1.4 本課題研究背景及內容如前所提到的,語音識別系統(tǒng)目前還面臨著很多問題,其中的噪聲干擾,是最常見也是影響最廣泛的一個難題。實際應用中很多情況下是要求語音識別系統(tǒng)工作在噪聲環(huán)境下,因此一個高性能水平的語音識別系統(tǒng)必需要對不同類型各強度的噪聲具有較強的魯棒性。盡管過去的研究對抗噪聲的語音識別技術做了大量工作,但到目前為止仍未能找到一種獨立于噪聲
14、的可靠的識別算法4。語音識別系統(tǒng)在噪聲環(huán)境下性能下降的原因在于噪聲造成了訓練環(huán)境與識別環(huán)境之間的不匹配,因此,必須盡量減少這種不匹配,以提高識別率。通常,可通過修改訓練參數(shù)使之適應識別環(huán)境,或用消除噪聲的方法來增強識別率?,F(xiàn)有的抗噪語音識別技術通??煞譃橐韵氯?:抗噪語音特征提取技術、語音增強技術和模型補償技術?;谶@樣的背景,本文提出了一個新的在噪聲環(huán)境下提取特征值的識別方法分頻帶識別法。本法是在已有的識別方法基礎上,稍加一點改進而來的。經(jīng)過實驗,發(fā)現(xiàn),其對噪聲環(huán)境下的語音識別還是有效果的。但是目前只是初期研究,我相信,此法應該會有廣闊的發(fā)展,有待于我們進一步探討。 (1.1)公式:(公式
15、行間距為:單倍行距)1. 公式應另起一行寫在稿紙中央。一行寫不完的長公式,最好在等號處轉行,如做不到這一點,可在數(shù)學符號(如“+”、“-”號)處轉行。2. 公式的編號用圓括號括起,放在公式右邊行末,在公式和編號之間不加虛線。公式可按全文統(tǒng)編序號,也可按章單獨立序號,如(3)或(42),采用哪一種序號應和稿中的圖序、表序編法一致。3. 夾在文字中公式的分子和分母平列在一行而用斜線分開,請注意避免含義不清。例如,abcosx就會既可能被認為是a(bcosx),也可能被認為是(ab)cosx。4. 公式中分式的橫線要寫清楚。連分數(shù)(即分子、分母也出現(xiàn)分數(shù)時)更要注意分線的長短,并把主要分數(shù)和等號對齊
16、。5. 公式書寫應在文中另起一行,居中書寫。公式的編號加圓括號,放在公式右邊行末,公式和編號之間不加虛線。公式后應注明編號,該編號按章順序編排。不引用的簡短公式一般隨文寫,但較復雜的無編號公式也可另行居中。第二章 語音識別基礎理論2.1 語音信號產(chǎn)生的機理人類的發(fā)音器官包括肺、氣管、喉(包括聲帶)、咽、鼻和口等。這些器官共同形成一條形狀復雜的管道,其中喉以上的部分稱為聲道,隨著發(fā)出聲音的不同形狀是變化的;面喉的部分稱為聲門。人的發(fā)聲是由于肺部的收縮,壓迫氣流由支氣管經(jīng)過聲門和聲道引起音頻振蕩而產(chǎn)生的。聲道截面積是隨縱向位置而變的函數(shù),稱為聲道截面積函數(shù),聲道的共振峰特性主要取決于聲道截面積函數(shù)
17、,聲道的共振峰特性決定所發(fā)聲音的頻譜特性,即音色。人類發(fā)音過程有三類不同的激勵方式,因而能產(chǎn)生三種不同的聲音,即濁音、清音和爆破音。當氣流通過聲門時聲帶的張力剛好使聲帶發(fā)生較低頻率的張弛震蕩,形成準周期的空氣脈沖,這些空氣脈沖激勵聲道變小產(chǎn)生濁音;如果聲道中某處面積很小,氣流高速沖過此處時產(chǎn)生湍流,當氣流速度與橫截面積之比大于某個門限時便產(chǎn)生摩擦音,即清音。如果聲道某處完全閉合建立起氣壓,然后突然釋放而產(chǎn)生的聲音就是爆破音。語音的產(chǎn)生機理可以由圖2-1來描述6。沖擊序列發(fā)生器Z聲門脈沖模型G(Z)隨機噪聲發(fā)生器聲道模型聲道參數(shù)輻射模型圖2-1 語音產(chǎn)生機理2.2 語音信號的預處理 系統(tǒng)要想獲得
18、一個比較理想的處理對象,對原始信號進行預處理是必要的。在語音信號處理中,預處理包括預濾波、采樣、A/D轉換、分幀加窗、預加重及端點檢測。2.2.1 預濾波、采樣、A/D轉換預濾波的目的有兩個:(1)抑制輸入信號各頻域分量中頻率超出/2的所有分量(為采樣頻率),以防止混疊干擾。(2)抑制50Hz的電源工頻干擾。這樣,預濾波必須是一個帶通濾波器,設其上、下截止頻率分別是,和,則對于絕大多數(shù)語音編譯碼器,=3400Hz,=60100Hz,采樣頻率為=8kHz;而對于語音識別而言,當用于電話用戶時,指標與語音編譯碼器相同。當使用要求較高或很高的場合時,=4500Hz或8000Hz,=60Hz,=10k
19、Hz或20kHz。語音信號經(jīng)預濾波和采樣后,由A/D轉換器轉換為二進制數(shù)字碼。 2.2.2 預加重由于語音信號的平均功率譜受聲門激勵和口鼻輻射的影響,語音信號從嘴唇輻射后,高頻端大約在800Hz以上按6dB/倍頻程跌落7,即語音信號的頻譜產(chǎn)生高頻衰落現(xiàn)象。所以系統(tǒng)得到語音信號頻譜時,頻率越高響應的成分越少,高頻部分的頻譜比低頻部分的難求。因此,為抵消這種影響,就在對語音信號分析前進行預加重(Pre-emphasis)處理。預加重的目的是提升高頻部分,使信號的頻譜變得平坦,保持在低頻到高頻整個頻帶中,能用同樣的信噪比求頻譜,以便于頻譜分析或聲道參數(shù)分析。預加重一般是在語音信號數(shù)字化之后、參數(shù)分析
20、之前在計算機里用具有提升高頻特性的預加重數(shù)字濾波器來實現(xiàn),它一般是一個一階的數(shù)字濾波器,其函數(shù)為: (2.1)其中,為預加重濾波器的系數(shù),決定截止頻率,取值范圍一般在0.940.97,本文的取值為0.95。圖2-2為數(shù)字3的原始語音信號與預加重后的信號對照圖,其語音采樣頻率為16K。從圖中可以看出,預加重后,清音段的能量得到了提升,甚至接近濁音段的能量。圖2-2 數(shù)字“3”的原始語音信號與預加重后的信號對照2.2.3 分幀加窗語音信號是一種非平穩(wěn)信號,但其具有短時平穩(wěn)的特點。因此,為了能對語音信號進行處理,我們需將語音信號劃分為一個一個的短時段,每一個短時段稱為一幀。通過對語音的分幀操作,可以
21、撮其適時特性,便于模型的建立。數(shù)據(jù)幀長一般可取為2030ms,前一幀與后一幀的交疊部分稱為幀移,幀移與幀長的比例一般取為00.5。分幀可用移動的有限窗口進行加權的方法來實現(xiàn)的,從2.3 端點檢測端點檢測在語音識別中有著重要的作用。其目的是從包含語音的一段信號中檢測出語音信號段和噪聲段,確定語音段的起點和終點。準確的端點檢測不僅可以減少計算量,而且能排除無聲段的噪聲干擾,從而提高系統(tǒng)的識別率。下面,簡單介紹幾種目前常用的檢測方法。 2.3.1 短時能量 能量是語音的一個重要特性,清音的能量較小,濁音的能量較大。由于語音信號的能量隨時間而變化,靜音段和語音段之間的能量差別明顯,靜音段的能量很小,而
22、語音段的能量明顯增大。因此,可以考慮用信號的能量作為特征,區(qū)分靜音段和語音段。只要設定一個門限,當信號的幅度超過該門限的時候,就認為語音開始,當幅度降低到門限以下時,就認為語音結束。能量是語音的一個重要特性,清音的能量較小,濁音的能量較大。由于語音信號的能量隨時間而變化,靜音段和語音段之間的能量差別明顯,靜音段的能量很小,而語音段的能量明顯增大。因此,可以考慮用信號的能量作為特征,區(qū)分靜音段和語音段。只要設定一個門限,當信號的幅度超過該門限的時候,就認為語音開始,當幅度降低到門限以下時,就認為語音結束。能量是語音的一個重要特性,清音的能量較小,濁音的能量較大。由于語音信號的能量隨時間而變化,靜
23、音段和語音段之間的能量差別明顯,靜音段的能量很小,而語音段的能量明顯增大。因此,可以考慮用信號的能量作為特征,區(qū)分靜音段和語音段。只要設定一個門限,當信號的幅度超過該門限的時候,就認為語音開始,當幅度降低到門限以下時,就認為語音結束。能量是語音的一個重要特性,清音的能量較小,濁音的能量較大。由于語音信號的能量隨時間而變化,靜音段和語音段之間的能量差別明顯,靜音段的能量很小,而語音段的能量明顯增大。因此,可以考慮用信號的能量作為特征,區(qū)分靜音段和語音段。只要設定一個門限,當信號的幅度超過該門限的時候,就認為語音開始,當幅度降低到門限以下時,就認為語音結束。能量是語音的一個重要特性,清音的能量較小
24、,濁音的能量較大。由于語音信號的能量隨時間而變化,靜音段和語音段之間的能量差別明顯,靜音段的能量很小,而語音段的能量明顯增大。因此,可以考慮用信號的能量作為特征,區(qū)分靜音段和語音段。只要設定一個門限,當信號的幅度超過該門限的時候,就認為語音開始,當幅度降低到門限以下時,就認為語音結束。能量是語音的一個重要特性,清音的能量較小,濁音的能量較大。由于語音信號的能量隨時間而變化,靜音段和語音段之間的能量差別明顯,靜音段的能量很小,而語音段的能量明顯增大。因此,可以考慮用信號的能量作為特征,區(qū)分靜音段和語音段。只要設定一個門限,當信號的幅度超過該門限的時候,就認為語音開始,當幅度降低到門限以下時,就認
25、為語音結束。語音信號的短時能量定義如下: (2.2)其中為窗函數(shù),N為窗長。計算短時能量之前,要將語音信號進行預加重,目的是提升語音信號的清音部分。圖2-3為數(shù)字“3”的原始語音信號與預加重后的信號及信號短時能量的對照圖。可見,清音部分的能量提高了。圖2-3 數(shù)字“3”的原始語音信號與預加重后的信號及信號短時能量的對照圖2-4 數(shù)字“3”開始部分的波型插圖:1. 畢業(yè)設計(論文)的插圖必須精心制作,線條要勻潔美觀。插圖應與正文呼應,不得與正文無關或與正文脫節(jié)。2. 圖的內容安排要適當,不要過于密實。內容的多少和圖的大小應符合這樣一條原則:當你把插圖放在桌上,你站著看時能方便地看清楚圖上的每一條
26、線和每一個符號。3. 每幅插圖應有題目和序號,全文的插圖可以統(tǒng)一編序,也可以逐章單獨編序,但圖序必須連續(xù),不重復,不跳缺。4. 各類線條圖應在描圖紙或潔白圖紙上用墨線繪成,墨色要濃,線條要光滑。一般不使用方格坐標紙或有色紙畫圖。5. 制圖標準:插圖應符合國家標準及專業(yè)標準。機械工程圖:采用第一角投影法,嚴格按照GB44574460-84, GB131-83機械制圖標準規(guī)定。電氣圖:圖形符號、文字符號等應符合有關標準的規(guī)定。流程圖:原則上應采用結構化程序并正確運用流程框圖。6. 對無規(guī)定符號的圖形應采用該行業(yè)的常用畫法。7. 圖題若采用中英文對照時,其英文字體為五號正體,中文字體為五號宋體。引用
27、圖應在圖題的左上角標出文獻來源,圖號按章順序編寫,如:圖31為第三章第一圖。如圖中含有幾個不同部分應將分圖號標注在分圖的左上角,并在圖題下列出各部分內容,圖題放在圖下方,用五號宋體字。 2.3.2 短時平均過零率顧名思義,過零就是指時域波形穿過坐標軸,即當離散信號的相鄰兩個取樣值具有不同的符號時,便出現(xiàn)過零現(xiàn)象。單位時間內過零發(fā)生的次數(shù)稱作短時過零率。圖2-5為數(shù)字“3”的原始語音信號與過零率對照圖。過零率定義如下: 2-7其中,sgnx是取符號函數(shù),它和窗函數(shù)w(n)的定義如下 2-8 圖2-5 數(shù)字“3”的原始語音信號與過零率對照 第三章 常用的語音識別模型 第四章 噪聲下語音特征參數(shù)的提
28、取識別 表4-1 各SNR低頻噪聲環(huán)境下兩種識別方法識別率比較方法-5db時的識別率0db時的識別率5db時的識別率10db時的識別率傳統(tǒng)法56%86%96%98%分頻帶法88%96%96%96%表格:1. 表格必須與方案敘述有直接聯(lián)系,表格中的內容在技術上不得與正文矛盾,一般使用“三線表”表格形式,如有特殊表格可不用。2. 每個表格都應有自己的序號和標題,逐章單獨編序,如表3-1為第三章第一表,表序必須連續(xù),不得跳缺。正文中引用時,“表”字在前,序號在后,如寫“表3-1”,后空一格接寫標題,標題末尾不加標點。標題宋體五號,放在表上方,表中文字字號為小五號。3. 表格允許下頁接寫,接寫時表題省
29、略,表頭應重復書寫,并在右上方寫“續(xù)表x x”。4. 表格應寫在離正文首次出現(xiàn)處最近的地方,不應超前和過分拖后。第五章 結論 結論是全文的思想精髓和文章價值的體現(xiàn)。應概括說明所進行工作的情況和價值,分析其優(yōu)點和特色,指出創(chuàng)新所在,并應指出其中存在的問題和今后的改進方向,特別是對工作中遇到的重要問題要著重指出,并提出自己的見解。它集中反映作者的研究成果,表達作者對所研究的課題的見解和主張,結論要簡單、明確,篇幅不宜過長。參考文獻1 王士元, 彭剛. 語言、語音與技術M. 上海: 上海教育出版社, 2006.2 蔡蓮紅, 黃德智, 蔡銳. 現(xiàn)代語音技術基礎與應用M. 北京: 清華大學出版社, 20
30、03.3 胡航. 語音信號處理M. 哈爾濱工業(yè)大學出版社, 2000.4 寧更新. 抗噪聲語音識別新技術的研究D. 博士學位論文. 廣州:華南理工大學, 2006.5 李萱. 語音特征參數(shù)提取方法研究D. 碩士學位論文. 西安:西安電子科技大學, 2006.6 趙力. 語音信號處理M . 北京: 機械工業(yè)出版社,2003.1 馬靜. 基于HMM模型的漢語數(shù)字語音識別算法的研究D. 碩士學位論文. 太原:太原理工大學, 2008.8 毛峽,丁玉寬圖像的情感特征分析及其和諧感評價J. 電子學報, 2001,29(12A):1923-19279 Mao Xia, Zhang San. Affecti
31、ve Property of Image and Fractal Dimension J. Chaos, Solitons & FractalsU. K, 2003(15): 905-910參考文獻四字用小四號黑體字,內容用五號宋體字。其格式為:參考文獻的著錄均應符合國家有關標準(按GB771487 文后參考文獻著錄格式執(zhí)行)。以“參考文獻”居中排作為標識;參考文獻的序號左頂格,并用數(shù)字加方括號表示,如1,2,以與正文中的指示序號格式一致。每一參考文獻條目的最后均以“”結束。各類參考文獻條目的編排格式及示例如下:1連續(xù)出版物序號作者文獻題名J.刊名,出版年份,卷號(期號):起止頁碼例如
32、: 1毛峽,丁玉寬圖像的情感特征分析及其和諧感評價J. 電子學報, 2001,29(12A):1923-19272 Mao Xia,et al. Affective Property of Image and Fractal DimensionJ. Chaos, Solitons & FractalsUK,2003:V15 905-9102專著序號作者文獻題名M 出版地:出版者,出版年:起止頁碼例如:3 劉國鈞,王連成圖書館史研究M.北京:高等教育出版社,1979:15-18,313會議論文集序號作者文獻題名A論文集名C出版地:出版者,出版年:起止頁碼例如:4 毛峽繪畫的音樂表現(xiàn)A.中
33、國人工智能學會2001年全國學術年會論文集C.北京:北京郵電大學出版社, 2001:739-7405 Mao Xia, et al.Analysis of Affective Characteristics and Evaluation of Harmonious Feeling of Image Based on 1/f Fluctuation TheoryA.International Conference on Industrial & Engineering Applications of Artificial Intelligence & Expert Systems
34、 (IEA/AIE ) C. Australia:Springer Publishing House, 2002:17-194學位論文序號作者文獻題名D. 保存地:保存單位,年份例如:6 張和生地質力學系統(tǒng)理論D. 太原:太原理工大學,19985報告序號作者文獻題名R報告地:報告會主辦單位,年份例如:7 馮西橋核反應堆壓力容器的LBB分析R. 北京:清華大學核能技術設計研究院,19976專利文獻序號專利所有者專利題名P. 專利國別:專利號,發(fā)布日期例如:8 姜錫洲一種溫熱外敷藥制備方案P. 中國專利:881056078,1983-08-127國際、國家標準序號標準代號,標準名稱S. 出版地:出
35、版者,出版年例如:9 GB/T 161591996,漢語拼音正詞法基本規(guī)則S.北京:中國標準出版社,19968報紙文章序號作者文獻題名N.報紙名,出版日期(版次)例如:10 毛峽情感工學破解舒服之迷N. 光明日報,2000-4-17(B1).9電子文獻序號作者電子文獻題名文獻類型/載體類型. 電子文獻的出版或可獲得地址,發(fā)表或更新的期/引用日期(任選)例如:21王明亮中國學術期刊標準化數(shù)據(jù)庫系統(tǒng)工程的EB/OL. pub/wml.txt/9808 10-2.html, 1998-08-16/1998-10-04外國作者的姓名書寫格式一般為:名的縮寫、姓。例如A. Johnson,R. O. D
36、uda 1作者1,作者2. 論文名J. 雜志名,年,卷(期)XX頁XXX頁。附件1 語音“0”的各狀態(tài)頻譜圖純凈語音1. 未分頻:附錄:不宜放在正文中的資料,如調查問卷、公式推演、編寫程序、原始數(shù)據(jù)附表、修改稿等等。可放入設計(論文)資料袋或采用其他形式袋裝保存。13英文標題的首個單詞的首字母必須大寫,標題的單詞的首字母需大寫(但是,連詞、介詞和虛詞等首字母都是小寫)單詞的非首字母都小寫。The Investigation of the Robust of Feature Extracted fromSpeech Signals in Additive Gaussian Noise EnvironmentsZhang Sanfeng 2010 Computer Science and Technology (Embeded Technology) Major, School of Information Engineering, Sanming UniversityAbstract:With incre
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年4月網(wǎng)絡搭建模擬試題及答案(附解析)
- 怎樣進行創(chuàng)新設計
- 3月汽車發(fā)動機檢修試題含參考答案解析
- 安全項目風險管理考核試卷
- 安全運維招聘注意事項
- 肥料制造智能化控制考核試卷
- 文化創(chuàng)意創(chuàng)業(yè)生態(tài)系統(tǒng)考核試卷
- 電力工程設計考核試卷
- 學習編寫安全專項施工方案
- 2025年煤炭采掘機械設備合作協(xié)議書
- 八年級數(shù)學題試卷及答案
- 2025年物業(yè)管理從業(yè)人員考試試卷及答案
- 比亞迪新能源汽車業(yè)務競爭戰(zhàn)略:基于全產(chǎn)業(yè)鏈優(yōu)勢的多維剖析與展望
- 教研員考試試題及答案
- 河北檢察院試題及答案
- 2025年下半年山東濰坊市工程技師學院招聘事業(yè)單位控制總量教師35人易考易錯模擬試題(共500題)試卷后附參考答案
- 部編版語文四年級下冊 26《寶葫蘆的秘密》整本書教學設計
- MOOC 大學英語聽說譯-河南理工大學 中國大學慕課答案
- 《水電工程巖爆風險評估技術規(guī)范》(NB-T 10143-2019)
- 自然資源管理業(yè)務培訓學習心得體會(二)
- 【護理講課】肺炎病人的護理PPT
評論
0/150
提交評論