版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、中北大學課 程 設(shè) 計 說 明 書學生姓名: 蔣寶哲 學 號: 24 學生姓名: 甕澤勇 學 號: 42 學生姓名: 侯戰(zhàn)祎 學 號: 47 學 院: 信息商務(wù)學院 專 業(yè): 電子信息工程 題 目:信息處理實踐:語音信號的時域特征分析 指導教師:徐美芳 職稱: 講師 2013 年 6 月 28 日 中北大學課程設(shè)計任務(wù)書 2012-2013 學年第 二 學期學 院: 信息商務(wù)學院 專 業(yè): 電子信息工程 學生姓名: 蔣寶哲 學 號: 24 學生姓名: 甕澤勇 學 號: 42 學生姓名: 侯戰(zhàn)祎 學 號: 47 課程設(shè)計題目:信息處理實踐:語音信號的時域特征分析 起 迄 日 期: 2013年6
2、月7日2013年6月 28 日 課程設(shè)計地點: 學院樓201實驗室、510實驗室、608實驗室 指 導 教 師: 徐美芳 系 主 任: 王浩全 下達任務(wù)書日期: 2013 年 6 月 7 日課 程 設(shè) 計 任 務(wù) 書1設(shè)計目的:通過設(shè)計,掌握USB總線或PCI總線的基本結(jié)構(gòu),了解基于USB總線或PCI總線A/D卡的通用結(jié)構(gòu)。較全面地掌握語音信號的時域特征的基本理論、原理和實現(xiàn)手段,較系統(tǒng)地分析語音信號的時域特征,使學生具有一定綜合分析問題和解決問題的能力。2設(shè)計內(nèi)容和要求(包括原始數(shù)據(jù)、技術(shù)參數(shù)、條件、設(shè)計要求等):原始數(shù)據(jù):仿真信號或?qū)嶒灢杉Z音信號。技術(shù)要求:(1)完成基于USB總線或PC
3、I總線A/D卡通用結(jié)構(gòu)報告;(2)通過A/D卡,利用高級語言編寫信號的采集、存儲和顯示程序。(3)完成題目所要求技術(shù):直接對語音信號的時域波形進行分析,提取的特征參數(shù)主要有:語音的短時能量,短時平均過零率,短時自相關(guān)函數(shù)等;通過仿真(實驗)驗證,編程實現(xiàn)各時域特征參數(shù)提取的處理和實現(xiàn)手段,并進行結(jié)果分析。設(shè)計要求:課程設(shè)計的目的在于培養(yǎng)學生的綜合素質(zhì),要求學生做到:(1)根據(jù)題目要求查閱有關(guān)資料,確定方案,寫出設(shè)計方案;(2)根據(jù)對選題的理解,消化查閱資料,給出相關(guān)的實現(xiàn)算法和理論根據(jù);(3) 在Matlab或VC環(huán)境下,實現(xiàn)算法,并給出仿真結(jié)果;(4) 對結(jié)果進行分析總結(jié)3設(shè)計工作任務(wù)及工作
4、量的要求包括課程設(shè)計計算說明書(論文)、圖紙、實物樣品等:設(shè)計工作任務(wù):(1) 了解選題背景,掌握基本技術(shù),制定設(shè)計思路,寫出設(shè)計方案。(2) 完成設(shè)計內(nèi)容:包括算法和程序設(shè)計;實驗驗證及技術(shù)改進,寫出設(shè)計說明書。(3) 設(shè)計答辯。工作量的要求:(1) 通過查閱資料了解選題相關(guān)的基本理論、原理以及技術(shù)背景,理解選題意義;(2) 掌握USB總線或PCI總線的基本結(jié)構(gòu),了解基于USB總線或PCI總線A/D卡的通用結(jié)構(gòu);(3) 完成語音信號特征提取;(4) 通過實驗仿真驗證算法的可行性;(5) 給出技術(shù)總結(jié)。課 程 設(shè) 計 任 務(wù) 書4主要參考文獻:1 L.R. Rabiner, B.H. Juan
5、g. Fundamentals of Speech Recognition. Prentice Hall, Englewood Cliffs,1993. 清華大學出版社(影?。?,2002年.2胡航. 語音信號處理(修訂版),哈爾濱工業(yè)大學出版社,2002年.3 吳家安等. 語音編碼技術(shù)及應(yīng)用,機械工業(yè)出版社,2006年.4 韓繼慶等. 語音信號處理,清華大學出版社,2004年.5 D.G.Childers. Matlab之語音處理與合成工具箱(影印版),清華大學出版社,2004年.6 Thomas F. Quatieri著,趙勝輝等譯,離散時間語音信號處理原理與應(yīng)用,電子工業(yè)出版社,2004.
6、5設(shè)計成果形式及要求:仿真結(jié)果;課程設(shè)計說明書。6工作計劃及進度:2013年6月7日 6月15日:理解選題,查資料,掌握USB總線或PCI總線的基本結(jié)構(gòu),基于USB總線或PCI總線A/D卡的通用結(jié)構(gòu);6月16日 6月19日:在教師指導下給出設(shè)計方案;6月20日 6月28日:在指導教師輔導下完成實驗;撰寫課程設(shè)計說明書; 6月28日:答辯系主任審查意見: 簽字: 年 月 日語音信號的采集與分析摘 要 語音信號的采集與分析技術(shù)是一門涉及面很廣的交叉科學,它的應(yīng)用和發(fā)展與語音學、聲音測量學、電子測量技術(shù)以及數(shù)字信號處理等學科緊密聯(lián)系。其中語音采集和分析儀器的小型化、智能化、數(shù)字化以及多功能化的發(fā)展越
7、來越快,分析速度較以往也有了大幅度的高。本文簡要介紹了語音信號采集與分析的發(fā)展史以及語音信號的特征、采集與分析方法,并通過PC機錄制自己的一段聲音,運用Matlab進行仿真分析,最后加入噪聲進行濾波處理,比較濾波前后的變化。關(guān)鍵詞:語音信號,采集與分析, Matlab0 引言通過語音傳遞倍息是人類最重要、最有效、最常用和最方便的交換信息的形式。語言是人類持有的功能聲音是人類常用的工具,是相互傳遞信息的最主要的手段。因此,語音信號是人們構(gòu)成思想疏通和感情交流的最主要的途徑。并且,由于語言和語音與人的智力活動密切相關(guān),與社會文化和進步緊密相連,所以它具有最大的信息容量和最高的智能水平?,F(xiàn)在,人類已
8、開始進入了信息化時代,用現(xiàn)代手段研究語音信號,使人們能更加有效地產(chǎn)生、傳輸、存儲、獲取和應(yīng)用語音信息,這對于促進社會的發(fā)展具有十分重要的意義。 讓計算機能聽懂人類的語言,是人類自計算機誕生以來夢寐以求的想法。隨著計算機越來越向便攜化方向發(fā)展,隨著計算環(huán)境的日趨復雜化,人們越來越迫切要求擺脫鍵盤的束縛而代之以語音輸人這樣便于使用的、自然的、人性化的輸人方式。作為高科鼓應(yīng)用領(lǐng)域的研究熱點,語音信號采集與分析從理論的研究到產(chǎn)品的開發(fā)已經(jīng)走過了幾十個春秋并且取得了長足的進步。它正在直接與辦公、交通、金融、公安、商業(yè)、旅游等行業(yè)的語音咨詢與管理工業(yè)生產(chǎn)部門的語聲控制,電話、電信系統(tǒng)的自動撥號、輔助控制與
9、查詢以及醫(yī)療衛(wèi)生和福利事業(yè)的生活支援系統(tǒng)等各種實際應(yīng)用領(lǐng)域相接軌,并且有望成為下一代操作系統(tǒng)和應(yīng)用程序的用戶界面??梢?,語音信號采集與分析的研究將是一項極具市場價值和挑戰(zhàn)性的工作。我們今天進行這一領(lǐng)域的研究與開拓就是要讓語音信號處理技術(shù)走人人們的日常生活當中,并不斷朝更高目標而努力。語音信號采集與分析之所以能夠那樣長期地、深深地吸引廣大科學工作者去不斷地對其進行研究和探討,除了它的實用性之外,另一個重要原因是,它始終與當時信息科學中最活躍的前沿學科保持密切的聯(lián)系并且一起發(fā)展。語音信號采集與分析是以語音語言學和數(shù)字信號處理為基礎(chǔ)而形成的一門涉及面很廣的綜合性學科,與心理、生理學、計算機科學、通信
10、與信息科學以及模式識別和人工智能等學科都有著非常密切的關(guān)系。對語音信號采集與分析的研究一直是數(shù)字信號處理技術(shù)發(fā)展的重要推動力量。因為許多處理的新方法的提出,首先是在語音信號處理中獲得成功,然后再推廣到其他領(lǐng)域。1.語音信號的介紹1.1 語音信號的特點通過對大量語音信號的觀察和分析發(fā)現(xiàn),語音信號主要有下面兩個特點: 在頻域內(nèi),語音信號的頻譜分量主要集中在3003400Hz的范圍內(nèi)。利用這個特點,可以用一個防混迭的帶通濾波器將此范圍內(nèi)的語音信號頻率分量取出,然后按8kHz的采樣率對語音信號進行采樣,就可以得到離散的語音信號。 在時域內(nèi),語音信號具有“短時性”的特點,即在總體上,語音信號的特征是隨著
11、時間而變化的,但在一段較短的時間間隔內(nèi),語音信號保持平穩(wěn)。在濁音段表現(xiàn)出周期信號的特征,在清音段表現(xiàn)出隨機噪聲的特征。下面是一段語音信號的時域波形圖(圖2-1)和頻域圖(圖2-2),由這兩個圖可以看出語音信號的兩個特點。 圖2-1語音信號時域波形圖 圖2-2語音信號頻域波形圖Figure 2-1Speech signal time-domain waveform Figure 2-2 Frequency-domain speech signal waveform1.2語音信號的采集在將語音信號進行數(shù)字化前,必須先進行防混疊預濾波,預濾波的目的有兩個:抑制輸入信導各領(lǐng)域分量中頻率超出fs/2的所
12、有分量(fs為采樣頻率),以防止混疊干擾。抑制50Hz的電源工頻干擾。這樣,預濾波器必須是一個帶通濾波器,設(shè)其上、下截止顏率分別是fH和fL,則對于絕人多數(shù)語音編譯碼器,fH=3400Hz、fL60100Hz、采樣率為fs8kHz;而對丁語音識別而言,當用于電話用戶時,指標與語音編譯碼器相同。當使用要求較高或很高的場合時fH4500Hz或8000Hz、fL60Hz、fs10kHz或20kHz。為了將原始模擬語音信號變?yōu)閿?shù)字信號,必須經(jīng)過采樣和量化兩個步驟,從而得到時間和幅度上均為離散的數(shù)字語音信號。采樣也稱抽樣,是信號在時間上的離散化,即按照一定時間間隔t在模擬信號x(t)上逐點采取其瞬時值。
13、采樣時必須要注意滿足奈奎斯特定理,即采樣頻率fs必須以高于受測信號的最高頻率兩倍以上的速度進行取樣,才能正確地重建波它是通過采樣脈沖和模擬信號相乘來實現(xiàn)的。下圖時一段語音信號在采樣頻率44.1KHz情況下的頻譜圖。由圖可知,這段語音信號的頻率主要集中在1KHz左右,當采樣頻率為44.1KHz時,由于采樣頻率比較大,所以采樣點數(shù)就越密,所得離散信號就越逼近于原信號,頻譜也沒有發(fā)生混疊。對上述信號進行1/80采樣頻率抽取,即采樣頻率變?yōu)閷⒔?00Hz時,由于采樣頻率比較小,所以采樣點數(shù)就稀疏,所得離散信號就越偏離于原信號,頻譜也發(fā)生了混疊。在采樣的過程中應(yīng)注意采樣間隔的選擇和信號混淆:對模擬信號采
14、樣首先要確定采樣間隔。如何合理選擇t涉及到許多需要考慮的技術(shù)因素。一般而言,采樣頻率越高,采樣點數(shù)就越密,所得離散信號就越逼近于原信號。但過高的采樣頻率并不可取,對固定長度(T)的信號,采集到過大的數(shù)據(jù)量(N=T/t),給計算機增加不必要的計算工作量和存儲空間;若數(shù)據(jù)量(N)限定,則采樣時間過短,會導致一些數(shù)據(jù)信息被排斥在外。采樣頻率過低,采樣點間隔過遠,則離散信號不足以反映原有信號波形特征,無法使信號復原,造成信號混淆。根據(jù)采樣定理,當采樣頻率大于信號的兩倍帶寬時,采樣過程不會丟失信息,利用理想濾波器可從采樣信號中不失真地重構(gòu)原始信號波形。量化是對幅值進行離散化,即將振動幅值用二進制量化電平
15、來表示。量化電平按級數(shù)變化,實際的振動值是連續(xù)的物理量。具體振值用舍入法歸到靠近的量化電平上。 語音信號經(jīng)過預濾波和采樣后,由AD變換器變換為二址制數(shù)字碼。這種防混疊濾波通常與模數(shù)轉(zhuǎn)換器做在一個集成塊內(nèi),因此目前來說,語音信號的數(shù)字化的質(zhì)量還是有保證的。市面上購買到的普通聲卡在這方面做的都很好,語音聲波通過話筒輸入到聲卡后直接獲得的是經(jīng)過防混疊濾波、A/D變換、量化處理的離散的數(shù)字信號。在實際工作中,我們可以利用windows自帶的錄音機錄制語音文件,圖2-3是基于PC機的語音信號采集過程,聲卡可以完成語音波形的A/D轉(zhuǎn)換,獲得WAVE文件,為后續(xù)的處理儲備原材料。調(diào)節(jié)錄音機保存界面的“更改”
16、選項,可以存儲各種格式的WAVE文件。Windows自帶的錄音機聲音麥克風聲卡濾波采樣A/D轉(zhuǎn)換 Wav圖2-3 基于PC機的語音信號采集過程Figure 2-3 Voice PC-based signal acquisition process采集到語音信號之后,需要對語音信號進行分析,如語音信號的時域分析、頻譜分析、語譜圖分析以及加噪濾波等處理。2 語音信號的分析2.1語音信號分析技術(shù)語音信號分析是語音信號處理的前提和基礎(chǔ),只有分析出可表示語音信號本質(zhì)特征的參數(shù),才有可能利用這些參數(shù)進行高效的語音通信、語音合成和語音識別等處理8。而且,語音合成的音質(zhì)好壞,語音識別率的高低,也都取決于對語音
17、信號分橋的準確性和精確性。因此語音信號分析在語音信號處理應(yīng)用中具有舉足輕重的地位。貫穿于語音分析全過程的是“短時分析技術(shù)”。因為,語音信號從整體來看其特性及表征其本質(zhì)特征的參數(shù)均是隨時間而變化的,所以它是一個非乎穩(wěn)態(tài)過程,不能用處理乎穩(wěn)信號的數(shù)字信號處理技術(shù)對其進行分析處理。但是,由于不同的語音是由人的口腔肌肉運動構(gòu)成聲道某種形狀而產(chǎn)生的響應(yīng),而這種口腔肌肉運動相對于語音頻率來說是非常緩慢的,所以從另一方面看,雖然語音倍號具有時變特性,但是在一個短時間范圍內(nèi)(一般認為在1030ms的短時間內(nèi)),其特性基本保持不變即相對穩(wěn)定,因面可以將其看作是一個準穩(wěn)態(tài)過程,即語音信號具有短時平穩(wěn)性。所以任何語
18、音信號的分析和處理必須建立在“短時”的基礎(chǔ)上即進行“短時分析”,將語音信號分為一段一段來分析其特征參數(shù),其中每一段稱為一“幀”,幀長一般取為1030ms。這樣,對于整體的語音信號來講,分析出的是由每一幀特征參數(shù)組成的特征參數(shù)時間序列。根據(jù)所分析出的參數(shù)的性質(zhì)的不同,可將語音信號分析分為時域分析、頻域分析、倒領(lǐng)域分析等;時域分析方法具有簡單、計算量小、物理意義明確等優(yōu)點,但由于語音信號最重要的感知特性反映在功率譜中,而相位變化只起著很小的作用,所以相對于時域分析來說頻域分析更為重要。本文將簡要介紹時域分析、頻域分析以及語譜圖分析。2.2 語音信號的時域分析語音信號的時域分析就是分析和提取語音信號
19、的時域參數(shù)。進行語音分析時,最先接觸到并且也是最直觀的是它的時域波形。語音信號本身就是時域信號,因而時域分析是最早使用,也是應(yīng)用最廣泛的一種分析方法,這種方法直接利用語音信號的時域波形。時域分析通常用于最基本的參數(shù)分析及應(yīng)用,如語音的分割、預處理、大分類等。這種分析方法的特點是:表示語音信號比較直觀、物理意義明確。實現(xiàn)起來比較簡單、運算且少。可以得到語音的一些重要的參數(shù)。只使用示波器等通用設(shè)備,使用較為簡單等。語音信號的時域參數(shù)有短時能量、短時過零率、短時白相關(guān)函數(shù)和短時平均幅度差函數(shù)等,這是語音信號的一組最基本的短時參數(shù),在各種語音信號數(shù)字處理技術(shù)中都要應(yīng)用6。在計算這些參數(shù)時使用的一般是方
20、窗或漢明窗。2.2.1 短時能量及短時平均幅度分析設(shè)語音波形時域信號為x(l)、加密分幀處理后得到的第n幀語音信號為 Xn(m),則Xn(m)滿足下式: (3-1) (3-2)其中,n0,1T,2T,并且N為幀長,T為幀移長度。設(shè)第n幀語音信號Xn(m)的短時能量用En表示,則其計算公式如下: (3-3)En是一個度量語音信號幅度值變化的函數(shù),但它有一個缺陷,即它對高電平非常敏感(因為它計算時用的是信號的平方)。為此可采用另一個度量語音信號幅度值變化的函數(shù)即短時平均幅度函數(shù)Mn,它定義為: (3-4)Mn也是一帕語音信號能量大小的表征,它與En的區(qū)別在于計算時小取樣值和大取樣值不會因取平方而造
21、成較大差異,在某些應(yīng)用領(lǐng)域呻會帶來一些好處。 短時能量和短時平均幅度函數(shù)的主要用途有:可以區(qū)分濁音段與清音段,因為濁音時En值比清音時大的多??梢杂脕韰^(qū)分聲母與韻母的分界,無聲與有盧的分界,連字(指字之間無間隙)的分界等。作為一種超音段信息,用于語音識別中。2.2.2短時過零率分析短時過零率表示一幀語音中語音信號波形穿過橫軸(零電平)的次數(shù)。過零分析是語音時域分析中最簡單的一種。對于連續(xù)語音信號,過零即意味著時域波形通過時間軸;而對于離散信號,如果相鄰的取樣值改變符號則稱為過零。過零率就是樣本改變符號的次數(shù)。定義語音信號Xn(m)的短時過零率Zn為: (3-5)式中,sgn 是符號函數(shù),即:
22、(3-6)在實際中求過零率參數(shù)時,需要十分注意的一個問題是如果輸入信號中包含有50Hz的工頻干擾或者A/D變換器的工作點有偏移(這等效于輸入信號有直流偏移),往往會使計算的過零率參數(shù)很不準確。為了解決前一個問題,A/D變換器前的防混疊帶通濾波器的低端截頻應(yīng)高于50Hz,以有效地抑制電源干擾。對于后一個問題除了可以采用低直流漂移器件外,也可以在軟件上加以解決,這就是算出每一幀的直流分量并予以濾除。對語音信號進行分析,發(fā)現(xiàn)發(fā)濁音時,盡管聲道有若干個共振峰,但由于聲門波引起譜的高頻跌落,所以其話音能量約集中在3kHz以下。而發(fā)清音時,多數(shù)能量出現(xiàn)在較高頻率上。高頻就意味著高的平均過零率,低頻意味著低
23、的平均過零率,所以可以認為濁音時具有較低的過零率,而清音時具有較高的過零率。當然,這種高低僅是相對而言,并沒方精確的數(shù)值關(guān)系。 利用短時平均過零率還可以從背景噪聲中找出語音信號,可用于判斷寂靜無聲段和有聲段的起點和終點位置。在孤立詞的語音識別中,必須要在一連串連續(xù)的語音信號中進行適當分割,用以確定一個一個單詞的語音信號,即找出每一個單詞的開始和終止位置,這在語音處理中是一個基本問題。此時,在背景噪聲較小時用平均能量識別較為有效,而在背景噪聲較大時用平均過零率識別較為有效。但是研究表明,在以某些音為開始或結(jié)尾時如當弱摩擦音 (如f、h等音素)、弱燃破音(如p、t、k等音素)為語音的開頭或結(jié)尾;以
24、鼻音(如n、 m等音素)為語音的結(jié)尾時只用其中一個參量來判別語音的起點和終點是有困難的,必須同時使用這兩個參數(shù)。圖3-1是用Mtalab仿真一段語音信號時域波形的短時能量和短時平均過零率。圖3-1語音信號的短時能量和短時平均過零率Figure 3-1 Short-term speech signal energy and zero-crossing rate of the average short-term2.3 語音信號的語譜圖 語音的時域分析和頻域分析是語音分析的兩種重要方法。顯然這兩種單獨分析的方法均有局限性:時域分析對語音信號的頻率特性沒有直觀的了解;而頻域分析出的特征中又沒有語音信
25、號隨時間的變化關(guān)系:語音信號是時變信號,所以其頻譜也是隨時間變化的。但是由于語音信號隨時間變化是很緩慢的,因而在一段短時間內(nèi)(如1030ms之間,即所謂的一幀之內(nèi))可以認為其頻譜是固定不變的,這種頻譜又稱為短時譜。短時譜只能反映語音信號的靜態(tài)頻率特性,不能反映語音信號的動態(tài)頻率特性。因此,人們致力于研究語音的時頻分析特性。把和時序相關(guān)的傅里葉分析的顯示圖形稱為語譜圖(Sonogram,或者Spectrogram)。語諾圖是一種三維頻譜,它是表示語音頻譜隨時間變化的圖形,其縱軸為頻率,橫軸為時間,任一給定頻率成分在給定時刻的強弱用相應(yīng)點的灰度或色調(diào)的濃談來表示。用語譜圖分析語音又稱為語譜分析。語
26、譜圖中顯示了大量的與語音的語句特性有關(guān)的信息,它綜合了頻譜圖和時域波形的特點,明顯地顯示出語音頻譜隨時間的變化情況,或者說是一種動態(tài)的頻譜;記錄這種頻譜的儀器就是語譜儀。語譜儀實際上是一個帶通濾波器組的輸出隨時間發(fā)生連續(xù)變化,連續(xù)重復進行語音信號頻率分析的儀器。帶通濾波器有兩種帶寬可供選擇:窄帶為45Hz,寬帶為300Hz。窄帶語譜圖有良好的頻率分辨率,有利于顯示基音頻率及其各次諧波,但它的時間分辨率較差,不利于觀察共振峰(盧道諧振)的變化;而寬帶語譜圖正相反,具有良好的時間分辨率及較差的頻率分辨率。寬帶語譜圖能給出語音的共振峰頻率及清輔音的能量匯集區(qū),在話譜圖里共振峰呈現(xiàn)為黑色的條紋。 可以
27、利用語譜儀測量語譜圖的方法來確定語音參數(shù),例如共振峰頻率及基音頻率。語語圖的實際應(yīng)用是用于確定出講話人的本性。語譜圖上因其不同的黑白程度,形成了個同的紋路,稱之為“聲紋”,它因人而異,即不同講話者語譜圖的聲紋是不同的。因而可以利用聲紋鑒別不問的講話人。這與不向的人有不同的指紋,根據(jù)指紋可以區(qū)別不同的人是一個道理。雖然對采用語譜圖的講活人識別技術(shù)的可靠性過存在相當人的懷疑,但目前這一技術(shù)已在司法法庭小得到某些認可及采用11。 圖3-3是用Mtalab繪制的一個寬帶語譜圖,其中橫抽坐標為時間,縱軸坐標為頻率,語句內(nèi)容為 “河南農(nóng)業(yè)大學理學院”,它的發(fā)音在圖下方以音標表示。同時給出了相應(yīng)的語音的時域
28、波形。語譜圖中的花紋有橫扛(Bar)、亂紋和豎直條等。橫杠是與時間軸平行的幾條深黑色帶紋,它們相應(yīng)于短時譜中的幾個凸出點,也就是共振峰。從橫扛對應(yīng)的頻率和寬度可以確定相應(yīng)的共振峰頻率和帶寬。在一個語音段的語譜圖中,有沒有橫扛出現(xiàn)是判斷它是否是濁音的重要標志 。豎直條(又叫沖直條)是語譜圖中出現(xiàn)與時間軸垂直的一條窄黑條。每個豎直條相當于一個基音,條紋的起點相當于聲門脈沖的起點,條紋之間的距離表示基音周期。條紋越密表示越音頻率越高。2.22.42.62.833.23.43.6x 104-0.0500.05中北大學信息商務(wù)學院0501001502002503003504005010015020025
29、0圖2-3譜圖Figure 3-3, anguage spectra3語音信號的綜合仿真分析錄制一段自己的語音信號,并對錄制的信號進行采樣;畫出采樣后語音信號的時域波形和頻譜圖;圖31原始語音信號Figure 31 the original speech signal由圖可知這段語音信號頻率主要集中在1000hz左右。對語音信號進行調(diào)制,為了減少在傳輸時的耗損,人們一般是先對傳輸信號進行特殊處理,然后再傳遞。把原始的待傳信號托附到高頻振蕩的過程稱為調(diào)制。我們知道音頻信號的頻率在我們的聽覺范圍內(nèi),音頻信號在無線傳輸?shù)倪^程中會受到各種聲音的干擾而產(chǎn)生能量消耗!因此限制了傳輸?shù)木嚯x!所以在現(xiàn)實的傳送
30、過程中要現(xiàn)對語音信號進行調(diào)制再發(fā)送出去!下面是對一段語音信號的調(diào)制仿真圖,載波頻率為fc=20000。圖3-2調(diào)制后的語音信號Figure3-2 after the speech signal modulation由圖可知,經(jīng)過調(diào)制后的語音信號頻譜都搬移到fc=20000的頻段。用經(jīng)過調(diào)制的信號與原信號疊加。圖3-3調(diào)制后的語音信號+原始語音信號Figure 3-3 voice modulated signal + the original speech signal由圖可知低頻部分是原始信號,高頻部分是經(jīng)過調(diào)制后的信號。設(shè)計數(shù)字濾波器和畫出頻率響應(yīng)根據(jù)語音信號的特點給出有關(guān)濾波器的性能指標:
31、低通濾波器性能指標,fp=1000Hz,fc=1200 Hz, As=100dB,Ap=1dB;用雙線性變換法設(shè)計的低通濾波器的程序如下: fp=1000;fc=1200;As=100;Ap=1;fs=22050; wc=2*fc/fs;wp=2*fp/fs; n,wn=ellipord(wp,wc,Ap,As); b,a=ellip(n,Ap,As,wn); freqz(b,a,512,fs); 濾波器的頻率響應(yīng)圖4-4濾波器的頻率響應(yīng)Figure 3-4 Frequency response of the filter進行低通濾波,比較濾波前后語音信號的波形及頻譜。總 結(jié)通過這次課程設(shè)計,
32、使我對語音信號有了全面的認識,對數(shù)字信號處理的知識又有了深刻的理解,在之前數(shù)字信號與處理的學習以及完成課后的作業(yè)的過程中,已經(jīng)使用過MATLAB,對其有了一些基礎(chǔ)的了解和認識。通過這次練習是我進一步了解了信號的產(chǎn)生、采樣及頻譜分析的方法。 以及其中產(chǎn)生信號和繪制信號的基本命令和一些基礎(chǔ)編程語言。讓我感受到只有在了解課本知識的前提下,才能更好的應(yīng)用這個工具;并且熟練的應(yīng)用MATLAB也可以很好的加深我對課程的理解,方便我的思維。這次設(shè)計使我了解了MATLAB的使用方法,學會分析濾波器的優(yōu)劣和性能,提高了分析和動手實踐能力。同時我相信,進一步加強對MATLAB的學習與研究對我今后的學習將會起到很大
33、的幫助。附錄一:%語音信號時域頻域分析y,Fs,bits=wavread(2.wav);%讀出信號,采樣率和采樣位數(shù)。 y=y(:,1);%我這里假設(shè)你的聲音是雙聲道,我只取單聲道作分析,如果你想分析另外一個聲道,請改成y=y(:,2) sigLength=length(y); Y = fft(y,sigLength); Pyy = Y.* conj(Y) / sigLength; halflength=floor(sigLength/2); f=Fs*(0:halflength)/sigLength; figure;plot(f,Pyy(1:halflength+1);xlabel(Freq
34、uency(Hz); t=(0:sigLength-1)/Fs; figure;plot(t,y);xlabel(Time(s);附錄二:%抽取的源程序y,fs,bs=wavread(d:01.wav,25000,75000);y=y(:,1);lg=length(y);yx=(0:(lg-1)*fs/lg;yx=yx(1:lg/2);% sound(y,fs);figure(1);subplot(211);plot(y);title(原始信號);subplot(212);yf=abs(fft(y);yf=yf(1:lg/2);plot(yx,yf);ycq=zeros(1,lg); %先將抽
35、取后的值全設(shè)為零 for i=1:80:lg; %通過循環(huán),每隔80個點將抽取后的值賦值為原函數(shù)的 ycq(i)=y(i); %采樣值 end sound(ycq,fs);figure(2);subplot(211);plot(ycq);title(抽取后的信號);subplot(212);ycqf=abs(fft(ycq);ycqf=ycqf(1:lg/2);plot(yx,ycqf);附錄三:“中北大學信息商務(wù)學院”語譜圖源程序:frmsize = 256; % 設(shè)置貞大小x,fs,nbits = wavread(3.wav); % 讀取語音文件x = filter(1 -0.95,1,x
36、); % 高頻預加重,抵消頻譜傾斜n = length(x); frmcnt = floor(n/frmsize); x = reshape(x(1:frmsize*frmcnt),frmsize,frmcnt); % 分幀xFFT = abs(fft(x); % 傅里葉譜xFFT = xFFT(1:frmsize/2,1:frmcnt); % 奈奎斯特頻率以內(nèi)是無效的xFFTdB = 20*log10(xFFT+eps); % 換算成分貝xFFTdB(xFFTdB+20) = +20; % 能量太高的截斷xFFTdB(xFFTdB-40) = -40; % 能量太低的截斷xFFTdB = (
37、xFFTdB+40); % 能量整理到 0,60 之間,當然你可以整理到0,255范圍subplot(2,1,1);plot(x(1:frmsize*frmcnt); title(河南農(nóng)業(yè)大學理學院); % 畫波形subplot(2,1,2);image(flipud(xFFTdB); colormap(jet)% 畫語譜圖附錄四:語音信號的綜合仿真分析程序:y,fs,bits=wavread(3.wav);% sound(y,fs,bits);Y=fft(y,40000);%采樣點數(shù)40000figure(1);subplot(211);plot(y);title(原始信號波形);subpl
38、ot(212);plot(abs(Y);title(原始信號頻譜);fc=20000;%載波頻率y1=modulate(y,fc,fs,fm);%對原語音信號調(diào)制Y1=fft(y1,40000);%采樣點數(shù)40000figure(2);subplot(211);plot(y1);title(調(diào)制后信號波形);subplot(212);plot(abs(Y1);title(調(diào)制后信號頻譜);% sound(y1);y2=y+y1;Y2=fft(y2,40000);%采樣點數(shù)40000figure(3);subplot(211);plot(y2);title(調(diào)制信號+原始信號波形);subplo
39、t(212);plot(abs(Y2);title(調(diào)制信號+原始信號頻譜);% sound(y2);figure(4);fp=1000;fc=1200;As=100;Ap=1;fs1=22050;wc=2*fc/fs1;wp=2*fp/fs1;n,wn=ellipord(wp,wc,Ap,As);b,a=ellip(n,Ap,As,wn);freqz(b,a,512,fs1); x=filter(b,a,y2);X=fft(x,40000);figure(5);subplot(211);plot(x);title(低通濾波后信號波形);subplot(212);plot(abs(X);tit
40、le(低通濾波后信號頻譜); sound(x,40000);附錄五:%短時能量,短時過零率7% function x1,x2=vad(x)x,Fs,bits = wavread(one)specgram(x,240,8000,80);x=double(x);x=x/max(abs(x);%將幅度歸一化到-1,1framelen=240;frameinc=80;%設(shè)定幀長為240幀移為80amp1=10;amp2=2;zcr1=10;zcr2=5;maxsilence=3;minlen=15;status=0;count=0;silence=0;temp1=enframe(x(1:length(x)-1),framelen,frameinc);temp2=enframe(x
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 制造業(yè)重組合作協(xié)議書
- 大班繪畫活動:畫表情
- 2024年安陸買房合同范本大全
- 黃陂區(qū)民事糾紛協(xié)議書范本范本
- 家庭婚姻協(xié)議書范文范本模板
- 自行車山地車轉(zhuǎn)讓協(xié)議書范文
- 人教版英語八年級下冊 Unit 2 單元鞏固練
- 藝術(shù)文化客戶開發(fā)合作協(xié)議書
- 亂扔垃圾講解
- 老年護理人員職業(yè)道德培訓方案
- 神經(jīng)阻滯與術(shù)后鎮(zhèn)痛課件
- 慢性鼻竇炎臨床診療指南許庚
- 冷拉扁鋼規(guī)格表
- 消防控制室的操作與管理-消防聯(lián)動控制系統(tǒng)課件
- 《無人機概述及系統(tǒng)組成》考試復習題庫(含解析)
- 新疆小麥高產(chǎn)栽培技術(shù)
- 考察領(lǐng)導談話怎么評價領(lǐng)導【六篇】
- 醫(yī)院停水、停電演練腳本
- 幼兒園繪本故事:《我不知道我是誰》
- 18項核心制度完整版
- 三位數(shù)乘兩位數(shù)筆算乘法 說課稿
評論
0/150
提交評論