版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第一章 語(yǔ)音信號(hào)的特點(diǎn)與采集第一節(jié) 語(yǔ)音信號(hào)采集的介紹在Matlab環(huán)境中,主要可以通過(guò)以下幾種方法驅(qū)動(dòng)聲卡,采集語(yǔ)音信號(hào): 1將聲卡作為對(duì)象處理采集語(yǔ)音信號(hào)Matlab將聲卡作為對(duì)象處理,其后的一切操作都不與硬件直接相關(guān),而是通過(guò)對(duì)該對(duì)象的操作來(lái)作用于硬件設(shè)備(聲卡)。操作時(shí)首先要對(duì)聲卡產(chǎn)生一個(gè)模擬輸入對(duì)象(ai),給ai對(duì)象添加一個(gè)通道設(shè)置采樣頻率后,就可以啟動(dòng)設(shè)備對(duì)象,開(kāi)始采集數(shù)據(jù),采集完成后停止對(duì)象并刪除對(duì)象。2調(diào)用wavrecord功能函數(shù)采集語(yǔ)音信號(hào)。wavrecord功能函數(shù)只適用于windows95/98/N平臺(tái),它使用windows聲音輸入設(shè)備錄制聲音。函數(shù)調(diào)用方式:wavr
2、ecord(N,fs,ch,nbits); N:采集的樣本數(shù)據(jù)量; fs:樣本采集頻率,為8000Hz、11025Hz、22050Hz和44100Hz之一,默認(rèn)值為11025Hz; ch:樣本采集通道,1為單聲道,2為雙聲道,默認(rèn)值為1(單聲道); nbits:每個(gè)樣本的位數(shù)(或稱(chēng)解析度), double、single或int16為16位,uint8為8位; 3運(yùn)用audiorecorder對(duì)象采集語(yǔ)音信號(hào)audiorecorder(fs,nbits,ch)可以創(chuàng)設(shè)一個(gè)audiorecorder對(duì)象。fs:樣本采集頻率,為8000Hz、11025Hz、22050Hz和44100Hz之一,默認(rèn)值
3、為8000Hz; nbits:每個(gè)樣本的位數(shù),8位或16位,默認(rèn)值為8位; ch:樣本采集通道,1為單聲道,2為雙聲道,默認(rèn)值為1(單聲道); audiorecorder對(duì)象創(chuàng)設(shè)后,就可以進(jìn)行相應(yīng)的錄音、暫停、停止、播放以及數(shù)據(jù)讀取等操作。第二節(jié) 語(yǔ)音信號(hào)的特點(diǎn) 通過(guò)對(duì)大量語(yǔ)音信號(hào)的觀察和分析發(fā)現(xiàn),語(yǔ)音信號(hào)主要有下面兩個(gè)特點(diǎn): 在頻域內(nèi),語(yǔ)音信號(hào)的頻譜分量主要集中在3003400Hz的范圍內(nèi)。利用這個(gè)特點(diǎn),可以用一個(gè)防混迭的帶通濾波器將此范圍內(nèi)的語(yǔ)音信號(hào)頻率分量取出,然后按8kHz的采樣率對(duì)語(yǔ)音信號(hào)進(jìn)行采樣,就可以得到離散的語(yǔ)音信號(hào)。 在時(shí)域內(nèi),語(yǔ)音信號(hào)具有“短時(shí)性”的特點(diǎn),即在總體上,語(yǔ)音信
4、號(hào)的特征是隨著時(shí)間而變化的,但在一段較短的時(shí)間間隔內(nèi),語(yǔ)音信號(hào)保持平穩(wěn)。在濁音段表現(xiàn)出周期信號(hào)的特征,在清音段表現(xiàn)出隨機(jī)噪聲的特征。下面是一段語(yǔ)音信號(hào)的時(shí)域波形圖(圖1-1)和頻域圖(圖1-2),由這兩個(gè)圖可以看出語(yǔ)音信號(hào)的兩個(gè)特點(diǎn)。 圖1-1語(yǔ)音信號(hào)時(shí)域波形圖 圖1-2語(yǔ)音信號(hào)頻域波形圖第三節(jié) 語(yǔ)音信號(hào)的采集在將語(yǔ)音信號(hào)進(jìn)行數(shù)字化前,必須先進(jìn)行防混疊預(yù)濾波,預(yù)濾波的目的有兩個(gè):抑制輸入信導(dǎo)各領(lǐng)域分量中頻率超出fs/2的所有分量(fs為采樣頻率),以防止混疊干擾。抑制50Hz的電源工頻干擾。這樣,預(yù)濾波器必須是一個(gè)帶通濾波器,設(shè)其上、下截止顏率分別是fH和fL,則對(duì)于絕大多數(shù)語(yǔ)音編譯碼器,fH
5、=3400Hz、fL60100Hz、采樣率為fs8kHz;而對(duì)語(yǔ)音識(shí)別而言,當(dāng)用于電話(huà)用戶(hù)時(shí),指標(biāo)與語(yǔ)音編譯碼器相同。當(dāng)使用要求較高或很高的場(chǎng)合時(shí)fH4500Hz或8000Hz、fL60Hz、fs10kHz或20kHz。為了將原始模擬語(yǔ)音信號(hào)變?yōu)閿?shù)字信號(hào),必須經(jīng)過(guò)采樣和量化兩個(gè)步驟,從而得到時(shí)間和幅度上均為離散的數(shù)字語(yǔ)音信號(hào)。采樣也稱(chēng)抽樣,是信號(hào)在時(shí)間上的離散化,即按照一定時(shí)間間隔t在模擬信號(hào)x(t)上逐點(diǎn)采取其瞬時(shí)值。采樣時(shí)必須要注意滿(mǎn)足奈奎斯特定理,即采樣頻率fs必須以高于受測(cè)信號(hào)的最高頻率兩倍以上的速度進(jìn)行取樣,才能正確地重建波它是通過(guò)采樣脈沖和模擬信號(hào)相乘來(lái)實(shí)現(xiàn)的。在采樣的過(guò)程中應(yīng)注意
6、采樣間隔的選擇和信號(hào)混淆:對(duì)模擬信號(hào)采樣首先要確定采樣間隔。如何合理選擇t涉及到許多需要考慮的技術(shù)因素。一般而言,采樣頻率越高,采樣點(diǎn)數(shù)就越密,所得離散信號(hào)就越逼近于原信號(hào)。但過(guò)高的采樣頻率并不可取,對(duì)固定長(zhǎng)度(T)的信號(hào),采集到過(guò)大的數(shù)據(jù)量(N=T/t),給計(jì)算機(jī)增加不必要的計(jì)算工作量和存儲(chǔ)空間;若數(shù)據(jù)量(N)限定,則采樣時(shí)間過(guò)短,會(huì)導(dǎo)致一些數(shù)據(jù)信息被排斥在外。采樣頻率過(guò)低,采樣點(diǎn)間隔過(guò)遠(yuǎn),則離散信號(hào)不足以反映原有信號(hào)波形特征,無(wú)法使信號(hào)復(fù)原,造成信號(hào)混淆。根據(jù)采樣定理,當(dāng)采樣頻率大于信號(hào)的兩倍帶寬時(shí),采樣過(guò)程不會(huì)丟失信息,利用理想濾波器可從采樣信號(hào)中不失真地重構(gòu)原始信號(hào)波形。量化是對(duì)幅值進(jìn)
7、行離散化,即將振動(dòng)幅值用二進(jìn)制量化電平來(lái)表示。量化電平按級(jí)數(shù)變化,實(shí)際的振動(dòng)值是連續(xù)的物理量。具體振值用舍入法歸到靠近的量化電平上。 在實(shí)際工作中,我們可以利用windows自帶的錄音機(jī)錄制語(yǔ)音文件,圖2-3是基于PC機(jī)的語(yǔ)音信號(hào)采集過(guò)程,聲卡可以完成語(yǔ)音波形的A/D轉(zhuǎn)換,獲得WAVE文件,為后續(xù)的處理儲(chǔ)備原材料。調(diào)節(jié)錄音機(jī)保存界面的“更改”選項(xiàng),可以存儲(chǔ)各種格式的WAVE文件。Windows自帶的錄音機(jī)聲音麥克風(fēng)聲卡濾波采樣A/D轉(zhuǎn)換 Wav圖1-3 基于PC機(jī)的語(yǔ)音信號(hào)采集過(guò)程采集到語(yǔ)音信號(hào)之后,需要對(duì)語(yǔ)音信號(hào)進(jìn)行分析,如語(yǔ)音信號(hào)的時(shí)域分析、頻譜分析、語(yǔ)譜圖分析以及加噪濾波等處理。第二章
8、語(yǔ)音信號(hào)的分析第一節(jié) 語(yǔ)音信號(hào)分析技術(shù)語(yǔ)音信號(hào)分析是語(yǔ)音信號(hào)處理的前提和基礎(chǔ),只有分析出可表示語(yǔ)音信號(hào)本質(zhì)特征的參數(shù),才有可能利用這些參數(shù)進(jìn)行高效的語(yǔ)音通信、語(yǔ)音合成和語(yǔ)音識(shí)別等處理。而且,語(yǔ)音合成的音質(zhì)好壞,語(yǔ)音識(shí)別率的高低,也都取決于對(duì)語(yǔ)音信號(hào)分橋的準(zhǔn)確性和精確性。因此語(yǔ)音信號(hào)分析在語(yǔ)音信號(hào)處理應(yīng)用中具有舉足輕重的地位。貫穿于語(yǔ)音分析全過(guò)程的是“短時(shí)分析技術(shù)”。因?yàn)?,語(yǔ)音信號(hào)從整體來(lái)看其特性及表征其本質(zhì)特征的參數(shù)均是隨時(shí)間而變化的,所以它是一個(gè)非乎穩(wěn)態(tài)過(guò)程,不能用處理乎穩(wěn)信號(hào)的數(shù)字信號(hào)處理技術(shù)對(duì)其進(jìn)行分析處理。但是,由于不同的語(yǔ)音是由人的口腔肌肉運(yùn)動(dòng)構(gòu)成聲道某種形狀而產(chǎn)生的響應(yīng),而這種口腔
9、肌肉運(yùn)動(dòng)相對(duì)于語(yǔ)音頻率來(lái)說(shuō)是非常緩慢的,所以從另一方面看,雖然語(yǔ)音倍號(hào)具有時(shí)變特性,但是在一個(gè)短時(shí)間范圍內(nèi)(一般認(rèn)為在1030ms的短時(shí)間內(nèi)),其特性基本保持不變即相對(duì)穩(wěn)定,因面可以將其看作是一個(gè)準(zhǔn)穩(wěn)態(tài)過(guò)程,即語(yǔ)音信號(hào)具有短時(shí)平穩(wěn)性。所以任何語(yǔ)音信號(hào)的分析和處理必須建立在“短時(shí)”的基礎(chǔ)上即進(jìn)行“短時(shí)分析”,將語(yǔ)音信號(hào)分為一段一段來(lái)分析其特征參數(shù),其中每一段稱(chēng)為一“幀”,幀長(zhǎng)一般取為1030ms。這樣,對(duì)于整體的語(yǔ)音信號(hào)來(lái)講,分析出的是由每一幀特征參數(shù)組成的特征參數(shù)時(shí)間序列。根據(jù)所分析出的參數(shù)的性質(zhì)的不同,可將語(yǔ)音信號(hào)分析分為時(shí)域分析、頻域分析、倒領(lǐng)域分析等;時(shí)域分析方法具有簡(jiǎn)單、計(jì)算量小、物理
10、意義明確等優(yōu)點(diǎn),但由于語(yǔ)音信號(hào)最重要的感知特性反映在功率譜中,而相位變化只起著很小的作用,所以相對(duì)于時(shí)域分析來(lái)說(shuō)頻域分析更為重要。本文將簡(jiǎn)要介紹時(shí)域分析、頻域分析。第二節(jié) 語(yǔ)音信號(hào)的時(shí)域分析語(yǔ)音信號(hào)的時(shí)域分析就是分析和提取語(yǔ)音信號(hào)的時(shí)域參數(shù)。進(jìn)行語(yǔ)音分析時(shí),最先接觸到并且也是最直觀的是它的時(shí)域波形。語(yǔ)音信號(hào)本身就是時(shí)域信號(hào),因而時(shí)域分析是最早使用,也是應(yīng)用最廣泛的一種分析方法,這種方法直接利用語(yǔ)音信號(hào)的時(shí)域波形。時(shí)域分析通常用于最基本的參數(shù)分析及應(yīng)用,如語(yǔ)音的分割、預(yù)處理、大分類(lèi)等。這種分析方法的特點(diǎn)是:表示語(yǔ)音信號(hào)比較直觀、物理意義明確。實(shí)現(xiàn)起來(lái)比較簡(jiǎn)單、運(yùn)算且少??梢缘玫秸Z(yǔ)音的一些重要的參
11、數(shù)。只使用示波器等通用設(shè)備,使用較為簡(jiǎn)單等。語(yǔ)音信號(hào)的時(shí)域參數(shù)有短時(shí)能量、短時(shí)過(guò)零率、短時(shí)白相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù)等,這是語(yǔ)音信號(hào)的一組最基本的短時(shí)參數(shù),在各種語(yǔ)音信號(hào)數(shù)字處理技術(shù)中都要應(yīng)用。在計(jì)算這些參數(shù)時(shí)使用的一般是方窗或漢明窗。一 短時(shí)能量及短時(shí)平均幅度分析設(shè)語(yǔ)音波形時(shí)域信號(hào)為x(l)、加密分幀處理后得到的第n幀語(yǔ)音信號(hào)為 Xn(m),則Xn(m)滿(mǎn)足下式: (2-1) (2-2)其中,n0,1T,2T,并且N為幀長(zhǎng),T為幀移長(zhǎng)度。設(shè)第n幀語(yǔ)音信號(hào)Xn(m)的短時(shí)能量用En表示,則其計(jì)算公式如下: (2-3) En是一個(gè)度量語(yǔ)音信號(hào)幅度值變化的函數(shù),但它有一個(gè)缺陷,即它對(duì)高電平非常
12、敏感(因?yàn)樗?jì)算時(shí)用的是信號(hào)的平方)。為此可采用另一個(gè)度量語(yǔ)音信號(hào)幅度值變化的函數(shù)即短時(shí)平均幅度函數(shù)Mn,它定義為: (2-4) Mn也是一度量語(yǔ)音信號(hào)能量大小的表征,它與En的區(qū)別在于計(jì)算時(shí)小取樣值和大取樣值不會(huì)因取平方而造成較大差異,在某些應(yīng)用領(lǐng)域會(huì)帶來(lái)一些好處。 短時(shí)能量和短時(shí)平均幅度函數(shù)的主要用途有:可以區(qū)分濁音段與清音段,因?yàn)闈嵋魰r(shí)En值比清音時(shí)大的多??梢杂脕?lái)區(qū)分聲母與韻母的分界,無(wú)聲與有盧的分界,連字(指字之間無(wú)間隙)的分界等。作為一種超音段信息,用于語(yǔ)音識(shí)別中。二 短時(shí)過(guò)零率分析短時(shí)過(guò)零率表示一幀語(yǔ)音中語(yǔ)音信號(hào)波形穿過(guò)橫軸(零電平)的次數(shù)。過(guò)零分析是語(yǔ)音時(shí)域分析中最簡(jiǎn)單的一種。
13、對(duì)于連續(xù)語(yǔ)音信號(hào),過(guò)零即意味著時(shí)域波形通過(guò)時(shí)間軸;而對(duì)于離散信號(hào),如果相鄰的取樣值改變符號(hào)則稱(chēng)為過(guò)零。過(guò)零率就是樣本改變符號(hào)的次數(shù)。定義語(yǔ)音信號(hào)Xn(m)的短時(shí)過(guò)零率Zn為: (2-5)式中,sgn 是符號(hào)函數(shù),即: (2-6)在實(shí)際中求過(guò)零率參數(shù)時(shí),需要十分注意的一個(gè)問(wèn)題是如果輸入信號(hào)中包含有50Hz的工頻干擾或者A/D變換器的工作點(diǎn)有偏移(這等效于輸入信號(hào)有直流偏移),往往會(huì)使計(jì)算的過(guò)零率參數(shù)很不準(zhǔn)確。為了解決前一個(gè)問(wèn)題,A/D變換器前的防混疊帶通濾波器的低端截頻應(yīng)高于50Hz,以有效地抑制電源干擾。對(duì)于后一個(gè)問(wèn)題除了可以采用低直流漂移器件外,也可以在軟件上加以解決,這就是算出每一幀的直流
14、分量并予以濾除。對(duì)語(yǔ)音信號(hào)進(jìn)行分析,發(fā)現(xiàn)發(fā)濁音時(shí),盡管聲道有若干個(gè)共振峰,但由于聲門(mén)波引起譜的高頻跌落,所以其話(huà)音能量約集中在3kHz以下。而發(fā)清音時(shí),多數(shù)能量出現(xiàn)在較高頻率上。高頻就意味著高的平均過(guò)零率,低頻意味著低的平均過(guò)零率,所以可以認(rèn)為濁音時(shí)具有較低的過(guò)零率,而清音時(shí)具有較高的過(guò)零率。當(dāng)然,這種高低僅是相對(duì)而言,并沒(méi)方精確的數(shù)值關(guān)系。 利用短時(shí)平均過(guò)零率還可以從背景噪聲中找出語(yǔ)音信號(hào),可用于判斷寂靜無(wú)聲段和有聲段的起點(diǎn)和終點(diǎn)位置。在孤立詞的語(yǔ)音識(shí)別中,必須要在一連串連續(xù)的語(yǔ)音信號(hào)中進(jìn)行適當(dāng)分割,用以確定一個(gè)一個(gè)單詞的語(yǔ)音信號(hào),即找出每一個(gè)單詞的開(kāi)始和終止位置,這在語(yǔ)音處理中是一個(gè)基本問(wèn)
15、題。此時(shí),在背景噪聲較小時(shí)用平均能量識(shí)別較為有效,而在背景噪聲較大時(shí)用平均過(guò)零率識(shí)別較為有效。但是研究表明,在以某些音為開(kāi)始或結(jié)尾時(shí)如當(dāng)弱摩擦音 (如f、h等音素)、弱燃破音(如p、t、k等音素)為語(yǔ)音的開(kāi)頭或結(jié)尾;以鼻音(如n、 m等音素)為語(yǔ)音的結(jié)尾時(shí)只用其中一個(gè)參量來(lái)判別語(yǔ)音的起點(diǎn)和終點(diǎn)是有困難的,必須同時(shí)使用這兩個(gè)參數(shù)。第三節(jié) 語(yǔ)音信號(hào)的頻域分析語(yǔ)音信號(hào)的頻域分析就是分析語(yǔ)音信號(hào)的頻域持征。從廣義上講,語(yǔ)音信號(hào)的頻域分析包括語(yǔ)音信號(hào)的頻譜、功率譜、倒頻譜、頻譜包絡(luò)分析等,而常用的頻域分析方法有帶通濾波器組法、傅里葉變換法、線件預(yù)測(cè)法等幾種。本文介紹的是語(yǔ)音信號(hào)的傅里葉分析法。因?yàn)檎Z(yǔ)音波
16、是一個(gè)非平穩(wěn)過(guò)程,因此適用于周期、瞬變或平穩(wěn)隨機(jī)信號(hào)的標(biāo)準(zhǔn)傅里葉變換不能用來(lái)直接表示語(yǔ)音信號(hào),而應(yīng)該用短時(shí)傅里葉變換對(duì)語(yǔ)音信號(hào)的頻譜進(jìn)行分析,相應(yīng)的頻譜稱(chēng)為“短時(shí)譜 ”一 利用短時(shí)博里葉變換求語(yǔ)音的短時(shí)譜 對(duì)第n幀語(yǔ)音信號(hào)Xn(m)進(jìn)行傅里葉變換(離散時(shí)域傅里葉變換,DTFT),可得到短時(shí)傅里葉變換,其定義如下: (2-7) 由定義可知,短時(shí)傅里葉變換實(shí)際就是窗選語(yǔ)音信號(hào)的標(biāo)準(zhǔn)傅里葉變換。這里,窗w(n-m)是一個(gè)“滑動(dòng)的”窗口,它隨n的變化而沿著序列X(n)滑動(dòng)。由于窗口是有限長(zhǎng)度的,滿(mǎn)足絕對(duì)可和條件,所以這個(gè)變換是存在的。當(dāng)然窗口函數(shù)不同,博里葉變換的結(jié)果也將不同。我們還可以將式(37)寫(xiě)
17、成另一種形式。設(shè)語(yǔ)音信號(hào)序列和窗口序列的標(biāo)準(zhǔn)傅早葉變換均存在。當(dāng)n取固定值時(shí),w(n-m)的傅里葉變換為: (2-8) 根據(jù)卷積定理,有: (2-9)因?yàn)樯鲜接疫厓蓚€(gè)卷積項(xiàng)均為關(guān)于角頻率w的以2為周期的連續(xù)函數(shù),所以也可將其寫(xiě)成以下的卷積積分形式: (2-10)即,假設(shè)x(m)的DTFT是,且的DTFT是,那么是和的的周期卷積。根據(jù)信號(hào)的時(shí)寬帶寬積為一常數(shù)這一基本性質(zhì),可知主瓣寬度與窗口寬度成反比,N越大,的主瓣越窄。由式(2-10)可知,為了使忠實(shí)再現(xiàn)的特性相對(duì)于來(lái)說(shuō)必須是個(gè)沖激函數(shù)。所以為了使,需;但是N值太大時(shí),倍號(hào)的分幀又失去了意義。尤其是N大于語(yǔ)音的音素長(zhǎng)度時(shí),已不能反映該語(yǔ)音音素的
18、頻譜了。因此應(yīng)折衷選擇窗的寬度N。另外,窗的形狀也對(duì)短時(shí)博氏頻譜有影響,如矩形窗,雖然頻率分辨率很高(即主辯狹窄尖銳),但由于第一旁瓣的衰減很小,有較大的上下沖,采用矩形窗時(shí)求得的與的偏差較大,這就是Gibbs效應(yīng),所以不適合用于頻譜成分很寬的語(yǔ)音分析中。而漢明窗在頻率范圍中的分辨率較高,而且旁辯的衰減大,具有頻譜泄漏少的優(yōu)點(diǎn)所以在求短時(shí)頻譜時(shí)一船采用具有較小上下沖的漢明窗。與離散傅里葉變換和連續(xù)博里葉變換的關(guān)系一樣,如令角頻率w=2kN,則得離散的短時(shí)博里葉變換(DFT)它實(shí)際上是在頻域的取樣,如下所示: (2-11) 在語(yǔ)音信號(hào)數(shù)字處理中,都是采用的離散博里葉變換(DFT)來(lái)替代并且可以用
19、高效的快速傅里葉變換(FFT)算法完成由至的轉(zhuǎn)換。當(dāng)然,這時(shí)窗長(zhǎng)N必須是2的倍數(shù) (L是整數(shù))。根據(jù)傅里葉變換的性質(zhì),實(shí)數(shù)序列的傅里葉變換的頻譜具有對(duì)稱(chēng)性,因此,全部頻譜信息包含在長(zhǎng)度為N/2+1個(gè)里。另外,為了使具有較高的頻率分辨率,所取的DFT以及相應(yīng)的FFT點(diǎn)數(shù)應(yīng)該足夠多,但有時(shí)的長(zhǎng)度N要受到采樣率和短時(shí)性的限制,例如,在通常采樣率為8kHz且?guī)L(zhǎng)為20ms時(shí),N=160。而一般取256、512或1024,為了將的點(diǎn)數(shù)從N擴(kuò)大力,可以采用補(bǔ)0的辦法,在擴(kuò)大的部分添若干個(gè)0取樣值,然后再對(duì)添0后的序列進(jìn)行FFT。例如、在10kHz的范圍內(nèi)采樣求頻譜,并要求頻率分辨率在30 Hz以下。由10
20、k/30,得333,所以要取比333大的值,這時(shí)可取=512點(diǎn),不足的部分采用補(bǔ)0的辦法解決,此時(shí)頻率分辨率(即頻率間隔)為10 Hz51219.53Hz,采樣后的該幀信號(hào)頻率處在02x1953Hz之間,因此,原連續(xù)信號(hào)頻率就處在0之間(即),所以我們要在0頻率范圍內(nèi)求其頻譜。FFT的計(jì)算可以在通用計(jì)算機(jī)上由相應(yīng)的算法軟件來(lái)完成,這種方式一般只能實(shí)現(xiàn)非實(shí)時(shí)運(yùn)算。為了完成實(shí)時(shí)運(yùn)算可以采用先進(jìn)的數(shù)字信號(hào)處理芯片、陣列處理芯片或?qū)S肍FT芯片。為了完成1024點(diǎn)的萬(wàn)FFT,這些專(zhuān)用芯片所需的運(yùn)算時(shí)間是幾十毫秒至兒毫秒,甚至可以降至1ms以下。在語(yǔ)音信號(hào)數(shù)字處理中,功率譜具有重要意義,在一些語(yǔ)音應(yīng)用系
21、統(tǒng)中往往都是利用語(yǔ)音信號(hào)的功率譜。根據(jù)功率譜定義,可以寫(xiě)出短時(shí)功率譜與短時(shí)傅里葉變換之間的關(guān)系: (2-12) 或者: (2-13)式中表示復(fù)共軛運(yùn)算。并且功率譜是短時(shí)自相關(guān)函數(shù)的傅里葉變換。 (2-14) 第三章 語(yǔ)音信號(hào)的綜合仿真分析 在MATLAB下采集 Windows自帶的“Windows XP 關(guān)機(jī).wav”語(yǔ)音信號(hào),并畫(huà)出采樣后語(yǔ)音信號(hào)的時(shí)域波形和頻譜圖:fs=22050; %語(yǔ)音信號(hào)采樣頻率為22050fname,pname=uigetfile('C:WINDOWSMediaWindowsXP關(guān)機(jī).wav');file=pname,fname;x1,fs,bits
22、=wavread(file); % 讀入聲音文件(*.wav) Y=fft(x1,4096); %對(duì)信號(hào)做4096點(diǎn)FFT變換figure(1);subplot(211);plot(x1);title('原始信號(hào)波形');subplot(212);plot(abs(Y);title('原始信號(hào)頻譜');圖3-1原始語(yǔ)音信號(hào)設(shè)計(jì)數(shù)字濾波器和畫(huà)出頻率響應(yīng):根據(jù)語(yǔ)音信號(hào)的特點(diǎn)給出有關(guān)濾波器的性能指標(biāo),低通濾波器性能指標(biāo): fp=1000Hz,fc=1200 Hz, As=100dB,Ap=1dB,Fs=8000;用雙線性變換法設(shè)計(jì)的butterworth低通濾波器的程
23、序如下fp=1000;fc=1200;As=100;Ap=1;Fs=8000;wc=2*fc/Fs; wp=2*fp/Fs;N,ws=buttord(wc,wp,Ap,As,'s');b,a=butter(N,ws,'s');num1,den1=bilinear(b,a,0.5);figure(1);freqz(num1,den1);濾波器的頻率響應(yīng):圖3-2濾波器的頻率響應(yīng) 進(jìn)行低通濾波,比較濾波前后語(yǔ)音信號(hào)的波形及頻譜:fs=22050; %語(yǔ)音信號(hào)采樣頻率為22050fname,pname=uigetfile('C:WINDOWSMediaWind
24、owsXP關(guān)機(jī).wav');file=pname,fname;x1,fs,bits=wavread(file); % 讀入聲音文件(*.wav) sound(x1,fs,bits); Y=fft(x1,4096); %對(duì)信號(hào)做4096點(diǎn)FFT變換fp=1000;fc=1200;As=100;Ap=1;Fs=8000;% 低通濾波器濾波wc=2*fc/Fs; wp=2*fp/Fs; N,ws=buttord(wc,wp,Ap,As,'s');%求低通濾波器的階數(shù)和截止頻率b,a=butter(N,ws,'s');%求S域的頻率響應(yīng)的參數(shù) num1,den1=bilinear(b,a,0.5); %利用雙線性變換實(shí)現(xiàn)頻率響應(yīng)S域到Z域的變換figure(1);freqz(num1,den1,512,Fs);x=filter(num1,den1,x1);X=fft(x,4096);sound(x); % 回放低通濾波器后的聲音figure(2);subplot(2,2,1);plot(x1);title('濾波前信號(hào)波形');subplot(2,2,2);plot(abs(Y);title('濾波前信號(hào)頻譜');subplot(2,
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 農(nóng)業(yè)機(jī)械智能化發(fā)展-深度研究
- 智能交通倫理挑戰(zhàn)-深度研究
- 企業(yè)文化與企業(yè)形象-深度研究
- 聲學(xué)層析成像技術(shù)-深度研究
- 時(shí)尚產(chǎn)業(yè)消費(fèi)趨勢(shì)洞察-深度研究
- 2025年廣州華夏職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試近5年??及鎱⒖碱}庫(kù)含答案解析
- 2025年山東勝利職業(yè)學(xué)院高職單招高職單招英語(yǔ)2016-2024歷年頻考點(diǎn)試題含答案解析
- 2025年太湖創(chuàng)意職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試近5年??及鎱⒖碱}庫(kù)含答案解析
- 2025年天津生物工程職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試近5年??及鎱⒖碱}庫(kù)含答案解析
- 2025年天津渤海職業(yè)技術(shù)學(xué)院高職單招語(yǔ)文2018-2024歷年參考題庫(kù)頻考點(diǎn)含答案解析
- 【探跡科技】2024知識(shí)產(chǎn)權(quán)行業(yè)發(fā)展趨勢(shì)報(bào)告-從工業(yè)轟鳴到數(shù)智浪潮知識(shí)產(chǎn)權(quán)成為競(jìng)爭(zhēng)市場(chǎng)的“矛與盾”
- 《中國(guó)政法大學(xué)》課件
- GB/T 35270-2024嬰幼兒背帶(袋)
- 遼寧省沈陽(yáng)名校2025屆高三第一次模擬考試英語(yǔ)試卷含解析
- 2024-2025學(xué)年高二上學(xué)期期末數(shù)學(xué)試卷(新題型:19題)(基礎(chǔ)篇)(含答案)
- 2022版藝術(shù)新課標(biāo)解讀心得(課件)小學(xué)美術(shù)
- Profinet(S523-FANUC)發(fā)那科通訊設(shè)置
- 醫(yī)學(xué)教程 常見(jiàn)化療藥物歸納
- 統(tǒng)編版九年級(jí)歷史下冊(cè)第一單元教案教學(xué)設(shè)計(jì)
- GB/T 25000.51-2016系統(tǒng)與軟件工程系統(tǒng)與軟件質(zhì)量要求和評(píng)價(jià)(SQuaRE)第51部分:就緒可用軟件產(chǎn)品(RUSP)的質(zhì)量要求和測(cè)試細(xì)則
- 外科學(xué)試題庫(kù)及答案(共1000題)
評(píng)論
0/150
提交評(píng)論