語音形態(tài)觀測_第1頁
語音形態(tài)觀測_第2頁
語音形態(tài)觀測_第3頁
語音形態(tài)觀測_第4頁
語音形態(tài)觀測_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、語音形態(tài)觀測語音是人類思想交流的重要方式之一,現(xiàn)代語音分析和處理技術(shù)是現(xiàn)代科技的重要領(lǐng)域之一。語音由人體的肺及腹部提供能量(氣流)引起聲帶或某些器官震動(dòng)發(fā)出聲音,發(fā)聲的同時(shí),人的喉嚨、口、鼻、唇及舌參與音調(diào)的形成。中樞神經(jīng)控制著以上各個(gè)器官協(xié)調(diào)運(yùn)動(dòng)以表達(dá)語音發(fā)出人的思想及情緒。語音信息包括了發(fā)音人思想、自身身體結(jié)構(gòu)及情緒信息,了解和掌握這些信息是現(xiàn)代語音分析的目的。實(shí)驗(yàn)原理人體器官震動(dòng)發(fā)出聲音,由于人類個(gè)體的差異,每個(gè)人的聲帶和其它器官的物理結(jié)構(gòu)不完全相同,所以每個(gè)人的聲音都有自身的特異性。面部肌肉受中樞神經(jīng)支配在發(fā)音時(shí)參與運(yùn)動(dòng),所以在人在說話時(shí)不可避免的受到心理活動(dòng)影響。這使得即使同一個(gè)人在

2、不同時(shí)刻不同環(huán)境下說的同一個(gè)字其聲音也不完全相同。語音觀測表明,人類的語音的時(shí)域圖象總體上呈現(xiàn)復(fù)雜的脈沖狀,如圖一所示。如果顯示語音結(jié)構(gòu)的細(xì)節(jié),則出現(xiàn)在短時(shí)間內(nèi)重復(fù)的類周期變化(圖三曲線為漢語元音“a”的局部時(shí)域圖形)。圖一 重復(fù)兩次的話語“語音測試”時(shí)域圖一般把這種短暫的類周期過程稱為一幀,漢語的一個(gè)字和拼音文字的一個(gè)詞可以由多個(gè)幀組成。一般來講,一句話由若干詞語組成,所以一句話的時(shí)域圖象是許多不同形態(tài)的幀集合形成的階段性脈沖。現(xiàn)代語音分析有多種方法,語音的能量和頻率分析是最簡單和普遍的方法之一。快速傅立葉(FFT)變換為實(shí)現(xiàn)這種方法提供了技術(shù)工具。但人在話語過程中,語音內(nèi)容及音調(diào)都會(huì)隨時(shí)間

3、變化。從物理學(xué)上講,這意味著語音的強(qiáng)度及頻率隨時(shí)間變化。這樣,語音的頻率分析就必須隨時(shí)間分段進(jìn)行,這在信號分析領(lǐng)域稱為時(shí)-頻分析。由前段介紹可知,人類語音一般由暫短的類周期過程集合組成,每個(gè)類周期(即每幀)的時(shí)間長度大約在20-50ms。本實(shí)驗(yàn)由話筒采集語音信號,信號經(jīng)電子放大器放大后送入計(jì)算機(jī)由數(shù)/模轉(zhuǎn)換器轉(zhuǎn)換為數(shù)字信號。該數(shù)字信號經(jīng)軟件處理后顯示在監(jiān)視器上,實(shí)驗(yàn)中學(xué)生可選擇適當(dāng)?shù)膸M(jìn)行傅立葉變換。變換后得到的頻譜圖即為實(shí)驗(yàn)采集到的某個(gè)語音的頻率特征譜。 實(shí)驗(yàn)儀器實(shí)驗(yàn)儀器由前置放大器及數(shù)據(jù)處理用計(jì)算機(jī)組成。前置放大器面板各組件功能如圖二所示。輸出插座脈搏傳感器輸入插口話筒輸入插口電源開關(guān)實(shí)驗(yàn)

4、時(shí)將話筒插入話筒插口,用專用電纜將語音信號從輸出插口引入到計(jì)算機(jī)背后的專用數(shù)/模轉(zhuǎn)換插口。計(jì)算機(jī)軟件操作界面如圖三所示。雙擊桌面上“speacha”圖標(biāo)后即進(jìn)入該畫面。操作界面分為功能相似的兩部分,分別對應(yīng)A、B通道。其中可將A通道測量做為標(biāo)準(zhǔn)信號,將B通道信號做為與A通道的對比信號。每個(gè)通道有兩個(gè)圖形窗口以顯示實(shí)驗(yàn)內(nèi)容,左邊圖形窗口稱為時(shí)域窗口,顯示時(shí)域信號,右邊窗口稱為功能窗口,在程序進(jìn)行語音采樣時(shí)顯示實(shí)時(shí)信號,在傅立葉變換后顯示信號的頻譜。處理軟件最下方按鈕為提示窗口,即時(shí)提供鼠標(biāo)所在位置的功能或程序進(jìn)行的結(jié)果各窗口及按鈕功能簡述如下:窗口:可分為五部分,1,左上窗口為一時(shí)域圖形窗口。顯

5、示A通道采集的時(shí)域信號。2,右上窗口為稱為A通道功能窗口,在采集信號時(shí)它檢視A通道信號強(qiáng)度,在傅立葉變換后它顯示信號頻譜。3、4為通道B圖形窗口,其功能與窗口1、2相同。5,下方為提示窗口,當(dāng)鼠標(biāo)在一些按鈕上停留時(shí),該窗口給出必要的操作提示。長時(shí)語音觀察-開始:按下該按鈕,處理軟件將按一定速度等間隔采集來自話筒的信號并在A通道時(shí)域窗口顯示。長時(shí)語音觀察可以從整體上了解聲音振動(dòng)的形態(tài),為學(xué)生提供一個(gè)感性了解語音形態(tài)的手段。語音觀察-停止:按下該按鈕,處理軟件停止采集話筒信號,實(shí)驗(yàn)者可靜態(tài)觀察語音信號的整體特征。音頻采樣(A或B通道):此按鈕為幀采集命令按鈕。按下此按鈕后,軟件監(jiān)測來自話筒的信息,

6、采集到的信號顯示在對應(yīng)通道的功能窗口中。但此時(shí)處理軟件并沒有真正記錄信號,只有當(dāng)輸入的語音達(dá)到一定強(qiáng)度后,處理軟件以較高速度(約10000點(diǎn)/S)對輸入信息進(jìn)行采集、記錄并顯示在相應(yīng)通道的時(shí)域窗口。周期選擇(A或B通道):當(dāng)數(shù)據(jù)采集到有效數(shù)據(jù)后采集自動(dòng)停止,此時(shí)該按鈕有效。按下該按鈕后將鼠標(biāo)在時(shí)域圖上移動(dòng),可看到一條指示線顯示,適時(shí)點(diǎn)擊左鍵可選擇分析周期,確認(rèn)一幀語音。采樣門限調(diào)整:在A(B)通道檢視語音信號時(shí)一般會(huì)有現(xiàn)場雜音進(jìn)入采集系統(tǒng),而這些雜音并不是我們所需要的。為了防止雜音觸發(fā)采集,設(shè)置了采樣門限。只有當(dāng)進(jìn)入話筒的信息足夠大,系統(tǒng)才會(huì)認(rèn)定信息有效并開始采集。該門限的大小可以由“門限提高

7、”“門限降低”調(diào)整。門限越高,系統(tǒng)認(rèn)定的有效強(qiáng)度就越大,需要實(shí)驗(yàn)者發(fā)出的聲音越大,抗干擾的能力也越強(qiáng)。門限位置已由教師事先設(shè)置好,一般不需要學(xué)生自己調(diào)整。相似性識(shí)別:軟件對A、B存在的兩組信號進(jìn)行頻率比對。在A、B兩通道均有有效信息時(shí)該按鈕生效。頻率校準(zhǔn):此按鈕用于對系統(tǒng)采樣基準(zhǔn)頻率的校準(zhǔn)。一般只允許指定教師使用,不對學(xué)生開放。存儲(chǔ)參數(shù):操作界面提供了圖形及文檔存儲(chǔ)功能,如果學(xué)生準(zhǔn)備將圖形存儲(chǔ)需填寫相關(guān)信息。這些信息包括:語音內(nèi)容、語音音調(diào)、文件名及性別。按下“數(shù)據(jù)存盤”按鈕后有關(guān)A通道及B通道的圖形文件及數(shù)據(jù)文件存儲(chǔ)在D盤根目錄下。退出實(shí)驗(yàn):按此按鈕退出本次實(shí)驗(yàn)。實(shí)驗(yàn)內(nèi)容一, 語音圖象觀察將

8、話筒插入“話筒輸入插口”,將計(jì)算機(jī)采集電纜插頭接入信號“信號輸出”插座,打開前置放大器電源開關(guān)。雙擊計(jì)算機(jī)桌面上“speach”圖標(biāo)進(jìn)入實(shí)驗(yàn)處理程序。按下語音觀察按鈕,對準(zhǔn)話筒發(fā)出一句完整語音,例如“語音觀察”。在信號完整時(shí)可點(diǎn)擊“停止采集”進(jìn)行靜態(tài)觀察。注意此時(shí)信號采集速度比較慢,不能觀測到完整的幀,但可以看到完整的語音過程及詞與詞之間的間歇。二, 不同元音的時(shí)域與頻域圖象觀測點(diǎn)擊A通道“數(shù)據(jù)采集”按鈕,此時(shí)A通道的功能窗口(右上)將顯示數(shù)據(jù)監(jiān)測結(jié)果。對準(zhǔn)話筒,發(fā)出漢語拼音的第一個(gè)元音“a”。當(dāng)語音能量足夠大時(shí),軟件采集語音信號并在A通道時(shí)域窗口以幀的形式顯示語音“a”的時(shí)域信號。用“周期選擇”功能從時(shí)域圖選擇完整一幀信號,第一次按鼠標(biāo)左鍵為周期起始點(diǎn),第二次按鼠標(biāo)左鍵為周期結(jié)束點(diǎn)。第二次按下鼠標(biāo)左鍵后傅立葉變換自動(dòng)進(jìn)行并將變換結(jié)果顯示在通道A的功能顯示區(qū)。如若重新選周期可再次點(diǎn)“周期選擇”按鈕,重復(fù)以上過程。在通道B以漢語元音o、i重復(fù)以上過程,對比其時(shí)域及頻域異同。三, 不同實(shí)驗(yàn)者同音觀測以通道A為標(biāo)準(zhǔn)音,輸入漢語“a”。以通道B為對比通道,換實(shí)驗(yàn)者輸入同樣語音,對比同音不同人的語音結(jié)構(gòu)差異。四, 音調(diào)模仿用通道A做標(biāo)準(zhǔn)通道,錄入一個(gè)音節(jié)(如a)并按前述方法得到頻率成分。以通道B為對比通道,請實(shí)驗(yàn)伙伴模仿通道A的音調(diào)進(jìn)行采集分析,實(shí)驗(yàn)者先

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論