Praat 語音軟件操作手冊_第1頁
Praat 語音軟件操作手冊_第2頁
Praat 語音軟件操作手冊_第3頁
Praat 語音軟件操作手冊_第4頁
Praat 語音軟件操作手冊_第5頁
已閱讀5頁,還剩181頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、Praat 語音軟件使用手冊()熊子瑜xiongziyu北京東城區(qū)建國門內(nèi)大街 5 號中國社會科學院語言研究所辦公室電話:010-85195406100732謹以此獻給“2004 年現(xiàn)代語音學暑期講習班”上的可親可敬的學員們,祝愿大家都能夠?qū)W有所得!目錄一 Cool Edit Pro 錄音操作初步 . 1(一)幾個重要概念 .1(二)Cool Edit Pro 錄音操作 .2二 聲學基礎(chǔ) . 9三 頻譜分析 . 27(一)語圖分析及參數(shù)設(shè)置 .27(二)觀察語圖 .29(三)畫圖及參數(shù)設(shè)定 .30(四)頻譜分析及參量設(shè)置 .34(五)觀察二維頻譜 .35(

2、六)二維頻譜作圖 .36四 基頻分析 . 39(一)基頻分析及參數(shù)設(shè)置 .39(二)察看基頻對象 .41(三)基頻數(shù)據(jù)的核查和修改 .42(四)基頻數(shù)據(jù)的保存 .48(五)基頻數(shù)據(jù)的作圖 .49(六)基頻數(shù)據(jù)的獲取 .52五 強度分析 . 55(一)時域維度測量某個時段的強度 .55(二)察看強度對象 .56(三)獲得強度對象的數(shù)據(jù) .57(四)從強度曲線換算成振幅曲線 .58(五)強度數(shù)據(jù)作圖 .58(六)頻域維度測量某個時點的某個頻率位置的強度 .623(七)頻域維度測量某個時點的某個帶寬的能量 .64(八)頻域維度測量某個頻段的長時全部能量 .64六 共振峰分析 . 67(一)共振峰分析

3、與參數(shù)設(shè)置 .67(二)察看共振峰對象 .69(三)提取和修改共振峰數(shù)據(jù) .71(四)LPC 分析 .75(五)基于 LPC 對象測量某時間點的共振峰 .77(六)基于 LPC 對象分析共振峰數(shù)據(jù) .78(七)基于 LPC 對象進行語圖分析 .79(八)基于共振峰數(shù)據(jù)做聲學元音圖 .80(九)基于共振峰對象做共振峰圖 .80七 語音標注 . 83(一)新建語音標注對象 .83(二)菜單功能介紹 .84(三)提取標注對象中的某個層級數(shù)據(jù) .88(四)提取標注對象中的某個片斷的標注數(shù)據(jù) .90(五)獲取 TextGrid 對象的數(shù)據(jù) .91(六)標注文件作圖 .91(七)提取標注文件的數(shù)據(jù) .93

4、(八)在語音標注文件中輸入國際音標 .94八 語音參數(shù)調(diào)整與合成 . 97(一)調(diào)整強度 .97(二)聲音的剪切、復制、粘貼和清零 .98(三)聲音信號的重新采樣 .99(四)聲音信號的拉長和縮短,以調(diào)整語速 .100(五)調(diào)整語聲的性別特性 .101(六)調(diào)整聲音文件的超音段特征 .103(七)濾波.109(八)共振峰數(shù)據(jù)的修改 .1114九 編寫 Praat 的腳本程序 . 113(一)編程環(huán)境 .113(二)編程語言 .114(三)交互對話 .119十 提取語音數(shù)據(jù) . 123(一)提取標注數(shù)據(jù) .123(二)提取音節(jié)或聲韻母的音高數(shù)據(jù) .123(三)提取音節(jié)或聲韻母的強度數(shù)據(jù) .124

5、(四)提取音節(jié)或聲韻母的共振峰數(shù)據(jù) .124(五)語音數(shù)據(jù)作圖 .124十一 語音數(shù)據(jù)的統(tǒng)計分析 . 127(一)相關(guān)性分析 .127(二)均值比較及 T 檢驗 .131(三)方差分析 .133(四)回歸分析 .135附錄 腳本程序 . 139(一)提取二維頻譜中某個頻率位置的能量值 .139(二)提取二維頻譜中前 n 個諧波峰的能量值 .140(三)提取二維頻譜中各頻率成分的能量值 .141(四)將共振峰頻率數(shù)據(jù)提取到 TextGrid 對象中 .142(五)將 TextGrid 對象中的共振峰數(shù)據(jù)轉(zhuǎn)換成文本文件.143(六)制作聲學元音圖 .144(七)提取標注對象中的數(shù)據(jù) .148(八)

6、修改一個音段的共振峰特性以得到一個新的聲音 .153(九)提取音節(jié)或聲韻母的音高數(shù)據(jù) .156(十)提取音節(jié)的強度數(shù)據(jù) .160(十一)提取音節(jié)或聲韻母的共振峰數(shù)據(jù) .165(十二)語音數(shù)據(jù)作圖 .1715Praat 語音軟件使用手冊熊子瑜一 Cool Edit Pro 錄音操作初步通過本節(jié)的學習,幫助您了解與錄音過程有關(guān)的幾個基本概念,并掌握如何使用 Cool Edit Pro 軟件的錄音功能。(一)幾個重要概念、采樣由于聲音為模擬連續(xù)信號,而計算機只能處理數(shù)字離散信號,因此要使用計算機來分析和處理聲音,就需要經(jīng)歷模數(shù)轉(zhuǎn)換過程Analog to Digital Converter,即 ADC

7、,即將模擬的連續(xù)信號轉(zhuǎn)換為數(shù)字離散信號。采樣就是按照一定的時間間隔從模擬連續(xù)信號提取出一定數(shù)量的樣本來,其樣本值用二進制碼 0 和 1 來表示,這些 0 和 1 便構(gòu)成了數(shù)字音頻文件,其過程實際上是將模擬音頻信號轉(zhuǎn)換成數(shù)字離散信號。、采樣率采樣率表示了每秒對原始信號采樣的次數(shù)。顯然,在一秒中內(nèi)采樣的點越多,獲取的信息越豐富,為了復原波形,一次振動中,至少得有 2 個點的采樣,要想使采集到的信號不失真,采樣頻率規(guī)定至少為語音頻率的 2 倍,因此要得到一個頻率為 10000 赫茲的聲音,則其采樣率至少得大于 20000 赫茲。采樣頻率越高,數(shù)字信號的保真度越高,但同時占用的存儲空間也越大。如果采樣

8、率低于高頻成分頻率的兩倍,則會產(chǎn)生低頻失真、信號混淆現(xiàn)象。、采樣精度采樣精度就是指存放一個采樣值所使用的比特數(shù)目。當用 8 個比特(采樣精度為 8 位)存放一個采樣值時,對聲音振幅的分辨等級理論上為 256 個,即 0至 255;當用 16 個比特(采樣精度為 16 位)存放一個采樣值時,對聲音振幅的分辨等級理論上為 65536 個,即 0 至 65535。如果您將采樣精度設(shè)置為 16 位,計算機紀錄的采樣值范圍則為-32768 至 32767 之間的整數(shù)。采樣率和采樣精度的值越大,記錄的波形更接近原始信號,但同時占用的存儲空間也越大。、聲道聲道指輸入或輸出信號的通道。通常用多聲道來輸入或輸出

9、不同的信號。如果只需錄制一個位置的一種信號時,只要使用單聲道就可以了。1Praat 語音軟件使用手冊熊子瑜、信噪比信噪比指信號與噪聲之間的能量比。錄音時,信噪比越高越好。16 位采樣的信噪比大約是 96dB,8 位采樣的信噪比大約是 48dB。在錄音時,簡單估計噪音大小的辦法是:當沒有語聲信號輸入的時候,如果麥克風輸入信號的振幅值超過了 200(單位為采樣值,相當于 46dB),則噪聲就比較大,需要進行一定的控制,如在比較安靜的環(huán)境下錄音,關(guān)閉窗戶、空調(diào)、電扇等噪聲源,遠離電腦等噪聲源等等,選用比較好的帶有屏蔽的麥克風,選用比較好的聲卡等等。噪聲的振幅值越低越好,錄音室里的錄音一般可以控制在

10、10 以下(單位為采樣值,相當于 20dB)。(二)Cool Edit Pro 錄音操作第一步,打開 Cool Edit pro 軟件。初始窗口如下:第二步:按“文件”菜單下的“新建”按鈕,會彈出下面對話框。在下圖1 的位置選擇采樣率 16000,在 2 的位置選擇單聲道,在 3 的位置選擇 16 位。選擇好之后請按 4 位置的按鈕“確定”?!菊f明:采樣率和采樣精度的設(shè)置以越高越好,采樣率和采樣精度越高則聲音的質(zhì)量越高,不過考慮到存儲空間和語音信號的特點,一般可以設(shè)置為 16000赫茲的采樣率和 16 位的采樣精度。如果需要錄制兩個不同的信號源,則使用立體聲,否則都使用單聲道?!?Praat

11、語音軟件使用手冊熊子瑜按了上圖的“確定”按鈕后,回到了下面的主窗口:主窗口的功能區(qū)解釋如下:1 區(qū):用于播放和錄音。播放按鈕是其上排左數(shù)第二個三角形狀的按鈕;錄音是其下排右數(shù)第一個圓圈形紅色按鈕。此時按紅色錄音按鈕即開始錄音,錄音時再按一次即停止錄音,也可以按上排第一個方塊按鈕停止錄音或播放過程。2 區(qū):用于調(diào)整橫軸顯示比例,以觀察波形。上排左一用于放大,上排左二用于縮小,上排左三用于顯示全部波形。3 區(qū):顯示游標所在的時間位置。4 區(qū):用于顯示錄音過程或放音過程的瞬時電平量,通常用于考察聲音的強度,一般以不超過-3dB 為宜,最好大多處于-6-3 之間。3Praat 語音軟件使用手冊熊子瑜5

12、 區(qū):聲壓坐標,可以有四種不同的標度:采樣值(-32768+32767)、分貝值、歸一值(-1+1 之間)、百分比(-100%+100%)??梢酝ㄟ^雙擊縱坐標軸來改變標度單位。6 區(qū):波形顯示區(qū),最大采樣數(shù)據(jù)以不超過 6 區(qū)的上下橫線為宜,即小于-3dB。第三步:連接并設(shè)置好您的麥克風及錄音音量等。(1) 選擇“錄音時實時更新顯示”,操作如下:先按 Cool Edit Pro 主菜單“選項”下的“設(shè)置”按鈕,出現(xiàn)下一對話框,將下圖 1 位置的復選框打上對鉤,然后按“確定”按鈕。(2) 調(diào)整合適的輸入音量。首先雙擊電腦屏幕右下角的小喇叭圖標,會彈出如下對話框,注意:不同電腦所顯示的界面可能略有不

13、同。4Praat 語音軟件使用手冊熊子瑜按上圖主菜單中的“選項”之下的“屬性”下拉菜單,會彈出下面對話框。其中,在 1 的位置選擇您用來錄音的聲卡名稱;在 2 的位置選擇“錄音”之前的圓圈,使其內(nèi)部出現(xiàn)一個綠色小圓點;在 3 的位置選擇“麥克風”之前的復選框,使其內(nèi)部出現(xiàn)一個對鉤,另外保持“錄音控制”之前的對鉤,并將其他的對鉤都取消。如果您用的是“線路輸入”的方法錄音,則選擇“線路輸入”之前的復選框,使其內(nèi)部出現(xiàn)一個對鉤,另外保持“錄音控制”之前的對鉤,并將其他的對鉤都取消。設(shè)置結(jié)束后按 4“確定”按鈕結(jié)束。接著會自動彈出下一對話框,其中 1 的滑鈕用來調(diào)節(jié)錄音音量高低,越往上則輸入的音量越高

14、;請在 2“選擇”之前復選框里打上對鉤;請在 4“全部靜音”之前的復選框里取消對鉤。5Praat 語音軟件使用手冊熊子瑜上圖 3 位置的“高級”按鈕是一個開關(guān),點擊它會彈出一個對話框,在此主要用來確定是否需要增強麥克風的輸入信號,如下圖所示:不同的聲卡上圖的顯示可能有所不同。如果不選擇上圖 1“麥克風加強”前的復選框時,麥克風輸入的信號特別弱,那么請選擇上圖 1“麥克風加強”前的復選框,即打上對鉤;如果不選擇上圖 1“麥克風加強”前的復選框時,麥克風輸入的信號就已經(jīng)夠強,則不必選擇上圖 1“麥克風加強”前的復選框,即取消對鉤。確定好選擇以后,請按上圖 2“關(guān)閉”按鈕結(jié)束。返回到前一對話框,如下

15、圖所示:6Praat 語音軟件使用手冊熊子瑜說明,如果選擇了“麥克風加強”前的復選框,則將上圖 1 的滑鈕調(diào)到較低的位置,如果沒有選擇“麥克風加強”前的復選框,則將上圖 1 的滑鈕調(diào)到較高的位置。這兩個配合起來使用,可以邊調(diào)節(jié)邊錄音,看調(diào)節(jié)后的錄音音量效果,直到比較合適的音量輸入位置。目標是聲壓不超過-3 分貝,以保證不出現(xiàn)過載削波現(xiàn)象,在-3 分貝以下要求是聲壓越大越好。調(diào)解好之后直接按上圖右上角的“”按鈕結(jié)束錄入音量設(shè)置過程。如果調(diào)節(jié)之后的錄入音量仍然過強或過弱,而又無法再調(diào)整錄入音量時,請調(diào)節(jié)麥克風與嘴唇之間的距離注意:一般要求發(fā)音時這個距離保持不變,或者調(diào)整發(fā)音的力度注意:一般要求發(fā)音

16、時發(fā)音力度保持不變。第四步,開始錄音。以上設(shè)置結(jié)束以后,請按下圖 1 的右下角紅色錄音鍵開始錄音。錄音過程中盡可能避免外界的一切噪聲。錄音過程中,可以通過監(jiān)控波形的變化來考察其能量的強弱,太強不行,太弱也不行,隨時監(jiān)控隨時調(diào)整。另外要注意的是麥克風不可離嘴唇太近,正常的呼吸氣流最好不要被錄入到語音中去。第五步:保存錄音。錄制結(jié)束以后,記得保存錄音數(shù)據(jù),操作如下,點擊主菜單“文件”下的“另存為”按鈕。7Praat 語音軟件使用手冊熊子瑜自動彈出下一對話框,在其 1 的位置選擇合適的保存文件夾;其 2 的位置輸入合適的文件名;其 3 的位置設(shè)定合適的保存格式,一般選用“Windows PCM(*.

17、wav)”;然后按 4“保存”即可。錄制結(jié)束后,按主窗口右上角的“”按鈕結(jié)束關(guān)閉程序。8Praat 語音軟件使用手冊熊子瑜二 聲學基礎(chǔ)通過本節(jié)的學習,幫助您回顧一下聲學語音學的一些基礎(chǔ)知識和概念。當物體振動時,會引起周圍空氣的波動,導致空氣粒子間的距離發(fā)生疏密變化,從而引發(fā)空氣壓強的改變,再通過人的耳膜對空氣壓力的反映傳入大腦,從而形成聲音。物理上講,聲音具有四個基本特性:即音色、音強、音高和音長。1、聲波聲波是由物體振動產(chǎn)生的,物體振動使周圍的介質(zhì)(如空氣)產(chǎn)生波動,這就是聲波。聲波的最簡單形狀是正弦波,由正弦波得到的聲音叫純音。在日常生活中,人們聽到的大部分聲音不是純音,而是復合音,這是由

18、多個不同頻率和振幅的正弦波疊加而成的。純音借助 Praat 軟件的語音生成工具可以創(chuàng)建純音和復合音,操作如下:點擊下圖 1 位置的按鈕。9Praat 語音軟件使用手冊熊子瑜彈出下一對話框:在上圖 1 位置輸入聲音對象的名稱;在上圖 2 位置輸入聲音的起點時間;在上圖 3 位置輸入聲音的末點時間;在上圖 4 位置輸入聲音的采樣率;在上圖 5位置輸入每個正弦波的函數(shù),如 1/2*sin(2*pi*377*x),起首的 1/2 表示振幅,“sin()”表示生成的是一個正弦波,“2*pi”是個常量,“377”表示頻率(可以改成不同的值)。下面是一個純音的例子,生成公式為“1*sin(2*pi*100*

19、x)”,采樣率為 10000 赫茲。Sine-10000-16-1-100-1.0(相對振幅為 1)(函數(shù)名-采樣率-精度-通道數(shù)-頻率-時長)A 點至 B 點為一個完整的周期,從時間軸上可以看出這個周期的時長為 10 毫秒。根據(jù)采樣率,可以知道這個周期包含了 100 個采樣點。從右側(cè)縱軸,我們可以看出其最大振幅位于+32767 和-32768。10Praat 語音軟件使用手冊熊子瑜復合音下面是五個正弦波,其頻率分別是 100,200,300,400,500 赫茲,相對振幅分別是 0.5,0.25,0.125,0.0625,0.03125。其生成公式如下:a: 1/2 * sin(2 * pi

20、 * 100 * x)b: 1/4 * sin(2 * pi * 200 * x)c: 1/8 * sin(2 * pi * 300 * x)d: 1/16 * sin(2 * pi * 400 * x)e: 1/32 * sin(2 * pi * 500 * x)下面是這五個正弦波的波形圖的片斷,時長都是 50 毫秒,周期數(shù)分別是 5,10,15,20,25。11Praat 語音軟件使用手冊熊子瑜將這五個正弦波疊加起來,就生成了一個復合波,下面是這個復合波的波形圖的片斷,時長也是 50 毫秒。復合波的生成公式為:“1/2 * sin(2 * pi * 100* x) +1/4 * sin(2

21、 * pi * 200 * x)+1/8 * sin(2 * pi * 300 * x)+1/16 * sin(2* pi * 400 * x)+1/32 * sin(2 * pi * 500 * x)”。從波形圖可以看出,這個復合波的周期數(shù)與頻率最低的純音 a 的周期數(shù)相同,其振幅并不等于 5 個純音的振幅直接相加,這是由于它們的頻率不一致,存在強弱抵消的情況。要了解復合波的特性,需要對它進行頻譜分析??陕犅暡ǖ念l率范圍為 20Hz-20KHz,頻率高于 20KHz 的聲波為超聲波,頻率低于 20Hz 的聲波為次聲波,超聲波和次聲波一般不能引起聽覺,只有頻率在兩者之間的聲波才能聽到,通常把能

22、夠聽到的聲波稱為可聽聲。2、聲速聲波每秒在介質(zhì)中傳播的距離,叫做“聲速”,用 c 表示,單位為 m/s。聲速與傳播聲音的介質(zhì)和溫度有關(guān)。在常溫常壓下的空氣中,聲速(c)和溫度(t)的關(guān)系可簡寫為:c 331.4+0.607t(m/s)。常溫常壓下,聲速約為 345m/s。3、波長沿著聲波傳播方向,聲波振動一周所傳播的距離,或在波形上相位相同的相鄰兩點間的距離,叫做“波長”,用表示,單位為 m。波長與發(fā)聲物體的振動頻率成反比:頻率越高,波長越短。日常所說的長波指頻率低的聲音,短波指頻率高的聲音。波長和聲速、頻率三者之間的關(guān)系:=c/f。4、振幅振動物體離開平衡位置的最大距離,叫做振動的“振幅”,

23、通常用符號 A 表示。簡諧振動的振幅是不變的。強迫振動的穩(wěn)定階段振幅也是一個常數(shù)。阻尼振動的振幅逐漸減小,振幅是可變化的。振幅是用來表示振動強弱的物理量,振幅大,則振動強度強大;振幅小,則振動強度小。12Praat 語音軟件使用手冊熊子瑜5、分貝分貝是增益或衰減單位,用于描述兩個相同物理量之間的相對關(guān)系。聲信號和電信號的相對強弱,例如聲壓和電壓、聲功率和電功率的放大(增益)和減?。ㄋp)的量都可用分貝數(shù)來表示。計算公式如下:LN = 10 * lg( A1/ Ar) 或 LN = 20 * lg( A1 / Ar)式中,其中 Ar 是基準量,A1 是被測量,分貝符號為“dB”。被測量和基準量之

24、比取以 10 為底的對數(shù),這對數(shù)值稱為被測量的“級”,它代表被測量比基準量高出多少“級”。根據(jù)公式可以得出,若被測量是基準量的 10 倍,則被測量比基準量高出 1 級,若被測量是基準量的 100 倍,則被測量比基準量高出 2 級,以此類推。每 1 級相差 10 或 20 個 dB。分貝的計算很簡單,對于振幅類物理量,如聲壓、電壓、電流強度等,將被測量與基準值相比后求常用對數(shù)再乘以 20;對于它們的平方項的物理量如電功率、聲功率和聲強,取對數(shù)后乘以 10 就行了。如果需要表示的量小于與其相比的量時(即比值小于 1 時),則 dB 數(shù)前要加一個負號。6、聲強-聲強級聲強是衡量聲音強弱的一個物理量。

25、聲場中,在垂直于聲波傳播方向上,單位時間內(nèi)通過單位面積的聲能稱做聲強。聲強常以 I 表示,單位為 (wm2)。聲強實質(zhì)是聲場中某點聲波能量大小的度量。對平面波來說,聲強 I 正比于聲壓有效值的平方。聲強級是相對于參考聲強的分貝數(shù),聲強 I1 的聲強級 LI 為:LI = 10 * lg(I1 / Ir)式中,I1 是聲強,Ir 是參考聲強,通常取 10-12瓦/平方米, 該數(shù)值是人對 1kHz聲音剛能聽到時的聲強值。7、聲功率-聲功率級聲源在單位時間內(nèi)輻射的總聲能量稱為聲功率。常用 W 表示,單位為瓦(w)或 mW(毫瓦)或W(微瓦)。聲功率是表示聲源特性的一個物理量。聲功率越大,表示聲源單位

26、時間內(nèi)發(fā)射的聲能量越大。聲功率的大小,只與聲源本身有關(guān)。13Praat 語音軟件使用手冊熊子瑜聲功率級是相對于參考聲功率的分貝數(shù),聲功率 W1 的聲功率級 LW 為:LW = 10 * lg(W1/ Wr)式中,W1 是聲功率,Wr 是參考聲功率,通常取 10-12瓦。聲強和聲功率通常不易直接測量,要根據(jù)測出的聲壓通過換算來求得。8、聲壓-聲壓級目前,在聲學測量中,常用聲壓來衡量聲音的強弱。聲波在大氣中傳播時,引起空氣質(zhì)點的振動,從而使空氣密度發(fā)生變化。在聲波所達到的各點上,氣壓時而比無聲時的壓強高,時而比無聲時的壓強低,某一瞬間介質(zhì)中的壓強相對于無聲波時壓強的改變量稱為聲壓,記為 p(t),

27、單位是 Pa。聲音在振動過程中,聲壓是隨時間迅速起伏變化的,人耳感受到的實際只是一個平均效應,因為瞬時聲壓有正負值之分,所以有效聲壓取瞬時聲壓的均方根值,故實際上總是正值。PT =1 TT2式中 pT 是 T 時間內(nèi)的有效聲壓 Pa;p(T)為某一時刻的瞬時聲壓 Pa。聲壓(p)以 Pa,即帕(斯卡)為單位,有時也有即微巴(Pa)作單位。1Pa=10Pa;人耳可聽到的最弱聲壓為 2*10-5 Pa (0dB),最強的聲壓為 2*101 Pa (120 dB),最強聲壓和最弱聲壓之間相差大約 6 個級數(shù)。為了計算上的方便,同時也符合人耳聽覺分辨能力的靈敏度要求,從最弱的聲壓(2×10-

28、5 Pa)到最強的聲壓(20 Pa),按對數(shù)方式分成等級,以此作為衡量聲壓大小的常用單位,這就是聲壓級。聲壓級的單位為 dB。聲壓 p1 的聲壓級 Lp 為:Lp = 20 * lg(P1 / Pr)式中,Pr 為基準聲壓=2×10-5 Pa, 該值是人耳對 1kHz 聲音剛能聽到時的聲壓值,作為聲壓級的 0 dB。141 PTPraat 語音軟件使用手冊熊子瑜聲壓級不能直接相加,如 LP1=LP2,即兩個聲源的聲壓級相等,則總聲壓級:LP = LP1+ 10lg2 LP1 + 3(dB)也就是說,作用于某一點的兩個聲源聲壓級相等,其合成的總聲壓級比一個聲源的聲壓級增加 3dB。下面

29、以 16 位采樣精度為例,加以說明每個采樣點聲壓的計算。以 16 位采樣精度采得的每個樣本值都是用兩個字節(jié)來保存的,我們把這兩個字節(jié)的值分別記作 b1 和 b2,它們都是 0 至 255 之間的某個整數(shù), 可以用公式 b1+b2*256 算出其相應的十進制的值。如一個采樣點的 b1 和 b2 分別等于 199 和 19,那么這個采樣點的采樣值就等于 199+19*256,即 5063。再比如說,某個采樣點的 b1 和 b2 分別等于 41 和 236, 那么這個采樣點的采樣值就等于 41+236*256,即 60473。如果采樣值大于或等于 32768,則將其減去 65536,得出負值。因此采

30、樣值的范圍在-32768+36767 之間。然后將采樣值換算為-1+1 之間的聲壓值,公式如下:P = N i / 32768 (Pascal)接下來可以根據(jù)聲壓值來計算聲壓級,公式如下:LP = 20 * lg(| P |) (dB)如果|P|=1,則 LP=0dB;如果|P|=0.5,則 LP=-6.02dB;如果|P|=0.25,則LP=-12.04dB。這表明聲壓相差一倍時,聲壓級上相差大約 6 個分貝。如果以基準聲壓 Pr(2×10-5 Pa)為參考點,則上面公式改寫為:LP = 20 * lg(| P | /(2 *10 5 ) (dB)此時結(jié)果為:如果 P=1,則 LP

31、=93.98dB;如果 P=0.5,則 LP=87.96dB;如果 P=0.25,則 LP=81.94dB。我們可以使用 Praat 軟件察看語音文件的振幅特征,操作如下:先在對象列表窗口選擇一個聲音對象,如下圖 1 所示;再點擊下圖 2 位置的 Info 按鈕。15Praat 語音軟件使用手冊彈出一個信息對話框,如下圖所示:在上圖紅色框里標出了所選聲音對象的振幅和能量特征值。振幅,單位為 Pascal,是根據(jù)聲壓值來標示的。熊子瑜Mean: 單位 Pascal。ni =116Amean = 1 / n * ( Ai )Praat 語音軟件使用手冊Root-mean-square:單位 Pas

32、cal。ni =1熊子瑜2energy in air: 單位 Joule/m2。 energyInAir = Te / 400Mean power (intensity) in air: 單位 Watt/m2。MeanPower = energyInAir / WaveLengthMean power (intensity) in air: 單位 dB。MeanPower = 10 * log(MeanPower /(10 12 ) = 20 * log(RMS /(2 *10 5 )Standard deviation: 單位 Pascal。ni =19、響度-響度級響度是人耳對聲音強弱的主

33、觀評價尺度,它主要決定于聲壓,而且與頻率和頻譜有一定的關(guān)系。聲壓愈大,引起人耳主觀感覺到的響度也愈大。如敲鑼打鼓時,用力大,鑼面或鼓皮振幅就大,聲音就響;輕輕敲打振幅就小,聲音就輕。響度和聲強是不同的概念,使用中需要注意它們之間的區(qū)別和聯(lián)系。聲強是聲波強弱的客觀反映,可用聲壓級或聲強級來計量,聲壓值的單位為帕(Pa),其對數(shù)值聲壓級的單位為分貝。而響度是人們對聲音強弱的主觀感覺,不能用任何儀器來直接測定。響度用單位宋(sone)來度量, 將 1000Hz、40dB 的純音所具有的響度定義為1 宋。如果另一個聲音聽起來比 1 宋的聲音大 n 倍,即該聲音的響度為 n 宋。響度還常用對數(shù)值來表示響

34、度級,單位為方(phon),響度級的定義是:將一個聲音與 1000Hz 純音作比較,當聽起來兩者一樣響時,這時 1000Hz 純音的聲壓級的數(shù)值就是這個聲音的響度級。如果某聲音聽起來與聲壓級為 0dB 的 1000Hz 純音一樣響,則該聲音的響度級為 0 方。如果某聲音聽起來與聲壓級為 80dB 的 1000Hz17RMS = ( Ai2 ) / n )Total energy: 單位 Pascal2 sec。Te = RMS *WaveLength ,時長單位秒。Std = ( ( Ai Amean ) 2 /(n 1)Praat 語音軟件使用手冊熊子瑜純音一樣響,則該聲音的響度級為 80

35、方。除 1000Hz 純音外,聲壓級的值一般不等于響度級的值。根據(jù)大量的實驗得到,響度加倍或減半,響度級增加或降低 10 方。它們的關(guān)系可用下列數(shù)學式表示:N = 2 ( LN 40) / 10 或 LN = 40 + 33 log(N ) 。其中 N 表示響度,單位為宋,LN 表示響度級,單位為方。注意,響度級之間不能直接相加,而響度可以相加。應先將各響度級換算成響度進行合成,然后再換算成響度級。10、頻率-基頻-音高單位時間內(nèi)(每秒)物體振動的次數(shù),稱為“頻率”,用 f 表示,單位為赫茲。物體振動越快,頻率就越高;物體振動越慢,頻率就越低。物體振動一周所經(jīng)歷的時間,稱為“周期”,記作 T,

36、單位為秒。周期與頻率之間具有以下關(guān)系:T=1/f。在一個自然的復合音里,有一個振幅最大、頻率最低的分音,也就是第一諧波,這個分音(或第一諧波)一般還被稱為“基音”,它的振動頻率被稱為“基頻”。但對于人工合成的聲音或者通過濾波處理后的聲音(如過濾掉一些低頻成分),其基頻并不等于第一諧波的頻率。例如,一個 300 赫茲的純音與一個 400赫茲的純音疊加時,會產(chǎn)生一個復合波,這個復合波就包括兩個分音,其頻率分別等于 300 赫茲和 400 赫茲,第一諧波的頻率為 300 赫茲,這個復合波的基頻并不等于 300 赫茲,而是等于 100 赫茲。音高是人耳對物體振動頻率的聽覺感受,其高低主要決定于聲波頻率。一般來說,振動頻率越高,感受到的音高也越高;振動頻率越低,感受到的音高也越低。對復合波音高的感知,主要決定于基頻。一般來說,女同志的音高比男的高,童聲的音高比成人高。11、基音-陪音-諧波-分音-泛音一個復合音是由多個頻率不同的純音組成的,通過一定的方法可以把復合音分解為一定數(shù)目的純音,這些被分解出來的純音在物理學上被稱為“分音”,在電聲學上被稱為“諧波”。其中,那個振幅最大、頻率最低的分音,被稱為“基音”,也被稱為“第一諧波”;其他分音的振幅一般都比基音的振幅小,而頻率都

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論