藝術(shù)嗓音的基頻參數(shù)估計方法研究_第1頁
藝術(shù)嗓音的基頻參數(shù)估計方法研究_第2頁
藝術(shù)嗓音的基頻參數(shù)估計方法研究_第3頁
藝術(shù)嗓音的基頻參數(shù)估計方法研究_第4頁
藝術(shù)嗓音的基頻參數(shù)估計方法研究_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

精品文檔-下載后可編輯藝術(shù)嗓音的基頻參數(shù)估計方法研究藝術(shù)嗓音是衡量歌手歌唱水平的重要指標,在選拔和培養(yǎng)歌手的過程中對藝術(shù)嗓音的評價占據(jù)著重要的位置。特別是藝術(shù)院校,在招生和教學、考核環(huán)節(jié)對藝術(shù)嗓音進行客觀和公正的評價更為重要。

在選拔與培養(yǎng)歌手的過程中,對嗓音的評價非常重要。傳統(tǒng)的評價方式是通過幾位評委來給歌手評價,這種方法主觀性強,難以做到對每一個歌手客觀、公正地評價??陀^定量的評價嗓音、藝術(shù)嗓音的報道隨著計算機在各領(lǐng)域的開發(fā)與應用而日漸增加。平野實1990年在《人類聲音的客觀評價》一文中指出目前發(fā)聲機能檢查的其中一個目的就是為了評價發(fā)聲機能(平野實,人類聲音的客觀評價[J],臨床方面,國外醫(yī)學耳鼻咽冊,1990,14(5):274.);胡維平、王修信等1998年《嗓音客觀評價的探討》中得到正常成人/a/音的頻域呈穩(wěn)定的分布(胡維平,王修信,嗓音客觀評價的探討[J],聽力學及言語疾病志,1998,6(04):193-195.)。這些研究都說明了可以利用科學手段客觀評價藝術(shù)嗓音。

聲樂教學是復雜的系統(tǒng)工程,目前采用的是教師個人面對面的技藝傳授形式,如果能輔以利用計算機對歌唱信號的共振峰、基頻、音域、平均能量等聲學參數(shù)進行定量的分析,以穩(wěn)定可靠的科學手段觀察、測量、分析人發(fā)音時的各種影響因素,給歌唱者以客觀的評價,并通過上述參數(shù)定量反映學生嗓音發(fā)聲機能的狀態(tài)、嗓音發(fā)揮是否理想,并探索其中存在的規(guī)律性,將大大改善聲樂教學的質(zhì)量。同時利用計算機技術(shù)可以將聲音以圖形的方式顯示,從而間接地了解聲道的變化。歌唱者不僅能聽到自己的聲音,還能通過計算機看到自己的聲音,并通過聲譜樣板進行比較,來發(fā)現(xiàn)自身的不足,從而進行自我強化訓練,提高自己的歌唱水平。

本文通過采集藝術(shù)嗓音的聲學信號,用三種不同的方法分析提取基頻參數(shù),并分析基頻參數(shù)的變化規(guī)律及其對藝術(shù)嗓音評價的量化影響,然后將結(jié)果應用于聲樂教學中,取得了很好的效果。

一、評價藝術(shù)嗓音的聲學參數(shù)

評價藝術(shù)嗓音的聲學參數(shù)包括基頻、共振峰、平均能量和音域等,在研究這些參數(shù)與歌唱水平的關(guān)系之前,研究這些參數(shù)的正確提取與估計方法是十分重要的。共振峰主要用來評價歌手的音質(zhì)、音域,反映歌手的發(fā)聲能力,是藝術(shù)嗓音研究的重要指標;平均能量主要用來反映在相同環(huán)境下歌聲信號的大小?;羰敲總€樂音中頻率最低的純音,其強度最大,基音的頻率即為基頻,決定整個音的音高,在藝術(shù)嗓音評估時是非常重要的一個參數(shù)。本文主要研究藝術(shù)嗓音聲學信號的基頻參數(shù)的估計方法,并將研究成果在聲樂教學中進行驗證。

1、基頻定義

基頻是發(fā)濁音時聲帶振動的基本頻率;除與聲帶本身的基本特征(長度、質(zhì)量、張力等)有關(guān)外,還受環(huán)甲肌、甲杓肌及聲門下壓的調(diào)節(jié)。由于發(fā)聲器官生理方面的差異,男性和女性的基頻范圍不同,一般地,成年男性的基頻范圍為50~250Hz;成年女性的基頻范圍為120~500Hz。

2、基頻提取原理

基音是指發(fā)濁音時聲帶振動所引起的周期性,而基音周期是指聲帶振動頻率的倒數(shù)。語音信號處理中基頻的提取和估計可以分為三類:時域的方法、頻域的方法和統(tǒng)計的方法。頻域的方法一般采用倒譜法來提取,即:將語音信號變換到頻域或者倒譜域來估算基音周期,基音周期的倒數(shù)就是基音頻率,簡稱之基頻。時域方法主要包括過零率、自相關(guān)函數(shù)法、峰值率和平均幅度差函數(shù)法等,本文在相同的歌唱信號采樣樣本基礎(chǔ)上分別采用倒譜法、過零率、自相關(guān)函數(shù)法和平均幅度差函數(shù)法來提取語音信號的基頻并將結(jié)果進行比較。文中以音高/do/為基準來提取基頻,采樣樣本中所唱的最低的音高是|do|。

3、倒譜法

語音信號可看做是音高基準信號通過不同的發(fā)聲系統(tǒng)而產(chǎn)生的輸出,將發(fā)聲系統(tǒng)看作線性時不變系統(tǒng),語音信號就卷積信號。為了能用線性方法對其進行后續(xù)處理,先用卷積同態(tài)系統(tǒng)對其進行加工分解。設(shè)原語音序列為x(n),根據(jù)時域卷積定理時域卷積相當于頻域乘積,故首先對原序列取傅立葉變換,再取對數(shù),將輸入與系統(tǒng)關(guān)系以線性疊加關(guān)系描述出來,再經(jīng)過傅立葉擬變換恢復為時域序列。這樣經(jīng)過卷積同態(tài)系統(tǒng)后輸出的是偽時域序列,稱之為原序列的“復倒頻譜”(王曉亞,倒譜在語音的基音和共振峰提取中的應用[J],無線電工程,2022,34(1):57-61.),用x(n)表示。它的定義式表示如下:

歌手在歌唱發(fā)濁音時,設(shè)聲門發(fā)出的是一有限長沖激序列,它是以基音周期為周期的序列,經(jīng)過求倒譜得到的偽時間序列也是一個周期沖激序列,并且周期不變。由定義可知倒譜的偽時間序列的衰減速度比原序列要快。另外,由于倒譜是復倒譜的偶對稱分量,它具有與復倒譜相同的基音周期,由于計算方便而更容易精確獲得,基音周期的倒數(shù)就是待估計的基頻。

4、過零率法

過零率是通過觀察語音信號的波形重復自己的頻率來估計出基頻(張杰,龍子夜,張博等,語音信號處理中基頻提取算法綜述[J],電子科技大學學報,2022,39(4):99-101.)。這些方法的理論依據(jù)是,如果語音信號是周期的,那么事件就會隨著時間不斷重復出現(xiàn),將單位時間內(nèi)的發(fā)生次數(shù)統(tǒng)計出來,就能估計出基頻。簡單的說,過零率就是單位時間內(nèi)波形通過零點的次數(shù)。基頻是過零率的一半,過零率求出來之后再除以2就能得到基頻。但是這樣的方法提取基頻有一定的誤差,如果信號的能量都集中在基頻的附近,那么一個周期內(nèi)它將兩次穿過零。但是如果信號包含了高頻能量,在一個周期內(nèi)它穿過零的次數(shù)將大于2。所以如果使用過零率檢測基頻,要先濾掉高頻成分。確定濾波器的截止頻率,盡可能多地去掉高頻成分,得出的結(jié)果才更接近真實值。

5、自相關(guān)函數(shù)法

以兩個信號之間的相關(guān)函數(shù)來度量它們之間的相似性,如果兩個信號波形開始時間的延遲發(fā)生變化則相關(guān)函數(shù)的結(jié)果也將發(fā)生改變。自相關(guān)函數(shù)是信號自身的相關(guān)函數(shù),以自相關(guān)函數(shù)度量信號自身的相似性。對于無限長的離散信號x(n),自相關(guān)函數(shù)的定義為:

其中y為信號的延時。若x(n)為長度為N的離散信號,則自相關(guān)函數(shù)的定義為:

若x(n)是周期函數(shù),則自相關(guān)函數(shù)也是周期性函數(shù),并且在基音周期的各個整數(shù)點上有很大的峰值。因此只要計算出自相關(guān)函數(shù)峰值的周期,再取周期的倒數(shù)就能得到基頻。

6、平均幅度差函數(shù)法

平均幅度差函數(shù)法的計算公式為:

這種方法與自相關(guān)函數(shù)法相同,對于周期性的函數(shù),平均幅度差函數(shù)也呈現(xiàn)周期性,不同點在于自相關(guān)函數(shù)法的結(jié)果在基音周期的各個整數(shù)點有很大的峰值,而平均幅度差函數(shù)法在基音周期的各個整數(shù)點有谷值。

二、基頻參數(shù)的估計

1、藝術(shù)嗓音聲學信號的采樣

本文使用的藝術(shù)嗓音聲學信號的采集在專業(yè)錄音棚中進行,分別請一個班30位男女歌手唱出不同音高,不同元音聲音信號,以44100Hz為采樣頻率對歌聲信號進行采集,文件以wav形式存貯。

2、倒譜法基頻估計

倒譜法估計基頻屬于頻域方法。利用倒譜算法提取基頻的步驟如下:首先讀入歌手的語音信號序列并截取所需的信號段,然后對其進行傅立葉變換,取幅度譜的對數(shù)后再做傅立葉逆變換。估計的目的是求得基頻信號,最后一步傅立葉逆變換得到偽時間序列,其具有與原時間序列相同的基音周期,求得周期也就得到了基頻。從信號處理角度而言,在頻域估計偽時間序列的基頻信噪比更高,估計更為準確。因此,倒譜估計基頻的過程中,不再進行最后一步的傅立葉逆變換,直接在頻域估計基頻信號。根據(jù)先驗知識,女性基頻信號的范圍為120~500Hz,因此在此頻段搜索偽時間序列的最大值,它所對應的頻率位置就是所求的基頻。

下面對女歌手Md_yang的歌聲信號應用倒譜法估計基頻,歌唱為小字一組do的/a/持續(xù)時間波形如圖1所示,總持續(xù)時間約5.6秒。按照上述求倒譜步驟,利用每1秒鐘的數(shù)據(jù)計算基頻,結(jié)果如表1所示。

每秒鐘的基頻最大相差約10Hz,這5.6秒數(shù)據(jù)的基頻均值為266.20Hz。圖2第一組為0-1秒時間數(shù)據(jù)的傅里葉變換頻譜圖,其中縱坐標根據(jù)倒譜定義取幅度譜的自然對數(shù);圖3為第一組4-5秒時間數(shù)據(jù)的傅里葉變換頻譜圖,其中縱坐標定義同上;對比圖2和圖3。圖2的表現(xiàn)諧波性更強,聲音更加的干凈。圖3信號的傅立葉變換的頻譜更加的豐富,聲音信號中也可以聽出來略有顫音。每組各時間段基音頻率的估計值都在合理的范圍之內(nèi)。雖然利用不同的時間段估計基頻值略有不同,但結(jié)果也是合理的,因為發(fā)聲的聲腔本身也是時變的,但對于一個音高來說,應該是越穩(wěn)定越好。該歌手依次3組錄音,由第二組和第三組的基頻估計值來看,不同時間段基頻的差異越來越小,聲音信號漸漸穩(wěn)定的。由同一音高上不同的三組數(shù)據(jù)估計的基頻數(shù)值也非常接近,這三組數(shù)據(jù)估計的基頻均值為264.89Hz。

3、過零率法基頻估計

過零率法假設(shè)語音信號是周期的,通過估計波形的重復率計算基頻,即統(tǒng)計單位時間內(nèi)的語音波形的重復發(fā)生次數(shù)。此方法比較簡單,屬于時域估計方法,實用中只要統(tǒng)計出單位時間內(nèi)波形的過零率,過零率就是單位時間內(nèi)波形通過零點的次數(shù)。如果信號的能量都集中在基頻的附近,那么一個周期內(nèi)它將兩次穿過零,基頻等于過零率的一半。為提高估計精度,首先要濾除信號中高頻分量,可根據(jù)歌手特征分別設(shè)計低通濾波器,也可以根據(jù)所有歌手的統(tǒng)一聲音特征設(shè)計低通濾波器。仿真中采用配合歌手特征設(shè)計低通濾波器,通帶頻率為500Hz,截止頻率選為600Hz,衰減40dB。采用時域相關(guān)原理可以很容易計算出單位時間內(nèi)波形穿過零點的次數(shù),估計出語音信號的基頻。

下面仍采用歌手Md_yang歌聲信號,應用過零率法估計基頻。估計結(jié)果如表2所示。

三組數(shù)據(jù)的估計結(jié)果的趨勢與倒譜法具有一致性。第二組與第三組數(shù)據(jù)估計基頻的穩(wěn)定性較好,三組數(shù)據(jù)過零率法提取的基頻均值為291.21Hz。

4、自相關(guān)函數(shù)法基頻估計

此方法屬于時域的方法,同樣是通過觀察語音信號的波形重復自己的頻率來估計出基頻。如果語音信號是周期的,那么自相關(guān)函數(shù)也呈周期性,并且在基音周期的各個整數(shù)點上有很大的峰值。在自相關(guān)波形中找出幾個峰值算出基音周期,取倒數(shù)后就得到基頻,由于自相關(guān)函數(shù)的峰值非常顯著,這種方法對低信噪比信號更為有效。仍對歌手Md_yang聲音信號利用自相關(guān)函數(shù)法進行基頻估計,估計結(jié)果如表3所示。

圖4是從原語音波形中截取0-1秒數(shù)據(jù)進行自相關(guān)波形,放大自相關(guān)波形的峰值,可見是周期性變化的,峰值周期的倒數(shù)就是基頻值。自相關(guān)函數(shù)法對三組信號進行基頻估計的均值為265.01Hz。由圖4可以看出,由于自相關(guān)信號處理方法,增強了信噪比,圖中信號的周期性十分的明顯,信號估計精度會較過零率法更高。

5、平均幅度差函數(shù)法基頻估計

此方法也是時域的方法,與自相關(guān)函數(shù)法相類似,不同點在于自相關(guān)函數(shù)法的結(jié)果在基音周期的各個整數(shù)點有很大的峰值,而平均幅度差函數(shù)法在基音周期的各個整數(shù)點有谷值。應用這種方法對歌手Md_yang進行基頻估計,估計結(jié)果如表4所示。

圖5為平均幅度差波形的放大圖。從圖中可以看出波形是周期性變化的,求得谷值周期,其倒數(shù)就是基頻,表4中平均幅度差法估計的基頻均值為263.98Hz。

三、結(jié)果分析與總結(jié)

將30個歌手的數(shù)據(jù)進行分析,將三組數(shù)據(jù)的四種基頻估計方法求得的基頻平均值與方差總結(jié)于同一表格中,方便進行比較,并表5所示。由方差可以看出,平均幅度法的方差最小,基頻估計值最為穩(wěn)定,過零率法的方差最大,估計最不穩(wěn)定。同時從程序的計算量角度來說,四種方法中,過零率法計算量用時最少,因為運算方法簡便,而平均幅度差法的計算用時最多。

將四種方法基頻估計的平均值再一次平均,得到基頻值為271.27Hz,方差為13.30。如果不包含過零率方法,將另外三種方法進行平均,則得到基頻值為264.63Hz,方差為0.56。即四種方法中,除過零率方法外,三種方法的估計方差非常小,說明三種方法基

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論