成年人與老年人語音轉(zhuǎn)換_第1頁
成年人與老年人語音轉(zhuǎn)換_第2頁
成年人與老年人語音轉(zhuǎn)換_第3頁
成年人與老年人語音轉(zhuǎn)換_第4頁
成年人與老年人語音轉(zhuǎn)換_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、(1)題目任務(wù)與目的(2)語音轉(zhuǎn)換的概念與應(yīng)用 (3)語音轉(zhuǎn)換實(shí)施的初步方案 研究年輕人與老人聲音的不同特點(diǎn),編程實(shí)現(xiàn)一段語音由年輕人向老人及逆過程的轉(zhuǎn)換,選擇合適的特征參數(shù)。 語音信號的特征主要有時域和頻域兩種。時域特征如短時平均能量、短時平均過零率,共振峰、基音周期等;頻域特征有線性預(yù)測系數(shù)、LP倒譜系數(shù)、線譜對參數(shù)、短時頻率、Melp頻率倒譜系數(shù)等,因此要通過實(shí)驗(yàn)摸索較好的轉(zhuǎn)換方法。 語言是人類交換信息最方便、最快捷的一種方式,在高度發(fā)達(dá)的信息社會中,用數(shù)字化的方法對語音進(jìn)行合成,編碼,識別等是整個現(xiàn)代通信系統(tǒng)和電子系統(tǒng)的重要組成部分之一。 語音信號承載了很多信息,主要有:語義內(nèi)容(wh

2、at)、信源語音特征(who)、說話背景信息(where)。 語音轉(zhuǎn)換(Voice Conversion)就是要保留語義內(nèi)容不變,改變說話人的聲音特性,使得某人的聲音聽起來像是由另一個人說出的話。 語音轉(zhuǎn)換是語音信號處理中一個比較新的分支,語音轉(zhuǎn)換的研究具有重要的理論價值與應(yīng)用價值。語音轉(zhuǎn)換的研究涉及語音信號處理領(lǐng)域的各個領(lǐng)域,需要研究并借鑒這些領(lǐng)域的一些知識。(1)應(yīng)用于文語轉(zhuǎn)換(TTS,test-to-speech)系統(tǒng)中。(2)應(yīng)用于娛樂與醫(yī)療領(lǐng)域(3)用于保密通信,語音的個性化偽裝。 (4)語音轉(zhuǎn)換技術(shù)的研究同時也推動了語音信號處理領(lǐng)域其他技術(shù)的發(fā)展。 語音信號隨時間變化的頻譜特性可以

3、用語譜圖直觀的表示。(左圖為“我到北京去”的語譜圖)。 語音信號是一種非平穩(wěn)的時變信號,它攜帶著反映語音特征的各種信息,語音處理的目的在于有效地提取語音特征 根據(jù)左圖,語音轉(zhuǎn)換需要兩個過程(1)訓(xùn)練過程:輸入語音信號經(jīng)過預(yù)處理后,語音信號的特征被提取出來,首先在此基礎(chǔ)上建立的模板,這個過程叫做訓(xùn)練(2) 轉(zhuǎn)換過程:系統(tǒng)利用訓(xùn)練后的轉(zhuǎn)換規(guī)則,用源說話人的參數(shù)來預(yù)測目標(biāo)說話人的參數(shù),最后利用預(yù)測參數(shù)來合成出轉(zhuǎn)換后的語音。 語音的訓(xùn)練過程主要包括:(1)語音信號的采樣(2)語音那信號的預(yù)處理(3)語音信號的特征提?。?)語音訓(xùn)練 語音信號的頻率范圍是3003400Hz,一般情況下采取采樣頻率為8KH

4、z 采樣方法:利用音頻處理軟件 Cool edit,設(shè)置采樣頻率為8KHz,單聲道 mono,采樣精度16 bit, 將錄音存成 “.wav”文件 左圖為預(yù)加重前和預(yù)加重后的一段濁音信號及頻譜由于語音信號平均功率受口唇輻射的影響,高頻端在800Hz以上按6dB/倍頻程跌落預(yù)加重處理的目的是為了對語音的高頻部分進(jìn)行加重,去除口唇輻射的影響。 語音信號是一種非平穩(wěn)信號,不具備傅里葉變換所要求的穩(wěn)態(tài)特性,但可以認(rèn)為語音信號在10ms30ms的短時間內(nèi)是平穩(wěn)的,這是短時傅里葉分析的基礎(chǔ) 左圖是語音信號處理中常用的兩種窗:矩形窗和漢明窗。 語音轉(zhuǎn)換的一個重要的步驟是特征提取。所謂特征提取,即對不同的語音信號尋找其內(nèi)在特征,由此來判別未知語音信號,所以每個語音轉(zhuǎn)換系統(tǒng)都要進(jìn)行特征提取。常用的特征提取方法:(1)線性預(yù)測系數(shù)(LPC)(2)LPC倒譜系數(shù)(LPCC) (3)Mel頻率倒譜系數(shù)(MFCC)通過轉(zhuǎn)換算法進(jìn)行語音分析,提取語音模型參數(shù),之后將相同的參數(shù)聚集在一起作為訓(xùn)練數(shù)據(jù),常用的方法是隱馬爾科夫模型()。轉(zhuǎn)換函數(shù)描述的是源說話人與目

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論