版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
PAGEPAGE1《語音處理技術(shù)》試卷1答案及評分標準一、填空:(12小題,共36分)1.數(shù)字信號處理;語音學。2.激勵模型;聲道模型;輻射模型。3.高;清音;濁音。4.將輸入矢量用碼本重構(gòu)矢量來表征時所產(chǎn)生的誤差或失真的度量方法;線性預(yù)測失真測度;似然比失真測度;主觀失真測度。5.全極點數(shù)字濾波器;預(yù)測系數(shù)ai;反射系數(shù)ki。6.非線性處理;減譜法;自適應(yīng)對消。7.說話人確認;說話人辨認。8.波形合成法;參數(shù)合成法;規(guī)則合成法;合成單元、合成參數(shù)和合成音。9.自適應(yīng)差分脈沖編碼調(diào)制;矢量量化編碼;線性預(yù)測編碼;多脈沖線性預(yù)測編碼;碼激勵線性預(yù)測編碼。10.聲門激勵;聲道響應(yīng)序列;同態(tài)濾波。11.語音信號的冗余度;人的聽覺感知機理。12.頻譜包絡(luò)、基音周期。二、名詞解釋(5小題,共12分)1.(2分)語言:語言是人類特有的功能,它是創(chuàng)造和記載幾千年人類文明史的根本手段,沒有語言就沒有今天的人類文明。語音:語音是語言的聲學表現(xiàn),是相互傳遞信息的最重要的手段,是人類最重要、最有效、最常用和最方便的交換信息的形式。2.(2分)濁音:由聲帶振動產(chǎn)生的音;清音:不由聲帶振動產(chǎn)生的音。3.(2分)基音:每開啟和閉合一次的時間即振動周期稱為基音周期;共振峰:聲道可以等效為一個諧振腔,有許多諧振頻率,這些諧振頻率稱為共振峰頻率,簡稱共振峰。4.(4分)復(fù)倒譜、倒譜(要求寫出數(shù)學表達式)(2分)(2分)5.(2分)錯誤拒絕率(FR):將真正的說話人當成冒名頂替者加以拒絕的概率;錯誤接受率(FA):將冒名頂替者作為真正的人加以接受的概率。三、簡答題(7小題,共29分)1.答:將分析的信號用一個模型來表示,即把信號看作一個模型的輸出。常用的模型有全極點模型,全零點模型及零極點模型三種(2分)線性預(yù)測(1分)逆濾波器(1分)2.答:因為系數(shù){ai}的很小變化都將會導(dǎo)致合成濾波器極點位置的很大變化,甚至造成不穩(wěn)定現(xiàn)象。(2分)3.答:語音信號雖然是動態(tài)信號,但是在短時間內(nèi)10-30ms之間是短時平穩(wěn)的,因此通過分幀可以進行線性處理。常用的方法是窗函數(shù)法。(2分)4.答:短時能量、短時過零率、短時自相關(guān)、短時幅度譜(每個1分)5.答:隱馬爾可夫模型(HMM)是一種統(tǒng)計信號模型,是用參數(shù)表示的,用于描述隨機過程統(tǒng)計特性的概率模型,它是由馬爾可夫鏈演變而來的。(2分)隱馬爾可夫模型(HMM)的參數(shù):,即,初始分布,狀態(tài)轉(zhuǎn)移概率矩陣A,某狀態(tài)下系統(tǒng)的輸出概率分布B。(2分)6.答:卷積同態(tài)系統(tǒng)可分為兩個特征系統(tǒng)(它們只取決于信號的組合規(guī)則)和一個線性系統(tǒng)(它僅取決于處理要求)。特征系統(tǒng)D*[],線性系統(tǒng)L*[]和逆特征系統(tǒng)D*-1[],同態(tài)系統(tǒng)可以使卷積關(guān)系變?yōu)榍蠛完P(guān)系,到達語音信號的分離處理。(1分)特征系統(tǒng)D*[]的運算步驟:Z變換對數(shù)運算逆Z變換(2分)逆特征系統(tǒng)D*-1[]Z變換指數(shù)運算逆Z變換(2分)7.濁音語音的復(fù)倒譜中存在峰值,其出現(xiàn)時間等于基音周期;而清音語音段的復(fù)倒譜則不出現(xiàn)峰值;共振峰信息包含在頻譜的包絡(luò)中,譜包絡(luò)的峰值對應(yīng)于共振峰頻率,因此我們可以計算出復(fù)倒譜后,進行解卷,提取聲門激勵信息,在預(yù)期的基音周期附近尋找峰值。在譜包絡(luò)中獲取共振峰。(2分)對于語音信號,設(shè)其頻譜為,用表示聲門激勵頻譜,表示聲道頻率響應(yīng),則有則的復(fù)倒譜為聲門激勵的復(fù)倒譜為聲道沖擊響應(yīng)的復(fù)倒譜。(2分)倒譜和復(fù)倒譜表現(xiàn)出相同的性質(zhì),如圖所示:(2分)聲道沖激響應(yīng)的倒譜聲道沖激響應(yīng)的倒譜c(n)相應(yīng)于頻譜包絡(luò)的慢變分量(虛線表示)以及相應(yīng)于基音諧波峰值的快變分量(實線所示),通過傅立葉反變換,將慢變分量和快變分量分開,其中靠近靠近原點的低頻部分是頻譜包絡(luò)的變換,而位于處的窄峰為諧波峰值的變換,表示基音周期;通過高倒譜窗慮除聲道響應(yīng),得到基音。通過在倒譜域用意個濾波器慮處聲門激勵的影響,得到共振峰。(2分)四、分析題(3小題,共24分)1.第一步:初始化。給出訓練VQ碼書所需的全部參考矢量X,X的集合用S表示;設(shè)定量化級數(shù),失真控制門限,算法最大迭代次數(shù)L以及初始碼書;設(shè)總失真;迭代次數(shù)的初始化為m=1(3分)第二步:迭代1)根據(jù)最近鄰準則將S劃分成N個子集即當時,下式成立:2)計算失真:3)計算新碼字:4)計算相對失真改進量:,將與失真門限進行比較,。若,則轉(zhuǎn)入6),否則轉(zhuǎn)入5)5)若則轉(zhuǎn)至6),否則m加1,轉(zhuǎn)至1)(4分)第三步:結(jié)束,得到最終的訓練碼書,并輸出總失真(1分)2.框圖如下:(4分)工作原理:1)取樣率為10kHz,幀長51.2ms,然后求出c(n),可以采用漢明窗(1分)2)求出倒譜峰值IPK和其位置IPOS,如果峰值未超過某門限值,則進行過零計算;若過零數(shù)超過某門限值,則為無聲語音幀。反之則為有聲,且基音周期仍等于該峰值的位置。(2分)3)無聲檢測器是時域信號的峰值檢測器,若低于某門限值,則認為是無聲,勿須進行上述由倒譜檢測基音的計算。(1分)3.特征提?。菏侵笍恼Z音信號波形獲得一組能夠描述語音信號特征的參數(shù)的過程。也稱為特征參數(shù)提取。(2分)距離測度:如歐氏距離及其變形的距離、似然比測度、加權(quán)了超音段信息的識別測度等用于語音測度估計的測度公式。(2分)參考模式庫:即聲學參數(shù)模板。它是用訓練與聚類的方法,從單講話或多講話者的多次重復(fù)的語音參數(shù),經(jīng)過長時間的訓練而聚類得到的。用
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年滬科版九年級地理下冊階段測試試卷含答案
- 2025年新科版必修2歷史下冊月考試卷
- 二零二五版模具維修與翻新服務(wù)合同4篇
- 二零二五年度智慧城市建設(shè)年薪制合同4篇
- 2025年度養(yǎng)老康復(fù)派遣員工康復(fù)治療合同4篇
- 2025年度面包烘焙原料綠色認證采購合同3篇
- 2025年度設(shè)施農(nóng)業(yè)專用化肥農(nóng)藥定制配送合同4篇
- 2024版離婚債務(wù)解決方案合同范例一
- 二零二五年度煤炭期貨交易居間代理合同3篇
- 2025年度農(nóng)業(yè)科技園區(qū)建設(shè)與管理合同范例4篇
- 撂荒地整改協(xié)議書范本
- 國際貿(mào)易地理 全套課件
- GB/T 20878-2024不銹鋼牌號及化學成分
- 診所負責人免責合同范本
- 2024患者十大安全目標
- 印度與阿拉伯的數(shù)學
- 會陰切開傷口裂開的護理查房
- 實驗報告·測定雞蛋殼中碳酸鈣的質(zhì)量分數(shù)
- 部編版小學語文五年級下冊集體備課教材分析主講
- 電氣設(shè)備建筑安裝施工圖集
- 《工程結(jié)構(gòu)抗震設(shè)計》課件 第10章-地下建筑抗震設(shè)計
評論
0/150
提交評論