數(shù)字語(yǔ)音處理復(fù)習(xí)題分析_第1頁(yè)
數(shù)字語(yǔ)音處理復(fù)習(xí)題分析_第2頁(yè)
已閱讀5頁(yè),還剩9頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第一章緒論1. 語(yǔ)音信號(hào)處理是以語(yǔ)音語(yǔ)言學(xué)和數(shù)字信號(hào)處理為基礎(chǔ)而形成的一門涉及面很廣的綜合性的學(xué)科。p1d32語(yǔ)音信號(hào)處理的應(yīng)用技術(shù)列舉:語(yǔ)音編碼、語(yǔ)音識(shí)別、語(yǔ)音合成、說(shuō)話人識(shí)別和語(yǔ)種辨識(shí)、語(yǔ)音轉(zhuǎn)換和語(yǔ)音隱藏(語(yǔ)音信息偽裝、語(yǔ)音數(shù)字水印技術(shù))、語(yǔ)音增強(qiáng)等p4d33當(dāng)前語(yǔ)音信號(hào)處理應(yīng)用的3個(gè)主流技術(shù):矢量量化技術(shù)、隱馬爾可夫模型技術(shù)、人工神經(jīng)網(wǎng)絡(luò)技術(shù)。p4d3第二章語(yǔ)音信號(hào)處理基礎(chǔ)知識(shí)1語(yǔ)音是組成語(yǔ)言的聲音,是聲音(Acoustic)和語(yǔ)言(Language)的組合體。p5d22. 語(yǔ)音的基本聲學(xué)特性包括音色,音調(diào),音強(qiáng)、音長(zhǎng)。p7d2 音色:也叫音質(zhì),是一種聲音區(qū)別于另一種聲音的基本特征。 音

2、調(diào):是指聲音的高低,它取決于聲波的頻率。 音強(qiáng):聲音的強(qiáng)弱,它由聲波的振動(dòng)幅度決定。 音長(zhǎng):聲音的長(zhǎng)短,它取決于發(fā)音時(shí)間的長(zhǎng)短。3. 說(shuō)話時(shí)一次發(fā)出的,具有一個(gè)響亮的中心,并被明顯感覺(jué)到的語(yǔ)音片段叫音節(jié)(Syllable)。一個(gè)音節(jié)可以由一個(gè)音素(Phoneme)構(gòu)成,也可以由幾個(gè)音素構(gòu)成。音素是語(yǔ)音發(fā)音的最小單位。p7d34. 任何語(yǔ)言都有語(yǔ)音的元音(Vowel)和輔音(Consonant)兩種音素。p7d38當(dāng)聲帶振動(dòng)發(fā)出的聲音氣流從喉腔、咽腔進(jìn)入口腔從唇腔出去時(shí),這些聲腔完全開(kāi)放,氣流順利通過(guò),這種音稱為元音。p7d39呼出的聲流,由于通路的某一部分封閉起來(lái)或受到阻礙,氣流被阻不能暢通,

3、而克服發(fā)音器官的這種阻礙而產(chǎn)生的音素稱為輔音。p7d37發(fā)輔音時(shí)由聲帶是否振動(dòng)引起濁音和清音的區(qū)別,聲帶振動(dòng)的是濁音,聲帶不振動(dòng)的是清音。p7d38元音構(gòu)成音節(jié)的主干(因?yàn)闊o(wú)論從長(zhǎng)度還是能量看,元音在音節(jié)中都占主要部分。)p7d39. 元音的一個(gè)重要聲學(xué)特性是共振峰(Formant)。共振峰參數(shù)是區(qū)別不同元音的重要參數(shù),它一般包括共振峰頻率(FormantFrequency)的位置和頻帶寬度(FormantBandwidth)。p7d516. 人類的聲道和鼻道可以看作是非均勻截面的聲道管,聲道管的諧振頻率稱為共振峰頻率(共振峰)。p7d510. 漢語(yǔ)音節(jié)一般由聲母、韻母和聲調(diào)三部分組成。漢語(yǔ)普

4、通話中有6000多個(gè)常用字,每個(gè)漢字是一個(gè)音節(jié)。p10d610. 發(fā)濁音時(shí),氣流通過(guò)聲門時(shí)使聲帶發(fā)生振動(dòng),產(chǎn)生準(zhǔn)周期激勵(lì)脈沖串,這個(gè)脈沖串的周期就稱為基音周期(pitch),其倒數(shù)成為基音頻率。11. 漢語(yǔ)是一種聲調(diào)語(yǔ)言,聲調(diào)的變化就是濁音基音周期(或基音頻率)的變化。p14d513. 無(wú)論是單音節(jié)語(yǔ)音還是連續(xù)語(yǔ)音,其中濁音段的基因頻率是隨時(shí)間而變化的,基因頻率的不同軌跡成為聲調(diào)。p9d1114. 當(dāng)兩個(gè)響度不同的聲音作用于人耳時(shí),響度較高的頻率成分的存在會(huì)影響到對(duì)響度較低的頻率成分的感受,使其變得不易察覺(jué),這種現(xiàn)象成為掩蔽效應(yīng)。15. 語(yǔ)音信號(hào)的牛成模型可由激勵(lì)模型、聲道模型和輻射模型三個(gè)子

5、模型構(gòu)成,三者是串聯(lián)(串聯(lián)/并聯(lián))的關(guān)系。p21-2616語(yǔ)音信號(hào)激勵(lì)模型一般分為濁音激勵(lì)和清音激勵(lì),發(fā)濁音時(shí)激勵(lì)模型為脈沖波。p21d617. 語(yǔ)音信號(hào)激勵(lì)模型一般分為濁音激勵(lì)和清音激勵(lì),發(fā)清音時(shí)激勵(lì)信號(hào)通常被模擬為隨機(jī)白噪聲。p22d216. 語(yǔ)音信號(hào)生成模型的輻射模型是一階類高通濾波器。p25d217設(shè)截取的一段語(yǔ)音共有160個(gè)樣本,而采樣頻率為8kHz,則該段語(yǔ)音持續(xù)時(shí)間為20mso18.設(shè)采樣頻率為8kHz,則25ms長(zhǎng)的語(yǔ)音共有200個(gè)采樣值。18. 研究語(yǔ)音的時(shí)頻分析特性所采用的與時(shí)序相關(guān)的傅立葉分析的顯示圖形稱為語(yǔ)譜圖(Sonogram,或者Spectrogram)p29d11

6、9語(yǔ)譜圖是一種三維頻譜,它是表示語(yǔ)音頻譜隨時(shí)間變化的圖形,其縱軸為頻率,橫軸為時(shí)間,任一給定頻率成分在給定時(shí)刻的強(qiáng)弱用相應(yīng)點(diǎn)的灰度或色調(diào)的濃淡來(lái)表示。p29d120. 傳輸函數(shù)形式為V(z)=H:的共振峰模型為(2)數(shù)學(xué)模型;1一bz-1一cz-2i=1ii1. 全零點(diǎn);2. 全極點(diǎn);3. 極零點(diǎn);4. 以上都不是;21. 傳輸函數(shù)形式為V(z)=N7ai的共振峰模型在結(jié)構(gòu)上為(1)模型;1一bz-1一cz-2i=1ii1. 級(jí)聯(lián)型2. 并聯(lián)型;3. 混合型;4. 以上都不是;22. 傳輸函數(shù)形式為V(z)=藝i的共振峰模型為(3)數(shù)學(xué)模型;1一Bz-1一Cz-2i=1ii1. 全零點(diǎn);2.

7、全極點(diǎn);3. 極零點(diǎn);4. 以上都不是;23. 傳輸函數(shù)形式為V(z)=藝i的共振峰模型在結(jié)構(gòu)上為(2)模型;1一Bz-1一Cz-2i=1ii1. 級(jí)聯(lián)型2. 并聯(lián)型;3. 混合型;4. 以上都不是;24. 簡(jiǎn)述語(yǔ)音產(chǎn)生過(guò)程的三個(gè)模型:25. 基音頻率、共振峰、語(yǔ)譜圖的概念,會(huì)從語(yǔ)音波形中識(shí)別基音周期與共振峰頻率。發(fā)濁音時(shí),氣流通過(guò)聲門時(shí)使聲帶發(fā)生振動(dòng),產(chǎn)生準(zhǔn)周期激勵(lì)脈沖串,這個(gè)脈沖串的周期就稱為基音周期(pitch),其倒數(shù)成為基音頻率。一般來(lái)說(shuō),男性說(shuō)話的基音頻率大致分布在50-200HZ范圍內(nèi),女性和小孩的基因頻率在200-450HZ之間。人類的聲道和鼻道可以看作是非均勻截面的聲道管,聲

8、道管的諧振頻率成為共振峰頻率,簡(jiǎn)稱共振峰。共振峰由低到高依次為第一共振峰、第二共振峰、第三共振峰。、。,相應(yīng)的頻率用Fl、F2、F3。表示。一般濁音中可以辨識(shí)的共振峰有5個(gè),其中前三個(gè)對(duì)于區(qū)別不同語(yǔ)音至關(guān)重要。語(yǔ)譜圖描述了語(yǔ)音信號(hào)隨時(shí)間而變化的頻譜特性??v軸對(duì)應(yīng)于頻率、橫軸對(duì)應(yīng)于時(shí)間,圖像的黑白度對(duì)應(yīng)于信號(hào)的能量。26. 漢語(yǔ)中的四種聲調(diào)與基音頻率的關(guān)系是什么?無(wú)論是單音節(jié)語(yǔ)音還是連續(xù)語(yǔ)音,其中濁音段的基因頻率是隨時(shí)間而變化的,基因頻率的不同軌跡成為聲調(diào)。29.音調(diào):音調(diào)是聽(tīng)覺(jué)分辨聲音高低時(shí),用于描述這種感受的一種特性。音調(diào)與聲音的頻率并不成正比,還與聲音的強(qiáng)度及波形有關(guān)。描述音調(diào)的單位是美(

9、mel)。一個(gè)高于聽(tīng)閾40dB、頻率為lKHz的純音所產(chǎn)生的音調(diào)定位lOOOmel,如果一個(gè)純音聽(tīng)起來(lái)比lOOOmel的聲音調(diào)子高一倍,則其音調(diào)為2000mel。音調(diào)與頻率的關(guān)系近似表示為:T沁3323.23lg(l+0.001f)melHz27. 掩蔽效應(yīng):當(dāng)兩個(gè)響度不同的聲音作用于人耳時(shí),響度較高的頻率成分的存在會(huì)影響到對(duì)響度較低的頻率成分的感受,使其變得不易察覺(jué),這種現(xiàn)象成為掩蔽效應(yīng)。第三章語(yǔ)音信號(hào)分析2l.語(yǔ)音信號(hào)分析采用短時(shí)分析技術(shù)。p32d220.語(yǔ)音信號(hào)分析,根據(jù)所分析出的參數(shù)的性質(zhì)的不同可以分為:時(shí)域分析、頻域分析、倒頻域分析、線性預(yù)測(cè)分析等。根據(jù)分析方法的不同,分為模型分析方

10、法和非模型分析方法兩種。p32d322由于輻射模型的影響,語(yǔ)音信號(hào)高頻部分衰減較大,所以在預(yù)處理中需采用預(yù)加重技術(shù),即提升高頻部分,使信號(hào)的頻譜變得平坦。23. 不論是分析怎么樣的參數(shù)以及采用什么分析方法,在按幀進(jìn)行語(yǔ)音分析,提取語(yǔ)音參數(shù)之前,有一些經(jīng)常使用的、共同的短時(shí)分析技術(shù)必須預(yù)先進(jìn)行,如語(yǔ)音信號(hào)的數(shù)字化、語(yǔ)音信號(hào)的端點(diǎn)檢測(cè)、預(yù)加重、加窗和分幀等23.語(yǔ)音信號(hào)加窗、分幀常用的窗函數(shù)有矩形窗、漢明窗等(列舉兩個(gè))。25.對(duì)于頻率分布為03400Hz的語(yǔ)音信號(hào),最低無(wú)失真采樣頻率應(yīng)為6800Hz25. 若信號(hào)波形的變化足夠大,或量化間隔A足夠小時(shí),以下有關(guān)量化噪聲描述錯(cuò)誤的是(4)p33d2

11、1是平穩(wěn)的白噪聲過(guò)程2. 量化噪聲與輸入信號(hào)不相關(guān)3. 量化噪聲在量化間隔內(nèi)均勻分布,即具有等概率密度分布4. 是服從高斯分布的隨機(jī)過(guò)程26. 以下那種分析不屬于語(yǔ)音信號(hào)時(shí)域分析?(4)1. 短時(shí)過(guò)零率分析;2. 短時(shí)相關(guān)分析;3. 短時(shí)平均幅度差函數(shù);4. 同態(tài)分析;短時(shí)能量的主要用途不包括以下那一項(xiàng)(4)p38d51. 可以區(qū)分濁音段和清音段;2. 可以用來(lái)查找聲母和韻母的分界;3. 可以用來(lái)查找無(wú)聲和有聲的分界;4. 可以區(qū)分高頻和低頻分量;24. 采用自相關(guān)函數(shù)法對(duì)基音周期進(jìn)行估計(jì)時(shí),先用60900Hz的帶通濾波器對(duì)語(yǔ)音信號(hào)進(jìn)行濾波,以下描述錯(cuò)誤的是(4)p71d21. 可減少共振峰的

12、影響;2. 可抑制50Hz的電源干擾;3. 可保留基音頻率的一、二次諧波;4為了防止8kHz采樣時(shí)發(fā)生混疊干擾;定義語(yǔ)音信號(hào)x(m)的短時(shí)自相關(guān)函數(shù)R(k)為nnR(k=)淀xmXm+k(k|R(k)|nn7設(shè)序列x(n)的短時(shí)能量定義為:=藝x(m)w(n-m)m=g其中窗函數(shù)表示為:w(m)=00,m0試求E的一個(gè)遞推公式,用E,和輸入x(n)表示Enn-1n8設(shè)序列x(n)的短時(shí)能量定義為:=藝x(m)w(n-m)m=g其中窗函數(shù)表示為:,、aM,mNw(m)= 自相關(guān)函數(shù)法:濁音信號(hào)的自相關(guān)函數(shù)在基音周期的整數(shù)倍位置上出現(xiàn)峰值;而清音的自相關(guān)函數(shù)沒(méi)有明顯的峰值出現(xiàn)。因此檢測(cè)是否有峰值就

13、可判斷是清音或濁音,檢測(cè)峰值的位置就可提取基音周期值。 短時(shí)平均幅度差函數(shù)法:對(duì)周期性的濁音語(yǔ)音,短時(shí)平均幅度差函數(shù)也呈現(xiàn)與濁音語(yǔ)音周期相一致的周期特性,短時(shí)平均幅度差函數(shù)在周期的各個(gè)整數(shù)倍點(diǎn)上具有谷值特性而不是峰值特性,可確定基音周期;而對(duì)于清音語(yǔ)音信號(hào),短時(shí)平均幅度差函數(shù)卻沒(méi)有這種周期特性。利用短時(shí)平均幅度差函數(shù)的這種特性,可以判定一段語(yǔ)音是濁音還是清音,并估計(jì)出濁音語(yǔ)音的基音周期。12濁音與清音的短時(shí)能量、短時(shí)平均過(guò)零率、短時(shí)自相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù)有什么差異?導(dǎo)致這些差異的根本原因是什么?相對(duì)來(lái)說(shuō)濁音的短時(shí)能量大、短時(shí)平均過(guò)零率低、短時(shí)自相關(guān)函數(shù)的峰值位置具有周期性,短時(shí)平均幅度

14、差函數(shù)的谷值位置具有周期性。這是因?yàn)闈嵋羰怯陕晭д駝?dòng)引起的脈沖波激勵(lì)聲道產(chǎn)生的,能量較大,頻率較低,具有與激勵(lì)波相同的周期性結(jié)構(gòu),而清音是由白噪聲激勵(lì)而產(chǎn)生,能量較低,頻率較高,不具有周期性。13.若用信號(hào)的短時(shí)傅立葉變換來(lái)定義其短時(shí)能量譜密度:nXd2同時(shí)定義信號(hào)的短時(shí)自相關(guān)函數(shù)為:R(k)=w(n-m)x(m)w(n-k-m)x(m+k)nm證明當(dāng)X(ej)=x(m)w(n-m)e-jm時(shí),R(k)與S(eje)互為傅立葉變換對(duì)。nnnm=s15設(shè)p階線性預(yù)測(cè)器表達(dá)式為S(n)=Yas(n-i),證明在最小均方預(yù)測(cè)誤差準(zhǔn)則下,預(yù)ii=1測(cè)系數(shù)a,a滿足方程組:(0,j)=刀a(i,j),j

15、=1,2,,p,其中1pii=1(i,j)=Es(m-i)s(m-j)。解:預(yù)測(cè)誤差為(n)=s(n)-s(n)=s(n)刀as(n-i),ii=1均方誤差為E2(n)=Es(n)刀as(n一i)2,為使Es2(n)最小,ii=1對(duì)aj求偏導(dǎo)令其為零,有:Ejs(n)-Xas(n-i)s(n-j)=0,j=1,.,p,即Ii=1丿Es(n)s(n-j)=E,j=1,pii=1又因?yàn)?i,j)=Es(n-i)s(n-j),代入上式有(0,j)=Xa(i,j),j=1,2,pii=1設(shè)語(yǔ)音信號(hào)的線性預(yù)測(cè)模型為s(n)=0.9s(n-104n-20s1n-,3模型增益G=1,求該語(yǔ)音信號(hào)的線性預(yù)測(cè)譜

16、表達(dá)式。p59解:-H(ej)=h(z)=EZ)G1一另az-/ii=1G1一另ae一妙i11一0.9e一j一0.4e一2j一0.1e一3ji=1第四章矢量量化技術(shù)1. 根據(jù)量化的值的維數(shù)的不同,量化可分為標(biāo)量量化和矢量量化。2. 矢量量化常用的失真測(cè)度有:歐式距離測(cè)度、加權(quán)歐式距離測(cè)度、Itakura-Saito距離、似然比測(cè)度和識(shí)別失真測(cè)度。3. 訓(xùn)練矢量量化碼本時(shí),初始碼本的牛成可采用隨機(jī)選取法、分裂法、鏈映射法等。3矢量量化LBG算法每次迭代時(shí)將訓(xùn)練集分割為若干個(gè)子集所依據(jù)的是(1):1. 最鄰近準(zhǔn)則;2. Centroid質(zhì)心條件;3. 收斂準(zhǔn)則;4. 熵極大化準(zhǔn)則;3矢量量化LBG

17、算法每次迭代時(shí)計(jì)算新碼字所依據(jù)的是(2):1. 最鄰近準(zhǔn)則;2. Centroid質(zhì)心條件;3. 收斂準(zhǔn)則;4. 熵極大化準(zhǔn)則;第五章隱馬爾可夫模型1. HMM是一個(gè)雙內(nèi)嵌式隨機(jī)過(guò)稈。2. HMM的輸出符號(hào)序列可見(jiàn),而狀態(tài)序列不可見(jiàn)。3下圖是一個(gè)三狀態(tài)HMM,S1是起始狀態(tài),S3是終了狀態(tài),該HMM只能輸出a和b兩種符號(hào),由下圖的Viterbi算法可知輸出aab的最佳路徑為3對(duì)于語(yǔ)音識(shí)別用HMM,可用六個(gè)參數(shù)M=S,O,A,B,兀,F來(lái)定義,這六個(gè)參數(shù)分別表示什么?S是模型中狀態(tài)的有限集合;O是輸出的觀測(cè)值序號(hào)的集合;A是狀態(tài)轉(zhuǎn)移概率的集合;B是輸出觀測(cè)值概率的集合;pai是系統(tǒng)初始狀態(tài)概率的

18、集合;F是終了狀態(tài)的集合。1. 從左到右型HMM(即狀態(tài)的轉(zhuǎn)移只能從左到右或者停留在原狀態(tài),不能返回到以前的狀態(tài))的狀態(tài)轉(zhuǎn)移矩陣具有何種形式?(1)1.上三角矩陣;2. 下三角矩陣;3. 對(duì)稱矩陣;4. 非奇異矩陣;2針對(duì)給定的HMM模型,尋找與給定觀察字符序列對(duì)應(yīng)的最佳狀態(tài)序列可采用(3)1. 前向算法;2. 后向算法;3. Viterbi算法;4. Baum-Welch算法訓(xùn)練HMM模型采用(4)1. 前向算法;2. 后向算法;3. Viterbi算法;4. Baum-Welch算法;下圖是一個(gè)三狀態(tài)HMM,S是起始狀態(tài),S3是終了狀態(tài),該HMM只能輸出a和b兩種符號(hào),試求解:(參考P98

19、)1.該HMM的轉(zhuǎn)移概率矩陣A;2從S1出發(fā)到S3截止,輸出符號(hào)序列abb的概率;3. 最大可能的狀態(tài)序列;0.8bbs3C(230.6bb00g0.20bcij0.3220.4第七章語(yǔ)音編碼1. 語(yǔ)音編碼(SpeechCoding)的目的是在保證語(yǔ)音質(zhì)量和可懂度的條件下,采用盡可能少的比特?cái)?shù)來(lái)表示語(yǔ)音。即降低數(shù)碼率。2. 信源編碼主要解決有效性問(wèn)題:信道編碼主要解決可靠性問(wèn)題。3. 語(yǔ)音編碼誦常分為三類:波形編碼、參數(shù)編碼與混合編碼。4波形編碼力圖使重建后的語(yǔ)音時(shí)域信號(hào)的波形與原語(yǔ)音信號(hào)保持一致。具有適應(yīng)能力強(qiáng)、話音質(zhì)量好等優(yōu)點(diǎn),缺點(diǎn)是編碼速率咼。5. 參數(shù)編碼又稱聲碼器技術(shù),從聽(tīng)覺(jué)感知的角

20、度注重語(yǔ)音的重現(xiàn),通過(guò)建立語(yǔ)音信號(hào)的產(chǎn)生模型,提取其特征參數(shù)來(lái)編碼,波形上不要求與原信號(hào)匹配。優(yōu)點(diǎn)是編碼速率低:缺點(diǎn)是語(yǔ)音質(zhì)量差,自然度低,對(duì)環(huán)境噪聲敏感。6若普通電話通信中采用8kHz采樣,并進(jìn)行12bit量化,則數(shù)碼率為96Kbit/s。7. 對(duì)語(yǔ)音信號(hào)進(jìn)行壓縮編碼的基本依據(jù)是語(yǔ)音信號(hào)的冗余度和人的聽(tīng)覺(jué)感知機(jī)理。8人的聽(tīng)覺(jué)生理和心理特性對(duì)于語(yǔ)音感知的影響主要表現(xiàn)在:1)人類聽(tīng)覺(jué)系統(tǒng)具有掩蔽效應(yīng):2)人耳對(duì)不同頻段聲音的敏感程度不同:3)人耳對(duì)語(yǔ)音信號(hào)的相位變化不敏感。9感覺(jué)加權(quán)濾波器是根據(jù)人耳的掩蔽效應(yīng)來(lái)設(shè)計(jì)的。p138d110均勻量化的特點(diǎn)是:大信號(hào)時(shí)量化信噪比大,小信號(hào)時(shí)量化信噪比小。

21、10. 在增量調(diào)制(DM)中,語(yǔ)音信號(hào)波形發(fā)生急劇變化時(shí),容易出現(xiàn)譯碼波形不能充分跟蹤這種急劇變化而產(chǎn)生失真的現(xiàn)象,稱為斜率過(guò)載。p150d311. 利用參數(shù)編碼實(shí)現(xiàn)語(yǔ)音通信的設(shè)備通常稱為聲碼器。p161d312. LPC聲碼器采用的編碼方式為參數(shù)編碼(波形編碼/參數(shù)編碼)。7語(yǔ)音信號(hào)中存在多種冗余度是語(yǔ)音信號(hào)可進(jìn)行壓縮的重要依據(jù),下列選項(xiàng)中(4)屬于頻域冗余度(1)語(yǔ)音信號(hào)幅度非均勻分布性(2)語(yǔ)音信號(hào)樣本間的強(qiáng)相關(guān)性(3)濁音語(yǔ)音段具有的準(zhǔn)周期性(4)非均勻的長(zhǎng)時(shí)功率譜密度9.下列選項(xiàng)中,()不屬于波形編碼方式(1)PCM(2)APCM(3)DM(4)LPC聲碼器8. 語(yǔ)音中最基本的元素是音素,設(shè)語(yǔ)音的音素共有128個(gè),并假設(shè)通常的說(shuō)話速度為每秒平均發(fā)出10個(gè)音素,請(qǐng)從信息論角度計(jì)算語(yǔ)音信號(hào)壓縮編碼的極限碼率。pl3611.一幀典型的LPC參數(shù)包括lbit清濁音信息、5bit增益常數(shù)、6bit基因周期、每個(gè)LPC系數(shù)6bit,共8個(gè)LPC系數(shù),如果一幀時(shí)長(zhǎng)20ms,請(qǐng)計(jì)算該LPC聲碼器的碼率。p162解:(1+5+6+6*8)/0.02=3000bit/s第八章語(yǔ)音合成共振峰合成法屬于(3)1.波形合成法;2. LPC合成法;3. 參

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論