老師整理-語(yǔ)音信號(hào)處理復(fù)習(xí)知識(shí)點(diǎn)1南理工_第1頁(yè)
老師整理-語(yǔ)音信號(hào)處理復(fù)習(xí)知識(shí)點(diǎn)1南理工_第2頁(yè)
老師整理-語(yǔ)音信號(hào)處理復(fù)習(xí)知識(shí)點(diǎn)1南理工_第3頁(yè)
老師整理-語(yǔ)音信號(hào)處理復(fù)習(xí)知識(shí)點(diǎn)1南理工_第4頁(yè)
老師整理-語(yǔ)音信號(hào)處理復(fù)習(xí)知識(shí)點(diǎn)1南理工_第5頁(yè)
已閱讀5頁(yè),還剩12頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

教師整理————語(yǔ)音信號(hào)處理復(fù)習(xí)學(xué)問(wèn)點(diǎn)-11§1.1語(yǔ)音信號(hào)處理概述一、語(yǔ)音、語(yǔ)音信號(hào)處理的名詞解釋1、語(yǔ)音:是語(yǔ)言的聲學(xué)表現(xiàn),是聲音和意義的結(jié)合體,是相互傳遞信息的重要手段,是人類最重要、最有效、最常用和最便利的交換信息的形式。2、語(yǔ)音信號(hào)處理:是爭(zhēng)論用數(shù)字信號(hào)處理技術(shù)對(duì)語(yǔ)音信號(hào)進(jìn)展處理的一門學(xué)科,它是一門興的學(xué)科,同時(shí)又是綜合性的多學(xué)科領(lǐng)域和涉及很廣的穿插學(xué)科。它與語(yǔ)音學(xué)、語(yǔ)言學(xué)、聲學(xué)、認(rèn)知科學(xué)、生理學(xué)、心理學(xué)有親熱關(guān)系。3、語(yǔ)音信號(hào)的數(shù)字處理的優(yōu)點(diǎn):其次頁(yè)第四段二、語(yǔ)音學(xué)的名詞解釋語(yǔ)音學(xué):與語(yǔ)音信號(hào)處理存在格外親熱的關(guān)系,是爭(zhēng)論言語(yǔ)過(guò)程的一門科學(xué),它包括三個(gè)爭(zhēng)論內(nèi)容:發(fā)音器官在發(fā)音過(guò)程中的運(yùn)動(dòng)和語(yǔ)音的音位特性;語(yǔ)音的物理特性;以及聽(tīng)覺(jué)和語(yǔ)言感知?!?.2語(yǔ)音信號(hào)處理的進(jìn)展概況1、語(yǔ)音編碼:語(yǔ)音編碼技術(shù)是伴隨著語(yǔ)音信號(hào)的數(shù)字化而產(chǎn)生的,目前主要應(yīng)用在數(shù)字語(yǔ)音通信領(lǐng)域。2、語(yǔ)音合成:語(yǔ)音合成的目的是使計(jì)算機(jī)能像人一樣說(shuō)話。3、語(yǔ)音識(shí)別:語(yǔ)音識(shí)別是使計(jì)算機(jī)推斷出所說(shuō)的話的內(nèi)容?!?.2語(yǔ)音產(chǎn)生的過(guò)程一、語(yǔ)音、清音、濁音1、語(yǔ)音:聲音是一種波,能被人耳聽(tīng)到,振動(dòng)頻率在 20Hz-20kHz之間。語(yǔ)音是聲音的一種,它是由人的發(fā)音器官發(fā)出的、具有肯定語(yǔ)法和意義的聲音。語(yǔ)音的振動(dòng)頻率最高可達(dá)15kHz2、濁音、清音:語(yǔ)音由聲帶振動(dòng)或不經(jīng)聲帶振動(dòng)來(lái)產(chǎn)生,其中由聲帶振動(dòng)產(chǎn)生的音統(tǒng)稱為濁音,而不由聲帶振動(dòng)產(chǎn)生的音統(tǒng)稱為清音。濁音中包括全部的元音和一些輔音,清音包括另一局部輔音。二、語(yǔ)音的產(chǎn)生過(guò)程〔人體發(fā)出聲音的根本過(guò)程〕:人類的語(yǔ)音是由人體發(fā)音器官在大腦掌握下的生理運(yùn)動(dòng)產(chǎn)生的??諝鈴姆尾颗懦鲂纬蓺饬?,沖擊聲帶,假設(shè)聲帶是緊繃的,則則形成準(zhǔn)周期性脈沖的空氣流,產(chǎn)生“濁音”。假設(shè)聲帶完全伸展,則形成摩擦音或爆破音。經(jīng)過(guò)聲道調(diào)制的空氣流最終從口或鼻腔輻射出來(lái),形成語(yǔ)音。語(yǔ)言交際:通過(guò)連接說(shuō)話人大腦的一連串心理、生理、和物理的轉(zhuǎn)換過(guò)程實(shí)現(xiàn)的。這個(gè)過(guò)程包括:發(fā)音-傳遞-感知。因此現(xiàn)代語(yǔ)音的三個(gè)分支:發(fā)音語(yǔ)言學(xué)、聲學(xué)語(yǔ)言學(xué)、聽(tīng)覺(jué)語(yǔ)言學(xué)。三、基音周期、基音頻率基音周期:聲帶開(kāi)啟和閉合一次的時(shí)間即振動(dòng)周期稱為音調(diào)周期或基音周期?;纛l率:基音周期的倒數(shù)稱為基音頻率,簡(jiǎn)稱為基頻。四、濁音、清音、爆破音的鼓勵(lì)源對(duì)于濁音、清音和爆破音來(lái)說(shuō),鼓勵(lì)源是不同的,濁音語(yǔ)音是位于聲門處的準(zhǔn)周期脈沖序列,清音的鼓勵(lì)源是位于聲道的某個(gè)收縮區(qū)的空氣湍流,而爆破音的鼓勵(lì)源是位于聲道某個(gè)閉合點(diǎn)處建立起來(lái)的氣壓及其突然釋放。五、共振峰的概念1、共振峰名詞解釋:聲道是一個(gè)分布參數(shù)系統(tǒng),它是一個(gè)諧振腔,有很多諧振頻率,稱為共振峰,它是聲道的重要聲學(xué)特征。2、共振峰的公式:Fn=(2n-1)c/4L〔會(huì)運(yùn)用公式進(jìn)展計(jì)算,填空、8〕3、諧振點(diǎn)間的間隔不同,但平均仍舊大約為每1KHz有一個(gè)諧振點(diǎn)。4、聲道的共振峰特性打算所發(fā)聲音的頻譜特性〔音色〕。5、頭三個(gè)共振峰最重要?!?.3語(yǔ)音信號(hào)的特性一、語(yǔ)音的物理屬性語(yǔ)音的物理性質(zhì)包括音質(zhì)、音調(diào)、音強(qiáng)、音長(zhǎng)等特性。語(yǔ)音是人的發(fā)音器官發(fā)出的一種聲波,具有聲音的物理屬性。音質(zhì)是一種聲音區(qū)分于其他聲音的根本特征;音調(diào)指聲音的凹凸,取決于聲波的頻率:頻率高則音調(diào)高,頻率低則音調(diào)低;響度是指聲音的強(qiáng)弱,又稱音量,它是由聲波振動(dòng)幅度打算的;聲音的長(zhǎng)短也稱音長(zhǎng),它取決于發(fā)音持續(xù)時(shí)間的長(zhǎng)短。二、音素、音節(jié)、單詞、句子的根本概念以及它們之間的關(guān)系音素是語(yǔ)音的最小、最根本的組成單位,音素都有其獨(dú)立的各不一樣的發(fā)音方法和發(fā)音部位,它是使聽(tīng)者能區(qū)分一個(gè)單詞和另一個(gè)單詞的聲音的根底。音節(jié)是最小的語(yǔ)言片段,一個(gè)音節(jié)由一個(gè)或幾個(gè)音素組成。單詞是由音節(jié)結(jié)合而成的更大單位,是有意義的語(yǔ)言的最小單位。句子是單詞的進(jìn)一步組合。三、漢語(yǔ)的特點(diǎn)是:音素少、音節(jié)少。漢語(yǔ)中的音節(jié)即字音由聲母、韻母和聲調(diào)按肯定方式構(gòu)成,即聲、韻、調(diào)三個(gè)因素構(gòu)成。四、語(yǔ)音頻譜特性其中虛線稱為譜包絡(luò),其外形是由H(f)和G(f)的包絡(luò)乘積得到的。五、清音和濁音的頻譜特性清音和濁音的波形有很大的不同。清音的波形類似于白噪聲,具有很弱的振幅;元音〔濁音〕具有明顯的準(zhǔn)周期性,并具有較強(qiáng)的振幅。它們的周期對(duì)應(yīng)的頻率就是基音頻率。假設(shè)考察其中一個(gè)周期,還可以大致看出其頻譜特性。§2.4語(yǔ)音信號(hào)產(chǎn)生的數(shù)學(xué)模型一、語(yǔ)音信號(hào)的數(shù)字模型1、語(yǔ)音信號(hào)數(shù)字模型的概念:語(yǔ)音信號(hào)被看成是線性時(shí)不變系統(tǒng)〔聲道〕在隨機(jī)噪聲或準(zhǔn)調(diào)周期脈沖序列鼓勵(lì)下的輸出。2P163、語(yǔ)音的產(chǎn)生過(guò)程〔具體見(jiàn)考題〕二、發(fā)不同性質(zhì)的音時(shí),鼓勵(lì)的狀況是不同的,大致分為兩類:發(fā)濁音時(shí),此時(shí)氣流在通過(guò)繃緊的聲帶時(shí),沖激聲帶產(chǎn)生振動(dòng),使聲門處形成準(zhǔn)周期性的脈沖串。聲帶繃緊的程度不同時(shí),振動(dòng)頻率也不同,這個(gè)頻率就是音調(diào)頻率,其倒數(shù)為音調(diào)周期。不同人的音調(diào)周期是不同的,男子大,女子小,老人大,小孩低?!?〕發(fā)清音時(shí),此時(shí)聲帶松弛而不振動(dòng),氣流通過(guò)聲門直接進(jìn)入聲道。三、語(yǔ)音信號(hào)數(shù)字模型的組成等1、語(yǔ)音信號(hào)數(shù)字模型由鼓勵(lì)模型、聲道模型和輻射模型組成。2、聲道模型包括聲管模型和共振峰模型。3、共振峰模型又可分為級(jí)聯(lián)型、并聯(lián)型和混合型。四、語(yǔ)音信號(hào)數(shù)字模型的框圖:P212-18圖中,清/濁音開(kāi)關(guān)模擬了加在聲道上的鼓勵(lì)的轉(zhuǎn)變狀況:當(dāng)開(kāi)關(guān)接在濁音位臵時(shí),鼓勵(lì)源是準(zhǔn)周期脈沖序列發(fā)生器,其重復(fù)頻率由基音頻率來(lái)確定;當(dāng)開(kāi)關(guān)接在清音位臵時(shí),鼓勵(lì)源是隨機(jī)噪聲發(fā)生器?!?.5語(yǔ)音感知一、聲音的三要素:響度、音調(diào)和音色。任何聲音的都可以用聲強(qiáng)的三個(gè)物理量表示:幅度、頻率、相位。1、響度:響度是人耳對(duì)聲音強(qiáng)弱程度的主觀反響,響度取決于聲音的幅度,主要是聲壓的函數(shù),但和頻率和波形也有關(guān),單位是宋〔sone〕。人耳對(duì)3000-4000Hz的聲音感覺(jué)最靈敏。2、音調(diào):也稱音高,是一種主觀心理量,是人耳對(duì)聲音頻率凹凸的感受,即與聲音的頻率有關(guān)。音調(diào)與聲音頻率近似為對(duì)數(shù)關(guān)系,還與聲音的強(qiáng)度及波形有關(guān),單位是美〔mel〕。3、音色:也叫音質(zhì),反映了聲音屬性。每個(gè)聲音具有特別的音色,人依據(jù)音色在主觀感覺(jué)上區(qū)分具有一樣響度和音調(diào)的兩個(gè)聲音。二、人的聽(tīng)覺(jué)系統(tǒng)的特性〔具體見(jiàn)考題〕三、聽(tīng)覺(jué)掩蔽〔具體見(jiàn)考題〕:人類聽(tīng)覺(jué)中存在一種現(xiàn)象,即兩個(gè)音同時(shí)存在時(shí),一個(gè)聲音有可能受到另一個(gè)聲音的干擾或壓制,即一個(gè)音被另一音掩蓋,這稱為聽(tīng)覺(jué)掩蔽。兩個(gè)聲音音調(diào)越接近,掩蓋現(xiàn)象越嚴(yán)峻。聽(tīng)覺(jué)掩蔽現(xiàn)象在語(yǔ)音處理中得到了一些應(yīng)用,比方,在語(yǔ)音編碼中,利用聽(tīng)覺(jué)掩蔽效應(yīng)改善輸出語(yǔ)音質(zhì)量已經(jīng)取得了很大的效益。Ch3時(shí)域分析§3.1概述一、為什么時(shí)域分析要承受短時(shí)分析技術(shù)〔具體見(jiàn)考題〕1、短時(shí)分析技術(shù)的根本概念:語(yǔ)音信號(hào)是一種隨時(shí)間而變化的信號(hào),可能是濁音鼓勵(lì)也可能是清音鼓勵(lì),濁音的基音周期以及信號(hào)幅度等語(yǔ)音特性也都隨時(shí)間變化,但這種變化是緩慢的,在一小段短時(shí)間內(nèi)10-30ms,語(yǔ)音信號(hào)近似不變。于是,我們把變化的語(yǔ)音信號(hào)分成一些相繼的短時(shí)間段來(lái)處理。而每一段時(shí)間段具有固定的特性,這種方法稱為“短時(shí)”處理方法。2、語(yǔ)音信號(hào)特點(diǎn):〔1〕表示語(yǔ)音信號(hào)比較直觀、物理意義明確;實(shí)現(xiàn)起來(lái)比較簡(jiǎn)潔、運(yùn)算量少;〔3〕可以得到語(yǔ)音的一些重要參數(shù)。§3.2數(shù)字化和預(yù)處理一、取樣和量化〔具體見(jiàn)考題〕1、為了將原始的模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào),必需經(jīng)過(guò)取樣和量化兩個(gè)步驟。2、取樣是將時(shí)間上連續(xù)的語(yǔ)音信號(hào)離散化為一個(gè)樣本序列。滿足取樣定理,當(dāng)取樣頻率大于兩倍信號(hào)帶寬時(shí),取樣過(guò)程不會(huì)喪失信息,且從取樣信號(hào)中可以準(zhǔn)確地重構(gòu)原始信號(hào)的波形。3、量化是指將取樣后得到的樣本序列的幅度再離散化,量化過(guò)程是將整個(gè)幅度值分割為有限個(gè)區(qū)間,將落入同一區(qū)間的樣本賜予一樣的幅度值。分為均勻和非均勻量化。二、量化噪聲的概念及特點(diǎn)1、量化噪聲:量化后信號(hào)值與原信號(hào)之間的差值稱為量化誤差,即量化噪聲。2、量化信噪比的計(jì)算公式:SNR〔dB〕=6.02B-7.2三、語(yǔ)音信號(hào)系統(tǒng)框圖〔為什么要進(jìn)展預(yù)處理〕1、系統(tǒng)框圖:P263-42、反混疊濾波器的作用:它是一個(gè)具有良好截止特性的模擬低通濾波器,主要是為了防止混疊失真和噪聲干擾?!?.3短時(shí)能量分析一、語(yǔ)音信號(hào)的能量分析:語(yǔ)音信號(hào)的能量分析是基于語(yǔ)音信號(hào)能量隨時(shí)間有相當(dāng)大的變化,特別是清音段的能量一般比濁音段的小得多。能量分析包括能量和幅度兩個(gè)方面。二、直角窗和海明窗1、不同的窗口選擇將打算短時(shí)能量特性,即窗口的外形和長(zhǎng)度。2、直角窗和海明窗的比較從窗口外形上:海明窗的帶寬大約是同等寬度矩形窗帶寬的2倍。此外,海明窗在通帶外的衰減比矩形窗大得多,而且通帶與阻帶的起伏比較小。從窗口長(zhǎng)度上〔窗口選擇原則〕:N選擇太大,則短時(shí)能量E隨時(shí)間變化就很小,不能充分反映語(yǔ)音信號(hào)的幅度變化;而N選擇得小,即選擇N時(shí),E將依據(jù)信號(hào)波形的微小變化而起伏不定,以致短時(shí)能量E不夠勻化和平滑。因此,折衷考慮N的值,在通常狀況下,當(dāng)取樣頻率10KHzN=100-200三、短時(shí)平均能量反映了語(yǔ)音能量隨著時(shí)間緩慢變化的規(guī)律。它的主要用途有:1、可以區(qū)分清音段和濁音段,由于濁音時(shí)比清音時(shí)大得多;2、可以區(qū)分聲母與韻母的分界、無(wú)聲和有聲的分界、連字的分界等。3、作為一種超音段信息,用于語(yǔ)音識(shí)別中?!?.4短時(shí)過(guò)零分析一、過(guò)零分析、過(guò)零率和平均過(guò)零數(shù)的名詞解釋1、過(guò)零分析是語(yǔ)音時(shí)域分析中最簡(jiǎn)潔的一種,對(duì)于離散時(shí)間信號(hào)的相鄰兩個(gè)取樣值具有不同的符號(hào)時(shí),便消滅“過(guò)零”現(xiàn)象。單位時(shí)間過(guò)零的次數(shù)叫作“過(guò)零率”。2、平均過(guò)零數(shù)Z:?jiǎn)挝粫r(shí)間內(nèi)的過(guò)零數(shù)〔Z=2f0/fs過(guò)零/樣本〕。二、短時(shí)平均過(guò)零數(shù)的實(shí)現(xiàn)1、實(shí)現(xiàn)框圖:P323-122、文字描述:首先對(duì)語(yǔ)音信號(hào)序列x(n)進(jìn)展成對(duì)的查對(duì)采樣以確定是否發(fā)生過(guò)零,假設(shè)發(fā)生符號(hào)變化,則表示有一次過(guò)零;而后進(jìn)展一階差分計(jì)算,再求確定值,最終進(jìn)展低通濾波。三、短時(shí)過(guò)零分析的用途〔包含清音、濁音的各自特點(diǎn)〕1、短時(shí)平均過(guò)零數(shù)可以用來(lái)區(qū)分清音和濁音。發(fā)濁音時(shí),語(yǔ)音能3kHz以下。而發(fā)清音時(shí),多數(shù)能量集中在較高的頻譜上。濁音具有較低的平均過(guò)零數(shù),而清音時(shí)具有較高的平均過(guò)零數(shù)??梢?jiàn)P33的圖3-132、利用短時(shí)平均過(guò)零數(shù)還可以從背景噪聲中找出語(yǔ)音信號(hào),用于推斷安靜無(wú)語(yǔ)音和有語(yǔ)音的起點(diǎn)和終點(diǎn)位臵。3-14由圖可見(jiàn),這三句話的平均過(guò)零數(shù)變換都很大,高平均過(guò)零數(shù)對(duì)應(yīng)于清音,低平均過(guò)零數(shù)對(duì)應(yīng)于濁音;但是清音和濁音的變化格外明顯。因而,短時(shí)平均過(guò)零數(shù)可用于清音和濁音的大分類上。§3.5短時(shí)相關(guān)分析一、短時(shí)自相關(guān)分析得到語(yǔ)音信號(hào)有何特點(diǎn)和用途1、對(duì)于濁音語(yǔ)音來(lái)說(shuō),短時(shí)自相關(guān)函數(shù)具有明顯的峰值且呈周期分布,而對(duì)于清音來(lái)說(shuō),則沒(méi)有很強(qiáng)的自相關(guān)周期峰,其性質(zhì)類似于噪聲的高頻波形。2、短時(shí)自相關(guān)函數(shù)是語(yǔ)音信號(hào)時(shí)域分析的重要參量。它有兩個(gè)用途,一是推斷清/濁音,并估量濁音的基音周期,由于周期函數(shù)的自相關(guān)還是周期函數(shù),周期不變;二是它的傅里葉變換是短時(shí)譜,可用于計(jì)算語(yǔ)音信號(hào)的頻譜特性。3、短時(shí)自相關(guān)函數(shù)的框圖〔P35圖3-17〕4、短時(shí)平均幅度差函數(shù):利用差值來(lái)簡(jiǎn)化計(jì)算自相關(guān)函數(shù)。用途:推斷清/濁音,并估量濁音的基音周期。常見(jiàn)的幾種語(yǔ)音信號(hào)短時(shí)分析法:短時(shí)能量、短時(shí)平均過(guò)零率和短時(shí)自相關(guān)函數(shù)。Ch4短時(shí)傅里葉分析§4.1概述一、傅里葉分析在信號(hào)分析與處理中的地位與作用在語(yǔ)音信號(hào)處理中,傅里葉表示在傳統(tǒng)上始終起主要作用。其緣由一方面在于穩(wěn)態(tài)語(yǔ)音的產(chǎn)生模型由線性系統(tǒng)組成,此系統(tǒng)被一隨時(shí)間作周期變化或隨機(jī)變化的源所鼓勵(lì),因而系統(tǒng)輸出頻譜反映了鼓勵(lì)與聲道頻率響應(yīng)特性。另一方面,語(yǔ)音信號(hào)的頻譜具有格外明顯的語(yǔ)言聲學(xué)意義,可以獲得某些重要的語(yǔ)音特征。同時(shí),語(yǔ)音的感知過(guò)程與人類聽(tīng)覺(jué)系統(tǒng)具有頻譜分析功能是親熱相關(guān)的。二、短時(shí)傅里葉分析的重要性。短時(shí)傅里葉分析是分析緩慢時(shí)變頻譜的一種簡(jiǎn)便方法,是用穩(wěn)態(tài)分析方法處理非穩(wěn)態(tài)信號(hào)的一種方法,在語(yǔ)音處理中是一個(gè)格外重要的工具?!?.2短時(shí)傅里葉變換一、短時(shí)傅里葉變換的定義語(yǔ)音信號(hào)可以認(rèn)為是局部平穩(wěn)的,所以可以對(duì)某一幀語(yǔ)音進(jìn)展傅里葉變換,即短時(shí)傅里葉變換,定義為:∑∞-∞=--=mnjjemnmxeXωωω)(n2kNπω=,22kkmjjNNnnmXeXkxmnmeππω∞-=-∞==-∑01kN≤≤-二、短時(shí)傅里葉變換的兩種解釋一是標(biāo)準(zhǔn)傅里葉變換的解釋,二是濾波器的解釋。三、標(biāo)準(zhǔn)傅里葉變換解釋1、與序列的傅里葉變換一樣,短時(shí)傅里葉變換隨著ω作周期變2π。2、窗口序列具有的特性:頻率區(qū)分率高,即主瓣狹窄、鋒利;通過(guò)卷積,在其他頻率成分產(chǎn)生的頻譜泄漏少,即旁瓣衰減大。3、海明窗與直角窗的頻率特性〔具體見(jiàn)考題答案〕它們?cè)诨糁C波、共振峰構(gòu)造以及頻譜具有相像性,但其頻譜間也具有差異?!?〕是基音諧波鋒利度增加,這是由于矩形窗頻率區(qū)分率較高;〔2〕矩形窗較高的旁瓣產(chǎn)生了一個(gè)類似于噪聲的頻譜。因此,在語(yǔ)音頻譜分析中極少承受矩形窗。4、窗口寬度與短時(shí)傅里葉變換特性之間的關(guān)系,即用窄窗可得到好的時(shí)間區(qū)分率,用寬窗可得到好的頻率區(qū)分率。四、濾波器的解釋1、第一種形式的濾波器為低通濾波器;其次種形式的濾波器為帶4-5§4.3短時(shí)傅里葉變換的取樣率一、時(shí)間取樣率、頻域取樣率和總?cè)勇实南嚓P(guān)概念1、時(shí)間取樣率2B=2fs/N直角窗2B=4fs/N海明窗2、頻域取樣率為使恢復(fù)的時(shí)域信號(hào)不產(chǎn)生混疊失真,需滿足條件L≥N〔取樣頻L≥N〕。3SR〔Hz〕SR=時(shí)域取樣率*頻域取樣率=2B*L=2BLSR=2fsL/NSR=4fsL/N海明窗§4.4語(yǔ)音信號(hào)的短時(shí)綜合一、語(yǔ)音的短時(shí)綜合兩種經(jīng)典的方法是:濾波器組求和法和快速傅里葉變換求和法?!?.5語(yǔ)譜圖〔大綱沒(méi)要求,但2023年考題有,所以請(qǐng)參照答案記概念〕Ch5同態(tài)濾波〔同態(tài)信號(hào)處理〕及倒譜分析§5.1概述一、依據(jù)語(yǔ)音信號(hào)的產(chǎn)生模型,可以將其用一個(gè)線性非時(shí)變系統(tǒng)的輸出表示,即看做是聲門鼓勵(lì)信號(hào)和聲道沖激響應(yīng)的卷積。二、為了分別加性組合信號(hào),常承受線性濾波方法;而為了分別非加性組合信號(hào),常承受同態(tài)濾波技術(shù)?!?.2同態(tài)信號(hào)處理的根本原理一、同態(tài)信號(hào)處理的概念同態(tài)信號(hào)處理就是將非線性問(wèn)題轉(zhuǎn)化為線性問(wèn)題來(lái)處理,按處理的信號(hào)可分為乘積同態(tài)處理和卷積同態(tài)處理。二、同態(tài)信號(hào)處理的實(shí)現(xiàn)框圖、根本原理〔要把握公式的推導(dǎo)〕任何同態(tài)系統(tǒng)都可以表示為三個(gè)同態(tài)系統(tǒng)的級(jí)聯(lián),框圖如圖 5-2所示。即同態(tài)系統(tǒng)可分解為兩個(gè)特征系統(tǒng)和一個(gè)線性系統(tǒng)。在同態(tài)系統(tǒng)的組成中第一個(gè)系統(tǒng)以假設(shè)干信號(hào)的卷積作為輸入,并將它變換成對(duì)應(yīng)輸出的相加性組合。其次個(gè)系統(tǒng)是一個(gè)一般的線性系統(tǒng),聽(tīng)從疊加定理。第三個(gè)系統(tǒng)是第一個(gè)系統(tǒng)的逆變換,即它將信號(hào)的相加性組合反變換為卷積組合。特征系統(tǒng)和逆特征系統(tǒng)如圖5-3所示。§5.3復(fù)倒譜和倒譜一、復(fù)倒譜和倒譜的概念復(fù)倒譜:信號(hào)經(jīng)過(guò)同態(tài)濾波的特征系統(tǒng)環(huán)節(jié)后,xn∧仍舊是一個(gè)時(shí)域序列,我們稱xn∧是xn的復(fù)倒譜域,簡(jiǎn)稱為復(fù)倒譜〔具體名詞解釋見(jiàn)考題答案〕1cn2cn1xn2xn倒12xnxnxn=*xn的倒譜為12cncncn=+。§5.4兩個(gè)卷積重量復(fù)倒譜的性質(zhì)一、一個(gè)周期沖激的有限長(zhǎng)度序列,其復(fù)倒譜也是一個(gè)周期沖激序列,并且長(zhǎng)度Np不變,只是序列變?yōu)闊o(wú)限長(zhǎng)度序列。同時(shí)其振幅隨K值的增大而衰減。二、聲道沖激響應(yīng)序列復(fù)倒譜的性質(zhì)1、xn∧是雙邊序列,存在于-≦<n<≦。<p=““>2、xn∧是衰減序列。3、xn∧隨|n|1/|n|快。4、假設(shè)x(nz平面單位圓內(nèi),此時(shí)xn∧只在n≥0xn∧是因果序列。最小相位信號(hào)序列的復(fù)倒譜是因果序列。5、假設(shè)x(nz平面單位圓外,此時(shí)xn∧只在n≤0時(shí)有值,為左邊序列。最大相位信號(hào)序列的復(fù)倒譜是左邊序列。三、聲道沖激響應(yīng)序列的全零點(diǎn)模型描述§5.5避開(kāi)相位卷繞的算法一、避開(kāi)相位卷繞求復(fù)倒譜的方法包括:微分法、最小相位信號(hào)法、遞推法。二、相位卷繞:在復(fù)倒譜分析中,Z變換后得到的是復(fù)數(shù),所以取對(duì)數(shù)時(shí)進(jìn)展的是復(fù)對(duì)數(shù)運(yùn)算。這時(shí)存在相位的多值性問(wèn)題,使得后面求復(fù)倒譜以及恢復(fù)語(yǔ)音等運(yùn)算均存在不確定性而產(chǎn)生錯(cuò)誤。三、微分法和最小相位法求復(fù)倒譜框圖。Ch6線性推測(cè)分析§6.1概述一、線性推測(cè)分析的根本概念線性推測(cè)分析的根本概念是,一個(gè)語(yǔ)音的抽樣能夠用過(guò)去假設(shè)干個(gè)語(yǔ)音抽樣的線性組合來(lái)靠近。通過(guò)使實(shí)際語(yǔ)音抽樣和線性推測(cè)抽樣之間差值的平方和〔在一個(gè)有限間隔上〕到達(dá)最小值,即進(jìn)展最小均方誤差的靠近,能夠打算唯一的一組推測(cè)系數(shù),即線性組合的加權(quán)系數(shù)?!?.2線性推測(cè)分析的根本原理一、線性推測(cè)模型承受全極點(diǎn)模型的緣由〔具體見(jiàn)答案〕全極點(diǎn)模型最易于計(jì)算,對(duì)全極點(diǎn)模型作參數(shù)估量是對(duì)線性方程組的求解過(guò)程;有時(shí)無(wú)法知道輸入序列;人的聽(tīng)覺(jué)對(duì)于那種只能用零點(diǎn)來(lái)表示的頻譜陡峭谷點(diǎn)是遲鈍的;假設(shè)不考慮鼻音和摩擦音,那么語(yǔ)音的聲道傳遞函數(shù)就是一個(gè)全極點(diǎn)模型。二、全極點(diǎn)模型——非鼻音濁音語(yǔ)音極零點(diǎn)模型——鼻音和摩擦音三、1、對(duì)于濁音信號(hào)譜在諧波成分處的匹配效果要遠(yuǎn)比諧波之間好得多。2、LPC譜對(duì)其他譜的優(yōu)點(diǎn)是可以很好地表示共振峰構(gòu)造而不消滅額外的峰起和起伏?!?.4線性推測(cè)分析的解法〔1〕一、線性推測(cè)的經(jīng)典解法有兩種,一種是自相關(guān)法,一種是協(xié)方差法,另外還有格型法?!矁?yōu)缺點(diǎn)比較,具體看書〕§6.6線性推測(cè)分析應(yīng)用——LPC譜估量和LPC復(fù)倒譜一、線性推測(cè)分析〔LPC〕P首先要保證有足夠的極點(diǎn)來(lái)模擬聲道響應(yīng)的諧振構(gòu)造,但P值到達(dá)12-14二、線性推測(cè)分析中,幀長(zhǎng)度N線性推測(cè)分析中,分析幀長(zhǎng)度N同樣重要,N盡可能小有好處,在LPC線性方程組求解中,計(jì)算量都與N成正比。但譜估量的精度隨N的增加而提高。通常取N2-3三、復(fù)倒譜分析的優(yōu)點(diǎn):運(yùn)算量小,可用于實(shí)時(shí)語(yǔ)音識(shí)別。Ch7VQ§7.1概述一、量化可以分為兩類:標(biāo)量量化和矢量量化。VQ矢量量化是將假設(shè)干個(gè)取樣信號(hào)分成一組,即構(gòu)成一個(gè)矢量,然后對(duì)此矢量一次進(jìn)展量化,即作為一個(gè)整體進(jìn)展量化,既能有效降低數(shù)碼率,又能保證語(yǔ)音質(zhì)量。三、矢量量化的理論依據(jù)與優(yōu)越性〔大綱〕依據(jù)仙農(nóng)信息論可以得出,矢量量化總是優(yōu)于標(biāo)量量化,且矢量維數(shù)越大性能越優(yōu)越。由于矢量量化有效利用了矢量中各重量間的各種相互關(guān)聯(lián)的性質(zhì)。承受矢量量化技術(shù)對(duì)信號(hào)波形數(shù)據(jù)進(jìn)展壓縮,可以獲得格外高的壓縮比?!?.2矢量量化的根本原理一、矢量量化的過(guò)程〔VQ的根本原理〕將語(yǔ)音信號(hào)波形的K個(gè)樣點(diǎn)的每一幀,或有K個(gè)參數(shù)的每一幀參數(shù),構(gòu)成K§7.3失真測(cè)度一、失真測(cè)度必需具備的幾個(gè)特性必需在主觀評(píng)價(jià)上有意義,即小的失真應(yīng)當(dāng)對(duì)應(yīng)于好的主觀語(yǔ)音質(zhì)量;必需是易于處理的,即在數(shù)學(xué)上易于實(shí)現(xiàn);平均失真存在且可計(jì)算;易于硬件實(shí)現(xiàn)。二、歐氏距離-均方誤差的概念〔P96公式7-1〕§7.4最正確矢量量化器和碼本的設(shè)計(jì)一、矢量量化器最正確設(shè)計(jì)的兩個(gè)條件是:最正確劃分和最正確碼書。二、幾種初始碼書的生成方法包括:隨機(jī)選取法、分裂法、乘積碼書法?!?.5降低簡(jiǎn)單度的矢量量化系統(tǒng)一、矢量量化器的爭(zhēng)論主要是圍圍著降低速率、削減失真和降低簡(jiǎn)單度開(kāi)放的。速率、失真和簡(jiǎn)單度是矢量量化器的三個(gè)關(guān)鍵問(wèn)題。二、矢量量化系統(tǒng)主要由編碼器和譯碼器組成。三、降低簡(jiǎn)單度的設(shè)計(jì)方法包括兩類:無(wú)記憶的矢量量化器和有記憶的矢量量化器。四、無(wú)記憶的矢量量化器和有記憶的矢量量化器的概念及區(qū)分無(wú)記憶的矢量量化器是指量化每一個(gè)矢量時(shí)都不依靠于此矢量前面的其他矢量,即每一個(gè)矢量都是獨(dú)立量化的。有記憶的矢量量化器與無(wú)記憶的矢量量化器不同,它是量化每一個(gè)輸入矢量時(shí),不僅與此矢量本身有關(guān),而且也與其前面的矢量有關(guān)。五、無(wú)記憶的矢量量化系統(tǒng)包括樹(shù)形搜尋的矢量量化系統(tǒng)和多級(jí)矢量量化系統(tǒng)。有記憶的矢量量化分為反響矢量量化和自適應(yīng)矢量量化兩類。Ch9§9.1基音檢測(cè)一、基音檢測(cè)的重要性和難點(diǎn)基音的提取和估量是語(yǔ)音信號(hào)處理中格外重要的一個(gè)問(wèn)題,準(zhǔn)確地檢測(cè)語(yǔ)音信號(hào)的基音周期對(duì)于高質(zhì)量的語(yǔ)音分析與合成、語(yǔ)音壓縮編碼、語(yǔ)音識(shí)別和說(shuō)話人確認(rèn)等具有重要意義。在低速率語(yǔ)音編碼中,準(zhǔn)確的基音檢測(cè)是格外關(guān)鍵的,它直接影響到整個(gè)系統(tǒng)的性能。二、基音檢測(cè)的三個(gè)爭(zhēng)論方面1、穩(wěn)定并提取準(zhǔn)周期性信號(hào)的周期性方法;2、因周期混亂,實(shí)行基音提取誤差補(bǔ)償?shù)姆椒ǎ?、消退聲道影響的方法。三、基音檢測(cè)的三種方法:波形估量法、相關(guān)處理法和變換法。1、波形估量法包括:并行處理法、數(shù)據(jù)削減法、過(guò)零數(shù)法;2、相關(guān)處理法包括:自相關(guān)法、SIFTAMDF法;3、變換法:倒譜法、循環(huán)直方圖。四、清/濁音推斷的關(guān)心參量1、語(yǔ)音信號(hào)能量2、過(guò)零數(shù)3、自相關(guān)函數(shù)4、線性推測(cè)系數(shù)五、常用的幾種基音檢測(cè)方法包括:自相關(guān)法、并行處理法、倒譜法、簡(jiǎn)化逆濾波法。六、中心削波法的根本原理,三電平削波函數(shù)特性〔P119-120〕七、利用倒譜法提取基音的根本原理和實(shí)現(xiàn)方法〔P123〕八、利用簡(jiǎn)化逆濾波器法進(jìn)展基音檢測(cè)的根本原理和方法〔P125〕§9.2共振峰估值一、共振峰估量中存在的問(wèn)題1、虛假峰值2、共振峰合并3、高基音語(yǔ)音二、幾種常用的提取共振峰特性的方法1、帶通濾波器組法2、離散傅立葉變換3、倒譜法4、LPC法三、濁音和清音時(shí)DFT譜特性比較1、濁音時(shí)DFT得到的頻譜受基頻諧波的影響,最大值只能消滅在諧波頻率上,因此共振峰測(cè)定誤差較大。2、清音時(shí)此時(shí)信號(hào)具有隨機(jī)噪聲的特點(diǎn),其頻譜不具有離散諧波特性,但其包絡(luò)根本上反映了聲道的特性。對(duì)其頻譜進(jìn)展線性平滑而得到譜包絡(luò),并用一個(gè)峰值搜尋算法來(lái)確定峰值。四、濁音和清音時(shí)倒譜法檢測(cè)效果比照1、濁音時(shí),假設(shè)頻譜包絡(luò)的變換和基音峰值的變換在倒譜域中的間隔足夠大,則前者簡(jiǎn)潔識(shí)別。2、清音時(shí),聲門鼓勵(lì)序列具有噪聲特性,其倒譜沒(méi)有明顯峰值,且倒譜分布于從低倒譜域到高倒譜域的很寬的范圍之內(nèi),因而在低倒譜域?qū)β暤理憫?yīng)的信息產(chǎn)生了影響。五、倒譜法難以解

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論