畢業(yè)論文基于Matlab的語音信號(hào)處理_第1頁
畢業(yè)論文基于Matlab的語音信號(hào)處理_第2頁
畢業(yè)論文基于Matlab的語音信號(hào)處理_第3頁
畢業(yè)論文基于Matlab的語音信號(hào)處理_第4頁
畢業(yè)論文基于Matlab的語音信號(hào)處理_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、畢 業(yè) 論 文語音信號(hào)分析與處理系統(tǒng)設(shè)計(jì) 學(xué)生姓名 學(xué) 號(hào) 200602305104 指導(dǎo)教師 王敏 系(中心) 信息工程系 專 業(yè) 電子信息工程 年 級(jí) 2006級(jí) 論文答辯日期 2010 年 5 月 20 日 中 國(guó) 海 洋 大 學(xué) 青 島 學(xué) 院語音信號(hào)分析與處理系統(tǒng)設(shè)計(jì) 完成日期: 指導(dǎo)教師簽字: 答辯小組成員簽字: 語音信號(hào)分析與處理系統(tǒng)設(shè)計(jì)摘要語音信號(hào)處理是研究用數(shù)字信號(hào)處理技術(shù)和語音學(xué)知識(shí)對(duì)語音信號(hào)進(jìn)行處理的新興的學(xué)科,是目前發(fā)展最為迅速的信息科學(xué)研究領(lǐng)域的核心技術(shù)之一。通過語音傳遞信息是人類最重要、最有效、最常用和最方便的交換信息形式。matlab語言是一種數(shù)據(jù)分析和處理功能十

2、分強(qiáng)大的計(jì)算機(jī)應(yīng)用軟件,它可以將聲音文件變換為離散的數(shù)據(jù)文件,然后利用其強(qiáng)大的矩陣運(yùn)算能力處理數(shù)據(jù),如數(shù)字濾波、傅里葉變換、時(shí)域和頻域分析、聲音回放以及各種圖的呈現(xiàn)等,它的信號(hào)處理與分析工具箱為語音信號(hào)分析提供了十分豐富的功能函數(shù),利用這些功能函數(shù)可以快捷而又方便地完成語音信號(hào)的處理和分析以及信號(hào)的可視化,使人機(jī)交互更加便捷。信號(hào)處理是matlab重要應(yīng)用的領(lǐng)域之一。本設(shè)計(jì)針對(duì)現(xiàn)在大部分語音處理軟件內(nèi)容繁多、操作不便等問題,采用matlab7.0綜合運(yùn)用gui界面設(shè)計(jì)、各種函數(shù)調(diào)用等來實(shí)現(xiàn)語音信號(hào)的變頻、變幅、傅里葉變換及濾波,程序界面簡(jiǎn)練,操作簡(jiǎn)便,具有一定的實(shí)際應(yīng)用意義。最后,本文對(duì)語音信

3、號(hào)處理的進(jìn)一步發(fā)展方向提出了自己的看法。關(guān)鍵字:matlab;語音信號(hào);傅里葉變換;信號(hào)處理;the design of analysis and processing voice signalabstractspeech signal processing is to study the use of digital signal processing technology and knowledge of the voice signal voice processing of the emerging discipline is the fastest growing areas of

4、information science one of the core technology. transmission of information through the voice of humanitys most important, most effective, most popular and most convenient form of exchange of information.matlab language is a data analysis and processing functions are very powerful computer applicati

5、on software, sound files which can be transformed into discrete data files, then use its powerful ability to process the data matrix operations, such as digital filtering, fourier transform, when domain and frequency domain analysis, sound playback and a variety of map rendering, and so on. its sign

6、al processing and analysis toolkit for voice signal analysis provides a very rich feature function, use of these functions can be quick and convenient features complete voice signal processing and analysis and visualization of signals, makes computer interaction more convenient . matlab signal proce

7、ssing is one of the important areas of application.the design of voice-processing software for most of the content are numerous, easy to maneuver and so on, using matlab7.0 comprehensive use gui interface design, various function calls to voice signals such as frequency, amplitude, fourier transform

8、 and filtering, the program interface concise, simple, has some significance in practice.finally, the speech signal processing further development put forward their own views.keywords: matlab, voice signal,fourier transform,signal processing目 錄1 緒論11.1課題背景及意義11.2國(guó)內(nèi)外研究現(xiàn)狀11. 3本課題的研究?jī)?nèi)容和方法21.3.1 研究?jī)?nèi)容21.

9、3.2 運(yùn)行環(huán)境21.3.3 開發(fā)環(huán)境22 語音信號(hào)處理的總體方案32.1 系統(tǒng)基本概述32.2 系統(tǒng)基本要求32.3 系統(tǒng)框架及實(shí)現(xiàn)32.4系統(tǒng)初步流程圖43 語音信號(hào)處理基本知識(shí)63.1語音的錄入與打開63.2采樣位數(shù)和采樣頻率63.3時(shí)域信號(hào)的fft分析63.4數(shù)字濾波器設(shè)計(jì)原理73.5倒譜的概念74 語音信號(hào)處理實(shí)例分析84.1圖形用戶界面設(shè)計(jì)84.2信號(hào)的采集84.3語音信號(hào)的處理設(shè)計(jì)84.3.1 語音信號(hào)的提取84.3.2 語音信號(hào)的調(diào)整104.3.2.1 語音信號(hào)的頻率調(diào)整104.3.2.2語音信號(hào)的振幅調(diào)整114.3.3 語音信號(hào)的傅里葉變換124.3.4 語音信號(hào)的濾波134

10、.3.4.1 語音信號(hào)的低通濾波134.3.4.2 語音信號(hào)的高通濾波154.3.4.3 語音信號(hào)的帶通濾波154.3.4.4 語音信號(hào)的帶阻濾波164.4 語音信號(hào)的輸出175 總結(jié)18參考文獻(xiàn)19致 謝201 緒論語音是語言的聲學(xué)表現(xiàn),是人類交流信息最自然、最有效、最方便的手段。隨著社會(huì)文化的進(jìn)步和科學(xué)技術(shù)的發(fā)展,人類開始進(jìn)入了信息化時(shí)代,用現(xiàn)代手段研究語音處理技術(shù),使人們能更加有效地產(chǎn)生、傳輸、存儲(chǔ)、和獲取語音信息,這對(duì)于促進(jìn)社會(huì)的發(fā)展具有十分重要的意義,因此,語音信號(hào)處理正越來越受到人們的關(guān)注和廣泛的研究。1.1課題背景及意義語音信號(hào)處理是一門比較實(shí)用的電子工程的專業(yè)課程,語音是人類獲

11、取信息的重要來源和利用信息的重要手段。通過語言相互傳遞信息是人類最重要的基本功能之一。語言是人類特有的功能,它是創(chuàng)造和記載幾千年人類文明史的根本手段,沒有語言就沒有今天的人類文明。語音是語言的聲學(xué)表現(xiàn),是相互傳遞信息的最重要的手段,是人類最重要、最有效、最常用和最方便的交換信息的形式。語音信號(hào)處理是研究用數(shù)字信號(hào)處理技術(shù)對(duì)語音信號(hào)進(jìn)行處理的一門學(xué)科,它是一門新興的學(xué)科,同時(shí)又是綜合性的多學(xué)科領(lǐng)域和涉及面很廣的交叉學(xué)科。1.2國(guó)內(nèi)外研究現(xiàn)狀20世紀(jì)60年代中期形成的一系列數(shù)字信號(hào)處理的理論和算法,如數(shù)字濾波器、快速傅立葉變換(fft)等是語音信號(hào)數(shù)字處理的理論和技術(shù)基礎(chǔ)。隨著信息科學(xué)技術(shù)的飛速發(fā)

12、展,語音信號(hào)處理取得了重大的進(jìn)展:進(jìn)入70年代之后,提出了用于語音信號(hào)的信息壓縮和特征提取的線性預(yù)測(cè)技術(shù)(lpc),并已成為語音信號(hào)處理最強(qiáng)有力的工具,廣泛應(yīng)用于語音信號(hào)的分析、合成及各個(gè)應(yīng)用領(lǐng)域,以及用于輸入語音與參考樣本之間時(shí)間匹配的動(dòng)態(tài)規(guī)劃方法;80年代初一種新的基于聚類分析的高效數(shù)據(jù)壓縮技術(shù)矢量量化(vq)應(yīng)用于語音信號(hào)處理中;而用隱馬爾可夫模型(hmm)描述語音信號(hào)過程的產(chǎn)生是80年代語音信號(hào)處理技術(shù)的重大發(fā)展,目前hmm已構(gòu)成了現(xiàn)代語音識(shí)別研究的重要基石。近年來人工神經(jīng)網(wǎng)絡(luò)(ann)的研究取得了迅速發(fā)展,語音信號(hào)處理的各項(xiàng)課題是促進(jìn)其發(fā)展的重要?jiǎng)恿χ唬瑫r(shí),它的許多成果也體現(xiàn)在有

13、關(guān)語音信號(hào)處理的各項(xiàng)技術(shù)之中。1.3本課題的研究?jī)?nèi)容和方法1.3.1 研究?jī)?nèi)容本論文主要介紹的是的語音信號(hào)的簡(jiǎn)單處理。本論文針對(duì)以上問題,運(yùn)用數(shù)字信號(hào)學(xué)基本原理實(shí)現(xiàn)語音信號(hào)的處理,在matlab7.0環(huán)境下綜合運(yùn)用信號(hào)提取,幅頻變換以及傅里葉變換、濾波等技術(shù)來進(jìn)行語音信號(hào)處理。我所做的工作就是在matlab7.0軟件上編寫一個(gè)處理語音信號(hào)的程序,能對(duì)語音信號(hào)進(jìn)行采集,并對(duì)其進(jìn)行各種處理,達(dá)到簡(jiǎn)單的語音信號(hào)處理的目的。1.3.2 運(yùn)行環(huán)境運(yùn)行環(huán)境主要介紹了硬件環(huán)境和軟件環(huán)境。硬件環(huán)境: 處理器:inter pentium 166 mx 或更高 內(nèi)存:512mb或更高 硬盤空間:40gb或更高 顯

14、卡:svga顯示適配器軟件環(huán)境:操作系統(tǒng):window 98/me/2000/xp1.3.3 開發(fā)環(huán)境 開發(fā)環(huán)境主要介紹了本系統(tǒng)采用的操作系統(tǒng)、開發(fā)語言。(1) 操作系統(tǒng):windows xp(2) 開發(fā)環(huán)境:matlab 7.02 語音信號(hào)處理的總體方案2.1 系統(tǒng)基本概述圖形用戶界面(graphical user interface,簡(jiǎn)稱 gui,又稱圖形用戶接口)是指采用圖形方式顯示的計(jì)算機(jī)操作用戶界面。與早期計(jì)算機(jī)使用的命令行界面相比,圖形界面對(duì)于用戶來說在視覺上更易于接受。gui的廣泛應(yīng)用是當(dāng)今計(jì)算機(jī)發(fā)展的重大成就之一,他極大地方便了非專業(yè)用戶的使用人們從此不再需要死記硬背大量的命令

15、,取而代之的是可以通過窗口、菜單、按鍵等方式來方便地進(jìn)行操作。2.2 系統(tǒng)基本要求本文是用matlab對(duì)含噪的的語音信號(hào)同時(shí)在時(shí)域和頻域進(jìn)行濾波處理和分析,在matlab應(yīng)用軟件下設(shè)計(jì)一個(gè)簡(jiǎn)單易用的圖形用戶界面(gui),來解決一般應(yīng)用條件下的各種語音信號(hào)的處理。2.3 系統(tǒng)框架及實(shí)現(xiàn)1) 語音信號(hào)的采集 使用電腦的聲卡設(shè)備采集一段語音信號(hào),并將其保存在電腦中。2) 語音信號(hào)的處理語音信號(hào)的處理主要包括信號(hào)的提取、信號(hào)的調(diào)整、信號(hào)的變換和濾波等。.語音信號(hào)的時(shí)域分析語音信號(hào)是一種非平穩(wěn)的時(shí)變信號(hào),它攜帶著各種信息。在語音編碼、語音合成、語音識(shí)別和語音增強(qiáng)等語音處理中無一例外需要提取語音中包含的

16、各種信息。語音信號(hào)分析的目的就在與方便有效的提取并表示語音信號(hào)所攜帶的信息。語音信號(hào)分析可以分為時(shí)域和變換域等處理方法,其中時(shí)域分析是最簡(jiǎn)單的方法,直接對(duì)語音信號(hào)的時(shí)域波形進(jìn)行分析,提取的特征參數(shù)主要有語音的短時(shí)能量,短時(shí)平均過零率,短時(shí)自相關(guān)函數(shù)等。 提?。和ㄟ^圖形用戶界面上的菜單功能按鍵采集電腦設(shè)備上的一段音頻信號(hào),完成音頻信號(hào)的頻率,幅度等信息的提取,并得到該語音信號(hào)的波形圖。 調(diào)整:在設(shè)計(jì)的用戶圖形界面下對(duì)輸入的音頻信號(hào)進(jìn)行各種變化,如變化幅度、改變頻率等操作,以實(shí)現(xiàn)對(duì)語音信號(hào)的調(diào)整。.語音信號(hào)的頻域分析信號(hào)的傅立葉表示在信號(hào)的分析與處理中起著重要的作用。因?yàn)閷?duì)于線性系統(tǒng)來說,可以很方

17、便地確定其對(duì)正弦或復(fù)指數(shù)和的響應(yīng),所以傅立葉分析方法能完善地解決許多信號(hào)分析和處理問題。另外,傅立葉表示使信號(hào)的某些特性變得更明顯,因此,它能更深入地說明信號(hào)的各項(xiàng)紅物理現(xiàn)象。由于語音信號(hào)是隨著時(shí)間變化的,通常認(rèn)為,語音是一個(gè)受準(zhǔn)周期脈沖或隨機(jī)噪聲源激勵(lì)的線性系統(tǒng)的輸出。輸出頻譜是聲道系統(tǒng)頻率響應(yīng)與激勵(lì)源頻譜的乘積。聲道系統(tǒng)的頻率響應(yīng)及激勵(lì)源都是隨時(shí)間變化的,因此一般標(biāo)準(zhǔn)的傅立葉表示雖然適用于周期及平穩(wěn)隨機(jī)信號(hào)的表示,但不能直接用于語音信號(hào)。由于語音信號(hào)可以認(rèn)為在短時(shí)間內(nèi),近似不變,因而可以采用短時(shí)分析法。 變換:在用戶圖形界面下對(duì)采集的語音信號(hào)進(jìn)行fourier等變換,并畫出變換前后的頻譜圖

18、和變換后的倒譜圖。 濾波:濾除語音信號(hào)中的噪音部分,可采用低通濾波、高通濾波、帶通濾波和帯阻濾波,并比較各種濾波后的效果。3)語音信號(hào)的效果顯示 通過用戶圖形界面的輸出功能,將處理后的信號(hào)的語音進(jìn)行播放,試聽處理后的效果。2.4系統(tǒng)初步流程圖圖2.1列出了整個(gè)語音信號(hào)處理系統(tǒng)的工作流程:信號(hào)采集信息提取信號(hào)調(diào)整信號(hào)濾波信號(hào)變換效果顯示圖2.1 語音信號(hào)處理系統(tǒng)的工作流程其中信號(hào)調(diào)整包括信號(hào)的幅度和頻率的任意倍數(shù)變化。如下圖2.2圖2.2 信號(hào)調(diào)整信號(hào)調(diào)整幅度調(diào)整頻率調(diào)整信號(hào)的濾波采用了四種濾波方式,來觀察各種濾波性能的優(yōu)缺點(diǎn):信號(hào)濾波切比雪夫i型低通濾波橢圓數(shù)字帶通濾波切比雪夫型帶阻濾波切比雪

19、夫型高通濾波圖2.3 語音信號(hào)濾波的方式在以上三圖中,可以看到整個(gè)語音信號(hào)處理系統(tǒng)的流程大概分為三步,首先要讀入待處理的語音信號(hào),然后進(jìn)行語音信號(hào)的處理,包括信息的提取、幅度和頻率的變換以及語音信號(hào)的傅里葉變換、濾波等;濾波又包括低通濾波、高通濾波、帶通濾波和帶阻濾波等方式。最后對(duì)處理過的語音信號(hào)進(jìn)行處理后的效果顯示。以上是本系統(tǒng)的工作流程,本文將從語音信號(hào)的采集開始做詳細(xì)介紹。3 語音信號(hào)處理基本知識(shí)3.1語音的錄入與打開在matlab中,y,fs,bits=wavread(blip,n1 n2);用于讀取語音,采樣值放在向量y中,fs表示采樣頻率(hz),bits表示采樣位數(shù)。n1 n2表

20、示讀取從n1點(diǎn)到n2點(diǎn)的值(若只有一個(gè)n的點(diǎn)則表示讀取前n點(diǎn)的采樣值)。 sound(x,fs,bits); 用于對(duì)聲音的回放。向量y則就代表了一個(gè)信號(hào)(也即一個(gè)復(fù)雜的“函數(shù)表達(dá)式”)也就是說可以像處理一個(gè)信號(hào)表達(dá)式一樣處理這個(gè)聲音信號(hào)。3.2采樣位數(shù)和采樣頻率采樣位數(shù)即采樣值或取樣值,用來衡量聲音波動(dòng)變化的參數(shù),是指聲卡在采集和播放聲音文件時(shí)所使用數(shù)字聲音信號(hào)的二進(jìn)制位數(shù)。采樣頻率是指錄音設(shè)備在一秒鐘內(nèi)對(duì)聲音信號(hào)的采樣次數(shù),采樣頻率越高聲音的還原就越真實(shí)越自然。采樣位數(shù)和采樣率對(duì)于音頻接口來說是最為重要的兩個(gè)指標(biāo),也是選擇音頻接口的兩個(gè)重要標(biāo)準(zhǔn)。無論采樣頻率如何,理論上來說采樣的位數(shù)決定了音

21、頻數(shù)據(jù)最大的力度范圍。每增加一個(gè)采樣位數(shù)相當(dāng)于力度范圍增加了6db。采樣位數(shù)越多則捕捉到的信號(hào)越精確。對(duì)于采樣率來說你可以想象它類似于一個(gè)照相機(jī),44.1khz意味著音頻流進(jìn)入計(jì)算機(jī)時(shí)計(jì)算機(jī)每秒會(huì)對(duì)其拍照達(dá)441000次。顯然采樣率越高,計(jì)算機(jī)攝取的圖片越多,對(duì)于原始音頻的還原也越加精確。3.3時(shí)域信號(hào)的fft分析fft即為快速傅氏變換,是離散傅氏變換的快速算法,它是根據(jù)離散傅氏變換的奇、偶、虛、實(shí)等特性,對(duì)離散傅立葉變換的算法進(jìn)行改進(jìn)獲得的。在matlab的信號(hào)處理工具箱中函數(shù)fft和ifft用于快速傅立葉變換和逆變換。函數(shù)fft用于序列快速傅立葉變換,其調(diào)用格式為y=fft(x),其中,x

22、是序列,y是序列的fft,x可以為一向量或矩陣,若x為一向量,y是x的fft且和x相同長(zhǎng)度;若x為一矩陣,則y是對(duì)矩陣的每一列向量進(jìn)行fft。如果x長(zhǎng)度是2的冪次方,函數(shù)fft執(zhí)行高速基2fft算法,否則fft執(zhí)行一種混合基的離散傅立葉變換算法,計(jì)算速度較慢。函數(shù)fft的另一種調(diào)用格式為y=fft(x,n),式中,x,y意義同前,n為正整數(shù)。函數(shù)執(zhí)行n點(diǎn)的fft,若x為向量且長(zhǎng)度小于n,則函數(shù)將x補(bǔ)零至長(zhǎng)度n;若向量x的長(zhǎng)度大于n,則函數(shù)截短x使之長(zhǎng)度為n;若x 為矩陣,按相同方法對(duì)x進(jìn)行處理。3.4數(shù)字濾波器設(shè)計(jì)原理數(shù)字濾波器的作用是利用離散時(shí)間系統(tǒng)的特性對(duì)輸入信號(hào)波形(或頻譜)進(jìn)行加工處理

23、,或者說利用數(shù)字方法按預(yù)定的要求對(duì)信號(hào)進(jìn)行變換。數(shù)字濾波器可以理解為是一個(gè)計(jì)算程序或算法,將代表輸入信號(hào)的數(shù)字時(shí)間序列轉(zhuǎn)化為代表輸出信號(hào)的數(shù)字時(shí)間序列,并在轉(zhuǎn)化過程中,使信號(hào)按預(yù)定的形式變化。數(shù)字濾波器有多種分類,根據(jù)數(shù)字濾波器沖激響應(yīng)的時(shí)域特征,可將數(shù)字濾波器分為兩種,即無限長(zhǎng)沖激響應(yīng)(iir)濾波器和有限長(zhǎng)沖激響應(yīng)(fir)濾波器。從性能上來說,iir濾波器傳輸函數(shù)的極點(diǎn)可位于單位圓內(nèi)的任何地方,因此可用較低的階數(shù)獲得高的選擇性,所用的存貯單元少,所以經(jīng)濟(jì)而效率高。但是這個(gè)高效率是以相位的非線性為代價(jià)的。選擇性越好,則相位非線性越嚴(yán)重。相反,fir濾波器卻可以得到嚴(yán)格的線性相位,然而由于f

24、ir濾波器傳輸函數(shù)的極點(diǎn)固定在原點(diǎn),所以只能用較高的階數(shù)達(dá)到高的選擇性;對(duì)于同樣的濾波器設(shè)計(jì)指標(biāo),fir濾波器所要求的階數(shù)可以比iir濾波器高510倍,結(jié)果,成本較高,信號(hào)延時(shí)也較大;如果按相同的選擇性和相同的線性要求來說,則iir濾波器就必須加全通網(wǎng)絡(luò)進(jìn)行相位較正,同樣要大增加濾波器的節(jié)數(shù)和復(fù)雜性。整體來看,iir濾波器達(dá)到同樣效果階數(shù)少,延遲小,但是有穩(wěn)定性問題,非線性相位;fir濾波器沒有穩(wěn)定性問題,線性相位,但階數(shù)多,延遲大。3.5倒譜的概念l 定義:倒譜定義為信號(hào)短時(shí)振幅譜的對(duì)數(shù)傅里葉反變換。l 特點(diǎn):具有可近似地分離并能提取出頻譜包絡(luò)信息和細(xì)微結(jié)構(gòu)信息的特點(diǎn)l 用途: 提取聲道特征

25、信息:提取頻譜包絡(luò)特征,以此作為描述音韻的特征參 數(shù)而應(yīng)用于語音識(shí)別。 提取音源信息:提取基音特征,以此作為描述音韻特征的輔助參數(shù)而應(yīng)用于語音識(shí)別。 求法:a:短時(shí)信號(hào);b:短時(shí)頻譜;c:對(duì)數(shù)頻譜; d:倒譜系數(shù);e:對(duì)數(shù)頻譜包絡(luò); f:基本周期4 語音信號(hào)處理實(shí)例分析4.1圖形用戶界面設(shè)計(jì)在matlab主窗口中,選擇file菜單中的new菜單項(xiàng),再選擇其中的gui命令,就會(huì)顯示圖形用戶界面的設(shè)計(jì)模板。matlab為gui設(shè)計(jì)一共準(zhǔn)備了4種模板,分別是blank gui(默認(rèn)) 、gui with uicontrols(帶控件對(duì)象的gui模板) 、gui with axes and menu(

26、帶坐標(biāo)軸與菜單的gui模板)與modal question dialog(帶模式問話對(duì)話框的gui模板)。設(shè)計(jì)語音信號(hào)處理系統(tǒng)的用戶圖形操作界面(gui)soundprocess,其中菜單主要包括file、process和output三大主要部分,其中file菜單包括輸入(input)、保存(save)和退出(quit)等功能;process菜單主要包括提?。╡xtract)、調(diào)整(extract)、變換(transform)和濾波(filter)菜單,其中調(diào)整(extract)包括幅度調(diào)整(range)和頻率調(diào)整(frequency),濾波(filter)菜單包含低通濾波(lowpassfi

27、lter)、高通濾波(highpassfilter)、帶通濾波(bandpassfilter)和帯阻濾波(bandstopfilter)等功能菜單。4.2信號(hào)的采集該系統(tǒng)是以一段簡(jiǎn)短的的語音信號(hào)做為分析樣本,通過計(jì)算機(jī)系統(tǒng)將一段“主人,信息收到了”的語音信號(hào)保存到到計(jì)算機(jī)中,并且保存格式為“*.wav”。4.3語音信號(hào)的處理設(shè)計(jì)4.3.1 語音信號(hào)的提取在matlab中使用wavread函數(shù),可得出信號(hào)的采樣頻率為22500,并且聲音是單聲道的。利用sound函數(shù)可以清晰的聽到“主人,信息收到了”的語音。采集數(shù)據(jù)并畫出波形圖。其中聲音的采樣頻率fs=22050hz,y為采樣 數(shù)據(jù),nbits表

28、示量化階數(shù)。部分程序如下: fn=input( enter wav filename:,s); %獲取一個(gè)*.wav的文件x,fs,nb=wavread(fn);ms2=floor(fs*0.002);ms10=floor(fs*0.01);ms20=floor(fs*0.02);ms30=floor(fs*0.03);t=(0:length(x)-1)/fs; %計(jì)算樣本時(shí)刻 subplot(2,1,1); %確定顯示位置plot(t,x); %畫波形圖legend(waveform);xlabel( time(s);ylabel(amplitude); 運(yùn)行后彈出語音信號(hào)處理系統(tǒng)的操作界面

29、如圖4.1:圖4.1語音信號(hào)處理系統(tǒng)的操作界面然后點(diǎn)擊file菜單中的子菜單input,回到matlab軟件的輸入界面如圖4.2:圖4.2輸入界面輸入要處理的語音信號(hào)的名稱,便可得到語音語音的波形圖如圖4.3: 圖4.3語音語音的波形圖 如圖中提取的語音的波形圖所示,整段音頻數(shù)據(jù)中得聲音高低起伏與錄入的聲音信號(hào)基本一致,并且可以觀察到其中包含部分高頻噪聲。4.3.2 語音信號(hào)的調(diào)整在語音信號(hào)的研究中,經(jīng)常會(huì)對(duì)語音信號(hào)進(jìn)行進(jìn)行多倍頻率以及多倍幅度變換調(diào)整,日常應(yīng)用中,這種變換調(diào)整也經(jīng)常要用到。所以在設(shè)計(jì)中也添加了這種功能,并能夠觀察調(diào)整后的信號(hào)的波形圖得變化, 而且能通過語音處理界面的輸出功能試

30、聽處理后的語音信號(hào)。4.3.2.1 語音信號(hào)的頻率調(diào)整 在設(shè)計(jì)中,可以將語音信號(hào)的采樣頻率提高或降低,來實(shí)現(xiàn)語音信號(hào)的調(diào)整,得到理想的語音信號(hào)。例如將采樣頻率提高一倍,即可得到語音信號(hào)頻率為原頻率2倍新的語音信號(hào)。運(yùn)行processadjustfrequency,得到如圖4.4的信號(hào)波形圖,并試聽調(diào)整后的效果。圖4.4頻率調(diào)整后波形圖與原語音信號(hào)相比,經(jīng)過調(diào)整后的信號(hào)周期變?yōu)樵瓉淼?/2,此時(shí)的語速明顯變快,即實(shí)現(xiàn)了信號(hào)的2倍頻功能。4.3.2.2語音信號(hào)的振幅調(diào)整在設(shè)計(jì)中,可以將語音信號(hào)的幅度進(jìn)行提高或降低操作,來實(shí)現(xiàn)語音信號(hào)的調(diào)整,得到聲音音量大小不同的語音信號(hào),例如將原語音信號(hào)的幅度提高

31、一倍,得到如下圖4.5的信號(hào)波形圖,可以通過gui操作界面的輸出功能試聽調(diào)整后的效果。圖4.5 幅度調(diào)整后波形圖 此時(shí)聽到的調(diào)整后聲音聲調(diào)變高,但不是很明顯,可以將幅度的變化值設(shè)置的比較大,那樣的話就可以得到效果相當(dāng)明顯的語音信號(hào)了。4.3.3 語音信號(hào)的傅里葉變換倒譜分析是指信號(hào)短時(shí)振幅譜的對(duì)數(shù)進(jìn)行傅里葉反變換。它具有可近似地分離并提取出頻譜包絡(luò)信息和細(xì)微結(jié)構(gòu)信息的特點(diǎn)。 對(duì)語音信號(hào)進(jìn)行頻譜分析,在matlab中可以利用函數(shù)fft對(duì)信號(hào)行快速傅里葉變換,得到信號(hào)的頻譜圖,并進(jìn)行倒譜分析,得到倒譜圖。 傅里葉變換的部分程序如下:x=y(44101:55050,1); %提取原語音信號(hào)的一部分t

32、=(0:length(x)-1)/fs; %計(jì)算樣本時(shí)刻subplot(3,1,1); %確定顯示位置plot(t,x); %畫波形圖legend(波形圖);xlabel( time(s);ylabel(amplitude);y=fft(x,hamming(length(x); %做加窗傅里葉變換fm=5000*length(y)/fs; %限定頻率范圍f=(0:fm)*fs/length(y); %確定頻率刻度subplot(3,1,2);plot(f,20*log10(abs(y(1:length(f)+eps);legend(頻譜圖); %畫頻譜圖ylabel(幅度(db);xlabel

33、(頻率(hz);c=fft(log(abs(x)+eps); %倒頻譜計(jì)算ms1=fs/1000;ms20=fs/50q=(ms1:ms20)/fs; %確定倒頻刻度subplot(3,1,3);plot(q,abs(c(ms1:ms20); %畫倒譜圖legend(倒譜圖);xlabel(倒頻(s));ylabel(倒頻譜幅度(hz));運(yùn)行process transform,對(duì)語音信號(hào)的一部分進(jìn)行傅里葉變換,并進(jìn)行倒譜分析,得到如圖4.6圖4.6 聲音樣本波形圖、頻譜圖和倒譜圖從上面的倒譜圖可以看出當(dāng)讀“主人,信息收到了”時(shí),所對(duì)應(yīng)的頻率大概在200hz左右。這與人的語音信號(hào)頻率集中在20

34、0 hz到4.5 khz之間是相一致的。而在未發(fā)聲的時(shí)間段內(nèi),相對(duì)的小高頻部分(200500hz)應(yīng)該屬于背景噪聲。4.3.4 語音信號(hào)的濾波 從圖4.4中發(fā)現(xiàn),語音信號(hào)中包含背景噪聲,這些噪聲的頻率一般較高。所以可以利用matlab軟件中的濾波器進(jìn)行濾波處理,得到較為理想的語音信號(hào)。4.3.4.1 語音信號(hào)的低通濾波 系統(tǒng)中設(shè)計(jì)了一個(gè)截止頻率為200hz切比雪夫i型低通濾波器,它的幅頻特性如下圖4.7:圖4.7 低通濾波器的幅頻特性低通濾波器性能指標(biāo): wp=0075pi,ws =0125pi,rp=025;as =50db;經(jīng)過低通濾波器處理后,比較處理前后的波形圖的變化,如下圖4.8:圖

35、4.8 低通濾波后波形和頻譜的變化低通濾波后,聲音稍微有些發(fā)悶、低沉,原因是高頻分量被低通濾波器衰減。但是很接近原來的聲音。4.3.4.2 語音信號(hào)的高通濾波運(yùn)用切比雪夫型數(shù)字高通濾波器,對(duì)語音信號(hào)進(jìn)行濾波處理。高通濾波器性能指標(biāo): wp=0375pi,ws =0425pi,rp=025;as =50db;然后將其與原信號(hào)的比較圖如下圖4.9:圖4.9高通濾波后波形和頻譜的變化高通濾波后,此時(shí)只有少許雜音,原因是低頻分量被高通濾波器衰減,而人聲部分正好是低頻部分,所以只剩下雜音,或者發(fā)出高頻雜音但人的耳朵聽不到。4.3.4.3 語音信號(hào)的帶通濾波運(yùn)用橢圓數(shù)字帶通濾波器函數(shù),對(duì)語音信號(hào)進(jìn)行濾波處

36、理后其與原信號(hào)的比較圖如下圖4.10:圖4.10帶通濾波后波形和頻譜的變化4.3.4.4 語音信號(hào)的帶阻濾波運(yùn)用切比雪夫型數(shù)字帶阻濾波器,對(duì)語音信號(hào)進(jìn)行濾波處理后其與原信號(hào)的比較圖如下圖3.11:圖4.11帯阻濾波后波形和頻譜的變化從以上各種數(shù)字濾波器經(jīng)過濾波后得出的語音信號(hào)相比較,低通濾波后,聲音稍微有些發(fā)悶,但是很接近原來的聲音;高通濾波后聽不到人的聲音;帶通濾波后聲音有點(diǎn)像機(jī)器人小叮當(dāng)發(fā)出的聲音。帶阻濾波后,聲音比較接近原來的聲音。從頻譜圖中我們可以看出聲音的能量主要集中在低頻(0.2pi即22045hz以內(nèi))部分。4.4 語音信號(hào)的輸出 可以將處理后的語音信號(hào)在matlab軟件先播放,

37、體驗(yàn)處理后的語音信號(hào)的效果。還可以將處理后的語音信號(hào)保存在電腦上。運(yùn)行filesave,保存處理后的語音信號(hào)。如果沒有語音信號(hào)被處理,則系統(tǒng)會(huì)出現(xiàn)提示如下圖4.12:圖4.12 保存提示界面如果有語音信號(hào)被處理,運(yùn)行filesave,系統(tǒng)會(huì)出現(xiàn)提示如下圖4.13:圖4.13 保存界面保存后,整個(gè)操作過程就完成了。5 總結(jié)本文對(duì)語音信號(hào)處理系統(tǒng)的設(shè)計(jì)作了詳細(xì)的介紹,采用一系列圖像分析和處理技術(shù),實(shí)現(xiàn)了語音信號(hào)的基本處理的功能,經(jīng)過測(cè)試運(yùn)行,本設(shè)計(jì)圓滿的完成了對(duì)語音信號(hào)的讀取與打開;較好的完成了對(duì)語音信號(hào)的頻譜分析,通過fft變換,得出了語音信號(hào)的頻譜圖;在濾波這一塊,課題主要是從數(shù)字濾波器入手來設(shè)計(jì)濾波器,基本實(shí)現(xiàn)了濾波,完成了各種濾波器的濾波效果比較,與課題的要求十分相符。 本文對(duì)語音信號(hào)處理系統(tǒng)的設(shè)計(jì)作了詳細(xì)的介紹,采

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論