語(yǔ)音信號(hào)處理1_第1頁(yè)
語(yǔ)音信號(hào)處理1_第2頁(yè)
語(yǔ)音信號(hào)處理1_第3頁(yè)
語(yǔ)音信號(hào)處理1_第4頁(yè)
語(yǔ)音信號(hào)處理1_第5頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余2頁(yè)可下載查看

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

本文格式為Word版,下載可任意編輯——語(yǔ)音信號(hào)處理1吉林工程技術(shù)師范學(xué)院課程設(shè)計(jì)論文

第一章緒論

1.1選題目的、意義

語(yǔ)音信號(hào)處理是研究用數(shù)字信號(hào)處理技術(shù)和語(yǔ)音學(xué)知識(shí)對(duì)語(yǔ)音信號(hào)進(jìn)行處理的新興的

學(xué)科,是目前發(fā)展最為迅速的信息科學(xué)研究領(lǐng)域的核心技術(shù)之一。通過(guò)語(yǔ)音傳遞信息是人類(lèi)最重要、最有效、最常用和最便利的交換信息形式。同時(shí),語(yǔ)言也是人與機(jī)器之間進(jìn)行通信的重要工具,它是一種理想的人機(jī)通信方式,因而可為計(jì)算機(jī)、自動(dòng)化系統(tǒng)等建立良好的人機(jī)交互環(huán)境,進(jìn)一步推動(dòng)計(jì)算機(jī)和其他智能機(jī)器的應(yīng)用,提高社會(huì)的信息化和自動(dòng)化程度。

語(yǔ)音信號(hào)處理是一門(mén)新興的學(xué)科,同時(shí)又是綜合性的多學(xué)科領(lǐng)域和涉及面很廣的交織學(xué)科。雖然從事這一領(lǐng)域研究的人員主要來(lái)自信號(hào)與信息處理及計(jì)算機(jī)應(yīng)用等學(xué)科,但是它與語(yǔ)音學(xué)、語(yǔ)言學(xué)、聲學(xué)、認(rèn)知科學(xué)、生理學(xué)、心理學(xué)等大量學(xué)科也有十分密切的聯(lián)系。語(yǔ)音信號(hào)處理技術(shù)的應(yīng)用極其廣泛,涉及工業(yè)、軍事、交通、醫(yī)學(xué)、民用等各個(gè)領(lǐng)域,其中最重要的包括語(yǔ)音編碼、語(yǔ)音合成、語(yǔ)音識(shí)別以及語(yǔ)音加強(qiáng)等。

1.2設(shè)計(jì)要求

本次課程設(shè)計(jì)是用MATLAB對(duì)含噪的語(yǔ)音信號(hào)同時(shí)在時(shí)域和頻域進(jìn)行濾波處理和分析,

在MATLAB應(yīng)用軟件下設(shè)計(jì)一個(gè)簡(jiǎn)單易用的圖形用戶(hù)界面(GUI),來(lái)解決一般應(yīng)用條件下的各種語(yǔ)音信號(hào)的處理。

1.3研究?jī)?nèi)容及難點(diǎn)

對(duì)所采集的語(yǔ)音信號(hào)參與干擾噪聲,對(duì)語(yǔ)音信號(hào)進(jìn)行回放,感覺(jué)加噪前后聲音的

變化,分析原因,得出結(jié)論。并對(duì)其進(jìn)行FFT頻譜分析,比較加噪前后語(yǔ)音信號(hào)的波形及頻譜,對(duì)所得結(jié)果進(jìn)行分析,說(shuō)明原因,得出結(jié)論。

用所設(shè)計(jì)的濾波器對(duì)含噪語(yǔ)音信號(hào)進(jìn)行濾波。對(duì)濾波后的語(yǔ)音信號(hào)進(jìn)行FFT頻譜分析。畫(huà)出處理過(guò)程中所得各種波形及頻譜圖。對(duì)語(yǔ)音信號(hào)進(jìn)行回放,感覺(jué)濾波前后聲音的變化。比較濾波前后語(yǔ)音信號(hào)的波形及頻譜,對(duì)所得結(jié)果和濾波器性能進(jìn)行頻譜分析,說(shuō)明原因,得出結(jié)論。

1

吉林工程技術(shù)師范學(xué)院課程設(shè)計(jì)論文

其次章語(yǔ)音信號(hào)處理理論基礎(chǔ)

2.1系統(tǒng)基本概述

圖形用戶(hù)界面(GraphicalUserInterface,簡(jiǎn)稱(chēng)GUI,又稱(chēng)圖形用戶(hù)接口)是指采用圖形方式顯示的計(jì)算機(jī)操作用戶(hù)界面。與早期計(jì)算機(jī)使用的命令行界面相比,圖形界面對(duì)于用戶(hù)來(lái)說(shuō)在視覺(jué)上更易于接受。GUI的廣泛應(yīng)用是當(dāng)今計(jì)算機(jī)發(fā)展的重大成就之一,他極大地便利了非專(zhuān)業(yè)用戶(hù)的使用人們此后不再需要死記硬背大量的命令,取而代之的是可以通過(guò)窗口、菜單、按鍵等方式來(lái)便利地進(jìn)行操作。

目前,隨著數(shù)字化信號(hào)處理技術(shù)的不斷提高,單片機(jī),數(shù)字信號(hào)處理器以及語(yǔ)音處理大規(guī)模集成電路的進(jìn)步,語(yǔ)音合成,語(yǔ)音識(shí)別,語(yǔ)音存儲(chǔ)和回放技術(shù)的應(yīng)用越來(lái)越廣泛.本文提出的體積小巧,功耗低的數(shù)字化語(yǔ)音存儲(chǔ)與回放系統(tǒng)將完全可以替代傳統(tǒng)的語(yǔ)音錄放系統(tǒng).

2.2系統(tǒng)基本原理

語(yǔ)音采集原理是,人耳能聽(tīng)到的聲音是一種頻率范圍為20Hz20kHz,而一般語(yǔ)音頻率最高為3.4kHz.語(yǔ)音的采集是指語(yǔ)音聲波信號(hào)經(jīng)麥克風(fēng)和高頻放大器轉(zhuǎn)換成有一定幅度的模擬量電信號(hào),然后再轉(zhuǎn)換成數(shù)字量的全過(guò)程.

本次設(shè)計(jì)的基本原理是對(duì)語(yǔ)音的錄音和放音進(jìn)行數(shù)字化控制.其中,關(guān)鍵技術(shù)在于:為了增加語(yǔ)音存儲(chǔ)時(shí)間,提高存儲(chǔ)器的利用率,采用了非失真壓縮算法對(duì)語(yǔ)音信號(hào)進(jìn)行壓縮后再存儲(chǔ),而在回放是再進(jìn)行解壓縮;同時(shí),對(duì)輸入語(yǔ)音信號(hào)進(jìn)行數(shù)字濾波以抑制雜音和干擾,從而確保了語(yǔ)音回放的可靠質(zhì)量.

通過(guò)設(shè)計(jì)一個(gè)GUI試驗(yàn)箱,并添加相應(yīng)的控制控件,添加一個(gè)聲音文件,通過(guò)MATLAB編程,使其通過(guò)各種按鈕實(shí)現(xiàn)語(yǔ)音信號(hào)處理的各種功能,最終做成一個(gè)完整的語(yǔ)音信號(hào)處理試驗(yàn)箱。

2

吉林工程技術(shù)師范學(xué)院課程設(shè)計(jì)論文

第三章系統(tǒng)方案論證

3.1設(shè)計(jì)理論依據(jù)

3.1.1采樣定理

在進(jìn)行模擬/數(shù)字信號(hào)的轉(zhuǎn)換過(guò)程中,當(dāng)采樣頻率fs.max大于信號(hào)中,最高頻率fmax的2倍時(shí),則采樣之后的數(shù)字信號(hào)完整地保存了原始信號(hào)中的信息,一般實(shí)際應(yīng)用中保證采樣頻率為信號(hào)最高頻率的5-10倍;采樣定理又稱(chēng)乃奎斯特定理。

3.1.2采樣頻率

采樣頻率是指計(jì)算機(jī)每秒鐘采集多少個(gè)聲音樣本,是描述聲音文件的音質(zhì)、音調(diào)、衡量聲卡、聲音文件的質(zhì)量標(biāo)準(zhǔn)。采樣頻率越高,即采樣的間隔時(shí)間越短,則在單位時(shí)間內(nèi)計(jì)算機(jī)得到的聲音樣本數(shù)據(jù)就越多,對(duì)聲音波形的表示也就越確切,采樣頻率與聲音頻率之間有一定的關(guān)系,根據(jù)奈奎斯特理論,只有采樣頻率高于聲音信號(hào)最高頻率的2倍的時(shí)候,才能把數(shù)字信號(hào)表示的聲音還原成為原來(lái)的聲音,這就是說(shuō)采樣頻率是衡量聲卡采集、記錄和還原聲音文件的質(zhì)量標(biāo)準(zhǔn)。

3.1.3采樣位數(shù)與采樣頻率

采樣位數(shù)即采樣值或取樣值,用來(lái)衡量聲音波動(dòng)變化的參數(shù),是指聲卡在采集和播放聲音文件時(shí)候使用數(shù)字聲音信號(hào)的二進(jìn)制為數(shù)。采樣頻率是指錄音設(shè)備在一秒鐘內(nèi)對(duì)聲音信號(hào)的采樣次數(shù),采樣頻率越高聲音的還原就越真實(shí)越自然。

采樣位數(shù)和采樣頻率對(duì)于音頻接口來(lái)說(shuō)是最為重要的兩個(gè)基本指標(biāo),也是選擇音頻接口的兩個(gè)重要標(biāo)準(zhǔn)。無(wú)論采樣頻率如何,理論上來(lái)說(shuō)采樣的位數(shù)決定了音頻數(shù)據(jù)最大的力度范圍。每增加一個(gè)采樣位數(shù)相當(dāng)于力度范圍增加了6dB。采樣位數(shù)越多則捕獲到的信號(hào)越確切。對(duì)于采樣率來(lái)說(shuō)你可以想象它類(lèi)似一個(gè)照相機(jī)。顯然采樣率越高,計(jì)算機(jī)提取的圖片越多,對(duì)于原始的還原也越加確切。

3

吉林工程技術(shù)師范學(xué)院課程設(shè)計(jì)論文

第四章GUI設(shè)計(jì)實(shí)現(xiàn)

4.1整體圖

4.1GUI圖

4.2GUI各形成圖

4.2.1語(yǔ)音信號(hào)的短時(shí)分析Matlab編程試驗(yàn)步驟:

1.新建M文件,擴(kuò)展名為“.m〞,編寫(xiě)程序;2.選擇File/Save命令,將文件保存在F盤(pán)中;3.在CommandWindow窗中輸入文件名,運(yùn)行程序;Matlab部分函數(shù)語(yǔ)法格式:

讀wav文件:x=wavread(`filename`)數(shù)組a及b中元素相乘:a.*b

創(chuàng)立圖形窗口命令:figure繪圖函數(shù):plot(x)

坐標(biāo)軸:axis([xminxmaxyminymax])坐標(biāo)軸注解:xlabel(`?`)ylabel(`?`)

4

吉林工程技術(shù)師范學(xué)院課程設(shè)計(jì)論文

圖例注解:legend(`?`)

一階高通濾波器:y=filter([1-0.09375],1,x)分幀函數(shù):f=enframe(x,len,inc)

x為輸入語(yǔ)音信號(hào),len指定了幀長(zhǎng),inc指定幀移,函數(shù)返回為n×len的一個(gè)矩陣

[x]=wavread('3.wav');sound(x);figure;

subplot(4,1,1);plot(x);

axis([1length(x)-11]);ylabel('Speech');

enhance=filter([1-0.9375],1,x);FrameLen=240;FrameInc=80;

yframe=enframe(x,FrameLen,FrameInc);amp1=sum(abs(yframe),2);subplot(4,1,2);plot(amp1);

axis([1length(amp1)0max(amp1)]);ylabel('Amp');

legend('amp1=∑│x│');

amp2=sum(abs(yframe.*yframe),2);subplot(4,1,3);plot(amp2);

axis([1length(amp2)0max(a

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論