第3章音頻信息的獲取與處理_第1頁
第3章音頻信息的獲取與處理_第2頁
第3章音頻信息的獲取與處理_第3頁
第3章音頻信息的獲取與處理_第4頁
第3章音頻信息的獲取與處理_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第2章音頻信息的獲取和處理2.1

數(shù)字音頻基礎(chǔ)2.2聲卡的組成與工作原理

2.3音頻編碼基礎(chǔ)和標(biāo)準(zhǔn)

2.4音樂合成和MIDI標(biāo)準(zhǔn)2023/2/6

2.1數(shù)字音頻基礎(chǔ)

隨著多媒體信息處理技術(shù)的發(fā)展,計算機(jī)數(shù)據(jù)處理能力的增強,音頻處理技術(shù)受到重視,并得到了廣泛的應(yīng)用,如:視頻圖像配以娓娓動聽的音樂和語音;靜態(tài)或動態(tài)圖像配以解說和背景音樂;立體聲音樂可增加空間感;游戲中的音響效果等。本章主要介紹音頻的相關(guān)知識。2023/2/6一、模擬音頻規(guī)則音頻是一種連續(xù)變化的模擬信號,可用一條連續(xù)的曲線來表示,稱為聲波。因聲波是在時間和幅度上都連續(xù)變化的量,我們稱之為模擬量。用聲音錄制軟件記錄的英文單詞“Hello”的語音實際波形2.1.1模擬音頻和數(shù)字音頻2023/2/6模擬音頻信號的兩個重要參數(shù)模擬音頻信號有兩個重要參數(shù):頻率和幅度。聲音的頻率體現(xiàn)音調(diào)的高低,聲波幅度的大小體現(xiàn)聲音的強弱。

一個聲源每秒鐘可產(chǎn)生成百上千個波,我們把每秒鐘波峰所發(fā)生的數(shù)目稱之為信號的頻率,單位用赫茲(Hz)或千赫茲(kHz)表示。信號的幅度是從信號的基線到當(dāng)前波峰的距離。幅度決定了信號音量的強弱程度。幅度越大,聲音越強。對音頻信號,聲音的強度用分貝(dB)表示,分貝的幅度就是音量。幅度限周期基線2023/2/6二、數(shù)字音頻聲音的A/D與D/A轉(zhuǎn)換A/D轉(zhuǎn)換就是把模擬信號轉(zhuǎn)換成數(shù)字信號的過程,模擬電信號變?yōu)榱擞伞?”和“1”組成的Bit信號。這樣做的好處是顯而易見的,聲音存儲質(zhì)量得到了加強,數(shù)字化的聲音信息使計算機(jī)能夠進(jìn)行識別、處理和壓縮。A/D轉(zhuǎn)換的一個關(guān)鍵步驟是聲音的采樣和量化,得到數(shù)字音頻信號,它在時間上是不連續(xù)的離散信號。借助于A/D或D/A轉(zhuǎn)換器,模擬信號和數(shù)字信號可以互相轉(zhuǎn)換。2023/2/6模擬音頻的數(shù)字化過程

數(shù)字化的聲音易于用計算機(jī)軟件處理,現(xiàn)在幾乎所有的專業(yè)化聲音錄制、編輯器都是數(shù)字方式。對模擬音頻數(shù)字化過程涉及到音頻的采樣和量化。

采樣和量化的過程可由A/D轉(zhuǎn)換器實現(xiàn)。A/D轉(zhuǎn)換器以固定的頻率去采樣,即每個周期測量和量化信號一次。經(jīng)采樣和量化后聲音信號經(jīng)編碼后就成為數(shù)字音頻信號,可以將其以文件形式保存在計算機(jī)的存儲介質(zhì)中,這樣的文件一般稱為數(shù)字聲波文件。

2023/2/62.1.2音頻的數(shù)字化

多媒體計算機(jī)產(chǎn)生聲音的方式主要有3種:由外部聲音源進(jìn)行錄制與重放的波形音頻、MIDI音樂的MIDI音頻/programs/view/AB0N4boBhFY/聲音數(shù)字化分為采樣和量化兩個步驟:采樣就是每隔一段時間就讀一次聲音信號的幅度,記錄下來的原始模擬聲波在某一時刻的狀態(tài),稱之為樣本;每秒鐘抽取聲波幅度樣本的次數(shù),稱為采樣頻率;量化:把采樣得到的聲波幅度轉(zhuǎn)化為數(shù)字值,也就是把某一幅度范圍內(nèi)的電壓用一個數(shù)字表示。2023/2/6

以下圖所示的原始模擬波形為例進(jìn)行采樣和量化。假設(shè)采樣頻率為1000次/秒,即每1/1000秒A/D轉(zhuǎn)換器采樣一次,其幅度被劃分成0到9共10個量化等級,并將其采樣的幅度值取最接近0~9之間的一個數(shù)來表示,如下圖所示。圖中每個正方形表示一次采樣。

012345678910ms2023/2/6

失真在采樣過程中是不可避免的,如何減少失真呢?可以直觀地看出,我們可以把上圖中的波形劃分成更為細(xì)小的區(qū)間,即采用更高的采樣頻率。同時,增加量化精度,以得到更高的量化等級,即可減少失真的程度。在下圖(左)中,采樣率和量化等級均提高了一倍,分別為2000次/秒和20個量化等級。在下圖(右)中,采樣率和量化等級再提高了一倍,分別達(dá)到4000次/秒和40個量化等級。從圖中可以看出,當(dāng)用D/A轉(zhuǎn)換器重構(gòu)原來信號時(圖中的輪廓線),信號的失真明顯減少,信號質(zhì)量得到了提高。2023/2/6

信息論的奠基者香農(nóng)(Shannon)為實現(xiàn)A/D轉(zhuǎn)換,需要把模擬音頻信號波形進(jìn)行分割,這種方法就是采樣(Sampling)。采樣的過程是把時間上的連續(xù)信號變成時間上的離散信號。該時間間隔稱為采樣周期,其倒數(shù)為采樣頻率。采樣頻率是指計算機(jī)每秒鐘采集多少個聲音樣本。采樣頻率越高,聲音失真越小,存儲音頻的數(shù)據(jù)量也越大。常用的有8kHz,11.025kHz,22.05,kHz16kHz,44.1kHz,48kHz等。1.采樣頻率

2023/2/6

采樣只解決了音頻波形信號在時間坐標(biāo)(即橫軸)上把一個波形切成若干個等分的數(shù)字化問題,但是還需要用某種數(shù)字化的方法來反映某一瞬間聲波幅度的電壓值大小。該值的大小影響音量的高低。我們把對聲波波形幅度的數(shù)字化表示稱之為“量化”。量化位數(shù)是每個采樣點能夠表示的數(shù)據(jù)范圍,有8/12/16/32位。量化級的大小決定了聲音的動態(tài)范圍,即被記錄和重放的聲音最高與最低之間的差值。量化的過程是先將采樣后的信號按整個聲波的幅度劃分成有限個區(qū)段的集合,把落入某個區(qū)段內(nèi)的樣值歸為一類,并賦于相同的量化值。如何分割采樣信號的幅度呢?我們還是采取二進(jìn)制的方式,以8位(bit)或16位(bit)的方式來劃分縱軸。也就是說在一個以8位為記錄模式的音效中,其縱軸將會被劃分為一個量化等級,用以記錄其幅度大小。量化位數(shù)越高音質(zhì)越好,數(shù)據(jù)量也越大。2.量化數(shù)據(jù)位數(shù)(也稱量化級、樣本尺寸等)2023/2/63、單聲道與雙聲道反映音頻數(shù)字化質(zhì)量的另一個因素是通道(或聲道)個數(shù)。記錄聲音時,如果每次生成1個聲波數(shù)據(jù),稱為單聲道;如果每次生成2個聲波數(shù)據(jù),稱為立體聲(雙聲道)。立體聲更能反映人的聽覺感受,數(shù)字音頻還受其他一些因素(如揚聲器質(zhì)量)的影響。2023/2/64、數(shù)字音頻的存儲可用下面的公式估算聲音數(shù)字化后每秒所需的存儲量(假定不經(jīng)壓縮):存儲量(B)=(采樣頻率HZ×量化位數(shù)bit×聲道數(shù))/8例:數(shù)字激光唱盤(CD-DA,紅皮書標(biāo)準(zhǔn))的標(biāo)準(zhǔn)采樣頻率為44.1KHZ,量化位數(shù)為16位,立體聲(這就是所謂的CD音質(zhì)—CD-qualitysound),可以幾乎無失真地播出頻率高達(dá)22KHZ的聲音,這也是人耳所能聽到的最高聲音頻率。1分鐘CD-DA音樂所需的存儲量為

(44.1×1000×16×2×60/8)B=10584000B采樣頻率是8KHZ,量化位數(shù)是16位,雙聲道聲音,一分鐘的數(shù)據(jù)量是多少?2023/2/6在多媒體技術(shù)中,存儲音頻信息的文件格式主要有:WAV文件、VOC文件、MIDI文件、AIF文件、SNO文件和RMI文件等。

1.

WAV文件

WAV文件又稱波形文件,來源于對聲音模擬波形的采樣,并以不同的量化位數(shù)把這些采樣點的值轉(zhuǎn)換成二進(jìn)制數(shù),然后存入磁盤,這就產(chǎn)生了波形文件。WAV文件用于保存Windows平臺的音頻信息資源,被Windows平臺及其應(yīng)用程序所廣泛支持。2.1.3數(shù)字音頻的文件格式2023/2/62.2聲卡的組成與工作原理

處理音頻信號的PC插卡是聲卡(AudioCard),又稱音頻卡,聲卡處理的音頻媒體有數(shù)字化聲音(Wave)、合成音樂(MIDI)、CD音頻。2023/2/62.2.1聲卡的功能、技術(shù)指標(biāo)與分類1.聲卡的功能(1)采集來自話筒、收音機(jī)等音源的信號,并將其數(shù)字化形成數(shù)字音頻(2)將數(shù)字音頻回原位模擬音頻信號,待放大后送到揚聲器還原為聲音信號(3)對數(shù)字化的聲音進(jìn)行編輯加工,已達(dá)到特殊的效果(4)控制音源的音量,對各種音源進(jìn)行混合(5)采集數(shù)據(jù)時,對數(shù)字化聲音信號進(jìn)行壓縮,一邊存儲;播放時,對壓縮的數(shù)字化聲音文件進(jìn)行解壓(6)接受來自MIDI控制器的MIDI信號,使計算機(jī)可以控制多臺具有MIDI接口的樂器2023/2/6音箱2、Microphone(麥克風(fēng)輸入)3、Speaker(揚聲器輸出)4、MIDI/GamePort(MIDI/操縱桿端口)7、CD-ROM音頻信號接口6、CD-ROM的接口8、跳接器音頻輸出IDE接口CD-ROM外部音頻設(shè)備麥克風(fēng)操縱桿MIDI聲音裝置1、Linein(線性輸入)5、VolumeControl(音量調(diào)節(jié)旋鈕)電源跳接線2023/2/6MIDI是數(shù)字音樂接口(MusicalInstrumentDigitalInterface)的縮寫?;蛘哒f,MIDI是用來將電子樂器相互連接,或?qū)IDI設(shè)備與電腦連接成系統(tǒng)的一種通訊協(xié)議。通過它,各種MIDI設(shè)備都可以準(zhǔn)確傳送MIDI信息。2.4.2MIDI規(guī)范一、什么是MIDI2023/2/6二、MIDI系統(tǒng)的組成基于計算機(jī)的MIDI音樂創(chuàng)作系統(tǒng)2023/2/6三、MIDI的工作過程音序器:你可以理解為一個MIDI數(shù)據(jù)的錄音機(jī),它是以軟件形式安裝在電腦上,如

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論