數(shù)字音頻處理技術(shù)第三章_第1頁(yè)
數(shù)字音頻處理技術(shù)第三章_第2頁(yè)
數(shù)字音頻處理技術(shù)第三章_第3頁(yè)
數(shù)字音頻處理技術(shù)第三章_第4頁(yè)
數(shù)字音頻處理技術(shù)第三章_第5頁(yè)
已閱讀5頁(yè),還剩55頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)字音頻處理技術(shù)第三章第3

數(shù)字音頻處理技術(shù)3.1音頻處理概述3.1.1什么是聲音3.1.2聲音的基本參數(shù)3.1.3人的聽覺特性3.1.4音頻信號(hào)處理過程3.2音頻的數(shù)字化3.2.1音頻的采樣3.2.2音頻的量化3.2.3聲道數(shù)3.2.4音頻的編碼與壓縮技術(shù)3.2.5數(shù)字音頻的質(zhì)量3.3音頻文件格式及標(biāo)準(zhǔn)3.3.1波形文件格式3.3.2MPEG音頻文件格式3.3.3流媒體音頻文件格式3.3.4MIDI3.4音頻軟件的使用3.4.1常見音頻軟件簡(jiǎn)介3.4.2CoolEdit3.5音頻效果處理技巧3.5.1常用音頻編輯命令3.5.2常用音效命令3.5.3特殊音頻的生成3.1音頻處理概述物理學(xué)角度:聲音是一種由物體振動(dòng)產(chǎn)生的機(jī)械波,并在彈性介質(zhì)(如空氣等)中傳播??梢杂谩奥暡ā眮肀硎韭曇簦暡ㄊ且粭l隨時(shí)間變化的連續(xù)曲線。3.1.1什么是聲音聲音信號(hào)的波形單音信號(hào)波形

由單一頻率和振幅組成的聲音信號(hào)。一般只有電子儀器才能產(chǎn)生。復(fù)合信號(hào)波形由若干頻率和振幅各不相同的正弦波組成。自然界存在的聲音大多是復(fù)合音。3.1.2聲音的基本參數(shù)1.頻率表示聲波每秒中出現(xiàn)的周期數(shù)目,即變化的次數(shù)。以赫茲Hz為單位。頻率反映音調(diào)高低:頻率越高,音調(diào)越細(xì)尖;頻率越低,音調(diào)越粗低。聲音的基本參數(shù):頻率和振幅2.振幅振幅決定聲音的強(qiáng)度,振幅越高,聲音越強(qiáng);振幅越低,聲音越弱。以分貝dB為單位。人耳的聽覺范圍在聽閾與痛閾之間。聽閾:人耳剛剛能聽到的最低聲音,如0dB。痛閾:當(dāng)聲強(qiáng)過高,超過120dB時(shí),會(huì)使人耳感到疼痛。3.1.3人的聽覺特性1.頻率與音強(qiáng)的關(guān)系人耳對(duì)不同頻率段聲音的音強(qiáng)敏感度差別很大,不同頻率的聲音要達(dá)到能被人耳聽到的水平所需要的強(qiáng)度是不一樣的。人耳對(duì)2KHz~4KHz范圍的信號(hào)最敏感一種音頻信號(hào)會(huì)阻礙聽覺系統(tǒng)感受另一種音頻信號(hào)的現(xiàn)象,前者稱為“掩蔽音”,后者稱為“被掩蔽音”。2.掩蔽效應(yīng)在一定頻率范圍內(nèi),強(qiáng)音頻信號(hào)會(huì)掩蔽在其附近同時(shí)存在的弱音頻信號(hào),使得弱音被強(qiáng)音“掩蔽”掉。除了同時(shí)發(fā)出的聲音之間有掩蔽現(xiàn)象之外,在時(shí)間上相鄰的聲音之間也有掩蔽現(xiàn)象。包括超前掩蔽和滯后掩蔽。頻域掩蔽時(shí)域掩蔽3.1.4音頻信號(hào)處理過程

將時(shí)間和幅度都連續(xù)的模擬音頻信號(hào),經(jīng)過一定的變化和處理,使其變成時(shí)間和幅度都離散的二進(jìn)制數(shù)字信號(hào)的過程。音頻數(shù)字化過程3.2音頻的數(shù)字化

把模擬音頻信號(hào)在時(shí)間域上,按照設(shè)定的時(shí)間間隔,讀取音頻信號(hào)波形的幅度值,再用若干位二進(jìn)制數(shù)表示此幅度值的過程。采樣3.2.1音頻的采樣采樣時(shí)間間隔稱“采樣周期”采樣周期的倒數(shù)稱“采樣頻率”,單位為Hz。采樣頻率決定每秒鐘所取聲波幅度樣本的次數(shù)。隔相等的時(shí)間間隔的采樣稱為“均勻采樣”;采樣時(shí)間間隔不恒定的,稱“非均勻采樣”。采樣周期和采樣頻率fs>=2f或Ts<=T/2其中:fs―采樣頻率;f―音頻信號(hào)的最高頻率;Ts―采樣周期;T―音頻信號(hào)的最小周期。奈奎斯特理論(Nyquisttheory)采樣頻率與聲音質(zhì)量的關(guān)系采樣頻率直接影響到聲音的質(zhì)量,采樣頻率高,每秒采集的樣本多,聲音保真度越好,但數(shù)據(jù)存儲(chǔ)量也越大。幾種常用的采樣頻率人類話音頻率范圍:300Hz~3000Hz人耳能聽到的聲音頻率范圍:20Hz~20KHz3.2.2音頻的量化量化是對(duì)采樣后信號(hào)幅度值進(jìn)行離散化處理。1.量化過程①劃分量化階距。

將聲波幅度值劃分為有限個(gè)小幅度(量化階距△)的集合:

量化階距△=2Xmax/2B,其中:

Xmax

―聲波最大幅值;B―二進(jìn)制量化值的位數(shù)②賦量化值。

把落入某個(gè)量化界線±1/2范圍內(nèi)的采樣值歸為一類,賦予同樣的量化值。均勻量化與非均勻量化采用相等的量化階距處理采樣得到的信號(hào)值稱為均勻量化(線性量化)。實(shí)際量化中,通常會(huì)以人的聽力敏感度為準(zhǔn)來設(shè)定更適合且不同大小的量化階距,這種方式稱為非均勻量化。

指量化后二進(jìn)制樣本值的位數(shù)(bit/s或b/s)。

2.量化精度樣本值位數(shù)取值范圍量化精度3位0~71/816位0~655351/65536

量化位數(shù)越多,聲音質(zhì)量越高,但數(shù)據(jù)量也越大。量化精度用信噪比SNR(單位:分貝dB)表示:其中:Vsignal

―信號(hào)電壓Vniose―噪聲電壓量化后的樣本值Y與原始值X的差E=Y(jié)-X。量化誤差隨量化階距變大而增加,樣本位數(shù)的大小影響聲音質(zhì)量,位數(shù)越多,聲音還原越真實(shí)。量化誤差(量化噪聲)3.2.3聲道數(shù)一次采樣記錄的聲音波形個(gè)數(shù)決定聲道數(shù)多少。聲道數(shù)多,音質(zhì)音色更好更真實(shí),存儲(chǔ)容量也要相應(yīng)增加。單聲道Mono:記錄聲音時(shí),每次生成一個(gè)聲波數(shù)據(jù)。立體聲Stereo:記錄聲音時(shí),每次生成兩個(gè)聲波數(shù)據(jù)。多聲道:如4.1聲道,即前后左右各一個(gè)聲道,“.1”是指低音音箱(低音炮),用來播放分離的低頻聲音。3.2.4音頻的編碼與壓縮技術(shù)音頻質(zhì)量數(shù)據(jù)量計(jì)算復(fù)雜度音頻壓縮編碼時(shí)考慮的因素:常見音頻編碼算法和標(biāo)準(zhǔn)

基于音頻數(shù)據(jù)的統(tǒng)計(jì)特性進(jìn)行的編碼,其目標(biāo)是使重建語音波形保持原波形的形狀。特點(diǎn):算法簡(jiǎn)單,易于實(shí)現(xiàn),可獲得高質(zhì)量語音。1.波形編碼

將音頻信號(hào)以某種模型表示,再抽出合適的模型參數(shù)和參考激勵(lì)信號(hào)進(jìn)行編碼;播放聲音時(shí),使用這些參數(shù)通過話音生成模型重構(gòu)聲音信號(hào)。特點(diǎn):算法復(fù)雜,計(jì)算量大,音質(zhì)比較差,但保密性能好,壓縮率高,常用在軍事上。2.參數(shù)編碼

將波形編碼的高質(zhì)量和參數(shù)編碼的低數(shù)據(jù)率結(jié)合在一起的編碼方式。特點(diǎn):效果較好。

3.混合編碼

利用人耳的聽覺特性,如掩蔽效應(yīng)等,在編碼過程中保留人耳可以聽到(感知)的部分,而忽略人耳聽不到(不能感知)的部分,將聽眾察覺不了的信號(hào)去除。特點(diǎn):屬于有損壓縮編碼。4.感知編碼3.2.5數(shù)字音頻的質(zhì)量音質(zhì)與數(shù)據(jù)率3.3音頻文件格式及標(biāo)準(zhǔn)CDA文件CD唱片采用的格式音質(zhì)好無法復(fù)制3.3.1波形文件格式WAV文件微軟和IBM公司聯(lián)合開發(fā)的通用音頻文件基本無數(shù)據(jù)壓縮聲音效果好數(shù)據(jù)量大VOC文件Creative公司開發(fā)聲霸卡使用的音頻文件格式帶有濃厚的硬件相關(guān)色彩MPEG運(yùn)動(dòng)圖像專家組(MovingPicturesExpertsGroup)

1988年由國(guó)際標(biāo)準(zhǔn)化組織ISO和國(guó)際電工委員會(huì)IEC聯(lián)合成立,負(fù)責(zé)開發(fā)電視圖像數(shù)據(jù)和聲音數(shù)據(jù)的編碼、解碼和同步等標(biāo)準(zhǔn)。3.3.2MPEG音頻文件格式現(xiàn)有的MPEG標(biāo)準(zhǔn):MPEG-1:數(shù)字電視標(biāo)準(zhǔn)MPEG-2:數(shù)字電視標(biāo)準(zhǔn)MPEG-4:多媒體應(yīng)用標(biāo)準(zhǔn)MPEG-7:多媒體內(nèi)容描述接口標(biāo)準(zhǔn)

全稱“MPEG-1Layer3”音頻文件。MP3聲音文件存儲(chǔ)空間只相當(dāng)于WAV文件的十分之一,但音質(zhì)與CD唱片大體接近,因此在網(wǎng)絡(luò)、可視、通信方面應(yīng)用十分廣泛。MP3聲音文件MPEG-1標(biāo)準(zhǔn)提供三個(gè)獨(dú)立的壓縮層次,各層壓縮率:3.3.3流媒體音頻文件格式主要有:RealNetwork公司的RealMedia(*.RA,*.RAM或*.RM)Microsoft的WindowsMedia(*.asf和*.wmv)Apple公司的QuickTime(*.MOV)采用流式傳輸?shù)姆绞皆贗nternet播放的各種媒體信息,如音頻、視頻、動(dòng)畫等。相對(duì)于傳統(tǒng)的下載后播放方式,流媒體使得用戶可以邊接收邊播放,減少了大量的等待時(shí)間。流媒體電子樂器數(shù)字接口(MusicalInstrumentDigitalInterface)的縮寫,一種定義MIDI電子音樂設(shè)備與計(jì)算機(jī)之間交換音樂信息的國(guó)際標(biāo)準(zhǔn)協(xié)議,規(guī)定了使用數(shù)字編碼來描述音樂樂譜的規(guī)范。常見的MIDI文件:*.MID、*.RMI等

MIDI音頻文件是一個(gè)腳本語言,它通過對(duì)“事件”編碼,產(chǎn)生聲音。一個(gè)MIDI事件包含一個(gè)音階的音調(diào)、持續(xù)時(shí)間和音量等參數(shù)。

3.3.4MIDIMIDI原理:根據(jù)傅立葉級(jí)數(shù)理論,任何一種波形信號(hào)都可被分解成若干個(gè)頻率不同的正弦波1.MIDI樂音合成方法頻率調(diào)制(FM)合成法FM聲音合成器波形也稱波形表合成法。原理:先記錄各種樂器的真實(shí)聲音,并進(jìn)行數(shù)字化處理,形成波形數(shù)據(jù),存儲(chǔ)在ROM中。

發(fā)音時(shí)通過查表找到所選樂器的波形數(shù)據(jù),再經(jīng)過調(diào)制、濾波、再合成等處理形成立體聲回放。優(yōu)點(diǎn):直觀、真實(shí),更接近自然的聲音。樂音樣本合成法2.MIDI系統(tǒng)簡(jiǎn)介

當(dāng)作樂器使用的設(shè)備,如樂器鍵盤。

MIDI控制器產(chǎn)生一套指示電子音樂合成器要做什么、怎么做(如演奏某個(gè)音符、加大音量、生成音響效果)的標(biāo)準(zhǔn)指令。MIDI控制器與其他設(shè)備的接口,包括MIDIIn輸入、MIDIOut輸出、MIDIThru傳輸三種。MIDI端口為MIDI作曲而設(shè)計(jì)的計(jì)算機(jī)程序或電子裝置,用于記錄、編輯、播放MIDI聲音文件。分硬件和軟件兩種,目前大多數(shù)為軟件音序器。音序器集成在聲卡上。

利用數(shù)字信號(hào)處理器或其他芯片產(chǎn)生音樂或聲音的電子裝置。功能:解釋MIDI文件中的指令符號(hào),然后生成所需要的聲音波形,經(jīng)放大后由揚(yáng)聲器播出。合成器兩種合成器說明:音色:聲音的音質(zhì)音調(diào):指合成器能夠播放的音符數(shù)。播放音頻的設(shè)備。揚(yáng)聲器3.MIDI樂音特點(diǎn)生成的文件比較小。容易編輯。適合重現(xiàn)打擊樂。需要長(zhǎng)時(shí)間播放高質(zhì)量音樂時(shí);需要以音樂為背景的音響效果,同時(shí)從CD-ROM中裝載其他數(shù)據(jù)時(shí);需要以音樂為背景的音響效果,同時(shí)播放波形音頻或?qū)崿F(xiàn)文-語轉(zhuǎn)換,實(shí)現(xiàn)音樂和語音同時(shí)輸出時(shí)。MIDI音樂適合的情況3.4音頻軟件的使用專業(yè)級(jí)多軌錄音和音頻處理軟件。

SyntrilliumSoftwareCorporation公司開發(fā)。

功能強(qiáng)大、效果出色。詳見下節(jié)介紹。1.CoolEditPro3.4.1常見音頻軟件簡(jiǎn)介

Windows操作系統(tǒng)附帶的聲音處理軟件,支持*.WAV格式文件,功能簡(jiǎn)單:設(shè)置不同的參數(shù)錄音;使用不同的算法壓縮聲音,向文件中添加、刪除部分聲音;更改聲音回放速度和音量;更改或轉(zhuǎn)換聲音文件格式類型;添加回音,反轉(zhuǎn)聲音。2.Windows錄音機(jī)共享軟件,小巧,即拷即用。主要功能:可將文件保存成MP3、WAV、AU、SND、RAW、AFC等多種格式;從CD、DVD、VCD及其它視頻文件中獲取聲音;以不同的采樣頻率錄制聲音信號(hào);聲音剪輯,如刪除、復(fù)制和連接聲音片段;增加特殊效果,如混響、回音、變頻、淡入淡出、反轉(zhuǎn)等。3.GoldWaveSonicFoundry公司開發(fā),具有全套的音頻處理、工具和效果制作等功能,界面簡(jiǎn)單、可操作性強(qiáng)。4.SoundForgeCakewalk。最著名的MIDI工具軟件,功能強(qiáng)大,可編輯、創(chuàng)作、調(diào)試MIDI音樂。MidisoftStudio。專業(yè)MIDI制作軟件,能夠錄制、播放MIDI等格式的樂曲,并能夠編輯可打印樂譜(五線譜)。5.MIDI音樂軟件錄制音頻文件;多文件、多音軌操作。剪切、粘貼、合并、混合音頻;提供多種特效,如降噪、回聲、延遲、調(diào)整音調(diào)等;可生成噪音、靜音、電話信號(hào)等聲音;自動(dòng)靜音檢測(cè)和刪除,自動(dòng)節(jié)拍查找;多種文件格式轉(zhuǎn)換。軟件功能3.4.2CoolEdit簡(jiǎn)介分為“波形文件編輯界面”和“多音軌編輯界面”兩種。

用功能鍵F12或切換按鈕進(jìn)行切換。CoolEdit界面1.CoolEdit界面——波形文件編輯界面1.CoolEdit界面——多音軌編輯界面2.菜單結(jié)構(gòu)2.菜單結(jié)構(gòu)3.5音頻效果處理技巧3.5.1常用音頻編輯命令1.聲音的插入、混合和替換插入:將數(shù)據(jù)插入到當(dāng)前文件插入點(diǎn)之后,原波形文件數(shù)據(jù)后移。替換:被插入的數(shù)據(jù)替換原波形數(shù)據(jù)?;旌希罕徽迟N的數(shù)據(jù)與當(dāng)前選定的部分疊加。操作步驟拖動(dòng)鼠標(biāo),選擇需要混縮粘貼的聲音波形,單擊【編輯】—【復(fù)制】;單擊【編輯】—【混合粘貼】,打開【混縮粘貼】對(duì)話框?!揪庉嫛俊巨D(zhuǎn)換音頻格式】2.將單聲道轉(zhuǎn)為立體聲3.調(diào)整采樣率【編輯】—【調(diào)整采樣率】3.5.2常用音效命令1.菜單欄【效果】的常用命令反相:將波形振幅交換。靜音:產(chǎn)生無聲音的波形倒置:把聲波從后往前,反向播放反相前反相后【效果】—【變速變調(diào)】—【變速器】2.改變聲音頻率和節(jié)拍預(yù)設(shè)框【效果】—【波形振幅】—【漸變】恒量改變:改變聲波振幅,即改變音量淡入淡出:聲音波形振幅逐漸增大或減小3.調(diào)節(jié)音量大小【效果】→【噪音消除】可降低背景噪音,并進(jìn)行破音修復(fù)等操作。4.特殊音效5.噪音消除【效果】—【波形振幅】—【漸變】房間回聲:產(chǎn)生在房間中的回聲效果延遲:產(chǎn)生一個(gè)滯后播放的聲音3.5.3特殊音頻的生成菜單欄【效果】-【生成】靜音DTMF信號(hào)音調(diào)(Chord)噪波(白噪)音調(diào)(A440)本章小結(jié)本章介紹了聲音的基礎(chǔ)知識(shí),如聲音的基本參數(shù)和人的聽覺特性等。詳細(xì)介紹了數(shù)字化音頻的過程和一些關(guān)鍵技術(shù),如采樣、量化的概念,幾種常見的音頻編碼技術(shù)等。此外還介紹了一些常見的音頻文件格式,并對(duì)音頻處理軟件CoolEdit做了詳細(xì)介紹。思考與練習(xí)一、選擇題1.下述聲音分類中質(zhì)量最好的是

。A.?dāng)?shù)字激光唱盤

B.調(diào)頻無線電廣播

C.調(diào)幅無線電廣播

D.電話2.下面哪個(gè)不是常用的音頻文件的后綴?A.WAVB.MIDC.MP3D.DOC3.下列采集的波形聲音

的質(zhì)量最好。A.單聲道、8位量化、22.05kHz采樣頻率

B.雙聲道、8位量化,44.1kHz采樣頻率C.單聲道、16位量化、22.05kHz采樣頻率

D.雙聲道、16位量化、44.1kHz采樣頻率4.在數(shù)字音頻信息獲取與處理過程中,下列順序正確的是

。A.A/D變換、采樣、壓縮、存儲(chǔ)、解壓縮、D/A變換B.采樣、壓縮、A/D變換、存儲(chǔ)、解壓縮、D/A

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論