多媒體音頻技術(shù)優(yōu)秀課件_第1頁
多媒體音頻技術(shù)優(yōu)秀課件_第2頁
多媒體音頻技術(shù)優(yōu)秀課件_第3頁
多媒體音頻技術(shù)優(yōu)秀課件_第4頁
多媒體音頻技術(shù)優(yōu)秀課件_第5頁
已閱讀5頁,還剩76頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

多媒體音頻技術(shù)3.1音頻基礎(chǔ)3.1.1聲音的基本概念聲音在物理學(xué)上稱之為聲波,是通過一定介質(zhì)(如空氣、水等)傳播的連續(xù)的振動(dòng)的波。聲波引起某處媒質(zhì)壓強(qiáng)的變化量稱為該處的聲壓。聲音的強(qiáng)弱體現(xiàn)在聲波的振幅上音調(diào)的高低體現(xiàn)在聲波的周期和頻率上。2.聲音的頻率聲源每秒振動(dòng)的次數(shù)稱為該聲源的“頻率”。用音頻來表示聲音信號的頻率,單位為赫茲(Hz)。頻率對于聲音來說是個(gè)非常重要的概念,不同的聲音有不同的頻率范圍,人耳只能聽到頻率范圍在20Hz~20kHz之間的聲音,低于20Hz的次聲和高于20kHz的超聲都聽不到。次聲波可聽聲波超聲波20Hz20kHzf(Hz)聲音質(zhì)量的標(biāo)準(zhǔn)人耳對不同頻率的敏感程度有很大差別對中頻段(2kHz~4kHz)最為敏感,幅度很低的信號都能被人耳聽到;對低頻區(qū)和高頻區(qū)較不敏感,能被人耳聽到的信號幅度比中頻段要高得多。

1020502003.4k7k15k20kCD-DAFM廣播AM廣播電話f(Hz)多媒體數(shù)據(jù)壓縮的國際標(biāo)準(zhǔn)音頻壓縮標(biāo)準(zhǔn)音頻信號是多媒體信息的重要組成部分。目前,業(yè)界公認(rèn)的聲音質(zhì)量標(biāo)準(zhǔn)分為4級,即數(shù)字激光唱盤CD-DA質(zhì)量,其信號帶寬為10Hz~20kHz;調(diào)頻廣播FM質(zhì)量,其信號帶寬為20Hz~l5kHz;調(diào)幅廣播AM質(zhì)量,其信號帶寬為50Hz~7kHz;電話的話音質(zhì)量,其信號帶寬為200Hz~3.4kHz??梢?,數(shù)字激光唱盤的聲音質(zhì)量最高,電話的話音質(zhì)量最低。數(shù)字音頻壓縮技術(shù)標(biāo)準(zhǔn)分為電話語音壓縮、調(diào)幅廣播語音壓縮、高保真立體聲音頻壓縮三種。3.聲音的傳播方向當(dāng)輻射出來的聲波波長比聲源的尺寸大時(shí),聲波比較均勻地向各方向傳播;當(dāng)輻射出來的聲波波長小于聲源的尺寸時(shí),聲波集中地向正前方一個(gè)尖銳的圓錐體范圍內(nèi)傳播。4.聲音的三要素聲音效果的三要素:音調(diào)、音強(qiáng)、音色。音調(diào):指聲音的高低。音調(diào)的高低,主要取決于聲波頻率的高低。頻率越高,音調(diào)越高,反之亦然。在使用音頻處理軟件對聲音的頻率進(jìn)行調(diào)整時(shí),其音調(diào)也會隨之產(chǎn)生變化。例如,男子發(fā)音,其頻率約在90~140Hz之間,其音調(diào)較低;女子發(fā)音的頻率約在270~550Hz之間,其音調(diào)較高。音強(qiáng):是指聲音的強(qiáng)度,又稱聲音的響度,由聲波振動(dòng)的振幅決定。它是人耳感受到的聲音強(qiáng)弱,是人對聲音大小的一個(gè)主觀感覺量。音色:即聲音的品質(zhì),它由泛音的多少、泛音的頻率和振幅決定。例如,不同的樂器在基本振動(dòng)頻率相同的情況下,仍然可以區(qū)分各自的特色,就是因?yàn)樗囊羯煌?.音質(zhì)“音質(zhì)”是聲音的質(zhì)量,音質(zhì)的好壞與音色的頻率范圍有關(guān)。影響音質(zhì)的因素對于數(shù)字音頻信號,音質(zhì)的好壞與數(shù)據(jù)采樣頻率和數(shù)據(jù)位數(shù)有關(guān)。音質(zhì)與聲音還原設(shè)備有關(guān)。音質(zhì)與信號噪聲比有關(guān)。音頻 數(shù)字音頻(Audio)可分為波形聲音語音和音樂。

2.2多媒體音頻 音頻是多媒體技術(shù)的重要特征之一,是攜帶信息的重要媒體。在計(jì)算機(jī)多媒體技術(shù)中,音頻的種類主要有波形音頻、MIDI音頻和CD唱盤音頻。

2.2.1波形音頻

2.2.2MIDI音頻

2.2.3CD-DA唱盤

2.2.4聲卡返回從模擬到數(shù)字聲源聲波傳聲器模擬電信號數(shù)字聲音聲音輸入到計(jì)算機(jī)的過程

2.2.1波形音頻

1.聲音的基本特征

2.?dāng)?shù)字音頻

1.聲音的基本特征 聲音是由空氣中分子的振動(dòng)而產(chǎn)生的。自然界的聲音是一個(gè)隨時(shí)間而變化的連續(xù)信號,可近似地看成是一種周期性的函數(shù)。通常用模擬的連續(xù)波形描述聲波的形狀,單一頻率的聲波可用一條正弦波表示,如下圖所示。振幅周期基線聲波是隨時(shí)間連續(xù)變化的物理量,它有3個(gè)重要指標(biāo):振幅——波的高低幅度,表示聲音的強(qiáng)弱;周期——兩個(gè)相鄰波之間的時(shí)間長度;頻率——每秒振動(dòng)的次數(shù),以Hz為單位。 基線是測量模擬信號的基準(zhǔn)點(diǎn)。聲波的振幅表示聲音信號的強(qiáng)弱程度。聲波的頻率反映出聲音的音調(diào),聲音細(xì)尖表示頻率高,聲音粗低表示頻率低。 振幅和頻率不變的聲音信號,稱為單音。單音一般只能由專用電子設(shè)備產(chǎn)生。在日常生活中,我們聽到的自然界的聲音一般都屬于復(fù)音,

2.?dāng)?shù)字音頻 聲波是隨時(shí)間而連續(xù)變化的物理量,通過能量轉(zhuǎn)換裝置,可用隨聲波變化而改變的電壓或電流信號來模擬。以模擬電壓的幅度來表示聲音的強(qiáng)弱。 為使計(jì)算機(jī)能處理音頻,必須對聲音信號數(shù)字化。(1).采樣和量化(2).影響數(shù)字音頻質(zhì)量的技術(shù)參數(shù)(3).數(shù)字音頻文件的存儲量(4).數(shù)字音頻信號的編碼3.1.2聲音的數(shù)字化奈奎斯特(Nyquist)理論采樣頻率與聲音頻率之間有一定的關(guān)系,只有采樣頻率高于聲音信號最高頻率的兩倍時(shí),才能把數(shù)字信號表示的聲音還原成為原來的聲音。采樣量化聲音的模擬信號聲音的數(shù)字信號編碼(1).采樣和量化(c)采樣信號的量化(a)模擬音頻信號(b)音頻信號的采樣數(shù)字化音頻的過程如下圖所示。 模擬聲音在時(shí)間上是連續(xù)的,或稱連續(xù)時(shí)間函數(shù)x(t)。用計(jì)算機(jī)處理這些信號時(shí),必須先對連續(xù)信號采樣,即按一定的時(shí)間間隔(T)在模擬聲波上截取一個(gè)振幅值(通常為反映某一瞬間聲波幅度的電壓值),得到離散信號x(nT)(n為整數(shù))。T稱采樣周期,1/T稱為采樣頻率。 為了把采樣得到的離散序列信號x(nT)存入計(jì)算機(jī),必須將采樣值量化成有限個(gè)幅度值的集合x(nT),采樣值用二進(jìn)制數(shù)字表示的過程稱為量化編碼。(2).影響數(shù)字音頻質(zhì)量的技術(shù)參數(shù) 對模擬音頻信號進(jìn)行采樣量化編碼后,得到數(shù)字音頻。數(shù)字音頻的質(zhì)量取決于采樣頻率、量化位數(shù)和聲道數(shù)三個(gè)因素。1).采樣頻率 采樣頻率是指一秒鐘時(shí)間內(nèi)采樣的次數(shù)。在計(jì)算機(jī)多媒體音頻處理中,采樣頻率通常采用三種:11.025KHz(語音效果)、22.05KHz(音樂效果)、44.1KHz(高保真效果)。常見的CD唱盤的采樣頻率即為44.1KHz。2).量化位數(shù) 量化位數(shù)也稱“量化精度”,是描述每個(gè)采樣點(diǎn)樣值的二進(jìn)制位數(shù)。就是通常所說的聲卡的位數(shù)。例如,8位量化位數(shù)表示每個(gè)采樣值可以用28即256個(gè)不同的量化值之一來表示,而16位量化位數(shù)表示每個(gè)采樣值可以用216即65536個(gè)不同的量化值之一來表示。常用的量化位數(shù)為8位、12位、16位、32位。量化是將經(jīng)過采樣得到的離散數(shù)據(jù)轉(zhuǎn)換成二進(jìn)制數(shù)的過程。以下圖所示的原始模擬波形為例進(jìn)行采樣和量化。假設(shè)采樣頻率為1000次/秒,即每1/1000秒A/D轉(zhuǎn)換器采樣一次,其幅度被劃分成0到9共10個(gè)量化等級,并將其采樣的幅度值取最接近0~9之間的一個(gè)數(shù)來表示,如下圖所示。圖中每個(gè)正方形表示一次采樣。

D/A轉(zhuǎn)換器從上圖得到的數(shù)值中重構(gòu)原來信號時(shí),得到下圖中藍(lán)色(直線段)線段所示的波形。從圖中可以看出,藍(lán)色線與原波形(紅色線)相比,其波形的細(xì)節(jié)部分丟失了很多。這意味著重構(gòu)后的信號波形有較大的失真。

失真在采樣過程中是不可避免的,如何減少失真呢?可以直觀地看出,我們可以把上圖中的波形劃分成更為細(xì)小的區(qū)間,即采用更高的采樣頻率。同時(shí),增加量化精度,以得到更高的量化等級,即可減少失真的程度。在下圖(左)中,采樣率和量化等級均提高了一倍,分別為2000次/秒和20個(gè)量化等級。在下圖(右)中,采樣率和量化等級再提高了一倍,分別達(dá)到4000次/秒和40個(gè)量化等級。從圖中可以看出,當(dāng)用D/A轉(zhuǎn)換器重構(gòu)原來信號時(shí)(圖中的輪廓線),信號的失真明顯減少,信號質(zhì)量得到了提高。SamplingResolution8bitSamplingFrequency11KHz+127…+64+320-32-64…-12801001010Comparison:SamplingResolution16bitSamplingFrequency22KHz+32767…+512+1280-128-512…-327680010101100011000Comparison:3).聲道數(shù) 聲音通道的個(gè)數(shù)稱為聲道數(shù),是指一次采樣所記錄產(chǎn)生的聲音波形個(gè)數(shù)。記錄聲音時(shí),如果每次生成一個(gè)聲波數(shù)據(jù),稱為單聲道;每次生成兩個(gè)聲波數(shù)據(jù),稱為雙聲道(立體聲)。隨著聲道數(shù)的增加,所占用的存儲容量也成倍增加。雙聲道立體聲2.1聲道環(huán)繞立體聲5.1聲道環(huán)繞立體聲(3).數(shù)字音頻文件的存儲量 以字節(jié)為單位,模擬波形聲音被數(shù)字化后音頻文件的存儲量(假定未經(jīng)壓縮)為:存儲量=采樣頻率×量化位數(shù)/8×聲道數(shù)×?xí)r間

例如,用44.1KHz的采樣頻率進(jìn)行采樣,量化位數(shù)選用16位,則錄制1秒的立體聲節(jié)目,其波形文件所需的存儲量為:

44100×16/8×2×1=176400(字節(jié))質(zhì)量等級采樣頻率/KHz量化精度/b聲道數(shù)/個(gè)數(shù)碼率/kbps記錄內(nèi)容電話88單聲道64簡單的聲音AM(可接受的音樂)11.0258單聲道88.2長音樂片段、高質(zhì)量語音FM(收音音質(zhì))22.0516雙聲道705.6短的高質(zhì)量音樂片段CD(CD音質(zhì))44.116雙聲道1411.2高保真音樂和聲音DAT(廣播質(zhì)量)4816雙聲道1536記錄數(shù)字媒體的廣播使用(4).數(shù)字音頻信號的編碼 一般情況下,聲音的制作是使用麥克風(fēng)或錄音機(jī)來產(chǎn)生,再由聲卡上的WAVE合成器的(模/數(shù)轉(zhuǎn)換器)對模擬音頻采樣后,量化編碼為一定字長的二進(jìn)制序列,并在計(jì)算機(jī)內(nèi)傳輸和存儲。在數(shù)字音頻回放時(shí),再由數(shù)字到模擬的轉(zhuǎn)化器(數(shù)/模轉(zhuǎn)換器)解碼可將二進(jìn)制編碼恢復(fù)成原始的聲音信號,通過音響設(shè)備輸出。如下圖所示。模擬音頻信號輸入采樣/量化編碼傳輸/存儲解碼播放3.1.3聲音文件的格式數(shù)字音頻數(shù)據(jù)是以文件的形式保存在計(jì)算機(jī)中的。數(shù)字音頻的文件格式主要有CD、WAVE、MP3、WMA、MIDI等。目錄1.4.1聲音文件的基本格式1.WAV文件3.VOC文件2.MIDI4.MOD文件WAV文件

Windows所用的標(biāo)準(zhǔn)數(shù)字音頻稱為波形文件,文件的擴(kuò)展名是“.WAV”,它記錄了對實(shí)際聲音進(jìn)行采樣的數(shù)據(jù)。它可以重現(xiàn)各種聲音,但產(chǎn)生的文件很大。 采用的軟件壓縮方法主要有ACM和PCM等。人的講話聲使用8位量化級11.025KHz采樣率就能較好的還原。CD音質(zhì)需要16位量化級、44.1KHz的采樣率。MIDI

MIDI文件的擴(kuò)展名為“.MID”,它與波形文件不同,記錄的不是聲音本身,而是將每個(gè)音符記錄為一個(gè)數(shù)字,因此比較節(jié)省空間,可以滿足長時(shí)間音樂的需要。

MIDI的主要限制是缺乏重現(xiàn)真實(shí)自然的能力。采用波表法進(jìn)行音樂合成的聲音卡可以使MIDI音樂的質(zhì)量大大提高。

VOC文件:VOC文件也是一種數(shù)字聲音文件,主要用于DOS程序。與波形文件相似,可以方便地互相轉(zhuǎn)換。

MOD文件:MOD文件是移植過來的MODULE音樂。它主要由一些業(yè)余音樂愛好者通過網(wǎng)絡(luò)和BBS支持。聽覺系統(tǒng)的感知特性掩蔽效應(yīng)一種頻率的聲音阻礙聽覺系統(tǒng)感受另一種頻率的聲音的現(xiàn)象前者稱為掩蔽聲音(maskingtone)后者稱為被掩蔽聲音(maskedtone)掩蔽可分成頻域掩蔽和時(shí)域掩蔽頻域掩蔽一個(gè)強(qiáng)純音掩蔽在其附近同時(shí)發(fā)聲的弱純音的特性,也稱同時(shí)掩蔽(simultaneousmasking).聽覺系統(tǒng)的感知特性圖

頻域掩蔽聽覺系統(tǒng)的感知特性圖

不同純音的掩蔽效應(yīng)曲線圖中的一組曲線表示為250Hz,1kHz和4kHz純音的掩蔽效應(yīng),它們的聲強(qiáng)均為60dB250Hz,1kHz和4kHz附近,對其他純音的掩蔽效果最明顯低頻純音可有效地掩蔽高頻純音,相反則不明顯聽覺系統(tǒng)的感知特性時(shí)域掩蔽在時(shí)間上相鄰的聲音之間的掩蔽現(xiàn)象一個(gè)強(qiáng)掩蔽音出現(xiàn)前、同時(shí)存在時(shí)或消失后的掩蔽效果.同時(shí)掩蔽(simultaneousmasking):信號和掩蔽音同時(shí)產(chǎn)生的現(xiàn)象滯后掩蔽(post-masking):信號出現(xiàn)在掩蔽音消失后出現(xiàn)的現(xiàn)象,可以持續(xù)50~200ms超前掩蔽(pre-masking):信號出現(xiàn)在掩蔽音出現(xiàn)之前產(chǎn)生的現(xiàn)象。雖然對超前掩蔽有許多研究報(bào)告,但這種現(xiàn)象依然令人費(fèi)解。超前掩蔽很短,通常只有大約2~20ms產(chǎn)生時(shí)域掩蔽的主要原因人的大腦處理信息需要花費(fèi)一定的時(shí)間聽覺系統(tǒng)的感知特性圖

時(shí)域掩蔽感知編碼

(perceptualaudiocoding)頻率為10~20000Hz的聲音數(shù)據(jù)壓縮技術(shù)依據(jù)是人耳朵的聽覺特性方法是使用“心理聲學(xué)模型”來取消人耳感覺不到的聲音數(shù)據(jù)應(yīng)用于MPEG-1Audio、MPEG-2Audio、MPEG-2AAC(AdvancedAudioCoding)和MPEG-4AudioMPEG聲音主要采納兩種感知編碼算法感知子帶編碼(perceptualsub-bandcoding)杜比實(shí)驗(yàn)室(DolbyLaboratories)開發(fā)的杜比數(shù)字(DolbyDigital)MPEG聲音的壓縮依據(jù)聽覺系統(tǒng)存在聽覺閾值電平低于閾值電平的信號聽不到,因此可把這部分信號去掉聽覺閾值的大小隨聲音頻率的改變而改變大多數(shù)人的聽覺系統(tǒng)對2~5kHz之間的聲音最敏感聽覺掩飾特性聽覺閾值電平會隨聽到的不同頻率的聲音而發(fā)生變化例如,1000Hz和1100Hz的聲音同時(shí)存在,前者的強(qiáng)度大于后者18dB,在這種情況下,1100Hz的聲音就聽不到MPEG-1AudioMPEG-1Audio編碼器MPEG-1Audio(ISO/IEC11172-3)是世界上第一個(gè)高保真聲音數(shù)據(jù)壓縮標(biāo)準(zhǔn),得到極其廣泛的應(yīng)用編碼器的輸入信號為線性PCM信號

采樣率為32,44.1或48kHz編碼器的輸出信號為32~384kbpsMPEG-1Audio定義了三個(gè)獨(dú)立壓縮層次第1層—MP1(MPEGAudioLayer1)僅利用頻域掩蔽特性,典型的壓縮比為1:4,相應(yīng)的數(shù)據(jù)率為384kbps算法復(fù)雜度最低第2層—MP2(MPEGAudioLayer2)利用頻域掩蔽特性和時(shí)間掩蔽特性,典型的壓縮比為1:6~1:8,數(shù)據(jù)率為256~192kbps算法復(fù)雜度中等第3層—MP3(MPEGAudioLayer3)利用頻域掩蔽特性、時(shí)間掩蔽特性和臨界頻帶特性,典型的壓縮比為1:10~1:12,相應(yīng)的數(shù)據(jù)率為128~112kbps,聲音質(zhì)量接近CD-DA算法復(fù)雜度最高M(jìn)P3MP3是MPEGAudioLayer3的縮寫,它是一種超級聲音文件的壓縮方法,具有文件小、音質(zhì)佳的特點(diǎn)。MPEG是由音頻和視頻兩部分組成的,可以分別進(jìn)行壓縮。MPEG在音頻上的壓縮可以分為MPEGLayer1、MPEGLayer2和MPEGLayer3(如表所示)。MP4壓縮技術(shù)MP4最初是一種音頻格式,使用的是MPEG-2AAC(AdvancedAudioCoding,先進(jìn)音頻編碼)技術(shù)。它的特點(diǎn)是音質(zhì)更加完美而壓縮比更大(15:1~20:1)。MPEG-2AAC在采樣頻率為8~96kHz時(shí)可提供1~48個(gè)聲道可選范圍的高質(zhì)量音頻編碼。AAC適用于從比特率為8kb/s單聲道的電話語音音質(zhì)到160kb/s多聲道超高質(zhì)量音頻信號范圍內(nèi)的編碼,并且允許對多媒體進(jìn)行編碼/解碼,增加了諸如對立體聲的完美再現(xiàn)、比特流效果音掃描、多媒體控制、降噪等MP3沒有的特性,使得在音頻壓縮后仍能完美的再現(xiàn)CD的音質(zhì)。MP4的特點(diǎn)MP4除了采用了先進(jìn)的音頻壓縮技術(shù)之外,最重要的是,它采用特殊的技術(shù)實(shí)現(xiàn)了數(shù)碼版權(quán)保護(hù),這是MP3所無法比擬的。由于AAC有版權(quán)保護(hù)功能,要使自己的播放器支持AAC,除了需要支付一定的版權(quán)費(fèi)或?qū)@M(fèi),采用AAC編碼音頻文件的來源也是個(gè)問題,不像MP3那么開放,網(wǎng)上來源極少,這使得MP4推廣難度大大增加。目前市場上的MP4多數(shù)是多媒體播放器,能夠播放AAC的很少,這種播放器其實(shí)不算是MP4,本質(zhì)上是MP3,視頻播放只不過是其附件功能。高保真立體聲音頻壓縮標(biāo)準(zhǔn)

高保真立體聲音頻信號的頻率范圍為50Hz~20kHz,在44.1kHz采樣頻率下用16bit量化,信號速率為每聲道705kb/s。目前國際上比較成熟的高保真立體聲音頻壓縮標(biāo)準(zhǔn)為MPEG音頻。MPEG是由音頻和視頻兩部分組成的,可以分別進(jìn)行壓縮。 數(shù)字波形文件數(shù)據(jù)量大,數(shù)字音頻的編碼必須采用高效的數(shù)據(jù)壓縮編碼技術(shù)。音頻信號能夠被壓縮編碼的依據(jù)有兩個(gè),一是聲音信號存在著數(shù)據(jù)冗余;二是利用人的聽覺特性來降低編碼率,人的聽覺具有一個(gè)強(qiáng)音能抑制一個(gè)同時(shí)存在的弱音現(xiàn)象,這樣就可以抑制與信號同時(shí)存在的量化噪聲;另外人耳對低頻端比較敏感,而對高頻端不太敏感,由此引出了“子帶編碼技術(shù)”。 音頻信號的壓縮編碼方式可分為波形編碼參數(shù)編碼和混合編碼三種。音頻信號壓縮技術(shù)評價(jià)多媒體數(shù)據(jù)壓縮方法的指標(biāo)評價(jià)多媒體數(shù)據(jù)壓縮方法有3個(gè)主要指標(biāo):1.壓縮比2.壓縮質(zhì)量(失真度)3.壓縮與解壓的速度

1).波形編碼 波形編碼的算法簡單,易于實(shí)現(xiàn),可獲得高質(zhì)量的語音。常見的三種波形編碼方法為:脈沖編碼調(diào)制(PCM),實(shí)際為直接對聲音信號作A/D轉(zhuǎn)換。只要采樣頻率足夠高,量化位數(shù)足夠多,就能使解碼后恢復(fù)的聲音信號有很高的質(zhì)量。差分脈沖編碼調(diào)制(DPCM),即只傳輸聲音預(yù)測值和樣本值的差值以此降低音頻數(shù)據(jù)的編碼率。自適應(yīng)差分編碼調(diào)制(ADPCM),是DPCM方法的進(jìn)一步改進(jìn),通過調(diào)整量化步長,對不同頻段設(shè)置不同的量化字長,使數(shù)據(jù)得到進(jìn)一步的壓縮。2).參數(shù)編碼 參數(shù)編碼方法通過建立起聲音信號的產(chǎn)生模型,將聲音信號用模型參數(shù)來表示,再對參數(shù)進(jìn)行編碼,在聲音播放時(shí)根據(jù)參數(shù)重建聲音信號。參數(shù)編碼法算法復(fù)雜,計(jì)算量大,壓縮率高,但還原聲音的質(zhì)量不高。3).混合編碼 混合編碼是把波形編碼的高質(zhì)量和參數(shù)編碼的低數(shù)據(jù)率結(jié)合在一起,取得了較好效果。音頻編碼標(biāo)準(zhǔn)和算法編碼類型算法名稱數(shù)據(jù)率標(biāo)準(zhǔn)應(yīng)用質(zhì)量波形編碼PCM均勻量化公共網(wǎng)ISDN配音4.0-4.5μ(A)μ(A)64kbit/sG.711APCM自適應(yīng)量化DPCM差值量化ADPCM自適應(yīng)差值量化32kbit/sG.721SB-ADPCM子帶一自適應(yīng)差值量化64kbit/sG.722參數(shù)編碼LPC線性預(yù)測編碼2.4kbit/s保密電話2.5-3.5混合編碼CELPC碼激勵(lì)LPC4.8kbit/s移動(dòng)通信3.7-4.0VSELP矢量和激勵(lì)LPC8kbit/s語音郵件RPE-CELP長時(shí)預(yù)測規(guī)則碼激勵(lì)13.2kbit/sISDNLD-CELP低延時(shí)碼激勵(lì)LPC16kbit/G.728MPEG多子帶感知編碼128kbit/sCD5.0預(yù)測編碼

通常,圖像中局部區(qū)域的像素是高度相關(guān)的,因此可以用先前像素的有關(guān)灰度知識來對當(dāng)前像素的灰度進(jìn)行估計(jì),這就是預(yù)測。如果預(yù)測是正確的,則不必對每一個(gè)像素的灰度都進(jìn)行壓縮,而是把預(yù)測值與實(shí)際像素值之間的差值經(jīng)過熵編碼后發(fā)送到接收端,接收端通過預(yù)測值+差值信號來重建原像素。預(yù)測編碼可分為線性預(yù)測編碼和非線性預(yù)測編碼。前者常被稱為差分脈沖編碼調(diào)制,即DPCM(DifferentialPulseCodeModulation)。DPCM的原理框圖(a)DPCM編碼框圖(b)DPCM譯碼框圖DPCM編碼示例DPCM系統(tǒng)如圖所示,預(yù)測器的預(yù)測值為前一個(gè)樣值(圖中D表示單位延遲)。假設(shè)輸入信號已經(jīng)量化,差值不再進(jìn)行量化。若DPCM系統(tǒng)的輸入為{0,1,2,1,1,2,3,3,4,4,…},則編碼過程如下:

2.2.2MIDI音頻

MIDI音頻是將電子樂器鍵盤上的彈奏信息記錄下來,包括鍵名、力度、時(shí)值長短等,是樂譜的一種數(shù)字式描述。當(dāng)需要播放時(shí),只需從相應(yīng)的MIDI文件中讀出MIDI消息,生成所需要的聲音波形,經(jīng)放大后由揚(yáng)聲器輸出。如下圖所示。合成器揚(yáng)聲器MIDI鍵盤MIDI接口音序器

1.什么是MIDI

2.MIDI設(shè)備配置

3.MIDI文件的特點(diǎn)

MIDI是MusicalInstrumentDigitalInterface(樂器數(shù)字接口)的縮寫。MIDI是一種國際標(biāo)準(zhǔn),是計(jì)算機(jī)和MIDI設(shè)備之間進(jìn)行信息交換的一整套規(guī)則,包括各種電子樂器之間傳送數(shù)據(jù)的通信協(xié)議。

1.什么是MIDIMIDI與普通音頻的區(qū)別MIDI與普通音頻的本質(zhì)區(qū)別是攜帶的信息不同。MIDI本身并不是音樂,不能發(fā)出聲音。它是一個(gè)協(xié)議,只包含用于產(chǎn)生特定聲音的指令,而這些指令包括調(diào)用何種MIDI設(shè)備的音色、聲音的強(qiáng)弱及持續(xù)的時(shí)間等。計(jì)算機(jī)把這些指令交由聲卡去合成相應(yīng)的聲音(如依指令發(fā)出鋼琴聲或小提琴聲等)。

MIDI設(shè)備就是處理MIDI信息所需的硬件設(shè)備,其基本組成包括:

2.MIDI設(shè)備配置(1).MIDI端口(2).MIDI鍵盤(3).音序器(Sequencer)(4).合成器(1).MIDI端口 一臺MID設(shè)備可以有一至三個(gè)MIDI端口,分別稱為MIDIIn、MIDIOut、MIDIThru。它們的作用是:

MIDIIn:接收來自其它MIDI設(shè)備的MIDI信息。

MIDIOut:發(fā)送本設(shè)備生成的MIDI信息到其它設(shè)備。

MIDIThru:將從MIDIIn端口傳來的信息轉(zhuǎn)發(fā)到相連的另一臺MIDI設(shè)備上。(2).MIDI鍵盤

MIDI鍵盤是用于MIDI樂曲演奏的,MIDI鍵盤本身并不發(fā)出聲音,當(dāng)作曲人員觸動(dòng)鍵盤上的按鍵時(shí),就發(fā)出按鍵信息,所產(chǎn)生的僅僅是MIDI音樂消息,從而由音序器錄制生成MIDI文件。(3).音序器(Sequencer) 用于記錄、編輯、播放MIDI的聲音文件,音序器有以硬件形式提供的,目前大多為軟件音序器。音序器可捕捉MIDI消息,將其存入MIDI文件,MIDI文件擴(kuò)展名為.MID。音序器還可編輯MIDI文件。(4).合成器

MIDI文件的播放是通過MIDI合成器,合成器解釋MIDI文件中的指令符號,生成所需要的聲音波形,經(jīng)放大后由揚(yáng)聲器輸出,聲音的效果比較豐富。1).MIDI合成方式

MIDI合成方式主要有調(diào)頻合成(FM)和波形表合成(WaveTable)兩種方式。調(diào)頻合成方式,其原理是根據(jù)傅立葉級數(shù)而來。波形表合成的原理是ROM中已存儲著各種實(shí)際樂器的聲音采樣,合成時(shí)以查表方式調(diào)用這些樣本將其還原回放。MIDI合成器是利用數(shù)字信號處理器(DSP)或其他芯片來產(chǎn)生音樂或聲音的電子裝置。利用合成器產(chǎn)生MIDI音樂的主要方法有調(diào)頻合成法波形表合成法目錄2).硬波形表合成與軟波形表合成

硬波表合成方式的數(shù)字聲音樣本被保存在ROM內(nèi)或RAM(可動(dòng)態(tài)更換)內(nèi)。而軟波表的數(shù)字化樣本保存于系統(tǒng)主存中,合成運(yùn)算靠CPU完成,最終的音頻

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論