秋季養(yǎng)生之美顏汁_第1頁
秋季養(yǎng)生之美顏汁_第2頁
秋季養(yǎng)生之美顏汁_第3頁
秋季養(yǎng)生之美顏汁_第4頁
秋季養(yǎng)生之美顏汁_第5頁
已閱讀5頁,還剩93頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第2章 音頻處理(chl)技術(shù)(二)西安交通大學(xué)計(jì)算機(jī)教學(xué)實(shí)驗(yàn)中心(zhngxn)2007多媒體技術(shù)及應(yīng)用基礎(chǔ)QQ寶 共九十八頁問題(wnt)的提出數(shù)字音頻信息如何處理?用什么工具可以(ky)處理?有哪些處理?我能處理嗎?2共九十八頁二、數(shù)字音頻數(shù)字音頻原理(yunl)回顧3共九十八頁聲音(shngyn)的數(shù)字化 聲音的數(shù)字化 數(shù)字化就是將連續(xù)信號(hào)變成離散信號(hào)。對(duì)音頻信號(hào),首先在時(shí)間上離散,取有限個(gè)時(shí)間點(diǎn),稱為采樣。然后(rnhu)在幅度上離散,取有限個(gè)幅度值,稱為量化。再將得到的數(shù)據(jù)表示成計(jì)算機(jī)容易識(shí)別的格式,稱為編碼。 4共九十八頁聲音(shngyn)的A/D與D/A轉(zhuǎn)換模擬信號(hào)很容易受到

2、電子干擾,因此用數(shù)字信息代替聲音信號(hào)成為音頻信息處理的一種方法。A/D轉(zhuǎn)換和D/A轉(zhuǎn)換技術(shù)便應(yīng)運(yùn)而生。A表示Analog”(類比、模擬),D代表“Digital ”(數(shù)字(shz)),A/D轉(zhuǎn)換就是把模擬電信號(hào)轉(zhuǎn)換成由“0”和“1”組成數(shù)字(shz)信號(hào)的過程。這樣做的好處是顯而易見的,聲音存儲(chǔ)質(zhì)量得到了加強(qiáng),數(shù)字化的聲音信息使計(jì)算機(jī)能夠進(jìn)行識(shí)別、處理和壓縮,這也就是為什么如今磁帶逐漸被淘汰,CD唱片卻趨于流行的原因。A/D轉(zhuǎn)換的一個(gè)關(guān)鍵步驟是聲音的采樣和量化,得到數(shù)字音頻信號(hào),它在時(shí)間上是不連續(xù)的離散信號(hào)。5共九十八頁P(yáng)CM編碼(bin m)1939年法國(guó)工程師Alec Reeves發(fā)明了將

3、連續(xù)的模擬信號(hào)變換成時(shí)間和幅度都離散的二進(jìn)制碼代表的脈沖編碼調(diào)制信號(hào)(Pulse Code Modulation-PCM),并申請(qǐng)了專利。P首先開始應(yīng)用于電話系統(tǒng),但一直到年美國(guó)(mi u)Bell實(shí)驗(yàn)室才為制成了國(guó)際上第一套商用電話系統(tǒng)(系統(tǒng)),這標(biāo)志了通信開始步入數(shù)字化。PCM 編碼是對(duì)連續(xù)語音信號(hào)進(jìn)行空間采樣、幅度值量化及用適當(dāng)碼字將其編碼的總稱。6共九十八頁P(yáng)CM編碼主要(zhyo)優(yōu)點(diǎn) 抗干擾能力強(qiáng);失真(sh zhn)??;傳輸特性穩(wěn)定,尤其是遠(yuǎn)距離信號(hào)再生中繼時(shí)噪聲不累積,而且可以采用壓縮編碼、糾錯(cuò)編碼和保密編碼等來提高系統(tǒng)的有效性、可靠性和保密性。 7共九十八頁 A/D 和D/A

4、轉(zhuǎn)換(zhunhun)示意圖 8位可編程A/D轉(zhuǎn)換(zhunhun)芯片示意圖8共九十八頁模擬聲音(shngyn)信號(hào)的采樣和量化過程示意 模擬聲音信號(hào)的波形采樣得到的離散時(shí)間信號(hào)再量化得到的數(shù)字信號(hào)9共九十八頁數(shù)字音頻的技術(shù)指標(biāo) 采樣(ci yn)頻率采樣精度聲道數(shù)音頻數(shù)據(jù)傳輸率編碼算法與音頻數(shù)據(jù)壓縮比10共九十八頁采樣(ci yn)頻率采樣頻率是指一秒鐘采樣的次數(shù)。采樣頻率越高,單位時(shí)間內(nèi)采集的樣本數(shù)越多,得到波形越接近于原始波形,音質(zhì)就越好。 根據(jù)奈奎斯特(Harry Nyquist)采樣理論(lln):如果采樣頻率高于輸入信號(hào)最高頻率的兩倍,重放時(shí)就能從采樣信號(hào)序列無失真地重構(gòu)原始信號(hào)

5、。11共九十八頁采樣的3個(gè)常用(chn yn)頻率分別為:11.025kHzAM(調(diào)幅)廣播22.05kHz FM(調(diào)頻)廣播44.1kHz CD高保真音質(zhì)聲音現(xiàn)在聲卡的采樣頻率一般(ybn)為48kHz甚至96kHz。 12共九十八頁采樣(ci yn)精度 采樣精度(jn d)用每個(gè)聲音樣本的位數(shù)表示,也叫樣本精度(jn d)或量化位數(shù),反映度量聲音波形幅度的精度(jn d)。例如,每個(gè)聲音樣本用16位表示,則量化樣本值在065535之間,它的精度是輸入信號(hào)的1/65536。 采樣精度決定了模擬信號(hào)數(shù)字化以后的動(dòng)態(tài)范圍。采樣精度影響到聲音的質(zhì)量位數(shù)越多,聲音的質(zhì)量越高,而需要的存儲(chǔ)空間也越多

6、;位數(shù)越少,聲音的質(zhì)量越低,需要的存儲(chǔ)空間越少。13共九十八頁聲道數(shù) 單聲道(mono)信號(hào)一次產(chǎn)生(chnshng)一組聲波數(shù)據(jù)。雙聲道或立體聲(stereo)一次產(chǎn)生兩組聲波數(shù)據(jù)。雙聲道在硬件中占兩條線路,一條是左聲道,一條是右聲道。立體聲不僅音質(zhì)、音色好,而且能產(chǎn)生逼真的空間感。但立體聲數(shù)字化后所占空間比單聲道多一倍。14共九十八頁其他(qt)因素除采樣頻率、采樣精度、聲道數(shù)影響聲音質(zhì)量外,聲音錄制時(shí)環(huán)境噪聲、聲卡內(nèi)部噪聲以及采樣數(shù)據(jù)丟失等都會(huì)造成聲音質(zhì)量的下降。實(shí)際(shj)收聽時(shí),音響(功率放大器、揚(yáng)聲器等)的質(zhì)量對(duì)音質(zhì)的表現(xiàn)也起很大作用。15共九十八頁音頻(ynpn)數(shù)據(jù)傳輸率 音

7、頻信號(hào)數(shù)字化后,產(chǎn)生大量數(shù)據(jù) 。產(chǎn)生數(shù)據(jù)的速度或播放聲音時(shí)需要傳輸(chun sh)數(shù)據(jù)的速度影響聲音的播放質(zhì)量。數(shù)據(jù)傳輸(chun sh)率用每秒鐘傳輸(chun sh)的數(shù)據(jù)位數(shù)表示,記為bps(bit per second)。未經(jīng)壓縮的數(shù)字音頻數(shù)據(jù)傳輸率為: 數(shù)據(jù)傳輸率(bits)=采樣頻率(Hz)量化位數(shù)(bit)聲道數(shù) 16共九十八頁聲音(shngyn)質(zhì)量和數(shù)字化指標(biāo) 質(zhì)量采樣頻率(kHz)樣本精度(bit)單道聲/立體聲數(shù)據(jù)率(kB/s)(未壓縮)頻率范圍電話*88單道聲82003 400 HzAM11.0258單道聲11.0507 000HzFM22.05016立體聲88.22

8、015 000HzCD44.116立體聲176.42020 000 HzDAT4816立體聲192.02020 000 Hz17共九十八頁 編碼(bin m)算法與音頻數(shù)據(jù)壓縮比 未壓縮的音頻數(shù)據(jù)量非常大,因此在編碼的時(shí)候常采用壓縮的方式。實(shí)際上,編碼的作用一是記錄數(shù)字?jǐn)?shù)據(jù),二是采用一定的算法(sun f)來壓縮數(shù)據(jù)以減少存儲(chǔ)空間和提高傳輸效率。壓縮編碼的基本指標(biāo)之一就是壓縮比,一般為數(shù)據(jù)壓縮前后的數(shù)據(jù)量之比:18共九十八頁數(shù)據(jù)壓縮(sh j y su)說明采用不同(b tn)的數(shù)字化指標(biāo)實(shí)際上也是進(jìn)行了不同(b tn)比例的數(shù)據(jù)壓縮。如果PCM編碼采用4bit量化對(duì)CD音質(zhì)信號(hào)壓縮,其壓縮比

9、為4:1。壓縮算法包括有損壓縮和無損壓縮;有損壓縮解壓后數(shù)據(jù)不能完全復(fù)原,要丟失一部分信息。無損壓縮不丟失任何信息,能較好地復(fù)原原始信號(hào)。19共九十八頁數(shù)字音頻文件格式 數(shù)字聲音(shngyn)文件格式是數(shù)字音頻在磁盤文件中的存放形式,相同的數(shù)據(jù)可以有不同的文件格式,而不同的數(shù)據(jù)也可以有相同的文件格式。WAVE 格式MP3 格式RA 格式20共九十八頁WAVE文件格式WAVE文件是一種通用(tngyng)的音頻數(shù)據(jù)文件,文件擴(kuò)展名為“WAV”,Windows系統(tǒng)和一般的音頻卡都支持這種格式文件的生成、編輯和播放。CD激光唱盤中包含的就是WAVE格式的波形數(shù)據(jù)。一般說來,聲音質(zhì)量與其WAVE格式

10、的文件大小成正比。WAVE文件的特點(diǎn)是易于生成和編輯,但在保證一定音質(zhì)的前提下壓縮比不夠,不適合在網(wǎng)絡(luò)上播放。21共九十八頁 MP3文件(wnjin)MP3文件是采用MP3算法壓縮生成的數(shù)字音頻數(shù)據(jù)文件,以“.MP3”為文件后綴。MP3利用MPEG制定的MPEG-1 Audio layer 3的壓縮標(biāo)準(zhǔn),將音頻信息用10:1甚至12:1壓縮率變成容量(rngling)較小的數(shù)據(jù)文件。雖然MP3是一種利用了人類心理聲學(xué)特性的有損壓縮,人耳基本不能分辨出失真,音質(zhì)幾乎達(dá)到了CD音質(zhì)標(biāo)準(zhǔn)。按照這種算法,10張CD-DA的內(nèi)容可以壓縮到l張CD-ROM中,而且視聽效果相當(dāng)好。 22共九十八頁 RA文件

11、(wnjin) Real Audio是Real networks推出的一種音樂壓縮格式,它的壓縮比可達(dá)到96:1,因此在網(wǎng)上比較流行。經(jīng)過壓縮的音樂文件可以在通過速率為14.4kb/s的MODEM上網(wǎng)的計(jì)算機(jī)中流暢回放。其最大特點(diǎn)是可以采用流媒體的方式實(shí)現(xiàn)網(wǎng)上實(shí)時(shí)(sh sh)播放,即邊下載邊播放。 23共九十八頁五、多媒體數(shù)據(jù)的編碼(bin m)技術(shù) 自然現(xiàn)象:我們了解的東西,描述它用的信息量少,不了解的東西,描述它用的信息量大。在信息(xnx)論中,可以說:信息(xnx)是用不確定的度量來定義的;一個(gè)消息的可能性越小,其信息(xnx)含量越大;消息的可能性越大,則信息(xnx)含量越小。2

12、4共九十八頁(1)信息(xnx)和熵香農(nóng)(C. E. Shannon)信息論應(yīng)用概率來描述不確定性。事件出現(xiàn)的概率小,不確定性越多,信息量就大,反之則少。在數(shù)學(xué)上,所傳輸?shù)南⑹瞧涑霈F(xiàn)概率的單調(diào)下降函數(shù)。所謂信息是指從N個(gè)相等可能事件中選出一個(gè)事件,所需要的信息度量或含量,也就是在辨識(shí)N個(gè)事件中某個(gè)特定事件過程中所需提問“是”或“否”的最少次數(shù)。如從64個(gè)數(shù)中選定某一個(gè)數(shù),提問:“是否(sh fu)大于32?”,則不論回答是與否,都消去了半數(shù)的可能事件,如此下去,只要問6次這類問題,就可以從64個(gè)數(shù)中選定一個(gè)數(shù)。因此,可以用二進(jìn)制的6個(gè)位來記錄這一過程,就可以得到這條信息。25共九十八頁信息源

13、x的熵 26共九十八頁例2-10 27共九十八頁例2-11 28共九十八頁香儂理論(lln)的要點(diǎn)信源中含有自然冗余度,這些冗余度既來自于信源本身的相關(guān)性,又來自于信源概率分布的不均勻性,只要找到去除相關(guān)性或改變(gibin)概率分布不均勻性的手段和方法,也就找到了信息熵編碼的方法。但信源所含有的平均信息量(熵)是進(jìn)行無失真編碼的理論的極限,只要不低于此極限,就能找到某種適宜的編碼方法,去逼近信息熵,實(shí)現(xiàn)數(shù)據(jù)壓縮。 29共九十八頁(2)信息冗余 多媒體數(shù)據(jù)中大的數(shù)據(jù)量并不完全(wnqun)等于它們所攜帶的信息量。在信息論中,稱為冗余。冗余是指信息存在的各種性質(zhì)的多余度。減少數(shù)據(jù)冗余可以節(jié)省存儲(chǔ)

14、空間,有效利用網(wǎng)絡(luò)帶寬。 30共九十八頁數(shù)據(jù)冗余(rn y)的類型空間(kngjin)冗余 物理特性具有相關(guān)性。 時(shí)間冗余 相鄰幀圖像之間有較大的相關(guān)性。 信息熵冗余 自然編碼的比特分配不能達(dá)到最佳。視覺冗余 人眼不能察覺圖像中的所有變化。知識(shí)冗余 數(shù)據(jù)的理解與先驗(yàn)知識(shí)有很大的關(guān)系。例如,當(dāng)接收到一個(gè)成語的前三個(gè)字“大驚小”時(shí),就知道下一個(gè)字肯定是“怪”。聽覺冗余 人耳不能察覺所有頻率的變化。31共九十八頁數(shù)據(jù)壓縮(sh j y su)的基本原理數(shù)據(jù)壓縮的對(duì)象是數(shù)據(jù)。數(shù)據(jù)是信息的載體,用來記錄和傳送信息。真正有用的不是數(shù)據(jù)本身,而是數(shù)據(jù)所攜帶的信息。大的數(shù)據(jù)量并不代表含有大的信息量 。而對(duì)于去

15、掉冗余(rn y)的數(shù)據(jù)對(duì)信息沒有本質(zhì)的影響稱為壓縮。32共九十八頁(3)壓縮算法的分類(fn li) 從信息量有無損失劃分:可逆編碼和不可逆編碼??赡婢幋a也叫無失真編碼、冗余度壓縮、熵編碼等。其原理是減少數(shù)據(jù)中的冗余度,而不損失任何信息。解壓時(shí)可以完全恢復(fù)出原來的數(shù)據(jù),亦稱無損壓縮。典型的無損壓縮有Huffman編碼、算術(shù)編碼和行程編碼等??赡婢幋a由于不會(huì)產(chǎn)生失真,因此在多媒體技術(shù)中常用于文本、數(shù)據(jù)的壓縮,它能保證完全地恢復(fù)原始數(shù)據(jù)。但這種方法的壓縮比較(bjio)低,一般在2:15:1之間。33共九十八頁不可逆編碼(bin m)不可逆編碼是有失真壓縮,信息論中叫熵壓縮。由于壓縮了熵,會(huì)減少

16、信息而不能再恢復(fù)。因此這種壓縮又稱有損壓縮。在語音和圖像中,由于存在視覺冗余和聽覺冗余,減少這種信息并不影響人們的聽覺效果和視覺效果,所以經(jīng)常采用這種方法,有損壓縮常用于數(shù)字化存儲(chǔ)的模擬(mn)數(shù)據(jù),并且主要應(yīng)用于圖像、聲音、動(dòng)態(tài)視頻等數(shù)據(jù)的壓縮。如果用混合編碼的JPEG標(biāo)準(zhǔn),對(duì)自然景物的彩色圖像,壓縮比可達(dá)到幾十倍甚至上百倍。34共九十八頁壓縮算法分類(fn li)根據(jù)壓縮原理劃分(hu fn)有預(yù)測(cè)編碼、變換編碼、矢量編碼、子帶編碼、熵編碼等。 35共九十八頁1)預(yù)測(cè)(yc)編碼 對(duì)于(duy)語音,就是通過預(yù)測(cè)去除語音信號(hào)時(shí)間上的相關(guān)性。而對(duì)于(duy)圖像,幀內(nèi)預(yù)測(cè)去除了空間上的冗余,

17、幀間預(yù)測(cè)則可以去除時(shí)間上冗余。目前大多數(shù)語音、圖像編碼中都采用了預(yù)測(cè)技術(shù)。例如語音中的LPC(linear Predictive Coding,線性預(yù)測(cè))、CELP(碼激勵(lì)線性預(yù)測(cè))、圖像中的ADPCM(自適應(yīng)差分脈沖編碼調(diào)制)等。36共九十八頁2)變換編碼變換編碼首先把要壓縮的數(shù)據(jù)變換到某個(gè)變換域中,然后再進(jìn)行編碼。變換域中表現(xiàn)為能量(nngling)集中在某些區(qū)域,就可以利用這一特點(diǎn)在不同區(qū)域間有效地分配量化比特?cái)?shù),或者去掉這些能量(nngling)很小的區(qū)域,從而達(dá)到數(shù)據(jù)壓縮的目的。例如聲音中的頻譜分析實(shí)際上是對(duì)語音波形進(jìn)行了快速傅里葉變換(FFT),將時(shí)域信號(hào)變到了頻域中,可以清楚地看

18、到能量集中在哪些頻率范圍內(nèi)。 37共九十八頁3)矢量(shling)量化矢量量化是利用相鄰數(shù)據(jù)(shj)間的相關(guān)性,將數(shù)據(jù)(shj)序列分組進(jìn)行量化的一種壓縮方法。和預(yù)測(cè)編碼一樣,矢量量化本質(zhì)也是利用數(shù)據(jù)(shj)序列的統(tǒng)計(jì)相關(guān)性進(jìn)行壓縮的。38共九十八頁4)子帶編碼(bin m)子帶編碼首先讓原始數(shù)據(jù)分別通過若干個(gè)具有不同通頻帶的濾波器,將信號(hào)(xnho)分成多個(gè)子帶信號(hào)(xnho)輸出,然后分別對(duì)各個(gè)濾波器的輸出進(jìn)行編碼。當(dāng)濾波器選取得合適時(shí),它們的輸出將各自具有不同的分布特性,對(duì)各頻段進(jìn)行不同的量化處理,可以有效地進(jìn)行數(shù)據(jù)壓縮。 39共九十八頁5)熵編碼(bin m)根據(jù)(gnj)信息墑

19、的原理,用短碼表示出現(xiàn)概率大的數(shù)據(jù),用長(zhǎng)碼表示出現(xiàn)概率小的數(shù)據(jù)。這是一種無損數(shù)據(jù)壓縮技術(shù),在語音和圖像編碼中常常和其它有損壓縮編碼方法結(jié)合使用。 40共九十八頁2.基本(jbn)壓縮編碼方法 哈夫曼(Huffman)編碼在1952年為文本文件而建立?;舴蚵幋a的碼長(zhǎng)是變化的,對(duì)于出現(xiàn)頻率(pnl)高的信息,編碼的長(zhǎng)度較短;而對(duì)于出現(xiàn)頻率(pnl)低的信息,編碼長(zhǎng)度較長(zhǎng)。這樣,處理全部信息的總碼長(zhǎng)一定小于實(shí)際信息的符號(hào)長(zhǎng)度。41共九十八頁例2-12設(shè)信號(hào)源為X= 、a、e、I、m、t、c、h、r。對(duì)應(yīng)的概率為p=O.22、0.22、0.14、O.07、0.07、0.07、0.07、0.07、0.

20、07,試給出該信源的霍夫曼編碼方案。若傳送一個(gè)串字符串“I am a teacher”,共14個(gè)字符。若用ASCII傳送,每個(gè)字符8位,共需112位。該字符串中有9個(gè)不同的符號(hào),至少需要4位二進(jìn)制才能表示,這樣(zhyng)傳送該字符串也要56位。若用剛計(jì)算的Huffman編碼,只需要42位。 42共九十八頁霍夫曼編碼(bin m)過程 43共九十八頁(2)行程編碼(bin m)原理 由字符(或信號(hào)采樣值)構(gòu)成的數(shù)據(jù)流中相同的字符(或字符串)會(huì)連續(xù)重復(fù)出現(xiàn),重復(fù)出現(xiàn)的字符長(zhǎng)度稱為游程長(zhǎng)度RL(Run Length)。如果給出了形成串的字符,串的長(zhǎng)度及串的位置,就能復(fù)出原來的數(shù)據(jù)流。行程編碼RL

21、C(Run Length Coding)就是(jish)用二進(jìn)制碼字給出上述信息的一類方法。行程編碼又稱“運(yùn)行長(zhǎng)度編碼”或“游程編碼” 44共九十八頁例2-13設(shè)有數(shù)據(jù)流“AAABBBBCCCCCDAAAAAA”,試計(jì)算該數(shù)據(jù)的行程編碼。解:A重復(fù)3次,B重復(fù)4次,C重復(fù)5次,D不重復(fù),A重復(fù)6次,RLC數(shù)據(jù)流為:“SA3SB4SC5DSA6”,其中S為指示(zhsh)符。總共占用13個(gè)字節(jié),而源數(shù)據(jù)占用19個(gè)字節(jié)。有時(shí)行程編碼不用指示符,重復(fù)與否相同對(duì)待,則相應(yīng)的RLC為“A3B4C5D1A6”占用10個(gè)字節(jié)。45共九十八頁3.數(shù)字音頻壓縮(y su)標(biāo)準(zhǔn) 1.電話質(zhì)量的語音壓縮(y su)

22、標(biāo)準(zhǔn) 。標(biāo)準(zhǔn)編號(hào)要 點(diǎn)G.711采用PCM編碼,采樣頻率8kHz,采樣精度8bit,數(shù)據(jù)率64kb/s,非線性量化G.721基于ADPCM編碼,采樣頻率8kHz,數(shù)值差分用4位量化,數(shù)據(jù)率32kb/sG.723ADPCM編碼,數(shù)據(jù)率24k/sG.728LD-CELP編碼技術(shù),數(shù)據(jù)率16k/s,音質(zhì)與G.721相當(dāng)電視會(huì)議的語音編碼、為提高線路利用率的多媒體多路復(fù)用裝置、數(shù)字錄音電活的數(shù)字記錄部件以及高質(zhì)量的語音合成器;數(shù)字移動(dòng)通信、無繩電話。ITU 國(guó)際電信聯(lián)盟 International Telecommunication Union46共九十八頁(2)調(diào)幅廣播(gungb)質(zhì)量的音頻壓縮標(biāo)

23、準(zhǔn)調(diào)幅廣播質(zhì)量音頻(ynpn)信號(hào)的頻率范圍是50Hz7kHz,又稱“7kHz音頻(ynpn)信號(hào)”,當(dāng)使用16kHz的采樣頻率和14bit的量化位數(shù)時(shí),信號(hào)速率為224kbs。1988年ITU制定了G.722標(biāo)準(zhǔn),它可把信號(hào)速率壓縮成64kbs。G.722標(biāo)準(zhǔn)基于子帶ADPCM技術(shù)(SBADPCM),將現(xiàn)有的帶寬分成兩個(gè)獨(dú)立的子帶信道,使輸入信號(hào)進(jìn)入濾波器組分成高子帶信號(hào)和低子帶信號(hào),然后分別進(jìn)行ADPCM編碼,最后進(jìn)入混合器形成輸出碼流。這種壓縮方法能夠在每秒8kB的存儲(chǔ)量下給出相當(dāng)好的音樂信號(hào),也很適合于需要存儲(chǔ)大量高質(zhì)量音頻信號(hào)的多媒體系統(tǒng)使用。 47共九十八頁(3)高保真立體聲音頻壓

24、縮(y su)標(biāo)準(zhǔn) 高保真立體聲音頻信號(hào)的頻率范圍50Hz20kHz,在44.1 kHz采樣(ci yn)頻率下用16bit量化,信號(hào)速率為每聲道1410kbs。目前國(guó)際上比較成熟的高保真立體聲音頻壓縮標(biāo)準(zhǔn)為MPEG音頻。MPEG Audio是一個(gè)子帶編碼系統(tǒng),聲音數(shù)據(jù)壓縮算法的根據(jù)是心理聲學(xué)模型。心理聲學(xué)模型中一個(gè)最基本的概念是聽覺系統(tǒng)中存在一個(gè)聽覺閾值電平,低于這個(gè)電平的聲音信號(hào)就聽不到。聽覺閾值的大小隨聲音頻率的改變而改變,各個(gè)人的聽覺閾值也不同。大多數(shù)人的聽覺系統(tǒng)對(duì)2kHz5kHz之間的聲音最敏感。一個(gè)人是否能聽到聲音取決于聲音的頻率,以及聲音的幅度是否高于這種頻率下的聽覺閾值。48共

25、九十八頁MPEGMPEG聲音(ISO/IEC 11172-3)壓縮算法是世界上第一個(gè)高保真聲音數(shù)據(jù)壓縮國(guó)際標(biāo)準(zhǔn),并且得到了極其廣泛的應(yīng)用。MPEG聲音標(biāo)準(zhǔn)是MPEG標(biāo)準(zhǔn)的一部分,但它也完全可以獨(dú)立應(yīng)用。MPEG聲音標(biāo)準(zhǔn)提供(tgng)三個(gè)獨(dú)立的壓縮層次:層1(Layer 1)、層2(Layer 2)和層3(Layer 3),用戶對(duì)層次的選擇可在復(fù)雜性和聲音質(zhì)量之間進(jìn)行權(quán)衡。 49共九十八頁四、數(shù)字音頻處理(chl) 本節(jié)介紹數(shù)字音頻的應(yīng)用(yngyng)技術(shù),包括聲音的采集、編輯以及音效處理。 編輯工具:Windows下的錄音機(jī)Sound ForgeGoldWave50共九十八頁 1、基本操作

26、 通過下例學(xué)習(xí)文件的打開、聲道的轉(zhuǎn)換、數(shù)字化指標(biāo)的轉(zhuǎn)換、提高音量和文件格式轉(zhuǎn)換 例2.4 example_0220.wav文件是一個(gè)(y )雙聲道立體聲語音文件,采樣頻率44.1kHz,采樣精度32位,請(qǐng)對(duì)其做以下處理:將雙聲道聲音轉(zhuǎn)換成單聲道聲音;采樣頻率轉(zhuǎn)換為8kHz,樣本精度轉(zhuǎn)換成16位;將其音量提高20%;將文件格式轉(zhuǎn)換為mp3格式,話音質(zhì)量。51共九十八頁操作步驟 打開文件。使用“FileOpen”命令打開聲音文件example_0220.wav 聲道轉(zhuǎn)換。執(zhí)行“ProcessChannel Converter”命令 修改技術(shù)指標(biāo)。執(zhí)行“processResample”命令,輸入新的

27、采樣頻率“8,000”; 設(shè)置位深。執(zhí)行“ProcessBit-depth Converter”命令,在打開的對(duì)話框中設(shè)置“Bit depth”為“16”位。 提高音量(ynling)。執(zhí)行“ProcessVolume”菜單命令 保存文件為mp3文件。執(zhí)行“FileSave As”命令,保存類型選擇“MP3 Audio(*.mp3)”,單擊“Template”右邊的“Custom”按鈕,打開“Custom Setting”(自定義設(shè)置),選擇“Bit Rate”為“8kbps 8,000Hz”,單擊“OK”,并保存文件。52共九十八頁 2、聲音的錄制(l zh)與格式轉(zhuǎn)換 在使用計(jì)算機(jī)進(jìn)行錄音

28、時(shí),話筒的插頭應(yīng)插入聲卡的MIC(話筒)輸入插座內(nèi)。聲卡有兩個(gè)輸入插座,一個(gè)用于話筒,一個(gè)用于線路輸入。用于話筒的插座靈敏度高,一般為O.53mv,適于輸入微弱的信號(hào);用于線路輸入的插座靈敏度低,主要與音響設(shè)備的線路輸出端連接,適于輸入強(qiáng)度較大的信號(hào),一般為5001000mv。上述兩個(gè)插座不要(byo)混淆。如果把話筒插在線路輸入插座內(nèi),將錄不到聲音 。53共九十八頁(1)質(zhì)量(zhling)選擇錄制聲音時(shí)應(yīng)根據(jù)不同的要求選擇不同的質(zhì)量參數(shù),包括采樣頻率、樣本位數(shù)、聲道數(shù)、編碼格式等。錄音時(shí),應(yīng)注意調(diào)整輸入信號(hào)的強(qiáng)度,使其不超過錄音設(shè)備的動(dòng)態(tài)范圍,否則將產(chǎn)生削頂失真,音感阻塞,嚴(yán)重時(shí)無法辨別聲

29、音的內(nèi)容。信號(hào)強(qiáng)度過低,也不能獲得滿意的聲音,原因是信號(hào)與噪聲的比值小,噪聲相對(duì)(xingdu)比較明顯,影響了音質(zhì)。正式錄音前,最好先試錄一次,以調(diào)整音響效果。 54共九十八頁(2)聲音(shngyn)格式的轉(zhuǎn)換 一般的聲音處理軟件兼容多種格式的聲音文件(wnjin),使得聲音格式的轉(zhuǎn)換非常簡(jiǎn)單,只要在保存文件(wnjin)時(shí)使用“另存為”,然后選擇不同的文件(wnjin)格式、質(zhì)量級(jí)別、壓縮算法或不同的性能指標(biāo)。例2.5 以22.1kHz的采樣頻率、16位位深度錄制以下唐詩(shī)。去除錄制過程中過長(zhǎng)的停頓、喀喀聲,調(diào)整音量,分別將其保存為WAV文件、FM音質(zhì)的MP3文件和rm文件。55共九十八頁

30、3、朗讀(lngd)并錄音為人進(jìn)出的門緊鎖著 為狗爬出的洞敞開著 一個(gè)聲音高叫著“爬出來吧,給你自由(zyu)” 我,渴望自由 但我深深地知道:人的身軀怎能從狗洞里爬出 我希望有一天 地下的烈火將我和這口活棺材一起燒掉 我,愿在烈火中永生!56共九十八頁錄音(l yn)操作步驟環(huán)境準(zhǔn)備啟動(dòng)(qdng)Sound Forge創(chuàng)建新文件選擇音頻格式參數(shù)錄音按指定文件格式保存57共九十八頁環(huán)境(hunjng)準(zhǔn)備連接話筒,在Windows控制面板中雙擊“聲音和多媒體”圖標(biāo),打開“聲音和多媒體”對(duì)話框(圖2-19a),選擇“音頻(ynpn)”選項(xiàng)卡,單擊“錄音”選框中的“音量”按鈕,打開“Record

31、ing Control”(錄音控制)對(duì)話框。如果使用話筒錄音,則在“Microphone”下的小方框中打“”,音量滑塊調(diào)到90%左右。58共九十八頁啟動(dòng)(qdng)Sound Forge 59共九十八頁創(chuàng)建(chungjin)新文件選擇(xunz)“File”“New”,創(chuàng)建一個(gè)新文件。60共九十八頁選擇格式(g shi)參數(shù)選擇(xunz)采樣頻率選擇位深度選擇聲道數(shù)61共九十八頁錄音(l yn) 單擊工具欄中錄音(l yn)按鈕,打開“Recording”對(duì)話框,單擊“錄音(l yn)”按鈕 。62共九十八頁編輯(binj)調(diào)整在編輯窗口中沒有波形的區(qū)域是沒有聲音(shngyn)的區(qū)域。不

32、做任何選擇,執(zhí)行“ProcessVolume”菜單命令調(diào)整整體音量的大小,也可選擇某個(gè)區(qū)域調(diào)整音量。63共九十八頁保存(bocn)文件執(zhí)行“FileSave As”保存聲音文件。保存WAV文件選擇文件類型“Wave(Microsoft)(*.wav)”;保存MP3 文件選擇文件類型 “MP3 Audio(*.mp3)”,模板選擇“64kbps,FM Radio Quality Audio”;保存RM文件選擇文件類型“RealMedia(*.rm)”,模板選擇“56kbps Audio”,適合使用56k MODEM以上線路上網(wǎng)(shn wn)的用戶,也可選其他模板。保存的3個(gè)文件的大小分別為54

33、5kB、101kB和56kB,時(shí)間長(zhǎng)度為12秒。64共九十八頁 4、聲音(shngyn)的剪輯 聲音文件可以進(jìn)行剪輯操作:刪除就是去掉聲音文件中的一段數(shù)據(jù)。兩段數(shù)據(jù)排列順序的不同就改變(gibin)了聲音播放的先后順序。將兩個(gè)文件中的聲音數(shù)據(jù)連接起來保存在一個(gè)文件中就實(shí)現(xiàn)了聲音的連接。當(dāng)然也可以將原來的聲音文件分成兩個(gè)聲音文件存放,就實(shí)現(xiàn)了聲音的分割。 65共九十八頁剪輯(jinj)操作步驟 確定編輯區(qū)域;選定起點(diǎn)(Mark In)和終點(diǎn)(Mark Out) 聲音編輯,編輯操作可以使用“Edit”菜單中的命令,也可以使用與Word相同(xin tn)快捷鍵。 去除噪聲;去除噪聲使用“Effec

34、tNoise Gate”菜單命令。 靜音處理, “Process Mute” 例2.6 笨狼上學(xué) 66共九十八頁 5、聲音的效果(xiogu)處理 淡入淡出頻率均衡控制混響合唱效果聲音的混合(hnh)聲道搖動(dòng)67共九十八頁(1)淡入淡出“淡入(Fade In)”和“淡出(Fade Out)”指聲音的漸強(qiáng)和漸弱,通常用于聲音的開始、結(jié)束,兩個(gè)聲音素材的交替切換(qi hun),產(chǎn)生漸近漸遠(yuǎn)的音響效果等場(chǎng)合。淡入效果使聲音從無到有、由弱到強(qiáng)。而淡出效果則正好相反,聲音逐漸消失。淡入與淡出的過渡時(shí)間長(zhǎng)度由編輯區(qū)域的寬窄決定。淡入淡出常用于節(jié)目的開始、結(jié)尾和兩段聲音之間的過渡,使聲音的出現(xiàn)和消失不太突

35、然。68共九十八頁實(shí)現(xiàn)(shxin)方法在SoundForge中選擇一段聲音,執(zhí)行(zhxng): “ProcessFadeIn”(淡入) “ProcessFadeOut”(淡出)產(chǎn)生淡入或淡出效果,也可以使用:“ProcessFadeGraphics”命令在打開的對(duì)話框中拖動(dòng)增益曲線隨意地編輯淡入和淡出效果。69共九十八頁淡入淡出效果聲音(shngyn)波形 淡入淡出聲音(shngyn)70共九十八頁(2)頻率均衡(jnhng)控制頻率均衡(EQ)控制指對(duì)聲音素材的低音區(qū)、中音區(qū)、高音區(qū)各個(gè)頻段進(jìn)行(jnxng)提升和衰減等控制,使聲音的層次和頻段分布更符合要求。這一技術(shù)從根本上改變了音頻文

36、件的固有頻率均衡值。 頻率均衡使用“ProcessEQ”命令71共九十八頁均衡(jnhng)效果示意圖 源音濾掉部分低頻(dpn)的均衡效果均衡控制指對(duì)不同頻段的聲音音量的調(diào)整,可以使聲音產(chǎn)生清脆、低沉、柔和等效果。72共九十八頁(3)混響(hn xin) 聲音在傳播過程中遇到障礙物,會(huì)產(chǎn)生反射、繞射及散射。因此形成直達(dá)聲、反射次數(shù)較少的早期反射聲和多次反射形成的混響聲?;祉懯菢菲骰蛟捯艏皬奈矬w表面反射回來的聲音的混合(hnh),用軟件模擬混響的原理是將滯后一段的聲音提前加到原聲音上播放?;祉憰r(shí)間的長(zhǎng)短可以改變音色,混響時(shí)間短,聲音干澀;混響時(shí)間長(zhǎng),聲音圓潤(rùn),具有空曠感。 73共九十八頁數(shù)字(

37、shz)混響的基本原理把指定編輯區(qū)域內(nèi)的聲音滯后一小段時(shí)間再疊加到原來的聲音上。影響混響效果的參數(shù)(cnsh)是疊加聲音的音量和滯后時(shí)間長(zhǎng)度。根據(jù)延遲信號(hào)的延遲時(shí)間和幅度的不同,可以調(diào)制出任何大小房間、音樂廳、禮堂、教堂、山谷等環(huán)境的音響效果?;祉憰r(shí)間短,聲音干澀,聲音就像在近前發(fā)出的一般;混響時(shí)間長(zhǎng),聲音圓潤(rùn),具有空曠感。 命令:EffectsReverb 74共九十八頁混響(hn xin)效果混響(hn xin)源音混響效果75共九十八頁(4)合唱(hchng)效果 合唱效果可以把一個(gè)人的聲音變成兩個(gè)的聲音,把兩個(gè)人的聲音變成4個(gè)人等,從而產(chǎn)生合唱效果或把小樂隊(duì)的演奏(ynzu)變成大樂隊(duì)

38、的合奏效果 影響合唱效果的參數(shù)主要有三個(gè):合唱程度(Chorus Size)、調(diào)制速率(Modulation Rate)和合唱輸出(Chorus Out)。它們的值越大,效果越明顯。命令:EffectsChorus 76共九十八頁(5)聲音(shngyn)的混合 聲音混合將兩段聲音混合在一起,可以為自己的歌曲或語音配上音樂(ynyu)。將兩段聲音混和在一起,首先要保證兩段聲音的采樣頻率相同。為保證質(zhì)量,應(yīng)將低的采樣頻率改為高的采樣頻率。 命令序列:ProcessResample EditCopy EditPaste SpecialMix(注) 77共九十八頁聲道搖動(dòng)(yo dng)可以讓聲音(

39、shngyn)交替地從左右聲道上發(fā)出,產(chǎn)生聲的立體效果,稱為搖動(dòng)(Pan,平底鍋)。命令:ProcessPan78共九十八頁搖動(dòng)(yo dng)編輯對(duì)話框79共九十八頁添加搖動(dòng)效果的聲音(shngyn)波形搖動(dòng)(yo dng)效果80共九十八頁5.聲音(shngyn)的頻譜分析 頻譜分析(Spectrum Analysis)是分析數(shù)字音頻頻率分布情況的強(qiáng)有利(yul)工具,使用它可以很清楚地看到所處理的聲音文件中各種頻率的聲音的分布情況。 命令: ToolsSpectrum Analysis 該聲音頻率范圍在20-3.3kHz內(nèi),量化只要8kHz的采樣頻率即可。81共九十八頁作業(yè)(zuy)第2

40、章2,5,7,11實(shí)驗(yàn)(shyn)制作音頻作品82共九十八頁Huffman(哈夫曼)編碼(bin m)Huffman樹的定義(dngy)構(gòu)造Huffman樹Huffman編碼Huffman編碼的譯碼83共九十八頁Huffman樹的定義(dngy)Huffman樹也稱為最優(yōu)樹,是一類帶權(quán)路徑(ljng)最短的二叉樹。樹的帶權(quán)路徑長(zhǎng)度定義為: WPL = wklkk = 1n 其中: n 是樹中葉結(jié)點(diǎn)的個(gè)數(shù) wi 是第i個(gè)結(jié)點(diǎn)的權(quán)值 li 是第i個(gè)結(jié)點(diǎn)的路徑長(zhǎng)度84共九十八頁Huffman樹舉例(j l)以下(yxi)有三棵樹:(a)(b)(c)abcdabcdacbd777555222444WP

41、La =7x2+5x2+2x2+4x2 = 36WPLb =7x3+5x3+2x1+4x2 = 46 WPLc = 7x1+5x2+2x3+4x3 = 35 事實(shí)證明按哈夫曼樹構(gòu)造二叉樹,可得到很好的特性,應(yīng)用于實(shí)際問題,可提高處理效率。85共九十八頁應(yīng)用(yngyng)舉例由統(tǒng)計(jì)規(guī)律(gul)可知,考試成績(jī)的分布符合正態(tài)分布:-1 1 0 分?jǐn)?shù) 059 60 69 70 79 80 89 90 100比例數(shù) 0.05 0.15 0.40 0.3 0.10 根據(jù)正態(tài)分布規(guī)律,在6090之間的分?jǐn)?shù)占85%,而不及格和優(yōu)秀是少數(shù)。86共九十八頁將百分制轉(zhuǎn)換成五分制判定(pndng)樹比較:a60?

42、a70?a80?a90?不及格 及格(j g) 中等 良好 優(yōu)秀YYYYNNNNa80?a70?a90?a60?不及格 優(yōu)秀 良好 中等 中等 及格不及格YYYNNNNYY(A)(B)若輸入1萬個(gè)數(shù)據(jù),按A的判定過程進(jìn)行操作,約需比較3.2萬次,而按B比較,則僅需2.2萬次。87共九十八頁構(gòu)造(guzo)Huffman樹構(gòu)造Huffman樹算法步驟:Step1 將n個(gè)帶權(quán)值wi(in)的結(jié)點(diǎn)構(gòu)成n棵二叉樹的集合T=T1,T2,Tn,每棵二叉樹只有一個(gè)根結(jié)點(diǎn)。Step2 在T中選取兩個(gè)權(quán)值最小的結(jié)點(diǎn)作為左右子樹,構(gòu)成一個(gè)新的二叉樹,其根結(jié)點(diǎn)的權(quán)值取左右子樹權(quán)值之和;Step3 在T中刪除這兩棵樹,將新構(gòu)成的樹加入到T中;Step4 重復(fù)(chngf)2)、3)步的操作,直到T中只含一棵樹為止,該樹就是Huffman樹。88共九十八頁構(gòu)造(guzo)Huffman樹舉例以權(quán)值分別為7,5,2,4的結(jié)點(diǎn)(ji din)a、b、c、d構(gòu)造Huffman樹。T= a b c d cdT3246bT3T26511bT26511cd2418aT2711T1618a7T1bT3T251118a7T1b511cd264(d)T= T1 (c)T= a T

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論