論文注釋怎么弄_第1頁
論文注釋怎么弄_第2頁
論文注釋怎么弄_第3頁
論文注釋怎么弄_第4頁
論文注釋怎么弄_第5頁
已閱讀5頁,還剩73頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第2章音頻處理技術(一)西安交通大學計算機教學實驗中心2007多媒體技術及應用教學要求論文外文翻譯1問題的提出什么是聲音?聲音有哪些物理特征?音樂1、2、歌曲1、2、3、MIDI1、2、3、樂器伴唱……當我們看到“聲音”這個字時,聯(lián)想到的是什么?……2一.聲音的基本特性聲音的表現(xiàn)形式有三類:語音是指具有語言內(nèi)涵和人類約定的特殊媒體;音樂是規(guī)范的符號化了的聲音;音響指其他自然聲音,如動物的叫聲、機器的轟鳴聲、風雨雷電聲等。3聲音什么是聲音?聲波機械振動或氣流擾動引起周圍彈性媒質(zhì)發(fā)生波動而產(chǎn)生聲波。聲源產(chǎn)生聲波的物體為聲源(如人聲帶、樂器等)。聲場聲波所及的空間范圍稱為聲場。聲音聲波傳到人耳,經(jīng)過人類聽覺系統(tǒng)的感知就是聲音。聲音是振動的波,是隨時間連續(xù)變化的物理量。聲音依靠介質(zhì)的振動進行傳播。聲源就是振動源。4聲波的表示聲波可以用一條連續(xù)的曲線來表示,它在時間和幅度上都是連續(xù)的,稱為模擬音頻信號。在任一時刻t,聲波可以分解成一系列正弦波的線性疊加:An是振幅,表示聲音的強弱ω是聲波的基頻,表示聲音音調(diào)的高低φn是n次諧波的初相位nω是ω的n次諧波分量,或稱為泛音5音頻信號的特征聲音的物理特性頻率、聲壓和聲強、動態(tài)范圍、頻譜聲音的心理特性音調(diào)、響度、音色、掩蔽效應、方位感、空間感聲音的音質(zhì)頻帶寬度、信噪比、數(shù)據(jù)量6聲音的物理特性周期/頻率/帶寬

兩個相鄰波之間的時間長度為周期T,單位為秒;每秒鐘聲源振動的次數(shù)稱為頻率f,單位Hz;

f=1/T描述組成復合信號的頻率范圍,稱為帶寬。t振幅周期7聲音頻帶示意圖高于20kHz頻率的聲音人耳聽不到。人類對聲音的感覺是有限的,即只能在一個頻帶范圍內(nèi)有效。有的音響產(chǎn)品工作頻率上限為50kHz,調(diào)音臺的最高工作頻率設計到100kHz。

8聲波的頻率范圍在自然界中,人耳接收的音域:20~20,000Hz次聲波(大象):<20Hz超聲波(海豚):>20,000Hz9聲源的頻率范圍日常生活中的不同聲源頻率范圍:男聲:100~9,000Hz

女聲:150~10,000Hz

電話聲:200~3,400Hz

收音機AM調(diào)幅廣播聲:50~7,000Hz收音機FM調(diào)頻廣播聲:20~15,000Hz

專業(yè)級音響放大器聲:10~40,000Hz10聲壓和聲強聲壓P聲波在空氣傳播造成空氣中的氣壓發(fā)生變化而產(chǎn)生的壓強(相當于在無聲波下空氣中的氣壓上疊加一個變化的壓強),被稱為聲壓,記作P。單位有帕斯卡(Pa)和微巴(μbar)。聲強I描述聲音傳播所需能量的強度(聲波是由能量來維持傳播的。如揚聲器紙盆的振動是由電能轉(zhuǎn)換而來)。單位時間內(nèi)通過垂直于聲波傳播方向的單位面積內(nèi)的聲波能量為聲場中某點的聲強,記作I,單位為瓦/米2(W/m2)。聲強與聲壓最大值的平方成正比。11在聲學中,量級定義為一個量與同類基準量之比的以10為底對數(shù)。單位是dB。聲壓級Lp

為:

Lp=20lgP/P0

聲壓基準量為P0=2×10-4μbar,聲壓級為0~120dB。聲強級LI為:

LI=10lgI/I0

聲強的基準量為I0=10-12W/m2。聲壓級&聲強級12閾閾值是指臨界值??陕犻撘鹑硕鷦偰苈牭铰曇魰r的聲壓,與年齡有關。中音頻時約為0.0002微巴。痛閾使人耳膜感到疼痛的聲壓,超過200微巴的聲壓,能使人耳膜產(chǎn)生疼痛。13分貝(dB)自然現(xiàn)象:揚聲器的功率增加一倍發(fā)出的聲音,人聽到的聲音強度并不是增加一倍。在聲學中用分貝來表示聲壓或聲強的變化程度。人聽覺神經(jīng)的刺激程度不與刺激量大小成正比,而是按刺激量以10為底的對數(shù)增長。成對數(shù)關系變化。14動態(tài)范圍指聲音最大聲壓級和最小聲壓級之間的差值。每種聲源的動態(tài)范圍依據(jù)各自的特性有所不同。如女聲的動態(tài)范圍為25~50dB,男聲為30~50dB,交響樂隊的動態(tài)范圍大于100dB。動態(tài)范圍不僅用來表示一個聲源產(chǎn)生的最大聲壓級與最小聲壓級之間的差值,錄音設備或記錄聲音的載體(磁帶、光盤、硬盤)同樣可用動態(tài)范圍表示能夠處理信號電平的范圍。15動態(tài)范圍的相對強度動態(tài)范圍可以用信號的相對強度表示:信號的動態(tài)范圍=20×lg(信號最大強度/信號最小強度)(dB)其中信號可以用電壓或功率衡量。因為是一種比例關系,故只要采用相同的度量單位,其結果都是一致的。

16頻譜物體在一定位置的附近作來回往復的運動,稱為簡諧振動。簡諧振動會產(chǎn)生一個特定音調(diào)的純音,聽起來感覺單薄。樂器很少產(chǎn)生單一頻率的純音,而是復音。復音的產(chǎn)生基于物體的復雜振動,可以分解為許多不同振幅和不同頻率的簡諧振動(即看成簡諧振動的疊加)。簡諧振動的振幅按頻率排列的圖形稱為頻譜。頻譜可一目了然地看出復雜振動的頻率結構。17鋼琴的復音頻譜鋼琴(基頻為253Hz)的復音頻譜18聲音的心理學特性

從聲學心理角度分析,聲音有三個要素:音調(diào)、響度和音色。它們與聲波的頻率、聲壓和頻譜結構對應。19音調(diào)音調(diào)代表聲音的高低,與頻率有關。頻率越高,音調(diào)越高,反之亦然。人對聲音頻率的感覺表現(xiàn)為音調(diào)的高低,在音樂中稱為音高。音調(diào)與基頻的對數(shù)(20×lg)成線性關系,單位為美(mei)?;l越低,給人的感覺越低沉?;l頻率增加一倍,音樂上稱提高了一個八度。在編輯聲音時,如果對聲音的頻率進行調(diào)整,其音調(diào)也會隨之而變;不同聲源有自己特定的音調(diào),若改變了聲源的音調(diào),聲音會發(fā)生質(zhì)的轉(zhuǎn)變。20頻率與音調(diào)的關系

21響度響度也稱音強,是人耳對聲音強弱的感覺程度。常說的“音量”也是指響度。響度與聲波的振幅成正比,振幅越大,響度越大。唱盤、CD激光盤等播放出來的聲音響度是一定的,但通過控制、調(diào)整播放設備的音量,可以改變聆聽時的響度。22等響度曲線人的耳道會對某段頻率產(chǎn)生共鳴,使靈敏度提高。因此人耳聽到聲音的響度與聲音的頻率有關。描述響度、聲壓以及聲源頻率之間的關系曲線稱為等響度曲線。從曲線看出,當音量開到使聲壓級為80dB時,就可做到高、低頻聲音豐滿。23音色音色是聲音的特色,又稱音品。通常說法是:聲音的音調(diào)和響度以外的音質(zhì)差異叫做音色。影響音色主要因素是復音。所謂“復音”是指不同頻率和不同振幅的混合聲音,自然聲中大部分是復音。在復音中,最低頻率的聲音是“基音”(聲音的基調(diào)),其他頻率的聲音稱為“諧音”(也叫泛音)?;艉椭C音是構成聲音音色的重要因素。各種聲源都具有自己獨特的音色,例如每種樂器的聲音、每個人的聲音等,人是根據(jù)音色來辨別聲源種類的。24音色(續(xù))高次諧波越豐富,音色就越有明亮感和穿透力。此外,音色還與諸多其他因素有關,如聽音條件等。音色是一個主觀量,常用柔和、刺耳、飽滿等詞描述。25掩蔽效應稱聽不到的聲音為被掩蔽聲,而起掩蔽作用的聲音為掩蔽聲。掩蔽效應的實質(zhì)是掩蔽聲的出現(xiàn)使人耳聽覺的等響度曲線的最小可聽閾抬高。掩蔽效應的一般規(guī)律是強音壓低音、低頻率聲音壓高頻率。利用掩蔽效應可以用有用信號去掩蔽無用的聲信號,只需要把無用聲音的聲壓級降低到掩蔽閾以下即可。在數(shù)字音頻處理中,還可以利用掩蔽效應去掉人耳聽不到的那部分信號進行聲音數(shù)據(jù)的壓縮。26方位感人憑借雙耳在一定聲學環(huán)境內(nèi)能夠?qū)β曉炊ㄎ唬@種能力來自于聲源發(fā)出的聲波到達雙耳間的強度差、時間差等因素。聲源到達聽者耳朵的聲音有兩個,一個聲音直接到達,而另一個由于人頭部遮蔽,需繞過頭部才能到達。稱前者為直達聲,而后者為繞射聲。若有兩個聲源,增大其中一個聲源的強度,由于該聲音源發(fā)出的直達聲或繞射聲的聲壓大于另一個聲源,雙耳將會產(chǎn)生聲壓級差。使聽者感受的聲源(聲像)位置向強度較大的聲源方向移,使人感受到聲音的立體感。27空間感一個聲源發(fā)出的聲音同時向各個方向散開,其發(fā)散的角度取決于聲源所具有的指向性,發(fā)散的聲波有一小部分直接傳給聽者,而大部分會被空間表面反射,然后到達聽者。由于直接和經(jīng)反射到達聽者的兩個聲音途徑存在差別(取決于環(huán)境)而帶來時間差。當時間差超過一定數(shù)量時,聽者會聽到先后到達的兩個聲音,從而產(chǎn)生回音。經(jīng)多次反射,造成余聲。即使聲源已停止發(fā)聲,但聽者仍能聽到聲音存在。回聲與余音的感覺可使聽者感受出房間體積大小、房間高低及內(nèi)表面結構上的差異,這便是空間感。28

音頻信號的質(zhì)量指標

頻帶寬度動態(tài)范圍信噪比數(shù)據(jù)量29(1)頻帶寬度音頻信號所包含的諧波分量越豐富,音色越好。在廣播通信和數(shù)字音響系統(tǒng)中,以聲音信號所包含的諧波分量的頻率范圍來衡量聲音的質(zhì)量,即帶寬。不同質(zhì)量的聲音的頻帶對比示意圖

30動態(tài)范圍動態(tài)范圍越大,說明音頻信號強度的相對變化范圍越大,音響效果越好。動態(tài)范圍一般用dB為單位來計量。FM(調(diào)頻)廣播的動態(tài)范圍約60dB,AM(調(diào)幅)廣播的動態(tài)范圍約40dB。CD-DA的動態(tài)范圍約100dB,數(shù)字電話約50dB。31信噪比信噪比SNR(SignalNoiseRatio)是有用信號與噪聲之比的簡稱。信噪比大,在一定程度上能夠掩蔽噪聲,從而獲得較好的聲音效果。信噪比不僅是聲音設備的性能指標,在聲音的錄制和播放時,也要注意環(huán)境噪聲。錄制時應盡可能減小環(huán)境噪音。輸出時應使音量適當大,以減少環(huán)境噪音對聽音的影響。一般話筒和音箱的信噪比在75dB以上。聲卡的信噪比在85~95dB。32數(shù)據(jù)量音質(zhì)與數(shù)據(jù)采樣頻率和數(shù)據(jù)位數(shù)有關:采樣頻率越低,位數(shù)越少,音質(zhì)越差;采樣頻率越高,位數(shù)越多,音質(zhì)越好。33二、數(shù)字音頻聲音的數(shù)字化

數(shù)字化就是將連續(xù)信號變成離散信號。對音頻信號,首先在時間上離散,取有限個時間點,稱為采樣。然后在幅度上離散,取有限個幅度值,稱為量化。再將得到的數(shù)據(jù)表示成計算機容易識別的格式,稱為編碼。34PCM編碼

PCM是把模擬信號轉(zhuǎn)換成數(shù)字信號的編碼方法,它主要包括采樣、量化和編碼3個過程。采樣按時間間隔測量,把時間連續(xù)的模擬信號轉(zhuǎn)換成時間離散、幅度連續(xù)的采樣信號。如果采樣時間間隔相等,稱為均勻采樣;量化是按“四舍五入”等方法將采樣得到的數(shù)值限定在幾個有限的數(shù)值中,將采樣信號轉(zhuǎn)換成時間離散、幅度離散的數(shù)字信號;編碼(coding)是將量化后的信號轉(zhuǎn)換成一個二進制碼組輸出。例如,量化得到的數(shù)據(jù)中只會出現(xiàn)兩個數(shù)值51和80,則只用一位二進制數(shù)表示即可,用0表示51,用1表示80。這種編碼方法稱為自然編碼。35模擬聲音信號的采樣和量化過程示意

模擬聲音信號的波形采樣得到的離散時間信號再量化得到的數(shù)字信號36例2.1例2.1設一個連續(xù)信號的波形可以表示為:設采樣頻率為21Hz,[-10,10]內(nèi)的量化間隔取為1,試計算出該信號0到1秒內(nèi)的量化數(shù)據(jù)。在0-1秒內(nèi),取21個采樣點。在1、1/20、2/20、……19/20、1秒時刻采樣,將采樣得到的數(shù)值取整,即得到量化數(shù)據(jù)。37表2-1連續(xù)波形的數(shù)字化

序號采樣點采樣數(shù)據(jù)量化值序號采樣點采樣數(shù)據(jù)量化值00.009.414219

110.55-9.37474-910.05-7.66754-8120.604.73547520.101.308671130.65-2.56445-330.151.079301140.700.40759040.20-3.46729-3150.756.34915650.258.934339160.80-9.36672-9…………90.45-1.63831-2201.004.400904100.507.89216838舉例對于CD-DA,采樣頻率為44.1kHz,即每秒取44,100個點。幅度的取值范圍是限制在216=65,536以內(nèi),量化間隔為1,即量化幅度可以取65,536個不同的值,計算機中用16位的存儲空間就可以表示一個量化后的數(shù)值。動態(tài)范圍為20×lg(216)≈96dB39PCM編碼原理編碼的過程:采樣。用一組脈沖采樣時鐘信號乘以輸入的模擬音頻信號,得到離散時間信號。量化。對采樣后的信號幅值進行量化。量化過程由量化器來完成。編碼。對經(jīng)量化器變換后的信號再進行編碼,即把量化的信號電平轉(zhuǎn)換成二進制碼組,得到離散的二進制數(shù)據(jù)序列x(n)。數(shù)據(jù)處理。計算機對量化后的二進制數(shù)據(jù)可以用文件的形式存儲、編輯和處理,并可還原成原始的模擬信號播放。40PCM編碼示意圖

41

均勻量化和非均勻量化

均勻量化采用相等的量化間隔(“等分尺”)對采樣得到的信號作量化,也稱為線性量化。缺點:增加的樣本位數(shù)不能得到充分的利用。42非均勻量化非線性量化思想是大的輸入信號采用大的量化間隔,小的輸入信號采用小的量化間隔;這樣就可以在滿足精度要求的情況下用較少的位數(shù)來表示。聲音數(shù)據(jù)還原時,采用相同的規(guī)則。43非均勻量化算法非均勻量化采用兩種算法(定義采樣輸入信號幅度和量化輸出數(shù)據(jù)之間的對應關系):μ律(μ-Law)壓擴A律(A-Law)壓擴44律壓擴

μ律(μ-Law)壓擴主要用在北美和日本等地區(qū)的數(shù)字電話通信中,按下面的公式確定量化輸入和輸出的關系。

45A律(A-Law)A律(A-Law)壓擴主要用在歐洲和中國大陸等地區(qū)的數(shù)字電話通信中,按下面的式子確定量化輸入和輸出的關系。46舉例對于采樣頻率為8kHz,樣本精度為13位、14位或者16位的輸入信號,使用μ律壓擴編碼或者使用A律壓擴編碼,經(jīng)過PCM編碼器之后每個樣本需8位二進制存儲,輸出的數(shù)據(jù)率為64kb/s。這個數(shù)據(jù)就是CCITT推薦的G.711標準:話音頻率脈沖編碼調(diào)制。

47數(shù)字音頻的技術指標采樣頻率采樣精度聲道數(shù)音頻數(shù)據(jù)傳輸率編碼算法與音頻數(shù)據(jù)壓縮比48采樣頻率采樣頻率是指一秒鐘采樣的次數(shù)。采樣頻率越高,單位時間內(nèi)采集的樣本數(shù)越多,得到波形越接近于原始波形,音質(zhì)就越好。

根據(jù)奈奎斯特(HarryNyquist)采樣理論:如果采樣頻率高于輸入信號最高頻率的兩倍,重放時就能從采樣信號序列無失真地重構原始信號。例如,電話話音的信號頻率約為3.4kHz,若采樣頻率選為8kHz,就能無失真地重放原始聲音。49采樣的3個常用頻率分別為:11.025kHz——AM(調(diào)幅)廣播22.05kHz——FM(調(diào)頻)廣播44.1kHz——CD高保真音質(zhì)聲音現(xiàn)在聲卡的采樣頻率一般為48kHz甚至96kHz。50采樣精度

采樣精度用每個聲音樣本的位數(shù)表示,也叫樣本精度或量化位數(shù),反映度量聲音波形幅度的精度。例如,每個聲音樣本用16位表示,則量化樣本值在0~65535之間,它的精度是輸入信號的1/65536。

采樣精度決定了模擬信號數(shù)字化以后的動態(tài)范圍。若以8位量化,則其波形的幅值可分為28=256等份,等效的動態(tài)范圍為20×lg(256)=48dB。若以16位采樣,則可分為216=65536等份,等效動態(tài)范圍為20×lg(65536)=96dB。采樣精度影響到聲音的質(zhì)量位數(shù)越多,聲音的質(zhì)量越高,而需要的存儲空間也越多;位數(shù)越少,聲音的質(zhì)量越低,需要的存儲空間越少。51聲道數(shù)

單聲道(mono)信號一次產(chǎn)生一組聲波數(shù)據(jù)。雙聲道或立體聲(stereo)一次產(chǎn)生兩組聲波數(shù)據(jù)。雙聲道在硬件中占兩條線路,一條是左聲道,一條是右聲道。立體聲不僅音質(zhì)、音色好,而且能產(chǎn)生逼真的空間感。但立體聲數(shù)字化后所占空間比單聲道多一倍。52其他因素除采樣頻率、采樣精度、聲道數(shù)影響聲音質(zhì)量外,聲音錄制時環(huán)境噪聲、聲卡內(nèi)部噪聲以及采樣數(shù)據(jù)丟失等都會造成聲音質(zhì)量的下降。實際收聽時,音響(功率放大器、揚聲器等)的質(zhì)量對音質(zhì)的表現(xiàn)也起很大作用。53音頻數(shù)據(jù)傳輸率

音頻信號數(shù)字化后,產(chǎn)生大量數(shù)據(jù)。產(chǎn)生數(shù)據(jù)的速度或播放聲音時需要傳輸數(shù)據(jù)的速度影響聲音的播放質(zhì)量。數(shù)據(jù)傳輸率用每秒鐘傳輸?shù)臄?shù)據(jù)位數(shù)表示,記為bps(bitpersecond)。未經(jīng)壓縮的數(shù)字音頻數(shù)據(jù)傳輸率為:

數(shù)據(jù)傳輸率(bit/s)=采樣頻率(Hz)×量化位數(shù)(bit)×聲道數(shù)54聲音質(zhì)量和數(shù)字化指標

質(zhì)量采樣頻率(kHz)樣本精度(bit)單道聲/立體聲數(shù)據(jù)率(kB/s)(未壓縮)頻率范圍電話*88單道聲8200~3400HzAM11.0258單道聲11.050~7000HzFM22.05016立體聲88.220~15000HzCD44.116立體聲176.420~20000HzDAT4816立體聲192.020~20000Hz55例2-2例2.2高保真立體聲數(shù)字音頻的量化位數(shù)為16,試計算其數(shù)據(jù)傳輸率。

解:高保真立體聲數(shù)字音頻采樣頻率為44.1kHz,雙聲道,其數(shù)據(jù)傳輸率為:數(shù)據(jù)傳輸率=44.1(kHz)×16(bit)×2(聲道)=1411.2(kbps)

如果采用PCM編碼,數(shù)字音頻文件所占用的空間可用如下的公式計算:

音頻數(shù)據(jù)量(Byte)=數(shù)據(jù)傳輸率×持續(xù)時間/8(bit/Byte)

其中數(shù)據(jù)量以字節(jié)(Byte)為單位;數(shù)據(jù)傳輸率以每秒比特(bps)為單位;持續(xù)時間以秒(s)為單位。

56例2-3例2.3計算1分鐘未經(jīng)壓縮的高保真立體聲數(shù)字聲音文件的大小。

解:高保真立體聲數(shù)字音頻采樣頻率為44.1kHz,16位量化,雙聲道,其數(shù)據(jù)傳輸率為:

數(shù)據(jù)傳輸率=44.1(kHz)×16(bit)×2(聲道)=1411.2(kbps)

1分鐘這樣的聲音文件的大小為:音頻數(shù)據(jù)量=1411.2(kb/s)×60(s)/8(bit/Byte)=10584kB未經(jīng)壓縮的4分鐘的歌曲文件約42M數(shù)據(jù),128M的MP3播放器只能存放3首這樣的歌曲。

57

編碼算法與音頻數(shù)據(jù)壓縮比

未壓縮的音頻數(shù)據(jù)量非常大,因此在編碼的時候常采用壓縮的方式。實際上,編碼的作用一是記錄數(shù)字數(shù)據(jù),二是采用一定的算法來壓縮數(shù)據(jù)以減少存儲空間和提高傳輸效率。壓縮編碼的基本指標之一就是壓縮比,一般為數(shù)據(jù)壓縮前后的數(shù)據(jù)量之比:58數(shù)據(jù)壓縮說明數(shù)字化指標不同反映在采用了不同數(shù)據(jù)壓縮比。如果PCM編碼采用4bit量化對CD音質(zhì)信號壓縮,其壓縮比為4:1。這種情況下,用來記錄幅值的比特位越少,編碼后數(shù)據(jù)量就越小,壓縮比越大。但壓縮比越大,丟掉的信息就會越多,信號還原后失真就越大。(對有損壓縮)壓縮算法包括有損壓縮和無損壓縮:有損壓縮解壓后數(shù)據(jù)不能完全復原,要丟失一部分信息。無損壓縮不丟失任何信息,能較好地復原原始信號。59數(shù)字音頻文件格式

數(shù)字聲音文件格式是數(shù)字音頻在磁盤文件中的存放形式,相同的數(shù)據(jù)可以有不同的文件格式,而不同的數(shù)據(jù)也可以有相同的文件格式。WAVE格式MP3格式RA格式60WAVE文件格式WAVE文件是一種通用的音頻數(shù)據(jù)文件,文件擴展名為“.WAV”,Windows系統(tǒng)和一般的音頻卡都支持這種格式文件的生成、編輯和播放。WAVE文件由三部分組成:文件頭(標明是WAVE文件、文件結構和數(shù)據(jù)的總字節(jié)數(shù))、數(shù)字化參數(shù)(如采樣率、聲道數(shù)、編碼算法等),最后是實際波形數(shù)據(jù)。CD激光唱盤中包含的就是WAVE格式的波形數(shù)據(jù)。一般說來,聲音質(zhì)量與其WAVE格式的文件大小成正比。WAVE文件的特點是易于生成和編輯,但在保證一定音質(zhì)的前提下壓縮比不夠,不適合在網(wǎng)絡上播放。61MP3文件MP3文件是采用MP3算法壓縮生成的數(shù)字音頻數(shù)據(jù)文件,以“.MP3”為文件后綴。MP3利用MPEG(MotionPictureExpertGroup,運動圖像專家組)制定的MPEG-1Audiolayer3的壓縮標準,將音頻信息用10:1甚至12:1壓縮率變成容量較小的數(shù)據(jù)文件。MPEG-1壓縮主要用于VCD數(shù)據(jù)的壓縮,也用來壓縮不包含圖像的純音頻數(shù)據(jù),音頻壓縮算法包括MPEGAudioLayer1、MPEGAudioLayer2等,而MPEGAudioLayer3有很高的壓縮比。雖然MP3是一種利用了人類心理聲學特性的有損壓縮,人耳基本不能分辨出失真,音質(zhì)幾乎達到了CD音質(zhì)標準。按照這種算法,10張CD-DA的內(nèi)容可以壓縮到l張CD-ROM中,而且視聽效果相當好。62RA文件

RealAudio是Realnetworks推出的一種音樂壓縮格式,它的壓縮比可達到96:1,因此在網(wǎng)上比較流行。經(jīng)過壓縮的音樂文件可以在通過速率為14.4kb/s的MODEM上網(wǎng)的計算機中流暢回放。其最大特點是可以采用流媒體的方式實現(xiàn)網(wǎng)上實時播放,即邊下載邊播放。

63三、電子合成音樂

在多媒體系統(tǒng)中,除了用數(shù)字音頻的方式以外,還可以用合成的方式產(chǎn)生音樂。音樂合成的方式根據(jù)一定的協(xié)議標準,使用音樂符號來記錄和解釋樂譜,并組合成相應的音樂信號,這就是MIDI(MusicalInstrumentDigitalInterface樂器數(shù)字接口)。

64電子合成音樂的有關概念

MIDI不是把音樂的波形進行數(shù)字化采樣和編碼,而是將數(shù)字式電子樂器的彈奏過程以命令符號的形式記錄下來,如按了哪一個鍵、力度多大、時間多長等。當需要播放這首樂曲時,根據(jù)記錄的樂譜指令,通過音樂合成器生成音樂聲波,經(jīng)放大后由揚聲器播出。

65電子音樂中的常用術語電子合成器(musicalsynthesizer)是由數(shù)字信號處理器和其他集成電路芯片構成的電子設備,用來產(chǎn)生并修改正弦波形,然后通過聲音產(chǎn)生器和揚聲器發(fā)出特定的聲音。復調(diào)(polyphony)指合成器同時演奏若干音符時發(fā)出的聲音。如鋼琴、吉他等樂器可以同時演奏幾種音符,而雙簧管就不能。復調(diào)著重于同時演奏的音符數(shù),如鋼琴的和弦音符。多音色(timbre)指同時演奏幾種不同樂器時發(fā)出的聲音。它著重同時演奏的樂器數(shù)。例如,具有6音符復音的4種樂器合成器,可以同時演奏4種不同聲音的6個音符,如3個鋼琴的合弦音符、1個長笛、1個小提琴和1個薩克斯管的音符。66與MIDI有關的術語(1)MIDI電子樂器它是能產(chǎn)生特定聲音的合成器,如電子鍵盤、吉他、薩克斯管等;它們相互間的數(shù)據(jù)傳送符合MIDI的通信約定。(2)MIDI消息(message)或指令MIDI軟件通信協(xié)議,實際上是用數(shù)字指令描述的音樂樂譜,其中包含音符、強度、定時及樂器的指派等。(3)MIDI接口(interface)MIDI硬件通信協(xié)議,可使電子樂器互連或與計算機硬件端口相連,可發(fā)送和接收MIDI消息。(4)MIDI通道(channel)MIDI標準提供了16個通道,每種通道對應一種邏輯的合成器,即對應一種樂器的合成。(5)音序器(sequencer)它指可用來記錄、編輯和播放MIDI文件的計算機程序。67電腦合成音樂的制作原理

電腦合成音樂需要使用MIDI語言。MIDI語言利用字節(jié)傳送來告知相應的設備能夠做什么和不能做什么。MIDI字節(jié)通知樂器、聲卡和其他MIDI設備什么時候開始和什么時候結束演奏音符。MIDI自身并不產(chǎn)生和傳送聲音,只是傳送產(chǎn)生聲音的控制符號。使用MIDI語言的設備(MIDI設備)可以互聯(lián)。典型設備是合成器或者MIDI控制鍵盤,也可以是外掛式音響效果單元、計算機、配備有MIDI接口的吉他等。68

MIDI音樂的產(chǎn)生過程

69MIDI通道

當MIDI設備交流信息時,需要遵循一定的事件序列。例如,兩個MIDI設備在建立連接之后首先要做的事情就是在使用相同的MIDI通道方面達成一致。MIDI可以在16個這樣的通道上進行操作,這些通道用數(shù)字分別標記為0~15。只要兩個MIDI設備進行交流,就必須使用相同的通道。對電腦合成音樂,每個邏輯通道可指定一種樂器,音樂鍵盤可設置在這16個通道之中的任何一個,而MIDI聲源或者聲音模塊可被設置在指定的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論