第3章數(shù)字音頻處理技術(shù)_第1頁
第3章數(shù)字音頻處理技術(shù)_第2頁
第3章數(shù)字音頻處理技術(shù)_第3頁
第3章數(shù)字音頻處理技術(shù)_第4頁
第3章數(shù)字音頻處理技術(shù)_第5頁
已閱讀5頁,還剩47頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第3章數(shù)字音頻處理技術(shù) 第第 3 章章 數(shù)字音頻處理技術(shù)數(shù)字音頻處理技術(shù) 第3章數(shù)字音頻處理技術(shù) 聲音的概述聲音的概述 數(shù)字化音頻數(shù)字化音頻 聲卡與音箱聲卡與音箱 MIDI技術(shù)技術(shù) 數(shù)字音頻的采集、編輯和轉(zhuǎn)換數(shù)字音頻的采集、編輯和轉(zhuǎn)換 本章要點(diǎn):本章要點(diǎn): 第3章數(shù)字音頻處理技術(shù) 聲音(聲音(Sound)是通過一定介質(zhì)(如空氣、水等)傳播的連續(xù)波,在)是通過一定介質(zhì)(如空氣、水等)傳播的連續(xù)波,在 物理學(xué)中稱為聲波。聲音是振動(dòng)的波,是隨時(shí)間連續(xù)變化的物理量。物理學(xué)中稱為聲波。聲音是振動(dòng)的波,是隨時(shí)間連續(xù)變化的物理量。 聲波的振幅通常是指音量,它是聲波波形的高低幅度,表示聲波的振幅通常是指音量,

2、它是聲波波形的高低幅度,表示 聲音信號的強(qiáng)弱程度。聲音信號的強(qiáng)弱程度。 (1) 聲音信號的周期是指兩個(gè)相鄰聲波之間的時(shí)間長度,即重復(fù)聲音信號的周期是指兩個(gè)相鄰聲波之間的時(shí)間長度,即重復(fù) 出現(xiàn)的時(shí)間間隔,以秒(出現(xiàn)的時(shí)間間隔,以秒(s)為單位。)為單位。 (2) 聲音信號的頻率是指每秒鐘信號變化的次數(shù),即為周期的倒聲音信號的頻率是指每秒鐘信號變化的次數(shù),即為周期的倒 數(shù),以赫茲(數(shù),以赫茲(Hz)為單位。)為單位。 (3) 第3章數(shù)字音頻處理技術(shù) 聲音依靠介質(zhì)(空氣、液體、固體)的振動(dòng)進(jìn)行傳播。聲源是一聲音依靠介質(zhì)(空氣、液體、固體)的振動(dòng)進(jìn)行傳播。聲源是一 個(gè)振蕩源,它使周圍的介質(zhì)產(chǎn)生振動(dòng),并

3、以波的形式進(jìn)行傳播。人耳個(gè)振蕩源,它使周圍的介質(zhì)產(chǎn)生振動(dòng),并以波的形式進(jìn)行傳播。人耳 感覺到這種傳播過來的振動(dòng),再反映到大腦,就聽到了聲音。聲音在感覺到這種傳播過來的振動(dòng),再反映到大腦,就聽到了聲音。聲音在 不同的介質(zhì)中傳播,其傳播的速度和衰減的速率是不一樣的,這兩個(gè)不同的介質(zhì)中傳播,其傳播的速度和衰減的速率是不一樣的,這兩個(gè) 因素導(dǎo)致了聲音在不同的介質(zhì)中傳播的距離不同。因素導(dǎo)致了聲音在不同的介質(zhì)中傳播的距離不同。 不同的聲音有不同的頻率范圍。聲音按頻率可分為不同的聲音有不同的頻率范圍。聲音按頻率可分為3種:次聲波、種:次聲波、 可聽聲波和超聲波。人耳只能聽到頻率在可聽聲波和超聲波。人耳只能聽

4、到頻率在20Hz20kHz之間的聲音,之間的聲音, 聽不到低于聽不到低于20Hz和高于和高于20kHz的聲音。低于的聲音。低于20Hz的為次聲波,高于的為次聲波,高于 20kHz的為超聲波。人的發(fā)聲器官發(fā)出的聲音頻率是的為超聲波。人的發(fā)聲器官發(fā)出的聲音頻率是803400Hz,但,但 人說話的聲音信號頻率通常為人說話的聲音信號頻率通常為300Hz3kHz,把在這種頻率范圍內(nèi)的,把在這種頻率范圍內(nèi)的 信號稱為語音信號。信號稱為語音信號。 第3章數(shù)字音頻處理技術(shù) 次聲波人耳可聽域超聲波 20000Hz 第3章數(shù)字音頻處理技術(shù) 聲音以振動(dòng)的形式從聲源向四周傳播。從聲源直接到達(dá)人類聲音以振動(dòng)的形式從聲源

5、向四周傳播。從聲源直接到達(dá)人類 聽覺器官的聲音是聽覺器官的聲音是“直達(dá)聲直達(dá)聲”。直達(dá)聲的方向辨別非常容易。但。直達(dá)聲的方向辨別非常容易。但 是,在現(xiàn)實(shí)生活中,森林、海洋、建筑、地貌和景物等存在于我是,在現(xiàn)實(shí)生活中,森林、海洋、建筑、地貌和景物等存在于我 們周圍,聲音從聲源發(fā)出后,經(jīng)過多次反射才能被人們聽到,這們周圍,聲音從聲源發(fā)出后,經(jīng)過多次反射才能被人們聽到,這 就是就是“反射聲反射聲”。 第3章數(shù)字音頻處理技術(shù) (1) 音調(diào)即聲音的高低,與頻率有關(guān)。頻率越高,音調(diào)越高,反之亦音調(diào)即聲音的高低,與頻率有關(guān)。頻率越高,音調(diào)越高,反之亦 然。在使用音頻處理軟件對聲音的頻率進(jìn)行調(diào)整時(shí),其音調(diào)會隨

6、之變?nèi)?。在使用音頻處理軟件對聲音的頻率進(jìn)行調(diào)整時(shí),其音調(diào)會隨之變 化。不同的聲源有它自己特定的音調(diào),如果改變了聲源的音調(diào),那么化。不同的聲源有它自己特定的音調(diào),如果改變了聲源的音調(diào),那么 聲音會發(fā)生質(zhì)的轉(zhuǎn)變,使人們無法辨別聲源本來的面目。聲音會發(fā)生質(zhì)的轉(zhuǎn)變,使人們無法辨別聲源本來的面目。 (2) 音強(qiáng)即聲音的響亮程度(或音量),與振幅相關(guān),取決于聲波信音強(qiáng)即聲音的響亮程度(或音量),與振幅相關(guān),取決于聲波信 號的強(qiáng)弱程度。音強(qiáng)與聲波振幅成正比,振幅越大,強(qiáng)度越大,反之號的強(qiáng)弱程度。音強(qiáng)與聲波振幅成正比,振幅越大,強(qiáng)度越大,反之 亦然。唱盤、亦然。唱盤、CD盤以及其他形式的聲音載體中的音強(qiáng)是一定

7、的,通盤以及其他形式的聲音載體中的音強(qiáng)是一定的,通 過播放設(shè)備的音量控制,可以改變聆聽時(shí)的強(qiáng)度。如果想改變原始聲過播放設(shè)備的音量控制,可以改變聆聽時(shí)的強(qiáng)度。如果想改變原始聲 音的音強(qiáng),可以在聲音數(shù)字化以后,使用音頻處理軟件提高音強(qiáng)。音的音強(qiáng),可以在聲音數(shù)字化以后,使用音頻處理軟件提高音強(qiáng)。 第3章數(shù)字音頻處理技術(shù) (3) 音色指聲音的感覺特性,與波形相關(guān),影響聲音感覺特色音色指聲音的感覺特性,與波形相關(guān),影響聲音感覺特色 的因素是復(fù)音。所謂的因素是復(fù)音。所謂“復(fù)音復(fù)音”是指具有不同頻率和不同振幅的是指具有不同頻率和不同振幅的 混合聲音,自然聲中大部分是復(fù)音。在復(fù)音中,最低頻率是混合聲音,自然聲

8、中大部分是復(fù)音。在復(fù)音中,最低頻率是 “基音基音”,它是聲音的基調(diào);其他頻率的聲音稱為,它是聲音的基調(diào);其他頻率的聲音稱為“諧音(泛諧音(泛 音)音)”。 第3章數(shù)字音頻處理技術(shù) 從模擬信號過渡到數(shù)字信號從模擬信號過渡到數(shù)字信號 回顧歷史,大多數(shù)電信號的處理一直是用模擬元部件回顧歷史,大多數(shù)電信號的處理一直是用模擬元部件(如晶體管、變壓如晶體管、變壓 器、電阻、電容等器、電阻、電容等)對模擬信號進(jìn)行處理。但是,開發(fā)一個(gè)具有相當(dāng)精對模擬信號進(jìn)行處理。但是,開發(fā)一個(gè)具有相當(dāng)精 度、且?guī)缀醪皇墉h(huán)境變化影響的模擬信號處理元部件是相當(dāng)困難的,而度、且?guī)缀醪皇墉h(huán)境變化影響的模擬信號處理元部件是相當(dāng)困難的,

9、而 且成本也很高。且成本也很高。 如果把模擬信號轉(zhuǎn)變成數(shù)字信號,用數(shù)字來表示模擬量,對數(shù)字信號如果把模擬信號轉(zhuǎn)變成數(shù)字信號,用數(shù)字來表示模擬量,對數(shù)字信號 做計(jì)算,那么難點(diǎn)就發(fā)生了轉(zhuǎn)移。把開發(fā)模擬運(yùn)算部件的問題轉(zhuǎn)變成做計(jì)算,那么難點(diǎn)就發(fā)生了轉(zhuǎn)移。把開發(fā)模擬運(yùn)算部件的問題轉(zhuǎn)變成 開發(fā)數(shù)字運(yùn)算部件的問題,這就出現(xiàn)了數(shù)字信號處理器開發(fā)數(shù)字運(yùn)算部件的問題,這就出現(xiàn)了數(shù)字信號處理器(digital signal processor,DSP)。DSP與通用微處理器相比,除了它們的結(jié)構(gòu)不同外,與通用微處理器相比,除了它們的結(jié)構(gòu)不同外, 其基本差別是,其基本差別是,DSP有能力響應(yīng)和處理采樣模擬信號得到的數(shù)據(jù)

10、流,有能力響應(yīng)和處理采樣模擬信號得到的數(shù)據(jù)流, 如做乘法和累加求和運(yùn)算。如做乘法和累加求和運(yùn)算。 第3章數(shù)字音頻處理技術(shù) 從模擬信號過渡到數(shù)字信號從模擬信號過渡到數(shù)字信號 在數(shù)字域而不在模擬域中做信號處理的主要優(yōu)點(diǎn)是:首先,數(shù)字在數(shù)字域而不在模擬域中做信號處理的主要優(yōu)點(diǎn)是:首先,數(shù)字 信號計(jì)算是一種精確的運(yùn)算方法,它不受時(shí)間和環(huán)境變化的影響;信號計(jì)算是一種精確的運(yùn)算方法,它不受時(shí)間和環(huán)境變化的影響; 其次,表示部件的數(shù)學(xué)運(yùn)算不是物理上實(shí)現(xiàn)的功能部件,而是僅其次,表示部件的數(shù)學(xué)運(yùn)算不是物理上實(shí)現(xiàn)的功能部件,而是僅 用數(shù)學(xué)運(yùn)算去模擬,其中的數(shù)學(xué)運(yùn)算也相對容易實(shí)現(xiàn);此外,可用數(shù)學(xué)運(yùn)算去模擬,其中的數(shù)

11、學(xué)運(yùn)算也相對容易實(shí)現(xiàn);此外,可 以對數(shù)字運(yùn)算不見進(jìn)行編程,如欲改變算法或改變某些功能,還以對數(shù)字運(yùn)算不見進(jìn)行編程,如欲改變算法或改變某些功能,還 可對數(shù)字部件進(jìn)行再編程。可對數(shù)字部件進(jìn)行再編程。 第3章數(shù)字音頻處理技術(shù) 話音信號是典型的連續(xù)信號,不僅在時(shí)間上是連續(xù)的,而且在幅度上也是話音信號是典型的連續(xù)信號,不僅在時(shí)間上是連續(xù)的,而且在幅度上也是 連續(xù)的。在時(shí)間上連續(xù)的。在時(shí)間上“連續(xù)連續(xù)”是指在一個(gè)指定的時(shí)間范圍里聲音信號的幅值是指在一個(gè)指定的時(shí)間范圍里聲音信號的幅值 有無窮多個(gè),在幅度上有無窮多個(gè),在幅度上“連續(xù)連續(xù)”是指幅度的數(shù)值有無窮多個(gè)。我們把在時(shí)是指幅度的數(shù)值有無窮多個(gè)。我們把在時(shí)

12、 間和幅度上都是連續(xù)的信號稱為模擬信號。間和幅度上都是連續(xù)的信號稱為模擬信號。 在某些特定的時(shí)刻對這種模擬信號進(jìn)行測量叫做采樣在某些特定的時(shí)刻對這種模擬信號進(jìn)行測量叫做采樣(sampling),由這,由這 些特定時(shí)刻采樣得到的信號稱為離散時(shí)間信號。采樣得到的幅值是無窮些特定時(shí)刻采樣得到的信號稱為離散時(shí)間信號。采樣得到的幅值是無窮 多個(gè)實(shí)數(shù)值中的一個(gè),因此幅度還是連續(xù)的。如果把信號幅度取值的數(shù)多個(gè)實(shí)數(shù)值中的一個(gè),因此幅度還是連續(xù)的。如果把信號幅度取值的數(shù) 目加以限定,這種由有限個(gè)數(shù)值組成的信號就稱為離散幅度信號。例如,目加以限定,這種由有限個(gè)數(shù)值組成的信號就稱為離散幅度信號。例如, 假設(shè)輸入電壓

13、的范圍是假設(shè)輸入電壓的范圍是0.0V-0.7V,并假設(shè)它的取值只限定在并假設(shè)它的取值只限定在0,0.1,0.2,0.7 共共8個(gè)值。如果采樣得到的幅度值是個(gè)值。如果采樣得到的幅度值是0.123V,它的取值就應(yīng)算作,它的取值就應(yīng)算作0.1V, 如果采樣得到的幅度值是如果采樣得到的幅度值是0.26V,它的取值就算作,它的取值就算作0.3,這種數(shù)值就稱為,這種數(shù)值就稱為 離散數(shù)值。我們把時(shí)間和幅度都用離散的數(shù)字表示的信號就稱為數(shù)字信離散數(shù)值。我們把時(shí)間和幅度都用離散的數(shù)字表示的信號就稱為數(shù)字信 號。號。 第3章數(shù)字音頻處理技術(shù) 第3章數(shù)字音頻處理技術(shù) 第3章數(shù)字音頻處理技術(shù) 采樣頻率又稱取樣頻率,它

14、是指將模擬聲音波形轉(zhuǎn)換為數(shù)字音采樣頻率又稱取樣頻率,它是指將模擬聲音波形轉(zhuǎn)換為數(shù)字音 頻時(shí),每秒鐘所抽取聲波幅度樣本的次數(shù)。采樣頻率的高低是根據(jù)頻時(shí),每秒鐘所抽取聲波幅度樣本的次數(shù)。采樣頻率的高低是根據(jù) 奈奎斯特理論奈奎斯特理論(Nyquist theory)和聲音信號本身的最高頻率決定的。和聲音信號本身的最高頻率決定的。 奈奎斯特理論指出:采樣頻率不應(yīng)低于聲音信號最高頻率的兩倍,奈奎斯特理論指出:采樣頻率不應(yīng)低于聲音信號最高頻率的兩倍, 這樣就能把以數(shù)字表達(dá)的聲音還原為原來的聲音,這叫做無損數(shù)字這樣就能把以數(shù)字表達(dá)的聲音還原為原來的聲音,這叫做無損數(shù)字 化化(lossless digitiz

15、ation)。你可以這樣來理解奈奎斯特理論:聲音信號。你可以這樣來理解奈奎斯特理論:聲音信號 可以看成由許許多多正玄波組成的,一個(gè)振幅為可以看成由許許多多正玄波組成的,一個(gè)振幅為A、頻率為、頻率為f的正炫的正炫 波至少需要兩個(gè)采樣樣本表示,因此,如果一個(gè)信號中的最高頻率波至少需要兩個(gè)采樣樣本表示,因此,如果一個(gè)信號中的最高頻率 為為f,采樣頻率最低要選擇采樣頻率最低要選擇2f。例如:電話話音的信號頻率約為。例如:電話話音的信號頻率約為3.4kHz, 采樣頻率就選為采樣頻率就選為8kHz。 第3章數(shù)字音頻處理技術(shù) 量化位數(shù)又稱取樣大小,它是每個(gè)采樣點(diǎn)能夠表示的數(shù)據(jù)范量化位數(shù)又稱取樣大小,它是每個(gè)

16、采樣點(diǎn)能夠表示的數(shù)據(jù)范 圍。量化位數(shù)的大小決定了聲音的動(dòng)態(tài)范圍,即被記錄和重放的圍。量化位數(shù)的大小決定了聲音的動(dòng)態(tài)范圍,即被記錄和重放的 聲音最高與最低之間的差值。聲音最高與最低之間的差值。 聲道數(shù)是指所使用的聲音的通道個(gè)數(shù),它表明聲音一次同時(shí)聲道數(shù)是指所使用的聲音的通道個(gè)數(shù),它表明聲音一次同時(shí) 產(chǎn)生的聲波組數(shù)。聲音的聲道數(shù)也是技術(shù)發(fā)展的重要標(biāo)志,從單產(chǎn)生的聲波組數(shù)。聲音的聲道數(shù)也是技術(shù)發(fā)展的重要標(biāo)志,從單 聲道到環(huán)繞立體聲,聲音的質(zhì)量越來越好,但是同時(shí)增加了對存聲道到環(huán)繞立體聲,聲音的質(zhì)量越來越好,但是同時(shí)增加了對存 儲和傳輸媒體的要求。儲和傳輸媒體的要求。 第3章數(shù)字音頻處理技術(shù) (1)

17、單聲道是比較原始的聲音復(fù)制形式,早期的音頻卡采用的比單聲道是比較原始的聲音復(fù)制形式,早期的音頻卡采用的比 較普遍。當(dāng)通過兩個(gè)揚(yáng)聲器回放單聲道信息的時(shí)候,可以明顯感較普遍。當(dāng)通過兩個(gè)揚(yáng)聲器回放單聲道信息的時(shí)候,可以明顯感 覺到聲音是從兩個(gè)音箱中間傳遞到耳朵里的。覺到聲音是從兩個(gè)音箱中間傳遞到耳朵里的。 (2) 立體聲又稱為雙聲道。單聲道缺乏對聲音的位置定位,而立立體聲又稱為雙聲道。單聲道缺乏對聲音的位置定位,而立 體聲技術(shù)則徹底改變了這一狀況。聲音在錄制過程中被分配到兩體聲技術(shù)則徹底改變了這一狀況。聲音在錄制過程中被分配到兩 個(gè)獨(dú)立的聲道,從而達(dá)到了很好的聲音定位效果。個(gè)獨(dú)立的聲道,從而達(dá)到了很

18、好的聲音定位效果。 (3) 準(zhǔn)立體聲指的是在錄制聲音的時(shí)候采用單聲道,而放音有時(shí)準(zhǔn)立體聲指的是在錄制聲音的時(shí)候采用單聲道,而放音有時(shí) 是立體聲,有時(shí)是單聲道。是立體聲,有時(shí)是單聲道。 第3章數(shù)字音頻處理技術(shù) (4) 準(zhǔn)立體聲指的是在錄制聲音的時(shí)候采用單聲道,而放音有時(shí)準(zhǔn)立體聲指的是在錄制聲音的時(shí)候采用單聲道,而放音有時(shí) 是立體聲,有時(shí)是單聲道。是立體聲,有時(shí)是單聲道。 (5) 5.1聲音系統(tǒng)來源于聲音系統(tǒng)來源于4.1環(huán)繞,不同之處在于它增加了一個(gè)中環(huán)繞,不同之處在于它增加了一個(gè)中 置單元。這個(gè)中置單元負(fù)責(zé)傳送低于置單元。這個(gè)中置單元負(fù)責(zé)傳送低于80 Hz的聲音信號,在欣賞的聲音信號,在欣賞 影

19、片時(shí)有利于加強(qiáng)人聲,把對話集中在整個(gè)聲場的中部,以增加影片時(shí)有利于加強(qiáng)人聲,把對話集中在整個(gè)聲場的中部,以增加 整體效果。整體效果。 (6) 是在是在5.1的基礎(chǔ)上又增加了中左和中右兩個(gè)發(fā)音點(diǎn),以求達(dá)到的基礎(chǔ)上又增加了中左和中右兩個(gè)發(fā)音點(diǎn),以求達(dá)到 更加完美的境界。更加完美的境界。 第3章數(shù)字音頻處理技術(shù) 音頻數(shù)據(jù)壓縮比的表達(dá)式音頻數(shù)據(jù)壓縮比的表達(dá)式 音頻數(shù)據(jù)壓縮比音頻數(shù)據(jù)壓縮比 = 壓縮后的音頻數(shù)據(jù)壓縮后的音頻數(shù)據(jù) 壓縮前的音頻數(shù)據(jù)壓縮前的音頻數(shù)據(jù) 數(shù)據(jù)率為每秒位數(shù),它與信息在計(jì)算機(jī)中的實(shí)時(shí)傳輸有直接關(guān)系,數(shù)據(jù)率為每秒位數(shù),它與信息在計(jì)算機(jī)中的實(shí)時(shí)傳輸有直接關(guān)系, 而其總數(shù)據(jù)量又與計(jì)算機(jī)的存

20、儲空間有直接關(guān)系。用數(shù)字音頻產(chǎn)生而其總數(shù)據(jù)量又與計(jì)算機(jī)的存儲空間有直接關(guān)系。用數(shù)字音頻產(chǎn)生 的數(shù)據(jù)一般以的數(shù)據(jù)一般以WAVE的文件格式存儲,以的文件格式存儲,以 “.WAV”作為文件擴(kuò)展名。作為文件擴(kuò)展名。 編碼作用:一方面是采用一定的格式來記錄數(shù)字?jǐn)?shù)據(jù),另一方面是采編碼作用:一方面是采用一定的格式來記錄數(shù)字?jǐn)?shù)據(jù),另一方面是采 用一定的算法來壓縮數(shù)字?jǐn)?shù)據(jù)以減少存儲空間和提高傳輸效率。用一定的算法來壓縮數(shù)字?jǐn)?shù)據(jù)以減少存儲空間和提高傳輸效率。 壓縮比越大,信息丟失越多,信號還原后失真越大。壓縮比越大,信息丟失越多,信號還原后失真越大。 第3章數(shù)字音頻處理技術(shù) 數(shù)據(jù)量數(shù)據(jù)量=采樣頻率采樣頻率(量化位

21、數(shù)(量化位數(shù)/8)聲道數(shù)聲道數(shù)聲音持續(xù)時(shí)間聲音持續(xù)時(shí)間 對于調(diào)頻廣播級立體聲,采樣頻率為對于調(diào)頻廣播級立體聲,采樣頻率為44.1kHz,量化等級為,量化等級為16 位(即位(即2字節(jié))聲道形式為雙聲道,則轉(zhuǎn)換后每秒以千字節(jié)為字節(jié))聲道形式為雙聲道,則轉(zhuǎn)換后每秒以千字節(jié)為 單位的數(shù)據(jù)量為:單位的數(shù)據(jù)量為: 44 100(Hz)(16/8)()(B)2=176 400B/s172kB/s 用用44.1kHz的采樣頻率對聲波進(jìn)行采樣,每個(gè)采樣點(diǎn)的量化位的采樣頻率對聲波進(jìn)行采樣,每個(gè)采樣點(diǎn)的量化位 數(shù)選用數(shù)選用16位,則錄制位,則錄制3分鐘的立體聲節(jié)目,其波形文件所需的分鐘的立體聲節(jié)目,其波形文件所需

22、的 存儲容量為:存儲容量為: 44 100(Hz)(16/8)()(B)2360=31 752 000B/s 31 007.8kB/s 30.28MB/s 第3章數(shù)字音頻處理技術(shù) 用用44.1kHz的采樣頻率對聲波進(jìn)行采樣,每個(gè)采樣點(diǎn)的量化位的采樣頻率對聲波進(jìn)行采樣,每個(gè)采樣點(diǎn)的量化位 數(shù)選用數(shù)選用16位,則錄制位,則錄制5分鐘的單聲道節(jié)目,其波形文件所需的分鐘的單聲道節(jié)目,其波形文件所需的 存儲容量為:存儲容量為: 44 100(Hz)(16/8)()(B)1560=26460000B/s 26460kB/s 26.46MB/s 數(shù)據(jù)的采樣頻率和量化位數(shù)是影響數(shù)據(jù)的兩個(gè)因素。提高采樣頻率數(shù)據(jù)

23、的采樣頻率和量化位數(shù)是影響數(shù)據(jù)的兩個(gè)因素。提高采樣頻率 和增加量化位數(shù)將使相應(yīng)的數(shù)據(jù)量大大增加,給聲音信號的存儲與和增加量化位數(shù)將使相應(yīng)的數(shù)據(jù)量大大增加,給聲音信號的存儲與 傳輸帶來困難,這就需要在聲音的質(zhì)量與數(shù)據(jù)量之間作出恰當(dāng)?shù)倪x傳輸帶來困難,這就需要在聲音的質(zhì)量與數(shù)據(jù)量之間作出恰當(dāng)?shù)倪x 擇。擇。 第3章數(shù)字音頻處理技術(shù) 數(shù)字音頻等級數(shù)字音頻等級 采樣頻率采樣頻率 /kHz 量化位量化位 數(shù)數(shù)/bit 聲道數(shù)聲道數(shù)每分鐘的數(shù)據(jù)量每分鐘的數(shù)據(jù)量/MB (無壓縮)(無壓縮) 等效音質(zhì)等效音質(zhì) 11.0258單聲道單聲道0.63語音語音 22.0516雙聲道雙聲道5.05FM廣播廣播 44.116

24、雙聲道雙聲道10.09CD唱盤唱盤 常用的采樣指標(biāo)及等效音質(zhì)常用的采樣指標(biāo)及等效音質(zhì) 信號類型信號類型頻率范圍頻率范圍/Hz 采樣率采樣率/kHz量化位數(shù)量化位數(shù)/bit 電話話音電話話音200340088 寬帶音頻寬帶音頻5070001616 調(diào)頻廣播調(diào)頻廣播201500037.816 高質(zhì)量音頻高質(zhì)量音頻202000044.116 第3章數(shù)字音頻處理技術(shù) 如同存儲文本文件一樣,存儲聲音數(shù)據(jù)也需要有存儲格式。在因如同存儲文本文件一樣,存儲聲音數(shù)據(jù)也需要有存儲格式。在因 特網(wǎng)上和各種機(jī)器上運(yùn)行的聲音文件格式很多,但目前比較流行特網(wǎng)上和各種機(jī)器上運(yùn)行的聲音文件格式很多,但目前比較流行 的有以的有

25、以.wav(waveform),.au(audio),.aiff(audio interchangeable ) 和和.snd(sound)為擴(kuò)展名的文件格式。為擴(kuò)展名的文件格式。.wav格式主要用在格式主要用在PC上,上,.au 主要用在主要用在Unix工作站上,工作站上,.aiff和和snd主要用在蘋果機(jī)和美國視算科主要用在蘋果機(jī)和美國視算科 技有限公司技有限公司(Silicon Graphics,Inc.,SGI)的工作站上。的工作站上。 第3章數(shù)字音頻處理技術(shù) 數(shù)字音頻數(shù)據(jù)是以文件的形式保存在計(jì)算機(jī)里。數(shù)字音頻的文數(shù)字音頻數(shù)據(jù)是以文件的形式保存在計(jì)算機(jī)里。數(shù)字音頻的文 件格式主要有件格

26、式主要有WAV、MP3、WMA、MIDI、VOC、PCM、RA、 CDA等。等。 WAV(Wave)文件,又名波形文件,擴(kuò)展名為)文件,又名波形文件,擴(kuò)展名為.WAV這是這是 Windows本身存放數(shù)字聲音的標(biāo)準(zhǔn)格式,幾乎所有的音頻處理本身存放數(shù)字聲音的標(biāo)準(zhǔn)格式,幾乎所有的音頻處理 軟件都支持軟件都支持WAV格式。格式。 MP3(MPEG Audio-3)是現(xiàn)在最流行的聲音文件格式,)是現(xiàn)在最流行的聲音文件格式, 其擴(kuò)展名為其擴(kuò)展名為.MP3,它是采用,它是采用MPEG標(biāo)準(zhǔn)音頻數(shù)據(jù)壓縮編碼中層標(biāo)準(zhǔn)音頻數(shù)據(jù)壓縮編碼中層 技術(shù)壓縮之后的數(shù)字音頻文件,技術(shù)壓縮之后的數(shù)字音頻文件,MP3格式壓縮音樂的

27、典型比格式壓縮音樂的典型比 例有例有10:1、17:1,甚至,甚至70:l 。 第3章數(shù)字音頻處理技術(shù) 微軟的微軟的Windows Media Audio 7是一種壓縮的離散文件或流式文是一種壓縮的離散文件或流式文 件,其文件擴(kuò)展名是件,其文件擴(kuò)展名是.WMA,WMA(Windows Media Audio)相對)相對 于于MP3的主要優(yōu)點(diǎn)是在較低的采樣頻率下保持良好的音質(zhì)。的主要優(yōu)點(diǎn)是在較低的采樣頻率下保持良好的音質(zhì)。 樂器數(shù)字接口樂器數(shù)字接口MIDI(Musical Instrument Digital Interface) 是由世界上主要電子樂器制造廠商建立的一個(gè)通信標(biāo)準(zhǔn),以規(guī)定計(jì)是由世

28、界上主要電子樂器制造廠商建立的一個(gè)通信標(biāo)準(zhǔn),以規(guī)定計(jì) 算機(jī)音樂程序、電子合成器和其他電子設(shè)備之間交換信息與控制信算機(jī)音樂程序、電子合成器和其他電子設(shè)備之間交換信息與控制信 號的方法。號的方法。 VOC(Creative Voice)文件是)文件是Creative公司波形音頻文件格式,公司波形音頻文件格式, 也是聲霸卡使用的音頻文件格式。每個(gè)也是聲霸卡使用的音頻文件格式。每個(gè)VOC文件由文件頭塊文件由文件頭塊 (Header Block)和音頻數(shù)據(jù)塊()和音頻數(shù)據(jù)塊(Data Block)組成。)組成。 第3章數(shù)字音頻處理技術(shù) RA(Real Audio)是)是Real networks推出的一

29、種音樂壓縮格推出的一種音樂壓縮格 式,其壓縮比可以達(dá)到式,其壓縮比可以達(dá)到96:1,其最大特點(diǎn)是可以采用流媒體的,其最大特點(diǎn)是可以采用流媒體的 方式實(shí)現(xiàn)網(wǎng)上實(shí)時(shí)播放,即邊下載邊播放。該文件擴(kuò)展名是方式實(shí)現(xiàn)網(wǎng)上實(shí)時(shí)播放,即邊下載邊播放。該文件擴(kuò)展名是.RA。 CDA(CD Audio)又稱為)又稱為CD音樂,其擴(kuò)展名為音樂,其擴(kuò)展名為.CDA,是,是 標(biāo)準(zhǔn)的激光盤文件。它是唱片采用的格式,又叫標(biāo)準(zhǔn)的激光盤文件。它是唱片采用的格式,又叫“紅皮書紅皮書”格格 式,記錄的是波形流,該文件的特點(diǎn)是音質(zhì)好,絕對純正,但式,記錄的是波形流,該文件的特點(diǎn)是音質(zhì)好,絕對純正,但 缺點(diǎn)是數(shù)據(jù)量大,無法編輯。缺點(diǎn)是

30、數(shù)據(jù)量大,無法編輯。 PCM(Pulse Code Modulation)文件是模擬的音頻信號經(jīng))文件是模擬的音頻信號經(jīng) 過模數(shù)轉(zhuǎn)換(過模數(shù)轉(zhuǎn)換(A/D轉(zhuǎn)換)直接形成的二進(jìn)制數(shù)字序列,該文件沒轉(zhuǎn)換)直接形成的二進(jìn)制數(shù)字序列,該文件沒 有附加的文件頭和文件結(jié)束標(biāo)志。有附加的文件頭和文件結(jié)束標(biāo)志。 第3章數(shù)字音頻處理技術(shù) 最基本的編輯是刪除聲音文件中不需要的聲音片段,一般的最基本的編輯是刪除聲音文件中不需要的聲音片段,一般的 方法是確定片段的起點(diǎn)和終點(diǎn),把它刪掉。方法是確定片段的起點(diǎn)和終點(diǎn),把它刪掉。 可以將單聲道的聲音變成雙聲道的聲音??梢詫温暤赖穆曇糇兂呻p聲道的聲音。 聲音從無到有,逐漸增強(qiáng)

31、,直到正常,有逐漸走近的效果。聲音從無到有,逐漸增強(qiáng),直到正常,有逐漸走近的效果。 均衡控制指對不同頻段的聲音音量的調(diào)整,可以使聲音產(chǎn)生均衡控制指對不同頻段的聲音音量的調(diào)整,可以使聲音產(chǎn)生 清脆,低沉,柔和等效果。清脆,低沉,柔和等效果。 第3章數(shù)字音頻處理技術(shù) 音頻信號是依賴時(shí)間的連續(xù)媒體,因此,音頻處理的時(shí)序性音頻信號是依賴時(shí)間的連續(xù)媒體,因此,音頻處理的時(shí)序性 要求很高。如果在時(shí)間上有要求很高。如果在時(shí)間上有25ms的延遲,人就會感到斷續(xù)。的延遲,人就會感到斷續(xù)。 對語音信號的處理,不僅是信號處理問題,還要抽取語意等對語音信號的處理,不僅是信號處理問題,還要抽取語意等 其他信息;可能還會

32、涉及到語言學(xué)、社會學(xué)、聲學(xué)等。其他信息;可能還會涉及到語言學(xué)、社會學(xué)、聲學(xué)等。 音頻信號分為兩類:語音信號與非語音信號。非語音信號又可分音頻信號分為兩類:語音信號與非語音信號。非語音信號又可分 為音樂和雜音。非語音信號的特點(diǎn)是不具有復(fù)雜的語義和語法信為音樂和雜音。非語音信號的特點(diǎn)是不具有復(fù)雜的語義和語法信 息,信息量低,識別簡單。語音是語言的物質(zhì)外殼。息,信息量低,識別簡單。語音是語言的物質(zhì)外殼。 第3章數(shù)字音頻處理技術(shù) (1) 相應(yīng)處理:音頻獲取,包括比如語音識別與理解。相應(yīng)處理:音頻獲取,包括比如語音識別與理解。 (2) 相應(yīng)處理:音頻合成,包括音樂合成和語音合成;聲音定位,相應(yīng)處理:音頻

33、合成,包括音樂合成和語音合成;聲音定位, 包括立體聲模擬,音頻包括立體聲模擬,音頻/視頻同步,其目的是讓計(jì)算機(jī)產(chǎn)生真視頻同步,其目的是讓計(jì)算機(jī)產(chǎn)生真 實(shí)感聲音。實(shí)感聲音。 (3) 相應(yīng)處理:人通過網(wǎng)絡(luò),與處于異地的人進(jìn)行語音通信,需要相應(yīng)處理:人通過網(wǎng)絡(luò),與處于異地的人進(jìn)行語音通信,需要 的音頻處理包括:語音采集、音頻編碼的音頻處理包括:語音采集、音頻編碼/解碼、音頻傳輸?shù)?。解碼、音頻傳輸?shù)取?音頻編音頻編/解碼技術(shù)是信道利用率的關(guān)鍵。解碼技術(shù)是信道利用率的關(guān)鍵。 第3章數(shù)字音頻處理技術(shù) 第3章數(shù)字音頻處理技術(shù) (1) 通過聲卡,人們可將外部的聲音信號錄入計(jì)算機(jī),并以文件形通過聲卡,人們可將外

34、部的聲音信號錄入計(jì)算機(jī),并以文件形 式保存,需要時(shí)只需調(diào)出相應(yīng)的聲音播放即可。式保存,需要時(shí)只需調(diào)出相應(yīng)的聲音播放即可。 (2) 對聲音文件進(jìn)行多種特技效果的處理,音樂合成功能和性能主對聲音文件進(jìn)行多種特技效果的處理,音樂合成功能和性能主 要依賴于合成芯片。要依賴于合成芯片。 第3章數(shù)字音頻處理技術(shù) (3) MIDI接口:外部電子樂器與計(jì)算機(jī)之間的通信。接口:外部電子樂器與計(jì)算機(jī)之間的通信。 CD-ROM:各種各樣的。:各種各樣的。 游戲棒接口:游戲棒接口: (4)文語轉(zhuǎn)換和語音識別文語轉(zhuǎn)換和語音識別 對聲音文件進(jìn)行多種特技效果的處理,音樂合成功能和性能主對聲音文件進(jìn)行多種特技效果的處理,音樂

35、合成功能和性能主 要依賴于合成芯片。要依賴于合成芯片。 第3章數(shù)字音頻處理技術(shù) 第3章數(shù)字音頻處理技術(shù) 聲卡是將話筒或線性輸入的聲音信號經(jīng)過聲卡是將話筒或線性輸入的聲音信號經(jīng)過A/D轉(zhuǎn)換變成數(shù)字信轉(zhuǎn)換變成數(shù)字信 號進(jìn)行數(shù)據(jù)處理,然后再經(jīng)過號進(jìn)行數(shù)據(jù)處理,然后再經(jīng)過 D/A轉(zhuǎn)換成模擬信號,送往混轉(zhuǎn)換成模擬信號,送往混 音器中放大,最后輸出驅(qū)動(dòng)揚(yáng)聲器發(fā)聲。音器中放大,最后輸出驅(qū)動(dòng)揚(yáng)聲器發(fā)聲。 聲卡的核心器件是數(shù)字音頻處理芯片和音樂合成器,他們決聲卡的核心器件是數(shù)字音頻處理芯片和音樂合成器,他們決 定了聲卡的性能優(yōu)劣。定了聲卡的性能優(yōu)劣。 第3章數(shù)字音頻處理技術(shù) 第3章數(shù)字音頻處理技術(shù) 聲卡的分類主

36、要根據(jù)數(shù)據(jù)采樣量化的位數(shù)來分,通常分為聲卡的分類主要根據(jù)數(shù)據(jù)采樣量化的位數(shù)來分,通常分為8 位、位、16位和位和32位幾種類型,位數(shù)越高取樣頻率越高,量化精度越位幾種類型,位數(shù)越高取樣頻率越高,量化精度越 高,音質(zhì)就越好。高,音質(zhì)就越好。 (1) 采樣頻率一般有采樣頻率一般有3種標(biāo)準(zhǔn):種標(biāo)準(zhǔn):11.025kHz(語音等級)、(語音等級)、 22.05kHz(音樂等級)、(音樂等級)、44.1kH。(高保真效果等級)。采樣。(高保真效果等級)。采樣 頻率的高低直接影響聲卡的頻率響應(yīng)范圍。頻率的高低直接影響聲卡的頻率響應(yīng)范圍。 量化位數(shù)通常有兩種標(biāo)準(zhǔn):量化位數(shù)通常有兩種標(biāo)準(zhǔn):8位和位和16位。對于

37、語音信號,位。對于語音信號,8 位量化位數(shù)基本可以滿足要求;但是對于音量幅度變化很大的位量化位數(shù)基本可以滿足要求;但是對于音量幅度變化很大的 交響樂,就需要交響樂,就需要16位量化音頻質(zhì)量。位量化音頻質(zhì)量。 第3章數(shù)字音頻處理技術(shù) (2) 采用什么樣的核心器件是決定聲卡性能高低的主要因素。采用什么樣的核心器件是決定聲卡性能高低的主要因素。 (3) 聲卡依其與計(jì)算機(jī)的連接方式不同,分為聲卡依其與計(jì)算機(jī)的連接方式不同,分為ISA總線、總線、PCI總總 線和通過線和通過USB電纜連接的外置方式。電纜連接的外置方式。 (4) 聲卡所支持的聲道數(shù)也是聲卡技術(shù)發(fā)展的重要標(biāo)志之一,聲卡所支持的聲道數(shù)也是聲卡

38、技術(shù)發(fā)展的重要標(biāo)志之一, 它決定了聲卡的基本功能。通常有它決定了聲卡的基本功能。通常有2聲道(即立體聲)、聲道(即立體聲)、2.1聲聲 道、道、4.1聲道、聲道、5.1聲道甚至聲道甚至7.1聲道等,多通道聲卡是營造逼真聲道等,多通道聲卡是營造逼真 音效環(huán)境的先決條件。音效環(huán)境的先決條件。 第3章數(shù)字音頻處理技術(shù) 第3章數(shù)字音頻處理技術(shù) 多媒體電腦將其聲音文件通過電腦中的聲卡,將數(shù)字音頻信號轉(zhuǎn)為多媒體電腦將其聲音文件通過電腦中的聲卡,將數(shù)字音頻信號轉(zhuǎn)為 模擬音頻信號再由其輸出口輸出,這時(shí)音頻信號電平較弱,一般只模擬音頻信號再由其輸出口輸出,這時(shí)音頻信號電平較弱,一般只 有幾百毫伏,還不能推動(dòng)喇叭

39、正常工作。而推動(dòng)喇叭正常工作的電有幾百毫伏,還不能推動(dòng)喇叭正常工作。而推動(dòng)喇叭正常工作的電 壓一般需要幾伏左右的信號電壓。這時(shí)就需要將聲卡輸出的小信號壓一般需要幾伏左右的信號電壓。這時(shí)就需要將聲卡輸出的小信號 通過放大器(俗稱功放)加以放大。放大后的音頻信號就可以推動(dòng)通過放大器(俗稱功放)加以放大。放大后的音頻信號就可以推動(dòng) 喇叭將音頻電信號轉(zhuǎn)換為聲音信號了。而現(xiàn)在最新推出的喇叭將音頻電信號轉(zhuǎn)換為聲音信號了。而現(xiàn)在最新推出的USB多媒多媒 體音箱則可以不需要聲卡,它通過電腦的體音箱則可以不需要聲卡,它通過電腦的USB接口輸出端引入數(shù)字接口輸出端引入數(shù)字 音頻信號,然后音頻信號,然后USB多媒體

40、音箱將此信號通過內(nèi)部專用的多媒體音箱將此信號通過內(nèi)部專用的USB IC 芯片轉(zhuǎn)換為模擬音頻信號,從而實(shí)現(xiàn)取代聲卡的功能。芯片轉(zhuǎn)換為模擬音頻信號,從而實(shí)現(xiàn)取代聲卡的功能。 第3章數(shù)字音頻處理技術(shù) 按照材質(zhì)不用分:塑料音響和木質(zhì)音響按照材質(zhì)不用分:塑料音響和木質(zhì)音響 按照功率放大器分:有源音箱和無源音箱按照功率放大器分:有源音箱和無源音箱 按照接口:普通聲卡接口,數(shù)字接口,按照接口:普通聲卡接口,數(shù)字接口,USB接口,接口, IEEE1394接口接口 按照聲道數(shù)分:多種類型按照聲道數(shù)分:多種類型 第3章數(shù)字音頻處理技術(shù) (1) 輸出功率是音箱最重要的指標(biāo),輸出功率分為額定功率和輸出功率是音箱最重要

41、的指標(biāo),輸出功率分為額定功率和 最大峰值功率兩種。最大峰值功率兩種。 額定功率是音箱諧波失真在標(biāo)準(zhǔn)范圍內(nèi)變化時(shí),音箱長額定功率是音箱諧波失真在標(biāo)準(zhǔn)范圍內(nèi)變化時(shí),音箱長 時(shí)間工作輸出功率的最大值。時(shí)間工作輸出功率的最大值。 最大峰值功率是在不損壞音箱的前提下,瞬時(shí)功率的最最大峰值功率是在不損壞音箱的前提下,瞬時(shí)功率的最 大值。大值。 (2) 頻率范圍是指音箱最低有效回放頻率和最高有效回放頻率頻率范圍是指音箱最低有效回放頻率和最高有效回放頻率 之間的范圍,單位為赫茲。之間的范圍,單位為赫茲。 頻率響應(yīng)是指將一個(gè)以恒定電壓輸出的音頻信號與音箱系頻率響應(yīng)是指將一個(gè)以恒定電壓輸出的音頻信號與音箱系 統(tǒng)相

42、連接時(shí),音箱產(chǎn)生的聲壓會隨頻率的變化而增大或衰減,統(tǒng)相連接時(shí),音箱產(chǎn)生的聲壓會隨頻率的變化而增大或衰減, 相位也會隨頻率而發(fā)生變化。相位也會隨頻率而發(fā)生變化。 聲壓、相位與頻率變化的曲線分別叫做幅頻特性和相頻特聲壓、相位與頻率變化的曲線分別叫做幅頻特性和相頻特 性,合稱頻率特性。性,合稱頻率特性。 第3章數(shù)字音頻處理技術(shù) (3) 信噪比是指音箱回放的有效信號與噪聲信號的比值,單位信噪比是指音箱回放的有效信號與噪聲信號的比值,單位 是分貝(是分貝(dB)。信噪比越高越好。)。信噪比越高越好。 (4) 失真度分為諧波失真、互調(diào)失真和瞬態(tài)失真失真度分為諧波失真、互調(diào)失真和瞬態(tài)失真3種。種。 諧波失真

43、是指聲音回放中由于增加了原信號沒有的高次諧波失真是指聲音回放中由于增加了原信號沒有的高次 諧波成分而導(dǎo)致的失真;諧波成分而導(dǎo)致的失真; 互調(diào)失真影響到的主要是聲音的音調(diào)方面;互調(diào)失真影響到的主要是聲音的音調(diào)方面; 瞬態(tài)失真是因?yàn)閾P(yáng)聲器具有一定的慣性質(zhì)量,盆體的振瞬態(tài)失真是因?yàn)閾P(yáng)聲器具有一定的慣性質(zhì)量,盆體的振 動(dòng)無法跟上瞬間變化的電信號的振動(dòng)而導(dǎo)致的原信號與回放音動(dòng)無法跟上瞬間變化的電信號的振動(dòng)而導(dǎo)致的原信號與回放音 色之間的差異。色之間的差異。 第3章數(shù)字音頻處理技術(shù) (5) 靈敏度是指產(chǎn)生全功率輸出時(shí)的輸入信號。輸入信號越低,靈敏度是指產(chǎn)生全功率輸出時(shí)的輸入信號。輸入信號越低, 靈敏度越高

44、,音箱性能就越好。音箱的靈敏度每差靈敏度越高,音箱性能就越好。音箱的靈敏度每差3dB,輸出,輸出 的聲壓就相差一倍,一般的聲壓就相差一倍,一般84dB以下為低靈敏度,以下為低靈敏度,87dB為中靈敏為中靈敏 度,度,90dB以上為高靈敏度。以上為高靈敏度。 (6) 阻抗是指揚(yáng)聲器輸入信號的電壓與電流的比值。阻抗是指揚(yáng)聲器輸入信號的電壓與電流的比值。 音箱的輸入阻抗一般分為高阻抗和低阻抗兩種:高于音箱的輸入阻抗一般分為高阻抗和低阻抗兩種:高于16 的是高阻抗,低于的是高阻抗,低于8的是低阻抗,音箱的標(biāo)準(zhǔn)阻抗是的是低阻抗,音箱的標(biāo)準(zhǔn)阻抗是8。 在功放與輸出功率相同的情況下,低阻抗的音箱可以獲得較大

45、在功放與輸出功率相同的情況下,低阻抗的音箱可以獲得較大 的輸出功率,但阻抗太低又會造成欠阻尼和低音劣化等現(xiàn)象。的輸出功率,但阻抗太低又會造成欠阻尼和低音劣化等現(xiàn)象。 第3章數(shù)字音頻處理技術(shù) MIDI( Musical Instrument Digital Interface)是音樂樂器數(shù)字接)是音樂樂器數(shù)字接 口???。MIDI是一種技術(shù)規(guī)范,它定義了為把電子樂器連接到計(jì)算機(jī)所需是一種技術(shù)規(guī)范,它定義了為把電子樂器連接到計(jì)算機(jī)所需 要的電纜和端口的一種硬件標(biāo)準(zhǔn),也定義了控制計(jì)算機(jī)和具有要的電纜和端口的一種硬件標(biāo)準(zhǔn),也定義了控制計(jì)算機(jī)和具有MIDI接接 口的設(shè)備之間進(jìn)行消息交換的一整套規(guī)則,包括電

46、子樂器之間傳送數(shù)據(jù)口的設(shè)備之間進(jìn)行消息交換的一整套規(guī)則,包括電子樂器之間傳送數(shù)據(jù) 的通信協(xié)議。的通信協(xié)議。 MIDI(樂器數(shù)字接口)是數(shù)字音樂的國際標(biāo)準(zhǔn),任何電子樂器,(樂器數(shù)字接口)是數(shù)字音樂的國際標(biāo)準(zhǔn),任何電子樂器, 只要有處理只要有處理MIDI指令的微處理器,并有合適的硬件接口,都可以成為指令的微處理器,并有合適的硬件接口,都可以成為 一個(gè)一個(gè)MIDI設(shè)備。設(shè)備。MIDI的音樂符號化過程實(shí)際上就是產(chǎn)生的音樂符號化過程實(shí)際上就是產(chǎn)生MIDI協(xié)議信協(xié)議信 息的過程。它沒有波形聲音那種數(shù)字化采樣和編碼過程,而是將電子樂息的過程。它沒有波形聲音那種數(shù)字化采樣和編碼過程,而是將電子樂 器鍵盤的彈奏

47、過程記錄下來,作為某首樂譜的一種數(shù)字描述的器鍵盤的彈奏過程記錄下來,作為某首樂譜的一種數(shù)字描述的MIDI消消 息。當(dāng)需要重新產(chǎn)生這首樂譜時(shí),只需要從息。當(dāng)需要重新產(chǎn)生這首樂譜時(shí),只需要從MIDI文件中讀出相應(yīng)的文件中讀出相應(yīng)的 MIDI消息再通過音樂合成器生成音樂聲波,經(jīng)放大后由揚(yáng)聲器播出。消息再通過音樂合成器生成音樂聲波,經(jīng)放大后由揚(yáng)聲器播出。 第3章數(shù)字音頻處理技術(shù) MIDI有以下常用的術(shù)語有以下常用的術(shù)語 (1)MIDI音樂合成器音樂合成器 利用數(shù)字信號處理器或其他芯片來產(chǎn)生音樂或聲音的電子裝利用數(shù)字信號處理器或其他芯片來產(chǎn)生音樂或聲音的電子裝 置。置。 (2)MIDI消息或指令消息或指

48、令 樂譜的一種記錄格式,相當(dāng)于樂譜語言。樂譜的一種記錄格式,相當(dāng)于樂譜語言。 (3)MIDI接口接口 MIDI硬件通信協(xié)議。硬件通信協(xié)議。 (4)MIDI通道通道 共共16個(gè)通道,其中個(gè)通道,其中110通道作擴(kuò)展合成器,通道作擴(kuò)展合成器,1316用作基本用作基本 合成器合成器 (5)MIDI文件文件 由控制數(shù)據(jù)和樂譜信息數(shù)據(jù)構(gòu)成。由控制數(shù)據(jù)和樂譜信息數(shù)據(jù)構(gòu)成。 (6)音序器)音序器 是為是為MIDI作曲而設(shè)計(jì)的計(jì)算機(jī)程序或電子裝置。作曲而設(shè)計(jì)的計(jì)算機(jī)程序或電子裝置。 第3章數(shù)字音頻處理技術(shù) 1. 存儲容量??;存儲容量小; 2. 具有背景音樂或音響效果的配音功能;具有背景音樂或音響效果的配音功能

49、; 3. 便于編輯和修改;便于編輯和修改; 4. 可以在可以在MIDI合成器中完全重現(xiàn)原來的演奏。合成器中完全重現(xiàn)原來的演奏。 根據(jù)根據(jù)MIDI的特點(diǎn),在以下幾種情況下比較適合用的特點(diǎn),在以下幾種情況下比較適合用MIDI譜曲:譜曲: (1)需要播放長時(shí)間的高質(zhì)量的音樂。)需要播放長時(shí)間的高質(zhì)量的音樂。 (2)需要以音樂作背景音響效果,同時(shí)從)需要以音樂作背景音響效果,同時(shí)從 CD一一ROM裝載裝載 其他音樂文件。其他音樂文件。 (3)需要以音樂作背景音響效果,同時(shí)播放波形音頻,以)需要以音樂作背景音響效果,同時(shí)播放波形音頻,以 實(shí)現(xiàn)語音和音樂的同時(shí)輸出。實(shí)現(xiàn)語音和音樂的同時(shí)輸出。 第3章數(shù)字音

50、頻處理技術(shù) MIDI規(guī)范規(guī)定,每種規(guī)范規(guī)定,每種MIDI裝置通常由一個(gè)接收器和一個(gè)發(fā)送器組裝置通常由一個(gè)接收器和一個(gè)發(fā)送器組 成,如果該裝置只作輸出端或輸入端,則可以省去其中之一。成,如果該裝置只作輸出端或輸入端,則可以省去其中之一。 接收器可以接收接收器可以接收MIDI格式的消息,并執(zhí)行格式的消息,并執(zhí)行MIDI命令;命令; 發(fā)送器可以生成符合發(fā)送器可以生成符合MIDI格式的消息并向外發(fā)送。格式的消息并向外發(fā)送。 一個(gè)接收器和一個(gè)發(fā)送器構(gòu)成一對一個(gè)接收器和一個(gè)發(fā)送器構(gòu)成一對MIDI消息輸入輸出組合,它們消息輸入輸出組合,它們 之間用一種通用的異步收發(fā)器互相連接,數(shù)據(jù)傳輸?shù)谋忍芈蕿橹g用一種通

51、用的異步收發(fā)器互相連接,數(shù)據(jù)傳輸?shù)谋忍芈蕿?3125bps,每個(gè)數(shù)據(jù)字節(jié)(,每個(gè)數(shù)據(jù)字節(jié)(8位)前后各有一個(gè)起始位和停止位。位)前后各有一個(gè)起始位和停止位。 MIDI設(shè)備的端口有三種:設(shè)備的端口有三種:MIDI In(輸入口)、(輸入口)、MIDI Out(輸出(輸出 口)和口)和MIDI Thru(傳送口)。(傳送口)。 MIDI規(guī)范規(guī)定,規(guī)范規(guī)定,MIDI鍵盤共有鍵盤共有128個(gè)鍵。個(gè)鍵。MIDI消息可以描述每個(gè)消息可以描述每個(gè) 音符對應(yīng)的鍵號、按鍵持續(xù)時(shí)間、音量和力度等信息。音符對應(yīng)的鍵號、按鍵持續(xù)時(shí)間、音量和力度等信息。 MIDI接收器有接收器有16個(gè)聲道(個(gè)聲道(Channel),它

52、們可以同時(shí)向聲音合成),它們可以同時(shí)向聲音合成 器傳送器傳送16路不同的聲音。路不同的聲音。 第3章數(shù)字音頻處理技術(shù) MIDI 音樂的產(chǎn)生過程音樂的產(chǎn)生過程 MIDI 電子樂器電子樂器 MIDI接口接口 音序器音序器 音樂合成器音樂合成器 MIDI文件文件 揚(yáng)聲器揚(yáng)聲器 MIDI指令指令 計(jì)算機(jī)音頻卡計(jì)算機(jī)音頻卡 模擬音頻信號模擬音頻信號 聲頻卡的聲頻卡的MIDI音樂合成主要有兩種方法:音樂合成主要有兩種方法: FM 數(shù)字式頻率調(diào)制合成法。數(shù)字式頻率調(diào)制合成法。 波形表合成法。波形表合成法。 第3章數(shù)字音頻處理技術(shù) MIDI作曲和核配器系統(tǒng)核心部分是一個(gè)被稱為序列器的軟件。這個(gè)軟件作曲和核配器

53、系統(tǒng)核心部分是一個(gè)被稱為序列器的軟件。這個(gè)軟件 即可以裝到個(gè)人電腦里,也可做在一個(gè)專門的硬件里。序列器實(shí)際上是即可以裝到個(gè)人電腦里,也可做在一個(gè)專門的硬件里。序列器實(shí)際上是 一個(gè)音樂詞處理器(一個(gè)音樂詞處理器(word porcessor),應(yīng)用它可以記錄、播放和編輯各),應(yīng)用它可以記錄、播放和編輯各 種不同種不同MIDI樂器演奏出的樂曲。序列器并不真正的記錄聲音,它只記錄樂器演奏出的樂曲。序列器并不真正的記錄聲音,它只記錄 和播放和播放MIDI信息,這些信息從信息,這些信息從MIDI樂器來的電腦信息,就像印在紙上樂器來的電腦信息,就像印在紙上 的樂譜一樣,它本身不能直接產(chǎn)生音樂,的樂譜一樣,

54、它本身不能直接產(chǎn)生音樂,MIDI本身也不能產(chǎn)生音樂,但本身也不能產(chǎn)生音樂,但 是它包含有如何產(chǎn)生音樂所需的所有指令,例如用什么樂器、奏什么音是它包含有如何產(chǎn)生音樂所需的所有指令,例如用什么樂器、奏什么音 符、奏得多快,奏得力度多強(qiáng)等。符、奏得多快,奏得力度多強(qiáng)等。 序列器可以是硬件,也可以是軟件,它們作用過程完全與專業(yè)錄音棚里序列器可以是硬件,也可以是軟件,它們作用過程完全與專業(yè)錄音棚里 多軌錄音機(jī)一樣,可以把許多獨(dú)立的聲音記錄在序列器里,其區(qū)別僅僅多軌錄音機(jī)一樣,可以把許多獨(dú)立的聲音記錄在序列器里,其區(qū)別僅僅 是序列器只記錄演奏時(shí)的是序列器只記錄演奏時(shí)的MIDI數(shù)據(jù),而不記錄聲音;它可以一軌

55、一軌地?cái)?shù)據(jù),而不記錄聲音;它可以一軌一軌地 進(jìn)行錄制,也可以一軌軌地進(jìn)行修改,當(dāng)你彈鍵盤音樂時(shí),序列器記錄進(jìn)行錄制,也可以一軌軌地進(jìn)行修改,當(dāng)你彈鍵盤音樂時(shí),序列器記錄 下從鍵盤來的下從鍵盤來的MIDI數(shù)據(jù)。一旦把所需要的數(shù)據(jù)存儲下來以后,可以播放數(shù)據(jù)。一旦把所需要的數(shù)據(jù)存儲下來以后,可以播放 你剛作好的曲子。如果你覺得這一聲部的曲子不錯(cuò),可以把別的聲部加你剛作好的曲子。如果你覺得這一聲部的曲子不錯(cuò),可以把別的聲部加 上去,新加上去的聲部播放時(shí)完全與第一道同步。上去,新加上去的聲部播放時(shí)完全與第一道同步。 MIDI系統(tǒng)是如何工作的系統(tǒng)是如何工作的 第3章數(shù)字音頻處理技術(shù) MIDI程序的設(shè)計(jì)目標(biāo)就是要將所要演奏的音

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論