常見音頻文件格式和處理工具_第1頁
常見音頻文件格式和處理工具_第2頁
常見音頻文件格式和處理工具_第3頁
常見音頻文件格式和處理工具_第4頁
常見音頻文件格式和處理工具_第5頁
已閱讀5頁,還剩73頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

常見音頻文件格式和處理工具第4章多媒體音頻信號處理4.1音頻信號概述4.2音頻信號的獲取與處理4.3話音信號的參數(shù)編碼4.4樂器數(shù)字接口MIDI4.5聲卡概述常見音頻文件格式和處理工具4.1音頻信號概述 4.1.1信號的描述及分類

1.確定信號及隨機信號 能夠用一確定的時間函數(shù)來表示的信號就是確定信號。這種信號對應(yīng)某一時刻都有一個確定的信號值。 有一些信號具有不可預(yù)知的不確定性,這種信號就是隨機信號。 我們將要研究的音頻信號、視頻信號以至計算機中的數(shù)字信號均為確定信號。常見音頻文件格式和處理工具 2.周期信號與非周期信號 按一定時間間隔周而復(fù)始重復(fù)的信號就是周期信號,而在時間上不具有周而復(fù)始的重復(fù)特性的信號就是非周期信號。

3.連續(xù)信號與離散信號 信號隨時間的取值是連續(xù)的,這樣的信號就是連續(xù)信號。如果信號在時間上的取值是離散的,則這種信號就稱為離散信號。可見,離散信號在時間上是離散的,但信號在幅度上可以是連續(xù)的,也可以是離散的。常見音頻文件格式和處理工具 4.模擬信號與數(shù)字信號 如果信號在時間上和幅度上都是連續(xù)的,那么這樣的信號就是模擬信號。模擬信號以一定時間間隔取值,則可獲得離散信號,又稱之為采樣信號。若將離散信號進行二進制編碼,以二進制編碼來表示離散值的幅度,那么這種二進制編碼信號叫做數(shù)字信號。 在本書后面的討論中可以看到,話筒或攝像機產(chǎn)生的信號為模擬信號。模擬信號經(jīng)過采樣可獲得離散信號,離散信號經(jīng)A/D轉(zhuǎn)換變成二進制的數(shù)字信號,數(shù)字信號就可以由計算機直接進行處理了。 模擬信號、離散信號與二進制編碼的數(shù)字信號之間的關(guān)系表示在圖4-1上。常見音頻文件格式和處理工具圖4-1模擬信號、離散信號及數(shù)字信號常見音頻文件格式和處理工具

圖4-1中,用連續(xù)變化的曲線表示模擬信號;用圓點表示以相等時間間隔取值而得到的離散信號;圖4-1的縱坐標(biāo)上標(biāo)的是幅度的二進制編碼值。

4.1.2采樣定理及信號重構(gòu)

1.采樣定理 設(shè)輸入信號是帶寬有限的信號,最高信號頻率為fm,則從采樣得到信號序列(離散信號)重構(gòu)(復(fù)現(xiàn))連續(xù)信號的條件是采樣頻率fs≥2fm,否則,將產(chǎn)生混迭效應(yīng),而使信號失真。頻率2fm稱為奈奎斯特(Nyquist)頻率fq,fq=2fm。 時域信號與它的傅立葉變換頻譜密度如圖4-2所示。常見音頻文件格式和處理工具圖4-2時域信號及其頻譜密度常見音頻文件格式和處理工具 2.信號重構(gòu) 設(shè)時域信號為x(t),對應(yīng)的頻譜密度為X(f),若時域采樣脈沖序列為

是等間隔(T)的單位脈沖序列,由信號理論可知對應(yīng)的頻譜為

是一個等間隔(fs)頻域沖激序列。其中T是時域采樣序列的周期,即采樣頻率

常見音頻文件格式和處理工具

可以寫出時域采樣序列的表達式,即

x*(t)就是x(t)在t=nT處的離散序列。 由卷積定理,時域的乘積對應(yīng)頻域的卷積,即

因為是一個沖激序列,卷積的結(jié)果相當(dāng)于X(f)搬移至序列出現(xiàn)的地方,從而成為周期函數(shù)。x(t)在時域的采樣與X(f)在頻域卷積(搬移)的關(guān)系如圖4-3所示。常見音頻文件格式和處理工具圖4-3時域采樣與頻域卷積常見音頻文件格式和處理工具

可見,若fs=1/T不是足夠大,采樣以后對應(yīng)的頻譜就會產(chǎn)生混迭,用矩形(帶通)濾波器濾波所得的主頻譜就會失真,恢復(fù)到時域以后,時域連續(xù)信號也將失真。因此,采樣頻率fs必須滿足采樣定理的要求,即fs≥2fm

。圖4-4音頻信號的帶寬常見音頻文件格式和處理工具4.2音頻信號的獲取與處理 4.2.1音頻信號

1.常見音頻信號 常見的音頻信號主要有電話音頻信號、調(diào)頻、調(diào)幅無線電廣播音頻信號和高保真數(shù)字的立體聲音頻信號。由于用途不同,這些音頻信號頻帶寬度也各不相同,而且,在音響設(shè)備中,通常以音頻信號的帶寬來衡量聲音的質(zhì)量。圖4-4中表示了這4種常見音頻信號的帶寬。常見音頻文件格式和處理工具

圖4-4表示了人們公認(rèn)的音頻信號的質(zhì)量標(biāo)準(zhǔn)。其中,等級最高的是激光唱盤的音頻信號;其次是調(diào)頻無線電廣播,調(diào)幅無線電廣播;最低的是電話話音的頻帶,從0.2kHz到3.4kHz,帶寬只有3.2kHz。

2.聲音的特性

1)聲音的波動性 任何物體的振動通過空氣的傳播都會形成連續(xù)或間斷的波動,這種波動引起人的耳膜的振動,變?yōu)槿说穆犛X。因此,聲音是一種連續(xù)或間斷的波動。

常見音頻文件格式和處理工具 2)聲音的三要素 音調(diào)、音強和音色稱為聲音的三要素。其中,音調(diào)與聲波的頻率相關(guān),頻率高則音調(diào)高,頻率低則音調(diào)低。音調(diào)高時聲音尖銳,俗稱高音;音調(diào)低時聲音沉悶,俗稱低音。人的耳朵對于聲音的感知頻率范圍為20Hz~20kHz之間。低于20Hz的聲波為次聲波,高于20kHz的聲波稱為超聲波。音強取決于聲波的幅度,振幅高時音強強,振幅低時音強弱。音色則由疊加在聲音基波上的諧波所決定,一個聲波上的諧波越豐富,音色越好。常見音頻文件格式和處理工具 3)聲音的連續(xù)譜 聲音信號一般為非周期信號,包含有一定頻帶的所有頻率分量,其頻譜是連續(xù)譜。聲波的連續(xù)譜成分使聲音聽起來飽滿、生動。

4)聲音的方向性 聲音的傳播是以彈性波形式進行的,傳播具有方向性,人通過到達左右兩耳聲波的時間差及聲音強度差異來辨別聲音的方向。聲音的方向性是產(chǎn)生立體聲效果和空間效果的基礎(chǔ)。常見音頻文件格式和處理工具 3.音頻的種類 在自然界中,聲音包含聲響、語音和音樂等三種形式。在多媒體系統(tǒng)中,聲音不論是何種形式都是一種裝載信息的媒體,統(tǒng)稱為音頻。由產(chǎn)生音頻的方式不同音頻被分為波形音頻,MIDI音頻和CD音頻三類。

1)波形音頻 以聲波表示的聲響、語音、音樂等各種形式的聲音經(jīng)過聲音獲取設(shè)備(例如麥克風(fēng))和聲音播放設(shè)備(例如錄音機、CD唱機等)輸入,并通過聲卡控制采樣,由A/D轉(zhuǎn)換將模擬信號轉(zhuǎn)變成數(shù)字信號,然后以*.WAV文件格式存儲在硬盤上,這種聲音媒體稱為波形音頻。波形音頻重放時,必須經(jīng)過D/A轉(zhuǎn)換將數(shù)字信號轉(zhuǎn)換成模擬信號,由聲卡上的混音器混合后生成聲波,再由音箱輸出聲音。常見音頻文件格式和處理工具

波形音頻的*.WAV文件中記錄的是數(shù)字信號,可以使用計算機對*.WAV文件進行各種處理,并像其他數(shù)據(jù)文件一樣被存取、復(fù)制和傳輸。

2)MIDI音頻 將電子樂器演奏時的指令信息(例如音高、音長和力度等)通過聲卡上的MIDI控制器輸入計算機,或者利用一種稱為音序器的計算機音樂處理軟件編輯產(chǎn)生音樂指令集合,以*.MID文件格式存儲在硬盤上,這種聲音媒體稱為MIDI音頻。MIDI音頻重放時,必須經(jīng)過合成器將MIDI指令譯成相應(yīng)的聲音信號,再由聲卡上的混音器混合后生成聲波,最后由音箱播出音樂。

常見音頻文件格式和處理工具 MIDI音頻的*.MID文件中可以包含多達16種不同樂器的聲音定義。MIDI文件記錄的不是樂曲本身,而是一些描述樂曲演奏過程中的指令,因此,MIDI音頻是樂譜的數(shù)字化描述。MIDI文件的存儲量比較小,因此,它可以滿足較長時間音樂播放的要求,但是MIDI文件的錄制工作較為復(fù)雜,需要使用MIDI創(chuàng)作并改編作品的專業(yè)知識以及專門化工具,例如鍵盤合成器等。

3)CD音頻

CD音頻是指以44.1kHz頻率、16位精度采樣而獲得的一種立體聲數(shù)字化聲音。常見音頻文件格式和處理工具 4.2.2音頻信號的獲取與處理

1.音頻信號的獲取 音頻信號的獲取框圖如圖4-5所示。圖4-5音頻信號獲取框圖常見音頻文件格式和處理工具 2.音頻信號的處理 在第3章里已經(jīng)提到,不管多媒體信息是音頻信號還是視頻信號,其數(shù)據(jù)量都是十分巨大的。如果像圖4-5所示的那樣,經(jīng)A/D轉(zhuǎn)換的數(shù)字化音頻信號直接進入計算機進行存儲(記錄)或進行傳送,是不可取的。

3.音頻信號的回放 經(jīng)壓縮的音頻信號以一定的格式記錄在有關(guān)的媒體上,例如,磁帶、磁盤及光盤等,或者以一定的格式傳送到接收端。 在音頻信號接收端或由媒體回放音頻信號時,首先由專用的硬件或軟件對壓縮數(shù)據(jù)進行解壓縮,恢復(fù)音頻數(shù)字信號,然后,經(jīng)由圖4-6所示的電路框圖對音頻信號進行放音。常見音頻文件格式和處理工具圖4-6音頻信號的回放框圖常見音頻文件格式和處理工具 4.有關(guān)音頻信號的標(biāo)準(zhǔn)及規(guī)范 在第1章中,已經(jīng)特別說明標(biāo)準(zhǔn)及規(guī)范在多媒體世界中的重要性。這里,首先闡明數(shù)字電話音頻信號的數(shù)據(jù)壓縮標(biāo)準(zhǔn)。在表4-1中列出了國際電報電話咨詢委員會(CCITT),歐洲移動通信專家組(GSM),美國移動通信標(biāo)準(zhǔn)(CTIA)及美國國家安全局各自制定的有關(guān)電話通信的編碼標(biāo)準(zhǔn)。表中還給出了各種標(biāo)準(zhǔn)的大致使用領(lǐng)域以及它們的質(zhì)量,其中,質(zhì)量是以最高為5.0分來表示的。

常見音頻文件格式和處理工具

除了上面所提到的數(shù)字電話編碼標(biāo)準(zhǔn)外,調(diào)幅廣播的音頻信號范圍為50Hz~7kHz,又稱“7kHz音頻信號”,其最高頻率為7kHz,當(dāng)使用16kHz對其采樣并進行14位二進制編碼時,其數(shù)據(jù)的傳送速率為224KB/s。為了對最高頻率進行壓縮,CCITT于1988年為其制定了G.722標(biāo)準(zhǔn),標(biāo)準(zhǔn)規(guī)定這種信號的數(shù)據(jù)傳送率為64KB/s。常見音頻文件格式和處理工具表4-1數(shù)字電話的編碼標(biāo)準(zhǔn)組織ISOCCITT標(biāo)準(zhǔn)

G.711G.712G.728制定時間1992197219841992傳送速率(Kb/s)128643216編碼算法

PCMADPCMLD–CELP質(zhì)量5.04.34.14.0使用場合CD長途電話網(wǎng)絡(luò)常見音頻文件格式和處理工具GSMCTIANSAGSMGIA

19831989198919821384.82.4RPE–LTVSELPCELPLPC3.73.83.22.5移動通信保密電話常見音頻文件格式和處理工具 5.常用語音文件格式 在多媒體計算機的語音處理或在后面將要說明的聲卡中所用到的操作系統(tǒng)或工具軟件為我們提供了語音文件。這些語音文件都有各自的標(biāo)準(zhǔn),以便于用戶使用和相互轉(zhuǎn)換。在這里將簡要介紹目前最常見的語音文件格式。

1)VOC語音文件格式

VOC語音文件由文件頭和數(shù)據(jù)塊兩大部分組成。其中VOC語音文件的文件頭如表4-2所示。常見音頻文件格式和處理工具表4-2VOC語音文件的文件頭偏移地址內(nèi)容00~13H文件類型14~15H從VOC文件開始到數(shù)據(jù)塊的偏移量16~17HVOC文件版本號18~19HVOC文件標(biāo)志1AHVOC文件的數(shù)據(jù)塊標(biāo)志1B~1DH數(shù)據(jù)塊長度1EH數(shù)據(jù)采樣率常見音頻文件格式和處理工具

由表4-2看到,VOC文件的文件頭主要是對VOC文件的類型、版號及標(biāo)志做出說明,同時,指出了數(shù)據(jù)塊的起始地址、數(shù)據(jù)塊長度及采樣率。

VOC文件中數(shù)據(jù)塊由性質(zhì)不盡相同的子塊組合而成。各子塊的功能及其長度也各不相同,例如有語音數(shù)據(jù)子塊、靜音標(biāo)志子塊、ASCII碼字符子塊、循環(huán)重復(fù)子塊、終止子塊及用于立體聲音響的擴展子塊等。VOC文件中數(shù)據(jù)子塊的長度及主要功能列于表4-3中。常見音頻文件格式和處理工具表4-3VOC文件中數(shù)據(jù)子塊的長度及主要功能數(shù)據(jù)子塊號長度功能01B(字節(jié))終止塊17B+?語音數(shù)據(jù)25B+?語音數(shù)據(jù)37B靜音46B標(biāo)志56B+?ASCII字符66B循環(huán)重復(fù)74B循環(huán)結(jié)束87B+?擴展塊常見音頻文件格式和處理工具

不同子塊的開始幾個字節(jié)除前面4個如上所述外,剩下的就不太相同,表4-3中用?表示。例如,1號數(shù)據(jù)子塊的開始字節(jié)中,有規(guī)定本數(shù)據(jù)塊的數(shù)據(jù)壓縮比的字節(jié)。知道了壓縮比,就可以解壓縮恢復(fù)原始的語音數(shù)據(jù)。

2)WAV語音文件格式 在多媒體應(yīng)用中被廣泛使用的是RIFF(ResourceInterchange)標(biāo)準(zhǔn)給出的WAV語音文件。 與VOC文件類似,WAV文件也是由文件頭和數(shù)據(jù)塊兩部分組成。其中文件頭所規(guī)定的內(nèi)容如表4-4所示。常見音頻文件格式和處理工具表4-4WAV語音文件的文件頭偏移地址字節(jié)數(shù)類型內(nèi)容00H~03H4B字符‘RIFF’04H~07H4B長整數(shù)從下一個地址(08H)開始到文件結(jié)束的總字節(jié)數(shù)08H~0BH4B字符‘WAVE’0CH~0FH4B字符‘fmt’常見音頻文件格式和處理工具10H~11H2B整數(shù)文件標(biāo)志12H~13H2B整數(shù)目前為114H~15H2B整數(shù)聲道數(shù)16H~19H4B長整數(shù)采樣率1AH~1DH4B長整數(shù)每秒平均字節(jié)數(shù)常見音頻文件格式和處理工具

由表4-4可見,WAV語音文件頭也是對文件設(shè)置了一些標(biāo)志并確定了對語音信號的采集速率。單聲道語音信號用11.025kHz的采樣率采樣,采樣值為8bit二進制編碼,雙聲道語音信號用44.1kHz采樣率采樣,即左右聲道各為22.05kHz采樣,每聲道采樣值用8bit二進制編碼表示,這樣一來,每個語音采樣值要用16bit表示,且高8位放左聲道的數(shù)據(jù),低8位放右聲道的數(shù)據(jù)。具體數(shù)據(jù)塊的存放情況如表4-5所示。 表4-5表明,數(shù)據(jù)塊緊跟在文件頭的后面,其偏移地址從1EH開始,前面是數(shù)據(jù)塊的標(biāo)志和數(shù)據(jù)塊的總長度。從偏移地址26H開始存放語音數(shù)據(jù)。常見音頻文件格式和處理工具表4-5WAV文件中的數(shù)據(jù)塊存放偏移地址字節(jié)數(shù)(B)類型內(nèi)容1EH~21H4B字符‘data’22H~25H4B長整數(shù)采樣數(shù)據(jù)總字節(jié)數(shù)??26H~…8位整數(shù)采樣數(shù)據(jù)常見音頻文件格式和處理工具

以上我們簡單地介紹了兩種語音文件VOC和WAV。前者是我們在本章后面要介紹的聲霸卡所形成的文件格式,后者是Microsoft的語音文件格式。在實際應(yīng)用中,經(jīng)常需要知道這些語音文件的格式,而且也經(jīng)常會遇到由WAV文件向VOC文件的轉(zhuǎn)換或由VOC文件向WAV文件的轉(zhuǎn)換。所幸的是這兩種文件的相互轉(zhuǎn)換已有現(xiàn)成的程序可供調(diào)用,這就省了許多麻煩。使用者只要用一條簡單的命令即可方便地完成它們之間的相互轉(zhuǎn)換。但是,由于兩種文件的復(fù)雜性,在利用軟件命令進行兩種文件格式轉(zhuǎn)換時,應(yīng)注意,WAV文件只支持11.025kHz、22.05kHz和44.1kHz采樣率,因此,在形成VOC文件時也要采用這樣的采樣率才能順利地進行相互轉(zhuǎn)換。常見音頻文件格式和處理工具 VOC文件中可包括多個數(shù)據(jù)塊,而WAV文件只支持一個數(shù)據(jù)塊,且只能用一種采樣速率播放出來。因此,在WAV和VOC文件相互轉(zhuǎn)換時,只能是功能強的VOC文件來適應(yīng)WAV文件的規(guī)定。 同時,WAV文件不支持壓縮文件,因此,當(dāng)VOC文件向WAV文件轉(zhuǎn)換時,VOC文件中的壓縮數(shù)據(jù)塊將被忽略。

3.AU聲音文件格式

AU文件是使用于UNIX操作系統(tǒng)下的一種波形文件。其格式如表4-6所示。常見音頻文件格式和處理工具表4-6AU文件格式偏移量內(nèi)容偏移量內(nèi)容0~3AU文件標(biāo)志16~19數(shù)據(jù)采樣頻率4~7文件頭長度20~23聲道數(shù)N(1為單聲道、2位雙聲道)8~11數(shù)據(jù)長度24~(x–1)附加描述信息(其中x為文件頭長度)12~15波形格式文件x~聲音數(shù)據(jù)常見音頻文件格式和處理工具 4.MID文件格式

MID文件是一種記錄數(shù)字化音樂的MIDI文件,由一個文件頭塊和多個音軌塊組成。文件頭塊記錄了MIDI文件的描述信息,而音軌塊記錄了MIDI通道的數(shù)據(jù)流信息。文件頭塊和音軌的格式分別如表4-7和4-8所示。常見音頻文件格式和處理工具表4-7MID文件頭偏移量內(nèi)容0~3MID文件頭標(biāo)識4~7文件頭塊長度8~15記錄格式。格式0:文件由包含所有16個通道數(shù)據(jù)的一個音軌組成。格式1:文件由一個或多個同步的音軌組成。格式2:文件由一個或多個獨立的音軌組成16~17音軌號18~19時間分割,規(guī)定了形成1/4音符節(jié)拍的時間長度常見音頻文件格式和處理工具表4-8MID音軌偏移量內(nèi)容偏移量內(nèi)容0~3MID音軌標(biāo)識8~音軌數(shù)據(jù)4~7音軌塊長度

常見音頻文件格式和處理工具4.3話音信號的參數(shù)編碼 4.3.1話音源 通過對人的話音生成機理研究,人們認(rèn)為,人的話音由聲道產(chǎn)生,可分為濁音和清音兩種類型。

1.濁音 濁音由聲帶振動產(chǎn)生的準(zhǔn)周期脈沖引起,每次振動使一股空氣從肺部流進聲道并激勵聲道,各股空氣之間的間隔稱為音調(diào)間隙或音調(diào)周期T。或者說,激勵的速度就是音調(diào)。常見音頻文件格式和處理工具 2.清音 清音由空氣通過聲道時,受聲道某些部分壓縮引起,較濁音更具有隨機性。話音信號的頻譜間隔對應(yīng)音調(diào)周期T,包絡(luò)信號是濁音在時域中實際波形的函數(shù)(音量大小),上限頻率fm=3~4kHz,一般取3.4kHz,存在三個峰點F1、F2、F3,即諧振峰,話音信號的時域波形及其頻譜如圖4-7所示。 通過對話音信號的分析可知,同一個人的話音信號的周期T大致是不變的。常見音頻文件格式和處理工具

圖4-7話音信號的時域波形及其頻譜話音信號(濁音)的時域波形;(b)話音信號(清音)的時域波形;(c)話音信號(濁音)的頻譜常見音頻文件格式和處理工具 4.3.2話音參數(shù)的編碼及聲碼器

1.參數(shù)編碼 在分析合成法中,根據(jù)話音生成模型,從話音波形中提取的參數(shù),主要有以下4種:

(1)濁音和清音。濁音用脈沖源模擬;清音用噪聲源模擬。

(2)濁音的基本頻率,或音調(diào)周期T。

(3)音源的幅度(音量大小)。

(4)線性濾波器的特性參數(shù)。它反映話音頻譜的包絡(luò)信息,表示發(fā)音器官發(fā)音的符性(不同的音符),用線性濾波器模擬發(fā)音。頻譜的包絡(luò)用于表征各個音符的區(qū)別。常見音頻文件格式和處理工具

分析合成法編碼步驟如下:

(1)從話音波形中提取攜帶重要聽覺信息的參數(shù);

(2)對這些參數(shù)進行編碼;

(3)利用這些參數(shù),盡可能準(zhǔn)確、自然地重構(gòu)原始話音。

2.聲碼器的工作原理

1)工作原理 利用濾波器組把話音頻率分成幾個相應(yīng)的頻帶,然后傳送各頻帶的話音成分(話音頻譜的包絡(luò)線),采樣(頻率較低)、編碼傳送到合成器的各頻段,控制(調(diào)制)脈沖發(fā)生器或噪聲發(fā)生器的各頻段的包絡(luò),從而合成語音。常見音頻文件格式和處理工具 2)聲碼器結(jié)構(gòu) 聲碼器結(jié)構(gòu)如圖4-8所示。它的工作過程如下:

(1)在發(fā)送端,話音信號加到分析器上,帶通濾波器將話音頻率范圍分為若干相鄰頻段,并由整流器和低通濾波器組成的包絡(luò)檢測器檢出各頻段時域合成信號包絡(luò)(反映時域語音包絡(luò)——強度),并對包絡(luò)進行采樣、編碼,由于包絡(luò)變化比較慢,因而采樣速度比較低,為50Hz/s。音調(diào)檢測器確定話音的基音頻率1/T(決定音調(diào)周期)和濁/清音。

常見音頻文件格式和處理工具 (2)接收端為話音合成器。 當(dāng)接收到濁音時,脈沖發(fā)生器工作,它的信號強度由各頻段上的包絡(luò)控制,多頻段合成后便得到合成后的語音。 當(dāng)接收到清音時,噪聲發(fā)生器工作。常見音頻文件格式和處理工具圖4-8聲碼器結(jié)構(gòu)圖常見音頻文件格式和處理工具4.4樂器數(shù)字接口MIDI 4.4.1計算機音樂 計算機音樂也稱為電子音樂,是由計算機音樂軟件創(chuàng)作、修改和編輯樂譜,通過合成器把數(shù)字樂譜變換成聲音波形,再經(jīng)過混音器混合后送到音箱播放的樂曲。計算機的數(shù)字合成技術(shù)可以模擬傳統(tǒng)樂曲的音色,也可以通過計算機的編輯功能合成不是自然樂器發(fā)出的聲音。計算機音樂改變了傳統(tǒng)音樂的創(chuàng)作和演奏方式的概念。常見音頻文件格式和處理工具 1.樂音的幾個要素 一個樂音主要由3個要素組成。

1)音高 音高指聲波的基頻。各音階的對應(yīng)頻率如表4-9所示。表4-9音階與頻率的對應(yīng)關(guān)系音階CDEFGAB簡譜1234567頻率(Hz)261293330349392440494常見音頻文件格式和處理工具 2)音色 有時,具有固定音高和相同諧波的樂音給人的感覺有很大差異。

3)響度和時值 響度是對聲音強度的衡量,它是聽判樂音的基礎(chǔ)。

2.計算機音樂的生成 計算機音樂系統(tǒng)由演奏控制器、音源和MIDI接口幾部分組成。

1)演奏控制器 演奏控制器是一種輸入和記錄實時樂曲演奏信息的設(shè)備,例如鋼琴模擬鍵盤。常見音頻文件格式和處理工具 2)音源 音源是計算機音樂系統(tǒng)的核心,是具體產(chǎn)生聲音波形的部分。

(1)數(shù)字合成音源。 合成FM音樂是使高頻振蕩波的頻率按調(diào)制信號規(guī)律變化的一種調(diào)制方式。在考慮音樂合成時,可以用頻率的單音調(diào)制信號去調(diào)制基波的相角,即

常見音頻文件格式和處理工具

對F(t)進行第一類貝塞爾函數(shù)展開可知,該調(diào)頻波F(t)由載波基頻ωc和無數(shù)對邊頻(±ωm,±2ωm,…)分量所組成,各諧波分量的幅值由調(diào)制指數(shù)I的值確定。因此,采用不同的調(diào)制波頻率ωm和調(diào)制指數(shù)I,就可以方便地合成不同頻譜分布的波形,再現(xiàn)某些樂器的音樂,還可以得到非真實樂器的“電子模擬聲”。常見音頻文件格式和處理工具 FM音樂合成單元電路的典型形成如圖4-9所示,只要給出ωc、ωm、A(t)、I(t)各項參數(shù),這個單元電路就能輸出某一特定的調(diào)角波F(t)。

圖4-9FM音樂合成單元電路常見音頻文件格式和處理工具

圖中PG是相位產(chǎn)生器,用于為所需頻率載波計算相位值,它通過累加每個單位時間的增量來實現(xiàn);EG是載頻包絡(luò)產(chǎn)生器,電路由ωc、A控制產(chǎn)生正弦載波信號,它的相角由ωm和I控制產(chǎn)生正弦調(diào)制信號決定。

YM3812是一種廣泛使用的FM音樂合成芯片,能夠在軟件的控制下產(chǎn)生變化極為豐富的各種音色。它的主要性能是: ˙以FM方式產(chǎn)生真實音響; ˙具有兩種工作模式,9聲道同時發(fā)音,可以產(chǎn)生6種旋律和5種節(jié)奏樂; ˙內(nèi)置顫音振蕩器/調(diào)幅(AM)振蕩器; ˙可采用正弦波組合方式合成語音; ˙輸入/輸出為TTL電平。常見音頻文件格式和處理工具

使用YM3812構(gòu)成的音樂系統(tǒng)如圖4-10所示。

圖4-10使用YM3812構(gòu)成的音樂系統(tǒng)框圖常見音頻文件格式和處理工具

該系統(tǒng)由微機通過總線傳輸必要的數(shù)據(jù),由YM3812轉(zhuǎn)換成相應(yīng)的音高、音色、響度等數(shù)字信號,經(jīng)過數(shù)/模轉(zhuǎn)換器DAC變成模擬量,并經(jīng)音頻功率放大器驅(qū)動音響輸出。 很多聲卡使用YM3812產(chǎn)生FM音樂,典型的產(chǎn)品是SoundBlaster。 廠家為這些產(chǎn)品配置了相應(yīng)的驅(qū)動軟件,用戶可以借助開發(fā)工具提供的高級語言界面進行音樂創(chuàng)作或演奏樂曲。

(2)采樣音源。使用FM合成法來產(chǎn)生逼真的樂音是不甚理想的,有些樂音幾乎不能產(chǎn)生,只在低檔聲卡采用。中、高檔聲卡采用樂音樣本合成法,即波表合成法。常見音頻文件格式和處理工具 (3)物理模型化音源。 物理模型化音源與合成音源和采樣音源有著本質(zhì)的區(qū)別,音源中既沒有波形發(fā)生器也不存在采樣波形,而是利用計算機的強大的處理功能和高速的實時響應(yīng)能力模擬出各種演奏信息的相應(yīng)聲波。

4.4.2MIDI接口

MIDI(MusicalInstrumentDigitalInterface)即樂器數(shù)字接口,是音樂與計算機結(jié)合的產(chǎn)物。它是一種計算機與MIDI設(shè)備之間連接的硬件,同時也是一種數(shù)字音樂的國際標(biāo)準(zhǔn)。常見音頻文件格式和處理工具 1.MIDI基本概念

MIDI接口規(guī)范由兩部分組成。

1)硬件連接端口 規(guī)定了樂器間的物理連接方式,要求樂器必須帶有MIDI端口,并對連接兩個樂器的MIDI電纜及傳輸電信號作了規(guī)定。

MIDI接口具有三種輸入/輸出端口,它們分別是MIDIIN、MIDIOUT和MIDITHRU。

(1)MIDIIN:MIDI輸入端口,MIDI設(shè)備用MIDIIN端口接受MIDI信息。

常見音頻文件格式和處理工具 (2)MIDIOUT:MIDI輸出端口,MIDI設(shè)備用MIDIOUT端口送出MIDI信息。

(3)MIDITHRU:MIDI轉(zhuǎn)接端口,MIDI設(shè)備利用MIDITHRU端口起到中繼和橋接的作用。

MIDI接口的IN、OUT、THRU端口均是一個圓形的5孔接頭,如圖4-11所示。 最常用的MIDI設(shè)備連接方法是用一根MIDI電纜將演奏控制器的MIDIOUT端口與計算機(內(nèi)有音序器)的MIDIIN端口相連接,同時用另一根MIDI電纜將計算機的MIDIOUT端口與音源MIDIIN端口相連接,這樣由演奏控制器發(fā)出的演奏信息便可被計算機接收和存儲,經(jīng)過處理后送到音源去演奏。常見音頻文件格式和處理工具圖4-11MIDI接口示意圖常見音頻文件格式和處理工具 2)數(shù)據(jù)傳輸格式

MIDI標(biāo)準(zhǔn)規(guī)定了硬件上傳輸?shù)男畔⒌木幋a方式。

2.MIDI設(shè)備 通過MIDI接口,計算機可以控制各個樂器的輸出。

1)MIDI合成器 已經(jīng)指出,MIDI聲音產(chǎn)生和記錄的方法與波形聲音產(chǎn)生和記錄的方法是不同的,MIDI文件記錄的內(nèi)容是音樂演奏的一系列指令。

2)MIDI音序器 音序器又稱聲音序列發(fā)生器,是一種記錄、編輯和播放MIDI文件的軟件,是為MIDI作曲而設(shè)計的計算機程序。常見音頻文件格式和處理工具 3)MIDI鍵盤 演奏者使用鍵盤可以直接控制合成器的輸出。

4)微處理器 微處理器的任務(wù)是接收和發(fā)送MIDI信息。

5)控制面板 控制面板控制那些不直接由鍵盤產(chǎn)生的音符和與持續(xù)時間有關(guān)的一些其他量,如控制總音量的滑動條,控制合成器開關(guān)的按鈕,以及一組確定聲音生成器音調(diào)的聲音選擇按鈕。 還可以通過輔助控制器調(diào)節(jié)合成器的音調(diào)或加入特殊效果。 另外,MIDI用時鐘表示音符的長度,并實現(xiàn)發(fā)送端與接收端的同步。

常見音頻文件格式和處理工具 3.MIDI軟件 計算機通過MIDI接口與各種MIDI樂器連接后,就可以使用各種各樣的MIDI軟件。

MIDI軟件可以分為以下4類:

(1)音樂記錄和演奏軟件。

(2)樂譜創(chuàng)作與打印軟件。

(3)合成器片斷編輯或管理軟件。

(4)音樂教學(xué)軟件。常見音頻文件格式和處理工具4.5聲卡概述 4.5.1聲卡的結(jié)構(gòu)與工作原理

1.聲卡的結(jié)構(gòu) 計算機處理聲音的硬件設(shè)備是聲卡,盡管聲卡的類型很多,但聲卡的基本結(jié)構(gòu)和功能都是類似的。聲卡的主要組成部分如圖4-12所示。

常見音頻文件格式和處理工具圖4-12聲卡的功能結(jié)構(gòu)模型常見音頻文件格式和處理工具 1)音源 聲卡可以接受話筒的信號輸入(MICIN),外部的音頻信號輸入(LINEIN),或是內(nèi)部連接的CD音頻信號。

2)混音器(Mixer)

混音器芯片可以混合各種音源,包括數(shù)字化聲音、MIDI(合成)音樂、CD音頻輸入、LINEIN、MICIN以及PC揚聲器,并通過軟件控制多種音源的音量,實現(xiàn)混合錄音。 3)前置放大器 在有些聲卡上有獨立的音頻前置放大器芯片,它是一塊模擬信號處理芯片,其主要任務(wù)是將各種音源的微弱信號放大到一定的電平,或進行選擇、補償、控制等處理,使其足以推動后級電路。常見音頻文件格式和處理工具 4)DSP(DigitalSignalProcessing,數(shù)字信號處理)芯片

DSP是聲卡的核心部件,是處理速度高、集成度大的可編程芯片,能把數(shù)據(jù)及時處理并以所需要的方式傳送給用戶。

5)音樂合成芯片 音樂合成芯片是處理MIDI音樂的關(guān)鍵,合成音樂有兩種方式:頻率調(diào)制(FM)和波形表(WaveTable)合成方式。

6)波形表ROM

并不是所有的波形表都能達到相同的效果,取得成功的關(guān)鍵在于提供足夠多的音色樣本數(shù)據(jù)。常見音頻文件格式和處理工具 7)CD-ROM驅(qū)動器接口 聲卡上含有一個或多個CD-ROM驅(qū)動器接口,如SoundBlaster系列的一些聲卡在卡上安排了Panasonic、Sony和Mitsumi三種接口,有一些聲卡必須與特定的CD-ROM驅(qū)動器相連,采用SCSI-2標(biāo)準(zhǔn)CD-ROM驅(qū)動器的接口卡,使得用戶可以使用豐富的CD節(jié)目。常見音頻文件格式和處理工具 8)功率放大器 音頻信號在輸出之前必須經(jīng)過功率放大。聲卡一般把信號放大到4W輸出,輸出的立體聲音頻信號可以接到耳機、有源音響或是功率較大的立體聲功放。

9)總線連接 聲卡插在電

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論