音頻信息處理技術(shù)_第1頁
音頻信息處理技術(shù)_第2頁
音頻信息處理技術(shù)_第3頁
音頻信息處理技術(shù)_第4頁
音頻信息處理技術(shù)_第5頁
已閱讀5頁,還剩63頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/www.zg- http:/ http:/www.skf- http:/www.nsk- http:/www.fag- http:/ http:/www.ntn- http:/ http:/ http:/ http:/ http:/ http:/www.xunchi- http:/ http:/ http:/ http:/ http:/ http:/ http:/www.ort- 第第2 2頁頁/ /共

2、共6868頁頁本章導讀 音頻信息處理技術(shù)是多媒體信息處理的主要技術(shù)之一,音頻信息處理技術(shù)是多媒體信息處理的主要技術(shù)之一,它使計算機具備了錄音、聲音編輯、語音合成、聲音播放它使計算機具備了錄音、聲音編輯、語音合成、聲音播放等功能。在等功能。在mpc中,可以通過聲音傳遞信息、制造效果、中,可以通過聲音傳遞信息、制造效果、營造氣氛及演奏音樂等。目前的音頻信息處理技術(shù)主要包營造氣氛及演奏音樂等。目前的音頻信息處理技術(shù)主要包括模擬聲音信號的數(shù)字化、數(shù)據(jù)壓縮編碼、數(shù)字音效處理、括模擬聲音信號的數(shù)字化、數(shù)據(jù)壓縮編碼、數(shù)字音效處理、音頻文件存儲、傳輸、播放等內(nèi)容。音頻文件存儲、傳輸、播放等內(nèi)容。本章主要介紹聲

3、音信本章主要介紹聲音信號及其數(shù)字化的基本概念、音頻卡的組成及其工作原理、號及其數(shù)字化的基本概念、音頻卡的組成及其工作原理、數(shù)字音頻的采集與編輯、數(shù)字音頻的采集與編輯、midi音樂以及幾個常用的音頻處音樂以及幾個常用的音頻處理軟件等內(nèi)容,理軟件等內(nèi)容,并以并以adobe audition3.0版本為例,詳細版本為例,詳細介紹音頻信息編輯處理的具體方法。介紹音頻信息編輯處理的具體方法。http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/www.zg- htt

4、p:/ http:/www.skf- http:/www.nsk- http:/www.fag- http:/ http:/www.ntn- http:/ http:/ http:/ http:/ http:/ http:/www.xunchi- http:/ http:/ http:/ http:/ http:/ http:/ http:/www.ort- 第第3 3頁頁/ /共共6868頁頁本章主要內(nèi)容本章主要內(nèi)容4.1 4.1 音頻基礎(chǔ)知識音頻基礎(chǔ)知識 4.2 4.2 音質(zhì)標準與評價音質(zhì)標準與評價4.3 4.3 音頻的數(shù)字化與編碼音頻的數(shù)字化與編碼4.4 4.4 音頻卡音頻卡4.5 4.

5、5 數(shù)字音頻的采集與編輯數(shù)字音頻的采集與編輯4.6 midi4.6 midi音樂音樂第第4 4頁頁/ /共共6868頁頁4.1 4.1 音頻基礎(chǔ)知識音頻基礎(chǔ)知識4.1.1 4.1.1 聲音的物理特征聲音的物理特征 聲音聲音是由物體振動產(chǎn)生的,并以是由物體振動產(chǎn)生的,并以聲波形式聲波形式通過介質(zhì)(如通過介質(zhì)(如空氣、水、金屬等)傳播。物理上,聲音可以用空氣、水、金屬等)傳播。物理上,聲音可以用一條連續(xù)曲一條連續(xù)曲線線來表示,來表示,, ,如圖如圖4-1 4-1 。物體振動的最大位移稱為。物體振動的最大位移稱為振幅振幅a a,聲,聲波中兩個連續(xù)波峰(或波谷)之間的距離稱為波中兩個連續(xù)波峰(或波谷)

6、之間的距離稱為周期周期t t,周期,周期的倒數(shù)的倒數(shù)1/t1/t即為即為頻率頻率f f,以,以赫茲(赫茲(hzhz)為單位,頻率為單位,頻率反映了單位時間(反映了單位時間(1 1秒)物秒)物體振動的次數(shù)。體振動的次數(shù)。圖圖4-1 4-1 聲波的振幅與頻率聲波的振幅與頻率tat0第第5 5頁頁/ /共共6868頁頁 聲音按頻率可分為三類:聲音按頻率可分為三類:音頻、次聲、超聲音頻、次聲、超聲 l 低于低于20hz20hz的聲音稱為次聲的聲音稱為次聲l 頻率范圍在頻率范圍在20hz20hz20khz20khz范范圍的可聽聲音稱為音頻,圍的可聽聲音稱為音頻, 其中人說話發(fā)出的語音信號的其中人說話發(fā)出

7、的語音信號的頻率范圍是頻率范圍是300hz300hz3khz3khzl 頻率高于頻率高于20khz20khz的稱為超音的稱為超音頻(或超聲)頻(或超聲)15 20 300 3k 20k 50k f(hz)音頻信號音頻信號語音信號語音信號超聲信號超聲信號次聲信號次聲信號圖圖4-2 4-2 不同聲音信號的頻率范圍不同聲音信號的頻率范圍 可聽的音頻聲音又可分為可聽的音頻聲音又可分為語音、樂音、效果音、合語音、樂音、效果音、合成音、噪音(聲)成音、噪音(聲)等五種。等五種。 第第6 6頁頁/ /共共6868頁頁4.1.2 4.1.2 音頻三要素音頻三要素 音頻有三個主要屬性,分別是音頻有三個主要屬性,

8、分別是音調(diào)、音強音調(diào)、音強和和音色音色,它們,它們既反映了音頻信號的基本特征,也是人感受聲音信號的三個既反映了音頻信號的基本特征,也是人感受聲音信號的三個主要因素,因此又被稱為音頻三要素。主要因素,因此又被稱為音頻三要素。 音調(diào)音調(diào):又稱音高,反映聲音的高低程度,由聲音信號的:又稱音高,反映聲音的高低程度,由聲音信號的頻率大小所決定。頻率越大,音調(diào)越高;頻率越小,音調(diào)越頻率大小所決定。頻率越大,音調(diào)越高;頻率越小,音調(diào)越低。低。 音強音強:又稱響度,反映聲音的大小或強弱,由振幅和聲:又稱響度,反映聲音的大小或強弱,由振幅和聲源距離共同決定。振幅越大,距離越小,音強(響度)越大。源距離共同決定。

9、振幅越大,距離越小,音強(響度)越大。 音色音色:又稱音質(zhì),反映聲音的品質(zhì),它由振動物體(聲:又稱音質(zhì),反映聲音的品質(zhì),它由振動物體(聲源)的材料、結(jié)構(gòu)、狀態(tài)等自身因素決定,表現(xiàn)為聲源的頻源)的材料、結(jié)構(gòu)、狀態(tài)等自身因素決定,表現(xiàn)為聲源的頻帶寬度。帶寬度。第第7 7頁頁/ /共共6868頁頁4.1.3 4.1.3 數(shù)字音頻的三種形式數(shù)字音頻的三種形式 音頻(音頻(audioaudio)是指頻率在)是指頻率在20hz20hz20khz20khz范圍內(nèi)的可聽聲范圍內(nèi)的可聽聲音,是多媒體信息中的一種媒體類型音,是多媒體信息中的一種媒體類型聽覺類媒體。聽覺類媒體。 目前多媒體計算機中的音頻主要有目前多

10、媒體計算機中的音頻主要有波形音頻、波形音頻、cdcd音頻和音頻和midimidi音樂音樂3 3種形式。種形式。1 1、波形音頻:、波形音頻: 是由外部聲音源通過數(shù)字化過程采集到多媒體計算機中是由外部聲音源通過數(shù)字化過程采集到多媒體計算機中的所有聲音形式??赏ㄟ^編輯(裁剪、合成、效果等)、編的所有聲音形式。可通過編輯(裁剪、合成、效果等)、編碼壓縮、存儲、傳輸以及還原播放等方式進行處理。在波形碼壓縮、存儲、傳輸以及還原播放等方式進行處理。在波形音頻中,有一類特殊的聲音需要特別提到,即人的語音。語音頻中,有一類特殊的聲音需要特別提到,即人的語音。語音是波形聲音中人的說話聲音,具有內(nèi)在的語言學、語音

11、學音是波形聲音中人的說話聲音,具有內(nèi)在的語言學、語音學的內(nèi)涵。的內(nèi)涵。第第8 8頁頁/ /共共6868頁頁2 2、cdcd音頻音頻 cd-cd-音頻(音頻(cd-audiocd-audio)是存儲在音樂)是存儲在音樂cdcd光盤中的數(shù)字音光盤中的數(shù)字音頻,可以通過頻,可以通過cd-romcd-rom驅(qū)動器讀取并采集到多媒體計算機系驅(qū)動器讀取并采集到多媒體計算機系統(tǒng)中,并以波形音頻的相應形式存儲、傳輸和處理。統(tǒng)中,并以波形音頻的相應形式存儲、傳輸和處理。3 3、midimidi音樂音樂 也稱也稱midimidi音頻。它將音樂符號化并保存在音頻。它將音樂符號化并保存在midimidi文件中,文件中

12、,并通過音樂合成器產(chǎn)生相應的聲音波形來還原播放。并通過音樂合成器產(chǎn)生相應的聲音波形來還原播放。 音頻是時間的函數(shù),具有很強的前后相關(guān)性,所以實音頻是時間的函數(shù),具有很強的前后相關(guān)性,所以實時性是音頻處理的基本要求。時性是音頻處理的基本要求。第第9 9頁頁/ /共共6868頁頁4.1.4 4.1.4 數(shù)字音頻的文件格式數(shù)字音頻的文件格式音頻文件通常分為兩大類:音頻文件通常分為兩大類:聲音文件聲音文件 和和 midimidi文件文件下表介紹幾種常用的音頻文件格式及后綴名:下表介紹幾種常用的音頻文件格式及后綴名:序號序號音頻文件名稱音頻文件名稱后綴名后綴名1 1wavewave文件文件 .wav .

13、wav 2 2aiffaiff文件文件 .aif/.aiff .aif/.aiff 3 3audioaudio文件文件 .au .au 4 4 sound sound文件文件 .snd .snd 5 5voicevoice文件文件 .voc .voc 6 6 mpeg mpeg音頻文件音頻文件 .mp1/.mp2/.mp3 .mp1/.mp2/.mp3 7 7realaudiorealaudio文件文件 .ra/.rm/.ram .ra/.rm/.ram 8 8windows media audiowindows media audio文件文件 .wma/.asf/.asx/.wax .wma

14、/.asf/.asx/.wax 9 9midimidi文件文件 .mid/.rmi/.cmi/.cmf .mid/.rmi/.cmi/.cmf 1010modulemodule文件文件 .mod/.s3m/.xm/.mtm/.far/.kar/ .mod/.s3m/.xm/.mtm/.far/.kar/ 第第1010頁頁/ /共共6868頁頁4.1.5 4.1.5 音頻處理工具軟件簡介音頻處理工具軟件簡介 音頻工具軟件在內(nèi)容上主要指處理數(shù)字音頻和音頻工具軟件在內(nèi)容上主要指處理數(shù)字音頻和midimidi樂譜樂譜的各種工具軟件,在功能上包括的各種工具軟件,在功能上包括音頻采集、編輯、合成、編音頻采

15、集、編輯、合成、編碼壓縮以及碼壓縮以及midimidi樂譜的創(chuàng)作、編輯、發(fā)布等環(huán)節(jié)樂譜的創(chuàng)作、編輯、發(fā)布等環(huán)節(jié)。 按照音頻處理的基本過程,通常可把音頻工具軟件分為:按照音頻處理的基本過程,通??砂岩纛l工具軟件分為: 1 1、midimidi制作軟件制作軟件 2 2、音頻處理軟件、音頻處理軟件 3 3、音頻壓縮軟件、音頻壓縮軟件 4 4、音樂、音樂cdcd刻錄軟件刻錄軟件第第1111頁頁/ /共共6868頁頁4.2 4.2 音質(zhì)標準與評價音質(zhì)標準與評價4.2.1 4.2.1 音質(zhì)等級標準音質(zhì)等級標準 音質(zhì)音質(zhì)是指音頻信號經(jīng)傳輸、處理后所再現(xiàn)的聲音質(zhì)量是指音頻信號經(jīng)傳輸、處理后所再現(xiàn)的聲音質(zhì)量(保

16、真度)。(保真度)。等級等級頻率范圍頻率范圍音質(zhì)音質(zhì)高端高端dvddvd0 048khz48khz頂級頂級標準標準dvddvd0 024khz24khzcd-dacd-da音質(zhì)音質(zhì)10hz10hz20khz20khz高高fmfm廣播音質(zhì)廣播音質(zhì)20hz20hz15khz15khz較高較高amam廣播音質(zhì)廣播音質(zhì)50hz50hz7khz7khz中中電話音質(zhì)電話音質(zhì)200hz200hz3.4khz3.4khz低低第第1212頁頁/ /共共6868頁頁4.2.2 4.2.2 音質(zhì)客觀評價音質(zhì)客觀評價 客觀評價客觀評價是指通過檢測儀器測量音頻信號的技術(shù)指標來進是指通過檢測儀器測量音頻信號的技術(shù)指標來進

17、行聲音質(zhì)量評價,主要技術(shù)指標有:頻帶寬度、動態(tài)范圍和信行聲音質(zhì)量評價,主要技術(shù)指標有:頻帶寬度、動態(tài)范圍和信噪比等。噪比等。 理論上,理論上,聲音信號是由許多頻率不同的分量信號組合而聲音信號是由許多頻率不同的分量信號組合而成的復合信號,因此,聲音的頻帶寬度特指復合聲音信號的成的復合信號,因此,聲音的頻帶寬度特指復合聲音信號的頻率范圍,范圍越大,頻帶越寬,可包含的音頻信號(諧波)頻率范圍,范圍越大,頻帶越寬,可包含的音頻信號(諧波)越豐富,因而聲音質(zhì)量就越高。越豐富,因而聲音質(zhì)量就越高。 實際上實際上,再現(xiàn)聲音(特別是樂音)的質(zhì)量與所用的播放,再現(xiàn)聲音(特別是樂音)的質(zhì)量與所用的播放設(shè)備和場地條

18、件有關(guān)。高質(zhì)量的音頻信號要通過高品質(zhì)的音設(shè)備和場地條件有關(guān)。高質(zhì)量的音頻信號要通過高品質(zhì)的音響設(shè)備在較好的音響環(huán)境中,才能再現(xiàn)出高質(zhì)量的音響效果。響設(shè)備在較好的音響環(huán)境中,才能再現(xiàn)出高質(zhì)量的音響效果。對于音響設(shè)備而言,主要關(guān)注對于音響設(shè)備而言,主要關(guān)注失真度、頻響、瞬態(tài)響應、信失真度、頻響、瞬態(tài)響應、信噪比、聲道分離度、聲道平衡度噪比、聲道分離度、聲道平衡度等指標。等指標。 第第1313頁頁/ /共共6868頁頁4.2.3 4.2.3 音質(zhì)主觀評價音質(zhì)主觀評價 主觀評價是指通過人聆聽各種聲音而產(chǎn)生的好惡感覺來進主觀評價是指通過人聆聽各種聲音而產(chǎn)生的好惡感覺來進行聲音質(zhì)量評價。行聲音質(zhì)量評價。

19、1 1、語音質(zhì)量評價方法、語音質(zhì)量評價方法 常用的主觀評價方法有:常用的主觀評價方法有:平均主觀分法,失真平均主觀分平均主觀分法,失真平均主觀分法,判斷滿意度測量法法,判斷滿意度測量法等。等。 itu-tp800itu-tp800標準中定義的標準中定義的mosmos,它將語音質(zhì)量分為,它將語音質(zhì)量分為5 5級,如級,如表所示:表所示:等級等級音質(zhì)音質(zhì)主觀感覺主觀感覺5 5優(yōu)優(yōu)未察覺失真未察覺失真4 4良良剛察覺失真,但不討厭剛察覺失真,但不討厭3 3中中察覺失真,稍微討厭察覺失真,稍微討厭2 2差差討厭,但不令人反感討厭,但不令人反感1 1劣劣極其討厭,令人反感極其討厭,令人反感第第1414頁

20、頁/ /共共6868頁頁 2 2、樂音質(zhì)量評價、樂音質(zhì)量評價 樂音音質(zhì)的優(yōu)劣取決于多種因素,如樂音音質(zhì)的優(yōu)劣取決于多種因素,如聲源特性、音響器聲源特性、音響器材的信號特性、聲場特性、聽覺特性材的信號特性、聲場特性、聽覺特性等。因此,對音響設(shè)等。因此,對音響設(shè)備再現(xiàn)的樂音音質(zhì)的準確評價難度較大。備再現(xiàn)的樂音音質(zhì)的準確評價難度較大。 主觀評價樂音音質(zhì),一般是通過再現(xiàn)樂音的響度、音調(diào)主觀評價樂音音質(zhì),一般是通過再現(xiàn)樂音的響度、音調(diào)和音色的變化及其組合來評價音質(zhì)的,和音色的變化及其組合來評價音質(zhì)的, 幾種典型的聽感:幾種典型的聽感:定位感定位感 ,空間感,空間感 ,層次感,層次感 ,厚度,厚度感感 ,

21、立體感,立體感 。除此之外,還有力度感、亮度感、臨場感、。除此之外,還有力度感、亮度感、臨場感、軟硬感、松緊感、寬窄感等許多評價音質(zhì)的聽感。軟硬感、松緊感、寬窄感等許多評價音質(zhì)的聽感。 第第1515頁頁/ /共共6868頁頁4.3 4.3 音頻的數(shù)字化與編碼音頻的數(shù)字化與編碼 計算機在處理音頻信號之前,計算機在處理音頻信號之前,必須將模擬的聲音信號數(shù)字化,必須將模擬的聲音信號數(shù)字化,形成數(shù)字音頻。具體過程包括:形成數(shù)字音頻。具體過程包括:采樣、量化、編碼采樣、量化、編碼。4.3.1 4.3.1 采樣與采樣頻率采樣與采樣頻率 采樣是每間隔一段時間讀采樣是每間隔一段時間讀取一次聲音信號幅度,使聲音

22、取一次聲音信號幅度,使聲音信號在時間上被離散化,如圖信號在時間上被離散化,如圖4-24-2所示。采樣的主要參數(shù)是所示。采樣的主要參數(shù)是采樣頻率采樣頻率 。第第1616頁頁/ /共共6868頁頁 采樣頻率采樣頻率:是指將模擬聲音波形數(shù)字化時,每秒鐘所抽:是指將模擬聲音波形數(shù)字化時,每秒鐘所抽取聲波幅度樣本的次數(shù),其計算單位是取聲波幅度樣本的次數(shù),其計算單位是khz(khz(千赫茲千赫茲) )。如圖。如圖4-34-3是模擬聲音信號數(shù)字化時的采樣圖示。是模擬聲音信號數(shù)字化時的采樣圖示。 一般來講,采樣頻率一般來講,采樣頻率越高聲音失真越小,用于越高聲音失真越小,用于存儲數(shù)字音頻的數(shù)據(jù)量也存儲數(shù)字音頻

23、的數(shù)據(jù)量也越大。越大。 采樣頻率的高低是根采樣頻率的高低是根據(jù)據(jù)聲音信號本身的最高頻聲音信號本身的最高頻率和采樣定理率和采樣定理決定的。決定的。圖圖4-3 4-3 聲音信號采樣聲音信號采樣第第1717頁頁/ /共共6868頁頁 采樣定理采樣定理:在進行模擬:在進行模擬/ /數(shù)字信號的轉(zhuǎn)換過程中,當采數(shù)字信號的轉(zhuǎn)換過程中,當采樣頻率樣頻率f fs s大于信號中最高頻率大于信號中最高頻率f fmaxmax的的2 2倍時,即倍時,即f fs s=2f=2fmaxmax,采,采樣之后的數(shù)字信號完整地保留了原始信號中的信息。采樣定樣之后的數(shù)字信號完整地保留了原始信號中的信息。采樣定理又叫奈奎斯特定理(理

24、又叫奈奎斯特定理(nyquist theorynyquist theory)。)。表表4-4 4-4 不同音質(zhì)數(shù)字音頻的常用采樣率不同音質(zhì)數(shù)字音頻的常用采樣率采樣率采樣率音質(zhì)音質(zhì)頻率范圍頻率范圍8,000 hz8,000 hz電話電話0 04,000 hz4,000 hz11,025 hz11,025 hz低于低于amam廣播廣播0 05,512 hz5,512 hz22,050 hz22,050 hz接近接近fmfm廣播廣播0 011,025 hz11,025 hz32,000 hz32,000 hz優(yōu)于優(yōu)于fmfm廣播廣播0 016,000 hz16,000 hz44,100 hz44,1

25、00 hzcd-dacd-da0 022,050 hz22,050 hz48,000 hz48,000 hz標準標準dvddvd0 024,000 hz24,000 hz96,000 hz96,000 hz高端高端dvddvd0 048,000 hz48,000 hz第第1818頁頁/ /共共6868頁頁4.3.2 4.3.2 量化與量化位數(shù)量化與量化位數(shù) 量化量化就是把采樣得到的聲音信號幅度轉(zhuǎn)換為數(shù)字值,就是把采樣得到的聲音信號幅度轉(zhuǎn)換為數(shù)字值,是聲音信號在幅度上被離散化。是聲音信號在幅度上被離散化。 量化位數(shù)量化位數(shù)n n定義了每個采樣點的數(shù)據(jù)范圍(定義了每個采樣點的數(shù)據(jù)范圍(0 02 2

26、n n-1-1),),也叫量化等級,量化等級的多少決定了聲音的動態(tài)范圍。也叫量化等級,量化等級的多少決定了聲音的動態(tài)范圍。圖圖4-4 4-4 量化位數(shù)與動態(tài)范圍量化位數(shù)與動態(tài)范圍 第第1919頁頁/ /共共6868頁頁4.3.2 4.3.2 量化與量化位數(shù)量化與量化位數(shù)表表4-5 4-5 不同音質(zhì)的量化位數(shù)、量化范圍、動態(tài)范圍不同音質(zhì)的量化位數(shù)、量化范圍、動態(tài)范圍量化位數(shù)量化位數(shù)音質(zhì)音質(zhì)量化等級量化等級動態(tài)范圍動態(tài)范圍8 8位位電話電話25625648 db48 db1616位位cdcd65,53665,53696 db96 db2424位位dvddvd16,777,21616,777,216

27、144 db144 db3232位位頂級頂級4,294,967,2964,294,967,296192 db192 db第第2020頁頁/ /共共6868頁頁4.3.3 4.3.3 聲道聲道聲道個數(shù)是聲道個數(shù)是反映音頻數(shù)字化質(zhì)量的另一個因素。反映音頻數(shù)字化質(zhì)量的另一個因素。單聲道:單聲道:采集聲音數(shù)據(jù)時,僅采集一個聲波的數(shù)據(jù)采集聲音數(shù)據(jù)時,僅采集一個聲波的數(shù)據(jù)雙聲道(立體聲)雙聲道(立體聲):采集兩個聲波數(shù)據(jù):采集兩個聲波數(shù)據(jù)多聲道(環(huán)繞立體聲)多聲道(環(huán)繞立體聲):采集兩個以上聲波數(shù)據(jù):采集兩個以上聲波數(shù)據(jù)聲道數(shù)越多,再現(xiàn)出的音響效果就越好。聲道數(shù)越多,再現(xiàn)出的音響效果就越好。第第2121頁

28、頁/ /共共6868頁頁4.3.4 4.3.4 音頻采樣的數(shù)據(jù)量音頻采樣的數(shù)據(jù)量數(shù)字音頻的數(shù)據(jù)量主要取決于兩個因素:數(shù)字音頻的數(shù)據(jù)量主要取決于兩個因素:u音質(zhì)因素音質(zhì)因素:由采樣頻率、量化位數(shù)和聲道數(shù):由采樣頻率、量化位數(shù)和聲道數(shù)3 3個個參數(shù)決定。參數(shù)決定。u時間因素:時間因素:單位時間的數(shù)據(jù)量可用下式表示:單位時間的數(shù)據(jù)量可用下式表示: fcbs8v= v= v v:為單位時間的數(shù)據(jù)量(:為單位時間的數(shù)據(jù)量(kbpskbps)fc:為采樣頻率(:為采樣頻率(khzkhz)b b:為量化位數(shù)(:為量化位數(shù)(bitbit)s s:為聲道數(shù):為聲道數(shù)4.3.5 4.3.5 音頻數(shù)據(jù)編碼音頻數(shù)據(jù)編

29、碼音頻數(shù)據(jù)壓縮方法分類音頻數(shù)據(jù)壓縮方法分類pcmpcm為脈沖調(diào)制編碼,為脈沖調(diào)制編碼,dpcmdpcm為差分脈沖調(diào)制編碼,為差分脈沖調(diào)制編碼,adpcmadpcm為自適應差分脈沖調(diào)制編碼為自適應差分脈沖調(diào)制編碼, ,vselpvselp為矢量和激勵線性預測編碼,為矢量和激勵線性預測編碼,mplpcmplpc為多脈沖激勵線性預測編碼,為多脈沖激勵線性預測編碼,celpcelp為碼本激勵線性預測編碼。為碼本激勵線性預測編碼。第第2323頁頁/ /共共6868頁頁4.3.6 4.3.6 音頻編碼標準音頻編碼標準 1 1、一般語音音質(zhì)的音頻壓縮標準、一般語音音質(zhì)的音頻壓縮標準u特點:特點:音質(zhì)低,能聽

30、到聲音就可以音質(zhì)低,能聽到聲音就可以u應用:應用:各類提示音各類提示音u壓縮標準:壓縮標準: ccitt a lawccitt a law ccitt law ccitt law 低采樣率或低量化位數(shù)的低采樣率或低量化位數(shù)的pcm pcm 第第2424頁頁/ /共共6868頁頁2 2、電話音質(zhì)的音頻壓縮標準、電話音質(zhì)的音頻壓縮標準u頻率范圍頻率范圍:300hz:300hz3.4khz3.4khz,用標準的,用標準的pcmpcm編碼。編碼。u壓縮標準:壓縮標準: g g系列音頻壓縮標準系列音頻壓縮標準ug g系列音頻壓縮標準利用的技術(shù)系列音頻壓縮標準利用的技術(shù): 線性預測技術(shù)線性預測技術(shù) 矢量量

31、化技術(shù)矢量量化技術(shù) 綜合分析技術(shù)綜合分析技術(shù)u典型的算法典型的算法: adpcmadpcm celp celp ld-celp ld-celp(短時延碼本激勵線性預測編碼)(短時延碼本激勵線性預測編碼) rpe-ltprpe-ltp(長時線性預測規(guī)則碼激勵)(長時線性預測規(guī)則碼激勵) vselpvselp(矢量和激勵線性預測編碼)(矢量和激勵線性預測編碼)第第2525頁頁/ /共共6868頁頁標準標準參數(shù)說明參數(shù)說明g.711g.711pcmpcm編碼,采樣速率編碼,采樣速率8khz8khz,量化位數(shù),量化位數(shù)8bit8bit,比特流速率,比特流速率為為64kb/s64kb/s。使用非線性量化

32、技術(shù)。使用非線性量化技術(shù)g.721g.721adpcmadpcm編碼:每個數(shù)值差分用編碼:每個數(shù)值差分用4 4位編碼,采樣率為位編碼,采樣率為8khz8khz,比特流被轉(zhuǎn)換為比特流被轉(zhuǎn)換為32kbps32kbpsg.723g.723sb-adpcmsb-adpcm編碼(編碼(有損壓縮),比特流被轉(zhuǎn)換為有損壓縮),比特流被轉(zhuǎn)換為5.35.3 6.3kbps6.3kbps之間之間g.728g.728ld-celpld-celp編碼,比特流被轉(zhuǎn)換為編碼,比特流被轉(zhuǎn)換為16kbps16kbps,帶寬限于,帶寬限于3.4khz3.4khz;音質(zhì)與;音質(zhì)與g.721g.721標準相當標準相當表表4-6 4

33、-6 電話音質(zhì)的音頻編碼標準電話音質(zhì)的音頻編碼標準第第2626頁頁/ /共共6868頁頁3 3、 amam廣播音質(zhì)的音頻壓縮標準廣播音質(zhì)的音頻壓縮標準u頻率范圍頻率范圍:50hz:50hz7khz 7khz u壓縮標準:壓縮標準:ituitu制定的制定的g.722g.722標準標準 ug.722g.722標準采用的算法:標準采用的算法:sb-adpcmsb-adpcm(子帶(子帶adpcmadpcm)usb-adpcmsb-adpcm算法:算法:將現(xiàn)有的帶寬分成兩個獨立的子帶將現(xiàn)有的帶寬分成兩個獨立的子帶信道,使輸入信號進入濾波器組分成高子帶信號和低信道,使輸入信號進入濾波器組分成高子帶信號和

34、低子帶信號,然后分別進行子帶信號,然后分別進行adpcmadpcm編碼,最后進入混合器編碼,最后進入混合器形成輸出碼流形成輸出碼流 第第2727頁頁/ /共共6868頁頁4 4、高保真立體聲音頻壓縮標準、高保真立體聲音頻壓縮標準u包括包括: :cd-dacd-da以上音質(zhì)、以上音質(zhì)、fmfm廣播音質(zhì)廣播音質(zhì)ufmfm廣播音質(zhì)頻率范圍廣播音質(zhì)頻率范圍: :20hz20hz15khz15khz ucd-dacd-da音頻信號的頻率范圍:音頻信號的頻率范圍:50hz50hz20khz20khz u壓縮標準:壓縮標準: 1 1)mpeg1mpeg1,mpeg2mpeg2的的layer1layer1、2

35、 2、3 3,mpeg 4 aacmpeg 4 aac音頻編碼,杜比音頻編碼,杜比ac-3ac-3等等。用于數(shù)字廣播、數(shù)字電視廣。用于數(shù)字廣播、數(shù)字電視廣播、消費電子產(chǎn)品、音頻信息的存儲和下載等。播、消費電子產(chǎn)品、音頻信息的存儲和下載等。 2 2)itu-t g.722.1itu-t g.722.1、3gpp amr-wb+3gpp amr-wb+和和3gpp 2 3gpp 2 4gv-wb 4gv-wb 。用于像用于像3g3g通信這樣的高音質(zhì)低碼率應用場合。通信這樣的高音質(zhì)低碼率應用場合。第第2828頁頁/ /共共6868頁頁4.4 4.4 音頻卡音頻卡 4.4.1 4.4.1 音頻卡的功能

36、音頻卡的功能u 錄制和播放數(shù)字聲音文件錄制和播放數(shù)字聲音文件u 控制音量和混音效果控制音量和混音效果u 聲音文件的壓縮與解壓縮聲音文件的壓縮與解壓縮u midimidi接口與音樂合成接口與音樂合成 第第2929頁頁/ /共共6868頁頁4.4.2 4.4.2 音頻卡的組成與工作原理音頻卡的組成與工作原理圖圖4-6 4-6 音頻卡的一般組成與結(jié)構(gòu)示意圖音頻卡的一般組成與結(jié)構(gòu)示意圖dspdsp音頻輸出音頻輸出放大器放大器麥克風麥克風micmic線路輸入線路輸入line inline in音樂合成器音樂合成器系統(tǒng)總系統(tǒng)總線接口線接口cdcd輸入輸入混合信號混合信號處理器處理器midimidi與游與游

37、戲接口戲接口系統(tǒng)總線系統(tǒng)總線放大器放大器第第3030頁頁/ /共共6868頁頁 音頻卡的主要功能部件音頻卡的主要功能部件:功率放大器、混合信號處理:功率放大器、混合信號處理器、器、dspdsp數(shù)字信號處理器、音樂合成器以及相關(guān)的外圍接口數(shù)字信號處理器、音樂合成器以及相關(guān)的外圍接口等。等。 聲音的合成與處理聲音的合成與處理:由:由dspdsp數(shù)字聲音處理器、音樂合成數(shù)字聲音處理器、音樂合成器及器及midimidi接口控制器組成接口控制器組成, ,主要任務是完成聲波信號的模主要任務是完成聲波信號的模/ /數(shù)、數(shù)數(shù)、數(shù)/ /模轉(zhuǎn)換,利用調(diào)頻技術(shù)控制聲音的音調(diào)、音色和幅模轉(zhuǎn)換,利用調(diào)頻技術(shù)控制聲音的音

38、調(diào)、音色和幅度。度。 混合信號處理器及功率放大器混合信號處理器及功率放大器:內(nèi)置數(shù)字:內(nèi)置數(shù)字/ /模擬混音器,模擬混音器,混音器的聲源可以是混音器的聲源可以是midimidi信號、信號、cdcd音頻、線性輸入、話筒音頻、線性輸入、話筒以及以及pcpc機的揚聲器等,可以選擇輸入一個聲源或?qū)讉€不機的揚聲器等,可以選擇輸入一個聲源或?qū)讉€不同聲源進行混合錄音。同聲源進行混合錄音。 4.4.3 4.4.3 音頻卡的音頻卡的i/oi/o接口接口圖圖4-7 音頻卡的外圍接口連接示意圖音頻卡的外圍接口連接示意圖第第3232頁頁/ /共共6868頁頁4.4.3 4.4.3 音頻卡的音頻卡的i/oi/o接口

39、接口圖圖4-8 支持支持5.1環(huán)繞的聲卡插口環(huán)繞的聲卡插口第第3333頁頁/ /共共6868頁頁4.5 4.5 數(shù)字音頻的采集與編輯數(shù)字音頻的采集與編輯 一般的數(shù)字音頻采集首先需要選擇和設(shè)置恰當?shù)牟蓸訁⒁话愕臄?shù)字音頻采集首先需要選擇和設(shè)置恰當?shù)牟蓸訁?shù),然后再開始錄音采集,最后再使用相應的編輯軟件對錄數(shù),然后再開始錄音采集,最后再使用相應的編輯軟件對錄制的音頻數(shù)據(jù)進行剪輯和效果處理。制的音頻數(shù)據(jù)進行剪輯和效果處理。 4.5.1 4.5.1 錄音采集錄音采集u 選擇采樣參數(shù)選擇采樣參數(shù)u 調(diào)整輸入音頻的頻響調(diào)整輸入音頻的頻響u 檢測輸入音頻的強度檢測輸入音頻的強度 u 開始錄音開始錄音第第343

40、4頁頁/ /共共6868頁頁圖圖4-9 4-9 設(shè)置錄音參數(shù)設(shè)置錄音參數(shù)1 1、選擇采樣參數(shù)、選擇采樣參數(shù) 首先要根據(jù)實際情況選擇最佳的采樣參數(shù),做到音質(zhì)與首先要根據(jù)實際情況選擇最佳的采樣參數(shù),做到音質(zhì)與數(shù)據(jù)量的折中考慮,避免采樣過程中出現(xiàn)存儲空間不足的現(xiàn)數(shù)據(jù)量的折中考慮,避免采樣過程中出現(xiàn)存儲空間不足的現(xiàn)象發(fā)生。象發(fā)生。 cdcd音質(zhì)、音質(zhì)、電話質(zhì)量電話質(zhì)量收音質(zhì)量收音質(zhì)量default quality default quality 第第3535頁頁/ /共共6868頁頁2 2調(diào)整輸入音頻的頻響調(diào)整輸入音頻的頻響 表表4-7 各頻段參數(shù)對音質(zhì)的影響各頻段參數(shù)對音質(zhì)的影響頻段頻段頻率范圍頻率

41、范圍音質(zhì)影響音質(zhì)影響低頻低頻20206060hzhz空間感。提升低頻共振(嗡),降落空虛;空間感。提升低頻共振(嗡),降落空虛;6060100100hzhz渾厚感。提升轟鳴渾厚感。提升轟鳴( (轟轟) ),降落無力;,降落無力;100100150hz150hz豐滿度。提升渾濁、降落單?。回S滿度。提升渾濁、降落單?。恢蓄l低段中頻低段150150300300hzhz聲音力度、男聲力度。提升聲音硬、無特色,降落軟、飄;聲音力度、男聲力度。提升聲音硬、無特色,降落軟、飄;中頻中頻300300500500hzhz語音主要音區(qū),提升語音單調(diào)、降落語音空洞;語音主要音區(qū),提升語音單調(diào)、降落語音空洞;5005

42、001k1khzhz人聲基音、聲音廓,提升語音前凸、降落語音收縮感;人聲基音、聲音廓,提升語音前凸、降落語音收縮感; 1k1k2k2khzhz通透感、順暢感,提升有跳躍感、降落通透感、順暢感,提升有跳躍感、降落 松散;松散; 中頻上段中頻上段2k2k3k3khzhz對明亮度最敏感,提升聲音硬,不自然;對明亮度最敏感,提升聲音硬,不自然;3k3k4k4khzhz穿透力,提升穿透力,提升 咳音;咳音;4k4k5k5khzhz樂器表面響度,提升樂器距離近、降落樂器表面響度,提升樂器距離近、降落 樂器距離遠;樂器距離遠;高頻高頻5k5k6k6khzhz語言的清晰度,提升聲音鋒利、易疲勞;語言的清晰度,

43、提升聲音鋒利、易疲勞;6k6k8k8khzhz明亮度、透明度,明亮度、透明度, 提升齒音重、降落提升齒音重、降落 聲音黯淡;聲音黯淡;8k8k10k10khzhzs s音,影響音色的清晰度和透明度;音,影響音色的清晰度和透明度;第第3636頁頁/ /共共6868頁頁3 3、檢測輸入音頻的強度、檢測輸入音頻的強度 在在win2kwin2k環(huán)境下,可通過環(huán)境下,可通過“音量控制音量控制”對話框來檢測、調(diào)對話框來檢測、調(diào)節(jié)進入計算機的音源強度。節(jié)進入計算機的音源強度。 打開打開windowswindows下的音量控制臺,選擇菜單欄中的下的音量控制臺,選擇菜單欄中的“選選項項”“屬性屬性”命令打開命令

44、打開“屬性屬性”對話框。對話框。 圖圖4-10 4-10 音量控制臺音量控制臺第第3737頁頁/ /共共6868頁頁 在在“屬性屬性“對話框中的音量調(diào)節(jié)選項中選擇對話框中的音量調(diào)節(jié)選項中選擇“錄錄音音”,在顯示音量控制欄中選中麥克風等選項,如圖,在顯示音量控制欄中選中麥克風等選項,如圖4-114-11所所示。示。 在彈出的錄音控制臺中選中麥克風或線路輸入或在彈出的錄音控制臺中選中麥克風或線路輸入或cdcd音頻,使相應的音源有效,如圖音頻,使相應的音源有效,如圖4-124-12所示。所示。 圖圖4-11 “屬性屬性”對話框?qū)υ捒?圖圖4-12 錄音控制對話框錄音控制對話框第第3838頁頁/ /共

45、共6868頁頁4 4、開始錄音、開始錄音圖圖4-11 錄音機操作面板錄音機操作面板第第3939頁頁/ /共共6868頁頁4.5.2 4.5.2 抓取抓取cdcd、vcdvcd和和dvddvd音軌音軌 獲取數(shù)字音頻的另一個快捷途徑就是從不同的多媒體產(chǎn)品獲取數(shù)字音頻的另一個快捷途徑就是從不同的多媒體產(chǎn)品中直接抓取音軌信息,并轉(zhuǎn)換壓縮成所需的音頻格式。中直接抓取音軌信息,并轉(zhuǎn)換壓縮成所需的音頻格式。 wavelab 5.0版版 :抓取音樂抓取音樂cd、dvd中的音軌中的音軌 “豪杰超級解霸豪杰超級解霸”軟件軟件:抓取音樂:抓取音樂cd、vcd或或dvd光盤等光盤等格式音軌格式音軌 豪杰超級解霸豪杰超

46、級解霸9.0版版 :可從:可從dvd、vcd、rm/rmvb、avi、mpg、mv等音視頻混合的媒體中提取音頻信息,并保存為一種等音視頻混合的媒體中提取音頻信息,并保存為一種稱為稱為dac高音質(zhì)壓縮格式或高音質(zhì)壓縮格式或wav、mp3格式的聲音文件格式的聲音文件 注意:在使用抓取音軌來采集數(shù)字音頻時,應該遵守有關(guān)注意:在使用抓取音軌來采集數(shù)字音頻時,應該遵守有關(guān)法律規(guī)定,取得相應的使用權(quán),避免以后出現(xiàn)知識產(chǎn)權(quán)糾紛。法律規(guī)定,取得相應的使用權(quán),避免以后出現(xiàn)知識產(chǎn)權(quán)糾紛。 第第4040頁頁/ /共共6868頁頁4.5.3 4.5.3 編輯數(shù)字音頻編輯數(shù)字音頻 音頻編輯一般包括音頻編輯一般包括音頻內(nèi)

47、容剪切音頻內(nèi)容剪切、合成合成以及以及音質(zhì)和效音質(zhì)和效果的編輯果的編輯等方面。等方面。 多音軌(多音軌(multiple tracksmultiple tracks) 切邊(切邊(trimmingtrimming) 拼接和組合(拼接和組合(splicing and assemblysplicing and assembly) 音量調(diào)節(jié)(音量調(diào)節(jié)(volume adjustmentsvolume adjustments) 格式轉(zhuǎn)換(格式轉(zhuǎn)換(format conversionformat conversion) 重采樣或降低采樣率(重采樣或降低采樣率(resampling or down samp

48、lingresampling or down sampling) 淡進淡出(淡進淡出(fade-ins and fade-outsfade-ins and fade-outs) 均衡(均衡(equalizationequalization) 時間拉伸(時間拉伸(time stretchingtime stretching) 數(shù)字信號處理(數(shù)字信號處理(digital signal processing-dspdigital signal processing-dsp)第第4141頁頁/ /共共6868頁頁4.6 midi4.6 midi音樂音樂4.6.1 4.6.1 什么是什么是midimid

49、i midi midi(musical instrument digital interfacemusical instrument digital interface)樂器數(shù))樂器數(shù)字接口字接口。它是由。它是由yamahayamaha、rolandroland等公司在等公司在19831983年聯(lián)合提出并不年聯(lián)合提出并不斷發(fā)展確定的數(shù)字音樂的國際標準,它規(guī)定了電子樂器和多媒斷發(fā)展確定的數(shù)字音樂的國際標準,它規(guī)定了電子樂器和多媒體計算機之間進行連接的硬件及數(shù)據(jù)通信協(xié)議,是多媒體計算體計算機之間進行連接的硬件及數(shù)據(jù)通信協(xié)議,是多媒體計算機所支持的又一種聲音產(chǎn)生方法機所支持的又一種聲音產(chǎn)生方法mid

50、imidi方法。方法。 midimidi方法方法就是將數(shù)字式電子樂器的彈奏過程記錄下來,如就是將數(shù)字式電子樂器的彈奏過程記錄下來,如選的是什么樂器,彈下哪一個鍵,用了多大力氣,持續(xù)了多長選的是什么樂器,彈下哪一個鍵,用了多大力氣,持續(xù)了多長時間等。時間等。 midimidi格式的數(shù)字化文件格式的數(shù)字化文件可以看作是樂譜的數(shù)字化描述,它可以看作是樂譜的數(shù)字化描述,它記錄的不再是聲音的波形,而是樂器的種類以及音階的高低、記錄的不再是聲音的波形,而是樂器的種類以及音階的高低、長短、強弱、速度等因素,這些被稱為長短、強弱、速度等因素,這些被稱為midimidi消息,存儲為消息,存儲為midimidi文

51、件。文件。 第第4242頁頁/ /共共6868頁頁4.6.2 midi4.6.2 midi設(shè)備的配置與連接設(shè)備的配置與連接 一件樂器只要包含了能處理一件樂器只要包含了能處理midimidi信息的微處理器以及信息的微處理器以及相關(guān)的硬件接口,就可以認為是一臺相關(guān)的硬件接口,就可以認為是一臺midimidi設(shè)備設(shè)備。 兩臺兩臺midimidi設(shè)備之間可以通過設(shè)備之間可以通過接口發(fā)送信息接口發(fā)送信息而進行相互而進行相互通信。通信。 一臺一臺midimidi設(shè)備可以有設(shè)備可以有1 13 3個端口個端口:umidi in midi in 接口接口:接收來自其它:接收來自其它midimidi設(shè)備上的設(shè)備上

52、的midimidi信息;信息;umidi outmidi out接口接口:用來輸出本設(shè)備生成的:用來輸出本設(shè)備生成的midimidi信息;信息;u midi thrumidi thru接口:接口:將從將從midi inmidi in端口傳來的信息發(fā)送到另端口傳來的信息發(fā)送到另一臺相聯(lián)的一臺相聯(lián)的midimidi設(shè)備上。設(shè)備上。第第4343頁頁/ /共共6868頁頁 接收設(shè)備的接收設(shè)備的midi inmidi in連接器內(nèi)常采用連接器內(nèi)常采用光電耦合器光電耦合器實現(xiàn)收、發(fā)實現(xiàn)收、發(fā)設(shè)備之間的電氣隔離。設(shè)備之間的電氣隔離。 midimidi信息采用信息采用異步串行方式傳輸異步串行方式傳輸,傳輸速率

53、為,傳輸速率為31.2531.25 kbpskbps。 在進行在進行midimidi通信時,用戶可以通過標準的通信時,用戶可以通過標準的midimidi電纜電纜來相互連來相互連接各端口。如圖接各端口。如圖4-144-14所示。所示。圖圖4-14 midi4-14 midi與游戲接口電纜與游戲接口電纜midimidi接口接口游戲接口游戲接口inin和和outout第第4444頁頁/ /共共6868頁頁圖圖4-14 4-14 多媒體計算機與多媒體計算機與midimidi設(shè)備連接示意圖設(shè)備連接示意圖 midimidi軟件軟件(音(音序器)是用于記錄、序器)是用于記錄、編輯和播放編輯和播放midimi

54、di文文件的一種軟件,其件的一種軟件,其作用相當于是作用相當于是midimidi樂器的一臺多軌磁樂器的一臺多軌磁帶錄音機。帶錄音機。 midi midi設(shè)備可以配備設(shè)備可以配備電子鍵盤、合成器、音序器(電子鍵盤、合成器、音序器(midimidi軟軟件)以及揚聲器或音箱件)以及揚聲器或音箱等。等。 midimidi鍵盤鍵盤主要用于產(chǎn)生主要用于產(chǎn)生midimidi信息信息 midimidi合成器合成器是一種電子設(shè)備,使用數(shù)字信號處理器或其是一種電子設(shè)備,使用數(shù)字信號處理器或其他類型的芯片產(chǎn)生音樂或聲音。他類型的芯片產(chǎn)生音樂或聲音。 第第4545頁頁/ /共共6868頁頁4.6.3 4.6.3 播放

55、播放midimidi音樂音樂 聲卡播放聲卡播放midimidi音樂最常用的方法有兩種:音樂最常用的方法有兩種:fmfm合成合成與與波波表(表(wavetablewavetable)合成)合成。 fmfm是運用聲音振蕩的原理對是運用聲音振蕩的原理對midimidi進行合成處理的。進行合成處理的。 波表合成波表合成,效果較好。它是將各種真實樂器所能發(fā)出,效果較好。它是將各種真實樂器所能發(fā)出的所有聲音的所有聲音( (包括各個音域、聲調(diào)包括各個音域、聲調(diào)) )錄制下來,存儲在聲卡錄制下來,存儲在聲卡的的romrom中,稱為硬波表。中,稱為硬波表。第第4646頁頁/ /共共6868頁頁4.6.4 4.6

56、.4 制作制作midimidi音樂音樂 制作制作midimidi音樂,需要按音樂,需要按圖圖4-144-14的示意構(gòu)成系統(tǒng)。的示意構(gòu)成系統(tǒng)。 樂譜創(chuàng)作軟件樂譜創(chuàng)作軟件能夠能夠錄制、編輯、打印錄制、編輯、打印midimidi樂譜樂譜并并播放播放midimidi音樂音樂。有些樂譜創(chuàng)作軟件還能對。有些樂譜創(chuàng)作軟件還能對樂譜進行量化來調(diào)節(jié)節(jié)拍的不樂譜進行量化來調(diào)節(jié)節(jié)拍的不一致問題。一致問題。 midimidi編輯編輯中很重要的是中很重要的是選擇選擇midimidi樂器樂器,midimidi標準標準規(guī)定了不規(guī)定了不同的演奏樂器并用編號加以區(qū)分,范圍在同的演奏樂器并用編號加以區(qū)分,范圍在0 0127127

57、之間,之間,見附錄見附錄三。三。 在在midimidi樂譜中,樂譜中,樂器樂器idid用來決定以何種樂器來播放樂曲,用來決定以何種樂器來播放樂曲,為改變樂器,只需改變該數(shù)值即可。為改變樂器,只需改變該數(shù)值即可。 midimidi是為多媒體項目創(chuàng)建原始音樂素材的最佳途徑。準備是為多媒體項目創(chuàng)建原始音樂素材的最佳途徑。準備發(fā)布時應將其轉(zhuǎn)換成數(shù)字音頻數(shù)據(jù)。發(fā)布時應將其轉(zhuǎn)換成數(shù)字音頻數(shù)據(jù)。 創(chuàng)作創(chuàng)作midimidi樂譜的軟件樂譜的軟件:cakewalkcakewalk(cakewalk 9.0 xcakewalk 9.0 x版)版)第第4747頁頁/ /共共6868頁頁4.6.5 4.6.5 樂譜的掃

58、描與識別樂譜的掃描與識別 除了通過除了通過midimidi方法創(chuàng)作樂譜方法創(chuàng)作樂譜(midimidi音樂)以外,還可以利音樂)以外,還可以利用用掃描掃描- -識別技術(shù)識別技術(shù),快速將印刷樂譜數(shù)字化,保存為,快速將印刷樂譜數(shù)字化,保存為midimidi樂譜。樂譜。 smartscoresmartscore軟件掃描識別過程:軟件掃描識別過程: 首先,通過掃描儀將樂譜以圖像的方式掃描成數(shù)字圖像首先,通過掃描儀將樂譜以圖像的方式掃描成數(shù)字圖像, ,掃描參數(shù)的選擇與設(shè)置掃描參數(shù)的選擇與設(shè)置: :u 分辨率分辨率: :一般選擇一般選擇150150300300 dpidpi,u 圖像類型圖像類型: :黑白二

59、值或黑白二值或ocrocr,u 掃描后的掃描后的圖片存儲格式圖片存儲格式:tif:tif格式格式; 然后,通過樂譜識別功能識別出可編輯的數(shù)字樂譜并進行然后,通過樂譜識別功能識別出可編輯的數(shù)字樂譜并進行校對、編輯。校對、編輯。第第4848頁頁/ /共共6868頁頁識別后的樂譜識別后的樂譜識別前的樂譜圖片識別前的樂譜圖片圖圖4-16 smartscore4-16 smartscore軟件的樂譜識別畫面軟件的樂譜識別畫面 smartscoresmartscore也可以打開事先存儲好的樂譜圖片并進行也可以打開事先存儲好的樂譜圖片并進行識別,識別完成后會提示將識別的結(jié)果保存為識別,識別完成后會提示將識別

60、的結(jié)果保存為smartscoresmartscore專專用格式的用格式的.enf.enf文件。文件。 第第4949頁頁/ /共共6868頁頁4.6.6 midi4.6.6 midi與數(shù)字音頻的比較與數(shù)字音頻的比較 midimidi數(shù)字音頻數(shù)字音頻是樂譜是樂譜是一段錄音是一段錄音取決于音樂設(shè)備的質(zhì)量和音響取決于音樂設(shè)備的質(zhì)量和音響系統(tǒng)的性能系統(tǒng)的性能取決于音響系統(tǒng)的性能取決于音響系統(tǒng)的性能文件小文件小數(shù)字化波形文件大數(shù)字化波形文件大與設(shè)備有關(guān)與設(shè)備有關(guān)與播放設(shè)備無關(guān)與播放設(shè)備無關(guān)依賴于特定的回放設(shè)備依賴于特定的回放設(shè)備與回放的設(shè)備關(guān)系不大,與回放的設(shè)備關(guān)系不大,播放效果幾乎一樣。播放效果幾乎一樣

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論