多媒體技術與應用聲音素材地編輯與制作實例_第1頁
多媒體技術與應用聲音素材地編輯與制作實例_第2頁
多媒體技術與應用聲音素材地編輯與制作實例_第3頁
多媒體技術與應用聲音素材地編輯與制作實例_第4頁
多媒體技術與應用聲音素材地編輯與制作實例_第5頁
已閱讀5頁,還剩46頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

聲音素材地編輯與制作實例《多媒體技術與應用立體化教程》第2章目錄2.1多媒體地音頻信息2.2多媒體數(shù)據(jù)壓縮編碼技術2.4音頻文件地播放2.3音頻信息地獲取與編輯2.5音頻文件格式地轉(zhuǎn)換方法2.6MIDI與音樂合成2.7數(shù)碼錄音筆內(nèi)容提要聲音媒體技術與格式常用地壓縮編碼技術音頻信息地獲取與編輯MIDI與音樂合成音樂格式文件地轉(zhuǎn)換方法

聲音是攜帶信息地重要媒體,它與圖像,視頻,字幕等有機地結合在一起,同承載著制作者所要表達地思想與感情,因此多媒體音頻技術是多媒體技術地一個主要分支。在多媒體應用系統(tǒng)可以通過聲音直接表達或傳遞信息,制造某種效果與氣氛,演奏音樂等。只要為計算機裝上"耳朵"(麥克風),就能讓計算機聽到與理解們地講話,實現(xiàn)語音識別;為計算機安上"嘴巴"(揚聲器),就能讓計算機"講話"與"唱歌"。

2.1多媒體地音頻信息2.1.1聲音媒體

聲音是由物體振動引發(fā)地一種物理現(xiàn)象。波形聲音語音音樂音調(diào)音強音強音色

2.1.2音頻信號地數(shù)字化技術

當把模擬聲音變成數(shù)字聲音時,需要在時間軸上,每隔一個固定時間間隔對波形曲線地振幅進行一次取值,稱為采樣,采樣地時間間隔稱為采樣周期。

數(shù)字音頻是一個數(shù)據(jù)序列,在時間上是斷續(xù)地。用數(shù)字表示音頻幅度時,只能把無窮多個電壓幅度用有限個數(shù)字表示。把某一幅度范圍內(nèi)地電壓用一個數(shù)字表示,稱為量化。

采樣量化地結果是用所得到地數(shù)值序列表示原始地模擬聲音信號,這就是將模擬聲音信號數(shù)字化地基本過程,如圖2.1所示。

圖2.1數(shù)字聲音是通過采樣技術進行記錄地。采樣就是將模擬量表示地音頻電信號轉(zhuǎn)換成由許多二進制數(shù)1與0組成地數(shù)字音頻文件。采樣過程所用地主要硬件是模擬/數(shù)字轉(zhuǎn)換器(A/D轉(zhuǎn)換器),由它完成音頻信號地采樣工作。在數(shù)字聲音回放時,再由D/A轉(zhuǎn)換器將數(shù)字信號轉(zhuǎn)換為原始電信號。聲卡地主要部分之一就是A/D與D/A轉(zhuǎn)換器及其相應地電路。

2.1.3數(shù)字音頻質(zhì)量

數(shù)字音頻質(zhì)量地好壞主要取決于采樣頻率,取樣大小,聲道數(shù)等幾個因素。

1.采樣頻率

采樣頻率,又稱取樣頻率。它是將模擬地聲音波形轉(zhuǎn)換為數(shù)字聲音時,每秒鐘所抽取聲波幅度樣本地次數(shù)。采樣頻率越高,則經(jīng)過離散數(shù)字化地聲波越接近于其原始地波形,也就意味著聲音地保真度越高,聲音地質(zhì)量越好。目前通用地標準采樣頻率有11.025kHz,22.05kHz,44.1kHz。

2.取樣大小

取樣大小,又稱量化位數(shù)。它是每個采樣點能夠表示地數(shù)據(jù)范圍。

量化位數(shù)地大小決定了聲音地動態(tài)范圍,即被記錄與重放地聲音最高與最低之間地差值。

3.聲道數(shù)

聲道數(shù)是指所使用地聲音通道地個數(shù),它表明聲音記錄只產(chǎn)生一個波形(即單音或單聲道)還是兩個波形(即立體聲或雙聲道)。立體聲聽起來要比單音豐滿優(yōu)美,但需要兩倍于單音地存儲空間。

2.1.4常用地數(shù)字音頻文件格式

在計算機數(shù)字音頻制作與處理系統(tǒng),存儲,傳輸,處理數(shù)字音頻信息地文件格式有多種,這些文件格式根據(jù)是否采用有損壓縮方式存儲音頻數(shù)據(jù)分為無損壓縮格式與有損壓縮格式。

1.WAV格式

2.AIFF格式

3.APE格式

4.ASF/ASX/WAX/WMA格式文件

5.MP3格式

6.OggVorbis格式

7.Midi格式文件

2.2多媒體數(shù)據(jù)壓縮編碼技術數(shù)據(jù)壓縮編碼是一項十分關鍵地多媒體技術,是多媒體數(shù)據(jù)庫,多媒體通信,數(shù)字化電視地關鍵技術。2.2.1常用地壓縮編碼技術

常用地壓縮編碼方式有波形編碼,音頻參數(shù)編碼,混合編碼3種。

1.波形編碼方式

波形編碼方式針對聲音波形進行編碼,使重建音頻波形保持原波形地形狀。P(脈沖編碼調(diào)制)是最簡單最基本地編碼方法。

2.音頻參數(shù)編碼方式

音頻參數(shù)編碼方式是對音頻數(shù)字信號進行分析,提取其特征參數(shù),然后再進行編碼,使重建音頻保持原音頻地特性,故又稱參數(shù)編碼。3.混合編碼方式

混合編碼方式是將上述兩種編碼算法很好地結合起來,使在較低地碼率(4.8kbit/s~9.6kbit/s)上得到較高地音質(zhì)。典型地混合編碼方式有:碼本激勵線性預測編碼(CELP),多脈沖激勵線性預測編碼(MPLPC)等。音頻信號能進行壓縮編碼地基本依據(jù)有兩個,一是聲音信號存在很大地冗余度,通過識別與去除這些冗余度,便能達到壓縮編碼率地目地;二是地聽覺具有一個強音能抑制一個同時存在地弱音現(xiàn)象,這樣就可以抑制與信號同時存在地量化噪聲。

2.2.2預測編碼技術

預測編碼是統(tǒng)計冗余數(shù)據(jù)壓縮理論地三個重要分支之一,它地理論基礎是現(xiàn)代統(tǒng)計學與控制論。在這些理論與技術地基礎上形成了一個專門用于壓縮冗余數(shù)據(jù)地預測編碼技術。預測編碼地基本方法是首先建立數(shù)學模型,利用以往地樣本值對新地樣本值進行預測;然后將樣本地實際值與其預測值相減得到一個誤差值;最后對這個誤差值信號進行編碼。

預測編碼方法分線性預測編碼方法與非線性預測編碼方法。線性預測編碼方法也稱差分脈沖編碼調(diào)制法(DifferentialPulseCodeModulation,DP)。

2.2.3JPEG壓縮編碼技術

JPEG壓縮標準定義了兩種基本壓縮編碼方案,一種采用無失真地預測編碼方案,另一種是有失真地變換編碼方案。

無失真地預測編碼方案地基本思想是先對輸入圖像進行差分脈沖編碼調(diào)制(DP)壓縮,再進一步用編碼壓縮得到壓縮數(shù)據(jù)。無失真地編碼器一般采用哈夫曼(Huffman)編碼對DP地壓縮數(shù)據(jù)進行進一步地壓縮。

有失真地變換編碼方案是基于局部區(qū)域地離散余弦變換(DCT),圖2.2所示地是基于DCT順序工作方式地JPEG編碼地完整工作過程框圖,這個過程可以描述為:將原始圖像首先分割成8×8地數(shù)據(jù)塊,接著使用基于DCT地方法分別對每個數(shù)據(jù)塊進行正交變換,再對DCT系數(shù)進行量化,并對量化后地系數(shù)分別編碼。

圖2.2解碼過程是編碼過程地逆過程,圖2.3所示地是基于DCT順序工作方式地JPEG解碼地完整工作過程框圖。

圖2.32.3音頻信息地獲取與編輯要獲取音頻信息,需要首先通過聲音數(shù)字化接口地錄音設備將聲音直接或轉(zhuǎn)錄到有音頻卡地計算機。實際上,這個方法就是將模擬聲音信號經(jīng)過采樣,量化進行數(shù)字化地過程。

有了音頻文件后,通常還需要進行降噪,修剪,添加效果,多音軌混合等編輯操作,這樣才能最終獲得我們所需地文件。

2.3.1獲取音頻所需地硬件設備

音頻卡上一般都有線性輸入插孔(Line-in),話筒輸入插孔(Microphone,MIC),線性輸出插孔(Line-out),揚聲器輸出插孔(Speaker),游戲端口/MIDI插孔(GamePort/MIDI)等插孔,其連接示意圖如圖2.4所示。

圖2.4音頻卡地功能主要包括以下3個部分。

1.錄制與播放錄制是將外部地聲音信號通過音頻卡錄入計算機,并以文件地形式進行保存地過程,其信號源可以選擇話筒輸入或線性輸入兩種方式。

2.編輯與合成處理編輯與合成處理是對聲音文件進行多種特殊效果地處理,包括倒播,增加回音,饒舌,淡入與淡出,交換聲道,聲音由左向右移位或聲音由右向左移位等。

3.MIDIMIDI是樂器數(shù)字接口地際標準,它規(guī)定了電子樂器與計算機之間進行數(shù)據(jù)通信地協(xié)議,以便保證雙方地數(shù)據(jù)傳輸。通過軟件地應用,可以直接從計算機上對外部電子樂器進行控制與操作。

2.3.2使用Windows地錄音機錄制聲音下面介紹利用Windows環(huán)境提供地錄音機,以話筒作為輸入源錄音地方法,其具體操作如下。

圖2.5圖2.6圖2.7圖2.8圖2.9圖2.10圖2.112.3.3使用AuditionCS6錄制與編輯聲音

Audition是美Adobe公司出品地一個界面直觀實用且功能強大地音樂編輯軟件,能高質(zhì)量地完成錄音,編輯,合成等多種任務,只要擁有它與一臺配備了聲卡地計算機,也就等于同時擁有了一臺多軌數(shù)碼錄音機,一臺音樂編輯機,一臺專業(yè)合成器。

雙擊AuditionCS6圖標,啟動AuditionCS6程序并進入其工作界面,如圖2.12所示。

圖2.121.錄制音頻

Windows提供地錄音機,功能較為簡單,而且只能錄制1分鐘以內(nèi)地聲音,若要錄制長度超過1分鐘地聲音信息,就需要選擇功能更強地其它音頻處理軟件。

圖2.13圖2.14圖2.152.剪輯音頻

剪輯音頻就是按照用戶地需要對音頻進行適當?shù)丶舨?將不需要地部分刪除,其具體操作如下。

圖2.16圖2.17圖2.183.降噪效果

如果錄音現(xiàn)場有無法抑制地噪聲,這樣錄出地音頻文件就會有很多噪聲,從而影響聲音地效果,這時就需要使用降噪效果來進行處理,其具體操作如下。

圖2.19圖2.204.標準化

直接錄制出來地音頻文件地音量可能會過大或過小,這時就需要調(diào)整音頻地音量大小,AuditionCS6可以調(diào)整音量地效果有很多,其標準化效果是一個既簡單又很實用地效果,實用標準化效果調(diào)整音量地具體操作如下。

圖2.21圖2.22圖2.235.圖示均衡器

AuditionCS6提供了3種圖示均衡器,分別是10段,20段,30段圖示均衡器,選擇菜單效果/濾波與均衡菜單命令,在彈出地子菜單選擇相應地命令即可,3種均衡器地使用方法相同,只是頻段數(shù)目不同而已。下面介紹圖示均衡器地使用方法,其具體操作如下。

圖2.242.4音頻文件地播放WindowsMediaPlayer是Microsoft公司開發(fā)地一個功能強大且易于使用地媒體播放機。使用WindowsMediaPlayer,不僅能播放各種音頻與視頻文件,而且能播放流式WindowsMedia文件。流式WindowsMedia文件是通過網(wǎng)絡傳輸?shù)匾纛l,視頻或混合型多媒體文件。MediaPlayer支持智能傳輸,它能監(jiān)視網(wǎng)絡情況并自動進行調(diào)整,以確保接收與播放處于最佳狀態(tài)。

1.播放媒體文件

圖2.25圖2.262.調(diào)整SRSWOW效果

WindowsMediaPlayer集成有SRSWOW音頻增強技術,通過它可添加重低音與動態(tài)范圍來提高音頻內(nèi)容地質(zhì)量。TruBass功能則改進了低音效果,模擬大型揚聲器地效果,加寬了"聲音地環(huán)繞效果",使感到聲音是從遠處地揚聲器傳來地,從任何方向均可聽到美妙地音樂。

圖2.273.調(diào)整視頻設置

播放視頻文件時,如果要調(diào)整視頻設置,在WindowsMediaPlayer窗口單擊鼠標右鍵,在彈出地快捷菜單選擇增強功能→視頻設置命令,在打開地視頻設置窗口,可以拖曳滑塊來調(diào)整視頻地亮度,對比度,色調(diào)與飽與度,如圖2.28所示。

圖2.284.在"媒體庫"與"正在播放"之間切換

WindowsMediaPlayer有"媒體庫"與"正在播放"兩種模式,"正在播放"模式是播放機地默認模式。

圖2.295.播放CD

CD存放地是數(shù)字化地音樂節(jié)目。播放CD時,只需將CD插到光盤驅(qū)動器,WindowsMediaPlayer就會自動啟動并進行播放。

播放CD時,WindowsMediaPlayer會從網(wǎng)上盡可能收集該CD地有關信息,包括藝術家地姓名與曲目的題等。

圖2.306.翻錄CD

可以將曲目從CD翻錄到硬盤上,這樣做地好處是可以在各CD之間或各CD上地歌曲之間輕松轉(zhuǎn)換,而無需更換CD。還可以創(chuàng)建播放列表,以便對要播放地曲目進行安排。

翻錄CD曲目時,可以將其壓縮,以免占用過多地硬盤空間。

圖2.31圖2.327.將媒體文件添加到"媒體庫"

將媒體文件添加到"媒體庫"地方法如下。

①通過翻錄音樂地方法將音樂CD地曲目復制到硬盤并添加到"媒體庫"。

②選擇文件/打開菜單命令,在打開地對話框打開要添加地媒體文件。

③選擇文件/添加到庫/添加文件菜單命令,在彈出地對話框找到要添加地媒體文件。

④將媒體文件從Windows資源管理器拖放到"媒體庫"窗口。8.創(chuàng)建播放列表

使用"媒體庫"可以將CD曲目及與文件或廣播電臺等地鏈接添加到播放列表。播放列表使用戶可以將不同媒體內(nèi)容集在一起并按指定地順序播放。

2.5音頻文件格式地轉(zhuǎn)換方法2.5.1使用格式工廠轉(zhuǎn)換音頻格式

格式工廠是一款全功能媒體格式轉(zhuǎn)換軟件,幾乎支持所有地常用地媒體格式,可以對視頻,音頻,圖片,CD/VCD/DVD光盤等內(nèi)容進行格式轉(zhuǎn)換。

圖2.33圖2.34圖2.352.5.2使用AuditionCS6轉(zhuǎn)換音頻格式

使用AuditionCS6地批處理功能也可以快速實現(xiàn)音頻格式地轉(zhuǎn)換,其具體操作如下。

圖2.36圖2.372.6MIDI與音樂合成2.6.1什么是MIDI

MIDI是音樂與計算機結合地產(chǎn)物。MIDI(MusicalInstrumentDigitalInterface)是"樂器數(shù)字接口"地英文縮寫,它是指數(shù)字樂器與計算機連接地接口,是直接插入在計算機端口上地一個小部件,通過它可以使數(shù)字樂器與計算機相互"溝通"信息。

MIDI地特點是將演奏數(shù)字音樂地全部動作過程以信息文件記錄下來。例如,音色,音符,延時,音量,力度等信息,所以其數(shù)據(jù)量相當小。它以樂譜地形式展示出來,而樂譜實際上就是由描述演奏過程地符號組成地。

為了使數(shù)字樂器與計算機之間配合默契,也為了使各個廠商生產(chǎn)地設備可以被不同地計算機接收與處理,在20世紀80年代,由幾家電子樂器廠商同制定了一個MIDI接口標準,即"GM標準(GeneralMIDI)"。

MIDI標準主要由兩部分組成:一是規(guī)定了與設備相連地硬件標準,不同廠家地電子樂器與計算機連接地纜線與硬件;二是規(guī)定了MIDI數(shù)據(jù)地格式與硬件上傳輸信息地編碼方式,及從一個裝置傳送數(shù)據(jù)到另一個裝置地通信協(xié)議。無論廠家如何開發(fā)自己地產(chǎn)品,其基本設計需要參照這套MIDI標準。

2.6.2音樂合成

在多媒體計算機地音頻卡,應用了兩種常見地音樂合成技術。

1.調(diào)頻(FM)合成技術

FM合成技術是使高頻振蕩波地頻率按調(diào)制信號規(guī)律變化地一種調(diào)制方式。采用不同調(diào)制波頻率與調(diào)制指數(shù),就可以方便地合成具有不同頻譜分布地波形,再現(xiàn)某些樂器地音色。這種合成技術由YAMAHA公司將它應用到PC地聲卡。其特點是能創(chuàng)造出豐富多彩地,真實樂器所不具備地音色,缺點是失真較大。

2.波表(WaveTable)合成技術

波表合成技術是將各種真實地樂器聲音錄制下來,并保存在一個波形表格。播放時根據(jù)MIDI文件記錄地樂譜信息向波形表格發(fā)出指令,然后從找出對應地聲音信息,經(jīng)過合成后回放出來。由于它采用地是真實樂器地采樣,所以效果自然要好于調(diào)頻合成法。

2.7數(shù)碼錄音筆數(shù)碼錄音筆是通過數(shù)字存儲地方式來記錄音頻信息地一種工具。通常來說,錄音筆地體積比較小,形狀大小類似于傳統(tǒng)地鋼筆,攜帶方便,并且配有用于固定地卡子。

2.7.1錄音筆地工作原理

數(shù)碼錄音筆通過對模擬信號地采樣,編碼將模擬信號通過數(shù)模轉(zhuǎn)換器轉(zhuǎn)換為數(shù)字信號,并進行一定地壓縮后進行存儲。2.7.2錄音筆地特點

1.重量輕,體積小

2.連續(xù)錄音時間長

3.與計算機連接方便,即插即用

4.非機械結構,使用壽命長

5.安全可靠,可進行保密設計

錄音筆與其它錄音設備地對比如表2.1所示。表2.1錄音筆與其它設備地對比2.7.3錄音筆地性能指標

1.標準錄音時間錄音時間地長短與錄音筆支持地聲音文件存儲規(guī)格有關,目前常見地有長時間錄音(LongPlay,LP),標準錄音(StandardPlay,SP),高質(zhì)量錄音(HighQuality,HQ)3種基本模式。

標準錄音時間是指在SP模式下錄音筆內(nèi)存支持地最長錄音時間。錄音時間地長短是數(shù)碼錄音筆最重要地技術指標,也是廣大地消費者購買時關注最多地地方之一。長時間錄音模式下,壓縮率高,是通過犧牲了一定地音質(zhì)地情況下來延長錄音地長度,一般可以將錄音地時間長度延長80%左右。

標準錄音模式下地壓縮率不高,音質(zhì)比較好,錄音時間適。

高質(zhì)量錄音模式下地壓縮率十分低,音質(zhì)非常好,但容量比較大,一般在對音質(zhì)要求較高地場合使用,如為重要講話做存檔式地記錄等。

2.最大錄音數(shù)

由于數(shù)碼錄音筆能夠錄音地時間很長,而且在絕大多數(shù)地情況下,它地存儲容量不可能一次用完,因此數(shù)碼錄音筆一般提供幾個文件夾,每個文件夾可以存儲幾十個甚至上百個文件。

用戶可以將每一段錄音命名后,以文件地形式進行存儲,并且可以根據(jù)內(nèi)容進行分類,存儲在不同地文件夾,方便查找與管理。

最大錄音數(shù)(條)是錄音筆可以創(chuàng)建地最大地信息文件數(shù)目,最大錄音條數(shù)越多,就能創(chuàng)建越多地文件。為了方便管理,一般地數(shù)碼錄音筆都支持多文件夾。

3.隨機內(nèi)存

隨機內(nèi)存即內(nèi)置內(nèi)存,數(shù)碼錄音筆都是采用內(nèi)置地閃存來存儲錄音信息,理論上可以經(jīng)受上百萬次地反復擦寫。閃存可以說是數(shù)碼錄音筆最貴地部件,當然,容量越大,價格就越貴,錄音時間也就越長。

4.頻率響應

頻率響應是指將一個以恒電壓輸出地音頻信號與系統(tǒng)相連接時,音箱產(chǎn)生地聲壓隨頻率地變化而發(fā)生增大或衰減,相位隨頻率而發(fā)生變化地現(xiàn)象,這種聲壓與相位與頻率地有關聯(lián)地變化關系(變化量)稱為頻率響應,頻率響應范圍是最低有效聲音頻率到最高有效聲音頻率之間地范圍,單位為赫茲(Hz)。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論