多媒體第三講音頻信息的獲取與處理課件_第1頁(yè)
多媒體第三講音頻信息的獲取與處理課件_第2頁(yè)
多媒體第三講音頻信息的獲取與處理課件_第3頁(yè)
多媒體第三講音頻信息的獲取與處理課件_第4頁(yè)
多媒體第三講音頻信息的獲取與處理課件_第5頁(yè)
已閱讀5頁(yè),還剩9頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第三講 音頻信息的獲取與處理主要內(nèi)容2.1 音頻技術(shù)的主要組成部分2.2 聲音卡的功能和分類(lèi)2.3 聲音卡的組成2.4 聲音卡的選擇及應(yīng)用2.5 數(shù)字音頻的文件格式2.6 聲音文件工具 2.1 音頻技術(shù)的主要組成部分 1. 音頻信息獲取技術(shù)的工作原理和主要組成部分如下:音頻的信號(hào)源是拾音器,如麥克風(fēng)具有可編程增益控制的音頻放大器:立體聲分左右兩個(gè)通道,分別編程控制音頻放大器的放大倍數(shù)低通濾波器:濾澡聲,防止采樣混疊采樣和A/D變換器:將連續(xù)的模擬語(yǔ)音信號(hào)離散數(shù)字化存儲(chǔ)器:存放數(shù)字或語(yǔ)音信息)D/A變換器:將處理好的數(shù)字式語(yǔ)音信號(hào)轉(zhuǎn)換成模擬信號(hào)濾波器:改善輸出語(yǔ)音信號(hào)的質(zhì)量功率放大和增益控制:可

2、編程的音量控制器,分左右兩路輸出到音響設(shè)備2.1 音頻技術(shù)的主要組成部分2. 多媒體涉及到的音頻處理技術(shù):(1)音頻采集:把模擬音頻信號(hào)轉(zhuǎn)換成數(shù)字化音頻信 號(hào),然后存儲(chǔ)到存儲(chǔ)設(shè)備中。(2)文語(yǔ)轉(zhuǎn)換:經(jīng)過(guò)語(yǔ)言學(xué)處理、語(yǔ)音學(xué)處理,把計(jì)算 機(jī)內(nèi)的文本轉(zhuǎn)換成聲音輸出。(3)聲音編碼/解碼:對(duì)語(yǔ)音信息進(jìn)行壓縮編碼和解壓縮 還原。(4)語(yǔ)音識(shí)別:電腦辨別和理解人說(shuō)的話。(5)音樂(lè)合成:利用音樂(lè)合成芯片,把樂(lè)譜轉(zhuǎn)換成樂(lè)曲 輸出。還有音頻數(shù)據(jù)傳輸、音頻視頻同步、音頻效果與編輯等2.2 聲音卡的功能和分類(lèi)聲音卡的分類(lèi) 聲音卡的分類(lèi)主要是根據(jù)其數(shù)據(jù)采樣量化的位數(shù)來(lái)確定,通常分為8位、16位和32位,位數(shù)越多,其量

3、化精度越高,音質(zhì)就越好。 聲音卡通常帶有自己的CPU,具有較高的智能性和靈活性,支持DOS環(huán)境和Windows環(huán)境下的應(yīng)用開(kāi)發(fā)。 數(shù)字音頻部分具有的基本功能有44 .1kHz的采樣率,8位以上的分辨率,錄音和播放聲音信號(hào),同時(shí)具有壓縮采樣信號(hào)的能力。最常用的壓縮方法是自適應(yīng)脈沖編碼調(diào)制。2.2 聲音卡的功能和分類(lèi)2. 聲音卡的主要功能(1)錄制、編輯和回放數(shù)字聲音文件(2)控制、混合各聲源的音量(3)在記錄和回放數(shù)字文件時(shí)壓縮和解壓縮(4)采用語(yǔ)音合成技術(shù)讓電腦朗讀文本(5)具有MIDI(Music Instrument Data Interface,即 樂(lè)器數(shù)字化接口)接口:MIDI是一種用

4、于電子樂(lè)器 和計(jì)算機(jī)之間的通信標(biāo)準(zhǔn),通過(guò)軟件,計(jì)算機(jī)可以 直接對(duì)外部電子樂(lè)器進(jìn)行控制和操作。(6)文語(yǔ)轉(zhuǎn)換和語(yǔ)音識(shí)別1. 插孔和D形連接器線路輸入(Line In)插孔:麥克風(fēng)(MIC)輸入插孔:線路輸出插孔:“Line Out”、“Audio Out”、 “Speaker”D形連接器:15芯的D形接口,可以用來(lái)連接游戲操縱桿、游戲機(jī)入口或MIDI合成器。2. CD-ROM接口及音頻信號(hào)連接口:通常為4芯插座,有左、右聲道以及兩根地線。2.3 聲音卡的組成3. 音量調(diào)節(jié)旋鈕4. 跳接器 其功能是用來(lái)選擇聲音卡的硬件設(shè)備,包括CD-ROM型號(hào)、CD-ROM的I/O地址、聲音卡的I/O地址的選擇。

5、聲音卡上游戲口的選擇(開(kāi)或關(guān))以及聲頻卡的IRQ(中斷請(qǐng)求號(hào))和DMA(Directly Memory Access,即直接存儲(chǔ)訪問(wèn))通道的設(shè)置不能與系統(tǒng)上其他設(shè)備的設(shè)置相沖突,否則聲音卡甚至整個(gè)計(jì)算機(jī)系統(tǒng)將不能正常工作。5. 聲音卡的驅(qū)動(dòng)程序2.3 聲音卡的組成 首先應(yīng)明確準(zhǔn)備用聲音卡完成什么功能,然后仔細(xì)閱讀產(chǎn)品說(shuō)明書(shū)所承諾的功能,查看聲音卡的技術(shù)指標(biāo)和功能是否符合需求,并按照以下標(biāo)準(zhǔn)來(lái)進(jìn)行衡量。如果允許的話,最好在購(gòu)買(mǎi)時(shí)試聽(tīng)一下聲音的效果。模/數(shù)轉(zhuǎn)換與數(shù)/模轉(zhuǎn)換(1)模/數(shù)轉(zhuǎn)換(ADC):將輸入的模擬音頻信號(hào)轉(zhuǎn)換成數(shù)值,數(shù)字化后的音頻信號(hào)是數(shù)值,是離散的數(shù)據(jù),并非像音頻卡信號(hào)一樣為連續(xù)的

6、波形。數(shù)字化音頻信號(hào)涉及的兩個(gè)基本技術(shù)指標(biāo)是: a. 采樣頻率:?jiǎn)挝粫r(shí)間內(nèi)的采樣次數(shù)。目前一般采用44.1kHz和48kHz。 b. 采樣值的編碼位數(shù):采樣值使用的二進(jìn)制編碼位數(shù) 2.4 聲音卡的選擇及應(yīng)用 聲音卡涉及三個(gè)指標(biāo):采樣頻率(應(yīng)支持11.025kHz、22.05kHz和44.1kHz三種頻率)、采樣數(shù)據(jù)位數(shù)(有8位、16位和32位等)以及聲道數(shù)(單聲道與雙聲道等)(2)數(shù)模轉(zhuǎn)換(DAC):完成將數(shù)字化的聲音數(shù)據(jù)轉(zhuǎn)換成模擬音頻信號(hào)輸出,它是模數(shù)轉(zhuǎn)換的逆過(guò)程。其主要指標(biāo)與模數(shù)轉(zhuǎn)換相同。2. 內(nèi)部聲音混合調(diào)節(jié)器( Internal Mixer) 主要功能是把不同輸入源如(LINE IN,

7、MIC及CD-Audio)中輸入的聲音信號(hào)進(jìn)行混合和音量調(diào)節(jié)。3. 合成器:合成方法有波表(Wave Table)查詢(xún)和頻率調(diào)制(FM),前者效果好但價(jià)格高。2.4 聲音卡的選擇及應(yīng)用4. MIDI接口 選購(gòu)聲音卡時(shí),首先看有無(wú)MIDI合成器,若有還要看MIDI輸出采用何種合成方法,是FM合成,還是波表合成5. DSP(Data Signal Processor數(shù)字信號(hào)處理器)芯片 其功能是用來(lái)處理聲音合成、特殊效果和音頻文件的壓縮與解壓縮。6. 信噪比(SNR)和THD(總諧波失真)7. I/O設(shè)備的支持8. 兼容性9. ASP(高級(jí)數(shù)字信號(hào)處理器)功能10. 即插即用、三維音效、系統(tǒng)參數(shù)的

8、可調(diào)性等2.4 聲音卡的選擇及應(yīng)用 在多媒體技術(shù)中,存儲(chǔ)聲音信息的文件格式主要有:WAV文件、VOC文件、MIDI文件、AIF文件、SND文件及RMI文件等。WAV文件 WAV是Microsoft公司的音頻文件格式。來(lái)源于對(duì)聲音模擬波形的采樣,故它所需要的存儲(chǔ)容量都很大,其大小可用以下公式表示: Wav文件的字節(jié)數(shù)/秒= 采樣頻率(Hz)X 量化位數(shù)(位)X 聲道數(shù)/82.5 數(shù)字音頻的文件格式2. VOC文件 VOC文件是Creative公司波形音頻文件格式,也是聲霸卡使用的音頻文件格式。每個(gè)VOC文件由文件頭塊(header block)和音頻數(shù)據(jù)塊(data block)組成。3. MIDI文件 MIDI文件中包含音符、定時(shí)和多達(dá)16個(gè)通道的樂(lè)器定義,每個(gè)音符包括鍵、通道號(hào)、持續(xù)時(shí)間、音量和力度等信息。所以MIDI文件記錄的不是樂(lè)曲本身,而是一些描述樂(lè)曲演奏過(guò)程中的指令。4. AIF文件:Apple機(jī)上聲音文件存儲(chǔ)格式2.5 數(shù)字音頻的文件格式2.6 聲音文件工具Windows 操作系統(tǒng)自帶的“Sound Recorder”買(mǎi)聲音卡

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論