




已閱讀5頁,還剩39頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第二章 數(shù)字聲音及MIDI,信息:數(shù)、文、形、音、圖 音頻:麥克風(fēng)、揚(yáng)聲器 多媒體計(jì)算機(jī): 聲音的輸入、存儲(chǔ)、處理、輸出 聲音:消息、意向、情感,2.1 聲音與聽覺,聲音:通過空氣傳播的一種連續(xù)的波,又稱聲波。 聲音的度量:頻率與幅度(聲波壓力的大?。?頻率用音高表示,幅度用聲強(qiáng)表示 與看得見的水波類似,波形聲音,波形聲音,實(shí)際上包含了所有的聲音形式。任何聲音信號(hào),包括麥克風(fēng)、磁帶錄音、無線電和電視廣播、光盤等各種聲源所產(chǎn)生的聲音,都要首先對(duì)其進(jìn)行模數(shù)轉(zhuǎn)換,然后再恢復(fù)出來。,語音(speech),人的聲音不僅是一種波形,而且還有內(nèi)在的語言、語音學(xué)的內(nèi)涵,可以利用特殊的方法進(jìn)行抽取,通常將語音也作為一種媒體。,音樂,音樂是符號(hào)化了的聲音。這種符號(hào)就是樂曲,樂譜是轉(zhuǎn)化為符號(hào)媒體的聲音。電子樂器數(shù)字接口(musical instrument digital interface, MIDI )是十分規(guī)范的一種形式。,帶寬與聽覺 Hertz,Amplitude, Frequency infra-sound, ultrasound, hypersound,18k,感知聲音的幅度:用dyne(達(dá)因)/平方厘米表示,常轉(zhuǎn)換成0120dB(decibel),但對(duì)不同的頻率,同樣的聲強(qiáng),感覺不同。 聲音信號(hào): 有許多不同頻率的信號(hào)組成,又稱復(fù)合信號(hào)。 帶寬:組成復(fù)合信號(hào)的頻率范圍。 純音:單一頻率的聲音。,聲音是由空氣中分子的振動(dòng)而產(chǎn)生的。自 然界的聲音是一個(gè)隨時(shí)間而變化的連續(xù)信號(hào),可近似地看成是一種周期性的函數(shù)。通常用模擬的連續(xù)波形描述聲波的形狀,單一頻率的聲波可用一條正弦波表示,如下圖所示。,基線是測量模擬信號(hào)的基準(zhǔn)點(diǎn)。 聲波的振幅表示聲音信號(hào)的強(qiáng)弱程度。 聲波的頻率反映出聲音的音調(diào),聲音細(xì)尖表示頻率高,聲音粗低表示頻率低。 振幅和頻率不變的聲音信號(hào),稱為單音。單音一般只能由專用電子設(shè)備產(chǎn)生。 在日常生活中,我們聽到的自然界的聲音一般都屬于復(fù)音,其聲音信號(hào)由不同的振幅與頻率合成而得到。,模擬聲音信號(hào):可分解成一系列正弦波的線性疊加。 最低頻的音波稱為基音,頻率為基頻 其余的為泛音,頻率是基頻的整數(shù)倍。,聲音三要素:音高、音色、音強(qiáng) 音高:由基頻決定,基頻取對(duì)數(shù)后與人的音高感覺成線性關(guān)系。 音色:有混入基音中的泛音決定。 音強(qiáng):幅度,聽覺與聲音信號(hào)強(qiáng)度不成線性關(guān)系,因而用20log幅度(分貝)表示,(1). 采樣和量化,(c) 采樣信號(hào)的量化,(a) 模擬音頻信號(hào),(b) 音頻信號(hào)的采樣,數(shù)字化音頻的過程如下圖所示。,2.2 聲音信號(hào)數(shù)字化,從模擬信號(hào)到數(shù)字信號(hào) 模擬信號(hào):在時(shí)間與幅度上都連續(xù),連續(xù) 記為x(t). 離散信號(hào):按一定的時(shí)間間隔T,得到的x(nT). T為抽樣周期,1/T抽樣頻率 量化:把抽樣序列x(nT)量化成一個(gè)有限個(gè)幅度之的集合x(nT).,對(duì)模擬音頻信號(hào)進(jìn)行采樣量化編碼后,得到數(shù)字音頻。數(shù)字音頻的質(zhì)量取決于 采樣頻率 量化位數(shù) 聲道數(shù),采樣頻率,采樣頻率是指一秒鐘時(shí)間內(nèi)采樣的次數(shù)。 在計(jì)算機(jī)多媒體音頻處理中,采樣頻率通常采用三種:11.025KHz(語音效果)、22.05KHz(音樂效果)、44.1KHz(高保真效果)。常見的CD唱盤的采樣頻率即為44.1KHz。,量化位數(shù),量化位數(shù)也稱“量化精度”,是描述每個(gè)采樣點(diǎn)樣值的二進(jìn)制位數(shù)。 例如,8位量化位數(shù)表示每個(gè)采樣值可以用28即256個(gè)不同的量化值之一來表示,而16位量化位數(shù)表示每個(gè)采樣值可以用216即65536個(gè)不同的量化值之一來表示。常用的量化位數(shù)為8位、12位、16位。,聲道數(shù),聲音通道的個(gè)數(shù)稱為聲道數(shù),是指一次采樣所記錄產(chǎn)生的聲音波形個(gè)數(shù)。 記錄聲音時(shí),如果每次生成一個(gè)聲波數(shù)據(jù),稱為單聲道;每次生成兩個(gè)聲波數(shù)據(jù),稱為雙聲道(立體聲)。隨著聲道數(shù)的增加,所占用的存儲(chǔ)容量也成倍增加。,2. 聲音數(shù)字化: Sampling, Quantization, Coding 采樣頻率與量化精度 3.采樣頻率 奈奎斯特(Nyquist)定理(1928年提出原理,仙儂(Shannon)形成定理并應(yīng)用,1933年卡切尼科夫用公式表述): 采樣頻率2f 這里f為被采樣信號(hào)的最高頻率。,4. 量化精度 量化: 取樣值(-,+)有限個(gè)數(shù)(量化值近似) 若量化值有J個(gè),若用二進(jìn)制表示,需要R=log2(J) 位 量化誤差:用有限的離散值表示無限多的連續(xù)值,必然存在誤差. 該誤差又稱為量化噪聲(與一般的噪聲不同)。 采樣精度可以用信噪比表示: R為編碼位數(shù),5. 音頻數(shù)據(jù)率 未經(jīng)壓縮的數(shù)字音頻數(shù)據(jù)率(bit/s) 采樣頻率(Hz)量化位數(shù) (bit)聲道數(shù) 音頻數(shù)據(jù)存儲(chǔ)量(Byte) 數(shù)據(jù)率(bit/s)持續(xù)時(shí)間(s) / 8 例:采樣率11.025KHz、量化位8位,采集1分鐘, 則:音頻數(shù)據(jù)率11.025(KHz)8(bit) 88.2 (Kbit/s) 音頻數(shù)據(jù)量11.025(KHz)8(bit) 60(s)/8 0.66 (MByte),存儲(chǔ)量=采樣頻率量化位數(shù)/8聲道數(shù)時(shí)間,聲音的質(zhì)量與數(shù)據(jù)率,根據(jù)聲音的頻帶,把聲音的質(zhì)量分為5個(gè)等級(jí),2.3 聲音文件的存儲(chǔ)格式,聲音文件的格式: PC機(jī):.wav Apple: .aiff, .snd Unix: .au 2. 波形文件格式:1991年IBM與微軟開發(fā)(以 .wav為擴(kuò)展名) Fig 2.3 3. 常見聲音文件的擴(kuò)展名 表2-2,聲音文件,在多媒體技術(shù)中,存儲(chǔ)聲音信息的常用文件格式主要有:WAV文件、VOC文件、MIDI文件、AIF文件、SNO文件和RMI文件等。,(1) WAV文件,WAV是Microsoft公司的音頻文件格式。利用Microsoft Sound System軟件Sound Finder可以將AIF、SND和VOD文件轉(zhuǎn)換到WAV格式。 WAV文件來源于對(duì)聲音模擬波形的采樣。用不同的采樣頻率對(duì)聲音的模擬波形進(jìn)行采樣可以得到一系列離散的采樣點(diǎn),以不同的量化位數(shù)(8位或16位)把這些采樣點(diǎn)的值轉(zhuǎn)換成二進(jìn)制數(shù),然后存入磁盤,這就產(chǎn)生了聲音的WAV文件,即波形文件。WAV文件是由采樣數(shù)據(jù)組成的,所以它需要的存儲(chǔ)容量很大。,(2) VOC文件,VOC文件是Creative公司波形音頻文件格式,也是聲卡使用的音頻文件格式。每個(gè)VOC文件由文件頭塊(header block)和音頻數(shù)據(jù)塊(data block)組成。文件頭包含一個(gè)標(biāo)識(shí)、版本號(hào)和一個(gè)指向數(shù)據(jù)塊起始的指針。數(shù)據(jù)塊分成各種類型的子塊,如聲音數(shù)據(jù)、靜音、標(biāo)記、ASCII碼文件、重復(fù)的結(jié)束,以及終止標(biāo)記、擴(kuò)展塊等。,(3) MIDI文件,MIDI(musical instrument digital interface)是一種技術(shù)規(guī)范,從它的英文全名可以看出,它用于音樂。,其他音頻文件,最重要的是PCM格式,它是模擬的音頻信號(hào)經(jīng)數(shù)模轉(zhuǎn)換(A/D變換)直接形成的二進(jìn)制序列,該文件沒有附加的文件頭和文件結(jié)束標(biāo)志。在聲卡提供的軟件中,可以利用VOCHDR程序,為PCM格式的音頻文件加上文件頭,而形成VOC格式。Windows的Convert工具也可以將PCM音頻文件轉(zhuǎn)換成Microsoft的WAV格式。 AIF是Apple計(jì)算機(jī)的音頻文件格式。WindowsConvert工具可以把AIF格式的文件轉(zhuǎn)換成Microsoft的WAV格式的文件。,2.4 聲音工具,聲音工具:錄、放、存儲(chǔ)、編輯 Windows自帶:sound recorder 播放和錄音設(shè)備:SoundMAX Digital Audio 聲卡:附帶wave studio 網(wǎng)上:cool edit, goldwave Windows Media Player 播放和組織計(jì)算機(jī)和 Internet 上的數(shù)字媒體文件。這就好象把收音機(jī)、視頻播放機(jī)、CD 播放機(jī)和信息數(shù)據(jù)庫等都裝入了一個(gè)應(yīng)用程序中 Windows Media Player 播放器支持的文件類型.doc,2.5 聲音質(zhì)量的度量,1.聲音信號(hào)的帶寬 2.客觀質(zhì)量度量 signal-to-noise ratio,SNR 3.主觀質(zhì)量度量:人的感覺 MOS:mean opinion score,聲音質(zhì)量 MOS標(biāo)準(zhǔn),2.5 聲音質(zhì)量的度量,作業(yè) 使用“錄音機(jī)”軟件把10秒鐘的CD音樂錄制成CD音質(zhì)(44.1kz、16位、雙聲道、PCM)的.wav文件)。 把錄制的文件分別轉(zhuǎn)換為“22.05kz、16位、單聲道、PCM”, “11.025kz、8位、單聲道、PCM”以及“44.1kz、4位、單聲道、ADPCM” 比較以上四種格式的聲音文件的數(shù)據(jù)量和聲音音質(zhì),2.6 電子樂器數(shù)字接口MIDI,MIDI(Musical Instruments Digital Interface) Musical synthesizers、musical instruments、計(jì)算機(jī)之間交換音樂信息的一種標(biāo)準(zhǔn)協(xié)議。 MIDI是一套指令,指示MIDI設(shè)備做什么,如何做。 MIDI不是聲音信號(hào),而是發(fā)送給Midi 設(shè)備的,產(chǎn)生聲音或執(zhí)行動(dòng)作的指令。 MIDI樂音的產(chǎn)生方法 頻率調(diào)制合成, FM 波形表合成 wave table synthesis,3.頻率調(diào)制FM合成(frequency modulation): 把幾種樂音的波形用數(shù)字表達(dá),存于計(jì)算機(jī)中并通過數(shù)模轉(zhuǎn)換器來生成樂音。專利售給Yamaha公司。樂音由一組參數(shù)控制。 4.波形表合成 把樂器的真實(shí)聲音記錄下來,生成各種音符 在樂器上演奏音符,采樣 存于ROM中 合成。圖2-9,5.MIDI系統(tǒng): MPC:MIDI 接口與聲音模塊組合在卡上。SoundMAX Wavetable synthesizer(MIDI音樂播放器) Windows Media Player 播放 MIDI音樂 制作軟件Midisoft Studio 6,MIDI文件,記錄MIDI信息的標(biāo)準(zhǔn)格式文件稱MIDI文件,其中包含音符、定時(shí)和多達(dá)16個(gè)通道的樂器定義以及鍵號(hào)、通道號(hào)、持續(xù)時(shí)間、音量和擊鍵力度等各個(gè)音符的有關(guān)信息。定義和產(chǎn)生樂曲的MIDI信息和數(shù)據(jù)組存放于MIDI文件中,每個(gè)MIDI文件最多可存放16個(gè)音樂通道的信息。 音序器是一種為MIDI作曲而設(shè)計(jì)的軟件或設(shè)備,可用來記錄、播放及編輯MIDI事件,大多數(shù)音序器可輸入輸出MIDI文件。當(dāng)演奏MIDI文件時(shí),音序器將MIDI信息從文件中取出并送至合成器中。,MIDI作品,MIDI作者可以購買現(xiàn)成的產(chǎn)品,也可以自己制作。當(dāng)然,開發(fā)自己的MIDI作品,除了必須擁有計(jì)算機(jī)方面的知識(shí)與設(shè)備之外,還需要具備專業(yè)音樂知識(shí)和專用工具。,數(shù)字化聲音和MIDI的比較,與MIDI數(shù)據(jù)相比,數(shù)字化的聲音是聲音的實(shí)際表示。它代表了聲音的瞬時(shí)幅度。因?yàn)樗c設(shè)備無關(guān),每次播放時(shí)它都發(fā)出相同的聲音。從這一點(diǎn)看,它的一致性好,但代價(jià)較高,因其數(shù)據(jù)文件要求較大的存儲(chǔ)空間。 MIDI數(shù)據(jù)是與設(shè)備有關(guān)的,即MIDI音樂文件所產(chǎn)生的聲音與用來播放的特定的MIDI設(shè)備有關(guān)。,(3) 在不需要改變音調(diào)或降低音質(zhì)的情況下,可以通過改變其速度來改變MIDI文件的長度。MIDI數(shù)據(jù)是完全可編輯的,我們可以用多種方法來處理它的每一個(gè)細(xì)節(jié),而在處理數(shù)字化聲音時(shí),這些方法卻完全用不上。 (4) 為了創(chuàng)建數(shù)字化聲音所要求的準(zhǔn)備與編程工作,不需要掌握許多音樂理論知識(shí),MIDI則要求比較多。 (5) 在應(yīng)用軟件和系統(tǒng)支持方面數(shù)字化聲音都有更多的選擇,不管對(duì)Macintosh還是Windows平臺(tái)均如此。,MIDI數(shù)據(jù)優(yōu)點(diǎn),(1) 文件緊湊,所占空間小,MIDI文件的大小與回放質(zhì)量完全無關(guān)。通常,MIDI文件比CD質(zhì)量的數(shù)字化聲音文件小200到1000倍,它不占用較多的內(nèi)存、外存空間和CPU資源。 (2) 在某些情況下,如果所
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 古城祭孔活動(dòng)方案
- 古鎮(zhèn)促銷活動(dòng)方案
- 召喚植物活動(dòng)方案
- 臺(tái)燈公司年會(huì)策劃方案
- 葉子配對(duì)活動(dòng)方案
- 吃螃蟹比賽活動(dòng)方案
- 各大軟件元宵節(jié)活動(dòng)方案
- 各種飯店活動(dòng)方案
- 合唱特色活動(dòng)方案
- 吉林大件物流活動(dòng)方案
- 監(jiān)護(hù)人安全培訓(xùn)試卷(答案)
- 小學(xué)綜合實(shí)踐活動(dòng)與勞動(dòng)教育有效整合的策略研究
- 《中國慢性阻塞性肺疾病基層診療與管理指南(2024年)》解讀課件
- 環(huán)保設(shè)備行業(yè)市場分析與銷售技巧課件
- 細(xì)胞器互作機(jī)制-深度研究
- JJF1033-2023計(jì)量標(biāo)準(zhǔn)考核規(guī)范
- 個(gè)人閱兵申請(qǐng)書
- 人工智能導(dǎo)論-第2版-全套課件
- 電大《Python語言基礎(chǔ)》實(shí)驗(yàn)6:文件讀寫基本操作
- 中國廚電用微晶玻璃行業(yè)市場競爭現(xiàn)狀及發(fā)展前景研判報(bào)告
- 2025年上半年中學(xué)校教育工會(huì)工作總結(jié)(2篇)
評(píng)論
0/150
提交評(píng)論