音頻基礎(chǔ)知識課件_第1頁
音頻基礎(chǔ)知識課件_第2頁
音頻基礎(chǔ)知識課件_第3頁
音頻基礎(chǔ)知識課件_第4頁
音頻基礎(chǔ)知識課件_第5頁
已閱讀5頁,還剩15頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

10六月2023多媒體技術(shù)-音頻基礎(chǔ)1本章內(nèi)容音頻的聲學(xué)基礎(chǔ)聲音的數(shù)字化聲音的存儲格式MIDI音樂語音信號、非語音信號10六月2023多媒體技術(shù)-音頻基礎(chǔ)2音頻媒體音頻(audio)或聲音(sound)攜帶信息的極其重要的媒體多媒體技術(shù)研究中的一個重要內(nèi)容與視覺媒體相比具有特殊性不同場合下的重要性不同Passiveviewing(e.g.film,video,etc.)Videoconferencing10六月2023多媒體技術(shù)-音頻基礎(chǔ)3聲音的概念聲音是一種機(jī)械振動狀態(tài)的傳播現(xiàn)象,它表現(xiàn)為一種機(jī)械被即聲波。產(chǎn)生聲波的條件有作機(jī)械振動的物體:聲源有能傳播機(jī)械振功的彈性介質(zhì)聲波在介質(zhì)中傳播有一定速度,稱之為聲波的傳播速度(聲速)10六月2023多媒體技術(shù)-音頻基礎(chǔ)4聲波示意(L.A.Rowe)壓縮稀薄時間幅度正弦波10六月2023多媒體技術(shù)-音頻基礎(chǔ)5聲波頻率聲壓變化可以是周期性的和非周期性頻率概念循環(huán)(cycle)-壓縮/稀薄過程頻率(frequency):每秒cycle數(shù),單位hertz(Hz)周期

cycle的持續(xù)時間(1/frequency)聲音信號一般由許多頻率不同的信號組成,稱為復(fù)合信號;而單一頻率的信號稱為分量信號10六月2023多媒體技術(shù)-音頻基礎(chǔ)6頻率范圍頻率小于20Hz一般稱為次聲波(subsonic)人的聽覺器官能感知的聲音頻率范圍約為20Hz~20kHz的信號稱為音頻(Audio)信號人發(fā)音器官發(fā)聲頻率約是80~3400Hz,但人說話的信號頻率約為300~3000Hz,即話音(speech)信號高于20kHz的信號稱為超聲波(ultrasonic)超聲波及次聲波一般不能引起人聽覺器官的感覺,但可借助一些儀器設(shè)備進(jìn)行觀察和測量10六月2023多媒體技術(shù)-音頻基礎(chǔ)7樂音與噪音一般樂音指具有確定的基頻以及與該基頻有較小整數(shù)倍關(guān)系的各階諧頻(harmonictone)頻率比基音高的所有分音統(tǒng)稱泛音(overtone),泛音的頻率不必與基音成整數(shù)倍關(guān)系在主觀上把令人不愉快或不需要的聲音定義為噪音噪音的頻譜較為復(fù)雜,具有無規(guī)則的振幅和波形的連續(xù)頻譜10六月2023多媒體技術(shù)-音頻基礎(chǔ)8聲音要素(一)響度(音響)loudness到達(dá)人耳的聲擾動振幅所產(chǎn)生的聽覺的大小聲振動能量是物理特性,可用聲強(qiáng)(soundpressure)定義,單位:帕斯卡(Pa)實(shí)用上通常都以對數(shù)方式的聲壓級(soundpressurelevel)表示,單位:分貝(db)響度是主觀量,不能用任何儀器正確地測量聲音響度使用了以兩個聲強(qiáng)之比的對數(shù)為基礎(chǔ)的相對標(biāo)度,單位:宋(sone)10六月2023多媒體技術(shù)-音頻基礎(chǔ)9聲音要素(二)音調(diào)(音高)pitch或tone人對聲音刺激頻率的主觀判斷與估量,稱之為音調(diào)(Pitch),單位:美(Mel)Frequency是物理量,而音調(diào)是人的感覺聽覺經(jīng)驗(yàn)一般女生的聲音比男生高較大物體振動的音調(diào)較低10六月2023多媒體技術(shù)-音頻基礎(chǔ)10聲音要素(三)音色(音質(zhì))timber由其頻譜決定不同樂器發(fā)出同一音高的樂音,仍然可以分辨可以把音色描述為音的瞬時橫截面,即用諧音(泛音)的數(shù)目、強(qiáng)度、分布和相位來描述。泛音的強(qiáng)度可使音色發(fā)生變化,音色的主觀特性比響度或音調(diào)的主觀特性復(fù)雜得多。10六月2023多媒體技術(shù)-音頻基礎(chǔ)11模擬信號與數(shù)字信號在時間和幅度上連續(xù)的信號為模擬(analog)信號。巴時間和幅度都用離散的數(shù)字表示的信號就稱為數(shù)字(digital)信號采樣(sampling)-時間量化(quantization)-幅度數(shù)字化實(shí)際上就是采樣和量化10六月2023多媒體技術(shù)-音頻基礎(chǔ)12聲音的采樣和量化兩個關(guān)鍵參數(shù):采樣頻率與量化精度10六月2023多媒體技術(shù)-音頻基礎(chǔ)13采樣頻率每秒鐘需要采集多少個聲音樣本根據(jù)奈奎斯特理論(Nyquisttheory)和聲音信號本身的最高頻率決定的fs>=2f或者Ts<=T/2如果一個信號中的最高頻率為fmax,采樣頻率最低要選擇2fmax10六月2023多媒體技術(shù)-音頻基礎(chǔ)14量化精度反映度量聲音波形幅度的精度,一般用每個聲音樣本的位數(shù)(bitpersample,bps)表示常見的量化精度有:8與16聲音的質(zhì)量越高,需要的存儲空間越多10六月2023多媒體技術(shù)-音頻基礎(chǔ)15聲音質(zhì)量等級質(zhì)量采樣頻率

(kHz)樣本精度

(bit/s)單道聲/立體聲數(shù)據(jù)率(未壓縮)

(kb/s)頻率范圍電話88單道聲64200~3400HzAM11.0258單道聲88.220~15000HzFM22.05016立體聲705.650~7000HzCD44.116立體聲1411.220~20000HzDAT4816立體聲1536.020~20000Hz10六月2023多媒體技術(shù)-音頻基礎(chǔ)16聲音質(zhì)量的度量聲音質(zhì)量的評價目前仍然是一個很困難的問題,需要繼續(xù)研究聲音質(zhì)量的度量有兩種基本的方法客觀質(zhì)量度量:主要用信噪比(signaltonioseratio,SNR)主觀質(zhì)量度量:主觀平均判分法對于圖象等其它媒體數(shù)據(jù)的處理同樣存在兩種質(zhì)量度量主客觀結(jié)合?10六月2023多媒體技術(shù)-音頻基礎(chǔ)17存儲格式(一)用.wav為擴(kuò)展名的文件格式稱為波形文件格式(WAVEFileFormat)RIFF:ResourceInterchangeFileFormatIBM和微軟公司于1991年8月聯(lián)合開發(fā)支持存儲各種采樣頻率和樣本精度的聲音數(shù)據(jù),并支持一定的聲音數(shù)據(jù)的壓縮主要用于PC類似格式au(SUN),aiff(Apple),snd(SGI)/_articles/AudioFormatIntro.ht

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論