音頻基礎知識_第1頁
音頻基礎知識_第2頁
音頻基礎知識_第3頁
音頻基礎知識_第4頁
音頻基礎知識_第5頁
已閱讀5頁,還剩71頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、音頻編輯第1章 音頻基礎知識第1章 音頻基礎知識11.1 聲音21.1.1 聲波21. 聲音與聲波22. 聲音三要素71.1.2 頻率范圍71. 聽覺、人聲與話音82. 十二平均律與音分83. 標準音高94. 器樂和聲樂101.1.3 音量111*. 聲壓與聲壓級112*. 聲功率與聲功率級123*. 聲強與聲強級134. 比較135. 噪聲141.1.4 聽覺系統(tǒng)的感知特性151*. 人耳的構造與聲音的感知152*. 對音強的感知173. 對音高的感知194. 對音色的感知215*. 掩蔽效應236. 雙耳效應267. 其他人耳效應281.1.5 立體聲301 時間差式立體聲312 聲級差式

2、立體聲313 仿真頭式立體聲321.1.6 聲道331.2 音頻信號的數(shù)字化361.2.1 模擬信號與數(shù)字信號361. 模擬音頻和數(shù)字音頻362. 數(shù)字音頻的優(yōu)勢371.2.2 音頻信號的數(shù)字化371. 采樣頻率382. 位深度403. 動態(tài)范圍、信噪比以及動態(tài)余量414. 音頻文件421.2.3 聲音質(zhì)量421.3 音頻編碼與格式441.3.1 語音編碼441. 簡介442. 波形編譯碼453. 音源編譯碼464. 混合編譯碼461.3.2 寬帶音頻編碼471. pcm 編碼482. 有損和無損編碼481.3.3 wav文件及格式491. wav,無損的音樂492. wav的格式491.3.

3、4 常見格式511.3.5 文件擴展名541.3.6 光盤與磁帶541.4 midi621.4.1 midi簡介621.4.2 midi簡史621.4.3 音樂生成方法631. 調(diào)頻合成聲音632. 波表合成聲音651.4.4 midi系統(tǒng)661. midi消息與數(shù)據(jù)流、midi控制器與音序器662. midi系統(tǒng)673. pc機midi系統(tǒng)684. 通用midi(gm)691.5 聲卡701.5.1 聲卡的功能701.5.2 聲卡的分類701.5.3 聲卡的結構與功能70附錄1 超聲波與次聲波721 超聲波722 次聲波72第1章目錄 2021年5月11日星期二 8:45:00 下午此文檔打

4、開 第3頁音頻編輯第1章 音頻基礎知識音是一種物理現(xiàn)象。物體振動時產(chǎn)生音波,通過空氣傳到人們的耳膜,經(jīng)過大腦的反射被感知為聲音。音頻(audio)指人能聽到的聲音,包括語音、音樂和其它聲音,如環(huán)境聲、音效聲、自然聲等。根據(jù)物體振動狀態(tài)的規(guī)則與不規(guī)則,音被分為樂音與噪音兩類。樂音是由規(guī)則的振動產(chǎn)生的,只包含有限的某些特定頻率,具有確定的波形。噪音是由不規(guī)則的振動產(chǎn)生的,它包含有一定范圍內(nèi)的各種音頻的聲振動,沒有確定的波形。音樂中使用的主要是樂音,但噪音在是音樂表現(xiàn)中必不可少。如架子鼓發(fā)出的聲響就是一種噪音,不過,這種噪音有一定的規(guī)律。音的物理屬性,是指由于發(fā)聲體材料、振動方式、傳播方式的不同,所

5、造成的音的高低、長短、強弱、音色這四個基本屬性。音的高低是由于物體在一定時間內(nèi)的振動次數(shù)(頻率)而決定的。振動次數(shù)多,音則高;振動次數(shù)少,音則低。音的長短是由于音的延續(xù)時間的不同而決定的。音的延續(xù)時間長,音則長;音的延續(xù)時間短,音則短。音的強弱是由于振幅(音的振動的幅度)的大小決定的。振幅大,音則強;振幅小,音則弱。音色,即聲音的特色,是由發(fā)聲體的材料、結構以及泛音的多少決定的。音的以上四種性質(zhì),在音樂表現(xiàn)中都是非常重要的,但音的高低和長短則更有意義。音頻信號是帶有語音、音樂和音效的有規(guī)律的聲波頻率、幅度變化的信息載體。本章介紹聲音的物理屬性、音頻信號的數(shù)字化、數(shù)字音頻的編碼與存儲格式、mid

6、i等。1.1 聲音聲音是一種縱向壓力波,主要用振幅和頻率來刻畫,具有響度、音調(diào)和音色等特征。人的聽覺和發(fā)聲都有一定的頻率范圍。人的聽覺能夠聽到的聲音頻率范圍是20hz20khz。本節(jié)介紹聲音的物理屬性和感知特性,以及各種聲音的頻率范圍。1.1.1 聲波聲音是一種縱向壓力波,其客觀物理屬性主要有振幅和頻率,而其主觀感知特性則有響度、音高和音色等,對于音樂還有風格、節(jié)奏、旋律等特征。1. 聲音與聲波聲音(sound)是一種由機械振動引起,可在物理介質(zhì)(氣體、液體或固體)中傳播的縱向壓力波(縱波或疏密波)。稱振動發(fā)聲的物體為聲源。聲波(sound wave)指在物理介質(zhì)中傳播的聲音。聲音在真空中不能

7、傳播。聲音在空氣中傳播的速度幾乎不受氣壓大小的影響,但是受氣溫的影響很大。在氣溫為tc時的聲速:c=331.5*(1+t/273)1/2331.5+0.6 t (m/s)例如在室溫(15c)下,聲速c340m/s。聲音隨著空氣中的振動開始,如吉他弦,聲帶等。這些振動把附近的空氣分子推在一起,輕微地提高空氣的壓力。壓力下的空氣分子,則推動它們周圍的空氣分子,那些再推動下一組分子,等等。由于高壓區(qū)通過空氣移動,它們把低壓區(qū)留在后面。當這些壓力變化的波到達我們身邊時,它們震動我們耳中的受體,我們就聽到聲音的振動。當你看到一個可視的聲波,它反映了這些空氣壓力波。波形中的零線是靜止的空氣壓力。當這條線搖

8、擺至一個高峰,它表示更高的壓力;當這條線降到低谷,它表示低的壓力。圖1.1 一種表現(xiàn)為可視波形的聲波a. 零線 b. 低壓區(qū) c. 高壓區(qū)a 波形測量多次測量可以描述波形。振幅 amplitude:聲波的振幅(a),定義為振動過程中振動的物質(zhì)偏離平衡位置的最大絕對值。振幅反映了壓力從波形峰值到谷底的變化。高振幅的波形是響亮的,低振幅的波形是安靜的。周期 cycle:聲波的周期,定義為聲波完成一次振動的時間。周期描述了一個單一,重復的壓力變化的序列,從零壓,到高壓,到低壓,再回歸零。頻率 frequency:聲波的頻率(f),定義為單位時間內(nèi)振動的次數(shù),單位為赫茲hz(每秒振動的次數(shù))。人耳能聽

9、到的聲音的頻率范圍為20hz20khz。頻率描述了每秒的周期數(shù)。(例如,一個1000hz的波形每秒有1000個周期。)頻率越高,樂器的音調(diào)越高。相位 phase:周期波形特定時刻的位置。一種它是否在波峰、波谷或它們之間的某點的標度。是描述訊號波形變化的度量,通常以度(角度)作為單位,也稱作相角。當波形以周期的方式變化時,相位以360度測量,表明了在一個周期中波形的位置。零度是起點,然后90在高壓,180在中途點, 270在低壓,并且360在終點。波長 wavelength:聲音的波長,定義為聲音每振動一次所走過的距離。波長以如英寸或厘米做單位,是相位中相同度數(shù)的兩點之間的距離。隨著頻率的增加,

10、波長減小。圖1.2 一個單周期在左邊,一個完整的20赫茲波形在右邊a. 波長 b. 相位 c. 振幅 d. 一秒聲音頻率的高低,與聲源物體的共振頻率有關。一般情況下,發(fā)聲的物體(如樂器)越粗大松軟,則所發(fā)聲音的頻率就越低;反之,物體越細小緊硬,則所發(fā)聲音的頻率就越高。例如大編鐘發(fā)出的聲音比小編鐘的頻率低、大提琴的聲音比小提琴的低;同是一把提琴,粗弦發(fā)出的聲音比細弦的低;同是一根弦,放松時的聲音比繃緊時的低。振幅表示了聲音的大小,也體現(xiàn)了聲波能量的大小。同一發(fā)聲物體(如樂器),敲打、彈撥、拉擦它所使得勁越大,則所產(chǎn)生振動的能量就越大、發(fā)出聲音的音量就越大、對應聲波的振幅也就越大。聲音的強弱體現(xiàn)在

11、聲波壓力的大小(振動的幅度)上,音調(diào)的高低體現(xiàn)在聲波的頻率上。也可以用波長代替頻率來刻畫聲音的物理特性。聲波的波長與頻率的關系為:=c/f其中c為聲速。表1.1是一些頻率的聲波所對應的波長。表1.1 聲音的頻率與波長(c=340m/s)f20hz 50hz 100hz 250hz 500hz 1khz 2khz 5khz 10khz 15khz 20khz17m 6.8m 3.4m 1.36m 68cm 34cm 17cm 6.8cm 3.4cm 2.3cm 1.7cmb 聲波相互作用當兩個或兩個以上的聲波相遇,它們互加或者互減。如果它們的波峰和波谷在相位上是完全吻合,則它們相互增強,產(chǎn)生一個

12、具有比任一單個波形有較高振幅的波形。圖1.3 同相波相互增強如果兩個波形的波峰和波谷在相位上是完全相反的,則它們相互抵消,導致完全沒有波形。圖1.4 異相波相互抵消但是在大多數(shù)情況下,波在變化量中是異相的,從而產(chǎn)生比任一單個波形更復合的組合波形。一個表示音樂,語音,噪聲和其它聲音的復合波形,例如,結合了每個聲音的波形在一起。由于其獨特的物理結構,一個單一樂器可以產(chǎn)生非常復雜的波。這就是為什么一個小提琴和一個小號聽起來不同,即使在演奏同一曲調(diào)時。圖1.5 兩個簡單的波組合產(chǎn)生一個復合波c 純音與復合音現(xiàn)實世界中有各種各樣的聲音。在可聽聲里,又分為樂音和噪聲。凡是其振動波形是周期性、在頻譜上是分列

13、、聽起來有一定音調(diào)的,就叫作樂音。反之,凡是其振動的波形不呈周期性,在頻譜上是連續(xù)的,聽起來沒有一定音調(diào)的,則叫作噪聲。每一個樂音,即周期性的振動都可以分解為許多不同頻率、不同相位、不同振幅的簡諧振動的疊加,這叫作fourier分析。簡單的簡諧振動(即正弦振動或余弦振動)產(chǎn)生的聲波,被稱為純音(pure tone)。純音具有單一的頻率。實際的樂音如歌唱聲、樂器聲等都不是簡單的純音。許多簡諧振動的疊加,被稱為復合音(complex tone)。復合音是由物體振動時引起不同部位的振動而產(chǎn)生的。如一根琴弦,當它在振動時,就同時包含了琴弦的不同部位的振動。首先是整條弦的振動,然后還有二分之一、三分之一

14、、四分之一等琴弦不同部位的振動。這些部分振動就產(chǎn)生了不同音高的音,這些音又是同時發(fā)響,于是就混合在一起,形成了復合音。由發(fā)聲體整體振動而產(chǎn)生的音叫做基音(fundamental tone),也就是最易聽見的聲音。由發(fā)聲體各部分振動而產(chǎn)生的音叫做諧音(harmonic tone),也叫泛音(overtone)?;襞c泛音,統(tǒng)稱為分音。把分音按照音的高低從低到高排列起來,就叫做分音列。從基音開始,分別叫做一分音、二分音、三分音等等。把分音列去掉基音,就叫做泛音列,二分音就是第一泛音、三分音就是第二泛音等等。d 基頻與諧頻疊加的簡諧振動中頻率最低的(通常具有最大振幅),稱為基頻(fundamenta

15、l frequency);頻率是基頻的整數(shù)倍的,稱為諧頻(harmonic frequency)。頻率不是基頻整數(shù)倍的高頻振動,稱為分音。基頻、諧頻、分音組成了實際的樂音。基頻的能量往往是最大的,但也不是絕對的。圖1.6 和諧復合音的基頻與諧頻 f0為基頻 fi = i * f 為諧頻我們所聽到的音樂中,除了樂音以外,還包括一些在物理上是噪聲的聲音。如鑼、鼓、沙錘、木魚、梆子等沒有固定音調(diào)的打擊樂器,海濤、流水、風聲等效果聲等,這也是音樂聲的一部分。人們在日常生活中所接觸到的聲音為復合音,其中的基音與諧音成分是聲音的客觀特性。人耳對復合音中各種諧音成分總和起來的主觀印象即為音色。基音為100h

16、z的鋼琴聲與基音100hz的黑管聲音的基音頻率相同,經(jīng)分析,鋼琴聲除100hz振幅最大的基音外,還有15個振幅不同的諧音。同樣,黑管聲有9個諧音。因此人們可以區(qū)別同一頻率鋼琴聲與黑管聲?;纛l率決定聲音的高低(音調(diào)),諧音的頻率與振幅決定了特定的音色(音品)。2. 聲音三要素除了上面所介紹的振幅和頻率這兩個物理屬性外,聲音還有若干感知特性,它們是人對聲音的主觀反應。聲音的感知特性主要有音調(diào)、響度(音強)和音色,稱之為聲音的三要素:音調(diào)人耳對聲音高低的感覺稱為音調(diào)(tone)。音調(diào)主要與聲音的頻率有關,但不是簡單的線性關系,而是成對數(shù)關系。除了頻率外,影響音調(diào)的因素還有聲音的聲壓級和聲音的持續(xù)時

17、間。音調(diào)的單位為美(mel)。響度聲音的響度(loudness),也叫音強,就是對聲音強弱的主觀感知。聲音的大小在客觀上一般用聲級(sound level)表示,其單位為db(decibel 分貝),無量綱。人能感知的聲音大小的范圍一般為0120db。主觀感覺的聲音強弱則使用響度“宋(sone)”或響度級“方(phon)”來度量。音強與聲波的振幅成正比,振幅越大,音強越大。音色音色(timbre)是聲音的特色,是人們區(qū)別具有相同的響度和音調(diào)的兩個不同聲音的主觀感覺,也稱為音品。音色主要是由復合音中不同的諧音組成所決定的,影響音色的因素還有聲音的時間過程。每個人講話都有自己的音色;每種樂器都有各

18、自的音色,即使它們演奏相同的曲調(diào),人們還是能將其區(qū)分開來。人們區(qū)分音色的能力是天生的。1.1.2 頻率范圍下面依次介紹聽覺、人聲與話音,十二平均律與音分,器樂和聲樂等的頻率范圍。1. 聽覺、人聲與話音人耳能感受到(聽覺hearing/auditory sensation)的頻率范圍約為 20hz20khz,稱此頻率范圍內(nèi)的聲音為可聽聲(audible sound)或音頻(audio)。頻率20khz的聲音為超聲(ultrasound)。表1.2 聲音的頻率范圍20khz次聲可聽聲(音頻)超聲音頻的帶寬約20khz,其范圍內(nèi)的頻率相差達一千倍。人耳相當于一種對數(shù)頻譜分析儀,可以很好地感知不同頻率

19、的聲音。人的發(fā)音器官發(fā)出的聲音(人聲)的頻率大約是80hz3400hz。人說話的聲音(話音voice/語音speech)的頻率通常為300hz3000 hz(帶寬約3khz)。可見,與近2萬赫茲的寬帶(broadband)聽覺相比,只有不到3千赫茲的語音是一種窄帶(narrowband)的聲音。寬帶和窄帶的聲音,在編碼上有很大的不同。2. 十二平均律與音分十二平均律,完整的說法應該是“八度的十二平均律”。計算頻率時,只要對2開12次方根,就可以確定兩個半音頻率的比值了。十二平均律是由明朝律學家朱載堉提出的。十二平均律將八度間(基頻與其倍頻之間),按頻率分成十二個音階,以2的1/12次方根(1.

20、059463094)為音階間格,組成一組十二個數(shù)的等比序列。就相當于,在相對頻率1和2中間插入11個數(shù),使得所得數(shù)組為等比數(shù)列,就得到12平均律了。12平均律中,高音與相鄰低音的比值都是1.05946,都是標準的半音關系。鋼琴是十二平均律的典型樂器,巴赫就以十二平均律編寫了十二種調(diào)性的樂曲。音分 cent,為提高測量聲音高低的準確度,計量上將每個半音音程分為100音分,以利計算其誤差率。現(xiàn)在對鋼琴等樂器調(diào)音,常用電子音準儀,輸入一個音,可從儀器指針看出音高是否準或誤差多少音分。相差幾音分,人耳也能察覺,但說不出具體相差多少音分。十二平均律半音的音程距離相差2的1/12次方倍,即1.059463

21、0941倍。將半音音程的距離再分成100個單位,即100音分。那么每1音分之間的距離相差每半音音程開100次方,即1.0594630941開100次方,得數(shù)是1.00057779。舉例來說,中央c的頻率是261.626hz,那么c#的頻率是261.626hz1.0594630941=277.183hz。中央c與c#之間分為100音分,第n音分(n=100)就是261.626hz1.00057779n。例如比中央c高10音分的頻率是,261.6261.0005777910=263.142hz??梢钥闯觯恳灰舴种g的頻率絕對差值是不同的,但它們的倍數(shù)是相同的,都是相差1.00057779倍。樂理

22、的音高采用12平均律,將8度(二倍倍頻)音,按2的1/12次方,分為12份,每份相當于一個半音(100音分)。參見表1.3。表1.3 12平均律音名cdefgabc簡譜1234567i唱名doremifasollasido音程全音全音半音全音全音全音半音音分2002001002002002001003. 標準音高standard pitch,為解決合唱、合奏的定音、作曲的定調(diào)和樂器制造的音高校正等而制訂的統(tǒng)一音高標準。現(xiàn)行的國際標準音高為1939年5月國際標準協(xié)會在倫敦通過的a1440赫茲,亦稱“第一國際音高”或“音樂會音高”。在古典主義時期里,a1的音高約在 415429赫茲之間,稱為古典音

23、高。浪漫主義時期,樂器制造隨著科學的發(fā)展、工藝的改進以及人們崇尚明快嘹亮的音色等原因,a1高達455赫茲左右。1834年,德國斯圖加特物理學家會議定 a1440赫茲。米蘭拉斯卡拉歌劇院在1856年左右的音高標準為a1451赫茲;倫敦愛樂協(xié)會的音高標準曾一度到達a1452赫茲;1880年,歐美最負盛名的斯坦韋鋼琴以a1457赫茲定音。西歐的音高標準自19世紀晚期趨向統(tǒng)一,法國在1859年以a1435赫茲定為法定標準來實施,1885年維也納國際會議把它定為“國際音高”。1939年倫敦會議決定恢復斯圖加特會議結果。今稱a1440赫茲為“第一國際音高”,稱a1435赫茲為“第二國際音高”。以a1440

24、赫茲的音高標準,可用多種方法取得,如音叉、定音笛、旋轉(zhuǎn)圓盤等,現(xiàn)今最精確的是用銫-133原子振蕩裝置來定音。4. 器樂和聲樂傳統(tǒng)樂器的發(fā)聲范圍為16hz(c2)7khz(a5),如鋼琴的為27.5hz(a2)4186hz(c5)。可把音高分為若干組,低音用大寫字母,高音用小寫字母,更低/高的音在大/小寫字母后用數(shù)字下/上標表示其級別。如標準音:a1=440hz,中央c:c1=261.6255653hz。8度音的頻率差一倍,如a2=2a1=2440hz=880hz,c1=2c2=216.35hz=32.70hz。參見表1.4。表1.4 音高的分組與頻率分組大字2組大字1組大字組小字組小字1組小字

25、2組小字3組小字4組小字5組音名c2b2c1 b1cbcbc1 b1c2 b2c3 b3c4 b4c5 a5頻率hz16.3530.632.7061.7365.4123.5130.8246.9261.6493.9523.3987.81046.51975.520933951.141867040例如,鍵盤樂器(如鋼琴、風琴、電子琴等)的鍵盤由多組按鍵組成,每組有7白和5黑共12個按鍵組成,對應于一個八度音的12平均律。其中7個白鍵分別依次對應于音名:c、d、e、f、g、a、b,5個黑鍵分別依次對應于音名:#c(bd)、#d(be)、#f(bg)、#g(ba)、#a(bb),其中字母左上角的符號#和

26、b分別表示升/降半音。圖1.7 琴鍵與12平均律聲樂指人唱歌,可以按照男、女、童和高、中、低等來進行分類(參見表1.5)。聲樂的頻率范圍為87hz(男低音)1318hz(花腔女高音)。一般歌手的音域都有兩個8度左右的寬度,但是有少數(shù)通俗唱法歌手的音域只有8度寬。1.5 聲樂中不同聲部的音高與頻率范圍人聲部音域頻率范圍(hz)音寬(度)女聲花腔女高音c1 e3261.6 1318.517女高音c1 c3261.6 1046.515女中音a a2220 88015女低音f f 2174.6 69815男聲男高音c c2130.8 523.215男中音a a1110 44015男低音f f 387.

27、3 349.215童聲童高音c1 g2261.6 783.912童低音a e2220 659.2121.1.3 音量音量(sound volume)即聲音的強弱,可以用聲壓(級)、聲強(級)和聲功率(級)來度量。1*. 聲壓與聲壓級聲音是一種在空氣中傳播的縱向壓力波(疏密波),聲音的強弱體現(xiàn)在聲波壓力的大小上。沒有聲波的空氣中的壓強為大氣壓,一個標準大氣壓等于1.013*105pa。在有聲波傳輸時,空氣的疏密發(fā)生變化,壓強在原來大氣壓的上下波動,稱這種由聲波引起的壓強變化為聲壓(sound pressure/acoustic pressure),用符號p表示,即:聲壓p=空氣壓強-大氣壓壓強的

28、單位為pa(帕)(pascal 帕斯卡的簡稱)或bar(微巴),有時也用n/m2(牛頓/平方米):1pa=1n/m2,1bar=0.1pa瞬時聲壓可正可負,聲壓的平均值一般為零。通常所說的聲壓是指聲壓的有效值,即一段時間內(nèi)的瞬時聲壓的均方根值,總是正的。對于正弦波,有效聲壓 。人耳對1khz頻率聲音之聽閾的聲壓約為2*10-5pa,痛閾的聲壓約為20pa,正常說話時的聲壓約為0.020.03pa,是標準大氣壓的千萬分之二、三。由于人耳對聲壓的感知范圍大(相差約一百萬倍),而且人的聽覺與聲壓不是線性關系,而是近似于對數(shù)關系。所以常按對數(shù)式分級(level)辦法來表示聲音的大小,這就是聲壓級(so

29、und pressure level)lp、聲強級和聲功率級等。聲壓級lp定義為有效聲壓p與參考聲壓pref的比值取常用對數(shù)后再乘以20:其中,參考聲壓pref取為1khz的聽閾聲壓(2*10-5pa),聲壓級的值無量綱,單位為db(decibel 分貝)。于是,1khz頻率聲音的聽閾之聲壓級=20*lg1=0db,痛閾之聲壓級=20*lg106=120db。聲壓變化10倍,聲壓級才變化20db。2*. 聲功率與聲功率級聲波是能量傳輸?shù)囊环N形式,因此也常用能量的大小來表示聲音的強弱。聲源在單位時間內(nèi)向外輸出的聲能量叫做聲功率(acoustic power/sound power),用符號w表示

30、,單位為w(瓦)。與聲壓一樣,聲功率的變化范圍也很大(如1khz的聽閾聲功率為10-12w、痛閾的聲功率為1w、噴氣飛機的聲功率為100w),聽覺也與其成對數(shù)關系。所以,也可以定義聲功率級(sound power level)其中,參考聲功率wref取為1khz的聽閾聲功率10-12pa,聲功率級的值也無量綱,單位也為db。注意,由于聲功率與聲壓的平方成正比,所以聲功率級是聲壓級的兩倍,為了便于同級比較,這里將聲壓級公式中的20改為了現(xiàn)在聲功率級公式中的10。聲功率變化10倍,聲功率級變化10db。3*. 聲強與聲強級聲音的強弱也可以用聲強來度量。聲場中某點的聲強(acoustic inten

31、sity/sound intensity),是指在單位時間內(nèi),聲波通過垂直于聲波傳播方向單位面積的聲能量(聲功率w),用符號i表示,單位為w/m2(瓦/平方米):其中,s為聲能量通過的面積。在無反射聲波的自由聲場中,點聲源發(fā)出的球面波的聲強為??梢娗蛎娌ǖ穆晱奿與點聲源的聲功率w成正比,與距離(半徑)r的平方成反比,稱之為平方反比定律。由于在實際工作中,指定方向的聲強難以測量,一般是先測出聲壓p,然后按公式計算聲強和聲功率。其中,為媒質(zhì)密度、c為聲速、c為媒質(zhì)的特性阻抗。20時的標準大氣壓下的空氣對聲波的特性阻抗為c=415ns/m2。似聲功率級,可以定義聲強級(sound intensity

32、 level)li如下:其中,參考聲強iref取為1khz的聽閾聲強10-12w/m2,聲強級的值也無量綱,單位也為db。聲強變化10倍,聲強級變化10db。根據(jù)該平方反比定律,在自由聲場中,接收點與聲源的距離增加一倍,則聲壓級下降6db。由此可以進行聲場估算,由聲功率級計算聲壓級。4. 比較由于聲壓級、聲強級和聲功率級的值是一致的,所以它們可以統(tǒng)稱為聲級(soundlevel),參加表1.6。表1.6 聲壓、聲強、聲功率與聲壓級、聲強級、聲功率級聲壓(pa)聲強(w/m2)聲功率(w)聲級(db)環(huán)境2*102102102140飛機發(fā)動機(3m)2*10111120痛閾2*10010-210

33、-2100織布機房2*10-110-410-480汽車汽喇叭2*10-210-610-660交談(1m)2*10-310-810-840安靜室內(nèi)2*10-410-1010-1020輕聲耳語2*10-510-1210-120聽閾人耳的聽覺的動態(tài)范圍很寬廣,約為0140db。一般正常年輕人在中頻附近的聽閾約為0db,人耳能忍受的強噪聲(noise)極限約為125db。注:聽閾對于人耳能感受的振動頻率,有一個剛好能引起聽覺的最小振動強度,稱為聽閾。聲壓變化10倍,聲壓級變化20db。聲強和聲功率變化10倍,聲強級和聲功率級變化10db。對于50hz10khz的純音,在聲壓級超過聽閾50db時,人耳大

34、約可以鑒別1db的聲壓變化。在聲壓級超過聽閾40db時,頻率低于1khz時,人耳大約可以察覺3hz的頻率變化。5. 噪聲稱紊亂斷續(xù)或統(tǒng)計上隨機的聲音為噪聲,例如交通噪聲和工業(yè)噪聲。噪聲的大小也用它的聲壓級db數(shù)來表示,例如重型卡車的噪聲約為88db、轎車的噪聲約為60db、火車車廂的噪聲約為70db、噴氣飛機附近的噪聲約為140db,紡織工業(yè)的噪聲約為80110db、鋼鐵工業(yè)的噪聲約為80130db。強噪聲會使人聽覺遲鈍(聽閾上移),嚴重時會造成耳聾。我國于1993年公布了城市區(qū)域環(huán)境噪聲標準gb 3096-93(參見表1.7),要求夜間突發(fā)的噪聲,其最大值不準超過標準值15db。表1.7 城

35、市區(qū)域環(huán)境噪聲標準(等效聲級laeq: db)類別晝間夜間適用區(qū)域說明050db40db療養(yǎng)區(qū)、高級別墅區(qū)、高級賓館區(qū)等特別需要安靜的區(qū)域位于城郊和鄉(xiāng)村的這一類區(qū)域分別按嚴于0類標準5db執(zhí)行155db45db以居住、文教機關為主的區(qū)域鄉(xiāng)村居住環(huán)境可參照執(zhí)行該類標準260db50db居住、商業(yè)、工業(yè)混雜區(qū)365db55db工業(yè)區(qū)470db55db城市中的道路交能干線道路兩側區(qū)域,穿越城區(qū)的內(nèi)河航道兩側區(qū)域穿越城區(qū)的鐵路主、次干線兩側區(qū)域的背景噪聲(指不通過列車時的噪聲水平)限值也行該類標準1.1.4 聽覺系統(tǒng)的感知特性科學工作者一直在研究聽覺系統(tǒng)(auditory system)對聲音的感知特

36、性,部分特性已經(jīng)被用于音頻信號的數(shù)據(jù)壓縮(如mp3所使用的音感子帶編碼)。下面介紹人耳的構造與聲音的感知,討論三個主要的聲音感知特性:響度、音高和音色,以及掩蔽等人耳效應。1*. 人耳的構造與聲音的感知人耳分為外耳、中耳和內(nèi)耳三個部分(參見圖1.8)。外耳由耳廓和耳道構成;鼓膜處在外耳和中耳之間;中耳包含三根聽骨及通向咽腔的耳咽管;內(nèi)耳則包括耳蝸、前庭、三半規(guī)管和聽神經(jīng)等部分。圖1.8 人耳的構造外耳的形狀如銅號。其中,耳廓有復雜的蝸旋構造,用于區(qū)分前后和上下的聲源位置;耳道長約2.3cm,形狀不規(guī)則,是一個諧振腔。外耳的諧振帶為2k5khz。鼓膜位于耳道的終端,處在外耳與中耳之間,面積約69

37、mm2。鼓膜在聲音的作用下,可以自由振動,對聲音的傳導有重要的作用。中耳是容積為12cm3的空腔,包含三根相互連接形成杠桿的聽骨:錘骨上連鼓膜,鐙骨下連內(nèi)耳開口處的卵圓窗,二者之間為跕骨。中耳內(nèi)還有通向咽腔的耳咽管。中耳有如下三重作用:平衡中耳與外耳的氣壓,保證鼓膜的正常振動;對強聲起反射作用,減少傳入內(nèi)耳的聲強,起保護作用;使聲能有效地從外耳傳到內(nèi)耳,起阻抗匹配作用(因為聲波在外耳是在空氣中傳播,而在內(nèi)耳則是在淋巴液中傳播。兩種不同介質(zhì)對聲音的阻抗是不同的,淋巴液的阻抗是空氣的3750倍。如果直接傳播,則會只有1/1000的能量傳入內(nèi)耳)。內(nèi)耳包含耳蝸、前庭、三半規(guī)管和聽神經(jīng)等部分。內(nèi)耳中的

38、前庭器和半規(guī)管內(nèi),主要含平衡覺感受器,與聽覺無關。耳蝸(cochlea)是一種充滿液體的卷曲結構,大小如一顆豆子。管長35mm,卷繞兩圈半,成蝸殼狀。耳蝸內(nèi)部被兩個膜(前庭膜和基膜)分隔,中間形成的一個楔形剖面部分,稱為蝸管(參見圖1.9)。圖1.9 耳蝸的剖面蝸管內(nèi)部的復雜結構稱為柯蒂器(organ of corti),是外周聽覺系統(tǒng)的核心部分。在柯蒂器中呈三角形的柯蒂隧道兩側,成行地分布著聽覺感受器毛細胞。毛細胞被分成內(nèi)毛細胞和外面細胞兩類,內(nèi)毛細胞有3千5百個,它們組成一排,沿基膜排列;外毛細胞有1萬2千個,它們組成3排,也沿基膜排列。90%以上的聽覺神經(jīng)纖維與內(nèi)毛細胞相連,一個內(nèi)毛細胞

39、可以興奮20根神經(jīng)纖維。而多個外毛細胞才匯集到一根神經(jīng)纖維上。在毛細胞的上面有一層薄膜覆蓋,稱為蓋膜。外毛細胞的纖毛插入蓋膜之中,而內(nèi)毛細胞的纖毛則不與蓋膜相連。圖1.10 柯蒂器聲音經(jīng)過耳廓傳入耳道(空氣振動),引起鼓膜振動;再通過聽骨傳入內(nèi)耳,引起耳蝸內(nèi)的淋巴液體振動;從而帶動基膜和蓋膜的相互獨立運動,引起纖毛的剪切運動;該運動使毛細胞發(fā)出神經(jīng)脈沖,通過神經(jīng)通路傳入大腦,最后使人產(chǎn)生聽覺。一定頻率的聲音所產(chǎn)生的刺激引發(fā)沿基膜傳播的行波,其振幅在耳蝸的某點上升到最大值,然后迅速下降。高頻刺激引發(fā)的行波最大幅度出現(xiàn)在卵形窗附近的蝸管底端,低頻的則靠近蝸管頂端。聲音的波形在耳蝸的傳播中,速度逐漸

40、降低,能量迅速下降(從耳蝸的底端到頂端降低了100倍)。基膜的物理特性,使輸入信號的不同頻率的成分被分布在膜的不同位置,作用在對應的毛細胞上后,就產(chǎn)生了對不同頻率聲音的感知。2*. 對音強的感知在物理上,聲音的大小使用客觀測量單位來度量,即聲壓用pa(帕)或n/m2(牛頓/平方米)、聲強用w/m2(瓦特/平方米)、聲功率用w(瓦)、聲級用db(分貝)。在心理上,主觀感覺的聲音強弱使用響度(loudness)或響度級(loudness level)來度量。這兩種感知聲音強弱的計量單位是完全不同的兩種概念,但是它們之間又有一定的聯(lián)系。響度的單位為“宋(sone)”,為了對響度進行計算,定義聲級為4

41、0db的1khz標準音的響度等于1宋;定義響度級的值為1khz標準音的聲級的db值,單位為“方(phon)”。響度s與響度級p之間有關系式:,40方p105方或,1宋 s 91宋可見,40方為1宋,2宋比1宋響1倍,3宋比1宋響2倍,其余可依次類推。圖1.11 響度與響度級的關系當聲音弱到人的耳朵剛剛可以聽見時,我們稱此時的聲音強度為“聽閾(hearing threshold/audibility threshold)”。例如,1khz純音的聲強達到10-12w/m2(定義成0db聲強級)時,人耳剛能聽到,此時的主觀響度級定為零方。實驗表明,聽閾是隨頻率變化的。測出的等響曲線如圖1.12所示。

42、圖1.12 等響曲線圖中最靠下面的一根曲線叫做“零方等響度級”曲線,也稱“絕對聽閾”曲線,即在安靜環(huán)境中,能被人耳聽到的純音的最小值。另一種極端的情況是聲音強到使人耳感到疼痛。實驗表明,如果頻率為1khz的純音的聲強級達到120db左右時,人的耳朵就感到疼痛,這個閾值稱為“痛閾(pain threshold)”。對不同的頻率進行測量,可以得到“痛閾頻率”曲線,如圖中最靠上面所示的一根曲線。這條曲線也就是120方等響度級曲線。在“聽閾頻率”曲線和“痛閾頻率”曲線之間的區(qū)域就是人耳的聽覺范圍。這個范圍內(nèi)的等響度級曲線也是用同樣的方法測量出來的。由圖1.12可以看出,1khz的10db的聲音和200

43、hz的30db的聲音,在人耳聽起來具有相同的響度。該圖說明人耳對不同頻率的敏感程度差別很大,其中對1khz5khz范圍的信號最為敏感,幅度很低的信號都能被人耳聽到。而在低頻區(qū)和高頻區(qū),能被人耳聽到的信號幅度要高得多。此外,人的聽覺頻響還隨聲壓級的變化而變化。參見圖1.13。圖1.13 聽覺的頻響特性聲音的響度級還與聲音的持續(xù)時間有關,對振幅一定的連續(xù)聲音,開始聽到的響度并不是立即達到其響度級,而是較急速的增大,經(jīng)過一段時間后才達到最大值,隨后則逐漸減小。對于持續(xù)時間在一秒以下的聲音,人耳會感到響度下降。頻率越高的聲音,下降得越多。持續(xù)時間越短的聲音,聽起來的響度也下降得越多。人耳對音強差別的感

44、知與聲壓級有關,而與頻率的關系不大。當聲壓級在50db以上時,人耳能辨別的最小聲壓級差大約為1db左右;如果聲壓級小于40db,則聲壓級需變化2db左右才能被察覺出來。所以分檔調(diào)節(jié)的音量控制器的檔位差應該小于1db,以免人感覺音量突變。3. 對音高的感知客觀上用頻率來表示聲音的音高,其單位是hz。而主觀感覺的音高(音調(diào))單位則是“美爾(mel)”和“巴克(bark)”,主觀音高與客觀音高的關系是其中f的單位為hz,這也是兩個既不相同又有聯(lián)系的單位。參見圖1.14。圖1.14 音高頻率 曲線人耳對響度的感覺有一個范圍,即從聽閾到痛閾。同樣,人耳對頻率的感覺也有一個范圍。人耳可以聽到的最低頻率約2

45、0hz,最高頻率約20khz。正如測量響度時是以1khz純音為基準一樣,在測量音高時則以40db聲強為基準,并且同樣由主觀感覺來確定。測量主觀音高時,讓實驗者聽兩個聲強級為40db的純音,固定其中一個純音的頻率,調(diào)節(jié)另一個純音的頻率,直到他感到后者的音高為前者的兩倍,就標定這兩個聲音的音高差為兩倍。實驗表明,音高與頻率之間也不是線性關系。測出的“音高頻率”曲線如圖1.14所示。除了頻率這個主要因素外,影響音調(diào)的因素還有聲音的強度和持續(xù)時間。對低頻的純音,聲壓級升高時會感到音調(diào)卻變低;對1k5khz的中頻純音,音調(diào)與聲壓級幾乎沒有什么關系;對于高頻的純音,聲壓級升高時會感到音調(diào)也變高。復合音的音

46、調(diào)由其基音決定,復合音聲壓級的高低對音調(diào)的影響比純音要小得多。持續(xù)時間在半秒以下時的聲音的音調(diào)要比在一秒以上所感覺到的要低。持續(xù)時間太短(如10毫秒左右)的聲音,人耳感覺不出它的音調(diào),只聽到喀嚦聲。使人耳能明確感知音調(diào)所需的聲音持續(xù)時間,隨聲音頻率而不同,低頻聲音所需要的持續(xù)時間要比高頻聲音的長。人對聲音頻率的微小變化的分辨能力,成為人耳對頻率的分辨閾。根據(jù)實驗結果(參見圖1.15),人耳對于中等強度的中頻聲音(5006khz,50db)最敏感,辨別閾為0.3%左右。例如,頻率為3khz的聲音,變化(3000 * 0.3/100)= 9hz,人耳就能感覺出來。圖1.15 人耳對頻率的辨別域4.

47、 對音色的感知音色(音品)主要是由復合音中不同的諧音組成所決定的,影響音色的因素還有聲音的時間過程(時程)。a 頻譜圖頻譜就是頻率的分布曲線。復雜振動分解為振幅不同和頻率不同的諧振動,這些諧振動的幅度按頻率排列的圖形叫做頻譜。頻譜是頻率譜密度的簡稱。兩個音高(音調(diào))相同的聲音,它們的基頻是一樣的。但是如果它們的諧頻的成分和幅度不同(即頻譜的組成不同),則人們感知的音色也不同。所以音色也可以用聲音的頻譜圖來表示。頻譜圖的橫坐標為對數(shù)頻率,縱坐標為聲壓級。例如鋼琴聲音的頻譜中,諧頻較多,屬于和諧的樂音。而鈸釵聲音的頻譜則沒有諧頻,屬于不和諧的聲音。參見圖1.16。圖1.16 鋼琴與鈸的頻譜圖1.1

48、7為一些樂器的波形和頻譜圖,從中可見,同是吉他,如果聲音的音調(diào)不同,則波形和頻譜圖也不相同。圖1.17 幾種樂器的波形和頻譜b 時程影響音色的因素還有聲音的時程(時間過程)。所謂聲音的時程是指聲音的起振、穩(wěn)態(tài)和衰減的過程,也稱為音型(figure)。體現(xiàn)為波形圖中的曲線包絡。不同音色之聲音的時程是不同的,如弦樂的拉奏和彈撥樂的撥奏的時程就是不同的。例如鋼琴的起振較快,然后逐漸衰減;風琴則起振較慢,并保持一定的穩(wěn)態(tài)期,然后再較快的衰減;吉他的起振特別快,然后慢慢衰減。參見圖1.18。圖1.18 幾種樂器的時程不同的樂器,如果擊振和發(fā)聲方式不同,則發(fā)音過程的三個階段所占的比重也會不同。即使是同一種

49、樂器(如大提琴),如果采用不同的演奏方法(如拉弦或彈撥),則所產(chǎn)生的時程也會不同。5*. 掩蔽效應由于人耳蝸底隔膜振動的峰值位置取決于刺激的頻率,所以耳蝸及其組成部分在工作時就相當于一個頻率-位置轉(zhuǎn)換裝置。人耳將聲音信號運載到高級聽覺系統(tǒng)的傳入神經(jīng)原,存在鎖相機制。并且在偏移周期的某個特定點(峰值點)上會發(fā)生諧振(相當于相位檢測的鑒頻器在工作)。由于這種相位鎖定效應,大信號會淹沒同一頻段的小信號,從而產(chǎn)生掩蔽效應。稱一種頻率的聲音阻礙聽覺系統(tǒng)感受另一種頻率的聲音的現(xiàn)象為掩蔽效應。前者稱為掩蔽聲音(masking tone),后者稱為被掩蔽聲音(masked tone)。掩蔽可分成頻域掩蔽、時域

50、掩蔽和中樞掩蔽。a 頻域掩蔽(1)純音掩蔽一個強純音會掩蔽在其附近同時發(fā)聲的弱純音,這種特性稱為頻域的純音掩蔽,也稱為同時掩蔽(simultaneous masking)。一般來說,弱純音離強純音越近就越容易被掩蔽。從圖中可以看到,聲音頻率在300hz附近、聲強約為60db的聲音掩蔽了聲音頻率在150hz附近、聲強約為40db的聲音。圖1.19 聲強為60 db、頻率為1000 hz純音的掩蔽效應又如,一個聲強為60db、頻率為1000hz的純音,另外還有一個1100hz的純音,前者比后者高18db,在這種情況下我們的耳朵就只能聽到那個1000hz的強音。如果有一個1000hz的純音和一個聲強

51、比它低18db的2000hz的純音,那么我們的耳朵將會同時聽到這兩個聲音。要想讓2000hz的純音也聽不到,則需要把它降到比1000hz的純音低45db。(參見圖1.19)在圖1.20中的一組曲線分別表示頻率為250hz,1khz和4khz純音的掩蔽效應,它們的聲強均為60db。 圖1.20 不同純音的掩蔽效應曲線從圖中可以看到:在250hz,1khz和4khz純音附近,對其他純音的掩蔽效果最明顯,低頻純音可以有效地掩蔽高頻純音,但高頻純音對低頻純音的掩蔽作用則不明顯。由于聲音頻率與掩蔽曲線不是線性關系,為從感知上來統(tǒng)一度量聲音頻率,引入了“臨界頻帶(critical band)”的概念。臨界

52、頻帶表示的是人耳對兩個純音疊加時的分辨能力。通常將從20hz到20khz范圍分成24個臨界頻帶,臨界頻帶的中心頻率越高,其帶寬也越大,如表1.8所示。臨界頻帶的單位也叫bark(巴克):1 bark=一個臨界頻帶的寬度f (頻率)500 hz的情況下,bark 9 + 4lg(f /1000)表1.8 臨界頻帶臨界頻帶頻率 (hz)臨界頻帶頻率 (hz)低端中心高端寬度低端中心高端寬度0050100100132000216023203201100150200100142320251027003802200250300100152700292531504503300350400100163150

53、3425370055044004555101101737004050440070055105706301201844004850530090066307007701401953005850640011007770845920150206400705077001300892010001080160217700860095001800910801175127019022950010750120002500101270137514802102312000137501550035001114801600172024024155001877522050655012172018602000280(2)復合

54、音掩蔽復合音由多種頻率的聲音組成,人耳能分辨出復合音所包含的各種分音,從而感受到它的音色。由于純音的掩蔽效應可能使得復合音中的部分分音人耳聽不到,使得原來的音色發(fā)生改變,稱之為復合音掩蔽效應。(3)頻帶噪聲對純音的掩蔽當噪聲的頻帶不太寬時,掩蔽曲線與純音的近似,但更具有對稱性,并且不受拍頻的影響,其中心的掩蔽量要大于純音的。當噪聲的頻帶較寬時,只有以純音為中心的很窄頻帶(臨界頻帶)內(nèi)的噪聲才與掩蔽有關。當純音處于寬帶噪聲的臨界頻帶以外時,仍然會產(chǎn)生掩蔽效應,但是這種效應隨著他們之間間隔的增加而減弱。(4)遠掩蔽在純音掩蔽時,通常高頻聲對低頻聲的掩蔽較?。坏窃谠肼曆诒螘r,低于噪聲頻率的聲音也會受到掩蔽效應的影響,稱這種掩蔽為遠掩蔽。b 時域掩蔽除了同時發(fā)出的聲音之間有掩蔽現(xiàn)象之外,在時間上相鄰的聲音之間也有掩蔽現(xiàn)象,稱為時域掩蔽。時域掩蔽又分為超前掩蔽(pre-masking)和滯后掩蔽(post-masking),如圖1.21所示。產(chǎn)生時域掩蔽的主要原因是人的大腦處理信息需要花費一定的時間。一般來說,超前掩蔽很短,只有大約520ms,而滯后掩蔽可以持續(xù)50200ms。這個區(qū)別也是很容易

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論