聲音心理學(xué)模型_第1頁
聲音心理學(xué)模型_第2頁
聲音心理學(xué)模型_第3頁
聲音心理學(xué)模型_第4頁
聲音心理學(xué)模型_第5頁
已閱讀5頁,還剩26頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

聲音心理學(xué)模型第1頁,共31頁,2023年,2月20日,星期四主要內(nèi)容1.聽覺模型2.M-PEAG1心理聲學(xué)模型結(jié)構(gòu)3.仿真結(jié)果4.關(guān)于后期工作的想法5.總結(jié)第2頁,共31頁,2023年,2月20日,星期四1.聽覺模型1.1人耳聽覺模型(HAS)1.2人耳生理系統(tǒng)和臨界頻段1.3安靜狀態(tài)閾值和掩蔽第3頁,共31頁,2023年,2月20日,星期四1.聽覺模型人耳對于頻率的感知

呈對數(shù)規(guī)律的;會產(chǎn)生出差頻;人耳生理系統(tǒng)和臨界頻段

臨界頻段=24.7(4.37F+1)有調(diào)成分和無調(diào)成分

當(dāng)音調(diào)間的頻率差大于臨界頻段時,就是一般的和音;而當(dāng)頻率差小于臨界頻段時,就成為不諧和音Bark

感知頻率的單位,1個臨界頻段的寬度為1Bark。使用Bark來標(biāo)度,需要將物理頻率轉(zhuǎn)化為心理聲學(xué)頻率。這樣,一個純音就可以用心理掩蔽曲線來表示。第4頁,共31頁,2023年,2月20日,星期四1.聽覺模型安靜狀態(tài)閾值

安靜狀態(tài)閾值曲線表示了在給定頻率上,人耳能夠聽到聲音的最小聲壓級。0dB時的閾值為1kHz。人耳在1~5kHz的范圍內(nèi)最為敏感,可以聽到低于0dB參考值幾個分貝的信號。一般而言,兩個相同能量不同頻率的信號,聽起來是不一樣的。類似的,能夠聽到的噪聲和失真也隨頻率而改變。在太高或太低的頻率處,聽覺的靈敏度也會下降。第5頁,共31頁,2023年,2月20日,星期四1.聽覺模型掩蔽閾值掩蔽閾值是指幾乎聽不到聲音的聲壓級。當(dāng)同時有好幾個音調(diào)時,當(dāng)高音調(diào)完全掩蓋低音調(diào)時,就會出現(xiàn)掩蔽。掩蔽的一般性介紹

掩蔽的分類:同時掩蔽;異時掩蔽掩蔽的特點:利用聲調(diào)的強弱;利用人腦的反應(yīng)延遲

第6頁,共31頁,2023年,2月20日,星期四2.M-PEAG1心理聲學(xué)模型結(jié)構(gòu)2.1譜計算2.2聲壓級測定2.3安靜狀態(tài)閾值2.4判決有調(diào)和無調(diào)2.5有調(diào)和無調(diào)成分的抽取2.6單獨掩蔽閾值的計算2.7總體掩蔽閾值的計算第7頁,共31頁,2023年,2月20日,星期四2.1譜計算進行512點的FFT計算。FFT是直接對輸入PCM信號加海寧窗后進行的。海寧窗h(i)和功率譜X(k)的計算公式分別為:

第8頁,共31頁,2023年,2月20日,星期四2.2聲壓級的測定子帶n中的聲壓級的計算公式如下:第9頁,共31頁,2023年,2月20日,星期四2.3安靜狀態(tài)閾值安靜閾值也稱絕對閾值,它依賴于信號的抽樣頻率,由經(jīng)驗得出。對應(yīng)計算掩蔽閾值頻率范圍中的每個樣點,根據(jù)總體比特率補償絕對閾值,對于比特率≥96kbit/s,補償值為12dB,對于比特率<96kbit/s,補償值為0dB。下圖1給出了樣本音頻信號的安靜狀態(tài)閾值。

第10頁,共31頁,2023年,2月20日,星期四2.3安靜狀態(tài)閾值第11頁,共31頁,2023年,2月20日,星期四2.4判決有調(diào)和無調(diào)成分一個掩蔽成分的可調(diào)性影響到掩蔽閾值,因此必須判定有調(diào)與無調(diào)成分。為了計算總掩蔽閾值,必須從FFT頻譜中得出有調(diào)和無調(diào)成分。首先決定局部最大值,然后提取有調(diào)成分(正弦波),以及計算一個臨界頻段頻率范圍內(nèi)無調(diào)成分的強度。下圖2給出了樣本音頻信號局部最大值的確定,圖中帶圈的成分為局部最大值成分。第12頁,共31頁,2023年,2月20日,星期四2.4判決有調(diào)和無調(diào)成分第13頁,共31頁,2023年,2月20日,星期四2.4判決有調(diào)和無調(diào)成分而臨界頻段的頻寬隨著中心頻率變化,低頻時大約0.1kHz頻寬,高頻時大約4kHz頻寬。從心理聲學(xué)實驗可以知道,耳朵的低頻分辨率比高頻分辨率好。為了決定某個局部最大值是否可能是有調(diào)成分,還必須了解局部最大值所處頻率處臨界頻段的頻寬df。在不同的頻率段所用的頻寬是事先規(guī)定的:

df=172.266Hz,0kHz<f≤5.512kHzdf=281.25Hz,5.512kHz<f≤11.024kHzdf=562.50Hz,11.024kHz<f≤19.982kHz第14頁,共31頁,2023年,2月20日,星期四2.4判決有調(diào)和無調(diào)成分綜上所述,要列出譜線X(k)是有調(diào)或是無調(diào),需執(zhí)行以下三個運算:

標(biāo)明局部最大值。

列出有調(diào)成分并計算聲壓級.列出無調(diào)成分并計算功率.下面的圖3和圖4依次顯示了有調(diào)和無調(diào)成分的讀取。第15頁,共31頁,2023年,2月20日,星期四2.4判決有調(diào)和無調(diào)成分第16頁,共31頁,2023年,2月20日,星期四2.4判決有調(diào)和無調(diào)成分第17頁,共31頁,2023年,2月20日,星期四2.5有調(diào)和無調(diào)掩蔽成分的抽取抽取是用來減少掩蔽成分數(shù)目的步驟,它是計算綜合掩蔽閾值時必須考慮的問題。只要有調(diào)成分的X(k)之間滿足小于0.5Bark的寬度,就可以抽取這樣的有調(diào)成分。方法是列出有調(diào)成分,在臨界頻段范圍內(nèi)采用0.5Bark寬度的滑動窗,若窗內(nèi)存在兩個或更多的成分,僅保持窗內(nèi)最高功率的成分,移去所有較小功率的成分。圖5和圖6給出了樣本音頻信號有調(diào)成分、無調(diào)成分和安靜狀態(tài)閾值的比較。第18頁,共31頁,2023年,2月20日,星期四2.5有調(diào)和無調(diào)掩蔽成分的抽取第19頁,共31頁,2023年,2月20日,星期四2.5有調(diào)和無調(diào)掩蔽成分的抽取第20頁,共31頁,2023年,2月20日,星期四2.6單獨掩蔽閾值的計算通常在所有的N/2個頻率樣點的譜線中,僅僅只有其中一部分頻率樣點的譜線用于綜合掩蔽閾值計算。在最低頻的6個子帶的頻域范圍內(nèi)的譜線不考慮進行下采樣;接著6個子帶的頻域范圍內(nèi)的譜線,每隔1個譜線考慮進行下采樣;剩余的最高頻處的18個子帶的頻域范圍內(nèi)的譜線,每隔4個譜線考慮進行下采樣。將所有考慮進行下采樣的譜線進行下采樣,下采樣的樣點數(shù)n=106。第21頁,共31頁,2023年,2月20日,星期四2.6單獨掩蔽閾值的計算對于這108個樣點,經(jīng)驗給定對應(yīng)的譜值。對每個序號為k有調(diào)無調(diào)成分,選擇最接近其譜值X(k)的106樣點譜值中的某個樣點,將該成分序號令為i,i∈{1,2,3,...,106}。j為所有有調(diào)、無調(diào)成分在抽取后的譜線序號。有調(diào)和無調(diào)的單獨掩蔽閾值分別由下式計算:第22頁,共31頁,2023年,2月20日,星期四2.6單獨掩蔽閾值的計算第23頁,共31頁,2023年,2月20日,星期四2.6單獨掩蔽閾值的計算第24頁,共31頁,2023年,2月20日,星期四2.7總體掩蔽閾值的計算第i個頻率樣點的總掩蔽閾值LTg(i)是由序號為j的所有有調(diào)無調(diào)掩蔽成分的單獨掩蔽閾值LTtm[z(j),z(i)]、LTnm[z(j),z(i)]和安靜狀態(tài)閾值LTq(i)求出的,把相應(yīng)于單獨掩蔽閾值的功率和安靜狀態(tài)閾值的功率相加可求得總掩蔽閾值:其中,有調(diào)掩蔽成分總數(shù)為m,無調(diào)掩蔽成分總數(shù)為n。圖9給出了樣本音頻信號的總體掩蔽閾值,即圖中黑色的虛線。第25頁,共31頁,2023年,2月20日,星期四2.7總體掩蔽閾值的計算第26頁,共31頁,2023年,2月20日,星期四3.仿真結(jié)果仿真文件選擇:1-5.wav仿真數(shù)據(jù)截取:總體掩蔽閾值第27頁,共31頁,2023年,2月20日,星期四

4.關(guān)于后期工作的想法

基于心理聲學(xué)模型的音頻數(shù)據(jù)隱藏方案:

利用宿主音頻信號的心理學(xué)模型得到的掩蔽閾值,對偽隨機序列調(diào)制后的隱藏消息進行頻域掩蔽,將掩蔽后的偽隨機消息嵌入宿主音頻。利用偽隨機信號的相關(guān)性思路的結(jié)合第28頁,共31頁,2023年,2月20日,星期四5.總結(jié)心理聲學(xué)模型的優(yōu)缺點

采用以宿主音頻信號本身的頻域掩蔽效應(yīng)來調(diào)制隱藏的偽隨機序列,因此被隱藏的偽隨機序列是基于宿主音頻信號內(nèi)容的,嵌入后具有良好的聽覺不可感知性.但是在變換域中的抗攻擊能力較弱.第29頁,共31頁,2023年,2月20日,星期四5.總結(jié)信息隱藏技術(shù)的展望利用數(shù)字化媒體進行信息隱藏是一個嶄新的研究領(lǐng)域,在應(yīng)用需求的刺激下得到了迅速的發(fā)展,使其能夠橫跨數(shù)字信號處理、圖像處理、語音處理、模式識別、數(shù)字通信、多媒體技術(shù)、密碼學(xué)等多個學(xué)科,盡管在目前還沒形成完整的理論體系,但由于它是一項與具體應(yīng)用十分密切的實用技

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論