聲源定位計算機仿真與分析_第1頁
聲源定位計算機仿真與分析_第2頁
聲源定位計算機仿真與分析_第3頁
聲源定位計算機仿真與分析_第4頁
聲源定位計算機仿真與分析_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、聲源定位計算機仿真與分析 摘要 確定一個聲源在空間中的位置是一項有廣闊應用前景的有趣研究,將來可以廣泛 的應用于社會生產(chǎn)、生活的各個方面。 聲源定位是通過測量物體發(fā)出的聲音對物體定位,與使用聲納、雷達、無線通訊 的定位方法不同,前者信源是普通的聲音,是寬帶信號,而后者信源是窄帶信號。根 據(jù)聲音信號特點,人們提出了不同的聲源定位算法,但由于信號質(zhì)量、噪聲和混響的 存在,使得現(xiàn)有聲源定位算法的定位精度較低。此外,已有的聲源定位方法的運算量 較大,難以實時處理。為解決這些問題,本文系統(tǒng)地研究了基于傳聲器陣列的聲源定 位方法,主要做了以下一些工作: 首先對傳聲器陣列及其研究現(xiàn)狀進行了總體概述,討論了基

2、于傳聲器陣列的聲源 定位所面臨的問題,重點分析了傳聲器陣列信號處理的特殊性和混響的產(chǎn)生原因及影 響,總結(jié)歸納并比較了各種基于傳聲器陣列聲源定位方法的優(yōu)缺點。重點分析了基于 時延估計(ITD)和強度差異(IID)的聲源定位方法。 作者開發(fā)了一種基于 Matlab 軟件的聲源定位系統(tǒng),結(jié)合時延估計和強度差異算法, 進行了系統(tǒng)的聲源定位仿真,給出了仿真結(jié)果,并提出了改進方案。仿真實驗證明所 設計的聲源定位系統(tǒng)可用,并可以為進一步的聲源定位研究提供平臺支持。 關鍵詞:傳聲器陣列;聲源定位;ITD;IID;Matlab TO SIMULATE AND ANALYZE THE SOUND SOURCE L

3、OCALIZATION BY COMPUTER ABSTRACT Localization of sound source is an interesting course of study which will be widely applied in our future life. Sound source localization is realized by processing sound signals,differing from the localization method with sonar,radar or wireless communication in the

4、type of signals.Sound is a wide-band signal,while the later are narrow-band signals.Many sound source localization algorithms are proposed aiming at the characteristic of sound signals.However,signals quality,background noise and room reverberations in enclosure greatly degrade the effectiveness of

5、acoustic source localization.For solve these question,some work are accomplished in this paper. Foremost,the microphone array is generally described,and some issues of sound source localization based on microphone array are discussed.The particularities of signal processing based on microphone array

6、 and the cause and influence of reverberation are analyzed.Some main methods of sound source localization are compared.A sound source localization method based on the interaural time difference(ITD) and interaural intensity difference(IID) is analyzed with emphasis. A sound source localization syste

7、m based on the Matlab was produced.Finally,based on the ITD and IID,some experiment is conducted on the system,and the experimental result is presented.The results showed that further study on sound source localization can be made on the sound source localization system. Key words: Microphone Array;

8、 Sound Source Localization; ITD; IID; Matlab 目 錄 第一章 緒論 1.1 聲源定位的關鍵技術及國內(nèi)外研究現(xiàn)狀.1 1.2 基于傳聲器陣列的定位方法簡述.2 1.3 基于傳聲器陣列的聲源定位系統(tǒng)的模型與難點 .3 1.4 聲源定位系統(tǒng)的結(jié)構(gòu) .4 1.4.1 硬件結(jié)構(gòu).4 1.4.2 軟件結(jié)構(gòu). 5 1.5 本論文的主要工作和內(nèi)容安排.5 第二章 幾種定位方法的介紹 2.1 聲音信號分析.6 2.2 聲源定位原理.6 2.2.1 仿人雙耳的聲源定位原理.7 2.2.2 基于到達時間差的聲源定位原理.7 2.2.3 基于聲壓幅比的定位方法.7 2.3

9、聲源定位方法的分類和比較.9 2.3.1 基于最大輸出功率的可控波束形成定位方法.9 2.3.2 基于高分辨率譜估計技術的定位方法.9 2.3.3 基于時延估計的定位方法.10 2.3.4 定位方法比較.10 第三章 基于時延(ITD)的方位估計 3.1 傳聲器和聲源的幾何模型.11 3.1.1 雙傳聲器幾何模型與分析.11 3.1.2 傳聲器陣列幾何模型與分析.13 3.2 幾何定位方法.13 3.2.1 數(shù)據(jù)采集方法.14 3.2.2 聲音信號的處理.14 3.2.2.1 聲源到傳聲器間距離差的計算.14 3.2.2.2 聲源位置的計算與仿真.15 3.3 程序測試與誤差分析.17 第四章

10、 基于強度差異(IID)的方位估計 4.1 方法概述與分析.19 4.2 聲源方位估計的實現(xiàn).21 4.2.1 數(shù)據(jù)的采集.21 4.2.2 聲壓幅比的計算方法.22 4.2.3 聲源位置的計算與仿真.23 4.3 程序測試與誤差分析.24 第五章 總結(jié).27 參考文獻.28 致謝.29 附錄 附錄 A.30 附錄 B.32 第一章 緒論 1.1 聲源定位的關鍵技術及國內(nèi)外研究現(xiàn)狀 利用目標發(fā)出的聲音信號來確定目標的方位,是聲音探測系統(tǒng)測定目標位置的關 鍵技術,系統(tǒng)以被動方式測出目標聲音的參數(shù),利用聲程差等信息來確定目標方向和 距離。聲源定位的基本原理是將傳聲器在空間布置成有一定幾何形狀的陣列

11、,以接收 目標聲音信號的聲場信息。通過檢測或計算出各傳聲器所測信號的參數(shù)來確定目標的 方位和距離。 20 世紀 80 年代以來,傳感器陣列信號處理技術得到迅猛的發(fā)展,并在雷達、聲納 及通信中得到廣泛的應用。這種陣列信號處理的思想后來應用到語音信號處理中。在 1985 年 Flanagan 將傳聲器陣列引入到大型會議的語音增強應用中,開發(fā)出多種實際產(chǎn) 品。之后,Silverman 和 Brandstein 將其應用于語音識別和聲源定位中。進入 90 年代以 來,基于傳聲器陣列的語音處理算法正逐漸成為一新的研究熱點?;趥髀暺麝嚵械?產(chǎn)品能夠廣泛利用于具有復雜背景的語音通信環(huán)境,例如會場、多媒體教

12、室、車載免 提電話和助聽器等。目前國外從事傳聲器陣列相關研究的機構(gòu)主要有:Intel、寶利通、 東芝等。但是國內(nèi)并沒有類似的具有自主知識產(chǎn)權(quán)的產(chǎn)品,所以對于該技術的研究具 有較為領先的意義。 出現(xiàn)較早,并且在實際中應用的傳感器陣列的信號處理方法是波束形成法1,在這 種方法中,基陣的輸出是各個陣元輸出的簡單的加權(quán)求和,通過調(diào)整權(quán)系數(shù)可以在希 望的方向上形成波束,而對其余的方向產(chǎn)生較小的響應。然后對整個觀測空間做波束 掃描即可確定信號的方位。但是,基陣的分辨率受瑞利準則的限制,是這種方法自身 無法解決的問題。 針對常規(guī)波束形成信號處理中存在的分辨率問題,許多研究工作者進行了大量的 理論研究工作,以

13、期改善基陣的分辨率,最終形成了各種高分辨算法。如最大嫡譜法、 信號子空間法、特征結(jié)構(gòu)法和最小方差法等。與常規(guī)波束形成法相比,這些高分辨算 法都有效地改善了基陣的分辨率,但這些方法都有一個共同的缺點,即無法解決相干 源問題。 為了解決相干源情況下的高分辨問題,研究人員又尋找了其它的方法和技術,出 現(xiàn)了最大似然估計法、遞增階數(shù)多參數(shù)估計法、信號參數(shù)估計旋轉(zhuǎn)不變技術、空間平 滑技術、子空間擬合類算法等,這些算法獲取了較佳的性能,但是計算量相對龐大。 基于傳聲器陣列的參數(shù)估計法除了上述這些技術之外,還有一種常用方法就是時 延估計法2,3。 所謂時間延遲,是指陣列中不同接收器所接收到的聲源信號之間由于信

14、號傳輸距 離不同而引起的時間差。時間延遲估計是指利用參數(shù)估計和信號處理的理論和方法, 對上述時間延遲進行估計和測定,并由此進一步確定其它有關參數(shù),例如信源目標的 距離、方位、運動方向和速度等。 時延估計的理論和技術是由水聲目標定位及信號處理發(fā)展脫穎而出的?,F(xiàn)代聲納 的研究始于 20 世紀初,到第二次世界大戰(zhàn)時,各種聲納裝置己經(jīng)被廣泛地用于水中兵 器。自 20 世紀五十年代以來,隨著信息論、信號檢測理論和計算機技術的飛速發(fā)展, 以及各個應用領域?qū)r延估計的需求,時延估計理論得到了迅速的發(fā)展。 進入上個世紀九十年代以來,除了對以往的方法進行擴展和深入研究以外,又發(fā) 展了基于人工神經(jīng)網(wǎng)絡的時延估計方

15、法,基于譜相關理論的時延估計方法和各種自適 應時延估計方法等。 近幾年,在時頻分析工具的發(fā)展下,為了更準確的分析非平穩(wěn)信號,又出現(xiàn)了基 于短時傅立葉變換的時延估計、基于小波變換的時延估計間等方法。使得時延估計的 精確度以及聲源定位的性能都有較大提高。 1.2 基于傳聲器陣列的定位方法簡述 在無噪聲、無混響的情況下,距離聲源很近的高性能、高方向性的單傳聲器可以 獲得高質(zhì)量的聲源信號。但是,這要求聲源和傳聲器之間的位置相對固定,如果聲源 位置改變,就必須人為地移動傳聲器。若聲源在傳聲器的選擇方向之外,則會引入大 量的噪聲,導致拾取信號的質(zhì)量下降。而且,當傳聲器距離聲源很遠,或者存在一定 程度的混響

16、及干擾的情況下,也會使拾取信號的質(zhì)量嚴重下降。為了解決單傳聲器系 統(tǒng)的這些局限性,人們提出了用傳聲器陣列進行聲音處理的方法。 傳聲器陣列是指由一定的幾何結(jié)構(gòu)排列而成的若干個傳聲器組成的陣列。相對于 單個傳聲器而言具有更多優(yōu)勢,它能以電子瞄準的方式從所需要的聲源方向提供高質(zhì) 量的聲音信號,同時抑制其他的聲音和環(huán)境噪聲,具有很強的空間選擇性,無須移動 傳聲器就可對聲源信號自動監(jiān)測、定位和跟蹤,如果算法設計精簡得當,則系統(tǒng)可實 現(xiàn)高速的實時跟蹤定位。 傳聲器陣列的聲音信號處理與傳統(tǒng)的陣列信號處理主要有以下幾種不同: (1)傳統(tǒng)的陣列信號處理技術處理的信號一般為平穩(wěn)或準平穩(wěn)信號,相關函數(shù)可 以通過時間

17、相關來準確獲得,而傳聲器陣列要處理的信號通常為短時平穩(wěn)的聲音信號, 用時間平均來求得準確的相關函數(shù)比較困難。 (2)傳統(tǒng)的陣列信號處理一般采用遠場模型,而傳聲器陣列信號處理要根據(jù)不同 的情況選擇遠場模型還是使用近場模型。近場模型和遠場模型最主要的區(qū)別在于是否 考慮傳聲器陣列各陣元因接收信號幅度衰減的不同所帶來的影響,對于遠場模型,信 源到各陣元的距離差與整個傳播距離相比非常小,可忽略不計,對于近場模型,信源 到各陣元的距離差與整個傳播距離相比較大,必須考慮各陣元接收信號的幅度差。 (3)在傳統(tǒng)的陣列信號處理中,噪聲一般為高斯噪聲(包括白、色噪聲),與信源 無關,在傳聲器陣列信號處理中噪聲既有高

18、斯噪聲,也有非高斯噪聲,這些噪聲可能 和信源無關,也可能相關。 由于上述陣列信號處理間的區(qū)別,給傳聲器陣列信號處理帶來了極大的挑戰(zhàn)。聲 波在傳播過程中要發(fā)生幅度衰減,其幅度衰減因子與傳播距離成正比,信源到傳聲器 陣列各陣元的距離是不同的,因此聲波波前到達各陣元時,幅度也是不同的。 另外,當聲音信號在傳播時,由于反射、衍射等原因,使到達傳聲器的聲音信號 的路徑除了直達路徑外還存在著多條其它路徑,從而產(chǎn)生接收信號的幅度衰減、音質(zhì) 變差等不利影響,這種現(xiàn)象稱為混響(Reverberation)?;祉懶拇嬖诋a(chǎn)生了很多不 利影響,如所獲取的聲音質(zhì)量下降、聲源定位的精度嚴重降低等。 1.3 基于傳聲器

19、陣列的聲源定位系統(tǒng)的模型與難點 為了說明基于傳聲器陣列的聲源定位系統(tǒng)的模型與難點,圖 1.1 詳細描繪了一個傳 聲器陣列聲源定位應用的實際情況。由圖 1.1 可知,傳聲器陣列系統(tǒng)定位聲源的精度受 多方面因素的影響。第一是噪聲和反射的噪聲;第二是聲源的多重反射(即混響) ;第 三是聲源與傳聲器的相對位置。 圖 1.1 傳聲器陣列聲源定位系統(tǒng)描述 假定聲音傳播滿足線性波動方程,且周圍環(huán)境在一段時間內(nèi)不變,則從聲源到傳 聲器之間可看成線性時不變系統(tǒng)??稍O聲源信號為 s (n),第 i 個傳聲器接收到的信號 為 xi (n),若噪聲為高斯白噪聲,則 xi (n)=hi (n)*si (n)+ i(n)

20、 (1.1) 其中 hi (n)是周圍環(huán)境的脈沖沖激響應,i(n)是高斯白噪聲。 一個高精度聲源定位系統(tǒng)所面臨的難點主要有: (1)由于聲音的反射,傳聲器不僅收到聲音信號的直接到達部分,還收到反射部 分。而聲音的反射會導致互相關函數(shù)或者波束的尖峰擴展,使得難以確定最大值,從 而加大了定位的誤差。 (2)定位系統(tǒng)不僅受到噪聲的干擾,而且由于噪聲的反射,會產(chǎn)生相關噪聲。這 樣各傳聲器間噪聲的互相關函數(shù)就不等于零,從而增大了定位的難度。 (3)傳聲器位置的擺放。對于一個定位系統(tǒng)而言,傳聲器的數(shù)量越多,傳聲器的 相對位置越多樣化,提供的空間信息量越大,從而具有較高的定位精度。而在實際系 統(tǒng)中,傳聲器的

21、擺放位置比較固定,數(shù)量也比較少。因此難點就是在盡量少的傳聲器 和固定擺放位置條件下,提供高的定位精度。 1.4 聲源定位系統(tǒng)的結(jié)構(gòu) 一個完整的聲源定位系統(tǒng)由硬件部分和軟件部分構(gòu)成。具體結(jié)構(gòu)如下所述。 1.4.1 硬件結(jié)構(gòu) 完整的聲源定位系統(tǒng)的硬件結(jié)構(gòu)如圖 1.2 所示:由一定數(shù)目按特定位置擺放的傳聲 器陣列,信號預處理系統(tǒng),同步數(shù)據(jù)采集系統(tǒng)和數(shù)據(jù)處理系統(tǒng)組成。 圖 1.2 聲源定位系統(tǒng)硬件結(jié)構(gòu)框圖 在系統(tǒng)工作時,聲音信號經(jīng)傳聲器轉(zhuǎn)換為電信號,然后經(jīng)信號預處理系統(tǒng)處理后 把信號調(diào)整到數(shù)據(jù)采集系統(tǒng)的輸入信號電壓范圍,再經(jīng)過采集系統(tǒng)采集后傳輸?shù)綌?shù)據(jù) 處理系統(tǒng),由數(shù)據(jù)處理系統(tǒng)中的軟件系統(tǒng)處理后可得出聲

22、源的位置。 1.4.2 軟件結(jié)構(gòu) 聲源定位系統(tǒng)的軟件結(jié)構(gòu)框圖如圖 1.3 所示。 圖 1.3 聲源定位系統(tǒng)的軟件結(jié)構(gòu)框圖 由硬件系統(tǒng)同步采集得到聲音信號后,經(jīng)過去噪,增強等預處理,計算出每個傳 聲器對的聲音到達時間差值或者聲壓幅度比值,最后通過聲源定位程序得到聲源估計 位置。 1.5 本論文的主要工作和內(nèi)容安排 實現(xiàn)一個可仿真的聲源定位系統(tǒng)是本論文的目的。在算法研究比較充分的基礎上, 設計系統(tǒng)結(jié)構(gòu),實現(xiàn)聲源定位。本文對傳聲器陣列聲源定位系統(tǒng)進行了系統(tǒng)的研究, 主要工作如下: (1)介紹了幾種聲源定位方法,總結(jié)歸納了各種基于傳聲器陣列的定位方法的優(yōu) 缺點。 (2)重點研究了時延估計方法,討論了各

23、種時延估計方法的優(yōu)缺點。歸納比較了 各種基于時延的方位估計方法。 (3)設計并實現(xiàn)了可仿真的聲源定位系統(tǒng)。詳細介紹了系統(tǒng)結(jié)構(gòu),給出了實驗結(jié) 果,詳細分析了各種影響因素對系統(tǒng)定位精度的影響,并給出了改進方案。 本論文的各章主要內(nèi)容安排如下: 第一章,介紹了系統(tǒng)的應用背景和研究現(xiàn)狀,討論了系統(tǒng)的模型與難點,給出了 聲源定位系統(tǒng)的結(jié)構(gòu)。 第二章,分析了聲源定位原理和幾種聲源定位方法。 第三章,給出了基于時間差(ITD)的聲源定位設計,詳細介紹了傳聲器的選擇與 布局、算法的實現(xiàn)過程及軟件系統(tǒng)的設計和實現(xiàn)過程,并對存在的問題進行討論。 第四章,給出了基于聲壓差(IID)的聲源定位設計,詳細介紹了算法的改

24、動及軟 件系統(tǒng)的設計和實現(xiàn)過程,并對存在的問題進行討論。 第五章,總結(jié)了本論文所完成的工作,分析了其中的長處和不足,并提出了對后 續(xù)研究工作的建議。 第二章 幾種定位方法的介紹 2.1 聲音信號分析 聲源體發(fā)生振動會引起四周空氣振蕩,那種振蕩方式就是聲波。聲波借助空氣向 四面八方傳播。在開闊空間的空氣中那種傳播方式像逐漸被吹大的肥皂泡,是一種球 形的陣面波。 除了空氣,水、金屬、木頭等也都能夠傳遞聲波,它們都是聲波的良好介質(zhì)。在 真空狀態(tài)中聲波就不能傳播了。聲音在不同的介質(zhì)中的傳播速度不同。聲音的速度受 溫度影響,溫度越高,速度越快。在 15時,聲音在空氣中的傳播速度為 340m/s,25時為

25、 346m/s。它和溫度的關系可以用以下公式來表示: C =331.45 +0.61T(m/s) (2.1) 在使用時,如果溫度變化不大,則可認為聲速是基本不變的。聲波傳輸距離首先 和大氣的吸收性有關,其次是溫度、濕度、氣壓等。 2.2 聲源定位原理 根據(jù)不同的應用要求,有以下三種聲源定位原理。 2.2.1 仿人雙耳的聲源定位原理 人是我們最熟悉的一個聲源定位系統(tǒng),人的兩只耳朵是這個系統(tǒng)的主角。由于耳 廓具有非常特殊的形狀,聲音經(jīng)過耳廓的處理后,大腦只需要根據(jù)兩只耳朵所接收到 的聲音強度就能大致定位某一個聲源的方位。然而要模擬制作出耳廓這樣具有特殊結(jié) 構(gòu)的傳感器是比較困難的。Handzel,A

26、.A 等把人的頭部用球的模型來近似4,在球相對 的兩極各安裝一個傳聲器,給出了兩耳功能的解析方程能夠有效的定位聲音的方向。 2.2.2 基于到達時間差的聲源定位原理 人對聲源的定位主要用到了聲音幅度這個物理量,而機器卻可以精確的測量聲音 的相位。由于聲波在空氣中以一定速度傳播,到達設置于不同位置的傳聲器的相位不 同,根據(jù)這些傳聲器對同一聲音采集時的相位差別,我們可以計算出同一聲音到達每 對傳聲器的時間差值(又叫時延值) 。圖 2.1 是到達時間差 t 的示意圖。 如果我們得到了某個聲源發(fā)出的聲音到達一對傳聲器的時延值,則這個聲源就處 于以這對傳聲器所處的位置為焦點,到達時延所對應的聲音傳輸距離

27、為參數(shù)的雙曲面 上。使用多對傳聲器得到多個時延值,也就得到了多個雙曲面,聲源位置就處于這些 雙曲面的相交點。合適的安排傳聲器的位置,可以使得雙曲面的交點只有一個,這點 就是我們要的聲源位置。大多數(shù)聲源定位是基于時延的方法,提高對時延估計的準確 程度是這種方法的關鍵,而要得到準確的時延估計必須要確保有高效的信號采集能力。 圖 2.1 到達時間差 t 的示意圖 2.2.3 基于聲壓幅比的定位方法 與上述基于時間差的方法不同,這種方法利用不同傳聲器接收到的來自同一個聲 源的聲音信號在強度上的差異實現(xiàn)聲源定位。為此,引入聲壓幅度比的概念,根據(jù)由 聲壓在傳聲器處產(chǎn)生的電壓輸出與對應聲源到傳聲器的距離兩者

28、之間存在的關系導出 一個用于聲源定位的約束條件。由這個約束條件可確定出三維空間中的一個球面。每 個傳聲器可導出一個這樣的約束條件,由這些約束條件可確定出聲源的位置。它們既 可以單獨使用,也可以和由基于時間差的方法導出的約束條件一起使用。 為簡單起見,首先考慮二維平面上的聲源定位問題。圖 2.2 為根據(jù)聲壓幅度比定位 平面上一個聲源的示意圖。假設四個傳聲器被等間距地排列在 X 軸上,其坐標分別為 (-3a,0),(-a,0),(a,0)和(3a,0)。若聲源位于 S(x,y)點處,則聲源到四個傳聲器的距離 分別可表示為: (2.2) (2.3) (2.4) (2.5) 圖 2.2 平面上基于聲壓

29、幅度比聲源定位示意圖 假設第 i 個傳聲器上接收到的聲壓幅度為 e i(t),其值可以由各傳聲器的實測值得 到,經(jīng)過推理可以得到: (2.6) (2.7) 這樣,把式(2.2) 、 (2.3) 、 (2.4) 、(2.5)代入式(2.6)、(2.7),可得到以 x,y 為變量 的二元二次方程組。求解上述方程組即可得出聲源位置的候補解組。再根據(jù)對聲源的 先驗知識(在很多情況下,聲源的大致方位是已知的),可以確定出聲源的最終位置。而 對于三維空間中的定位,只需要使用不在同一個平面中的四個傳聲器,便可以唯一的 確定出聲源在三維空間中的位置。 2.3 聲源定位方法的分類和比較 基于傳聲器陣列的聲源定位

30、問題,就是通過對所接收陣列信號的分析處理來估計 出聲源的空間位置信息,如波達方向(Direction of Arrival,簡稱 DoA)或者二維平面坐 標及三維空間坐標等。 基于傳聲器陣列的聲源定位方法大體上可分為三類: (1)基于最大輸出功率的可控波束形成方法。該方法對傳聲器陣列接收到的聲音 信號進行濾波、加權(quán)求和,然后直接控制傳聲器指向使波束有最大輸出功率的方向; (2)基于高分辨率譜估計的定位方法。該方法利用求解傳聲器信號間的相關矩陣 來定出方向角; (3)基于時延估計(Time Delay Estimation,TDE)的聲源定位方法。該方法首先 求出聲音到達不同位置傳聲器的時間差,

31、再利用這些時間差求得聲音到達不同位置傳 聲器的距離差,最后用幾何知識或搜索的方法確定聲源位置。 2.3.1 基于最大輸出功率的可控波束形成定位方法 波束形成的基本思想是將各陣元采集到的信號進行加權(quán)求和形成波束,進而通過 搜索聲源位置來引導波束,修改權(quán)值使傳聲器陣列的輸出信號功率達到最大,波束輸 出功率最大的點就是聲源的位置。在文獻5中介紹了該方法的理論基礎,文獻6將該方 法應用于多聲源的定位。 傳統(tǒng)的波束形成器的權(quán)值取決于各陣元上信號的相位延遲,而相位又與時延和聲 源到達延遲有關,故又稱為時延求和波束形成器。而現(xiàn)代的波束形成器則突破了上述 局限,在進行時間校正的同時還對信號進行濾波,稱為濾波求

32、和波束形成器7。 2.3.2 基于高分辨率譜估計技術的定位方法 該方法來源于一些現(xiàn)代高分辨率譜估計技術,該類聲源定位技術是利用接收信號 相關矩陣的空間譜,求解傳聲器間的相關矩陣來確定方向角。高分辨率譜估計的定位 技術包括現(xiàn)代高分辨率譜估計技術:自回歸模型(AR)、最小方差譜估計(MV)和特征值分 解方法(如 MUSIC 算法)。 在實際中,基于高分辨率譜估計定位技術的空間譜的相關矩陣是未知的,必須從 觀測信號中來估計,需要在一定時間間隔內(nèi)把所有信號平均來得到,同時要求接收信 號處于聲源、噪聲、估計參數(shù)固定不變的環(huán)境和有足夠多的信號平均值。即便滿足這 些條件,該算法也不如傳統(tǒng)的波束形成方法對聲源

33、和傳聲器模型誤差的魯棒性好。目 前定位問題所涉及算法都是研究遠場的線性陣列情況。AR 模型和某些特征值分析的方 法就限定在遠場且具有相同特性的線性陣列,但 MV 和 MUSIC 算法己經(jīng)延伸到一般陣 列的幾何結(jié)構(gòu)和近場8。 2.3.3 基于時延估計的定位方法 基于時延估計(Time Delay Estimation,TDE)的聲源定位方法在導航系統(tǒng)、聲納系 統(tǒng)等領域都有廣泛的應用。該方法首先估計出聲源到達傳聲器陣列的各陣元的相對時 間差,再利用時間差算出聲源到達各陣元的距離差,最后用搜索或幾何算法確定聲源 位置,較適合于單個聲源的定位。由于每對傳聲器時延唯一對應一個雙曲面,因此多個 傳聲器對就

34、可以確定多個雙曲面?;诖嗽懋a(chǎn)生出許多定位方法,各有自己的優(yōu)缺 點。 基于時延估計的聲源定位包括 2 個步驟:(1)先進行時延估計,并從中獲得傳聲器陣 列中相應陣元對之間的聲音到達時延(Time Delay of Arrival,TDoA)。TDE 的方法很多, 常用的有廣義互相關(Generalized Cross Correlation,GCC)函數(shù)法9、最小均方(Least Mean Square,LMS)自適應濾波法10和互功率譜相位(Cross-power Spectrum Phase,CSP)法9三種。(2)利用時延估計進行方位估計,主要的方法有角度距離定位法、 球形插值(Sph

35、erical Interpolation,SI)法11、線性插值(Linear Interpolation,LI)法 12,13和目標函數(shù)空間搜索定位法8。 2.3.4 定位方法比較 在這三種定位方法中,基于最大輸出功率的可控波束形成技術是出現(xiàn)較早且已在 實際中應用的一種定位方法,較多的用于雷達、聲吶以及移動通信的信號處理中???控波束形成技術本質(zhì)上是一種最大似然估計,它需要聲源和環(huán)境噪聲的先驗知識。而 實際使用中,這種先驗知識往往很難獲得。 基于高分辨率譜估計的定位方法是通過時間平均來估計信號之間的相關矩陣,需 要信號是平穩(wěn)過程,估計參數(shù)固定不變,而聲音信號是一個短時平穩(wěn)過程,往往不能 滿足

36、這個條件。該定位方法的效果和穩(wěn)定性不如可控波束形成法,但每次迭代的計算 復雜度不像可控波束形成那么苛刻。此外還須假定理想的信號源和相同特性的傳聲器 等,在實際環(huán)境中不可能做到這點。 基于時延估計的定位方法在運算量上遠遠小于可控波束和譜估計法,可以考慮在 實際中實時實現(xiàn)。但是該方法也有不足之處。其一,估計時延和估計方位分成兩階段 來完成,因此在定位階段用的參數(shù)已經(jīng)是對過去時間的估計,這在某種意義上只是對 聲源位置的次最優(yōu)估計;其二,時延定位的方法比較適合于單聲源的定位,而對多聲 源的定位就束手無策;其三,在有較強反射和噪聲的情況下,往往很難獲得精確的時 延,從而導致第二步的定位產(chǎn)生很大的誤差。

37、雖然如此,但由于時延估計定位方法的運算量比較低,而且在適當改進后,在一 定的噪聲和反射下有比較好的定位精度,因此適合于在實際中實時應用。 本論文將重點研究基于時延估計和聲壓幅比14的聲源定位方法,這兩種方法在模 型的建立與仿真的實現(xiàn)上有很多相似,在第三章和第四章中將分兩部分詳細討論這兩 種方法。 第三章 基于時延(ITD)的方位估計 本章詳細討論了如何根據(jù)估計的時延值來確定聲源的方位并進行仿真,定位的方 法為幾何定位法,首先分析了傳聲器和聲源的幾何模型,然后根據(jù)幾何方法,實現(xiàn)定 位算法以及對樣本數(shù)據(jù)的采集,最后通過編寫 Matlab 程序?qū)λ惴ㄟM行仿真。 3.1 傳聲器和聲源的幾何模型 在建立

38、傳聲器和聲源的幾何模型的過程中,首先建立雙傳聲器幾何模型,然后建 立傳聲器陣列幾何模型,并做出詳細的分析。 3.1.1 雙傳聲器幾何模型與分析 在本模型中,聲源和傳聲器的坐標位置如圖 3.1 所示 圖 3.1 聲源和傳聲器的坐標位置 假設第i對傳聲器m1和m2連線的中點為原點,它們的連線為X軸,聲源到這兩個傳聲器 間的時間差是 。用矢量和表示這兩個傳聲器的位置,用矢量 表示聲源的位置, 則聲源S應該滿足矢量方程 (3.1) 其中c為聲速。由雙曲面的定義可得,滿足該方程的S必落在雙曲面上。 在圖中所示的聲源是極坐標形式,將聲源坐標和傳聲器坐標轉(zhuǎn)化為直角 坐標形式,可得 (3.2) (3.3) (

39、3.4) 將式(3.2)、(3.3)、(3.4)代入式(3.1),兩邊平方可得 (3.5) 當聲源離傳聲器比較遠時(即r變得很大時, 趨近于零),式(3.5)可以近似為 (3.6) 所以當已知傳聲器間的時延和傳聲器間的距離時,可以近似求得圖3.1中的角。也 就是說,當聲源離傳聲器比較遠時,可以用以為方向角的圓錐面來近似代替聲源可能 的位置。此近似如下圖3.2。 圖3.2 聲源的雙曲面和錐面近似圖 因此只要求得時延(時間差) ,就能近似求得聲源相對于兩傳聲器連線中點的方 向角。 3.1.2 傳聲器陣列幾何模型與分析 在聲源定位的研究過程中,雙傳聲器只能確定聲源在以一定角度為頂角的雙曲面 上,不能

40、確定聲源的具體位置。所以,想要探測出聲源的位置,必須擺放兩組甚至多 組傳聲器,從而組成傳聲器陣列。同時,定位的準確程度也取決于傳聲器的數(shù)量,在 經(jīng)過一定位置的擺放后,傳聲器的數(shù)量越多定位的精度也就越高。圖 3.3 就是一種由四 個傳聲器組成的典型傳聲器擺放方法。 圖3.3 四個傳聲器的定位擺放示意圖 可見,定位系統(tǒng)的成功與否與傳聲器的擺放有很大關系,傳聲器的數(shù)量會影響定 位的精確程度。 3.2 幾何定位方法 本文使用七個傳聲器組成的傳聲器陣列來實現(xiàn)聲源定位的仿真,傳聲器的分布如 圖3.4所示。其中,假定聲源S的坐標為(x0,y0,z0),傳聲器m2擺放在原點位置,其 坐標為(0,0,0) ;m

41、1和m3擺放在X軸上,坐標為(-a,0,0)和(a,0,0) ;m4和 m5擺放在Y軸上,坐標為(0,a,0)和(0,-a,0) ;m6和m7擺放在Z軸上,坐標為 (0,0,-a)和(0,0,a) ,聲源S到各傳聲器的距離分別為 d1,d2,d3,d4,d5,d6,d7(圖中只標示了d1,d2,d3) ??梢?,七個傳聲器覆蓋了 整個三維空間,等距的分布在原點、X軸、Y軸和Z軸上,這樣的布局方式,一方面嚴 密而一致,可以充分的接收聲源信號;另一方面呈幾何對稱關系的各傳聲器的擺放, 減少了很大部分的運算量,更高效的實現(xiàn)了對各個量之間的關系求解過程。 圖3.4 七個傳聲器的定位擺放示意圖 3.2.1

42、 數(shù)據(jù)采集方法 將七個傳聲器m1,m3,m4,m5,m6,m7放置于以m2為原點的三維直角坐標系 中,兩兩分布在X,Y,Z軸上,與原點m2的距離為a,a可以根據(jù)實際需要取值。聲源 發(fā)出的聲音信號以不同的時間傳達至各傳聲器,由于聲速c一定,所以根據(jù)傳聲器陣列 所獲得的時間差可以計算出聲源至各傳聲器的距離差。將采集得到的數(shù)據(jù)以數(shù)組的形 式保存,繼而進行下一步的運算與分析。 但是,由于本文只涉及到用計算機實現(xiàn)定位仿真,所以必須預先假定聲源坐標, 通過對假定坐標的運算得到聲源S到各傳聲器間的距離差,此距離差將作為“已知的測 量值”進行接下來的定位仿真,其過程舉例如下: 傳聲器至原點的間距a=20,聲源

43、S坐標x0=50,y0=-200,z0=-60,即S=(50,- 200,-60)。 3.2.2 聲音信號的處理 對聲音信號的處理過程分為三個環(huán)節(jié),首先通過幾何方法計算聲源到各傳聲器間 的距離差,然后通過已得的距離差對聲源位置進行計算,最后通過Matlab編程實現(xiàn)聲 源定位的仿真。 3.2.2.1 聲源到傳聲器間距離差的計算 根據(jù)兩點間距離公式,聲源S到m1的距離可表示為 d1= (3.7) 同理,聲源S到m2的距離可表示為 d2= (3.8) 所以得聲源到m1和m2的距離差 d12= (3.9) 在Matlab程序編寫時,可以使用cumsum函數(shù)實現(xiàn)d12的運算。以此類推,可以得到 聲源S到

44、各傳聲器的距離差d23,d24,d52,d13,d62,d27。 但是,由于聲源發(fā)出的聲波在傳播過程中受到外界環(huán)境中噪音、混音等多方面因 素影響,所以聲源到個傳聲器的實際距離差與計算值之間有一定程度上的偏差。為了 解決這個問題,在d23,d24,d52,d13,d62,d27的計算值的基礎上加上一個量“b”, b的值為一個標準差為k的數(shù)乘以一百個隨機正態(tài)分布樣本,可以用randn函數(shù)實現(xiàn)這一 過程。 3.2.2.2 聲源位置的計算與仿真 通過運算得到的聲源S至各傳聲器間的距離差可以確定聲源S的坐標。 首先,將d12,d23,d52,d24這四個距離差表達式聯(lián)立 (3.10) (3.11) (3

45、.12) (3.13) 可得 x=(-d242d23-d522d23-d52d232+2d23d122+d24d232+2d12d232-d242d12-d522d12 - d24d122+d52d122)-4(d24-d52+d12-d23)a (3.14) y=(-d242d23+d522d23-2d24d52+d52d232-d52d242+d24d232+d242d12- d522d12+d24d122+d52d122)-4(d24-d52+d12-d23)a (3.15) z=RootOf(4a2d123d52-4a2d242d122-4a2d123d24-4d242d122d522

46、+2d243d123+ d244d122-2d523d123+2d524d242+d524d232+d124d522+d522d234+d242d234+2_Z2, label=_L3)/ /2(d24-d52+d12-d23)a (3.16) 由于之前給x,y,z分別加上了一個k與一百個隨機正態(tài)分布樣本的乘積“b” ,所 以得到的x,y,z的值均為十行十列的矩陣,將這三個矩陣中的元素求平均值,得到 x,y,z,即估計出的聲源S的位置。求平均值的仿真過程可以通過reshape和mean函數(shù) 實現(xiàn)。 由(3.14) , (3.15) , (3.16)可見,以聲源S到X軸上的m1,m3和到Y(jié)軸上的

47、 m4,m5分別為距離差的方程組,得到的結(jié)果中,x,y的表達式均很簡單明了,可以直 接編寫Matlab程序,而z的表達式冗長復雜,對編寫程序造成很大的困難。并且,經(jīng)仿 真后得到的定位效果不佳,尤其當a的取值很小,z0的取值很大時,z0的估計值和實際 值誤差很大,例如取a=20,k=0.1,x0=100,y0=200,z0=7600時,聲源的估計坐標與實 際如圖3.5所示,其中紅色“+”為聲源S的實際位置,綠色“*”為聲源S的估計位置。 圖3.5 聲源估計坐標與實際坐標相差偏大 由于表達式(3.10) , (3.11) , (3.12) , (3.13)中所選取的傳聲器 m1,m2,m3,m4,

48、m5分別分布在X軸和Y軸上,所以在仿真實現(xiàn)過程中,x0和y0的 估計值較為準確,z0的估計值偏差很大,所以要做適當?shù)母倪M。 將d52,d24,d62,d27這四個距離差表達式聯(lián)立 (3.17) (3.18) (3.19) (3.20) 可得 x=RootOf(-4a2d273d52+2d27d243d522+4a2d24d273+2d274d24d62-2d524d27d24 - 2d273d62d242+8a2d27d62d242-2d623d27d242-2d623d24d272+8a2d622d24d52,label =L9)/ /2(- d27+d62-d52+d24)a (3.21)

49、 y=(-d242d62-d272d24+d27d242+2d52d242-d27d522-d272d52+2d522d24 + d62d522-d622d52-d24d622)/ /4(-d27+d62-d52+d24)a (3.22) z=(d242d62-d272d24+d27d242+d27d522+d272d52+d62d522-d622d52-2d272d62 - 2d622d27+d24d622)/ /4(-d27+d62-d52+d24)a (3.23) 此時,y與z的表達式一目了然,而x的表達式很冗長,其原理與以上一步相同。取 z的表達式(3.23)與(3.14),(3.15

50、)聯(lián)立,得到的x,y,z的表達式均很簡明。同時,由于 這三個表達式中的傳聲器覆蓋了X,Y,Z三個坐標軸,即整個空間,所以得到的聲源S 的估計坐標與實際坐標之間的誤差很小,同樣取 a=20,k=0.1,x0=100,y0=200,z0=7600,在仿真時兩點幾乎重合,仿真效果很理想。 如圖3.6所示,聲源S的實際位置與估計位置基本重合。 圖3.6 聲源S的實際位置與估計位置基本重合 3.3 程序測試與誤差分析 經(jīng)過對算法的多方面改善和合理的Matlab編程,仿真結(jié)果較為理想,能夠直觀的 觀察到聲源S的實際坐標與估計坐標基本吻合,達到了預期目標。測試過程如下: 采用的傳聲器擺放如圖3.4所示。假定

51、傳聲器間距a=20,傳聲器m2在原點。隨機產(chǎn) 生100個點,時延根據(jù)聲源位置和距離差方差的不同分八種情況測試。 (1)聲源在(50,200,5) ,距離差d的標準差k=0.1 (2)聲源在(50,200,5) ,距離差d的標準差k=0.4 (3)聲源在(700,200,5) ,距離差d的標準差k=0.1 (4)聲源在(700,200,5) ,距離差d的標準差k=0.4 (5)聲源在(-50,200,850) ,距離差d的標準差k=0.3 (6)聲源在(-50,200,850) ,距離差d的標準差k=0.7 (7)聲源在(700,-450,80) ,距離差d的標準差k=0.3 (8)聲源在(70

52、0,-450,80) ,距離差d的標準差k=0.7 測試結(jié)果如表3.1所示 表表3.1 基于時延基于時延(ITD)(ITD)算法的測試結(jié)果算法的測試結(jié)果 估計聲源位置和實際聲源位置的偏差估計聲源位置的標準差 mx-x0 my-y0 mz-z0kx ky kz 1 0.0202 0.0281 0.02030.9964 2.7950 0.9964 2 -0.4470 -0.9609 -0.26335.5216 10.2615 4.1356 4 6.6090 3.9920 5.059835.7284 20.1047 14.0354 5 2.6563 9.1424 5.38235.1587 46.96

53、91 33.5770 6 15.1982 31.8215 14.9926 16.0987 99.6033 69.8814 7 17.7979 -5.2140 0.549783.0877 33.0364 7.4006 8 -8.0194 13.5277 -6.3588177.3602 71.2193 16.6520 由表3.1的結(jié)果可以看出,隨著x0,y0,z0取值的變大,估計的聲源位置和實際聲 源位置的偏差會有不同程度的增加,而估計聲源位置的標準差的增加量較大,但在可 接受范圍內(nèi),仿真效果很理想。 即便如此,在仿真過程中仍存在一些不容忽視的問題。例如,當假定的聲源坐標 中有兩個坐標的數(shù)值相等時

54、,仿真圖中只出現(xiàn)“+” ,而沒有“*” ,如圖3.7即為當x0=- 200,y0=-200,z=-60時的仿真結(jié)果。圖中只顯示出了聲源的實際值,而我們所要仿真 的估計值卻沒有得到。 圖3.7 只顯示了聲源S的實際值而沒有仿真出估計值 之所以會出現(xiàn)這種結(jié)果是因為在算法的實現(xiàn)過程中某些表達式的分母部分出現(xiàn)了 值為零的情況。例如,當選取x0=-200,y0=-200,z=-60為假定聲源S坐標時,表達式 (3.14)的分母部分為 -4(d24-d52+d12-d23)a (3.24) 其中,d24=d23,d12=d52,所以表達式的值為零。在使用Matlab進行仿真時,由 于此時(3.24)的值無

55、法計算,所以不能得到相應的聲源S的估計坐標,無法實現(xiàn)仿真。 第四章 基于強度差異(IID)的方位估計 4.1 方法概述與分析 與上述基于時間差的方法不同,這種方法利用不同傳聲器接收到的來自同一個聲 源的聲音信號在強度上的差異實現(xiàn)聲源定位。為此,引入聲壓幅度比的概念,根據(jù)由 聲壓在傳聲器處產(chǎn)生的電壓輸出與對應聲源到傳聲器的距離兩者之間存在的關系導出 一個用于聲源定位的約束條件。每個傳聲器可導出一個這樣的約束條件,由這些約束 條件可確定出聲源的位置。它們既可以單獨使用,也可以和由基于時間差的方法導出 的約束條件一起使用。 為簡單起見,首先考慮二維平面上的聲源定位問題。如圖4.1所示,假設四個傳聲

56、器被等間距地排列在X軸上,其坐標分別為(-3a,0)、(-a,0)、(a,0)和(3a,0)。若聲 源位于S(x,y)點處,則聲源到四個傳聲器的距離分別可表為: (4.1) (4.2) (4.3) (4.4) 由關于聲波的相關知識可知,聲源在第i個傳聲器處產(chǎn)生的聲壓由下式給出, (4.5) 其中,為聲源在基準距離 處產(chǎn)生的聲壓,為聲源簡諧震動的角頻率,, 為 聲速,而。 根據(jù)傳聲器的特性,在第i個傳聲器處,由上述聲壓所產(chǎn)生的電壓輸出為: (4.6) 其中,為由第i個傳聲器的傳遞特性確定的參量, 為聲波在第i個傳聲器處的入射角。 如果四個傳聲器的傳遞特性完全相同(用H表示),則對其中任意兩個接收

57、信號和 而言,除幅度不同和存在一個固定的時間延遲之外,其波形是相同的。 圖4.1 平面上基于聲壓幅度比聲源定位示意圖 下面,導出與聲源定位有關的幾個參量。為此,以和之比,有 (4.7) 由式(4.5)和(4.6),知, (4.8) 這樣, (4.9) 類似的,在和之間,也存在相似的關系, (4.10) 將上述(4.9)、(4.10)兩式中左邊的項稱為電壓幅度比(亦稱聲壓幅度比,以下 簡稱聲壓幅比)。其值可由各傳聲器的實測值得到。 4.2 聲源方位估計的實現(xiàn) 實際的聲源定位是在三維空間內(nèi)進行的,因此,有必要將上述在二維情況下得到 的結(jié)果擴展到三維。二維到三維的擴展是簡單的。事實上,只要增加一組傳

58、聲器,并 相應地構(gòu)造一組聲壓幅比參量,得到類似于(4.9)和(4.10)所示的約束方程,然后 通過求解所得到的約束方程組即可獲得聲源的實際定位。 4.2.1 數(shù)據(jù)的采集 將六個傳聲器m1,m3,m4,m5,m6放置于以m2為原點的三維直角坐標系中,兩 兩分布在X,Y,Z軸上,其坐標分別為m1(a,0,0),m2(-2a,0,0), m3(0,3a,0),m4(0,-4a,0),m5(0,0,3a),m6(0,0,-4a),a可以根 據(jù)實際需要取值,如圖4.2所示。聲源發(fā)出的聲音信號以不同的強度傳達至各傳聲器, 根據(jù)傳聲器陣列所獲得的聲音強度差異可以計算出聲源至各傳聲器的距離。將采集得 到的數(shù)據(jù)

59、以數(shù)組的形式保存,繼而進行下一步的運算與分析。 圖4.2 六個傳聲器的定位擺放示意圖 與上一章相同,由于本文只涉及到用計算機實現(xiàn)定位仿真,所以必須預先假定聲 源坐標,通過對假定坐標的運算得到聲源S到各傳聲器間的聲壓幅比,此比值將作為 “已知的測量值”進行接下來的定位仿真。 4.2.2 聲壓幅比的計算方法 假設聲源的坐標S(x0,y0,z0)為已知量, S到傳聲器 m1,m2,m3,m4,m5,m6的距離分別為r1,r2,r3,r4,r5,r6,第i個傳聲器上接收 到的聲壓幅為,其值可以由各傳聲器的實測值得到,經(jīng)過3.1.2小節(jié)的推理可以得 到: (4.11) (4.12) (4.13) (4.

60、14) (4.15) 而r1,r2,r3,r4,r5,r6的值可以由兩點間的距離公式求出,所以可以很容易的計 算出e21,e43,e31,e65,e51的實際值。將此實際值作為已知量從而去仿真出聲源S的位 置并得到S的估計坐標正是本文的目的所在。 在編寫Matlab程序時,可以通過cumsum函數(shù)和簡單的賦值語句實現(xiàn)以上的過程。 4.2.3 聲源位置的計算與仿真 由于聲源發(fā)出的聲波在傳播過程中受到外界環(huán)境中噪音、混音等多方面因素影響, 而傳聲器所接收到的聲壓幅度同時還會受到空間中的物體、空氣阻力等其他條件的干 擾,所以傳聲器接收到的聲壓幅度與真實值會存在一定的偏差,并且其差值受外界因 素影響的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論