



下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、 基于仿生學(xué)和SoPC的嵌入式聲源定位器 梁志毅,高金山,董文杰 時(shí)間:2008年05月06日 字 體: 大 中 小 關(guān)鍵詞:<"cblue" " target='_blank'>定位器<"cblue" " target=&
2、#39;_blank'>語音識別<"cblue" " target='_blank'>端點(diǎn)檢測<"cblue" " target='_blank'>聲源定位<"cblue" " target='_blank'>三路 摘要: 論述了基于人體仿生學(xué)和嵌入式軟核的可編程片上系
3、統(tǒng)SoPC的研究與實(shí)現(xiàn)。關(guān)鍵詞: 仿生學(xué) SoPC 數(shù)字信號并行處理 嵌入式<"cblue" " title="聲源定位">聲源定位器眾所周知,人的聽覺系統(tǒng)可以對所聽到的特定聲音來源進(jìn)行定位。所謂的“雞尾酒會(huì)效應(yīng)”1就是指人耳可以在一定的噪音背景下惟一地關(guān)注一個(gè)指定的聲音。結(jié)合嵌入式系統(tǒng)小巧靈活的特點(diǎn)和日益強(qiáng)大的功能,實(shí)現(xiàn)這樣的一種仿生聲源<"cblue" " title="定位器">定位器,可以有效地對聽障人士的日常生活起到幫助作用,例如躲避突發(fā)的危險(xiǎn)狀況、日常的人際交
4、往等。更廣泛地看,這種系統(tǒng)可應(yīng)用于機(jī)器人的聽覺系統(tǒng)、保安保密設(shè)施等諸多領(lǐng)域。為與基于ASIC技術(shù)的聲源定位器2區(qū)別,本文基于SoPC技術(shù),在Altera的stratix系統(tǒng)平臺(tái)上,充分利用SoPC靈活的可重用設(shè)計(jì)特性和FPGA的信號并行處理能力,用一個(gè)MIC陣列,模擬人耳的聽覺系統(tǒng),實(shí)現(xiàn)聲源定位器。并利用其良好的擴(kuò)展性,進(jìn)一步將系統(tǒng)從單CPU架構(gòu)擴(kuò)展至雙CPU架構(gòu),加入了<"cblue" " title="語音識別">語音識別的功能(本文只重點(diǎn)論述聲源定位的研究與實(shí)現(xiàn))。在一個(gè)相對安靜的房間里對定位器進(jìn)行測試,在5米的直徑范圍內(nèi),可
5、以較準(zhǔn)確地通過LCD輸出聲源的位置坐標(biāo)。同時(shí),對于簡單的短語,經(jīng)過訓(xùn)練之后,系統(tǒng)能夠在不超過1秒的時(shí)間內(nèi)產(chǎn)生指定的響應(yīng),如在LCD上顯示相應(yīng)的文字、振動(dòng)器振動(dòng)報(bào)警等。1 人耳聽覺模型的基本原理在一個(gè)簡單的人耳聽覺系統(tǒng)模型中,聲源定位可以描述為:(1)從各種不同頻率的聲音中解析發(fā)現(xiàn)特定的聲音,如從一定的環(huán)境噪聲背景中找到特定聲源所發(fā)出的聲音。(2)獲得聲音到達(dá)MIC陣列的端點(diǎn),即<"cblue" " title="端點(diǎn)檢測">端點(diǎn)檢測。(3)聽覺系統(tǒng)根據(jù)聲音到達(dá)兩耳的時(shí)間差,判斷出聲源的方向和位置。根據(jù)上述人耳聽覺的機(jī)理,所設(shè)計(jì)的聲源
6、定位器需要解決聲音的噪音過濾、端點(diǎn)檢測及方位距離算法等問題。(1)聲音的噪音過濾和端點(diǎn)檢測。對于噪音的簡單過濾和聲音的端點(diǎn)檢測,可以通過常用的“雙門限法”實(shí)現(xiàn)。本文利用Matlab下的Simulink作為原理驗(yàn)證工具。驗(yàn)證無誤后,將對應(yīng)的FIR數(shù)字濾波器的階數(shù)和系數(shù)直接填入到Quartus II提供的FIR IP Core模塊中參數(shù)化,再在VHDL用戶模塊例化,即可完成FPGA中的語音信號預(yù)處理模塊的搭建工作。(2)聲源定位算法。系統(tǒng)中共使用了3個(gè)MIC,分別位于水平面上邊長為20cm的等邊三角形的三個(gè)頂點(diǎn)。借助于端點(diǎn)檢測,可獲取聲音到達(dá)各個(gè)MIC時(shí)對應(yīng)的不同計(jì)數(shù)值n(對應(yīng)有t=n/f,其中t
7、為聲音傳播時(shí)間,f為采樣頻率),從而得到時(shí)延估計(jì)。經(jīng)過前端的信號預(yù)處理工作,再充分利用聲源傳播中的先驗(yàn)信息,基于空間幾何知識建立的算法模型,定位精度基本上達(dá)到了應(yīng)用要求。MIC陣列擺放如圖1所示。因?yàn)樵撛O(shè)備主要是針對聾啞人的語音輔助開發(fā)的,所以通常情況下聲源是與MIC陣列確定的平面共面或近似共面的。在近似共面的情形時(shí),將數(shù)學(xué)模型擴(kuò)展到三維的情況,即MIC陣列確定一個(gè)平面,而聲源不在該平面內(nèi)。此時(shí),以原點(diǎn)為中心,假設(shè)聲源位于一個(gè)橫截面直徑為310m的環(huán)狀空間中,且聲源到MIC陣列平面(橫截面)的垂直距離不超過±1m??沈?yàn)證,聲源到原點(diǎn)的距離與聲源在MIC陣列平面投影點(diǎn)到原點(diǎn)的距離,二者
8、偏差僅在4%左右。所以,為便于計(jì)算和構(gòu)建模型,可以假設(shè)聲源與MIC陣列共面。2 系統(tǒng)架構(gòu)系統(tǒng)基本架構(gòu)由Avalon Bus和兩個(gè)NIOS II CPU組成。NIOS II是基于哈佛結(jié)構(gòu)的RISC通用嵌入式處理器軟核,能與用戶邏輯相結(jié)合。該處理器具有32位指令集、32位數(shù)據(jù)通道和可配置的指令及數(shù)據(jù)緩沖。本文選用標(biāo)準(zhǔn)型內(nèi)核搭建系統(tǒng)。利用外圍ADC電路并通過IIS總線,<"cblue" " title="三路">三路MIC并行地將各自采集到的語音信號傳入AD Receiver模塊。該模塊是利用VHDL構(gòu)建的用戶外設(shè),用以橋接Avalon總
9、線和ADC,同時(shí)完成三路語音信號的并行預(yù)處理。單路信號處理過程如下所述:將ADC傳入的串行信號轉(zhuǎn)換成16位的并行信號送入FIFO1。每一個(gè)并行信號即一個(gè)采樣點(diǎn),定義每2 400個(gè)點(diǎn)為一幀,選取FIFO1容量為16bit×2560=5KB。存儲(chǔ)點(diǎn)數(shù)達(dá)到一幀后,將該幀逐點(diǎn)送入短時(shí)能量分析模塊、短時(shí)過零率分析模塊和FIFO2,計(jì)數(shù)器同時(shí)計(jì)數(shù)。FIFO2的容量與FIFO1相同。如果該幀沒有達(dá)到短時(shí)能量和過零率的閾值觸發(fā)要求,則該幀為無效幀;如果只達(dá)到過零率的觸發(fā)要求,則該幀為有效幀,暫時(shí)保留在FIFO2中,其后一幀若短時(shí)能量閾值觸發(fā)則回溯前一幀定位端點(diǎn),否則兩幀都舍棄;如果某幀同時(shí)達(dá)到短時(shí)能
10、量和過零率的觸發(fā)要求,則聲音起始端點(diǎn)即為該幀內(nèi)部觸發(fā)過零率閾值的那一點(diǎn)。在這里,設(shè)置短時(shí)能量的觸發(fā)閾值EH為0.01,約為平穩(wěn)狀態(tài)時(shí)能量值的5倍;短時(shí)過零率公式中修正閾值T為0.01,當(dāng)短時(shí)過零率幅值發(fā)生大于3倍的突變時(shí),則認(rèn)為過零率閾值觸發(fā)。另外,為便于能量閾值觸發(fā)后的回溯查尋,設(shè)置了同樣為5KB的FIFO3、FIFO4,分別存儲(chǔ)短時(shí)過零率和短時(shí)能量的數(shù)據(jù)。將取得的聲音端點(diǎn)值傳至CPU1進(jìn)行定位計(jì)算。CPU1利用Avalon總線與CPU2及系統(tǒng)其他模塊進(jìn)行信息交換和處理。系統(tǒng)硬件結(jié)構(gòu)如圖2、圖3所示。?NIOS II提供了良好的系統(tǒng)擴(kuò)展性和可編輯性,當(dāng)系統(tǒng)引入語音識別功能使性能要求提高時(shí),在
11、不改變原有系統(tǒng)架構(gòu)的基礎(chǔ)上,通過增加共享內(nèi)存互斥鎖和共享內(nèi)存,系統(tǒng)即可方便快速地?cái)U(kuò)展成為雙CPU架構(gòu)。其中定義CPU1對前段采集的數(shù)據(jù)進(jìn)行定位處理,將處理過的數(shù)據(jù)傳入CPU2,由CPU2完成識別及LCD顯示的功能,如圖3所示。3 實(shí)驗(yàn)在一個(gè)相對安靜的房間中對系統(tǒng)進(jìn)行了測試。房間大小約為(8×6×3)m3,環(huán)境噪聲以持續(xù)的音樂模擬,約為4050dB,待檢測聲音約為6570dB。人發(fā)聲的位置在圖1所示的平面坐標(biāo)系中選擇。圖4顯示了實(shí)驗(yàn)中某個(gè)MIC的聲音預(yù)處理波形。聲音信號從左往右依次是你好、危險(xiǎn)、早上好三句話,其中利用了223階的FIR線性濾波器實(shí)現(xiàn)信號處理功能,其窗函數(shù)為矩形
12、窗。從圖4中可以明顯看出:因?yàn)楸尘耙魳泛驼f話前后的呼吸,原始聲音波形中出現(xiàn)明顯的干擾信號(背景噪音),但經(jīng)過短時(shí)能量分析后,短時(shí)能量分析圖中的干擾部分已經(jīng)被過濾掉。實(shí)驗(yàn)證明,將短時(shí)能量分析與短時(shí)過零率結(jié)合,可以較好地檢測到聲音的端點(diǎn)。利用FPGA可并行處理的特性,實(shí)時(shí)監(jiān)控三路MIC的聲音處理信號,比較各路聲音端點(diǎn)對應(yīng)的不同n值,得出三個(gè)時(shí)間差,代入定位計(jì)算公式,從而定位聲源位置。本文論述了基于人體仿生學(xué)和NIOS II的聲源定位器。系統(tǒng)分為語音信號采集預(yù)處理和定位計(jì)算兩個(gè)基本部分及語音識別一個(gè)擴(kuò)展部分。整個(gè)系統(tǒng)在實(shí)現(xiàn)過程中:(1)利用FPGA的并行特性實(shí)現(xiàn)了三路語音信號的并行采集和處理;(2)
13、利用嵌入式的軟核NIOS II搭建了雙CPU結(jié)構(gòu)。其中CPU1實(shí)現(xiàn)了對聲源定位的算法,CPU2實(shí)現(xiàn)了對語音識別及響應(yīng)的功能;(3)利用NIOS II提供的硬件互斥鎖機(jī)制實(shí)現(xiàn)了CPU間的良好同步通信。從該系統(tǒng)的研究與實(shí)現(xiàn)中可以看到,SoPC的多核結(jié)構(gòu)在低功耗、小面積、低成本的前提下提供了實(shí)現(xiàn)強(qiáng)大功能的可能。在聲源定位、語音識別的基礎(chǔ)上,結(jié)合語音合成技術(shù),可為聾啞人提供更完善的幫助。而較高的性價(jià)比也將使這樣的系統(tǒng)進(jìn)入更多更廣泛的生活工作應(yīng)用領(lǐng)域。參考文獻(xiàn)1 Jie Huang,Ohnishi N,Sugie N.A Biomimetic System for Localization and Separation of Multi-ple Sound Sources.Instrumentation and Measure-ment.IEEE Transactions,1995;44(3)2 Stanacevic M,Cauwenberghs G.Micorpower Gra-dient Flow Acoustic Localizer.Circuits and Sys-tems I:Regular Papers,IEEE Transactions onseealso Circ
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 電子測量儀器軟件算法分析與設(shè)計(jì)考核試卷
- 電信企業(yè)文化建設(shè)與品牌塑造考核試卷
- 氣動(dòng)元件的綠色制造技術(shù)考核試卷
- 堿性溶液的化學(xué)分析考核試卷
- 油氣倉儲(chǔ)與能源科技創(chuàng)新發(fā)展戰(zhàn)略考核試卷
- 2025年-吉林省安全員-C證考試題庫
- 2025年-天津建筑安全員C證考試(專職安全員)題庫附答案
- 浙江卷-2025屆高考生物學(xué)全真模擬卷(有解析)
- 2025年江西省安全員C證考試(專職安全員)題庫附答案
- 2025年-福建省建筑安全員知識題庫及答案
- 智能倉儲(chǔ)管理實(shí)戰(zhàn)手冊
- 中考英語時(shí)態(tài)專項(xiàng)練習(xí)題(附答案)
- 提高住院病歷完成及時(shí)性持續(xù)改進(jìn)(PDCA)
- 氣門搖臂軸支座的機(jī)械加工工藝及夾具設(shè)計(jì)畢業(yè)設(shè)計(jì)
- 企業(yè)職工代表任命協(xié)議書
- 地下管線測繪及數(shù)據(jù)處理
- 附件1:中國聯(lián)通動(dòng)環(huán)監(jiān)控系統(tǒng)B接口技術(shù)規(guī)范(V3.0)
- 衛(wèi)生院B超、心電圖室危急值報(bào)告制度及流程
- 醫(yī)療器械經(jīng)營公司-年度培訓(xùn)計(jì)劃表
- 校園青年志愿者培訓(xùn)(服務(wù)禮儀講解)
- 教練員教學(xué)質(zhì)量信譽(yù)考核表
評論
0/150
提交評論