基于麥克風(fēng)陣列的語音增強(qiáng)算法概述

上傳人：d*** IP屬地：江西上傳時(shí)間：2021-10-14 格式：DOCX 頁數(shù)：8 大小：18.09KB 積分：12 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩3頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、基于麥克風(fēng)陣列的語音增強(qiáng)算法概述論文導(dǎo)讀：應(yīng)用了陣列信號(hào)處理技術(shù)的麥克風(fēng)陣列能夠充分利用語音信號(hào)的空時(shí)信息。逐漸成為強(qiáng)噪聲環(huán)境中語音增強(qiáng)的研究熱點(diǎn)。陣列信號(hào)處理，基于麥克風(fēng)陣列的語音增強(qiáng)算法概述。關(guān)鍵詞：麥克風(fēng)陣列，陣列信號(hào)處理，語音增強(qiáng)（一）引言在日常生活和工作中，語音通信是人與人之間互相傳遞信息溝通不可缺少的方式。近年來，雖然數(shù)據(jù)通信得到了迅速發(fā)展，但是語音通信仍然是現(xiàn)階段的主流，并且在通信行業(yè)中占主導(dǎo)地位。在語音通信中，語音信號(hào)不可避免地會(huì)受到來自周圍環(huán)境和傳輸媒介的外部噪聲、通信設(shè)備的內(nèi)部噪聲及其他講話者的干擾。這些干擾共同作用，最終使聽者獲得的語音不是純凈的原始語音，而是被噪聲污染過

2、的帶噪聲語音，嚴(yán)重影響了雙方之間的交流。應(yīng)用了陣列信號(hào)處理技術(shù)的麥克風(fēng)陣列能夠充分利用語音信號(hào)的空時(shí)信息，具有靈活的波束控制、較高的空間分辨率、高的信號(hào)增益與較強(qiáng)的抗干擾能力等特點(diǎn)，逐漸成為強(qiáng)噪聲環(huán)境中語音增強(qiáng)的研究熱點(diǎn)。美國、德國、法國、意大利、日本、香港等國家和地區(qū)許多科學(xué)家都在開展這方面的研究工作，并且已經(jīng)應(yīng)用到一些實(shí)際的麥克風(fēng)陣列系統(tǒng)中，這些應(yīng)用包括視頻會(huì)議、語音識(shí)別、車載聲控系統(tǒng)、大型場所的記錄會(huì)議和助聽裝置等。本文將介紹各種麥克風(fēng)陣列語音增強(qiáng)算法的基本原理，并總結(jié)各個(gè)算法的特點(diǎn)及存在的局限性。（二）常見麥克風(fēng)陣列語音增強(qiáng)方法1基于固定波束形成的麥克風(fēng)陣列語音增強(qiáng)固定波束形成技術(shù)是最

3、簡單最成熟的一種波束形成技術(shù)。論文大全，陣列信號(hào)處理。論文大全，陣列信號(hào)處理。1985年美國學(xué)者Flanagan提出采用延時(shí)-相加（Delay-and-Sum）波束形成方法進(jìn)行麥克風(fēng)陣列語音增強(qiáng)，該方法通過對(duì)各路麥克風(fēng)接收到的信號(hào)添加合適的延時(shí)補(bǔ)償，使得各路輸出信號(hào)在某一方向上保持同步，使在該方向的入射信號(hào)獲得最大增益1。此方法易于實(shí)現(xiàn)，但要想獲取較高的噪聲抑制能力需要增加麥克風(fēng)數(shù)目，并且對(duì)非相干噪聲沒有抑制能力，環(huán)境適應(yīng)性差，因此，實(shí)際中很少單獨(dú)使用。后來出現(xiàn)的微分麥克風(fēng)陣列（DifferentialMicrophone Arrays），超方向麥克風(fēng)陣列（Superairective Mic

4、rophoneArrays）和固定頻率波束形成（Frequency-InvariantBeamformers）技術(shù)也屬于固定波束形成。2基于自適應(yīng)波束形成器的麥克風(fēng)陣列語音增強(qiáng)自適應(yīng)波束形成是現(xiàn)在廣泛使用的一類麥克風(fēng)陣列語音增強(qiáng)方法。最早出現(xiàn)的自適應(yīng)波束形成算法是1972年由Frost提出的線性約束最小方差（LinearlyConstrained Minimum Variance, LCMV）自適應(yīng)波束形成器2。其基本思想是在某方向有用信號(hào)的增益一定的前提下，使陣列輸出信號(hào)的功率最小。在線性約束最小方差自適應(yīng)波束形成器的基礎(chǔ)上，1982年Griffiths和Jim提出了廣義旁瓣消除器（Gene

5、ralizedSidelobe Canceller, GSC）3，成為了許多算法的基本框架（圖1）。圖1 廣義旁瓣消除器的基本結(jié)構(gòu)廣義旁瓣消除器是麥克風(fēng)陣列語音增強(qiáng)應(yīng)用最廣泛的技術(shù)，帶噪聲的語音信號(hào)同時(shí)通過自適應(yīng)通道和非自適應(yīng)通道，自適應(yīng)通道中的阻塞矩陣將有用信號(hào)濾除后產(chǎn)生僅包含多通道噪聲參考信號(hào)，自適應(yīng)濾波器根據(jù)這個(gè)參考信號(hào)得到噪聲估計(jì)，最后由這個(gè)被估計(jì)的噪聲抵消非自適應(yīng)通道中的噪聲分量，從而得到有用的純凈語音信號(hào)。如果噪聲源的數(shù)目比麥克風(fēng)數(shù)目少，自適應(yīng)波束法能得到很好的性能。但是隨著干擾數(shù)目的增加和混響的增強(qiáng)，自適應(yīng)濾波器的降噪性能會(huì)逐漸降低。3基于后置濾波的麥克風(fēng)陣列語音增強(qiáng)1988年Z

6、elinski將維納濾波器應(yīng)用在了麥克風(fēng)陣列延時(shí)相加波束形成的輸出端，進(jìn)一步提高了語音信號(hào)的降噪效果，提出了基于后置濾波的麥克風(fēng)陣列語音增強(qiáng)方法4（圖2）?；诤笾脼V波的方法在對(duì)非相干噪聲抑制方面，具有良好的效果，還能夠在一定程度上適應(yīng)時(shí)變的聲學(xué)環(huán)境。它的基本原理是：假設(shè)各麥克風(fēng)接收到的目標(biāo)信號(hào)相同，接收到的噪聲信號(hào)獨(dú)立同分布，信號(hào)和噪聲不相關(guān)，根據(jù)噪聲特性，依據(jù)某一準(zhǔn)則實(shí)時(shí)更新濾波器權(quán)系數(shù)，對(duì)所接收到數(shù)據(jù)進(jìn)行濾波，從而達(dá)到語音增強(qiáng)的目的。圖2 結(jié)合后置濾波的固定波束形成器后置濾波方法存在以下不足：首先，算法的性能受到時(shí)延誤差的影響，使增強(qiáng)后的語音信號(hào)有一定失真。其次，該方法對(duì)方向性的強(qiáng)干擾抑

7、制效果不佳。后置濾波方法極少單獨(dú)使用，常與其他方法聯(lián)合使用。文獻(xiàn)5研究了后置濾波和通用旁瓣對(duì)消器結(jié)合使用的問題。論文大全，陣列信號(hào)處理。4基于近場波束形成的麥克風(fēng)陣列語音增強(qiáng)當(dāng)聲源位于麥克風(fēng)陣列近場（即陣列的入射波是球面波）情況下，聲波的波前彎曲率不能被忽略，如果仍然把入射聲波作為平面波考慮，采用常規(guī)的波束形成方法來拾取語音信號(hào)，那么麥克風(fēng)陣列系統(tǒng)輸出效果會(huì)很不理想。解決這個(gè)問題，最直接的方法就是根據(jù)聲源位置和近場聲學(xué)的特性，對(duì)入射聲波進(jìn)行近場補(bǔ)償6，但是這種方法需要已知聲源位置，這在實(shí)際應(yīng)用中難以是滿足。由于近場聲學(xué)的復(fù)雜性，目前有關(guān)近場波束形成麥克風(fēng)陣列語音增強(qiáng)方法的研究相對(duì)較少。5基于子

8、空間的麥克風(fēng)陣列語音增強(qiáng)子空間方法的基本思想是計(jì)算出信號(hào)的自相關(guān)矩陣或協(xié)方差矩陣，然后對(duì)其進(jìn)行奇異值分解，將帶噪聲語音信號(hào)劃分為有用信號(hào)子空間和噪聲子空間，利用有用信號(hào)子空間對(duì)信號(hào)進(jìn)行重構(gòu)，從而得到增強(qiáng)后的信號(hào)。由Asano等提出的基于相干子空間的麥克風(fēng)陣列語音增強(qiáng)方法是一種典型的子空間方法7。該方法首先將語音信號(hào)劃分到不同頻帶，然后在每個(gè)頻帶再利用空間信息，進(jìn)行子空間處理?；谧涌臻g的麥克風(fēng)陣列語音增強(qiáng)方法雖然降噪性受噪聲場是否相關(guān)影響較小，在相干和非相干噪聲場中均有一定的消噪效果，但是由于計(jì)算量較大，實(shí)現(xiàn)實(shí)時(shí)處理具有一定困難。6基于盲源分離的麥克風(fēng)陣列語音增強(qiáng)在很多實(shí)際應(yīng)用中，信號(hào)源情況和

9、信道的傳遞參數(shù)都很難獲取，盲源分離技術(shù)（BlindSource Separation, BSS）就是在這種需求下提出的。盲源分離是根據(jù)輸入源信號(hào)和干擾的統(tǒng)計(jì)特性，從傳感器陣列接收到的混合信號(hào)中提取出各個(gè)獨(dú)立分量的過程。法國學(xué)者Herault.J和Jutten.C在信源與信道先驗(yàn)條件未知的情況下，利用人工神經(jīng)網(wǎng)絡(luò)分離出了有用信號(hào)，開創(chuàng)了盲源分離的先河8。目前為止，已有許多學(xué)者將盲源分離技術(shù)應(yīng)用于麥克風(fēng)陣列語音增強(qiáng)。論文大全，陣列信號(hào)處理。經(jīng)過二十多年來國內(nèi)外學(xué)者的不斷深入研究，盲源分離技術(shù)已經(jīng)取得了巨大的進(jìn)步和發(fā)展，對(duì)盲信號(hào)分離問題的研究己經(jīng)從瞬時(shí)混迭模型擴(kuò)展成為線性卷積模型和非線性瞬時(shí)混迭模型

10、，但是由于盲源分離仍屬一個(gè)新興的研究方向，理論上還不成熟，這類方法一般運(yùn)算量大，全局收斂性和漸進(jìn)穩(wěn)定性有待加強(qiáng)，距離實(shí)際應(yīng)用有一段距離。7其他方法90年代以來，一些學(xué)者將各種信號(hào)處理算法與麥克風(fēng)陣列技術(shù)相融合，各種語音增強(qiáng)算法不斷涌現(xiàn)，諸如倒譜分析、小波變換、神經(jīng)網(wǎng)絡(luò)、語音模型等方法已經(jīng)在語音信號(hào)處理領(lǐng)域得到應(yīng)用。雖然這些方法從不同角度對(duì)語音增強(qiáng)系統(tǒng)的性能進(jìn)行了不同程度的改善，但大多計(jì)算量龐大，不適合時(shí)變性較強(qiáng)的聲學(xué)環(huán)境，而且在需要實(shí)時(shí)處理的場合，對(duì)硬件的要求也將大大提高。論文大全，陣列信號(hào)處理。近些年國內(nèi)一些高校，如清華大學(xué)，大連理工大學(xué)，電子科技大學(xué)，西安電子科技大學(xué)等也做了一些關(guān)于麥克風(fēng)

11、陣列技術(shù)的研究工作，取得了一定的研究成果。張麗艷等提出一種改進(jìn)的麥克風(fēng)陣列倒譜域語音去混響方法，改善混響環(huán)境下的語音質(zhì)量9。崔瑋瑋等提出一種基于一階差分麥克風(fēng)陣列的實(shí)時(shí)噪聲譜估計(jì)和抵消方法，提高輸出信噪比的同時(shí)降低了計(jì)算量10。曾慶寧等將陣列交叉串?dāng)_信號(hào)的自適應(yīng)噪聲抵消方法應(yīng)用于麥克風(fēng)陣列語音增強(qiáng)，適用于在多種噪聲環(huán)境中實(shí)時(shí)實(shí)現(xiàn)11。（三）結(jié)論語音信號(hào)增強(qiáng)是諸如智能控制、辦公自動(dòng)化、多媒體消費(fèi)品等領(lǐng)域的關(guān)鍵技術(shù)之一，將麥克風(fēng)陣列技術(shù)應(yīng)用于語音增強(qiáng)，能夠取得傳統(tǒng)單麥克風(fēng)難以達(dá)到的增強(qiáng)效果。論文大全，陣列信號(hào)處理。語音信號(hào)作為一種寬帶的非平穩(wěn)信號(hào)，在傳輸過程中不可避免地會(huì)受到各種噪聲的干擾，所以采

12、用麥克風(fēng)陣列系統(tǒng)時(shí)需滿足在一個(gè)比較寬的聲域范圍抑制各種噪聲干擾，減少語音的失真，同時(shí)也要降低系統(tǒng)成本和計(jì)算時(shí)間，以達(dá)到較好的實(shí)時(shí)性和實(shí)用性。在實(shí)際應(yīng)用中應(yīng)根據(jù)具體的使用環(huán)境的噪聲特性，設(shè)計(jì)合適的麥克風(fēng)陣列結(jié)構(gòu)，選擇最佳的算法及其具體的實(shí)現(xiàn)形式?！緟⒖嘉墨I(xiàn)】1Flanagan J L, JohnstonD J, Zahn R, et al. Computer-steered microphone arrays for sound transductionin large roomsJ. Journal of Acoustical Society of American. 1985, 78(5).

13、2O. L. Frost. Analgorithm for linearly-constrained adaptive array processingJ. Proc. IEEE.1972, 60(8).3L. J. Griffiths, C. W.Jim. An alternative approach to linearly constrained adaptive beamformingJ.IEEE Trans. On Antennas and Propagation. 1982, 30(1).4Zelinski R. A microphone array with adaptive p

14、ost-filtering for noise reductionin reverberant roomsA. IEEE International Conference on Acoustics, Speech andSignal Processing, USA: 1988.5S. Cannot and I. Cohen. Speech enhancement based on the general transfer function GSC andpostfilteringJ. IEEE Trans. Speech and Audio Processing, 2004, 12(6).6K

15、halil F, Jullien J P, Crilloire A. Microphone array for sound pickup inteleconference systemsJ. Audio Engineering Society, 1994, 42( 9).7Asano F, Hayamizu S. Speech enhancement using css-based array processingA.IEEE International Conference on Acoustics, Speech and Signal Processing. Germany: 1997.8Jutten C and Herault J. Blind separation of sources,

人人文庫> 全部分類> 行業(yè)資料 > 管理策劃

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

基于麥克風(fēng)陣列的語音增強(qiáng)算法概述

文檔簡介

溫馨提示

最新文檔

評(píng)論

基于麥克風(fēng)陣列的語音增強(qiáng)算法概述

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔