版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、基于麥克風(fēng)陣列的語音增強(qiáng)算法概述論文導(dǎo)讀:應(yīng)用了陣列信號(hào)處理技術(shù)的麥克風(fēng)陣列能夠充分利用語音信號(hào)的空時(shí)信息。逐漸成為強(qiáng)噪聲環(huán)境中語音增強(qiáng)的研究熱點(diǎn)。陣列信號(hào)處理,基于麥克風(fēng)陣列的語音增強(qiáng)算法概述。關(guān)鍵詞:麥克風(fēng)陣列,陣列信號(hào)處理,語音增強(qiáng)(一)引言在日常生活和工作中,語音通信是人與人之間互相傳遞信息溝通不可缺少的方式。近年來,雖然數(shù)據(jù)通信得到了迅速發(fā)展,但是語音通信仍然是現(xiàn)階段的主流,并且在通信行業(yè)中占主導(dǎo)地位。在語音通信中,語音信號(hào)不可避免地會(huì)受到來自周圍環(huán)境和傳輸媒介的外部噪聲、通信設(shè)備的內(nèi)部噪聲及其他講話者的干擾。這些干擾共同作用,最終使聽者獲得的語音不是純凈的原始語音,而是被噪聲污染過
2、的帶噪聲語音,嚴(yán)重影響了雙方之間的交流。應(yīng)用了陣列信號(hào)處理技術(shù)的麥克風(fēng)陣列能夠充分利用語音信號(hào)的空時(shí)信息,具有靈活的波束控制、較高的空間分辨率、高的信號(hào)增益與較強(qiáng)的抗干擾能力等特點(diǎn),逐漸成為強(qiáng)噪聲環(huán)境中語音增強(qiáng)的研究熱點(diǎn)。美國、德國、法國、意大利、日本、香港等國家和地區(qū)許多科學(xué)家都在開展這方面的研究工作,并且已經(jīng)應(yīng)用到一些實(shí)際的麥克風(fēng)陣列系統(tǒng)中,這些應(yīng)用包括視頻會(huì)議、語音識(shí)別、車載聲控系統(tǒng)、大型場所的記錄會(huì)議和助聽裝置等。本文將介紹各種麥克風(fēng)陣列語音增強(qiáng)算法的基本原理,并總結(jié)各個(gè)算法的特點(diǎn)及存在的局限性。(二)常見麥克風(fēng)陣列語音增強(qiáng)方法1基于固定波束形成的麥克風(fēng)陣列語音增強(qiáng)固定波束形成技術(shù)是最
3、簡單最成熟的一種波束形成技術(shù)。論文大全,陣列信號(hào)處理。論文大全,陣列信號(hào)處理。1985年美國學(xué)者Flanagan提出采用延時(shí)-相加(Delay-and-Sum)波束形成方法進(jìn)行麥克風(fēng)陣列語音增強(qiáng),該方法通過對(duì)各路麥克風(fēng)接收到的信號(hào)添加合適的延時(shí)補(bǔ)償,使得各路輸出信號(hào)在某一方向上保持同步,使在該方向的入射信號(hào)獲得最大增益1。此方法易于實(shí)現(xiàn),但要想獲取較高的噪聲抑制能力需要增加麥克風(fēng)數(shù)目,并且對(duì)非相干噪聲沒有抑制能力,環(huán)境適應(yīng)性差,因此,實(shí)際中很少單獨(dú)使用。后來出現(xiàn)的微分麥克風(fēng)陣列(DifferentialMicrophone Arrays),超方向麥克風(fēng)陣列(Superairective Mic
4、rophoneArrays)和固定頻率波束形成(Frequency-InvariantBeamformers)技術(shù)也屬于固定波束形成。2基于自適應(yīng)波束形成器的麥克風(fēng)陣列語音增強(qiáng)自適應(yīng)波束形成是現(xiàn)在廣泛使用的一類麥克風(fēng)陣列語音增強(qiáng)方法。最早出現(xiàn)的自適應(yīng)波束形成算法是1972年由Frost提出的線性約束最小方差(LinearlyConstrained Minimum Variance, LCMV)自適應(yīng)波束形成器2。其基本思想是在某方向有用信號(hào)的增益一定的前提下,使陣列輸出信號(hào)的功率最小。在線性約束最小方差自適應(yīng)波束形成器的基礎(chǔ)上,1982年Griffiths和Jim提出了廣義旁瓣消除器(Gene
5、ralizedSidelobe Canceller, GSC)3,成為了許多算法的基本框架(圖1)。圖1 廣義旁瓣消除器的基本結(jié)構(gòu)廣義旁瓣消除器是麥克風(fēng)陣列語音增強(qiáng)應(yīng)用最廣泛的技術(shù),帶噪聲的語音信號(hào)同時(shí)通過自適應(yīng)通道和非自適應(yīng)通道,自適應(yīng)通道中的阻塞矩陣將有用信號(hào)濾除后產(chǎn)生僅包含多通道噪聲參考信號(hào),自適應(yīng)濾波器根據(jù)這個(gè)參考信號(hào)得到噪聲估計(jì),最后由這個(gè)被估計(jì)的噪聲抵消非自適應(yīng)通道中的噪聲分量,從而得到有用的純凈語音信號(hào)。如果噪聲源的數(shù)目比麥克風(fēng)數(shù)目少,自適應(yīng)波束法能得到很好的性能。但是隨著干擾數(shù)目的增加和混響的增強(qiáng),自適應(yīng)濾波器的降噪性能會(huì)逐漸降低。3基于后置濾波的麥克風(fēng)陣列語音增強(qiáng)1988年Z
6、elinski將維納濾波器應(yīng)用在了麥克風(fēng)陣列延時(shí)相加波束形成的輸出端,進(jìn)一步提高了語音信號(hào)的降噪效果,提出了基于后置濾波的麥克風(fēng)陣列語音增強(qiáng)方法4(圖2)?;诤笾脼V波的方法在對(duì)非相干噪聲抑制方面,具有良好的效果,還能夠在一定程度上適應(yīng)時(shí)變的聲學(xué)環(huán)境。它的基本原理是:假設(shè)各麥克風(fēng)接收到的目標(biāo)信號(hào)相同,接收到的噪聲信號(hào)獨(dú)立同分布,信號(hào)和噪聲不相關(guān),根據(jù)噪聲特性,依據(jù)某一準(zhǔn)則實(shí)時(shí)更新濾波器權(quán)系數(shù),對(duì)所接收到數(shù)據(jù)進(jìn)行濾波,從而達(dá)到語音增強(qiáng)的目的。圖2 結(jié)合后置濾波的固定波束形成器后置濾波方法存在以下不足:首先,算法的性能受到時(shí)延誤差的影響,使增強(qiáng)后的語音信號(hào)有一定失真。其次,該方法對(duì)方向性的強(qiáng)干擾抑
7、制效果不佳。后置濾波方法極少單獨(dú)使用,常與其他方法聯(lián)合使用。文獻(xiàn)5研究了后置濾波和通用旁瓣對(duì)消器結(jié)合使用的問題。論文大全,陣列信號(hào)處理。4基于近場波束形成的麥克風(fēng)陣列語音增強(qiáng)當(dāng)聲源位于麥克風(fēng)陣列近場(即陣列的入射波是球面波)情況下,聲波的波前彎曲率不能被忽略,如果仍然把入射聲波作為平面波考慮,采用常規(guī)的波束形成方法來拾取語音信號(hào),那么麥克風(fēng)陣列系統(tǒng)輸出效果會(huì)很不理想。解決這個(gè)問題,最直接的方法就是根據(jù)聲源位置和近場聲學(xué)的特性,對(duì)入射聲波進(jìn)行近場補(bǔ)償6,但是這種方法需要已知聲源位置,這在實(shí)際應(yīng)用中難以是滿足。由于近場聲學(xué)的復(fù)雜性,目前有關(guān)近場波束形成麥克風(fēng)陣列語音增強(qiáng)方法的研究相對(duì)較少。5基于子
8、空間的麥克風(fēng)陣列語音增強(qiáng)子空間方法的基本思想是計(jì)算出信號(hào)的自相關(guān)矩陣或協(xié)方差矩陣,然后對(duì)其進(jìn)行奇異值分解,將帶噪聲語音信號(hào)劃分為有用信號(hào)子空間和噪聲子空間,利用有用信號(hào)子空間對(duì)信號(hào)進(jìn)行重構(gòu),從而得到增強(qiáng)后的信號(hào)。由Asano等提出的基于相干子空間的麥克風(fēng)陣列語音增強(qiáng)方法是一種典型的子空間方法7。該方法首先將語音信號(hào)劃分到不同頻帶,然后在每個(gè)頻帶再利用空間信息,進(jìn)行子空間處理?;谧涌臻g的麥克風(fēng)陣列語音增強(qiáng)方法雖然降噪性受噪聲場是否相關(guān)影響較小,在相干和非相干噪聲場中均有一定的消噪效果,但是由于計(jì)算量較大,實(shí)現(xiàn)實(shí)時(shí)處理具有一定困難。6基于盲源分離的麥克風(fēng)陣列語音增強(qiáng)在很多實(shí)際應(yīng)用中,信號(hào)源情況和
9、信道的傳遞參數(shù)都很難獲取,盲源分離技術(shù)(BlindSource Separation, BSS)就是在這種需求下提出的。盲源分離是根據(jù)輸入源信號(hào)和干擾的統(tǒng)計(jì)特性,從傳感器陣列接收到的混合信號(hào)中提取出各個(gè)獨(dú)立分量的過程。法國學(xué)者Herault.J和Jutten.C在信源與信道先驗(yàn)條件未知的情況下,利用人工神經(jīng)網(wǎng)絡(luò)分離出了有用信號(hào),開創(chuàng)了盲源分離的先河8。目前為止,已有許多學(xué)者將盲源分離技術(shù)應(yīng)用于麥克風(fēng)陣列語音增強(qiáng)。論文大全,陣列信號(hào)處理。經(jīng)過二十多年來國內(nèi)外學(xué)者的不斷深入研究,盲源分離技術(shù)已經(jīng)取得了巨大的進(jìn)步和發(fā)展,對(duì)盲信號(hào)分離問題的研究己經(jīng)從瞬時(shí)混迭模型擴(kuò)展成為線性卷積模型和非線性瞬時(shí)混迭模型
10、,但是由于盲源分離仍屬一個(gè)新興的研究方向,理論上還不成熟,這類方法一般運(yùn)算量大,全局收斂性和漸進(jìn)穩(wěn)定性有待加強(qiáng),距離實(shí)際應(yīng)用有一段距離。7其他方法90年代以來,一些學(xué)者將各種信號(hào)處理算法與麥克風(fēng)陣列技術(shù)相融合,各種語音增強(qiáng)算法不斷涌現(xiàn),諸如倒譜分析、小波變換、神經(jīng)網(wǎng)絡(luò)、語音模型等方法已經(jīng)在語音信號(hào)處理領(lǐng)域得到應(yīng)用。雖然這些方法從不同角度對(duì)語音增強(qiáng)系統(tǒng)的性能進(jìn)行了不同程度的改善,但大多計(jì)算量龐大,不適合時(shí)變性較強(qiáng)的聲學(xué)環(huán)境,而且在需要實(shí)時(shí)處理的場合,對(duì)硬件的要求也將大大提高。論文大全,陣列信號(hào)處理。近些年國內(nèi)一些高校,如清華大學(xué),大連理工大學(xué),電子科技大學(xué),西安電子科技大學(xué)等也做了一些關(guān)于麥克風(fēng)
11、陣列技術(shù)的研究工作,取得了一定的研究成果。張麗艷等提出一種改進(jìn)的麥克風(fēng)陣列倒譜域語音去混響方法,改善混響環(huán)境下的語音質(zhì)量9。崔瑋瑋等提出一種基于一階差分麥克風(fēng)陣列的實(shí)時(shí)噪聲譜估計(jì)和抵消方法,提高輸出信噪比的同時(shí)降低了計(jì)算量10。曾慶寧等將陣列交叉串?dāng)_信號(hào)的自適應(yīng)噪聲抵消方法應(yīng)用于麥克風(fēng)陣列語音增強(qiáng),適用于在多種噪聲環(huán)境中實(shí)時(shí)實(shí)現(xiàn)11。(三)結(jié)論語音信號(hào)增強(qiáng)是諸如智能控制、辦公自動(dòng)化、多媒體消費(fèi)品等領(lǐng)域的關(guān)鍵技術(shù)之一,將麥克風(fēng)陣列技術(shù)應(yīng)用于語音增強(qiáng),能夠取得傳統(tǒng)單麥克風(fēng)難以達(dá)到的增強(qiáng)效果。論文大全,陣列信號(hào)處理。語音信號(hào)作為一種寬帶的非平穩(wěn)信號(hào),在傳輸過程中不可避免地會(huì)受到各種噪聲的干擾,所以采
12、用麥克風(fēng)陣列系統(tǒng)時(shí)需滿足在一個(gè)比較寬的聲域范圍抑制各種噪聲干擾,減少語音的失真,同時(shí)也要降低系統(tǒng)成本和計(jì)算時(shí)間,以達(dá)到較好的實(shí)時(shí)性和實(shí)用性。在實(shí)際應(yīng)用中應(yīng)根據(jù)具體的使用環(huán)境的噪聲特性,設(shè)計(jì)合適的麥克風(fēng)陣列結(jié)構(gòu),選擇最佳的算法及其具體的實(shí)現(xiàn)形式?!緟⒖嘉墨I(xiàn)】1Flanagan J L, JohnstonD J, Zahn R, et al. Computer-steered microphone arrays for sound transductionin large roomsJ. Journal of Acoustical Society of American. 1985, 78(5).
13、2O. L. Frost. Analgorithm for linearly-constrained adaptive array processingJ. Proc. IEEE.1972, 60(8).3L. J. Griffiths, C. W.Jim. An alternative approach to linearly constrained adaptive beamformingJ.IEEE Trans. On Antennas and Propagation. 1982, 30(1).4Zelinski R. A microphone array with adaptive p
14、ost-filtering for noise reductionin reverberant roomsA. IEEE International Conference on Acoustics, Speech andSignal Processing, USA: 1988.5S. Cannot and I. Cohen. Speech enhancement based on the general transfer function GSC andpostfilteringJ. IEEE Trans. Speech and Audio Processing, 2004, 12(6).6K
15、halil F, Jullien J P, Crilloire A. Microphone array for sound pickup inteleconference systemsJ. Audio Engineering Society, 1994, 42( 9).7Asano F, Hayamizu S. Speech enhancement using css-based array processingA.IEEE International Conference on Acoustics, Speech and Signal Processing. Germany: 1997.8Jutten C and Herault J. Blind separation of sources,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 杭州高端住宅買賣合同定制
- 國際展覽館管家服務(wù)協(xié)議
- 建筑外墻施工合同:領(lǐng)先版
- 2024年度信息系統(tǒng)運(yùn)維服務(wù)與管理合同
- 2024年建筑勞務(wù)分包價(jià)款協(xié)議
- 職業(yè)培訓(xùn)機(jī)構(gòu)師資聘用合同模板
- 2024年度區(qū)塊鏈游戲開發(fā)與應(yīng)用合同
- 漁業(yè)養(yǎng)殖物資員招聘協(xié)議
- 燃?xì)庑孤?yīng)急處理規(guī)程
- 體育場館節(jié)能保溫施工協(xié)議
- 04S519小型排水構(gòu)筑物(含隔油池)圖集
- 2024年執(zhí)法資格考試題庫(附答案)
- 運(yùn)用PDCA循環(huán)提高全麻患者體溫檢測率
- 工程施工人員安全教育培訓(xùn)【共55張課件】
- 計(jì)算機(jī)系統(tǒng)的組成--完整版PPT課件
- 全程制程合格率統(tǒng)計(jì)表
- (完整版)鍋爐拆除施工方案
- (精選)城鎮(zhèn)燃?xì)獍踩珯z查表
- 英語才藝表演評(píng)分標(biāo)準(zhǔn)
- 餐飲操作流程圖
- 腦卒中綠色通道救治流程
評(píng)論
0/150
提交評(píng)論