語言清晰度客觀評(píng)價(jià)方法_第1頁
語言清晰度客觀評(píng)價(jià)方法_第2頁
語言清晰度客觀評(píng)價(jià)方法_第3頁
語言清晰度客觀評(píng)價(jià)方法_第4頁
語言清晰度客觀評(píng)價(jià)方法_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

語言清晰度客觀評(píng)價(jià)方法一一對(duì)IEC60268-16(4.0版,2011.6)規(guī)范的解讀祝培生;莫方朔;路曉東;胡沈健【摘要】語言清晰度(或可懂度)是音質(zhì)評(píng)價(jià)的重要指標(biāo).但語言清晰度客觀評(píng)價(jià)定義復(fù)雜,修正系數(shù)眾多,測(cè)量結(jié)果也容易產(chǎn)生誤差,因此一直沒有得到有效推廣.結(jié)合最新發(fā)布的IEC60268-16(4.0版,2011.6)規(guī)范,介紹其推薦的語言清晰度客觀評(píng)價(jià)方法即語言傳輸指數(shù)STI以及其他幾種常見的客觀評(píng)價(jià)方法,并對(duì)他們的適用條件加以說明.期刊名稱】《電聲技術(shù)》年(卷),期】2012(036)005【總頁數(shù)】6頁(P40-45)【關(guān)鍵詞】語言清晰度;客觀評(píng)價(jià)方法;語言傳輸指數(shù)【作者】祝培生;莫方朔;路曉東;胡沈健【作者單位】大連理工大學(xué)建筑與藝術(shù)學(xué)院,遼寧大連116023;同濟(jì)大學(xué)聲學(xué)研究所,上海200092;大連理工大學(xué)建筑與藝術(shù)學(xué)院,遼寧大連116023;大連理工大學(xué)建筑與藝術(shù)學(xué)院,遼寧大連116023【正文語種】中文【中圖分類】TU112.1引言語言清晰度(或可懂度)是音質(zhì)評(píng)價(jià)的重要指標(biāo),可以用來評(píng)價(jià)廳堂或擴(kuò)聲系統(tǒng)的聲音傳輸質(zhì)量。對(duì)語言清晰度的評(píng)價(jià),主要包括主觀評(píng)價(jià)和客觀評(píng)價(jià)。主觀評(píng)價(jià)是利用發(fā)音人和聽音人組成的隊(duì)伍,以一定的發(fā)話語言聲級(jí)和語速,在現(xiàn)場(chǎng)測(cè)聽并記錄由發(fā)音人按實(shí)驗(yàn)字表發(fā)出的字,然后加以統(tǒng)計(jì)分析得到語言清晰度得分。這種方法不需要太多實(shí)驗(yàn)設(shè)備,能夠較準(zhǔn)確反映出語言的傳輸質(zhì)量,但需要較多的人力物力,同時(shí)受發(fā)音人、測(cè)試隊(duì)伍個(gè)人條件的影響,測(cè)試結(jié)果存在一定的不確定性??陀^評(píng)價(jià)是依據(jù)對(duì)一些物理量的測(cè)量,然后將數(shù)據(jù)加以分析得到語言清晰度參量。對(duì)語言清晰度進(jìn)行客觀評(píng)價(jià)的嘗試從二十世紀(jì)二三十年代就開始了,隨后在四五十年代提出了第一個(gè)客觀評(píng)價(jià)參量:清晰度指數(shù)AI[1](ArticulationIndex,近年來發(fā)展成SII[2],SpeechIntelligibilityIndex),到二十世紀(jì)七十年代,又提出了語言傳輸指數(shù)STI[3](SpeechTransmissionIndex)和輔音損失比%ALcons[4](ArticulationLossofConsonants)。這些參量的提出,為語言清晰度的客觀評(píng)價(jià)提供了可能,雖然也都有各自的局限性。STI方法因?yàn)槟軌蜉^好反應(yīng)混響時(shí)間、信噪比對(duì)語言清晰度的影響,具有一定的抗系統(tǒng)失真能力,自從1973年提出來之后,被IEC標(biāo)準(zhǔn)采納并推薦。雖然STI方法也有一定的局限性,但被證明在很多條件下是非常有效的,因此為國(guó)際社會(huì)普遍接受,并在建筑聲學(xué)領(lǐng)域得到廣泛應(yīng)用。但語言清晰度客觀評(píng)價(jià)定義復(fù)雜,修正系數(shù)眾多,測(cè)量結(jié)果也容易產(chǎn)生誤差,這些因素在一定程度上影響了語言清晰度作為一個(gè)通用的控制參量而被推廣與普及。本文結(jié)合新發(fā)布的IEC60268-16規(guī)范[5],介紹其推薦的語言清晰度客觀評(píng)價(jià)方法即語言傳輸指數(shù)STI以及其他幾種常見的客觀評(píng)價(jià)方法,并對(duì)他們的適用條件加以說明。IEC60268-16推薦語言清晰度客觀評(píng)價(jià)方法在廳堂內(nèi)聽講話時(shí),不論是否使用擴(kuò)聲系統(tǒng).從講演者到聽眾形成的傳輸過程中由于房間內(nèi)存在回聲、混響和環(huán)境噪聲等影響,會(huì)使接收到的語言信號(hào)與原信號(hào)相比呈現(xiàn)不同程度的模糊,從而導(dǎo)致語言可懂度的降低。二十世紀(jì)七十年代末,Houtgast和Steeneken[3]從室內(nèi)聲學(xué)中引入調(diào)制轉(zhuǎn)移函數(shù)(Modulationtransferfunction,MTF)概念,提出通過測(cè)量聲音傳輸系統(tǒng)的調(diào)制轉(zhuǎn)移函數(shù)來得到語言傳輸指數(shù)STI°IEC60268-16規(guī)范就是將語言傳輸指數(shù)STI作為評(píng)價(jià)語言清晰度的客觀方法,自從發(fā)布以來,已經(jīng)經(jīng)過了4次修訂(1988;1998;2003;2011),一些成熟、可靠的研究成果也不斷被吸收,并在最新的修訂版中體現(xiàn)出來。2011修訂的主要目的就是要提供一個(gè)完整、確定并具有廣泛適用性STI技術(shù)標(biāo)準(zhǔn),以促進(jìn)STI的推廣與應(yīng)用。STI方法的提出是基于在實(shí)驗(yàn)中發(fā)現(xiàn),語言信號(hào)的波動(dòng)攜帶著語言清晰度相關(guān)的信息。詞、句子的聲學(xué)特征會(huì)導(dǎo)致語言信號(hào)的波動(dòng)起伏。這些起伏也是語言的基本組成部分,稱之為調(diào)制,可以用調(diào)制頻率來表達(dá)。為與語言的語速對(duì)應(yīng),典型的調(diào)制頻率從0.5~16Hz,通過計(jì)算調(diào)制頻率對(duì)應(yīng)于語言頻譜各頻帶上的振幅降低程度,就可以得到調(diào)制轉(zhuǎn)移值,見圖1。假設(shè)發(fā)出測(cè)試信號(hào)的調(diào)制指數(shù)是mi(振幅深度),接收信號(hào)的調(diào)制指數(shù)是mo(振幅深度),fm為調(diào)制頻率,調(diào)制頻率幅值深度的降低程度由調(diào)制轉(zhuǎn)移函數(shù)m(fm)來表達(dá),定義為然后得到表觀信噪比SNReff,定義為圖1調(diào)制轉(zhuǎn)移函數(shù)示意圖表觀信噪比的值被界定在±15dB之間,小于-15dB時(shí),取值-15dB,大于15dB時(shí),取值15dB,每個(gè)頻帶對(duì)語言清晰度都有一個(gè)貢獻(xiàn)權(quán)重,用這些權(quán)重把各個(gè)頻帶的平均表觀信噪比加起來,就得到了整個(gè)聲傳輸系統(tǒng)的STI值。IEC60268-16推薦的STI測(cè)量方法有兩種:基于信號(hào)調(diào)制的直接測(cè)量方法和基于房間脈沖響應(yīng)的間接測(cè)量方法。這兩種方法前期包絡(luò)信號(hào)的獲取方式不同,在后期處理和系數(shù)修正方面基本是一樣的。在計(jì)算出STI之前,這兩種方法都要經(jīng)過絕對(duì)語言識(shí)別閾值(門限)修正、聽音屏蔽因子修正、權(quán)重因子和冗余因子修正等。2.1直接測(cè)量方法STI直接測(cè)量方法就是對(duì)聲傳輸系統(tǒng)發(fā)出特定的測(cè)試信號(hào),通過分析并識(shí)別接收到的信號(hào),得到聲傳輸系統(tǒng)的STI,根據(jù)STI值就能夠確定語言清晰度。通常,測(cè)試信號(hào)包含7個(gè)從125Hz~8kHz的倍頻帶噪聲載波信號(hào),這些載波信號(hào)對(duì)應(yīng)于語言的頻譜,每個(gè)噪聲載波信號(hào)用一個(gè)或多個(gè)調(diào)制頻率調(diào)制,這些調(diào)制頻率對(duì)應(yīng)于不同詞、句子的聲學(xué)特征導(dǎo)致的語言信號(hào)的波動(dòng)起伏。為與語言的語速對(duì)應(yīng),典型的調(diào)制頻率從0.5~16Hz按照1/3倍頻程分布,共14個(gè)。完整的STI是經(jīng)過對(duì)7x14=98個(gè)調(diào)制數(shù)據(jù)點(diǎn)(調(diào)制轉(zhuǎn)移矩陣)的綜合計(jì)算得到的。直接測(cè)量方法流程如圖2所示。圖2直接測(cè)量法流程示意圖間接測(cè)量方法根據(jù)Schroeder提出的方法[6],調(diào)制轉(zhuǎn)移函數(shù)m(fm)能夠通過聲傳輸系統(tǒng)的脈沖響應(yīng)計(jì)算出來,計(jì)算公式為式中,m(fm)是調(diào)制轉(zhuǎn)移函數(shù);h(t)是房間脈沖響應(yīng);fm是調(diào)制頻率;SNR是信噪比。間接測(cè)量方法的流程如圖3所示。STIPA,STITELSTIPA和STITEL是從STI衍生出來的兩個(gè)簡(jiǎn)化形式,為減少工作量,只采用部分?jǐn)?shù)據(jù)點(diǎn)進(jìn)行計(jì)算得到。STIPA是對(duì)每個(gè)載波用兩個(gè)調(diào)制頻率調(diào)制,-共14個(gè)調(diào)制數(shù)據(jù)點(diǎn),見表1。STITEL是對(duì)每個(gè)載波用一個(gè)預(yù)先指定的頻率調(diào)制,共有7個(gè)調(diào)制數(shù)據(jù)點(diǎn),見表2。圖3間接測(cè)量法流程示意圖表1STIPA的調(diào)制頻率?表2STITEL的調(diào)制頻率?STI,STIPA,STITEL的適用范圍及限制直接測(cè)試方法中,STIPA和STITEL測(cè)試過程相對(duì)簡(jiǎn)單,應(yīng)用較多,STI很少用在實(shí)際測(cè)試中,大多用在研究方面。在測(cè)量具有聲學(xué)和電聲畸變聲系統(tǒng)的語言傳輸質(zhì)量時(shí),這些方法是客觀和有效的。然而,由于其對(duì)語言信號(hào)的簡(jiǎn)化處理,不同方法的應(yīng)用應(yīng)受到限制,任何超出適用范圍的應(yīng)用可能導(dǎo)致不準(zhǔn)確的結(jié)果。STI,STIPA,STITEL的適用范圍見表3。不論直接或間接的STI方法,對(duì)于在時(shí)域和頻域的線性失真影響都有很好的考慮。但在非線性失真的情況下,直接測(cè)量方法對(duì)特定的非線性失真有一定的適應(yīng)能力,比如削波失真,而非直接方法只能用在線性時(shí)不變系統(tǒng)中。表4給出了STI各方法對(duì)于不同失真情況的使用限制概覽。表3STI,STIPA,STITEL適用范圍注:表中++表示非常適合;+表示適合;-表示不適合。?表4STI不同測(cè)量方法適用于各失真情況概覽?.5STI值與語言傳輸質(zhì)量的對(duì)應(yīng)關(guān)系IEC60268-16規(guī)定STI值與語言傳輸質(zhì)量(主觀評(píng)價(jià))的對(duì)應(yīng)關(guān)系見表5、表6。表5STI值與語言傳輸質(zhì)量分類的對(duì)應(yīng)關(guān)系0.380.420.460.500.540.580.620.660.700.74?表6語言傳輸質(zhì)量分類及適用范圍注:表中PA為PublicAddressSystem,VA為VoiceAlarmSystem。?其他客觀評(píng)價(jià)方法3.1清晰度指數(shù)AI[1-2,7]AI是第一個(gè)將聲學(xué)測(cè)量同語言清晰度聯(lián)系起來的客觀參量。AI的理論基礎(chǔ)是:語言信號(hào)的信息內(nèi)容在頻率上分布是不均勻的,語言信號(hào)各個(gè)頻帶對(duì)語言清晰度的貢獻(xiàn)是相互獨(dú)立的。這樣就可以設(shè)計(jì)一個(gè)頻率連接的20頻帶模型,這些頻帶內(nèi)的語言信號(hào)對(duì)AI具有同等貢獻(xiàn),并且語言信號(hào)的可懂度是各個(gè)頻帶語言信號(hào)的貢獻(xiàn)之和。綜合這些研究成果,美國(guó)國(guó)家標(biāo)準(zhǔn)局在1969年發(fā)布了ANSIS3.5-1969“Methodsforthecalculationofthespeechintelligibilityindex”,隨著實(shí)驗(yàn)材料從無意義的音節(jié)變?yōu)閱卧~、單句,AI最后發(fā)展為語言可懂度指數(shù)SII,因此美國(guó)國(guó)家標(biāo)準(zhǔn)局在1997年對(duì)AI進(jìn)行修正,發(fā)布了ANSIS3.5-1997“Methodsforthecalculationofthespeechintelligibilityindex”。通過修訂,標(biāo)準(zhǔn)的普遍性得到擴(kuò)展,對(duì)應(yīng)于不同使用要求提出了幾種不同的測(cè)量方法,并將建筑聲學(xué)的自由聲場(chǎng)情況加以考慮。SII指數(shù)范圍從0到1,0代表沒有,1代表100%,與STI相比,SII不能直接測(cè)量,需要通過測(cè)量很多與語言信號(hào)相關(guān)頻率的信噪比,然后才能計(jì)算得到。由于SII值是根據(jù)實(shí)驗(yàn)結(jié)果的經(jīng)驗(yàn)推導(dǎo),物理理論基礎(chǔ)不夠,同時(shí)不能充分反映噪聲和混響聯(lián)合作用時(shí)的影響,因此用在短混響的地方比較合適,比如通信系統(tǒng)。?2輔音損失比%ALcons[4,7]輔音損失比與STI測(cè)量技術(shù)在同一時(shí)期提出。有趣的是,輔音損失比的提出主要是—種預(yù)測(cè)技術(shù)(輔音損失比不能通過精確地聲學(xué)測(cè)量得到),而STI主要是一種測(cè)量方法,目標(biāo)并不是去預(yù)測(cè)。輔音損失比的原始公式由Peutz提出,在1971年被Klein修正到現(xiàn)在大家熟悉的公式[8],以適用于擴(kuò)聲系統(tǒng)。在一個(gè)布置了擴(kuò)聲系統(tǒng)的房間里面,%AL-cons公式為式中,D為接收者到揚(yáng)聲器的距離;T60為混響時(shí)間;Q為揚(yáng)聲器的指向性因子;V為房間的容積。輔音損失比越小,語言清晰度越好。從這個(gè)公式可以看到,混響空間里面的清晰度與空間容積和揚(yáng)聲器的指向性因子Q成正比(也就是說當(dāng)其他參量為常數(shù)時(shí),這兩個(gè)參量的增長(zhǎng)會(huì)改善語言清晰度);清晰度和混響時(shí)間以及距離的平方成反比。這個(gè)方法的主要限制就是只使用倍頻程中心頻率2kHz來預(yù)計(jì),而對(duì)于語言來說,不同講話者的指向型圖案并不相同。同時(shí)由于這個(gè)方法是基于統(tǒng)計(jì)聲學(xué),在混響時(shí)間較短時(shí)就變得不太準(zhǔn)確。3.3RASTI[5](RoomAcousticalSpeechTransmissionIndex)室內(nèi)聲學(xué)語言傳輸指數(shù)(又稱快速語言傳輸指數(shù))是一種簡(jiǎn)化的STI方法,為簡(jiǎn)化測(cè)量與計(jì)算,從7個(gè)載波頻帶中篩選了2個(gè)載波頻帶(500Hz,用4個(gè)調(diào)制頻率調(diào)制;2000Hz,用5個(gè)調(diào)制頻率調(diào)制),適用于評(píng)價(jià)沒有擴(kuò)聲系統(tǒng)的人與人之間的溝通。由于RASTI測(cè)試方法應(yīng)用于擴(kuò)聲系統(tǒng)的局限性,替代方法STIPA在2001年被提出,STIPA采用一個(gè)稀疏矩陣,測(cè)試125~8000Hz的全部7個(gè)載波頻帶。需要指出的是,在IEC60268-16標(biāo)準(zhǔn)中,RASTI現(xiàn)已作廢。3.4直達(dá)與混響聲能比、早后期聲能比[7]用直達(dá)和混響聲能比或更精確的直達(dá)和早期反射聲同后期反射和混響聲能比來預(yù)測(cè)建筑和廳堂的語言清晰度,也已經(jīng)使用了很多年。在區(qū)分什么是直達(dá)聲、早期反射聲和后期反射聲方面,有很多不同的時(shí)間分割點(diǎn)。最常用的測(cè)量方法為C50,是前50ms聲能和整個(gè)脈沖響應(yīng)聲能的比;也有用C35測(cè)量的,就是用前35ms的聲能;C7,這么早的一個(gè)分割時(shí)間產(chǎn)生一個(gè)基本上是純的直達(dá)和反射聲能比。在分割比例上并沒有明確的說法,但是通常認(rèn)為,要達(dá)到好的語言清晰度(在廳堂或類似的大空間里面),大約+4dB的C50是比較有利的,這也應(yīng)該是設(shè)計(jì)的目標(biāo)。聲能比測(cè)試時(shí)經(jīng)常采用1000Hz或一系列頻率的平均,這個(gè)方法沒有考慮背景噪聲,應(yīng)用在擴(kuò)聲系統(tǒng)時(shí)也受到限制。Bradley[9]把C50和C80概念拓展到U50和U80,U意味著有用的能量,這些嘗試也是進(jìn)一步了解分析語言清晰度的有用工具IEC標(biāo)準(zhǔn)用于評(píng)價(jià)漢語語言清晰度的探討IEC60268-16推薦的兩種STI測(cè)量方法(直接法和間接法)本質(zhì)上是一致的,都要經(jīng)過語言頻譜濾波、絕對(duì)語言識(shí)別閾值(門限)修正、聽音屏蔽因子修正、權(quán)重因子和冗余因子修正。由于語言頻譜濾波以及各個(gè)修正系數(shù)都是以英語(荷蘭語)為實(shí)驗(yàn)對(duì)象得到的,STI客觀評(píng)價(jià)值與英語的清晰度主觀評(píng)價(jià)得分在IEC60268-16規(guī)定中體現(xiàn)出良好的一致性。但這種主、客觀對(duì)應(yīng)關(guān)系并不一定適用于漢語的評(píng)價(jià)。國(guó)內(nèi)已有研究表明漢語普通話單音節(jié)清晰度受混響的影響與英語清晰度受混響的影響程度有明顯的不同[10]。造成這種不同的主要原因是漢語與英語的標(biāo)準(zhǔn)頻譜不同;為獲得各種修正系數(shù)而進(jìn)行的實(shí)驗(yàn)也都對(duì)應(yīng)于特定的語言頻譜;同時(shí)使用漢語與英語這兩種不同語言的主體在感受和理解上也存在文化差異。因此如果用IEC60268-16推薦的這套體系直接評(píng)價(jià)漢語的語言清晰度,就需要對(duì)語言頻譜、絕對(duì)語言識(shí)別閾值、聽音屏蔽因子、權(quán)重因子、冗余因子等進(jìn)行漢語頻譜的修正,而不是直接翻譯使用。發(fā)展及展望隨著IEC60268-16第4次修訂的發(fā)布,語言清晰度客觀評(píng)價(jià)指標(biāo)STI在今后必將作為一個(gè)通用的而在較高頻段,IIR均衡器幅度響應(yīng)平坦度比全極點(diǎn)模型均衡器效果好,這證實(shí)了本文所采用的基于IIR模型的均衡器具有保持其他頻帶響應(yīng)平坦的特性。結(jié)論針對(duì)傳統(tǒng)的基于全極點(diǎn)模型的均衡器所存在的缺陷性,筆者提出了基于IIR模型的均衡算法,并通過仿真和測(cè)量實(shí)驗(yàn)對(duì)比了兩種均衡算法的性能,實(shí)驗(yàn)結(jié)果表明,基于IIR模型的均衡器,能夠?qū)崿F(xiàn)空間多個(gè)位置的房間幅度響應(yīng)均衡,且不會(huì)影響其余頻帶的幅度響應(yīng)。參考文獻(xiàn)[1]馬登永?關(guān)于全數(shù)字揚(yáng)聲器系統(tǒng)的討論[J].電聲技術(shù),2011,35(1):22-27.[2]沐永生?壓電揚(yáng)聲器的后腔設(shè)計(jì)與實(shí)驗(yàn)[J].電聲技術(shù),2010,34(11):32-35?[3]蔡野鋒?數(shù)字揚(yáng)聲器系統(tǒng)中失配整形技術(shù)的設(shè)計(jì)與實(shí)現(xiàn)[J].電聲技術(shù),2011,35(2):20-23?[4]BRANNMARKLJ?Robustloudspeakerequalizationbasedonposition-independentexcessphasemodeling[C]//IEEEInt?Conf?Acoustics,Speech,SignalProcessing,385-388,LasVegas:[s.n.],2008:385-388?[5]WILSONR?Equalizationofloudspeakerdriveunitsconsideringbothonandoff-axisresponses[J].J.AudioEng.Soc?,1991,39:127-139.[6

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論