下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
語音信號非線性分析和處理
1語音信號產(chǎn)生的時代特征。自然現(xiàn)象在現(xiàn)代語音信號為非線性和非穩(wěn)定。語音信號具有的漸變不穩(wěn)定性可通過成熟的自適應方法處理,而其非線性性質卻一直在傳統(tǒng)語音處理的發(fā)展趨勢中未得到應有的重視。近十幾年來,非線性理論中的混沌和分形信號處理為人們提供了分析自然現(xiàn)象的全新方法。人們發(fā)現(xiàn),自然界中的大量現(xiàn)象是混沌的,或是近似混沌的。嚴格的聲學及空氣動力學理論已證明,語音信號的產(chǎn)生中存在混沌的機制。文中主要討論語音信號非線性分析和處理,特別是基于混沌的、應用神經(jīng)網(wǎng)絡的非線性處理。2信號的動力學模型從信號處理的角度檢查信號是否為混沌的,首先必須從信號的物理背景出發(fā)探討;其次,必須實驗驗證:①信號是有界的;②信號的分形維有限,且通常不是整數(shù),這是不規(guī)則信號區(qū)別于噪聲的根本點之一;③信號的最大Lyapunov指數(shù)是正的,這決定了信號對初始條件的敏感依賴;④信號是局部可預測的,特別地,信號的動力學系統(tǒng)可以用確定性模型重建。針對語音信號的非線性特性和混沌特性,從物理背景和實驗兩方面出發(fā),已有許多研究。文獻運用空氣動力學理論表明,語音信號的產(chǎn)生是一個非線性過程。文獻詳細討論了語音信號混沌性的產(chǎn)生機制,即,語音的產(chǎn)生過程中可能在聲道內形成湍流,而湍流自身就是一種混沌。文獻用實驗證明語音存在非線性性,即語音濁音LPC分析殘差中的基音復合成分是高度非線性的。文獻從逆的角度思考,構造信號為語音信號所含的完全線性的確定性部分,和原始語音信號比較,發(fā)現(xiàn)原始語音中具有構造信號所缺少的信息,這證明了原始語音中存在確定性的非線性因子。同時,大量關于語音信號分形維和Lyapunov指數(shù)的統(tǒng)計實驗(下文討論)表明,語音信號符合最大Lyapunov指數(shù)為正的和分形維有限的要求;而語音信號顯然是局部可預測的。因此,語音信號中存在有混沌因素。這是文中將混沌及分形理論引入語音信號處理的基礎。3計算方法的選取通過分析系統(tǒng)相空間,可了解系統(tǒng)的動力學特性。但通常對實際系統(tǒng),僅能知道表現(xiàn)為時間序列形式的系統(tǒng)觀察值。因此,從時間序列重構系統(tǒng)相空間具有重要意義。Takens提出了解決問題的方法,稱為Takens嵌入定理。該定理指出,任意m維的緊的超平面,可被微分同胚地嵌入變換為等價的對應維數(shù)的歐氏空間。其中,微分同胚指嵌入換及其逆變換是可導的;等價的對應維數(shù)指嵌入維數(shù)M,M≥2m+1就可以了。Takens嵌入定理可應用延時坐標法重構相空間。在應用該定理重構語音信號相空間時,必須對以下幾個問題給予足夠的重視。Lyapunov指數(shù)是混沌過程的一個重要參數(shù),它給出過程對初始條件敏感依賴的度量。第2節(jié)已指出,判斷信號是否為混沌的,一個重要的依據(jù)在于檢查其最大Lyapunov指數(shù)是否為正。事實上,Lyapunov指數(shù)給出的是動態(tài)系統(tǒng)沿其相空間主軸發(fā)散或收斂的平均速度。同時,它可以指示,對系統(tǒng)的可靠預測能進行多久。文獻介紹了一種從實際數(shù)據(jù)中計算最大Lyapunov指數(shù)的算法。該算法廣為人們使用,但近年來,人們并沒有停止對Lyapunov指數(shù)計算的探討,目前的重點在于,如何給出從時間序列中計算Lyapunov指數(shù)的算法,算法應具有良好的收斂性、準確性和有效性,能計算一般的Lyapunov指數(shù),具有強的排除噪聲和其他干擾的能力。分形維是刻劃動力學系統(tǒng)奇異吸引子復雜度的重要參數(shù)。分形維有各種定義,如容量維、信息維、Hausdorff維、相關維、Lyapunov維、Minkowski_Bouliqand維等。其中,容量維最為常用,其計算方法為計盒算法。文獻討論適用于語音信號的求分形維的方法,指出計盒算法對語音信號的不當之處,并提出一種新方法,稱為幅度尺度法。文獻應用小波求自相似信號(或1/f過程)的分形維,利用小波處理性質或信號的自相關性,可較準確地從含噪信號中求得信號分形維。如何將之應用于語音(特別是語音自相似性很強的濁音部分),尚在研究之中。各文獻求得的語音信號的分形維值并不一致,這一方面和所使用的具體分形維有關,另一方面和計算算法有關。文獻和文獻求得的語音信號分形維在1.66左右,文獻還給出了從物理根源出發(fā)的解釋;文獻的所求數(shù)值在1.5左右,且不同性質的語音,分形維波動較大;文獻所求結果則在2.9左右。各種方法所得結果相去甚遠。如何找出適合于語音信號的分形維的定義和計算方法,從含噪、短長度的語音信號中正確、高效地估計出可靠實用的結果,是研究的方向之一。Takens嵌入定理指出,在重構相空間時,如果嵌入維數(shù)大于吸引子維數(shù)的2倍,延遲坐標向量可構成原可微流形在歐氏空間中的微分同胚。嵌入定理其實是將系統(tǒng)相空間向嵌入空間投影,若嵌入維數(shù)選得太小,相空間軌跡向低維空間投影,會產(chǎn)生許多錯誤的交叉,隨著嵌入維數(shù)的增大,錯誤交叉數(shù)量會減少,當取了足夠大的嵌入維數(shù)時,原系統(tǒng)相空間就被解折疊了。當然,嵌入維數(shù)大于吸引子維數(shù)的2倍,僅僅是相空間重構的充分條件,在實際應用中,嵌入維數(shù)并非取得越大越好。如果嵌入維數(shù)取得太大,觀測數(shù)據(jù)中的噪聲會占滿該嵌入空間的大部分,原系統(tǒng)吸引子退縮一隅,重要性被噪聲掩蓋。理論上,如果求得了系統(tǒng)的分形維,系統(tǒng)的嵌入維數(shù)就可以確定,也可直接求系統(tǒng)重構的嵌入維數(shù)值。求適合嵌入維數(shù)較有價值的方法可以分為三類。第一類使用去虛假交叉(虛假相鄰點)的想法;第二類分析系統(tǒng)的主分量;最后一類利用信息論分析系統(tǒng)變量的相互依賴性。Takens嵌入定理重構相空間,所取的觀察值是對原時間序列以一定間隔重新采樣的,該間隔就是時間延遲。時間延遲的意義在于讓參加系統(tǒng)重構的相鄰數(shù)據(jù)盡可能不相關,從而讓嵌入空間中的樣點所包含的關于原吸引子的信息盡可能大。從這一點看,時間延遲應取得大一些。但是,類似Nyquist定律,時間延遲也不能取得太大,必須保證原系統(tǒng)的信息盡可能地被傳遞到嵌入空間中去。因此,必須適當選取時間延遲。現(xiàn)有的時間延遲的選擇方法一般都基于如下的兩個準則之一:①序列相關法。讓重構矢量內元素之間的相關性減弱,同時重構矢量包含的原動力學系統(tǒng)的信息不丟失;②相空間擴展法。重構相空間軌跡應從相空間的主對角線(時間延遲很小時)盡可能地擴展,但又不出現(xiàn)折疊。實際觀測的數(shù)據(jù)總會受到噪聲干擾。噪聲是否會影響語音信號動力學系統(tǒng)的重構,如何去除噪聲對重構的影響,成為實際應用中不可或缺的研究任務。其中,基于混沌信號處理的噪聲去除方法是研究的重點方向。另外,在求解動力學系統(tǒng)的各項指標時,必須兼顧求解算法的抗噪能力。一般簡單的濾除噪聲方法,是用濾波器對信號濾波。但人們已認識到,經(jīng)濾波的混沌信號的特征可能被改變。文獻討論簡單的IIR高、低通濾波器對原動力學系統(tǒng)的影響,指出,濾波后信號的Lyapunov指數(shù)可能被改變或不變,取決于原系統(tǒng)某一特定的Lyapunov指數(shù)和濾波器極點實部之間的大小關系。文獻總結了FIR濾波器的作用,深入探討一般性的IIR濾波器情形,并建議犧牲一部分原吸引子信息,進行適當濾波。濾波實際上是卷積,文獻討論卷積對吸引子Lyapunov指數(shù)和分形維的影響,提出了一種解卷方法。濾波通過增加新的Lyapunov指數(shù)來影響混沌系統(tǒng);由于Lyapunov維數(shù)和Lyapunov指數(shù)有直接的關系,濾波因而影響系統(tǒng)的分形維。但是,適當選取濾波器參數(shù),可以實現(xiàn)讓濾波對原系統(tǒng)不產(chǎn)生根本上的實質影響。文獻使用平滑濾波器濾除噪聲,并認為,如果平滑濾波器能保留原混沌系統(tǒng)的信息,則不會影響原混沌信號。文獻研究混沌系統(tǒng)中的局部預測問題,得出在噪聲影響不大情況下的如下式子:E≈ce(m+1)λ1ΤΝ-(m+1)/D其中,E為預測歸一化均方誤差,m為用多項式做近似器的多項式階數(shù),λ1為系統(tǒng)吸引子的最大Lyapunov指數(shù),D為吸引子維數(shù),T為預測時間,C為常數(shù)。文獻應用該式,得到式子:T≈ln(σT/σ0)λ1Τ≈ln(σΤ/σ0)λ1,其中,σT為T時刻預測誤差的歸一化標準差,σ0為起始時刻預測誤差的歸一化標準差。從該式中可以知道可靠預測大致時間。另外,估計混沌系統(tǒng)的各種特征參數(shù)需要一定的數(shù)據(jù)長度。文獻構建并應用尺度法則討論這一問題。文獻提出,估計分形維和Lyapunov指數(shù)時,要得到可靠結果,數(shù)據(jù)長度不能小于其中給出的基本限制。文獻應用其結果并從實驗角度進行驗證。4各種神經(jīng)網(wǎng)絡的選擇神經(jīng)網(wǎng)絡非常適合應用于重構混沌過程的非線性動力學系統(tǒng)。首先,神經(jīng)網(wǎng)絡本質上是非線性的,而非線性性是混沌過程存在的基礎;其次,許多類型的神經(jīng)網(wǎng)絡是通用近似器,能以適合的精度近似任意連續(xù)的輸入輸出映射;第三,神經(jīng)網(wǎng)絡的分布式并行處理計算能力很強;第四,神經(jīng)網(wǎng)絡可以自適應訓練自己,具備從環(huán)境中學習的能力。基于混沌理論的語音信號非線性處理,事實上是將預測問題從動力學系統(tǒng)重構角度解釋,而語音信號的分形維并不高,即語音信號動力學系統(tǒng)從混沌角度上看并不十分復雜,這為將神經(jīng)網(wǎng)絡應用于動力學系統(tǒng)重構創(chuàng)造了條件。研究者們已運用了許多種類神經(jīng)網(wǎng)絡,主要集中于如下幾類:多層感知器(MLP)、自組織網(wǎng)絡(SOM)、時間延遲網(wǎng)絡(TDNN)、自回歸網(wǎng)絡(RNN)、RBF網(wǎng)絡等。如何選擇最佳結構的神經(jīng)網(wǎng)絡,目前并沒有理論上的指導與結論,大都靠經(jīng)驗與實驗做出選擇。用于語音非線性處理的神經(jīng)網(wǎng)絡至少必須具備如下特性:首先,神經(jīng)網(wǎng)絡應是通用近似器,這樣才能對非線性動力學系統(tǒng)進行重構;其次,神經(jīng)網(wǎng)絡的訓練速度較快,這符合語音信號非平穩(wěn)特性的要求。MLP是通用近似器,但它依照BP算法訓練,訓練時間較長,常需要訓練數(shù)據(jù)重復輸入,因此不大適合于解決即時性問題;RNN網(wǎng)絡的計算復雜度為網(wǎng)絡中神經(jīng)元個數(shù)的4次冪,計算量太大,為減少RNN的計算量可以采取一些措施,但并沒有從根本上解決問題;SOM一般并不用于系統(tǒng)重構的近似器中。事實上,RBF(RadialBasisFunction)網(wǎng)絡是符合語音信號非線性處理綜合要求的較好工具。RBF網(wǎng)絡是通用近似器;它對其隱含層節(jié)點的中心位置是非線性的,但它輸出權重函數(shù)的連接卻是線性的,可以運用線性自適應的方法調節(jié),計算量遠小于BP算法;它的局部性能、穩(wěn)定性能都較好。基于混沌理論的語音信號非線性處理,可應用RBF網(wǎng)絡實現(xiàn)語音信號動力學系統(tǒng)重構。Takens嵌入定理僅要求使用原系統(tǒng)任意的一類觀測量,可以直接使用語音信號。RBF網(wǎng)絡的輸入節(jié)點由語音信號嵌入維確定,輸入數(shù)據(jù)根據(jù)時間延遲重新采樣。訓練RBF網(wǎng)絡,對其節(jié)點中心、寬度形成碼本,應用于語音預測時從碼本中選取預測增益最高的參數(shù);節(jié)點的輸出連接權值則直接用線性自適應方法訓練。應用RBF網(wǎng)絡的語音編碼可以采用前向或后向工作方式。另外,可以將RBF網(wǎng)絡做為語音處理系統(tǒng)中的一個部分,替換原來的線性預測部分,能提高原語音處理性能。5語音信號相空間重構文中主要介紹基于混沌理論的語音信號非線性分析和處理。首先概括
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 關于體育課件教學課件
- 2024年度成都農(nóng)產(chǎn)品批發(fā)市場運營合同
- 2024年度廣告發(fā)布合同:某品牌廣告投放協(xié)議
- 2024年建筑工程施工安全管理協(xié)議
- 20245G基站建設項目合同
- 2024年定期貨物運輸協(xié)議
- 2024年上海房屋裝修工程維修合同
- 2024年度★店鋪轉讓及財務交接合同
- 2024年城市公共藝術裝置安裝工程分包合同
- 04版房地產(chǎn)買賣與開發(fā)合同
- 《中華商業(yè)文化》第六章
- 醫(yī)院玻璃采光頂玻璃雨棚施工方案
- 運籌學-隨機規(guī)劃課件
- 《電阻》說課課件
- 同濟外科學課件之頸腰椎退行性疾病
- 杜邦杜邦工程塑料課件
- 砌體工程監(jiān)理實施細則
- 運輸車輛衛(wèi)生安全檢查記錄表
- 房建裝修修繕工程量清單
- 部編版四年級道德與法治上冊第8課《網(wǎng)絡新世界》優(yōu)質課件
- 柴油發(fā)電機組應急預案
評論
0/150
提交評論