基于主元分析的故障診斷_第1頁
基于主元分析的故障診斷_第2頁
基于主元分析的故障診斷_第3頁
基于主元分析的故障診斷_第4頁
基于主元分析的故障診斷_第5頁
已閱讀5頁,還剩22頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、PPT模板下載: 行業(yè)PPT模板: 節(jié)日PPT模板: PPT素材下載: PPT圖表下載: 優(yōu)秀PPT下載: PPT教程: Word教程: Excel教程: 資料下載: PPT課件下載: 范文下載: 試卷下載: 教案下載: 數(shù)據(jù)驅(qū)動的工業(yè)過程故障診斷技術(shù)數(shù)據(jù)驅(qū)動的工業(yè)過程故障診斷技術(shù)基于主元分析的方法基于主元分析的方法學(xué)習(xí)匯報故障診斷的方法分類多元統(tǒng)計分析 多元統(tǒng)計分析是從經(jīng)典統(tǒng)計學(xué)中發(fā)展起來的一個分支,是一種綜合分析方法,它能夠在多個對象和多個指標(biāo)互相關(guān)聯(lián)的情況下分析它們的統(tǒng)計規(guī)律在多個對象和多個指標(biāo)互相關(guān)聯(lián)的情況下分析它們的統(tǒng)計規(guī)律。主要內(nèi)容包括多元正態(tài)分布及其抽樣分布、多元正態(tài)總體的均值向

2、量和協(xié)方差陣的假設(shè)檢驗、多元方差分析、直線回歸與相關(guān)、多元線性回歸、主成分分析與因子分析、判別分析與聚類分析、Shannon信息量及其應(yīng)用。 如果每個個體有多個觀測數(shù)據(jù),或者從數(shù)學(xué)上說,如果個體的觀測數(shù)據(jù)能表為P維歐幾里得空間的點,那么這樣的數(shù)據(jù)叫做多元數(shù)據(jù),而分析多元數(shù)據(jù)的統(tǒng)計方法就叫做多元統(tǒng)計分析 ?;诙嘣y(tǒng)計分析的故障診斷方法 基于多元統(tǒng)計分析的故障診斷方法是利用過程多個變量之間的相關(guān)性過程多個變量之間的相關(guān)性對過程進行故障診斷。這類方法根據(jù)過程變量的歷史數(shù)據(jù),利用多元投影的方法將多變量樣本空間分解成由主元空間張成的較低維的投影子空間和一個相應(yīng)的殘差子空間較低維的投影子空間和一個相應(yīng)的

3、殘差子空間,并分別在這兩個子空間進行投影,并計算相應(yīng)的統(tǒng)計量指標(biāo)用于過程監(jiān)控,從而達到故障檢測和診斷的目的。 常用的多元統(tǒng)計分析的方法有兩種:主元分析(PCA)和偏最小二乘(PLS)。主元分析(PCA)的思想 PCA是Principal component analysis的縮寫,是一種對數(shù)據(jù)進行分析的技術(shù),最重要的應(yīng)用是對原有的數(shù)據(jù)進行簡化。主元分析法可以有效地找出數(shù)據(jù)中最“主要主要”的元素和結(jié)構(gòu),取出噪音和冗余,將原有的復(fù)雜數(shù)據(jù)降維,揭示隱藏在復(fù)雜數(shù)據(jù)背后的簡單結(jié)構(gòu)。 先從一個簡單的物理實驗的例子開始說明這種思想。主元分析(PCA)的目的 對于一個有先驗知識的實驗者來說,這個實驗很容易。球

4、的運動之在x軸方向上發(fā)生,y軸和z軸冗余的,只需要記錄一下x軸上的運動序列并加以分析即可。 可是,在真實世界中,對于第一次做實驗的人來說(或者在實驗科學(xué)中遇到的一種新情況),是不會剛開始就舍棄y和z軸的信息的。一般來說,實驗者會記錄球的三維位置,得到球在空間中的運動序列然后進行分析。 在沒有先驗知識的情況下,利用測到的數(shù)據(jù)將實驗數(shù)據(jù)中的冗余變量剔除并化歸到x軸上,這就是簡單的主元分析達到得的效果(顯然x軸方向是上述問題的主元)。主元分析(PCA)的思想 主元分析一項十分著名的工作是美國的統(tǒng)計學(xué)家斯通在1947年關(guān)于國民經(jīng)濟的研究。他曾用美國在19291938年各年的數(shù)據(jù),得到了17個反映國民收

5、入與支出的變量要素,例如雇主補貼、消費資料和生產(chǎn)資料、純公共指出、凈增庫存、股息、利息和外貿(mào)平衡等等。 在進行主成分分析后,他竟以97.4%的精度,用三個新變量就取代了原來17個變量。根據(jù)經(jīng)濟學(xué)知識,斯通給這三個新變量分別命名為總收入F1、總收入變化率F2和經(jīng)濟發(fā)展或衰退的趨勢F3(這三個變量其實是可以通過直接測量得到的)。 在現(xiàn)在的研究中,為了全面系統(tǒng)地分析和研究問題,必須考慮許多指標(biāo),這些指標(biāo)能從不同的側(cè)面反映我們所研究的對象的特征,但在某種程度上存在信息的重疊,也就是這些信息之間具有一定的相關(guān)性。 主成分分析試圖保證數(shù)據(jù)信息丟失最少的原則下,對多面輛的數(shù)據(jù)表進行最佳綜合簡化,也就是說,對

6、高維變量空間進行降維降維處理。顯然辨識系統(tǒng)在一個低維空間要比在一個高維空間容易很多。主元分析(PCA)的幾何解釋 設(shè)有n個樣品,每個樣品有兩個觀測變量x1和x2,在由變量x1和x2所定的二維平面中,n個樣本點所散布的情況如橢圓狀。 如圖可以看出這n個樣本點無論是沿著x1軸的方向還是x2軸方向都具有較大的離散型,其離散的程度可以分別用觀測變量x1的方差和x2的方差定量地表示。顯然,如果只考慮x1和x2中的任何一個,那么包含在原始數(shù)據(jù)中的信息將會有較大的損失。主元分析(PCA)的幾何解釋 主元分析(PCA)的幾何解釋 主元分析(PCA)的幾何解釋 如果我們將x1軸和x2軸先平移,再同時按逆時針方向

7、旋轉(zhuǎn)角度 ,得到新坐標(biāo)軸F1和F2。F1和F2是兩個新變量。 旋轉(zhuǎn)變換的目的是為了使n個樣品點在F1軸方向上的離散程度最大,即F1的方差最大。變量F1代表了原始數(shù)據(jù)的絕大部分信息,在研究某些問題時,即使不考慮變量F2也無損大局。經(jīng)過上述變換,原始數(shù)據(jù)的大部分信息集中到F1軸上,對數(shù)據(jù)中包含的信息起到了濃縮作用。 主元分析(PCA)的幾何解釋 為旋轉(zhuǎn)變換矩陣,它是正交矩陣,則有 F1,F(xiàn)2除了可以對包含在X1,X2中的信息起著濃縮作用之外,還具有不相關(guān)的性質(zhì),這就使得在研究復(fù)雜問題時避免了信息重疊所帶來的虛假性。二維平面上的n個點的方差大部分都歸結(jié)在F1軸上,而F2軸上的方差很小。F1和F2成為

8、原始變量x1和x2的綜合變量。F簡化了系統(tǒng)結(jié)構(gòu),抓主了主要矛盾。1122121122cossinsincoscossinsincosFxxFxxFxU xFx 1,UUU UI 主元分析(PCA)的一般化模型 一般化,假設(shè)我們所討論的實際問題中,有p個指標(biāo),我們把這p個指標(biāo)看作p個隨機變量,記為X1,X2,XP,主要成分分析就是要把這p個指標(biāo)的問題,轉(zhuǎn)變?yōu)橛懻損個指標(biāo)的線性組合的問題,而這些新的指標(biāo)F1,F2,,F(xiàn)k(k=p),按照保留主要信息量的原則充分反映原指標(biāo)的信息,并且相互獨立。建立新指標(biāo)的過程也就是實現(xiàn)降維降維的過程。 主成分分析通常的做法是,尋求原指標(biāo)的線性組合Fi: 111121

9、21212122221122ppppkkkpkpFu Xu Xu XFu Xu XuXFu Xu XuX 主元分析(PCA)的一般化模型模型滿足如下條件: 每個主成分的系數(shù)平方和為1,即主成分之間相互獨立,即無重疊的信息:主成分的方差依次遞減,重要性依次遞減:222121iipiuuu(,)0, ,1,2,ijCov F Fij i jp12()()()pVar FVar FVar F 主元分析(PCA)的步驟(含例子) 接下來,用一個實例來陳述主元分析的具體步驟: 第一步:獲得數(shù)據(jù) 在簡單的例子中,使用自己制作的2維數(shù)據(jù): x=2.5, 0.5, 2.2, 1.9, 3.1, 2.3, 2.

10、0, 1.0, 1.5, 1.1T y=2.4, 0.7, 2.9, 2.2, 3.0, 2.7, 1.6, 1.1, 1.6, 0.9T第二步:減去均值 要使PCA正常工作,必須減去數(shù)據(jù)的均值。減去的均值為每一維的平均,所有的x值都要減去,同樣所有的y值都要減去,這樣處理后的數(shù)據(jù)都具有0均值。 x=0.69, -1.31, 0.39, 0.09, 1.29, 0.49, 0.19, -0.81, -0.31, -0.71T y=0.49, -1.21, 0.99, 0.29, 1.09, 0.79, -0.31, -0.81, -0.31, -1.01T; 主元分析(PCA)的步驟(含例子)

11、 第三步:計算協(xié)方差矩陣 因為數(shù)據(jù)是2維的,它的協(xié)方差矩陣就是2X2維的,這里直接給出結(jié)果: 因為非對角元素是正的,我們可以期望 和 變量一起增大。第四步:計算協(xié)方差矩陣的特征矢量和特征值(確定主元以及變換矩陣) 因為協(xié)方差矩陣為方陣,我們可以計算它的特征矢量和特征值,它可以告訴我們數(shù)據(jù)的有用信息。我們數(shù)據(jù)的特征值和特征矢量分別為:0.6165555560.615444444cov0.6154444440.716555556 主元分析(PCA)的步驟(含例子) 第五步:選擇成分組成模式矢量 現(xiàn)在可以進行數(shù)據(jù)壓縮降低維數(shù)了。事實上,可以證明對應(yīng)最大特征值的特征最大特征值的特征矢量矢量就是數(shù)據(jù)的主

12、成分?jǐn)?shù)據(jù)的主成分。在我們的例子中,對應(yīng)大特征值的特征矢量就是那條穿過數(shù)據(jù)中間的矢量,它是數(shù)據(jù)維數(shù)之間最大的關(guān)聯(lián)。 一般地,從協(xié)方差矩陣找到特征矢量以后,下一步就是按照特征值由大到小進行排列,這將給出成分的重要性級別。如果條件允許,可以忽略那些重要性很小的成分,當(dāng)然這會丟失一些信息,但是如果對應(yīng)的特征值很小,不會丟失很多信息。如果你已經(jīng)忽略了一些成分,那么最后的數(shù)據(jù)集將有更少的維數(shù),精確地說,如果原始數(shù)據(jù)是n維的,選擇了前p個主要成分,那么現(xiàn)在的數(shù)據(jù)將僅有p維。 接下來需要組成一個模式矢量,它由所有特征矢量構(gòu)成,每一個特征矢量是這個矩陣的一列。用兩個特征矢量組成模式矢量: 主元分析(PCA)的步

13、驟(含例子) 忽略其中較小特征值的一個特征矢量,剩下特征值大的特征向量: 第六步:獲得新數(shù)據(jù) PCA最后一步,簡單地對其進行轉(zhuǎn)置,并將其左乘原始數(shù)據(jù)的轉(zhuǎn)置: 得到的結(jié)果為: x=-0.828, 1.778, -0.992, -2.742, -1.676, -0.913, 0.099, 1.145, 0.438,1.224T 其中rowFeatureVector是由特征矢量作為列組成的矩陣的轉(zhuǎn)置,因此它的行就是原來的特征矢量,而且對應(yīng)最大特征值的特征矢量在該矩陣的最上一行。rowdataAdjust是減去均值后的數(shù)據(jù),即數(shù)據(jù)項目在每一列中,每一行就是一維。FinalData是最后得到的數(shù)據(jù)。原始數(shù)據(jù)有兩個軸(x和y),原始數(shù)據(jù)按這兩個軸分布。PCA將數(shù)據(jù)從原來的x、y軸表達變換為現(xiàn)在的單個特征矢量表達。FinalDatarowFeatureVectorrowdataAdjust 主元分析(PCA)的步驟(含例子) 如果想恢復(fù)原來的數(shù)據(jù),可以進行逆運算: ()TTrowdataAdjustrowFeatu

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論