版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、各專業(yè)全套優(yōu)秀畢業(yè)設(shè)計(jì)圖紙基于聚類分析的間歇過程時(shí)段劃分的mpca建模的故障分析摘要對(duì)于具有過渡特性、多階段特性的間歇過程的故障檢測(cè)是非常復(fù)雜的。間歇過程最基本的特征就是多階段,每個(gè)階段操作條件、參數(shù)等特性都有一定的差異。由于對(duì)于間歇過程的建模和故障診斷都要求對(duì)數(shù)據(jù)進(jìn)行預(yù)處理才能得到有效的檢驗(yàn)結(jié)果,所以需要找到合適的方法對(duì)間歇過程進(jìn)行階段劃分,才能有效提高建模和故障診斷的準(zhǔn)確性。為了實(shí)現(xiàn)更加準(zhǔn)確地對(duì)間歇過程進(jìn)行階段劃分,最終實(shí)現(xiàn)更加精準(zhǔn)、有效的故障檢測(cè)及診斷,降低系統(tǒng)誤報(bào)率。本文采用一種基于馬氏距離的k-means聚類算法,該方法依據(jù)基于協(xié)方差距離的方法實(shí)現(xiàn)對(duì)間歇過程的階段劃分,在matlab
2、編程環(huán)境下,完成基于馬氏距離的間歇過程時(shí)段劃分算法程序的整體設(shè)計(jì)方案,編寫馬氏距離實(shí)現(xiàn)以及k-means聚類算法的相應(yīng)程序,完成對(duì)間歇過程進(jìn)行劃分的實(shí)現(xiàn);最后通過pensim青霉素發(fā)酵仿真軟件獲取青霉素發(fā)酵過程的間歇過程仿真數(shù)據(jù),設(shè)計(jì)基于多向主元分析(mpca)模型的故障檢測(cè)方法,并利用mpca建模對(duì)基于馬氏距離的k-means聚類劃分的子時(shí)段進(jìn)行故障檢測(cè)。實(shí)驗(yàn)結(jié)果表明,在k-means聚類算法對(duì)間歇過程進(jìn)行分段模塊,基于馬氏距離的k-means聚類方法的分段效果較符合生產(chǎn)實(shí)際;在故障檢測(cè)的效果方面,基于馬氏距離的k-means聚類的故障檢測(cè)準(zhǔn)確,誤報(bào)率低,達(dá)到了預(yù)期效果。關(guān)鍵詞:間歇過程;聚
3、類分析;k-均值;馬氏距離目錄前言1第1章緒論2第2章基于聚類分析的間歇過程時(shí)段劃分算法原理3第2.1節(jié)聚類分析算法原理32.1.1 聚類分析算法概述32.1.2 k-means聚類分析算法原理42.1.3 馬氏距離基本原理52.1.4 馬氏距離與歐氏距離的比較5第2.2節(jié)基于mpca的故障檢測(cè)原理62.2.1基于批次展開的mpca方法原理62.2.2主元分析方法原理7第2.3節(jié)總體方案設(shè)計(jì)9第3章基于聚類分析間歇過程時(shí)段劃分算法程序的設(shè)計(jì)與實(shí)現(xiàn)10第3.1節(jié)數(shù)據(jù)獲取及預(yù)處理模塊設(shè)計(jì)與實(shí)現(xiàn)10第3.2節(jié)基于k-means的聚類分析算法模塊設(shè)計(jì)與實(shí)現(xiàn)12第3.3節(jié)基于mpca的故障檢測(cè)模塊設(shè)計(jì)與
4、實(shí)現(xiàn)15第4章實(shí)驗(yàn)與分析18第4.1節(jié)基于k-means的聚類分析算法模塊的實(shí)驗(yàn)與分析184.1.1實(shí)驗(yàn)數(shù)據(jù)獲取184.1.2 基于馬氏距離的k-means聚類分析算法的實(shí)驗(yàn)與分析194.1.4 聚類結(jié)果分析19第4.2節(jié)基于mpca的故障檢測(cè)模塊的實(shí)驗(yàn)與分析204.2.1 mpca的數(shù)據(jù)預(yù)處理與建模204.2.2 故障檢測(cè)結(jié)果214.2.3 故障溯源23v前言復(fù)雜工業(yè)過程往往伴隨著很多危險(xiǎn)因素,一個(gè)環(huán)節(jié)控制不準(zhǔn)確就可能會(huì)引起生產(chǎn)運(yùn)行不穩(wěn)定、產(chǎn)品質(zhì)量不可靠等問題,甚至可能造成財(cái)產(chǎn)及人身安全的重大事故。所以對(duì)生產(chǎn)過程的故障檢測(cè)、預(yù)測(cè)、排除等技術(shù)的研究近年來一直受到國(guó)內(nèi)外的廣泛關(guān)注,也成為一個(gè)炙手
5、可熱的研究熱點(diǎn)。隨著社會(huì)對(duì)工業(yè)產(chǎn)品高精度、高質(zhì)量、多品種的需求,小批量的精細(xì)生產(chǎn)也成為一個(gè)重要的發(fā)展趨勢(shì)。工業(yè)化生產(chǎn)更加依賴間歇過程。間歇過程具有多時(shí)段和過渡性的特點(diǎn),導(dǎo)致這類系統(tǒng)通常是非線性、時(shí)變、滯后的,并且模型不確定,對(duì)這類系統(tǒng)很難建立一個(gè)精確的數(shù)學(xué)模型來對(duì)其進(jìn)行控制和檢測(cè),這個(gè)問題一直是控制界一個(gè)非常具有挑戰(zhàn)性的課題之一,因而對(duì)間歇過程系統(tǒng)控制問題的研究,具有一定的理論價(jià)值和實(shí)際應(yīng)用價(jià)值。傳統(tǒng)聚類分析方法采用歐氏距離進(jìn)行計(jì)算,即用兩點(diǎn)之間的距離的平方和來比較實(shí)際操作數(shù)據(jù)與質(zhì)心的距離。這種方法雖然比較簡(jiǎn)單,而且比較實(shí)用,但是也存在著明顯的缺陷。歐氏距離將不同屬性的變量等同對(duì)待,這一點(diǎn)有時(shí)
6、并不能滿足實(shí)際的要求。而采用馬氏距離不受量綱的影響,可以排除變量之間相關(guān)性的干擾,克服指標(biāo)變量不同量綱不同權(quán)重所造成的誤判。本課題對(duì)傳統(tǒng)的歐氏距離方法上進(jìn)行改進(jìn),采用馬氏距離方法進(jìn)行聚類分析。在matlab編程環(huán)境下實(shí)現(xiàn)基于馬氏距離的間歇過程時(shí)段劃分算法程序設(shè)計(jì)。并使用pensim青霉素發(fā)酵仿真軟件對(duì)青霉素發(fā)酵過程的間歇過程數(shù)據(jù)進(jìn)行實(shí)驗(yàn)測(cè)試。第1章緒論隨著工業(yè)水平的不斷發(fā)展和提高,間歇過程已經(jīng)廣泛應(yīng)用于各個(gè)領(lǐng)域,如精細(xì)化工產(chǎn)業(yè)、生物產(chǎn)業(yè)、農(nóng)產(chǎn)品深加工等。同時(shí)為了適應(yīng)市場(chǎng)對(duì)于產(chǎn)品多品種、多規(guī)格、高質(zhì)量的要求,間歇生產(chǎn)越來越受到重視。間歇過程中,受生產(chǎn)設(shè)備的物理結(jié)構(gòu),或其他經(jīng)濟(jì)和技術(shù)上因素的影響,
7、使生產(chǎn)過程由一個(gè)或多個(gè)一定順序執(zhí)行的操作階段組成。在執(zhí)行過程中,都會(huì)受其生產(chǎn)環(huán)境和動(dòng)態(tài)特性的影響,使得生產(chǎn)的產(chǎn)品和工藝操作條件頻繁發(fā)生變化。與連續(xù)生產(chǎn)過程相比,間歇過程具有動(dòng)態(tài)性,多樣性,不確定性等特征。如果分段不合理,就不能很好的反映過渡階段特性的變化,從而造成相鄰階段的過渡過程特性變化對(duì)監(jiān)控結(jié)果產(chǎn)生很大影響1。多階段是間歇過程的一個(gè)固有特征,過程的每個(gè)階段都有不同的過程特征及過程主導(dǎo)變量,而且過程變量相關(guān)關(guān)系并非隨著時(shí)間變化,而是跟隨過程操作進(jìn)程或過程機(jī)理特性變化呈現(xiàn)分階段性2-4。然而由于這些過程本身其動(dòng)態(tài)特性,以及當(dāng)在同一設(shè)備上要求運(yùn)行不同的生產(chǎn)批次,所需要產(chǎn)生的各批次之間的操作條件的
8、變化會(huì)帶來產(chǎn)品質(zhì)量不高或重復(fù)性差等問題,也會(huì)造成許多安全隱患5。k-means聚類算法是一種經(jīng)典的劃分的聚類算法,具有算法簡(jiǎn)單,收斂速度快,適用于處理大數(shù)據(jù)集等優(yōu)點(diǎn),該算法在當(dāng)聚類是密集的,且類與類之間區(qū)別明顯時(shí),效果較好,該算法本身具有優(yōu)化迭代功能,可以在已經(jīng)求得的聚類上再次進(jìn)行迭代修正確定部分樣本的聚類,對(duì)初始樣本分類不合理的地方進(jìn)行。在處理大數(shù)據(jù)集時(shí),k-means聚類算法是相對(duì)可伸縮和高效的,是一種簡(jiǎn)單快捷的方法。因此針對(duì)間歇過程的動(dòng)態(tài)特性,k-means聚類分析算法是一種可行性很強(qiáng)的方法,能行之有效地實(shí)現(xiàn)對(duì)間歇過程的故障檢測(cè)。第2章基于聚類分析的間歇過程時(shí)段劃分算法原理第2.1節(jié)聚類
9、分析算法原理2.1.1 聚類分析算法概述聚類是一種將未知變量劃分成類的方法,這也是聚類與分類的根本差別。通過將不同數(shù)據(jù)劃分成簇,一個(gè)簇內(nèi)部的對(duì)象之間有很強(qiáng)的相似性,而不同的簇之間則有很大的區(qū)別。這樣一個(gè)搜索簇的無監(jiān)督的學(xué)習(xí)過程不需要依賴事先定義好的類或者帶有類標(biāo)記實(shí)例,而是需要聚類學(xué)習(xí)算法自動(dòng)地確定標(biāo)記。因此,聚類是一種觀察式學(xué)習(xí)而非示例式學(xué)習(xí)。聚類可以定義如下:在數(shù)據(jù)空間中,數(shù)據(jù)由許多個(gè)數(shù)據(jù)點(diǎn)(或?qū)ο螅┙M成,數(shù)據(jù)點(diǎn)的每個(gè)屬性既可以是數(shù)值型的,也可以是非數(shù)值型的。假設(shè)數(shù)據(jù)集x有n個(gè)對(duì)象,則x可以用一個(gè)的矩陣表示。聚類的最終目的是把數(shù)據(jù)集x劃分為p個(gè)分割,當(dāng)然,也可能有些對(duì)象不屬于任何一個(gè)分割,
10、將這些對(duì)象歸類為噪聲。所有這些分割和噪聲集的并集就是數(shù)據(jù)集x,并且這些分割之間的交集為空。聚類分析是多元統(tǒng)計(jì)方法之一,按照隸屬度的取值范圍,則可以把聚類算法分成傳統(tǒng)的硬聚類算法(如k-平均算法)和模糊聚類算法(如模糊c 均值) 等。模糊聚類技術(shù)基于模糊集合論,被廣泛應(yīng)用于模式識(shí)別和數(shù)據(jù)挖掘等領(lǐng)域,成為一個(gè)研究的熱點(diǎn),不斷涌現(xiàn)出一些聚類分析算法16,17。但目前為止大多數(shù)算法都是以歐氏距離作為相似性度量的,只考慮了各類別樣本均值這種一階統(tǒng)計(jì)特征,得到的聚類結(jié)果是超球型的。而實(shí)際大多數(shù)情況下因?yàn)槊總€(gè)變量的方差并不是相同的,尤其在間歇過程中,各階段變量變化特征不同,每一類的域應(yīng)該是超橢圓而不是超球面
11、,這樣,傳統(tǒng)的聚類方法會(huì)導(dǎo)致數(shù)據(jù)不正確的分類?;跉W氏距離的聚類算法傾向于發(fā)現(xiàn)具有相近尺度和密度的球狀簇,即在不同的方向上相似性的尺度都一樣,然而,簇可能是任意形狀的,因此提出能發(fā)現(xiàn)任意形狀簇的算法是很重要的。聚類分析算法旨在將相似的失誤進(jìn)行歸類,是依據(jù)事物本身的特征來研究個(gè)體。這種方法具有同一類的個(gè)體相似度較高,不同類的個(gè)體差異度很大的原則。聚類分析算法的三個(gè)特征分別為:(1) 對(duì)沒有先驗(yàn)知識(shí)的分類適用。即便沒有先驗(yàn)知識(shí)或其他的國(guó)際標(biāo)準(zhǔn)、國(guó)內(nèi)標(biāo)準(zhǔn)以及行業(yè)標(biāo)準(zhǔn),聚類分析算法可以通過設(shè)定一些邊角完善的分類變量,來實(shí)現(xiàn)較為合理、科學(xué)的分段。(2) 能處理由多個(gè)變量決定的分類。例如根據(jù)一個(gè)學(xué)生每月的
12、開支分類比較容易。但是在進(jìn)行數(shù)據(jù)挖掘的過程中,要求根據(jù)該生的家庭收入、家庭支出、平均每天消費(fèi)金額等多個(gè)指標(biāo)完成分類比較困難的,不過聚類分析解決這一類問題。(3) 聚類分析算法屬于一種探索性的分析方法,可以利用聚類分析探索一些事物的內(nèi)在的規(guī)律和特點(diǎn)。然后按照相似性原則對(duì)研究對(duì)象進(jìn)行分組?,F(xiàn)有的主要聚類算法大致可以分為以下幾種:劃分聚類算法、層次聚類算法、基于密度的聚類算法、基于網(wǎng)格的聚類算法以及基于模型的聚類算法等。本文采用的k-means聚類分析算法屬于劃分聚類算法,劃分聚類算法是指對(duì)于一個(gè)給定的n個(gè)數(shù)據(jù)對(duì)象的數(shù)據(jù)集,采用目標(biāo)函數(shù)最小化策略,通常把數(shù)據(jù)分成k個(gè)組,每個(gè)組為一個(gè)類(或簇)??梢钥?/p>
13、出,這種聚類方法同時(shí)滿足以下兩個(gè)條件:(1) 每個(gè)類至少包含一個(gè)數(shù)據(jù)對(duì)象;(2) 每個(gè)數(shù)據(jù)對(duì)象必須屬于且只屬于一個(gè)類。當(dāng)然,在有些情況,如模糊聚類、可能性聚類等,條件(2)可以放寬要求。最著名與最常用的劃分聚類算法是k-均值算法和k-中心點(diǎn)算法,其他劃分算法大都是這些算法的變種。2.1.2 k-means聚類分析算法原理k-means算法是一種經(jīng)典的基于劃分的聚類方法。它的基本思想是先隨機(jī)產(chǎn)生k個(gè)初始點(diǎn)作為k個(gè)簇的中心點(diǎn),將靠近它們的相似的點(diǎn)分到不同的簇,然后按照一定的方法計(jì)算各個(gè)簇的質(zhì)心,從而確定新的質(zhì)心,不斷進(jìn)行迭代,直到質(zhì)心的移動(dòng)范圍滿足給定的要求。這種算法比較簡(jiǎn)單快捷,但是它的關(guān)鍵在k
14、值的選擇和距離公式是否準(zhǔn)確。k-means算法實(shí)現(xiàn)的具體步驟可以概括為以下5步:(1) 從m個(gè)數(shù)據(jù)中任意選取k個(gè)對(duì)象作為初始的聚類中心;(2) 分別計(jì)算每個(gè)數(shù)據(jù)對(duì)象到每個(gè)聚類中心的距離,距離最近的一個(gè)中心所在的聚類就是該點(diǎn)所在的聚類;(3) 聚類完成后運(yùn)用一定方法重新計(jì)算該聚類中距離每一個(gè)點(diǎn)的最近的中心點(diǎn);(4) 如果與上一次計(jì)算出的聚類中心相同則說明聚類結(jié)果成立,轉(zhuǎn)(5);如果不同,則轉(zhuǎn)(2)重新進(jìn)行計(jì)算;(5) 輸出聚類結(jié)果?;跉W氏距離的k-means算法非常簡(jiǎn)單而且便于解決實(shí)際問題,該算法應(yīng)用比較廣泛,但是有一定的缺點(diǎn)。首先,歐氏距離適用于超球形聚類,在不同的方向上相似的尺度一樣,傾向
15、于發(fā)現(xiàn)具有相近尺度和密度的球狀簇。同時(shí),由于基于歐氏距離的k-means算法對(duì)野值點(diǎn)和噪聲敏感。即使對(duì)于一個(gè)遠(yuǎn)離聚類中心的目標(biāo),算法也強(qiáng)行將其劃入一個(gè)類中,從而扭曲了聚類形狀。本文采用一種基于馬氏距離的k-means算法進(jìn)行聚類。馬氏距離定義了空間中樣本之間的協(xié)方差距離??紤]了指標(biāo)變量的協(xié)方差矩陣結(jié)構(gòu)及相關(guān)性對(duì)分類的影響,可以減弱由變量屬性之間的相互影響而使聚類產(chǎn)生的誤差。2.1.3 馬氏距離基本原理馬氏距離表示數(shù)據(jù)的協(xié)方差距離。設(shè)總體g為m維總體(考慮m個(gè)指標(biāo)),均值向量為=1,2,m,協(xié)方差矩陣為=ij,則樣品x=x1,x2,xm與總體g的馬氏距離定義為:d2x,g=x-1x- (21)其
16、中,=covx,y=ex-exy-ey,當(dāng)m=1時(shí),d2x,g=x-x-2=x-22 (22)利用馬氏距離進(jìn)行計(jì)算在聚類上具有顯著的優(yōu)勢(shì),它可以使分類過程中的相似的數(shù)據(jù)點(diǎn)距離較近。這樣可以減弱各屬性數(shù)據(jù)間的相關(guān)性影響,降低誤差。在具體間歇過程應(yīng)用中,既能考慮到穩(wěn)定階段下的監(jiān)控,也能兼顧不同階段間的監(jiān)控和故障檢測(cè)。2.1.4 馬氏距離與歐氏距離的比較歐氏距離是在m維空間中兩個(gè)點(diǎn)之間的真實(shí)距離。設(shè)m維空間中兩點(diǎn)x=x1,x2,xp,和y=y1,y2,yp,它們之間的歐氏距離為:d2x,y=x1-y12+xp-yp2 (23)可以看出,歐氏距離算法雖然簡(jiǎn)單,但是在分析處理多元數(shù)據(jù)時(shí)會(huì)體現(xiàn)出一些缺點(diǎn)。
17、例如,歐氏距離沒考慮到總體的變異對(duì)于距離遠(yuǎn)近的影響,并且歐氏距離會(huì)受到變量的量綱影響。而經(jīng)過協(xié)方差矩陣逆矩陣處理的馬氏距離則可以排除測(cè)量單位的影響。但是兩者之間也有這一定的聯(lián)系,由(21),(23)兩式可以看出,當(dāng)協(xié)方差矩陣為單位矩陣時(shí),馬氏距離就簡(jiǎn)化為歐氏距離。說明馬氏距離算法對(duì)于歐式距離是一種補(bǔ)充和改進(jìn)。前文提到,k-means算法實(shí)現(xiàn)過程非常重要的一個(gè)部分就是各點(diǎn)到聚類中心距離的計(jì)算。傳統(tǒng)研究通常采用歐氏距離進(jìn)行計(jì)算,即距離的平方和。而馬氏距離表示的是數(shù)據(jù)之間的協(xié)方差距離,可以更加有效地計(jì)算數(shù)據(jù)樣本集的相似度。運(yùn)用馬氏距離計(jì)算聚類中各點(diǎn)到中心的距離可以排除變量之間的干擾。同時(shí)也無需考慮原
18、始數(shù)據(jù)的測(cè)量單位的影響。第2.2節(jié)基于mpca的故障檢測(cè)原理2.2.1基于批次展開的mpca方法原理多向主元分析(mpca)方法建立統(tǒng)計(jì)模型,模型數(shù)據(jù)矩陣結(jié)構(gòu)和表達(dá)方式相較于pca方法都發(fā)生了變化。間歇過程的反應(yīng)數(shù)據(jù)通常是以三維數(shù)據(jù)矩陣的形式來表示,其中,代表間歇過程的個(gè)數(shù),代表過程變量的個(gè)數(shù),代表每一次間歇過程的采樣時(shí)刻的個(gè)數(shù)。pca方法要求每一個(gè)子數(shù)學(xué)模型具備獨(dú)立的子數(shù)據(jù)空間,mpca模型就是由這一系列子數(shù)據(jù)空間構(gòu)成。mpca方法的原理是,首先將三維矩陣的操作數(shù)據(jù)進(jìn)行二維展開,得到一個(gè)二維矩陣,不同間歇過程具有不同的特性,其在建模方面的需求不同,所采用的展開方式也有所不同。對(duì)間歇過程的數(shù)據(jù)
19、進(jìn)行二維展開后,先要對(duì)展開處理后的二維數(shù)據(jù)矩陣進(jìn)行標(biāo)準(zhǔn)化處理,經(jīng)過標(biāo)準(zhǔn)化的二維數(shù)據(jù)可以通過pca方法進(jìn)行建模。mpca方法建模實(shí)質(zhì)是將一個(gè)大型復(fù)雜的數(shù)據(jù)空間,沿這一個(gè)軌跡分割成一系列子數(shù)據(jù)空間,在每一個(gè)子數(shù)據(jù)空間上分別建立子統(tǒng)計(jì)模型,多個(gè)子模型構(gòu)成了非線性多元統(tǒng)計(jì)數(shù)學(xué)模型。2.2.2主元分析方法原理給定一個(gè)在正常狀態(tài)下工作的歷史數(shù)據(jù),設(shè)該數(shù)據(jù)集有個(gè)過程變量,個(gè)觀測(cè)值,將該數(shù)據(jù)集變?yōu)榫仃嚕ǎ┑男问?,其中,每一列代表一個(gè)測(cè)量變量,每一行代表一個(gè)樣本。矩陣如式24所示。(24)對(duì)pca模型的數(shù)據(jù)預(yù)處理即對(duì)矩陣的標(biāo)準(zhǔn)化通常是將x的每一列減去相應(yīng)的變量均值且除以相應(yīng)的變量標(biāo)準(zhǔn)差。利用pca對(duì)樣本數(shù)據(jù)進(jìn)行
20、建模。定義標(biāo)準(zhǔn)化的樣本協(xié)方差矩陣為:(25)對(duì)其進(jìn)行特征值分解,并且按章特征值得大小降序排列。pca模型對(duì)x進(jìn)行如下分解:(26)(27)其中為負(fù)載矩陣,由s的前a個(gè)特征向量構(gòu)成。為得分矩陣,t的各列被稱為主元變量,a表示主元的個(gè)數(shù),也是得分矩陣的列數(shù)。得分矩陣的各列是相互正交的,說明這些主元是統(tǒng)計(jì)線性無關(guān)的。主元的協(xié)方差矩陣可以由來得到,其中表示是s的前a個(gè)較大的特征值?;趐ca方法的過程監(jiān)控通過監(jiān)視兩個(gè)多元統(tǒng)計(jì)量,hotellings和殘差子空間的,來實(shí)現(xiàn)對(duì)間歇生產(chǎn)過程是否正常運(yùn)行的實(shí)時(shí)監(jiān)控的。其中,統(tǒng)計(jì)量的控制限可采用分布來計(jì)算,公式如式28。(28)其中,為主元個(gè)數(shù),為建模批次數(shù),為
21、顯著性水平。統(tǒng)計(jì)量,是指預(yù)測(cè)誤差平方和指標(biāo)(squared prediction error,spe),表示測(cè)量量偏離主元模型的距離值。spe統(tǒng)計(jì)量的控制限可由下式計(jì)算:(29)(210)(211)其中,為建模數(shù)據(jù)集中所有批次測(cè)量數(shù)據(jù)在第個(gè)時(shí)刻spe統(tǒng)計(jì)量的均值,為其對(duì)應(yīng)的方差。完成建模后,根據(jù)標(biāo)準(zhǔn)軌跡分段情況對(duì)在線數(shù)據(jù)進(jìn)行階段劃分,使用基于馬氏距離的k-means算法對(duì)每個(gè)階段進(jìn)行分段建模,然后再根據(jù)公式(212)、(213)、(214)、(215)就得各點(diǎn)和spe值。(212)(213)(214)(215)檢查各點(diǎn)是否超過控制限,若超過和spe控制限,則發(fā)現(xiàn)故障,則說明該點(diǎn)出現(xiàn)故障;若沒有
22、超過控制限,則該批次數(shù)據(jù)正常。對(duì)于使用mpca對(duì)在線數(shù)據(jù)建模檢測(cè),使用spe和控制限檢驗(yàn)系統(tǒng)是否出現(xiàn)故障,可能會(huì)有4種不同的結(jié)果:(1) 故障使用spe和同時(shí)超過控制限;(2) 故障使用spe超過控制限,而沒有超過控制限;(3) 故障使用超過控制限,而spe沒有超過控制限;(4) 兩者均沒有超過控制限。盡管兩者總是同時(shí)用于檢測(cè)故障,但這兩者具有不同的物理意義,而且重要性也并不相同。對(duì)于pca模型,如果建模合理,那么它便描述了變量之間因?yàn)楦鞣N物理約束形成的相關(guān)性,如質(zhì)量守恒、能量守恒,以及各種操作約束。spe可以檢測(cè)打破了各種約束的過程異常。根據(jù)上面的分析,spe可以區(qū)分并檢測(cè)故障情形(1)、(
23、2)、(4)。在spe的基礎(chǔ)上,指標(biāo)只是補(bǔ)充了沒有破壞變量關(guān)系,但是無法被spe監(jiān)測(cè)的故障。第2.3節(jié)總體方案設(shè)計(jì)本課題的目標(biāo)是在matlab環(huán)境下設(shè)計(jì)一個(gè)利用基于馬氏距離的k-means算法對(duì)間歇過程時(shí)段進(jìn)行劃分的算法程序。主要實(shí)現(xiàn)對(duì)間歇過程的階段劃分,以期達(dá)到更準(zhǔn)確地進(jìn)行系統(tǒng)的故障檢測(cè),降低系統(tǒng)誤報(bào)率。圖21是本文提出的基于聚類分析間歇過程時(shí)段劃分算法程序的設(shè)計(jì)的整體設(shè)計(jì)方案。圖21 總體設(shè)計(jì)流程圖該方案主要由數(shù)據(jù)的預(yù)處理,間歇過程階段劃分,基于mpca的故障檢測(cè),故障溯源四個(gè)模塊組成。本程序首先從一個(gè)間歇過程工業(yè)模型獲得仿真數(shù)據(jù);對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,包括標(biāo)準(zhǔn)化等等;然后通過基于matlab
24、環(huán)境下編寫的分段算法分別對(duì)間歇過程進(jìn)行基于歐氏距離的k-means聚類和基于馬氏距離的k-means聚類,實(shí)現(xiàn)對(duì)間歇過程的階段劃分,其中基于馬氏距離的k-means聚類是本文設(shè)計(jì)的方法,基于歐氏距離的k-means聚類算法作為對(duì)照實(shí)驗(yàn);實(shí)現(xiàn)分段后,為檢驗(yàn)本文方法的優(yōu)劣,分別對(duì)該兩種方法進(jìn)行mpca建模,對(duì)其進(jìn)行故障檢測(cè);最后通過故障溯源來找到出現(xiàn)故障的變量。第3章基于聚類分析間歇過程時(shí)段劃分算法程序的設(shè)計(jì)與實(shí)現(xiàn)第3.1節(jié)數(shù)據(jù)獲取及預(yù)處理模塊設(shè)計(jì)與實(shí)現(xiàn)數(shù)據(jù)獲取模塊:對(duì)典型的間歇過程工業(yè)模型進(jìn)行建模和故障檢測(cè),產(chǎn)生故障1(斜坡故障)數(shù)據(jù)和故障2(階躍故障)數(shù)據(jù),作為故障檢測(cè)樣本。數(shù)據(jù)處理模塊:在實(shí)
25、際操作過程中,由于不同變量具有不同的量綱,對(duì)檢測(cè)結(jié)果會(huì)有所影響。為了消除這種由量綱的差異而引起的不合理的影響,所以要對(duì)測(cè)量數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。通常的方法是將x的每一列減去相應(yīng)的變量均值且除以相應(yīng)的變量標(biāo)準(zhǔn)差。數(shù)據(jù)獲取及預(yù)處理模塊的流程如圖31所示。圖31 數(shù)據(jù)獲取及預(yù)處理模塊流程圖關(guān)鍵部分代碼如下:% 讀入數(shù)據(jù)選取有用變量filepath=c:usersqiudesktop故障檢測(cè)作業(yè)大作業(yè)仿真數(shù)據(jù)data;data_n=20;j=1;batch_data=cell(1,data_n);for i = 1:data_n temp = strcat(filepath, num2str(i),.t
26、xt);data_temp = load(temp); vr(:,j)=data_temp(:,2); %ventilation_rate mp(:,j)=data_temp(:,3); %mixing power fr(:,j)=data_temp(:,4); %feed rate sc(:,j)=data_temp(:,6); %substrate concentration do(:,j)=data_temp(:,7); %dissolved oxygen concentration cc(:,j)=data_temp(:,8); %cell concentration pc(:,j)=
27、data_temp(:,9); %penicillin concentration bvc(:,j)=data_temp(:,10); %broth volume change cocd(:,j)=data_temp(:,11); %concentration of carbon dioxide ho(:,j)=data_temp(:,14); %heat outputbatch_datai=vr(:,j) mp(:,j) fr(:,j) sc(:,j) do(:,j) cc(:,j) pc(:,j) bvc(:,j) cocd(:,j) ho(:,j);enddata1=batch_data
28、1 batch_data2 batch_data3 batch_data4 batch_data5 batch_data6 batch_data7 batch_data8 batch_data9 batch_data10 batch_data11 batch_data12 batch_data13 batch_data14 batch_data15 batch_data16 batch_data17 batch_data18 batch_data19 batch_data20;% 數(shù)據(jù)標(biāo)準(zhǔn)化data=zscore(data1);第3.2節(jié)基于k-means的聚類分析算法模塊設(shè)計(jì)與實(shí)現(xiàn)該模塊主要
29、內(nèi)容是關(guān)于基于k-means的聚類分析算法的設(shè)計(jì),結(jié)合本文具體思路和方案,設(shè)計(jì)出基于馬氏距離的k-means聚類分析算法,并實(shí)現(xiàn)對(duì)間歇過程的階段劃分。k-means算法的流程如圖32所示。圖32 k-means算法流程圖無論基于歐氏距離還是馬氏距離,k-means算法整體流程大致相同。但是在第四步、第六步中需要分別按照不同的距離公式進(jìn)行計(jì)算。歐氏距離的計(jì)算公式為兩點(diǎn)之間距離的平方和。如式31。d2x,y=x1-y12+xp-yp2(31)而馬氏距離的的計(jì)算公式為兩個(gè)數(shù)據(jù)點(diǎn)之間的協(xié)方差距離。如式(32)。d2x,g=x-1x-(32)如果協(xié)方差矩陣是奇異的,將導(dǎo)致馬氏距離無法直接被求得。根據(jù)矩陣
30、理論,任一秩為的實(shí)對(duì)稱半正定矩陣,都可按下述方式進(jìn)行分解。為實(shí)對(duì)稱半正定矩陣,假設(shè)的秩為,那么就可以分解為,其中為的對(duì)角陣,是由的非0特征值向量構(gòu)成的非奇異矩陣,為矩陣,由中的特征值所對(duì)應(yīng)的特征向量構(gòu)成。通過這種方式,便可以根據(jù)來求的偽逆(33)另外,除了通過協(xié)方差矩陣的非零特征值集其相應(yīng)的特征向量來求的偽逆,也可以通過樣本的內(nèi)積求得。關(guān)鍵部分代碼如下:% 基于馬氏距離的k均值階段劃分% 對(duì)k個(gè)中心點(diǎn)進(jìn)行初始化m1=100;m2=300;m3=500;m4=700;% 循環(huán)迭代求取馬氏距離count=1;co=cov(data);u,s,v=svd(co);c=inv(s);mx1=data(
31、m1,:);mx2=data(m2,:);mx3=data(m3,:);mx4=data(m4,:);while(count50) k1=0; k2=0; k3=0; k4=0; clear new1 clear new2 clear new3 clear new4 for i=1:800 t1=(data(i,:)-mx1)*c*(data(i,:)-mx1); t2=(data(i,:)-mx2)*c*(data(i,:)-mx2); t3=(data(i,:)-mx3)*c*(data(i,:)-mx3); t4=(data(i,:)-mx4)*c*(data(i,:)-mx4);% 將
32、數(shù)據(jù)點(diǎn)劃分到最近的聚類中心 values,number=min(t1,t2,t3,t4); switch number case 1 k1=k1+1; new1(k1,:)=data(i,:); case 2 k2=k2+1; new2(k2,:)=data(i,:); case 3 k3=k3+1; new3(k3,:)=data(i,:); case 4 k4=k4+1; new4(k4,:)=data(i,:); end end mx1=mean(new1); mx2=mean(new2); mx3=mean(new3); mx4=mean(new4); count=count+1;en
33、d第3.3節(jié)基于mpca的故障檢測(cè)模塊設(shè)計(jì)與實(shí)現(xiàn)mpca方法利用正常數(shù)據(jù)集合確定各子數(shù)據(jù)空間的統(tǒng)計(jì)控制指標(biāo),預(yù)測(cè)誤差平方和,=1,2,并向各自的模型空間投影,進(jìn)行故障檢測(cè)。故障檢測(cè)的流程如圖33所示。利用mpca進(jìn)行數(shù)據(jù)建模,分別計(jì)算和spe統(tǒng)計(jì)量,并利用其檢測(cè)一組新的操作數(shù)據(jù)。用上述分段結(jié)果進(jìn)行分段建模,檢查各點(diǎn)是否超過控制限。超過控制限,說明系統(tǒng)運(yùn)作在該點(diǎn)出現(xiàn)異常,否則,則說明運(yùn)行正常。為了清晰直觀地表示離線監(jiān)視結(jié)果,可以采用多種統(tǒng)計(jì)控制圖如、spe監(jiān)視圖形,每種統(tǒng)計(jì)控制圖分別給出95%,99%兩種統(tǒng)計(jì)控制限。如果新批次過程的統(tǒng)計(jì)指標(biāo)處于統(tǒng)計(jì)控制域或控制限內(nèi)時(shí),表明監(jiān)視過程處于一種統(tǒng)計(jì)控制
34、狀態(tài),否則表明系統(tǒng)處于故障失控狀態(tài)。圖形化表達(dá)信息豐富,表達(dá)方式直觀、易于理解。如果檢測(cè)到故障,則尋找故障發(fā)生的時(shí)間、種類、引發(fā)故障的主要變量將是進(jìn)一步研究的問題。圖33基于mpca的故障診斷流程圖關(guān)鍵部分代碼如下:%求取各階段和spe控制限r(nóng)=mainpc3(latent1);phaset2limit1=(19*r)/(20-r)*finv(0.95,r,20-r);n=size(phase1,2);for i=1:nspem=mean(phasespe1(1+20*(i-1):20*i);spev=std(phasespe1(1+20*(i-1):20*i); phasespelimit1
35、(i)=(spev/(2*spem)*chi2inv(0.95,(2*(spem2)/spev);endfor i=1:n t2limit(phase1(i)=phaset2limit1;spelimit(phase1(i)=phasespelimit1(i);end%在線故障檢測(cè) if(it2limit(i) | spe(i)spelimit(i)fprintf(判斷該點(diǎn)為可能故障點(diǎn),i) end continue end第4章實(shí)驗(yàn)與分析第4.1節(jié)基于k-means的聚類分析算法模塊的實(shí)驗(yàn)與分析4.1.1實(shí)驗(yàn)數(shù)據(jù)獲取本文檢測(cè)仿真數(shù)據(jù)從pensim青霉素發(fā)酵仿真平臺(tái)獲得16,pensim仿真平
36、臺(tái)是由伊利諾科技學(xué)院(illinois institute of technology,iit)cinar教授的過程建模、檢測(cè)及控制研究小組于1998-2002年研究開發(fā)的。pensim仿真平臺(tái)是專門為青霉素發(fā)酵過程二設(shè)計(jì),該軟件的內(nèi)核采用基于bajpai機(jī)理模型改進(jìn)的birol模型,在該平臺(tái)上可以簡(jiǎn)易實(shí)現(xiàn)青霉素發(fā)酵過程的一系列仿真,相關(guān)研究表明該仿真平臺(tái)的實(shí)用性與有效性,因此已經(jīng)成為國(guó)際上較有影響的青霉素仿真平臺(tái)。青霉素仿真平臺(tái)如圖41所示。圖41pensim仿真平臺(tái)本課題所采用的多元批次軌跡數(shù)據(jù)均來自pensim仿真平臺(tái)。采集數(shù)據(jù)均400h,采樣時(shí)間間隔為0.5h,選擇10個(gè)過程變量。產(chǎn)生
37、20批次正常數(shù)據(jù)作為訓(xùn)練樣本x(2010800),產(chǎn)生故障1(斜坡故障)數(shù)據(jù)和故障2(階躍故障)數(shù)據(jù),作為故障檢測(cè)樣本。通過對(duì)比基于馬氏距離的k-means算法與基于歐氏距離的k-means聚類劃分子時(shí)段的mpca建模方法的檢測(cè)效果,以驗(yàn)證本文算法的有效性。4.1.2基于馬氏距離的k-means聚類分析算法的實(shí)驗(yàn)與分析通過pensim仿真平臺(tái)獲得仿真數(shù)據(jù),采集數(shù)據(jù)均400h,采樣時(shí)間間隔為0.5h,選擇10個(gè)過程變量。利用節(jié)3.3設(shè)計(jì)的基于馬氏距離的k-means聚類算法進(jìn)行時(shí)段劃分,選取其中青霉素濃度作為分段樣本數(shù)據(jù)。具體劃分的時(shí)間段如表41所示。分段結(jié)果如圖42所示。表41基于馬氏距離的k
38、-means聚類階段劃分時(shí)間表階段第一階段第二階段第三階段第四階段時(shí)間161629394459460800圖4.2基于馬氏距離的k-means聚類階段劃分圖4.1.4聚類結(jié)果分析通過基于馬氏距離的k-means聚類分析算法的實(shí)驗(yàn)聚類結(jié)果圖可以看出,基于馬氏距離的聚類分析算法產(chǎn)生的分段結(jié)果中,青霉素在不同階段生成的速率有明顯的不同,而在相同階段內(nèi)則比較近似,這與青霉素的實(shí)際生產(chǎn)階段比較符合。第4.2節(jié)基于mpca的故障檢測(cè)模塊的實(shí)驗(yàn)與分析4.2.1 mpca的數(shù)據(jù)預(yù)處理與建模1. 基于mpca的數(shù)據(jù)預(yù)處理對(duì)20個(gè)批次的訓(xùn)練樣本按變量方向展開,獲得每個(gè)階段的二維子數(shù)據(jù)矩陣,通過使用4.1節(jié)所述的k
39、-means聚類分析算法對(duì)20個(gè)批次的訓(xùn)練樣本進(jìn)行階段劃分,得出四個(gè)階段,對(duì)每個(gè)階段數(shù)據(jù)矩陣進(jìn)行標(biāo)準(zhǔn)化處理,消除由量綱的差異而引起的不合理的影響。2. 基于mpca的訓(xùn)練樣本建模對(duì)每個(gè)階段數(shù)據(jù)矩陣使用pca建模獲得每階段的得分矩陣、負(fù)載矩陣,根據(jù)主元貢獻(xiàn)率求得所需主元個(gè)數(shù),并使用式(28),(29)分別計(jì)算和spe控制限,為在線故障檢測(cè)提供有效的檢測(cè)依據(jù)。3. 基于mpca的在線數(shù)據(jù)建模由于在線數(shù)據(jù)是按時(shí)間發(fā)展獲得的,必須使用歷史數(shù)據(jù)所求得的每階段的均值與標(biāo)準(zhǔn)差,再對(duì)在線數(shù)據(jù)進(jìn)行實(shí)時(shí)標(biāo)準(zhǔn)化,根據(jù)公式(212)、(213)、(214)、(215)使用pca建模方法求得該點(diǎn)的和spe值。圖4.3基于馬氏距離分段后的和spe控制限4.2.2故障檢測(cè)結(jié)果圖45給出使用基于馬氏距離的k-means聚類劃分子時(shí)段的mpca建模方法對(duì)故障1(斜坡故障)的檢測(cè)結(jié)果。故障設(shè)定在160-180時(shí)刻加入一個(gè)10%的斜坡故障,如圖44所示。故障情況圖中每個(gè)變量的說明如表42所示。表42故障情況變量說明表變量單位ventilation_rate,通風(fēng)量l/hmixing power,攪拌功率wfeed rate,補(bǔ)料速度l/hcell concentration,菌體濃度g/lsubstrate concentration,底物濃度g/lpenicillin concentr
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 中華傳統(tǒng)美德心得體會(huì)(10篇)
- 員工表揚(yáng)信15篇
- 會(huì)飛的教室讀后感集合
- 中國(guó)好人李培生先進(jìn)事跡
- 他鄉(xiāng)的童年日本紀(jì)錄片觀后感
- 二八定律讀后感
- 個(gè)人無收入證明書(9篇)
- DB12∕T 1050-2021 畜禽糞污異位發(fā)酵床處理技術(shù)規(guī)范
- 報(bào)關(guān)實(shí)務(wù)-教學(xué)課件 第三章 海關(guān)檢驗(yàn)檢疫
- 影響我國(guó)自主創(chuàng)新因素的SVAR分析
- 心肺復(fù)蘇術(shù)課件2024新版
- 四分位數(shù)(課堂PPT)
- 英語1分鐘演講小故事(課堂PPT)
- 很好的QC工程圖范本
- 吸收氨過程填料塔的設(shè)計(jì)吸收塔設(shè)計(jì)完整版
- 培智實(shí)用數(shù)學(xué)11冊(cè)認(rèn)識(shí)鐘表試題整理(共13頁)
- 連續(xù)梁施工作業(yè)要點(diǎn)手冊(cè)(支架現(xiàn)澆)
- 三年級(jí)習(xí)作:菊花教學(xué)指導(dǎo)(課堂PPT)
- 會(huì)議·宴會(huì)預(yù)訂單
- 個(gè)人醫(yī)德醫(yī)風(fēng)檔案
- 局組會(huì)議議題提報(bào)單模板
評(píng)論
0/150
提交評(píng)論