




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
基于m5’模型樹(shù)的汽輪機(jī)組汽耗量特性模型
0熱動(dòng)力學(xué)分析工廠網(wǎng)絡(luò)的分離、價(jià)格調(diào)整、價(jià)格上漲,使得燃料電廠了解設(shè)備的運(yùn)行,并解決特定目標(biāo)函數(shù)和限制條件下的優(yōu)化問(wèn)題。其中最重要的約束條件是機(jī)組的汽耗率特性方程。火電廠凝汽機(jī)組的汽耗量模型的研究相對(duì)較成熟,而熱電廠中大部分是抽汽式機(jī)組,同時(shí)提供熱電兩種負(fù)荷,其汽耗量特性方程更加復(fù)雜、非線性程度更高,建立該類機(jī)組精確的汽耗量預(yù)測(cè)模型十分困難。傳統(tǒng)的汽耗量預(yù)測(cè)模型主要采用基于傳統(tǒng)熱動(dòng)力學(xué)分析方法。該類方法是對(duì)機(jī)組各子系統(tǒng)進(jìn)行熱動(dòng)力學(xué)分析,分開(kāi)考慮供熱、供電負(fù)荷所需的汽耗量,如熱平衡法、等效焓降法。這些方法需要大量的機(jī)組參數(shù),而機(jī)組長(zhǎng)時(shí)間運(yùn)行后,機(jī)組的物理結(jié)構(gòu)參數(shù)可能發(fā)生變化,從而偏離機(jī)組原出廠特性或經(jīng)實(shí)測(cè)的特性參數(shù)。另外,方法沒(méi)有考慮到熱電負(fù)荷的關(guān)聯(lián)關(guān)系,應(yīng)用受到一定的限制。熱電廠信息化程度越來(lái)越高,滾動(dòng)積累了海量的機(jī)組運(yùn)行數(shù)據(jù)。利用這些數(shù)據(jù),結(jié)合數(shù)據(jù)挖掘算法建立汽輪機(jī)組汽耗量模型,可滾動(dòng)擬合機(jī)組汽耗量的特性曲線,以取代傳統(tǒng)定期的現(xiàn)場(chǎng)機(jī)組特性測(cè)試。目前求解汽耗量問(wèn)題常見(jiàn)的方法是多元線性回歸方程(multivariatelinearregressionmodel,MLR)擬合數(shù)據(jù),其基礎(chǔ)是汽耗量具有凸集合并且連續(xù)的曲線特性。文獻(xiàn)[6,10-12]指出抽汽式機(jī)組汽耗量同時(shí)存在凸性與非凸形的特性,此外,由于大多數(shù)機(jī)組本身一些物理?xiàng)l件的限制,如鍋爐壓力等,使其不能處于某些出力范圍內(nèi),即存在禁行區(qū),這導(dǎo)致機(jī)組的出力區(qū)間有間斷現(xiàn)象,因此,采用多元線性回歸方程并不能很好地逼近原非線性的汽耗量曲線。隨著節(jié)能發(fā)電調(diào)度特別是智能調(diào)度的提出,將機(jī)組的非凸或非連續(xù)的耗量曲線近似擬合成凸連續(xù)曲線進(jìn)而采用傳統(tǒng)機(jī)組組合(unitcommitment,UC)模型求解已不能滿足要求。針對(duì)這種復(fù)雜非線性的特性曲線,最有效的方法是采用分段式線性擬合特性曲線,按給定的精度,自動(dòng)優(yōu)選分段數(shù)并逼近原非線性耗量曲線,這正是數(shù)據(jù)挖掘算法——M5’模型樹(shù)算法的優(yōu)勢(shì)。1模型樹(shù)5m1.1基于fm模型樹(shù)的多模式分析算法Breiman等人在1984年提出了分類回歸樹(shù)(ClassificationAndRegressionTree,CART),將樹(shù)結(jié)構(gòu)應(yīng)用到回歸預(yù)測(cè)問(wèn)題。CART的輸出是各個(gè)葉子節(jié)點(diǎn)的目標(biāo)屬性的平均值,只是盡可能地逼近回歸的樹(shù)結(jié)構(gòu)。Quinlan于1992年提出分段式多元線性回歸樹(shù)——M5模型樹(shù),用于解決預(yù)測(cè)問(wèn)題,Wang等人在1997年將M5模型樹(shù)算法進(jìn)行重構(gòu)、改進(jìn)后,形成了M5’模型樹(shù)。與CART的零階模型相比,M5’模型樹(shù)是一階線性模型,構(gòu)建的樹(shù)結(jié)構(gòu)更小,預(yù)測(cè)精度更高,真正意義上實(shí)現(xiàn)了樹(shù)結(jié)構(gòu)的回歸預(yù)測(cè)。M5’模型樹(shù)算法的特點(diǎn):訓(xùn)練規(guī)則簡(jiǎn)單、有效,訓(xùn)練時(shí)間短,透明化程度高以及具有較好的泛化能力。該方法在20世紀(jì)90年代提出后,已經(jīng)廣泛用于解決回歸預(yù)測(cè)問(wèn)題,如:降雨量預(yù)測(cè),洪澇災(zāi)害預(yù)測(cè),水位預(yù)測(cè),含沙量評(píng)估,海浪高度評(píng)估,波譜分析等等。1.2對(duì)第二大空間的分割M5’模型樹(shù)將輸入與輸出參數(shù)之間非線性的關(guān)系轉(zhuǎn)換為一個(gè)分段式線性關(guān)系。M5’劈分的標(biāo)準(zhǔn)是樣本屬性差異化原則(standarddeviationreduction,SDR):式中:T為總樣本空間,其樣本數(shù)為|T|;T被劈為2個(gè)子空間,分別為T1、T2,分別具有樣本數(shù)為|T1|、|T2|;sd(T)是總目標(biāo)屬性標(biāo)準(zhǔn)差,sd(T1)、sd(T2)表示劈分后2個(gè)子空間的目標(biāo)屬性標(biāo)準(zhǔn)差。以圖1的2維輸入為例,可以看出其細(xì)化模型的空間劃分是一個(gè)遞歸空間2分化問(wèn)題:先要制定2分化規(guī)則,即X1、X2平面是先按X2,還是以X2進(jìn)行劈分;其次要決定在何處劈分。一旦這個(gè)問(wèn)題解決,余下的就是被劈分的空間如何再次2分化,可以繼續(xù)按此規(guī)則遞歸,一直到滿足停止條件。設(shè)共有n個(gè)離散的樣本,即X1、X2均具有n個(gè)值;對(duì)X1空間按其樣本值排序,得到序列其中x11≤x12≤x13...≤x1n。依次對(duì)AX1按照x12,x13,…,x1n-1進(jìn)行2分,共有n-2中分法,按式(1)計(jì)算可獲得n-2個(gè)SDR值,設(shè)其最大值為SDRmax(AX1),其對(duì)應(yīng)的分隔點(diǎn)為x1A1。同理,對(duì)X2空間按其樣本值排序,也可獲得其最大值為SDRmax(AX2),其對(duì)應(yīng)的分隔點(diǎn)為x2A2。若SDRmax(AX1)≥SDRmax(AX2),則首先選擇X1進(jìn)行劈分,劈分點(diǎn)為x1A1;否則,則首先選擇X2進(jìn)行劈分,劈分點(diǎn)為x2A2。這樣就可以獲得如圖1(a)的第一個(gè)空間分割線X2=2,及圖1(b)模型樹(shù)的頂級(jí)結(jié)點(diǎn)或跟結(jié)點(diǎn),即X2>2的節(jié)點(diǎn)。對(duì)分割后的平面繼續(xù)按上述規(guī)則,就可以實(shí)現(xiàn)不斷的平面分割,或模型樹(shù)的不斷生成。按以上步驟,從根結(jié)點(diǎn)開(kāi)始,對(duì)每個(gè)結(jié)點(diǎn)遞歸劈分。樹(shù)停止生長(zhǎng)的條件有2個(gè):1是分割結(jié)點(diǎn)樣本數(shù)少于一定數(shù)量停止分割,本文取為4;2是達(dá)到結(jié)點(diǎn)的樣本目標(biāo)屬性的標(biāo)準(zhǔn)差與總體樣本目標(biāo)屬性標(biāo)準(zhǔn)差的比例小于某個(gè)限定值時(shí),樹(shù)停止生長(zhǎng)。本文取值的比值為5%,即由上述分析可知,樣本集的在某結(jié)點(diǎn)處劈分需要確定2個(gè)參數(shù):劈分的輸入分量屬性和劈分閾值。以下是劈分的具體步驟:1)設(shè)結(jié)點(diǎn)處的訓(xùn)練數(shù)據(jù)集T共有n個(gè)樣例,每個(gè)樣本為ti,i=1,2,3,…,n;輸入屬性表示為Xi,i=1,2,…,m;目標(biāo)屬性為Y;計(jì)算訓(xùn)練數(shù)據(jù)集T的標(biāo)準(zhǔn)差為SD。2)對(duì)所有輸入分量Xi,分別按其分量值排序,生成數(shù)據(jù)集Ti,Ti={ti∈T|xi1≤xi2≤xi3...≤xin}。3)對(duì)2)的數(shù)據(jù)集Ti,順序取ixk值(k=2,…,n-1),可以將Ti劈分成2個(gè)子集Ti1={ti∈T|?xij,xij≤xik},Ti2={ti∈T|?xij,xij>xik},共有n-2中劈分組合,分別按式(1)計(jì)算SDR(Ti,ixk)。計(jì)算獲得最大的DRmaxDR()max[(,)]kiiiST=STx。4)對(duì)3)所有輸入分量Xi對(duì)應(yīng)SDRmax(Ti)中選擇最大值,其對(duì)應(yīng)的輸入分量將作為該結(jié)點(diǎn)的劈分分量,對(duì)應(yīng)的該分量的樣本值即該劈分的閥值。該樹(shù)停止生長(zhǎng)的結(jié)點(diǎn)稱為葉子結(jié)點(diǎn),對(duì)葉子結(jié)點(diǎn)樣本,利用線性回歸算法產(chǎn)生一個(gè)多元回歸方程,得到線性模型??梢钥闯?樹(shù)的生長(zhǎng)就是尋找最大的空間分割差異分界,式(1)給出的是按有限樣本的標(biāo)準(zhǔn)差預(yù)測(cè)空間的離散度,并以此作為差異性空間分割的依據(jù)。同時(shí)可以看出,空間分割與分割后的線性方程沒(méi)有直接關(guān)系。1.3遍歷樹(shù)各控制點(diǎn)的線性方程剪枝即是對(duì)某些子樹(shù)進(jìn)行歸并而以葉子結(jié)點(diǎn)取代,以提高整個(gè)模型的簡(jiǎn)潔性和效率。在剪切之前,首先利用線性回歸方法遍歷樹(shù)的各個(gè)結(jié)點(diǎn),擬合出每個(gè)結(jié)點(diǎn)的多元線性方程。剪切的原則為預(yù)測(cè)誤差減少量,即式中:RMSE為該結(jié)點(diǎn)(包括其下屬分支和葉子的所有樣本)出擬合方程預(yù)測(cè)的均方根誤差;RMSEl,RMSEr該結(jié)點(diǎn)劈分后的左、右葉子節(jié)點(diǎn)預(yù)測(cè)的均方根誤差。當(dāng)ER大于0時(shí),該子樹(shù)保留,否則,將該子樹(shù)轉(zhuǎn)變成一個(gè)葉子結(jié)點(diǎn)。剪切過(guò)程也是一個(gè)遞歸的過(guò)程。1.4葉-單位本-擬合線性方程剪切后,樹(shù)的相鄰葉子結(jié)點(diǎn)處可能會(huì)出現(xiàn)一定程度的不連續(xù)性。因此,Quinlan提出樹(shù)葉子結(jié)點(diǎn)的平滑方法。每個(gè)結(jié)點(diǎn)都存在一個(gè)按線性回歸方法擬合的多元線性方程,并且具有相同的參數(shù),因此子結(jié)點(diǎn)與其父結(jié)點(diǎn)的2個(gè)方程合并為1個(gè)新的線性方程即式中:fparent為葉子上級(jí)父結(jié)點(diǎn)擬合方程;fchild為葉子結(jié)點(diǎn)擬合方程;n為到達(dá)本葉子結(jié)點(diǎn)的訓(xùn)練樣本數(shù)目;k為一個(gè)常數(shù)(通常取值為15);fnew為合并的方程;若子結(jié)點(diǎn)采用新函數(shù)后的RMSE變化小于一定的閾值,則將取代子結(jié)點(diǎn)的線性方程,否則不進(jìn)行平滑處理。2數(shù)據(jù)屬性和數(shù)據(jù)處理2.1預(yù)處理方法實(shí)測(cè)數(shù)據(jù)中不可避免地含有不確定的隨機(jī)誤差,這些誤差最終會(huì)導(dǎo)致M5’模型的偏差。因此,在利用這些實(shí)測(cè)數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘之前,必須對(duì)實(shí)測(cè)數(shù)據(jù)進(jìn)行預(yù)處理,以減小采集、傳輸過(guò)程中產(chǎn)生的各種誤差。具體包括:1)數(shù)據(jù)收集與抽取。根據(jù)分析問(wèn)題的要求,通過(guò)條件設(shè)置,從源數(shù)據(jù)集中抽取出樣本數(shù)據(jù)集。2)數(shù)據(jù)采樣。按數(shù)據(jù)挖掘的不同需要,從樣本數(shù)據(jù)集中按照提供的采樣方法抽取分析數(shù)據(jù)集。3)野值的識(shí)別、剔除。用7點(diǎn)二階前推插值算法對(duì)野值進(jìn)行識(shí)別和剔除。4)數(shù)據(jù)補(bǔ)正。經(jīng)過(guò)以上步驟后,數(shù)據(jù)存在不連續(xù)現(xiàn)象,選用7點(diǎn)二階多項(xiàng)式中心插值擬合算法對(duì)剔除數(shù)據(jù)進(jìn)行補(bǔ)正。2.2建模時(shí)的數(shù)據(jù)處理浙江省已建立了“以熱定電”為目的的全省集中建設(shè)的地方熱電廠數(shù)據(jù)采集與管理信息系統(tǒng),對(duì)將近110家電廠進(jìn)行時(shí)間間隔為5min的熱電生產(chǎn)過(guò)程數(shù)據(jù)采集。本文對(duì)其中數(shù)據(jù)完備的熱電機(jī)組汽耗量特性方程進(jìn)行了研究。以某熱電廠型號(hào)為C12-4.9/0.88-HQ單抽機(jī)組為例,選取2008-05-01至2009-04-31跨度為一年的歷史數(shù)據(jù)。每小時(shí)提取1個(gè)樣本,共8760個(gè)樣本,并對(duì)樣本數(shù)據(jù)進(jìn)行預(yù)處理。要識(shí)別機(jī)組進(jìn)汽量F與機(jī)組輸出功率P和蒸汽抽汽量D1的關(guān)系。利用M5’算法訓(xùn)練完成后,該模型樹(shù)的葉子節(jié)點(diǎn)多達(dá)39個(gè),如圖2所示;時(shí)間僅僅花費(fèi)9.45s。從圖2中看出,M5’模型樹(shù)利用輸出功率P與低壓抽汽量D1這2個(gè)屬性將機(jī)組的汽耗量特性分成了多個(gè)多元線性方程,其中LM1~LM4只是其中的幾個(gè)分支:當(dāng)P≤0.94時(shí),汽耗量特性方程為L(zhǎng)M1:當(dāng)0.94<P≤11.46且43.32<D1≤63.46時(shí),汽耗量特性方程為L(zhǎng)M2:當(dāng)11.46<P≤13.26且43.32<D1≤63.46時(shí),汽耗量特性方程為L(zhǎng)M3:當(dāng)13.26<P且43.32<D1≤63.46時(shí),汽耗量特性方程為L(zhǎng)M4:2.3機(jī)組特性分析根據(jù)樣本數(shù)據(jù),采用多元線性回歸方法對(duì)型號(hào)C12-4.9/0.88-HQ單抽機(jī)組進(jìn)行擬合方程,根據(jù)樣本多元線性擬合汽耗特性,其特性方程為2.4預(yù)測(cè)結(jié)果對(duì)比本文采用交叉檢驗(yàn)的方式評(píng)估模型的誤差率。模型評(píng)估指標(biāo)為關(guān)聯(lián)度、絕對(duì)差值率、均方根誤差率。關(guān)聯(lián)度:絕對(duì)差值:均方根誤差:式中:xi為測(cè)試樣本集的進(jìn)汽量數(shù)據(jù);yi為模型預(yù)測(cè)進(jìn)汽量數(shù)據(jù);x為測(cè)試樣本進(jìn)汽量平均值;y為模型預(yù)測(cè)進(jìn)汽量平均值。關(guān)聯(lián)度R表示模型與真實(shí)關(guān)聯(lián)函數(shù)的相似程度,越接近1表明模型越接近真實(shí)關(guān)聯(lián)函數(shù);MAE用于評(píng)判預(yù)測(cè)值與實(shí)際值之間的差異度,注重反映個(gè)體樣本的預(yù)測(cè)效果程度,越小越好。RMSE與MAE類似,但RMSE注重反映樣本總體的預(yù)測(cè)效果程度,值越小越好。由表1可以看出,2個(gè)模型的關(guān)聯(lián)度均很高,說(shuō)明利用M5’和多元線性擬合的方法分析機(jī)組的汽耗量均非常有效。從絕對(duì)差值率和均方根誤差率2個(gè)指標(biāo)看,M5’的預(yù)測(cè)效果明顯優(yōu)于多元線性方程擬合的效果。從圖3可以看出,M5’模型預(yù)測(cè)點(diǎn)比多元線性擬合模型預(yù)測(cè)點(diǎn)更多地分布在對(duì)角線附近,尤其是大值。圖4(a)、(b)分別為采用M5’和多元線性模型進(jìn)行進(jìn)汽量預(yù)測(cè)的一個(gè)片段,可以看出,在00:00—8:30時(shí)段,兩模型預(yù)測(cè)效果基本相同,從5:00—23:55,M5’模型預(yù)測(cè)曲線與實(shí)際的運(yùn)行曲線基本吻合,而多元線性模型預(yù)測(cè)曲線嚴(yán)重偏離了實(shí)際運(yùn)行曲線。2.5有網(wǎng)數(shù)據(jù)的樹(shù)種設(shè)計(jì)M5’模型之所以更好地實(shí)現(xiàn)了對(duì)汽耗量的擬合及其預(yù)測(cè)是因?yàn)镸5’算法有一個(gè)強(qiáng)大的數(shù)據(jù)處理和數(shù)據(jù)擬合的建樹(shù)體系,是一種精巧和高度原則化的學(xué)習(xí)方法。1)M5’樹(shù)結(jié)構(gòu)植根于SDR最大化原則,樹(shù)的大小由訓(xùn)練數(shù)據(jù)本身的離散化程度決定。因此,M5’可以根據(jù)系統(tǒng)的非線性程度來(lái)構(gòu)造樹(shù)結(jié)構(gòu)和大小,更好地逼近目標(biāo)特性曲線。2)M5’葉子節(jié)點(diǎn)不是一個(gè)單一數(shù)據(jù)值,而經(jīng)過(guò)劈分后由若干個(gè)相似度最高的數(shù)據(jù)樣本擬合線性方程,這樣大大增加了M5’算法的泛化能力。M5’采用對(duì)劈法自動(dòng)分段搜索擬合。M5’的葉子節(jié)點(diǎn)的擬合線性方程沒(méi)有直接聯(lián)系,在剪切處理若左右葉子的特性不相同時(shí),該兩葉子不會(huì)被剪切掉;平滑處理中,要判斷平滑
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 電子商務(wù)的跨境合作與國(guó)際化發(fā)展策略
- 現(xiàn)代生活節(jié)奏下的胃腸疾病預(yù)防
- 科學(xué)運(yùn)動(dòng)對(duì)職業(yè)運(yùn)動(dòng)員的重要性
- 包子老店轉(zhuǎn)讓合同范本
- 癌癥患者康復(fù)期營(yíng)養(yǎng)支持與飲食調(diào)整
- 綜采工作面乳化液泵檢修工技能理論考試題庫(kù)150題(含答案)
- 社交網(wǎng)絡(luò)如何重塑現(xiàn)代教育模式
- 二零二五年度金融科技風(fēng)控團(tuán)隊(duì)勞動(dòng)合同
- 二零二五年度信息安全保密協(xié)議簡(jiǎn)述:概念特點(diǎn)與實(shí)施策略
- 2025年度無(wú)手續(xù)房屋買賣環(huán)保評(píng)價(jià)合同協(xié)議
- TTAAA 002-2022 天津市事故機(jī)動(dòng)車貶損價(jià)值評(píng)估標(biāo)準(zhǔn)
- 肝硬化超聲診斷 課件
- 現(xiàn)代節(jié)水灌溉技術(shù)課件
- 幕墻工程項(xiàng)目管理方案手冊(cè)施工管理方案標(biāo)準(zhǔn)化手冊(cè)
- 常用臨床檢驗(yàn)
- VDA6.3 基本知識(shí)培訓(xùn)教材
- 人類行為與社會(huì)環(huán)境全套課件
- 上課用03工程中的價(jià)值利益與公正課件
- 司機(jī)安全培訓(xùn)課件
- 公司年度虧損專項(xiàng)治理方案
- 鋼結(jié)構(gòu)施工進(jìn)度計(jì)劃保障措施
評(píng)論
0/150
提交評(píng)論