基于EEMD-EN-SVR的短期負(fù)荷預(yù)測方法_第1頁
基于EEMD-EN-SVR的短期負(fù)荷預(yù)測方法_第2頁
基于EEMD-EN-SVR的短期負(fù)荷預(yù)測方法_第3頁
基于EEMD-EN-SVR的短期負(fù)荷預(yù)測方法_第4頁
基于EEMD-EN-SVR的短期負(fù)荷預(yù)測方法_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

基于EEMD-EN-SVR的短期負(fù)荷預(yù)測方法

劉輝,黃海林(1.安徽職業(yè)技術(shù)學(xué)院機電工程學(xué)院,安徽合肥230011;2.中國建材集團安徽節(jié)源環(huán)??萍加邢薰?,安徽合肥230088)0引言預(yù)測就是根據(jù)一定規(guī)律來推算事物將來的發(fā)展趨勢.由于預(yù)測問題本身存在復(fù)雜性和不確定性,雖然對于同一個預(yù)測問題而言有多種預(yù)測方法,但是傳統(tǒng)預(yù)測方法的預(yù)測精度往往不能令人滿意[1].因此,新的預(yù)測理論和方法一直是國內(nèi)外學(xué)者研究重點.目前,短期電力負(fù)荷預(yù)測的方法可以分為2大類:傳統(tǒng)預(yù)測方法和人工智能預(yù)測方法[2].其中,傳統(tǒng)預(yù)測方法有回歸分析法、灰色模型、時間序列法、自回歸滑動平均模型等[3];人工智能預(yù)測方法有支持向量機(SupportVectorMachine,SVM)、神經(jīng)網(wǎng)絡(luò)、模糊邏輯方法等[4].短期負(fù)荷預(yù)測易受多種因素干擾和影響,比如夏季氣溫的變化對負(fù)荷波動的影響十分顯著,另一方面,現(xiàn)有的單一負(fù)荷預(yù)測方法往往具有一定的局限性,使用單一的負(fù)荷預(yù)測方法難以取得較好的預(yù)測效果.因此,為提高短期負(fù)荷預(yù)測精度,需要對電力負(fù)荷波動的諸多影響因素進行考慮,提取出那些主要的、有效的影響因素作為特征,降低輸入維數(shù),利用特征處理技術(shù)與單一預(yù)測方法相結(jié)合的組合模型對電力負(fù)荷進行預(yù)測.文中的特征處理技術(shù)涉及原始負(fù)荷序列分解后的特征提取與特征選擇.分解原始負(fù)荷序列的方法有小波變換方法或經(jīng)驗?zāi)B(tài)分解(EmpiricalModeDecomposition,EMD)方法.其中小波變換方法具有局部化特性明顯的優(yōu)勢[5],但該方法要依靠相關(guān)人員的經(jīng)驗來確定所使用的小波基函數(shù)和分解尺度,所以并不是一種自適應(yīng)的分解方法;而EMD方法可以避免小波分解的弊端,自適應(yīng)地分解非平穩(wěn)負(fù)荷序列,從而使得預(yù)測精度進一步提高.神經(jīng)網(wǎng)絡(luò)以及支持向量機方法是目前短期負(fù)荷預(yù)測的主要方法,二者都屬于人工智能預(yù)測法.其中,基于統(tǒng)計理論支持向量機方法能夠得到全局最優(yōu)解,從而避免神經(jīng)網(wǎng)絡(luò)方法存在容易陷入局部最優(yōu)解等問題.結(jié)合現(xiàn)有的研究成果,針對短期電力負(fù)荷易受到復(fù)雜環(huán)境影響且具有非平穩(wěn)性的特點,本文提出一種新的EEMD-EN-SVR組合短期負(fù)荷預(yù)測方法.將基于彈性網(wǎng)回歸(ElasticNet,EN)的特征選擇環(huán)節(jié)加入到集合經(jīng)驗?zāi)B(tài)分解算法(EnsembleEmpiricalModeDecomposition,EEMD)和粒了群算法優(yōu)化的支持向量回歸(PSO-SVR)預(yù)測模型之間.將通過EN方法獲得的最優(yōu)特征集作為優(yōu)化的PSO-SVR預(yù)測模型的輸入特征,再對模型進行訓(xùn)練.本文最后以某地區(qū)的真實負(fù)荷數(shù)據(jù)結(jié)合本文所提方法進行算例分析,結(jié)果表明,本文提出的新的組合預(yù)測模型能夠取得更好的預(yù)測效果.1電力負(fù)荷數(shù)據(jù)及其影響因素1.1負(fù)荷預(yù)測影響因素電力負(fù)荷是具有多種周期疊加的復(fù)雜非線性時間序列[6].它主要取決于生產(chǎn)和生活的規(guī)律性變化,同時受時間、溫度和其他隨機因素的影響.其中時間因素對于用戶的用電的影響主要在于人們生活或工作的規(guī)律性變化.節(jié)假日用電相對于工作日用電都會有較大變化.溫度變化會導(dǎo)致一些大功率電器的使用,從而帶來用電負(fù)荷的變化.降雨對于人們的出行有影響,從而使當(dāng)日用電負(fù)荷增加.還有一些其他隨機因素比如大規(guī)模停電、數(shù)據(jù)記錄錯誤等對于短期電力負(fù)荷預(yù)測的精度影響很大,故需要先對負(fù)荷數(shù)據(jù)進行預(yù)處理,排除此類因素的干擾.1.2負(fù)荷數(shù)據(jù)分析對于原始負(fù)荷數(shù)據(jù)的分析,圖1示例某地區(qū)連續(xù)2個工作日負(fù)荷,圖2示例該地區(qū)連續(xù)2周的工作日負(fù)荷.從圖1中可以看出,相鄰2個工作日的用電負(fù)荷曲線相似程度較高,同時從圖2中可以看出相鄰2周的同時段用電負(fù)荷曲線也較為相似.負(fù)荷變化的周期性為定義預(yù)測模型的輸入特征提供依據(jù).圖1日負(fù)荷曲線圖2周工作日負(fù)荷曲線2基于EEMD-EN-SVR的負(fù)荷預(yù)測模型本文所構(gòu)建的組合負(fù)荷預(yù)測模型主要包括用電特征的定義、特征選擇、負(fù)荷預(yù)測3個部分.具體流程如圖3所示.圖3負(fù)荷預(yù)測模型2.1定義用電特征通常情況下在對某地區(qū)進行負(fù)荷預(yù)測之前,需要對該地區(qū)的負(fù)荷波動特性進行分析,得到該地區(qū)的負(fù)荷變化規(guī)律,定義用電特征.電力負(fù)荷是具有一定周期性和隨機性的多因素疊加的復(fù)雜非線性時間序列.為得到更好的預(yù)測結(jié)果,進行預(yù)測時就不能夠直接提取歷史負(fù)荷數(shù)據(jù)作為負(fù)荷預(yù)測的輸入特征,而應(yīng)將原始負(fù)荷序列進行分解,得出一系列不同頻率近乎平穩(wěn)的分量,通過這些分量找出影響負(fù)荷信號變化的因素,定義用電特征.小波分解和經(jīng)驗?zāi)B(tài)分解是經(jīng)常使用的信號分解方法.小波變換本質(zhì)仍然是傅立葉變換,不適用于解決非線性問題.EMD方法是Hilbert-Huang變換核心部分,是一種新的自適應(yīng)信號處理方法[7].為減少EMD由于信號間歇性而出現(xiàn)的模態(tài)混疊現(xiàn)象,Wu等提出集合經(jīng)驗?zāi)B(tài)分解算法[8].EEMD分解方法適用于各種類型的信號,并且在處理非平穩(wěn)信號上具有明顯的優(yōu)勢,克服小波方法與EMD方法的缺點.因此,本文采用EEMD方法對負(fù)荷數(shù)據(jù)進行分解提取用電特征.EEMD方法基本步驟如下:1)確定EMD分解次數(shù)M,并令當(dāng)前實驗次數(shù)m=1.2)給原始序列x(t)添加隨機高斯白噪聲序列n(t):3)對ym(t)進行EMD分解,得到k個IMF分量ci,m(t),i=1,2,…,k,以及一個剩余分量rk,m(t).4)當(dāng)m<p>5)對M次實驗的所有IMF分量和剩余分量求均值,得到EEMD分解的第k個IMF分量和剩余分量式中,分解次數(shù)M一般選擇100次左右,并且每次添加的高斯白噪聲幅值相同.對于某地區(qū)某周的原始負(fù)荷序列x(t)的EEMD分解如圖4所示.采用EEMD方法將原始負(fù)荷序列自適應(yīng)分解為各個不同時間尺度的IMF分量.其中第1行是原始負(fù)荷序列x(t),第2到6行是不同尺度的IMF分量,第7行是剩余分量,反映從高頻到低頻不同尺度下的負(fù)荷波動特性,相對于原始負(fù)荷序列x(t)的波動更為平穩(wěn).令該地區(qū)第i日第j個時刻點為圖4EEMD分解示意圖則i日j時刻點所對應(yīng)的信號分量如下式:那么對于該用戶第i日的用電特征的定義如式(5)或式(6):Fi中每一列代表該時刻點對應(yīng)的用電特征,F(xiàn)i代表該日的用電特征,將用于下一步的特征選擇.2.2特征選擇在提取用電特征的過程中可能會得到一些對于負(fù)荷波動特性分析無用甚至有偏差的特征.因此,直接采用EEMD分解后的分量所定義的用電特征集可能存在大量冗余或者不相關(guān)的特征.這會導(dǎo)致負(fù)荷預(yù)測模型復(fù)雜度和計算時間大大增加,而特征選擇能夠剔除冗余或不相關(guān)特征,提高模型的泛化能力、精度以及計算速率[9],因此需要對用電行為特征進行選擇.特征選擇的搜索策略方法主要有窮舉式搜索、隨機搜索、啟發(fā)式搜索3種[10].這3種方法各有不同應(yīng)用場景,如果特征數(shù)較少,窮舉式搜索策略較佳;如果需要較快的計算速度可以采用啟發(fā)式搜索;如果對特征子集性能要求較高,同時計算時間又比較寬裕,隨機搜索策略方案最佳[11].依據(jù)特征或者特征子集評價準(zhǔn)則的不同,特征選擇方法還可以進行分類.其中過濾式(Filter)特征選擇方法運行效率高,適合大規(guī)模數(shù)據(jù)集[12].封裝式特征選擇方法(Wrapper)的精確度高,相對來說計算效率低,不適合大規(guī)模數(shù)據(jù)集[13].嵌入式特征選擇方法(Embedded)直接利用所選的特征訓(xùn)練模型來進行特征篩選,并根據(jù)這個模型的表現(xiàn)來評價特征,它比過濾式特征選擇方法的精度高;比封裝式特征選擇方法的計算效率高.本文根據(jù)后續(xù)算法的相關(guān)性選擇嵌入式特征選擇方法中的正則化方法.常用的正則化方法有Lasso回歸、嶺回歸、以及EN等.嶺回歸是帶有L2正則化項的回歸,可以使用嶺回歸來估計選擇特征和壓縮特征系數(shù),但是嶺回歸無法將特征系數(shù)壓縮為0從而產(chǎn)生稀疏解.Lasso方法采用L1正則化改進嶺回歸無法將特征系數(shù)壓縮為0的缺點,從而獲得特征系數(shù)的稀疏解,但是Lasso存在著以下幾種缺點[14-15]:1)對每個特征系數(shù)都進行等量的壓縮,很可能導(dǎo)致過度懲罰;2)無法高效地處理多重共線性問題,如果特征中存在著群組效應(yīng)時,只能選出一個特征而將其余重要特征去除;3)假設(shè)樣本數(shù)量為N,特征數(shù)為p,最多只能選擇出min(N,p)個變量,即當(dāng)p>>N時,最多選出N個特征,會使模型過于稀疏.Zou等提出彈性網(wǎng)回歸(ElasticNet)算法[16],表達(dá)式如下:其中:λ1、λ2是正則化參數(shù),L1范數(shù)能夠求得稀疏解,嶺罰項使得彈性網(wǎng)具有組效應(yīng).由于L1范數(shù)和嶺罰項都有壓縮特征系數(shù)作用,為避免過度壓縮,需要對彈性網(wǎng)進行一次大小為1+λ2的比例變換進行重放縮.令α=λ1/(λ1+λ2),λ=λ1+λ2,則式(7)可以等價于下式:由于L1范數(shù)正則化與L2范數(shù)正則化方法具有互補性,彈性網(wǎng)回歸結(jié)合二者優(yōu)勢,可以有效處理樣本數(shù)量遠(yuǎn)少于特征的問題.因此,本文在特征選擇步驟中選擇彈性網(wǎng)回歸對提取的用電特征進行選擇.在使用ElasticNet方法時,需要對懲罰系數(shù)λ以及α進行合理選擇.本文采用均方根誤差(MSE)作為評價標(biāo)準(zhǔn),即在α值一定的情況下,采用交叉驗證的方式尋找最優(yōu)的懲罰系數(shù)λ,具體步驟如下:1)選取n天的實際用電負(fù)荷數(shù)據(jù),并且從中提取每個時刻點的用電特征Wi以及實際負(fù)荷Load(i,j).2)確定本算法的輸入與輸出,并對輸入進行歸一化處理.其中輸入是待預(yù)測時刻點前7天相同時刻點EMD分解的分量,輸出是該時刻點實際負(fù)荷,對于第i日第j個時刻點,輸入輸出如下式:3)對于本算法選取合適的α值,本文根據(jù)經(jīng)驗,令α=0.5.4)選擇k個不同的λ值,對于每個λξ(ξ=1,2,…,k),將輸入輸出帶入到彈性網(wǎng)中進行十折交叉運算[17],得到10個MSE值,如下式:5)計算10個MSE值的均值MSE′ξ,那么MSE′ξ最小時所對應(yīng)的λξ即為最優(yōu)的懲罰系數(shù)λ.6)利用得到的最優(yōu)λ值重新擬合彈性網(wǎng)回歸,得出最終的特征選擇結(jié)果.2.3負(fù)荷預(yù)測支持向量機估計回歸函數(shù)時,其基本思想是通過非線性變換將輸入向量映射到高維空間中,再利用原空間的核函數(shù)代替高維空間的點積運算.對于訓(xùn)練樣本集,其中xi是輸入,yi為輸出,N為訓(xùn)練樣本個數(shù),回歸函數(shù)如下:上式w是權(quán)重向量,b是截距.采用結(jié)構(gòu)風(fēng)險最小化原理來確定參數(shù)w和b,如下式:式(13)是一個凸二次規(guī)劃問題,它的原始問題的對偶問題可以通過引入Lagrange乘子建立Lagrange函數(shù),并對求偏導(dǎo)置零得出:式中,K(xi,xj)=[?(xi)??(xj)]是滿足Mercer定理的核函數(shù).本文采用的核函數(shù)是高斯核函數(shù)K(xi,xj)從公式的推導(dǎo)過程可以看出,SVR的2個主要參數(shù)懲罰因子C、RBF核函數(shù)參數(shù)σ對于預(yù)測模型的性能至關(guān)重要,傳統(tǒng)的根據(jù)經(jīng)驗所選取參數(shù)值具有主觀性,網(wǎng)格搜索法效率又過低.故本文中采用粒子群優(yōu)化算法(ParticleSwarmOptimiza?tion,PSO)代替常用的網(wǎng)格搜索法對這兩個參數(shù)進行選擇.PSO算法選取最佳參數(shù)的流程如圖5所示.負(fù)荷預(yù)測的輸入為{X1,2,…,k,Xk+1,Xk+2,Xk+3}.其中X1,2,…,k是特征選擇的結(jié)果,Xk+1,Xk+2,Xk+3分別是編碼好的日期類型、平均溫度以及降雨量.特征選擇的結(jié)果要進行歸一化,編碼后的日期類型、平均溫度以及降雨量無需歸一化.對測試集進行預(yù)測的前提是訓(xùn)練集要得到全局最優(yōu)的C和σ,這需要在負(fù)荷預(yù)測模型的各個參數(shù)初始化后通過粒子群算法尋優(yōu).圖5PSO算法流程圖3實驗結(jié)果及分析3.1實驗數(shù)據(jù)及其預(yù)處理本實驗采用的電力負(fù)荷數(shù)據(jù)是來自我國南方某電力公司的真實記錄.用電數(shù)據(jù)每15min記錄一次,每天共96個記錄值.實驗前進行必要的負(fù)荷數(shù)據(jù)預(yù)處理與負(fù)荷預(yù)測影響因素量化.(1)負(fù)荷數(shù)據(jù)預(yù)處理.本實驗所采用數(shù)據(jù)的異常主要包括連續(xù)0值、缺失、負(fù)值、值過大等.對于這些異常數(shù)據(jù),需要對其進行數(shù)據(jù)替換、數(shù)據(jù)修補等預(yù)處理以避免產(chǎn)生過大誤差.數(shù)據(jù)替換通常在負(fù)荷數(shù)據(jù)大量連續(xù)異常時使用,如長時間停電導(dǎo)致用戶負(fù)荷數(shù)據(jù)缺失,此時可采用前后兩個相同時段負(fù)荷的均值來替換.數(shù)據(jù)修補通常用于單個或者少數(shù)連續(xù)異常值,這種情況下可以采用前后兩個時刻點負(fù)荷的均值進行修改.(2)負(fù)荷預(yù)測影響因素量化.在前文中分析負(fù)荷預(yù)測的影響因素有溫度、降雨、日期類型等.需要將溫度和降雨量以及日期類型進行編碼之后才能作為負(fù)荷預(yù)測輸入.對應(yīng)的編碼如表1.表1影響因素編碼3.2實驗設(shè)計本實驗提取該地區(qū)連續(xù)半年的用電負(fù)荷數(shù)據(jù),進行提前1天的短期負(fù)荷預(yù)測,其中預(yù)測日前4周作為訓(xùn)練集.設(shè)計4組實驗來分別驗證本文所提出組合預(yù)測模型的有效性與魯棒性,實驗均在MatlabR2016a上進行,具體內(nèi)容如下:實驗1對比本文提出的組合預(yù)測模型和單一預(yù)測模型,在測試集目標(biāo)日的預(yù)測精度來考察本模型的有效性.實驗2在用電特征定義這一步驟,采用EEMD方法進行特征提取,在對比算法中采用EMD以及小波分解方法進行用電特征提取.實驗3在用電特征選擇這一步驟中采用EN方法,對比算法則采用Lasso方法.實驗4在負(fù)荷預(yù)測這一步驟中采用SVR方法,對比實算則采用廣義回歸神經(jīng)網(wǎng)絡(luò)(generalregres?sionneuralnetworkGRNN)方法.實驗2~4在特征提取、選擇以及負(fù)荷預(yù)測過程中采用別的可替代算法來驗證模型的魯棒性.對于負(fù)荷預(yù)測精度評價采用日平均相對誤差(MAPE)和日均方根誤差(RMSE)2個量化標(biāo)準(zhǔn),如下式:式(16)與(17)中,Load(t)是目標(biāo)日t時刻的實際負(fù)荷值,Load*(t)是目標(biāo)日t時刻的預(yù)測負(fù)荷值.3.3實驗結(jié)果表2對比本文所提出的結(jié)合EEMD與彈性網(wǎng)特征選擇的組合預(yù)測模型和單一預(yù)測模型(GRNN,SVR)在測試集目標(biāo)日的預(yù)測精度.表2、表3、表4分別對比在特征提取、特征選擇、負(fù)荷預(yù)測階段采用不同算法的預(yù)測精度對比.圖6給出在實驗1中組合預(yù)測模型以及2種單一預(yù)測模型在測試集目標(biāo)日的負(fù)荷預(yù)測結(jié)果,圖7給出每個計量點預(yù)測值的百分誤差.圖8、圖9、圖10分別給出在實驗2、實驗3、實驗4中采用不同算法擬合的負(fù)荷預(yù)測結(jié)果.表2本文模型與單一預(yù)測模型精度對比表3不同方法提取特征的精度對比圖63種不同模型在目標(biāo)日的負(fù)荷預(yù)測結(jié)果對比圖7本文模型與單一預(yù)測模型模型預(yù)測誤差對比圖8不同方法提取特征在目標(biāo)日的負(fù)荷預(yù)測結(jié)果對比圖9不同特征選擇方法在目標(biāo)日的預(yù)測結(jié)果對比圖10不同負(fù)荷預(yù)測方法在測試集目標(biāo)日的結(jié)果對比表4不同方法進行特征選擇的精度對比表5不同方法進行負(fù)荷預(yù)測的精度對比3.4實驗結(jié)果分析對表2可以分析得出,本文所提出的基于EEMD-EN-SVR的短期負(fù)荷預(yù)測方法的各項誤差指標(biāo)均優(yōu)于單一預(yù)測方法SVR或GRNN.從圖5和圖6可以看出,本文所提出的組合預(yù)測模型對于待預(yù)測日負(fù)荷曲線擬合效果更好,相對于單一預(yù)測方法SVR或GRNN而言,本方法的精

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論