




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、(封面格式) 報名序號:1249論文題目:某地區(qū)電力負荷數(shù)據(jù)分析與預測姓 名班級有效聯(lián)系電話參賽隊員1陳富安全工賽隊員2謝海燕統(tǒng)計賽隊員3王浩統(tǒng)計導教師:唐玲參賽學校:安徽建筑大學南區(qū)證書郵寄地址、郵編、收件人:地址: 安徽合肥市經(jīng)開區(qū)紫云路292號安徽建筑大學南區(qū) 郵政編碼:230061收件人姓名: 陳富 聯(lián)系電話: 131155146667 報名序號:1249論文題目:某地區(qū)電力負荷數(shù)據(jù)分析與預測閱卷專家1閱卷專家2閱卷專家3論文等級某地區(qū)電力負荷數(shù)據(jù)分析與預測摘 要針對兩個地區(qū)歷史數(shù)據(jù)分析及未來數(shù)據(jù)相關預測,本
2、文用統(tǒng)計學相關理論為基礎對兩個地區(qū)歷史數(shù)據(jù)進行探索分析,深入并直觀的描述了數(shù)據(jù)的分布情況;同時利用時間序列乘積季節(jié)模型和LMBP神經(jīng)網(wǎng)絡模型分別對未來數(shù)據(jù)進行預測并進行相關誤差分析,分別得到不同預測方法下的預測結果。對于問題一,本文對兩個地區(qū)2014年1月1日2014年12月31日的負荷數(shù)據(jù)進行挖掘分析,選取描述數(shù)據(jù)集中趨勢的均值和中位數(shù)統(tǒng)計量、描述數(shù)據(jù)分布離散程度的方差和離散系數(shù)統(tǒng)計量以及描述數(shù)據(jù)分布偏態(tài)與峰度的偏度系數(shù)和峰度系數(shù)統(tǒng)計量來描述各地區(qū)全年的日最高負荷、日最低負荷、日峰谷差、日負荷率指標的分布情況;繪制出了兩地區(qū)2014年全年負荷持續(xù)曲線;結合上述結果,分析出地區(qū)2負荷變化數(shù)據(jù)波
3、動較平緩,初步預判地區(qū)2的負荷可以獲得更準確的預測結果。對于問題二,本文根據(jù)2012年1月1日至2014年12月31日的數(shù)據(jù),用偏最小二乘法,分別對日最高負荷、日最低負荷、日平均負荷與各氣象因素關系進行回歸分析,得出6個多元線性回歸模型,同時得到各個回歸模型的離差平方和,以離差平方和的大小來反映回歸誤差的大?。皇褂煤唵蜗嚓P系數(shù)檢驗法,通過各個氣象因素相互之間的相關系數(shù)矩陣,得出最高溫度、最低溫度、平均溫度這三個因素相關系數(shù)較高,存在多重共線性;再經(jīng)過變量的顯著性檢驗,得出若要用氣象因素來提高負荷預測精度,優(yōu)先推薦平均溫度、降雨量、濕度這三個氣象因素的結論。對于問題三,考慮到歷史電力負荷數(shù)據(jù)具有
4、明顯的周期性,建立時間序列乘積季節(jié)模型,對兩個地區(qū)2015年1月11日至17日共7天的電力負荷進行預測,得出負荷預測結果見附件。由于模型中各個參數(shù)均通過了參數(shù)的顯著性檢驗,殘差序列通過了殘差檢驗為白噪聲序列,體現(xiàn)了模型對原序列的信息提取十分充分,所以在不知道實際負荷數(shù)據(jù)的情況下,有充分理由判斷預測結果的準確度是較高的。對于問題四,考慮最日高溫度等5個天氣因素,利用包含5個輸入層,7個隱含層和一個輸出層的LMBP神經(jīng)網(wǎng)絡預測模型在5個天氣因素影響下,再次對兩個地區(qū)2015年1月11日至17日共7天的電力負荷進行預測,得出負荷預測結果見附件。對于問題五,綜合上述結果參數(shù),并同時引用股票分析中的黃金
5、分割線對兩個地區(qū)負荷數(shù)據(jù)規(guī)律優(yōu)劣進行評價。得出地區(qū)2的數(shù)據(jù)規(guī)律性優(yōu)于地區(qū)1的結論。關鍵詞:描述性統(tǒng)計,偏最小二乘回歸,時間序列乘積季節(jié)模型,LMBP§1 問題的提出一、背景知識短期負荷預測是電力系統(tǒng)運行與分析的基礎,對機組組合、經(jīng)濟調(diào)度、安全校核等具有重要意義。提高負荷預測精度,是保障電力系統(tǒng)優(yōu)化決策科學性的重要手段。現(xiàn)代電力系統(tǒng)中,構成電力負荷的用電器種類繁多,空調(diào)等受氣象條件影響的負荷占比持續(xù)增高,氣象因素(溫度、濕度、降雨量等)對電力系統(tǒng)負荷的影響愈顯突出。考慮氣象因素成為調(diào)度中心進一步改進負荷預測精度的主要手段之一。二、相關試驗數(shù)據(jù)已知地區(qū)1、地區(qū)2從2009年1月1日至20
6、15年1月10 日的電力負荷數(shù)據(jù)(每15min 一個采樣點,每日96點,量綱為MW)以及2012年1月1至2015年1月17 日的氣象因素數(shù)據(jù)(日最高溫度、日最低溫度、日平均溫度、日相對濕度以及日降雨量),詳見附件1-數(shù)據(jù).xlsx。三、要解決的問題1.請分析兩個地區(qū)2014年1月1日-2014年12月31日的負荷數(shù)據(jù),統(tǒng)計各地區(qū)全年的日最高負荷、日最低負荷、日峰谷差、日負荷率指標的分布情況,并繪制兩地區(qū)2014年全年的負荷持續(xù)曲線;結合上述結果,分析兩地區(qū)負荷變化的主要差異;初步預判哪個地區(qū)的負荷可以獲得更準確的預測結果,說明你的理由。2.根據(jù)2012年1月1日至2014年12月31日的數(shù)據(jù)
7、,分別對日最高負荷、日最低負荷、日平均負荷與各氣象因素的關系進行回歸分析,分析回歸誤差;如果要用氣象因素來提高負荷預測精度,在諸氣象因素中,你優(yōu)先推薦哪個(或哪幾個)?簡要說明理由。3.請根據(jù)已知負荷數(shù)據(jù),構建預測方法,對兩個地區(qū) 2015年1月11日至17日共7天的電力負荷進行預測(間隔 15min),給出負荷預測結果(提交兩個地區(qū)96*7負荷預測結果數(shù)據(jù),具體要求見附錄1);在不知道實際負荷數(shù)據(jù)的條件下,你對預測結果的準確度有何推斷,請說明理由。4.如果已獲得2015年1月11日至17日的氣象因素數(shù)據(jù),你能否構建計及氣象因素的負荷預測方法,對兩個地區(qū)2015年1月11 日至17日共7天的電
8、力負荷再次進行預測(間隔 15min),給出預測結果(提交兩個地區(qū) 96*7負荷預測結果數(shù)據(jù),具體要求見附錄1);與原有的預測結果相比,你認為計及氣象因素影響的負荷預測結果精度得到改善了嗎?有何證據(jù)?請說明理由。5.綜合上述計算結果,你如何評價兩地區(qū)負荷規(guī)律性的優(yōu)劣?你還有什么證據(jù)可以佐證兩地區(qū)負荷整體規(guī)律性優(yōu)劣的判斷?§2 問題的分析1) 對于問題一,本文使用統(tǒng)計學方法,并利用MATLAB對所給數(shù)據(jù)進行處理,分別繪制出日最高負荷、日最低負荷、日峰谷差、日負荷率四個指標分別隨時間變化的曲線圖,并且分別得出數(shù)據(jù)的集中趨勢、數(shù)據(jù)分布離散程度和數(shù)據(jù)的分布偏態(tài)與峰度3個大方面來描述統(tǒng)計分布情
9、況。2) 對于問題二,本文對日最高負荷、日最低負荷、日平均負荷與各氣象因素的關系進行偏最小二乘多元回歸分析,在EVIEWS軟件中分別得出兩個地區(qū)6個線性回歸方程,并同時對線性回歸方程誤差進行了分析。3) 對于問題三,要求由已知負荷數(shù)據(jù)對兩個地區(qū)2015年1月11日至17日共7天的電力負荷進行預測。相對于已知數(shù)據(jù)來說,預測屬于短期預測。故本文利用時間序列季節(jié)乘積模型對這7天數(shù)據(jù)進行預測。4) 對于問題四,要求利用2015年1月11日至17日的氣象因素數(shù)據(jù)構建計及氣象因素的負荷預測方法,同樣的對兩個地區(qū)2015年1月11日至17日共7天的電力負荷再次進行預測。本文在MATLAB中利用LMBP算法進
10、行7天電力負荷再次預測。5) 對于問題五,要求綜合上述計算結果,比較兩地區(qū)負荷數(shù)據(jù)的優(yōu)劣。本文通過選取上述計算結果日峰谷差方差等幾項具有代表性的參數(shù)來對兩地區(qū)數(shù)據(jù)規(guī)律性進行綜合評價,并結合股票中黃金分割線思想來進一步佐證評價結果。§3模型假設1)假設所有數(shù)據(jù)來源真實可靠;2)假設電負荷量只受題目所給五項氣象因素影響3) 在建立乘積季節(jié)模型,序列周期選取時,假設一年都是365天;§4名詞解釋與符號說明一、名詞解釋1) 日最高負荷:典型日中記錄的負荷中,數(shù)值最大的一個;2) 日最低負荷:典型日中記錄的負荷中,數(shù)值最小的一個;3) 日峰谷差:日最高負荷與最低負荷之差;4) 日負荷
11、率:日平均負荷與日最大負荷的比值;5) 年持續(xù)負荷曲線:按一年中系統(tǒng)負荷的數(shù)值大小及其持續(xù)小時數(shù)順序繪制的曲線;6) 離散系數(shù):一組數(shù)據(jù)標準差與其均值的比,也稱為標準差系數(shù),是測度數(shù)據(jù)離散程度的相對指標;7) 偏度系數(shù):是描述分布偏離對稱性程度的一個特征數(shù)。當分布左右對稱時,偏度系數(shù)為0。當偏度系數(shù)大于0時,即重尾在右側時,該分布為右偏。當偏度系數(shù)小于0時,即重尾在左側時,該分布左偏。8) 峰度系數(shù):峰度是用來反映頻數(shù)分布曲線頂端尖峭或扁平程度的指標。有時兩組數(shù)據(jù)的算術平均數(shù)、標準差和偏態(tài)系數(shù)都相同,但他們分布曲線頂端的高聳程度卻不同。二、符號說明序號符號含義1X、Y解釋變量、被解釋變量2、解
12、釋變量的第一主成分3表示解釋變量矩陣X中第j個變量的第i個樣本值4表示被解釋變量矩陣Y中第i個樣本值5表示標準化后的數(shù)值, 6表示標準化后的數(shù)值7E0、F0標準化矩陣8表示y關于的回歸系數(shù)9表示原變量的與之間的相關系數(shù)10表示誤差對權值微分的雅克比矩陣§5 模型的建立與求解一、 問題一的分析與求解根據(jù)上文中對日最高負荷、日最低負荷、日峰谷差以及日負荷率的相關描述,再由附件中所提供的兩個地區(qū)2014年1月1日-2014年12月31日的負荷數(shù)據(jù),利用MATLAB軟件繪制出了兩個地區(qū)全年的日最高負荷、日最低負荷、日峰谷差、日負荷率四個指標分別隨時間變化的折線圖,如圖1(相關程序見附錄一)。
13、圖 1 兩個地區(qū)各指標對比圖根據(jù)統(tǒng)計學1中常用來描述數(shù)據(jù)特征,再結合本題所給數(shù)據(jù)特點,本文選取了數(shù)據(jù)的集中趨勢(均值、中位數(shù))、數(shù)據(jù)分布離散程度(方差、離散系數(shù))和數(shù)據(jù)的分布偏態(tài)與峰度(偏度系數(shù)、峰度系數(shù))三個大方面中六個參數(shù)對兩個地區(qū)2014年1月1日-2014年12月31日的全年的日最高負荷、日最低負荷、日峰谷差、日負荷率四個指標數(shù)據(jù)進行進一步描述。利用SPSS軟件求出數(shù)據(jù)的六個參數(shù),如表1所示。表 1 兩個地區(qū)相關數(shù)據(jù)分布表集中趨勢分布離散程度分布偏態(tài)與峰度均值中位數(shù)方差離散系數(shù)偏度系數(shù)峰度系數(shù)日最高地區(qū)19222.6529324.6584304937.5330.225-0.9991.3
14、28負荷地區(qū)29786.9159141.2124132055.4470.208-0.2160.089日最低負荷地區(qū)15140.6495007.4851515519.7720.239-0.5800.478地區(qū)25330.6494662.3052022676.6880.2670.193-0.692日峰谷差地區(qū)14081.7284317.1731259224.6920.275-0.8610.490地區(qū)24456.2674478.908730535.0850.192-0.6500.512日負荷率地區(qū)10.7900.7772190.0010.0401.0391.328地區(qū)20.8000.7947040.
15、0010.0400.6940.089根據(jù)上文中對全年的負荷持續(xù)性曲線的相關,再由附件中所提供的兩個地區(qū)2014年1月1日-2014年12月31日的負荷數(shù)據(jù),利用MATLAB軟件繪制出了兩個地區(qū)全年的負荷持續(xù)性曲線圖(相關程序見附錄一),如圖2所示。圖 2 全年持續(xù)性曲線由圖1可知:在全年的日最高負荷、日最低負荷、日峰谷差、日負荷率四個指標中地區(qū)2數(shù)值高于地區(qū)1的數(shù)值,說明地區(qū)2的總體用電量大于地區(qū)1的用電量。由表1可知:地區(qū)2統(tǒng)計平均數(shù)大于地區(qū)1,同樣證明地區(qū)2總體用電量較大,再對比方差等其他參數(shù),地區(qū)2的數(shù)據(jù)波動范圍相對較小,數(shù)據(jù)的分布較為集中,且較為對稱。由圖2同樣可知,地區(qū)2的用電量在幾
16、乎全年各時刻均高于地區(qū)1的用電量。在大量數(shù)據(jù)的前提下做預測分析,數(shù)據(jù)變化范圍越小,預測結果越準確。由上述分析可知,地區(qū)2的數(shù)據(jù)更加平穩(wěn),波動范圍小,所以在后續(xù)負荷預測中,地區(qū)2相對于地區(qū)1可以獲得更為準確的結果。二、問題二的分析與求解5.2.1 偏最小二乘法回歸分析原理偏最小二乘回歸分析2是多元線性回歸分析、典型相關分析及主成分分析有機結合。在主成分分析基礎理論中,從被解釋量X和解釋變量Y中提取的第1主成分和應盡量多地攜帶原始數(shù)據(jù)的變異信息,時所提取的成分方差達到最大,則有 (1)式中、表示和的方差。在典型相關分析中,為保證解釋量與被解釋量之間的相關性,在典型成分和的提取過程中,應使典型成分之
17、間的相關性關系最大,則有 (2)式中表示和的相關系數(shù)。這樣,在X和Y中提取的成分和不僅能夠最大程度上地攜帶X和Y的基本信息,而且保值了和具有比較強大的解釋能力。提取第1個主成分后,實施X和Y對的回歸分析,如果精度滿足要求,則不再計算;否則,提取殘余信息繼續(xù)進行回歸分析,直到滿足要求為止。如果最終對X共提取m個成分,則Y對X回歸分析即可以轉化為Y對的一組多元回歸分析,而自變量X主成分均可由X線性表示,所以最后可還原成Y對X的回歸方程。5.2.2 具體建模求解根據(jù)解釋量個數(shù)不同,偏最小二乘回歸分析可分為單變量偏最小二乘回歸分析和多變量偏最小二乘回歸分析。根據(jù)題目要求,本文分別對日最高負荷、日最低負
18、荷和日平均負荷三個被解釋變量進行多變量偏最小二乘回歸分析。1)設已知被解釋變量日最高負荷y和5個解釋變量(最高溫度)、(最低溫度)、(平均溫度)、(相對濕度)和(降雨量),樣本數(shù)為n(n=1096),形成解釋變量矩陣和被解釋矩陣。將X與Y進行標準化處理,得到標準化后的解釋變量矩陣E0和被解釋變量矩陣F0。做標準化處理是為了公式表達的方便和減少預算誤差。 (3)i=1,2,L,k;j=1,2,3,4,5式中:表示解釋變量矩陣X中第j個變量的第i個樣本值;表示解釋變量X中第j個變量個均值,表示的標準差, 表示被解釋變量矩陣Y中第i個樣本值, 表示被解釋變量y的均值, 表示被解釋變量y的標準差,表示
19、標準化后的數(shù)值,表示標準化后的數(shù)值。2)從E0中提取第1主成分,其中w1為E0的第1主軸,即,E0和F0均是標準化矩陣,則有 (4) (5) 式中:E0i(i=1,2,L,k)表示E0的第i列,(i=1,2,L,k)表示與y的相關系數(shù)。在簡化算法中只需求出E0對的回歸系數(shù)即可,無需實施F0對的回歸。 (6) (7)式中:表示E0對的回歸系數(shù),E1表示回歸方程殘差矩陣 (8)3)重復建模步驟2),以E1取代E0,以F1取代F0,用同樣的方法得到;由于不再是標準化矩陣,所以有 (9) (10) (11) (12)式中表示與y的協(xié)方差。依次類推,從第4)步開始,可用交叉有效性來確定偏最小二乘回歸分析
20、中成分提取個數(shù),并停止迭代。在得到成分( m<A,A=rank(X))后,然后再實施F0關于的回歸分析,即為 (13)由于(h=1,2,L,m)均為E0的線性組合,所以有 (14)記,其中I為單位矩陣,所以綜合可得: (15)若記,則標準化變量關于的回歸方程為 (16)最后,通過標準化的逆過程,可得到y(tǒng)關于的回歸方程為 (17)式中表示y關于的回歸系數(shù)。5)分別改變對應被解釋變量,重復以上步驟,分別對日最高負荷、日最低負荷和日平均負荷三個被解釋變量進行回歸分析。利用EVIEWS進行求解(具體結果見附錄二),整理后結果如表2所示。表2 線性回歸曲線表地區(qū)1地區(qū)2日最高負荷日最低負荷日平均負
21、荷5.2.3 氣象因素選擇下面進行氣象因素的選?。菏紫扔蒃VIEWS分析,得到五個氣象因素相互之間的相關系數(shù),匯成關系數(shù)表,如下所示:表3 地區(qū)一各氣象因素相關系數(shù)表X1X2X3X4X5X110.91290.95690.13120.01261X20.912910.98410.31140.0988X30.95690.984110.21690.0644X40.13120.31140.216910.3649X50.012610.09880.06440.36491表4 地區(qū)二各氣象因素相關系數(shù)表X1X2X3X4X5X110.79450.96160.13810.0322X20.794510.87810.
22、39850.1775X30.96160.878110.27880.1152X40.13810.39850.278810.4111X50.03220.17750.11520.41111從兩個地區(qū)氣象因素相關系數(shù)表可以看出兩兩之間相關系數(shù)較大,均接近與1,根據(jù)綜合判別法與簡單相關系數(shù)檢驗法分析的結果可以知道,本案例的最高溫度、最低溫度、平均溫度這三個回歸變量間確實存在多重共線性,變量蘊含的信息相互交叉影響,沒有必要將這三個變量全部引進模型,可以經(jīng)過分析對其中個別變量進行剔除3。接下來,構造統(tǒng)計量,進行變量的顯著性檢驗。在變量的顯著性檢驗中,針對變量設計的原假設與備擇假設為: 給定一個顯著性水平,得
23、到臨界值,于是可根據(jù)來決定拒絕,從而判定對應的解釋變量是否應包含在模型中。本題對六個回歸方程進行參數(shù)的顯著性檢驗,EVIEWS軟件的回歸結果見附錄二,觀察各個方程中每個回歸變量統(tǒng)計量對應概率值的大小,可以得出變量的統(tǒng)計量對應概率值基本上小于給定顯著性水平,通過參數(shù)的顯著性檢驗;而變量的統(tǒng)計量對應概率值基本上大于,不通過參數(shù)的顯著性檢驗。綜合以上兩點,如果要用氣象因素來提高負荷預測精度,在這五個氣象因素中,我優(yōu)先推薦平均溫度、相對濕度、降雨量這三個氣象因素。三、問題三的分析與求解5.3.1 時間序列乘積季節(jié)模型原理當序列具有短期相關性時,通??梢允褂玫碗A模型提取。當序列具有季節(jié)效應,季節(jié)效應本身
24、還具有相關性時,季節(jié)相關性可以使用以周期步長為單位的模型提取。由于短期相關性和季節(jié)效應之間具有乘積關系,因此擬合模型實質為與的乘積。綜合前面的階趨勢差分和階以周期為步長的季節(jié)差分運算,對原觀察值序列擬合的乘積季節(jié)模型4-5結構如下: (18)式中:該乘積季節(jié)模型簡記為。5.3.2 具體建模本文針對問題三,在EVIEWS軟件做出兩個地區(qū)原序列的時序圖與差分后時序圖。1)確定時間序列季節(jié)乘積模型:首先考慮的是簡單加法季節(jié)模型擬合原始序列再對7天各個時間節(jié)點的電負荷量進行預測,進行模型檢驗時,產(chǎn)生的殘差序列延遲6步、12步、18步的統(tǒng)計量對應概率值均小于,說明殘差序列為非白噪聲序列,不通過模型的殘差
25、檢驗,可以得出模型對序列信息的提取不夠充分的結論。充分說明序列的季節(jié)效應、長期趨勢效應和隨機波動間有著復雜的交互影響關系,使用簡單的模型不足以提取其中的相關關系,所以這時我們考慮使用乘積季節(jié)模型對原序列進行擬合。 地區(qū)二原序列時序圖 地區(qū)二差分后時序圖圖 3 時序圖兩個地區(qū)2009年1月1日2015年1月10日的電力負荷序列時序圖顯示該序列具有長期遞增趨勢和以年為周期的季節(jié)效應,先對序列最一階差分消除線性增長趨勢,每隔15分鐘做一次記錄,所以該序列周期步長為35040(),接下來再做一階步長為35040的差分消除序列周期性。2)模型定階:首先考慮1階35040步差分過后,序列12階以內(nèi)的自相關
26、系數(shù)和偏自相關系數(shù)的特征,以確定短期相關模型。考察兩個地區(qū)序列差分后自相關圖和偏自相關圖(見附錄三),自相關圖和偏自相關圖顯示12階以內(nèi)的偏相關系數(shù)2階截尾,所以嘗試使用模型提取差分后序列的短期相關信息。使用模型提取差分后序列的季節(jié)相關信息。綜合前面的信息我們要擬合的乘積季節(jié)模型為即: (19)3)模型擬合:使用最小二乘估計方法,確定擬合該模型的口徑為:地區(qū)一:地區(qū)二: 4)序列預測:使用該模型預測兩個地區(qū)2015年1月11日1月17日的電力負荷(每間隔15min),負荷預測結果見附件Q3-Area1-Load.xlsx與附件Q3-Area2-Load.xlsx。圖4 乘積季節(jié)模型擬合效果圖在
27、不知道實際負荷數(shù)據(jù)的條件下,本文推斷預測結果的準確度較高。從圖4兩個地區(qū)電力負荷序列模型擬合效果圖可以看出,擬合出的圖曲線與原差分后序列接近程度較高,殘差曲線在0附近波動;因為兩個時間序列乘積季節(jié)模型均通過了參數(shù)的顯著性檢驗,充分說明模型參數(shù)的選取是合理的;模型產(chǎn)生的殘差序列為白噪聲序列,不具有短期相關性,通過了殘差檢驗,表明模型對原序列的信息提取較為充分,綜合以上三個方面說明模型合理有效,使用該模型進行預測,預測的結果必然準確度較高。四、問題四的分析與求解5.4.1 主成分分析本文有最高溫度、最低溫度、平均氣溫、相對濕度、降雨量五個氣象因素,每個變量都在不同程度上反映了研究問題的模型特征,但
28、指標之間彼此有一定的相關性,因而所得的統(tǒng)計數(shù)據(jù)反應的信息在一定程度上有所重疊。主成分分析旨在利用降維的思想,把多指標轉化為較少幾個綜合指標,用較少的幾個綜合指標來代替原來的指標,而且這些較少的綜合指標能盡量多的反映原來較多變量指標所反映的信息,同時綜合指標之間是彼此獨立的。假定有個樣本,每個樣本有個變量,構成一個階的數(shù)據(jù)矩陣:主成分分析具體過程如下:(1)將原始數(shù)據(jù)標準化為0,1之間的有效數(shù)據(jù);(2)計算相關系數(shù)矩陣:式中:為原變量的與之間的相關系數(shù),其計算公式為: (20)因為是實對稱矩陣(即),只需要計算上三角元素或者下三角元素即可;(3)計算特征值與特征向量:首先解特征方程,用雅可比法求
29、出特征值,并使其按大小順序排列;然后分別求出各個特征值對應的特征向量:;(4)計算主成分貢獻率及累計貢獻率:主成分的貢獻率為: (21)累計貢獻率為: (22)一般取累計貢獻率達到85%95%的特征值所對應的第一、第二、第個主成分;(5)新樣本矩陣的構造:定義:記為原變量指標,為新變量指標,根據(jù)下式計算每個主成分的各個樣本值。 (23)系數(shù)的確定原則:與相互無關;是的所有線性組合中方差最大者,是與不相關的的所有線性組合方差最大者;是與都不相關的的所有線性組合中方差最大者。則新變量指標分別稱為原變量指標的第1,第2,第主成分,它們分別是相關矩陣個較大特征值所對應的特征向量。5.4.2 LMBP建
30、模具體求解在傳統(tǒng)BP網(wǎng)絡預測的學習過程中,分別通過正向傳播和反向傳播兩個過程的交替進行,在權向量空間執(zhí)行誤差函數(shù)梯度下降策略,動態(tài)迭代搜索一組權向量,使網(wǎng)絡誤差值達到最小值,來完成信息提取和記憶兩個過程傳統(tǒng)BP算法采用的最速下降算法,在開始幾步下降相對較快,但隨著接近最優(yōu)值,目標函數(shù)下降逐漸變緩;牛頓法則可在最優(yōu)值附近提供一個理想的搜索方向。Levenberg-Marquardt法實際上就是梯度下降法和牛頓法的結合,而且網(wǎng)絡權值數(shù)目較少時收斂速度非常迅速。針對標準BP神經(jīng)網(wǎng)絡算法固有的一些缺陷,考慮到實驗樣本數(shù)目和網(wǎng)絡的收斂速度,本文引入Levenberg-Marquardt算法6-7進行網(wǎng)絡
31、學習。算法基本思想是使每次迭代不在沿著單一負梯度方向,而是允許誤差沿著惡化的方向進行搜索,同時通過在最速梯度下降法和牛頓法之間自適應調(diào)整來優(yōu)化網(wǎng)絡權值,使網(wǎng)絡有效收斂,提高了網(wǎng)絡的收斂速度和泛化能力。L-M優(yōu)化算法的權值調(diào)整公式為: (24)式中:為誤差向量,為誤差對權值微分的雅克比矩陣,為一個標量,當增加時,它接近于具有較小的學習速率的下降法,當下降到0時,該算法就變成了高斯牛頓法基于主成分分析LMBP電力負荷預測步驟如下:(1)主成分分析處理天氣因素,將多個有一定相關的氣象因素通過主成分分析法降維處理,用少數(shù)不相關氣象特征變量來代表;(2)數(shù)據(jù)歸一化,將數(shù)據(jù)處理為0,1之間的有效數(shù)據(jù)。本文
32、采用的歸一化方式為: ;(3)建立LMBP神經(jīng)網(wǎng)絡,包括根據(jù)Kolmogorov定理粗略確定網(wǎng)絡層次,層節(jié)點數(shù),再多次實驗來確定,輸出層節(jié)點數(shù)應與輸出量個數(shù)相同;(4)設定訓練參數(shù)進行訓練,完成訓練后,調(diào)用訓練結果,輸入測試數(shù)據(jù)進行測試;(5)得到目標測試數(shù)據(jù),進行反歸一化,還原為原始范圍數(shù)據(jù)將相關數(shù)據(jù)統(tǒng)計整理,導入MATLAB中進行計算(相關程序見附錄四),結果見附件Q4-Area1-Load.xlsx與附件Q4-Area2-Load.xlsx。5.4.3 模型對比評價我認為本題與原有的預測結果相比,計及氣象因素引影響的負荷預測結果精度提高了。因為一方面使用本問題的LMBP模型,不僅使用以往
33、的歷史負荷數(shù)據(jù)訓練神經(jīng)網(wǎng)絡模型,在此基礎上在進行電力負荷序列預測是引入了氣象因素作為影響因素,相較于此前單單以歷史數(shù)據(jù)擬合模型作為預測模型,考慮更為全面,且經(jīng)過驗證氣象因素確實可以對電力負荷產(chǎn)生一定程度的影響;另一方面,相比于前面建立的模型,本題建立的LMBP模型的離差平方和有所降低,表示此模型對原有序列信息的提取更加充分,進一步說明與原有的預測結果相比,計及氣象因素引影響的負荷預測結果精度有所提高。五、問題五的分析與求解5.5.1數(shù)據(jù)綜合評價根據(jù)上文對兩地負荷規(guī)律性分別統(tǒng)計分析法、時間序列法和人工智能算法三種方式研究,現(xiàn)選取三種方式中具有代表性的參數(shù)來綜合比較兩地區(qū)負荷分布規(guī)律,如表2所示。
34、表 5 相關參數(shù)表日峰谷差方差回歸方程平均離差平方和乘積季節(jié)模型離差平方和LMBP模型training:R地區(qū)11259224.6921.795×1092.92×1040.7452地區(qū)2730535.0851.554×1091.57×1040.7652由上表可知:地區(qū)2的日峰谷差方差相對于地區(qū)1較小,說明地區(qū)2負荷數(shù)據(jù)波動范圍較??;地區(qū)2回歸方程平均離差平方和與乘積季節(jié)模型離差平方和相對于地區(qū)1較小,反映模型對原序列的信息提取比較充分,從而說明了地區(qū)2負荷數(shù)據(jù)規(guī)律較強;在LMBP模型中,地區(qū)2的training:R(網(wǎng)絡學習正確率)雖然較小,但相對地區(qū)1
35、較大,說明地區(qū)2負荷數(shù)據(jù)規(guī)律性更好。綜上所述,地區(qū)2負荷數(shù)據(jù)規(guī)律性更優(yōu)。5.5.2 數(shù)據(jù)黃金比例評價許多專家學者指出,“黃金分割率”不但具有美學觀點更具有達到機能的目的。比如,建筑物、畫框、撲克牌和書籍等,長和寬的比例都十分接近于“黃金分 割率”。黃金分割線股市8中最常見、最受歡迎的切線分析工具之一,主要運用黃金分割來揭示上漲行情的調(diào)整支撐位或下跌行情中的反彈壓力位。不過,黃金分割線沒有考慮到時間變化對股價的影響,所揭示出來的支撐位與壓力位較為固定,投資者不知道什么時候會到達支撐位與壓力位。因此,如果指數(shù)或股價在頂部或底部橫盤運行的時間過長,則其參考作用則要打一定的折扣,但這絲毫不影響黃金分割
36、線的實用價值。黃金分割線是利用黃金分割比率進行的切線畫法,在行情發(fā)生轉勢后,無論是止跌轉升或止升轉跌,以近期走勢中重要的高點和低點之間的漲跌幅作為計量的基數(shù),將原漲跌幅按0.191、0.382、0.5、0.618、0.809分割為5個黃金點,股價在反轉后的走勢將可能在這些黃金分割點上遇到暫時的阻力或支撐。其中黃金分割線中運用最經(jīng)典的數(shù)字為0.382、0.618,極易產(chǎn)生支撐與壓力。同樣的在本題負荷數(shù)據(jù)規(guī)律也呈現(xiàn)股價變化類似規(guī)律,所以同樣的可以利用黃金分割線來對數(shù)據(jù)進行分析。根據(jù)分析,地區(qū)2的負荷數(shù)據(jù)的走勢更貼近于黃金分割線的劃分,從而更進一步說明地區(qū)2的數(shù)據(jù)規(guī)律更優(yōu)。§6 模型的評價
37、與推廣一、 模型的優(yōu)缺點6.1模型優(yōu)點1)本文用于模型計算的數(shù)據(jù)量足夠大,使得相關計算和預測結果可信度較高;2)本文模型建立模型考慮因素全面合理,使得模型適用性較為廣泛;3)本文在選擇預測算法為改進后的算法,使得本文相關預測結果相對更為準確;4)本文從不同角度全面具體地證明了地區(qū)2較地區(qū)1數(shù)據(jù)分布規(guī)律更優(yōu);5)本文選取乘積季節(jié)模型,相比于一般的簡單季節(jié)模型,時間序列乘積季節(jié)模型能同時更好的反映序列的季節(jié)效應、長期趨勢效應。6.2模型缺點1)雖然相關算法已為改進后的算法,但仍存在一些固有的缺陷,導致預測數(shù)據(jù)存在一定程度的誤差;2)本文將選取五個天氣因素,忽略了其他因素對用電負荷量的影響,也會導致
38、模型的擬合存在一定程度的誤差,進而引起預測的結果存在不可控誤差。二、模型的推廣由于本文模型考慮因素較多,所以使得模型應用相對較為廣泛。例如可以用來預測某地區(qū)自來水用量或是對股市大致走勢進行簡單預測。參考文獻1 王學民. 應用多元分析M. 上海財經(jīng)大學出版社, 2009.2 毛李帆, 江岳春, 龍瑞華,等. 基于偏最小二乘回歸分析的中長期電力負荷預測J. 電網(wǎng)技術, 2008(19):71-77.3 李子奈. 計量經(jīng)濟學應用研究的總體回歸模型設定J. 經(jīng)濟研究, 2008(8):136-144.4 萬昆, 柳瑞禹. 區(qū)間時間序列向量自回歸模型在短期電力負荷預測中的應用J. 電網(wǎng)技術, 2012,
39、 36(11):77-81.5 王燕. 應用時間序列分析M. 中國人民大學出版社, 2012.6 張淑清, 任爽, 師榮艷,等. 基于多變量氣象因子的LMBP電力日負荷預測J. 儀器儀表學報, 2015, 36(7):1646-1652.7 史峰. MATLAB智能算法30個案例分析M. 北京航空航天大學出版社, 2011.8 謝先武. 證券投資中的數(shù)學方法J. 科學中國人, 2000(9):63-64.附 錄附錄一:A1=xlsread('diqu1.xlsx');A2=xlsread('diqu2.xlsx');%讀入兩個地區(qū)全年的電負荷矩陣M1=zeros
40、(size(A1);M2=zeros(size(A2);M1=sort(A1,2);M2=sort(A2,2);%按照行升序排列電負荷矩陣C11=M1(:,1);C12=M2(:,1);%兩個地區(qū)日最低負荷C21=M1(:,96);C22=M2(:,96);%兩個地區(qū)日最高負荷C31=C21-C11;C32=C22-C12;%兩個地區(qū)日峰谷差值C41=sum(M1,2)./96;C42=sum(M2,2)./96;%兩地區(qū)日負荷均值C51=C41./C21;C52=C42./C22%兩地區(qū)日負荷率t=1:1:365;subplot(2,2,1);plot(t,C21,'g')
41、;hold onplot(t,C22,'r');%最高負荷legend('地區(qū)1','地區(qū)2');subplot(2,2,2);plot(t,C11,'g') ;hold onplot(t,C12,'r');%最低legend('地區(qū)1','地區(qū)2');subplot(2,2,3);plot(t,C31,'g') ;hold onplot(t,C32,'r');%日峰谷差legend('地區(qū)1','地區(qū)2');subpl
42、ot(2,2,4);plot(t,C51,'g') ;hold onplot(t,C52,'r');%日負荷率legend('地區(qū)1','地區(qū)2');a1=xlsread('c.xlsx');a2=xlsread('d.xlsx');%讀入兩個地區(qū)全年的電負荷矩陣B1=a1(:,4:4:96);B2=a2(:,4:4:96);%提取整點電力負荷t=1:18760;C1=B1.*B1;C2=B2.*B2;D1=sum(C1,2);D2=sum(C2,2);E1=sqrt(D1/24);E2=sqrt(D2/24);%求出全天電力負荷e1=sort(E1,'descend');e2=sort(E2,'descend');%對全天電力負荷降序排列n=24;z1=e1*ones(1,n);z2=e2*on
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 合租備案合同范本
- 學生自主學習與創(chuàng)新思維的培養(yǎng)策略
- 零碳數(shù)據(jù)算力中心的定義與發(fā)展趨勢
- 2025年中國銀行服務市場規(guī)模預測及投資戰(zhàn)略咨詢報告
- 地塊平整設備與材料選擇
- 2025年電欖橋架項目投資可行性研究分析報告
- 秋季養(yǎng)生:順應天時護身心
- 舊車交易過戶合同范本
- 年產(chǎn)10萬噸醋酸丁酯融資投資立項項目可行性研究報告(齊魯咨詢)
- 終止土地流轉合同范本
- 新教材青島版六三制四年級下冊科學全冊教案(教學設計)
- DB11-T 825-2021綠色建筑評價標準
- 醫(yī)院招聘醫(yī)護人員報名登記表
- 完整解讀2022年《義務教育課程方案》2022年《義務教育課程方案(2022版)》新課標PPT
- 央企最新版員工手冊vvv
- 新生兒科出科考試試卷試題
- 信息化教學設計教案大學語文
- 植物的營養(yǎng)器官:根、莖、葉匯總
- 會議、匯報材料排版格式
- 華為公司產(chǎn)品線獎金分配暫行辦法
- 兒童能力評估量表(PEDI拍迪)
評論
0/150
提交評論