版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、改進的模糊c均值法在負荷特性統(tǒng)計數(shù)據(jù)聚類中的應(yīng)用摘要電力負荷是整個電力系統(tǒng)的安全穩(wěn)定運行中較活躍的一部分。建立符合實際的動態(tài)負荷模型對電力系統(tǒng)規(guī)劃、設(shè)計和運行等諸方面均有十分重要現(xiàn)實意義。本文采用實用化負荷建模思想 ,對負荷特性進行聚類,從而為變電站建立合適的負荷模型打下基礎(chǔ)?;谀壳柏摵山7矫娲嬖诘膯栴},使用模糊c均值法,對同一地域不同地點變電站的負荷統(tǒng)計數(shù)據(jù)進行聚類分析。針對湖南電網(wǎng)48個變電站,對模糊c均值法實施改進后對其進行聚類,并與未改進的模糊c均值法的聚類結(jié)果進行比較,以說明改進方案的有效性。關(guān)鍵字:電力負荷;負荷特性;聚類;模糊c均值法application of improv
2、ed fcm to electric load characteristics of statistical data clusteringabstractthe power load is an active part in the security and stable operation of the entire electrical power system. it is significantly important to make suitable load model for the power system planning, design and operation. in
3、 this paper the practical load modeling method is employed, and the load characteristics is clustered to establish the actual load model for substations. based on the current problems, fcm with hierarchical clustering is used to perform the clustering of the load characteristics data of the differen
4、t substations on the same area, the improved method is applied for the clustering of hunan grid substation. the clustering result shows that the improved method is effective comparing with the unimproved method.key words: power load; load characteristic; cluster,fcm目 錄第一章 緒論.11.1 研究背景.11.2發(fā)展及研究現(xiàn)狀.2
5、1.2.1 發(fā)展.2 1.2.2 研究現(xiàn)狀.4 1.2.2.1 電力負荷建模的總體原則.4 1.2.2.2 電力負荷建模的基本概念.4 1.2.2.3 分類.5 1.2.3 實用化負荷建模思想.6 1.2.3.1 統(tǒng)計綜合法.6 1.2.3.2 總體測辨法.71.3 聚類分析在負荷特性分析中的應(yīng)用現(xiàn)狀.81.4 本文主要研究內(nèi)容.9第二章 聚類分析.102.1 聚類分析的基本概念.102.2 聚類方法.112.3 系統(tǒng)聚類法.15 2.3.1 最小張樹聚類法.16 2.3.2 基于密度的聚類算法.16 2.3.3 基于網(wǎng)絡(luò)的聚類方法.16 2.3.4 基于模型的聚類算法.16 2.3.5 基于
6、劃分的聚類算法.162.4 各算法優(yōu)缺點比較.17第三章 模糊c均值在負荷特性聚類中的應(yīng)用實例.193.1 聚類在電力系統(tǒng)中的應(yīng)用綜述.193.2 模糊c均值聚類算法.20 3.2.1 硬c均值聚類算法(hcm).20 3.2.2 模糊c均值聚類.22 3.2.3 程序流程圖.233.3對模糊c均值法的改進.25 3.3.1 改進的各方案比較.25 3.3.2 最終改進方案的選定.263.4 聚類實例.27 3.4.1 原始數(shù)據(jù)聚類數(shù)據(jù).27 3.4.2 未改進的模糊c均值法在實例中的應(yīng)用.27 3.4.3 改進的模糊c均值法在實例中的應(yīng)用.28 3.4.4 兩種算法的比較.293.5 結(jié)果分
7、析.31第四章 結(jié)語.33參考文獻 .34致謝.35附錄.36附錄a 原始聚類數(shù)據(jù).36附錄b 系統(tǒng)聚類法所得的聚類中心生成的隸屬度矩陣.38附錄c 改進的模糊c均值法源程序.41附錄d 類間距離計算源程序.47附錄e 類內(nèi)距離計算源程序.48 第一章 緒 論1.1 研究背景目前電力系統(tǒng)的數(shù)字仿真已成為電力系統(tǒng)設(shè)計、規(guī)劃、運行的主要工具, 相應(yīng)的決策無不是以數(shù)字仿真的結(jié)果為依據(jù)。但數(shù)字仿真畢竟是仿真, 其與實際系統(tǒng)有著或大、或小的誤差, 誤差的大小及性質(zhì)對該決策的正確性具有決定作用。如果決策基于悲觀的仿真分析結(jié)果,則在規(guī)劃設(shè)計方面將會因不必要的加強系統(tǒng)結(jié)構(gòu)和反事故措施而投入過多的資金,造成浪費
8、;在運行方面采取過分保守的策略而限制了功率傳輸?shù)臉O限,使設(shè)備得不到充分的利用。如果決策基于樂觀的仿真分析結(jié)果,則在規(guī)劃設(shè)計方面將會導(dǎo)致系統(tǒng)結(jié)構(gòu)、反事故措施方面投入資金不足,從而產(chǎn)生不合理的系統(tǒng)規(guī)劃方案,給以后的系統(tǒng)運行造成不便,帶來許多運行限制;在運行方面將導(dǎo)致系統(tǒng)運行于危險的臨界狀態(tài)或疏于防范而造成事故。仿真結(jié)果的誤差是由仿真所用模型的準確性決定,目前發(fā)電機組和輸電網(wǎng)絡(luò)的模型已相當成熟,比較而言,電力負荷模型仍相當簡單,往往從基本物理概念出發(fā),采用理想化的模型,如: 恒功率、恒阻抗、恒電流或三者的組合。負荷模型的過分粗糙已成為制約電力系統(tǒng)仿真計算精度的關(guān)鍵因素。當今,在電力市場化的趨勢沖擊下
9、,人們對系統(tǒng)分析軟件的精度要求將越來越高,負荷模型的研究的重要性也將更加凸現(xiàn)7。電力負荷作為能量的消耗者,在電力系統(tǒng)的設(shè)計、分析與控制中有著重要影響。在進行電力系統(tǒng)分析時,不恰當?shù)乜紤]負荷的模型,會使所得結(jié)果與系統(tǒng)實際情況不相一致,或偏樂觀,或偏保守,從而構(gòu)成系統(tǒng)的潛在危險或造成不必要的投資。目前,數(shù)字模擬計算已成為電力系統(tǒng)設(shè)計、運行與控制中不可缺少的輔助手段。人們不但要求模擬計算結(jié)果是定性正確的,而且要求模擬計算結(jié)果是定量精確的。大量的計算與實驗結(jié)果表明:負荷模型對電力系統(tǒng)動態(tài)行為的定量模擬結(jié)果影響很大,對潮流計算、短路計算、安全分析、電壓穩(wěn)定性等也有一定影響。在臨界情況下,還有可能從根本上
10、改變定性的結(jié)論。例如,在澳大利亞queensland系統(tǒng)將理論計算與實測結(jié)果作了比較,發(fā)現(xiàn)用恒定阻抗表示負荷時兩者相差較大,而當負荷的有功電壓指數(shù)改為1.4,無功電壓指數(shù)改為3.0時,兩者基本吻合。另一計算表明,當某負荷的頻率相關(guān)成分提高到40%時,原來穩(wěn)定的系統(tǒng)變成不穩(wěn)定。因此,負荷的頻率特性對系統(tǒng)穩(wěn)定性也有顯著影響。還有的研究報導(dǎo),感應(yīng)電動機對穩(wěn)定極限的影響相當大,其誤差有時可高達30%。此外,負荷特性對低頻振蕩也有很大影響。通過這些例子,對改進負荷模型的必要性便可見一斑。在過去的幾十年間,發(fā)電機及輸電網(wǎng)絡(luò)的建模已取得很大的發(fā)展。與之相比,負荷建模則發(fā)展較慢,顯得有些不相匹配。顯然,電力系
11、統(tǒng)模擬計算精度的提高與發(fā)電機、輸電網(wǎng)絡(luò)及電力負荷三大部分的建模都有密切的關(guān)系。負荷模型的粗糙阻礙了整個系統(tǒng)模擬精度的進一步提高,并降低了改善發(fā)電機及輸電網(wǎng)絡(luò)模型的價值。因此,改進負荷模型具有一定的迫切性?,F(xiàn)代電力系統(tǒng)穩(wěn)定分析常需把仿真的時間跨度增大,人們對低頻率振蕩、頻率穩(wěn)定、中長期穩(wěn)定性等問題的興趣日增。為此,更需要研究相應(yīng)的模型和算法,負荷模型當然也應(yīng)考慮在內(nèi)。隨著計算機技術(shù)的迅速發(fā)展,計算機的容量不斷擴大,計算速度也不斷提高。這就為采用更加精確、詳細的負荷模型創(chuàng)造了條件??傊?,電力負荷是電力系統(tǒng)的重要組成部分,電力系統(tǒng)運行與控制中的大多數(shù)內(nèi)容都與負荷問題有關(guān)。因此,負荷建模研究是電力系統(tǒng)
12、運行與控制中的基礎(chǔ)性課題,既具有非常重要的理論意義,又具有十分顯著的工程實用價值19。1.2發(fā)展及研究現(xiàn)狀1.2.1 發(fā)展 人們較早就認識到負荷模型對系統(tǒng)穩(wěn)定研究的重要性, 并對此進行了初步研究, 這可算是負荷模型研究的萌芽階段。 到了60 70年代,由于數(shù)字電子計算機及控制理論的引入,電力系統(tǒng)這門工程學科煥發(fā)了新的活力。在這樣的背景下, 人們可以采用數(shù)字電子計算機對復(fù)雜的電力系統(tǒng)進行精確的仿真研究。而精確的仿真的基礎(chǔ)便是精確的模型, 同其他系統(tǒng)元件模型一樣, 負荷建模工作有了相當?shù)倪M展, 除提出了最常用的恒阻抗、恒電流、恒功率模型以外,還在計算中采用了感應(yīng)電動機負荷模型和多項式、冪函數(shù)靜態(tài)負
13、荷模型。 到了70年代末80年代初統(tǒng)計綜合法 (componen t- basedmethod)的提出是負荷建模在這一時期的最重大的成果。從1976年開始美國epr i 主持了一項龐大的研究計劃。根據(jù)該計劃,研究工作在美國和加拿大同時展開。整個工作經(jīng)過了嚴密的計劃和組織,從理論、現(xiàn)場實驗上以及數(shù)據(jù)收集系統(tǒng)的軟、硬件開發(fā)和數(shù)據(jù)處理程序等幾個方面全面鋪開。美國的texas 大學與ge及其他一些電力公司合作致力于統(tǒng)計綜合法負荷建模的研究。該方法是在實驗室內(nèi)確定每種典型負荷 (如工業(yè)電動機、電冰箱、熒光燈等)的平均特性方程,然后在一個負荷點上統(tǒng)計一些特殊時刻的負荷 (如冬季峰值負荷、夏季峰值負荷)的組
14、成,即每種典型負荷所占的百分比,以及配電線路和變壓器的數(shù)據(jù),最后綜合這些數(shù)據(jù)得出該負荷點的負荷模型。經(jīng)過多年的努力,到了1987年完成的el25003計劃, 一個在統(tǒng)計綜合法負荷建模中最具影響的軟件包epr i 的load syn開發(fā)完成了 17 。該軟件包使用時雖然需要三種數(shù)據(jù): 負荷組成, 即各類負荷(民用、商業(yè)、工業(yè)等)所占的比例; 各類負荷中各用電設(shè)備(熒光燈、電動機、空調(diào)等) 所占的比例; 各用電設(shè)備的平均特性。但對于使用者來說,必須提供的只有第一種數(shù)據(jù),后兩種數(shù)據(jù)可以利用該軟件包所給的典型值,這給該軟件包的使用者提供了一定的方便。 60年代開始迅速發(fā)展起來的系統(tǒng)辨識理論到了80年代
15、前后已取得了許多令人矚目的成就,加之計算機數(shù)據(jù)采集與處理技術(shù)的發(fā)展,為另一種新的負荷建模方法-總體測辨法的產(chǎn)生奠定了基礎(chǔ)。該方法的基本思想是將負荷群作為一個整體, 先在現(xiàn)場進行人為擾動實驗或捕捉自然擾動,采集并記錄該擾動數(shù)據(jù),然后由現(xiàn)場采集的數(shù)據(jù)辨識負荷模型的結(jié)構(gòu)和參數(shù),最后再由大量的實測數(shù)據(jù)驗證所建模型的有效性。中國、美國、日本、加拿大和澳大利亞等國在實際系統(tǒng)研制和投運了一大批電力負荷特性數(shù)據(jù)在線記錄裝置,記錄了大量數(shù)據(jù),借此開展了大量的基于總體測辨法的研究 。 gigre和ieee都設(shè)有負荷建模工作組,其不定期的發(fā)表一些專題報告,以指導(dǎo)負荷建模方面的研究和及時總結(jié)負荷建模方面的進展。199
16、0年gigre發(fā)表的專題報告,結(jié)合荷蘭fgo電網(wǎng)對各種負荷模型的暫態(tài)穩(wěn)定計算效果為例論證了負荷模型的重要性,并對建立實際負荷模型的方法及負荷測試的有關(guān)問題進行了論證。ieee在1993年發(fā)表的報告統(tǒng)一了負荷建模中的許多術(shù)語和定義, 總結(jié)了負荷模型從建立、驗證到應(yīng)用的有關(guān)問題。ieee在1995年2月的報告列出了國際上學者在負荷建模研究中提出的許多有價值的負荷模型以及他們的文獻和著作,以期推動負荷建模的進一步研究和實際應(yīng)用。在1995年8月的報告中推薦了用于電力系統(tǒng)潮流計算和動態(tài)仿真的標準化負荷模型,為各種仿真程序的使用者指明了方向7。1.2.2 研究現(xiàn)狀1.2.2.1 電力負荷建模的總體原則
17、(1)可用性原則 電力負荷建模具有時變性、隨機性、分布性、多樣性、非連續(xù)性等特點,多年來雖然人們做了大量努力,但要對所有負荷點、所有時間點建立“精確”的模型是不現(xiàn)實的。雖然不能做到定量完全精確,但至少要做到定性正確。所以,在目前只能考慮建立“可用”的負荷模型,對該模型的最基本的要求是能夠反映負荷的實際本質(zhì)特征。 (2)實用性原則 電力負荷建模的目的當然是為了應(yīng)用。這就要求模型在能夠反映負荷本質(zhì)的前提下要盡量簡單,最好與現(xiàn)有電力系統(tǒng)計算程序能夠銜接。同時要求方法也要盡量簡單,最好少做全系統(tǒng)性的大規(guī)模試驗尤其是穩(wěn)定試驗。 (3)針對性原則 國外對電力負荷建模已有大量研究,美國等國家進行了大量實際負
18、荷參數(shù)的研究,給出了推薦參數(shù)。但不同國家的管理體制和負荷情況具有明顯差異,國外的做法不一一定就能夠照搬,國外的數(shù)據(jù)也不一定能夠照用。我國開展負荷建模工作,一方面要借鑒國外的經(jīng)驗,但另一方面要針對我國的實際,立足國內(nèi),走1條 有中國特色的負荷建模之路8。1.2.2.2 電力負荷建模的基本概念電力系統(tǒng)是由發(fā)電廠、電力網(wǎng)及電力負荷三大部分組成的能量生產(chǎn)、傳輸和使用系統(tǒng)。發(fā)電廠是電能的發(fā)出者,這些電能經(jīng)高壓輸電網(wǎng)及低壓配電網(wǎng)被傳送到各個用戶,并由安裝在用戶處的用電設(shè)備所消耗。電力負荷就是這些用電設(shè)備的總稱,其中有時也包括配電網(wǎng)絡(luò),并簡稱為負荷。電力系統(tǒng)中有各式各樣的負荷,可以從不同的角度進行分類。從用
19、電部門來看,可以分為城市民用負荷、商業(yè)負荷、農(nóng)業(yè)負荷、工業(yè)負荷及其它負荷。城市民用負荷主要是城市居民的家用電器負荷。商業(yè)和工業(yè)負荷是為商業(yè)與工業(yè)服務(wù)的負荷。農(nóng)業(yè)負荷是農(nóng)村所有負荷的統(tǒng)稱,包括農(nóng)村民用電、生產(chǎn)與排灌用電及農(nóng)村商業(yè)用電等。其它負荷包括市政用電、公用事業(yè)用電、政府辦公用電、鐵路與電車用電等等。家用電器大致有如下幾類。1) 照明電器:熒光燈、白熾燈;2) 備餐電器:電爐、電飯鍋、電烤箱、烤爐等等;3) 洗熨電器:洗衣機、電熨斗、烘干機等;4) 食品儲存電器:電冰箱及其它冷凍設(shè)備;5) 調(diào)溫電器:電風扇、空調(diào)等;6) 電視音響電器:收錄機、電視機、錄像機等。 工業(yè)負荷中電力設(shè)備種類更多,
20、最主要的是感應(yīng)電動機和同步電動機,其它還有整流型負荷、電弧爐、阻抗型負荷(如工廠照明)等等。配電網(wǎng)主要有配電線路、變壓器和補償電容等。 負荷吸收的有功功率(p)及無功功率(q)是隨著負荷母線的電壓(u)和頻率(f)的變動而變化的,這就是負荷的電壓、頻率特性,用于描述負荷特性的數(shù)學方程稱為負荷模型。建立負荷模型就是要確定描述負荷特性的數(shù)學方程的形式及其中的參數(shù),簡稱為負荷建模19。1.2.2.3 分類按照是否反映負荷的動態(tài)特性,負荷模型一般可分為靜態(tài)模型和動態(tài)模型兩類,前者通常用代數(shù)方程來描述,后者通常用微分方程或差分方程描述。每一類都有多種結(jié)構(gòu)。 (1) 靜態(tài)模型在穩(wěn)態(tài)條件下,負荷功率與端電壓
21、及頻率之間的非線性函數(shù)關(guān)系稱為負荷的靜態(tài)模型19 ?;镜撵o態(tài)負荷模型的結(jié)構(gòu)為:冪函數(shù)模型;多項式模型。通常一個冪函數(shù)在電壓變化范圍比較大的情況下仍能較好地描述許多負荷的靜態(tài)特性。多項式模型由恒功率、恒電流、恒阻抗三部分組成,它可以看作是三個冪函數(shù)相加的特例,這三個冪函數(shù)的冪指數(shù)分別為0,1,2。靜態(tài)的負荷模型主要適用于潮流計算和以潮流計算為基礎(chǔ)的穩(wěn)態(tài)分析中。在電力系統(tǒng)動態(tài)分析中,靜態(tài)負荷模型一般適用于計算結(jié)果對負荷模型不太敏感的負荷點。目前國內(nèi)電力系統(tǒng)潮流計算所采用的負荷模型多是恒功率模型,暫態(tài)計算所采用的負荷模型也多是多項式模型(多為40% 的恒功率+60%的恒阻抗)。與有些文獻所述不同的
22、是,由于大部分的計算程序采用的多項式負荷模型, 在低電壓下(0.6pu) 多相應(yīng)的轉(zhuǎn)化為恒阻抗模型,所以對多項式的負荷模型并不存在電壓為零時功率不過零點的問題4。 (2) 動態(tài)模型動態(tài)負荷模型又可進一步分為機理模型和非機理模型。其中機理模型通常就是感應(yīng)電動機模型。相應(yīng)的還有采用一臺等值感應(yīng)電動機, 兩臺或更多的等值感應(yīng)電動機 , 以及將感應(yīng)電動機并聯(lián)上有關(guān)的靜態(tài)模型等幾種形式。非機理模型則是在系統(tǒng)辨識理論發(fā)展過程中,從大量的具體動態(tài)系統(tǒng)建模中概括出來的,對一大類動態(tài)系統(tǒng)具有很強的描述能力。每一種非機理模型模型都有其普遍適用的范圍, 也正是由于其普遍適用性也掩蓋了它作為具體系統(tǒng)的具體物理機理。目
23、前常用的非機理動態(tài)負荷模型的形式有:常微分方程模型, 傳遞函數(shù)模型 , 狀態(tài)空間模型 ,時域離散模型 。此外還有考慮描述負荷模型非線性而提出的人工神經(jīng)網(wǎng)絡(luò)模型4。負荷模型的評判是困難的,因為不同的應(yīng)用目的對負荷的要求不同,不同的研究人員看問題的出發(fā)點可能也不一樣。一般來說,需要考慮以下幾個方面:(1)精確度;(2)計算量;(3)物理背景;(4)參數(shù)獲?。?5)應(yīng)用方便??梢哉f,目前沒有一種統(tǒng)一的負荷模型在各方面都可以適用。事實上,上述幾個方面有的有時甚至是互相矛盾的。因此,往往要根據(jù)應(yīng)用者關(guān)心的主要方瑤,選擇一種折中的負荷模型。1.2.3 實用化負荷建模思想 負荷建模:兩大方法、特點、不足時至
24、今日,人們已提出了不少負荷建模方法,這些方法可以歸納為兩大類:一類是“統(tǒng)計綜合法”,另一類是“總體測辨法”。 1.2.3.1 統(tǒng)計綜合法 統(tǒng)計綜合法的基本思想是將負荷看成個別用戶的集合,先將這些用戶的電器分類,并確定各種類型電器的平均特性,然后統(tǒng)計出各類電器所占的比重,最后綜合得出總的負荷模型,其典型成果體現(xiàn)在epri聯(lián)合研究集團開發(fā)研制的loadsyn軟件中。這套軟件的理論部分是由美國texas大學的arlington分校負責的,ge和其他電力公司負責在電網(wǎng)上進行實驗驗證。現(xiàn)在許多國家的電力部門都采用這類辦法。在采用這類方法時,需要3種數(shù)據(jù)資料:負荷組成及各類負荷所占的比重;配電網(wǎng)絡(luò)的參數(shù);
25、各類負荷的平均特性。一般來說,后兩種數(shù)據(jù)變化較小,而第一種數(shù)據(jù)變化較大。據(jù)文獻報導(dǎo):有功功率的電壓特性系數(shù)隨運行條件的變化較小,從而使綜合得到的有功電壓特性與實際的比較吻合;而無功功率的電壓特性系數(shù)則變化較大,使綜合得到的無功電壓特性與其試驗結(jié)果相差較大;綜合得到的頻率特性與試驗結(jié)果相差較大;對負荷動態(tài)特性也不能很好地模擬。統(tǒng)計綜合法是一種傳統(tǒng)的做法,比定性估計負荷參數(shù)前進一大步。它不依賴現(xiàn)場試驗,花費的代價較小。但這種方法存在著下列問題:(1) 需事先統(tǒng)計成千上萬個用戶的負荷組成及參數(shù)。這種統(tǒng)計工作不但耗時費力,而且難以統(tǒng)計準確。(2) 各類電器的“平均特性”難以確定。(3) 統(tǒng)計綜合工作不
26、可能隨時進行,甚至不能經(jīng)常進行。而負荷特性是經(jīng)常變化的,甚至變化很大。因此,這種方法不能適應(yīng)負荷特性的時變性。(4) 對無功電壓特性、頻率特性及動態(tài)特性難以模擬準確。(5) 負荷成分往往比較復(fù)雜,包含的用電設(shè)備可達數(shù)十種,如電動機、電阻負荷、電壓器、熒光燈等等。若將所有這些類型的負荷都考慮進去,則因各類用電設(shè)備的模型不同,從而導(dǎo)致總的模型難以應(yīng)用。隨著負荷成分的日益復(fù)雜化,這個問題將更加突出。1.2.3.2 總體測辨法 總體測辨法的基本思想是將負荷群看作一個整體,先從現(xiàn)場采集測量數(shù)據(jù),然后確定負荷模型的結(jié)構(gòu),最后根據(jù)現(xiàn)場采集的數(shù)據(jù)辨識出模型參數(shù),其典型成果體現(xiàn)在加拿大quebec及ontari
27、o水電研究所開發(fā)的在線監(jiān)測裝置上。他們設(shè)計了一套微機控制的實時數(shù)據(jù)采集系統(tǒng),收集了大量的現(xiàn)場實測數(shù)據(jù)資料。在此基礎(chǔ)上,離線或在線辨識出負荷特性系數(shù)??傮w測辨法是一種比較新穎的方法,目前正處于開發(fā)研究中。這種方法所必需的現(xiàn)場測量工作比較復(fù)雜,甚至會受到實際條件的限制,例如電壓波動難以做到超過10%。但與統(tǒng)計綜合法相比,它具有如下優(yōu)點:(1) 無需知道各個用戶的負荷組成及參數(shù),不依賴于用戶統(tǒng)計資料。(2) 在負荷母線處長期裝設(shè)測量裝置,可以根據(jù)各個時刻的測量數(shù)據(jù)得到相應(yīng)的負荷特性參數(shù),從而解決了負荷特性的時變性問題。(3) 有希望獲得較好的參數(shù)估計值。(4) 當負荷組成比較復(fù)雜時,仍可以用簡單的輸
28、入/輸出模型來描述。這種模型的參數(shù)易于辨識,模型結(jié)構(gòu)統(tǒng)一,便于處理。(5) 總體測辨法實質(zhì)上是將負荷看作“灰色系統(tǒng)”或“黑色系統(tǒng)”,而現(xiàn)代系統(tǒng)理論為總體測辨法提供了有力的理論依據(jù)和分析工具19 。1.3 聚類分析在負荷特性分析中的應(yīng)用現(xiàn)狀 聚類分析是一種新興的多元統(tǒng)計方法,是當代分類學與多元分析的結(jié)合。聚類分析是將分類對象置于一個多維空間中,按照它們空間關(guān)系的親疏程度進行分類。也就是說,對彼此不同屬性的事物進行辨認,將具有相似屬性的事物聚為一類,使得同一類的事物具有高度的相似性8。 聚類分析指將物理或抽象對象的集合分組成為由類似的對象組成的多個類的分析過程。它是一種重要的人類行為。聚類與分類的
29、不同在于,聚類所要求劃分的類是未知的。聚類是將數(shù)據(jù)分類到不同的類或者簇這樣的一個過程,所以同一個簇中的對象有很大的相似性,而不同簇間的對象有很大的相異性。聚類分析的目標就是在相似的基礎(chǔ)上收集數(shù)據(jù)來分類。聚類源于很多領(lǐng)域,包括數(shù)學,計算機科學,統(tǒng)計學,生物學和經(jīng)濟學。在不同的應(yīng)用領(lǐng)域,很多聚類技術(shù)都得到了發(fā)展,這些技術(shù)方法被用作描述數(shù)據(jù),衡量不同數(shù)據(jù)源間的相似性,以及把數(shù)據(jù)源分類到不同的簇中。從統(tǒng)計學的觀點看,聚類分析是通過數(shù)據(jù)建模簡化數(shù)據(jù)的一種方法。傳統(tǒng)的統(tǒng)計聚類分析方法包括系統(tǒng)聚類法、分解法、加入法、動態(tài)聚類法、有序樣品聚類、有重疊聚類和模糊聚類等。采用k-均值、k-中心點等算法的聚類分析工
30、具已被加入到許多著名的統(tǒng)計分析軟件包中,如spss、sas等。從機器學習的角度講,簇相當于隱藏模式。聚類是搜索簇的無監(jiān)督學習過程。與分類不同,無監(jiān)督學習不依賴預(yù)先定義的類或帶類標記的訓練實例,需要由聚類學習算法自動確定標記,而分類學習的實例或數(shù)據(jù)對象有類別標記。聚類是觀察式學習,而不是示例式的學習從實際應(yīng)用的角度看,聚類分析是數(shù)據(jù)挖掘的主要任務(wù)之一。而且聚類能夠作為一個獨立的工具獲得數(shù)據(jù)的分布狀況,觀察每一簇數(shù)據(jù)的特征,集中對特定的聚簇集合作進一步地分析。聚類分析還可以作為其他算法(如分類和定性歸納算法)的預(yù)處理步驟。1.4 本文主要研究內(nèi)容 負荷建模領(lǐng)域的研究目前大多仍以理論研究為主,尚未很
31、好地推廣到工程應(yīng)用。隨著當前電網(wǎng)規(guī)模的日益增大,對于一個廣域電力系統(tǒng)分析人員而言,如果該區(qū)域的所有負荷站點均采用同一種負荷模型,該負荷模型必定是非常保守和粗糙的。而如果將每個負荷站點均根據(jù)總體測辨法建立起相當精確的負荷模型,這將需要大量的設(shè)備和資金的投入,無論是從人力、財力和物力上考慮都是不可取的。這一問題是近來負荷建模工作一直不斷探討的熱點,目前正在逐步形成一類基于統(tǒng)計與基于量測相結(jié)合的負荷建模新方法。在初步探討了聚類分析技術(shù)在負荷建模中的應(yīng)用現(xiàn)狀的基礎(chǔ)上,重點研究了模糊c-均值法的基本原理和實現(xiàn)過程,并將其用于統(tǒng)計負荷特性數(shù)據(jù)的分類,從而驗證了聚類技術(shù)在負荷特性分類中應(yīng)用的工程實用性,為統(tǒng)
32、計綜合法和總體測辨法的融合提供了有效的途徑。第2章 聚類分析聚類分析就是如何對樣品(或變量)進行量化分類的問題。通常聚類分析分為q型聚類和r型聚類。q型聚類是對樣品進行分類處理,r型聚類是對變量進行分類處理。2.1 聚類分析的基本概念 在實際研究中,既可以對樣本個體進行聚類,也可以對研究變量進行聚類,對樣本個體進行的聚類通常稱為q型聚類,對研究變量進行的聚類稱為r型聚類。本文采用的是對樣本個體進行聚類分析。所謂樣本,就是指待分類的對象全體。每個樣本都由一系列指標表示,這些指標形成樣本矢量,全體樣本矢量構(gòu)成的集合稱為樣本矢量集,這里設(shè)樣本矢量集合為x=,每一個對象(i=1、2、m)都由一組n個指
33、標刻畫:。定義為樣本與的距離,常用的距離有:1 閔氏距離 如 當q=l時,稱為絕對值距離。 當q=2時,稱為歐氏距離 當q=時,稱為切比雪夫距離2馬氏距離 其中為樣本的p個指標組成的向量,為協(xié)方差矩陣3. 蘭氏距離 ()在眾多的距離中,用的較多的是歐氏距離和絕對值距離。4. 距離選擇的原則一般說來,同一批數(shù)據(jù)采用不同的距離公式,會得到不同的分類結(jié)果。產(chǎn)生不同結(jié)果的原因,主要是由于不同的距離公式的側(cè)重點和實際意義都有不同。因此我們在進行聚類分析時,應(yīng)注意距離公式的選擇。通常選擇距離公式應(yīng)注意遵循以下的基本原則:(1) 要考慮所選擇的距離公式在實際應(yīng)用中有明確的意義。如歐氏距離就有非常明確的空間距
34、離概念,馬氏距離有消除量綱影響的作用。(2) 要綜合考慮對樣本觀測數(shù)據(jù)的預(yù)處理和將要采用的聚類分析方法。如在進行聚類分析之前已經(jīng)對變量作了標準化處理,則通常就可采用歐氏距離。(3) 要考慮研究對象的特點和計算量的大小。樣品間距離公式的選擇是一個比較復(fù)雜且?guī)в幸欢ㄖ饔^性的問題,我們應(yīng)根據(jù)研究對象的特點不同做出具體分析。實際中,聚類分析前不妨試探地多選擇幾個距離公式分別進行聚類,然后對聚類分析的結(jié)果進行對比分析,以確定最合適的距離測度方法。 在量綱取定的條件下,兩個樣本越相似,它們之間的距離d就越小,反之亦然,值得注意的是量綱的選取不同會改變某特征的判斷依據(jù)性。因此當樣本的不同特征值的量綱差別很大
35、時,會對聚類結(jié)果造成很大的影響。這就需要將各種特征值進行標準化。標準化的方法有很多種,他們可以保證比例的不變性或至少可以試圖使距離度量方法在各種特征下的貢獻達到一個最佳的平衡8。2.2 聚類方法 聚類分析的方法有很多種,經(jīng)典的聚類方法有譜系數(shù)聚類分析法,動態(tài)聚類分析法,由于新的理論不斷提出,現(xiàn)在又有了模糊聚類分析法和灰色聚類分析法。這些方法各有優(yōu)缺點,分別適用于不同的場合。相比而言,譜系數(shù)聚類分析法和動態(tài)聚類分析法在理論上相對比較成熟。下面對這幾種方法做出介紹:1 譜系數(shù)聚類分析法 這種方法又稱為系統(tǒng)聚類分析法,設(shè)樣本矢量集合為,每個樣本有n個特征量表示,表示第k次合并時的第i類。首先,視m個
36、樣本各自成為一類,后計算類與類之間距離,選擇距離最小的一對合并成一個新類,計算在新的類別劃分下各類之間的距離,再將距離最近兩類合并,直至所有樣本聚成一類為止。將所有樣本聚成一類結(jié)果是沒有意義的,再根據(jù)一定的原則確定最終的種類個數(shù)。算法的具體步驟如下:1) 數(shù)據(jù)的標準化處理。由原樣本矢量集形成新的樣本矢量集,其中: 式中:,即各列數(shù)據(jù)平均值; 即各列數(shù)據(jù)標準方差;i=1,2,m, j=1,2,n。2) 初始分類。令k=0,每個樣本自成一類,即3) 計算各類間的距離,由此生成一個對稱的距離矩陣,其中m為類的個數(shù)(初始時,m=n)。4) 找出前一步求得的矩陣中最小元素,設(shè)它是和間的距離,將和兩類合并
37、成一類,于是產(chǎn)生新的聚類令k=k+1,n=n-1;5) 查聚類后的個數(shù),如果類數(shù)n大于2,則轉(zhuǎn)至3),否則,停止。 譜系數(shù)聚類法除了要定義事物之間的親疏程度指標,還要定義類與類之間親疏程度指標并且要導(dǎo)出求取類間親疏指標值的遞推公式。類與類之間親疏程度指標不同,則求取類間親疏指標值的遞推公式也就不同。這樣就有很多種不同的譜系數(shù)聚類法,其中幾種介紹如下: 1)重心距離法 從物理觀點看,若一個類空間位置要用一個點表示,那就用重心來表示。設(shè)類、重心分別為、,它們分別有、個,將和合 并為,則有個樣本,易知的重心 設(shè)另一類的重心為則它與的距離平方是2) 平均距離法兩類和之間距離平方也可定義為這兩類元素兩兩
38、之間平均平方距離,即 設(shè),類平均距離遞推公式為 3) 最短距離法定義類和之間的距離為兩類最近樣品的距離,即為 設(shè)類和合并成一個新類記為,則任一類與的距離為 4) 最長距離法定義類和之間的距離為兩類最遠樣品的距離,即為 最長距離法與最短距離法的并類步驟完全一樣,也是將各樣品先自成一類,然后將距離最小的兩類合并。將類和合并成一個新類記為,則任一類與的距離為 再找距離最小兩類并類,直至所有的樣品全歸為一類為止??梢钥闯鲎铋L距離法與最短距離法只有兩點不同:一是類與類之間的距離定義不同;另一是計算新類與其他類的距離所用的公式不同。2動態(tài)聚類分析法 動態(tài)聚類的原理是先對分類事物做一個初始的粗糙的分類,然后
39、再根據(jù)某種原則對初始分類進行修改,直至準則函數(shù)取得極值或者是分類被認為比較合理為止。其基本步驟為:1)建立初始聚類中心,進行初始聚類。2)計算模式和類的距離,調(diào)整模式的類別。3)計算各聚類的參數(shù),刪除合并或分裂一些聚類。4)從初始聚類開始,運用迭代算法動態(tài)地改變模式的類別和聚類中心 使準則函數(shù)取得極值或設(shè)定的參數(shù)達到設(shè)計要求時停止。在眾多的動態(tài)聚類分析方法中,c均值聚類算法是最常用的一種,這里簡要介紹一下,假設(shè)樣本特征矢量集為,事先取定類的數(shù)目為c類,并確定c個初始聚類中心,按最小距離原則將各樣本分配到c類中某一類,之后不斷計算類心和調(diào)整各樣本的類別,最終使各樣本到其判屬類別中心的距離平方之和
40、最小。c均值聚類分析法是以確定的類數(shù)及選定的初始聚類中心為前提,使各樣本到其所判屬類別中心距離平方之和最小的最佳聚類,受這一前提的影響,其結(jié)果很容易陷入局部最優(yōu)。3 灰色聚類分析法 灰色聚類分析法屬于灰色系統(tǒng)理論中灰色評估范疇,灰色系統(tǒng)理論是一種新的分析系統(tǒng)的理論,它以“部分信息已知,部分信息未知”的“小樣本”、“貧信息”不確定系統(tǒng)為研究對象,主要通過對“部分”已知信息的生成、開發(fā),提取有價值的信息,實現(xiàn)對系統(tǒng)運行行為的正確認識和有效控制,有很多系統(tǒng)可以看成是貧信息不確定系統(tǒng),因此,這一新的理論具有十分廣闊的應(yīng)用前景。4 模糊聚類分析法人類在社會實踐中,常常要把所處理的事物按其特征分為若干類,
41、所謂“物以類聚,人以群分”。由于實際對象之間在很多方面,其差異的變化表現(xiàn)為一種連續(xù)性,差異對象之間并沒有一個截然區(qū)別的界限,所以事物分類的本身具有模糊性的特點。模糊聚類方法是通過建立模糊相似關(guān)系而將客觀事物予以分類的方法。在普通聚類分析中,類別之間是清晰的,分類集合中的任意兩個對象要么等價,要么不等價。而模糊聚類的結(jié)論并不表征對象絕對地屬于某一類或絕對地不屬于某一類,而是表征對象在什么程度上相對地屬于某一類,在什么程度上相對地屬于另一類。模糊聚類分析的數(shù)學基礎(chǔ)是模糊集合論。自模糊集合論建立以來,聚類分析很快地運用了這一新的數(shù)學方法。ehruspinid 1969年在聚類分析中引入了模糊劃分的概
42、念。jcbezdek和jcdunn在1974年給出了模糊isodata聚類方法。此后國外一些學者提出了許多模糊聚類方法,更多的學者還將這些方法應(yīng)用于實河海大學碩士學位論文踐,目前這種聚類分析法正在不斷改進中,有待于進一步開展研究。2.3. 系統(tǒng)聚類法系統(tǒng)聚類算法5,又稱為等級聚類法,層次聚類法。它將給定數(shù)據(jù)集合進行層次的分解。根據(jù)聚類過程方向的不同,系統(tǒng)聚類算法可以分為分解法(divisive,自頂而下)和聚類法(agglomerative,自底而上)兩類。分解法把整個集合看作一個整體(類),再逐步劃分為更小的類,直到每個數(shù)據(jù)對象分別隸屬于一個類,或者達到某個終止條件。聚合法則剛好相反,它先是
43、把每一個數(shù)據(jù)對象都看成一個單獨的類,然后合并相似的數(shù)據(jù)對象成為一個新類,直到所有數(shù)據(jù)對象置于一個類中,或者達到某個終止條件。實際中的絕大多數(shù)層次聚類算法屬于聚合法。一個純粹的層次聚類算法最大的問題是一旦一個合并或者分裂被執(zhí)行,就不可修正。目前的研究集中于凝聚層次聚類和迭代重定位方法的集成。2.3.1 最小張樹聚類法 在圖論聚類法中,將各個模式視為加權(quán)圖g的頂點,加權(quán)圖的權(quán)定義為模式之間的距離,當取類間最近距離為類間距離時,聚類過程所表示成的樹就是最小張樹7,第j步合并的兩類正是kruskal法中第j步取出的je所連結(jié)的兩類,此時每類各自的最小張樹是g的最小張樹的子集。當兩個距離較近的密聚點集之
44、間有少量孤立的模式特征時,使用前述的方法將會錯分。2.3.2 基于密度的聚類算法基于密度的聚類算法比較有代表性的有:包括基于高密度連接區(qū)域的dbscan聚類方法,通過對象排序識別聚類結(jié)構(gòu)的optics聚類方法;基于密度分布函數(shù)的denclue聚類方法。其主要思想是只要臨近區(qū)域的密度(樣本的數(shù)目)超過某個閥值則繼續(xù)聚類。即對于給定簇中的每個樣本,在一個給定范圍的區(qū)域中必須至少包含某個數(shù)目的樣本,但它只能發(fā)現(xiàn)球狀的簇,而基于密度的方法可用來過濾“噪聲”孤立點數(shù)據(jù),以發(fā)現(xiàn)任意形狀的簇。2.3.3基于網(wǎng)絡(luò)的聚類方法 這種方法首先將數(shù)據(jù)空間劃分成為有限個單元(cell)的網(wǎng)絡(luò)結(jié)構(gòu),所有的處理都是以單個的
45、單元為對象的。其突出的優(yōu)點就是處理速度快,通常與目標數(shù)據(jù)庫中記錄的個數(shù)無關(guān)的,而只與數(shù)據(jù)空間的單元有關(guān)。代表算法有:sting它利用存儲在網(wǎng)絡(luò)單元中的統(tǒng)計信息;clique算法,它是在高維數(shù)據(jù)空間中基于網(wǎng)絡(luò)和密度的聚類算法;wave-cluster算法,它通過小波變換來轉(zhuǎn)換原始的特征空間能很好的處理高維數(shù)據(jù)和大數(shù)據(jù)集的數(shù)據(jù)表格。2.3.4 基于模型的聚類算法基于模型的方法首先是基于這樣一個假定:目標數(shù)據(jù)集是由一系列的概率分布所決定的。那么,可以在空間中尋找諸如密度分布函數(shù)這樣的模型來實現(xiàn)聚類。統(tǒng)計的方案和神經(jīng)網(wǎng)絡(luò)的方案是近些年兩種不同的嘗試方向。神經(jīng)網(wǎng)絡(luò)方法將每個簇描述為一個標本。標本作為聚類
46、的“原型”,不一定對應(yīng)一個特定的數(shù)據(jù)實例或?qū)ο?。根?jù)某些距離度量,新的對象可以被分配給標本與其最相似的簇。被分配給一個簇的對象的屬性可以根據(jù)該簇的標本的屬性來預(yù)測。2.3.5 基于劃分的聚類算法基于劃分的聚類方法,又稱動態(tài)聚類法。逐步聚類法,是實際中受到普遍歡迎的一種方法。這種方法把聚類分析歸結(jié)成一個帶約束的非線性規(guī)劃問題,通過優(yōu)化求解獲得數(shù)據(jù)集的最優(yōu)劃分和歸類。其基本思想是,在一個平面層次上對所有的樣本點先做出某種較為粗略的劃分,然后按照某種最優(yōu)的準則進行修正,通過算法的迭代執(zhí)行,得到一個較為合理的聚類結(jié)果?;趧澐值木垲惙椒ㄔO(shè)計簡單、解決問題的范圍廣,還可以轉(zhuǎn)化為優(yōu)化問題而借助經(jīng)典數(shù)學的非
47、線性規(guī)劃理論求解,非易于計算機實現(xiàn)。因此,隨著計算機的應(yīng)用和發(fā)展,基于劃分的聚類算法成為新的研究熱點?;趧澐值木垲惙椒ㄖ凶钣写硇缘乃惴ㄊ莄均值算法(c均值算法有時又稱為k均值算法,c或者k是聚類類別的個數(shù)),和k中心點算法,c均值算法又可分為硬c均值算法和模糊c均值算法。2.4 各算法優(yōu)缺點比較表2-1 幾種算法的比較算法名稱優(yōu)點缺點系統(tǒng)聚類法對初值不敏感一旦一個合并或者分裂被執(zhí)行,就不可修正,當兩個距離較近的密聚點集之間有少量孤立的模式特征點時容易出錯。最小張樹法理論上完備實際中運用效率低下基于密度的聚類算法可以發(fā)現(xiàn)任意形狀的簇,對噪聲不敏感對于空間數(shù)據(jù)分布不均勻的情況聚類效果不佳基于網(wǎng)
48、絡(luò)的聚類算法速度快,可以高效處理低維的海量數(shù)據(jù)對于維數(shù)較高的數(shù)據(jù)集,生成的單元數(shù)過多,導(dǎo)致算法的效率較低基于劃分的聚類算法設(shè)計簡單、解決問題的范圍廣,還可以轉(zhuǎn)化為優(yōu)化問題而借助經(jīng)典數(shù)學的非線性規(guī)劃理論求解,并易于計算機實現(xiàn)對初值敏感,初值選取不當可能造成聚類失敗。 由表可以看出,基于劃分的聚類算法設(shè)計簡單,解決問題的范圍廣,以及易于計算機實現(xiàn)的突出優(yōu)點十分合適本文的設(shè)計,因為隨著計算機技術(shù)的發(fā)展,電力負荷聚類,更多地要求計算機實現(xiàn)。雖然,它對初值要求較高,但對這一不足的改進與克服也正是本文的核心所在。第三章 模糊c均值在負荷特性聚類中的應(yīng)用實例3.1 聚類在電力系統(tǒng)中的應(yīng)用綜述目前,聚類分析在
49、電力系統(tǒng)中的應(yīng)用一般在以下方面,電力系統(tǒng)的故障診斷,電力系統(tǒng)同調(diào)機群,電力負荷預(yù)測以及電力負荷建模等。文獻8結(jié)合新英格蘭10機39節(jié)點系統(tǒng)和ieee50機145節(jié)點系統(tǒng)為例,將聚類和矢量量化方法相結(jié)合,將故障后系統(tǒng)的能量裕度作為特征變量之一,發(fā)展了電力系統(tǒng)暫態(tài)穩(wěn)定故障篩選方法,對電力系統(tǒng)故障分類的新的探索。文獻17中給出了一種利用模糊劃分的迭代自組織數(shù)據(jù)分析技術(shù)(iterative self-organizing data analysis techniquesalgorithm,isodata)識別電力系統(tǒng)同調(diào)機群的算法。該方法原理簡單,計算量小,適用于快速的電力系統(tǒng)分析。國內(nèi)外關(guān)于電力系統(tǒng)短期負荷預(yù)測的文獻很多,采用的預(yù)測方法和預(yù)測精度也各不相同,但由于影響負荷的諸多因素和負荷的不確定性,各種預(yù)測方法都存在著一定的局限性。傳統(tǒng)的短期負荷預(yù)測方法有回歸模型,時間序列等,隨著人工智能的興起和發(fā)展,模糊聚類辨識方法也引入到短期負荷預(yù)測中,并取得了較好的結(jié)果。文獻18中依據(jù)模糊聚類理論,提出一種短期負荷預(yù)測新方法。應(yīng)用隸屬度
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 跨國工程項目貸款合同示范文本
- 商品雞苗購銷協(xié)議書2024年
- 第5章-核反應(yīng)堆流體力學-核工程概論課件
- 商用場所裝修合同
- 加工貿(mào)易協(xié)議范本
- 大數(shù)據(jù)分析技術(shù)合作合同樣本
- 授權(quán)額度借款合同范本
- 餐廳轉(zhuǎn)讓合同書
- 應(yīng)屆畢業(yè)生就業(yè)實習合同樣本
- 2024車位交易合同范本
- 會計基礎(chǔ)案例
- 小學數(shù)學概念教學策略ppt課件
- 對數(shù)函數(shù)的圖像和性質(zhì)》說課稿
- 出租房退房驗收表
- 常用外窗及幕墻熱工性能參數(shù)
- 物業(yè)安全檢查記錄表(共7頁)
- 個人住房情況承諾書
- 國學經(jīng)典文化PPT課件
- GB_T 14976-2012流體輸送用不銹鋼無縫鋼管
- 導(dǎo)數(shù)概念ppt課件
- 旋翼式水表的結(jié)構(gòu)和工作原理(共21頁)
評論
0/150
提交評論