面向電網(wǎng)調(diào)控信息智能檢索的知識圖譜構(gòu)建及應(yīng)用_第1頁
面向電網(wǎng)調(diào)控信息智能檢索的知識圖譜構(gòu)建及應(yīng)用_第2頁
面向電網(wǎng)調(diào)控信息智能檢索的知識圖譜構(gòu)建及應(yīng)用_第3頁
面向電網(wǎng)調(diào)控信息智能檢索的知識圖譜構(gòu)建及應(yīng)用_第4頁
面向電網(wǎng)調(diào)控信息智能檢索的知識圖譜構(gòu)建及應(yīng)用_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

01電網(wǎng)調(diào)控信息知識圖譜構(gòu)建電網(wǎng)調(diào)控信息知識圖譜通過業(yè)務(wù)需求分析,構(gòu)建知識圖譜本體概念框架,以電網(wǎng)設(shè)備作為圖譜基礎(chǔ)本體,與設(shè)備相關(guān)屬性進行鏈接,通過設(shè)備與廠站關(guān)聯(lián)關(guān)系,鏈接全網(wǎng)范圍設(shè)備,將調(diào)度規(guī)程文本中對設(shè)備的描述作為電力設(shè)備屬性,通過上述方式構(gòu)建調(diào)控信息層次化知識圖譜,如圖1所示。在圖1中,數(shù)據(jù)層主要以結(jié)構(gòu)化的電網(wǎng)模型信息以及非結(jié)構(gòu)的調(diào)度規(guī)程文本形式存在。數(shù)據(jù)預處理層形成了調(diào)控信息訓練樣本庫。知識抽取層是構(gòu)建知識圖譜的關(guān)鍵,其采用提取-翻譯-加載方法將電網(wǎng)模型數(shù)據(jù)轉(zhuǎn)換為調(diào)控信息知識圖譜的實體和實體間關(guān)系。知識融合層可以對抽取的知識進行標準化以形成統(tǒng)一的知識模型。知識應(yīng)用層基于調(diào)控信息知識圖譜推薦和檢索調(diào)控業(yè)務(wù)操作知識提升調(diào)控業(yè)務(wù)處置效率。圖1

調(diào)控信息知識圖譜構(gòu)建方案Fig.1

ConstructionplanofdispatchingandcontrolinformationknowledgegraphBiLSTM-CRF模型是將BiLSTM模型和CRF進行結(jié)合,模型結(jié)構(gòu)如圖2所示。與此同時,本文將BiLSTM中Softmax層替換為CRF層,以提升調(diào)度運行規(guī)程文本的段落類別識別精確性。BiLSTM將前向與后向LSTM相結(jié)合,以更好地從兩個方向獲取序列特征。本文模型包含向前和向后兩個訓練層,且兩層之間沒有信息流,共同連接一個輸出層。這個結(jié)構(gòu)提供給輸出層輸入序列中每一個點完整的過去和未來上、下文信息。Embedding層將模型輸入特征轉(zhuǎn)化為低維稠密向量。LSTM記憶單元由輸入門、遺忘門、輸出門與存儲記憶單元組合而成,使得序列信息可以更好地向后傳遞。圖2

BiLSTM-CRF模型結(jié)構(gòu)Fig.2

StructureofBiLSTM-CRFmodelCRF通過考慮相鄰標簽的關(guān)系獲得一個全局最優(yōu)的標簽序列。通過學習各類別標注間的約束條件,以彌補BiLSTM網(wǎng)絡(luò)沒有考慮輸出標注間關(guān)系的劣勢。將BiLSTM網(wǎng)絡(luò)計算出的狀態(tài)序列向量作為CRF層的輸入,并通過狀態(tài)轉(zhuǎn)移矩陣,得到整個預測序列的得分。02基于BiLSTM-CRF的調(diào)度規(guī)程文本信息抽取

將電網(wǎng)調(diào)度運行規(guī)程文本轉(zhuǎn)化為超文本標記語言(hypertextmarkuplanguage,HTML)格式,通過分析調(diào)度規(guī)程屬性、內(nèi)容和格式,確定影響文本信息的8維特征,如表1所示。其中文本特征基于正則表達式識別運行規(guī)則文本特定字符、符號或數(shù)字確定,其余7種特征均由HTML格式文本直接生成。表1

特征變量表示Table1

Characteristicvariablerepresentation通過對調(diào)度運行規(guī)程分析,確定20個規(guī)則標題及段落標簽作為模型輸出,20個標簽存在父子關(guān)系,父節(jié)點標簽為待檢索問題,子節(jié)點標簽為檢索所對應(yīng)的解釋內(nèi)容。本文將電網(wǎng)調(diào)度運行規(guī)程20種輸出標簽劃分為10個層級,如表2所示。表2

層級劃分及其標簽類別對應(yīng)關(guān)系Table2

Hierarchyandcorrespondingrelationshipbetweenlabelcategories在模型訓練階段,將前5種特征中的每個特征通過Embedding層轉(zhuǎn)化為3維向量,剩余3種特征利用自身數(shù)值表示,如此形成一個18維的輸入樣本。采用20種信息標簽作為模型輸出。通過樣本訓練基于BiLSTM-CRF的電網(wǎng)調(diào)度規(guī)程信息識別模型,批次大小為16,學習率為0.01,隱藏層維數(shù)為256,神經(jīng)元隨機失活率為0.5,優(yōu)化器為Adam。03算例分析本文試驗數(shù)據(jù)來自某調(diào)控中心,包括電網(wǎng)調(diào)度控制管理規(guī)程、電網(wǎng)調(diào)度控制運行管理細則、電網(wǎng)作業(yè)指導書等調(diào)度規(guī)程文本,將文檔中每一段落作為一條數(shù)據(jù),累計得到10904條數(shù)據(jù),按照7∶2∶1的比例將數(shù)據(jù)集劃分為訓練集、驗證集和測試集,得到訓練集、驗證集、測試集數(shù)據(jù)分別為7634、2180、1090條。模型訓練采用GPU顯卡型號為NVIDIAQuadroRTX5000,深度學習框架為Torch1.4.0。本文采用精準率P、召回率R和綜合評價指標F1作為電網(wǎng)運行規(guī)程信息識別結(jié)果的評價指標,即式中:T為正類預測為正類的樣本數(shù);L為負類預測為正類的樣本數(shù);N為正類預測為負類的樣本數(shù)?;谡{(diào)度規(guī)程訓練集和驗證集訓練BiSLTM-CRF知識識別模型。采用1090條測試樣本驗證,20種標簽識別效果如表3所示。表3

各類別標簽識別結(jié)果Table3

Labelrecognitionresultsofeachcategory從表3可以看出,文中所提BiSLTM-CRF模型在測試集上取得了較高的識別效果,對于部分調(diào)度規(guī)程段落標簽,其各項評價指標可以達到100%,多數(shù)段落標簽識別指標也超過90%。與此同時,計算20種段落標簽識別效果,其P為98.10%,R為98.19%,F(xiàn)1為98.10%。采用相同數(shù)據(jù)集驗證LSTM模型、BiLSTM模型和BiLSTM-CRF模型對調(diào)度運行規(guī)程信息的識別效果,如圖3所示。圖3

訓練過程準確率Fig.3

Accuracycurveoftrainingprocess從圖3可以看出,隨著訓練迭代次數(shù)增加,3個模型呈現(xiàn)不同程度的收斂速度。相比LSTM和BiLSTM模型,BiLSTM-CRF模型收斂速度較快,損失值較小,準確率較高。對于測試樣本集,各模型性能如表4所示。表4

不同模型性能比較Table4

Performancecomparisonofdifferentmodels采用不同模型計算每條測試樣本的F1,繪制箱型圖如圖4所示。從圖4可以看出BiLSTM-CRF模型的F1要明顯高于BiSLTM和LSTM模型。LSTM模型的F1集中在89.15%~93.11%,個別類別標簽識別準確性在80%,這種情況的原因可能是由于部分標簽之間特征過于相似,模型難以學習到區(qū)分規(guī)程。BiLSTM對調(diào)度規(guī)程整體識別精度有了一定提升,模型的F1提升了2.77%,說明加入反向?qū)W習后,使得模型對運行規(guī)程段落信息特征提取能力更加充分,但還不能解決由于部分標簽之間特征過于相似,使模型難以有效區(qū)分的問題。加入CRF后,模型對各類別標簽識別精度集中于96.60%~99.60%,使得原來難以區(qū)分的段落標簽得到有效區(qū)分,其相對于BiLSTM模型的F1值提升了4.68%。圖4

各模型綜合評價指標F1對比Fig.4

Comparisonofdifferentmodels

F1

value04基于知識圖譜的信息智能檢索融合識別的電網(wǎng)模型知識建立電力實體知識圖譜,融合識別的調(diào)度運行規(guī)程知識建立調(diào)度運行規(guī)程知識圖譜,通過“設(shè)備-廠站-運行規(guī)程”的關(guān)系將上述知識圖譜鏈接建立調(diào)控信息知識圖譜?;谠~頻-逆文件頻率和余弦值計算輸入的調(diào)度檢索語言與知識圖譜實體節(jié)點文本的相似度距離,檢索和推薦出與輸入調(diào)度運行語言最匹配的解釋內(nèi)容。在實際應(yīng)用中,涉及調(diào)度應(yīng)用場景中較多,文中以系統(tǒng)自動感知事件檢索信息和人工檢索信息兩種方式給出典型調(diào)度場景下的應(yīng)用實例,如圖5所示。在電網(wǎng)故障異常、倒閘操作、設(shè)備啟動等場景中,調(diào)控系統(tǒng)可以自動感知相關(guān)事件,將事件輸入到調(diào)控信息知識圖譜中,經(jīng)過知識推理,快速檢索出調(diào)控人員所需要的設(shè)備信息、天氣信息以及調(diào)度規(guī)程精細化信息,快速反饋給調(diào)度員,大幅度提升調(diào)度員對信息檢索和歸集的效率。同時調(diào)控人員也可以通過手動輸入調(diào)度運行語言,并通過調(diào)控信息知識圖譜推理定位檢索內(nèi)容所對應(yīng)的精細化解釋,以減少查找時間。文中所提檢索方法可以精細化地將檢索要點和對應(yīng)的解釋內(nèi)容,與現(xiàn)行單純檢索規(guī)程標題的方法相比,更能夠滿足實際現(xiàn)場的需要。目前基于知識圖譜的調(diào)控信息智能檢索應(yīng)用已經(jīng)在多個調(diào)控中心上線應(yīng)用,調(diào)控業(yè)務(wù)信息檢索平均準確率在95%以上,能夠滿足調(diào)控人員面對海量信息快速增長,對多維信息進行精細化檢索的需求。圖5

基于知識圖譜的調(diào)控信息智能檢索技術(shù)應(yīng)用實例Fig.5

Applicationofintelligentretrievalofdispatchingandcontrolinformationbaseknowledgegraph

05結(jié)語

為了提升不同電網(wǎng)調(diào)控場景下多維信息快速檢索和推薦能力,提出基于知識圖譜的調(diào)控信息智能檢索方法,采用BiLSTM-CRF識別調(diào)度運行規(guī)則知識,通過“設(shè)備-廠站-規(guī)程”的調(diào)度業(yè)務(wù)邏輯關(guān)系融合

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論