數(shù)據(jù)立方體技術(shù)在電力數(shù)據(jù)統(tǒng)計(jì)分析中的運(yùn)用與研究_第1頁(yè)
數(shù)據(jù)立方體技術(shù)在電力數(shù)據(jù)統(tǒng)計(jì)分析中的運(yùn)用與研究_第2頁(yè)
數(shù)據(jù)立方體技術(shù)在電力數(shù)據(jù)統(tǒng)計(jì)分析中的運(yùn)用與研究_第3頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、數(shù)據(jù)立方體技術(shù)在電力數(shù)據(jù)統(tǒng)計(jì)分析中的運(yùn)用與研究摘要:數(shù)據(jù)立方體是一類(lèi)多維矩陣,讓用戶從多個(gè)角度探索和分析數(shù)據(jù)集,即它允許以多個(gè)維度對(duì)數(shù)據(jù)進(jìn)行建模和觀察,數(shù)據(jù)立方體技術(shù)是數(shù)據(jù)倉(cāng)庫(kù)的核心技術(shù)。本文以電力系統(tǒng)數(shù)據(jù)統(tǒng)計(jì)分析工作為例,介紹了數(shù)據(jù)立方體技術(shù)的原理,研究探討了數(shù)據(jù)立方體技術(shù)在電力系統(tǒng)數(shù)據(jù)統(tǒng)計(jì)分析工作中的運(yùn)用,通過(guò)建立基于數(shù)據(jù)立方體模型的電力數(shù)據(jù)統(tǒng)計(jì)分析系統(tǒng),不但可以實(shí)現(xiàn)運(yùn)行輕量級(jí)數(shù)據(jù)分析工具,而且滿足了當(dāng)前電網(wǎng)建設(shè)運(yùn)行數(shù)據(jù)統(tǒng)計(jì)分析靈活、多樣的需求。關(guān)鍵詞:數(shù)據(jù)立方體模型數(shù)據(jù)挖掘輕量級(jí)工具中圖分類(lèi)號(hào):TM73文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1674-098X202111a-0009-02電網(wǎng)建設(shè)運(yùn)行數(shù)

2、據(jù)的采集與分析,是全面快速了解電網(wǎng)狀態(tài)并指導(dǎo)后續(xù)工作開(kāi)展的一項(xiàng)重要工作。電力數(shù)據(jù)統(tǒng)計(jì)分析需要對(duì)數(shù)據(jù)進(jìn)行快速提取并進(jìn)行靈活、多樣的分析,現(xiàn)有電網(wǎng)中涉及電力運(yùn)行分析的相關(guān)業(yè)務(wù)系統(tǒng)繁多,數(shù)據(jù)大局部面向業(yè)務(wù)雖有報(bào)表統(tǒng)計(jì)模塊,卻難以完全適應(yīng)此需求。通過(guò)在電力數(shù)據(jù)統(tǒng)計(jì)分析管理系統(tǒng)中建立數(shù)據(jù)立方體模型,可以實(shí)現(xiàn)運(yùn)行輕量級(jí)數(shù)據(jù)分析工具,滿足當(dāng)前電力數(shù)據(jù)統(tǒng)計(jì)分析工作的需要。1基于數(shù)據(jù)立方體技術(shù)數(shù)據(jù)分析模型建立1.1數(shù)據(jù)立方體數(shù)據(jù)立方體是一類(lèi)多維矩陣,通常一次同時(shí)考慮三個(gè)因素維度,但并不局限于三個(gè),在實(shí)際中常常用多個(gè)維度來(lái)構(gòu)建數(shù)據(jù)立方體。多維矩陣是數(shù)據(jù)立方體分析的根底,涉及2個(gè)重要概念:事實(shí)和維度。事實(shí)即分析的目

3、標(biāo)數(shù)據(jù),如數(shù)量、金額等,維度即事實(shí)信息的屬性,如對(duì)應(yīng)的時(shí)間、設(shè)備類(lèi)型、產(chǎn)權(quán)單位等。數(shù)據(jù)立方體是根據(jù)用戶對(duì)數(shù)據(jù)挖掘的要求確定維及維層次而生成的多維數(shù)據(jù)集合。每個(gè)數(shù)據(jù)立方體是一個(gè)三維結(jié)構(gòu),x、y、z軸分別表示數(shù)據(jù)立方體的三個(gè)維度。x軸是時(shí)間軸,其時(shí)間單位是該層的統(tǒng)計(jì)粒度;y軸是屬性軸,表示統(tǒng)計(jì)針對(duì)的記錄類(lèi)型;z軸是統(tǒng)計(jì)方法軸,表示采用的統(tǒng)計(jì)方法。1.2數(shù)據(jù)立方體的建立與提取構(gòu)建在數(shù)據(jù)庫(kù)中的數(shù)據(jù)立方體并非如數(shù)據(jù)立方體字面意思直觀,而是通過(guò)二維數(shù)據(jù)表形式進(jìn)行組織與存儲(chǔ)。通過(guò)將y軸的維度與z軸的統(tǒng)計(jì)值轉(zhuǎn)化為二維表格中的列,x軸時(shí)間單位作為記錄頻率進(jìn)行定期數(shù)據(jù)獲取并存儲(chǔ)到數(shù)據(jù)立方體所在數(shù)據(jù)庫(kù)中。1數(shù)據(jù)列重

4、定義。大局部系統(tǒng)因?yàn)榫幋a技術(shù)特點(diǎn),開(kāi)發(fā)人員往往使用英文字母與數(shù)字組合作為表格與字段名稱(chēng),在客戶展現(xiàn)端使用相應(yīng)意義的中文顯示。然而通過(guò)表格關(guān)聯(lián)的字段,數(shù)據(jù)立方體視圖在生成時(shí)按照計(jì)算機(jī)特點(diǎn)仍然使用英文字母與數(shù)字方式顯示,由于需要考慮數(shù)據(jù)立方體生成靈活性,需要在數(shù)據(jù)庫(kù)中針對(duì)表格和字段進(jìn)行重定義,利用系統(tǒng)表格進(jìn)行表名和字段名稱(chēng)中文與字母的映射,滿足用戶隨意利用系統(tǒng)表關(guān)聯(lián)建立視圖工作方式。2計(jì)算列實(shí)現(xiàn)。數(shù)據(jù)立方體中的指標(biāo)列,既可以包含個(gè)數(shù)、長(zhǎng)度、金額等原始表格數(shù)據(jù)列,也可以包含諸如平均數(shù)、求和、乘積等計(jì)算值??衫脭?shù)據(jù)庫(kù)定義的多種函數(shù)進(jìn)行計(jì)算列生成。3維度遞進(jìn)實(shí)現(xiàn)。由于一些維度存在一定的層次結(jié)構(gòu)特性,故

5、而維度的定義與組織往往使用樹(shù)狀層次結(jié)構(gòu)實(shí)現(xiàn)。遞進(jìn)維度是多個(gè)相關(guān)維度相互嵌套的一種形式,是實(shí)現(xiàn)數(shù)據(jù)立方體數(shù)據(jù)切塊或切片的根底,通過(guò)組織好維度的樹(shù)狀菜單,可實(shí)現(xiàn)基于維度樹(shù)的數(shù)據(jù)向上向下切片功能。在數(shù)據(jù)提取上采用手工提取與系統(tǒng)獲取相結(jié)合,通過(guò)系統(tǒng)統(tǒng)計(jì)周期即數(shù)據(jù)立方體中y軸頻率對(duì)數(shù)據(jù)立方體中數(shù)據(jù)進(jìn)行上一周期數(shù)據(jù)進(jìn)行復(fù)制到本周期默認(rèn)數(shù)據(jù),相應(yīng)數(shù)據(jù)管理單位通過(guò)對(duì)默認(rèn)數(shù)據(jù)的修改填報(bào)完成各個(gè)數(shù)據(jù)立方體數(shù)據(jù)的填充。數(shù)據(jù)立方體主要采用自動(dòng)化生成,由于電力數(shù)據(jù)統(tǒng)計(jì)分析數(shù)據(jù)管理需具備閉環(huán)管理功能,故采用數(shù)據(jù)自動(dòng)生成,通過(guò)任務(wù)接收、提供對(duì)外標(biāo)準(zhǔn)接口,提供不同系統(tǒng)條件下數(shù)據(jù)填報(bào)由人工轉(zhuǎn)入自動(dòng)化接口。2系統(tǒng)構(gòu)建本系統(tǒng)通過(guò)B

6、/S結(jié)構(gòu)進(jìn)行開(kāi)發(fā),用戶客戶端通過(guò)瀏覽器進(jìn)行操作,效勞端進(jìn)行數(shù)據(jù)的存儲(chǔ)和對(duì)外發(fā)布管理,實(shí)現(xiàn)基于省市縣三級(jí)管理單位電力運(yùn)行分析數(shù)據(jù)設(shè)備、缺陷、業(yè)務(wù)等數(shù)據(jù)的填報(bào)和報(bào)表統(tǒng)計(jì)分析管理。系統(tǒng)使用三層結(jié)構(gòu)開(kāi)發(fā),分為數(shù)據(jù)層、邏輯層和應(yīng)用層。數(shù)據(jù)層負(fù)責(zé)根底臺(tái)賬數(shù)據(jù)的存儲(chǔ),使用SQLSERVER數(shù)據(jù)庫(kù)進(jìn)行管理,邏輯層負(fù)責(zé)數(shù)據(jù)填報(bào)與統(tǒng)計(jì)數(shù)據(jù)庫(kù)操作邏輯與結(jié)果反響功能,應(yīng)用層使用基于Ajax頁(yè)面無(wú)刷新技術(shù)的富客戶端顯示技術(shù)與操作用戶進(jìn)行交互。3數(shù)據(jù)挖掘?qū)嶋H運(yùn)用3.1數(shù)據(jù)切片數(shù)據(jù)立方體想要通過(guò)統(tǒng)計(jì)圖進(jìn)行展示,就需將數(shù)據(jù)立方體進(jìn)行切片。通過(guò)數(shù)據(jù)切片,實(shí)現(xiàn)數(shù)據(jù)立方體中單一維度的分解,通過(guò)單位切片可以分析不同單位的缺陷分布統(tǒng)計(jì)

7、圖。3.2數(shù)據(jù)切塊數(shù)據(jù)切塊主要包括兩種方式,單一維區(qū)間切塊和多維區(qū)間切塊。單一維區(qū)間切塊在本系統(tǒng)中應(yīng)用較多。多維切塊是指在兩個(gè)或多個(gè)維度上選取相應(yīng)的數(shù)據(jù)范圍進(jìn)行切塊的方式。例如在缺陷數(shù)據(jù)切塊中時(shí)間維度選擇2021年,地區(qū)維度選擇某市,影響設(shè)備類(lèi)型選擇電源,即可針對(duì)該范圍提取相應(yīng)的數(shù)據(jù)塊,進(jìn)行進(jìn)一步的數(shù)據(jù)切片分析。3.3數(shù)據(jù)鉆取數(shù)據(jù)挖掘分?jǐn)?shù)據(jù)源鉆取、深度鉆取兩種方式。數(shù)據(jù)源鉆取主要用于統(tǒng)計(jì)圖表中相應(yīng)數(shù)據(jù)項(xiàng)的統(tǒng)計(jì)來(lái)源數(shù)據(jù)的提取,具備數(shù)據(jù)源表格顯示和表格下載功能。深度鉆取指在數(shù)據(jù)立方體上進(jìn)行某個(gè)方向上數(shù)據(jù)切塊后,在獲得的數(shù)據(jù)塊根底上進(jìn)一步進(jìn)行維度切塊或者切片分析的操作模式。3.4維度旋轉(zhuǎn)構(gòu)建的數(shù)據(jù)立

8、方體二維表格具備多個(gè)維度,在原有維度的根底上進(jìn)行維度選擇,可以實(shí)現(xiàn)圖表不同維度的轉(zhuǎn)換。分析出的數(shù)據(jù)視圖大都具備三個(gè)以上的維度,系統(tǒng)用戶往往需要對(duì)其多維度進(jìn)行提取,從而完成基于兩個(gè)維度的平面統(tǒng)計(jì)圖構(gòu)建工作,通過(guò)轉(zhuǎn)換不同的x軸和y軸坐標(biāo)可以實(shí)現(xiàn)多個(gè)圖表的維度旋轉(zhuǎn)。3.5數(shù)據(jù)導(dǎo)出通過(guò)數(shù)據(jù)鉆取的數(shù)據(jù),通常用戶需將其轉(zhuǎn)換為EXCEL表格,進(jìn)行報(bào)告的依據(jù)整理。使用基于微軟COM組件根底的EXCELDLL接口,實(shí)現(xiàn)基于web數(shù)據(jù)的導(dǎo)出工作,可以實(shí)現(xiàn)表格導(dǎo)出。3.6固定報(bào)表企業(yè)報(bào)表是信息系統(tǒng)呈現(xiàn)用戶價(jià)值所在,日常實(shí)現(xiàn)報(bào)表的方式有兩種,一種網(wǎng)頁(yè)格式,另一種電子文件格式。兩種實(shí)現(xiàn)方式各具優(yōu)缺點(diǎn),本系統(tǒng)兼容兩種格式

9、。1基于web的固定報(bào)表。Web固定報(bào)表可根據(jù)用戶實(shí)際需求進(jìn)行選取,圖表展示和表格顯示大局部報(bào)表工具都具備。由于系統(tǒng)支持電子文件格式導(dǎo)出報(bào)表,故而沒(méi)有使用專(zhuān)業(yè)報(bào)表工具進(jìn)行顯示打印,僅僅使用Extjs前端腳本進(jìn)行數(shù)據(jù)表格與圖表的顯示功能,也可以選擇商業(yè)化的圖表工具進(jìn)行展示,提升系統(tǒng)的美觀性。2基于EXCEL的報(bào)表?;谖④汣OM組件技術(shù)的EXCELDLL接口,實(shí)現(xiàn)基于web數(shù)據(jù)的導(dǎo)出,可以實(shí)現(xiàn)表格導(dǎo)出。通過(guò)COM自帶OLE函數(shù),調(diào)用生成EXCEL表格并填入表格數(shù)字,同時(shí)根據(jù)表格自動(dòng)生成相應(yīng)的圖表,最后通過(guò)COM函數(shù)存儲(chǔ)為需要的EXCEL文件。當(dāng)報(bào)表數(shù)目很多時(shí),可通過(guò)標(biāo)簽頁(yè)實(shí)現(xiàn)或者通過(guò)調(diào)用ZIP函數(shù)進(jìn)行多文件打包下載。4結(jié)語(yǔ)數(shù)據(jù)立方體是數(shù)據(jù)倉(cāng)庫(kù)的核心技術(shù),基于數(shù)據(jù)立方體模型建立電力數(shù)據(jù)統(tǒng)計(jì)分析系統(tǒng),不但實(shí)現(xiàn)輕量化易于掌握的軟件,而且可以滿足數(shù)據(jù)統(tǒng)計(jì)靈活、多樣需求,成為電力管理部門(mén)數(shù)據(jù)分析挖掘重要工具。參考文獻(xiàn)【1】王德文,周青.一種電力設(shè)備狀態(tài)監(jiān)測(cè)大數(shù)據(jù)的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論