版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
智能建造概論裝配式建筑工程技術(shù)專業(yè)教學(xué)資源庫(kù)功能模塊層模塊六—智能運(yùn)維主講人:在智能運(yùn)維(AIOps)平臺(tái)落地的實(shí)踐中,算法和數(shù)據(jù)的融合,第一步是數(shù)據(jù)的采集和匯聚,通過(guò)前文介紹的關(guān)鍵技術(shù),我們已經(jīng)獲得了質(zhì)量標(biāo)準(zhǔn)歸一化的、經(jīng)過(guò)了提取和轉(zhuǎn)換的、時(shí)間/空間/業(yè)務(wù)維度標(biāo)記清楚的數(shù)據(jù),需要補(bǔ)充的是數(shù)據(jù)預(yù)處理相關(guān)的核心要點(diǎn)。功能模塊在數(shù)據(jù)挖掘中,海量原始數(shù)據(jù)中存在大量不完整(有缺失值)、不一致或有異常的數(shù)據(jù),嚴(yán)重影響到數(shù)據(jù)挖掘建模的執(zhí)行效率,甚至可能導(dǎo)致挖掘結(jié)果的偏差。數(shù)據(jù)預(yù)處理的目的是提高數(shù)據(jù)質(zhì)量,從而提升數(shù)據(jù)挖掘的質(zhì)量。方法包括數(shù)據(jù)清洗、數(shù)據(jù)集成和轉(zhuǎn)換,以及數(shù)據(jù)歸約。1、數(shù)據(jù)預(yù)處理通過(guò)數(shù)據(jù)預(yù)處理,可以去掉數(shù)據(jù)中的噪音,糾正不一致;數(shù)據(jù)集成將數(shù)據(jù)由多個(gè)源合并成一致的數(shù)據(jù)存儲(chǔ),如數(shù)據(jù)倉(cāng)儲(chǔ)或數(shù)據(jù)立方;數(shù)據(jù)變換(如規(guī)范化)也可以使用,例如規(guī)范化可以改進(jìn)涉及距離度量的挖掘算法的精度和有效性;數(shù)據(jù)規(guī)約可以通過(guò)合并、刪除冗余特征或聚類來(lái)壓縮數(shù)據(jù)。這些數(shù)據(jù)處理技術(shù)在數(shù)據(jù)挖掘之前使用,可以大大提高數(shù)據(jù)挖掘模式的質(zhì)量,降低實(shí)際挖掘所需要的時(shí)間。1、數(shù)據(jù)預(yù)處理需要注意,有些算法對(duì)異常值非常敏感。任何依賴均值/方差的算法都對(duì)離群值敏感,因?yàn)檫@些統(tǒng)計(jì)量受極值的影響極大。另一方面,一些算法對(duì)離群點(diǎn)具有更強(qiáng)的魯棒性。數(shù)據(jù)分析中的描述性統(tǒng)計(jì)分析認(rèn)為:當(dāng)我們面對(duì)大量信息的時(shí)候,經(jīng)常會(huì)出現(xiàn)數(shù)據(jù)越多,事實(shí)越模糊的情況,因此我們需要對(duì)數(shù)據(jù)進(jìn)行簡(jiǎn)化,描述統(tǒng)計(jì)學(xué)就是用幾個(gè)關(guān)鍵的數(shù)字來(lái)描述數(shù)據(jù)集的整體情況。1、數(shù)據(jù)預(yù)處理在智能運(yùn)維(AIOps)算法分析系統(tǒng)中,不同算法對(duì)應(yīng)不同的適配場(chǎng)景,需要根據(jù)數(shù)據(jù)特征模式來(lái)選擇合適的算法應(yīng)用。如指標(biāo)異常算法的應(yīng)用:針對(duì)周期穩(wěn)定的數(shù)據(jù),我們采取動(dòng)態(tài)極限的模型;針對(duì)周期不穩(wěn)定的數(shù)據(jù),采用頻域分析的模型;針對(duì)穩(wěn)定的數(shù)據(jù)采用極限閾值判斷的模型。通過(guò)模型選擇的算法,對(duì)于相同的數(shù)據(jù)的模型進(jìn)行適配,達(dá)到最優(yōu)的效果。2、算法工程集成因此,想要以開(kāi)箱即用的方式、采用某種標(biāo)準(zhǔn)的機(jī)器學(xué)習(xí)算法直接應(yīng)用,而不考慮業(yè)務(wù)特征,通常并不可行。2、算法工程集成我們需要首先考慮該組業(yè)務(wù)指標(biāo)間的關(guān)聯(lián)性,如果有應(yīng)用或系統(tǒng)間的調(diào)用鏈或調(diào)用拓?fù)涔﹨⒖迹@是最好不過(guò)的。如果沒(méi)有調(diào)用鏈或拓?fù)洌瑒t需要先根據(jù)已知可能的業(yè)務(wù)相關(guān)性,進(jìn)行曲線波動(dòng)關(guān)聯(lián)、回歸分析等算法分析,獲得極限閾值嘗試得到因果匹配,通過(guò)一系列的事件歸集得到相關(guān)性,再對(duì)每一次反饋進(jìn)行適應(yīng),嘗試自動(dòng)匹配更為準(zhǔn)確的算法和參數(shù),才可能達(dá)到期望的異常檢測(cè)目標(biāo)。2、算法工程集成智能運(yùn)維的工程化過(guò)程,是一個(gè)算法、算力與數(shù)據(jù)相結(jié)合,平臺(tái)自身與業(yè)務(wù)系統(tǒng)反饋相結(jié)合的復(fù)雜過(guò)程。在與業(yè)務(wù)場(chǎng)景結(jié)合的前提下,靈活的算
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 借款合同保證書(shū)
- 對(duì)賭協(xié)議合同注意事項(xiàng)
- 商業(yè)服務(wù)合同的社交媒體營(yíng)銷
- 總價(jià)合同與單價(jià)合同的差異性解讀
- 論文質(zhì)量自我檢查
- 面料訂購(gòu)協(xié)議范例
- 專業(yè)外包服務(wù)合同詳解
- 土方承包合同規(guī)定
- 方木購(gòu)入合同格式
- 品牌年度服務(wù)合同的續(xù)簽策略
- 《礦山隱蔽致災(zāi)因素普查規(guī)范》解讀培訓(xùn)
- 小學(xué)2024年法制教育工作計(jì)劃x
- (DB45T 2524-2022)《高速公路瀝青路面施工技術(shù)規(guī)范》
- 醫(yī)療溝通技巧
- 子宮動(dòng)脈栓塞手術(shù)
- 2024年世界職業(yè)院校技能大賽中職組“節(jié)水系統(tǒng)安裝與維護(hù)組”賽項(xiàng)考試題庫(kù)(含答案)
- 紙袋制造機(jī)產(chǎn)業(yè)深度調(diào)研及未來(lái)發(fā)展現(xiàn)狀趨勢(shì)
- 2024年職業(yè)病危害防治培訓(xùn)試題
- 維修作業(yè)區(qū)修理工上崗試卷+答案
- 譯林新版(2024)七年級(jí)英語(yǔ)上冊(cè)Unit 5 Welcome to the unit課件
- 東方電影學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
評(píng)論
0/150
提交評(píng)論