基于形變分析模型的異常檢測系統(tǒng)建設_第1頁
基于形變分析模型的異常檢測系統(tǒng)建設_第2頁
基于形變分析模型的異常檢測系統(tǒng)建設_第3頁
基于形變分析模型的異常檢測系統(tǒng)建設_第4頁
基于形變分析模型的異常檢測系統(tǒng)建設_第5頁
已閱讀5頁,還剩22頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、基于形變分析模型的異常檢測系統(tǒng)建設與實踐、美團外賣業(yè)務異常檢測現(xiàn)狀外賣業(yè)務特點 主要痛點二、形變分析模型介紹三、業(yè)務異常檢測系統(tǒng)的整體設計四、異常檢測與其他穩(wěn)定性保障系統(tǒng)內(nèi)聯(lián)五、落地情況及實踐效果 六、回顧總結模型分析過程 告警收斂策略解決了美團外賣哪些現(xiàn)實問題與常時間序列異常檢測法的差異美團外賣業(yè)務特點-典型曲線大多數(shù)核業(yè)務指標都是呈現(xiàn)周期性、趨勢性。 午/晚峰值與低峰期相差百倍。日完成訂單2千多萬單。有規(guī)律的時間序列美團外賣業(yè)務特點-典型曲線規(guī)律的時間序列不定 時 營 銷 活 動SET化引 流 操 作AVG、TP99等性能指 標某 服 務 失 敗 率美團外賣業(yè)務特點-主要痛點重大事故時如何

2、避免 告警洪潮配置告警閾值 成本告警精確率與召回率 難平衡典型故障場景分析需要介、美團外賣業(yè)務異常檢測現(xiàn)狀外賣業(yè)務特點 主要痛點二、形變分析模型介紹三、業(yè)務異常檢測系統(tǒng)的整體設計四、異常檢測與其他穩(wěn)定性保障系統(tǒng)內(nèi)聯(lián)五、落地情況及實踐效果 六、回顧總結模型分析過程 告警收斂策略解決了美團外賣哪些現(xiàn)實問題與常時間序列異常檢測法的差異形變分析模型介紹形變分析模型的特點: 主要基于對形狀的預測,不是數(shù)值的預測。通過多次處理提 升告警閾值適應性。形變分析模型的適范圍:有規(guī)律的時間序列。形變分析模型的核公式:歸化互相關(余弦相關性):是如何進異常點識別的?主要是通過當前曲線的形狀是否符合預期。眼識別的有規(guī)

3、律時間序列會分如下類:整體抬升或偏移陰跌陡升陡降陡降后更貼近預測形變量計算:(1 - 余弦相關性)x基線變化量形變分析模型介紹異常檢測+相關性變點檢測告警收斂策略鏈路維度收斂:同刻單鏈路多條曲線告警收斂為條。 按照次數(shù)或時間桶進收斂。圖形化告警信息,直觀體現(xiàn)前后異常趨勢。針對當前值減去基線值趨近于0的超級變點,采前分鐘數(shù)值減去當前值作為補充。形變分析模型介紹-模型分析過程形變分析模型的主旨是對有規(guī)律的時間序列數(shù)據(jù)進 處理,盡量將數(shù)據(jù)歸到個維度。1.確定曲線特征:通過傅葉變換確定周期,確 定節(jié)假與作的差異性。2.選擇基準線:這可以根據(jù)歷史數(shù)據(jù)預測曲線形 狀,也可以根據(jù)同源數(shù)據(jù)進預測。3.基準形變

4、量計算:預測完畢后需要進兩次處 理,盡可能將多維數(shù)據(jù)歸到個基準上,計算 出對應的形變量告警閾值。4.異常判定:根據(jù)基準形變量動設定不同等級的 告警閾值,并結合反饋進動修正。次處 理,去 除形狀擾。二次處 理,去 除量級 影響。形 變 分 析 模 型 整 體 分 析 流 程形變分析模型介紹-第次針對形狀處理歸化互相關(余弦相關性):將整個時間序列歸成個 0,1 的區(qū)間,去除了形狀的維度。但是,不同時段的量級對相關性計 算影響較大。低峰期量級較對相關性影響較大。形變分析模型介紹-第二次針對量級還原形變量計算:P0 P1最終的形變量(1 - 余弦相關性)x|實時當前值- 基線當前值|通過對量級的還原

5、,對量級降級,去除量級的影響,最終歸到形變量上。形變分析模型介紹-模型分析過程圖形解釋的:基于對形狀的預測,通過兩次處理將數(shù)據(jù)統(tǒng)在個維度上進異常判定與定級1次處理,進歸化互 相關,去除因時間引起的波峰波。2二次處理,通過差值還原量級最終得到形變量,去除量級的影響。P0 P1反饋閾值敏感或不敏感4通過反饋動調(diào)整告警等級。3形狀預測。形變分析模型-告警收斂策略的:直觀展示異常點與變化趨勢,在事故時避免出現(xiàn)告警洪潮影響業(yè)務開發(fā)員定位問題根因圖形化告警,直觀展示異常點變 化幅度,展示最近時間區(qū)間是否 發(fā)過異常。通過收集戶為判斷告警的關注度,對低關注度告警進強收斂。根據(jù)業(yè)務相關性,從強相關的 業(yè)務鏈路上

6、收集異常告警事件 進分析,從更維度給出鏈 路級分析報告。在事故持續(xù)時間較時,每分鐘都發(fā)送告警會對業(yè)務 造成擾,在連續(xù)三分鐘發(fā)送異常告警之后,采間 隔3、5、7、7. 直到判斷異?;謴蜑?。形變分析模型-解決了哪些現(xiàn)實問題P0 P1P2次處理,將歷史樣本與基線進歸化互相關計算,得到數(shù)據(jù) 集看到在業(yè)務低峰期時,相關性波動很大,在午晚峰時相關性較。二次處理,還原量級,去除量級 維度,并通過基準形變量計算出 不同告警等級對應的形變量,我 們發(fā)現(xiàn)沒有任何點需要告警,符合預期。不應該被識別為異常的事故案例案例1:因為全國大范圍出現(xiàn)惡 劣天氣,引起了午晚峰整體 抬升,這種情況不希望出現(xiàn)連 續(xù)告警。形變分析模型

7、-解決了哪些現(xiàn)實問題案例2:某渠道出現(xiàn)問題引起整體流量緩慢下降,需要識別出異常點。次處理,將歷史樣本與基線進歸 化互相關計算,得到數(shù)據(jù)集看到在渠道 異常期間相關性波動較大。二次處理,還原量級,去除量級維度,并通過 基準形變量計算出不同告警等級對應的形變量, 在渠道異常期間引起的指標緩慢下降,逐漸超 過相應等級的告警閾值,符合預期。P0需要被識別為異常的事故案例形變分析模型-解決了哪些現(xiàn)實問題超級變點案例3:某服務口流量因為某渠道突然故障,引起整體流量 陡降,之后曲線形狀保持不變, 陡降異常點需要被識別出。次處理,將歷史樣本與基線進歸化互相關計算,因為故障 之后曲線形狀迅速恢復,相關性 依然很。

8、二次處理,還原量級,去除量級維度,并通過基準形變量計算出不同告警等級對應的形變量,因為異常之后真實值與基線基本吻合,形 變量計算在這種特例下法識別,需要同時增加前后分鐘的形變量分析,在兩個結果中任何個超過對應等級的告警閾值則認為是異 常點,符合預期。變點檢測P0需要被識別為異常的事故案例P0(1 - 余弦相關)x|前分鐘數(shù)值- 當前值|形變分析模型-解決了哪些現(xiàn)實問題次處理,將歷史樣本與基線進歸化互相關計算,得到數(shù)據(jù) 集看到在活動期間相關性波動較大二次處理,還原量級,去除量級 維度,并通過基準形變量計算出 不同告警等級對應的形變量,三 處活動期間引起的指標陡升超過 告警閾值,符合預期。P0P1

9、需要被識別為異常的事故案例案例4:世界杯期間的營銷活動 不定時引起指標陡升,正常需 要識別出異常點。形變分析模型-解決了哪些現(xiàn)實問題案例5:峰期與低峰期都有跟基線相比下降5%的異常點,在午峰時 需要進P0級別告警,低峰期波動經(jīng)常超過10%可能都不需要告警。低峰期波動兩次處理后,可以看到在低峰期時形變量常,達不到告 警閾值。在午峰時形變量常大,達到P0級別告警閾值。P0低峰期形變量在低峰期如果想達到P0級別告警閾值,需要波動在50%左右,這個案例體現(xiàn)了形變分析模型在閾值判定上較好的適應性。低峰期波動在多少 才會觸發(fā)P0告警?波動在50%左右需要被識別為異常的事故案例形變分析模型-與常時間序列異常

10、檢測法的差異、美團外賣業(yè)務異常檢測現(xiàn)狀外賣業(yè)務特點 主要痛點二、形變分析模型介紹三、業(yè)務異常檢測系統(tǒng)的整體設計四、異常檢測與其他穩(wěn)定性保障系統(tǒng)內(nèi)聯(lián)五、落地情況及實踐效果 六、回顧總結模型分析過程 告警收斂策略解決了美團外賣哪些現(xiàn)實問題與常時間序列異常檢測法的差異業(yè)務異常檢測系統(tǒng)的整體設計職責 :精準識別監(jiān)控指標的異常點。幫助戶快速診斷業(yè)務異常問題根因, 并給出降級 建議。結合戶反饋,進半監(jiān)督學習,提升精確率與召 回率。動配置告警閾值,告警信息解釋。難點 :判斷業(yè)務曲線適哪種異常檢測模型。不同異常檢測模型的效果評估。監(jiān)控數(shù)據(jù)采集的穩(wěn)定性,需要對指標進可信度標 記。異常檢測系統(tǒng)整體結構圖、美團外賣

11、業(yè)務異常檢測現(xiàn)狀外賣業(yè)務特點 主要痛點二、形變分析模型介紹三、業(yè)務異常檢測系統(tǒng)的整體設計四、異常檢測與其他穩(wěn)定性保障系統(tǒng)內(nèi)聯(lián)五、落地情況及實踐效果 六、回顧總結模型分析過程 告警收斂策略解決了美團外賣哪些現(xiàn)實問題與常時間序列異常檢測法的差異異常檢測與其他穩(wěn)定性保障系統(tǒng)內(nèi)聯(lián)異常檢測結果的好壞直接影響到相關穩(wěn)定 性保障系統(tǒng)核功能是否有效。異常檢測告警事件分析,提煉業(yè)務穩(wěn) 定性報告。在全鏈路壓測過程中,準確的異常檢 測告警可以作為是否繼續(xù)施壓的判定 標準。通過壓測前后的穩(wěn)定性報告做相應的 容量規(guī)劃。4.準確的異常檢測告警是可以動觸發(fā) 服務保護動作的前提。穩(wěn)定性保障體系能地圖、美團外賣業(yè)務異常檢測現(xiàn)狀外賣業(yè)務特點 主要痛點二、形變分析模型介紹三、業(yè)務異常檢測系統(tǒng)的整體設計四、異常檢測與其他穩(wěn)定性保障系統(tǒng)內(nèi)聯(lián)五、落地情況及實踐效果 六、回顧總結模型分析過程 告警收斂策略解決了美團外賣哪些現(xiàn)實問題與常時間序列異常檢測法的差異落地情況及實踐效果覆蓋外賣核業(yè)務指標2000多個(訂單、流量、營銷、SET等)單次異常檢測流程在200ms通過混淆矩陣收集戶反饋:正確錯誤檢測異常AB檢測正常CD精確率80%召回率80%告警閾值配置動化注:在現(xiàn)在特定場景下,基于現(xiàn)有的數(shù)據(jù)集統(tǒng) 計獲得。異

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論