ZXG10-SC(V3.0)短消息中心故障應急指導書_第1頁
ZXG10-SC(V3.0)短消息中心故障應急指導書_第2頁
ZXG10-SC(V3.0)短消息中心故障應急指導書_第3頁
ZXG10-SC(V3.0)短消息中心故障應急指導書_第4頁
ZXG10-SC(V3.0)短消息中心故障應急指導書_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、Evaluation Warning: The document was created with Spire.Doc for .NET.ZXG10-SC(V3.0)短消息中心心故障應急指指導書深圳市中興興通訊股股份有限限公司ZXG100-SCC(V33.0)短消息中心心故障應急指指導書本資料著作作權屬深深圳市中中興通訊訊股份有有限公司司所有。未未經著作作權人書書面許可可,任何何單位或或個人不不得以任任何方式式摘錄、復復制或翻翻譯。侵權必究。Copyrrighht 20002 ZTEE Coorpoorattionn Shhenzzhenn P. R. ChhinaaAll rrighhts

2、resservved.No paart of thiis ddocuumenntattionn maay bbe eexceerptted, reeprooducced, trransslatted, annnottateed oor ddupllicaatedd, iin aany forrm oor bby aany meaans witthouut tthe priior wriitteen ppermmisssionn off ZTTE CCorpporaatioon.策 劃 移動用用服部編 著 朱權力力責任編輯 江月月軍* * * *深圳市中興興通訊股股份有限限公司地址:深圳圳市高新

3、新技術產產業(yè)園科科技南路路中興通通訊大廈廈客戶支持中中心熱線線:(+867755)2677708800 8000-8300-11118傳真:(+867755)2677708801E-maiil:網(wǎng)址:郵編:51180557* * * *版次:20002年年12月月第1版版前 言聲明:由于于產品和和技術的的不斷更更新、完完善,本本資料中中的內容容可能與與實際產產品不完完全相符符,敬請請諒解。如如需查詢詢產品的的更新情情況,請請聯(lián)系當當?shù)剞k事事處。PAGE ii目 錄TOC o 1-3 h z HYPERLINK l _Toc28762491 1 概述 PAGEREF _Toc28762491 h

4、 2 HYPERLINK l _Toc28762492 1.1 目目的 PAGEREF _Toc28762492 h 2 HYPERLINK l _Toc28762493 1.2 使使用對象象 PAGEREF _Toc28762493 h 2 HYPERLINK l _Toc28762494 1.3 適適用場合合 PAGEREF _Toc28762494 h 2 HYPERLINK l _Toc28762495 2 設備故故障預防防措施 PAGEREF _Toc28762495 h 3 HYPERLINK l _Toc28762496 2.1 設設備巡檢檢 PAGEREF _Toc287624

5、96 h 3 HYPERLINK l _Toc28762497 2.2 數(shù)數(shù)據(jù)備份份 PAGEREF _Toc28762497 h 3 HYPERLINK l _Toc28762498 3 應急處處理流程程說明 PAGEREF _Toc28762498 h 4 HYPERLINK l _Toc28762499 4 系統(tǒng)掉掉電的應應急處理理 PAGEREF _Toc28762499 h 6 HYPERLINK l _Toc28762500 5 硬件故故障應急急處理 PAGEREF _Toc28762500 h 7 HYPERLINK l _Toc28762501 6 軟件故故障的應應急處理理 P

6、AGEREF _Toc28762501 h 8 HYPERLINK l _Toc28762502 6.1 系系統(tǒng)監(jiān)控控 PAGEREF _Toc28762502 h 8 HYPERLINK l _Toc28762503 6.2 系系統(tǒng)測試試 PAGEREF _Toc28762503 h 8 HYPERLINK l _Toc28762504 6.3 系系統(tǒng)擁塞塞的應急急處理 PAGEREF _Toc28762504 h 8 HYPERLINK l _Toc28762505 6.3.11 減少少系統(tǒng)的的負荷 PAGEREF _Toc28762505 h 8 HYPERLINK l _Toc2876

7、2506 6.3.22 操作作引起的的故障 PAGEREF _Toc28762506 h 9 HYPERLINK l _Toc28762507 6.4 網(wǎng)網(wǎng)絡風暴暴或惡意意攻擊應應急處理理 PAGEREF _Toc28762507 h 9 HYPERLINK l _Toc28762508 6.4.11 網(wǎng)絡絡風暴的的判斷 PAGEREF _Toc28762508 h 10 HYPERLINK l _Toc28762509 6.4.22 網(wǎng)絡絡風暴應應急處理理 PAGEREF _Toc28762509 h 10 HYPERLINK l _Toc28762510 7 節(jié)日應應急處理理 PAGERE

8、F _Toc28762510 h 11 HYPERLINK l _Toc28762511 8 附件一一緊急維維護記錄錄 PAGEREF _Toc28762511 h 13 HYPERLINK l _Toc28762512 9 附件二二重試配配置 PAGEREF _Toc28762512 h 14PAGE 1PAGE 29概述目的ZXG100-SCC(V33.0)故故障應急急處理指指導書,是是針對中中興通訊訊網(wǎng)上短短消息設設備在運運行過程程中或者者操作過過程中可可能出現(xiàn)現(xiàn)的緊急急問題,如如告警異異常、CCPU占占用過高高、癱機機、系統(tǒng)統(tǒng)功能異異常、大大話務量量等而制制定的操操作指導導,其目目的是

9、在在設備發(fā)發(fā)生故障障時,提提供緊急急維護的的手段,以以便快速速恢復業(yè)業(yè)務,從從而把損損失和影影響降低低到最低低程度。使用對象中興通訊ZZXG110-SSC(VV3.00)維護護工程師師適用場合設備運行過過程中出出現(xiàn)重大大故障。操作設備(如如擴容、升升級等)過過程中出出現(xiàn)重大大故障。設備故障預預防措施施設備巡檢要求定期對對設備進進行巡檢檢,了解解設備的的運行情情況,特特別注意意告警、性性能統(tǒng)計計等是否否有異常?,F(xiàn)象,主主要檢查查內容概概要如下下,具體體的檢查查項目請請見附件件ZXXG100-SCC日常檢檢查手冊冊1告警警箱2前臺臺交換機機檢查3業(yè)務務處理機機檢查4SMMPP AGEENT檢檢查5

10、計費費服務器器檢查61229服務務器檢查查7信息息臺實體體檢查8催繳繳費臺檢檢查9人工工臺檢查查10排排隊機檢檢查11CCTI SERRVERR服務器器檢查12排排隊機1129服服務器檢檢查13語語音信箱箱功能檢檢查數(shù)據(jù)備份備份系統(tǒng)是是為了防防止意外外情況發(fā)發(fā)生,ZZXG110-SSC維護護工程師師一定要要有良好好的備份份習慣。備備份一定定要全面面,作好好標識,由由專人保保管。要要保證有有2份以上上完全同同樣的備備份保存存,建議議備份到到硬盤,有有條件還還可以備備份到MMO,不不能備份份在同一一臺計算算機里。備份方式:1最小小備份:進入基基本配置置管理和和SC配配置管理理,進行行業(yè)務的的最小備

11、備份。2業(yè)務務備份:將ZXXG100-SCC系統(tǒng)的的運行文文件和接接口進行行備份。3最大大備份:將操作作系統(tǒng)和和數(shù)據(jù)庫庫進行完完全備份份。應急處理流流程說明明故障發(fā)生后后,請第第一時間間上報給給中興公公司ZXXG100-SCC維護工工程師。在在中興公公司工程程師指導導下或者者根據(jù)以以下流程程完成系系統(tǒng)應急急處理。短消息設備備應急流流程說明明如下:1短消消息系統(tǒng)統(tǒng)工作環(huán)環(huán)境較復復雜,涉及IIW/GG網(wǎng)關、短短消息中中心、網(wǎng)網(wǎng)絡設備備等,分分布區(qū)域域較大,因因為異常常原因引引起掉電電的可能能性較大大,因此此在短消消息系統(tǒng)統(tǒng)出現(xiàn)故故障時,應首先先關注電電源問題題。如果發(fā)生大大規(guī)模的的電源故故障,請請

12、盡快將將所有的的磁盤陣陣列、服服務器、交交換機等等設備的的電源依依次關閉閉。等待待電源供供電穩(wěn)定定后重新新開電,開開電順序序和關電電順序相相反。2網(wǎng)絡絡設備的的正常工工作是短短消息系系統(tǒng)穩(wěn)定定運行的的保證,可以使使用PIING命命令檢查查各計算算機、排排隊機MMP板、短短信網(wǎng)關關MP等等是否能能連通,保保證基本本的網(wǎng)絡絡環(huán)境正正常。常常見的原原因如:網(wǎng)線松松動、網(wǎng)網(wǎng)線斷、網(wǎng)網(wǎng)絡交換換機掉電電等硬件件故障和和配置改改動等軟軟件故障障。如果出現(xiàn)短短信中心心所有的的設備網(wǎng)網(wǎng)絡都不不正常的的情況,請請檢查網(wǎng)網(wǎng)絡中的的HUBB等設備備。如果故障出出現(xiàn)在某某個模塊塊,檢查查該模塊塊的網(wǎng)絡絡配置情情況。3短

13、消消息網(wǎng)關關或排隊隊機的MMP出現(xiàn)現(xiàn)不正常常時,可可能會影影響短信信業(yè)務,此此時可以以采取數(shù)數(shù)據(jù)同步步、復位位網(wǎng)關MMP、復復位機架架等進行行嘗試。故障若出現(xiàn)現(xiàn)在前臺臺時,請請在前臺臺交換機機的前面面觀察MMP和其其他單板板上的各各個指示示燈的運運行情況況,若MMP和其其他單板板通過反反復復位位都無法法啟動時時,請盡盡快更換換MP,或或加顯卡卡進行故故障的定定位。4業(yè)務務處理機機是否運運行正常常,可以以通過維維護終端端進行監(jiān)監(jiān)視,如如果有問問題可以以采取復復位業(yè)務務處理機機等來嘗嘗試解決決,如果果不能恢恢復,請請觀察業(yè)業(yè)務處理理機的上上電調試試信息,觀觀察數(shù)據(jù)據(jù)庫是否否破壞或或接口改改變和客客

14、戶端連連接協(xié)議議改變等等如果數(shù)據(jù)庫庫損壞,倒倒換雙機機或在其其他服務務器上建建立對應應的數(shù)據(jù)據(jù)庫,然然后在SSC配置置和本地地配置中中將參數(shù)數(shù)指向相相應的節(jié)節(jié)點和數(shù)數(shù)據(jù)庫。5如果果出現(xiàn)計計費問題題,請先先進行判判斷是否否為短信信中心問問題、傳傳輸問題題、計費費中心問問題等,然然后進行行有關處處理。如果為短信信中心問問題請觀觀察1330上的的業(yè)務程程序是否否啟動、分分解程序序是否啟啟動、1140等等業(yè)務處處理機上上的BIIL目錄錄下是否否產生了了積壓文文件等。出現(xiàn)問題,可可以查看看告警箱箱有無告告警,如如有告警警,可以以在短信信中心或或排隊機機的應用用服務器器或維護護臺上的的故障管管理系統(tǒng)統(tǒng)中查

15、看看有關告告警記錄錄信息,然然后做出出響應的的處理。6上面面的方法法如果不不能解決決現(xiàn)場故故障,請請與中興興公司ZZXG110-SSC維護護工程師師或者中中興公司司移動用用服部聯(lián)聯(lián)系。備注:在故故障管理理系統(tǒng)中中告警信信息,可可以知道道當前告告警的具具體信息息,如設設備單板板故障、網(wǎng)網(wǎng)絡鏈路路故障、77號鏈路路故障等等,比較較方便現(xiàn)現(xiàn)場及時時定位問問題原因因。系統(tǒng)掉電的的應急處處理需要的注意意點:系系統(tǒng)在掉掉電癱瘓瘓后,不不能馬上上重啟,必必須查明明事故原原因,以以防止電電源短路路等更嚴嚴重的后后果發(fā)生生。重啟步驟:檢查系統(tǒng)掉掉電原因因并確認認系統(tǒng)是是否允許許重啟。檢檢查交換換機、服服務器、小

16、小型機等等關鍵硬硬件設備備是否全全部掉電電,如果果有個別別機器沒沒有掉電電,那么么就應該該全部將將還在運運行的軟軟件退出出。在檢檢查工作作完成之之后,開開始上電電啟動短短消息及及其業(yè)務務系統(tǒng)。1交換換機上電電,觀察察沒有問問題的情情況下,進進行系統(tǒng)統(tǒng)加載。2上電電短消息息中心各各服務器器或小型型機等主主機的磁磁盤陣列列或磁帶帶機等外外設。3上電電啟動短短消息中中心各服服務器或或小型機機等主機機設備,啟啟動操作作系統(tǒng)。4啟動動短消息息中心應應用程序序。請根根據(jù)ZXXG100-SCC操作維維護說明明來進行行。5進行行點對點點短消息息測試,確確認短消消息中心心系統(tǒng)運運行已經經恢復正正常。注意:對于于

17、雙機系系統(tǒng),如如果帶有有磁陣,請請先啟動動磁陣,然然后在啟啟動主機機,再啟啟動備機機(主備備機不要要同時重重起)。硬件故障應應急處理理短信網(wǎng)關和和排隊交交換機出出現(xiàn)硬件件故障,排排查起來來比較容容易,并并且上述述設備的的關鍵單單板硬件件都配置置成主備備方式,一一旦出現(xiàn)現(xiàn)故障,在在壞板沒沒有及時時替換之之前,系系統(tǒng)基本本還能夠夠正常運運行。然而,有些些單板與與對端局局相連,出出現(xiàn)硬件件故障后后將會對對系統(tǒng)造造成不同同程度的的影響,但但是這在在系統(tǒng)配配置中是是可以補補救的。如如在系統(tǒng)統(tǒng)配置和和工程安安裝中,考考慮到與與中繼相相關聯(lián)單單板的可可靠性,對對于每個個局向可可以采取取負荷分分擔的兩兩條鏈路

18、路和兩個個中繼路路由。另外,對于于處理77號信令令板,在在配置中中肯定是是負荷分分擔的,如如果有一一塊單板板出現(xiàn)硬硬件故障障,可以以馬上將將損壞單單板需處處理信令令的鏈路路,通過過有關數(shù)數(shù)據(jù)管理理臺的數(shù)數(shù)據(jù)配置置到其它它好的信信令板上上,保證證系統(tǒng)仍仍然安全全運行。目前ZXGG10-SC在在前臺交交換機配配置上通通常采用用64KK中心機機架組網(wǎng)網(wǎng)和8KK外圍模模塊組網(wǎng)網(wǎng)兩種方方式,在在這兩種種方式下下,設備備1、22號模塊塊MP主主要承擔擔消息交交換和OOMC功功能,因因此必須須確保11、2號號模塊的的正常。在極端情況況下,如如果1或或2號模模塊的左左右MPP同時出出現(xiàn)故障障無法正正常啟動動的

19、情況況,則必必須從其其他模塊塊MP上上拔下一一塊MPP,將其其C:DATTAVV01000、CC:DDATAATEEMP兩兩個目錄錄下的文文件刪除除,然后后將MPP主板上上的模塊塊跳線跳跳到1或或者2號號模塊的的位置,重重新插到到1或者者2號模模塊位置置,最后后重起重重傳3次次數(shù)據(jù)。如果正在運運行中上上述業(yè)務務平臺出出現(xiàn)硬件件故障,就就應該采采取相應應的補救救措施,以以保證系系統(tǒng)盡快快恢復運運行。如果工程中中配置有有備用機機器,那那么在安安裝的過過程中必必須將該該硬件也也安裝起起來,并并且與主主用機器器安裝配配置成雙雙機系統(tǒng)統(tǒng),這樣樣在主用用機器硬硬件出現(xiàn)現(xiàn)故障時時,馬上上啟動備備用機器器進行

20、接接管,保保證系統(tǒng)統(tǒng)運行不不受影響響。如果工程中中沒有配配置有備備用機器器,一但但出現(xiàn)故故障,應應該緊急急找出一一臺計算算機進行行恢復安安裝,使使系統(tǒng)盡盡快恢復復。有關關業(yè)務模模塊的安安裝請參參照ZXXG100-SCC短消息息中心安安裝手冊冊來進行行安裝調調試。軟件故障的的應急處處理系統(tǒng)業(yè)務軟軟件的應應急處理理是建立立在良好好的日常常維護和和備份的的基礎之之上的,因因此在系系統(tǒng)的運運行中,需需要作好好備份工工作。系統(tǒng)監(jiān)控在節(jié)假日尤尤其是春春節(jié)期間間,短消消息使用用一般會會是平時時運行的的好幾倍倍,所以以在這期期間,定定期對系系統(tǒng)進行行檢查,可可以及早早發(fā)現(xiàn)系系統(tǒng)是否否出現(xiàn)擁擁塞等問問題。在在節(jié)

21、假日日對短消消息中心心系統(tǒng)維維護,建建議每11個小時時左右就就進行一一次系統(tǒng)統(tǒng)的監(jiān)控控,春節(jié)節(jié)除夕晚晚上建議議半小時時進行一一次系統(tǒng)統(tǒng)的監(jiān)控控。監(jiān)控控的對象象主要是是:1短消消息中心心當前的的處理消消息數(shù),注注意是否否已經接接近系統(tǒng)統(tǒng)設計的的最大容容量。2短消消息中心心所在機機器的系系統(tǒng)資源源,跟蹤蹤系統(tǒng)占占用資源源是否已已經接近近系統(tǒng)設設計的最最大容量量。3數(shù)據(jù)據(jù)庫/話話單文件件等是否否還有足足夠空間間和資源源。4當前前的告警警有無任任何負荷荷告警等等。系統(tǒng)測試在節(jié)假日對對短消息息中心系系統(tǒng)維護護,建議議每1個個小時左左右就進進行一次次系統(tǒng)的的測試,春春節(jié)除夕夕晚上建建議每半半小時進進行一次

22、次系統(tǒng)的的測試。測測試的方方法主要要是:1進行行本局之之內點對對點的短短消息的的發(fā)送,注注意觀察察短消息息是否能能成功的的提交和和接收、以以及整個個短消息息過程的的時延情情況。2進行行本省之之內點對對點的短短消息的的發(fā)送,注注意觀察察短消息息是否能能成功的的提交和和接收、以以及整個個短消息息過程的的時延情情況。3進行行省間點點對點短短消息的的發(fā)送,注注意觀察察短消息息是否能能成功的的提交和和接收、以以及整個個短消息息過程的的時延情情況。4針對對各個局局所開展展的不同同的短消消息業(yè)務務,進行行相應的的業(yè)務短短消息的的測試,注注意觀察察短消息息是否能能成功的的提交和和接收、以以及整個個短消息息過程

23、的的時延情情況。系統(tǒng)擁塞的的應急處處理減少系統(tǒng)的的負荷在節(jié)假日話話務量增增大的情情況下,我我們短消消息中心心有一套套限制流流量、自自我保護護的機制制。這主主要是通通過對短短信系統(tǒng)統(tǒng)的安全全變量的的參數(shù)進進行設置置實現(xiàn)。當當業(yè)務量量增大并并超過某某個門限限值時,系系統(tǒng)將會會產生不不同級別別(16級)的的告警,同同時系統(tǒng)統(tǒng)將按不不同級別別告警對對當前短短消息業(yè)業(yè)務進行行不同級級別的丟丟包限制制處理,以以保證系系統(tǒng)能正正常運行行。如果果再加上上適當?shù)牡娜斯ふ{調節(jié),將將使短信信系統(tǒng)運運行更加加穩(wěn)定可可靠,使使有限的的業(yè)務處處理能力力得到更更加合理理的利用用。同時在監(jiān)控控的過程程中如果果發(fā)現(xiàn)已已經出現(xiàn)現(xiàn)

24、業(yè)務量量不斷增增大、短短消息中中心開始始擁塞、資資源快占占用盡的的情況,局局方維測測人員應應該采取取一定的的應急措措施,以以確保短短訊中心心的安全全:1停止止全用戶戶廣播、112588群發(fā)送送及18860大大客戶終終端業(yè)務務。2不要要使用性性能統(tǒng)計計中的實實時觀察察、信令令跟蹤、探探針、系系統(tǒng)監(jiān)測測、業(yè)務務觀察等等。3注意意限制有有關SMME的業(yè)業(yè)務流量量,防止止個別SSME超超量發(fā)送送業(yè)務而而造成擁擁塞。4如果果發(fā)現(xiàn)數(shù)數(shù)據(jù)庫、話話單文件件等的資資源不夠夠,譬如如分配的的硬盤空空間已經經耗盡的的情況,可可以將系系統(tǒng)中早早期的數(shù)數(shù)據(jù)庫歷歷史表、話話單文件件等備份份到其他他的機器器上,騰騰出硬盤盤

25、空間。5在業(yè)業(yè)務量非非常大出出現(xiàn)高級級別的告告警時,可可以根據(jù)據(jù)當前告告警級別別對短信信系統(tǒng)的的各種業(yè)業(yè)務進行行適當?shù)牡恼{節(jié):(1)關關閉歡迎迎短信業(yè)業(yè)務。(2)通通知各SSME(如如網(wǎng)關等等),進進行流量量限制。(3)取取消未知知錯誤和和MS接接收錯誤誤引起的的重發(fā)設設置。(4)取取消因系系統(tǒng)錯誤誤引起的的重發(fā)設設置。(5)取取消因內內存溢出出引起的的重發(fā)設設置,將將結束動動作有停停止改為為丟棄。(6)取取消因缺缺席原因因(含關關機和不不在服務務區(qū))引引起的重重發(fā)設置置,將結結束動作作由停止止改為丟丟棄。備注:當話話務量開開始降低低時,再再對上述述各項依依次恢復復。6如果果發(fā)現(xiàn)短短消息中中心

26、資源源不夠,進進行上述述處理后后如果還還不能解解決,就就重啟短短消息中中心業(yè)務務處理機機系統(tǒng),如如問題仍仍然存在在,請與與ZXGG10-SC技技術人員員聯(lián)系。操作引起的的故障在系統(tǒng)維護護過程中中,如果果需要改改變配置置,建議議在改變變參數(shù)之之前先進進行配置置的備份份,防止止修改配配置后引引起的系系統(tǒng)業(yè)務務中斷。如果修改配配置后引引起業(yè)務務中斷,請請將配置置恢復到到維護操操作之前前的配置置,然后后執(zhí)行數(shù)數(shù)據(jù)的同同步。網(wǎng)絡風暴或或惡意攻攻擊應急急處理短消息產品品系統(tǒng)網(wǎng)網(wǎng)絡組網(wǎng)網(wǎng)復雜,內內部系統(tǒng)統(tǒng)之間需需要保證證網(wǎng)絡的的通暢,同同時還可可能直接接和外部部的SMME等實實體連接接。因此此網(wǎng)絡干干擾可能

27、能發(fā)生。網(wǎng)絡風暴的的判斷短消息中心心在遇到到網(wǎng)絡風風暴或者者惡意攻攻擊時,主主要表現(xiàn)現(xiàn)為以下下幾種征征兆:CPU負荷荷指標居居高不下下:通常常在網(wǎng)絡絡風暴或或者攻擊擊出現(xiàn)時時,各個個服務器器上的CCPU值值會出現(xiàn)現(xiàn)居高不不下的現(xiàn)現(xiàn)象。對對于短消消息中心心的前臺臺交換機機和業(yè)務務處理機機等設備備運行的的主要功功能實體體,可能能出現(xiàn)程程序保護護的反復復重新啟啟動現(xiàn)象象。內存負荷指指標居高高,計算算機系統(tǒng)統(tǒng)人機對對話響應應緩慢:通常在在網(wǎng)絡風風暴或者者攻擊出出現(xiàn)時,由由于CPPU或內內存耗用用較多,因因此出現(xiàn)現(xiàn)系統(tǒng)響響應緩慢慢現(xiàn)象。前臺日志分分析:在在網(wǎng)絡風風暴出現(xiàn)現(xiàn)時,前前臺交換換機會將將收到的的

28、網(wǎng)絡包包(以太太)的數(shù)數(shù)量記錄錄,請將將MP日日志導出出分析。通通常兩次次統(tǒng)計值值之差到到達了660000個包以以上,即即可能對對系統(tǒng)構構成危害害。* Innterrruppt TTaskk Maany Runn *Date: 20002-12-27 11:17:44Modulle: 2Posittionn: RRighht(DDownn)Statee: SSlavveUB: 229966, 9999, 4000, 3988, 4400, 3997, 2722, 337CPU: 66Task Namme: ne22ReccePhasee Naame: 0Phasee Deepetth: 255

29、5Last Runn Coountt: 1123336688#上次次運行記記錄Curreent Runn Coountt: 1130116277#當前前運行記記錄網(wǎng)絡風暴應應急處理理網(wǎng)絡風暴出出現(xiàn)時,視視對系統(tǒng)統(tǒng)的影響響程序進進行處理理,如果果影響系系統(tǒng)的基基本業(yè)務務,請斷斷開短消消息中心心和所有有外接實實體之間間的物理理連接,然然后逐步步將外部部實體接接入到短短消息中中心,觀觀察5分分鐘以上上后無誤誤后,再再進行后后面實體體的連接接,以查查找故障障源頭。對于暫沒有有影響系系統(tǒng)的風風暴故障障,請采采用了一一些網(wǎng)絡絡分析工工具查找找故障源源頭。節(jié)日應急處處理由于短消息息在節(jié)假假日具有有爆發(fā)性性的

30、特點點,因此此擬訂節(jié)節(jié)日應急急流程。1平時時忙時話話務量統(tǒng)統(tǒng)計、節(jié)節(jié)日話務務量預計計根據(jù)20002春節(jié)節(jié)的統(tǒng)計計,短消消息業(yè)務務在春節(jié)節(jié)晚上111:000到初初一凌晨晨1:000左右右話務量量為平時時的約33-155倍,峰峰值流量量約為平平時的220倍以以上,因因此必須須通過性性能統(tǒng)計計做好平平時話務務統(tǒng)計,并并估計節(jié)節(jié)日時的的消息流流量,對對于節(jié)日日流量可可能大于于系統(tǒng)設設計容量量的設備備,進行行系統(tǒng)的的擴容。節(jié)假日短信信業(yè)務的的另一個個特點是是,點對對點發(fā)送送成功率率要求高高,ESSME發(fā)發(fā)送可靠靠性相對對較低。2平時時忙時話話務量設設備情況況分析由于短消息息的業(yè)務務對各種種設備的的運行條

31、條件需求求較高,因因此在節(jié)節(jié)日之間間,對各各種設備備參數(shù)進進行詳細細的參數(shù)數(shù)記錄。對對于各種種垃圾數(shù)數(shù)據(jù)和可可能影響響系統(tǒng)運運行效率率的數(shù)據(jù)據(jù)考慮進進行清理理。3控制制措施(1)取取消全用用戶廣播播、大客客戶終端端、催繳繳費發(fā)送送任務,改改在業(yè)務務閑時進進行。在全用戶廣廣播、大大客戶終終端、催催繳費等等應用程程序中停停止或者者取消消消息的發(fā)發(fā)送,將將消息的的任務時時間定義義在節(jié)日日高峰流流量之后后。(2)限限制個別別SMEE的消息息流量,甚甚至在系系統(tǒng)負荷荷重時拒拒絕其提提交消息息到SCC在SC配置置管理系系統(tǒng)中,首首先進行行系統(tǒng)的的備份,然然后進入入SMEE配置,設設置允許許某個SSME能能

32、夠提交交的消息息速率,然然后執(zhí)行行同步,系系統(tǒng)即開開始限制制個別SSME的的流量。在節(jié)日高峰峰完成后后直接恢恢復回備備份配置置即可。(3)取取消所有有消息的的重式方方式在節(jié)日,為為了迎接接話務高高峰,確確保點對對點業(yè)務務,可以以在系統(tǒng)統(tǒng)檢測到到流量到到達了平平時流量量的約33倍時,取取消系統(tǒng)統(tǒng)的重式式方式,避避免重式式引起的的話務增增加。執(zhí)行方法是是在短消消息SCC配置管管理中,首首先備份份當前的的系統(tǒng)配配置,然然后在RRSM中中增加一一種重試試方式(假假定為110),該該重試方方式為間間隔1秒秒重試00次,結結束動作作為丟棄棄。然后在用戶戶配置中中檢查各各種配置置標識,將將各種下下發(fā)失敗敗的

33、重試試都改變變?yōu)?00,之后后同步系系統(tǒng),即即取消了了所有的的重試。在節(jié)日話務務高峰過過后,直直接將備備份的數(shù)數(shù)據(jù)倒換換回備份份的配置置即可恢恢復正常常的運行行。關于正常情情況下的的重試方方式配置置請參見見附件文文檔。(4)取取消所有有用戶的的狀態(tài)報報告發(fā)送送要求在節(jié)假日,為為了避免免出現(xiàn)話話務擁塞塞,在系系統(tǒng)檢測測到流量量到達了了平時流流量的約約3倍時時,即可可以由系系統(tǒng)取消消對點對對點發(fā)送送狀態(tài)報報告的取取消。4極端端措施(1)清清除業(yè)務務處理機機數(shù)據(jù)庫庫中的各各個表在大話務量量高峰,或或者由于于其他原原因導致致了業(yè)務務處理機機負荷過過重或者者系統(tǒng)故故障,請請直接采采用TRRUNCCATE

34、E命令刪刪除短消消息中的的MSDDESTT、SHHORTTMSGG、SHHORTTMSGG_TIIMINNG表。1)對于于SQLL數(shù)據(jù)庫庫的系統(tǒng)統(tǒng),每個個節(jié)點對對應以下下3類表表:mssdesst,shoortmmsg(000-0311),sshorrtmssg_ttimiing。2)對OORACCLE的的系統(tǒng),每每個節(jié)點點對應以以下3類類表(00表示1140模模塊、11表示為為1411):mmsdeest_0,sshorrtmssg_00,shhorttmsgg_tiiminng_00。(2)重重新啟動動業(yè)務處處理機將業(yè)務處理理機重新新啟動,觀觀察負荷荷或者故故障現(xiàn)象象是否消消息(3)倒倒換業(yè)務務處理機機將業(yè)務處理理機或者者后臺數(shù)數(shù)據(jù)庫故故障不能能在短消消息間內內恢復的的情況下下,請倒倒換數(shù)據(jù)據(jù)庫進行行業(yè)務恢恢復。(4)重重建業(yè)務務處理機機數(shù)據(jù)庫庫在倒換業(yè)務務處理機機后臺數(shù)數(shù)據(jù)庫無無效(SSQL/ORAACLEE數(shù)據(jù)庫庫系統(tǒng)故故障、磁磁陣損害害)等情情況下,請請重新建建立業(yè)務務處理機機后臺數(shù)數(shù)據(jù)庫,可可以選擇擇在本地地或者其其他節(jié)點點(1660等)上上建立后后臺數(shù)據(jù)據(jù)庫,并并在1229上SSC配置置中將1140或或者1441

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論