FusionManager云平臺告警處理指南_第1頁
FusionManager云平臺告警處理指南_第2頁
FusionManager云平臺告警處理指南_第3頁
FusionManager云平臺告警處理指南_第4頁
FusionManager云平臺告警處理指南_第5頁
已閱讀5頁,還剩223頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、FusionManager 云平臺告警處理指南目 錄前 言ii HYPERLINK l _bookmark0 ALM-FusionManager.9001 FusionManager 和域服務器連接異常1 HYPERLINK l _bookmark2 ALM-FusionManager.9002 FusionManager 與 SNMP 管理站連接異常3 HYPERLINK l _bookmark4 ALM-FusionManager.9201 FusionManager 與上級時間服務器同步時間失敗5 HYPERLINK l _bookmark13 ALM-FusionManager.920

2、2 NTP 服務啟動失敗8 HYPERLINK l _bookmark18 ALM-FusionManager.9203 FusionManager 服務器時間被修改11 HYPERLINK l _bookmark22 ALM-FusionManager.9204 FusionManager 與上級時間服務器時間差異過大13 HYPERLINK l _bookmark26 ALM-FusionManager.9206 FusionManager 數據備份失敗15 HYPERLINK l _bookmark50 ALM-FusionManager.9207 License 即將過期23 HYPE

3、RLINK l _bookmark53 ALM-FusionManager.9208 License 已經過期25 HYPERLINK l _bookmark56 ALM-FusionManager.9209 當前資源數量大于 License 許可上限27 HYPERLINK l _bookmark61 ALM-FusionManager.9210 當前 License 已失效30 HYPERLINK l _bookmark64 ALM-FusionManager.9215 系統(tǒng)磁盤使用率過大33 HYPERLINK l _bookmark72 ALM-FusionManager.9216 專

4、享升級服務即將到期36 HYPERLINK l _bookmark75 ALM-FusionManager.9217 專享升級服務已經過期39 HYPERLINK l _bookmark78 ALM-FusionManager.9220 虛擬機模板丟失41 HYPERLINK l _bookmark85 ALM-FusionManager.9221 FusionManager F5 設備吞吐量超過告警閾值43 HYPERLINK l _bookmark90 ALM-FusionManager.9222 部署服務健康告警45 HYPERLINK l _bookmark91 ALM-FusionM

5、anager.9223 應用健康告警47 HYPERLINK l _bookmark92 ALM-FusionManager.9300 VDC 資源不足49 HYPERLINK l _bookmark93 ALM-FusionManager.9301 計劃任務執(zhí)行失敗51 HYPERLINK l _bookmark99 ALM-FusionManager.9400 網絡的端口組數據一致性校驗異常54 HYPERLINK l _bookmark100 ALM-FusionManager.9401 VTEP 網絡子網校驗異常56 HYPERLINK l _bookmark101 ALM-Fusio

6、nManager.9801 FusionManager 資源異常58 HYPERLINK l _bookmark111 ALM-FusionManager.9803 FusionManager 與內部部件連接異常63 HYPERLINK l _bookmark120 ALM-FusionManager.9804 VM 在 Hypervisor 上丟失66 HYPERLINK l _bookmark130 ALM-FusionManager.9805 FusionManager 與第三方部件連接異常69 HYPERLINK l _bookmark132 ALM-FusionManager.980

7、7 從 UDS 下載話單文件失敗71 HYPERLINK l _bookmark134 ALM-FusionManager.9808 上傳話單文件到 FTP 失敗73 HYPERLINK l _bookmark136 ALM-FusionManager.9809 二級存儲斷連75 HYPERLINK l _bookmark138 ALM-FusionManager.9811 VDC 容量 CPU 分配率超過閾值77 HYPERLINK l _bookmark139 ALM-FusionManager.9812 VDC 容量內存分配率超過閾值79 HYPERLINK l _bookmark140

8、 ALM-FusionManager.9813 VDC 容量存儲分配率超過閾值81 HYPERLINK l _bookmark141 ALM-FusionManager.9814 虛擬機規(guī)格一致性檢驗異常83 HYPERLINK l _bookmark142 ALM-FusionManager.9902 FusionManager 雙機心跳中斷85 HYPERLINK l _bookmark147 ALM-FusionManager.9903 FusionManager 雙機文件同步失敗87 HYPERLINK l _bookmark151 ALM-FusionManager.9905 Fus

9、ionManager 第三方仲裁心跳中斷90 HYPERLINK l _bookmark154 ALM-0 x000803220001 FusionManager 所在服務器 CPU 利用率超過閾值93 HYPERLINK l _bookmark158 ALM-0 x000803220002 FusionManager 所在服務器內存利用率超過閾值95 HYPERLINK l _bookmark162 39 ALM-0 x000803220005 設備離線97 HYPERLINK l _bookmark167 40 ALM-0 x000803220103 交換機堆疊分裂99 HYPERLINK

10、 l _bookmark172 41 ALM-0 x000803220104 SMM 板離線101 HYPERLINK l _bookmark177 42 ALM-0 x000803220105 刀片服務器不在位103 HYPERLINK l _bookmark180 43 ALM-0 x000803220106 交換機堆疊異常105 HYPERLINK l _bookmark183 44 ALM-0 x000803220107 交換機數據恢復失敗107 HYPERLINK l _bookmark185 45 ALM-0 x000803220108 硬盤狀態(tài)異常109 HYPERLINK l

11、_bookmark189 46 ALM-0 x000803220109 硬盤不在位111 HYPERLINK l _bookmark193 47 ALM-0 x000803220110 電源狀態(tài)異常113 HYPERLINK l _bookmark197 48 ALM-0 x000803220111 風扇狀態(tài)異常115 HYPERLINK l _bookmark201 ALM-0 x000803220112 服務器硬盤占用率超過提示閾值117 HYPERLINK l _bookmark205 ALM-0 x000803220113 服務器硬盤占用率超過次要閾值120 HYPERLINK l _

12、bookmark209 ALM-0 x000803220114 服務器硬盤占用率超過重要閾值123 HYPERLINK l _bookmark213 ALM-0 x000803220115 服務器硬盤占用率超過緊急閾值126 HYPERLINK l _bookmark217 ALM-0 x000803220116 服務器 CPU 溫度超過提示閾值129 HYPERLINK l _bookmark228 ALM-0 x000803220117 服務器 CPU 溫度超過次要閾值132 HYPERLINK l _bookmark239 ALM-0 x000803220118 服務器 CPU 溫度超過

13、重要閾值135 HYPERLINK l _bookmark250 ALM-0 x000803220119 服務器 CPU 溫度超過緊急閾值138 HYPERLINK l _bookmark261 ALM-0 x000803220120 服務器下行網絡帶寬超過提示閾值141 HYPERLINK l _bookmark266 ALM-0 x000803220121 服務器下行網絡帶寬超過次要閾值143 HYPERLINK l _bookmark271 ALM-0 x000803220122 服務器下行網絡帶寬超過重要閾值145 HYPERLINK l _bookmark276 ALM-0 x000

14、803220123 服務器下行網絡帶寬超過緊急閾值147 HYPERLINK l _bookmark281 61 ALM-0 x000803220124 服務器網口狀態(tài)異常149 HYPERLINK l _bookmark286 62 ALM-0 x000803220125 服務器離線152 HYPERLINK l _bookmark291 63 ALM-0 x000803220126 CPU 狀態(tài)異常154 HYPERLINK l _bookmark297 64 ALM-0 x000803220127 內存狀態(tài)異常156 HYPERLINK l _bookmark303 65 ALM-0 x

15、000803220128 GPU 狀態(tài)異常158 HYPERLINK l _bookmark307 66 ALM-0 x000803220129 SMM 板帳戶異常160 HYPERLINK l _bookmark317 67 ALM-0 x000803220130 FusionManager 硬件管理服務中斷163 HYPERLINK l _bookmark319 68 ALM-0 x000803220131 BMC 離線165 HYPERLINK l _bookmark323 69 ALM-0 x000803220132 風扇不在位167 HYPERLINK l _bookmark328

16、70 ALM-0 x000803220133 電源不在位169 HYPERLINK l _bookmark333 71 ALM-0 x000803220134 服務器 RAID 組降級171 HYPERLINK l _bookmark337 72 ALM-0 x000803220135 防火墻主備故障173 HYPERLINK l _bookmark340 73 ALM-0 x000803220136 防火墻安全域端口故障175 HYPERLINK l _bookmark342 74 ALM-0 x000803220137 防火墻管理鏈路故障178 HYPERLINK l _bookmark3

17、44 ALM-0 x000803220138 系統(tǒng)同步配置到交換機/板功能被去激活180 HYPERLINK l _bookmark345 ALM-15.1002000 VSAM 主備間節(jié)點心跳故障182 HYPERLINK l _bookmark354 ALM-15.1007006 VSAM 時鐘同步進程異常186 HYPERLINK l _bookmark357 ALM-15.1007007 VSAM 系統(tǒng)定時服務進程異常189 HYPERLINK l _bookmark360 ALM-15.1007009 VSAM 與 NTP 服務器心跳狀態(tài)異常192 HYPERLINK l _book

18、mark368 ALM-15.1007010 VSAM 系統(tǒng)時鐘跳變超過一分鐘196 HYPERLINK l _bookmark374 81 ALM-15.1007011 配置通道客戶端進程異常199 HYPERLINK l _bookmark377 ALM-15.1007017 VSAM 雙機備份進程異常202 HYPERLINK l _bookmark388 ALM-15.1007019 VSAM 未配置 NTP 服務器207 HYPERLINK l _bookmark390 ALM-15.1007099 VSAM 備份或上傳關鍵數據失敗209 HYPERLINK l _bookmark3

19、96 ALM-15.1010000 VSA 與 VSAM 心跳異常212 HYPERLINK l _bookmark406 86 ALM-15.1010001 系統(tǒng)存在未受控 VSA216 HYPERLINK l _bookmark410 87 ALM-15.1010002 VSAM 和 VSA 配置數據不一致218 HYPERLINK l _bookmark413 88 ALM-15.1010003 VSA 業(yè)務異常2201 ALM-FusionManager.9001 FusionManager和域服務器連接異常告警解釋FusionManager啟動10s定時任務周期檢測域服務器是否在位,

20、通過ping對端IP的方式實現,10s為周期如果連續(xù)3次出現ping超時,觸發(fā)此告警。告警屬性告警ID告警級別可自動清除9001重要是告警參數參數名稱參數含義附加信息告警內容補充信息。流水號按照告警產生的先后順序為每條告警信息順序分配的編號。告警名稱固定為“FutionManager與域服務器連接異?!?。對象類型固定為“AD Server”。告警對象域服務器IP地址。部件類型固定為“FusionManager”。產生時間告警產生的時間。清除時間告警清除的時間。參數名稱參數含義清除類型告警清除的類型,例如手工清除和自動清除。清除用戶清除告警的用戶名稱。對系統(tǒng)的影響當出現此告警時,由于Fusion

21、Manager與域服務器連接異常,則FusionManager中對應的域用戶將無法登錄FusionManager??赡茉蛴蚍掌髋渲脜挡徽_。網絡中斷。服務器異常。處理步驟單擊“監(jiān)控”。進入“告警列表”頁面。在本條告警所在行點擊,在彈出的窗口中查看告警詳細信息,記錄附加信息中的告警對象。單擊“系統(tǒng)”。單擊“第三方認證配置”。進入“第三方認證配置”頁面。在第三方認證配置頁面中,根據告警附加信息中的告警對象,找到對應的配置信息,檢查域服務參數是否正確。根據檢查結果,配置正確的參數信息,并單擊保存。大約2分鐘后,查看告警是否清除?是,處理完畢。否,執(zhí)行 HYPERLINK l _bookmark

22、1 步驟8。請聯(lián)系技術支持。-結束參考信息無。2 ALM-FusionManager.9002 FusionManager 與 SNMP 管理站連接異常告警解釋FusionManager啟動10s定時任務周期檢測SNMP管理站是否在位,通過ping對端IP的方式實現,10s為周期如果連續(xù)3次出現ping超時,觸發(fā)此告警。告警屬性告警ID告警級別可自動清除9002重要是告警參數參數名稱參數含義附加信息告警內容補充信息。流水號按照告警產生的先后順序為每條告警信息順序分配的編號。告警名稱固定為“FusionManager與SNMP管理站連接異常”。對象類型固定為“SNMP Manager Stati

23、on”。告警對象SNMP管理站名稱。部件類型固定為“FusionManager”。產生時間告警產生的時間。清除時間告警清除的時間。參數名稱參數含義清除類型告警清除的類型,例如手工清除和自動清除。清除用戶清除告警的用戶名稱。對系統(tǒng)的影響當出現此告警時,由于FusionManager與SNMP管理站連接異常,則FusionManager與對應SNMP管理站之間的業(yè)務功能將不可用??赡茉騍NMP管理站IP地址配置不正確。網絡中斷。服務器異常。處理步驟單擊“監(jiān)控”。進入“告警列表”頁面。在本條告警所在行點擊,在彈出的窗口中查看告警詳細信息,記錄附加信息中的SNMP管理站名稱和SNMP管理站IP。單擊

24、“系統(tǒng)”。進入“SNMP管理站”頁面。在“SNMP管理站”頁面,配置正確的IP地址,并單擊保存。大約2分鐘后,查看告警是否清除?是,處理完畢。否,執(zhí)行 HYPERLINK l _bookmark3 步驟6。請聯(lián)系技術支持。-結束參考信息無。3 ALM-FusionManager.9201 FusionManager與上級時間服務器同步時間失敗告警解釋時間管理模塊按設置的同步周期檢測上級時間服務器狀態(tài),當連續(xù)10次檢測到上級時間服務器不可用時,系統(tǒng)產生此告警。當系統(tǒng)檢測到上級時間服務器可用時,告警恢復。告警屬性告警ID告警級別可自動清除9201重要是告警參數參數名稱參數含義附加信息告警內容補充信

25、息。流水號按照告警產生的先后順序為每條告警信息順序分配的編號。告警名稱固定為“FusionManager與上級時間服務器同步時間失敗”。對象類型固定為“Time Management”。告警對象固定為“Time Management”。部件名稱固定為“FusionManager”。產生時間告警產生的時間。清除時間告警清除的時間。參數名稱參數含義清除類型自動清除。清除用戶清除告警的用戶名稱。對系統(tǒng)的影響此告警產生時,FusionManager節(jié)點不能正常的將上級時間服務器作為時間服務器,從而難以獲得精準的時間??赡茉騀usionManager節(jié)點與上級時間服務器時間差異大于1分鐘。Fusion

26、Manager節(jié)點與上級時間服務器網絡連接異常。上級時間服務器時間同步服務異常。處理步驟1單擊“系統(tǒng)管理”。進入“系統(tǒng)管理”頁面。2在“系統(tǒng)管理”頁面,單擊“時間管理”。進入“時間管理”頁面。3查看時間服務器1的IP,即為上級時間服務器的IP。4使用“PuTTY”,登錄FusionManager節(jié)點。用“galaxmanager”用戶,以FusionManager節(jié)點的管理IP登錄。5執(zhí)行以下命令,查看通信狀況。ping 上級時間服務器的IP,如ping 0返回信息如下所示,則通信正常。ping 0 (0) 56(84) bytes of data.64 bytes from 0: icmp_

27、seq=1 ttl=64 time=0.035 ms 64 bytes from 0: icmp_seq=2 ttl=64 time=0.028 ms 64 bytes from 0: icmp_seq=3 ttl=64 time=0.025 ms6通信是否正常? 是,執(zhí)行 HYPERLINK l _bookmark5 步驟7。 否,檢查網絡連接,確保網絡通暢。7執(zhí)行以下命令,并按提示輸入“root”用戶的密碼,切換至“root”用戶。su - root8執(zhí)行以下命令,查看上級時間服務器時間同步服務是否可用。ntpq -p 上級時間服務器的IP,如ntpq -p 1返回信息如下所示,則服務正常

28、。GMN01: # ntpq -p 1remoterefidst t when poll reachdelayoffset jitter=*LOCAL(0).LOCL.11 l 41064 3770.0000.0000.004上級時間服務器時間同步服務是否可用?是,執(zhí)行 HYPERLINK l _bookmark7 步驟11。否,執(zhí)行 HYPERLINK l _bookmark6 步驟10。修復上級時間服務器,確保同步服務正常。查看上級時間服務器的時間和FusionManager節(jié)點的時間差是否小于一分鐘?是,執(zhí)行 HYPERLINK l _bookmark11 步驟17。否,執(zhí)行 HYPER

29、LINK l _bookmark8 步驟12。在“系統(tǒng)管理”頁面單擊“時間管理”,進入“時間同步”頁面。在“時間同步”界面,單擊“強制時間同步”。強制時間同步過程中,會重啟系統(tǒng)服務,耗時約20分鐘。等待大約20分鐘后,重新登錄FusionManager,進入“時間同步”頁面,查看強制時間同步是否成功?是,執(zhí)行 HYPERLINK l _bookmark9 步驟15。否,執(zhí)行 HYPERLINK l _bookmark12 步驟18。查看告警是否清除?是,處理完畢。否,執(zhí)行 HYPERLINK l _bookmark10 步驟16。按照產品文檔“故障處理”章節(jié)中的“系統(tǒng)時間錯誤”指導進行處理。等

30、待1015個時間同步間隔,查看告警是否自動清除?是,處理完畢。否,執(zhí)行 HYPERLINK l _bookmark12 步驟18。請聯(lián)系技術支持。-結束參考信息無4 ALM-FusionManager.9202 NTP 服務啟動失敗告警解釋時間管理模塊監(jiān)測NTP服務狀態(tài),如果檢測到NTP服務停止將嘗試重啟NTP服務,嘗試3次,如果都失敗,系統(tǒng)產生此告警。當時間管理模塊監(jiān)測NTP服務狀態(tài)正常時告警自動清除。告警屬性告警ID告警級別可自動清除9202重要是告警參數參數名稱參數含義附加信息告警內容補充信息。流水號按照告警產生的先后順序為每條告警信息順序分配的編號。告警名稱固定為“NTP服務啟動失敗”

31、。對象類型固定為“Time Management”。告警對象固定為“Time Management”。部件名稱固定為“FusionManager”。產生時間告警產生的時間。參數名稱參數含義清除時間告警清除的時間。清除類型自動清除。清除用戶清除告警的用戶名稱。對系統(tǒng)的影響此告警產生時,系統(tǒng)不能正常的與上級時間服務器同步,從而難以獲得精準的時間??赡茉驎r間同步進程停止。時間同步進程出現故障。處理步驟使用“PuTTY”,登錄FusionManager節(jié)點主機。用“galaxmanager”用戶,以FusionManager節(jié)點的管理IP登錄。執(zhí)行以下命令,并按提示輸入“root”用戶的密碼,切換至

32、“root”用戶。su - root執(zhí)行以下命令,防止“PuTTY”超時退出。TMOUT=0執(zhí)行以下命令,查看進程狀態(tài)。service ntp status返回信息如下所示,狀態(tài)為“running”則進程正常。remoterefidst t when poll reachdelayoffset jitter=*LOCAL(0).LOCL.5 1164 3770.0000.0000.001Checking for network time protocol daemon (NTPD):running進程是否正常?是,執(zhí)行 HYPERLINK l _bookmark17 步驟12。否,執(zhí)行 HYP

33、ERLINK l _bookmark14 步驟6。執(zhí)行service ntp restart。執(zhí)行以下命令,查看進程狀態(tài)。service ntp status返回信息如下所示,狀態(tài)為“running”則進程正常。remoterefidst t when poll reachdelayoffset jitter=*LOCAL(0).LOCL.5 1164 3770.0000.0000.001Checking for network time protocol daemon (NTPD):running進程是否正常?是,執(zhí)行 HYPERLINK l _bookmark15 步驟9。否,執(zhí)行 HYP

34、ERLINK l _bookmark16 步驟10。等待23分鐘,查看告警是否清除。是,處理完畢。否,執(zhí)行 HYPERLINK l _bookmark17 步驟12執(zhí)行ps -aux | grep ntpd查看服務進程ID。執(zhí)行kill -9 進程ID,執(zhí)行是否成功?是,執(zhí)行 HYPERLINK l _bookmark14 步驟6否,執(zhí)行 HYPERLINK l _bookmark17 步驟12請聯(lián)系技術支持。-結束參考信息無。5 ALM-FusionManager.9203 FusionManager服務器時間被修改告警解釋時間管理模塊監(jiān)測到FusionManager節(jié)點時間被修改,同時修改

35、的時間超出了FusionManager節(jié)點允許的時間調整閾值(默認60秒),系統(tǒng)產生此告警。告警處理完成后,告警自動清除。告警屬性告警ID告警級別可自動清除9203重要是告警參數參數名稱參數含義附加信息告警內容補充信息。流水號按照告警產生的先后順序為每條告警信息順序分配的編號。告警名稱固定為“FusionManager服務器時間被修改”。對象類型固定為“Time Management”。告警對象固定為“Time Management”。部件名稱固定為“FusionManager”。產生時間告警產生的時間。參數名稱參數含義清除時間告警清除的時間。清除類型自動清除。清除用戶清除告警的用戶名稱。對系

36、統(tǒng)的影響此告警產生時,系統(tǒng)的功能會產生異常,如FusionManager使用定時器的業(yè)務等。同時如果FusionManager配置了上級時間服務器可能會產生“FusionManager與上級時間服務器時間差異過大”的告警??赡茉蛉藶樾薷牧薋usionManager節(jié)點的時間。處理步驟單擊“系統(tǒng)管理”。進入“系統(tǒng)管理”頁面。單擊“時間管理”。進入“時間同步”頁面。在“時間同步”界面,單擊“強制時間同步”。強制時間同步過程中,會重啟系統(tǒng)服務,耗時約20分鐘。等待大約20分鐘后,重新登錄FusionManager,進入“時間同步”頁面,查看強制時間同步是否成功?是,執(zhí)行 HYPERLINK l _

37、bookmark19 步驟5。否,執(zhí)行 HYPERLINK l _bookmark21 步驟7。查看告警是否清除?是,處理完畢。否,執(zhí)行 HYPERLINK l _bookmark20 步驟6。按照產品文檔“故障處理”章節(jié)中的“系統(tǒng)時間錯誤”指導進行處理。請聯(lián)系技術支持。-結束參考信息無6 ALM-FusionManager.9204 FusionManager與上級時間服務器時間差異過大告警解釋時間管理模塊監(jiān)測NTP服務狀態(tài),如果NTP服務異常是由于與上級時間服務器時間差異超過閾值造成的NTP服務停止,系統(tǒng)產生此告警。告警處理完成后,告警自動清除。告警屬性告警ID告警級別可自動清除9204重

38、要是告警參數參數名稱參數含義附加信息告警內容補充信息。流水號按照告警產生的先后順序為每條告警信息順序分配的編號。告警名稱固定為“FusionManager與上級時間服務器時間差異過大”。對象類型固定為“Time Management”。告警對象固定為“Time Management”。部件名稱固定為“FusionManager”。產生時間告警產生的時間。參數名稱參數含義清除時間告警清除的時間。清除類型自動清除。清除用戶清除告警的用戶名稱。對系統(tǒng)的影響此告警產生時,FusionManager節(jié)點不能正常的與上級時間服務器同步。此時,因為缺少了可靠的上級時間服務器,將無法對FusionManage

39、r節(jié)點的時間進行精確校準??赡茉騀usionManager節(jié)點與上級時間服務器時間差異超過閾值(默認60秒),停止與上級時間服務器同步。處理步驟單擊“系統(tǒng)管理”。進入“系統(tǒng)管理”頁面。單擊“時間管理”。進入“時間同步”頁面。在“時間同步”界面,單擊“強制時間同步”。強制時間同步過程中,會重啟系統(tǒng)服務,耗時約20分鐘。等待大約20分鐘后,重新登錄FusionManager,進入“時間同步”頁面,查看強制時間同步是否成功?是,執(zhí)行 HYPERLINK l _bookmark23 步驟5。否,執(zhí)行 HYPERLINK l _bookmark25 步驟7。查看告警是否清除?是,處理完畢。否,執(zhí)行 H

40、YPERLINK l _bookmark24 步驟6。按照產品文檔“故障處理”章節(jié)中的“系統(tǒng)時間錯誤”指導進行處理。請聯(lián)系技術支持。-結束參考信息無7 ALM-FusionManager.9206 FusionManager數據備份失敗告警解釋備份恢復模塊在每天2:00進行本地自動備份,每隔30分鐘,把備份文件上傳到第三方服務器。當本地自動備份失敗或上傳備份文件到第三方服務器失敗,系統(tǒng)產生此告警。在告警的附加信息中會說明產生告警的錯誤碼和錯誤信息。由于本地自動備份失敗產生的告警,告警級別為重要,需要用戶手工清除。由上傳備份文件到第三方服務器失敗產生的告警,告警級別為重要,會自動清除。告警屬性告

41、警ID告警級別可自動清除9206重要/次要是/否告警參數參數名稱參數含義附加信息告警內容補充信息。流水號按照告警產生的先后順序為每條告警信息順序分配的編號。告警名稱固定為“FusionManager數據備份失敗”。對象類型固定為“backup and restore”。參數名稱參數含義告警對象包括:LocalAutoBackup_UnknownLocalAutoBackup_SystemLocalAutoBackup_DBStatusLocalAutoBackup_DBOpLocalAutoBackup_SpaceLocalAutoBackup_SNLocalAutoBackup_LocalF

42、ileLocalAutoBackup_ScriptParamLocalAutoBackup_InitLogUploadBakFile_UnknownUploadBakFile_SNUploadBakFile_UserPassUploadBakFile_UnreachSvrUploadBakFile_LocalFileUploadBakFile_RemoteFileUploadBakFile_FileNumUploadBakFile_ScriptParamUploadBakFile_InitLog部件名稱固定為“FusionManager”。產生時間告警產生的時間。清除時間告警清除的時間。清除類

43、型告警清除的類型,例如手工清除和自動清除。清除用戶清除告警的用戶名稱。對系統(tǒng)的影響當出現一次本地自動備份失敗,系統(tǒng)會缺少一天的備份數據。當出現一次上傳備份文件到第三方服務器失敗,第三方服務器會缺少一份備份數據??赡茉虮镜刈詣觽浞菔』蛏蟼鱾浞菸募降谌椒掌魇 L幚聿襟E確認原因處理故障1 處理故障2請參見下表。序號錯誤碼錯誤描述處理方案110409101本地自動備份失敗,內部錯誤。執(zhí)行 HYPERLINK l _bookmark27 處理故障1210409106本地自動備份失敗,數據庫狀態(tài)異常。執(zhí)行 HYPERLINK l _bookmark28 處理故障2310409108本地自動備份

44、失敗,本地主機備份空間不足。執(zhí)行 HYPERLINK l _bookmark30 處理故障3410409109本地自動備份失敗,本地主機備份文件序號超過上限。執(zhí)行 HYPERLINK l _bookmark40 處理故障4510409301上傳備份文件到第三方服務器失敗,內部錯誤。執(zhí)行 HYPERLINK l _bookmark27 處理故障1610409309上傳備份文件到第三方服務器失敗,本地主機備份文件序號超過上限。執(zhí)行 HYPERLINK l _bookmark43 處理故障5710409310上傳備份文件到第三方服務器失敗,連接第三方服務器時用戶名密碼錯誤。執(zhí)行 HYPERLINK

45、l _bookmark44 處理故障6810409311上傳備份文件到第三方服務器失敗,無法連接第三方服務器。執(zhí)行 HYPERLINK l _bookmark46 處理故障7910409316上傳備份文件到第三方服務器失敗,本地主機的備份文件數超過上限。執(zhí)行 HYPERLINK l _bookmark48 處理故障8請聯(lián)系技術支持。使用“PuTTY”,登錄FusionManager節(jié)點主機。用“galaxmanager”用戶,以FusionManager節(jié)點主機的管理IP登錄。執(zhí)行以下命令,防止“galaxmanager”用戶超時退出。TMOUT=0執(zhí)行以下命令,進入數據庫啟停腳本所在目錄。c

46、d /opt/GalaxManager/bin執(zhí)行以下命令,檢查數據庫的狀態(tài)。sh pg_monitor.sh status數據庫狀態(tài)是否正常?處理故障3顯示status:abnormal,數據庫狀態(tài)異常,執(zhí)行 HYPERLINK l _bookmark31 步驟8。顯示status:normal,數據庫狀態(tài)正常,執(zhí)行 HYPERLINK l _bookmark32 步驟10。執(zhí)行以下命令,啟動數據庫。sh start_pt.sh啟動數據庫是否成功?顯示start pt successfully,啟動數據庫成功,執(zhí)行 HYPERLINK l _bookmark32 步驟10。顯示start p

47、t fail,啟動數據庫失敗,執(zhí)行 HYPERLINK l _bookmark29 步驟2。登錄告警頁面,手工清除告警。使用“PuTTY”,登錄FusionManager節(jié)點主機。用“galaxmanager”用戶,以FusionManager節(jié)點主機的管理IP登錄。執(zhí)行以下命令,防止“PuTTY”超時退出。TMOUT=0執(zhí)行以下命令,檢查備份目錄所在分區(qū)的空間。df -mFilesystem1M-blocksUsedAvailableUse%Mounted on/dev/sda1100773152641333%/devtmpfs241171241171%/devtmpfs2411702411

48、70%/dev/shm/dev/sda520163618782%/home/dev/sda92015348811424926%/opt/dev/sda134283152624062971%/opt/GalaxManager/data/dev/sda101007715194142%/opt/UHM/data/dev/sda740313177380891%/opt/cnalog/dev/sda111007715194142%/opt/gmbackup/dev/sda21007715194142%/sysback/dev/sda31007715294142%/tmp/dev/sda610077184

49、93812%/var/log/GalaxManager/dev/sda81007715194142%/var/log/UHM顯示每個分區(qū)的空間使用情況,查看第6列(Mounted on),目錄/opt/gmbackup對應的第4列(Available),可用磁盤空間是否小于900。小于900,執(zhí)行 HYPERLINK l _bookmark34 步驟14大于等于900,執(zhí)行 HYPERLINK l _bookmark32 步驟10。執(zhí)行以下命令,進入目錄“/opt/gmbackup/db”。cd /opt/gmbackup/db執(zhí)行以下命令,查看目錄“/opt/gmbackup/db”下的文件

50、和目錄。ls檢查目錄“/opt/gmbackup/db”下是否有不合法的文件和目錄。有,執(zhí)行 HYPERLINK l _bookmark35 步驟17。沒有,執(zhí)行 HYPERLINK l _bookmark36 步驟19。 說明目錄和文件的合法性請參見“參考信息”中的說明。執(zhí)行以下命令,逐個刪除目錄“/opt/gmbackup/db”下不合法的文件和目錄。rm -r 不合法的文件或目錄的名字執(zhí)行 HYPERLINK l _bookmark33 步驟13。執(zhí)行以下命令,進入目錄“/opt/gmbackup/db/manualbk”。cd /opt/gmbackup/db/manualbk執(zhí)行以下

51、命令,查看目錄“/opt/gmbackup/db/manualbk”下的文件和目錄。ls檢查目錄“/opt/gmbackup/db/manualbk”下是否有不合法的文件和目錄。有,執(zhí)行 HYPERLINK l _bookmark37 步驟22。沒有,執(zhí)行 HYPERLINK l _bookmark38 步驟24。執(zhí)行以下命令,逐個刪除目錄“/opt/gmbackup/db/manualbk”下不合法的文件和目錄。rm -r 不合法的文件或目錄的名字執(zhí)行 HYPERLINK l _bookmark33 步驟13。執(zhí)行以下命令,進入目錄“/opt/gmbackup/db”。cd /opt/gmb

52、ackup/db執(zhí)行以下命令,查看配置的自動備份文件個數。cat /opt/gmbackup/backup.conf | grep MAX_AUTO_BACKUP_NUM 說明如果用戶不進行配置,自動備份文件個數默認為7。執(zhí)行以下命令,查看目錄“/opt/gmbackup/db”下的備份文件。ls 說明備份文件名的格式請參見“參考信息”中的說明。檢查目錄“/opt/gmbackup/db”下的備份文件個數是否大于所配置的自動備份文件個數。大于,執(zhí)行 HYPERLINK l _bookmark39 步驟28。不大于,執(zhí)行 HYPERLINK l _bookmark41 步驟30。執(zhí)行以下命令,刪

53、除序號最小的備份文件。rm -r 序號最小的備份文件的名字處理故障4 說明備份文件的序號查看方法請參見“參考信息”中的說明。執(zhí)行 HYPERLINK l _bookmark33 步驟13。執(zhí)行以下命令,進入目錄“/opt/gmbackup/db/manualbk”。cd /opt/gmbackup/db/manualbk查看目錄“/opt/gmbackup/db/manualbk”下是否存在備份文件。存在,執(zhí)行 HYPERLINK l _bookmark42 步驟32。不存在,執(zhí)行 HYPERLINK l _bookmark29 步驟2。執(zhí)行以下命令,刪除序號最小的備份文件。rm -r 序號最

54、小的備份文件的名字執(zhí)行 HYPERLINK l _bookmark33 步驟13。使用“winscp”,以“galaxmanager”用戶登錄FusionManager節(jié)點主機。進入目錄“/opt/gmbackup/db”,查看是否存在序號大于4294967295的備份文件。存在,刪除序號大于4294967295的備份文件后,執(zhí)行 HYPERLINK l _bookmark32 步驟10。不存在,執(zhí)行 HYPERLINK l _bookmark32 步驟10。處理故障5處理故障6處理故障7 說明備份文件的序號查看方法請參見“參考信息”中的說明。使用“winscp”,以“galaxmanager

55、”用戶登錄FusionManager節(jié)點主機。進入目錄“/opt/gmbackup/db”,查看是否存在序號大于4294967295的備份文件。存在,刪除序號大于4294967295的備份文件后,執(zhí)行 HYPERLINK l _bookmark45 步驟38。不存在,執(zhí)行 HYPERLINK l _bookmark45 步驟38。 說明備份文件的序號查看方法請參見“參考信息”中的說明。進入目錄“/opt/gmbackup/db/manualbk”,查看是否存在序號大于4294967295的備份文件。存在,刪除序號大于4294967295的備份文件后,執(zhí)行 HYPERLINK l _bookma

56、rk32 步驟10。不存在,執(zhí)行 HYPERLINK l _bookmark32 步驟10。準備第三方服務器的IP,ftps服務的用戶名和密碼,以及第三方服務器ftps服務設置指導書。 說明請參考第三方服務器ftps服務設置指導書,獲取ftps服務的用戶名和密碼。使用“PuTTY”,登錄FusionManager節(jié)點主機。用“galaxmanager”用戶,以FusionManager節(jié)點主機的管理IP登錄。執(zhí)行以下命令,以便后續(xù)可以執(zhí)行啟用遠程備份命令,并防止“galaxmanager”用戶超時退出。. /etc/profile; TMOUT=0執(zhí)行以下命令,啟用遠程備份,并設置ftps服務

57、端的ip、端口、用戶名和密碼。remoteBackupMgr -e -h 第三方服務器的IP -p 21 -U “ftps服務的用戶名” -P “ftps 服務的密碼”例如:remoteBackupMgr -e -h 0 -p 21 -U gmbackupuser -P gmbackup顯示:Config remote backup information ok,執(zhí)行 HYPERLINK l _bookmark32 步驟10。顯示:Config remote backup information error,執(zhí)行 HYPERLINK l _bookmark29 步驟2。準備第三方服務器的IP和

58、第三方服務器ftps服務設置指導書。使用“PuTTY”,登錄FusionManager節(jié)點主機。用“galaxmanager”用戶,以FusionManager節(jié)點主機的管理IP登錄。執(zhí)行以下命令,防止“PuTTY”超時退出。TMOUT=0執(zhí)行以下命令,查看FusionManager節(jié)點主機和第三方服務器之間的網絡連接是否正常。ping 第三方服務器IP,如ping 0返回信息如下所示,則通信正常。ping 0 (0) 56(84) bytes of data.64 bytes from 0: icmp_seq=1 ttl=64 time=0.035 ms 64 bytes from 0: i

59、cmp_seq=2 ttl=64 time=0.028 ms 64 bytes from 0: icmp_seq=3 ttl=64 time=0.025 ms通信是否正常?是,執(zhí)行 HYPERLINK l _bookmark47 步驟48。否,執(zhí)行 HYPERLINK l _bookmark29 步驟2。檢查第三方服務器ftps服務是否正常。正常,執(zhí)行 HYPERLINK l _bookmark32 步驟10。不正常,請參考第三方服務器ftps服務設置指導書,進行恢復。處理故障8 說明請參考第三方服務器ftps服務設置指導書,檢查第三方服務器ftps服務是否正常。執(zhí)行 HYPERLINK l

60、_bookmark32 步驟10。使用“PuTTY”,登錄FusionManager節(jié)點主機。用“galaxmanager”用戶,以FusionManager節(jié)點服務器的管理IP登錄。執(zhí)行以下命令,防止“PuTTY”超時退出。TMOUT=0執(zhí)行以下命令,進入目錄“/opt/gmbackup/db”。cd /opt/gmbackup/db執(zhí)行以下命令,查看配置的自動備份文件個數。cat /opt/gmbackup/backup.conf | grep MAX_AUTO_BACKUP_NUM 說明如果用戶不進行配置,自動備份文件個數默認為7。執(zhí)行以下命令,查看目錄“/opt/gmbackup/db

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論