F5-LTM--故障檢測及信息收集(共6頁)_第1頁
F5-LTM--故障檢測及信息收集(共6頁)_第2頁
F5-LTM--故障檢測及信息收集(共6頁)_第3頁
F5-LTM--故障檢測及信息收集(共6頁)_第4頁
F5-LTM--故障檢測及信息收集(共6頁)_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、F5 LTM故障檢測及信息收集這篇文章是介紹硬件故障的處理和報錯信息的收集,用于向F5 SUPPORT提出RMA或DOA申請(軟件以及系統(tǒng)設置方面的故障這里沒有包括),綜合現場工程師和我所經手處理過的故障現象,總結了F5提供的解決方案和現場處理方法,以及RMA處理的一些經驗。主要分以下三個方面:l 常見故障現象l 故障處理和報錯信息的收集l 注意事項一、 主要故障現象分為兩個部分:V4.5系統(tǒng)和V9系統(tǒng)。V4.5系統(tǒng)對應的機型為 F5 1000、2400、5100系列。V9系統(tǒng)對應的機型為 F5 1500、3400、6400、6800系列1、 V4.5系統(tǒng)常見的故障現象l 電源故障l 風扇故障

2、l CF存儲卡故障l 光纖端口故障l 系統(tǒng)啟動故障2、 V9系統(tǒng)常見故障l 電源故障l 風扇故障l CPU溫度過高的故障l 系統(tǒng)啟動故障l 機器內部的板卡故障二、 故障處理和報錯信息的收集1、對于V4.5的系統(tǒng)由于沒有專項的檢測程序,所以我們要收集以下主要內容:l QKVIEW的運行結果(機器能夠啟動進入OS)l LOG文件(機器能夠啟動進入OS)l 觀察機器故障時的前面板狀態(tài)燈的情況、風扇工作情況、電源和電源風扇的工作情況;l CONSOLE口的輸出內容;l 有條件的話,對故障機器拍照(針對一些特殊的故障現象)。2、對于V9系統(tǒng)由于有硬件檢測程序,我們主要收集以下內容:l 硬件檢測程序 EU

3、D 的運行結果(機器能夠啟動或使用外置USB光驅運行);l CONSOLE口的輸出內容l 觀察機器故障時的前面板狀態(tài)燈的情況、風扇工作情況、電源和電源風扇的工作情況以及前面板液晶屏幕的顯示內容;l 有條件的話,對故障機器拍照(針對一些特殊的故障現象);l 啟動進入系統(tǒng)后,運行一些命令的結果。3、 下面介紹一些針對不同故障的信息收集和一些常見故障的解決方法。(1) 電源故障現象:開機無反應、風扇不工作、CONSOLE口無輸出等。這種故障比較明顯,只需觀察機器故障時的前面板狀態(tài)燈、風扇工作情況、電源和電源風扇的工作情況以及前面板液晶屏幕的顯示內容并記錄下來即可。(2) 風扇故障現象:系統(tǒng)報警,提示

4、風扇錯誤,這種故障情況要觀察風扇是否工作,因V4.5 的系統(tǒng)出現過風扇誤報警的情況,針對這個情況工程師包宏宇已經提出了解決方法,具體現場操作時要分清情況區(qū)別處理。如風扇確實不工作或轉速過低可運行/usr/local/bin/system_check d 命令并將運行結果保存起來,還要保存系統(tǒng)LOG文件以便用于RMA操作。 (3) CF卡有壞塊(針對V4.5的系統(tǒng))現象:系統(tǒng)提示文件系統(tǒng)故障。系統(tǒng)啟動過程中,出現如下信息,可確認CF卡有錯誤。.numdirs is zero, try using an alternate superblockAutomatic file system check

5、 failed!Initiating automatic fsck -y.* /dev/rwd0gnumdirs i/var: filesystem not clean, cannot mount read/writes zero, try using an alternate s/var: filesystem not clean, cannot mount read/writeuperblock* FILE SYSTEM STILL DIRTY */dev/wd0g on /var: filesystem not clean, cannot mount read/write/dev/wd0

6、g on /var: filesystem not clean, cannot mount read/write對于這種故障,F5 SUPPORT要求在單用戶模式下運行diskdefect命令來修復,具體命令如下:# /sbin/diskdefect -a -swcv wd0,執(zhí)行后還要運行CompactFlash Repair Utility命令進行檢測,命令為:#/sbin/hwtest/cfrepair wd0執(zhí)行結果的最后三行如下:這說明還有2016個壞扇區(qū)* Sectors scanned: 1000755* Bad sectors found: 2016* Bad sectors

7、fixed: 0需要將所作的過程和結果保存下來用于做RMA操作。(4) 光纖接口損壞現象:光纖連接中斷,無數據流量,端口狀態(tài)燈不亮。多出現于2400機型對于這種故障的確認缺乏有效的檢測命令,要申報F5的RMA 需要收集qkview的運行結果,里面有各個網絡接口的連接狀態(tài),現場有條件的話拍攝故障機器照片。其他網絡接口故障的信息收集也與此相同。下面是我在維修操作間拍攝的一組照片,用于表明光纖接口2 .1故障(5) 系統(tǒng)啟動故障現象:系統(tǒng)啟動過程中止,console口輸出信息如下:System is booting, please wait.Hit any key to stop autoboot:

8、 0 kernel.core_uses_pid = 0kernel.core_pattern = /var/core/%e.sccp.coreHost Console Shell - Press ( for command menu.對于這種故障可以進行的操作是通過網絡重新安裝系統(tǒng),V9的系統(tǒng)還可以使用外置USB接口的CD-ROM/DVD來重新安裝系統(tǒng)。如果無法重裝系統(tǒng)則需申請F5公司的RMA操作。注:以上介紹的故障都是V4.5的系列為主,V9系列機型的故障檢測相對容易,因為V9操作系統(tǒng)有了專用的硬件檢測程序End User Diagnostics(EUD),所以故障的檢測均以運行EUD為主。

9、(6) CPU溫度過高造成系統(tǒng)掛起?,F象:系統(tǒng)啟動后報警,Cpu 1: temperature (99) is too high. 然后系統(tǒng)掛起。這個故障多見于6400系列,在其他機型也偶有出現。進入系統(tǒng)后要運行兩個命令來確認故障點:#system_check d#b platform運行結果示例如下rootbigip:Active config # system_check -dCpu 1: temperature 26, fan_speed 6750Cpu 2: temperature 99, fan_speed 6750Chassis fan 101: status 1 - (good)

10、Chassis fan 102: status 1 - (good)Chassis fan 103: status 1 - (good)Chassis fan 104: status 1 - (good)Chassis fan 105: status 1 - (good)Chassis fan 106: status 1 - (good)Chassis power supply 101: status 1 - (good)Chassis power supply 102: status 2 - (not present)Chassis temperature 101: temperature

11、35Chassis temperature 102: temperature 28rootbigip:Active config # b platformPLATFORM INFORMATION -| Type D63a| Chassis: serial bip218733s| 200 Level part number: 200-0215-03 REV B| Switch board: serial PCA0101MP8F9 part PCA-0101-01 REV A| Host board: serial TY6FB35A0063 part MOB-0018-03 REV A| Annu

12、nciator board: serial 91022566 part OEM-0029-05 REV A| base MAC: 00:01:D7:5E:5E:C0+- CPU 1 temp 26degC fan speed 6750rpm+- CPU 2 temp 99degC fan speed 6750rpm| CHASSIS TEMPERATURE| (101) 35degC (102) 27degC| CHASSIS FAN| (101) active (102) active (103) active (104) active (105) active| (106) active|

13、 POWER SUPPLY| (101) active (102) missing通過察看輸出結果,可以看到這兩個命令可以有效檢測CPU溫度和散熱風扇的轉速,機箱內部溫度和風扇的狀態(tài)以及電源工作情況。三、注意事項:1、 EUD的版本盡量使用最新的。因為舊版本的EUD對于F5公司新出的機器支持的不好,舊版本的EUD在檢測第8項的時候會報錯,例如9.1.2系統(tǒng)的EUD,而新版本則不會。下面為EUD的檢測菜單:01 - Hardware Report02 - Run the switchboard CPLD tests03 - Verify switchboard I2C devices04 - V

14、erify PCI devices05 - Run the System Ram test06 - Run the LCD functionality test07 - Internal Packet Path test08 - Run the Disk Drive test09 - Run the PVAx memory tests10 - Run the SSL test11 - Run the FIPS test12 - Run the Compression test13 - S.M.A.R.T test14 - Run fsck on all drive partitions15 - Run all of the above applicable Non User Interactive tests16 - Run all of the above applicable tests17 - Display Test Report Log18 - Exit EUD Test and Reboot System2、 6400及以上機型的電源為可更換模塊,對于此類機型申請電源故障的RMA請求,F5公司只更換電源模塊。附件:V4.5系統(tǒng)如何進入單用戶重新啟動系統(tǒng)1. CMOS 檢測之后,當顯示BSD boot sequenc

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論