HP設(shè)備預(yù)防性巡檢報告模版V_第1頁
HP設(shè)備預(yù)防性巡檢報告模版V_第2頁
HP設(shè)備預(yù)防性巡檢報告模版V_第3頁
HP設(shè)備預(yù)防性巡檢報告模版V_第4頁
HP設(shè)備預(yù)防性巡檢報告模版V_第5頁
免費預(yù)覽已結(jié)束,剩余18頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

HP設(shè)備預(yù)防性巡檢報告模版V1HP設(shè)備預(yù)防性巡檢報告模版V1

HP主機巡檢效勞報告

公司名稱客戶信息部門聯(lián)系人手機公司名稱效勞商信息地址聯(lián)系人手機南京南瑞集團公司南京市鼓樓區(qū)南瑞路8號210003電話電子郵件025--83092831電話電子郵件主機硬件檢查檢查內(nèi)容指示燈狀態(tài)分區(qū)狀態(tài)(僅限高端產(chǎn)品)處理器內(nèi)存磁盤I/O正常正常正常正常正常正常正常特別說明:特別說明:特別說明:特別說明:特別說明:特別說明:特別說明:特別說明:特別說明:特別說明:特別說明:檢查結(jié)果網(wǎng)絡(luò)正常正常磁帶機DVD,CD-ROM正常正常機器的出風(fēng)口和入已清潔不需要清潔說明:風(fēng)口是否需要清潔系統(tǒng)日志檢查檢查內(nèi)容GSP/MP/SP日志dmesg輸出系統(tǒng)啟動日志系統(tǒng)運行日志正常正常正常正常檢查結(jié)果特別說明:特別說明:特別說明:特別說明:

第1頁共3頁

HP主機巡檢效勞報告

系統(tǒng)shutdown日志文件系統(tǒng)正常正常特別說明:特別說明:有說明:有說明:系統(tǒng)近期有無HPMC無系統(tǒng)近期有無Core無Dump檢查內(nèi)容集群的運行狀態(tài)集群的日志鎖盤檢查正常正常正常檢查結(jié)果特別說明:特別說明:特別說明:系統(tǒng)備份檢查做vg配置信息的備份詢問客戶有否在系統(tǒng)變更后或每半年做ignite系統(tǒng)備份詢問客戶數(shù)據(jù)庫及應(yīng)用、應(yīng)用數(shù)據(jù)是否認期有效進展備份詢問客戶磁帶機是否按要求定期清潔完成是是是失敗說明:否建議:否建議:否建議:系統(tǒng)總體性能評估Usr:%Sys:%CPU平均使用率Idle:%IO所占用的CPU使用率空閑的物理內(nèi)存交換區(qū)使用狀況Wio:%Free:K建議:建議:建議:PctUsed(Total):%建議:

第2頁共3頁

HP主機巡檢效勞報告

檢查結(jié)論:下一步工作規(guī)劃:客戶意見:□特別滿足□滿足□不滿足客戶建議:

客戶簽字:年月日聯(lián)系電話:

(簽字人有效電話,便于客服回訪)

工程師簽字:年月日

第3頁共3頁

擴展閱讀:HP主機設(shè)備巡檢標準版V1

HP巡檢指導(dǎo)說明

名目

..4.

PM過程中留意事項3預(yù)防性報告的使用方法3登錄系統(tǒng)留意事項3確定機器型號及操作系統(tǒng)型號3查看MP日志及Cell版狀態(tài)3查看系統(tǒng)硬件狀態(tài)-IOSCAN命令4Dmesg查看系統(tǒng)緩沖區(qū)內(nèi)容5系統(tǒng)啟動日志7系統(tǒng)運行日志7系統(tǒng)shutdown日志7EMS日志8文件系統(tǒng)(bdf)8系統(tǒng)近期有無HPMC8系統(tǒng)近期有無CoreDump8查看規(guī)律卷狀態(tài)9Dump區(qū)的配置是否合理9集群的運行狀態(tài)10集群的日志11鎖盤檢查12系統(tǒng)信息收集12CPU平均使用率(#sar)13IO所占用的CPU使用率13空閑的物理內(nèi)存(#top)14交換區(qū)使用狀況(#swapinfoatm)14查看系統(tǒng)CPU個數(shù),內(nèi)存數(shù)量

1.PM過程中留意事項

預(yù)防性報告的使用方法

在到達用戶現(xiàn)場前,打印預(yù)防性維護報告,一式兩份。在完成維護后,簽名并留一份

拷貝給客戶,另一份保存在公司文檔中。

PM過程中,請盡量保存具體的日志,以備不時之需

本文檔為巡檢的簡易文檔,如有時間,請多閱讀我的MP/p>

2.登錄系統(tǒng)留意事項

登陸HPUX操作系統(tǒng),以避開產(chǎn)生彗星撞地球之類不行預(yù)料事,請多開窗口以防萬一

A:開多個窗口命令:#TSMB:切換窗口命令:#CTRL+wC.退出TSM命令:#quit

同時請翻開SecureCRT等軟件的日志Log功能,以便記錄下相關(guān)重要日志

3.確定機器型號及操作系統(tǒng)型號

a.確定系統(tǒng)型號命令:#modelb.確定系統(tǒng)序列號

命令:#getconfCS_MACHINE_SERIAL

假如此命令失效,物理觀看取得機器序列號c.確定操作系統(tǒng)型號命令:#unamea

HP-UXasogz3B.11.11U9000/8001135931517unlimited-userlicense

4.查看MP日志及Cell版狀態(tài)

a.查看MP卡錯誤日志,及消退System黃燈告警

1.從串口或者MPLAN口登陸MP卡

Account:AdminPassword:Admin2.消失如下登陸窗口

MPMAINMENU:

CO:Console

VFP:VirtualFrontPanel

CM:CommandMenuCL:ConsoleLogSL:ShowEventLogsHE:MainHelpMenuX:ExitConnection

[rp4440_mp]MP>

輸入命令:SL

3.緊接著就可查看MP卡日志命令序列:e->a->3

此時就可以看到導(dǎo)致System黃燈大事了,多按幾次Enter,黃燈就能被毀滅了.

b.查看系統(tǒng)Cell版電源狀態(tài),或者風(fēng)扇狀態(tài):

MPMAINMENU:

CO:Console

VFP:VirtualFrontPanel

CM:CommandMenuCL:ConsoleLog

SL:ShowEventLogsHE:MainHelpMenuX:ExitConnection

[rp4440_mp]MP>

在此窗口下,輸入命令:CM然后輸入命令:PS

此時就可以看到Fan及Power狀態(tài)了,如下:

[rp3440]MP:CM>ps

PSSystemPowerstate:OnTemperature:NormalPowersuppliesState

PowerSupply1Normal

PowerSupply2NotInstalled

FansState

Cooling1(Sys)NormalCooling2(Mem)NormalCooling3(Disk)Normal

5.查看系統(tǒng)硬件狀態(tài)-IOSCAN命令I(lǐng)oscan作為查看系統(tǒng)硬件狀態(tài)的重要命令,其狀態(tài)CLAIMED為正常,

NO_HW,UNCLAIMED,UNKNOWN為不正常,至于三命令為何種不正常,請參看,在此略過不提

a:ioscan磁盤

命令:#ioscanfnCdiskb:ioscanIO

命令:#ioscannfc:ioscan網(wǎng)絡(luò)

命令:#ioscannfClan命令:#lanscan

命令:#ifconfiglanX

此處有兩條幫助命令lanscan及ifconfigLanscan狀態(tài)UP為正常,down為特別

Ifconfig顯示正確配置ip為正常,非配置ip為特別

6.Dmesg查看系統(tǒng)緩沖區(qū)內(nèi)容運行命令dmesg是一個即簡潔又快捷的方法來查看系統(tǒng)硬件及文件系統(tǒng)有無報錯。dmesg

的工作原理是直接從系統(tǒng)的緩沖器(buffer)中讀取系統(tǒng)最近一段時期內(nèi)的硬件狀態(tài)。命令dmesg的缺點是輸出結(jié)果中沒有時間標志,同時由于緩沖器的容量有限,近期的內(nèi)

容會掩蓋緩沖器里以前的內(nèi)容,因此假如有些故障輸出,而機器一兩年沒重啟過,也屬正常,不必過分關(guān)注.

效勞器沒有硬件報錯時,dmesg的標準輸出是:

May1410:38

gate64:sysvec_vaddr=0xc000201*for2pages

NOTICE:autofs_link():Filesystemwasregisteredatindex3.NOTICE:cachefs_link():Filesystemwasregisteredatindex5.NOTICE:nfs3_link():Filesystemwasregisteredatindex6.0sba0/0lba

0/0/0/0btlan0/0/1/0c7200/0/1/0.7tgt0/0/1/0.7.0sctl0/0/1/1c7200/0/1/1.2tgt0/0/1/1.2.0sdisk0/0/1/1.7tgt0/0/1/1.7.0sctl0/0/2/0c7200/0/2/0.7tgt0/0/2/0.7.0sctl0/0/2/1c7200/0/2/1.2tgt0/0/2/1.2.0sdisk0/0/2/1.7tgt0/0/2/1.7.0sctl0/0/4/0asio00/0/5/0asio00/1lba0/2lba

0/2/0/0c7200/2/0/0.0tgt0/2/0/0.0.0schgr0/2/0/0.1tgt0/2/0/0.1.0stape0/2/0/0.7tgt0/2/0/0.7.0sctl0/3lba0/4lba

c8xxBUS:5SCSIC1010UltraWideLVDassignedCPU:00/4/0/0c8xx0/4/0/0.6tgt0/4/0/0.6.0sctl0/5lba

0/5/0/0c7200/5/0/0.2tgt0/5/0/0.2.0stape0/5/0/0.7tgt0/5/0/0.7.0sctl0/6lba0/6/0/0td

td:claimedTachyonXL2FibreChannelMassStoragecardat0/6/0/00/6/0/0.8fcp

0/6/0/10.0fcparray0/6/0/10.0.0tgt0/6/0/sdisk0/6/0/sdisk0/6/0/sdisk0/6/0/10.1fcparray0/6/0/10.1.0tgt0/6/0/sdisk0/6/0/sdisk0/6/0/sdisk0/6/0/55.6fcpdev0/6/0/55.6.14tgt0/6/0/sctl0/7lba

c8xxBUS:7SCSIC1010UltraWideLVDassignedCPU:10/7/0/0c8xx0/7/0/0.6tgt0/7/0/0.6.0sctl8memory

160processor166processor

btlan:Initializing10/100BASE-TXcardat0/0/0/0

SystemConsoleisontheBuilt-InSerialInterfaceLogicalvolume64,0x3configuredasROOTLogicalvolume64,0x2configuredasSWAPLogicalvolume64,0x2configuredasDUMP

Swapdevicetable:(startstart=0,size=5242880Dumpdevicetable:(startstart=310112,size=2621440

StartingtheSTREAMSdaemons-phase1CreateSTCPdevicefilesStartingtheSTREAMSdaemons-phase2

$Revision:vmunix:vw:-projselectors:CUPI80_BL201*_1108-c“VwforCUPI80_BL201*_1108build“--cupi80_bl201*_1108“CUPI80_BL201*_1108“WedNov819:24:56PST201*$MemoryInformation:

physicalpagesize=4096bytes,logicalpagesize=4096bytes

Physical:1310720Kbytes,lockable:1127096Kbytes,available:1091104Kbytes

我們查看dmesg的輸出時,應(yīng)著重觀看有沒有類似”SCSIReset”,“DiskPowerFailed”,

“PVpath”,“LPMC”,“filesystemfull”等報錯信息。假如有,可以在系統(tǒng)的syslog中進一步確定錯誤發(fā)生的時間,從而對所報錯誤進展定位.

7.系統(tǒng)啟動日志

請輸入命令:#cat/etc/rc.log記錄系統(tǒng)啟動日志系統(tǒng)的啟動日志是指文件:/etc/rc.log.

我們可以用vi命令進展查看,看/etc/rc.log日志中有沒有”Fail”或”error”;假如

有,就代表系統(tǒng)在啟動時相應(yīng)的啟動腳本運行失敗。

8.系統(tǒng)運行日志

請輸入命令:#more/var/adm/syslog/syslog.log記錄系統(tǒng)運行日志,有些系統(tǒng)常年未重

啟過,日志超大,輸入命令#tail-500/var/adm/syslog/syslog.log觀看機器詳細運行狀況.

系統(tǒng)的運行日志是指文件:/var/adm/syslog/syslog.log.查看syslog.log日志中有沒有”SCSIReset”,“DiskPowerFailed”,“PVpath”,

“LPMC”,“filesystemfull”,“Fail”,“Error”,“Warning”等錯誤信息。假如有,請依據(jù)閱歷給出合理的解釋;假如有EMSlog,可以根據(jù)其提示的命令看詳細的內(nèi)容;如有必要請聯(lián)系我.

9.系統(tǒng)shutdown日志

請輸入命令:#cat/etc/shutdownlog記錄系統(tǒng)關(guān)機日志.

系統(tǒng)的shutdown日志(/etc/shutdownlog)記錄了系統(tǒng)全部停頓,重啟的時間。

07:35SatMay11,201*.Reboot:(bySAM)

07:37SatMay11,201*.Reboot:(byasogz3!root)00:01SunMay12,201*.Reboot:(bySAM)00:04SunMay12,201*.Reboot:

17:17ThuMay30,201*.Reboot:(byasogz3!oracle9i)21:33ThuMay30,201*.Reboot:(byasogz3!root)

17:35FriApr30,201*.Halt:(!root)

我們可以同客戶進展溝通,確認系統(tǒng)是否非正常重啟過。

10.EMS日志

輸入命令:#more/var/opt/resmon/log/event.logEMS日志記錄系統(tǒng)硬件大事,認真閱讀確定有無故障.

11.文件系統(tǒng)(bdf)

用命令bdf查看文件系統(tǒng)的使用狀況,假如有文件系統(tǒng)的使用率超過90%,請告知客戶。

有可能的話,可幫忙客戶擴大相應(yīng)的文件系統(tǒng);或者和客戶一起刪除過期沒用的文件。

12.系統(tǒng)近期有無HPMC

查看系統(tǒng)近期有沒有HPMC的方法是:

#cd/var/tombstones#morets99

HP-UXasogz3B.11.11U9000/8001135931517

CPU-ID(Model)=0x11

Processor0HPMCInformation-PDCVersion:40.48

Timestamp=MonApr2110:26:49GMT201*(20:03:04:21:10:26:49)

HPMCChassisCodes系統(tǒng)最近一次發(fā)生HPMC的時間(格林尼治時間)ChassisCodeExtension

0x000008201*ff62420x00000000000000000x180008201*0063020xc3808000000000000x0000087000ff62920x00000000000000000x60000820700060620x00000000011001700x70000820700060820x0000000000a41c000x201*082374ff6b830x0000ff00002aff740x201*082374ff6b830x0000ff00002bff740x201*082274ff6bc30x0000ff00002aff740x201*082274ff6bc30x0000ff00002bff74

0x00000800800063100x0000000000000001

13.系統(tǒng)近期有無CoreDump

查看系統(tǒng)近期有沒有CoreDump的方法是:#cd/var/adm/crash#lltotal40

-rwxr-xr-x1rootroot1May30201*boundsdrwxr-xr-x2rootroot4096Apr809:59crash.0drwxr-xr-x2rootroot4096Apr110:02crash.1drwxr-xr-x2rootroot4096Mar910:04crash.2drwxr-xr-x2rootroot4096Mar210:06crash.3

系統(tǒng)CoreDump內(nèi)容存到硬盤上的時間

在DUMP的子名目中的INDEX文件中dumptime和savetime會更準確地指出dump發(fā)生

及存儲的時間。

14.查看規(guī)律卷狀態(tài).

系統(tǒng)硬盤物理損壞,一般前面故障指示燈,都會亮,但也有些古董級別的機器,壞了,故障燈依舊長綠.為防此類大事,可查看規(guī)律卷狀態(tài)命令:#vgdisplayvvg00|more

#lvdisplayv/dev/vg00/lv*|more

規(guī)律卷狀態(tài)為Syncd/Active為正常;stale/Unknown為不正常.

15.Dump區(qū)的配置是否合理

對CoreDump的分析是我們定位系統(tǒng)故障緣由的重要手段。

Dump區(qū)配置的是否合理,打算了CoreDump能否被勝利保存到系統(tǒng)硬盤上。

以下是關(guān)于DUMP區(qū)配置的一些建議,請認真檢查主機系統(tǒng)中Dump區(qū)的配置是否滿意要

求:

1.#lvlnbootv

BootDefinitionsforVolumeGroup/dev/vg00:PhysicalVolumesbelonginginRootVolumeGroup:/dev/dsk/c1t2d0(0/0/1/1.2.0)--BootDiskBoot:lvol1on:/dev/dsk/c1t2d0Root:lvol3on:/dev/dsk/c1t2d0Swap:lvol2on:/dev/dsk/c1t2d0Swap:lvol1on:/dev/dsk/c2t1d0Dump:lvol2on:/dev/dsk/c1t2d0,0系統(tǒng)DUMP區(qū)(PrimarySwap)

通常狀況下,系統(tǒng)將PrimarySwap區(qū)作為系統(tǒng)的Dump區(qū).

2.DUMP大小的要求

HPUX10.20:Dump區(qū)的大小肯定要大于PhysicalRAM。

HPUX11.0&11i:為了勝利將CoreDump保存到系統(tǒng)硬盤上,Dump區(qū)的大小需要介于PhysicalRAM的30%和60%之間,詳細要根

據(jù)系統(tǒng)發(fā)生Dump時的忙閑程度。

3.假如系統(tǒng)現(xiàn)有的Dump區(qū)大小無法滿意要求,請告知客戶。

4.在條件允許的狀況下,和客戶協(xié)商并征得客戶同意,可以增加Swap.

16.集群的運行狀態(tài)

用命令#cmviewclv查看整個集群的運行狀態(tài)。

#cmviewclvCLUSTERSTATUS正常:UP特別:DOWNacct_clusterupNODESTATUSSTATEacctdb_auprunningNetwork_Parameters:正常:running特別:down,unknownINTERFACESTATUSPATHNAME

PRIMARYup5/1/0lan2正常:UP特別:DOWNPRIMARYup3/0/0lan0STANDBYup5/0/0lan1PACKAGESTATUSSTATEAUTO_RUNNODEacct_pkg1uprunningdisabledacctdb_aPolicy_Parameters:正常:UP特別:DOWN正常:runningPOLICY_NAMECONFIGURED_VALUE特別:HaltedFailoverconfigured_nodeFailbackmanualScript_Parameters:

ITEMSTATUSMAX_RESTARTSRESTARTSNAMEServiceup00service1Subnetup正常:UP特別:DOWNNode_Switching_Parameters:

NODE_TYPESTATUSSWITCHINGNAMEPrimaryupenabledacctdb_a(current)Alternateupenabledacctdb_b

NODESTATUSSTATEacctdb_buprunningNetwork_Parameters:

INTERFACESTATUSPATHNAMEPRIMARYup5/1/0lan2PRIMARYup3/0/0lan0STANDBYup5/0/0lan1

PACKAGESTATUSSTATEAUTO_RUNNODEacct_pkg2uprunningdisabledacctdb_bPolicy_Parameters:

POLICY_NAMECONFIGURED_VALUEFailoverconfigured_nodeFailbackmanualScript_Parameters:

ITEMSTATUSMAX_RESTARTSRESTARTSNAMEServiceup00service2SubnetupNode_Switching_Parameters:

NODE_TYPESTATUSSWITCHINGNAMEPrimaryupenabledacctdb_b(current)Alternateupenabledacctdb_a

假如集群的運行狀態(tài)有特別,請和客戶一起確認產(chǎn)生特別的緣由,并請聯(lián)系我.

17.集群的日志

集群的日志是指文件:/etc/cmcluster/pkgXX/pkgXX.log.

集群的每個包(Package)都有自己的運行日志,并且每個包(Package)的實時日志是

保存在這個包所正在運行的主機節(jié)點上。我們查看集群的日志主要是看日志中有沒有類似于“Failed”,“Error”等報錯信息,

假如有請憑閱歷給出解釋.

18.鎖盤檢查

對于由2個節(jié)點(主機)組成的集群(Cluster),我們需要確認集群中鎖盤上的鎖盤

標志是否存在。

檢查集群中鎖盤標志是否存在的方法是:

1.首先在集群的配置文件中找出主機上的鎖盤。例如:

#Definitionofnodesinthecluster.

#Repeatnodedefinitionsasnecessaryforadditionalnodes.NODE_NAME

acctdb_alan2

NETWORK_INTERFACE

HEARTBEAT_IPNETWORK_INTERFACEHEARTBEAT_IPNETWORK_INTERFACEFIRST_CLUSTER_LOCK_PV

lan0lan1

/dev/dsk/c7t5d6

鎖盤

2.然后用下面的命令檢查鎖盤上的標志信息是否存在:

#echo“0x2084?4D“|adb/dev/dsk/c7t5d6

2084:141941451010590466256

有鎖盤標志

2084:0000

沒有鎖盤標志

假如輸出結(jié)果的其次列是“1”,說明集群中鎖盤上有鎖盤的標志。假如輸出結(jié)果的其次列是“0”,說明集群中鎖盤上鎖盤的標志已經(jīng)喪失。

假如鎖盤上沒有鎖盤的標志,可用以下命令將鎖盤標志重新寫到鎖盤上,建議和客戶

另外約時間并聯(lián)系我.

19.系統(tǒng)信息收集

請用cstm收集系統(tǒng)相關(guān)信息

a:收集相關(guān)信息到文件/tmp/hp/info.out#cstmselall>info>>>>>>il>EOF

以上腳本中的幾個空行是必要的,否則執(zhí)行il命令時可能得不到正確結(jié)果。輸出的結(jié)果被保存在info.out文件中,Memory,InternalDisk,Tapedrive等設(shè)備的序列號都會被列出來,通常CPU的序列號顯示為0.b:Log收集的信息

#Cat/tmp/hp/info.out

20.CPU平均使用率(#sar)

#saru330(每隔3秒采樣一次,共采樣30次)

在業(yè)務(wù)頂峰期使用saru命令

%usr=times

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論