版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
RS6000系統(tǒng)日常管理培訓(xùn)內(nèi)容提要系統(tǒng)健康檢查常用操作故障的處理IBM服務(wù)熱線內(nèi)容提要系統(tǒng)健康檢查系統(tǒng)健康檢查系統(tǒng)健康檢查系統(tǒng)健康檢查
機(jī)房環(huán)境檢查電源線的母頭是否為左零右火電壓值是否為240V零地電壓是否小于1V溫度(攝氏℃)10℃-40℃濕度(%)8%-80%查看硬件情況檢查設(shè)備故障燈,一般為橙色并有標(biāo)志。有沒有異常聲響,如硬盤、風(fēng)扇等。有沒有破損的電纜等系統(tǒng)健康檢查
機(jī)房環(huán)境檢查系統(tǒng)健康檢查檢查文件系統(tǒng)查看有沒有“滿”的文件系統(tǒng)。文件系統(tǒng)滿可導(dǎo)致系統(tǒng)不能正常工作,尤其是AIX的基本文件系統(tǒng)。如/(根文件系統(tǒng))滿則會(huì)導(dǎo)致用戶不能登錄。#df-k (查看AIX的基本文件系統(tǒng))Filesystem1024-blocksFree%UsedIused%IusedMountedon/dev/hd424576145295%259922%//dev/hd26144002806896%2296715%/usr/dev/hd9var8192454045%64932%/var/dev/hd31679361579686%891%/tmp/dev/hd116384533268%140235%/home系統(tǒng)健康檢查檢查文件系統(tǒng)#df-k (查看AIX的基本系統(tǒng)健康檢查除/usr文件系統(tǒng),其他文件系統(tǒng)都不應(yīng)太滿,一般不超過80%。處理方法1:找出(刪除)垃圾文件#du-sk*|sort–rn|head查找出當(dāng)前目錄下占空間最大的子目錄,逐層往下直到找出占空間最大的文件。(要區(qū)分哪些目錄是文件系統(tǒng)的mountpoint,哪些是文件系統(tǒng)的子目錄)刪除文件,釋放空間。有時(shí)刪除文件后空間并不馬上釋放,這是由于你刪除的文件正被某個(gè)程序打開。只有當(dāng)這個(gè)程序停止后空間才釋放,有時(shí)甚至需要重起系統(tǒng)。系統(tǒng)健康檢查除/usr文件系統(tǒng),其他文件系統(tǒng)都不應(yīng)太滿,一般系統(tǒng)健康檢查處理方法2:增加文件系統(tǒng)大小#smittychjfs 文件系統(tǒng)可以在任何時(shí)候加大,前提是卷組(VG)中有剩余空間。檢查文件系統(tǒng)的完整性#umountfilesystem_name#fsckfilesystem_name#fsck-yfilesystem_name注意:文件系統(tǒng)必須先umount,再做檢查和修復(fù),否則可導(dǎo)致未知的后果。系統(tǒng)健康檢查處理方法2:增加文件系統(tǒng)大小系統(tǒng)健康檢查查看卷組信息lsvg-lvg_name有沒有"stale"狀態(tài)的邏輯卷。用syncvg命令修復(fù)。#smittysyncvgLVNAMETYPELPsPPsPVsLVSTATEMOUNTPOINThd5boot122closed/syncdN/Ahd6paging48962open/syncdN/Apaging00paging32642open/syncdN/Ahd8jfslog122open/syncdN/Ahd4jfs122open/syncd/hd2jfs32642open/syncd/usrhd9varjfs5102open/syncd/varhd3jfs482open/syncd/tmphd1jfs122open/syncd/home系統(tǒng)健康檢查查看卷組信息LVNAME系統(tǒng)健康檢查檢查內(nèi)存交換區(qū)(pagingspace)使用率#lsps-s使用率不要超過70%。增加交換區(qū),或增加內(nèi)存。觀察內(nèi)存大小的命令:lsattr–Elmem0#lsps-sTotalPagingSpacePercentUsed2048MB15%#lsps–aPageSpacePhysicalVolumeVolumeGroupSize%UsedActiveAutoTypehd6hdisk0rootvg2048MB15yesyeslv系統(tǒng)健康檢查檢查內(nèi)存交換區(qū)(pagingspace)使用率系統(tǒng)健康檢查網(wǎng)絡(luò)檢查netstat-i查看網(wǎng)卡狀態(tài)Ierrs/Ipkts和Oerrs/Opkts是否>1%pinghost_name/IPAddress查看是否通和是否有丟包。路由表#netstat-rn查看路由表是否正確,ping各路由器是否通。核對(duì)主機(jī)名#hostname系統(tǒng)健康檢查網(wǎng)絡(luò)檢查系統(tǒng)健康檢查#ifconfig-aen0:flags=4e080863<UP,BROADCAST,NOTRAILERS,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT,PSEG> inet172.40.10.31netmask0xffff0000broadcast172.40.255.255lo0:flags=e08084b<UP,BROADCAST,LOOPBACK,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT> inet127.0.0.1netmask0xff000000broadcast127.255.255.255 inet6::1/0#ifconfig用法ifconfigen0inet11.0.0.1upifconfigen0ns110:02.60.8c.2c.a4.98up(還有很多)系統(tǒng)健康檢查#ifconfig-aen0:flags=4系統(tǒng)健康檢查#lsattr–Elinet0authm65536AuthenticationMethodsTruehostnameqtsmsHostNameTruegatewayGatewayTrueroutenet,,0,172.40.10.1RouteTruebootup_optionnoSerialOpticalNetworkInterfaceTruerout6FDDINetworkInterfaceTrueroute屬性是否有相應(yīng)的路由信息。格式為:net,,0,172.16.23.81如果沒有缺省路由,執(zhí)行命令:#chdev–linet0–aroute=0,172.16.23.81其中172.16.23.81為網(wǎng)關(guān)如果缺省路由不正確,則先刪除路由,再增加缺省路由:#chdev–linet0–adelroute=net,,0,133.16.23.81#chdev–linet0–aroute=0,172.16.23.81系統(tǒng)健康檢查#lsattr–Elinet0系統(tǒng)健康檢查檢查dump設(shè)置#sysdumpdev–lprimary/dev/hd6secondary/dev/sysdumpnullcopydirectory/var/adm/rasforcedcopyflagTRUEalwaysallowdumpFALSEdumpcompressionOFF若不正確請(qǐng)用下列命令修改:#sysdumdev–P–p/dev/hd6–s/dev/sysdumpnull系統(tǒng)健康檢查檢查dump設(shè)置系統(tǒng)健康檢查系統(tǒng)故障記錄(errorlog)errdemon進(jìn)程在系統(tǒng)啟動(dòng)時(shí)自動(dòng)運(yùn)行記錄包括硬件、軟件及其他操作信息故障記錄文件為/var/adm/ras/errlog,可備份下來或拷貝到別的機(jī)器上分析errpt命令的使用(普通用戶權(quán)限也可使用)系統(tǒng)健康檢查系統(tǒng)故障記錄(errorlog)系統(tǒng)健康檢查系統(tǒng)健康檢查系統(tǒng)健康檢查系統(tǒng)健康檢查系統(tǒng)健康檢查系統(tǒng)健康檢查系統(tǒng)健康檢查發(fā)給root的mail信息#mail#mail–f;查看已經(jīng)存起來的郵件#Ctrl+d;存盤退出,存在/var/spool/Mail目錄下,每個(gè)用戶一個(gè)文件#mhmail;將郵件另存至/Mail/inbox目錄下,每個(gè)郵件一個(gè)文件
系統(tǒng)會(huì)定期將PD的結(jié)果以郵件形式發(fā)送給root,比errlog更詳細(xì)準(zhǔn)確。系統(tǒng)健康檢查發(fā)給root的mail信息系統(tǒng)健康檢查磁帶機(jī)磁帶機(jī)應(yīng)定期清潔,每使用30小時(shí)(8mm20GB為72小時(shí))或至少每月清潔一次,不要等故障燈亮起后再清潔。不同類型的帶機(jī)用要不同的清洗帶,不要混用。用"/usr/lpp/diagnostics/bin/utape-c-drmt0-n"可查看磁帶機(jī)使用時(shí)數(shù)。4mmDDS3磁帶機(jī)可讀寫DDS2,但對(duì)DDS1只能讀。8mm20GB磁帶機(jī)只能讀5GB和7GB磁帶,而且在讀過低密度磁帶后需要清洗,所以最好不要使用低密度磁帶。需要清洗時(shí)液晶板上有提示信息。系統(tǒng)健康檢查磁帶機(jī)系統(tǒng)健康檢查磁盤陣列狀態(tài)檢查(ssadisk)如果在errlog或mail中發(fā)現(xiàn)了ssa的報(bào)錯(cuò),則進(jìn)入smittyssaraid詳細(xì)觀察系統(tǒng)健康檢查磁盤陣列狀態(tài)檢查(ssadisk)系統(tǒng)健康檢查L(zhǎng)istingAllDefinedSSARAIDArraysCOMMANDSTATUSCommand:OKstdout:yesstderr:noBeforecommandcompletion,additionalinstructionsmayappearbelow.hdisk3095231779F0737Kgood3.4GRAID-5arrayhdisk409523173A02137Kgood3.4GRAID-5arrayF1=Help F2=Refresh F3=Cancel F6=Command F8=Image F9=ShellF10=Exit/=Find n=FindNext系統(tǒng)健康檢查L(zhǎng)istingAllDefinedSSA系統(tǒng)健康檢查L(zhǎng)istingorIdentifyingSSAPhysicalDiskDrives系統(tǒng)健康檢查L(zhǎng)istingorIdentifyingS系統(tǒng)健康檢查ssa在errlog中的報(bào)錯(cuò)形式OpenLink;不一定是故障ResourceUnavailable;Pdiskerror;Others.pdisk的狀態(tài)Good,FailedFree,System,ArrayCandidate,Hotspare,Rejectedssaraid的狀態(tài)Good,Exposed,Degraded,Rebuilding,Offline系統(tǒng)健康檢查ssa在errlog中的報(bào)錯(cuò)形式常用操作常用操作常用操作系統(tǒng)備份系統(tǒng)備份除每日進(jìn)行正常的用戶數(shù)據(jù)備份外,建議定期進(jìn)行系統(tǒng)備份。備份前先停止業(yè)務(wù)系統(tǒng)軟件和HACMP軟件的運(yùn)行。其他無關(guān)的用戶退出,停止無關(guān)的操作。系統(tǒng)備份只備份ROOTVG,除系統(tǒng)基本的5個(gè)文件系統(tǒng)外,其他ROOTVG上已mount上的文件系統(tǒng)也會(huì)被備份。用smittymksysb命令進(jìn)行系統(tǒng)備份,備份前先清掉root的密碼。每當(dāng)系統(tǒng)作變更(安裝新軟件、補(bǔ)丁程序等)前后,都需要做系統(tǒng)備份。常用操作系統(tǒng)備份系統(tǒng)備份常用操作系統(tǒng)備份
BackUptheSystemTypeorselectvaluesinentryfields.PressEnterAFTERmakingalldesiredchanges.[TOP][EntryFields]WARNING:Executionofthemksysbcommandwillresultinthelossofallmaterialpreviouslystoredontheselectedoutputmedium.Thiscommandbacksuponlyrootvgvolumegroup.*BackupDEVICEorFILE[/dev/rmt0]+/CreateMAPfiles?no+EXCLUDEfiles?no+Listfilesastheyarebackedup?no+Generatenew/image.datafile?yes+EXPAND/tmpifneeded?yes+Disablesoftwarepackingofbackup?no+[MORE...2]F1=HelpF2=RefreshF3=CancelF4=ListEsc+5=ResetEsc+6=CommandEsc+7=EditEsc+8=ImageEsc+9=ShellEsc+0=ExitEnter=Do常用操作系統(tǒng)備份常用操作系統(tǒng)備份檢查系統(tǒng)備份帶是否有效用備份帶啟動(dòng)機(jī)器,但不要進(jìn)行安裝,我們只是驗(yàn)證系統(tǒng)備份帶是否能用于啟動(dòng)。出現(xiàn)以下菜單后,關(guān)機(jī)即可。 WelcometoBaseOperatingSystem InstallationandMaintenanceTypethenumberofyourchoiceandpressEnter.>>> 1StartInstallationNowwithDefaultSettings 2Change/ShowInstallationSettingsandInstall 3StartMaintenanceModeforSystemRecovery88Help?99PreviousMenu常用操作系統(tǒng)備份檢查系統(tǒng)備份帶是否有效常用操作系統(tǒng)備份#smittylsmksysb ; 檢查系統(tǒng)備份帶的內(nèi)容。系統(tǒng)備份不是萬能的。備份最好有兩份。用戶數(shù)據(jù)備份文件系統(tǒng)可用tar命令,切記不要使用絕對(duì)路徑。數(shù)據(jù)庫可用數(shù)據(jù)庫的備份方式備。邏輯卷(LV)可用dd命令。smittysavevg用戶卷組備份只備份mount起的文件系統(tǒng)。注意:不備份邏輯卷(裸設(shè)備)。常用操作系統(tǒng)備份#smittylsmksysb ; 常用操作系統(tǒng)備份磁帶機(jī)卡帶子時(shí)可嘗試RESET磁帶機(jī)。按住磁帶機(jī)的彈出按鈕15~30秒,直到磁帶機(jī)液晶面板顯示RESET。磁帶RESET后磁帶應(yīng)能彈出。(此方法僅適用于8mm20GB磁帶機(jī))#diag-cdrmt0#tctl-f/dev/rmt0reset如果上述方法均不奏效,則只有重起機(jī)器。常用操作系統(tǒng)備份磁帶機(jī)卡帶子時(shí)可嘗試RESET磁帶機(jī)。常用操作鏡像鏡像(rootvg)lspv,lsvg–lrootvg,lsvgrootvg,lsvg–prootvg,lslv–mlv_name,lsvg–Mrootvgextendvg–frootvghdisk1chvg–ay–Qnrootvgmirrorvg–Srootvghdisk0hdisk1bosboot–a–l/dev/hd5–d/dev/hdisk1bootlist–mnormalhdisk0hdisk1syncvg–vrootvg常用操作鏡像鏡像(rootvg)常用操作鏡像拆鏡像(rootvg)lsvg–Mrootvg;檢查有效的pv,確認(rèn)hdisk1壞unmirrorvgrootvghdisk1bosboot–a–d/dev/hdisk0bootlist–mnormalhdisk0cd0mkboot–c–d/dev/hdisk1sysdumpdev–l;檢查dump所在的lv(缺省hd6)sysdumpdev–P–p/dev/hd6;reducevgrootvghdisk1rmdev–dlhdisk1shutdown-Fr常用操作鏡像拆鏡像(rootvg)常用操作HACMP的操作HACMP的操作 啟動(dòng):smittyclstart 停止:smittyclstop啟動(dòng)/停止過程可以查看/tmp/hacmp.out文件:#tail–f/tmp/hacmp.out檢查Cluster是否運(yùn)行正常Cluster進(jìn)程是否運(yùn)行:#lssrc–gcluster,至少兩個(gè)進(jìn)程,且為active。IP地址是否獲?。?netstat–i,看bootIP是否變?yōu)閟erviceip。VG是否varyon:#lsvg–o文件系統(tǒng)是否mount:#mount應(yīng)用進(jìn)程是否啟動(dòng):#ps–ef|grepapp_name常用操作HACMP的操作HACMP的操作常用操作HACMP的操作HACMP相關(guān)日志/usr/adm/cluster.log;以事件為單位的紀(jì)錄/tmp/hacmp.out;詳細(xì)記錄/usr/sbin/cluster/history/cluster.mmdd;
歷史紀(jì)錄常用操作HACMP的操作HACMP相關(guān)日志常用操作dump設(shè)置dump的有關(guān)設(shè)置估算系統(tǒng)dump的大小,在系統(tǒng)最繁忙時(shí)(內(nèi)存使用最多)#sysdumpdev-e0453-041Estimateddumpsizeinbytes:53477376#lsps-aPageSpacePhysicalVolumeVolumeGroupSize%UsedActivepaging00hdisk0rootvg480MB1yeshd6hdisk1rootvg544MB1yes當(dāng)前的設(shè)置#sysdumpdev-l primary/dev/hd6 <--dump的主設(shè)備secondary/dev/sysdumpnullcopydirectory/var/adm/ras <--dump拷貝的目錄forcedcopyflagTRUEalwaysallowdumpTRUEhd6應(yīng)比估算值稍大。常用操作dump設(shè)置dump的有關(guān)設(shè)置常用操作dump設(shè)置/var/adm/ras是默認(rèn)的dump拷貝目錄,比較估算值,保證/var文件系統(tǒng)有足夠的剩余空間拷貝dump文件。否則機(jī)器重起時(shí)會(huì)提示用戶插入磁帶。dump文件名為vmcore.#建立一個(gè)新的dump設(shè)備#smittylv例如:lv_name=dump_lv,type=sysdump#sysdumpdev–P–p/dev/dump_lv常用操作dump設(shè)置/var/adm/ras是默認(rèn)的故障處理故障處理故障處理故障的定義弄清楚系統(tǒng)發(fā)生了什么問題系統(tǒng)現(xiàn)在能做什么?不能做什么?故障什么時(shí)候發(fā)生的?有沒有做平時(shí)不同的操作?故障有沒有規(guī)律?定時(shí)還是不定時(shí)?發(fā)生的頻率有多高?是一臺(tái)機(jī)器出現(xiàn)故障還是多臺(tái)機(jī)器故障?故障現(xiàn)象是否相同?最近有沒有做改動(dòng)?如安裝了新的硬件、軟件,改變了系統(tǒng)的一些設(shè)置(如HACMP配置)等。故障處理故障的定義弄清楚系統(tǒng)發(fā)生了什么問題故障處理故障信息的收集收集故障信息對(duì)于判斷、診斷故障原因,修復(fù)系統(tǒng)非常重要。系統(tǒng)故障記錄(errorlog)errdemon進(jìn)程在系統(tǒng)啟動(dòng)時(shí)自動(dòng)運(yùn)行記錄包括硬件、軟件及其他操作信息故障記錄文件為/var/adm/ras/errlog,可備份下來或拷貝到別的機(jī)器上分析errpt命令的使用(普通用戶權(quán)限也可使用)故障處理故障信息的收集故障處理故障信息的收集控制面板上的LED代碼8位代碼,通常系統(tǒng)故障燈會(huì)同時(shí)亮起。某些機(jī)型還會(huì)同時(shí)顯示故障設(shè)備位置代碼。(注:S85正常啟動(dòng)過程中有合法的8位代碼。)4位代碼,通常是Exxx。3位代碼,通常為0yyy,只看后3位。8位和4位代碼可查看系統(tǒng)服務(wù)手冊(cè)(ServiceGuide)。3位代碼可查看系統(tǒng)診斷手冊(cè)(DiagnosticInformationforMultipleBusSystem)。故障處理故障信息的收集控制面板上的LED代碼故障處理故障信息的收集控制面板上的LED代碼查看DiagnosticInformationforMultipleBusSystems手冊(cè)故障處理故障信息的收集控制面板上的LED代碼故障處理故障信息的收集控制面板上的LED代碼(續(xù))閃動(dòng)的888,系統(tǒng)崩潰,硬件或軟件原因造成。按reset鍵會(huì)顯示更多內(nèi)容。888-102一般為軟件故障(888-102-207例外)系統(tǒng)會(huì)產(chǎn)生一個(gè)dump。888-102-xxx-0C9系統(tǒng)正在做dump,請(qǐng)等待。888-102-xxx-0C0系統(tǒng)dump完成,可關(guān)電重啟。888-103或105硬件故障,一般有SRN代碼及位置代碼。故障處理故障信息的收集控制面板上的LED代碼(續(xù))故障處理故障信息的收集SMS(SystemManagementService)故障記錄如何進(jìn)入SMS菜單當(dāng)主控臺(tái)出現(xiàn)鍵盤圖標(biāo)后(LED顯示E1F1時(shí))按F1鍵。字符終端按1鍵。(X80機(jī)型則無論是字符主控還是圖形主空臺(tái),一律按鍵盤左上角的1鍵)選擇"Utilities“,選擇"ErrorLog",抄下8位故障代碼在SMS中還可以更改系統(tǒng)啟動(dòng)順序表#mail系統(tǒng)會(huì)向root用戶發(fā)mail報(bào)告出錯(cuò)信息。通常系統(tǒng)出現(xiàn)故障后沒有進(jìn)行檢查修復(fù),系統(tǒng)會(huì)定時(shí)提醒root故障處理故障信息的收集SMS(SystemMana故障處理故障信息的收集其他用于收集系統(tǒng)信息的命令lsdev-C 系統(tǒng)設(shè)備信息#lsdev-Ccdiskhdisk0Available00-06-00-2,04.5GB16BitSCSIDiskDrivehdisk1Available00-06-00-1,04.5GB16BitSCSIDiskDrivehdisk2Defined 00-06-00-4,016BitSCSIDiskDrivelspv 查看物理卷信息#lspvhdisk00007821160af3d76rootvghdisk1000782117f571294rootvghdisk20000000045c45bdedatavglsvg 查看卷組信息故障處理故障信息的收集其他用于收集系統(tǒng)信息的命令故障處理故障信息的收集故障處理故障信息的收集故障處理故障信息的收集故障處理故障信息的收集故障處理故障信息的收集故障處理故障信息的收集故障處理系統(tǒng)不能啟動(dòng)系統(tǒng)不能正常啟動(dòng)可能由多種原因引起,硬件或軟件。觀察系統(tǒng)的啟動(dòng)過程。設(shè)備的故障燈是否亮起。異常的聲音,如硬盤的怪聲。注意LED上顯示的代碼,這是故障分析最重要的信息。主控臺(tái)上最后顯示的信息也很重要,必須記錄下來。alog-ot系統(tǒng)的啟動(dòng)順序故障處理系統(tǒng)不能啟動(dòng)系統(tǒng)不能正常啟動(dòng)可能由多種原因引起故障處理系統(tǒng)不能啟動(dòng)故障處理系統(tǒng)不能啟動(dòng)故障處理系統(tǒng)不能啟動(dòng)系統(tǒng)停在Stage1,可能為電源、系統(tǒng)板、CPU、內(nèi)存等硬件故障。記錄故障代碼通知IBM工程師。系統(tǒng)停在Stage2,可能是啟動(dòng)順序表(bootlist)損壞或I/O子系統(tǒng)故障??蓢L試進(jìn)入SMS菜單檢查啟動(dòng)順序表,并修改。 若在選擇bootlist時(shí)沒有硬盤設(shè)備可選或顯示的硬盤信息不正確則可能是硬盤故障。若根本沒有SCSI設(shè)備可選則鏈路有問題。系統(tǒng)停在Stage3,可能是硬盤數(shù)據(jù)損壞,系統(tǒng)設(shè)置文件出錯(cuò),或I/O子系統(tǒng)故障。故障處理系統(tǒng)不能啟動(dòng)系統(tǒng)停在Stage1,可能為電源故障處理系統(tǒng)停在551,555或557發(fā)生在系統(tǒng)啟動(dòng)的第三階段(Stage3),可能是:文件系統(tǒng)損壞文件系統(tǒng)日志(jfslog)損壞rootvg中有壞硬盤修復(fù)方法用系統(tǒng)光盤或系統(tǒng)備份帶啟動(dòng)(必須與硬盤中的操作系統(tǒng)版本一致)啟動(dòng)后選擇選項(xiàng)3"StartMaintenanceModeforSystemRecovery" >"AccessaRootVolumeGroup" >"Accessthisvolumegroupandstartashell beforemountingthefilesystems"故障處理系統(tǒng)停在551,555或557發(fā)生在系統(tǒng)啟動(dòng)的故障處理系統(tǒng)停在551,555或557格式化文件系統(tǒng)日志(jfslog)#/usr/sbin/logform/dev/hd8檢查修復(fù)文件系統(tǒng)#fsck-y/dev/hd1 (/home文件系統(tǒng))#fsck-y/dev/hd2 (/usr文件系統(tǒng))#fsck-y/dev/hd3 (/tmp文件系統(tǒng))#fsck-y/dev/hd4 (/文件系統(tǒng))#fsck-y/dev/hd9var (/var文件系統(tǒng))......用exit命令退出,文件系統(tǒng)會(huì)自動(dòng)mount起來。重建bootimage#lslv-mhd5 找出bootimage所在的硬盤,如hdisk0#bosboot-ad/dev/hdisk0#bootlist-mnormal/dev/hdisk0重建啟動(dòng)順序表。故障處理系統(tǒng)停在551,555或557格式化文件系統(tǒng)日故障處理系統(tǒng)停在551,555或557重啟動(dòng)系統(tǒng)#shutdown-Fr如上述步驟不奏效用系統(tǒng)備份帶恢復(fù)系統(tǒng)。如備份帶不能恢復(fù),用診斷光盤(DiagnosticCDROM)檢查是否壞硬盤。通知IBM工程師。故障處理系統(tǒng)停在551,555或557重啟動(dòng)系統(tǒng)故障處理主控臺(tái)不能登錄
字符終端有時(shí)會(huì)出現(xiàn)不能登錄的情形,可先嘗試關(guān)掉終端,重開。如果不行則可能是getty進(jìn)程運(yùn)行不正常。遠(yuǎn)程telnet登錄檢查"getty"進(jìn)程是否運(yùn)行正常#ps-ef|grepconsoleroot2917010Jul24lft00:00/usr/sbin/getty/dev/console如"getty"正常,查看主控臺(tái)端口是否正確#lscons 查看主控臺(tái)設(shè)備/dev/tty0#lsdev-C-ltty0 查看端口是否可用,連線是否正確tty0Available01-S1-00-00AsynchronousTerminal#lsattr-Eltty0 看端口參數(shù)是否正確,如波特率故障處理主控臺(tái)不能登錄字符終端有時(shí)故障處理主控臺(tái)不能登錄如"getty"沒有運(yùn)行在主控臺(tái)上,檢查/etc/inittab文件有否cons:0123456789:respawn:/etc/getty/dev/console更正后運(yùn)行"initQ"命令激活主控端口。如getty確實(shí)在運(yùn)行,則可能是終端的硬件問題。故障處理主控臺(tái)不能登錄如"getty"沒有運(yùn)行在主控臺(tái)故障處理CDE圖形界面掛死CDE運(yùn)行時(shí)不要更改網(wǎng)絡(luò)參數(shù)(如:主機(jī)名和IP地址)更改網(wǎng)卡設(shè)置,請(qǐng)先退出CDE圖形環(huán)境,選擇命令行方式登錄,在字符界面下更改。如CDE已經(jīng)掛死遠(yuǎn)程telnet登錄找出所有dt有關(guān)的進(jìn)程用kill命令殺掉#ps-ef|grepdt......#killPID檢查當(dāng)前主機(jī)名#hostname uname-atscf50故障處理CDE圖形界面掛死CDE運(yùn)行時(shí)不要更改網(wǎng)絡(luò)參故障處理CDE圖形界面掛死查看主機(jī)名是否對(duì)應(yīng)有效的IP地址#netstat-i|greptscf50 tr0*15009.185.40tscf5050604902824700更改主機(jī)名或IP地址,使主機(jī)名與當(dāng)前有效的IP地址存在對(duì)應(yīng)關(guān)系。#smittytcpip重新啟動(dòng)CDE界面#/etc/rc.dt HACMP環(huán)境下可把主機(jī)名alias到127.0.0.1上#cat/etc/hosts127.0.0.1loopbacklocalhosttscf50#loopback(lo0)name/addressbvg故障處理CDE圖形界面掛死查看主機(jī)名是否對(duì)應(yīng)有效的IP故障處理系統(tǒng)dump發(fā)生在系統(tǒng)崩潰時(shí),AIX會(huì)做dump(系統(tǒng)內(nèi)存的快照)。此時(shí)機(jī)器會(huì)顯示閃動(dòng)的888102xxx0cx代碼:0c9 系統(tǒng)dump進(jìn)行中。0c9狀態(tài)可能會(huì)維持超過2分鐘, 不要關(guān)電和按reset,等待dump做完。0c0 dump成功完成,這時(shí)可以斷電重起。0c2 手動(dòng)啟動(dòng)dump功能0c4 dump設(shè)備空間不足,只有部分信息保存下來0c5 不明原因?qū)е耫ump失敗mostlyhdiskorsysplanererror故障處理系統(tǒng)dump發(fā)生在系統(tǒng)崩潰時(shí),AIX會(huì)做dum故障處理系統(tǒng)dump一般dump是由于軟件出錯(cuò)引起(888-102-207除外),機(jī)器通??梢灾貑ⅰV貑r(shí)可能提示用戶插入磁帶拷貝dump文件,不要選擇退出,這樣會(huì)丟失重要的故障信息。故障處理系統(tǒng)dump一般dump是由于軟件出錯(cuò)引起(8故障處理系統(tǒng)dumpdump打包#snap-a-o/dev/rmt# 或#snap-a-c 把/tmp/ibmsupt目錄做成一個(gè)壓縮文件snap.tar.Z如果/tmp文件系統(tǒng)空間不夠,可用-ddirectory參數(shù)指定別的目錄代替/tmp/ibmsupt#smittydump故障處理系統(tǒng)dumpdump打包故障處理診斷程序(Diag)的使用運(yùn)行故障診斷程序(Diagnostic),對(duì)系統(tǒng)硬件進(jìn)行檢查和診斷。當(dāng)發(fā)現(xiàn)有硬件故障時(shí)應(yīng)立即使用diag#diag>選高級(jí)診斷(AdvanceDiagnostic)>選問題診斷(ProblemDetermination)或選系統(tǒng)檢查(SystemVerification)(選PD會(huì)對(duì)系統(tǒng)錯(cuò)誤記錄進(jìn)行分析)diag運(yùn)行后會(huì)給出SRN代碼,故障設(shè)備名稱及百分比,地址代碼等。對(duì)于PCI機(jī)型應(yīng)在系統(tǒng)報(bào)錯(cuò)7天之內(nèi)運(yùn)行diag程序?qū)Τ鲥e(cuò)記錄里的sense數(shù)據(jù)進(jìn)行分析。故障處理診斷程序(Diag)的使用運(yùn)行故障診斷程序(D故障處理診斷程序(Diag)的使用concurrent模式
多用戶模式下(系統(tǒng)正常運(yùn)行時(shí))運(yùn)行硬盤上的診斷程序。如果可能盡量使用該模式(但不要在應(yīng)用程序運(yùn)行時(shí)使用)。#diag 運(yùn)行該命令需要root權(quán)限Stand-alone模式
用硬盤上的診斷程序,在機(jī)器啟動(dòng)時(shí)鑰匙打到Service位置(MCA機(jī)型)或按F6/6(PCI機(jī)型)。系統(tǒng)啟動(dòng)后自動(dòng)運(yùn)行診斷程序。DiagnosticCDROM
用診斷光盤啟動(dòng),通常在硬盤無法啟動(dòng)時(shí)使用。故障處理診斷程序(Diag)的使用concurrent故障處理診斷程序(Diag)的使用故障處理診斷程序(Diag)的使用故障處理診斷程序(Diag)的使用故障處理診斷程序(Diag)的使用故障處理診斷程序(Diag)的使用定時(shí)的mail報(bào)錯(cuò)信息的處理每天定時(shí)收到mail報(bào)錯(cuò)信息,而所指的硬件確實(shí)是好的。這種情況經(jīng)常發(fā)生在系統(tǒng)意外掉電后,或更換設(shè)備后沒有運(yùn)行診斷程序。處理方法#diag選高級(jí)診斷(AdvancedDiagnosticsRoutines)選系統(tǒng)檢查(SystemVerfication)選mail里所指的設(shè)備,如果報(bào)電源、風(fēng)扇故障,選擇sysplanar0進(jìn)行檢查。如果硬件確實(shí)沒有問題,診斷程序會(huì)提示該設(shè)備曾經(jīng)有出錯(cuò)信息,問是否已更換或更正?選中該設(shè)備按F7確認(rèn)。退出診斷程序,如果還是繼續(xù)收到mail,通知IBM故障處理診斷程序(Diag)的使用定時(shí)的mail報(bào)錯(cuò)信故障處理診斷程序(Diag)的使用故障處理診斷程序(Diag)的使用故障處理診斷程序(Diag)的使用故障處理診斷程序(Diag)的使用IBM服務(wù)熱線IBM服務(wù)熱線演講完畢,謝謝觀看!演講完畢,謝謝觀看!RS6000系統(tǒng)日常管理培訓(xùn)內(nèi)容提要系統(tǒng)健康檢查常用操作故障的處理IBM服務(wù)熱線內(nèi)容提要系統(tǒng)健康檢查系統(tǒng)健康檢查系統(tǒng)健康檢查系統(tǒng)健康檢查
機(jī)房環(huán)境檢查電源線的母頭是否為左零右火電壓值是否為240V零地電壓是否小于1V溫度(攝氏℃)10℃-40℃濕度(%)8%-80%查看硬件情況檢查設(shè)備故障燈,一般為橙色并有標(biāo)志。有沒有異常聲響,如硬盤、風(fēng)扇等。有沒有破損的電纜等系統(tǒng)健康檢查
機(jī)房環(huán)境檢查系統(tǒng)健康檢查檢查文件系統(tǒng)查看有沒有“滿”的文件系統(tǒng)。文件系統(tǒng)滿可導(dǎo)致系統(tǒng)不能正常工作,尤其是AIX的基本文件系統(tǒng)。如/(根文件系統(tǒng))滿則會(huì)導(dǎo)致用戶不能登錄。#df-k (查看AIX的基本文件系統(tǒng))Filesystem1024-blocksFree%UsedIused%IusedMountedon/dev/hd424576145295%259922%//dev/hd26144002806896%2296715%/usr/dev/hd9var8192454045%64932%/var/dev/hd31679361579686%891%/tmp/dev/hd116384533268%140235%/home系統(tǒng)健康檢查檢查文件系統(tǒng)#df-k (查看AIX的基本系統(tǒng)健康檢查除/usr文件系統(tǒng),其他文件系統(tǒng)都不應(yīng)太滿,一般不超過80%。處理方法1:找出(刪除)垃圾文件#du-sk*|sort–rn|head查找出當(dāng)前目錄下占空間最大的子目錄,逐層往下直到找出占空間最大的文件。(要區(qū)分哪些目錄是文件系統(tǒng)的mountpoint,哪些是文件系統(tǒng)的子目錄)刪除文件,釋放空間。有時(shí)刪除文件后空間并不馬上釋放,這是由于你刪除的文件正被某個(gè)程序打開。只有當(dāng)這個(gè)程序停止后空間才釋放,有時(shí)甚至需要重起系統(tǒng)。系統(tǒng)健康檢查除/usr文件系統(tǒng),其他文件系統(tǒng)都不應(yīng)太滿,一般系統(tǒng)健康檢查處理方法2:增加文件系統(tǒng)大小#smittychjfs 文件系統(tǒng)可以在任何時(shí)候加大,前提是卷組(VG)中有剩余空間。檢查文件系統(tǒng)的完整性#umountfilesystem_name#fsckfilesystem_name#fsck-yfilesystem_name注意:文件系統(tǒng)必須先umount,再做檢查和修復(fù),否則可導(dǎo)致未知的后果。系統(tǒng)健康檢查處理方法2:增加文件系統(tǒng)大小系統(tǒng)健康檢查查看卷組信息lsvg-lvg_name有沒有"stale"狀態(tài)的邏輯卷。用syncvg命令修復(fù)。#smittysyncvgLVNAMETYPELPsPPsPVsLVSTATEMOUNTPOINThd5boot122closed/syncdN/Ahd6paging48962open/syncdN/Apaging00paging32642open/syncdN/Ahd8jfslog122open/syncdN/Ahd4jfs122open/syncd/hd2jfs32642open/syncd/usrhd9varjfs5102open/syncd/varhd3jfs482open/syncd/tmphd1jfs122open/syncd/home系統(tǒng)健康檢查查看卷組信息LVNAME系統(tǒng)健康檢查檢查內(nèi)存交換區(qū)(pagingspace)使用率#lsps-s使用率不要超過70%。增加交換區(qū),或增加內(nèi)存。觀察內(nèi)存大小的命令:lsattr–Elmem0#lsps-sTotalPagingSpacePercentUsed2048MB15%#lsps–aPageSpacePhysicalVolumeVolumeGroupSize%UsedActiveAutoTypehd6hdisk0rootvg2048MB15yesyeslv系統(tǒng)健康檢查檢查內(nèi)存交換區(qū)(pagingspace)使用率系統(tǒng)健康檢查網(wǎng)絡(luò)檢查netstat-i查看網(wǎng)卡狀態(tài)Ierrs/Ipkts和Oerrs/Opkts是否>1%pinghost_name/IPAddress查看是否通和是否有丟包。路由表#netstat-rn查看路由表是否正確,ping各路由器是否通。核對(duì)主機(jī)名#hostname系統(tǒng)健康檢查網(wǎng)絡(luò)檢查系統(tǒng)健康檢查#ifconfig-aen0:flags=4e080863<UP,BROADCAST,NOTRAILERS,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT,PSEG> inet172.40.10.31netmask0xffff0000broadcast172.40.255.255lo0:flags=e08084b<UP,BROADCAST,LOOPBACK,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT> inet127.0.0.1netmask0xff000000broadcast127.255.255.255 inet6::1/0#ifconfig用法ifconfigen0inet11.0.0.1upifconfigen0ns110:02.60.8c.2c.a4.98up(還有很多)系統(tǒng)健康檢查#ifconfig-aen0:flags=4系統(tǒng)健康檢查#lsattr–Elinet0authm65536AuthenticationMethodsTruehostnameqtsmsHostNameTruegatewayGatewayTrueroutenet,,0,172.40.10.1RouteTruebootup_optionnoSerialOpticalNetworkInterfaceTruerout6FDDINetworkInterfaceTrueroute屬性是否有相應(yīng)的路由信息。格式為:net,,0,172.16.23.81如果沒有缺省路由,執(zhí)行命令:#chdev–linet0–aroute=0,172.16.23.81其中172.16.23.81為網(wǎng)關(guān)如果缺省路由不正確,則先刪除路由,再增加缺省路由:#chdev–linet0–adelroute=net,,0,133.16.23.81#chdev–linet0–aroute=0,172.16.23.81系統(tǒng)健康檢查#lsattr–Elinet0系統(tǒng)健康檢查檢查dump設(shè)置#sysdumpdev–lprimary/dev/hd6secondary/dev/sysdumpnullcopydirectory/var/adm/rasforcedcopyflagTRUEalwaysallowdumpFALSEdumpcompressionOFF若不正確請(qǐng)用下列命令修改:#sysdumdev–P–p/dev/hd6–s/dev/sysdumpnull系統(tǒng)健康檢查檢查dump設(shè)置系統(tǒng)健康檢查系統(tǒng)故障記錄(errorlog)errdemon進(jìn)程在系統(tǒng)啟動(dòng)時(shí)自動(dòng)運(yùn)行記錄包括硬件、軟件及其他操作信息故障記錄文件為/var/adm/ras/errlog,可備份下來或拷貝到別的機(jī)器上分析errpt命令的使用(普通用戶權(quán)限也可使用)系統(tǒng)健康檢查系統(tǒng)故障記錄(errorlog)系統(tǒng)健康檢查系統(tǒng)健康檢查系統(tǒng)健康檢查系統(tǒng)健康檢查系統(tǒng)健康檢查系統(tǒng)健康檢查系統(tǒng)健康檢查發(fā)給root的mail信息#mail#mail–f;查看已經(jīng)存起來的郵件#Ctrl+d;存盤退出,存在/var/spool/Mail目錄下,每個(gè)用戶一個(gè)文件#mhmail;將郵件另存至/Mail/inbox目錄下,每個(gè)郵件一個(gè)文件
系統(tǒng)會(huì)定期將PD的結(jié)果以郵件形式發(fā)送給root,比errlog更詳細(xì)準(zhǔn)確。系統(tǒng)健康檢查發(fā)給root的mail信息系統(tǒng)健康檢查磁帶機(jī)磁帶機(jī)應(yīng)定期清潔,每使用30小時(shí)(8mm20GB為72小時(shí))或至少每月清潔一次,不要等故障燈亮起后再清潔。不同類型的帶機(jī)用要不同的清洗帶,不要混用。用"/usr/lpp/diagnostics/bin/utape-c-drmt0-n"可查看磁帶機(jī)使用時(shí)數(shù)。4mmDDS3磁帶機(jī)可讀寫DDS2,但對(duì)DDS1只能讀。8mm20GB磁帶機(jī)只能讀5GB和7GB磁帶,而且在讀過低密度磁帶后需要清洗,所以最好不要使用低密度磁帶。需要清洗時(shí)液晶板上有提示信息。系統(tǒng)健康檢查磁帶機(jī)系統(tǒng)健康檢查磁盤陣列狀態(tài)檢查(ssadisk)如果在errlog或mail中發(fā)現(xiàn)了ssa的報(bào)錯(cuò),則進(jìn)入smittyssaraid詳細(xì)觀察系統(tǒng)健康檢查磁盤陣列狀態(tài)檢查(ssadisk)系統(tǒng)健康檢查L(zhǎng)istingAllDefinedSSARAIDArraysCOMMANDSTATUSCommand:OKstdout:yesstderr:noBeforecommandcompletion,additionalinstructionsmayappearbelow.hdisk3095231779F0737Kgood3.4GRAID-5arrayhdisk409523173A02137Kgood3.4GRAID-5arrayF1=Help F2=Refresh F3=Cancel F6=Command F8=Image F9=ShellF10=Exit/=Find n=FindNext系統(tǒng)健康檢查L(zhǎng)istingAllDefinedSSA系統(tǒng)健康檢查L(zhǎng)istingorIdentifyingSSAPhysicalDiskDrives系統(tǒng)健康檢查L(zhǎng)istingorIdentifyingS系統(tǒng)健康檢查ssa在errlog中的報(bào)錯(cuò)形式OpenLink;不一定是故障ResourceUnavailable;Pdiskerror;Others.pdisk的狀態(tài)Good,FailedFree,System,ArrayCandidate,Hotspare,Rejectedssaraid的狀態(tài)Good,Exposed,Degraded,Rebuilding,Offline系統(tǒng)健康檢查ssa在errlog中的報(bào)錯(cuò)形式常用操作常用操作常用操作系統(tǒng)備份系統(tǒng)備份除每日進(jìn)行正常的用戶數(shù)據(jù)備份外,建議定期進(jìn)行系統(tǒng)備份。備份前先停止業(yè)務(wù)系統(tǒng)軟件和HACMP軟件的運(yùn)行。其他無關(guān)的用戶退出,停止無關(guān)的操作。系統(tǒng)備份只備份ROOTVG,除系統(tǒng)基本的5個(gè)文件系統(tǒng)外,其他ROOTVG上已mount上的文件系統(tǒng)也會(huì)被備份。用smittymksysb命令進(jìn)行系統(tǒng)備份,備份前先清掉root的密碼。每當(dāng)系統(tǒng)作變更(安裝新軟件、補(bǔ)丁程序等)前后,都需要做系統(tǒng)備份。常用操作系統(tǒng)備份系統(tǒng)備份常用操作系統(tǒng)備份
BackUptheSystemTypeorselectvaluesinentryfields.PressEnterAFTERmakingalldesiredchanges.[TOP][EntryFields]WARNING:Executionofthemksysbcommandwillresultinthelossofallmaterialpreviouslystoredontheselectedoutputmedium.Thiscommandbacksuponlyrootvgvolumegroup.*BackupDEVICEorFILE[/dev/rmt0]+/CreateMAPfiles?no+EXCLUDEfiles?no+Listfilesastheyarebackedup?no+Generatenew/image.datafile?yes+EXPAND/tmpifneeded?yes+Disablesoftwarepackingofbackup?no+[MORE...2]F1=HelpF2=RefreshF3=CancelF4=ListEsc+5=ResetEsc+6=CommandEsc+7=EditEsc+8=ImageEsc+9=ShellEsc+0=ExitEnter=Do常用操作系統(tǒng)備份常用操作系統(tǒng)備份檢查系統(tǒng)備份帶是否有效用備份帶啟動(dòng)機(jī)器,但不要進(jìn)行安裝,我們只是驗(yàn)證系統(tǒng)備份帶是否能用于啟動(dòng)。出現(xiàn)以下菜單后,關(guān)機(jī)即可。 WelcometoBaseOperatingSystem InstallationandMaintenanceTypethenumberofyourchoiceandpressEnter.>>> 1StartInstallationNowwithDefaultSettings 2Change/ShowInstallationSettingsandInstall 3StartMaintenanceModeforSystemRecovery88Help?99PreviousMenu常用操作系統(tǒng)備份檢查系統(tǒng)備份帶是否有效常用操作系統(tǒng)備份#smittylsmksysb ; 檢查系統(tǒng)備份帶的內(nèi)容。系統(tǒng)備份不是萬能的。備份最好有兩份。用戶數(shù)據(jù)備份文件系統(tǒng)可用tar命令,切記不要使用絕對(duì)路徑。數(shù)據(jù)庫可用數(shù)據(jù)庫的備份方式備。邏輯卷(LV)可用dd命令。smittysavevg用戶卷組備份只備份mount起的文件系統(tǒng)。注意:不備份邏輯卷(裸設(shè)備)。常用操作系統(tǒng)備份#smittylsmksysb ; 常用操作系統(tǒng)備份磁帶機(jī)卡帶子時(shí)可嘗試RESET磁帶機(jī)。按住磁帶機(jī)的彈出按鈕15~30秒,直到磁帶機(jī)液晶面板顯示RESET。磁帶RESET后磁帶應(yīng)能彈出。(此方法僅適用于8mm20GB磁帶機(jī))#diag-cdrmt0#tctl-f/dev/rmt0reset如果上述方法均不奏效,則只有重起機(jī)器。常用操作系統(tǒng)備份磁帶機(jī)卡帶子時(shí)可嘗試RESET磁帶機(jī)。常用操作鏡像鏡像(rootvg)lspv,lsvg–lrootvg,lsvgrootvg,lsvg–prootvg,lslv–mlv_name,lsvg–Mrootvgextendvg–frootvghdisk1chvg–ay–Qnrootvgmirrorvg–Srootvghdisk0hdisk1bosboot–a–l/dev/hd5–d/dev/hdisk1bootlist–mnormalhdisk0hdisk1syncvg–vrootvg常用操作鏡像鏡像(rootvg)常用操作鏡像拆鏡像(rootvg)lsvg–Mrootvg;檢查有效的pv,確認(rèn)hdisk1壞unmirrorvgrootvghdisk1bosboot–a–d/dev/hdisk0bootlist–mnormalhdisk0cd0mkboot–c–d/dev/hdisk1sysdumpdev–l;檢查dump所在的lv(缺省hd6)sysdumpdev–P–p/dev/hd6;reducevgrootvghdisk1rmdev–dlhdisk1shutdown-Fr常用操作鏡像拆鏡像(rootvg)常用操作HACMP的操作HACMP的操作 啟動(dòng):smittyclstart 停止:smittyclstop啟動(dòng)/停止過程可以查看/tmp/hacmp.out文件:#tail–f/tmp/hacmp.out檢查Cluster是否運(yùn)行正常Cluster進(jìn)程是否運(yùn)行:#lssrc–gcluster,至少兩個(gè)進(jìn)程,且為active。IP地址是否獲?。?netstat–i,看bootIP是否變?yōu)閟erviceip。VG是否varyon:#lsvg–o文件系統(tǒng)是否mount:#mount應(yīng)用進(jìn)程是否啟動(dòng):#ps–ef|grepapp_name常用操作HACMP的操作HACMP的操作常用操作HACMP的操作HACMP相關(guān)日志/usr/adm/cluster.log;以事件為單位的紀(jì)錄/tmp/hacmp.out;詳細(xì)記錄/usr/sbin/cluster/history/cluster.mmdd;
歷史紀(jì)錄常用操作HACMP的操作HACMP相關(guān)日志常用操作dump設(shè)置dump的有關(guān)設(shè)置估算系統(tǒng)dump的大小,在系統(tǒng)最繁忙時(shí)(內(nèi)存使用最多)#sysdumpdev-e0453-041Estimateddumpsizeinbytes:53477376#lsps-aPageSpacePhysicalVolumeVolumeGroupSize%UsedActivepaging00hdisk0rootvg480MB1yeshd6hdisk1rootvg544MB1yes當(dāng)前的設(shè)置#sysdumpdev-l primary/dev/hd6 <--dump的主設(shè)備secondary/dev/sysdumpnullcopydirectory/var/adm/ras <--dump拷貝的目錄forcedcopyflagTRUEalwaysallowdumpTRUEhd6應(yīng)比估算值稍大。常用操作dump設(shè)置dump的有關(guān)設(shè)置常用操作dump設(shè)置/var/adm/ras是默認(rèn)的dump拷貝目錄,比較估算值,保證/var文件系統(tǒng)有足夠的剩余空間拷貝dump文件。否則機(jī)器重起時(shí)會(huì)提示用戶插入磁帶。dump文件名為vmcore.#建立一個(gè)新的dump設(shè)備#smittylv例如:lv_name=dump_lv,type=sysdump#sysdumpdev–P–p/dev/dump_lv常用操作dump設(shè)置/var/adm/ras是默認(rèn)的故障處理故障處理故障處理故障的定義弄清楚系統(tǒng)發(fā)生了什么問題系統(tǒng)現(xiàn)在能做什么?不能做什么?故障什么時(shí)候發(fā)生的?有沒有做平時(shí)不同的操作?故障有沒有規(guī)律?定時(shí)還是不定時(shí)?發(fā)生的頻率有多高?是一臺(tái)機(jī)器出現(xiàn)故障還是多臺(tái)機(jī)器故障?故障現(xiàn)象是否相同?最近有沒有做改動(dòng)?如安裝了新的硬件、軟件,改變了系統(tǒng)的一些設(shè)置(如HACMP配置)等。故障處理故障的定義弄清楚系統(tǒng)發(fā)生了什么問題故障處理故障信息的收集收集故障信息對(duì)于判斷、診斷故障原因,修復(fù)系統(tǒng)非常重要。系統(tǒng)故障記錄(errorlog)errdemon進(jìn)程在系統(tǒng)啟動(dòng)時(shí)自動(dòng)運(yùn)行記錄包括硬件、軟件及其他操作信息故障記錄文件為/var/adm/ras/errlog,可備份下來或拷貝到別的機(jī)器上分析errpt命令的使用(普通用戶權(quán)限也可使用)故障處理故障信息的收集故障處理故障信息的收集控制面板上的LED代碼8位代碼,通常系統(tǒng)故障燈會(huì)同時(shí)亮起。某些機(jī)型還會(huì)同時(shí)顯示故障設(shè)備位置代碼。(注:S85正常啟動(dòng)過程中有合法的8位代碼。)4位代碼,通常是Exxx。3位代碼,通常為0yyy,只看后3位。8位和4位代碼可查看系統(tǒng)服務(wù)手冊(cè)(ServiceGuide)。3位代碼可查看系統(tǒng)診斷手冊(cè)(DiagnosticInformationforMultipleBusSystem)。故障處理故障信息的收集控制面板上的LED代碼故障處理故障信息的收集控制面板上的LED代碼查看DiagnosticInformationforMultipleBusSystems手冊(cè)故障處理故障信息的收集控制面板上的LED代碼故障處理故障信息的收集控制面板上的LED代碼(續(xù))閃動(dòng)的888,系統(tǒng)崩潰,硬件或軟件原因造成。按reset鍵會(huì)顯示更多內(nèi)容。888-102一般為軟件故障(888-102-207例外)系統(tǒng)會(huì)產(chǎn)生一個(gè)dump。888-102-xxx-0C9系統(tǒng)正在做dump,請(qǐng)等待。888-102-xxx-0C0系統(tǒng)dump完成,可關(guān)電重啟。888-103或105硬件故障,一般有SRN代碼及位置代碼。故障處理故障信息的收集控制面板上的LED代碼(續(xù))故障處理故障信息的收集SMS(SystemManagementService)故障記錄如何進(jìn)入SMS菜單當(dāng)主控臺(tái)出現(xiàn)鍵盤圖標(biāo)后(LED顯示E1F1時(shí))按F1鍵。字符終端按1鍵。(X80機(jī)型則無論是字符主控還是圖形主空臺(tái),一律按鍵盤左上角的1鍵)選擇"Utilities“,選擇"ErrorLog",抄下8位故障代碼在SMS中還可以更改系統(tǒng)啟動(dòng)順序表#mail系統(tǒng)會(huì)向root用戶發(fā)mail報(bào)告出錯(cuò)信息。通常系統(tǒng)出現(xiàn)故障后沒有進(jìn)行檢查修復(fù),系統(tǒng)會(huì)定時(shí)提醒root故障處理故障信息的收集SMS(SystemMana故障處理故障信息的收集其他用于收集系統(tǒng)信息的命令lsdev-C 系統(tǒng)設(shè)備信息#lsdev-Ccdiskhdisk0Available00-06-00-2,04.5GB16BitSCSIDiskDrivehdisk1Available00-06-00-1,04.5GB16BitSCSIDiskDrivehdisk2Defined 00-06-00-4,016BitSCSIDiskDrivelspv 查看物理卷信息#lspvhdisk00007821160af3d76rootvghdisk1000782117f571294rootvghdisk20000000045c45bdedatavglsvg 查看卷組信息故障處理故障信息的收集其他用于收集系統(tǒng)信息的命令故障處理故障信息的收集故障處理故障信息的收集故障處理故障信息的收集故障處理故障信息的收集故障處理故障信息的收集故障處理故障信息的收集故障處理系統(tǒng)不能啟動(dòng)系統(tǒng)不能正常啟動(dòng)可能由多種原因引起,硬件或軟件。觀察系統(tǒng)的啟動(dòng)過程。設(shè)備的故障燈是否亮起。異常的聲音,如硬盤的怪聲。注意LED上顯示的代碼,這是故障分析最重要的信息。主控臺(tái)上最后顯示的信息也很重要,必須記錄下來。alog-ot系統(tǒng)的啟動(dòng)順序故障處理系統(tǒng)不能啟動(dòng)系統(tǒng)不能正常啟
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度寵物用品銷售及養(yǎng)護(hù)服務(wù)外包協(xié)議4篇
- 2025年度廠房租賃合同配套基礎(chǔ)設(shè)施完善協(xié)議4篇
- 旅游部門半年回顧
- 專用借款協(xié)議:2024年版詳盡協(xié)議版A版
- 2025年度智能家居產(chǎn)品定制生產(chǎn)合同范本4篇
- 二零二四三方國際貿(mào)易融資借款協(xié)議2篇
- 2025年度拆除項(xiàng)目環(huán)保驗(yàn)收合同模板4篇
- 二手房交易代簽合同范本2024年版版
- 個(gè)性化服務(wù)型酒店房間租賃協(xié)議版A版
- 二零二五版船艇交易環(huán)保與安全協(xié)議3篇
- SH/T 3046-2024 石油化工立式圓筒形鋼制焊接儲(chǔ)罐設(shè)計(jì)規(guī)范(正式版)
- 2024年海口市選調(diào)生考試(行政職業(yè)能力測(cè)驗(yàn))綜合能力測(cè)試題及答案1套
- 六年級(jí)數(shù)學(xué)質(zhì)量分析及改進(jìn)措施
- 一年級(jí)下冊(cè)數(shù)學(xué)口算題卡打印
- 真人cs基于信號(hào)發(fā)射的激光武器設(shè)計(jì)
- 【閱讀提升】部編版語文五年級(jí)下冊(cè)第三單元閱讀要素解析 類文閱讀課外閱讀過關(guān)(含答案)
- 四年級(jí)上冊(cè)遞等式計(jì)算練習(xí)200題及答案
- 法院后勤部門述職報(bào)告
- 2024年國信證券招聘筆試參考題庫附帶答案詳解
- 道醫(yī)館可行性報(bào)告
- 仙家送錢表文-文字打印版
評(píng)論
0/150
提交評(píng)論