IBMP小型機(jī)日常維護(hù)手冊_第1頁
IBMP小型機(jī)日常維護(hù)手冊_第2頁
IBMP小型機(jī)日常維護(hù)手冊_第3頁
IBMP小型機(jī)日常維護(hù)手冊_第4頁
IBMP小型機(jī)日常維護(hù)手冊_第5頁
已閱讀5頁,還剩2頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、IBM P750小型機(jī)日常維護(hù)手冊一、 服務(wù)器硬件運(yùn)行狀態(tài)檢查1. 當(dāng)服務(wù)器處于啟動和正常工作狀態(tài)時(shí),其前面板上的狀態(tài)燈(與電源燈并排)和各硬盤的狀態(tài)燈(一排小燈,與各硬盤位置一一對應(yīng))應(yīng)顯示為綠色。2. 當(dāng)服務(wù)器的狀態(tài)燈出現(xiàn)橙黃色時(shí),說明有硬件告警,此時(shí)要檢查服務(wù)器的電源、接線、硬盤等。如果有硬件故障則需要立即進(jìn)行更換和更正,如果查不出具體問題,則需要聯(lián)系相關(guān)專家進(jìn)一步診斷。3. 當(dāng)硬盤工作正常時(shí),與各硬盤對應(yīng)的硬盤燈會呈綠色,如無讀寫,則綠燈一直亮,如該硬盤有讀寫操作,則綠燈會不規(guī)則閃爍,當(dāng)硬盤損壞時(shí),則硬盤狀態(tài)燈將熄滅,或者呈閃爍狀態(tài):以13秒的頻率有規(guī)律地、不停地閃爍。如果發(fā)現(xiàn)有服務(wù)器

2、硬件狀態(tài)燈不正常的情況,請及時(shí)聯(lián)系我公司工程師,以便及時(shí)進(jìn)行診斷并解決故障。二、 HMC(硬件管理平臺)管理與操作HMC的兩種訪問途徑:1、 在機(jī)房直接通過顯示器和鍵盤進(jìn)行管理維護(hù)等相關(guān)操作2、 通過web遠(yuǎn)程訪問,登錄HMC web管理界面,訪問地址為:https:/1、 登錄HMC1.1 瀏覽器訪問連接HMC后,首頁界面如下圖所示。1.2 點(diǎn)擊下圖所示鏈接,進(jìn)入HMC驗(yàn)證登錄界面。1.3 輸入用戶名與口令,登錄HMC。用戶名:hscroot口令:1.4 成功登錄到HMC管理界面如下圖所示。2、 注銷HMC在HMC console右上角有(hscroot | help | log off)鏈

3、接,單擊log off,會出現(xiàn)如下圖所示注銷界面:選擇Log off,系統(tǒng)返回到HMC初始登錄界面狀態(tài)。3、 重啟HMC左邊導(dǎo)航欄中選擇 à HMC Management à shut down or Restart,如下圖所示,對HMC進(jìn)行正常重啟及關(guān)機(jī)操作。請謹(jǐn)慎對HMC進(jìn)行關(guān)機(jī)和重啟操作!4、 狀態(tài)欄功能狀態(tài)欄位于HMC左下角位置,如下圖所示,負(fù)責(zé)監(jiān)控并反映管理系統(tǒng)資源狀態(tài)和HMC狀態(tài)。單擊每個圖標(biāo)狀態(tài)可以列出詳細(xì)狀態(tài),你可以查到更詳細(xì)的幫助信息:非法操作,如果任何被管理的主機(jī)執(zhí)行了非法操作,這個圖標(biāo)將會變亮。:黃燈警告, 如果任何被管理的主機(jī)有錯誤并有黃燈被點(diǎn)亮,這

4、個圖標(biāo)也將會變亮:報(bào)錯日志:日志中有報(bào)錯信息,這個圖標(biāo)將會變亮,此項(xiàng)與:摘要,摘要中會將有用信息做統(tǒng)計(jì)并顯示在工作欄中。5、 Service Management導(dǎo)航欄中Service Management強(qiáng)大的管理功能給用戶日常維護(hù)提供了更簡單直觀的界面,如下圖所示,但日平時(shí)最常用的子項(xiàng)是Manage Serviceable Events,如下圖步驟可以對HMC所管理的設(shè)備進(jìn)行日常錯誤及時(shí)直觀的觀察,以確保IBM小型機(jī)能正常工作,下圖就是基本的操作方法圖示:Service ManagementàManage Serviceable Events6、 Service Plans-分區(qū)

5、管理與操作6.1 如何查看小型機(jī)資源配置:如上圖紅色標(biāo)注所示,選中所需查看主機(jī)(備注:請不要同時(shí)選中多臺主機(jī)及多個分區(qū)),在下拉菜單中選中“Properties”,打開參數(shù)窗口,通過“Properties”可以查看主機(jī)運(yùn)行狀態(tài),CPU,內(nèi)存,I/0等重要硬件系統(tǒng)參數(shù),如下圖所示。同理,在分區(qū)區(qū)域中先中每分區(qū)后的Properties選項(xiàng),便可以直觀方便的掌握分區(qū)狀態(tài)和資源配置信息。6.2 如何開關(guān)機(jī)及激活分區(qū):關(guān)機(jī)。開機(jī)。Operation項(xiàng)中主要包含小型機(jī)及分區(qū)開關(guān)機(jī),及消除報(bào)警燈這兩項(xiàng)功能,如雖要對小型機(jī)下電操作,請先將圖15中的分區(qū)Deactivate(建議:最好在操作系統(tǒng)中按照正常流程將

6、操作系統(tǒng)shutdown),最后再將主機(jī)power off。注意:非特殊情況,無專業(yè)人員指導(dǎo),嚴(yán)禁進(jìn)行開關(guān)機(jī)操作!6.3 手動消除黃燈警告如下兩圖所示, Operations中LED status,及Deactivate Attention LED兩項(xiàng)中所指,針對不同分區(qū)或主機(jī)所報(bào)出的警告黃燈,進(jìn)行特定的消除黃燈操作。6.4 如何打開控制終端(Terminal Window)在HMC上對分區(qū)操作系統(tǒng)進(jìn)行操作,可以通過分區(qū)下拉菜單Console Window-àOpen Terminal Window對選中分區(qū)進(jìn)行操作,如圖所示,操作界面如同telnet界面。在HMC中同一分區(qū)只允許打

7、開一個Terminal Window,如試圖打開第二個窗口,系統(tǒng)提示如圖17所示界面。三、 AIX系統(tǒng)日常維護(hù)1、查看系統(tǒng)的錯誤記錄很重要,應(yīng)該定期查看,如發(fā)現(xiàn)有硬件(H)類型的報(bào)錯,應(yīng)該及時(shí)關(guān)注。在系統(tǒng)運(yùn)行時(shí),一些系統(tǒng)錯誤會記錄在errlog 中,其中有些錯誤還會在終端上顯示。檢查錯誤日志可用以下命令:#errpt | more查看系統(tǒng)所有的記錄IDENTIFIER TIMESTAM P T C RESOURCE_NAME DESCRIPTIONE85C5C4C 0426104399 P S CFGLFT SOFTWARE PROGRAM ERROR2BFA76F6 0426104099 T

8、 S SYSPROC SYSTEM SHUTDOWN BY USER9D4CF6E7 0426104399 T O errdemon ERROR LOGGING TURNED ON1E2AC07E 0426103999 T O errdemon ERROR LOGGING TURNED OFF1E5EER4T 0423132999 T O clstrmgr OPERATOR NOTIFICATION 其中IDENTIFIER 為錯誤編號,當(dāng)需要檢查詳細(xì)信息時(shí)常會用到。TIME STAMP 為時(shí)間標(biāo)簽,它記錄的是出錯時(shí)間,其格式:月月日日時(shí)時(shí)分分年年T 為Type , 它記錄的是錯誤類型P :為

9、永久錯誤,需引起注意T :為臨時(shí)錯誤。C 為Class, 它記錄的是錯誤種類,如H : HardwareS : SoftwareO : Errloger command messagesU : undeterminedRESOURCE_NAME 為錯誤來源DESCRIPTION 為錯誤描述#errpt -aj <IDENTIFIER>查看系統(tǒng)詳細(xì)記錄內(nèi)容其中IDENTIFIER為錯誤編號,如 #errpt -aj 0426104399#errpt -dH 查看系統(tǒng)所有的硬件出錯記錄2、日常檢查服務(wù)器狀態(tài)的項(xiàng)目及其相關(guān)命令2.1 運(yùn)行l(wèi)sdev 命令配以各種參數(shù),所列各種設(shè)備狀態(tài)都應(yīng)

10、為Available。#lsdev C H S a 列出系統(tǒng)中可用設(shè)備。#lsdev Cc processor列出系統(tǒng)中的所有CPU。#lsdev Cc memory列出系統(tǒng)中的所有內(nèi)存。#lsdev Cc disk列出系統(tǒng)中的所有硬盤。#lsdev -Cc adapter | grep ent列出系統(tǒng)中的所有網(wǎng)卡#lsdev -Cc adapter | grep scsi列出系統(tǒng)中的所有SCSI卡。#lsdev -Cc adapter | grep ssa列出系統(tǒng)中的所有SSA卡。2.2 lspv命令#lspv顯示系統(tǒng)中可用的PV。#lspv hdiskn顯示hdiskn的具體信息。#lsd

11、ev Cc pdisk 顯示磁盤陣列的硬盤的具體信息。2.3 lsattr命令# lsattr E l mem0列出系統(tǒng)中內(nèi)存mem0的大小,本項(xiàng)目中內(nèi)存有4GB。2.4 lsvg命令#lsvg列出系統(tǒng)中所有的vg。#lsvg rootvg列出rootvg的詳細(xì)信息。#lsvg o 列出激活的vg2.5 oslevel命令#oslevel顯示操作系統(tǒng)版本信息。2.6 netstat命令#netstat in顯示系統(tǒng)中各網(wǎng)卡的配置。可查看網(wǎng)卡的IP配置好了沒有。2.7 diag命令 通過運(yùn)行# diag 命令運(yùn)行硬件診斷程序檢測主機(jī)內(nèi)所有硬件,檢測結(jié)果為 “No trouble found ”顯

12、示各部分工作正常。2.8 lsps查看頁面空間lsps a 查看PAGING SPACE的使用情況,如果使用率超過70%,就需要采取措施。2.9 查看LV(卷)狀態(tài) lsvg o | lsvg il | grep i stale查看有無stale的lv,如果輸入該命令之后有輸出結(jié)果,就需要采取措施2.10 查看mail# mail,查看有否發(fā)給root用戶的錯誤報(bào)告(mail)。3、檢查文件系統(tǒng)查看有沒有“滿”的文件系統(tǒng)。文件系統(tǒng)滿可導(dǎo)致系統(tǒng)不能正常工作,尤其是AIX的基本文件系統(tǒng)。如/ (根文件系統(tǒng))滿則會導(dǎo)致用戶不能登錄。# df -k (查看AIX的基本文件系統(tǒng))Filesystem 1

13、024-blocks Free %Used Iused %Iused Mounted on/dev/hd4 24576 1452 95% 2599 22% /dev/hd2 614400 28068 96% 22967 15% /usr/dev/hd9var 8192 4540 45% 649 32% /var/dev/hd3 167936 157968 6% 89 1% /tmp/dev/hd1 16384 5332 68% 1402 35% /home除/usr文件系統(tǒng),其他文件系統(tǒng)都不應(yīng)太滿,一般不超過80%。4、性能監(jiān)控與調(diào)優(yōu)4.1 通過topas來觀察topas能夠?qū)⑾到y(tǒng)的全局信息,

14、包括CPU、內(nèi)存、磁盤、網(wǎng)絡(luò)、文件系統(tǒng)、事件隊(duì)列、文件等信息,排列在一個統(tǒng)一的界面上進(jìn)行展示。bash-4.3# topasTopas Monitor for host:localhost EVENTS/QUEUES FILE/TTYWed Feb 22 10:42:00 2017 Interval:2 Cswitch Readch Syscall WritechCPU User% Kern% Wait% Idle% Reads Rawin Writes Ttyout Forks IgetsNetwork BPS I-Pkts O-Pkts B-In B-Out Execs Namei Run

15、queue Dirblk WaitqueueDisk Busy% BPS TPS B-Read B-Writ MEMORY PAGING Real,MB Faults % CompFileSystem BPS TPS B-Read B-Writ Steals % Noncomp PgspIn % Client PgspOutName PID CPU% PgSp Owner PageIn PAGING SPACE PageOut Size,MB Sios % Used % Free NFS (calls/sec) SerV2 WPAR Activ CliV2 WPAR Total SerV3 P

16、ress: "h"-help CliV3 "q"-quit SerV44.2 通過命令vmstat 1 來觀察.kthr memory page faults cpu- - - - - r b avm fre re pi po fr sr cy in sy cs us sy id wa命令解析:vmstat 命令的輸出可以反映系統(tǒng)整體運(yùn)行狀況,包括cpu、內(nèi)存、虛擬頁面、系統(tǒng)進(jìn)程和系統(tǒng)調(diào)用情況。檢查CPU是否為瓶頸,分別檢查CPU的四項(xiàng)數(shù)值和kthr的兩項(xiàng)數(shù)值.檢查MEM是否為瓶頸,分別檢查Memory的兩項(xiàng)數(shù)值和Page 的六項(xiàng)數(shù)值.4.3 通過命令

17、sar mu P ALL 來觀察。命令解析: sar可以用來收集反映系統(tǒng)運(yùn)行狀況,在這里主要是查看CPU的運(yùn)行狀況,CPU是否負(fù)載均衡,是否存在分配不均的情況。4.4 通過命令ps gv | more來觀察。PID TTY STAT TIME PGIN SIZE RSS LIM TSIZ TRS %CPU %MEM COMMAND 0 - A 4:20 7 12 14516 xx 0 14504 0.0 5.0 swapper 1 - A 1:33 103 78952 79044 32768 25 36 0.0 29.0 /etc/init命令解析:ps可以用來查看進(jìn)程的當(dāng)前狀態(tài)。在這里通過參

18、數(shù)的配搭,可以觀察目前正在運(yùn)行的進(jìn)程所耗的時(shí)間,CPU和memory 量.其中,%CPU表示進(jìn)程所占用的CPU資源情況,%MEM表示進(jìn)程所占用的內(nèi)存情況。主要檢查是否有標(biāo)示為<defunc>的僵尸進(jìn)程耗用系統(tǒng)資源,以及informix 數(shù)據(jù)庫的oninit進(jìn)程的系統(tǒng)消耗情況。4.5 通過命令iostat 1 d hdiskX觀察磁盤在機(jī)器上用dd命令進(jìn)行磁盤陣列的寫操作校驗(yàn),與此同時(shí)用iostat 1 d hdiskX觀察磁盤。Disks: % tm_act Kbps tps Kb_read Kb_wrtn命令解析: iostat可以用來查看系統(tǒng)的 I/O的輸入輸出情況,在這里主要查看陣列上的硬盤的每秒讀

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論