IBMX系列服務(wù)器操作手冊v10教學(xué)資料_第1頁
IBMX系列服務(wù)器操作手冊v10教學(xué)資料_第2頁
IBMX系列服務(wù)器操作手冊v10教學(xué)資料_第3頁
IBMX系列服務(wù)器操作手冊v10教學(xué)資料_第4頁
IBMX系列服務(wù)器操作手冊v10教學(xué)資料_第5頁
已閱讀5頁,還剩49頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、Good is good, but better carries it.精益求精,善益求善。IBMX系列服務(wù)器操作手冊v10IBMX系列服務(wù)器操作手冊Ver.1.0藍(lán)色快車武漢二站肖涵2008/7/6目錄TOCo1-3hzuHYPERLINKl_Toc203134859規(guī)范及流程篇PAGEREF_Toc203134859h3HYPERLINKl_Toc203134860服務(wù)器技術(shù)篇PAGEREF_Toc203134860h3HYPERLINKl_Toc203134861一、X系列服務(wù)器簡介PAGEREF_Toc203134861h3HYPERLINKl_Toc203134862二、IBM陣列卡

2、PAGEREF_Toc203134862h4HYPERLINKl_Toc2031348631、分類PAGEREF_Toc203134863h4HYPERLINKl_Toc2031348642、配置RAID(以ServeRAID8i為例)PAGEREF_Toc203134864h6HYPERLINKl_Toc203134865三、收集日志PAGEREF_Toc203134865h9HYPERLINKl_Toc2031348661、DSA日志PAGEREF_Toc203134866h9HYPERLINKl_Toc2031348672.RAID日志PAGEREF_Toc203134867h12HYP

3、ERLINKl_Toc2031348683、BMC日志PAGEREF_Toc203134868h18HYPERLINKl_Toc203134869四、故障排除PAGEREF_Toc203134869h24HYPERLINKl_Toc2031348701.故障排除步驟及技巧PAGEREF_Toc203134870h24HYPERLINKl_Toc2031348712、DASD故障PAGEREF_Toc203134871h26HYPERLINKl_Toc203134872五、必備工具PAGEREF_Toc203134872h27規(guī)范及流程篇服務(wù)器工作流程請查看IBMXServer工程師服務(wù)工作手冊

4、,目前最新版本為ver1.4,該手冊會(huì)不定期更新,請及時(shí)通過服務(wù)站郵箱收取并學(xué)習(xí)。服務(wù)器技術(shù)篇一、X系列服務(wù)器簡介眾所周知,IBM的服務(wù)器產(chǎn)品線非常豐富齊全,從入門級到大型機(jī),一應(yīng)俱全。打開IBM的官方網(wǎng)站,IBM給我們帶來的第一印象就是擁有如此多的專業(yè)產(chǎn)品可供選擇。總體來看,IBM服務(wù)器家族目前共有4條產(chǎn)品線:基于Intel架構(gòu)的服務(wù)器x系列(xSeries,近日IBM已經(jīng)升級推出基于AMD皓龍?zhí)幚砥鞯?款新品)、中型企業(yè)級服務(wù)器i系列(iSeries)、UNIX服務(wù)器p系列(pSeries)和大型主機(jī)z系列(zSeries)。這四大系列基本都包括了從入門級到企業(yè)級的各種檔次的服務(wù)器產(chǎn)品,在

5、結(jié)構(gòu)上也全面包括了塔式、機(jī)架式、刀片和機(jī)柜式。IBMeServerxSeries系列服務(wù)器是IBM服務(wù)器品牌之一。eServerxSeries服務(wù)器得名于IBM工業(yè)標(biāo)準(zhǔn)服務(wù)器經(jīng)典的“X-架構(gòu)”,是eServer家族中支持開放工業(yè)標(biāo)準(zhǔn)的代表,它是由原來的Netfinity系列發(fā)展而來的。下面我們將用一組數(shù)據(jù)為標(biāo)題,來簡要描述IBMx系列的發(fā)展歷程:1)9年歷史IBM在1998年提出X系列服務(wù)器設(shè)想,到現(xiàn)在已經(jīng)有9年歷史。而使x系列真正意義上進(jìn)入到應(yīng)用領(lǐng)域,還是到了2001年之后。相比較IBM大型機(jī)的誕生時(shí)間,x系列所關(guān)注的目標(biāo)是面向中小企業(yè),因此要比面向金融行業(yè)的大型機(jī)稍晚一些。2)2億美元從x

6、1系列到x3共經(jīng)歷了5載歷程,耗資近2億美元。正是IBM看到中小企業(yè)蘊(yùn)含著無限商機(jī),因此不惜重金打造x系列。3)3代架構(gòu)IBMx系列共經(jīng)歷了3次架構(gòu)變革。早在2001年,IBM大型機(jī)事業(yè)部就歷時(shí)三年、耗資2000多萬美元開發(fā)出“SUMMIT”芯片組。第一代X-架構(gòu)的誕生,使得IBM芯片組為INTEL處理器賦予更強(qiáng)能力,工業(yè)標(biāo)準(zhǔn)服務(wù)器開始進(jìn)入企業(yè)關(guān)鍵應(yīng)用領(lǐng)域;以HURRICANE芯片組為核心的X3架構(gòu)同樣歷時(shí)三年,耗資高達(dá)1億美元。據(jù)分析數(shù)據(jù)顯示,X3架構(gòu)相比X2,其系統(tǒng)性能約有38%的提升。4)4地研發(fā)IBM在全球斥資成立4座xSeries研發(fā)中心。最近的一次是在2004年7月,IBM成立了“

7、xSeries臺(tái)灣研發(fā)中心”,研發(fā)中心初期人員達(dá)到80人,該中心定位為MissionLab,賦予其“end-to-end開發(fā)”使命,亦即從市場需求匯集、規(guī)格訂定、乃至于產(chǎn)品的最終出貨等所有流程。目前已經(jīng)研發(fā)出包括x206、x306及x226等3款服務(wù)器,相關(guān)投資金額業(yè)已累積達(dá)數(shù)千萬美元。另外3座研發(fā)中心位于美國的Raleigh、Austin與Kirkland。5)數(shù)年發(fā)布梳理IBM歷年的新品發(fā)布軌跡,我們發(fā)現(xiàn)IBM對于1、2路服務(wù)器新品推出的力度在逐年加大,無論從推出頻率還是新品數(shù)量來看,都使IBMx系列產(chǎn)品線日趨成熟,造就了今日非比尋常的產(chǎn)品線。2002年,IBM公司推出x232系列服務(wù)器的

8、升級產(chǎn)品x235,針對用戶不斷增長的商業(yè)需要而設(shè)計(jì);同年8月,IBM推出x200的升級產(chǎn)品面向小型企業(yè)的Pentium4單路服務(wù)器x205,具有熱插拔硬盤功能,更加易于使用及安裝。2003年2月,IBM宣布推出當(dāng)時(shí)全球最快的4路機(jī)架優(yōu)化式服務(wù)器x365和最薄的4路刀片服務(wù)器BladeCenterHS40;同年8月率先推出了基于AMD處理器的面向高性能運(yùn)算的系統(tǒng)。2004年,IBM再次推出x205換代產(chǎn)品x206塔式服務(wù)器和新一代機(jī)架優(yōu)化式服務(wù)器x306;同年9月,IBM在中國市場推出了8款基于英特爾新至強(qiáng)(Nocona)64位擴(kuò)展技術(shù)處理器的服務(wù)器新產(chǎn)品。這是IBMeServerx系列品牌誕生

9、以來規(guī)模最大的一次產(chǎn)品線更新,此次發(fā)布的新產(chǎn)品包括x206、x226、x236、x306、x336、x346以及IBMeServerBladeCenter刀片服務(wù)器。2005年,IBMx系列服務(wù)器在技術(shù)上不斷創(chuàng)新,推出了X3架構(gòu)系列產(chǎn)品,為基于下一代64位Intel至強(qiáng)處理器7000序列的x系列服務(wù)器,即入門級服務(wù)器x100、x206m、x306m產(chǎn)品系列。2006年5月,IBM正式發(fā)布了4款基于Intel全新Dempsey芯片的雙核服務(wù)器。8月份,IBM宣布擴(kuò)展其基于AMDOpteron處理器的服務(wù)器產(chǎn)品線,推出5款新品BladeCenterLS41、BladeCenterLS21、Syst

10、emx3755、Systemx3655和Systemx3455。6)一朝更名2006年5月,IBM宣布IBMeServerxSeries改名為IBMSystemx,后面的型號(hào)也全面更新,如原來的高性能服務(wù)器x260更名為x3800、x366更名為x3850、x460更名為x3950,其中x3代表這些系統(tǒng)是基于X3架構(gòu),倒數(shù)第三個(gè)數(shù)字代表功能,數(shù)字越大功能越強(qiáng);倒數(shù)第二個(gè)數(shù)字代表塔式(0)還是機(jī)架式(5);最后一個(gè)數(shù)字代表采用Intel(0)或AMD(5)的處理器。綜觀IBMeServer的Z、I、P與X這4個(gè)系列服務(wù)器產(chǎn)品線,x系列相對起步較晚,但xSeries成長率最近幾年尤為顯著。二、IB

11、M陣列卡1、分類目前IBM的陣列卡從控制的硬盤來說可以分成三大類:1.控制SCSI硬盤的SCSIRAID控制器:ServeRaid、ServeRaidII、ServeRaid3L、ServeRaid3H、ServeRaid4L、ServeRaid4Lx、ServeRaid4M、ServeRaid4Mx、ServeRaid4H、ServeRaid5i、ServeRaid6M、ServeRaid6i/6i+、ServeRaid7e、ServeRaid7k;2.控制SATA硬盤的SATARAID控制器:ServeRaid7e、ServeRaid7t;3.控制SAS硬盤以及熱插拔SATA硬盤的SASR

12、AID控制器:ServeRaid8e、ServeRaid8i、ServeRaid8k、ServeRaid8k-l;按照是集成的陣列卡或者是選件來分:1.主板集成陣列卡:ServerRaid7e,ServerRaid8e2.選件陣列卡:ServerRaid7k、ServerRaid7t、ServerRaid8i、ServerRaid8k,ServerRaid8k-l下面會(huì)詳細(xì)介紹幾款新的Raid卡:ServeRaid7e:集成的SCSIRAID控制器,可以支持Raid1、0和Raid10支持的機(jī)型有:xSeries206、226、236、306、346ServeRaid7t(part71P864

13、8):選件的SATARaid卡,支持SATA硬盤,可以最多連接4塊SATA硬盤作陣列;Cache:128MB支持陣列級別:Raid0、1、5、10;支持機(jī)型:xSeries206、206m、226、306、306m、336、326、326mServeRaid7k(part71P8642):選件SCSIRaid卡,支持SCSI硬盤;Cache:128MB支持的陣列級別:Raid0、1、5、1E、5EE、00、10、1E0、50;支持的機(jī)型:xSeries236、346ServeRaid8e:集成的SASRAID控制器,支持SAS/SATAHot-Swap的硬盤,可以支持Raid0和1;支持的機(jī)型

14、:xSeries206m、306mServerRaid8i(part13N2227和part39R8729):選件SASRAID控制器,支持SAS/SATA硬盤;Cache:256MB支持陣列級別:Raid0、1、5、5EE、6、00、10、1E0、50、60支持的機(jī)型:xSeries206m、306m、260、366、460Systemx3800、3850、3950/3950EServeRaid8k-l(part25r8025):選件SASRAID控制器,支持SAS/SATA硬盤;Cache:32MB支持陣列級別:Raid0、1、10支持機(jī)型:Systemx3400、3550、3650Ser

15、veRaid8k(part25r8064):選件SASRAID控制器,支持SAS/SATA硬盤;Cache:256MB支持陣列級別:Raid0、1、1E、10、5、6支持機(jī)型:Systemx3400、3500、3550、36502、配置RAID(以ServeRAID8i為例)使用ServeRaidManager配置啟動(dòng)服務(wù)器,插入IBMServeRAIDSupportCD(或者包括ServeRAIDManager程序的CD)到光驅(qū)中,如果ServeRAIDManager程序發(fā)現(xiàn)未配置的控制器和ready的硬盤,程序會(huì)自動(dòng)啟動(dòng)配置向?qū)缦聢D:配置向?qū)峁┝藘蓚€(gè)配置選項(xiàng):定制(Custom)和快速

16、(Express)??焖倥渲脮?huì)自動(dòng)配置陣列卡,也可以通過Express手動(dòng)配置。如果要使用RAID1E,RAID5EE,RAID6,或RAIDx0,必需使用定制配置。使用定制配置(Customconfiguration):1)在ServeRAIDManager樹,點(diǎn)擊要設(shè)置的ServeRAID控制器(controller)2)在工具欄,點(diǎn)擊Create3)點(diǎn)擊Customconfiguration.4)點(diǎn)擊Next打開創(chuàng)建邏輯驅(qū)動(dòng)器窗口。5)選擇一個(gè)陣列級別,可以從上面的列表中選擇或者通過展開高級設(shè)置菜單,從中選擇。注意:如果要?jiǎng)?chuàng)建RAID卷,必須先創(chuàng)建獨(dú)立的驅(qū)動(dòng)器,然后再運(yùn)行配置向?qū)?chuàng)建RA

17、ID卷。冗余的邏輯驅(qū)動(dòng)器同步必須完成。在同步前,可以被創(chuàng)建RAID卷。6)點(diǎn)擊下一步打開配置邏輯驅(qū)動(dòng)器窗口。7)選擇邏輯驅(qū)動(dòng)器中需要加入的物理驅(qū)動(dòng)器,并且修改高級屬性。注意:A一些操作系統(tǒng)有邏輯驅(qū)動(dòng)器大小的限制。保存配置前,核實(shí)邏輯驅(qū)動(dòng)器容量適合要安裝的操作系統(tǒng)。B一個(gè)邏輯驅(qū)動(dòng)器不能超過2048GB;最大容量是nMB,這里n是邏輯驅(qū)動(dòng)器中的物理驅(qū)動(dòng)器個(gè)數(shù)。C典型的,啟動(dòng)時(shí)系統(tǒng)BIOS第一個(gè)檢測到的陣列卡上面定義的第一個(gè)邏輯驅(qū)動(dòng)器是啟動(dòng)驅(qū)動(dòng)器。8)點(diǎn)擊Next。配置摘要窗口打開:9)瀏覽配置摘要窗口顯示的信息。要改變配置,點(diǎn)擊Back10)點(diǎn)擊Apply;然后,當(dāng)提問是否應(yīng)用新的配置時(shí),點(diǎn)擊Ye

18、s。配置信息則保存到陣列卡和物理硬盤。11)如果不要改變設(shè)置,從ServeRAIDManager程序退出,從光驅(qū)中移除CD。12)重啟服務(wù)器。使用ARC配置ARC是內(nèi)嵌的BIOS的程序,您可以通過它配置ServeRAID-8k-l/8k/8iSAS控制器.其包括:ArrayConfigurationUtility(ACU)-創(chuàng)建,配置,管理邏輯驅(qū)動(dòng)器.也可以對驅(qū)動(dòng)器進(jìn)行初始化及重新掃描.SerialSelect-改變設(shè)備及控制器的設(shè)置DiskUtilities格式化或校驗(yàn)媒體設(shè)備開機(jī)自檢過程中有Ctrl+A提示:按下組合鍵Ctrl+A進(jìn)入配置程序。具體使用方法見三、收集日志在服務(wù)器維修中,CA

19、G會(huì)要求收集各方面的日志來判斷機(jī)器故障,需要收集的日志一般有DSA、RAID、BMC1、DSA日志(1)概述“IBM動(dòng)態(tài)系統(tǒng)分析”(IBMDynamicSystemAnalysis)收集并分析系統(tǒng)信息,從而為診斷系統(tǒng)問題提供輔助。DSA收集以下方面的系統(tǒng)信息:系統(tǒng)配置已安裝的應(yīng)用程序和最新的修訂包設(shè)備驅(qū)動(dòng)程序和系統(tǒng)服務(wù)網(wǎng)絡(luò)接口和設(shè)置性能數(shù)據(jù)和有關(guān)正在運(yùn)行的進(jìn)程的詳細(xì)信息包括PCI信息在內(nèi)的硬件清單重要的產(chǎn)品數(shù)據(jù)和固件信息SCSI設(shè)備檢測數(shù)據(jù)ServeRAID配置應(yīng)用程序、系統(tǒng)、安全性、ServeRAID以及服務(wù)處理器系統(tǒng)事件日志此外,DSA會(huì)創(chuàng)建一份合并的日志,使用戶能從系統(tǒng)的不同日志來源中確

20、定問題的前因后果。DSA也會(huì)將系統(tǒng)上的設(shè)備驅(qū)動(dòng)程序和固件與UpdateXpressCD上的版本進(jìn)行比較,以生成一份差異匯總報(bào)告。版本介紹:DSA有三個(gè)版本,一個(gè)版本是WindowsPortableEdition(可移植版),一個(gè)版本是WindowsInstallableEdition(安裝版),第三個(gè)版是Bootable(啟動(dòng)版)“DSA可移植版”在受支持的系統(tǒng)上通過命令提示符運(yùn)行,無需修改任何系統(tǒng)文件或系統(tǒng)設(shè)置。它在目標(biāo)系統(tǒng)的臨時(shí)空間中運(yùn)行,并會(huì)在執(zhí)行完成后刪除所有的臨時(shí)文件。可移植版的設(shè)計(jì)和打包方式?jīng)Q定了它只需臨時(shí)使用系統(tǒng)資源,就能夠在對資源使用敏感的客戶環(huán)境中收集系統(tǒng)信息。“DSA可安裝

21、版”會(huì)在系統(tǒng)上永久安裝DSA。這個(gè)版本使用與“可移植版”相似的命令提示符界面。利用“DSA可安裝版”,您還可以使用UpdateXpress比較分析功能?!癉SA啟動(dòng)版”當(dāng)機(jī)器無系統(tǒng)時(shí),可以用該啟動(dòng)版啟動(dòng)來收集DSA信息。優(yōu)點(diǎn):使數(shù)據(jù)收集自動(dòng)化并對基本數(shù)據(jù)進(jìn)行組織和分析有助于減少問題確定時(shí)間,從而減少了宕機(jī)時(shí)間使數(shù)據(jù)收集以及向IBMService提供系統(tǒng)信息的過程自動(dòng)化根據(jù)UpdateXpress輸入提供集成的分析,以便能快速識(shí)別低版本的固件和驅(qū)動(dòng)程序(2)使用方法目前DSAWindows最新的版本為v2.10版,下載地址:PortableEdition:HYPERLINK/systems/su

22、pport/supportsite.wss/docdisplay?lndocid=MIGR-5075327&brandind=5000008/systems/support/supportsite.wss/docdisplay?lndocid=MIGR-5075327&brandind=5000008InstallableEdition:HYPERLINK/systems/support/supportsite.wss/docdisplay?lndocid=MIGR-5075325&brandind=5000008/systems/support/supportsite.wss/docdisp

23、lay?lndocid=MIGR-5075325&brandind=5000008BootableEdition(最新v2.02版):HYPERLINK/systems/support/supportsite.wss/docdisplay?lndocid=MIGR-5071800&brandind=5000008/systems/support/supportsite.wss/docdisplay?lndocid=MIGR-5071800&brandind=5000008PortableEdition直接在windows系統(tǒng)下運(yùn)行ibm_utl_dsa_211p_windows_i386.ex

24、e默認(rèn)保存在C:IBM_Support機(jī)器型號(hào)_20080325-140608下,運(yùn)行index.html即可看到DSA的內(nèi)容。InstallableEdition運(yùn)行程序,它會(huì)自動(dòng)安裝到系統(tǒng)中,在開始菜單中運(yùn)行das即可C、BootableEdition在以上地址下載iso鏡像文件,刻成光盤后啟動(dòng)機(jī)器,啟動(dòng)后包含如下提示:view-ViewDSAresults.copy-CopyDSAresultstoremovablemedia.ftp-FTPDSA.exit-Quitprogram.help-Displaythishelpmessage.Commanddetail:oview-Displ

25、aysthecollecteddataonthelocalconsoleinatextviewer.Note:Toexitviewer,type:xthenpressenter.ocopy-Thiscommandpresentstheavailableremovablemediadevices,eg.USBKey,forstoringtheDSAcollecteddata.oftp-TransfersthecollectedcompressedXMLdatafiletoIBMService.oexit-ExitstheDSABootableEditionmenu,ejectstheBootab

26、leEditionmedia,andrebootsthemachine.執(zhí)行view可以查看機(jī)器DSA信息,執(zhí)行copy,同時(shí)在機(jī)器上插入一個(gè)usb存儲(chǔ)設(shè)備,即可將DSA保存下來。2.RAID日志RAID日志主要通過ServeRAIDManager來收集ServeRAIDManager可以通過ServeRAIDSupportCD啟動(dòng)機(jī)器來運(yùn)行,也可以通過ServeRAIDApplicationCD安裝到Windows系統(tǒng)中來運(yùn)行。進(jìn)入ServeRAIDManager在左邊的localhost(localsystem)處點(diǎn)擊右鍵,選擇saveprintableconfiguration(保存ra

27、id配置信息),默認(rèn)保存文件名為raidcfg.log。對于Xserise機(jī)型,配有軟驅(qū),此文件就默認(rèn)存入A盤(所以要準(zhǔn)備好軟盤或者雙啟動(dòng)U盤);對于SystemX機(jī)器,標(biāo)配無軟驅(qū),所以插入任何usb存儲(chǔ)設(shè)備都可將此文件保存。如選擇savesupportarchive,保存是raid運(yùn)行日志,如果有任何errors,都可以通過此文件判斷出。該文件會(huì)自動(dòng)保存為一個(gè)zip文件,打開該zip文件后,其中有個(gè)controllerlog.txt文件對于7系列以前的卡(包括7系列),controllerlog.txt文件如下:說明:上表反應(yīng)了SCSI總線上每個(gè)SCSI設(shè)備的運(yùn)行異常情況統(tǒng)計(jì):Parity:

28、該項(xiàng)對應(yīng)的是數(shù)據(jù)在SCSI總線傳輸時(shí)奇偶校驗(yàn)錯(cuò)誤數(shù),如果計(jì)數(shù)大于10則反應(yīng)了SCSI線纜的錯(cuò)誤;Soft:該項(xiàng)對應(yīng)的是數(shù)據(jù)在讀寫過程中的軟錯(cuò)誤,如果計(jì)數(shù)大于10則反應(yīng)了盤體本身的錯(cuò)誤;如果計(jì)數(shù)小于10,可以認(rèn)為是在受的干擾或電流沖擊下的個(gè)別現(xiàn)象,可以忽略不計(jì);Hard:該項(xiàng)對應(yīng)的是數(shù)據(jù)在讀寫過程中的硬錯(cuò)誤,如果計(jì)數(shù)大于10則反應(yīng)了陣列卡本身的錯(cuò)誤;PFA:該項(xiàng)對應(yīng)的是預(yù)失效分析的報(bào)錯(cuò),如果是YES則需要更換相對應(yīng)的硬盤;MISC:該項(xiàng)對應(yīng)的是其他方面的報(bào)錯(cuò),如果計(jì)數(shù)大于10則反應(yīng)了陣列卡的DeviceDriver或Firwmare/BIOS等方面造成的錯(cuò)誤,需要相應(yīng)的軟件升級;如果為8系列的卡

29、,此文件內(nèi)容如下:Parityerrors:反映了SCSI線纜的錯(cuò)誤;Linkerrors:反映了硬盤背板錯(cuò)誤;HWerrors:反映了陣列卡錯(cuò)誤;Mediumerrors:反映了硬盤自身的故障;校驗(yàn)磁盤此外,有些硬盤故障為隱形,所以需要通過校驗(yàn)硬盤來檢測出問題,此時(shí)找到該磁盤,點(diǎn)右鍵,選擇Identifyphysicaldrive系統(tǒng)會(huì)自動(dòng)校驗(yàn)該磁盤,硬盤綠燈會(huì)閃爍,直到校驗(yàn)完畢后才會(huì)熄滅。當(dāng)硬盤有故障時(shí),此硬盤會(huì)亮黃燈,并出現(xiàn)感嘆號(hào),右鍵選擇“Properties”,在status頁面的PFAerror狀態(tài)為YES,表示硬盤自身有故障,需要更換硬盤。3、BMC日志BMC(Baseboard

30、managementcontroller)保存了系統(tǒng)板及附屬設(shè)備的運(yùn)行狀況,通過該日志可以查看到部件運(yùn)行狀況。A、更新BMCfirmware更新到最新的BMCfirmware可以避免出現(xiàn)問題。注意:更新BMC的firmware不會(huì)改變user設(shè)置。步驟如下:1、從/systems/support/supportsite.wss/docdisplay?lndocid=MIGR-4JTS2T&brandind=5000008,對應(yīng)機(jī)型下載最新的firmware。2.BMCfirmware更新多是啟動(dòng)軟盤的形式,(一個(gè)EXE文件),也可以是一個(gè)ISOimage,可刻成CD。3.插入更新盤,啟動(dòng)服務(wù)器

31、。4.BMCfirmware更新自動(dòng)執(zhí)行。5.更新BMCfirmware后,可以用更新盤來配置BMC。6.配置BMC后,取走更新盤,重啟服務(wù)器。B、配置BMC方法一:用BMC_CFG配置BMC(部分服務(wù)器由于BMC軟盤里沒有BMC_CFG文件,所以用lancfg)1用firmware更新盤中的bmc_cfg.exe配置工具。Bmc_cfg主要是一個(gè)排錯(cuò)工具,也可以用來查看和修改BMC配置。存在于更新盤中,不能作為獨(dú)立的工具使用可配置如下設(shè)置,以實(shí)現(xiàn)BMC的通信:IPAddress,Subnetmask,Defaultgateway,Alertnotification和alertdestinat

32、ionsettings。建議ip:7Subnetmask:建議更改默認(rèn)的userID和password(賬號(hào)USERID密碼PASSWORD)。要運(yùn)行bmc_cfg:1.如果剛更新完BMC的firmware,退出更新工具,回到DOS提示符。如果沒有,則用更新盤啟動(dòng)服務(wù)器,當(dāng)問是否更新時(shí),選No。2.在DOS提示符,運(yùn)行bmc_cfg。如下圖開始可以用lancfg(LANConfiguration)工具來配置BMC。一旦設(shè)置好網(wǎng)絡(luò)后,就可以用IBMDirector來配置userID,password,和alert-forwarding特性。方法二:用lancfg配置BMC可以用lancfg工具,

33、來做所有的配置。此工具在用于升級BMCfirmware的軟盤或者CD中。注意:只能從升級BMCfirmware的軟盤或者CD中運(yùn)行l(wèi)ancfg.exe,不要在Windows的DOS窗口中運(yùn)行。1.在BMCfirmware升級成功后,顯示一個(gè)提示符,運(yùn)行l(wèi)ancfg。2.按F10和方向鍵,選擇窗口頂部的菜單。3.選擇LanCfg,則屏幕顯示如下圖2-24.按Tab編輯,并選OK。HostIPaddressSubnetmaskRouterIPaddress建議ip:7Subnetmask:建議更改默認(rèn)的userID和password(賬號(hào)USERID密碼PASSWORD)。注意:HostMACAd

34、dress不能更改。方法三:在BIOS中配置BMCBIOS中可以配置如下設(shè)置:IPaddress,Subnetmask,Defaultgateway。如果想修改默認(rèn)的userID和password,則要用bmc_cfg或者IBMDirector。按如下步驟用Bios配置BMC:1.服務(wù)器啟動(dòng)時(shí)按F1,進(jìn)入ConfigurationandSetuputility。2.選AdvancedSetup。3.選BaseboardManagementController(BMC)Settings,如下圖4.選BMCNetworkConfiguration,如下圖。5.輸入IPaddress,subnetm

35、ask,和gatewayaddresses,再選SaveNetworkSettingsinBMC。建議ip:7Subnetmask:建議更改默認(rèn)的userID和password(賬號(hào)USERID密碼PASSWORD)。注:一些故障機(jī)器可能已無法開機(jī),同時(shí)也從未配置過BMCip,此時(shí)可以使用,連接。C、收集BMC日志方法一:用SmBridge收取用反線將筆記本與服務(wù)器上BMC控制口(第一個(gè)網(wǎng)口,只要服務(wù)器有交流輸入不必開機(jī))連接SmBridge()Downloadsite:/systems/support/supportsite.wss/docdisplay?lndocid=MIGR-64636

36、&brandind=5000008在命令行界面下,進(jìn)入SmBridge軟件安裝后所在的目錄,執(zhí)行smbridge-ip7-uUSERID-pPASSW0RDselgetbmclog.txt方法二:用SvcCon收取SvccondownloadsiteHYPERLINK/support/docview.wss?uid=psg1MIGR-63877/support/docview.wss?uid=psg1MIGR-63877用反線將筆記本與服務(wù)器上BMC控制口(第一個(gè)網(wǎng)口,只要服務(wù)器有交流輸入不必開機(jī))連接在筆記本上運(yùn)行SvcCon點(diǎn)logon登陸后,點(diǎn)DumpSEL抓日志,或者點(diǎn)ClearSEL

37、清日志方法三:F2收取啟動(dòng)ServerF2里可以用軟盤收取BMC日志,HardwareInfo-BMCLog將導(dǎo)出的bmclog按要求發(fā)給CAG。注意,并不是所有X系列服務(wù)器都有BMC功能,具體請查閱ServeHMM。另外,X3650T機(jī)型,收取BMC不能使用上述方法,此機(jī)器需要按以下方法收集BMC。X3650T抓取SELlog指導(dǎo)首先找出隨機(jī)附帶的DocumentationandResourceCD(必須而可以找客戶索?。┓湃霗C(jī)器的光驅(qū)內(nèi),啟動(dòng)機(jī)器,確認(rèn)機(jī)器的第一啟動(dòng)是光驅(qū)。開機(jī)后機(jī)器自動(dòng)引導(dǎo)光盤進(jìn)入下面界面,點(diǎn)擊continue選擇RunSELViewerUtility,然后點(diǎn)擊conti

38、nue。點(diǎn)擊File在子菜單中選擇SaveAside在彈出的窗口中輸入要保存的文件名。然后按TAB鍵將光標(biāo)切換到A盤,按回車保存(在機(jī)器沒有接任何外置USB設(shè)備時(shí)A盤默認(rèn)為62M閃存盤)。正在保存日志。大約5秒后彈出的窗口自動(dòng)關(guān)閉,保存日志完成。清除SELLog,點(diǎn)擊選項(xiàng)卡中的SEL,在彈出的子菜單中選中ClearSEL。在彈出的確認(rèn)窗口中選中OK。日志清理完畢,退出重啟機(jī)器.四、故障排除1.故障排除步驟及技巧1.1準(zhǔn)確描述問題信息獲得途徑:使用者、代理商、了解情況的人、目的:獲得第一手資料有效溝通方式有效傾聽做記錄,不要打岔等有效發(fā)問,Questioningisakeyskill思路清晰,針

39、對不同類型用戶問不同類型問題可以通過規(guī)范表格,收集有效信息故障情況客戶通過什么信息認(rèn)為有問題從正常狀況到故障狀況,做了什么操作,軟件和硬件的變化有沒有規(guī)律(了解什么時(shí)間發(fā)生,發(fā)生什么問題,發(fā)生后做過什么操作)分析信息有效組織信息確定問題給客戶描述問題目的:確認(rèn)雙方對問題理解的準(zhǔn)確性、一致性1.2收集信息故障設(shè)備信息了解產(chǎn)品類別POSTbeepcode,POSTerrorcodeCheckPoint顯示代碼故障狀態(tài)下屏幕信息LPD,及系統(tǒng)其它部件故障燈狀態(tài)收集各種可獲得的日志軟件和硬件的信息(DSA)1.3分析問題分析問題過程中,確定問題是否屬于支持范圍之內(nèi)明確我們能做到什么,做不到的可以給用戶

40、什么建議如果不屬于服務(wù)范圍,要恰到好處”SayNo”具體分析問題確認(rèn)服務(wù)器的用電環(huán)境(輸入電壓200V-240V,零點(diǎn)電壓0-3.3V)確認(rèn)硬件配置合法性確認(rèn)NOS兼容性分析日志維修記錄查閱Retain和GCGTipsDB,是否屬于已知問題硬件維護(hù)手冊是否有相關(guān)幫助信息PMR是否已經(jīng)有相關(guān)問題的報(bào)告查閱第三方KnowledgeBase,是否屬于已知問題1.4現(xiàn)場操作步驟步驟收集當(dāng)前故障狀態(tài)下日志,如果有報(bào)錯(cuò)信息一定記錄下來(無論是拷屏還是手工記錄),留下第一手資料,而且希望在現(xiàn)場告訴用戶,讓用戶將來也做到這點(diǎn),幫我們收集第一手資料。詢問故障發(fā)生前后所做過的操作。如果需要,先檢查硬件連接,重新裝

41、配連接,確認(rèn)故障有什么變化。升級所有微碼、驅(qū)動(dòng)(請一定閱讀微碼或者驅(qū)動(dòng)說明文件中重要章節(jié),確認(rèn)用正確步驟升級有關(guān)微碼和驅(qū)動(dòng)),觀察故障變化情況。如問題解決,再次收集信息。最小化配置(參閱HMM有關(guān)最小化配置章節(jié))。如果最小化配置情況下系統(tǒng)正常,遵循每次添加一個(gè)部件,啟動(dòng)系統(tǒng)確認(rèn)正常再添加一個(gè)備件的原則。如果最小化配置情況下,依舊故障,記錄故障情況,盡量按照一次更換一個(gè)備件的原則定位故障部件。如果問題解決,再次收集信息。如果問題沒有解決,一定要在離開現(xiàn)場之前收集完整的日志信息及時(shí)將情況反饋給CAG。收集信息后,清空日志。將一些信息收集工具留給客戶,告訴用戶怎么使用,從單個(gè)Case來說,工程師多付

42、出一點(diǎn),但是從大局來看,將來我們可以直接從用戶手里獲得有關(guān)日志,加快工程是修復(fù)故障機(jī)的速度。升級所有微碼、驅(qū)動(dòng)HYPERLINK/systems/support/supportsite.wss/docdisplay?lndocid=MIGR-4JTS2T&brandind=5000008/systems/support/supportsite.wss/docdisplay?lndocid=MIGR-4JTS2T&brandind=5000008最小化配置(電源,系統(tǒng)啟動(dòng))測試保留1個(gè)cpu,最小啟動(dòng)內(nèi)存(有些機(jī)器用1根內(nèi)存,有些機(jī)型必須2根成對使用),陣列卡,必須拔掉外圍所有部件(包括鼠標(biāo)、鍵

43、盤、顯示器,特別是一些非IBM部件),必要是不安裝開關(guān),使用主板強(qiáng)制開關(guān)跳線開機(jī)。注意事項(xiàng):升級微碼過程中不要斷電,重新啟動(dòng)操作。作系統(tǒng)硬件操作的時(shí)候一定要拔掉電源線等連接線,防靜電等等。操作有可能導(dǎo)致數(shù)據(jù)丟失,提醒備份數(shù)據(jù)。1.5確認(rèn)后關(guān)閉確認(rèn)操作的有效性問題是否解決?是否需要觀察?如果問題沒有解決,一定要在離開現(xiàn)場之前收集完整的日志信息,及時(shí)將情況反饋給CAG。2、DASD故障服務(wù)器維修過程中DASD(DirectAccessStorageDevice硬盤子系統(tǒng),其包括:硬盤,硬盤背板,SCSI線,Raid卡,主板)故障居多,當(dāng)DASD出現(xiàn)故障時(shí),客戶總有許多問題會(huì)要求提供RootCaus

44、e。2.1DASD的故障原因DASD出現(xiàn)問題時(shí),客戶總是希望知道故障原因,建議從以下幾點(diǎn)給予客戶解釋1)環(huán)境問題(電流的沖擊,溫度過高,灰塵靜電堆積狀況)2)微碼和版本問題(Raid卡、硬盤等的微碼,Raid卡的驅(qū)動(dòng))注:Raid卡的微碼和Raid卡的驅(qū)動(dòng)需要在同一Level3)硬件問題現(xiàn)場工程師是沒有權(quán)利定性此故障原因?yàn)橛布栴}的,只有對備件送去ITPC做FA測試后,才能確定備件是否存在硬件問題。如果碰到數(shù)據(jù)丟失的情況,請謹(jǐn)慎地回答客戶的提問,一定要讓CAG幫助分析和確認(rèn)故障的RootCause。2.2硬盤的狀態(tài)硬盤正常狀態(tài):綠燈閃爍,琥珀燈不亮硬盤異常狀態(tài):硬盤掉線琥珀燈長亮硬盤Hung琥珀燈長亮硬盤Rebuild狀態(tài):綠燈近似長亮的閃爍,琥珀燈有規(guī)律的閃爍硬盤兩個(gè)指示燈都不亮(硬盤為Hotspare或Ready狀態(tài))2.3更換硬盤更換單塊掉線硬盤操作流程:1.建議客戶異地備份數(shù)據(jù)2.備份陣列信息(客戶同意重啟服務(wù)器)3.抓取Raid日志并分析(是否有壞條帶,是否有PFA等)4.更換掉線的硬盤5

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論