服務(wù)器維修故障診斷思路大全_第1頁(yè)
服務(wù)器維修故障診斷思路大全_第2頁(yè)
服務(wù)器維修故障診斷思路大全_第3頁(yè)
服務(wù)器維修故障診斷思路大全_第4頁(yè)
服務(wù)器維修故障診斷思路大全_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

刖百:相對(duì)PC機(jī)而言服務(wù)器出故障的機(jī)率是小多了,但是它的故障給企業(yè)也帶來(lái)了一些影響。作為服務(wù)器工程師除要有服務(wù)器基礎(chǔ)知識(shí)以外,還需要具備服務(wù)器故障的診斷思路,這樣才能最快速的解決問(wèn)題也可以減少故障停機(jī)時(shí)間。本文并不是針對(duì)某個(gè)廠家服務(wù)器故障完全手冊(cè),而是根據(jù)個(gè)人經(jīng)驗(yàn)總結(jié)出來(lái)的一些經(jīng)驗(yàn)思路還有一些總結(jié)案例。按照下面思路和方法基本上能夠解決目前服務(wù)器更換式維修的大多數(shù)問(wèn)題。而且里面的一些操作風(fēng)險(xiǎn)性也不是很大,因?yàn)榉?wù)器本身就是壞的,最壞的情況下就是它一點(diǎn)都不能工作了唄,(主要確認(rèn)是否有數(shù)據(jù),數(shù)據(jù)無(wú)價(jià)?。┒椰F(xiàn)在很多廠商都有自己的客服電話關(guān)于產(chǎn)品問(wèn)題打個(gè)電話也很方便,所以安心做啦當(dāng)然如果服務(wù)器在保修期內(nèi)就打電話讓售后工程師上門(mén)服務(wù),畢竟顧客就是上帝嘛,但是如果上帝比較著急使用,一般小故障自己解決一下就好了,因?yàn)橐话銏?bào)修最快都是第二天(大客戶如銀行等除外,一般當(dāng)天還得是晚上才能停機(jī)解決)目錄:一、服務(wù)器常見(jiàn)故障分類(lèi)二、服務(wù)器常見(jiàn)故障現(xiàn)象及其對(duì)應(yīng)排錯(cuò)方法三、服務(wù)器排錯(cuò)基本原則四、服務(wù)器故障需要收集哪些信息五、服務(wù)器硬件故障排錯(cuò)實(shí)例六、服務(wù)器軟件故障排錯(cuò)實(shí)例七、服務(wù)器常見(jiàn)內(nèi)存故障現(xiàn)象一、服務(wù)器常見(jiàn)故障類(lèi)型分類(lèi):A.開(kāi)機(jī)無(wú)顯示B.加電BIOS自檢階段故障C.系統(tǒng)和軟件安裝階段故障和現(xiàn)象D.操作系統(tǒng)啟動(dòng)失敗E.系統(tǒng)運(yùn)行階段故障二、服務(wù)器常見(jiàn)故障現(xiàn)象及其對(duì)應(yīng)的排除方法A.服務(wù)器開(kāi)機(jī)無(wú)顯示(加電無(wú)顯示和不加電無(wú)顯示).檢查供電環(huán)境.檢查電源和故障指示燈(故障指示燈狀態(tài),目前很多廠商的服務(wù)器都有故障指示燈,或故障診斷卡等。).按下電源開(kāi)關(guān)時(shí),鍵盤(pán)指示燈是否亮、風(fēng)扇是否全部轉(zhuǎn)動(dòng).是否更換過(guò)顯示器,嘗試更換另外一臺(tái)顯示器.插拔內(nèi)存,用橡皮擦擦拭一下金手指,如果在故障之前有增加內(nèi)存,去掉增加的內(nèi)存嘗試.是否添加了CPU,如果有增加CPU嘗試去掉.去掉增加的第三方I/O卡包括Raid卡等.ClearCMOS(記得使用跳線來(lái)清除,盡量不要直接拔電池,每款服務(wù)器清除跳線位置不一致,具體找不到電話聯(lián)系一下廠商客服).嘗試更換主板、內(nèi)存等主要部件.清除靜電,將電源線等外插在服務(wù)器上的線纜全部拔掉,然后輕按開(kāi)機(jī)鍵幾下B.加電BIOS自檢報(bào)錯(cuò).根據(jù)BIOS自檢報(bào)錯(cuò)信息提示.查看是否外插了第三方的卡或者添加部件,如果有還原基本配置重啟.做最小化測(cè)試.嘗試清除CMOS.看能否正常進(jìn)入BIOSC.系統(tǒng)安裝階段故障和現(xiàn)象.查看服務(wù)器支持操作系統(tǒng)的兼容版本(從廠商能查到兼容性列表).系統(tǒng)安裝藍(lán)屏(對(duì)藍(lán)屏故障代碼診斷).安裝在分區(qū)格式化的時(shí)候找不到硬盤(pán)(陣列驅(qū)動(dòng)沒(méi)有安裝或者沒(méi)有配置陣列,可以嘗試適應(yīng)引導(dǎo)光盤(pán)安裝).大于2T的硬盤(pán)式應(yīng)該如何分區(qū)(必須使用陣列卡才能實(shí)現(xiàn)或者有外插識(shí)別卡)(使用陣列卡配置陣列分成一個(gè)小于2T的空間,一個(gè)大于2T的空間,然后將系統(tǒng)安裝在小于2T的上面,安裝好系統(tǒng)后在使用GPT方式分區(qū)即可).安裝過(guò)程是死機(jī)(檢查兼容性列表一-查看硬盤(pán)接口選擇是否正確一-陣列驅(qū)動(dòng)安裝是否正確一-嘗試最小化配置安裝檢查是否為內(nèi)存和CPU等問(wèn)題).引導(dǎo)光盤(pán)安裝失?。ㄊ褂靡龑?dǎo)光盤(pán)安裝失敗,查看引導(dǎo)光盤(pán)版本是否匹配,嘗試手動(dòng)安裝系統(tǒng),如有陣列重新配置陣列引導(dǎo)安裝)D.操作系統(tǒng)啟動(dòng)失敗.在系統(tǒng)啟動(dòng)自檢過(guò)程中有報(bào)錯(cuò)(具體查看啟動(dòng)報(bào)錯(cuò)信息在定方案).啟動(dòng)系統(tǒng)藍(lán)屏(查看藍(lán)屏代碼核對(duì)).進(jìn)入登陸界面死機(jī)(查看進(jìn)入單用戶或者安全模式是否正常,進(jìn)入BIOS是否正常、是否會(huì)死機(jī),進(jìn)入磁盤(pán)陣列查看陣列狀態(tài)是否正常,檢查測(cè)試硬盤(pán)是否有壞道,最小化配置啟動(dòng)).忘記密碼 (windows使用PE破解,linux進(jìn)入單用戶破解)E.系統(tǒng)運(yùn)行階段故障.安裝數(shù)據(jù)庫(kù)等應(yīng)用軟件報(bào)錯(cuò)(對(duì)系統(tǒng)版本和軟件版本是否兼容,查看報(bào)錯(cuò)信息是否缺少插件).系統(tǒng)運(yùn)行速度變慢(查殺病毒,檢測(cè)陣列狀態(tài),測(cè)試硬盤(pán)有無(wú)壞道,重新安裝系統(tǒng)或者修復(fù)).運(yùn)行藍(lán)屏(查看藍(lán)屏代碼目錄).運(yùn)行死機(jī)(檢查進(jìn)入BIOS是否死機(jī),進(jìn)入系統(tǒng)后測(cè)試部件溫度是否正常,windows系統(tǒng)查看dump文件).硬盤(pán)拷貝數(shù)據(jù)文件速度變慢(測(cè)試硬盤(pán)是否有壞道,如果有陣列檢查陣列狀態(tài),檢查改變條帶大小,與軟件應(yīng)用要求測(cè)試對(duì)比)三.服務(wù)器故障排錯(cuò)的基本原則:.盡量恢復(fù)系統(tǒng)出廠配置a:硬件配置:去除第三方廠商備件和非標(biāo)配備件b:資源配置:清除CMOS、恢復(fù)資源初始配置BIOS、F/W、驅(qū)動(dòng)程序:升級(jí)最新的BIOS、F/W和相關(guān)驅(qū)動(dòng)程序TPL:擴(kuò)展的第三方的I/O卡是否屬于該機(jī)型的硬件兼容列表(TPL).從基本到復(fù)雜a:系統(tǒng)上從個(gè)體到網(wǎng)絡(luò):首先將存在故障的服務(wù)器獨(dú)立運(yùn)行,待測(cè)試正常后再接入網(wǎng)絡(luò)運(yùn)行,觀察故障現(xiàn)象變化并處理。b:硬件上從最小系統(tǒng)到現(xiàn)實(shí)系統(tǒng):指從可以運(yùn)行的硬件開(kāi)始逐步到現(xiàn)實(shí)系統(tǒng)為止。c:軟件上從基本系統(tǒng)到現(xiàn)實(shí)系統(tǒng):指從基本操作系統(tǒng)開(kāi)始逐步到現(xiàn)實(shí)系統(tǒng)為止。.部件交換對(duì)比測(cè)試a:在最大可能相同的條件下,交換操作簡(jiǎn)單效果明顯的部件b:交換NOS載體,既交換軟件環(huán)境c:交換硬件,既交換硬件環(huán)境d:交換整機(jī),既交換整體環(huán)境總結(jié):在服務(wù)器的維修中,線索都會(huì)顯得撲朔迷離,有的甚至按起葫蘆翹起瓢。一般來(lái)說(shuō)不可能一次就可以準(zhǔn)確地判斷出問(wèn)題的所在。這樣就要求工程師要有信心和耐心。出現(xiàn)錯(cuò)誤一般的方法都是根據(jù)經(jīng)驗(yàn)優(yōu)先使用最簡(jiǎn)單排錯(cuò)方法測(cè)試,如果沒(méi)有解決問(wèn)題再找其它因素進(jìn)行測(cè)試。總之,服務(wù)器出錯(cuò)后必須一步一步解決,沒(méi)有捷徑可言。四、服務(wù)器故障排除需要收集哪些信息.服務(wù)器信息:.機(jī)器型號(hào):什么廠家的機(jī)器、什么型號(hào)如:DELLR720服務(wù)器.機(jī)器序列號(hào)或主機(jī)編號(hào)(如:主機(jī)編號(hào)為NC00755666).是否增加其它設(shè)備,如網(wǎng)卡、Raid卡、內(nèi)存、CPU等.硬盤(pán)配置,如是否做磁盤(pán)陣列,陣列級(jí)別.安裝什么操作系統(tǒng)及版本(win2003、Redhat等).在故障前有沒(méi)有做過(guò)操作、或者運(yùn)行了什么軟件.BIOS版本.故障信息:.在POST自檢時(shí),屏幕顯示的異常信息.服務(wù)器本身指示燈的狀態(tài).報(bào)警聲和BEEPCODES.系統(tǒng)的事件記錄文件.Sel日志五、服務(wù)器硬件故障處理實(shí)際案例(因廠家機(jī)型不同,在實(shí)際問(wèn)題中如果遇到相似現(xiàn)象,也需要具體問(wèn)題具體分析,請(qǐng)不要盲目套用)硬件故障是指服務(wù)器硬件出現(xiàn)異常而導(dǎo)致的各類(lèi)錯(cuò)誤,由于服務(wù)器構(gòu)成比較復(fù)雜,因此在檢查的時(shí)候必須認(rèn)真、仔細(xì)。實(shí)例一:有一臺(tái)XXX型號(hào)服務(wù)器,配有256M內(nèi)存,使用一個(gè)PIIIXEON500帶2M高速緩存的處理器。開(kāi)機(jī)后沒(méi)有任何顯示,但系統(tǒng)日志上提示了一條CPU電壓為0伏的信息,系統(tǒng)指示燈三燈不停在閃爍(指示燈三燈閃爍是服務(wù)器的另一種報(bào)警方式,我會(huì)在文后說(shuō)明)。這種錯(cuò)誤一般是處理器電壓調(diào)節(jié)模塊(VRM)出錯(cuò)或CPU出錯(cuò)或CPU與CPU板塊接觸不良,但也可能是CPU板塊出錯(cuò),這時(shí)情況就比較復(fù)雜了,必須經(jīng)過(guò)認(rèn)真慎重的思考。因?yàn)镃PU板塊在整個(gè)服務(wù)器中,占有舉足輕重的地位,如果它出錯(cuò)服務(wù)器是會(huì)報(bào)致命錯(cuò)誤的,并且在系統(tǒng)日志中會(huì)提示致命錯(cuò)誤,但報(bào)CPU電壓報(bào)錯(cuò)的情況也有5%左右。我們立刻把CPU調(diào)換在另一CPU插槽中,開(kāi)機(jī)后依然是剛才的那種故障。所以在初步判斷中,可以排除是CPU板塊壞。這時(shí)取出CPU仔細(xì)擦拭金手指,以及CPU板塊中與CPU接觸的地方后,開(kāi)機(jī)依然無(wú)顯示。相對(duì)處理器壞的情況來(lái)說(shuō)處理器電壓模塊(VRM)出現(xiàn)故障的情況比較大。于是立即在另一臺(tái)同型號(hào)服務(wù)器中取下一個(gè)處理器電壓模塊,安裝在此服務(wù)器中。開(kāi)機(jī)后,服務(wù)器依然沒(méi)有任何顯示,系統(tǒng)日志上依然提示CPU電壓為0伏的信息,系統(tǒng)指示燈三燈依然不停在閃爍。這時(shí)的情況就比較明顯了。于是立即從另一臺(tái)同類(lèi)型服務(wù)器中取下一個(gè)CPU安裝后,開(kāi)機(jī)正常。實(shí)例二:有一臺(tái)XXX型號(hào)服務(wù)器不顯示,發(fā)現(xiàn)開(kāi)機(jī)時(shí)系統(tǒng)日志沒(méi)有任何信息,且系統(tǒng)指示燈不亮。初步判斷是電源方面出現(xiàn)了錯(cuò)誤。經(jīng)過(guò)仔細(xì)檢查,發(fā)現(xiàn)服務(wù)器的電源是正常的,因此最大的可能就是服務(wù)器的電源管理板出現(xiàn)故障。更換電源管理板后,開(kāi)機(jī)顯示正常。但這時(shí),新的問(wèn)題來(lái)了:自檢時(shí),用CTRL+M不能檢測(cè)到硬盤(pán)。硬盤(pán)在別的服務(wù)器上是正常的,因此立即清除此服務(wù)器的CMOS,但依然不正常。立刻上網(wǎng)找到此服務(wù)器的最新BIOS,升級(jí)BIOS后也不能解決問(wèn)題。又檢查硬盤(pán)籠子和服務(wù)器里的數(shù)據(jù)線及電源線后依然出錯(cuò)。這時(shí),一般情況會(huì)懷疑是服務(wù)器的I/O板(輸入輸出板塊)有問(wèn)題。但就在這個(gè)時(shí)候,工程師發(fā)現(xiàn)在I/O板上有一個(gè)非XXX型號(hào)服務(wù)器標(biāo)配的舊式網(wǎng)卡,立即去除此網(wǎng)卡后服務(wù)器就一切正常。硬件故障并不單單指硬件有問(wèn)題,它也指硬件之間不兼容。因?yàn)榉?wù)器的正常運(yùn)作需要各部件之間的大力協(xié)調(diào)。建議大家在采購(gòu)各元件時(shí),都采用同一品牌原裝的,并且要采用能發(fā)揮服務(wù)器性能的元件(上例中的舊式網(wǎng)卡即使正常也會(huì)嚴(yán)重影響服務(wù)器性能),這樣才不會(huì)發(fā)生莫明其妙的故障。實(shí)例三:用戶需要把他的XXX型號(hào)服務(wù)器升級(jí)到雙網(wǎng)卡,我建議他購(gòu)買(mǎi)原裝網(wǎng)卡,但當(dāng)他看到XXX型號(hào)服務(wù)器的網(wǎng)卡是采用的INTEL82559芯片后,斷然決定不使用原裝網(wǎng)卡而采用另一品牌也采用INTEL82559的網(wǎng)卡。過(guò)了幾天,他打電話給我說(shuō),他的新網(wǎng)卡不能使用網(wǎng)絡(luò)冗余及數(shù)據(jù)校驗(yàn),并懷疑服務(wù)器有問(wèn)題。工程師帶了一個(gè)INTEL82559網(wǎng)卡到用戶那里,仔細(xì)檢查了服務(wù)器的環(huán)境完全正常后,把INTEL82559網(wǎng)卡安裝到機(jī)器上后一切正常。這個(gè)例子更加說(shuō)明了,要發(fā)揮服務(wù)器的最大性能及功能,必須使用原品牌原裝的配件。非原品牌非原裝的配件,不能支持服務(wù)器的某些功能,嚴(yán)重的會(huì)影響到服務(wù)器的正常使用。要避免硬件故障發(fā)生頻率,服務(wù)器管理人員必須注意服務(wù)器的使用環(huán)境完全正常。比較重要的服務(wù)器必須在恒溫、恒濕的環(huán)境;電壓也要符合,不僅要采用UPS,還必須接地線,必須是左零線、右火線,零地電壓在1?3伏。在開(kāi)、關(guān)服務(wù)器上必須符合正常的流程。工作人員必須嚴(yán)格執(zhí)行操作流程。實(shí)例四:服務(wù)器故障現(xiàn)象:一臺(tái)XXX型號(hào)服務(wù)器,近期頻繁出現(xiàn)幾次藍(lán)屏幕死機(jī)故障。趁死機(jī)關(guān)閉的機(jī)會(huì),將內(nèi)存由原來(lái)的128M升級(jí)到512M(普通內(nèi)存),并且在系統(tǒng)CMOS設(shè)置中選擇裝入(Load)最優(yōu)參數(shù)設(shè)置,對(duì)內(nèi)存每個(gè)單元進(jìn)行檢測(cè)。怪異服務(wù)器故障出現(xiàn)了,當(dāng)我開(kāi)機(jī)后,內(nèi)存檢測(cè)正常,但是屏幕提示須重新SETUP,按指定的[F2]鍵后卻死機(jī)。我裝個(gè)內(nèi)存條招誰(shuí)惹誰(shuí)了,怎么會(huì)死機(jī)?而且內(nèi)存檢測(cè)正常啊?服務(wù)器故障處理:服務(wù)器出了故障就要解決,哪怕是怪異服務(wù)器故障。按照縮小故障源的思路,換回原來(lái)的內(nèi)存條,逐步去掉各個(gè)部分(軟驅(qū)、硬盤(pán)、光驅(qū)等),可是這個(gè)怪異服務(wù)器故障依然存在。分析可能與系統(tǒng)SETUP設(shè)置有關(guān),特別是關(guān)于對(duì)內(nèi)存每個(gè)單元進(jìn)行檢測(cè)的設(shè)置。于是,拔出電池,對(duì)電池插腳短接放電,沒(méi)有奏效??磥?lái),這個(gè)怪異服務(wù)器故障還真是頑固。后來(lái),找到主板清除CMOS跳線設(shè)置,將插腳線由1-2改到2-3一會(huì)兒,然后恢復(fù)原位,開(kāi)機(jī)正常(提示:不要輕易拔出電池,而是要找CMOS清除跳線)。再次將內(nèi)存升級(jí),調(diào)整CMOSSETUP設(shè)置,特別注意到對(duì)內(nèi)存的檢測(cè),設(shè)置為檢測(cè)到每兆,至此系統(tǒng)完全恢復(fù)正常。服務(wù)器故障經(jīng)驗(yàn)這個(gè)怪異服務(wù)器故障發(fā)生的根本原因是服務(wù)器的內(nèi)存缺省設(shè)置為ECC(帶校驗(yàn)),由于使用普通不帶校驗(yàn)的內(nèi)存,而系統(tǒng)中設(shè)置每個(gè)單元都進(jìn)行檢測(cè),所以導(dǎo)致了上面的故障。排除的方法是清除CMOS設(shè)置,調(diào)整有關(guān)參數(shù)設(shè)置。另外CMOSSETUP裝入最優(yōu)參數(shù)設(shè)置通常有2種:一種是BIOS優(yōu)化參數(shù),這種參數(shù)穩(wěn)定性最好;另一種是SETUP優(yōu)化參數(shù),優(yōu)化整個(gè)系統(tǒng),但是需要系統(tǒng)支持,其穩(wěn)定性不能保證最好。所以,當(dāng)系統(tǒng)出現(xiàn)故障時(shí),不妨先將穩(wěn)定性最好的參數(shù)裝入,解決問(wèn)題后再行實(shí)例五:一臺(tái)XXX型號(hào)服務(wù)器使用8708E的raid卡在讀取某個(gè)文件或運(yùn)行某個(gè)軟件時(shí)經(jīng)常出錯(cuò),或者要經(jīng)過(guò)很長(zhǎng)時(shí)間才能成功,其間硬盤(pán)不斷讀盤(pán)并發(fā)出刺耳的雜音,這種現(xiàn)象意味著硬盤(pán)上載有數(shù)據(jù)的某些扇區(qū)已壞。一旦硬盤(pán)有比較刺耳的雜音可以嘗試使用HD軟件來(lái)測(cè)試硬盤(pán)時(shí)候有壞道,進(jìn)入ctrl+H配置界面進(jìn)行查看,陣列是否降級(jí)六、服務(wù)器常見(jiàn)軟故障解決思路與實(shí)例服務(wù)器軟件故障是在服務(wù)器故障中占有比例最高的部份,約占70%,解決的過(guò)程必須更加深思熟慮。導(dǎo)致服務(wù)器出現(xiàn)軟件故障的原因有很多,最常見(jiàn)的是服務(wù)器BIOS版本太低、服務(wù)器的管理軟件或服務(wù)器的驅(qū)動(dòng)程序有BUG、應(yīng)用程序有沖突及人為造成的軟件故障。下面分別舉例說(shuō)明各類(lèi)軟件故障的維修方法。實(shí)例一:有一臺(tái)***型號(hào)服務(wù)器,配置為雙PIII500帶521K高速緩存的CPU、512M內(nèi)存。開(kāi)機(jī)后,系統(tǒng)日志報(bào)電壓調(diào)節(jié)模塊異常(VRM)的錯(cuò)誤,報(bào)錯(cuò)的信息是:“VoltageRegulatorModule(VRM)over/under-voltage2.88V/0V”。從表面來(lái)看,極有可能是服務(wù)器的電壓調(diào)節(jié)模塊或其它硬件出現(xiàn)故障,極容易導(dǎo)致維護(hù)人員認(rèn)為是硬件故障。維護(hù)人員立刻使用其它同類(lèi)型服務(wù)器的硬件來(lái)測(cè)試,發(fā)現(xiàn)即使使用新的配件,此服務(wù)器依然報(bào)VRM錯(cuò)。就在一籌莫展的時(shí)候,維修工程師帶來(lái)了最新的CPU管理板(CPUManagementControl)的固件(FIRMWARE),于是升級(jí)了CPU管理板塊的FIRMWARE后,服務(wù)器恢復(fù)立即正常。FIRMWARE升級(jí)方法是每個(gè)廠家的服務(wù)器都有專門(mén)的firmware升級(jí)方法和軟件,以聯(lián)想為例,一般需要使用PE或dos環(huán)境下使用專門(mén)的升級(jí)軟件來(lái)使用,任何一款服務(wù)器的FIRMWARE及BIOS都會(huì)有不同的BUG,因?yàn)锽UG在所難免,所以我們不能錯(cuò)誤地認(rèn)為服務(wù)器的BIOS程序就很完善,最新的不是一定是最好的最穩(wěn)定的才是最好的,在升級(jí)之前應(yīng)該小心謹(jǐn)慎,升級(jí)了錯(cuò)誤的版本和使用錯(cuò)誤的步驟會(huì)導(dǎo)致機(jī)器徹底的黑屏和癱瘓。目前流行的中高檔服務(wù)器都擁有強(qiáng)大的管理程序,為客戶提供了方便的管理途徑;服務(wù)器也擁有各種操作系統(tǒng)下的驅(qū)動(dòng)程序,方便了客戶在各種操作系統(tǒng)中的使用。但是,世上任何一款程序都會(huì)有一些BUG,這些BUG將影響用戶使用。但是服務(wù)器廠商總是會(huì)在第一時(shí)間內(nèi)開(kāi)發(fā)出新的程序,客戶只需要及時(shí)更新這些程序就可以避免這類(lèi)故障。當(dāng)服務(wù)器的軟件故障為此類(lèi)時(shí),表現(xiàn)的現(xiàn)象也不盡相同。一般來(lái)說(shuō),管理程序BUG會(huì)導(dǎo)致系統(tǒng)速度變慢,CPU占用率變高,無(wú)法正常使用某些功能等;驅(qū)動(dòng)程序的BUG會(huì)導(dǎo)致死機(jī)、與某些軟件有沖突,磁盤(pán)工作不穩(wěn)定等。查看管理程序是否出錯(cuò)的最好的辦法就是在系統(tǒng)中首先禁止此類(lèi)管理工具,再觀察服務(wù)器是否還是異常。由于管理工具是隨著系統(tǒng)啟動(dòng)而啟動(dòng)的,所以應(yīng)首先避免它的啟動(dòng)。以WINDOWSNT4為例,就首先在管理工具服務(wù)中禁用某些服務(wù)器軟件服務(wù),再修改注冊(cè)表中的啟動(dòng)項(xiàng)即可。如果是驅(qū)動(dòng)程序有問(wèn)題的話,就以安全模式進(jìn)入系統(tǒng),看是否正常。但是需要注意的是,在安全模式中,系統(tǒng)速度變慢是正常的(特別是磁盤(pán)I/O方面)。服務(wù)器的維護(hù)人員就應(yīng)該經(jīng)常在服務(wù)器網(wǎng)站上下載最新的管理工具程序及驅(qū)動(dòng)程序。這樣會(huì)減少很大一部份軟件故障的發(fā)生。相比之下,軟件沖突造成的故障判斷比較困難,需要管理人員有比較豐富的經(jīng)驗(yàn)以及敏銳的觀察力。實(shí)例二:一位用戶說(shuō),他有一臺(tái)XXX型號(hào)服務(wù)器無(wú)法安裝SQLSERVER2000,已經(jīng)重裝N次NT了,排除是系統(tǒng)故障。而這唯一的服務(wù)器又將作為非常重要數(shù)據(jù)庫(kù)服務(wù)器,因此非常著急。于是維修工程師去了他的公司查看。這臺(tái)服務(wù)器所在的機(jī)房是非常標(biāo)準(zhǔn)、完善的機(jī)房,檢查了這臺(tái)服務(wù)器的情況,發(fā)現(xiàn)并沒(méi)有硬件上的故障,于是排除了光驅(qū)讀盤(pán)力差的可臺(tái)P能匕。但是,用戶刻的SQLSERVER2000光盤(pán)引起了工程師的懷疑,工程師讓他拿出了正版的SQLSERVER安裝,結(jié)果還是不行。在安裝的過(guò)程中,沒(méi)有出現(xiàn)絲毫錯(cuò)誤,可就是在運(yùn)行的時(shí)候會(huì)自動(dòng)退出,沒(méi)有任何提示。但是,我在管理工具中的事件查看器的系統(tǒng)日志中卻發(fā)現(xiàn)了一條信息:windata.exe導(dǎo)致一個(gè)無(wú)效的數(shù)據(jù)溢出。Windata是用戶自己編寫(xiě)的一個(gè)程序,而且是隨操作系統(tǒng)啟動(dòng)而啟動(dòng)的程序。立即結(jié)束掉這個(gè)進(jìn)程后,再運(yùn)行SQL一切正常。對(duì)于此類(lèi)軟件故障,操作員最好先查看有關(guān)的日志,看看系統(tǒng)中是否有可疑的進(jìn)程。目前的服務(wù)器無(wú)論是高端還是低端,對(duì)于SQL等標(biāo)準(zhǔn)程序的支持是相當(dāng)可靠的,所以排除的重點(diǎn)就是結(jié)束可疑進(jìn)程。還有一種軟件故障是人為因素造成的,它一般是人為誤操作(包括沒(méi)按操作流程的操作)、意外關(guān)機(jī)(包括電源突然不供電)或非正常關(guān)閉應(yīng)用程序造成的。人為誤操作因素只要加強(qiáng)管理都可以避免此類(lèi)故障發(fā)生。在這里就詳細(xì)說(shuō)明意外關(guān)機(jī)或非正常關(guān)閉程序造成故障的方法。正常關(guān)閉系統(tǒng)程序非常重要,尤其是WEB服務(wù)器,一個(gè)用戶就是因?yàn)闆](méi)有正常關(guān)閉系統(tǒng)程序而經(jīng)歷了一次數(shù)據(jù)損壞甚至丟失的經(jīng)歷。七、服務(wù)器常見(jiàn)內(nèi)存故障現(xiàn)象實(shí)例服務(wù)器常用部件除了硬盤(pán)以外就是內(nèi)存了,內(nèi)存為服務(wù)器主要部件以個(gè)人經(jīng)驗(yàn)來(lái)講它一旦出現(xiàn)問(wèn)題不是很好來(lái)判定,因?yàn)榉?wù)器一般來(lái)講都會(huì)由陣列功能的,一旦硬盤(pán)故障硬盤(pán)前面板會(huì)有指示燈,沒(méi)有指示燈的在陣列的配置界面里面也會(huì)看到有降級(jí)或者硬盤(pán)離線的報(bào)錯(cuò)信息的。實(shí)在不行我們還有很多像

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論