




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、修訂記錄課程編碼適用產(chǎn)品產(chǎn)品版本課程版本ISSUEHC1209208大數(shù)據(jù)存儲V1(C30)3.0開發(fā)/優(yōu)化者時間審核人開發(fā)類型(新開發(fā)/優(yōu)化)李鋒2015-09-01代錦秀、周頌書新開發(fā)本頁不打印第八章 大數(shù)據(jù)存儲系統(tǒng)維護與故障處理目標(biāo)學(xué)完本課程,您將能夠:掌握OceanStor 9000日常維護方法及維護工具的使用熟悉OceanStor 9000主要部件更換方法掌握OceanStor 9000存儲系統(tǒng)故障排查思路和方法掌握OceanStor 9000版本升級流程及版本回退方法目錄系統(tǒng)維護 例行維護 安全維護 巡檢與信息收集 部件更換系統(tǒng)升級故障處理維護基本原則日常維護按照正確的流程操作使用
2、原廠提供的資源和軟件現(xiàn)場保留備件,以便故障時及時更換創(chuàng)建日志制定可靠的備份計劃嚴(yán)格遵守設(shè)備安全注意事項管理軟件介紹介紹OceanStor 9000的管理方式,包括GUI和CLI: OceanStor 9000支持GUI(Graphical User Interface)和CLI(Command Line Interface)兩種管理方式。 OceanStor DeviceManager提供GUI的管理方式,其中服務(wù)器端部署在OceanStor 9000上,用戶通過終端瀏覽器連接到OceanStor 9000所在業(yè)務(wù)網(wǎng),訪問OceanStor 9000進行管理和維護。OceanStor Devi
3、ceManager是存儲單元管理平臺,支持同時管理集群和節(jié)點。 CLI是命令行接口,能夠高效、快捷地管理和維護設(shè)備。P25/P12節(jié)點設(shè)備運行指示燈1系統(tǒng)電源指示燈/開機按鈕2系統(tǒng)告警指示燈3系統(tǒng)定位指示燈4USB端口5硬盤運行指示燈6硬盤告警/定位指示燈C36/P36設(shè)備運行指示燈1系統(tǒng)電源指示燈/開機按鈕2系統(tǒng)告警指示燈3系統(tǒng)定位指示燈4USB端口5硬盤運行指示燈6硬盤告警/定位指示燈Page 9C36/P36設(shè)備運行指示燈1電源模塊拉手2電源運行/告警指示燈3電源接口4PCI-E擴展插槽5SAS卡6GE網(wǎng)口7IPMI管理網(wǎng)口8USB端口9系統(tǒng)串口10VGA端口11系統(tǒng)告警指示燈12系統(tǒng)定
4、位指示燈13IPMI管理網(wǎng)口LNK指示燈14IPMI管理網(wǎng)口ACT指示燈15GE網(wǎng)口ACT指示燈16GE網(wǎng)口LNK指示燈17硬盤運行指示燈18硬盤告警/定位指示燈1910GE SFP+以太網(wǎng)光接口指示燈2010GE SFP+以太網(wǎng)光接口Page 10C72設(shè)備運行指示燈Page 11C72設(shè)備運行指示燈Page 121電源運行指示燈2電源開關(guān)3風(fēng)扇運行指示燈4MODE模式切換按鈕/ID指示燈5管理網(wǎng)口指示燈6USB開局指示燈7堆疊主從指示燈8系統(tǒng)運行狀態(tài)燈交換機指示燈Page 13交換機指示燈1系統(tǒng)運行狀態(tài)燈2堆疊主從指示燈3STAT模式狀態(tài)燈4SPEED模式狀態(tài)燈5STACK模式狀態(tài)燈6模式
5、切換按鈕/ID指示燈7業(yè)務(wù)接口指示燈(10GE光口)8業(yè)務(wù)接口指示燈(40GE光口) 940GE接口的10GE模式指示燈(1/2/3/4)-設(shè)備管理軟件維護項-查看硬盤信息查看硬盤信息設(shè)備硬盤狀態(tài)異常,可能會影響業(yè)務(wù)的正常運行。通過檢查設(shè)備硬盤的運行狀態(tài),用戶可以及時發(fā)現(xiàn)異常狀態(tài)并進行處理。操作步驟步驟一:登錄設(shè)備管理軟件。步驟二:在導(dǎo)航樹中單擊“設(shè)備管理 硬盤信息”,查看硬盤信息,相應(yīng) 的參數(shù)說明如下表所示。參數(shù)說明ID硬盤的編號。在位狀態(tài)硬盤的在位狀態(tài),包括:在位、不在位上電狀態(tài)硬盤的上電狀態(tài),包括:上電、未上電故障燈硬盤故障燈的狀態(tài),包括:亮、滅設(shè)備管理軟件維護項-查看告警信息操作步驟步
6、驟一 登錄設(shè)備管理軟件。步驟二 在導(dǎo)航樹中選擇并單擊“告警管理 告警瀏覽”查看告警信息,相應(yīng)的參數(shù)說明如下表所示參數(shù)說明流水號告警的編號。描述對告警信息的具體描述。類型告警模塊的類型。告警模塊的類型如下:Power Supply:電源模塊類Cooling Device:風(fēng)扇在位類Fan:風(fēng)扇轉(zhuǎn)速類Temperature:溫度傳感器類Voltage:電壓傳感器類System ACPI Power State:系統(tǒng)ACPI電源狀態(tài)類Reserved:自定義類動作Deasserted:告警解除Asserted:告警發(fā)生時間告警信息發(fā)生的時間。DeviceManager維護項-查看系統(tǒng)信息登陸Devi
7、ceManager在首頁中查看當(dāng)前設(shè)備中的系統(tǒng)信息。系統(tǒng)信息:在“基本信息”區(qū)域,查看當(dāng)前設(shè)備的集群名稱、集群容量,以及節(jié)點個數(shù),節(jié)點類型等。告警:在“告警”區(qū)域,查看當(dāng)前設(shè)備的告警信息。性能:在“性能”區(qū)域,查看當(dāng)前設(shè)備的性能總體數(shù)據(jù)??蛻舳耍涸凇胺?wù)信息”區(qū)域,查看當(dāng)前設(shè)備各個類型的客戶端數(shù)量DeviceManager維護項-查看集群狀態(tài)操作步驟步驟一 登錄OceanStor DeviceManager。步驟二 在左上方基本信息中查看集群狀態(tài),相關(guān)參數(shù)說明如下表所示。參數(shù)名稱說明集群名稱標(biāo)識了集群的名稱。健康狀態(tài)集群的健康狀態(tài),包括:“正常”、“故障”、“部分損壞”、“降級”。運行狀態(tài)集群
8、的運行狀態(tài),包括“正在啟動”、“運行”、“正在升級”、“正在下電” 。集群容量集群的總?cè)萘考翱捎萌萘俊eviceManager維護項-查看節(jié)點狀態(tài)操作步驟步驟一 登錄OceanStor DeviceManager。步驟二在右側(cè)導(dǎo)航中單擊 “系統(tǒng)”進入“節(jié)點列表”界面。步驟三 在中間信息展示區(qū)瀏覽節(jié)點信息,相關(guān)參數(shù)說明如下表所示。參數(shù)名稱說明名稱標(biāo)識了節(jié)點的名稱。健康狀態(tài)節(jié)點的健康狀態(tài),包括“正?!?、“故障”和“未知”幾種狀態(tài)。運行狀態(tài)包括“在線”、“離線”和“未知”幾種狀態(tài)。總?cè)萘浚═B)此節(jié)點的總?cè)萘?,單位為TB。容量利用率(%)已使用的容量與總?cè)萘康陌俜直?。吞吐量(in/out)集群系統(tǒng)
9、每秒接收/發(fā)送的字節(jié)數(shù)。CPU(%)-內(nèi)存(%)-DeviceManager維護項-查看節(jié)點文件系統(tǒng)服務(wù)狀態(tài)查看節(jié)點文件系統(tǒng)服務(wù)狀態(tài)介紹通過OceanStor DeviceManager檢查節(jié)點文件系統(tǒng)服務(wù)狀態(tài)的具體操作。通過檢查節(jié)點文件系統(tǒng)服務(wù)的狀態(tài),可以及時發(fā)現(xiàn)和處理故障。操作步驟步驟一:登錄OceanStor DeviceManager。步驟二:在右側(cè)導(dǎo)航中單擊 “系統(tǒng)”進入“節(jié)點列表”界面。步驟三:單擊某個節(jié)點的名稱進入節(jié)點基本信息界面。步驟四:在節(jié)點基本信息中查詢此節(jié)點“文件系統(tǒng)服務(wù)運行狀態(tài)”是否為“正?!?。DeviceManager維護項-查看性能信息查看性能信息通過查看性能的數(shù)據(jù)
10、變化情況,及時發(fā)現(xiàn)系統(tǒng)中的異?,F(xiàn)象,并根據(jù)相應(yīng)的告警信息進行故障處理。操作步驟登錄OceanStor DeviceManager。在首頁的左下方統(tǒng)計了系統(tǒng)的性能信息包括吞吐量、CPU/內(nèi)存。異常處理當(dāng)CPU/內(nèi)存平均值長期大于90%,需要及時擴容提升性能目錄系統(tǒng)維護 例行維護 安全維護 巡檢與信息收集 部件更換系統(tǒng)升級故障處理OceanStor 9000系統(tǒng)安全概述OceanStor 9000具有安全的物理組網(wǎng)結(jié)構(gòu),將用戶的業(yè)務(wù)網(wǎng)絡(luò)和管理網(wǎng)絡(luò)隔離,保護系統(tǒng)運行的安全。分層的安全維護應(yīng)用層安全維護的目的是從安全角度保障業(yè)務(wù)系統(tǒng)可以正常運行和對外提供服務(wù)。系統(tǒng)層安全維護的目的是保障操作系統(tǒng)、數(shù)據(jù)庫
11、、中間件可以正常運行,以支撐應(yīng)用層各個應(yīng)用軟件的運行。網(wǎng)絡(luò)層安全維護的目的是保障交換機、路由器、防火墻等網(wǎng)絡(luò)設(shè)備的正常運行,確保網(wǎng)絡(luò)層的安全策略得到落實。管理層安全維護的目的是加強人為管理,防范于未然。管理層維護涉及上述各個層面。OceanStor WushanFS賬戶管理管理OceanStor DeviceManager賬戶WushanFS的OceanStor DeviceManager管理員擁有不同的操作權(quán)限,包括超級管理員、管理員、只讀用戶、資源管理員和設(shè)備管理員。系統(tǒng)默認(rèn)提供了admin(超級管理員),該管理員不允許修改和刪除。管理方法登錄OceanStor DeviceManager
12、。選擇“設(shè)置 查看與設(shè)置 權(quán)限設(shè)置 管理用戶”。 在中間信息展示區(qū),超級管理員可以執(zhí)行創(chuàng)建、刪除、鎖定、解鎖、強制下線等操作。修改系統(tǒng)密碼(C01)系統(tǒng)密碼是登錄系統(tǒng)的必要條件,修改系統(tǒng)密碼能夠防止密碼的泄露。對于OceanStor 9000的Linux操作系統(tǒng)自帶特權(quán)賬戶root,建議定期更新一次賬戶密碼。修改系統(tǒng)密碼方法有如下方式:以root用戶使用PuTTY工具登錄系統(tǒng),輸入passwd后設(shè)置root的新密碼。使用CLI命令change system root_password修改。登錄OceanStor DeviceManager,選擇“設(shè)置 集群設(shè)置 集群節(jié)點設(shè)置”,勾選需要修改的節(jié)
13、點后單擊左下角的“修改Root密碼”。檢查系統(tǒng)賬戶(C01)系統(tǒng)會擁有很多賬戶,定期檢查系統(tǒng)賬戶能夠防止賬戶的不合理擴散和泄露,規(guī)避安全隱患。建議您每季度對系統(tǒng)維護賬戶、應(yīng)用系統(tǒng)的運行賬戶進行檢查,查看是否存在不合理的賬戶和不合理的賬戶權(quán)限。檢查方式:以root用戶使用KVM工具登錄節(jié)點。查看所有群組的信息:cat /etc/group查看所有賬戶的信息:cat /etc/passwd檢查系統(tǒng)賬戶(C30)系統(tǒng)會擁有很多賬戶,定期檢查系統(tǒng)賬戶能夠防止賬戶的不合理擴散和泄露,規(guī)避安全隱患。建議您每季度對系統(tǒng)維護賬戶、應(yīng)用系統(tǒng)的運行賬戶進行檢查,查看是否存在不合理的賬戶和不合理的賬戶權(quán)限。檢查方式
14、:以root用戶登錄節(jié)點。P12/P25/P36/C36:使用KVM工具登錄節(jié)點。C72:通過左側(cè)控制框的系統(tǒng)串口登錄節(jié)點。波特率為115200、8位數(shù)據(jù)位、1位停止位、無奇偶校驗和無數(shù)據(jù)流控制。查看所有群組的信息:cat /etc/group查看所有賬戶的信息:cat /etc/passwd檢查系統(tǒng)進程(C01)系統(tǒng)運行中會觸發(fā)眾多進程,不合理進程的存在會帶來性能、安全等方面的風(fēng)險,而檢查系統(tǒng)進程并做相應(yīng)處理能避免這些風(fēng)險。管理員進行安全維護時,需要檢查是否有多余的進程,及時發(fā)現(xiàn)不合理進程并處理,避免風(fēng)險。檢查方式:以root用戶使用KVM工具登錄節(jié)點。輸入ps -ef檢查不相關(guān)的賬戶進程。
15、檢查系統(tǒng)進程(C30)系統(tǒng)運行中會觸發(fā)眾多進程,不合理進程的存在會帶來性能、安全等方面的風(fēng)險,而檢查系統(tǒng)進程并做相應(yīng)處理能避免這些風(fēng)險。管理員進行安全維護時,需要檢查是否有多余的進程,及時發(fā)現(xiàn)不合理進程并處理,避免風(fēng)險。檢查方式:以root用戶登錄節(jié)點。P12/P25/P36/C36:使用KVM工具登錄節(jié)點。C72:通過左側(cè)控制框的系統(tǒng)串口登錄節(jié)點。波特率為115200、8位數(shù)據(jù)位、1位停止位、無奇偶校驗和無數(shù)據(jù)流控制。輸入ps -ef檢查不相關(guān)的賬戶進程。檢查服務(wù)/端口(C01)系統(tǒng)會提供各種服務(wù)/端口,但多余服務(wù)/端口會帶來安全風(fēng)險,需要及時停止。檢查是否有多余的服務(wù)/端口,如果有多余服務(wù)
16、/端口建議聯(lián)系技術(shù)支持分析確認(rèn)后及時停止,以避免安全風(fēng)險。系統(tǒng)提供的詳細(xì)服務(wù)、端口請參見通信端口矩陣文檔。檢查方式:以root用戶使用KVM工具登錄節(jié)點。輸入netstat -an |grep LISTEN |grep tcp檢查TCP服務(wù)/端口。輸入netstat -an |grep udp檢查UDP服務(wù)/端口。檢查服務(wù)/端口(C30)系統(tǒng)會提供各種服務(wù)/端口,但多余服務(wù)/端口會帶來安全風(fēng)險,需要及時停止。檢查是否有多余的服務(wù)/端口,如果有多余服務(wù)/端口建議聯(lián)系技術(shù)支持分析確認(rèn)后及時停止,以避免安全風(fēng)險。系統(tǒng)提供的詳細(xì)服務(wù)、端口請參見通信端口矩陣文檔。檢查方式:以root用戶登錄節(jié)點。P12
17、/P25/P36/C36:使用KVM工具登錄節(jié)點。C72:通過左側(cè)控制框的系統(tǒng)串口登錄節(jié)點。波特率為115200、8位數(shù)據(jù)位、1位停止位、無奇偶校驗和無數(shù)據(jù)流控制。輸入netstat -an |grep LISTEN |grep tcp檢查TCP服務(wù)/端口。輸入netstat -an |grep udp檢查UDP服務(wù)/端口。安全組網(wǎng)組網(wǎng)劃分需要考慮安全區(qū)域劃分、邊界訪問控制、網(wǎng)絡(luò)入侵檢測等方面,并根據(jù)這些規(guī)則規(guī)劃出系統(tǒng)的安全組網(wǎng)。在存儲系統(tǒng)業(yè)務(wù)網(wǎng)絡(luò)中,OceanStor 9000系統(tǒng)集群與網(wǎng)管系統(tǒng)置于同一個安全網(wǎng)絡(luò)中。遠(yuǎn)程用戶需要通過防火墻才能連接OceanStor 9000系統(tǒng)。檢查交換機安
18、全以華為QuidWay S5700-52C-SI交換機為例進行說明,通過檢查其ACL配置來確保業(yè)務(wù)系統(tǒng)接收的數(shù)據(jù)包是安全的??梢允褂萌缦旅畈榭碅CL的配置結(jié)果。display acl acl-number | all查看以編號創(chuàng)建的ACL規(guī)則。display acl name acl-name查看以名稱創(chuàng)建的ACL規(guī)則。display time-range all | time-name查看時間段信息。display acl resource slot slot-id查看ACL的資源信息。上述ACL命令均以S5700 V200R001C00版本為例,實際所用的ACL相關(guān)命令請參照交換機對應(yīng)版
19、本的產(chǎn)品文檔。檢查VLAN/IP地址VLAN的作用是將一個物理的LAN在邏輯上進行隔離,使得廣播報文等通信受到VLAN劃分的限制。檢查VLAN配置信息及相關(guān)IP地址、處理異常能保障網(wǎng)絡(luò)的安全性。當(dāng)網(wǎng)絡(luò)中需要跨越防火墻設(shè)備時,建議按IP地址放行流量。如果需要按IP地址+端口放行流量,則需獲取端口列表,避免屏蔽掉OceanStor 9000使用的端口。 賬戶維護建議建議系統(tǒng)管理員對賬戶例行檢查,檢查的內(nèi)容包括:操作系統(tǒng)、OceanStor DeviceManager的賬戶是否有必要,臨時賬戶是否已刪除。各類賬戶的權(quán)限是否合理,不同的管理員擁有不同的權(quán)限。對各類賬戶的登錄、操作日志進行檢查和審計。密
20、碼維護建議用戶的賬戶和密碼的復(fù)雜性、有效期等需根據(jù)客戶的安全要求進行配置。對密碼的維護建議如下:專人保管系統(tǒng)root密碼。密碼需要滿足一定的強度要求,例如密碼最少字符數(shù)、混合大小寫等。密碼傳遞時注意加密,盡量避免通過郵件傳遞密碼。密碼需要加密存儲。系統(tǒng)移交時提醒客戶更改系統(tǒng)默認(rèn)密碼。首次登錄后請及時修改系統(tǒng)默認(rèn)密碼。定期修改密碼。日志維護建議定期檢查日志定期查看系統(tǒng)日志,若發(fā)現(xiàn)有非法操作、非法登錄用戶等異常情況,應(yīng)根據(jù)異常情況進行相應(yīng)的處理。定期備份日志日志應(yīng)當(dāng)進行定期備份,同時將備份文件在安全的保存介質(zhì)(磁盤、磁帶、光盤等)上存檔。日志在備份后應(yīng)當(dāng)及時刪除,以釋放日志空間。缺陷報告建議為了更
21、好的解決故障,建議客戶在發(fā)現(xiàn)問題后及時的將問題反饋給華為,并在尋求華為技術(shù)支持前做好必要的準(zhǔn)備工作,包括收集必要的故障信息和做好必要的調(diào)試準(zhǔn)備等。如果現(xiàn)場發(fā)生了安全事故,華為技術(shù)支持工程師將提供遠(yuǎn)程或者現(xiàn)場支持,協(xié)同用戶維護人員減輕系統(tǒng)遭受攻擊的影響,并且完善現(xiàn)場事故報告的處理過程。如果沒有發(fā)生安全事故,華為技術(shù)支持工程師將把問題錄入數(shù)據(jù)庫并傳給研發(fā)團隊。研發(fā)團隊找到解決方案后,技術(shù)支持工程師將分析方案實施對現(xiàn)場業(yè)務(wù)的影響,并提供建議的解決方法。注意:將問題數(shù)據(jù)傳出客戶網(wǎng)絡(luò)時,必須得到客戶授權(quán),且必須對其中的個人數(shù)據(jù)進行匿名化處理,確保華為不能以任何方式還原個人數(shù)據(jù)。安全應(yīng)急響應(yīng)機制客戶需要建
22、立應(yīng)對安全事故的應(yīng)急響應(yīng)處理機制,以保證出現(xiàn)安全事故后,可以盡快恢復(fù)生產(chǎn)和解決問題,將損失降至最低。如果系統(tǒng)發(fā)生了故障,可以先根據(jù)故障的具體情況,查閱華為技術(shù)有限公司提供的相關(guān)產(chǎn)品指導(dǎo)文檔。指導(dǎo)文檔能解決在日常維護或故障處理過程中遇到的常見問題。如果仍不能解決問題,可以尋求華為的技術(shù)支持。為了更好的解決故障,建議在尋求華為技術(shù)支持前做好必要的準(zhǔn)備工作,包括收集必要的故障信息和做好必要的調(diào)試準(zhǔn)備。目錄系統(tǒng)維護 例行維護 安全維護 巡檢與信息收集 部件更換系統(tǒng)升級故障處理巡檢內(nèi)容(1)性能指標(biāo)磁盤利用率CPU利用率內(nèi)存利用率節(jié)點吞吐量硬件狀態(tài)電源狀態(tài)風(fēng)扇狀態(tài)網(wǎng)口狀態(tài)光模塊狀態(tài)巡檢內(nèi)容(2)集群軟件
23、狀態(tài)集群狀態(tài)節(jié)點狀態(tài)DeviceManager運行狀態(tài)軟件設(shè)置時鐘同步外部DNS連通性License狀態(tài)日志級別巡檢內(nèi)容(3)文件系統(tǒng)運行狀態(tài)節(jié)點池內(nèi)存一致性檢測檢查打開的文件句柄數(shù)文件系統(tǒng)運行狀態(tài)數(shù)據(jù)恢復(fù)狀態(tài)其他風(fēng)險檢查近30天是否存在core和crash恢復(fù)任務(wù)執(zhí)行時間過長本地文件系統(tǒng)是否有操作超時OceanStor Toolkit進行巡檢(1)界面列出了所有的巡檢項,根據(jù)需求進行選擇,默認(rèn)全部進行巡檢。OceanStor Toolkit進行巡檢(2)待巡檢完成后,單擊“查看巡檢報告”可以進行查看。 步驟一:選擇“所有功能 維護 信息收集”。OceanStor Toolkit進行信息收集(
24、1)步驟二:勾選待收集的設(shè)備后單擊“收集”。步驟三:當(dāng)進度變成100%時,單擊“打開收集目錄”查看信息收集結(jié)果。OceanStor Toolkit進行信息收集(2)常見巡檢不通過項分析Nvdimm從原始信息可看到巡檢不通過原因。常見巡檢不通過項分析BMC狀態(tài)從原始信息可看到巡檢不通過原因。打開收集OceanStor 9000設(shè)備信息結(jié)果目錄,進入以收集信息設(shè)備IP為名稱的目錄。將信息收集結(jié)果壓縮包解壓到當(dāng)前目錄,獲得名為“DataCollect”的文件夾。進入“DataCollect”目錄,獲取每個節(jié)點的信息收集結(jié)果包。OceanStor Toolkit進行日志分析(1)在OceanStor
25、Toolkit工具主界面中,選擇“所有功能 維護 日志分析”,打開日志分析工具。OceanStor Toolkit進行日志分析(2)單擊“選擇”按鈕,依次導(dǎo)入步驟2中獲取的每一個節(jié)點的信息收集包,進行日志分析。此處以其中一個節(jié)點的信息包為例說明。在“設(shè)備類型”中選擇“OceanStor 9000”。如果更新了日志分析的配置文件AnalyzeRule.xml,要先單擊“清空臨時文件”,再重新導(dǎo)入日志包進行日志分析。OceanStor Toolkit進行日志分析(3)單擊“開始分析”并選擇要分析的內(nèi)容。單擊提示框中的“確定”后開始進行分析。目錄系統(tǒng)維護 例行維護 安全維護 巡檢與信息收集 部件更換
26、系統(tǒng)升級故障處理基本操作流程基本操作流程-確定操作的可行性在執(zhí)行故障處理或設(shè)備檢修的過程中,當(dāng)維護人員需要對某個設(shè)備部件執(zhí)行更換操作時,首先需要對本次操作的可行性進行評:設(shè)備庫房有待安裝或待更換部件的可用部件,當(dāng)缺少可用部件時,請及時聯(lián)系華為技術(shù)支持工程師以獲取幫助。確認(rèn)新部件良好,無氧化、無化學(xué)腐蝕、無元器件脫落、無運輸損壞等缺陷。維護人員是否有能力執(zhí)行本次更換操作,除CRU外,其他部件的更換操作只能由有經(jīng)過專業(yè)培訓(xùn)技術(shù)支持工程師執(zhí)行, CRU包括 :硬盤模塊、電源模塊、電纜、光模塊。 基本操作流程-準(zhǔn)備備件與工具準(zhǔn)備好待安裝或待更換的部件。 準(zhǔn)備好十字螺絲刀、防靜電腕帶等工具。 準(zhǔn)備好一個
27、防靜電平臺,方便設(shè)備、工具的放置。 在拿放、運輸部件時,必須使用專用的防靜電包裝袋。 在設(shè)備的日常維護中,應(yīng)做好部件的整理、登記和送修工作。安全注意事項在更換部件的過程中,請配戴防靜電腕帶或防靜電手套,防止靜電對人體和設(shè)備造成損傷。 在更換部件時,確保袖口扎緊或卷到肘部以上,為了安全,建議不要穿戴首飾、手表、金屬框眼鏡或有金屬扣子的衣服。 請保持部件所在區(qū)域的清潔。 避免用力過大或強行插拔等操作,以免損壞部件的外觀或?qū)е陆硬寮收希ɡ绮遽槒澢?、插針短路等)?確保設(shè)備接地良好。防靜電措施在運輸、保管部件的過程中,必須使用專用的防靜電袋與防靜電盒。更換過程中,部件應(yīng)放置在防靜電桌上。防靜電腕帶
28、分為插孔式的防靜電腕帶和帶金屬夾的防靜電腕帶兩種。對于插孔式的防靜電腕帶,需要將防靜電腕帶的接地端插入機柜的ESD(Electro Static Discharge )插孔。對于帶金屬夾的防靜電腕帶,需要將防靜電腕帶的金屬夾夾在機柜側(cè)面的方孔中。FRU更換工具FRU更換工具目前FRU更換工具支持在線更換硬盤、電源模塊、電纜(或光模塊)。目錄系統(tǒng)維護系統(tǒng)升級故障處理升級概述OceanStor 9000支持在線升級和離線升級兩種升級方式。在線升級是不需要中斷業(yè)務(wù)的升級方式,在升級過程中OceanStor 9000仍然可以為用戶提供業(yè)務(wù)。離線升級是需要中斷業(yè)務(wù)的升級方式,在升級過程中OceanSto
29、r 9000不能繼續(xù)為用戶提供業(yè)務(wù)。升級影響-對現(xiàn)行系統(tǒng)的影響在線升級方式對業(yè)務(wù)的影響如下: 在線升級過程不會影響業(yè)務(wù)正常運行。 在線升級方式單節(jié)點升級需要約30分鐘,且為保證業(yè)務(wù)不中斷,需要逐個節(jié)點進行升級,所以集群升級時間與集群內(nèi)節(jié)點數(shù)量相關(guān)。 升級某個節(jié)點時如果其他節(jié)點發(fā)生故障,可能導(dǎo)致部分業(yè)務(wù)數(shù)據(jù)無法訪問。 在全部節(jié)點升級成功之前用戶都只能使用舊版本的功能。離線升級方式對業(yè)務(wù)的影響如下:離線升級過程會中斷業(yè)務(wù)運行,業(yè)務(wù)中斷時間依賴于升級執(zhí)行時間。離線升級方式是集群中所有節(jié)點同時執(zhí)行升級操作,整個集群升級需要約1小時。升級影響-對現(xiàn)行系統(tǒng)的影響對網(wǎng)絡(luò)通信的影響在線升級和離線升級方式均對網(wǎng)
30、絡(luò)通信無影響。對管理功能的影響在線升級和離線升級方式在升級過程中,均只能提供查詢類管理功能,不能提供設(shè)置類管理功能。升級前準(zhǔn)備-升級前檢查檢查項目檢查標(biāo)準(zhǔn)建議起始時間 耗時準(zhǔn)備升級參考文檔升級操作人員已獲取參考文檔并熟練掌握相關(guān)說明和操作要點。升級前一周1小時獲取新版本的License文件(可選,若升級后需要更新License文件則需要獲?。┥壊僮魅藛T已申請新版本所需加載的License文件。升級前一周3小時準(zhǔn)備升級軟件包升級操作人員已獲取升級軟件包并完成校驗。升級前三天 1小時準(zhǔn)備升級工具升級操作人員已獲取升級所需工具并掌握使用方法。升級前三天3小時檢查設(shè)備運行狀態(tài)升級操作人員已完成設(shè)備運
31、行狀態(tài)檢查并排除現(xiàn)有告警和故障件更換。升級前一天3小時升級前準(zhǔn)備-升級工具工具名軟件名說明SSH工具putty.zip用戶準(zhǔn)備SSH工具SSHSecureShellClient-3.2.9.ext用戶準(zhǔn)備FTP工具wftpd32.exe用戶準(zhǔn)備巡檢工具OceanStor Toolkit V100R001CxxSPCxxx.zip請登錄華為官網(wǎng)下載升級流程圖升級步驟-上傳軟件包步驟1:打開瀏覽器(例如Internet Explorer),輸入存儲設(shè)備管理IP地址登錄OceanStor Toolkit,(例如0:8098/tools),默認(rèn)用戶名為admin,默認(rèn)密碼為Adminstorage。步
32、驟2:單擊“升級”,彈出“升級”窗口。步驟3:單擊“瀏覽”,選擇升級目標(biāo)版本的軟件包,單擊打開。步驟4:單擊“導(dǎo)入”,軟件包上傳成功后界面顯示“導(dǎo)入升級包成功”。步驟5:單擊“確定”后,單擊“下一步”,系統(tǒng)開始加載節(jié)點信息。升級步驟-選擇升級模式在“升級模式”后選擇“離線”,則采用離線升級模式進行升級操作;選擇“在線”,則采用在線升級模式進行升級操作。離線升級模式只能所有節(jié)點同時升級。在線升級模式可以所有節(jié)點同時升級,也可以選擇部分節(jié)點進行升級。如果只需要升級某個節(jié)點,可只選擇該節(jié)點前面的復(fù)選框。升級步驟-選擇升級模式選擇升級模式后可執(zhí)行“預(yù)檢測”和“啟動升級”操作。預(yù)檢測:操作只檢查存儲集群
33、是否滿足升級的條件,不執(zhí)行升級操作。啟動升級:操作會首先檢查存儲集群是否滿足升級條件,并在檢查通過時執(zhí)行升級操作。升級步驟-升級前預(yù)檢測升級前預(yù)檢測的目的是檢查設(shè)備是否符合升級條件,預(yù)檢測成功可進行升級操作,預(yù)檢測失敗則必須先處理檢測問題再進行升級。預(yù)檢測所需時間從5min到10min,若集群內(nèi)存在同步恢復(fù)操作時檢查時間較長。升級預(yù)檢測完成后,可以單擊“完成”結(jié)束操作,也可以單擊“啟動升級”直接進行升級操作。升級步驟-執(zhí)行升級操作離線升級和在線升級都包括“升級進程自升級” 、“下載升級包”、“升級前檢查”、“升級中”和“升級后驗證”幾個階段,界面上的“總體狀態(tài)”信息會根據(jù)升級所處的不同階段顯示
34、對應(yīng)的提示信息。升級完成并驗證成功后,“總進度”為100%,且每個節(jié)點的“升級狀態(tài)”為升級后驗證成功,“進度”為100%。若在離線升級的過程中有節(jié)點升級不成功,本次升級的所有節(jié)點會自動回滾,將版本退回到升級前的狀態(tài),待回滾結(jié)束后,可再次進行升級。若在在線升級的過程中有節(jié)點升級不成功,升級失敗的節(jié)點會自動回滾,將版本退回到升級前的狀態(tài)。版本回退采用離線升級方式時,任何一個節(jié)點升級失敗,本次離線升級的所有節(jié)點都會自動進行版本回退,無需人工干預(yù)。采用在線升級方式時,升級失敗的節(jié)點會自動進行版本回退,升級成功的節(jié)點不進行回退,無需人工干預(yù)。驗證升級結(jié)果驗證項目檢查標(biāo)準(zhǔn)收集存儲設(shè)備信息可通過信息收集工具
35、收集設(shè)備運行信息檢查系統(tǒng)狀態(tài)使用巡檢工具進行檢查,各檢查項結(jié)果均為通過檢查系統(tǒng)配置配置數(shù)據(jù)與升級前一致,系統(tǒng)配置不丟失注意事項(1)升級前請保證系統(tǒng)盤空閑空間至少大于4GB。升級前如果系統(tǒng)中存在故障節(jié)點或系統(tǒng)中集群版本(每個節(jié)點的版本和導(dǎo)入的升級包的版本)超過2個,不允許進行升級操作。打開升級界面后,OceanStor Toolkit會向OceanStor 9000查詢上一次上傳的升級包的位置、版本和上傳時間等信息。如果上述三個值不為空,則可以直接點擊“下一步”進行升級操作或查詢上次升級的進度。如果為空,則必須上傳升級包。升級和擴容操作不能同時進行。注意事項(2)升級過程中會出現(xiàn)節(jié)點的狀態(tài)為“
36、離線”或“故障”狀態(tài),屬于正?,F(xiàn)象,升級成功后即恢復(fù)正常,無需特殊處理。確保升級或者回退后,OceanStor 9000 產(chǎn)品與DeviceManager對應(yīng)的版本是匹配的。不支持deploy agent和驅(qū)動、OS補丁的單獨升級。升級過程中會切換操作系統(tǒng),這些組件的升級都是通過升級到新系統(tǒng)實現(xiàn)。目錄系統(tǒng)維護系統(tǒng)升級故障處理 先外部后內(nèi)部先高級后低級先共性后個別故障處理原則故障處理方法分析法替換法看告警信息并配合對性能數(shù)據(jù)的分析替換懷疑工作不正常的部件告警告警分為四種級別:緊急、重要、次要、警告告警通知:短信通知郵件通知聲音通知故障的分類設(shè)備類故障設(shè)備硬件、物理狀態(tài)相關(guān)問題部署擴容類故障部署和
37、擴容的軟件、硬件問題業(yè)務(wù)類故障以文件共享服務(wù)為主的各類業(yè)務(wù)功能故障管理類故障通過DeviceManager為主的管理工具修改、查看配置時遇到的故障設(shè)備類故障-基礎(chǔ)知識診斷流程和方案檢查硬件型號檢查接口、線纜連接問題更換故障部件修改軟件配置典型舉例-節(jié)點重啟后無法進入操作系統(tǒng)現(xiàn)象描述節(jié)點重啟后,停留在SAS卡初始化階段,無法進入操作系統(tǒng)。典型舉例-節(jié)點重啟后無法進入操作系統(tǒng)定位思路典型舉例-設(shè)備開機無法啟動現(xiàn)象描述按下系統(tǒng)電源開關(guān)時,系統(tǒng)電源指示燈不亮,系統(tǒng)無法開機。P25系統(tǒng)電源指示燈的位置如圖1所示;C36系統(tǒng)電源指示燈的位置如圖2所示。圖1圖2典型舉例-設(shè)備開機無法啟動定位思路部署擴容類故
38、障-基礎(chǔ)知識診斷流程和方案檢查信號線纜連接檢查節(jié)點是否恢復(fù)出廠設(shè)置檢查Deploy進程是否正常典型舉例-節(jié)點無響應(yīng)現(xiàn)象描述啟動部署后,部署工具界面提示“節(jié)點無響應(yīng)”??赡茉虿渴鸸ぞ吆蚫eploy版本不匹配,導(dǎo)致deploy消息解析失敗。典型舉例-節(jié)點無響應(yīng)定位思路用KVM登錄部署失敗的OceanStor 9000節(jié)點設(shè)備。執(zhí)行如下命令rpm -qa |grep deploy,查看deploy版本號。 顯示如下報文 deploy-V100R00 xC0 xB0 xx-1執(zhí)行如下命令,查看部署工具版本號。 cat /opt/Runtime/perties 顯示如下報文: =OceanStor ISM-N V100R00 xC0 xB0 xx subversion=OceanStor ISM-N V100R00 xC0 xB0 xx ismVer
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 前臺文員節(jié)假日工作安排計劃
- 提升跨文化溝通能力的方案計劃
- 會計人員的多元化發(fā)展路徑計劃
- 《常用化學(xué)軟件概述》課程教學(xué)大綱
- 小班感官體驗活動安排計劃
- 社會實踐與綜合調(diào)查活動計劃
- 中國傳統(tǒng)文化傳承與創(chuàng)新發(fā)展研究報告
- 七年級道德與法治上冊 第三單元 師長情誼 第七課 親情之愛 第1框家的意味教學(xué)實錄 新人教版
- 學(xué)校美術(shù)教學(xué)示范課設(shè)計計劃
- 2024年安徽七年級語文下學(xué)期期末基礎(chǔ)卷(解析版)
- 思想道德與法治教案第四章:明確價值要求踐行價值準(zhǔn)則
- 寧騷版《公共政策學(xué)》課后答案
- 氧氣安全標(biāo)簽
- 不經(jīng)歷風(fēng)雨怎么見彩虹》教學(xué)設(shè)計
- 二年級有余數(shù)的除法口算題1000道
- (綜合治理)修復(fù)工程指南(試行) - 貴州省重金屬污染防治與土壤修復(fù)網(wǎng)
- 員工就餐簽到表
- A-level項目介紹(課堂PPT)
- 航海計算軟件---ETA計算器
- 光伏電站運維手冊
- 半導(dǎo)體及集成電路領(lǐng)域的撰寫及常見問題
評論
0/150
提交評論