TD051201 T2000網(wǎng)管保護(hù)的維護(hù)ISSUE1.0_第1頁
TD051201 T2000網(wǎng)管保護(hù)的維護(hù)ISSUE1.0_第2頁
TD051201 T2000網(wǎng)管保護(hù)的維護(hù)ISSUE1.0_第3頁
TD051201 T2000網(wǎng)管保護(hù)的維護(hù)ISSUE1.0_第4頁
TD051201 T2000網(wǎng)管保護(hù)的維護(hù)ISSUE1.0_第5頁
已閱讀5頁,還剩22頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、課程 TD051201T2000網(wǎng)管保護(hù)的維護(hù)ISSUE1.0Huawei TechnologiesTD051201 T2000網(wǎng)管保護(hù)的維護(hù) ISSUE1.0目 錄目 錄課程說明1課程介紹1課程目標(biāo)1相關(guān)資料1第1章 SUN Cluster常用操作和故障處理21.1 常用操作21.1.1 啟動iManager T2000/StandBy 服務(wù)器21.1.2 停止iManager T2000/StandBy 服務(wù)器及 Cluster41.1.3 狀態(tài)檢查51.2 故障處理81.2.1 案例一 當(dāng)haT2000-ph1機(jī)器出現(xiàn)故障(如掉電)后,如何從故障模式恢復(fù)到正常模式?81.2.2 案例二

2、使用vxprint 命令顯示磁盤卷狀態(tài)為 disable 時(shí),如何解決?91.2.3 案例三 數(shù)據(jù)庫被掛起(Suspect)后如何解決?9第2章 SYBASE 復(fù)制服務(wù)器常用操作和故障處理102.1 常用操作102.1.1 啟動102.1.2 關(guān)機(jī)122.1.3 狀態(tài)查看132.2 故障處理162.2.1 案例一 如何進(jìn)行功能及性能測試162.2.2 案例二 數(shù)據(jù)如何恢復(fù)?17第3章 VERITAS常用操作和故障處理203.1 常用操作203.1.1 啟動203.1.2 關(guān)閉213.1.3 常用操作213.2 故障處理223.2.1 案例一 查看雙機(jī)主(備)節(jié)點(diǎn)運(yùn)行狀態(tài)信息(常用的查詢命令)2

3、23.2.2 案例二 本地cluster管理(VCS-veritas cluster server)無法啟動233.2.3 案例三 工作站異常掉電或異常關(guān)機(jī)導(dǎo)致SybRebVVR無法啟動233.2.4 案例四 雙機(jī)維護(hù)注意事項(xiàng)說明243.2.5 案例五 安裝完veritas雙機(jī)系統(tǒng)后需要做哪些測試?24附錄 縮略詞表25iTD051201 T2000網(wǎng)管保護(hù)的維護(hù) ISSUE1.0課程說明課程說明課程介紹本教材對應(yīng)的產(chǎn)品版本為:OptiX iManager T2000 V100R002版本。本課程介紹目前網(wǎng)上網(wǎng)管保護(hù)運(yùn)用的三種方案的雙機(jī)系統(tǒng)的日常操作及其故障的維護(hù)方法。課程目標(biāo)完成本課程學(xué)習(xí),

4、學(xué)員能夠: l 明確日常維護(hù)中最常用的操作任務(wù)。l 掌握常用的維護(hù)操作方法。l 掌握基本故障的解決方法。相關(guān)資料Sybase遠(yuǎn)程復(fù)制服務(wù)器系統(tǒng)軟件安裝指導(dǎo)書Veritas遠(yuǎn)程熱備份系統(tǒng)軟件安裝指導(dǎo)書本地雙機(jī)StandBy安裝手冊24TD051201 T2000網(wǎng)管保護(hù)的維護(hù) ISSUE1.0第3章 VERITAS常用操作和故障處理第1章 SUN Cluster常用操作和故障處理1.1 常用操作1.1.1 啟動iManager T2000/StandBy 服務(wù)器1. 啟動Sun Cluster在haT2000-ph1機(jī)器上執(zhí)行 命令啟動Sun cluster#scadmin startclust

5、er haT2000-ph1 haT2000等haT2000-ph1機(jī)器上的cluster起來之后,在haT2000-ph2機(jī)器上執(zhí)行下面的命令啟動haT2000-ph2上的Cluster#scadmin startnode& 說明:本手冊中表示root用戶,$表示sybase用戶; 2. 啟動數(shù)據(jù)庫服務(wù)在任何一臺機(jī)器上使用下面命令啟動sybase注冊服務(wù)#hareg -y sybaseSybase 服務(wù)啟動之后,在haT2000-ph1機(jī)器上使用下面的命令啟動T2000DBServer監(jiān)控服務(wù),T2000DBServer監(jiān)控服務(wù)會使用注冊腳本自動啟動T2000DBServer數(shù)據(jù)庫服務(wù) #h

6、asybase start T2000DBServer3. 啟動iManager T2000/StandBy 應(yīng)用服務(wù)在haT2000-ph1機(jī)器上使用下面的命令啟動T2000log邏輯主機(jī)的haT2k服務(wù):#hareg -y haT2khaT2k會通過注冊腳本自動啟動mdp 、ems、ss、toposvr進(jìn)程。iManager T2000/StandBy應(yīng)用服務(wù)啟動后,客戶端可以通過網(wǎng)絡(luò)連接mdp進(jìn)程的IP地址登錄iManager T2000/StandBy。(該mdp進(jìn)程的IP地址同T2000log的IP地址)4. 啟動T2000HA到正常模式(此步為前三步的綜合描述)啟動haT2000-

7、ph1和haT2000-ph2機(jī)器,以root用戶登錄系統(tǒng),在haT2000-ph1機(jī)器上執(zhí)行命令:#scadmin startcluster haT2000-ph1 haT2000啟動Cluster管理系統(tǒng),需要等待3分鐘讓Cluster完全啟動。第1步啟動完成后,T2000log邏輯主機(jī)會被haT2000-ph1接管,此時(shí)在haT2000-ph2機(jī)器上執(zhí)行命令:#scadmin startnode將haT2000-ph2加入Cluster管理系統(tǒng),這一步執(zhí)行完成后,haT2000-ph1和haT2000-ph2都加入到Cluster系統(tǒng)管理中,兩臺機(jī)器已同步。在haT2000-ph1機(jī)器上

8、執(zhí)行下面的命令:#hareg -y sybase#hasybase start T2000DBServer正常情況下,會同時(shí)啟動T2000DBServer服務(wù)器和它的故障監(jiān)控程序hasybase_fmon在haT2000-ph1上執(zhí)行命令:#hareg -y haT2k 啟動haT2k監(jiān)控服務(wù)和它管理的四個(gè)進(jìn)程ems、mdp、ss、toposvr, 這一過程需要等待35分鐘讓ems加載靜態(tài)數(shù)據(jù)。完成上面的4步之后T2000HA的服務(wù)器端就啟動完成了,此時(shí)啟動本地或遠(yuǎn)程的T2000 Client連接到T2000log邏輯主機(jī)的IP地址上就可以登錄并使用T2000HA網(wǎng)管了!T2000/HA在正常

9、模式下,所有監(jiān)控服務(wù)都要打開,如果沒有打開,出現(xiàn)故障時(shí)將不能做故障倒換。使用命令 #hareg 檢查 sybase、haT2k 的監(jiān)控服務(wù)是否都是 on 狀態(tài),如果是off 狀態(tài),使用 下面的命令分別打開它們#hareg -y sybase #hareg -y haT2k使用命令:#hasybase list檢查T2000DBServer的監(jiān)控服務(wù)是否都是on 狀態(tài),如果是off 狀態(tài),使用下面的命令打開它#hasybase start T2000DBServer1.1.2 停止iManager T2000/StandBy 服務(wù)器及 Cluster 注意:在關(guān)閉T2000HA系統(tǒng)之前,T200

10、0HA應(yīng)處于正常模式。停止iManager T2000/StandBy 服務(wù)器及Cluster的步驟和啟動的步驟相反,主要分為:1. 停止IManager T2000/StandBy 應(yīng)用服務(wù)在haT2000-ph1機(jī)器上使用下面的命令停止T2000log邏輯主機(jī)的haT2k服務(wù)#hareg -n haT2khaT2k會通過注冊腳本自動關(guān)閉mdp 、ems、ss、toposvr進(jìn)程。2. 停止數(shù)據(jù)庫服務(wù)在T2000DBServer運(yùn)行的機(jī)器上使用下面的命令停止T2000DBServer監(jiān)控服務(wù)#hasybase stop T2000DBServer停止T2000DBServe監(jiān)控服務(wù)之后,需要

11、停止T2000DBerver數(shù)據(jù)庫服務(wù),使用下面命令:#su -u sybase$isql -Usa -P -ST2000DBServer1shutdown2 go在任何一臺機(jī)器上使用下面命令停止sybase注冊服務(wù)#hareg -n sybase3. 停止Sun Cluster。在haT2000-ph2機(jī)器上執(zhí)行 命令#scadmin stopnode等haT2000-ph2機(jī)器上的Cluster停止之后,在haT2000-ph1機(jī)器上執(zhí)行命令#scadmin stopnode 到此為止,就停止了iManager T2000/StandBy 服務(wù)器及 Cluster。1.1.3 狀態(tài)檢查1.

12、 檢測Cluster系統(tǒng)層的安裝狀態(tài)Cluster系統(tǒng)層是指Solaris操作系統(tǒng) 、Volumn Manager管理軟件、rootdg劃分、Cluster系統(tǒng)軟件、T2000dg劃分、邏輯主機(jī)和HA文件系統(tǒng)都已安裝配置完成之后所組建的系統(tǒng)層。它是上面應(yīng)用層運(yùn)行的基礎(chǔ),那么如何檢測Cluster系統(tǒng)層安裝配置狀態(tài)正常呢? 啟動Cluster管理系統(tǒng),在haT2000-ph1、haT2000-ph2機(jī)器上啟動Cluster的過程中,需要仔細(xì)查看監(jiān)控口的輸出信息,這些監(jiān)控信息能夠很好的顯示Cluster啟動過程,如果Cluster 啟動不成功或者邏輯主機(jī)不能成功接管,這些監(jiān)控信息對我們定位問題就大

13、有幫助了!Cluster管理系統(tǒng)安裝配置正常的狀態(tài)應(yīng)該是:1)haT2000-ph1和haT2000-ph2兩臺機(jī)器都是Cluster 系統(tǒng)的成員,可以在任何一臺機(jī)器上使用 #hastat 命令檢查2)T2000log邏輯主機(jī)接管在haT2000-ph1機(jī)器上,可以在haT2000-ph1上使用 #haget -f mastered 命令檢查在任意一臺機(jī)器上執(zhí)行命令 #haswitch haT2000-ph2 T2000log 都能夠?qū)2000log邏輯主機(jī)從haT2000-ph1上切換到haT2000-ph2上,切換過程需要兩分鐘時(shí)間,請仔細(xì)查看兩臺機(jī)器監(jiān)控窗口打印的Cluster切換信息

14、,這些信息對切換不成功的問題定位大有幫助!再使用命令:#haswitch haT2000-ph1 T2000log把T2000log邏輯主機(jī)切換回haT2000-ph1物理主機(jī)。進(jìn)行完上面的步驟后T2000log邏輯主機(jī)綁定在haT2000-ph1上。此時(shí)關(guān)閉haT2000-ph1機(jī)器的電源,等待3分鐘后T2000log邏輯主機(jī)能夠自動切換到haT2000-ph2機(jī)器上并被它接管,此時(shí)在haT2000-ph2上使用命令:#haget -f mastered可以看到T2000log在haT2000-ph2上。打開haT2000-ph1機(jī)器的電源,以root用戶登錄系統(tǒng)。執(zhí)行命令:#scadmin

15、 startnode 將haT2000-ph1機(jī)器加入到Cluster管理系統(tǒng)中。在任何一臺機(jī)器上執(zhí)行命令:#haswitch haT2000-ph1 T2000log都能夠?qū)2000log邏輯主機(jī)從haT2000-ph2上切換到haT2000-ph1上。此時(shí)Cluster管理系統(tǒng)又恢復(fù)到了正常模式T2000log被haT2000-ph1接管。如果執(zhí)行倒換后結(jié)果全部正確,恭喜您,Cluster系統(tǒng)層安裝配置狀態(tài)正常。下一步可以檢查Sybase數(shù)據(jù)庫系統(tǒng)層的安裝配置狀態(tài)了。2. 檢測Sybase數(shù)據(jù)庫系統(tǒng)層的安裝狀態(tài)Sybase數(shù)據(jù)庫系統(tǒng)層是基于Cluster系統(tǒng)層之上、T2000HA Ser

16、ver應(yīng)用層之下的中間層。那么如何檢測Sybase數(shù)據(jù)庫系統(tǒng)層安裝狀態(tài)呢?方法如下:啟動Cluster管理系統(tǒng),等完全啟動后,在haT2000-ph1機(jī)器上切換到sybase用戶、啟動T2000DBServer數(shù)據(jù)庫服務(wù)器,步驟如下: #su -u sybase$cd /opt/sybase/ASE-12_0/install$./startserver -f ./RUN_T2000DBServer$exit (退回到root用戶環(huán)境)請仔細(xì)檢查啟動T2000DBServer數(shù)據(jù)庫服務(wù)器時(shí)的窗口輸出信息(或者到/opt/sybase/ASE-12_0/install 查看 T2000DBServ

17、er.log日志文件),這對定位T2000DBServer數(shù)據(jù)庫服務(wù)器起不來的問題很有幫助。如果執(zhí)行上面的步驟后結(jié)果全部正確,恭喜您,Sybase數(shù)據(jù)庫系統(tǒng)層已安裝配置正常。下一步可以檢測T2000HA應(yīng)用層的安裝狀態(tài)了。3. 檢測T2000HA應(yīng)用層的安裝狀態(tài)T2000HA應(yīng)用層是運(yùn)行在Cluster系統(tǒng)層和Sybase數(shù)據(jù)庫系統(tǒng)層之上的一層,如果要保證雙機(jī)系統(tǒng)能夠?qū)ν馓峁┓€(wěn)定正常的T2000 Server端應(yīng)用服務(wù)并進(jìn)行故障恢復(fù),這一層必須進(jìn)行安裝狀態(tài)檢查。啟動Cluster管理系統(tǒng)并啟動數(shù)據(jù)庫服務(wù),在haT2000-ph1上執(zhí)行命令:#hareg -y haT2k啟動haT2k監(jiān)控服務(wù)和

18、它綁定的四個(gè)進(jìn)程ems、mdp、ss、toposvr,這一過程需要等待35分鐘讓ems加載靜態(tài)數(shù)據(jù),加載成功后,啟動本地或遠(yuǎn)程的T2000 Client連接到T2000log邏輯主機(jī)的IP地址上,T2000的客戶端必須能夠連接上MDP并加載靜態(tài)數(shù)據(jù)進(jìn)入到主拓?fù)浣缑?,如果不成功說明上面的哪一步出現(xiàn)了問題,請根據(jù)上面各步驟輸出的監(jiān)控信息定位并解決問題!在上述安裝配置狀態(tài)正常情況下可以開始做故障倒換測試,先測試haT2000-ph1故障時(shí),haT2000-ph2機(jī)器的故障接管能力。關(guān)斷haT2000-ph1機(jī)器的電源,密切檢查haT2000-ph2機(jī)器監(jiān)控窗口的輸出信息,正常狀況下45分鐘后T200

19、0主機(jī)連同T2000DB的數(shù)據(jù)庫、haT2k上的四個(gè)進(jìn)程都會遷移到haT2000-ph2上面,T2000HA進(jìn)入故障接管模式,由haT2000-ph2一臺機(jī)器接管所有服務(wù)、向外提供T2000 Server端的服務(wù),此時(shí)再次啟動本地或遠(yuǎn)程的T2000 Client連接到T2000DBlog邏輯主機(jī)的IP地址上,T2000的客戶端應(yīng)該能夠連接上MDP并加載靜態(tài)數(shù)據(jù)進(jìn)入到主拓?fù)浣缑妫绻怀晒φf明上面的哪一步出現(xiàn)了問題,請根據(jù)上面各步驟輸出的監(jiān)控信息定位并解決問題!如果執(zhí)行上面的步驟后結(jié)果全部正確,恭喜您,T2000HA系統(tǒng)安裝配置狀態(tài)正常。1.2 故障處理1.2.1 案例一 當(dāng)haT2000-ph

20、1機(jī)器出現(xiàn)故障(如掉電)后,如何從故障模式恢復(fù)到正常模式?啟動HAT2000系統(tǒng)到正常模式,當(dāng)haT2000-ph1機(jī)器出現(xiàn)故障(如掉電)后,這種正常模式將被打破。T2000log邏輯主機(jī)將從haT2000-ph1上切換到haT2000-ph2上,T2000log邏輯主機(jī)上綁定的所有服務(wù)如haT2k都將被haT2000-ph2機(jī)器接管,這時(shí)就進(jìn)入了T2000HA的故障模式 , 那么如何從這種T2000HA的故障模式恢復(fù)到正常模式呢?請按照下面的步驟進(jìn)行:如果haT2000-ph1因掉電還沒有啟動,則啟動haT2000-ph1機(jī)器以root用戶登錄,執(zhí)行命令 #scadmin startnode

21、 將haT2000-ph1加入Cluster管理系統(tǒng)中,這一步需要等待3分鐘讓Cluster啟動完成。在haT2000-ph2機(jī)器上執(zhí)行下面的命令切換T2000log邏輯主機(jī)#haswitch haT2000-ph1 T2000log完成上面的2步之后T2000HA的服務(wù)器端就啟動完成了,此時(shí)啟動本地或遠(yuǎn)程的T2000 Client連接到T2000log邏輯主機(jī)的IP地址上就可以登錄并使用T2000HA網(wǎng)管了T2000/HA在正常模式時(shí),所有監(jiān)控服務(wù)都要打開,如果沒有打開,出現(xiàn)故障時(shí)將不能做故障倒換。使用命令 #hareg 檢查 sybase、haT2k 的監(jiān)控服務(wù)是否都是 on 狀態(tài),如果是

22、off 狀態(tài),使用 下面的命令分別打開他們#hareg -y sybase #hareg -y haT2k使用命令 #hasybase list 檢查T2000DBServer的監(jiān)控服務(wù)是否都是on 狀態(tài),如果是off 狀態(tài),使用下面的命令分別打開他們#hasybase start T2000DBServer1.2.2 案例二 使用vxprint 命令顯示磁盤卷狀態(tài)為 disable 時(shí),如何解決?如果使用vxprint命令顯示磁盤卷的狀態(tài)為disable,則磁盤卷將不能正常工作,必須修復(fù),此時(shí)先看看狀態(tài)為disable的磁盤卷屬于哪個(gè)磁盤組(T2000dg),然后使用命令 #vxvol -g

23、 T2000dg startall 就可以修復(fù)1.2.3 案例三 數(shù)據(jù)庫被掛起(Suspect)后如何解決? 出現(xiàn)數(shù)據(jù)庫被掛起(Suspect)多半是對數(shù)據(jù)庫的異常操作引起的,可以使用下面的isql 命令檢測一下哪些庫被掛起了(執(zhí)行下面的操作之前需要將Cluster系統(tǒng)啟動到正常模式,啟動T2000DBServer數(shù)據(jù)庫服務(wù)器但不要啟動T2000HA應(yīng)用服務(wù)haT2k) #su -u sybase$isql -Usa -P -ST2000DBServer1use master2go1select name,status from sysdatabases2go執(zhí)行上面的命令后顯示status值

24、=320的庫都是被掛起(Suspect) 的庫,使用下面的isql命令來恢復(fù)這些掛起的庫:1sp_configure allow updates,12go1update sysdatabases set status=status-320 where status =3202go重起T2000DBServer數(shù)據(jù)庫服務(wù)器1shutdown2go$cd /opt/sybase/ASE-12_0/install$./startserver -f ./RUN_T2000DBServer打印出的信息中沒有數(shù)據(jù)庫被掛起的信息,那么可以正常使用數(shù)據(jù)庫了! 第2章 SYBASE 復(fù)制服務(wù)器常用操作和故障處理

25、2.1 常用操作2.1.1 啟動檢查Sybase雙機(jī)正常情況下主機(jī)和備機(jī)的server啟動情況:主機(jī)正常應(yīng)啟動兩個(gè)服務(wù)器:T2000DBServer、T2000DBServer_back$ ps -ef |grep sybase sybase 303 1 0 1月 14 ? 0:00 /bin/sh /opt/sybase/ASE-12_0/install/RUN_T2000DBServer_back sybase 309 303 0 1月 14 ? 0:00 /opt/sybase/ASE-12_0/bin/backupserver -ST2000DBServer_back -e/opt/s

26、ybase/ASE-12 sybase 877 875 0 1月 15 ? 0:02 /opt/sybase/ASE-12_0/bin/backupserver -ST2000DBServer_back -e/opt/sybase/ASE-12 sybase 880 879 0 1月 15 ? 8:57 /opt/sybase/ASE-12_0/bin/dataserver -sT2000DBServer -d/opt/sybase/data/master_d sybase 881 880 0 1月 15 ? 4:50 /opt/sybase/ASE-12_0/bin/dataserver -

27、ONLINE:1,0,0x10f5513, f6800000, 0x7528000, sybase 2298 2293 0 14:04:59 pts/4 0:00 grep sybase 備機(jī)正常應(yīng)啟動四個(gè)服務(wù)器:T2000DBServer、T2000DBServer_back、T2000RepServer、T2000RsmServer$ ps -ef |grep sybase sybase 340 326 0 11:38:34 ? 1:39 /opt/sybase/ASE-12_0/bin/dataserver -ONLINE:1,0,0xe90f547d, f6800000, 0x750c

28、000 sybase 324 1 0 11:38:12 ? 0:00 /bin/sh /opt/sybase/ASE-12_0/install/RUN_T2000DBServer sybase 326 324 0 11:38:12 ? 1:37 /opt/sybase/ASE-12_0/bin/dataserver -sT2000DBServer -d/opt/sybase/data/master_d sybase 331 1 0 11:38:12 ? 0:00 /bin/sh /opt/sybase/ASE-12_0/install/RUN_T2000DBServer_back sybase

29、 337 331 0 11:38:12 ? 0:00 /opt/sybase/ASE-12_0/bin/backupserver -ST2000DBServer_back -e/opt/sybase/ASE-12 sybase 461 460 0 12:29:25 pts/1 0:19 /opt/sybase/REP-12_5/bin/repserver -ST2000RepServer -C/opt/sybase/REP-12_5/inst sybase 465 453 0 12:29:53 pts/1 0:00 /bin/sh ./RUN_T2000RsmServer sybase 466

30、 465 0 12:29:53 pts/1 0:02 /opt/sybase/RSM-12_5/bin/rsmsrvr -S T2000RsmServer -s /opt/sybase -o RSM-12_5 - sybase 506 482 0 14:12:51 pts/4 0:00 grep Sybase檢查服務(wù)器是否啟動還可以使用isql 登錄服務(wù)器,如果登錄上則表示服務(wù)器正常啟動,反之服務(wù)器沒有啟動。如查看T2000RepServer是否啟動$ cd /opt/sybase/OCS-12_0/bin$ ./isql -ST2000RepServer -Usa -P1出現(xiàn)1表示登錄成功,

31、T2000RepServer正常啟動。如果采用上述方法檢查某個(gè)服務(wù)器沒有啟動,則應(yīng)手工啟動服務(wù)器。手工啟動兩臺工作站上的Server1.備機(jī)的四個(gè)Server的啟動方法分別是:啟動T2000DBServer$cd /opt/sybase/ASE-12_0/install$startserver -f T2000DBServer啟動T2000DBServer_back$cd /opt/sybase/ASE-12_0/install$startserver -f T2000DBServer_back啟動T2000RepServer$cd /opt/sybase/REP-12_0/install$.

32、/RUN_T2000RepServer &啟動T2000RsmServer$cd /opt/sybase/RSM-12_0/install$./RUN_T2000RsmServer &2. 主機(jī)的兩個(gè)Server的啟動方法:啟動T2000DBServer$cd /opt/sybase/ASE-12_0/install$startserver -f T2000DBServer啟動T2000DBServer_back$cd /opt/sybase/ASE-12_0/install$startserver -f T2000DBServer_back啟動后,再按前面的方法檢查是否啟動成功。2.1.2

33、關(guān)機(jī)在主機(jī)上運(yùn)行:1. 如果T2000在運(yùn)行的話,請先停掉T2000的Server及client。2. 關(guān)T2000DBServer$su - sybase$isql -Usa -P -ST2000DBServer1shutdown2go最后就可以關(guān)機(jī)或重啟了。在備機(jī)上運(yùn)行:1. 如果T2000在運(yùn)行的話,請先停掉T2000的Server及client ,實(shí)際上這一步一般是不會執(zhí)行到的,因?yàn)閭錂C(jī)的T2000不用于運(yùn)行,除非主機(jī)已無法恢復(fù)。 2. 然后關(guān)閉T2000RepServer$su - sybase$isql -Usa -P -ST2000RepServer1shutdown2go3.

34、再關(guān)閉T2000RsmServer$su - sybase$isql -Usa -P -ST2000RsmServer1shutdown2go4. 最后關(guān)閉T2000DBServer$su - sybase1$isql -Usa -P -ST2000DBServer1shutdown2go最后就可以關(guān)機(jī)或重啟了。2.1.3 狀態(tài)查看通過啟動 Rsm Client(sybase central),檢查驗(yàn)證雙機(jī)狀態(tài)的正確性:確定主機(jī),備機(jī),PC機(jī)三者之間都連接并保證網(wǎng)絡(luò)通暢后,從開始菜單里按這個(gè)路徑一路找過去:Startup/Program/Sybase/Sybase Central就能打開Rsm

35、 client。連接上各Server后應(yīng)該看到如下界面:右邊的窗口中出現(xiàn)的各項(xiàng)都顯示UP狀態(tài),表明此時(shí)各連接工作正常,異地復(fù)制的功能已啟動。如果某項(xiàng)顯示DOWN,則需要啟動一下,方法如下,在該項(xiàng)上點(diǎn)右鍵,選擇右鍵菜單中的Resume項(xiàng)。出現(xiàn)如下對話框:如果是Replication Agent Status一欄顯示DOWN,需要選中圖中Resume replication agent的checkbox,如果是DSI Status一欄顯示DOWN,需要選中圖中Resume DSI的checkbox,如果兩者都是DOWN的,則請同時(shí)選中對應(yīng)的checkbox,然后點(diǎn)OK按鈕啟動被DOWN掉的線程。如

36、果按上面的操作多試幾次始終不能將全部線程UP起來,則需要重建相應(yīng)的連接了,重建之前選刪掉相應(yīng)的連接。刪掉連接的操作同樣在右鍵菜單里的倒數(shù)第二項(xiàng)“Delete”。從前面的圖中可以看出,我們是為T2000的5個(gè)數(shù)據(jù)庫,主機(jī)和備機(jī)上都分別建了一個(gè)連接。另外還有一個(gè)RSSD數(shù)據(jù)庫的連接,這個(gè)一般情況不用理會。例如T2000DBServer_2.iMapTopoDB的DSI Status狀態(tài)顯示為DOWN,按上面的操作試過多次后也不能重新UP起來,則刪除連接時(shí)需要刪除T2000DBServer_1.iMapTopoDB及T2000DBServer_2.iMapTopoDB兩個(gè)連接,其它連接如果是UP的,

37、就不用管。然后就是重建連接的過程,請參照Sybase遠(yuǎn)程復(fù)制服務(wù)器系統(tǒng)軟件安裝指導(dǎo)書。簡而言之,要讓異地復(fù)制系統(tǒng)工作起來,首先需要保證主備兩臺工作站的各個(gè)Server已正常啟動;然后Rsm client上顯示與兩臺工作站的各數(shù)據(jù)庫的連接都是UP狀態(tài)的就可以了。2.2 故障處理2.2.1 案例一 如何進(jìn)行功能及性能測試測試方案一:1. 先查詢主機(jī)的告警記錄條數(shù)$su - sybase$isql -Usa -P -ST2000DBServer_11use iMapAlarmDB2go1select count(*) from tbl_AlarmData2go到這里會返回告警記錄條數(shù),假設(shè)這里的告警

38、記錄數(shù)據(jù)是0條。2. 然后在備機(jī)上再用同樣的方法查備機(jī)上的告警記錄條數(shù),也應(yīng)該是0條。$su - sybase$isql -Usa -P -ST2000DBServer_21use iMapAlarmDB2go1select count(*) from tbl_AlarmData2go2. 啟動主機(jī)上的T2000 Server及T2000 Client,建好網(wǎng)元,配好業(yè)務(wù)。如果有告警上來,主機(jī)機(jī)上的tbl_AlarmData表中的記錄數(shù)將首先改變,然后會同步到備機(jī)上,備機(jī)上的告警記錄數(shù)也會保持一致,因此再重復(fù)做步驟1中的操作觀察兩邊的記錄數(shù)是否一致,如果一致,則說明系統(tǒng)工作正常,確實(shí)在進(jìn)行異地

39、復(fù)制了。對于這兩步過程,我們還可以使用tbl_Log表來判斷,T2000中的大部分操作都會記錄在這個(gè)表中,因此按照異地復(fù)制的原理,有操作記錄記到了主機(jī)機(jī)的tbl_Log表中,它也應(yīng)該被記到備機(jī)的tbl_Log表中。1.查詢主機(jī)的日志記錄條數(shù)$su - sybase$isql -Usa -P -ST2000DBServer_11use iMapLogDB2go1select count(*) from tbl_Log2go2. 查詢備機(jī)的日志記錄條數(shù)$su - sybase$isql -Usa -P -ST2000DBServer_21use iMapLogDB2go1select count(

40、*) from tbl_Log2go然后在T2000里做一些操作之后,再重復(fù)這兩步,比較兩邊的日志記錄數(shù)是否相同。測試方案二:1. 將備機(jī)的網(wǎng)線拔掉,使得數(shù)據(jù)只能積累在主機(jī)上,這時(shí)試著讓網(wǎng)元產(chǎn)生大量告警,同時(shí)也反復(fù)使用前面的命令查詢tbl_AlarmData表中的記錄數(shù)(也就是告警條數(shù)),讓它達(dá)到30000至50000條。2. 然后連上備機(jī)的網(wǎng)線,數(shù)據(jù)將自動進(jìn)行同步,我們使用如下命令查詢同步的記錄數(shù)$su - sybase$isql -Usa -P -ST2000DBServer_21use iMapAlarmDB2go1select count(*) from tbl_AlarmData2g

41、o反復(fù)執(zhí)行上述查詢命令查詢記錄數(shù),每次查得的記錄數(shù)都在快速增長的話,說明同步正在進(jìn)行,而且還可以估算出同步這幾萬條告警記錄需要的大致時(shí)間。2.2.2 案例二 數(shù)據(jù)如何恢復(fù)?實(shí)際使用的情況是,當(dāng)主機(jī)發(fā)生了故障修復(fù)后,我們需要將備機(jī)中數(shù)據(jù)庫中的數(shù)據(jù)dump出來,再load到主機(jī)數(shù)據(jù)庫中,主機(jī)的T2000就應(yīng)該能正常繼續(xù)工作,也就達(dá)到了數(shù)據(jù)備份容災(zāi)的目的,步驟如下:1. 停掉應(yīng)用T2000 Server及T2000 Client2. 在PC機(jī)上的Rsm Client中刪掉連接,同時(shí)包括邏輯連接。3. 將備機(jī)上的5個(gè)T2000的數(shù)據(jù)庫dump出來。操作如下:以iMapLogDB為例1)su - syb

42、ase 2) $cd /opt/syabse3)$ mkdir dumpdata (如果目錄dumpdata已經(jīng)存在,這一步就不用執(zhí)行)4) $isql -Usa -P -ST2000DBServer_21dump database iMapLogDB to /opt/syabse/dumpdata/iMapLogDB.bak2go對其它4個(gè)數(shù)據(jù)庫重復(fù)藍(lán)色字的操作,最后將得到iMapAlarmDB.bak、iMapLogDB.bak、iMapSecurityDB.bak、iMapTopoDB.bakiMapT2000DB.bak共5個(gè)文件。4. 用ftp傳到主機(jī)上去將第3步中得到的5個(gè).bak

43、文件用ftp的bin方式傳到主機(jī)機(jī)上去,假設(shè)傳到了/opt/sybase/loaddata目錄下,沒有l(wèi)oaddata目錄的話,可以在/opt/sybase目錄下自行創(chuàng)建一個(gè)。5. shutdown 備機(jī)上的RepServer$isql -Usa -P -ST2000RepServer1shutdown2go6. shutdown 主機(jī)上的T2000DBServer_1$isql -Usa -P -ST2000DBServer_11shutdown2go7. 重啟主機(jī)上的T2000DBServer_1$cd /opt/sybase/ASE-12_0/install$startserver -f

44、 T2000DBServer_18. 重啟備機(jī)上的T2000RepServer(如果已經(jīng)存在則不需再啟動)$cd /opt/sybase/REP-12_0/install$./RUN_T2000RepServer &9. load到主機(jī)的數(shù)據(jù)庫中。$isql -Usa -P -ST2000DBServer_11load database iMapLogDB from /opt/sybase/loaddata/iMapLogDB.bak2goload完成后,需要online 數(shù)據(jù)庫1online database iMapLogDB2go對其它4個(gè)數(shù)據(jù)庫也要做load和online的操作。10.

45、 在Rsm Client(sybase central)中再全部重建連接并激活Rep Agent及DSI線程(PC機(jī)上操作)參見Sybase遠(yuǎn)程復(fù)制服務(wù)器系統(tǒng)軟件安裝指導(dǎo)書。11. 重啟T2000 Server及Client,如果創(chuàng)建的網(wǎng)元都在,業(yè)務(wù)和告警都正常,就說明數(shù)據(jù)恢復(fù)成功了。第3章 VERITAS常用操作和故障處理3.1 常用操作3.1.1 啟動1. 啟動卷管理器VM(volumn manager)vmsa &進(jìn)入VM需要用戶和密碼, VM的初始用戶和密碼是user:admin password:password通過VM可以創(chuàng)建卷,刪除卷,修復(fù)卷等管理操作。附:增加維護(hù)級用戶命令ha

46、conf -makerwhauser -add roothaclus -modify Administrators -add roothaconf -dump -makero說明上述操作是增加root用戶,其用戶級別是Administrators2. 啟動本地cluster集群管理器(VCS-veritas cluster server) 使用hastatus -sum查看cluster service是否為online狀態(tài)。如果為online狀態(tài),則可以打開VCS的gui進(jìn)行操作管理hagui &正常安裝情況下,veritas本地cluster集群管理是自動啟動的。不再需要手工啟動。手工啟動

47、:hastart -onenode 3.1.2 關(guān)閉手工關(guān)閉:hastop -all關(guān)閉后可以查詢狀態(tài)hastatus -sum正常關(guān)閉應(yīng)返回如下信息Local system not available 如果只想關(guān)閉cluster集群管理軟件本身,而不想關(guān)閉網(wǎng)管應(yīng)用請使用:hastop -all force這樣cluster軟件雖已經(jīng)關(guān)閉,但T2000仍正常運(yùn)行。3.1.3 常用操作1. 啟動WEB控制臺進(jìn)行雙機(jī)應(yīng)用操作管理web控制臺用來管理雙機(jī),包括VCS和GCM(Globle cluster manager);web控制臺使用web瀏覽器登錄,可以運(yùn)行在與雙機(jī)服務(wù)器同一個(gè)網(wǎng)絡(luò)的任何機(jī)器上。打開Web控制臺的操作如下:1.打開IE或Netscape瀏覽器2.在地址欄中輸入WebIp8181 (每臺雙機(jī)主備服務(wù)器都有一個(gè)Webip)如: 13:81813.2 故障處理3.2.1 案例一 查看雙機(jī)主(備)節(jié)點(diǎn)運(yùn)行狀態(tài)信息(常用的查詢命令)利用雙機(jī)系統(tǒng)提供的查看當(dāng)前節(jié)點(diǎn)狀態(tài)的腳本:display_primary_info(display_secondary_info 查看備節(jié)點(diǎn)信息)diaplay_primary_info(查看主節(jié)點(diǎn)信息)查看雙機(jī)主備節(jié)點(diǎn)狀態(tài)vradmin printrvgReplicated Data Set: t20

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論