IBMHACMP雙機統(tǒng)服務器系統(tǒng)的解決方案_第1頁
IBMHACMP雙機統(tǒng)服務器系統(tǒng)的解決方案_第2頁
IBMHACMP雙機統(tǒng)服務器系統(tǒng)的解決方案_第3頁
IBMHACMP雙機統(tǒng)服務器系統(tǒng)的解決方案_第4頁
IBMHACMP雙機統(tǒng)服務器系統(tǒng)的解決方案_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、IBM HACMP雙機服務器系統(tǒng)的解決方案Hacmp(High Availability Cluster Multi-Processing)雙機熱備份軟件的主要功能是提高客戶計算機系統(tǒng)及其應用的可靠性,而不是單臺主機的可靠性。一、Hacmp雙機系統(tǒng)的工作原理HACMP的工作原理是利用LAN來監(jiān)控主機及網絡、網卡的狀態(tài)。在一個HACMP環(huán)境中有TCP/IP網絡和非TCP/IP網絡。TCP/IP網絡即應用客戶端訪問的公共網,該網可以是大多數AIX所支持的網絡,如Ethernet,T.R.,FDDI,ATM,SOCC,SLIP,等等。 非TCP/IP網絡用來為HACMP對HA環(huán)境(Cluster)中

2、的各節(jié)點進行監(jiān)控而提供的一個替代TCP/IP的通訊路徑,它可以是用RS232串口線將各節(jié)點連接起來,也可以是將各節(jié)點的SCSI卡或SSA卡設置成Target Mode方式。1、作為雙機系統(tǒng)的兩臺服務器(主機A和B)同時運行Hacmp軟件;    2、服務器除正常運行自機的應用外,同時又作為對方的備份主機;    3、兩臺主機系統(tǒng)(A和B)在整個運行過程中,通過 “心跳線”相互監(jiān)測對方的運行情況(包括系統(tǒng)的軟硬件運行、網絡通訊和應用運行情況等);    4、一旦發(fā)現對方主機的運行不正常(出故障)時,故障機上

3、的應用就會立即停止運行,本機(故障機的備份機)就會立即在自己的機器上啟動故障機上的應用,把故障機的應用及其資源(包括用到的IP地址和磁盤空間等)接管過來,使故障機上的應用在本機繼續(xù)運行;    5、應用和資源的接管過程由Ha軟件自動完成,無需人工干預;6、當兩臺主機正常工作時,也可以根據需要將其中一臺機上的應用人為切換到另一臺機(備份機)上運行。HACMP雙機系統(tǒng)結構圖(點擊看大圖) 二、Hacmp安裝配置前需作的準備工作1、劃分清楚兩臺服務器主機各自要運行的應用(如A機運行應用,B機作為standby);2、給每個應用(組)分配Service_ip、Standb

4、y_ip、boot_ip和心跳線tty,如:主機A(運行應用):                 Service_ip:      172.16.1.1                 Standby_ip:  

5、;    172.16.2.1                 Boot_ip:         172.16.1.3主機B(standby):               

6、60; Service_ip:      172.16.1.2                 Standby_ip:      172.16.2.2                

7、; Boot_ip:         172.16.1.43、按照各主機的應用的要求,建立好各自的磁盤組,并分配好磁盤空間;4、根據Ha軟件的要求,對服務器操作系統(tǒng)的參數作必要的修改。三、IBM HACMP雙機服務器系統(tǒng)的解決方案HACMP的安裝配置步驟如下:(一)在兩臺服務器上分別安裝HACMP軟件    #smit installp    (二)分別檢查兩臺主機上安裝的軟件是否成功    #/usr/sbin/cluste

8、r/diag/clverify    software    cluster    clverify>software             Valid Options are:    lpp    clverify.software> lpp    若沒有error出現則安裝成功。(三)分別配

9、置兩臺服務器的boot IP地址和Standby IP地址,保證boot 網和Standby網能ping通(用smit  tcpip命令),用netstat命令檢查配置是否正確:    #netstat -i    (四)利用smit tty在兩臺主機上增加一個TTY接口,配置心跳線(RS232):    #smitty tty      TTY        

10、60;                               tty0      TTY type           &#

11、160;                       tty      TTY interface                   &#

12、160;          rs232      Description                                As

13、ynchronous Terminal      Status                                     Available  &

14、#160;   Location                                   20-70-01-00      Parent adapter  &

15、#160;                          sa2    PORT number                  

16、60;             0                     Enable LOGIN                

17、;               disable                       BAUD rate           

18、0;                      9600                         PARITY  

19、0;                                  none                

20、;         BITS per character                         8               &

21、#160;            Number of STOP BITS                        1    用lsdev Cc tty查看tty是否配置好。    #lsdev Cc tt

22、y    在兩臺上分別輸入如下命令:    S85_1# cat /etc/hosts >/dev/tty0    S85_2# cat     如果在S85_2機能接收到信息,則表明心跳線已經配置好。    (五)具體配置及技巧    注:HACMP的配置(或修改配置)只需要在其中的一臺主機上進行,當配置(或修改)完畢后使用同步命令將配置結果傳到另外一臺主機上。一般選S85_1在進行配置。在S85_1上運行s

23、mit hacmp,然后按照下面的步驟進行配置:     #smit hacmp 1、 Cluster Configuration1.1、配置Cluster Topology配置Configure Cluster/ Add a Cluster Definition       * Cluster ID                 &#

24、160;        100                   #    * Cluster Name                  

25、;     sb_ha配置Configure Nodes,增加兩個Node    * Node Names                                    s

26、85_a    * Node Names                                    s85_b配置Configure Adapters,分別配置兩臺機的service地址,boot地址,sta

27、ndby地址及tty(a_svc、b_svc、a_boot、b_boot、a_stdby、b_stdby、a_tty、b_tty)    * Adapter IP Label                            a_svc      

28、;  Network Type                                  ether            

29、0;           Network Name                                  ethnet     

30、                 Network Attribute                             public  

31、0;                     Adapter Function                           

32、0;  service                       Adapter Identifier                       

33、     172.16.1.1      Adapter Hardware Address                             Node Name       

34、                              s85_a 修改/etc/hosts及/.rhosts文件,如:修改/etc/hosts文件,增加以下內容:      172.16.1.1     

35、       a_svc      172.16.1.2            b_svc      172.16.1.3            a_boot     

36、172.16.1.4            b_boot      172.16.2.1            a_stdby      172.16.2.2          &

37、#160; b_stdby修改/.rhosts文件,增加以下內容:      a_svc      b_svc      a_boot      b_boot      a_stdby      b_stdby    1.2、同步cluster(Cluster Conf

38、iguration/ Cluster Topology/ Synchronize Cluster Topology)    在進行同步的時候可以先進行模擬(Emulate)同步,當模擬同步OK后再進行實際(actual)同步:                   Synchronize Cluster Topology    Type or select v

39、alues in entry fields.    Press Enter AFTER making all desired changes.    TOP                                

40、                   Entry Fields      Ignore Cluster Verification Errors?              No     &#

41、160;          +    * Emulate or Actual?                         Emulate        &

42、#160;    +    2、配置Cluster Resources    2.1、定義一個資源組(Define Resource Groups)    注意,在定義資源組的時候,要注意Participating Node Names的先后順序。      Resource Group Name            

43、;               data_res       New Resource Group Name                          

44、 Node Relationship                             cascading       Participating Node Names        

45、              s85_a  s85_b     2.2、定義應用服務器(Define Application Servers)    Server Name                   &

46、#160;               ora_app       New Server Name                          

47、         start Script                                  /etc/start    Stop Script 

48、;                                  /etc/stop    2.3、修改資源組屬性(Change/Show Resources for a Resource Group)   

49、; data_res組:             Resource Group Name                       data_res       Node Relationship 

50、                        cascading       Participating Node Names               &

51、#160;  s85_a  s85_b       Service IP label                          a_svc       Filesystems(default is al

52、l)                                       Filesystems Consistency Check        &#

53、160;    fsck         Filesystems Recovery Method               sequential       Filesystems to Export        &

54、#160;                     Filesystems to NFS mount                           

55、60;        Volume Groups                             datavg logvg         Concurrent Volume gro

56、ups                                     Raw Disk PVIDs            

57、0;                         Application Servers                       ora_app

58、0;2.4、同步資源組(Synchronize Cluster Resources)在進行同步的時候可以先進行模擬(Emulate)同步,當模擬同步OK后再進行實際(actual)同步:                      Synchronize Cluster Resources    Type or select values in entry f

59、ields.    Press Enter AFTER making all desired changes.    TOP                                  

60、0;                Entry Fields      Ignore Cluster Verification Errors?             No         

61、         +    * Emulate or Actual?                          Emulate         

62、;    +    3、HACMP的啟動及關閉     (1)啟動過程:            #smit clstart            #tail f /tmp/hacmp.out        &#

63、160;    May 22 17:29:23 EVENT COMPLETED: node_up_complete s85_a              如果/tmp/hacmp.out文件顯示類似上述信息,則表明HACMP在本機上可以正常啟動。    (2)關閉過程:            #smit cl

64、stop    4、HACMP功能的測試在HACMP配置完成并檢查沒有錯誤后,即可按3的方法啟動HACMP,進行功能測試。包括應用在同一臺服務器的兩個網卡能否切換,在兩臺服務器間能否切換等??捎妹睿?#160;   #netstat-in來看地址的切換情況四、HACMP常見的故障解決方法HACMP將診測并響應于三種類型的故障:1網卡故障,2網絡工作,3節(jié)點故障。下面就這三種故障分別進行介紹。     1、網卡故障 HACMP的群集結構中,除了TCP/IP網絡以外,還有一個非TCP/IP網絡,它實際上是一

65、根“心跳”線,專門用來診測是節(jié)點死機還是僅僅網絡發(fā)生故障。如下圖所示,一旦節(jié)點加入了 Cluster(即該節(jié)點上的HACMP已正常啟動),該節(jié)點的各個網卡、非TCP/IP網絡就會不斷地接收并送Keep-Alive信號,K-A的參數是可調 的,HA在連續(xù)發(fā)送一定數量個包都丟失后就可確認對方網卡,或網絡,或節(jié)點發(fā)生故障。因此,有了K-A后,HACMP可以很輕易地發(fā)現網卡故障,因為一旦某塊網卡發(fā)生故障發(fā)往該塊網卡的K-A就會丟失。此時node 1上的cluster manager( HACMP的“大腦”)會產生一個swap-adapter的事件,并執(zhí)行該事件的script(HACMP中提供了大部分通

66、用環(huán)境下的事件scripts,它們是用標準AIX命令和HACMP工具來寫的)。每個節(jié)點上都有至少兩塊網卡,一塊是service adapter,提供對外服務,另一塊是standby adapter,它的存在只有cluster manager知道,應用和client并不知道。一旦發(fā)生swap-adapter事件后,cluster manager將原來service adapter的 IP地址轉移到standby adapter上,而standby地址轉移到故障網卡上,同時網絡上其他節(jié)點進行ARP的刷新。網卡互換(swap-adapter)在幾秒內就可完成,以太網為3秒,并且這種轉換對應用和cli

67、ent來說是透明的,只發(fā)生延遲但連接并不中斷。2、網絡故障     如果發(fā)往node1上的service和standby網卡上的K-A包全都丟失,而非TCP/IP網絡上的K-A仍然存在,那么HACMP判斷node1仍然正常而網絡發(fā)生故障。此時HACMP執(zhí)行一個。    3 、節(jié)點故障     如果不僅TCP/IP網絡上的K-A全部丟失,而且非TCP/IP網絡上的K-A也丟失,那么HACMP斷定該節(jié)點發(fā)生故障,并產生node-down事件。此時將有資源接管,即放在共享磁盤陳列上的資源將由備份節(jié)點接管,接管包括一系列操作:Acquire disks,Varyon VG, Mount file systems,Export NFS file systems, Assume IP network Address, Restart highly available applications,其中IP地址接管和重新啟動應用由HACMP來實現,而其他是由AIX來完成。     當整個節(jié)點發(fā)生故障時,HACMP將故障節(jié)點的service IP address轉移到備份節(jié)點上,使網

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論