大型網(wǎng)站高性能和高可用方案_第1頁(yè)
大型網(wǎng)站高性能和高可用方案_第2頁(yè)
大型網(wǎng)站高性能和高可用方案_第3頁(yè)
大型網(wǎng)站高性能和高可用方案_第4頁(yè)
大型網(wǎng)站高性能和高可用方案_第5頁(yè)
已閱讀5頁(yè),還剩1頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1.1高可用性高可用性(HighAvailability)通常用來(lái)描述一個(gè)系統(tǒng),經(jīng)過(guò)特殊設(shè)計(jì),減少停止服務(wù)的時(shí)間,從而使其服務(wù)保持高度的可使用性。計(jì)算機(jī)系統(tǒng)的可靠性用平均無(wú)故障時(shí)間(MTTF)來(lái)度量,即計(jì)算機(jī)系統(tǒng)平均能夠正常運(yùn)行多長(zhǎng)時(shí)間,才會(huì)發(fā)生一次故障。系統(tǒng)的可靠性能越高,平均無(wú)故障時(shí)間越長(zhǎng)??删S護(hù)性用平均維修時(shí)間(MTTR)來(lái)度量,即系統(tǒng)發(fā)生故障后維修和重新恢復(fù)正常運(yùn)行平均花費(fèi)時(shí)間。系統(tǒng)的可維護(hù)性越好,平均維修時(shí)間越短。計(jì)算機(jī)系統(tǒng)的可用性定義為:MTTF/(MTTF+MTTR)*100%。舉例來(lái)說(shuō),淘寶網(wǎng)在2010年成交額為300億,則每分鐘成交額為5—10萬(wàn),那么對(duì)淘寶來(lái)說(shuō),其后臺(tái)系統(tǒng)的高可用,對(duì)企業(yè)運(yùn)營(yíng)非常重要。淘寶數(shù)據(jù)負(fù)責(zé)人寧海元指出,淘寶系統(tǒng),可用性至少需要99.999%。那么對(duì)于系統(tǒng),在一年365天,系統(tǒng)停止服務(wù)時(shí)間為5分15秒。1.2確保高可用性咼可用性的衡量指標(biāo)%availability=(TotalElapsedTime一SumofInoperativeTimes)/TotalElapsedTime其中:TotalElapsedTime為系統(tǒng)總時(shí)間,包括可提供服務(wù)時(shí)間+停止服務(wù)時(shí)間。SumofInoperativeTimes為停止服務(wù)時(shí)間,包括宕機(jī)時(shí)間+維護(hù)時(shí)間。1?2?1如何確保高可用可用性越高越好,提高可用性主要從一下幾個(gè)方面入手:系統(tǒng)架構(gòu)容災(zāi)性監(jiān)控報(bào)警故障轉(zhuǎn)移1?2?1?1系統(tǒng)架構(gòu)系統(tǒng)架構(gòu),指整個(gè)網(wǎng)站后臺(tái)系統(tǒng)的架構(gòu)。好的系統(tǒng)架構(gòu),主要從下面幾個(gè)方面考慮:操作系統(tǒng)的選擇,從穩(wěn)定性、安全性和可維護(hù)性考慮,unix和linux性能遠(yuǎn)遠(yuǎn)好于windows,從成本考慮,Linux遠(yuǎn)遠(yuǎn)低于windows和unix。負(fù)載均衡器的選擇,硬件負(fù)載均衡器性能和穩(wěn)定性高于軟件負(fù)載均衡器。但成本上,軟件比如haproxy、LVS優(yōu)于硬件(比如F5、Netscaler)。webserver的選擇,Nginx優(yōu)于傳統(tǒng)的Apache。⑷各級(jí)緩存的選擇與應(yīng)用,varnish、squid、memcached。網(wǎng)站開(kāi)發(fā)語(yǔ)言的選擇,與開(kāi)發(fā)有關(guān),主要分為需要編譯性的語(yǔ)言和不需要編譯性的語(yǔ)言。⑹數(shù)據(jù)庫(kù)的選擇,傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)中,Oracle優(yōu)于MySQL,但Oracle收費(fèi)遠(yuǎn)遠(yuǎn)高于MySQL,實(shí)際上,Oracle有兩種收費(fèi)模式,一種是按用戶數(shù),一種是按主機(jī)處理器個(gè)數(shù)。而MySQL有免費(fèi)的版本。底層存儲(chǔ)設(shè)備的選擇,比如機(jī)械磁盤(pán)和固態(tài)硬盤(pán)的選擇。避免單點(diǎn)故障問(wèn)題,在邏輯架構(gòu)上,避免單點(diǎn)故障,避免出現(xiàn)割點(diǎn)。1?2?1?2容災(zāi)性容災(zāi)性能對(duì)系統(tǒng)非常重要,比如服務(wù)器因?yàn)閿嚯?,?dǎo)致數(shù)據(jù)文件的不一致,因?yàn)榘l(fā)生自然或者非自然災(zāi)害比如火災(zāi)導(dǎo)致的磁盤(pán)損壞,發(fā)生數(shù)據(jù)丟失等。所以容災(zāi)很重要,主要從以下幾個(gè)方面提高容災(zāi)性能:服務(wù)器熱備機(jī)的部署,當(dāng)發(fā)生故障后,熱備機(jī)能馬上使用,提供服務(wù)。這里的服務(wù)器主要指webserver、應(yīng)用服務(wù)器、數(shù)據(jù)庫(kù)服務(wù)器等。數(shù)據(jù)備份,比如做定期備份、熱備份、增量備份,甚至需要做主從備份,來(lái)提高抗災(zāi)性能。并且從底層存儲(chǔ)設(shè)備上進(jìn)行備份,比如做RAID。做雙線網(wǎng)絡(luò)交換,盡量?jī)?yōu)化設(shè)計(jì)網(wǎng)絡(luò),避免因?yàn)楹诵慕粨Q機(jī)故障,而影響服務(wù)。網(wǎng)絡(luò)上避免單點(diǎn)故障。監(jiān)控報(bào)警監(jiān)控是指對(duì)在線服務(wù)和非服務(wù)的在線服務(wù)器和相應(yīng)的進(jìn)程進(jìn)行狀態(tài)檢測(cè),當(dāng)出現(xiàn)宕機(jī)或者某項(xiàng)服務(wù)進(jìn)程僵死之后,能夠在盡量短的時(shí)間獲得該信息,然后通過(guò)報(bào)警系統(tǒng)將信息發(fā)送到一線運(yùn)維人員。所以,監(jiān)控報(bào)警,直接影響宕機(jī)時(shí)間。監(jiān)控報(bào)警,主要從以下幾個(gè)方面展開(kāi):監(jiān)控主機(jī)CPU使用情況,負(fù)載情況。監(jiān)控主機(jī)內(nèi)存使用情況。監(jiān)控主機(jī)10外設(shè),主要以磁盤(pán)為主。如磁盤(pán)的讀寫(xiě)、磁盤(pán)使用量等。監(jiān)控主機(jī)網(wǎng)卡使用情況。網(wǎng)卡是否損壞,是否招到DD0S攻擊。⑸監(jiān)控應(yīng)用進(jìn)程,包括webserver,應(yīng)用服務(wù)器等。監(jiān)控?cái)?shù)據(jù)庫(kù)使用情況。包括用戶的請(qǐng)求數(shù)、緩存使用量等。監(jiān)控交換設(shè)備的使用情況。網(wǎng)絡(luò)入、出的流量。監(jiān)控IDC機(jī)房溫度、濕度等。防火墻、入侵檢測(cè)等安全檢測(cè)、監(jiān)控等。通過(guò)上面的各項(xiàng)監(jiān)控、得到相應(yīng)數(shù)值,應(yīng)用監(jiān)控繪圖軟件,把相應(yīng)的數(shù)值繪畫(huà)出來(lái),現(xiàn)有監(jiān)控繪圖軟件有mrtg、cacti、nagios等。然后設(shè)置一個(gè)報(bào)警閾值,如果超過(guò)該閾值,那么通過(guò)報(bào)警系統(tǒng),比如短信、msn、郵件、甚至是聲音完成報(bào)警功能。典型的報(bào)警系統(tǒng)如圖3-2-1-3所示。

*百ewe邛*百ewe邛収稟鶴據(jù)email圖3-2-1-3如圖3-2-1-3所示,監(jiān)控服務(wù)器從servers上收集系統(tǒng)信息,如果發(fā)現(xiàn)系統(tǒng)的某項(xiàng)狀態(tài)指數(shù)超過(guò)預(yù)設(shè)的閾值,則發(fā)送郵件到運(yùn)維人員。同時(shí),把相應(yīng)的報(bào)警信息發(fā)送到短信運(yùn)營(yíng)商的短信網(wǎng)關(guān)服務(wù)器,然后短信網(wǎng)關(guān)服務(wù)器發(fā)送短信到運(yùn)維人員手機(jī)中,完成短信報(bào)警。上述報(bào)警過(guò)程,傳送郵件報(bào)警信息,是基于TCP/IP協(xié)議,而傳送短信報(bào)警信息,是基于gprs網(wǎng)絡(luò)。1?2?1?4故障轉(zhuǎn)移故障轉(zhuǎn)移是指,當(dāng)對(duì)用戶提供服務(wù)的服務(wù)器或者相應(yīng)的應(yīng)用進(jìn)程發(fā)生故障后,比如服務(wù)器宕機(jī)、進(jìn)程僵死之后,備用服務(wù)器能夠在盡量短的時(shí)間內(nèi)啟用,提供服務(wù)。這樣能夠最大限度減少損失,保證用戶的正常服務(wù)。所以,做好故障轉(zhuǎn)移,要解決以下兩個(gè)問(wèn)題:(1)實(shí)時(shí)監(jiān)測(cè)故障問(wèn)題。(2)準(zhǔn)確快速切換服務(wù)器問(wèn)題。針對(duì)不同層次的服務(wù),監(jiān)測(cè)機(jī)制也不同,詳細(xì)情況,在已經(jīng)闡述。下面主要論述一下故障切換問(wèn)題。故障切換包括負(fù)載均衡器的故障切換、主機(jī)os的故障切換、webserver的故障切換、應(yīng)用進(jìn)程的故障切換、數(shù)據(jù)庫(kù)的故障切換、存儲(chǔ)系統(tǒng)的故障切換、DNS的故障切換、交換設(shè)備的故障切換等。下面主要分析進(jìn)程僵死的故障轉(zhuǎn)移和服務(wù)器宕機(jī)的故障轉(zhuǎn)移。進(jìn)程僵死故障轉(zhuǎn)移案例,常見(jiàn)的webserver僵死故障轉(zhuǎn)移如圖3-2-1-4所示?!鯥Wel?_5eT¥trand172.^141412Moriircir_rigiAK.-5hWeb_serrtrfind■IWel?_5eT¥trand172.^141412Moriircir_rigiAK.-5hWeb_serrtrfind茁啤切器一圖3-2-1-4-1如圖3-2-1-4-1所示,當(dāng)主機(jī)12的webserver對(duì)外提供服務(wù)時(shí),通過(guò)在主機(jī)13上部署監(jiān)控程序Monitor_nginx.sh來(lái)監(jiān)控主機(jī)12上面的webserver進(jìn)程運(yùn)行情況,一旦發(fā)現(xiàn)12上webserver停止服務(wù),馬上報(bào)警,先更改13的ip地址為12,再啟用其自身的webserver,完成故障轉(zhuǎn)移。此外,也可以在兩服務(wù)器上同時(shí)部署監(jiān)控程序Monitor_nginx.sh,完成互相監(jiān)控。服務(wù)器宕機(jī)故障轉(zhuǎn)移案例,常見(jiàn)的服務(wù)器宕機(jī)故障轉(zhuǎn)移,如圖3-2-1-4-2所示。

切帳尿務(wù)對(duì)礙豁Ma切帳尿務(wù)對(duì)礙豁Ma諛準(zhǔn)惻映二岳養(yǎng)罌鳥(niǎo)畏鱷.務(wù)戲務(wù)輔呂;在蛭備柳圖3-2-1-4-2如圖3-2-1-4-2所示,服務(wù)器A和服務(wù)器B同時(shí)部署,但服務(wù)器A提供服務(wù),而服務(wù)器B作為熱備機(jī)。監(jiān)控系統(tǒng)單獨(dú)部署。當(dāng)服務(wù)器A宕機(jī)之后,監(jiān)控系統(tǒng)會(huì)檢測(cè)到這一信息,然

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論