08關(guān)于大型網(wǎng)站技術(shù)演進(jìn)的思考八存儲瓶頸終篇_第1頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、關(guān)于大型技術(shù)演進(jìn)的思考(八)-的瓶頸終篇(8)在開始本篇主要內(nèi)容前,一起的幾張截圖,首先是第一張圖,如下圖所示:這是一家的首頁,當(dāng)?shù)谝淮未蜷_這個首頁,會彈出一個強制性的框,讓用戶選擇貨物配送的地址,如果是淘寶和京東的話,那么這個選擇配貨地址的選項是在商品里,如下圖是淘寶的選擇配送地點:下圖是京東選擇配貨地點:那么圖一跟京東和淘寶區(qū)別呢?圖一的 強制用戶選擇地區(qū)后,那么在查詢這個商品時候會因為地區(qū)不同,顯示的查詢結(jié)果會不一樣,這個就和做有點像,不過是切語言和語言相關(guān)的靜態(tài)資源,但是這個地域的選擇是和業(yè)務(wù)相關(guān)的,不同的地域查詢結(jié)果是不相同的,這個選擇地域的彈出框很像一個路由器。相比之下,淘寶和京東

2、把商品的配送和商品相關(guān),那么在這些 里查詢商品時候,其實是按照查詢的,不同的地方查詢同一個條件所獲得到的結(jié)果是一致的。從業(yè)務(wù)角度而言,這說明第一個的業(yè)務(wù)沒有鋪開,就算是鋪開了,地域的差異也影響到物流,而淘寶和京東是一個意義的大型了。回到技術(shù)的角度,這兩種不同的做法有沒有可能還和技術(shù)問題有關(guān)了?今天我就來探討下這個問題。不站大與小,一個肯定可以分為客戶端、服務(wù)端和端,勾連這不同的組成部分是網(wǎng)絡(luò),網(wǎng)絡(luò)是一種通訊設(shè)施,距離的遠(yuǎn)近會直接影響到網(wǎng)絡(luò)傳輸?shù)男蕟栴},如是乎就出現(xiàn)了像CDN 這樣的技術(shù),很多大型互聯(lián)網(wǎng)公司還會在不同的城市建立機房,這些的目的就是在解決距離對網(wǎng)絡(luò)傳輸效率的影響,但是當(dāng)這種就近解

3、決問題的方案落到層的時候,問題就來了。上篇里我說道KH 服務(wù)的水平擴展問題,這種水平擴展是基于一種無狀態(tài)性的原理設(shè)計的,但是到了層不管怎么拆分它,它都很難消除狀態(tài),也就是層有狀態(tài)性是它的天然屬性。特別是碰到一個競爭性的資源時候,這種狀態(tài)性會變得非常頑固,例如商品的庫存問題,如果把庫存數(shù)據(jù)對等的平移到不同地域的數(shù)據(jù)中心,那么如何保證不同地方的庫存信息總是準(zhǔn)確的,這就成為了難題。這種問題放在一個小國家不是什么問題,但是放到地大物博的中國那就很成問題了。所以是這種就近方案的短板了。我曾了解到中國一家大型信息企業(yè)在設(shè)計它們第一代系統(tǒng)時候,就考慮到了這種地域性差異對系統(tǒng)設(shè)計的影響,它們的第一代系統(tǒng)在層這

4、塊就設(shè)計成了一個雙核系統(tǒng),什么叫做層的雙核系統(tǒng)了?它們的做法是在和分別建立兩個數(shù)據(jù)中心,系統(tǒng)的層分別部署在的數(shù)據(jù)中心和的數(shù)據(jù)中心,兩個數(shù)據(jù)中心是等價的,那么中國北部的交易就走數(shù)據(jù)中心,中國南部的交易就走的數(shù)據(jù)中心。但是系統(tǒng)上線后,發(fā)現(xiàn)這種雙核設(shè)計方案成為了整個系統(tǒng)的夢魘了,這個夢魘的最就是數(shù)據(jù)的同步問題,因為該企業(yè)是一個性業(yè)務(wù)的企業(yè),因此有大量交易需要南北數(shù)據(jù)中心同步完數(shù)據(jù)后才能正常完成,但是想從和同步數(shù)據(jù)的效率是異常的低效,我曾經(jīng)看過一份資料,里面說有機構(gòu)做了一個測試,當(dāng)兩個數(shù)據(jù)中心的距離超過了 公里,那么網(wǎng)絡(luò)的延遲性基本是線的成本高的嚇人,我曾聽人說就在受的,當(dāng)然不差錢的企業(yè)可以專門鋪設(shè)專

5、線來連接兩個數(shù)據(jù)中心,這種專,如果鋪專線從浦東到浦西,那么這條專線基本是用鋪就的,更何況是從到鋪專線,就算企業(yè)不差這些錢延遲性也嚴(yán)重影響了企業(yè)業(yè)務(wù)的發(fā)展。除了延遲性外,通過網(wǎng)絡(luò)大規(guī)模傳輸數(shù)據(jù),數(shù)據(jù)的可靠性是很難保證的,也就是網(wǎng)絡(luò)傳輸時候經(jīng)常沒有道理的丟包,這就造成了很多重復(fù)性傳輸,使得同步數(shù)據(jù)的效率更加的低效。因為層這種雙核設(shè)計缺陷,該企業(yè)馬上從事了二代系統(tǒng)的設(shè)計和開發(fā),而這個二代系統(tǒng)業(yè)務(wù)就是解就搞一決這個層的雙核問題。那到底該怎么解決了?把雙核變成單核,既然兩個數(shù)據(jù)中心這么麻煩,那個數(shù)據(jù)中心算了,既有沒那么多麻煩事情,這個肯定不是解決問題的正確思路了,雙核設(shè)計的出發(fā)點是非常有現(xiàn)實意義和價值的

6、,最后該公司使用了一個新的方案替代雙核,這個方案稱之為主備方案,層部署到兩個數(shù)據(jù)中心,到了業(yè)務(wù)運行階段,一個數(shù)據(jù)中心為主,一個數(shù)據(jù)中心為輔,不過這個主備方案絕不是通常意義的數(shù)據(jù)備份方案,他其實是吸收了單核和雙核方案的優(yōu)點,同時盡量避免單核和雙核的缺點,那么這點上這個主備方案是如何做到的呢?首先還是要把系統(tǒng)業(yè)務(wù)交易分下類,系統(tǒng)有些交易對于實時性啊,數(shù)據(jù)的正確性啊要求非常高,那么這樣的業(yè)務(wù)場景使用單核系統(tǒng)比較合適,一個業(yè)務(wù)系統(tǒng)不可能全是這樣的實時,也有一些交易對實時性要求比較差,當(dāng)然還是得要下這種交易對于延時度,具體就是一般延時多久用戶是可以接受的,這點非常重要,因為就算是主備方案,那么數(shù)據(jù)還是會

7、有同步的操作,只不過這個同步的時間粒度上會更粗些,我們可以以系統(tǒng)和業(yè)務(wù)角度合理設(shè)置一個同步時間間隔,如果延時的延時時間超過了這個間隔時間的話,那么這樣的業(yè)務(wù)場景其實是可以就近處理的,沒有必要將這些請求都發(fā)送到主數(shù)據(jù)中心,這樣可以減輕主數(shù)據(jù)中心的運行壓力。該企業(yè)的二代信息系統(tǒng)還有個要求就是過了每天的零點,前一天的數(shù)據(jù)必須在兩個數(shù)據(jù)中心完成同步,換句話說,兩個數(shù)據(jù)中心數(shù)據(jù)的差異性最大度是天,為什么要這樣做了?有的朋友看到了一定認(rèn)為這是為了備份數(shù)據(jù),的確這是目的之一,但這個做法還有更大的深意,雙核設(shè)計除了解決距離對網(wǎng)絡(luò)效率的影響外,掛了 個小時,我當(dāng)時很奇怪,我就還有個重要的目的就是容災(zāi),我記得幾年

8、前,有個朋友告訴我他們公司問系統(tǒng)難道不是分布式嗎?他說他們線上系統(tǒng)沒有單點,那為什么還會整個掛掉了?真的讓人不敢相信,因為他們的機房漏雨了,機房的線路短路了,那個朋友告訴我這件事情以后,他們公司又在附近租了個新機房做容災(zāi),防止此類事情再發(fā)生了。這種情況真的可以稱之為了,不過這樣的事情概率很低,一旦發(fā)生就會非常致命,記得爆發(fā)九級的時候,我看到一個新網(wǎng),里面有好多大型計算機倒掉了,而這個機房的機器的作用幾乎關(guān)系到亞洲互聯(lián)網(wǎng)系統(tǒng)脈,大家都知道每個都有自己的,是一個的*49,而那個機房放置的服務(wù)器就是全球赫赫有名的 臺服務(wù)器之一,專門用來的服務(wù)器,如果這些機器掛掉了,可能發(fā)生一整個國家都不能正常使用互

9、聯(lián)網(wǎng)。但是畢竟是局部的,因此甚至全球設(shè)立不同的數(shù)據(jù)中心用來容災(zāi)是很多大型互聯(lián)網(wǎng)公司必須走的道路,回到本文的主備方案,為了保證數(shù)據(jù)中心的容災(zāi)性,那么再設(shè)計主備方案同時還要保證主備數(shù)據(jù)中心可以迅速切換,當(dāng)一個數(shù)據(jù)中心出現(xiàn)問題時候可以馬上把輔助的數(shù)據(jù)中心轉(zhuǎn)化為主數(shù)據(jù)中心。為了保證這種切換的可靠性,該企業(yè)經(jīng)常在晚上交易量小的時候,把主備來回切換跑跑?;氐介_篇提到的那三張截圖,那個一開始彈出地域選擇框的樣的商品最后顯示的商品列表是不同,而京東雖然也有地域選擇,但是,當(dāng)選擇不同的地域時候,查詢同切換地域后查詢商品后結(jié)果基本沒有變化,至于淘寶和天貓壓根就沒有讓選擇地域的選項,配送都是在商品這邊進(jìn)行選擇的???/p>

10、能淘寶和天貓沒有自營業(yè)務(wù),因此天貓很難控制里面商家的地域區(qū)別,京東和前面哪家因為大部分是直營業(yè)務(wù),因此配送地址和他們倉儲所在地是有關(guān)系的,其實這個做法衍生下的話,地域其實還可以做到數(shù)據(jù)中心的劃分,例如江滬浙用一個數(shù)據(jù)中心,中部地區(qū)用一個數(shù)據(jù)中心,那么這種方式就可以幫助似乎也可以看出 ( ) 和) ) 的業(yè)務(wù)場景的一些區(qū)別。解決層的就近問題,從這里由此我可以做一個總結(jié),首先層做到對等多核的體系基本是不可能的,主備的方案可以解決單核和多核的缺點,同時可以發(fā)揚單核和多核的優(yōu)點,距離的遠(yuǎn)近也能產(chǎn)生業(yè)務(wù)的差異性,可以通過這種差異性把數(shù)據(jù)中心變成分散式,這樣還可以解決數(shù)據(jù)的就近原則。的互聯(lián)網(wǎng)公司規(guī)模很大,

11、他們從一開始就是全球化的,那么對于的大型互聯(lián)網(wǎng)公司將數(shù)據(jù)中心分散化和本地化就變的非常重要,所以好的層的分布設(shè)計方案是完成全球布局任務(wù)的基礎(chǔ)。但是對于很多中小企業(yè),或者是剛剛創(chuàng)業(yè)的公司能在不同地域建立數(shù)據(jù)中心,或者不差錢但是能快速的建立不同地域的數(shù)據(jù)中心其實是非常難的事情,那么這個時候找一家全球性的云例如亞馬遜的云,或者的業(yè)務(wù)就局限在中國,使用個本土優(yōu)秀的云也是一種不錯的選擇,云計算的推廣使得創(chuàng)業(yè)者的成本越來越低了。好了,本系列的文章到此為止,本系列都是在講數(shù)據(jù)庫,我曾經(jīng)任何程序或都是計算和的結(jié)合體,本系列著重講到的是,時下很多大型互聯(lián)網(wǎng)公司在這塊已經(jīng)發(fā)生了很大的變化,在關(guān)系數(shù)據(jù)庫這塊都已經(jīng)做到了去商業(yè)關(guān)系數(shù)據(jù)庫,而使用開源的關(guān)系數(shù)據(jù)庫,并將這些開源的關(guān)系數(shù)據(jù)進(jìn)行了大規(guī)模的改造,這個做法應(yīng)該算是互聯(lián)網(wǎng)領(lǐng)域關(guān)系數(shù)據(jù)庫發(fā)展的前沿了,同時將關(guān)系數(shù)據(jù)庫很難做到的事情用 4UYWR 數(shù)據(jù)庫來替代也是一種大趨勢。本系列講述時候設(shè)置了一個很大的前提,那就是盡量保持關(guān)系數(shù)據(jù)庫的本性,因此我將很多計算建議遷移到應(yīng)用層,這個觀點我有很多理由說明它的好處,但是現(xiàn)實中是否是最好的方法,這個就要具體看了,因此我

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論