版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、of57云計(jì)算第三版配套PPT課件電子工業(yè)出版社云計(jì)算(第三版)配套課件第 2 章Google云計(jì)算原理與應(yīng)用(三)of57云計(jì)算第三版配套PPT課件2.1 Google文件系統(tǒng)GFS2.2 分布式數(shù)據(jù)處理MapReduce2.3 分布式鎖服務(wù)Chubby2.4 分布式結(jié)構(gòu)化數(shù)據(jù)表Bigtable2.5 分布式存儲系統(tǒng)Megastore2.6 大規(guī)模分布式系統(tǒng)的監(jiān)控基礎(chǔ)架構(gòu)Dapper2.7 海量數(shù)據(jù)的交互式分析工具Dremel2.8 內(nèi)存大數(shù)據(jù)分析系統(tǒng)PowerDrill2.9 Google應(yīng)用程序引擎of57云計(jì)算第三版配套PPT課件2.5 分布式存儲系統(tǒng)Megastore2.5.1 設(shè)計(jì)
2、目標(biāo)及方案選擇2.5.2 Megastore數(shù)據(jù)模型2.5.3 Megastore中的事務(wù)及并發(fā)控制2.5.4 Megastore基本架構(gòu)2.5.5 核心技術(shù)復(fù)制2.5.6 產(chǎn)品性能及控制措施of57云計(jì)算第三版配套PPT課件在互聯(lián)網(wǎng)的應(yīng)用中,為了達(dá)到好的可擴(kuò)展性可擴(kuò)展性,常常會采用NoSQL存儲方式。但是從應(yīng)用程序的構(gòu)建方面來看,傳統(tǒng)的關(guān)系型數(shù)據(jù)庫又有著NoSQL所不具備的優(yōu)勢。 Google設(shè)計(jì)和構(gòu)建了用于互聯(lián)網(wǎng)中交互式服務(wù)的分布式存儲系統(tǒng)MegastoreMegastore,該系統(tǒng)成功的將關(guān)系型數(shù)據(jù)庫和NoSQL的特點(diǎn)與優(yōu)勢進(jìn)行了融合 of57云計(jì)算第三版配套PPT課件針對可用性的要求,
3、實(shí)現(xiàn)了一個(gè)同步的、容錯(cuò)的、適合遠(yuǎn)距離傳輸?shù)膹?fù)制機(jī)制。針對可擴(kuò)展性的要求,將整個(gè)大的數(shù)據(jù)分割成很多小的數(shù)據(jù)分區(qū),每個(gè)數(shù)據(jù)分區(qū)連同它自身的日志存放在NoSQL數(shù)據(jù)庫中,具體來說就是存放在Bigtable中。設(shè)計(jì)目標(biāo)及方案選擇 2.5 分布式存儲系統(tǒng)Megastore設(shè)計(jì)一種介于傳統(tǒng)的關(guān)系型數(shù)據(jù)庫和NoSQL之間的存儲技術(shù),盡可能達(dá)到高可用性和高可擴(kuò)展性的統(tǒng)一。方法一設(shè)計(jì)目標(biāo)方法二5of57云計(jì)算第三版配套PPT課件數(shù)據(jù)分區(qū)和復(fù)制 數(shù)據(jù)分區(qū)和復(fù)制數(shù)據(jù)分區(qū)和復(fù)制 Megastore中,這些小的數(shù)據(jù)分區(qū)被稱為實(shí)體組集(Entity Groups)。每個(gè)實(shí)體組集包含若干實(shí)體組(Entity Group,相
4、當(dāng)于分區(qū)中表的概念),而一個(gè)實(shí)體組中又包含很多的實(shí)體(Entity,相當(dāng)于表中記錄的概念)。從圖中還可以看出單個(gè)實(shí)體組支持ACID語義實(shí)體組集之間只具有比較松散的一致性。每個(gè)實(shí)體組都通過復(fù)制技術(shù)在數(shù)據(jù)中心中保存若干數(shù)據(jù)副本,這些實(shí)體組及其副本都存儲在NoSQL數(shù)據(jù)庫(Bigtable)中 of57云計(jì)算第三版配套PPT課件2.5 分布式存儲系統(tǒng)Megastore2.5.1 設(shè)計(jì)目標(biāo)及方案選擇2.5.2 Megastore數(shù)據(jù)模型2.5.3 Megastore中的事務(wù)及并發(fā)控制2.5.4 Megastore基本架構(gòu)2.5.5 核心技術(shù)復(fù)制2.5.6 產(chǎn)品性能及控制措施of57云計(jì)算第三版配套PP
5、T課件82.5 分布式存儲系統(tǒng)Megastore傳統(tǒng)的關(guān)系型數(shù)據(jù)庫不合適的三個(gè)原因傳統(tǒng)的關(guān)系型數(shù)據(jù)庫是通過連接(Join)來滿足用戶的需求的,但是就Megastore而言,這種數(shù)據(jù)模型是不合適的,主要有以下三個(gè)原因:原因 1對于高負(fù)載的交互式應(yīng)用來說,可預(yù)期的性能提升要比使用一種代價(jià)高昂的查詢語言所帶來的好處多原因 2Megastore所面對的應(yīng)用是讀遠(yuǎn)多于寫,因此好的選擇是將讀操作所需要做的工作盡可能地轉(zhuǎn)移到寫操作上原因 3在Bigtable這樣的鍵/值存儲系統(tǒng)中存儲和查詢級聯(lián)數(shù)據(jù)(Hierarchical Data)是很方便的 of41云計(jì)算第三版配套PPT課件Megastore數(shù)據(jù)模型怎
6、么設(shè)計(jì)?of57云計(jì)算第三版配套PPT課件102.5 分布式存儲系統(tǒng)Megastore細(xì)粒度控制的數(shù)據(jù)模型和模式語言同關(guān)系型數(shù)據(jù)庫一樣,Megastore的數(shù)據(jù)模型是在模式(schema)中定義的且是強(qiáng)類型的(strongly typed)每個(gè)模式都由一系列的表(tables)構(gòu)成,表又包含有一系列的實(shí)體(entities),每實(shí)體中包含一系列屬性(properties)屬性是命名的且具有類型,這些類型包括字符型(strings)、數(shù)字類型(numbers)或者Google的Protocol Buffers。Google團(tuán)隊(duì)設(shè)計(jì)的Megastore數(shù)據(jù)模型of57云計(jì)算第三版配套PPT課件11
7、2.5 分布式存儲系統(tǒng)Megastore照片共享服務(wù)數(shù)據(jù)模型實(shí)例 表Photo就是一個(gè)子表,因?yàn)樗暶髁艘粋€(gè)外鍵User則是一個(gè)根表一個(gè)Megastore實(shí)例中可以有若干個(gè)不同的根表,表示不同類型的實(shí)體組集 三種不同屬性設(shè)置,既有必須的(如user_id),也有可選的(如thumbnail_url)Photo中的可重復(fù)類型的tag屬性of57云計(jì)算第三版配套PPT課件122.5 分布式存儲系統(tǒng)MegastoreMegastore索引局部索引定義在單個(gè)實(shí)體組中,作用域僅限于單個(gè)實(shí)體組( 如PhotosByTime )可以橫跨多個(gè)實(shí)體組集進(jìn)行數(shù)據(jù)讀取操作( 如PhotosByTag )全局索引主要
8、兩類額外索引STORING子句(STORING Clause)可重復(fù)的索引(Repeated Indexes)內(nèi)聯(lián)索引(Inline Indexes)of57云計(jì)算第三版配套PPT課件132.5 分布式存儲系統(tǒng)MegastoreBigtable中存儲情況 行鍵(Row Key)UPhoto.timePhoto.tagPhoto._url101John101,50012:30:01Dinner, Paris101,50212:15:22Betty, Paris102MaryBigtable的列名實(shí)際上是表名和屬性名結(jié)合在一起得到,不同表中實(shí)體可存儲在同一個(gè)Bigtable行中of
9、57云計(jì)算第三版配套PPT課件2.5 分布式存儲系統(tǒng)Megastore2.5.1 設(shè)計(jì)目標(biāo)及方案選擇2.5.2 Megastore數(shù)據(jù)模型2.5.3 Megastore中的事務(wù)及并發(fā)控制2.5.4 Megastore基本架構(gòu)2.5.5 核心技術(shù)復(fù)制2.5.6 產(chǎn)品性能及控制措施of57云計(jì)算第三版配套PPT課件15Megastore提供的三種讀currentsnapshotinconsistent總是在單個(gè)實(shí)體組中完成總是在單個(gè)實(shí)體組中完成系統(tǒng)取出已知的最后一個(gè)完整提交的事務(wù)的時(shí)間戳,接著從這個(gè)位置讀數(shù)據(jù)忽略日志的狀態(tài)直接讀取最新的值2.5 分布式存儲系統(tǒng)Megastoreof57云計(jì)算第三版
10、配套PPT課件Megastore中的事務(wù)及并發(fā)控制Megastore事務(wù)中的寫操作采用了預(yù)寫式日志預(yù)寫式日志(Write-ahead Log) 一個(gè)寫事務(wù)總是開始于開始于一個(gè)current讀以便確認(rèn)下一個(gè)可用的日志位置。提交操作將數(shù)據(jù)變更聚集到日志,接著接著分配一個(gè)比之前任意一個(gè)都高的時(shí)間戳,然后然后使用Paxos將數(shù)據(jù)變更加入到日志中 協(xié)議使用了樂觀并發(fā)(Optimistic Concurrency):盡管可能有多個(gè)寫操作同時(shí)試圖寫同一個(gè)日志位置,但只會有1個(gè)成功of57云計(jì)算第三版配套PPT課件17完整的事務(wù)周期讀應(yīng)用邏輯提交生效清除獲取最后一次提交的事務(wù)的時(shí)間戳和日志位置 從Bigtab
11、le讀取且聚集數(shù)據(jù)到日志入口 使用Paxos達(dá)到一致,將入口追加到日志 將數(shù)據(jù)更新到Bigtable中的實(shí)體和索引 清理不再需要的數(shù)據(jù) 2.5 分布式存儲系統(tǒng)Megastoreof57云計(jì)算第三版配套PPT課件182.5 分布式存儲系統(tǒng)MegastoreMegastore中的事務(wù)機(jī)制 of57云計(jì)算第三版配套PPT課件2.5 分布式存儲系統(tǒng)Megastore2.5.1 設(shè)計(jì)目標(biāo)及方案選擇2.5.2 Megastore數(shù)據(jù)模型2.5.3 Megastore中的事務(wù)及并發(fā)控制2.5.4 Megastore基本架構(gòu)2.5.5 核心技術(shù)復(fù)制2.5.6 產(chǎn)品性能及控制措施of57云計(jì)算第三版配套PPT課
12、件Megastore的基本架構(gòu)Megastore中三種副本 完整副本:Bigtable中存儲完整的日志和數(shù)據(jù) 見證者副本:在Paxos算法執(zhí)行過程中無法產(chǎn)生一個(gè)決議時(shí)參與投票 只讀副本:讀取最近過去某一個(gè)時(shí)間點(diǎn)一致性數(shù)據(jù) MegastoreMegastore的基本架構(gòu)的基本架構(gòu) of57云計(jì)算第三版配套PPT課件Megastore中提供快速讀(Fast Reads)和快速寫(Fast Writes)機(jī)制 快速讀 如果讀操作不需要副本之間進(jìn)行通信即可完成,那么讀取的效率必然相對較高 利用本地讀?。↙ocal Reads)實(shí)現(xiàn)快速讀,能夠帶來更好的用戶體驗(yàn)及更低的延遲 確保快速讀成功的關(guān)鍵是保證選
13、擇的副本上數(shù)據(jù)是最新的。為了達(dá)到這一目標(biāo),引入了協(xié)調(diào)者的概念 協(xié)調(diào)者是一個(gè)服務(wù),該服務(wù)分布在每個(gè)副本的數(shù)據(jù)中心里面。它的主要作用就是跟蹤一個(gè)實(shí)體組集合 協(xié)調(diào)者的狀態(tài)是由寫算法來保證 of57云計(jì)算第三版配套PPT課件快速寫 Megastore采用了一種在主/從式系統(tǒng)中常用的優(yōu)化方法。如果一次寫成功,那么下一次寫的時(shí)候就跳過準(zhǔn)備過程,直接進(jìn)入接受階段 Megastore沒有使用專門的主服務(wù)器,而是使用leaders leader主要是來裁決哪個(gè)寫入的值可以獲取0號提議 優(yōu)化:提交值最多的位置附近選擇一副本作為leader 客戶端、網(wǎng)絡(luò)及Bigtable的故障都會導(dǎo)致一個(gè)寫操作處于不確定的狀態(tài) o
14、f57云計(jì)算第三版配套PPT課件2.5 分布式存儲系統(tǒng)Megastore2.5.1 設(shè)計(jì)目標(biāo)及方案選擇2.5.2 Megastore數(shù)據(jù)模型2.5.3 Megastore中的事務(wù)及并發(fā)控制2.5.4 Megastore基本架構(gòu)2.5.5 核心技術(shù)復(fù)制2.5.6 產(chǎn)品性能及控制措施of57云計(jì)算第三版配套PPT課件242.5 分布式存儲系統(tǒng)Megastore復(fù)制的日志每個(gè)副本都存有記錄所有更新的數(shù)據(jù)。Megastore允許副本不按順序接受日志,這些日志將獨(dú)立的存儲在Bigtable中。預(yù)寫式日志of57云計(jì)算第三版配套PPT課件復(fù)制的日志 預(yù)寫式日志預(yù)寫式日志 當(dāng)日志有不完整的前綴時(shí)我們就稱一個(gè)
15、日志副本有“缺失缺失”(Holes) 圖中099的日志位置已經(jīng)被全部清除全部清除;100的日志位置被部分清除部分清除;101的日志位置被全部全部副本副本接受;102的日志位置被獲得;103的日志位置被副本副本A A和和C C接受,副本B則留下了一個(gè)“缺失缺失”;104的日志位置則未達(dá)到一致性未達(dá)到一致性of57云計(jì)算第三版配套PPT課件數(shù)據(jù)讀取 數(shù)據(jù)讀取 數(shù)據(jù)讀取過程:本地查詢(Query Local)發(fā)現(xiàn)位置(Find Position) 本地讀?。↙ocal Read) 多數(shù)派讀?。∕ajority Read) 追趕 (Catchup) Paxos將會促使絕大多數(shù)副本達(dá)成一個(gè)共識值 達(dá)到一
16、種分布式一致狀態(tài) 驗(yàn)證(Validate)查詢數(shù)據(jù)(Query Data) of57云計(jì)算第三版配套PPT課件數(shù)據(jù)寫入 數(shù)據(jù)寫入 數(shù)據(jù)寫入完整過程 :(1)接受leader:請求leader接受值作為0號提議(快速寫方法),若成功,跳至步驟(3) (2)準(zhǔn)備:將值替換成擁有最高提議號的那個(gè)值 (3)接受:請求剩余的副本接受該值,如果大多數(shù)副本拒絕這個(gè)值,返回步驟(2) (4)失效:將不接受值的副本上的協(xié)調(diào)者進(jìn)行失效操作 (5)生效:將值的更新在盡可能多的副本上生效。如果選擇的值和原來提議的有沖突,返回一個(gè)沖突錯(cuò)誤 of57云計(jì)算第三版配套PPT課件282.5 分布式存儲系統(tǒng)Megastore協(xié)
17、調(diào)者的可用性 協(xié)調(diào)者在系統(tǒng)中是比較重要的協(xié)調(diào)者的進(jìn)程運(yùn)行在每個(gè)數(shù)據(jù)中心。每次的寫操作中都要涉及協(xié)調(diào)者,因此協(xié)調(diào)者的故障將會導(dǎo)致系統(tǒng)的不可用 Megastore使用了Chubby鎖服務(wù),為了處理請求,一個(gè)協(xié)調(diào)者必須持有多數(shù)鎖。一旦因?yàn)槌霈F(xiàn)問題導(dǎo)致它丟失了大部分鎖,協(xié)調(diào)者就會恢復(fù)到一個(gè)默認(rèn)保守狀態(tài) 除了可用性問題,對于協(xié)調(diào)者的讀寫協(xié)議必須滿足一系列的競爭條件 of57云計(jì)算第三版配套PPT課件2.5 分布式存儲系統(tǒng)Megastore2.5.1 設(shè)計(jì)目標(biāo)及方案選擇2.5.2 Megastore數(shù)據(jù)模型2.5.3 Megastore中的事務(wù)及并發(fā)控制2.5.4 Megastore基本架構(gòu)2.5.5 核
18、心技術(shù)復(fù)制2.5.6 產(chǎn)品性能及控制措施of57云計(jì)算第三版配套PPT課件302.5 分布式存儲系統(tǒng)Megastore可用性的分布情況Megastore在Google中已經(jīng)部署和使用了若干年,有超過100個(gè)產(chǎn)品使用Megastore作為其存儲系統(tǒng)從圖中可以看出,絕大多數(shù)產(chǎn)品具有極高的可用性(99.999%)。這表明Megastore系統(tǒng)的設(shè)計(jì)是非常成功的,基本達(dá)到了預(yù)期目標(biāo) of57云計(jì)算第三版配套PPT課件31產(chǎn)品延遲情況的分布2.5 分布式存儲系統(tǒng)Megastore應(yīng)用程序的平均讀取延遲在萬分之一毫秒之內(nèi),平均寫入延遲在100至400毫秒之間 避免Megastore的性能下降,可采取以下三
19、種應(yīng)對方法: (1)重新選擇路由使客戶端繞開出現(xiàn)問題的副本(2)將出現(xiàn)問題副本上的協(xié)調(diào)者禁用,確保問題的影響降至最小。(3)禁用整個(gè)副本需要指出:Megastore已經(jīng)是Google相對過時(shí)的存儲技術(shù)。Google目前正在使用的存儲系統(tǒng)是Spanner架構(gòu),Spanner的設(shè)計(jì)目標(biāo)是能夠控制一百萬到一千萬臺服務(wù)器,Spanner最強(qiáng)大之處在于能夠在50毫秒之內(nèi)為數(shù)據(jù)傳遞提供通道 of57云計(jì)算第三版配套PPT課件2.1 Google文件系統(tǒng)GFS2.2 分布式數(shù)據(jù)處理MapReduce2.3 分布式鎖服務(wù)Chubby2.4 分布式結(jié)構(gòu)化數(shù)據(jù)表Bigtable2.5 分布式存儲系統(tǒng)Megasto
20、re2.6 大規(guī)模分布式系統(tǒng)的監(jiān)控基礎(chǔ)架構(gòu)Dapper2.7 海量數(shù)據(jù)的交互式分析工具Dremel2.8 內(nèi)存大數(shù)據(jù)分析系統(tǒng)PowerDrill2.9 Google應(yīng)用程序引擎of57云計(jì)算第三版配套PPT課件2.6 大規(guī)模分布式系統(tǒng)的監(jiān)控 基礎(chǔ)架構(gòu)Dapper2.6.1 基本設(shè)計(jì)目標(biāo)2.6.2 Dapper監(jiān)控系統(tǒng)簡介2.6.3 關(guān)鍵性技術(shù)2.6.4 常用Dapper工具2.6.5 Dapper使用經(jīng)驗(yàn)在我們看來很簡單的一次搜索實(shí)際上涉及了眾多Google后臺子系統(tǒng),這些子系統(tǒng)的運(yùn)行狀態(tài)都需要進(jìn)行監(jiān)控 用戶的平均每一次前臺搜索會導(dǎo)致Google的后臺發(fā)生1011次的處理of57云計(jì)算第三版配
21、套PPT課件352.6 大規(guī)模分布式系統(tǒng)的監(jiān)控基礎(chǔ)架構(gòu)Dapper兩個(gè)基本要求設(shè)計(jì)出的監(jiān)控系統(tǒng)應(yīng)當(dāng)能夠?qū)ΡM可能多的Google服務(wù)進(jìn)行監(jiān)控Google的服務(wù)是全天候的,如果不能對Google 的后臺同樣進(jìn)行全天候的監(jiān)控很可能會錯(cuò)過某些無法再現(xiàn)的關(guān)鍵性故障監(jiān)控系統(tǒng)設(shè)計(jì)兩個(gè)基本要求 1. 廣泛可部署性(Ubiquitous Deployment)2. 不間斷的監(jiān)控of57云計(jì)算第三版配套PPT課件362.6 大規(guī)模分布式系統(tǒng)的監(jiān)控基礎(chǔ)架構(gòu)Dapper三個(gè)基本設(shè)計(jì)目標(biāo)低開銷這個(gè)是廣泛可部署性的必然要求。監(jiān)控系統(tǒng)的開銷越低,對于原系統(tǒng)的影響就越小,系統(tǒng)的開發(fā)人員也就越愿意接受這個(gè)監(jiān)控系統(tǒng)。對應(yīng)用層透明
22、監(jiān)控系統(tǒng)對程序員應(yīng)當(dāng)是不可見的。如果監(jiān)控系統(tǒng)的使用需要程序開發(fā)人員對其底層的一些細(xì)節(jié)進(jìn)行調(diào)整才能正常工作的話,這個(gè)監(jiān)控系統(tǒng)肯定不是一個(gè)完善的監(jiān)控系統(tǒng)??蓴U(kuò)展性Google的服務(wù)增長速度是驚人的,設(shè)計(jì)出的系統(tǒng)至少在未來幾年里要能夠滿足Google服務(wù)和集群的需求。of57云計(jì)算第三版配套PPT課件2.6 大規(guī)模分布式系統(tǒng)的監(jiān)控 基礎(chǔ)架構(gòu)Dapper2.6.1 基本設(shè)計(jì)目標(biāo)2.6.2 Dapper監(jiān)控系統(tǒng)簡介2.6.3 關(guān)鍵性技術(shù)2.6.4 常用Dapper工具2.6.5 Dapper使用經(jīng)驗(yàn)of57云計(jì)算第三版配套PPT課件基本概念 圖中,用戶發(fā)出請求X,前端A發(fā)現(xiàn)該請求的處理需要涉及服務(wù)器B和
23、服務(wù)器C,因此A又向B和C發(fā)出兩個(gè)RPC(遠(yuǎn)程過程調(diào)用)。B收到后立刻做出響應(yīng),但是C在接到后發(fā)現(xiàn)它還需要調(diào)用服務(wù)器D和E才能完成請求X,因此C對D和E分別發(fā)出了RPC,D和E接到后分別做出了應(yīng)答,收到D和E的應(yīng)答之后C才向A做出響應(yīng),在接收到B和C的應(yīng)答之后A才對用戶請求X做出一個(gè)應(yīng)答X 在監(jiān)控系統(tǒng)中記錄下所有這些消息不難,如何將這些消息記錄同特定的請求(本例中的X)關(guān)聯(lián)起來才是分布式監(jiān)控系統(tǒng)設(shè)計(jì)中需要解決的關(guān)鍵性問題之一 典型分布式系統(tǒng)的請求及應(yīng)答過程典型分布式系統(tǒng)的請求及應(yīng)答過程 方案一方案一 黑盒(黑盒(Black BoxBlack Box)方案)方案方案比較輕便,但在消息關(guān)系判斷過程
24、中,主要是利用一些統(tǒng)計(jì)學(xué)知識來進(jìn)行推斷,有時(shí)不是很準(zhǔn)確 方案二方案二 基于注釋的方案基于注釋的方案 利用應(yīng)用程序或中間件給每條記錄賦予一個(gè)全局性的標(biāo)示符,借此將相關(guān)消息串聯(lián)起來(GoogleGoogle最終選擇最終選擇 )of57云計(jì)算第三版配套PPT課件基本概念 Dapper監(jiān)控系統(tǒng)中三個(gè)基本概念:監(jiān)控樹(Trace Tree)、區(qū)間(Span)和注釋(Annotation)圖示是一個(gè)典型的監(jiān)控樹,實(shí)際上就是一個(gè)同特定事件相關(guān)的按照一定的規(guī)律以樹的形式組織起來所有消息,每一個(gè)節(jié)點(diǎn)稱為一個(gè)區(qū)間(一條記錄),所有記錄聯(lián)系在一起就構(gòu)成了對某個(gè)事件的完整監(jiān)控。每個(gè)區(qū)間包括如下的內(nèi)容:區(qū)間名(Span
25、 Name)、區(qū)間id(Span id)、父id(Parent id)和監(jiān)控id(Trace id) 監(jiān)控樹監(jiān)控樹 監(jiān)控id圖中并沒有列出,一棵監(jiān)控樹中所有區(qū)間的監(jiān)控id相同,隨機(jī)分配且唯一 of57云計(jì)算第三版配套PPT課件區(qū)間區(qū)間Helper.CallHelper.Call的詳細(xì)信息的詳細(xì)信息 圖中區(qū)間包含來自客戶端的注釋信息:“”、“Client Send”、“Client Recv”和“”,也包含來自服務(wù)器端的注釋信息:“Server Recv”、“foo”和“Server Send”。除“foo”是用戶自定義的注釋外,其他的注釋信息都是和時(shí)間相關(guān)的信息。Dapper不但支持用戶進(jìn)行簡
26、單的文本方式的注釋,還支持鍵-值對方式的注釋基本概念 of57云計(jì)算第三版配套PPT課件412.6 大規(guī)模分布式系統(tǒng)的監(jiān)控基礎(chǔ)架構(gòu)Dapper監(jiān)控信息的匯總(1)將區(qū)間的數(shù)據(jù)寫入到本地的日志文件 (2)所有機(jī)器上的本地日志文件匯集 (3)匯集后的數(shù)據(jù)寫入到Bigtable存儲庫中 of57云計(jì)算第三版配套PPT課件監(jiān)控?cái)?shù)據(jù)匯總是單獨(dú)進(jìn)行單獨(dú)進(jìn)行的,而不是伴隨系統(tǒng)對用戶的應(yīng)答一起返回的,如此選擇主要原因: 內(nèi)置的匯總方案(監(jiān)控?cái)?shù)據(jù)隨RPC應(yīng)答頭返回)會影響網(wǎng)絡(luò)動態(tài) 內(nèi)置的匯總方案需要保證所有的RPC都是完全嵌套安全問題 應(yīng)用層注釋提供一種方便的選擇機(jī)制選擇機(jī)制(Opt-in Mechanism)
27、:應(yīng)用程序開發(fā)者可以將任何對后期分析有益的數(shù)據(jù)和區(qū)間關(guān)聯(lián)起來 of57云計(jì)算第三版配套PPT課件2.6 大規(guī)模分布式系統(tǒng)的監(jiān)控 基礎(chǔ)架構(gòu)Dapper2.6.1 基本設(shè)計(jì)目標(biāo)2.6.2 Dapper監(jiān)控系統(tǒng)簡介2.6.3 關(guān)鍵性技術(shù)2.6.4 常用Dapper工具2.6.5 Dapper使用經(jīng)驗(yàn)of57云計(jì)算第三版配套PPT課件Dapper三個(gè)設(shè)計(jì)目標(biāo)中,實(shí)現(xiàn)難度最大的是 ?應(yīng)用層透明 怎么實(shí)現(xiàn)應(yīng)用層透明 輕量級的核心功能庫輕量級的核心功能庫 二次抽樣技術(shù)二次抽樣技術(shù) of57云計(jì)算第三版配套PPT課件452.6 大規(guī)模分布式系統(tǒng)的監(jiān)控基礎(chǔ)架構(gòu)Dapper輕量級核心功能庫 最關(guān)鍵的代碼基礎(chǔ)是基本
28、RPC、線程和控制流函數(shù)庫的實(shí)現(xiàn)主要功能是實(shí)現(xiàn)區(qū)間創(chuàng)建、抽樣和在本地磁盤上記錄日志。將復(fù)雜的功能實(shí)現(xiàn)限制在一個(gè)輕量級的核心功能庫中保證了Dapper的監(jiān)控過程基本對應(yīng)用層透明。小規(guī)模庫通用線程(Ubiquitous Threading)控制流(Control Flow)RPC代碼庫(RPC Library Code)of57云計(jì)算第三版配套PPT課件462.6 大規(guī)模分布式系統(tǒng)的監(jiān)控基礎(chǔ)架構(gòu)Dapper二次抽樣技術(shù)利用二次抽樣技術(shù)成功地解決了低開銷及廣泛可部署性的問題。第一次抽樣第二次抽樣實(shí)踐中,設(shè)計(jì)人員發(fā)現(xiàn)當(dāng)抽樣率低至1/1024時(shí)也能夠產(chǎn)生足夠多的有效監(jiān)控?cái)?shù)據(jù),即在1024個(gè)請求中抽取1個(gè)
29、進(jìn)行監(jiān)控也是可行的,從而可以捕獲有效數(shù)據(jù)發(fā)生在數(shù)據(jù)寫入Bigtable前,具體方法是將監(jiān)控id散列成一個(gè)標(biāo)量z(0z1),如果某個(gè)區(qū)間的z小于事先定義好的匯總抽樣系數(shù),則保留這個(gè)區(qū)間并將它寫入Bigtable,否則丟棄 of57云計(jì)算第三版配套PPT課件2.6 大規(guī)模分布式系統(tǒng)的監(jiān)控 基礎(chǔ)架構(gòu)Dapper2.6.1 基本設(shè)計(jì)目標(biāo)2.6.2 Dapper監(jiān)控系統(tǒng)簡介2.6.3 關(guān)鍵性技術(shù)2.6.4 常用Dapper工具2.6.5 Dapper使用經(jīng)驗(yàn)of57云計(jì)算第三版配套PPT課件482.6 大規(guī)模分布式系統(tǒng)的監(jiān)控基礎(chǔ)架構(gòu)DapperDapper存儲APIDapper的“存儲API”簡稱為 DAPI,提供了對分散在區(qū)域Dapper存儲庫(DEPOTS)的監(jiān)控記錄的直接訪問。一般有以下三種方式訪問這些記錄。(1)通過監(jiān)控id訪問(Access by Trace id)(2)塊訪問(Bulk Access)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 精準(zhǔn)識別課件教學(xué)課件
- 智慧養(yǎng)老中心解決方案
- 頸椎病解刨結(jié)構(gòu)
- 2024年超高速加工中心投資項(xiàng)目資金申請報(bào)告書
- 車場停電應(yīng)急預(yù)案
- 第六章 機(jī)械能守恒定律-功能關(guān)系與能量守恒 2025年高考物理基礎(chǔ)專項(xiàng)復(fù)習(xí)
- 2-1-4 微專題1-碳酸鈉與碳酸氫鈉的相關(guān)計(jì)算 高一上學(xué)期化學(xué)人教版(2019)必修第一冊
- 骨水泥在糖尿病足的應(yīng)用
- 醫(yī)療器械合作協(xié)議書范本
- 社交網(wǎng)絡(luò)鉤機(jī)租賃合同
- 年產(chǎn)6000萬塊粉煤灰煤矸石燒結(jié)磚項(xiàng)目節(jié)能評估報(bào)告書
- 秘書五級總復(fù)習(xí)3 (收文發(fā)文+事務(wù)管理+自動化100)附答案
- 人教版英語九全 Unit 8 It must belong to Carla. Section A(3a-3c)教案
- 移植物抗宿主病課件
- 全面解讀2020年《中華人民共和國民法典》之物權(quán)編PPT
- 高中生物必修一新教材課后習(xí)題與參考答案
- 水利部水利建設(shè)經(jīng)濟(jì)定額站
- 大班數(shù)學(xué)《貪心的三角形》課件
- 金屬和半導(dǎo)體材料電導(dǎo)(材料物理性能)
- 最新八年級道法上冊概括與評論題角度匯編
- 酒店組織架構(gòu)圖以及各崗位職責(zé)(完整版)
評論
0/150
提交評論