版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
分布式數(shù)據(jù)庫(kù)新第一頁(yè),共67頁(yè)。主要(zhǔyào)內(nèi)容分布式數(shù)據(jù)庫(kù)系統(tǒng)概述(ɡàishù)分布式數(shù)據(jù)庫(kù)系統(tǒng)的體系結(jié)構(gòu)分布式查詢處理客戶/服務(wù)器結(jié)構(gòu)的分布式系統(tǒng)第二頁(yè),共67頁(yè)。主要(zhǔyào)參考資料TEXTBOOK邵佩英分布式數(shù)據(jù)庫(kù)系統(tǒng)及其應(yīng)用第二版科學(xué)出版社M.T.?zsuandP.Valduriez.PrinciplesofDistributedDatabaseSystems,2ndedition.PrenticeHall賈焰分布式數(shù)據(jù)庫(kù)技術(shù).國(guó)防工業(yè)(ɡuófánɡɡōnɡyè)出版社周龍?bào)J分布式數(shù)據(jù)庫(kù)管理系統(tǒng)實(shí)現(xiàn)技術(shù)科學(xué)出版社第三頁(yè),共67頁(yè)。1分布式數(shù)據(jù)庫(kù)系統(tǒng)概述(ɡàishù)1.1集中式系統(tǒng)和分布式系統(tǒng)集中式數(shù)據(jù)庫(kù)管理系統(tǒng)的缺點(diǎn):通信開(kāi)銷大;系統(tǒng)的堅(jiān)固性差;性能差;可擴(kuò)充性差;設(shè)計(jì)、管理困難。分散式系統(tǒng):將數(shù)據(jù)庫(kù)分成多個(gè),建立在多臺(tái)計(jì)算機(jī)上,數(shù)據(jù)庫(kù)的管理、應(yīng)用程序的研制都是分開(kāi)并相互獨(dú)立的,之間不存在數(shù)據(jù)通行聯(lián)系。分布式數(shù)據(jù)庫(kù)系統(tǒng)的特點(diǎn)(tèdiǎn):數(shù)據(jù)的分布性;統(tǒng)一性;透明性。統(tǒng)一性(兩個(gè)方面:數(shù)據(jù)在邏輯上的統(tǒng)一性和數(shù)據(jù)在管理上的統(tǒng)一性)分布式數(shù)據(jù)庫(kù)與集中式數(shù)據(jù)庫(kù)相比的優(yōu)點(diǎn):堅(jiān)固性好;可擴(kuò)充性好;可改善性能;自治性好。第四頁(yè),共67頁(yè)。與集中式數(shù)據(jù)(shùjù)庫(kù)相比,分布式DB具有:數(shù)據(jù)(shùjù)分布式的特點(diǎn)。與分散式數(shù)據(jù)(shùjù)庫(kù)相比,分布式DB具有:邏輯整體性的特點(diǎn)。第五頁(yè),共67頁(yè)。背景(bèijǐng)數(shù)據(jù)庫(kù)系統(tǒng)+計(jì)算機(jī)網(wǎng)絡(luò)1.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的定義(dìngyì)DB1DB1DB1計(jì)算機(jī)1計(jì)算機(jī)2計(jì)算機(jī)3通訊網(wǎng)絡(luò)T1T2T3T1T2T3T1T2T3第六頁(yè),共67頁(yè)。1.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的定義(dìngyì)一個(gè)分布式系統(tǒng)由通信網(wǎng)絡(luò)聯(lián)接(liánjiē)起來(lái)的結(jié)點(diǎn)的集合。每個(gè)結(jié)點(diǎn)都是擁有集中式數(shù)據(jù)庫(kù)的計(jì)算機(jī)系統(tǒng)。分布式數(shù)據(jù)庫(kù)的特點(diǎn):數(shù)據(jù)庫(kù)中的數(shù)據(jù)不是存儲(chǔ)在同一場(chǎng)地,而是分布存儲(chǔ)在多個(gè)場(chǎng)地。第七頁(yè),共67頁(yè)。1.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的定義(dìngyì)分布性:數(shù)據(jù)存儲(chǔ)在不同場(chǎng)地上。與集中式數(shù)據(jù)庫(kù)不同。邏輯整體性:數(shù)據(jù)邏輯上是相互(xiānghù)聯(lián)系的一個(gè)整體。與分散在計(jì)算機(jī)網(wǎng)絡(luò)不同站點(diǎn)上的一組沒(méi)有相互(xiānghù)聯(lián)系的本地?cái)?shù)據(jù)庫(kù)區(qū)別開(kāi)來(lái)。第八頁(yè),共67頁(yè)。1.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的定義(dìngyì)物理上是分布(fēnbù)的,邏輯上是統(tǒng)一的一組數(shù)據(jù)庫(kù)的集合要素計(jì)算機(jī)網(wǎng)絡(luò)數(shù)據(jù)庫(kù)系統(tǒng)第九頁(yè),共67頁(yè)。DB1DB1DB1計(jì)算機(jī)1計(jì)算機(jī)1計(jì)算機(jī)1通訊(tōngxùn)網(wǎng)絡(luò)北京(běijīnɡ)重慶(zhònɡqìnɡ)上海銀行系統(tǒng)訪問(wèn)本地銀行數(shù)據(jù):局部應(yīng)用通兌業(yè)務(wù)、轉(zhuǎn)賬業(yè)務(wù):全局應(yīng)用第十頁(yè),共67頁(yè)。1.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的定義(dìngyì)全局應(yīng)用(yìngyòng):指涉及到兩個(gè)或兩個(gè)以上場(chǎng)地中數(shù)據(jù)庫(kù)的應(yīng)用(yìngyòng)。網(wǎng)絡(luò)的每個(gè)站點(diǎn)具有獨(dú)立處理能力,可以執(zhí)行局部應(yīng)用(yìngyòng),同時(shí)也能通過(guò)網(wǎng)絡(luò)執(zhí)行全局應(yīng)用(yìngyòng)。分布式數(shù)據(jù)庫(kù)是由一組數(shù)據(jù)庫(kù)組成,這些數(shù)據(jù)庫(kù)分布在計(jì)算機(jī)網(wǎng)絡(luò)的不同站點(diǎn)上,邏輯上是屬于同一個(gè)系統(tǒng)的。第十一頁(yè),共67頁(yè)。1.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的定義(dìngyì)分布式數(shù)據(jù)庫(kù)包含兩個(gè)重要組成部分:分布式數(shù)據(jù)庫(kù)和分布式數(shù)據(jù)庫(kù)管理系統(tǒng)。分布式數(shù)據(jù)庫(kù)是計(jì)算機(jī)網(wǎng)絡(luò)環(huán)境中各場(chǎng)地上數(shù)據(jù)庫(kù)的邏輯集合(jíhé)。分布式數(shù)據(jù)庫(kù)管理系統(tǒng)是分布式數(shù)據(jù)庫(kù)系統(tǒng)中的一組軟件,它復(fù)雜管理分布環(huán)境下邏輯集成數(shù)據(jù)的存取、一致性、有效性和完備性。第十二頁(yè),共67頁(yè)。1.3分布式數(shù)據(jù)庫(kù)系統(tǒng)的透明性位置透明性 用戶或應(yīng)用程序不必了解它所使用的數(shù)據(jù)的存儲(chǔ)位置。舉例:銀行的借貸業(yè)務(wù):要判斷的情況有5種。復(fù)制透明性 有些數(shù)據(jù)并不存在一個(gè)場(chǎng)地,可能重復(fù)存放在不同的場(chǎng)地。本地?cái)?shù)據(jù)庫(kù)中也包含(bāohán)了外地?cái)?shù)據(jù)庫(kù)中的數(shù)據(jù)。一個(gè)分布式系統(tǒng)有了這兩種透明性后,用戶看到的系統(tǒng)就如同一個(gè)集中式系統(tǒng)。第十三頁(yè),共67頁(yè)。分布式數(shù)據(jù)庫(kù)系統(tǒng)具有(jùyǒu)以下特點(diǎn)數(shù)據(jù)的物理分布性數(shù)據(jù)的邏輯整體性數(shù)據(jù)的分布獨(dú)立性場(chǎng)地(chǎngdì)自治性場(chǎng)地(chǎngdì)之間的協(xié)調(diào)性數(shù)據(jù)冗余及冗余透明性事務(wù)管理的分布性第十四頁(yè),共67頁(yè)。1.4分布式數(shù)據(jù)庫(kù)系統(tǒng)的優(yōu)缺點(diǎn)
DDBS的上述特點(diǎn)(tèdiǎn)決定它具有以下優(yōu)點(diǎn):具有靈活的體系結(jié)構(gòu)數(shù)據(jù)庫(kù)的使用單位組織上、地理上是分布的適應(yīng)分布式管理和控制機(jī)構(gòu)。經(jīng)濟(jì)性能優(yōu)越經(jīng)濟(jì)上和組織上的理由系統(tǒng)的可靠性高,可用性好。局部應(yīng)用的響應(yīng)速度快??蓴U(kuò)展性好,易于集成(jíchénɡ)現(xiàn)有系統(tǒng)。既有數(shù)據(jù)庫(kù)互連,歷史繼承;數(shù)據(jù)資源共享系統(tǒng)規(guī)模逐步擴(kuò)展增加結(jié)點(diǎn),不影響現(xiàn)有系統(tǒng)運(yùn)行第十五頁(yè),共67頁(yè)。1.4分布式數(shù)據(jù)庫(kù)系統(tǒng)的優(yōu)缺點(diǎn)缺點(diǎn):系統(tǒng)開(kāi)銷(kāixiāo)大,主要花在通信部分。復(fù)雜的存取結(jié)構(gòu)在集中式系統(tǒng)中是有效存取數(shù)據(jù)的重要基數(shù),但在分布式系統(tǒng)中不一定有效。數(shù)據(jù)的安全性和保密性較難處理。第十六頁(yè),共67頁(yè)。1.5分布式數(shù)據(jù)庫(kù)系統(tǒng)的分類(fēnlèi)同構(gòu)同質(zhì)數(shù)據(jù)庫(kù)每個(gè)場(chǎng)地都用同一類型的數(shù)據(jù)模型,并運(yùn)行同一型號(hào)的DBMS同構(gòu)異質(zhì)(yìzhì)數(shù)據(jù)庫(kù)每個(gè)場(chǎng)地都用同一類型的數(shù)據(jù)模型,但運(yùn)行不同型號(hào)的DBMS異構(gòu)數(shù)據(jù)庫(kù)場(chǎng)地上的數(shù)據(jù)庫(kù)系統(tǒng)不盡相同DBMS不同數(shù)據(jù)模型不同第十七頁(yè),共67頁(yè)。練習(xí)(liànxí):1、與集中式DB相比,分布式DB具有()特點(diǎn),與分散式DB相比,又具有()特點(diǎn)。2、區(qū)別系統(tǒng)是分散式還是分布式就是判定系統(tǒng)是否支持().3、在分布式DB中,用戶看到的系統(tǒng)如同一個(gè)集中式DBS,這是因?yàn)榉植际较到y(tǒng)具有()和()特點(diǎn)。4、如果各個(gè)場(chǎng)地都采用同類型(lèixíng)數(shù)據(jù)模型,但DBMS不同型號(hào),這種系統(tǒng)屬于()型DBMS.1、數(shù)據(jù)分布性,邏輯整體性2、全局應(yīng)用3、位置(wèizhi)透明性,復(fù)制透明性4、同構(gòu)異質(zhì)型DDBS.第十八頁(yè),共67頁(yè)。數(shù)據(jù)庫(kù)分布式的管理-在技術(shù)上引起(yǐnqǐ)新問(wèn)題是由一個(gè)節(jié)點(diǎn)來(lái)統(tǒng)一管理各分?jǐn)?shù)據(jù)庫(kù)呢?還是各節(jié)點(diǎn)在必要時(shí),都挺身而出代行管理的職能呢?這是集中與分散的問(wèn)題。每個(gè)節(jié)點(diǎn)的數(shù)據(jù)只在本節(jié)點(diǎn)保留一份呢,還是存儲(chǔ)備份于其他各節(jié)點(diǎn)以防數(shù)據(jù)的破壞丟失呢?這是可靠性與節(jié)約(jiéyuē)之間的矛盾。當(dāng)數(shù)據(jù)庫(kù)操作涉及多個(gè)分?jǐn)?shù)據(jù)庫(kù)上的數(shù)據(jù)時(shí),應(yīng)該把這些數(shù)據(jù)傳送到哪個(gè)節(jié)點(diǎn)上去進(jìn)行操作最佳呢?這是運(yùn)籌帷幄的優(yōu)化問(wèn)題,等等。第十九頁(yè),共67頁(yè)。關(guān)鍵問(wèn)題分布式系統(tǒng)實(shí)現(xiàn)考慮的核心問(wèn)題:盡量將網(wǎng)絡(luò)(wǎngluò)的使用減到最小,即盡量縮減消息的數(shù)量和大小。具體涉及到:分布數(shù)據(jù)庫(kù)設(shè)計(jì)分布查詢處理分布目錄管理分布并發(fā)控制分布死鎖管理分布DDBMS的可靠性操作系統(tǒng)的支持-如何提供一致的操作系統(tǒng)支持第二十頁(yè),共67頁(yè)。2分布式數(shù)據(jù)庫(kù)系統(tǒng)的體系結(jié)構(gòu)2.1分布式數(shù)據(jù)存儲(chǔ)(1)數(shù)據(jù)分配數(shù)據(jù)分配是指數(shù)據(jù)在計(jì)算機(jī)網(wǎng)絡(luò)各場(chǎng)地(chǎngdì)上的分配策略。集中式:所有數(shù)據(jù)均安排在同一個(gè)場(chǎng)地(chǎngdì)上。分割式:所有數(shù)據(jù)只有一份,分布被安置在若干個(gè)場(chǎng)地(chǎngdì)。全復(fù)制式:數(shù)據(jù)在每個(gè)場(chǎng)地(chǎngdì)重復(fù)存儲(chǔ)?;旌鲜剑簲?shù)據(jù)庫(kù)分成若干可相交的子集,每一子集安置在一個(gè)或多個(gè)場(chǎng)地(chǎngdì)上,但是每一場(chǎng)地(chǎngdì)未必保存全部數(shù)據(jù)。第二十一頁(yè),共67頁(yè)。分布式數(shù)據(jù)(shùjù)存儲(chǔ)(2)數(shù)據(jù)分片:分布式數(shù)據(jù)庫(kù)中的數(shù)據(jù)可以被分割和復(fù)制在物理場(chǎng)地(chǎngdì)的各個(gè)物理數(shù)據(jù)庫(kù)中。優(yōu)點(diǎn)將關(guān)系分片,有利于按用戶需求組織數(shù)據(jù)的分布。如產(chǎn)品→(內(nèi)銷產(chǎn)品,出口產(chǎn)品)。分片方式水平分片垂直分片導(dǎo)出分片混合分片第二十二頁(yè),共67頁(yè)。分布式數(shù)據(jù)(shùjù)存儲(chǔ)第二十三頁(yè),共67頁(yè)。第四十六頁(yè),共67頁(yè)。⒈把關(guān)系EMPLOYEE和DEPARTMENT分布從場(chǎng)地1和場(chǎng)地2傳到場(chǎng)地3,然后在場(chǎng)地3站進(jìn)行(jìnxíng)查詢傳送(chuánsònɡ)時(shí)間T=(104100+400000)/104=140s復(fù)雜的存取結(jié)構(gòu)在集中式系統(tǒng)中是有效存取數(shù)據(jù)的重要基數(shù),但在分布式系統(tǒng)中不一定有效。定義各種分片時(shí)必須遵守下面三個(gè)條件:fromEMPLOYEE,DEPARTMENT2分布式數(shù)據(jù)庫(kù)系統(tǒng)的體系結(jié)構(gòu)是由一個(gè)節(jié)點(diǎn)來(lái)統(tǒng)一管理各分?jǐn)?shù)據(jù)庫(kù)呢?還是各節(jié)點(diǎn)在必要時(shí),都挺身而出代行管理的職能呢?這是集中與分散的問(wèn)題。4分布式數(shù)據(jù)庫(kù)系統(tǒng)的優(yōu)缺點(diǎn)⒉把關(guān)系EMPLOYEE傳送到場(chǎng)地2,在場(chǎng)地2作聯(lián)接,再把操作結(jié)構(gòu)(jiégòu)從場(chǎng)地2傳到場(chǎng)地3:第四十一頁(yè),共67頁(yè)。第六十三頁(yè),共67頁(yè)。RS=R'S4客戶(kèhù)/服務(wù)器結(jié)構(gòu)的分布式系統(tǒng)r=r1r2…rnQ2:總的數(shù)據(jù)傳輸量是4800字節(jié),傳輸時(shí)間為0.分布式數(shù)據(jù)(shùjù)存儲(chǔ)1)水平分片 將關(guān)系r按行分為若干(ruògān)子集r1,r2,…,rn,每個(gè)子集ri稱為一個(gè)水平片段。 一個(gè)水平片段可以看成是關(guān)系上的一個(gè)選擇。ri=P(i)(r) 如M_S=sex=‘M’(S) 關(guān)系的重構(gòu)可以通過(guò)并運(yùn)算來(lái)實(shí)現(xiàn)。r=r1∪r2∪…∪rn第二十四頁(yè),共67頁(yè)。分布式數(shù)據(jù)(shùjù)存儲(chǔ)(2)垂直分片 將關(guān)系r按列分為若干屬性子集r1,r2,…,rn,每個(gè)子集ri稱為一個(gè)垂直片段。 一個(gè)垂直片段可以看成是關(guān)系上的一個(gè)投影。ri=∏Ri(r) 其中Ri是r的一個(gè)屬性子集。 如P_S=∏SNO,SNAME(S) 關(guān)系的重構(gòu)可以通過(guò)連接運(yùn)算來(lái)實(shí)現(xiàn)(shíxiàn)。r=r1r2…rn 要求所有垂直分片的片段都包括關(guān)系的鍵。第二十五頁(yè),共67頁(yè)。分布式數(shù)據(jù)(shùjù)存儲(chǔ)(3)混合分片關(guān)系(guānxì)按某種方式分片后,得到的片段再按另一種方式繼續(xù)分片。如SC(S#,C#,G,DNO)按學(xué)生系別分片,再對(duì)每個(gè)片段按成績(jī)(及格,不及格)分片。第二十六頁(yè),共67頁(yè)。分布式數(shù)據(jù)(shùjù)存儲(chǔ)定義各種分片時(shí)必須遵守下面三個(gè)條件:1)完備性條件:必須把全局關(guān)系的所有數(shù)據(jù)映射到各個(gè)片段中,絕不允許發(fā)生屬于全局關(guān)系的某個(gè)數(shù)據(jù)不屬于任何一個(gè)片段。2)重構(gòu)條件:劃分所采用的方法必須確保能夠(nénggòu)由各個(gè)分段重建全局關(guān)系。3)不相交條件:要求一個(gè)全局關(guān)系被劃分后得到的各個(gè)數(shù)據(jù)片段互相不重疊。目的是為了在數(shù)據(jù)分片時(shí)容易控制數(shù)據(jù)的復(fù)制。第二十七頁(yè),共67頁(yè)。2.2分布式數(shù)據(jù)庫(kù)系統(tǒng)的體系結(jié)構(gòu)全局外模式(móshì) 全局應(yīng)用的用戶視圖。全局概念模式(móshì) 定義D-DBS中數(shù)據(jù)的整體邏輯結(jié)構(gòu),數(shù)據(jù)如同沒(méi)有分布一樣。分片模式(móshì) 每一個(gè)關(guān)系可以分為若干互不相交的部分,每一部分稱為一個(gè)片段。分配(分布)模式(móshì) 定義片段的存放地點(diǎn)。第二十八頁(yè),共67頁(yè)。用戶(yònghù)視圖用戶(yònghù)視圖全局(quánjú)視圖分片視圖分配視圖局部概念視圖局部概念視圖局部?jī)?nèi)視圖局部?jī)?nèi)視圖局部DB局部DB分布式集中式分片視圖分片視圖分配視圖分配視圖局部概念視圖局部?jī)?nèi)視圖局部DB第二十九頁(yè),共67頁(yè)。舉例(jǔlì):RR1R2R3R4R11R21R12R22R23R33R43S1S2S3邏輯(luójí)片段物理(wùlǐ)映像一個(gè)全局關(guān)系的片段所對(duì)應(yīng)的存儲(chǔ)片段組成兩個(gè)物理映像可以相同。第三十頁(yè),共67頁(yè)。2.3分布(fēnbù)透明性分布(網(wǎng)絡(luò))透明性分片透明性(全局視圖和分片視圖之間) 用戶或應(yīng)用程序只對(duì)全局關(guān)系進(jìn)行(jìnxíng)操作而不必考慮關(guān)系的分片。如果分片模式改變了,通過(guò)調(diào)整全局模式與分片模式之間的映象關(guān)系來(lái)保持全局模式不變。位置透明性(分片視圖和分配視圖之間) 用戶或應(yīng)用程序不必了解片段的存儲(chǔ)位置。局部數(shù)據(jù)模型透明性(分配視圖和局部概念視圖之間) 用戶或應(yīng)用程序不必了解局部場(chǎng)地上使用的是哪種數(shù)據(jù)模型。第三十一頁(yè),共67頁(yè)。RR1R2R3R4R11R21R12R22R23R33R43S1S2S3第三十二頁(yè),共67頁(yè)。2.4分布式數(shù)據(jù)庫(kù)管理系統(tǒng)的功能(gōngnéng)及組成1、DDBMS的主要功能:用戶能夠?qū)W(wǎng)絡(luò)上任意場(chǎng)地?cái)?shù)據(jù)庫(kù)的數(shù)據(jù)進(jìn)行遠(yuǎn)程存取,執(zhí)行全局應(yīng)用。支持透明存取,提供一定級(jí)別的分布透明性。支持對(duì)分布式數(shù)據(jù)庫(kù)的管理與控制。支持對(duì)分布式事務(wù)的并發(fā)(bìngfā)控制和恢復(fù)。第三十三頁(yè),共67頁(yè)。為一個(gè)典型DDBMS的結(jié)構(gòu)圖,包括四個(gè)部分(bùfen):全局?jǐn)?shù)據(jù)庫(kù)管理系統(tǒng)GDBMS、全局?jǐn)?shù)據(jù)字典GDD、局部數(shù)據(jù)庫(kù)管理系統(tǒng)LDBMS、通信管理CM。網(wǎng)絡(luò)場(chǎng)地3DDBMS結(jié)構(gòu)圖場(chǎng)地1LDBLDBMSGDBMSCM用戶/DBAGDD場(chǎng)地2第三十四頁(yè),共67頁(yè)。1.全局?jǐn)?shù)據(jù)庫(kù)管理系統(tǒng)GDBMSGDBMS是DDBMS的核心,負(fù)責(zé)(fùzé)提供分布透明性,協(xié)調(diào)全局事務(wù)的執(zhí)行及協(xié)調(diào)各場(chǎng)地上的LDBMS共同完成全局應(yīng)用。GDBMS通常包括:(1)用戶接口層。提供一個(gè)用于檢驗(yàn)用戶身份的接口,用戶的應(yīng)用程序經(jīng)用戶接口處理,作為一個(gè)全局事務(wù)由DDBMS執(zhí)行。(2)語(yǔ)言處理層。負(fù)責(zé)(fùzé)查詢語(yǔ)言的語(yǔ)法、詞法分析,把查詢語(yǔ)句轉(zhuǎn)換成某種內(nèi)部表示形式,如用語(yǔ)法樹(shù)表示查詢。第三十五頁(yè),共67頁(yè)。(3)分布式數(shù)據(jù)管理層。主要完成查詢分解、優(yōu)化和確定查詢計(jì)劃。(4)分布式事務(wù)管理層。用于對(duì)分布式事務(wù)進(jìn)行并發(fā)控制,并提供全局恢復(fù)(huīfù)功能。(5)全局?jǐn)?shù)據(jù)與局部數(shù)據(jù)之間的轉(zhuǎn)換層。對(duì)異構(gòu)系統(tǒng),需將數(shù)據(jù)轉(zhuǎn)換成系統(tǒng)可接受的形式。具體的轉(zhuǎn)換有:數(shù)據(jù)模型的轉(zhuǎn)換;數(shù)字代碼格式、字長(zhǎng)、精度、單位等的轉(zhuǎn)換;操作命令、完整性規(guī)則、安全性規(guī)則的轉(zhuǎn)換等。第三十六頁(yè),共67頁(yè)。2.全局?jǐn)?shù)據(jù)字典GDDGDD負(fù)責(zé)提供系統(tǒng)的各種描述、管理和控制信息。如為系統(tǒng)提供各級(jí)模式描述、網(wǎng)絡(luò)描述、存取權(quán)限、事務(wù)優(yōu)先級(jí)、完整性約束與相容性約束、數(shù)據(jù)的分割及其定義、副本數(shù)據(jù)及其所在場(chǎng)地、存取路徑(lùjìng)、死鎖檢測(cè)、預(yù)防及故障恢復(fù),與數(shù)據(jù)庫(kù)運(yùn)行質(zhì)量有關(guān)的統(tǒng)計(jì)信息等。數(shù)據(jù)字典又稱數(shù)據(jù)目錄,是面向系統(tǒng)的。它由系統(tǒng)定義,在初始化時(shí)由系統(tǒng)自動(dòng)生成并為系統(tǒng)所用。由于數(shù)據(jù)是分布的,因此數(shù)據(jù)字典也存在一個(gè)分布策略及管理問(wèn)題,數(shù)據(jù)字典中的數(shù)據(jù)與冗余也需要進(jìn)行優(yōu)化。第三十七頁(yè),共67頁(yè)。3.局部(júbù)數(shù)據(jù)庫(kù)管理系統(tǒng)LDBMSLDBMS用來(lái)建立和管理各場(chǎng)地上的局部(júbù)數(shù)據(jù)庫(kù)LDB,提供場(chǎng)地的自治能力,可執(zhí)行局部(júbù)應(yīng)用和全局查詢的子查詢。4.通信管理CMCM遵循網(wǎng)絡(luò)協(xié)議,實(shí)現(xiàn)各場(chǎng)地之間數(shù)據(jù)的可靠傳送,完成系統(tǒng)的通信功能。第三十八頁(yè),共67頁(yè)。分布式數(shù)據(jù)庫(kù)管理系統(tǒng)的分類(fēnlèi)1.按LDBMS類型分類(1)同構(gòu)型DDBMS(HomogeneousDDBMS)同構(gòu)型(也稱均質(zhì)型)系統(tǒng)是指系統(tǒng)中每個(gè)場(chǎng)地的LDBMS類型都相同,即它們支持(zhīchí)相同的數(shù)據(jù)模型、訪問(wèn)方法、優(yōu)化策略、并發(fā)控制算法,以及相同的命令語(yǔ)言和查詢語(yǔ)言等。(2)異構(gòu)型DDBMS(HeterogeneousDDBMS)異構(gòu)型(也稱異質(zhì)型)系統(tǒng)是指系統(tǒng)中每個(gè)場(chǎng)地可以有不同類型的LDBMS。它們可以是不同的數(shù)據(jù)模型,也可以是同一數(shù)據(jù)模型但由不同廠商提供的產(chǎn)品。第三十九頁(yè),共67頁(yè)。2.按全局控制方式分類(1)全局集中控制的DDBMS這種方式的GDBMS和GDD集中在一個(gè)中心場(chǎng)地上,由該場(chǎng)地完成全局事務(wù)的協(xié)調(diào)和局部數(shù)據(jù)庫(kù)轉(zhuǎn)換等一切控制問(wèn)題。(2)全局控制分散的DDBMSGDBMS和GDD分散存放在各個(gè)場(chǎng)地上,即每個(gè)場(chǎng)地都有控制信息(xìnxī)的一個(gè)副本,都能完成全局事務(wù)的協(xié)調(diào)和局部數(shù)據(jù)庫(kù)轉(zhuǎn)換的控制問(wèn)題。第四十頁(yè),共67頁(yè)。(3)全局控制部分分散的DDBMS這種方式根據(jù)應(yīng)用的需要將GDBMS和GDD分散在某些場(chǎng)地上,即只在部分場(chǎng)地包含(bāohán)控制信息的副本,性能介于以上兩種類型之間。第四十一頁(yè),共67頁(yè)。分布式數(shù)據(jù)庫(kù)管理系統(tǒng)的分類(fēnlèi)3.按數(shù)據(jù)(shùjù)在邏輯上集中/分布分類:(1)物理上分布、邏輯上集中的DDBMS這種方式數(shù)據(jù)(shùjù)庫(kù)在邏輯上是集中的,用戶感覺(jué)不到數(shù)據(jù)(shùjù)的分布,看到的似乎是一個(gè)數(shù)據(jù)(shùjù)模式為全局?jǐn)?shù)據(jù)(shùjù)模式的集中式數(shù)據(jù)(shùjù)庫(kù)。(2)物理上分布、邏輯上分布的DDBMS這種分布式數(shù)據(jù)(shùjù)庫(kù)系統(tǒng)又稱聯(lián)邦分布式數(shù)據(jù)(shùjù)庫(kù)系統(tǒng)(FederatedDistributedDatabaseSystems)。系統(tǒng)中每個(gè)場(chǎng)地所看到的數(shù)據(jù)(shùjù)模式是不同的,好像有多個(gè)邏輯數(shù)據(jù)(shùjù)庫(kù)存在。第四十二頁(yè),共67頁(yè)。分布式數(shù)據(jù)庫(kù)管理系統(tǒng)的分類(fēnlèi)4.按功能分類(1)綜合型體系結(jié)構(gòu)設(shè)計(jì)一個(gè)全新的DDBMS時(shí),設(shè)計(jì)人員可綜合權(quán)衡用戶需求,采用自頂向下的設(shè)計(jì)方法,設(shè)計(jì)一個(gè)完整的DDBMS,然后把系統(tǒng)的功能按一定的策略分散(fēnsàn)配置在一個(gè)分布式環(huán)境中,這種結(jié)構(gòu)稱為DDBMS。(2)聯(lián)合型體系結(jié)構(gòu)在原有DBMS基礎(chǔ)上建立分布式DBMS,按照使用LDBMS類型的不同又分為同構(gòu)型和異構(gòu)型DDBMS。第四十三頁(yè),共67頁(yè)。分布式數(shù)據(jù)庫(kù)管理系統(tǒng)的分類(fēnlèi)5.按層次分類法分類(1)單層結(jié)構(gòu)DDBMS指一個(gè)分布式數(shù)據(jù)庫(kù)中,在同一全局DBMS控制管理下,其數(shù)據(jù)物理分布在網(wǎng)絡(luò)的多個(gè)(duōɡè)場(chǎng)地上,每個(gè)場(chǎng)地不存在獨(dú)立的DBMS,但可以包含全局DBMS的子部件。(2)多層結(jié)構(gòu)DDBMS如果一個(gè)分布式數(shù)據(jù)庫(kù)是來(lái)自一些相互連接的場(chǎng)地上的數(shù)據(jù)庫(kù)中數(shù)據(jù)的邏輯集合,則稱該系統(tǒng)為多層結(jié)構(gòu)的DDBMS。在這種系統(tǒng)中,每個(gè)場(chǎng)地都有一個(gè)獨(dú)立的DBMS,而且每個(gè)場(chǎng)地可以是另一個(gè)單層或多層結(jié)構(gòu)的DDBMS。第四十四頁(yè),共67頁(yè)。2.5分布式數(shù)據(jù)庫(kù)系統(tǒng)中存在(cúnzài)的問(wèn)題1、不同場(chǎng)地的通信速度(sùdù),與局部DBS的存儲(chǔ)部件的存取速度(sùdù)相比,是非常慢的。2、通信系統(tǒng)有較高的存取延遲時(shí)間。3、在CPU上處理通信的代價(jià)很高。4、不同通信系統(tǒng)有不同意義的字符,數(shù)據(jù)轉(zhuǎn)換速度(sùdù)也不一樣,可以相差1000倍,存取延遲時(shí)間可能相差106倍。第四十五頁(yè),共67頁(yè)。3分布式查詢處理分布式數(shù)據(jù)庫(kù)系統(tǒng)中由于數(shù)據(jù)分布在各個(gè)場(chǎng)地(chǎngdì),因此,查詢的處理比集中式數(shù)據(jù)庫(kù)復(fù)雜。第四十六頁(yè),共67頁(yè)。3.1查詢處理的傳輸(chuánshū)代價(jià)Site-1Site-2EMPLOYEE104個(gè)記錄(jìlù)每個(gè)記錄(jìlù)100字節(jié)DEPARTMENT100個(gè)記錄(jìlù)每個(gè)記錄(jìlù)100字節(jié)檢索每個(gè)職工的姓名、地址及工作部門(mén)名 selectENAME,ADDRESS,DNAME
fromEMPLOYEE,DEPARTMENT
whereDNO=DNUMBER網(wǎng)絡(luò)傳輸速度104字節(jié)/秒第四十七頁(yè),共67頁(yè)。分布式查詢處理⒈把關(guān)系EMPLOYEE和DEPARTMENT分布從場(chǎng)地1和場(chǎng)地2傳到場(chǎng)地3,然后在場(chǎng)地3站進(jìn)行(jìnxíng)查詢 傳送時(shí)間T=(104100+10035)/104=100s32 傳送時(shí)間T=總傳輸(chuánshū)延遲+總數(shù)據(jù)量/傳輸(chuánshū)速度1第四十八頁(yè),共67頁(yè)。分布式查詢處理⒉把關(guān)系EMPLOYEE傳送(chuánsònɡ)到場(chǎng)地2,在場(chǎng)地2作聯(lián)接,再把操作結(jié)構(gòu)從場(chǎng)地2傳到場(chǎng)地3: 傳送(chuánsònɡ)時(shí)間T=(104100+400000)/104=140s132第四十九頁(yè),共67頁(yè)。分布式查詢處理3.把關(guān)系DEPARTMENT傳送到場(chǎng)地1,在場(chǎng)地1作聯(lián)接,再把操作(cāozuò)結(jié)構(gòu)從場(chǎng)地1傳到場(chǎng)地3: 傳送時(shí)間T=(3500+400000)/104=40s132第五十頁(yè),共67頁(yè)。分布式查詢處理2)在場(chǎng)地3有一個(gè)查詢“檢索每個(gè)部門(mén)的名字和其經(jīng)理(jīnglǐ)的姓名、地址”。selectDNAME,ENAME,ADDRESSfromEMPLOYEE,DEPARTMENT whereMGRENO=ENO第五十一頁(yè),共67頁(yè)。分布式查詢處理⒈把關(guān)系EMPLOYEE和DEPARTMENT分布從場(chǎng)地1和場(chǎng)地2傳到場(chǎng)地3,然后(ránhòu)在場(chǎng)地3站進(jìn)行查詢 傳送時(shí)間T=(104100+3500)/104=100s32 傳送(chuánsònɡ)時(shí)間T=總傳輸延遲+總數(shù)據(jù)量/傳輸速度1第五十二頁(yè),共67頁(yè)。分布式查詢處理⒉把關(guān)系EMPLOYEE傳送到場(chǎng)地2,在場(chǎng)地2作聯(lián)接,再把操作結(jié)構(gòu)(jiégòu)從場(chǎng)地2傳到場(chǎng)地3: 傳送時(shí)間T=(104100+4000)/104=100s132第五十三頁(yè),共67頁(yè)。分布式查詢處理3.把關(guān)系DEPARTMENT傳送(chuánsònɡ)到場(chǎng)地1,在場(chǎng)地1作聯(lián)接,再把操作結(jié)構(gòu)從場(chǎng)地1傳到場(chǎng)地3: 傳送(chuánsònɡ)時(shí)間T=(3500+4000)/104=0.75s132第五十四頁(yè),共67頁(yè)。分布式查詢處理3)如果在場(chǎng)地(chǎngdì)2提出上述兩個(gè)查詢Q1和Q2,可以有兩種方法:4、把關(guān)系EMPLOYEE傳送到場(chǎng)地(chǎngdì)2,在場(chǎng)地(chǎngdì)2作聯(lián)接,此時(shí)Q1和Q2的傳輸量都是1000000,時(shí)間都是100秒。12Q1Q2第五十五頁(yè),共67頁(yè)。分布式查詢處理5.把關(guān)系DEPARTMENT傳送到場(chǎng)地1,在場(chǎng)地1作聯(lián)接,再把結(jié)果從場(chǎng)地1傳到場(chǎng)地2,此時(shí)Q1的傳輸(chuánshū)量為:3500+400000=403500,時(shí)間是40秒。Q2的傳輸(chuánshū)量都是3500+4000=7500,時(shí)間是0.75秒。12第五十六頁(yè),共67頁(yè)。3.2基于半聯(lián)接的查詢(cháxún)優(yōu)化策略數(shù)據(jù)在網(wǎng)絡(luò)中傳輸,如果都以整個(gè)關(guān)系傳輸,顯然是一種冗余。不參與聯(lián)接的值或無(wú)用的值不必在網(wǎng)絡(luò)中來(lái)回傳輸。(1)、基于半聯(lián)接的查詢實(shí)例:如果在場(chǎng)地2提出上述兩個(gè)查詢Q1和Q2,可以有兩種方法:把關(guān)系DEPARTMENT傳送到場(chǎng)地1,在場(chǎng)地1作聯(lián)接,再把結(jié)果從場(chǎng)地1傳到場(chǎng)地2??梢愿倪M(jìn):1)在場(chǎng)地2,用投影求得關(guān)系DEPARTMENT中參與聯(lián)接操作(cāozuò)的屬性值,把投影結(jié)果傳輸?shù)綀?chǎng)地1。Q1:數(shù)據(jù)傳輸量是400字節(jié)(DEPARTMENT在DNUMBER上的投影)。Q2:數(shù)據(jù)傳輸量是900字節(jié)(DEPARTMENT在MGRENO上的投影)。第五十七頁(yè),共67頁(yè)。3.2基于半聯(lián)接的查詢(cháxún)優(yōu)化策略2)在場(chǎng)地1,執(zhí)行聯(lián)接操作,并用投影求出所需的屬性值,把結(jié)果送到場(chǎng)地2。Q1:數(shù)據(jù)傳輸量是340000字節(jié)。Q2:數(shù)據(jù)傳輸量是3900字節(jié)。3)在場(chǎng)地2,執(zhí)行聯(lián)接操作,把結(jié)果給用戶(yònghù)。Q1:總的數(shù)據(jù)傳輸量是340400字節(jié),傳輸時(shí)間為40秒。Q2:總的數(shù)據(jù)傳輸量是4800字節(jié),傳輸時(shí)間為0.75。顯然,本方法采用的查詢處理方法是有效的。第五十八頁(yè),共67頁(yè)。(2)半聯(lián)接(liánjiē)操作的定義半連接運(yùn)算(yùnsuàn)定義 半連接RS=R(RS)
=第五十九頁(yè),共67頁(yè)。(2)半聯(lián)接(liánjiē)操作的定義半連接作用(zuòyòng) 找出R中能夠與S中元組相連接的元組來(lái),類似于在連接之前先做選擇和投影。RS=(RS)SRS=(SR)R半連接的非對(duì)稱性RS(SR
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年環(huán)保型汽車運(yùn)輸汽油專項(xiàng)合同模板3篇
- 下年個(gè)人工作計(jì)劃
- 2024年單位福利房產(chǎn)權(quán)轉(zhuǎn)讓及后續(xù)物業(yè)管理合同3篇
- 買(mǎi)賣合同范文集錦6篇
- 2022銷售類工作計(jì)劃
- 工程合同匯編七篇
- 主任工作計(jì)劃模板
- 中國(guó)其他貴金屬冶煉行業(yè)分析報(bào)告
- 年度商務(wù)工作計(jì)劃
- 讀三國(guó)演義有感600字寒假作文
- 市場(chǎng)營(yíng)銷試題(含參考答案)
- 九年級(jí)化學(xué)下冊(cè) 第9單元 課題1《溶液的形成》教案 (新版)新人教版
- 景區(qū)旅游安全風(fēng)險(xiǎn)評(píng)估報(bào)告
- 電氣工程及其自動(dòng)化職業(yè)規(guī)劃課件
- 2023年新高考(新課標(biāo))全國(guó)2卷數(shù)學(xué)試題真題(含答案解析)
- 2024年計(jì)算機(jī)二級(jí)WPS考試題庫(kù)380題(含答案)
- 計(jì)價(jià)格[1999]1283號(hào)_建設(shè)項(xiàng)目前期工作咨詢收費(fèi)暫行規(guī)定
- 植物與植物生理課程教學(xué)大綱
- 展廳展館中控系統(tǒng)解決方案
- 兒童福利個(gè)人工作總結(jié)報(bào)告
- 《夜宿山寺》
評(píng)論
0/150
提交評(píng)論