版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第九章分布式數(shù)據(jù)庫系統(tǒng)第九章分布式數(shù)據(jù)庫系統(tǒng)1本章內容分布式數(shù)據(jù)庫系統(tǒng)概述分布式數(shù)據(jù)庫系統(tǒng)的體系結構分布式查詢處理客戶/服務器結構的分布式系統(tǒng)本章內容分布式數(shù)據(jù)庫系統(tǒng)概述29.1分布式數(shù)據(jù)庫系統(tǒng)概述9.1.1集中式系統(tǒng)和分布式系統(tǒng)集中式數(shù)據(jù)庫管理系統(tǒng)的缺點:通信開銷大;系統(tǒng)的堅固性差;性能差;可擴充性差;設計、管理困難。分散式系統(tǒng):將數(shù)據(jù)庫分成多個,建立在多臺計算機上,數(shù)據(jù)庫的管理、應用程序的研制都是分開并相互獨立的,之間不存在數(shù)據(jù)通行聯(lián)系。分布式數(shù)據(jù)庫系統(tǒng)的特點:數(shù)據(jù)的分布性;統(tǒng)一性;透明性。統(tǒng)一性(兩個方面:數(shù)據(jù)在邏輯上的統(tǒng)一性和數(shù)據(jù)在管理上的統(tǒng)一性)分布式數(shù)據(jù)庫與集中式數(shù)據(jù)庫相比的優(yōu)點:堅固性好;可擴充性好;可改善性能;自治性好。9.1分布式數(shù)據(jù)庫系統(tǒng)概述9.1.1集中式系統(tǒng)和分布式系39.1分布式數(shù)據(jù)庫系統(tǒng)概述與集中式數(shù)據(jù)庫相比,分布式DB具有:數(shù)據(jù)分布式的特點。與分散式數(shù)據(jù)庫相比,分布式DB具有:邏輯整體性的特點。9.1分布式數(shù)據(jù)庫系統(tǒng)概述與集中式數(shù)據(jù)庫相比,分布式DB具4背景數(shù)據(jù)庫系統(tǒng)+計算機網(wǎng)絡9.1.2分布式數(shù)據(jù)庫系統(tǒng)的定義DB1DB1DB1計算機1計算機2計算機3通訊網(wǎng)絡T1T2T3T1T2T3T1T2T3背景數(shù)據(jù)庫系統(tǒng)+計算機網(wǎng)絡9.1.2分布式59.1.2分布式數(shù)據(jù)庫系統(tǒng)的定義一個分布式系統(tǒng)由通信網(wǎng)絡聯(lián)接起來的結點的集合。每個結點都是擁有集中式數(shù)據(jù)庫的計算機系統(tǒng)。分布式數(shù)據(jù)庫的特點:數(shù)據(jù)庫中的數(shù)據(jù)不是存儲在同一場地,而是分布存儲在多個場地。9.1.2分布式數(shù)據(jù)庫系統(tǒng)的定義一個分布式系統(tǒng)由通信網(wǎng)絡聯(lián)69.1.2分布式數(shù)據(jù)庫系統(tǒng)的定義分布性:數(shù)據(jù)存儲在不同場地上。與集中式數(shù)據(jù)庫不同。邏輯整體性:數(shù)據(jù)邏輯上是相互聯(lián)系的一個整體。與分散在計算機網(wǎng)絡不同站點上的一組沒有相互聯(lián)系的本地數(shù)據(jù)庫區(qū)別開來。9.1.2分布式數(shù)據(jù)庫系統(tǒng)的定義分布性:數(shù)據(jù)存儲在不同場地79.1.2分布式數(shù)據(jù)庫系統(tǒng)的定義物理上是分布的,邏輯上是統(tǒng)一的一組數(shù)據(jù)庫的集合要素計算機網(wǎng)絡數(shù)據(jù)庫系統(tǒng)9.1.2分布式數(shù)據(jù)庫系統(tǒng)的定義物理上是分布的,邏輯上是統(tǒng)8DB1DB1DB1計算機1計算機1計算機1通訊網(wǎng)絡北京重慶上海銀行系統(tǒng)訪問本地銀行數(shù)據(jù):局部應用通兌業(yè)務、轉賬業(yè)務:全局應用DB1DB1DB1計算機1計算機1計算機1通訊網(wǎng)絡北京重慶上99.1.2分布式數(shù)據(jù)庫系統(tǒng)的定義全局應用:指涉及到兩個或兩個以上場地中數(shù)據(jù)庫的應用。網(wǎng)絡的每個站點具有獨立處理能力,可以執(zhí)行局部應用,同時也能通過網(wǎng)絡執(zhí)行全局應用。分布式數(shù)據(jù)庫是由一組數(shù)據(jù)庫組成,這些數(shù)據(jù)庫分布在計算機網(wǎng)絡的不同站點上,邏輯上是屬于同一個系統(tǒng)的。9.1.2分布式數(shù)據(jù)庫系統(tǒng)的定義全局應用:指涉及到兩個或兩109.1.2分布式數(shù)據(jù)庫系統(tǒng)的定義分布式數(shù)據(jù)庫包含兩個重要組成部分:分布式數(shù)據(jù)庫和分布式數(shù)據(jù)庫管理系統(tǒng)。分布式數(shù)據(jù)庫是計算機網(wǎng)絡環(huán)境中各場地上數(shù)據(jù)庫的邏輯集合。分布式數(shù)據(jù)庫管理系統(tǒng)是分布式數(shù)據(jù)庫系統(tǒng)中的一組軟件,它復雜管理分布環(huán)境下邏輯集成數(shù)據(jù)的存取、一致性、有效性和完備性。9.1.2分布式數(shù)據(jù)庫系統(tǒng)的定義分布式數(shù)據(jù)庫包含兩個重要組119.1.3分布式數(shù)據(jù)庫系統(tǒng)的透明性位置透明性 用戶或應用程序不必了解它所使用的數(shù)據(jù)的存儲位置。舉例:銀行的借貸業(yè)務:要判斷的情況有5種。復制透明性 有些數(shù)據(jù)并不存在一個場地,可能重復存放在不同的場地。本地數(shù)據(jù)庫中也包含了外地數(shù)據(jù)庫中的數(shù)據(jù)。
一個分布式系統(tǒng)有了這兩種透明性后,用戶看到的系統(tǒng)就如同一個集中式系統(tǒng)。9.1.3分布式數(shù)據(jù)庫系統(tǒng)的透明性位置透明性129.1.4分布式數(shù)據(jù)庫系統(tǒng)的優(yōu)缺點具有靈活的體系結構數(shù)據(jù)庫的使用單位組織上、地理上是分布的適應分布式管理和控制機構。經(jīng)濟性能優(yōu)越經(jīng)濟上和組織上的理由系統(tǒng)的可靠性高,可用性好。局部應用的響應速度快??蓴U展性好,易于集成現(xiàn)有系統(tǒng)。既有數(shù)據(jù)庫互連,歷史繼承;數(shù)據(jù)資源共享系統(tǒng)規(guī)模逐步擴展增加結點,不影響現(xiàn)有系統(tǒng)運行9.1.4分布式數(shù)據(jù)庫系統(tǒng)的優(yōu)缺點具有靈活的體系結構139.1.4分布式數(shù)據(jù)庫系統(tǒng)的優(yōu)缺點缺點:系統(tǒng)開銷大,主要花在通信部分。復雜的存取結構在集中式系統(tǒng)中是有效存取數(shù)據(jù)的重要基數(shù),但在分布式系統(tǒng)中不一定有效。數(shù)據(jù)的安全和行保密性較難處理。9.1.4分布式數(shù)據(jù)庫系統(tǒng)的優(yōu)缺點缺點:149.1.5分布式數(shù)據(jù)庫系統(tǒng)的分類同構同質數(shù)據(jù)庫每個場地都用同一類型的數(shù)據(jù)模型,并運行同一型號的DBMS同構異質數(shù)據(jù)庫每個場地都用同一類型的數(shù)據(jù)模型,但運行不同型號的DBMS異構數(shù)據(jù)庫場地上的數(shù)據(jù)庫系統(tǒng)不盡相同DBMS不同數(shù)據(jù)模型不同9.1.5分布式數(shù)據(jù)庫系統(tǒng)的分類同構同質數(shù)據(jù)庫15練習:1、與集中式DB相比,分布式DB具有()特點,與分散式DB相比,又具有()特點。2、區(qū)別系統(tǒng)是分散式還是分布式就是判定系統(tǒng)是否支持().3、在分布式DB中,用戶看到的系統(tǒng)如同一個集中式DBS,這是因為分布式系統(tǒng)具有()和()特點。4、如果各個場地都采用同類型數(shù)據(jù)模型,但DBMS不同型號,這種系統(tǒng)屬于()型DBMS.1、數(shù)據(jù)分布性,邏輯整體性2、全局應用3、位置透明性,復制透明性4、同構異質型DDBS.練習:1、與集中式DB相比,分布式DB具有()特點,與分散式169.2分布式數(shù)據(jù)庫系統(tǒng)的體系結構9.2.1分布式數(shù)據(jù)存儲(1)數(shù)據(jù)分配數(shù)據(jù)分配是指數(shù)據(jù)在計算機網(wǎng)絡各場地上的分配策略。集中式:所有數(shù)據(jù)均安排在同一個場地上。分割式:所有數(shù)據(jù)只有一份,分布被安置在若干個場地。全復制式:數(shù)據(jù)在每個場地重復存儲?;旌鲜剑簲?shù)據(jù)庫分成若干可相交的子集,每一子集安置在一個或多個場地上,但是每一場地未必保存全部數(shù)據(jù)。9.2分布式數(shù)據(jù)庫系統(tǒng)的體系結構9.2.1分布式數(shù)據(jù)存儲17分布式數(shù)據(jù)存儲(2)數(shù)據(jù)分片:分布式數(shù)據(jù)庫中的數(shù)據(jù)可以被分割和復制在物理場地的各個物理數(shù)據(jù)庫中。優(yōu)點將關系分片,有利于按用戶需求組織數(shù)據(jù)的分布。如產品→(內銷產品,出口產品)。分片方式水平分片垂直分片導出分片混合分片分布式數(shù)據(jù)存儲(2)數(shù)據(jù)分片:分布式數(shù)據(jù)庫中的數(shù)據(jù)可以被分割18分布式數(shù)據(jù)存儲分布式數(shù)據(jù)存儲19分布式數(shù)據(jù)存儲1)水平分片 將關系r按行分為若干子集r1,r2,…,rn,每個子集ri稱為一個水平片段。 一個水平片段可以看成是關系上的一個選擇。ri=P(i)(r) 如M_S=sex=‘M’(S) 關系的重構可以通過并運算來實現(xiàn)。r=r1∪r2∪…∪rn分布式數(shù)據(jù)存儲1)水平分片20分布式數(shù)據(jù)存儲(2)垂直分片 將關系r按列分為若干屬性子集r1,r2,…,rn,每個子集ri稱為一個垂直片段。 一個垂直片段可以看成是關系上的一個投影。ri=∏Ri(r) 其中Ri是r的一個屬性子集。 如P_S=∏SNO,SNAME(S) 關系的重構可以通過連接運算來實現(xiàn)。r=r1r2…rn
要求所有垂直分片的片段都包括關系的鍵。分布式數(shù)據(jù)存儲(2)垂直分片21分布式數(shù)據(jù)存儲(3)混合分片關系按某種方式分片后,得到的片段再按另一種方式繼續(xù)分片。如SC(S#,C#,G,DNO)按學生系別分片,再對每個片段按成績(及格,不及格)分片。分布式數(shù)據(jù)存儲(3)混合分片22分布式數(shù)據(jù)存儲定義各種分片時必須遵守下面三個條件:1)完備性條件:必須把全局關系的所有數(shù)據(jù)映射到各個片段中,絕不允許發(fā)生屬于全局關系的某個數(shù)據(jù)不屬于任何一個片段。2)重構條件:劃分所采用的方法必須確保能夠由各個分段重建全局關系。3)不相交條件:要求一個全局關系被劃分后得到的各個數(shù)據(jù)片段互相不重疊。目的是為了在數(shù)據(jù)分片時容易控制數(shù)據(jù)的復制。分布式數(shù)據(jù)存儲定義各種分片時必須遵守下面三個條件:239.2.2分布式數(shù)據(jù)庫系統(tǒng)的體系結構全局外模式 全局應用的用戶視圖。全局概念模式 定義D-DBS中數(shù)據(jù)的整體邏輯結構,數(shù)據(jù)如同沒有分布一樣。分片模式 每一個關系可以分為若干互不相交的部分,每一部分稱為一個片段。分配(分布)模式 定義片段的存放地點。9.2.2分布式數(shù)據(jù)庫系統(tǒng)的體系結構全局外模式24用戶視圖用戶視圖全局視圖分片視圖分配視圖局部概念視圖局部概念視圖局部內視圖局部內視圖局部DB局部DB分布式集中式分片視圖分片視圖分配視圖分配視圖局部概念視圖局部內視圖局部DB用戶視圖用戶視圖全局視圖分片視圖分配視圖局部概念視圖局部概念25舉例:RR1R2R3R4R11R21R12R22R23R33R43S1S2S3邏輯片段物理映像一個全局關系的片段所對應的存儲片段組成兩個物理映像可以相同。舉例:RR1R2R3R4R11R21R12R22R23R33269.2.3分布透明性分布(網(wǎng)絡)透明性分片透明性(全局視圖和分片視圖之間) 用戶或應用程序只對全局關系進行操作而不必考慮關系的分片。如果分片模式改變了,通過調整全局模式與分片模式之間的映象關系來保持全局模式不變。位置透明性(分片視圖和分配視圖之間)
用戶或應用程序不必了解片段的存儲位置。局部數(shù)據(jù)模型透明性(分配視圖和局部概念視圖之間)
用戶或應用程序不必了解局部場地上使用的是哪種數(shù)據(jù)模型。9.2.3分布透明性分布(網(wǎng)絡)透明性27RR1R2R3R4R11R21R12R22R23R33R43S1S2S3例子9.4RR1R2R3R4R11R21R12R22R23R33R43289.2.4分布式數(shù)據(jù)庫管理系統(tǒng)的功能及組成1、DDBMS的主要功能:接收用戶請求;訪問網(wǎng)絡數(shù)據(jù)字典;如果目標數(shù)據(jù)存儲于系統(tǒng)的多個計算機上,就必須進行分布式處理;通信接口功能;在一個異構型分布式處理環(huán)境中,還需要提供數(shù)據(jù)和進程移植的支持。2、DDBMS的組成:查詢處理子系統(tǒng)、完整性子系統(tǒng)、調度子系統(tǒng)和可靠性子系統(tǒng)。9.2.4分布式數(shù)據(jù)庫管理系統(tǒng)的功能及組成1、DDBMS的299.2.5分布式數(shù)據(jù)庫系統(tǒng)中存在的問題1、不同場地的通信速度,與局部DBS的存儲部件的存取速度相比,是非常慢的。2、通信系統(tǒng)有較高的存取延遲時間。3、在CPU上處理通信的代價很高。4、不同通信系統(tǒng)有不同意義的字符,數(shù)據(jù)轉換速度也不一樣,可以相差1000倍,存取延遲時間可能相差106倍。9.2.5分布式數(shù)據(jù)庫系統(tǒng)中存在的問題1、不同場地的通信速309.3分布式查詢處理分布式數(shù)據(jù)庫系統(tǒng)中由于數(shù)據(jù)分布在各個場地,因此,查詢的處理比集中式數(shù)據(jù)庫復雜。9.3分布式查詢處理分布式數(shù)據(jù)庫系統(tǒng)中由于數(shù)據(jù)分布在各個場319.3.1查詢處理的傳輸代價Site-1Site-2EMPLOYEE104個記錄每個記錄100字節(jié)DEPARTMENT100個記錄每個記錄100字節(jié)檢索每個職工的姓名、地址及工作部門名 selectENAME,ADDRESS,DNAME
fromEMPLOYEE,DEPARTMENT
whereDNO=DNUMBER網(wǎng)絡傳輸速度104字節(jié)/秒9.3.1查詢處理的傳輸代價Site-1Site-2EMP32分布式查詢處理⒈把關系EMPLOYEE和DEPARTMENT分布從場地1和場地2傳到場地3,然后在場地3站進行查詢 傳送時間T=(104100+10035
)/104=100s32 傳送時間T=總傳輸延遲+總數(shù)據(jù)量/傳輸速度1分布式查詢處理⒈把關系EMPLOYEE和DEPARTMENT33分布式查詢處理⒉把關系EMPLOYEE傳送到場地2,在場地2作聯(lián)接,再把操作結構從場地2傳到場地3: 傳送時間T=(104100+400000
)/104=140s132分布式查詢處理⒉把關系EMPLOYEE傳送到場地2,在場地234分布式查詢處理3.把關系DEPARTMENT傳送到場地1,在場地1作聯(lián)接,再把操作結構從場地1傳到場地3: 傳送時間T=(3500+400000
)/104=40s132分布式查詢處理3.把關系DEPARTMENT傳送到場地1,在35分布式查詢處理2)在場地3有一個查詢“檢索每個部門的名字和其經(jīng)理的姓名、地址”。selectDNAME,ENAME,ADDRESS
fromEMPLOYEE,DEPARTMENT
whereMGRENO=ENO分布式查詢處理2)在場地3有一個查詢“檢索每個部門的名字和其36分布式查詢處理⒈把關系EMPLOYEE和DEPARTMENT分布從場地1和場地2傳到場地3,然后在場地3站進行查詢 傳送時間T=(104100+3500
)/104=100s32 傳送時間T=總傳輸延遲+總數(shù)據(jù)量/傳輸速度1分布式查詢處理⒈把關系EMPLOYEE和DEPARTMENT37分布式查詢處理⒉把關系EMPLOYEE傳送到場地2,在場地2作聯(lián)接,再把操作結構從場地2傳到場地3: 傳送時間T=(104100+4000
)/104=100s132分布式查詢處理⒉把關系EMPLOYEE傳送到場地2,在場地238分布式查詢處理3.把關系DEPARTMENT傳送到場地1,在場地1作聯(lián)接,再把操作結構從場地1傳到場地3: 傳送時間T=(3500+4000
)/104=0.75s132分布式查詢處理3.把關系DEPARTMENT傳送到場地1,在39分布式查詢處理3)如果在場地2提出上述兩個查詢Q1和Q2,可以有兩種方法:4、把關系EMPLOYEE傳送到場地2,在場地2作聯(lián)接,此時Q1和Q2的傳輸量都是1000000,時間都是100秒。12Q1Q2分布式查詢處理3)如果在場地2提出上述兩個查詢Q1和Q2,可40分布式查詢處理5.把關系DEPARTMENT傳送到場地1,在場地1作聯(lián)接,再把結果從場地1傳到場地2,此時Q1的傳輸量為:3500+400000=403500,時間是40秒。Q2的傳輸量都是3500+4000=7500,時間是0.75秒。12分布式查詢處理5.把關系DEPARTMENT傳送到場地1,在419.3.2基于半聯(lián)接的查詢優(yōu)化策略數(shù)據(jù)在網(wǎng)絡中傳輸,如果都以整個關系傳輸,顯然是一種冗余。不參與聯(lián)接的值或無用的值不必在網(wǎng)絡中來回傳輸。(1)、基于半聯(lián)接的查詢實例:如果在場地2提出上述兩個查詢Q1和Q2,可以有兩種方法:把關系DEPARTMENT傳送到場地1,在場地1作聯(lián)接,再把結果從場地1傳到場地2??梢愿倪M:1)在場地2,用投影求得關系DEPARTMENT中參與聯(lián)接操作的屬性值,把投影結果傳輸?shù)綀龅?。Q1:數(shù)據(jù)傳輸量是400字節(jié)(DEPARTMENT在DNUMBER上的投影)。Q2:數(shù)據(jù)傳輸量是900字節(jié)(DEPARTMENT在MGRENO上的投影)。9.3.2基于半聯(lián)接的查詢優(yōu)化策略數(shù)據(jù)在網(wǎng)絡中傳輸,如果都以429.3.2基于半聯(lián)接的查詢優(yōu)化策略2)在場地1,執(zhí)行聯(lián)接操作,并用投影求出所需的屬性值,把結果送到場地2。Q1:數(shù)據(jù)傳輸量是340000字節(jié)。Q2:數(shù)據(jù)傳輸量是3900字節(jié)。3)在場地2,執(zhí)行聯(lián)接操作,把結果給用戶。Q1:總的數(shù)據(jù)傳輸量是340400字節(jié),傳輸時間為40秒。Q2:總的數(shù)據(jù)傳輸量是4800字節(jié),傳輸時間為0.75。顯然,本方法采用的查詢處理方法是有效的。9.3.2基于半聯(lián)接的查詢優(yōu)化策略2)在場地1,執(zhí)行聯(lián)接操作43(2)半聯(lián)接操作的定義半連接運算定義 半連接RS=R(RS)
=(2)半聯(lián)接操作的定義半連接運算=44(2)半聯(lián)接操作的定義半連接作用 找出R中能夠與S中元組相連接的元組來,類似于在連接之前先做選擇和投影。RS=(RS)SRS=(SR)R半連接的非對稱性RS(SR)定義RS=R(RS)
A=B
A=B(2)半聯(lián)接操作的定義半連接作用45(2)半聯(lián)接操作的定義半連接在分布式數(shù)據(jù)庫中的應用 R與S位于不同場地S1,S2上,其屬性組分別為A,B,要作聯(lián)接操作。⒈在場地2對S做投影,然后把B(S)傳輸?shù)綀龅?⒉在場地1執(zhí)行半聯(lián)接,設結果為R‘,然后把結果送到場地2。R‘=RS
A=B⒊在場地2執(zhí)行R‘與S的聯(lián)接操作,得到最后結果。RS=R'S(2)半聯(lián)接操作的定義半連接在分布式數(shù)據(jù)庫中的應用46ABC123456889357BCD234578864238計算RS;RS;SR
3=2
3=1RSABC123456889357BCD23457886423847ABC123357ABC123456357BCD234578864238計算RS;RS;SR
3=2
3=1ABC123357ABC123456357BCD234578489.3.3基于聯(lián)接的查詢優(yōu)化策略在分布式查詢處理時,究竟用半聯(lián)接還是用聯(lián)接方案,取決于數(shù)據(jù)傳輸和局部處理的相對費用。9.3.3基于聯(lián)接的查詢優(yōu)化策略在分布式查詢處理時,究竟用499.4客戶/服務器結構的分布式系統(tǒng)9.4.1客戶/服務器式DBS在計算機中網(wǎng)絡中,有一些計算機扮演客戶,另一些扮演服務器,客戶統(tǒng)通過計算機網(wǎng)絡向服務器提出計算請求,服務器經(jīng)過計算,將結果返回客戶機。這樣的計算機網(wǎng)絡稱為客戶/服務器計算機網(wǎng)絡。9.4客戶/服務器結構的分布式系統(tǒng)9.4.1客戶/服務器509.4.1客戶/服務器式DBSClientServer客戶發(fā)出請求同意連接請求客戶發(fā)出服務請求服務器給出響應連接建立Client客戶發(fā)出請求同意連接請求客戶發(fā)出服務請求服務器給出響應連接建立9.4.1客戶/服務器式DBSClientServer客戶519.4.1客戶/服務器式DBS在客戶/服務器式DBS中,數(shù)據(jù)庫應用的功能分為兩部分:1、前端部分:由應用程序構成2、后端部分:包括存取結果、查詢優(yōu)化、并發(fā)控制、恢復等系統(tǒng)程序。9.4.1客戶/服務器式DBS在客戶/服務器式DBS中,數(shù)529.4.2客戶/服務器結構的分布式DBS1、分布式DBS的物理級客戶/服務器結構2、客戶機和服務器的功能劃分方法3、分布式DBS的邏輯級客戶/服務器體系結構9.4.2客戶/服務器結構的分布式DBS1、分布式DBS的物53第九章分布式數(shù)據(jù)庫系統(tǒng)第九章分布式數(shù)據(jù)庫系統(tǒng)54本章內容分布式數(shù)據(jù)庫系統(tǒng)概述分布式數(shù)據(jù)庫系統(tǒng)的體系結構分布式查詢處理客戶/服務器結構的分布式系統(tǒng)本章內容分布式數(shù)據(jù)庫系統(tǒng)概述559.1分布式數(shù)據(jù)庫系統(tǒng)概述9.1.1集中式系統(tǒng)和分布式系統(tǒng)集中式數(shù)據(jù)庫管理系統(tǒng)的缺點:通信開銷大;系統(tǒng)的堅固性差;性能差;可擴充性差;設計、管理困難。分散式系統(tǒng):將數(shù)據(jù)庫分成多個,建立在多臺計算機上,數(shù)據(jù)庫的管理、應用程序的研制都是分開并相互獨立的,之間不存在數(shù)據(jù)通行聯(lián)系。分布式數(shù)據(jù)庫系統(tǒng)的特點:數(shù)據(jù)的分布性;統(tǒng)一性;透明性。統(tǒng)一性(兩個方面:數(shù)據(jù)在邏輯上的統(tǒng)一性和數(shù)據(jù)在管理上的統(tǒng)一性)分布式數(shù)據(jù)庫與集中式數(shù)據(jù)庫相比的優(yōu)點:堅固性好;可擴充性好;可改善性能;自治性好。9.1分布式數(shù)據(jù)庫系統(tǒng)概述9.1.1集中式系統(tǒng)和分布式系569.1分布式數(shù)據(jù)庫系統(tǒng)概述與集中式數(shù)據(jù)庫相比,分布式DB具有:數(shù)據(jù)分布式的特點。與分散式數(shù)據(jù)庫相比,分布式DB具有:邏輯整體性的特點。9.1分布式數(shù)據(jù)庫系統(tǒng)概述與集中式數(shù)據(jù)庫相比,分布式DB具57背景數(shù)據(jù)庫系統(tǒng)+計算機網(wǎng)絡9.1.2分布式數(shù)據(jù)庫系統(tǒng)的定義DB1DB1DB1計算機1計算機2計算機3通訊網(wǎng)絡T1T2T3T1T2T3T1T2T3背景數(shù)據(jù)庫系統(tǒng)+計算機網(wǎng)絡9.1.2分布式589.1.2分布式數(shù)據(jù)庫系統(tǒng)的定義一個分布式系統(tǒng)由通信網(wǎng)絡聯(lián)接起來的結點的集合。每個結點都是擁有集中式數(shù)據(jù)庫的計算機系統(tǒng)。分布式數(shù)據(jù)庫的特點:數(shù)據(jù)庫中的數(shù)據(jù)不是存儲在同一場地,而是分布存儲在多個場地。9.1.2分布式數(shù)據(jù)庫系統(tǒng)的定義一個分布式系統(tǒng)由通信網(wǎng)絡聯(lián)599.1.2分布式數(shù)據(jù)庫系統(tǒng)的定義分布性:數(shù)據(jù)存儲在不同場地上。與集中式數(shù)據(jù)庫不同。邏輯整體性:數(shù)據(jù)邏輯上是相互聯(lián)系的一個整體。與分散在計算機網(wǎng)絡不同站點上的一組沒有相互聯(lián)系的本地數(shù)據(jù)庫區(qū)別開來。9.1.2分布式數(shù)據(jù)庫系統(tǒng)的定義分布性:數(shù)據(jù)存儲在不同場地609.1.2分布式數(shù)據(jù)庫系統(tǒng)的定義物理上是分布的,邏輯上是統(tǒng)一的一組數(shù)據(jù)庫的集合要素計算機網(wǎng)絡數(shù)據(jù)庫系統(tǒng)9.1.2分布式數(shù)據(jù)庫系統(tǒng)的定義物理上是分布的,邏輯上是統(tǒng)61DB1DB1DB1計算機1計算機1計算機1通訊網(wǎng)絡北京重慶上海銀行系統(tǒng)訪問本地銀行數(shù)據(jù):局部應用通兌業(yè)務、轉賬業(yè)務:全局應用DB1DB1DB1計算機1計算機1計算機1通訊網(wǎng)絡北京重慶上629.1.2分布式數(shù)據(jù)庫系統(tǒng)的定義全局應用:指涉及到兩個或兩個以上場地中數(shù)據(jù)庫的應用。網(wǎng)絡的每個站點具有獨立處理能力,可以執(zhí)行局部應用,同時也能通過網(wǎng)絡執(zhí)行全局應用。分布式數(shù)據(jù)庫是由一組數(shù)據(jù)庫組成,這些數(shù)據(jù)庫分布在計算機網(wǎng)絡的不同站點上,邏輯上是屬于同一個系統(tǒng)的。9.1.2分布式數(shù)據(jù)庫系統(tǒng)的定義全局應用:指涉及到兩個或兩639.1.2分布式數(shù)據(jù)庫系統(tǒng)的定義分布式數(shù)據(jù)庫包含兩個重要組成部分:分布式數(shù)據(jù)庫和分布式數(shù)據(jù)庫管理系統(tǒng)。分布式數(shù)據(jù)庫是計算機網(wǎng)絡環(huán)境中各場地上數(shù)據(jù)庫的邏輯集合。分布式數(shù)據(jù)庫管理系統(tǒng)是分布式數(shù)據(jù)庫系統(tǒng)中的一組軟件,它復雜管理分布環(huán)境下邏輯集成數(shù)據(jù)的存取、一致性、有效性和完備性。9.1.2分布式數(shù)據(jù)庫系統(tǒng)的定義分布式數(shù)據(jù)庫包含兩個重要組649.1.3分布式數(shù)據(jù)庫系統(tǒng)的透明性位置透明性 用戶或應用程序不必了解它所使用的數(shù)據(jù)的存儲位置。舉例:銀行的借貸業(yè)務:要判斷的情況有5種。復制透明性 有些數(shù)據(jù)并不存在一個場地,可能重復存放在不同的場地。本地數(shù)據(jù)庫中也包含了外地數(shù)據(jù)庫中的數(shù)據(jù)。
一個分布式系統(tǒng)有了這兩種透明性后,用戶看到的系統(tǒng)就如同一個集中式系統(tǒng)。9.1.3分布式數(shù)據(jù)庫系統(tǒng)的透明性位置透明性659.1.4分布式數(shù)據(jù)庫系統(tǒng)的優(yōu)缺點具有靈活的體系結構數(shù)據(jù)庫的使用單位組織上、地理上是分布的適應分布式管理和控制機構。經(jīng)濟性能優(yōu)越經(jīng)濟上和組織上的理由系統(tǒng)的可靠性高,可用性好。局部應用的響應速度快??蓴U展性好,易于集成現(xiàn)有系統(tǒng)。既有數(shù)據(jù)庫互連,歷史繼承;數(shù)據(jù)資源共享系統(tǒng)規(guī)模逐步擴展增加結點,不影響現(xiàn)有系統(tǒng)運行9.1.4分布式數(shù)據(jù)庫系統(tǒng)的優(yōu)缺點具有靈活的體系結構669.1.4分布式數(shù)據(jù)庫系統(tǒng)的優(yōu)缺點缺點:系統(tǒng)開銷大,主要花在通信部分。復雜的存取結構在集中式系統(tǒng)中是有效存取數(shù)據(jù)的重要基數(shù),但在分布式系統(tǒng)中不一定有效。數(shù)據(jù)的安全和行保密性較難處理。9.1.4分布式數(shù)據(jù)庫系統(tǒng)的優(yōu)缺點缺點:679.1.5分布式數(shù)據(jù)庫系統(tǒng)的分類同構同質數(shù)據(jù)庫每個場地都用同一類型的數(shù)據(jù)模型,并運行同一型號的DBMS同構異質數(shù)據(jù)庫每個場地都用同一類型的數(shù)據(jù)模型,但運行不同型號的DBMS異構數(shù)據(jù)庫場地上的數(shù)據(jù)庫系統(tǒng)不盡相同DBMS不同數(shù)據(jù)模型不同9.1.5分布式數(shù)據(jù)庫系統(tǒng)的分類同構同質數(shù)據(jù)庫68練習:1、與集中式DB相比,分布式DB具有()特點,與分散式DB相比,又具有()特點。2、區(qū)別系統(tǒng)是分散式還是分布式就是判定系統(tǒng)是否支持().3、在分布式DB中,用戶看到的系統(tǒng)如同一個集中式DBS,這是因為分布式系統(tǒng)具有()和()特點。4、如果各個場地都采用同類型數(shù)據(jù)模型,但DBMS不同型號,這種系統(tǒng)屬于()型DBMS.1、數(shù)據(jù)分布性,邏輯整體性2、全局應用3、位置透明性,復制透明性4、同構異質型DDBS.練習:1、與集中式DB相比,分布式DB具有()特點,與分散式699.2分布式數(shù)據(jù)庫系統(tǒng)的體系結構9.2.1分布式數(shù)據(jù)存儲(1)數(shù)據(jù)分配數(shù)據(jù)分配是指數(shù)據(jù)在計算機網(wǎng)絡各場地上的分配策略。集中式:所有數(shù)據(jù)均安排在同一個場地上。分割式:所有數(shù)據(jù)只有一份,分布被安置在若干個場地。全復制式:數(shù)據(jù)在每個場地重復存儲?;旌鲜剑簲?shù)據(jù)庫分成若干可相交的子集,每一子集安置在一個或多個場地上,但是每一場地未必保存全部數(shù)據(jù)。9.2分布式數(shù)據(jù)庫系統(tǒng)的體系結構9.2.1分布式數(shù)據(jù)存儲70分布式數(shù)據(jù)存儲(2)數(shù)據(jù)分片:分布式數(shù)據(jù)庫中的數(shù)據(jù)可以被分割和復制在物理場地的各個物理數(shù)據(jù)庫中。優(yōu)點將關系分片,有利于按用戶需求組織數(shù)據(jù)的分布。如產品→(內銷產品,出口產品)。分片方式水平分片垂直分片導出分片混合分片分布式數(shù)據(jù)存儲(2)數(shù)據(jù)分片:分布式數(shù)據(jù)庫中的數(shù)據(jù)可以被分割71分布式數(shù)據(jù)存儲分布式數(shù)據(jù)存儲72分布式數(shù)據(jù)存儲1)水平分片 將關系r按行分為若干子集r1,r2,…,rn,每個子集ri稱為一個水平片段。 一個水平片段可以看成是關系上的一個選擇。ri=P(i)(r) 如M_S=sex=‘M’(S) 關系的重構可以通過并運算來實現(xiàn)。r=r1∪r2∪…∪rn分布式數(shù)據(jù)存儲1)水平分片73分布式數(shù)據(jù)存儲(2)垂直分片 將關系r按列分為若干屬性子集r1,r2,…,rn,每個子集ri稱為一個垂直片段。 一個垂直片段可以看成是關系上的一個投影。ri=∏Ri(r) 其中Ri是r的一個屬性子集。 如P_S=∏SNO,SNAME(S) 關系的重構可以通過連接運算來實現(xiàn)。r=r1r2…rn
要求所有垂直分片的片段都包括關系的鍵。分布式數(shù)據(jù)存儲(2)垂直分片74分布式數(shù)據(jù)存儲(3)混合分片關系按某種方式分片后,得到的片段再按另一種方式繼續(xù)分片。如SC(S#,C#,G,DNO)按學生系別分片,再對每個片段按成績(及格,不及格)分片。分布式數(shù)據(jù)存儲(3)混合分片75分布式數(shù)據(jù)存儲定義各種分片時必須遵守下面三個條件:1)完備性條件:必須把全局關系的所有數(shù)據(jù)映射到各個片段中,絕不允許發(fā)生屬于全局關系的某個數(shù)據(jù)不屬于任何一個片段。2)重構條件:劃分所采用的方法必須確保能夠由各個分段重建全局關系。3)不相交條件:要求一個全局關系被劃分后得到的各個數(shù)據(jù)片段互相不重疊。目的是為了在數(shù)據(jù)分片時容易控制數(shù)據(jù)的復制。分布式數(shù)據(jù)存儲定義各種分片時必須遵守下面三個條件:769.2.2分布式數(shù)據(jù)庫系統(tǒng)的體系結構全局外模式 全局應用的用戶視圖。全局概念模式 定義D-DBS中數(shù)據(jù)的整體邏輯結構,數(shù)據(jù)如同沒有分布一樣。分片模式 每一個關系可以分為若干互不相交的部分,每一部分稱為一個片段。分配(分布)模式 定義片段的存放地點。9.2.2分布式數(shù)據(jù)庫系統(tǒng)的體系結構全局外模式77用戶視圖用戶視圖全局視圖分片視圖分配視圖局部概念視圖局部概念視圖局部內視圖局部內視圖局部DB局部DB分布式集中式分片視圖分片視圖分配視圖分配視圖局部概念視圖局部內視圖局部DB用戶視圖用戶視圖全局視圖分片視圖分配視圖局部概念視圖局部概念78舉例:RR1R2R3R4R11R21R12R22R23R33R43S1S2S3邏輯片段物理映像一個全局關系的片段所對應的存儲片段組成兩個物理映像可以相同。舉例:RR1R2R3R4R11R21R12R22R23R33799.2.3分布透明性分布(網(wǎng)絡)透明性分片透明性(全局視圖和分片視圖之間) 用戶或應用程序只對全局關系進行操作而不必考慮關系的分片。如果分片模式改變了,通過調整全局模式與分片模式之間的映象關系來保持全局模式不變。位置透明性(分片視圖和分配視圖之間)
用戶或應用程序不必了解片段的存儲位置。局部數(shù)據(jù)模型透明性(分配視圖和局部概念視圖之間)
用戶或應用程序不必了解局部場地上使用的是哪種數(shù)據(jù)模型。9.2.3分布透明性分布(網(wǎng)絡)透明性80RR1R2R3R4R11R21R12R22R23R33R43S1S2S3例子9.4RR1R2R3R4R11R21R12R22R23R33R43819.2.4分布式數(shù)據(jù)庫管理系統(tǒng)的功能及組成1、DDBMS的主要功能:接收用戶請求;訪問網(wǎng)絡數(shù)據(jù)字典;如果目標數(shù)據(jù)存儲于系統(tǒng)的多個計算機上,就必須進行分布式處理;通信接口功能;在一個異構型分布式處理環(huán)境中,還需要提供數(shù)據(jù)和進程移植的支持。2、DDBMS的組成:查詢處理子系統(tǒng)、完整性子系統(tǒng)、調度子系統(tǒng)和可靠性子系統(tǒng)。9.2.4分布式數(shù)據(jù)庫管理系統(tǒng)的功能及組成1、DDBMS的829.2.5分布式數(shù)據(jù)庫系統(tǒng)中存在的問題1、不同場地的通信速度,與局部DBS的存儲部件的存取速度相比,是非常慢的。2、通信系統(tǒng)有較高的存取延遲時間。3、在CPU上處理通信的代價很高。4、不同通信系統(tǒng)有不同意義的字符,數(shù)據(jù)轉換速度也不一樣,可以相差1000倍,存取延遲時間可能相差106倍。9.2.5分布式數(shù)據(jù)庫系統(tǒng)中存在的問題1、不同場地的通信速839.3分布式查詢處理分布式數(shù)據(jù)庫系統(tǒng)中由于數(shù)據(jù)分布在各個場地,因此,查詢的處理比集中式數(shù)據(jù)庫復雜。9.3分布式查詢處理分布式數(shù)據(jù)庫系統(tǒng)中由于數(shù)據(jù)分布在各個場849.3.1查詢處理的傳輸代價Site-1Site-2EMPLOYEE104個記錄每個記錄100字節(jié)DEPARTMENT100個記錄每個記錄100字節(jié)檢索每個職工的姓名、地址及工作部門名 selectENAME,ADDRESS,DNAME
fromEMPLOYEE,DEPARTMENT
whereDNO=DNUMBER網(wǎng)絡傳輸速度104字節(jié)/秒9.3.1查詢處理的傳輸代價Site-1Site-2EMP85分布式查詢處理⒈把關系EMPLOYEE和DEPARTMENT分布從場地1和場地2傳到場地3,然后在場地3站進行查詢 傳送時間T=(104100+10035
)/104=100s32 傳送時間T=總傳輸延遲+總數(shù)據(jù)量/傳輸速度1分布式查詢處理⒈把關系EMPLOYEE和DEPARTMENT86分布式查詢處理⒉把關系EMPLOYEE傳送到場地2,在場地2作聯(lián)接,再把操作結構從場地2傳到場地3: 傳送時間T=(104100+400000
)/104=140s132分布式查詢處理⒉把關系EMPLOYEE傳送到場地2,在場地287分布式查詢處理3.把關系DEPARTMENT傳送到場地1,在場地1作聯(lián)接,再把操作結構從場地1傳到場地3: 傳送時間T=(3500+400000
)/104=40s132分布式查詢處理3.把關系DEPARTMENT傳送到場地1,在88分布式查詢處理2)在場地3有一個查詢“檢索每個部門的名字和其經(jīng)理的姓名、地址”。selectDNAME,ENAME,ADDRESS
fromEMPLOYEE,DEPARTMENT
whereMGRENO=ENO分布式查詢處理2)在場地3有一個查詢“檢索每個部門的名字和其89分布式查詢處理⒈把關系EMPLOYEE和DEPARTMENT分布從場地1和場地2傳到場地3,然后在場地3站進行查詢 傳送時間T=(104100+3500
)/104=100s32 傳送時間T=總傳輸延遲+總數(shù)據(jù)量/傳輸速度1分布式查詢處理⒈把關系EMPLOYEE和DEPARTMENT90分布式查詢處理⒉把關系EMPLOYEE傳送到場地2,在場地2作聯(lián)接,再把操作結構從場地2傳到場地3: 傳送時間T=(104100+4000
)/104=100s132分布式查詢處理⒉把關系EMPLOYEE傳送到場地2,在場地291分布式查詢處理3.把關系DEPARTMENT傳送到場地1,在場地1作聯(lián)接,再把操作結構從場地1傳到場地3: 傳送時間T=(3500+4000
)/104=0.75s132分布式查詢處理3.把關系DEPARTMENT傳送到場地1,在92分布式查詢處理3)如果在場地2提出上述兩個查詢Q1和Q2,可以有兩種方法:4、把關系EMPLOYEE傳送到場地2,在場地2作聯(lián)接,此時Q1和Q2的傳輸量都是1000000,時間都是100秒。12Q1Q2分布式查詢處理3)如果在場地2提出上述兩個查詢Q1和Q2,可93分布式查詢處理5.把關系DEPARTMENT傳送到場地1,在場地1作聯(lián)接,再把結果從場地1傳到場地2,此時Q1的傳輸量為:3500+400000=403500,時間是40秒。Q2的傳輸量都是3500+4000=7500,時間是0.75秒。12分布式查詢處理5.把關系DEPARTMENT傳送到場地1,在949.3.2基于半聯(lián)接的查詢優(yōu)化策略數(shù)據(jù)在網(wǎng)絡中傳輸,如果都以整個關系傳輸,顯然是一種冗余。不參與聯(lián)接的值或無用的值不必在網(wǎng)絡中來回傳輸。(1)、基于半聯(lián)接的查詢實例:如果在場地2提出上述兩個查詢Q1和Q2,可以有兩種方法:把關系DEPARTMENT傳送到場地1,在場地1作聯(lián)接,再把結果從場地1傳到場地2??梢愿倪M:1)在場地2,用投影求得關系DEPARTMENT中參與聯(lián)接操作的屬性值,把投影結果傳輸?shù)綀龅?。Q1:數(shù)據(jù)傳輸量是400字節(jié)(DEPARTMENT在DNUMBER上的投影)。Q2:數(shù)據(jù)傳輸量是900字節(jié)(DEPARTMENT在MGRENO上的投影)。9.3.2基于半聯(lián)接的查詢優(yōu)化策略數(shù)據(jù)在網(wǎng)絡中傳輸,如果都以959.3.2基于半聯(lián)接的查詢優(yōu)化策略2)在場地1,執(zhí)行聯(lián)接操作,并用投影求出所需的屬性值,把結果送到場地2。Q
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025版信用證抵押貸款業(yè)務合作協(xié)議范本3篇
- 2025版土方工程居間代理服務合同范本下載33篇
- 2025年度股權分割與繼承處理協(xié)議
- 2025年度房地產合作終止協(xié)議書
- 2025年度旅游文化股權合作協(xié)議書
- 二零二五年度木工機械操作人員勞務租賃合同4篇
- 2025年度牧業(yè)產品品牌推廣與營銷合同4篇
- 二零二五年度火鍋餐飲品牌區(qū)域代理授權協(xié)議
- 二零二五年度餐飲店員工激勵機制與績效考核合同
- 二零二五版環(huán)保技術入股合作協(xié)議書3篇
- 并購指南(如何發(fā)現(xiàn)好公司)
- DL-T-1642-2016環(huán)形混凝土電桿用腳扣
- 平安產險陜西省地方財政生豬價格保險條款
- 銅礦成礦作用與地質環(huán)境分析
- 30題紀檢監(jiān)察位崗位常見面試問題含HR問題考察點及參考回答
- 詢價函模板(非常詳盡)
- 《AI營銷畫布:數(shù)字化營銷的落地與實戰(zhàn)》
- 麻醉藥品、精神藥品、放射性藥品、醫(yī)療用毒性藥品及藥品類易制毒化學品等特殊管理藥品的使用與管理規(guī)章制度
- 乘務培訓4有限時間水上迫降
- 2023年低年級寫話教學評語方法(五篇)
- DB22T 1655-2012結直腸外科術前腸道準備技術要求
評論
0/150
提交評論