




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第一章1、世界上第一個分布式數(shù)據(jù)庫系統(tǒng)SDD1是由美國計算機公司(CCA)于1976年至1979年在DEC10和DEC20計算機上實現(xiàn)。2、分布式數(shù)據(jù)庫系統(tǒng)是數(shù)據(jù)庫系統(tǒng)與計算機網(wǎng)絡(luò)相結(jié)合的產(chǎn)物3、12條規(guī)則既不是相互獨立的,也不是同等重要的,完全實現(xiàn)難度很大。4、實現(xiàn)和建立分布式數(shù)據(jù)庫系統(tǒng)絕對不是數(shù)據(jù)庫技術(shù)與網(wǎng)絡(luò)技術(shù)的簡單結(jié)合。分布式數(shù)據(jù)庫系統(tǒng)雖然基于集中式數(shù)據(jù)庫系統(tǒng),但卻有它自己的特色和理論基礎(chǔ)。5、一些商品化的數(shù)據(jù)庫系統(tǒng)產(chǎn)品,如Oracle,Ingres,Sybase,Informix,IBMDB2等6、關(guān)系技術(shù)是分布式技術(shù)的一個先決條件。7、分布式數(shù)據(jù)庫系統(tǒng)是物理上分散而邏輯上集中的數(shù)據(jù)
2、庫系統(tǒng)。分布式數(shù)據(jù)庫系統(tǒng)使用計算機網(wǎng)絡(luò)將地理位置分散而管理和控制又不需要不同程度集中的多個邏輯單位連接起來,共同組成一個統(tǒng)一的數(shù)據(jù)庫系統(tǒng)。因此,分布式數(shù)據(jù)庫系統(tǒng)可以看成是計算機網(wǎng)絡(luò)與數(shù)據(jù)庫系統(tǒng)的有機結(jié)合。8、在分布式數(shù)據(jù)庫系統(tǒng)中,被計算機網(wǎng)絡(luò)連接的每個邏輯單位是能夠獨立工作的計算機,這些計算機稱為站點也稱為結(jié)點。9、在分布式數(shù)據(jù)庫系統(tǒng)中,一個用戶或一個應(yīng)用如果只訪問他注冊的那個站點上的數(shù)據(jù)稱為本地(或局部)用戶或本地應(yīng)用;如果訪問涉及兩個或兩個以上的站點中的數(shù)據(jù),稱為全局用戶或全局應(yīng)用。10、一個分布式數(shù)據(jù)庫系統(tǒng)應(yīng)用應(yīng)該具有以下幾種特點:(1)物理分布性:分布式數(shù)據(jù)庫系統(tǒng)的數(shù)據(jù)具有物理分布性,
3、這是與集中式數(shù)據(jù)庫系統(tǒng)的最大差別之一(2)邏輯整體性:區(qū)別一個數(shù)據(jù)庫系統(tǒng)是分散式還是分布式,只需判斷該數(shù)據(jù)庫系統(tǒng)是否支持全局應(yīng)用(3)站點自治性:各站點上的數(shù)據(jù)由本地的DBMS管理,具有自治處理能力,完成本站點的應(yīng)用(局部應(yīng)用),這是分布式數(shù)據(jù)庫系統(tǒng)與多處理機系統(tǒng)的區(qū)別11、數(shù)據(jù)分布透明性是指用戶不必關(guān)心數(shù)據(jù)是如何被邏輯分片的,不必關(guān)心數(shù)據(jù)及其片段是否被復(fù)制及復(fù)制副本的個數(shù),也不必關(guān)心數(shù)據(jù)及其片段的物理位置分布的細(xì)節(jié),同時也不必關(guān)心局部場地上數(shù)據(jù)庫支持哪種數(shù)據(jù)模型12、增加數(shù)據(jù)冗余度方便了檢索,提高了系統(tǒng)的查詢速度、可用性和可靠性,但不利于數(shù)據(jù)的更新,這將增加系統(tǒng)維護(hù)的成本13、按局部數(shù)據(jù)庫管
4、理系統(tǒng)的數(shù)據(jù)模型分類(1)同構(gòu)型:同構(gòu)同質(zhì)型、同構(gòu)異質(zhì)型(2)異構(gòu)型14、按分布式數(shù)據(jù)庫系統(tǒng)的全局控制系統(tǒng)類型分類:全局控制集中型DDBS、全局控制分散型DDBS、全局控制可變型DDBS15、在集中式數(shù)據(jù)庫系統(tǒng)中,除了計算機本身的硬件和軟件外,主要成分有:數(shù)據(jù)庫DB、數(shù)控管理系統(tǒng)DBMS和數(shù)據(jù)庫管理員DBA。分布式數(shù)據(jù)庫系統(tǒng)在次基礎(chǔ)上做了擴充:數(shù)據(jù)庫分為局部DB和全局DB;數(shù)據(jù)庫管理系統(tǒng)分為局部DBMS和全局DBMS;數(shù)據(jù)庫管理員分為局部DBA和全局DBA15、分布式數(shù)據(jù)庫有兩部分組成:一部分是關(guān)于應(yīng)用所需要的數(shù)據(jù)的集合,稱為應(yīng)用數(shù)據(jù)庫,它是分布式數(shù)據(jù)庫的主體;另一部分是關(guān)于數(shù)據(jù)庫中數(shù)據(jù)結(jié)構(gòu)的
5、定義,以及全局?jǐn)?shù)據(jù)的分片、分布的描述,稱為數(shù)據(jù)字典、數(shù)據(jù)目錄或元數(shù)據(jù)16、局部數(shù)據(jù)目錄是指本站點中的局部數(shù)據(jù)字典,而全局?jǐn)?shù)據(jù)目錄就是全局?jǐn)?shù)據(jù)字典,又稱網(wǎng)路數(shù)據(jù),是提供全局?jǐn)?shù)據(jù)的描述和管理的相關(guān)信息,如數(shù)據(jù)的結(jié)構(gòu)定義,數(shù)據(jù)的分片、分布處理、授權(quán)、事務(wù)恢復(fù)等的必要信息17、數(shù)據(jù)分片有三種基本方法:水平分片、垂直分片、混合分片18、定義各類片段要遵守的規(guī)則:完備性條件、可重構(gòu)條件、不相交條件19、所謂數(shù)據(jù)分布是指分布式數(shù)據(jù)庫中的數(shù)據(jù)不是存儲在一個站點的計算機存儲設(shè)備上,而是根據(jù)需要將數(shù)據(jù)劃分成邏輯片段,按某種策略將這些片段分散地存儲在各個站點上20、數(shù)據(jù)分布的策略有:集中式、分割式、復(fù)制式、混合式2
6、1、集中式數(shù)據(jù)庫的模式結(jié)構(gòu):內(nèi)模式、模式、外模式22、分布式數(shù)據(jù)庫是多層模式結(jié)構(gòu):(1)全局外層:全局外模式(2)全局概念層:全局概念模式、分片模式、分配模式(3)局部概念層:局部概念模式(4)局部內(nèi)層:局部內(nèi)模式23、分布式數(shù)據(jù)庫管理系統(tǒng)的功能模塊:(1)查詢處理模塊|:查詢處理模塊至少由兩部分組成:查詢分析和優(yōu)化處理(2)完整性處理模塊:該模塊主要負(fù)責(zé)維護(hù)數(shù)據(jù)庫的完整性和一致性規(guī)則,處理多副本數(shù)據(jù)的同步更新等(3)調(diào)度處理模塊(4)可靠性處理模塊24、(分布式中)所謂數(shù)據(jù)分布獨立性是指用戶或用戶程序使用分布式數(shù)據(jù)庫如同使用集中式數(shù)據(jù)庫那樣,不必關(guān)心全局?jǐn)?shù)據(jù)的分布情況,包括全局?jǐn)?shù)據(jù)的邏輯分片
7、情況、邏輯片段的站點位置分配情況,以及各站點上數(shù)據(jù)庫的數(shù)據(jù)模型等。25、分布透明性有三層:分片透明性、位置透明性、局部數(shù)據(jù)模型透明性26、分片透明性是分布透明性的最高層。當(dāng)分布式數(shù)據(jù)庫具有分片透明性時,用戶編寫應(yīng)用程序只對全局關(guān)系進(jìn)行操作,不必考慮數(shù)據(jù)的邏輯分片,當(dāng)分片模式改變時,只要改變?nèi)指拍钅J降椒制J街g的映像,就不會影響用戶程序,從而實現(xiàn)了數(shù)據(jù)分片透明性。27、位置透明性也稱分配透明性是分布透明性的中間層。當(dāng)分布式數(shù)據(jù)庫具有位置透明時,用戶編寫應(yīng)用程序要了解全局?jǐn)?shù)據(jù)的數(shù)據(jù)分片情況,但不必了解各邏輯片段的復(fù)制副本情況,也不必關(guān)心各片段及其副本的站點位置分配情況。當(dāng)片段及其副本的存儲站
8、點改變時,只要改變從分片模式到分配模式之間的映像,就不會影響用戶程序,從而實現(xiàn)了數(shù)據(jù)片段的位置透明性28、局部數(shù)據(jù)模型透明性也稱局部映像透明性,即與各站點上數(shù)據(jù)庫的數(shù)據(jù)模型無關(guān),是分布透明性的最底層。29、如果一個分布式數(shù)據(jù)庫系統(tǒng)提供分片透明性,當(dāng)然它也提供分配透明性和局部數(shù)據(jù)模型透明性,所以也稱完全分布透明性,是分布透明性的最高級別如果一個分布式數(shù)據(jù)庫系統(tǒng)提供分配透明性,而沒有提供分片透明性,當(dāng)然它也提供局部數(shù)據(jù)模型透明性,所以也稱為中級分布透明性如果一個分布式數(shù)據(jù)庫系統(tǒng)只提供局部數(shù)據(jù)模型透明性,不提供分片透明性,也不提供分配透明性,稱為低級分布透明性如果一個分布式數(shù)據(jù)庫系統(tǒng),連局部數(shù)據(jù)模型
9、透明性也不提供,即將異構(gòu)數(shù)據(jù)模型轉(zhuǎn)換也交給用戶和用戶程序自己處理,稱為無分布透明性30、分布式數(shù)據(jù)庫系統(tǒng)的有點:良好的可靠性和可用性、提高系統(tǒng)效率,降低通信費用、較大的靈活性和可伸縮性、經(jīng)濟(jì)性和保護(hù)投資31、分布式數(shù)據(jù)庫系統(tǒng)中存在的技術(shù)問題:數(shù)據(jù)的分片、分布與冗余度;異構(gòu)數(shù)據(jù)庫的互聯(lián);分布式數(shù)據(jù)庫的查詢處理;分布式數(shù)據(jù)庫的更新處理第二章1、分布式數(shù)據(jù)庫系統(tǒng)的創(chuàng)建方法即分布式數(shù)據(jù)庫系統(tǒng)的實現(xiàn)方法,大致可分為兩種:組合法和重構(gòu)法。2、組合法也稱為集成法,這是一種自底向上的創(chuàng)建方法。3、創(chuàng)建分布式數(shù)據(jù)庫系統(tǒng)應(yīng)考慮:一方面要對網(wǎng)絡(luò)系統(tǒng)的功能進(jìn)行剖析,另一方面還需要對各個站點上原有的數(shù)據(jù)庫系統(tǒng)進(jìn)行剖析。
10、除此之外,還需解決數(shù)據(jù)的一致性、完整性以及可靠性。(此方法是建立在原有的系統(tǒng)里)4、重構(gòu)法是根據(jù)系統(tǒng)的實現(xiàn)環(huán)境和用戶需求,按照分布式數(shù)據(jù)庫系統(tǒng)的設(shè)計思想和方法,采用統(tǒng)一的觀點,從總體設(shè)計做起,包括各站點上的數(shù)據(jù)庫系統(tǒng),重新建立一個分布式數(shù)據(jù)庫。(此方法是建立在新建的系統(tǒng)里)5、重構(gòu)法的優(yōu)點在于,可以按照統(tǒng)一的思想來考慮分布式數(shù)據(jù)庫系統(tǒng)中的各種問題,有效地解決分布式數(shù)據(jù)庫系統(tǒng)的數(shù)據(jù)一致性、完整性和可靠性。6、(簡答題)分布式數(shù)據(jù)庫設(shè)計的目標(biāo)包括集中式數(shù)據(jù)庫設(shè)計中的目標(biāo),還要包括以下幾點:(1)分布式數(shù)據(jù)庫的本地性或進(jìn)地性。分布式數(shù)據(jù)庫系統(tǒng)中最重要的目標(biāo)是盡量減少對網(wǎng)絡(luò)的利用,即盡可能減少站點之間
11、的通信次數(shù)和通信量。所以,分布式數(shù)據(jù)庫設(shè)計中的一個主要原則是使數(shù)據(jù)和應(yīng)用實現(xiàn)最大程度的本地性。(2)控制數(shù)據(jù)庫的適當(dāng)冗余。這不僅使應(yīng)用具有高度的可用性和本地性,而且當(dāng)數(shù)據(jù)的任何一個副本不能使用時,可方便地使用在另一站點中的該數(shù)據(jù)的副本進(jìn)行恢復(fù),從而提高系統(tǒng)的可靠性。(3)工作負(fù)荷分布。分布式計算機系統(tǒng)的一個重要特征是把工作負(fù)荷分布在網(wǎng)絡(luò)中的各個站點上。(4)存儲的能和費用。數(shù)據(jù)庫的分布會受到各站點的存儲能力的影響。在網(wǎng)絡(luò)中可以有專門用于存儲數(shù)據(jù)的站點。數(shù)據(jù)存儲的費用與CPU,I/O及傳輸?shù)馁M用相比是不重要的,但是必須考慮各站點可用存儲空間的限制。(P43具體實現(xiàn),第三段)7、分布式數(shù)據(jù)庫系統(tǒng)的
12、創(chuàng)建方法有重構(gòu)法和組合法,相應(yīng)的分布式數(shù)據(jù)庫設(shè)計方法也有兩種方法,即自頂而下方法和自底而上方法。前一種方法是從頭開始設(shè)計分布式數(shù)據(jù)庫,而后一種方法則通過聚集現(xiàn)存的數(shù)據(jù)庫來設(shè)計分布式數(shù)據(jù)庫。8、設(shè)計集中式數(shù)據(jù)庫的一般方法包括四個階段:需求分析、概念設(shè)計、邏輯設(shè)計和物理設(shè)計。分布式數(shù)據(jù)庫設(shè)計出了上述階段外,還要增加一個新的階段,叫做分布設(shè)計,它位于邏輯設(shè)計與物理設(shè)計之間,以一個全局的、與站點無關(guān)的模式作為輸入,以產(chǎn)生分布式數(shù)據(jù)庫各站點的子模式(局部概念模式)作為結(jié)果輸出。9、分布式數(shù)據(jù)庫的分布設(shè)計要求確定數(shù)據(jù)的分片和片段的分配。分片是指把一個全局對象(實體或關(guān)系)細(xì)分成若干邏輯片段的過程;分配是指
13、把各片段映射到一個或多個站點的過程,片段是最適合的數(shù)據(jù)分配單位。10、在自頂向下的數(shù)據(jù)分布設(shè)計中,必須要解決的第一個問題是數(shù)據(jù)的分片設(shè)計。11、因此,如果同一個片段的任意兩個元素具有“相同的性質(zhì)(例如訪問頻率相同)”的話,那么數(shù)據(jù)分配時所用的任意一種豐富都將把這兩個元素放在一起,以這種方式得到的片段將是分布式數(shù)據(jù)庫中數(shù)據(jù)合適的分配和存儲單位。12、分片設(shè)計的基本目的是產(chǎn)生一個對全局?jǐn)?shù)據(jù)合適的劃分方案。13、P45數(shù)據(jù)分片的基本類型和方法(全看)14、數(shù)據(jù)分片方法兩種:水平分片與垂直分片。兩者交替可以產(chǎn)生混合分片。15、水平分片的方法可歸為初級分片和導(dǎo)出分片兩類。16、P45例2.1,2.2,2
14、.317、P48垂直分片(全看)18、在確定數(shù)據(jù)片段的位置分配時,應(yīng)根據(jù)應(yīng)用需求確定設(shè)計是非冗余分配還是冗余分配。在非冗余分配中,每個片段恰好映射到一個站點上;在冗余分配中,每個片段映射到一個或多個站點上。19、在非冗余分配的設(shè)計中,最簡單的方法是“最佳適應(yīng)”方法。20、冗余分配的設(shè)計可選用如下兩種方法的任意一種。1)“所有得益站點”法2)“附加復(fù)制”法21、P50數(shù)據(jù)片段分配的費用和得益估算22、DATAIDD是自頂向下設(shè)計分布式數(shù)據(jù)庫的一個典型方法。23、DATAID-D要求對其增加兩個階段:分布要求分析階段和分布設(shè)計階段。1)分布要求分析階段:需要這一階段是為了收集關(guān)于分布的信息,如水平
15、分片的劃分謂詞,每一應(yīng)用在各站點激活的頻率等。2)分布設(shè)計階段:這一階段始于全局?jǐn)?shù)據(jù)庫模式的規(guī)格說明和所收集的分要求,然后產(chǎn)生全局?jǐn)?shù)據(jù)的分片模式和片段的位置分配模式,分配模式描述了分配在各站點上的數(shù)據(jù)情況。24、建立三種類型的表作為分部要求分析階段的輸出:應(yīng)用的頻率表、實體的劃分表和數(shù)據(jù)與應(yīng)用的極化表。25、分布設(shè)計的目的是從全局?jǐn)?shù)據(jù)模式、邏輯訪問表和分布要求出發(fā),將數(shù)據(jù)分配在站點上。26、DATAID-D中的分布設(shè)計分成四個階段:1)分片設(shè)計,對實體進(jìn)行水平分片和垂直分片。2)非冗余分配,它的執(zhí)行是把各片段映射到使用最多的站點上。3)冗余分配,它的執(zhí)行是使用“貪婪”啟發(fā)式,可以采用上面已經(jīng)闡
16、述過的“所有得益站點法”或采用“附加復(fù)制法”。4)局部模式重新構(gòu)造,DATAID-D方法建議把聯(lián)系放置在具有最大基數(shù)性的實體或片段的站點上,使得必須傳送的實體標(biāo)識符及可能少。27、把現(xiàn)有的數(shù)據(jù)庫集成起來構(gòu)成分布式數(shù)據(jù)庫時,可采用自底向上的方法。這種方法重點是把現(xiàn)有的各種不同的數(shù)據(jù)庫模式集成為全局模式。所謂集成就是把公用數(shù)據(jù)定義合并起來,并解決對同一數(shù)據(jù)的不同表示方法之間的沖突。28、注意,自底向上的設(shè)計方法不宜于水平分片關(guān)系的設(shè)計。29、模式差異包括命名沖突、域差異、定標(biāo)差異和結(jié)構(gòu)差異。30、處理操作期間的不一致數(shù)據(jù)。1)存儲在不同站點的雇員實體的兩個示例碰巧有相同的標(biāo)示符,但薪水屬性值不同。
17、2)另一種可能性是,同一雇員在兩個站點有兩種不同的工作,并且薪水屬性正好涉及這兩種不同的工作。3)不一致的第三個原因可能是逐漸過時所致,這種情況也可以在模式級解決。把兩個薪水處理成異物同名(即老薪水和新薪水)。否則,有可能在查詢修改時指明應(yīng)使用最新值(在這種情況,薪水屬性必須蓋上時間戳)。4)不一致性的第四個原因是由于不符合邏輯錯誤的實際存在的不正確性。第三章1、分布式查詢優(yōu)化的目標(biāo):一種目標(biāo)是以總代價最小為標(biāo)準(zhǔn),除了如集中式數(shù)據(jù)庫系統(tǒng)一樣考慮CPU代價和I/O代價之外,總代價還包括通過網(wǎng)絡(luò)在站點之間傳輸數(shù)據(jù)或信息的代價。另一種目標(biāo)是以每個查詢的響應(yīng)時間最短為標(biāo)準(zhǔn)。2、在分布式查詢優(yōu)化中常常用
18、時使用這兩種標(biāo)準(zhǔn),根據(jù)系統(tǒng)應(yīng)用的不同,一種作為主要標(biāo)準(zhǔn),另一種作為輔助標(biāo)準(zhǔn)。3、分布式查詢優(yōu)化的準(zhǔn)則是使通信費用最低和響應(yīng)時間最短,即以最小的總代價,在最短的響應(yīng)時間內(nèi)獲得需要的數(shù)據(jù)。4、查詢代價分析(1)在遠(yuǎn)程通信網(wǎng)中,查詢的局部處理時間與通信所需時間相比,可以忽略不計,減少通信費用成為分布式查詢優(yōu)化的主要目標(biāo)(2)在高速局域網(wǎng)中,往往以響應(yīng)時間作為優(yōu)化目標(biāo)在某些情況下,查詢處理同時以減少通信費用與響應(yīng)時間作為優(yōu)化目標(biāo),這時在這兩者之間要作出權(quán)衡5、分布式查詢的分類:局部查詢、遠(yuǎn)程查詢、全局查詢6、局部查詢的一般策略:(1)選擇和投影運算應(yīng)盡可能先做,這是因為選擇和投影運算使中間結(jié)果數(shù)據(jù)大大
19、減少(2)在執(zhí)行連接前對數(shù)據(jù)庫數(shù)據(jù)進(jìn)行適當(dāng)?shù)念A(yù)處理(3)同時執(zhí)行一串投影和選擇操作,盡可能把它們與其前后的二元操作結(jié)合起來,以避免重復(fù)掃描關(guān)系和減少中間數(shù)據(jù)7、全局查詢(1)具體化。對查詢進(jìn)行分解,確定查詢使用的物理副本,落實查詢對象。冗余具體化的目標(biāo)是:通過冗余數(shù)據(jù)提高處理的并行性和減少通信費用(2)確定操作執(zhí)行的次序。主要是確定二元操作連接和并操作的次序,其他操作的次序是不難確定的。(3)確定操作執(zhí)行的方法。這包括把若干個操作連接起來在一次數(shù)據(jù)庫訪問中執(zhí)行,確定可用的訪問路徑,以及確定某種計算方法。(4)確定執(zhí)行站點。全局查詢執(zhí)行的站點不一定就是發(fā)出查詢的站點,全局查詢原則上可以在網(wǎng)絡(luò)上的
20、任意站點上執(zhí)行,然后將結(jié)果傳送到發(fā)出查詢的站點。8、分布式查詢處理的層次結(jié)構(gòu)(1)查詢分解。是將查詢問題轉(zhuǎn)換成一個定義在全局關(guān)系上的關(guān)系代數(shù)表達(dá)式(2)數(shù)據(jù)本地化。是把一個在全局關(guān)系上的查詢,進(jìn)行具體化落實到適合的片段上的查詢(3)全局優(yōu)化。即是找出分片查詢的最佳操作次序,包括使得代價函數(shù)最小。(4)局部優(yōu)化。由擁有與查詢有關(guān)的片段的各個站點執(zhí)行。在每一個站點上執(zhí)行的子查詢被稱為局部查詢。9、基于關(guān)系代數(shù)等價變換優(yōu)化算法的基本原理是:把查詢問題轉(zhuǎn)變?yōu)殛P(guān)系代數(shù)表達(dá)式,分析得到查詢樹,進(jìn)行從全局到片段的變換得到基于片段上的查詢樹,然后利用關(guān)系代數(shù)等價變換規(guī)則的優(yōu)化算法,盡可能先執(zhí)行選擇和投影操作。
21、這樣,一方面可以減少其后操作的操作量,另一方面可以減少操作次數(shù)。對查詢樹進(jìn)行優(yōu)化,從而達(dá)到查詢優(yōu)化的目的。10、究竟用直接連接(全連接)方案還是用半連接方案,取決于對數(shù)據(jù)傳輸和局部處理的相對費用。11、站點依賴算法的數(shù)據(jù)傳送量最小,連接數(shù)據(jù)量最小且能利用索引,因而能獲得最佳性能。其次是Hash劃分算法,最后是片段和復(fù)制算法。第四章1、(名詞解釋)所謂最小是指這個操作序列的全部操作都成功完成,才能使數(shù)據(jù)庫從一種一致狀態(tài)轉(zhuǎn)換到另一種一致狀態(tài)。在分布式數(shù)據(jù)庫系統(tǒng)中,任何一個應(yīng)用的請求最終都將轉(zhuǎn)化成對分布在網(wǎng)絡(luò)中相應(yīng)站點上的數(shù)據(jù)庫數(shù)據(jù)存取操作的序列,因此分布式數(shù)據(jù)庫系統(tǒng)中的事務(wù)是一個分布式操作的序列,
22、被操作的數(shù)據(jù)分布在不同的站點上,所以成為分布式事務(wù)。2、一般地,主事務(wù)負(fù)責(zé)事務(wù)的開始、提交和異常終止;各個子事務(wù)完成對相應(yīng)站點上數(shù)據(jù)庫的訪問操作。所謂“全局事務(wù)”是指一個要求訪問或更新多個站點上數(shù)據(jù)的事務(wù),所謂“局部事務(wù)”是指一個僅僅訪問或更新一個站點上數(shù)據(jù)的事務(wù)。3、分布式事務(wù)的特點:(ACID)1)原子性,引起數(shù)據(jù)庫改變的操作全部都成功執(zhí)行,要么都不執(zhí)行。2)一致性,分布式事務(wù)的一致性簡單地說是指事物的正確性,或者說一個分布式事務(wù)是一個使分布式數(shù)據(jù)庫從一個一致轉(zhuǎn)臺轉(zhuǎn)變?yōu)榱硪粋€一致狀態(tài)的正確性程序。3)隔離性,分布式事務(wù)的隔離性是指一個正在執(zhí)行的事務(wù)在其提交之前,決不允許把它們對共享數(shù)據(jù)所作
23、改變的結(jié)果提供給其他事務(wù)使用。4)持久性,分布式事務(wù)的持久性也稱為永久性,是指一旦某個事務(wù)被提交了,則無論系統(tǒng)發(fā)生任何故障,都不會丟失該事務(wù)的執(zhí)行結(jié)果。4、由于分布式數(shù)據(jù)庫的分布特性,使得分布式事務(wù)還具有自己獨有的特性:在分布式事務(wù)中,除需要考慮訪問數(shù)據(jù)庫的存取操作序列外,還必須考慮大量的數(shù)據(jù)傳送、通信原語和控制報文等,這些都是的分布式事務(wù)所特有的性質(zhì)。5、事務(wù)以begintransaction原語作為一個事務(wù)的開始,以commit原語作為一個事務(wù)成功完成的結(jié)束,而以rollback或abort原語作為事務(wù)失敗的結(jié)束。6、(名詞解釋)事務(wù)代理:在分布式數(shù)據(jù)庫系統(tǒng)中,為了完成在不同站點上的相應(yīng)功
24、能,分布式應(yīng)用必須在這些站點執(zhí)行若干進(jìn)程,這些進(jìn)程就稱為該應(yīng)用在那個站點上的“事務(wù)代理”。7、分布式事務(wù)管理的問題:(1)處理數(shù)據(jù)項的多個副本(2)單個站點的故障(3)通信網(wǎng)絡(luò)的故障(4)分布式提交8、事務(wù)管理的任務(wù)就是負(fù)責(zé)當(dāng)若干個事務(wù)并發(fā)執(zhí)行和事務(wù)執(zhí)行發(fā)生錯誤時,使數(shù)據(jù)庫仍保持一致狀態(tài)。9、事務(wù)管理所追求的理想目標(biāo)是高執(zhí)行政策、高并性和高可靠性,分布式事務(wù)管理也不例外,而且內(nèi)容更加豐富。這三大理想目標(biāo)往往不能兼得,因為它們之間密切相關(guān),而又矛盾。可靠性措施會使效率下降,而事務(wù)運行效率不僅取決于所采用的策略,還與下列因素有關(guān):(1)CPU和主存利用率(2)控制報文(不含任何應(yīng)用數(shù)據(jù)僅含控制性息
25、的報文)(3)響應(yīng)時間(4)可以性10、分布式事務(wù)管理的目標(biāo)是:1)維護(hù)分布式事務(wù)的原子性、一致性(可串行性)、耐久性和隔離性。2)獲得最小的主存和CPU開銷,降低控制報文的傳輸個數(shù)和加快分布式事務(wù)的影響速度。3)獲得最大限度的系統(tǒng)可靠性和可用性。11、(填空)在分布式數(shù)據(jù)庫系統(tǒng)中,事務(wù)管理功能分成兩個層次,集中式數(shù)據(jù)庫系統(tǒng)中的局部事務(wù)管理(LTM)進(jìn)行局部事務(wù)的管理,分布式事務(wù)管理器(DTM)共同協(xié)作,實現(xiàn)對分布式事務(wù)的協(xié)調(diào)和管理。12、(簡答題)LTM的結(jié)果和功能包括:1)保證本地事務(wù)的ACID特性。2)維護(hù)一個用于恢復(fù)的日志,代替DTM把用于分布式事務(wù)執(zhí)行和恢復(fù)的信息記入日志。3)參與適
26、當(dāng)?shù)牟l(fā)控制模式,以協(xié)調(diào)在該站點上執(zhí)行的事務(wù)的并發(fā)執(zhí)行。接受并聽從本站點上DTM代理發(fā)來的LOG原語,記入日志并執(zhí)行之。13、分布式事務(wù)管理DTM的功能主要包括:1)保證分布式事務(wù)ACID特性,尤其是執(zhí)行分布式事務(wù)的原子性,使每一站點的子事務(wù)都成功執(zhí)行,或都不執(zhí)行。這是通過向各站點發(fā)begintransaction,commit,abort,create原語來實現(xiàn)的。2)負(fù)責(zé)協(xié)調(diào)由該站點發(fā)出的所有分布式事務(wù)的執(zhí)行。包括:啟動分布式事務(wù)的執(zhí)行;將分布式事務(wù)分解為一些子事務(wù),并將這些子事務(wù)分派到恰當(dāng)?shù)恼军c上去執(zhí)行;決定分布式事務(wù)的終止,即決定在該分布式事務(wù)中所包含的所有站點上的子事務(wù)都撤銷或都提交
27、。3)支持分布式事務(wù)的執(zhí)行位置透明性,它實現(xiàn)了對網(wǎng)絡(luò)上個站點的個子事務(wù)的監(jiān)督與管理,完成對整個分布式事務(wù)執(zhí)行過程的調(diào)度和管理,從而保證分布式數(shù)據(jù)庫系統(tǒng)的高效率。14、控制分布式事務(wù)執(zhí)行的控制模型有:主從模型、三角模型和層次模型。15、P105主從控制模型、三角控制模型(是什么樣子的)、層次控制模型16、在集中式數(shù)據(jù)庫系統(tǒng)中,故障分為事務(wù)故障(計算溢出、完整性被破壞、操作員干預(yù)、輸入或輸出錯等)、系統(tǒng)故障(CPU出錯、死循環(huán)、緩沖區(qū)滿、系統(tǒng)崩潰等)和介質(zhì)故障(DB因介質(zhì)損壞無法訪問等)。17、通信故障可分為報文故障和網(wǎng)絡(luò)分割(網(wǎng)絡(luò)斷連)故障。而報文故障又可分為報文錯、報文失序、報文丟失和長時間的
28、延遲。對報文錯和報文失序現(xiàn)今網(wǎng)絡(luò)都可檢測和處理,所以通信故障主要是報文丟失、報文延遲和網(wǎng)絡(luò)分割。18、恢復(fù)的基本原理是數(shù)據(jù)冗余。19、(名詞解釋)事務(wù)恢復(fù):當(dāng)發(fā)生事務(wù)故障時,保證事務(wù)原子性的措施稱為事務(wù)故障恢復(fù),簡稱事務(wù)恢復(fù)。事務(wù)恢復(fù)主要是依靠日志來實現(xiàn)的。20、P109事務(wù)狀態(tài)轉(zhuǎn)移圖21、當(dāng)事務(wù)T所有的站點數(shù)據(jù)庫存取操作都已成功執(zhí)行,并且所有操作對數(shù)據(jù)庫的影響都已記錄在日志中時,該事務(wù)T就達(dá)到提交點(committedpoint)。22、需要注意的是,必須將日志文件保存在磁盤上。23、在事務(wù)達(dá)到提交點以前,還未寫到磁盤的日志的任何部分不,必須被寫入磁盤,這稱為事務(wù)提交前強制寫日志。24、日志
29、會被定期備份到歸檔存儲設(shè)備(例如磁盤)中,以預(yù)防磁盤盒災(zāi)難性故障。25、為了防止因介質(zhì)故障而破壞數(shù)據(jù)庫,要定期將整個數(shù)據(jù)庫的全部內(nèi)容轉(zhuǎn)儲到檔案庫中。26、為了便于恢復(fù),在日志中設(shè)定一種周期性(時間/容量)操作點,稱為檢查點,以標(biāo)識檢查點前已執(zhí)行完的事務(wù)是正確的。27、因此在寫檢查點時間是要講緩沖區(qū)中的所有內(nèi)容寫入到永久存儲設(shè)備中,而且采取“先寫日志”的原則。28、事務(wù)恢復(fù)主要是依靠日志來實現(xiàn)?;謴?fù)的原則是:(1)孤立和逐步退出事務(wù)的原則。(2)成功結(jié)束事務(wù)原則。(3)夭折事務(wù)的原則。29、P112本地事務(wù)的恢復(fù)30、兩階段提交協(xié)議把分布式事務(wù)的某一個代理指定為協(xié)調(diào)者,所有其他代理稱為參與者。只
30、有協(xié)調(diào)者才有掌握提交或撤銷事務(wù)的決定權(quán),而其他參與者各自負(fù)責(zé)在其本地數(shù)據(jù)庫中執(zhí)行寫操作,并向協(xié)調(diào)者提出撤銷或提交子事務(wù)的意向。2PC保證分布式事務(wù)提交的原子性,這是通過堅持在分布式事務(wù)的結(jié)果生效以前所有參與執(zhí)行分布式事務(wù)的站點都同意提交而做到這一點的。如果某個事務(wù)正在讀一項由另一個還未提交的事務(wù)更新的數(shù)據(jù)項的值時,相應(yīng)的調(diào)度程序就不會同意馬上提交該事務(wù);另一種參與者不同意提交的可能的原因是發(fā)生了死鎖,這要求某一個參與者撤銷事務(wù)。31、第一階段是表決階段,目的是形成一個共同的決定。第二階段是執(zhí)行階段,目的是實行這個決定。32、兩階段提交協(xié)議的通信結(jié)構(gòu) 因為通信只發(fā)生在協(xié)調(diào)者和參與者之間,參與者之
31、間不交換消息。(集中式2PC通信結(jié)構(gòu))在協(xié)調(diào)者和參與者之間的通信不用直接廣播的方法進(jìn)行,而是使報文在樹中上下傳播。(分層式2PC通信結(jié)構(gòu)) 實現(xiàn)兩階段提交協(xié)議時,在第一階段使用了向前通信方式,從協(xié)調(diào)者1到N;第二階段使用了向后通信方式,即從N到協(xié)調(diào)者。(線性2PC的通信結(jié)構(gòu)) 允許所有的參與者在第一階段相互通信,以便它們能獨立作出關(guān)于特定事務(wù)的終止決定。它不需要第二階段(分布式2PC的通信結(jié)構(gòu))33、多站點的數(shù)據(jù)更新的原則和方法在分布式數(shù)據(jù)庫中引入多站點的數(shù)據(jù)(冗余數(shù)據(jù))的目的是為了獲得高查詢速度。即以增加數(shù)據(jù)復(fù)制的代價來減少數(shù)據(jù)通信的代價,并增強系統(tǒng)的高可靠性和高可用性。由于數(shù)據(jù)復(fù)制在多個站
32、點上,一旦要對其中某個副本進(jìn)行更新時,就必須對這個數(shù)據(jù)庫的所以復(fù)制副本同時做同樣的更新。這即是多站點數(shù)據(jù)更新的原則,也是保證分布式數(shù)據(jù)庫一致性的要求。34、主文本更新法(1)基本思想:對每一個有多副本的數(shù)據(jù),指定其中一個副本為主文本,其他為輔文本。一般,不同的數(shù)據(jù)其主文本在不同的站點上,對一個數(shù)據(jù)的更新,只要對它的主文本進(jìn)行更新,就認(rèn)為完成了對該數(shù)據(jù)的更新。然后由擁有主文本的站點負(fù)責(zé)把對主文本所做的更新,及時發(fā)送給各個輔文本站點進(jìn)行更新。各個輔文本的更新可并行進(jìn)行。如有與主文本站點尚未連通的輔文本站點,在連通后按記錄的更新順序逐一進(jìn)行更新。(2)改進(jìn)方法:采用“移動主文本法”。若初次更新在某個
33、輔文本站點上進(jìn)行,然后再把更新引向該數(shù)據(jù)的站點。如果主站點此時尚未連通,則另選一個輔站點中的輔文本為該數(shù)據(jù)進(jìn)行更新,待原文本站點連通后,系統(tǒng)將自動把它改為輔文本,并按記錄要求執(zhí)行更新。若初次更新就在主文本上進(jìn)行,而主文本站點現(xiàn)在與網(wǎng)絡(luò)未連通,即做本地更新,則這次更新操作失敗,事務(wù)被撤銷。35、一致性約束可分為兩大類:一類是客觀世界本身存在的一定規(guī)則,即業(yè)務(wù)規(guī)則的一致性約束;另一類是分布式數(shù)據(jù)庫管理的需要。如為了提高系統(tǒng)效率和可靠性采用冗余數(shù)據(jù),即冗余數(shù)據(jù)的一致性約束。36、業(yè)務(wù)規(guī)則分為有效性約束和數(shù)據(jù)依賴約束。有效性約束的業(yè)務(wù)規(guī)則主要是域約束;數(shù)據(jù)依賴約束的業(yè)務(wù)規(guī)則則是指實體完整性約束和引用完整性約束37、在分布式數(shù)據(jù)庫中
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 山東滕州市八年級政治上冊 第1單元 讓愛駐我家 第2課 我們共有一個家教學(xué)實錄與檢測 魯教版
- 達(dá)州市通川區(qū)楊家溝煤業(yè)有限公司楊家溝煤礦礦山地質(zhì)環(huán)境保護(hù)與土地復(fù)墾方案情況
- 四川化工職業(yè)技術(shù)學(xué)院
- 肝膿腫護(hù)理相關(guān)知識
- 【人教PEP版英語四年級下冊】期中測試卷6
- 人教版小學(xué)四年級語文下冊2024-2025學(xué)年度第二學(xué)期第一單元質(zhì)量檢測試卷含參考答案
- 人教版小學(xué)四年級語文下冊2024-2025學(xué)年度第二學(xué)期第八單元質(zhì)量檢測試卷
- 第5單元 第14課 新年賀卡-綜合制作-教學(xué)設(shè)計2023-2024學(xué)年清華大學(xué)版(2012)初中信息技術(shù)八年級上冊001
- 網(wǎng)絡(luò)安全運維專家簡歷
- 安徽省部分地市2024-2025學(xué)年高三下學(xué)期2月聯(lián)合考試物理試題(解析版)
- 公司清潔生產(chǎn)的審核報告書
- 貨運車輛交通安全講座教案
- 2024露天煤礦智能化建設(shè)與管理規(guī)范
- 中國成人患者腸外腸內(nèi)營養(yǎng)臨床應(yīng)用指南(2023版)
- 高速公路機械施工方案設(shè)計
- 學(xué)校桌椅采購?fù)稑?biāo)方案(技術(shù)方案)
- 乳腺結(jié)節(jié)健康宣教
- GA/T 2012-2023竊照專用器材鑒定技術(shù)規(guī)范
- 內(nèi)部控制及內(nèi)部審計
- 學(xué)前比較教育全套教學(xué)課件
- 電工電子技術(shù)完整全套教學(xué)課件
評論
0/150
提交評論