版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
分布式數(shù)據(jù)庫總結(jié)1600字
分布式數(shù)據(jù)庫介紹自學(xué)、整理、備忘它和集中式操作系統(tǒng)的區(qū)別在于資源管理、進(jìn)程通信和系統(tǒng)結(jié)構(gòu)等方面。分布式程序設(shè)計語言用于編寫運(yùn)行于分布式計算機(jī)系統(tǒng)上的分布式程序。一個分布式程序由若干個可以獨(dú)立執(zhí)行的程序模塊組成,它們分布于一個分布式處理系統(tǒng)的多臺計算機(jī)上被同時執(zhí)行。它與集中式的程序設(shè)計語言相比有三個特點(diǎn):分布性、通信性和穩(wěn)健性。分布式文件系統(tǒng)具有執(zhí)行遠(yuǎn)程文件存取的能力,并以透明方式對分布在網(wǎng)絡(luò)上的文件進(jìn)行管理和存取。分布式數(shù)據(jù)庫系統(tǒng)由分布于多個計算機(jī)結(jié)點(diǎn)上的若干個數(shù)據(jù)庫系統(tǒng)組成,它提供有效的存取手段來操縱這些結(jié)點(diǎn)上的子數(shù)據(jù)庫。分布式數(shù)據(jù)庫在使用上可視為一個完整的數(shù)據(jù)庫,而實(shí)際上它是分布在地理分散的各個結(jié)點(diǎn)上。當(dāng)然,分布在各個結(jié)點(diǎn)上的子數(shù)據(jù)庫在邏輯上是相關(guān)的。主要特點(diǎn):????多數(shù)處理就地完成各地的計算機(jī)由數(shù)據(jù)通信網(wǎng)絡(luò)相聯(lián)系克服了中心數(shù)據(jù)庫的弱點(diǎn):降低了數(shù)據(jù)傳輸代價提高了系統(tǒng)的可靠性,局部系統(tǒng)發(fā)生故障,其他部分還可繼續(xù)工作?各個數(shù)據(jù)庫的位置是透明的,方便系統(tǒng)的擴(kuò)充?為了協(xié)調(diào)整個系統(tǒng)的事務(wù)活動,事務(wù)管理的性能花費(fèi)高體系結(jié)構(gòu):分布式數(shù)據(jù)庫系統(tǒng)抽象為4層的結(jié)構(gòu)模式,4層模式劃分為全局外層、全局概念層、局部概念層和局部內(nèi)層,在各層間還有相應(yīng)的層間映射。這種4層模式適用于同構(gòu)型分布式數(shù)據(jù)庫系統(tǒng),也適用于異構(gòu)型分布式數(shù)據(jù)庫系統(tǒng)數(shù)據(jù)分片類型:1)水平分片:按一定的條件把全局關(guān)系的所有元組劃分成若干不相交的子集,每個子集為關(guān)系的一個片段。(2)垂直分片:把一個全局關(guān)系的屬性集分成若干子集,并在這些子集上作投影運(yùn)算,每個投影稱為垂直分片。(3)導(dǎo)出分片:又稱為導(dǎo)出水平分片,即水平分片的條件不是本關(guān)系屬性的條件,而是其他關(guān)系屬性的條件。(4)混合分片:以上三種方法的混合??梢韵人椒制俅怪狈制?,或先垂直分片再水平分片,或其他形式,但他們的結(jié)果是不相同的。條件:(1)完備性條件:必須把全局關(guān)系的所有數(shù)據(jù)映射到片段中,決不允許有屬于全局關(guān)系的數(shù)據(jù)卻不屬于它的任何一個片段。(2)可重構(gòu)條件:必須保證能夠由同一個全局關(guān)系的各個片段來重建該全局關(guān)系。對于水平分片可用并操作重構(gòu)全局關(guān)系;對于垂直分片可用聯(lián)接操作重構(gòu)全局關(guān)系。(3)不相交條件:要求一個全局關(guān)系被分割后所得的各個數(shù)據(jù)片段互不重疊(對垂直分片的主鍵除外)。數(shù)據(jù)分配方式:(1)集中式:所有數(shù)據(jù)片段都安排在同一個場地上。(2)分割式:所有數(shù)據(jù)只有一份,它被分割成若干邏輯片段,每個邏輯片段被指派在一個特定的場地上。(3)全復(fù)制式:數(shù)據(jù)在每個場地重復(fù)存儲。也就是每個場地上都有一個完整的數(shù)據(jù)副本。(4)混合式:這是一種介乎于分割式和全復(fù)制式之間的分配方式。目前分布式數(shù)據(jù)庫分配的設(shè)計,越來越多的采用尋找最優(yōu)解的算法,比如遺傳算法、退火機(jī)制等查詢優(yōu)化:指在執(zhí)行分布式查詢時選擇查詢執(zhí)行計劃的方法和關(guān)系運(yùn)算符的實(shí)現(xiàn)算法。根據(jù)系統(tǒng)環(huán)境的不同,查詢優(yōu)化所使用的算法也有所不同,通常分為遠(yuǎn)程廣域網(wǎng)環(huán)境和高速局域網(wǎng)環(huán)境,其區(qū)別主要在網(wǎng)絡(luò)的帶寬。對于一元運(yùn)算符可以采用集中式數(shù)據(jù)庫中的查詢優(yōu)化方法。而對于二元運(yùn)算符,由于涉及場地間的數(shù)據(jù)傳輸,因此必須考慮通信代價。分布式查詢中常見的連接運(yùn)算執(zhí)行策略包括:(1)半連接方法:利用半連接運(yùn)算的轉(zhuǎn)換方法R∞S=(RµS)∞S。假設(shè)場地1和場地2上分別有關(guān)系R和關(guān)系S,首先在S上執(zhí)行連接屬性上的投影并將結(jié)果傳輸至場地1,在場地1上執(zhí)行關(guān)系R與投影的連接操作,再將結(jié)果傳輸至場地2與關(guān)系S執(zhí)行連接操作。這種方法能夠降低執(zhí)行連接運(yùn)算時的網(wǎng)絡(luò)通信代價,主要適用于帶寬較低的遠(yuǎn)程廣域網(wǎng)絡(luò)。(2)枚舉法方法:指枚舉關(guān)系運(yùn)算符的物理執(zhí)行計劃,通過對比執(zhí)行計劃的代價選擇執(zhí)行算法的方法。其中,連接運(yùn)算符的物理執(zhí)行計劃包括嵌套循環(huán)方法、哈希連接法和歸并連接法。枚舉法主要適用于以磁盤IO代價為主的高速局域網(wǎng)環(huán)境。------------------完--------------------------
第二篇:分布式數(shù)據(jù)庫總結(jié)6700字分布式數(shù)據(jù)庫系統(tǒng)及其應(yīng)用復(fù)習(xí)大綱第一章分布式數(shù)據(jù)庫系統(tǒng)概述1、理解分布式數(shù)據(jù)庫系統(tǒng)的特點(diǎn)分布式數(shù)據(jù)庫系統(tǒng)的定義:分布式數(shù)據(jù)庫系統(tǒng),通俗地說,是物理上分散而邏輯上集中的數(shù)據(jù)庫系統(tǒng)。分布式數(shù)據(jù)庫系統(tǒng)使用計算機(jī)網(wǎng)絡(luò)將地理位置分散而管理和控制又需要不同程度集中的多個邏輯單位(通常是集中是數(shù)據(jù)庫系統(tǒng))連接起來,共同組成一個統(tǒng)一的數(shù)據(jù)庫系統(tǒng)。分布式數(shù)據(jù)庫系統(tǒng)的特點(diǎn):1物理分布性:數(shù)據(jù)不是存放在一個站點(diǎn)上2邏輯整體性:是與分散式數(shù)據(jù)庫系統(tǒng)的區(qū)別3站點(diǎn)自治性:是與多處理機(jī)系統(tǒng)的區(qū)別4數(shù)據(jù)分布透明性5集中與自治相結(jié)合的控制機(jī)制6存在適當(dāng)?shù)臄?shù)據(jù)冗余度7事務(wù)管理的分布性2、能夠按照不同標(biāo)準(zhǔn)描述分布式數(shù)據(jù)庫系統(tǒng)的分類按局部數(shù)據(jù)庫管理系統(tǒng)的數(shù)據(jù)模型分類:同構(gòu)性(homogeneous)(分為同構(gòu)同質(zhì)型和同構(gòu)異質(zhì)型)DDBS和異構(gòu)性(heterogeneous)DDBS按分布式數(shù)據(jù)庫系統(tǒng)的全局控制系統(tǒng)類型分類:全局控制集中型DDBS,全局控制分散型DDBS,全局控制可變型DDBS。3、理解分布式數(shù)據(jù)庫中數(shù)據(jù)的獨(dú)立性和分布透明性所謂數(shù)據(jù)獨(dú)立性是指用戶或用戶程序使用分布式數(shù)據(jù)庫如同使用集中式數(shù)據(jù)庫那樣,不必關(guān)心全局?jǐn)?shù)據(jù)的分布情況,包括全局?jǐn)?shù)據(jù)的邏輯分片情況、邏輯片段站點(diǎn)位置的分配情況,以及各站點(diǎn)上數(shù)據(jù)庫的數(shù)據(jù)模型等。也就是說,全局?jǐn)?shù)據(jù)的邏輯分片、片段的物理位置分配,各站點(diǎn)數(shù)據(jù)庫的數(shù)據(jù)模型等情況對用戶和用戶程序透明。所以,在分布式數(shù)據(jù)庫中分布獨(dú)立性也稱為分布透明性。分布透明性包括三個層次:分片透明性(完全分布透明性):映像2位置透明性(中級分布透明性):映像3局部數(shù)據(jù)模型透明性(低級分布透明性):映像4無分布透明性:異構(gòu)數(shù)據(jù)第二章分布式數(shù)據(jù)庫系統(tǒng)設(shè)計1、理解分布式數(shù)據(jù)庫的設(shè)計目標(biāo)分布式數(shù)據(jù)庫設(shè)計的目標(biāo)1分布式數(shù)據(jù)庫的本地性或近地性2控制數(shù)據(jù)的適當(dāng)冗余3工作負(fù)荷分布4存儲的能力和費(fèi)用2、理解水平分片的定義、分類和應(yīng)用水平分片是對全局關(guān)系執(zhí)行“選擇操作”,把具有相同性質(zhì)的元組進(jìn)行分組,構(gòu)成若干個不相交的子集。水平分片的方法可歸為初級分片和導(dǎo)出分片兩類。初級分片:以關(guān)系自身的屬性性質(zhì)為基礎(chǔ),執(zhí)行“選擇”操作,將關(guān)系分為若干個不相交的片段。例子2.1S(S#,SNAME,AGE,SEX)DefinefragmentS1asselect*fromwheresex=’M’DefinefragmentS2asselect*fromwheresex=’F’導(dǎo)出分片:全局關(guān)系的導(dǎo)出分片不是以其自身的屬性性質(zhì)為基礎(chǔ),而是從另一個關(guān)系的屬性性質(zhì)或水平片段推導(dǎo)出來的。采用導(dǎo)出分片可片可使片段與片段之間的“連接”變得更容易。例2.3設(shè)全局關(guān)系SC(S#,C#,GRADE),S(S#,SNAME,AGE,SEX)若要將SC劃分為男生的各門課成績和女生的各門課成績,這就不可能從SC本身的屬性性質(zhì)來執(zhí)行選擇,必須從關(guān)系S的屬性性質(zhì)或水平片段來導(dǎo)出。DefinefragmentSC1asselectSC.S#,C#,GRADEfromSC,SwhereSC.S#=S.S#andSEX=’M’DefinefragmentSC2asselectSC.S#,C#,GRADEfromSC,SwhereSC.S#=S.S#andSEX=’F’如果S已經(jīng)進(jìn)行水平分片,分為SF和SM,分別為男生全體和女生全體,則上述的片段定義可以基于片段SF和SM導(dǎo)出:DefinefragmentSC1asselect*fromSCwhereS#in(selectSF.S#fromSF)DefinefragmentSC2asselect*fromSCwhereS#in(selectSM.S#fromSM)3、理解垂直分片的定義和應(yīng)用一個全局關(guān)系的垂直分片是通過“投影”操作把它的屬性分為若干組。確定一個全局關(guān)系R的垂直分片需要根據(jù)應(yīng)用以“同樣方式”(例如具有相同的使用頻率)訪問的屬性來進(jìn)行分組。例2.4全局關(guān)系EMP(E#,NAME,SAL,TEL,MAGNUM,DEPT),主碼為E#。主要應(yīng)用有:集中在站點(diǎn)3上的管理性應(yīng)用要求查詢雇員的:NAME,SAL,TEL;和從其他站點(diǎn)發(fā)出的應(yīng)用要求查詢雇員的:NAME,DEPT,MAGNUM。解:如果使用垂直分片:EMP1(E#,NAME,SAL,TEL)和EMP2(E#,MAGNUM,DEPT)則NAME屬性只屬于一個片段,對于上述的應(yīng)用,必須進(jìn)行連接操作和非本地訪問。如果使用垂直群集:EMP1(E#,NAME,SAL,TEL)和EMP2(E#,NAME,MAGNUM,DEPT)則對于上述應(yīng)用,不需要執(zhí)行連接操作,且可實(shí)現(xiàn)較好的本地性。4、能夠描述分片的基本原則完備性原則:要把所有的數(shù)據(jù)映射到各個片斷中可重構(gòu)原則:關(guān)系分片后的各個片斷可重構(gòu)整個關(guān)系不相交原則:關(guān)系分片后的各個片斷不能重疊5、掌握數(shù)據(jù)片斷分配的分類和常用方法分配的簡化模型有:讀代價、寫代價、存儲代價和目標(biāo)函數(shù)。常用方法:非冗余分配設(shè)計方法(包含最佳適應(yīng)法和其他方法)和冗余分配的設(shè)計方法(包含所有得益站點(diǎn)法和附加復(fù)制法)6、掌握最佳適應(yīng)法和所有得益站點(diǎn)法的基本特點(diǎn)最佳適應(yīng)法是對每一種分配方式進(jìn)行估算,然后選擇最佳的站點(diǎn)。這種方法不考慮把一個片段與一個相關(guān)片段放在同一站點(diǎn)的“相互”影響。特點(diǎn):將片斷Ri分配到訪問Ri次數(shù)最多的那個站點(diǎn)上Bij=∑kFkj*Nki所有得益站點(diǎn)法:首先確定非復(fù)制為題的解,然后在全部站點(diǎn)中確定一組站點(diǎn),給這組站點(diǎn)中的每一個站點(diǎn)分配片斷的一個副本,這樣做所得到的好處要比為此而付出的費(fèi)用合算。特點(diǎn):將片斷Ri的副本分配到所有得益站點(diǎn)j上Bij=∑kFkj*Rki-c*∑k∑j’≠jFkj*Uki如果Bij>0,則站點(diǎn)j是得益站點(diǎn),放置Ri的一個副本7、能夠描述DATAID-D方法設(shè)計分布式數(shù)據(jù)庫的各個階段需求分析,概念設(shè)計,分布要求分析,全局邏輯設(shè)計,分布設(shè)計,局部邏輯設(shè)計,局部物理設(shè)計。邏輯設(shè)計分為全局邏輯設(shè)計和局部邏輯設(shè)計8、能夠根據(jù)給出的條件對關(guān)系進(jìn)行具體分片,給出正確的限定關(guān)系上邊的例子。第三章分布式數(shù)據(jù)庫系統(tǒng)中的查詢處理和優(yōu)化1、掌握分布式數(shù)據(jù)庫查詢的分類局部查詢、遠(yuǎn)程查詢和全局查詢2、理解關(guān)系代數(shù)運(yùn)算的交換率?∪1(∪2(R))=∪2(∪1(R))條件:∪1∪2是選擇操作時總成立,∪1∪2是投影操作時要求其屬性集合相等∪1與∪2是投影和選擇操作時:πA1,?An(σF(R))=σF(πA1,?An(R))的條件是F中的屬性是A1,?.An的子集。R∞S=S∞RR×S=S×RR∪S=S∪RR∩S=S∩RR∝S≠?S∝RR-S≠?S-R3、掌握直接連接優(yōu)化算法的分類利用站點(diǎn)依賴信息的算法,分片與復(fù)制算法,站點(diǎn)依賴和數(shù)據(jù)復(fù)制結(jié)合算法,Hash劃分算法4、掌握半連接運(yùn)算見P83-84例子5、掌握半連接和直接連接查詢優(yōu)化算法的區(qū)別取決于數(shù)據(jù)傳輸和局部處理的相對費(fèi)用;如果傳輸費(fèi)用是主要的,采用半連接;如果本地費(fèi)用是主要的,采用直接連接,6、理解Hash劃分算法的特點(diǎn)1數(shù)據(jù)傳送量是R;2索引方面,比片段復(fù)制算法更低,3每個站點(diǎn)的連接數(shù)據(jù)量同站點(diǎn)依賴7、能夠描述基于半連接算法查詢優(yōu)化的基本原理和步驟基本原理是在傳到另一個站點(diǎn)做連接前,消除與連接無關(guān)的數(shù)據(jù),減少做連接操作的數(shù)據(jù)量,從而減小傳輸代價步驟:1計算每種半連接方案的代價,并從中選擇一種最佳方案2選擇傳輸代價最小的站點(diǎn),計算采用全連接的方案的代價3比較兩種方案,確定最優(yōu)方案8、能夠描述基于關(guān)系代數(shù)等價變換的查詢優(yōu)化算法原理、算法實(shí)現(xiàn)步驟原理:1查詢問題——〉關(guān)系代數(shù)表達(dá)式2分析得到查詢樹3進(jìn)行全局到片段的變換得到基于片段的查詢樹4利用關(guān)系代數(shù)等價變換規(guī)則的優(yōu)化算法,盡可能先執(zhí)行選擇和投影操作算法:1連接和合并盡可能上提(樹根方向)2選擇和投影操作盡可能下移(葉子方向)實(shí)現(xiàn)步驟:轉(zhuǎn)換一:1查詢問題——〉關(guān)系代數(shù)表達(dá)式。2轉(zhuǎn)換二:關(guān)系代數(shù)表達(dá)式——〉查詢樹。3轉(zhuǎn)換三:全局查詢樹分拆成片段查詢樹。4優(yōu)化:利用關(guān)系代數(shù)等價變換規(guī)則的優(yōu)化算法,優(yōu)化查詢樹,進(jìn)而優(yōu)化查詢9、能夠根據(jù)提供的條件完成分片和復(fù)制算法應(yīng)用,通過計算判斷哪個關(guān)系保持分片最優(yōu)P88例3-6考試第四章分布式數(shù)據(jù)庫中的事務(wù)管理和恢復(fù)1、掌握事務(wù)的四大特性原子性(Atomicity),一致性(Consistency),持久性(Durability).隔離性(Isolation)2、能夠描述兩階段提交協(xié)議的工作流程兩階段提交協(xié)議的基本思想是:將本地原子性提交行為的效果擴(kuò)展到分布式事務(wù),保證了分布式事務(wù)提交的原子性,并在不損壞Log的情況下,實(shí)現(xiàn)快速故障恢復(fù),提高DDB系統(tǒng)的可靠性.2PC把事務(wù)的提交過程分為兩個階段:第一階段:表決階段,目的是形成一個共同的決定首先,協(xié)調(diào)者給所有參與者發(fā)送“準(zhǔn)備”消息,進(jìn)入等待狀態(tài)其次,參與者收到“準(zhǔn)備”消息后,檢查是否能夠提交本地事務(wù)如能,給協(xié)調(diào)者發(fā)送“建議提交”消息,進(jìn)入就緒狀態(tài)如不能,給協(xié)調(diào)者發(fā)送“建議撤銷”消息,可以單方面撤銷第三,協(xié)調(diào)者收到所有參與者的消息后,他就做出是否提交事務(wù)的決定,只要有一個參與者投了反對票,就決定撤銷整個事務(wù),發(fā)送“全局撤銷”消息給所有參與者,進(jìn)入撤銷狀態(tài)否則,就決定提交整個事務(wù),發(fā)送“全局提交”消息給所有參與者,進(jìn)入提交狀態(tài)第二個階段:執(zhí)行階段,實(shí)現(xiàn)表決階段的決定,提交或者撤銷3、掌握事務(wù)故障的分類分布是數(shù)據(jù)庫的故障分布是數(shù)據(jù)庫的故障分為站點(diǎn)故障和通信故障。站點(diǎn)故障包括事務(wù)故障、系統(tǒng)故障和介質(zhì)故障。事務(wù)故障包括計算溢出。完整性被破壞、操作員干預(yù)、輸入或輸出出錯等。通信故障分為報文故障和網(wǎng)絡(luò)分割故障。4、掌握分布式數(shù)據(jù)庫事務(wù)執(zhí)行的控制模型的分類分為三類:主從模型,三角模型,層次控制模型5、理解日志文件的特點(diǎn)日志文件保存到磁盤上。日志Log:記錄所有對DB的操作事務(wù)標(biāo)識:每個事務(wù)給定一個具有惟一性的標(biāo)識符Log記錄項:[start_transaction,T][write_item,T,x,舊值,新值][read_item,T,x][commit,T][abort,T]寫動作:寫Log比寫數(shù)據(jù)優(yōu)先Log存儲:一般存在盤上,還會定期備份到磁帶上6、理解分布式數(shù)據(jù)庫數(shù)據(jù)更新常見方法多站點(diǎn)數(shù)據(jù)更新、主文本更新法、快照方法7、理解故障恢復(fù)時檢查點(diǎn)知識檢查點(diǎn)(Checkpoint):設(shè)置一個周期性(時間/容量)操作點(diǎn)a)LogBuffer內(nèi)容寫入Log數(shù)據(jù)集b)寫檢查點(diǎn)Log信息:當(dāng)前活動事務(wù)表,每個事務(wù)最近一次Log記錄在Log文件中的位置c)DBBuffer內(nèi)容寫入DBd)將本次檢查點(diǎn)Log項在Log文件中的地址記入“重啟動文件”8、能夠描述兩階段提交協(xié)議的特點(diǎn):2PC協(xié)議的重要特點(diǎn):1允許參與者單方面撤銷事務(wù)2一旦參與者確定了提交或撤銷協(xié)議,它就不能再更改它的提議3當(dāng)參與者處于就緒狀態(tài)時,根據(jù)協(xié)調(diào)者發(fā)出的消息種類,它可以轉(zhuǎn)換為提交狀態(tài)或者撤銷狀態(tài)4協(xié)調(diào)者根據(jù)全局提交規(guī)則做出全局終止決定5協(xié)調(diào)者和參與者可能進(jìn)入互相等待對方消息的狀態(tài),使用定時器,保證退出消息等待狀態(tài)第五章分布式數(shù)據(jù)庫中的并發(fā)控制1、理解封鎖的基本準(zhǔn)則1事務(wù)T在執(zhí)行任何read_item(x)操作之前,必須先執(zhí)行read_lock(x)或者write_lock(x)操作2事務(wù)T在執(zhí)行任何write_item(x)操作之前,必須先執(zhí)行write_lock(x)操作3如果事務(wù)T執(zhí)行read_lock(x)操作,數(shù)據(jù)項x必須沒有加鎖或者已經(jīng)加了讀鎖,否則事務(wù)T的這個操作不能進(jìn)行4如果事務(wù)T執(zhí)行write_lock(x)操作,數(shù)據(jù)項x必須沒有加鎖,否則事務(wù)T的這個操作不能進(jìn)行5事務(wù)T在完成所有read_item(x)和write_item(x)操作之后,必須執(zhí)行unlock(x)操作6如果事務(wù)T已經(jīng)持有數(shù)據(jù)項x上的一個讀鎖或者一個寫鎖,那么它不能再執(zhí)行read_lock(x)操作7如果事務(wù)T已經(jīng)持有數(shù)據(jù)項x上的一個讀鎖或者一個寫鎖,那么它不能再執(zhí)行write_lock(x)操作8如果事務(wù)T沒有持有數(shù)據(jù)項x上的一個讀鎖或者一個寫鎖,那么它不能執(zhí)行unlock(x)操作2、理解基于時標(biāo)的并發(fā)控制方法并發(fā)控制方法包含全局時標(biāo)和局部時標(biāo)3、掌握死鎖檢測的方法分類局部死鎖:僅在一個站點(diǎn)上發(fā)生的死鎖全局死鎖:涉及多個站點(diǎn)的死鎖(即等待圈由多個站點(diǎn)組成)4、理解一致性調(diào)度和可串行化調(diào)度的特點(diǎn)一致性調(diào)度:調(diào)度可以使得數(shù)據(jù)庫從一個一致性狀態(tài)轉(zhuǎn)變?yōu)榱硪粋€一致性狀態(tài),則稱調(diào)度為一致性調(diào)度可串行化調(diào)度:如果一個調(diào)度等價于某個串行調(diào)度,則該調(diào)度稱為可串行化調(diào)度。也就是說,該調(diào)度可以通過一系列非沖突動作的交換操作使其成為串行調(diào)度5、能夠描述死鎖發(fā)生的四個必要條件:會考試互斥條件:事務(wù)請求對資源的獨(dú)占控制等待條件:事務(wù)已持有分配給它的資源,又去申請并等待別的資源非搶占條件:直到資源被持有它的事務(wù)釋放前,不可能將資源強(qiáng)制從持有它的事務(wù)奪去循環(huán)等待條件:存在事務(wù)互相等待的等待圈6、能夠列舉并發(fā)控制算法悲觀并發(fā)控制法和樂觀并發(fā)控制法悲觀并發(fā)控制法有基于封鎖的算法、基于時標(biāo)排序的算法和混合算法。樂觀的方法也可分為基于封鎖或基于時標(biāo)排序的算法。第六章分布式數(shù)據(jù)庫中的可靠性1、理解可靠性和可用性的含義與關(guān)系可靠性:指數(shù)據(jù)庫在一給定時間間隔內(nèi)不產(chǎn)生任何失敗的概率。它強(qiáng)調(diào)數(shù)據(jù)庫的正確性,要求數(shù)據(jù)庫正確運(yùn)行。通常用來描述不可修復(fù)的系統(tǒng)??捎眯裕簭?qiáng)調(diào)的是當(dāng)需要訪問數(shù)據(jù)庫時,它是可用的。指在給定的時間點(diǎn)系統(tǒng)可以正常運(yùn)行的概率。通常用于描述那些可以修復(fù)的系統(tǒng)。兩者關(guān)系:通常認(rèn)為構(gòu)建可用性的系統(tǒng)比可靠性的系統(tǒng)容易。兩者是統(tǒng)一的,可靠性高的系統(tǒng)可用性自然是好的。兩者又是矛盾的,增加錯誤風(fēng)險的情況下,可提高可用性;采用太謹(jǐn)慎的策略會降低可用性2、理解兩階段提交協(xié)議如何轉(zhuǎn)為三階段提交協(xié)議2PC中的狀態(tài):C(提交)狀態(tài)是可提交狀態(tài),其它為不可提交狀態(tài)。Ready狀態(tài)是不可提交狀態(tài)。Wait狀態(tài)是不可提交狀態(tài)。它們都侵犯了非阻斷協(xié)議的充要條件,從而考慮改變2PC,使其滿足非阻斷協(xié)議條件。在Wait和Commit之間,或者在Ready和Commit之間加入另一種狀態(tài)作為緩沖狀態(tài),從而有了3PC協(xié)議3、掌握分布式可靠性協(xié)議的組成。簡答可靠性協(xié)議組成:包括提交、終結(jié)、恢復(fù)協(xié)議。提交和恢復(fù)協(xié)議詳細(xì)說明提交命令和恢復(fù)命令是如何執(zhí)行的。終結(jié)協(xié)議是分布式系統(tǒng)特有的協(xié)議。在執(zhí)行一個分布式事務(wù)時,若一個Site故障,希望其它Site也停止該事務(wù)。處理這種情況的技術(shù)就稱為終止協(xié)議。4、理解發(fā)生網(wǎng)絡(luò)分割時冗余分布式數(shù)據(jù)庫和非冗余數(shù)據(jù)庫采用的處理協(xié)議非冗余數(shù)據(jù)庫:任何需要訪問存儲在另一網(wǎng)絡(luò)區(qū)域里的數(shù)據(jù)項的新事務(wù)都被阻斷,等待網(wǎng)絡(luò)修復(fù)。位于同一區(qū)域里的數(shù)據(jù)項的并發(fā)訪問由并發(fā)控制算法處理。網(wǎng)絡(luò)分割時由提交協(xié)議處理冗余數(shù)據(jù)庫:分割時,副本可能位于不同的區(qū)域。由復(fù)制協(xié)議處理5、能夠描述三階段提交協(xié)議中事務(wù)協(xié)調(diào)者和參與者的狀態(tài)轉(zhuǎn)換P188頁圖6.4考試6、能夠采用版本號法進(jìn)行不一致性檢測,并且應(yīng)用于實(shí)際。大題需要首先發(fā)現(xiàn)哪些數(shù)據(jù)部分已經(jīng)不一致(不一致性檢測)然后根據(jù)發(fā)生的情況,給這些部分賦予一個最合理的值(不一致性的解法)檢測方法:采用版本號P200頁例子第七章分布式數(shù)據(jù)庫的安全性與目錄管理1、理解分布式數(shù)據(jù)庫的動態(tài)授權(quán)語句的形式1用戶對自己生成的關(guān)系擁有全權(quán),通過授權(quán)和收權(quán)語句完成對數(shù)據(jù)開放,保密的存取權(quán)授予(Grant,Revoke)。授權(quán)語句授權(quán)語句:Grant<權(quán)>To<用戶>WithGrantOption2訪問表(AT)法2、理解數(shù)據(jù)庫的安全性含義數(shù)據(jù)庫安全性包括兩個方面的內(nèi)容:數(shù)據(jù)庫數(shù)據(jù)的保密性和安全性。
第三篇:數(shù)據(jù)庫總結(jié)5900字?jǐn)?shù)據(jù)庫老師畫的重點(diǎn)數(shù)據(jù)庫:數(shù)據(jù)庫是長期存儲在計算機(jī)內(nèi)、有組織、可共享的大數(shù)據(jù)集合。數(shù)據(jù)庫操縱功能:查詢select、插入insert、刪除delete、修改update數(shù)據(jù)庫系統(tǒng)的特點(diǎn):1數(shù)據(jù)結(jié)構(gòu)化2數(shù)據(jù)的共享高,冗余度低,易擴(kuò)充3數(shù)據(jù)獨(dú)立性高4數(shù)據(jù)由DBMS統(tǒng)一管理和控制數(shù)據(jù)模型的組成要素:數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)操作、完整性約束概念模型:要出大體,畫圖信息世界中的基本概念————1、實(shí)體:客觀存在并可以相互區(qū)別的事物稱為實(shí)體2、屬性:實(shí)體所具有的某一特性3、碼(key):唯一標(biāo)識實(shí)體的屬性集稱為碼4、域(domain):域是一組具有相同數(shù)據(jù)類型的集合5、實(shí)體型(entitytype):具有相同屬性的實(shí)體必然具有共同的特征和性質(zhì)。用實(shí)體名及屬性名集合來抽象和刻畫同類實(shí)體,稱為實(shí)體型。6、實(shí)體集(entityset):同一類型的實(shí)體的集合7、聯(lián)系:在現(xiàn)實(shí)世界中,事物內(nèi)部以及事物之間是有聯(lián)系的,這些聯(lián)系在信息世界中反應(yīng)為實(shí)體(型)內(nèi)部的聯(lián)系和實(shí)體(型)之間的聯(lián)系。實(shí)體內(nèi)部的聯(lián)系通常是指組成實(shí)體的各屬性之間的聯(lián)系;實(shí)體之間的聯(lián)系通常是指不同實(shí)體集之間的聯(lián)系最常用的數(shù)據(jù)模型:1、層次模型(HierarchicalModel)2、網(wǎng)狀模型(NetworkModel)3、關(guān)系模型(RelationalModel)4、面向?qū)ο竽P停∣bjectOrientedModel)5、對象關(guān)系模型(ObjectRelationalModel)其中層次模型和網(wǎng)狀模型統(tǒng)稱為格式化模型數(shù)據(jù)庫系統(tǒng)的三級模式結(jié)構(gòu):1、模式(scheme):模式也稱邏輯模式,是數(shù)據(jù)庫中全體數(shù)據(jù)的邏輯結(jié)構(gòu)和特征的描述,是所有用戶的公共數(shù)據(jù)視圖。他是數(shù)據(jù)庫系統(tǒng)模式結(jié)構(gòu)的中間層,既不設(shè)計涉及數(shù)據(jù)的物理存儲細(xì)節(jié)和硬件環(huán)境,也與具體的應(yīng)用程序、所使用的應(yīng)用開發(fā)工具及高級程序設(shè)計語言無關(guān)。2、外模式(externalschema):外模式也稱為子模式(subschema)或用戶模式,他是數(shù)據(jù)庫用戶(包括應(yīng)用程序員和最終用戶)能看見和使用的局部數(shù)據(jù)的邏輯結(jié)構(gòu)和特征的描述,是數(shù)據(jù)庫用戶的數(shù)據(jù)視圖,是與某一應(yīng)用有關(guān)的數(shù)據(jù)的邏輯表示。3、內(nèi)模式(internalscheme):內(nèi)模式也稱存儲模式(storageschema),一個數(shù)據(jù)庫只有一個內(nèi)模式。他是數(shù)據(jù)庫物理結(jié)構(gòu)和存儲方式的描述,是數(shù)據(jù)在數(shù)據(jù)庫內(nèi)部的表達(dá)方式。數(shù)據(jù)庫的二級映像功能與數(shù)據(jù)庫獨(dú)立性————為了能夠在系統(tǒng)內(nèi)部實(shí)現(xiàn)這3個抽象層次的聯(lián)系和轉(zhuǎn)換,數(shù)據(jù)庫管理系統(tǒng)在這三個模式之間提供了兩層映像:·外模式/模式映像·模式/內(nèi)模式映像正是這兩層映像保證了數(shù)據(jù)庫系統(tǒng)中的數(shù)據(jù)能夠具有較高的邏輯獨(dú)立性和物理獨(dú)立性關(guān)系(relation):D1*D2*D3··*Dn的子集叫做在域D1、D2、D3···Dn上的關(guān)系,表示為R(D1、D2、D3···Dn)這里的的R表示關(guān)系的名字,n是關(guān)系的目或度(degree)關(guān)系中每個元素是關(guān)系中的元組,通常用t表示當(dāng)n=1時,稱關(guān)系為單元關(guān)系(unaryrelation),或一元關(guān)系當(dāng)n=2時,稱該關(guān)系為二元關(guān)系(binaryrelation)關(guān)系是笛卡爾積的有限子集,所以關(guān)系也是一個二維表,表的每行對應(yīng)一個元組,表的每列對應(yīng)一個域。由于域可以相同,為了加以區(qū)分,必須對每列起一個名字,稱為屬性(attribute)。n目關(guān)系必有n個屬性。若關(guān)系中的某一屬性組的值能夠唯一的標(biāo)識一個元組,則稱該屬性組為候選碼(candidatekey)若一個關(guān)系有多個候選碼,則選定其中一個為主碼(primarykey)候選碼的諸屬性稱為主屬性(primeattribute)。不包含在任何候選碼中的屬性稱為非主屬性(non-primeattribute)或非碼屬性(non-keyattribute)P46沒有搞明白干嘛使得?。。。。。。。。。。。。。。。。。。。?!關(guān)系的三類完整性約束:實(shí)體完整性、參照完整性、用戶定義的完整性實(shí)體完整性和參照完整性被稱作關(guān)系的兩個不變性1、實(shí)體完整性(entityintegrity):主碼中的屬性即主屬性不能取空值2、參照完整性(referentialintegrity):若屬性(或?qū)傩越M)F是基本關(guān)系R的外碼,它與基本關(guān)系S的的主碼K相對應(yīng)(基本關(guān)系R和S不一定是不同的關(guān)系),則對于R中每個元組在F上的值必須為:·或者取空值(F的每個屬性值均為空值)·或者等于S中某個元組的主碼值SQL(StructuredQueryLanguage),即結(jié)構(gòu)化查詢語言,是關(guān)系數(shù)據(jù)庫的標(biāo)準(zhǔn)語言。SQL的特點(diǎn):1、綜合統(tǒng)一2、高度非過程化3、面向集合的操作方式4、以同一種語法結(jié)構(gòu)提供多種使用方式5、語言簡潔、易學(xué)易用SQL的動詞:數(shù)據(jù)查詢:select數(shù)據(jù)定義:create、drop、alter(房間)修改表數(shù)據(jù)操縱:insert、update(家具)修改數(shù)據(jù)、delete數(shù)據(jù)控制:grant、revoke繪制ER圖————在ER圖中有如下四個成分:矩形框:表示實(shí)體,在框中記入實(shí)體名。菱形框:表示聯(lián)系,在框中記入聯(lián)系名。橢圓形框:表示實(shí)體或聯(lián)系的屬性,將屬性名記入框中。對于主屬性名,則在其名稱下劃一下劃線。連線:實(shí)體與屬性之間;實(shí)體與聯(lián)系之間;聯(lián)系與屬性之間用直線相連,并在直線上標(biāo)注聯(lián)系的類型。(對于一對一聯(lián)系,要在兩個實(shí)體連線方向各寫1;對于一對多聯(lián)系,要在一的一方寫1,多的一方寫N;對于多對多關(guān)系,則要在兩個實(shí)體連線方向各寫N,M?;颈硎潜旧愍?dú)立存在的表,在SQL中一個關(guān)系就對應(yīng)一個基本表。一個(或多個)基本表對應(yīng)一個存儲文件,一個表可以帶若干索引,索引也可以放在存儲文件中。存儲文件的邏輯結(jié)構(gòu)組成了關(guān)系數(shù)據(jù)庫的內(nèi)模式。存儲文件的物理結(jié)構(gòu)是任意的,對用戶是透明的。視圖是從一個或幾個基本表導(dǎo)出的表。它本身不獨(dú)立存儲在數(shù)據(jù)庫中,即數(shù)據(jù)庫中只存放視圖的定義而不存放視圖對應(yīng)的數(shù)據(jù)。這些數(shù)據(jù)仍存放在導(dǎo)出視圖的基本表中,因此視圖是一個虛表。視圖在概念上與基本表等同,用戶可以在視圖上再定義視圖?;颈淼亩x、刪除與修改:1、定義基本表:createtable***()2、定義主鍵:Primarykey==notnull(中間不用連接符號)unique3、定義外碼的語句:foreignkey(某個字段)references某表(某字段)4、定義主碼語句:primarykey(***,***)5、修改基本表:altertable某表名add列名<數(shù)據(jù)類型>[完整性約束]drop<完整性約束名>(字段名)altercolumn<列名><數(shù)據(jù)類型>6、刪除表:droptable表名[restrict|cascade級聯(lián)刪除]7、建立索引:create[unique][clustered]index索引名on表名(列名[asc|desc],······)·clustered表示是聚簇索引·unique表明此索引的每一個索引值只對應(yīng)唯一的數(shù)據(jù)記錄·用戶可以在最經(jīng)常查詢的列上建立聚簇索引以提高查詢效率·在一個基本表上只能建立一個聚簇索引·建立局促索引后,更新該索引列上的數(shù)據(jù)時,往往導(dǎo)致表中記錄的物理順序的額變更,代價較大,因此對于經(jīng)常更新的列不宜建立聚簇索引8、刪除索引:dropindex<索引名>上機(jī)的時候不太一樣:dropindex表名。索引名字9、數(shù)據(jù)的查詢:select[all|distinct]<目標(biāo)列表達(dá)式>,······from表名或者視圖名,···where條件表達(dá)式groupby列名1[having條件表達(dá)式]orderby列名2[asc|desc]·如果有g(shù)roupby子句,則結(jié)果按“列名1”的值進(jìn)行分組,該屬性列值相等的元組為一個組。通常會在每組中作用聚集函數(shù)。如果groupby子句帶having短語,則只有滿足指定條件的組才予以輸出?!と绻衞rderby子句,則結(jié)果表按“列名2”的值的升序或降序排序·selectSnameName,‘YearofBirth:’Birth,20xx-SageBirthday,lower(Sdept)DepartmentfromStudentlower表示小寫常用的查詢條件————比較:大于、等于、小于、不等于(<>/!=)、大于/小于等于、不小于、不大于、not+上述比較運(yùn)算符確定范圍:betweenand,notbetweenand確定集合:in,notin字符匹配:like,notlike空值:isnull,isnotnull多重條件(邏輯運(yùn)算):and,or,not例子————·selectSname,SagefromStudentwhereSdept(not)in(‘cs’,‘ma’,‘is’)字符匹配:[not]like‘字符串’[escape‘換嗎字符’]百分號表示任意長度、下劃線表示任意單個字符聚集函數(shù)————count([distinct|all]*)統(tǒng)計元組個數(shù)count([distinct|all]列名)統(tǒng)計一列中值的個數(shù)sum([distinct|all]列名)計算一列值的總和(此列必須是數(shù)值型)avg([distinct|all]列名)計算一列的平局值(此列必須是數(shù)值型)max([distinct|all]列名)求一列中的最大值min·如果指定distinct短語,則表示在計算時要取消指定列中的重復(fù)值。如果不指定distinct短語或者指定all短語(all為缺省值),則表示不取消重復(fù)?!ぷ⒁庠诰奂瘮?shù)遇到空值時,除count(*)外,都跳過空值而只處理非空值?!ぷ⒁鈝here子句中不能用聚集函數(shù)作為條件表達(dá)式groupby子句————where子句與having短語的區(qū)別在于作用對象不同。Where子句作用對象作用于基本表或試圖,從中選擇條件的元組。Having短語作用于組,從中選擇滿足條件的組。例子:selectSnofromSCgroupbySnohavingcount(*)>3查詢了選修3門以上課程的學(xué)生學(xué)號鏈接查詢——————例子:非自然鏈接·selectStudent.*,SC.*fromStudent,SCWhereStudent.Sno=SC.Sno自然鏈接·selectStudent.Sno,Sname,Ssex,Sage,Sdept,Cno,GradefromStudent,SCwhereStudent.Sno=SC.Sno自身鏈接·selectFIRST.Cno,SECOND.CpnofromCourseFIRST,CourseSECONDwhereFIRST.Cpno=SECOND.Cpno外連接·selectStudent.Sno,Sname,Sage,Sdept,Cno,GradefromStudentleftouterjoinSConStudent.Sno=SC.Sno·左外鏈接列出左邊關(guān)系中所有的元組,右外連接列出右邊關(guān)系中的所有元組嵌套查詢·selectSnamefromStudentwhereSnoin(selectSnofromSCwhereCno=‘2’)·找出每個學(xué)生超過他選修課程平均成績的課程號SelectSno,CnoFromSCxWhereGrade>=(selectavg(Grade)FromSCyWherey.Sno=x.Sno)授權(quán)————Grant權(quán)限,·····On對象類型對象名,·····To用戶,·····[withgrantoption]只一句表示權(quán)限的傳遞例子:·GrantallprivilegesOnStudent,CourseToU1,U2·grantupdate(Sno),selectonStudenttou4·revokeupdate(Sno)ontableStudentfromu4一個滿足BCNF的關(guān)系模式有:·所有非主屬性對每一個碼都是完全函數(shù)依賴3NF編輯3NF,即第三范式是要求一個數(shù)據(jù)庫表中不包含已在其它表中已包含的非主關(guān)鍵字信息。例如,存在一個部門信息表,其中每個部門有部門編號(dept_id)、部門名稱、部門簡介等信息。那么在員工信息表中列出部門編號后就不能再將部門名稱、部門簡介等與部門有關(guān)的信息再加入員工信息表中。如果不存在部門信息表,則根據(jù)第三范式(3NF)也應(yīng)該構(gòu)建它,否則就會有大量的數(shù)據(jù)冗余。簡而言之,第三范式就是屬性不依賴于其它非主屬性。滿足第三范式(3NF)必須先滿足第二范式(2NF)2NF(第二范式)第二范式(2NF)是在第一范式(1NF)的基礎(chǔ)上建立起來的,即滿足第二范式(2NF)必須先滿足第一范式(1NF)。第二范式(2NF)要求數(shù)據(jù)庫表中的每個實(shí)例或行必須可以被唯一地區(qū)分。為實(shí)現(xiàn)區(qū)分通常需要為表加上一個列,以存儲各個實(shí)例的唯一標(biāo)識。如圖3-2員工信息表中加上了員工編號(emp_id)列,因為每個員工的員工編號是唯一的,因此每個員工可以被唯一區(qū)分。這個惟一屬性列被稱為主關(guān)鍵字或主鍵、主碼。+分布式數(shù)據(jù)庫總結(jié)發(fā)表于:2023.1.1來自:字?jǐn)?shù):1735手機(jī)看范文分布式數(shù)據(jù)庫介紹自學(xué)、整理、備忘它和集中式操作系統(tǒng)的區(qū)別在于資源管理、進(jìn)程通信和系統(tǒng)結(jié)構(gòu)等方面。分布式程序設(shè)計語言用于編寫運(yùn)行于分布式計算機(jī)系統(tǒng)上的分布式程序。一個分布式程序由若干個可以獨(dú)立執(zhí)行的程序模塊組成,它們分布于一個分布式處理系統(tǒng)的多臺計算機(jī)上被同時執(zhí)行。它與集中式的程序設(shè)計語言相比有三個特點(diǎn):分布性、通信性和穩(wěn)健性。分布式文件系統(tǒng)具有執(zhí)行遠(yuǎn)程文件存取的能力,并以透明方式對分布在網(wǎng)絡(luò)上的文件進(jìn)行管理和存取。分布式數(shù)據(jù)庫系統(tǒng)由分布于多個計算機(jī)結(jié)點(diǎn)上的若干個數(shù)據(jù)庫系統(tǒng)組成,它提供有效的存取手段來操縱這些結(jié)點(diǎn)上的子數(shù)據(jù)庫。分布式數(shù)據(jù)庫在使用上可視為一個完整的數(shù)據(jù)庫,而實(shí)際上它是分布在地理分散的各個結(jié)點(diǎn)上。當(dāng)然,分布在各個結(jié)點(diǎn)上的子數(shù)據(jù)庫在邏輯上是相關(guān)的。主要特點(diǎn):????多數(shù)處理就地完成各地的計算機(jī)由數(shù)據(jù)通信網(wǎng)絡(luò)相聯(lián)系克服了中心數(shù)據(jù)庫的弱點(diǎn):降低了數(shù)據(jù)傳輸代價提高了系統(tǒng)的可靠性,局部系統(tǒng)發(fā)生故障,其他部分還可繼續(xù)工作?各個數(shù)據(jù)庫的位置是透明的,方便系統(tǒng)的擴(kuò)充?為了協(xié)調(diào)整個系統(tǒng)的事務(wù)活動,事務(wù)管理的性能花費(fèi)高體系結(jié)構(gòu):分布式數(shù)據(jù)庫系統(tǒng)抽象為4層的結(jié)構(gòu)模式,4層模式劃分為全局外層、全局概念層、局部概念層和局部內(nèi)層,在各層間還有相應(yīng)的層間映射。這種4層模式適用于同構(gòu)型分布式數(shù)據(jù)庫系統(tǒng),也適用于異構(gòu)型分布式數(shù)據(jù)庫系統(tǒng)數(shù)據(jù)分片類型:1)水平分片:按一定的條件把全局關(guān)系的所有元組劃分成若干不相交的子集,每個子集為關(guān)系的一個片段。(2)垂直分片:把一個全局關(guān)系的屬性集分成若干子集,并在這些子集上作投影運(yùn)算,每個投影稱為垂直分片。(3)導(dǎo)出分片:又稱為導(dǎo)出水平分片,即水平分片的條件不是本關(guān)系屬性的條件,而是其他關(guān)系屬性的條件。(4)混合分片:以上三種方法的混合??梢韵人椒制俅怪狈制?,或先垂直分片再水平分片,或其他形式,但他們的結(jié)果是不相同的。條件:(1)完備性條件:必須把全局關(guān)系的所有數(shù)據(jù)映射到片段中,決不允許有屬于全局關(guān)系的數(shù)據(jù)卻不屬于它的任何一個片段。(2)可重構(gòu)條件:必須保證能夠由同一個全局關(guān)系的各個片段來重建該全局關(guān)系。對于水平分片可用并操作重構(gòu)全局關(guān)系;對于垂直分片可用聯(lián)接操作重構(gòu)全局關(guān)系。(3)不相交條件:要求一個全局關(guān)系被分割后所得的各個數(shù)據(jù)片段互不重疊(對垂直分片的主鍵除外)。數(shù)據(jù)分配方式:(1)集中式:所有數(shù)據(jù)片段都安排在同一個場地上。(2)分割式:所有數(shù)據(jù)只有一份,它被分割成若干邏輯片段,每個邏輯片段被指派在一個特定的場地上。(3)全復(fù)制式:數(shù)據(jù)在每個場地重復(fù)存儲。也就是每個場地上都有一個完整的數(shù)據(jù)副本。(4)混合式:這是一種介乎于分割式和全復(fù)制式之間的分配方式。目前分布式數(shù)據(jù)庫分配的設(shè)計,越來越多的采用尋找最優(yōu)解的算法,比如遺傳算法、退火機(jī)制等查詢優(yōu)化:指在執(zhí)行分布式查詢時選擇查詢執(zhí)行計劃的方法和關(guān)系運(yùn)算符的實(shí)現(xiàn)算法。根據(jù)系統(tǒng)環(huán)境的不同,查詢優(yōu)化所使用的算法也有所不同,通常分為遠(yuǎn)程廣域網(wǎng)環(huán)境和高速局域網(wǎng)環(huán)境,其區(qū)別主要在網(wǎng)絡(luò)的帶寬。對于一元運(yùn)算符可以采用集中式數(shù)據(jù)庫中的查詢優(yōu)化方法。而對于二元運(yùn)算符,由于涉及場地間的數(shù)據(jù)傳輸,因此必須考慮通信代價。分布式查詢中常見的連接運(yùn)算執(zhí)行策略包括:(1)半連接方法:利用半連接運(yùn)算的轉(zhuǎn)換方法R∞S=(RµS)∞S。假設(shè)場地1和場地2上分別有關(guān)系R和關(guān)系S,首先在S上執(zhí)行連接屬性上的投影并將結(jié)果傳輸至場地1,在場地1上執(zhí)行關(guān)系R與投影的連接操作,再將結(jié)果傳輸至場地2與關(guān)系S執(zhí)行連接操作。這種方法能夠降低執(zhí)行連接運(yùn)算時的網(wǎng)絡(luò)通信代價,主要適用于帶寬較低的遠(yuǎn)程廣域網(wǎng)絡(luò)。(2)枚舉法方法:指枚舉關(guān)系運(yùn)算符的物理執(zhí)行計劃,通過對比執(zhí)行計劃的代價選擇執(zhí)行算法的方法。其中,連接運(yùn)算符的物理執(zhí)行計劃包括嵌套循環(huán)方法、哈希連接法和歸并連接法。枚舉法主要適用于以磁盤IO代價為主的高速局域網(wǎng)環(huán)境。------------------完--------------------------
第二篇:分布式數(shù)據(jù)庫總結(jié)6700字分布式數(shù)據(jù)庫系統(tǒng)及其應(yīng)用復(fù)習(xí)大綱第一章分布式數(shù)據(jù)庫系統(tǒng)概述1、理解分布式數(shù)據(jù)庫系統(tǒng)的特點(diǎn)分布式數(shù)據(jù)庫系統(tǒng)的定義:分布式數(shù)據(jù)庫系統(tǒng),通俗地說,是物理上分散而邏輯上集中的數(shù)據(jù)庫系統(tǒng)。分布式數(shù)據(jù)庫系統(tǒng)使用計算機(jī)網(wǎng)絡(luò)將地理位置分散而管理和控制又需要不同程度集中的多個邏輯單位(通常是集中是數(shù)據(jù)庫系統(tǒng))連接起來,共同組成一個統(tǒng)一的數(shù)據(jù)庫系統(tǒng)。分布式數(shù)據(jù)庫系統(tǒng)的特點(diǎn):1物理分布性:數(shù)據(jù)不是存放在一個站點(diǎn)上2邏輯整體性:是與分散式數(shù)據(jù)庫系統(tǒng)的區(qū)別3站點(diǎn)自治性:是與多處理機(jī)系統(tǒng)的區(qū)別4數(shù)據(jù)分布透明性5集中與自治相結(jié)合的控制機(jī)制6存在適當(dāng)?shù)臄?shù)據(jù)冗余度7事務(wù)管理的分布性2、能夠按照不同標(biāo)準(zhǔn)描述分布式數(shù)據(jù)庫系統(tǒng)的分類按局部數(shù)據(jù)庫管理系統(tǒng)的數(shù)據(jù)模型分類:同構(gòu)性(homogeneous)(分為同構(gòu)同質(zhì)型和同構(gòu)異質(zhì)型)DDBS和異構(gòu)性(heterogeneous)DDBS按分布式數(shù)據(jù)庫系統(tǒng)的全局控制系統(tǒng)類型分類:全局控制集中型DDBS,全局控制分散型DDBS,全局控制可變型DDBS。3、理解分布式數(shù)據(jù)庫中數(shù)據(jù)的獨(dú)立性和分布透明性所謂數(shù)據(jù)獨(dú)立性是指用戶或用戶程序使用分布式數(shù)據(jù)庫如同使用集中式數(shù)據(jù)庫那樣,不必關(guān)心全局?jǐn)?shù)據(jù)的分布情況,包括全局?jǐn)?shù)據(jù)的邏輯分片情況、邏輯片段站點(diǎn)位置的分配情況,以及各站點(diǎn)上數(shù)據(jù)庫的數(shù)據(jù)模型等。也就是說,全局?jǐn)?shù)據(jù)的邏輯分片、片段的物理位置分配,各站點(diǎn)數(shù)據(jù)庫的數(shù)據(jù)模型等情況對用戶和用戶程序透明。所以,在分布式數(shù)據(jù)庫中分布獨(dú)立性也稱為分布透明性。分布透明性包括三個層次:分片透明性(完全分布透明性):映像2位置透明性(中級分布透明性):映像3局部數(shù)據(jù)模型透明性(低級分布透明性):映像4無分布透明性:異構(gòu)數(shù)據(jù)第二章分布式數(shù)據(jù)庫系統(tǒng)設(shè)計1、理解分布式數(shù)據(jù)庫的設(shè)計目標(biāo)分布式數(shù)據(jù)庫設(shè)計的目標(biāo)1分布式數(shù)據(jù)庫的本地性或近地性2控制數(shù)據(jù)的適當(dāng)冗余3工作負(fù)荷分布4存儲的能力和費(fèi)用2、理解水平分片的定義、分類和應(yīng)用水平分片是對全局關(guān)系執(zhí)行“選擇操作”,把具有相同性質(zhì)的元組進(jìn)行分組,構(gòu)成若干個不相交的子集。水平分片的方法可歸為初級分片和導(dǎo)出分片兩類。初級分片:以關(guān)系自身的屬性性質(zhì)為基礎(chǔ),執(zhí)行“選擇”操作,將關(guān)系分為若干個不相交的片段。例子2.1S(S#,SNAME,AGE,SEX)DefinefragmentS1asselect*fromwheresex=’M’DefinefragmentS2asselect*fromwheresex=’F’導(dǎo)出分片:全局關(guān)系的導(dǎo)出分片不是以其自身的屬性性質(zhì)為基礎(chǔ),而是從另一個關(guān)系的屬性性質(zhì)或水平片段推導(dǎo)出來的。采用導(dǎo)出分片可片可使片段與片段之間的“連接”變得更容易。例2.3設(shè)全局關(guān)系SC(S#,C#,GRADE),S(S#,SNAME,AGE,SEX)若要將SC劃分為男生的各門課成績和女生的各門課成績,這就不可能從SC本身的屬性性質(zhì)來執(zhí)行選擇,必須從關(guān)系S的屬性性質(zhì)或水平片段來導(dǎo)出。DefinefragmentSC1asselectSC.S#,C#,GRADEfromSC,SwhereSC.S#=S.S#andSEX=’M’DefinefragmentSC2asselectSC.S#,C#,GRADEfromSC,SwhereSC.S#=S.S#andSEX=’F’如果S已經(jīng)進(jìn)行水平分片,分為SF和SM,分別為男生全體和女生全體,則上述的片段定義可以基于片段SF和SM導(dǎo)出:DefinefragmentSC1asselect*fromSCwhereS#in(selectSF.S#fromSF)DefinefragmentSC2asselect*fromSCwhereS#in(selectSM.S#fromSM)3、理解垂直分片的定義和應(yīng)用一個全局關(guān)系的垂直分片是通過“投影”操作把它的屬性分為若干組。確定一個全局關(guān)系R的垂直分片需要根據(jù)應(yīng)用以“同樣方式”(例如具有相同的使用頻率)訪問的屬性來進(jìn)行分組。例2.4全局關(guān)系EMP(E#,NAME,SAL,TEL,MAGNUM,DEPT),主碼為E#。主要應(yīng)用有:集中在站點(diǎn)3上的管理性應(yīng)用要求查詢雇員的:NAME,SAL,TEL;和從其他站點(diǎn)發(fā)出的應(yīng)用要求查詢雇員的:NAME,DEPT,MAGNUM。解:如果使用垂直分片:EMP1(E#,NAME,SAL,TEL)和EMP2(E#,MAGNUM,DEPT)則NAME屬性只屬于一個片段,對于上述的應(yīng)用,必須進(jìn)行連接操作和非本地訪問。如果使用垂直群集:EMP1(E#,NAME,SAL,TEL)和EMP2(E#,NAME,MAGNUM,DEPT)則對于上述應(yīng)用,不需要執(zhí)行連接操作,且可實(shí)現(xiàn)較好的本地性。4、能夠描述分片的基本原則完備性原則:要把所有的數(shù)據(jù)映射到各個片斷中可重構(gòu)原則:關(guān)系分片后的各個片斷可重構(gòu)整個關(guān)系不相交原則:關(guān)系分片后的各個片斷不能重疊5、掌握數(shù)據(jù)片斷分配的分類和常用方法分配的簡化模型有:讀代價、寫代價、存儲代價和目標(biāo)函數(shù)。常用方法:非冗余分配設(shè)計方法(包含最佳適應(yīng)法和其他方法)和冗余分配的設(shè)計方法(包含所有得益站點(diǎn)法和附加復(fù)制法)6、掌握最佳適應(yīng)法和所有得益站點(diǎn)法的基本特點(diǎn)最佳適應(yīng)法是對每一種分配方式進(jìn)行估算,然后選擇最佳的站點(diǎn)。這種方法不考慮把一個片段與一個相關(guān)片段放在同一站點(diǎn)的“相互”影響。特點(diǎn):將片斷Ri分配到訪問Ri次數(shù)最多的那個站點(diǎn)上Bij=∑kFkj*Nki所有得益站點(diǎn)法:首先確定非復(fù)制為題的解,然后在全部站點(diǎn)中確定一組站點(diǎn),給這組站點(diǎn)中的每一個站點(diǎn)分配片斷的一個副本,這樣做所得到的好處要比為此而付出的費(fèi)用合算。特點(diǎn):將片斷Ri的副本分配到所有得益站點(diǎn)j上Bij=∑kFkj*Rki-c*∑k∑j’≠jFkj*Uki如果Bij>0,則站點(diǎn)j是得益站點(diǎn),放置Ri的一個副本7、能夠描述DATAID-D方法設(shè)計分布式數(shù)據(jù)庫的各個階段需求分析,概念設(shè)計,分布要求分析,全局邏輯設(shè)計,分布設(shè)計,局部邏輯設(shè)計,局部物理設(shè)計。邏輯設(shè)計分為全局邏輯設(shè)計和局部邏輯設(shè)計8、能夠根據(jù)給出的條件對關(guān)系進(jìn)行具體分片,給出正確的限定關(guān)系上邊的例子。第三章分布式數(shù)據(jù)庫系統(tǒng)中的查詢處理和優(yōu)化1、掌握分布式數(shù)據(jù)庫查詢的分類局部查詢、遠(yuǎn)程查詢和全局查詢2、理解關(guān)系代數(shù)運(yùn)算的交換率?∪1(∪2(R))=∪2(∪1(R))條件:∪1∪2是選擇操作時總成立,∪1∪2是投影操作時要求其屬性集合相等∪1與∪2是投影和選擇操作時:πA1,?An(σF(R))=σF(πA1,?An(R))的條件是F中的屬性是A1,?.An的子集。R∞S=S∞RR×S=S×RR∪S=S∪RR∩S=S∩RR∝S≠?S∝RR-S≠?S-R3、掌握直接連接優(yōu)化算法的分類利用站點(diǎn)依賴信息的算法,分片與復(fù)制算法,站點(diǎn)依賴和數(shù)據(jù)復(fù)制結(jié)合算法,Hash劃分算法4、掌握半連接運(yùn)算見P83-84例子5、掌握半連接和直接連接查詢優(yōu)化算法的區(qū)別取決于數(shù)據(jù)傳輸和局部處理的相對費(fèi)用;如果傳輸費(fèi)用是主要的,采用半連接;如果本地費(fèi)用是主要的,采用直接連接,6、理解Hash劃分算法的特點(diǎn)1數(shù)據(jù)傳送量是R;2索引方面,比片段復(fù)制算法更低,3每個站點(diǎn)的連接數(shù)據(jù)量同站點(diǎn)依賴7、能夠描述基于半連接算法查詢優(yōu)化的基本原理和步驟基本原理是在傳到另一個站點(diǎn)做連接前,消除與連接無關(guān)的數(shù)據(jù),減少做連接操作的數(shù)據(jù)量,從而減小傳輸代價步驟:1計算每種半連接方案的代價,并從中選擇一種最佳方案2選擇傳輸代價最小的站點(diǎn),計算采用全連接的方案的代價3比較兩種方案,確定最優(yōu)方案8、能夠描述基于關(guān)系代數(shù)等價變換的查詢優(yōu)化算法原理、算法實(shí)現(xiàn)步驟原理:1查詢問題——〉關(guān)系代數(shù)表達(dá)式2分析得到查詢樹3進(jìn)行全局到片段的變換得到基于片段的查詢樹4利用關(guān)系代數(shù)等價變換規(guī)則的優(yōu)化算法,盡可能先執(zhí)行選擇和投影操作算法:1連接和合并盡可能上提(樹根方向)2選擇和投影操作盡可能下移(葉子方向)實(shí)現(xiàn)步驟:轉(zhuǎn)換一:1查詢問題——〉關(guān)系代數(shù)表達(dá)式。2轉(zhuǎn)換二:關(guān)系代數(shù)表達(dá)式——〉查詢樹。3轉(zhuǎn)換三:全局查詢樹分拆成片段查詢樹。4優(yōu)化:利用關(guān)系代數(shù)等價變換規(guī)則的優(yōu)化算法,優(yōu)化查詢樹,進(jìn)而優(yōu)化查詢9、能夠根據(jù)提供的條件完成分片和復(fù)制算法應(yīng)用,通過計算判斷哪個關(guān)系保持分片最優(yōu)P88例3-6考試第四章分布式數(shù)據(jù)庫中的事務(wù)管理和恢復(fù)1、掌握事務(wù)的四大特性原子性(Atomicity),一致性(Consistency),持久性(Durability).隔離性(Isolation)2、能夠描述兩階段提交協(xié)議的工作流程兩階段提交協(xié)議的基本思想是:將本地原子性提交行為的效果擴(kuò)展到分布式事務(wù),保證了分布式事務(wù)提交的原子性,并在不損壞Log的情況下,實(shí)現(xiàn)快速故障恢復(fù),提高DDB系統(tǒng)的可靠性.2PC把事務(wù)的提交過程分為兩個階段:第一階段:表決階段,目的是形成一個共同的決定首先,協(xié)調(diào)者給所有參與者發(fā)送“準(zhǔn)備”消息,進(jìn)入等待狀態(tài)其次,參與者收到“準(zhǔn)備”消息后,檢查是否能夠提交本地事務(wù)如能,給協(xié)調(diào)者發(fā)送“建議提交”消息,進(jìn)入就緒狀態(tài)如不能,給協(xié)調(diào)者發(fā)送“建議撤銷”消息,可以單方面撤銷第三,協(xié)調(diào)者收到所有參與者的消息后,他就做出是否提交事務(wù)的決定,只要有一個參與者投了反對票,就決定撤銷整個事務(wù),發(fā)送“全局撤銷”消息給所有參與者,進(jìn)入撤銷狀態(tài)否則,就決定提交整個事務(wù),發(fā)送“全局提交”消息給所有參與者,進(jìn)入提交狀態(tài)第二個階段:執(zhí)行階段,實(shí)現(xiàn)表決階段的決定,提交或者撤銷3、掌握事務(wù)故障的分類分布是數(shù)據(jù)庫的故障分布是數(shù)據(jù)庫的故障分為站點(diǎn)故障和通信故障。站點(diǎn)故障包括事務(wù)故障、系統(tǒng)故障和介質(zhì)故障。事務(wù)故障包括計算溢出。完整性被破壞、操作員干預(yù)、輸入或輸出出錯等。通信故障分為報文故障和網(wǎng)絡(luò)分割故障。4、掌握分布式數(shù)據(jù)庫事務(wù)執(zhí)行的控制模型的分類分為三類:主從模型,三角模型,層次控制模型5、理解日志文件的特點(diǎn)日志文件保存到磁盤上。日志Log:記錄所有對DB的操作事務(wù)標(biāo)識:每個事務(wù)給定一個具有惟一性的標(biāo)識符Log記錄項:[start_transaction,T][write_item,T,x,舊值,新值][read_item,T,x][commit,T][abort,T]寫動作:寫Log比寫數(shù)據(jù)優(yōu)先Log存儲:一般存在盤上,還會定期備份到磁帶上6、理解分布式數(shù)據(jù)庫數(shù)據(jù)更新常見方法多站點(diǎn)數(shù)據(jù)更新、主文本更新法、快照方法7、理解故障恢復(fù)時檢查點(diǎn)知識檢查點(diǎn)(Checkpoint):設(shè)置一個周期性(時間/容量)操作點(diǎn)a)LogBuffer內(nèi)容寫入Log數(shù)據(jù)集b)寫檢查點(diǎn)Log信息:當(dāng)前活動事務(wù)表,每個事務(wù)最近一次Log記錄在Log文件中的位置c)DBBuffer內(nèi)容寫入DBd)將本次檢查點(diǎn)Log項在Log文件中的地址記入“重啟動文件”8、能夠描述兩階段提交協(xié)議的特點(diǎn):2PC協(xié)議的重要特點(diǎn):1允許參與者單方面撤銷事務(wù)2一旦參與者確定了提交或撤銷協(xié)議,它就不能再更改它的提議3當(dāng)參與者處于就緒狀態(tài)時,根據(jù)協(xié)調(diào)者發(fā)出的消息種類,它可以轉(zhuǎn)換為提交狀態(tài)或者撤銷狀態(tài)4協(xié)調(diào)者根據(jù)全局提交規(guī)則做出全局終止決定5協(xié)調(diào)者和參與者可能進(jìn)入互相等待對方消息的狀態(tài),使用定時器,保證退出消息等待狀態(tài)第五章分布式數(shù)據(jù)庫中的并發(fā)控制1、理解封鎖的基本準(zhǔn)則1事務(wù)T在執(zhí)行任何read_item(x)操作之前,必須先執(zhí)行read_lock(x)或者write_lock(x)操作2事務(wù)T在執(zhí)行任何write_item(x)操作之前,必須先執(zhí)行write_lock(x)操作3如果事務(wù)T執(zhí)行read_lock(x)操作,數(shù)據(jù)項x必須沒有加鎖或者已經(jīng)加了讀鎖,否則事務(wù)T的這個操作不能進(jìn)行4如果事務(wù)T執(zhí)行write_lock(x)操作,數(shù)據(jù)項x必須沒有加鎖,否則事務(wù)T的這個操作不能進(jìn)行5事務(wù)T在完成所有read_item(x)和write_item(x)操作之后,必須執(zhí)行unlock(x)操作6如果事務(wù)T已經(jīng)持有數(shù)據(jù)項x上的一個讀鎖或者一個寫鎖,那么它不能再執(zhí)行read_lock(x)操作7如果事務(wù)T已經(jīng)持有數(shù)據(jù)項x上的一個讀鎖或者一個寫鎖,那么它不能再執(zhí)行write_lock(x)操作8如果事務(wù)T沒有持有數(shù)據(jù)項x上的一個讀鎖或者一個寫鎖,那么它不能執(zhí)行unlock(x)操作2、理解基于時標(biāo)的并發(fā)控制方法并發(fā)控制方法包含全局時標(biāo)和局部時標(biāo)3、掌握死鎖檢測的方法分類局部死鎖:僅在一個站點(diǎn)上發(fā)生的死鎖全局死鎖:涉及多個站點(diǎn)的死鎖(即等待圈由多個站點(diǎn)組成)4、理解一致性調(diào)度和可串行化調(diào)度的特點(diǎn)一致性調(diào)度:調(diào)度可以使得數(shù)據(jù)庫從一個一致性狀態(tài)轉(zhuǎn)變?yōu)榱硪粋€一致性狀態(tài),則稱調(diào)度為一致性調(diào)度可串行化調(diào)度:如果一個調(diào)度等價于某個串行調(diào)度,則該調(diào)度稱為可串行化調(diào)度。也就是說,該調(diào)度可以通過一系列非沖突動作的交換操作使其成為串行調(diào)度5、能夠描述死鎖發(fā)生的四個必要條件:會考試互斥條件:事務(wù)請求對資源的獨(dú)占控制等待條件:事務(wù)已持有分配給它的資源,又去申請并等待別的資源非搶占條件:直到資源被持有它的事務(wù)釋放前,不可能將資源強(qiáng)制從持有它的事務(wù)奪去循環(huán)等待條件:存在事務(wù)互相等待的等待圈6、能夠列舉并發(fā)控制算法悲觀并發(fā)控制法和樂觀并發(fā)控制法悲觀并發(fā)控制法有基于封鎖的算法、基于時標(biāo)排序的算法和混合算法。樂觀的方法也可分為基于封鎖或基于時標(biāo)排序的算法。第六章分布式數(shù)據(jù)庫中的可靠性1、理解可靠性和可用性的含義與關(guān)系可靠性:指數(shù)據(jù)庫在一給定時間間隔內(nèi)不產(chǎn)生任何失敗的概率。它強(qiáng)調(diào)數(shù)據(jù)庫的正確性,要求數(shù)據(jù)庫正確運(yùn)行。通常用來描述不可修復(fù)的系統(tǒng)??捎眯裕簭?qiáng)調(diào)的是當(dāng)需要訪問數(shù)據(jù)庫時,它是可用的。指在給定的時間點(diǎn)系統(tǒng)可以正常運(yùn)行的概率。通常用于描述那些可以修復(fù)的系統(tǒng)。兩者關(guān)系:通常認(rèn)為構(gòu)建可用性的系統(tǒng)比可靠性的系統(tǒng)容易。兩者是統(tǒng)一的,可靠性高的系統(tǒng)可用性自然是好的。兩者又是矛盾的,增加錯誤風(fēng)險的情況下,可提高可用性;采用太謹(jǐn)慎的策略會降低可用性2、理解兩階段提交協(xié)議如何轉(zhuǎn)為三階段提交協(xié)議2PC中的狀態(tài):C(提交)狀態(tài)是可提交狀態(tài),其它為不可提交狀態(tài)。Ready狀態(tài)是不可提交狀態(tài)。Wait狀態(tài)是不可提交狀態(tài)。它們都侵犯了非阻斷協(xié)議的充要條件,從而考慮改變2PC,使其滿足非阻斷協(xié)議條件。在Wait和Commit之間,或者在Ready和Commit之間加入另一種狀態(tài)作為緩沖狀態(tài),從而有了3PC協(xié)議3、掌握分布式可靠性協(xié)議的組成。簡答可靠性協(xié)議組成:包括提交、終結(jié)、恢復(fù)協(xié)議。提交和恢復(fù)協(xié)議詳細(xì)說明提交命令和恢復(fù)命令是如何執(zhí)行的。終結(jié)協(xié)議是分布式系統(tǒng)特有的協(xié)議。在執(zhí)行一個分布式事務(wù)時,若一個Site故障,希望其它Site也停止該事務(wù)。處理這種情況的技術(shù)就稱為終止協(xié)議。4、理解發(fā)生網(wǎng)絡(luò)分割時冗余分布式數(shù)據(jù)庫和非冗余數(shù)據(jù)庫采用的處理協(xié)議非冗余數(shù)據(jù)庫:任何需要訪問存儲在另一網(wǎng)絡(luò)區(qū)域里的數(shù)據(jù)項的新事務(wù)都被阻斷,等待網(wǎng)絡(luò)修復(fù)。位于同一區(qū)域里的數(shù)據(jù)項的并發(fā)訪問由并發(fā)控制算法處理。網(wǎng)絡(luò)分割時由提交協(xié)議處理冗余數(shù)據(jù)庫:分割時,副本可能位于不同的區(qū)域。由復(fù)制協(xié)議處理5、能夠描述三階段提交協(xié)議中事務(wù)協(xié)調(diào)者和參與者的狀態(tài)轉(zhuǎn)換P188頁圖6.4考試6、能夠采用版本號法進(jìn)行不一致性檢測,并且應(yīng)用于實(shí)際。大題需要首先發(fā)現(xiàn)哪些數(shù)據(jù)部分已經(jīng)不一致(不一致性檢測)然后根據(jù)發(fā)生的情況,給這些部分賦予一個最合理的值(不一致性的解法)檢測方法:采用版本號P200頁例子第七章分布式數(shù)據(jù)庫的安全性與目錄管理1、理解分布式數(shù)據(jù)庫的動態(tài)授權(quán)語句的形式1用戶對自己生成的關(guān)系擁有全權(quán),通過授權(quán)和收權(quán)語句完成對數(shù)據(jù)開放,保密的存取權(quán)授予(Grant,Revoke)。授權(quán)語句授權(quán)語句:Grant<權(quán)>To<用戶>WithGrantOption2訪問表(AT)法2、理解數(shù)據(jù)庫的安全性含義數(shù)據(jù)庫安全性包括兩個方面的內(nèi)容:數(shù)據(jù)庫數(shù)據(jù)的保密性和安全性。
第三篇:數(shù)據(jù)庫總結(jié)5900字?jǐn)?shù)據(jù)庫老師畫的重點(diǎn)數(shù)據(jù)庫:數(shù)據(jù)庫是長期存儲在計算機(jī)內(nèi)、有組織、可共享的大數(shù)據(jù)集合。數(shù)據(jù)庫操縱功能:查詢select、插入insert、刪除delete、修改update數(shù)據(jù)庫系統(tǒng)的特點(diǎn):1數(shù)據(jù)結(jié)構(gòu)化2數(shù)據(jù)的共享高,冗余度低,易擴(kuò)充3數(shù)據(jù)獨(dú)立性高4數(shù)據(jù)由DBMS統(tǒng)一管理和控制數(shù)據(jù)模型的組成要素:數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)操作、完整性約束概念模型:要出大體,畫圖信息世界中的基本概念————1、實(shí)體:客觀存在并可以相互區(qū)別的事物稱為實(shí)體2、屬性:實(shí)體所具有的某一特性3、碼(key):唯一標(biāo)識實(shí)體的屬性集稱為碼4、域(domain):域是一組具有相同數(shù)據(jù)類型的集合5、實(shí)體型(entitytype):具有相同屬性的實(shí)體必然具有共同的特征和性質(zhì)。用實(shí)體名及屬性名集合來抽象和刻畫同類實(shí)體,稱為實(shí)體型。6、實(shí)體集(entityset):同一類型的實(shí)體的集合7、聯(lián)系:在現(xiàn)實(shí)世界中,事物內(nèi)部以及事物之間是有聯(lián)系的,這些聯(lián)系在信息世界中反應(yīng)為實(shí)體(型)內(nèi)部的聯(lián)系和實(shí)體(型)之間的聯(lián)系。實(shí)體內(nèi)部的聯(lián)系通常是指組成實(shí)體的各屬性之間的聯(lián)系;實(shí)體之間的聯(lián)系通常是指不同實(shí)體集之間的聯(lián)系最常用的數(shù)據(jù)模型:1、層次模型(HierarchicalModel)2、網(wǎng)狀模型(NetworkModel)3、關(guān)系模型(RelationalModel)4、面向?qū)ο竽P停∣bjectOrientedModel)5、對象關(guān)系模型(ObjectRelationalModel)其中層次模型和網(wǎng)狀模型統(tǒng)稱為格式化模型數(shù)據(jù)庫系統(tǒng)的三級模式結(jié)構(gòu):1、模式(scheme):模式也稱邏輯模式,是數(shù)據(jù)庫中全體數(shù)據(jù)的邏輯結(jié)構(gòu)和特征的描述,是所有用戶的公共數(shù)據(jù)視圖。他是數(shù)據(jù)庫系統(tǒng)模式結(jié)構(gòu)的中間層,既不設(shè)計涉及數(shù)據(jù)的物理存儲細(xì)節(jié)和硬件環(huán)境,也與具體的應(yīng)用程序、所使用的應(yīng)用開發(fā)工具及高級程序設(shè)計語言無關(guān)。2、外模式(externalschema):外模式也稱為子模式(subschema)或用戶模式,他是數(shù)據(jù)庫用戶(包括應(yīng)用程序員和最終用戶)能看見和使用的局部數(shù)據(jù)的邏輯結(jié)構(gòu)和特征的描述,是數(shù)據(jù)庫用戶的數(shù)據(jù)視圖,是與某一應(yīng)用有關(guān)的數(shù)據(jù)的邏輯表示。3、內(nèi)模式(internalscheme):內(nèi)模式也稱存儲模式(storageschema),一個數(shù)據(jù)庫只有一個內(nèi)模式。他是數(shù)據(jù)庫物理結(jié)構(gòu)和存儲方式的描述,是數(shù)據(jù)在數(shù)據(jù)庫內(nèi)部的表達(dá)方式。數(shù)據(jù)庫的二級映像功能與數(shù)據(jù)庫獨(dú)立性————為了能夠在系統(tǒng)內(nèi)部實(shí)現(xiàn)這3個抽象層次的聯(lián)系和轉(zhuǎn)換,數(shù)據(jù)庫管理系統(tǒng)在這三個模式之間提供了兩層映像:·外模式/模式映像·模式/內(nèi)模式映像正是這兩層映像保證了數(shù)據(jù)庫系統(tǒng)中的數(shù)據(jù)能夠具有較高的邏輯獨(dú)立性和物理獨(dú)立性關(guān)系(relation):D1*D2*D3··*Dn的子集叫做在域D1、D2、D3···Dn上的關(guān)系,表示為R(D1、D2、D3···Dn)這里的的R表示關(guān)系的名字,n是關(guān)系的目或度(degree)關(guān)系中每個元素是關(guān)系中的元組,通常用t表示當(dāng)n=1時,稱關(guān)系為單元關(guān)系(unaryrelation),或一元關(guān)系當(dāng)n=2時,稱該關(guān)系為二元關(guān)系(binaryrelation)關(guān)系是笛卡爾積的有限子集,所以關(guān)系也是一個二維表,表的每行對應(yīng)一個元組,表的每列對應(yīng)一個域。由于域可以相同,為了加以區(qū)分,必須對每列起一個名字,稱為屬性(attribute)。n目關(guān)系必有n個屬性。若關(guān)系中的某一屬性組的值能夠唯一的標(biāo)識一個元組,則稱該屬性組為候選碼(candidatekey)若一個關(guān)系有多個候選碼,則選定其中一個為主碼(primarykey)候選碼的諸屬性稱為主屬性(primeattribute)。不包含在任何候選碼中的屬性稱為非主屬性(non-primeattribute)或非碼屬性(non-keyattribute)P46沒有搞明白干嘛使得?。。。。。。。。。。。。。。。。。。。?!關(guān)系的三類完整性約束:實(shí)體完整性、參照完整性、用戶定義的完整性實(shí)體完整性和參照完整性被稱作關(guān)系的兩個不變性1、實(shí)體完整性(entityintegrity):主碼中的屬性即主屬性不能取空值2、參照完整性(referentialintegrity):若屬性(或?qū)傩越M)F是基本關(guān)系R的外碼,它與基本關(guān)系S的的主碼K相對應(yīng)(基本關(guān)系R和S不一定是不同的關(guān)系),則對于R中每個元組在F上的值必須為:·或者取空值(F的每個屬性值均為空值)·或者等于S中某個元組的主碼值SQL(StructuredQueryLanguage),即結(jié)構(gòu)化查詢語言,是關(guān)系數(shù)據(jù)庫的標(biāo)準(zhǔn)語言。SQL的特點(diǎn):1、綜合統(tǒng)一2、高度非過程化3、面向集合的操作方式4、以同一種語法結(jié)構(gòu)提供多種使用方式5、語言簡潔、易學(xué)易用SQL的動詞:數(shù)據(jù)查詢:select數(shù)據(jù)定義:create、drop、alter(房間)修改表數(shù)據(jù)操縱:insert、update(家具)修改數(shù)據(jù)、delete數(shù)據(jù)控制:grant、revoke繪制ER圖————在ER圖中有如下四個成分:矩形框:表示實(shí)體,在框中記入實(shí)體名。菱形框:表示聯(lián)系,在框中記入聯(lián)系名。橢圓形框:表示實(shí)體或聯(lián)系的屬性,將屬性名記入框中。對于主屬性名,則在其名稱下劃一下劃線。連線:實(shí)體與屬性之間;實(shí)體與聯(lián)系之間;聯(lián)系與屬性之間用直線相連,并在直線上標(biāo)注聯(lián)系的類型。(對于一對一聯(lián)系,要在兩個實(shí)體連線方向各寫1;對于一對多聯(lián)系,要在一的一方寫1,多的一方寫N;對于多對多關(guān)系,則要在兩個實(shí)體連線方向各寫N,M?;颈硎潜旧愍?dú)立存在的表,在SQL中一個關(guān)系就對應(yīng)一個基本表。一個(或多個)基本表對應(yīng)一個存儲文件,一個表可以帶若干索引,索引也可以放在存儲文件中。存儲文件的邏輯結(jié)構(gòu)組成了關(guān)系數(shù)據(jù)庫的內(nèi)模式。存儲文件的物理結(jié)構(gòu)是任意的,對用戶是透明的。視圖是從一個或幾個基本表導(dǎo)出的表。它本身不獨(dú)立存儲在數(shù)據(jù)庫中,即數(shù)據(jù)庫中只存放視圖的定義而不存放視圖對應(yīng)的數(shù)據(jù)。這些數(shù)據(jù)仍存放在導(dǎo)出視圖的基本表中,因此視圖是一個虛表。視圖在概念上與基本表等同,用戶可以在視圖上再定義視圖?;颈淼亩x、刪除與修改:1、定義基本表:createtable***()2、定義主鍵:Primarykey==notnull(中間不用連接符號)unique3、定義外碼的語句:foreignkey(某個字段)references某表(某字段)4、定義主碼語句:primarykey(***,***)5、修改基本表:altertable某表名add列名<數(shù)據(jù)類型>[完整性約束]drop<完整性約束名>(字段名)altercolumn<列名><數(shù)據(jù)類型>6、刪
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 項目施工合同
- 全屋定制安裝合同范本
- 采購及服務(wù)合同
- 一建合同管理的程序
- 廢舊買賣合同范本
- 幼兒園場地租賃合同
- 鍍鋅行業(yè)安全知識競賽學(xué)習(xí)資料
- 重大安全風(fēng)險管控措施落實(shí)情況檢查和事故隱患排查工作方案
- 基于能量選擇的空間電磁防護(hù)結(jié)構(gòu)設(shè)計與研究
- 2025年??趶臉I(yè)資格證應(yīng)用能力考些啥
- 中小學(xué)校食品安全與膳食經(jīng)費(fèi)管理工作指引
- 電商平臺客服人員績效考核手冊
- 04S519小型排水構(gòu)筑物(含隔油池)圖集
- YB∕T 4146-2016 高碳鉻軸承鋼無縫鋼管
- 多圖中華民族共同體概論課件第十三講先鋒隊與中華民族獨(dú)立解放(1919-1949)根據(jù)高等教育出版社教材制作
- 高考英語單詞3500(亂序版)
- 《社區(qū)康復(fù)》課件-第五章 脊髓損傷患者的社區(qū)康復(fù)實(shí)踐
- 北方、南方戲劇圈的雜劇文檔
- 燈謎大全及答案1000個
- 洗衣機(jī)事業(yè)部精益降本總結(jié)及規(guī)劃 -美的集團(tuán)制造年會
- 2015-2022年湖南高速鐵路職業(yè)技術(shù)學(xué)院高職單招語文/數(shù)學(xué)/英語筆試參考題庫含答案解析
評論
0/150
提交評論