數(shù)據(jù)庫工程師知識點(diǎn)_第1頁
數(shù)據(jù)庫工程師知識點(diǎn)_第2頁
數(shù)據(jù)庫工程師知識點(diǎn)_第3頁
數(shù)據(jù)庫工程師知識點(diǎn)_第4頁
數(shù)據(jù)庫工程師知識點(diǎn)_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

一、數(shù)據(jù)模型1.數(shù)據(jù)模型的三要素(1)數(shù)據(jù)結(jié)構(gòu)數(shù)據(jù)結(jié)構(gòu)是所研究的對象類型(ObjectType)的集合。這些對象和對象類型是數(shù)據(jù)庫的組成成分。一般可分為兩類:一類是與數(shù)據(jù)類型、內(nèi)容和其它性質(zhì)有關(guān)的對象;一類是與數(shù)據(jù)之間的聯(lián)系有關(guān)的對象。前者如網(wǎng)狀模型中的數(shù)據(jù)項(xiàng)和記錄,關(guān)系模型中的域、屬性和關(guān)系等。后者如網(wǎng)狀模型中的關(guān)系模型(settype)。在數(shù)據(jù)庫領(lǐng)域中,通常按照數(shù)據(jù)結(jié)構(gòu)的類型來命名數(shù)據(jù)模型,進(jìn)而對數(shù)據(jù)庫管理系統(tǒng)進(jìn)行分類。如層次結(jié)構(gòu)、網(wǎng)狀結(jié)構(gòu)和關(guān)系結(jié)構(gòu)的數(shù)據(jù)模型分別稱作為層次模型、網(wǎng)狀模型和關(guān)系模型。相應(yīng)地,數(shù)據(jù)庫分別稱作為層次數(shù)據(jù)庫、網(wǎng)狀數(shù)據(jù)庫和關(guān)系數(shù)據(jù)庫。(2)數(shù)據(jù)操作數(shù)據(jù)操作是指對各種對象類型的實(shí)例(或值)所允許執(zhí)行的操作的集合,包括操作及有關(guān)的操作規(guī)則。在數(shù)據(jù)庫中,主要的操作有檢索和更新(包括插入、刪除、修改)兩大類。數(shù)據(jù)模型定義了這些操作的定義、語法(即使用這些操作時(shí)所用的語言)。數(shù)據(jù)結(jié)構(gòu)是對系統(tǒng)靜態(tài)特性的描述,而數(shù)據(jù)操作是對系統(tǒng)動態(tài)特性的描述。兩者既有聯(lián)系,又有區(qū)別。(3)數(shù)據(jù)的約束條件數(shù)據(jù)的約束條件是完整性規(guī)則的集合。完整性規(guī)則是指在給定的數(shù)據(jù)模型中,數(shù)據(jù)及其聯(lián)系所具有的制約條件和依存條件,用以限制符合數(shù)據(jù)模型的數(shù)據(jù)庫的狀態(tài)以及狀態(tài)的變化,確保數(shù)據(jù)的正確性、有效性和一致性。2.概念模型數(shù)據(jù)模型是數(shù)據(jù)庫系統(tǒng)的核心和基礎(chǔ)。每個(gè)DBMS軟件都是基于某種數(shù)據(jù)模型的。為了把現(xiàn)實(shí)世界中的具體事物或事物之間的聯(lián)系表示成DBMS所支持的數(shù)據(jù)模型,人們首先必須將現(xiàn)實(shí)世界的事物及其之間的聯(lián)系進(jìn)行抽象,轉(zhuǎn)換為信息世界的概念模型;然后將信息世界的概念模型轉(zhuǎn)換為機(jī)器世界的數(shù)據(jù)模型。也就是說,首先把現(xiàn)實(shí)世界中的客觀對象抽象成一種信息結(jié)構(gòu)。這種信息結(jié)構(gòu)并不依賴于具體的計(jì)算機(jī)系統(tǒng)和DBMS。然后,再把概念模型轉(zhuǎn)換為某一計(jì)算機(jī)系統(tǒng)上某一DBMS所支持的數(shù)據(jù)模型。因此,概念模型是從現(xiàn)實(shí)世界到機(jī)器世界的一個(gè)中間層次?,F(xiàn)實(shí)世界的事物反映到人的大腦之中,然后人們開始認(rèn)識這些事物,經(jīng)過選擇、命名、分類和組織等抽象工作之后形成概念模型,并進(jìn)入到信息世界。用戶(user)關(guān)心的是現(xiàn)實(shí)世界中的事物、事物的屬性及其相互關(guān)系。例如,用戶可能關(guān)心他的顧客及其屬性,如顧客地址、銀行帳號等等。用戶也關(guān)心自己的定貨帳目,如誰訂的貨、訂的什么和訂多少等等。系統(tǒng)分析員(analyst)同樣也關(guān)心現(xiàn)實(shí)世界,但是系統(tǒng)分析員需要分析用戶的信息需求。作為需求分析的結(jié)果,分析員必須以文檔的形式對需求進(jìn)行結(jié)構(gòu)化的描述;這個(gè)文檔就是信息模型。實(shí)體(Entity)實(shí)體是構(gòu)成數(shù)據(jù)庫的基本元素。實(shí)體是指一個(gè)存在的東西以區(qū)別這個(gè)東西所具有的屬性和這個(gè)東西與其它東西的聯(lián)系。實(shí)體可以是人,也可以是物;可以是實(shí)際對象,也可以是概念;可以是事物本身,也可以是指事物之間的聯(lián)系。屬性(Attribute)一個(gè)實(shí)體可以由若干個(gè)屬性來刻畫。屬性是相對實(shí)體而言的,是實(shí)體所具有的特性。關(guān)鍵字(Key)能唯一地標(biāo)識實(shí)體的屬性的集合稱為關(guān)鍵字(或碼)。域(Domain)屬性的取值范圍稱作域。實(shí)體型(EntityType)一類實(shí)體所具有的共同特征或?qū)傩缘募戏Q為實(shí)體型。一般用實(shí)體名及其屬性來抽象地刻畫一類實(shí)體的實(shí)體型。實(shí)體集(EntitySet)同型實(shí)體的集合叫實(shí)體集。例如,學(xué)生就是一個(gè)實(shí)體集。實(shí)體集的名即是實(shí)體型。對于學(xué)生和(學(xué)號,姓名,年齡,系,年級)均是實(shí)體型,而學(xué)生是對實(shí)體型(學(xué)號,姓名,年齡,系,年級)所起的名稱,兩者是指同一客觀對象。但本科生和研究生可以為相同實(shí)體型,而實(shí)體集不同。聯(lián)系(Relationship)現(xiàn)實(shí)世界的事物之間是有聯(lián)系的。一般存在兩類聯(lián)系:一是實(shí)體內(nèi)部的組成實(shí)體的屬性之間的聯(lián)系,二是實(shí)體之間的聯(lián)系。在考慮實(shí)體內(nèi)部的聯(lián)系時(shí),是把屬性看作為實(shí)體。一般來說,兩個(gè)實(shí)體之間的聯(lián)系可分為三種:(1)一對一(1∶1)聯(lián)系若對于實(shí)體集A中的每一個(gè)實(shí)體,實(shí)體集B中至多有唯一的一個(gè)實(shí)體與之聯(lián)系,反之亦然,則稱實(shí)體集A與實(shí)體集B具有一對一聯(lián)系,記作1∶1。(2)一對多(1∶n)聯(lián)系若對于實(shí)體集A中的每個(gè)實(shí)體,實(shí)體集B中有n個(gè)實(shí)體(n≥0)與之聯(lián)系;反之,對于實(shí)體集B中的每一個(gè)實(shí)體,實(shí)體集A中至多只有一個(gè)實(shí)體與之聯(lián)系,則稱實(shí)體集A與實(shí)體集B有一對多聯(lián)系,記為1∶n。相應(yīng)地有多對一(n∶1)聯(lián)系多對一聯(lián)系,從本質(zhì)上說,是一對多聯(lián)系的逆轉(zhuǎn)。其定義同一對多聯(lián)系類似,不再贅述。(3)多對多(m∶n)聯(lián)系若對于實(shí)體集A中的每一個(gè)實(shí)體,實(shí)體集B中有n個(gè)實(shí)體(n≥0)與之聯(lián)系;反之,對于實(shí)體集B中的每一個(gè)實(shí)體,實(shí)體集A中也有m個(gè)實(shí)體(m≥0)與之對應(yīng),則稱實(shí)體集A與實(shí)體集B具有多對多聯(lián)系,記作m∶n。實(shí)質(zhì)上,多對多聯(lián)系是任意一種聯(lián)系。另外,同一實(shí)體集內(nèi)的各個(gè)實(shí)體間也可以有各種聯(lián)系。概念模型的表示方法最常用的是實(shí)體一聯(lián)系方法(Entity-RelationshipApproach),簡稱E-R方法。該方法是由P.P.S.Chen在1976年提出的。E-R方法用E-R圖來描述某一組織的概念模型。在這里僅介紹E-R圖的要點(diǎn)。在E-R圖中:(1)長方形框表示實(shí)體集,框內(nèi)寫上實(shí)體型的名稱。(2)用橢圓框表示實(shí)體的屬性,并用有向邊把實(shí)體框及其屬性框連接起來。(3)用菱形框表示實(shí)體間的聯(lián)系,框內(nèi)寫上聯(lián)系名,用無向邊把菱形框及其有關(guān)的實(shí)體框連接起來,在旁邊標(biāo)明聯(lián)系的種類。如果聯(lián)系也具有屬性,則把屬性框和菱形框也用無向邊連接上。3.三種主要的數(shù)據(jù)模型實(shí)際DBMS所支持的數(shù)據(jù)模型主要有三種:層次模型(HierarchicalModel)網(wǎng)狀模型(NetworkModel)關(guān)系模型(RelationalModel)其中,關(guān)系模型是當(dāng)前DBMS所支持的數(shù)據(jù)模型的主流。90年代運(yùn)行的DBMS幾乎都是基于關(guān)系模型的。層次模型和網(wǎng)狀模型統(tǒng)稱為非關(guān)系模型。非關(guān)系模型的結(jié)構(gòu)可以和圖論中的圖相對應(yīng),比較直觀,但在理論上不完備,實(shí)現(xiàn)效率較低,故此目前很少用。但是最近,層次模型在研究面向?qū)ο蟮腄BMS中已得到重視。在關(guān)系模型中,數(shù)據(jù)在用戶的觀點(diǎn)中(或在用戶視圖中)的邏輯結(jié)構(gòu)是一張二維表(Table)。關(guān)系(Relation),對應(yīng)于平常講的一張表。元組(Tuple),表中的一行。屬性(Attribute),表中的一列稱為一個(gè)屬性,給每一列起一個(gè)名,稱為屬性名。這一列或這個(gè)屬性所有可能取的值的集合稱為這個(gè)屬性的值域(Domain),值域中的一個(gè)元素叫做這個(gè)屬性的值。主關(guān)鍵字(PrimaryKeyAttribute或PrimaryKey),是指能唯一標(biāo)識一個(gè)元組的一個(gè)或一組屬性。分量(Attributevalue),是指元組中的一個(gè)屬性值。關(guān)系模式(RelationalSchema),是對關(guān)系的描述,一般用關(guān)系名(屬性名1,屬性名2,…,屬性名n)來表示。同層次模型和網(wǎng)狀模型相比較,關(guān)系模型具有下列特點(diǎn):(1)概念單一在關(guān)系模型中,無論是實(shí)體還是實(shí)體之間的聯(lián)系都用關(guān)系來表示。在關(guān)系模型中,在用戶的觀點(diǎn)中,數(shù)據(jù)的邏輯結(jié)構(gòu)就是表,也只有這唯一的概念。在非關(guān)系模型中,用戶要區(qū)分記錄型與記錄型之間的聯(lián)系兩個(gè)概念;當(dāng)環(huán)境復(fù)雜時(shí),數(shù)據(jù)結(jié)構(gòu)異常復(fù)雜,難以掌握。而關(guān)系模型,由于概念單一,可以變復(fù)雜為直觀、簡單,易學(xué)易用。(2)規(guī)范化所謂關(guān)系規(guī)范化是指在關(guān)系模型中,每一個(gè)關(guān)系都要滿足一定的條件要求。這些條件被稱為規(guī)范條件。對于關(guān)系,一個(gè)最基本的規(guī)范條件是,要求關(guān)系中的每一個(gè)屬性(或分量)均是不可分的數(shù)據(jù)項(xiàng);也就是說不允許表中有表,表是不可嵌套的。(3)在關(guān)系模型中,用戶對數(shù)據(jù)的操作的輸入和輸出都是表,也就是說,用戶通過操作舊表而得到一張新表??傊P(guān)系模型概念簡單,結(jié)構(gòu)清晰,用戶易學(xué)易用,有嚴(yán)格的以數(shù)學(xué)為基礎(chǔ)的關(guān)系理論作指導(dǎo),便于DBMS的實(shí)現(xiàn)。基于關(guān)系的DBMS簡化了應(yīng)用程序員的工作,便于數(shù)據(jù)庫應(yīng)用系統(tǒng)的設(shè)計(jì)和維護(hù)。故此,關(guān)系模型自誕生以后就得到了迅速的發(fā)展,成為應(yīng)用最為廣泛的、唯一的數(shù)據(jù)模型。二、數(shù)據(jù)庫系統(tǒng)的結(jié)構(gòu)1.數(shù)據(jù)庫系統(tǒng)的三級模式結(jié)構(gòu)數(shù)據(jù)庫管理系統(tǒng)的三級模式結(jié)構(gòu)由外模式、模式和內(nèi)模式組成。外模式(externalschema),或子模式(subschema)或用戶模式(userschema),是指數(shù)據(jù)庫用戶所看到的數(shù)據(jù)結(jié)構(gòu),是用戶看到的數(shù)據(jù)視圖。模式(schema)或邏輯模式(logicschema),是數(shù)據(jù)庫中對全體數(shù)據(jù)的邏輯結(jié)構(gòu)和特性的描述,是所有用戶所見到的數(shù)據(jù)視圖的總和。外模式是模式的一部分。內(nèi)模式(internalschema),或存儲模式(storageschema),或物理模式(physicalschema),是指數(shù)據(jù)在數(shù)據(jù)庫系統(tǒng)內(nèi)的存儲介質(zhì)上的表示,即對數(shù)據(jù)的物理結(jié)構(gòu)和存取方式的描述。模式描述的是數(shù)據(jù)的全局的邏輯結(jié)構(gòu),決定了DBMS的功能。外模式涉及的僅是局部的邏輯結(jié)構(gòu),是模式的子集,是對模式的調(diào)用。數(shù)據(jù)庫系統(tǒng)的三級模式是對數(shù)據(jù)進(jìn)行三個(gè)層次抽象的工具。通過三級模式,把對數(shù)據(jù)的具體組織留給DBMS來完成,使得用戶能在高層次上處理數(shù)據(jù)的邏輯結(jié)構(gòu),而不必關(guān)心數(shù)據(jù)的物理結(jié)構(gòu)。為了實(shí)現(xiàn)這三個(gè)層次這間的聯(lián)系,DBMS在溝通三級模式中提供了兩個(gè)映象:外模式-模式映象模式-內(nèi)模式映象(1)模式模式規(guī)定了數(shù)據(jù)庫中全部數(shù)據(jù)的一個(gè)邏輯表示或描述形式。模式既不同于內(nèi)模式,也不同于外模式。它比內(nèi)模式抽象,不涉及數(shù)據(jù)的物理結(jié)構(gòu)和存儲介質(zhì)。它與具體的應(yīng)用程序或高級語言無關(guān)。(2)外模式外模式是個(gè)別用戶的數(shù)據(jù)視圖,即與某一應(yīng)用有關(guān)的數(shù)據(jù)的邏輯表示。(3)內(nèi)模式內(nèi)模式是全部數(shù)據(jù)庫的內(nèi)部表示或底層描述,是用來定義數(shù)據(jù)的物理結(jié)構(gòu)和存取方式的。(4)二級映象對于同一個(gè)模式,可以有任意多個(gè)外模式。外模式-模式的映象定義了某個(gè)外模式和模式之間的對應(yīng)關(guān)系。這些映象的定義通常包含在各自的外模式中。當(dāng)模式改變時(shí),外模式-模式的映象要做相應(yīng)的改變,以保證外模式的不變性。這是數(shù)據(jù)庫管理員(DBA)的責(zé)任。模式-內(nèi)模式的映象定義了數(shù)據(jù)邏輯結(jié)構(gòu)和存儲結(jié)構(gòu)之間的對應(yīng)關(guān)系。例如,字段的內(nèi)部表示等。當(dāng)數(shù)據(jù)庫的存儲結(jié)構(gòu)改變時(shí),模式-內(nèi)模式的映象也須做相應(yīng)的修改,以使得模式保持不變性。這仍是DBA的責(zé)任。正是由于上述二級映象的功能及其自動實(shí)現(xiàn),使得數(shù)據(jù)庫系統(tǒng)中的數(shù)據(jù)具有較高的邏輯獨(dú)立性和物理獨(dú)立性,從而大大地方便了用戶的使用。(5)概念模式與模式ANSI研究組于1975年2月提出一個(gè)臨時(shí)報(bào)告。1978年提出一個(gè)最終報(bào)告,稱之為ANˉSI/SPARC報(bào)告,簡稱為SPARC報(bào)告。SPARC報(bào)告中指出,數(shù)據(jù)庫管理系統(tǒng)應(yīng)具有三級模式的結(jié)構(gòu),即概念模式、外模式和內(nèi)模式。其中外模式和內(nèi)模多與上面所講的大致相當(dāng)。但SPARC報(bào)告中的概念模式是指一個(gè)組織或部門所對應(yīng)的現(xiàn)實(shí)世界的真實(shí)模型,即概念模型。概念模式僅描述實(shí)體及其屬性和聯(lián)系,不涉及機(jī)器世界的概念。概念模型是信息世界范疇內(nèi)的信息的結(jié)構(gòu),而模式是機(jī)器世界范疇內(nèi)的概念模型的邏輯表示。概念模型獨(dú)立于具體的計(jì)算機(jī)系統(tǒng),甚至是和計(jì)算機(jī)無關(guān)的,是一個(gè)組織或部門的模型。常用的描述概念模式的方法是E-R方法。模式是依賴于具體的計(jì)算機(jī)及其DBMS的。模式通過三種具體模型:層次模型、網(wǎng)狀模型和關(guān)系模型來加以實(shí)現(xiàn)。概念模式必須轉(zhuǎn)換成具體的數(shù)據(jù)模型,然后才能在相應(yīng)的DBMS上實(shí)現(xiàn)。概念模型和模式都是描述信息或數(shù)據(jù)的整體結(jié)構(gòu)的,然而它們是在不同的抽象層次上加以描述的。概念模型離機(jī)器更遠(yuǎn),形式化程度低。從遠(yuǎn)離機(jī)器的觀點(diǎn)看,概念模型更抽象些,但更接近現(xiàn)實(shí)世界。而模式描述使用的是形式化的語言-模式DDL,而概念模型描述使用的是E-R圖和一些自然語言。2.使用數(shù)據(jù)庫的計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)廣義地講,實(shí)際上使用數(shù)據(jù)庫的計(jì)算機(jī)系統(tǒng)由下列幾個(gè)部分組成的:(1)硬件部分包括主機(jī)、外部存儲設(shè)備、網(wǎng)絡(luò)設(shè)備和電源等。(2)軟件部分包括操作系統(tǒng)、DBMS、編譯系統(tǒng)和應(yīng)用開發(fā)工具軟件等。(3)人員包括數(shù)據(jù)庫管理員(DataBaseAdministrator-DBA),系統(tǒng)分析員(SystemAnaˉlyst)、應(yīng)用程序員(ApplicationProgrammer)和用戶(User)。3.數(shù)據(jù)庫管理系統(tǒng)數(shù)據(jù)庫管理系統(tǒng)DBMS是數(shù)據(jù)庫系統(tǒng)的核心。DBMS是負(fù)責(zé)數(shù)據(jù)庫的建立、使用和維護(hù)的軟件。DBMS建立在操作系統(tǒng)之上,實(shí)施對數(shù)據(jù)庫的統(tǒng)一管理和控制。用戶使用的各種數(shù)據(jù)庫命令以及應(yīng)用程序的執(zhí)行,最終都必須通過DBMS。另外,DBMS還承擔(dān)著數(shù)據(jù)庫的安全保護(hù)工作,按照DBA所規(guī)定的要求,保證數(shù)據(jù)庫的完整性和安全性。DBMS的主要功能包括以下幾個(gè)主要方面:(1)數(shù)據(jù)庫的定義功能DBMS通過提供數(shù)據(jù)描述語言(也稱數(shù)據(jù)定義語言)(DataDescripˉtiveLanguage———DDL)來對外模式、模式和內(nèi)模式加以描述。然后模式翻譯程序把用DDL寫的各種模式的定義源碼翻譯成相應(yīng)的內(nèi)部表示,形成相應(yīng)的目標(biāo)形式,分別叫目標(biāo)外模式、目標(biāo)模式、目標(biāo)內(nèi)模式,這些目標(biāo)模式是對數(shù)據(jù)庫的描述,而不是數(shù)據(jù)本身。(目標(biāo))模式只刻畫了數(shù)據(jù)庫的形式或框架,而不包括數(shù)據(jù)庫的內(nèi)容。這些目標(biāo)模式被保存在數(shù)據(jù)字典(或系統(tǒng)目標(biāo))之中,作為DBMS存取和管理數(shù)據(jù)的基本依據(jù)。例如,DBMS根據(jù)這些模式定義,進(jìn)行物理結(jié)構(gòu)和邏輯結(jié)構(gòu)的映象,進(jìn)行邏輯結(jié)構(gòu)和用戶視圖的映象,以導(dǎo)出用戶要檢索的數(shù)據(jù)的存取方式。(2)數(shù)據(jù)操縱功能DBMS提供數(shù)據(jù)操縱語言(DataManipulationLanguage———DML)實(shí)現(xiàn)對數(shù)據(jù)庫中數(shù)據(jù)的一些基本操作,如:檢索、插入、修改、刪除和排序等等。DML有兩類:一類是嵌入主語言的,如嵌入到C或COBOL等高級語言中。這類DML語言本身不能單獨(dú)使用,故此稱為宿主型的DML或嵌入式DML。另一類是非嵌入式語言(包括交互式命令語言和結(jié)構(gòu)化語言),它的語法簡單,可以獨(dú)立使用,由單獨(dú)的解釋或編譯系統(tǒng)來執(zhí)行,所以一般稱為自主型或自含型的DML。命令語言是行結(jié)構(gòu)語言,單條執(zhí)行。結(jié)構(gòu)化語言是命令語言的擴(kuò)充或發(fā)展,增加了程序結(jié)構(gòu)描述或過程控制功能,如循環(huán)、分支等功能。命令語言一般逐條解釋執(zhí)行。結(jié)構(gòu)化語言可以解釋執(zhí)行,也可以編譯執(zhí)行?,F(xiàn)在DBMS一般均提供命令語言的交互式環(huán)境和結(jié)構(gòu)環(huán)境兩種運(yùn)行方式,供用戶選擇。DBMS控制和執(zhí)行DML語句(或DML程序),完成對數(shù)據(jù)庫的操作。對于自主型的結(jié)構(gòu)化的DML,DBMS通常采用解釋執(zhí)行的方法,但也有編譯執(zhí)行的方法,而且編譯執(zhí)行的越來越多。另外,很多系統(tǒng)同時(shí)設(shè)有解釋和編譯兩種功能,由用戶選其一。對于嵌入型或縮主型DML,DBMS一種提供兩種方法:①預(yù)編譯方法。②修改和擴(kuò)充主語言編譯程序(亦稱增強(qiáng)編譯方法)。預(yù)編譯方法是,由DBMS提供一個(gè)預(yù)處理程序,對源程序進(jìn)行語法掃描,識別出DML語句,并把這些語句轉(zhuǎn)換成主語言中的特殊調(diào)用語句。主語言必須和DML有調(diào)用接口。這樣在連接形成目標(biāo)時(shí)和主語言語句一起形成可執(zhí)行的目標(biāo)。(3)數(shù)據(jù)庫運(yùn)行管理數(shù)據(jù)庫運(yùn)行期間的動態(tài)管理是DBMS的核心部分,包括并發(fā)控制、存取控制(或安全性檢查、完整性約束條件的檢查)、數(shù)據(jù)庫內(nèi)部的維護(hù)(如索引、數(shù)據(jù)字典的自動維護(hù)等)、緩沖區(qū)大小的設(shè)置等等。所有的數(shù)據(jù)庫操作都是在這個(gè)控制部分的統(tǒng)一管理下,協(xié)同工作,以確保事務(wù)處理的正常運(yùn)行,保證數(shù)據(jù)庫的正確性、安全性和有效性。(4)數(shù)據(jù)庫的建立和維護(hù)功能數(shù)據(jù)庫的建立和維護(hù)包括初始數(shù)據(jù)的裝入、數(shù)據(jù)庫的轉(zhuǎn)儲或后備功能、數(shù)據(jù)庫恢復(fù)功能、數(shù)據(jù)庫的重組織功能和性能分析等功能,這些功能一般都由各自對應(yīng)的實(shí)用功能子程序來完成。DBMS隨軟件產(chǎn)品和版本不同而有所差異。通常大型機(jī)上的DBMS功能最全,小型機(jī)上的DBMS功能稍弱點(diǎn),微機(jī)上的DBMS更弱些。但是,目前,由于硬件性能和價(jià)格的改進(jìn),微機(jī)上的DBMS功能越來越全。三、關(guān)系數(shù)據(jù)庫的標(biāo)準(zhǔn)語言———SQL1.SQL概述SQL的英語名稱是結(jié)構(gòu)查詢語言(StructuredQueryLanguage)實(shí)際上它的功能包括查詢(Query)、操縱(Manipulation)、定義(Definition)和控制(Control)四個(gè)方面,是一個(gè)綜合的、通用的、功能極強(qiáng)的關(guān)系數(shù)據(jù)庫語言。SQL支持?jǐn)?shù)據(jù)庫的三級模式結(jié)構(gòu)。2.SQL的數(shù)據(jù)定義功能SQL的數(shù)據(jù)定義功能包括三部分:定義基本表,定義視圖和定義索引。它們是:CREATETABLECREATEVIEWCREATEINDEXDROPTABLEDROPVIEWDROPINDEXSQL的數(shù)據(jù)定義功能可用于定義和修改模式(如基本表),定義外模式(如視圖)和內(nèi)模式(如索引)。3.基本表的定義與刪除定義基本表的語句格式為:CREATETABLE表名(列名1類型[NOTNULL][,列名2類型[NOTNULL]]…)[其他參數(shù)];其中,任選項(xiàng)“其它參數(shù)”是與物理存儲有關(guān)的參數(shù)。根據(jù)具體系統(tǒng)的不同而不同。刪除基本表的語句為:DROPTABLE表名;刪除索引的語句為:DROPINDEX索引名;刪除索引的同時(shí)把有關(guān)索引的描述也從數(shù)據(jù)字典中刪去。但表的內(nèi)涵仍存在且其數(shù)據(jù)外延內(nèi)容不變。把一個(gè)基本表的定義連同表上所有的記錄、索引以及由此基本表導(dǎo)出的所有視圖全部都刪除,并釋放相應(yīng)的存儲空間。4.索引的建立與刪除對一個(gè)基本表,可以根據(jù)應(yīng)用環(huán)境的需要建立若干索引,以提供多種存取方式。通常,索引的建立和刪除由DBA或表的主人(即建立表的人)負(fù)責(zé)。用戶不必也不能在存取數(shù)據(jù)時(shí)選擇索引。存取路徑的選擇由系統(tǒng)自動進(jìn)行。索引的描述存放在數(shù)據(jù)字典中。建立索引的語句格式為:CREATE[UNIQUE]INDEX索引名ON基本表名(列名[次序][,列名[次序]]…)[其他參數(shù)];這里的任選項(xiàng)———其他參數(shù)是與物理存儲有關(guān)的參數(shù)。索引可以建在一列或幾列上。圓括號內(nèi)是索引列的順序說明表。其中的任選項(xiàng)———次序,指定了索引值排序的次序??扇SC(升序)或DESC(降序)。缺省值為升序。UNIQUE表示每一索引值只對應(yīng)唯一的數(shù)據(jù)記錄。5.SQL的數(shù)據(jù)操縱功能SQL的數(shù)據(jù)操縱功能包括SELECT,INSERT,DELETE和UPDATE四個(gè)語句,即檢索和更新(包括增、刪、改)兩部分工能。檢索就是查詢。SQL更新語句SQL的更新語句包括修改,刪除和插入三類語句。①修改(UPDATE)(亦稱為更新)修改語句的一般格式為:UPDATE表名SET字段=表達(dá)式[,字段=表達(dá)式]…[WHERE謂詞];修改指定表中滿足謂詞(或條件)的元組,把這些元組按SET子句中的表達(dá)式修改相應(yīng)屬性或字段上的值。②刪除(DELETE)刪除語句一般格式為:DELETEFROM表名[WHERE謂詞];從指定表中刪除滿足謂詞的那些記錄。沒有WHERE子句時(shí)表示刪去此表中的全部記錄,但此表的定義仍在數(shù)據(jù)字典中,只是一個(gè)空表。DELETE只對表外延操作,不對內(nèi)涵操作。③插入(INSERT)插入語句的一般格式為:INSERTINTO表名[(字段名[,字段名]…)]valueS(常量[,常量]…);或INSERTINTO表名[(字段名[,字段名]…)]子查詢;第一種格式把一個(gè)新記錄插入指定的表中。第二種格式把子查詢的結(jié)果插入表中。若表中有些字段在插入語句中沒有出現(xiàn),則這些字段上的值取空值NULL。當(dāng)然在表定義中說明了NOTNULL的字段在插入時(shí)不能取NULL。若插入語句中沒有指出字段名,則新記錄必須在每個(gè)字段上均有值。6.視圖視圖是從一個(gè)或幾個(gè)基本表(或視圖)導(dǎo)出的表。某一用戶可以定義若干視圖。因此對某一用戶而言,按ANSI/SPARC報(bào)告的觀點(diǎn),他的外模式是由若干基本表和若干視圖組成的。視圖和基本表不同,視圖是一個(gè)虛表,即視圖所對應(yīng)的數(shù)據(jù)不實(shí)際存儲在數(shù)據(jù)庫中,數(shù)據(jù)庫中只存儲視圖的定義(存在數(shù)據(jù)字典中)。視圖一經(jīng)定義就可以和基本表一樣被查詢、被刪除(DROP),也可以用來定義新的視圖,但更新(增、刪、改)操作將有一定限制。視圖可以理解成一個(gè)數(shù)據(jù)庫,只有內(nèi)涵保存在數(shù)據(jù)庫字典中,而無外延存儲;其外延是在使用時(shí)動態(tài)地生成的或計(jì)算出來的。(1)視圖的定義與刪除SQL建立視圖的語句格式為:CREATEVIEW視圖名[(字段名[,字段名]…)]AS子查詢[WITHCHECKOPTION謂詞];視圖可以刪除,語句格式為:DROPVIEW視圖名;視圖的定義就從數(shù)據(jù)字典中刪除。由此視圖導(dǎo)出的其它視圖也將自動被刪除。若導(dǎo)出此視圖的基本表刪除了,則此視圖也將自動刪除。(2)視圖的查詢語句視圖定義后,用戶可以如同基本表那樣對視圖查詢。(3)視圖的更新語句對視圖的更新最終要轉(zhuǎn)換成對基本表的更新(這里的更新,指INSERT,UPDATE和DELETE三類操作)。在關(guān)系數(shù)據(jù)庫中,并非所有的視圖都是可更新的,也就是說,有些視圖的更新不能唯一地有意義地轉(zhuǎn)換成對基本表的更新。(4)視圖的優(yōu)點(diǎn)視圖的概念具有很多優(yōu)點(diǎn),主要有:(1)視圖對于數(shù)據(jù)庫的重構(gòu)造提供了一定程度的邏輯獨(dú)立性;(2)簡化了用戶觀點(diǎn);(3)視圖機(jī)制使不同的用戶能以不同的方式看待同一數(shù)據(jù);(4)視圖機(jī)制對機(jī)密數(shù)據(jù)提供了自動的安全保護(hù)功能。7.SQL的數(shù)據(jù)控制功能SQL數(shù)據(jù)控制功能是指控制用戶對數(shù)據(jù)的存取權(quán)力。某個(gè)用戶對某類數(shù)據(jù)具有何種操作權(quán)力是由DBA決定的。這是個(gè)政策問題而不是技術(shù)問題。數(shù)據(jù)庫管理系統(tǒng)的功能是保證這些決定的執(zhí)行。為此它必須能:(1)把授權(quán)的決定告知系統(tǒng),這是由SQL的GRANT和REVOKE語句來完成的。(2)把授權(quán)的結(jié)果存入數(shù)據(jù)字典。(3)當(dāng)用戶提出操作請求時(shí),根據(jù)授權(quán)情況進(jìn)行檢查,以決定是執(zhí)行操作請求還是拒絕之。授權(quán)語句的一般格式為:GRANT權(quán)力[,權(quán)力]…[ON對象類型對象名]TO用戶[,用戶]…,[WITHGRANTOPTION];對不同類型的操作對象可有不同的操作權(quán)力。(1)對基本表、視圖及其字段的操作權(quán)力有查詢、插入、更新、刪除以及它們的總和ALLPRIVILEGE。(2)對基本表的操作權(quán)力還有修改(ALTER)和建立索引(INDEX)。(3)對數(shù)據(jù)庫的操作權(quán)力有建立表(CREATETAB)。某用戶有了此權(quán)力就可以使用Createtable建立基本表。稱他為表的主人,擁有對此表的一切操作權(quán)力。(4)對表空間的權(quán)力有使用(USE)數(shù)據(jù)庫空間存儲基本表的權(quán)力。(5)系統(tǒng)權(quán)力有建立新數(shù)據(jù)庫(CREATEDBA)的權(quán)力。GRANT語句中的任選項(xiàng)WITHGRANTOPTION的作用是使獲得某種權(quán)力的用戶可以把權(quán)力再授予別的用戶。8.嵌入式SQL把SQL嵌入主語言使用時(shí)必須解決三個(gè)問題:(1)區(qū)分SQL語句與主語言語句。這是通過在所有的SQL語句前加前綴EXECSQL來解決的。SQL語句結(jié)束標(biāo)志隨主語言不同而不同,如PL/1用分號(;),COBOL用EMD-EXEC來表示。SQL語句首先由預(yù)編譯程序加以處理,轉(zhuǎn)換為主語言編譯程序能夠識別的形式,然后交主語言編譯程序進(jìn)一步處理。(2)數(shù)據(jù)庫工作單元和程序工作單元之間的通信。SQL語句中可以使用主語言的程序變量(簡稱主變量),這些變量名前加冒號(:)作標(biāo)志,以區(qū)別地字段名,程序中使用的任何表(基本表或視圖)都要用EXECSQLDECLARE語句加以說明。一則使程序更加清晰,二則使預(yù)編譯程序能作某些語法檢查。SQL語句執(zhí)行后,系統(tǒng)要反饋給應(yīng)用程序若干信息,這些信息送到SQL的通信區(qū)SQLCA。SQLCA用語句EXECSQLINCLUDE加以定義。在SQLCA中有一個(gè)狀態(tài)指示字段SQLCODE。當(dāng)SQLCODE為零時(shí),表示SQL語句執(zhí)行成功,否則返回一個(gè)錯(cuò)誤代碼(負(fù)值)或警告信息(正值)。程序員應(yīng)該在每個(gè)SQL語句之后測試SQLCODE的值,以便處理各種情況。(3)一個(gè)SQL語句原則上可產(chǎn)生或處理一組記錄,而主語言一次只能處理一個(gè)記錄,為此必須協(xié)調(diào)兩種處理方式。這是用游標(biāo)(Cursor)來解決的。下面首先討論不需要游標(biāo)的DML語句,然后討論使用游標(biāo)的DML語句。9.不用游標(biāo)的DML語句不需要游標(biāo)的DML語句有:查詢結(jié)果為單記錄的SELECT語句UPDATE(除了CURRENT形式的UPDATE)語句DELETE(除了CURRENT形式的DELETE)語句INSERT語句(1)查詢結(jié)果為單記錄的SELECT語句這類語句的一般格式是:(主語言為PL/1)EXECSQLSELECT目標(biāo)列INTO主變量[空值標(biāo)志]FROM基本表(或視圖)[WHERE條件表達(dá)式];SELECT語句從數(shù)據(jù)庫中找到符合條件的記錄,把結(jié)果放到主變量中。(2)UPDATE語句(3)DELETE語句(4)INSERT語句10.使用游標(biāo)的DML語句一般情況下SELECT語句的查詢結(jié)果是記錄的集合而不是單個(gè)記錄,為此需要用游標(biāo)機(jī)制作為橋梁,把集合操作轉(zhuǎn)換為單記錄處理。與游標(biāo)有關(guān)的語句有四個(gè):(1)定義游標(biāo)。游標(biāo)是與某一查詢結(jié)果相聯(lián)系的符號名。用DECLARE語句定義。這是一個(gè)說明語句。與游標(biāo)相對應(yīng)的SELECT語句這時(shí)并不執(zhí)行。(2)打開(OPEN)游標(biāo)。打開游標(biāo)語句使游標(biāo)處于活動狀態(tài)。與游標(biāo)相應(yīng)的查詢語句被執(zhí)行。游標(biāo)指向查詢結(jié)果集中的第一個(gè)記錄之前。(3)推進(jìn)(FETCH)游標(biāo)。把游標(biāo)向前推進(jìn)一個(gè)記錄,并把游標(biāo)指向的當(dāng)前記錄中的字段值取出,放到INTO子句后相應(yīng)的主變量中。FETCH語句常常用于循環(huán),以借助主語言功能逐一處理結(jié)果集中的數(shù)據(jù)。(4)關(guān)閉(CLOSE)游標(biāo)。關(guān)閉游標(biāo),使它不再和原來的查詢結(jié)果相聯(lián)系。關(guān)閉了的游標(biāo)可以再次被打開,與新的查詢結(jié)果集相聯(lián)系。使用CURRENT形式的UPDATE和刪除語句應(yīng)注意:(1)若游標(biāo)定義中的SELECT語句帶有UNION或ORDERBY子句,或者這個(gè)SELECT語句相當(dāng)于定義了一個(gè)不可更新的視圖,則不能用這兩個(gè)更新語句。(2)若使用CURRENT形式的UPDATE語句,則游標(biāo)定義中要包括FORUPDATE子句,指出更新的字段(SET子句中使用的字段)。因此,游標(biāo)定義語句的一般格式為:EXECSQLDECLARE游標(biāo)名CURSORFOR子查詢UNION子查詢…[FORUPDATEOF字段名[,字段名]…|ORDER-BY-子句];11.SQL的事務(wù)處理功能(1)事務(wù)處理的概述所謂事務(wù)(Transaction)是指一系列動作的組合,這些動作被當(dāng)作一個(gè)整體來處理。這些動作或者相繼都被執(zhí)行,或者什么也不做。在數(shù)據(jù)庫中,一個(gè)動作是指一個(gè)SQL語句。事務(wù)是一組SQL語句組成的一個(gè)邏輯單位。要么這些SQL語句全部被按順序正確執(zhí)行,要么在某SQL語句執(zhí)行失敗時(shí),按照用戶要求,取消已執(zhí)行的SQL語句對數(shù)據(jù)庫中數(shù)據(jù)的修改?;蛘咭词聞?wù)中SQL語句都被正確執(zhí)行,完成該事務(wù)對數(shù)據(jù)庫中數(shù)據(jù)的所有操作;或者要么相當(dāng)于一條SQL語句也未執(zhí)行,數(shù)據(jù)庫數(shù)據(jù)未做任何改動。(2)SQL語言的事務(wù)處理語句SQL語言有3條語句用于事務(wù)處理,它們是:(1)Commit語句,對于正確執(zhí)行了的事務(wù)進(jìn)行提交,進(jìn)行提交即對數(shù)據(jù)庫中數(shù)據(jù)的修改永久化。同時(shí)還釋放事務(wù)和封鎖,標(biāo)志該事務(wù)結(jié)束。(2)Savepoint語句,定義事務(wù)中的一個(gè)回滾保留點(diǎn),它是事務(wù)恢復(fù)時(shí)的一個(gè)標(biāo)記點(diǎn)。(3)rollback語句,無論事務(wù)執(zhí)行的當(dāng)前位置在哪里,該語句的執(zhí)行要么取消事務(wù)執(zhí)行以來對數(shù)據(jù)庫的全部修改,要么取消至某個(gè)指定回滾點(diǎn)后對數(shù)據(jù)庫的全部修改。釋放自保留點(diǎn)之后的全部表或行的封鎖(沒有保留點(diǎn),相當(dāng)于回滾到事務(wù)開始處,終止該事務(wù))。事務(wù)的恢復(fù)(回滾)是根據(jù)事務(wù)執(zhí)行前保存下的當(dāng)時(shí)數(shù)據(jù)庫狀態(tài)來實(shí)現(xiàn)的。一遇到rollback語句,就將數(shù)據(jù)庫中數(shù)據(jù)恢復(fù)到原來的狀態(tài),相當(dāng)于撤消事務(wù)中已執(zhí)行了的SQL語句。四、數(shù)據(jù)庫的存儲結(jié)構(gòu)數(shù)據(jù)庫的存儲結(jié)構(gòu)不同于一般文件系統(tǒng)的存儲結(jié)構(gòu)。數(shù)據(jù)庫數(shù)據(jù)的特點(diǎn)是各種記錄型之間彼此有聯(lián)系,數(shù)據(jù)是結(jié)構(gòu)化的。數(shù)據(jù)的存儲結(jié)構(gòu)不僅涉及每種記錄型的記錄如何存儲,而且要使數(shù)據(jù)的存儲反映各種記錄型之間的聯(lián)系。在DB多級模式中引入內(nèi)模式(存儲模式)的主要目的是使模式的數(shù)據(jù)結(jié)構(gòu)的描述同它的存儲表示的描述分開,以致DBA為了協(xié)調(diào)數(shù)據(jù)庫性能而對數(shù)據(jù)庫數(shù)據(jù)的存儲方法進(jìn)行修改時(shí),可不必修改模式,以提高數(shù)據(jù)庫的物理獨(dú)立性。在各個(gè)數(shù)據(jù)庫管理系統(tǒng)中,對內(nèi)模式的定義功能各不相同。在關(guān)系數(shù)據(jù)庫管理系統(tǒng)中有些DDL語句可影響數(shù)據(jù)庫的存儲結(jié)構(gòu)。在DBMS中各級模式的存儲結(jié)構(gòu)是恒定的或唯一的,而數(shù)據(jù)庫內(nèi)容(或其記錄)的存儲方式是不唯一的。數(shù)據(jù)庫存儲結(jié)構(gòu)設(shè)計(jì)的好壞直接影響系統(tǒng)的性能。在存儲結(jié)構(gòu)中主要是涉及存儲記錄的設(shè)計(jì)。存儲記錄與概念記錄之間具有對應(yīng)關(guān)系,如果存儲記錄與概念記錄之間具有一一對應(yīng)關(guān)系,在這種情況下存儲記錄的設(shè)計(jì)就比較簡單,不需要進(jìn)一步討論。概念記錄是指在邏輯結(jié)構(gòu)中的記錄。但當(dāng)一個(gè)概念記錄對應(yīng)多個(gè)不同類型的存儲記錄時(shí),存在如何設(shè)計(jì)存儲記錄的問題。對于這樣的概念記錄,其存儲記錄可以有以下幾種設(shè)計(jì):1.順序組織將存儲記錄設(shè)計(jì)成與概念記錄一一對應(yīng),按SNO大小(或按記錄到來)的順序?qū)⒂涗浗M成一個(gè)順序組織的文件。這樣組織的優(yōu)點(diǎn)是結(jié)構(gòu)簡單,缺點(diǎn)是會浪費(fèi)存儲空間。2.順序帶鏈的組織順序帶鏈組織允許記錄中帶有指針(Pointer),這樣可以大大節(jié)省存儲空間。3.帶次關(guān)鍵字索引的順序組織為了適應(yīng)對多項(xiàng)內(nèi)容的檢索,可以建立索引文件,上述組織可改為帶次關(guān)鍵字索引的順序組織。4.多表組織在次關(guān)鍵字索引中,由于一個(gè)次關(guān)鍵字值對應(yīng)于多個(gè)記錄值,它們的個(gè)數(shù)是不固定的,所以對應(yīng)的指針數(shù)目是可變的。這種可變性給管理帶來困難,為了解決這個(gè)困難,引入了多表組織。多表組織的實(shí)現(xiàn)思想比較簡單,在索引中多個(gè)指針分散存放在每個(gè)記錄值中,索引項(xiàng)中的指針指向第一個(gè)記錄,在第一個(gè)記錄中的指針指向第二個(gè)記錄等等。5.完全倒排組織在一個(gè)記錄型中,對主關(guān)鍵字以外的數(shù)據(jù)項(xiàng)都建立索引,這樣的組織稱之為完全倒排組織。6.Hash定址組織對于每一個(gè)存儲記錄值存放在數(shù)據(jù)庫的什么地方,可通過對該記錄的主關(guān)鍵字值的雜湊函數(shù)計(jì)算得出。這種組織為Hash定址組織。雜湊函數(shù)種類很多,如質(zhì)數(shù)除余法、基數(shù)轉(zhuǎn)換法、平方取中法、折疊法、位移法及各位數(shù)字分析法等等。關(guān)鍵是如何選擇一個(gè)雜湊函數(shù),盡可能避免發(fā)生碰撞。對于不同的主關(guān)鍵字值通過計(jì)算而得到同一個(gè)地址的映象,稱之為碰撞。7.聯(lián)系的存儲在關(guān)系數(shù)據(jù)庫中,通過外來關(guān)鍵字(ForeignKey)來表示概念記錄之間的聯(lián)系。例如,為了表達(dá)學(xué)生和學(xué)校的聯(lián)系,可以在學(xué)生記錄中增加外來關(guān)鍵字“學(xué)校號”來表示聯(lián)系。五、關(guān)系數(shù)據(jù)庫1.表格表格(或簡稱表)表示了用戶的特定類型(Type)的一些實(shí)體。表頭由一些屬性名(AttributeName)組成,每個(gè)屬性名對應(yīng)于一列。在表上屬性名必須唯一,不允許重名。表體是由一些行或元組(tuple)、或記錄(record)組成。一個(gè)元組對應(yīng)于傳統(tǒng)的文件結(jié)構(gòu)中的一個(gè)記錄,一個(gè)記錄含有若干個(gè)域(field)用以存儲屬性值(Attributevalue)。一個(gè)元組對應(yīng)于一個(gè)“用戶”實(shí)體的出現(xiàn)(occurrence)。表體中每一行和某一列的交叉點(diǎn)(相當(dāng)于記錄中的域)上保存一個(gè)屬性值。這個(gè)屬性值叫做這一行(或這個(gè)實(shí)體出現(xiàn))的相應(yīng)屬性值。表體中每一列可以保存的值對應(yīng)于某種屬性類型(TypeofAttribute),也就是說,這一列的屬性值只能取這個(gè)屬性類型的值。某個(gè)屬性所能取的所有值的集合叫做這個(gè)屬性的值域(DomainofAttribute)。類型和值域的對應(yīng)關(guān)系是一對多的。一個(gè)類型有一個(gè)值域,但一個(gè)值域可以作為多個(gè)類型,基名稱不同,但實(shí)質(zhì)上值域一樣。實(shí)際上,類型是對值域的命名。能唯一標(biāo)識一個(gè)元組的屬性稱之為關(guān)鍵屬性(PrimaryKeyAttribute)或簡稱為主關(guān)鍵字(PrimaryKey)。主關(guān)鍵字有時(shí)是由多個(gè)屬性組成的,此時(shí)的主關(guān)鍵字叫做組合關(guān)鍵字(ConˉcatenatedprimaryKey)。有的時(shí)候,表中必須由一些組合的主關(guān)鍵字才能唯一地標(biāo)識一個(gè)元組,也就是說,不存在能作關(guān)鍵字的一個(gè)屬性。這時(shí)為了方便,往往引入一個(gè)附加的屬性并稱之為外來關(guān)鍵字(ForeighKey)來作主關(guān)鍵字。外來關(guān)鍵字為以后檢索和查詢帶來了方便,但也增加了信息冗余。2.表名、表頭和表體表名、表頭和表體在關(guān)系模型中具有不同的作用或功能,因而也具有完全不同的性質(zhì)。表頭是一個(gè)屬性的集合,它規(guī)定了表的結(jié)構(gòu)。表體是一個(gè)特殊的集體,稱作為關(guān)系(relation)?!瓣P(guān)系模型”中的“關(guān)系”一詞就是指表體中的這個(gè)數(shù)學(xué)關(guān)系。在關(guān)系數(shù)據(jù)庫中,表名對應(yīng)于數(shù)據(jù)庫名(或關(guān)系名),表頭對應(yīng)于數(shù)據(jù)描述(或結(jié)構(gòu)描述),表體對應(yīng)于數(shù)據(jù)庫。表體是數(shù)據(jù)庫的內(nèi)容及數(shù)據(jù)庫操作的對象。另外,有兩個(gè)概念必須加以強(qiáng)調(diào):型(type)和值或出現(xiàn)(occurence)。表頭定義了實(shí)體(或元組)的型,也就是說規(guī)定了實(shí)體(或元組)的值域。而表體則給出了實(shí)體(或元組)的出現(xiàn)。出現(xiàn)是型中的一個(gè)值。3.關(guān)系的數(shù)學(xué)定義關(guān)系模型是建立在集合論(SetTheory)的基礎(chǔ)之上的?,F(xiàn)在,開始用集合論的術(shù)語來嚴(yán)格地定義數(shù)學(xué)上的關(guān)系,即給出關(guān)系的數(shù)學(xué)定義。定義1域(Domain)是值(value)的集合。4.關(guān)系模型關(guān)系模型由三部分組成:數(shù)據(jù)結(jié)構(gòu)(即關(guān)系)、關(guān)系操作、關(guān)系的完整性。下面將對這三個(gè)部分進(jìn)行分別的討論。(1)單一的數(shù)據(jù)結(jié)構(gòu)———關(guān)系在關(guān)系模型中,無論是實(shí)體還是實(shí)體之間的聯(lián)系均由單一的類型結(jié)構(gòu)—關(guān)系來表示。在前面,已給出了關(guān)系和域的數(shù)學(xué)定義,介紹了n元關(guān)系、元組和屬性等概念。下面介紹關(guān)鍵字、關(guān)系模式和關(guān)系數(shù)據(jù)庫等一些基本概念。關(guān)鍵字關(guān)系中的某一組屬性,若其值可以唯一地標(biāo)識一個(gè)元組,則稱該屬性組為一個(gè)候選關(guān)鍵字(CandidateKey)。若一個(gè)關(guān)系有多個(gè)候選關(guān)鍵字,則可以任選其中一個(gè)作為主關(guān)鍵字(PrimaryKey)。主關(guān)鍵字中的諸屬性被稱為主屬性。關(guān)系模式關(guān)系的描述稱為關(guān)系模式。它包括:關(guān)系名、組成關(guān)系的諸屬性名、屬性到域的映象、屬性間的數(shù)據(jù)依賴關(guān)系等等。所以,關(guān)系模式由關(guān)系名、諸屬性名和屬性到域的映象三個(gè)部分組成,關(guān)系模式通常簡記為R(A1,A2,…,An),其中R是關(guān)系名,A1,A2,…,An為諸屬性名。屬性到域的映象一般通過指定屬性的類型和長度來說明。某個(gè)關(guān)系模式在某一時(shí)刻所具有的狀態(tài)是指關(guān)系的外延,即元組的集合。關(guān)系的外延內(nèi)容有時(shí)簡稱為關(guān)系。但關(guān)系模式和關(guān)系的內(nèi)容有時(shí)也統(tǒng)稱為關(guān)系。讀者可以從上下文中區(qū)別其確切的含義。形象地說,關(guān)系模式是關(guān)于表名和表頭的描述,而關(guān)系的內(nèi)容是表體。關(guān)系數(shù)據(jù)庫在關(guān)系數(shù)據(jù)庫中,要分清型和值兩個(gè)基本概念。關(guān)系數(shù)據(jù)庫的型是指數(shù)據(jù)庫的結(jié)構(gòu)描述,它包括關(guān)系數(shù)據(jù)庫名、若干屬性的定義,以及這些屬性上的若干關(guān)系關(guān)系模式。亦稱為數(shù)據(jù)庫的內(nèi)涵(Intension),數(shù)據(jù)庫的值亦稱為數(shù)據(jù)庫的外延。在關(guān)系數(shù)據(jù)庫中,內(nèi)涵是比較穩(wěn)定的,它規(guī)定了外延的取值范圍。而外延卻是隨時(shí)間變化的。這和在一般的形式邏輯中外延和內(nèi)涵一一對應(yīng)有所區(qū)別。此處外延是指任意一個(gè)滿足內(nèi)涵的集合,而不一定恒指滿足內(nèi)涵的最大的一個(gè)集合。關(guān)系模式(即內(nèi)涵)是穩(wěn)定的;而關(guān)系的內(nèi)容,即外延,卻是隨時(shí)間動態(tài)的變化而變化的。數(shù)據(jù)庫的結(jié)構(gòu)(即模式)是穩(wěn)定的;而數(shù)據(jù)庫中的數(shù)據(jù)內(nèi)容卻在不斷地更新。(2)關(guān)系操作關(guān)系模型規(guī)定了關(guān)系操作的功能和特點(diǎn),但不對DBMS語言的語法做出具體的規(guī)定。關(guān)系數(shù)據(jù)庫語言的主要特點(diǎn)(或優(yōu)點(diǎn))是其高度的非過程化(Non-procedureae)或者說明性(declarative)。關(guān)系數(shù)據(jù)庫語言的語句是透明的。用戶只須知道語句做什么,而不須知道怎么做的。Codd在其早期的文章中,引入了8種基本的操作:并(Union)交(Intersection)差(Difference)笛卡爾乘積(CartesianProduct)限制(Restrictions)投影(Projection)連接(Join)除(Division)這些操作都是對關(guān)系的內(nèi)容或表體實(shí)施操作的,得到的結(jié)果仍為關(guān)系。注意,這些操作只是基本的操作,而不是不再可分的原始(Primitive)操作,例如,Join,Intersection和Division可以由其它五種操作合成。但是,把它們?nèi)齻€(gè)也作為基本操作使用起來很方便。另外,Codd并沒說上述8種操作就是關(guān)系數(shù)據(jù)庫只能有的8種操作。實(shí)際上,上述8種操作僅僅是作為最小的DML操作的基礎(chǔ)部分,并且也還未考慮到DDL的需求。SQL支持的操作多于上述8種DML操作,而且SQL還支持DDL操作。關(guān)系操作的特點(diǎn)是集合操作,即操作的對象和結(jié)果都是集合。這種操作方式也稱為一次一集合(set-at-a-time)方式。而非關(guān)系模型的數(shù)據(jù)庫的操作方式則為一次一記錄(record-at-a-time)方式。關(guān)系操作可以用兩種方式來表示:①代數(shù)方式,即關(guān)系代數(shù)②邏輯方式,即關(guān)系演算而關(guān)系演算又進(jìn)一步分為元組關(guān)系演算和域關(guān)系演算。已經(jīng)證明,這些表示方式在功能上是相互等價(jià)的。一般選其一即可。(3)關(guān)系模型的三類完整性關(guān)系模型的三類完整性是:①實(shí)體完整性(EntityIntegrity)②參照完整性(ReferentialIntegrity)③用戶定義的完整性(UserDefinedIntegrity)其中,實(shí)體完整性和參照完整性是任何關(guān)系模型都必須滿足的完整性約束條件,應(yīng)該由關(guān)系數(shù)據(jù)庫DBMS自動支持。而用戶定義的完整性的支持是由DBMS提供完整性定義設(shè)施(或機(jī)制),可以隨DBMS商品軟件不同而有所變化。實(shí)體完整性是指:若屬性A是基本關(guān)系R的主關(guān)鍵字的屬性(即主屬性),則屬性A不能取空值(NULL)。在關(guān)系數(shù)據(jù)庫中有各種關(guān)系,如基本關(guān)系(常稱為基本表)、查詢表、視圖表等等。基本表是指實(shí)際存在的表,它是實(shí)際存儲數(shù)據(jù)的邏輯表示。查詢表是指和查詢結(jié)果相對應(yīng)的表。而視圖表是由基本表或視圖表導(dǎo)出的表,是虛表,不對應(yīng)實(shí)際存儲的數(shù)據(jù)。實(shí)體完整性是針對基本關(guān)系的??罩凳侵浮安恢馈被蛘摺盁o意義的”或“不屬于定義域”值。空值以“NULL”表示。對于實(shí)體完整性作如下說明:(1)一個(gè)基本關(guān)系通常對應(yīng)于現(xiàn)實(shí)世界中的一個(gè)實(shí)體集。例如學(xué)生關(guān)系對應(yīng)于學(xué)生實(shí)體集。基本關(guān)系不是由其它關(guān)系生成的關(guān)系?;娟P(guān)系是本原(Primitive),是定義復(fù)雜關(guān)系的出發(fā)點(diǎn)。(2)現(xiàn)實(shí)世界中的實(shí)體是可區(qū)分的,即實(shí)體具有某種唯一性的標(biāo)識。(3)在關(guān)系模型中由主關(guān)鍵字作為滿足唯一性的標(biāo)識。(4)主關(guān)鍵字中屬性不能取空值。因?yàn)槿糁麝P(guān)鍵字中某屬性取空值,則意味著某個(gè)實(shí)體不可標(biāo)識;而這和(2)相矛盾。參照完整性是指:若基本關(guān)系R中含有另一個(gè)基本關(guān)系S的主關(guān)鍵字KS所對應(yīng)的屬性組F(F稱為R的外部關(guān)鍵字(externalkeys)),則在關(guān)系R中的每個(gè)元組中的F上的值必須滿足:①或者取空值(即F中的每個(gè)屬性的值均為空值);②或等于S中某個(gè)元組的主關(guān)鍵字的值?;娟P(guān)系R和S不一定是不同的關(guān)系。外部關(guān)鍵字也稱為外來關(guān)鍵字。例如,某數(shù)據(jù)庫中有職工關(guān)系EMP(職工號,姓名,部門號)和部門關(guān)系DEPT(部門號,部門名稱)為兩個(gè)基本關(guān)系。關(guān)系EMP的主關(guān)鍵字為“職工號”,DEPT的主關(guān)鍵字為“部門號”在EMP中,“部門號”是EMP的外部關(guān)鍵字。故此,在EMP中的每個(gè)元組中“部門號”的值只有兩種可能性:①取空值。這說明這個(gè)職工尚未分到某個(gè)部門;②或取非空值。這時(shí)“部門號”的值必須是DEPT中某個(gè)元組中的“部門號”的值。這說明一個(gè)職工不可能被分配到一個(gè)不存在的部門。也就是說,被參照的關(guān)系DEPT中一定存在一個(gè)元組,該元組的關(guān)鍵字的值等于EMP中某元組的外部關(guān)鍵字的值。實(shí)體完整性和參照完整性是針對任何關(guān)系數(shù)據(jù)庫系統(tǒng)的所有數(shù)據(jù)庫的一般性原則。用戶定義的完整性針對某一具體的數(shù)據(jù)庫的約束條件。條件是由現(xiàn)實(shí)世界中的應(yīng)用環(huán)境決定的。它涉及到某一具體的應(yīng)用中的數(shù)據(jù)所必須滿足的語義要求。關(guān)型模型的DBMS應(yīng)提供定義和檢驗(yàn)這類完整性條件的機(jī)制,以使用統(tǒng)一的方法來自動地處理它們而不要求應(yīng)用程序員來承擔(dān)這一功能。5.關(guān)系數(shù)據(jù)庫語言概述關(guān)系數(shù)據(jù)庫語言分三類:數(shù)據(jù)描述語言DDL,數(shù)據(jù)操縱語言DML和數(shù)據(jù)控制語言DCL。其中,DDL負(fù)責(zé)數(shù)據(jù)庫的描述,提供一種數(shù)據(jù)描述機(jī)制,用來描述數(shù)據(jù)庫的特征或數(shù)據(jù)的邏輯結(jié)構(gòu)。DML負(fù)責(zé)數(shù)據(jù)庫的操作,提供一種處理數(shù)據(jù)庫操作的機(jī)制。DCL負(fù)責(zé)控制數(shù)據(jù)庫的完整性和安全性,提供一種檢驗(yàn)完整性和保證安全的機(jī)制。DML是用戶經(jīng)常使用的語言,包括了DBMS的主要功能。DML包括數(shù)據(jù)查詢和數(shù)據(jù)的增、刪、改等功能。其中查詢的表達(dá)方式是DML的主要部分。關(guān)系數(shù)據(jù)庫的DML按照查詢方式可以分為兩大類:(1)用對關(guān)系的集合代數(shù)運(yùn)算來表示查詢的方式,稱為關(guān)系代數(shù)(RelationalAlgebra)。(2)用謂詞演算來表達(dá)查詢的方式,稱為關(guān)系演算(RelationalCalculus)。關(guān)系演算又可按謂詞變元的基本對象是元組變量(tuplevariable)還是域變量(domainvariable)分為元組關(guān)系演算和域關(guān)系演算兩種。關(guān)系代數(shù)和兩種關(guān)系演算均是抽象的查詢語言,這些抽象的查詢語言和實(shí)際的DBMS軟件產(chǎn)品中實(shí)現(xiàn)的具體的查詢語言并不完全一樣。但它們是DBMS中查詢語言的理論基礎(chǔ)。關(guān)系代數(shù)、元組關(guān)系演算和域關(guān)系演算這三種語言在表達(dá)能力上是彼此相互等價(jià)的,它們均可以作為評價(jià)實(shí)際DBMS軟件產(chǎn)品中查詢語言能力的標(biāo)準(zhǔn)。實(shí)際DBMS軟件產(chǎn)品的查詢語言,除了提供關(guān)系代數(shù)(或一種關(guān)系演算)之外,還提供了許多附加的功能,如庫函數(shù)、算術(shù)運(yùn)算等功能。SQL是介于關(guān)系代數(shù),和關(guān)系演算之間的一種語言。SQL不僅具有豐富的查詢功能,而且還具有數(shù)據(jù)庫定義和數(shù)據(jù)庫控制功能。SQL是集DDL、DML、DCL為一體的標(biāo)準(zhǔn)的關(guān)系數(shù)據(jù)庫語言。SQL充分體現(xiàn)了關(guān)系數(shù)據(jù)庫語言的優(yōu)點(diǎn)。6.關(guān)系代數(shù)關(guān)系代數(shù)中的運(yùn)算可以分為兩類:(1)傳統(tǒng)的集合運(yùn)算,如并、交、差、笛卡爾乘積等。這類運(yùn)算是從關(guān)系的“水平方向(即按行)”來進(jìn)行的。(2)專門的關(guān)系運(yùn)算,如選擇、投影、連接、除。這類運(yùn)算不僅涉及到行而且也涉及到列。7.關(guān)系演算關(guān)系演算是以數(shù)理邏輯中的謂詞演算為基礎(chǔ)的。用謂詞演算作為關(guān)系數(shù)據(jù)庫的語言并提出關(guān)系演算的是E.F.Codd。Codd首先定義了關(guān)系演算語言ALPHA。但ALPHA并沒有在計(jì)算機(jī)上實(shí)現(xiàn)。但關(guān)系數(shù)據(jù)庫管理系統(tǒng)INGRES所用的QUEL語言是參考ALPHA研制的,與ALPHA十分類似。六、關(guān)系數(shù)據(jù)庫的規(guī)范化理論函數(shù)依賴定義1設(shè)R(U)是屬性集U上的關(guān)系模式。X,Y是U的子集。若對于R(U)的任意一個(gè)可能的關(guān)系r,r中不可能存在兩個(gè)元組在X上的屬性值相等,而在Y上的屬性值不等,則稱‘X函數(shù)確定Y’或‘Y函數(shù)依賴于X’,記作X→Y。函數(shù)依賴和別的數(shù)據(jù)依賴一樣是語義范疇的概念。只能根據(jù)語義來確定一個(gè)函數(shù)依賴。例如姓名→年齡這個(gè)函數(shù)依賴只有在沒有同名人的條件下成立。如果允許有相同名字,則年齡就不再函數(shù)依賴于姓名了。設(shè)計(jì)者也可以對現(xiàn)實(shí)世界作強(qiáng)制的規(guī)定。例如規(guī)定不允許同名人出現(xiàn),因而使姓名→年齡函數(shù)依賴成立。這樣當(dāng)插入某個(gè)元組時(shí)這個(gè)元組上的屬性值必須滿足規(guī)定的函數(shù)依賴,若發(fā)現(xiàn)有同名人存在,則拒絕插入該元組。注意,函數(shù)依賴不是指關(guān)系模式R的某個(gè)或某些關(guān)系滿足的約束條件,而是指R的一切關(guān)系均要滿足的約束條件七、數(shù)據(jù)庫的安全與保護(hù)1.安全性數(shù)據(jù)庫的安全性是指保護(hù)數(shù)據(jù)庫以防止不合法的或非正常的使用所造成的數(shù)據(jù)泄露、更改或破壞。安全性問題不是數(shù)據(jù)庫系統(tǒng)所獨(dú)有的,計(jì)算機(jī)系統(tǒng)都有這個(gè)問題。只是在數(shù)據(jù)庫系統(tǒng)中大量數(shù)據(jù)集中存放,而且為許多用戶直接共享,是十分重要的信息資源。從而使安全性問題變得更為突出。系統(tǒng)安全保護(hù)措施是否有效是數(shù)據(jù)庫系統(tǒng)的主要性能指標(biāo)之一。對于數(shù)據(jù)庫的安全保密方式可以有系統(tǒng)處理的和物理的兩個(gè)方面。所謂物理的是指,對于強(qiáng)力逼迫透露口令、在通信線路上竊聽、以至盜竊物理存儲設(shè)備等行為。對此所采取的措施是將數(shù)據(jù)編為密碼,加強(qiáng)警衛(wèi)以識別用戶身份和保護(hù)存儲設(shè)備等措施。在一般計(jì)算機(jī)系統(tǒng)中,安全措施是一級一級層層設(shè)置的。(1)用戶標(biāo)識和鑒定首先,系統(tǒng)提供一定的方式讓用戶標(biāo)識自己的名字或身份。系統(tǒng)進(jìn)行核實(shí),通過鑒定后才提供機(jī)器使用權(quán)。常用的方法有:用一個(gè)用戶名或者用戶標(biāo)識號來標(biāo)明用戶身份。系統(tǒng)鑒別此用戶是否是合法用戶。若是,則可以進(jìn)入下一步的核實(shí);若不是,則不能使用計(jì)算機(jī)。用戶名的登錄只由系統(tǒng)管理員進(jìn)行,一般用戶不能實(shí)施用戶名登錄??诹?Password),為了進(jìn)一步核實(shí)用戶,系統(tǒng)常常要求用戶輸入口令。(2)存取控制對于獲得上機(jī)權(quán)的用戶還要根據(jù)預(yù)先定義好的用戶權(quán)限進(jìn)行存取控制,保證用戶只能存取他有權(quán)存取的數(shù)據(jù)。所謂用戶權(quán)限是指不同的用戶對于不同的數(shù)據(jù)對象允許執(zhí)行的操作權(quán)限。它由兩部分組成,一是數(shù)據(jù)對象,二是操作類型。數(shù)據(jù)對象有二類。一類是數(shù)據(jù)本身,如關(guān)系數(shù)據(jù)庫中的表、字段,非關(guān)系數(shù)據(jù)庫中的記錄、字段(亦稱為數(shù)據(jù)項(xiàng))。另一類是外模式、模式、內(nèi)模式。在關(guān)系系統(tǒng)中DBA可以把建立、修改基本表的權(quán)力授予用戶,用戶獲得此權(quán)力后可以建立基本表、索引、視圖。這說明關(guān)系系統(tǒng)中存取控制的數(shù)據(jù)對象不僅有數(shù)據(jù)而且有模式、外模式、內(nèi)模式等數(shù)據(jù)字典中的內(nèi)容。對于存取權(quán)限的定義稱為授權(quán)(Authorization)。這些定義經(jīng)過編譯后存儲在數(shù)據(jù)字典中。每當(dāng)用戶發(fā)出存取數(shù)據(jù)庫的操作請求后,DBMS查找數(shù)據(jù)字典,根據(jù)用戶權(quán)限進(jìn)行合法權(quán)限檢查(AuthorizationCheck)。若用戶的操作請求超出了定義的權(quán)限,系統(tǒng)拒絕執(zhí)行此操作。授權(quán)編譯程序和合法權(quán)限檢查機(jī)制一起組成了安全性子系統(tǒng)。衡量授權(quán)子系統(tǒng)精巧程度的另一個(gè)盡度是否提供與數(shù)據(jù)值有關(guān)的授權(quán)。有的系統(tǒng)還允許存取謂詞中引用系統(tǒng)變量,如一天中的時(shí)刻,終端設(shè)備號。這樣用戶只能在某臺終端、某段時(shí)間內(nèi)存取有關(guān)數(shù)據(jù),這就是與時(shí)間和地點(diǎn)有關(guān)的存取權(quán)限。另外,在操作系統(tǒng)中對文件、目標(biāo)等的存取還有一些安全保護(hù)措施。其中加密是一種防止數(shù)據(jù)內(nèi)容被別人引用或了解的切實(shí)可行的辦法。加密有程序加密和硬件加密卡兩種形式。2.完整性數(shù)據(jù)庫的完整性是指數(shù)據(jù)的正確性和相容性。DBMS必須提供一種功能來保證數(shù)據(jù)庫中數(shù)據(jù)的完整性。這種功能亦稱為完整性檢查,即系統(tǒng)用一定的機(jī)制來檢查數(shù)據(jù)庫中的數(shù)據(jù)是否滿足規(guī)定的條件。這種條件在數(shù)據(jù)庫中稱為完整性約束條件。數(shù)據(jù)的約束條件是語義的體現(xiàn),這些完整性約束條件將作為模式的一部分存放數(shù)據(jù)字典中。數(shù)據(jù)的完整性和安全性是兩個(gè)不同的概念。前者是為了防止數(shù)據(jù)庫中存在不符合語義的數(shù)據(jù),防止錯(cuò)誤信息的輸入和輸出,即所謂垃圾進(jìn)垃圾出(GarbageInGarbageOut)所造成的無效操作和錯(cuò)誤結(jié)果。而后者是保護(hù)數(shù)據(jù)庫防止惡意的破壞和非法的存取。當(dāng)然,完整性和安全性是密切相關(guān)的。特別從系統(tǒng)實(shí)現(xiàn)的方法來看,往往是一種機(jī)制常常既可用于安全性保護(hù)亦可用于完整性保證。完整性約束條件可以分類如下:(1)值的約束和結(jié)構(gòu)的約束前者指對數(shù)據(jù)的值的限制,后者指對數(shù)據(jù)之間聯(lián)系的限制。關(guān)于對數(shù)據(jù)值的約束這類約束條件是指對數(shù)據(jù)取值類型、范圍、精度等的規(guī)定。關(guān)于數(shù)據(jù)之間聯(lián)系的約束數(shù)據(jù)庫中同一關(guān)系的不同屬性之間可以有一定的聯(lián)系,從而也應(yīng)滿足一定的約束條件。同時(shí),由于數(shù)據(jù)庫中數(shù)據(jù)是結(jié)構(gòu)化的,不同的關(guān)系之間也可以有聯(lián)系,因而不同關(guān)系的屬性之間也可滿足一定的約束條件。(2)靜態(tài)約束和動態(tài)約束所謂靜態(tài)約束是指對數(shù)據(jù)庫每一確定狀態(tài)的數(shù)據(jù)所應(yīng)滿足的約束條件。以上所講的約束都屬靜態(tài)約束。動態(tài)約束是指數(shù)據(jù)庫從一種狀態(tài)轉(zhuǎn)變?yōu)榱硪环N狀態(tài)時(shí)新、舊值之間所應(yīng)滿足的約束條件。(3)立即執(zhí)行約束和延遲執(zhí)行約束立即執(zhí)行約束是指在執(zhí)行用戶事務(wù)時(shí),對事務(wù)中某一更新語句執(zhí)行完后馬上對此數(shù)據(jù)所應(yīng)滿足的約束條件進(jìn)行完整性檢查。延遲執(zhí)行是指在整個(gè)事務(wù)執(zhí)行結(jié)束后方對此約束條件進(jìn)行完整性檢查,結(jié)果正確方能提交。完整性的實(shí)現(xiàn)應(yīng)包括兩個(gè)方面,一是系統(tǒng)要提供定義完整性約束條件的功能,二是提供檢查完整性約束條件的方法。對于數(shù)據(jù)值的那類完整性約束條件通常在模式中定義。例如在模式中定義屬性名、類型、長度、碼屬性名并標(biāo)明其值是唯一的、非空的等等。另外的那些約束條件就要用專門的方式加以定義。3.并發(fā)控制數(shù)據(jù)庫是一個(gè)共享資源,可以由多個(gè)用戶使用。這些用戶程序可以一個(gè)一個(gè)地串行執(zhí)行,也可以并行執(zhí)行。在單CPU計(jì)算機(jī)上,為了充分利用數(shù)據(jù)庫資源,應(yīng)該允許多個(gè)用戶程序并行的存取數(shù)據(jù)。這樣就會產(chǎn)生多個(gè)用戶程度并發(fā)地存取同一數(shù)據(jù)的情況。若對并發(fā)操作不加控制就會存取和存儲不正確的數(shù)據(jù),破壞數(shù)據(jù)庫的完整性(這里也稱為一致性)。在多CPU計(jì)算機(jī)或多計(jì)算機(jī)網(wǎng)絡(luò)環(huán)境下,并發(fā)控制尤為重要。(1)事務(wù)的概念事務(wù)(Transaction)是并發(fā)控制的基本單位。所謂事務(wù)是一個(gè)操作序列。這些操作作為一個(gè)序列形成一個(gè)整體要么都做,要么都不做,是一個(gè)不可分割的工作單位。事務(wù)通常以BEGINTRANSACTION開始,以COMMIT或ROLLBACK操作結(jié)束。COMMIT即提交,提交事務(wù)中所有的操作,事務(wù)正常結(jié)束。ROLLBACK即撤消已作的所有操作,滾回到事務(wù)開始時(shí)的狀態(tài)。這里的操作指對數(shù)據(jù)庫的更新操作。滾回即相當(dāng)于所有操作均未執(zhí)行。事務(wù)和程序是兩個(gè)概念。一般地講,一個(gè)程序可包括多個(gè)事務(wù),由于事務(wù)是并發(fā)控制的基本單位,所以下面的討論均以事務(wù)為對象。(2)數(shù)據(jù)一致性級別的概念。所謂并發(fā)控制就是要用正確的方式調(diào)度并發(fā)操作,避免造成數(shù)據(jù)的不一致性,使一個(gè)用戶事務(wù)的執(zhí)行不受其它事務(wù)的干擾。4.封鎖封鎖(Locking)就是事務(wù)T可以向系統(tǒng)發(fā)出請求,對某個(gè)數(shù)據(jù)對象(最常用的是記錄)加鎖。于是事務(wù)T對這個(gè)數(shù)據(jù)對象就有一定的控制。例如,其它事務(wù)不能更新此數(shù)據(jù)直到T釋放(unlock)它的鎖為止。確切的控制由封鎖的類型決定?;镜姆怄i類型有兩種:排它鎖(Exclusivelocks簡記為X鎖)和共享鎖(Sharelocks簡記為S鎖)。若事務(wù)T對數(shù)據(jù)R加上X鎖,則只允許T讀取和修改R;其它一切事務(wù)對R的任何(包括封鎖)請求都不成功,直至T釋放R上的X鎖為止。這就保證了其它事務(wù)不能再讀取和修改R,直到T釋放X鎖。若事務(wù)T對數(shù)據(jù)R加上S鎖,則其它事務(wù)對R的X鎖請求不能成功,而對R的共享請求可以得到。這就保證了其它事務(wù)以讀取R但不能修改R,直至T釋放S鎖為止。5.可串行性定義當(dāng)且僅當(dāng)某組事務(wù)的一定交叉調(diào)度產(chǎn)生的結(jié)果和這些事務(wù)的某一串行調(diào)度的結(jié)果相同,則這個(gè)交叉調(diào)度是可串行化的??纱行?Serializability)是并行事務(wù)正確性的準(zhǔn)則。這個(gè)準(zhǔn)則規(guī)定,一給定的交叉調(diào)度,當(dāng)且僅當(dāng)它是可串行化的,才認(rèn)為是正確的。6.兩段鎖協(xié)議兩段鎖協(xié)議規(guī)定所有的事務(wù)應(yīng)遵守下列規(guī)則:(1)在對任何數(shù)據(jù)進(jìn)行讀、寫操作之前,事務(wù)首先要獲得對該數(shù)據(jù)的封鎖,而且:(2)在釋放一個(gè)封鎖之后,事務(wù)不再獲得任何其它鎖。所謂“兩段”鎖的含義是:事務(wù)分為兩個(gè)階段。第一階段是獲得封鎖,也稱為擴(kuò)展階段。第二階段是釋放封鎖,也稱為收縮階段。定理若所有事務(wù)均遵守兩段鎖協(xié)議,則這些事務(wù)的所有交叉調(diào)度都是可串行化的(證明略)。為了確保事務(wù)并行執(zhí)行的正確性,許多系統(tǒng)采用兩段鎖協(xié)議。同時(shí)系統(tǒng)設(shè)有死鎖檢測機(jī)制,發(fā)現(xiàn)死鎖后按一定的算法解除死鎖。7.恢復(fù)盡管系統(tǒng)中采取了各種保護(hù)措施來保證數(shù)據(jù)庫的安全性和完整性不被破壞,保證并行事務(wù)的正確執(zhí)行,但是計(jì)算機(jī)系統(tǒng)中硬件的故障、軟件的錯(cuò)誤、操作員的失誤以及故意的破壞仍是不可避免的。這些故障輕則造成運(yùn)行事務(wù)非正常地中斷,影響數(shù)據(jù)庫中數(shù)據(jù)的正確性,重則破壞數(shù)據(jù)庫,使數(shù)據(jù)庫中全部或部分?jǐn)?shù)據(jù)丟失。因此數(shù)據(jù)庫管理系統(tǒng)必須具有把數(shù)擾庫從錯(cuò)誤狀態(tài)恢復(fù)到某一已知的正確狀態(tài)(亦稱為完整狀態(tài)或一致狀態(tài))的功能,這就是數(shù)據(jù)庫的恢復(fù)。恢復(fù)子系統(tǒng)是數(shù)據(jù)庫管理系統(tǒng)的一個(gè)重要組成部分,而且還相當(dāng)龐大,常常占整個(gè)系統(tǒng)代碼的10%以上(如IMS,DB2)。故障恢復(fù)是否考慮周到和行之有效,是數(shù)據(jù)庫系統(tǒng)性能的一個(gè)重要指標(biāo)。大型的數(shù)據(jù)庫應(yīng)用對故障恢復(fù)的要求更加強(qiáng)烈。有時(shí)甚至采用雙工制。(1)故障的種類數(shù)據(jù)庫系統(tǒng)中可能發(fā)生各種各樣的故障,大致可以分以下幾類:①事務(wù)內(nèi)部的故障;②系統(tǒng)范圍內(nèi)的故障;③介質(zhì)故障;④計(jì)算機(jī)病毒。(2)轉(zhuǎn)儲和恢復(fù)轉(zhuǎn)儲是數(shù)據(jù)庫恢復(fù)中經(jīng)常采用的基本技術(shù)。所謂轉(zhuǎn)儲即DBA定期地將整個(gè)數(shù)據(jù)庫復(fù)制到磁帶或另一個(gè)磁盤上保存起來的過程。這些備用的數(shù)據(jù)文本為后備副本或后援副本。當(dāng)數(shù)據(jù)庫遭到破壞后就可以利用后備副本把數(shù)據(jù)庫恢復(fù)。這時(shí),數(shù)據(jù)庫只能恢復(fù)到轉(zhuǎn)儲時(shí)的狀態(tài),從那以后的所有更新事務(wù)必須重新運(yùn)行才能恢復(fù)到現(xiàn)時(shí)的正常狀態(tài)。轉(zhuǎn)儲是十分耗費(fèi)時(shí)間和資源的,不能頻繁進(jìn)行。DBA應(yīng)該根據(jù)數(shù)據(jù)庫使用情況確定一個(gè)適當(dāng)?shù)霓D(zhuǎn)儲周期。轉(zhuǎn)儲可分為靜態(tài)轉(zhuǎn)儲和動態(tài)轉(zhuǎn)儲。靜態(tài)轉(zhuǎn)儲是指轉(zhuǎn)儲期間不允許(或不存在)對數(shù)據(jù)庫進(jìn)行任何存取、修改活動。動態(tài)轉(zhuǎn)儲是指轉(zhuǎn)儲期間允許對數(shù)據(jù)庫進(jìn)行存取或修改。即轉(zhuǎn)儲和用戶事務(wù)可以并發(fā)執(zhí)行。靜態(tài)轉(zhuǎn)儲簡單,但轉(zhuǎn)儲必須等待用戶事務(wù)結(jié)束才能進(jìn)行。同樣,新的事務(wù)必須等待轉(zhuǎn)儲結(jié)束才能執(zhí)行。顯然,這會降低數(shù)據(jù)庫的可用性。動態(tài)轉(zhuǎn)儲可克服靜態(tài)轉(zhuǎn)儲的缺點(diǎn)。但是,轉(zhuǎn)儲結(jié)束時(shí)后援副本上的數(shù)據(jù)并不能保證正確有效。例如,在轉(zhuǎn)儲期間的某時(shí)刻t1系統(tǒng)把數(shù)據(jù)A=100轉(zhuǎn)儲到了磁帶上,而在時(shí)刻t2,某一事務(wù)對A進(jìn)行了修改使A=200轉(zhuǎn)儲結(jié)束,后援副本上的A已是過時(shí)的數(shù)據(jù)了。為此,必須把轉(zhuǎn)儲期間事務(wù)對數(shù)據(jù)庫的修改活動登記下來,建立日志文件(logfile)。這樣,后援副本加上日志文件就能把數(shù)據(jù)庫恢復(fù)到某一時(shí)刻的正確狀態(tài)。轉(zhuǎn)儲還可以分為海量轉(zhuǎn)儲和增量轉(zhuǎn)儲。海量轉(zhuǎn)儲是指每次轉(zhuǎn)儲全部數(shù)據(jù)庫。增量轉(zhuǎn)儲則指每次只轉(zhuǎn)儲上次轉(zhuǎn)儲后更新過的數(shù)據(jù)。如果數(shù)據(jù)庫很大,事務(wù)處理又十分頻繁,則增量轉(zhuǎn)儲方式是很有效的。(3)日志文件日志文件是用來記錄對數(shù)據(jù)庫每一次更新活動的文件。在動態(tài)轉(zhuǎn)儲方式中必須建立日志文件,后援副本和日志文件綜合起來才能有效地恢復(fù)數(shù)據(jù)庫。在靜態(tài)轉(zhuǎn)儲方式中,也可以建立日志文件。當(dāng)數(shù)據(jù)庫毀壞后可重新裝放后援副本把數(shù)據(jù)庫恢復(fù)到轉(zhuǎn)儲結(jié)束時(shí)刻的正確狀態(tài),然后利用日志文件,把已完成的事務(wù)進(jìn)行重做處理,對故障發(fā)生時(shí)尚未完成的事務(wù)進(jìn)行撤消處理。這樣不必重新運(yùn)行那些在轉(zhuǎn)儲前已完成的事務(wù)程序就可把數(shù)據(jù)庫恢復(fù)到故障前某一時(shí)刻的正確狀態(tài)。八、數(shù)據(jù)庫應(yīng)用系統(tǒng)的設(shè)計(jì)1.數(shù)據(jù)庫應(yīng)用系統(tǒng)的設(shè)計(jì)步驟按規(guī)范設(shè)計(jì)的方法可將數(shù)據(jù)庫設(shè)計(jì)分為以下六個(gè)階段(1)需求分析;(2)概念結(jié)構(gòu)設(shè)計(jì);(3)邏輯結(jié)構(gòu)設(shè)計(jì);(4)數(shù)據(jù)庫物理設(shè)計(jì);(5)數(shù)據(jù)庫實(shí)施;(6)數(shù)據(jù)庫運(yùn)行和維護(hù)。2.需求分析需求收集和分析是數(shù)據(jù)庫應(yīng)用系統(tǒng)設(shè)計(jì)的第一階段。明確地把它作為數(shù)據(jù)庫應(yīng)用系統(tǒng)設(shè)計(jì)的第一步是十分重要的。這一階段收集到的基礎(chǔ)數(shù)據(jù)和一組數(shù)據(jù)流圖(DataFlowDiaˉgram———DFD)是下一步設(shè)計(jì)概念結(jié)構(gòu)的基礎(chǔ)。概念結(jié)構(gòu)對整個(gè)數(shù)據(jù)庫設(shè)計(jì)具有深刻影響。而要設(shè)計(jì)好概念結(jié)構(gòu),就必須在需求分析階段用系統(tǒng)的觀點(diǎn)來考慮問題、收集和分析數(shù)據(jù)及其處理。如何分析和表達(dá)用戶需求呢?在眾多的分析方法中,結(jié)構(gòu)化分析(StructuredAnalysis,簡稱SA方法)是一個(gè)簡單實(shí)用的方法。SA方法用自頂向下、逐層分解的方式分析系統(tǒng)。用數(shù)據(jù)流圖,數(shù)據(jù)字典描述系統(tǒng)。然后把一個(gè)處理功能的具體內(nèi)容分解為若干子功能,每個(gè)子功能繼續(xù)分解,直到把系統(tǒng)的工作過程表達(dá)清楚為止。在處理功能逐步分解的同時(shí),它們所用的數(shù)據(jù)也逐級分解。形成若干層次的數(shù)據(jù)流圖。數(shù)據(jù)流圖表達(dá)了數(shù)據(jù)和處理過程的關(guān)系。處理過程的處理邏輯常常用判定表或判定樹來描述。數(shù)據(jù)字典(DataDictionary,簡稱DD)則是對系統(tǒng)中數(shù)據(jù)的詳盡描述,是各類數(shù)據(jù)屬性的清單。對數(shù)據(jù)庫應(yīng)用系統(tǒng)設(shè)計(jì)來講,數(shù)據(jù)字典是進(jìn)行詳細(xì)的數(shù)據(jù)收集和數(shù)據(jù)分析所獲得的主要結(jié)果。數(shù)據(jù)字典是各類數(shù)據(jù)描述的集合,它通常包括以下5個(gè)部分:(1)數(shù)據(jù)項(xiàng),是數(shù)據(jù)最小單位。(2)數(shù)據(jù)結(jié)構(gòu),是若干數(shù)據(jù)項(xiàng)有意義的集合。(3)數(shù)據(jù)流,可以是數(shù)據(jù)項(xiàng),也可以是數(shù)據(jù)結(jié)構(gòu)。表示某一處理過程的輸入輸出。(4)數(shù)據(jù)存儲,處理過程中存取的數(shù)據(jù)。常常是手工憑證、手工文檔或計(jì)算機(jī)文件。(5)處理過程。3.概念結(jié)構(gòu)設(shè)計(jì)如同軟件工程中重視需求分析與規(guī)范說明的思想一樣,數(shù)據(jù)庫設(shè)計(jì)中同樣十分重視數(shù)據(jù)分析、抽象與概念結(jié)構(gòu)的設(shè)計(jì)。概念結(jié)構(gòu)的設(shè)計(jì),是整個(gè)數(shù)據(jù)庫設(shè)計(jì)的關(guān)鍵之一。概念結(jié)構(gòu)獨(dú)立于數(shù)據(jù)庫邏輯結(jié)構(gòu),獨(dú)立于支持?jǐn)?shù)據(jù)庫的DBMS,也獨(dú)立于具體計(jì)算機(jī)軟件和硬件系統(tǒng)。歸納總結(jié),其主要特點(diǎn)是:(1)能充分地反映現(xiàn)實(shí)世界,包括實(shí)體和實(shí)體之間的聯(lián)系,能滿足用戶對數(shù)據(jù)處理的要求,是現(xiàn)實(shí)世界的一個(gè)真實(shí)的模型,或接近真實(shí)的模型。(2)易于理解,從而可以和不熟悉計(jì)算機(jī)的用戶交換意見。用戶的積極參與是數(shù)據(jù)庫應(yīng)用系統(tǒng)設(shè)計(jì)成功與否的關(guān)鍵。(3)易于更動。當(dāng)現(xiàn)實(shí)世界改變時(shí)容易修改和擴(kuò)充,特別是軟件、硬件環(huán)境變化時(shí)更應(yīng)如此。(4)易于向關(guān)系、網(wǎng)狀或?qū)哟蔚雀鞣N數(shù)據(jù)模型轉(zhuǎn)換。概念結(jié)構(gòu)是各種數(shù)據(jù)模型的共同基礎(chǔ),它比任意一種數(shù)據(jù)模型更獨(dú)立于機(jī)器,更抽象,從而更加穩(wěn)定。描述概念結(jié)構(gòu)的有力工具是E-R模型。P.P.S.Chen把用E-R模型定義的概念結(jié)構(gòu)稱為組織模式。設(shè)計(jì)概念結(jié)構(gòu)的策略有3種:(1)自頂向下首先定義全局概念結(jié)構(gòu)的框架,然后逐步細(xì)化。(2)自底向上首先定義各局部應(yīng)用的概念結(jié)構(gòu),然后將它們集成,得到全局概念結(jié)構(gòu)。(3)混合策略自頂向下和自底向上相結(jié)合的方法。用自頂向下策略設(shè)計(jì)一個(gè)全局概念結(jié)構(gòu)的框架,以它為骨架集成由自底向上策略中設(shè)計(jì)的各局部概念結(jié)構(gòu)?,F(xiàn)介紹自底向上設(shè)計(jì)概念結(jié)構(gòu)的策略。按照這種策略,概念結(jié)構(gòu)的設(shè)計(jì)可按下面步驟進(jìn)行。(1)數(shù)據(jù)抽象與局部視圖設(shè)計(jì)E-R模型是對現(xiàn)實(shí)世界的一種抽象。一般地講,所謂抽象是對實(shí)際的人、物、事和概念的人為處理。它抽取人們關(guān)心的共同特性,忽略非本質(zhì)的細(xì)節(jié),并把這些特性用各種抽象的概念精確地加以描述。這些概念組成了現(xiàn)實(shí)世界的一種模型表示。有3種抽象方法形成了抽象機(jī)制,來對數(shù)據(jù)進(jìn)行組織:①分類(Classification)定義某一概念作為現(xiàn)實(shí)世界中一組對象的類型。這些對象具有某些共同的特性和行為。它抽象了對象值和型之間的“isamemberof”的語義。在E-R模型中,實(shí)體型就是這種抽象。②聚集(Aggregation)定義某一類型的組成成分。它抽象了對象內(nèi)部屬性類型和整體與部分之間“isapartof”的語義。在E-R模型中若干屬性的聚集組成了實(shí)體型,就是這種抽象。③概括(Generalization)定義類型之間的一種子集聯(lián)系。它抽象了類型之間的“isasubsetof”的語義。概括具有一個(gè)很重要的性質(zhì):繼承性。子類繼承超類上定義的所有抽象性質(zhì)。當(dāng)然,子類可以增加自己的某些特殊屬性。概念結(jié)構(gòu)設(shè)計(jì)的第一步就是利用上面介紹的抽象機(jī)制對需求分析階段收集到的數(shù)據(jù)進(jìn)行組織,形成實(shí)體、實(shí)體的屬性,標(biāo)識實(shí)體的碼,確定實(shí)體之間的聯(lián)系類型(1∶1,1∶n,n∶m),設(shè)計(jì)成部分E-R圖。(2)視圖的集成視圖集成就是把上一步得到的各個(gè)部分E-R圖綜合成一個(gè)總體的E-R圖。視圖集成可以有兩種方式:①多個(gè)部分E-R圖一次集成。②逐步集成。用累加的方式一次集成兩個(gè)部分E-R圖。無論哪種方式,每次集成可分兩步走。第一步是合并,解決各部分E-R圖之間的沖突問題,生成初步E-R圖。第二步是修改和重構(gòu),消除不必要的冗余,生成基本E-R圖。4.邏輯結(jié)構(gòu)設(shè)計(jì)邏輯結(jié)構(gòu)設(shè)計(jì)的任務(wù)就是把概念結(jié)構(gòu)轉(zhuǎn)換為選用的DBMS所支持的數(shù)據(jù)模型的過程。設(shè)計(jì)邏輯結(jié)構(gòu)按理應(yīng)選擇對某個(gè)概念結(jié)構(gòu)最好的數(shù)據(jù)模型,然后對支持這種數(shù)據(jù)模型的各種DBMS進(jìn)行比較,選出最合適的DBMS。但實(shí)際情況常常是已給定了某臺機(jī)器,設(shè)計(jì)人員沒有選擇DBMS的余地。現(xiàn)行的DBMS一般只支持關(guān)系、網(wǎng)狀或?qū)哟稳N模型中的某一種,對某一種數(shù)據(jù)模型,各個(gè)機(jī)器系統(tǒng)又有許多不同的限制,提供不同的環(huán)境與工具。因而我們把設(shè)計(jì)過程分三步進(jìn)行。首先把概念結(jié)構(gòu)向一般的關(guān)系模型轉(zhuǎn)換,然后向特定的DBMS支持下的數(shù)據(jù)模型轉(zhuǎn)換,最后進(jìn)行模型的優(yōu)化。(1)E-R圖向關(guān)系數(shù)據(jù)模型的轉(zhuǎn)換下面給出把E-R圖轉(zhuǎn)換為關(guān)系模型的轉(zhuǎn)換規(guī)則。①一個(gè)實(shí)體轉(zhuǎn)換為一個(gè)關(guān)系模式。實(shí)體的屬性就是關(guān)系的屬性,實(shí)體的碼就是關(guān)系的碼。②一個(gè)聯(lián)系轉(zhuǎn)換為一個(gè)關(guān)系模式,與該聯(lián)系相連的各實(shí)體的碼以及聯(lián)系的屬性轉(zhuǎn)換為關(guān)系的屬性。該關(guān)系的碼則有三種情況:若聯(lián)系為1∶1,則每個(gè)實(shí)體的碼均是該關(guān)系的候選碼。若聯(lián)系為1∶n,關(guān)系的碼為n端實(shí)體的碼。若聯(lián)系為n∶m,則關(guān)系的碼為諸實(shí)體碼的組合。具有相同碼的關(guān)系模式可合并。形成了一般的數(shù)據(jù)模型后,下一步就向特定的DBMS規(guī)定的模型轉(zhuǎn)換。設(shè)計(jì)人員必須熟知所用DBMS的功能及限制。這一步轉(zhuǎn)換是依賴于機(jī)器的,不能給出一個(gè)普遍的規(guī)則。轉(zhuǎn)化后的模型必須進(jìn)行優(yōu)化。對數(shù)據(jù)模型進(jìn)行優(yōu)化是指調(diào)整數(shù)據(jù)模型的結(jié)構(gòu),以提高數(shù)據(jù)庫應(yīng)用系統(tǒng)的性能。性能有動態(tài)性能和靜態(tài)性能兩種。靜態(tài)性能分析容易實(shí)現(xiàn)。根據(jù)應(yīng)用要求,選出合適的模型是一項(xiàng)復(fù)雜的工作。(2)規(guī)范化理論的應(yīng)用規(guī)范化理論是數(shù)據(jù)庫邏輯設(shè)計(jì)的指南和工具,具體地講可應(yīng)用在下面幾個(gè)具體的方面:第一,在數(shù)據(jù)分析階段用數(shù)據(jù)依賴的概念分析和表示各數(shù)據(jù)項(xiàng)之間的關(guān)系。第二,在設(shè)計(jì)概念結(jié)構(gòu)階段,用規(guī)范化理論為工具消除初步E-R圖中冗余的聯(lián)系。第三,由E-R圖向數(shù)據(jù)模型轉(zhuǎn)換過程中用模式分解的概念和算法指導(dǎo)設(shè)計(jì)?,F(xiàn)在,不管選用的DBMS是支持哪種數(shù)據(jù)模型的,均先把概念結(jié)構(gòu)向關(guān)系模型轉(zhuǎn)換。然后,充分運(yùn)用規(guī)范化理論的成果優(yōu)化關(guān)系數(shù)據(jù)庫模式的設(shè)計(jì)。5.數(shù)據(jù)庫的物理設(shè)計(jì)物理設(shè)計(jì)的內(nèi)容主要包括:(1)確定數(shù)據(jù)的存儲結(jié)構(gòu)從DBMS所提供的存儲結(jié)構(gòu)中選取一種合適的加以實(shí)現(xiàn)。確定存儲結(jié)構(gòu)的主要因素是存取時(shí)間、存儲空間利用率和維護(hù)代價(jià)三個(gè)方面。設(shè)計(jì)者常常要對這些因素進(jìn)行權(quán)衡。一般的DBMS也總是具有一定靈活性供你選擇。例如,若引入某些冗余數(shù)據(jù),則可能減少物理I/O次數(shù)提高檢索效率。相反節(jié)約存儲空間檢索代價(jià)就會增加。當(dāng)然應(yīng)該盡量尋找優(yōu)化方法,使這三方面的性能都較好。折衷有時(shí)是必須的。(2)存取路徑的選擇和調(diào)整數(shù)據(jù)庫必須支持多個(gè)用戶的多種應(yīng)用,因而必須提供對數(shù)據(jù)庫的多個(gè)存取入口,也就是對同一數(shù)據(jù)存儲要提供多條存取路徑。物理設(shè)計(jì)的任務(wù)應(yīng)確定建立哪些存取路徑。設(shè)計(jì)者應(yīng)該進(jìn)行定量的分析,根據(jù)計(jì)算結(jié)果確定存取路徑。(3)確定數(shù)據(jù)存放位置首先按數(shù)據(jù)的應(yīng)用情況劃分為不同的組,然后確定存放位置。一般的應(yīng)把數(shù)據(jù)的易變部分和穩(wěn)定部分分開,把經(jīng)常存取和不常存取的數(shù)據(jù)分開。經(jīng)常存取或存取時(shí)間要求高的記錄應(yīng)存放在高速存儲器上,如硬盤。存取頻率小或存取時(shí)間要求低的放在低速存儲器上,如軟盤磁帶。對于同一數(shù)據(jù)文件也可根據(jù)情況進(jìn)行水平劃分或垂直劃分。(4)確定存儲分配許多DBMS提供了存儲分配的參數(shù)供設(shè)計(jì)者物理優(yōu)化處理用。例如溢出空間的大小和分布參數(shù),塊的長度,塊因子的大小,裝填因子,緩沖區(qū)的大小和個(gè)數(shù)等等,它們都要在物理設(shè)計(jì)中確定。這些參數(shù)的大小影響存取時(shí)間和存儲空間的分配。物理設(shè)計(jì)過程需要對時(shí)間、空間效率、維護(hù)代價(jià)和各種用戶要求進(jìn)行權(quán)衡,其結(jié)果可以產(chǎn)生多種方案。在實(shí)施數(shù)據(jù)庫前對這些方案進(jìn)行方案進(jìn)行細(xì)致的評價(jià),以選擇一個(gè)較優(yōu)的方案是十分必要的。6.數(shù)據(jù)庫應(yīng)用系統(tǒng)的實(shí)施和維護(hù)對數(shù)據(jù)庫的物理設(shè)計(jì)初步評價(jià)完成后就可建立數(shù)據(jù)庫了。數(shù)據(jù)庫應(yīng)用系統(tǒng)實(shí)施對應(yīng)于軟件工程的編碼、調(diào)試階段。設(shè)計(jì)人員運(yùn)用DBMS提供的數(shù)據(jù)定義語言將邏輯設(shè)計(jì)和物理設(shè)計(jì)的結(jié)果嚴(yán)格地描述出來,成為DBMS可接受的源代碼。經(jīng)過調(diào)試產(chǎn)生目標(biāo)模式。然后組織數(shù)據(jù)入庫。組織數(shù)據(jù)入庫是數(shù)據(jù)庫應(yīng)用系統(tǒng)實(shí)施階段最主要的工作。(1)數(shù)據(jù)庫數(shù)據(jù)的載入和應(yīng)用程序的開發(fā)由于數(shù)據(jù)庫數(shù)據(jù)量一般都非常大,并且這些數(shù)據(jù)來源于一個(gè)組織的各個(gè)部門,分散在各種數(shù)據(jù)文件或原始憑證中。這些數(shù)據(jù)的結(jié)構(gòu)和格式一般也不符合數(shù)據(jù)庫的要求,還要進(jìn)行轉(zhuǎn)換。因此組織數(shù)據(jù)入庫是一件耗費(fèi)大量人力物力的工作。數(shù)據(jù)的轉(zhuǎn)換和組織對于小系統(tǒng)可以用人工方法完成。但是,人工轉(zhuǎn)換效率低、質(zhì)量差。一般來說,應(yīng)設(shè)計(jì)一個(gè)數(shù)據(jù)輸入子系統(tǒng)讓計(jì)算機(jī)完成這個(gè)工作。輸入子系統(tǒng)的主要功能是:原始數(shù)據(jù)的輸入、抽取、校驗(yàn)、分類、轉(zhuǎn)換和綜合,最終把數(shù)據(jù)組織成符合數(shù)據(jù)庫結(jié)構(gòu)的形式。然后把數(shù)據(jù)存入數(shù)據(jù)庫中。數(shù)據(jù)的轉(zhuǎn)換、分類和綜合常常要經(jīng)過多次才能完成,因而輸入子系統(tǒng)的設(shè)計(jì)和實(shí)施亦是比較復(fù)雜的,要編寫許多應(yīng)用程序。輸入子系統(tǒng)的設(shè)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論