醫(yī)學(xué)信息學(xué)復(fù)件數(shù)據(jù)庫(kù)_第1頁(yè)
醫(yī)學(xué)信息學(xué)復(fù)件數(shù)據(jù)庫(kù)_第2頁(yè)
醫(yī)學(xué)信息學(xué)復(fù)件數(shù)據(jù)庫(kù)_第3頁(yè)
醫(yī)學(xué)信息學(xué)復(fù)件數(shù)據(jù)庫(kù)_第4頁(yè)
醫(yī)學(xué)信息學(xué)復(fù)件數(shù)據(jù)庫(kù)_第5頁(yè)
已閱讀5頁(yè),還剩10頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、數(shù)據(jù)庫(kù)技術(shù) 2007 醫(yī)學(xué)信息工程1數(shù)據(jù)庫(kù)管理系統(tǒng)(DBMS)DBMS是在OS支持下工作的數(shù)據(jù)庫(kù)管理軟件。對(duì)內(nèi),它負(fù)責(zé)管理數(shù)據(jù)庫(kù);對(duì)外,它向用戶提供一整套命令,用于合法用戶對(duì)數(shù)據(jù)庫(kù)的;包括創(chuàng)建DB、定義數(shù)據(jù)、增、刪、改DB、統(tǒng)計(jì)計(jì)算等。2007-11-156數(shù)據(jù)庫(kù)(DataBase)在計(jì)算機(jī)上合理存放的相互關(guān)聯(lián)的數(shù)據(jù)的集合,被稱為數(shù)據(jù)庫(kù)。它具有下列特點(diǎn):最小冗余(盡可能不重復(fù))可以最優(yōu)方式提供數(shù)據(jù)共享數(shù)據(jù)的獨(dú)立性實(shí)現(xiàn)數(shù)據(jù)的管理和數(shù)據(jù)安全的保障數(shù)據(jù)庫(kù)技術(shù)是數(shù)據(jù)處理最有效段。2007-11-155一、基本概念數(shù)據(jù)(Data):是用來(lái)信息的可識(shí)別的符號(hào),是信息的具體表現(xiàn)形式。數(shù)據(jù)表示: 可用實(shí)體(E

2、ntity)、屬性(Attribute)和屬性值(Attribute Value)表示。 (“TS52001”, “Java技術(shù)與應(yīng)用”,3,48)數(shù)據(jù)處理(Data Prosing):是表示一系列活動(dòng)的一個(gè)總過(guò)程,包括收集、加工、檢索和發(fā)布數(shù) 據(jù);并在此過(guò)程中過(guò)濾掉無(wú)關(guān)數(shù)據(jù),抽取最有價(jià)值的相關(guān)數(shù)據(jù),以供計(jì)算機(jī)進(jìn)一步處理使用。2007-11-154數(shù)據(jù)庫(kù)管理系統(tǒng)概述2007-11-153本章教學(xué)要點(diǎn)數(shù)據(jù)庫(kù)及數(shù)據(jù)庫(kù)管理系統(tǒng)基本概念數(shù)據(jù)模型關(guān)系數(shù)據(jù)庫(kù)基本概念關(guān)系運(yùn)算及關(guān)系代數(shù)關(guān)系的規(guī)范化2007-11-152第四章 數(shù)據(jù)庫(kù)技術(shù)數(shù)據(jù)庫(kù)技術(shù) 2007 醫(yī)學(xué)信息工程2手工管理階段(4650年代中期)計(jì)算

3、機(jī)硬件技術(shù)落后,還沒(méi)有像磁盤(pán)這樣的介質(zhì),數(shù)據(jù)無(wú)法,也沒(méi)有OS和其他處理數(shù)據(jù)的軟件,而只有CPU指令系統(tǒng)和匯編語(yǔ)言軟件。早期計(jì)算機(jī)數(shù)據(jù)處理應(yīng)用沒(méi)有專門(mén)管理數(shù)據(jù)的軟件,程序自帶數(shù)據(jù)。其特點(diǎn)是:數(shù)據(jù)獨(dú)立性差,不能共享;數(shù)據(jù)冗余;無(wú)法集中式管理;.主要用于科學(xué)計(jì)算。101101011101011101110001100100110數(shù)據(jù)組n應(yīng)用程序n數(shù)據(jù)組1應(yīng)用程序1數(shù)據(jù)管理的發(fā)展階段數(shù)據(jù)管理經(jīng)歷了3個(gè)發(fā)展階段:手工管理階段文件系統(tǒng)階段數(shù)據(jù)庫(kù)系統(tǒng)階段2007-11-1511數(shù)據(jù)庫(kù)技術(shù)發(fā)展的歷史于60年代末,在理論上、實(shí)現(xiàn)技術(shù)上都有很大的發(fā)展。世界第一個(gè)數(shù)據(jù)庫(kù)IDS于1964年由通用電氣公司開(kāi)發(fā)成功(它是

4、網(wǎng)狀結(jié)構(gòu)的數(shù)據(jù)庫(kù))。1969年,的IBM公司研制了世界上第一個(gè)層次數(shù)據(jù)庫(kù)管理系統(tǒng)IMS。1970年,IBM公司E.F.Codd 了一篇題為“大型共享DB數(shù)據(jù)的關(guān)系模型” , 提出了RDB模型的概念、關(guān)系代數(shù)和關(guān)系演算,從而奠定了RDB的理論基礎(chǔ)。如今,數(shù)據(jù)庫(kù)技術(shù)已成為計(jì)算機(jī)學(xué)科的一個(gè)重要領(lǐng)域,DB已多個(gè)領(lǐng)域的主要工具之一。2007-11-1510DBS階段數(shù)據(jù)與程序的關(guān)系用戶1應(yīng)用程序1數(shù)應(yīng)用程序2據(jù)數(shù)據(jù)庫(kù)庫(kù)用戶2 應(yīng)用程序3 管理系統(tǒng)應(yīng)用程序n2007-11-159數(shù)據(jù)字典用戶m數(shù)據(jù)庫(kù)系統(tǒng)DBSDBS是指在計(jì)算機(jī)系統(tǒng)中引入DB后的系統(tǒng)。 DBS = 數(shù)據(jù)庫(kù) + 用戶 + 軟件 + 硬件硬件:

5、指運(yùn)行DBS的硬件資源,例如,SQL Server要求至少16MB內(nèi)存、32位CPU、至少80MB硬盤(pán)空間;軟件:指DBS操作,例如WINDOWS NT、DBMS、漢字處理系統(tǒng)等;用戶:指終端用戶、應(yīng)用程序員和數(shù)據(jù)庫(kù)管理員。2007-11-158DBMS的功能1. 數(shù)據(jù)定義 DBMS提供了數(shù)據(jù)定義語(yǔ)言DDL,用戶利用 DDL可以方便地定義DB中數(shù)據(jù)的邏輯結(jié)構(gòu)。2. 數(shù)據(jù)用戶利用提供的數(shù)據(jù)語(yǔ)言DML可以方便地實(shí)現(xiàn)對(duì)數(shù)據(jù)的。3. 完整性約束檢查 支持常用的完整性檢查(指數(shù)據(jù)必須符合一定的規(guī)則,如學(xué)號(hào)必須惟一)。4.控制 DB中數(shù)據(jù)可以共享,但只有合法用戶才能的數(shù)據(jù)。5. 并發(fā)控制 允許多用戶同時(shí)D

6、B,但要避免并發(fā)操作可能帶來(lái)的不一致性問(wèn)題。6. 數(shù)據(jù)庫(kù)恢復(fù)2007-11-157數(shù)據(jù)庫(kù)技術(shù) 2007 醫(yī)學(xué)信息工程3二、數(shù)據(jù)模型從現(xiàn)實(shí)生活中的客觀事物到存放于計(jì)算機(jī)中的數(shù)據(jù),這樣一個(gè)加工過(guò)程可劃分為三個(gè)階段:現(xiàn)實(shí)世界、觀念世界和數(shù)據(jù)世界在現(xiàn)實(shí)世界中,分析客觀事物,找出要求解的對(duì)象集合, 這些對(duì)象、認(rèn)識(shí)它們的本質(zhì)及其規(guī)律。在概念世界中,將求解的事物 為實(shí)體,找出實(shí)體之間的各種聯(lián)系,用實(shí)體-關(guān)系圖來(lái)描述(Entity-Relationship,簡(jiǎn)稱E-R圖)。在數(shù)據(jù)世界中,將實(shí)體模型轉(zhuǎn)換為能夠在計(jì)算機(jī)中處理的數(shù)據(jù)模型。2007-11-1518某省郵電中心分布式數(shù)據(jù)庫(kù)在集中式數(shù)據(jù)庫(kù)系統(tǒng)中,數(shù)據(jù)、

7、設(shè)備都在單個(gè)物理場(chǎng)所中,而分布式數(shù)據(jù)庫(kù)將數(shù)據(jù) 在若干不同地域的物理場(chǎng)所。分布式數(shù)據(jù)庫(kù)主要有兩種分布策略:一種策略是將中心數(shù)據(jù)庫(kù)分開(kāi) ,每個(gè) 數(shù)據(jù)庫(kù)主機(jī)只存放與各自的局部區(qū)域有關(guān)的數(shù)據(jù)。局部區(qū)域的文件變動(dòng)可以通過(guò)批處理方式與中心數(shù)據(jù)庫(kù)的數(shù)據(jù)調(diào)整同步,時(shí)間往往安排在夜間。第二種策略是將中心數(shù)據(jù)庫(kù)在 數(shù)據(jù)庫(kù)主機(jī)上提供完整的備份。要求數(shù)據(jù)庫(kù)在下班時(shí)間進(jìn)行數(shù)據(jù)的更新。分布式數(shù)據(jù)庫(kù)系統(tǒng)減少了單個(gè)集中式中心站點(diǎn)的故障風(fēng)險(xiǎn),但由于數(shù)據(jù)是分布式 ,給數(shù)據(jù)安全控制帶來(lái)復(fù)雜化的問(wèn)題。2007-11-1516分布式數(shù)據(jù)庫(kù)系統(tǒng)(80年代中期起)分布式數(shù)據(jù)庫(kù)DDBS(Distributed DBS)技術(shù)是DB技術(shù)和網(wǎng)絡(luò)、

8、通信技術(shù)的結(jié)晶產(chǎn)物。其主要特點(diǎn):處理的數(shù)據(jù)分散在各個(gè)結(jié)點(diǎn)上,每個(gè)結(jié)點(diǎn)的數(shù)據(jù)由本地的DBMS管理,各結(jié)點(diǎn)間可以數(shù)據(jù)共享;充分利用、發(fā)揮各個(gè)結(jié)點(diǎn)的資源優(yōu)勢(shì),減輕網(wǎng)絡(luò)負(fù)擔(dān);DBMS1DBMSi.DB1DBiDDBMS數(shù)據(jù)庫(kù)系統(tǒng)階段(60年代至今)由DBMS實(shí)現(xiàn)對(duì)DB的定義、管理和操作。DBMS是用戶和數(shù)據(jù)間的接 口,特別是網(wǎng)絡(luò)和通信技術(shù)的發(fā)展,使異地、異機(jī)間的數(shù)據(jù)共享成為現(xiàn)實(shí)。其特點(diǎn)是:能為多用戶共享數(shù)據(jù)冗余度最小可以交互方式或程序方式操作問(wèn)題: 異地共處數(shù)據(jù),容易造成網(wǎng)絡(luò)通信“堵塞”.DBMSDB應(yīng)用程序n應(yīng)用程序1文件系統(tǒng)階段(5060年代)數(shù)據(jù)以文件的形式存放于外存中,數(shù)據(jù)由文件系統(tǒng)FS和操作

9、系統(tǒng)OS管理,數(shù)據(jù)通過(guò)程序方式來(lái)實(shí)現(xiàn)操作。其特點(diǎn)是:文件系統(tǒng)是應(yīng)用程序和數(shù)據(jù)間的公共接口、存取文件由用戶自定義,格式和內(nèi)容不,難于共享數(shù)據(jù)冗余度大數(shù)據(jù)共享性和數(shù)據(jù)獨(dú)立性不強(qiáng)是文件管理階段的缺點(diǎn)。文件系統(tǒng)本身無(wú)法解決這些問(wèn)題。文件.系統(tǒng).應(yīng)用程序n數(shù)據(jù)組m數(shù)據(jù)組1應(yīng)用程序1數(shù)據(jù)庫(kù)技術(shù) 2007 醫(yī)學(xué)信息工程4實(shí)體模型實(shí)體(Entity):客觀存在并且可以相互區(qū)別的“事物”稱為實(shí)體。如一個(gè)學(xué)生,一本書(shū),一輛汽車,一個(gè)比喻等。屬性(Attribute):實(shí)體的某一特性稱為屬性。如學(xué)生實(shí)體有學(xué)號(hào)、系等方面的屬性。屬性有“型”和 “值”之分,“型”即為屬性名,如、等; “值”為屬性的具體取值,如(990

10、001, ,20, 男,計(jì)算機(jī))。主碼(主關(guān)鍵字,Primary Key):指一個(gè)或一組屬性,其值唯一地標(biāo)識(shí)一個(gè)實(shí)體。實(shí)體類型(Entity Type):指使用實(shí)體名和屬性名共同來(lái)刻畫(huà)同類實(shí)體的方法,例如,學(xué)生(學(xué)號(hào),班級(jí))。域():屬性值的取值范圍稱為該屬性的域。如學(xué)號(hào)的域?yàn)?位整數(shù),的域?yàn)椋?,女)等?007-11-1524數(shù)據(jù)加工三個(gè)階段的關(guān)系客觀世界是信息之源,是設(shè)計(jì)DB的出數(shù)據(jù)發(fā)點(diǎn)。世界實(shí)體模型和數(shù)據(jù)模 抽型是對(duì)客觀事物的 象兩級(jí)抽象描述。過(guò)觀念數(shù)據(jù)庫(kù)的問(wèn)題 程對(duì)象 屬性 總體世界是數(shù)據(jù)模型。要得到正確的數(shù)據(jù)現(xiàn)實(shí)模型,必須首先充世界分了解客觀事物。事物及 聯(lián)系事物事物分級(jí)對(duì)象 性質(zhì)

11、 共同 特殊實(shí)體模實(shí)體 實(shí)體分級(jí)型數(shù)據(jù)模型數(shù)據(jù)數(shù)據(jù)分級(jí)項(xiàng) 項(xiàng)值數(shù)據(jù)世界數(shù)據(jù)世界 是數(shù)據(jù)在觀念世界中信息的數(shù)據(jù)化,現(xiàn)實(shí)世界中的事物及聯(lián)系在中用數(shù)據(jù)模型來(lái)描述。數(shù)據(jù)模型反映的是數(shù)據(jù)間的聯(lián)系。數(shù)據(jù)用“數(shù)據(jù)”和“數(shù)據(jù)項(xiàng)”來(lái)描述;又分為“數(shù)據(jù)類型”和“數(shù)據(jù) 值”兩個(gè)不同級(jí)別。2007-11-1522實(shí)體與關(guān)系在現(xiàn)實(shí)世界中,某類實(shí)體集中各個(gè)屬性之間的聯(lián)系、各實(shí)體之間的聯(lián)系可使用E-R圖來(lái)描述。在E-R圖中,用矩形表示實(shí)體,用圓角矩形表示屬性,用菱形表示實(shí)體間的聯(lián)系。教師-課程的E-R圖班級(jí)觀念世界觀念世界:是現(xiàn)實(shí)世界在人腦中的反映,客觀事物在概念世界中稱為“ 實(shí)體”。反映事物聯(lián)系的是實(shí)體模型。實(shí)體用“對(duì)象

12、”和“屬性”來(lái)描述。又分為“ 實(shí)體”和“總體實(shí)體”兩個(gè)級(jí)別。2007-11-1520現(xiàn)實(shí)世界現(xiàn)實(shí)世界:是存在于人腦之外的客觀世界,事物及其相互聯(lián)系就存在于這個(gè)世界中。事物可用“對(duì)象”和“性質(zhì)”來(lái)描述。又有“共同事物”和“特殊事物”兩個(gè)不同級(jí)別。2007-11-1519數(shù)據(jù)庫(kù)技術(shù) 2007 醫(yī)學(xué)信息工程5商店的數(shù)據(jù)關(guān)系模型關(guān)系(庫(kù)名)SHOP屬性(字段)關(guān)系框架或店 名地 址經(jīng)辦人庫(kù)結(jié)構(gòu)路食品店路262號(hào)李國(guó)基3275036桃園商場(chǎng)桃園路6號(hào)山6246161元組或瓜果店街26號(hào)宏3366201白塔干鮮果店 西大街56號(hào)良3337637街果品店街231號(hào)3321116屬性“”的值數(shù)據(jù)模型的設(shè)計(jì)命名

13、數(shù)據(jù)模型(數(shù)據(jù)庫(kù)名稱)以示區(qū)別不同的模型,例如:成績(jī)庫(kù).MDB命名類型(數(shù)據(jù)庫(kù)結(jié)構(gòu))定義數(shù)據(jù)庫(kù)結(jié)構(gòu),例如:成績(jī)庫(kù)學(xué)號(hào)、課程號(hào)、分?jǐn)?shù)命名每個(gè)中的數(shù)據(jù)項(xiàng)(字段)XH(學(xué)號(hào))、CNO(課程號(hào))、SCORE(分?jǐn)?shù))說(shuō)明各個(gè)類型之間的聯(lián)系各數(shù)據(jù)項(xiàng)的數(shù)據(jù)特征、數(shù)據(jù)類型、長(zhǎng)度、值域等。例如,XH ,字符型,長(zhǎng)度為72007-11-1529數(shù)據(jù)模型建立了實(shí)體模型后,就可以建立數(shù)據(jù)模型。在DBS中表示實(shí)體(數(shù)據(jù) )之間聯(lián)系的方式稱為數(shù)據(jù)模型。數(shù)據(jù)模型實(shí)際上是數(shù)據(jù)間的一個(gè)整體邏輯結(jié)構(gòu)圖。為了使模型能清晰、準(zhǔn)確地反映客觀事物,要進(jìn)行數(shù)據(jù)模型的設(shè)計(jì),也即數(shù)據(jù)庫(kù)的設(shè)計(jì)。2007-11-1528教學(xué)實(shí)體模型示意圖學(xué)號(hào)、班

14、級(jí)教師、課程號(hào)學(xué)生聽(tīng)課授課學(xué)習(xí)課程講授課程號(hào)、課程名成績(jī)教師學(xué)號(hào)、課程號(hào)、分?jǐn)?shù)教師、實(shí)體模型舉例以教學(xué)管理為例:教學(xué)由學(xué)生、課程、教師、學(xué)習(xí)、任課等實(shí)體組成。學(xué)生屬性:學(xué)號(hào)、班級(jí)課程屬性:課程號(hào)、課程名稱教師屬性:、課程號(hào)、學(xué)習(xí)屬性:學(xué)號(hào)、課程號(hào)、分?jǐn)?shù)任課屬性:教師名、課程號(hào)、教室2007-11-1526之間的聯(lián)系總體的 之間有著某種聯(lián)系,分為三種:一對(duì)一聯(lián)系:實(shí)體A中任一 至多對(duì)應(yīng)實(shí)體B中的一個(gè) ,反之亦然;則稱A和B是一一對(duì)應(yīng)的聯(lián)系。例如,高考錄取、 院看 等。一對(duì)多聯(lián)系:實(shí)體A中至少有一個(gè) 對(duì)應(yīng)于實(shí)體B中一個(gè)以上的 ,反之亦然, 則稱這種聯(lián)系是 “一對(duì)多”的聯(lián)系。例如,父親對(duì) ;院系對(duì)班

15、級(jí)等。多對(duì)多聯(lián)系:實(shí)體A中至少有一個(gè) 對(duì)應(yīng)于實(shí)體B中一個(gè)以上 ;反之,B中也至少有一個(gè) 對(duì)應(yīng)于A中一個(gè)以上的 ,則稱A對(duì)B是多對(duì)多的聯(lián)系。例如,學(xué)生對(duì)課程、工廠對(duì)產(chǎn)品等。2007-11-1525數(shù)據(jù)庫(kù)技術(shù) 2007 醫(yī)學(xué)信息工程6網(wǎng)絡(luò)模型舉例教務(wù)管理系統(tǒng)課程學(xué)生教學(xué)課程表*教室?guī)?007-11-1536網(wǎng)絡(luò)模型圖結(jié)構(gòu)模型特點(diǎn):可有0個(gè)或多個(gè)結(jié)點(diǎn)無(wú)雙親允許結(jié)點(diǎn)有多個(gè)雙親允許結(jié)點(diǎn)間有2種以上的關(guān)系存取、必須按事先定義好的路徑進(jìn)行(從指定出發(fā)點(diǎn))最有影響的網(wǎng)絡(luò)模型是數(shù)據(jù)系統(tǒng)語(yǔ)言推出的 DBTG系統(tǒng)。2007-11-1535層次模型示意圖校長(zhǎng)校長(zhǎng)辦公室 各學(xué)院 各職能處( 生命學(xué)院)教研組 .生物醫(yī)學(xué)

16、工程系生物工程系 生物醫(yī)學(xué)工程層次模型描述層次(樹(shù)形)結(jié)構(gòu)的模型。特點(diǎn):每個(gè)模型中只有一個(gè)稱為根的最高結(jié)點(diǎn)其它結(jié)點(diǎn)都只能和一個(gè)父結(jié)點(diǎn)相連接(1:M)查詢、都必須從根結(jié)點(diǎn)開(kāi)始最有影響的層次模型的DBS是60年代末,IBM公司推出的IMS層次模型數(shù)據(jù)庫(kù)系統(tǒng)。2007-11-1533三種數(shù)據(jù)模型數(shù)據(jù)模型的好壞直接影響到DB的性能。當(dāng)前較流行的設(shè)計(jì)方法有三種:關(guān)系、層次和網(wǎng)絡(luò)方法;對(duì)應(yīng)的模型為關(guān)系模型、層次模型、網(wǎng)絡(luò)模型。2007-11-1532數(shù)據(jù)模型三要素?cái)?shù)據(jù)結(jié)構(gòu):即數(shù)據(jù)庫(kù)對(duì)象的集合操作數(shù)據(jù):對(duì)數(shù)據(jù)庫(kù)對(duì)象所進(jìn)行的一系列操作的集合約束:用以確保數(shù)據(jù)庫(kù)數(shù)據(jù)的正確、有效和相一致的規(guī)則集合2007-11-

17、1531數(shù)據(jù)庫(kù)技術(shù) 2007 醫(yī)學(xué)信息工程7二、關(guān)系運(yùn)算從數(shù)據(jù)庫(kù)操作角度關(guān)系運(yùn)算主要包括:選擇運(yùn)算 針對(duì)元組投影運(yùn)算 針對(duì)屬性自然聯(lián)結(jié)運(yùn)算2007-11-1542關(guān)鍵字(Key)候選關(guān)鍵字(Candidate Key)在給定關(guān)系中,具有唯一標(biāo)識(shí)特性的一個(gè)或多個(gè)屬性被稱為該關(guān)系的候選關(guān)鍵字。例如,學(xué)生關(guān)系中的學(xué)號(hào)。主關(guān)鍵字(Primary Key)有時(shí)候選關(guān)鍵字多于一個(gè),從中選取一個(gè)作為操作的根據(jù),稱其為主關(guān)鍵字。2007-11-1541關(guān)系概念的圖解關(guān)系(庫(kù)名)SHOP屬性(字段)關(guān)系框架店 名地 址經(jīng)辦人或庫(kù)結(jié)構(gòu)路食品店路262號(hào)李國(guó)基3275036桃園商場(chǎng)桃園路6號(hào)山6246161元組或瓜

18、果店街26號(hào)宏3366201白塔干鮮果店 西大街56號(hào)良3337637街果品店街231號(hào)3321116屬性“”的值一、基本概念關(guān)系模型:是數(shù)學(xué)化的模型,它把數(shù)據(jù)看作二維表中的元素,表就是其關(guān)系。其特點(diǎn)是:表中每一列屬性都是不能再細(xì)分的基本單元不允許有重復(fù)的列不允許有相同的行、列次序均無(wú)關(guān)2007-11-1539關(guān)系數(shù)據(jù)庫(kù)及其規(guī)范化2007-11-1538關(guān)系模型其組織形式是一張二維表,一個(gè)表即一個(gè)關(guān)系;特點(diǎn):一個(gè)關(guān)系一張表數(shù)據(jù)獨(dú)立性高操作簡(jiǎn)單一行是一個(gè)一列是一個(gè)數(shù)據(jù)項(xiàng)(字段)2007-11-1537數(shù)據(jù)庫(kù)技術(shù) 2007 醫(yī)學(xué)信息工程8英語(yǔ)成績(jī)關(guān)系ENGLISHENGLISH班級(jí)英語(yǔ)自控86 7

19、6自控86 92自控86 92自控86 96自控86 852007-11-1548投影運(yùn)算從指定關(guān)系的屬性(字段)集合中選取部分屬性組成同類的一個(gè)新關(guān)系。由于屬性減少而出現(xiàn)的重復(fù)元組被自動(dòng)刪除。舉例,生成學(xué)生英語(yǔ)成績(jī)關(guān)系ENGLISH,只包含“ ”、“班級(jí)”、“英語(yǔ)”三項(xiàng)屬性。2007-11-1547選擇運(yùn)算舉例的集合A、B、C、 D、E、F、 G、H、G、X、Y、ZA、D、選擇運(yùn)算(選取小于H且跳過(guò)G兩個(gè)間隔的的那些)2007-11-1546優(yōu)秀學(xué)生關(guān)系EXC_STEXC_ST12345678學(xué)號(hào)班級(jí)操行 數(shù)自控原理8612162自控869692958612104自控869192998612

20、106自控86 男優(yōu)899696滿足:“操行=優(yōu) AND 數(shù)+自控原理=2702007-11-1545選擇運(yùn)算從指定關(guān)系中選擇出符合條件的元組( )組成一個(gè)新的關(guān)系。舉例,從STUDENTS關(guān)系中,選出三好學(xué)生候選人 ,條件是:操行為優(yōu),其它三門(mén)功課的總成績(jī)不低于 270分。選擇運(yùn)算條件:CP=“操行=優(yōu) AND 數(shù) +自控原理=2702007-11-1544學(xué)生關(guān)系STUDENTSTUDENT12345678學(xué)號(hào)班級(jí)操行 數(shù)自控原理8612101自控868576768612162自控869692958612104自控869192998612106自控86 男優(yōu)8996968612107自控8

21、6 男優(yōu)898582 2007-11-1543數(shù)據(jù)庫(kù)技術(shù) 2007 醫(yī)學(xué)信息工程9同類關(guān)系同一關(guān)系模式(關(guān)系框架)填以不同的值所生成的諸關(guān)系稱為同類關(guān)系。同類關(guān)系之間可以進(jìn)行下列運(yùn)算并、交、差運(yùn)算選擇運(yùn)算投影運(yùn)算自然聯(lián)結(jié)運(yùn)算2007-11-1554三、關(guān)系代數(shù)在介紹關(guān)系代數(shù)之前,先介紹一些有關(guān)的符號(hào)及其含義。P Q P并且QP Q P或Qa A a是集合A中的元素(a屬于A)a A a不屬于AA B 集合A和集合B的并A B 集合A和集合B的交A B 集合A包含于集合B中A B 集合A真包含于集合B中2007-11-1553自然聯(lián)結(jié)舉例設(shè)有體育成績(jī)關(guān)系PE。三好學(xué)生的標(biāo)準(zhǔn)之一是體育成績(jī)達(dá)到“優(yōu)

22、”或“良”。將PE和STUDENT關(guān)系合并,生成新的關(guān)系ST_MARK,并從中選出三好學(xué)生簡(jiǎn)況表。學(xué)號(hào)班級(jí)操行 數(shù)自控原理 體育 8612162 自控8696 9295良8612104自控8691 9299良8612106自控86 男優(yōu) 89 9696優(yōu)定義查詢條件:操行=“優(yōu)”.AND.數(shù)+自控原理=270AND (體育=優(yōu).OR.體育=良)2007-11-1552體育關(guān)系PEPE學(xué)號(hào)體育8612101優(yōu)8612162良8612104良8612106優(yōu)8612107良2007-11-1551自然聯(lián)結(jié)對(duì)于兩個(gè)有公共屬性的關(guān)系,把其中公共屬性值相同的元組挑選出來(lái), 一個(gè)新的關(guān)系,稱之為自然聯(lián)結(jié)。

23、自然連接的特點(diǎn):關(guān)系A(chǔ)和關(guān)系B中有同名的屬性;新關(guān)系的條件是關(guān)系A(chǔ)和B中同名屬性的值相等;形成新關(guān)系的屬性集合是關(guān)系A(chǔ)、B屬性集合的并集。2007-11-1550投影運(yùn)算舉例的集合A1(a1、a2、a3、a4、a5、a6)A2(a1、a2、a3、a4、a5、a6)A3(a1、a2、a3、a4、a5、a6)10. A10(a1、a2、a3、a4、a5、a6)投影運(yùn)算(選擇記錄中奇數(shù)的屬性,組成新的 )。A1(a1、a3、a5)A2(a1、a3、a5)A3(a1、a3、a5)新集合10. A10(a1、a3、a5)數(shù)據(jù)庫(kù)技術(shù) 2007 醫(yī)學(xué)信息工程10差運(yùn)算舉例關(guān)系R關(guān)系S關(guān)系R-S2007-11

24、-1560名稱顏色長(zhǎng)度的確良白1000名稱顏色長(zhǎng)度的確良華達(dá)呢白黑10002000名稱顏色長(zhǎng)度的確良華達(dá)呢黑黑20002000交運(yùn)算舉例關(guān)系R關(guān)系S關(guān)系RS2007-11-1559名稱顏色長(zhǎng)度華達(dá)呢黑2000名稱顏色長(zhǎng)度的確良華達(dá)呢白黑10002000名稱顏色長(zhǎng)度的確良華達(dá)呢黑黑20002000并運(yùn)算舉例有同類關(guān)系R和S,如下所示:關(guān)系R關(guān)系S關(guān)系RS2007-11-1558名稱 的確良的確良華達(dá)呢顏色白黑黑長(zhǎng)度 100020002000名稱顏色長(zhǎng)度的確良華達(dá)呢白黑10002000名稱顏色長(zhǎng)度的確良華達(dá)呢黑黑20002000差運(yùn)算差運(yùn)算 同類關(guān)系R和S的差記為R-S,是由屬于R而不屬于S的元組

25、組成;記為:R-S = t| tR tS 示意圖為:RSR-S2007-11-1557交運(yùn)算交運(yùn)算 同類關(guān)系R和S的交記為R S,是由既屬于 R又屬于S的元組組成。記為:R S = t| t R t S 示意圖為:RSR S2007-11-1556并運(yùn)算并運(yùn)算 如果R和S為同類關(guān)系,則它們的并記為R S,仍然是R和S的同類關(guān)系,由屬于R或?qū)儆赟的元組組成。記為:R S= t|tR tS 示意圖為:R S2007-11-1555數(shù)據(jù)庫(kù)技術(shù) 2007 醫(yī)學(xué)信息工程11異常之三:異常如果某課程決定由擔(dān)任,但在還不知道哪些學(xué)生選修前,無(wú)法將的關(guān)系中。因?yàn)椋赟CT關(guān)系中(S#,C#)是主關(guān)鍵字,在C#

26、不確定的情況下,根據(jù)關(guān)系模型的實(shí)體完整性規(guī)則,不允許主關(guān)鍵字中出現(xiàn)空值。因此,在C#不確定的情況下,不能該。SCT關(guān)系 (學(xué)生課程教師關(guān)系)S# C# GRADETNAMETAGEOFFICE S1 C190周45301S1 C291劉39302S1 C385劉39302S1 C487王51301S2 C192周45301S3 C175周45301S3 C256劉39302C5張30304異常之二:更新異常對(duì)SCT關(guān)系中的元組進(jìn)行修改,可能導(dǎo)致出現(xiàn) 數(shù)據(jù)不一致的情況。例如,要修改第一元組中的OFFICE值時(shí),將301改為 303,會(huì)出現(xiàn)周老師的辦公室號(hào)碼不一致,除非修改所有周老師元組( )中的

27、辦公室號(hào)碼。SCT關(guān)系 (學(xué)生課程教師關(guān)系)S# C# GRADETNAMETAGEOFFICE S1 C190周45303S1 C291劉39302S1 C385劉39302S1 C487王51301S2 C192周45301S3 C175周45301S3 C256劉39302異常之一:數(shù)據(jù)冗余如果某門(mén)課程有100個(gè)學(xué)生選修,就要出現(xiàn)100個(gè)元組(記錄),相應(yīng)的教這門(mén)功課的教師的 、 、辦公室也要出現(xiàn)100次。SCT關(guān)系 (學(xué)生課程教師關(guān)系)S# C# GRADETNAMETAGEOFFICES1 C190周45301S1 C291劉39302S1 C385劉39302S1 C487王513

28、01S2 C192周45301S3 C175周45301S3 C256劉39302關(guān)系模式的異常問(wèn)題在上述SCT關(guān)系中,至少存在下列問(wèn)題:數(shù)據(jù)冗余更新異常異常刪除異常2007-11-1563SCT關(guān)系是由S#(學(xué)號(hào))、C#(課程號(hào)),GRADE(成績(jī))、TNAME(教師)、TAGE(教師年齡)、OFFICE(辦公室)屬性組成。SCT關(guān)系 (學(xué)生課程教師關(guān)系)S# C# GRADETNAMETAGEOFFICES1 C190周45301S1 C291劉39302S1 C385劉39302S1 C487王51301S2 C192周45301S3 C175周45301S3 C256劉39302200

29、7-11-1562四、關(guān)系的規(guī)范化概念如何評(píng)價(jià)關(guān)系模型的好壞,這關(guān)系到如何設(shè)計(jì)關(guān)系模型(關(guān)系框架)的問(wèn)題。以SCT關(guān)系為例說(shuō)明存在的問(wèn)題2007-11-1561數(shù)據(jù)庫(kù)技術(shù) 2007 醫(yī)學(xué)信息工程12第一范式1NF第一范式(1NF)是指數(shù)據(jù)庫(kù)表的每一列都是不可分割的基本數(shù)據(jù)項(xiàng),同一列中不能有多個(gè)值,即實(shí)體中的某個(gè)屬性不能有多個(gè)值或者不能有重復(fù)的屬性。在任何一個(gè)關(guān)系數(shù)據(jù)庫(kù)中,第一范式(1NF)是對(duì)關(guān)系模式的基本要求,不滿足第一范式(1NF)的數(shù)據(jù)庫(kù)就不是關(guān)系數(shù)據(jù)庫(kù)。2007-11-1572關(guān)系規(guī)范化范式關(guān)系規(guī)范化有不同的標(biāo)準(zhǔn),將規(guī)范標(biāo)準(zhǔn)稱之為范式。可以把范式看成是用范式定義消除數(shù)據(jù)冗余的程度。范

30、式分為:第一范式1NF第二范式2NF第三范式3NFBoyce-Codd范式BCNF第四范式4NF第五范式5NF它們滿足下列關(guān)系:5NF 4NF BCNF 3NF 2NF 1NF2007-11-1571數(shù)據(jù)依賴描述同一關(guān)系內(nèi)各屬性之間的相互關(guān)系被稱為數(shù)據(jù)依賴。數(shù)據(jù)依賴有許多種類型,這里只介紹函數(shù)依賴、完全函數(shù)依賴和傳遞依賴的概念。2007-11-1570產(chǎn)生儲(chǔ)異常問(wèn)題的原因?yàn)槭裁磿?huì)產(chǎn)生異常的問(wèn)題呢?這與每個(gè)關(guān)系模式中各屬性值之間的聯(lián)系有關(guān)。在SCT關(guān)系中,(S#,C#)是主關(guān)鍵字,它們的值唯一決定其它所有屬性的值,形成一種依賴關(guān)系。TNME、TAGE、OFFICE的屬性值由課程號(hào)C#決定,與學(xué)號(hào)

31、S#無(wú)直接聯(lián)系。把無(wú)直接聯(lián)系的教師屬性和學(xué)生學(xué)號(hào)放在一起,就產(chǎn)生了 異常的問(wèn)題。因此,模式設(shè)計(jì)時(shí)強(qiáng)調(diào)“獨(dú)立聯(lián)系,獨(dú)立表達(dá)”。這是一條設(shè)計(jì)原則。將SCT分解為SC、CT,就符合這條設(shè)計(jì)原則。通常,將結(jié)構(gòu)較簡(jiǎn)單的關(guān)系取代結(jié)構(gòu)較復(fù)雜關(guān)系(簡(jiǎn)單和復(fù)雜是指數(shù)據(jù)相關(guān)性而言)的過(guò)程稱為關(guān)系的規(guī)范化。2007-11-1569關(guān)系的規(guī)范化舉例顯然,SCT關(guān)系的性能是很差的。如果將SCT關(guān)系分解為兩個(gè)子關(guān)系SC和CT,即SC(S#,C#,GRADE)、CT(C#, TNAME,TAGE,OFFICE),上述異常問(wèn)題將。SC關(guān)系CT關(guān)系S# C# GRADEC# TNAME TAGE OFFICE S1 C190

32、C1周45301S1 C291C2劉39302S1 C385C3劉39302S1 C487 C4王51301 S2 C192S3 C175S3 C256異常之四:刪除異常如果要?jiǎng)h除某門(mén)課程的所有成績(jī),則會(huì)將教這門(mén)功課的教師信息也刪除掉。例如,若要?jiǎng)h除C4的元組,結(jié)果會(huì)丟失 的有關(guān)信息。顯然,這是不希望發(fā)生的事情。SCT關(guān)系 (學(xué)生課程教師關(guān)系)S# C# GRADETNAMETAGEOFFICE S1 C190周45301S1 C291劉39302S1 C385劉39302S1 C487王51301S2 C192周45301S3 C175周45301S3 C256劉39302數(shù)據(jù)庫(kù)技術(shù)READ

33、ER關(guān)系2007-11-1578 2007 醫(yī)學(xué)信息工程13借書(shū)證號(hào)住址8612101自控86宿舍2060621自控教研室 花園路312號(hào)8612103自控86宿舍2068603211機(jī)制86男生宿舍101關(guān)系BORROW的規(guī)范化作下列投影運(yùn)算:READER = 借書(shū)證號(hào)、住址(BORROW) BOOK = 書(shū)號(hào)、書(shū)名(BORROW)BORROW = 借書(shū)證號(hào)、書(shū)號(hào)、日期(BORROW)2007-11-1577關(guān)系BORROW書(shū)證住址書(shū)號(hào) 書(shū)名日期8212102自控86宿舍206 6201 自控原理 93.07.060621自控教研室 花園路312號(hào) 6201 自控原理 93.03.02062

34、1自控教研室 花園路312號(hào) 3104 數(shù)據(jù)處理 93.04.040621自控教研室 花園路312號(hào) 5112 晶體管電路 93.06.058212103自控86宿舍206 5112 晶體管電路 93.07.068603211機(jī)制86男生宿舍101 116 機(jī)械制造 93.05.058603211機(jī)制86男生宿舍101 229 金相分析 93.05.05第二范式2NF第二范式(2NF)是在第一范式(1NF)的基礎(chǔ)上建立起來(lái)的,即滿足第二范式(2NF)必須先滿足第一范式(1NF)。第二范式(2NF)要求數(shù)據(jù)庫(kù)表中的每個(gè)實(shí)例或行必須可以被惟一區(qū)分。要求實(shí)體的屬性完全依賴于主關(guān)鍵字。所謂完全依賴是指

35、不能存在僅依賴主關(guān)鍵字一部分的屬性,如果存在,那么這個(gè)屬性和主關(guān)鍵字的這一部分應(yīng)該分離出來(lái)形成一個(gè)新的實(shí)體,新實(shí)體與原實(shí)體之間是一對(duì)多的關(guān)系。為實(shí)現(xiàn)區(qū)分通常需要為表加上一個(gè)列,以存儲(chǔ)各個(gè)實(shí)例的惟一標(biāo)識(shí)。2007-11-1575轉(zhuǎn)化非規(guī)范化關(guān)系舉例表中具有復(fù)合數(shù)據(jù)項(xiàng)和多值數(shù)據(jù)項(xiàng)的都不是規(guī)范化的表。消除復(fù)合數(shù)據(jù)項(xiàng)職工號(hào)基本工資職務(wù)工資工齡工資消除多值數(shù)據(jù)項(xiàng)職工號(hào)系名 系辦公地址 學(xué)歷 畢業(yè)年份教授 計(jì)算機(jī)-205大學(xué)1963001教授 計(jì)算機(jī)1-2051982講師 電信2-204大學(xué)1989非規(guī)范化關(guān)系表中具有復(fù)合數(shù)據(jù)項(xiàng)和多值數(shù)據(jù)項(xiàng)的都不是規(guī)范化的表。復(fù)合數(shù)據(jù)項(xiàng)多值數(shù)據(jù)項(xiàng)職工號(hào)系名 系辦公地址 學(xué)

36、歷 畢業(yè)年份大學(xué)1963001教授 計(jì)算機(jī)1-2051982002講師 電信2-204大學(xué)職工號(hào)工 資基本工資職務(wù)工資工齡工資數(shù)據(jù)庫(kù)技術(shù) 2007 醫(yī)學(xué)信息工程14新BICYCLE關(guān)系經(jīng)投影操作:BICYCLE= 品名、廠家、年產(chǎn)量、單價(jià)(BICYCLE)品名廠家 年產(chǎn)量 單 價(jià)黃山牌26男車 黃山自行車廠 20000336.00黃山牌26坤車 黃山自行車廠 23000326.00牌24坤車 海河自行車廠 76000310.00大象牌28男車 生發(fā)自行車廠 10000310.00大象牌28加重 生發(fā)自行車廠 50000340.00大象牌28跑車 生發(fā)自行車廠 10000371.00大象牌26男

37、車 生發(fā)自行車廠 30000320.00大象牌26坤車 生發(fā)自行車廠 50000320.00大象牌24坤車 生發(fā)自行車廠 10000305.00BICYCLE關(guān)系規(guī)范化BICYCLE關(guān)系中有傳遞依賴的關(guān)系tt品名 廠家, 廠家 廠長(zhǎng)tt品名 廠家, 廠家 產(chǎn)地去掉其中的傳遞依賴關(guān)系,得到規(guī)范化關(guān)系。還是通過(guò)投影運(yùn)算,得到:新BICYCLE關(guān)系和BICYCLE_PLANT關(guān)系。2007-11-1583關(guān)系BICYCLE品 名廠 家廠 長(zhǎng) 產(chǎn)地 年產(chǎn)量 單 價(jià)黃山牌26男車 黃山自行車廠合肥20000336.00黃山牌26坤車 黃山自行車廠合肥23000326.00牌24坤車 海河自行車廠76000310.00大象牌28男車 生發(fā)自行車廠 丁三元 廣州10000310.00大象牌28加重 生發(fā)自行車廠 丁三元 廣州50000340.00大象牌

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論