版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
數(shù)據(jù)庫及數(shù)據(jù)倉庫精要第1頁,共35頁,2023年,2月20日,星期六前言數(shù)據(jù)庫扮演的角色也叫聯(lián)機(jī)事務(wù)處理OLAP(OnlineTransactionalProcessing),數(shù)據(jù)庫保存由日常管理過程中涉及的業(yè)務(wù)操作創(chuàng)建的操作型結(jié)構(gòu)化數(shù)據(jù),數(shù)據(jù)記錄系統(tǒng)管理行為(通過各種業(yè)務(wù)邏輯來交互)。反映細(xì)粒度的事務(wù)數(shù)據(jù),保存時間短。主要依賴關(guān)系建模方法論。數(shù)據(jù)倉庫扮演的角色也叫聯(lián)機(jī)分析處理OLAP(OnlineAnalyticalProcessing),數(shù)據(jù)由聯(lián)機(jī)事務(wù)處理來,經(jīng)過選擇和聚集,變?yōu)榉治鍪聦嵁a(chǎn)生的因果,輔助決策制定(通過各種分析報表來交互)。反映大范圍的事實數(shù)據(jù),保存時間長。主要依賴多維建模方法論第2頁,共35頁,2023年,2月20日,星期六問題的導(dǎo)入結(jié)構(gòu)良好的表,范式,SQL語言及關(guān)系基本表與中間表、臨時表不同,基本表及其字段之間的關(guān)系,應(yīng)盡量滿足第三范式,是結(jié)構(gòu)良好的表,它可以消除刪除行,改變行,修改行(實例)的錯誤和異常。它具有如下四個特性:(1)原子性,基本表中的字段是不可再分解的。(2)原始性,基本表中的記錄是原始數(shù)據(jù)(基礎(chǔ)數(shù)據(jù))的記錄。(3)演繹性,由基本表與代碼表中的數(shù)據(jù),可以派生出所有的輸出數(shù)據(jù)。(4)穩(wěn)定性,基本表的結(jié)構(gòu)是相對穩(wěn)定的,表中的記錄是要長期保存的。(5)基本表的每個決定因子都必須是候選建。(6)菲基本表必須分解為兩個或多個基本表。三個基本范式:(1)1NF是對屬性的原子性約束,要求屬性具有原子性,不可再分解。(2)2NF是對記錄的惟一性約束,要求記錄有惟一標(biāo)識,即實體的惟一性。(3)3NF是對字段冗余性的約束,即任何字段不能由其他字段派生出來,它要求字段沒有冗余大多數(shù)結(jié)構(gòu)不良好的表,會產(chǎn)生或包含大量的冗余數(shù)據(jù),同時可能會出現(xiàn)刪除行,改變行,修改行的錯誤和異常,這都是都是使用了SQLDMLCURD語句產(chǎn)生的。像中間表、報表和臨時表:(1)中間表是存放統(tǒng)計數(shù)據(jù)的表,它是為數(shù)據(jù)倉庫、輸出報表或查詢結(jié)果而設(shè)計的,有時它沒有主鍵與外鍵(數(shù)據(jù)倉庫除外)。(2)臨時表是程序員個人設(shè)計的,存放臨時記錄,為個人所用。(3)基表和中間表由DBA維護(hù),臨時表由程序員自己用程序自動維護(hù)。關(guān)系是一個由行和列組成的二維表,不一定結(jié)構(gòu)良好,特征為:行包括實體的數(shù)據(jù),列包含實體性質(zhì)的數(shù)據(jù),表中的單元格存儲單個值,每列的所有實體類型一致,每列具有唯一名稱,列的順序任意,行的順序任意,任意兩行互不重復(fù)。這是最大的復(fù)合關(guān)系模式的條件,符合這個要求的表就是關(guān)系型表格。統(tǒng)計,匯總,分析表自動用Excel做第3頁,共35頁,2023年,2月20日,星期六目錄E-R模型的概念與表示實體-聯(lián)系方法(概念設(shè)計)E-R圖向關(guān)系表的轉(zhuǎn)換(邏輯設(shè)計)第4頁,共35頁,2023年,2月20日,星期六E-R模型的概念與表示實體集-語義(名詞類性)實體(Entity)事物就是在行動影響下物質(zhì)本身的改變,或者進(jìn)行??陀^存在并可相互區(qū)別的事物稱為實體。實體可以是具體的,也可以是抽象的概念或聯(lián)系。具有共性的一類實體可歸類為一個實體集(Entityset)。屬性(Attribute)實體所具有的某一特性稱為屬性。一個實體可以由若干個屬性來刻畫。域(Domain)屬性的取值范圍或類型。鍵或標(biāo)識符(Key)標(biāo)識符是實體中一個或多個屬性的集合,可用來唯一標(biāo)識實體中的一個實例。每個實體都必須至少有一個標(biāo)識符。如果實體只有一個標(biāo)識符,則它為實體的主標(biāo)識符。如果實體有多個標(biāo)識符,則其中一個被指定為主標(biāo)識符,其余的標(biāo)識符就是次標(biāo)識符了第5頁,共35頁,2023年,2月20日,星期六E-R模型的概念與表示聯(lián)系集-語義(動詞類型)實體之間可以通過聯(lián)系來相互關(guān)聯(lián)。與實體和實體集對應(yīng),聯(lián)系也可以分為聯(lián)系和聯(lián)系集,聯(lián)系集是實體集之間的聯(lián)系,聯(lián)系是實體之間的聯(lián)系,聯(lián)系是具有方向性的。聯(lián)系具有方向性,每個方向上都有一個基數(shù)。聯(lián)系的兩個方向上各自包含有一角色名,描述該方向聯(lián)系的作用。按照實體類型中實例之間的數(shù)量對應(yīng)關(guān)系,通常可將聯(lián)系分為4個基本聯(lián)系分為類,即一對一(ONE
TOONE)聯(lián)系、一對多(ONETOMANY)聯(lián)系、多對一(MANYTOONE)聯(lián)系和多對多聯(lián)系(MANYTOMANY)。三個特殊聯(lián)系每個實體類型都有自己的標(biāo)識符,如果兩個實體集之間發(fā)生聯(lián)系,其中一個實體類型的標(biāo)識符進(jìn)入另一個實體類型并與該實體類型中的標(biāo)識符共同組成其標(biāo)識符時,這種聯(lián)系則稱為標(biāo)定聯(lián)系,也叫依賴聯(lián)系。反之稱為非標(biāo)定聯(lián)系,也叫非依賴聯(lián)系。遞歸聯(lián)系是實體集內(nèi)部實例之間的一種聯(lián)系,通常形象地稱為自反聯(lián)系。同一實體類型中不同實體集之間的聯(lián)系也稱為遞歸聯(lián)系。第6頁,共35頁,2023年,2月20日,星期六E-R模型的概念與表示第7頁,共35頁,2023年,2月20日,星期六E-R模型的概念與表示E-R圖的設(shè)計步驟
第一步:針對特定的應(yīng)用,確定實體、屬性和實體間的聯(lián)系,畫出局部E-R圖。第二步:綜合各個局部E-R圖,產(chǎn)生反映數(shù)據(jù)庫整體概念的總體E-R圖。第8頁,共35頁,2023年,2月20日,星期六E-R模型的概念與表示弱實體集有些實體集的所有屬性都不足以形成主碼,這樣的實體集稱為弱實體集(WeakEntitySet),依賴于其它實體集而存在。與此相對,其屬性可以形成主碼的實體集稱為強(qiáng)實體集。弱實體集所依賴的實體集稱為標(biāo)識實體集(identifyingentityset),相應(yīng)的關(guān)系為標(biāo)識聯(lián)系(identifyingrelationship)。OrderItemdatestatuspaymentorder#item#tagInclude第9頁,共35頁,2023年,2月20日,星期六E-R模型的概念與表示弱實體集通常沒有主鍵。以訂單的分項為例,訂單項實體集可能有編號(局部的編號)、商品名稱、數(shù)量、單價等屬性,但是這些屬性不足以識別一個定單項,因為完全有可能在另外一張訂單中出現(xiàn)相同的內(nèi)容。必須把訂單的關(guān)鍵字(如一個全局的訂單編號)和定單項的局部編號結(jié)合起來才能標(biāo)示一個定單項。弱實體集的屬性中,用來與標(biāo)識實體集的鍵結(jié)合以識別一個弱實體集的屬性稱為部分鍵(partialkey)。弱實體集的主鍵=它的標(biāo)識實體集的鍵+它的部分鍵第10頁,共35頁,2023年,2月20日,星期六4.1E-R模型的概念與表示ER圖使用雙線矩形表示弱實體集,弱實體集與其標(biāo)識實體集之間的聯(lián)系用雙線菱形表示,弱實體集的部分鍵使用虛下劃線表示。OrderItemdatestatuspaymentorder#item#tagInclude第11頁,共35頁,2023年,2月20日,星期六E-R模型的概念與表示實體集的層次關(guān)系現(xiàn)實世界中的很多概念之間都具體層次關(guān)系。ER模型使用實體集間的繼承和ISA關(guān)系來描述這種概念間的層次關(guān)系實體集老師或?qū)W生都繼承自實體集人,并且實體集老師或?qū)W生與實體集人之間都滿足ISA關(guān)系,即老師或?qū)W生都是人的一種。ISA關(guān)系可以從兩個方向進(jìn)行設(shè)計從自上而下的方向,首先設(shè)計出人這一實體,然后根據(jù)屬性的不同,將兩種不同的人具體化(specification)為老師或者學(xué)生。從自下而上的方向,首先設(shè)計出老師或?qū)W生,然后將他們的共性提取出來,泛化(generalization)為人。第12頁,共35頁,2023年,2月20日,星期六E-R模型的概念與表示層次關(guān)系的約束從子實體集之間是否相交角度,不相交(disjoin)泛化要求繼承自同一父輩的多個子實體集之沒有交集,重疊(overlapping)泛化則允許有交集。從泛化是否完全角度,全參與泛化要求所有父輩實體都必須同時也是某一子輩實體,部分泛化則允許不是任何子輩實體的父輩實體存在。例如,在采用會員制的銷售系統(tǒng)中,顧客被分為會員(VIP)與非會員(NONVIP)兩種,會員擁有消費積分(credit),非會員擁有固定的折扣率(discount)。一個顧客要么是會員、要么是非會員,二者必取其一,因此為全參與不相交。第13頁,共35頁,2023年,2月20日,星期六E-R模型的概念與表示CustomerISAVIPNONVIPcreditdiscountdisjoincustomer#namegenderbirthdaycityaddressemail第14頁,共35頁,2023年,2月20日,星期六E-R圖例第15頁,共35頁,2023年,2月20日,星期六實體-聯(lián)系方法實體還是屬性凡是滿足以下兩條準(zhǔn)則的事物,一般均可作為屬性對待。作為屬性,不能再具有需要描述的性質(zhì)。屬性必須是不可分的數(shù)據(jù)項,不能包含其他屬性。屬性不能與其他實體具有聯(lián)系,即E-R圖中所表示的聯(lián)系是實體之間的聯(lián)系。例如書籍是一個實體,書號、書名、作者、出版社、定價是書籍的屬性,如果應(yīng)用系統(tǒng)不再需要作者的其他信息,如電話、住址、個人主頁等,那么根據(jù)原則1可以將作者作為書籍的屬性對待。但是如果這些信息是必須的,那么作者作為一個實體看待更為恰當(dāng)。第16頁,共35頁,2023年,2月20日,星期六實體-聯(lián)系方法bookisbntitlepricepresswritten_bynameauthorauthorcityserialbookisbntitlepricepressauthor第17頁,共35頁,2023年,2月20日,星期六實體-聯(lián)系方法實體還是聯(lián)系一般來說,實體對應(yīng)現(xiàn)實世界中實際存在的事物,是名詞類型;聯(lián)系對應(yīng)的概念一般是一種動作,是動詞類型。例如:書和作者都是現(xiàn)實世界中的名詞,因此作為實體。而written_by表示作者寫書這一動作,因此作為聯(lián)系。映射基數(shù)往往影響到一個概念是作為實體還是聯(lián)系的選擇。若一項貸款只能由一個分行發(fā)放,并且只能由一個客戶借貸,則將Loan作為Customer與Branch之間的聯(lián)系比較合適。但如果允許多個客戶共同借貸同一項貸款,在這種情況下,將Loan作為實體。第18頁,共35頁,2023年,2月20日,星期六實體-聯(lián)系方法二元關(guān)系還是多元關(guān)系數(shù)據(jù)庫中使用得最多的是二元聯(lián)系。通常,將多元關(guān)系轉(zhuǎn)換為二元關(guān)系。如學(xué)校選課系統(tǒng),涉及到學(xué)生、教室、教師、課程等多個實體,可表示為一個四元關(guān)系。
學(xué)生上課教室教師課程學(xué)生選課課程授課教師地點教室第19頁,共35頁,2023年,2月20日,星期六實體-聯(lián)系方法但也有一些情況下使用多元聯(lián)系更好(如需要表達(dá)多個實體集間的約束時)如學(xué)校選課系統(tǒng)中若一門課程可由多個教師教授,并且若課程和教師確定,則上課的地點也隨之確定。第20頁,共35頁,2023年,2月20日,星期六實體-聯(lián)系方法聯(lián)系屬性的放置影響聯(lián)系屬性放置的主要因素是聯(lián)系的映射基數(shù)。對于一對一或一對多聯(lián)系,選擇作為聯(lián)系屬性或?qū)嶓w屬性只是體現(xiàn)語義側(cè)重點的不同如銷售系統(tǒng)需要記錄顧客(Customer)與訂單(Order)之間的關(guān)系(Possess)。由于一個訂單只能由一個顧客所有,因此為顧客與訂單之間為一對多關(guān)系。這時,記錄生成訂單日期的屬性(date)既可以作為聯(lián)系Possess的屬性,也可作為訂單的屬性。
OrderdatestatuspaymentorderPossesCustomer第21頁,共35頁,2023年,2月20日,星期六實體-聯(lián)系方法對于多對多聯(lián)系,聯(lián)系的屬性不能作為實體的屬性。如,顧客與希望書籍之間的聯(lián)系希望購買(Wish_for)。Wish_for有一屬性date,表示顧客發(fā)出購買意向的日期,這一屬性不能作為參與聯(lián)系的兩個實體Customer或Book的屬性。BookWish_forCustomerdate第22頁,共35頁,2023年,2月20日,星期六實例——在線書店數(shù)據(jù)庫類似于Amazon的在線書店系統(tǒng)所用的數(shù)據(jù)庫數(shù)據(jù)庫中要求存儲所有書籍的相關(guān)信息,并對書加以分類;顧客的有關(guān)信息也要求存儲在數(shù)據(jù)庫中,并且允許用戶選擇自己感興趣的書籍類別及希望購買的圖書;顧客在決定購買時可以發(fā)出訂單,同一訂單可以包含多種書,每種書可一次購買多本。顧客在訂單中提供送貨地址,系統(tǒng)根據(jù)訂單發(fā)貨。第23頁,共35頁,2023年,2月20日,星期六第24頁,共35頁,2023年,2月20日,星期六實例——在線書店數(shù)據(jù)庫合并分E-R圖各分E-R圖之間的沖突主要有三類:屬性沖突
(1)屬性域沖突,即屬性值的類型、取值范圍或取值集合不同。
例如:屬性“訂單號”有的定義為字符型,有的為數(shù)值型。
(2)屬性取值單位沖突。
例如:屬性“庫存”有的以冊為單位,有的以千冊為單位。
命名沖突
(1)
同名異義。不同意義對象相同名稱。
例如:Author和Customer均有屬性name。
(2)
異名同義(一義多名)。同意義對象不相同名稱。
例如:“項目”和“課題”。
第25頁,共35頁,2023年,2月20日,星期六實例——在線書店數(shù)據(jù)庫結(jié)構(gòu)沖突
(1)
同一對象在不同應(yīng)用中具有不同的抽象。
例如:“作者”在某一局部應(yīng)用中被當(dāng)作實體,而在另一局部應(yīng)用中則被當(dāng)作屬性。
(2)
同一實體在不同局部視圖中所包含的屬性不完全相同,或者屬性的排列次序不完全相同。
(3)
實體之間的聯(lián)系在不同局部視圖中呈現(xiàn)不同的類型。
例如:實體E1與E2在局部應(yīng)用A中是多對多聯(lián)系,而在局部應(yīng)用B中是一對多聯(lián)系;又如在局部應(yīng)用X中E1與E2發(fā)生聯(lián)系,而在局部應(yīng)用Y中E1、E2、E3三者之間有聯(lián)系。
解決方法是根據(jù)應(yīng)用的語義對實體聯(lián)系的類型進(jìn)行綜合或調(diào)整。
第26頁,共35頁,2023年,2月20日,星期六E-R圖向表的轉(zhuǎn)換通過實體—聯(lián)系方法可以方便得得到現(xiàn)實世界的一個抽象模型,但這一模型并不能為數(shù)據(jù)庫管理系統(tǒng)接受。要完成從現(xiàn)實世界到信息世界的轉(zhuǎn)化,還必須將實體—聯(lián)系方法所得的E-R圖轉(zhuǎn)化為關(guān)系表定義。第27頁,共35頁,2023年,2月20日,星期六實體的轉(zhuǎn)換將一個普通實體(非弱實體)轉(zhuǎn)換為表定義是相當(dāng)直觀的,實體的每個屬性對應(yīng)表中的一個字段,實體的主鍵對應(yīng)表的主鍵。如Book實體轉(zhuǎn)化到表的結(jié)果為:Book(isbn,title,price,press,stock)第28頁,共35頁,2023年,2月20日,星期六聯(lián)系的轉(zhuǎn)換一個多對多聯(lián)系在轉(zhuǎn)換后也對應(yīng)一個表,表中的屬性包括參與聯(lián)系各實體的主鍵聯(lián)系的描述屬性參與聯(lián)系各實體的主鍵之和構(gòu)成表的超鍵。如多對多聯(lián)系Written_by轉(zhuǎn)化為表之后其主鍵將由參與該聯(lián)系的兩個實體Book和Author的主鍵構(gòu)成,如下:Written_by(isbn,author#,serial)第29頁,共35頁,2023年,2月20日,星期六聯(lián)系的轉(zhuǎn)換一對一和一對多聯(lián)系A(chǔ)與B之間是一對多聯(lián)系,不轉(zhuǎn)換為一張單獨的表,而只在B轉(zhuǎn)換后的表中增加A的主鍵屬性(當(dāng)然這些屬性將形成一個引用到A的主鍵的一個外鍵),以此表示某B實體所從屬的A實體。這種方法可以產(chǎn)生更少的表,有利于提高數(shù)據(jù)庫性能,還可以表達(dá)更多的約束如對于聯(lián)系Possess,將在Order表中增加一列customer#表示訂單從屬的顧客第30頁,共35頁,2023年,2月20日,星期六弱實體的轉(zhuǎn)換由于弱實體總是全參與它與它的標(biāo)識實體之間的多對一聯(lián)系,因此可以采用上面提出的一對多聯(lián)系方法進(jìn)行轉(zhuǎn)換。弱實體轉(zhuǎn)換后生成的表的主鍵由標(biāo)識實體的主鍵與弱實體本身的部分鍵組合而成。如弱實體Item轉(zhuǎn)換后,構(gòu)成如下:Item(order#,item#,isbn,qty)第31頁,共35頁,2023年,2月20日,星期六實體層次的轉(zhuǎn)換將實體層次轉(zhuǎn)換為表定義時可采用兩種方法父輩實體與子輩實體都轉(zhuǎn)換為單獨的表
通用方法,任何情況適用。每一個子輩實體轉(zhuǎn)換為單獨的表,其中既包含各子輩實體的特殊屬性,也包含子輩與父輩實體的公有屬性。
只適用全參與泛化,因無法比哦啊是不從屬于任何子輩實體的父輩實體如Customer與VIP、NONVIP之間的全參與泛化可用第二種方法轉(zhuǎn)換為:VIP(customer#,name,gender,birthday,city,address,email,credit)NONVIP(customer#,name,gender,birthday,city,address,email,
discount)第32頁,共35頁,2023年,2月20日,星期六一些實際的考慮一般來
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 【《現(xiàn)代古箏演奏技巧在民族響樂團(tuán)中的影響探究》5300字(論文)】
- 【《加加食品公司人力資源績效管理存在的問題及優(yōu)化案例8600字》(論文)】
- 新學(xué)期計劃書職中300字(15篇)
- 2024年客服年終工作總結(jié)參考模板(三篇)
- 2024年年終總結(jié)參考樣本(四篇)
- 2024年小學(xué)學(xué)??记谥贫确段模ㄈ?/a>
- 2024年醫(yī)院院感科質(zhì)控小組成員及職責(zé)范本(二篇)
- 2024年商鋪買賣合同范例(四篇)
- 2024年小學(xué)衛(wèi)生室工作計劃(三篇)
- 2024年幼兒園小班安全計劃例文(四篇)
- 3-4單元測試-2024-2025學(xué)年統(tǒng)編版語文六年級上冊
- 2024-2030年中國濱海旅游行業(yè)發(fā)展分析及投資戰(zhàn)略研究咨詢報告
- 八年級物理第一次月考卷(考試版A3)(遼寧專用人教版2024第1~3章第2節(jié))
- 2024-2030年中國農(nóng)村商業(yè)銀行行業(yè)市場深度調(diào)研及發(fā)展趨勢與投資前景研究報告
- 2024至2030年中國商業(yè)POS機(jī)行業(yè)現(xiàn)狀調(diào)研及未來發(fā)展展望報告
- 公共衛(wèi)生突發(fā)事件應(yīng)急處理與防治考核試卷
- 5.2 外力作用與地表形態(tài)高三地理一輪復(fù)習(xí)課件
- NB/T 11446-2023煤礦連采連充技術(shù)要求
- 護(hù)理美學(xué)-第一章 美學(xué)概述
- 空調(diào)管路設(shè)計規(guī)范
- 消防故障排查合同范本
評論
0/150
提交評論