數(shù)據(jù)庫(kù)及數(shù)據(jù)倉(cāng)庫(kù)精要-課件_第1頁(yè)
數(shù)據(jù)庫(kù)及數(shù)據(jù)倉(cāng)庫(kù)精要-課件_第2頁(yè)
數(shù)據(jù)庫(kù)及數(shù)據(jù)倉(cāng)庫(kù)精要-課件_第3頁(yè)
數(shù)據(jù)庫(kù)及數(shù)據(jù)倉(cāng)庫(kù)精要-課件_第4頁(yè)
數(shù)據(jù)庫(kù)及數(shù)據(jù)倉(cāng)庫(kù)精要-課件_第5頁(yè)
已閱讀5頁(yè),還剩99頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)據(jù)庫(kù)及數(shù)據(jù)倉(cāng)庫(kù)精要終極目標(biāo):Ad-hoc報(bào)表系統(tǒng)Ad-hoc釋義:即時(shí)的、隨意的、特殊的數(shù)據(jù)庫(kù)及數(shù)據(jù)倉(cāng)庫(kù)精要終極目標(biāo):Ad-hoc報(bào)表系統(tǒng)Ad-ho前言數(shù)據(jù)庫(kù)扮演的角色也叫聯(lián)機(jī)事務(wù)處理OLAP(OnlineTransactionalProcessing),數(shù)據(jù)庫(kù)保存由日常管理過(guò)程中涉及的業(yè)務(wù)操作創(chuàng)建的操作型結(jié)構(gòu)化數(shù)據(jù),數(shù)據(jù)記錄系統(tǒng)管理行為(通過(guò)各種業(yè)務(wù)邏輯來(lái)交互)。反映細(xì)粒度的事務(wù)數(shù)據(jù),保存時(shí)間短。主要依賴關(guān)系模式建模方法論。數(shù)據(jù)倉(cāng)庫(kù)扮演的角色也叫聯(lián)機(jī)分析處理OLAP(OnlineAnalyticalProcessing),數(shù)據(jù)由聯(lián)機(jī)事務(wù)處理來(lái),經(jīng)過(guò)選擇和聚集,變?yōu)榻y(tǒng)計(jì)分析事實(shí)產(chǎn)生的因果,輔助決策制定(通過(guò)各種統(tǒng)計(jì)分析報(bào)表來(lái)交互)。反映大范圍的事實(shí)數(shù)據(jù)(業(yè)務(wù)事件的累積),保存時(shí)間長(zhǎng)。主要依賴多維模式建模方法論主題、事實(shí)和事件(請(qǐng)注意語(yǔ)義)

事實(shí)是一個(gè)主題,比如:銷售、配送、住院、手術(shù)等。一個(gè)主題對(duì)應(yīng)了多個(gè)相互關(guān)聯(lián)的關(guān)系模式,也可以叫做相關(guān)關(guān)系表。事實(shí)的實(shí)例對(duì)應(yīng)著發(fā)生的事件,比如:一個(gè)執(zhí)行的銷售、配送、住院、手術(shù)等都是一個(gè)事件。每個(gè)事實(shí)由一組提供了事件的量化描述的度量的屬性值描述,比如:銷售收入、配送量、住院支出、手術(shù)時(shí)間等通過(guò)語(yǔ)義將數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)結(jié)合在一起前言數(shù)據(jù)庫(kù)扮演的角色從報(bào)表到報(bào)表存在的問(wèn)題及對(duì)策綱領(lǐng)對(duì)策綱領(lǐng)實(shí)體(關(guān)系所代表的實(shí)體)原子化,是指實(shí)體本身不能再分解屬性原子化,是指實(shí)體的屬性(值域所代表的屬性)本身不能再分解主鍵原子化,是指實(shí)體的主鍵本身是一個(gè)唯一的ID字段聯(lián)系原子化,是指實(shí)體間的聯(lián)系(關(guān)系所代表的聯(lián)系)都是一對(duì)多的聯(lián)系命題原子化,是指語(yǔ)義角度的聯(lián)系原子化現(xiàn)實(shí)(面對(duì)單一主題,數(shù)據(jù)規(guī)模極小,僅是面對(duì)招投標(biāo)業(yè)務(wù)追蹤)1)第二個(gè)表是從第一個(gè)表通過(guò)高級(jí)程序員編寫VBA程序?qū)崿F(xiàn),第一個(gè)表也是專業(yè)定崗員工通過(guò)Excel專用表單維護(hù)和更新的,背后其實(shí)還是高級(jí)程序員的工作價(jià)值體現(xiàn)2)信息化崗位需求及配置:高級(jí)程序員四名,六個(gè)專業(yè)業(yè)務(wù)人員。滿負(fù)荷工作以應(yīng)對(duì)數(shù)據(jù)變動(dòng)和操作功能變動(dòng)解決方案:報(bào)表列表化,去除冗余數(shù)據(jù),建模信息化模型(數(shù)據(jù)庫(kù)模型)并影射和實(shí)現(xiàn)為Access桌面數(shù)據(jù)庫(kù)應(yīng)用從報(bào)表到報(bào)表存在的問(wèn)題及對(duì)策綱領(lǐng)對(duì)策綱領(lǐng)現(xiàn)實(shí)(面對(duì)單一主題,問(wèn)題的導(dǎo)入-從Excel表格出發(fā)引出的問(wèn)題結(jié)構(gòu)良好的表,范式,SQL語(yǔ)言,關(guān)系模式及E-R圖基本表與中間表、臨時(shí)表不同,基本表及其字段之間的關(guān)系,應(yīng)盡量滿足第三范式,是結(jié)構(gòu)良好的表,它可以消除刪除行,改變行,修改行(實(shí)例)的錯(cuò)誤和異常。它具有如下四個(gè)特性:(1)原子性,基本表中的字段是不可再分解的。(2)原始性,基本表中的記錄是原始數(shù)據(jù)(基礎(chǔ)數(shù)據(jù))的記錄。(3)演繹性,由基本表與代碼表中的數(shù)據(jù),可以派生出所有的輸出數(shù)據(jù)。(4)穩(wěn)定性,基本表的結(jié)構(gòu)是相對(duì)穩(wěn)定的,表中的記錄是要長(zhǎng)期保存的。(5)基本表的每個(gè)決定因子都必須是候選建。(6)非基本表必須分解為兩個(gè)或多個(gè)基本表。三個(gè)基本范式:(1)1NF是對(duì)屬性的原子性約束,要求屬性具有原子性,不可再分解。(2)2NF是對(duì)記錄的惟一性約束,要求記錄有惟一標(biāo)識(shí),即實(shí)體的惟一性。(3)3NF是對(duì)字段冗余性的約束,即任何字段不能由其他字段派生出來(lái),它要求字段沒有冗余大多數(shù)結(jié)構(gòu)不良好的表,會(huì)產(chǎn)生或包含大量的冗余數(shù)據(jù),同時(shí)可能會(huì)出現(xiàn)刪除行,改變行,修改行的錯(cuò)誤和異常,這都是都是使用了SQLDMLCURD語(yǔ)句產(chǎn)生的。像中間表、報(bào)表和臨時(shí)表:(1)

中間表是存放統(tǒng)計(jì)分析數(shù)據(jù)的表,它是為數(shù)據(jù)倉(cāng)庫(kù)、輸出報(bào)表或查詢結(jié)果而設(shè)計(jì)的,有時(shí)它沒有主鍵與外鍵(數(shù)據(jù)倉(cāng)庫(kù)除外)。(2)

臨時(shí)表是程序員個(gè)人設(shè)計(jì)的,存放臨時(shí)記錄,為個(gè)人所用。(3)

基表和中間表由DBA維護(hù),臨時(shí)表由程序員自己用程序自動(dòng)維護(hù)。關(guān)系是一個(gè)由行和列組成的二維表,不一定結(jié)構(gòu)良好,特征為:行包括實(shí)體的數(shù)據(jù),列包含實(shí)體性質(zhì)的數(shù)據(jù),表中的單元格存儲(chǔ)單個(gè)值,每列的所有實(shí)體類型一致,每列具有唯一名稱,列的順序任意,行的順序任意,任意兩行互不重復(fù)。這是最大的復(fù)合關(guān)系模式的條件,符合這個(gè)要求的表就是關(guān)系型表格。通過(guò)E-R圖將這些概念反映出來(lái),通過(guò)名詞性和動(dòng)詞性,完全可以描述客觀世界,其中名詞性描述實(shí)體,動(dòng)詞性描述聯(lián)系或動(dòng)作影響,通過(guò)動(dòng)詞性將不同的實(shí)體關(guān)聯(lián)在一起第一目標(biāo)或者叫基礎(chǔ)目標(biāo):統(tǒng)計(jì),匯總及分析報(bào)表的工作盡量地自動(dòng)用Excel或Spreadsheet做,幾乎不需人為干預(yù)問(wèn)題的導(dǎo)入-從Excel表格出發(fā)引出的問(wèn)題結(jié)構(gòu)良好的表,范式目錄E-R模型的概念與表示實(shí)體-聯(lián)系方法(概念模型及設(shè)計(jì),關(guān)注現(xiàn)實(shí)世界)關(guān)系模式的規(guī)范化(消除數(shù)據(jù)冗余,避免操作異常)E-R圖向關(guān)系表(Schema)的轉(zhuǎn)換(邏輯模型及設(shè)計(jì),關(guān)注信息世界)多維模式與統(tǒng)計(jì)分析的關(guān)系Excel或Spreadsheet在統(tǒng)計(jì)分析中的角色統(tǒng)計(jì)分析系統(tǒng)(多維模式建構(gòu))的演進(jìn)終極目標(biāo):Ad-hoc報(bào)表系統(tǒng)目錄E-R模型的概念與表示關(guān)于現(xiàn)實(shí)世界事實(shí)及描述的定義事實(shí)包括以下四個(gè)方面:

第一:事實(shí)是指“某物具有某種性質(zhì)或某些事物具有某種關(guān)系?!?/p>

與原子命題、分子命題的分類相對(duì)應(yīng),事實(shí)可以分為原子事實(shí)、分子事實(shí)。其中,原子事實(shí)是最基本、最簡(jiǎn)單的事實(shí),從中不能再析出其它事實(shí);分子事實(shí)是原子事實(shí)的復(fù)合

第二:事實(shí)具有客觀性?!按蠖鄶?shù)的事實(shí)的存在都不依靠我們的意愿;這就是為什么我們把它們叫作‘嚴(yán)峻的’、‘不肯遷就的’或‘不可抗拒’的理由。大部分物理事實(shí)的存在不僅不依靠我們的意愿,而且也不依靠我們的存在”

第三:現(xiàn)實(shí)世界由各種各樣的事實(shí)組合而成,事實(shí)屬于現(xiàn)實(shí)世界

第四:事實(shí)決定命題的真?zhèn)?,“事?shí)是使得命題為真或?yàn)榧俚臇|西”。具體說(shuō)來(lái),原子命題的真假取決于它是否與原子事實(shí)相符合,分子命題的真假取決于組成它的原子命題的真假現(xiàn)實(shí)世界的語(yǔ)義描述的存在第一:原子命題第二:分子命題第三:段落(由多個(gè)邏輯緊密相關(guān)的分子命題構(gòu)成)第四:主題(由多個(gè)邏輯緊密相關(guān)的段落構(gòu)成)關(guān)于現(xiàn)實(shí)世界事實(shí)及描述的定義事實(shí)包括以下四個(gè)方面:E-R模型的概念與表示E-R圖也稱實(shí)體-聯(lián)系圖(EntityRelationshipDiagram),提供了表示實(shí)體類型、實(shí)體屬性和相關(guān)實(shí)體之間聯(lián)系(三個(gè)要素)的方法,用來(lái)描述現(xiàn)實(shí)世界的概念模型關(guān)系數(shù)據(jù)庫(kù)使用實(shí)體-聯(lián)系模型(E-R模型)進(jìn)行數(shù)據(jù)庫(kù)設(shè)計(jì),以構(gòu)造信息世界的邏輯模型。E-R數(shù)據(jù)庫(kù)設(shè)計(jì)工具提供了一個(gè)“方框與箭頭”的繪圖工具,幫助數(shù)據(jù)庫(kù)用戶建立E-R圖來(lái)描繪數(shù)據(jù),邏輯及現(xiàn)實(shí)世界E-R圖可以手繪,亦可以借用Case工具(PowerDesigner,Visio或SQL

Power

Architect)做出考察單獨(dú)的一個(gè)聯(lián)系(動(dòng)詞類型的語(yǔ)義連接及構(gòu)造能力),聯(lián)系及相互關(guān)聯(lián)的實(shí)體形成的一個(gè)描述,構(gòu)造了一個(gè)最基本的原子命題E-R模型的概念與表示E-R圖也稱實(shí)體-聯(lián)系圖(EntityE-R模型的概念與表示實(shí)體集-語(yǔ)義(名詞類性)實(shí)體(Entity)事物就是在行動(dòng)影響下物質(zhì)本身的改變,或者進(jìn)行??陀^存在并可相互區(qū)別的事物稱為實(shí)體。實(shí)體可以是具體的,也可以是抽象的概念或聯(lián)系。具有共性的一類實(shí)體可歸類為一個(gè)實(shí)體集(Entityset)。屬性(Attribute)實(shí)體所具有的某一特性稱為屬性。一個(gè)實(shí)體可以由若干個(gè)屬性來(lái)刻畫。域(Domain)屬性的取值范圍或類型。鍵或標(biāo)識(shí)符(Key)標(biāo)識(shí)符是實(shí)體中一個(gè)或多個(gè)屬性的集合,可用來(lái)唯一標(biāo)識(shí)實(shí)體中的一個(gè)實(shí)例。每個(gè)實(shí)體都必須至少有一個(gè)標(biāo)識(shí)符。如果實(shí)體只有一個(gè)標(biāo)識(shí)符,則它為實(shí)體的主標(biāo)識(shí)符。如果實(shí)體有多個(gè)標(biāo)識(shí)符,則其中一個(gè)被指定為主標(biāo)識(shí)符,其余的標(biāo)識(shí)符就是次標(biāo)識(shí)符(候選標(biāo)識(shí)符)E-R模型的概念與表示實(shí)體集-語(yǔ)義(名詞類性)E-R模型的概念與表示聯(lián)系集-語(yǔ)義(動(dòng)詞類型)實(shí)體之間可以通過(guò)聯(lián)系來(lái)相互關(guān)聯(lián)。與實(shí)體和實(shí)體集對(duì)應(yīng),聯(lián)系也可以分為聯(lián)系和聯(lián)系集,聯(lián)系集是實(shí)體集之間的聯(lián)系,聯(lián)系是實(shí)體之間的聯(lián)系,聯(lián)系是具有方向性的。聯(lián)系具有方向性,每個(gè)方向上都有一個(gè)基數(shù)。聯(lián)系的兩個(gè)方向上各自包含有一角色名,描述該方向聯(lián)系的作用。按照實(shí)體類型中實(shí)例之間的數(shù)量對(duì)應(yīng)關(guān)系,通??蓪⒙?lián)系分為4個(gè)基本聯(lián)系分為類,即一對(duì)一(ONE

TOONE)聯(lián)系、一對(duì)多(ONETOMANY)聯(lián)系、多對(duì)一(MANYTOONE)聯(lián)系和多對(duì)多聯(lián)系(MANYTOMANY)。三個(gè)特殊聯(lián)系每個(gè)實(shí)體類型都有自己的標(biāo)識(shí)符,如果兩個(gè)實(shí)體集之間發(fā)生聯(lián)系,其中一個(gè)實(shí)體類型的標(biāo)識(shí)符進(jìn)入另一個(gè)實(shí)體類型并與該實(shí)體類型中的標(biāo)識(shí)符共同組成其標(biāo)識(shí)符時(shí),這種聯(lián)系則稱為標(biāo)定聯(lián)系,也叫依賴聯(lián)系。反之稱為非標(biāo)定聯(lián)系,也叫非依賴聯(lián)系。遞歸聯(lián)系是實(shí)體集內(nèi)部實(shí)例之間的一種聯(lián)系,通常形象地稱為自反聯(lián)系。同一實(shí)體類型中不同實(shí)體集之間的聯(lián)系也稱為遞歸聯(lián)系。E-R模型的概念與表示聯(lián)系集-語(yǔ)義(動(dòng)詞類型)E-R模型的概念與表示(使用Case工具時(shí)的圖符及事例)E-R模型的概念與表示(使用Case工具時(shí)的圖符及事例)E-R模型的概念與表示E-R圖的設(shè)計(jì)步驟

第一步:針對(duì)特定的應(yīng)用,確定實(shí)體、屬性和實(shí)體間的聯(lián)系,畫出局部E-R圖。第二步:綜合各個(gè)局部E-R圖,產(chǎn)生反映數(shù)據(jù)庫(kù)整體概念的總體E-R圖。E-R模型的概念與表示E-R圖的設(shè)計(jì)步驟E-R模型的概念與表示(手繪草圖事例)弱實(shí)體集有些實(shí)體集的所有屬性都不足以形成主碼,這樣的實(shí)體集稱為弱實(shí)體集(WeakEntitySet),依賴于其它實(shí)體集而存在。與此相對(duì),其屬性可以形成主碼的實(shí)體集稱為強(qiáng)實(shí)體集。弱實(shí)體集所依賴的實(shí)體集稱為標(biāo)識(shí)實(shí)體集(identifyingentityset),相應(yīng)的關(guān)系為標(biāo)識(shí)聯(lián)系(identifyingrelationship)。OrderItemdatestatuspaymentorder#item#tagIncludeE-R模型的概念與表示(手繪草圖事例)弱實(shí)體集OrderItE-R模型的概念與表示弱實(shí)體集通常沒有主鍵。以訂單的分項(xiàng)為例,訂單項(xiàng)實(shí)體集可能有編號(hào)(局部的編號(hào))、商品名稱、數(shù)量、單價(jià)等屬性,但是這些屬性不足以識(shí)別一個(gè)定單項(xiàng),因?yàn)橥耆锌赡茉诹硗庖粡堄唵沃谐霈F(xiàn)相同的內(nèi)容。必須把訂單的關(guān)鍵字(如一個(gè)全局的訂單編號(hào))和定單項(xiàng)的局部編號(hào)結(jié)合起來(lái)才能標(biāo)示一個(gè)定單項(xiàng)。弱實(shí)體集的屬性中,用來(lái)與標(biāo)識(shí)實(shí)體集的鍵結(jié)合以識(shí)別一個(gè)弱實(shí)體集的屬性稱為部分鍵(partialkey)。弱實(shí)體集的主鍵=它的標(biāo)識(shí)實(shí)體集的鍵+它的部分鍵E-R模型的概念與表示弱實(shí)體集通常沒有主鍵。E-R模型的概念與表示(手繪草圖事例)E-R圖使用雙線矩形表示弱實(shí)體集,弱實(shí)體集與其標(biāo)識(shí)實(shí)體集之間的聯(lián)系用雙線菱形表示,弱實(shí)體集的部分鍵使用虛下劃線表示。OrderItemdatestatuspaymentorder#item#tagIncludeE-R模型的概念與表示(手繪草圖事例)E-R圖使用雙線矩形表E-R模型的概念與表示實(shí)體集的層次關(guān)系現(xiàn)實(shí)世界中的很多概念之間都具體層次關(guān)系。E-R模型使用實(shí)體集間的繼承和ISA關(guān)系來(lái)描述這種概念間的層次關(guān)系實(shí)體集老師或?qū)W生都繼承自實(shí)體集人,并且實(shí)體集老師或?qū)W生與實(shí)體集人之間都滿足ISA關(guān)系,即老師或?qū)W生都是人的一種。ISA關(guān)系可以從兩個(gè)方向進(jìn)行設(shè)計(jì)從自上而下的方向,首先設(shè)計(jì)出人這一實(shí)體,然后根據(jù)屬性的不同,將兩種不同的人具體化(specification)為老師或者學(xué)生。從自下而上的方向,首先設(shè)計(jì)出老師或?qū)W生,然后將他們的共性提取出來(lái),泛化(generalization)為人。E-R模型的概念與表示實(shí)體集的層次關(guān)系E-R模型的概念與表示層次關(guān)系的約束從子實(shí)體集之間是否相交角度,不相交(disjoin)泛化要求繼承自同一父輩的多個(gè)子實(shí)體集之沒有交集,重疊(overlapping)泛化則允許有交集。從泛化是否完全角度,全參與泛化要求所有父輩實(shí)體都必須同時(shí)也是某一子輩實(shí)體,部分泛化則允許不是任何子輩實(shí)體的父輩實(shí)體存在。例如,在采用會(huì)員制的銷售系統(tǒng)中,顧客被分為會(huì)員(VIP)與非會(huì)員(NONVIP)兩種,會(huì)員擁有消費(fèi)積分(credit),非會(huì)員擁有固定的折扣率(discount)。一個(gè)顧客要么是會(huì)員、要么是非會(huì)員,二者必取其一,因此為全參與不相交。E-R模型的概念與表示層次關(guān)系的約束E-R模型的概念與表示(手繪草圖事例)CustomerISAVIPNONVIPcreditdiscountdisjoincustomer#namegenderbirthdaycityaddressemailE-R模型的概念與表示(手繪草圖事例)CustomerISAE-R圖符(手繪草圖事例)E-R圖符(手繪草圖事例)實(shí)體-聯(lián)系方法實(shí)體還是屬性凡是滿足以下兩條準(zhǔn)則的事物,一般均可作為屬性對(duì)待。作為屬性,不能再具有需要描述的性質(zhì)。屬性必須是不可分的數(shù)據(jù)項(xiàng),不能包含其他屬性。屬性不能與其他實(shí)體具有聯(lián)系,即E-R圖中所表示的聯(lián)系是實(shí)體之間的聯(lián)系。例如書籍是一個(gè)實(shí)體,書號(hào)、書名、作者、出版社、定價(jià)是書籍的屬性,如果應(yīng)用系統(tǒng)不再需要作者的其他信息,如電話、住址、個(gè)人主頁(yè)等,那么根據(jù)原則1可以將作者作為書籍的屬性對(duì)待。但是如果這些信息是必須的,那么作者作為一個(gè)實(shí)體看待更為恰當(dāng)。實(shí)體-聯(lián)系方法實(shí)體還是屬性實(shí)體-聯(lián)系方法(手繪草圖事例)bookisbntitlepricepresswritten_bynameauthorauthorcityserialbookisbntitlepricepressauthor實(shí)體-聯(lián)系方法(手繪草圖事例)bookisbntitlep實(shí)體-聯(lián)系方法實(shí)體還是聯(lián)系一般來(lái)說(shuō),實(shí)體對(duì)應(yīng)現(xiàn)實(shí)世界中實(shí)際存在的事物,是名詞類型;聯(lián)系對(duì)應(yīng)的概念一般是一種動(dòng)作,是動(dòng)詞類型。例如:書和作者都是現(xiàn)實(shí)世界中的名詞,因此作為實(shí)體。而written_by表示作者寫書這一動(dòng)作,因此作為聯(lián)系。映射基數(shù)往往影響到一個(gè)概念是作為實(shí)體還是聯(lián)系的選擇。若一項(xiàng)貸款只能由一個(gè)分行發(fā)放,并且只能由一個(gè)客戶借貸,則將Loan作為Customer與Branch之間的聯(lián)系比較合適。但如果允許多個(gè)客戶共同借貸同一項(xiàng)貸款,在這種情況下,將Loan作為實(shí)體。實(shí)體-聯(lián)系方法實(shí)體還是聯(lián)系實(shí)體-聯(lián)系方法(手繪草圖事例)二元關(guān)系還是多元關(guān)系數(shù)據(jù)庫(kù)中使用得最多的是二元聯(lián)系。通常,將多元關(guān)系轉(zhuǎn)換為二元關(guān)系。如學(xué)校選課系統(tǒng),涉及到學(xué)生、教室、教師、課程等多個(gè)實(shí)體,可表示為一個(gè)四元關(guān)系。

學(xué)生上課教室教師課程學(xué)生選課課程授課教師地點(diǎn)教室實(shí)體-聯(lián)系方法(手繪草圖事例)二元關(guān)系還是多元關(guān)系學(xué)生上課教實(shí)體-聯(lián)系方法(手繪草圖事例)但也有一些情況下使用多元聯(lián)系更好(如需要表達(dá)多個(gè)實(shí)體集間的約束時(shí))如學(xué)校選課系統(tǒng)中若一門課程可由多個(gè)教師教授,并且若課程和教師確定,則上課的地點(diǎn)也隨之確定。實(shí)體-聯(lián)系方法(手繪草圖事例)但也有一些情況下使用多元聯(lián)系更實(shí)體-聯(lián)系方法(手繪草圖事例)聯(lián)系屬性的放置影響聯(lián)系屬性放置的主要因素是聯(lián)系的映射基數(shù)。對(duì)于一對(duì)一或一對(duì)多聯(lián)系,選擇作為聯(lián)系屬性或?qū)嶓w屬性只是體現(xiàn)語(yǔ)義側(cè)重點(diǎn)的不同如銷售系統(tǒng)需要記錄顧客(Customer)與訂單(Order)之間的關(guān)系(Possess)。由于一個(gè)訂單只能由一個(gè)顧客所有,因此為顧客與訂單之間為一對(duì)多關(guān)系。這時(shí),記錄生成訂單日期的屬性(date)既可以作為聯(lián)系Possess的屬性,也可作為訂單的屬性。

OrderdatestatuspaymentorderPossesCustomer實(shí)體-聯(lián)系方法(手繪草圖事例)聯(lián)系屬性的放置Orderdat實(shí)體-聯(lián)系方法(手繪草圖事例)對(duì)于多對(duì)多聯(lián)系,聯(lián)系的屬性不能作為實(shí)體的屬性。如,顧客與希望書籍之間的聯(lián)系希望購(gòu)買(Wish_for)。Wish_for有一屬性date,表示顧客發(fā)出購(gòu)買意向的日期,這一屬性不能作為參與聯(lián)系的兩個(gè)實(shí)體Customer或Book的屬性。BookWish_forCustomerdate實(shí)體-聯(lián)系方法(手繪草圖事例)對(duì)于多對(duì)多聯(lián)系,聯(lián)系的屬性不能實(shí)例——在線書店數(shù)據(jù)庫(kù)類似于Amazon的在線書店系統(tǒng)所用的數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)中要求存儲(chǔ)所有書籍的相關(guān)信息,并對(duì)書加以分類;顧客的有關(guān)信息也要求存儲(chǔ)在數(shù)據(jù)庫(kù)中,并且允許用戶選擇自己感興趣的書籍類別及希望購(gòu)買的圖書;顧客在決定購(gòu)買時(shí)可以發(fā)出訂單,同一訂單可以包含多種書,每種書可一次購(gòu)買多本。顧客在訂單中提供送貨地址,系統(tǒng)根據(jù)訂單發(fā)貨。實(shí)例——在線書店數(shù)據(jù)庫(kù)類似于Amazon的在線書店系統(tǒng)所用的實(shí)例——在線書店數(shù)據(jù)庫(kù)E-R圖(手繪草圖事例)實(shí)例——在線書店數(shù)據(jù)庫(kù)E-R圖(手繪草圖事例)實(shí)例——在線書店數(shù)據(jù)庫(kù)合并分E-R圖各分E-R圖之間的沖突主要有三類:屬性沖突

(1)屬性域沖突,即屬性值的類型、取值范圍或取值集合不同。

例如:屬性“訂單號(hào)”有的定義為字符型,有的為數(shù)值型。

(2)屬性取值單位沖突。

例如:屬性“庫(kù)存”有的以冊(cè)為單位,有的以千冊(cè)為單位。

命名沖突

(1)

同名異義。不同意義對(duì)象相同名稱。

例如:Author和Customer均有屬性name。

(2)

異名同義(一義多名)。同意義對(duì)象不相同名稱。

例如:“項(xiàng)目”和“課題”。

實(shí)例——在線書店數(shù)據(jù)庫(kù)合并分E-R圖實(shí)例——在線書店數(shù)據(jù)庫(kù)結(jié)構(gòu)沖突

(1)

同一對(duì)象在不同應(yīng)用中具有不同的抽象。

例如:“作者”在某一局部應(yīng)用中被當(dāng)作實(shí)體,而在另一局部應(yīng)用中則被當(dāng)作屬性。

(2)

同一實(shí)體在不同局部視圖中所包含的屬性不完全相同,或者屬性的排列次序不完全相同。

(3)

實(shí)體之間的聯(lián)系在不同局部視圖中呈現(xiàn)不同的類型。

例如:實(shí)體E1與E2在局部應(yīng)用A中是多對(duì)多聯(lián)系,而在局部應(yīng)用B中是一對(duì)多聯(lián)系;又如在局部應(yīng)用X中E1與E2發(fā)生聯(lián)系,而在局部應(yīng)用Y中E1、E2、E3三者之間有聯(lián)系。

解決方法是根據(jù)應(yīng)用的語(yǔ)義對(duì)實(shí)體聯(lián)系的類型進(jìn)行綜合或調(diào)整。

實(shí)例——在線書店數(shù)據(jù)庫(kù)結(jié)構(gòu)沖突

(1)

同一對(duì)關(guān)系模式設(shè)計(jì)范式(范式,數(shù)據(jù)庫(kù)設(shè)計(jì)范式,數(shù)據(jù)庫(kù)關(guān)系表的設(shè)計(jì)范式)是符合某一種級(jí)別的關(guān)系模式的集合。構(gòu)造數(shù)據(jù)庫(kù)必須遵循一定的規(guī)則。在關(guān)系數(shù)據(jù)庫(kù)中,這種規(guī)則或者叫約束就是范式。關(guān)系數(shù)據(jù)庫(kù)中的關(guān)系必須滿足一定的要求,即滿足不同的范式第一范式(1NF):在任何一個(gè)關(guān)系數(shù)據(jù)庫(kù)中,第一范式(1NF)是對(duì)關(guān)系模式的基本要求,不滿足第一范式(1NF)的數(shù)據(jù)庫(kù)就不是關(guān)系數(shù)據(jù)庫(kù)。所謂第一范式(1NF)是指數(shù)據(jù)庫(kù)表的每一列都是不可分割的基本數(shù)據(jù)項(xiàng),同一列中不能有多個(gè)值,即實(shí)體中的某個(gè)屬性不能有多個(gè)值或者不能有重復(fù)的屬性。如果出現(xiàn),就可能需要定義一個(gè)新的實(shí)體,新實(shí)體與原實(shí)體之間為一對(duì)多關(guān)系第二范式(2NF):數(shù)據(jù)庫(kù)表中不存在非關(guān)鍵字段對(duì)任一候選關(guān)鍵字段的部分函數(shù)依賴(部分函數(shù)依賴指的是存在組合關(guān)鍵字中的某些字段決定非關(guān)鍵字段的情況),也即所有非關(guān)鍵字段都完全依賴于任意一組候選關(guān)鍵字。如果存在,那么這個(gè)屬性和主關(guān)鍵字的這一部分應(yīng)該分離出來(lái)形成一個(gè)新的實(shí)體,新實(shí)體與原實(shí)體之間是一對(duì)多的關(guān)系第三范式(3NF):要求一個(gè)數(shù)據(jù)庫(kù)表中不包含已在其它表中已包含的非主關(guān)鍵字信息。例如,存在一個(gè)部門信息表,其中每個(gè)部門有部門編號(hào)(dept_id)、部門名稱、部門簡(jiǎn)介等信息。那么在員工信息表中列出部門編號(hào)后就不能再將部門名稱、部門簡(jiǎn)介等與部門有關(guān)的信息再加入員工信息表中。如果不存在部門信息表,則根據(jù)第三范式(3NF)也應(yīng)該構(gòu)建它,否則就會(huì)有大量的數(shù)據(jù)冗余。如果存在,應(yīng)該分離這一部分出來(lái)形成一個(gè)新的實(shí)體,新實(shí)體與原實(shí)體之間是一對(duì)多的關(guān)系關(guān)鍵要理解定義這種范式標(biāo)準(zhǔn)的主要目的是為了減少數(shù)據(jù)冗余,數(shù)據(jù)冗余產(chǎn)生的本質(zhì)就是在一個(gè)表中存在字段與字段之間的一對(duì)多,或者多對(duì)多關(guān)系。滿足這些規(guī)范的數(shù)據(jù)庫(kù)是簡(jiǎn)潔的、結(jié)構(gòu)明晰的,同時(shí),也不會(huì)發(fā)生插入(insert)、刪除(delete)和更新(update)操作異常。反之則是亂七八糟,不僅給數(shù)據(jù)庫(kù)的編程人員制造麻煩,而且面目可憎,可能存儲(chǔ)了大量不需要的冗余信息。解決這個(gè)幾對(duì)幾的關(guān)系問(wèn)題,就能輕易實(shí)現(xiàn)滿足第三范式的數(shù)據(jù)庫(kù)設(shè)計(jì)思考題:假定選課關(guān)系表為SelectCourse(學(xué)號(hào),姓名,年齡,課程名稱,成績(jī),學(xué)分),關(guān)鍵字為組合關(guān)鍵字(學(xué)號(hào),課程名稱),因?yàn)榇嬖谌缦聸Q定關(guān)系:(學(xué)號(hào),課程名稱)→(姓名,年齡,成績(jī),學(xué)分)

這個(gè)數(shù)據(jù)庫(kù)表不滿足第二范式,因?yàn)榇嬖谌缦聸Q定關(guān)系:(課程名稱)→(學(xué)分)

(學(xué)號(hào))→(姓名,年齡)即存在組合關(guān)鍵字中的字段決定非關(guān)鍵字的情況。造成的潛在問(wèn)題:

(1)數(shù)據(jù)冗余:同一門課程由n個(gè)學(xué)生選修,“學(xué)分”就重復(fù)n-1次;同一個(gè)學(xué)生選修了m門課程,姓名和年齡就重復(fù)了m-1次。(2)更新異常:若調(diào)整了某門課程的學(xué)分,數(shù)據(jù)表中所有行的“學(xué)分”值都要更新,否則會(huì)出現(xiàn)同一門課程學(xué)分不同的情況。(3)插入異常:假設(shè)要開設(shè)一門新的課程,暫時(shí)還沒有人選修。這樣,由于還沒有“學(xué)號(hào)”關(guān)鍵字,課程名稱和學(xué)分也無(wú)法記錄入數(shù)據(jù)庫(kù)。(4)刪除異常:假設(shè)一批學(xué)生已經(jīng)完成課程的選修,這些選修記錄就應(yīng)該從數(shù)據(jù)庫(kù)表中刪除。但是,與此同時(shí),課程名稱和學(xué)分信息也被刪除了。很顯然,這也會(huì)導(dǎo)致插入異常。

把選課關(guān)系表SelectCourse改為如下三個(gè)表:學(xué)生:Student(學(xué)號(hào),姓名,年齡);課程:Course(課程名稱,學(xué)分);選課關(guān)系:SelectCourse(學(xué)號(hào),課程名稱,成績(jī))。這樣的數(shù)據(jù)庫(kù)表是符合第二范式的,消除了數(shù)據(jù)冗余、更新異常、插入異常和刪除異常。另外,所有單關(guān)鍵字的數(shù)據(jù)庫(kù)表都符合第二范式,因?yàn)椴豢赡艽嬖诮M合關(guān)鍵字。關(guān)系模式設(shè)計(jì)范式(范式,數(shù)據(jù)庫(kù)設(shè)計(jì)范式,數(shù)據(jù)庫(kù)關(guān)系表的設(shè)計(jì)范E-R圖向關(guān)系模式的轉(zhuǎn)換及主題數(shù)據(jù)庫(kù)通過(guò)實(shí)體—聯(lián)系方法可以方便得得到現(xiàn)實(shí)世界的一個(gè)抽象模型,但這一模型并不能為數(shù)據(jù)庫(kù)管理系統(tǒng)接受。要完成從現(xiàn)實(shí)世界到信息世界的轉(zhuǎn)化,還必須將實(shí)體—聯(lián)系方法所得的E-R圖轉(zhuǎn)化為關(guān)系表定義。注意:一定要區(qū)分語(yǔ)義,包括名詞性和動(dòng)詞性。先是動(dòng)詞性,代表聯(lián)系集,其次是名詞性,代表聯(lián)系集的動(dòng)詞性所依賴、影響和作用的實(shí)體集分析并確定主題:主題數(shù)據(jù)庫(kù)是面向業(yè)務(wù),面向事務(wù),面向事實(shí)和事件的主題的數(shù)據(jù)組織存儲(chǔ),例如,企業(yè)中需要建立的典型的主題數(shù)據(jù)庫(kù)有:產(chǎn)品、客戶、零部件、供應(yīng)商、訂貨、員工、文件資料、工程規(guī)范等。其中產(chǎn)品、客戶、零部件等數(shù)據(jù)庫(kù)的結(jié)構(gòu),是對(duì)有關(guān)單證、報(bào)表的數(shù)據(jù)項(xiàng)進(jìn)行分析整理而設(shè)計(jì)的,不是按單證、報(bào)表的原樣建立的。這些主題數(shù)據(jù)庫(kù)與企業(yè)管理中要解決的主要問(wèn)題相關(guān)聯(lián),而不是與通常的計(jì)算機(jī)應(yīng)用項(xiàng)目相關(guān)聯(lián)。一個(gè)主題數(shù)據(jù)庫(kù)的科學(xué)的數(shù)據(jù)結(jié)構(gòu):是由多個(gè)達(dá)到“基本表”(BaseTable)規(guī)范的數(shù)據(jù)實(shí)體構(gòu)成的,這些基本表具有如下的特性:

1)原子性——基本表中的數(shù)據(jù)項(xiàng)是數(shù)據(jù)元素(即最小的、不能再分解的信息單元);

2)演繹性——可由基本表中的數(shù)據(jù)生成全部輸出數(shù)據(jù)(即這些基本表是精練的,經(jīng)過(guò)計(jì)算或操作(自動(dòng)化)處理可以產(chǎn)生全部企業(yè)管理所需要的數(shù)據(jù));

3)規(guī)范性——基本表中數(shù)據(jù)滿足三范式(3NF)要求,這是依據(jù)科學(xué)的、能滿足演繹性推算要求、并能保證快捷存取的數(shù)據(jù)結(jié)構(gòu)。E-R圖向關(guān)系模式的轉(zhuǎn)換及主題數(shù)據(jù)庫(kù)通過(guò)實(shí)體—聯(lián)系方法可以方實(shí)體的轉(zhuǎn)換將一個(gè)普通實(shí)體(非弱實(shí)體)轉(zhuǎn)換為表定義是相當(dāng)直觀的,實(shí)體的每個(gè)屬性對(duì)應(yīng)表中的一個(gè)字段,實(shí)體的主鍵對(duì)應(yīng)表的主鍵。如Book實(shí)體轉(zhuǎn)化到表的結(jié)果為:Book(isbn#,title,price,press,stock)實(shí)體的轉(zhuǎn)換將一個(gè)普通實(shí)體(非弱實(shí)體)轉(zhuǎn)換為表定義是相當(dāng)直觀聯(lián)系的轉(zhuǎn)換一個(gè)多對(duì)多聯(lián)系在轉(zhuǎn)換后也對(duì)應(yīng)一個(gè)新的交叉實(shí)體表,表中的屬性包括參與聯(lián)系各實(shí)體的主鍵聯(lián)系的描述屬性參與聯(lián)系各實(shí)體的主鍵之和構(gòu)成新的交叉實(shí)體表的超鍵。如多對(duì)多聯(lián)系Written_by轉(zhuǎn)化為表之后其主鍵將由參與該聯(lián)系的兩個(gè)實(shí)體Book和Author的主鍵構(gòu)成,如下:Written_by(isbn#,author#,serial)聯(lián)系的轉(zhuǎn)換一個(gè)多對(duì)多聯(lián)系在轉(zhuǎn)換后也對(duì)應(yīng)一個(gè)新的交叉實(shí)體表,表聯(lián)系的轉(zhuǎn)換一對(duì)一和一對(duì)多聯(lián)系A(chǔ)與B之間是一對(duì)多聯(lián)系,不轉(zhuǎn)換為一張單獨(dú)的表,而只在B轉(zhuǎn)換后的表中增加A的主鍵屬性(當(dāng)然這些屬性將形成一個(gè)引用到A的主鍵的一個(gè)外鍵),以此表示某B實(shí)體所從屬的A實(shí)體。這種方法可以產(chǎn)生更少的表,有利于提高數(shù)據(jù)庫(kù)性能,還可以表達(dá)更多的約束如對(duì)于聯(lián)系Possess,將在Order表中增加一列customer#表示訂單從屬的顧客聯(lián)系的轉(zhuǎn)換一對(duì)一和一對(duì)多聯(lián)系弱實(shí)體的轉(zhuǎn)換由于弱實(shí)體總是全參與它與它的標(biāo)識(shí)實(shí)體之間的多對(duì)一聯(lián)系,因此可以采用上面提出的一對(duì)多聯(lián)系方法進(jìn)行轉(zhuǎn)換。弱實(shí)體轉(zhuǎn)換后生成的表的主鍵由標(biāo)識(shí)實(shí)體的主鍵與弱實(shí)體本身的部分鍵組合而成。如弱實(shí)體Item轉(zhuǎn)換后,構(gòu)成如下:Item(order#,item#,isbn,qty)弱實(shí)體的轉(zhuǎn)換由于弱實(shí)體總是全參與它與它的標(biāo)識(shí)實(shí)體之間的多對(duì)實(shí)體層次的轉(zhuǎn)換將實(shí)體層次轉(zhuǎn)換為表定義時(shí)可采用兩種方法父輩實(shí)體與子輩實(shí)體都轉(zhuǎn)換為單獨(dú)的表

通用方法,任何情況適用。每一個(gè)子輩實(shí)體轉(zhuǎn)換為單獨(dú)的表,其中既包含各子輩實(shí)體的特殊屬性,也包含子輩與父輩實(shí)體的公有屬性。

只適用全參與泛化,因無(wú)法比哦啊是不從屬于任何子輩實(shí)體的父輩實(shí)體如Customer與VIP、NONVIP之間的全參與泛化可用第二種方法轉(zhuǎn)換為:VIP(customer#,name,gender,birthday,city,address,email,credit)NONVIP(customer#,name,gender,birthday,city,address,email,

discount)實(shí)體層次的轉(zhuǎn)換將實(shí)體層次轉(zhuǎn)換為表定義時(shí)可采用兩種方法一些實(shí)際的考慮一般來(lái)說(shuō),在將E-R圖轉(zhuǎn)換到關(guān)系表定義的過(guò)程中,需要考慮兩個(gè)實(shí)際的問(wèn)題:性能與數(shù)據(jù)規(guī)范化。提高數(shù)據(jù)庫(kù)性能的一個(gè)重要方法是進(jìn)行數(shù)據(jù)冗余,不要跨表進(jìn)行處理。用一個(gè)表記錄所有父子實(shí)體,而用一個(gè)字段來(lái)表示實(shí)體的類型。請(qǐng)大家依據(jù)關(guān)系模式規(guī)范化理論討論如下實(shí)體是否要拆分成不同的實(shí)體集和聯(lián)系集,還是不拆分:例如:Customer(customer#,name,gender,birthday,city,

address,email,credit,discount,customer-type)一些實(shí)際的考慮一般來(lái)說(shuō),在將E-R圖轉(zhuǎn)換到關(guān)系表定義的過(guò)程中在線書店數(shù)據(jù)庫(kù)及關(guān)系模式Book(isbn#,title,price,press,stock)Author(author#,name,city)Written_by(isbn,author#,serial)Category(category#,super#,tag)Customer(customer#,name,gender,birthday,city,

address,email,credit,discount,customer_type)Interest_in(customer#,category#,date)Wish_for(customer#,isbn#,date,status)Order(order#,customer#,date,status,payment,name,address)Item(item#,order#,isbn,qty)在線書店數(shù)據(jù)庫(kù)及關(guān)系模式Book(isbn#,title,p思考題電話計(jì)費(fèi)系統(tǒng)關(guān)于不同業(yè)務(wù)或叫特殊功能需求,比如:國(guó)內(nèi)長(zhǎng)途,港澳長(zhǎng)途,國(guó)際長(zhǎng)途等,如何設(shè)計(jì)數(shù)據(jù)庫(kù)滿足:表結(jié)構(gòu)不變,永遠(yuǎn)滿足需求,比如:減少業(yè)務(wù),增加業(yè)務(wù)基于類似Excel表格的設(shè)計(jì)和基于E-R圖實(shí)體聯(lián)系模型(關(guān)系模式/模型)的設(shè)計(jì)比較思考題電話計(jì)費(fèi)系統(tǒng)關(guān)于不同業(yè)務(wù)或叫特殊功能需求,比如:國(guó)內(nèi)長(zhǎng)數(shù)據(jù)的統(tǒng)計(jì)分析及報(bào)表的展示功能報(bào)表展示與制作是面向業(yè)務(wù)統(tǒng)計(jì)分析人員的最終體驗(yàn),是最高層的數(shù)據(jù)統(tǒng)計(jì)分析應(yīng)用的需求和表達(dá)真實(shí)例子展開(Practical

Data

Warehouse

andBusinessIntelligenceInsights)單主題1)加拿大電信2007年的年度銷售報(bào)表(1)2)加拿大電信2007年的季度銷售報(bào)表(4)3)加拿大電信2007年的月度銷售報(bào)表(12)4)加拿大電信2007年每省的年度銷售報(bào)表(10)5)加拿大電信2007年的每省的季度銷售報(bào)表(40)6)加拿大電信2007年的每省的月度銷售報(bào)表(120)7)若每省有十個(gè)縣,則需要報(bào)表10*12*10=1200

多主題這樣如果一個(gè)主題像上面的報(bào)表需求量,則有多少主題,報(bào)表數(shù)量是冪乘數(shù)的關(guān)系,尤其是同比和環(huán)比這樣的統(tǒng)計(jì)需求工作場(chǎng)景描述(Just

Build

It)1)新建報(bào)表時(shí),大多數(shù)人都是使用MicrosoftExcel利用原有已經(jīng)被Excel表格加工過(guò)的數(shù)據(jù),很少使用初始規(guī)范化的數(shù)據(jù)源2)一個(gè)報(bào)表因?yàn)榧庸み^(guò)的而造成的數(shù)據(jù)分散,需要多個(gè)業(yè)務(wù)人員協(xié)作完成3)多人協(xié)作時(shí)數(shù)據(jù)不一致,數(shù)據(jù)不規(guī)范嚴(yán)重影響工作進(jìn)度解決方案使用多維建模方法論,建立以業(yè)務(wù)事件為導(dǎo)向的以主題(統(tǒng)計(jì)分析涉及的不同領(lǐng)域數(shù)據(jù))為相關(guān)的事實(shí)表庫(kù)(統(tǒng)計(jì)分析涉及不同數(shù)據(jù)事件模型),通過(guò)對(duì)多維模型的鉆取、切取、旋轉(zhuǎn)等操作實(shí)現(xiàn)報(bào)表的動(dòng)態(tài)化和個(gè)性化,消除眾多關(guān)聯(lián)的中間報(bào)表,以實(shí)現(xiàn)Ad-hoc報(bào)表(自動(dòng)化程度高的報(bào)表)逐步從依賴類似Microsoft

Excel(分散部署,數(shù)據(jù)不一致及不規(guī)范的始作俑者)表格過(guò)渡到多維統(tǒng)計(jì)分析到數(shù)據(jù)集市再到數(shù)據(jù)倉(cāng)庫(kù)的路線數(shù)據(jù)的統(tǒng)計(jì)分析及報(bào)表的展示功能報(bào)表展示與制作是面向業(yè)務(wù)統(tǒng)計(jì)分Excel報(bào)表與事實(shí)表的相互轉(zhuǎn)換關(guān)系單一的Excel列表,有數(shù)據(jù)冗余,存在增刪改的異常Excel報(bào)表,依據(jù)習(xí)慣行為建立,沒有考慮增刪改的操作關(guān)聯(lián)的Excel列表,消除數(shù)據(jù)冗余,增刪改的異常不存在例如:多種產(chǎn)品只能放在一個(gè)倉(cāng)庫(kù)中,一個(gè)倉(cāng)庫(kù)有多個(gè)管理員。構(gòu)造關(guān)系模式(倉(cāng)庫(kù)管理員,倉(cāng)庫(kù)號(hào),庫(kù)存產(chǎn)品號(hào)),存在數(shù)據(jù)冗余,重新構(gòu)造或修改為相互關(guān)聯(lián)的關(guān)系模式(倉(cāng)庫(kù)號(hào),倉(cāng)庫(kù)管理員),(倉(cāng)庫(kù)號(hào),庫(kù)存產(chǎn)品號(hào))思考:(系名,教師名,學(xué)生名)存在數(shù)據(jù)冗余嗎,怎樣修改或構(gòu)造實(shí)際上相互關(guān)聯(lián)的關(guān)系模式(E-R模型或主題數(shù)據(jù)庫(kù))記錄了操作影響的單一事務(wù)或形成了一個(gè)事件,事件將多個(gè)實(shí)體關(guān)聯(lián)在一起,這是業(yè)務(wù)操作型數(shù)據(jù)庫(kù)系統(tǒng)的最為顯著的特征,事件構(gòu)成了事實(shí),事實(shí)形成了主題(主題數(shù)據(jù)庫(kù)),可以被度量(統(tǒng)計(jì)分析)。理論上通過(guò)集合論的關(guān)系運(yùn)算,可以得到任意統(tǒng)計(jì)分析結(jié)果,所以相對(duì)完美的解決方案是逆序,不要按習(xí)慣先做報(bào)表,有了問(wèn)題(增刪改異常及新的查詢需求)才回溯數(shù)據(jù)源表:駐留在操作型關(guān)系數(shù)據(jù)庫(kù)端中間表:駐留在操作型關(guān)系數(shù)據(jù)庫(kù)端或被倒出,駐留在Excel端統(tǒng)計(jì)分析表:駐留在Excel端Excel報(bào)表與事實(shí)表的相互轉(zhuǎn)換關(guān)系單一的Excel列表,有多維模式(OLAP)的星型和雪花模型多維模式:由一個(gè)事實(shí)表(FactTable)和一組維表(DimensionTable)組成。每個(gè)維表都有一個(gè)維作為主鍵,所有這些維的主鍵組合成事實(shí)表的主鍵。事實(shí)表的非主鍵屬性稱為事實(shí)(Fact),它們一般都是數(shù)值或其他可以進(jìn)行計(jì)算的數(shù)據(jù);而維表大都是文字、時(shí)間等類型的數(shù)據(jù),按這種方式組織好數(shù)據(jù)我們就可以按照不同的維(事實(shí)表主鍵的部分或全部)來(lái)對(duì)這些事實(shí)數(shù)據(jù)進(jìn)行求和(summary)、求平均(average)、計(jì)數(shù)(count)、百分比(percent)的聚集計(jì)算,甚至可以做20~80分析。這樣就可以從不同的角度的數(shù)據(jù)來(lái)分析單一業(yè)務(wù)主題的事件情況當(dāng)所有維表都直接連接到事實(shí)表上時(shí),將該模型稱為星型模型當(dāng)有一個(gè)或多個(gè)維表沒有直接連接到事實(shí)表上,而是通過(guò)其他維表連接到事實(shí)表上時(shí),將該模型稱為雪花模型。雪花模型是對(duì)星型模型的維表進(jìn)一步層次化的結(jié)果多維模式(OLAP)的星型和雪花模型多維模式:由一個(gè)事實(shí)表(多維模式(OLAP)的基本操作類型鉆?。―rill-up和Drill-down)

Drill-up是在某一維上將低層次的細(xì)節(jié)數(shù)據(jù)概括到高層次的匯總數(shù)據(jù),或者減少維數(shù)。Drill-down則相反,它從匯總數(shù)據(jù)深入到細(xì)節(jié)數(shù)據(jù)進(jìn)行觀察或增加新維。鉆取報(bào)表是指用戶通過(guò)單擊其他報(bào)表中的鏈接打開的報(bào)表。鉆取報(bào)表通常包含某原始匯總報(bào)表中所包含的某項(xiàng)的詳細(xì)信息切取(Slice和Dice)切片(Slice)和切塊(Dice是在一部分維上選定值后,關(guān)心度量數(shù)據(jù)在剩余維上的分布。如果剩余的維只有兩個(gè),則是切片。如果有三個(gè)或以上,則是切塊透視(Pivot)

Pivot是變換維的方向,即在表格中重新安排維的放置(例如行列互換)。透視是模型中跟蹤不同數(shù)據(jù)集的對(duì)象的子集。通常為特定的用戶組或業(yè)務(wù)方案定義透視,從而便于導(dǎo)航大型數(shù)據(jù)集。在透視中,表、列和度量值(包括KPI)定義為字段對(duì)象??梢赃x擇將在各透視中包括的字段。例如,單個(gè)模型可以包含產(chǎn)品、銷售、財(cái)務(wù)、員工和地理數(shù)據(jù)。在銷售部要求產(chǎn)品、銷售、促銷和地理數(shù)據(jù)時(shí),可能不需要員工和財(cái)務(wù)數(shù)據(jù)。同樣,人力資源部門不需要與銷售促銷和地理有關(guān)的數(shù)據(jù)注意:請(qǐng)關(guān)注這些術(shù)語(yǔ)和英語(yǔ)專用詞多維模式(OLAP)的基本操作類型鉆?。―rill-up和D多維模式(OLAP)的基本操作類型事例多維模式(OLAP)的基本操作類型事例Excel表格和關(guān)系模式(規(guī)范化表)的關(guān)系Excel表格和Excel列表的區(qū)別

MicrosoftWeb(微軟官網(wǎng))

Excel列表注釋

Excel列表是Excel2003中的新增功能。列表是您可以與較大的工作表獨(dú)立開來(lái)而單獨(dú)進(jìn)行操作的一部分工作表,這樣操作對(duì)周圍任何數(shù)據(jù)都沒有影響。例如,可以添加數(shù)據(jù)、對(duì)數(shù)據(jù)進(jìn)行排序、重新排列列表中的行,而不影響周圍的單元格。Excel列表還可以加快工作速度,因?yàn)樗峁┝艘唤M數(shù)據(jù)操作工具,包括“自動(dòng)篩選”按鈕和一組聚合函數(shù),可以從同一位置使用這些聚合函數(shù)。同時(shí)還可以使用Excel列表從不同的外部數(shù)據(jù)源(關(guān)系模式)創(chuàng)建數(shù)據(jù)透視表(Pivot)。右面是一個(gè)典型的Excel2003列表

“自動(dòng)篩選”按鈕:該按鈕會(huì)自動(dòng)顯示,它們所提供的功能與早期版本的Excel功能相同。您可以使用該按鈕快速對(duì)數(shù)據(jù)進(jìn)行排序和篩選、查找高低值等等是邊框:邊框?qū)⒘斜碇械膯卧衽c周圍數(shù)據(jù)區(qū)分開是“插入”行:星號(hào)表示行。您可以直接在該行的單元格中鍵入數(shù)據(jù),列表會(huì)自動(dòng)調(diào)整大小以容納新數(shù)據(jù)是“匯總”行:單擊此行中的某個(gè)單元格可以從聚合函數(shù)列表中進(jìn)行選擇。您可以使用“列表”工具欄顯示或隱藏“匯總”行。當(dāng)您顯示“匯總”行時(shí),如果右側(cè)的列中包含數(shù)字?jǐn)?shù)據(jù),Excel會(huì)將該列中的數(shù)據(jù)自動(dòng)進(jìn)行相加是聚合函數(shù):選擇某個(gè)函數(shù)以將其插入到“匯總”行中選定的單元格。您不必手動(dòng)輸入該函數(shù),這樣您可以在更短的時(shí)間內(nèi)更準(zhǔn)確地添加計(jì)算是調(diào)整手柄:通過(guò)拖動(dòng)該手柄可以修改列表的大小Excel表格和關(guān)系模式(規(guī)范化表)的關(guān)系Excel表格和EExcel列表與多維模式(OLAP)的關(guān)系在Excel中,在沒有連接任何OLAP數(shù)據(jù)源的情況下,也支持旋轉(zhuǎn)透視表(Pivot),這算是一種非常簡(jiǎn)易的OLAP前端(微軟官網(wǎng))OLAP是為了提高檢索數(shù)據(jù)的速度。因?yàn)樵趧?chuàng)建或更改報(bào)表時(shí),會(huì)計(jì)算匯總值,這樣就只有較少數(shù)據(jù)送到Excel中。此方法使得可以處理的源數(shù)據(jù)比使用傳統(tǒng)數(shù)據(jù)庫(kù)組織的數(shù)據(jù)更多。因?yàn)閷?duì)于傳統(tǒng)數(shù)據(jù)庫(kù),Excel必須先檢索所有單個(gè)記錄后,再計(jì)算匯總值(微軟官網(wǎng))在Excel中的OLAP和非OLAP數(shù)據(jù)透視表的區(qū)別(微軟官網(wǎng))Excel列表與多維模式(OLAP)的關(guān)系在Excel中,在Excel列表與Excel數(shù)據(jù)透視表的關(guān)系用戶可以從四種類型的數(shù)據(jù)源中來(lái)創(chuàng)建數(shù)據(jù)透視表(Pivot)Excel數(shù)據(jù)列表,可以進(jìn)行增加,刪除,修改,查詢(CURD)等列表操作外部數(shù)據(jù)源,比如:關(guān)系型數(shù)據(jù)庫(kù),結(jié)構(gòu)良好的文件等,可以視作數(shù)據(jù)準(zhǔn)備的結(jié)果多個(gè)獨(dú)立的Excel數(shù)據(jù)列表其他的數(shù)據(jù)透視表,或者甚至于來(lái)自其他異構(gòu)的系統(tǒng)數(shù)據(jù)透視表的關(guān)鍵術(shù)語(yǔ)數(shù)據(jù)源,從中創(chuàng)建數(shù)據(jù)透視表的數(shù)據(jù)列表或多維數(shù)據(jù)集,可以視作數(shù)據(jù)準(zhǔn)備的結(jié)果軸,數(shù)據(jù)透視表中的一個(gè)維統(tǒng)計(jì)匯總函數(shù),公式編輯器,KPI分類匯總,分類KPI刷新,自動(dòng)計(jì)算數(shù)據(jù)透視表,以反映當(dāng)前的數(shù)據(jù)源狀態(tài)演示:在Excel中使用OLAP數(shù)據(jù)透視表深入了解獵奇公司-Excel–Office.om(大型業(yè)務(wù)數(shù)據(jù)庫(kù)組織成多維數(shù)據(jù)集從而支持商業(yè)智能的技術(shù))Excel列表與Excel數(shù)據(jù)透視表的關(guān)系用戶可以從四種類型微軟官網(wǎng)演示URL微軟官網(wǎng)演示URL多維模式構(gòu)造演進(jìn)路線圖數(shù)據(jù)源層數(shù)據(jù)準(zhǔn)備階段層協(xié)調(diào)層加載層數(shù)據(jù)倉(cāng)庫(kù)層統(tǒng)計(jì)分析層數(shù)據(jù)源層數(shù)據(jù)準(zhǔn)備階段層數(shù)據(jù)集市層統(tǒng)計(jì)分析層數(shù)據(jù)源層數(shù)據(jù)準(zhǔn)備階段層統(tǒng)計(jì)分析層數(shù)據(jù)準(zhǔn)備階段層的角色是中間協(xié)調(diào)和處理數(shù)據(jù)源以生成基于操作型或事務(wù)型數(shù)據(jù)的多維視圖模式。演進(jìn)的核心價(jià)值是基于對(duì)數(shù)據(jù)準(zhǔn)備階段層的粒度、分層、分類、模式,物理部署的考量統(tǒng)計(jì)分析層的角色只是友善的用戶使用體驗(yàn),統(tǒng)計(jì)分析層有太多的物理實(shí)現(xiàn)或工具型系統(tǒng)可供選擇多維模式構(gòu)造演進(jìn)路線圖數(shù)據(jù)源層數(shù)據(jù)準(zhǔn)備階段層協(xié)調(diào)層加載層數(shù)據(jù)終極目標(biāo):Ad-hoc報(bào)表系統(tǒng)以Birt的多維Ad-hoc報(bào)表引擎和報(bào)表設(shè)計(jì)器(IBM

Developer

Resource)為例BIRT(BusinessIntelligenceandReportingTools),是為Web應(yīng)用程序開發(fā)的基于Eclipse的開源報(bào)表系統(tǒng),特別之處在于它是以Java和J2EE為基礎(chǔ)。BIRT有兩個(gè)主要組件:基于Eclipse的報(bào)表設(shè)計(jì)器,以及部署到應(yīng)用服務(wù)器上的運(yùn)行時(shí)組件支持團(tuán)隊(duì)作業(yè),在一個(gè)團(tuán)隊(duì)中,不同的設(shè)計(jì)者設(shè)計(jì)報(bào)表的時(shí)候,能夠保證報(bào)表風(fēng)格的統(tǒng)一;同時(shí)使得設(shè)計(jì)得到重用,從而提高工作效率;能夠集中定義一些常用的資源,從而避免一處資源的變動(dòng),所有報(bào)表都要修改的情況發(fā)生超短時(shí)間面對(duì)數(shù)百萬(wàn)行或列的超大數(shù)據(jù)源進(jìn)行報(bào)表制作;瞬間改變報(bào)表的統(tǒng)計(jì)視角及統(tǒng)計(jì)方法;從容面對(duì)包括關(guān)系型和多維型等的多種數(shù)據(jù)源;任意角度查看的匯總報(bào)表和明細(xì)報(bào)表;以上這些盡量地均不使用公式求解器或通過(guò)編寫代碼來(lái)完成,這樣也就實(shí)現(xiàn)了自動(dòng)化程度較高的報(bào)表系統(tǒng)演示:在Birt中使用OLAP數(shù)據(jù)透視表及Ad-hoc報(bào)表終極目標(biāo):Ad-hoc報(bào)表系統(tǒng)以Birt的多維Ad-hoc報(bào)Ad-hoc報(bào)表演示URLAd-hoc報(bào)表演示URL思考題及調(diào)研表請(qǐng)說(shuō)明Excel(Spreadsheet微軟以外的稱呼:比如Google

Doc中的Spreadsheet,IBM

Lotus1-2-3

Spreadsheet,Libreoffice中的Spreadsheet)的價(jià)值和應(yīng)用意義E-R模式(模型)轉(zhuǎn)化為關(guān)系模式(模型)后,一個(gè)關(guān)系表和其他相關(guān)關(guān)系表形成了什么基數(shù)關(guān)系(從語(yǔ)義學(xué)角度分別論述),如何通過(guò)主題數(shù)據(jù)庫(kù)的關(guān)系模式理解E-R模式的概念及現(xiàn)實(shí)世界信息及邏輯的模型Pivot和OLAP及多維模式的區(qū)別和聯(lián)系,多維模式和關(guān)系模式的區(qū)別和聯(lián)系怎樣通過(guò)Excel列表,建立多個(gè)列表相互之間的關(guān)聯(lián)關(guān)系(請(qǐng)參考:使用實(shí)體關(guān)系模型或通過(guò)搜索網(wǎng)絡(luò)來(lái)解答或查閱參考文檔),Excel(Spreadsheet)是否能完全實(shí)現(xiàn)Ad-hoc報(bào)表功能要求通過(guò)什么途徑,如何成為Excel(Spreadsheet)應(yīng)用專家;假以時(shí)日,更加努力地成為數(shù)據(jù)庫(kù)(關(guān)系模式)和數(shù)據(jù)倉(cāng)庫(kù)(多維模式)的應(yīng)用專家實(shí)踐及調(diào)研:請(qǐng)區(qū)分和梳理個(gè)人統(tǒng)計(jì)分析及報(bào)表的工作,區(qū)別數(shù)據(jù)源和操作(因操作事務(wù)而加工引起數(shù)據(jù)的變化),請(qǐng)用Excel事例使用過(guò)程請(qǐng)大家及時(shí)反饋交流意見,多提寶貴意見,教學(xué)相長(zhǎng)。謝謝大家!思考題及調(diào)研表請(qǐng)說(shuō)明Excel(Spreadsheet微軟以數(shù)據(jù)庫(kù)及數(shù)據(jù)倉(cāng)庫(kù)精要終極目標(biāo):Ad-hoc報(bào)表系統(tǒng)Ad-hoc釋義:即時(shí)的、隨意的、特殊的數(shù)據(jù)庫(kù)及數(shù)據(jù)倉(cāng)庫(kù)精要終極目標(biāo):Ad-hoc報(bào)表系統(tǒng)Ad-ho前言數(shù)據(jù)庫(kù)扮演的角色也叫聯(lián)機(jī)事務(wù)處理OLAP(OnlineTransactionalProcessing),數(shù)據(jù)庫(kù)保存由日常管理過(guò)程中涉及的業(yè)務(wù)操作創(chuàng)建的操作型結(jié)構(gòu)化數(shù)據(jù),數(shù)據(jù)記錄系統(tǒng)管理行為(通過(guò)各種業(yè)務(wù)邏輯來(lái)交互)。反映細(xì)粒度的事務(wù)數(shù)據(jù),保存時(shí)間短。主要依賴關(guān)系模式建模方法論。數(shù)據(jù)倉(cāng)庫(kù)扮演的角色也叫聯(lián)機(jī)分析處理OLAP(OnlineAnalyticalProcessing),數(shù)據(jù)由聯(lián)機(jī)事務(wù)處理來(lái),經(jīng)過(guò)選擇和聚集,變?yōu)榻y(tǒng)計(jì)分析事實(shí)產(chǎn)生的因果,輔助決策制定(通過(guò)各種統(tǒng)計(jì)分析報(bào)表來(lái)交互)。反映大范圍的事實(shí)數(shù)據(jù)(業(yè)務(wù)事件的累積),保存時(shí)間長(zhǎng)。主要依賴多維模式建模方法論主題、事實(shí)和事件(請(qǐng)注意語(yǔ)義)

事實(shí)是一個(gè)主題,比如:銷售、配送、住院、手術(shù)等。一個(gè)主題對(duì)應(yīng)了多個(gè)相互關(guān)聯(lián)的關(guān)系模式,也可以叫做相關(guān)關(guān)系表。事實(shí)的實(shí)例對(duì)應(yīng)著發(fā)生的事件,比如:一個(gè)執(zhí)行的銷售、配送、住院、手術(shù)等都是一個(gè)事件。每個(gè)事實(shí)由一組提供了事件的量化描述的度量的屬性值描述,比如:銷售收入、配送量、住院支出、手術(shù)時(shí)間等通過(guò)語(yǔ)義將數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)結(jié)合在一起前言數(shù)據(jù)庫(kù)扮演的角色從報(bào)表到報(bào)表存在的問(wèn)題及對(duì)策綱領(lǐng)對(duì)策綱領(lǐng)實(shí)體(關(guān)系所代表的實(shí)體)原子化,是指實(shí)體本身不能再分解屬性原子化,是指實(shí)體的屬性(值域所代表的屬性)本身不能再分解主鍵原子化,是指實(shí)體的主鍵本身是一個(gè)唯一的ID字段聯(lián)系原子化,是指實(shí)體間的聯(lián)系(關(guān)系所代表的聯(lián)系)都是一對(duì)多的聯(lián)系命題原子化,是指語(yǔ)義角度的聯(lián)系原子化現(xiàn)實(shí)(面對(duì)單一主題,數(shù)據(jù)規(guī)模極小,僅是面對(duì)招投標(biāo)業(yè)務(wù)追蹤)1)第二個(gè)表是從第一個(gè)表通過(guò)高級(jí)程序員編寫VBA程序?qū)崿F(xiàn),第一個(gè)表也是專業(yè)定崗員工通過(guò)Excel專用表單維護(hù)和更新的,背后其實(shí)還是高級(jí)程序員的工作價(jià)值體現(xiàn)2)信息化崗位需求及配置:高級(jí)程序員四名,六個(gè)專業(yè)業(yè)務(wù)人員。滿負(fù)荷工作以應(yīng)對(duì)數(shù)據(jù)變動(dòng)和操作功能變動(dòng)解決方案:報(bào)表列表化,去除冗余數(shù)據(jù),建模信息化模型(數(shù)據(jù)庫(kù)模型)并影射和實(shí)現(xiàn)為Access桌面數(shù)據(jù)庫(kù)應(yīng)用從報(bào)表到報(bào)表存在的問(wèn)題及對(duì)策綱領(lǐng)對(duì)策綱領(lǐng)現(xiàn)實(shí)(面對(duì)單一主題,問(wèn)題的導(dǎo)入-從Excel表格出發(fā)引出的問(wèn)題結(jié)構(gòu)良好的表,范式,SQL語(yǔ)言,關(guān)系模式及E-R圖基本表與中間表、臨時(shí)表不同,基本表及其字段之間的關(guān)系,應(yīng)盡量滿足第三范式,是結(jié)構(gòu)良好的表,它可以消除刪除行,改變行,修改行(實(shí)例)的錯(cuò)誤和異常。它具有如下四個(gè)特性:(1)原子性,基本表中的字段是不可再分解的。(2)原始性,基本表中的記錄是原始數(shù)據(jù)(基礎(chǔ)數(shù)據(jù))的記錄。(3)演繹性,由基本表與代碼表中的數(shù)據(jù),可以派生出所有的輸出數(shù)據(jù)。(4)穩(wěn)定性,基本表的結(jié)構(gòu)是相對(duì)穩(wěn)定的,表中的記錄是要長(zhǎng)期保存的。(5)基本表的每個(gè)決定因子都必須是候選建。(6)非基本表必須分解為兩個(gè)或多個(gè)基本表。三個(gè)基本范式:(1)1NF是對(duì)屬性的原子性約束,要求屬性具有原子性,不可再分解。(2)2NF是對(duì)記錄的惟一性約束,要求記錄有惟一標(biāo)識(shí),即實(shí)體的惟一性。(3)3NF是對(duì)字段冗余性的約束,即任何字段不能由其他字段派生出來(lái),它要求字段沒有冗余大多數(shù)結(jié)構(gòu)不良好的表,會(huì)產(chǎn)生或包含大量的冗余數(shù)據(jù),同時(shí)可能會(huì)出現(xiàn)刪除行,改變行,修改行的錯(cuò)誤和異常,這都是都是使用了SQLDMLCURD語(yǔ)句產(chǎn)生的。像中間表、報(bào)表和臨時(shí)表:(1)

中間表是存放統(tǒng)計(jì)分析數(shù)據(jù)的表,它是為數(shù)據(jù)倉(cāng)庫(kù)、輸出報(bào)表或查詢結(jié)果而設(shè)計(jì)的,有時(shí)它沒有主鍵與外鍵(數(shù)據(jù)倉(cāng)庫(kù)除外)。(2)

臨時(shí)表是程序員個(gè)人設(shè)計(jì)的,存放臨時(shí)記錄,為個(gè)人所用。(3)

基表和中間表由DBA維護(hù),臨時(shí)表由程序員自己用程序自動(dòng)維護(hù)。關(guān)系是一個(gè)由行和列組成的二維表,不一定結(jié)構(gòu)良好,特征為:行包括實(shí)體的數(shù)據(jù),列包含實(shí)體性質(zhì)的數(shù)據(jù),表中的單元格存儲(chǔ)單個(gè)值,每列的所有實(shí)體類型一致,每列具有唯一名稱,列的順序任意,行的順序任意,任意兩行互不重復(fù)。這是最大的復(fù)合關(guān)系模式的條件,符合這個(gè)要求的表就是關(guān)系型表格。通過(guò)E-R圖將這些概念反映出來(lái),通過(guò)名詞性和動(dòng)詞性,完全可以描述客觀世界,其中名詞性描述實(shí)體,動(dòng)詞性描述聯(lián)系或動(dòng)作影響,通過(guò)動(dòng)詞性將不同的實(shí)體關(guān)聯(lián)在一起第一目標(biāo)或者叫基礎(chǔ)目標(biāo):統(tǒng)計(jì),匯總及分析報(bào)表的工作盡量地自動(dòng)用Excel或Spreadsheet做,幾乎不需人為干預(yù)問(wèn)題的導(dǎo)入-從Excel表格出發(fā)引出的問(wèn)題結(jié)構(gòu)良好的表,范式目錄E-R模型的概念與表示實(shí)體-聯(lián)系方法(概念模型及設(shè)計(jì),關(guān)注現(xiàn)實(shí)世界)關(guān)系模式的規(guī)范化(消除數(shù)據(jù)冗余,避免操作異常)E-R圖向關(guān)系表(Schema)的轉(zhuǎn)換(邏輯模型及設(shè)計(jì),關(guān)注信息世界)多維模式與統(tǒng)計(jì)分析的關(guān)系Excel或Spreadsheet在統(tǒng)計(jì)分析中的角色統(tǒng)計(jì)分析系統(tǒng)(多維模式建構(gòu))的演進(jìn)終極目標(biāo):Ad-hoc報(bào)表系統(tǒng)目錄E-R模型的概念與表示關(guān)于現(xiàn)實(shí)世界事實(shí)及描述的定義事實(shí)包括以下四個(gè)方面:

第一:事實(shí)是指“某物具有某種性質(zhì)或某些事物具有某種關(guān)系。”

與原子命題、分子命題的分類相對(duì)應(yīng),事實(shí)可以分為原子事實(shí)、分子事實(shí)。其中,原子事實(shí)是最基本、最簡(jiǎn)單的事實(shí),從中不能再析出其它事實(shí);分子事實(shí)是原子事實(shí)的復(fù)合

第二:事實(shí)具有客觀性。“大多數(shù)的事實(shí)的存在都不依靠我們的意愿;這就是為什么我們把它們叫作‘嚴(yán)峻的’、‘不肯遷就的’或‘不可抗拒’的理由。大部分物理事實(shí)的存在不僅不依靠我們的意愿,而且也不依靠我們的存在”

第三:現(xiàn)實(shí)世界由各種各樣的事實(shí)組合而成,事實(shí)屬于現(xiàn)實(shí)世界

第四:事實(shí)決定命題的真?zhèn)?,“事?shí)是使得命題為真或?yàn)榧俚臇|西”。具體說(shuō)來(lái),原子命題的真假取決于它是否與原子事實(shí)相符合,分子命題的真假取決于組成它的原子命題的真假現(xiàn)實(shí)世界的語(yǔ)義描述的存在第一:原子命題第二:分子命題第三:段落(由多個(gè)邏輯緊密相關(guān)的分子命題構(gòu)成)第四:主題(由多個(gè)邏輯緊密相關(guān)的段落構(gòu)成)關(guān)于現(xiàn)實(shí)世界事實(shí)及描述的定義事實(shí)包括以下四個(gè)方面:E-R模型的概念與表示E-R圖也稱實(shí)體-聯(lián)系圖(EntityRelationshipDiagram),提供了表示實(shí)體類型、實(shí)體屬性和相關(guān)實(shí)體之間聯(lián)系(三個(gè)要素)的方法,用來(lái)描述現(xiàn)實(shí)世界的概念模型關(guān)系數(shù)據(jù)庫(kù)使用實(shí)體-聯(lián)系模型(E-R模型)進(jìn)行數(shù)據(jù)庫(kù)設(shè)計(jì),以構(gòu)造信息世界的邏輯模型。E-R數(shù)據(jù)庫(kù)設(shè)計(jì)工具提供了一個(gè)“方框與箭頭”的繪圖工具,幫助數(shù)據(jù)庫(kù)用戶建立E-R圖來(lái)描繪數(shù)據(jù),邏輯及現(xiàn)實(shí)世界E-R圖可以手繪,亦可以借用Case工具(PowerDesigner,Visio或SQL

Power

Architect)做出考察單獨(dú)的一個(gè)聯(lián)系(動(dòng)詞類型的語(yǔ)義連接及構(gòu)造能力),聯(lián)系及相互關(guān)聯(lián)的實(shí)體形成的一個(gè)描述,構(gòu)造了一個(gè)最基本的原子命題E-R模型的概念與表示E-R圖也稱實(shí)體-聯(lián)系圖(EntityE-R模型的概念與表示實(shí)體集-語(yǔ)義(名詞類性)實(shí)體(Entity)事物就是在行動(dòng)影響下物質(zhì)本身的改變,或者進(jìn)行。客觀存在并可相互區(qū)別的事物稱為實(shí)體。實(shí)體可以是具體的,也可以是抽象的概念或聯(lián)系。具有共性的一類實(shí)體可歸類為一個(gè)實(shí)體集(Entityset)。屬性(Attribute)實(shí)體所具有的某一特性稱為屬性。一個(gè)實(shí)體可以由若干個(gè)屬性來(lái)刻畫。域(Domain)屬性的取值范圍或類型。鍵或標(biāo)識(shí)符(Key)標(biāo)識(shí)符是實(shí)體中一個(gè)或多個(gè)屬性的集合,可用來(lái)唯一標(biāo)識(shí)實(shí)體中的一個(gè)實(shí)例。每個(gè)實(shí)體都必須至少有一個(gè)標(biāo)識(shí)符。如果實(shí)體只有一個(gè)標(biāo)識(shí)符,則它為實(shí)體的主標(biāo)識(shí)符。如果實(shí)體有多個(gè)標(biāo)識(shí)符,則其中一個(gè)被指定為主標(biāo)識(shí)符,其余的標(biāo)識(shí)符就是次標(biāo)識(shí)符(候選標(biāo)識(shí)符)E-R模型的概念與表示實(shí)體集-語(yǔ)義(名詞類性)E-R模型的概念與表示聯(lián)系集-語(yǔ)義(動(dòng)詞類型)實(shí)體之間可以通過(guò)聯(lián)系來(lái)相互關(guān)聯(lián)。與實(shí)體和實(shí)體集對(duì)應(yīng),聯(lián)系也可以分為聯(lián)系和聯(lián)系集,聯(lián)系集是實(shí)體集之間的聯(lián)系,聯(lián)系是實(shí)體之間的聯(lián)系,聯(lián)系是具有方向性的。聯(lián)系具有方向性,每個(gè)方向上都有一個(gè)基數(shù)。聯(lián)系的兩個(gè)方向上各自包含有一角色名,描述該方向聯(lián)系的作用。按照實(shí)體類型中實(shí)例之間的數(shù)量對(duì)應(yīng)關(guān)系,通??蓪⒙?lián)系分為4個(gè)基本聯(lián)系分為類,即一對(duì)一(ONE

TOONE)聯(lián)系、一對(duì)多(ONETOMANY)聯(lián)系、多對(duì)一(MANYTOONE)聯(lián)系和多對(duì)多聯(lián)系(MANYTOMANY)。三個(gè)特殊聯(lián)系每個(gè)實(shí)體類型都有自己的標(biāo)識(shí)符,如果兩個(gè)實(shí)體集之間發(fā)生聯(lián)系,其中一個(gè)實(shí)體類型的標(biāo)識(shí)符進(jìn)入另一個(gè)實(shí)體類型并與該實(shí)體類型中的標(biāo)識(shí)符共同組成其標(biāo)識(shí)符時(shí),這種聯(lián)系則稱為標(biāo)定聯(lián)系,也叫依賴聯(lián)系。反之稱為非標(biāo)定聯(lián)系,也叫非依賴聯(lián)系。遞歸聯(lián)系是實(shí)體集內(nèi)部實(shí)例之間的一種聯(lián)系,通常形象地稱為自反聯(lián)系。同一實(shí)體類型中不同實(shí)體集之間的聯(lián)系也稱為遞歸聯(lián)系。E-R模型的概念與表示聯(lián)系集-語(yǔ)義(動(dòng)詞類型)E-R模型的概念與表示(使用Case工具時(shí)的圖符及事例)E-R模型的概念與表示(使用Case工具時(shí)的圖符及事例)E-R模型的概念與表示E-R圖的設(shè)計(jì)步驟

第一步:針對(duì)特定的應(yīng)用,確定實(shí)體、屬性和實(shí)體間的聯(lián)系,畫出局部E-R圖。第二步:綜合各個(gè)局部E-R圖,產(chǎn)生反映數(shù)據(jù)庫(kù)整體概念的總體E-R圖。E-R模型的概念與表示E-R圖的設(shè)計(jì)步驟E-R模型的概念與表示(手繪草圖事例)弱實(shí)體集有些實(shí)體集的所有屬性都不足以形成主碼,這樣的實(shí)體集稱為弱實(shí)體集(WeakEntitySet),依賴于其它實(shí)體集而存在。與此相對(duì),其屬性可以形成主碼的實(shí)體集稱為強(qiáng)實(shí)體集。弱實(shí)體集所依賴的實(shí)體集稱為標(biāo)識(shí)實(shí)體集(identifyingentityset),相應(yīng)的關(guān)系為標(biāo)識(shí)聯(lián)系(identifyingrelationship)。OrderItemdatestatuspaymentorder#item#tagIncludeE-R模型的概念與表示(手繪草圖事例)弱實(shí)體集OrderItE-R模型的概念與表示弱實(shí)體集通常沒有主鍵。以訂單的分項(xiàng)為例,訂單項(xiàng)實(shí)體集可能有編號(hào)(局部的編號(hào))、商品名稱、數(shù)量、單價(jià)等屬性,但是這些屬性不足以識(shí)別一個(gè)定單項(xiàng),因?yàn)橥耆锌赡茉诹硗庖粡堄唵沃谐霈F(xiàn)相同的內(nèi)容。必須把訂單的關(guān)鍵字(如一個(gè)全局的訂單編號(hào))和定單項(xiàng)的局部編號(hào)結(jié)合起來(lái)才能標(biāo)示一個(gè)定單項(xiàng)。弱實(shí)體集的屬性中,用來(lái)與標(biāo)識(shí)實(shí)體集的鍵結(jié)合以識(shí)別一個(gè)弱實(shí)體集的屬性稱為部分鍵(partialkey)。弱實(shí)體集的主鍵=它的標(biāo)識(shí)實(shí)體集的鍵+它的部分鍵E-R模型的概念與表示弱實(shí)體集通常沒有主鍵。E-R模型的概念與表示(手繪草圖事例)E-R圖使用雙線矩形表示弱實(shí)體集,弱實(shí)體集與其標(biāo)識(shí)實(shí)體集之間的聯(lián)系用雙線菱形表示,弱實(shí)體集的部分鍵使用虛下劃線表示。OrderItemdatestatuspaymentorder#item#tagIncludeE-R模型的概念與表示(手繪草圖事例)E-R圖使用雙線矩形表E-R模型的概念與表示實(shí)體集的層次關(guān)系現(xiàn)實(shí)世界中的很多概念之間都具體層次關(guān)系。E-R模型使用實(shí)體集間的繼承和ISA關(guān)系來(lái)描述這種概念間的層次關(guān)系實(shí)體集老師或?qū)W生都繼承自實(shí)體集人,并且實(shí)體集老師或?qū)W生與實(shí)體集人之間都滿足ISA關(guān)系,即老師或?qū)W生都是人的一種。ISA關(guān)系可以從兩個(gè)方向進(jìn)行設(shè)計(jì)從自上而下的方向,首先設(shè)計(jì)出人這一實(shí)體,然后根據(jù)屬性的不同,將兩種不同的人具體化(specification)為老師或者學(xué)生。從自下而上的方向,首先設(shè)計(jì)出老師或?qū)W生,然后將他們的共性提取出來(lái),泛化(generalization)為人。E-R模型的概念與表示實(shí)體集的層次關(guān)系E-R模型的概念與表示層次關(guān)系的約束從子實(shí)體集之間是否相交角度,不相交(disjoin)泛化要求繼承自同一父輩的多個(gè)子實(shí)體集之沒有交集,重疊(overlapping)泛化則允許有交集。從泛化是否完全角度,全參與泛化要求所有父輩實(shí)體都必須同時(shí)也是某一子輩實(shí)體,部分泛化則允許不是任何子輩實(shí)體的父輩實(shí)體存在。例如,在采用會(huì)員制的銷售系統(tǒng)中,顧客被分為會(huì)員(VIP)與非會(huì)員(NONVIP)兩種,會(huì)員擁有消費(fèi)積分(credit),非會(huì)員擁有固定的折扣率(discount)。一個(gè)顧客要么是會(huì)員、要么是非會(huì)員,二者必取其一,因此為全參與不相交。E-R模型的概念與表示層次關(guān)系的約束E-R模型的概念與表示(手繪草圖事例)CustomerISAVIPNONVIPcreditdiscountdisjoincustomer#namegenderbirthdaycityaddressemailE-R模型的概念與表示(手繪草圖事例)CustomerISAE-R圖符(手繪草圖事例)E-R圖符(手繪草圖事例)實(shí)體-聯(lián)系方法實(shí)體還是屬性凡是滿足以下兩條準(zhǔn)則的事物,一般均可作為屬性對(duì)待。作為屬性,不能再具有需要描述的性質(zhì)。屬性必須是不可分的數(shù)據(jù)項(xiàng),不能包含其他屬性。屬性不能與其他實(shí)體具有聯(lián)系,即E-R圖中所表示的聯(lián)系是實(shí)體之間的聯(lián)系。例如書籍是一個(gè)實(shí)體,書號(hào)、書名、作者、出版社、定價(jià)是書籍的屬性,如果應(yīng)用系統(tǒng)不再需要作者的其他信息,如電話、住址、個(gè)人主頁(yè)等,那么根據(jù)原則1可以將作者作為書籍的屬性對(duì)待。但是如果這些信息是必須的,那么作者作為一個(gè)實(shí)體看待更為恰當(dāng)。實(shí)體-聯(lián)系方法實(shí)體還是屬性實(shí)體-聯(lián)系方法(手繪草圖事例)bookisbntitlepricepresswritten_bynameauthorauthorcityserialbookisbntitlepricepressauthor實(shí)體-聯(lián)系方法(手繪草圖事例)bookisbntitlep實(shí)體-聯(lián)系方法實(shí)體還是聯(lián)系一般來(lái)說(shuō),實(shí)體對(duì)應(yīng)現(xiàn)實(shí)世界中實(shí)際存在的事物,是名詞類型;聯(lián)系對(duì)應(yīng)的概念一般是一種動(dòng)作,是動(dòng)詞類型。例如:書和作者都是現(xiàn)實(shí)世界中的名詞,因此作為實(shí)體。而written_by表示作者寫書這一動(dòng)作,因此作為聯(lián)系。映射基數(shù)往往影響到一個(gè)概念是作為實(shí)體還是聯(lián)系的選擇。若一項(xiàng)貸款只能由一個(gè)分行發(fā)放,并且只能由一個(gè)客戶借貸,則將Loan作為Customer與Branch之間的聯(lián)系比較合適。但如果允許多個(gè)客戶共同借貸同一項(xiàng)貸款,在這種情況下,將Loan作為實(shí)體。實(shí)體-聯(lián)系方法實(shí)體還是聯(lián)系實(shí)體-聯(lián)系方法(手繪草圖事例)二元關(guān)系還是多元關(guān)系數(shù)據(jù)庫(kù)中使用得最多的是二元聯(lián)系。通常,將多元關(guān)系轉(zhuǎn)換為二元關(guān)系。如學(xué)校選課系統(tǒng),涉及到學(xué)生、教室、教師、課程等多個(gè)實(shí)體,可表示為一個(gè)四元關(guān)系。

學(xué)生上課教室教師課程學(xué)生選課課程授課教師地點(diǎn)教室實(shí)體-聯(lián)系方法(手繪草圖事例)二元關(guān)系還是多元關(guān)系學(xué)生上課教實(shí)體-聯(lián)系方法(手繪草圖事例)但也有一些情況下使用多元聯(lián)系更好(如需要表達(dá)多個(gè)實(shí)體集間的約束時(shí))如學(xué)校選課系統(tǒng)中若一門課程可由多個(gè)教師教授,并且若課程和教師確定,則上課的地點(diǎn)也隨之確定。實(shí)體-聯(lián)系方法(手繪草圖事例)但也有一些情況下使用多元聯(lián)系更實(shí)體-聯(lián)系方法(手繪草圖事例)聯(lián)系屬性的放置影響聯(lián)系屬性放置的主要因素是聯(lián)系的映射基數(shù)。對(duì)于一對(duì)一或一對(duì)多聯(lián)系,選擇作為聯(lián)系屬性或?qū)嶓w屬性只是體現(xiàn)語(yǔ)義側(cè)重點(diǎn)的不同如銷售系統(tǒng)需要記錄顧客(Customer)與訂單(Order)之間的關(guān)系(Possess)。由于一個(gè)訂單只能由一個(gè)顧客所有,因此為顧客與訂單之間為一對(duì)多關(guān)系。這時(shí),記錄生成訂單日期的屬性(date)既可以作為聯(lián)系Possess的屬性,也可作為訂單的屬性。

OrderdatestatuspaymentorderPossesCustomer實(shí)體-聯(lián)系方法(手繪草圖事例)聯(lián)系屬性的放置Orderdat實(shí)體-聯(lián)系方法(手繪草圖事例)對(duì)于多對(duì)多聯(lián)系,聯(lián)系的屬性不能作為實(shí)體的屬性。如,顧客與希望書籍之間的聯(lián)系希望購(gòu)買(Wish_for)。Wish_for有一屬性date,表示顧客發(fā)出購(gòu)買意向的日期,這一屬性不能作為參與聯(lián)系的兩個(gè)實(shí)體Customer或Book的屬性。BookWish_forCustomerdate實(shí)體-聯(lián)系方法(手繪草圖事例)對(duì)于多對(duì)多聯(lián)系,聯(lián)系的屬性不能實(shí)例——在線書店數(shù)據(jù)庫(kù)類似于Amazon的在線書店系統(tǒng)所用的數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)中要求存儲(chǔ)所有書籍的相關(guān)信息,并對(duì)書加以分類;顧客的有關(guān)信息也要求存儲(chǔ)在數(shù)據(jù)庫(kù)中,并且允許用戶選擇自己感興趣的書籍類別及希望購(gòu)買的圖書;顧客在決定購(gòu)買時(shí)可以發(fā)出訂單,同一訂單可以包含多種書,每種書可一次購(gòu)買多本。顧客在訂單中提供送貨地址,系統(tǒng)根據(jù)訂單發(fā)貨。實(shí)例——在線書店數(shù)據(jù)庫(kù)類似于Amazon的在線書店系統(tǒng)所用的實(shí)例——在線書店數(shù)據(jù)庫(kù)E-R圖(手繪草圖事例)實(shí)例——在線書店數(shù)據(jù)庫(kù)E-R圖(手繪草圖事例)實(shí)例——在線書店數(shù)據(jù)庫(kù)合并分E-R圖各分E-R圖之間的沖突主要有三類:屬性沖突

(1)屬性域沖突,即屬性值的類型、取值范圍或取值集合不同。

例如:屬性“訂單號(hào)”有的定義為字符型,有的為數(shù)值型。

(2)屬性取值單位沖突。

例如:屬性“庫(kù)存”有的以冊(cè)為單位,有的以千冊(cè)為單位。

命名沖突

(1)

同名異義。不同意義對(duì)象相同名稱。

例如:Author和Customer均有屬性name。

(2)

異名同義(一義多名)。同意義對(duì)象不相同名稱。

例如:“項(xiàng)目”和“課題”。

實(shí)例——在線書店數(shù)據(jù)庫(kù)合并分E-R圖實(shí)例——在線書店數(shù)據(jù)庫(kù)結(jié)構(gòu)沖突

(1)

同一對(duì)象在不同應(yīng)用中具有不同的抽象。

例如:“作者”在某一局部應(yīng)用中被當(dāng)作實(shí)體,而在另一局部應(yīng)用中則被當(dāng)作屬性。

(2)

同一實(shí)體在不同局部視圖中所包含的屬性不完全相同,或者屬性的排列次序不完全相同。

(3)

實(shí)體之間的聯(lián)系在不同局部視圖中呈現(xiàn)不同的類型。

例如:實(shí)體E1與E2在局部應(yīng)用A中是多對(duì)多聯(lián)系,而在局部應(yīng)用B中是一對(duì)多聯(lián)系;又如在局部應(yīng)用X中E1與E2發(fā)生聯(lián)系,而在局部應(yīng)用Y中E1、E2、E3三者之間有聯(lián)系。

解決方法是根據(jù)應(yīng)用的語(yǔ)義對(duì)實(shí)體聯(lián)系的類型進(jìn)行綜合或調(diào)整。

實(shí)例——在線書店數(shù)據(jù)庫(kù)結(jié)構(gòu)沖突

(1)

同一對(duì)關(guān)系模式設(shè)計(jì)范式(范式,數(shù)據(jù)庫(kù)設(shè)計(jì)范式,數(shù)據(jù)庫(kù)關(guān)系表的設(shè)計(jì)范式)是符合某一種級(jí)別的關(guān)系模式的集合。構(gòu)造數(shù)據(jù)庫(kù)必須遵循一定的規(guī)則。在關(guān)系數(shù)據(jù)庫(kù)中,這種規(guī)則或者叫約束就是范式。關(guān)系數(shù)據(jù)庫(kù)中的關(guān)系必須滿足一定的要求,即滿足不同的范式第一范式(1NF):在任何一個(gè)關(guān)系數(shù)據(jù)庫(kù)中,第一范式(1NF)是對(duì)關(guān)系模式的基本要求,不滿足第一范式(1NF)的數(shù)據(jù)庫(kù)就不是關(guān)系數(shù)據(jù)庫(kù)。所謂第一范式(1NF)是指數(shù)據(jù)庫(kù)表的每一列都是不可分割的基本數(shù)據(jù)項(xiàng),同一列中不能有多個(gè)值,即實(shí)體中的某個(gè)屬性不能有多個(gè)值或者不能有重復(fù)的屬性。如果出現(xiàn),就可能需要定義一個(gè)新的實(shí)體,新實(shí)體與原實(shí)體之間為一對(duì)多關(guān)系第二范式(2NF):數(shù)據(jù)庫(kù)表中不存在非關(guān)鍵字段對(duì)任一候選關(guān)鍵字段的部分函數(shù)依賴(部分函數(shù)依賴指的是存在組合關(guān)鍵字中的某些字段決定非關(guān)鍵字段的情況),也即所有非關(guān)鍵字段都完全依賴于任意一組候選關(guān)鍵字。如果存在,那么這個(gè)屬性和主關(guān)鍵字的這一部分應(yīng)該分離出來(lái)形成一個(gè)新的實(shí)體,新實(shí)體與原實(shí)體之間是一對(duì)多的關(guān)系第三范式(3NF):要求一個(gè)數(shù)據(jù)庫(kù)表中不包含已在其它表中已包含的非主關(guān)鍵字信息。例如,存在一個(gè)部門信息表,其中每個(gè)部門有部門編號(hào)(dept_id)、部門名稱、部門簡(jiǎn)介等信息。那么在員工信息表中列出部門編號(hào)后就不能再將部門名稱、部門簡(jiǎn)介等與部門有關(guān)的信息再加入員工信息表中。如果不存在部門信息表,則根據(jù)第三范式(3NF)也應(yīng)該構(gòu)建它,否則就會(huì)有大量的數(shù)據(jù)冗余。如果存在,應(yīng)該分離這一部分出來(lái)形成一個(gè)新的實(shí)體,新實(shí)體與原實(shí)體之間是一對(duì)多的關(guān)系關(guān)鍵要理解定義這種范式標(biāo)準(zhǔn)的主要目的是為了減少數(shù)據(jù)冗余,數(shù)據(jù)冗余產(chǎn)生的本質(zhì)就是在一個(gè)表中存在字段與字段之間的一對(duì)多,或者多對(duì)多關(guān)系。滿足這些規(guī)范的數(shù)據(jù)庫(kù)是簡(jiǎn)潔的、結(jié)構(gòu)明晰的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論