數(shù)據(jù)庫(kù)及數(shù)據(jù)倉(cāng)庫(kù)精要_Ad-hoc報(bào)表系統(tǒng)_第1頁(yè)
數(shù)據(jù)庫(kù)及數(shù)據(jù)倉(cāng)庫(kù)精要_Ad-hoc報(bào)表系統(tǒng)_第2頁(yè)
數(shù)據(jù)庫(kù)及數(shù)據(jù)倉(cāng)庫(kù)精要_Ad-hoc報(bào)表系統(tǒng)_第3頁(yè)
數(shù)據(jù)庫(kù)及數(shù)據(jù)倉(cāng)庫(kù)精要_Ad-hoc報(bào)表系統(tǒng)_第4頁(yè)
數(shù)據(jù)庫(kù)及數(shù)據(jù)倉(cāng)庫(kù)精要_Ad-hoc報(bào)表系統(tǒng)_第5頁(yè)
已閱讀5頁(yè),還剩50頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、數(shù)據(jù)庫(kù)及數(shù)據(jù)倉(cāng)庫(kù)精要數(shù)據(jù)庫(kù)及數(shù)據(jù)倉(cāng)庫(kù)精要終極目標(biāo):從需求分析到Ad-hoc報(bào)表系統(tǒng)Ad-hoc釋義:即時(shí)的、隨意的、特殊的前言前言n數(shù)據(jù)庫(kù)扮演的角色 也叫聯(lián)機(jī)事務(wù)處理OLAP(Online Transactional Processing),數(shù)據(jù)庫(kù)保存由日常業(yè)務(wù)/管理過(guò)程中涉及的業(yè)務(wù)操作創(chuàng)建的操作型結(jié)構(gòu)化數(shù)據(jù),數(shù)據(jù)記錄系統(tǒng)管理行為(通過(guò)各種業(yè)務(wù)邏輯來(lái)交互)。反映細(xì)粒度的事務(wù)數(shù)據(jù),保存時(shí)間短。主要依賴(lài)關(guān)系模式建模方法論。n數(shù)據(jù)倉(cāng)庫(kù)扮演的角色 也叫聯(lián)機(jī)分析處理OLAP(Online Analytical Processing),數(shù)據(jù)由聯(lián)機(jī)事務(wù)處理來(lái),經(jīng)過(guò)選擇和聚集,變?yōu)榻y(tǒng)計(jì)分析事實(shí)產(chǎn)生的因果,輔助

2、決策制定(通過(guò)各種統(tǒng)計(jì)分析報(bào)表來(lái)交互)。反映大范圍的事實(shí)數(shù)據(jù)(業(yè)務(wù)事件的累積),保存時(shí)間長(zhǎng)。主要依賴(lài)多維模式建模方法論n主題、事實(shí)和事件(請(qǐng)注意語(yǔ)義) 事實(shí)是一個(gè)主題,比如:銷(xiāo)售、配送、住院、手術(shù)等。一個(gè)主題對(duì)應(yīng)了多個(gè)相互關(guān)聯(lián)的關(guān)系模式,也可以叫做相關(guān)關(guān)系表。事實(shí)的實(shí)例對(duì)應(yīng)著發(fā)生的事件,比如:一個(gè)執(zhí)行的銷(xiāo)售、配送、住院、手術(shù)等都是一個(gè)事件。每個(gè)事實(shí)由一組提供了事件的量化描述的度量的屬性值描述,比如:銷(xiāo)售收入、配送量、住院支出、手術(shù)時(shí)間等n通過(guò)語(yǔ)義將數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)結(jié)合在一起從報(bào)表到報(bào)表存在的問(wèn)題及對(duì)策綱領(lǐng)從報(bào)表到報(bào)表存在的問(wèn)題及對(duì)策綱領(lǐng)n 對(duì)策綱領(lǐng)n 實(shí)體(關(guān)系所代表的實(shí)體)原子化,是指實(shí)體本

3、身不能再分解n 屬性原子化,是指實(shí)體的屬性(值域所代表的屬性)本身不能再分解n 主鍵原子化,是指實(shí)體的主鍵本身是一個(gè)唯一的ID字段n 聯(lián)系原子化,是指實(shí)體間的聯(lián)系(關(guān)系所代表的聯(lián)系)都是一對(duì)多的聯(lián)系n 命題原子化,是指語(yǔ)義角度的聯(lián)系原子化n現(xiàn)實(shí)(面對(duì)單一主題,數(shù)據(jù)規(guī)模極小,僅是面對(duì)招投標(biāo)業(yè)務(wù)追蹤)1)第二個(gè)表是從第一個(gè)表通過(guò)高級(jí)程序員編寫(xiě)VBA程序?qū)崿F(xiàn),第一個(gè)表也是專(zhuān)業(yè)定崗員工通過(guò)Excel專(zhuān)用表單維護(hù)和更新的,背后其實(shí)還是高級(jí)程序員的工作價(jià)值體現(xiàn)。另外,現(xiàn)實(shí)工作中的數(shù)據(jù)往往是以復(fù)雜維的表格(報(bào)表模式)形式存在的(來(lái)自于書(shū)籍),只有將數(shù)據(jù)表格轉(zhuǎn)換為數(shù)據(jù)列表,才是理想的數(shù)據(jù)源(來(lái)自于書(shū)籍)2)信

4、息化崗位需求及配置:高級(jí)程序員四名,六個(gè)專(zhuān)業(yè)業(yè)務(wù)人員。滿(mǎn)負(fù)荷工作以應(yīng)對(duì)數(shù)據(jù)變動(dòng)和操作功能變動(dòng)n解決方案:報(bào)表列表化,去除冗余數(shù)據(jù),建模信息化模型(數(shù)據(jù)庫(kù)模型)并影射和實(shí)現(xiàn)為Access桌面數(shù)據(jù)庫(kù)應(yīng)用問(wèn)題的導(dǎo)入問(wèn)題的導(dǎo)入- -從從ExcelExcel表格出發(fā)引出的問(wèn)題表格出發(fā)引出的問(wèn)題結(jié)構(gòu)良好的表,范式,SQL語(yǔ)言,關(guān)系模式及E-R圖n基本表與中間表、臨時(shí)表不同,基本表及其字段之間的關(guān)系,應(yīng)盡量滿(mǎn)足第三范式,是結(jié)構(gòu)良好的表,它可以消除刪除行,改變行,修改行(實(shí)例)的錯(cuò)誤和異常。它具有如下四個(gè)特性:(1) 原子性,基本表中的字段是不可再分解的。(2) 原始性,基本表中的記錄是原始數(shù)據(jù)(基礎(chǔ)數(shù)據(jù))的

5、記錄。(3) 演繹性,由基本表與代碼表中的數(shù)據(jù),可以派生出所有的輸出數(shù)據(jù)。(4) 穩(wěn)定性,基本表的結(jié)構(gòu)是相對(duì)穩(wěn)定的,表中的記錄是要長(zhǎng)期保存的。(5)基本表的每個(gè)決定因子都必須是候選建。(6)非基本表必須分解為兩個(gè)或多個(gè)基本表。n三個(gè)基本范式:(1) 1NF是對(duì)屬性的原子性約束,要求屬性具有原子性,不可再分解。(2) 2NF是對(duì)記錄的惟一性約束,要求記錄有惟一標(biāo)識(shí),即實(shí)體的惟一性。(3) 3NF是對(duì)字段冗余性的約束,即任何字段不能由其他字段派生出來(lái),它要求字段沒(méi)有冗余n大多數(shù)結(jié)構(gòu)不良好的表,會(huì)產(chǎn)生或包含大量的冗余數(shù)據(jù),同時(shí)可能會(huì)出現(xiàn)刪除行,改變行,修改行的錯(cuò)誤和異常,這都是都是使用了SQL DM

6、L CURD語(yǔ)句產(chǎn)生的。像中間表、報(bào)表和臨時(shí)表:(1) 中間表是存放統(tǒng)計(jì)分析數(shù)據(jù)的表,它是為數(shù)據(jù)倉(cāng)庫(kù)、輸出報(bào)表或查詢(xún)結(jié)果而設(shè)計(jì)的,有時(shí)它沒(méi)有主鍵與外鍵(數(shù)據(jù)倉(cāng)庫(kù)除外)。(2) 臨時(shí)表是程序員個(gè)人設(shè)計(jì)的,存放臨時(shí)記錄,為個(gè)人所用。(3) 基表和中間表由DBA維護(hù),臨時(shí)表由程序員自己用程序自動(dòng)維護(hù)。n關(guān)系是一個(gè)由行和列組成的二維表,不一定結(jié)構(gòu)良好,特征為:行包括實(shí)體的數(shù)據(jù),列包含實(shí)體性質(zhì)的數(shù)據(jù),表中的單元格存儲(chǔ)單個(gè)值,每列的所有實(shí)體類(lèi)型一致,每列具有唯一名稱(chēng),列的順序任意,行的順序任意,任意兩行互不重復(fù)。這是最大的復(fù)合關(guān)系模式的條件,符合這個(gè)要求的表就是關(guān)系型表格。n通過(guò)E-R圖將這些概念反映出來(lái)

7、,通過(guò)名詞性和動(dòng)詞性,完全可以描述客觀世界,其中名詞性描述實(shí)體,動(dòng)詞性描述聯(lián)系或動(dòng)作影響,通過(guò)動(dòng)詞性將不同的實(shí)體關(guān)聯(lián)在一起第一目標(biāo)或者叫基礎(chǔ)目標(biāo):統(tǒng)計(jì),匯總及分析報(bào)表的工作盡量地自動(dòng)用Excel或Spreadsheet做,幾乎不需人為干預(yù)(來(lái)自于書(shū)籍及)目錄目錄n E-R模型的概念與表示n 實(shí)體-聯(lián)系方法(概念模型及設(shè)計(jì),關(guān)注現(xiàn)實(shí)世界)n 關(guān)系模式的規(guī)范化(消除數(shù)據(jù)冗余,避免操作異常)n E-R圖向關(guān)系表(Schema)的轉(zhuǎn)換(邏輯模型及設(shè)計(jì),關(guān)注信息世界)n 多維模式與統(tǒng)計(jì)分析的關(guān)系n Excel或Spreadsheet在統(tǒng)計(jì)分析中的角色n 統(tǒng)計(jì)分析系統(tǒng)(多維模式建構(gòu))的演進(jìn)n 終極目標(biāo):A

8、d-hoc報(bào)表系統(tǒng)關(guān)于現(xiàn)實(shí)世界事實(shí)及描述的定義關(guān)于現(xiàn)實(shí)世界事實(shí)及描述的定義n 事實(shí)包括以下四個(gè)方面: 第一:事實(shí)是指“某物具有某種性質(zhì)或某些事物具有某種關(guān)系?!?與原子命題、分子命題的分類(lèi)相對(duì)應(yīng),事實(shí)可以分為原子事實(shí)、分子事實(shí)。其中,原子事實(shí)是最基本、最簡(jiǎn)單的事實(shí),從中不能再析出其它事實(shí);分子事實(shí)是原子事實(shí)的復(fù)合 第二:事實(shí)具有客觀性?!按蠖鄶?shù)的事實(shí)的存在都不依靠我們的意愿;這就是為什么我們把它們叫作嚴(yán)峻的、不肯遷就的或不可抗拒的理由。大部分物理事實(shí)的存在不僅不依靠我們的意愿,而且也不依靠我們的存在” 第三:現(xiàn)實(shí)世界由各種各樣的事實(shí)組合而成,事實(shí)屬于現(xiàn)實(shí)世界 第四:事實(shí)決定命題的真?zhèn)危笆聦?shí)是

9、使得命題為真或?yàn)榧俚臇|西”。具體說(shuō)來(lái),原子命題的真假取決于它是否與原子事實(shí)相符合,分子命題的真假取決于組成它的原子命題的真假n 現(xiàn)實(shí)世界的語(yǔ)義描述的存在 第一:原子命題 第二:分子命題(由多個(gè)邏輯緊密相關(guān)的原子命題構(gòu)成) 第三:段落(由多個(gè)邏輯緊密相關(guān)的分子命題構(gòu)成) 第四:主題(由多個(gè)邏輯緊密相關(guān)的段落構(gòu)成)E-RE-R模型的概念與表示模型的概念與表示n E-R圖也稱(chēng)實(shí)體-聯(lián)系圖(Entity Relationship Diagram),提供了表示實(shí)體類(lèi)型、實(shí)體屬性和相關(guān)實(shí)體之間聯(lián)系(三個(gè)要素)的方法,用來(lái)描述現(xiàn)實(shí)世界的概念模型n 關(guān)系數(shù)據(jù)庫(kù)使用實(shí)體-聯(lián)系模型(E-R模型)進(jìn)行數(shù)據(jù)庫(kù)設(shè)計(jì),以

10、構(gòu)造信息世界的邏輯模型。E-R數(shù)據(jù)庫(kù)設(shè)計(jì)工具提供了一個(gè)“方框與箭頭”的繪圖工具,幫助數(shù)據(jù)庫(kù)用戶(hù)建立E-R圖來(lái)描繪數(shù)據(jù),邏輯及現(xiàn)實(shí)世界n E-R圖可以手繪,亦可以借用Case工具(Power Designer,Visio或SQL Power Architect)做出n 考察單獨(dú)的一個(gè)聯(lián)系(動(dòng)詞類(lèi)型的語(yǔ)義連接及構(gòu)造能力),聯(lián)系及相互關(guān)聯(lián)的實(shí)體形成的一個(gè)描述,構(gòu)造了一個(gè)最基本的原子命題E-RE-R模型的概念與表示模型的概念與表示實(shí)體集-語(yǔ)義(名詞類(lèi)性)n 實(shí)體(Entity)n 事物就是在行動(dòng)影響下物質(zhì)本身的改變,或者進(jìn)行??陀^存在并可相互區(qū)別的事物稱(chēng)為實(shí)體。實(shí)體可以是具體的,也可以是抽象的概念或聯(lián)

11、系。n 具有共性的一類(lèi)實(shí)體可歸類(lèi)為一個(gè)實(shí)體集(Entity set)。n 屬性(Attribute)n 實(shí)體所具有的某一特性稱(chēng)為屬性。n 一個(gè)實(shí)體可以由若干個(gè)屬性來(lái)刻畫(huà)。n 域(Domain)n 屬性的取值范圍或類(lèi)型。n 鍵或標(biāo)識(shí)符(Key)n 標(biāo)識(shí)符是實(shí)體中一個(gè)或多個(gè)屬性的集合,可用來(lái)唯一標(biāo)識(shí)實(shí)體中的一個(gè)實(shí)例。每個(gè)實(shí)體都必須至少有一個(gè)標(biāo)識(shí)符。如果實(shí)體只有一個(gè)標(biāo)識(shí)符,則它為實(shí)體的主標(biāo)識(shí)符。如果實(shí)體有多個(gè)標(biāo)識(shí)符,則其中一個(gè)被指定為主標(biāo)識(shí)符,其余的標(biāo)識(shí)符就是次標(biāo)識(shí)符(候選標(biāo)識(shí)符)E-RE-R模型的概念與表示模型的概念與表示聯(lián)系集-語(yǔ)義(動(dòng)詞類(lèi)型)n 實(shí)體之間可以通過(guò)聯(lián)系來(lái)相互關(guān)聯(lián)。與實(shí)體和實(shí)體集對(duì)

12、應(yīng),聯(lián)系也可以分為聯(lián)系和聯(lián)系集,聯(lián)系集是實(shí)體集之間的聯(lián)系,聯(lián)系是實(shí)體之間的聯(lián)系,聯(lián)系是具有方向性的。n 聯(lián)系具有方向性,每個(gè)方向上都有一個(gè)基數(shù)。n 聯(lián)系的兩個(gè)方向上各自包含有一角色名,描述該方向聯(lián)系的作用。n 按照實(shí)體類(lèi)型中實(shí)例之間的數(shù)量對(duì)應(yīng)關(guān)系,通??蓪⒙?lián)系分為4個(gè)基本聯(lián)系分為類(lèi),即一對(duì)一(ONE TO ONE)聯(lián)系、一對(duì)多(ONE TO MANY)聯(lián)系、多對(duì)一(MANY TO ONE)聯(lián)系和多對(duì)多聯(lián)系(MANY TO MANY)。n 三個(gè)特殊聯(lián)系n 每個(gè)實(shí)體類(lèi)型都有自己的標(biāo)識(shí)符,如果兩個(gè)實(shí)體集之間發(fā)生聯(lián)系,其中一個(gè)實(shí)體類(lèi)型的標(biāo)識(shí)符進(jìn)入另一個(gè)實(shí)體類(lèi)型并與該實(shí)體類(lèi)型中的標(biāo)識(shí)符共同組成其標(biāo)識(shí)符時(shí)

13、,這種聯(lián)系則稱(chēng)為標(biāo)定聯(lián)系,也叫依賴(lài)聯(lián)系。反之稱(chēng)為非標(biāo)定聯(lián)系,也叫非依賴(lài)聯(lián)系。n 遞歸聯(lián)系是實(shí)體集內(nèi)部實(shí)例之間的一種聯(lián)系,通常形象地稱(chēng)為自反聯(lián)系。同一實(shí)體類(lèi)型中不同實(shí)體集之間的聯(lián)系也稱(chēng)為遞歸聯(lián)系。E-RE-R模型的概念與表示(使用模型的概念與表示(使用CaseCase工具時(shí)的圖符及事例)工具時(shí)的圖符及事例)E-RE-R模型的概念與表示模型的概念與表示E-R圖的設(shè)計(jì)步驟 n 第一步:針對(duì)特定的應(yīng)用,確定實(shí)體、屬性和實(shí)體間的聯(lián)系,畫(huà)出局部E-R圖。n 第二步:綜合各個(gè)局部E-R圖,產(chǎn)生反映數(shù)據(jù)庫(kù)整體概念的總體E-R圖。E-RE-R模型的概念與表示(手繪草圖事例)模型的概念與表示(手繪草圖事例)弱實(shí)體

14、集n 有些實(shí)體集的所有屬性都不足以形成主碼,這樣的實(shí)體集稱(chēng)為弱實(shí)體集(Weak Entity Set),依賴(lài)于其它實(shí)體集而存在。n 與此相對(duì),其屬性可以形成主碼的實(shí)體集稱(chēng)為強(qiáng)實(shí)體集。n 弱實(shí)體集所依賴(lài)的實(shí)體集稱(chēng)為標(biāo)識(shí)實(shí)體集(identifying entity set),相應(yīng)的關(guān)系為標(biāo)識(shí)聯(lián)系(identifying relationship)。OrderItemdatestatuspaymentorder#item#tagIncludeE-RE-R模型的概念與表示模型的概念與表示n 弱實(shí)體集通常沒(méi)有主鍵。n 以訂單的分項(xiàng)為例,訂單項(xiàng)實(shí)體集可能有編號(hào)(局部的編號(hào))、商品名稱(chēng)、數(shù)量、單價(jià)等屬性,但

15、是這些屬性不足以識(shí)別一個(gè)定單項(xiàng),因?yàn)橥耆锌赡茉诹硗庖粡堄唵沃谐霈F(xiàn)相同的內(nèi)容。n 必須把訂單的關(guān)鍵字(如一個(gè)全局的訂單編號(hào))和定單項(xiàng)的局部編號(hào)結(jié)合起來(lái)才能標(biāo)示一個(gè)定單項(xiàng)。n 弱實(shí)體集的屬性中,用來(lái)與標(biāo)識(shí)實(shí)體集的鍵結(jié)合以識(shí)別一個(gè)弱實(shí)體集的屬性稱(chēng)為部分鍵(partial key)。n 弱實(shí)體集的主鍵=它的標(biāo)識(shí)實(shí)體集的鍵+它的部分鍵E-RE-R模型的概念與表示(手繪草圖事例)模型的概念與表示(手繪草圖事例)n E-R圖使用雙線(xiàn)矩形表示弱實(shí)體集,弱實(shí)體集與其標(biāo)識(shí)實(shí)體集之間的聯(lián)系用雙線(xiàn)菱形表示,弱實(shí)體集的部分鍵使用虛下劃線(xiàn)表示。OrderItemdatestatuspaymentorder#item#t

16、agIncludeE-RE-R模型的概念與表示模型的概念與表示n實(shí)體集的層次關(guān)系n 現(xiàn)實(shí)世界中的很多概念之間都具體層次關(guān)系。 n E-R模型使用實(shí)體集間的繼承和ISA關(guān)系來(lái)描述這種概念間的層次關(guān)系n 實(shí)體集老師或?qū)W生都繼承自實(shí)體集人,并且實(shí)體集老師或?qū)W生與實(shí)體集人之間都滿(mǎn)足ISA關(guān)系,即老師或?qū)W生都是人的一種。n ISA關(guān)系可以從兩個(gè)方向進(jìn)行設(shè)計(jì)n 從自上而下的方向,首先設(shè)計(jì)出人這一實(shí)體,然后根據(jù)屬性的不同,將兩種不同的人具體化(specification)為老師或者學(xué)生。n 從自下而上的方向,首先設(shè)計(jì)出老師或?qū)W生,然后將他們的共性提取出來(lái),泛化(generalization)為人。E-RE-

17、R模型的概念與表示模型的概念與表示n 層次關(guān)系的約束n 從子實(shí)體集之間是否相交角度,不相交(disjoin)泛化要求繼承自同一父輩的多個(gè)子實(shí)體集之沒(méi)有交集,重疊(overlapping)泛化則允許有交集。n 從泛化是否完全角度,全參與泛化要求所有父輩實(shí)體都必須同時(shí)也是某一子輩實(shí)體,部分泛化則允許不是任何子輩實(shí)體的父輩實(shí)體存在。n 例如,在采用會(huì)員制的銷(xiāo)售系統(tǒng)中,顧客被分為會(huì)員(VIP)與非會(huì)員(NONVIP)兩種,會(huì)員擁有消費(fèi)積分(credit),非會(huì)員擁有固定的折扣率(discount)。一個(gè)顧客要么是會(huì)員、要么是非會(huì)員,二者必取其一,因此為全參與不相交。E-RE-R模型的概念與表示(手繪草

18、圖事例)模型的概念與表示(手繪草圖事例)CustomerISAVIPNONVIPcreditdiscountdisjoincustomer #namegenderbirthdaycityaddressemailE-RE-R圖符(手繪草圖事例)圖符(手繪草圖事例)EAEARA實(shí)體集屬性弱實(shí)體集多值屬性聯(lián)系集導(dǎo)出屬性R弱實(shí)體集的確定聯(lián)系集A主鍵A弱實(shí)體集的區(qū)別屬性R多對(duì)多聯(lián)系R多對(duì)一聯(lián)系R一對(duì)一聯(lián)系RE實(shí)體集在聯(lián)系中的全參與ISA泛化或特殊化ISA不相交泛化disjoinISA全參與泛化RE角色指示標(biāo)示角色名RE重復(fù)次數(shù)約定1.h實(shí)體實(shí)體- -聯(lián)系方法聯(lián)系方法實(shí)體還是屬性n 凡是滿(mǎn)足以下兩條準(zhǔn)則的

19、事物,一般均可作為屬性對(duì)待。 n 作為屬性,不能再具有需要描述的性質(zhì)。屬性必須是不可分的數(shù)據(jù)項(xiàng),不能包含其他屬性。n 屬性不能與其他實(shí)體具有聯(lián)系,即E-R圖中所表示的聯(lián)系是實(shí)體之間的聯(lián)系。n 例如書(shū)籍是一個(gè)實(shí)體,書(shū)號(hào)、書(shū)名、作者、出版社、定價(jià)是書(shū)籍的屬性,如果應(yīng)用系統(tǒng)不再需要作者的其他信息,如電話(huà)、住址、個(gè)人主頁(yè)等,那么根據(jù)原則1可以將作者作為書(shū)籍的屬性對(duì)待。但是如果這些信息是必須的,那么作者作為一個(gè)實(shí)體看待更為恰當(dāng)。實(shí)體實(shí)體- -聯(lián)系方法(手繪草圖事例)聯(lián)系方法(手繪草圖事例) bookisbntitlepricepresswritten_bynameauthorauthorcityseri

20、al bookisbntitlepricepressauthor實(shí)體實(shí)體- -聯(lián)系方法聯(lián)系方法實(shí)體還是聯(lián)系n 一般來(lái)說(shuō),實(shí)體對(duì)應(yīng)現(xiàn)實(shí)世界中實(shí)際存在的事物,是名詞類(lèi)型;聯(lián)系對(duì)應(yīng)的概念一般是一種動(dòng)作,是動(dòng)詞類(lèi)型。n 例如:n 書(shū)和作者都是現(xiàn)實(shí)世界中的名詞,因此作為實(shí)體。n 而written_by表示作者寫(xiě)書(shū)這一動(dòng)作,因此作為聯(lián)系。n 映射基數(shù)往往影響到一個(gè)概念是作為實(shí)體還是聯(lián)系的選擇。 n 若一項(xiàng)貸款只能由一個(gè)分行發(fā)放,并且只能由一個(gè)客戶(hù)借貸,則將Loan作為Customer與Branch之間的聯(lián)系比較合適。n 但如果允許多個(gè)客戶(hù)共同借貸同一項(xiàng)貸款 ,在這種情況下,將Loan作為實(shí)體。實(shí)體實(shí)體-

21、-聯(lián)系方法(手繪草圖事例)聯(lián)系方法(手繪草圖事例)二元關(guān)系還是多元關(guān)系n 數(shù)據(jù)庫(kù)中使用得最多的是二元聯(lián)系。n 通常,將多元關(guān)系轉(zhuǎn)換為二元關(guān)系。n 如學(xué)校選課系統(tǒng),涉及到學(xué)生、教室、教師、課程等多個(gè)實(shí)體,可表示為一個(gè)四元關(guān)系。 學(xué)生學(xué)生上課上課教室教室教師教師課程課程學(xué)生學(xué)生選課選課課程課程授課授課教師教師地點(diǎn)地點(diǎn)教室教室實(shí)體實(shí)體- -聯(lián)系方法(手繪草圖事例)聯(lián)系方法(手繪草圖事例)n 但也有一些情況下使用多元聯(lián)系更好(如需要表達(dá)多個(gè)實(shí)體集間的約束時(shí))n 如學(xué)校選課系統(tǒng)中若一門(mén)課程可由多個(gè)教師教授,并且若課程和教師確定,則上課的地點(diǎn)也隨之確定。教師課程教室上課實(shí)體實(shí)體- -聯(lián)系方法(手繪草圖事例

22、)聯(lián)系方法(手繪草圖事例)聯(lián)系屬性的放置n 影響聯(lián)系屬性放置的主要因素是聯(lián)系的映射基數(shù)。n 對(duì)于一對(duì)一或一對(duì)多聯(lián)系,選擇作為聯(lián)系屬性或?qū)嶓w屬性只是體現(xiàn)語(yǔ)義側(cè)重點(diǎn)的不同 n 如銷(xiāo)售系統(tǒng)需要記錄顧客(Customer)與訂單(Order)之間的關(guān)系(Possess)。由于一個(gè)訂單只能由一個(gè)顧客所有,因此為顧客與訂單之間為一對(duì)多關(guān)系。這時(shí),記錄生成訂單日期的屬性(date)既可以作為聯(lián)系Possess的屬性,也可作為訂單的屬性。 OrderdatestatuspaymentorderPossesCustomer實(shí)體實(shí)體- -聯(lián)系方法(手繪草圖事例)聯(lián)系方法(手繪草圖事例)n 對(duì)于多對(duì)多聯(lián)系,聯(lián)系的屬

23、性不能作為實(shí)體的屬性。n 如,顧客與希望書(shū)籍之間的聯(lián)系希望購(gòu)買(mǎi)(Wish_for)。n Wish_for有一屬性date,表示顧客發(fā)出購(gòu)買(mǎi)意向的日期,這一屬性不能作為參與聯(lián)系的兩個(gè)實(shí)體Customer或Book的屬性。BookWish_forCustomerdate實(shí)例實(shí)例在線(xiàn)書(shū)店數(shù)據(jù)庫(kù)在線(xiàn)書(shū)店數(shù)據(jù)庫(kù)n 類(lèi)似于Amazon的在線(xiàn)書(shū)店系統(tǒng)所用的數(shù)據(jù)庫(kù)n數(shù)據(jù)庫(kù)中要求存儲(chǔ)所有書(shū)籍的相關(guān)信息,并對(duì)書(shū)加以分類(lèi);n顧客的有關(guān)信息也要求存儲(chǔ)在數(shù)據(jù)庫(kù)中,并且允許用戶(hù)選擇自己感興趣的書(shū)籍類(lèi)別及希望購(gòu)買(mǎi)的圖書(shū);n顧客在決定購(gòu)買(mǎi)時(shí)可以發(fā)出訂單,同一訂單可以包含多種書(shū),每種書(shū)可一次購(gòu)買(mǎi)多本。顧客在訂單中提供送貨地址,

24、系統(tǒng)根據(jù)訂單發(fā)貨。實(shí)例在線(xiàn)書(shū)店數(shù)據(jù)庫(kù)E-R圖(手繪草圖事例)B o o kW r i t t e n _ b yA u t h o rt i t l ep r i c ep r e s sI S B Na u t h o r #n a m ec i t ys e r i a ly e a rB e l o n g _ t oC a t e g o r yc a t e g o r y #t a gC o n t a i ns u bs u p e rc u s t o m e r #n a m eg e n d e rb i r t h d a yc i t ya d d r e s se m

25、 a i lC u s t o m e rO r d e rI t e md a t es t a t u sp a y m e n to r d e r #i t e m #q t yI n c l u d en a m ea d d r e s sP o s s e s sI S AV I PN O N V I Pc r e d i td i s c o u n tF o u n d _ a tW i s h _ f o rI n t e r e s t _ i nd a t ed a t es t a t u sd i s j o i ns t o c k實(shí)例實(shí)例在線(xiàn)書(shū)店數(shù)據(jù)庫(kù)在線(xiàn)書(shū)店數(shù)

26、據(jù)庫(kù)n 合并分E-R圖n 各分E-R圖之間的沖突主要有三類(lèi):n 屬性沖突 (1) 屬性域沖突,即屬性值的類(lèi)型、取值范圍或取值集合不同。例如:屬性“訂單號(hào)”有的定義為字符型,有的為數(shù)值型。 (2) 屬性取值單位沖突。例如:屬性“庫(kù)存”有的以?xún)?cè)為單位,有的以千冊(cè)為單位。 n 命名沖突 (1) 同名異義。不同意義對(duì)象相同名稱(chēng)。例如:Author和Customer均有屬性name。 (2) 異名同義(一義多名)。同意義對(duì)象不相同名稱(chēng)。例如:“項(xiàng)目”和“課題”。實(shí)例實(shí)例在線(xiàn)書(shū)店數(shù)據(jù)庫(kù)在線(xiàn)書(shū)店數(shù)據(jù)庫(kù)n 結(jié)構(gòu)沖突 (1) 同一對(duì)象在不同應(yīng)用中具有不同的抽象。例如: “作者”在某一局部應(yīng)用中被當(dāng)作實(shí)體,而在另

27、一局部應(yīng)用中則被當(dāng)作屬性。 (2) 同一實(shí)體在不同局部視圖中所包含的屬性不完全相同,或者屬性的排列次序不完全相同。 (3) 實(shí)體之間的聯(lián)系在不同局部視圖中呈現(xiàn)不同的類(lèi)型。例如:實(shí)體E1與E2在局部應(yīng)用A中是多對(duì)多聯(lián)系,而在局部應(yīng)用B中是一對(duì)多聯(lián)系;又如在局部應(yīng)用X中E1與E2發(fā)生聯(lián)系,而在局部應(yīng)用Y中E1、E2、E3三者之間有聯(lián)系。 n 解決方法是根據(jù)應(yīng)用的語(yǔ)義對(duì)實(shí)體聯(lián)系的類(lèi)型進(jìn)行綜合或調(diào)整。 思考題思考題n 什么是數(shù)據(jù)庫(kù),什么是數(shù)據(jù)倉(cāng)庫(kù)n 描述事實(shí),事件,主題的關(guān)系,描述實(shí)體和聯(lián)系的語(yǔ)義基礎(chǔ)n 請(qǐng)手繪在線(xiàn)書(shū)店數(shù)據(jù)庫(kù) E-R模型n Excel能做什么,Excel結(jié)合Access能做什么關(guān)系模式

28、關(guān)系模式n設(shè)計(jì)范式(范式,數(shù)據(jù)庫(kù)設(shè)計(jì)范式,數(shù)據(jù)庫(kù)關(guān)系表的設(shè)計(jì)范式)是符合某一種級(jí)別的關(guān)系模式的集合。構(gòu)造數(shù)據(jù)庫(kù)必須遵循一定的規(guī)則。在關(guān)系數(shù)據(jù)庫(kù)中,這種規(guī)則或者叫約束就是范式。關(guān)系數(shù)據(jù)庫(kù)中的關(guān)系必須滿(mǎn)足一定的要求,即滿(mǎn)足不同的范式n第一范式(1NF):在任何一個(gè)關(guān)系數(shù)據(jù)庫(kù)中,第一范式(1NF)是對(duì)關(guān)系模式的基本要求,不滿(mǎn)足第一范式(1NF)的數(shù)據(jù)庫(kù)就不是關(guān)系數(shù)據(jù)庫(kù)。所謂第一范式(1NF)是指數(shù)據(jù)庫(kù)表的每一列都是不可分割的基本數(shù)據(jù)項(xiàng),同一列中不能有多個(gè)值,即實(shí)體中的某個(gè)屬性不能有多個(gè)值或者不能有重復(fù)的屬性。如果出現(xiàn),就可能需要定義一個(gè)新的實(shí)體,新實(shí)體與原實(shí)體之間為一對(duì)多關(guān)系n第二范式(2NF):數(shù)

29、據(jù)庫(kù)表中不存在非關(guān)鍵字段對(duì)任一候選關(guān)鍵字段的部分函數(shù)依賴(lài)(部分函數(shù)依賴(lài)指的是存在組合關(guān)鍵字中的某些字段決定非關(guān)鍵字段的情況),也即所有非關(guān)鍵字段都完全依賴(lài)于任意一組候選關(guān)鍵字。如果存在,那么這個(gè)屬性和主關(guān)鍵字的這一部分應(yīng)該分離出來(lái)形成一個(gè)新的實(shí)體,新實(shí)體與原實(shí)體之間是一對(duì)多的關(guān)系n第三范式(3NF) :要求一個(gè)數(shù)據(jù)庫(kù)表中不包含已在其它表中已包含的非主關(guān)鍵字信息。例如,存在一個(gè)部門(mén)信息表,其中每個(gè)部門(mén)有部門(mén)編號(hào)(dept_id)、部門(mén)名稱(chēng)、部門(mén)簡(jiǎn)介等信息。那么在員工信息表中列出部門(mén)編號(hào)后就不能再將部門(mén)名稱(chēng)、部門(mén)簡(jiǎn)介等與部門(mén)有關(guān)的信息再加入員工信息表中。如果不存在部門(mén)信息表,則根據(jù)第三范式(3NF

30、)也應(yīng)該構(gòu)建它,否則就會(huì)有大量的數(shù)據(jù)冗余。如果存在,應(yīng)該分離這一部分出來(lái)形成一個(gè)新的實(shí)體,新實(shí)體與原實(shí)體之間是一對(duì)多的關(guān)系n關(guān)鍵要理解定義這種范式標(biāo)準(zhǔn)的主要目的是為了減少數(shù)據(jù)冗余,數(shù)據(jù)冗余產(chǎn)生的本質(zhì)就是在一個(gè)表中存在字段與字段之間的一對(duì)多,或者多對(duì)多關(guān)系。滿(mǎn)足這些規(guī)范的數(shù)據(jù)庫(kù)是簡(jiǎn)潔的、結(jié)構(gòu)明晰的,同時(shí),也不會(huì)發(fā)生插入(insert)、刪除(delete)和更新(update)操作異常。反之則是亂七八糟,不僅給數(shù)據(jù)庫(kù)的編程人員制造麻煩,而且面目可憎,可能存儲(chǔ)了大量不需要的冗余信息。解決這個(gè)幾對(duì)幾的關(guān)系問(wèn)題,就能輕易實(shí)現(xiàn)滿(mǎn)足第三范式的數(shù)據(jù)庫(kù)設(shè)計(jì)n思考題思考題:假定選課關(guān)系表為SelectCours

31、e(學(xué)號(hào), 姓名, 年齡, 課程名稱(chēng), 成績(jī), 學(xué)分),關(guān)鍵字為組合關(guān)鍵字(學(xué)號(hào), 課程名稱(chēng)),因?yàn)榇嬖谌缦聸Q定關(guān)系:(學(xué)號(hào), 課程名稱(chēng)) (姓名, 年齡, 成績(jī), 學(xué)分) 這個(gè)數(shù)據(jù)庫(kù)表不滿(mǎn)足第二范式,因?yàn)榇嬖谌缦聸Q定關(guān)系:(課程名稱(chēng)) (學(xué)分) (學(xué)號(hào)) (姓名, 年齡) 即存在組合關(guān)鍵字中的字段決定非關(guān)鍵字的情況。 n造成的潛在問(wèn)題:造成的潛在問(wèn)題: (1) 數(shù)據(jù)冗余: 同一門(mén)課程由n個(gè)學(xué)生選修,“學(xué)分”就重復(fù)n-1次;同一個(gè)學(xué)生選修了m門(mén)課程,姓名和年齡就重復(fù)了m-1次。(2) 更新異常: 若調(diào)整了某門(mén)課程的學(xué)分,數(shù)據(jù)表中所有行的“學(xué)分”值都要更新,否則會(huì)出現(xiàn)同一門(mén)課程學(xué)分不同的情況。

32、(3) 插入異常:假設(shè)要開(kāi)設(shè)一門(mén)新的課程,暫時(shí)還沒(méi)有人選修。這樣,由于還沒(méi)有“學(xué)號(hào)”關(guān)鍵字,課程名稱(chēng)和學(xué)分也無(wú)法記錄入數(shù)據(jù)庫(kù)。 (4) 刪除異常: 假設(shè)一批學(xué)生已經(jīng)完成課程的選修,這些選修記錄就應(yīng)該從數(shù)據(jù)庫(kù)表中刪除。但是,與此同時(shí),課程名稱(chēng)和學(xué)分信息也被刪除了。很顯然,這也會(huì)導(dǎo)致插入異常。 把選課關(guān)系表SelectCourse改為如下三個(gè)表:學(xué)生:Student(學(xué)號(hào), 姓名, 年齡); 課程:Course(課程名稱(chēng), 學(xué)分);選課關(guān)系:SelectCourse(學(xué)號(hào), 課程名稱(chēng), 成績(jī))。 這樣的數(shù)據(jù)庫(kù)表是符合第二范式的, 消除了數(shù)據(jù)冗余、更新異常、插入異常和刪除異常。 另外,所有單關(guān)鍵字的

33、數(shù)據(jù)庫(kù)表都符合第二范式,因?yàn)椴豢赡艽嬖诮M合關(guān)鍵字。 E-RE-R圖向關(guān)系模式的轉(zhuǎn)換及主題數(shù)據(jù)庫(kù)圖向關(guān)系模式的轉(zhuǎn)換及主題數(shù)據(jù)庫(kù)n通過(guò)實(shí)體聯(lián)系方法可以方便得得到現(xiàn)實(shí)世界的一個(gè)抽象模型,但這一模型并不能為數(shù)據(jù)庫(kù)管理系統(tǒng)接受。要完成從現(xiàn)實(shí)世界到信息世界的轉(zhuǎn)化,還必須將實(shí)體聯(lián)系方法所得的E-R圖轉(zhuǎn)化為關(guān)系表定義。n注意:一定要區(qū)分語(yǔ)義,包括名詞性和動(dòng)詞性。先是動(dòng)詞性,代表聯(lián)系集,其次是名詞性,代表聯(lián)系集的動(dòng)詞性所依賴(lài)、影響和作用的實(shí)體集n分析并確定主題:主題數(shù)據(jù)庫(kù)是面向業(yè)務(wù),面向事務(wù),面向事實(shí)和事件的主題的數(shù)據(jù)組織存儲(chǔ),例如,企業(yè)中需要建立的典型的主題數(shù)據(jù)庫(kù)有:產(chǎn)品、客戶(hù)、零部件、供應(yīng)商、訂貨、員工、文

34、件資料、工程規(guī)范等。其中產(chǎn)品、客戶(hù)、零部件等數(shù)據(jù)庫(kù)的結(jié)構(gòu),是對(duì)有關(guān)單證、報(bào)表的數(shù)據(jù)項(xiàng)進(jìn)行分析整理而設(shè)計(jì)的,不是按單證、報(bào)表的原樣建立的。這些主題數(shù)據(jù)庫(kù)與企業(yè)管理中要解決的主要問(wèn)題相關(guān)聯(lián),而不是與通常的計(jì)算機(jī)應(yīng)用項(xiàng)目相關(guān)聯(lián)。n一個(gè)主題數(shù)據(jù)庫(kù)的科學(xué)的數(shù)據(jù)結(jié)構(gòu):是由多個(gè)達(dá)到“基本表” (Base Table)規(guī)范的數(shù)據(jù)實(shí)體構(gòu)成的,這些基本表具有如下的特性: 1)原子性基本表中的數(shù)據(jù)項(xiàng)是數(shù)據(jù)元素(即最小的、不能再分解的信息單元); 2)演繹性可由基本表中的數(shù)據(jù)生成全部輸出數(shù)據(jù)(即這些基本表是精練的,經(jīng)過(guò)計(jì)算或操作(自動(dòng)化)處理可以產(chǎn)生全部企業(yè)管理所需要的數(shù)據(jù)); 3)規(guī)范性基本表中數(shù)據(jù)滿(mǎn)足三范式(3N

35、F)要求,這是依據(jù)科學(xué)的、能滿(mǎn)足演繹性推算要求、并能保證快捷存取的數(shù)據(jù)結(jié)構(gòu)。實(shí)體的轉(zhuǎn)換實(shí)體的轉(zhuǎn)換 n 將一個(gè)普通實(shí)體(非弱實(shí)體)轉(zhuǎn)換為表定義是相當(dāng)直觀的,實(shí)體的每個(gè)屬性對(duì)應(yīng)表中的一個(gè)字段,實(shí)體的主鍵對(duì)應(yīng)表的主鍵。n 如Book實(shí)體轉(zhuǎn)化到表的結(jié)果為:n Book(isbn#, title, price, press, stock)聯(lián)系的轉(zhuǎn)換聯(lián)系的轉(zhuǎn)換n 一個(gè)多對(duì)多聯(lián)系在轉(zhuǎn)換后也對(duì)應(yīng)一個(gè)新的交叉(轉(zhuǎn)換為一對(duì)多聯(lián)系)實(shí)體表,表中的屬性包括n 參與聯(lián)系各實(shí)體的主鍵n 聯(lián)系的描述屬性n 參與聯(lián)系各實(shí)體的主鍵之和構(gòu)成新的交叉(轉(zhuǎn)換為一對(duì)多聯(lián)系)實(shí)體表的超鍵。n 如多對(duì)多聯(lián)系Written_by轉(zhuǎn)化為表之后

36、(被轉(zhuǎn)換為一對(duì)多聯(lián)系)其主鍵將由參與該聯(lián)系的兩個(gè)實(shí)體Book和Author的主鍵構(gòu)成,如下:n Written_by(isbn#, author#, serial)聯(lián)系的轉(zhuǎn)換聯(lián)系的轉(zhuǎn)換n 一對(duì)一和一對(duì)多聯(lián)系n A與B之間是一對(duì)多聯(lián)系,不轉(zhuǎn)換為一張單獨(dú)的表,而只在B轉(zhuǎn)換后的表中增加A的主鍵屬性(當(dāng)然這些屬性將形成一個(gè)引用到A的主鍵的一個(gè)外鍵),以此表示某B實(shí)體所從屬的A實(shí)體。n 這種方法可以產(chǎn)生更少的表,有利于提高數(shù)據(jù)庫(kù)性能,還可以表達(dá)更多的約束 n 如對(duì)于聯(lián)系Possess,將在Order表中增加一列customer#表示訂單從屬的顧客弱實(shí)體的轉(zhuǎn)換弱實(shí)體的轉(zhuǎn)換 n 由于弱實(shí)體總是全參與它與它的

37、標(biāo)識(shí)實(shí)體之間的多對(duì)一聯(lián)系,因此可以采用上面提出的一對(duì)多聯(lián)系方法進(jìn)行轉(zhuǎn)換。n 弱實(shí)體轉(zhuǎn)換后生成的表的主鍵由標(biāo)識(shí)實(shí)體的主鍵與弱實(shí)體本身的部分鍵組合而成。n 如弱實(shí)體Item轉(zhuǎn)換后,構(gòu)成如下:n Item(order# ,item# , isbn ,qty)實(shí)體層次的轉(zhuǎn)換實(shí)體層次的轉(zhuǎn)換 n 將實(shí)體層次轉(zhuǎn)換為表定義時(shí)可采用兩種方法n 父輩實(shí)體與子輩實(shí)體都轉(zhuǎn)換為單獨(dú)的表通用方法,任何情況適用。n 每一個(gè)子輩實(shí)體轉(zhuǎn)換為單獨(dú)的表,其中既包含各子輩實(shí)體的特殊屬性,也包含子輩與父輩實(shí)體的公有屬性。只適用全參與泛化,因無(wú)法比哦啊是不從屬于任何子輩實(shí)體的父輩實(shí)體n 如Customer與VIP、NONVIP之間的全參

38、與泛化可用第二種方法轉(zhuǎn)換為:VIP(customer#,name,gender,birthday,city,address,email,credit)NONVIP( customer# ,name,gender,birthday,city,address,email,discount)一些實(shí)際的考慮一些實(shí)際的考慮n 一般來(lái)說(shuō),在將E-R圖轉(zhuǎn)換到關(guān)系表定義的過(guò)程中,需要考慮兩個(gè)實(shí)際的問(wèn)題:性能與數(shù)據(jù)規(guī)范化。n 提高數(shù)據(jù)庫(kù)性能的一個(gè)重要方法是進(jìn)行數(shù)據(jù)冗余,不要跨表進(jìn)行處理。n 用一個(gè)表記錄所有父子實(shí)體,而用一個(gè)字段來(lái)表示實(shí)體的類(lèi)型。n 請(qǐng)大家依據(jù)關(guān)系模式規(guī)范化理論討論如下實(shí)體是否要拆分成不同的實(shí)體

39、集和聯(lián)系集,還是不拆分:例如:Customer( customer# ,name,gender,birthday,city,address,email,credit,discount,customer-type)在線(xiàn)書(shū)店數(shù)據(jù)庫(kù)及關(guān)系模式在線(xiàn)書(shū)店數(shù)據(jù)庫(kù)及關(guān)系模式n Book(isbn#,title,price,press,stock)n Author(author# ,name,city)n Written_by(isbn,author# ,serial)n Category(category# ,super# ,tag)n Customer( customer# ,name,gender,bi

40、rthday,city,address,email,credit,discount,customer_type)n Interest_in(customer# ,category# ,date)n Wish_for(customer# ,isbn# ,date,status)n Order(order# ,customer# ,date,status,payment,name,address)n Item(item# ,order# ,isbn,qty)數(shù)據(jù)庫(kù)便利查詢(xún)及數(shù)據(jù)庫(kù)便利查詢(xún)及SQLSQL語(yǔ)言語(yǔ)言規(guī)范化規(guī)范化后的若干后的若干表到單一表的解決之道表到單一表的解決之道nIBM QBE:QB

41、E是Query By Example(通過(guò)例子進(jìn)行查詢(xún))的簡(jiǎn)稱(chēng),即實(shí)例查詢(xún)語(yǔ)言。它是一種基于圖形的點(diǎn)擊式查詢(xún)數(shù)據(jù)庫(kù)的方法。域關(guān)系演算是以元組變量的分量即是域變量作為謂詞變?cè)幕緦?duì)象。域關(guān)系演算語(yǔ)言的典型代表是1975年由IBM公司的約克城高級(jí)研究試驗(yàn)室的M.M.Zloof的QBE語(yǔ)言。該語(yǔ)言于1978年在IBM 370上實(shí)現(xiàn)。QBE其最突出的特點(diǎn)就是他的操作方式。它是一種高度非過(guò)程化的基于屏幕表格的查詢(xún)語(yǔ)言,用戶(hù)通過(guò)終端終端屏幕編輯程序以填寫(xiě)表格的方式構(gòu)造查詢(xún)要求,而查詢(xún)結(jié)果也是以表格形式顯示,因此非常直觀,易學(xué)易用。QBE免去了用戶(hù)需要記憶表格名,屬性名及查詢(xún)語(yǔ)言語(yǔ)法的工作。它的基本思想是

42、根據(jù)查詢(xún)模板檢索數(shù)據(jù),因此易學(xué)易用。因?yàn)镼BE是由IBM開(kāi)發(fā)的,所以它具有IBM的商標(biāo),但是許多其它的公司也具有類(lèi)似于QBE的查詢(xún)界面。有一些系統(tǒng),如Microsoft Access,受到了QBE的影響,已經(jīng)在某種程度上支持基于表單的查詢(xún)。n Microsoft Query: 檢索來(lái)自外部源的數(shù)據(jù)。通過(guò)使用 Microsoft Query 從企業(yè)數(shù)據(jù)庫(kù) (數(shù)據(jù)庫(kù):與特定主題或用途相關(guān)的數(shù)據(jù)的集合。在數(shù)據(jù)庫(kù)內(nèi),關(guān)于特定實(shí)體的信息(如雇員或訂單)分類(lèi)歸納到表、記錄和字段中。)和文件中檢索數(shù)據(jù),可以避 免在 Excel 中重新鍵入要分析的數(shù)據(jù)。另外,只要原始源數(shù)據(jù)庫(kù)更新了新的信息,就可以自動(dòng)從該數(shù)據(jù)

43、庫(kù)中刷新 Excel 報(bào)表和摘要。n從數(shù)據(jù)庫(kù)中選擇數(shù)據(jù) 您通過(guò)創(chuàng)建查詢(xún)從數(shù)據(jù)庫(kù)中檢索數(shù)據(jù),查詢(xún)是您提出的有關(guān)存儲(chǔ)在外部數(shù)據(jù)庫(kù)中的數(shù)據(jù)的問(wèn)題。例如,如果數(shù)據(jù)存儲(chǔ)在 Access 數(shù)據(jù)庫(kù)中,您可能想要知道某種特定產(chǎn)品在各個(gè)地區(qū)的銷(xiāo)售數(shù)字??梢灾贿x擇要分析的產(chǎn)品和地區(qū)的數(shù)據(jù),從而檢索部分?jǐn)?shù)據(jù)。n使用 Microsoft Query,您可以選擇所需的數(shù)據(jù)列,并只將這些數(shù)據(jù)導(dǎo)入 Excel。通過(guò)一個(gè)操作更新工作表 如果您的 Excel 工作簿中包含外部數(shù)據(jù),那么,只要數(shù)據(jù)庫(kù)發(fā)生更改,就可以刷新 (刷新:更新源于外部數(shù)據(jù)源的數(shù)據(jù)。每次刷新數(shù)據(jù)后,查看到的都是數(shù)據(jù)庫(kù)中信息的最新版本,其中包括對(duì)數(shù)據(jù)所做的任何

44、更改。)數(shù)據(jù)以更新您的分析,而不必 重新創(chuàng)建匯總報(bào)表和圖表。例如,您可以創(chuàng)建每月銷(xiāo)售匯總,并在每個(gè)月的新銷(xiāo)售數(shù)字出來(lái)后刷新它。QBE與與SQL的的區(qū)別區(qū)別:關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng)(RDBMS)主要有兩種語(yǔ)言:QBE語(yǔ)言和SQL語(yǔ)言。QBE與SQL的最大區(qū)別就是,QBE具有圖形用戶(hù)界面,允許用戶(hù)通過(guò)在屏幕上創(chuàng)建示例表來(lái)編寫(xiě)查詢(xún)。QBE特別適合于不太復(fù)雜、可用幾個(gè)表描述的查詢(xún)。思考題及大作業(yè)思考題及大作業(yè)n 請(qǐng)用Access做出在線(xiàn)書(shū)店數(shù)據(jù)庫(kù)及關(guān)系模式n 電話(huà)計(jì)費(fèi)系統(tǒng)關(guān)于不同業(yè)務(wù)或叫特殊功能需求,比如:國(guó)內(nèi)長(zhǎng)途,港澳長(zhǎng)途,國(guó)際長(zhǎng)途等,如何設(shè)計(jì)數(shù)據(jù)庫(kù)滿(mǎn)足: 表結(jié)構(gòu)不變,永遠(yuǎn)滿(mǎn)足需求,比如:減少業(yè)務(wù),增

45、加業(yè)務(wù)n 基于類(lèi)似Excel表格的設(shè)計(jì)和基于E-R圖實(shí)體聯(lián)系模型(關(guān)系模式/模型)的設(shè)計(jì)比較n 利用Excel多個(gè)列表之間關(guān)系分析在線(xiàn)書(shū)店數(shù)據(jù)庫(kù)數(shù)據(jù)的統(tǒng)計(jì)分析及報(bào)表的展示功能數(shù)據(jù)的統(tǒng)計(jì)分析及報(bào)表的展示功能n 報(bào)表展示與制作是面向業(yè)務(wù)統(tǒng)計(jì)分析人員的最終體驗(yàn),是最高層的數(shù)據(jù)統(tǒng)計(jì)分析應(yīng)用的需求和表達(dá)n真實(shí)例子展開(kāi)(Practical Data Warehouse and Business Intelligence Insights)n單主題1)加拿大電信2007年的年度銷(xiāo)售報(bào)表(1)2)加拿大電信2007年的季度銷(xiāo)售報(bào)表(4)3)加拿大電信2007年的月度銷(xiāo)售報(bào)表(12)4)加拿大電信2007年每省

46、的年度銷(xiāo)售報(bào)表(10)5)加拿大電信2007年的每省的季度銷(xiāo)售報(bào)表(40)6)加拿大電信2007年的每省的月度銷(xiāo)售報(bào)表(120)7)若每省有十個(gè)縣,則需要報(bào)表10*12*10=1200 n多主題這樣如果一個(gè)主題像上面的報(bào)表需求量,則有多少主題,報(bào)表數(shù)量是冪乘數(shù)的關(guān)系,尤其是同比和環(huán)比這樣的統(tǒng)計(jì)需求n工作場(chǎng)景描述(Just Build It) 1)新建報(bào)表時(shí),大多數(shù)人都是使用Microsoft Excel利用原有已經(jīng)被Excel表格加工過(guò)的數(shù)據(jù),很少使用初始規(guī)范化的數(shù)據(jù)源2)一個(gè)報(bào)表因?yàn)榧庸み^(guò)的而造成的數(shù)據(jù)分散,需要多個(gè)業(yè)務(wù)人員協(xié)作完成3)多人協(xié)作時(shí)數(shù)據(jù)不一致,數(shù)據(jù)不規(guī)范嚴(yán)重影響工作進(jìn)度n 解決

47、方案n使用多維建模方法論,建立以業(yè)務(wù)事件為導(dǎo)向的以主題(統(tǒng)計(jì)分析涉及的不同領(lǐng)域數(shù)據(jù))為相關(guān)的事實(shí)表庫(kù)(統(tǒng)計(jì)分析涉及不同數(shù)據(jù)事件模型),通過(guò)對(duì)多維模型的鉆取、切取、旋轉(zhuǎn)等操作實(shí)現(xiàn)報(bào)表的動(dòng)態(tài)化和個(gè)性化,消除眾多關(guān)聯(lián)的中間報(bào)表,以實(shí)現(xiàn)Ad-hoc報(bào)表(自動(dòng)化程度高的報(bào)表)n逐步從依賴(lài)類(lèi)似Microsoft Excel(分散部署,數(shù)據(jù)不一致及不規(guī)范的始作俑者)表格過(guò)渡到多維統(tǒng)計(jì)分析到數(shù)據(jù)集市再到數(shù)據(jù)倉(cāng)庫(kù)的路線(xiàn)ExcelExcel報(bào)表與事實(shí)表的相互轉(zhuǎn)換關(guān)系報(bào)表與事實(shí)表的相互轉(zhuǎn)換關(guān)系單一的Excel列表,有數(shù)據(jù)冗余,存在增刪改的異常Excel報(bào)表,依據(jù)習(xí)慣行為建立,沒(méi)有考慮增刪改的操作關(guān)聯(lián)的Excel列表

48、,消除數(shù)據(jù)冗余,增刪改的異常不存在例如:多種產(chǎn)品只能放在一個(gè)倉(cāng)庫(kù)中,一個(gè)倉(cāng)庫(kù)有多個(gè)管理員。構(gòu)造關(guān)系模式(倉(cāng)庫(kù)管理員,倉(cāng)庫(kù)號(hào),庫(kù)存產(chǎn)品號(hào)),存在數(shù)據(jù)冗余,重新構(gòu)造或修改為相互關(guān)聯(lián)的關(guān)系模式(倉(cāng)庫(kù)號(hào),倉(cāng)庫(kù)管理員),(倉(cāng)庫(kù)號(hào),庫(kù)存產(chǎn)品號(hào))思考:(系名,教師名,學(xué)生名)存在數(shù)據(jù)冗余嗎,怎樣修改或構(gòu)造實(shí)際上相互關(guān)聯(lián)的關(guān)系模式(E-R模型或主題數(shù)據(jù)庫(kù))記錄了操作影響的單一事務(wù)或形成了一個(gè)事件,事件將多個(gè)實(shí)體關(guān)聯(lián)在一起,這是業(yè)務(wù)操作型數(shù)據(jù)庫(kù)系統(tǒng)的最為顯著的特征,事件構(gòu)成了事實(shí),事實(shí)形成了主題(主題數(shù)據(jù)庫(kù)),可以被度量(統(tǒng)計(jì)分析)。理論上通過(guò)集合論的關(guān)系運(yùn)算,可以得到任意統(tǒng)計(jì)分析結(jié)果,所以相對(duì)完美的解決方案是

49、逆序,不要按習(xí)慣先做報(bào)表,有了問(wèn)題(增刪改異常及新的查詢(xún)需求)才回溯數(shù)據(jù)源表:駐留在操作型關(guān)系數(shù)據(jù)庫(kù)端中間表:駐留在操作型關(guān)系數(shù)據(jù)庫(kù)端或被倒出,駐留在Excel端統(tǒng)計(jì)分析表:駐留在Excel端多維模式多維模式(OLAP)(OLAP)的星型和雪花模型的星型和雪花模型n多維模式:由一個(gè)事實(shí)表(Fact Table)和一組維表(Dimension Table)組成。每個(gè)維表都有一個(gè)維作為主鍵,所有這些維的主鍵組合成事實(shí)表的主鍵。事實(shí)表的非主鍵屬性稱(chēng)為事實(shí)(Fact),它們一般都是數(shù)值或其他可以進(jìn)行計(jì)算的數(shù)據(jù);而維表大都是文字、時(shí)間等類(lèi)型的數(shù)據(jù),按這種方式組織好數(shù)據(jù)我們就可以按照不同的維(事實(shí)表主鍵的

50、部分或全部)來(lái)對(duì)這些事實(shí)數(shù)據(jù)進(jìn)行求和(summary)、求平均(average)、計(jì)數(shù)(count)、百分比(percent)的聚集計(jì)算,甚至可以做2080分析。這樣就可以從不同的角度的數(shù)據(jù)來(lái)分析單一業(yè)務(wù)主題的事件情況n當(dāng)所有維表都直接連接到事實(shí)表上時(shí),將該模型稱(chēng)為星型模型n當(dāng)有一個(gè)或多個(gè)維表沒(méi)有直接連接到事實(shí)表上,而是通過(guò)其他維表連接到事實(shí)表上時(shí),將該模型稱(chēng)為雪花模型。雪花模型是對(duì)星型模型的維表進(jìn)一步層次化的結(jié)果多維模式多維模式(OLAP)(OLAP)的基本操作類(lèi)型的基本操作類(lèi)型n 鉆?。―rill-up和Drill-down) Drill-up是在某一維上將低層次的細(xì)節(jié)數(shù)據(jù)概括到高層次的匯

51、總數(shù)據(jù),或者減少維數(shù)。Drill-down則相反,它從匯總數(shù)據(jù)深入到細(xì)節(jié)數(shù)據(jù)進(jìn)行觀察或增加新維。鉆取報(bào)表是指用戶(hù)通過(guò)單擊其他報(bào)表中的鏈接打開(kāi)的報(bào)表。鉆取報(bào)表通常包含某原始匯總報(bào)表中所包含的某項(xiàng)的詳細(xì)信息n 切取(Slice和Dice) 切片(Slice)和切塊(Dice是在一部分維上選定值后,關(guān)心度量數(shù)據(jù)在剩余維上的分布。如果剩余的維只有兩個(gè),則是切片。如果有三個(gè)或以上,則是切塊n 透視(Pivot) Pivot是變換維的方向,即在表格中重新安排維的放置(例如行列互換)。透視是模型中跟蹤不同數(shù)據(jù)集的對(duì)象的子集。通常為特定的用戶(hù)組或業(yè)務(wù)方案定義透視,從而便于導(dǎo)航大型數(shù)據(jù)集。在透視中,表、列和度量

52、值(包括 KPI)定義為字段對(duì)象??梢赃x擇將在各透視中包括的字段。例如,單個(gè)模型可以包含產(chǎn)品、銷(xiāo)售、財(cái)務(wù)、員工和地理數(shù)據(jù)。在銷(xiāo)售部要求產(chǎn)品、銷(xiāo)售、促銷(xiāo)和地理數(shù)據(jù)時(shí),可能不需要員工和財(cái)務(wù)數(shù)據(jù)。同樣,人力資源部門(mén)不需要與銷(xiāo)售促銷(xiāo)和地理有關(guān)的數(shù)據(jù)n 注意:請(qǐng)關(guān)注這些術(shù)語(yǔ)和英語(yǔ)專(zhuān)用詞多維模式多維模式(OLAP)(OLAP)的基本操作類(lèi)型事例的基本操作類(lèi)型事例ExcelExcel表格和關(guān)系模式表格和關(guān)系模式( (規(guī)范化表規(guī)范化表) )的關(guān)系的關(guān)系nExcel表格和Excel列表的區(qū)別 Microsoft Web(Microsoft Web(微軟官網(wǎng)) Excel Excel 列表注釋列表注釋 Excel

53、列表是 Excel 2003 中的新增功能。列表是您可以與較大的工作表獨(dú)立開(kāi)來(lái)而單獨(dú)進(jìn)行操作的一部分工作表,這樣操作對(duì)周?chē)魏螖?shù)據(jù)都沒(méi)有影響。例如,可以添加數(shù)據(jù)、對(duì)數(shù)據(jù)進(jìn)行排序、重新排列列表中的行,而不影響周?chē)膯卧?。Excel 列表還可以加快工作速度,因?yàn)樗峁┝艘唤M數(shù)據(jù)操作工具,包括“自動(dòng)篩選”按鈕和一組聚合函數(shù),可以從同一位置使用這些聚合函數(shù)。同時(shí)還可以使用 Excel 列表從不同的外部數(shù)據(jù)源(關(guān)系模式)創(chuàng)建數(shù)據(jù)透視表(Pivot)。同樣列表,數(shù)據(jù)透視表也是Excel 2003 中的新增功能。右面是一個(gè)典型的 Excel 2003 列表 是 “自動(dòng)篩選自動(dòng)篩選”按鈕按鈕:該按鈕會(huì)自動(dòng)顯

54、示,它們所提供的功能與早期版本的 Excel 功能相同。您可以使用該按鈕快速對(duì)數(shù)據(jù)進(jìn)行排序和篩選、查找高低值等等 是邊框邊框:邊框?qū)⒘斜碇械膯卧衽c周?chē)鷶?shù)據(jù)區(qū)分開(kāi) 是“插入插入”行行:星號(hào)表示行。您可以直接在該行的單元格中鍵入數(shù)據(jù),列表會(huì)自動(dòng)調(diào)整大小以容納新數(shù)據(jù) 是“匯總匯總”行行:單擊此行中的某個(gè)單元格可以從聚合函數(shù)列表中進(jìn)行選擇。您可以使用“列表列表”工具欄顯示或隱藏“匯總”行。當(dāng)您顯示“匯總”行時(shí),如果右側(cè)的列中包含數(shù)字?jǐn)?shù)據(jù),Excel 會(huì)將該列中的數(shù)據(jù)自動(dòng)進(jìn)行相加 是聚合函數(shù)聚合函數(shù):選擇某個(gè)函數(shù)以將其插入到“匯總”行中選定的單元格。您不必手動(dòng)輸入該函數(shù),這樣您可以在更短的時(shí)間內(nèi)更準(zhǔn)確

55、地添加計(jì)算 是調(diào)整手柄調(diào)整手柄:通過(guò)拖動(dòng)該手柄可以修改列表的大小ExcelExcel列表與多維模式列表與多維模式(OLAP)(OLAP)的關(guān)系的關(guān)系n在Excel中,在沒(méi)有連接任何OLAP數(shù)據(jù)源的情況下,也支持旋轉(zhuǎn)透視表(Pivot),這算是一種非常簡(jiǎn)易的OLAP前端(微軟官網(wǎng))nOLAP是為了提高檢索數(shù)據(jù)的速度。因?yàn)樵趧?chuàng)建或更改報(bào)表時(shí),會(huì)計(jì)算匯總值,這樣就只有較少數(shù)據(jù)送到 Excel 中。此方法使得可以處理的源數(shù)據(jù)比使用傳統(tǒng)數(shù)據(jù)庫(kù)組織的數(shù)據(jù)更多。因?yàn)閷?duì)于傳統(tǒng)數(shù)據(jù)庫(kù),Excel 必須先檢索所有單個(gè)記錄后,再計(jì)算匯總值(微軟官網(wǎng))n在 Excel 中的 OLAP 和非 OLAP 數(shù)據(jù)透視表的區(qū)別

56、(微軟官網(wǎng))n不需要知道任何公式,只需要拖動(dòng)字段即可(微軟官網(wǎng))ExcelExcel列表與列表與ExcelExcel數(shù)據(jù)透視表的關(guān)系數(shù)據(jù)透視表的關(guān)系n 用戶(hù)可以從四種類(lèi)型的數(shù)據(jù)源中來(lái)創(chuàng)建數(shù)據(jù)透視表(Pivot)nExcel數(shù)據(jù)列表,可以進(jìn)行增加,刪除,修改,查詢(xún)(CURD)等列表操作n外部數(shù)據(jù)源,比如:關(guān)系型數(shù)據(jù)庫(kù),結(jié)構(gòu)良好的文件等,可以視作數(shù)據(jù)準(zhǔn)備的結(jié)果n多個(gè)獨(dú)立的Excel數(shù)據(jù)列表n其他的數(shù)據(jù)透視表,或者甚至于來(lái)自其他異構(gòu)的系統(tǒng)n 數(shù)據(jù)透視表的關(guān)鍵術(shù)語(yǔ)n數(shù)據(jù)源,從中創(chuàng)建數(shù)據(jù)透視表的數(shù)據(jù)列表或多維數(shù)據(jù)集,可以視作數(shù)據(jù)準(zhǔn)備的結(jié)果n軸,數(shù)據(jù)透視表中的一個(gè)維n統(tǒng)計(jì)匯總函數(shù),公式編輯器,KPIn分類(lèi)

57、匯總,分類(lèi)KPIn刷新,自動(dòng)計(jì)算數(shù)據(jù)透視表,以反映當(dāng)前的數(shù)據(jù)源狀態(tài)演示:在 Excel 中使用 OLAP 數(shù)據(jù)透視表深入了解獵奇公司 - Excel Office.om(大型業(yè)務(wù)數(shù)據(jù)庫(kù)組織成多維數(shù)據(jù)集從而支持商業(yè)智能的技術(shù))微軟官網(wǎng)演示微軟官網(wǎng)演示URLURL多維模式構(gòu)造演進(jìn)路線(xiàn)圖多維模式構(gòu)造演進(jìn)路線(xiàn)圖數(shù)據(jù)源層數(shù)據(jù)準(zhǔn)備階段層協(xié)調(diào)層加載層數(shù)據(jù)倉(cāng)庫(kù)層統(tǒng)計(jì)分析層數(shù)據(jù)源層數(shù)據(jù)準(zhǔn)備階段層數(shù)據(jù)集市層統(tǒng)計(jì)分析層數(shù)據(jù)源層數(shù)據(jù)準(zhǔn)備階段層統(tǒng)計(jì)分析層n數(shù)據(jù)準(zhǔn)備階段層的角色是中間協(xié)調(diào)和處理數(shù)據(jù)源以生成基于操作型或事務(wù)型數(shù)據(jù)的多維視圖模式。演進(jìn)的核心價(jià)值是基于對(duì)數(shù)據(jù)準(zhǔn)備階段層的粒度、分層、分類(lèi)、模式,物理部署的考量n統(tǒng)計(jì)分析層的角色只是友善的用戶(hù)使用體驗(yàn),統(tǒng)計(jì)分析層有太多的物理實(shí)現(xiàn)或工具型系統(tǒng)可供選擇終極目標(biāo):終極目標(biāo):Ad-

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論