版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第第3 3章章 設(shè)計(jì)數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)數(shù)據(jù)倉(cāng)庫(kù)(2)(2)數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)n概念設(shè)計(jì)n實(shí)體關(guān)系圖(ERD)n邏輯設(shè)計(jì)n數(shù)據(jù)項(xiàng)集(DIS)n維度事實(shí)模型DFMn物理設(shè)計(jì)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)倉(cāng)庫(kù)的概念設(shè)計(jì)n實(shí)體關(guān)系圖(ERD)n以實(shí)體和關(guān)系為特征n實(shí)體用橢圓表示n關(guān)系用箭頭表示n箭頭方向和數(shù)量表示關(guān)系的基數(shù)實(shí)體關(guān)系的表示實(shí)體關(guān)系的表示實(shí)體和屬性的建模慣例n唯一的名字n標(biāo)題風(fēng)格n完整、非縮寫(xiě)的單詞n單數(shù)名詞n企業(yè)ERD由企業(yè)內(nèi)各個(gè)反映不同群體觀點(diǎn)的高層數(shù)據(jù)模型組合而成。數(shù)據(jù)倉(cāng)庫(kù)的邏輯數(shù)據(jù)倉(cāng)庫(kù)的邏輯設(shè)計(jì)n對(duì)概念模型中標(biāo)識(shí)的每個(gè)主要主題域或?qū)嶓w,都要建立一個(gè)中間層模型n中間層數(shù)據(jù)模型包括四個(gè)基本構(gòu)造:n主要數(shù)據(jù)分組n每
2、個(gè)主要主題域只有一個(gè)主要數(shù)據(jù)分組,包含了只存在一次的屬性n二級(jí)數(shù)據(jù)分組n包含每個(gè)主要主題域可以存在多次的數(shù)據(jù)屬性n連接器n表示二個(gè)主要主題域間的關(guān)系n數(shù)據(jù)的“類型”n由指向數(shù)據(jù)分組右邊的的線段表示,左邊分組為超類型,右邊分組為子類型中間層數(shù)據(jù)模型中間層數(shù)據(jù)模型中間層數(shù)據(jù)模型例子中間層數(shù)據(jù)模型例子nERD層標(biāo)識(shí)了一個(gè)關(guān)系后,在DIS層需要用一對(duì)連接器關(guān)系來(lái)表現(xiàn)中間層數(shù)據(jù)模型例子中間層數(shù)據(jù)模型例子中間層數(shù)據(jù)模型例子中間層數(shù)據(jù)模型例子企業(yè)企業(yè)DISn企業(yè)DIS由企業(yè)內(nèi)各個(gè)反映不同群體觀點(diǎn)的DIS組合而成。維度事實(shí)模型DFMn事實(shí)是與決策相關(guān)的概念,通常是建模公司內(nèi)發(fā)生的一組事件n維度是范圍有限的事實(shí)
3、屬性,提供了事實(shí)的分析坐標(biāo)事實(shí)n通常對(duì)應(yīng)公司中動(dòng)態(tài)發(fā)生的事件n事實(shí)可能對(duì)應(yīng)一個(gè)實(shí)體或?qū)嶓w間的N元關(guān)系n經(jīng)常發(fā)生更新的實(shí)體是事實(shí)的上佳候選;而靜態(tài)的實(shí)體則不是nSALE-事實(shí)nSRORE-不是事實(shí)星型模型星型模型n主要包含3種邏輯實(shí)體:n事實(shí)表n維度表n聯(lián)系星型模型的特點(diǎn)n文本數(shù)據(jù)與數(shù)值數(shù)據(jù)分離n文本數(shù)據(jù)通常出現(xiàn)在維表中,而數(shù)值數(shù)據(jù)出現(xiàn)在事實(shí)表中n可以為決策支持系統(tǒng)的處理優(yōu)化數(shù)據(jù)事實(shí)表n一個(gè)星型模型只有一個(gè)事實(shí)表n事實(shí)表包括獨(dú)有的標(biāo)識(shí)數(shù)據(jù),同時(shí)包含其本身的獨(dú)有數(shù)據(jù)n事實(shí)表往往是數(shù)字度量,不歡迎描述性信息n事實(shí)表可達(dá)數(shù)百萬(wàn)行或更多n最小粒度原則n事實(shí)表同時(shí)包含指向周?chē)恚ňS表)的預(yù)先連接的外鍵n可
4、以有任意多個(gè)外鍵與維表相關(guān)事實(shí)表的內(nèi)容n事實(shí)表的主鍵是所有維度表主鍵的組合鍵n主要是數(shù)字屬性n表很長(zhǎng),但不寬n稀疏的數(shù)據(jù)n假期記錄可能為空n退化的維度n既不是事實(shí)也不是維屬性的數(shù)據(jù)元素n如發(fā)票號(hào)、訂單號(hào)等事實(shí)表設(shè)計(jì)n毛利潤(rùn)=銷(xiāo)售-成本;在已有銷(xiāo)售和成本字段的情況下,是否應(yīng)物理存儲(chǔ)毛利潤(rùn)字段?n應(yīng)存儲(chǔ)n減少用戶出錯(cuò)n便于生成報(bào)表維度表n維度表是事實(shí)表不可分割的伴侶n維度表傾向于將行數(shù)做得相當(dāng)少(通常100萬(wàn)行),而將列數(shù)做得特別大n數(shù)據(jù)倉(cāng)庫(kù)的能力與維度的質(zhì)量和深度成正比n一個(gè)用戶要按星期與商標(biāo)來(lái)查看銷(xiāo)售額,星期與商標(biāo)就必須是可的維度屬性維度內(nèi)容n維度屬性是查詢的約束條件、分組與報(bào)表標(biāo)簽生成的基本
5、來(lái)源n每個(gè)維度用單一的主關(guān)鍵字進(jìn)行定義,主關(guān)鍵字是確保與之相連的事實(shí)表存在完整性的基礎(chǔ)。n非直接相關(guān)屬性n產(chǎn)品:包裹大小與品牌n非規(guī)范化n很多維度變化很緩慢n多級(jí)層次結(jié)構(gòu)n維度表通常有多種多級(jí)層次結(jié)構(gòu)維度中的文本與數(shù)字n維度應(yīng)當(dāng)是文本和離散的n盡量使用詳細(xì)的文本信息取代編碼n數(shù)字屬性放入維度表還是事實(shí)表應(yīng)當(dāng)看它是一個(gè)含有許多取值并參與運(yùn)算的度量(應(yīng)放入事實(shí)表),還是變化不多并參與約束條件的離散取值(應(yīng)放入維度表)n產(chǎn)品尺寸-維度表n產(chǎn)品生產(chǎn)成本-事實(shí)表n例:業(yè)務(wù)數(shù)據(jù)的E-R圖銷(xiāo)售銷(xiāo)售日期商店號(hào)商品號(hào)銷(xiāo)售數(shù)量銷(xiāo)售單位商品商品號(hào)商品名商品類號(hào)存貨星期商店號(hào)商品號(hào)數(shù)量1m1m商店商店號(hào)商店名地址城市
6、省郵編地區(qū)號(hào)1mm11商品類商品類號(hào)商品類名部門(mén)號(hào)m1m地區(qū)地區(qū)號(hào)地區(qū)名nE-R圖向多維表的轉(zhuǎn)換n該問(wèn)題的多維表模型中,商品維包括部門(mén)、商品和商品大類,地點(diǎn)維包括地區(qū)和商店,忽略存貨,而只注意銷(xiāo)售事實(shí)。在E-R圖中不出現(xiàn)的時(shí)間,在多維模型中增加時(shí)間維。n在多維模型中,實(shí)體與維之間建立映射關(guān)系,聯(lián)系多個(gè)實(shí)體的實(shí)體就成為事實(shí),此處銷(xiāo)售實(shí)體作為事實(shí),其他實(shí)體作為維。然后用維關(guān)鍵字將它轉(zhuǎn)換為星型模型,如圖所示。商品維地區(qū)維時(shí)間維部門(mén)地區(qū)年商品大類商店月商品周日銷(xiāo)售事實(shí)E-R圖向多維模型的轉(zhuǎn)換圖向多維模型的轉(zhuǎn)換 時(shí)間 時(shí)間鍵 時(shí)間說(shuō)明 日期 星期 月 年 級(jí)別號(hào) 銷(xiāo)售事實(shí) 時(shí)間鍵 地理位置鍵 商品鍵 銷(xiāo)
7、售數(shù)量 銷(xiāo)售單位 地區(qū) 地理位置鍵 地理位置名 地區(qū)號(hào) 商店號(hào) 級(jí)別號(hào) 商品 商品鍵 商品名 部門(mén)號(hào) 商品類號(hào) 級(jí)別號(hào) 利用維關(guān)鍵字制定的星型模型利用維關(guān)鍵字制定的星型模型n在各維中,只有部門(mén),商品類,地區(qū),商店的編號(hào)沒(méi)有具體的說(shuō)明。n為了打印報(bào)表將增加這些編號(hào)的名稱說(shuō)明,即部門(mén)名、商店名等,在維表中增加這些說(shuō)明,即修改該星型模型n 時(shí)間 時(shí)間鍵 時(shí)間說(shuō)明 日期 星期 月 年 級(jí)別號(hào) 銷(xiāo)售事實(shí) 時(shí)間鍵 地理位置鍵 商品鍵 銷(xiāo)售數(shù)量 銷(xiāo)售單位 地區(qū) 地理位置鍵 地理位置名 地區(qū)號(hào) 地區(qū)名 商店號(hào) 商店名 級(jí)別號(hào) 商品 商品鍵 商品名 部門(mén)號(hào) 部門(mén)名 商品類號(hào) 商品類名 級(jí)別號(hào) 修改后的星型模型修改后的星型模型產(chǎn)品維度表n產(chǎn)品關(guān)鍵字(PK)、產(chǎn)品描述、商標(biāo)描述、分類描述、部門(mén)描述、包裝類型、包裝尺寸、重量、儲(chǔ)藏類型、貨架類型、貨架高度、貨架深度。n產(chǎn)品維度表每行都有與產(chǎn)品相關(guān)的商標(biāo)與分類,有冗余但易于使用n日期維度:日期關(guān)鍵字、日期描述、星期、年歷月、年歷周、年歷日、月編號(hào)、周編號(hào)、日編號(hào)、財(cái)政日、財(cái)政
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 環(huán)保教育在推動(dòng)綠色建筑中的作用
- 用戶體驗(yàn)在產(chǎn)品迭代中的重要性
- 生態(tài)種植技術(shù)對(duì)農(nóng)業(yè)可持續(xù)發(fā)展的貢獻(xiàn)
- 環(huán)境保護(hù)與腎功能指標(biāo)的關(guān)聯(lián)性研究
- 《15 口袋游戲》(說(shuō)課稿)-2023-2024學(xué)年四年級(jí)下冊(cè)綜合實(shí)踐活動(dòng)長(zhǎng)春版
- Module 6 Unit 1 Can I have some sweets?(說(shuō)課稿)外研版(三起)英語(yǔ)四年級(jí)上冊(cè)
- 2023二年級(jí)數(shù)學(xué)上冊(cè) 7 認(rèn)識(shí)時(shí)間第2課時(shí) 解決問(wèn)題說(shuō)課稿 新人教版
- 《小數(shù)的大小比較》(說(shuō)課稿)-2024-2025學(xué)年四年級(jí)下冊(cè)數(shù)學(xué)北師大版
- 環(huán)保材料在酒店裝修中的應(yīng)用
- 生態(tài)辦公空間現(xiàn)代工作的新選擇
- 2025新譯林版英語(yǔ)七年級(jí)下單詞默寫(xiě)表
- 2024-2025學(xué)年人教版八年級(jí)上冊(cè)數(shù)學(xué)期末專項(xiàng)復(fù)習(xí):軸對(duì)稱(易錯(cuò)必刷40題)解析版
- 盾構(gòu)標(biāo)準(zhǔn)化施工手冊(cè)
- 天然氣脫硫完整版本
- 抖音達(dá)人簽約合同模板
- 中歐班列課件
- 2025屆高三數(shù)學(xué)一輪復(fù)習(xí)備考經(jīng)驗(yàn)交流
- 人教版八級(jí)物理下冊(cè)知識(shí)點(diǎn)結(jié)
- 2021年高考真題-生物(湖南卷) 含解析
- 幼兒園2024-2025學(xué)年第二學(xué)期園務(wù)工作計(jì)劃
- 河南省2024年中考英語(yǔ)真題【附真題答案】
評(píng)論
0/150
提交評(píng)論