mysql數(shù)據(jù)倉庫指南_第1頁
mysql數(shù)據(jù)倉庫指南_第2頁
mysql數(shù)據(jù)倉庫指南_第3頁
mysql數(shù)據(jù)倉庫指南_第4頁
mysql數(shù)據(jù)倉庫指南_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、mysql 數(shù)據(jù)倉庫指南mysql 數(shù)據(jù)倉庫指南、八 、-前言歡迎使用 mysql 多維數(shù)據(jù)倉庫指南。數(shù)據(jù)倉庫可以通過集成各種多樣的數(shù)據(jù)實(shí)現(xiàn)信息的統(tǒng) 一,這些數(shù)據(jù)來源包括現(xiàn)行的事務(wù)操作和管理信息系統(tǒng),以 及外部各種信息源。這些源數(shù)據(jù)將被整合,清洗,轉(zhuǎn)換,如 果需要直接從這些數(shù)據(jù)來源讀取數(shù)據(jù)的話,該數(shù)據(jù)將會在數(shù) 據(jù)倉庫中以更有利于操作的方式存儲。數(shù)據(jù)倉庫的數(shù)據(jù)構(gòu)造方式使你可以存儲當(dāng)前和歷史的 數(shù)據(jù)。當(dāng)前數(shù)據(jù)是實(shí)際事務(wù)操作活動必要的,一般是定期的 硬拷貝(比如打印出的報表) 或者是聯(lián)機(jī)報表。 而歷史數(shù)據(jù), 往往不是那么容易利用,可以提供基于時間點(diǎn)分析的商業(yè)信 息,比如:追蹤、推論分析,以及對比,這

2、些對于長期計劃和 戰(zhàn)略性的市場決策都是很重要的。如何從多個信息源整合信息,定期積聚存儲,有效 的需求設(shè)計和發(fā)展技術(shù),所有這些都和事務(wù)型管理信息系統(tǒng) 所應(yīng)用的技術(shù)有很大的不同。本書都是關(guān)于數(shù)據(jù)倉庫的設(shè)計 和開發(fā)技術(shù),它涵蓋了大部分建立數(shù)據(jù)倉庫所涉及到的大部 分技術(shù)問題。更為重要的是,本書提供了一個易懂的操作指 南,便于開發(fā)一個實(shí)際的數(shù)據(jù)倉庫。本書的適用范圍mysql 多維數(shù)據(jù)倉庫指南是一個實(shí)戰(zhàn)的書籍。你將使用 mysql 數(shù)據(jù)庫,但該書不是關(guān)于 mysql 的。本書不涉及任何 硬件架構(gòu)方面的問題。本書主要關(guān)心數(shù)據(jù)倉庫的設(shè)計和開發(fā)技術(shù)。它不涉及開發(fā)項 目的管理,理論,以及如何領(lǐng)導(dǎo)開發(fā)等相關(guān)的技術(shù)問

3、題。本書用一個數(shù)據(jù)倉庫開發(fā)的例子來展示技術(shù)如何應(yīng) 用。提供數(shù)據(jù)模型和 sql 腳本,將能夠適用于實(shí)際的數(shù)據(jù)倉 庫開發(fā)。這些腳本已經(jīng)在 Windows xp professional sp2 平 臺上用 mysql 5 。0。21 版本測試通過。另外,本書不再對以下的幾個主題進(jìn)行特別的論述: 數(shù)據(jù)倉庫的概念Sql MySQL數(shù)據(jù)庫適合閱讀本書的人: 數(shù)據(jù)倉庫應(yīng)用于各種組織和商業(yè)機(jī)構(gòu),從政府部門,非 盈利組織到學(xué)校,從制造業(yè)到零售店,從金融機(jī)構(gòu)到醫(yī)療機(jī) 構(gòu),從傳統(tǒng)公司到互聯(lián)網(wǎng)商家。本書首先面向數(shù)據(jù)倉庫開發(fā)人員。但是, it 經(jīng)理和其他 it 職 業(yè),特別是那些對 mis (經(jīng)營報告)和dss (決

4、策支撐應(yīng)用) 感興趣的人將發(fā)現(xiàn)本書同樣有用??偟恼f來,本書是給那些 為分析應(yīng)用準(zhǔn)備數(shù)據(jù)工作相關(guān)的人,以及那些需要遞交信息 的人,比如打印報表,聯(lián)機(jī)報表。本書同樣適用于那些數(shù)據(jù)倉庫初學(xué)者。它將直接快速的 為那些正在準(zhǔn)備開發(fā)他們第一個數(shù)據(jù)倉庫的人提供幫助。教師和學(xué)生可以將該書作為教科書,以便于明確他們對 于數(shù)據(jù)倉庫原理 , 概念的理解。 大部分章節(jié)可以被定制用于實(shí) 驗練習(xí)。預(yù)備的技能本書不是面向 it 新人,為了更有效的利用本書,讀者必須有 一些系統(tǒng)開發(fā)經(jīng)驗。 但是,不要求先有數(shù)據(jù)倉庫的建設(shè)經(jīng)驗。 需要實(shí)踐操作本書例子的人需要有 rdbms (關(guān)系數(shù)據(jù)庫管理 系統(tǒng))和 sql 的實(shí)際操作技能。你可

5、以從本書得到 你將可以僅僅用一個示例,一個最先存儲商業(yè)銷售相關(guān)數(shù)據(jù) 的數(shù)據(jù)倉庫,并且進(jìn)行實(shí)踐操作,就可以磨練你的數(shù)據(jù)倉庫 知識和實(shí)際技能。該示例是一個精簡版的實(shí)際數(shù)據(jù)倉庫,可 以在很多種商業(yè)類型中找到它的原型。你將基于 mysql 數(shù)據(jù)庫用本書介紹的技術(shù)一步步的開發(fā)該示 例中銷售相關(guān)數(shù)據(jù)倉庫。這些技術(shù)是在通常數(shù)據(jù)倉庫開發(fā)中 將碰到的問題的分解技巧。通過完成本文的學(xué)習(xí)并且完成所 有的練習(xí),你將獲得相關(guān)工作經(jīng)驗并可以為負(fù)責(zé)第一個實(shí)際數(shù)據(jù)倉庫項目做好準(zhǔn)備。章節(jié)總覽本書包含 25 個章節(jié)和一個附錄。所有章節(jié)組織為四個部分。 第一部分涵蓋數(shù)據(jù)倉庫基礎(chǔ)。第二部分描述從原始數(shù)據(jù)到數(shù) 據(jù)倉庫的遷移。第三部分討

6、論如何控制數(shù)據(jù)倉庫的發(fā)展演化。 第四部分涉及到一些高級的多維技術(shù)。接下來的部分將給出 每個章節(jié)的預(yù)覽。第一篇基本原理第一篇 ,涵蓋多維數(shù)據(jù)倉庫的基礎(chǔ)原理,有四個章節(jié)。第 1 章,“基本組成”,介紹星型模式(一種數(shù)據(jù)庫模式,有 一個事實(shí)表,周圍圍繞著多個維表)以及解釋該模式的基本 組成。第 2 章,”維度歷史“介紹用代理健來維護(hù)維成員的歷史記錄。第 3 章,“度量可加性”,包含維度數(shù)據(jù)倉庫中最重要的特性 之一,也就是存儲在數(shù)據(jù)倉庫事實(shí)表中的度量的可加性。sql第 4 章,“維度查詢”,介紹最適合應(yīng)用于星型模式的一種 查詢,維度查詢可以用來證明一個維度數(shù)據(jù)倉庫是否具備兩 個最基本的設(shè)計指標(biāo):簡單和

7、高效。第二篇 : 提取、轉(zhuǎn)換和加載該篇的所有 5 個章節(jié)涉及了數(shù)據(jù)集成,事實(shí)表,維第 5 章,“源數(shù)據(jù)提取”介紹了不同類型數(shù)據(jù)的提取。 第 6 章“導(dǎo)入時間維”涵蓋了三種最通用的加載時間維的技術(shù)。 第 7 章 “初始化導(dǎo)入“和第8 章,“定期導(dǎo)入”涉及到兩種類型 的導(dǎo)入技術(shù),初始化和周期性。第 9 章,“周期導(dǎo)入計劃”,作為第二篇的總結(jié),提供一個進(jìn) 階式的指導(dǎo),關(guān)于如何利用 Windows 的任務(wù)管理器實(shí)現(xiàn)定 期導(dǎo)入計劃。第三篇:成長 第三篇介紹了不同的處理技術(shù),這些技術(shù)主要處理一個成功 的多維數(shù)據(jù)倉庫成長過程中碰到的相關(guān)問題。該部分有十個 章節(jié)。第 10 章,“增加字段”討論關(guān)于向現(xiàn)有數(shù)據(jù)倉

8、庫中的表增 加一個字段的技術(shù)問題。第 11 章,“按需載入”涉及按需載入的技術(shù)。第 12 章,“維表子集”,介紹相關(guān)技術(shù)以幫助用戶處理維 表子集問題。第 13 章,“維度角色扮演”,關(guān)于在一個事實(shí)表中多次使 用同一個維度的問題。第 14 章,“快照”讓你在需要作出匯總數(shù)據(jù)的時候, 能提 供快速性能的查詢。第 15 章,“唯度層次”和第16 章“多路徑和不齊整的維度 層次”是關(guān)于簡單和多路徑維度技術(shù), 相應(yīng)的, 這些技術(shù)幫助 人們進(jìn)行匯聚和鉆取分析。第 17 章,“維度退化”,展示了如何用維度退化技術(shù)去減 少一個數(shù)據(jù)倉庫模式的復(fù)雜性。第 18 章,“垃圾維”,是關(guān)于垃圾維的技術(shù),即將表面上 不相

9、關(guān)的但是經(jīng)常會被用戶進(jìn)行要求分析的數(shù)據(jù),用維的方 式組織起來。第 19 章,“多星型模式”展示了如何在模式中增加多個星 型模式。第四篇:高級技術(shù)包含六個章節(jié)。第 20 章,“不齊整數(shù)據(jù)源”,介紹如何在數(shù)據(jù)倉庫中處理 那些結(jié)構(gòu)無法直接映射到目標(biāo)表的數(shù)據(jù)源。第 21 章,“無事實(shí)的事實(shí)表”,幫助你為客戶建立一種可 供分析的輔助數(shù)據(jù),一種無事實(shí)字段的事實(shí)表,該數(shù)據(jù)無法 從數(shù)據(jù)源直接取得度量。第 22 章,“遲來的事實(shí)”,包含一個技術(shù),用于處理當(dāng)數(shù) 據(jù)源中某個特殊的事實(shí)沒有在計劃載入時間之前產(chǎn)生的情 況。第 23 章,“外部數(shù)據(jù)源和維度合并“,包括兩個主題:處 理外部數(shù)據(jù)源和如何將多個維中分散的屬性合

10、并到一個維 的技術(shù)。第 24 章,“累積度量”,討論兩個相關(guān)的問題:計算度量和累積度量的不可相加性。第 25 章,“分段維度”,闡述一種技術(shù),可以幫助使用者 針對那些有連續(xù)值的屬性進(jìn)行數(shù)據(jù)分析。附錄附錄a,“格式文件數(shù)據(jù)源”,介紹如何使用本書例子中的 格式文件數(shù)據(jù)源。源代碼下載可以從 . 上面下載本書的示例的程序腳本。Dimensional Data Warehousing with MySQL: A Tutorial byDjoni DarmawikartaBrainy Software Corp. 2007 (432 pages)ISBN:9780975212820Computer programmers who need to build a data warehouse will find relevant examples and information written in a thorough, easy-to-follow style in this step-by-step tutorial.封底 Back Cover將 Mysql 這個最流行的開源數(shù)據(jù)庫軟件進(jìn)行數(shù)據(jù)倉 庫應(yīng)用,在本書之前還從來沒有被在創(chuàng)建多維數(shù)據(jù)倉庫方面 用這種入門指南的方式進(jìn)行介紹。主題包括 星型模式建模, 數(shù)據(jù)載入(數(shù)據(jù)的提取、轉(zhuǎn)換和加載: etl

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論