SQL-Server-中數(shù)據(jù)倉庫的創(chuàng)建課件_第1頁
SQL-Server-中數(shù)據(jù)倉庫的創(chuàng)建課件_第2頁
SQL-Server-中數(shù)據(jù)倉庫的創(chuàng)建課件_第3頁
SQL-Server-中數(shù)據(jù)倉庫的創(chuàng)建課件_第4頁
SQL-Server-中數(shù)據(jù)倉庫的創(chuàng)建課件_第5頁
已閱讀5頁,還剩81頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

理論與技術(shù)基礎(chǔ)實驗?zāi)康膶嶒炓髮嶒炘O(shè)備及軟件實驗內(nèi)容實驗步驟實驗思考題SQLServer中數(shù)據(jù)倉庫的創(chuàng)建理論與技術(shù)基礎(chǔ)SQLServer中數(shù)據(jù)倉庫的創(chuàng)建1理論與技術(shù)基礎(chǔ)(1)數(shù)據(jù)倉庫的概念著名的數(shù)據(jù)庫專家BillInmon認為數(shù)據(jù)倉庫就是面向主題的(subject-oriented)、集成的(integrated)、非易失的(non-volatile)和時變的(time-variant)的數(shù)據(jù)集合,用以支持管理決策。對于這個概念我們可以從兩個層次予以理解:首先,數(shù)據(jù)倉庫用于支持決策,面向分析型數(shù)據(jù)處理,它不同于企業(yè)現(xiàn)有的事務(wù)型數(shù)據(jù)庫;其次,數(shù)據(jù)倉庫是對多個異構(gòu)數(shù)據(jù)源的有效集成,集成后按照主題進行了重組,并包含歷史數(shù)據(jù),而且存放在數(shù)據(jù)倉庫中的數(shù)據(jù)一般不再修改。理論與技術(shù)基礎(chǔ)(1)數(shù)據(jù)倉庫的概念2理論與技術(shù)基礎(chǔ)(2)數(shù)據(jù)集市數(shù)據(jù)集市是為了特定應(yīng)用目的或應(yīng)用范圍而從數(shù)據(jù)倉庫中獨立出來的一部分數(shù)據(jù),也可稱為部門數(shù)據(jù)或主題數(shù)據(jù)。在數(shù)據(jù)倉庫的實施過程中往往可以從一個部門的數(shù)據(jù)集市入手,以后再用幾個數(shù)據(jù)集市組成一個完整的數(shù)據(jù)倉庫。需要注意的就是在實施不同的數(shù)據(jù)集市時,同一含義的字段定義一定要相容。理論與技術(shù)基礎(chǔ)(2)數(shù)據(jù)集市3理論與技術(shù)基礎(chǔ)(3)元數(shù)據(jù)元數(shù)據(jù)與電話黃頁的作用相似,是數(shù)據(jù)倉庫內(nèi)容的一個字典。它是描述數(shù)據(jù)倉庫內(nèi)數(shù)據(jù)的結(jié)構(gòu)和建立方法的數(shù)據(jù)。數(shù)據(jù)倉庫中的元數(shù)據(jù)主要分為事務(wù)型元數(shù)據(jù)、抽取盒轉(zhuǎn)換元數(shù)據(jù)和最終用戶數(shù)據(jù)。理論與技術(shù)基礎(chǔ)(3)元數(shù)據(jù)4理論與技術(shù)基礎(chǔ)(4)ETL數(shù)據(jù)倉庫并非只是數(shù)據(jù)的簡單累積,而是要經(jīng)過一系列的抽取、轉(zhuǎn)換和裝載的過程,即ETL。ETL是構(gòu)建數(shù)據(jù)倉庫的重要環(huán)節(jié),也是企業(yè)數(shù)據(jù)管理的核心,對數(shù)據(jù)倉庫的后續(xù)環(huán)節(jié)影響比較大。目前市場上主流的ETL工具主要有Informatica的PowerCenter、IBM的DataStage、Oracle的WarehouseBuilder以及Microsoft的SQLServerIS等。ETL的主要功能包括數(shù)據(jù)抽取、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)清洗和數(shù)據(jù)裝載。理論與技術(shù)基礎(chǔ)(4)ETL5理論與技術(shù)基礎(chǔ)(5)數(shù)據(jù)倉庫模型模型是對現(xiàn)實事物的反映和抽象,它可以幫助我們更加清晰地了解客觀世界。數(shù)據(jù)倉庫建模在業(yè)務(wù)分析之后開始,是數(shù)據(jù)倉庫構(gòu)造工作正式開始的第一步。正確而完備的數(shù)據(jù)模型是用戶業(yè)務(wù)需求的體現(xiàn),是數(shù)據(jù)倉庫項目成功與否的最重要的技術(shù)因素。數(shù)據(jù)建模有三層:概念、邏輯和物理。在數(shù)據(jù)倉庫的設(shè)計中,數(shù)據(jù)建模的每一層都有自己的目的。理論與技術(shù)基礎(chǔ)(5)數(shù)據(jù)倉庫模型6理論與技術(shù)基礎(chǔ)(6)數(shù)據(jù)倉庫的實現(xiàn)步驟數(shù)據(jù)倉庫不是直接買來就能使用的產(chǎn)品,它是一種方案或過程,是建立在用戶提供的大量數(shù)據(jù)、硬件環(huán)境和數(shù)據(jù)庫管理系統(tǒng)上的,需要分析工具的輔助支持。數(shù)據(jù)倉庫的構(gòu)建通常包括以下步驟:理論與技術(shù)基礎(chǔ)(6)數(shù)據(jù)倉庫的實現(xiàn)步驟7理論與技術(shù)基礎(chǔ)①建立企業(yè)模型要實現(xiàn)體系結(jié)構(gòu)的變遷,首先要了解企業(yè)需要什么數(shù)據(jù)、已經(jīng)具備了哪些數(shù)據(jù)、哪些數(shù)據(jù)是和需求相關(guān)的,最大程度地利用現(xiàn)有系統(tǒng)中的數(shù)據(jù)。建立企業(yè)模型一般采用ER模型或面向?qū)ο蟮姆治龇椒?。理論與技術(shù)基礎(chǔ)①建立企業(yè)模型8理論與技術(shù)基礎(chǔ)②選取主題企業(yè)模型建立后,可以根據(jù)企業(yè)模型和用戶需求確定系統(tǒng)中存在的主題。一個復(fù)雜的大型數(shù)據(jù)倉庫系統(tǒng)通常包含有多個主題。在主題選定后,需要針對這些主題擬定一個盡可能詳盡的需求說明,然后逐個主題進行實施,它是知識螺旋式開發(fā)思想在具體實現(xiàn)中的體現(xiàn)。根據(jù)選定的主題,在企業(yè)模型中劃分出各個主題的邊界,從而確定各個主題涉及的操作系統(tǒng)中的表。理論與技術(shù)基礎(chǔ)②選取主題9理論與技術(shù)基礎(chǔ)③邏輯模型設(shè)計確定了主題域,接下來進行系統(tǒng)邏輯模型的設(shè)計,包括確定數(shù)據(jù)的粒度層次、數(shù)據(jù)分割策略、定義關(guān)系模式記錄系統(tǒng)等任務(wù),在數(shù)據(jù)庫數(shù)據(jù)表的基礎(chǔ)上設(shè)計數(shù)據(jù)倉庫的表結(jié)構(gòu)。④物理設(shè)計在數(shù)據(jù)倉庫的物理模型設(shè)計中主要解決數(shù)據(jù)的存儲結(jié)構(gòu)、索引策略、存儲策略、存儲分配優(yōu)化等問題。理論與技術(shù)基礎(chǔ)③邏輯模型設(shè)計10理論與技術(shù)基礎(chǔ)⑤數(shù)據(jù)裝載接口的設(shè)計在完成數(shù)據(jù)倉庫概念、邏輯、物理設(shè)計后,接下來一個需要設(shè)計的是數(shù)據(jù)裝載接口的設(shè)計。數(shù)據(jù)裝載程序?qū)嶋H包括數(shù)據(jù)裝載功能(數(shù)據(jù)清洗、轉(zhuǎn)換和集成)、數(shù)據(jù)綜合功能(將集成的細節(jié)數(shù)據(jù)轉(zhuǎn)化成不同綜合層次的數(shù)據(jù))。理論與技術(shù)基礎(chǔ)⑤數(shù)據(jù)裝載接口的設(shè)計11理論與技術(shù)基礎(chǔ)⑥裝載檢驗數(shù)據(jù)在進行了上述步驟的設(shè)計后,一個初步的數(shù)據(jù)倉庫已經(jīng)設(shè)計完成。接下來裝載一個主題的數(shù)據(jù)進行數(shù)據(jù)校驗以進行數(shù)據(jù)質(zhì)量評估,確保數(shù)據(jù)的可靠性。⑦OLAP模型設(shè)計和應(yīng)用通常,需要對階段任務(wù)中涉及的維度進行一個總體的分析,然后針對每一個需要進行OLAP展現(xiàn)的主題確定其維度和度量事實,最終為每一個主題建立一個OLAP模型。并在此模型上進行必要的OLAP操作,做數(shù)據(jù)分析。理論與技術(shù)基礎(chǔ)⑥裝載檢驗數(shù)據(jù)12理論與技術(shù)基礎(chǔ)⑧數(shù)據(jù)挖掘在數(shù)據(jù)挖掘?qū)用嫔希紫纫獮閿?shù)據(jù)挖掘準(zhǔn)備足夠的數(shù)據(jù),根據(jù)需求選擇算法建立挖掘模型。數(shù)據(jù)挖掘需要的數(shù)據(jù)可以來自數(shù)據(jù)倉庫,也可以由于需求的需要而來自其他地方。⑨前端數(shù)據(jù)展示系統(tǒng)設(shè)計⑩重復(fù)前面過程在完成初級階段的工作后,需要和客戶進行更深入的交流。根據(jù)最終用戶的需求,將現(xiàn)有業(yè)務(wù)系統(tǒng)的缺陷和不足進行調(diào)整和修改,從而為上層數(shù)據(jù)倉庫系統(tǒng)的發(fā)展做更好的數(shù)據(jù)準(zhǔn)備。理論與技術(shù)基礎(chǔ)⑧數(shù)據(jù)挖掘13實驗?zāi)康?.理解數(shù)據(jù)庫與數(shù)據(jù)倉庫之間的區(qū)別與聯(lián)系;2.掌握典型的關(guān)系型數(shù)據(jù)庫及其數(shù)據(jù)倉庫系統(tǒng)的工作原理以及應(yīng)用方法;3.掌握數(shù)據(jù)倉庫建立的基本方法及其相關(guān)工具的使用。實驗?zāi)康?.理解數(shù)據(jù)庫與數(shù)據(jù)倉庫之間的區(qū)別與聯(lián)系;14實驗要求

利用實驗室和指導(dǎo)教師提供的實驗軟件,認真完成規(guī)定的實驗項目,真實地記錄實驗中遇到的各種問題和解決的方法與過程,并繪出模擬實驗案例的數(shù)據(jù)倉庫模型。實驗完成后,應(yīng)根據(jù)實驗情況寫出實驗報告。實驗要求利用實驗室和指導(dǎo)教師提供的實驗軟件,認真完成規(guī)15實驗設(shè)備及軟件

基于NT的局域網(wǎng)絡(luò),服務(wù)器與客戶端安裝MSSQLServer服務(wù)系統(tǒng)以及AnalysisServices系統(tǒng)。實驗設(shè)備及軟件基于NT的局域網(wǎng)絡(luò),服務(wù)器與客戶端安裝M16實驗內(nèi)容以SQLServer為系統(tǒng)平臺,設(shè)計、建立數(shù)據(jù)庫,并以此為基礎(chǔ)創(chuàng)建數(shù)據(jù)倉庫。實驗內(nèi)容以SQLServer為系統(tǒng)平臺,設(shè)計、17實驗步驟1.啟動SQLServer服務(wù)啟動SQLServer實例時即啟動了SQLServer服務(wù)。啟動SQLServer服務(wù)之后,用戶便可與服務(wù)器建立新連接。SQLServer服務(wù)可在本地或遠程作為MicrosoftWindowsNT?4.0或Windows?2000服務(wù)啟動和停止。SQLServer服務(wù)若是默認實例,則被稱為MSSQLServer;若是命名實例,則被稱為MSSQL$instancename。實驗步驟1.啟動SQLServer服務(wù)18實驗步驟2.注冊服務(wù)器⑴右擊一個服務(wù)器或服務(wù)器組,然后單擊"新建SQLServer注冊"命令。⑵在"服務(wù)器"框中,鍵入服務(wù)器名。⑶若要指定SQLServer企業(yè)管理器(作為客戶端)與運行正在注冊的Microsoft?SQLServer?實例的服務(wù)器之間的連接,請執(zhí)行下列操作之一:

單擊“使用Windows身份驗證”-或-單擊“使用SQLServer身份驗證”。實驗步驟2.注冊服務(wù)器19實驗步驟⑷在"服務(wù)器組"列表中,單擊一個服務(wù)器組。⑸執(zhí)行下列一個或多個操作:選擇"在控制臺中顯示SQLServer服務(wù)器的狀態(tài)"復(fù)選框。選擇"顯示系統(tǒng)數(shù)據(jù)庫和系統(tǒng)對象"復(fù)選框。選擇"在連接時自動啟動SQLServer"復(fù)選框。

重復(fù)步驟1到5,在"SQLServer企業(yè)管理器"中注冊每個服務(wù)器。

實驗步驟⑷在"服務(wù)器組"列表中,單擊一個服務(wù)器組。20實驗步驟3.設(shè)計表設(shè)計數(shù)據(jù)庫時,應(yīng)先確定需要什么樣的表,各表中都有哪些數(shù)據(jù)以及各個表的存取權(quán)限等等。在創(chuàng)建和操作表的過程中,將對表進行更為細致的設(shè)計。設(shè)計時應(yīng)注意:表所包含的數(shù)據(jù)的類型;表的各列及每一列的數(shù)據(jù)類型(如果必要,還應(yīng)注意列寬);哪些列允許空值;是否要使用以及何時使用約束、默認設(shè)置或規(guī)則;所需索引的類型,哪里需要索引,哪些列是主鍵,哪些是外鍵。實驗步驟3.設(shè)計表21實驗步驟4.修改表表創(chuàng)建之后可以修改許多已定義的選項,包括:添加、修改、刪除列。例如,列的名稱、長度、數(shù)據(jù)類型、精度、小數(shù)位數(shù)以及為空性均可進行修改,不過有一些限制而已。注意:可添加或刪除PRIMARYKEY和FOREIGNKEY約束;可添加或刪除UNIQUE和CHECK約束及DEFAULT定義(對象);可使用IDENTITY或ROWGUIDCOL屬性添加或刪除標(biāo)識符列;雖然ROWGUIDCOL屬性也可添加至現(xiàn)有列或從現(xiàn)有列刪除,但是任何時候在表中只能有一列可具有該屬性;表及表中所選定的列已注冊為全文索引。實驗步驟4.修改表22實驗步驟5.建立系統(tǒng)數(shù)據(jù)源連接⑴Microsoft?WindowsNT?4.0用戶:單擊“開始”按鈕,指向“設(shè)置”,單擊

“控制面板”,然后雙擊“數(shù)據(jù)源(ODBC)”。⑵Windows?2000用戶:單擊“開始”按鈕,指向“設(shè)置”,單擊“控制面板”,然后雙擊“管理工具”,再雙擊“數(shù)據(jù)源(ODBC)”。⑶在“系統(tǒng)DSN”選項卡上單擊“添加”按鈕。

⑷選擇“MicrosoftAccess驅(qū)動程序(*.mdb)”,然后單擊“完成”按鈕。

⑸在“數(shù)據(jù)源名”框中,輸入“教程”,然后在“數(shù)據(jù)庫”下,單擊“選擇”。

⑹在“選擇數(shù)據(jù)庫”對話框中,瀏覽到“C:\ProgramFiles\MicrosoftAnalysisServices\Samples”,然后單擊“FoodMart2000.mdb”。單擊“確定”按鈕。

實驗步驟5.建立系統(tǒng)數(shù)據(jù)源連接23SQL-Server-中數(shù)據(jù)倉庫的創(chuàng)建課件24實驗步驟6.建立數(shù)據(jù)庫和數(shù)據(jù)源⑴如何建立數(shù)據(jù)庫結(jié)構(gòu)①在AnalysisManager樹視圖中展開“AnalysisServers”。

②單擊服務(wù)器名稱,即可建立與AnalysisServers的連接。

③右擊服務(wù)器名稱,然后單擊“新建數(shù)據(jù)庫”命令。

④在“數(shù)據(jù)庫”對話框中的“數(shù)據(jù)庫名稱”框中,輸入“教程”,然后單擊“確定”按鈕。

⑤在AnalysisManager樹窗格中展開服務(wù)器,然后展開剛才創(chuàng)建的“教程”數(shù)據(jù)庫。實驗步驟6.建立數(shù)據(jù)庫和數(shù)據(jù)源25實驗步驟⑵建立數(shù)據(jù)源在AnalysisManager樹窗格中,右擊“教程”數(shù)據(jù)庫下的“數(shù)據(jù)源”文件夾,然后單擊“新數(shù)據(jù)源”命令。在“數(shù)據(jù)鏈接屬性”對話框中,單擊“提供者”選項卡,然后單擊“MicrosoftOLEDBProviderforODBCDrivers”。實驗步驟⑵建立數(shù)據(jù)源26SQL-Server-中數(shù)據(jù)倉庫的創(chuàng)建課件27實驗步驟①單擊“連接”選項卡,然后從“使用數(shù)據(jù)源名稱”列表中單擊“教程”。②單擊“測試連接”以確保一切工作正常。在“Microsoft數(shù)據(jù)鏈接”對話框中應(yīng)出現(xiàn)一條消息,說明連接成功。在消息框中單擊“確定”按鈕。③單擊“確定”按鈕關(guān)閉“數(shù)據(jù)鏈接屬性”對話框。實驗步驟①單擊“連接”選項卡,然后從“使用數(shù)據(jù)源名稱”列表28SQL-Server-中數(shù)據(jù)倉庫的創(chuàng)建課件29實驗步驟7.建立多維數(shù)據(jù)集您現(xiàn)在的身份是FoodMartCorporation的數(shù)據(jù)庫管理員。FoodMart是一家大型的連鎖店,在美國、墨西哥和加拿大有銷售業(yè)務(wù)。市場部想要按產(chǎn)品和顧客分析1998年進行的所有銷售業(yè)務(wù)數(shù)據(jù)。使用存儲在公司數(shù)據(jù)倉庫中的數(shù)據(jù),您就能建立多維數(shù)據(jù)結(jié)構(gòu)(多維數(shù)據(jù)集),以便在市場分析人員查詢數(shù)據(jù)庫時獲取快速的響應(yīng)。建立一個多維數(shù)據(jù)集,用于進行銷售分析。實驗步驟7.建立多維數(shù)據(jù)集30實驗步驟⑴打開多維數(shù)據(jù)集向?qū)г贏nalysisManager樹窗格中,“教程”數(shù)據(jù)庫下,右擊“多維數(shù)據(jù)集”文件夾,單擊“新建多維數(shù)據(jù)集”菜單,然后單擊“向?qū)А泵睢"葡蚨嗑S數(shù)據(jù)集添加度量值度量值是要進行分析的數(shù)據(jù)庫中的量化值。常用的度量值為銷售、成本和預(yù)算數(shù)據(jù)。度量值根據(jù)多維數(shù)據(jù)集不同的維度類別進行分析。

實驗步驟⑴打開多維數(shù)據(jù)集向?qū)?1實驗步驟①在多維數(shù)據(jù)集向?qū)У摹皻g迎”步驟,單擊“下一步”按鈕。②在“從數(shù)據(jù)源中選擇事實數(shù)據(jù)表”步驟,展開“教程”數(shù)據(jù)源,然后單擊“sales_fact_1998”。③單擊“瀏覽數(shù)據(jù)”按鈕可以查看“sales_fact_1998”表中的數(shù)據(jù)。數(shù)據(jù)瀏覽完畢后,關(guān)閉“瀏覽數(shù)據(jù)”窗口,然后單擊“下一步”按鈕。④若要定義多維數(shù)據(jù)集的度量值,在“事實數(shù)據(jù)表數(shù)據(jù)列”下,雙擊“store_sales”。對“store_cost”和“unit_sales”列重復(fù)此步驟,然后單擊“下一步”按鈕。實驗步驟①在多維數(shù)據(jù)集向?qū)У摹皻g迎”步驟,單擊“下一步”按32實驗步驟⑶建立時間維度在向?qū)У摹斑x擇多維數(shù)據(jù)集的維度”步驟,單擊“新建維度”命令。此操作將調(diào)用維度向?qū)?。①在“歡迎”步驟,單擊“下一步”按鈕。②在“選擇維度的創(chuàng)建方式”步驟,選擇“星型架構(gòu):單個維度表”選項,然后單擊“下一步”按鈕。③在“選擇維度表”步驟,單擊“time_by_day”。單擊“瀏覽數(shù)據(jù)”按鈕可以查看包含在“time_by_day”表中的數(shù)據(jù)。查看完“time_by_day”表后,單擊“下一步”按鈕。④在“選擇維度類型”步驟,選擇“時間維度”選項,然后單擊“下一步”按鈕。

實驗步驟⑶建立時間維度33SQL-Server-中數(shù)據(jù)倉庫的創(chuàng)建課件34實驗步驟⑤接下來,將定義維度的級別。在“創(chuàng)建時間維度級別”步驟,單擊“選擇時間級別”,單擊“年、季度、月”,然后單擊“下一步”按鈕。

⑥在“選擇高級選項”步驟,單擊“下一步”按鈕。⑦在向?qū)У淖詈笠徊剑斎搿癟ime”作為新維度的名稱。⑧單擊“完成”返回到多維數(shù)據(jù)集向?qū)?。⑨在多維數(shù)據(jù)集向?qū)е?,現(xiàn)在應(yīng)能在“多維數(shù)據(jù)集維度”列表中看到“Time”維度。實驗步驟⑤接下來,將定義維度的級別。在“創(chuàng)建時間維度級別”35實驗步驟⑷建立產(chǎn)品維度①再次單擊“新建維度”命令。在“歡迎進入維度向?qū)А辈襟E,單擊“下一步”按鈕。②在“選擇創(chuàng)建維度的方式”步驟,選擇“雪花架構(gòu):多個相關(guān)維度表”選項,然后單擊“下一步”按鈕。

③在“選擇維度表”步驟,雙擊“Product”和“product_class”將它們添加到“選定的表”。單擊“下一步”按鈕。

④在維度向?qū)У摹皠?chuàng)建和編輯聯(lián)接”步驟,顯示在上一步選定的兩個表以及它們之間的聯(lián)接。單擊“下一步”按鈕。

實驗步驟⑷建立產(chǎn)品維度36SQL-Server-中數(shù)據(jù)倉庫的創(chuàng)建課件37實驗步驟⑸建立客戶維度①單擊“新建維度”命令。②在“歡迎”步驟,單擊“下一步”按鈕。

③在“選擇創(chuàng)建維度的方式”步驟,選擇“星型架構(gòu):單個維度表”選項,然后單擊“下一步”按鈕。

④在“選擇維度表”步驟,單擊“Customer”,然后單擊“下一步”按鈕。

⑤在“選擇維度類型”步驟,單擊“下一步”按鈕。

實驗步驟⑸建立客戶維度38實驗步驟⑥若要定義維度的級別,在“可用列”下,按順序雙擊“Country”、“State_Province”、“City”和“l(fā)name”列。雙擊每一列后,其名稱將顯示在“維度級別”下方。選擇完所有四個列之后,單擊“下一步”按鈕。

⑦在“指定成員鍵列”步驟,單擊“下一步”按鈕。

⑧在“選擇高級選項”步驟,單擊“下一步”按鈕。

⑨在向?qū)У淖詈笠徊?,在“維度名稱”框中,輸入“Customer”。保持“與其它多維數(shù)據(jù)集共享此維度”復(fù)選框的選中狀態(tài)。單擊“完成”按鈕。

⑩在多維數(shù)據(jù)集向?qū)е?,現(xiàn)在應(yīng)能在“多維數(shù)據(jù)集維度”列表中看到“Customer”維度。

實驗步驟⑥若要定義維度的級別,在“可用列”下,按順序雙擊“39實驗步驟⑹完成多維數(shù)據(jù)集的生成①在多維數(shù)據(jù)集向?qū)е校瑔螕簟跋乱徊健卑粹o。②在“事實數(shù)據(jù)表行數(shù)”消息給出提示時,單擊“是”按鈕。

③在多維數(shù)據(jù)集向?qū)У淖詈笠徊?,將多維數(shù)據(jù)集命名為“Sales”,然后單擊“完成”按鈕。④向?qū)㈥P(guān)閉并隨之啟動多維數(shù)據(jù)集編輯器,其中包含剛剛創(chuàng)建的多維數(shù)據(jù)集。單擊藍色或黃色的標(biāo)題欄,對表進行排列,使其符合下圖所示的樣子。

實驗步驟⑹完成多維數(shù)據(jù)集的生成40SQL-Server-中數(shù)據(jù)倉庫的創(chuàng)建課件41實驗思考題1.SqlServer環(huán)境下,數(shù)據(jù)庫與表之間的關(guān)系。2.多維數(shù)據(jù)集建立過程中,如何理解數(shù)據(jù)倉庫與源數(shù)據(jù)。3.維表和事實表之間的關(guān)系。4.創(chuàng)建數(shù)據(jù)倉庫的基本過程。實驗思考題1.SqlServer環(huán)境下,數(shù)據(jù)庫與表之間的關(guān)系42TheEnd!SQL-Server-中數(shù)據(jù)倉庫的創(chuàng)建課件43理論與技術(shù)基礎(chǔ)實驗?zāi)康膶嶒炓髮嶒炘O(shè)備及軟件實驗內(nèi)容實驗步驟實驗思考題SQLServer中數(shù)據(jù)倉庫的創(chuàng)建理論與技術(shù)基礎(chǔ)SQLServer中數(shù)據(jù)倉庫的創(chuàng)建44理論與技術(shù)基礎(chǔ)(1)數(shù)據(jù)倉庫的概念著名的數(shù)據(jù)庫專家BillInmon認為數(shù)據(jù)倉庫就是面向主題的(subject-oriented)、集成的(integrated)、非易失的(non-volatile)和時變的(time-variant)的數(shù)據(jù)集合,用以支持管理決策。對于這個概念我們可以從兩個層次予以理解:首先,數(shù)據(jù)倉庫用于支持決策,面向分析型數(shù)據(jù)處理,它不同于企業(yè)現(xiàn)有的事務(wù)型數(shù)據(jù)庫;其次,數(shù)據(jù)倉庫是對多個異構(gòu)數(shù)據(jù)源的有效集成,集成后按照主題進行了重組,并包含歷史數(shù)據(jù),而且存放在數(shù)據(jù)倉庫中的數(shù)據(jù)一般不再修改。理論與技術(shù)基礎(chǔ)(1)數(shù)據(jù)倉庫的概念45理論與技術(shù)基礎(chǔ)(2)數(shù)據(jù)集市數(shù)據(jù)集市是為了特定應(yīng)用目的或應(yīng)用范圍而從數(shù)據(jù)倉庫中獨立出來的一部分數(shù)據(jù),也可稱為部門數(shù)據(jù)或主題數(shù)據(jù)。在數(shù)據(jù)倉庫的實施過程中往往可以從一個部門的數(shù)據(jù)集市入手,以后再用幾個數(shù)據(jù)集市組成一個完整的數(shù)據(jù)倉庫。需要注意的就是在實施不同的數(shù)據(jù)集市時,同一含義的字段定義一定要相容。理論與技術(shù)基礎(chǔ)(2)數(shù)據(jù)集市46理論與技術(shù)基礎(chǔ)(3)元數(shù)據(jù)元數(shù)據(jù)與電話黃頁的作用相似,是數(shù)據(jù)倉庫內(nèi)容的一個字典。它是描述數(shù)據(jù)倉庫內(nèi)數(shù)據(jù)的結(jié)構(gòu)和建立方法的數(shù)據(jù)。數(shù)據(jù)倉庫中的元數(shù)據(jù)主要分為事務(wù)型元數(shù)據(jù)、抽取盒轉(zhuǎn)換元數(shù)據(jù)和最終用戶數(shù)據(jù)。理論與技術(shù)基礎(chǔ)(3)元數(shù)據(jù)47理論與技術(shù)基礎(chǔ)(4)ETL數(shù)據(jù)倉庫并非只是數(shù)據(jù)的簡單累積,而是要經(jīng)過一系列的抽取、轉(zhuǎn)換和裝載的過程,即ETL。ETL是構(gòu)建數(shù)據(jù)倉庫的重要環(huán)節(jié),也是企業(yè)數(shù)據(jù)管理的核心,對數(shù)據(jù)倉庫的后續(xù)環(huán)節(jié)影響比較大。目前市場上主流的ETL工具主要有Informatica的PowerCenter、IBM的DataStage、Oracle的WarehouseBuilder以及Microsoft的SQLServerIS等。ETL的主要功能包括數(shù)據(jù)抽取、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)清洗和數(shù)據(jù)裝載。理論與技術(shù)基礎(chǔ)(4)ETL48理論與技術(shù)基礎(chǔ)(5)數(shù)據(jù)倉庫模型模型是對現(xiàn)實事物的反映和抽象,它可以幫助我們更加清晰地了解客觀世界。數(shù)據(jù)倉庫建模在業(yè)務(wù)分析之后開始,是數(shù)據(jù)倉庫構(gòu)造工作正式開始的第一步。正確而完備的數(shù)據(jù)模型是用戶業(yè)務(wù)需求的體現(xiàn),是數(shù)據(jù)倉庫項目成功與否的最重要的技術(shù)因素。數(shù)據(jù)建模有三層:概念、邏輯和物理。在數(shù)據(jù)倉庫的設(shè)計中,數(shù)據(jù)建模的每一層都有自己的目的。理論與技術(shù)基礎(chǔ)(5)數(shù)據(jù)倉庫模型49理論與技術(shù)基礎(chǔ)(6)數(shù)據(jù)倉庫的實現(xiàn)步驟數(shù)據(jù)倉庫不是直接買來就能使用的產(chǎn)品,它是一種方案或過程,是建立在用戶提供的大量數(shù)據(jù)、硬件環(huán)境和數(shù)據(jù)庫管理系統(tǒng)上的,需要分析工具的輔助支持。數(shù)據(jù)倉庫的構(gòu)建通常包括以下步驟:理論與技術(shù)基礎(chǔ)(6)數(shù)據(jù)倉庫的實現(xiàn)步驟50理論與技術(shù)基礎(chǔ)①建立企業(yè)模型要實現(xiàn)體系結(jié)構(gòu)的變遷,首先要了解企業(yè)需要什么數(shù)據(jù)、已經(jīng)具備了哪些數(shù)據(jù)、哪些數(shù)據(jù)是和需求相關(guān)的,最大程度地利用現(xiàn)有系統(tǒng)中的數(shù)據(jù)。建立企業(yè)模型一般采用ER模型或面向?qū)ο蟮姆治龇椒?。理論與技術(shù)基礎(chǔ)①建立企業(yè)模型51理論與技術(shù)基礎(chǔ)②選取主題企業(yè)模型建立后,可以根據(jù)企業(yè)模型和用戶需求確定系統(tǒng)中存在的主題。一個復(fù)雜的大型數(shù)據(jù)倉庫系統(tǒng)通常包含有多個主題。在主題選定后,需要針對這些主題擬定一個盡可能詳盡的需求說明,然后逐個主題進行實施,它是知識螺旋式開發(fā)思想在具體實現(xiàn)中的體現(xiàn)。根據(jù)選定的主題,在企業(yè)模型中劃分出各個主題的邊界,從而確定各個主題涉及的操作系統(tǒng)中的表。理論與技術(shù)基礎(chǔ)②選取主題52理論與技術(shù)基礎(chǔ)③邏輯模型設(shè)計確定了主題域,接下來進行系統(tǒng)邏輯模型的設(shè)計,包括確定數(shù)據(jù)的粒度層次、數(shù)據(jù)分割策略、定義關(guān)系模式記錄系統(tǒng)等任務(wù),在數(shù)據(jù)庫數(shù)據(jù)表的基礎(chǔ)上設(shè)計數(shù)據(jù)倉庫的表結(jié)構(gòu)。④物理設(shè)計在數(shù)據(jù)倉庫的物理模型設(shè)計中主要解決數(shù)據(jù)的存儲結(jié)構(gòu)、索引策略、存儲策略、存儲分配優(yōu)化等問題。理論與技術(shù)基礎(chǔ)③邏輯模型設(shè)計53理論與技術(shù)基礎(chǔ)⑤數(shù)據(jù)裝載接口的設(shè)計在完成數(shù)據(jù)倉庫概念、邏輯、物理設(shè)計后,接下來一個需要設(shè)計的是數(shù)據(jù)裝載接口的設(shè)計。數(shù)據(jù)裝載程序?qū)嶋H包括數(shù)據(jù)裝載功能(數(shù)據(jù)清洗、轉(zhuǎn)換和集成)、數(shù)據(jù)綜合功能(將集成的細節(jié)數(shù)據(jù)轉(zhuǎn)化成不同綜合層次的數(shù)據(jù))。理論與技術(shù)基礎(chǔ)⑤數(shù)據(jù)裝載接口的設(shè)計54理論與技術(shù)基礎(chǔ)⑥裝載檢驗數(shù)據(jù)在進行了上述步驟的設(shè)計后,一個初步的數(shù)據(jù)倉庫已經(jīng)設(shè)計完成。接下來裝載一個主題的數(shù)據(jù)進行數(shù)據(jù)校驗以進行數(shù)據(jù)質(zhì)量評估,確保數(shù)據(jù)的可靠性。⑦OLAP模型設(shè)計和應(yīng)用通常,需要對階段任務(wù)中涉及的維度進行一個總體的分析,然后針對每一個需要進行OLAP展現(xiàn)的主題確定其維度和度量事實,最終為每一個主題建立一個OLAP模型。并在此模型上進行必要的OLAP操作,做數(shù)據(jù)分析。理論與技術(shù)基礎(chǔ)⑥裝載檢驗數(shù)據(jù)55理論與技術(shù)基礎(chǔ)⑧數(shù)據(jù)挖掘在數(shù)據(jù)挖掘?qū)用嫔?,首先要為?shù)據(jù)挖掘準(zhǔn)備足夠的數(shù)據(jù),根據(jù)需求選擇算法建立挖掘模型。數(shù)據(jù)挖掘需要的數(shù)據(jù)可以來自數(shù)據(jù)倉庫,也可以由于需求的需要而來自其他地方。⑨前端數(shù)據(jù)展示系統(tǒng)設(shè)計⑩重復(fù)前面過程在完成初級階段的工作后,需要和客戶進行更深入的交流。根據(jù)最終用戶的需求,將現(xiàn)有業(yè)務(wù)系統(tǒng)的缺陷和不足進行調(diào)整和修改,從而為上層數(shù)據(jù)倉庫系統(tǒng)的發(fā)展做更好的數(shù)據(jù)準(zhǔn)備。理論與技術(shù)基礎(chǔ)⑧數(shù)據(jù)挖掘56實驗?zāi)康?.理解數(shù)據(jù)庫與數(shù)據(jù)倉庫之間的區(qū)別與聯(lián)系;2.掌握典型的關(guān)系型數(shù)據(jù)庫及其數(shù)據(jù)倉庫系統(tǒng)的工作原理以及應(yīng)用方法;3.掌握數(shù)據(jù)倉庫建立的基本方法及其相關(guān)工具的使用。實驗?zāi)康?.理解數(shù)據(jù)庫與數(shù)據(jù)倉庫之間的區(qū)別與聯(lián)系;57實驗要求

利用實驗室和指導(dǎo)教師提供的實驗軟件,認真完成規(guī)定的實驗項目,真實地記錄實驗中遇到的各種問題和解決的方法與過程,并繪出模擬實驗案例的數(shù)據(jù)倉庫模型。實驗完成后,應(yīng)根據(jù)實驗情況寫出實驗報告。實驗要求利用實驗室和指導(dǎo)教師提供的實驗軟件,認真完成規(guī)58實驗設(shè)備及軟件

基于NT的局域網(wǎng)絡(luò),服務(wù)器與客戶端安裝MSSQLServer服務(wù)系統(tǒng)以及AnalysisServices系統(tǒng)。實驗設(shè)備及軟件基于NT的局域網(wǎng)絡(luò),服務(wù)器與客戶端安裝M59實驗內(nèi)容以SQLServer為系統(tǒng)平臺,設(shè)計、建立數(shù)據(jù)庫,并以此為基礎(chǔ)創(chuàng)建數(shù)據(jù)倉庫。實驗內(nèi)容以SQLServer為系統(tǒng)平臺,設(shè)計、60實驗步驟1.啟動SQLServer服務(wù)啟動SQLServer實例時即啟動了SQLServer服務(wù)。啟動SQLServer服務(wù)之后,用戶便可與服務(wù)器建立新連接。SQLServer服務(wù)可在本地或遠程作為MicrosoftWindowsNT?4.0或Windows?2000服務(wù)啟動和停止。SQLServer服務(wù)若是默認實例,則被稱為MSSQLServer;若是命名實例,則被稱為MSSQL$instancename。實驗步驟1.啟動SQLServer服務(wù)61實驗步驟2.注冊服務(wù)器⑴右擊一個服務(wù)器或服務(wù)器組,然后單擊"新建SQLServer注冊"命令。⑵在"服務(wù)器"框中,鍵入服務(wù)器名。⑶若要指定SQLServer企業(yè)管理器(作為客戶端)與運行正在注冊的Microsoft?SQLServer?實例的服務(wù)器之間的連接,請執(zhí)行下列操作之一:

單擊“使用Windows身份驗證”-或-單擊“使用SQLServer身份驗證”。實驗步驟2.注冊服務(wù)器62實驗步驟⑷在"服務(wù)器組"列表中,單擊一個服務(wù)器組。⑸執(zhí)行下列一個或多個操作:選擇"在控制臺中顯示SQLServer服務(wù)器的狀態(tài)"復(fù)選框。選擇"顯示系統(tǒng)數(shù)據(jù)庫和系統(tǒng)對象"復(fù)選框。選擇"在連接時自動啟動SQLServer"復(fù)選框。

重復(fù)步驟1到5,在"SQLServer企業(yè)管理器"中注冊每個服務(wù)器。

實驗步驟⑷在"服務(wù)器組"列表中,單擊一個服務(wù)器組。63實驗步驟3.設(shè)計表設(shè)計數(shù)據(jù)庫時,應(yīng)先確定需要什么樣的表,各表中都有哪些數(shù)據(jù)以及各個表的存取權(quán)限等等。在創(chuàng)建和操作表的過程中,將對表進行更為細致的設(shè)計。設(shè)計時應(yīng)注意:表所包含的數(shù)據(jù)的類型;表的各列及每一列的數(shù)據(jù)類型(如果必要,還應(yīng)注意列寬);哪些列允許空值;是否要使用以及何時使用約束、默認設(shè)置或規(guī)則;所需索引的類型,哪里需要索引,哪些列是主鍵,哪些是外鍵。實驗步驟3.設(shè)計表64實驗步驟4.修改表表創(chuàng)建之后可以修改許多已定義的選項,包括:添加、修改、刪除列。例如,列的名稱、長度、數(shù)據(jù)類型、精度、小數(shù)位數(shù)以及為空性均可進行修改,不過有一些限制而已。注意:可添加或刪除PRIMARYKEY和FOREIGNKEY約束;可添加或刪除UNIQUE和CHECK約束及DEFAULT定義(對象);可使用IDENTITY或ROWGUIDCOL屬性添加或刪除標(biāo)識符列;雖然ROWGUIDCOL屬性也可添加至現(xiàn)有列或從現(xiàn)有列刪除,但是任何時候在表中只能有一列可具有該屬性;表及表中所選定的列已注冊為全文索引。實驗步驟4.修改表65實驗步驟5.建立系統(tǒng)數(shù)據(jù)源連接⑴Microsoft?WindowsNT?4.0用戶:單擊“開始”按鈕,指向“設(shè)置”,單擊

“控制面板”,然后雙擊“數(shù)據(jù)源(ODBC)”。⑵Windows?2000用戶:單擊“開始”按鈕,指向“設(shè)置”,單擊“控制面板”,然后雙擊“管理工具”,再雙擊“數(shù)據(jù)源(ODBC)”。⑶在“系統(tǒng)DSN”選項卡上單擊“添加”按鈕。

⑷選擇“MicrosoftAccess驅(qū)動程序(*.mdb)”,然后單擊“完成”按鈕。

⑸在“數(shù)據(jù)源名”框中,輸入“教程”,然后在“數(shù)據(jù)庫”下,單擊“選擇”。

⑹在“選擇數(shù)據(jù)庫”對話框中,瀏覽到“C:\ProgramFiles\MicrosoftAnalysisServices\Samples”,然后單擊“FoodMart2000.mdb”。單擊“確定”按鈕。

實驗步驟5.建立系統(tǒng)數(shù)據(jù)源連接66SQL-Server-中數(shù)據(jù)倉庫的創(chuàng)建課件67實驗步驟6.建立數(shù)據(jù)庫和數(shù)據(jù)源⑴如何建立數(shù)據(jù)庫結(jié)構(gòu)①在AnalysisManager樹視圖中展開“AnalysisServers”。

②單擊服務(wù)器名稱,即可建立與AnalysisServers的連接。

③右擊服務(wù)器名稱,然后單擊“新建數(shù)據(jù)庫”命令。

④在“數(shù)據(jù)庫”對話框中的“數(shù)據(jù)庫名稱”框中,輸入“教程”,然后單擊“確定”按鈕。

⑤在AnalysisManager樹窗格中展開服務(wù)器,然后展開剛才創(chuàng)建的“教程”數(shù)據(jù)庫。實驗步驟6.建立數(shù)據(jù)庫和數(shù)據(jù)源68實驗步驟⑵建立數(shù)據(jù)源在AnalysisManager樹窗格中,右擊“教程”數(shù)據(jù)庫下的“數(shù)據(jù)源”文件夾,然后單擊“新數(shù)據(jù)源”命令。在“數(shù)據(jù)鏈接屬性”對話框中,單擊“提供者”選項卡,然后單擊“MicrosoftOLEDBProviderforODBCDrivers”。實驗步驟⑵建立數(shù)據(jù)源69SQL-Server-中數(shù)據(jù)倉庫的創(chuàng)建課件70實驗步驟①單擊“連接”選項卡,然后從“使用數(shù)據(jù)源名稱”列表中單擊“教程”。②單擊“測試連接”以確保一切工作正常。在“Microsoft數(shù)據(jù)鏈接”對話框中應(yīng)出現(xiàn)一條消息,說明連接成功。在消息框中單擊“確定”按鈕。③單擊“確定”按鈕關(guān)閉“數(shù)據(jù)鏈接屬性”對話框。實驗步驟①單擊“連接”選項卡,然后從“使用數(shù)據(jù)源名稱”列表71SQL-Server-中數(shù)據(jù)倉庫的創(chuàng)建課件72實驗步驟7.建立多維數(shù)據(jù)集您現(xiàn)在的身份是FoodMartCorporation的數(shù)據(jù)庫管理員。FoodMart是一家大型的連鎖店,在美國、墨西哥和加拿大有銷售業(yè)務(wù)。市場部想要按產(chǎn)品和顧客分析1998年進行的所有銷售業(yè)務(wù)數(shù)據(jù)。使用存儲在公司數(shù)據(jù)倉庫中的數(shù)據(jù),您就能建立多維數(shù)據(jù)結(jié)構(gòu)(多維數(shù)據(jù)集),以便在市場分析人員查詢數(shù)據(jù)庫時獲取快速的響應(yīng)。建立一個多維數(shù)據(jù)集,用于進行銷售分析。實驗步驟7.建立多維數(shù)據(jù)集73實驗步驟⑴打開多維數(shù)據(jù)集向?qū)г贏nalysisManager樹窗格中,“教程”數(shù)據(jù)庫下,右擊“多維數(shù)據(jù)集”文件夾,單擊“新建多維數(shù)據(jù)集”菜單,然后單擊“向?qū)А泵?。⑵向多維數(shù)據(jù)集添加度量值度量值是要進行分析的數(shù)據(jù)庫中的量化值。常用的度量值為銷售、成本和預(yù)算數(shù)據(jù)。度量值根據(jù)多維數(shù)據(jù)集不同的維度類別進行分析。

實驗步驟⑴打開多維數(shù)據(jù)集向?qū)?4實驗步驟①在多維數(shù)據(jù)集向?qū)У摹皻g迎”步驟,單擊“下一步”按鈕。②在“從數(shù)據(jù)源中選擇事實數(shù)據(jù)表”步驟,展開“教程”數(shù)據(jù)源,然后單擊“sales_fact_1998”。③單擊“瀏覽數(shù)據(jù)”按鈕可以查看“sales_fact_1998”表中的數(shù)據(jù)。數(shù)據(jù)瀏覽完畢后,關(guān)閉“瀏覽數(shù)據(jù)”窗口,然后單擊“下一步”按鈕。④若要定義多維數(shù)據(jù)集的度量值,在“事實數(shù)據(jù)表數(shù)據(jù)列”下,雙擊“store_sales”。對“store_cost”和“unit_sales”列重復(fù)此步驟,然后單擊“下一步”按鈕。實驗步驟①在多維數(shù)據(jù)集向?qū)У摹皻g迎”步驟,單擊“下一步”按75實驗步驟⑶建立時間維度在向?qū)У摹斑x擇多維數(shù)據(jù)集的維度”步驟,單擊“新建維度”命令。此操作將調(diào)用維度向?qū)А"僭凇皻g迎”步驟,單擊“下一步”按鈕。②在“選擇維度的創(chuàng)建方式”步驟,選擇“星型架構(gòu):單個維度表”選項,然后單擊“下一步”按鈕。③在“選擇維度表”步驟,單擊“time_by_day”。單擊“瀏覽數(shù)據(jù)”按鈕可以查看包含在“time_by_day”表中的數(shù)據(jù)。查看完“time_by_day”

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論