數(shù)據(jù)倉庫與數(shù)據(jù)挖掘?qū)嶒炛笇?dǎo)書_第1頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘?qū)嶒炛笇?dǎo)書_第2頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘?qū)嶒炛笇?dǎo)書_第3頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘?qū)嶒炛笇?dǎo)書_第4頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘?qū)嶒炛笇?dǎo)書_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、實驗一、DTS的使用一、實驗?zāi)康模?、了解MS SQL Server 2000的安裝,熟悉MS SQL Server 2000數(shù)據(jù)庫的使用環(huán)境2、理解數(shù)據(jù)庫和數(shù)據(jù)倉庫的關(guān)系,為數(shù)據(jù)倉庫建立數(shù)據(jù)庫3、熟練使用MS SQL Server 2000的DTS,能夠?qū)⒏鞣N數(shù)據(jù)源的數(shù)據(jù)按照數(shù)據(jù)倉庫設(shè)計的要求導(dǎo)入到數(shù)據(jù)倉庫二、實驗內(nèi)容:1、熟悉MS SQL Server 2000數(shù)據(jù)庫和表的基本操作。2、為數(shù)據(jù)倉庫建立新的數(shù)據(jù)庫Mynorthwind。3、使用DTS導(dǎo)入TXT文本文件到Mynorthwind。4、使用DTS導(dǎo)入Access數(shù)據(jù)庫到Mynorthwind。5、使用DTS導(dǎo)入Excel文件到My

2、northwind。6、使用DTS從Northwind導(dǎo)出Products和Categories兩個表到Mynorthwind。7、使用DTS查詢導(dǎo)入,從Northwind導(dǎo)出Employees表到Mynorthwind,并將源表中first name和lastname列合成一個列fullname。8、使用DTS的查詢導(dǎo)入,從Northwind導(dǎo)出Orders表到Mynorthwind為Dates表,并將源表Orders表中OrderDate一列分成年、月、日、周、季五列,同時保留OrderDate一列。9、使用DTS的查詢導(dǎo)入,從Northwind導(dǎo)出Order Details表到Mynor

3、thwind為Facts表。首先用Select語句將產(chǎn)品類別編號和員工編號等從各自表中取出,其次計算合計列值,計算方法為單價*(1-折扣)*數(shù)量,然后將Order Details表的內(nèi)容復(fù)制到Facts表各列。三、實驗步驟:1、啟動Microsoft SQL Server2000“服務(wù)管理器”,打開“企業(yè)管理器”,在出現(xiàn)的“SQL Server Enterprise Manager”窗口中,單擊加號找到數(shù)據(jù)庫,右鍵選擇“新建數(shù)據(jù)庫”,打開對話框如圖1.1所示,輸入數(shù)據(jù)庫名:Mynorthwind,點擊確定完成創(chuàng)建。圖1.1 “新建數(shù)據(jù)庫”對話框2、在新建的Mynorthwind數(shù)據(jù)庫上點擊右鍵

4、,選擇“所有任務(wù)”>“導(dǎo)入數(shù)據(jù)”,打開“DTS導(dǎo)入/導(dǎo)出向?qū)А睂υ捒?,如圖1.2所示。圖1.2 “DTS導(dǎo)入/導(dǎo)出向?qū)А睂υ捒?、點擊圖1.2對話框中“下一步”,打開新的對話框如圖1.3所示。根據(jù)導(dǎo)入數(shù)據(jù)源的不同格式在對話框下拉菜單中選擇不同的“數(shù)據(jù)源”,如:“文本文件”、“Microsoft Access”或“Microsoft Excel 97-2000”等。選定“數(shù)據(jù)源”后,點擊“文件名”文本框后對應(yīng)“.”按鈕,選擇需要導(dǎo)入的文件,點擊“下一步”,保持默認設(shè)置不變直到最后完成導(dǎo)入。圖1.3 “選擇數(shù)據(jù)源”對話框4、在圖1.3中選定“數(shù)據(jù)源”為“用于SQL Server的Micros

5、oft OLE DB提供程序”,在“數(shù)據(jù)庫”下拉菜單中選擇源數(shù)據(jù)庫為“Northwind”,點擊“下一步”,確定目的“數(shù)據(jù)庫”為“Mynorthwind”,點擊“下一步”。對于簡單的表格導(dǎo)出/導(dǎo)入操作,選擇“從源數(shù)據(jù)庫復(fù)制表和視圖”,并按提示完成導(dǎo)出/導(dǎo)入。對于查詢導(dǎo)入選擇“用一條查詢指定要傳輸?shù)臄?shù)據(jù)”,打開新的對話框如圖1.4所示,輸入需要實現(xiàn)的查詢命令。圖1.4 查詢導(dǎo)出/導(dǎo)入對話框四、注意事項:1、 觀察數(shù)據(jù)庫中數(shù)據(jù)字典的形式。2、 導(dǎo)入TXT文件時,中文輸入法輸入的符號不能作為分隔符使用。五、思考與練習(xí):1、數(shù)據(jù)倉庫與數(shù)據(jù)庫的關(guān)系。 2、向數(shù)據(jù)倉庫導(dǎo)入數(shù)據(jù)的時候?qū)⑷掌诜譃槟?、月、日、?/p>

6、的作用是什么? 實驗二、數(shù)據(jù)備份還原和OLAP數(shù)據(jù)源的建立一、實驗?zāi)康模?、熟悉Analysis Service的使用環(huán)境2、掌握數(shù)據(jù)倉庫的備份和還原操作,能夠為Analysis Service的OLAP分析建立數(shù)據(jù)庫和數(shù)據(jù)源二、實驗內(nèi)容:1、安裝Analysis Service組件,熟悉Analysis Service包含的基本內(nèi)容和操作環(huán)境2、還原實驗用數(shù)據(jù)庫insur,熟悉數(shù)據(jù)庫的表結(jié)構(gòu)和數(shù)據(jù)記錄3、在Analysis Service中建立新的分析數(shù)據(jù)庫人壽保險實驗,把insur設(shè)為數(shù)據(jù)源4、在Analysis Service中瀏覽人壽保險實驗的元數(shù)據(jù)和多維數(shù)據(jù)5、在Analysis S

7、ervice中備份人壽保險實驗為d:myinsur.cab6、刪除現(xiàn)有人壽保險實驗,還原備份數(shù)據(jù)庫為人壽保險實驗三、實驗步驟:1、啟動Microsoft SQL Server2000“服務(wù)管理器”,打開“企業(yè)管理器”,在出現(xiàn)的“SQL Server Enterprise Manager”窗口中,單擊加號找到數(shù)據(jù)庫,右鍵選擇“所有任務(wù)”>“還原數(shù)據(jù)庫”,打開對話框如圖2.1所示,輸入“還原為數(shù)據(jù)庫”名稱為“insur”,選擇“從設(shè)備”還原。圖2.1 “還原數(shù)據(jù)庫”對話框2、點擊“選擇設(shè)備”在彈出的對話框中選擇“添加”,在彈出的對話框中查找對應(yīng)的數(shù)據(jù)庫備份文件“insur”,確定后返回到圖2

8、.1對話框,點擊“選項”選項卡打開對話框如圖2.2 所示。選中“在現(xiàn)有數(shù)據(jù)庫上強制還原”,修改“移至物理文件名”內(nèi)容為本地計算機上的正確路徑,點擊確定完成還原,還原后瀏覽“insur”數(shù)據(jù)庫中的表,理解表的用途和表之間的關(guān)系。圖2.2 “還原數(shù)據(jù)庫”對話框3、啟動“Analysis Manager”,如圖2.3所示。圖2.3 打開“Analysis Manager”4、在“服務(wù)管理器”圖標上點擊右鍵選擇“新建數(shù)據(jù)庫”,打開對話框輸入數(shù)據(jù)庫名稱為“人壽保險實驗”,完成分析數(shù)據(jù)庫的創(chuàng)建。點擊打開新建的數(shù)據(jù)庫,在“數(shù)據(jù)源”上點擊右鍵選擇“新數(shù)據(jù)源”打開“數(shù)據(jù)鏈接屬性”對話框,選擇希望連接的數(shù)據(jù)為“M

9、icrosoft OLE DB Provider for SQL Server”,點擊“下一步”打開對話框如圖2.4所示,分別點擊下拉菜單選擇對應(yīng)的服務(wù)器名稱和服務(wù)器上的數(shù)據(jù)庫的名稱,點擊確定完成數(shù)據(jù)源的連接。圖2.4 “連接數(shù)據(jù)源”對話框5、點擊“數(shù)據(jù)源”對應(yīng)的“元數(shù)據(jù)”選項卡,查看元數(shù)據(jù)的格式和內(nèi)容。當(dāng)前數(shù)據(jù)庫意外丟失,或在公共環(huán)境下上機無法正常存檔需要備份和還原分析數(shù)據(jù)庫。在“人壽保險實驗”上點擊右鍵選擇“將數(shù)據(jù)庫存檔”,打開對話框如圖2.5所示。設(shè)置本地計算機的合適的保存路徑,生成備份文件為“人壽保險實驗.CAB”,現(xiàn)有數(shù)據(jù)庫刪除后可以還原此數(shù)據(jù)庫。圖2.5 備份數(shù)據(jù)庫對話框四、注意事

10、項:1、備份數(shù)據(jù)庫時要注意路徑的選擇。2、Analysis Service中無法瀏覽數(shù)據(jù)的話安裝Microsoft SQL Server補丁軟件SP4。3、Sql Server 2000中還原數(shù)據(jù)庫時注意選擇從設(shè)備還原,找到備份的路徑,設(shè)定還原后的路徑。五、思考與練習(xí):1、Sql Server 2000中的數(shù)據(jù)庫與“設(shè)置聚合選項”對話框Analysis Service中數(shù)據(jù)庫的區(qū)別。實驗三、維度的創(chuàng)建一、實驗?zāi)康模?、理解維度的基本概念2、掌握時間維度、標準維度等維度的創(chuàng)建方法 二、實驗內(nèi)容:1、選擇數(shù)據(jù)庫中的“保單”表中的“時間”屬性,建立“時間”維度,分為:年、季度、月、日四個層次2、選擇

11、數(shù)據(jù)庫中的“收付費類型明細”表,選擇“收付費”,建立單一層次的標準維度“收付費類型” 3、選擇數(shù)據(jù)庫中的“投保人類型險種分類”表,建立多層次標準維度“險種_投保人類型分類”,包括:投保人類型、險種名稱兩個層次(注意層次的先后關(guān)系)4、選擇數(shù)據(jù)庫中的“機構(gòu)區(qū)域分類”、 “機構(gòu)細分”、 “機構(gòu)業(yè)務(wù)員”表,選擇“區(qū)域分類”、“機構(gòu)名稱”、“業(yè)務(wù)員名稱”,建立多重關(guān)系型標準維度“區(qū)域_機構(gòu)_業(yè)務(wù)員”(注意:維度向?qū)е羞x擇的是雪花架構(gòu))5、編輯建立的維度,在“收付費類型”維度中添加兩個層次:收付費歸并類型、收付費明細類型表示三、實驗步驟:1、創(chuàng)建“時間”維度(1)在“Analysis Manager”窗

12、口中點擊“人壽保險實驗”左邊的加號,在列表項中的“共享維度”上點擊右鍵選擇“新建維度”,選擇“向?qū)А?,點擊“下一步”打開“選擇維度的創(chuàng)建方式”對話框,如圖3.1所示。圖3.1 “選擇維度的創(chuàng)建方式”對話框(2)選擇默認的“星型架構(gòu)”,點擊“下一步”出現(xiàn)“選擇維度表”對話框,在“可用的表”中選擇“保單”,對應(yīng)可以看到字段信息和“瀏覽數(shù)據(jù)”,如圖3.2所示。圖3.2 “選擇維度表”對話框(3)點擊“下一步”,打開“選擇維度類型”對話框,選擇“時間維度”,在下拉菜單中選擇“時間列”為“時間”,如圖3.3所示。圖3.3 “選擇維度類型”對話框(4)點擊“下一步”,彈出“創(chuàng)建時間維度級別”對話框,選擇時

13、間級別為“年、季度、月、日”,如圖3.4所示。圖3.4 “創(chuàng)建時間維度級別”對話框(5)點擊“下一步”保持“選擇高級選項”默認設(shè)置,點擊“下一步”,打開“完成”對話框,在“維度名稱”中輸入“時間”,可以同時看到“時間”維度的層次數(shù)據(jù),如圖3.5所示,點擊“完成”創(chuàng)建。圖3.5 “完成”對話框2、建立“收付費類型”維度(1)與上面建立“時間”維度步驟類似,將3.2圖中選擇的表改為“收付費類型明細”,點擊“下一步”,打開“選擇維度的級別”對話框,選擇“維度級別”為“收付費”,如圖3.6所示。圖3.6 “選擇維度的級別”對話框(2)點擊“下一步”保持“指定成員鍵列”默認設(shè)置,點擊“下一步”保持“選擇

14、高級選項”默認設(shè)置,點擊“下一步”打開“完成”對話框,在“維度名稱”中輸入“收付費類型” ,點擊“完成”創(chuàng)建。3、建立多層次標準維度“險種_投保人類型分類”(1)與上面建立“時間”維度步驟類似,將3.2圖中選擇的表改為“投保人類型險種分類”,點擊“下一步”,打開“選擇維度的級別”對話框,依次選擇“維度級別”為“投保人類型”和“險種名稱”兩個層次,如圖3.7所示。圖3.7 “選擇維度的級別”對話框(2)點擊“下一步”保持“指定成員鍵列”默認設(shè)置,點擊“下一步”保持“選擇高級選項”默認設(shè)置,點擊“下一步”打開“完成”對話框,在“維度名稱”中輸入“險種_投保人類型分類”,點擊“完成”創(chuàng)建。4、建立多

15、重關(guān)系型標準維度“區(qū)域_機構(gòu)_業(yè)務(wù)員”(1)在圖3.1中選擇“雪花架構(gòu):多個相關(guān)維度表”,點擊“下一步”,在圖3.2 中選擇“機構(gòu)區(qū)域分類”、“機構(gòu)細分”、“業(yè)務(wù)員”三個表,點擊“下一步”打開“創(chuàng)建和編輯聯(lián)接”對話框,如圖3.8所示。圖3.8 “創(chuàng)建和編輯聯(lián)接”對話框(2)點擊“下一步”,打開“選擇維度的級別”對話框,依次選擇維度字段“區(qū)域分類”、“機構(gòu)名稱”、“業(yè)務(wù)員名稱”,如圖3.9所示。圖3.9 “選擇維度的級別”對話框(3)點擊“下一步”保持“指定成員鍵列”默認設(shè)置,點擊“下一步”保持“選擇高級選項”默認設(shè)置,點擊“下一步”打開“完成”對話框,在“維度名稱”中輸入“區(qū)域_機構(gòu)_業(yè)務(wù)員”

16、,點擊“完成”創(chuàng)建。5、編輯建立的維度(1)在“收付費類型”維度上點擊右鍵選擇“編輯”,打開“維度編輯器”,在“收付費”上點擊右鍵選擇“新建級別”,如圖3.10所示。圖3.10 “維度編輯器”窗口(2)在彈出的“插入級別”對話框中依次選擇“收付費歸并類型”、“收付費明細類型表示”,點擊確定完成編輯。四、注意事項:1、首先熟悉insur數(shù)據(jù)庫中的表,了解各個表的用途和相互之間的聯(lián)系。2、建立多重標準維度時注意維度的顯示,可以拖動維度以便正確顯示連接關(guān)系。五、思考與練習(xí):1、觀察維度數(shù)據(jù),理解維度的原理和作用。2、維度是否可以隨時添加。實驗四、多維數(shù)據(jù)集的創(chuàng)建一、實驗?zāi)康模?、理解多維數(shù)據(jù)集的基本

17、概念2、掌握基本多維數(shù)據(jù)集的建立和編輯過程二、實驗內(nèi)容:1、建立“保單數(shù)據(jù)分析”多維數(shù)據(jù)集2、加入“時間”、“收付費類型”、“險種_投保人類型分類”、“區(qū)域_機構(gòu)_業(yè)務(wù)員”維度3、插入“中間表”,連接事實表和各維度表4、保存并處理多維數(shù)據(jù)集三、實驗步驟:1、在“人壽保險實驗”中右鍵點擊“多維數(shù)據(jù)集”,選擇“新建多維數(shù)據(jù)集”>“向?qū)А?,打開“多維數(shù)據(jù)集向?qū)А睂υ捒?,選擇事實表為“保單”,如圖4.1所示。圖4.1 “多維數(shù)據(jù)集向?qū)А睂υ捒?、點擊“下一步”,打開度量值選擇對話框,選擇所有的事實表數(shù)字列為“多維數(shù)據(jù)集度量值”,如圖4.2所示。圖4.2 度量值選擇對話框3、點擊“下一步”,打開維

18、度選擇對話框,選擇所有的維度為“多維數(shù)據(jù)集維度”,如圖4.3所示。圖4.3 維度選擇對話框4、點擊“下一步”,彈出“事實數(shù)據(jù)表行數(shù)”提示框,如圖4.4所示,點擊“是”。圖4.4“事實數(shù)據(jù)表行數(shù)”提示框5、在彈出的提示框中點擊確定,如圖4.5所示。圖4.5信息提示6、在彈出的“完成”對話框中輸入“多維數(shù)據(jù)集名稱”為“保單數(shù)據(jù)分析”,點擊完成彈出“多維數(shù)據(jù)集編輯器”窗口,如圖4.6所示。圖4.6 “多維數(shù)據(jù)集編輯器”窗口7、在上圖的“架構(gòu)”區(qū)域中右鍵點擊空白區(qū)域,彈出“插入表”按鈕,在“選擇表”對話框中選擇“中間表”,點擊“添加”,關(guān)閉對話框。將各個表通過公共鍵連接起來,如圖4.7所示。圖4.7

19、表間連接8、選擇“多維數(shù)據(jù)集編輯器”窗口的“工具”菜單>“處理多維數(shù)據(jù)集”,打開信息提示框,如圖4.8所示。圖4.8 信息提示9、點擊“是”,打開“存儲設(shè)計向?qū)А睂υ捒颍c擊“下一步”打開“選擇數(shù)據(jù)存儲類型”對話框,如圖4.9所示,選擇“MOLAP”選項。圖4.9 “選擇數(shù)據(jù)存儲類型”對話框10、點擊“下一步”,打開“設(shè)置聚合選項”對話框,如圖4.10所示,點擊“開始”。圖4.10 “設(shè)置聚合選項”對話框11、聚合后點擊“下一步”,彈出“完成”對話框,如圖4.11所示,點擊“完成”,得到最終處理結(jié)果,如果4.12所示。圖4.11 “完成”對話框圖4.12 “處理”對話框四、注意事項:1、

20、建立“雪花模型”的時候注意表之間的連接操作。2、計算聚合時選的是MOLAP而不是ROLAP。五、思考與練習(xí):1、觀察多維數(shù)據(jù)集的數(shù)據(jù),理解多維數(shù)據(jù)集的原理和作用。2、聚合的作用。實驗五、OLAP數(shù)據(jù)展示一、實驗?zāi)康模?、理解OLAP的數(shù)據(jù)分析模式,掌握鉆取、旋轉(zhuǎn)等操作方法2、學(xué)習(xí)建立OLAP分析數(shù)據(jù)的動態(tài)訪問方式,在Excel上建立OLAP數(shù)據(jù)透視,對多維立方體進行展示分析二、實驗內(nèi)容:1、按照時間對多維數(shù)據(jù)集的數(shù)據(jù)進行展示,按照時間和投保人類型進行嵌套維度查詢2、使用Excel進行數(shù)據(jù)展示,在Excel中建立與分析服務(wù)器的連接,將分析結(jié)果顯示到Excel上3、學(xué)習(xí)使用數(shù)據(jù)透視表進行數(shù)據(jù)分析展

21、示,查看更細節(jié)數(shù)據(jù)。三、實驗步驟:1、左鍵點擊“多維數(shù)據(jù)集”中的“保單數(shù)據(jù)分析”,對應(yīng)右邊的顯示區(qū)里點擊“數(shù)據(jù)”選項卡,如圖5.1所示。圖5.1 數(shù)據(jù)顯示2、選擇“時間”、“收付費類型”或“險種_投保人類型分類”維度的某一個或組合分量查看查詢數(shù)據(jù),用鼠標左鍵拖動查詢區(qū)域維度或顯示區(qū)域的維度,改變顯示形式。3、新建Excel文件,選擇“數(shù)據(jù)”菜單,打開“導(dǎo)入數(shù)據(jù)”,如圖5.2所示。圖5.2 導(dǎo)入數(shù)據(jù)菜單4、打開“選擇數(shù)據(jù)源”對話框,如圖5.3所示,點擊“新建源”按鈕,彈出“數(shù)據(jù)連接向?qū)А睂υ捒?,如圖5.4所示。圖5.3 “選取數(shù)據(jù)源”對話框圖5.4 “數(shù)據(jù)連接向?qū)А睂υ捒?、在打開的“數(shù)據(jù)連接向

22、導(dǎo)”中選擇數(shù)據(jù)源為“Microsoft SQL Server OLAP服務(wù)”,點擊“下一步”,在彈出的對話框中輸入服務(wù)管理器的名稱,點擊“下一步”,在彈出的對話框中“選擇數(shù)據(jù)庫”為“人壽保險實驗”,選定多維數(shù)據(jù)集為“保單數(shù)據(jù)分析”,如圖5.5所示。圖5.5 “選擇數(shù)據(jù)庫和表”對話框6、點擊“下一步”,點擊“完成”,點擊“打開”,彈出透視表視圖向?qū)?,如圖5.6所示,點擊完成。圖5.6 數(shù)據(jù)透視向?qū)υ捒?、點擊“格式”菜單,選擇“自動套用格式”,打開的對話框中選擇“表1”格式,如圖5.7所示。圖5.7 顯示區(qū)域8、將“數(shù)據(jù)透視表字段列表”中的維度和度量值分別拖動到左邊的工作區(qū)域中,形成完整的表格,如圖5.8所示。圖5.8 Excel中OLAP數(shù)據(jù)的顯示四、注意事項:1、Excel與數(shù)據(jù)源的連接用菜單的“導(dǎo)入外部數(shù)據(jù)”功能。2、注意Excel中顯示數(shù)據(jù)表格的格式。五、思考與練習(xí):1、OLAP中旋轉(zhuǎn)、鉆取、切片、切塊等操作如何實現(xiàn)。實驗六、決策樹挖掘與聚類挖掘一、實驗?zāi)康模?、掌握使用Analysis

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論