《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報(bào)告模板_第1頁
《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報(bào)告模板_第2頁
《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報(bào)告模板_第3頁
《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報(bào)告模板_第4頁
《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報(bào)告模板_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、江西理工大學(xué)應(yīng)用科學(xué)學(xué)院數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課程設(shè)計(jì)報(bào)告題目:某超市數(shù)據(jù)集的OLAP分析及數(shù)據(jù)挖掘系別:班級(jí):姓名:二O二年六月目錄一、建立數(shù)據(jù)倉庫數(shù)據(jù)庫結(jié)構(gòu)和設(shè)置數(shù)據(jù)源11.任務(wù)描述2建立數(shù)據(jù)倉庫數(shù)據(jù)庫設(shè)置數(shù)據(jù)源二、銷售數(shù)據(jù)OLAP分析任務(wù)描述設(shè)計(jì)星型架構(gòu)多維數(shù)據(jù)集(Sales)設(shè)計(jì)存儲(chǔ)和數(shù)據(jù)集處理OLAP分析三、人力資源數(shù)據(jù)OLAP分析1.任務(wù)描述設(shè)計(jì)父子維度的多維數(shù)據(jù)集(HR)3修改多維數(shù)據(jù)集(HR)的結(jié)構(gòu)設(shè)計(jì)存儲(chǔ)和數(shù)據(jù)集處理OLAP分析四、數(shù)據(jù)倉庫及多維數(shù)據(jù)集其它操作1.任務(wù)描述設(shè)置數(shù)據(jù)倉庫及多維數(shù)據(jù)集角色及權(quán)限查看元數(shù)據(jù)創(chuàng)建對(duì)策鉆取6.建立遠(yuǎn)程Internet連接五、數(shù)據(jù)倉庫高級(jí)操作任

2、務(wù)描述創(chuàng)建分區(qū)創(chuàng)建虛擬多維數(shù)據(jù)集DTS調(diào)度多維數(shù)據(jù)集處理備份/還原數(shù)據(jù)倉庫六、數(shù)據(jù)挖掘任務(wù)描述創(chuàng)建揭示客戶模式的決策樹挖掘模型決策樹挖掘結(jié)果分析創(chuàng)建聚類挖掘模型聚類挖掘結(jié)果分析創(chuàng)建基于關(guān)系數(shù)據(jù)表的決策樹挖掘模型瀏覽“相關(guān)性網(wǎng)絡(luò)”視圖 一、建立數(shù)據(jù)倉庫數(shù)據(jù)庫結(jié)構(gòu)和設(shè)置數(shù)據(jù)源1、任務(wù)描述數(shù)據(jù)倉庫數(shù)據(jù)庫是將要在其中存放多維數(shù)據(jù)集、角色、數(shù)據(jù)源、共享維度和挖掘模型的一種結(jié)構(gòu)。然后跟預(yù)先設(shè)置好的ODBC數(shù)據(jù)源建立連接。2、建立數(shù)據(jù)倉庫數(shù)據(jù)庫展開樹視圖的AnalysisServers;單擊服務(wù)器名或右擊選擇連接,與AnalysisServers建立連接;右擊服務(wù)器名,然后單擊“新建數(shù)據(jù)庫”命令;在“數(shù)據(jù)庫

3、”對(duì)話框中輸入數(shù)據(jù)庫名“教程DW”,單擊確定;3、設(shè)置數(shù)據(jù)源展開剛創(chuàng)建的“教程DW”數(shù)據(jù)庫,可看到如下項(xiàng)目:數(shù)據(jù)源、多維數(shù)據(jù)集、共享維度、挖掘模型、數(shù)據(jù)庫角色右擊“教程DW”數(shù)據(jù)庫下的“數(shù)據(jù)源”文件夾,然后單擊“新數(shù)據(jù)源”命令;在“數(shù)據(jù)鏈接屬性”對(duì)話框中,單擊“提供程序”選項(xiàng)卡,選擇“MicrosoftOLEDBProviderforODBCDrivers”;單擊“連接”選項(xiàng)卡,選擇建好的ODBC數(shù)據(jù)源“FoodMart2000”;單擊確定按鈕關(guān)閉“數(shù)據(jù)鏈接屬性”對(duì)話框?qū)相論?jù)陡揍性fx規(guī)供程序辻搖|raiJr|所有選斥洛弟坐辻檢的埶JE:OLEDI棕洪稈序MediaeatalogEEULEDU

4、rrovid_erMdiCdt_:gTil-st-gc=cLDEOLEDEFr-:-ridsrMedi=CatalogVfebDDULIEDBProviderMicr-z-EoEt.Jc:4.OLZEEFr:-vidci:-Hi匚xcisoEtOLEDBProttj.drForE.vridei-f:rOi-it.1:kSeai_cRFroviderfor旨PCServerimplqPro1-!d-2fIMUL_n.Lihrr:v1-i-2ftor111i口it口jz:11Li1fqzt:rv0czirvicez確走|恥消|卒即左使用數(shù)據(jù)遞名稱)V刷新r使用連接宇符串虹j圖表1連接數(shù)據(jù)源銷售數(shù)據(jù)

5、OLAP分析任務(wù)描述以多維方式建立數(shù)據(jù)模型可簡(jiǎn)化聯(lián)機(jī)業(yè)務(wù)分析,提高查詢性能。通過創(chuàng)建多維數(shù)據(jù)集,AnalysisManager可將存儲(chǔ)在關(guān)系數(shù)據(jù)庫中的數(shù)據(jù)轉(zhuǎn)換為具有實(shí)際含義并且易于查詢的業(yè)務(wù)信息。設(shè)計(jì)星型架構(gòu)多維數(shù)據(jù)集(Sales)星型架構(gòu)的多維數(shù)據(jù)集由一個(gè)事實(shí)數(shù)據(jù)表和鏈接到該事實(shí)數(shù)據(jù)表的多個(gè)維度表組成。下面針對(duì)FoodMart超市1998年的銷售業(yè)務(wù)數(shù)據(jù),建立一個(gè)多維數(shù)據(jù)集,以便按產(chǎn)品和顧客2個(gè)主題展開分析。具體操作如下:展開樹窗格的“教程DW”,右擊“多維數(shù)據(jù)集”,選擇“新建多維數(shù)據(jù)集”一“向?qū)А辈藛蚊?,打開如下“多維數(shù)據(jù)集向?qū)А睂?duì)話框。向多維數(shù)據(jù)集添加度量值(事實(shí)):?jiǎn)螕粝乱徊剑凇皬?/p>

6、數(shù)據(jù)源中選擇事實(shí)數(shù)據(jù)表”步驟中,展開“FoodMart”數(shù)據(jù)源,然后單擊“sales_fact_1998”;單擊下一步,設(shè)置多維數(shù)據(jù)集的度量值列:store_sales、store_cost、unit_sales;單擊下一步,建立維度表。單擊新建維度,打開“維度向?qū)А睂?duì)話框;向多維數(shù)據(jù)集添加時(shí)間維:選擇維度類型為“星型架構(gòu):?jiǎn)蝹€(gè)維度表”;單擊下一步,選擇維度表“time_by_day”;單擊下一步,選擇維度類型為“時(shí)間維度”;單擊下一步,選擇時(shí)間級(jí)別為“年、季度、月”;單擊下一步,單擊下一步,輸入時(shí)間維名稱:Time,并設(shè)為“共享”方式,單擊完成,OK!向多維數(shù)據(jù)集添加產(chǎn)品維:再次單擊新建維度

7、,打開“維度向?qū)А睂?duì)話框;選擇創(chuàng)建維度的方式為“雪花架構(gòu):多個(gè)相關(guān)維度表”;單擊下一步,選擇維度表“Product”和“product_class”;單擊下一步,查看連接方式,在這里可刪除不要的連接,添加需要的連接單擊下一步,依次選擇product_category、product_subcategory和brand_name三個(gè)維度級(jí)別;單擊下一步,指定成員鍵列步驟中,不需改變主鍵列;單擊下一步,在“高級(jí)選項(xiàng)”步驟中,根據(jù)需要選擇;單擊下一步,輸入產(chǎn)品維名稱:Product,并設(shè)為“共享”方式,單擊完成,OK!向多維數(shù)據(jù)集添加客戶維度:再次單擊新建維度,打開“維度向?qū)А睂?duì)話框;選擇創(chuàng)建維度的

8、方式為“星型架構(gòu):?jiǎn)蝹€(gè)維度表”;單擊下一步,選擇維度表“Customer”;單擊下一步,選擇維度類型為“標(biāo)準(zhǔn)維度”;單擊下一步,依次選擇Country、State_Province、City和lname四個(gè)維度級(jí)別;單擊下一步,指定成員鍵列步驟中,不需改變主鍵列;單擊下一步,在“高級(jí)選項(xiàng)”步驟中,根據(jù)需要選擇;單擊下一步,輸入客戶維名稱:Customer,并設(shè)為“共享”方式,單擊完成,OK!生成多維數(shù)據(jù)集:回到多維數(shù)據(jù)集向?qū)?duì)話框,這里已到了新建的4個(gè)維度;單擊下一步,在“是否計(jì)算事實(shí)數(shù)據(jù)表行數(shù)提問時(shí),單擊是,開始計(jì)算。計(jì)算完成后,命名多維數(shù)據(jù)集為:Sales,單擊完成,0K!關(guān)閉向?qū)ВS之啟

9、動(dòng)多維數(shù)據(jù)集編輯器,其中可看到剛剛創(chuàng)建的多維數(shù)據(jù)集。單擊藍(lán)色或黃色的標(biāo)題欄,對(duì)表進(jìn)行排列,使其符合下圖所示的樣子7蓋牯Stk-_dayYeek_oE_ye-wni3nih_of_y*arIU.-Wlertisc-aljeritionji-anerf顯亡produci.adtLne_id.CTi3torer_Ld.jroriQlj:-n_atore_3dnti?r?_3-alssst-:-re=-:ostUJUt_34143pt1odd亡tproducl_cla53_iapr-?djcl;_idbr-Mid_pimieprodueI;jumieMJSEP5TO33_He:tklrecycl-it

10、lejattlojv_al305t4nr|卜CUEtOFiif_idiCCDUJil_TLiJllliirnailA.ddXAE.t血ddrpE.出*jl圖表2“Sales多維數(shù)據(jù)集編輯器”窗口設(shè)計(jì)存儲(chǔ)和數(shù)據(jù)集處理:設(shè)計(jì)好Sales多維數(shù)據(jù)集的結(jié)構(gòu)之后,需要選擇數(shù)據(jù)的存儲(chǔ)模式(MOLAP、ROLAP或HOLAP),并指定要存儲(chǔ)的預(yù)先計(jì)算好的值的數(shù)量,然后用數(shù)據(jù)填充多維數(shù)據(jù)集。本例選擇MOLAP作為存儲(chǔ)模式,創(chuàng)建Sales多維數(shù)據(jù)集的聚合設(shè)計(jì),然后從ODBC源中裝載數(shù)據(jù)并按照聚合設(shè)計(jì)中的定義計(jì)算匯總值。展開樹窗格,右擊“Sales”多維數(shù)據(jù)集,選擇“設(shè)計(jì)存儲(chǔ)”菜單命令,彈出“存儲(chǔ)設(shè)計(jì)向?qū)А睂?duì)話框

11、;也可在多維數(shù)據(jù)集編輯窗口中選擇“工具設(shè)計(jì)存儲(chǔ)”菜單命令,打開“存儲(chǔ)設(shè)計(jì)向?qū)А睂?duì)話框;單擊下一步,然后選擇“MOLAP”作為數(shù)據(jù)存儲(chǔ)類型;單擊下一步,設(shè)置聚合選項(xiàng)為“性能提升達(dá)到”,并輸入“40”作為指定百分比,以此優(yōu)化能力平衡查詢性能和存儲(chǔ)空間大小。單擊開始,完成后可看到“性能與大小”圖,從中可看出增加性能提升對(duì)使用額外磁盤空間的需求。單擊下一步,選擇“立即處理”,并單擊完成,系統(tǒng)開始進(jìn)行數(shù)據(jù)處理,處理聚合一般要花費(fèi)較長一些時(shí)間。處理完成后點(diǎn)擊關(guān)閉,回到AnalysisManager窗口。接下來就可瀏覽多維數(shù)據(jù)集的數(shù)據(jù)了。4.OLAP分析:聯(lián)機(jī)分析處理(OLAP)是使用多維數(shù)據(jù)表達(dá)式(稱為多

12、維數(shù)據(jù)集)提供對(duì)數(shù)據(jù)倉庫數(shù)據(jù)進(jìn)行快速訪問的常用方法。多維數(shù)據(jù)集為維度表中的數(shù)據(jù)和數(shù)據(jù)倉庫中的事實(shí)數(shù)J據(jù)表建立模型,并為客戶端應(yīng)用程序提供完善的查詢和分析功能。11-GduxiJHh+rro-*tic:vEtorlvaEtorCo:-PSPlTi?匚UKtOTt*bPH-ifrCuetamavA1_1-ITS匚弓7i4DCV.X1B.日.-A+vn4-Je-工”亠Mixiuw丄WQ,2?5T1TZ.595口4UTJ-L1-金二.匚卓刁1L-UdA+CA曰屯?15.心1.”匕小+on3A5-ac-.=口51.5LAFA+TTAce-T-B-1510T.1?e-CiQ圖表3OLAP分析圖三、人力資源

13、數(shù)據(jù)OLAP分析任務(wù)描述:建立一個(gè)人力資源(HR)多維數(shù)據(jù)集,以進(jìn)行雇員工資分析。先把Employee維度創(chuàng)建為父子維度,然后使用該維度以及常規(guī)維度來生成HR多維數(shù)據(jù)集設(shè)計(jì)父子維度的多維數(shù)據(jù)集(HR):展開“教程DW”,右擊“共享維度”,選擇“新建維度|向?qū)А辈藛蚊?,打開“新建維度向?qū)А睂?duì)話框。單擊下一步,選擇維度結(jié)構(gòu)為“父子:?jiǎn)蝹€(gè)維度表中相關(guān)的兩列”;單擊下一步,選擇維度表employee;單擊下一步,選擇employee_id為成員鍵,選擇supervisor_id為父鍵列,選擇full_name為成員名。單擊下一步,直到最后一步,輸入維度名稱:employee;單擊完成,回到維度編輯器

14、。OK!修改多維數(shù)據(jù)集(HR)的結(jié)構(gòu)展開“教程DW”,右擊“多維數(shù)據(jù)集”,選擇“新建多維數(shù)據(jù)集|向?qū)А辈藛蚊?,打開多維數(shù)據(jù)集向?qū)?duì)話框。點(diǎn)擊下一步,選擇salary(工資)作事實(shí)數(shù)據(jù)表;點(diǎn)擊下一步,選擇salary_paid、vacation_used為度量值列;點(diǎn)擊下一步,選擇Employee(雇員)、Store(商店)、Time(時(shí)間)作維度;點(diǎn)擊下一步,在提示是否計(jì)算事實(shí)數(shù)據(jù)表行數(shù)時(shí)選“是”。最后輸入人力資源多維數(shù)據(jù)集的名稱NR,點(diǎn)擊完成,OK!回到編輯器窗口,手工建立time_by_day表到salary表的聯(lián)接,再建立store表到employee表中的聯(lián)接,刪除多余的聯(lián)接。最后如

15、下圖所示。設(shè)計(jì)存儲(chǔ)和數(shù)據(jù)集處理設(shè)計(jì)好Sales多維數(shù)據(jù)集的結(jié)構(gòu)之后,需要選擇數(shù)據(jù)的存儲(chǔ)模式(MOLAP、ROLAP或HOLAP),并指定要存儲(chǔ)的預(yù)先計(jì)算好的值的數(shù)量,然后用數(shù)據(jù)填充多維數(shù)據(jù)集。本例選擇MOLAP作為存儲(chǔ)模式,創(chuàng)建Sales多維數(shù)據(jù)集的聚合設(shè)計(jì),然后從ODBC源中裝載數(shù)據(jù)并按照聚合設(shè)計(jì)中的定義計(jì)算匯總值。展開樹窗格,右擊“Sales”多維數(shù)據(jù)集,選擇“設(shè)計(jì)存儲(chǔ)”菜單命令,彈出“存儲(chǔ)設(shè)計(jì)向?qū)А睂?duì)話框;也可在多維數(shù)據(jù)集編輯窗口中選擇“工具|設(shè)計(jì)存儲(chǔ)”菜單命令,打開“存儲(chǔ)設(shè)計(jì)向?qū)А睂?duì)話框;單擊下一步,然后選擇“MOLAP”作為數(shù)據(jù)存儲(chǔ)類型;單擊下一步,設(shè)置聚合選項(xiàng)為“性能提升達(dá)到”,并

16、輸入“40”作為指定百分比,以此優(yōu)化能力平衡查詢性能和存儲(chǔ)空間大小。單擊開始,完成后可看到“性能與大小”圖,從中可看出增加性能提升對(duì)使用額外磁盤空間的需求。遜:|停止|證附|眈衆(zhòng)口圖表4性能與大小單擊下一步,選擇“立即處理”,并單擊完成,系統(tǒng)開始進(jìn)行數(shù)據(jù)處理,處理聚合一般要花費(fèi)較長一些時(shí)間。處理完成后點(diǎn)擊關(guān)閉,回到AnalysisManager窗口。接下來就可瀏覽多維數(shù)據(jù)集的數(shù)據(jù)了。OLAP分析聯(lián)機(jī)分析處理(OLAP)是使用多維數(shù)據(jù)表達(dá)式(稱為多維數(shù)據(jù)集)提供對(duì)數(shù)據(jù)倉庫數(shù)據(jù)進(jìn)行快速訪問的常用方法。多維數(shù)據(jù)集為維度表中的數(shù)據(jù)和數(shù)據(jù)倉庫中的事實(shí)數(shù)據(jù)表建立模型,并為客戶端應(yīng)用程序提供完善的查詢和分析

17、功能。四、數(shù)據(jù)倉庫及多維數(shù)據(jù)集其它操作1任務(wù)描述多維數(shù)據(jù)集角色用于定義可以訪問和查詢多維數(shù)據(jù)集的用戶或組,指出其可以訪問的對(duì)象,以及對(duì)這些對(duì)象的訪問類型。角色是保護(hù)多維數(shù)據(jù)集內(nèi)對(duì)象和數(shù)據(jù)安全的主要方法,可以在多維數(shù)據(jù)集的不同粒度級(jí)別上設(shè)置安全性。要定義安全性必須先創(chuàng)建角色,然后向這些角色授予權(quán)限。我們要?jiǎng)?chuàng)建Sales和HR角色分別用于訪問多維數(shù)據(jù)集Sales和HR。Management角色用于管理整個(gè)數(shù)據(jù)倉庫。2設(shè)置數(shù)據(jù)倉庫及多維數(shù)據(jù)集角色及權(quán)限多維數(shù)據(jù)集角色用于定義可以訪問和查詢多維數(shù)據(jù)集的用戶或組,指出其可以訪問的對(duì)象,以及對(duì)這些對(duì)象的訪問類型。角色是保護(hù)多維數(shù)據(jù)集內(nèi)對(duì)象和數(shù)據(jù)安全的主要方

18、法,可以在多維數(shù)據(jù)集的不同粒度級(jí)別上設(shè)置安全性。要定義安全性必須先創(chuàng)建角色,然后向這些角色授予權(quán)限。本例中,我們要?jiǎng)?chuàng)建Sales和HR角色分別用于訪問多維數(shù)據(jù)集Sales和HR。Management角色用于管理整個(gè)數(shù)據(jù)倉庫。具體操作如下:2.1創(chuàng)建多維數(shù)據(jù)集角色:展開“多維數(shù)據(jù)集”文件夾,右擊“Sales”多維數(shù)據(jù)集,并選擇“管理角色”命令,打開“多維數(shù)據(jù)集角色管理器”;目前還沒角色顯示在角色列表中。點(diǎn)擊新建,打開新建角色對(duì)話框,并輸入角色名:Marketing,表示市場(chǎng)部;在“成員資格”選項(xiàng)卡中單擊添加按鈕,接著在“添加用戶和組”對(duì)話框中,添加該角色的網(wǎng)絡(luò)用戶名(如hzm),單擊確定回到新建

19、對(duì)話框框框;其它選項(xiàng)可暫不設(shè)定,直接點(diǎn)確定,回到角色管理器窗口,角色Marketing就已在列表中了。在這里可以看到各個(gè)角色的權(quán)限,也可修改它們的權(quán)限。關(guān)閉角色管理器。然后用同樣的方法創(chuàng)建多維數(shù)據(jù)集HR的角色HR。2.2創(chuàng)建數(shù)據(jù)庫角色:數(shù)據(jù)庫角色是可在數(shù)據(jù)庫范圍內(nèi)使用的角色,可指派給該數(shù)據(jù)庫的一個(gè)或多個(gè)多維數(shù)據(jù)集。本例中我們可以為經(jīng)理創(chuàng)建一個(gè)數(shù)據(jù)庫角色,然后將其指派到Sales和HR兩個(gè)多維數(shù)據(jù)集。具體操作如下:在“教程DW”數(shù)據(jù)庫下右擊“數(shù)據(jù)庫角色”,然后選擇“管理角色”命令,打開“數(shù)據(jù)庫角色管理器”窗口;這里顯示了“教程DW”數(shù)據(jù)庫中現(xiàn)有角色的列表(包括剛建的Marketing和HR多維數(shù)

20、據(jù)集角色);單擊新建,在彈出的對(duì)話框中輸入角色名:Management,然后為該角色添加用戶或組(如admin),并勾選多維數(shù)據(jù)集Sales和HR。最后點(diǎn)擊關(guān)閉退出3查看元數(shù)據(jù)元數(shù)據(jù)是關(guān)于數(shù)據(jù)屬性和數(shù)據(jù)結(jié)構(gòu)的信息,此信息顯示在AnalysisManager右窗格中。查看多維數(shù)據(jù)集的元數(shù)據(jù):展開“多維數(shù)據(jù)集”文件夾,單擊某多維數(shù)據(jù)集,再單擊右窗格的“元數(shù)據(jù)”;查看維度的元數(shù)據(jù):展開“共享維度”文件夾,單擊一個(gè)維度,再單擊右窗格的“元數(shù)據(jù)”。4創(chuàng)建對(duì)策對(duì)策是指由最終用戶啟動(dòng)的、在所選多維數(shù)據(jù)集或其某部分上執(zhí)行的操作。AnalysisServices管理員可以定義以下幾種類型的對(duì)策:命令行、URL、

21、OLEDB語句或多維表達(dá)式(MDX)語句。本例假設(shè)市場(chǎng)部想要針對(duì)上一節(jié)中創(chuàng)建的Sales多維數(shù)據(jù)集,能在分析過程的某一點(diǎn)跳轉(zhuǎn)到Internet,以便能夠搜索并找到關(guān)于某個(gè)特定客戶的信息。操作步驟如下:展開“教程DW”數(shù)據(jù)庫,右擊“Sales”多維數(shù)據(jù)集,然后選擇“編輯”命令,打開多維數(shù)據(jù)集編輯器;右擊“對(duì)策”文件夾,然后選擇“新建對(duì)策”命令,啟動(dòng)對(duì)策向?qū)Вc(diǎn)擊下一步;在“目標(biāo)”框中選擇“此多維數(shù)據(jù)集中的某一維度”,并單擊“Customer”,點(diǎn)擊下一步;保持“對(duì)策類型”列表不變,繼續(xù)單擊下一步;在“定義對(duì)策語法”步驟中鍵入:“ HYPERLINK / /results.asp?q二”+Cust

22、omer.,意思是“通過瀏覽器調(diào)用MSN搜索引擎搜索Customer維度中的當(dāng)前客戶的信息。圖表5對(duì)朿語法圖(6)繼續(xù)單擊下一步,輸入對(duì)策名稱:CustomerInfo,點(diǎn)擊完成。OK!5鉆取本例假設(shè)市場(chǎng)部希望對(duì)商店和客戶按從上到下進(jìn)行分析,最終深化到關(guān)系數(shù)據(jù)庫中的事務(wù)級(jí)別。為此,我們要在Sales多維數(shù)據(jù)集內(nèi)啟用鉆取,然后瀏覽數(shù)據(jù)并深化到事務(wù)。具體操作如下:展開“教程DW”數(shù)據(jù)庫,右擊“Sales”多維數(shù)據(jù)集并選擇“編輯”命令,打開多維數(shù)據(jù)集編輯器;單擊“工具|鉆取選項(xiàng)”菜單命令,打開“鉆取選項(xiàng)”對(duì)話框;選擇“啟用鉆取”復(fù)選框,并單擊全選以選中所有列,然后單擊確定,關(guān)閉對(duì)話框;接下來為不同的

23、角色分配鉆取權(quán)限。右擊“Sales”多維數(shù)據(jù)集,并選擇“管理角色”命令,打開角色管理器;單擊前面創(chuàng)建的“Management”角色,然后在“鉆取”列中單擊.按鈕,打開角色權(quán)限設(shè)置對(duì)話框;選中“允許鉆取”復(fù)選框,然后單擊確定返回角色管理器;這時(shí)可看到“Management”角色已獲得鉆取權(quán)。關(guān)閉角色管理器,回到分析管理器,右擊“Sales”多維數(shù)據(jù)集,并選擇“瀏覽數(shù)據(jù)”命令,打開數(shù)據(jù)瀏覽器;雙擊展開統(tǒng)計(jì)列以顯示不同級(jí)別的聚集數(shù)據(jù)。右擊某數(shù)據(jù)(如USA-CA-Berkeley的銷售額)并選擇“鉆取”命令,稍等將打開明細(xì)數(shù)據(jù)查看窗口,顯示原始數(shù)據(jù)源中的明細(xì)數(shù)據(jù)。MaaehjaeLauaIFioduc

24、iCritetorr-PioductStiIjm:etorr孔ndBaneStoreSaLesSioreCost血ffi育Pa-Ddu-c-t有froduel合計(jì)L.&44.冊(cè)5.GO&5乩畑9GD.kLii音ib4瓦E.E18,43T43+CooIilheOilCoolinE.Oi1咅iJ1BL625.BOT.4E20-Dod.s-Sanets合計(jì)3,920.DT1,59.ME4=1KF.9ZBQCDFi965.5514T251&.2鉆瞬也單元屢性疋EJL1DLB7E.:SillierfTE.BSpica合計(jì)14.215.9單兀計(jì)算51逞.1+Su踽!f去43D.2?比T:=:5.50Pio

25、duct晉計(jì)3tBlE.5:L久匕辭訓(xùn)圖表6鉆取6建立遠(yuǎn)程Internet連接SQLServerAnalysisServices能讓用戶借助客戶端工具,通過Internet連接訪問分析服務(wù)器數(shù)據(jù)庫和多維數(shù)據(jù)集。本示例介紹通過HTTP從Excel連接到分析服務(wù)器并訪問多維數(shù)據(jù)集的操作。具體步驟如下:準(zhǔn)備:在分析服務(wù)器上安裝Web服務(wù)(如IIS),從分析服務(wù)器的bin文件夾中復(fù)制Msolap.asp文件到默認(rèn)站點(diǎn)文件夾(C:Inetpubwwwroot)中;啟動(dòng)客戶端Excel,選擇“數(shù)據(jù)|數(shù)據(jù)透視表和數(shù)據(jù)透視圖報(bào)表”菜單命令;在向?qū)У?步中選擇“外部數(shù)據(jù)源”,然后單擊下一步;在向?qū)У牡?步,單擊

26、獲取數(shù)據(jù),打開“選擇數(shù)據(jù)源”對(duì)話框,然后選擇“OLAP多維數(shù)據(jù)集”選項(xiàng)卡,并選中“新數(shù)據(jù)源”,然后單擊確定;在接下來的對(duì)話框中,輸入數(shù)據(jù)源名稱:RemoteSales,在驅(qū)動(dòng)程序列表中選擇“MicrosoftOLEDBProviderforOLAPServices8.”,然后單擊連接;在接下來的對(duì)話框中,選中“分析服務(wù)器”并輸入U(xiǎn)RL(如http:/Localhost,然后單擊下一步;從連接到的遠(yuǎn)程分析服務(wù)器上選擇數(shù)據(jù)庫列表(如教程DW),然后單擊完成,回到上級(jí)對(duì)話框;選定包含所需數(shù)據(jù)的多維數(shù)據(jù)集(如Sales),然后單擊確定,最后一步點(diǎn)擊完成,回到Excel工作表;(9)接下來就可以在客戶端

27、電子表格中執(zhí)行OLAP了。五、數(shù)據(jù)倉庫高級(jí)操作任務(wù)描述多維數(shù)據(jù)集的數(shù)據(jù)可以存儲(chǔ)在一個(gè)或多個(gè)分區(qū)上,在創(chuàng)建多維數(shù)據(jù)集時(shí)系統(tǒng)會(huì)自動(dòng)為其分配一個(gè)默認(rèn)分區(qū)。合理地將一個(gè)邏輯多維數(shù)據(jù)集劃分為多個(gè)單獨(dú)的物理分區(qū),常??梢愿倪M(jìn)查詢的性能,但不正確地分區(qū)也可能導(dǎo)致錯(cuò)誤。創(chuàng)建分區(qū)多維數(shù)據(jù)集的數(shù)據(jù)可以存儲(chǔ)在一個(gè)或多個(gè)分區(qū)上,在創(chuàng)建多維數(shù)據(jù)集時(shí)系統(tǒng)會(huì)自動(dòng)為其分配一個(gè)默認(rèn)分區(qū)。合理地將一個(gè)邏輯多維數(shù)據(jù)集劃分為多個(gè)單獨(dú)的物理分區(qū),常??梢愿倪M(jìn)查詢的性能,但不正確地分區(qū)也可能導(dǎo)致錯(cuò)誤。為多維數(shù)據(jù)集創(chuàng)建分區(qū)的步驟如下:(1)展開“Sales”多維數(shù)據(jù)集,右擊“分區(qū)”文件夾,然后選擇“新建分區(qū)”命令,打開分區(qū)向?qū)?,單擊下一?/p>

28、;(2)在“指定數(shù)據(jù)源和事實(shí)數(shù)據(jù)表”步驟中,單擊更改,然后選擇“FoodMard”數(shù)據(jù)源的sales_fact_1997表,然后單擊確定;(3)繼續(xù)單擊下一步,在“選擇數(shù)據(jù)切片(可選)”步驟中,選擇“Time”維度,展(4)開“所有Time”級(jí)別并選擇1997,繼續(xù)單擊下一步;(5)在“指定分區(qū)類型”步驟中,選擇“本地”并單擊下一步;完KE(6)輸入分區(qū)名稱:Sales97,并選擇“從現(xiàn)有的分區(qū)(Sales)中復(fù)制聚合設(shè)計(jì)”和“完成時(shí)處理分區(qū)”,最后單擊完成;11笛|定MlLd保垢車fiS什也9r就誅i十汨:K:lM后苒設(shè)計(jì)棗含tyr;肽譏TTfru:Ai竺代攔豈訕i-r:Jii滙唄便f如在持

29、乘合井謹(jǐn)兩泊區(qū).mI:則計(jì)呂冷哲UJq圖表7分區(qū)(7)處理完成后單擊關(guān)閉,97年多維數(shù)據(jù)集將位于另一個(gè)名為Sales97的分區(qū)上了。將來99、2000、的數(shù)據(jù)也可分別存儲(chǔ)在不同的分區(qū)上,這樣既便于管理,也可提高查詢的效率,特別對(duì)大型數(shù)據(jù)集,效果更加明顯。3.創(chuàng)建虛擬多維數(shù)據(jù)集虛擬維度是基于物理維度內(nèi)容的邏輯維度。這些內(nèi)容可以是物理維度中的現(xiàn)有成員屬性,也可以是物理維度的表中的列。使用虛擬維度可基于成員屬性對(duì)多維數(shù)據(jù)集數(shù)據(jù)進(jìn)行分析。其優(yōu)點(diǎn)是不占用磁盤空間或處理時(shí)間。下面創(chuàng)建一個(gè)帶有YearlyIncome(年收入)成員屬性的虛擬維度,然后將這個(gè)新創(chuàng)建的維度添加到Sales多維數(shù)據(jù)集中。操作步驟如

30、下:(1)右擊“共享維度”文件夾,選擇“新建維度|向?qū)А辈藛蚊睿粏螕粝乱徊?,選擇“虛擬維度:另一個(gè)維度的成員屬性”,再單擊下一步;在“選擇帶有成員屬性的維度”步驟中,單擊“Customer”維度,再單擊下一步;在“選擇虛擬維度的級(jí)別步驟中,添加“Lname.YearlyIncome成員屬性后再單擊下一步,在“高級(jí)選項(xiàng)”步驟中直接單擊下一步;在“完成”步驟中,輸入維度名稱“YearlyIncome”;單擊完成。關(guān)閉向?qū)АP陆ǖ奶摂M維度“YearlyIncome已在共享維度列表中了。接下來就可向現(xiàn)有多維數(shù)據(jù)集添加虛擬維度了。4.DTS調(diào)度多維數(shù)據(jù)集處理本例為Sales、HR和ExpenseBud

31、get三多維數(shù)據(jù)集創(chuàng)建自動(dòng)化過程,確保在每天早上3點(diǎn)鐘從OLTP和ERP導(dǎo)入前一天的新增業(yè)務(wù)數(shù)據(jù)。處理完成后再給管理員和關(guān)鍵用戶發(fā)送電子郵件通知他們處理任務(wù)已順利完成。具體操作如下:選擇“開始|程序MicrosoftSQLServer|企業(yè)管理器菜單命令,啟動(dòng)SQLServer企業(yè)管理器;逐級(jí)展開,直到看到“數(shù)據(jù)轉(zhuǎn)換服務(wù)”文件夾下的“本地包”,右擊“本地包”并選擇“新建包”命令,打開DTS包窗口,接下來為2個(gè)多維數(shù)據(jù)集定義處理任務(wù);點(diǎn)擊DTS包窗口的左窗格中的“AnalysisServices處理任務(wù)”圖標(biāo),并將其拖動(dòng)到空白窗格中,彈出“AnalysisServices處理任務(wù)”對(duì)話框;在對(duì)話

32、框中,給第1個(gè)任務(wù)輸入名稱為Sales,并輸入相應(yīng)的描述,如Sales任務(wù);展開樹窗格的“教程DW”數(shù)據(jù)倉庫,單擊“Sales”多維數(shù)據(jù)集,然后在右窗格選擇處(5)理選項(xiàng),選擇“完整處理”;同樣的方法為“HR”多維數(shù)據(jù)集創(chuàng)建另1個(gè)處理任務(wù):HR任務(wù);接下來指定任務(wù)執(zhí)行的順序:按住Ctrl鍵,依次選擇Sales任務(wù)和HR任務(wù),然后選擇“工作流|完成時(shí)”菜單命令;將左窗格中的“發(fā)送電子郵件”圖標(biāo)拖至右窗格中,彈出“發(fā)送郵件任務(wù)屬性”對(duì)話框,設(shè)置好相關(guān)參數(shù)后點(diǎn)確定,然后設(shè)置其處理順序。最后以“Cubes處理”為名保存該包?;氐狡髽I(yè)管理器窗口,剛創(chuàng)建的包位于“本地包”文件夾中,接下來要為該包設(shè)置執(zhí)行時(shí)

33、間;右擊“Cube處理”包,選擇“調(diào)度包”命令,彈出“作業(yè)調(diào)度”對(duì)話框;在“每月”頻率下,設(shè)置“第末一天,每1個(gè)月”,在“每日頻率”下設(shè)置:“一次發(fā)生于:3:00:00AM”,單擊確定;至此,多維數(shù)據(jù)集定期處理任務(wù)已定制完成,可以退出企業(yè)管理器了。OK!5.備份/還原數(shù)據(jù)倉庫5.1以下3種情況可能需要對(duì)數(shù)據(jù)倉庫進(jìn)行存檔:5.1.1創(chuàng)建數(shù)據(jù)倉庫的壓縮備份;數(shù)據(jù)倉庫不再用于日常分析了,先存檔后刪除,以后需要時(shí)還可還原;將數(shù)據(jù)倉庫從一臺(tái)服務(wù)器復(fù)制到另一臺(tái)服務(wù)器。5.1.2具體操作如下:(1)在AnalysisManager樹窗格中右擊“教程DW”,然后單擊“將數(shù)據(jù)庫存檔命令,打開存檔對(duì)話框;(2)輸

34、入存檔文件(.cab)保存位置及文件名,如d:ProgramFilesMicrosoftAnalysisServicesSamples教程.cab,最后點(diǎn)擊存檔。0K!圖表8備份5.2刪除/還原數(shù)據(jù)倉庫在要?jiǎng)h除的數(shù)據(jù)倉庫(如“教程DW”)上右擊,然后選擇“刪除”命令,提示確認(rèn)時(shí)點(diǎn)擊是,該數(shù)據(jù)倉庫將被刪除。刪除數(shù)據(jù)倉庫之前最好先存檔!(2)利用數(shù)據(jù)倉庫的存檔CAB文件可將其還原到任一臺(tái)分析服務(wù)器上。具體操作如下:右擊AnalysisManager的服務(wù)器名,然后選擇“還原數(shù)據(jù)庫”,在接下來的對(duì)話框中選擇存檔文件,最后點(diǎn)擊還原,稍等,存檔的數(shù)據(jù)倉庫就會(huì)被還原。六、數(shù)據(jù)挖掘任務(wù)描述將通過實(shí)例介紹如何

35、創(chuàng)建用于揭示客戶模式的數(shù)據(jù)挖掘模型。這里將創(chuàng)建一個(gè)數(shù)據(jù)挖掘模型以訓(xùn)練銷售數(shù)據(jù),并使用“Microsoft決策樹”算法在客戶群中找出會(huì)員卡選擇模式。將需要挖掘的維度設(shè)置為客戶,將Member_Card屬性設(shè)置為挖掘算法識(shí)別模式的參考信息。然后從人口統(tǒng)計(jì)特征列表中確定模式:婚姻狀況、年收入、在家子女?dāng)?shù)和教育程度。下一步需要訓(xùn)練模型,以便能夠?yàn)g覽樹視圖并從中讀取模式。市場(chǎng)部將根據(jù)這些模式設(shè)計(jì)新的會(huì)員卡,實(shí)際上就是對(duì)會(huì)員卡重新分類創(chuàng)建揭示客戶模式的決策樹挖掘模型展開“多維數(shù)據(jù)集”文件夾,右擊“Sales”多維數(shù)據(jù)集,然后選擇“新建挖掘模型”命令,打開挖掘模型向?qū)?;在“選擇數(shù)據(jù)挖掘技術(shù)”步驟中,選擇“M

36、icrosoft決策樹”,然后單擊下一步;在“選擇事例”步驟中,選擇維度為Customer,級(jí)別選擇Lname,然后單擊下一步;在“選擇被預(yù)測(cè)實(shí)體”步驟中,選擇“事例級(jí)別的成員屬性”,并選擇“MemberCard”,繼續(xù)單擊下一步;(5)在“選擇訓(xùn)練數(shù)據(jù)步驟中,取消Customer維度的Country、StateProvince和City聚集成員前的勾V,繼續(xù)單擊下一步;Brand.KameCustomer口CouiLtryStatePrevinceCityggiLnaine-E|Z1成員雇性C-&rL(i&rMaritaiStatusEducation00S圖表9勾選成員(6)接下來輸入新維

37、度名“CustomerPatterns,“虛擬多維數(shù)據(jù)集名“TrainedCube,繼續(xù)單擊下一步;福型名利型):您吊璽擻什蟲?在最后的步驟輸入模型名“Customerpatternsdiscovery,并選擇“保存并開始處理”,然后單擊完成;C-uxiorTiHrpi-t-Lilixc-o-varrL保存伯在不址理c*-保存井弁姑牡理1X1址理恂鈕細(xì)矣瞿弁用卻g垢訓(xùn)亡卻fa型圖表10模型向?qū)幚硗瓿珊?,單擊關(guān)閉,然后“OLAP挖掘模型編輯器”將打開,最大化編輯器窗口,右窗格中就能看到生成的決策樹。右窗格分為4個(gè)區(qū)域,分別以不同的方式顯示挖掘結(jié)果。決策樹挖掘結(jié)果分析在“內(nèi)容詳情”窗格的決策樹區(qū)

38、域中,顏色深淺代表“事例”的密度點(diǎn)擊某節(jié)點(diǎn)能從“特性”框查看其出現(xiàn)的事例數(shù),從這里還看到不同類型客戶選擇金、銀、銅及普通卡的比例(偏好)情況。樹的第一個(gè)級(jí)別yearlyincome”,說明該屬性的重要性最高(信息增益率最大),其中年收入為35萬的人最多。在右下角設(shè)置“樹顏色基于:Golden,則可方便地看出偏好選擇金卡的客戶群為:年收入15萬以上的已婚簇。從特性框中可以看出其購買金卡的概率達(dá)到45.09%,另外還有47.4%購買了銀卡。再往下展開決策樹可以看到,購買金卡的主要為已婚簇,未婚簇則購買銀卡為主。同樣也可以查看其它卡的客戶類型及分布情況。市場(chǎng)部可以根據(jù)上述決策樹挖掘結(jié)果來確定最可能選擇

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論