版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報告模板PAGE1江西理工大學(xué)應(yīng)用科學(xué)學(xué)院《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報告題目:某超市數(shù)據(jù)集的OLAP分析及數(shù)據(jù)挖掘系別:班級:姓名:二〇一二年六月《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報告模板全文共18頁,當(dāng)前為第1頁。
目錄《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報告模板全文共18頁,當(dāng)前為第1頁。一、建立數(shù)據(jù)倉庫數(shù)據(jù)庫結(jié)構(gòu)和設(shè)置數(shù)據(jù)源 1任務(wù)描述 2建立數(shù)據(jù)倉庫數(shù)據(jù)庫 設(shè)置數(shù)據(jù)源 二、銷售數(shù)據(jù)OLAP分析 任務(wù)描述 設(shè)計(jì)星型架構(gòu)多維數(shù)據(jù)集(Sales) 設(shè)計(jì)存儲和數(shù)據(jù)集處理 OLAP分析 三、人力資源數(shù)據(jù)OLAP分析 任務(wù)描述 設(shè)計(jì)父子維度的多維數(shù)據(jù)集(HR) 修改多維數(shù)據(jù)集(HR)的結(jié)構(gòu) 設(shè)計(jì)存儲和數(shù)據(jù)集處理 OLAP分析 四、數(shù)據(jù)倉庫及多維數(shù)據(jù)集其它操作 任務(wù)描述 設(shè)置數(shù)據(jù)倉庫及多維數(shù)據(jù)集角色及權(quán)限 查看元數(shù)據(jù) 創(chuàng)建對策 鉆取 建立遠(yuǎn)程Internet連接 五、數(shù)據(jù)倉庫高級操作 任務(wù)描述 創(chuàng)建分區(qū) 創(chuàng)建虛擬多維數(shù)據(jù)集 DTS調(diào)度多維數(shù)據(jù)集處理 備份/還原數(shù)據(jù)倉庫 六、數(shù)據(jù)挖掘 任務(wù)描述 創(chuàng)建揭示客戶模式的決策樹挖掘模型 決策樹挖掘結(jié)果分析 創(chuàng)建聚類挖掘模型 聚類挖掘結(jié)果分析 創(chuàng)建基于關(guān)系數(shù)據(jù)表的決策樹挖掘模型 《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報告模板全文共18頁,當(dāng)前為第2頁。瀏覽“相關(guān)性網(wǎng)絡(luò)”視圖 《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報告模板全文共18頁,當(dāng)前為第2頁。PAGE14一、建立數(shù)據(jù)倉庫數(shù)據(jù)庫結(jié)構(gòu)和設(shè)置數(shù)據(jù)源1、任務(wù)描述數(shù)據(jù)倉庫數(shù)據(jù)庫是將要在其中存放多維數(shù)據(jù)集、角色、數(shù)據(jù)源、共享維度和挖掘模型的一種結(jié)構(gòu)。然后跟預(yù)先設(shè)置好的ODBC數(shù)據(jù)源建立連接。2、建立數(shù)據(jù)倉庫數(shù)據(jù)庫展開樹視圖的AnalysisServers;單擊服務(wù)器名或右擊選擇連接,與AnalysisServers建立連接;右擊服務(wù)器名,然后單擊“新建數(shù)據(jù)庫”命令;在“數(shù)據(jù)庫”對話框中輸入數(shù)據(jù)庫名“教程DW”,單擊<確定>;3、設(shè)置數(shù)據(jù)源展開剛創(chuàng)建的“教程DW”數(shù)據(jù)庫,可看到如下項(xiàng)目:數(shù)據(jù)源、多維數(shù)據(jù)集、共享維度、挖掘模型、數(shù)據(jù)庫角色右擊“教程DW”數(shù)據(jù)庫下的“數(shù)據(jù)源”文件夾,然后單擊“新數(shù)據(jù)源”命令;在“數(shù)據(jù)鏈接屬性”對話框中,單擊“提供程序”選項(xiàng)卡,選擇“MicrosoftOLEDBProviderforODBCDrivers”;單擊“連接”選項(xiàng)卡,選擇建好的ODBC數(shù)據(jù)源“FoodMart2000”;單擊<確定>按鈕關(guān)閉“數(shù)據(jù)鏈接屬性”對話框圖表SEQ圖表\*ARABIC1連接數(shù)據(jù)源二、銷售數(shù)據(jù)OLAP分析任務(wù)描述《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報告模板全文共18頁,當(dāng)前為第3頁。以多維方式建立數(shù)據(jù)模型可簡化聯(lián)機(jī)業(yè)務(wù)分析,提高查詢性能。通過創(chuàng)建多維數(shù)據(jù)集,AnalysisManager可將存儲在關(guān)系數(shù)據(jù)庫中的數(shù)據(jù)轉(zhuǎn)換為具有實(shí)際含義并且易于查詢的業(yè)務(wù)信息?!稊?shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報告模板全文共18頁,當(dāng)前為第3頁。設(shè)計(jì)星型架構(gòu)多維數(shù)據(jù)集(Sales)星型架構(gòu)的多維數(shù)據(jù)集由一個事實(shí)數(shù)據(jù)表和鏈接到該事實(shí)數(shù)據(jù)表的多個維度表組成。下面針對FoodMart超市1998年的銷售業(yè)務(wù)數(shù)據(jù),建立一個多維數(shù)據(jù)集,以便按產(chǎn)品和顧客2個主題展開分析。具體操作如下:(1)展開樹窗格的“教程DW”,右擊“多維數(shù)據(jù)集”,選擇“新建多維數(shù)據(jù)集”→“向?qū)А辈藛蚊?,打開如下“多維數(shù)據(jù)集向?qū)А睂υ捒颉?2)向多維數(shù)據(jù)集添加度量值(事實(shí)):(3)單擊<下一步>,在“從數(shù)據(jù)源中選擇事實(shí)數(shù)據(jù)表”步驟中,展開“FoodMart”數(shù)據(jù)源,然后單擊“sales_fact_1998”(4)單擊<下一步>,設(shè)置多維數(shù)據(jù)集的度量值列:store_sales、store_cost、unit_sales;(5)單擊<下一步>,建立維度表。單擊<新建維度>,打開“維度向?qū)А睂υ捒?;向多維數(shù)據(jù)集添加時間維:(1)選擇維度類型為“星型架構(gòu):單個維度表”;(2)單擊<下一步>,選擇維度表“time_by_day”;(3)單擊<下一步>,選擇維度類型為“時間維度”;(4)單擊<下一步>,選擇時間級別為“年、季度、月”;(5)單擊<下一步>,單擊<下一步>,輸入時間維名稱:Time,并設(shè)為“共享”方式,單擊<完成>,OK!向多維數(shù)據(jù)集添加產(chǎn)品維:(1)再次單擊<新建維度>,打開“維度向?qū)А睂υ捒颍?2)選擇創(chuàng)建維度的方式為“雪花架構(gòu):多個相關(guān)維度表”;(3)單擊<下一步>,選擇維度表“Product”和“product_class”;(4)單擊<下一步>,查看連接方式,在這里可刪除不要的連接,添加需要的連接;(5)單擊<下一步>,依次選擇product_category、product_subcategory和brand_name三個維度級別;(6)單擊<下一步>,指定成員鍵列步驟中,不需改變主鍵列;(7)單擊<下一步>,在“高級選項(xiàng)”步驟中,根據(jù)需要選擇;(8)單擊<下一步>,輸入產(chǎn)品維名稱:Product,并設(shè)為“共享”方式,單擊<完成>,OK!向多維數(shù)據(jù)集添加客戶維度:(1)再次單擊<新建維度>,打開“維度向?qū)А睂υ捒颍?2)選擇創(chuàng)建維度的方式為“星型架構(gòu):單個維度表”;(3)單擊<下一步>,選擇維度表“Customer”;(4)單擊<下一步>,選擇維度類型為“標(biāo)準(zhǔn)維度”;(5)單擊<下一步>,依次選擇Country、State_Province、City和lname四個維度級別;(6)單擊<下一步>,指定成員鍵列步驟中,不需改變主鍵列;(7)單擊<下一步>,在“高級選項(xiàng)”步驟中,根據(jù)需要選擇;《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報告模板全文共18頁,當(dāng)前為第4頁。(8)單擊<下一步>,輸入客戶維名稱:Customer,并設(shè)為“共享”方式,單擊<完成>,OK!《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報告模板全文共18頁,當(dāng)前為第4頁。生成多維數(shù)據(jù)集:(1)回到多維數(shù)據(jù)集向?qū)υ捒颍@里已到了新建的4個維度;(2)單擊<下一步>,在“是否計(jì)算事實(shí)數(shù)據(jù)表行數(shù)提問時,單擊<是>,開始計(jì)算。(3)計(jì)算完成后,命名多維數(shù)據(jù)集為:Sales,單擊<完成>,OK!(4)關(guān)閉向?qū)?,隨之啟動多維數(shù)據(jù)集編輯器,其中可看到剛剛創(chuàng)建的多維數(shù)據(jù)集。單擊藍(lán)色或黃色的標(biāo)題欄,對表進(jìn)行排列,使其符合下圖所示的樣子圖表SEQ圖表\*ARABIC2“Sales多維數(shù)據(jù)集編輯器”窗口設(shè)計(jì)存儲和數(shù)據(jù)集處理:設(shè)計(jì)好Sales多維數(shù)據(jù)集的結(jié)構(gòu)之后,需要選擇數(shù)據(jù)的存儲模式(MOLAP、ROLAP或HOLAP),并指定要存儲的預(yù)先計(jì)算好的值的數(shù)量,然后用數(shù)據(jù)填充多維數(shù)據(jù)集。本例選擇MOLAP作為存儲模式,創(chuàng)建Sales多維數(shù)據(jù)集的聚合設(shè)計(jì),然后從ODBC源中裝載數(shù)據(jù)并按照聚合設(shè)計(jì)中的定義計(jì)算匯總值。(1)展開樹窗格,右擊“Sales”多維數(shù)據(jù)集,選擇“設(shè)計(jì)存儲…”菜單命令,彈出“存儲設(shè)計(jì)向?qū)А睂υ捒?;也可在多維數(shù)據(jù)集編輯窗口中選擇“工具|設(shè)計(jì)存儲…”菜單命令,打開“存儲設(shè)計(jì)向?qū)А睂υ捒颍?2)單擊<下一步>,然后選擇“MOLAP”作為數(shù)據(jù)存儲類型;(3)單擊<下一步>,設(shè)置聚合選項(xiàng)為“性能提升達(dá)到”,并輸入“40”(4)單擊<開始>,完成后可看到“性能與大小”圖,從中可看出增加性能提升對使用額外磁盤空間的需求。(5)單擊<下一步>,選擇“立即處理”,并單擊<完成>,系統(tǒng)開始進(jìn)行數(shù)據(jù)處理,處理聚合一般要花費(fèi)較長一些時間。(6)處理完成后點(diǎn)擊<關(guān)閉>,回到AnalysisManager窗口。(7)接下來就可瀏覽多維數(shù)據(jù)集的數(shù)據(jù)了。OLAP分析:《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報告模板全文共18頁,當(dāng)前為第5頁。聯(lián)機(jī)分析處理(OLAP)是使用多維數(shù)據(jù)表達(dá)式(稱為多維數(shù)據(jù)集)提供對數(shù)據(jù)倉庫數(shù)據(jù)進(jìn)行快速訪問的常用方法。多維數(shù)據(jù)集為維度表中的數(shù)據(jù)和數(shù)據(jù)倉庫中的事實(shí)數(shù)據(jù)表建立模型,并為客戶端應(yīng)用程序提供完善的查詢和分析功能?!稊?shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報告模板全文共18頁,當(dāng)前為第5頁。圖表SEQ圖表\*ARABIC3OLAP分析圖三、人力資源數(shù)據(jù)OLAP分析任務(wù)描述:建立一個人力資源(HR)多維數(shù)據(jù)集,以進(jìn)行雇員工資分析。先把Employee維度創(chuàng)建為父子維度,然后使用該維度以及常規(guī)維度來生成HR多維數(shù)據(jù)集設(shè)計(jì)父子維度的多維數(shù)據(jù)集(HR):展開“教程DW”,右擊“共享維度”,選擇“新建維度|向?qū)А辈藛蚊睿蜷_“新建維度向?qū)А睂υ捒?。單?lt;下一步>,選擇維度結(jié)構(gòu)為“父子:單個維度表中相關(guān)的兩列”;單擊<下一步>,選擇維度表employee;單擊<下一步>,選擇employee_id為成員鍵,選擇supervisor_id為父鍵列,選擇full_name為成員名。單擊<下一步>,直到最后一步,輸入維度名稱:employee;單擊<完成>,回到維度編輯器。OK!修改多維數(shù)據(jù)集(HR)的結(jié)構(gòu)展開“教程DW”,右擊“多維數(shù)據(jù)集”,選擇“新建多維數(shù)據(jù)集|向?qū)А辈藛蚊?,打開多維數(shù)據(jù)集向?qū)υ捒?。點(diǎn)擊<下一步>,選擇salary(工資)作事實(shí)數(shù)據(jù)表;點(diǎn)擊<下一步>,選擇salary_paid、vacation_used為度量值列;點(diǎn)擊<下一步>,選擇Employee(雇員)、Store(商店)、Time(時間)作維度;點(diǎn)擊<下一步>,在提示是否計(jì)算事實(shí)數(shù)據(jù)表行數(shù)時選“是”。最后輸入人力資源多維數(shù)據(jù)集的名稱NR,點(diǎn)擊<完成>,OK!回到編輯器窗口,手工建立time_by_day表到salary表的聯(lián)接,再建立store表到employee表中的聯(lián)接,刪除多余的聯(lián)接。最后如下圖所示。設(shè)計(jì)存儲和數(shù)據(jù)集處理《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報告模板全文共18頁,當(dāng)前為第6頁。設(shè)計(jì)好Sales多維數(shù)據(jù)集的結(jié)構(gòu)之后,需要選擇數(shù)據(jù)的存儲模式(MOLAP、ROLAP或HOLAP),并指定要存儲的預(yù)先計(jì)算好的值的數(shù)量,然后用數(shù)據(jù)填充多維數(shù)據(jù)集?!稊?shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報告模板全文共18頁,當(dāng)前為第6頁。本例選擇MOLAP作為存儲模式,創(chuàng)建Sales多維數(shù)據(jù)集的聚合設(shè)計(jì),然后從ODBC源中裝載數(shù)據(jù)并按照聚合設(shè)計(jì)中的定義計(jì)算匯總值。(1)展開樹窗格,右擊“Sales”多維數(shù)據(jù)集,選擇“設(shè)計(jì)存儲…”菜單命令,彈出“存儲設(shè)計(jì)向?qū)А睂υ捒?;也可在多維數(shù)據(jù)集編輯窗口中選擇“工具|設(shè)計(jì)存儲…”菜單命令,打開“存儲設(shè)計(jì)向?qū)А睂υ捒颍?2)單擊<下一步>,然后選擇“MOLAP”作為數(shù)據(jù)存儲類型;(3)單擊<下一步>,設(shè)置聚合選項(xiàng)為“性能提升達(dá)到”,并輸入“40”(4)單擊<開始>,完成后可看到“性能與大小”圖,從中可看出增加性能提升對使用額外磁盤空間的需求。圖表SEQ圖表\*ARABIC4性能與大小(5)單擊<下一步>,選擇“立即處理”,并單擊<完成>,系統(tǒng)開始進(jìn)行數(shù)據(jù)處理,處理聚合一般要花費(fèi)較長一些時間。(6)處理完成后點(diǎn)擊<關(guān)閉>,回到AnalysisManager窗口。(7)接下來就可瀏覽多維數(shù)據(jù)集的數(shù)據(jù)了。OLAP分析聯(lián)機(jī)分析處理(OLAP)是使用多維數(shù)據(jù)表達(dá)式(稱為多維數(shù)據(jù)集)提供對數(shù)據(jù)倉庫數(shù)據(jù)進(jìn)行快速訪問的常用方法。多維數(shù)據(jù)集為維度表中的數(shù)據(jù)和數(shù)據(jù)倉庫中的事實(shí)數(shù)據(jù)表建立模型,并為客戶端應(yīng)用程序提供完善的查詢和分析功能。四、數(shù)據(jù)倉庫及多維數(shù)據(jù)集其它操作任務(wù)描述多維數(shù)據(jù)集角色用于定義可以訪問和查詢多維數(shù)據(jù)集的用戶或組,指出其可以訪問的對象,以及對這些對象的訪問類型。角色是保護(hù)多維數(shù)據(jù)集內(nèi)對象和數(shù)據(jù)安全的主要方法,可以在多維數(shù)據(jù)集的不同粒度級別上設(shè)置安全性。要定義安全性必須先創(chuàng)建角色,然后向這些角色授予權(quán)限?!稊?shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報告模板全文共18頁,當(dāng)前為第7頁。我們要創(chuàng)建Sales和HR角色分別用于訪問多維數(shù)據(jù)集Sales和HR。Management角色用于管理整個數(shù)據(jù)倉庫?!稊?shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報告模板全文共18頁,當(dāng)前為第7頁。 設(shè)置數(shù)據(jù)倉庫及多維數(shù)據(jù)集角色及權(quán)限多維數(shù)據(jù)集角色用于定義可以訪問和查詢多維數(shù)據(jù)集的用戶或組,指出其可以訪問的對象,以及對這些對象的訪問類型。角色是保護(hù)多維數(shù)據(jù)集內(nèi)對象和數(shù)據(jù)安全的主要方法,可以在多維數(shù)據(jù)集的不同粒度級別上設(shè)置安全性。要定義安全性必須先創(chuàng)建角色,然后向這些角色授予權(quán)限。本例中,我們要創(chuàng)建Sales和HR角色分別用于訪問多維數(shù)據(jù)集Sales和HR。Management角色用于管理整個數(shù)據(jù)倉庫。具體操作如下:創(chuàng)建多維數(shù)據(jù)集角色:展開“多維數(shù)據(jù)集”文件夾,右擊“Sales”多維數(shù)據(jù)集,并選擇“管理角色”命令,打開“多維數(shù)據(jù)集角色管理器”;目前還沒角色顯示在角色列表中。點(diǎn)擊<新建…>,打開新建角色對話框,并輸入角色名:Marketing,表示市場部;在“成員資格”選項(xiàng)卡中單擊<添加>按鈕,接著在“添加用戶和組”對話框中,添加該角色的網(wǎng)絡(luò)用戶名(如hzm),單擊<確定>回到新建對話框框框;其它選項(xiàng)可暫不設(shè)定,直接點(diǎn)<確定>,回到角色管理器窗口,角色Marketing就已在列表中了。在這里可以看到各個角色的權(quán)限,也可修改它們的權(quán)限。<關(guān)閉>角色管理器。然后用同樣的方法創(chuàng)建多維數(shù)據(jù)集HR的角色HR。創(chuàng)建數(shù)據(jù)庫角色:數(shù)據(jù)庫角色是可在數(shù)據(jù)庫范圍內(nèi)使用的角色,可指派給該數(shù)據(jù)庫的一個或多個多維數(shù)據(jù)集。本例中我們可以為經(jīng)理創(chuàng)建一個數(shù)據(jù)庫角色,然后將其指派到Sales和HR兩個多維數(shù)據(jù)集。具體操作如下:在“教程DW”數(shù)據(jù)庫下右擊“數(shù)據(jù)庫角色”,然后選擇“管理角色”命令,打開“數(shù)據(jù)庫角色管理器”窗口;這里顯示了“教程DW”數(shù)據(jù)庫中現(xiàn)有角色的列表(包括剛建的Marketing和HR多維數(shù)據(jù)集角色);單擊<新建>,在彈出的對話框中輸入角色名:Management,然后為該角色添加用戶或組(如admin),并勾選多維數(shù)據(jù)集Sales和HR。最后點(diǎn)擊<關(guān)閉>退出 查看元數(shù)據(jù)《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報告模板全文共18頁,當(dāng)前為第8頁。元數(shù)據(jù)是關(guān)于數(shù)據(jù)屬性和數(shù)據(jù)結(jié)構(gòu)的信息,此信息顯示在AnalysisManager右窗格中?!稊?shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報告模板全文共18頁,當(dāng)前為第8頁。查看多維數(shù)據(jù)集的元數(shù)據(jù):展開“多維數(shù)據(jù)集”文件夾,單擊某多維數(shù)據(jù)集,再單擊右窗格的“元數(shù)據(jù)”;查看維度的元數(shù)據(jù):展開“共享維度”文件夾,單擊一個維度,再單擊右窗格的“元數(shù)據(jù)”。 創(chuàng)建對策對策是指由最終用戶啟動的、在所選多維數(shù)據(jù)集或其某部分上執(zhí)行的操作。AnalysisServices管理員可以定義以下幾種類型的對策:命令行、URL、OLEDB語句或多維表達(dá)式(MDX)語句。本例假設(shè)市場部想要針對上一節(jié)中創(chuàng)建的Sales多維數(shù)據(jù)集,能在分析過程的某一點(diǎn)跳轉(zhuǎn)到Internet,以便能夠搜索并找到關(guān)于某個特定客戶的信息。操作步驟如下:(1)展開“教程DW”數(shù)據(jù)庫,右擊“Sales”多維數(shù)據(jù)集,然后選擇“編輯”命令,打開多維數(shù)據(jù)集編輯器;(2)右擊“對策”文件夾,然后選擇“新建對策”命令,啟動對策向?qū)?,點(diǎn)擊<下一步>;(3)在“目標(biāo)”框中選擇“此多維數(shù)據(jù)集中的某一維度”,并單擊“Customer”,點(diǎn)擊<下一步>;(4)保持“對策類型”列表不變,繼續(xù)單擊<下一步>;(5)在“定義對策語法”步驟中鍵入:“/results.asp?q=”+[Customer].,意思是“通過瀏覽器調(diào)用MSN搜索引擎搜索Customer維度中的當(dāng)前客戶的信息。圖表SEQ圖表\*ARABIC5對策語法圖(6)繼續(xù)單擊<下一步>,輸入對策名稱:CustomerInfo,點(diǎn)擊完成。OK! 鉆取 本例假設(shè)市場部希望對商店和客戶按從上到下進(jìn)行分析,最終深化到關(guān)系數(shù)據(jù)庫中的事務(wù)級別。為此,我們要在Sales多維數(shù)據(jù)集內(nèi)啟用鉆取,然后瀏覽數(shù)據(jù)并深化到事務(wù)。具體操作如下:《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報告模板全文共18頁,當(dāng)前為第9頁。(1)展開“教程DW”數(shù)據(jù)庫,右擊“Sales”多維數(shù)據(jù)集并選擇“編輯”命令,打開多維數(shù)據(jù)集編輯器;《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報告模板全文共18頁,當(dāng)前為第9頁。(2)單擊“工具|鉆取選項(xiàng)…”菜單命令,打開“鉆取選項(xiàng)”對話框;(3)選擇“啟用鉆取”復(fù)選框,并單擊<全選>以選中所有列,然后單擊<確定>,關(guān)閉對話框;(4)接下來為不同的角色分配鉆取權(quán)限。(5)右擊“Sales”多維數(shù)據(jù)集,并選擇“管理角色…”命令,打開角色管理器;(6)單擊前面創(chuàng)建的“Management”角色,然后在“鉆取”列中單擊<...>按鈕,打開角色權(quán)限設(shè)置對話框;(7)選中“允許鉆取”復(fù)選框,然后單擊<確定>返回角色管理器;這時可看到“Management”角色已獲得鉆取權(quán)。(8)關(guān)閉角色管理器,回到分析管理器,右擊“Sales”多維數(shù)據(jù)集,并選擇“瀏覽數(shù)據(jù)…”命令,打開數(shù)據(jù)瀏覽器;(9)雙擊展開統(tǒng)計(jì)列以顯示不同級別的聚集數(shù)據(jù)。右擊某數(shù)據(jù)(如USA→CA→Berkeley的銷售額)并選擇“鉆取”命令,稍等將打開明細(xì)數(shù)據(jù)查看窗口,顯示原始數(shù)據(jù)源中的明細(xì)數(shù)據(jù)。圖表SEQ圖表\*ARABIC6鉆取建立遠(yuǎn)程Internet連接SQLServerAnalysisServices能讓用戶借助客戶端工具,通過Internet連接訪問分析服務(wù)器數(shù)據(jù)庫和多維數(shù)據(jù)集。本示例介紹通過HTTP從Excel連接到分析服務(wù)器并訪問多維數(shù)據(jù)集的操作。具體步驟如下:(1)準(zhǔn)備:在分析服務(wù)器上安裝Web服務(wù)(如IIS),從分析服務(wù)器的bin文件夾中復(fù)制Msolap.asp文件到默認(rèn)站點(diǎn)文件夾(C:\Inetpub\wwwroot)中;(2)啟動客戶端Excel,選擇“數(shù)據(jù)|數(shù)據(jù)透視表和數(shù)據(jù)透視圖報表…”菜單命令;(3)在向?qū)У?步中選擇“外部數(shù)據(jù)源”,然后單擊<下一步>;(4)在向?qū)У牡?步,單擊<獲取數(shù)據(jù)>,打開“選擇數(shù)據(jù)源”對話框,然后選擇“OLAP多維數(shù)據(jù)集”選項(xiàng)卡,并選中“<新數(shù)據(jù)源>”,然后單擊<確定>;(5)在接下來的對話框中,輸入數(shù)據(jù)源名稱:RemoteSales,在驅(qū)動程序列表中選擇“MicrosoftOLEDBProviderforOLAPServices8.0”(6)在接下來的對話框中,選中“分析服務(wù)器”并輸入URL(如http://Localhost,然后單擊<下一步>;(7)從連接到的遠(yuǎn)程分析服務(wù)器上選擇數(shù)據(jù)庫列表(如教程DW),然后單擊<完成>,回到上級對話框;《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報告模板全文共18頁,當(dāng)前為第10頁。(8)選定包含所需數(shù)據(jù)的多維數(shù)據(jù)集(如Sales),然后單擊<確定>,最后一步點(diǎn)擊<完成>,回到Excel工作表;《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報告模板全文共18頁,當(dāng)前為第10頁。(9)接下來就可以在客戶端電子表格中執(zhí)行OLAP了。 五、數(shù)據(jù)倉庫高級操作任務(wù)描述多維數(shù)據(jù)集的數(shù)據(jù)可以存儲在一個或多個分區(qū)上,在創(chuàng)建多維數(shù)據(jù)集時系統(tǒng)會自動為其分配一個默認(rèn)分區(qū)。合理地將一個邏輯多維數(shù)據(jù)集劃分為多個單獨(dú)的物理分區(qū),常??梢愿倪M(jìn)查詢的性能,但不正確地分區(qū)也可能導(dǎo)致錯誤。 創(chuàng)建分區(qū)多維數(shù)據(jù)集的數(shù)據(jù)可以存儲在一個或多個分區(qū)上,在創(chuàng)建多維數(shù)據(jù)集時系統(tǒng)會自動為其分配一個默認(rèn)分區(qū)。合理地將一個邏輯多維數(shù)據(jù)集劃分為多個單獨(dú)的物理分區(qū),常??梢愿倪M(jìn)查詢的性能,但不正確地分區(qū)也可能導(dǎo)致錯誤。為多維數(shù)據(jù)集創(chuàng)建分區(qū)的步驟如下:(1)展開“Sales”多維數(shù)據(jù)集,右擊“分區(qū)”文件夾,然后選擇“新建分區(qū)”命令,打開分區(qū)向?qū)В瑔螕?lt;下一步>;(2)在“指定數(shù)據(jù)源和事實(shí)數(shù)據(jù)表”步驟中,單擊<更改>,然后選擇“FoodMard”數(shù)據(jù)源的sales_fact_1997表,然后單擊<確定>;(3)繼續(xù)單擊<下一步>,在“選擇數(shù)據(jù)切片(可選)”步驟中,選擇“Time”維度,展(4)開“所有Time”級別并選擇1997,繼續(xù)單擊<下一步>;(5)在“指定分區(qū)類型”步驟中,選擇“本地”并單擊<下一步>;(6)輸入分區(qū)名稱:Sales97,并選擇“從現(xiàn)有的分區(qū)(Sales)中復(fù)制聚合設(shè)計(jì)”和“完成時處理分區(qū)”,最后單擊<完成>;圖表SEQ圖表\*ARABIC7分區(qū)(7)處理完成后單擊<關(guān)閉>,97年多維數(shù)據(jù)集將位于另一個名為Sales97的分區(qū)上了。將來99、2000、…的數(shù)據(jù)也可分別存儲在不同的分區(qū)上,這樣既便于管理,也可提高查詢的效率,特別對大型數(shù)據(jù)集,效果更加明顯。 創(chuàng)建虛擬多維數(shù)據(jù)集虛擬維度是基于物理維度內(nèi)容的邏輯維度。這些內(nèi)容可以是物理維度中的現(xiàn)有成員屬性,也可以是物理維度的表中的列。使用虛擬維度可基于成員屬性對多維數(shù)據(jù)集數(shù)據(jù)進(jìn)行分析。其優(yōu)點(diǎn)是不占用磁盤空間或處理時間。下面創(chuàng)建一個帶有YearlyIncome(年收入)成員屬性的虛擬維度,然后將這個新創(chuàng)建的維度添加到Sales多維數(shù)據(jù)集中。操作步驟如下:《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報告模板全文共18頁,當(dāng)前為第11頁。右擊“共享維度”文件夾,選擇“新建維度|向?qū)А辈藛蚊?;《?shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報告模板全文共18頁,當(dāng)前為第11頁。單擊<下一步>,選擇“虛擬維度:另一個維度的成員屬性”,再單擊<下一步>;在“選擇帶有成員屬性的維度”步驟中,單擊“Customer”維度,再單擊<下一步>;在“選擇虛擬維度的級別”步驟中,添加“Lname.YearlyIncome”成員屬性后再單擊<下一步>,在“高級選項(xiàng)”步驟中直接單擊<下一步>;在“完成”步驟中,輸入維度名稱“YearlyIncome”;單擊<完成>。關(guān)閉向?qū)?。新建的虛擬維度“YearlyIncome”已在共享維度列表中了。接下來就可向現(xiàn)有多維數(shù)據(jù)集添加虛擬維度了。 DTS調(diào)度多維數(shù)據(jù)集處理 本例為Sales、HR和ExpenseBudget三多維數(shù)據(jù)集創(chuàng)建自動化過程,確保在每天早上3點(diǎn)鐘從OLTP和ERP導(dǎo)入前一天的新增業(yè)務(wù)數(shù)據(jù)。處理完成后再給管理員和關(guān)鍵用戶發(fā)送電子郵件通知他們處理任務(wù)已順利完成。具體操作如下:(1)選擇“開始|程序|MicrosoftSQLServer|企業(yè)管理器”菜單命令,啟動SQLServer企業(yè)管理器;(2)逐級展開,直到看到“數(shù)據(jù)轉(zhuǎn)換服務(wù)”文件夾下的“本地包”,右擊“本地包”并選擇“新建包”命令,打開DTS包窗口,接下來為2個多維數(shù)據(jù)集定義處理任務(wù);(3)點(diǎn)擊DTS包窗口的左窗格中的“AnalysisServices處理任務(wù)”圖標(biāo),并將其拖動到空白窗格中,彈出“AnalysisServices處理任務(wù)”對話框;(4)在對話框中,給第1個任務(wù)輸入名稱為Sales,并輸入相應(yīng)的描述,如Sales任務(wù);展開樹窗格的“教程DW”數(shù)據(jù)倉庫,單擊“Sales”多維數(shù)據(jù)集,然后在右窗格選擇處(5)理選項(xiàng),選擇“完整處理”;(6)同樣的方法為“HR”多維數(shù)據(jù)集創(chuàng)建另1個處理任務(wù):HR任務(wù);(7)接下來指定任務(wù)執(zhí)行的順序:按住<Ctrl>鍵,依次選擇Sales任務(wù)和HR任務(wù),然后選擇“工作流|完成時”菜單命令;(8)將左窗格中的“發(fā)送電子郵件”圖標(biāo)拖至右窗格中,彈出“發(fā)送郵件任務(wù)屬性”對話框,設(shè)置好相關(guān)參數(shù)后點(diǎn)<確定>,然后設(shè)置其處理順序。最后以“Cubes處理”為名保存該包。(9)回到企業(yè)管理器窗口,剛創(chuàng)建的包位于“本地包”文件夾中,接下來要為該包設(shè)置執(zhí)行時間;(10)右擊“Cube處理”包,選擇“調(diào)度包…”命令,彈出“作業(yè)調(diào)度”對話框;在“每月”頻率下,設(shè)置“第末一天,每1個月”,在“每日頻率”下設(shè)置:“一次發(fā)生于:3:00:00AM”,單擊<確定>;(11)至此,多維數(shù)據(jù)集定期處理任務(wù)已定制完成,可以退出企業(yè)管理器了。OK!備份/還原數(shù)據(jù)倉庫5.1以下3種情況可能需要對數(shù)據(jù)倉庫進(jìn)行存檔:5.1.1創(chuàng)建數(shù)據(jù)倉庫的壓縮備份;(1)數(shù)據(jù)倉庫不再用于日常分析了,先存檔后刪除,以后需要時還可還原;(2)將數(shù)據(jù)倉庫從一臺服務(wù)器復(fù)制到另一臺服務(wù)器。5.1.2具體操作如下:《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報告模板全文共18頁,當(dāng)前為第12頁。(1)在AnalysisManager樹窗格中右擊“教程DW”,然后單擊“將數(shù)據(jù)庫存檔”命令,打開存檔對話框;《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報告模板全文共18頁,當(dāng)前為第12頁。(2)輸入存檔文件(.cab)保存位置及文件名,如d:\ProgramFiles\MicrosoftAnalysisServices\Samples\教程.cab,最后點(diǎn)擊<存檔>。OK!圖表SEQ圖表\*ARABIC8備份5.2刪除/還原數(shù)據(jù)倉庫(1)在要刪除的數(shù)據(jù)倉庫(如“教程DW”)上右擊,然后選擇“刪除”命令,提示確認(rèn)時點(diǎn)擊<是>,該數(shù)據(jù)倉庫將被刪除。刪除數(shù)據(jù)倉庫之前最好先存檔!(2)利用數(shù)據(jù)倉庫的存檔CAB文件可將其還原到任一臺分析服務(wù)器上。具體操作如下:右擊AnalysisManager的服務(wù)器名,然后選擇“還原數(shù)據(jù)庫…”,在接下來的對話框中選擇存檔文件,最后點(diǎn)擊<還原>,稍等,存檔的數(shù)據(jù)倉庫就會被還原。 六、數(shù)據(jù)挖掘任務(wù)描述將通過實(shí)例介紹如何創(chuàng)建用于揭示客戶模式的數(shù)據(jù)挖掘模型。這里將創(chuàng)建一個數(shù)據(jù)挖掘模型以訓(xùn)練銷售數(shù)據(jù),并使用“Microsoft決策樹”算法在客戶群中找出會員卡選擇模式。將需要挖掘的維度設(shè)置為客戶,將Member_Card屬性設(shè)置為挖掘算法識別模式的參考信息。然后從人口統(tǒng)計(jì)特征列表中確定模式:婚姻狀況、年收入、在家子女?dāng)?shù)和教育程度。下一步需要訓(xùn)練模型,以便能夠?yàn)g覽樹視圖并從中讀取模式。市場部將根據(jù)這些模式設(shè)計(jì)新的會員卡,實(shí)際上就是對會員卡重新分類 創(chuàng)建揭示客戶模式的決策樹挖掘模型(1)展開“多維數(shù)據(jù)集”文件夾,右擊“Sales”多維數(shù)據(jù)集,然后選擇“新建挖掘模型”命令,打開挖掘模型向?qū)В?2)在“選擇數(shù)據(jù)挖掘技術(shù)”步驟中,選擇“Microsoft決策樹”,然后單擊<下一步>;(3)在“選擇事例”步驟中,選擇維度為Customer,級別選擇Lname,然后單擊<下一步>;《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報告模板全文共18頁,當(dāng)前為第13頁。(4)在“選擇被預(yù)測實(shí)體”步驟中,選擇“事例級別的成員屬性”,并選擇“MemberCard”,繼續(xù)單擊<下一步>;《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報告模板全文共18頁,當(dāng)前為第13頁。(5)在“選擇訓(xùn)練數(shù)據(jù)”步驟中,取消Customer維度的Country、StateProvince和City聚集成員前的勾√,繼續(xù)單擊<下一步>;圖表SEQ圖表\*ARABIC9勾選成員(6)接下來輸入新維度名“CustomerPatterns”,“虛擬多維數(shù)據(jù)集名“TrainedCube”,繼續(xù)單擊<下一步>;(7)在最后的步驟輸入模型名“Customerpatternsdiscovery”,并選擇“保存并開始處理”,然后單擊<完成>;圖表SEQ圖表\*ARABIC10模型向?qū)?8)處理完成后,單擊<關(guān)閉>,然后“OLAP挖掘模型編輯器”將打開,最大化編輯器窗口,右窗格中就能看到生成的決策樹。右窗格分為4個區(qū)域,分別以不同的方式顯示挖掘結(jié)果。 決策樹挖掘結(jié)果分析 (1)在“內(nèi)容詳情”窗格的決策樹區(qū)域中,顏色深淺代表“事例”的密度點(diǎn)擊某節(jié)點(diǎn)能從“特性”框查看其出現(xiàn)的事例數(shù),從這里還看到不同類型客戶選擇金、銀、銅及普通卡的比例(偏好)情況。(2)樹的第一個級別“yearlyincome”,說明該屬性的重要性最高(信息增益率最大),其中年收入為3~5萬的人最多。(3)在右下角設(shè)置“樹顏色基于:Golden”,則可方便地看出偏好選擇金卡的客戶群為:年收入15萬以上的已婚簇。從特性框中可以看出其購買金卡的概率達(dá)到45.09%,另外還有47.4%購買了銀卡。再往下展開決策樹可以看到,購買金卡的主要為已婚簇,未婚簇則購買銀卡為主。(4)同樣也可以查看其它卡的客戶類型及分布情況。《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報告模板全文共18頁,當(dāng)前為第14頁。市場部可以根據(jù)上述決策樹挖掘結(jié)果來確定最可能選擇某種類型卡的客戶的特征。根據(jù)這些特征(年收入、子女?dāng)?shù)、婚姻狀況等),可以重新定義會員卡服務(wù)和方案,以便更好地針對其客戶。《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報告模板全文共18頁,當(dāng)前為第14頁。創(chuàng)建聚類挖掘模型目標(biāo):通過創(chuàng)建聚類挖掘模型將客戶群劃分為不同的邏輯簇。操作步驟如下:(1)右擊“Sales”多維數(shù)據(jù)集,然后選擇“新建挖掘模型”命令,打開新建挖掘模型向?qū)В?2)在“選擇數(shù)據(jù)挖掘技術(shù)”步驟中,選擇“Microsoft聚集”,單擊<下一步>;在“選擇事例”步驟中,選擇維度“Customer”,級別為“Lname”,單擊<下一步>;(3)在“選擇訓(xùn)練數(shù)據(jù)”步聚中,清除“Customer”維度的Country、StateProvince和City復(fù)選框(因?yàn)闆]有必要使用匯總級別劃分客戶群),然后在“度量值”維度中選擇“StoreSales”,單擊<下一步>;(4)輸入挖掘模型的名稱“Customersegmentation”,選中“保存,但現(xiàn)在不處理”,然后單擊<完成>。 聚類挖掘結(jié)果分析通過分析,市場部可以知道:Cluster1主要由中等收入的客戶構(gòu)成,而且全部為單身,每年在FoodMart商店平均花費(fèi)72.42美元,由此可進(jìn)一步采取有針對的營銷策略。同樣可找出Cluster2和Cluster3中的客戶特征。 創(chuàng)建基于關(guān)系數(shù)據(jù)表的決策樹挖掘模型通過建立基于關(guān)系數(shù)據(jù)表的挖掘模型,可以挖掘出更詳細(xì)的信息。具體操作如下:(1)右擊“挖掘模型”文件夾,然后選擇“新建挖掘模型”命令,打開挖掘模型向?qū)В?2)單擊<下一步>,在“選擇源類型”步驟中,單擊“關(guān)系數(shù)據(jù)”,繼續(xù)單擊<下一步>;(3)在“選擇事例表”步驟中,單擊“單個表包含數(shù)據(jù)”并選擇“Customer”,然后單擊<下一步>;(4)選擇挖掘技術(shù)為“Microsoft決策樹”,繼續(xù)<下一步>;(5)選擇“事例鍵列”為“customer_id”,繼續(xù)<下一步>; 瀏覽“相關(guān)性網(wǎng)絡(luò)”視圖《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報告模板全文共18頁,當(dāng)前為第15頁。相關(guān)性網(wǎng)絡(luò)是Microsoft決策樹另一視圖模型,是對樹瀏覽器的補(bǔ)充。樹瀏覽器可以使觀察者的注意力集中在單個特性的詳細(xì)關(guān)系上,而相關(guān)性網(wǎng)絡(luò)則顯示所有特性的高級關(guān)系,給出數(shù)據(jù)中相關(guān)性的俯視圖。《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報告模板全文共18頁,當(dāng)前為第15頁。圖表SEQ圖表\*ARABIC11相關(guān)性瀏覽視圖《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)報告模板全文共18頁,當(dāng)前為第16頁?!稊?shù)據(jù)倉庫與數(shù)據(jù)挖
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 簡歷所學(xué)課程設(shè)計(jì)
- 系統(tǒng)辨識與建模課程設(shè)計(jì)
- 線上蛋糕面包課程設(shè)計(jì)
- 2025湖南省建筑安全員《A證》考試題庫及答案
- 2025湖南省安全員《C證》考試題庫及答案
- 2024年江西省安全員《A證》考試題庫
- 紙杯自助課程設(shè)計(jì)
- 組裝桌子的課程設(shè)計(jì)
- 短片技巧解析課程設(shè)計(jì)
- 石灰石熱分解動力學(xué)研究考核試卷
- 2025年蛇年年度營銷日歷營銷建議【2025營銷日歷】
- 2024年人教版八年級道德與法治下冊期末考試卷(附答案)
- 企業(yè)所得稅匯算清繳申報表電子表格版(帶公式-自動計(jì)算)
- 2024年6月廣東省高中學(xué)業(yè)水平考試物理試卷(附答案)
- Y620優(yōu)眾變頻器說明書
- 明挖明頂方案
- 幼兒園小班生成活動教案20篇
- 講師與平臺的合作協(xié)議
- 空白中心醫(yī)院魚骨圖分析模板
- 不等式在數(shù)學(xué)問題中的應(yīng)用畢業(yè)論文
- 進(jìn)口肉類產(chǎn)品名稱HS編碼及CIQ代碼
評論
0/150
提交評論