已閱讀5頁,還剩21頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
只參考該設(shè)計(jì)報(bào)告的內(nèi)容,主要供同學(xué)們參考微軟數(shù)據(jù)挖掘工具進(jìn)行面向主題的數(shù)據(jù)挖掘過程。具體的課程設(shè)計(jì)內(nèi)容結(jié)構(gòu)及格式規(guī)范,請按照課程設(shè)計(jì)指導(dǎo)書及說明書規(guī)范。這是一篇A類選題的課程設(shè)計(jì)報(bào)告,運(yùn)用各種Microsoft Business Intelligence Development Studio (BIDS)數(shù)據(jù)挖掘軟件進(jìn)行具有背景資料的數(shù)據(jù)主題分析為主,數(shù)據(jù)挖掘報(bào)告主要內(nèi)容應(yīng)具有:確定挖掘主題和方法、數(shù)據(jù)選擇和預(yù)處理、挖掘方法實(shí)現(xiàn)、挖掘數(shù)據(jù)、模式可視化表達(dá)與解釋流程幾部分。此課程設(shè)計(jì)內(nèi)容僅供概念參考,主要明確數(shù)據(jù)分析的大概過程,文章部分結(jié)構(gòu)與本課程說明書規(guī)范并不一致,請同學(xué)們注意,請按照提供的課程設(shè)計(jì)指導(dǎo)書及課程設(shè)計(jì)說明書的規(guī)范來撰寫課程設(shè)計(jì)報(bào)告。蘇州大學(xué)應(yīng)用技術(shù)學(xué)院數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課程設(shè)計(jì)題目(XXX的數(shù)據(jù)挖掘分析報(bào)告)暫定日期(如果題目過長,用兩行顯示)起止日期: 2019 年 11 月 19 日 至 2019 年 11 月 30 日學(xué)生姓名李四一/張三二/李四二班級16級物聯(lián)網(wǎng)1班成績/ /指導(dǎo)教師(簽字)日期不要修改工學(xué)院2017年 6 月 9 日數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課程設(shè)計(jì)課程設(shè)計(jì)分工及成績評定表分工情況說明學(xué)號姓名承擔(dān)主要任務(wù)貢獻(xiàn)等級貢獻(xiàn)由大到小依次為1、2、3、4(貢獻(xiàn)最大的為1,貢獻(xiàn)最小的為4),要求每一等級為1人第一行為該組組長,承擔(dān)主要任務(wù)填寫要詳細(xì),細(xì)化到二級目錄。成績評定表學(xué)號姓名考勤(10%)報(bào)告(60%)答辯成績(30%)分?jǐn)?shù)成績總評成績該表學(xué)號和姓名列由學(xué)生填寫,其余不要填。打印時(shí)刪除此標(biāo)志目 錄一、建立數(shù)據(jù)倉庫數(shù)據(jù)庫結(jié)構(gòu)和設(shè)置數(shù)據(jù)源31. 任務(wù)描述32. 建立數(shù)據(jù)倉庫數(shù)據(jù)庫33. 設(shè)置數(shù)據(jù)源3二、銷售數(shù)據(jù)OLAP分析31. 任務(wù)描述32. 設(shè)計(jì)星型架構(gòu)多維數(shù)據(jù)集(Sales)33. 設(shè)計(jì)存儲和數(shù)據(jù)集處理54. OLAP分析6三、人力資源數(shù)據(jù)OLAP分析61. 任務(wù)描述62. 設(shè)計(jì)父子維度的多維數(shù)據(jù)集(HR)73. 修改多維數(shù)據(jù)集(HR)的結(jié)構(gòu)74. 設(shè)計(jì)存儲和數(shù)據(jù)集處理85. OLAP分析8四、數(shù)據(jù)倉庫及多維數(shù)據(jù)集其它操作81. 任務(wù)描述82. 設(shè)置數(shù)據(jù)倉庫及多維數(shù)據(jù)集角色及權(quán)限83. 查看元數(shù)據(jù)94. 創(chuàng)建對策105. 鉆取116. 建立遠(yuǎn)程 Internet 連接12五、數(shù)據(jù)倉庫高級操作121. 任務(wù)描述122. 創(chuàng)建分區(qū)133. 創(chuàng)建虛擬多維數(shù)據(jù)集134. DTS調(diào)度多維數(shù)據(jù)集處理145. 備份/還原數(shù)據(jù)倉庫 15六、數(shù)據(jù)挖掘151. 任務(wù)描述152. 創(chuàng)建揭示客戶模式的決策樹挖掘模型153. 決策樹挖掘結(jié)果分析164. 創(chuàng)建聚類挖掘模型175. 聚類挖掘結(jié)果分析186. 創(chuàng)建基于關(guān)系數(shù)據(jù)表的決策樹挖掘模型187. 瀏覽“相關(guān)性網(wǎng)絡(luò)”視圖19一、建立數(shù)據(jù)倉庫數(shù)據(jù)庫結(jié)構(gòu)和設(shè)置數(shù)據(jù)源1任務(wù)描述 數(shù)據(jù)倉庫數(shù)據(jù)庫是將要在其中存放多維數(shù)據(jù)集、角色、數(shù)據(jù)源、共享維度和挖掘模型的一種結(jié)構(gòu)。然后跟預(yù)先設(shè)置好的ODBC數(shù)據(jù)源建立連接。2建立數(shù)據(jù)倉庫數(shù)據(jù)庫1) 右擊計(jì)算機(jī)屬性計(jì)算機(jī)名復(fù)制“dzsw129”,開始Microsoft SQL ServerAnalysis ServersAnalysis Manager;2) 右擊Analysis Servers,“注冊服務(wù)器”,粘貼服務(wù)器名“dzsw129”;3) 展開樹視圖的Analysis Servers下的dzsw129; 4) 單擊服務(wù)器名或右擊選擇連接,與Analysis Servers建立連接; 5) 右擊服務(wù)器名,然后單擊“新建數(shù)據(jù)庫”命令; 6) 在“數(shù)據(jù)庫”對話框中輸入數(shù)據(jù)庫名“Winnie”,單擊;7) 展開剛創(chuàng)建的“Winnie”數(shù)據(jù)庫,可看到如下項(xiàng)目:數(shù)據(jù)源、多維數(shù)據(jù)集、共享維度、挖掘模型、數(shù)據(jù)庫角色.3. 設(shè)置數(shù)據(jù)源1) 右擊“Winnie”數(shù)據(jù)庫下的“數(shù)據(jù)源”文件夾,然后單擊“新數(shù)據(jù)源”命令; 2) 在“數(shù)據(jù)鏈接屬性”對話框中,單擊“提供程序”選項(xiàng)卡,選擇“Microsoft OLE DB Provider for ODBC Drivers”;3) 單擊“連接”選項(xiàng)卡,選擇建好的ODBC數(shù)據(jù)源“FoodMart 2000”;4) 單擊按鈕關(guān)閉“數(shù)據(jù)鏈接屬性”對話框。OK! 二、銷售數(shù)據(jù)OLAP分析1任務(wù)描述 以多維方式建立數(shù)據(jù)模型可簡化聯(lián)機(jī)業(yè)務(wù)分析,提高查詢性能。通過創(chuàng)建多維數(shù)據(jù)集,Analysis Manager 可將存儲在關(guān)系數(shù)據(jù)庫中的數(shù)據(jù)轉(zhuǎn)換為具有實(shí)際含義并且易于查詢的業(yè)務(wù)信息。星型架構(gòu)的多維數(shù)據(jù)集由一個(gè)事實(shí)數(shù)據(jù)表和鏈接到該事實(shí)數(shù)據(jù)表的多個(gè)維度表組成。2設(shè)計(jì)星型架構(gòu)多維數(shù)據(jù)集(Sales)下面針對FoodMart2000超市1998年的銷售業(yè)務(wù)數(shù)據(jù),建立一個(gè)多維數(shù)據(jù)集,以便按產(chǎn)品和顧客2個(gè)主題展開分析。具體操作如下:1) 展開樹窗格的“winnie”,右擊“多維數(shù)據(jù)集”,選擇“新建多維數(shù)據(jù)集”“向?qū)А辈藛蚊?,打開如下“多維數(shù)據(jù)集向?qū)А睂υ捒颉?) 向多維數(shù)據(jù)集添加度量值(事實(shí)) :3) 單擊,在“從數(shù)據(jù)源中選擇事實(shí)數(shù)據(jù)表”步驟中,展開“FoodMart2000”數(shù)據(jù)源,然后單擊“sales_fact_1998”; 4) 單擊,設(shè)置多維數(shù)據(jù)集的度量值列: store_sales、store_cost、unit_sales;5) 單擊,建立維度表。單擊,打開“維度向?qū)А睂υ捒颍?向多維數(shù)據(jù)集添加時(shí)間維:1) 選擇維度類型為“星型架構(gòu):單個(gè)維度表”;2) 單擊,選擇維度表“time_by_day”;3) 單擊,選擇維度類型為“時(shí)間維度”;4) 單擊,選擇時(shí)間級別為“年、季度、月”;5) 單擊,單擊,輸入時(shí)間維名稱: Time,并設(shè)為“共享”方式,單擊,OK! 向多維數(shù)據(jù)集添加產(chǎn)品維:1) 再次單擊,打開“維度向?qū)А睂υ捒颍?) 選擇創(chuàng)建維度的方式為“雪花架構(gòu):多個(gè)相關(guān)維度表”; 3) 單擊,選擇維度表“Product”和“product_class”;4) 單擊,查看連接方式,在這里可刪除不要的連接,添加需要的連接;5) 單擊,依次選擇product_category、product_subcategory和brand_name三個(gè)維度級別;6) 單擊,指定成員鍵列步驟中,不需改變主鍵列;7) 單擊,在“高級選項(xiàng)”步驟中,根據(jù)需要選擇;8) 單擊,輸入產(chǎn)品維名稱: Product,并設(shè)為“共享”方式,單擊,OK! 向多維數(shù)據(jù)集添加客戶維度:1) 再次單擊,打開“維度向?qū)А睂υ捒颍?) 選擇創(chuàng)建維度的方式為“星型架構(gòu):單個(gè)維度表”; 3) 單擊,選擇維度表“Customer”;4) 單擊,選擇維度類型為“標(biāo)準(zhǔn)維度”;5) 單擊,依次選擇Country、State_Province、City和lname四個(gè)維度級別;6) 單擊,指定成員鍵列步驟中,不需改變主鍵列;7) 單擊,在“高級選項(xiàng)”步驟中,根據(jù)需要選擇;8) 單擊,輸入客戶維名稱: Customer,并設(shè)為“共享”方式,單擊,OK! 向多維數(shù)據(jù)集添加商店維:1) 再次單擊,打開“維度向?qū)А睂υ捒颍?) 選擇創(chuàng)建維度的方式為“星型架構(gòu):單個(gè)維度表”; 3) 單擊,選擇維度表“Store”;4) 單擊,選擇維度類型為“標(biāo)準(zhǔn)維度”;5) 單擊,依次選擇store_country、store_state、store_city和store_name四個(gè)維度級別;6) 單擊,指定成員鍵列步驟中,不需改變主鍵列;7) 單擊,在“高級選項(xiàng)”步驟中,根據(jù)需要選擇;8) 單擊,輸入商店維名稱: Store,并設(shè)為“共享”方式,單擊,OK! 生成多維數(shù)據(jù)集:1) 回到多維數(shù)據(jù)集向?qū)υ捒?,這里已到了新建的4個(gè)維度;2) 單擊,在“是否計(jì)算事實(shí)數(shù)據(jù)表行數(shù)提問時(shí),單擊,開始計(jì)算。 3) 計(jì)算完成后,命名多維數(shù)據(jù)集為:Sales,單擊,OK!4) 關(guān)閉向?qū)?,隨之啟動多維數(shù)據(jù)集編輯器,其中可看到剛剛創(chuàng)建的多維數(shù)據(jù)集。單擊藍(lán)色或黃色的標(biāo)題欄,對表進(jìn)行排列,使其符合下圖所示的樣子: 向多維數(shù)據(jù)集Sales中添加維度:1) 選擇“插入|表”菜單命令,彈出“選擇表”對話框; 2) 選擇“promotion”表,單擊,然后單擊“關(guān)閉”; 3) 右擊“promotion”表中的“promotion_name”列,然后選擇“作為維度插入”命令,一個(gè) 名為“promotion Name”的維度就建好了,該維度為非共享的。 4) 在樹窗格中重命名剛插入的維度為“Promotion”。5) 關(guān)閉編輯器,保存修改。3設(shè)計(jì)存儲和處理多維數(shù)據(jù)集 1) 展開樹窗格,右擊“Sales”多維數(shù)據(jù)集,選擇“設(shè)計(jì)存儲”菜單命令,彈出“存儲設(shè)計(jì)向?qū)А睂υ捒?;也可在多維數(shù)據(jù)集編輯窗口中選擇“工具|設(shè)計(jì)存儲”菜單命令,打開“存儲設(shè)計(jì)向?qū)А睂υ捒颍?2) 單擊,然后選擇“MOLAP”作為數(shù)據(jù)存儲類型 ;3) 單擊,設(shè)置聚合選項(xiàng)為“性能提升達(dá)到”,并輸入“40”作為指定百分比,以此優(yōu)化能力平衡查詢性能和存儲空間大小。4) 單擊,完成后可看到“性能與大小”圖,從中可看出增加性能提升對使用額外磁盤空間的需求。5) 單擊,選擇“立即處理”,并單擊,系統(tǒng)開始進(jìn)行數(shù)據(jù)處理,處理聚合一般要花費(fèi)較長一些時(shí)間。6) 處理完成后如圖:7) 然后點(diǎn)擊,回到Analysis Manager窗口。8) 接下來就可瀏覽多維數(shù)據(jù)集的數(shù)據(jù)了。 4OLAP分析瀏覽“salary”多維數(shù)據(jù)集,通過瀏覽數(shù)據(jù)發(fā)現(xiàn),所有的customer人數(shù)為1,079,147.47人,Canada人為98,045.46人,Mexico人為430,293.59,USA人為550,808.55。其中在高收入水平中,USA的比例比較大,其次是Mexico。三、人力資源數(shù)據(jù)OLAP分析1任務(wù)描述 以進(jìn)行雇員工資分析。先把Employee維度創(chuàng)建為父子維度,然后使用該維度以及常規(guī)維度來生成HR多維數(shù)據(jù)集。父子維度的多維數(shù)據(jù)集單個(gè)維度表中相關(guān)的兩列,其中一列確定維度的成員,另一列確定成員的父代。2設(shè)計(jì)父子維度的多維數(shù)據(jù)集(HR)1) 展開“winnie”,右擊“共享維度”,選擇“新建維度|向?qū)А辈藛蚊?,打開“新建維度向?qū)А睂υ捒颉?) 單擊,選擇維度結(jié)構(gòu)為“父子:單個(gè)維度表中相關(guān)的兩列”;3) 單擊,選擇維度表 employee;4) 單擊,選擇employee_id為成員鍵,選擇supervisor_id為父鍵列,選擇full_name為成員名。5) 單擊,直到最后一步,輸入維度名稱: employee;6) 單擊,回到維度編輯器。OK!3修改多維數(shù)據(jù)集(HR)的結(jié)構(gòu)1) 展開“winnie”,右擊“多維數(shù)據(jù)集”,選擇“新建多維數(shù)據(jù)集|向?qū)А辈藛蚊睿蜷_多維數(shù)據(jù)集向?qū)υ捒颉?) 點(diǎn)擊,選擇salary(工資)作事實(shí)數(shù)據(jù)表;3) 點(diǎn)擊,選擇salary_paid、vacation_used為度量值列;4) 點(diǎn)擊,選擇Employee(雇員)、Store(商店)、Time(時(shí)間)作維度;5) 點(diǎn)擊,在提示是否計(jì)算事實(shí)數(shù)據(jù)表行數(shù)時(shí)選“是”。最后輸入人力資源多維數(shù)據(jù)集的名稱NR,點(diǎn)擊,OK!6) 回到編輯器窗口,手工建立time_by_day表到salary表的聯(lián)接,再建立 store表到employee表中的聯(lián)接,刪除多余的聯(lián)接。最后如下圖所示。4設(shè)計(jì)存儲和數(shù)據(jù)集處理1) 展開樹窗格,右擊“HR”多維數(shù)據(jù)集,選擇“設(shè)計(jì)存儲”菜單命令,彈出“存儲設(shè)計(jì)向?qū)А睂υ捒颍灰部稍诙嗑S數(shù)據(jù)集編輯窗口中選擇“工具|設(shè)計(jì)存儲”菜單命令,打開“存儲設(shè)計(jì)向?qū)А睂υ捒颍?) 單擊,然后選擇“MOLAP”作為數(shù)據(jù)存儲類型 ;3) 單擊,設(shè)置聚合選項(xiàng)為“性能提升達(dá)到”,并輸入“40”作為指定百分比,以此優(yōu)化能力平衡查詢性能和存儲空間大小。4) 單擊,完成后可看到“性能與大小”圖,從中可看出增加性能提升對使用額外磁盤空間的需求。5) 單擊,選擇“立即處理”,并單擊,系統(tǒng)開始進(jìn)行數(shù)據(jù)處理,處理聚合一般要花費(fèi)較長一些時(shí)間。6) 處理完成后點(diǎn)擊,回到Analysis Manager窗口。5OLAP分析瀏覽“HR”多維數(shù)據(jù)集,通過瀏覽數(shù)據(jù)發(fā)現(xiàn),所有部門的人員一共為616人,其中Store Temporary Check部門中的人數(shù)最多,占143人,其次是Store Temporary Store部門,占140人。最少的為HQ Human Resources部門,只有一個(gè)人,其次是HQ Information System部門和HQ Marketing部門,都有3個(gè)人。在雇傭薪水中,總工資為39431.67美元。其中HQ General Management部門薪水最高,平均每人465美元,而最低的為Store Temporary Check部門,平均每人的薪水為40.由此說明,人數(shù)最多部門,都是底層收入水平。底層收入的人為多數(shù)。四、數(shù)據(jù)倉庫及多維數(shù)據(jù)集其它操作1任務(wù)描述多維數(shù)據(jù)集角色用于定義可以訪問和查詢多維數(shù)據(jù)集的用戶或組,指出其可以訪問的對象,以及對這些對象的訪問類型。角色是保護(hù)多維數(shù)據(jù)集內(nèi)對象和數(shù)據(jù)安全的主要方法,可以在多維數(shù)據(jù)集的不同粒度級別上設(shè)置安全性。要定義安全性必須先創(chuàng)建角色,然后向這些角色授予權(quán)限。我們要創(chuàng)建Sales和HR角色分別用于訪問多維數(shù)據(jù)集Sales和HR。Management角色用于管理整個(gè)數(shù)據(jù)倉庫。 2設(shè)置數(shù)據(jù)倉庫及多維數(shù)據(jù)集角色及權(quán)限創(chuàng)建多維數(shù)據(jù)集角色:1) 展開“多維數(shù)據(jù)集”文件夾,右擊“Sales”多維數(shù)據(jù)集,并選擇“管理角色”命令,打開“多維數(shù)據(jù)集角色管理器”;2) 目前還沒角色顯示在角色列表中。點(diǎn)擊,打開新建角色對話框,并輸入角色名:Marketing,表示市場部;3) 在“成員資格”選項(xiàng)卡中單擊按鈕,接著在“添加用戶和組”對話框中,添加該角色的網(wǎng)絡(luò)用戶名(如:AdminIstrator),單擊回到新建對話框框框;4) 其它選項(xiàng)可暫不設(shè)定,直接點(diǎn),回到角色管理器窗口,角色Marketing就已在列表中了。在這里可以看到各個(gè)角色的權(quán)限,也可修改它們的權(quán)限。5) 角色管理器。然后用同樣的方法創(chuàng)建多維數(shù)據(jù)集HR的角色HR。創(chuàng)建數(shù)據(jù)庫角色: 1) 在“winnie”數(shù)據(jù)庫下右擊“數(shù)據(jù)庫角色”,然后選擇“管理角色”命令,打開“數(shù)據(jù)庫角色管理器”窗口;2) 這里顯示了“winnie”數(shù)據(jù)庫中現(xiàn)有角色的列表(包括剛建的Marketing和HR多維數(shù)據(jù)集角色);3) 單擊,在彈出的對話框中輸入角色名:Management,然后為該角色添加用戶或組(如admin),并勾選多維數(shù)據(jù)集Sales和HR。最后點(diǎn)擊退出。3查看元數(shù)據(jù)元數(shù)據(jù)是關(guān)于數(shù)據(jù)屬性和數(shù)據(jù)結(jié)構(gòu)的信息,此信息顯示在 Analysis Manager 右窗格中。1) 查看多維數(shù)據(jù)集的元數(shù)據(jù):展開“多維數(shù)據(jù)集”文件夾,單擊某多維數(shù)據(jù)集(如:Sales),再單擊右窗格的“元數(shù)據(jù)”;得到如圖:2) 查看維度的元數(shù)據(jù):展開“共享維度”文件夾,單擊一個(gè)維度,再單擊右窗格的“元數(shù)據(jù)”。 跟上面耳朵步驟一樣。4創(chuàng)建對策1) 展開“winnie”數(shù)據(jù)庫,右擊“Sales”多維數(shù)據(jù)集,然后選擇“編輯”命令,打開多維數(shù)據(jù)集編輯器;2) 右擊“對策”文件夾,然后選擇“新建對策”命令,啟動對策向?qū)?,點(diǎn)擊; 3) 在“目標(biāo)”框中選擇“此多維數(shù)據(jù)集中的某一維度”,并單擊“Customer”,點(diǎn)擊 ;4) 保持“對策類型”列表不變,繼續(xù)單擊;5) 在“定義對策語法”步驟中鍵入:”/results.asp?q=” + C,意思是“通過瀏覽器調(diào)用MSN 搜索引擎搜索Customer維度中的當(dāng)前客戶的信息。6) 繼續(xù)單擊,輸入對策名稱:Customer Info,點(diǎn)擊完成。OK!下面是觸發(fā)對策的操作步驟:1) 展開“winnie”數(shù)據(jù)庫,右擊“Sales”多維數(shù)據(jù)集,選擇“瀏覽數(shù)據(jù)”命令,打開“多維數(shù)據(jù)集瀏覽器”窗口;2) 雙擊,逐級展開Customer,直到顯示某客戶(如USACALos AngelesJohnson)為止,然后在該客戶上右單并選擇“Customer Info”對策,這時(shí)瀏覽器將啟動并打開搜索頁:/results.asp?q=Johnson,以便在Internet上搜索客戶Johnson的信息。3) 其它對策的創(chuàng)建和觸發(fā)過程類似。 對策結(jié)果如下:5鉆取1) 展開“winnie”數(shù)據(jù)庫,右擊“Sales”多維數(shù)據(jù)集并選擇“編輯”命令,打開多維數(shù)據(jù)集編輯器;2) 單擊“工具|鉆取選項(xiàng)”菜單命令,打開“鉆取選項(xiàng)”對話框;3) 選擇“啟用鉆取”復(fù)選框,并單擊以選中所有列,然后單擊,關(guān)閉對話框; 4) 接下來為不同的角色分配鉆取權(quán)限。5) 右擊“Sales”多維數(shù)據(jù)集,并選擇“管理角色”命令,打開角色管理器;6) 單擊前面創(chuàng)建的“Management”角色,然后在“鉆取”列中單擊 按鈕,打開角色權(quán)限設(shè)置對話框;7) 選中“允許鉆取”復(fù)選框,然后單擊返回角色管理器; 8) 這時(shí)可看到“Management”角色已獲得鉆取權(quán)。9) 關(guān)閉角色管理器,回到分析管理器,右擊“Sales”多維數(shù)據(jù)集,并選擇“瀏覽數(shù)據(jù)”命令,打開數(shù)據(jù)瀏覽器; 10) 雙擊展開統(tǒng)計(jì)列以顯示不同級別的聚集數(shù)據(jù)。右擊某數(shù)據(jù)(如USACABerkeley的銷售額)并選擇“鉆取”命令,稍等將打開明細(xì)數(shù)據(jù)查看窗口,顯示原始數(shù)據(jù)源中的明細(xì)數(shù)據(jù)。OK!6建立遠(yuǎn)程 Internet 連接SQL Server Analysis Services 能讓用戶借助客戶端工具,通過Internet連接訪問分析服務(wù)器數(shù)據(jù)庫和多維數(shù)據(jù)集。具體步驟如下:1) 準(zhǔn)備:進(jìn)入C盤;2) 啟動客戶端 Excel,選擇“數(shù)據(jù)|數(shù)據(jù)透視表和數(shù)據(jù)透視圖報(bào)表”菜單命令; 3) 在向?qū)У?步中選擇“外部數(shù)據(jù)源”,然后單擊; 4) 在向?qū)У牡?步,單擊,打開“選擇數(shù)據(jù)源”對話框,然后選擇“OLAP多維數(shù)據(jù)集”選項(xiàng)卡,并選中“”,然后單擊;5) 在接下來的對話框中,輸入數(shù)據(jù)源名稱:RemoteSales,在驅(qū)動程序列表中選擇“Microsoft OLE DB Provider for OLAP Services 8.0”,然后單擊;6) 在接下來的對話框中,選中“分析服務(wù)器”并輸入U(xiǎn)RL(如 http:/Localhost,然后單擊;7) 從連接到的遠(yuǎn)程分析服務(wù)器上選擇數(shù)據(jù)庫列表(如Winnie),然后單擊,回到上級對話框; 8) 選定包含所需數(shù)據(jù)的多維數(shù)據(jù)集(如Sales),然后單擊,最后一步點(diǎn)擊,回到Excel工作表;9) 接下來就可以在客戶端電子表格中執(zhí)行OLAP了。 五、數(shù)據(jù)倉庫高級操作1任務(wù)描述將企業(yè)數(shù)據(jù)拆分為操作環(huán)境數(shù)據(jù)和分析環(huán)境數(shù)據(jù)后,歷史數(shù)據(jù)就可歸并到分析環(huán)境的數(shù)據(jù)倉庫中以便于進(jìn)行決策分析,可專用于各種復(fù)雜分析,為高層決策者服務(wù)。2創(chuàng)建分區(qū)1) 展開“Sales”多維數(shù)據(jù)集,右擊“分區(qū)”文件夾,然后選擇“新建分區(qū)”命令,打開分區(qū)向?qū)?,單擊?) 在“指定數(shù)據(jù)源和事實(shí)數(shù)據(jù)表”步驟中,單擊,然后選擇“FoodMart”數(shù)據(jù)源的sales_fact_1997表,然后單擊; 3) 繼續(xù)單擊,在“選擇數(shù)據(jù)切片(可選)”步驟中,選擇“Time”維度,展開“所有Time”級別并選擇1997,繼續(xù)單擊; 4) 在“指定分區(qū)類型”步驟中,選擇“本地”并單擊; 5) 輸入分區(qū)名稱:Sales 97,并選擇“從現(xiàn)有的分區(qū)(Sales)中復(fù)制聚合設(shè)計(jì)”和“完成時(shí)處理分區(qū)”,最后單擊;進(jìn)行處理。6) 處理完成后單擊,97年多維數(shù)據(jù)集將位于另一個(gè)名為Sales 97的分區(qū)上了。將來99、2000、的數(shù)據(jù)也可分別存儲在不同的分區(qū)上,這樣既便于管理,也可提高查詢的效率,特別對大型數(shù)據(jù)集,效果更加明顯。3創(chuàng)建虛擬多維數(shù)據(jù)集1) 展開FoodMart 2000數(shù)據(jù)倉庫,右擊“多維數(shù)據(jù)集”文件夾并選擇“新建虛擬多維數(shù)據(jù)集”命令,打開向?qū)В?2) 單擊,選擇虛擬多維數(shù)據(jù)集要包括的邏輯多維數(shù)據(jù)集:Sales、Warehouse,然后單擊;3) 選擇虛擬多維數(shù)據(jù)集的度量值:Store Sales、Warehouse Cost,繼續(xù)單擊;4) 選擇虛擬多維數(shù)據(jù)集的維度:Warehouse、Time、Store,繼續(xù)單擊;5) 最后輸入虛擬多維數(shù)據(jù)集名:Cost versus Sales,選擇“立即處理”并單擊。處理完成后將打開虛擬多維數(shù)據(jù)集編輯器,在這里可對其修改設(shè)置,也可瀏覽其數(shù)據(jù)。6) 關(guān)閉編輯器回到管理器,在新建的虛擬多維數(shù)據(jù)集Cost versus Sales上右擊選擇“瀏覽數(shù)據(jù)”,即可在獨(dú)立的瀏覽窗口OLAP,操作與邏輯多維數(shù)據(jù)集一樣,但它并不占據(jù)磁盤空間,類似于數(shù)據(jù)庫視圖。4、DTS調(diào)度多維數(shù)據(jù)集處理1) 選擇“開始|程序|Microsoft SQL Server|企業(yè)管理器”菜單命令,啟動SQL Server企業(yè)管理器;2) 逐級展開,直到看到“數(shù)據(jù)轉(zhuǎn)換服務(wù)”文件夾下的“本地包”,右擊“本地包”并選擇“新建包”命令,打開DTS包窗口,接下來為2個(gè)多維數(shù)據(jù)集定義處理任務(wù);3) 點(diǎn)擊DTS包窗口的左窗格中的“Analysis Services處理任務(wù)”圖標(biāo),并將其拖動到空白窗格中,彈出“Analysis Services 處理任務(wù)”對話框; 4) 在對話框中,給第1個(gè)任務(wù)輸入名稱為Sales,并輸入相應(yīng)的描述,如Sales任務(wù);5) 展開樹窗格的“winnie”數(shù)據(jù)倉庫,單擊“Sales”多維數(shù)據(jù)集,然后在右窗格選擇處理選項(xiàng),選擇“完整處理”;6) 同樣的方法為“HR”多維數(shù)據(jù)集創(chuàng)建另1個(gè)處理任務(wù):HR任務(wù);7) 接下來指定任務(wù)執(zhí)行的順序:按住鍵,依次選擇Sales任務(wù)和HR任務(wù),然后選擇“工作流|完成時(shí)”菜單命令;8) 將左窗格中的“發(fā)送電子郵件”圖標(biāo)拖至右窗格中,彈出“發(fā)送郵件任務(wù)屬性”對話框,設(shè)置好相關(guān)參數(shù)后點(diǎn),然后設(shè)置其處理順序。最后以“Cubes處理”為名保存該包。9) 回到企業(yè)管理器窗口,剛創(chuàng)建的包位于“本地包”文件夾中,接下來要為該包設(shè)置執(zhí)行時(shí)間;10) 右擊“Cube處理”包,選擇“調(diào)度包”命令,彈出“作業(yè)調(diào)度”對話框;11) 在“每月”頻率下,設(shè)置“第末一天,每1個(gè)月”,在“每日頻率”下設(shè)置:“一次發(fā)生于:3:00:00AM”,單擊;OK!5備份/還原數(shù)據(jù)倉庫具體操作如下:1) 在Analysis Manager樹窗格中右擊“Winnie”,然后單擊“將數(shù)據(jù)庫存檔”命令,打開存檔對話框;2) 輸入存檔文件(.cab)保存位置及文件名,如d:Program FilesMicrosoft Analysis ServicesSampleswinnie.cab,最后點(diǎn)擊。刪除/還原數(shù)據(jù)倉庫1) 在要刪除的數(shù)據(jù)倉庫(如“Winnie”)上右擊,然后選擇“刪除”命令,提示確認(rèn)時(shí)點(diǎn)擊,該數(shù)據(jù)倉庫將被刪除。刪除數(shù)據(jù)倉庫之前最好先存檔!2) 利用數(shù)據(jù)倉庫的存檔CAB文件可將其還原到任一臺分析服務(wù)器上。具體操作如下:右擊Analysis Manager 的服務(wù)器名,然后選擇“還原數(shù)據(jù)庫”,在接下來的對話框中選擇存檔文件,最后點(diǎn)擊,稍等,存檔的數(shù)據(jù)倉庫就會被還原。六、數(shù)據(jù)挖掘1任務(wù)描述將需要挖掘的維度設(shè)置為客戶,將Member_Card屬性設(shè)置為挖掘算法識別模式的參考信息。然后從人口統(tǒng)計(jì)特征列表中確定模式:婚姻狀況、年收入、在家子女?dāng)?shù)和教育程度。下一步需要訓(xùn)練模型,以便能夠?yàn)g覽樹視圖并從中讀取模式。市場部將根據(jù)這些模式設(shè)計(jì)新的會員卡,實(shí)際上就是對會員卡重新分類。2創(chuàng)建揭示客戶模式的數(shù)據(jù)挖掘模型 1) 展開“多維數(shù)據(jù)集”文件夾,右擊“Sales”多維數(shù)據(jù)集,然后選擇“新建挖掘模型”命令,打開挖掘模型向?qū)В?) 在“選擇數(shù)據(jù)挖掘技術(shù)”步驟中,選擇“Microsoft決策樹”,然后單擊;3) 在“選擇事例”步驟中,選擇維度為Customer, 級別選擇Lname,然后單擊;4) 在“選擇被預(yù)測實(shí)體”步驟中,選擇“事例級別的成員屬性”,并選擇“Member Card”,繼續(xù)單擊;5) 在“選擇訓(xùn)練數(shù)據(jù)”步驟中,取消Customer維度的Country、State Province和City聚集成員前的勾,繼續(xù)單擊;6) 接下來輸入新維度名“Customer Patterns”, “虛擬多維數(shù)據(jù)集名“Trained Cube”,繼續(xù)單擊;7) 在最后的步驟輸入模型名“Customer patterns discovery”,并選擇“保存并開始處理”,然后單擊;8) 處理完成后,單擊,然后“OLAP挖掘模型編輯器”將打開,最大化 編輯器窗口,右窗格中就能看到生成的決策樹。右窗格分為4個(gè)區(qū)域,分別以不同的方式顯示挖掘結(jié)果。3決策樹挖掘結(jié)果分析說明該屬性的重要性最高(信息增益率最大),其中年收入為35萬的人最多。從下特性框中可以看出其購買金卡的概率達(dá)到44.44%,另外還有48.15%購買了銀卡。其中他們的年收入多數(shù)為大于15萬,再往下展開決策樹可以看到,購買金卡的主要為已婚簇,未婚簇則購買銀卡為主。在所有調(diào)查的人數(shù)中,年收入為3萬5萬的人數(shù)最多,在這群人中,購買銅卡的人數(shù)占72.97%,在家中孩子的數(shù)量大多數(shù)=2.25.在普通卡中,年收入1萬3萬的低收入人數(shù)較多。4創(chuàng)建聚類挖掘模型 1) 右擊“Sales”多維數(shù)據(jù)集,然后選擇“新建挖掘模型”命令,打開新建挖掘模型向?qū)В?) 在“選擇數(shù)據(jù)挖掘技術(shù)”步驟中,選擇“Microsoft聚集”,單擊;3) 在“選擇事例”步驟中,選擇維度“Customer”,級別為“Lname”,單擊;4) 在“選擇訓(xùn)練數(shù)據(jù)”步聚中,清除“Customer”維度的Country、State Province和City復(fù)選框(因?yàn)闆]有必要使用匯總級別劃分客戶群),然后在“度量值”維度中選擇“Store Sales”,單擊;5) 輸入挖掘模型的名稱“Customer segmentation”,選中“保存,但現(xiàn)在不處理”,然后單擊。 6) 進(jìn)入挖掘模型編輯器,在這里還可對模型的相關(guān)參數(shù)作進(jìn)一步修改。展開屬性窗格,將“Cluster Count”的值由10改為3。7) 保存更改,然后選擇“工具 | 處理挖掘模型”菜單命令,處理完成之后就可看到聚集的結(jié)果了。8) 聚類結(jié)果窗口由4個(gè)窗格組成:中間是“內(nèi)容詳情”窗格, 以樹形圖顯示聚類結(jié)果;“內(nèi)容選擇區(qū)”窗格顯示樹的完整視圖;其下是“特性”窗格,可以查看各簇的統(tǒng)計(jì)特性,還可以選擇不同的成員屬性進(jìn)行查看;再下面是“節(jié)點(diǎn)路徑”,列出了各簇的節(jié)點(diǎn)路徑。5、聚類挖掘結(jié)果分析通過分析,市場部可以知道:Cluster1主要由中等收入的客戶構(gòu)成, 其中年收入為1萬5萬為55.47%,用Bronze card最多,占43.11%,而且全部已婚。Cluster2主要由中等收入的客戶構(gòu)成,其中年收入為3萬5萬為64.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024月子中心產(chǎn)后康復(fù)與美容護(hù)膚服務(wù)合同范本3篇
- 2025年桉樹苗木綠色種植與可持續(xù)發(fā)展合同2篇
- 2024無人機(jī)買賣合同協(xié)議
- 專業(yè)委托經(jīng)營協(xié)作合同(2024年版)版B版
- 2024外墻涂料施工質(zhì)量責(zé)任保險(xiǎn)合同范本3篇
- 專業(yè)勞務(wù)分包協(xié)議范本(2024)版B版
- 2025年金融科技參股合作合同書樣本2篇
- 2024年度新能源汽車充電設(shè)施投資建設(shè)合同3篇
- 2024年網(wǎng)絡(luò)游戲虛擬物品銷售合同
- 2024文藝巡回演出項(xiàng)目風(fēng)險(xiǎn)管理與服務(wù)保障合同3篇
- 2024中國工業(yè)品電商采購白皮書
- 公安機(jī)關(guān)保密協(xié)議
- 蛇年金蛇賀歲
- 人教版九年級數(shù)學(xué)上冊全冊同步練習(xí)
- 2024年中國社會科學(xué)院外國文學(xué)研究所專業(yè)技術(shù)人員招聘3人歷年高頻難、易錯(cuò)點(diǎn)500題模擬試題附帶答案詳解
- 第8課《列夫-托爾斯泰》公開課一等獎創(chuàng)新教學(xué)設(shè)計(jì)
- 職業(yè)咖啡比賽方案策劃書
- 人教版2024-2025學(xué)年七年級數(shù)學(xué)上冊計(jì)算題專項(xiàng)訓(xùn)專題09運(yùn)用運(yùn)算律簡便運(yùn)算(計(jì)算題專項(xiàng)訓(xùn)練)(學(xué)生版+解析)
- 2023年二輪復(fù)習(xí)解答題專題十七:二次函數(shù)的應(yīng)用(銷售利潤問題)(原卷版+解析)
- 《ISO56001-2024創(chuàng)新管理體系 - 要求》之26:“9績效評價(jià)-9.3管理評審”解讀和應(yīng)用指導(dǎo)材料(雷澤佳編制-2024)
- GB 26134-2024乘用車頂部抗壓強(qiáng)度
評論
0/150
提交評論