




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘?qū)嶒?yàn)指導(dǎo)書(shū)一、 課程簡(jiǎn)介及基本要求數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘是專(zhuān)業(yè)教學(xué)計(jì)劃中一門(mén)專(zhuān)業(yè)選修課,是綜合性和實(shí)踐性都很強(qiáng)的課程,它是研究數(shù)據(jù)倉(cāng)庫(kù)技術(shù)與數(shù)據(jù)挖掘技術(shù)的一門(mén)重要課程。它著重介紹數(shù)據(jù)倉(cāng)庫(kù)原理、聯(lián)機(jī)分析處理、數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)與開(kāi)發(fā)、數(shù)據(jù)倉(cāng)庫(kù)的決策支持應(yīng)用、數(shù)據(jù)挖掘原理等基本知識(shí)。通過(guò)學(xué)習(xí)本課程使學(xué)生初步掌握數(shù)據(jù)倉(cāng)庫(kù)技術(shù)與數(shù)據(jù)挖掘技術(shù)的基礎(chǔ)理論與專(zhuān)業(yè)技術(shù),具備從數(shù)據(jù)資源提取信息與知識(shí)并進(jìn)行輔助決策的基本能力。課程主要內(nèi)容有:數(shù)據(jù)倉(cāng)庫(kù)原理、聯(lián)機(jī)分析處理、數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)與開(kāi)發(fā)、數(shù)據(jù)倉(cāng)庫(kù)的決策支持應(yīng)用、數(shù)據(jù)挖掘原理、信息論的決策樹(shù)方法、集合論的粗糙集方法、關(guān)聯(lián)規(guī)則、公式發(fā)現(xiàn)、神經(jīng)網(wǎng)絡(luò)、遺傳算法、
2、文本挖掘與Web挖掘,以及數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的發(fā)展。學(xué)生學(xué)習(xí)本課程之后,應(yīng)達(dá)到下列要求:1了解數(shù)據(jù)管理技術(shù)從數(shù)據(jù)庫(kù)到數(shù)據(jù)倉(cāng)庫(kù)的發(fā)展過(guò)程。2掌握數(shù)據(jù)倉(cāng)庫(kù)的定義、特點(diǎn)和研究數(shù)據(jù)倉(cāng)庫(kù)的必要性。3掌握數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu)和聯(lián)機(jī)分析處理的概念4掌握數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織、數(shù)據(jù)預(yù)處理與規(guī)劃管理5掌握數(shù)據(jù)倉(cāng)庫(kù)規(guī)劃、設(shè)計(jì)、管理的基本方法6掌握數(shù)據(jù)挖掘的基本概念及與數(shù)據(jù)倉(cāng)庫(kù)的關(guān)系7熟悉聚類(lèi)分析、分類(lèi)發(fā)現(xiàn)和關(guān)聯(lián)規(guī)則等數(shù)據(jù)挖掘算法的使用環(huán)境、算法特點(diǎn),并能進(jìn)行算法復(fù)雜性的分析。8認(rèn)識(shí)數(shù)據(jù)挖掘的發(fā)展趨勢(shì)和應(yīng)用前景9能夠在實(shí)踐中應(yīng)用數(shù)據(jù)倉(cāng)庫(kù)技術(shù)和應(yīng)用數(shù)據(jù)挖掘的方法。二、 課程實(shí)驗(yàn)?zāi)康囊髷?shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘課程上機(jī)練習(xí),是理論
3、教學(xué)之后的深化和補(bǔ)充,具有較強(qiáng)的實(shí)踐性,是本課程的重要環(huán)節(jié)。通過(guò)實(shí)驗(yàn)教學(xué)環(huán)節(jié),對(duì)學(xué)生進(jìn)行實(shí)踐技能和科學(xué)研究方法的訓(xùn)練,鞏固其在課堂上所學(xué)書(shū)本知識(shí),加深對(duì)商務(wù)智能的基本概念,基本原理和分析方法的理解,掌握商務(wù)智能的核心基礎(chǔ)技術(shù)與工具,并能運(yùn)用典型的商務(wù)智能工具處理,解決一些實(shí)際問(wèn)題。同時(shí),通過(guò)實(shí)踐教學(xué)活動(dòng),拓寬學(xué)生的知識(shí)領(lǐng)域,鍛煉學(xué)生的實(shí)踐技能,培養(yǎng)科學(xué)嚴(yán)謹(jǐn)、求真務(wù)實(shí)的工作作風(fēng)。通過(guò)實(shí)驗(yàn)教學(xué)應(yīng)達(dá)到以下基本要求:1理解數(shù)據(jù)倉(cāng)庫(kù)的工作機(jī)理及其構(gòu)建過(guò)程。2掌握典型的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)及其開(kāi)發(fā)工具的使用。3理解OLAP的工作原理與流程,掌握典型OLAP工具的操作與使用方法。4理解數(shù)據(jù)挖掘的工作原理與流程,掌握
4、典型數(shù)據(jù)挖掘技術(shù)及其工具的使用方法。三、 適用專(zhuān)業(yè) 信息管理與信息系統(tǒng)專(zhuān)業(yè)四、 主要儀器設(shè)備計(jì)算機(jī)局域網(wǎng),在服務(wù)器與客戶(hù)端安裝MS SQL Server 系統(tǒng)及其Analysis Services系統(tǒng)。五、考核與報(bào)告1學(xué)生按上機(jī)階段要求上交上機(jī)報(bào)告。指導(dǎo)教師根據(jù)學(xué)生在上機(jī)過(guò)程中的出勤情況、設(shè)計(jì)表現(xiàn)、上機(jī)報(bào)告內(nèi)容等方面進(jìn)行綜合評(píng)定。2綜合上機(jī)過(guò)程中的出勤和獨(dú)立工作能力及表現(xiàn)情況占30%,實(shí)際完成情況占35%,綜合設(shè)計(jì)報(bào)告占35%,指導(dǎo)教師給出綜合上機(jī)成績(jī)。3上機(jī)成績(jī)按比例計(jì)入數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘課程學(xué)期總成績(jī)。實(shí)驗(yàn)一、數(shù)據(jù)倉(cāng)庫(kù)的基本操作1實(shí)驗(yàn)?zāi)康模?1)建立系統(tǒng)數(shù)據(jù)源連接,并應(yīng)用Analysis
5、Server工具建立數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)源(2)察看、編輯數(shù)據(jù)倉(cāng)庫(kù)的基本模型2實(shí)驗(yàn)步驟:1.1建立系統(tǒng)數(shù)據(jù)源連接數(shù)據(jù)源包含訪(fǎng)問(wèn)一個(gè)對(duì)象源數(shù)據(jù)所需的信息。 如何設(shè)置系統(tǒng)數(shù)據(jù)源名稱(chēng)(DSN)1. Microsoft® Windows NT® 4.0 用戶(hù):?jiǎn)螕簟伴_(kāi)始”按鈕,指向“設(shè)置”,單擊“控制面板”,然后雙擊“數(shù)據(jù)源 (ODBC)”。 Windows® 2000 用戶(hù):?jiǎn)螕簟伴_(kāi)始”按鈕,指向“設(shè)置”,單擊“控制面板”,然后雙擊“管理工具”,再雙擊“數(shù)據(jù)源 (ODBC)”。 2. 在“系統(tǒng) DSN”選項(xiàng)卡上單擊“添加”按鈕。 3. 選擇“Microsoft Access
6、驅(qū)動(dòng)程序 (*.mdb)”,然后單擊“完成”按鈕。 4. 在“數(shù)據(jù)源名”框中,輸入“教程”,然后在“數(shù)據(jù)庫(kù)”下,單擊“選擇”。 5. 在“選擇數(shù)據(jù)庫(kù)”對(duì)話(huà)框中,瀏覽到“C:Program FilesMicrosoft Analysis ServicesSamples”,然后單擊“FoodMart 2000.mdb”。單擊“確定”按鈕。 6. 在“ODBC Microsoft Access 安裝”對(duì)話(huà)框中單擊“確定”按鈕。 7. 在“ODBC 數(shù)據(jù)源管理器”對(duì)話(huà)框中單擊“確定”按鈕。1.2啟動(dòng) Analysis ManagerAnalysis Manager 是一個(gè)在 Microsoft
7、4; 管理控制臺(tái) (MMC) 上運(yùn)行的管理單元程序。 如何啟動(dòng) Analysis Manager· 單擊“開(kāi)始”按鈕,依次指向“程序”、“Microsoft SQL Server”和“Analysis Services”,然后單擊“Analysis Manager”。 1.3建立數(shù)據(jù)庫(kù)和數(shù)據(jù)源 現(xiàn)在即可以開(kāi)始使用 Analysis Manager! 如何建立數(shù)據(jù)庫(kù)結(jié)構(gòu)1. 在 Analysis Manager 樹(shù)視圖中展開(kāi)“Analysis Servers”。 2. 單擊服務(wù)器名稱(chēng),即可建立與 Analysis Servers 的連接。 3. 右擊服務(wù)器名稱(chēng),然后單擊“新建數(shù)據(jù)庫(kù)”命
8、令。 4. 在“數(shù)據(jù)庫(kù)”對(duì)話(huà)框中的“數(shù)據(jù)庫(kù)名稱(chēng)”框中,輸入“教程”,然后單擊“確定”按鈕。 5. 在 Analysis Manager 樹(shù)窗格中展開(kāi)服務(wù)器,然后展開(kāi)剛才創(chuàng)建的“教程”數(shù)據(jù)庫(kù)。新的“教程”數(shù)據(jù)庫(kù)包含下列項(xiàng)目: · 數(shù)據(jù)源 · 多維數(shù)據(jù)集 · 共享維度 · 挖掘模型 · 數(shù)據(jù)庫(kù)角色然后,建立到“教程”數(shù)據(jù)源中的示例數(shù)據(jù)的連接。教程中的全部練習(xí)都將使用這個(gè)示例。 在 Analysis Manager 中建立一個(gè)數(shù)據(jù)源,將數(shù)據(jù)庫(kù)連接到在 ODBC 數(shù)據(jù)源管理器中建立的系統(tǒng)數(shù)據(jù)源名稱(chēng) (DSN) 上。在建立多維數(shù)據(jù)集的過(guò)程中,所有的數(shù)據(jù)都
9、將來(lái)自這個(gè)源。如何建立數(shù)據(jù)源1. 在 Analysis Manager 樹(shù)窗格中,右擊“教程”數(shù)據(jù)庫(kù)下的“數(shù)據(jù)源”文件夾,然后單擊“新數(shù)據(jù)源”命令。 2. 在“數(shù)據(jù)鏈接屬性”對(duì)話(huà)框中,單擊“提供者”選項(xiàng)卡,然后單擊“Microsoft OLE DB Provider for ODBC Drivers”。 3. 單擊“連接”選項(xiàng)卡,然后從“使用數(shù)據(jù)源名稱(chēng)”列表中單擊“教程”。 4. 單擊“測(cè)試連接”以確保一切工作正常。在“Microsoft 數(shù)據(jù)鏈接”對(duì)話(huà)框中應(yīng)出現(xiàn)一條消息,說(shuō)明連接成功。在消息框中單擊“確定”按鈕。 5. 單擊“確定”按鈕關(guān)閉“數(shù)據(jù)鏈接屬性”對(duì)話(huà)框。1.4建立多維數(shù)據(jù)集多維數(shù)據(jù)
10、集是數(shù)據(jù)的一種多維結(jié)構(gòu)。多維數(shù)據(jù)集由維度和度量值的集合進(jìn)行定義。 如何打開(kāi)多維數(shù)據(jù)集向?qū)?#183; 在 Analysis Manager 樹(shù)窗格中,“教程”數(shù)據(jù)庫(kù)下,右擊“多維數(shù)據(jù)集”文件夾,單擊“新建多維數(shù)據(jù)集”菜單,然后單擊“向?qū)А泵睢?如何向多維數(shù)據(jù)集添加度量值度量值是要進(jìn)行分析的數(shù)據(jù)庫(kù)中的量化值。常用的度量值為銷(xiāo)售、成本和預(yù)算數(shù)據(jù)。度量值根據(jù)多維數(shù)據(jù)集不同的維度類(lèi)別進(jìn)行分析。 1. 在多維數(shù)據(jù)集向?qū)У摹皻g迎”步驟,單擊“下一步”按鈕。 2. 在“從數(shù)據(jù)源中選擇事實(shí)數(shù)據(jù)表”步驟,展開(kāi)“教程”數(shù)據(jù)源,然后單擊“sales_fact_1998”。 3. 單擊“瀏覽數(shù)據(jù)”按鈕可以查看“sa
11、les_fact_1998”表中的數(shù)據(jù)。數(shù)據(jù)瀏覽完畢后,關(guān)閉“瀏覽數(shù)據(jù)”窗口,然后單擊“下一步”按鈕。 4. 若要定義多維數(shù)據(jù)集的度量值,在“事實(shí)數(shù)據(jù)表數(shù)據(jù)列”下,雙擊“store_sales”。對(duì)“store_cost”和“unit_sales”列重復(fù)此步驟,然后單擊“下一步”按鈕。 如何建立時(shí)間維度1. 在向?qū)У摹斑x擇多維數(shù)據(jù)集的維度”步驟,單擊“新建維度”命令。此操作將調(diào)用維度向?qū)А?2. 在“歡迎”步驟,單擊“下一步”按鈕。 3. 在“選擇維度的創(chuàng)建方式”步驟,選擇“星型架構(gòu):?jiǎn)蝹€(gè)維度表”選項(xiàng),然后單擊“下一步”按鈕。 4. 在“選擇維度表”步驟,單擊“time_by_day”。單擊“
12、瀏覽數(shù)據(jù)”按鈕可以查看包含在“time_by_day”表中的數(shù)據(jù)。 查看完“time_by_day”表后,單擊“下一步”按鈕。 5. 在“選擇維度類(lèi)型”步驟,選擇“時(shí)間維度”選項(xiàng),然后單擊“下一步”按鈕。 6. 接下來(lái),將定義維度的級(jí)別。在“創(chuàng)建時(shí)間維度級(jí)別”步驟,單擊“選擇時(shí)間級(jí)別”,單擊“年、季度、月”,然后單擊“下一步”按鈕。 7. 在“選擇高級(jí)選項(xiàng)”步驟,單擊“下一步”按鈕。 8. 在向?qū)У淖詈笠徊?,輸入“Time”作為新維度的名稱(chēng)。注意: 使用“與其它多維數(shù)據(jù)集共享此維度”復(fù)選框,可以指定此維度是共享的,還是專(zhuān)用的。該復(fù)選框位于屏幕的左下角。 保持該復(fù)選框的選中狀態(tài)。7. 單擊“完成
13、”返回到多維數(shù)據(jù)集向?qū)А?8. 在多維數(shù)據(jù)集向?qū)е?,現(xiàn)在應(yīng)能在“多維數(shù)據(jù)集維度”列表中看到“Time”維度。 如何建立產(chǎn)品維度1. 再次單擊“新建維度”命令。在“歡迎進(jìn)入維度向?qū)А辈襟E,單擊“下一步”按鈕。 2. 在“選擇創(chuàng)建維度的方式”步驟,選擇“雪花架構(gòu): 多個(gè)相關(guān)維度表”選項(xiàng),然后單擊“下一步”按鈕。 3. 在“選擇維度表”步驟,雙擊“Product”和“product_class”將它們添加到“選定的表”。單擊“下一步”按鈕。 4. 在維度向?qū)У摹皠?chuàng)建和編輯聯(lián)接”步驟,顯示在上一步選定的兩個(gè)表以及它們之間的聯(lián)接。單擊“下一步”按鈕。 5. 若要定義維度的級(jí)別,在“可用的列”下,按順序雙
14、擊“product_category”、“product_subcategory”和“brand_name”。 雙擊每列后,其名稱(chēng)顯示在“維度級(jí)別”下。在選擇了所有三列后,單擊“下一步”按鈕。 6. 在“指定成員鍵列”步驟,單擊“下一步”按鈕。 7. 在“選擇高級(jí)選項(xiàng)”步驟,單擊“下一步”按鈕。 8. 在向?qū)У淖詈笠徊?,在“維度名稱(chēng)”框中,輸入“Product”,并保持“與其它多維數(shù)據(jù)集共享此維度”復(fù)選框?yàn)檫x中狀態(tài)。單擊“完成”按鈕。 9. 現(xiàn)在應(yīng)能在“多維數(shù)據(jù)集維度”列表中看到“Product”維度。如何建立客戶(hù)維度1. 單擊“新建維度”命令。 2. 在“歡迎”步驟,單擊“下一步”按鈕。 3
15、. 在“選擇創(chuàng)建維度的方式”步驟,選擇“星型架構(gòu): 單個(gè)維度表”選項(xiàng),然后單擊“下一步”按鈕。 4. 在“選擇維度表”步驟,單擊“Customer”,然后單擊“下一步”按鈕。 5. 在“選擇維度類(lèi)型”步驟,單擊“下一步”按鈕。 6. 若要定義維度的級(jí)別,在“可用列”下,按順序雙擊“Country”、“State_Province”、“City”和“l(fā)name”列。 雙擊每一列后,其名稱(chēng)將顯示在“維度級(jí)別”下方。選擇完所有四個(gè)列之后,單擊“下一步”按鈕。 7. 在“指定成員鍵列”步驟,單擊“下一步”按鈕。 8. 在“選擇高級(jí)選項(xiàng)”步驟,單擊“下一步”按鈕。 9. 在向?qū)У淖詈笠徊剑凇熬S度名稱(chēng)”
16、框中,輸入“Customer”。保持“與其它多維數(shù)據(jù)集共享此維度”復(fù)選框的選中狀態(tài)。單擊“完成”按鈕。 10. 在多維數(shù)據(jù)集向?qū)е?,現(xiàn)在應(yīng)能在“多維數(shù)據(jù)集維度”列表中看到“Customer”維度。 如何生成商店維度1. 單擊“新建維度”命令。 2. 在“歡迎”步驟,單擊“下一步”按鈕。 3. 在“選擇創(chuàng)建維度的方式”步驟,選擇“星型架構(gòu): 單個(gè)維度表”選項(xiàng),然后單擊“下一步”按鈕。 4. 在“選擇維度表”步驟,單擊“Store”,然后單擊“下一步”按鈕。 5. 在“選擇維度表”步驟,單擊“Store”,然后單擊“下一步”按鈕。 6. 若要定義維度的級(jí)別,在“可用列”下,按順序雙擊“store_
17、country”、“store_state”、“store_city”和“store_name”列。 雙擊每一列之后,其名稱(chēng)將顯示在“維度級(jí)別”框下。選擇了所有四個(gè)列之后,單擊“下一步”按鈕。 7. 在“指定成員鍵列”步驟,單擊“下一步”按鈕。 8. 在“選擇高級(jí)選項(xiàng)”步驟,單擊“下一步”按鈕。 9. 在向?qū)У淖詈笠徊?,在“維度名稱(chēng)”框中,輸入“Store”,并保持“與其它多維數(shù)據(jù)集共享此維度”復(fù)選框的選中狀態(tài)。單擊“完成”按鈕。 10. 在多維數(shù)據(jù)集向?qū)е校F(xiàn)在應(yīng)能在“多維數(shù)據(jù)集維度”列表中看到“Store”維度。如何完成多維數(shù)據(jù)集的生成1. 在多維數(shù)據(jù)集向?qū)е?,單擊“下一步”按鈕。 2.
18、在“事實(shí)數(shù)據(jù)表行數(shù)”消息給出提示時(shí),單擊“是”按鈕。 3. 在多維數(shù)據(jù)集向?qū)У淖詈笠徊?,將多維數(shù)據(jù)集命名為“Sales”,然后單擊“完成”按鈕。 4. 向?qū)㈥P(guān)閉并隨之啟動(dòng)多維數(shù)據(jù)集編輯器,其中包含剛剛創(chuàng)建的多維數(shù)據(jù)集。單擊藍(lán)色或黃色的標(biāo)題欄,對(duì)表進(jìn)行排列。 注意: 無(wú)須關(guān)閉多維數(shù)據(jù)集編輯器;在本教程的下一節(jié)將編輯該多維數(shù)據(jù)集。如果需要現(xiàn)在退出教程,請(qǐng)?jiān)陉P(guān)閉多維數(shù)據(jù)集之前先保存更改,并在出現(xiàn)其它提示時(shí),一律選擇“否”。 1.5編輯多維數(shù)據(jù)集使用多維數(shù)據(jù)集編輯器可以對(duì)現(xiàn)有多維數(shù)據(jù)集進(jìn)行更改。 如何在多維數(shù)據(jù)集編輯器內(nèi)編輯多維數(shù)據(jù)集可以使用以下兩種方法啟用多維數(shù)據(jù)集編輯器:
19、3; 在 Analysis Manager 樹(shù)窗格中右擊一個(gè)現(xiàn)有的多維數(shù)據(jù)集,然后單擊“編輯”命令。-或者-· 使用多維數(shù)據(jù)集編輯器直接創(chuàng)建新的多維數(shù)據(jù)集。除非您是高級(jí)用戶(hù),否則不建議使用本方法。如果您是從上一節(jié)的操作接著下來(lái)的,則應(yīng)該已經(jīng)在多維數(shù)據(jù)集編輯器中。 在多維數(shù)據(jù)集編輯器的“架構(gòu)”窗格中,可以看到事實(shí)數(shù)據(jù)表(黃色標(biāo)題欄)及聯(lián)接的維度表(藍(lán)色標(biāo)題欄)。在多維數(shù)據(jù)集編輯器樹(shù)窗格中,可以在層次樹(shù)中預(yù)覽多維數(shù)據(jù)集的結(jié)構(gòu)。通過(guò)單擊左窗格中底部的“屬性”按鈕,可以編輯多維數(shù)據(jù)集的屬性。 如何向現(xiàn)有多維數(shù)據(jù)集添加維度此時(shí),您可能需要一個(gè)新維度以提供有關(guān)產(chǎn)品促銷(xiāo)的數(shù)據(jù)。在多維數(shù)據(jù)集編輯器內(nèi)
20、可以方便地生成該維度。注意:默認(rèn)情況下,在多維數(shù)據(jù)集編輯器中生成的維度為專(zhuān)用維度,即只能用于當(dāng)前所處理的多維數(shù)據(jù)集,而不能與其它多維數(shù)據(jù)集共享。它們不顯示在 Analysis Manager 樹(shù)視圖中的“共享維度”文件夾中。當(dāng)通過(guò)維度向?qū)?chuàng)建此類(lèi)維度時(shí),可以使其在多維數(shù)據(jù)集之間共享。 1. 在多維數(shù)據(jù)集編輯器中,在“插入”菜單上單擊“表”命令。 2. 在“選擇表”對(duì)話(huà)框中,單擊“promotion”表,單擊“添加”按鈕,然后單擊“關(guān)閉”按鈕。 3. 若要定義新的維度,請(qǐng)雙擊“promotion”表中的“promotion_name”列。 4. 在“映射列”對(duì)話(huà)框中選擇“維度”選項(xiàng),然后單擊“確
21、定”按鈕。 5. 在樹(shù)視圖中選擇“Promotion Name”維度。 6. 在“編輯”菜單中單擊“重命名”命令。 7. 鍵入“Promotion”,按 ENTER 鍵。 8. 保存所做的更改。 9. 關(guān)閉多維數(shù)據(jù)集編輯器。當(dāng)系統(tǒng)提示您是否設(shè)計(jì)存儲(chǔ)時(shí),單擊“否”。您將在下節(jié)中設(shè)計(jì)存儲(chǔ)。 1.6設(shè)計(jì)存儲(chǔ)和處理多維數(shù)據(jù)集可以設(shè)計(jì)多維數(shù)據(jù)集中的數(shù)據(jù)和聚合的存儲(chǔ)選項(xiàng)。在使用或?yàn)g覽多維數(shù)據(jù)集中的數(shù)據(jù)之前,必須先進(jìn)行處理。 如何使用存儲(chǔ)設(shè)計(jì)向?qū)гO(shè)計(jì)存儲(chǔ)1. 在 Analysis Manager 樹(shù)窗格中,在“教程”數(shù)據(jù)庫(kù)下展開(kāi)“多維數(shù)據(jù)集”文件夾,右擊“Sales”多維數(shù)據(jù)集,然后單擊“編輯”命令。 2.
22、 在“歡迎”步驟中單擊“下一步”按鈕。 3. 選擇“MOLAP”作為數(shù)據(jù)存儲(chǔ)類(lèi)型,然后單擊“下一步”按鈕。 4. 在“設(shè)置聚合選項(xiàng)”下單擊“性能提升達(dá)到”。在此框中輸入“40”作為指定百分比。 此操作指示 Analysis Services 將性能提升到 40%,而不管需要多大的磁盤(pán)空間。管理員可以用此優(yōu)化能力平衡查詢(xún)性能需求和存儲(chǔ)聚合數(shù)據(jù)所需磁盤(pán)空間大小。5. 單擊“啟動(dòng)”按鈕。 6. 在 Analysis Services 設(shè)計(jì)聚合時(shí),您可以查看向?qū)в疫叺摹靶阅芘c大小”圖。從中可以看出增加性能提升對(duì)使用額外磁盤(pán)空間的需求。完成設(shè)計(jì)聚合的進(jìn)程之后,單擊“下一步”按鈕。 7. 在“您希望做什么
23、?”下選擇“立即處理”,然后單擊“完成”按鈕。 注意:處理聚合可能會(huì)花費(fèi)一些時(shí)間。 8. 在處理時(shí)可以在出現(xiàn)的窗口中查看多維數(shù)據(jù)集。處理完成之后將出現(xiàn)一則信息,確認(rèn)處理已成功完成。 9. 單擊“關(guān)閉”按鈕返回 Analysis Manager 樹(shù)窗格。1.7瀏覽多維數(shù)據(jù)集數(shù)據(jù)可以開(kāi)始瀏覽 Sales 多維數(shù)據(jù)集中的數(shù)據(jù)了! 如何使用多維數(shù)據(jù)集瀏覽器查看多維數(shù)據(jù)集數(shù)據(jù)1. 在 Analysis Manager 樹(shù)窗格中,右擊“Sales”多維數(shù)據(jù)集,然后單擊“瀏覽數(shù)據(jù)”命令。 2. 出現(xiàn)多維數(shù)據(jù)集瀏覽器,顯示由多維數(shù)據(jù)集的一個(gè)維度和度量值組成的網(wǎng)格。其它四個(gè)維度顯示在瀏覽器的上方。如何替換網(wǎng)格中
24、的維度1. 要用另一個(gè)維度替換網(wǎng)格中的維度,拖動(dòng)上方框中的維度,然后直接將該維度放在要與其交換的列上。確保在此過(guò)程中,指針的形狀為雙端箭頭。 2. 使用這種拖放方法,選擇“Product”維度按鈕并將其拖動(dòng)到網(wǎng)格上,然后直接放在“Measures”上方。“Product”維度和“Measures”維度在多維數(shù)據(jù)集瀏覽器中將交換位置。 注意: 如果想將維度添加到網(wǎng)格,而不是用另一個(gè)維度進(jìn)行替換,則將該維度拖動(dòng)到網(wǎng)格的中間。如何按時(shí)間篩選數(shù)據(jù)1. 單擊“Time”維度旁邊的箭頭。 2. 展開(kāi)“所有 Time”和“1998”節(jié)點(diǎn),然后單擊“Quarter 1”。將對(duì)網(wǎng)格中的數(shù)據(jù)進(jìn)行篩選,使篩選出的數(shù)
25、據(jù)為僅反映該季度情況的數(shù)字。 如何深化1. 使用拖放方法交換“Product”和“Customer”維度。單擊“Product”并將其拖到“Country”維度上。 2. 雙擊網(wǎng)格中包含“Baking Goods”的單元。多維數(shù)據(jù)集展開(kāi)以包括子類(lèi)別列。 注意:雙擊已經(jīng)展開(kāi)的單元可以關(guān)閉子類(lèi)別列。 用上述方法使維度在網(wǎng)格上來(lái)回移動(dòng)。這有助于了解如何使用 Analysis Manager 將有關(guān)復(fù)雜數(shù)據(jù)關(guān)系的信息信手拈來(lái)。 3. 完成后,單擊“關(guān)閉”按鈕關(guān)閉多維數(shù)據(jù)集瀏覽器。實(shí)驗(yàn)二、多維數(shù)據(jù)的組織與分析1實(shí)驗(yàn)?zāi)康模哼\(yùn)用Analysis Server工具進(jìn)行維度,度量值以及多維數(shù)據(jù)集的創(chuàng)建使用維度瀏
26、覽器進(jìn)行多維數(shù)據(jù)的查詢(xún)、編輯操作2實(shí)驗(yàn)步驟:2.1建立具有父子維度的多維數(shù)據(jù)集父子維度是由成員的父子關(guān)系定義的成員組織好的層次結(jié)構(gòu)。通常其各個(gè)分支并不具有對(duì)稱(chēng)數(shù)量的級(jí)別。 對(duì)稱(chēng)層次結(jié)構(gòu): 不對(duì)稱(chēng)層次結(jié)構(gòu): 如何打開(kāi) Analysis Manager 維度向?qū)?. 在 Analysis Manager 樹(shù)窗格中,在“教程”數(shù)據(jù)庫(kù)下,右擊“共享維度”文件夾,單擊“新建維度”菜單,然后單擊“向?qū)А泵睢?如何建立 Employee 維度1. 在“歡迎”步驟,單擊“下一步”按鈕。 2. 在“選擇維度的創(chuàng)建方式”步驟,選擇“父子:?jiǎn)蝹€(gè)維度表中相關(guān)的兩列”,然后單擊“下一步”按鈕。 3. 在“選擇維度表”
27、步驟,單擊“employee”,然后單擊“下一步”按鈕。 4. 若要定義子鍵列,在“成員鍵”框旁邊,選擇“employee_id”。若要定義父鍵列,在“父鍵”框旁邊,選擇“supervisor_id”。若要定義“成員名稱(chēng)”列,在“成員名稱(chēng)”框旁邊,選擇“full_name”。單擊“下一步”按鈕。 5. 在向?qū)У摹斑x擇高級(jí)選項(xiàng)”步驟,單擊“下一步”按鈕。 6. 在最后一步,在“維度名稱(chēng)”框中,輸入“employee”。單擊“完成”按鈕。 7. 現(xiàn)在進(jìn)入維度編輯器。在“文件”菜單上,單擊“退出”命令關(guān)閉維度編輯器。 8. 現(xiàn)在,在“共享維度”列表中,應(yīng)能看到雇員維度。如何建立 HR 多維數(shù)據(jù)集1.
28、 在 Analysis Manager 樹(shù)窗格中,在“教程”數(shù)據(jù)庫(kù)下,右擊“多維數(shù)據(jù)集”文件夾,單擊“新建多維數(shù)據(jù)集”菜單,然后單擊“向?qū)А泵睢?2. 按照向?qū)е械牟襟E創(chuàng)建人力資源多維數(shù)據(jù)集,使其具有如下特征: 1. 事實(shí)數(shù)據(jù)表:salary(工資) 2. 度量值:salary_paid、vacation_used 3. 維度:Employee(雇員)、Store(商店)、Time(時(shí)間) 4. 是否計(jì)算事實(shí)數(shù)據(jù)表的行數(shù)?是 注意:在該向?qū)е?,將接收到一條消息,說(shuō)明無(wú)法找到兩個(gè)聯(lián)接。單擊“確定”按鈕。(將在多維數(shù)據(jù)集編輯器中手動(dòng)創(chuàng)建這兩個(gè)聯(lián)接)。 3. 在該向?qū)У淖詈笠徊?,將多維數(shù)據(jù)集命名為
29、“HR”,然后單擊“完成”按鈕。 4. 出現(xiàn)多維數(shù)據(jù)集編輯器。 若要手動(dòng)創(chuàng)建聯(lián)接,將“time_by_day”表的“the_date”字段拖動(dòng)到“salary”表的“pay_date”字段上。 5. 在“store”表的“store_id”字段上單擊,并將其拖動(dòng)到“employee”表中的“store_id”字段上。 6. 刪除在“salary”表和“employee”表之間自動(dòng)創(chuàng)建的“department_id”聯(lián)接:?jiǎn)螕粼撀?lián)接將其選中,然后按“刪除”按鈕。 7. 完成時(shí),關(guān)閉多維數(shù)據(jù)集編輯器。提示保存多維數(shù)據(jù)集時(shí)單擊“是”按鈕,但提示設(shè)計(jì)存儲(chǔ)時(shí)單擊“否”按鈕。(將在本教程的高級(jí)
30、分析部分處理該多維數(shù)據(jù)集。) 2.2瀏覽維度數(shù)據(jù)Microsoft® SQL Server 2000 Analysis Services 提供了維度瀏覽器,可用來(lái)查看和編輯維度結(jié)構(gòu)。 如何瀏覽維度數(shù)據(jù)1. 在 Analysis Manager 樹(shù)窗格中,在“教程”數(shù)據(jù)庫(kù)下,展開(kāi)“共享維度”文件夾。 2. 右擊“Employee”維度,然后單擊“瀏覽維度數(shù)據(jù)”命令。 3. 出現(xiàn)維度瀏覽器,在左窗格的樹(shù)結(jié)構(gòu)中顯示維度成員。在右窗格中顯示成員屬性和公式。 4. 數(shù)據(jù)瀏覽完畢后,單擊“關(guān)閉”退出維度瀏覽器。2.3創(chuàng)建計(jì)算成員可以將多維數(shù)據(jù)集數(shù)據(jù)、算術(shù)運(yùn)算符、數(shù)字和/或函數(shù)組合起來(lái)創(chuàng)建自定義度
31、量值或維度成員,這些度量值和維度成員稱(chēng)為計(jì)算成員。 如何創(chuàng)建計(jì)算成員1. 在 Analysis Manager 樹(shù)窗格中,在“教程”數(shù)據(jù)庫(kù)下,右擊“Sales”多維數(shù)據(jù)集,然后單擊“編輯”命令。 2. 即進(jìn)入多維數(shù)據(jù)集編輯器開(kāi)始編輯 Sales 多維數(shù)據(jù)集。多維數(shù)據(jù)集組件(“維度”、“度量值”、“計(jì)算成員”等)列在多維數(shù)據(jù)集編輯器的左窗格中。 3. 右擊“計(jì)算成員”,然后單擊“新建計(jì)算成員”。 4. 現(xiàn)在進(jìn)入計(jì)算成員生成器中。前三個(gè)框用于確定計(jì)算成員的維度的特征:“父維度”(其所屬維度)、“父成員”(其所附加到的父代)和“成員名稱(chēng)”。 5. 將“父維度”設(shè)置保持為“Measures”不變。此時(shí)
32、“父成員”框不可用,因?yàn)槎攘恐稻S度不支持層次結(jié)構(gòu)。在“成員名稱(chēng)”框中輸入“Average price”。 6. 計(jì)算成員生成器的下半部分提供生成計(jì)算成員表達(dá)式所需的全部組件。在“數(shù)據(jù)”下展開(kāi)“Measures”維度,然后展開(kāi)“MeasuresLevel”。出現(xiàn)度量值列表。 7. 從中選擇“Store Sales”,然后將其拖入“值表達(dá)式”框中。 8. 在數(shù)字和運(yùn)算符鍵區(qū),單擊“/”運(yùn)算符。在“值表達(dá)式”框中表達(dá)式的末尾出現(xiàn)運(yùn)算符。 9. 在“數(shù)據(jù)”下選擇“Unit sales”度量值,然后拖至“值表達(dá)式”框中表達(dá)式的末尾。 10. 計(jì)算成員現(xiàn)已完全定義完畢。單擊“確定”按鈕。計(jì)算成
33、員生成器關(guān)閉,回到多維數(shù)據(jù)編輯器中。請(qǐng)注意,新創(chuàng)建的計(jì)算成員在多維數(shù)據(jù)集編輯器的左窗格的“計(jì)算成員”文件夾中已經(jīng)可用。 11. 單擊“保存”圖標(biāo)或單擊“文件”菜單中的“保存”命令以保存所做的更改。 如何查看計(jì)算成員數(shù)據(jù)計(jì)算成員的計(jì)算是在工作中進(jìn)行。即從來(lái)不存儲(chǔ)由計(jì)算成員表達(dá)式得出的數(shù)據(jù),每次分析需要計(jì)算成員時(shí)才進(jìn)行計(jì)算。 1. 若要查看數(shù)據(jù),請(qǐng)單擊右窗格底部的“數(shù)據(jù)”選項(xiàng)卡。出現(xiàn)數(shù)據(jù),Measures 維度出現(xiàn)在列中,Customer 維度出現(xiàn)在行中。注意共出現(xiàn)以下四列:三個(gè)度量值列和一個(gè)剛創(chuàng)建的計(jì)算成員列,即 Average Price。 2. 關(guān)閉多維數(shù)據(jù)
34、集編輯器。2.4創(chuàng)建成員屬性成員屬性是維度成員的一個(gè)特性。它為最終用戶(hù)提供關(guān)于成員的其它信息。 如何創(chuàng)建成員屬性1. 在 Analysis Manager 樹(shù)窗格中,展開(kāi)“共享維度”文件夾。 2. 右擊“Customer”維度,然后單擊“編輯”命令。 3. 在維度編輯器中,展開(kāi)“Lname”。您將看到該級(jí)別的“成員屬性”文件夾。 4. 在“架構(gòu)”窗格中,將“gender”列從“Customer”表拖動(dòng)到“LName”的“成員屬性”文件夾。 5. 為以下五列重復(fù)上述步驟:“marital_status”、“education”、“yearly_income”、“num_childr
35、en_at_home”和“member_card”。 在“Lname”的“成員屬性”文件夾下應(yīng)看到以下六個(gè)成員屬性: “Gender”、“Marital Status”、“Education”、“Yearly Income”、“Num Children At Home”和“Member Card”。 6. 在“文件”菜單上單擊“保存”命令。 7. 關(guān)閉維度編輯器。2.5創(chuàng)建虛擬維度虛擬維度是基于物理維度內(nèi)容的邏輯維度。這些內(nèi)容可以是物理維度中的現(xiàn)有成員屬性,也可以是物理維度的表中的列。 如何創(chuàng)建虛擬維度1. 在 Analysis Manager 樹(shù)窗格中右擊“共享維度”文件夾,指向“新建維度”
36、菜單,然后單擊“向?qū)А泵睢?2. 在維度向?qū)У摹皻g迎”步驟中單擊“下一步”按鈕。 3. 選擇“虛擬維度:另一個(gè)維度的成員屬性”,然后單擊“下一步”按鈕。 4. 在“選擇帶有成員屬性的維度”步驟中,單擊“Customer”維度,然后單擊“下一步”按鈕。 5. 在“選擇虛擬維度的級(jí)別”步驟中,單擊“Lname.Yearly Income”成員屬性,然后單擊添加按鈕“>”。單擊“下一步”按鈕。 6. 在“選擇高級(jí)選項(xiàng)”步驟中,確保不選中“選項(xiàng)”框中的任何項(xiàng)目。此時(shí)不需要設(shè)置高級(jí)選項(xiàng)。單擊“下一步”按鈕。 7. 在“完成維度向?qū)А辈襟E中,在“維度名稱(chēng)”框中輸入“Yearly Income”。
37、8. 單擊“完成”按鈕。 9. 您現(xiàn)在在維度編輯器中。單擊“文件”菜單中的“退出”命令。 10. 新維度包括在共享維度的列表中。如何向現(xiàn)有多維數(shù)據(jù)集添加虛擬維度1. 在 Analysis Manager 樹(shù)視圖中,右擊“多維數(shù)據(jù)集”文件夾中的“Sales”多維數(shù)據(jù)集,然后單擊“編輯”命令。 2. 在多維數(shù)據(jù)集編輯器中右擊左窗格樹(shù)中的“維度”。單擊“現(xiàn)有維度”。 3. 在維度管理器中選擇新創(chuàng)建維度“Yearly Income”,將它拖動(dòng)到“多維數(shù)據(jù)集維度”列表中。單擊“確定”按鈕。 4. 關(guān)閉多維數(shù)據(jù)集編輯器。當(dāng)提示您保存多維數(shù)據(jù)集時(shí)單擊“是”。 5. 當(dāng)設(shè)計(jì)存儲(chǔ)窗口向您提示時(shí)請(qǐng)單擊“是”。 6
38、. 按照存儲(chǔ)設(shè)計(jì)向?qū)Р襟E操作并選擇以下設(shè)置: 1. 數(shù)據(jù)存儲(chǔ)類(lèi)型:MOLAP 2. 聚合選項(xiàng):性能提升達(dá)到 20% 3. 最后步驟:處理多維數(shù)據(jù)集 7. 當(dāng)最后一行顯示為:“已成功完成處理”時(shí),單擊“進(jìn)程”對(duì)話(huà)框中的“關(guān)閉”。 2.6查看多維數(shù)據(jù)集元數(shù)據(jù)和維度元數(shù)據(jù)元數(shù)據(jù)是關(guān)于數(shù)據(jù)屬性和數(shù)據(jù)結(jié)構(gòu)的信息。它也指用以界定對(duì)象(如多維數(shù)據(jù)集或維度)設(shè)計(jì)的信息。此信息顯示在 Analysis Manager 右窗格中。 如何查看銷(xiāo)售多維數(shù)據(jù)集的元數(shù)據(jù)1. 在 Analysis Manager 樹(shù)窗格中展開(kāi)“多維數(shù)據(jù)集”文件夾。 2. 選擇“Sales”多維數(shù)據(jù)集。 3. 在 Analysis Mana
39、ger 右窗格中單擊“元數(shù)據(jù)”。 如何查看維度的元數(shù)據(jù)1. 在 Analysis Manager 樹(shù)窗格中,展開(kāi)“共享維度”文件夾。 2. 單擊一個(gè)維度。 3. 在 Analysis Manager 右窗格中單擊“元數(shù)據(jù)”。實(shí)驗(yàn)三、基于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)挖掘1實(shí)驗(yàn)?zāi)康模?1)用決策樹(shù)創(chuàng)建 OLAP 挖掘模型 (2)瀏覽 OLAP 數(shù)據(jù)挖掘維度和虛擬多維數(shù)據(jù)集(3)使用聚集功能創(chuàng)建 OLAP 挖掘模型(4)用決策樹(shù)創(chuàng)建關(guān)系挖掘模型2實(shí)驗(yàn)步驟:31使用 Microsoft 決策樹(shù)創(chuàng)建 OLAP 數(shù)據(jù)挖掘模型數(shù)據(jù)挖掘模型是一種包含運(yùn)行特定數(shù)據(jù)挖掘任務(wù)所需的全部設(shè)置的模型。 如何創(chuàng)建揭示客戶(hù)模式的數(shù)據(jù)挖掘
40、模型1. 在 Analysis Manager 樹(shù)視圖中,展開(kāi)“多維數(shù)據(jù)集”文件夾,右擊“Sales”多維數(shù)據(jù)集,然后選擇“新建挖掘模型”命令。 2. 打開(kāi)挖掘模型向?qū)АT凇斑x擇數(shù)據(jù)挖掘技術(shù)”步驟中的“技術(shù)”框中選擇“Microsoft 決策樹(shù)”。單擊“下一步”按鈕。 3. 在“選擇事例”步驟中,在“維度”框中選擇“Customer”。在“級(jí)別”框中,確保選擇了“Lname”。單擊“下一步”按鈕。 4. 在“選擇被預(yù)測(cè)實(shí)體”步驟中,選擇“事例級(jí)別的成員屬性”。然后在“成員屬性”框中選擇“Member Card”。 5. 單擊“下一步”按鈕。 6. 在“選擇訓(xùn)練數(shù)據(jù)”步驟中,滾動(dòng)到“Custom
41、er”維度,清除“Country”、“State Province”和“City”框(因?yàn)椴恍枰诰奂?jí)別上而只需要在單獨(dú)的客戶(hù)級(jí)別上確定客戶(hù)模式)。單擊“下一步”按鈕。 7. 在“創(chuàng)建維度和虛擬多維數(shù)據(jù)集(可選)”步驟中,在“維度名稱(chēng)”框中輸入“Customer Patterns”。然后在“虛擬多維數(shù)據(jù)集名稱(chēng)”框中輸入“Trained Cube”。單擊“下一步”按鈕。 8. 在最后的步驟中,在“模型名稱(chēng)”字段中鍵入“Customer patterns discovery”。確保選擇了“保存并開(kāi)始處理”。單擊“完成”按鈕。 注意:處理數(shù)據(jù)挖掘模型可能會(huì)花費(fèi)一些時(shí)間。 9. 出現(xiàn)一個(gè)窗口,顯示模
42、型正在處理之中。處理完成之后,出現(xiàn)一則消息,說(shuō)明“已成功完成處理”,然后單擊“關(guān)閉”按鈕。 如何讀取客戶(hù)決策樹(shù)1. 現(xiàn)在已在 OLAP 挖掘模型編輯器中。可以使用編輯器編輯模型屬性或者瀏覽其結(jié)果。最大化 OLAP 挖掘模型編輯器。 2. 決策樹(shù)顯示于右窗格中。其中包括四個(gè)窗格。中間的“內(nèi)容詳情”窗格 (1) 顯示焦點(diǎn)所在的決策樹(shù)的部分?!皟?nèi)容選擇區(qū)”窗格 (2) 顯示樹(shù)的完整視圖。該窗格使您可以將焦點(diǎn)設(shè)置到樹(shù)的其它部分。其它的兩個(gè)窗格分別是“特性”窗格 (3)(特性信息可以用“合計(jì)”選項(xiàng)卡以數(shù)值方式查看或者用“直方圖”選項(xiàng)卡以圖形方式查看)和與焦點(diǎn)所在節(jié)點(diǎn)相關(guān)聯(lián)的“節(jié)點(diǎn)路徑”區(qū)域 (4)。 3
43、. 在“內(nèi)容詳情”窗格的決策樹(shù)區(qū)域中,顏色代表“事例”的密度(在本事例中為:客戶(hù)的密度)。顏色越深則節(jié)點(diǎn)中包含的事例就越多。 單擊“全部”節(jié)點(diǎn)。該節(jié)點(diǎn)為黑色,因?yàn)樗?(7632) 事例的 100%。7632 代表 1998 年活動(dòng)的客戶(hù)數(shù)目(即 Sales 多維數(shù)據(jù)集中有事務(wù)記錄的客戶(hù))。這個(gè)數(shù)字也說(shuō)明在 1998 年并非所有的客戶(hù)都是活動(dòng)的,因?yàn)槲覀儚摹癈ustomer”維度的“Lname”級(jí)別中所包含的 9991 個(gè)客戶(hù)中只得到 7632 個(gè)事例。 4. 特性窗格顯示“全部”節(jié)點(diǎn)中,所有事例的 55.83%(或者說(shuō) 4263 個(gè)示例)可能選擇銅卡 (Bronze);11.50% 可能選
44、擇金卡 (Golden);23.32% 可能選擇普通卡 (Normal);9.34% 可能選擇銀卡 (Silver)。如果沒(méi)有顯示百分比,則可以調(diào)整“特性”窗格中“合計(jì)”面板的“可能性”列的大小。 5. 如果選擇了樹(shù)的不同節(jié)點(diǎn),此百分比將會(huì)更改。讓我們調(diào)查一下哪些客戶(hù)可能選擇金卡。若要執(zhí)行此操作,則需要重新畫(huà)出樹(shù)以便勾畫(huà)出金卡的高密度區(qū)。在右下角的“樹(shù)顏色基于”字段中選擇“Golden”。該樹(shù)顯示另一種顏色模式??梢钥闯觥癈ustomer.Lname.Yearly Income = $150K+”節(jié)點(diǎn)的密度高于其它任何節(jié)點(diǎn)。 6. 樹(shù)的第一個(gè)級(jí)別由“yearly income”屬性決定。樹(shù)的組
45、織由算法決定,其基礎(chǔ)是該屬性在輸出中的重要性。這意味著“yearly income”屬性是最重要的因素,它將決定客戶(hù)可能選擇的會(huì)員卡的類(lèi)型。選擇“Customer.Lname.Yearly Income = $150K+”節(jié)點(diǎn)。該特性窗格顯示收入較多的客戶(hù)中,45.09% 的客戶(hù)可能會(huì)選擇金卡。這個(gè)百分比要比“全部”節(jié)點(diǎn)中的 (11.50%) 高得多。當(dāng)繼續(xù)在樹(shù)中做進(jìn)一步調(diào)查時(shí),讓我們調(diào)查一下這些百分比是如何演化的。 7. 雙擊“Customer.Lname.Yearly Income = $150K+”節(jié)點(diǎn)。 該樹(shù)現(xiàn)在只顯示“Customer.Lname.Yearly Incom
46、e = $150K+”節(jié)點(diǎn)下的子樹(shù)。 選擇“Customer.Lname.Marital Status = M”節(jié)點(diǎn)。在“節(jié)點(diǎn)路徑”窗格中,可以看到包含于該節(jié)點(diǎn)的客戶(hù)的完整的特征定義:收入高于 150000 美元且已婚的客戶(hù)。該“特性”窗格現(xiàn)在顯示:與上一級(jí)別 (45.09%) 相比,較高百分比 (81.05%) 的客戶(hù)可能會(huì)選擇金卡。 8. 我們?cè)俜祷氐巾攲?,進(jìn)行一種與此不同的調(diào)查,即調(diào)查可能選擇普通卡的客戶(hù)。若要返回頂層節(jié)點(diǎn),可以單擊從“Customer.Lname.Yearly Income = $150K+”節(jié)點(diǎn)左面伸出來(lái)的線(xiàn)(方法 1)或者使用“內(nèi)
47、容選擇區(qū)”回到樹(shù)的頂部(方法 2)。 9. 在“樹(shù)顏色基于”字段中選擇“Normal”。樹(shù)刷新節(jié)點(diǎn)的顏色之后,可以看到“Customer.Lname.Yearly Income = $150K+”節(jié)點(diǎn)的顏色非常淺;這意味著這些客戶(hù)選擇普通卡的可能性非常小。另一方面,可以看到“Customer.Lname.Yearly Income = $10K $30K”節(jié)點(diǎn)的顏色非常深。這意味著這些客戶(hù)選擇普通卡的可能性非常高?!疤匦浴贝案耧@示在此年收入范圍內(nèi)的客戶(hù)中,91.92% 的客戶(hù)可能會(huì)選擇普通卡。樹(shù)還顯示已無(wú)法對(duì)此節(jié)點(diǎn)進(jìn)行進(jìn)一步調(diào)查。這意味著在樹(shù)的這個(gè)分支中,年收入是決定客戶(hù)選擇普通卡的可能性的唯
48、一因素。 10. 可以查看樹(shù)的其它分支并調(diào)查客戶(hù)選擇一種卡而不選擇另一種卡的可能性。市場(chǎng)部可以使用此信息來(lái)確定最可能選擇某種類(lèi)型卡的客戶(hù)的特征。根據(jù)這些特征(收入、子女?dāng)?shù)、婚姻狀況等等),可以重新定義會(huì)員卡服務(wù)和方案以便更好地適應(yīng)其客戶(hù)。 11. 完成對(duì)決策樹(shù)的分析之后,請(qǐng)關(guān)閉 OLAP 挖掘模型編輯器。 32瀏覽 OLAP 數(shù)據(jù)挖掘維度和虛擬多維數(shù)據(jù)集數(shù)據(jù)挖掘維度和虛擬多維數(shù)據(jù)集是兩個(gè)彼此關(guān)聯(lián)的對(duì)象,在使用 Microsoft 決策樹(shù)算法建立 OLAP 數(shù)據(jù)挖掘模型時(shí)得以創(chuàng)建。 如何瀏覽數(shù)據(jù)挖掘虛擬維度1. 在 Analysis Manager 樹(shù)視圖中,展開(kāi)“共享維度”文件夾,右擊“Cus
49、tomer patterns”維度,然后單擊“瀏覽維度數(shù)據(jù)”命令。 2. 維度瀏覽器打開(kāi)。展開(kāi)“全部”成員維度。 3. 選擇“Customer.Lname.Yearly Income = $150K+”成員。在“自定義成員公式”窗格中,出現(xiàn)定義該節(jié)點(diǎn)的 MDX 公式。 4. 可以繼續(xù)展開(kāi)維度并考察該節(jié)點(diǎn)的屬性。完成時(shí),單擊“關(guān)閉”按鈕。如何瀏覽數(shù)據(jù)挖掘虛擬多維數(shù)據(jù)集1. 在 Analysis Manager 樹(shù)窗格中,展開(kāi)“多維數(shù)據(jù)集”文件夾,右擊“Trained Cube”多維數(shù)據(jù)集,然后選擇“瀏覽數(shù)據(jù)”命令。 2. 多維數(shù)據(jù)集瀏覽器打開(kāi)。最大化該多維數(shù)據(jù)集瀏覽器。 3. 將“Custome
50、r Patterns”維度拖動(dòng)到“MeasuresLevel”框,以便用“Customer Patterns”維度替換“Measures”維度。 4. 按下列順序雙擊,展開(kāi)“Customer”維度:“USA”->“WA”->“Redmond”。顯示 Redmond 地區(qū)的所有客戶(hù)。 5. 雙擊“級(jí)別 01”展開(kāi)“Customer”維度。顯示“Customer Patterns”維度的第一個(gè)級(jí)別。 6. 關(guān)閉多維數(shù)據(jù)集瀏覽器。 3.3使用 Microsoft 聚集創(chuàng)建 OLAP 數(shù)據(jù)挖掘模型數(shù)據(jù)挖掘模型是包含運(yùn)行特定數(shù)據(jù)挖掘任務(wù)所需全部設(shè)置的模型。 如何創(chuàng)建將客戶(hù)群劃分為邏輯段的數(shù)據(jù)
51、挖掘模型 1. 在 Analysis Manager 樹(shù)窗格中展開(kāi)“多維數(shù)據(jù)集”文件夾,右擊“Sales”多維數(shù)據(jù)集,然后單擊“新建挖掘模型”命令。 2. 在挖掘模型向?qū)У摹斑x擇數(shù)據(jù)挖掘技術(shù)”步驟中,在“技術(shù)”框中單擊“Microsoft 聚集”。單擊“下一步”按鈕。 3. 在“選擇事例”步驟中的“維度”框中,選擇“Customer”。在“級(jí)別”框中,確保已經(jīng)選擇了“Lname”。 單擊“下一步”按鈕。 4. 在“選擇訓(xùn)練數(shù)據(jù)”步聚中,在“Customer”維度中清除“Country”、“State Province”和“City”復(fù)選框,因?yàn)闆](méi)有必要使用匯總級(jí)別劃分客戶(hù)群。然后,在“Meas
52、ures”維度中只選擇“Store Sales”。單擊“下一步”按鈕。 5. 在最后一個(gè)步驟中,在“模型名稱(chēng)”框中輸入“Customer segmentation”。選擇“保存,但現(xiàn)在不處理”。單擊“完成”按鈕。 6. 當(dāng)前在 OLAP 挖掘模型編輯器中??梢允褂么司庉嬈骶庉嬆P蛯傩曰?yàn)g覽其結(jié)果。 7. 在編輯器的左窗格的屬性窗格中,在“Cluster Count”框中,用“3”代替“10”。 8. 保存所做更改。 9. 單擊“工具”菜單上的“處理挖掘模型”命令。 注意: 處理數(shù)據(jù)挖掘模型可能會(huì)花費(fèi)一些時(shí)間。10. 出現(xiàn)“處理”窗口,顯示正在處理模型。處理完成之后出現(xiàn)一則消息,說(shuō)明“已成功完成
53、處理”。單擊“關(guān)閉”按鈕。如何讀取包含在各個(gè)聚集(客戶(hù)段)中的信息1. 現(xiàn)在已回到 OLAP 挖掘模型編輯器。分段樹(shù)顯示于右窗格中。右窗格由四個(gè)窗格組成:中間的“內(nèi)容詳情”窗格 (1) 顯示焦點(diǎn)所在的分段樹(shù)的部分?!皟?nèi)容選擇區(qū)”窗格 (2) 顯示樹(shù)的完整視圖。該窗格使您可以將焦點(diǎn)設(shè)置到樹(shù)的其它部分。其它的兩個(gè)窗格分別是“特性”窗格 (3)(特性信息可以用“合計(jì)”選項(xiàng)卡以數(shù)值方式查看或者用“直方圖”選項(xiàng)卡以圖形方式查看)和與焦點(diǎn)所在節(jié)點(diǎn)相關(guān)聯(lián)的“節(jié)點(diǎn)路徑”區(qū)域 (4)。 2. 在“內(nèi)容詳情”窗格中,在分段樹(shù)區(qū)域中,顏色代表事例的密度(在此事例中為客戶(hù)的密度)。顏色越深則節(jié)點(diǎn)中包含的
54、事例就越多。單擊“全部”節(jié)點(diǎn)。該節(jié)點(diǎn)為黑色,因?yàn)樗?100% 的事例(客戶(hù))。 3. 單擊“Cluster 1”。特性窗格顯示一個(gè)下拉列表和一個(gè)網(wǎng)格。下拉列表可用于選擇特定的客戶(hù)人口統(tǒng)計(jì)特征。網(wǎng)格顯示以人口統(tǒng)計(jì)特征的各個(gè)值為基礎(chǔ)對(duì)聚集中客戶(hù)的重新分區(qū)。 4. 對(duì)于“Cluster 1”,請(qǐng)選擇“節(jié)點(diǎn)特性集”框中的“Customer.Lname.Marital Status”,然后轉(zhuǎn)到“特性”網(wǎng)格。網(wǎng)格顯示“Cluster 1”包括 2878 個(gè)事例,對(duì)于“婚姻狀況”特征,事例分布如下:21.12% 的客戶(hù)已婚,其余 78.88% 單身。 5. 讓我們從另一個(gè)角度查看這些相同的 2878 個(gè)
55、事例。在“節(jié)點(diǎn)特性集”框中,選擇“Customer.Lname.Yearly Income”。網(wǎng)格中的分布顯示 0% 的客戶(hù)收入在 10000-30000 美元范圍之內(nèi);41.62% 的客戶(hù)收入在 30000-50000 美元范圍之內(nèi);24.01% 的客戶(hù)收入在 50000-70000 美元范圍之內(nèi)。結(jié)果顯示該聚集的 65% 以上的客戶(hù)在中等收入(年收入為 30000-70000 美元)范圍之內(nèi)。 6. 現(xiàn)在可以知道“Cluster 1”主要由中等收入的客戶(hù)構(gòu)成而且主要由單身客戶(hù)構(gòu)成。在列表中選擇“Customer.Lname.Num Children At Home”。結(jié)果顯示該聚集中平均在
56、家子女?dāng)?shù)為零。此項(xiàng)選擇顯示一個(gè)平均數(shù)而不是重新分區(qū),因?yàn)樵磾?shù)據(jù)庫(kù)的“Num of Children at Home”字段中包含連續(xù)的值。當(dāng)算法發(fā)現(xiàn)源數(shù)據(jù)中包含不連續(xù)的值,它將顯示包含這些值的重新分區(qū)。 當(dāng)算法發(fā)現(xiàn)源數(shù)據(jù)中包含連續(xù)的值(即非預(yù)定義數(shù)字),它將計(jì)算并顯示平均值。 7. 在“節(jié)點(diǎn)特性集”框中,選擇“Measures.Stores Sales”。網(wǎng)格顯示在“Cluster 1”中對(duì)每個(gè)客戶(hù)的平均銷(xiāo)售額為 72.42 美元。 8. 市場(chǎng)部現(xiàn)在了解到“Cluster 1”主要由中等收入的客戶(hù)構(gòu)成,而且完全是由單身客戶(hù)構(gòu)成,這些客戶(hù)家中沒(méi)有子女,每年在 FoodMart 商店平均花費(fèi) 72.
57、42 美元。根據(jù)這種情況,市場(chǎng)部可以確定在周刊中插入哪種贈(zèng)券了。您也可以在樹(shù)中瀏覽以確定在“Cluster 2”和“Cluster 3”中所包含客戶(hù)特征。 9. 瀏覽完其它聚集后,請(qǐng)關(guān)閉 OLAP 挖掘模型編輯器。3.4使用 Microsoft 決策樹(shù)創(chuàng)建關(guān)系數(shù)據(jù)挖掘模型數(shù)據(jù)挖掘模型是一種包含運(yùn)行特定數(shù)據(jù)挖掘任務(wù)所需的全部設(shè)置的模型。 如何創(chuàng)建揭示客戶(hù)模式的數(shù)據(jù)挖掘模型1. 在 Analysis Manager 樹(shù)窗格中右擊“挖掘模型”文件夾,然后單擊“新建挖掘模型”命令。 2. 打開(kāi)挖掘模型向?qū)?。在“歡迎使用挖掘模型向?qū)А辈襟E中,單擊“下一步”按鈕。 3. 在“選擇源類(lèi)型”步驟中,單擊“關(guān)系數(shù)據(jù)”。單擊“下一步”按鈕。 4. 在“選擇事例表”步驟中,單擊“單個(gè)表包含數(shù)據(jù)”。在“可用的表”框中選擇“Customer”。單擊“下一步”按鈕。 5. 在“選擇數(shù)據(jù)挖掘技術(shù)”步驟中,在“技術(shù)”框中選擇“Microsoft 決策樹(shù)”。單擊“下一步”按鈕。 6. 在“選擇鍵列”步驟中,在“事例鍵列”框中單擊“customer_id”。然后單擊“下一步”按鈕。 7. 在“選擇輸入與可預(yù)測(cè)列”步驟中,選擇以下列,然后用“>”按鈕依次移動(dòng)到“可預(yù)測(cè)列”框中:“marital_status”、“year
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 探討2025年創(chuàng)業(yè)扶持政策與科技創(chuàng)新的結(jié)合試題及答案
- 金融與投資行業(yè):2025年金融科技在信用評(píng)級(jí)領(lǐng)域的應(yīng)用與挑戰(zhàn)
- 2025年郵輪旅游市場(chǎng)產(chǎn)業(yè)發(fā)展現(xiàn)狀與未來(lái)趨勢(shì)研究報(bào)告
- 新能源汽車(chē)用戶(hù)體驗(yàn)提升的技術(shù)探索試題及答案
- 海外交流2025年商務(wù)英語(yǔ)考試試題及答案
- 鋼鐵行業(yè)綠色轉(zhuǎn)型與產(chǎn)能布局優(yōu)化政策效應(yīng)研究報(bào)告
- 工業(yè)互聯(lián)網(wǎng)平臺(tái)邊緣計(jì)算硬件架構(gòu)2025年邊緣計(jì)算與工業(yè)互聯(lián)網(wǎng)平臺(tái)協(xié)同創(chuàng)新報(bào)告
- 有機(jī)化學(xué)主要反應(yīng)類(lèi)型試題及答案
- 主題公園沉浸式體驗(yàn)項(xiàng)目設(shè)計(jì)與2025年旅游產(chǎn)品創(chuàng)新結(jié)合的研究報(bào)告
- 教師教育教學(xué)反思的價(jià)值與方法試題及答案
- 2025民宿租賃合同標(biāo)準(zhǔn)范本
- 2025-2030中國(guó)水鎂石行業(yè)供需形勢(shì)與營(yíng)銷(xiāo)策略分析研究報(bào)告
- 遼寧省部分高中2023-2024學(xué)年高二下學(xué)期期中考試數(shù)學(xué)試題(解析版)
- 四川省南充市閬中中學(xué)校2024-2025學(xué)年高二下學(xué)期4月期中 化學(xué)試題(含答案)
- 食用農(nóng)產(chǎn)品集中交易市場(chǎng)基本情況信息表
- 購(gòu)買(mǎi)機(jī)票合同協(xié)議
- 蓄水池水池清洗方案
- 2024年陪診師考試教材相關(guān)試題及答案
- 統(tǒng)編版七年級(jí)語(yǔ)文下冊(cè)《第16課有為有不為》教案
- 高中部學(xué)生會(huì)職責(zé)與組織架構(gòu)分析
- 骨科專(zhuān)業(yè)培訓(xùn)計(jì)劃及總結(jié)
評(píng)論
0/150
提交評(píng)論