商務(wù)智能實驗6報告參考模板_第1頁
商務(wù)智能實驗6報告參考模板_第2頁
商務(wù)智能實驗6報告參考模板_第3頁
商務(wù)智能實驗6報告參考模板_第4頁
商務(wù)智能實驗6報告參考模板_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、數(shù)據(jù)挖掘與商務(wù)智能實驗實 驗 報 告實驗題目:數(shù)據(jù)挖掘的基本數(shù)據(jù)分析 姓名:王俊 學(xué)號:201430850164 指導(dǎo)教師: 張大斌 實驗時間:201611.10 2016年 11月 10日 1 / 15實驗題綱:一、 實驗?zāi)康?) 熟悉基本數(shù)據(jù)分析的處理流程。2) 進一步熟練掌握拍SPSS Modeler工具的操作。二、 實驗內(nèi)容內(nèi)容一:數(shù)據(jù)的質(zhì)量探索步驟1 建立數(shù)據(jù)流1) 在“源”中通過拖入“Statistics”文件節(jié)點讀入Telephone.sav數(shù)據(jù)。2) 建立“類型”節(jié)點,并說明各個變量角色。這里指定“流失”為目標(biāo)變量。3) 選擇“輸出”選項卡中“數(shù)據(jù)審核”節(jié)點并將其連接到數(shù)據(jù)流的

2、恰當(dāng)位置,點擊鼠標(biāo)右鍵,在“質(zhì)量”選項卡下,選擇檢測方法為平均值的標(biāo)準(zhǔn)差。步驟2 結(jié)果輸出實驗結(jié)果輸出如圖所示。圖中藍色部分表示輸出變量取YES,即客戶流失的樣本數(shù),可以看出,各個變量上流失客戶的取值均不同。內(nèi)容二:基本描述分析這里分析的目標(biāo)是對電信客戶數(shù)據(jù)的基本服務(wù)、開通月數(shù)、免費部分和無線費用之間的相關(guān)系數(shù)以反映變量之間的相互關(guān)系。步驟1 建立數(shù)據(jù)流選擇“輸出”選項卡中的“統(tǒng)計量”節(jié)點。步驟2 設(shè)置相關(guān)參數(shù)1) 雙擊“統(tǒng)計量”節(jié)點,進行相應(yīng)的設(shè)置。在“檢查”框中添加開通月數(shù)、基本費用、免費部分和無線費用。2) 在“相關(guān)”框中添加年齡、收入和家庭人數(shù)。如圖所示。3)在“相關(guān)設(shè)置”中,勾選“按

3、重要性定義相關(guān)強度”。如圖所示。計算結(jié)果如圖所示??梢钥闯?,以“基本費用”為例,它與“年齡”和“收入”都有相關(guān)性,它們之間簡單相關(guān)系數(shù)雖然為0.401和0.195,但從統(tǒng)計量的角度來看有95%以上的把握認(rèn)為它們之間是非0相關(guān)?!盎举M用”與“家庭人數(shù)”呈負(fù)弱相關(guān)。內(nèi)容三:繪制散點圖數(shù)值之間變量的相關(guān)性可以采用上一個實驗,也可以通過散點圖來直接觀察,此次主要觀察基本費用和年齡之間的相關(guān)性。步驟1 構(gòu)建數(shù)據(jù)流選擇“圖形”選項卡中的“圖”節(jié)點。步驟2 設(shè)置相關(guān)參數(shù)1) 雙擊“圖”節(jié)點,選擇編輯菜單,進行參數(shù)窗口的設(shè)置。2) 在“X字段”和“Y”字段框中分別選擇“基本費用”和“年齡”。在“交疊字段”下

4、,選擇“顏色”-“流失”,不同顏色表示流失量不同取值的樣本點。如圖所示“圖”節(jié)點的參數(shù)設(shè)置窗口。輸出的結(jié)果如圖所示。內(nèi)容四:兩分類變量相關(guān)性的研究兩分類變量相關(guān)性研究可以從圖形分析入手,然后采用數(shù)值分析的方法。下面采用網(wǎng)狀圖分析。步驟1 設(shè)置相關(guān)參數(shù)選擇圖形中的網(wǎng)絡(luò)節(jié)點,進入編輯狀態(tài),在“字段”下選擇“套餐類型”和“流失”。設(shè)置線值為“絕對值”。步驟2 結(jié)果輸出可以由結(jié)果圖中得到,其電信客戶保持是最好的,結(jié)果輸出如圖所示。內(nèi)容五:變量中重要性分析步驟1 窗口設(shè)置選擇“模型”選項卡中的“特征選擇”節(jié)點,將其連接到數(shù)據(jù)流的恰當(dāng)位置,點擊鼠標(biāo)右鍵,選擇彈出菜單中的編輯窗口,將“流失”添加到目標(biāo)選項中

5、,其他的全部添入輸入,具體操作如圖所示步驟 2 結(jié)果輸出由結(jié)果輸出可以看出,開通月數(shù)、基本費用、電子支付、年齡、受教育程度、套餐類型、收入以及各種費用等變量對預(yù)測用戶是否流失很重要,其他的變量則意義不大,結(jié)果輸出如圖所示3、 實驗步驟與結(jié)果實驗步驟和結(jié)果見實驗內(nèi)容4、 實驗分析與擴展練習(xí)實驗分析:本次實驗通過對數(shù)據(jù)質(zhì)量、基本描述、散點圖、相關(guān)性、重要性五個方面進行內(nèi)容分析,比較全面地了解了該數(shù)據(jù)的相關(guān)信息,并得到了相應(yīng)的結(jié)果。請總結(jié)分析以下問題:(1) 針對上述案例,分析保存客戶與流失客戶的基本費用是否存在顯著的差異。(2) 如何評價數(shù)據(jù)質(zhì)量?相關(guān)性和重要性有何區(qū)別?答:(1)根據(jù)分析客戶流失

6、的樣本數(shù)的比例(灰色為流失)然后分析基本費用和流失之間的關(guān)系,通過建立統(tǒng)計量和繪制散點圖最后比較重要度可以得出結(jié)論:保存客戶與流失客戶的基本費用存在顯著性差異(2) 數(shù)據(jù)質(zhì)量是保證數(shù)據(jù)應(yīng)用的基礎(chǔ),它的評估標(biāo)準(zhǔn)主要包括四個方面,完整性、相關(guān)性、一致性、及時性。評估數(shù)據(jù)是否達到預(yù)期設(shè)定的質(zhì)量要求,就可以通過這四個方面來進行判斷。相關(guān)性:高質(zhì)量的數(shù)據(jù)應(yīng)該是能充分滿足用戶使用要求的數(shù)據(jù),即數(shù)據(jù)源和要處理的業(yè)務(wù)具有很強的聯(lián)系;重要性:數(shù)據(jù)有很大價值和影響的性質(zhì),能為數(shù)據(jù)處理提供很多方便2. 擴展練習(xí)(1) 針對上述的五個內(nèi)容,分別更改一些參數(shù),觀察是否對結(jié)果造成影響答:內(nèi)容一:更改“數(shù)據(jù)審核”中的部分參

7、數(shù),結(jié)果如下 左邊是沒有更改,右邊是更改后的,該系數(shù)更改無明顯變化五、結(jié)論與討論(重點) 通過這次實驗,我了解到數(shù)據(jù)分析是數(shù)據(jù)挖掘中很重要的一部分,數(shù)據(jù)分析的目的是把隱沒在一大批看來雜亂無章的數(shù)據(jù)中的信息集中和提煉出來,以找出所研究對象的內(nèi)在規(guī)律。數(shù)據(jù)分析是組織有目的地收集數(shù)據(jù)、分析數(shù)據(jù),使之成為信息的過程。 分析數(shù)據(jù)的時候不要盲目,首先要確定你要分析的方向,以更直觀的方式表現(xiàn)出來,然后從所得的數(shù)據(jù)了解這些數(shù)據(jù)背后所代表的是什么,我們可以以其他方式更好的體現(xiàn)出來嗎?怎么數(shù)據(jù)說話能更直觀表明問題?數(shù)據(jù)分析的步驟:1、探索性數(shù)據(jù)分析,當(dāng)數(shù)據(jù)剛?cè)〉脮r,可能雜亂無章,看不出規(guī)律,通過作圖、造表、用各種形式的方程擬合,計算某些特征量等手段探索規(guī)律性的可能形式,即往什么方向和用何

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論