商務(wù)智能試驗(yàn)報告_第1頁
商務(wù)智能試驗(yàn)報告_第2頁
商務(wù)智能試驗(yàn)報告_第3頁
商務(wù)智能試驗(yàn)報告_第4頁
免費(fèi)預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、數(shù)據(jù)挖掘與商務(wù)智能實(shí)驗(yàn)實(shí)驗(yàn)報告實(shí)驗(yàn)題目:數(shù)據(jù)挖掘的基本數(shù)據(jù)分析姓名:王位學(xué)號:4指導(dǎo)教師:張大斌實(shí)驗(yàn)時間:201611.102016年11月10日實(shí)驗(yàn)題綱:一、實(shí)驗(yàn)?zāi)康?) 熟悉基本數(shù)據(jù)分析的處理流程。2) 進(jìn)一步熟練掌握拍SPSS Modeler工具的操作。二、實(shí)驗(yàn)內(nèi)容內(nèi)容一:數(shù)據(jù)的質(zhì)量探索步驟1建立數(shù)據(jù)流1) 在“源”中通過拖入“ Statistics ”文件節(jié)點(diǎn)讀入 Telephone.sav 數(shù)據(jù)。2) 建立“類型”節(jié)點(diǎn),并說明各個變量角色。這里指定“流失”為目標(biāo)變量。3) 選擇“輸出”選項(xiàng)卡中“數(shù)據(jù)審核”節(jié)點(diǎn)并將其連接到數(shù)據(jù)流的恰 當(dāng)位置,點(diǎn)擊鼠標(biāo)右鍵,在“質(zhì)量”選項(xiàng)卡下,選擇檢測方

2、法為平均值的標(biāo)準(zhǔn)差。步驟2結(jié)果輸出實(shí)驗(yàn)結(jié)果輸出如圖所示。圖中藍(lán)色部分表示輸出變量取 YES即客戶流失的樣本數(shù),可以看出,各 個變量上流失客戶的取值均不同。內(nèi)容二:基本描述分析這里分析的目標(biāo)是對電信客戶數(shù)據(jù)的基本服務(wù)、開通月數(shù)、免費(fèi)部分和無線 費(fèi)用之間的相關(guān)系數(shù)以反映變量之間的相互關(guān)系。步驟1建立數(shù)據(jù)流選擇“輸出”選項(xiàng)卡中的“統(tǒng)計(jì)量”節(jié)點(diǎn)。步驟2設(shè)置相關(guān)參數(shù)1) 雙擊“統(tǒng)計(jì)量”節(jié)點(diǎn),進(jìn)行相應(yīng)的設(shè)置。在“檢查”框中添加開通 月數(shù)、基本費(fèi)用、免費(fèi)部分和無線費(fèi)用。2) 在“相關(guān)”框中添加年齡、收入和家庭人數(shù)。如圖所示。3)在“相關(guān)設(shè)置”中,勾選“按重要性定義相關(guān)強(qiáng)度”。如圖所示計(jì)算結(jié)果如圖所示??梢钥?/p>

3、出,以“基本費(fèi)用”為例,它與“年齡”和“收 入”都有相關(guān)性,它們之間簡單相關(guān)系數(shù)雖然為 0.401和0.195 ,但從統(tǒng)計(jì)量的 角度來看有95%Z上的把握認(rèn)為它們之間是非 0相關(guān)?!盎举M(fèi)用”與“家庭人 數(shù)”呈負(fù)弱相關(guān)。內(nèi)容三:繪制散點(diǎn)圖數(shù)值之間變量的相關(guān)性可以采用上一個實(shí)驗(yàn),也可以通過散點(diǎn)圖來直接觀 察,此次主要觀察基本費(fèi)用和年齡之間的相關(guān)性。步驟1構(gòu)建數(shù)據(jù)流選擇“圖形”選項(xiàng)卡中的“圖”節(jié)點(diǎn)。步驟2設(shè)置相關(guān)參數(shù)1) 雙擊“圖”節(jié)點(diǎn),選擇編輯菜單,進(jìn)行參數(shù)窗口的設(shè)置。2) 在“X字段”和“Y”字段框中分別選擇“基本費(fèi)用”和“年齡”在“交疊字段”下,選擇“顏色”-“流失”,不同顏色表示流失量不同

4、取值的樣本點(diǎn)。如圖所示“圖”節(jié)點(diǎn)的參數(shù)設(shè)置窗口輸出的結(jié)果如圖所示內(nèi)容四:兩分類變量相關(guān)性的研究兩分類變量相關(guān)性研究可以從圖形分析入手,然后采用數(shù)值分析的方法。下 面采用網(wǎng)狀圖分析步驟1設(shè)置相關(guān)參數(shù)選擇圖形中的網(wǎng)絡(luò)節(jié)點(diǎn),進(jìn)入編輯狀態(tài),在“字段”下選擇“套餐類型”和“流失”。設(shè)置線值為“絕對值”。步驟2結(jié)果輸出可以由結(jié)果圖中得到,具電信客戶保持是最好的,結(jié)果輸出如圖所示。內(nèi)容五:變量中重要性分析步驟1窗口設(shè)置選擇“模型”選項(xiàng)卡中的“特征選擇”節(jié)點(diǎn),將其連接到數(shù)據(jù)流的恰當(dāng)位置, 點(diǎn)擊鼠標(biāo)右鍵,選擇彈出菜單中的編輯窗口,將“流失”添加到目標(biāo)選項(xiàng)中,其 他的全部添入輸入,具體操作如圖所示步驟2結(jié)果輸出由

5、結(jié)果輸出可以看出,開通月數(shù)、基本費(fèi)用、電子支付、年齡、受教育程度、 套餐類型、收入以及各種費(fèi)用等變量對預(yù)測用戶是否流失很重要,其他的變量則 意義不大,結(jié)果輸出如圖所示三、實(shí)驗(yàn)步驟與結(jié)果實(shí)驗(yàn)步驟和結(jié)果見實(shí)驗(yàn)內(nèi)容四、實(shí)驗(yàn)分析與擴(kuò)展練習(xí)實(shí)驗(yàn)分析:本次實(shí)驗(yàn)通過對數(shù)據(jù)質(zhì)量、基本描述、散點(diǎn)圖、相關(guān)性、重要性五個方面進(jìn)行內(nèi)容分析,比較全面地了解了該數(shù)據(jù)的相關(guān)信息,并得到了相應(yīng)的結(jié)果。請總結(jié)分析以下問題:(1)針對上述案例,分析保存客戶與流失客戶的基本費(fèi)用是否存在顯著的差異。(2)如何評價數(shù)據(jù)質(zhì)量相關(guān)性和重要性有何區(qū)別答:(1)根據(jù)分析客戶流失的樣本數(shù)的比例(灰色為流失)然后分析基本費(fèi)用和流失之間的關(guān)系,通過

6、建立統(tǒng)計(jì)量和繪制散點(diǎn)圖最后比較重要度可以得出結(jié)論:保存客戶與流失客戶的基本費(fèi)用存在顯著性差異 (2)數(shù)據(jù)質(zhì)量是保證數(shù)據(jù)應(yīng)用的基礎(chǔ),它的評估標(biāo)準(zhǔn)主要包括四個方面,完整性、相關(guān)性、一致性、及時性。評估數(shù)據(jù)是否達(dá)到預(yù)期設(shè)定的質(zhì)量要求,就可以 通過這四個方面來進(jìn)行判斷。相關(guān)性:高質(zhì)量的數(shù)據(jù)應(yīng)該是能充分滿足用戶使用要求的數(shù)據(jù),即數(shù)據(jù)源和要處理的業(yè)務(wù)具有很強(qiáng)的聯(lián)系;重要性:數(shù)據(jù)有很大價值和影響的性質(zhì),能為數(shù)據(jù)處理提供很多方便2.擴(kuò)展練習(xí)(1)針對上述的五個內(nèi)容,分別更改一些參數(shù),觀察是否對結(jié)果造成影響答:內(nèi)容一:更改“數(shù)據(jù)審核”中的部分參數(shù),結(jié)果如下左邊是沒有更改,右邊是更改后的,該系數(shù)更改無明顯變化五、

7、結(jié)論與討論(重點(diǎn))通過這次實(shí)驗(yàn),我了解到數(shù)據(jù)分析是數(shù)據(jù)挖掘中很重要的一部分, 數(shù)據(jù)分析 的目的是把隱沒在一大批看來雜亂無章的數(shù)據(jù)中的信息集中和提煉出來, 以找出 所研究對象的內(nèi)在規(guī)律。數(shù)據(jù)分析是組織有目的地收集數(shù)據(jù)、 分析數(shù)據(jù),使之成 為信息的過程。分析數(shù)據(jù)的時候不要盲目,首先要確定你要分析的方向,以更直觀的方式表 現(xiàn)出來,然后從所得的數(shù)據(jù)了解這些數(shù)據(jù)背后所代表的是什么,我們可以以其他 方式更好的體現(xiàn)出來嗎?怎么數(shù)據(jù)說話能更直觀表明問題 數(shù)據(jù)分析的步驟:1、探索性數(shù)據(jù)分析,當(dāng)數(shù)據(jù)剛?cè)〉脮r,可能雜亂無章,看不出規(guī)律,通過作圖、 造表、用各種形式的方程擬合,計(jì)算某些特征量等手段探索規(guī)律性的可能形式, 即往什么方向和用何種方式

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論