




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、數(shù)據(jù)挖掘與應(yīng)用實(shí)驗(yàn)報(bào)告6到11章自動(dòng)化專 業(yè)物聯(lián)網(wǎng)工程年級(jí)班別2015物聯(lián)網(wǎng)4班學(xué) 號(hào) 3115001492董延峰學(xué)生姓名張思明指導(dǎo)教師實(shí)驗(yàn)6數(shù)據(jù)挖掘的基本數(shù)據(jù)分析一、實(shí)驗(yàn)?zāi)康?1) 熟悉基本數(shù)據(jù)分析的處理流程(2) 進(jìn)一步熟練掌握spss modeler工具的操作二、實(shí)驗(yàn)環(huán)境(1) 相關(guān)智能算法的基本原理(2) ibm spss modeler 軟件三、實(shí)驗(yàn)內(nèi)容及步驟1、數(shù)據(jù)的質(zhì)量探索(1) 建立數(shù)據(jù)流a、創(chuàng)建"statistics” 節(jié)點(diǎn),讀入 telco.sav 數(shù)據(jù)。b、創(chuàng)建“類型”節(jié)點(diǎn),說明各變量角色,其中“流失”為目標(biāo)變量。c、創(chuàng)建“數(shù)據(jù)審核”節(jié)點(diǎn)并連接在適當(dāng)?shù)奈恢?,進(jìn)入
2、編輯界面,在“質(zhì)量”選 項(xiàng)卡下,選擇檢測(cè)方法為平均值的標(biāo)準(zhǔn)差。(2) 結(jié)果輸出雨核fit注解2£件(巳生 ir©號(hào)jll術(shù)多方式u*示采件縮112、基本描述分析(1) 建立數(shù)據(jù)流,創(chuàng)建“統(tǒng)計(jì)量"節(jié)點(diǎn)。(2) 設(shè)置相關(guān)參數(shù)a. 設(shè)置“統(tǒng)計(jì)量”節(jié)點(diǎn),在“檢查”屮添加開通月數(shù)、基本費(fèi)用、免費(fèi)部分和無線費(fèi)用。b、在“相關(guān)”中添加年齡、收入和家庭人數(shù)。c、在“相關(guān)選擇”中選擇“按重要性定義相關(guān)強(qiáng)度”。(3)結(jié)果12sj3文件(e) l3偏輯(e)o生咸)絨計(jì)信息|注解g全fimfr愛(c) 全部展禾司日開通月教s statistics計(jì)數(shù)1000平均值35.526最小值1.
3、000最大值72.000范國71.000方差456.242標(biāo)121.360平均值標(biāo)淮誤差0.675h pearson相關(guān)性0.4900.243城庭入埶0.0373基本費(fèi)用e) statistics計(jì)敎1000平均值11.723最小佰0.900最大值99.950范遛99.050方差107.402標(biāo)進(jìn)差10.363平均值標(biāo)淮誤差0.328q pearson相天性0 401家庭人敎0.195 0.036誦走3、繪制散點(diǎn)圖(1)構(gòu)建數(shù)據(jù)流,創(chuàng)建“圖”節(jié)點(diǎn)。(2)設(shè)置參數(shù)a、編輯“圖”節(jié)點(diǎn)b、在“x字段”和“y字段”中分別選擇“基木費(fèi)用”和“年齡將“交叉字 段”中的“顏色”設(shè)置為“流失”,不同顏色表示流
4、失變量不同取值的樣本點(diǎn)。(3)結(jié)果輸出z 偏輯(fi) o 生咸(£) & ws(y)呈li xlojxj回s $»文件(e)圖形注解4、兩分類變量相關(guān)性的研究(1) 設(shè)置相關(guān)參數(shù)。創(chuàng)建“網(wǎng)絡(luò)”節(jié)點(diǎn),在“字段”中選擇“套餐類型”和“流 失”,設(shè)置線值為“絕對(duì)值”。(2) 結(jié)果輸!11剛首芽益夕:的網(wǎng)狀圖-x* £ 0/觀三0|屈»jolxjk1圖形連解3.0000004 000000<2.000000*/jbi.oooooo0.0000001.000000o誡失務(wù)資貢勺1 £1 1 11 1 1 1 1 11 1 1 11 j02
5、04000 80 1001201401oo180200220240wmkzi1你鄉(xiāng)1 *wnh?rr定5、變量重要性分析(1) 窗口設(shè)置。創(chuàng)建“特征選擇”節(jié)點(diǎn),編輯,將“流失”添加到目標(biāo)選項(xiàng)中, 其他的全部作為輸入。(2) 結(jié)果輸出©舷x值序么 字段開通月數(shù) 2®戛本費(fèi)用 年齡4 ®電子支付5 <&敎肓水平6®套餐類型7 ®無線服務(wù)8 <g>無線貴用 9®收入_10®免費(fèi)部分 門®姐姻狀;兄12®家庭人數(shù)13®居住地14®性別續(xù)續(xù)續(xù)義序義義續(xù)續(xù)續(xù)義續(xù)義義 連連
6、連名有名名連連連名連名名 z纟京夕纟夕玄選走審段數(shù):10可用亨段總數(shù):14總的圖:sxnstatistics訓(xùn) 要sb要 飪要要要要要要要要要要重1重羣1 ge ge uui 曾.hr be ge 亙 亙 f f f f a3 33 fl3 33 fl3 s3 a3 33 pv pv pv fv1.01.0 二1.0 二1.0 二1.0 二1.0 二1.0 二0.9980.9960.9960.7790.2440.1840.151e > 0.95 田 <=0.95 0<0.90篩選的字段測(cè)里原因telephone sav流失套餐類型x流尖15字段基本費(fèi)用v.年齡實(shí)驗(yàn)7統(tǒng)計(jì)分析:
7、邏輯回歸一、實(shí)驗(yàn)日的spss modeler 的 logistic 回歸的方法。(1) 了解和熟悉spss modeler及其相關(guān)知識(shí)。(2) 掌握spss modeler工具建立多項(xiàng)logistic回歸的方法。(3) 學(xué)會(huì)運(yùn)用spss modeler進(jìn)行多項(xiàng)logistic回歸的內(nèi)容。二、實(shí)驗(yàn)環(huán)境一臺(tái)裝有spss modeler軟件系統(tǒng)的計(jì)算機(jī)。三、實(shí)驗(yàn)內(nèi)容及步驟1、構(gòu)建多項(xiàng)logistic回歸數(shù)據(jù)流(1) 通過 ustatistics 文件”節(jié)點(diǎn)讀入 brand.sav0(2) 數(shù)據(jù)流中添加“類型”節(jié)點(diǎn)。(3) 在"建?!蹦K下選擇“l(fā)ogistic”節(jié)點(diǎn)連接在數(shù)據(jù)流中恰當(dāng)?shù)奈恢?/p>
8、。(4) 運(yùn)行結(jié)果:0x3x文件(e) 3 w8(fi) q生咸(g)+播入(1) _)格式»槪邑i直&e/ '描要鬲級(jí)設(shè)貴注解:丄 &全部折撻© 隔全卻展開(£)曰方程式用于10 2319 (x1=20.7474 *p(2=1* -0.656e方程式用于2-0.6556 (xu1 0.4755 (x1=2 0 7426 (x2=1j -06532曰方程式用于3 基灌類別 0 000000000000000000002、設(shè)置相關(guān)參數(shù)(1) 右擊“類型”節(jié)點(diǎn),將x3設(shè)置為目標(biāo),其他保持不變。(2) 設(shè)置“l(fā)ogistic”節(jié)點(diǎn),在模型下,將使
9、用分區(qū)數(shù)據(jù)勾選為“無”,采用的 過程選擇“多項(xiàng)式”,“多項(xiàng)式過程”中“方法”采用“進(jìn)入法”,其他保持不變。3、結(jié)果運(yùn)行"文件(d三o生欣(g)+播入q) 一格式 檢員曰|£abr t 弓 g q 出|9 nomnai regression4l cast processing summ hodtl fag information t studo r-square“ arametef eslmatei2 000filoflbs:d errorwak<fexp(8)95% confldenct intorvai tor eip(b)lower boundupptcbound
10、intercept 6562m4924i026(x1«1 000)1 31538411 72710012«9.127.570(xu2000)232.333486i4867934131.522(xu3000)ob0(x2»1 000).747.2827.02710082.1121-2153.670(x2-2000)0b0intercept6532934»861024(x1«1 0006563393 73010535192671 010(xu2000)-.475.3“1 9151666223171.219(x1s3000|0b0x2»1
11、000|.7432717 5331006210112373571x2=20000a the reference category ts 3.000.1 000總的圖:iz類型x3實(shí)驗(yàn)8關(guān)聯(lián)分析:關(guān)聯(lián)規(guī)則一、實(shí)驗(yàn)?zāi)康?1) 了解和熟悉spss modeler及其相關(guān)知識(shí)。(2) 掌握spss modeler工具建立apriori關(guān)聯(lián)規(guī)則的方法。(3) 學(xué)會(huì)運(yùn)用spss modeler關(guān)聯(lián)規(guī)則進(jìn)行相關(guān)的內(nèi)容分析。二、實(shí)驗(yàn)環(huán)境一臺(tái)裝有spss modeler軟件系統(tǒng)的計(jì)算機(jī)。三、實(shí)驗(yàn)內(nèi)容及步驟1、創(chuàng)建apriori算法數(shù)據(jù)流(1) 創(chuàng)建“可變文件”節(jié)點(diǎn)讀入baskets.txt文件。(2) 在數(shù)據(jù)流
12、的適當(dāng)位置創(chuàng)建"apriori"節(jié)點(diǎn)。(3) 運(yùn)行結(jié)果文件(e)0生成9)技型設(shè)畫摘要注解3 r -一r“v l<411 j 的巴 i前項(xiàng)支持度百分比bffiss分比sexibeer frozenmealicann edveg14.696.5754ibeer frozenmeal sex14.895.27ibeer cannedveg sex15.094.0beerifrozenmeal can nedveg sex15.292.763sexibeericannedveg16.789.82(sexifrozenmeal lean nedveg17.387.861fro
13、ienmealbeer can nedveg16.787.425|sex|beer-17 nq7 20l排序依據(jù)左信度百分比2、設(shè)置相關(guān)參數(shù)(1) 在“字段”下,選擇“使用定制設(shè)置”選項(xiàng)。在“后項(xiàng)”和“前項(xiàng)”中選 擇關(guān)聯(lián)規(guī)則的后項(xiàng)和前項(xiàng)的變量。此例中后項(xiàng)和前項(xiàng)均為所有商品。(2) 在“類型”下,指定當(dāng)前前項(xiàng)最低條件支持度,默認(rèn)值10%;最小規(guī)則置 信度,默認(rèn)值為80%;最大前項(xiàng)數(shù),默認(rèn)為5;勾選“僅包含標(biāo)志變量的真值”。(3) 在“專家”下,選擇模式“專家”選項(xiàng),并選擇評(píng)價(jià)關(guān)聯(lián)規(guī)則的度量指標(biāo), 這里選擇默認(rèn)選項(xiàng)“規(guī)則置信度”。3、結(jié)果運(yùn)行g(shù)節(jié)點(diǎn)預(yù)覽(27個(gè)孑段.10各.文件(e)弓編輯(e)o
14、生成(£)喪格注解cardidvaluepmethodsexhomeownincomeage fruitvegfreshmeatdai13980842.712 chequemno2700046 ftt26736225.357 cashf "no3000028 ftf31087220.618 cashmno1320036 fff42674823.688 cardfno1220026 fft-'59160918 813 cardmyes1100024 fff62663046 487 cardfno15000"3sftf76299514.047 cashfyes
15、2080030 tff33876522 203 cashmyes2440022 fff92893522.975 chequefno29500ff104179214.569 cashmno2960022 tff4、考察關(guān)聯(lián)規(guī)律(1) 將apriori節(jié)點(diǎn)屮的模型計(jì)算的結(jié)果添加到數(shù)據(jù)流編輯區(qū)域的恰當(dāng)位置。(2) 點(diǎn)擊鼠標(biāo)右鍵編輯。(3) “最大預(yù)測(cè)數(shù)”中輸入數(shù)值。(4) 勾選“忽略不匹配籃項(xiàng)目”和“檢測(cè)不在籃中”。通過“表”觀察具體的結(jié)果如圖:14字段文件(£) o生成© i 預(yù)覽空|排序依據(jù):貴信度百分比m | 的|前項(xiàng)sexbeer frozenmeal cannedveg
16、cannedvegbeer frozenmeal sexfrozenmealbeer cannedveg sexbeerfrozenme 合 i cannedveg sexsexibeerlean neetvegsexifrozenmealcan nedvegfrozenmealbeer cannedvegsexbeer frozenmealcannedvegbeer frozenmealbeerfrozenmeal cannedveg支持度百分比羞信度百分比14.696.575148952715.094015.29276316.7898217.387.86116.787.42517.087
17、05917.085.88217.384 393i確定i 取消應(yīng)用®重養(yǎng)遲);總的圖:14字段實(shí)驗(yàn)9分類分析:決策樹一、實(shí)驗(yàn)日的spss modeler的決策樹(1) 了解和熟悉spss modeler及其相關(guān)知識(shí)。(2) 掌握spss modeler工具建立chaid決策樹的方法。(3) 學(xué)會(huì)運(yùn)用spss modeler決策樹進(jìn)行相關(guān)的內(nèi)容分析。二、實(shí)驗(yàn)環(huán)境-臺(tái)裝有spss modeler軟件系統(tǒng)的計(jì)算機(jī)。三、實(shí)驗(yàn)內(nèi)容及步驟1、構(gòu)建chaid數(shù)據(jù)流(1) 通過"statistic文件”節(jié)點(diǎn)讀入"telco.sav”文件。(2) 數(shù)據(jù)流中添加“分區(qū)”節(jié)點(diǎn),將樣本集劃
18、分為訓(xùn)練集和測(cè)試集。(3) 選擇建模屮的“chaid”節(jié)點(diǎn),連接到數(shù)據(jù)流的恰當(dāng)位置。2、設(shè)置相關(guān)參數(shù)(1) 在“構(gòu)建選項(xiàng)”一一“基本(b)”,選擇樹的生長(zhǎng)算法為窮舉chaido自 定義最大樹狀圖深度為5.(2) 其他相關(guān)參數(shù)的設(shè)置默認(rèn)。3、結(jié)果運(yùn)行b開月器v(2【式:11 01 電子 «tt«1 «rt: 11 c 1.0 afllt > 12ano<s 33 i«st: 0) <«60|«rt: 0)oj c o.oasa*s|hu線決hhsauttv實(shí)驗(yàn)10聚類分析:k-means一、實(shí)驗(yàn)?zāi)康膕pss model
19、er的聚類分析(1) 了解和熟悉spss modeler及其相關(guān)知識(shí)。(2) 掌握spss modeler工具建立apriori關(guān)聯(lián)規(guī)則的方法。(3) 學(xué)會(huì)運(yùn)用spss modeler關(guān)聯(lián)規(guī)則進(jìn)行相關(guān)的內(nèi)容分析。二、實(shí)驗(yàn)環(huán)境一臺(tái)裝有spss modeler軟件系統(tǒng)的計(jì)算機(jī)。三、實(shí)驗(yàn)內(nèi)容及步驟1、創(chuàng)建k-means聚類數(shù)據(jù)流(1) 創(chuàng)建 “statistic 文件”節(jié)點(diǎn)導(dǎo)入 k-means.savo(2) 在“字段選項(xiàng)”一一“類型"節(jié)點(diǎn)屮,設(shè)置“地區(qū)”角色為“無”。(3) 創(chuàng)建“kmeans”節(jié)點(diǎn),連接到恰當(dāng)?shù)奈恢谩?、設(shè)置相關(guān)參數(shù)(1) 進(jìn)入編輯界面。(2) 在“模型”模塊下指定聚類
20、數(shù)目為4,勾選“生成距離字段”和“數(shù)值” 選項(xiàng)。(3)在“專家”模塊下,勾選“模式”下的“專家”選項(xiàng),其他默認(rèn)。3、結(jié)果運(yùn)行| 0 冷meg聚類大小聚類)0文件(e) o 生jr© "泗(¥) l h%(£)i aj 1叱口 a»謝9«qoo發(fā)食大小ta®q 從 k-mean$ 三日5生(14 個(gè)字歿.10 «h3ft ) «2 文件(£)3 wi(e) 0 生咸p1w7 即 xfi®10北天河山內(nèi)遼icb:上江京潭北西»寧林x2x3x4x5|x6x71670 011848929821.19576.1 0.69926 909628021511140 248562 12057824174 9047314 84155728 0517100 4513619 2783481 28572 50 300447422799 4113470 01117599771709 921716.03716 79719996 2752459 52612609921198 53469 8.0 3337 054315681074395 4902207 7792187.71173 3-043110 588306258662791 8831412 28
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 藥品追回找回管理制度
- 藥庫藥品庫存管理制度
- 藥店安全隔離管理制度
- 藥店設(shè)備設(shè)施管理制度
- 營業(yè)現(xiàn)金收入管理制度
- 設(shè)備場(chǎng)地清掃管理制度
- 設(shè)備投放運(yùn)營管理制度
- 設(shè)備檢修日常管理制度
- 設(shè)備程序備份管理制度
- 設(shè)備設(shè)施獎(jiǎng)懲管理制度
- 期末試卷(五)(含答案含聽力原文無聽力音頻)-2024-2025學(xué)年人教PEP版英語(新教材)三年級(jí)下冊(cè)
- 湖南2024生地會(huì)考試卷及答案
- 廣東省深圳市2024年中考英語真題(含答案)
- 奇瑞入職在線測(cè)評(píng)題庫
- 四害密度監(jiān)測(cè)工作實(shí)施方案
- 石家莊橋東污水處理廠三溝式氧化溝工藝設(shè)計(jì)
- 單相橋式整流電路通用課件
- 部編版六年級(jí)語文下冊(cè)詞語表(看拼音寫詞語)
- 血液制品發(fā)展制約因素分析:基礎(chǔ)薄弱起步晚
- 半自動(dòng)點(diǎn)膠機(jī)作業(yè)指導(dǎo)書
- 設(shè)計(jì)加熱爐推料機(jī)傳動(dòng)裝置
評(píng)論
0/150
提交評(píng)論