2上午第10章數(shù)據(jù)挖掘的誤區(qū)_第1頁
2上午第10章數(shù)據(jù)挖掘的誤區(qū)_第2頁
免費(fèi)預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第10章:數(shù)據(jù)挖掘的誤區(qū)誤區(qū)1:數(shù)據(jù)挖掘是萬能的只要有Y,模型可以自己從數(shù)據(jù)中獲取信息,構(gòu)造合理的模型性模型線性/Logistic回歸神經(jīng)網(wǎng)絡(luò)決策樹/回歸樹時(shí)間序列進(jìn)、出描述性模型聚類關(guān)聯(lián)分析7/18/20152誤區(qū)2:有了數(shù)據(jù)庫就有足夠的數(shù)據(jù)做挖掘數(shù)據(jù)挖掘業(yè)務(wù)問題?DataBase算法交易型數(shù)據(jù)和數(shù)據(jù)挖掘需要的分析型數(shù)據(jù)是完全不同的Dae7/18/20153Originator acct_id type productemographicsacct_idAgeeProducts product_id descriptionPeriods DatekCustomers acct_id ctiv

2、ation datTrans Details acct_id trans_id date-time product_id channel_id amount trans_typeoriginator_id誤區(qū)2:有了數(shù)據(jù)庫就有足夠的數(shù)據(jù)做挖掘數(shù)據(jù)挖掘需要的分析型數(shù)據(jù)集分析型數(shù)據(jù)集變量目標(biāo)變量是否違約客戶統(tǒng)計(jì)信息賬戶屬性消費(fèi)行為還款行為開卡時(shí)長(zhǎng)金卡/普卡信用額度自動(dòng)還款員工標(biāo)志額度調(diào)整發(fā)卡機(jī)構(gòu)收益率最近3期的消費(fèi)總額/最近6期消費(fèi)總額最近12個(gè)月全額還款賬單期數(shù)最近12個(gè)月最低還款賬單期數(shù)最近12個(gè)月未欠款賬單期數(shù) 最近12個(gè)月逾期還款期數(shù)距最近一次逾期的月數(shù)距上次年費(fèi)收取的月數(shù)最近3期帳戶逾期

3、月數(shù).最近6期帳戶逾期月數(shù).最近3個(gè)月內(nèi)的最大逾期天數(shù)最近6個(gè)月內(nèi)的最大逾期天數(shù)最近3個(gè)月還款率最近6個(gè)月還款率年收入行業(yè)類別戶籍狀況最近3期最近6期最近3期費(fèi)金額占比最近6期費(fèi)金額占比最近3期消費(fèi)金額占比消費(fèi)金額占比(+)消)消狀況職務(wù)級(jí)別消費(fèi)交易筆數(shù)最近6期消費(fèi)交易筆數(shù)最近3個(gè)月的消費(fèi)金額最近3個(gè)月的消費(fèi)筆數(shù)最近6個(gè)月的消費(fèi)金額最近6個(gè)月的消費(fèi)筆數(shù)誤區(qū)3:數(shù)據(jù)挖掘=數(shù)據(jù)+算法數(shù)據(jù)挖掘大部分的時(shí)間不是用來處理復(fù)雜的挖掘算法事實(shí)是:在數(shù)據(jù)挖掘項(xiàng)目中,大多數(shù)工作是業(yè)務(wù)需求、數(shù)據(jù)準(zhǔn)備與探索相關(guān)的數(shù)據(jù) + 算法從實(shí)踐的角度看,數(shù)據(jù)挖掘算法本身存在:不能確定模式的內(nèi)容為什么要尋找這些模式如何去利用這些模式CRISP-DM 是公認(rèn)的、較有影響的方法論之一。它強(qiáng)調(diào)數(shù)據(jù)挖掘不單是數(shù)據(jù)的組織

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論