數(shù)據(jù)挖掘軟件Clementine介紹_第1頁
數(shù)據(jù)挖掘軟件Clementine介紹_第2頁
數(shù)據(jù)挖掘軟件Clementine介紹_第3頁
數(shù)據(jù)挖掘軟件Clementine介紹_第4頁
數(shù)據(jù)挖掘軟件Clementine介紹_第5頁
已閱讀5頁,還剩29頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、數(shù)據(jù)挖掘軟件數(shù)據(jù)挖掘軟件 clementine介紹介紹 clementine產(chǎn)品介紹產(chǎn)品介紹 clementine是isl(integral solutions limited)公司開發(fā)的 數(shù)據(jù)挖掘工具平臺。1999年spss公司收購了isl公司, 對clementine產(chǎn)品進(jìn)行重新整合和開發(fā),現(xiàn)在clementine 已經(jīng)成為spss公司的又一亮點(diǎn)。 作為一個數(shù)據(jù)挖掘平臺, clementine結(jié)合商業(yè)技術(shù)可以 快速建立預(yù)測性模型,進(jìn)而應(yīng)用到商業(yè)活動中,幫助人們 改進(jìn)決策過程。 強(qiáng)大的數(shù)據(jù)挖掘功能和顯著的投資回報率 使得clementine在業(yè)界久負(fù)盛譽(yù)。 同那些僅僅著重于模型 的外在表現(xiàn)而

2、忽略了數(shù)據(jù)挖掘在整個業(yè)務(wù)流程中的應(yīng)用價 值的其它數(shù)據(jù)挖掘工具相比,clementine其功能強(qiáng)大的數(shù) 據(jù)挖掘算法,使數(shù)據(jù)挖掘貫穿業(yè)務(wù)流程的始終,在縮短投 資回報周期的同時極大提高了投資回報率。 clementine中的data mining 的方法 classification clustering estimation prediction market basket analysis description 預(yù)測 和分類推估類似,不同在于 是預(yù)測未來,將新資料帶入 既有資料建立的模型預(yù)見結(jié) 果 銀行新申請信用卡的客戶要 給多少額度 估計 和分類的不同在於目標(biāo)變量 為連續(xù)值,常和分類配合 用

3、分類判斷為會貸款客戶后 再推估會貸款的金額 聚類 非監(jiān)督式,未知有幾類,將 性質(zhì)類似的資料加以區(qū)分, 把顧客資料分群對不同群體 采用不同推銷手法 購物籃分析 找出哪些事件會一起發(fā)生 超級市場發(fā)現(xiàn)男性客戶會一 起購買啤酒跟尿布 描述 增進(jìn)對于資料的認(rèn)識,圖形 視覺化呈現(xiàn),或規(guī)則、決策 樹等 相相關(guān)關(guān)技技術(shù)術(shù) 神經(jīng)網(wǎng)絡(luò) 決策樹 (c5.0 c&rt) logistic 回歸 等等 相相關(guān)技術(shù)關(guān)技術(shù) k-means 兩步驟 kohonen 等等 相關(guān)技術(shù)相關(guān)技術(shù) 分類跟估計的所有方法 相相關(guān)關(guān)技技術(shù)術(shù) apriori gri 等等 相相關(guān)關(guān)技技術(shù)術(shù) 決策樹規(guī)則 各類圖表 等等 分類 目標(biāo)變量(因變量

4、、反應(yīng)變量數(shù))為類別的狀況 信用卡公司將既有資料分為偽卡非偽卡找出偽 卡的模式 debt$40k q q q q q q q q i ii i1 1 2 2 3 34 4 5 56 6 factor 1 factor 2 factor n 神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò) neural networksneural networks 聚類分析聚類分析 clusteringclustering open accnt add new product decrease usage ? time 序列分析序列分析 sequence analysissequence analysis決策樹決策樹 decision tr

5、eesdecision trees 傾向性分析 客戶保留 客戶生命周期管理 目標(biāo)市場 價格彈性分析 客戶細(xì)分 市場細(xì)分 傾向性分析 客戶保留 目標(biāo)市場 欺詐檢測 關(guān)聯(lián)分析關(guān)聯(lián)分析 associationassociation 市場組合分析 套裝產(chǎn)品分析 目錄設(shè)計 交叉銷售 clementine面板面板 clementine的使用的使用 1打開一個流文件 2執(zhí)行流文件中的某一流程執(zhí)行流文件中的某一流程 3得到結(jié)果 4瀏覽結(jié)果1 4瀏覽結(jié)果2 5瀏覽結(jié)果3 clementine流文件的建立流文件的建立 1讀取數(shù)據(jù)文件1 在節(jié)點(diǎn)區(qū),雙擊文件讀入 節(jié)點(diǎn),在流區(qū)出現(xiàn)其圖標(biāo) 再在流工作區(qū),雙擊 文件讀入節(jié)

6、點(diǎn),讀入 所需數(shù)據(jù)文件。 讀取數(shù)據(jù)文件2 對數(shù)據(jù)進(jìn)行處理 1 2 4 5 6 去掉兩個變量na、k3 增加新變量:na_to_k=na/k 定義變量的方向 在節(jié)點(diǎn)區(qū)雙擊type節(jié)點(diǎn), 使之在流區(qū)中出現(xiàn) 把drug的 direction 從in(輸入) 改為out (輸出) 作分類處理 讀取文本數(shù)據(jù)與查看數(shù)據(jù) clementine可以讀入的數(shù)據(jù)文件 文本格式數(shù)據(jù) spss/sas數(shù)據(jù) excel,access,dbase,foxpro,oracle, sql server,db2等數(shù)據(jù)庫 用戶輸入數(shù)據(jù) 文件讀入節(jié)點(diǎn): 讀取文本數(shù)據(jù)與查看數(shù)據(jù) 查看數(shù)據(jù)1 點(diǎn)擊data 和types,出現(xiàn)數(shù)據(jù)的屬性

7、 查看數(shù)據(jù)2 點(diǎn)擊table,使之出現(xiàn)在流 工作區(qū),再點(diǎn)擊execute (執(zhí)行),得到右面圖表: clementine中的字段類 離散型 二分 eg:sex:m/f 多分 eg: 等級:好/中/差 離散 eg: 連續(xù)型 整數(shù) 實數(shù) 日期、時間 其它 數(shù)據(jù)理解之?dāng)?shù)據(jù)質(zhì)量 缺失值的檢查:quality節(jié)點(diǎn) 點(diǎn)擊quality節(jié)點(diǎn),使之 出現(xiàn)在工作區(qū),再執(zhí)行 quality,出現(xiàn)數(shù)據(jù)質(zhì)量 表,從中可以看出, 數(shù)據(jù)100%有效,一共 有200個有效數(shù)據(jù)。 distribution節(jié)點(diǎn)-初步 理解字符型字 段的分布 1 2 3 4 簡單數(shù)據(jù)整理 derive節(jié)點(diǎn)介紹 2 增加新變量: na_to_k=na/k 根據(jù)原有字段值生成新字段值 filter節(jié)點(diǎn)介紹 對某些字段進(jìn)行重命名或丟棄某些無意義的字段 去掉兩個變 量na、k 數(shù)據(jù)理解之?dāng)?shù)據(jù)間簡單關(guān)系 web節(jié)點(diǎn)-研究字符型字段間關(guān)系1 web節(jié)點(diǎn)-研究字符型字段間關(guān)系2 執(zhí)行后,得到字符間的網(wǎng)狀連系,其中粗線條,表示 字符之間的強(qiáng)聯(lián)系。 statistics節(jié)點(diǎn)-研究連 續(xù)型字段

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論