



版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、數(shù)據(jù)挖掘軟件數(shù)據(jù)挖掘軟件CLEMENTINE介紹介紹Clementine產(chǎn)品介紹產(chǎn)品介紹 Clementine是ISL(Integral Solutions Limited)公司開(kāi)發(fā)的數(shù)據(jù)挖掘工具平臺(tái)。1999年SPSS公司收購(gòu)了ISL公司,對(duì)Clementine產(chǎn)品進(jìn)行重新整合和開(kāi)發(fā),現(xiàn)在Clementine已經(jīng)成為SPSS公司的又一亮點(diǎn)。 作為一個(gè)數(shù)據(jù)挖掘平臺(tái), Clementine結(jié)合商業(yè)技術(shù)可以快速建立預(yù)測(cè)性模型,進(jìn)而應(yīng)用到商業(yè)活動(dòng)中,幫助人們改進(jìn)決策過(guò)程。 強(qiáng)大的數(shù)據(jù)挖掘功能和顯著的投資回報(bào)率使得Clementine在業(yè)界久負(fù)盛譽(yù)。 同那些僅僅著重于模型的外在表現(xiàn)而忽略了數(shù)據(jù)挖掘在整
2、個(gè)業(yè)務(wù)流程中的應(yīng)用價(jià)值的其它數(shù)據(jù)挖掘工具相比,Clementine其功能強(qiáng)大的數(shù)據(jù)挖掘算法,使數(shù)據(jù)挖掘貫穿業(yè)務(wù)流程的始終,在縮短投資回報(bào)周期的同時(shí)極大提高了投資回報(bào)率。 Clementine中的Data Mining 的方法 Classification Clustering Estimation Prediction Market Basket Analysis Description預(yù)測(cè)和分類推估類似,不同在于是預(yù)測(cè)未來(lái),將新資料帶入既有資料建立的模型預(yù)見(jiàn)結(jié)果銀行新申請(qǐng)信用卡的客戶要給多少額度估計(jì)和分類的不同在於目標(biāo)變量為連續(xù)值,常和分類配合用分類判斷為會(huì)貸款客戶后再推估會(huì)貸款的金額聚類非
3、監(jiān)督式,未知有幾類,將性質(zhì)類似的資料加以區(qū)分,把顧客資料分群對(duì)不同群體采用不同推銷手法購(gòu)物籃分析找出哪些事件會(huì)一起發(fā)生超級(jí)市場(chǎng)發(fā)現(xiàn)男性客戶會(huì)一起購(gòu)買啤酒跟尿布描述增進(jìn)對(duì)于資料的認(rèn)識(shí),圖形視覺(jué)化呈現(xiàn),或規(guī)則、決策樹(shù)等相相關(guān)關(guān)技技術(shù)術(shù)神經(jīng)網(wǎng)絡(luò)決策樹(shù) (C5.0 C&RT)Logistic 回歸等等相相關(guān)技術(shù)關(guān)技術(shù)K-Means兩步驟Kohonen等等相關(guān)技術(shù)相關(guān)技術(shù)分類跟估計(jì)的所有方法相相關(guān)關(guān)技技術(shù)術(shù)AprioriGRI等等相相關(guān)關(guān)技技術(shù)術(shù)決策樹(shù)規(guī)則各類圖表等等分類目標(biāo)變量(因變量、反應(yīng)變量數(shù))為類別的狀況信用卡公司將既有資料分為偽卡非偽卡找出偽卡的模式Debt$40KQ QQ QQ QQ
4、 QI II I1 12 23 34 45 56 6factor 1factor 2factor n神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò) Neural NetworksNeural Networks聚類分析聚類分析 ClusteringClusteringOpenAccntAdd NewProductDecreaseUsage?Time序列分析序列分析 Sequence AnalysisSequence Analysis決策樹(shù)決策樹(shù) Decision TreesDecision Trees 傾向性分析 客戶保留 客戶生命周期管理 目標(biāo)市場(chǎng) 價(jià)格彈性分析 客戶細(xì)分 市場(chǎng)細(xì)分 傾向性分析 客戶保留 目標(biāo)市場(chǎng) 欺詐檢測(cè)
5、關(guān)聯(lián)分析關(guān)聯(lián)分析 AssociationAssociation 市場(chǎng)組合分析 套裝產(chǎn)品分析 目錄設(shè)計(jì) 交叉銷售Clementine面板面板Clementine的使用的使用 1打開(kāi)一個(gè)流文件 2執(zhí)行流文件中的某一流程執(zhí)行流文件中的某一流程 3得到結(jié)果 4瀏覽結(jié)果1 4瀏覽結(jié)果2 5瀏覽結(jié)果3Clementine流文件的建立流文件的建立1讀取數(shù)據(jù)文件1 在節(jié)點(diǎn)區(qū),雙擊文件讀入節(jié)點(diǎn),在流區(qū)出現(xiàn)其圖標(biāo)再在流工作區(qū),雙擊文件讀入節(jié)點(diǎn),讀入所需數(shù)據(jù)文件。 讀取數(shù)據(jù)文件2 對(duì)數(shù)據(jù)進(jìn)行處理12456 去掉兩個(gè)變量Na、K3 增加新變量:Na_to_K=Na/K 定義變量的方向在節(jié)點(diǎn)區(qū)雙擊Type節(jié)點(diǎn),使之在流
6、區(qū)中出現(xiàn)把Drug的Direction從in(輸入)改為out(輸出) 作分類處理讀取文本數(shù)據(jù)與查看數(shù)據(jù) Clementine可以讀入的數(shù)據(jù)文件文本格式數(shù)據(jù) SPSS/SAS數(shù)據(jù) Excel,Access,dBase,F(xiàn)oxpro,Oracle,SQL Server,DB2等數(shù)據(jù)庫(kù) 用戶輸入數(shù)據(jù)文件讀入節(jié)點(diǎn):讀取文本數(shù)據(jù)與查看數(shù)據(jù) 查看數(shù)據(jù)1點(diǎn)擊Data 和Types,出現(xiàn)數(shù)據(jù)的屬性 查看數(shù)據(jù)2點(diǎn)擊Table,使之出現(xiàn)在流工作區(qū),再點(diǎn)擊Execute(執(zhí)行),得到右面圖表:Clementine中的字段類離散型 二分 eg:sex:m/f 多分 eg: 等級(jí):好/中/差 離散 eg: 連續(xù)型 整
7、數(shù) 實(shí)數(shù) 日期、時(shí)間 其它數(shù)據(jù)理解之?dāng)?shù)據(jù)質(zhì)量 缺失值的檢查:quality節(jié)點(diǎn)點(diǎn)擊Quality節(jié)點(diǎn),使之出現(xiàn)在工作區(qū),再執(zhí)行Quality,出現(xiàn)數(shù)據(jù)質(zhì)量表,從中可以看出,數(shù)據(jù)100%有效,一共有200個(gè)有效數(shù)據(jù)。 Distribution節(jié)點(diǎn)-初步 理解字符型字段的分布 1234 簡(jiǎn)單數(shù)據(jù)整理 Derive節(jié)點(diǎn)介紹2 增加新變量:Na_to_K=Na/K根據(jù)原有字段值生成新字段值 Filter節(jié)點(diǎn)介紹對(duì)某些字段進(jìn)行重命名或丟棄某些無(wú)意義的字段去掉兩個(gè)變量Na、K數(shù)據(jù)理解之?dāng)?shù)據(jù)間簡(jiǎn)單關(guān)系 Web節(jié)點(diǎn)-研究字符型字段間關(guān)系1 Web節(jié)點(diǎn)-研究字符型字段間關(guān)系2執(zhí)行后,得到字符間的網(wǎng)狀連系,其中粗線條,表示字符之間的強(qiáng)聯(lián)系。 Statistics節(jié)點(diǎn)-研究連 續(xù)型字段間線性相關(guān)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 中通快遞司機(jī)合同協(xié)議書
- C語(yǔ)言關(guān)鍵字理解與使用試題及答案
- 冷庫(kù)合同協(xié)議書范本圖片
- 主播合同和解協(xié)議書范本
- 語(yǔ)言在文學(xué)創(chuàng)作中的關(guān)鍵作用試題及答案
- 回顧與總結(jié)軟件測(cè)試經(jīng)驗(yàn)試題及答案
- 烘焙技術(shù)入股合同協(xié)議書
- 房租合同到期解約協(xié)議書
- 軟件開(kāi)發(fā)常見(jiàn)問(wèn)題試題及答案
- 2025設(shè)備安裝調(diào)試合同
- 廣東省潮州市各縣區(qū)鄉(xiāng)鎮(zhèn)行政村村莊村名明細(xì)
- 代領(lǐng)畢業(yè)證委托書模板(通用6篇)
- 預(yù)拌混凝土運(yùn)輸單(正本)
- 服務(wù)器驗(yàn)收?qǐng)?bào)告
- 裝配式建筑設(shè)計(jì)施工總結(jié)PPT(127頁(yè))
- [安徽]高速公路改擴(kuò)建工程交通組織方案(155頁(yè))
- 張齊華:《平均數(shù)》課件
- 部編版四年級(jí)語(yǔ)文下冊(cè)第五單元復(fù)習(xí)教案設(shè)計(jì)
- 《鐵路線路里程斷鏈設(shè)置和管理規(guī)定》
- 21世紀(jì)音樂(lè)教育發(fā)展趨勢(shì)——問(wèn)題與對(duì)策2004年音樂(lè)教育國(guó)際學(xué)術(shù)會(huì)議在上海音樂(lè)學(xué)院召開(kāi)
- 中國(guó)字-中國(guó)人-歌詞
評(píng)論
0/150
提交評(píng)論