版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、數(shù)據(jù)挖掘軟件數(shù)據(jù)挖掘軟件 clementine介紹介紹 clementine產(chǎn)品介紹產(chǎn)品介紹 clementine是isl(integral solutions limited)公司開(kāi)發(fā)的 數(shù)據(jù)挖掘工具平臺(tái)。1999年spss公司收購(gòu)了isl公司, 對(duì)clementine產(chǎn)品進(jìn)行重新整合和開(kāi)發(fā),現(xiàn)在clementine 已經(jīng)成為spss公司的又一亮點(diǎn)。 作為一個(gè)數(shù)據(jù)挖掘平臺(tái), clementine結(jié)合商業(yè)技術(shù)可以 快速建立預(yù)測(cè)性模型,進(jìn)而應(yīng)用到商業(yè)活動(dòng)中,幫助人們 改進(jìn)決策過(guò)程。 強(qiáng)大的數(shù)據(jù)挖掘功能和顯著的投資回報(bào)率 使得clementine在業(yè)界久負(fù)盛譽(yù)。 同那些僅僅著重于模型 的外在表現(xiàn)而
2、忽略了數(shù)據(jù)挖掘在整個(gè)業(yè)務(wù)流程中的應(yīng)用價(jià) 值的其它數(shù)據(jù)挖掘工具相比,clementine其功能強(qiáng)大的數(shù) 據(jù)挖掘算法,使數(shù)據(jù)挖掘貫穿業(yè)務(wù)流程的始終,在縮短投 資回報(bào)周期的同時(shí)極大提高了投資回報(bào)率。 clementine中的data mining 的方法 classification clustering estimation prediction market basket analysis description 預(yù)測(cè) 和分類(lèi)推估類(lèi)似,不同在于 是預(yù)測(cè)未來(lái),將新資料帶入 既有資料建立的模型預(yù)見(jiàn)結(jié) 果 銀行新申請(qǐng)信用卡的客戶要 給多少額度 估計(jì) 和分類(lèi)的不同在於目標(biāo)變量 為連續(xù)值,常和分類(lèi)配合 用
3、分類(lèi)判斷為會(huì)貸款客戶后 再推估會(huì)貸款的金額 聚類(lèi) 非監(jiān)督式,未知有幾類(lèi),將 性質(zhì)類(lèi)似的資料加以區(qū)分, 把顧客資料分群對(duì)不同群體 采用不同推銷(xiāo)手法 購(gòu)物籃分析 找出哪些事件會(huì)一起發(fā)生 超級(jí)市場(chǎng)發(fā)現(xiàn)男性客戶會(huì)一 起購(gòu)買(mǎi)啤酒跟尿布 描述 增進(jìn)對(duì)于資料的認(rèn)識(shí),圖形 視覺(jué)化呈現(xiàn),或規(guī)則、決策 樹(shù)等 相相關(guān)關(guān)技技術(shù)術(shù) 神經(jīng)網(wǎng)絡(luò) 決策樹(shù) (c5.0 c&rt) logistic 回歸 等等 相相關(guān)技術(shù)關(guān)技術(shù) k-means 兩步驟 kohonen 等等 相關(guān)技術(shù)相關(guān)技術(shù) 分類(lèi)跟估計(jì)的所有方法 相相關(guān)關(guān)技技術(shù)術(shù) apriori gri 等等 相相關(guān)關(guān)技技術(shù)術(shù) 決策樹(shù)規(guī)則 各類(lèi)圖表 等等 分類(lèi) 目標(biāo)變量(因變量
4、、反應(yīng)變量數(shù))為類(lèi)別的狀況 信用卡公司將既有資料分為偽卡非偽卡找出偽 卡的模式 debt$40k q q q q q q q q i ii i1 1 2 2 3 34 4 5 56 6 factor 1 factor 2 factor n 神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò) neural networksneural networks 聚類(lèi)分析聚類(lèi)分析 clusteringclustering open accnt add new product decrease usage ? time 序列分析序列分析 sequence analysissequence analysis決策樹(shù)決策樹(shù) decision tr
5、eesdecision trees 傾向性分析 客戶保留 客戶生命周期管理 目標(biāo)市場(chǎng) 價(jià)格彈性分析 客戶細(xì)分 市場(chǎng)細(xì)分 傾向性分析 客戶保留 目標(biāo)市場(chǎng) 欺詐檢測(cè) 關(guān)聯(lián)分析關(guān)聯(lián)分析 associationassociation 市場(chǎng)組合分析 套裝產(chǎn)品分析 目錄設(shè)計(jì) 交叉銷(xiāo)售 clementine面板面板 clementine的使用的使用 1打開(kāi)一個(gè)流文件 2執(zhí)行流文件中的某一流程執(zhí)行流文件中的某一流程 3得到結(jié)果 4瀏覽結(jié)果1 4瀏覽結(jié)果2 5瀏覽結(jié)果3 clementine流文件的建立流文件的建立 1讀取數(shù)據(jù)文件1 在節(jié)點(diǎn)區(qū),雙擊文件讀入 節(jié)點(diǎn),在流區(qū)出現(xiàn)其圖標(biāo) 再在流工作區(qū),雙擊 文件讀入節(jié)
6、點(diǎn),讀入 所需數(shù)據(jù)文件。 讀取數(shù)據(jù)文件2 對(duì)數(shù)據(jù)進(jìn)行處理 1 2 4 5 6 去掉兩個(gè)變量na、k3 增加新變量:na_to_k=na/k 定義變量的方向 在節(jié)點(diǎn)區(qū)雙擊type節(jié)點(diǎn), 使之在流區(qū)中出現(xiàn) 把drug的 direction 從in(輸入) 改為out (輸出) 作分類(lèi)處理 讀取文本數(shù)據(jù)與查看數(shù)據(jù) clementine可以讀入的數(shù)據(jù)文件 文本格式數(shù)據(jù) spss/sas數(shù)據(jù) excel,access,dbase,foxpro,oracle, sql server,db2等數(shù)據(jù)庫(kù) 用戶輸入數(shù)據(jù) 文件讀入節(jié)點(diǎn): 讀取文本數(shù)據(jù)與查看數(shù)據(jù) 查看數(shù)據(jù)1 點(diǎn)擊data 和types,出現(xiàn)數(shù)據(jù)的屬性
7、 查看數(shù)據(jù)2 點(diǎn)擊table,使之出現(xiàn)在流 工作區(qū),再點(diǎn)擊execute (執(zhí)行),得到右面圖表: clementine中的字段類(lèi) 離散型 二分 eg:sex:m/f 多分 eg: 等級(jí):好/中/差 離散 eg: 連續(xù)型 整數(shù) 實(shí)數(shù) 日期、時(shí)間 其它 數(shù)據(jù)理解之?dāng)?shù)據(jù)質(zhì)量 缺失值的檢查:quality節(jié)點(diǎn) 點(diǎn)擊quality節(jié)點(diǎn),使之 出現(xiàn)在工作區(qū),再執(zhí)行 quality,出現(xiàn)數(shù)據(jù)質(zhì)量 表,從中可以看出, 數(shù)據(jù)100%有效,一共 有200個(gè)有效數(shù)據(jù)。 distribution節(jié)點(diǎn)-初步 理解字符型字 段的分布 1 2 3 4 簡(jiǎn)單數(shù)據(jù)整理 derive節(jié)點(diǎn)介紹 2 增加新變量: na_to_k=na/k 根據(jù)原有字段值生成新字段值 filter節(jié)點(diǎn)介紹 對(duì)某些字段進(jìn)行重命名或丟棄某些無(wú)意義的字段 去掉兩個(gè)變 量na、k 數(shù)據(jù)理解之?dāng)?shù)據(jù)間簡(jiǎn)單關(guān)系 web節(jié)點(diǎn)-研究字符型字段間關(guān)系1 web節(jié)點(diǎn)-研究字符型字段間關(guān)系2 執(zhí)行后,得到字符間的網(wǎng)狀連系,其中粗線條,表示 字符之間的強(qiáng)聯(lián)系。 statistics節(jié)點(diǎn)-研究連 續(xù)型字段
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 個(gè)人臨街租賃合同
- 2024年礦山開(kāi)采土石方運(yùn)輸服務(wù)合同
- 2025消防工程承包合同范本
- 商丘醫(yī)學(xué)高等??茖W(xué)?!缎畔D形設(shè)計(jì)》2023-2024學(xué)年第一學(xué)期期末試卷
- 商丘醫(yī)學(xué)高等專科學(xué)?!稊?shù)字化室內(nèi)建筑制圖AutoCAD》2023-2024學(xué)年第一學(xué)期期末試卷
- 商丘醫(yī)學(xué)高等??茖W(xué)校《材料熱力學(xué)基礎(chǔ)》2023-2024學(xué)年第一學(xué)期期末試卷
- 2024年簡(jiǎn)化版無(wú)子離婚合同參考版B版
- 2024年版聘用協(xié)議編號(hào)及管理規(guī)章版
- 委托生產(chǎn)醫(yī)療設(shè)備合同范例
- 汽車(chē)代理授權(quán)合同范例
- 學(xué)生常見(jiàn)病防治專項(xiàng)方案
- 醫(yī)院藥品目錄(很好的)
- 安徽省縣中聯(lián)盟2023-2024學(xué)年高二上學(xué)期12月聯(lián)考數(shù)學(xué)試題
- 家具廠編碼規(guī)則(新)
- 班前安全技術(shù)交底記錄表
- 規(guī)范權(quán)力運(yùn)行方面存在問(wèn)題及整改措施范文(五篇)
- 減壓孔板計(jì)算
- 博物館學(xué)概論課件:博物館與觀眾
- 著色滲透探傷檢測(cè)報(bào)告
- 反恐培訓(xùn)內(nèi)容
- 配套課件-計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)實(shí)踐教程-王秋華
評(píng)論
0/150
提交評(píng)論