版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)據(jù)挖掘技術(shù)簡(jiǎn)介
演講人:鐘云飛
Email:2002年7月19日大綱
什么是數(shù)據(jù)挖掘數(shù)據(jù)挖掘的標(biāo)準(zhǔn)流程:CRISP-DM數(shù)據(jù)挖掘工具——SPSSClementine簡(jiǎn)介第一部分:什么是數(shù)據(jù)挖掘?數(shù)據(jù)挖掘都干了些什么?英國電信需要發(fā)布一種新的產(chǎn)品,需要通過直郵的方式向客戶推薦這種產(chǎn)品。。。。。。使直郵的回應(yīng)率提高了100%數(shù)據(jù)挖掘都干了些什么?GUS日用品零售商店需要準(zhǔn)確的預(yù)測(cè)未來的商品銷售量,降低庫存成本。。。。。。通過數(shù)據(jù)挖掘的方法使庫存成本比原來減少了3.8%數(shù)據(jù)挖掘都干了些什么?匯豐銀行需要對(duì)不斷增長(zhǎng)的客戶群進(jìn)行分類,對(duì)每種產(chǎn)品找出最有價(jià)值的客戶。。。。。。營銷費(fèi)用減少了30%數(shù)據(jù)挖掘都干了些什么?美國國防財(cái)務(wù)部需要從每年上百萬比的軍火交易中發(fā)現(xiàn)可能存在的欺詐現(xiàn)象。。。。。。發(fā)現(xiàn)可能存在欺詐的交易,進(jìn)行深入調(diào)查,節(jié)約了大量的調(diào)查成本數(shù)據(jù)挖掘都干了些什么?美國國內(nèi)稅務(wù)局需要提高對(duì)納稅人的服務(wù)水平。。。。。。合理安排稅務(wù)官的工作,為納稅人提供更迅捷、更準(zhǔn)確的服務(wù)通過數(shù)據(jù)挖掘您可以發(fā)現(xiàn)最有價(jià)值的客戶通過數(shù)據(jù)挖掘您可以使組合銷售更有效率通過數(shù)據(jù)挖掘您可以留住那些最有價(jià)值的客戶通過數(shù)據(jù)挖掘您可以用更小的成本發(fā)現(xiàn)欺詐現(xiàn)象通過采用自動(dòng)或半自動(dòng)的手段,在海量數(shù)據(jù)中發(fā)現(xiàn)有意義的行為和規(guī)則的探測(cè)和分析活動(dòng)。數(shù)據(jù)挖掘能夠幫助你選擇正確瞄準(zhǔn)潛在目標(biāo),向現(xiàn)有的客戶提供額外的產(chǎn)品,識(shí)別那些準(zhǔn)備離開的好客戶。什么是數(shù)據(jù)挖掘電信:流失銀行:聚類(細(xì)分),交叉銷售百貨公司/超市:購物籃分析(關(guān)聯(lián)規(guī)則)保險(xiǎn):細(xì)分,交叉銷售,流失(原因分析)信用卡:欺詐探測(cè),細(xì)分電子商務(wù):網(wǎng)站日志分析稅務(wù)部門:偷漏稅行為探測(cè)警察機(jī)關(guān):犯罪行為分析醫(yī)學(xué):醫(yī)療保健數(shù)據(jù)挖掘應(yīng)用領(lǐng)域數(shù)據(jù)挖掘效益分析(直郵)(BigBank&CreditCardCompany)目的:發(fā)現(xiàn)新客戶數(shù)據(jù)挖掘以前數(shù)據(jù)挖掘以后差別發(fā)信的數(shù)量1,000,000750,000(250,000)成本$1,000,000$750,000($250,000)響應(yīng)的數(shù)量10,0009,000(1,000)每個(gè)響應(yīng)的毛利$125$125$0總毛利$1,250,000$1,125,000($125,000)凈利潤$250,000$375,000$125,000建模的費(fèi)用040,000$40,000最終的利潤$250,000$335,000$85,000第二部分:數(shù)據(jù)挖掘標(biāo)準(zhǔn)流程——CRISP-DMCRISP-DM簡(jiǎn)介
CRISP-DM是CRoss-IndustryStandardProcess-DataMining的縮寫由SPSS、NCR、Daimler-Benz在1996年制定CRISP是當(dāng)今數(shù)據(jù)挖掘業(yè)界通用流行的標(biāo)準(zhǔn)之一它強(qiáng)調(diào)數(shù)據(jù)挖掘在商業(yè)中的應(yīng)用,解決商業(yè)中存在的問題,而不是把數(shù)據(jù)挖掘局限在研究領(lǐng)域CRISP-DM
商業(yè)理解數(shù)據(jù)理解數(shù)據(jù)準(zhǔn)備建立模型模型評(píng)估模型發(fā)布商業(yè)理解(BusinessUnderstanding)找問題-確定商業(yè)目標(biāo)對(duì)現(xiàn)有資源的評(píng)估確定問題是否能夠通過數(shù)據(jù)挖掘來解決確定數(shù)據(jù)挖掘的目標(biāo)制定數(shù)據(jù)挖掘計(jì)劃數(shù)據(jù)理解(DataUnderstanding)確定數(shù)據(jù)挖掘所需要的數(shù)據(jù)對(duì)數(shù)據(jù)進(jìn)行描述數(shù)據(jù)的初步探索檢查數(shù)據(jù)的質(zhì)量Performtherest
onapowerful
server.把數(shù)據(jù)挖掘模型的結(jié)果送到相應(yīng)的管理人員手中Modelexport高度的擴(kuò)展性保證對(duì)數(shù)據(jù)庫中大量的數(shù)據(jù)進(jìn)行挖掘高度的擴(kuò)展性保證對(duì)數(shù)據(jù)庫中大量的數(shù)據(jù)進(jìn)行挖掘確定數(shù)據(jù)挖掘所需要的數(shù)據(jù)對(duì)整個(gè)數(shù)據(jù)挖掘過程的前面步驟進(jìn)行評(píng)估數(shù)據(jù)挖掘都干了些什么?電子商務(wù):網(wǎng)站日志分析數(shù)據(jù)挖掘技術(shù)簡(jiǎn)介英國電信需要發(fā)布一種新的產(chǎn)品,需要通過直郵的方式向客戶推薦這種產(chǎn)品。通過數(shù)據(jù)挖掘的方法使庫存成本比原來減少了3.稅務(wù)部門:偷漏稅行為探測(cè)數(shù)據(jù)準(zhǔn)備(DataPreparation)
選擇數(shù)據(jù)清理數(shù)據(jù)對(duì)數(shù)據(jù)進(jìn)行重建調(diào)整數(shù)據(jù)格式使之適合建模建立模型(Modeling)對(duì)各個(gè)模型進(jìn)行評(píng)價(jià)選擇數(shù)據(jù)挖掘模型建立模型模型評(píng)估(Evaluation)評(píng)估數(shù)據(jù)挖掘的結(jié)果對(duì)整個(gè)數(shù)據(jù)挖掘過程的前面步驟進(jìn)行評(píng)估確定下一步怎么辦?是發(fā)布模型?還是對(duì)數(shù)據(jù)挖掘過程進(jìn)行進(jìn)一步的調(diào)整,產(chǎn)生新的模型模型發(fā)布(Deployment)把數(shù)據(jù)挖掘模型的結(jié)果送到相應(yīng)的管理人員手中對(duì)模型進(jìn)行日常的監(jiān)測(cè)和維護(hù)定期更新數(shù)據(jù)挖掘模型第三部分:數(shù)據(jù)挖掘工具—SPSSClementine簡(jiǎn)介Makeadifferencewiththepredictivepowerofdatamining應(yīng)用Clementine達(dá)到你數(shù)據(jù)挖掘的目標(biāo)圖形化的界面、數(shù)據(jù)流的形式建立模型,保證了應(yīng)用Clementine進(jìn)行數(shù)據(jù)挖掘關(guān)注商業(yè)更甚于關(guān)注技術(shù)本身開放式的技術(shù)是更好的保護(hù)您的投資的保障高度的擴(kuò)展性保證對(duì)數(shù)據(jù)庫中大量的數(shù)據(jù)進(jìn)行挖掘業(yè)界領(lǐng)先的發(fā)布技術(shù)使數(shù)據(jù)挖掘結(jié)果更好的傳遞到相應(yīng)管理人員手中把你的商業(yè)經(jīng)驗(yàn)溶入數(shù)據(jù)挖掘過程是數(shù)據(jù)挖掘成功的關(guān)鍵Better
dataminingresults!InsightBusinessproblem?What
youknow豐富的數(shù)據(jù)挖掘算法Prediction
Neuralnet,C5.0Classification
Neuralnet,C5.0Segmentation
Kohonen,Kmeans,C5.0Association
Apriori,GRI,WebgraphSequence
CaprI,NeuralNet,Regression與SPSS及AnswerTree無縫集成提供更多的算法LogisticRegressionDiscriminantAnalysisFactorAnalysisManymore...C&RTCHAIDExhaustiveCHAIDQUEST使你在數(shù)據(jù)倉庫上的投資得到最大的回報(bào)SybaseDB2InformixOpenIngressOracleSQLServer+ODBCdriversforothers+ODBCsocketfornativedrivers開放的建模性能在Clementine中通過CEMI加入新的算法Clementine的系統(tǒng)結(jié)構(gòu)
1.Performmany
operationsin
thedatabase.2.Performtherest
onapowerful
server.3.Usetheclient
processorfor
viewingresults.ClementineServerdelivershugeperformancegainsGeneratinga
distributiongraph995secondswhenprocessedonthedesktop69secondswhenprocessedontheserver19secondswhenpushedbackintothedatabase
用更小的成本發(fā)現(xiàn)欺詐現(xiàn)象銀行:聚類(細(xì)分),交叉銷售69secondswhenprocessedontheserverClementineSolutionPublisher:
領(lǐng)先的模型發(fā)布技術(shù)通過數(shù)據(jù)挖掘的方法使庫存成本比原來減少了3.Modelbuilding模型評(píng)估(Evaluation)把數(shù)據(jù)挖掘模型的結(jié)果送到相應(yīng)的管理人員手中與SPSS及AnswerTree無縫集成提供更多的算法(BigBank&CreditCardCompany)把數(shù)據(jù)挖掘模型的結(jié)果送到相應(yīng)的管理人員手中數(shù)據(jù)挖掘技術(shù)簡(jiǎn)介In-databaseprocessingdeliversbetterperformanceasdatasetsgetlarger定期更新數(shù)據(jù)挖掘模型稅務(wù)部門:偷漏稅行為探測(cè)In-databaseprocessingdeliversbetterperformanceasdatasetsgetlargerShedatabase電子商務(wù):網(wǎng)站日志分析Classification
Neuralnet,C5.Modelexport演講人:鐘云飛ExhaustiveCHAIDModelexport用更小的成本發(fā)現(xiàn)欺詐現(xiàn)象確定問題是否能夠通過數(shù)據(jù)挖掘來解決第三部分:數(shù)據(jù)挖掘工具圖形化的界面、數(shù)據(jù)流的形式建立模型,保證了應(yīng)用Clementine進(jìn)行數(shù)據(jù)挖掘關(guān)注商業(yè)更甚于關(guān)注技術(shù)本身DiscriminantAnalysisClementineServercuts
modelbuildingtimeupto90%Modelbuildingtimeneededforbuildingmodelsontheserverasapercentageoft
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年醫(yī)療病例管理協(xié)議
- 2025年度美發(fā)店客戶滿意度調(diào)查與服務(wù)提升合同8篇
- 2025年食堂檔口租賃及市場(chǎng)營銷合作合同范本3篇
- 2024門店超市經(jīng)營管理承包合同3篇
- 2025年度綠色建材采購與施工一體化項(xiàng)目承包合同4篇
- 2025年度智能家用空調(diào)安裝與維護(hù)服務(wù)協(xié)議書
- 2025年度模具制造設(shè)備租賃及節(jié)能改造合同4篇
- 二零二五年度版黃金首飾等抵押交易合同
- 2025年度綠色有機(jī)糧食購銷合作經(jīng)營協(xié)議
- 2025年度風(fēng)力發(fā)電樁基施工勞務(wù)分包驗(yàn)收標(biāo)準(zhǔn)合同
- 電纜擠塑操作手冊(cè)
- 浙江寧波鄞州區(qū)市級(jí)名校2025屆中考生物全真模擬試卷含解析
- IATF16949基礎(chǔ)知識(shí)培訓(xùn)教材
- 【MOOC】大學(xué)生創(chuàng)新創(chuàng)業(yè)知能訓(xùn)練與指導(dǎo)-西北農(nóng)林科技大學(xué) 中國大學(xué)慕課MOOC答案
- 勞務(wù)派遣公司員工考核方案
- 基礎(chǔ)生態(tài)學(xué)-7種內(nèi)種間關(guān)系
- 2024年光伏農(nóng)田出租合同范本
- 《阻燃材料與技術(shù)》課件 第3講 阻燃基本理論
- 2024-2030年中國黃鱔市市場(chǎng)供需現(xiàn)狀與營銷渠道分析報(bào)告
- 新人教版九年級(jí)化學(xué)第三單元復(fù)習(xí)課件
- 江蘇省南京鼓樓區(qū)2024年中考聯(lián)考英語試題含答案
評(píng)論
0/150
提交評(píng)論