數(shù)據(jù)挖掘簡介_第1頁
數(shù)據(jù)挖掘簡介_第2頁
數(shù)據(jù)挖掘簡介_第3頁
數(shù)據(jù)挖掘簡介_第4頁
數(shù)據(jù)挖掘簡介_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、數(shù)據(jù)挖掘概述 2022/8/81Data Mining: Concepts and Techniques主要內(nèi)容1 背景2 數(shù)據(jù)挖掘定義3 主要功能4 數(shù)據(jù)挖掘模型5 實現(xiàn)流程6 數(shù)據(jù)挖掘的應(yīng)用7 主要工具2022/8/82Data Mining: Concepts and Techniques1 背景現(xiàn)實情況:人類積累的數(shù)據(jù)量以每月高于15%的速度增加,如果不借助強(qiáng)有力的挖掘工具,僅依靠人的能力來理解這些數(shù)據(jù)是不可能的。現(xiàn)在人們已經(jīng)評估出世界上信息的數(shù)量每二十個月翻一番,并且數(shù)據(jù)庫的數(shù)量與大小正在以更快的速度增長。2022/8/83Data Mining: Concepts and Tech

2、niques1 背景 著名的“啤酒尿布”案例:美國加州某個超級賣場通過數(shù)據(jù)挖掘發(fā)現(xiàn),下班后前來購買嬰兒尿布的男顧客大都購買啤酒。于是經(jīng)理當(dāng)機(jī)立斷,重新布置貨架,把啤酒類商品布置在嬰兒尿布貨架附近,并在二者之間放置佐酒食品,同時還把男士日常用品就近布置。這樣,上述幾種商品的銷量大增。2022/8/84Data Mining: Concepts and Techniques2 數(shù)據(jù)挖掘定義數(shù)據(jù)挖掘(Data Mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。數(shù)據(jù)挖掘相近的包括:數(shù)據(jù)融合、數(shù)據(jù)分析和決策

3、支持等。發(fā)現(xiàn)的知識要可接受、可理解、可運用;并不要求發(fā)現(xiàn)放之四海皆準(zhǔn)的知識,僅支持特定的發(fā)現(xiàn)問題。2022/8/85Data Mining: Concepts and Techniques數(shù)據(jù)挖掘的演化進(jìn)化階段商業(yè)問題支持技術(shù)產(chǎn)品廠家產(chǎn)品特點數(shù)據(jù)搜集(60年代)“過去五年中我的總收入是多少?”計算機(jī)、磁帶和磁盤IBM,CDC提供歷史性的、靜態(tài)的數(shù)據(jù)信息數(shù)據(jù)訪問(80年代)“在新英格蘭的分部去年三月的銷售額是多少?”關(guān)系數(shù)據(jù)庫(RDBMS),結(jié)構(gòu)化查詢語言(SQL),ODBC Oracle、Sybase、Informix、IBM、MicrosoftOracle、Sybase、Informix、I

4、BM、Microsoft在記錄級提供歷史性的、動態(tài)數(shù)據(jù)信息數(shù)據(jù)倉庫;決策支持(90年代)“在新英格蘭的分部去年三月的銷售額是多少?波士頓據(jù)此可得出什么結(jié)論?”聯(lián)機(jī)分析處理(OLAP)、多維數(shù)據(jù)庫、數(shù)據(jù)倉庫Pilot、Comshare、Arbor、Cognos、Microstrategy在各種層次上提供回溯的、動態(tài)的數(shù)據(jù)信息數(shù)據(jù)挖掘(正在流行)“下個月波士頓的銷售會怎么樣?為什么?”高級算法、多處理器計算機(jī)、海量數(shù)據(jù)庫Pilot、Lockheed、IBM、SGI、其他初創(chuàng)公司提供預(yù)測性的信息2022/8/86Data Mining: Concepts and Techniques數(shù)據(jù)挖掘與其他科

5、學(xué)的關(guān)系 數(shù)據(jù)挖掘是一個交叉學(xué)科領(lǐng)域,受多個學(xué)科影響,包括數(shù)據(jù)庫系統(tǒng)、統(tǒng)計學(xué)、機(jī)器學(xué)習(xí)、可視化和信息科學(xué) 。2022/8/87Data Mining: Concepts and Techniques數(shù)據(jù)挖掘與傳統(tǒng)數(shù)據(jù)分析方法 統(tǒng)計學(xué)和數(shù)據(jù)挖掘的目標(biāo)非常相似,而且數(shù)據(jù)挖掘中的許多算法也源于數(shù)理統(tǒng)計,統(tǒng)計學(xué)對數(shù)據(jù)挖掘發(fā)展的貢獻(xiàn)功不可沒。 聯(lián)系: 區(qū)別: 傳統(tǒng)的數(shù)據(jù)分析方法一般都是先給出一個假設(shè)然后通過數(shù)據(jù)驗證,在一定意義上是假設(shè)驅(qū)動的;與之相反,數(shù)據(jù)挖掘在一定意義上是發(fā)現(xiàn)驅(qū)動的,模式都是通過大量的搜索工作從數(shù)據(jù)中自動提取出來 。即數(shù)據(jù)挖掘是要發(fā)現(xiàn)那些不能靠直覺發(fā)現(xiàn)的信息或知識,甚至是違背直覺的信息

6、或知識,挖掘出的信息越是出乎意料,就可能越有價值。2022/8/88Data Mining: Concepts and Techniques3 主要功能1. 概念/類別描述(Concept/Class Description) 概念/類別描述是指對數(shù)據(jù)集做一個簡潔的總體性描述并/或描述它與某一對照數(shù)據(jù)集的差別。 例1:我們收集移動電話費月消費額超出1000元的客戶資料,然后利用數(shù)據(jù)挖掘進(jìn)行分析,獲得這類客戶的總體性描述:3550歲,有工作,月收入5000元以上,擁有良好的信用度; 2022/8/89Data Mining: Concepts and Techniques3 主要功能2 關(guān)聯(lián)分析

7、(Association Analysis)關(guān)聯(lián)規(guī)則挖掘就是發(fā)現(xiàn)大量數(shù)據(jù)中項集之間有趣的關(guān)聯(lián)關(guān)聯(lián)規(guī)則挖掘的典型案例:購物籃問題 在商場中擁有大量的商品(項目),如:牛奶、面包等,客戶將所購買的商品放入到自己的購物籃中。 通過發(fā)現(xiàn)顧客放入購物籃中的不同商品之間的聯(lián)系,分析顧客的購買習(xí)慣。哪些物品經(jīng)常被顧客購買? 同一次購買中,哪些商品經(jīng)常會被一起購買? 一般用戶的購買過程中是否存在一定的購買時間序列?2022/8/810Data Mining: Concepts and Techniques3 主要功能基本表示形式: 前提條件結(jié)論支持度, 置信度 buys(x, “diapers”) buys(

8、x, “beers”) 0.5%, 66% major(x, “CS”) takes(x, “DB”) grade(x, “A”) 1%, 75% 具體應(yīng)用:利潤最大化 商品貨架設(shè)計:更加適合客戶的購物路徑 貨存安排:實現(xiàn)超市的零庫存管理 用戶分類:提供個性化的服務(wù) 3 關(guān)聯(lián)分析(Association Analysis)關(guān)聯(lián)分析在交易數(shù)據(jù)分析、支持定向市場、商品目錄設(shè)計和其他業(yè)務(wù)決策等方面有著廣泛的應(yīng)用。2022/8/811Data Mining: Concepts and Techniques1.3 主要功能4 分類與預(yù)測(Classification and Prediction)研究已

9、分類資料的特征,分析對象屬性,據(jù)此建立一個分類函數(shù)或分類模型,然后運用該模型計算總結(jié)出的數(shù)據(jù)特征,將其他未經(jīng)分類或新的數(shù)據(jù)分派到不同的組中。預(yù)測是根據(jù)對象屬性、過去的觀察值和有關(guān)資料對該屬性的未來值進(jìn)行預(yù)測,預(yù)測使用的技巧主要是回歸分析、神經(jīng)網(wǎng)絡(luò)方法等。2022/8/812Data Mining: Concepts and Techniques1.3 主要功能常用方法決策樹(decision tree)貝葉斯分類(bayes classification)人工神經(jīng)網(wǎng)絡(luò)(ANN)K最近鄰分類法(k-nearest neighbor classifier)基于事例的推理(case-based re

10、asoning)遺傳算法(genetic algorithm)粗糙集方法(rough set approach)模糊集方法(fuzzy set approach)回歸分析(regression analysis)2022/8/813Data Mining: Concepts and Techniques1.3 主要功能5. 聚類分析(Clustering Analysis)把數(shù)據(jù)對象的集合分組到不同的聚類中聚類原則同一類內(nèi)的數(shù)據(jù)盡可能相似不同類數(shù)據(jù)盡可能不相似聚類實際上是一個無導(dǎo)師分類:沒有預(yù)先給定類別信息2022/8/814Data Mining: Concepts and Techniqu

11、es1.3 主要功能常用方法基于劃分的聚類分析方法基于層次的聚類分析方法基于密度的聚類分析方法基于網(wǎng)格的聚類分析方法基于模型的聚類分析方法2022/8/815Data Mining: Concepts and Techniques1.3 主要功能6. 時間序列分析(Time-Series Analysis) 時間序列分析即預(yù)測(Prediction),是指通過對大量時間序列數(shù)據(jù)的分析找到特定的規(guī)則和感興趣的特性,包括搜索相似序列或者子序列,挖掘序列模式、周期性、趨勢和偏差。預(yù)測的目的是對未來的情況作出估計。 如對主要股票的交易數(shù)據(jù)進(jìn)行建模分析。方法:趨勢和偏差: 回歸分析序列模式匹配:周期性分

12、析基于類似性的分析2022/8/816Data Mining: Concepts and Techniques1.3 主要功能7 特異點分析(Outlier Analysis)與數(shù)據(jù)的一般行為或模式不一致。多數(shù)為噪聲或異常數(shù)據(jù),常被剔除。在某些應(yīng)用中,孤立點數(shù)據(jù)更有趣,如:銀行詐騙,洗黑錢、恐怖行為。有專門進(jìn)行孤立點研究的方法與技術(shù)。統(tǒng)計方法是占主流,考察數(shù)據(jù)的分布,用距離來度量。2022/8/817Data Mining: Concepts and Techniques1.4數(shù)據(jù)挖掘模型 為了使數(shù)據(jù)挖掘技術(shù)在產(chǎn)業(yè)界得到更好的應(yīng)用,歐洲委員會聯(lián)合一些數(shù)據(jù)挖掘軟件廠商開發(fā)了CRISP-DM(Cr

13、oss Industry Standard Process for Data Mining)模型,目的是把數(shù)據(jù)挖掘的過程標(biāo)準(zhǔn)化, 使數(shù)據(jù)挖掘項目的實施速度更快、成本更低、更可靠并且更容易管理。 CRISP-DM模型最先在1996年被提出,當(dāng)前的白皮書版本是1.0。2022/8/818Data Mining: Concepts and TechniquesCRISP-DM(Cross Industry Standard Process for Data Mining)模型2022/8/819Data Mining: Concepts and Techniques1.4數(shù)據(jù)挖掘模型 CRISP-D

14、M模型中,數(shù)據(jù)挖掘包括六個步驟: 1.業(yè)務(wù)理解(Business Understanding)階段 具體地,包括: 確定業(yè)務(wù)目標(biāo) 項目可行性分析確定數(shù)據(jù)挖掘目標(biāo) 提出初步的項目計劃2022/8/820Data Mining: Concepts and Techniques1.4數(shù)據(jù)挖掘模型確定業(yè)務(wù)目標(biāo):分析項目的背景,從業(yè)務(wù)視點分析項目的目標(biāo)和需求,確定業(yè)務(wù)角度的成功標(biāo)準(zhǔn);項目可行性分析:分析擁有的資源,條件和限制,風(fēng)險估計,成本和效益估計;確定數(shù)據(jù)挖掘目標(biāo):明確確定數(shù)據(jù)挖掘的目標(biāo)和成功標(biāo)準(zhǔn),數(shù)據(jù)挖掘的目標(biāo)和業(yè)務(wù)目標(biāo)是不一樣的,前者指技術(shù)上的,例如生成一棵決策樹等;提出項目計劃:對整個項目做一

15、個計劃,初步估計用到的工具和技術(shù)。 2022/8/821Data Mining: Concepts and Techniques1.4數(shù)據(jù)挖掘模型 2數(shù)據(jù)理解(Data Understanding)階段 具體地,包括:收集原始數(shù)據(jù):收集本項目所涉及到的數(shù)據(jù),如有必要,把數(shù)據(jù)裝入數(shù)據(jù)處理工具,并作一些初步的數(shù)據(jù)集成的工作,生成相應(yīng)報告;描述數(shù)據(jù):對數(shù)據(jù)做一些大致的描述,例如記錄數(shù)、屬性數(shù)等,給出相應(yīng)報告;探索數(shù)據(jù):對數(shù)據(jù)做簡單的統(tǒng)計分析,例如關(guān)鍵屬性的分布等;檢查數(shù)據(jù)質(zhì)量:包括數(shù)據(jù)是否完整、數(shù)據(jù)是否有錯、是否有缺失值等問題。 2022/8/822Data Mining: Concepts and

16、 Techniques1.4數(shù)據(jù)挖掘模型3數(shù)據(jù)準(zhǔn)備(Data Preparation)階段 具體地,包括:數(shù)據(jù)選擇:根據(jù)數(shù)據(jù)挖掘目標(biāo)和數(shù)據(jù)質(zhì)量選擇合適的數(shù)據(jù),包括表的選擇、記錄選擇和屬性選擇;數(shù)據(jù)清潔:提高選擇好的數(shù)據(jù)的質(zhì)量,例如去除噪音,估計缺失值等;數(shù)據(jù)創(chuàng)建:在原有數(shù)據(jù)的基礎(chǔ)上是生成新的屬性或記錄;2022/8/823Data Mining: Concepts and Techniques1.4數(shù)據(jù)挖掘模型數(shù)據(jù)合并:利用表連接等方式將幾個數(shù)據(jù)集合并在一起;數(shù)據(jù)格式化:把數(shù)據(jù)轉(zhuǎn)換成適合數(shù)據(jù)挖掘處理的格式。2022/8/824Data Mining: Concepts and Techniqu

17、es1.4數(shù)據(jù)挖掘模型4建立模型(Modeling)階段 具體地,包括:選擇建模技術(shù):確定數(shù)據(jù)挖掘算法和參數(shù),可能會利用多個算法;測試方案設(shè)計:設(shè)計某種測試模型的質(zhì)量和有效性的機(jī)制;模型訓(xùn)練:在準(zhǔn)備好的數(shù)據(jù)集上運行數(shù)據(jù)挖掘算法,得出一個或者多個模型;模型測試評估:根據(jù)測試方案進(jìn)行測試,從數(shù)據(jù)挖掘技術(shù)的角度確定數(shù)據(jù)挖掘目標(biāo)是否成功。 2022/8/825Data Mining: Concepts and Techniques1.4數(shù)據(jù)挖掘模型5模型評估(Evaluation)階段 具體地,包括:結(jié)果評估:從商業(yè)角度評估得到的模型,甚至實際試用該模型測試其效果;過程回顧:回顧項目的所有流程,確定每

18、一個階段都沒有失誤;確定下一步工作:根據(jù)結(jié)果評估和過程回顧得出的結(jié)論,確定是部署該挖掘模型還是從某個階段開始重新開始。 2022/8/826Data Mining: Concepts and Techniques1.4數(shù)據(jù)挖掘模型6部署(Deployment)階段 具體地,包括:部署計劃:對在業(yè)務(wù)運作中部署模型作出計劃;監(jiān)控和維護(hù)計劃:如何監(jiān)控模型在實際業(yè)務(wù)中的使用情況,如何維護(hù)該模型;作出最終報告:項目總結(jié),項目經(jīng)驗和項目結(jié)果;項目回顧:回顧項目的實施過程,總結(jié)經(jīng)驗教訓(xùn);對數(shù)據(jù)挖掘的運行效果做一個預(yù)測。 2022/8/827Data Mining: Concepts and Techniqu

19、es1.4數(shù)據(jù)挖掘模型 為保證項目的可靠性和可管理性,CRISP-DM規(guī)定一個數(shù)據(jù)挖掘項目應(yīng)該產(chǎn)生11個報告: 業(yè)務(wù)理解報告 原始數(shù)據(jù)收集報告 數(shù)據(jù)描述報告 數(shù)據(jù)探索報告 數(shù)據(jù)質(zhì)量報告 數(shù)據(jù)集描述報告 模型訓(xùn)練報告 模型評估報告 部署計劃 監(jiān)控和維護(hù)計劃 總結(jié)報告 通過這些報告,可以有效地控制數(shù)據(jù)挖掘項目進(jìn)程,減少開發(fā)風(fēng)險。 2022/8/828Data Mining: Concepts and Techniques1.5 實現(xiàn)流程 各步驟之間互相影響、反復(fù)調(diào)整,形成一種螺旋式上升過程。2022/8/829Data Mining: Concepts and Techniques1.5 實現(xiàn)流程

20、數(shù)據(jù)準(zhǔn)備 KDD的處理對象是大量的數(shù)據(jù),這些數(shù)據(jù)一般存儲在數(shù)據(jù)庫系統(tǒng)中,是長期積累的結(jié)果。但往往不合適直接在這些數(shù)據(jù)上進(jìn)行知識挖掘,需要做一些準(zhǔn)備工作,也就數(shù)據(jù)的預(yù)處理。數(shù)據(jù)預(yù)處理包括數(shù)據(jù)的選擇(選擇相關(guān)數(shù)據(jù))、凈化(消除噪音、冗余數(shù)據(jù))、推測(推算缺值數(shù)據(jù))、轉(zhuǎn)換(離散型數(shù)據(jù)與連續(xù)型數(shù)據(jù)之間的轉(zhuǎn)換)、數(shù)據(jù)縮減(減少數(shù)據(jù)量)等。 數(shù)據(jù)準(zhǔn)備是KDD的第一個步驟,也是比較重要的一個步驟。數(shù)據(jù)準(zhǔn)備得好壞將直接影響數(shù)據(jù)挖掘的效率和準(zhǔn)確度以及最終模式的有效性。 2022/8/830Data Mining: Concepts and Techniques1.5 實現(xiàn)流程數(shù)據(jù)挖掘 數(shù)據(jù)挖掘是最為關(guān)鍵的步驟,

21、它根據(jù)KDD的目標(biāo),選取相應(yīng)算法的參數(shù),分析數(shù)據(jù),得到可能形成知識的模式模型。目前采用較多的技術(shù)有決策樹、分類、聚類、粗糙集、關(guān)聯(lián)規(guī)則、神經(jīng)網(wǎng)絡(luò)、遺傳算法等。 2022/8/831Data Mining: Concepts and Techniques1.5 實現(xiàn)流程模式的評估、解釋 通過上面步驟所得到的模式,有可能是沒有意義或沒有實用價值的,因此需要評估,確定那些是有效的、有用的模式。此外,大部分模式是用數(shù)學(xué)手段描述的表達(dá)式,很難被人理解,還需要將其解釋成可理解的方式以呈現(xiàn)給用戶。 2022/8/832Data Mining: Concepts and Techniques1.5 實現(xiàn)流程知

22、識運用 發(fā)現(xiàn)知識是為了運用,如何使知識能被運用也是KDD的步驟之一。運用知識有兩種方法:一種是只需看知識本身所描述的關(guān)系或結(jié)果,就可以對決策提供支持;另一種是要求對新的數(shù)據(jù)運用知識,由此可能產(chǎn)生新的問題,而需要對知識做進(jìn)一步的優(yōu)化。 KDD過程可能需要多次的循環(huán)反復(fù),每一個步驟一旦與預(yù)期目標(biāo)不符,都要回到前面的步驟,重新調(diào)整,重新執(zhí)行。2022/8/833Data Mining: Concepts and Techniques1.5 實現(xiàn)流程 數(shù)據(jù)挖掘過程的分步實現(xiàn),不同的步驟需要不同的專業(yè)人員參與完成,大體分為三類:1)業(yè)務(wù)分析人員:要求精通業(yè)務(wù),能夠解釋業(yè)務(wù)對象,并根據(jù)各業(yè)務(wù)對象確定出用于

23、數(shù)據(jù)定義和挖掘算法的業(yè)務(wù)需求。2)數(shù)據(jù)分析人員:精通數(shù)據(jù)分析技術(shù),并對統(tǒng)計學(xué)有較熟練的掌握,有能力把業(yè)務(wù)需求轉(zhuǎn)化為數(shù)據(jù)挖掘的各步操作,并為每步操作選擇合適的技術(shù)。3)數(shù)據(jù)管理人員:精通數(shù)據(jù)管理技術(shù),并從數(shù)據(jù)庫或數(shù)據(jù)倉庫中收集數(shù)據(jù)。2022/8/834Data Mining: Concepts and Techniques1.5 實現(xiàn)流程Increasing potentialto supportbusiness decisionsEnd UserBusiness Analyst DataAnalystDBADecision MakingData PresentationVisualizatio

24、n TechniquesData MiningInformation DiscoveryData ExplorationStatistical Summary, Querying, and ReportingData Preprocessing/Integration, Data WarehousesData SourcesPaper, Files, Web documents, Scientific experiments, Database Systems2022/8/835Data Mining: Concepts and Techniques1.5 實現(xiàn)流程 從上可見,數(shù)據(jù)挖掘是一個多

25、領(lǐng)域技術(shù)人員合作的過程,也是一個在資金上和技術(shù)上高投入的過程。這一過程要反復(fù)進(jìn)行,在反復(fù)過程中,不斷地趨近事物的本質(zhì),不斷地優(yōu)先問題的解決方案。 2022/8/836Data Mining: Concepts and Techniques1.6 數(shù)據(jù)挖掘的應(yīng)用金融領(lǐng)域營銷領(lǐng)域電子政務(wù)電信領(lǐng)域工業(yè)生產(chǎn)生物和醫(yī)學(xué)2022/8/837Data Mining: Concepts and Techniques1.6 數(shù)據(jù)挖掘的應(yīng)用Debt$40KQQQQII123456factor 1factor 2factor n神經(jīng)網(wǎng)絡(luò) Neural Networks聚類分析 ClusteringOpenAccnt

26、Add NewProductDecreaseUsage?Time序列分析 Sequence Analysis決策樹 Decision Trees 傾向性分析 客戶保留 客戶生命周期管理 目標(biāo)市場 價格彈性分析 客戶細(xì)分 市場細(xì)分 傾向性分析 客戶保留 目標(biāo)市場 欺詐檢測關(guān)聯(lián)分析 Association 市場組合分析 套裝產(chǎn)品分析 目錄設(shè)計 交叉銷售2022/8/838Data Mining: Concepts and Techniques1.6 數(shù)據(jù)挖掘的應(yīng)用-金融信用卡分析業(yè)務(wù)模型客戶信用等級評估客戶透支分析客戶利潤分析客戶消費行為分析 客戶消費異常行為分析2022/8/839Data Mi

27、ning: Concepts and Techniques1.6 數(shù)據(jù)挖掘的應(yīng)用-金融數(shù)據(jù)挖掘在反洗錢系統(tǒng)中的應(yīng)用2022/8/840Data Mining: Concepts and Techniques1.6 數(shù)據(jù)挖掘的應(yīng)用-營銷關(guān)聯(lián)分析-市場籃子分析,用于了解顧客的購買習(xí)慣和偏好,有助于決定市場商品的擺放和產(chǎn)品的捆綁銷售策略;序列模式與市場籃子分析相似,不過是用某時間點發(fā)現(xiàn)的產(chǎn)品購買或其他行為模式來預(yù)測將來購買產(chǎn)品或服務(wù)類別的概率;聚類用于市場細(xì)分,將顧客按其行為或特征模式的相似性劃分為若干細(xì)分市場,以采取有針對性的營銷策略;分類用于預(yù)測哪些人會對郵寄廣告和產(chǎn)品目錄、贈券等促銷手段有反應(yīng)

28、,還可用于顧客定級、破產(chǎn)預(yù)測等。 2022/8/841Data Mining: Concepts and Techniques1.6 數(shù)據(jù)挖掘的應(yīng)用-營銷數(shù)據(jù)挖掘在營銷中的應(yīng)用流程2022/8/842Data Mining: Concepts and Techniques1.6 數(shù)據(jù)挖掘的應(yīng)用-營銷應(yīng)用實例1:美國運通公司(American Express)有一個用于記錄信用卡業(yè)務(wù)的數(shù)據(jù)庫,通過對這些數(shù)據(jù)進(jìn)行挖掘,制定了“關(guān)聯(lián)結(jié)算(Relationship Billing)優(yōu)惠”的促銷策略,即如果一個顧客在一個商店用運通卡購買一套時裝,那么在同一個商店再買一雙鞋,就可以得到比較大的折扣,既增加了商店的銷售量,也可以增加運通卡在該商店的使用率。2022/8/843Data Mining: Concepts and Techniques1.6 數(shù)據(jù)挖掘的應(yīng)用-營銷應(yīng)用實例2:美國的讀者文摘(Reader s Digest)出版公司運行著一個積累了40年的業(yè)務(wù)數(shù)據(jù)庫,其中容納有遍布全球的一億多個訂戶的資料,并保證數(shù)據(jù)不斷得到實時的更新,基于對客戶資料數(shù)據(jù)庫進(jìn)行數(shù)據(jù)挖掘的優(yōu)勢,使讀者文摘出版公司能夠從通俗雜

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論