打印53大數(shù)據(jù)的分析方法(一)_第1頁
打印53大數(shù)據(jù)的分析方法(一)_第2頁
打印53大數(shù)據(jù)的分析方法(一)_第3頁
打印53大數(shù)據(jù)的分析方法(一)_第4頁
打印53大數(shù)據(jù)的分析方法(一)_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、大數(shù)據(jù)是2012 的時(shí)髦詞匯,正受到越來越多人的關(guān)注和談?wù)?。大?shù)據(jù)之所以受到人們的關(guān)注和談?wù)?,是因?yàn)殡[藏在大數(shù)據(jù)后面超千億美元的市場(chǎng)機(jī)會(huì)。大數(shù)據(jù)時(shí)代,數(shù)據(jù)挖掘是最關(guān)鍵的工作。以下內(nèi)容供個(gè)人學(xué)習(xí)用,感興趣的朋友可以看一下。智庫(kù)百科是這樣描述數(shù)據(jù)挖掘的“數(shù)據(jù)挖掘又稱數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn),是目前人工智能和數(shù)據(jù)庫(kù)領(lǐng)域研究的熱點(diǎn)問題,所謂數(shù)據(jù)挖掘是指從數(shù)據(jù)庫(kù)的大量數(shù)據(jù)中揭示出隱含的、先前未知的并有潛在價(jià)值的信息的非平凡過程。數(shù)據(jù)挖掘是一種決策支持過程,它主要基于人工智能、機(jī)器學(xué)習(xí)、模式識(shí)別、統(tǒng)計(jì)學(xué)、數(shù)據(jù)庫(kù)、可視化技術(shù)等,高度自動(dòng)化地分析企業(yè)的數(shù)據(jù),做出歸納性的推理,從中挖掘出潛在的模式,幫助決策者調(diào)整市場(chǎng)

2、策略,減少風(fēng)險(xiǎn),做出正確的決策。數(shù)據(jù)挖掘的定義技術(shù)上的定義及含義數(shù)據(jù)挖掘 (data mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過程。這個(gè)定義包括好幾層含義:數(shù)據(jù)源必須是真實(shí)的、大量的、含噪聲的; 發(fā)現(xiàn)的是用戶感興趣的知識(shí); 發(fā)現(xiàn)的知識(shí)要可接受、可理解、可運(yùn)用 ; 并不要求發(fā)現(xiàn)放之四海皆準(zhǔn)的知識(shí),僅支持特定的發(fā)現(xiàn)問題。與數(shù)據(jù)挖掘相近的同義詞有數(shù)據(jù)融合、人工智能、商務(wù)智能、模式識(shí)別、機(jī)器學(xué)習(xí)、知識(shí)發(fā)現(xiàn)、數(shù)據(jù)分析和決策支持等。-何為知識(shí)從廣義上理解,數(shù)據(jù)、信息也是知識(shí)的表現(xiàn)形式,但是人們更把概念、規(guī)

3、則、模式、規(guī)律和約束等看作知識(shí)。人們把數(shù)據(jù)看作是形成知識(shí)的源泉,好像從礦石中采礦或淘金一樣。原始數(shù)據(jù)可以是結(jié)構(gòu)化的,如關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù); 也可以是半結(jié)構(gòu)化的,如文本、圖形和圖像數(shù)據(jù);甚至是分布在網(wǎng)絡(luò)上的異構(gòu)型數(shù)據(jù)。發(fā)現(xiàn)知識(shí)的方法可以是數(shù)學(xué)的,也可以是非數(shù)學(xué)的; 可以是演繹的,也可以是歸納的。發(fā)現(xiàn)的知識(shí)可以被用于信息管理,查詢優(yōu)化, 決策支持和過程控制等,還可以用于數(shù)據(jù)自身的維護(hù)。因此,數(shù)據(jù)挖掘是一門交叉學(xué)科,它把人們對(duì)數(shù)據(jù)的應(yīng)用從低層次的簡(jiǎn)單查詢,提升到從數(shù)據(jù)中挖掘知識(shí),提供決策支持。 在這種需求牽引下,匯聚了不同領(lǐng)域的研究者,尤其是數(shù)據(jù)庫(kù)技術(shù)、人工智能技術(shù)、數(shù)理統(tǒng)計(jì)、可視化技術(shù)、并行計(jì)算等

4、方面的學(xué)者和工程技術(shù)人員,投身到數(shù)據(jù)挖掘這一新興的研究領(lǐng)域,形成新的技術(shù)熱點(diǎn)。這里所說的知識(shí)發(fā)現(xiàn),不是要求發(fā)現(xiàn)放之四海而皆準(zhǔn)的真理,也不是要去發(fā)現(xiàn)嶄新的自然科學(xué)定理和純數(shù)學(xué)公式, 更不是什么機(jī)器定理證明。實(shí)際上, 所有發(fā)現(xiàn)的知識(shí)都是相對(duì)的,是有特定前提和約束條件,面向特定領(lǐng)域的,同時(shí)還要能夠易于被用戶理解。最好能用自然語言表達(dá)所發(fā)現(xiàn)的結(jié)果。商業(yè)角度的定義數(shù)據(jù)挖掘是一種新的商業(yè)信息處理技術(shù),其主要特點(diǎn)是對(duì)商業(yè)數(shù)據(jù)庫(kù)中的大量業(yè)務(wù)數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析和其他模型化處理,從中提取輔助商業(yè)決策的關(guān)鍵性數(shù)據(jù)。簡(jiǎn)而言之,數(shù)據(jù)挖掘其實(shí)是一類深層次的數(shù)據(jù)分析方法。數(shù)據(jù)分析本身已經(jīng)有很多年的歷史,只不過在過去數(shù)

5、據(jù)收集和分析的目的是用于科學(xué)研究,另外,由于當(dāng)時(shí)計(jì)算能力的限制,對(duì)大數(shù)據(jù)量進(jìn)行分析的復(fù)雜數(shù)據(jù)分析方法受到很大限制。現(xiàn)在,由于各行業(yè)業(yè)務(wù)自動(dòng)化的實(shí)現(xiàn),商業(yè)領(lǐng)域產(chǎn)生了大量的業(yè)務(wù)數(shù)據(jù),這些數(shù)據(jù)不再是為了分析的目的而收集的,而是由于純機(jī)會(huì)的(opportunistic)商業(yè)運(yùn)作而產(chǎn)生。分析這些數(shù)據(jù)也不再是單純?yōu)榱搜芯康男枰?,更主要是為商業(yè)決策提供真正有價(jià)值的信息,進(jìn)而獲得利潤(rùn)。 但所有企業(yè)面臨的一個(gè)共同問題是:企業(yè)數(shù)據(jù)量非常大,而其中真正有價(jià)值的信息卻很少,因此從大量的數(shù)據(jù)中經(jīng)過深層分析,獲得有利于商業(yè)運(yùn)作、提高競(jìng)爭(zhēng)力的信息,就像從礦石中淘金一樣,數(shù)據(jù)挖掘也因此而得名。因此, 數(shù)據(jù)挖掘可以描述為:按企

6、業(yè)既定業(yè)務(wù)目標(biāo),對(duì)大量的企業(yè)數(shù)據(jù)進(jìn)行探索和分析,揭示隱藏的、未知的或驗(yàn)證已知的規(guī)律性,并進(jìn)一步將其模型化的先進(jìn)有效的方法。數(shù)據(jù)挖掘常用的方法利用數(shù)據(jù)挖掘進(jìn)行數(shù)據(jù)分析常用的方法主要有分類、回歸分析、聚類、關(guān)聯(lián)規(guī)則、特征、變化和偏差分析、 web頁挖掘等,它們分別從不同的角度對(duì)數(shù)據(jù)進(jìn)行挖掘。分類。分類是找出數(shù)據(jù)庫(kù)中一組數(shù)據(jù)對(duì)象的共同特點(diǎn)并按照分類模式將其劃分為不同的類,其目的是通過分類模型,將數(shù)據(jù)庫(kù)中的數(shù)據(jù)項(xiàng)映射到某個(gè)給定的類別。它可以應(yīng)用到客戶的分類、客戶的屬性和特征分析、客戶滿意度分析、客戶的購(gòu)買趨勢(shì)預(yù)測(cè)等,如一個(gè)汽車零售商將客戶按照對(duì)汽車的喜好劃分成不同的類,這樣營(yíng)銷人員就可以將新型汽車的廣

7、告手冊(cè)直接郵寄到有這種喜好的客戶手中,從而大大增加了商業(yè)機(jī)會(huì)?;貧w分析?;貧w分析方法反映的是事務(wù)數(shù)據(jù)庫(kù)中屬性值在時(shí)間上的特征,產(chǎn)生一個(gè)將數(shù)據(jù)項(xiàng)映射到一個(gè)實(shí)值預(yù)測(cè)變量的函數(shù),發(fā)現(xiàn)變量或?qū)傩蚤g的依賴關(guān)系,其主要研究問題包括數(shù)據(jù)序列的趨勢(shì)特征、數(shù)據(jù)序列的預(yù)測(cè)以及數(shù)據(jù)間的相關(guān)關(guān)系等。它可以應(yīng)用到市場(chǎng)營(yíng)銷的各個(gè)方面,如客戶尋求、保持和預(yù)防客戶流失活動(dòng)、產(chǎn)品生命周期分析、銷售趨勢(shì)預(yù)測(cè)及有針對(duì)性的促銷活動(dòng)等。聚類。聚類分析是把一組數(shù)據(jù)按照相似性和差異性分為幾個(gè)類別,其目的是使得屬于同一類別的數(shù)據(jù)間的相似性盡可能大,不同類別中的數(shù)據(jù)間的相似性盡可能小。它可以應(yīng)用到客戶群體的分類、客戶背景分析、客戶購(gòu)買趨勢(shì)預(yù)測(cè)

8、、市場(chǎng)的細(xì)分等。關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則是描述數(shù)據(jù)庫(kù)中數(shù)據(jù)項(xiàng)之間所存在的關(guān)系的規(guī)則,即根據(jù)一個(gè)事務(wù)中某些項(xiàng)的出現(xiàn)可導(dǎo)出另一些項(xiàng)在同一事務(wù)中也出現(xiàn),即隱藏在數(shù)據(jù)間的關(guān)聯(lián)或相互關(guān)系。在客戶關(guān)系管理中,通過對(duì)企業(yè)的客戶數(shù)據(jù)庫(kù)里的大量數(shù)據(jù)進(jìn)行挖掘,可以從大量的記錄中發(fā)現(xiàn)有趣的關(guān)聯(lián)關(guān)系,找出影響市場(chǎng)營(yíng)銷效果的關(guān)鍵因素,為產(chǎn)品定位、定價(jià)與定制客戶群,客戶尋求、細(xì)分與保持,市場(chǎng)營(yíng)銷與推銷,營(yíng)銷風(fēng)險(xiǎn)評(píng)估和詐騙預(yù)測(cè)等決策支持提供參考依據(jù)。特征。特征分析是從數(shù)據(jù)庫(kù)中的一組數(shù)據(jù)中提取出關(guān)于這些數(shù)據(jù)的特征式,這些特征式表達(dá)了該數(shù)據(jù)集的總體特征。如營(yíng)銷人員通過對(duì)客戶流失因素的特征提取,可以得到導(dǎo)致客戶流失的一系列原因和主要特

9、征,利用這些特征可以有效地預(yù)防客戶的流失。變化和偏差分析。偏差包括很大一類潛在有趣的知識(shí),如分類中的反常實(shí)例,模式的例外,觀察結(jié)果對(duì)期望的偏差等,其目的是尋找觀察結(jié)果與參照量之間有意義的差別。在企業(yè)危機(jī)管理及其預(yù)警中,管理者更感興趣的是那些意外規(guī)則。意外規(guī)則的挖掘可以應(yīng)用到各種異常信息的發(fā)現(xiàn)、分析、識(shí)別、評(píng)價(jià)和預(yù)警等方面。web頁挖掘。隨著internet的迅速發(fā)展及web 的全球普及,使得 web上的信息量無比豐富,通過對(duì) web的挖掘,可以利用web 的海量數(shù)據(jù)進(jìn)行分析,收集政治、經(jīng)濟(jì)、政策、科技、金融、各種市場(chǎng)、競(jìng)爭(zhēng)對(duì)手、供求信息、客戶等有關(guān)的信息,集中精力分析和處理那些對(duì)企業(yè)有重大或潛

10、在重大影響的外部環(huán)境信息和內(nèi)部經(jīng)營(yíng)信息,并根據(jù)分析結(jié)果找出企業(yè)管理過程中出現(xiàn)的各種問題和可能引起危機(jī)的先兆,對(duì)這些信息進(jìn)行分析和處理,以便識(shí)別、分析、評(píng)價(jià)和管理危機(jī)。數(shù)據(jù)挖掘的功能數(shù)據(jù)挖掘通過預(yù)測(cè)未來趨勢(shì)及行為,做出前攝的、基于知識(shí)的決策。數(shù)據(jù)挖掘的目標(biāo)是從數(shù)據(jù)庫(kù)中發(fā)現(xiàn)隱含的、有意義的知識(shí),主要有以下五類功能。1、自動(dòng)預(yù)測(cè)趨勢(shì)和行為數(shù)據(jù)挖掘自動(dòng)在大型數(shù)據(jù)庫(kù)中尋找預(yù)測(cè)性信息,以往需要進(jìn)行大量手工分析的問題如今可以迅速直接由數(shù)據(jù)本身得出結(jié)論。一個(gè)典型的例子是市場(chǎng)預(yù)測(cè)問題,數(shù)據(jù)挖掘使用過去有關(guān)促銷的數(shù)據(jù)來尋找未來投資中回報(bào)最大的用戶,其它可預(yù)測(cè)的問題包括預(yù)報(bào)破產(chǎn)以及認(rèn)定對(duì)指定事件最可能作出反應(yīng)的群體

11、。2、關(guān)聯(lián)分析數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫(kù)中存在的一類重要的可被發(fā)現(xiàn)的知識(shí)。若兩個(gè)或多個(gè)變量的取值之間存在某種規(guī)律性,就稱為關(guān)聯(lián)。關(guān)聯(lián)可分為簡(jiǎn)單關(guān)聯(lián)、時(shí)序關(guān)聯(lián)、因果關(guān)聯(lián)。關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫(kù)中隱藏的關(guān)聯(lián)網(wǎng)。有時(shí)并不知道數(shù)據(jù)庫(kù)中數(shù)據(jù)的關(guān)聯(lián)函數(shù),即使知道也是不確定的,因此關(guān)聯(lián)分析生成的規(guī)則帶有可信度。3、聚類數(shù)據(jù)庫(kù)中的記錄可被化分為一系列有意義的子集,即聚類。聚類增強(qiáng)了人們對(duì)客觀現(xiàn)實(shí)的認(rèn)識(shí),是概念描述和偏差分析的先決條件。聚類技術(shù)主要包括傳統(tǒng)的模式識(shí)別方法和數(shù)學(xué)分類學(xué)。80 年代初,mchalski提出了概念聚類技術(shù)牞其要點(diǎn)是,在劃分對(duì)象時(shí)不僅考慮對(duì)象之間的距離,還要求劃分出的類具有某種內(nèi)涵描述,從而避

12、免了傳統(tǒng)技術(shù)的某些片面性。4、概念描述概念描述就是對(duì)某類對(duì)象的內(nèi)涵進(jìn)行描述,并概括這類對(duì)象的有關(guān)特征。概念描述分為特征性描述和區(qū)別性描述,前者描述某類對(duì)象的共同特征,后者描述不同類對(duì)象之間的區(qū)別。生成一個(gè)類的特征性描述只涉及該類對(duì)象中所有對(duì)象的共性。生成區(qū)別性描述的方法很多,如決策樹方法、遺傳算法等。5、偏差檢測(cè)數(shù)據(jù)庫(kù)中的數(shù)據(jù)常有一些異常記錄,從數(shù)據(jù)庫(kù)中檢測(cè)這些偏差很有意義。偏差包括很多潛在的知識(shí),如分類中的反常實(shí)例、不滿足規(guī)則的特例、觀測(cè)結(jié)果與模型預(yù)測(cè)值的偏差、量值隨時(shí)間的變化等。偏差檢測(cè)的基本方法是,尋找觀測(cè)結(jié)果與參照值之間有意義的差別。數(shù)據(jù)挖掘與傳統(tǒng)分析方法的區(qū)別數(shù)據(jù)挖掘與傳統(tǒng)的數(shù)據(jù)分析

13、( 如查詢、報(bào)表、聯(lián)機(jī)應(yīng)用分析) 的本質(zhì)區(qū)別是數(shù)據(jù)挖掘是在沒有明確假設(shè)的前提下去挖掘信息、發(fā)現(xiàn)知識(shí). 數(shù)據(jù)挖掘所得到的信息應(yīng)具有先未知, 有效和可實(shí)用三個(gè)特征. 先前未知的信息是指該信息是預(yù)先未曾預(yù)料到的, 既數(shù)據(jù)挖掘是要發(fā)現(xiàn)那些不能靠直覺發(fā)現(xiàn)的信息或知識(shí) , 甚至是違背直覺的信息或知識(shí), 挖掘出的信息越是出乎意料,就可能越有價(jià)值. 在商業(yè)應(yīng)用中最典型的例子就是一家連鎖店通過數(shù)據(jù)挖掘發(fā)現(xiàn)了小孩尿布和啤酒之間有著驚人的聯(lián)系。數(shù)據(jù)挖掘應(yīng)用1、數(shù)據(jù)挖掘解決的典型商業(yè)問題需要強(qiáng)調(diào)的是,數(shù)據(jù)挖掘技術(shù)從一開始就是面向應(yīng)用的。目前,在很多領(lǐng)域,數(shù)據(jù)挖掘(data mining)都是一個(gè)很時(shí)髦的詞,尤其是在如

14、銀行、電信、保險(xiǎn)、交通、零售( 如超級(jí)市場(chǎng) ) 等商業(yè)領(lǐng)域。數(shù)據(jù)挖掘所能解決的典型商業(yè)問題包括:數(shù)據(jù)庫(kù)營(yíng)銷(database marketing)、客戶群體劃分(customer segmentation & classification)、背景分析 (profile analysis)、交叉銷售 (cross-selling)等市場(chǎng)分析行為,以及客戶流失性分析(churn analysis)、客戶信用記分(credit scoring)、欺詐發(fā)現(xiàn) (fraud detection)等等。2、數(shù)據(jù)挖掘在市場(chǎng)營(yíng)銷的應(yīng)用數(shù)據(jù)挖掘技術(shù)在企業(yè)市場(chǎng)營(yíng)銷中得到了比較普遍的應(yīng)用,它是以市場(chǎng)營(yíng)銷學(xué)的市

15、場(chǎng)細(xì)分原理為基礎(chǔ),其基本假定是“消費(fèi)者過去的行為是其今后消費(fèi)傾向的最好說明”。通過收集、 加工和處理涉及消費(fèi)者消費(fèi)行為的大量信息,確定特定消費(fèi)群體或個(gè)體的興趣、消費(fèi)習(xí)慣、消費(fèi)傾向和消費(fèi)需求,進(jìn)而推斷出相應(yīng)消費(fèi)群體或個(gè)體下一步的消費(fèi)行為,然后以此為基礎(chǔ),對(duì)所識(shí)別出來的消費(fèi)群體進(jìn)行特定內(nèi)容的定向營(yíng)銷,這與傳統(tǒng)的不區(qū)分消費(fèi)者對(duì)象特征的大規(guī)模營(yíng)銷手段相比,大大節(jié)省了營(yíng)銷成本,提高了營(yíng)銷效果,從而為企業(yè)帶來更多的利潤(rùn)。商業(yè)消費(fèi)信息來自市場(chǎng)中的各種渠道。例如,每當(dāng)我們用信用卡消費(fèi)時(shí),商業(yè)企業(yè)就可以在信用卡結(jié)算過程收集商業(yè)消費(fèi)信息,記錄下我們進(jìn)行消費(fèi)的時(shí)間、地點(diǎn)、感興趣的商品或服務(wù)、愿意接收的價(jià)格水平和支付

16、能力等數(shù)據(jù); 當(dāng)我們?cè)谏贽k信用卡、辦理汽車駕駛執(zhí)照、填寫商品保修單等其他需要填寫表格的場(chǎng)合時(shí),我們的個(gè)人信息就存入了相應(yīng)的業(yè)務(wù)數(shù)據(jù)庫(kù); 企業(yè)除了自行收集相關(guān)業(yè)務(wù)信息之外,甚至可以從其他公司或機(jī)構(gòu)購(gòu)買此類信息為自己所用。這些來自各種渠道的數(shù)據(jù)信息被組合,應(yīng)用超級(jí)計(jì)算機(jī)、并行處理、神經(jīng)元網(wǎng)絡(luò)、模型化算法和其他信息處理技術(shù)手段進(jìn)行處理,從中得到商家用于向特定消費(fèi)群體或個(gè)體進(jìn)行定向營(yíng)銷的決策信息。這種數(shù)據(jù)信息是如何應(yīng)用的呢?舉一個(gè)簡(jiǎn)單的例子,當(dāng)銀行通過對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行挖掘后,發(fā)現(xiàn)一個(gè)銀行帳戶持有者突然要求申請(qǐng)雙人聯(lián)合帳戶時(shí),并且確認(rèn)該消費(fèi)者是第一次申請(qǐng)聯(lián)合帳戶,銀行會(huì)推斷該用戶可能要結(jié)婚了,它就會(huì)向該用

17、戶定向推銷用于購(gòu)買房屋、支付子女學(xué)費(fèi)等長(zhǎng)期投資業(yè)務(wù),銀行甚至可能將該信息賣給專營(yíng)婚慶商品和服務(wù)的公司。數(shù)據(jù)挖掘構(gòu)筑競(jìng)爭(zhēng)優(yōu)勢(shì)。在市場(chǎng)經(jīng)濟(jì)比較發(fā)達(dá)的國(guó)家和地區(qū),許多公司都開始在原有信息系統(tǒng)的基礎(chǔ)上通過數(shù)據(jù)挖掘?qū)I(yè)務(wù)信息進(jìn)行深加工,以構(gòu)筑自己的競(jìng)爭(zhēng)優(yōu)勢(shì),擴(kuò)大自己的營(yíng)業(yè)額。美國(guó)運(yùn)通公司(american express)有一個(gè)用于記錄信用卡業(yè)務(wù)的數(shù)據(jù)庫(kù),數(shù)據(jù)量達(dá)到54 億字符,并仍在隨著業(yè)務(wù)進(jìn)展不斷更新。運(yùn)通公司通過對(duì)這些數(shù)據(jù)進(jìn)行挖掘,制定了“關(guān)聯(lián)結(jié)算(relation ship billing)優(yōu)惠”的促銷策略,即如果一個(gè)顧客在一個(gè)商店用運(yùn)通卡購(gòu)買一套時(shí)裝,那么在同一個(gè)商店再買一雙鞋,就可以得到比較

18、大的折扣,這樣既可以增加商店的銷售量,也可以增加運(yùn)通卡在該商店的使用率。再如,居住在倫敦的持卡消費(fèi)者如果最近剛剛乘英國(guó)航空公司的航班去過巴黎,那么他可能會(huì)得到一個(gè)周末前往紐約的機(jī)票打折優(yōu)惠卡?;跀?shù)據(jù)挖掘的營(yíng)銷,常??梢韵蛳M(fèi)者發(fā)出與其以前的消費(fèi)行為相關(guān)的推銷材料??ǚ?kraft)食品公司建立了一個(gè)擁有3000 萬客戶資料的數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)是通過收集對(duì)公司發(fā)出的優(yōu)惠券等其他促銷手段作出積極反應(yīng)的客戶和銷售記錄而建立起來的,卡夫公司通過數(shù)據(jù)挖掘了解特定客戶的興趣和口味,并以此為基礎(chǔ)向他們發(fā)送特定產(chǎn)品的優(yōu)惠券,并為他們推薦符合客戶口味和健康狀況的卡夫產(chǎn)品食譜。美國(guó)的讀者文摘 (readers di

19、gest)出版公司運(yùn)行著一個(gè)積累了40 年的業(yè)務(wù)數(shù)據(jù)庫(kù),其中容納有遍布全球的一億多個(gè)訂戶的資料,數(shù)據(jù)庫(kù)每天24 小時(shí)連續(xù)運(yùn)行,保證數(shù)據(jù)不斷得到實(shí)時(shí)的更新,正是基于對(duì)客戶資料數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)挖掘的優(yōu)勢(shì),使讀者文摘出版公司能夠從通俗雜志擴(kuò)展到專業(yè)雜志、書刊和聲像制品的出版和發(fā)行業(yè)務(wù),極大地?cái)U(kuò)展了自己的業(yè)務(wù)?;跀?shù)據(jù)挖掘的營(yíng)銷對(duì)我國(guó)當(dāng)前的市場(chǎng)競(jìng)爭(zhēng)中也很具有啟發(fā)意義,我們經(jīng)??梢钥吹椒比A商業(yè)街上一些廠商對(duì)來往行人不分對(duì)象地散發(fā)大量商品宣傳廣告,其結(jié)果是不需要的人隨手丟棄資料,而需要的人并不一定能夠得到。如果搞家電維修服務(wù)的公司向在商店中剛剛購(gòu)買家電的消費(fèi)者郵寄維修服務(wù)廣告,賣特效藥品的廠商向醫(yī)院特定門診

20、就醫(yī)的病人郵寄廣告,肯定會(huì)比漫無目的的營(yíng)銷效果要好得多。數(shù)據(jù)挖掘在企業(yè)危機(jī)管理中的應(yīng)用危機(jī)管理是管理領(lǐng)域新出現(xiàn)的一個(gè)熱點(diǎn)研究領(lǐng)域,它是以市場(chǎng)競(jìng)爭(zhēng)中危機(jī)的出現(xiàn)為研究起點(diǎn),分析企業(yè)危機(jī)產(chǎn)生的原因和過程,研究企業(yè)預(yù)防危機(jī)、應(yīng)付危機(jī)、 解決危機(jī)的手段和策略,以增強(qiáng)企業(yè)的免疫力、應(yīng)變力和競(jìng)爭(zhēng)力,使管理者能夠及時(shí)準(zhǔn)確地獲取所需要的信息,迅速捕捉到企業(yè)可能發(fā)生危機(jī)的一切可能事件和先兆,進(jìn)而采取有效的規(guī)避措施,在危機(jī)發(fā)生之前對(duì)其進(jìn)行控制,趨利避害,從而使企業(yè)能夠適應(yīng)迅速變化的市場(chǎng)環(huán)境,保持長(zhǎng)久的競(jìng)爭(zhēng)優(yōu)勢(shì)。但是由于危機(jī)產(chǎn)生的原因復(fù)雜,種類繁多,許多因素難以量化,而且危機(jī)管理中帶有大量不確定因素的半結(jié)構(gòu)化問題和非

21、結(jié)構(gòu)化問題,很多因素由于沒有歷史數(shù)據(jù)和相應(yīng)的統(tǒng)計(jì)資料, 很難進(jìn)行科學(xué)地計(jì)算和評(píng)估,因此需要應(yīng)用其它技術(shù)和方法來加強(qiáng)企業(yè)的危機(jī)管理工作。隨著計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)、通訊技術(shù)、internet技術(shù)的迅速發(fā)展和電子商務(wù)、辦公自動(dòng)化、管理信息系統(tǒng)、 internet 的普及等,企業(yè)業(yè)務(wù)操作流程日益自動(dòng)化,企業(yè)經(jīng)營(yíng)過程中產(chǎn)生了大量的數(shù)據(jù),這些數(shù)據(jù)和由此產(chǎn)生的信息是企業(yè)的寶貴財(cái)富,它如實(shí)地記錄著企業(yè)經(jīng)營(yíng)的本質(zhì)狀況。但是面對(duì)如此大量的數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)分析方法,如數(shù)據(jù)檢索、統(tǒng)計(jì)分析等只能獲得數(shù)據(jù)的表層信息,不能獲得其內(nèi)在的、深層次的信息,管理者面臨著數(shù)據(jù)豐富而知識(shí)貧乏的困境。如何從這些數(shù)據(jù)中挖掘出對(duì)企業(yè)經(jīng)營(yíng)決策

22、有用的知識(shí)是非常重要的,數(shù)據(jù)挖掘便是為適應(yīng)這種需要應(yīng)運(yùn)而生的。數(shù)據(jù)挖掘是一種新的信息處理技術(shù),其主要特點(diǎn)是對(duì)企業(yè)數(shù)據(jù)庫(kù)中的大量業(yè)務(wù)數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析和其他模型化處理,從中提取輔助經(jīng)營(yíng)決策的關(guān)鍵性數(shù)據(jù),它在企業(yè)危機(jī)管理中得到了比較普遍的應(yīng)用,具體可以應(yīng)用到以下幾個(gè)方面。1. 利用 web頁挖掘搜集外部環(huán)境信息信息是危機(jī)管理的關(guān)鍵因素。在危機(jī)管理過程中,可以利用web 頁挖掘技術(shù)對(duì)企業(yè)外部環(huán)境信息進(jìn)行收集、整理和分析,盡可能地收集政治、經(jīng)濟(jì)、政策、科技、金融、各種市場(chǎng)、競(jìng)爭(zhēng)對(duì)手、供求信息、消費(fèi)者等與企業(yè)發(fā)展有關(guān)的信息,集中精力分析處理那些對(duì)企業(yè)發(fā)展有重大或潛在重大影響的外部環(huán)境信息,抓住轉(zhuǎn)瞬

23、即逝的市場(chǎng)機(jī)遇,獲得企業(yè)危機(jī)的先兆信息,采取有效措施規(guī)避危機(jī),促使企業(yè)健康、持續(xù)地發(fā)展。2. 利用數(shù)據(jù)挖掘分析企業(yè)經(jīng)營(yíng)信息利用數(shù)據(jù)挖掘技術(shù)、數(shù)據(jù)倉(cāng)庫(kù)技術(shù)和聯(lián)機(jī)分析技術(shù),管理者能夠充分利用企業(yè)數(shù)據(jù)倉(cāng)庫(kù)中的海量數(shù)據(jù)進(jìn)行分析,并根據(jù)分析結(jié)果找出企業(yè)經(jīng)營(yíng)過程中出現(xiàn)的各種問題和可能引起危機(jī)的先兆,如經(jīng)營(yíng)不善、觀念滯后、產(chǎn)品失敗、戰(zhàn)略決策失誤、財(cái)務(wù)危機(jī)等內(nèi)部因素引起企業(yè)人、財(cái)、物、產(chǎn)、供、銷的相對(duì)和諧平衡體遭到重大破壞,對(duì)企業(yè)的生存、發(fā)展構(gòu)成嚴(yán)重威脅的信息,及時(shí)做出正確的決策,調(diào)整經(jīng)營(yíng)戰(zhàn)略,以適應(yīng)不斷變化的市場(chǎng)需求。3. 利用數(shù)據(jù)挖掘識(shí)別、分析和預(yù)防危機(jī)危機(jī)管理的精髓在于預(yù)防。利用數(shù)據(jù)挖掘技術(shù)對(duì)企業(yè)經(jīng)營(yíng)的

24、各方面的風(fēng)險(xiǎn)、威脅和危險(xiǎn)進(jìn)行識(shí)別和分析,如產(chǎn)品質(zhì)量和責(zé)任、環(huán)境、健康和人身安全、財(cái)務(wù)、營(yíng)銷、自然災(zāi)害、經(jīng)營(yíng)欺詐、人員及計(jì)算機(jī)故障等,對(duì)每一種風(fēng)險(xiǎn)進(jìn)行分類,并決定如何管理各類風(fēng)險(xiǎn); 準(zhǔn)確地預(yù)測(cè)企業(yè)所面臨的各種風(fēng)險(xiǎn),并對(duì)每一種風(fēng)險(xiǎn)、威脅和危險(xiǎn)的大小及發(fā)生概率進(jìn)行評(píng)價(jià),建立各類風(fēng)險(xiǎn)管理的優(yōu)先次序,以有限的資源、時(shí)間和資金來管理最嚴(yán)重的一種或某幾類風(fēng)險(xiǎn); 制定危機(jī)管理的策略和方法,擬定危機(jī)應(yīng)急計(jì)劃和危機(jī)管理隊(duì)伍,做好危機(jī)預(yù)防工作。4. 利用數(shù)據(jù)挖掘技術(shù)改善客戶關(guān)系管理客戶滿意度歷來就是衡量一個(gè)企業(yè)服務(wù)質(zhì)量好壞的重要尺度,特別是當(dāng)客戶的反饋意見具有廣泛效應(yīng)的時(shí)候更是如此。目前很多企業(yè)利用營(yíng)銷中心、新聞組

25、、 bbs 以及呼叫中心等收集客戶的投訴和意見,并對(duì)這些投訴和意見進(jìn)行分析,以發(fā)現(xiàn)客戶關(guān)系管理中存在的問題,如果有足夠多的客戶都在抱怨同一個(gè)問題,管理者就有理由對(duì)其展開調(diào)查,為企業(yè)及時(shí)捕捉到發(fā)生危機(jī)的一切可能事件和先兆,從而挽救客戶關(guān)系,避免經(jīng)營(yíng)危機(jī)。5. 利用數(shù)據(jù)挖掘進(jìn)行信用風(fēng)險(xiǎn)分析和欺詐甄別客戶信用風(fēng)險(xiǎn)分析和欺詐行為預(yù)測(cè)對(duì)企業(yè)的財(cái)務(wù)安全是非常重要的,使用企業(yè)信息系統(tǒng)中數(shù)據(jù)庫(kù)的數(shù)據(jù),利用數(shù)據(jù)挖掘中的變化和偏差分析技術(shù)進(jìn)行客戶信用風(fēng)險(xiǎn)分析和欺詐行為預(yù)測(cè),分析這些風(fēng)險(xiǎn)為什么會(huì)發(fā)生 ?哪些因素會(huì)導(dǎo)致這些風(fēng)險(xiǎn)?這些風(fēng)險(xiǎn)主要來自于何處?如何預(yù)測(cè)到可能發(fā)生的風(fēng)險(xiǎn)?采取何種措施減少風(fēng)險(xiǎn)的發(fā)生?通過評(píng)價(jià)這些風(fēng)險(xiǎn)的嚴(yán)重性、發(fā)生的可能性及控制這些風(fēng)險(xiǎn)的成本,匯總對(duì)各種風(fēng)險(xiǎn)的評(píng)價(jià)結(jié)果,進(jìn)而建立一套信用風(fēng)險(xiǎn)管理的戰(zhàn)略和監(jiān)督體系,設(shè)計(jì)并完善信

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論