![第三章信息處理技術(shù)與方法下_第1頁](http://file4.renrendoc.com/view/4adfcf41e9a8121cdf20680771662760/4adfcf41e9a8121cdf206807716627601.gif)
![第三章信息處理技術(shù)與方法下_第2頁](http://file4.renrendoc.com/view/4adfcf41e9a8121cdf20680771662760/4adfcf41e9a8121cdf206807716627602.gif)
![第三章信息處理技術(shù)與方法下_第3頁](http://file4.renrendoc.com/view/4adfcf41e9a8121cdf20680771662760/4adfcf41e9a8121cdf206807716627603.gif)
![第三章信息處理技術(shù)與方法下_第4頁](http://file4.renrendoc.com/view/4adfcf41e9a8121cdf20680771662760/4adfcf41e9a8121cdf206807716627604.gif)
![第三章信息處理技術(shù)與方法下_第5頁](http://file4.renrendoc.com/view/4adfcf41e9a8121cdf20680771662760/4adfcf41e9a8121cdf206807716627605.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第四節(jié)商務(wù)智能與數(shù)據(jù)挖掘商務(wù)智能的起源數(shù)據(jù)倉庫技術(shù)數(shù)據(jù)挖掘數(shù)據(jù)挖掘在商業(yè)中的應(yīng)用第三章信息處理技術(shù)與方法市場的競爭發(fā)展趨勢從“大眾化營銷”到“差異化營銷”的競爭;從“規(guī)模效益”到“深度效益”的競爭;從“單一銷售”到“產(chǎn)業(yè)價值鏈營銷”的競爭;企業(yè)領(lǐng)導(dǎo)人如何面對激烈市場競爭帶來的挑戰(zhàn)?完善組織結(jié)構(gòu)培養(yǎng)客戶忠誠度拓大客戶群增加產(chǎn)品、渠道品種加強(qiáng)成本控制提高營運(yùn)效率防范風(fēng)險………提高形象增加利潤增加/保留客戶增加市場占有率減低風(fēng)險增加服務(wù)/提高質(zhì)素減低經(jīng)營成本其他管理運(yùn)營數(shù)據(jù)競爭優(yōu)勢?數(shù)據(jù)能直接帶來競爭優(yōu)勢嗎?現(xiàn)在企業(yè)的問題不是數(shù)據(jù)太少,而是數(shù)據(jù)太多了現(xiàn)有的數(shù)據(jù)狀況傳統(tǒng)的信息系統(tǒng)中數(shù)據(jù)受限于其應(yīng)用面,最終出來的效果所表達(dá)的信息是割裂的,零碎的,如果不加處理與整合,甚至是自相矛盾的,因此這種數(shù)據(jù)積累的作用事實(shí)上只是一種備份。備份數(shù)據(jù)變成了“數(shù)據(jù)監(jiān)獄”,數(shù)據(jù)一進(jìn)去就十有八九成了“囚犯”,而數(shù)據(jù)一旦過時,要么就被束之高閣,無情地被判了無期徒刑,要么就象碎成紙片的機(jī)要文件一樣被銷毀了。
企業(yè)是個嚴(yán)密運(yùn)作的復(fù)雜系統(tǒng),每個細(xì)小環(huán)節(jié)的活動是彼此互相關(guān)聯(lián)的;從零碎的、片段的企業(yè)局部化信息難以看清企業(yè)整體的變化;同時企業(yè)需要一種協(xié)同思考的能力;在這種背景下,商務(wù)智能應(yīng)運(yùn)而生!什么是商業(yè)智能商業(yè)智能是用來實(shí)現(xiàn)數(shù)據(jù)向信息轉(zhuǎn)變,信息向知識轉(zhuǎn)變,知識向價值轉(zhuǎn)變的這么一個過程,以及這個過程中所使用到的種種技術(shù)和工具。
數(shù)據(jù)信息知識價值個性化的界面商業(yè)智能工具的分析和提煉收集整理其他管理運(yùn)營數(shù)據(jù)信息和知識分析數(shù)據(jù)采集數(shù)據(jù)
使業(yè)務(wù)更加高效
更大的效益企業(yè)信息門戶正確的決策和行動分析人員銀行領(lǐng)導(dǎo)員工IBM認(rèn)為商務(wù)智智能是指一一種能力::通過智能能的使用你你的數(shù)據(jù)財(cái)財(cái)產(chǎn)來制定定更好的商商務(wù)決策。。它的意思思是說各種種企業(yè)的決決策人員以以企業(yè)中的的數(shù)據(jù)倉庫(DataWarehouse)為本,經(jīng)由由各式各樣樣的查詢分析工工具(Query/ReportTools)、聯(lián)機(jī)分析處處理(OnlineAnalyticalProcessing簡稱OLAP)工具、或是是數(shù)據(jù)挖掘(DataMining)工具加上決決策規(guī)劃人人員的行業(yè)業(yè)知識(IndustryKnowledge),從數(shù)據(jù)倉倉儲中獲得得有利的信信息,進(jìn)而而幫助企業(yè)業(yè)提高獲利利,增加生生產(chǎn)力與競競爭力。學(xué)術(shù)界的觀觀點(diǎn)是:BI實(shí)際上是幫幫助企業(yè)提提高決策能能力和運(yùn)營營能力的概概念、方法法、過程以以及軟件的的集合,其其主要目標(biāo)標(biāo)是將企業(yè)業(yè)所掌握的的信息轉(zhuǎn)換換成競爭優(yōu)優(yōu)勢,提高高企業(yè)決策策能力、決決策效率、、決策準(zhǔn)確確性。根據(jù)國際數(shù)數(shù)據(jù)公司((IDC)的一個關(guān)關(guān)于65個公司的案案例研究顯顯示,在過過去2、3年里,商務(wù)務(wù)智能投資資的平均回回報超過了了400%。根據(jù)商務(wù)務(wù)智能的當(dāng)當(dāng)前應(yīng)用情情況,發(fā)現(xiàn)現(xiàn)商務(wù)智能能廣泛應(yīng)用用在零售、、電信和保保險、銀行行等行業(yè)。。這些行業(yè)業(yè)一般具有有以下特征征:(1)大量的顧顧客;這樣樣才能產(chǎn)生生足夠多的的可供分析析的數(shù)據(jù)。。(2)非非常常激激烈烈的的競競爭爭并并有有差差異異化化的的需需要要;;這這些些行行業(yè)業(yè)一一般般提提供供的的都都是是差差異異化化很很小小的的產(chǎn)產(chǎn)品品,,同同時時行行業(yè)業(yè)內(nèi)內(nèi)的的競競爭爭又又非非常常激激烈烈,,從從而而使使差差異異化化的的服服務(wù)務(wù)成成為為企企業(yè)業(yè)必必然然選選擇擇。。(3)能能容容易易地地收收集集到到大大量量的的電電子子數(shù)數(shù)據(jù)據(jù)。。這這些些行行業(yè)業(yè)一一般般都都有有較較完完善善的的電電子子交交易易記記錄錄系系統(tǒng)統(tǒng),,可可以以很很方方便便的的收收集集到到大大量量的的電電子子交交易易數(shù)數(shù)據(jù)據(jù)。。數(shù)據(jù)據(jù)倉倉庫庫1.數(shù)據(jù)據(jù)倉倉庫庫的的概概念念數(shù)據(jù)據(jù)倉倉庫庫是是一一種種為為信信息息分分析析提提供供了了良良好好的的基基礎(chǔ)礎(chǔ)并并支支持持管管理理決決策策活活動動的的分分析析環(huán)環(huán)境境,,是是面面向向主主題題的的、、集集成成的的、、穩(wěn)穩(wěn)定定的的、、隨隨時時間間變變化化的的、、分分層層次次的的多多維維的的集集成成數(shù)數(shù)據(jù)據(jù)集集合合。。它它為為不不同同層層次次的的管管理理者者提提供供敏敏捷捷性性和和實(shí)實(shí)用用性性的的決決策策支支持持。。數(shù)據(jù)據(jù)倉倉庫庫具具有有兩兩個個主主要要作作用用::一是是從從各各信信息息源源提提取取決決策策需需要要的的數(shù)數(shù)據(jù)據(jù),,加加工工處處理理后后,,存存儲儲到到數(shù)數(shù)據(jù)據(jù)倉倉庫庫中中;;二是是用用戶戶的的查查詢詢和和決決策策分分析析的的基基礎(chǔ)礎(chǔ)。。2.數(shù)據(jù)據(jù)倉倉庫庫特特征征1)面面向向主主題題(subjectoriented)在傳傳統(tǒng)統(tǒng)的的信信息息系系統(tǒng)統(tǒng)中中,,對對數(shù)數(shù)據(jù)據(jù)的的處處理理是是面面向向過過程程的的或或者者是是面面向向功功能能的的。。而而面面向向過過程程的的數(shù)數(shù)據(jù)據(jù)包包括括滿滿足足某某種種功功能能需需求求的的數(shù)數(shù)據(jù)據(jù),,它它們們可可能能與與決決策策問問題題有有關(guān)關(guān)也也可可能能無無關(guān)關(guān)。。采購購子子系系統(tǒng)統(tǒng):訂單單((訂訂單單號號,,供供應(yīng)應(yīng)商商號號,,商商品品號號,,類類別別,,單單價價。。數(shù)數(shù)量量,,總總金金額額,,日日期期,,…)供應(yīng)應(yīng)商商((供供應(yīng)應(yīng)商商號號,,供供應(yīng)應(yīng)商商名名,,地地址址,,電電話話,,…)銷售售子子系系統(tǒng)統(tǒng)::客戶戶((客客戶戶號號,,姓姓名名,,地地址址,,電電話話,,…)銷售售((客客戶戶號號,,商商品品號號,,數(shù)數(shù)量量,,單單價價,,日日期期,,…)庫存存子子系系統(tǒng)統(tǒng)::進(jìn)庫庫單單((編編號號,,商商品品號號,,數(shù)數(shù)量量,,單單價價,,日日期期,,…)出庫庫單單((編編號號,,商商品品號號,,數(shù)數(shù)量量,,單單價價,,日日期期,,…)庫存存((商商品品號號,,庫庫房房號號,,類類別別,,單單價價,,庫庫存存數(shù)數(shù)量量,,總金金額額,,日日期期,,…)商品品固固有有信信息息::商商品品號號,,類類別別,,單單價價,,顏顏色色,,…商品品采采購購信信息息::商商品品號號,,類類別別,,供供應(yīng)應(yīng)商商號號,,供供應(yīng)應(yīng)日日期期,,單單價價,,數(shù)數(shù)量量,,…商品銷售信息息:商品號,,客戶號,數(shù)數(shù)量,單價,,銷售日期,,…商品庫存信息息:商品號,,庫房號,,庫存數(shù)量,,日期,…)商品主題域::采購子系統(tǒng)銷售子系統(tǒng)庫存子系統(tǒng)從信息管理的的角度看,主題就是在一一個較高的管管理層次上對對信息系統(tǒng)的的數(shù)據(jù)按照某某一具體的管管理對象進(jìn)行行綜合、歸類類所形成的分分析對象。從數(shù)據(jù)組織的的角度看,主題是一些數(shù)數(shù)據(jù)集合,這這些數(shù)據(jù)集合合對分析對象象作了比較完完整的、一致致的描述,這這種描述不僅僅涉及到數(shù)據(jù)據(jù)自身,而且且涉及到數(shù)據(jù)據(jù)之間的關(guān)系系。2)集成化(integrated)數(shù)據(jù)倉庫在從從業(yè)務(wù)處理系系統(tǒng)那里獲取取數(shù)據(jù)時,并并不能將源數(shù)數(shù)據(jù)庫中的數(shù)數(shù)據(jù)直接加載載到數(shù)據(jù)倉庫庫中,而是需需要進(jìn)行一系系列的數(shù)據(jù)預(yù)預(yù)處理,即數(shù)數(shù)據(jù)的抽取、、篩選、清理理、綜合等集集成工作。也就是說,首首先要從源數(shù)數(shù)據(jù)庫中挑選選出數(shù)據(jù)倉庫庫所需要的數(shù)數(shù)據(jù),然后將將這些來自不不同數(shù)據(jù)庫中中的數(shù)據(jù)按照照某一標(biāo)準(zhǔn)進(jìn)進(jìn)行統(tǒng)一,即即將不同數(shù)據(jù)據(jù)源中的數(shù)據(jù)據(jù)的單位、字字長與內(nèi)容按按照數(shù)據(jù)倉庫庫的要求統(tǒng)一一起來,消除除源數(shù)據(jù)中字字段的同名異異義、異名同同義現(xiàn)象,這這些工作稱為為數(shù)據(jù)的清理(clean),把數(shù)據(jù)倉庫庫的數(shù)據(jù)呈現(xiàn)現(xiàn)給用戶一個個一致統(tǒng)一的的視圖。數(shù)據(jù)倉庫中的的數(shù)據(jù)分為四四個級別:早早期細(xì)節(jié)級,,當(dāng)前細(xì)節(jié)級級,輕度綜合合級,高度綜綜合級。1985~1998年銷售明細(xì)表1998~2003年銷售明細(xì)表1998~2003年每月銷售表1998~2003年每季度銷售表3)相對穩(wěn)定的的:數(shù)據(jù)倉庫庫的數(shù)據(jù)主要要供企業(yè)決策分析之用,所涉及及的數(shù)據(jù)操作作主要是數(shù)據(jù)據(jù)查詢,一旦旦某個數(shù)據(jù)進(jìn)進(jìn)入數(shù)據(jù)倉庫庫以后,一般般情況下將被被長期保留,,也就是數(shù)據(jù)據(jù)倉庫中一般般有大量的查查詢操作,但但修改和刪除除操作很少,,通常只需要要定期的加載載、刷新。4)反映歷史變變化:數(shù)據(jù)倉倉庫中的數(shù)據(jù)據(jù)通常包含歷歷史信息,系系統(tǒng)記錄了企企業(yè)從過去某某一時點(diǎn)(如開始應(yīng)用數(shù)數(shù)據(jù)倉庫的時時點(diǎn))到目前的各個個階段的信息息,通過這些些信息,可以以對企業(yè)的發(fā)發(fā)展歷程和未未來趨勢做出出定量分析和和預(yù)測。DW中數(shù)據(jù)量很大大:通常的DW的數(shù)據(jù)量為10GB級,大型DW是一個TB(1000GB)級數(shù)據(jù)量。DB一般為幾兆至至100兆B。DW軟硬件要求較較高:需要一個巨大大的硬件平臺與一個個并行的數(shù)據(jù)據(jù)庫系統(tǒng)(PDBS)。整個數(shù)據(jù)倉庫庫系統(tǒng)是一個個包含四個層層次的體系結(jié)結(jié)構(gòu),具體由由下圖表示。。3.OLAPOLAP的基本術(shù)語的定義為:OLAP是共享多維信信息的、針對對特定問題的的聯(lián)機(jī)數(shù)據(jù)訪訪問和分析的的快速軟件技技術(shù),OLAP具有靈活的分分析功能、直直觀的數(shù)據(jù)操操作和分析結(jié)結(jié)果可視化表表示等突出優(yōu)優(yōu)點(diǎn),從而使使用戶對基于于大量復(fù)雜數(shù)數(shù)據(jù)的分析變變得輕松而高高效,以利迅迅速做出正確確判斷。OLAP的基本分析方方法1)維維維是人們觀察察數(shù)據(jù)的特定定角度。2)維的層次一一個個維往往具有有多個層次,,如描述時間間維,可以從從日期、月份份、季度、年年等不同層次次來捕述,那那么日期、月月份、季度、、年等就是時時間維的層次次;同樣,城城市、地區(qū)、、國家等構(gòu)成成了一個地理理維的多個層層次。(1)維成員。維的的一個取值稱稱為該維的一一個維成員。。如果一個維維是多層次的的,那么,該該維的維成員員是在不同維維層次的取值值的組合。(2)多維數(shù)組。一一個多維數(shù)組組可以表示為為:(維1,維2,…,維n,變量)。例如,日用品銷售數(shù)數(shù)據(jù)是按時間間、地區(qū)和銷銷售渠道組織織起來的三維維立方體,加加上變量"銷售額”,就就組成了一個個多維數(shù)組(地區(qū),時間,,銷售渠道,,銷售額)。(3)數(shù)據(jù)單元。多多維數(shù)組的取取值稱為數(shù)據(jù)據(jù)單元。OLAP的基本分析方方法多維分析是指指對以多維形形式組織起來來的數(shù)據(jù)采取取切片、切塊塊、旋轉(zhuǎn)等各各種分析方法法,以求剖析析數(shù)據(jù),使最最終用戶能從從多個角度、、多側(cè)面地觀觀察數(shù)據(jù)庫中中的數(shù)據(jù),從從而深入地了了解包含在數(shù)數(shù)據(jù)中的信息息、內(nèi)涵。切片片選定多多維數(shù)數(shù)組的的一個個二維維子集集的方方法叫叫做切切片,,即選選定多多維數(shù)數(shù)組((維1,維2,……,維n,變量量)中中的兩兩個維維:維維I和維J,在這這兩個個維上上取某某一區(qū)區(qū)間或或任意意維成成員,,而將將其余余的維維都取取定一一個維維成員員,則則得到到的就就是多多維數(shù)數(shù)組在在維I和j上一個個二維維子集集,稱稱這個個二維維子集集為多多維數(shù)數(shù)在維維I和維J上的一一個切切片,,表示示為;;(維維I,維j,變量量)。。例如,,選定定多維維數(shù)組組(地區(qū),,時間間,產(chǎn)產(chǎn)品,,銷售售額)中的地地區(qū)維維與產(chǎn)產(chǎn)品維維,在在另外外一維維:時時間維維,選選取一一個維維成員員(如“2006年1月”),就得得到了了多維維數(shù)組組(地區(qū),,時間間,產(chǎn)產(chǎn)品,,銷售售額)在產(chǎn)品品和地地區(qū)兩兩維上上的一一個切切片(客戶,,地區(qū)區(qū),銷銷售額額)。這個個切片片表示示2006年1月各地地區(qū)、、各產(chǎn)產(chǎn)品的的銷售售情況況。
產(chǎn)品銷售情況2006.1產(chǎn)品銷售情況選定兩兩個維維:產(chǎn)產(chǎn)品維維和地地區(qū)維維時間維維數(shù)據(jù)切切片產(chǎn)品維維地區(qū)維維產(chǎn)品維維地區(qū)維維切塊塊選定多多維數(shù)數(shù)的一一個三三維子子集的的方法法稱切切塊。。即選選定多多維數(shù)數(shù)組((維1,維2,……,維n,變量量)中中的三三個維維:維維I、維j和維r,在這這三個個維上上取某某一區(qū)區(qū)間或或任意意的維維成員員,而而將其其余的的維都都取定定一個個維成成員,,則得得到的的就是是多維維數(shù)組組在維維I、維j和維r上一個個三維維子集集,我我們稱稱這個個三維維子集集為多多維數(shù)數(shù)組在在維I、維j和r上的一一個切切塊,,表示示為::(維維I,維j,維r,變量量)。。切塊塊與切切片的的作用用與目目的是是相似似的。。美國中國手機(jī)電腦圖8-3三維立方體切塊(Slice)旋轉(zhuǎn)轉(zhuǎn)旋轉(zhuǎn)即即是改改變一一個報報告或或面顯顯示的的維方方向。。例如如,旋旋轉(zhuǎn)可可能包包含了了交換換行和和列;;或是是把某某一個個行維維移到到列維維中去去,或或是把把頁面面顯示示中的的一個個維和和頁面面的維維進(jìn)行行交換換(令令其成成為新新一行行或列列中的的一個個)把把一個個橫向向?yàn)闀r時間、、縱向向?yàn)楫a(chǎn)產(chǎn)品的的報表表旋轉(zhuǎn)轉(zhuǎn)成為為橫向向?yàn)楫a(chǎn)產(chǎn)品、、維向向?yàn)闀r時間的的報表表。2005年2006年部門1季度2季度3季度4季度1季度2季度3季度4季度部門一2012182722161929部門二2311241722311234部門三26213433212326321季度2季度3季度4季度部門2005年2006年2005年2006年2005年2006年2005年2006年部門一2022121618192729部門二2322113124121734部門三2621212334263332旋轉(zhuǎn)前前的有有關(guān)數(shù)數(shù)據(jù)描描述旋轉(zhuǎn)后后的有有關(guān)數(shù)數(shù)據(jù)描描述鉆取按時間維向下鉆取按時間維向上鉆取604.數(shù)據(jù)挖挖掘數(shù)據(jù)的的爆炸炸性增增長:從TB到PB數(shù)據(jù)收收集和和數(shù)據(jù)據(jù)可用用性自動的的數(shù)據(jù)據(jù)收集集工具具,數(shù)據(jù)庫庫系統(tǒng)統(tǒng),Web,計(jì)算化化的社社會2003年,法法國電電信的的呼叫叫數(shù)據(jù)據(jù)為30TB,AT&T以26TB的數(shù)據(jù)據(jù)量位位居第第二,,如此此多的的呼叫叫數(shù)據(jù)據(jù)以致致于AT&T無法全全部保保存,,對數(shù)數(shù)據(jù)的的分析析也只只能是是“粗略”的Google,40億以上上的頁頁面((2004年4月統(tǒng)計(jì)計(jì)),,數(shù)據(jù)據(jù)量為為nTB據(jù)加州州大學(xué)學(xué)伯克克利分分校的的研究究人員員統(tǒng)計(jì)計(jì),2002年新產(chǎn)產(chǎn)生數(shù)數(shù)據(jù)為為1999年的2倍,而而且數(shù)數(shù)據(jù)的的膨脹脹在不不斷加加速我們正正淹沒沒在數(shù)數(shù)據(jù)洪洪水中中,但卻渴渴望知知識!數(shù)據(jù)挖挖掘(從數(shù)據(jù)據(jù)中發(fā)發(fā)現(xiàn)知知識)從海量量數(shù)據(jù)據(jù)中提提取感感興趣趣(重要的的,隱含的的,以前未未知的的和潛在有有用的的)模式或知識識數(shù)據(jù)挖挖掘:用詞不不當(dāng)?其他的的名稱稱數(shù)據(jù)庫庫中的的知識識發(fā)現(xiàn)現(xiàn)(挖掘)(KDD),知識提提取,數(shù)據(jù)/模式分分析,數(shù)據(jù)考考古學(xué)學(xué),數(shù)據(jù)捕捕撈,信息收收獲,商業(yè)智智能等等.當(dāng)心:所有的的都是是“數(shù)據(jù)挖掘”么?簡單的搜索索和查詢處處理(演繹的)專家系統(tǒng)4.數(shù)據(jù)挖掘?yàn)槭裁匆獢?shù)數(shù)據(jù)挖掘?—潛在的應(yīng)用用數(shù)據(jù)分析和和決策支持持市場分析和和管理目標(biāo)市場定定位,客戶關(guān)系管管理(CRM),購物籃分析析,交叉銷售風(fēng)險分析和和管理預(yù)測,客戶保持,質(zhì)量控制,競爭分析欺詐檢測和和不尋常模模式的檢測測(離群點(diǎn))其他的應(yīng)用用文本挖掘(新聞組,email,文檔)和Web挖掘流數(shù)據(jù)挖掘掘生物信息學(xué)學(xué)和生物數(shù)數(shù)據(jù)分析現(xiàn)實(shí)世界中中的數(shù)據(jù)挖挖掘可以用用來干什么么?——搜索制造爆爆炸的恐怖怖分子美國聯(lián)邦調(diào)調(diào)查局(FBI)對地區(qū)調(diào)調(diào)查員提交交的大量報報告進(jìn)行審審查,尋找找和爆炸事事件的聯(lián)系系。.使用鏈路分分析,聚類類和規(guī)則歸歸納等分析析方法來識識別可能的的線索。數(shù)據(jù)挖掘的的其他應(yīng)用用知識發(fā)現(xiàn)(KDD)過程數(shù)據(jù)挖掘—知識發(fā)現(xiàn)過過程的核心心數(shù)據(jù)清理數(shù)據(jù)集成數(shù)據(jù)庫數(shù)據(jù)倉庫知識任務(wù)相關(guān)的的數(shù)據(jù)選擇數(shù)據(jù)挖掘模式評估5.DM與OLAP的區(qū)別用戶可能會會提出這樣樣一個典型型的OLAP問題:去年年哪里的用用戶的購買買了更多的的轎車,是是上海還是是北京(請注意,在在這個問題題中已經(jīng)隱隱含了用戶戶的一些前前提條件)?面對這樣的的問題,OLAP可能會回答答:在去年年,上海地地區(qū)的用戶戶購買了12000輛轎車,而而北京的用用戶購買了了10000輛。相比之之下,一個個典型的DM問題可能會會是:給出出一個模式式來預(yù)測人人們購買轎轎車的情況況。通過對對數(shù)據(jù)庫中中數(shù)據(jù)的挖挖掘,DM可能這樣回回答:在北北京地區(qū)處處于A年齡段、收收入在X、y之間的用戶戶比上海地地區(qū)相同的的用戶會購購買更多的的轎車。6.數(shù)據(jù)挖掘在在商業(yè)中的的應(yīng)用關(guān)聯(lián)分析關(guān)聯(lián)分析主主要用于發(fā)發(fā)現(xiàn)不同事事件之間的的關(guān)聯(lián)性,,即一個事事件發(fā)生的的同時,另另一個事件件也經(jīng)常發(fā)發(fā)生。關(guān)聯(lián)聯(lián)分析的重重點(diǎn)在于快快速發(fā)現(xiàn)那那些有實(shí)用用價值的關(guān)關(guān)聯(lián)發(fā)生的的事件。其其主要依據(jù)據(jù)是事件發(fā)發(fā)生的概率率和條件概概率應(yīng)該符符合一定的的統(tǒng)計(jì)意義義。動機(jī):尋找數(shù)據(jù)中中固有的規(guī)規(guī)律什么產(chǎn)品會會經(jīng)常在一一起購買?—啤酒和尿布布?!買了一臺電電腦之后接接著會買什什么?哪種DNA對新藥是敏敏感的?我們能夠自自動分類Web文檔嗎?應(yīng)用購物籃分析析,交叉銷售,分類設(shè)計(jì),銷售活動分分析,Web日志(點(diǎn)擊流)分析,以及DNA序列分析.購物籃分析析商店的經(jīng)理理想了解顧顧客的購物物習(xí)慣“什么商品組組或集合顧顧客多半會會在一次購購物時同時時購買”可以幫助制制定營銷策策略:有選擇地安安排貨架按比例進(jìn)貨貨案例:金融融交叉銷售售什么是交叉叉銷售?簡簡單說來,,就是向擁擁有本公司司A產(chǎn)品的客戶戶推銷本公公司B產(chǎn)品。它有有兩大功能能:其一,可以以增強(qiáng)客戶戶忠誠度。。如果客戶戶購買本公公司的產(chǎn)品品和服務(wù)越越多,客戶戶流失的可可能性就越越小。來自自銀行的數(shù)數(shù)據(jù)顯示::購買兩種種產(chǎn)品的客客戶的流失失率是55%,而擁有有4個或更多多產(chǎn)品或或服務(wù)的的流失率率幾乎是是0。其二,交交叉銷售售也可以以增加利利潤。實(shí)實(shí)踐證明明,將一一種產(chǎn)品品和服務(wù)務(wù)推銷給給一個現(xiàn)現(xiàn)有客戶戶的成本本遠(yuǎn)低于于吸收一一個新客客戶的成成本。下表便是是一個采采用IBMIntelligentMiner進(jìn)行數(shù)據(jù)據(jù)挖掘的的案例::這個準(zhǔn)則則說明::有28.5%的VISA金卡用戶戶購買了了房屋貸貸款,它它的購買買率是平平均的10.7倍。這個個準(zhǔn)則的的客戶數(shù)數(shù)目占總總客戶群群的85%(關(guān)于準(zhǔn)則則的詳細(xì)細(xì)定義請請參考IBMIntelligentMiner的說明書書)。根據(jù)這這個準(zhǔn)則則我們可可以知道道,將房房屋貸款款交叉銷銷售給VISA金卡用戶戶是一個個很好的的選擇。。置信度支持度類型提升度規(guī)則0.85%28.5%+10.7VISA金卡=>房屋貸款序列分析析序列分析析技術(shù)主主要用于于發(fā)現(xiàn)一一定時間間間隔內(nèi)內(nèi)接連發(fā)發(fā)生的事事件。這這些事件件構(gòu)成一一個序列列,發(fā)現(xiàn)現(xiàn)的序列列應(yīng)該具具有普遍遍意義,,其依據(jù)據(jù)除了統(tǒng)統(tǒng)計(jì)上的的概率之之外,還還要加上上時間的的約束。。分類分析析分類分析析通過分分析具有有類別的的樣本的的特點(diǎn),,得到?jīng)Q決定樣本本屬于各各種類別別的規(guī)則則或方法法。利用分類類技術(shù),,可以根根據(jù)顧客客的消費(fèi)費(fèi)水平和和基本特特征對顧顧客進(jìn)行行分類,,找出對對商家有有較大利利益貢獻(xiàn)獻(xiàn)的重要要客戶的的特征,,通過對對其進(jìn)行行個性化化服務(wù),,提高他他們的忠忠誠度。。案例:中中移動客客戶保留留案例分分析國內(nèi)移動動通信市市場的價價格戰(zhàn)是是當(dāng)前困困擾運(yùn)營營商的主主要問題題,很多多客戶從從一個移移動運(yùn)營營商轉(zhuǎn)向向另一個個移動運(yùn)運(yùn)營商只只是為了了得到更更低的費(fèi)費(fèi)用及其其他額外外的優(yōu)惠惠條件((如贈機(jī)機(jī))。因因此需要要通過對對轉(zhuǎn)網(wǎng)客客戶群的的特征進(jìn)進(jìn)行深入入分析,,然后根根據(jù)分析析結(jié)果到到現(xiàn)有客客戶資料料中找出出可能轉(zhuǎn)轉(zhuǎn)網(wǎng)的客客戶群,,有針對對性地設(shè)設(shè)計(jì)一些些客戶保保持計(jì)劃劃來預(yù)防防現(xiàn)有客客戶的流流失。聚類分析析聚類分析析是根據(jù)據(jù)物以類類聚的原原理,將將本身沒沒有類別別的樣本本聚集成成不同的的組,并并且對每每一個這這樣的組組進(jìn)行描描述的過過程。其其主要依依據(jù)是聚聚到同一一個組中中的樣本本應(yīng)該彼彼此相似似,而屬屬于不同同組的樣樣本應(yīng)該該足夠不不相似。。在客戶關(guān)關(guān)系管理理中,利利用聚類類技術(shù),,根據(jù)客客戶的個個人特征征以及消消費(fèi)數(shù)據(jù)據(jù),可以以將客戶戶群體進(jìn)進(jìn)行細(xì)分分。例如,可可以得到到這樣的的一個消消費(fèi)群體體:女性性占91%,全部無無子女、、年齡在在31到40歲占70%,高消費(fèi)費(fèi)級別的的占64%,買過針針織品的的占91%,買過廚廚房用品品的占89%,買過園園藝用品品的占79%。針對不不同的客客戶群,,可以實(shí)實(shí)施不同同的營銷銷和服務(wù)務(wù)方式,,從而提提高客戶戶的滿意意度。對于空間間數(shù)據(jù),,根據(jù)地地理位置置以及障障礙物的的存在情情況
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年企業(yè)機(jī)器質(zhì)押借款合同
- 2025年勞動解除合同標(biāo)準(zhǔn)條款
- 2025年抗瘧藥項(xiàng)目申請報告模范
- 2025年貨車租賃與運(yùn)輸服務(wù)合同樣本
- 2025年國際貨物買賣合同與慣例
- 2025年專業(yè)清潔人員派遣協(xié)議
- 2025年二手車購買合同范本
- 2025年三板市場股權(quán)買賣協(xié)議
- 2025年伙伴開設(shè)教育機(jī)構(gòu)合作協(xié)議書模板
- 2025年繼電器研發(fā)策劃技術(shù)協(xié)議書范本
- 小報:人工智能科技科學(xué)小報手抄報電子小報word小報
- GB/T 41509-2022綠色制造干式切削工藝性能評價規(guī)范
- 全面介紹現(xiàn)貨中遠(yuǎn)期交易
- 公安系防暴安全03安檢
- 孫權(quán)勸學(xué)教案全國一等獎教學(xué)設(shè)計(jì)
- 企業(yè)生產(chǎn)現(xiàn)場6S管理知識培訓(xùn)課件
- 五年級下冊數(shù)學(xué)課件 第10課時 練習(xí)課 蘇教版(共11張PPT)
- 電梯口包邊施工方案正式
- 三年級道德與法治下冊我是獨(dú)特的
- 青年卒中 幻燈
- 典型倒閘操作票
評論
0/150
提交評論