CRM系統(tǒng)中的商業(yè)智能技術(shù)培訓(xùn)課件_第1頁(yè)
CRM系統(tǒng)中的商業(yè)智能技術(shù)培訓(xùn)課件_第2頁(yè)
CRM系統(tǒng)中的商業(yè)智能技術(shù)培訓(xùn)課件_第3頁(yè)
CRM系統(tǒng)中的商業(yè)智能技術(shù)培訓(xùn)課件_第4頁(yè)
CRM系統(tǒng)中的商業(yè)智能技術(shù)培訓(xùn)課件_第5頁(yè)
已閱讀5頁(yè),還剩78頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第7章CRM系統(tǒng)中的商業(yè)智能技術(shù)數(shù)據(jù)倉(cāng)庫(kù)技術(shù)數(shù)據(jù)挖掘理解三種技術(shù)的的應(yīng)用CRM系統(tǒng)中商業(yè)智能技術(shù)本章主要內(nèi)容:)聯(lián)機(jī)分析處理數(shù)據(jù)挖掘

OLAP的應(yīng)用

數(shù)據(jù)挖掘應(yīng)用基本步驟設(shè)計(jì)與實(shí)施數(shù)據(jù)倉(cāng)庫(kù)技術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能第一節(jié)商業(yè)智能商業(yè)智能是從大量的數(shù)據(jù)和信息中發(fā)掘有用的知識(shí),并用于決策以增加商業(yè)利潤(rùn),是一個(gè)從數(shù)據(jù)到信息到知識(shí)的處理過(guò)程。商業(yè)智能用來(lái)輔助商業(yè)活動(dòng)作出快速反應(yīng),加快知識(shí)的獲取速度,減少企業(yè)不確定性因素的影響。因此能很好地滿足管理層和決策層對(duì)信息知識(shí)的時(shí)間性和準(zhǔn)確性的要求。商業(yè)智能在我國(guó)尚處于起步階段,雖然其在發(fā)展和應(yīng)用過(guò)程中仍存在很多不足,但商業(yè)智能正朝著實(shí)時(shí)性、標(biāo)準(zhǔn)化、集成性、實(shí)用性、大眾化方向發(fā)展。

商業(yè)智能的定義數(shù)據(jù)挖掘

OLAP的應(yīng)用

數(shù)據(jù)挖掘應(yīng)用基本步驟設(shè)計(jì)與實(shí)施數(shù)據(jù)倉(cāng)庫(kù)技術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能支撐技術(shù):數(shù)據(jù)倉(cāng)庫(kù)為平臺(tái),數(shù)據(jù)挖掘OLAP互補(bǔ),進(jìn)行分析體系結(jié)構(gòu):以Web服務(wù)形式提供,以XML形式發(fā)放BI應(yīng)用的分析結(jié)果是新的發(fā)展趨勢(shì)。應(yīng)用系統(tǒng):BI系統(tǒng)將更具專(zhuān)業(yè)化和行業(yè)化的特點(diǎn),與企業(yè)門(mén)戶、企業(yè)應(yīng)用集成緊密相連商業(yè)智能的發(fā)展商業(yè)智能的發(fā)展第一節(jié)商業(yè)智能數(shù)據(jù)挖掘

OLAP的應(yīng)用

數(shù)據(jù)挖掘應(yīng)用基本步驟設(shè)計(jì)與實(shí)施數(shù)據(jù)倉(cāng)庫(kù)技術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能數(shù)據(jù)倉(cāng)庫(kù)決策支持企業(yè)決策層OLAP數(shù)據(jù)挖掘數(shù)據(jù)存儲(chǔ)提取、清洗、轉(zhuǎn)化業(yè)務(wù)數(shù)據(jù)庫(kù)決策信息反饋到實(shí)際的業(yè)務(wù)系統(tǒng)中

商業(yè)智能系統(tǒng)的構(gòu)成商業(yè)智能系統(tǒng)由業(yè)務(wù)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)、決策支持系統(tǒng)等部分構(gòu)成。圖7-12商業(yè)智能系統(tǒng)的數(shù)據(jù)處理循環(huán)第一節(jié)商業(yè)智能數(shù)據(jù)挖掘

OLAP的應(yīng)用

數(shù)據(jù)挖掘應(yīng)用基本步驟設(shè)計(jì)與實(shí)施數(shù)據(jù)倉(cāng)庫(kù)技術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能商務(wù)智能系統(tǒng)的三大支撐技術(shù)數(shù)據(jù)倉(cāng)庫(kù)技術(shù)

OLAP

數(shù)據(jù)倉(cāng)庫(kù)完成了數(shù)據(jù)的收集、集成、存儲(chǔ)、管理等工作,商務(wù)智能面對(duì)的是經(jīng)過(guò)加工的數(shù)據(jù),能更專(zhuān)注于信息的提取和知識(shí)的發(fā)現(xiàn)。OLAP從多種角度對(duì)原始數(shù)據(jù)進(jìn)行分析,將其轉(zhuǎn)化為用戶所理解、并真實(shí)反映企業(yè)經(jīng)營(yíng)情況的信息,為決策提供依據(jù)。數(shù)據(jù)挖掘技術(shù)

數(shù)據(jù)挖掘技術(shù)能高度自動(dòng)化地分析數(shù)據(jù),做出歸納性推理,挖掘出潛在的模式,幫助決策者作出正確的決策。

商業(yè)智能系統(tǒng)的支撐技術(shù)第一節(jié)商業(yè)智能數(shù)據(jù)挖掘

OLAP的應(yīng)用

數(shù)據(jù)挖掘應(yīng)用基本步驟設(shè)計(jì)與實(shí)施數(shù)據(jù)倉(cāng)庫(kù)技術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能客戶智能是創(chuàng)新和使用客戶知識(shí),幫助企業(yè)提高優(yōu)化客戶關(guān)系的決策能力和整體運(yùn)營(yíng)能力的概念、方法、過(guò)程以及軟件的集合。

客戶智能客戶智能的理解理論基礎(chǔ)信息系統(tǒng)層面數(shù)據(jù)分析層面知識(shí)發(fā)現(xiàn)層面戰(zhàn)略層面

客戶智能的定義第一節(jié)商業(yè)智能數(shù)據(jù)挖掘

OLAP的應(yīng)用

數(shù)據(jù)挖掘應(yīng)用基本步驟設(shè)計(jì)與實(shí)施數(shù)據(jù)倉(cāng)庫(kù)技術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能客戶知識(shí),顧名思義,是有關(guān)客戶的知識(shí)??蛻糁R(shí)包括客戶的消費(fèi)偏好、喜歡選用的接觸渠道、消費(fèi)特征等許多描述客戶的知識(shí)??蛻糁R(shí)是人們通過(guò)實(shí)踐認(rèn)識(shí)到的、與客戶有關(guān)的規(guī)律性,而客戶智能是獲得客戶知識(shí)并使用客戶知識(shí)求解問(wèn)題的能力??蛻糁悄苁菍?duì)企業(yè)戰(zhàn)略決策真正有價(jià)值的事物和行動(dòng)。生成客戶知識(shí)的過(guò)程稱(chēng)之為客戶知識(shí)的加工處理過(guò)程,客戶智能不僅包括了客戶知識(shí)的生成,而且強(qiáng)調(diào)了客戶知識(shí)在企業(yè)中的分發(fā)、使用,直到產(chǎn)生客戶智能。

客戶知識(shí)第一節(jié)商業(yè)智能數(shù)據(jù)挖掘

OLAP的應(yīng)用

數(shù)據(jù)挖掘應(yīng)用基本步驟設(shè)計(jì)與實(shí)施數(shù)據(jù)倉(cāng)庫(kù)技術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能客戶知識(shí)生成客戶知識(shí)分發(fā)客戶檔案客戶知識(shí)使用營(yíng)銷(xiāo)客戶服務(wù)。。。??蛻糁悄芸蛻糁悄軋D7-13客戶智能的生成、分發(fā)和使用第一節(jié)商業(yè)智能數(shù)據(jù)挖掘

OLAP的應(yīng)用

數(shù)據(jù)挖掘應(yīng)用基本步驟設(shè)計(jì)與實(shí)施數(shù)據(jù)倉(cāng)庫(kù)技術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能

(1)客戶知識(shí)的生成(generation):使用商業(yè)智能提供的OLAP分析工具、數(shù)據(jù)挖掘工具或兩種工具的組合,發(fā)現(xiàn)存在于客戶數(shù)據(jù)中的模式、規(guī)則、概念、規(guī)律的整個(gè)過(guò)程,稱(chēng)為客戶知識(shí)的生成。

(2)客戶知識(shí)的分發(fā)(distribution):客戶知識(shí)必須到達(dá)組織內(nèi)每一個(gè)需要客戶知識(shí)的部分。將客戶知識(shí)存儲(chǔ)與動(dòng)態(tài)知識(shí)庫(kù),借助CRM的系統(tǒng)平臺(tái),將客戶知識(shí)分發(fā)到需要的終端。

(3)客戶知識(shí)的使用(usingit):將客戶信息和知識(shí)投入使用是CRM的最后一個(gè)環(huán)節(jié)。許多CRM和知識(shí)發(fā)現(xiàn)沒(méi)有成功,很大程度上在于產(chǎn)生的與客戶有關(guān)的信息和知識(shí)不能投入使用。第一節(jié)商業(yè)智能數(shù)據(jù)挖掘

OLAP的應(yīng)用

數(shù)據(jù)挖掘應(yīng)用基本步驟設(shè)計(jì)與實(shí)施數(shù)據(jù)倉(cāng)庫(kù)技術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能第二節(jié)數(shù)據(jù)倉(cāng)庫(kù)概述數(shù)據(jù)倉(cāng)庫(kù)的產(chǎn)生沒(méi)有(一致的)全局信息→很難產(chǎn)生正確的決策沒(méi)有(完整的)歷史數(shù)據(jù)→歷史數(shù)據(jù)分析(經(jīng)驗(yàn))發(fā)展趨勢(shì)預(yù)測(cè)隱含信息挖掘→更難支持企業(yè)決策研究企業(yè)范圍內(nèi)的數(shù)據(jù)集成多數(shù)據(jù)庫(kù)系統(tǒng)面向問(wèn)題的分析海量數(shù)據(jù)存儲(chǔ)產(chǎn)生一項(xiàng)新的信息技術(shù)

DataWarehousingDW的概念起源于20世紀(jì)80年代美國(guó)著名信息工程學(xué)家W.H.Inmon博士RecordSystemAtomicData→提出數(shù)據(jù)倉(cāng)庫(kù)的概念DecisionSupportDatabase數(shù)據(jù)挖掘

OLAP的應(yīng)用

數(shù)據(jù)挖掘應(yīng)用基本步驟設(shè)計(jì)與實(shí)施數(shù)據(jù)倉(cāng)庫(kù)技術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能第二二節(jié)節(jié)數(shù)數(shù)據(jù)據(jù)倉(cāng)倉(cāng)庫(kù)庫(kù)概概述述早期期數(shù)數(shù)據(jù)據(jù)倉(cāng)倉(cāng)庫(kù)庫(kù)的的定定義義的的重重要要文文獻(xiàn)獻(xiàn)::MartinHubel1986.10DataBaseandtheDataWarehousingConcept數(shù)據(jù)據(jù)倉(cāng)倉(cāng)庫(kù)庫(kù)的的定定義義AnArchitectureforaBusinessandInformationSystem—IBMSystemJournal其中中,,披披露露了了一一項(xiàng)項(xiàng)IBM的內(nèi)內(nèi)部部研研究究計(jì)計(jì)劃劃目的的::構(gòu)構(gòu)造造一一種種“以關(guān)關(guān)系系數(shù)數(shù)據(jù)據(jù)庫(kù)庫(kù)為為基基礎(chǔ)礎(chǔ)的的公公司司數(shù)數(shù)據(jù)據(jù)的的集集成成化化倉(cāng)倉(cāng)儲(chǔ)儲(chǔ)”倉(cāng)儲(chǔ)儲(chǔ)的的使使用用者者::不不是是IT人員員而是是各各級(jí)級(jí)決決策策者者→→數(shù)據(jù)據(jù)倉(cāng)倉(cāng)庫(kù)庫(kù)1991年,,IBM公司司正正式式公公布布其其DW構(gòu)架架INDEPTH→成功功開(kāi)開(kāi)發(fā)發(fā)DW數(shù)據(jù)據(jù)挖挖掘掘OLAP的的應(yīng)應(yīng)用用數(shù)據(jù)據(jù)挖挖掘掘應(yīng)應(yīng)用用基本本步步驟驟設(shè)計(jì)計(jì)與與實(shí)實(shí)施施數(shù)據(jù)據(jù)倉(cāng)倉(cāng)庫(kù)庫(kù)技技術(shù)術(shù)體系系結(jié)結(jié)構(gòu)構(gòu)數(shù)據(jù)據(jù)倉(cāng)倉(cāng)庫(kù)庫(kù)客戶戶智智能能定義義、、構(gòu)構(gòu)成成OLAP技術(shù)術(shù)應(yīng)用用商業(yè)業(yè)智智能能第二二節(jié)節(jié)數(shù)數(shù)據(jù)據(jù)倉(cāng)倉(cāng)庫(kù)庫(kù)概概述述數(shù)據(jù)據(jù)倉(cāng)倉(cāng)庫(kù)庫(kù)(datawarehouse)是一一個(gè)個(gè)面面向向主主題題的的(subjectoriented)、集集成成的的(integrated)、非非易易失失的的(non-volatile)、隨隨時(shí)時(shí)間間變變化化的的(timevariant)數(shù)據(jù)據(jù)集集合合,,用用于于支支持持管管理理決決策策。。面向主題集成性非易失性時(shí)變性

在數(shù)據(jù)倉(cāng)庫(kù)中,所有數(shù)據(jù)都是圍繞一定主題進(jìn)行。對(duì)于同一主題:關(guān)系數(shù)據(jù)庫(kù)中,數(shù)據(jù)分布在相關(guān)的數(shù)據(jù)表中,在數(shù)據(jù)倉(cāng)庫(kù)中,數(shù)據(jù)存放在同一數(shù)據(jù)表中。數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)都經(jīng)過(guò)清洗、過(guò)濾、轉(zhuǎn)換。都有統(tǒng)一得格式、消除了源數(shù)據(jù)中結(jié)構(gòu)、表示方式、代碼含義,不一致性

對(duì)于支持決策,歷史數(shù)據(jù)非常重要。數(shù)據(jù)一旦寫(xiě)入,幾乎不再更改,除非錯(cuò)誤。對(duì)數(shù)據(jù)倉(cāng)庫(kù)的操作只是數(shù)據(jù)追加。所以數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)是非易失的(穩(wěn)定的)數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)是只增不刪的,所以記錄了所有的數(shù)據(jù)。反映企業(yè)各個(gè)時(shí)期的信息,即反映企業(yè)隨時(shí)間動(dòng)態(tài)變化的數(shù)據(jù)。數(shù)據(jù)據(jù)倉(cāng)倉(cāng)庫(kù)庫(kù)的的定定義義數(shù)據(jù)據(jù)挖挖掘掘OLAP的的應(yīng)應(yīng)用用數(shù)據(jù)據(jù)挖挖掘掘應(yīng)應(yīng)用用基本本步步驟驟設(shè)計(jì)計(jì)與與實(shí)實(shí)施施數(shù)據(jù)據(jù)倉(cāng)倉(cāng)庫(kù)庫(kù)技技術(shù)術(shù)體系系結(jié)結(jié)構(gòu)構(gòu)數(shù)據(jù)據(jù)倉(cāng)倉(cāng)庫(kù)庫(kù)客戶戶智智能能定義義、、構(gòu)構(gòu)成成OLAP技術(shù)術(shù)應(yīng)用用商業(yè)業(yè)智智能能第二二節(jié)節(jié)數(shù)數(shù)據(jù)據(jù)倉(cāng)倉(cāng)庫(kù)庫(kù)概概述述面向主題案例數(shù)據(jù)據(jù)結(jié)結(jié)構(gòu)構(gòu)::銷(xiāo)售售管管理理系系統(tǒng)統(tǒng)顧客客((顧顧客客號(hào)號(hào),,姓姓名名,,性性別別,,年年齡齡,,文文化化程程度度,,地地址址,,電電話話))銷(xiāo)售售((員員工工號(hào)號(hào),,顧顧客客號(hào)號(hào),,商品品號(hào)號(hào),數(shù)量,單價(jià),日期期)采購(gòu)管理系統(tǒng)統(tǒng)訂單單(訂單號(hào),,供應(yīng)商號(hào),,總金額,日日期)訂單細(xì)則(訂訂單號(hào),商品號(hào),類(lèi)別,單價(jià)價(jià),數(shù)量)供應(yīng)商((供應(yīng)商號(hào),,供應(yīng)商名,,地址,電話話)庫(kù)存管理系統(tǒng)統(tǒng)領(lǐng)料單(領(lǐng)料料單號(hào),領(lǐng)料料人,商品號(hào),數(shù)量,日期)進(jìn)料單(進(jìn)料料單號(hào),訂單單號(hào),進(jìn)料人人,收料人,,日期)庫(kù)存(商商品號(hào),庫(kù)房房號(hào),庫(kù)存量量,日期)庫(kù)房(庫(kù)庫(kù)房號(hào),倉(cāng)庫(kù)庫(kù)管理員,地地點(diǎn),庫(kù)存商商品描述)數(shù)據(jù)挖掘OLAP的應(yīng)應(yīng)用數(shù)據(jù)挖掘應(yīng)用用基本步驟設(shè)計(jì)與實(shí)施數(shù)據(jù)倉(cāng)庫(kù)技術(shù)術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能第二節(jié)數(shù)據(jù)據(jù)倉(cāng)庫(kù)概述面向主題案例這種數(shù)據(jù)組織織的特點(diǎn):對(duì)相關(guān)部門(mén)的的數(shù)據(jù)進(jìn)行收收集和處理,,重點(diǎn)是“數(shù)據(jù)”和“處理”數(shù)據(jù)按部門(mén)的的組織結(jié)構(gòu)和和業(yè)務(wù)活動(dòng)特特點(diǎn)進(jìn)行;數(shù)據(jù)是不斷變變化和反復(fù)更更新的,所以以,是動(dòng)態(tài)的的,要求的是是處理的速度和和即時(shí)性(只只反映當(dāng)時(shí)的的情況);數(shù)據(jù)庫(kù)中存儲(chǔ)儲(chǔ)的表與部門(mén)門(mén)中的業(yè)務(wù)報(bào)報(bào)表基本上是是對(duì)應(yīng)的,所所以,直觀,處理方方便,易理解解;數(shù)據(jù)庫(kù)建立的的本質(zhì):數(shù)據(jù)據(jù)與處理分離離(在程序中中不分離)因?yàn)椋汉芏鄳?yīng)應(yīng)用涉及同一一數(shù)據(jù)項(xiàng),而而同一數(shù)據(jù)項(xiàng)項(xiàng)分散在不同同的數(shù)據(jù)庫(kù)中→→造成數(shù)據(jù)據(jù)的不一致性性。這樣的數(shù)據(jù)處處理方式稱(chēng)為為“聯(lián)機(jī)事務(wù)處理理”——OLTP數(shù)據(jù)庫(kù)的存儲(chǔ)儲(chǔ)要求冗冗余?。ǜ鞲鞣N范式)速度快(保保留一定的冗冗余)數(shù)據(jù)挖掘OLAP的應(yīng)應(yīng)用數(shù)據(jù)挖掘應(yīng)用用基本步驟設(shè)計(jì)與實(shí)施數(shù)據(jù)倉(cāng)庫(kù)技術(shù)術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能第二節(jié)數(shù)據(jù)據(jù)倉(cāng)庫(kù)概述按主題組織數(shù)數(shù)據(jù)的數(shù)據(jù)結(jié)結(jié)構(gòu):商品商品固有信息息(商品號(hào),商品名,類(lèi)別,顏色,…)商品采購(gòu)信息息(商品號(hào),供應(yīng)商號(hào),供應(yīng)價(jià),供應(yīng)日期,供應(yīng)量,…)商品銷(xiāo)售信息息(商品號(hào),顧客號(hào),售價(jià),銷(xiāo)售日期,銷(xiāo)售量,….)商品庫(kù)存信息息(商品號(hào),庫(kù)房號(hào),庫(kù)存量,日期,…)供應(yīng)商供應(yīng)商固有信信息(供應(yīng)商號(hào),供應(yīng)信息,地址,電話,…)供應(yīng)商品信息息(供應(yīng)商號(hào),商品號(hào),供應(yīng)價(jià),供應(yīng)日期,供應(yīng)量,…)顧客客顧客固有信息息(顧客號(hào),顧客名,性別,年齡,文化程度,住址,電話,…)顧客購(gòu)物信息息(顧客號(hào),商品號(hào),售價(jià),購(gòu)買(mǎi)日期,購(gòu)買(mǎi)量,…)①企業(yè)關(guān)心的業(yè)業(yè)務(wù)方向:客客戶,商品,,供應(yīng)商②對(duì)上述分析對(duì)對(duì)象,可圍繞繞主題進(jìn)行數(shù)數(shù)據(jù)組織:采購(gòu)銷(xiāo)售庫(kù)存商品(一致)信息息,便于聯(lián)聯(lián)機(jī)分析處理理OLAP數(shù)據(jù)挖掘OLAP的應(yīng)應(yīng)用數(shù)據(jù)挖掘應(yīng)用用基本步驟設(shè)計(jì)與實(shí)施數(shù)據(jù)倉(cāng)庫(kù)技術(shù)術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能(1)數(shù)據(jù)粒度面向數(shù)據(jù)挖掘掘面向OLAP粒度的大小反反映數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的數(shù)據(jù)綜合程程度。粒度越越小,數(shù)據(jù)越詳詳細(xì),數(shù)據(jù)量量也越大。(表表7-1)反映的是抽樣樣率。抽樣率率的確定取決于源源數(shù)據(jù)量的大大小和數(shù)據(jù)挖掘的的具體要求。。源數(shù)據(jù)量越大,,抽樣率越低低。表7-1數(shù)數(shù)據(jù)粒度度的相關(guān)指標(biāo)標(biāo)數(shù)據(jù)粒度的劃劃分是設(shè)計(jì)最最重要的工作作,需考慮數(shù)數(shù)據(jù)倉(cāng)庫(kù)可接接受的分析類(lèi)類(lèi)型和最低粒粒度以及能存存儲(chǔ)的數(shù)據(jù)量量。一般數(shù)據(jù)據(jù)倉(cāng)庫(kù)都選擇擇多重粒度的的結(jié)構(gòu)。重要概念第二節(jié)數(shù)據(jù)據(jù)倉(cāng)庫(kù)概述數(shù)據(jù)挖掘OLAP的應(yīng)應(yīng)用數(shù)據(jù)挖掘應(yīng)用用基本步驟設(shè)計(jì)與實(shí)施數(shù)據(jù)倉(cāng)庫(kù)技術(shù)術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能數(shù)據(jù)分割常見(jiàn)見(jiàn)形式垂直分割水平分割圖解分割(2)數(shù)據(jù)分割數(shù)據(jù)分割就是將大量的的數(shù)據(jù)分成獨(dú)獨(dú)立的、較小小的單元進(jìn)行行存儲(chǔ)以提高高數(shù)據(jù)處理的的效率。在進(jìn)進(jìn)行分割時(shí)要要考慮數(shù)據(jù)量量、數(shù)據(jù)對(duì)象象和粒度劃分分策略等幾個(gè)個(gè)方面。一個(gè)表垂直分分成兩部分,把把一個(gè)大表分成成兩個(gè)表,表之之間通過(guò)關(guān)鍵字段關(guān)聯(lián)。表按行分成兩兩部分,表被用用來(lái)存儲(chǔ)用戶聯(lián)聯(lián)系緊密的本地地重要數(shù)據(jù),減減少網(wǎng)絡(luò)查詢。。經(jīng)過(guò)多個(gè)分布布系統(tǒng)把一個(gè)圖分分解成兩部分,從從指定的服務(wù)器或或在多個(gè)服務(wù)器之之間建立連接而得得到一個(gè)表所需要要的全部數(shù)據(jù)。第二節(jié)數(shù)據(jù)據(jù)倉(cāng)庫(kù)概述數(shù)據(jù)挖掘OLAP的應(yīng)應(yīng)用數(shù)據(jù)挖掘應(yīng)用用基本步驟設(shè)計(jì)與實(shí)施數(shù)據(jù)倉(cāng)庫(kù)技術(shù)術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能第二節(jié)數(shù)據(jù)據(jù)倉(cāng)庫(kù)概述數(shù)據(jù)倉(cāng)庫(kù)與數(shù)數(shù)據(jù)庫(kù)的區(qū)別別表7-2數(shù)據(jù)庫(kù)和數(shù)據(jù)據(jù)倉(cāng)庫(kù)的區(qū)別別數(shù)據(jù)庫(kù)只存儲(chǔ)儲(chǔ)當(dāng)前數(shù)據(jù),,而數(shù)據(jù)倉(cāng)庫(kù)庫(kù)存放歷史數(shù)數(shù)據(jù);數(shù)據(jù)庫(kù)庫(kù)主要面向業(yè)業(yè)務(wù)操作,而而數(shù)據(jù)倉(cāng)庫(kù)面面向數(shù)據(jù)分析析和決策支持持;數(shù)據(jù)庫(kù)中中的數(shù)據(jù)是動(dòng)動(dòng)態(tài)變化的,,隨時(shí)刷新,,而數(shù)據(jù)倉(cāng)庫(kù)庫(kù)中的數(shù)據(jù)是是靜態(tài)的,一一般不會(huì)改變變;數(shù)據(jù)庫(kù)使使用頻率比數(shù)數(shù)據(jù)倉(cāng)庫(kù)高,,數(shù)據(jù)訪問(wèn)量量少,要求響響應(yīng)時(shí)間短。。數(shù)據(jù)挖掘OLAP的應(yīng)應(yīng)用數(shù)據(jù)挖掘應(yīng)用用基本步驟設(shè)計(jì)與實(shí)施數(shù)據(jù)倉(cāng)庫(kù)技術(shù)術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能企業(yè)外部數(shù)據(jù)據(jù)數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)儲(chǔ)業(yè)務(wù)操作型系系統(tǒng)數(shù)據(jù)清洗/轉(zhuǎn)換數(shù)據(jù)提取提取倉(cāng)庫(kù)數(shù)據(jù)挖掘系統(tǒng)/數(shù)據(jù)展現(xiàn)系統(tǒng)數(shù)據(jù)集市數(shù)據(jù)集市數(shù)據(jù)集市數(shù)據(jù)集市數(shù)據(jù)倉(cāng)庫(kù)的體體系結(jié)構(gòu)數(shù)據(jù)元數(shù)據(jù)據(jù)圖7-3數(shù)數(shù)據(jù)倉(cāng)庫(kù)的體體系結(jié)構(gòu)圖第二節(jié)數(shù)據(jù)據(jù)倉(cāng)庫(kù)概述數(shù)據(jù)挖掘OLAP的應(yīng)應(yīng)用數(shù)據(jù)挖掘應(yīng)用用基本步驟設(shè)計(jì)與實(shí)施數(shù)據(jù)倉(cāng)庫(kù)技術(shù)術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能數(shù)據(jù)倉(cāng)庫(kù)的體體系結(jié)構(gòu)由于數(shù)據(jù)庫(kù)和和數(shù)據(jù)倉(cāng)庫(kù)應(yīng)應(yīng)用的出發(fā)點(diǎn)點(diǎn)不同,因此此數(shù)據(jù)倉(cāng)庫(kù)與與業(yè)務(wù)數(shù)據(jù)庫(kù)庫(kù)系統(tǒng)是相互互獨(dú)立的,但但數(shù)據(jù)倉(cāng)庫(kù)又又同業(yè)務(wù)數(shù)據(jù)據(jù)庫(kù)系統(tǒng)密切切相關(guān)。數(shù)據(jù)倉(cāng)庫(kù)是將將業(yè)務(wù)操作型型系統(tǒng)中的數(shù)數(shù)據(jù)提取出來(lái)來(lái),輔以企業(yè)業(yè)外部數(shù)據(jù),,這些數(shù)據(jù)經(jīng)經(jīng)過(guò)清洗和轉(zhuǎn)轉(zhuǎn)換,存儲(chǔ)在在數(shù)據(jù)倉(cāng)庫(kù)中中。數(shù)據(jù)倉(cāng)庫(kù)庫(kù)不只存儲(chǔ)業(yè)業(yè)務(wù)數(shù)據(jù),還還存儲(chǔ)記錄數(shù)數(shù)據(jù)信息的元元數(shù)據(jù)。數(shù)據(jù)倉(cāng)庫(kù)中還還可以抽取部部門(mén)型數(shù)據(jù)倉(cāng)倉(cāng)庫(kù),即數(shù)據(jù)據(jù)集市。數(shù)據(jù)據(jù)最終傳送給給數(shù)據(jù)挖掘系系統(tǒng)或數(shù)據(jù)展展現(xiàn)系統(tǒng),以以供數(shù)據(jù)分析析或展現(xiàn)給用用戶。所以,,數(shù)據(jù)倉(cāng)庫(kù)不不是簡(jiǎn)單地對(duì)對(duì)數(shù)據(jù)進(jìn)行存存儲(chǔ),而是對(duì)對(duì)數(shù)據(jù)進(jìn)行““再組織”。。第二節(jié)數(shù)據(jù)據(jù)倉(cāng)庫(kù)概述數(shù)據(jù)挖掘OLAP的應(yīng)應(yīng)用數(shù)據(jù)挖掘應(yīng)用用基本步驟設(shè)計(jì)與實(shí)施數(shù)據(jù)倉(cāng)庫(kù)技術(shù)術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能傳統(tǒng)數(shù)據(jù)庫(kù)面面向操作型環(huán)環(huán)境,系統(tǒng)設(shè)設(shè)計(jì)人員能夠夠明確了解用用戶需求,因因此傳統(tǒng)數(shù)據(jù)據(jù)庫(kù)一般采用用系統(tǒng)生命周期期法(systemdevelopmentlifecycle,SDLC))。而數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)面向分析析型應(yīng)用,設(shè)設(shè)計(jì)人員要在在與用戶不斷斷溝通的基礎(chǔ)礎(chǔ)上,逐步明明確與完善系系統(tǒng)需求,因因此數(shù)據(jù)倉(cāng)庫(kù)庫(kù)設(shè)計(jì)采用CLDS(cyclelifedevelopmentsystem)方法。需求分析貫穿穿整個(gè)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)設(shè)計(jì)過(guò)程程。數(shù)據(jù)倉(cāng)庫(kù)的設(shè)設(shè)計(jì)方法與步步驟第二節(jié)數(shù)據(jù)據(jù)倉(cāng)庫(kù)概述數(shù)據(jù)挖掘OLAP的應(yīng)應(yīng)用數(shù)據(jù)挖掘應(yīng)用用基本步驟設(shè)計(jì)與實(shí)施數(shù)據(jù)倉(cāng)庫(kù)技術(shù)術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能數(shù)據(jù)倉(cāng)庫(kù)的設(shè)設(shè)計(jì)方法與步步驟第二節(jié)數(shù)據(jù)據(jù)倉(cāng)庫(kù)概述圖7-4SDLC方法法和CLDS方法比較數(shù)據(jù)挖掘OLAP的的應(yīng)用數(shù)據(jù)挖掘應(yīng)應(yīng)用基本步驟設(shè)計(jì)與實(shí)施施數(shù)據(jù)倉(cāng)庫(kù)技技術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成成OLAP技術(shù)應(yīng)用商業(yè)智能數(shù)據(jù)倉(cāng)庫(kù)的的設(shè)計(jì)方法法與步驟第二節(jié)數(shù)數(shù)據(jù)倉(cāng)庫(kù)概概述表7-3數(shù)數(shù)據(jù)倉(cāng)庫(kù)設(shè)設(shè)計(jì)與數(shù)據(jù)據(jù)庫(kù)設(shè)計(jì)的的區(qū)別數(shù)據(jù)挖掘OLAP的的應(yīng)用數(shù)據(jù)挖掘應(yīng)應(yīng)用基本步驟設(shè)計(jì)與實(shí)施施數(shù)據(jù)倉(cāng)庫(kù)技技術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成成OLAP技術(shù)應(yīng)用商業(yè)智能數(shù)據(jù)倉(cāng)庫(kù)的的設(shè)計(jì)方法法與步驟第二節(jié)數(shù)數(shù)據(jù)倉(cāng)庫(kù)概概述圖7-5數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)設(shè)計(jì)的主主要步驟數(shù)據(jù)挖掘OLAP的的應(yīng)用數(shù)據(jù)挖掘應(yīng)應(yīng)用基本步驟設(shè)計(jì)與實(shí)施施數(shù)據(jù)倉(cāng)庫(kù)技技術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成成OLAP技術(shù)應(yīng)用商業(yè)智能第三節(jié)CRM系系統(tǒng)中的數(shù)數(shù)據(jù)倉(cāng)庫(kù)技技術(shù)最終用戶信息使用者知識(shí)挖掘者數(shù)據(jù)倉(cāng)庫(kù)的的用戶信息使用者者使用數(shù)據(jù)據(jù)倉(cāng)庫(kù)是經(jīng)經(jīng)常性的、、重復(fù)性的的,只訪問(wèn)問(wèn)很少的一一部分?jǐn)?shù)據(jù)據(jù)。每次查查詢也許是是相同的幾幾個(gè)指標(biāo),,運(yùn)用數(shù)據(jù)據(jù)倉(cāng)庫(kù)可以以快速、準(zhǔn)準(zhǔn)確地得到到他們所需需要的信息息。信息使使用者是操操作型用戶戶。知識(shí)挖掘者者不只查詢?cè)償?shù)據(jù)倉(cāng)庫(kù)庫(kù)目前能夠夠提供的信信息,還通通過(guò)數(shù)據(jù)分分析找到其其中的隱含含信息,用用以發(fā)現(xiàn)更更深層次的的知識(shí)來(lái)指指導(dǎo)決策。。知識(shí)挖掘掘者是分析析型用戶。。知識(shí)挖掘者者在使用數(shù)數(shù)據(jù)倉(cāng)庫(kù)時(shí)時(shí),先對(duì)數(shù)數(shù)據(jù)進(jìn)行概概括分析,,然后根據(jù)據(jù)需要從數(shù)數(shù)據(jù)倉(cāng)庫(kù)中中抽取數(shù)據(jù)據(jù),對(duì)抽取取出來(lái)的數(shù)數(shù)據(jù)選擇合合適的數(shù)據(jù)據(jù)挖掘算法法進(jìn)行建模模分析,最最后是根據(jù)據(jù)建模分析析得到的知知識(shí)對(duì)數(shù)據(jù)據(jù)倉(cāng)庫(kù)進(jìn)行行分類(lèi)處理理。數(shù)據(jù)挖掘OLAP的的應(yīng)用數(shù)據(jù)挖掘應(yīng)應(yīng)用基本步驟設(shè)計(jì)與實(shí)施施數(shù)據(jù)倉(cāng)庫(kù)技技術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成成OLAP技術(shù)應(yīng)用商業(yè)智能客戶數(shù)據(jù)倉(cāng)庫(kù)的功能動(dòng)態(tài)、整合合的客戶數(shù)數(shù)據(jù)管理和和查詢功能能基于數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)支持的的客戶關(guān)系系結(jié)構(gòu)和忠忠誠(chéng)客戶識(shí)識(shí)別功能基于WEB數(shù)據(jù)倉(cāng)庫(kù)的的信息共享享功能基于數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)支持的的客戶購(gòu)買(mǎi)買(mǎi)行為參考考功能基于數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)支持的的客戶流失失警示功能能CRM系統(tǒng)統(tǒng)中數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)的功能能CRM的數(shù)據(jù)倉(cāng)庫(kù)庫(kù)必須是動(dòng)動(dòng)態(tài)的、整整合的數(shù)據(jù)據(jù)庫(kù)系統(tǒng)。。動(dòng)態(tài)指數(shù)據(jù)庫(kù)能能夠?qū)崟r(shí)地地提供客戶戶的基本資資料和歷史史交易行為為等信息,,并在客戶戶每次交易易完成后,,能夠自動(dòng)動(dòng)補(bǔ)充新的的信息;整合是指客戶數(shù)數(shù)據(jù)庫(kù)與企企業(yè)其他資資源和信息息系統(tǒng)要綜綜合、統(tǒng)一一,各業(yè)務(wù)務(wù)部門(mén)及人人員可根據(jù)據(jù)職能、權(quán)權(quán)限的不同同實(shí)施信息息查詢和更更新功能,,客戶數(shù)據(jù)據(jù)倉(cāng)庫(kù)與企企業(yè)的各交交易渠道和和聯(lián)絡(luò)中心心必須緊密密結(jié)合等。。實(shí)施忠誠(chéng)客客戶管理的的企業(yè)需要要制定一套套合理的建建立和保持持客戶關(guān)系系的格式或或結(jié)構(gòu)。即即企業(yè)要像像建立雇員員的提升計(jì)計(jì)劃一樣,,建立一套套把新客戶戶提升為老老客戶的計(jì)計(jì)劃和方法法。例如,,航空公司司的里程積積累計(jì)劃——客戶飛行了了一定的里里程數(shù),便便可以獲得得相應(yīng)的免免費(fèi)里程,,或根據(jù)客客戶要求提提升艙位等等級(jí)等。企業(yè)運(yùn)用客客戶數(shù)據(jù)倉(cāng)倉(cāng)庫(kù),可以以使每一個(gè)個(gè)服務(wù)人員員在為客戶戶提供產(chǎn)品品和服務(wù)時(shí)時(shí),明確客客戶的偏好好和習(xí)慣,,從而提供供更具有針針對(duì)性的個(gè)個(gè)性化服務(wù)務(wù)。例如,,讀者俱樂(lè)樂(lè)部都有定定制寄送服服務(wù),他們們能根據(jù)會(huì)會(huì)員最后一一次的選擇擇和購(gòu)買(mǎi)記記錄,以及及他們最近近一次與會(huì)會(huì)員交流獲獲得的有關(guān)關(guān)個(gè)人生活活信息,向向會(huì)員推薦薦不同的書(shū)書(shū)籍。企業(yè)的客戶戶數(shù)據(jù)倉(cāng)庫(kù)庫(kù)將通過(guò)對(duì)對(duì)客戶歷史史交易行為為的觀察和和分析,發(fā)發(fā)揮警示客客戶異常購(gòu)購(gòu)買(mǎi)行為的的功能。如如一位客戶戶的購(gòu)買(mǎi)周周期或購(gòu)買(mǎi)買(mǎi)量出現(xiàn)顯顯著萎縮變變化時(shí),就就是潛在的的客戶流失失跡象。客客戶數(shù)據(jù)庫(kù)庫(kù)通過(guò)自動(dòng)動(dòng)監(jiān)視客戶戶的交易資資料,對(duì)客客戶的潛在在流失現(xiàn)象象作出警示示。Web數(shù)據(jù)倉(cāng)庫(kù)將將成為企業(yè)業(yè)信息共享享的基礎(chǔ)架架構(gòu)??蛻魬魯?shù)據(jù)倉(cāng)庫(kù)庫(kù)應(yīng)擁有可可以通過(guò)瀏瀏覽器使用用的接口,,以成為支支持客戶關(guān)關(guān)系管理的的基本架構(gòu)構(gòu),并且數(shù)數(shù)據(jù)倉(cāng)庫(kù)要要能夠通過(guò)過(guò)用戶的簡(jiǎn)簡(jiǎn)單點(diǎn)擊就就可以獲得得分析結(jié)果果。CRM環(huán)境下連接接分散單位位的數(shù)據(jù)中中心建成關(guān)關(guān)鍵在于Web數(shù)據(jù)倉(cāng)庫(kù)構(gòu)構(gòu)造之初就就為其所有有部分確立立一致的數(shù)數(shù)據(jù)元,并并通過(guò)一致致的數(shù)據(jù)元元實(shí)現(xiàn)數(shù)據(jù)據(jù)倉(cāng)庫(kù)的總總線體系結(jié)結(jié)構(gòu)。第三節(jié)CRM系系統(tǒng)中的數(shù)數(shù)據(jù)倉(cāng)庫(kù)技技術(shù)數(shù)據(jù)挖掘OLAP的的應(yīng)用數(shù)據(jù)挖掘應(yīng)應(yīng)用基本步驟設(shè)計(jì)與實(shí)施施數(shù)據(jù)倉(cāng)庫(kù)技技術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成成OLAP技術(shù)應(yīng)用商業(yè)智能能圖7-6客戶數(shù)據(jù)據(jù)倉(cāng)庫(kù)的的體系結(jié)結(jié)構(gòu)數(shù)據(jù)挖掘?qū)Ψ治龅慕Y(jié)果進(jìn)行評(píng)估客戶信息客戶活動(dòng)清洗、轉(zhuǎn)換外部數(shù)據(jù)聯(lián)機(jī)分析處理數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)準(zhǔn)備客戶數(shù)據(jù)集市CRM系系統(tǒng)中數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的系統(tǒng)統(tǒng)結(jié)構(gòu)第三節(jié)CRM系統(tǒng)統(tǒng)中的數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)數(shù)據(jù)挖掘掘OLAP的應(yīng)用用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能CRM系系統(tǒng)中數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的系統(tǒng)統(tǒng)結(jié)構(gòu)數(shù)據(jù)通過(guò)過(guò)抽取、轉(zhuǎn)轉(zhuǎn)換和裝裝載,形成數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù),并通通過(guò)OLAP和報(bào)表,,將客戶戶的整體體行為分分析和企企業(yè)運(yùn)營(yíng)營(yíng)分析等等傳遞給給數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)用戶戶。在數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)中,,利用數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的ETL(extraction-transformation-loading)工具,針針對(duì)行為為分組和和尋找重重點(diǎn)客戶戶的需要要,產(chǎn)生生相應(yīng)的的數(shù)據(jù)集市市(DM),將分析析結(jié)果與與性能評(píng)評(píng)價(jià)等傳傳遞給CRM用戶。對(duì)對(duì)于客戶戶量巨大大、市場(chǎng)場(chǎng)策略對(duì)對(duì)企業(yè)影影響較大大的企業(yè)業(yè),CRM要以數(shù)據(jù)據(jù)倉(cāng)庫(kù)為為核心。。數(shù)據(jù)來(lái)源客戶信息息客戶行為為生產(chǎn)系統(tǒng)統(tǒng)其他相關(guān)關(guān)數(shù)據(jù)第三節(jié)CRM系統(tǒng)統(tǒng)中的數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)數(shù)據(jù)挖掘掘OLAP的應(yīng)用用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能分析建立企業(yè)模型概念模型設(shè)計(jì)邏輯模型設(shè)計(jì)物理模型設(shè)計(jì)數(shù)據(jù)倉(cāng)庫(kù)生成確定系統(tǒng)邊界及主題域技術(shù)準(zhǔn)備工作確定數(shù)據(jù)的存儲(chǔ)結(jié)構(gòu)

確定數(shù)據(jù)存放位置

確定存儲(chǔ)分配

CRM系系統(tǒng)中數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的設(shè)計(jì)計(jì)與實(shí)施施第三節(jié)CRM系統(tǒng)統(tǒng)中的數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)數(shù)據(jù)挖掘掘OLAP的應(yīng)用用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能客戶數(shù)據(jù)倉(cāng)庫(kù)的建立注意問(wèn)題數(shù)據(jù)信息息收集和和集成確保數(shù)據(jù)據(jù)的質(zhì)量量按規(guī)則更更新客戶戶數(shù)據(jù),保持對(duì)已已有客戶戶的統(tǒng)一一看法數(shù)據(jù)倉(cāng)庫(kù)庫(kù)統(tǒng)一共共享,以以發(fā)揮最最大作用用為進(jìn)一步步了解客客戶身份份及其需需求,并并做出預(yù)預(yù)測(cè),企企業(yè)需要要花費(fèi)一一些精力力進(jìn)行分分析,因因此產(chǎn)生生了數(shù)據(jù)據(jù)信息搜搜集。成成功地使使用數(shù)據(jù)據(jù)信息搜搜集是CRM建設(shè)的重重要步驟驟。CRM的客戶數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)需要把把企業(yè)內(nèi)內(nèi)外的客客戶數(shù)據(jù)據(jù)集成起起來(lái)。就就客戶數(shù)數(shù)據(jù)集成成來(lái)講,,企業(yè)需需要對(duì)客客戶進(jìn)行行匹配和和合并。。首先,在在建立CRM數(shù)據(jù)庫(kù)時(shí)時(shí),一定定要確認(rèn)認(rèn)由應(yīng)用用程序所所生成的的客戶編編碼的唯唯一性;;其次,,建立完完整、準(zhǔn)準(zhǔn)確的客客戶數(shù)據(jù)據(jù)倉(cāng)庫(kù),,姓名和和地址這這兩個(gè)信信息片段段是很重重要的,,一定要要進(jìn)行分分解和規(guī)規(guī)范化;;最后,,對(duì)企業(yè)業(yè)想收集集又沒(méi)有有一定結(jié)結(jié)構(gòu)且信信息量比比較大的的數(shù)據(jù)一一定要非非常慎重重,比如如文本信信息。首先識(shí)別別新數(shù)據(jù)據(jù)性質(zhì),,新客戶戶的數(shù)據(jù)據(jù)給一個(gè)個(gè)獨(dú)立的的標(biāo)識(shí),,在數(shù)據(jù)據(jù)倉(cāng)庫(kù)中中插入一一條新的的記錄;;如果是是已有客客戶的數(shù)數(shù)據(jù),更更新客戶戶記錄的的相關(guān)信信息片段段。數(shù)據(jù)據(jù)更新要要求同步步化是CRM數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的特點(diǎn)點(diǎn)之一。。統(tǒng)一共享享的客戶戶數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)把銷(xiāo)銷(xiāo)售、市市場(chǎng)營(yíng)銷(xiāo)銷(xiāo)和客戶戶服務(wù)的的所有信信息連接接起來(lái)。。如果一一個(gè)企業(yè)業(yè)的信息息來(lái)源互互相獨(dú)立立,那么么這些信信息會(huì)不不可避免免地出現(xiàn)現(xiàn)重復(fù)、、互相沖沖突等現(xiàn)現(xiàn)象,這這對(duì)企業(yè)業(yè)的整體體運(yùn)作效效率將產(chǎn)產(chǎn)生消極極的影響響。第三節(jié)CRM系統(tǒng)統(tǒng)中的數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)CRM系系統(tǒng)中數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的設(shè)計(jì)計(jì)與實(shí)施施數(shù)據(jù)挖掘掘OLAP的應(yīng)用用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能CRM中數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用客戶行為為分析重點(diǎn)客戶戶發(fā)現(xiàn)市場(chǎng)性能能評(píng)估客戶行為為分析包包括整體行為為分析和群體行為為分析兩個(gè)方面面。整體行行為分析析用來(lái)發(fā)發(fā)現(xiàn)企業(yè)業(yè)所有客客戶的行行為規(guī)律律,行為為分組時(shí)時(shí)按照客客戶的不不同種類(lèi)類(lèi)的行為為,將客客戶劃分分成不同同的群體體。在行為分分組完成成后,要要進(jìn)行客客戶理解解、客戶戶行為規(guī)規(guī)律發(fā)現(xiàn)現(xiàn)和客戶戶組間交交叉分析析等。重點(diǎn)客戶戶發(fā)現(xiàn)主主要是發(fā)發(fā)現(xiàn)能為為企業(yè)帶帶來(lái)潛在在效益的的重要客客戶。根根據(jù)客戶戶的屬性性特點(diǎn)就就可以挖挖掘出重重點(diǎn)客戶戶,然后后做好保保持和提提高這些些重點(diǎn)客客戶的忠忠誠(chéng)度工工作。此此外,通通過(guò)數(shù)據(jù)據(jù)倉(cāng)庫(kù)的的數(shù)據(jù)清清洗與集集中過(guò)程程,可以以將客戶戶對(duì)市場(chǎng)場(chǎng)的反饋饋?zhàn)詣?dòng)輸輸入數(shù)據(jù)據(jù)倉(cāng)庫(kù)中中,這個(gè)個(gè)獲得客客戶反饋饋的過(guò)程程,稱(chēng)為為客戶行為為追蹤。根據(jù)客戶戶行為分分析,企企業(yè)可以以準(zhǔn)確地地制定市市場(chǎng)策略略和市場(chǎng)場(chǎng)活動(dòng)。然而,這這些市場(chǎng)場(chǎng)活動(dòng)是是否能夠夠達(dá)到預(yù)預(yù)定的目目標(biāo),是是改進(jìn)市市場(chǎng)策略略和評(píng)價(jià)價(jià)客戶行行為分組組性能的的重要指指標(biāo)。因因此,在在CRM中必須須對(duì)行為為分析和和市場(chǎng)策策略進(jìn)行行評(píng)估。第三節(jié)CRM系統(tǒng)統(tǒng)中的數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)CRM系系統(tǒng)中數(shù)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)的應(yīng)用用數(shù)據(jù)挖掘掘OLAP的應(yīng)用用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能第四節(jié)OLAP技術(shù)及其在CRM系統(tǒng)中中的應(yīng)用OLAP是共享多維信信息的、針對(duì)對(duì)特定問(wèn)題的的聯(lián)機(jī)數(shù)據(jù)快速訪問(wèn)和分析的的軟件技術(shù)。。它通過(guò)對(duì)信信息的多種可可能的觀察形形式進(jìn)行快速速、穩(wěn)定一致致和交互性的的存取,允許許管理決策人人員對(duì)數(shù)據(jù)進(jìn)進(jìn)行深入觀察察。相關(guān)概念變量維維的層次性維成員多維數(shù)組數(shù)據(jù)單元聯(lián)機(jī)分析處理理的概念數(shù)據(jù)挖掘OLAP的應(yīng)應(yīng)用數(shù)據(jù)挖掘應(yīng)用用基本步驟設(shè)計(jì)與實(shí)施數(shù)據(jù)倉(cāng)庫(kù)技術(shù)術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能變量:分析數(shù)據(jù)時(shí)要要考慮的屬性性,即描述數(shù)數(shù)據(jù)“是什么么”。維:是人們觀察數(shù)數(shù)據(jù)的特定角角度,是考慮慮問(wèn)題時(shí)的一一類(lèi)屬性,屬屬性集合構(gòu)成一個(gè)維。維的層次性::人們觀察數(shù)據(jù)據(jù)的某個(gè)特定定角度(即某某個(gè)維)還可可以存在細(xì)節(jié)節(jié)程度不同的各各個(gè)描述方面面,我們稱(chēng)這這多個(gè)描述方方面為維的層層次。一個(gè)維維往往具有多個(gè)層層次。維成員:維的一個(gè)取值值,若維分為為幾個(gè)層次,,那么維成員員就是不同維維層次取值的組合合。多維數(shù)組:多維數(shù)組是維維和變量的組組合表示。一一個(gè)多維數(shù)組組可以表示為為:(維1,維2,…,維n,變量)。。數(shù)據(jù)單元:數(shù)據(jù)單元是多多維數(shù)組的取取值。當(dāng)多維維數(shù)組的各個(gè)個(gè)維都選中一一個(gè)維成員,這這些維成員的的組合就唯一一確定了一個(gè)個(gè)變量的值。。那么數(shù)據(jù)單單元就可以表示為為:(維1維維成員,維2維成員,……,維n維成成員,變量的的值)。聯(lián)機(jī)分析處理理的概念第四節(jié)OLAP技術(shù)及其在CRM系統(tǒng)中中的應(yīng)用數(shù)據(jù)挖掘OLAP的應(yīng)應(yīng)用數(shù)據(jù)挖掘應(yīng)用用基本步驟設(shè)計(jì)與實(shí)施數(shù)據(jù)倉(cāng)庫(kù)技術(shù)術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能多維數(shù)據(jù)模型型上的OLAP操作對(duì)多維數(shù)據(jù)集集(維1、維2、維3……維n、變量值)在在維度i上選定一個(gè)維維成員,得到到一個(gè)n-1維多維數(shù)據(jù)集集,稱(chēng)得到的的這個(gè)n-1維多維數(shù)據(jù)集集為原數(shù)據(jù)集集在第i維上的數(shù)據(jù)切切片。OLAP的分析方法數(shù)據(jù)切片數(shù)據(jù)切塊數(shù)據(jù)鉆取數(shù)據(jù)聚集數(shù)據(jù)旋轉(zhuǎn)在多維數(shù)據(jù)立立方體中,確確定某些維度度的取值范圍圍,得到一個(gè)個(gè)原立方體的的子立方體的的過(guò)程被稱(chēng)為為數(shù)據(jù)切塊。。數(shù)據(jù)切塊與與數(shù)據(jù)切片得得到的多維數(shù)數(shù)組都是原多多維立方體的的子集,不同同的是數(shù)據(jù)切切片使多維立立方體降低了了一個(gè)維度,,而數(shù)據(jù)切塊塊得到的多維維立方體與原原立方體的維維度是相同的的。數(shù)據(jù)鉆取(數(shù)據(jù)下鉆),是由概括的的數(shù)據(jù)到詳細(xì)細(xì)的數(shù)據(jù)的過(guò)過(guò)程。數(shù)據(jù)鉆鉆取對(duì)應(yīng)于維維的層次,它它是由維的高高層次展開(kāi)到到低層次的一一個(gè)動(dòng)作。比比如,我們由由“年”數(shù)據(jù)下鉆到“季度”數(shù)據(jù),這無(wú)疑疑會(huì)增加數(shù)據(jù)據(jù)細(xì)節(jié)和數(shù)據(jù)據(jù)量,得到更更詳細(xì)的數(shù)據(jù)據(jù)。數(shù)據(jù)鉆取取的具體操作作參見(jiàn)圖7—2中的數(shù)據(jù)鉆取取部分。數(shù)據(jù)聚集又叫叫數(shù)據(jù)上卷,,是數(shù)據(jù)鉆取取的逆過(guò)程。。數(shù)據(jù)聚集是是將詳細(xì)的數(shù)數(shù)據(jù)聚集為較較概括的數(shù)據(jù)據(jù),是一個(gè)綜綜合數(shù)據(jù)的動(dòng)動(dòng)作。數(shù)據(jù)旋轉(zhuǎn)即變變換維度的位位置,也就是是轉(zhuǎn)動(dòng)數(shù)據(jù)的的視角,給用用戶提供一個(gè)個(gè)從不同的角角度觀察數(shù)據(jù)據(jù)的方法。第四節(jié)OLAP技術(shù)及其在CRM系統(tǒng)中中的應(yīng)用數(shù)據(jù)挖掘OLAP的應(yīng)應(yīng)用數(shù)據(jù)挖掘應(yīng)用用基本步驟設(shè)計(jì)與實(shí)施數(shù)據(jù)倉(cāng)庫(kù)技術(shù)術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能原數(shù)據(jù)立方體體包含了時(shí)間間(年)、城城市、產(chǎn)品三三個(gè)維度,其其中a1,a2為產(chǎn)品名。鉆鉆取過(guò)程是按按時(shí)間下鉆,,由年數(shù)據(jù)得得到季度數(shù)據(jù)據(jù),數(shù)據(jù)由原原來(lái)的兩行展展為八行。聚聚集過(guò)程是按按地區(qū)維度上上卷,將城市市維上卷為國(guó)國(guó)家維,即將將北京、上海海兩城市數(shù)據(jù)據(jù)統(tǒng)計(jì)為中國(guó)國(guó)的數(shù)據(jù),將將東京、大阪阪兩城市的數(shù)數(shù)據(jù)統(tǒng)計(jì)為日日本的數(shù)據(jù)。。數(shù)據(jù)聚集和和數(shù)據(jù)鉆取為為用戶提供了了不同層次觀觀察數(shù)據(jù)的方方法。20073季20071季20061季20063季20074季20072季20064季20062季a1a2

北京上海東京大阪鉆取聚集a2a120062007中國(guó)日本20062007北京上海東京大阪a1a2圖7-7

數(shù)據(jù)鉆取與聚集聚集鉆取第四節(jié)OLAP技術(shù)及其在CRM系統(tǒng)中中的應(yīng)用數(shù)據(jù)挖掘OLAP的應(yīng)應(yīng)用數(shù)據(jù)挖掘應(yīng)用用基本步驟設(shè)計(jì)與實(shí)施數(shù)據(jù)倉(cāng)庫(kù)技術(shù)術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能20062007A1200230A2456478A3100120A1A2A320062004561002007230478120圖7-8數(shù)據(jù)旋轉(zhuǎn)圖7-8是數(shù)據(jù)旋旋轉(zhuǎn)的一個(gè)簡(jiǎn)簡(jiǎn)單示例,只只體現(xiàn)了二維維表的旋轉(zhuǎn)。。當(dāng)數(shù)據(jù)是三三維或是三維維以上的多維維數(shù)據(jù)時(shí),數(shù)數(shù)據(jù)旋轉(zhuǎn)將更更有意義,每每進(jìn)行一次數(shù)數(shù)據(jù)旋轉(zhuǎn)就可可以從一個(gè)新新的視角觀察察數(shù)據(jù)。第四節(jié)OLAP技術(shù)及其在CRM系統(tǒng)中中的應(yīng)用數(shù)據(jù)挖掘OLAP的應(yīng)應(yīng)用數(shù)據(jù)挖掘應(yīng)用用基本步驟設(shè)計(jì)與實(shí)施數(shù)據(jù)倉(cāng)庫(kù)技術(shù)術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能OLAP的特點(diǎn)聯(lián)機(jī)分析處理理的用戶是企企業(yè)中的專(zhuān)業(yè)業(yè)分析人員及及管理決策人人員,在分析析業(yè)務(wù)經(jīng)營(yíng)的的數(shù)據(jù)時(shí),從從不同的角度度來(lái)審視業(yè)務(wù)務(wù)的衡量指標(biāo)標(biāo)是一種很自自然的思考模模式。比如,,分析銷(xiāo)售數(shù)數(shù)據(jù)時(shí),綜合合時(shí)間周期、、產(chǎn)品類(lèi)別、、分銷(xiāo)渠道、、地理分布、、客戶群類(lèi)生生成一張張報(bào)報(bào)表,各個(gè)分分析角度的不不同組合又可可以生成不同同的報(bào)表,使使得IT人員的工作量量相當(dāng)大。聯(lián)機(jī)分析處理理的主要特點(diǎn)點(diǎn)是直接仿照照用戶的多角角度思考模式式,預(yù)先為用用戶組建多維維的數(shù)據(jù)模型型。一旦多維維數(shù)據(jù)模型建建立完成,用用戶可以快速速地從各個(gè)分分析角度獲取取數(shù)據(jù),也能能動(dòng)態(tài)地在各各個(gè)角度之間間切換或者進(jìn)進(jìn)行多角度綜綜合分析,具具有極大的分分析靈活性。。這也是聯(lián)機(jī)機(jī)分析處理近近年來(lái)被廣泛泛關(guān)注的根本本原因,它從從設(shè)計(jì)理念和和真正實(shí)現(xiàn)上上都與舊的管管理信息系統(tǒng)統(tǒng)有著本質(zhì)的的區(qū)別。第四節(jié)OLAP技術(shù)及其在在CRM系系統(tǒng)中的應(yīng)應(yīng)用數(shù)據(jù)挖掘OLAP的的應(yīng)用數(shù)據(jù)挖掘應(yīng)應(yīng)用基本步驟設(shè)計(jì)與實(shí)施施數(shù)據(jù)倉(cāng)庫(kù)技技術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成成OLAP技術(shù)應(yīng)用商業(yè)智能OLAP的應(yīng)用數(shù)據(jù)倉(cāng)庫(kù)系系統(tǒng)核心是是聯(lián)機(jī)分析處理,從應(yīng)用的角角度來(lái)說(shuō),,數(shù)據(jù)倉(cāng)庫(kù)還可以以采用傳統(tǒng)統(tǒng)的報(bào)表或或數(shù)理統(tǒng)計(jì)計(jì)和數(shù)據(jù)挖挖掘等人工工智能方法法,涵蓋的范圍圍更廣;從應(yīng)用的范范圍來(lái)說(shuō),,聯(lián)機(jī)分析處處理往往根根據(jù)用戶分分析的主題題進(jìn)行應(yīng)用分類(lèi)類(lèi),如銷(xiāo)售分析析、市場(chǎng)推推廣分析、、客戶利潤(rùn)潤(rùn)率分析等等,每一個(gè)分析的的主題形成成一個(gè)OLAP應(yīng)用,而所所有的OLAP應(yīng)用實(shí)際上上只是數(shù)據(jù)倉(cāng)庫(kù)系系統(tǒng)的一部部分。以某家電企企業(yè)為例介介紹OLAP的應(yīng)用。家家電的多維維分析涉及及產(chǎn)品、銷(xiāo)售售數(shù)量、地地區(qū)和時(shí)間間4個(gè)維。所有有抽查的數(shù)數(shù)據(jù)都是第第1季度的。第四節(jié)OLAP技術(shù)及其在在CRM系系統(tǒng)中的應(yīng)應(yīng)用數(shù)據(jù)挖掘OLAP的的應(yīng)用數(shù)據(jù)挖掘應(yīng)應(yīng)用基本步驟設(shè)計(jì)與實(shí)施施數(shù)據(jù)倉(cāng)庫(kù)技技術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成成OLAP技術(shù)應(yīng)用商業(yè)智能冰箱銷(xiāo)售第1季度,冰箱箱在什么地地區(qū)銷(xiāo)售情情況最好??第1季度,哪個(gè)個(gè)省份的冰冰箱銷(xiāo)量處處于領(lǐng)先地地位?第1季度,哪個(gè)個(gè)城市的冰冰箱銷(xiāo)售數(shù)數(shù)量最高??負(fù)責(zé)冰箱銷(xiāo)銷(xiāo)售的副總總裁提出了了以下3個(gè)問(wèn)題:解決方法需需要用到OLAP的兩種多維維分析方法法,即數(shù)據(jù)切片片/切塊和數(shù)據(jù)據(jù)鉆取,其他的分析析方法還有有數(shù)據(jù)旋轉(zhuǎn)轉(zhuǎn)和數(shù)據(jù)聚聚集等。第四節(jié)OLAP技術(shù)及其在在CRM系系統(tǒng)中的應(yīng)應(yīng)用數(shù)據(jù)挖掘OLAP的的應(yīng)用數(shù)據(jù)挖掘應(yīng)應(yīng)用基本步驟設(shè)計(jì)與實(shí)施施數(shù)據(jù)倉(cāng)庫(kù)技技術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成成OLAP技術(shù)應(yīng)用商業(yè)智能產(chǎn)品地點(diǎn)時(shí)間電視冰箱空調(diào)華東東北西北2006.42007.12007.22007.3冰箱圖7-9運(yùn)用數(shù)據(jù)切切片來(lái)進(jìn)行行數(shù)據(jù)分析析首先使用數(shù)數(shù)據(jù)切片方方法來(lái)對(duì)第第一個(gè)問(wèn)題題進(jìn)行分析析。在圖7-9的數(shù)據(jù)立方體體中,時(shí)間間、地區(qū)和和產(chǎn)品分別別是3個(gè)維度,銷(xiāo)銷(xiāo)售額是度量變量。。在產(chǎn)品維維上選定“冰箱”則形成在產(chǎn)產(chǎn)品維上的的數(shù)據(jù)切片,顯示了了冰箱在各各地區(qū)和各各月份的銷(xiāo)銷(xiāo)售情況。。第四節(jié)OLAP技術(shù)及其在在CRM系系統(tǒng)中的應(yīng)應(yīng)用數(shù)據(jù)挖掘OLAP的的應(yīng)用數(shù)據(jù)挖掘應(yīng)應(yīng)用基本步驟設(shè)計(jì)與實(shí)施施數(shù)據(jù)倉(cāng)庫(kù)技技術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成成OLAP技術(shù)應(yīng)用商業(yè)智能數(shù)據(jù)鉆取和和聚集會(huì)改改變維的層層次,變換換分析的粒粒度,在家家電企業(yè)的例子中,,必須采用用聯(lián)機(jī)分析析處理工具具深入的地地區(qū)維中,,通過(guò)數(shù)據(jù)據(jù)鉆取來(lái)查看某某地區(qū)維中中更細(xì)致的的數(shù)據(jù)。((如圖7-10所示示)。表7-4按按地區(qū)劃分分的銷(xiāo)售數(shù)數(shù)據(jù)通過(guò)模型驅(qū)驅(qū)動(dòng)工具來(lái)來(lái)查詢數(shù)據(jù)據(jù)倉(cāng)庫(kù)的數(shù)數(shù)據(jù),如表表7-4第四節(jié)OLAP技術(shù)及其在在CRM系系統(tǒng)中的應(yīng)應(yīng)用數(shù)據(jù)挖掘OLAP的的應(yīng)用數(shù)據(jù)挖掘應(yīng)應(yīng)用基本步驟設(shè)計(jì)與實(shí)施施數(shù)據(jù)倉(cāng)庫(kù)技技術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成成OLAP技術(shù)應(yīng)用商業(yè)智能冰箱44899西北79954華東36040東北25309浙江29344江蘇17866吉林18174遼寧西北東北華東冰箱24632陜西20267甘肅25301山東圖7-10運(yùn)用數(shù)據(jù)鉆鉆取來(lái)進(jìn)行行數(shù)據(jù)分析析圖7-10表示示的是對(duì)地地區(qū)維數(shù)據(jù)據(jù)鉆取的第第一步,即即顯示了該該家電企業(yè)業(yè)按地區(qū)劃劃分的各省省份的冰箱箱銷(xiāo)售量(如表7-5所示);更深一步步的鉆取可可以顯示出出各城市的的銷(xiāo)售情況況,得到表表7-6。第四節(jié)OLAP技術(shù)及其在在CRM系系統(tǒng)中的應(yīng)應(yīng)用數(shù)據(jù)挖掘OLAP的的應(yīng)用數(shù)據(jù)挖掘應(yīng)應(yīng)用基本步驟設(shè)計(jì)與實(shí)施施數(shù)據(jù)倉(cāng)庫(kù)技技術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成成OLAP技術(shù)應(yīng)用商業(yè)智能表7-5按按地地區(qū)和省進(jìn)進(jìn)行劃分的的銷(xiāo)售數(shù)據(jù)據(jù)第四節(jié)OLAP技術(shù)及其在在CRM系系統(tǒng)中的應(yīng)應(yīng)用數(shù)據(jù)挖掘OLAP的的應(yīng)用數(shù)據(jù)挖掘應(yīng)應(yīng)用基本步驟設(shè)計(jì)與實(shí)施施數(shù)據(jù)倉(cāng)庫(kù)技技術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成成OLAP技術(shù)應(yīng)用商業(yè)智能表7-6按按地區(qū)區(qū)、省和城城市進(jìn)行劃劃分的銷(xiāo)售售數(shù)據(jù)第四節(jié)OLAP技術(shù)及其在在CRM系系統(tǒng)中的應(yīng)應(yīng)用數(shù)據(jù)挖掘OLAP的的應(yīng)用數(shù)據(jù)挖掘應(yīng)應(yīng)用基本步驟設(shè)計(jì)與實(shí)施施數(shù)據(jù)倉(cāng)庫(kù)技技術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成成OLAP技術(shù)應(yīng)用商業(yè)智能通過(guò)OLAP得出了負(fù)責(zé)責(zé)冰箱銷(xiāo)售售的副總裁裁所提出的的3個(gè)問(wèn)題的答答案:2007年第1季度,冰箱箱在華東地地區(qū)銷(xiāo)售情情況最好。。2007年第1季度,在華華東地區(qū),,江蘇的冰冰箱銷(xiāo)售量量處于領(lǐng)先先地位。2007年第1季度,江蘇蘇的南京冰冰箱銷(xiāo)售量量最高。OLAP的應(yīng)用第四節(jié)OLAP技術(shù)及其在在CRM系系統(tǒng)中的應(yīng)應(yīng)用數(shù)據(jù)挖掘OLAP的的應(yīng)用數(shù)據(jù)挖掘應(yīng)應(yīng)用基本步驟設(shè)計(jì)與實(shí)施施數(shù)據(jù)倉(cāng)庫(kù)技技術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成成OLAP技術(shù)應(yīng)用商業(yè)智能第五節(jié)數(shù)數(shù)據(jù)挖掘掘概述數(shù)據(jù)挖掘((datamining)是從大量的的、不完全全的、有噪噪聲的、模模糊的、隨隨機(jī)的實(shí)際際應(yīng)用數(shù)據(jù)據(jù)中提取人人們感興趣趣的知識(shí),,這些知識(shí)識(shí)是隱含的的、事先未未知的、潛潛在有用的的信息。它它是通過(guò)分分析數(shù)據(jù)發(fā)發(fā)現(xiàn)數(shù)據(jù)內(nèi)內(nèi)部的信息息和知識(shí)過(guò)過(guò)程。數(shù)據(jù)挖掘的的基礎(chǔ)是大大量數(shù)據(jù),,所以具有有高效處理理大量數(shù)據(jù)據(jù)的能力。。這也是目目前數(shù)據(jù)挖挖掘技術(shù)的的一個(gè)難題題,一些算算法在小數(shù)數(shù)據(jù)集上效效果很好,,但數(shù)據(jù)量量增加到一一定程度,,算法的實(shí)實(shí)現(xiàn)代價(jià)過(guò)過(guò)大、效率率太低,甚甚至無(wú)法實(shí)實(shí)現(xiàn)。數(shù)據(jù)挖掘的的定義數(shù)據(jù)挖掘OLAP的的應(yīng)用數(shù)據(jù)挖掘應(yīng)應(yīng)用基本步驟設(shè)計(jì)與實(shí)施施數(shù)據(jù)倉(cāng)庫(kù)技技術(shù)體系結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)客戶智能定義、構(gòu)成成OLAP技術(shù)應(yīng)用商業(yè)智能數(shù)據(jù)來(lái)源事務(wù)數(shù)據(jù)庫(kù)庫(kù)高級(jí)數(shù)據(jù)庫(kù)庫(kù)數(shù)據(jù)倉(cāng)庫(kù)關(guān)系數(shù)據(jù)庫(kù)庫(kù)數(shù)據(jù)據(jù)挖挖掘掘的的數(shù)數(shù)據(jù)據(jù)來(lái)來(lái)源源關(guān)系系數(shù)數(shù)據(jù)據(jù)庫(kù)庫(kù)::關(guān)系系數(shù)數(shù)據(jù)據(jù)庫(kù)庫(kù)中中的的數(shù)數(shù)據(jù)據(jù)是是最最豐豐富富、、最最詳詳細(xì)細(xì)的的。。在在進(jìn)進(jìn)行行數(shù)數(shù)據(jù)據(jù)挖挖掘掘之之前前也也要要對(duì)對(duì)數(shù)據(jù)據(jù)進(jìn)進(jìn)行行清清洗洗和和轉(zhuǎn)轉(zhuǎn)換換。。數(shù)數(shù)據(jù)據(jù)的的真真實(shí)實(shí)性性和和一一致致性性是是進(jìn)進(jìn)行行數(shù)數(shù)據(jù)據(jù)挖挖掘掘的的前前提提和和保保證證。。數(shù)據(jù)據(jù)倉(cāng)倉(cāng)庫(kù)庫(kù)::數(shù)據(jù)據(jù)經(jīng)經(jīng)過(guò)過(guò)清清洗洗和和轉(zhuǎn)轉(zhuǎn)換換,,不不存存在在錯(cuò)錯(cuò)誤誤和和不不一一致致的的情情況況,,數(shù)數(shù)據(jù)據(jù)倉(cāng)倉(cāng)庫(kù)庫(kù)在在獲獲取取數(shù)數(shù)據(jù)據(jù)后后就不不需需要要再再進(jìn)進(jìn)行行這這些些數(shù)數(shù)據(jù)據(jù)處處理理工工作作了了。。數(shù)據(jù)據(jù)倉(cāng)倉(cāng)庫(kù)庫(kù)、、數(shù)數(shù)據(jù)據(jù)挖挖掘掘和和聯(lián)聯(lián)機(jī)機(jī)分分析析處處理理共共同同構(gòu)構(gòu)成成了了系系統(tǒng)統(tǒng)的的決決策策支支持持模模塊塊。。事務(wù)務(wù)數(shù)數(shù)據(jù)據(jù)庫(kù)庫(kù)::數(shù)據(jù)據(jù)挖挖掘掘可可從從事事務(wù)務(wù)數(shù)數(shù)據(jù)據(jù)庫(kù)庫(kù)中中提提取取數(shù)數(shù)據(jù)據(jù)。。其其每每個(gè)個(gè)記記錄錄代代表表一一個(gè)個(gè)事事務(wù)務(wù)。。在進(jìn)進(jìn)行行數(shù)數(shù)據(jù)據(jù)挖挖掘掘時(shí)時(shí),,可可以以只只將將一一個(gè)個(gè)或或幾幾個(gè)個(gè)事事務(wù)務(wù)數(shù)數(shù)據(jù)據(jù)庫(kù)庫(kù)集集中中到到數(shù)數(shù)據(jù)據(jù)挖挖掘掘庫(kù)庫(kù)中中進(jìn)進(jìn)行行挖挖掘掘。。高級(jí)級(jí)數(shù)數(shù)據(jù)據(jù)庫(kù)庫(kù)::面向向?qū)?duì)象象的的數(shù)數(shù)據(jù)據(jù)庫(kù)庫(kù)、、空空間間數(shù)數(shù)據(jù)據(jù)庫(kù)庫(kù)、、時(shí)時(shí)間間和和時(shí)時(shí)間間序序列列數(shù)數(shù)據(jù)據(jù)庫(kù)庫(kù)、、文文本本和和多多媒媒體數(shù)數(shù)據(jù)據(jù)庫(kù)庫(kù)等等新新的的數(shù)數(shù)據(jù)據(jù)庫(kù)庫(kù)。。這這些些結(jié)結(jié)構(gòu)構(gòu)更更為為復(fù)復(fù)雜雜的的數(shù)數(shù)據(jù)據(jù)庫(kù)庫(kù)為為數(shù)數(shù)據(jù)據(jù)挖挖掘掘提提供供了了更更加加全全面面、、更更加多多元元化化的的數(shù)數(shù)據(jù)據(jù),,也也為為數(shù)數(shù)據(jù)據(jù)挖挖掘掘技技術(shù)術(shù)提提出出了了更更大大的的挑挑戰(zhàn)戰(zhàn)。。第五五節(jié)節(jié)數(shù)數(shù)據(jù)據(jù)挖挖掘掘概概述述數(shù)據(jù)據(jù)挖挖掘掘OLAP的的應(yīng)應(yīng)用用數(shù)據(jù)據(jù)挖挖掘掘應(yīng)應(yīng)用用基本本步步驟驟設(shè)計(jì)計(jì)與與實(shí)實(shí)施施數(shù)據(jù)據(jù)倉(cāng)倉(cāng)庫(kù)庫(kù)技技術(shù)術(shù)體系系結(jié)結(jié)構(gòu)構(gòu)數(shù)據(jù)據(jù)倉(cāng)倉(cāng)庫(kù)庫(kù)客戶戶智智能能定義義、、構(gòu)構(gòu)成成OLAP技術(shù)術(shù)應(yīng)用用商業(yè)業(yè)智智能能數(shù)據(jù)據(jù)挖挖掘掘的的基基本本步步驟驟數(shù)據(jù)據(jù)挖挖掘掘包包括括確確定定分分析析和和預(yù)預(yù)測(cè)測(cè)目目標(biāo)標(biāo)、、建建立立數(shù)數(shù)據(jù)據(jù)挖挖掘掘庫(kù)庫(kù)、、分分析析數(shù)數(shù)據(jù)據(jù)、、建建立立模模型型、、模模型評(píng)估估與驗(yàn)驗(yàn)證、、模型型實(shí)施施等幾幾個(gè)基基本步步驟。。第五節(jié)節(jié)數(shù)數(shù)據(jù)據(jù)挖掘掘概述述圖7-11數(shù)數(shù)據(jù)挖挖掘的的基本本步驟驟數(shù)據(jù)挖挖掘OLAP的的應(yīng)用用數(shù)據(jù)挖挖掘應(yīng)應(yīng)用基本步步驟設(shè)計(jì)與與實(shí)施施數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)技技術(shù)體系結(jié)結(jié)構(gòu)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)客戶智智能定義、、構(gòu)成成OLAP技術(shù)應(yīng)用商業(yè)智智能數(shù)據(jù)挖挖掘的的基本本步驟驟第五節(jié)節(jié)數(shù)數(shù)據(jù)據(jù)挖掘掘概述述數(shù)據(jù)挖掘的基本步驟1)確確定定分析析和預(yù)預(yù)測(cè)目目標(biāo)確定分分析和和預(yù)測(cè)測(cè)目標(biāo)標(biāo)相當(dāng)當(dāng)于需需求分分析,主要要是明明確業(yè)業(yè)務(wù)目目標(biāo)。。確定定分析析和預(yù)預(yù)測(cè)目目標(biāo)是是數(shù)據(jù)據(jù)挖掘掘的基基礎(chǔ)條條件。。同時(shí)時(shí),定定義了了數(shù)據(jù)據(jù)挖掘掘的分分析目目標(biāo)也也就定定義了了評(píng)價(jià)價(jià)這一一挖掘掘模型型的標(biāo)標(biāo)準(zhǔn)。2)建建立立數(shù)據(jù)據(jù)挖掘掘庫(kù)首先要要進(jìn)行行數(shù)據(jù)收收集,對(duì)于于收集集到的的數(shù)據(jù)據(jù),應(yīng)應(yīng)對(duì)數(shù)數(shù)據(jù)的的來(lái)源源、大大小、、存儲(chǔ)儲(chǔ)位置置和數(shù)數(shù)據(jù)在在使用用上的的限制制等進(jìn)進(jìn)行詳詳細(xì)的的記錄。完成成數(shù)據(jù)據(jù)收集集后,要對(duì)對(duì)數(shù)據(jù)據(jù)進(jìn)行行描述述。數(shù)據(jù)挖挖掘庫(kù)庫(kù)可以是是一個(gè)個(gè)單獨(dú)獨(dú)的數(shù)數(shù)據(jù)庫(kù)庫(kù),也也可以以和數(shù)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)建建立在在相同同的物物理介介質(zhì)上上。數(shù)數(shù)據(jù)挖挖掘庫(kù)庫(kù)中還還應(yīng)包包括數(shù)數(shù)據(jù)的的元數(shù)數(shù)據(jù)。。3)分分析析數(shù)據(jù)據(jù)分析數(shù)數(shù)據(jù)即即對(duì)數(shù)數(shù)據(jù)挖挖掘庫(kù)庫(kù)中的的數(shù)據(jù)據(jù)進(jìn)行行分析析,對(duì)對(duì)數(shù)據(jù)據(jù)有了了全面面、細(xì)細(xì)致的的了解解以后后,就就可以以針對(duì)對(duì)數(shù)據(jù)據(jù)挖掘掘分析析目標(biāo)標(biāo)選擇擇合適適的變變量和和記錄錄。對(duì)對(duì)于變變量的的選擇擇,首首先要要考慮慮對(duì)結(jié)結(jié)果有有影響響、可可以反反映結(jié)結(jié)果的的變量量。4)建建立立模型型建立模模型是是選擇擇合適適的方方法和和算法法對(duì)數(shù)數(shù)據(jù)進(jìn)進(jìn)行分分析,得到到一個(gè)個(gè)數(shù)據(jù)據(jù)挖掘掘模型型的過(guò)過(guò)程。。建立立模型型是一一個(gè)反反復(fù)進(jìn)進(jìn)行的的過(guò)程程,它它需要要不斷斷地改改進(jìn)或或更換換算法法以尋尋找對(duì)對(duì)目標(biāo)標(biāo)分析析作用用最明明顯的的模型型,最最后得得到一一個(gè)最最合理理、最最適用用的模模型。5)模模型型評(píng)估估與驗(yàn)驗(yàn)證為了驗(yàn)驗(yàn)證模模型的的有效效性,一般般會(huì)將將數(shù)據(jù)據(jù)集分分為兩兩部分分:一一部分分用于于建立立模型型,另另一部部分則則用于于測(cè)試試模型型。對(duì)對(duì)模型型的驗(yàn)驗(yàn)證主主要需需要考考慮以以下幾幾個(gè)方方面:(1)模型的的準(zhǔn)確確性;(2)模型的的可理理解性性;(3)模型的的性能能。模型型建立立和模模型檢檢驗(yàn)是是一個(gè)個(gè)反復(fù)復(fù)的過(guò)過(guò)程。。6)模模型實(shí)實(shí)施模型的的實(shí)施施有兩兩種情情況:一種種是將將數(shù)據(jù)據(jù)挖掘掘模型型得到到的結(jié)結(jié)果提提供給給信息息需求求者或或者管管理者者,以以輔助助管理理者的的決策策分析析;還有一一種情情況就就是保保留模模型,以后后每遇遇到類(lèi)類(lèi)似問(wèn)問(wèn)題就就用這這個(gè)模模型進(jìn)進(jìn)行分分析,或者者將模模型用用于不不同的的數(shù)據(jù)據(jù)集上上(這這些數(shù)數(shù)據(jù)分分析需需要采采用相相同的的方法法)進(jìn)進(jìn)行分分析。。在模型型的使使用過(guò)過(guò)程中中,隨隨時(shí)間間及環(huán)環(huán)境的的變化化,還還應(yīng)對(duì)對(duì)模型型進(jìn)行行重新新測(cè)試試,并并對(duì)模模型進(jìn)進(jìn)行相相應(yīng)的的修改改,這這就是是模型維維護(hù)的的過(guò)程程。數(shù)據(jù)挖挖掘OLAP的的應(yīng)用用數(shù)據(jù)挖挖掘應(yīng)應(yīng)用基本步步驟設(shè)計(jì)與與實(shí)施施數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)技技術(shù)體系結(jié)結(jié)構(gòu)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)客戶智智能定義、、構(gòu)成成OLAP技術(shù)應(yīng)用商業(yè)智智能數(shù)據(jù)挖挖掘工工具及及其選選擇第五節(jié)節(jié)數(shù)數(shù)據(jù)據(jù)挖掘掘概述述數(shù)據(jù)挖挖掘工工具包包括數(shù)據(jù)挖挖掘(datamining)工具具和文本挖挖掘(textmining)工具具。數(shù)據(jù)據(jù)挖掘掘工具具主要要是用用來(lái)進(jìn)進(jìn)行聚聚類(lèi)分分析、、關(guān)聯(lián)聯(lián)分析析、時(shí)時(shí)間序序列分分析以以及統(tǒng)統(tǒng)計(jì)分分析的的。文文本挖挖掘工工具主主要應(yīng)應(yīng)用在在市場(chǎng)場(chǎng)調(diào)研研報(bào)告告中或或呼叫叫中心心(callcenter)的的客戶戶抱怨怨定級(jí)級(jí)、專(zhuān)專(zhuān)利的的分類(lèi)類(lèi)、網(wǎng)網(wǎng)頁(yè)的的分類(lèi)類(lèi)以及及電子子郵件件的分分類(lèi)等等方面面。一一般而而言,目前前市場(chǎng)場(chǎng)上這這些數(shù)數(shù)據(jù)挖挖掘工工具又又可以以分成成兩類(lèi)類(lèi):企企業(yè)級(jí)級(jí)工具具以及及小型型工具具。數(shù)據(jù)挖挖掘OLAP的的應(yīng)用用數(shù)據(jù)挖挖掘應(yīng)應(yīng)用基本步步驟設(shè)計(jì)與與實(shí)施施數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)技技術(shù)體系結(jié)結(jié)構(gòu)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)客戶智智能定義、、構(gòu)成成OLAP技術(shù)應(yīng)用商業(yè)智智能數(shù)據(jù)挖挖掘工工具及及其選選擇第五節(jié)節(jié)數(shù)數(shù)據(jù)據(jù)挖掘掘概述述數(shù)據(jù)挖掘工具的選擇①公司司的數(shù)數(shù)據(jù)挖挖掘需需求是是短期期行為為還是是長(zhǎng)期期使用用②公司司的數(shù)數(shù)據(jù)挖挖掘經(jīng)經(jīng)驗(yàn)和和水平平③公司司的數(shù)數(shù)據(jù)狀狀態(tài)④公司司的預(yù)預(yù)算⑤工具具的性性能數(shù)據(jù)挖挖掘OLAP的的應(yīng)用用數(shù)據(jù)挖挖掘應(yīng)應(yīng)用基本步步驟設(shè)計(jì)與與實(shí)施施數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)技技術(shù)體系結(jié)結(jié)構(gòu)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)客戶智智能定義、、構(gòu)成成OLAP技術(shù)應(yīng)用商業(yè)智智能CRM中常用用的數(shù)數(shù)據(jù)挖挖掘算算法1)關(guān)聯(lián)聯(lián)分析析(associationanalysis)設(shè)I={i1,i2,……………im}是項(xiàng)的的集合合。設(shè)任務(wù)務(wù)相關(guān)關(guān)的數(shù)數(shù)據(jù)D是數(shù)據(jù)據(jù)庫(kù)事事務(wù)的的集合合,其其中每每個(gè)事事務(wù)T是項(xiàng)的的集合合,使使得T∈I。每一一個(gè)事事務(wù)有有一個(gè)個(gè)標(biāo)識(shí)識(shí)符,,稱(chēng)作作TID。設(shè)A是一個(gè)個(gè)項(xiàng)集集,事事務(wù)T包含A當(dāng)且僅僅當(dāng)A∈T。項(xiàng)的集集合稱(chēng)稱(chēng)為項(xiàng)項(xiàng)集((Itemset)。包含含k個(gè)項(xiàng)的的集合合稱(chēng)為為K-項(xiàng)集。。項(xiàng)集的的出現(xiàn)現(xiàn)頻率率是包包含項(xiàng)項(xiàng)集的的事務(wù)務(wù)數(shù),,簡(jiǎn)稱(chēng)稱(chēng)為項(xiàng)項(xiàng)集的的頻率率、支支持計(jì)計(jì)數(shù)或或計(jì)數(shù)數(shù)。關(guān)聯(lián)規(guī)規(guī)則是形如如AB的蘊(yùn)含含式,,其中A∈I,B∈I,并且且A∩B=。規(guī)則AB在事務(wù)務(wù)集D中成立立,具具有支支持度度s,其中s是D中包含含A∪B的事務(wù)務(wù)的百百分比比。它是概概率P(A∪B)。規(guī)則AB在事務(wù)務(wù)集D中具有有置信信度c,如果D中包含含A的事務(wù)務(wù)中同同時(shí)也也包含含B的事務(wù)務(wù)的百百分比比是c。這是是條件件概率率P(B|A)。第五節(jié)節(jié)數(shù)數(shù)據(jù)據(jù)挖掘掘概述述數(shù)據(jù)挖挖掘OLAP的的應(yīng)用用數(shù)據(jù)挖挖掘應(yīng)應(yīng)用基本步步驟設(shè)計(jì)與與實(shí)施施數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)技技術(shù)體系結(jié)結(jié)構(gòu)數(shù)據(jù)倉(cāng)倉(cāng)庫(kù)客戶智智能定義、、構(gòu)成成OLAP技術(shù)應(yīng)用商業(yè)智智能CRM中常用用的數(shù)數(shù)據(jù)挖挖掘算算法支持度Support(AB)=P(A∪B)置信度Confidence(AB)=P(B|A)同時(shí)滿足足最小支支持度和和最小置置信度的的規(guī)則稱(chēng)稱(chēng)為強(qiáng)規(guī)則。關(guān)聯(lián)規(guī)規(guī)則挖掘掘就是尋尋找強(qiáng)規(guī)規(guī)則的過(guò)過(guò)程。如果項(xiàng)集集滿足最最小支持持度,則則稱(chēng)為頻頻繁項(xiàng)集集Apriori算法是一一個(gè)關(guān)于于單維、、單層、、布爾規(guī)規(guī)則的方方法。因因此它也也是關(guān)聯(lián)聯(lián)規(guī)則挖挖掘中形形式最簡(jiǎn)簡(jiǎn)單的方方法。Apriori算法是一一個(gè)逐層層迭代尋尋找頻繁繁集的方方法。如果項(xiàng)集集滿足最最小支持持度,稱(chēng)稱(chēng)為頻繁項(xiàng)集集。Apriori算法的性性質(zhì)是頻繁項(xiàng)集集的所有有非空子子集一定定是頻繁繁的。Apriori算法第五節(jié)數(shù)數(shù)據(jù)據(jù)挖掘概概述1)關(guān)聯(lián)分分析(associationanalysis)數(shù)據(jù)挖掘掘OLAP的應(yīng)用用數(shù)據(jù)挖掘掘應(yīng)用基本步驟驟設(shè)計(jì)與實(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)庫(kù)技術(shù)體系結(jié)構(gòu)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)庫(kù)客戶智能能定義、構(gòu)構(gòu)成OLAP技術(shù)應(yīng)用商業(yè)智能能Apriori算法的實(shí)實(shí)例表7-7是一一個(gè)事務(wù)務(wù)數(shù)據(jù),,ID表示顧客客號(hào),“購(gòu)買(mǎi)商品品”表示顧客客一次購(gòu)購(gòu)買(mǎi)的商商品名稱(chēng)稱(chēng)。規(guī)定定最小支支持度為為60%,最小置置信度為為80%。表7-7事務(wù)務(wù)數(shù)據(jù)第四步,,L2與L2連接,得得到候選選項(xiàng)集。。根據(jù)Apriori算法的性性質(zhì)去掉掉不符合合條件的的候選項(xiàng)項(xiàng),即有有不頻繁繁子集的的項(xiàng)。然然后掃描描記錄,,對(duì)候選選集中剩剩余候選選項(xiàng)計(jì)算算支持度度。根據(jù)據(jù)最小支支持度得得到頻繁繁項(xiàng)集L3。第五步,繼續(xù)重復(fù)上上述動(dòng)作,,直到所得得頻繁項(xiàng)集集Ln為空,則頻頻繁項(xiàng)集Ln-1即為最大頻頻繁項(xiàng)集。。第一步,掃描每條記記錄,對(duì)每每個(gè)項(xiàng)(即即每種商品品)出現(xiàn)的的次數(shù)計(jì)數(shù)數(shù)。第二步,根據(jù)最小支支持度確定定頻繁項(xiàng)集集L1。第三步,L1與L1連

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論