第三章信息處理技術(shù)與方法課件_第1頁(yè)
第三章信息處理技術(shù)與方法課件_第2頁(yè)
第三章信息處理技術(shù)與方法課件_第3頁(yè)
第三章信息處理技術(shù)與方法課件_第4頁(yè)
第三章信息處理技術(shù)與方法課件_第5頁(yè)
已閱讀5頁(yè),還剩54頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第三章信息處理技術(shù)與方法2024/4/17第三章信息處理技術(shù)與方法第四節(jié)商務(wù)智能與數(shù)據(jù)挖掘商務(wù)智能的起源數(shù)據(jù)倉(cāng)庫(kù)技術(shù)數(shù)據(jù)挖掘數(shù)據(jù)挖掘在商業(yè)中的應(yīng)用第三章信息處理技術(shù)與方法第三章信息處理技術(shù)與方法市場(chǎng)的競(jìng)爭(zhēng)發(fā)展趨勢(shì)從“大眾化營(yíng)銷”到“差異化營(yíng)銷”的競(jìng)爭(zhēng);從“規(guī)模效益”到“深度效益”的競(jìng)爭(zhēng);從“單一銷售”到“產(chǎn)業(yè)價(jià)值鏈營(yíng)銷”的競(jìng)爭(zhēng);第三章信息處理技術(shù)與方法企業(yè)領(lǐng)導(dǎo)人如何面對(duì)激烈市場(chǎng)競(jìng)爭(zhēng)帶來的挑戰(zhàn)?完善組織結(jié)構(gòu)培養(yǎng)客戶忠誠(chéng)度拓大客戶群增加產(chǎn)品、渠道品種加強(qiáng)成本控制提高營(yíng)運(yùn)效率防范風(fēng)險(xiǎn)………提高形象增加利潤(rùn)增加/保留客戶增加市場(chǎng)占有率減低風(fēng)險(xiǎn)增加服務(wù)/提高質(zhì)素減低經(jīng)營(yíng)成本第三章信息處理技術(shù)與方法其他管理運(yùn)營(yíng)數(shù)據(jù)競(jìng)爭(zhēng)優(yōu)勢(shì)?數(shù)據(jù)能直接帶來競(jìng)爭(zhēng)優(yōu)勢(shì)嗎?第三章信息處理技術(shù)與方法現(xiàn)在企業(yè)的問題不是數(shù)據(jù)太少,而是數(shù)據(jù)太多了第三章信息處理技術(shù)與方法現(xiàn)有的數(shù)據(jù)狀況傳統(tǒng)的信息系統(tǒng)中數(shù)據(jù)受限于其應(yīng)用面,最終出來的效果所表達(dá)的信息是割裂的,零碎的,如果不加處理與整合,甚至是自相矛盾的,因此這種數(shù)據(jù)積累的作用事實(shí)上只是一種備份。備份數(shù)據(jù)變成了“數(shù)據(jù)監(jiān)獄”,數(shù)據(jù)一進(jìn)去就十有八九成了“囚犯”,而數(shù)據(jù)一旦過時(shí),要么就被束之高閣,無情地被判了無期徒刑,要么就象碎成紙片的機(jī)要文件一樣被銷毀了。

第三章信息處理技術(shù)與方法企業(yè)是個(gè)嚴(yán)密運(yùn)作的復(fù)雜系統(tǒng),每個(gè)細(xì)小環(huán)節(jié)的活動(dòng)是彼此互相關(guān)聯(lián)的;從零碎的、片段的企業(yè)局部化信息難以看清企業(yè)整體的變化;同時(shí)企業(yè)需要一種協(xié)同思考的能力;在這種背景下,商務(wù)智能應(yīng)運(yùn)而生!第三章信息處理技術(shù)與方法什么是商業(yè)智能商業(yè)智能是用來實(shí)現(xiàn)數(shù)據(jù)向信息轉(zhuǎn)變,信息向知識(shí)轉(zhuǎn)變,知識(shí)向價(jià)值轉(zhuǎn)變的這么一個(gè)過程,以及這個(gè)過程中所使用到的種種技術(shù)和工具。

數(shù)據(jù)信息知識(shí)價(jià)值第三章信息處理技術(shù)與方法個(gè)性化的界面商業(yè)智能工具的分析和提煉收集整理其他管理運(yùn)營(yíng)數(shù)據(jù)信息和知識(shí)分析數(shù)據(jù)采集數(shù)據(jù)

使業(yè)務(wù)更加高效

更大的效益企業(yè)信息門戶正確的決策和行動(dòng)分析人員銀行領(lǐng)導(dǎo)員工第三章信息處理技術(shù)與方法IBM認(rèn)為商務(wù)智能是指一種能力:通過智能的使用你的數(shù)據(jù)財(cái)產(chǎn)來制定更好的商務(wù)決策。它的意思是說各種企業(yè)的決策人員以企業(yè)中的數(shù)據(jù)倉(cāng)庫(kù)(DataWarehouse)為本,經(jīng)由各式各樣的查詢分析工具(Query/ReportTools)、聯(lián)機(jī)分析處理(OnlineAnalyticalProcessing簡(jiǎn)稱OLAP)工具、或是數(shù)據(jù)挖掘(DataMining)工具加上決策規(guī)劃人員的行業(yè)知識(shí)(IndustryKnowledge),從數(shù)據(jù)倉(cāng)儲(chǔ)中獲得有利的信息,進(jìn)而幫助企業(yè)提高獲利,增加生產(chǎn)力與競(jìng)爭(zhēng)力。第三章信息處理技術(shù)與方法學(xué)術(shù)界的觀點(diǎn)是:BI實(shí)際上是幫助企業(yè)提高決策能力和運(yùn)營(yíng)能力的概念、方法、過程以及軟件的集合,其主要目標(biāo)是將企業(yè)所掌握的信息轉(zhuǎn)換成競(jìng)爭(zhēng)優(yōu)勢(shì),提高企業(yè)決策能力、決策效率、決策準(zhǔn)確性。第三章信息處理技術(shù)與方法根據(jù)國(guó)際數(shù)據(jù)公司(IDC)的一個(gè)關(guān)于65個(gè)公司的案例研究顯示,在過去2、3年里,商務(wù)智能投資的平均回報(bào)超過了400%。根據(jù)商務(wù)智能的當(dāng)前應(yīng)用情況,發(fā)現(xiàn)商務(wù)智能廣泛應(yīng)用在零售、電信和保險(xiǎn)、銀行等行業(yè)。這些行業(yè)一般具有以下特征:(1)大量的顧客;這樣才能產(chǎn)生足夠多的可供分析的數(shù)據(jù)。(2)非常激烈的競(jìng)爭(zhēng)并有差異化的需要;這些行業(yè)一般提供的都是差異化很小的產(chǎn)品,同時(shí)行業(yè)內(nèi)的競(jìng)爭(zhēng)又非常激烈,從而使差異化的服務(wù)成為企業(yè)必然選擇。(3)能容易地收集到大量的電子數(shù)據(jù)。這些行業(yè)一般都有較完善的電子交易記錄系統(tǒng),可以很方便的收集到大量的電子交易數(shù)據(jù)。第三章信息處理技術(shù)與方法第三章信息處理技術(shù)與方法數(shù)據(jù)倉(cāng)庫(kù)1.數(shù)據(jù)倉(cāng)庫(kù)的概念數(shù)據(jù)倉(cāng)庫(kù)是一種為信息分析提供了良好的基礎(chǔ)并支持管理決策活動(dòng)的分析環(huán)境,是面向主題的、集成的、穩(wěn)定的、隨時(shí)間變化的、分層次的多維的集成數(shù)據(jù)集合。它為不同層次的管理者提供敏捷性和實(shí)用性的決策支持。數(shù)據(jù)倉(cāng)庫(kù)具有兩個(gè)主要作用:一是從各信息源提取決策需要的數(shù)據(jù),加工處理后,存儲(chǔ)到數(shù)據(jù)倉(cāng)庫(kù)中;二是用戶的查詢和決策分析的基礎(chǔ)。第三章信息處理技術(shù)與方法2.數(shù)據(jù)倉(cāng)庫(kù)特征1)面向主題(subjectoriented)

在傳統(tǒng)的信息系統(tǒng)中,對(duì)數(shù)據(jù)的處理是面向過程的或者是面向功能的。而面向過程的數(shù)據(jù)包括滿足某種功能需求的數(shù)據(jù),它們可能與決策問題有關(guān)也可能無關(guān)。

第三章信息處理技術(shù)與方法采購(gòu)子系統(tǒng):訂單(訂單號(hào),供應(yīng)商號(hào),商品號(hào),類別,單價(jià)。數(shù)量,總金額,日期,…)供應(yīng)商(供應(yīng)商號(hào),供應(yīng)商名,地址,電話,…)銷售子系統(tǒng):客戶(客戶號(hào),姓名,地址,電話,…)銷售(客戶號(hào),商品號(hào),數(shù)量,單價(jià),日期,…)庫(kù)存子系統(tǒng):進(jìn)庫(kù)單(編號(hào),商品號(hào),數(shù)量,單價(jià),日期,…)出庫(kù)單(編號(hào),商品號(hào),數(shù)量,單價(jià),日期,…)庫(kù)存(商品號(hào),庫(kù)房號(hào),類別,單價(jià),庫(kù)存數(shù)量,總金額,日期,…)第三章信息處理技術(shù)與方法

商品固有信息:商品號(hào),類別,單價(jià),顏色,…商品采購(gòu)信息:商品號(hào),類別,供應(yīng)商號(hào),供應(yīng)日期,單價(jià),數(shù)量,…商品銷售信息:商品號(hào),客戶號(hào),數(shù)量,單價(jià),銷售日期,…商品庫(kù)存信息:商品號(hào),庫(kù)房號(hào),庫(kù)存數(shù)量,日期,…)商品主題域:采購(gòu)子系統(tǒng)銷售子系統(tǒng)庫(kù)存子系統(tǒng)第三章信息處理技術(shù)與方法從信息管理的角度看,主題就是在一個(gè)較高的管理層次上對(duì)信息系統(tǒng)的數(shù)據(jù)按照某一具體的管理對(duì)象進(jìn)行綜合、歸類所形成的分析對(duì)象。從數(shù)據(jù)組織的角度看,主題是一些數(shù)據(jù)集合,這些數(shù)據(jù)集合對(duì)分析對(duì)象作了比較完整的、一致的描述,這種描述不僅涉及到數(shù)據(jù)自身,而且涉及到數(shù)據(jù)之間的關(guān)系。第三章信息處理技術(shù)與方法2)集成化(integrated)

數(shù)據(jù)倉(cāng)庫(kù)在從業(yè)務(wù)處理系統(tǒng)那里獲取數(shù)據(jù)時(shí),并不能將源數(shù)據(jù)庫(kù)中的數(shù)據(jù)直接加載到數(shù)據(jù)倉(cāng)庫(kù)中,而是需要進(jìn)行一系列的數(shù)據(jù)預(yù)處理,即數(shù)據(jù)的抽取、篩選、清理、綜合等集成工作。也就是說,首先要從源數(shù)據(jù)庫(kù)中挑選出數(shù)據(jù)倉(cāng)庫(kù)所需要的數(shù)據(jù),然后將這些來自不同數(shù)據(jù)庫(kù)中的數(shù)據(jù)按照某一標(biāo)準(zhǔn)進(jìn)行統(tǒng)一,即將不同數(shù)據(jù)源中的數(shù)據(jù)的單位、字長(zhǎng)與內(nèi)容按照數(shù)據(jù)倉(cāng)庫(kù)的要求統(tǒng)一起來,消除源數(shù)據(jù)中字段的同名異義、異名同義現(xiàn)象,這些工作稱為數(shù)據(jù)的清理(clean),把數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)呈現(xiàn)給用戶一個(gè)一致統(tǒng)一的視圖。第三章信息處理技術(shù)與方法數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)分為四個(gè)級(jí)別:早期細(xì)節(jié)級(jí),當(dāng)前細(xì)節(jié)級(jí),輕度綜合級(jí),高度綜合級(jí)。1985~1998年銷售明細(xì)表1998~2003年銷售明細(xì)表1998~2003年每月銷售表1998~2003年每季度銷售表第三章信息處理技術(shù)與方法3)相對(duì)穩(wěn)定的:數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)主要供企業(yè)決策分析之用,所涉及的數(shù)據(jù)操作主要是數(shù)據(jù)查詢,一旦某個(gè)數(shù)據(jù)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)以后,一般情況下將被長(zhǎng)期保留,也就是數(shù)據(jù)倉(cāng)庫(kù)中一般有大量的查詢操作,但修改和刪除操作很少,通常只需要定期的加載、刷新。

4)反映歷史變化:數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)通常包含歷史信息,系統(tǒng)記錄了企業(yè)從過去某一時(shí)點(diǎn)(如開始應(yīng)用數(shù)據(jù)倉(cāng)庫(kù)的時(shí)點(diǎn))到目前的各個(gè)階段的信息,通過這些信息,可以對(duì)企業(yè)的發(fā)展歷程和未來趨勢(shì)做出定量分析和預(yù)測(cè)。

第三章信息處理技術(shù)與方法DW中數(shù)據(jù)量很大:通常的DW的數(shù)據(jù)量為10GB級(jí),大型DW是一個(gè)TB(1000GB)級(jí)數(shù)據(jù)量。DB一般為幾兆至100兆B。DW軟硬件要求較高:需要一個(gè)巨大的硬件平臺(tái)與一個(gè)并行的數(shù)據(jù)庫(kù)系統(tǒng)(PDBS)。第三章信息處理技術(shù)與方法整個(gè)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)是一個(gè)包含四個(gè)層次的體系結(jié)構(gòu),具體由下圖表示。第三章信息處理技術(shù)與方法3.OLAPOLAP的基本術(shù)語

E.F.Codd的定義為:OLAP是共享多維信息的、針對(duì)特定問題的聯(lián)機(jī)數(shù)據(jù)訪問和分析的快速軟件技術(shù),OLAP具有靈活的分析功能、直觀的數(shù)據(jù)操作和分析結(jié)果可視化表示等突出優(yōu)點(diǎn),從而使用戶對(duì)基于大量復(fù)雜數(shù)據(jù)的分析變得輕松而高效,以利迅速做出正確判斷。

第三章信息處理技術(shù)與方法OLAP的基本分析方法

1)維

維是人們觀察數(shù)據(jù)的特定角度。

2)維的層次

一個(gè)維往往具有多個(gè)層次,如描述時(shí)間維,可以從日期、月份、季度、年等不同層次來捕述,那么日期、月份、季度、年等就是時(shí)間維的層次;同樣,城市、地區(qū)、國(guó)家等構(gòu)成了一個(gè)地理維的多個(gè)層次。

第三章信息處理技術(shù)與方法

(1)維成員。維的一個(gè)取值稱為該維的一個(gè)維成員。如果一個(gè)維是多層次的,那么,該維的維成員是在不同維層次的取值的組合。

(2)多維數(shù)組。一個(gè)多維數(shù)組可以表示為:(維1,維2,…,維n,變量)。例如,日用品銷售數(shù)據(jù)是按時(shí)間、地區(qū)和銷售渠道組織起來的三維立方體,加上變量"銷售額”,就組成了一個(gè)多維數(shù)組(地區(qū),時(shí)間,銷售渠道,銷售額)。

(3)數(shù)據(jù)單元。多維數(shù)組的取值稱為數(shù)據(jù)單元。第三章信息處理技術(shù)與方法OLAP的基本分析方法

多維分析是指對(duì)以多維形式組織起來的數(shù)據(jù)采取切片、切塊、旋轉(zhuǎn)等各種分析方法,以求剖析數(shù)據(jù),使最終用戶能從多個(gè)角度、多側(cè)面地觀察數(shù)據(jù)庫(kù)中的數(shù)據(jù),從而深入地了解包含在數(shù)據(jù)中的信息、內(nèi)涵。第三章信息處理技術(shù)與方法切片

選定多維數(shù)組的一個(gè)二維子集的方法叫做切片,即選定多維數(shù)組(維1,維2,……,維n,變量)中的兩個(gè)維:維I和維J,在這兩個(gè)維上取某一區(qū)間或任意維成員,而將其余的維都取定一個(gè)維成員,則得到的就是多維數(shù)組在維I和j上一個(gè)二維子集,稱這個(gè)二維子集為多維數(shù)在維I和維J上的一個(gè)切片,表示為;(維I,維j,變量)。第三章信息處理技術(shù)與方法

例如,選定多維數(shù)組(地區(qū),時(shí)間,產(chǎn)品,銷售額)中的地區(qū)維與產(chǎn)品維,在另外一維:時(shí)間維,選取一個(gè)維成員(如“2006年1月”),就得到了多維數(shù)組(地區(qū),時(shí)間,產(chǎn)品,銷售額)在產(chǎn)品和地區(qū)兩維上的一個(gè)切片(客戶,地區(qū),銷售額)。這個(gè)切片表示2006年1月各地區(qū)、各產(chǎn)品的銷售情況。第三章信息處理技術(shù)與方法

產(chǎn)品銷售情況2006.1產(chǎn)品銷售情況選定兩個(gè)維:產(chǎn)品維和地區(qū)維時(shí)間維數(shù)據(jù)切片產(chǎn)品維地區(qū)維產(chǎn)品維地區(qū)維第三章信息處理技術(shù)與方法切塊選定多維數(shù)的一個(gè)三維子集的方法稱切塊。即選定多維數(shù)組(維1,維2,……,維n,變量)中的三個(gè)維:維I、維j和維r,在這三個(gè)維上取某一區(qū)間或任意的維成員,而將其余的維都取定一個(gè)維成員,則得到的就是多維數(shù)組在維I、維j和維r上一個(gè)三維子集,我們稱這個(gè)三維子集為多維數(shù)組在維I、維j和r上的一個(gè)切塊,表示為:(維I,維j,維r,變量)。切塊與切片的作用與目的是相似的。美國(guó)中國(guó)手機(jī)電腦圖8-3三維立方體切塊(Slice)第三章信息處理技術(shù)與方法旋轉(zhuǎn)

旋轉(zhuǎn)即是改變一個(gè)報(bào)告或面顯示的維方向。例如,旋轉(zhuǎn)可能包含了交換行和列;或是把某一個(gè)行維移到列維中去,或是把頁(yè)面顯示中的一個(gè)維和頁(yè)面的維進(jìn)行交換(令其成為新一行或列中的一個(gè))把一個(gè)橫向?yàn)闀r(shí)間、縱向?yàn)楫a(chǎn)品的報(bào)表旋轉(zhuǎn)成為橫向?yàn)楫a(chǎn)品、維向?yàn)闀r(shí)間的報(bào)表。第三章信息處理技術(shù)與方法2005年2006年部門1季度2季度3季度4季度1季度2季度3季度4季度部門一2012182722161929部門二2311241722311234部門三26213433212326321季度2季度3季度4季度部門2005年2006年2005年2006年2005年2006年2005年2006年部門一2022121618192729部門二2322113124121734部門三2621212334263332旋轉(zhuǎn)前的有關(guān)數(shù)據(jù)描述旋轉(zhuǎn)后的有關(guān)數(shù)據(jù)描述第三章信息處理技術(shù)與方法鉆取按時(shí)間維向下鉆取按時(shí)間維向上鉆取60第三章信息處理技術(shù)與方法4.數(shù)據(jù)挖掘數(shù)據(jù)的爆炸性增長(zhǎng):從TB到PB數(shù)據(jù)收集和數(shù)據(jù)可用性自動(dòng)的數(shù)據(jù)收集工具,數(shù)據(jù)庫(kù)系統(tǒng),Web,計(jì)算化的社會(huì)2003年,法國(guó)電信的呼叫數(shù)據(jù)為30TB,AT&T以26TB的數(shù)據(jù)量位居第二,如此多的呼叫數(shù)據(jù)以致于AT&T無法全部保存,對(duì)數(shù)據(jù)的分析也只能是“粗略”的Google,40億以上的頁(yè)面(2004年4月統(tǒng)計(jì)),數(shù)據(jù)量為nTB據(jù)加州大學(xué)伯克利分校的研究人員統(tǒng)計(jì),2002年新產(chǎn)生數(shù)據(jù)為1999年的2倍,而且數(shù)據(jù)的膨脹在不斷加速我們正淹沒在數(shù)據(jù)洪水中,但卻渴望知識(shí)!

第三章信息處理技術(shù)與方法數(shù)據(jù)挖掘(從數(shù)據(jù)中發(fā)現(xiàn)知識(shí))從海量數(shù)據(jù)中提取感興趣(重要的,

隱含的,以前未知的和潛在有用的)模式或知識(shí)數(shù)據(jù)挖掘:用詞不當(dāng)?其他的名稱數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)(挖掘)(KDD),知識(shí)提取,數(shù)據(jù)/模式分析,數(shù)據(jù)考古學(xué),數(shù)據(jù)捕撈,信息收獲,商業(yè)智能等.當(dāng)心:所有的都是“數(shù)據(jù)挖掘”么?簡(jiǎn)單的搜索和查詢處理(演繹的)專家系統(tǒng)4.數(shù)據(jù)挖掘第三章信息處理技術(shù)與方法為什么要數(shù)據(jù)挖掘?—潛在的應(yīng)用數(shù)據(jù)分析和決策支持市場(chǎng)分析和管理目標(biāo)市場(chǎng)定位,客戶關(guān)系管理(CRM),購(gòu)物籃分析,交叉銷售風(fēng)險(xiǎn)分析和管理預(yù)測(cè),客戶保持,質(zhì)量控制,競(jìng)爭(zhēng)分析欺詐檢測(cè)和不尋常模式的檢測(cè)(離群點(diǎn))其他的應(yīng)用文本挖掘(新聞組,email,文檔)和Web挖掘流數(shù)據(jù)挖掘生物信息學(xué)和生物數(shù)據(jù)分析第三章信息處理技術(shù)與方法現(xiàn)實(shí)世界中的數(shù)據(jù)挖掘可以用來干什么?

——搜索制造爆炸的恐怖分子美國(guó)聯(lián)邦調(diào)查局(FBI)對(duì)地區(qū)調(diào)查員提交的大量報(bào)告進(jìn)行審查,尋找和爆炸事件的聯(lián)系。.使用鏈路分析,聚類和規(guī)則歸納等分析方法來識(shí)別可能的線索。數(shù)據(jù)挖掘的其他應(yīng)用第三章信息處理技術(shù)與方法知識(shí)發(fā)現(xiàn)(KDD)過程數(shù)據(jù)挖掘—知識(shí)發(fā)現(xiàn)過程的核心數(shù)據(jù)清理數(shù)據(jù)集成數(shù)據(jù)庫(kù)數(shù)據(jù)倉(cāng)庫(kù)知識(shí)任務(wù)相關(guān)的數(shù)據(jù)選擇數(shù)據(jù)挖掘模式評(píng)估第三章信息處理技術(shù)與方法5.DM與OLAP的區(qū)別用戶可能會(huì)提出這樣一個(gè)典型的OLAP問題:去年哪里的用戶的購(gòu)買了更多的轎車,是上海還是北京(請(qǐng)注意,在這個(gè)問題中已經(jīng)隱含了用戶的一些前提條件)?面對(duì)這樣的問題,OLAP可能會(huì)回答:在去年,上海地區(qū)的用戶購(gòu)買了12000輛轎車,而北京的用戶購(gòu)買了10000輛。相比之下,一個(gè)典型的DM問題可能會(huì)是:給出一個(gè)模式來預(yù)測(cè)人們購(gòu)買轎車的情況。通過對(duì)數(shù)據(jù)庫(kù)中數(shù)據(jù)的挖掘,DM可能這樣回答:在北京地區(qū)處于A年齡段、收入在X、y之間的用戶比上海地區(qū)相同的用戶會(huì)購(gòu)買更多的轎車。第三章信息處理技術(shù)與方法6.數(shù)據(jù)挖掘在商業(yè)中的應(yīng)用關(guān)聯(lián)分析

關(guān)聯(lián)分析主要用于發(fā)現(xiàn)不同事件之間的關(guān)聯(lián)性,即一個(gè)事件發(fā)生的同時(shí),另一個(gè)事件也經(jīng)常發(fā)生。關(guān)聯(lián)分析的重點(diǎn)在于快速發(fā)現(xiàn)那些有實(shí)用價(jià)值的關(guān)聯(lián)發(fā)生的事件。其主要依據(jù)是事件發(fā)生的概率和條件概率應(yīng)該符合一定的統(tǒng)計(jì)意義。第三章信息處理技術(shù)與方法動(dòng)機(jī):尋找數(shù)據(jù)中固有的規(guī)律什么產(chǎn)品會(huì)經(jīng)常在一起購(gòu)買?—啤酒和尿布?!買了一臺(tái)電腦之后接著會(huì)買什么?哪種DNA對(duì)新藥是敏感的?我們能夠自動(dòng)分類Web文檔嗎?應(yīng)用購(gòu)物籃分析,交叉銷售,分類設(shè)計(jì),銷售活動(dòng)分析,Web日志(點(diǎn)擊流)分析,以及DNA序列分析.第三章信息處理技術(shù)與方法購(gòu)物籃分析商店的經(jīng)理想了解顧客的購(gòu)物習(xí)慣“什么商品組或集合顧客多半會(huì)在一次購(gòu)物時(shí)同時(shí)購(gòu)買”

可以幫助制定營(yíng)銷策略:有選擇地安排貨架按比例進(jìn)貨第三章信息處理技術(shù)與方法案例:金融交叉銷售什么是交叉銷售?簡(jiǎn)單說來,就是向擁有本公司A產(chǎn)品的客戶推銷本公司B產(chǎn)品。它有兩大功能:其一,可以增強(qiáng)客戶忠誠(chéng)度。如果客戶購(gòu)買本公司的產(chǎn)品和服務(wù)越多,客戶流失的可能性就越小。來自銀行的數(shù)據(jù)顯示:購(gòu)買兩種產(chǎn)品的客戶的流失率是55%,而擁有4個(gè)或更多產(chǎn)品或服務(wù)的流失率幾乎是0。其二,交叉銷售也可以增加利潤(rùn)。實(shí)踐證明,將一種產(chǎn)品和服務(wù)推銷給一個(gè)現(xiàn)有客戶的成本遠(yuǎn)低于吸收一個(gè)新客戶的成本。第三章信息處理技術(shù)與方法下表便是一個(gè)采用IBMIntelligentMiner進(jìn)行數(shù)據(jù)挖掘的案例:這個(gè)準(zhǔn)則說明:有28.5%的VISA金卡用戶購(gòu)買了房屋貸款,它的購(gòu)買率是平均的10.7倍。這個(gè)準(zhǔn)則的客戶數(shù)目占總客戶群的85%(關(guān)于準(zhǔn)則的詳細(xì)定義請(qǐng)參考IBMIntelligentMiner的說明書)。根據(jù)這個(gè)準(zhǔn)則我們可以知道,將房屋貸款交叉銷售給VISA金卡用戶是一個(gè)很好的選擇。置信度支持度類型提升度規(guī)則0.85%28.5%+10.7VISA金卡=>房屋貸款第三章信息處理技術(shù)與方法序列分析

序列分析技術(shù)主要用于發(fā)現(xiàn)一定時(shí)間間隔內(nèi)接連發(fā)生的事件。這些事件構(gòu)成一個(gè)序列,發(fā)現(xiàn)的序列應(yīng)該具有普遍意義,其依據(jù)除了統(tǒng)計(jì)上的概率之外,還要加上時(shí)間的約束。第三章信息處理技術(shù)與方法分類分析分類分析通過分析具有類別的樣本的特點(diǎn),得到?jīng)Q定樣本屬于各種類別的規(guī)則或方法。利用分類技術(shù),可以根據(jù)顧客的消費(fèi)水平和基本特征對(duì)顧客進(jìn)行分類,找出對(duì)商家有較大利益貢獻(xiàn)的重要客戶的特征,通過對(duì)其進(jìn)行個(gè)性化服務(wù),提高他們的忠誠(chéng)度。第三章信息處理技術(shù)與方法案例:中移動(dòng)客戶保留案例分析

國(guó)內(nèi)移動(dòng)通信市場(chǎng)的價(jià)格戰(zhàn)是當(dāng)前困擾運(yùn)營(yíng)商的主要問題,很多客戶從一個(gè)移動(dòng)運(yùn)營(yíng)商轉(zhuǎn)向另一個(gè)移動(dòng)運(yùn)營(yíng)商只是為了得到更低的費(fèi)用及其他額外的優(yōu)惠條件(如贈(zèng)機(jī))。因此需要通過對(duì)轉(zhuǎn)網(wǎng)客戶群的特征進(jìn)行深入分析,然后根據(jù)分析結(jié)果到現(xiàn)有客戶資料中找出可能轉(zhuǎn)網(wǎng)的客戶群,有針對(duì)性地設(shè)計(jì)一些客戶保持計(jì)劃來預(yù)防現(xiàn)有客戶的流失。第三章信息處理技術(shù)與方法聚類分析聚類分析是根據(jù)物以類聚的原理,將本身沒有類別的樣本聚集成不同的組,并且對(duì)每一個(gè)這樣的組進(jìn)行描述的過程。其主要依據(jù)是聚到同一個(gè)組中的樣本應(yīng)該彼此相似,而屬于不同組的樣本應(yīng)該足夠不相似。第三章信息處理技術(shù)與方法

在客戶關(guān)系管理中,利用聚類技術(shù),根據(jù)客戶的個(gè)人特征以及消費(fèi)數(shù)據(jù),可以將客戶群體進(jìn)行細(xì)分。例如,可以得到這樣的一個(gè)消費(fèi)群體:女性占91%,全部無子女、年齡在31到40歲占70%,高消費(fèi)級(jí)別的占64%,買過針織品的占91%,買過廚房用品的占89%,買過園藝用品的占79%。針對(duì)不同的客戶群,可以實(shí)施不同的營(yíng)銷和服務(wù)方式,從而提高客戶的滿意度。第三章信息處理技術(shù)與方法對(duì)于空間數(shù)據(jù),根據(jù)地理位置以及障礙物的存在情況可以自動(dòng)進(jìn)行區(qū)域劃分。例如,根據(jù)分布在不同地理位置的ATM機(jī)的情況將居民進(jìn)行區(qū)域劃分,?????根據(jù)這一信息,可以有效地進(jìn)行ATM機(jī)的設(shè)置規(guī)劃,避免浪費(fèi),同時(shí)也避免失掉每一個(gè)商機(jī)。第三章信息處理技術(shù)與方法預(yù)測(cè)預(yù)測(cè)與分類類似,但預(yù)測(cè)是根據(jù)樣本的已知特征估算某個(gè)連續(xù)類型的變量的取值的過程,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論