數(shù)據(jù)分析方法培訓(xùn)教材課件_第1頁
數(shù)據(jù)分析方法培訓(xùn)教材課件_第2頁
數(shù)據(jù)分析方法培訓(xùn)教材課件_第3頁
數(shù)據(jù)分析方法培訓(xùn)教材課件_第4頁
數(shù)據(jù)分析方法培訓(xùn)教材課件_第5頁
已閱讀5頁,還剩77頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

數(shù)據(jù)分析方法培訓(xùn)數(shù)據(jù)分析方法培訓(xùn)1目錄數(shù)據(jù)分析前的思考案例分享深層次數(shù)據(jù)分析目錄數(shù)據(jù)分析前的思考案例分享深層次數(shù)據(jù)分析2數(shù)據(jù)分析前,我們需要思考3

>《孫子兵法〃謀攻篇》:故上兵伐謀,其次伐交,其次伐兵,其下攻城;攻城之法為不得已。像一場戰(zhàn)役的總指揮影響著整個戰(zhàn)役的勝敗一樣,數(shù)據(jù)分析師的思想對于整體分析思路,甚至分析結(jié)果都有著關(guān)鍵性的作用。數(shù)據(jù)分析前,我們需要思考3>《孫子兵法〃謀攻篇》:故上3問題分析結(jié)果呈現(xiàn)分析思路與方

法數(shù)據(jù)選取數(shù)據(jù)分析前,我們怎么去思考?

每一個步驟可能面臨的問題以及需要準(zhǔn)備的東西???4

>問題分析結(jié)分析思數(shù)據(jù)選取數(shù)據(jù)分析前,我們怎么去思考? 每一個4

選取的分析軟件以及分析方法(統(tǒng)計學(xué)相關(guān)方法)。分析問題和解決問題的思路5

>定義問題第一步

首先,要搞清

問題的實(shí)質(zhì),

準(zhǔn)確、完整、

真實(shí)地表達(dá)問

題。

其次,弄清楚

為什么要解決

這個問題?

最后,解決這

個問題的意義

何在?是必須

解決還是無關(guān)

緊要,或是需

要馬上解決還

是不太著急。第二步收集整理

信息

搜集、整理

關(guān)于要解決

問題的歷史

資料、類似

情況和現(xiàn)狀。第三步選取分析

方法

分析涉及到

的主要維度,

為后面提取

數(shù)據(jù)需求作

準(zhǔn)備;第四步數(shù)據(jù)提取

整理

根據(jù)分析內(nèi)

容以及分析

方法,提出

分析所需的

數(shù)據(jù)需求;

對于反饋回

來的數(shù)據(jù),

需要進(jìn)行部

分加工,以

便更能反應(yīng)

所要分析的

問題。第五步分析結(jié)果

及結(jié)論

根據(jù)分析的

結(jié)果,得出

一些當(dāng)前問

題產(chǎn)生的一

些結(jié)論。這

里注意分析

的方法以及

維度,結(jié)果

的展示方式

等。

結(jié)論需要求

足夠的數(shù)據(jù)

做支撐。第六步實(shí)施及建

議措施

針對數(shù)據(jù)分

析結(jié)論,給

出當(dāng)前問題

的解決建議

措施。

一方面從業(yè)

務(wù)層面進(jìn)行

建議措施,

另一方面,

可以就問題

點(diǎn)進(jìn)行更深

層次分析,

給出數(shù)據(jù)挖

掘?qū)用娴慕?/p>

決措施。第七步

實(shí)施效果評估及報告整理

根據(jù)措施實(shí)

施效果進(jìn)行

實(shí)際評估,

將完成的分

析過程,結(jié)

果以及評估

整理報告,

為以后出現(xiàn)

問題提供經(jīng)

驗(yàn)教訓(xùn)。

對于本次沒

有完全解決

的問題,進(jìn)

行說明。例如,從現(xiàn)有的報表數(shù)據(jù)中就能夠看到當(dāng)前問題點(diǎn)的數(shù)據(jù)情況或者一段時間的趨勢;

兩個重點(diǎn)步驟選取的分析軟件以及分析方法(統(tǒng)計學(xué)相關(guān)方法)。分析問題5精確的陳述問題Where----哪里存在問題?What------存在的問題是什么?Why-------原因在哪里?When-----什么時候開始出現(xiàn)這樣的問題?Who------與什么對象有關(guān)?How

many-----發(fā)生的次數(shù)和數(shù)量?How

much------損失有多大?愛因斯坦說:“精確的陳述問題比解決問題還來得重要”5W2H法:

5W:What,When,Where,Who,Why;

2H:How及How

many;使用這個方法阿根廷隊世界杯輸球了,如果你是馬拉多納,你怎么去思考?定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理精確的陳述問題Where----哪里存在問題?Why----6問題展現(xiàn)方式問題現(xiàn)狀

直接原因最終原因問題的結(jié)構(gòu)如同這座冰山

初步的問題分析深層次的問題分析

問題結(jié)構(gòu)是由現(xiàn)狀、直接原因以及最終原因構(gòu)成的。針對直接原因進(jìn)行的叫初步

問題分析,針對最終原因進(jìn)行分析的叫深層次問題分析。7

>治標(biāo)治本定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理問題展現(xiàn)方式問題現(xiàn)狀最終原因問題的結(jié)構(gòu)如同這座冰山深層次的問7問題分解8

>問題陳述問題/假設(shè)1問題/假設(shè)2問題/假設(shè)3分支問題分支問題分支問題分支問題分支問題分支問題為什么使用邏輯樹?1.將問題分成幾個部分使

?解決問題的工作可以分成智力上能夠解

決的幾個部分

?不同部分可按輕重緩急區(qū)分

?工作責(zé)任能分派到各人2.保證問題獲得完整地解決

?將問題的各個部分解決好,即可解決整

個問題

?所分問題的各個部分各不相同,而且包

括了各個方面(即沒有重疊沒有遺漏)3.使項目小組共同了解解決問題的框架4.協(xié)助重點(diǎn)使用組織框架及理論定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理問題分解8>問題陳述問題/假設(shè)1問題/假設(shè)2問題/假設(shè)8分析方法統(tǒng)計方法的三大特性,用三句話來簡單概括一下:反應(yīng)客觀現(xiàn)象

的數(shù)據(jù)

描述性統(tǒng)計(包括統(tǒng)計數(shù)據(jù)的收集、整理、顯示和分

析)實(shí)用性:除了實(shí)情,數(shù)據(jù)能證明一切;豐富性:統(tǒng)計就像比基尼,露出來的部分固然誘人,沒露出來的部分才是最要命的;公平性:我們相信上帝,其它人請用數(shù)據(jù)說話。

概率論

(包括分布理論、

大數(shù)定律和中心極

限定理)

推斷統(tǒng)計(利用樣本信息和概率論對總體的數(shù)量特征進(jìn)行估計和檢驗(yàn)等)

總體內(nèi)在的數(shù)量

規(guī)律性9

>樣本數(shù)據(jù)總體數(shù)據(jù)定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理分析方法統(tǒng)計方法的三大特性,用三句話來簡單概括一下:反應(yīng)客9描述性統(tǒng)計分析

“五點(diǎn)法”:最小值,1/4分位數(shù),均值,3/4分位數(shù),最大值

“兩度”:峰度,偏度

六西格瑪:

檢驗(yàn)統(tǒng)計量的取值空間

6

∑10

>定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理描述性統(tǒng)計分析 “五點(diǎn)法”:最小值,1/4分位數(shù),均值,3/102120y-1y-2-2-101-1-20221y0y468負(fù)相關(guān)相關(guān)但非線性相關(guān)推斷統(tǒng)計分析11

>回歸分析是統(tǒng)計分析思想中最基礎(chǔ)、最集中的一個領(lǐng)域。

高斯、高爾頓相關(guān)分析&回歸分析-3-212(a)-212(b)x-2-1012x-3-2-10123x

-1

0不相

x

關(guān)

(c)

-1

0正相關(guān)

(d)變量的選??;預(yù)測推斷;P值:回歸分析就是放“P”,放得好,就合格。定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理2120y-1y-2-2-101-1-20221y0y46811變量分析方法選取對象變量的關(guān)系類型因變量-自變量預(yù)測和解釋變量的個數(shù)變量的相互關(guān)系變量的結(jié)構(gòu)關(guān)系多因變量與自變量多因變量與自變量單一變量存在多存在多重關(guān)系存在單一關(guān)系重關(guān)系變量樣本因變量測量尺度結(jié)構(gòu)方程式模式

數(shù)

數(shù)

型數(shù)量型非數(shù)量型自變量尺度測量典型相關(guān)分析多元方差分析因變量尺度測量

多元回歸

分析結(jié)合分析

數(shù)

數(shù)

型多元判別分析Logistic回歸離散選擇模型

CHAID因子分析/主成分析聚類分析變量測量尺度數(shù)量型非數(shù)量型多維尺度分析對應(yīng)分析

一張簡單的圖勝過千言萬語?。。?!12

>定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理變量分析方法選取對變類因預(yù)變相互變結(jié)構(gòu)多存變樣因結(jié)構(gòu)方程式模12數(shù)據(jù)挖掘分析13

>按挖掘方法分類:包括統(tǒng)計方法,機(jī)器學(xué)習(xí)方法,神經(jīng)網(wǎng)絡(luò)方法和數(shù)據(jù)庫方法,

其中:統(tǒng)計方法可分為:判別分析(貝葉斯判別、費(fèi)歇爾判別、非參數(shù)判別等),聚類分析(系統(tǒng)聚類、動態(tài)聚類等),探索性分析(主成分分析等)等。

機(jī)器學(xué)習(xí)方法可分為:歸納學(xué)習(xí)方法(決策樹、規(guī)則歸納等),基于范例學(xué)習(xí),遺傳算法等。神經(jīng)網(wǎng)絡(luò)方法可以分為:前向神經(jīng)網(wǎng)絡(luò)(BP算法等),自組織神經(jīng)網(wǎng)絡(luò)(自組織特征映射、競爭學(xué)習(xí)等)。數(shù)據(jù)庫方法分為:多為數(shù)據(jù)分析和OLAP技術(shù),此外還有面向?qū)傩缘臍w納方法。關(guān)聯(lián)規(guī)則

關(guān)聯(lián)規(guī)則反映一個事物與其它事物之間的相互依存性和關(guān)聯(lián)性,如果兩個事

物或者多個事物之間存在一定的關(guān)聯(lián)關(guān)系,那么其中一個事物就能夠通過其

他事物預(yù)測到。Ps:

多元統(tǒng)計分析中的聚類分析有個閾值,用于確定分類的一個臨界值,平時會遇到把它讀成fá,誤以為它是“閥”字。正確的應(yīng)該是閾(念yù)值,而不是閥值.定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理數(shù)據(jù)挖掘分析13>按挖掘方法分類:包括統(tǒng)計方法,機(jī)器學(xué)13?

網(wǎng)管中心數(shù)據(jù)?

CRM數(shù)據(jù)

?

一經(jīng)數(shù)據(jù)

?

第三方調(diào)查數(shù)據(jù)

?

……14

>海量的數(shù)據(jù)eg數(shù)據(jù)提取時注意的幾點(diǎn)問題。

?

經(jīng)分?jǐn)?shù)據(jù)

?

BOSS數(shù)據(jù)定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理選取分析所需的相關(guān)數(shù)據(jù)?網(wǎng)管中心數(shù)據(jù) ?一經(jīng)數(shù)據(jù)海量的數(shù)據(jù)eg數(shù)據(jù)提取時注意的14制定數(shù)據(jù)提取需求15

>

人口統(tǒng)計

性別

年齡

戶藉

職業(yè)

婚姻狀況

教育程度

收入

……客戶

辦理時間地點(diǎn)

辦理的渠道

辦理的業(yè)務(wù)種類

生效和失效時間

購買行為

消費(fèi)行為

溝通記錄

銷售概率

帳單信息

分群特征

離網(wǎng)概率

離網(wǎng)原因

客戶價值

高利潤率

中等利潤率

低利潤率

負(fù)利潤率

服務(wù)與產(chǎn)品

使用的產(chǎn)品

使用的服務(wù)功能

接受的營銷offer

享受的客戶服務(wù)

態(tài)度形象價值觀生活方式心理因素…

客戶偏好

渠道偏好

聯(lián)絡(luò)時間偏好

服務(wù)內(nèi)容偏好帳戶信息

高級資料

性格和愛好

反感的業(yè)務(wù)

家庭情況

繳費(fèi)方式

使用清單

繳費(fèi)記錄行為信息

基本資料地址、電話、email、籍貫等語言、行業(yè)手機(jī)相關(guān)信息網(wǎng)絡(luò)狀況業(yè)務(wù)辦理信息

行為方式通話時段繁忙和非繁忙通話

量漫游服務(wù)方便程度行為方式的變化…

客戶交互信息

客戶交互概況

整合的投訴歷史

整合的咨詢歷史

主動聯(lián)絡(luò)客戶歷史

客戶分析信息注意數(shù)據(jù)提取粒度定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理制定數(shù)據(jù)提取需求15> 人口統(tǒng)計客戶辦理時間地點(diǎn)15數(shù)據(jù)質(zhì)量的評估?

在現(xiàn)實(shí)社會中,存在著大量的“臟”數(shù)

據(jù)

>

不完整性(數(shù)據(jù)結(jié)構(gòu)的設(shè)計人員、數(shù)據(jù)采集

設(shè)備和數(shù)據(jù)錄入人員)

缺少感興趣的屬性

感興趣的屬性缺少部分屬性值

僅僅包含聚合數(shù)據(jù),沒有詳細(xì)數(shù)據(jù)

>

噪音數(shù)據(jù)(采集數(shù)據(jù)的設(shè)備、數(shù)據(jù)錄入人員、

數(shù)據(jù)傳輸)

數(shù)據(jù)中包含錯誤的信息

存在著部分偏離期望值的孤立點(diǎn)

>

不一致性(數(shù)據(jù)結(jié)構(gòu)的設(shè)計人員、數(shù)據(jù)錄入人

員)

數(shù)據(jù)結(jié)構(gòu)的不一致性

Label的不一致性

數(shù)據(jù)值的不一致性

業(yè)務(wù)角度對于數(shù)據(jù)質(zhì)量進(jìn)行

初步評估!?。?6

>>

數(shù)據(jù)類型沖突

性別:string(Male、Female)、Char(M、

F)、Interger(0、1)

日期:Date、DateTime、String>

數(shù)據(jù)標(biāo)簽沖突:解決同名異義、異名同

學(xué)生成績、分?jǐn)?shù)>

度量單位沖突

學(xué)生成績

百分制:100

~

0

五分制:

A

、B、C、D、E

字符表示:優(yōu)、良、及格、不及格>

概念不清

最近交易額:前一個小時、昨天、本周、本

月?>

聚集沖突:根源在于表結(jié)構(gòu)的設(shè)計定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理數(shù)據(jù)質(zhì)量的評估?在現(xiàn)實(shí)社會中,存在著大量的“臟”數(shù) 業(yè)務(wù)16數(shù)據(jù)質(zhì)量的評估

技術(shù)角度進(jìn)行數(shù)據(jù)質(zhì)量評估17

>定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理數(shù)據(jù)質(zhì)量的評估 技術(shù)角度進(jìn)行數(shù)據(jù)質(zhì)量評估定義問題收集整理選取17數(shù)據(jù)的清洗處理主要任務(wù):

補(bǔ)充缺失數(shù)據(jù)

識別孤立點(diǎn),平滑噪音數(shù)據(jù)處理不一致的數(shù)據(jù)處理方法:

分箱(Binning)的方法:

聚類方法:

檢測并消除異常點(diǎn)

線性回歸:

對不符合回歸的數(shù)據(jù)進(jìn)行平滑處理

人機(jī)結(jié)合共同檢測:

由計算機(jī)檢測可疑的點(diǎn),然后由用戶確認(rèn)

…18

>定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理數(shù)據(jù)的清洗處理主要任務(wù):處理不一致的數(shù)據(jù)處理方法: 分箱(B18?

指標(biāo)分析與政策分析并重;?

反應(yīng)重點(diǎn)問題、實(shí)事求是;?

材料、數(shù)據(jù)要真實(shí),論據(jù)要有說服力。切記……分析角度:缺乏分析中心思想或主干線

文字表達(dá):“一圖二表三文字”

邏輯結(jié)構(gòu):論點(diǎn)、論據(jù)、論證19

>收集整理

定義問題

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理怎樣將分析的結(jié)果呈現(xiàn)出來??指標(biāo)分析與政策分析并重;切記……分析角度:缺乏分析中心19定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理分析結(jié)果呈現(xiàn)基本原則20

>確定表達(dá)的主題

使用圖形的目的:

將思想和觀點(diǎn)形

象化的表達(dá),加

深讀者或聽眾的

印象。

使用圖表時,必

須明確通過圖表

要表達(dá)的信息是

什么。

確定對比關(guān)系

同一類別不同項目間

的對比

不同類別不同項目間

的對比

時間對比:把時間作

為項目分類的標(biāo)準(zhǔn)

頻率對比:以部分占

整體的百分比為項目

分類的標(biāo)準(zhǔn)

相關(guān)性對比:按照項

目之間的函數(shù)關(guān)系作

為項目分類的標(biāo)準(zhǔn)

其他對比:邏輯關(guān)系

的對比(因果,時間序

列……)

選擇圖形餅圖柱狀圖百分比柱狀圖堆積柱狀圖線形圖雷達(dá)圖面積圖點(diǎn)圖氣泡圖矩陣圖邏輯圖數(shù)據(jù)分析結(jié)果呈現(xiàn)準(zhǔn)備工作:定義問題收集整理選取分析數(shù)據(jù)提取分析結(jié)果實(shí)施及建 實(shí)施效果評20如何用圖來表示數(shù)據(jù)?定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理如何用圖來表示數(shù)據(jù)?定義問題收集整理選取分析數(shù)據(jù)提取分析結(jié)果21定量數(shù)據(jù)的圖表示對于一個定量變量;用圖形來表示這個數(shù)據(jù),使人們能夠看出這個數(shù)據(jù)的大體分布或“形狀”的一個辦法是畫直方圖(histogram)。定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理定量數(shù)據(jù)的圖表示對于一個定量變量;定義問題收集整理選取分析22x

10000定性數(shù)據(jù)的圖表示定性變量(或?qū)傩宰兞?,分類變量)不能點(diǎn)出直方圖、散點(diǎn)圖或莖葉圖,但可以描繪出它們各類的比例。

丌同頁面內(nèi)容訪問量和累計訪問量大眾化網(wǎng)頁?單類網(wǎng)頁訪問次數(shù)占比大于10%;?累積網(wǎng)頁訪問次數(shù)占比達(dá)81.05%;?單類網(wǎng)頁訪問次數(shù)占比5~10%;?累積網(wǎng)頁訪問次數(shù)占比達(dá)15.41%;?單類網(wǎng)頁訪問次數(shù)占比小于5%;?累積網(wǎng)頁訪問次數(shù)占比丌足10%;個性化網(wǎng)頁小眾化網(wǎng)頁44.60%81.05%96.42%20%0%40%80%60%100%10

03020504060博客娛樂體育游戲女性星座金融笑話音樂彩票搜索微博視頻頁面訪問量累計占比定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理x10000定性數(shù)據(jù)的圖表示定性變量(或?qū)傩宰兞?,分類變?3常見的分析模式

內(nèi)容決定形式,形式服務(wù)于內(nèi)容,當(dāng)形式經(jīng)過實(shí)踐考驗(yàn)被

普遍接受后就固化成一種模式。

分析報告的模式主要包括:

金字塔式;

綜合式;

三步曲;

專題式;

通報;

簡報式;

工作匯報式.24

>定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理常見的分析模式 內(nèi)容決定形式,形式服務(wù)于內(nèi)容,當(dāng)形式經(jīng)過實(shí)踐24針對問題1建議措施針對問題2建議措施

針對問題3

建議措施

現(xiàn)狀及問題

總結(jié)

數(shù)據(jù)分析

分析總結(jié)25

>建議措施分類

業(yè)務(wù)層面

數(shù)據(jù)挖掘定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理分析總結(jié)及建議措施針對問題1 針對問題3建議措施分類定義問題收集整理選25定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理實(shí)施效果評估及報告整理

營銷活動效果反饋數(shù)據(jù),分析對于問題的解決程度;

活動歷史響應(yīng)數(shù)據(jù)的積累;

活動流程固化;

業(yè)務(wù)模型優(yōu)化提升;

對比組,顯示模型本身的優(yōu)越性;

營銷活動數(shù)據(jù)對于模型的提升情況;

…26

>定義問題收集整理選取分析數(shù)據(jù)提取分析結(jié)果實(shí)施及建 實(shí)施效果評26回顧一下27

>分析前的思考????回顧一下27>分析前的思考????27目錄數(shù)據(jù)分析前的思考案例分享深層次數(shù)據(jù)分析目錄數(shù)據(jù)分析前的思考案例分享深層次數(shù)據(jù)分析2829四大套餐沉默率高非沉默用戶人均流量低占套餐用戶總?cè)藬?shù)80.55%的5元套餐沉默率為39.44%,高于當(dāng)前套餐沉默率指標(biāo)30%。其它套餐雖然沉默率低,但總?cè)藬?shù)也低,故降低5元套餐沉默率是當(dāng)前急需解決的問題。四大套餐非沉默用戶人均流量均遠(yuǎn)低于套餐包含的標(biāo)準(zhǔn)流量,而人數(shù)最多的5元套餐(含30MGPRS流量)人均流量也只有10.72M,是套餐可使用量的35.73%。怎樣降低套餐沉默率怎樣提升套餐均流量

手機(jī)上網(wǎng)當(dāng)前遇到的問題——“一高兩低”按沉默用戶和非沉默用戶分析沉默用戶注:沉默用戶指套餐沉默用戶,由于2元、5元、10元、20元這四大套餐用戶占總套餐用戶的85%(5月數(shù)據(jù)),故取四大套餐為研究對象。各套餐人數(shù)占比=套餐用戶數(shù)/四大套餐用戶總數(shù);套餐使用率=人均套餐使用量/套餐包含的標(biāo)準(zhǔn)流量。非沉默用戶29四大套餐沉默率高非沉默用戶人均流量低占套餐用戶總?cè)藬?shù)8029手機(jī)上網(wǎng)問題分解及用戶定義

普及率偏低,提升緩慢

套餐沉默率偏高

套餐流量利用率偏低

部分用戶套餐需要升級30

查找潛在用戶查找可激發(fā)的套餐沉

默用戶查找可提升流量用戶

尋找到超量用戶

擴(kuò)大手機(jī)上網(wǎng)用戶規(guī)

模,提升普及率激活沉默用戶,降低套

餐沉默率增強(qiáng)營銷,提升手機(jī)上

網(wǎng)流量

套餐升級手機(jī)上網(wǎng)問題分解及用戶定義 普及率偏低,提升緩慢 查找潛在30相關(guān)分析數(shù)據(jù)字段提取

定制手機(jī)報類型

彩鈴主動下載次數(shù)

是否使用手機(jī)搜索31

>

基本屬性手機(jī)號碼

品牌

付費(fèi)類型imei號終端是否支GPRS入網(wǎng)時間年齡性別ARPU

數(shù)據(jù)業(yè)務(wù)點(diǎn)對點(diǎn)短信上行條數(shù)

夢網(wǎng)短信條數(shù)點(diǎn)對點(diǎn)彩信上行量短信計費(fèi)量新業(yè)務(wù)費(fèi)用是否是轉(zhuǎn)轉(zhuǎn)贏用戶是否是大贏家用戶是否飛信用戶是否無線音樂高級會員

GPRSGPRS套餐類型GPRS流量GPRS費(fèi)用CMWAP流量CMNET流量cmwap登陸次數(shù)cmnet登陸次數(shù)

語音業(yè)務(wù)語音業(yè)務(wù)費(fèi)用

本地通話時長本地通話次數(shù)總打入號碼數(shù)總打出號碼數(shù)相關(guān)分析數(shù)據(jù)字段提取 定制手機(jī)報類型 基本屬性 數(shù)據(jù)業(yè)務(wù) 3132查找潛在用戶(略去)32查找潛在用戶(略去)32沉默用戶流量提升分析總結(jié)及建議措施

分析總結(jié)

手機(jī)上網(wǎng)整體普及率較低,僅33%;

近半年多來手機(jī)上網(wǎng)普及率提升較

慢;

動感地帶品牌對于手機(jī)上網(wǎng)接受程度

最高;

手機(jī)上網(wǎng)業(yè)務(wù)粘性較差;

手機(jī)上網(wǎng)與特定業(yè)務(wù)訂購有很強(qiáng)關(guān)聯(lián)

性;

5元套餐是提升重點(diǎn);

建議措施手上網(wǎng)潛在用戶查找建議措施:較低的普及率為手機(jī)上網(wǎng)潛在用戶查找

提供了上升的空間;上月或上上月是手機(jī)上網(wǎng)活躍用戶;使用特定業(yè)務(wù)的手機(jī)上網(wǎng)沉默用戶;加強(qiáng)手機(jī)上網(wǎng)業(yè)務(wù)體驗(yàn)營銷和手機(jī)上網(wǎng)

助手業(yè)務(wù)的宣傳;加強(qiáng)手機(jī)上網(wǎng)用戶主動偏好需求研究。

對于不滿足建議查找條件的非手機(jī)上網(wǎng)用戶,利用數(shù)據(jù)挖掘技術(shù)進(jìn)行查找。33

>沉默用戶流量提升分析總結(jié)及建議措施 分析總結(jié) 建議措施 3334手機(jī)上網(wǎng)套餐沉默用戶查找潛在手機(jī)上網(wǎng)活躍用戶結(jié)果查找思路手機(jī)上網(wǎng)潛在活躍用戶查找

潛在手機(jī)上網(wǎng)活躍

用戶

20.8%非手機(jī)上網(wǎng)營銷目標(biāo)用戶:79.2%目標(biāo)用戶提取規(guī)則34手機(jī)上網(wǎng)套查潛在手機(jī)上結(jié)查找思路手機(jī)上網(wǎng)潛在活躍用戶查找34目錄數(shù)據(jù)分析前的思考案例分享深層次數(shù)據(jù)分析目錄數(shù)據(jù)分析前的思考案例分享深層次數(shù)據(jù)分析35這樣的客戶需求,我們怎么處理?36

>用戶和需求:對于復(fù)雜現(xiàn)象的簡單結(jié)論市場-誰將會購買這個產(chǎn)品?預(yù)測-我們將面臨何種需求?忠誠度

-誰最有可能流失?信用-哪一類人群不還款的傾向嚴(yán)重?欺詐-什么時候會發(fā)生?當(dāng)然這些問題,從業(yè)務(wù)角度,能夠有一定的回答,但是,如果有更深層次的分析,會得到比業(yè)務(wù)層面更好的效果?。?!這樣的客戶需求,我們怎么處理?36>用戶和需求:對于復(fù)3637

>?

簡單的呈現(xiàn)一樣當(dāng)

前的一些數(shù)據(jù)?

描述性的統(tǒng)計分析

方法?不同維度交叉分析?回歸統(tǒng)計,多元統(tǒng)

計分析方法數(shù)據(jù)分析與數(shù)據(jù)挖掘的關(guān)系

數(shù)據(jù)挖掘

數(shù)據(jù)分析

數(shù)據(jù)呈現(xiàn)

更深層次分析數(shù)據(jù)挖掘模型相關(guān)算法37>?簡單的呈現(xiàn)一樣當(dāng)?不同維度交叉分析數(shù)據(jù)分析37更深層次的分析38

>基于數(shù)據(jù)分析之上的數(shù)據(jù)挖掘數(shù)據(jù)挖掘的重點(diǎn)和難點(diǎn)是什么?數(shù)據(jù)挖掘是數(shù)據(jù)分析的一個環(huán)節(jié),同時是解決實(shí)際問題的一個環(huán)節(jié),當(dāng)然,數(shù)據(jù)挖掘的應(yīng)用就能體現(xiàn)出來?。。。「顚哟蔚姆治?8>基于數(shù)據(jù)分析之上的數(shù)據(jù)挖掘數(shù)據(jù)挖38競爭優(yōu)越性數(shù)據(jù)挖掘過程數(shù)據(jù)準(zhǔn)備數(shù)據(jù)收集模型開發(fā)準(zhǔn)備模型數(shù)據(jù)轉(zhuǎn)換商業(yè)理解

耗用時間

70%

時間用于數(shù)據(jù)處理

39模型開發(fā)期

數(shù)據(jù)探索

經(jīng)營分析支持

業(yè)務(wù)模型模型部署

Scoring

ADSModeling

ADS競爭優(yōu)越性數(shù)據(jù)挖掘過程數(shù)據(jù)準(zhǔn)備數(shù)據(jù)收集模型開發(fā)準(zhǔn)備模型數(shù)據(jù)轉(zhuǎn)39Thank-youThank-you40知識回顧KnowledgeReview知識回顧KnowledgeReview數(shù)據(jù)分析方法培訓(xùn)數(shù)據(jù)分析方法培訓(xùn)42目錄數(shù)據(jù)分析前的思考案例分享深層次數(shù)據(jù)分析目錄數(shù)據(jù)分析前的思考案例分享深層次數(shù)據(jù)分析43數(shù)據(jù)分析前,我們需要思考3

>《孫子兵法〃謀攻篇》:故上兵伐謀,其次伐交,其次伐兵,其下攻城;攻城之法為不得已。像一場戰(zhàn)役的總指揮影響著整個戰(zhàn)役的勝敗一樣,數(shù)據(jù)分析師的思想對于整體分析思路,甚至分析結(jié)果都有著關(guān)鍵性的作用。數(shù)據(jù)分析前,我們需要思考3>《孫子兵法〃謀攻篇》:故上44問題分析結(jié)果呈現(xiàn)分析思路與方

法數(shù)據(jù)選取數(shù)據(jù)分析前,我們怎么去思考?

每一個步驟可能面臨的問題以及需要準(zhǔn)備的東西???4

>問題分析結(jié)分析思數(shù)據(jù)選取數(shù)據(jù)分析前,我們怎么去思考? 每一個45

選取的分析軟件以及分析方法(統(tǒng)計學(xué)相關(guān)方法)。分析問題和解決問題的思路5

>定義問題第一步

首先,要搞清

問題的實(shí)質(zhì),

準(zhǔn)確、完整、

真實(shí)地表達(dá)問

題。

其次,弄清楚

為什么要解決

這個問題?

最后,解決這

個問題的意義

何在?是必須

解決還是無關(guān)

緊要,或是需

要馬上解決還

是不太著急。第二步收集整理

信息

搜集、整理

關(guān)于要解決

問題的歷史

資料、類似

情況和現(xiàn)狀。第三步選取分析

方法

分析涉及到

的主要維度,

為后面提取

數(shù)據(jù)需求作

準(zhǔn)備;第四步數(shù)據(jù)提取

整理

根據(jù)分析內(nèi)

容以及分析

方法,提出

分析所需的

數(shù)據(jù)需求;

對于反饋回

來的數(shù)據(jù),

需要進(jìn)行部

分加工,以

便更能反應(yīng)

所要分析的

問題。第五步分析結(jié)果

及結(jié)論

根據(jù)分析的

結(jié)果,得出

一些當(dāng)前問

題產(chǎn)生的一

些結(jié)論。這

里注意分析

的方法以及

維度,結(jié)果

的展示方式

等。

結(jié)論需要求

足夠的數(shù)據(jù)

做支撐。第六步實(shí)施及建

議措施

針對數(shù)據(jù)分

析結(jié)論,給

出當(dāng)前問題

的解決建議

措施。

一方面從業(yè)

務(wù)層面進(jìn)行

建議措施,

另一方面,

可以就問題

點(diǎn)進(jìn)行更深

層次分析,

給出數(shù)據(jù)挖

掘?qū)用娴慕?/p>

決措施。第七步

實(shí)施效果評估及報告整理

根據(jù)措施實(shí)

施效果進(jìn)行

實(shí)際評估,

將完成的分

析過程,結(jié)

果以及評估

整理報告,

為以后出現(xiàn)

問題提供經(jīng)

驗(yàn)教訓(xùn)。

對于本次沒

有完全解決

的問題,進(jìn)

行說明。例如,從現(xiàn)有的報表數(shù)據(jù)中就能夠看到當(dāng)前問題點(diǎn)的數(shù)據(jù)情況或者一段時間的趨勢;

兩個重點(diǎn)步驟選取的分析軟件以及分析方法(統(tǒng)計學(xué)相關(guān)方法)。分析問題46精確的陳述問題Where----哪里存在問題?What------存在的問題是什么?Why-------原因在哪里?When-----什么時候開始出現(xiàn)這樣的問題?Who------與什么對象有關(guān)?How

many-----發(fā)生的次數(shù)和數(shù)量?How

much------損失有多大?愛因斯坦說:“精確的陳述問題比解決問題還來得重要”5W2H法:

5W:What,When,Where,Who,Why;

2H:How及How

many;使用這個方法阿根廷隊世界杯輸球了,如果你是馬拉多納,你怎么去思考?定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理精確的陳述問題Where----哪里存在問題?Why----47問題展現(xiàn)方式問題現(xiàn)狀

直接原因最終原因問題的結(jié)構(gòu)如同這座冰山

初步的問題分析深層次的問題分析

問題結(jié)構(gòu)是由現(xiàn)狀、直接原因以及最終原因構(gòu)成的。針對直接原因進(jìn)行的叫初步

問題分析,針對最終原因進(jìn)行分析的叫深層次問題分析。7

>治標(biāo)治本定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理問題展現(xiàn)方式問題現(xiàn)狀最終原因問題的結(jié)構(gòu)如同這座冰山深層次的問48問題分解8

>問題陳述問題/假設(shè)1問題/假設(shè)2問題/假設(shè)3分支問題分支問題分支問題分支問題分支問題分支問題為什么使用邏輯樹?1.將問題分成幾個部分使

?解決問題的工作可以分成智力上能夠解

決的幾個部分

?不同部分可按輕重緩急區(qū)分

?工作責(zé)任能分派到各人2.保證問題獲得完整地解決

?將問題的各個部分解決好,即可解決整

個問題

?所分問題的各個部分各不相同,而且包

括了各個方面(即沒有重疊沒有遺漏)3.使項目小組共同了解解決問題的框架4.協(xié)助重點(diǎn)使用組織框架及理論定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理問題分解8>問題陳述問題/假設(shè)1問題/假設(shè)2問題/假設(shè)49分析方法統(tǒng)計方法的三大特性,用三句話來簡單概括一下:反應(yīng)客觀現(xiàn)象

的數(shù)據(jù)

描述性統(tǒng)計(包括統(tǒng)計數(shù)據(jù)的收集、整理、顯示和分

析)實(shí)用性:除了實(shí)情,數(shù)據(jù)能證明一切;豐富性:統(tǒng)計就像比基尼,露出來的部分固然誘人,沒露出來的部分才是最要命的;公平性:我們相信上帝,其它人請用數(shù)據(jù)說話。

概率論

(包括分布理論、

大數(shù)定律和中心極

限定理)

推斷統(tǒng)計(利用樣本信息和概率論對總體的數(shù)量特征進(jìn)行估計和檢驗(yàn)等)

總體內(nèi)在的數(shù)量

規(guī)律性9

>樣本數(shù)據(jù)總體數(shù)據(jù)定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理分析方法統(tǒng)計方法的三大特性,用三句話來簡單概括一下:反應(yīng)客50描述性統(tǒng)計分析

“五點(diǎn)法”:最小值,1/4分位數(shù),均值,3/4分位數(shù),最大值

“兩度”:峰度,偏度

六西格瑪:

檢驗(yàn)統(tǒng)計量的取值空間

6

∑10

>定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理描述性統(tǒng)計分析 “五點(diǎn)法”:最小值,1/4分位數(shù),均值,3/512120y-1y-2-2-101-1-20221y0y468負(fù)相關(guān)相關(guān)但非線性相關(guān)推斷統(tǒng)計分析11

>回歸分析是統(tǒng)計分析思想中最基礎(chǔ)、最集中的一個領(lǐng)域。

高斯、高爾頓相關(guān)分析&回歸分析-3-212(a)-212(b)x-2-1012x-3-2-10123x

-1

0不相

x

關(guān)

(c)

-1

0正相關(guān)

(d)變量的選取;預(yù)測推斷;P值:回歸分析就是放“P”,放得好,就合格。定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理2120y-1y-2-2-101-1-20221y0y46852變量分析方法選取對象變量的關(guān)系類型因變量-自變量預(yù)測和解釋變量的個數(shù)變量的相互關(guān)系變量的結(jié)構(gòu)關(guān)系多因變量與自變量多因變量與自變量單一變量存在多存在多重關(guān)系存在單一關(guān)系重關(guān)系變量樣本因變量測量尺度結(jié)構(gòu)方程式模式

數(shù)

數(shù)

型數(shù)量型非數(shù)量型自變量尺度測量典型相關(guān)分析多元方差分析因變量尺度測量

多元回歸

分析結(jié)合分析

數(shù)

數(shù)

型多元判別分析Logistic回歸離散選擇模型

CHAID因子分析/主成分析聚類分析變量測量尺度數(shù)量型非數(shù)量型多維尺度分析對應(yīng)分析

一張簡單的圖勝過千言萬語!?。?!12

>定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理變量分析方法選取對變類因預(yù)變相互變結(jié)構(gòu)多存變樣因結(jié)構(gòu)方程式模53數(shù)據(jù)挖掘分析13

>按挖掘方法分類:包括統(tǒng)計方法,機(jī)器學(xué)習(xí)方法,神經(jīng)網(wǎng)絡(luò)方法和數(shù)據(jù)庫方法,

其中:統(tǒng)計方法可分為:判別分析(貝葉斯判別、費(fèi)歇爾判別、非參數(shù)判別等),聚類分析(系統(tǒng)聚類、動態(tài)聚類等),探索性分析(主成分分析等)等。

機(jī)器學(xué)習(xí)方法可分為:歸納學(xué)習(xí)方法(決策樹、規(guī)則歸納等),基于范例學(xué)習(xí),遺傳算法等。神經(jīng)網(wǎng)絡(luò)方法可以分為:前向神經(jīng)網(wǎng)絡(luò)(BP算法等),自組織神經(jīng)網(wǎng)絡(luò)(自組織特征映射、競爭學(xué)習(xí)等)。數(shù)據(jù)庫方法分為:多為數(shù)據(jù)分析和OLAP技術(shù),此外還有面向?qū)傩缘臍w納方法。關(guān)聯(lián)規(guī)則

關(guān)聯(lián)規(guī)則反映一個事物與其它事物之間的相互依存性和關(guān)聯(lián)性,如果兩個事

物或者多個事物之間存在一定的關(guān)聯(lián)關(guān)系,那么其中一個事物就能夠通過其

他事物預(yù)測到。Ps:

多元統(tǒng)計分析中的聚類分析有個閾值,用于確定分類的一個臨界值,平時會遇到把它讀成fá,誤以為它是“閥”字。正確的應(yīng)該是閾(念yù)值,而不是閥值.定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理數(shù)據(jù)挖掘分析13>按挖掘方法分類:包括統(tǒng)計方法,機(jī)器學(xué)54?

網(wǎng)管中心數(shù)據(jù)?

CRM數(shù)據(jù)

?

一經(jīng)數(shù)據(jù)

?

第三方調(diào)查數(shù)據(jù)

?

……14

>海量的數(shù)據(jù)eg數(shù)據(jù)提取時注意的幾點(diǎn)問題。

?

經(jīng)分?jǐn)?shù)據(jù)

?

BOSS數(shù)據(jù)定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理選取分析所需的相關(guān)數(shù)據(jù)?網(wǎng)管中心數(shù)據(jù) ?一經(jīng)數(shù)據(jù)海量的數(shù)據(jù)eg數(shù)據(jù)提取時注意的55制定數(shù)據(jù)提取需求15

>

人口統(tǒng)計

性別

年齡

戶藉

職業(yè)

婚姻狀況

教育程度

收入

……客戶

辦理時間地點(diǎn)

辦理的渠道

辦理的業(yè)務(wù)種類

生效和失效時間

購買行為

消費(fèi)行為

溝通記錄

銷售概率

帳單信息

分群特征

離網(wǎng)概率

離網(wǎng)原因

客戶價值

高利潤率

中等利潤率

低利潤率

負(fù)利潤率

服務(wù)與產(chǎn)品

使用的產(chǎn)品

使用的服務(wù)功能

接受的營銷offer

享受的客戶服務(wù)

態(tài)度形象價值觀生活方式心理因素…

客戶偏好

渠道偏好

聯(lián)絡(luò)時間偏好

服務(wù)內(nèi)容偏好帳戶信息

高級資料

性格和愛好

反感的業(yè)務(wù)

家庭情況

繳費(fèi)方式

使用清單

繳費(fèi)記錄行為信息

基本資料地址、電話、email、籍貫等語言、行業(yè)手機(jī)相關(guān)信息網(wǎng)絡(luò)狀況業(yè)務(wù)辦理信息

行為方式通話時段繁忙和非繁忙通話

量漫游服務(wù)方便程度行為方式的變化…

客戶交互信息

客戶交互概況

整合的投訴歷史

整合的咨詢歷史

主動聯(lián)絡(luò)客戶歷史

客戶分析信息注意數(shù)據(jù)提取粒度定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理制定數(shù)據(jù)提取需求15> 人口統(tǒng)計客戶辦理時間地點(diǎn)56數(shù)據(jù)質(zhì)量的評估?

在現(xiàn)實(shí)社會中,存在著大量的“臟”數(shù)

據(jù)

>

不完整性(數(shù)據(jù)結(jié)構(gòu)的設(shè)計人員、數(shù)據(jù)采集

設(shè)備和數(shù)據(jù)錄入人員)

缺少感興趣的屬性

感興趣的屬性缺少部分屬性值

僅僅包含聚合數(shù)據(jù),沒有詳細(xì)數(shù)據(jù)

>

噪音數(shù)據(jù)(采集數(shù)據(jù)的設(shè)備、數(shù)據(jù)錄入人員、

數(shù)據(jù)傳輸)

數(shù)據(jù)中包含錯誤的信息

存在著部分偏離期望值的孤立點(diǎn)

>

不一致性(數(shù)據(jù)結(jié)構(gòu)的設(shè)計人員、數(shù)據(jù)錄入人

員)

數(shù)據(jù)結(jié)構(gòu)的不一致性

Label的不一致性

數(shù)據(jù)值的不一致性

業(yè)務(wù)角度對于數(shù)據(jù)質(zhì)量進(jìn)行

初步評估?。?!16

>>

數(shù)據(jù)類型沖突

性別:string(Male、Female)、Char(M、

F)、Interger(0、1)

日期:Date、DateTime、String>

數(shù)據(jù)標(biāo)簽沖突:解決同名異義、異名同

學(xué)生成績、分?jǐn)?shù)>

度量單位沖突

學(xué)生成績

百分制:100

~

0

五分制:

A

、B、C、D、E

字符表示:優(yōu)、良、及格、不及格>

概念不清

最近交易額:前一個小時、昨天、本周、本

月?>

聚集沖突:根源在于表結(jié)構(gòu)的設(shè)計定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理數(shù)據(jù)質(zhì)量的評估?在現(xiàn)實(shí)社會中,存在著大量的“臟”數(shù) 業(yè)務(wù)57數(shù)據(jù)質(zhì)量的評估

技術(shù)角度進(jìn)行數(shù)據(jù)質(zhì)量評估17

>定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理數(shù)據(jù)質(zhì)量的評估 技術(shù)角度進(jìn)行數(shù)據(jù)質(zhì)量評估定義問題收集整理選取58數(shù)據(jù)的清洗處理主要任務(wù):

補(bǔ)充缺失數(shù)據(jù)

識別孤立點(diǎn),平滑噪音數(shù)據(jù)處理不一致的數(shù)據(jù)處理方法:

分箱(Binning)的方法:

聚類方法:

檢測并消除異常點(diǎn)

線性回歸:

對不符合回歸的數(shù)據(jù)進(jìn)行平滑處理

人機(jī)結(jié)合共同檢測:

由計算機(jī)檢測可疑的點(diǎn),然后由用戶確認(rèn)

…18

>定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理數(shù)據(jù)的清洗處理主要任務(wù):處理不一致的數(shù)據(jù)處理方法: 分箱(B59?

指標(biāo)分析與政策分析并重;?

反應(yīng)重點(diǎn)問題、實(shí)事求是;?

材料、數(shù)據(jù)要真實(shí),論據(jù)要有說服力。切記……分析角度:缺乏分析中心思想或主干線

文字表達(dá):“一圖二表三文字”

邏輯結(jié)構(gòu):論點(diǎn)、論據(jù)、論證19

>收集整理

定義問題

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理怎樣將分析的結(jié)果呈現(xiàn)出來??指標(biāo)分析與政策分析并重;切記……分析角度:缺乏分析中心60定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理分析結(jié)果呈現(xiàn)基本原則20

>確定表達(dá)的主題

使用圖形的目的:

將思想和觀點(diǎn)形

象化的表達(dá),加

深讀者或聽眾的

印象。

使用圖表時,必

須明確通過圖表

要表達(dá)的信息是

什么。

確定對比關(guān)系

同一類別不同項目間

的對比

不同類別不同項目間

的對比

時間對比:把時間作

為項目分類的標(biāo)準(zhǔn)

頻率對比:以部分占

整體的百分比為項目

分類的標(biāo)準(zhǔn)

相關(guān)性對比:按照項

目之間的函數(shù)關(guān)系作

為項目分類的標(biāo)準(zhǔn)

其他對比:邏輯關(guān)系

的對比(因果,時間序

列……)

選擇圖形餅圖柱狀圖百分比柱狀圖堆積柱狀圖線形圖雷達(dá)圖面積圖點(diǎn)圖氣泡圖矩陣圖邏輯圖數(shù)據(jù)分析結(jié)果呈現(xiàn)準(zhǔn)備工作:定義問題收集整理選取分析數(shù)據(jù)提取分析結(jié)果實(shí)施及建 實(shí)施效果評61如何用圖來表示數(shù)據(jù)?定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理如何用圖來表示數(shù)據(jù)?定義問題收集整理選取分析數(shù)據(jù)提取分析結(jié)果62定量數(shù)據(jù)的圖表示對于一個定量變量;用圖形來表示這個數(shù)據(jù),使人們能夠看出這個數(shù)據(jù)的大體分布或“形狀”的一個辦法是畫直方圖(histogram)。定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理定量數(shù)據(jù)的圖表示對于一個定量變量;定義問題收集整理選取分析63x

10000定性數(shù)據(jù)的圖表示定性變量(或?qū)傩宰兞浚诸愖兞浚┎荒茳c(diǎn)出直方圖、散點(diǎn)圖或莖葉圖,但可以描繪出它們各類的比例。

丌同頁面內(nèi)容訪問量和累計訪問量大眾化網(wǎng)頁?單類網(wǎng)頁訪問次數(shù)占比大于10%;?累積網(wǎng)頁訪問次數(shù)占比達(dá)81.05%;?單類網(wǎng)頁訪問次數(shù)占比5~10%;?累積網(wǎng)頁訪問次數(shù)占比達(dá)15.41%;?單類網(wǎng)頁訪問次數(shù)占比小于5%;?累積網(wǎng)頁訪問次數(shù)占比丌足10%;個性化網(wǎng)頁小眾化網(wǎng)頁44.60%81.05%96.42%20%0%40%80%60%100%10

03020504060博客娛樂體育游戲女性星座金融笑話音樂彩票搜索微博視頻頁面訪問量累計占比定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理x10000定性數(shù)據(jù)的圖表示定性變量(或?qū)傩宰兞?,分類變?4常見的分析模式

內(nèi)容決定形式,形式服務(wù)于內(nèi)容,當(dāng)形式經(jīng)過實(shí)踐考驗(yàn)被

普遍接受后就固化成一種模式。

分析報告的模式主要包括:

金字塔式;

綜合式;

三步曲;

專題式;

通報;

簡報式;

工作匯報式.24

>定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理常見的分析模式 內(nèi)容決定形式,形式服務(wù)于內(nèi)容,當(dāng)形式經(jīng)過實(shí)踐65針對問題1建議措施針對問題2建議措施

針對問題3

建議措施

現(xiàn)狀及問題

總結(jié)

數(shù)據(jù)分析

分析總結(jié)25

>建議措施分類

業(yè)務(wù)層面

數(shù)據(jù)挖掘定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理分析總結(jié)及建議措施針對問題1 針對問題3建議措施分類定義問題收集整理選66定義問題收集整理

信息選取分析

方法數(shù)據(jù)提取

整理分析結(jié)果

及結(jié)論實(shí)施及建

議措施

實(shí)施效果評估及報告整理實(shí)施效果評估及報告整理

營銷活動效果反饋數(shù)據(jù),分析對于問題的解決程度;

活動歷史響應(yīng)數(shù)據(jù)的積累;

活動流程固化;

業(yè)務(wù)模型優(yōu)化提升;

對比組,顯示模型本身的優(yōu)越性;

營銷活動數(shù)據(jù)對于模型的提升情況;

…26

>定義問題收集整理選取分析數(shù)據(jù)提取分析結(jié)果實(shí)施及建 實(shí)施效果評67回顧一下27

>分析前的思考????回顧一下27>分析前的思考????68目錄數(shù)據(jù)分析前的思考案例分享深層次數(shù)據(jù)分析目錄數(shù)據(jù)分析前的思考案例分享深層次數(shù)據(jù)分析6929四大套餐沉默率高非沉默用戶人均流量低占套餐用戶總?cè)藬?shù)80.55%的5元套餐沉默率為39.44%,高于當(dāng)前套餐沉默率指標(biāo)30%。其它套餐雖然沉默率低,但總?cè)藬?shù)也低,故降低5元套餐沉默率是當(dāng)前急需解決的問題。四大套餐非沉默用戶人均流量均遠(yuǎn)低

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論