大數(shù)據(jù)應(yīng)用場(chǎng)景大數(shù)據(jù)預(yù)測(cè)_第1頁(yè)
大數(shù)據(jù)應(yīng)用場(chǎng)景大數(shù)據(jù)預(yù)測(cè)_第2頁(yè)
大數(shù)據(jù)應(yīng)用場(chǎng)景大數(shù)據(jù)預(yù)測(cè)_第3頁(yè)
大數(shù)據(jù)應(yīng)用場(chǎng)景大數(shù)據(jù)預(yù)測(cè)_第4頁(yè)
大數(shù)據(jù)應(yīng)用場(chǎng)景大數(shù)據(jù)預(yù)測(cè)_第5頁(yè)
已閱讀5頁(yè),還剩70頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

大數(shù)據(jù)應(yīng)用場(chǎng)景之-大數(shù)據(jù)預(yù)測(cè)01當(dāng)前第1頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)目錄CONTENTS021大數(shù)據(jù)預(yù)測(cè)概述2描述性數(shù)據(jù)分析3診斷性數(shù)據(jù)分析4大預(yù)測(cè)性數(shù)據(jù)分析5處方式數(shù)據(jù)分析6數(shù)據(jù)分析示例7大數(shù)據(jù)預(yù)測(cè)度特征8大數(shù)據(jù)的其他功能應(yīng)用領(lǐng)域當(dāng)前第2頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)PART01大數(shù)據(jù)預(yù)測(cè)概述大數(shù)據(jù)預(yù)測(cè)是大數(shù)據(jù)最核心的應(yīng)用,大數(shù)據(jù)預(yù)測(cè)將傳統(tǒng)意義預(yù)測(cè)拓展到“現(xiàn)測(cè)”。03當(dāng)前第3頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)預(yù)測(cè)是大數(shù)據(jù)的核心價(jià)值04大數(shù)據(jù)預(yù)測(cè)是大數(shù)據(jù)最核心的應(yīng)用大數(shù)據(jù)的本質(zhì)是解決問(wèn)題,大數(shù)據(jù)的核心價(jià)值就在于預(yù)測(cè),而企業(yè)經(jīng)營(yíng)的核心也是基于預(yù)測(cè)所做出的正確判斷。當(dāng)前第4頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)大數(shù)據(jù)預(yù)測(cè)的優(yōu)勢(shì)05大數(shù)據(jù)預(yù)測(cè)則是基于大數(shù)據(jù)和預(yù)測(cè)模型去預(yù)測(cè)未來(lái)某件事情的概率,讓分析從“面向已經(jīng)發(fā)生的過(guò)去”轉(zhuǎn)向“面向即將發(fā)生的未來(lái)”是大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)分析的最大不同大數(shù)據(jù)預(yù)測(cè)的優(yōu)勢(shì)體現(xiàn)在它把一個(gè)非常困難的預(yù)測(cè)問(wèn)題,轉(zhuǎn)化為一個(gè)相對(duì)簡(jiǎn)單的描述問(wèn)題,而這是傳統(tǒng)小數(shù)據(jù)集根本無(wú)法企及的從預(yù)測(cè)的角度看,大數(shù)據(jù)預(yù)測(cè)所得出的結(jié)果不僅僅得到處理現(xiàn)實(shí)業(yè)務(wù)簡(jiǎn)單、客觀的結(jié)論,更能用于幫助企業(yè)經(jīng)營(yíng)決策,收集起來(lái)的資料還可以被規(guī)劃,引導(dǎo)開發(fā)更大的消費(fèi)力量當(dāng)前第5頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)數(shù)據(jù)分析的四個(gè)層次06數(shù)據(jù)分析的根本目的就是要洞察數(shù)據(jù)背后的規(guī)律,企業(yè)可以基于數(shù)據(jù)分析的結(jié)果制訂決策、并采取相應(yīng)措施和行動(dòng),進(jìn)而達(dá)成想要的結(jié)果數(shù)據(jù)分析的四個(gè)層次描述性分析(DescriptiveAnalysis)診斷性分析(DiagnosticAnalysis)預(yù)測(cè)性分析(PredictiveAnalysis)處方性分析(PrescriptiveAnalysis)當(dāng)前第6頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)數(shù)據(jù)分析的四個(gè)層次07當(dāng)前第7頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)描述性分析—發(fā)生了什么08描述性分析主要是對(duì)已經(jīng)發(fā)生的事實(shí)用數(shù)據(jù)做出準(zhǔn)確的描述比如某企業(yè)本月訂單簽約額比上月增加100萬(wàn),至1100萬(wàn),但是訂單履約率從上月的98%下降到了95%,庫(kù)存周轉(zhuǎn)率從上月的0.8下降到了0.7當(dāng)前第8頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)診斷性分析—為什么會(huì)發(fā)生09通過(guò)評(píng)估描述型數(shù)據(jù),診斷分析工具能夠讓數(shù)據(jù)分析師深入地分析數(shù)據(jù),鉆取到數(shù)據(jù)的核心比如經(jīng)過(guò)分析,發(fā)現(xiàn)訂單履約率下降的原因是成品生產(chǎn)不出來(lái),無(wú)法完成交付,而成品生成不出來(lái)的原因則是部分原材料的供應(yīng)商未能按時(shí)送貨,導(dǎo)致原材料不齊套,無(wú)法開始生產(chǎn)當(dāng)前第9頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)預(yù)測(cè)性分析—什么可能會(huì)發(fā)生10預(yù)測(cè)型分析對(duì)事件未來(lái)發(fā)生的可能性,預(yù)測(cè)一個(gè)可量化的值,或者是預(yù)估事情發(fā)生的時(shí)間點(diǎn)比如通過(guò)建??梢灶A(yù)測(cè)本月該供應(yīng)商會(huì)使我們的訂單履約率下降2%當(dāng)前第10頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)處方性分析—該做些什么11處方性分析基于對(duì)“發(fā)生了什么”、“為什么會(huì)發(fā)生”和“可能發(fā)生什么”的分析,來(lái)幫助用戶決定應(yīng)該采取什么措施通常情況下,是在前面的所有方法都完成之后,最后需要完成的分析方法比如,供應(yīng)商A會(huì)導(dǎo)致本月訂單履約率下降,可能采取的措施就是把A換掉,但是現(xiàn)在有B和C兩個(gè)供應(yīng)商供選擇,通過(guò)分析和計(jì)算得出:選用供應(yīng)商B會(huì)比選C的訂單履約率高1%,因此建議選擇供應(yīng)商B當(dāng)前第11頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)數(shù)據(jù)分析方法總結(jié)12傳統(tǒng)分析方法只能完成描述性和診斷性分析大數(shù)據(jù)分析方法使用大量多樣化和可變數(shù)據(jù)來(lái)實(shí)現(xiàn)預(yù)測(cè),在充滿不確定性的環(huán)境下,能夠幫助企業(yè)做出更好的決定大數(shù)據(jù)預(yù)測(cè)是大數(shù)據(jù)在很多領(lǐng)域的重要應(yīng)用當(dāng)前第12頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)PART02描述性數(shù)據(jù)分析描述性分析做為商業(yè)數(shù)據(jù)分析的第一個(gè)層次,主要回答『發(fā)生了什么』的問(wèn)題。13當(dāng)前第13頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)描述性分析14描述性分析對(duì)采集到的大量數(shù)據(jù)進(jìn)行初步的整理和歸納,對(duì)調(diào)查總體所有變量的有關(guān)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)性描述,主要包括數(shù)據(jù)的頻數(shù)分析數(shù)據(jù)的集中趨勢(shì)分析數(shù)據(jù)的離散程度分析數(shù)據(jù)的分布統(tǒng)計(jì)圖形繪制當(dāng)前第14頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)數(shù)據(jù)的頻數(shù)分析15利用頻數(shù)分析可以發(fā)現(xiàn)一些統(tǒng)計(jì)規(guī)律比如說(shuō),被調(diào)查者使用個(gè)人支票支付方式的最多,使用信用卡支付的最少當(dāng)前第15頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)數(shù)據(jù)的集中趨勢(shì)分析16數(shù)據(jù)的集中趨勢(shì)分析是用來(lái)反映數(shù)據(jù)的一般水平平均值:是衡量數(shù)據(jù)的中心位置的重要指標(biāo),反映了一些數(shù)據(jù)必然性的特點(diǎn),包括算術(shù)平均值、加權(quán)算術(shù)平均值、調(diào)和平均值和幾何平均值中位數(shù):是反映數(shù)據(jù)的中心位置的指標(biāo),其確定方法是將所有數(shù)據(jù)以由小到大的順序排列,位于中央的數(shù)據(jù)值就是中位數(shù)眾數(shù):是指在數(shù)據(jù)中發(fā)生頻率最高的數(shù)據(jù)值如果各個(gè)數(shù)據(jù)之間的差異程度較小,用平均值就有較好的代表性如果數(shù)據(jù)之間的差異程度較大,特別是有個(gè)別的極端值的情況,用中位數(shù)或眾數(shù)有較好的代表性當(dāng)前第16頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)數(shù)據(jù)的離散程度分析17數(shù)據(jù)的離散程度分析主要是用來(lái)反映數(shù)據(jù)之間的差異程度,常用的指標(biāo)有方差和標(biāo)準(zhǔn)差方差是標(biāo)準(zhǔn)差的平方,根據(jù)不同的數(shù)據(jù)類型有不同的計(jì)算方法當(dāng)前第17頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)數(shù)據(jù)的分布18在統(tǒng)計(jì)分析中,通常要假設(shè)樣本的分布屬于正態(tài)分布,因此需要用偏度和峰度兩個(gè)指標(biāo)來(lái)檢查樣本是否符合正態(tài)分布偏度衡量的是樣本分布的偏斜方向和程度而峰度衡量的是樣本分布曲線的尖峰程度如果樣本的偏度接近于0,峰度接近于3,就可以判斷總體的分布接近于正態(tài)分布當(dāng)前第18頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)繪制統(tǒng)計(jì)圖19繪制統(tǒng)計(jì)圖:用圖形的形式來(lái)表達(dá)數(shù)據(jù),比用文字表達(dá)更清晰、更簡(jiǎn)明繪制各個(gè)變量的統(tǒng)計(jì)圖形,包括條形圖、餅圖和折線圖等當(dāng)前第19頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)描述性分析方法20了解業(yè)務(wù)場(chǎng)景首先要了解和還原數(shù)據(jù)產(chǎn)生的業(yè)務(wù)場(chǎng)景,包括:數(shù)據(jù)涉及到的部門和崗位,這些部門和崗位之間的業(yè)務(wù)流程,在不同業(yè)務(wù)流程中有哪些輸入,對(duì)數(shù)據(jù)做了什么處理,又是如何輸出和傳遞給下游部門的探索性分析提問(wèn),理順初步分析思路和目標(biāo)收集數(shù)據(jù)選擇相應(yīng)分析方法提煉指標(biāo)對(duì)數(shù)據(jù)做探索性分析后,可對(duì)數(shù)據(jù)反映的事實(shí)有一個(gè)直觀的感受,但是要想更準(zhǔn)確、簡(jiǎn)潔地描述發(fā)生了什么,還應(yīng)該進(jìn)行總結(jié)和提煉出相應(yīng)指標(biāo),做為企業(yè)日常經(jīng)營(yíng)管理的KPI比如描述庫(kù)存周轉(zhuǎn)的整體情況,庫(kù)存周轉(zhuǎn)率、庫(kù)存周轉(zhuǎn)天數(shù)等指標(biāo)更有效當(dāng)前第20頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)探索性分析步驟21提問(wèn),理順初步分析思路和目標(biāo)在了解清楚數(shù)據(jù)產(chǎn)生的業(yè)務(wù)場(chǎng)景后,試問(wèn)一些whathappened的問(wèn)題比如,本月銷售額是多少?環(huán)比和同比變化分別是多少?本財(cái)年銷售的變化趨勢(shì)是怎么樣的?收集數(shù)據(jù)有了初步的分析思路和目標(biāo)以后,就可以確定需要收集哪些數(shù)據(jù)了比如銷售額分析可能用到的數(shù)據(jù)為銷售訂單數(shù)據(jù)、銷售開票數(shù)據(jù)選擇相應(yīng)分析方法根據(jù)分析的思路和目標(biāo),就可以對(duì)收集到的數(shù)據(jù)選擇相應(yīng)的分析方法了。具體的方法包括:對(duì)數(shù)據(jù)位置的探索,包括:最大值、最小值、均值、中位數(shù)、分位數(shù)等對(duì)數(shù)據(jù)分布的探索,包括:偏差、方差、標(biāo)準(zhǔn)差、莖葉圖、直方圖、箱形圖、密度圖等對(duì)數(shù)據(jù)趨勢(shì)的探索,包括:同比、環(huán)比、趨勢(shì)圖、條形圖等對(duì)數(shù)據(jù)聚合的探索,包括:排序、篩選、計(jì)數(shù)、重復(fù)項(xiàng)、分組、求和、比例、條形圖、餅圖等當(dāng)前第21頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)PART03診斷性數(shù)據(jù)分析診斷性分析可以明確到底發(fā)生了什么。22當(dāng)前第22頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)診斷性分析23診斷性分析的目的是明確為什么發(fā)生尋找相關(guān)特征首先需要知道和結(jié)果可能相關(guān)的因素有哪些,這依賴于對(duì)業(yè)務(wù)的了解程度,只要是可能相關(guān)的,都納入考慮,也可以基于現(xiàn)有特征構(gòu)造新特征相關(guān)性分析列出和結(jié)果可能相關(guān)的特征后,就需要驗(yàn)證這些特征和結(jié)果到底是否相關(guān)因果性分析診斷性分析就是要找到事物的因果關(guān)系,即因果性分析所謂因果性,假設(shè)X是因,Y是果,則只要X出現(xiàn),必然會(huì)導(dǎo)致Y的發(fā)生當(dāng)前第23頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)相關(guān)性分析24二維散點(diǎn)圖若分析的僅是一個(gè)特征與結(jié)果的相關(guān)性,則可以通過(guò)畫二者的二維散點(diǎn)圖進(jìn)行分析,通過(guò)圖形描述,可以初步且直觀判斷二者的存在何種相關(guān)關(guān)系:正相關(guān)、負(fù)相關(guān)、無(wú)關(guān);如果相關(guān)的話,是線性相關(guān)還是非線性相關(guān)(拋物線、指數(shù)等)。左圖為不同性別年齡與身高關(guān)系的散點(diǎn)圖,可以看出在青少年時(shí)期,這二者是呈線性正相關(guān)的當(dāng)前第24頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)相關(guān)性分析25矩陣散點(diǎn)圖當(dāng)有多個(gè)特征與結(jié)果相關(guān)的情況時(shí)需要矩陣散點(diǎn)圖進(jìn)行分析。其實(shí)質(zhì)就是針對(duì)每一個(gè)特征與結(jié)果分別做二維散點(diǎn)圖,以分析其相關(guān)性。當(dāng)前第25頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)因果性分析26診斷性分析的隱含意思就是要找到事物的因果關(guān)系,即因果性分析所謂因果性,假設(shè)X是因,Y是果,則只要X出現(xiàn),必然會(huì)導(dǎo)致Y的發(fā)生當(dāng)前第26頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)PART04預(yù)測(cè)性數(shù)據(jù)分析預(yù)測(cè)性分析可以明確未來(lái)會(huì)發(fā)生什么。27當(dāng)前第27頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)預(yù)測(cè)性分析28預(yù)測(cè)性分析試圖基于歷史數(shù)據(jù)來(lái)預(yù)測(cè)未來(lái)的結(jié)果預(yù)測(cè)性分析的步驟:建立預(yù)測(cè)模型,模型評(píng)估和預(yù)測(cè)當(dāng)前第28頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)預(yù)測(cè)性分析第一步:建立模型29當(dāng)前第29頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)預(yù)測(cè)性分析第二步:用模型進(jìn)行預(yù)測(cè)30當(dāng)前第30頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)預(yù)測(cè)性分析的數(shù)據(jù)挖掘算法31回歸分析模型SVM神經(jīng)網(wǎng)絡(luò)當(dāng)前第31頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)預(yù)測(cè)性分析的數(shù)據(jù)挖掘算法32回歸分析模型一元回歸多元回歸非線性回歸線性回歸非線性回歸線性回歸兩個(gè)及兩個(gè)以上自變量一個(gè)自變量當(dāng)前第32頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)回歸分析的一般步驟33當(dāng)前第33頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)一元線性回歸分析示例34例1:已知工作年限與收入的額關(guān)系如下表所示。問(wèn)題:當(dāng)工作年限為10年時(shí),年收入是多少?問(wèn)題:當(dāng)工作年限為25年時(shí),年收入是多少?當(dāng)前第34頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)能夠用貨幣計(jì)量35由最小二乘法可得到對(duì)應(yīng)的一元線性回歸為:y=3.5*x+23.2當(dāng)前第35頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)一元線性回歸分析示例36問(wèn)題:當(dāng)工作年限為10年時(shí),年收入是多少?將工作年限10帶入一元線性回歸方程中,可預(yù)測(cè)出對(duì)應(yīng)的年收入為Y=3.5*10+23.2=58.2問(wèn)題:當(dāng)工作年限為25年時(shí),年收入是多少?將工作年限25帶入一元線性回歸方程中,可預(yù)測(cè)出對(duì)應(yīng)的年收入為Y=3.5*25+23.2=110.7。當(dāng)前第36頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)PART05處方式分析處方式分析給出問(wèn)題的解決方案和行動(dòng)建議。處方式分析回答的問(wèn)題是:為了解決這個(gè)問(wèn)題,我們?cè)撟鲂┦裁矗炕蛘哒f(shuō),為了達(dá)到某個(gè)目標(biāo),我們?cè)摮膫€(gè)方向努力?37當(dāng)前第37頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)處方式分析38處方式分析給出問(wèn)題的解決方案和行動(dòng)建議處方式分析回答的問(wèn)題是:為了解決這個(gè)問(wèn)題,應(yīng)該做些什么?或者說(shuō),為了達(dá)到某個(gè)目標(biāo),該朝哪個(gè)方向努力?當(dāng)前第38頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)處方式分析的步驟39首先,進(jìn)行描述性分析,通過(guò)描述性分析明確現(xiàn)狀和問(wèn)題,及業(yè)務(wù)人員和管理人員的需求,這樣才能做到有的放矢其次,進(jìn)行診斷性分析,尋找和當(dāng)前問(wèn)題相關(guān)的特征,并對(duì)其進(jìn)行建模最后,根據(jù)不同的業(yè)務(wù)場(chǎng)景和需求,給出具體的解決方案和行動(dòng)建議當(dāng)前第39頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)處方式分析的方法40預(yù)測(cè)性分析有些情況,僅使用診斷性分析和預(yù)測(cè)性分析的模型,即可以給出建議比如銀行可根據(jù)申請(qǐng)人的基本信息,包括學(xué)歷、收入、是否有車、是否有住房、存款金額、是否有違約記錄等,去建立模型預(yù)測(cè)其信用違約的風(fēng)險(xiǎn)有多大,進(jìn)而給出建議是否要給這個(gè)申請(qǐng)人發(fā)放信用卡,如果要發(fā)放,信用卡的額度又該是多少當(dāng)前第40頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)處方式分析的方法41仿真仿真就是通過(guò)建模模擬真實(shí)世界的系統(tǒng)或流程,并通過(guò)不同的輸入?yún)?shù)或條件查看其對(duì)結(jié)果的影響,據(jù)此制訂相應(yīng)決策主要是通過(guò)在電腦上做數(shù)學(xué)建模仿真,進(jìn)而根據(jù)仿真結(jié)果給出相應(yīng)的解決方案和行動(dòng)建議比如企業(yè)的成本支出和客戶服務(wù)水平是一個(gè)兩難問(wèn)題,往往成本的削減意味著客戶服務(wù)水平的下降,那如果說(shuō)企業(yè)要制訂年度成本削減目標(biāo),通過(guò)仿真發(fā)現(xiàn)成本降低5%,但是客戶服務(wù)水平僅下降1%,屬于可接受范圍,但是當(dāng)成本降低10%時(shí),客戶服務(wù)水平下降達(dá)6%,可能對(duì)公司的經(jīng)營(yíng)、商譽(yù)等產(chǎn)生重大影響,則此時(shí)成本降低5%是相對(duì)合適的,而10%就不是那么合適了。當(dāng)前第41頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)處方式分析的方法42最優(yōu)化最優(yōu)化是應(yīng)用數(shù)學(xué)的一個(gè)分支,主要指在一定限制條件下,選取某種研究方案使目標(biāo)達(dá)到最優(yōu)的一種方法最優(yōu)化問(wèn)題在當(dāng)今的軍事、工程、管理、商業(yè)等領(lǐng)域有著極其廣泛的應(yīng)用比如,企業(yè)都希望利潤(rùn)盡量高,那如何在現(xiàn)實(shí)的約束條件下,達(dá)到上述目標(biāo)就是一個(gè)普遍的最優(yōu)化問(wèn)題最優(yōu)化常用的方法為線性規(guī)劃、非線性規(guī)劃、凸優(yōu)化、整數(shù)規(guī)劃、網(wǎng)絡(luò)流優(yōu)化(物流、電網(wǎng)、通訊網(wǎng)絡(luò)應(yīng)用)等當(dāng)前第42頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)處方式分析的其他特點(diǎn)43處方式分析除了會(huì)給出行動(dòng)建議外,另一大特點(diǎn)就是需要有一個(gè)反饋系統(tǒng)可以收集采取相應(yīng)行動(dòng)后的結(jié)果數(shù)據(jù),以驗(yàn)證行動(dòng)建議的有效性,若效果不佳,則需要調(diào)整,給出新的可行性建議,這個(gè)過(guò)程會(huì)不斷循環(huán)迭代,直至達(dá)到預(yù)期目標(biāo)一個(gè)優(yōu)秀的處方式數(shù)據(jù)分析系統(tǒng),迭代過(guò)程應(yīng)該是無(wú)須人工干預(yù)、智能自動(dòng)完成的,這也是目前機(jī)器學(xué)習(xí)和人工智能方法的最大優(yōu)勢(shì)處方式分析是數(shù)據(jù)分析方法的最高階形態(tài),也是在商業(yè)環(huán)境中對(duì)企業(yè)最有用、產(chǎn)生價(jià)值最大的方法當(dāng)前第43頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)PART06數(shù)據(jù)分析示例44前面已經(jīng)詳細(xì)介紹了商業(yè)數(shù)據(jù)分析的四個(gè)層次,本節(jié)將通過(guò)一個(gè)示例將這四個(gè)層次串聯(lián)起來(lái)。當(dāng)前第44頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)示例背景45PAS是一家銷售企業(yè)管理軟件的公司,雖然整個(gè)行業(yè)欣欣向榮,但是這家公司的業(yè)務(wù)卻陷入泥沼,銷售額連續(xù)八個(gè)季度出現(xiàn)下滑。為了扭轉(zhuǎn)此局面,希望能通過(guò)數(shù)據(jù)分析的方法提供有力支撐PAS公司的業(yè)務(wù)現(xiàn)狀和數(shù)據(jù)情況PAS公司上線了CRM、ERP、HR等系統(tǒng),針對(duì)商機(jī)、合同、付款、客戶、價(jià)格、銷售員的入職時(shí)間、接受過(guò)的培訓(xùn)等信息都是有詳細(xì)記錄當(dāng)前第45頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)描述性分析46在做描述性分析時(shí),最重要的是結(jié)構(gòu)化思維,即要把分析的問(wèn)題或指標(biāo)進(jìn)行逐層結(jié)構(gòu)化分解,直到無(wú)法分解為止總體銷售收入=銷售漏斗中所有銷售機(jī)會(huì)的數(shù)量*每個(gè)銷售機(jī)會(huì)的交易金額*勝率每個(gè)銷售機(jī)會(huì)的交易金額=每個(gè)銷售機(jī)會(huì)包含的產(chǎn)品*每個(gè)產(chǎn)品包含的模塊數(shù)量*每個(gè)模塊的平均單價(jià)首先對(duì)去年銷售員整體的業(yè)績(jī)情況做了分析:總體銷售指標(biāo)為1億2000萬(wàn),已簽單1個(gè)億,指標(biāo)達(dá)成了83%,目前有100個(gè)銷售員,平均每個(gè)銷售員的簽單金額為100萬(wàn),這樣看起來(lái)貌似還不錯(cuò)。但是再看下一項(xiàng)數(shù)據(jù)就會(huì)發(fā)現(xiàn)比較大的問(wèn)題,僅有20%的銷售員完成了銷售指標(biāo)。當(dāng)前第46頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)對(duì)計(jì)算智能的新認(rèn)識(shí)47首先對(duì)去年銷售員整體的業(yè)績(jī)情況做了分析總體銷售指標(biāo)為1億2000萬(wàn),已簽單1個(gè)億,指標(biāo)達(dá)成了83%,目前有100個(gè)銷售員,平均每個(gè)銷售員的簽單金額為100萬(wàn),這樣看起來(lái)貌似還不錯(cuò)。但是再看下一項(xiàng)數(shù)據(jù)就會(huì)發(fā)現(xiàn)比較大的問(wèn)題,僅有20%的銷售員完成了銷售指標(biāo)。當(dāng)前第47頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)描述性分析48通過(guò)查看去年銷售員簽單金額分布,這個(gè)問(wèn)題體現(xiàn)的更明顯。銷售業(yè)績(jī)主要是靠幾個(gè)明星銷售員來(lái)達(dá)成的。當(dāng)前第48頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)描述性分析49再看去年整體銷售漏斗的表現(xiàn),整體銷售漏斗金額高達(dá)5億,而每個(gè)銷售員平均的漏斗金額有500萬(wàn),但是平均簽單金額僅有100萬(wàn),也就是說(shuō)勝率僅為20%;另外,去年已完結(jié)的交易數(shù)量為1000,而銷售員平均完成交易數(shù)量?jī)H為10個(gè),數(shù)量偏少;同樣,平均的交易金額僅為10萬(wàn),平均客戶價(jià)值僅為20萬(wàn),在企業(yè)管理軟件行業(yè),這兩個(gè)數(shù)字都是偏小的。當(dāng)前第49頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)描述性分析50接著分析新老客戶平均交易金額及勝率,可以看出新客戶雖然單子大,但是贏單的概率較低;反之,老客戶雖然單子小,但是勝率很高。當(dāng)前第50頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)描述性分析51再看新老客戶對(duì)收入的貢獻(xiàn),可以看到老客戶雖然平均交易金額較小,但是對(duì)整體收入的貢獻(xiàn)還是遠(yuǎn)遠(yuǎn)高于新客戶的。當(dāng)前第51頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)描述性分析52再看交易金額分布及其勝率,可以看出單子金額越大,勝率越低。當(dāng)前第52頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)描述性分析53再看不同產(chǎn)品的收入分布和勝率,A、B、C這三種產(chǎn)品收入貢獻(xiàn)較高,并且勝率也相對(duì)較高,證明在產(chǎn)品、價(jià)格等方面在市場(chǎng)上有較明顯的競(jìng)爭(zhēng)優(yōu)勢(shì),可以重點(diǎn)突破。當(dāng)前第53頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)診斷性分析54經(jīng)過(guò)初步的描述性分析,對(duì)現(xiàn)有CRM、ERP、HR、售后、市場(chǎng)等5大系統(tǒng)或數(shù)據(jù)源中的數(shù)據(jù)做了梳理,共137個(gè)變量或KPI。如此之多的變量想通過(guò)傳統(tǒng)的數(shù)據(jù)分析方法分析是很困難的(如通過(guò)散點(diǎn)圖分析這些變量與銷售業(yè)績(jī)的相關(guān)性),只能使用機(jī)器學(xué)習(xí)的技術(shù);通過(guò)此項(xiàng)技術(shù),可計(jì)算出不同變量(機(jī)器學(xué)習(xí)稱為特征)對(duì)結(jié)果值(即銷售業(yè)績(jī))的影響到底有多大。當(dāng)前第54頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)診斷性分析55根據(jù)去年銷售員業(yè)績(jī)達(dá)成率分布把銷售業(yè)績(jī)分為三類:平庸,中等和優(yōu)秀;其中平庸為業(yè)績(jī)完成不到50%的;中等為業(yè)績(jī)完成50%-99%的;優(yōu)秀為業(yè)績(jī)完成100%的。當(dāng)前第55頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)診斷性分析56優(yōu)秀組和平庸組在12個(gè)關(guān)鍵KPI的差異:對(duì)業(yè)績(jī)影響最大的變量為銷售員銷售的產(chǎn)品種類:業(yè)績(jī)優(yōu)秀的銷售員,是所有產(chǎn)品都銷售的;而業(yè)績(jī)平庸的銷售員,則只銷售自己熟悉的產(chǎn)品;其次,業(yè)績(jī)優(yōu)秀的銷售員,和合作伙伴的關(guān)系很緊密,銷售線索可能來(lái)自于合作伙伴,甚至合同都是與合作伙伴聯(lián)合與客戶簽訂;而業(yè)績(jī)平庸的銷售員,只依賴于公司內(nèi)部市場(chǎng)部提供的銷售線索;第三重要的是平均合同金額。業(yè)績(jī)優(yōu)秀的銷售員合同金額是平庸的銷售員的2倍多;而較大的合同金額通常是因?yàn)槊總€(gè)合同銷售的產(chǎn)品更多;第四重要的是銷售漏斗金額與銷售指標(biāo)的比率。業(yè)績(jī)優(yōu)秀的銷售員會(huì)在全年保持穩(wěn)定的銷售機(jī)會(huì)創(chuàng)造率,其每月創(chuàng)造的銷售漏斗金額是平庸銷售員的3倍。當(dāng)前第56頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)預(yù)測(cè)性分析57再細(xì)致分析不同銷售人員的12個(gè)變量表現(xiàn):可以看出,尺有所短,寸有所長(zhǎng)。比如,85號(hào)銷售員看起來(lái)大部分變量都處于平均水平或之下,但是其也有閃光點(diǎn),這些人里只有他每季度創(chuàng)造的銷售機(jī)會(huì)超過(guò)平均水平,那其他人就可以向他學(xué)習(xí)如何提升這一點(diǎn)。雖然可看出不同銷售員在單個(gè)變量的表現(xiàn),但是很難據(jù)此直接判斷出其未來(lái)是否能完成業(yè)績(jī)指標(biāo)。如果可以做到這點(diǎn),就可以把可能不達(dá)標(biāo)的人提前找出來(lái),進(jìn)而給予其必要的幫助。因此需要使用預(yù)測(cè)性分析,通過(guò)建立預(yù)測(cè)性模型,根據(jù)其關(guān)鍵KPI的表現(xiàn)情況,即可以預(yù)測(cè)其業(yè)績(jī)達(dá)標(biāo)情況。小白根據(jù)歷史數(shù)據(jù)訓(xùn)練出的預(yù)測(cè)模型,預(yù)測(cè)的準(zhǔn)確率已經(jīng)達(dá)到了95%。當(dāng)前第57頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)處方式分析58預(yù)測(cè)模型完成后,即開始發(fā)揮作用。根據(jù)模型預(yù)測(cè),剛?cè)肼氁荒甑匿N售員很難完成今年的業(yè)績(jī)指標(biāo)。雖然其很努力,每月創(chuàng)造的銷售機(jī)會(huì)比均值高不少,銷售漏斗金額與銷售指標(biāo)的比率也OK,但是在部分關(guān)鍵指標(biāo)表現(xiàn)不佳:對(duì)銷售業(yè)績(jī)影響最大的因素合同的平均金額,目前均值是180K,但是其只有25K。他不怎么和合作伙伴一起合作,公司平均60%的合同是和合作伙伴一起打單打下來(lái)的,而他的比率是0;而有合作伙伴參與的訂單金額是沒有合作伙伴參與的訂單金額的6倍,勝率也更高。當(dāng)前第58頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)處方式分析59根據(jù)數(shù)據(jù)分析的結(jié)果,建議該員工著重提升合同的金額,并給出了以下改進(jìn)措施:首先,小王需要更積極地聯(lián)系合作伙伴,主管給到小王負(fù)責(zé)區(qū)域的合作伙伴名單,以及以往公司與每個(gè)伙伴簽署的平均金額其次,建議小王要提升捆綁銷售軟件的數(shù)量,公司平均有40%的軟件都是捆綁銷售出去的;主管給了小王捆綁銷售占比較高的產(chǎn)品清單,以及在與合作伙伴和捆綁銷售做的好的同事名單,要求小王找他們多溝通,看他們是如何做到的。當(dāng)前第59頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)結(jié)果60經(jīng)過(guò)一年的時(shí)間,PAS公司的業(yè)績(jī)得到了明顯的提升。當(dāng)前第60頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)結(jié)果61當(dāng)前第61頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)PART07大數(shù)據(jù)預(yù)測(cè)的特征62在互聯(lián)網(wǎng)之前便已經(jīng)有基于大數(shù)據(jù)的預(yù)測(cè)分析了:天氣預(yù)報(bào)。因?yàn)榛ヂ?lián)網(wǎng),天氣預(yù)報(bào)為代表的大數(shù)據(jù)預(yù)測(cè)的以下幾個(gè)特征在更多領(lǐng)域得到體現(xiàn)。當(dāng)前第62頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)大數(shù)據(jù)預(yù)測(cè)的四大特征63在互聯(lián)網(wǎng)之前便已經(jīng)有基于大數(shù)據(jù)的預(yù)測(cè)分析了:天氣預(yù)報(bào)。因?yàn)榛ヂ?lián)網(wǎng),天氣預(yù)報(bào)為代表的大數(shù)據(jù)預(yù)測(cè)的以下幾個(gè)特征在更多領(lǐng)域得到體現(xiàn)。大數(shù)據(jù)預(yù)測(cè)的時(shí)效性大數(shù)據(jù)預(yù)測(cè)的數(shù)據(jù)源大數(shù)據(jù)預(yù)測(cè)的動(dòng)態(tài)性大數(shù)據(jù)預(yù)測(cè)的規(guī)律性當(dāng)前第63頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)大數(shù)據(jù)預(yù)測(cè)的四大特征64大數(shù)據(jù)預(yù)測(cè)的時(shí)效性天氣預(yù)報(bào)粒度從天縮短到小時(shí),有嚴(yán)苛的時(shí)效要求,基于海量數(shù)據(jù)通過(guò)傳統(tǒng)方式進(jìn)行計(jì)算,得出結(jié)論時(shí)明天早已到來(lái),預(yù)測(cè)并無(wú)價(jià)值。其他領(lǐng)域的大數(shù)據(jù)預(yù)測(cè)應(yīng)用特征對(duì)“時(shí)效性”有更高要求。譬如股市、實(shí)時(shí)定價(jià),而云計(jì)算、分布式計(jì)算和超級(jí)計(jì)算機(jī)的發(fā)展則提供了這樣的高速計(jì)算能力。當(dāng)前第64頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)大數(shù)據(jù)預(yù)測(cè)的四大特征65大數(shù)據(jù)預(yù)測(cè)的時(shí)效性大數(shù)據(jù)預(yù)測(cè)的數(shù)據(jù)源天氣預(yù)報(bào)需要收集海量氣象數(shù)據(jù),氣象衛(wèi)星、氣象站臺(tái)負(fù)責(zé)收集,但整套系統(tǒng)的部署和運(yùn)維耗資巨大。在互聯(lián)網(wǎng)之前鮮有領(lǐng)域具備這樣的數(shù)據(jù)收集能力。WEB1.0為中心化信息產(chǎn)生、WEB2.0為社會(huì)化創(chuàng)造、移動(dòng)互聯(lián)網(wǎng)則是隨時(shí)隨地、社會(huì)化和多設(shè)備的數(shù)據(jù)上傳,每一次演化數(shù)據(jù)收集的成本都大幅降低,范圍和規(guī)模則大幅擴(kuò)大。大數(shù)據(jù)被引爆的同時(shí),大數(shù)據(jù)預(yù)測(cè)所需數(shù)據(jù)源不再是問(wèn)題。當(dāng)前第65頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)大數(shù)據(jù)預(yù)測(cè)的四大特征66大數(shù)據(jù)預(yù)測(cè)的動(dòng)態(tài)性不同時(shí)點(diǎn)的計(jì)算因子動(dòng)態(tài)變化,任何變量都會(huì)引發(fā)整個(gè)系統(tǒng)變化,甚至產(chǎn)生蝴蝶效應(yīng)。如果某個(gè)變量對(duì)結(jié)果起決定性作用且難以捕捉,預(yù)測(cè)難上加難,譬如人為因素。大數(shù)據(jù)預(yù)測(cè)的應(yīng)用場(chǎng)景大都是極不穩(wěn)定的領(lǐng)域但有固定規(guī)律。如:天氣、股市、疾病。這需要預(yù)測(cè)系統(tǒng)對(duì)每一個(gè)變量數(shù)據(jù)的精準(zhǔn)捕捉,并接近實(shí)時(shí)地調(diào)整預(yù)測(cè)。發(fā)達(dá)的傳感器網(wǎng)絡(luò)外加大數(shù)據(jù)計(jì)算能力讓上述兩點(diǎn)更加容易。當(dāng)前第66頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)大數(shù)據(jù)預(yù)測(cè)的四大特征67大數(shù)據(jù)預(yù)測(cè)的規(guī)律性大數(shù)據(jù)預(yù)測(cè)與傳統(tǒng)的基于抽樣的預(yù)測(cè)不同之處在于,其基于海量歷史數(shù)據(jù)和實(shí)時(shí)動(dòng)態(tài)數(shù)據(jù),發(fā)現(xiàn)數(shù)據(jù)與結(jié)果之間的規(guī)律,并假設(shè)此規(guī)律會(huì)延續(xù),捕捉到變量之后進(jìn)行預(yù)測(cè)。一個(gè)領(lǐng)域本身便有相對(duì)穩(wěn)定的規(guī)律,大數(shù)據(jù)預(yù)測(cè)才有機(jī)會(huì)得到應(yīng)用。古人夜觀天象就說(shuō)明天氣是由規(guī)律可循的,因此氣象預(yù)報(bào)最早得到應(yīng)用。反面案例則是規(guī)律難以捉摸,數(shù)據(jù)源收集困難的地震預(yù)測(cè),還有雙色球彩票。當(dāng)前第67頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)大數(shù)據(jù)預(yù)測(cè)的典型應(yīng)用領(lǐng)域68互聯(lián)網(wǎng)給大數(shù)據(jù)預(yù)測(cè)應(yīng)用的普及帶來(lái)了便利條件。天氣預(yù)報(bào)之外,以下10個(gè)領(lǐng)域是最有機(jī)會(huì)的大數(shù)據(jù)預(yù)測(cè)應(yīng)用領(lǐng)域。體育賽事預(yù)測(cè)股票市場(chǎng)預(yù)測(cè)市場(chǎng)物價(jià)預(yù)測(cè)用戶行為預(yù)測(cè)人體健康預(yù)測(cè)疾病疫情預(yù)測(cè)災(zāi)害災(zāi)難預(yù)測(cè)環(huán)境變遷預(yù)測(cè)交通行為預(yù)測(cè)能源消耗預(yù)測(cè)當(dāng)前第68頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)PART08大數(shù)據(jù)的其他功能應(yīng)用領(lǐng)域69數(shù)據(jù)除了第一次被使用時(shí)提供的價(jià)值以外還具有的無(wú)窮無(wú)盡的“剩余價(jià)值”可以被利用,通過(guò)借助一些具體的應(yīng)用模式和場(chǎng)景就能得到集中體現(xiàn)。當(dāng)前第69頁(yè)\共有75頁(yè)\編于星期四\22點(diǎn)大數(shù)據(jù)的其他功能應(yīng)用領(lǐng)域70大數(shù)據(jù)幫助企業(yè)挖掘市場(chǎng)機(jī)會(huì)探尋細(xì)分市場(chǎng)大數(shù)據(jù)提高決策能力大數(shù)據(jù)創(chuàng)新企業(yè)管理模式,挖掘管理潛力大數(shù)據(jù)變革

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論