版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)據(jù)分析方法論2.1基本方法&2.2高級(jí)方法1對(duì)比法23CONTENTS拆分法排序法4分組法6降維法7增維法8指標(biāo)法9圖形法5交叉法10SWOT分析法11描述性統(tǒng)計(jì)法12數(shù)據(jù)標(biāo)準(zhǔn)化(指數(shù)化)基本方法數(shù)據(jù)分析有法可循,在分析數(shù)據(jù)時(shí)使用分析方法可以快速有效地分析數(shù)據(jù),從數(shù)據(jù)中獲取信息。常用的基本方法有對(duì)比法、拆分法、排序法、分組法、交叉法、降維法、增維法、指標(biāo)法和圖形法。根據(jù)業(yè)務(wù)場(chǎng)景選擇一種或一種以上的分析方法可以讓分析更加高效。各基本方法的使用場(chǎng)景如表所示。分析方法使用場(chǎng)景對(duì)比法發(fā)現(xiàn)問(wèn)題拆分法尋找問(wèn)題的原因排序法找到分析的重點(diǎn)分組法洞察事物特征交叉法將兩個(gè)及以上的維度進(jìn)行比較,并通過(guò)交叉的方式分析數(shù)據(jù)降維法解決復(fù)雜問(wèn)題增維法解決信息量過(guò)少的問(wèn)題指標(biāo)法基本方法,可支持多字段圖形法基本方法,對(duì)分析字段有數(shù)量限制對(duì)比法PARTONE對(duì)比法是最基本的分析方法也是數(shù)據(jù)分析的“先鋒軍”,分析師在開(kāi)展分析時(shí)首先使用對(duì)比法,可以快速發(fā)現(xiàn)問(wèn)題。進(jìn)行商業(yè)分析時(shí)有三個(gè)必備的維度,分別是過(guò)去的自己、同期的對(duì)手和同期的行業(yè),通過(guò)這三個(gè)維度的對(duì)比可以了解數(shù)據(jù)意義,否則數(shù)據(jù)就是一座孤島。對(duì)比法分為橫向和縱向兩個(gè)方向。橫向?qū)Ρ仁侵缚缇S度的對(duì)比,用于分析不同事物的差異,比如在分析企業(yè)銷(xiāo)售業(yè)績(jī)的時(shí)候,將不同行業(yè)的企業(yè)銷(xiāo)售業(yè)績(jī)一起進(jìn)行對(duì)比,這樣可以知道某家企業(yè)在整個(gè)市場(chǎng)的地位。如我國(guó)500強(qiáng)企業(yè)排行榜單,就是將不同行業(yè)的企業(yè)產(chǎn)值進(jìn)行對(duì)比??v向?qū)Ρ仁侵冈谕粋€(gè)維度不同階段的對(duì)比,比如基于時(shí)間維度,將今天的銷(xiāo)售業(yè)績(jī)和昨天、上個(gè)星期同一天進(jìn)行對(duì)比,可以知道今天銷(xiāo)售業(yè)績(jī)的情況。例:小李是某網(wǎng)店運(yùn)營(yíng),剛接手一家新網(wǎng)店,欲確定該店鋪的主營(yíng)品類(lèi),已知該店鋪經(jīng)營(yíng)A、B、C、D四個(gè)品類(lèi),各品類(lèi)銷(xiāo)售數(shù)據(jù)如右表所示。解:將表轉(zhuǎn)變成柱形圖,如右表所示,通過(guò)對(duì)比A、B、C、D四個(gè)品類(lèi)銷(xiāo)售額的最大值,要做市場(chǎng)規(guī)模則選擇銷(xiāo)售額高的品類(lèi),要便于生存則選擇銷(xiāo)售額低的品類(lèi)。A品類(lèi)B品類(lèi)C品類(lèi)D品類(lèi)1580萬(wàn)元780萬(wàn)元605萬(wàn)元1685萬(wàn)元各品類(lèi)的銷(xiāo)售額拆分法PARTTWO拆分法拆分法是最常用的分析方法之一,在許多領(lǐng)域應(yīng)用非常廣泛,杜邦分析法就是拆分法的經(jīng)典應(yīng)用。拆分法是將某個(gè)問(wèn)題拆解成若干個(gè)子問(wèn)題,通過(guò)研究該若干子問(wèn)題從而找到問(wèn)題的癥結(jié)點(diǎn)并解決問(wèn)題。比如在研究銷(xiāo)售業(yè)績(jī)下降問(wèn)題時(shí),可以將銷(xiāo)售業(yè)績(jī)問(wèn)題拆分成轉(zhuǎn)化率、客單價(jià)和訪客數(shù)這三個(gè)子問(wèn)題,通過(guò)分析這三個(gè)子問(wèn)題從而解決銷(xiāo)售業(yè)績(jī)問(wèn)題。解:如圖所示,銷(xiāo)售額下降的問(wèn)題可拆分成三個(gè)子問(wèn)題,分別是訪客數(shù)、轉(zhuǎn)化率和客單價(jià)的變化,對(duì)上表的數(shù)據(jù)運(yùn)用對(duì)比法發(fā)現(xiàn)主要是訪客數(shù)的變化引起的銷(xiāo)售額大幅下降??稍龠M(jìn)一步拆分訪客數(shù),訪客數(shù)可分為付費(fèi)訪客數(shù)和免費(fèi)訪客數(shù),對(duì)問(wèn)題的原因進(jìn)行進(jìn)一步剖析,直到找到問(wèn)題的根源。拆分法可分為完全拆分法和重點(diǎn)拆分法。完全拆分法,也稱(chēng)為等額拆分法,是將父問(wèn)題100%進(jìn)行拆解,拆解出來(lái)的子問(wèn)題的和或者集合(算法)可100%解釋父問(wèn)題。如銷(xiāo)售額=訪客數(shù)×轉(zhuǎn)化率×客單價(jià),等式兩邊完全相等。重點(diǎn)拆分法,也稱(chēng)為非等額拆分法。只拆分出問(wèn)題的重點(diǎn),子問(wèn)題只解釋了父問(wèn)題的80%左右。如做好網(wǎng)店=點(diǎn)擊率+轉(zhuǎn)化率+退款率,確實(shí)要做好一家網(wǎng)店只要做好點(diǎn)擊率、轉(zhuǎn)化率和退款率這三個(gè)指標(biāo)就夠了,但做網(wǎng)店運(yùn)營(yíng)不完全是這三個(gè)環(huán)節(jié)。抓住重要環(huán)節(jié),有時(shí)面對(duì)一些復(fù)雜的問(wèn)題,就需要采用重點(diǎn)拆分法。日期訪客數(shù)轉(zhuǎn)化率客單價(jià)銷(xiāo)售額周一10003.5%1003500昨日20003.4%1006800上周一25003.5%1008750例:某網(wǎng)店的銷(xiāo)售額大幅下降,店鋪核心數(shù)據(jù)如表所示,運(yùn)營(yíng)欲找出銷(xiāo)售額下降的原因排序法PARTTHREE排序法排序法是基于某一個(gè)指標(biāo)或度量值的大小,將觀測(cè)值進(jìn)行遞增或遞減排列,每一次排列只能基于某一個(gè)指標(biāo)。排序法是從對(duì)比法中衍生的一種常用方法,百度搜索風(fēng)云榜、阿里排行榜等業(yè)內(nèi)知名榜單就是重采用排序法的產(chǎn)品,通過(guò)查看排序后的榜單,用戶可以快速獲取目標(biāo)價(jià)值信息。例:某運(yùn)營(yíng)收集了數(shù)個(gè)品類(lèi)的數(shù)據(jù),如表所示,欲通過(guò)排序法列出品類(lèi)榜單品類(lèi)交易指數(shù)在線產(chǎn)品數(shù)(個(gè))T恤2017855135570連衣裙4355121868084褲子2266441053642襯衫1959211556930表1未排序的品類(lèi)行業(yè)數(shù)據(jù)解:排序法只能基于某一個(gè)度量進(jìn)行排序,表1中有兩個(gè)度量,因此可以做出兩個(gè)表單。表2為基于交易指數(shù)的榜單,排名越靠前代表該品類(lèi)的市場(chǎng)規(guī)模越大。排名品類(lèi)交易指數(shù)在線產(chǎn)品數(shù)(個(gè))1連衣裙43551218680842褲子22664410536423T恤20178551355704襯衫1959211556930表3為基于產(chǎn)品數(shù)的榜單,排名越靠前代表該品類(lèi)的市場(chǎng)競(jìng)爭(zhēng)越大。排名品類(lèi)交易指數(shù)在線產(chǎn)品數(shù)(個(gè))1T恤20178551355702褲子22664410536423連衣裙43551218680844襯衫1959211556930分組法PARTFOUR分組法來(lái)源于統(tǒng)計(jì)學(xué),用于發(fā)現(xiàn)事物的特征,是非常重要的分析方法。分析時(shí)可以按類(lèi)型、結(jié)構(gòu)、時(shí)間階段等維度進(jìn)行分組,觀察分組后的數(shù)據(jù)特征,從特征中洞察信息。例:基于下表的信息,分析褲子和職業(yè)套裝的差異父類(lèi)目子類(lèi)目銷(xiāo)售額(元)褲子休閑褲747991311褲子打底褲89942330褲子西裝褲/正裝褲4952899褲子棉褲/羽絨褲1800685職業(yè)套裝休閑套裝216517887職業(yè)套裝職業(yè)女裙套裝24072258職業(yè)套裝醫(yī)護(hù)制服1649589職業(yè)套裝其他套裝5952780解:基于題目可以得知需要對(duì)父類(lèi)目進(jìn)行統(tǒng)計(jì)分組。分組結(jié)果如下表所示父類(lèi)目銷(xiāo)售額(元)褲子844687225職業(yè)套裝248192514通過(guò)觀察分組結(jié)果可知褲子的市場(chǎng)份額遠(yuǎn)大于職業(yè)套裝的市場(chǎng)份額交叉法PARTFIVE交叉法是對(duì)比法和拆分法的結(jié)合,將有一定關(guān)聯(lián)的兩個(gè)或兩個(gè)以上的維度和度量值排列在統(tǒng)計(jì)表內(nèi)進(jìn)行對(duì)比分析,在小于等于三維的情況下可以靈活使用圖表進(jìn)行展示。當(dāng)維度大于三維時(shí)選用統(tǒng)計(jì)表展示,此時(shí)也稱(chēng)之多維分析法。比如在研究市場(chǎng)定價(jià)時(shí),經(jīng)常將產(chǎn)品特征和定價(jià)作為維度,銷(xiāo)售額作為指標(biāo)進(jìn)行分析。例:下表所示是不同性別的消費(fèi)者在不同品類(lèi)上的消費(fèi)金額數(shù)據(jù),利用交叉法分析不同性別的差異。性別品類(lèi)消費(fèi)金額(元)男零食68男耳機(jī)180女零食155女耳機(jī)42解:將左表轉(zhuǎn)變成二維交叉表,如表2-10所示,可以直觀地觀察到男性和女性用戶在消費(fèi)偏好上的差異,男性更愿意在耳機(jī)上消費(fèi),女性則更愿意在零食上消費(fèi)。性別
品類(lèi)零食耳機(jī)男68180女15542降維法PARTSIX降維法是在數(shù)據(jù)集指標(biāo)過(guò)多及分析干擾因素太多時(shí),通過(guò)找到并分析核心指標(biāo)提高分析精度,或者通過(guò)主成分分析、因子分析等統(tǒng)計(jì)學(xué)方法將數(shù)據(jù)由高維轉(zhuǎn)換成低維的方法。比如在分析店鋪數(shù)據(jù)時(shí),根據(jù)業(yè)務(wù)問(wèn)題的核心提取主要的2~4個(gè)核心指標(biāo)進(jìn)行分析。例:根據(jù)下表的數(shù)據(jù)指標(biāo)字段評(píng)估店鋪的綜合情況。轉(zhuǎn)化率銷(xiāo)售額客單價(jià)訪客數(shù)動(dòng)銷(xiāo)率連帶率好評(píng)率糾紛率上新率解:對(duì)數(shù)據(jù)指標(biāo)字段進(jìn)行分類(lèi),將店鋪的評(píng)估分成產(chǎn)品運(yùn)營(yíng)能力、店鋪獲客能力和店鋪服務(wù)能力。動(dòng)銷(xiāo)率連帶率上新率反映店鋪產(chǎn)品運(yùn)營(yíng)能力的指標(biāo)如下表所示反映店鋪獲客能力的指標(biāo)如下表所示轉(zhuǎn)化率銷(xiāo)售額客單價(jià)訪客數(shù)反映店鋪服務(wù)能力的指標(biāo)如下表所示好評(píng)率糾紛率基于各能力維度下的指標(biāo),綜合評(píng)估各能力的分?jǐn)?shù)??墒褂脭?shù)據(jù)歸一化的方法或者熵值法計(jì)算分?jǐn)?shù),達(dá)到綜合評(píng)估的目的。1.數(shù)據(jù)歸一化是將數(shù)據(jù)映射到[0,1]的區(qū)間,在2.2.3小節(jié)中詳細(xì)介紹。2.熵值法的核心思想是用信息的無(wú)序度來(lái)衡量信息的效用值。信息的無(wú)序度越低(越不穩(wěn)定)增維法Theusercandemonstrateonaprojectororcomputer,orprintthepresentationandmakeitintoafilmtobeusedinawiderfieldPARTSEVEN增維法是在數(shù)據(jù)集的字段過(guò)少或信息量不足時(shí),為了便于分析師分析,通過(guò)計(jì)算衍生出更加直觀的指標(biāo)。比如在分析關(guān)鍵詞時(shí),將搜索人氣除以商品數(shù)量得到的新指標(biāo),定義為關(guān)鍵詞的競(jìng)爭(zhēng)指數(shù)。例:如表所示,計(jì)算關(guān)鍵詞的競(jìng)爭(zhēng)度,公式如下:競(jìng)爭(zhēng)度=搜索人氣×點(diǎn)擊率×支付轉(zhuǎn)化率÷在線商品數(shù)基于業(yè)務(wù)經(jīng)驗(yàn),得到的指標(biāo)為正指標(biāo),數(shù)值越大越好關(guān)鍵詞搜索人氣點(diǎn)擊率在線商品數(shù)支付轉(zhuǎn)化率競(jìng)爭(zhēng)度永生花32914152.95%1651186.92%0.02永生花花瓣耳環(huán)11736132.03%31993.99%0.19永生花禮盒10274162.75%557748.55%0.03永生花DIY材料包9245222.64%41983.71%0.18永生花玻璃罩7977138.58%237186.89%0.03指標(biāo)法Theusercandemonstrateonaprojectororcomputer,orprintthepresentationandmakeitintoafilmtobeusedinawiderfieldPARTEIGHT指標(biāo)法是分析的基本方法之一,通過(guò)匯總值、平均值、標(biāo)準(zhǔn)差等一系列統(tǒng)計(jì)指標(biāo)研究分析數(shù)據(jù)。指標(biāo)法更適用于多維的數(shù)據(jù)。例:下表所示為淘寶搜索某關(guān)鍵詞按人氣排名前5的商品數(shù)據(jù),
通過(guò)指標(biāo)法描述這個(gè)數(shù)據(jù)。排名售價(jià)銷(xiāo)售額評(píng)價(jià)人數(shù)DSR_物流分DSR_描述分DSR_服務(wù)分16801156001514.614.744.7623680629280164.984.984.98321803727809024.954.954.964218037496023634.924.934.94521993804279584.954.974.95解:使用指標(biāo)法描述數(shù)據(jù)后的結(jié)果,如下表所示。
售價(jià)銷(xiāo)售額評(píng)價(jià)人數(shù)DSR_物流分DSR_描述分DSR_服務(wù)分計(jì)數(shù)555555缺失值000000平均值21843746098784.884.914.92匯總109191873047439024.4124.5724.59標(biāo)準(zhǔn)差9491624698350.140.090.08描述數(shù)據(jù)的相關(guān)度量圖形法Theusercandemonstrateonaprojectororcomputer,orprintthepresentationandmakeitintoafilmtobeusedinawiderfieldPARTNINE圖形法是分析的基本方法之一,通過(guò)柱形圖、折線圖、散點(diǎn)圖等一系列統(tǒng)計(jì)圖形直觀地分析數(shù)據(jù)。圖形法適用于低維的數(shù)據(jù)。例:下表所示為淘寶搜索某關(guān)鍵詞按人氣排名前220的商品數(shù)據(jù),通過(guò)圖形法分析相關(guān)售價(jià)的分布排名售價(jià)銷(xiāo)售額評(píng)價(jià)人數(shù)DSR_物流分DSR_描述分DSR_服務(wù)分16801156001514.614.744.7623680629280164.984.984.98321803727809024.954.954.96……………………………………220150547800332064.754.634.74某關(guān)鍵詞按人氣排名前220的商品數(shù)據(jù)解:下圖所示是基于售價(jià)分組后繪制的直方圖,可以直觀地觀察各個(gè)價(jià)格區(qū)間包含商品的個(gè)數(shù),商品售價(jià)分布主要集中在[118,588],[1058,1528]兩個(gè)區(qū)間。
圖形法有畫(huà)圖空間、圖形和圖注三個(gè)要素。畫(huà)圖空間是圖形的容器,圖形呈現(xiàn)在畫(huà)圖空間之中,如二維空間、三維空間。圖形是要表達(dá)信息的可視化結(jié)果,如線形、柱形。圖注是對(duì)圖形的標(biāo)注。如上圖所示,圖注包含圖標(biāo)題、數(shù)據(jù)標(biāo)簽、坐標(biāo)軸、坐標(biāo)軸標(biāo)題、圖例。圖1價(jià)格區(qū)間分布圖圖2圖形的圖注示例SWOT分析法Theusercandemonstrateonaprojectororcomputer,orprintthepresentationandmakeitintoafilmtobeusedinawiderfieldPARTTENSWOT分析法,即態(tài)勢(shì)分析法,來(lái)源于市場(chǎng)營(yíng)銷(xiāo)方法論,是首先將與研究對(duì)象密切相關(guān)的各種主要內(nèi)部?jī)?yōu)勢(shì)、劣勢(shì)和外部的機(jī)會(huì)和威脅等,通過(guò)調(diào)查列舉出來(lái),并依照矩陣形式排列,然后用系統(tǒng)分析的思想,把各種因素相互匹配起來(lái)加以分析,從中得出一系列相應(yīng)的結(jié)論,而結(jié)論通常帶有一定的決策性。SWOT分析法是常用的分析方法,有助于分析師了解企業(yè)當(dāng)前所處的內(nèi)外環(huán)境,可以讓分析師更準(zhǔn)確地通過(guò)數(shù)據(jù)做判斷。1.內(nèi)部因素分析
內(nèi)部因素由優(yōu)勢(shì)(Strengths)和劣勢(shì)(Weaknesses)組成,對(duì)企業(yè)內(nèi)部的管理、團(tuán)隊(duì)、產(chǎn)品和市場(chǎng)營(yíng)銷(xiāo)情況進(jìn)行分析,通過(guò)了解企業(yè)的內(nèi)部情況,分析師可以更好地解讀數(shù)據(jù)中蘊(yùn)藏的信息。例:如下表所示,對(duì)某電商公司的內(nèi)部因素進(jìn)行分析。優(yōu)勢(shì)(Strengths)劣勢(shì)(Weaknesses)1.店鋪開(kāi)發(fā)能力強(qiáng)2.服務(wù)消費(fèi)者的能力強(qiáng)3.能夠把控品質(zhì)4.公司的財(cái)務(wù)狀況非常好1.公司管理方面不是很完善2.庫(kù)存能力不強(qiáng),常斷貨3.公司內(nèi)部人員競(jìng)爭(zhēng)4.店鋪定位不明確5.開(kāi)發(fā)消費(fèi)者能力弱2.外部因素分析
外部因素由機(jī)會(huì)(Opportunities)和威脅(Threats)組成,對(duì)企業(yè)外部的環(huán)境、政策和競(jìng)爭(zhēng)對(duì)手進(jìn)行分析,通過(guò)了解企業(yè)的外部情況,分析師可以充分地了解企業(yè)的情況。例:如下表所示,對(duì)某電商公司的外部因素進(jìn)行分析。機(jī)會(huì)(Opportunities)威脅(Threats)1.市場(chǎng)標(biāo)桿很少,明確定位的店鋪很少2.市場(chǎng)需求大幅增長(zhǎng)3.普遍不重視用戶體驗(yàn)4.個(gè)性化1.競(jìng)爭(zhēng)2.同質(zhì)化嚴(yán)重3.盜圖4.大商家新入駐3.基于內(nèi)外因素的應(yīng)對(duì)策略
在充分了解企業(yè)的內(nèi)外部情況后,將內(nèi)部的優(yōu)勢(shì)、劣勢(shì)和外部的機(jī)會(huì)、威脅進(jìn)行交叉。當(dāng)企業(yè)的優(yōu)勢(shì)遇到機(jī)會(huì),應(yīng)當(dāng)采取發(fā)展的策略;當(dāng)企業(yè)的優(yōu)勢(shì)遇到威脅,應(yīng)當(dāng)采取拓展的策略;當(dāng)企業(yè)的劣勢(shì)遇到機(jī)會(huì),應(yīng)當(dāng)采取爭(zhēng)取的策略;當(dāng)企業(yè)的劣勢(shì)遇到威脅,應(yīng)當(dāng)采取保守的策略。例:如下表所示,根據(jù)某電商企業(yè)的內(nèi)外部因素進(jìn)行策略分析。
優(yōu)勢(shì)(Strengths)劣勢(shì)(Weaknesses)機(jī)會(huì)(Opportunities)SO(發(fā)展)WO(爭(zhēng)?。?.結(jié)合市場(chǎng)情況,在自身開(kāi)發(fā)能力的基礎(chǔ)上,找到明確的定位,增加消費(fèi)者黏性,提高復(fù)購(gòu)率2.提升消費(fèi)者體驗(yàn)3.開(kāi)發(fā)更多新品迎合市場(chǎng)需求1.提升管理能力,讓指令可以上行下達(dá)2.合理使用ERP軟件進(jìn)行管理,嚴(yán)格把控庫(kù)存?zhèn)}位3.設(shè)定良性競(jìng)爭(zhēng)機(jī)制4.精準(zhǔn)定位消費(fèi)者人群5.制訂推廣方案,吸引更多新消費(fèi)者威脅(Threats)ST(拓展)WT(保守)1.提升店鋪形象(口碑)2.開(kāi)發(fā)團(tuán)隊(duì)把控市場(chǎng)需求走向,規(guī)避同質(zhì)化3.結(jié)合公司的自主開(kāi)發(fā),提升公司版權(quán)保護(hù)意識(shí)4.精準(zhǔn)定位消費(fèi)者1.保持店鋪的獨(dú)特風(fēng)格,不被外界影響2.加強(qiáng)CRM管控描述性統(tǒng)計(jì)法Theusercandemonstrateonaprojectororcomputer,orprintthepresentationandmakeitintoafilmtobeusedinawiderfieldPARTELEVEN描述性統(tǒng)計(jì)法是運(yùn)用描述性統(tǒng)計(jì)指標(biāo)對(duì)數(shù)據(jù)集進(jìn)行研究,來(lái)源于統(tǒng)計(jì)學(xué)。在獲得數(shù)據(jù)集后,一般要對(duì)數(shù)據(jù)集進(jìn)行觀察,了解數(shù)據(jù)集的字段、數(shù)據(jù)分布等。當(dāng)數(shù)據(jù)指標(biāo)較少時(shí)可選用圖形法進(jìn)行直觀的觀察,數(shù)據(jù)指標(biāo)較多時(shí)無(wú)法使用,此時(shí)需使用描述性統(tǒng)計(jì)法。本節(jié)以淘寶網(wǎng)某關(guān)鍵詞排名前5的商品數(shù)據(jù)為數(shù)據(jù)集,利用Excel工具實(shí)現(xiàn)指標(biāo)計(jì)算。如圖所示,數(shù)據(jù)區(qū)域?yàn)锳1:G6。排名售價(jià)銷(xiāo)售額評(píng)價(jià)人數(shù)DSR_物流分DSR_描述分DSR_服務(wù)分16801156001514.614.744.7623680629280164.984.984.98321803727809024.954.954.964218037496023634.924.934.94521993804279584.954.974.95淘寶某關(guān)鍵詞排名前5的商品數(shù)據(jù)1.五數(shù)概括法
五數(shù)概括法是指用五個(gè)指標(biāo)反映數(shù)據(jù)集的分布情況,五個(gè)指標(biāo)分別是最小值、1/4位數(shù)(Q1)、中位數(shù)(Q2)、3/4位數(shù)(Q3)和最大值。(1)最小值指數(shù)據(jù)集中最小的一個(gè)值。計(jì)算方法:在Excel中鍵入“=MIN([array])”,其中[array]為要進(jìn)行計(jì)算的區(qū)域。例1:求上表中銷(xiāo)售額的最小值。解:在C7單元格中鍵入“=MIN(C2:C6)”,得到結(jié)果為:115600。(2)1/4位數(shù)指數(shù)據(jù)集中所有數(shù)值由小到大排列后第25%的數(shù)字。計(jì)算方法:在Excel中鍵入“=QUARTILE.INC([array],[quart])”,其中[array]為要進(jìn)行計(jì)
算的區(qū)域,[quart]為要計(jì)算的指標(biāo),[quart]為1表示計(jì)算1/4位數(shù)。例2:求上表中銷(xiāo)售額的1/4位數(shù)。解:在C8單元格中鍵入“=QUARTILE.INC(C2:C6,1)”,得到結(jié)果為:244190。(3)中位數(shù)指數(shù)據(jù)集中所有數(shù)值由小到大排列后第50%的數(shù)字。計(jì)算方法:在Excel中鍵入“=QUARTILE.INC([array],[quart])”,其中[array]為要進(jìn)行計(jì)算的區(qū)域,[quart]為要計(jì)算的指標(biāo),[quart]值為2表示計(jì)算中位數(shù)。例3:求前表中銷(xiāo)售額的中位數(shù)。解:在C9單元格中鍵入“=QUARTILE.INC(C2:C6,2)”,得到結(jié)果為:374960。(4)3/4位數(shù)指數(shù)據(jù)集中所有數(shù)值由小到大排列后第75%的數(shù)字。計(jì)算方法:在Excel中鍵入“=QUARTILE.INC([array],[quart])”,其中[array]為要進(jìn)行計(jì)算的區(qū)域,[quart]為要計(jì)算的指標(biāo),[quart]值為3表示計(jì)算3/4位數(shù)。例4:求前表中銷(xiāo)售額的3/4位數(shù)。解:在C10單元格中鍵入“=QUARTILE.INC(C2:C6,3)”,得到結(jié)果為:504853.5。(5)最大值指數(shù)據(jù)集中最大的一個(gè)值。計(jì)算方法:在Excel中鍵入“=MAX([array])”,其中[array]為要進(jìn)行計(jì)算的區(qū)域。例5:求前表中銷(xiāo)售額的最大值。解:在C11單元格中鍵入“=MAX(C2:C6)”,得到結(jié)果為:629280。五數(shù)概括法的計(jì)算結(jié)果如下表所示類(lèi)型計(jì)算結(jié)果最小值1156001/4位數(shù)244190中位數(shù)3749603/4位數(shù)504853.5最大值629280如下圖所示,將這5個(gè)數(shù)值繪制成箱線圖,可以直觀地看到數(shù)據(jù)集的分布情況。
在某些場(chǎng)景下,為了分析的可靠性,會(huì)從數(shù)據(jù)集中抽取分布在1/4位數(shù)~3/4位數(shù)的數(shù)據(jù)作為觀測(cè)值,也就是分別將兩端的數(shù)據(jù)過(guò)濾掉,避免極端情況的影響。例如在計(jì)算行業(yè)平均銷(xiāo)售件數(shù)時(shí),排除爆款群和銷(xiāo)量極低的產(chǎn)品,這樣計(jì)算出來(lái)的平均數(shù)更具有代表性,更接近于大多數(shù)的產(chǎn)品。
基于五數(shù)概括法繪制的箱線圖2.計(jì)數(shù)、匯總和平均值計(jì)數(shù)、匯總和平均值是最常用的描述性統(tǒng)計(jì)指標(biāo)。(1)計(jì)數(shù)計(jì)數(shù)(Count)亦稱(chēng)數(shù)數(shù),算術(shù)的基本概念之一,指數(shù)事物個(gè)數(shù)的過(guò)程。在統(tǒng)計(jì)指標(biāo)中計(jì)數(shù)是指統(tǒng)計(jì)數(shù)值或者觀測(cè)值的數(shù)量。計(jì)算方法:在Excel中鍵入“=COUNT([array])”,其中[array]表示要進(jìn)行計(jì)算的區(qū)域。例1:求右表中銷(xiāo)售額的計(jì)數(shù)。解:在C11單元格中鍵入“=COUNT(C2:C6)”,得到結(jié)果為:5。(2)匯總匯總是數(shù)據(jù)的求和。計(jì)算方法:在Excel中鍵入“=SUM([array])”,其中[array]表示要進(jìn)行計(jì)算的區(qū)域。例2:求右表中銷(xiāo)售額的總數(shù)。解:在C11單元格中鍵入“=SUM(C2:C6)”,得到結(jié)果為:1873047。(3)平均值平均值是指算術(shù)平均值,又稱(chēng)均值。計(jì)算方法:在Excel中鍵入“=AVERAGE([array])”,其中[array]表示要進(jìn)行計(jì)算的區(qū)域。例3:求右表中銷(xiāo)售額的平均值。解:在C11單元格中鍵入“=AVERAGE(C2:C6)”,得到結(jié)果為:374609.4。3.標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差是用于反映數(shù)據(jù)離散程度的指標(biāo)。標(biāo)準(zhǔn)差又分總體標(biāo)準(zhǔn)差和樣本標(biāo)準(zhǔn)差,當(dāng)數(shù)據(jù)是總體時(shí)采用總體標(biāo)準(zhǔn)差,如計(jì)算企業(yè)的所有產(chǎn)品的銷(xiāo)售額標(biāo)準(zhǔn)差,計(jì)算行業(yè)爆款的標(biāo)準(zhǔn)差則采用樣本標(biāo)準(zhǔn)差,如計(jì)算行業(yè)前10產(chǎn)品銷(xiāo)售額的標(biāo)準(zhǔn)差??傮w標(biāo)準(zhǔn)差計(jì)算方法:在Excel中鍵入“=STDEV.P([array])”,其中[array]代表要進(jìn)行計(jì)算的區(qū)域。樣本標(biāo)準(zhǔn)差計(jì)算方法:在Excel中鍵入“=STDEV.S([array])”,其中[array]代表要進(jìn)行計(jì)算的區(qū)域。例:求下表中銷(xiāo)售額的標(biāo)準(zhǔn)差。解:先明確何為總體,如果標(biāo)準(zhǔn)差是要反映表2-22中5個(gè)產(chǎn)品的標(biāo)準(zhǔn)差,那這5個(gè)產(chǎn)品就是總體;如果用此標(biāo)準(zhǔn)差反應(yīng)該品類(lèi)的標(biāo)準(zhǔn)差,此時(shí)該品類(lèi)的所有產(chǎn)品就是總體。本例求表中銷(xiāo)售額的標(biāo)準(zhǔn)差,不考慮整個(gè)品類(lèi),則用總體標(biāo)準(zhǔn)差,在C11單元格中鍵入“=STDEV.P(C2:C6)”,得到結(jié)果為:162468.6。4.變異系數(shù)變異系數(shù)和標(biāo)準(zhǔn)差一樣也是用于反映數(shù)據(jù)離散程度的指標(biāo),但不同的是變異系數(shù)不被數(shù)據(jù)量綱影響。公式為:變異系數(shù)=標(biāo)準(zhǔn)差/平均值例:求下表中銷(xiāo)售額的變異系數(shù)。解:在C11單元格中鍵入“=STDEV.P(C2:C6)/AVERAGE(C2:C6)”,得到結(jié)果為:0.433701。不同分組的變異系數(shù)可進(jìn)行對(duì)比,數(shù)值越大離散程度則越大。數(shù)據(jù)標(biāo)準(zhǔn)化(指數(shù)化)Theusercandemonstrateonaprojectororcomputer,orprintthepresentationandmakeitintoafilmtobeusedinawiderfieldPARTTWELVE在數(shù)據(jù)分析之前,通常需要先將數(shù)據(jù)標(biāo)準(zhǔn)化(Normalization),利用標(biāo)準(zhǔn)化后的數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,屬于數(shù)據(jù)清洗中的方法。數(shù)據(jù)標(biāo)準(zhǔn)化也就是統(tǒng)計(jì)數(shù)據(jù)的指數(shù)化。數(shù)據(jù)標(biāo)準(zhǔn)化處理主要包括數(shù)據(jù)同趨化處理和無(wú)量綱化處理兩個(gè)方面。數(shù)據(jù)同趨化處理主要解決不同性質(zhì)數(shù)據(jù)問(wèn)題,對(duì)不同性質(zhì)指標(biāo)直接加總不能正確反映不同作用力的綜合結(jié)果,須先考慮改變逆指標(biāo)數(shù)據(jù)性質(zhì),使所有指標(biāo)對(duì)測(cè)評(píng)方案的作用力同趨化,再加總才能得出正確結(jié)果。數(shù)據(jù)無(wú)量綱化處理主要解決數(shù)據(jù)的可比性。數(shù)據(jù)標(biāo)準(zhǔn)化的方法有很多種,常用的有“最小—最大(Min-Max)標(biāo)準(zhǔn)化”、“Z-score標(biāo)準(zhǔn)化”和“按小數(shù)定標(biāo)標(biāo)準(zhǔn)化”等。經(jīng)過(guò)上述標(biāo)準(zhǔn)化處理,原始數(shù)據(jù)均轉(zhuǎn)換為無(wú)量綱化指標(biāo)測(cè)評(píng)值,即各指標(biāo)值都處于同一個(gè)數(shù)量級(jí)別上,可以進(jìn)行綜合測(cè)評(píng)分析。1.Min-Max標(biāo)準(zhǔn)化Min-Max標(biāo)準(zhǔn)化方法是對(duì)原始數(shù)據(jù)進(jìn)行線性變換的方法。設(shè)MinA和MaxA分別為屬性A的最小值和最大值,將A的一個(gè)原始值x通過(guò)Min-Max標(biāo)準(zhǔn)化映射成在區(qū)間[0,1]中的值x',其公式為:新數(shù)據(jù)=(原數(shù)據(jù)-最小值)/(最大值-最小值)例:采用Min-Max標(biāo)準(zhǔn)化方法將下表的數(shù)據(jù)標(biāo)準(zhǔn)化。產(chǎn)品訪客數(shù)支付轉(zhuǎn)化率客單價(jià)A766312.92%40.92B615614.38%26.45C25623.44%238.65D24459.65%55.77E18814.94%106.69解:產(chǎn)品B的新訪客數(shù)映射到(6156-256)/(7663-256),其中,6156是產(chǎn)品B原訪客數(shù),256是訪客數(shù)中最小的值,7663是訪客數(shù)中最大的值。如下圖所示為Excel中的公式:=(B2-MIN(B$2:B$6))/(MAX(B$2:B$6)-MIN(B$2:B$6))其中,“$”表示絕對(duì)引用,在列名前加“$”表示對(duì)列絕對(duì)引用,在行號(hào)前加“$”表示對(duì)行絕對(duì)引用。
在Excel中運(yùn)用min-max的公式2.Z-score標(biāo)準(zhǔn)化Z-score是指基于原始數(shù)據(jù)的平均值(Mean)和標(biāo)準(zhǔn)差(StandardDeviation)進(jìn)行數(shù)據(jù)的標(biāo)準(zhǔn)化。將A的原始值x使用Z-score標(biāo)準(zhǔn)化到x'。Z-score是指標(biāo)準(zhǔn)化方法適用于屬性A的最大值和最小值未知的情況,或有超出取值范圍的離群數(shù)據(jù)的情況,其公式為:新數(shù)據(jù)=(原數(shù)據(jù)-平均值)/標(biāo)準(zhǔn)差例:采用Z-score標(biāo)準(zhǔn)化方法將表2-24的數(shù)據(jù)標(biāo)準(zhǔn)化。解:產(chǎn)品B的新訪客數(shù)為(6156-3680.2)/2774.18,其中,6156是產(chǎn)品B的訪客數(shù),3680.0是訪客數(shù)的平均值,2771.18是訪客數(shù)的總體標(biāo)準(zhǔn)差。右圖所示Excel中的公式為:“=(B2-AVERAGE(B$2:B$6))/STDEV.P(B$2:B$6)”。
在Excel中運(yùn)用z-score的公式感謝觀看數(shù)據(jù)分析方法論2.1基本方法&2.2高級(jí)方法熵值法CONTENTS漏斗分析法矩陣分析法多維分析法相關(guān)性分析法杜邦分析法時(shí)間序列分析法18131415161719熵值法PARTThirteen熵值法源自信息學(xué)科,廣泛應(yīng)用于對(duì)數(shù)據(jù)集的離散程度評(píng)估,也可用于估算權(quán)重從而計(jì)算綜合得分。1.原理
在信息論中,熵是對(duì)不確定性的一種度量。信息量越大,不確定性就越小,熵也就越?。恍畔⒘吭叫?,不確定性就越大,熵也就越大。根據(jù)熵的特性,可以通過(guò)計(jì)算熵值來(lái)判斷一個(gè)事件的隨機(jī)性及無(wú)序程度,也可以用熵值來(lái)判斷某個(gè)指標(biāo)的離散程度,指標(biāo)的離散程度越大,該指標(biāo)對(duì)綜合評(píng)價(jià)的影響越大。因此,可根據(jù)各項(xiàng)指標(biāo)的變異程度,利用信息熵計(jì)算各指標(biāo)的權(quán)重,為多指標(biāo)綜合評(píng)價(jià)提供依據(jù)。2.計(jì)算例2-25:表2-25是3個(gè)產(chǎn)品測(cè)試時(shí)的數(shù)據(jù),使用熵值法對(duì)產(chǎn)品的表現(xiàn)進(jìn)行綜合評(píng)估并排名。解:本例有3個(gè)款式的產(chǎn)品可供選擇,每個(gè)款式的產(chǎn)品有3個(gè)屬性,由于3個(gè)屬性的量綱不同,因此需要用熵值法求出各屬性的權(quán)重以及在產(chǎn)品中的貢獻(xiàn)度。設(shè)產(chǎn)品總量為m,得分為x,產(chǎn)品序號(hào)為i,屬性序號(hào)為j。
將表2-25轉(zhuǎn)變成p矩陣,如表2-26所示,p為數(shù)值與各列之和的商,pij=xij÷∑xij。將p值乘以ln(p)得到各個(gè)評(píng)分的貢獻(xiàn)度,Eij=pij×ln(pij),得到表2-27所示的E矩陣。根據(jù)k=1÷ln(m),其中m為產(chǎn)品總量,此例m=3,計(jì)算得k=0.910239。根據(jù)以下3個(gè)公式,計(jì)算出的結(jié)果如表2-28所示。貢獻(xiàn)總量E=k×∑p一致性程度D=1-E權(quán)重W=D÷∑D由于得分的量綱不同,先使用Min-Max標(biāo)準(zhǔn)化方法,將值轉(zhuǎn)換成[0,1]區(qū)間的數(shù)值,再用每個(gè)屬性的得分乘以權(quán)重值W后相加得到綜合得分,綜合得分落在[0,1]區(qū)間,如表2-29所示。漏斗分析法PARTFourteen漏斗分析法是結(jié)合了流程分析的方法,更強(qiáng)調(diào)事件的發(fā)展過(guò)程,按照事件發(fā)展的過(guò)程分析問(wèn)題,屬于數(shù)據(jù)分析中的方法。它能夠科學(xué)地反映用戶行為狀態(tài),以及從起點(diǎn)到終點(diǎn)各階段用戶轉(zhuǎn)化率的情況,是數(shù)據(jù)分析中重要的分析模型。
目前,漏斗分析法已經(jīng)廣泛應(yīng)用于網(wǎng)站用戶行為分析和App用戶行為分析的流量監(jiān)控、產(chǎn)品目標(biāo)轉(zhuǎn)化等日常數(shù)據(jù)運(yùn)營(yíng)與數(shù)據(jù)分析工作中。圖2-10所示為淘寶生意參謀的交易漏斗圖,從訪客到下單,再到支付,可運(yùn)用漏斗分析法在這個(gè)過(guò)程中洞察問(wèn)題。漏斗分析法分析步驟漏斗分析法的一般操作步驟如下。①確定業(yè)務(wù)流程,各個(gè)環(huán)節(jié)的量綱必須一致。②確定數(shù)據(jù)。③畫(huà)圖。例2-26:現(xiàn)有用戶交易過(guò)程的數(shù)據(jù)如圖2-11所示,使用Excel畫(huà)出數(shù)據(jù)集的漏斗圖。解:設(shè)置各環(huán)節(jié)數(shù)據(jù)表格,注意量綱必須一致。選中數(shù)據(jù),在【插入】選項(xiàng)卡中選擇【漏斗圖】選項(xiàng),如圖2-12所示。創(chuàng)建漏斗圖并設(shè)置好圖表標(biāo)題后的效果如圖2-13所示。右擊漏斗圖,在彈出的快捷菜單中選擇【設(shè)置數(shù)據(jù)系列格式(F)】命令,在【設(shè)置數(shù)據(jù)系列】窗格中,將間隙寬度設(shè)置為50%,如圖2-14所示。在【插入】選項(xiàng)卡中選擇【形狀】選項(xiàng),如圖2-15所示,選擇【下箭頭】。圖2-16所示為在漏斗圖中添加下箭頭后的效果。在【插入】選項(xiàng)卡中選擇【文本框】選項(xiàng),如圖2-17所示,在箭頭旁插入文本框?!靖袷健窟x項(xiàng)卡中,將文本框的形狀和邊框都設(shè)置為無(wú)填充,如圖2-18所示。設(shè)置好的漏斗圖如圖2-19所示。添加從瀏覽商品到完成交易的轉(zhuǎn)化率,最終效果如圖2-20所示。通過(guò)圖2-20可以發(fā)現(xiàn),整個(gè)流程中最大的問(wèn)題出現(xiàn)在“加入購(gòu)物車(chē)”這個(gè)環(huán)節(jié),運(yùn)營(yíng)人員可重點(diǎn)優(yōu)化這個(gè)環(huán)節(jié)。矩陣分析法PARTFifteen矩陣分析法是從交叉法演變而來(lái)的,和交叉法最大的區(qū)別是矩陣法的兩個(gè)軸是維度,不是度量。在低維(二維~三維)時(shí)可以使用該方法,它屬于數(shù)據(jù)分析方法。其原理是在矩陣圖的基礎(chǔ)上,把各因素分別放在行和列中,然后在行和列的交叉點(diǎn)用數(shù)量來(lái)描述這些因素之間的對(duì)比,再進(jìn)行數(shù)量計(jì)算,并進(jìn)行定量分析,從而確定哪些因素比較重要。矩陣分析思維矩陣分析思維是指通過(guò)對(duì)原始感性材料進(jìn)行矩陣般的分析與規(guī)整,形成全面、系統(tǒng)、嚴(yán)謹(jǐn)、專(zhuān)業(yè)并具有很強(qiáng)邏輯性和關(guān)聯(lián)性的理性思想,從而有助于形成正確思考、研究、決策等高層次思維的思想方法,這是一種縱橫交叉的邏輯研究方法。此思維被廣泛應(yīng)用,比如在工程管理上將各種任務(wù)分為重要并緊急、重要不緊急、不重要緊急和不重要不緊急這4類(lèi),4類(lèi)任務(wù)分別在矩陣圖的4個(gè)象限。SWOT分析法,也是矩陣分析思維的一種應(yīng)用。創(chuàng)建矩陣創(chuàng)建矩陣至少需要兩個(gè)維度,每個(gè)維度有N個(gè)交點(diǎn),因此兩個(gè)維度形成(N+1)×(N+1)的二維平面圖。以N=1為例,形成2×2=4的二維平面圖,也稱(chēng)為四象限分析法。例2-27:表2-30所示為某店鋪5個(gè)產(chǎn)品的表現(xiàn)數(shù)據(jù),用矩陣分析法分析數(shù)據(jù)。解:用矩陣分析法分析數(shù)據(jù)的步驟如下。①在Excel中選中支付金額和訪客平均價(jià)值,創(chuàng)建散點(diǎn)圖。②根據(jù)兩個(gè)指標(biāo)的平均值設(shè)置x軸和y軸的交點(diǎn)。③基于(20262.62,15.14)劃分4個(gè)坐標(biāo)區(qū)域,每個(gè)數(shù)據(jù)點(diǎn)代表一個(gè)產(chǎn)品,分布在4個(gè)區(qū)域內(nèi),如圖2-21所示。定義矩陣?yán)L制矩陣圖需根據(jù)畫(huà)圖的兩個(gè)維度對(duì)矩陣進(jìn)行定義,因此理解指標(biāo)背后所代表的業(yè)務(wù)意義,是矩陣分析法的關(guān)鍵。支付金額代表產(chǎn)品的市場(chǎng)份額,訪客平均價(jià)值代表流量?jī)r(jià)值。添加定義后的矩陣如圖2-22所示,定義如下。(1)右上角的區(qū)域市場(chǎng)份額和流量?jī)r(jià)值都較高,可定義該區(qū)域的產(chǎn)品為企業(yè)的核心產(chǎn)品??蓪①Y源重點(diǎn)放在B產(chǎn)品上,通過(guò)市場(chǎng)推廣和營(yíng)銷(xiāo)提高B產(chǎn)品的市場(chǎng)份額。(2)右下角的區(qū)域市場(chǎng)份額較高,但流量?jī)r(jià)值較低,可定義該區(qū)域的產(chǎn)品為企業(yè)的引流產(chǎn)品。需要維持A產(chǎn)品的市場(chǎng)份額,在其生命周期內(nèi)保持引流能力。(3)左上角的區(qū)域流量?jī)r(jià)值較高,但市場(chǎng)份額較低,可定義該區(qū)域的產(chǎn)品為企業(yè)的重點(diǎn)發(fā)展產(chǎn)品或利潤(rùn)產(chǎn)品。需要為C產(chǎn)品引入更多的流量,以測(cè)試市場(chǎng)對(duì)該產(chǎn)品的反饋。(4)左下角的區(qū)域市場(chǎng)份額和流量?jī)r(jià)值都較低,可定義該區(qū)域的產(chǎn)品為企業(yè)的問(wèn)題產(chǎn)品??上戮€E產(chǎn)品和D產(chǎn)品或?qū)產(chǎn)品和D產(chǎn)品進(jìn)行重新定位。矩陣具有運(yùn)動(dòng)的特性,分布在不同區(qū)間的點(diǎn)會(huì)隨著時(shí)間的推移而移動(dòng),而這種移動(dòng)是有規(guī)律可循的,如圖2-23所示。隨著需求的增長(zhǎng),低市場(chǎng)份額、高流量?jī)r(jià)值的市場(chǎng)就會(huì)轉(zhuǎn)變成高市場(chǎng)份額、高流量?jī)r(jià)值的市場(chǎng);隨著競(jìng)爭(zhēng)的加劇,高市場(chǎng)份額、高流量?jī)r(jià)值的市場(chǎng)就會(huì)轉(zhuǎn)變成高市場(chǎng)份額、低流量?jī)r(jià)值的市場(chǎng);隨著產(chǎn)品生命周期的結(jié)束,高市場(chǎng)份額、低流量?jī)r(jià)值的市場(chǎng)就會(huì)轉(zhuǎn)變成低市場(chǎng)份額、低流量?jī)r(jià)值的市場(chǎng);此時(shí)需要對(duì)市場(chǎng)進(jìn)行重新定位,重新定位后會(huì)重新轉(zhuǎn)變成低市場(chǎng)份額、高流量?jī)r(jià)值的市場(chǎng)。一個(gè)優(yōu)秀的產(chǎn)品必然具有高流量?jī)r(jià)值,隨著時(shí)間的推移市場(chǎng)份額會(huì)越來(lái)越大,市場(chǎng)份額大到一定程度,市場(chǎng)的競(jìng)爭(zhēng)對(duì)手會(huì)急劇增加,此時(shí)流量?jī)r(jià)值會(huì)逐漸下降,隨著產(chǎn)品生命周期的結(jié)束,最終產(chǎn)品將會(huì)退市多維分析法PARTSixteen多維分析法多維分析法是分析多個(gè)指標(biāo)的方法。在許多復(fù)雜的業(yè)務(wù)場(chǎng)景下,降維后仍存在多個(gè)指標(biāo),對(duì)多個(gè)維度進(jìn)行分析的方法就是多維分析法。多維分析法同樣局限于四維空間,一般采用二維平面圖進(jìn)行展示。1.三維氣泡圖三維氣泡圖并非真正的三維圖形,而是在二維平面圖上展示3個(gè)維度,比一般的二維圖形展現(xiàn)更多的信息。例2-28:表2-31所示為某店鋪產(chǎn)品數(shù)據(jù),用氣泡圖展現(xiàn)數(shù)據(jù)。解:在Excel中選中訪客數(shù)、支付轉(zhuǎn)化率和客單價(jià),創(chuàng)建氣泡圖。x軸為訪客數(shù),y軸為支付轉(zhuǎn)化率,氣泡大小為客單價(jià),如圖2-24所示。2.雷達(dá)圖雷達(dá)圖是以從同一點(diǎn)開(kāi)始的軸上表示的3個(gè)或更多個(gè)定量、變量的,以二維圖表的形式顯示多變量數(shù)據(jù)的圖形方法,其軸的相對(duì)位置和角度通常是無(wú)信息的。雷達(dá)圖也稱(chēng)為網(wǎng)絡(luò)圖、蜘蛛網(wǎng)圖、星圖、不規(guī)則多邊形、極坐標(biāo)圖或Kiviat圖。它相當(dāng)于平行坐標(biāo)圖,坐標(biāo)軸徑向排列。例2-29:表2-31所示為某店鋪產(chǎn)品數(shù)據(jù),用雷達(dá)圖展現(xiàn)數(shù)據(jù)。解:使用Min-Max標(biāo)準(zhǔn)化方法將表2-31的數(shù)據(jù)標(biāo)準(zhǔn)化,繪制出表2-32。在Excel中選中表2-32的產(chǎn)品、訪客數(shù)、支付轉(zhuǎn)化率和客單價(jià),創(chuàng)建雷達(dá)圖。選中雷達(dá)圖,在【圖表工具】的【設(shè)計(jì)】選項(xiàng)卡中,選擇【切換行/列】選項(xiàng),效果如圖2-25所示。時(shí)間序列分析法PARTSeventeen時(shí)間序列分析法,強(qiáng)調(diào)的是通過(guò)對(duì)某個(gè)事物或事件進(jìn)行一定時(shí)間段內(nèi)的連續(xù)觀測(cè),并對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)。采用時(shí)間序列分析法研究數(shù)據(jù)的變化和發(fā)展規(guī)模,廣泛應(yīng)用于數(shù)據(jù)挖掘領(lǐng)域1.移動(dòng)平均法移動(dòng)平均法是用一組最近的實(shí)際數(shù)據(jù)值來(lái)預(yù)測(cè)未來(lái)一期或幾期內(nèi)公司產(chǎn)品的需求量、公司產(chǎn)能等的常用方法。移動(dòng)平均法適用于近期預(yù)測(cè)。當(dāng)產(chǎn)品需求既不快速增長(zhǎng)也不快速下降,且不存在季節(jié)性因素時(shí),移動(dòng)平均法能有效地消除預(yù)測(cè)中的隨機(jī)波動(dòng)。移動(dòng)平均法根據(jù)預(yù)測(cè)時(shí)使用的各元素的權(quán)重不同,可以分為簡(jiǎn)單移動(dòng)平均法和加權(quán)移動(dòng)平均法。(1)簡(jiǎn)單移動(dòng)平均法。簡(jiǎn)單移動(dòng)平均法的各元素的權(quán)重都相等。簡(jiǎn)單移動(dòng)平均法的計(jì)算公式為:Ft=[(At-1)+(At-2)+(At-3)+…+(At-n)]/n其中:Ft——對(duì)下一期的預(yù)測(cè)值;n——移動(dòng)平均的時(shí)期個(gè)數(shù);At-1——前期實(shí)際值;At-2、At-3和At-n分別表示前兩期、前3期直至前n期的實(shí)際值。例2-30:表2-33是某店鋪2022年10月26日—2022年11月4日的店鋪訪客數(shù)真實(shí)數(shù)據(jù),采用簡(jiǎn)單移動(dòng)平均法預(yù)測(cè)2022年11月2日—2022年11月4日的訪客數(shù)據(jù)。其中表2-33的第8行到第10行為驗(yàn)證數(shù)據(jù),用于驗(yàn)證預(yù)測(cè)結(jié)果。解:在電商的數(shù)據(jù)體系中,存在一些常用的時(shí)間范圍節(jié)點(diǎn),如近3天、近7天、近14天、近30天等。在正常的流量(非活動(dòng))下,當(dāng)天的流量主要受當(dāng)天前n個(gè)小時(shí)、近3天、近7天數(shù)據(jù)的影響。在以天為單位預(yù)測(cè)數(shù)據(jù)時(shí),可選擇近3天或近7天的數(shù)據(jù),本例以近7天為例。將數(shù)據(jù)對(duì)應(yīng)填入Excel中,在D9單元格輸入公式“=AVERAGE(C2:C8)”,然后將公式填充到D10和D11。2022年11月2日和2022年11月3日的預(yù)測(cè)結(jié)果與真實(shí)數(shù)值較為接近,如圖2-26所示。(2)加權(quán)移動(dòng)平均法。加權(quán)移動(dòng)平均法給固定跨越期限內(nèi)的每個(gè)變量值以不同的權(quán)重。其原理是:歷史各期產(chǎn)品需求的數(shù)據(jù)信息對(duì)預(yù)測(cè)未來(lái)期內(nèi)需求量的作用是不一樣的。除了以n為周期的周期性變化外,遠(yuǎn)離目標(biāo)期的變量值的影響力相對(duì)較低,故應(yīng)給予較低的權(quán)重。加權(quán)移動(dòng)平均法的計(jì)算公式為:其中:w1——第t-1期實(shí)際銷(xiāo)售額的權(quán)重;w2——第t-2期實(shí)際銷(xiāo)售額的權(quán)重;wn——第t-n期實(shí)際銷(xiāo)售額的權(quán)重;n——預(yù)測(cè)的時(shí)期數(shù),w1+w2+…+wn=1。在運(yùn)用加權(quán)移動(dòng)平均法時(shí),權(quán)重的選擇是一個(gè)值得注意的問(wèn)題。經(jīng)驗(yàn)法和試算法是選擇權(quán)重較為簡(jiǎn)單的兩種方法。一般而言,離日期最近的數(shù)據(jù)最能準(zhǔn)確預(yù)測(cè)未來(lái)的情況,因而權(quán)重應(yīng)大些。例如,前一個(gè)月的利潤(rùn)和生產(chǎn)能力比前幾個(gè)月的數(shù)據(jù)能更好地估測(cè)下個(gè)月的利潤(rùn)和生產(chǎn)能力。但是,如果數(shù)據(jù)是季節(jié)性的,則權(quán)重也應(yīng)是季節(jié)性的。例2-31:使用加權(quán)移動(dòng)平均法預(yù)測(cè)表2-33所示的數(shù)據(jù)。解:根據(jù)業(yè)務(wù)經(jīng)驗(yàn),雖然近7天是一個(gè)整體,但也可以分成近3天和3天之前,近3天的數(shù)據(jù)權(quán)重相對(duì)較大,系數(shù)可設(shè)為0.6;3天之前的數(shù)據(jù)權(quán)重相對(duì)較低,系數(shù)可設(shè)為0.4。將表2-33中數(shù)據(jù)填至一個(gè)新的Excel表格中,在D9單元格輸入公式“=0.4×AVERAGE(C2:C5)+0.6×AVERAGE(C6:C8)”。在D10單元格輸入公式“=0.4×AVERAGE(C3:C6)+0.6×AVERAGE(C7:C8,D9)”。在D11單元格輸入公式“=0.4×AVERAGE(C4:C7)+0.6×AVERAGE(C8,D9:D10)”。預(yù)測(cè)結(jié)果如圖2-27所示,預(yù)測(cè)結(jié)果的誤差并沒(méi)有明顯提高,說(shuō)明訪客數(shù)受影響的因素較多。除了使用時(shí)間序列分析法之外,還可以通過(guò)其他方法預(yù)測(cè)并進(jìn)行修正。2.指數(shù)平滑法指數(shù)平滑法實(shí)際上是一種特殊的加權(quán)移動(dòng)平均法。指數(shù)平滑法進(jìn)一步加強(qiáng)了觀察期內(nèi)近期觀察值對(duì)預(yù)測(cè)值的作用,對(duì)不同時(shí)間的觀察值所賦予的權(quán)重不同,加大了近期觀察值的權(quán)重,使預(yù)測(cè)值能夠迅速反映市場(chǎng)實(shí)際的變化。根據(jù)平滑次數(shù)的不同,指數(shù)平滑法可以分為一次指數(shù)平滑法、二次指數(shù)平滑法、高次指數(shù)平滑法。(1)一次指數(shù)平滑法當(dāng)時(shí)間序列無(wú)明顯的變化趨勢(shì)時(shí),可用一次指數(shù)平滑法。其公式為:其中:指數(shù)平滑法初始值的確定需要從時(shí)間序列的項(xiàng)數(shù)來(lái)考慮:若時(shí)間序列的觀察期n大于15,初始值對(duì)預(yù)測(cè)結(jié)果的影響很小,可以以第一期觀測(cè)值作為初始值;若觀察期n等于15,初始值對(duì)預(yù)測(cè)結(jié)果影響較大,則取最初幾期觀測(cè)值的平均數(shù)作為初始值,通常取前3期。一次指數(shù)平滑法的局限性:一次指數(shù)平滑法只適用于水平型歷史數(shù)據(jù)的預(yù)測(cè),不適用于呈斜坡型線性趨勢(shì)歷史數(shù)據(jù)的預(yù)測(cè)。(2)二次指數(shù)平滑法二次指數(shù)平滑法是在一次指數(shù)平滑的基礎(chǔ)上再進(jìn)行一次平滑。它不能單獨(dú)進(jìn)行預(yù)測(cè),必須與一次指數(shù)平滑法配合,建立預(yù)測(cè)的數(shù)學(xué)模型,然后運(yùn)用數(shù)學(xué)模型確定預(yù)測(cè)值。預(yù)測(cè)公式為:(3)高次指數(shù)平滑預(yù)測(cè)法高次指數(shù)平滑預(yù)測(cè)法是一種使用多個(gè)指數(shù)平滑系數(shù)進(jìn)行預(yù)測(cè)的方法,通常使用二次指數(shù)平滑或者三次指數(shù)平滑。這種方法在預(yù)測(cè)時(shí)考慮了更多的歷史數(shù)據(jù),能夠更準(zhǔn)確地捕捉到趨勢(shì)和季節(jié)性的變化。若時(shí)間序列的變動(dòng)呈現(xiàn)二次曲線趨勢(shì),則需采用三次指數(shù)平滑法進(jìn)行預(yù)測(cè)。三次指數(shù)平滑法是在二次指數(shù)平滑的基礎(chǔ)上再進(jìn)行一次平滑。預(yù)測(cè)公式為:例2-32:使用指數(shù)平滑法預(yù)測(cè)表2-33中的數(shù)據(jù)。解:預(yù)測(cè)的期數(shù)為3,觀察值為7,由于觀察值過(guò)少,故使用一次指數(shù)平滑法。將表2-33的數(shù)填入一個(gè)新的Excel表格中,阻尼系數(shù)先設(shè)定為0.3,如圖2-28所示。初始值為前3個(gè)觀測(cè)值的平均值,即在C4單元格輸入公式“=AVERAGE(B2:B4)”。從第4個(gè)觀測(cè)值開(kāi)始預(yù)測(cè),即在C5單元格輸入公式“=$B$2×C2+(1-$B$2)×D4”。將公式一直填充到C11單元格,如圖2-29所示??梢詫㈩A(yù)測(cè)的值跟真實(shí)值進(jìn)行對(duì)比,算出誤差并通過(guò)調(diào)整阻尼系數(shù)對(duì)比誤差的大小,從而確定阻尼系數(shù)。相關(guān)性分析法PARTEighteen
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年酒店投資合作協(xié)議合同(例文)
- 2024年軟件開(kāi)發(fā)及技術(shù)服務(wù)合同協(xié)議
- 2024年小貨車(chē)租賃合同范本
- 2024年建設(shè)蔬菜大棚合同
- 2024年關(guān)于反擔(dān)保的合同
- 2024年環(huán)保設(shè)備購(gòu)銷(xiāo)的合同
- 2024年承包機(jī)械加工合同協(xié)議書(shū)
- 2024年工程中介人居間合同范本
- 上海一手房買(mǎi)賣(mài)合同范本2024年
- 2024年借款合同相關(guān)法律知識(shí)
- DL-T 572-2021電力變壓器運(yùn)行規(guī)程-PDF解密
- 貨物供應(yīng)方案及運(yùn)輸方案
- 羊水少治療護(hù)理查房
- 2024年陜西省二級(jí)建造師繼續(xù)教育網(wǎng)絡(luò)考試試題
- 2024年中考語(yǔ)文第一輪考點(diǎn)復(fù)習(xí)(全國(guó)通用) 專(zhuān)題11:記敘文閱讀之情節(jié)與線索【習(xí)題精練】 (原卷版+解析)
- 機(jī)械設(shè)備零部件招標(biāo)標(biāo)書(shū)文件
- 幼兒園主題活動(dòng)中家長(zhǎng)資源的利用現(xiàn)狀研究-畢業(yè)論文
- 中煤陜西公司招聘筆試題
- 第1單元水復(fù)習(xí)(課件)科教版科學(xué)三年級(jí)上冊(cè)
- 天堂旅行團(tuán)讀書(shū)分享
- 【課件】第3課+象外之境-中國(guó)傳統(tǒng)山水畫(huà)+課件-高中美術(shù)人教版(2019)美術(shù)鑒賞
評(píng)論
0/150
提交評(píng)論