幾種統(tǒng)計算法實例計算_第1頁
幾種統(tǒng)計算法實例計算_第2頁
幾種統(tǒng)計算法實例計算_第3頁
幾種統(tǒng)計算法實例計算_第4頁
幾種統(tǒng)計算法實例計算_第5頁
已閱讀5頁,還剩16頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、1. Pearson相關(guān)系數(shù):給出一個具體實例,寫出計算過程。皮爾森相關(guān)系數(shù)(Pearson correlation coefficient)也稱皮爾森積矩相關(guān)系數(shù)(Pearson product-moment correlation coefficient) ,是一種線性相關(guān)系數(shù)。皮爾森相關(guān)系數(shù)是用來反映兩個變量線性相關(guān)程度的統(tǒng)計量。相關(guān)系數(shù)用r表示,其中n為樣本量,分別為兩個變量的觀測值和均值。r描述的是兩個變量間線性相關(guān)強(qiáng)弱的程度。r的絕對值越大表明相關(guān)性越強(qiáng)。樣本的簡單相關(guān)系數(shù)一般用r表示,其中n 為樣本量, 分別為兩個變量的觀測值和均值。r描述的是兩個變量間線性相關(guān)強(qiáng)弱的程度。r的取

2、值在-1與+1之間,若r>0,表明兩個變量是正相關(guān),即一個變量的值越大,另一個變量的值也會越大;若r<0,表明兩個變量是負(fù)相關(guān),即一個變量的值越大另一個變量的值反而會越小。r 的絕對值越大表明相關(guān)性越強(qiáng),要注意的是這里并不存在因果關(guān)系。若r=0,表明兩個變量間不是線性相關(guān),但有可能是其他方式的相關(guān)(比如曲線方式)。利用樣本相關(guān)系數(shù)推斷總體中兩個變量是否相關(guān),可以用t 統(tǒng)計量對總體相關(guān)系數(shù)為0的原假設(shè)進(jìn)行檢驗。若t 檢驗顯著,則拒絕原假設(shè),即兩個變量是線性相關(guān)的;若t 檢驗不顯著,則不能拒絕原假設(shè),即兩個變量不是線性相關(guān)的。一個具體實例和計算過程(銷售額與利潤額的pearson相關(guān)系

3、數(shù))銷售額4358515862668590102111利潤額9101218132521242225=71.6=17.9=0.825626116Correlations銷售額利潤額銷售額Pearson Correlation1.826*Sig. (2-tailed).003N1010利潤額Pearson Correlation.826*1Sig. (2-tailed).003N1010*. Correlation is significant at the 0.01 level (2-tailed).說明銷售額與利潤額的相關(guān)皮爾森相關(guān)系數(shù)為0.826,sig=0.003<0.01,故滿足顯

4、著性要求。2卡方檢驗:給出卡方檢驗的一個具體實例,要求給出卡方統(tǒng)計量的計算過程,以及主要列聯(lián)強(qiáng)度指標(biāo)的計算方法??ǚ綑z驗就是統(tǒng)計樣本的實際觀測值與理論推斷值之間的偏離程度,實際觀測值與理論推斷值之間的偏離程度就決定卡方值的大小,卡方值越大,越不符合;卡方值越小,偏差越小,越趨于符合,若兩個值完全相等時,卡方值就為0,表明理論值完全符合。例題一,某機(jī)構(gòu)欲了解現(xiàn)在性別與收入是否有關(guān),他們隨機(jī)抽樣500人,詢問對此的看法,結(jié)果分為“有關(guān)、無關(guān)、不好說,三種答案,圖3中縣調(diào)查得到的數(shù)據(jù)。(1)零假設(shè)H0:性別與收入無關(guān)。(2)確定自由度為(3-1)×(2-1)=2,選擇顯著水平=0.05。原

5、數(shù)據(jù)性別有關(guān)無關(guān)不知道合計男1206050230女10011060270合計220170110500期望值性別有關(guān)無關(guān)不知道合計男101.278.250.6230女118.891.859.4270合計220170110500期望值F(男,有關(guān))=220*230/500=101.2期望值F(女,有關(guān))=220*270/500=118.8期望值F(男,無關(guān))=170*230/500=78.2期期望值F(女,無關(guān))=170*230/500=91.8期望值F(男,不知道)=110*270/500=50.6望值F(女,不知道)=110*270/500=59.4然后分別計算k(男,有關(guān))=(120-101

6、.2)2/101.2k(女,有關(guān))=(100-118.8)2/118.8k(男,無關(guān))=(60-78.2)2/78.2k(女,無關(guān))=(110-91.8)2/91.8k(男,不知道)=(50-50.6)2/50.6k(女,不知道)=(60-59.4)2/59.4=14.32483402性別有關(guān)無關(guān)不知道合計男3.4924901194.2358056270.0071146257.73541037女2.9750841753.6082788670.0060606066.589423648合計6.4675742947.8440844940.013175231 14.32483402而chiinv(0.

7、05,2)=5.9915<14.32483402,故拒絕原假設(shè)。例題二,在分類資料統(tǒng)計分析中我們常會遇到這樣的資料,如兩組大白鼠在不同致癌劑作用下的發(fā)癌率如下表,問兩組發(fā)癌率有無差別?處理發(fā)癌數(shù)未發(fā)癌數(shù)合計發(fā)癌率甲組5219710.732394366乙組393420.928571429合計91221130.805309735同例一一樣,得出期望值處理發(fā)癌數(shù)未發(fā)癌數(shù)合計發(fā)癌率甲組57.1769911513.82300885710.805309735乙組33.823008858805309735合計91221130.805309735處理發(fā)癌數(shù)未發(fā)癌數(shù)合計甲組0.4

8、687416531.938885932.407627584乙組0.7923966053.2776405014.070037106合計1.2611382585.2165264316.477664689 =6.47>3.841458821題三,T檢驗、方差分析:T檢驗:分別給出單樣本、雙樣本、配對樣本t檢驗的一個具體實例。T檢驗,亦稱student t檢驗(Student's t test),主要用于樣本含量較小(例如n<30),總體標(biāo)準(zhǔn)差未知的正態(tài)分布資料。T檢驗是用于小樣本(樣本容量小于30,適合正態(tài)分布)的兩個平均值差異程度的檢驗方法。它是用T分布理論來推斷差異發(fā)生的概率

9、,從而判定兩個平均數(shù)的差異是否顯著。單樣本T檢驗比較山區(qū)成年男子脈動次數(shù)樣本均數(shù)所代表的未知總體均數(shù)和已知總體均數(shù)0。  脈搏跳動7574727479787669777670737671787776747977統(tǒng)計量   自由度V=n-1One-Sample StatisticsNMeanStd. DeviationStd. Error Mean脈動次數(shù)2075.052.892.647One-Sample TestTest Value = 72 tdfSig. (2-tailed)Mean Difference95% Confidence Interva

10、l of the DifferenceLowerUpper脈動次數(shù)4.71619.0003.0501.704.40從單樣本統(tǒng)計表看出,均值為75.05次/分鐘,標(biāo)準(zhǔn)差為2.892,標(biāo)準(zhǔn)誤差為0.647次/分鐘。從單樣本T檢驗表中看出,T值為4.716,自由度為20-1=19;雙側(cè)檢驗顯著性為0<0.05,故拒絕原假設(shè),認(rèn)為山區(qū)成年健康男子的脈動與總體樣本存在差異,平均差值為3.050,在95%的置信度的條件下其置信區(qū)間為1.70,4.40。多樣本T檢驗兩獨立樣本t檢驗就是根據(jù)樣本數(shù)據(jù)對兩個樣本來自的兩獨立總體的均值是否有顯著差異進(jìn)行推斷;進(jìn)行兩獨立樣本t檢驗的條件是,兩樣本的總體相互獨立

11、且符合正態(tài)分布;數(shù)據(jù)1.0034.001.0037.001.0028.001.0036.001.0030.002.0043.002.0045.002.0047.002.0049.002.0039.00Group Statistics組號NMeanStd. DeviationStd. Error Mean數(shù)據(jù)1.00533.00003.872981.732052.00544.60003.847081.72047Independent Samples TestLevene's Test for Equality of VariancesFSig.數(shù)據(jù)Equal variances assu

12、med.077.788Equal variances not assumed從小組統(tǒng)計表中看出,第一組有五個數(shù)據(jù),均值為33.0000,標(biāo)準(zhǔn)差為3.87298,標(biāo)準(zhǔn)誤差為1.73205。第二組有五個數(shù)據(jù),均值為44.6000,標(biāo)準(zhǔn)差為3.84708,標(biāo)準(zhǔn)誤差為1.72047。Independent Samples Testt-test for Equality of MeanstdfSig. (2-tailed)Mean DifferenceStd. Error Difference95% Confidence Interval of the DifferenceLowerUpper-4.75

13、28.001-11.600002.44131-17.22967-5.97033-4.7528.000.001-11.600002.44131-17.22972-5.97028從F值對應(yīng)的p=0.788值大于0.05,所以方差是相等的。由于t=-4.752<15.50731306且sig均為0.001<0.05,故兩樣本獨立。配對樣本t檢驗配對樣本是指對同一樣本進(jìn)行兩次測試所獲得的兩組數(shù)據(jù),或?qū)蓚€完全的樣本在不同條件下進(jìn)行測試所得到的兩組數(shù)據(jù);兩獨立樣本t檢驗就是根據(jù)樣本數(shù)據(jù)對兩個配對樣本來自的兩配對總體的均值是否有顯著差異進(jìn)行推斷;兩配對樣本t檢驗的前提條件:兩樣本是配對的(數(shù)量

14、一樣,順序不能變),服從正態(tài)分布。數(shù)據(jù)組一 組二34 4337 4528 4736 4930 39配對基本統(tǒng)計Paired Samples StatisticsMeanNStd. DeviationStd. Error MeanPair 1組一33.0053.8731.732組二44.6053.8471.720兩組數(shù)據(jù)配對相關(guān)系數(shù)Paired Samples CorrelationsNCorrelationSig.Pair 1組一 & 組二5.302.621相關(guān)系數(shù)為0.302,sig=0.621>0.05,故認(rèn)為無相關(guān)性。配對樣本T檢驗Paired Samples TestPa

15、ired DifferencesMeanStd. DeviationStd. Error Mean95% Confidence Interval of the DifferenceLowerUpperPair 1組一 - 組二-11.6004.5612.040-17.263-5.937tdfSig. (2-tailed)-5.6874.005從上表可以看出t=-5.687<9.487729037且sig=0.005<0.05,故認(rèn)為兩配對樣本之間存在顯著性差異。方差分析,給出單因素方差分析的一個具體實例,給出方差分析表,及其計算過程單因素方差分析 (one-way ANOVA),用

16、于完全隨機(jī)設(shè)計的多個樣本均數(shù)間的比較,其統(tǒng)計推斷是推斷各樣本所代表的各總體均數(shù)是否相等。完全隨機(jī)設(shè)計(completely random design)不考慮個體差異的影響,僅涉及一個處理因素,但可以有兩個或多個水平,所以亦稱單因素實驗設(shè)計。在實驗研究中按隨機(jī)化原則將受試對象隨機(jī)分配到一個處理因素的多個水平中去,然后觀察各組的試驗效應(yīng);在觀察研究(調(diào)查)中按某個研究因素的不同水平分組,比較該因素的效應(yīng)。H0:三種人的轉(zhuǎn)蛋白無差異。H1:三種人的轉(zhuǎn)蛋白不完全相同。以一樣本為例,某社區(qū)隨機(jī)抽取糖尿病和IGT患者以及正常人共三十人進(jìn)行轉(zhuǎn)蛋白測定,觀測三種人的轉(zhuǎn)蛋白是否有差異。其中數(shù)據(jù)如下:糖尿病IG

17、T正常人105.2124.5117109.5105.11109676.4109xij115.295.310395.311012311095.212710099121125.6120159111115106.5對其進(jìn)行求和等一系列操作;各列求和1160921.512283309.5總和個數(shù)1191030總和平均數(shù)105.4545455102.3888889122.8110.3166667總和平方和123509.5296045.35153420372974.87總和有三種變異:總變異組間變異組內(nèi)變異ss總 =ss組間 +ss組內(nèi)v總 =v組間 +v組內(nèi)ms總 =ms組間 /ms組內(nèi)=372974.

18、87-365093.0083=7881.861667=-365093.0083=2384.025505=7881.861667-2384.025505=5497.836162=365093.0083=1192.012753=203.6235615=>結(jié)論:拒絕原假設(shè),認(rèn)為三種人的轉(zhuǎn)蛋白有明顯差異。因子分析:掌握因子分析的基本原理,給出一個具體實例基本原理: 其中i的取值區(qū)間為1,k而k<p且  變量共同度越大越能體現(xiàn)表明X對于F每一分量的依賴程度大。公共因子方差貢獻(xiàn)(1,2,3.k)越大越好,把它計算出來再依次地排好先后順序。就可以提煉出最有影響的公共因子。因子

19、分析(Factor analysis):就是用少數(shù)幾個因子來描述許多指標(biāo)或因素之間的聯(lián)系,以較少幾個因子來反映原資料的大部分信息的統(tǒng)計學(xué)分析方法。從數(shù)學(xué)角度來看,主成分分析是一種化繁為簡的降維處理技術(shù)。 如下數(shù)據(jù):數(shù)學(xué)化學(xué)語文歷史英語10010059736799995363608710074817691100706576878768786485956376667983898979KMO and Bartlett's TestKaiser-Meyer-Olkin Measure of Sampling Adequacy.580Bartlett's Test of Spherici

20、tyApprox. Chi-Square25.716df10Sig.004巴特利特球度檢驗統(tǒng)計量觀測值為25.726,p為0.004值接近0,顯著性差異,可以認(rèn)為相關(guān)系數(shù)矩陣與單位陣有顯著差異,同時KMO值為0.580,根據(jù)Kaiser給出的KMO度量標(biāo)準(zhǔn)可知原有變量適合進(jìn)行因子分析。從圖中可知1.首先得出其相關(guān)矩陣Correlation Matrix數(shù)學(xué)化學(xué)語文歷史英語Correlation數(shù)學(xué)1.000.721-.844-.788-.588化學(xué).7211.000-.644-.706-.181語文-.844-.6441.000.797.860歷史-.788-.706.7971.000.526

21、英語-.588-.181.860.5261.000從圖中可以看出語文、英語、歷史三科的相關(guān)系數(shù)較大,其次數(shù)學(xué)和化學(xué)。這與我們的指標(biāo)選取有很大的關(guān)系。2. 然后初始特征值及貢獻(xiàn)Total Variance ExplainedComponentInitial EigenvaluesExtraction Sums of Squared LoadingsTotal% of VarianceCumulative %Total% of VarianceCumulative %dimension013.70474.07774.0773.70474.07774.0772.88917.78091.856.889

22、17.78091.8563.2304.59196.4484.1733.45499.9015.005.099100.000Extraction Method: Principal Component Analysis.從圖中可以看出前面兩個因子的方差貢獻(xiàn)率就超過90%,因此我們選擇兩個因子來概括整個指標(biāo)體系。從碎石圖中也同樣可以看出。Rotated Component MatrixaComponent12數(shù)學(xué).765-.529化學(xué).965-.046語文-.594.791歷史-.784.462英語-.114.988從旋轉(zhuǎn)成分矩陣可以看出:公因子1得分越高,所有的英語、語文及歷史成績越差,而數(shù)學(xué)和化

23、學(xué)成績越高,所以公因子1代表的是語言文學(xué)類的反向指標(biāo)及自然科學(xué)類的正向指標(biāo),可稱為“理科能力”。公因子2得分越高,所有的英語、語文及歷史成績越高,而數(shù)學(xué)和化學(xué)成績越低,所以公因子2代表的是語言文學(xué)類的正向指標(biāo)及自然科學(xué)類的反向指標(biāo),可稱為“文科能力”。經(jīng)過旋轉(zhuǎn),可以看出公因子有了更合理的解釋。Component Score Coefficient MatrixComponent12數(shù)學(xué)-.250.114化學(xué)-.205.672語文.261.235歷史.242-.185英語.198.756得出因子的回歸模型:F1=-0.25*Z1+0.205*Z2+0.261*Z3+0.242*Z4-0.198*

24、Z5F2=0.114*Z1+0.672*Z2+0.235*Z3-0.185*Z4-0.756*Z5信息熵、信息增益:給出信息增益的一個具體實例。信息量:從N個可能事件中選出一個事件所需要的信息度量或含量,也就是在辯識N個事件中特定的一個事件的過程中所需要提問"是或否"的最少次數(shù).信息熵:當(dāng)我們對一問題毫無了解時,對它的認(rèn)識是不確定的,在對問題的了解過程中,通過各種途徑獲得信息,逐漸消除了不確定性,獲得的信息越多,消除的不確定性也越多。我們可以用消除不確定性的多少來度量信息量的大小。1948年,美國數(shù)學(xué)家、信息論的創(chuàng)始人Shannon在題為“通訊的數(shù)學(xué)理論”的論文中指出:“信

25、息是用來消除隨機(jī)不定性的東西”。并應(yīng)用概率論知識和邏輯方法推導(dǎo)出了信息量的計算公式 。由此給出3個公理:公理1:信息量是事件發(fā)生概率的連續(xù)函數(shù);公理2:信息量是有限值;公理3:如果事件A和事件B的發(fā)生是相互獨立的,則獲知事件A和事件B將同時發(fā)生的信息量是單獨獲知兩事件發(fā)生的信息量之和。設(shè)事件發(fā)生的概率為P,則滿足上述公理的信息量函數(shù)為: 其中為應(yīng)用方便,可取c=1,a=e,單位為奈特(nat);信息量函數(shù)體現(xiàn)不確定的消除;設(shè),M代表事件A所包含的基本事件,N代表總的不確定性,M為A事件所包含的不確定性,從而當(dāng)A事件發(fā)生時,共消除不確定性為N-M,分別將變量取對數(shù),并不影響其大小的單調(diào)性,這樣就

26、可以將事件發(fā)生的概率聯(lián)系起來,將lnN視為總的不確定性,將lnM視為事件A所包含的不確定性,從而獲得事件A發(fā)生后,共消除不確定性為lnN-lnM=-lnP例:會堂有20排、每排20個座位。找一個人。甲告訴消息(A):此人在第10排;乙告訴消息(B):此人在第10排、第10座??偟牟淮_定性:,從上式可以看出,I是P的單調(diào)遞減函數(shù);信息熵定義為“加權(quán)平均信息量”其中;信息量:信息熵也即加權(quán)平均信息量:;舉個例子:假如在一場比賽中A獲勝的概率為0.9,B獲勝的概率為0.1;那么其信息熵為信息增益(實例)Gain(A)=Entropy(After)-Entropy(before)我們要建立的決策樹的形

27、式類似于“如果天氣怎么樣,去玩;否則,怎么著怎么著”的樹形分叉。那么問題是用哪個屬性(即變量,如天氣、溫度、濕度和風(fēng)力)最適合充當(dāng)這顆樹的根節(jié)點,在它上面沒有其他節(jié)點,其他的屬性都是它的后續(xù)節(jié)點。借用信息論的概念,我們用一個統(tǒng)計量,“信息增益”(Information Gain)來衡量一個屬性區(qū)分以上數(shù)據(jù)樣本的能力。信息增益量越大,這個屬性作為一棵樹的根節(jié)點就能使這棵樹更簡潔,比如說一棵樹可以這么讀成,如果風(fēng)力弱,就去玩;風(fēng)力強(qiáng),再按天氣、溫度等分情況討論,此時用風(fēng)力作為這棵樹的根節(jié)點就很有價值。如果說,風(fēng)力弱,再又天氣晴朗,就去玩;如果風(fēng)力強(qiáng),再又怎么怎么分情況討論,這棵樹相比就不夠簡潔了。

28、計算信息增益的公式需要用到“熵”(Entropy)。我們檢查的屬性是是否出去玩。在這個例子中,我們的輸出屬性(我們要檢查的屬性)“play”只有兩個取值,同樣地,如果輸出屬性的取值大于2,公式是對成的,一樣的形式,連加就是,找到各個取值的個數(shù),求出各自的比例。如果樣本具有二元輸出屬性,其熵的公式為:Entropy(S) =-(p+)*log(p+)-(p-)*log(p-)其中,p+、p-分別為正例和負(fù)例占總記錄的比例。輸出屬性取值大于2的情況,公式是對稱的。首先用Excel對上面數(shù)據(jù)的play變量的各個取值排個序(這個工作簿里把“play”這個詞去掉),一共是14條記錄,你能數(shù)出取值為yes

29、的記錄有9個,取值為no的有5個,我們說這個樣本里有9個正例,5 個負(fù)例,記為S(9+,5-),S是樣本的意思(Sample)。這里熵記為Entropy(S),計算公式為:Entropy(S)= -(9/14)*log(9/14)-(5/14)*log(5/14)=-(9/14)*LOG(9/14,2)-(5/14)*LOG(5/14,2)=0.940解釋一下,9/14是正例的個數(shù)與總記錄之比,同樣5/14是負(fù)例占總記錄的比例。log(.)是以2為底的對數(shù)(我們知道以e為底的對數(shù)稱為自然對數(shù),記為ln(.),lg(.)表示以10為底的對數(shù))。在Excel里我們可以隨便找一個空白的單元格,鍵入以

30、下公式即得0.940,其中“2”的含義與上同。然后再分別以Wind、Humidity、Outlook和Temperature作為根節(jié)點,計算其信息增益。以wind為節(jié)點:Entropy(weak)=-(6/8)*log(6/8,2)-(2/8)*log(2/8,2)=0.811278124Entropy(strong)=-(3/6)*log(3/6,2)-(3/6)*log(3/6,2)=1.0Gain(wind)=Entropy(s)-(6/14)*Entropy(weak)-(8/14)*Entropy(strong)=0.04784107類似以Humidity為節(jié)點:Entropy(Hi

31、gh)=-(3/7)*log(3/7,2)-(4/7)*log(4/7,2)=0.985228136Entropy(normal)=-(6/7)*log(6/7,2)-(1/7)*log(1/7,2)=0.591672779Gain(Humidity)=Entropy(s)-(7/14)*Entropy(weak)-(7/14)*Entropy(strong)=0.151549543類似以O(shè)utlook為節(jié)點:Entropy(sunny)=-(3/5)*log(3/5,2)-(2/5)*log(2/5,2)=0.970950594Entropy(rain)=-(3/5)*log(3/5,2)-

32、(2/5)*log(2/5,2)=0.970950594Entropy(overcast)=0Gain(outlook)=Entropy(s)-(5/14)*Entropy(sunny)-(5/14)*Entropy(rain)-(0)*Entropy(overcast)=0.246463861類似以Temperature為節(jié)點:Entropy(hot)=-(2/4)*log(2/4,2)-(2/4)*log(2/4,2)=1Entropy(cool)=-(3/4)*log(3/4,2)-(1/4)*log(1/4,2)=0.811278124Entropy(mild)=-(4/6)*log(

33、4/6,2)-(2/6)*log(2/6,2)=0.918295834Gain(temperature)=Entropy(s)-(4/14)*Entropy(hot)-(4/14)*Entropy(cool)-(6/14)*Entropy(mild)=0.028936607最后按照信息增益最大的原則選Outlook為根節(jié)點。子節(jié)點重復(fù)上面的步驟。這顆樹可以是這樣的,它讀起來就跟你認(rèn)為的那樣。RFM:掌握RFM的基本原理,給出一個具體實例RFM模型原理:根據(jù)美國數(shù)據(jù)庫營銷研究所Arthur Hughes的研究,客戶數(shù)據(jù)庫中有三個神奇的要素,這三個要素構(gòu)成了數(shù)據(jù)分析最好的指標(biāo):最近一次消費(Rec

34、ency)、消費頻率(Frequency)、消費金額(Monetary)。 RFM模型:R(Recency)表示客戶最近一次購買的時間有多遠(yuǎn),F(xiàn)(Frequency)表示客戶在最近一段時間內(nèi)購買的次數(shù),M (Monetary)表示客戶在最近一段時間內(nèi)購買的金額。一般原始數(shù)據(jù)為3個字段:客戶ID、購買時間(日期格式)、購買金額,用數(shù)據(jù)挖掘軟件處理,加權(quán)(考慮權(quán)重)得到RFM得分,進(jìn)而可以進(jìn)行客戶細(xì)分,客戶等級分類,Customer Level Value得分排序等,實現(xiàn)數(shù)據(jù)庫營銷!近度R:R代表客戶最近的活躍時間距離數(shù)據(jù)采集點的時間距離,R越大,表示客戶越久未發(fā)生交易,R越小,表示客戶

35、越近有交易發(fā)生。R越大則客戶越可能會“沉睡”,流失的可能性越大。在這部分客戶中,可能有些優(yōu)質(zhì)客戶,值得公司通過一定的營銷手段進(jìn)行激活。頻度F:F代表客戶過去某段時間內(nèi)的活躍頻率。F越大,則表示客戶同本公司的交易越頻繁,不僅僅給公司帶來人氣,也帶來穩(wěn)定的現(xiàn)金流,是非常忠誠的客戶;F越小,則表示客戶不夠活躍,且可能是競爭對手的???。針對F較小、且消費額較大的客戶,需要推出一定的競爭策略,將這批客戶從競爭對手中爭取過來。額度M:表示客戶每次消費金額的多少,可以用最近一次消費金額,也可以用過去的平均消費金額,根據(jù)分析的目的不同,可以有不同的標(biāo)識方法。一般來講,單次交易金額較大的客戶,支付能力強(qiáng),價格敏感度低,是較為優(yōu)質(zhì)的客戶,而每次交易金額很小的客戶,可能在支付能力和支付意愿上較低。當(dāng)然,也不是絕對的。最后通過RFM分析將客戶群體劃分成重要保持客戶、重要發(fā)展客戶

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論