誰是最好的客戶-使用SPSS從營銷數據中獲得(doc 15)_第1頁
誰是最好的客戶-使用SPSS從營銷數據中獲得(doc 15)_第2頁
誰是最好的客戶-使用SPSS從營銷數據中獲得(doc 15)_第3頁
誰是最好的客戶-使用SPSS從營銷數據中獲得(doc 15)_第4頁
誰是最好的客戶-使用SPSS從營銷數據中獲得(doc 15)_第5頁
已閱讀5頁,還剩14頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、誰是最好的客戶?使用SPSS從營銷數據庫中獲得更多信息備注:這是一篇思路非常清晰的市場挖掘方面的文章,主要側重于從統(tǒng)計的角度來看待數據挖掘,而不是側重于從機器學習的角度。非常適合具有統(tǒng)計背景的人員迅速切入數據挖掘領域。美中不足的是沒有給出具體的數據這樣我們不能按圖索驥地將文章中介紹的方法操作一遍。網上也流傳一篇由SPSS北京辦事處翻譯的pdf版,但我覺得還是原來的英文版講得詳細點。歡迎前來交流營銷和數據挖掘 MSN:mktexchage。摘要本文使用SPSS 的頻數分析、描述性分析、缺失值分析、方差分析、卡方檢驗、交叉表、均值比較、相關分析、線性回歸、決策樹等統(tǒng)計方法及餅狀圖、條形圖、箱圖、散

2、點圖、樹形圖等圖表對一個客戶數據案例進行分析,以發(fā)現不同客戶群體的特征,為市場推廣活動提供依據。關鍵詞市場,細分,客戶,統(tǒng)計,分析,比較誰是最好的客戶?任何行業(yè)專業(yè)人士市場人員,銷售經理,產品開發(fā)者和服務專家都樂意回答這個問題。 在當今激烈的市場中,開發(fā),吸引和保留客戶越來越困難同時也越來越昂貴。由于這些壓力,更多的組織使用營銷數據庫最大化他們現有的客戶價值。轉換客戶數據為知識和信息的行為是一個有力的手段和企業(yè)生存的一項必需的技能。 理解客戶的固有特征可以給你有價值的發(fā)現。了解最有價值或至少有利潤的客戶,他們的購買方式,購買行為和人口統(tǒng)計特征是制訂營銷計劃的關鍵。較好地理解客戶是什么可以幫助你

3、開發(fā)忠誠的,有持續(xù)回報的客戶,制訂提升銷售和交叉銷售及營銷定位計劃。集思廣益的決策也是廣告,促銷,直接郵寄活動和其他營銷成功的基礎。 有許多方式可以確定最佳客戶的特征,也有許多方法可用來度量這些特征。本文說明使用SPSS實現客戶分析的一種方法。 案例營銷數據庫中包含2000個客戶和下列數據: n 首次成為公司客戶的日期 n 購買歷史n 不同促銷方案的響應率n 家庭收入n 地區(qū)n 性別和其它人口統(tǒng)計數據 本文中我們從數據庫中析取可控信息,使用各種數據分析技術,從初級的到高級的,目標是依據過去的銷售額用人口統(tǒng)計數據來識別不同的細分客戶群。即使最普通的過程產生的結果對怎樣理解客戶也可以產生深刻的含意

4、。不要低估這些方法。用靈活和有力的分析工具結合你的業(yè)務背景是從數據中獲得有價值信息的最好方法。 首先探索:典型客戶是什么樣的? 我們通過從數據庫中探索不同的變量來回答這樣的問題: n 客戶住在哪里?在三個銷售區(qū)域中客戶的分布如何? n 客戶的平均收入是多少? n 成為公司客戶的時間有多長? n 對不同的促銷方案,客戶平均響應是多少?有多少人響應第一促銷方案? n 客戶花費是多少? SPSS 提供了可以迅速回答以上問題的幾種分析方法,頻數和描述性分析過程可以提供對客戶數據的初步印象。從圖1 餅狀圖中可以看出,東部地區(qū)所占比例最大(34%),西部地區(qū)最小(19%),而有16.9%的數據未列出所屬地

5、區(qū)。圖 1 和表 1。SPSS自動形成的圖表顯示最多的客戶(34%)生活在東部地區(qū)。頻數和描述過程非常適合對數據進行原始整理,可能在分析中許多想法都要用這種方法實現。 分析客戶住居在哪里幫助我們確定銷售版圖。頻數過程提供分類變量計數和百分比表,同時可用條圖,直方圖和餅圖表示數據。SPSS 自動地呈現這些表和圖的結果。 從分析中我們可以認識到什么證明是重要的。餅圖和表1顯示最大的客戶群(34%)生活在東部地區(qū),最小的客戶群(19%)生活在西部地區(qū)。并且有16.9%的客戶在數據庫中沒有列出居住區(qū)域。 SPSS 用特殊的處理表示缺失數據。知道何時為什么信息缺失很有必要。例如,你可能想區(qū)別是因為它們沒

6、有涉及而缺失還是因為它們難以獲得而缺失。表1中,“百分數” 包括缺失數據,“有效百分數” 從計算中排出了缺失數據, 可以從表上迅速并行比較缺失數據怎樣影響結果的。 要得到家庭收入的信息,我們需要幾個基本的統(tǒng)計量作為最初描述統(tǒng)計量。如平均值,最小和最大值,或連續(xù)變量,如以美元為單位的收入和以年數為單位的年齡。描述過程為我們提供了一系列匯總統(tǒng)計量。從表2可以看到在2000個客戶中家庭收入的平均值大約是 $61,000, 大部分收入范圍在 $50,000和 $72,000之間。表2. 描述過程顯示平均家庭收入大約是$61,000.要回答“成為公司客戶的時間有多長?” 的問題,我們必須處理一個字段然后

7、計算每個時間周期的客戶數。因為數據庫包含第一次成為公司客戶的日期,首先計算一個新變量:作為客戶的時長。使用SPSS中提供的眾多的時間函數,可以輕而易舉地用年數轉換成日期計算客戶的時長。計算這個新變量后,用時長的頻數表來表示客戶存在時間。 表 3. 頻數表顯示51%的客戶存在超過7年。從表 3 看出大約有29%的客戶存在10年以上,差不多有過半數的客戶在7年以上。接下來,我們要問“誰消費最多?”,最好的客戶理所當然是最有利潤的客戶,或為組織花費最多的客戶。 為了得到準確的客戶生命周期價值,結合前期購買和客戶行為建立預測模型預測未來購買。 本例中,我們開始用總訂單金額代替每個客戶。首先,建立一個新

8、變量,對數據庫中每個訂單金額(訂單1的金額,訂單2的金額等等)求和。因為總訂單金額是連續(xù)變量,直方圖是顯示結果的最有效的方法。 圖 2. 從直方圖可以看出大部分客戶消費低于$500,少數幾個客戶消費量比較大。 直方圖的直條代表一個數據范圍。在圖2中大部分客戶消費低于$500,少數幾個客戶消費量比較大。 每個客戶平均消費量是$1,360 ,很少有客戶消費量超過$7,000。當目前為止,我們知道典型的客戶是: n 生活在東部n 家庭平均收入為$61,000n 有七年購物歷史 n 在公司產品和服務上消費 $1,360 客戶對不同的促銷有怎樣的響應? 進行促銷分析是理解客戶的另一個重要步驟。評估營銷計

9、劃和促銷幫助分辨可以做什么可以不做什么。它準確地告訴我們何時及為什么某個計劃成功,所以你可以拷貝你的成功經驗和學習失敗的經驗。 要回答“每種促銷有多少人響應?”和“不同的促銷平均響應是多少?”的問題,可以對每種促銷響應運行頻數分析過程和對四種促銷的訂單運行描述分析過程。 表 4. 大約有45%,或890人對第一促銷方案有響應。 在表4中,有890人,或大約45%的客戶響應第一促銷方案。對其它促銷進行類似的分析,第二促銷方案的響應率是39%,第三促銷方案的響應率是37.4%,第四促銷方案的響應率是17.4%。 這里出現一個新問題:在第四促銷方案中唯一的特征是它較成功的獲得客戶響應的原因嗎?換句話

10、說,這種結果有意義嗎?購買歷史(表5)信息顯示第三促銷方案的平均值是$294, 低于其它促銷方案。這種差別是否有統(tǒng)計意義還需進一步分析來確定。 表 5. 購買歷史分析顯示第三促銷方案的平均值是$294, 低于其它促銷方案。 進一步分析:我們的客戶怎樣不同?怎樣相似? 既然對客戶和各種促銷的成功有一個基本的理解,通過觀察兩個或多個變量立刻支持這種有力的分析。SPSS 幫助發(fā)現用別的方式難于發(fā)現的潛在關系。例如,已經知道客戶在各區(qū)域分布和有多少客戶響應第一促銷方案。接下來要觀察各區(qū)域響應第一促銷方案的客戶有多少。通過研究回答這些問題: n 每個地區(qū)客戶生命周期平均是多少? n 各區(qū)域人們怎樣響應第

11、一促銷方案? SPSS很容易實現比較不同的分組數據。Crosstabs過程,Means過程, 分段條圖和箱圖都可以清晰地表示這些結果;當結果有統(tǒng)計意義時,可用卡方統(tǒng)計量,方差分析和CHAID識別。當你知道什么是有統(tǒng)計意義時,這就很重要了,因為你沒有浪費你的努力。 下一步探索的問題是“每個區(qū)域客戶平均生命周期是多少?”。一個強有力的統(tǒng)計圖,箱圖將均值和數據分布顯示在一起。 圖3箱圖中很容易看出西部地區(qū)客戶平均生命周期大于其它地區(qū)。 圖 3. 箱圖將均值和數據分布顯示在一起。很容易看出西部地區(qū)客戶平均生命周期大于其它地區(qū)。 均值比較提供聯合分布的匯總統(tǒng)計。表6(包含與箱圖相同的信息,但用表的形式)

12、顯示總平均時長是 7.49 年,西部地區(qū)比東部和中部地區(qū)平均占有期長。這個發(fā)現有意義嗎?統(tǒng)計顯著性告訴你如果差別是隨機的,或它們概率值很大,需進一步分析判斷。如果差別是隨機的,意味著結果同原假設一樣。即變量沒有顯著性影響或對結果沒有發(fā)生影響。 如果差別有統(tǒng)計意義,意味著備擇假設成立,表明有非隨機因素的潛在影響。當統(tǒng)計意義存在時,進一步探索非常必要。 表6. 均值比較報告顯示總平均生命周期是 7.49 年,西部地區(qū)比東部和中部地區(qū)占有時間要長。 圖7的ANOVA表顯示區(qū)域與時間周期有統(tǒng)計意義的差別。因為顯著性水平是0.000, 或小于0.05,能夠得出均值間差別很可能統(tǒng)計意義的結論:區(qū)域和生命周

13、期的差別很可能不是隨機因素引起的而與其它因素有關??赡艿脑蚴牵菏紫仍谖鞑繀^(qū)域開展促銷,但在不同的區(qū)域有更多的產品需求,或某種產品功能在一個區(qū)域成功地促銷。了解你的業(yè)務,關鍵數據,支持你的直覺也是很重要的。 表7. ANOVA表顯示各區(qū)域有統(tǒng)計意義差別,表明要做進一步的分析。 接著對促銷響應進行分析。SPSS使用分段條圖將四種促銷信息組合在一起,并將其可視化。圖4提供按區(qū)域響應方式匯總表??梢娭胁康貐^(qū)同其它兩個地區(qū)相比訂單較少,特別是同西部相比。通過觀察區(qū)域頻數分布不會得出這個推測,它只告訴我們西部地區(qū)包含最少的人口。 圖 4. SPSS 分段條圖提供快速清晰的方式表達各區(qū)域響應方式。 要查明

14、如果這是顯著的,我們要進一步按區(qū)域探索各種促銷結果。要回答“有多少人在各區(qū)域響應第一促銷方案”的問題,我們在第一促銷方案和區(qū)域因素上執(zhí)行交叉表過程。表8顯示響應第一個促銷方案的人有41.3%來自東部地區(qū)(列百分比)。而響應第一個促銷方案的人只有26.5%來自西部地區(qū),超過半數(50.5%)的西部居民(行百分比)響應了促銷。要理解如果區(qū)域確定對第一促銷方案可能的響應,比較的是區(qū)域百分比(行百分比)并發(fā)現東部地區(qū)的居民45%響應了這個促銷,中部地區(qū)的居民40%響應這個促銷。根據這個信息,對第一促銷方案,得出西部是一個促銷較好銷售區(qū)域的結論??墒牵敯俜謹悼雌饋聿煌瑫r,在西部地區(qū)啟動拷貝第一促銷方案

15、就沒有充分的理由。首先,我們必須確定這些百分數是否有統(tǒng)計意義。這里,如果統(tǒng)計意義存在,卡方統(tǒng)計量可以表示。 表 8. 響應第一個促銷方案的人只有26.5%來自西部地區(qū),超過半數的西部居民響應了促銷。 表 9 包含區(qū)域和第一促銷方案的卡方信息。按慣例皮爾松卡方統(tǒng)計量應該小于0.05才有統(tǒng)計顯著性意義(在95%的置信水平上)。在這個例子中卡方值是0.007, 所有它有顯著性意義。能夠有令人信服的理由確信第一促銷方案在西部地區(qū)比較成功,例如廣告語言直接滿足客戶聽覺上的需要,或媒體類型匹配客戶視覺需要,吸引客戶的眼球。通過識別哪一種活動在西部地區(qū)比較成功,能夠得到今后在該地區(qū)促銷的知識。也可以選擇探索

16、以區(qū)域為基礎的任何關系。 表 9. Chi-square 值是0.007 表示各地區(qū)在第一促銷方案上有顯著性的差異。 哪一位客戶消費最多? 觀察購買歷史的另一種方法是評估總消費量而不是只看在單一訂單上消費多少。也許總消費量同區(qū)域之間的關系可以揭示一些信息。 單因素方差分析給你一個有關平均值有顯著性差異的詳細信息。 首先單因素方差分析提供一個描述性統(tǒng)計表。表10顯示各地區(qū)四種促銷方案的總消費量平均差別非常大。在中部地區(qū)平均消費量是$1,206, 東部地區(qū)是$1,391, 而西部地區(qū)超過$1,600.報告的最后部分顯示東部和西部間消費水平的平均差異沒有顯著的統(tǒng)計意義。另一方面,西部和中部間的差異有

17、統(tǒng)計意義。能使用這些信息進一步識別這些地區(qū)的差別如何及為什么,制訂營銷定位計劃。例如,不同的營銷和銷售混合,不同的促銷,或綁定一些產品和服務或許在中部地區(qū)會更好。西部地區(qū)營銷計劃在西部重復應該更加成功。 表10. 單因素方差分析顯示東部和西部消費水平的差別沒有統(tǒng)計意義差別;西部和中部地區(qū)的差別有統(tǒng)計意義。 預測總消費量 預測模型是幫助定位潛在客戶和優(yōu)化營銷資源一種有力的武器。它能幫助回答如“按照收入家庭消費占他們的收入多少?”的問題。 在許多統(tǒng)計研究中,目標是用方程建立一種關系,用一個已知變量預測另一個變量。SPSS 提供幾個過程建立相關關系定義預測模型,從散點圖到相關關系,線性和邏輯回歸分析

18、再到CHAID分析。SPSS的指南按部就班地指導,你不必成為統(tǒng)計學家就可以完成這些過程。 圖 5. 散點圖顯示兩個變量相關關系。 表11. 相關系數是60.8%,顯示在家庭收入和總消費量上有很強的相關關系圖 5 顯示這兩個變量的相關關系。散點圖顯示兩個連續(xù)變量的聯合分布。相關系數是60.8%,表11顯示在家庭收入和總消費量上有很強的相關關系。回歸分析進一步確定模型的相關關系,如表12和圖6所示。這種關系意思是隨著家庭收入的增加,購買我們產品的總消費量也增加。 我們能夠使用這個模型發(fā)現更好的預測銷售和改進營銷努力。 表12 和圖 6. 線性回歸說明家庭收入和總消費量的關系。收入越多,消費越多。

19、范例的計劃包括:對較高收入的家庭提供較多的產品和服務,或制訂客戶保留計劃幫助維持較高收入家庭成為長期的客戶,匹配營銷資源給潛在收入的細分市場。到現在為止,已經看到客戶所在地區(qū)和他們的消費量間的相關關系。同時也看到收入與總消費量有正相關性。 細分有利潤的客戶群并進行成功的營銷。 營銷數據庫常常使用一種叫做CHAID的技術(卡方自動交互檢驗)。CHAID告訴我們幾個變量什么特征結合很可能導致什么結果,而不是只告訴我們兩個變量間的關系是否有意義。(例如,對促銷的響應)。我們輸入區(qū)域,產品類別,離散化的收入變量到CHAID模型中,去尋找哪一種特征結合最可能對第一促銷方案產生響應。CHAID自動建立結果

20、樹圖,如圖7所示。 圖7. CHAID 呈現哪一個特征結合最可能對第一促銷方案產生結果的模型。 圖 8 顯示根節(jié)點的細節(jié),哪些變量對第一促銷方案有最顯著的影響。收入被發(fā)現是最高的預測因子(它對應著前面回歸方程發(fā)現)。在這種情況下,CHAID超出回歸方程的范圍對其進行進一步的交互探索。 圖8. CHAID樹圖的根節(jié)點顯示收入作為最高響應的預測因子。在圖 9中, 下面的樹枝顯示如果收入水平在第三類($57,750 到 $65,000)并且產品類別在第一類則有73%的響應率。CHAID 在數據庫內顯示唯一的細分。所以你能夠支持特征的組合從營銷計劃中獲得最好的結果。我們發(fā)現家庭收入在$57,750到$65,000的客戶(購買第一類產品的客戶)很可能就是購買第一促銷方案的客戶。用其它變量作CHAID 分析可能導致其它的研究結果;例如,一般而言,我們發(fā)現中部地區(qū)對我們的各種促銷響應不好,另外一個收入組的婦女對我們的響應良好,因此對另外的客戶群采用直接郵寄方法也許有效果。 圖 9. CHAID 用收入水平的第三類($57,750 到$65,000)和產品分類的第一類劃分唯一的細分市場。 采取行動SPSS 允

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論