版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
基于PSM的定價策略Let’sStart第7章PSM的原理TheprincipleofPSMPSM的流程ThePSMprocess問題的提出RaiseaquestionPSM的優(yōu)缺點AdvantagesanddisadvantagesofPSMCONTENTS目錄定價案例示范Pricingcasedemonstration思考題Thinkingproblems1問題的提出(一)定價傳統(tǒng)銷售模式下,制造商很難知道每個消費者對產(chǎn)品的需求價格,因此制造商幾乎不可能對產(chǎn)品實施一級的價格歧視(即企業(yè)將產(chǎn)品價格設(shè)定為消費者愿意并且能夠支付的最高價格)。在大數(shù)據(jù)背景下,產(chǎn)品定價模型與傳統(tǒng)定價模型相同,同時借助大數(shù)據(jù)技術(shù),能夠更好地理解消費者的需求彈性,使歧視性定價更加準(zhǔn)確。但是,預(yù)測最優(yōu)定價與定價的合理區(qū)間是制定產(chǎn)品價格策略必不可少的重要一個環(huán)節(jié)。企業(yè)對產(chǎn)品價格設(shè)定的想法與消費者的感知若是不匹配,必將會影響企業(yè)收入,因此,通過調(diào)查數(shù)據(jù)計算消費者對新產(chǎn)品的可接受價格的范圍是正確的營銷決策的一個基礎(chǔ)。(二)問題設(shè)計現(xiàn)某企業(yè)正打算推出一款新產(chǎn)品,目前還在定價階段,由于該企業(yè)之前推出的一款產(chǎn)品定價過高,導(dǎo)致銷量很差,因此本次定價格外謹(jǐn)慎。該企業(yè)先根據(jù)成本以及市面上該類產(chǎn)品的競品價格,初步將價格區(qū)間設(shè)定在50-100之間。很顯然,這價格區(qū)間是一個非常寬泛的范圍。為了科學(xué)合理的確定最終價格,該企業(yè)決定讓運營部基于數(shù)據(jù)分析來給出一個相對精準(zhǔn)、相對靠譜的價格設(shè)定,即通過一定的技術(shù)手段確定這款新產(chǎn)品的最優(yōu)價格設(shè)定應(yīng)是多少?較為合理的價格區(qū)間又是多少?(三)問題的解決思路產(chǎn)品價格的制定既不能違背經(jīng)濟(jì)發(fā)展的客觀規(guī)律,也不能完全堅持固有的理論模型;因此,我們需要找到一種方法,根據(jù)具體的產(chǎn)品市場和競爭情況來確定價格的一致性,從而得到最優(yōu)的銷售價格。由于企業(yè)經(jīng)營的多樣性,對市場的理解和態(tài)度也不同,因此企業(yè)制定產(chǎn)品價格的目標(biāo)和策略也不同。該企業(yè)數(shù)據(jù)分析員在查閱相關(guān)資料后決定通過問卷調(diào)查的方式,對獲取到的數(shù)據(jù)進(jìn)行價格敏感度測試,最終得到一個合理的理論價格。2PSM的原理
PSM即:PriceSensitivityMeasurement,是一種簡單適用的價格敏感度測試方法。
PSM通常依次詢問被訪者4種價格:樂意購買、物超所值的價格(低的價格);太便宜以至于不愿意購買的價格(太低的價格)、貴但仍能接受的價格(高的價格)、太貴以至于不愿意購買的價格(太高的價格)。基于被訪者數(shù)據(jù),統(tǒng)計出四種價格在具體價格點上頻數(shù)與頻數(shù)累積的百分比(如表7-1所示)PSM完全基于被訪者的自然反應(yīng),充分考慮顧客購買的主觀意愿,又兼顧企業(yè)經(jīng)濟(jì)利益最大化的追求,但沒有與任何競品做比較,只做單一品牌產(chǎn)品價格測試。旨在測試產(chǎn)品在不同價格下對顧客的價值,以此預(yù)測最優(yōu)定價以及定價的合理區(qū)間。PSM能夠有效界定價格區(qū)間,可通過價格趨勢圖、氣泡圖、正態(tài)分布圖等展示合適的產(chǎn)品定價策略。特別是在新產(chǎn)品上市前,PSM適用于對目標(biāo)顧客群體中產(chǎn)品的可接受價格水平進(jìn)行深入研究,從消費者那里獲得產(chǎn)品價格的可接受范圍。3PSM的流程PSM流程的四個階段:(1)問卷與價格梯度表設(shè)計。①基于成本導(dǎo)向、競爭導(dǎo)向的定價方法等,設(shè)計出能夠覆蓋產(chǎn)品可能價格范圍的價格梯度表。②基于產(chǎn)品,設(shè)計詢問受訪者的四類價格問題。問題1(Q1):你感覺什么樣的價格便宜且愿意購買嗎?問題2(Q2):你感覺什么樣的價格高但還愿意購買嗎?問題3(Q3):你感覺什么樣的價格太高而不會購買嗎?問題4(Q4):你感覺什么樣的價格太便宜的讓人懷疑產(chǎn)品質(zhì)量等而不敢購買嗎?PSM測量問卷中也可以包括其他題項,如從消費者視角考慮被訪者的其他信息設(shè)計。PSM流程的四個階段:(2)問卷調(diào)查。被訪者要在第一步獲得的價格梯度表上做出四項選擇:不可接受的太便宜價格、可接受的便宜價格,可接受的昂貴價格、不可接受的太貴價格。(3)數(shù)據(jù)處理。問卷中的四個問題需要遵循嚴(yán)格的數(shù)量次序,即同一個受訪者描述Q3、Q2、Q1、Q4四個問題的價格在數(shù)量上是嚴(yán)格遞減關(guān)系,否則該樣本將會被剔除。為所獲得的樣本數(shù)據(jù)繪制累計百分比曲線圖。(4)結(jié)論描述。根據(jù)太低、低、高、太高四條曲線的交點來判斷被訪者可接受的產(chǎn)品價格區(qū)間和最優(yōu)價格設(shè)定。4PSM的優(yōu)缺點1.PSM優(yōu)點PSM既考慮了消費者的意愿,又兼顧了企業(yè)經(jīng)濟(jì)利益最大化的追求,被廣泛應(yīng)用于市場研究的價格測試中。PSM特別適用于新產(chǎn)品的價格研究。2.PSM缺點PSM雖然考慮到了消費者的意愿,卻忽視了消費者的實際購買能力。事實上,即使消費者認(rèn)為價格合理,也會因購買力受限而導(dǎo)致購買失敗。5定價案例示范可視化信息1.搜索數(shù)據(jù)源2.對數(shù)據(jù)進(jìn)行預(yù)處理3.派生列4.計算占比5.繪制PSM價格敏感度折線圖6.產(chǎn)品精準(zhǔn)定價策略分析流程:可視化信息1.探索數(shù)據(jù)源本案例所收集到的問卷數(shù)據(jù)如表7-2所示。第1列表示價格,從50到100,后面4列分別代表“很劃算”、“便宜”、“有點貴”、“太貴”,下面的數(shù)值代表選擇此選項的人數(shù),一共30個人。新建實驗,保存之后從左邊數(shù)據(jù)源中拖拽“關(guān)系數(shù)據(jù)源”到中間畫布區(qū),并在右邊參數(shù)數(shù)據(jù)源中選擇對應(yīng)的數(shù)據(jù)。執(zhí)行之后,在“關(guān)系數(shù)據(jù)源”節(jié)點鼠標(biāo)右鍵點擊,選擇查看輸出,即可查看本數(shù)據(jù)源詳細(xì)數(shù)據(jù)(如圖7-1所示)。圖7-1探索數(shù)據(jù)源可視化信息2.對數(shù)據(jù)進(jìn)行預(yù)處理通過觀察源數(shù)據(jù)可以發(fā)現(xiàn)“很劃算”至“太貴”四列的數(shù)據(jù)類型為文本型,需要將其改為數(shù)值型,此步驟可以通過平臺的“元數(shù)據(jù)編輯”節(jié)點實現(xiàn),拖拽“元數(shù)據(jù)編輯”節(jié)點,并與數(shù)據(jù)源節(jié)點進(jìn)行關(guān)聯(lián),如圖7-2所示?!霸獢?shù)據(jù)編輯”節(jié)點具體配置如圖7-3所示。圖7-2“元數(shù)據(jù)編輯”節(jié)點圖7-3元數(shù)據(jù)編輯可視化信息3.派生列新增四列數(shù)據(jù),該新增列數(shù)據(jù)內(nèi)容分別為很劃算、便宜、有點貴以及太貴的累計求和,首先在左側(cè)找到派生列選項,將其拖拽到畫布區(qū),并與“元數(shù)據(jù)編輯”節(jié)點進(jìn)行關(guān)聯(lián),如圖7-4所示。圖7-4元數(shù)據(jù)編輯可視化信息3.派生列然后對其進(jìn)行配置,先在編輯表達(dá)式中輸入“sum([需要求和的列名]over(orderby[排序參照的列名]‘如需反向排序在中括號內(nèi)輸入desc’)”其具體操作步驟如圖7-5所示,處理后的結(jié)果如圖7-6所示。第一列表達(dá)式:sum([很劃算])over(orderby[價格]desc)第二列表達(dá)式:sum([便宜])over(orderby[價格]desc)第三列表達(dá)式:sum([有點貴])over(orderby[價格])第四列表達(dá)式:sum([太貴])over(orderby[價格])圖7-5派生列圖7-6輸出結(jié)果可視化信息3.派生列觀察派生列后的數(shù)據(jù)發(fā)現(xiàn),“價格”列現(xiàn)在是降序狀態(tài),需要修改成升序,使用“排序”節(jié)點可完成該操作,拖拽“排序”節(jié)點到畫布區(qū),并與派生列相關(guān)聯(lián),如圖7-7所示。圖7-7輸出結(jié)果可視化信息3.派生列在排序選項卡中選擇“價格”列,并將其排序方式修改為“asc(升序)”,其具體操作如圖7-8所示。圖7-8排序排序后的結(jié)果如圖7-9所示。圖7-9排序后結(jié)果可視化信息4.計算占比計算很劃算,便宜,有點貴,有點貴的占比是通過python節(jié)點進(jìn)行編寫,拖拽“自定義模塊”中的“PYTHON腳本”,并與“排序”節(jié)點相關(guān)聯(lián),如圖7-10所示。圖7-10“PYTHON腳本”可視化信息4.計算占比代碼詳細(xì)內(nèi)容如下所示,代碼詳情如圖7-11所示,計算占比后的結(jié)果如圖7-12所示。注:python節(jié)點上方有三個接入口,代表最多可以對三個數(shù)據(jù)源同時進(jìn)行操作,分別對應(yīng)著dataframe1、dataframe2、dataframe3。#import是導(dǎo)入庫的過程importnumpyasnpimportpandasaspd
defexecute(dataframe1=None,dataframe2=None,dataframe3=None):dataframe1.columns=['價格','很劃算','便宜','有點貴','太貴','很劃算累計','便宜累計','有點貴累計','太貴累計']#第一行是連接表格的代碼,第二行是表格列名的設(shè)置。#新建占比列dataframe1['很劃算占比']=round((dataframe1['很劃算累計']/20),2).astype(float)dataframe1['便宜占比']=round((dataframe1['便宜累計']/56),2).astype(float)dataframe1['有點貴占比']=round((dataframe1['有點貴累計']/29),2).astype(float)dataframe1['太貴占比']=round((dataframe1['太貴累計']/75),2).astype(float)returndataframe1可視化信息4.計算占比圖7-11python代碼編寫圖7-12占比結(jié)果可視化信息4.計算占比將關(guān)系目標(biāo)源節(jié)點拖拽到畫布區(qū),并與前序節(jié)點相關(guān)聯(lián),如圖7-13所示。圖7-13關(guān)系目標(biāo)源可視化信息4.計算占比選擇對應(yīng)的數(shù)據(jù)源和SCHEMA,最后對數(shù)據(jù)表進(jìn)行命名,具體操作如圖7-14所示。圖7-14關(guān)系目標(biāo)源參數(shù)配置可視化信息5.繪制PSM價格敏感度折線圖 為了繪制PSM價格敏感度折線圖,選用可視化看板整體呈現(xiàn)。在后臺“分析展現(xiàn)”板塊創(chuàng)建自助儀表盤可達(dá)到效果,由于自助儀表盤只接受“數(shù)據(jù)集”和“業(yè)務(wù)主題”數(shù)據(jù)源,因此首先需要將導(dǎo)出的表制作成數(shù)據(jù)集。(1)自助數(shù)據(jù)集在數(shù)據(jù)集界面搜索欄點擊“自助數(shù)據(jù)集”,如圖7-15所示。圖7-15進(jìn)入自助數(shù)據(jù)集可視化信息5.繪制PSM價格敏感度折線圖 找到目標(biāo)數(shù)據(jù)表,將其另存為數(shù)據(jù)集,其設(shè)置如圖7-16所示。圖7-16自助數(shù)據(jù)集可視化信息5.繪制PSM價格敏感度折線圖 (2)繪制PSM價格敏感度折線圖PSM價格敏感度折線圖的繪制需要在“自助儀表盤”模塊進(jìn)行,因此首先需要新建一個自助儀表盤,如圖7-17所示。圖7-17自助儀表盤可視化信息5.繪制PSM價格敏感度折線圖 制作PSM價格敏感度折線圖,創(chuàng)建清單表組件,拖入所有列,如下圖7-18所示。具體各指標(biāo)的交叉點說明如表7-3所示。圖7-18選擇指標(biāo)數(shù)據(jù)可視化信息5.繪制PSM價格敏感度折線圖 最終圖形如下圖7-19所示。圖7-19最終圖可視化信息5.繪制PSM價格敏感度折線圖 可視化信息6.產(chǎn)品精準(zhǔn)定價策略分析得到圖7-20的結(jié)果后,總共4條態(tài)度線,它們共有4種交叉點價格,圖中可以看到:PMC值大概為59元,PME值約為78元,OPP值約為60元,IPP值約為71元。
那么說明:定價時不能低于59元,否則用戶會覺得產(chǎn)品價格過于便宜;同時也不能高于78元,否則用戶會覺得價格太高。即價格區(qū)間應(yīng)該介于59~78元之間。同時,價格最好不能為IPP值即71元,因為這個價格讓用戶覺得好像有點便宜又好像有點貴,有點模糊。最好的價格是OPP值即60元。
當(dāng)然OPP值只是個從圖來看的值,實際研究中通常會將價格區(qū)間59~70元作為一個參考,也可以制定價格為65元均可,最終還需要似實際情況共同而定。6思考題1.通過相關(guān)模塊,掌握營銷PSM模型的應(yīng)用。2.列舉一些PSM模型在其他領(lǐng)域的應(yīng)用。12基于決策樹的消費者響應(yīng)預(yù)測Let’sStart第8章決策樹的工作原理Howadecisiontreeworks構(gòu)造決策樹的算法Algorithmsforconstructingdecisiontrees問題的提出RaiseaquestionCONTENTS目錄消費者響應(yīng)預(yù)測案例示范Consumerresponsepredictioncasedemonstration思考題Thinkingproblems1問題的提出(一)促銷與消費者響應(yīng)促銷是營銷者主動與消費者溝通,將各種刺激產(chǎn)品消費的信息傳遞給消費者,吸引消費者購買的一種活動,常見的促銷策略包括廣告、人員推銷、營業(yè)推廣、公共關(guān)系和網(wǎng)絡(luò)營銷等。消費者響應(yīng)是指消費者對企業(yè)行為的態(tài)度以及所形成的消費意愿。日常生活中,消費者感知到的促銷具體手段有很多種,例如樣品、折價券、現(xiàn)金返還、買贈、滿減、抽獎等。這些手段往往都能給消費者帶來附加價值,從而激勵消費者購買。然而,附加價值對消費者的激勵作用存在邊際遞減效應(yīng)。當(dāng)附加價值達(dá)到某一水平后,每為消費者增加一個單位的附加價值所產(chǎn)生的銷售利潤轉(zhuǎn)為負(fù)數(shù)。因此,企業(yè)需要確定附加價值的大小,如分發(fā)樣品的數(shù)量、折價券的具體折扣、滿減時的標(biāo)準(zhǔn)設(shè)定等。(一)促銷與消費者響應(yīng)傳統(tǒng)營銷中的促銷工具選擇往往是根據(jù)企業(yè)以往經(jīng)驗以及競爭對手水平來確定的,即使有些企業(yè)會調(diào)研消費者對不同促銷手段的反應(yīng),但也只是事后才能知道促銷的效果,僅能為以后的促銷活動提供參考。在大數(shù)據(jù)背景下,企業(yè)可以通過對比消費者以往的購買行為數(shù)據(jù)和企業(yè)相應(yīng)的優(yōu)惠措施及優(yōu)惠程度,預(yù)先測試出消費者對不同優(yōu)惠程度的反應(yīng),通過建模判斷出企業(yè)提供的附加價值的邊際臨界值,以最小成本獲得最優(yōu)消費激勵效果。(二)問題設(shè)計數(shù)字時代,如何采取有效的廣告策略,如何引發(fā)消費者積極的響應(yīng),一直是消費者行為學(xué)的一個熱點議題。現(xiàn)實中,大量商家經(jīng)常給消費者發(fā)送促銷短信,特別是一些重要的節(jié)日前后,期望產(chǎn)生更多的購買行為。但通常只會有部分消費者做出積極響應(yīng),因此,知曉哪些消費者更有可能對企業(yè)促銷信息產(chǎn)生積極響應(yīng)對于優(yōu)化精準(zhǔn)營銷策略、提升營銷效果具有重要意義。精準(zhǔn)營銷就是找準(zhǔn)時機(jī),利用正確的通道向消費者傳達(dá)合適的信息,從而促使消費者做出企業(yè)所期待的響應(yīng)。決策樹算法基于一系列歸納算法的規(guī)則進(jìn)行數(shù)據(jù)分類,是一種典型的用于預(yù)測的算法。某公司數(shù)據(jù)分析運營專員準(zhǔn)備運用決策樹算法分析市場部收集到的客戶人群特征數(shù)據(jù),挖掘出客戶對于營銷活動的反應(yīng),從而專門推送廣告給會響應(yīng)營銷活動的客戶,以幫助企業(yè)減少成本。(三)問題的解決思路以往企業(yè)在分析促銷效果時存在明顯的滯后性,并且有一些促銷效果難以用量化的數(shù)據(jù)統(tǒng)計分析。在當(dāng)前大數(shù)據(jù)背景下,企業(yè)可以持續(xù)跟蹤營銷信息投放以及目標(biāo)消費者響應(yīng)的實時反饋,能夠?qū)崟r監(jiān)測營銷信息的投放效果,進(jìn)而調(diào)整與優(yōu)化營銷策略。消費者響應(yīng)預(yù)測是基于以往數(shù)據(jù),包括產(chǎn)品總體銷量情況、用戶消費情況、流量情況以及競爭情況等。本案例的基本思路是建立客戶人群特征數(shù)據(jù)的決策樹模型,具體如下:①首先觀察數(shù)據(jù),以找到主要特征屬性;②通過模擬得出營銷活動響應(yīng)的預(yù)測模型;③根據(jù)模型結(jié)果為電商賣家營銷策略提供建議。根據(jù)營銷廣告的投放情況,利用可視化的手段對本次營銷活動的效果進(jìn)行分析,最終形成廣告投放優(yōu)化建議。2決策樹的工作原理
決策樹是一種常用的以樹形結(jié)構(gòu)表達(dá)的分類算法,其中每個內(nèi)部節(jié)點表示一個屬性上的測試,每個分支代表一個測試輸出,每個葉節(jié)點代表一種類別。根節(jié)點到每個葉子節(jié)點均形成一條分類的路徑規(guī)則,如圖8-1所示。而對新的樣本進(jìn)行測試時,只需要從根節(jié)點開始,在每個分支節(jié)點進(jìn)行測試,沿著相應(yīng)的分支遞歸地進(jìn)入子樹再測試,一直到達(dá)葉子節(jié)點,該葉子節(jié)點所代表的類別即是當(dāng)前測試樣本的預(yù)測類別。決策樹內(nèi)部節(jié)點用矩形表示,葉子節(jié)點用橢圓表示。在決策樹中,每個葉節(jié)點都賦予一個類標(biāo)簽。每個非終結(jié)點(包括根節(jié)點以及內(nèi)部節(jié)點)則對應(yīng)一個屬性測試條件。從根節(jié)點到葉節(jié)點的每一條路徑都是決策樹的一條完整規(guī)則。圖8-1決策樹工作原理決策樹法是隨機(jī)決策模型中最常見、最普及的一種決策模式和方法。決策樹法屬于風(fēng)險型決策方法,可有效地控制了決策帶來的風(fēng)險。不同于確定型決策方法,應(yīng)用決策樹決策方法必須具備以下條件:(1)具有決策者期望達(dá)到的明確目標(biāo)(2)存在決策者可以選擇的兩個以上的可行的備選方案;(3)存在決策者無法控制的兩個以上不確定因素(如氣候變化、市場行情、經(jīng)濟(jì)發(fā)展動向等);(4)不同方案在不同因素下的收益或損失(簡稱損益值)可以計算出來;(5)決策者可以估計不確定因素發(fā)生的概率。當(dāng)今的社會經(jīng)濟(jì)活動中,競爭日趨激烈,現(xiàn)代企業(yè)的經(jīng)營方向面臨著許多可供選擇的方案,如何用最少的資源,贏得最大的利潤以及最大限度地降低企業(yè)的經(jīng)營風(fēng)險,是企業(yè)決策者經(jīng)常面對的決策問題,決策樹法能簡單明了地幫助企業(yè)決策層分析企業(yè)的經(jīng)營風(fēng)險和經(jīng)營方向。3構(gòu)造決策樹的算法可視化信息數(shù)字經(jīng)濟(jì)時代下,作為一種戰(zhàn)略性生產(chǎn)要素,數(shù)據(jù)參與到價值主張、價值創(chuàng)造、價值交付、價值捕獲的全過程,而算法則是收集、處理數(shù)據(jù),從而獲取營銷洞察的戰(zhàn)略性工具。決策樹算法是運用樹狀圖表示各決策的期望值,通過計算,最終優(yōu)選出效益最大、成本最小的決策方法。1.ID3算法1979年昆蘭提出了ID3算法,ID3算法是通過計算節(jié)點的信息增益來選擇節(jié)點屬性。信息增益越大,則表示使用該屬性作為節(jié)點對數(shù)據(jù)集劃分所獲得的"純度提升"越大。所以信息增益可以用于決策樹劃分屬性的選擇,其實就是選擇信息增益最大的屬性,ID3算法就是采用的信息增益來劃分屬性。ID3算法的規(guī)則相對簡單,可解釋性強(qiáng)。但同時存在缺陷,它傾向于選擇取值比較多的屬性,所以存在有些屬性可能對分類任務(wù)沒有太大作用(比如編號,但一般不會選擇編號字段作為一個屬性),但是這些屬性仍然會被選為最優(yōu)屬性。這種缺陷不是每次都會發(fā)生,只是存在一定概率,但針對可能發(fā)生的缺陷,后人提出了新的算法進(jìn)行改進(jìn)。2.C4.5算法C4.5算法采用基于信息增益率的方法遞歸選擇屬性形成決策樹,其中信息增益率=信息增益/屬性熵。ID3算法在計算時傾向于選擇取值比較多的屬性,但當(dāng)屬性有很多值的時候,相當(dāng)于被劃分成了許多份,雖然信息增益變大了,屬性熵也會變大,所以整體的信息增益率并不大,因此,C4.5算法避免了ID3算法的這個缺陷。ID3算法在構(gòu)造決策樹的時候,容易出現(xiàn)“過擬合”現(xiàn)象。而在C4.5算法中,會在決策樹構(gòu)造之后采用悲觀剪枝。悲觀剪枝通過遞歸估算每個內(nèi)部節(jié)點的分類錯誤率,比較剪枝前后這個節(jié)點的分類錯誤率來決定是否對其進(jìn)行剪枝,以提升決策樹的泛化能力。相比于ID3算法,C4.5算法用信息增益率替代了信息增益,解決了噪聲敏感的問題,并且可以對構(gòu)造樹進(jìn)行剪枝,同時還能處理連續(xù)數(shù)值與數(shù)值缺失的情況。不過,由于C4.5需要對數(shù)據(jù)集進(jìn)行多次掃描,算法效率相對較低。3.Cart算法CART算法是一種應(yīng)用廣泛的決策樹學(xué)習(xí)方法。Cart被稱為分類回歸樹,既能是分類樹,也能是回歸樹。Cart算法與ID3、C4.5算法的不同之處在于Cart算法生成的必須是二叉樹。也就是說,不管是回歸還是分類問題,不管是離散型還是連續(xù)型特征變量,不管是有多個還是兩個屬性取值,內(nèi)部節(jié)點只能二分每一個屬性值。在用于分類問題時,Cart算法使用Gini(基尼)指數(shù)最小化準(zhǔn)則來選擇特征劃分類型?;嶂笖?shù)(Gini不純度)表示在樣本集合中一個隨機(jī)選中的樣本被分錯的概率。Gini指數(shù)越小表示集合中被選中的樣本被參錯的概率越小,也就是說集合的純度越高,反之,集合純度越低。當(dāng)集合中所有樣本為一個類時,基尼指數(shù)為0。所以Cart算法選擇Gini指數(shù)小的屬性作為決策樹節(jié)點。4消費者響應(yīng)預(yù)測案例示范可視化信息1.探索數(shù)據(jù)源2.對數(shù)據(jù)進(jìn)行預(yù)處理3.構(gòu)建決策樹模型4.預(yù)測得到高響應(yīng)率客戶5.對賣家提出促銷策略6.從廣告營銷效果角度進(jìn)行可視化分析7.從客戶個人屬性角度進(jìn)行可視化分析8.對廣告營銷投放的優(yōu)化流程:1.探索數(shù)據(jù)源案例使用到的數(shù)據(jù)包含兩部門:一是訓(xùn)練集數(shù)據(jù),二是測試集數(shù)據(jù)。收集到的該賣家的歷史客戶人群特征訂單數(shù)據(jù)包含以下字段:客戶昵稱、用戶等級、用戶價值度、用戶活躍度、年齡、性別、收貨地址、寶貝種類、寶貝數(shù)量、支付金額、總瀏覽量、是否響應(yīng)。訓(xùn)練集共200條數(shù)據(jù),測試集共有100條數(shù)據(jù)。注:特征變量數(shù)為10,“是否響應(yīng)”字段為目標(biāo)變量僅存在于訓(xùn)練集中不存在于測試集中。表8-1為“客戶特征數(shù)據(jù)”(共100條數(shù)據(jù),此處只顯示前10條數(shù)據(jù)),表中包含了統(tǒng)計日期內(nèi)的用戶等級、用戶活躍度、用戶價值度以及支付金額等。表8-2為重要指標(biāo)詳解。首先將本實訓(xùn)用到的數(shù)據(jù)導(dǎo)入【關(guān)系數(shù)據(jù)源】中,新建實驗并保存實驗后,從左邊數(shù)據(jù)源模塊拖拽“關(guān)系數(shù)據(jù)源”節(jié)點至畫布區(qū),并在右邊參數(shù)區(qū)根據(jù)自己上傳數(shù)據(jù)時所保存的路徑找到數(shù)據(jù)表。隨后右擊“關(guān)系數(shù)據(jù)源”節(jié)點并點擊“執(zhí)行到此處”,執(zhí)行成功后右擊查看關(guān)系數(shù)據(jù)源節(jié)點的輸出結(jié)果,輸出部分?jǐn)?shù)據(jù)如圖8-2所示。圖8-2數(shù)據(jù)源2.對數(shù)據(jù)進(jìn)行預(yù)處理
(1)將字符型字段進(jìn)行特征轉(zhuǎn)換由于算法模型的字段僅支持?jǐn)?shù)值型格式,所以需要將字符型字段轉(zhuǎn)換成數(shù)值型,這里需要用到“特征轉(zhuǎn)換”節(jié)點來實現(xiàn)特征類型的轉(zhuǎn)換。如圖8-3所示,選擇【特征工程】中的“特征選擇”節(jié)點,在選擇特征列中將需要轉(zhuǎn)換類型的文本型字段“性別”和“收貨地址”添加到“已選字段列表”中,進(jìn)行特征轉(zhuǎn)換,為后續(xù)模型的訓(xùn)練做準(zhǔn)備。圖8-3選擇需要進(jìn)行轉(zhuǎn)換的特征列添加【特征工程】中的“特征轉(zhuǎn)換”節(jié)點至畫布區(qū),該節(jié)點的作用是為轉(zhuǎn)換特征列增添后綴名而形成新的一列字段。該新增后綴名如圖8-4所示,為Index。圖8-4新增后綴名通過抽取、變換進(jìn)行特征轉(zhuǎn)化處理,流程如圖8-5所示圖8-5流程圖變換后的新列列名及對應(yīng)數(shù)值如表8-3所示?!靶詣e”字段轉(zhuǎn)換為“column6Index”,“收貨地址”字段轉(zhuǎn)換為“column7Index”,具體見圖8-6所示。圖8-6訓(xùn)練集進(jìn)行特征轉(zhuǎn)化后的字段(2)特征選擇將進(jìn)行數(shù)值轉(zhuǎn)換好后的字段需進(jìn)行特征選擇操作,為后續(xù)模型訓(xùn)練做準(zhǔn)備。它的具體作用是從數(shù)據(jù)集中選取有用特征,用于分類預(yù)測或者回歸預(yù)測算法的訓(xùn)練。其中標(biāo)簽列必選,具體的特征列和標(biāo)簽列配置如下圖8-7所示。圖8-7選擇特征列和標(biāo)簽列所選擇特征列的字段為與所需要預(yù)測的“是否響應(yīng)”字段有較大相關(guān)性的特征字段,這里需注意的是特征列中應(yīng)選擇數(shù)值型字段和已經(jīng)進(jìn)行了特征變換的字段,對于已經(jīng)進(jìn)行了特征變換后的字段,即以Index結(jié)尾的字段,即“column6Index”和“column7Index”。而標(biāo)簽列為后續(xù)所需要預(yù)測的“是否響應(yīng)”字段。3.構(gòu)建決策樹模型(1)算法選擇&模型訓(xùn)練回顧本案例的目的是對電商客戶對營銷活動的響應(yīng)預(yù)測,這屬于分類問題,對應(yīng)的算法為分類算法,此處選擇決策樹算法。該算法是多酚類算法,是一種流行的機(jī)器學(xué)習(xí)分類算法,算法的核心是信息熵。它通過計算每個屬性的信息增益,認(rèn)為信息增益高的屬性是好屬性,每次劃分選擇信息增益最高的屬性作為劃分標(biāo)準(zhǔn),重復(fù)這個過程,直至生成一個好的分類訓(xùn)練樣本的決策樹。拖拽【機(jī)器學(xué)習(xí)】-【分類算法】-【多分類算法】中的“決策樹”節(jié)點和【數(shù)據(jù)預(yù)處理】中的“拆分”節(jié)點至畫布區(qū),“拆分”上節(jié)點承接進(jìn)行了“行選擇1”操作后的訓(xùn)練集。數(shù)據(jù)拆分是將原始樣本集按照訓(xùn)練集和測試集的方式拆分為兩個子集。拆分后各個子集的比例總和小于等于100%。數(shù)據(jù)拆分經(jīng)常作為回歸或者分類算法節(jié)點的前置節(jié)點。具體的算法參數(shù)配置如圖8-8所示,圖8-8決策樹算法的參數(shù)配置分裂特征的數(shù)量為32,樹的深度為4?!安鸱帧惫?jié)點的參數(shù)配置如圖8-9所示,數(shù)據(jù)集占比為0.7,隨機(jī)種子默認(rèn)為1。圖8-9拆分節(jié)點的參數(shù)配置選擇【機(jī)器學(xué)習(xí)】-【訓(xùn)練】中的“訓(xùn)練”節(jié)點和【機(jī)器學(xué)習(xí)】中的“預(yù)測”節(jié)點至畫布區(qū)?!坝?xùn)練”節(jié)點是基于選擇的特征,對各種分類和回歸算法進(jìn)行訓(xùn)練,左邊輸入為待訓(xùn)練的算法,右邊輸入則為訓(xùn)練集。而“預(yù)測”節(jié)點是根據(jù)訓(xùn)練集以及各種分類或回歸算法對測試集進(jìn)行結(jié)果預(yù)測,左邊輸入為已訓(xùn)練的模型或者已保存的模型,右邊輸入為測試集。最終將模型預(yù)測的結(jié)果承接給“評估”節(jié)點,對分類算法模型的預(yù)測效果進(jìn)行評估,檢驗?zāi)P驮诜诸惾蝿?wù)中的表現(xiàn)或者檢驗其在回歸任務(wù)中的可靠性。運行并查看評估節(jié)點,具體評估結(jié)果如圖8-10和圖8-111所示。圖8-10評估結(jié)果1圖8-11評估結(jié)果2混淆矩陣也稱誤差矩陣,是表示精度評價的一種標(biāo)準(zhǔn)格式,用n行n列的矩陣形式來表示。在數(shù)據(jù)挖掘領(lǐng)域,混淆矩陣是可視化工具,特別用于監(jiān)督學(xué)習(xí)。混淆矩陣的每一列代表了預(yù)測類別,每一列的總數(shù)表示預(yù)測為該類別的數(shù)據(jù)的數(shù)目;每一行代表了數(shù)據(jù)的真實歸屬類別,每一行的數(shù)據(jù)總數(shù)表示該類別的數(shù)據(jù)實例的數(shù)目。每一列中的數(shù)值表示真實數(shù)據(jù)被預(yù)測為該類的數(shù)目。如圖8-11所示,第一行第一列中的表示有50個實際歸屬0的實例被預(yù)測為0,同理,第一行第二列的4表示有4個實際歸屬為0的實例被錯誤預(yù)測為1??偟膩碚f,預(yù)測正確的有52個,預(yù)測錯誤的有6個。觀察評估結(jié)果1和結(jié)果2(圖8-11和圖8-12)可以看到,該模型的準(zhǔn)確率(預(yù)測某類正確的樣本比例)為89.66%,召回率(真實為正的樣本中預(yù)測為正的樣本)為92.59%,可知該模型預(yù)測效果較好。(2)對測試集進(jìn)行相關(guān)操作將第二個“關(guān)系數(shù)據(jù)源”拖入畫布區(qū),將“客戶特征數(shù)據(jù)-測試集”上傳至該數(shù)據(jù)源,由于該數(shù)據(jù)集的詳情數(shù)據(jù)已經(jīng)展示過了,這里不做過多陳述。對于訓(xùn)練集也需要進(jìn)行跟訓(xùn)練相關(guān)同樣的操作。一是,將文本型字段——“性別”和“收貨地址”進(jìn)行特征轉(zhuǎn)換為數(shù)值型字段,相關(guān)配置如圖8-12所示。圖8-12特征選擇的相關(guān)配置最終測試集的部分變換結(jié)果如圖8-13所示。圖8-13測試集進(jìn)行特征轉(zhuǎn)換的輸出二是,在進(jìn)行了特征變換后,進(jìn)行選擇特征列的操作。所選擇的特征列字段如圖8-14所示,注意選擇的字段應(yīng)為數(shù)值型字段。圖8-14特征選擇的相關(guān)配置4.預(yù)測得到高響應(yīng)率客戶 最后選擇【機(jī)器學(xué)習(xí)】中的“預(yù)測”節(jié)點對測試集中的數(shù)據(jù)進(jìn)行預(yù)測。預(yù)測節(jié)點是根據(jù)訓(xùn)練集以及各種分類或回歸算法對測試集進(jìn)行結(jié)果預(yù)測,左邊輸入為已訓(xùn)練的模型或者已保存的模型,右邊輸入為測試集。因此“預(yù)測”節(jié)點的左邊應(yīng)放入第四步已經(jīng)進(jìn)行了訓(xùn)練的數(shù)據(jù)集。整體的工作流如下圖8-15所示。圖8-15整體工作流運行第二個“預(yù)測”節(jié)點查看預(yù)測結(jié)果,在列最后出現(xiàn)新字段“prediction”即為預(yù)測的結(jié)果,如下圖8-16所示。圖8-16預(yù)測結(jié)果5.對賣家提出促銷策略 為了方便觀察預(yù)測結(jié)果,可以選擇“聚合”節(jié)點,對“prediction”中的結(jié)果進(jìn)行統(tǒng)計(如圖8-17所示)。根據(jù)該聚合結(jié)果,100名客戶中預(yù)測結(jié)果中,只有5名客戶會對營銷活動進(jìn)行響應(yīng),可以得出客戶對于該商家的營銷活動響應(yīng)率是比較低的。圖8-17對預(yù)測結(jié)果進(jìn)行聚合觀察整體模型的訓(xùn)練和預(yù)測結(jié)果,可以為賣家提出的策略如下:①郵件營銷。郵件營銷是與電商客戶保持聯(lián)系的一種非常好的方式,可以與了解業(yè)務(wù)、并對電商產(chǎn)品感興趣的客戶直接進(jìn)行溝通。②營銷自動化。營銷自動化,可以降低成本、提高轉(zhuǎn)換率、增加平均訂單價值,甚至在某些情況下,提升購物體驗。作為一項技能,營銷自動化就是在自動化平臺管理營銷過程和工作流程。可以找到適合自己電商業(yè)務(wù)的自動化營銷工具,并學(xué)會如何利用它。③頁面設(shè)計。圖表和頁面設(shè)計是網(wǎng)絡(luò)營銷的基本因素。廣告的方式、文章內(nèi)容、甚至是產(chǎn)品細(xì)節(jié)頁面外觀都影響著營銷信息或產(chǎn)品如何被大眾感知。④書寫,內(nèi)容營銷。書寫能力,本質(zhì)上就是能夠在網(wǎng)上交流。電商產(chǎn)品描述、博客帖子、引導(dǎo)文章、產(chǎn)品微視頻,都需要進(jìn)行書寫。如果寫得好,能幫助推廣電商產(chǎn)品。好的內(nèi)容營銷是電商營銷成功的一個關(guān)鍵點。6.從廣告營銷效果角度進(jìn)行可視化分析時代在不停的變化,從傳統(tǒng)的報紙、電視,到現(xiàn)在的互聯(lián)網(wǎng)出現(xiàn),廣告主才真正擦亮眼睛,不會盲目的投放,而是學(xué)會借助網(wǎng)絡(luò)的力量。然而,廣告投放是一門廣告投放運營人必備的功課之一,廣告投放一個最核心的目標(biāo)就是占領(lǐng)用戶的心智。廣告的作用就是告知、說服、提醒、強(qiáng)化等功能。所以,廣告主的投放的目的就是希望能夠時不時的提醒用戶,讓用戶對你的產(chǎn)品進(jìn)行轉(zhuǎn)化。因而,如何持續(xù)優(yōu)化廣告投放策略,成為了眾多廣告主優(yōu)先考慮的問題之一。將本實訓(xùn)用到的第二個數(shù)據(jù)源——廣告投放運營數(shù)據(jù),對廣告投放效果進(jìn)行分析,提出可行的優(yōu)化意見。將數(shù)據(jù)上傳至【數(shù)據(jù)集】中,以便后續(xù)對廣告投放效果進(jìn)行可視化的分析。可視化將在【分析展現(xiàn)】中的【自助儀表盤】版塊進(jìn)行呈現(xiàn),在數(shù)據(jù)搜索框中搜索已經(jīng)上傳至【數(shù)據(jù)集】中的數(shù)據(jù)名進(jìn)行搜索并點擊選擇。(1)各渠道點擊量可視化對廣告營銷效果分析,首先從對各投放的渠道的廣告點擊量進(jìn)行可視化分析。數(shù)據(jù)源中的“廣告投放渠道”字段包含三個廣告渠道內(nèi)容:社交廣告、搜索廣告和媒體廣告。由于對各廣告渠道的客戶的廣告點擊量的統(tǒng)計,因此將包含三個廣告渠道內(nèi)容的“廣告投放渠道”字段拖入列區(qū)域,將“客戶昵稱”字段拖入行區(qū)域,如下圖8-18所示。圖8-18選擇字段圖形選擇為“柱形圖”,如圖8-19所示。圖8-19圖形選擇對于圖形的坐標(biāo)軸以及圖形標(biāo)題的設(shè)置,可以在【組件設(shè)置】中進(jìn)行相關(guān)的設(shè)置。在組件部分可以看到相關(guān)標(biāo)題設(shè)置的選項區(qū)域,這里輸入標(biāo)題名稱為“各渠道點擊量對比”并設(shè)置合適的字體大小和標(biāo)題位置,如圖8-20所示。圖8-20組件設(shè)置在【標(biāo)記】處選項卡中可以設(shè)置圖形的顏色,標(biāo)簽等。這里想要顯示標(biāo)簽,并讓標(biāo)簽顯示在外,以及標(biāo)簽的字體大小。相關(guān)設(shè)置如圖8-21。圖8-21標(biāo)簽設(shè)置需要注意的是,想要達(dá)到對比的效果,這里需對各廣告渠道的客戶點擊量進(jìn)行排序,如上圖8-18中,對“客戶昵稱”字段的排序方式設(shè)置為“升序排序”。最終各渠道點擊量對比可視化如下圖8-22所示。圖8-22各渠道點擊量對比從該可視化柱形圖(如圖8-22)中可以看出,在三個廣告渠道中,媒體廣告渠道的點擊量最多,搜索廣告渠道的點擊量最低。說明了媒體廣告投放渠道要優(yōu)于搜索廣告和社交廣告渠道。(2)各渠道不同時間段點擊量可視化對各渠道投放廣告的時間段進(jìn)行可視化分析,拖入“廣告投放渠道”至行區(qū)域,“小時”字段至列區(qū)域。設(shè)置圖形為“柱圖”,并在【組件設(shè)置】中設(shè)置圖形的標(biāo)題為“各渠道不同時間段的點擊情況對比”。在“標(biāo)記”選項卡中可以設(shè)置圖形標(biāo)簽等。這里想要顯示標(biāo)簽,并讓標(biāo)簽顯示在外,以及標(biāo)簽的字體大小。相關(guān)的設(shè)置如圖8-23所示。圖8-23字段選擇&標(biāo)簽設(shè)置最終各渠道不同時間段的點擊量情況對比圖,如下圖8-24所示。圖8-24各渠道不同時間段的點擊情況對比如圖8-24是三個廣告渠道不同時間段的點擊量對比柱形圖。結(jié)合各渠道點擊量對比柱形圖,可知點擊瀏覽媒體廣告的客戶數(shù)量最多,廣告點擊量在主要在早上5時、上午12時和晚間的20時。結(jié)合三個廣告渠道不同時間段的點擊情況,早晨3時至4時以及下午時段13時至17時的點擊量都比較低,這幾個時間段的廣告投放效果很差。當(dāng)然,點擊率的高低對比也受各時間段的瀏覽量影響,點擊率的低的時間段有可能是由于高瀏覽量造成,點擊率高的時間也有可能是由于低流量早晨。(3)各渠道周點擊量可視化對各渠道投放廣告以星期為時間段進(jìn)行可視化分析,拖入“廣告投放渠道”至行區(qū)域,“星期幾”字段至列區(qū)域。設(shè)置圖形為“柱圖”,并在【組件設(shè)置】中設(shè)置圖形的標(biāo)題為“各渠道周點擊情況對比”。在“標(biāo)記”選項卡中可以設(shè)置圖形標(biāo)簽等。這里想要顯示標(biāo)簽,并讓標(biāo)簽顯示在外,以及標(biāo)簽的字體大小。可視化過程與上步驟相似,這里進(jìn)行省略。最終的可視化柱形圖如下圖8-25所示。圖8-25各渠道周點擊情況對比圖8-25統(tǒng)計出了各廣告渠道以星期為統(tǒng)計時間單位的點擊量情況對比柱形圖。通過分析可以看出這三個廣告渠道在周三點擊量在較高的水平,在周四的點擊量效果較差,其余時間點擊量比較平穩(wěn),說明周五的廣告投放率效果比較好。7.從客戶個
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 染色體病檢測指南及規(guī)范
- 企業(yè)年金管理效率提升研究
- 汽車露營地裝修施工合同范本格式
- 供應(yīng)鏈協(xié)同管理方案
- 科技清水池防水施工合同
- 電力公司總經(jīng)理勞動合同范例
- 旅游管理專業(yè)教師聘用合同
- 漁業(yè)公司電工招聘及維護(hù)協(xié)議
- 醫(yī)療捐贈物品使用準(zhǔn)則
- 健康管理中心健身房租賃協(xié)議
- 化工裝置年度設(shè)備檢修工程施工組織設(shè)計方案
- 管道壓力和壁厚對照表
- 提前退休特殊工種目錄是怎樣的
- 無人機(jī)組裝與調(diào)試實訓(xùn)教案
- 超激光冷焊機(jī)技術(shù)規(guī)格書
- 畢業(yè)論文混合動力汽車原理及發(fā)展前景研究
- 體檢科健康管理崗位職責(zé)(共18篇)
- 農(nóng)業(yè)種質(zhì)資源保護(hù)與利用中長期發(fā)展規(guī)劃
- 超實用年會方案流程進(jìn)度表
- 道路施工進(jìn)度計劃橫道圖
- 太陽能路燈安裝施工方案及工藝方法
評論
0/150
提交評論