版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
基于決策樹的消費者響應(yīng)預(yù)測案例基于決策樹的廣告投入銷售額預(yù)測項目背景隨著人們生活節(jié)奏的加快,廣告在商品銷售中起到的作用越來越大,各個公司都已經(jīng)十分重視自身產(chǎn)品的廣告投入方式,從而將廣告的作用發(fā)揮到最大,來實現(xiàn)收益的最大化。精準投放廣告的作用有以下幾個方面。1、廣告是最大、最快、最廣泛的信息傳遞媒介。通過廣告,企業(yè)或公司能把產(chǎn)品與勞務(wù)的特性、功能、用途及供應(yīng)廠家等信息傳遞給消費者,溝通產(chǎn)需雙方的聯(lián)系,引起消費者的注意與興趣,促進購買。如果出現(xiàn)某些產(chǎn)品在某地積壓滯銷,而彼地卻缺少貨源,也可通過廣告溝通聯(lián)系。為了溝通產(chǎn)需之間的聯(lián)系,現(xiàn)在不僅生產(chǎn)單位和銷售單位刊登廣告,尋找顧客,而且一些急需某種設(shè)備或原材料的單位,也刊登廣告,尋找貨源。因此,廣告的信息傳遞能迅速溝通供求關(guān)系,加速商品流通和銷售。2、廣告能激發(fā)和誘導(dǎo)消費。消費者對某一產(chǎn)品的需求,往往是一種潛在的需求,這種潛在的需要與現(xiàn)實的購買行動,有時是矛盾的。廣告造成的視覺、感覺映象以及誘導(dǎo)往往會勾起消費者的現(xiàn)實購買欲望。有些物美價廉、適銷對路的新產(chǎn)品,由于不為消費者所知曉,所以很難打開市場,而一旦進行了廣告宣傳,消費者就紛紛購買。另外,廣告的反復(fù)渲染、反復(fù)刺激,也會擴大產(chǎn)品的知名度,甚至?xí)鹨欢ǖ男湃胃?。也會?dǎo)致購買量的增加。3、廣告能較好地介紹產(chǎn)品知識、指導(dǎo)消費。通過廣告可以全面介紹產(chǎn)品的性能、質(zhì)量、用途、維修安裝等,并且消除他們的疑慮,消除他們由于維修、保養(yǎng)、安裝等問題而產(chǎn)生的后顧之憂,從而產(chǎn)生購買欲望。4、廣告能促進新產(chǎn)品、新技術(shù)的發(fā)展。一新產(chǎn)品、新技術(shù)的出現(xiàn),靠行政手段推廣,既麻煩又緩慢,局限性很大,而通過廣告,直接與廣大的消費者見面,能使新產(chǎn)品、新技術(shù)迅速在市場上站穩(wěn)腳跟,獲得成功。如果我們能分析出廣告媒體投入與銷售額之間的關(guān)系,我們就可以更好地分配廣告開支并且使銷售額最大化。二、項目簡介1.項目內(nèi)容本項目將分析廣告的不同投入方式對銷售額的影響,并建立相關(guān)模型對不同廣告投入方式的銷售額進行預(yù)測。主要研究以下內(nèi)容:(1)不同廣告投入方式與銷售額之間的關(guān)系。(2)對不同廣告投入方式所帶來的銷售額進行預(yù)測。(3)嘗試給出合理化的廣告投入建議2.數(shù)據(jù)說明實驗使用從kaggle獲取的不同廣告投入方式和銷售額的數(shù)據(jù)。該數(shù)據(jù)共有4個字段,共202條內(nèi)容。每條內(nèi)容包含了不同廣告方式的投入額和相應(yīng)的銷售額。三、分析步驟1.理解數(shù)據(jù)在Pycharm中輸入下面程序,導(dǎo)入數(shù)據(jù)和工具包,并查看數(shù)據(jù)集的信息、大小,并初步觀察頭部信息。2.數(shù)據(jù)預(yù)處理在真實世界中,數(shù)據(jù)通常是不完整的(缺少某些感興趣的指標值)、不一致的(包含代碼或者名稱的差異)、極易受到噪聲(錯誤或異常值)的侵擾的。因為數(shù)據(jù)庫太大,而且數(shù)據(jù)集經(jīng)常來自多個異種數(shù)據(jù)源,低質(zhì)量的數(shù)據(jù)將導(dǎo)致低質(zhì)量的挖掘結(jié)果。就像一個大廚現(xiàn)在要做美味的蒸魚,如果不將魚進行去鱗等處理,一定做不成我們口中美味的魚。數(shù)據(jù)預(yù)處理就是解決上述所提到的數(shù)據(jù)問題的可靠方法,因此,在進行數(shù)據(jù)分析之前我們需要進行數(shù)據(jù)預(yù)處理。數(shù)據(jù)預(yù)處理一般要遵循以下規(guī)則:①完整性:單條數(shù)據(jù)是否存在空值,統(tǒng)計的字段是否完善。②全面性:觀察某一列的全部數(shù)值,通過常識來判斷該列是否有問題,比如:數(shù)據(jù)定義、單位標識、數(shù)據(jù)本身。③合法性:數(shù)據(jù)的類型、內(nèi)容、大小的合法性。比如數(shù)據(jù)中是否存在非ASCII字符,性別存在了未知,年齡超過了150等。④唯一性:數(shù)據(jù)是否存在重復(fù)記錄,因為數(shù)據(jù)通常來自不同渠道的匯總,重復(fù)的情況是常見的。行數(shù)據(jù)、列數(shù)據(jù)都需要是唯一的。本項目對數(shù)據(jù)進行數(shù)據(jù)類型轉(zhuǎn)換和缺失值處理兩種預(yù)處理方法,以確保其完整性、全面性與合法性。(1)數(shù)據(jù)類型轉(zhuǎn)換首先,通過Dataframe中的info()函數(shù)查看各數(shù)據(jù)字段數(shù)據(jù)類型和缺失值情況。經(jīng)過觀察,發(fā)現(xiàn)所有數(shù)據(jù)類型都為浮點型數(shù)據(jù),所以不需要進行數(shù)據(jù)類型的轉(zhuǎn)換。(2)缺失值處理在上述數(shù)據(jù)類型轉(zhuǎn)換過程中,發(fā)現(xiàn)radio和newspaper列存在數(shù)值缺失,需要對該缺失數(shù)據(jù)進行處理。缺失值指的是現(xiàn)有數(shù)據(jù)集中某個或某些指標的值是不完全的。其一般處理主要有以下方法:①刪除指標或者刪除樣本:如果大部分樣本該指標都缺失,這個指標能提供的信息有限,可以選擇放棄使用該維指標。②統(tǒng)計填充:對于缺失值的指標,尤其是數(shù)值類型的指標,根據(jù)所有樣本關(guān)于這維指標的統(tǒng)計值對其進行填充,如使用平均數(shù)、中位數(shù)、眾數(shù)、最大值、最小值等,具體選擇哪種統(tǒng)計值需要具體問具體分析。③統(tǒng)一填充:常用的統(tǒng)一填充值有“空”、“0”、“正無窮”、“負無窮”等;④預(yù)測/模型填充:可以通過預(yù)測模型利用不存在缺失值的指標來預(yù)測缺失值,如統(tǒng)計、學(xué)習(xí)等。這種雖然方法復(fù)雜,但是最后得到的結(jié)果比較好。本項目通過dropna方法刪除該樣本的缺失值來進行缺失值處理。結(jié)果顯示,缺失值處理已經(jīng)完成,下面可以進行數(shù)據(jù)可視化分析。(3)探索性數(shù)據(jù)分析探索性數(shù)據(jù)分析(ExploratoryDataAnalysis,EDA)是對數(shù)據(jù)進行分析并得出規(guī)律的一種數(shù)據(jù)分析方法,是一種利用各種工具和圖形技術(shù)(如柱狀圖、直方圖等)分析數(shù)據(jù)的方法。它是一個開放式的過程,在這個過程中,我們可以繪制圖表并計算統(tǒng)計數(shù)據(jù)以便探索我們的數(shù)據(jù)。EDA的目標是確定我們的數(shù)據(jù)可以告訴我們什么。與目標相關(guān)的變量對模型很有用,因為他們是用于預(yù)測目標。簡單說就是畫圖來理解數(shù)據(jù),EDA探索性數(shù)據(jù)分析本質(zhì)上就是用圖畫圖的方式來理解數(shù)據(jù)。首先,通過散點圖分析每一種廣告投放方式的銷售額分布情況:通過繪制每一個維度特征與銷售額的散點圖,可以大概看出,各種廣告投入與銷售額成正比。然后我們在畫出各個投放方式金額的平均數(shù)和銷售額的條形圖來更加直觀的證明這個結(jié)論。從下圖我們也可以清晰的看出電視這種廣告投放方式的平均值最高,這和我們上面得到的散點圖基本一致,電視廣告投放散點圖分布有明顯的集中趨勢。但是我們要清楚散點圖分布只能看出一個模糊的大概,具體量化的關(guān)聯(lián)性,可以通過關(guān)聯(lián)矩陣和熱力圖進行展示,首先就是corr()方法輸出關(guān)系矩陣。然后可以將輸出的數(shù)據(jù)進行圖形可視化,較為常用的就是熱力圖,直接利用上面的結(jié)果進行輸出。繪制熱力圖的代碼如下查看關(guān)聯(lián)矩陣和熱力圖都只需要查看主對角線(左上角到右下角對角線)的一側(cè)即可,由于這里探究的是利潤與其它三個影響因素之間的關(guān)系,因此只需要看最后一行的數(shù)據(jù)即可。數(shù)值在(0.45,1)或者(-1,-0.45)之間,都可以認為兩者具有相關(guān)性。比如上面的輸出結(jié)果,利潤和電視投放以及廣播投放都是有關(guān)聯(lián),而與新聞報紙的投放沒有關(guān)聯(lián)。(4)銷售額預(yù)測使用決策樹模型分析:結(jié)果顯示,決策樹模型的R2(擬合優(yōu)度)較高,均大于百分之九十。接下來畫出模型的學(xué)習(xí)曲線,觀察模型的擬合情況。五、實驗總結(jié)1.結(jié)果分析根據(jù)以上分析,可以得到結(jié)論:要想增加商品的銷售額,我們應(yīng)該首先考慮增加電視廣告和電臺廣告的投入量,因為商品的銷售額與這兩種廣告投放方式的關(guān)系最大。我們要嚴格控制在報紙上的廣告投入量,因為經(jīng)過我們分析,報紙廣告投入這種方式與銷售額并沒有什么明顯關(guān)系,換句話說,加大報紙廣告投入量并不能提高銷售額,所以我們也就沒有必要增加報紙的廣告投入。2.改善建議(1)現(xiàn)代化企業(yè)的廣告宣傳并不能只著眼于傳統(tǒng)宣傳方式,隨著互聯(lián)網(wǎng)平臺的崛起,在新媒體營銷時代背景下,企業(yè)產(chǎn)品的銷售模式也隨之發(fā)生改變。當前企業(yè)轉(zhuǎn)變生產(chǎn)產(chǎn)品營銷可以借助新媒體中的互聯(lián)網(wǎng)平臺來開展,可以此有效的降低企業(yè)的銷售成本和運輸費用,以此實現(xiàn)企業(yè)的經(jīng)濟效益增長,為生產(chǎn)企業(yè)的健康發(fā)展提供保障。(2)企業(yè)不
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年雞場生態(tài)養(yǎng)殖與技術(shù)開發(fā)合同3篇
- 2024適用個人借貸協(xié)議模板版B版
- 2024年第三方擔保責任合同執(zhí)行與監(jiān)督管理細則3篇
- 2024年離婚財產(chǎn)分配模板合同
- 2025年度風(fēng)力發(fā)電機組安裝合同3篇
- 2024環(huán)保項目居間合作合同
- 2024智能交通工具設(shè)計與制造合作協(xié)議
- 2024旅行社租車協(xié)議、合同
- 2024年社區(qū)生鮮自助取貨協(xié)議3篇
- 2024房地產(chǎn)融資居間合同格式范文
- 股權(quán)質(zhì)押登記授權(quán)委托書
- 混凝土采購運輸組織供應(yīng)、運輸、售后服務(wù)方案
- 2024糖尿病酮癥酸中毒診斷和治療課件
- 審計職業(yè)生涯規(guī)劃書
- 2024-2029年中國脊柱側(cè)彎支具行業(yè)市場現(xiàn)狀分析及競爭格局與投資發(fā)展研究報告
- 新媒體部門崗位配置人員架構(gòu)圖
- 認識各種樂器
- 神農(nóng)架自然保護區(qū)森林生態(tài)系統(tǒng)服務(wù)價值評估
- DJG330110-T 0101-2022 電動自行車充換電站建設(shè)及運營管理規(guī)范
- 2023年中考語文二輪復(fù)習(xí):圖(表)文轉(zhuǎn)化之徽標圖標 練習(xí)題匯編(含答案解析)
- 高考培優(yōu)方案
評論
0/150
提交評論