




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、基于機(jī)器學(xué)習(xí)方法對(duì)銷(xiāo)售預(yù)測(cè)的研究銷(xiāo)售預(yù)測(cè)現(xiàn)狀與痛點(diǎn)銷(xiāo)售預(yù)測(cè)現(xiàn)狀與痛點(diǎn)CONTENTS0102 銷(xiāo)售預(yù)測(cè)四大步驟銷(xiāo)售預(yù)測(cè)四大步驟03 銷(xiāo)售預(yù)測(cè)基本方法銷(xiāo)售預(yù)測(cè)基本方法04 銷(xiāo)售預(yù)測(cè)效果評(píng)估方法與指標(biāo)銷(xiāo)售預(yù)測(cè)效果評(píng)估方法與指標(biāo)05 某電商網(wǎng)站銷(xiāo)售預(yù)測(cè)案例分享某電商網(wǎng)站銷(xiāo)售預(yù)測(cè)案例分享銷(xiāo)售預(yù)測(cè)全景圖銷(xiāo)售預(yù)測(cè)全景圖供貨鏈條供貨鏈條送貨時(shí)間、送貨地點(diǎn)、是否包郵等物流物流市場(chǎng)營(yíng)銷(xiāo)市場(chǎng)營(yíng)銷(xiāo)促銷(xiāo)方案促銷(xiāo)方案商品減價(jià)、商品促銷(xiāo)、組合銷(xiāo)售等生成和采購(gòu)生成和采購(gòu)合理安排生成和采購(gòu)的時(shí)間節(jié)點(diǎn),優(yōu)化庫(kù)存庫(kù)存庫(kù)存財(cái)務(wù)財(cái)務(wù)管理管理財(cái)務(wù)和會(huì)計(jì)財(cái)務(wù)和會(huì)計(jì)實(shí)時(shí)反饋公司財(cái)務(wù)報(bào)表,監(jiān)控公司資金流動(dòng)管理銷(xiāo)售預(yù)測(cè)的現(xiàn)狀與痛點(diǎn)銷(xiāo)售預(yù)測(cè)的現(xiàn)
2、狀與痛點(diǎn)銷(xiāo)售預(yù)測(cè)是完善客戶(hù)需求管理、指導(dǎo)運(yùn)營(yíng)、以提高企業(yè)利潤(rùn)為最終目的商業(yè)問(wèn)題。而預(yù)測(cè)的精確性預(yù)測(cè)的精確性是銷(xiāo)售預(yù)測(cè)的核心痛點(diǎn)。銷(xiāo)售預(yù)測(cè)的痛點(diǎn)銷(xiāo)售預(yù)測(cè)的痛點(diǎn)商業(yè)環(huán)境因素眾多,變化極快,難以及時(shí)把握和分析供應(yīng)鏈整體水平低,導(dǎo)致貨物積壓嚴(yán)重產(chǎn)品定價(jià)、商品服務(wù)的單一性,導(dǎo)致企業(yè)競(jìng)爭(zhēng)力小變化模式變化模式預(yù)測(cè)的基本思想預(yù)測(cè)的基本思想預(yù)測(cè)是通過(guò)歷史數(shù)據(jù)或其他外部因素構(gòu)建模型、學(xué)習(xí)其變化“模式”,利用該“模式”對(duì)未來(lái)事物進(jìn)行預(yù)測(cè)的一個(gè)過(guò)程。特點(diǎn)特點(diǎn):短期預(yù)測(cè)的精度要遠(yuǎn)遠(yuǎn)高于長(zhǎng)期預(yù)測(cè)。業(yè)務(wù)理論業(yè)務(wù)理論數(shù)據(jù)量數(shù)據(jù)量假設(shè)銷(xiāo)售預(yù)測(cè)體系框架銷(xiāo)售預(yù)測(cè)現(xiàn)狀與痛點(diǎn)銷(xiāo)售預(yù)測(cè)現(xiàn)狀與痛點(diǎn)CONTENTS0102 銷(xiāo)售預(yù)測(cè)四大步驟
3、銷(xiāo)售預(yù)測(cè)四大步驟03 銷(xiāo)售預(yù)測(cè)基本方法銷(xiāo)售預(yù)測(cè)基本方法04 銷(xiāo)售預(yù)測(cè)效果評(píng)估方法與指標(biāo)銷(xiāo)售預(yù)測(cè)效果評(píng)估方法與指標(biāo)05 某電商網(wǎng)站銷(xiāo)售預(yù)測(cè)案例分享某電商網(wǎng)站銷(xiāo)售預(yù)測(cè)案例分享收集數(shù)據(jù)收集數(shù)據(jù)確定預(yù)測(cè)對(duì)象、預(yù)測(cè)目標(biāo)和需求;預(yù)測(cè)周期:短、中和長(zhǎng)期需求與預(yù)測(cè)精度的權(quán)衡準(zhǔn)確性與可解釋性的權(quán)衡預(yù)測(cè)目標(biāo)預(yù)測(cè)目標(biāo)收集數(shù)據(jù)、整理指標(biāo)體系數(shù)據(jù)描述與數(shù)據(jù)探索數(shù)據(jù)預(yù)處理評(píng)價(jià)指標(biāo)評(píng)價(jià)指標(biāo)算法的選擇模型的訓(xùn)練與預(yù)測(cè)過(guò)擬合問(wèn)題的處理建立建模建立建模RMSE、MAPE等定量評(píng)價(jià)指標(biāo)AIC、BIC等模型評(píng)價(jià)指標(biāo)需求探索開(kāi)發(fā)完善預(yù)測(cè)的基本步驟預(yù)測(cè)的基本步驟預(yù)測(cè)目標(biāo)預(yù)測(cè)目標(biāo)預(yù)測(cè)對(duì)象:預(yù)測(cè)對(duì)象:性質(zhì)、結(jié)構(gòu)、業(yè)務(wù)場(chǎng)景等預(yù)測(cè)時(shí)間:預(yù)測(cè)時(shí)間
4、:短期預(yù)測(cè)、中期預(yù)測(cè)和長(zhǎng)期預(yù)測(cè)等精確性可解釋性時(shí)間數(shù)據(jù)量少于5天大于4周或1個(gè)月短期預(yù)測(cè)短期預(yù)測(cè)長(zhǎng)期預(yù)測(cè)中期預(yù)測(cè)介于兩者之間業(yè)務(wù)目標(biāo):業(yè)務(wù)目標(biāo):準(zhǔn)確性和模型可解釋性的匹配度數(shù)據(jù)探索對(duì)數(shù)據(jù)檢查和理解:比如庫(kù)存量為負(fù)值、星期數(shù)大于8等對(duì)結(jié)果變量的分析:包括分布、趨勢(shì)性、周期性等對(duì)預(yù)測(cè)變量的分析:包括變量篩選、多重共線(xiàn)性、相關(guān)性數(shù)據(jù)預(yù)處理中心化和標(biāo)準(zhǔn)化缺失值處理:鄰近插補(bǔ)、多重插補(bǔ)、線(xiàn)性插補(bǔ)等數(shù)據(jù)轉(zhuǎn)換:取對(duì)數(shù)、Box-Cox變換離群點(diǎn)處理數(shù)據(jù)降維和特征選擇:PCA、AIC/BIC等收集數(shù)據(jù)或理解數(shù)據(jù)收集數(shù)據(jù)或理解數(shù)據(jù)數(shù)據(jù)搜集目標(biāo)數(shù)據(jù)(內(nèi)部數(shù)據(jù)、外部數(shù)據(jù))額外數(shù)據(jù):天氣、經(jīng)緯度、節(jié)假日、CPI指數(shù)等時(shí)
5、期變量2015-05-2310.02015-05-2410.02016-05-099.82016-05-109.8時(shí)期變量2015-05-23NA2015-05-2410.02016-05-099.82016-05-10NA處理之前處理之后收集數(shù)據(jù)或理解數(shù)據(jù)收集數(shù)據(jù)或理解數(shù)據(jù)數(shù)據(jù)預(yù)處理的缺失值部分?jǐn)?shù)據(jù)預(yù)處理的缺失值部分處理缺失值的兩大類(lèi)方法:(1) 直接刪除缺失的預(yù)測(cè)變量(2) 利用不同的方法對(duì)預(yù)測(cè)變量的缺失值進(jìn)行插補(bǔ),插補(bǔ)方法有:均值插補(bǔ)、多重插補(bǔ)、隨機(jī)插補(bǔ)、K近鄰插補(bǔ)、線(xiàn)性插補(bǔ)等。注意:一般對(duì)于帶有時(shí)間戳的時(shí)序變量,考慮到變量的時(shí)效性和經(jīng)濟(jì)因素,通常采用鄰近插補(bǔ)法或者線(xiàn)性插補(bǔ)。一個(gè)需要進(jìn)行
6、數(shù)據(jù)變換的原因是去除分布的偏度。一個(gè)無(wú)偏分布是大致對(duì)稱(chēng)的分布,這意味著隨機(jī)變量落入分布均值兩側(cè)的概率大體一致。數(shù)據(jù)變換一般有兩種方法:(1) 對(duì)數(shù)據(jù)做變換,如取對(duì)數(shù)、平方根或倒數(shù)(2) Box-Cox變換收集數(shù)據(jù)或理解數(shù)據(jù)收集數(shù)據(jù)或理解數(shù)據(jù)數(shù)據(jù)預(yù)處理的數(shù)據(jù)變換部分?jǐn)?shù)據(jù)預(yù)處理的數(shù)據(jù)變換部分銷(xiāo)售預(yù)測(cè)現(xiàn)狀與痛點(diǎn)銷(xiāo)售預(yù)測(cè)現(xiàn)狀與痛點(diǎn)CONTENTS0102 銷(xiāo)售預(yù)測(cè)四大步驟銷(xiāo)售預(yù)測(cè)四大步驟03 銷(xiāo)售預(yù)測(cè)基本方法銷(xiāo)售預(yù)測(cè)基本方法04 銷(xiāo)售預(yù)測(cè)效果評(píng)估方法與指標(biāo)銷(xiāo)售預(yù)測(cè)效果評(píng)估方法與指標(biāo)05 某電商網(wǎng)站銷(xiāo)售預(yù)測(cè)案例分享某電商網(wǎng)站銷(xiāo)售預(yù)測(cè)案例分享主觀預(yù)測(cè)專(zhuān)家法時(shí)間序列指數(shù)平滑法自回歸移動(dòng)模型銷(xiāo)售預(yù)測(cè)的基本方法
7、銷(xiāo)售預(yù)測(cè)的基本方法機(jī)器學(xué)習(xí)線(xiàn)性回歸決策樹(shù)隨機(jī)森林xgboost神經(jīng)網(wǎng)絡(luò)支持向量回歸時(shí)間銷(xiāo)量銷(xiāo)量時(shí)間根據(jù)過(guò)去經(jīng)驗(yàn)經(jīng)驗(yàn)專(zhuān)家法專(zhuān)家法專(zhuān)家預(yù)測(cè)法: 由專(zhuān)家根據(jù)他們的經(jīng)驗(yàn)和判斷能力對(duì)待定產(chǎn)品的未來(lái)銷(xiāo)售進(jìn)行判斷和預(yù)測(cè),通常有三種不同的形式:(1)個(gè)別專(zhuān)家意見(jiàn)匯集法(2)專(zhuān)家小組法(3)德?tīng)柗品▋?yōu)點(diǎn): 簡(jiǎn)單、快速缺點(diǎn): 準(zhǔn)確率低、受人的主觀影響大指數(shù)平滑遵循“重近輕遠(yuǎn)”原則,對(duì)全部歷史數(shù)據(jù)采用逐步衰減的不等加權(quán)辦法進(jìn)行數(shù)據(jù)處理的一種預(yù)測(cè)方法。基本公式:+1 = + (1 )1其中,是時(shí)間的時(shí)間值;是平滑常數(shù),其取值范圍為0, 1。優(yōu)點(diǎn):簡(jiǎn)單、適合趨勢(shì)預(yù)測(cè)、模糊預(yù)測(cè)缺點(diǎn): 準(zhǔn)確率不高、需要趨勢(shì)性較好的數(shù)據(jù)指數(shù)
8、平滑法指數(shù)平滑法ARIMA模型是指將非平穩(wěn)時(shí)間序列轉(zhuǎn)化為平穩(wěn)時(shí)間序列,然后將結(jié)果變量做自回歸(AR)和自平移(MA)。自回歸移動(dòng)模型(自回歸移動(dòng)模型(ARIMA)訓(xùn)練集測(cè)試集機(jī)器學(xué)習(xí)算法模型參數(shù)模型評(píng)估特征篩選預(yù)測(cè)Y值真實(shí)Y值YX樣本數(shù)據(jù)銷(xiāo)售量影響銷(xiāo)售量的因素機(jī)器學(xué)習(xí)的實(shí)現(xiàn)流程機(jī)器學(xué)習(xí)的實(shí)現(xiàn)流程使用機(jī)器學(xué)習(xí)的有監(jiān)督學(xué)習(xí)對(duì)進(jìn)行銷(xiāo)量變化進(jìn)行建模,依據(jù)建模結(jié)果來(lái)預(yù)測(cè)未來(lái)銷(xiāo)量值。其實(shí)現(xiàn)流程如下:(X,Y)(4) 模型選擇,如隨機(jī)森林、LASSO等模型輸出x3x4x2x4x1x6x5x3x1x6x5特征篩選特征篩選特征篩選是一類(lèi)預(yù)測(cè)變量變換的方法,通過(guò)這種方式,能夠用更具有信息量的變量來(lái)構(gòu)建模型,排除無(wú)
9、信息量的變量的噪聲干擾,提高模型穩(wěn)健性。常用的特征篩選方法:(1) 相關(guān)性等統(tǒng)計(jì) 閾值過(guò)濾(2) 信息增益、信息增益率、基尼系數(shù)等 閾值過(guò)濾(3) 向前、向后和逐步選擇法,如AIC/BIC準(zhǔn)則 最小值原理簡(jiǎn)介:原理簡(jiǎn)介:通過(guò)結(jié)果變量與預(yù)測(cè)變量直接建立線(xiàn)性關(guān)系數(shù)值型回歸優(yōu)點(diǎn):優(yōu)點(diǎn):模型可解釋性強(qiáng)線(xiàn)性回歸模型:廣義線(xiàn)性模型線(xiàn)性回歸模型:廣義線(xiàn)性模型線(xiàn)性模型隨機(jī)分布指數(shù)分布、泊松分布等線(xiàn)性回歸 = 0 + 1 1 + 2 2 + + Y為銷(xiāo)量值,X為預(yù)測(cè)變量,N為預(yù)測(cè)變量個(gè)數(shù),為參數(shù)激活函數(shù)激活函數(shù):sigmod, log函數(shù)等缺點(diǎn):缺點(diǎn): 只適用于線(xiàn)性規(guī)律邏輯回歸邏輯回歸原理簡(jiǎn)介:原理簡(jiǎn)介:通過(guò)訓(xùn)
10、練數(shù)據(jù),形成if-then規(guī)則集合由根節(jié)點(diǎn)到葉節(jié)點(diǎn)的每一條路徑構(gòu)成規(guī)則對(duì)結(jié)果變量有主要解釋作用的特征會(huì)先分裂形成規(guī)則回歸樹(shù)用平方誤差最小化準(zhǔn)則,節(jié)結(jié)點(diǎn)為單元內(nèi)數(shù)值的平均值優(yōu)點(diǎn):優(yōu)點(diǎn): 可擬合非線(xiàn)性規(guī)律,計(jì)算復(fù)雜度較低缺點(diǎn):缺點(diǎn):容易出現(xiàn)過(guò)擬合決策樹(shù)(回歸樹(shù))決策樹(shù)(回歸樹(shù))妹紙?jiān)u分:0,10五官端正五官端正是否身材身材好是否有錢(qián)是否有錢(qián)是9否53不好7隨機(jī)森林隨機(jī)森林原理簡(jiǎn)介:原理簡(jiǎn)介: 是包含多個(gè)回歸樹(shù)的組合器 輸出的數(shù)值是由個(gè)別樹(shù)輸出的數(shù)值的平均而定優(yōu)點(diǎn):優(yōu)點(diǎn): 準(zhǔn)確度高 訓(xùn)練速度快 容易做出并行算法 可處理大量變量并評(píng)估變量重要性缺點(diǎn):缺點(diǎn): 在噪聲較大的數(shù)據(jù)上會(huì)有過(guò)擬合問(wèn)題xgboos
11、txgboost + 2 xgboost目標(biāo)函數(shù)去掉常數(shù)項(xiàng):() =112+ ( )找到那顆樹(shù) ,使得目標(biāo)函數(shù)達(dá)到最優(yōu)即可。原理簡(jiǎn)介:原理簡(jiǎn)介: 是基于傳統(tǒng)的GBDT上做了一些優(yōu)化的開(kāi)源工具包,目前有python,R,Java版。優(yōu)點(diǎn):優(yōu)點(diǎn): 高速準(zhǔn)確 可移植,可以自己定義假設(shè)函數(shù) 可容錯(cuò)神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò) = f(X)(非線(xiàn)性映射)原理簡(jiǎn)介:原理簡(jiǎn)介: 是利用一系列非線(xiàn)性回歸,將預(yù)測(cè)變量映射到結(jié)果變量的一種方法。優(yōu)點(diǎn):優(yōu)點(diǎn): 準(zhǔn)確度高 訓(xùn)練速度快 并行處理能力強(qiáng)缺點(diǎn):缺點(diǎn): 需要大量的參數(shù) 不能觀察學(xué)習(xí)的過(guò)程,對(duì)結(jié)果難以解釋支持向量回歸(支持向量回歸(SVR)原理簡(jiǎn)介:原理簡(jiǎn)介: 是通過(guò)尋求結(jié)
12、構(gòu)化風(fēng)險(xiǎn)最小來(lái)提高學(xué)習(xí)泛化能力,實(shí)現(xiàn)經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信范圍最小化,從而達(dá)到獲得良好統(tǒng)計(jì)規(guī)律的目的優(yōu)點(diǎn):優(yōu)點(diǎn): 可以解決小樣本情況下的機(jī)器學(xué)習(xí)問(wèn)題 可以解決高維、非線(xiàn)性問(wèn)題缺點(diǎn):缺點(diǎn): 對(duì)非線(xiàn)性問(wèn)題沒(méi)有通用解決方案,對(duì)核函數(shù)的選擇非常敏感SVR最本質(zhì)與SVM類(lèi)似,都有一個(gè)margin,只不過(guò)SVM的margin是把兩種類(lèi)型分開(kāi),而SVR的margin是指里面的數(shù)據(jù)不會(huì)對(duì)回歸有任何幫助。銷(xiāo)售預(yù)測(cè)現(xiàn)狀與痛點(diǎn)銷(xiāo)售預(yù)測(cè)現(xiàn)狀與痛點(diǎn)CONTENTS0102 銷(xiāo)售預(yù)測(cè)四大步驟銷(xiāo)售預(yù)測(cè)四大步驟03 銷(xiāo)售預(yù)測(cè)基本方法銷(xiāo)售預(yù)測(cè)基本方法04 銷(xiāo)售預(yù)測(cè)效果評(píng)估方法與指標(biāo)銷(xiāo)售預(yù)測(cè)效果評(píng)估方法與指標(biāo)05 某電商網(wǎng)站銷(xiāo)售預(yù)測(cè)案例
13、分享某電商網(wǎng)站銷(xiāo)售預(yù)測(cè)案例分享模型評(píng)估方法:模型評(píng)估方法: k 折交叉驗(yàn)證法折交叉驗(yàn)證法K折交叉驗(yàn)證法折交叉驗(yàn)證法 在k-折交叉驗(yàn)證中,初試數(shù)據(jù)被劃分成k個(gè)互不相交的子集或“折”,每個(gè)折的大小大致相等。訓(xùn)練和測(cè)試k次。在第i次迭代中,第i折用作測(cè)試集,其余的子集都用于訓(xùn)練分類(lèi)法。 準(zhǔn)確率估計(jì)是k次迭代正確分類(lèi)數(shù)除以初始數(shù)據(jù)中的樣本總數(shù)。數(shù)據(jù)S1S2Sk測(cè)試集訓(xùn)練集導(dǎo)出回歸法評(píng)估精度模型評(píng)估方法:模型評(píng)估方法: k 折交叉驗(yàn)證法折交叉驗(yàn)證法K折交叉驗(yàn)證法折交叉驗(yàn)證法 在k-折交叉驗(yàn)證中,初試數(shù)據(jù)被劃分成k個(gè)互不相交的子集或“折”,每個(gè)折的大小大致相等。訓(xùn)練和測(cè)試k次。在第i次迭代中,第i折用作測(cè)
14、試集,其余的子集都用于訓(xùn)練分類(lèi)法。 準(zhǔn)確率估計(jì)是k次迭代正確分類(lèi)數(shù)除以初始數(shù)據(jù)中的樣本總數(shù)。數(shù)據(jù)S1S2Sk測(cè)試集訓(xùn)練集導(dǎo)出回歸法評(píng)估精度模型評(píng)估方法:模型評(píng)估方法: k 折交叉驗(yàn)證法折交叉驗(yàn)證法K折交叉驗(yàn)證法折交叉驗(yàn)證法 在k-折交叉驗(yàn)證中,初試數(shù)據(jù)被劃分成k個(gè)互不相交的子集或“折”,每個(gè)折的大小大致相等。訓(xùn)練和測(cè)試k次。在第i次迭代中,第i折用作測(cè)試集,其余的子集都用于訓(xùn)練分類(lèi)法。 準(zhǔn)確率估計(jì)是k次迭代正確分類(lèi)數(shù)除以初始數(shù)據(jù)中的樣本總數(shù)。數(shù)據(jù)S1S2Sk測(cè)試集訓(xùn)練集導(dǎo)出回歸法評(píng)估精度=1()=1() = 2 其中,為第i個(gè)樣本的真實(shí)值,為第i個(gè)樣本的預(yù)測(cè)值,n為樣本量。 有時(shí)也用 =2來(lái)評(píng)
15、估回歸模型的準(zhǔn)確率,與RMSE效果相同。模型評(píng)估指標(biāo):模型評(píng)估指標(biāo): RMSE(均方根誤差)(均方根誤差)RMSE 與分類(lèi)模型不同,回歸模型是對(duì)連續(xù)的因變量進(jìn)行預(yù)測(cè),因此判斷回歸模型的準(zhǔn)確率需要考慮的是預(yù)測(cè)值與真實(shí)值之間差異的大小。模型評(píng)估指標(biāo):模型評(píng)估指標(biāo): AIC & BICAIC準(zhǔn)則是評(píng)估統(tǒng)計(jì)模型的復(fù)雜度和衡量統(tǒng)計(jì)模型擬合優(yōu)度的一種標(biāo)準(zhǔn): = 2ln + 2 其中L是在相應(yīng)模型下的最大似然估計(jì)值,p是模型的變量個(gè)數(shù)。 增加變量的數(shù)目提高了擬合的優(yōu)良性,但可能造成過(guò)度擬合的情況。AIC鼓勵(lì)數(shù)據(jù)擬合的優(yōu)良性但是盡量避免出現(xiàn)過(guò)度擬合(overfitting)的情況。 AIC值越小,模型
16、越好。AIC準(zhǔn)則是尋找可以最好地解釋數(shù)據(jù)但包含最少自由參數(shù)的模型。 BIC準(zhǔn)則是依貝葉斯理論提出的一種模型選擇準(zhǔn)則。 = 2ln + ln() 其中L是在相應(yīng)模型下的最大似然估計(jì)值,n是樣本量,p是模型的變量個(gè)數(shù)。 BIC值越小,模型越好。 AIC準(zhǔn)則傾向于過(guò)擬合,BIC準(zhǔn)則傾向于欠擬合,BIC選出的模型相對(duì)于AIC的更為精簡(jiǎn)。銷(xiāo)售預(yù)測(cè)現(xiàn)狀與痛點(diǎn)銷(xiāo)售預(yù)測(cè)現(xiàn)狀與痛點(diǎn)CONTENTS0102 銷(xiāo)售預(yù)測(cè)四大步驟銷(xiāo)售預(yù)測(cè)四大步驟03 銷(xiāo)售預(yù)測(cè)基本方法銷(xiāo)售預(yù)測(cè)基本方法04 銷(xiāo)售預(yù)測(cè)效果評(píng)估方法與指標(biāo)銷(xiāo)售預(yù)測(cè)效果評(píng)估方法與指標(biāo)05 某電商網(wǎng)站銷(xiāo)售預(yù)測(cè)案例分享某電商網(wǎng)站銷(xiāo)售預(yù)測(cè)案例分享銷(xiāo)售預(yù)測(cè)的企業(yè)案例分析
17、銷(xiāo)售預(yù)測(cè)的企業(yè)案例分析項(xiàng)目背景某電商平臺(tái)主營(yíng)海外代購(gòu)業(yè)務(wù),由于海外代購(gòu)物流時(shí)間長(zhǎng)、發(fā)貨時(shí)間慢等因素導(dǎo)致 該電商平臺(tái)存在大量庫(kù)存積壓情況,想通過(guò)銷(xiāo)售預(yù)測(cè)模型改善安排進(jìn)貨、提高發(fā)貨速度以及優(yōu)化庫(kù)存。預(yù)測(cè)某類(lèi)銷(xiāo)量排行Top20某單品未來(lái)7天的銷(xiāo)量情況預(yù)測(cè)目標(biāo)1.收集數(shù)據(jù):18個(gè)月數(shù)據(jù),樣本513,指標(biāo)722.數(shù)據(jù)探索:與銷(xiāo)量的變量分析3.數(shù)據(jù)預(yù)處理:缺失值、Box-Cox變換、stepBIC等收集數(shù)據(jù)時(shí)間序列方法機(jī)器學(xué)習(xí)算法應(yīng)用模型評(píng)估指標(biāo)可視化展示評(píng)價(jià)指標(biāo)收集數(shù)據(jù):采集影響商品銷(xiāo)量指標(biāo)維度6維度72指標(biāo)商品銷(xiāo)量指標(biāo)體系季節(jié)特征(季節(jié)特征(1個(gè))個(gè))營(yíng)銷(xiāo)推廣(營(yíng)銷(xiāo)推廣(14個(gè))個(gè))商品優(yōu)惠 商品搶購(gòu)
18、商品促銷(xiāo) 首頁(yè)廣告商品分銷(xiāo)商品換貨商品退款商品退貨商品復(fù)購(gòu)用戶(hù)評(píng)價(jià)商品稅率商品庫(kù)存商品銷(xiāo)量商品物流商品產(chǎn)地商品供貨節(jié)假日消費(fèi)等級(jí)零售價(jià)格交易價(jià)格交易稅率用戶(hù)行為(用戶(hù)行為(21個(gè))個(gè))瀏覽行為 購(gòu)物車(chē)行為咨詢(xún)行為 下單行為收藏行為 支付行為321 商品信息(商品信息(10個(gè))個(gè))4價(jià)格變化(價(jià)格變化(13個(gè))個(gè)) 56商品品牌商品質(zhì)量(商品質(zhì)量(13個(gè))個(gè))數(shù)據(jù)探索:節(jié)假日與銷(xiāo)量關(guān)系節(jié)假日變量對(duì)銷(xiāo)量的影響明顯節(jié)假日變量對(duì)銷(xiāo)量的影響明顯數(shù)據(jù)探索:預(yù)測(cè)變量之間的多重共線(xiàn)性結(jié)論:訂單數(shù)、訂單金額和訂單用戶(hù)數(shù)之間相關(guān)性較高!需要過(guò)濾多重共線(xiàn)性!結(jié)論:訂單數(shù)、訂單金額和訂單用戶(hù)數(shù)之間相關(guān)性較高!需要過(guò)濾
19、多重共線(xiàn)性!模型效果:真實(shí)值與預(yù)測(cè)值對(duì)比圖xgboost和隨機(jī)森林的預(yù)測(cè)效果較佳,線(xiàn)性回歸和和隨機(jī)森林的預(yù)測(cè)效果較佳,線(xiàn)性回歸和ARIMA效果較差效果較差應(yīng)用模型:應(yīng)用模型:xgboost紅色點(diǎn)線(xiàn)紅色點(diǎn)線(xiàn):某商品的真實(shí)銷(xiāo)量綠色點(diǎn)線(xiàn)綠色點(diǎn)線(xiàn): 某商品的預(yù)測(cè)銷(xiāo)量RMSE(均方根誤差):3.68837算法名稱(chēng)RMSE性能ARIMA5.32速度較慢,2.5min線(xiàn)性回歸4.28速度快,1min決策樹(shù)5.02速度快,1min隨機(jī)森林2.85速度快,1minxgboost3.68速度適中,1.5min神經(jīng)網(wǎng)絡(luò)4.99速度快,1min支持向量回歸3.27速度快,1min模型評(píng)估:模型評(píng)估:RMSE隨機(jī)森林:隨機(jī)森林:采取的是重抽樣,具有自動(dòng)選擇重要特征的功能,無(wú)需做特征篩選,在一定程度上避免了過(guò)擬合 xgboost: kaggle比賽上表現(xiàn)卓越的算法之一,從本質(zhì)上分析是一個(gè)集成的決策樹(shù),但是可以讓弱回歸樹(shù)集成成強(qiáng)回歸樹(shù)因此,它們可以在本案例中能夠取得的好預(yù)測(cè)效果而其他算法:而其他算法: 處于數(shù)據(jù)的局限性或模型的參數(shù)未達(dá)到最優(yōu),會(huì)存在一定的過(guò)擬合,導(dǎo)致預(yù)測(cè)效果相對(duì)較差算法名稱(chēng)預(yù)處理
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 消費(fèi)級(jí)無(wú)人機(jī)行業(yè)分析
- 中級(jí)養(yǎng)老護(hù)理復(fù)習(xí)測(cè)試卷含答案
- 婦產(chǎn)科護(hù)理復(fù)習(xí)試題含答案(二)
- 時(shí)尚搭配指南表格
- 農(nóng)業(yè)生產(chǎn)網(wǎng)絡(luò)營(yíng)銷(xiāo)策略與技巧
- 農(nóng)業(yè)休閑旅游產(chǎn)業(yè)可持續(xù)發(fā)展研究報(bào)告
- 項(xiàng)目進(jìn)展會(huì)議重要事項(xiàng)紀(jì)要
- 智能財(cái)稅綜合實(shí)訓(xùn) 下篇 第四章工作領(lǐng)域二-任務(wù)三
- 音樂(lè)產(chǎn)業(yè)版權(quán)保護(hù)及管理手冊(cè)
- 醫(yī)療影像處理與診斷應(yīng)用
- GB/T 4154-1993氧化鑭
- 水泥混凝土路面試驗(yàn)檢測(cè)的要點(diǎn)
- 運(yùn)輸供應(yīng)商年度評(píng)價(jià)表
- 室內(nèi)消防及給排水管道安裝施工方案方案
- 無(wú)創(chuàng)呼吸機(jī)參數(shù)調(diào)節(jié)課件
- 《過(guò)零丁洋》公開(kāi)課件
- 文件傳閱單范本
- 電工培養(yǎng)計(jì)劃表
- 部編版五年級(jí)道德與法治下冊(cè)課程綱要
- Q∕SY 02006-2016 PVT取樣技術(shù)規(guī)程
- 初中物理公式MicrosoftWord文檔
評(píng)論
0/150
提交評(píng)論