版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
西南財經大學SouthwesternUniversityofFinanceandE數據挖掘課程論文論文題目:基于SAS數據挖掘的電商平臺商品銷售應用研究學號姓名:指導教師:2015年6月基于SAS數據挖掘的電商平臺商品銷售應用研究摘要 隨著互聯網技術的發(fā)展,電子商務平臺已成為眾多零售商主要銷售渠道之一。因此,如何選擇自身銷售的商品,在激烈的市場競爭中至關重要。本文采用京東三天的爽膚水交易記錄與評論信息,通過SAS的EM數據挖掘模塊,分析影響商品銷量的主要因素。通過描述性統計發(fā)現,市場中的商品類型分布不均勻。通過建立關聯分析,我們發(fā)現消費者對優(yōu)質品牌和具有保濕功能的產品,有更高的購買傾向。然后建立決策樹模型,通過構造損益矩陣,以收益最大為目標,得出了商家的最優(yōu)決策樹模型。通過結果本文發(fā)現,對于爽膚水這類商品,消費者更傾向于選擇知名品牌,并且對特定功效美白、控油有更高的需求,同時也傾向于購買成套出售的產品。對于商家而言,在滿足消費者的需求的同時,采用較低的定價模式,也能達到薄利多銷的效果,獲得更多的收益?!娟P鍵字】
電商平臺交易記錄關聯分析決策樹SAS數據挖掘
目錄1. 緒論 51.1研究背景 51.2研究意義 51.3研究內容和研究方法 52. 文獻綜述 52.1產品屬性 52.2在線商品銷售 62.3產品屬性與商品銷售的關系 63. 數據收集及處理 73.1數據描述: 73.2數據初步處理: 73.2.1數據導入與合并 73.2.2分類數據處理 83.2.3買家評分信息處理 103.2.4品牌信息處理 103.2.5處理結果 124. 簡單的描述性統計分析 125. 關聯分析 145.1變量離散化處理與數據轉置 145.2分析過程與結果 155.2.1高銷售量商品 155.2.2中等銷售量商品 155.2.3低銷售量商品 166. 決策樹分析 166.1構造損益矩陣 176.2決策樹模型與結果 176.3模型調整與對比 196.3.1調整損益矩陣 196.3.2改變目標變量 196.4模型總體流程圖 197. 總結與分析 208. 論文改進 21參考文獻 21附錄 22
緒論1.1研究背景聯合國貿易和發(fā)展協議3月發(fā)布《2015年信息經濟報告》稱,在全球130個經濟體重,中國實際上已經成為全球對打的“企業(yè)對消費者電子商務”市場。艾瑞咨詢統計數據顯示,2015Q1中國電子商務市場整體交易規(guī)模達3.48萬億元,環(huán)比下滑10.1%,同比增長23.8%。從同比增長來看,增速較2014Q1亦有所下滑,中國電子商務市場已進入成熟期。而在過去幾年,中國的化妝品行業(yè)穩(wěn)定增長,零售銷售總額從2010年的1362億元人民幣增長至2013年的2209億元人民幣,年復合增長率為17.5%。到2018年,預計這一銷售額將達到4318億元人民幣,2013年至2018年的年復合增長率為14.3%?;瘖y品零售渠道中商超、專營店、百貨商店、電商、直銷和其他的比例也在不斷變化,其中,網絡渠道從2006年占比的0.7%到2012年的13.1%,大幅上升。由上可見,化妝品行業(yè)仍有很大市場發(fā)展空間,而網絡已成其重要的銷售渠道。隨著中國電子商務市場的逐漸成熟,化妝品在網絡的競爭將日趨激烈。我們發(fā)現不同企業(yè)的化妝品市場份額有很大不同,定性來看,品牌、價格、功效、評價等都對其銷售有很大影響,因此,我們期望找出影響化妝品銷售量的重要因素,以便對企業(yè)制度營銷策略提供建議。1.2研究意義隨著化妝品網絡渠道銷售競爭越來越激烈,各大企業(yè)必須做出相應的營銷戰(zhàn)略來提高銷售量,而要制定相應的營銷戰(zhàn)略,必須對用戶行為進行研究,找出影響消費者購買化妝品的因素。因此,對影響化妝品銷售量、銷售額的因素的研究非常必要。本文通過研究影響化妝品銷售量和銷售額的因素,期望找出影響消費者購買不同化妝品的重要因素,從而對化妝品公司提供改善建議。1.3研究內容和研究方法本文主要以京東平臺上的化妝品為例來研究影響化妝品銷售的重要因素。通過相關數據來看,影響化妝品銷售的因素包括品牌、價格、功效、容量、套餐、評分等,我們利用sas企業(yè)數據分析對其進行相關建模,通過分類、關聯分析兩種挖掘方法來找出影響化妝品銷售的重要因素文獻綜述通過查閱文獻,本文發(fā)現,產品屬性、消費者購買偏好以及其對商品的銷售量等影響,長期以來收到廣泛的關注。與本文研究相關的文獻研究大致有以下幾個方面:2.1產品屬性(孫洪杰等,2011)認為在消費過程中,消費者的購買偏好一般是基于比較完成的,在比較的過程中,產品屬性比較是重要組成部分。產品屬性按不同劃分標準有很多分類。(Voss等,2003)指出產品本身包含了兩種屬性,即功能屬性和享受屬性,消費者在購買產品時會從功能屬性和享受屬性這兩方面做權衡。(徐劍,2005)按競爭因素將產品屬性分為經濟屬性和技術屬性;從產品屬性與新產品購買行為的關系角度,(陳文沛,2013)將產品屬性劃分為技術屬性和市場屬性。本文研究將產品屬性作為對產品銷售量的影響因素進行研究,包括產品的功能屬性以及價格、品牌、顧客評分等屬性。在產品購買過程中,消費者有自己的偏好,這是一種消費者傾向于消費某種特定商品亦或特別鐘愛消費某種商品或服務的心理行為。(汪出,2013)指出消費者心理偏好特征的形成不但受先天生理素質的影響,而且還受來后天的社會實踐的影響,并且后者的影響力更大。由于消費者自身的生理素質和周圍環(huán)境不同,以至于消費者形成不同的心理偏好特征,進而產生不同的購買行為。2.2在線商品銷售在電子商務平臺購物,商品的銷量對于顧客的購買行為起著重要作用。(任婕、彭晨,2015)網絡購物者在進入購物網站輸入商品大類名稱后,會在按照“銷量”,“價格”,“人氣”,“綜合”進行排序,購物平臺默認的排序方式為按照綜合排序。在進行網絡購物消費者行為特征的研究時,發(fā)現約有77.94%的消費者選擇根據商品銷量排序作為參考來進行選擇。(徐雪娟等,2013)指出電子商務中商品的銷售量呈冪律分布??紤]某一件商品銷售網絡的形成過程,當某一件商品在某購物網站銷售時,會有新的消費者從多家店鋪中選擇購買,銷售網絡就會擴大,整個網絡呈現動態(tài)增長。分析網購消費者的行為可以發(fā)現,消費者在對不同賣家的同一件商品進行比較甄選時,考慮的因素包括價格、已有的銷售量、賣家的銷售信用等等。當消費者做出購買的行為時,已經從諸多指標做出了考量,因此商品的銷售量可以作為一個綜合的評價指標。所以本文將研究產品銷售量的影響因素,以便于幫助賣家選擇所要銷售的產品。2.3產品屬性與商品銷售的關系 在研究產品屬性與商品銷售之間關系的有關文獻有:(任婕、彭晨,2015)基于淘寶平臺,對商品銷售量建立了兩階段模型,研究了淘寶商品銷量與店鋪信用以及價格等因素的關系,得出了商品銷售量與商品價格成負相關關系。(王倩倩等,2013)以淘寶網為例,運用包含商品標題、商品評論和商品描述在內的三層挖掘架構,使用文本挖掘提取評論關鍵詞,并將內容分析法納入其中,利用MATLAB進行仿真實驗,建立了數學回歸模型,得出質量、價格、尺碼與銷售量之間有著敏感的相關關系。(耿亮亮,2009)利用回歸分析品牌知名度在顧客滿意度和品牌忠誠之間的作用,結果表明品牌知名度在顧客滿意度和品牌忠誠之間起到一定的一調節(jié)作用。(張婧、鄧婕,2010)利用K-means聚類算法對銷售數掘進行建模,得出商品的利率等級,使企業(yè)準確的獲取獲利商品,提高收益。(成慧,2009)以數碼相機為例,分析了產品屬性對于消費者產品選擇的影響效應。通過研究可以發(fā)現,消費者在選擇數碼相機時,他們最關心的屬性是價格,其次是像素、顏色、變焦倍數和品牌,最后是LCD大小,消費者對于數碼相機各個屬性的不同水平也表現出一定的規(guī)律。雖然產品不一樣,但是和本文研究方向相同,即研究產品屬性與產品銷售間的關系,對本文有一定指導意義。數據收集及處理
3.1數據描述: 本文所采用的數據集是來自主要電商平臺:京東,淘寶,天貓,亞馬遜,一號店的2013年10月20日至2013年10月22日的爽膚水交易信息,該數據集從網絡數據中心數據堂獲得。以京東數據集為例,數據主要分為三部分。第一部分為京東平臺上爽膚水的交易記錄,一共有56489條交易記錄,14個變量,變量包含商品ID,電商名稱,日期,商品名稱,商品URL,促銷價,商品銷量銷售額,店鋪名稱,店鋪等級,品牌功效,適合皮膚,容量等。第二部分為買家購買后的評價信息,一共有3722條的評論信息,6個變量,變量包含商品ID,購買時間,評論時間,昵稱,評分,評論內容。第三部分為品牌數據集,一共51990條數據,7個變量,變量包括類目,品牌,電商平臺,平均價格,日總銷量,對應商品ID。本論文所采用的數據全部來自于知名網絡數據中心數據堂,具有相當的可信度。經過對數據的觀察,為了使得研究過程能夠更加方便,我們選擇數據較為完整并且有序的自于京東平臺的交易信息。由于本文目的是建立如何選擇商品銷售模型,因此不會對結果造成影響。3.2數據初步處理:3.2.1數據導入與合并本文所有的數據都是用SAS中SQL語言與EXCEL進行處理。首先處理京東平臺上爽膚水的交易記錄。首先應該去掉與本文研究不相關的信息。由于電商名稱,日期,店鋪名稱與本文研究目標不相符,同時在京東平臺上并沒有店鋪信息,而商品名稱已包含在品牌名稱等其他變量中,因此我們選擇的變量為:商品ID,促銷價,商品銷量、銷售額,品牌功效,適合膚質和容量大小。將源數據導入SAS之后采用EM模塊的InputData節(jié)點對銷量變量進行描述性統計,結果如圖所示:我們可以發(fā)現,其中大多數商品的銷售量都為0,是因為這里僅僅采用3天的交易數據,所以大多都沒有銷量。沒有銷量的商品對本文的并無研究意義,因此我們只研究銷售量大于0的商品。采用SQL語言將3日的交易數據合并,并選取所需變量,并且將相同的商品進行合并。Procsql;CREATEtableHomework.JDasselect*FROMHomework.JINGD1UNIONALLselect*FROMHomework.JINGD2UNIONALLselect*FROMHomework.JINGD3;Procsql;CREATEtableHomework.JDNEWasSelectID,PRICE,SUM(Q)asQ,SUM(INCOME)asINCOME,BRAND,EFFEct,CAPfromHomework.JDwhereQ>0GROUPBYID;處理后的結果在SAS中打開的部分內容如下:3.2.2分類數據處理為了使得變量能夠滿足分析的要求,我們利用EXCEL對數據進行預處理。對于容量這一變量,格式存在兩種“500ml”或者“100ml+10ml+10ml”。因此我們采用兩個變量來描述,CAP和COMB,其中CAP表示容量的大小,本文將100ml以下定為小瓶,100ml-300ml以下為中瓶,300ml以上為大瓶。COMB為一個二元變量,1表示存在套裝的情況,0則表示為單瓶。處理之后結果為:對于功能這一變量,我們通過建立數據透視表查看結果:EFFECT匯總NULL22保濕補水687保濕補水,控油平衡17保濕補水,控油平衡,美白祛斑1保濕補水,控油平衡,美白祛斑,細致毛孔25保濕補水,控油平衡,美白祛斑,細致毛孔,祛皺抗衰8保濕補水,控油平衡,美白祛斑,細致毛孔,深層清潔2保濕補水,控油平衡,美白祛斑,細致毛孔,深層清潔,祛皺抗衰26由數據透視表可知,功能包含6種功效,因此我們采用一系列的二元變量E_BS(保濕),E_KY(控油),E_MB(美白),E_XZ(細致毛孔),E_KS(抗衰老),E_QJ(清潔),1表示該品牌具有這種功效,0表示該品牌不存在具有該種功效。部分處理結果為:對于適合膚質這一變量同樣采用數據透視表來查看,部分結果如下:SKIN匯總干性38混合性48混合性,中性24混合性,中性,油性12混合性,中性,油性,干性20敏感性11所有膚質880油性31中性23我們可以發(fā)現其中大多數產品都適用于所有膚質,因此我們將采用一個二元變量BSKIN來描述適合膚質這一變量,1表示適合所有膚質,0代表針對特殊膚質。處理部分結果如下:3.2.3買家評分信息處理由于技術方面的缺乏,本論文僅采用評分作為消費者對商品評價的唯一方式。評分數據集中來源于2013年10月20號到22號三天的時間產生的評論信息。然后,我們用SQL選擇研究所需數據,并求評分的均值,方法如下:Procsql;CREATEtableHomework.SCORCEasselectID,AVG(SCORCE)asSCORCEfromHomework.PLGROUPBYID;Procsql;CREATEtableHomework.JINGDONGasselect*fromHomework.SCORCEaFULLJOINHomework.JDNEWona.ID=b.ID根據EM節(jié)點產生的統計信息如下我們可以發(fā)現SCORCE變量存在缺失值,現實生活中并非所有商品都會被評價,所以本文保留缺失值。3.2.4品牌信息處理根據EM節(jié)點查看BRAND變量的統計信息如下:我們發(fā)現僅選擇銷量大于0的品牌,也存在著大量不同取值,并且品牌名稱并不能作為判斷品牌優(yōu)劣的依據。在我們分析品牌效應的過程中,BRAND這一變量并不能表示品牌效應的作用。因此我們將通過第三個數據集,產生一個新的變量SBRAND來對品牌進行分析。第三個數據集代表的是全部主要的電商平臺,所有品牌爽膚水的交易信息。根據消費者的從眾心理,我們將采用全部電商平臺中品牌總銷量的排名來作為評判品牌優(yōu)劣的標準。利用SQL語言將3天的交易總量合并,并選擇所需數據:Procsql;CREATEtableHomework.qtestasSELECTID,BRAND,SUM(SALE)asSALE(select*FROMHomework.q20UNIONALLselect*FROMHomework.q21UNIONALLselect*FROMHomework.q22);由于京東平臺并非包含全部品牌,因此我們只采用在京東上有銷售的品牌進行研究,用SQL語言進行選擇,并將該表與原表連接:Procsql;CREATEtableHomework.SORTBasselet*fromHOMEWORK.Qtestawherea.BRANDin(selectBRANDFROMHOMEWORK.JINGDONG);在SAS中查看部分結果:可以發(fā)現,并非在全網銷量高的品牌在京東平臺上銷量就高,這表明數據滿足我們的假設,即品牌并不是唯一決定銷量的原因。3.2.5處理結果經過預處理之后的數據變量如下表:變量名稱變量內容ID商品IDQ商品銷售量PRICE 商品單價INCOME商品銷售額BRAND品牌名稱EFFECT品牌功效描述SKIN品牌所適合膚質SCORCE商品打分CAP商品的容量COMB商品是否套裝SALE品牌全網銷量排行E_BS保濕功能E_KY控油功能E_MB美白功能E_XZ細致毛孔功能E_KS抗衰老功能E_QJ清潔功能BSKIN是否適合所有膚質簡單的描述性統計分析 在進行數據挖掘之前,先對數據進行描述性統計,了解數據的大概分布特征,以便更進一步的分析。 對銷量進行描述統計,統計不同銷量下的品牌個數,并畫出直方圖: 根據上圖我們可以發(fā)現,銷量低的品牌數量占據大部分,其中銷售量為1的品牌數量最多,銷量大于11的品牌則只占很少的部分,銷量最高為139只有一個品牌。對數據中所有有銷售量的商品功能進行統計: 其中1代表具有該功能,而0則代表不具有該功能。對于套裝變量,1則代表是成套的商品,0則代表是單獨售賣的商品。對于適用膚質變量,1則適合所有膚質,0則代表針對特殊膚質。根據結果我們可以看出,在售的商品中成套商品較少,并且大多針對所有膚質。在爽膚水的功能中多為具有保濕功能的產品。 觀察售賣商品的容量規(guī)格: 可以發(fā)現所有在售的爽膚水,多為中等型號,同時也存在部分缺失值,但總體占比很小。 根據如上的統計,我們可以發(fā)現商品銷售的情況并不均勻,其中銷售量較高的品牌只占其中很少的一部分。而在商品的功能方面,有銷售量的商品具有的功能和特性也傾向于某一類,表明大多數消費者都會選擇某一類的商品,而找出這類商品就是本文主要的研究意義。關聯分析5.1變量離散化處理與數據轉置為了研究銷售量的主要影響因素,本文首先對數據進行關聯分析。為了進行關聯分析我們需要采用EM中的TRANSFROM節(jié)點將Q,PRICE,SCORE,SALE進行分類預處理,以Q為例:如下圖所示,將Q分為3個部分:分類結果為:將所有變量改為分類變量并且加上標識符,最終結果為:將預先處理好的數據進行轉置,再進行關聯分析,我們只關注Q變量,即只關注銷量受到哪些因素的影響。利用SAS語言將數據集進行轉置。procsortdata=JD;byID;run;proctransposedata=JDout=JDNEW;varQ,INCOME,BRAND,GONGXIAO,FUZHI,RONGLIANG,SCORCE,E_BS,E_KY,E_MB,E_XZ,E_QJ,BSKIN,SALEbyIDrun;5.2分析過程與結果 經過預處理后的數據,可以直接采用SAS中的關聯分析節(jié)點進行關聯分析。本文將分別研究高銷售量,中等銷售量,低銷售量的商品的關聯規(guī)則,以找出影響銷售量的主要因素5.2.1高銷售量商品首先對高銷售量商品,即Q3類商品進行關聯分析分析結果如下:根據結果我們可以“保濕1”以及S3的置信度是最高的,但總體的支持度和置信度都比較低。通過觀察數據我們發(fā)現,由于數據本身中銷量較高的產品占很小比重,因此含Q3的關聯規(guī)則支持度非常低。同時Q的分類的閾值為1、10。當閾值過大時,如1、20時,Q3的占比會小于5%。但當閾值較小時,代表了有一部分實際并非銷量高的產品樣本被歸納入Q3,從而就導致了置信度也較低,但結果依然具有說服力。從結果我們可以看出,對于具有保濕功能,并且品牌認可度高的產品銷量比較高。同時SC2或者P1,即評分高的商品或者價錢便宜的商品也會有很好的銷量。5.2.2中等銷售量商品對于Q2類,即銷量中等的一類產品進行分析。在研究哪些因素能夠提高銷量的時候,我們只關注哪些變量存在的時候會提高銷量,如產品擁有美白功效,或者擁有保濕功效,但不關注沒有保濕功效這一關聯規(guī)則。在SAS中對關聯結果進行篩選:關聯結果為:根據關聯分析結果我們可以看出,符合“大瓶,P1,COMB1,1”的商品能夠具有中等的銷量,即在同類商品中大瓶、價格便宜、適合所有膚質,并且是成套出售的商品具有相對更高的銷量。同時,通過別的關聯規(guī)則我們可以發(fā)現,S3也是一個重要的因素,即在同類商品中,消費者還是傾向與購買品牌公知度較高的產品。5.2.3低銷售量商品 對于Q1類,即銷量較低的一類變量進行分析。本文關聯分析Q1類的主要目的是想了解在電子商品平臺上并不受消費者歡迎的產品特性,因此,我們更關注的應該是商品不具有哪一些功能,而不去關心商品具有哪一些功能,因此將在生成關聯規(guī)則后進行如下篩選:篩選后的關聯規(guī)則如下: 根據關聯規(guī)則我們可以看出,銷售量低的商品通常具有以下特點,首先是產品的消費者評分較低,或者商品沒有評論信息。同時消費者在選擇品牌的時候也不會輕易選擇不熟悉的品牌(S1,S2)產品。同時消費者也要求商品具有保濕功能,并且更加傾向于套裝產品。決策樹分析 通過關聯分析我們可以看出,銷量較高的商品通常具有品牌知名度高,有保濕功能,商品成套出售等特點。在賣家選擇銷售商品的時候,不僅只考慮上述因素,還要根據自身情況考慮商品的成本以及定價等因素,以及面對一個新的產品如何對產品銷量進行預測,并選擇是否出售該類商品,是在電子商務市場中常見的決策方式。 我們將通過建立決策樹的方式,幫助商家進行選擇銷售商品。以收益最大為目標,通過建立損益矩陣來進行決策樹的建立。通過不斷的調整與測試,得出本文認為最有效的決策樹,并在目標不同的情況下比較決策樹的不同。6.1構造損益矩陣首先本文以銷售量最大為目標建立決策樹,本文嘗試將銷售量分為2類,3類或者4類。通過比較發(fā)現3類的分類方式效果更好,并且更加合理。因此我們將銷售量分類為Q1,Q2,Q3,三類分別代表低銷售量,中等銷售量,高銷售量。并通過SAS建立損益矩陣,經過多次試驗我們決定最后的損益矩陣的設置方式:如圖所示的損益矩陣中,決策1,決策2分別代表選擇這一類商品或者拒絕這一類商品。而商品1,2,3則代表了低中高三類的商品。圖中的損益矩陣代表的意義為,當一個賣家選擇銷售高銷售量的商品時,他將由于其較高的銷售量獲得較高的利潤5;選擇銷售中等銷售量的商品,則獲得較低利潤1;而當賣家選擇銷售銷售量低的商品時,會因為其銷售量低支出大于收入而造成損失為-2。這個損益矩陣的設置是根據實際情況,以及多次試驗的結果確定的,不同的損益矩陣會造成決策樹的結果有明顯的不同,這個損益矩陣是目前本文認為具有最好的設定結果。6.2決策樹模型與結果通過SAS建立決策樹結果如圖所示,根據決策樹結果我們可以分析出,賣家應該如何選擇銷售策略。決策樹結果圖首先決策樹對商品按照用戶評分的高低進行分類,本文由于用戶評分含有缺失值,通過多種方式處理進行對比之后,本文最終采用的方式將用戶評分分為了三類,高評分,低評分以及評分為缺失值。其中缺失值代表的經濟含義可以解釋為沒有評論信息,在電子平臺上產品更新速度快,平臺上每天都推出新品,沒有評論信息現象很常見,所以對其不進行缺失值處理是合理的。由上述決策樹結果我們可以發(fā)現,只要是評分高的商品我們就能從中獲得利潤。換一句話來說,如果賣家能夠有效地了解某類商品的總體買家評分情況,并且發(fā)現總評分很高,那么賣家就可以相信,該類商品能夠給他帶來較好的收益。對于低評分商品的結果來看,首先賣家應該注重商品是否是成套出售的。根據決策結果,成套出售的商品大多會具有不錯的銷量。然后消費者也會注重商品的功能,我們通過前文的描述統計,關聯分析和決策樹的結果可以發(fā)現,消費者最注重的商品功能就是保濕,或者消費者最常購買的商品是具有保濕功能的爽膚水,沒有保濕功能的商品不具有市場競爭力。根據決策樹結果我們也可以發(fā)現,品牌效應也對銷量的高低有著顯著地影響。本文將品牌的銷量排名進行分類,分為3類,前一百名為知名品牌,100至800名為普通品牌,800名以后為冷門品牌。品牌效應有著明顯的作用,根據決策結果,當商品品牌排名屬于知名品牌以及普通品牌時,賣家銷售這一類商品就將獲得較高的收益。而對于冷門品牌的商品,賣家應該采用低價格出售的方式,通過薄利多銷的方式能夠賺取利潤。 商品的評分處于缺失值的情況下,本文發(fā)現,是否具有控油效果是商品銷量主要影響因素,對賣家而言銷售控油功能的商品,就可以獲得收益。此外對于商品容量,無評分商品商品是小瓶的銷售量更好。在定價方面,與低評分的商品相同,同樣應該采用低價格薄利多銷的方式,采用較高定價時會影響銷量,使得賣家會有損失。通過SAS做出決策樹的收益圖:我們可以發(fā)現在前30%的銷售收益下降的斜率明顯相對于之后的斜率更大,表明在以賣家銷售收益最大為目標時,能夠更好的將收益較低的一類商品排除,以此達到賣家銷售收益最大化的效果。6.3模型調整與對比6.3.1調整損益矩陣我們可以通過調整收益矩陣來改變我們決策樹的結果。(結果圖見附錄)上述決策樹收益矩陣為5,1,-2,建立的決策樹能夠將銷量低的商品排除。本文嘗試將收益矩陣改為5,0,-3,代表賣家只有選擇了高銷售量的商品才能夠獲得收益,以此建立決策樹來決定怎樣選擇最高3類的商品。通過調整后的決策結果我們發(fā)現產生高銷量的商品,除上述已知因素外,針對某種膚質并且成套出售的商品,并且在高、中品牌中具有美白效果的商品具有相對較高的銷售量,可以被歸為第3類銷售量的商品。本文建立的損益矩陣是經過反復的實驗再加上經驗最終決定的,不同的損益矩陣會造成不同的結果,在實際的情況中,可以根據賣家自身的需求,經濟實力,風險傾向,商品本身的特性等調整損益矩陣來達到分析的需求。 6.3.2改變目標變量上文只以銷售量Q為目標變量來進行決策樹的分析,本文還將以銷售額Income為目標變量,進行簡單的決策樹分析,主要用于與以Q為目標決策進行對比(結果圖見附錄)。通過建立決策樹我們發(fā)現,當以Income為目標時基本決策情況但不會有明顯改變,但首要的分類因素增加了一項是價格,當商品價格較高則收入較高。但由于本次研究采用的均是有銷售記錄的商品,當存在著有較高價格的商品若偶然的一次銷售記錄,就會導致總體的銷售額較高。因此實際情況下這個銷售額的高低預測結果會相較于銷售量Q的決策結果準確度更低。6.4模型總體流程圖本文采用sas的企業(yè)挖掘模塊(EM)分析數據,建立本文商品銷售模型,模型總體流程圖如下:總結與分析本文采用的數據是來自數據堂的電子商務平臺數據,想要建立數據挖掘模型幫助賣家決策以獲取更高的收益,這在電子商務快速發(fā)展的今天有著重要的實際意義。本文首先對數據進行描述性統計,做出相應的條形統計圖。通過統計圖我們可以發(fā)現,商品的銷售量分布并不均勻,多數的商品銷售量僅為1,而銷售量較多的商品在所有商品中僅占非常少的一部分。不排除在數據所采取的時間內,該類商品出于促銷活動等特殊情況的原因,這一結果也非常符合當下電子商務市場的現狀:只有少數的賣家能夠做出正確的選擇,從而獲得相當高的銷售量并且從中獲得大量的利潤,而多數商品賣家則處于低銷售量的情況,因此本文的研究也就更加具有實際意義。接著文章通過關聯分析了解影響銷售量的主要因素。根據結果我們可以發(fā)現,商品銷售量高的商品都具有品牌知名度高,并且具有保濕功能等主要特點。而銷售量低的商品,通常情況下都有評分缺失,不具備保濕功能等特點。關聯規(guī)則的結果,只能代表在已有的情況下銷售量高的商品所具有的特征,而在實際做決策的時候,通常情況下,多數賣家并沒有實力購買并銷售這類在市場上已有較大份額的商品,因此為了能夠進入市場并且挖掘更多的潛在客戶群體,我們還要通過決策樹進行進一步的分析。然后本文通過建立決策樹來進行進一步分析。我們首先觀察到的是,商品受到的消費者評分對商品銷售額具有較大影響,消費者評分較高的商品明顯具有更高的銷售量。然而在本次樣本中,商品的評分存在著大量的缺失值,這與實際情況相近,當一個賣家選擇進入市場
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 最簡單的勞務派遣合同
- 2025版鞋類品牌授權合同書品牌戰(zhàn)略規(guī)劃與市場推廣合作2篇
- 二零二五年度地震數據采集與監(jiān)測合同3篇
- 二零二五年度標準押車借款服務合同范本3篇
- 二零二五版?zhèn)€人合伙網絡游戲公司退伙股權分配合同4篇
- 二零二五年度高端別墅個人購房合同示例
- 2025版深圳裝修公司裝修設計咨詢服務合同2篇
- 二零二五版特殊教育學校食堂綜合服務管理合同6篇
- 二零二五年度環(huán)保工程居間合作合同模板2篇
- 二零二五年度企業(yè)研發(fā)項目合作合同2篇
- 《聚焦客戶創(chuàng)造價值》課件
- PTW-UNIDOS-E-放射劑量儀中文說明書
- JCT587-2012 玻璃纖維纏繞增強熱固性樹脂耐腐蝕立式貯罐
- 保險學(第五版)課件全套 魏華林 第0-18章 緒論、風險與保險- 保險市場監(jiān)管、附章:社會保險
- 典范英語2b課文電子書
- 員工信息登記表(標準版)
- 17~18世紀意大利歌劇探析
- 春節(jié)工地停工復工計劃安排( 共10篇)
- 何以中國:公元前2000年的中原圖景
- 新教材人教版高中物理選擇性必修第二冊全冊各章節(jié)課時練習題及章末測驗含答案解析(安培力洛倫茲力電磁感應交變電流等)
- 初級養(yǎng)老護理員培訓全套
評論
0/150
提交評論