版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、電商銷售記錄分析 嚴(yán)智強(qiáng)、賀強(qiáng)、劉瑞、 崔亞松、臧茹歌Background網(wǎng)購(gòu)流行電商崛起消費(fèi)人群消費(fèi)習(xí)慣潛在價(jià)值消費(fèi)記錄消費(fèi)喜好分析市場(chǎng)方向Contentscontents電商數(shù)據(jù)天貓手機(jī)銷售數(shù)據(jù)分析京東商城銷售數(shù)據(jù)分析數(shù)據(jù)的獲取與預(yù)處理替代商品的挖掘價(jià)格空洞的發(fā)現(xiàn)牛仔褲銷售數(shù)據(jù)的分析用戶消費(fèi)記錄的分析淘寶網(wǎng)作作為國(guó)內(nèi)內(nèi)第一大大電商,占有近近50%市場(chǎng)份額額,而天天貓商城城則是所所有優(yōu)質(zhì)質(zhì)店鋪的的集合,每月會(huì)會(huì)產(chǎn)生大大量銷售售數(shù)據(jù),這里以以天貓近近一個(gè)月月的手機(jī)機(jī)銷售數(shù)數(shù)據(jù)進(jìn)行行分析,找出這這些數(shù)據(jù)據(jù)隱含的的價(jià)值。天貓手機(jī)機(jī)銷售數(shù)數(shù)據(jù)分析析天貓手機(jī)機(jī)銷售數(shù)數(shù)據(jù)分析析數(shù)據(jù)的獲獲取與預(yù)預(yù)處理替代
2、商品品的挖掘掘價(jià)格空洞洞的發(fā)現(xiàn)現(xiàn)數(shù)據(jù)的獲獲取與處處理天貓銷售售數(shù)據(jù)分分析構(gòu)建一個(gè)個(gè)爬蟲(chóng)腳腳本,從從天貓上上獲取銷銷量前600的手機(jī)銷銷售記錄錄,并匹匹配出每每條記錄錄的機(jī)型型、售價(jià)價(jià)、銷量量。Howtoget thedata爬蟲(chóng)腳本本#coding=gbkimporturllibimportref1=open(rE:tmaoshoujihtml.txt)#此處存儲(chǔ)儲(chǔ)了銷量量前600的網(wǎng)頁(yè)地地址http=f1.readlines()f1.close()f2=open(rE:tmaoshouji.txt,a)foriinhttp:content=urllib.urlopen(i.strip().r
3、ead()f2.write(content)f2.write(n)f2.write(#*50)f2.write(n)f2.close()f3=open(rE:tmaoshouji.txt)lines=forlineinf3.readlines():lines+=line.strip()f3.close()pattern=rem title=(.*?).*?.*?target=_blanktitle=(.*?).*?(.*?)result=re.findall(pattern,lines)f4=open(rE:tmaoshoujiInformation.txt,w)#該文件中中存儲(chǔ)了了每件手手機(jī)
4、的記記錄(機(jī)機(jī)型、售售價(jià)、銷銷量)foriteminresult:forjinrange(3):f4.write(itemj)f4.write(t)f4.write(n)f4.close()天貓銷售售數(shù)據(jù)分分析銷量?jī)r(jià)格散散點(diǎn)圖天貓銷售售數(shù)據(jù)分分析替代商品品的挖掘掘我們認(rèn)為為,如果果兩件手手機(jī)的售售價(jià)和銷銷量十分分接近,則認(rèn)為為這兩件件手機(jī)互互為替代代商品。從網(wǎng)絡(luò)絡(luò)營(yíng)銷的的特點(diǎn)來(lái)來(lái)看,從從店鋪的的角度出出發(fā),選選擇進(jìn)價(jià)價(jià)更低的的手機(jī)可可獲得更更多利潤(rùn)潤(rùn)。替代商品品的挖掘掘天貓銷售售數(shù)據(jù)分分析我們以歐歐氏距離離小于等等于2為標(biāo)準(zhǔn)sqrt(a.price-b.price)2+(a.sales_num
5、ber-b.sales_number)2)=2將手機(jī)聚聚類,找找出互為為替代的的手機(jī)。替代商品品的挖掘掘天貓銷售售數(shù)據(jù)分分析from _future_import divisionfrom mathimport sqrt#coding=gbkf1=open(rE:tmaoshoujiInformation.txt)records=f1.readlines()f1.close()price=number=product=foriinrange(len(records):item=recordsi.split(t)price.append(item0)product.append(item1)nu
6、mber.append(item2)foriinrange(len(price):forjinrange(i+1,len(price):distance=sqrt(pow(float(pricei)-float(pricej),2)+pow(int(numberi)-int(numberj),2)ifdistance=2:#ifthedistanceminuse 2,weconsiderthe twoisreplacedproductprintproducti,t,productjelse:pass所得結(jié)果果結(jié)果發(fā)現(xiàn)現(xiàn),下列列每一組組中的手手機(jī)互為為替代商商品(a)UMO/優(yōu)摩w9220Yus
7、un/語(yǔ)信T28(b)Huawei/華為C8812ZTE/中興N807(c)OPPO U705TTCLY910T(d)Coolpad/酷派8150DZTE/中興V889D(e)K-Touch/天語(yǔ)E800UMO/優(yōu)摩W800七喜TD710(f)UMO/優(yōu)摩W800七喜TD710Konka/康佳E5680(g)UniscopE/優(yōu)思U1201Huawei/華為Y300-0000(h)Coolpad/酷派8050Coolpad/酷派E239(i)Motorola/摩托羅拉拉XT800索愛(ài)正品品SA-I960安卓4.0(j)Coolpad/酷派8020Haier/海爾HT-I600(k)七喜H750
8、Gionee/金立C620(l)Lenovo/聯(lián)想A790E廣信ef58(m)Huawei/華為c8810Samsung/三星s6108(n)AUX/奧克斯V930TCLY710(o)Philips/飛利浦W8355ONN/歐恩V816G版(p)TCLY710Gionee/金立GN705w天貓銷售售數(shù)據(jù)分分析天貓銷售售數(shù)據(jù)分分析價(jià)格空洞洞的發(fā)現(xiàn)現(xiàn)經(jīng)過(guò)分析析,我們們發(fā)現(xiàn),作為中中高端機(jī)機(jī)營(yíng)銷,可選擇擇3500-4000的的價(jià)格空空洞。可可在較小小壓力下下打入市市場(chǎng)。京東商城城銷售數(shù)數(shù)據(jù)分析析牛仔褲銷銷售數(shù)據(jù)據(jù)分析用戶消費(fèi)費(fèi)記錄的的分析從生產(chǎn)廠廠家的角角度來(lái)說(shuō)說(shuō),如果果得到大大量消費(fèi)費(fèi)者的尺尺碼大
9、小小及顏色色偏好,則對(duì)生生產(chǎn)和銷銷售是非非常有利利的。因因此,我我們統(tǒng)計(jì)計(jì)了京東東女性牛牛仔褲的的銷售記記錄,從從中得到到各尺碼碼和顏色色在總的的銷售數(shù)數(shù)據(jù)中的的比例,從而指指導(dǎo)生產(chǎn)產(chǎn)。通過(guò)用戶戶的消費(fèi)費(fèi)記錄,分析出出用戶的的喜好品品牌,從從而當(dāng)該該品牌有有新產(chǎn)品品推出和和促銷活活動(dòng)時(shí)優(yōu)優(yōu)先推薦薦給這些些用戶。牛仔褲銷銷售數(shù)據(jù)據(jù)分析用戶尺碼碼大小顏顏色色偏好數(shù)據(jù)獲取取與預(yù)處處理以爬蟲(chóng)程程序從京京東商城城獲取牛牛仔褲銷銷售記錄錄,并過(guò)過(guò)濾出每每個(gè)用戶戶所購(gòu)買(mǎi)買(mǎi)的顏色色、尺碼碼。數(shù)據(jù)獲取取與預(yù)處處理京東商城城銷售數(shù)數(shù)據(jù)分析析#coding=gbkimportreimporturllibpage=1
10、6,16,16,16,16,16,16,16,15,15,15,15,15,15,15,14,14,14,14,14,13,13,13,13,13,13,12,12,12,12,12,12,12,12,12,12#page記錄了每每件商品品的評(píng)論論頁(yè)面數(shù)數(shù)目f1=open(rC:UsersYANZHIQIANGDesktopjdongNiuZaiKuAdd.txt)#goods存儲(chǔ)商品品評(píng)論地地址goodslist=f1.readlines()f1.close()s1=rE:jdongniuzaikupinglunAdds3=.txtforiinrange(0,len(goodslist):f
11、orjinrange(1,pagei+1):content=urllib.urlopen(goodslisti.strip()+str(j)+-0.html).read()printgoodslisti.strip()+str(j)+-0.htmlsave=s1+str(i)+s3f2=open(save,a)f2.write(content)f2.write(goodslisti.strip()+ page+str(j) +downloaded n)f2.write(#n)f2.close()s1=rE:jdongniuzaikupinglunAdds3=.txt數(shù)據(jù)獲取取與分析析forii
12、nrange(0,35):s=s1+str(i)+s3f=open(s)lines=forlineinf.readlines():lines+=line.strip()f.close()color=r顏.*?色:(.*?)size=r尺.*?碼:(.*?)date=r購(gòu)買(mǎi)日期期:(.*?)multiColor=re.findall(color,lines)printfile,i,has,len(multiColor),color recordsnmultiSize=re.findall(size,lines)printfile,i,has,len(multiSize),sizerecordsn
13、multiDate=re.findall(date,lines)printfile,i,has,len(multiDate),daterecordsnf1=open(s1+str(i)+color+s3,w)forcinmultiColor:f1.write(c)f1.write(n)f1.close()f2=open(s1+str(i)+size+s3,w)forsinmultiSize:f2.write(s)f2.write(n)f2.close()f3=open(s1+str(i)+date+s3,w)fordinmultiDate:f3.write(d)f3.write(n)f3.cl
14、ose()京東商城城銷售數(shù)數(shù)據(jù)分析析用戶尺碼碼大小與與顏色偏偏好挖掘掘#coding=gbkimportrename=白,黑,粉,棗紅,酒紅,大紅,紅,紫,綠,杏,黃,棕,寶藍(lán),彩藍(lán),海藍(lán),深藍(lán),淺藍(lán),灰藍(lán),中藍(lán),天藍(lán),墨蘭,墨藍(lán),藏藍(lán),藍(lán),橙,灰countColor=0*ifor iinrange(len(name)f1=open(rE:jdongallNiuZaiKuColor.txt)color=f1.readlines()f1.close()forjincolor:forkinrange(0,len(name):ifre.search(namek,j):countColork=coun
15、tColork+1breakf2=open(rE:jdongcolorSummary.txt,a)d=dict(zip(name,countColor)forkey in d.keys():f2.write(str(key)+t+str(dkey)f2.write(n)f2.close()daxiao=str(i)foriinrange(10,36)countSize=i*0foriinrange(len(daxiao)f3=open(rE:jdongallNiuZaiKuSize.txt)size=f3.readlines()f3.close()用戶尺碼碼大小與與顏色偏偏好挖掘掘forain
16、size:forbinrange(0,len(daxiao):ifre.search(daxiaob,a.strip():countSizeb=countSizeb+1breakelif re.search(XS$,a.strip():countSize14=countSize14+1breakelif re.search(S$,a.strip():countSize15=countSize15+1breakelif re.search(M$,a.strip():countSize16=countSize16+1breakelif re.search(L$,a.strip():countSiz
17、e17=countSize17+1breakelif re.search(XL$,a.strip():countSize18=countSize18+1breakelif re.search(XXL$,a.strip():countSize19=countSize19+1breakelif re.search(XXXL$,a.strip():countSize20=countSize20+1breakelse:breakf4=open(rE:jdongsizeSummary.txt,a)d2=dict(zip(daxiao,countSize)forkey in d2.keys():f4.wr
18、ite(str(key)+t+str(d2key)f4.write(n)f4.close()最后得到到33,098條牛仔褲褲的顏色色、尺碼碼等銷售售信息。用戶尺碼碼大小與與顏色偏偏好挖掘掘用戶消費(fèi)費(fèi)記錄的的分析數(shù)據(jù)的獲獲取用用戶品品牌偏好好的分析析京東商城城銷售數(shù)數(shù)據(jù)分析析數(shù)據(jù)的獲獲取利用爬蟲(chóng)蟲(chóng)程序,獲取用用戶消費(fèi)費(fèi)記錄原原始html代碼,并并過(guò)濾出出記錄數(shù)大大于30的用戶的的消費(fèi)消消費(fèi)記錄錄。數(shù)據(jù)的獲獲取京東商城城銷售數(shù)數(shù)據(jù)分析析from _future_import division#coding=gbkimportmathimporturllibimportres1=rE:jdongus
19、eruser_firstpages3=.txtf=open(rE:jdonguseruserPingLunShuDaYu30.txt,a)foriinrange(1000000,1008594):yuanshifile=s1+str(i)+s3f1=open(yuanshifile)lines=forlineinf1.readlines():lines+=line.strip()f1.close()n=r評(píng)論數(shù):(d+)條commentNumber=re.findall(n,lines)ifcommentNumber:ifint(commentNumber0)29:f.write(id+str
20、(i)f.write(t)f.write(commentNumber0)f.write(n)f.flush()else:pass數(shù)據(jù)的獲獲取else:passprintuser,i,got itf.close()f1=open(rE:jdonguseruserPingLunShuDaYu30.txt)user=f1.readlines()f1.close()h1=rhttp:/userreview/h2=-0-h3=.htmls1=rE:jdongusercostomers2=consume_records.txtforcon in user:sub=con.split()num=sub0f2
21、=open(s1+str(num)+s2,a)page=math.ceil(int(sub1)/30)foriinrange(1,int(page+1):html=h1+str(num)+h2+str(i)+h3record=urllib.urlopen(html).read()f2.write(record)f2.close()京東商城城銷售數(shù)數(shù)據(jù)分析析用戶品牌牌喜好分分析京東商城城銷售數(shù)數(shù)據(jù)分析析#coding=gbkimportreimportosf1=open(rC:UsersYANZHIQIANGDesktopbrand.txt)brand=f1.readlines()f1.clos
22、e()d=foriinbrand:di.strip()=0s1=rE:jdongkehucustmers2=BrandStatistic.txtf3=open(s1+final+s2,w)#save therecordsforiteminos.listdir(rE:jdonguser):用戶品牌牌喜好分分析foriteminos.listdir(rE:jdonguser):ifitem.endswith(goods_records.txt):s=str(item)Id=re.search(d+,s).group()f2=open(rE:jdonguser+/+str(item),r)lines=forlineinf2.readlines():lines+=line.strip()f2.close()f3.write(Id+t)forkey in
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024版合法借款合同模板
- 2024年度電機(jī)維修配件銷售與代理合同
- 2024年度安全環(huán)保施工與社區(qū)關(guān)系和諧協(xié)議
- 2024年保險(xiǎn)合同(財(cái)產(chǎn))
- 2024年度智能物流系統(tǒng)研發(fā)與實(shí)施合同
- 2024年度租賃合同標(biāo)的及服務(wù)內(nèi)容詳細(xì)描述
- 2024年衛(wèi)星發(fā)射服務(wù)提供商與客戶的發(fā)射合同
- 0架AC3A直升機(jī)購(gòu)銷合同(二零二四年版)
- 2024年度城市軌道交通建設(shè)施工合同
- 2024年家具采購(gòu)合同注意事項(xiàng)
- 2024版《糖尿病健康宣教》課件
- ktv保安管理制度及崗位職責(zé)(共5篇)
- 腦出血試題完整版本
- 義務(wù)教育信息科技課程標(biāo)準(zhǔn)(2022年版)考試題庫(kù)及答案
- 建筑施工安全生產(chǎn)責(zé)任書(shū)
- 新員工三級(jí)安全教育考試試題參考答案
- 公司年會(huì)策劃及執(zhí)行服務(wù)合同
- 概算審核服務(wù)投標(biāo)方案(技術(shù)方案)
- 人教版(2019)選擇性必修第二冊(cè)Unit 2 Bridging Cultures Learning About Language教學(xué)設(shè)計(jì)
- 數(shù)學(xué)史簡(jiǎn)介課件可編輯全文
- 化工原理課程設(shè)計(jì)附錄二
評(píng)論
0/150
提交評(píng)論