電商銷售數(shù)據(jù)分析_第1頁
電商銷售數(shù)據(jù)分析_第2頁
電商銷售數(shù)據(jù)分析_第3頁
電商銷售數(shù)據(jù)分析_第4頁
電商銷售數(shù)據(jù)分析_第5頁
已閱讀5頁,還剩28頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、logo電商銷售記錄分析電商銷售記錄分析 嚴(yán)智強、賀強、劉瑞、嚴(yán)智強、賀強、劉瑞、 崔亞松、臧茹歌崔亞松、臧茹歌background網(wǎng)購流網(wǎng)購流行行電商崛電商崛起起消費人消費人群群消費習(xí)消費習(xí)慣慣潛在價潛在價值值消費記消費記錄錄消費喜消費喜好分析好分析市場方市場方向向contents數(shù)據(jù)的數(shù)據(jù)的獲取與獲取與預(yù)處理預(yù)處理替代商替代商品的挖品的挖掘掘價格空價格空洞的發(fā)洞的發(fā)現(xiàn)現(xiàn)牛仔褲銷牛仔褲銷售數(shù)據(jù)的售數(shù)據(jù)的分析分析用戶消費用戶消費記錄的分記錄的分析析淘寶網(wǎng)作為國內(nèi)第一大電商,占有淘寶網(wǎng)作為國內(nèi)第一大電商,占有近近50%市場份額,而天貓商城則是市場份額,而天貓商城則是所有優(yōu)質(zhì)店鋪的集合,每月會產(chǎn)生

2、所有優(yōu)質(zhì)店鋪的集合,每月會產(chǎn)生大量銷售數(shù)據(jù),這里以天貓近一個大量銷售數(shù)據(jù),這里以天貓近一個月的手機銷售數(shù)據(jù)進(jìn)行分析,找出月的手機銷售數(shù)據(jù)進(jìn)行分析,找出這些數(shù)據(jù)隱含的價值。這些數(shù)據(jù)隱含的價值。天貓手機銷售數(shù)據(jù)分析天貓手機銷售數(shù)據(jù)分析天貓手機銷售數(shù)據(jù)分析天貓手機銷售數(shù)據(jù)分析數(shù)據(jù)的獲取與預(yù)處理數(shù)據(jù)的獲取與預(yù)處理 替代商品的挖掘替代商品的挖掘價格空洞的發(fā)現(xiàn)價格空洞的發(fā)現(xiàn)構(gòu)建一個爬蟲腳本,從天貓上獲取銷量前構(gòu)建一個爬蟲腳本,從天貓上獲取銷量前600的手機的手機銷售記錄,并匹配出每條記錄的機型、售價、銷量。銷售記錄,并匹配出每條記錄的機型、售價、銷量。 how to get the data爬蟲腳本爬蟲腳

3、本#coding=gbkimport urllibimport ref1=open(re:tmaoshoujihtml.txt)#此處存儲了銷量前此處存儲了銷量前600的網(wǎng)頁地址的網(wǎng)頁地址http=f1.readlines()f1.close()f2=open(re:tmaoshouji.txt,a)for i in http: content=urllib.urlopen(i.strip().read() f2.write(content) f2.write(n) f2.write(#*50) f2.write(n)f2.close()f3=open(re:tmaoshouji.txt)li

4、nes=for line in f3.readlines(): lines+=line.strip()f3.close()pattern=rem title=(.*?).*?.*?target=_blank title=(.*?).*?(.*?)result=re.findall(pattern,lines)f4=open(re:tmaoshoujiinformation.txt,w)#該文件中存儲了每件手機的記錄(機型、售價、銷量)該文件中存儲了每件手機的記錄(機型、售價、銷量)for item in result: for j in range(3): f4.write(itemj) f4

5、.write(t) f4.write(n)f4.close()銷量銷量價格價格 散點圖散點圖 替代商品的挖掘替代商品的挖掘 我們認(rèn)為,如果兩件手機的售價和銷我們認(rèn)為,如果兩件手機的售價和銷量十分接近,則認(rèn)為這兩件手機互為替代量十分接近,則認(rèn)為這兩件手機互為替代商品。從網(wǎng)絡(luò)營銷的特點來看,從店鋪的商品。從網(wǎng)絡(luò)營銷的特點來看,從店鋪的角度出發(fā),選擇進(jìn)價更低的手機可獲得更角度出發(fā),選擇進(jìn)價更低的手機可獲得更多利潤。多利潤。替代商品的挖掘替代商品的挖掘我們以歐氏距離小于等于我們以歐氏距離小于等于2為標(biāo)準(zhǔn)為標(biāo)準(zhǔn)sqrt(a.price-b.price)2+(a.sales_number-b.sales_

6、number)2)=2將手機聚類,找出互為替代的手機。將手機聚類,找出互為替代的手機。替代商品的挖掘替代商品的挖掘from _future_ import divisionfrom math import sqrt#coding=gbkf1=open(re:tmaoshoujiinformation.txt)records=f1.readlines()f1.close()price=number=product=for i in range(len(records): item=recordsi.split(t) price.append(item0) product.append(item1

7、) number.append(item2)for i in range(len(price): for j in range(i+1,len(price): distance=sqrt(pow(float(pricei)-float(pricej),2)+pow(int(numberi)-int(numberj),2) if distance=2: #if the distance minuse 2,we consider the two is replaced product print producti,t,productj else: pass所得結(jié)果所得結(jié)果結(jié)果發(fā)現(xiàn),下列每一組中的手

8、機互為替代商品結(jié)果發(fā)現(xiàn),下列每一組中的手機互為替代商品(a)umo/優(yōu)摩優(yōu)摩 w9220 yusun/語信語信 t28(b)huawei/華為華為 c8812 zte/中興中興 n807(c)oppo u705t tcl y910t(d)coolpad/酷派酷派 8150d zte/中興中興 v889d(e)k-touch/天語天語 e800 umo/優(yōu)摩優(yōu)摩 w800 七喜七喜 td710 (f)umo/優(yōu)摩優(yōu)摩 w800 七喜七喜 td710 konka/康佳康佳 e5680(g)uniscope/優(yōu)思優(yōu)思 u1201 huawei/華為華為 y300-0000(h)coolpad/酷派酷

9、派 8050 coolpad/酷派酷派 e239(i)motorola/摩托羅拉摩托羅拉 xt800 索愛正品索愛正品sa-i960 安卓安卓4.0 (j)coolpad/酷派酷派 8020 haier/海爾海爾 ht-i600(k)七喜七喜 h750 gionee/金立金立 c620(l)lenovo/聯(lián)想聯(lián)想 a790e 廣信廣信 ef58(m)huawei/華為華為 c8810 samsung/三星三星 s6108(n)aux/奧克斯奧克斯 v930 tcl y710(o)philips/飛利浦飛利浦 w8355 onn/歐恩歐恩 v8 16g版版(p)tcl y710 gionee/金

10、立金立 gn705w價格空洞的發(fā)現(xiàn)價格空洞的發(fā)現(xiàn)經(jīng)過分析,我們發(fā)現(xiàn),作為中高端機營銷,可選擇經(jīng)過分析,我們發(fā)現(xiàn),作為中高端機營銷,可選擇3500-4000的價格空洞??稍谳^小壓力下打入市場。的價格空洞??稍谳^小壓力下打入市場。京東商城銷售數(shù)據(jù)分析京東商城銷售數(shù)據(jù)分析牛仔褲銷售數(shù)據(jù)分析牛仔褲銷售數(shù)據(jù)分析 用戶消費記錄的分析用戶消費記錄的分析從生產(chǎn)廠家的角度來說,如果得到大量消從生產(chǎn)廠家的角度來說,如果得到大量消費者的尺碼大小及顏色偏好,則對生產(chǎn)和費者的尺碼大小及顏色偏好,則對生產(chǎn)和銷售是非常有利的。因此,我們統(tǒng)計了京銷售是非常有利的。因此,我們統(tǒng)計了京東女性牛仔褲的銷售記錄,從中得到各尺東女性牛

11、仔褲的銷售記錄,從中得到各尺碼和顏色在總的銷售數(shù)據(jù)中的比例,從而碼和顏色在總的銷售數(shù)據(jù)中的比例,從而指導(dǎo)生產(chǎn)。指導(dǎo)生產(chǎn)。通過用戶的消費記錄,分析出用戶的喜好通過用戶的消費記錄,分析出用戶的喜好品牌,從而當(dāng)該品牌有新產(chǎn)品推出和促銷品牌,從而當(dāng)該品牌有新產(chǎn)品推出和促銷活動時優(yōu)先推薦給這些用戶?;顒訒r優(yōu)先推薦給這些用戶。用戶尺碼大小用戶尺碼大小 顏色偏好顏色偏好數(shù)據(jù)獲取與預(yù)處理數(shù)據(jù)獲取與預(yù)處理 以爬蟲程序從京東商城獲取牛仔褲銷售記以爬蟲程序從京東商城獲取牛仔褲銷售記錄,并過濾出每個用戶所購買的顏色、尺錄,并過濾出每個用戶所購買的顏色、尺碼。碼。數(shù)據(jù)獲取與預(yù)處理數(shù)據(jù)獲取與預(yù)處理#coding=gbki

12、mport reimport urllibpage=16,16,16,16,16,16,16,16,15,15,15,15,15,15,15,14,14,14,14,14,13,13,13,13,13,13,12,12,12,12,12,12,12,12,12,12#page記錄了每件商品的評論頁面數(shù)目記錄了每件商品的評論頁面數(shù)目f1=open(rc:usersyanzhiqiangdesktopjdongniuzaikuadd.txt)#goods存儲商品評論地址存儲商品評論地址goodslist=f1.readlines()f1.close()s1=re:jdongniuzaikuping

13、lunadds3=.txtfor i in range(0,len(goodslist): for j in range(1,pagei+1): content=urllib.urlopen(goodslisti.strip()+str(j)+-0.html).read() print goodslisti.strip()+str(j)+-0.html save=s1+str(i)+s3 f2=open(save,a) f2.write(content) f2.write(goodslisti.strip()+ page + str(j) + downloaded n) f2.write(#n

14、) f2.close()s1=re:jdongniuzaikupinglunadds3=.txt數(shù)據(jù)獲取與分析數(shù)據(jù)獲取與分析for i in range(0,35): s=s1+str(i)+s3 f=open(s) lines= for line in f.readlines(): lines+=line.strip() f.close() color=r顏顏.*?色:色:(.*?) size=r尺尺.*?碼:碼:(.*?) date=r購買日期:購買日期:(.*?) multicolor=re.findall(color,lines) print file,i,has,len(multic

15、olor),color recordsn multisize=re.findall(size,lines) print file,i,has,len(multisize),size recordsn multidate=re.findall(date,lines) print file,i,has,len(multidate),date recordsn f1=open(s1+str(i)+color+s3,w) for c in multicolor: f1.write(c) f1.write(n) f1.close() f2=open(s1+str(i)+size+s3,w) for s

16、in multisize: f2.write(s) f2.write(n) f2.close() f3=open(s1+str(i)+date+s3,w) for d in multidate: f3.write(d) f3.write(n) f3.close()用戶尺碼大小與顏色偏好挖掘用戶尺碼大小與顏色偏好挖掘#coding=gbkimport rename=白白,黑黑,粉粉,棗紅棗紅,酒紅酒紅,大紅大紅,紅紅,紫紫,綠綠,杏杏,黃黃,棕棕,寶藍(lán)寶藍(lán),彩藍(lán)彩藍(lán),海藍(lán)海藍(lán),深藍(lán)深藍(lán),淺藍(lán)淺藍(lán),灰藍(lán)灰藍(lán),中藍(lán)中藍(lán),天藍(lán)天藍(lán),墨蘭墨蘭,墨藍(lán)墨藍(lán),藏藍(lán)藏藍(lán),藍(lán)藍(lán),橙橙,灰灰countcolor=0

17、*i for i in range(len(name)f1=open(re:jdongallniuzaikucolor.txt)color=f1.readlines()f1.close()for j in color: for k in range(0,len(name): if re.search(namek,j): countcolork=countcolork+1 break f2=open(re:jdongcolorsummary.txt,a)d=dict(zip(name,countcolor)for key in d.keys(): f2.write(str(key)+t+str(

18、dkey) f2.write(n)f2.close()daxiao=str(i) for i in range(10,36)countsize=i*0 for i in range(len(daxiao)f3=open(re:jdongallniuzaikusize.txt)size=f3.readlines()f3.close()用戶尺碼大小與顏色偏好挖掘用戶尺碼大小與顏色偏好挖掘for a in size: for b in range(0,len(daxiao): if re.search(daxiaob,a.strip(): countsizeb=countsizeb+1 break

19、elif re.search(xs$,a.strip(): countsize14=countsize14+1 break elif re.search(s$,a.strip(): countsize15=countsize15+1 break elif re.search(m$,a.strip(): countsize16=countsize16+1 break elif re.search(l$,a.strip(): countsize17=countsize17+1 break elif re.search(xl$,a.strip(): countsize18=countsize18+1

20、 break elif re.search(xxl$,a.strip(): countsize19=countsize19+1 break elif re.search(xxxl$,a.strip(): countsize20=countsize20+1 break else: breakf4=open(re:jdongsizesummary.txt,a)d2=dict(zip(daxiao,countsize)for key in d2.keys(): f4.write(str(key)+t+str(d2key) f4.write(n)f4.close()最后得到最后得到33,098條牛條牛

21、仔褲的顏色、尺碼等仔褲的顏色、尺碼等銷售信息銷售信息。用戶尺碼大小與顏色偏好挖掘用戶尺碼大小與顏色偏好挖掘 用戶消費記錄的分析用戶消費記錄的分析數(shù)據(jù)的獲取數(shù)據(jù)的獲取 用戶品牌偏好的分析用戶品牌偏好的分析數(shù)據(jù)的獲取數(shù)據(jù)的獲取 利用爬蟲程序,獲取用戶消費記錄原始利用爬蟲程序,獲取用戶消費記錄原始html代碼,并過濾出代碼,并過濾出記錄數(shù)大于記錄數(shù)大于30的用戶的用戶的消費消費記錄。的消費消費記錄。數(shù)據(jù)的獲取數(shù)據(jù)的獲取from _future_ import division#coding=gbkimport mathimport urllibimport res1=re:jdonguseruser

22、_firstpages3=.txtf=open(re:jdonguseruserpinglunshudayu30.txt,a)for i in range(1000000,1008594): yuanshifile=s1+str(i)+s3 f1=open(yuanshifile) lines= for line in f1.readlines(): lines+=line.strip() f1.close() n=r評論數(shù):評論數(shù):(d+)條條 commentnumber=re.findall(n,lines) if commentnumber: if int(commentnumber0)

23、 29: f.write(id+str(i) f.write(t) f.write(commentnumber0) f.write(n) f.flush() else: pass數(shù)據(jù)的獲取數(shù)據(jù)的獲取 else: pass print user,i,got itf.close() f1=open(re:jdonguseruserpinglunshudayu30.txt)user=f1.readlines()f1.close()h1=rhttp:/ con in user: sub=con.split() num=sub0 f2=open(s1+str(num)+s2,a) page=math.c

24、eil(int(sub1)/30) for i in range(1,int(page+1): html=h1+str(num)+h2+str(i)+h3 record=urllib.urlopen(html).read() f2.write(record)f2.close()用戶品牌喜好分析用戶品牌喜好分析#coding=gbkimport reimport osf1=open(rc:usersyanzhiqiangdesktopbrand.txt)brand=f1.readlines()f1.close()d=for i in brand: di.strip()=0s1=re:jdongk

25、ehucustmers2=brandstatistic.txtf3=open(s1+final+s2,w)#save the records for item in os.listdir(re:jdonguser):用戶品牌喜好分析用戶品牌喜好分析for item in os.listdir(re:jdonguser): if item.endswith(goods_records.txt): s=str(item) id=re.search(d+,s).group() f2=open(re:jdonguser+/+str(item),r) lines= for line in f2.readlines(): lines+=line.strip() f2.close() f3.write(id+t) for key in d.keys(): dkey=len(re.findall(key,lines) if dkey=5: f3.write(str(key)+str(t)+str(dkey)+str(t) else: pa

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論