Python數據分析與可視化典型項目實戰(zhàn)模塊六-訂單數據分析_第1頁
Python數據分析與可視化典型項目實戰(zhàn)模塊六-訂單數據分析_第2頁
Python數據分析與可視化典型項目實戰(zhàn)模塊六-訂單數據分析_第3頁
Python數據分析與可視化典型項目實戰(zhàn)模塊六-訂單數據分析_第4頁
Python數據分析與可視化典型項目實戰(zhàn)模塊六-訂單數據分析_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

模塊六訂單數據分析Python數據分析與可視化典型項目實戰(zhàn)(微課版)【任務描述】Excel文件“order_report.xlsx”共有28010行、7列數據,列名分別為:訂單編號、總金額(即訂單總金額)、實際支付金額(即在已付款的情況下為總金額與退款金額之差;在未付款的情況下則為0)、收貨地址(即各個省市區(qū))、訂單創(chuàng)建時間(即下單時間)、訂單付款時間(即付款時間)、退款金額(即付款后申請退款的金額,如未付過款,退款金額為0)。針對該數據集完成以下數據分析與可視化操作。(1)計算總體轉化率與單一環(huán)節(jié)轉化率。(2)繪制總體轉化率漏斗圖與單一環(huán)節(jié)轉化率漏斗圖。(3)繪制按日統(tǒng)計的訂單數量趨勢折線圖。(4)繪制銷量區(qū)域分布的柱形圖。(5)繪制全國各地區(qū)訂單數分布地圖?!救蝿諏崿F】在JupyterNotebook開發(fā)環(huán)境中創(chuàng)建tc06-01.ipynb,然后在單元格中編寫代碼并輸出對應的結果?!救蝿?-1】訂單數據分析訂單數據分析1.導入模塊importdatetime2.提取數據df=pd.read_excel(r'.\data\order_report.xlsx')df.head()訂單數據分析3.數據清洗查看數據集的列名df.columns輸出結果:Index(['訂單編號','總金額','實際支付金額','收貨地址','訂單創(chuàng)建時間','訂單付款時間','退款金額'],dtype='object')通過info()函數查看數據各字段的詳細信息()輸出結果:訂單數據分析數據重復值、缺失值處理重復值統(tǒng)計輸出結果:0df.duplicated().sum()缺失值統(tǒng)計輸出結果:df.isnull().sum()對于缺失值,訂單付款時間缺失3923個,因為實際支付金額未缺失,所以訂單付款時間缺失值可以不做處理,也可以填充“0”。訂單數據分析4.繪制總體轉化率漏斗圖與單一環(huán)節(jié)轉化率漏斗圖統(tǒng)計各字段數量dict_convs=dict()key='總訂單數'dict_convs[key]=len(df)key='付款訂單數'#訂單付款時間不為空的,表示付過款df_payed=df[df['訂單付款時間'].notnull()]dict_convs[key]=len(df_payed)key='到款訂單數'#實際支付金額=總金額-退款金額(在已付款的情況下)#實際支付金額不為0的,說明訂單商家收到貨款df_trans=df_payed[df_payed['實際支付金額']!=0]dict_convs[key]=len(df_trans)key='全額到款訂單數'訂單數據分析#在付款訂單中,退款金額為0的,說明沒有退款,表示全額收款df_trans_full=df_payed[df_payed['退款金額']==0]dict_convs[key]=len(df_trans_full)len(df_trans_full)df_convs=pd.Series(dict_convs,name='訂單數').to_frame()df_convs計算總體轉化率name='總體轉化率'total_convs=df_convs['訂單數']/df_convs.loc['總訂單數','訂單數']*100df_convs[name]=total_convs.apply(lambdax:round(x,0))繪制總體轉化率漏斗圖name='總體轉化率'funnel=Funnel().add(series_name=name,data_pair=[list(z)forzinzip(df_convs.index,df_convs[name])],訂單數據分析is_selected=True,label_opts=opts.LabelOpts(position='inside'))funnel.set_series_opts(tooltip_opts=opts.TooltipOpts(formatter='{a}<br/>:{c}%'))funnel.set_global_opts(title_opts=opts.TitleOpts(title=name),)funnel.render_notebook()計算單一環(huán)節(jié)轉化率name='單一環(huán)節(jié)轉化率'single_convs=df_convs['訂單數'].shift()#默認下移一位df_convs[name]=single_convs.fillna(df_convs.loc['總訂單數','訂單數'])#填充空值df_convs[name]=round((df_convs['訂單數']/df_convs[name]*100),0)df_convs訂單數據分析繪制單一環(huán)節(jié)轉化率漏斗圖name='單一環(huán)節(jié)轉化率'funnel=Funnel().add(series_name=name,data_pair=[list(z)forzinzip(df_convs.index,df_convs[name])],is_selected=True,label_opts=opts.LabelOpts(position='inside'))funnel.set_series_opts(tooltip_opts=opts.TooltipOpts(formatter='{a}<br/>:{c}%'))funnel.set_global_opts(title_opts=opts.TitleOpts(title=name))funnel.render_notebook()訂單數據分析5.分析整體訂單數趨勢將“訂單創(chuàng)建時間”設置為標簽#設置標簽為“訂單創(chuàng)建時間”df_trans=df_trans.set_index('訂單創(chuàng)建時間')df_trans.head()使用pandas的DataFrame.plot()方法繪制按日統(tǒng)計的訂單數量趨勢折線圖(5月)按日統(tǒng)計訂單數量se_trans_month=df_trans.resample('D')['訂單編號'].count()plt.figure(figsize=(10,5))se_trans_month.plot(fontsize=12)訂單數據分析計算訂單平均價格df_trans['實際支付金額'].mean()使用pyecharts.charts的Line類繪制按日統(tǒng)計的訂單數量趨勢折線圖掃描二維碼在線瀏覽電子活頁6-1“繪制按日統(tǒng)計的訂單數量趨勢折線圖”中的代碼及繪制的圖形。輸出結果:100.36861777895066訂單數據分析6.分析銷量區(qū)域分布分析收貨地址,繪制銷量區(qū)域分布的柱形圖se_trans_map=df_trans.groupby('收貨地址')['收貨地址'].count().sort_values(ascending=False)plt.figure(figsize=(10,5),dpi=100)se_trans_map.plot(kind='bar',fontsize=12)分析收貨地址,繪制銷量區(qū)域分布的柱形圖【任務描述】Excel文件“天貓訂單.xlsx”共有28010行、6列數據,列名分別為:訂單創(chuàng)建時間、訂單付款時間、訂單金額、實付金額、退款金額、收貨地址。通過分析28010條天貓實際訂單數據,看看全國哪里的訂單量比較大,哪些時間段訂單量比較大。針對該數據集完成以下數據可視化分析操作。(1)繪制一周7天各個時段訂單數量散點圖。(2)繪制一周各天訂單數量極坐標圖。(3)繪制天貓訂單全國分布地圖。【任務實現】在JupyterNotebook開發(fā)環(huán)境中創(chuàng)建tc06-02.ipynb,然后在單元格中編寫代碼并輸出對應的結果。【任務6-2】天貓訂單數據可視化分析天貓訂單數據可視化分析1.導入模塊導入通用模塊的代碼詳見“本書導學”,導入其他模塊的代碼如下:frommons.utilsimportJsCodefrompyecharts.globalsimportThemeType2.數據讀取與預處理數據讀取df=pd.read_excel(r'data\天貓訂單.xlsx')df.head()查看數據集大小df.shape輸出結果:28010,6天貓訂單數據可視化分析查看索引、數據類型、內存信息等基本信息()篩選已付款的訂單df[~df['訂單付款時間'].isnull()]根據“訂單創(chuàng)建時間”獲取星期數據并增加“星期”列df['星期']=df['訂單創(chuàng)建時間'].dt

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論