




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
模塊六訂單數(shù)據(jù)分析Python數(shù)據(jù)分析與可視化典型項(xiàng)目實(shí)戰(zhàn)(微課版)【任務(wù)描述】Excel文件“order_report.xlsx”共有28010行、7列數(shù)據(jù),列名分別為:訂單編號(hào)、總金額(即訂單總金額)、實(shí)際支付金額(即在已付款的情況下為總金額與退款金額之差;在未付款的情況下則為0)、收貨地址(即各個(gè)省市區(qū))、訂單創(chuàng)建時(shí)間(即下單時(shí)間)、訂單付款時(shí)間(即付款時(shí)間)、退款金額(即付款后申請(qǐng)退款的金額,如未付過款,退款金額為0)。針對(duì)該數(shù)據(jù)集完成以下數(shù)據(jù)分析與可視化操作。(1)計(jì)算總體轉(zhuǎn)化率與單一環(huán)節(jié)轉(zhuǎn)化率。(2)繪制總體轉(zhuǎn)化率漏斗圖與單一環(huán)節(jié)轉(zhuǎn)化率漏斗圖。(3)繪制按日統(tǒng)計(jì)的訂單數(shù)量趨勢折線圖。(4)繪制銷量區(qū)域分布的柱形圖。(5)繪制全國各地區(qū)訂單數(shù)分布地圖?!救蝿?wù)實(shí)現(xiàn)】在JupyterNotebook開發(fā)環(huán)境中創(chuàng)建tc06-01.ipynb,然后在單元格中編寫代碼并輸出對(duì)應(yīng)的結(jié)果。【任務(wù)6-1】訂單數(shù)據(jù)分析訂單數(shù)據(jù)分析1.導(dǎo)入模塊importdatetime2.提取數(shù)據(jù)df=pd.read_excel(r'.\data\order_report.xlsx')df.head()訂單數(shù)據(jù)分析3.?dāng)?shù)據(jù)清洗查看數(shù)據(jù)集的列名df.columns輸出結(jié)果:Index(['訂單編號(hào)','總金額','實(shí)際支付金額','收貨地址','訂單創(chuàng)建時(shí)間','訂單付款時(shí)間','退款金額'],dtype='object')通過info()函數(shù)查看數(shù)據(jù)各字段的詳細(xì)信息()輸出結(jié)果:訂單數(shù)據(jù)分析數(shù)據(jù)重復(fù)值、缺失值處理重復(fù)值統(tǒng)計(jì)輸出結(jié)果:0df.duplicated().sum()缺失值統(tǒng)計(jì)輸出結(jié)果:df.isnull().sum()對(duì)于缺失值,訂單付款時(shí)間缺失3923個(gè),因?yàn)閷?shí)際支付金額未缺失,所以訂單付款時(shí)間缺失值可以不做處理,也可以填充“0”。訂單數(shù)據(jù)分析4.繪制總體轉(zhuǎn)化率漏斗圖與單一環(huán)節(jié)轉(zhuǎn)化率漏斗圖統(tǒng)計(jì)各字段數(shù)量dict_convs=dict()key='總訂單數(shù)'dict_convs[key]=len(df)key='付款訂單數(shù)'#訂單付款時(shí)間不為空的,表示付過款df_payed=df[df['訂單付款時(shí)間'].notnull()]dict_convs[key]=len(df_payed)key='到款訂單數(shù)'#實(shí)際支付金額=總金額-退款金額(在已付款的情況下)#實(shí)際支付金額不為0的,說明訂單商家收到貨款df_trans=df_payed[df_payed['實(shí)際支付金額']!=0]dict_convs[key]=len(df_trans)key='全額到款訂單數(shù)'訂單數(shù)據(jù)分析#在付款訂單中,退款金額為0的,說明沒有退款,表示全額收款df_trans_full=df_payed[df_payed['退款金額']==0]dict_convs[key]=len(df_trans_full)len(df_trans_full)df_convs=pd.Series(dict_convs,name='訂單數(shù)').to_frame()df_convs計(jì)算總體轉(zhuǎn)化率name='總體轉(zhuǎn)化率'total_convs=df_convs['訂單數(shù)']/df_convs.loc['總訂單數(shù)','訂單數(shù)']*100df_convs[name]=total_convs.apply(lambdax:round(x,0))繪制總體轉(zhuǎn)化率漏斗圖name='總體轉(zhuǎn)化率'funnel=Funnel().add(series_name=name,data_pair=[list(z)forzinzip(df_convs.index,df_convs[name])],訂單數(shù)據(jù)分析is_selected=True,label_opts=opts.LabelOpts(position='inside'))funnel.set_series_opts(tooltip_opts=opts.TooltipOpts(formatter='{a}<br/>:{c}%'))funnel.set_global_opts(title_opts=opts.TitleOpts(title=name),)funnel.render_notebook()計(jì)算單一環(huán)節(jié)轉(zhuǎn)化率name='單一環(huán)節(jié)轉(zhuǎn)化率'single_convs=df_convs['訂單數(shù)'].shift()#默認(rèn)下移一位df_convs[name]=single_convs.fillna(df_convs.loc['總訂單數(shù)','訂單數(shù)'])#填充空值df_convs[name]=round((df_convs['訂單數(shù)']/df_convs[name]*100),0)df_convs訂單數(shù)據(jù)分析繪制單一環(huán)節(jié)轉(zhuǎn)化率漏斗圖name='單一環(huán)節(jié)轉(zhuǎn)化率'funnel=Funnel().add(series_name=name,data_pair=[list(z)forzinzip(df_convs.index,df_convs[name])],is_selected=True,label_opts=opts.LabelOpts(position='inside'))funnel.set_series_opts(tooltip_opts=opts.TooltipOpts(formatter='{a}<br/>:{c}%'))funnel.set_global_opts(title_opts=opts.TitleOpts(title=name))funnel.render_notebook()訂單數(shù)據(jù)分析5.分析整體訂單數(shù)趨勢將“訂單創(chuàng)建時(shí)間”設(shè)置為標(biāo)簽#設(shè)置標(biāo)簽為“訂單創(chuàng)建時(shí)間”df_trans=df_trans.set_index('訂單創(chuàng)建時(shí)間')df_trans.head()使用pandas的DataFrame.plot()方法繪制按日統(tǒng)計(jì)的訂單數(shù)量趨勢折線圖(5月)按日統(tǒng)計(jì)訂單數(shù)量se_trans_month=df_trans.resample('D')['訂單編號(hào)'].count()plt.figure(figsize=(10,5))se_trans_month.plot(fontsize=12)訂單數(shù)據(jù)分析計(jì)算訂單平均價(jià)格df_trans['實(shí)際支付金額'].mean()使用pyecharts.charts的Line類繪制按日統(tǒng)計(jì)的訂單數(shù)量趨勢折線圖掃描二維碼在線瀏覽電子活頁6-1“繪制按日統(tǒng)計(jì)的訂單數(shù)量趨勢折線圖”中的代碼及繪制的圖形。輸出結(jié)果:100.36861777895066訂單數(shù)據(jù)分析6.分析銷量區(qū)域分布分析收貨地址,繪制銷量區(qū)域分布的柱形圖se_trans_map=df_trans.groupby('收貨地址')['收貨地址'].count().sort_values(ascending=False)plt.figure(figsize=(10,5),dpi=100)se_trans_map.plot(kind='bar',fontsize=12)分析收貨地址,繪制銷量區(qū)域分布的柱形圖【任務(wù)描述】Excel文件“天貓訂單.xlsx”共有28010行、6列數(shù)據(jù),列名分別為:訂單創(chuàng)建時(shí)間、訂單付款時(shí)間、訂單金額、實(shí)付金額、退款金額、收貨地址。通過分析28010條天貓實(shí)際訂單數(shù)據(jù),看看全國哪里的訂單量比較大,哪些時(shí)間段訂單量比較大。針對(duì)該數(shù)據(jù)集完成以下數(shù)據(jù)可視化分析操作。(1)繪制一周7天各個(gè)時(shí)段訂單數(shù)量散點(diǎn)圖。(2)繪制一周各天訂單數(shù)量極坐標(biāo)圖。(3)繪制天貓訂單全國分布地圖。【任務(wù)實(shí)現(xiàn)】在JupyterNotebook開發(fā)環(huán)境中創(chuàng)建tc06-02.ipynb,然后在單元格中編寫代碼并輸出對(duì)應(yīng)的結(jié)果?!救蝿?wù)6-2】天貓訂單數(shù)據(jù)可視化分析天貓訂單數(shù)據(jù)可視化分析1.導(dǎo)入模塊導(dǎo)入通用模塊的代碼詳見“本書導(dǎo)學(xué)”,導(dǎo)入其他模塊的代碼如下:frommons.utilsimportJsCodefrompyecharts.globalsimportThemeType2.?dāng)?shù)據(jù)讀取與預(yù)處理數(shù)據(jù)讀取df=pd.read_excel(r'data\天貓訂單.xlsx')df.head()查看數(shù)據(jù)集大小df.shape輸出結(jié)果:28010,6天貓訂單數(shù)據(jù)可視化分析查看索引、數(shù)據(jù)類型、內(nèi)存信息等基本信息()篩選已付款的訂單df[~df['訂單付款時(shí)間'].isnull()]根據(jù)“訂單創(chuàng)建時(shí)間”獲取星期數(shù)據(jù)并增加“星期”列df['星期']=df['訂單創(chuàng)建時(shí)間'].dt
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年安徽盛潁建設(shè)投資發(fā)展有限公司招聘5人筆試參考題庫附帶答案詳解
- 浙江省紹興市上虞區(qū)城南中學(xué)2025屆高三第二學(xué)期期末調(diào)研數(shù)學(xué)試題
- 2024年天津銷售分公司秋季高校畢業(yè)生招聘10人筆試參考題庫附帶答案詳解
- 2024年吉林銷售分公司秋季高校畢業(yè)生招聘30人筆試參考題庫附帶答案詳解
- 類風(fēng)濕診斷標(biāo)準(zhǔn)
- 二零二五貨物運(yùn)輸代理三方協(xié)議
- 二零二五事業(yè)單位職工勞動(dòng)合同書
- 代養(yǎng)托管協(xié)議書二零二五年
- 二零二五影視劇制片人聘用合同模板
- 高中籃球模塊教學(xué)中運(yùn)動(dòng)處方應(yīng)用研究
- 庫房管理工作職責(zé)與規(guī)范化
- 2024-2025學(xué)年七年級(jí)下學(xué)期數(shù)學(xué)期中測試(浙江瑞安市專用)(含答案)
- 2025年浙江省杭州市拱墅區(qū)中考語文模擬試卷含答案
- 2024國家數(shù)字化范式與路徑-公共政策立場-67正式版
- 路面工程安全專項(xiàng)施工方案
- 瑞吉?dú)W幼兒教育
- 2025年中國人壽招聘筆試筆試參考題庫附帶答案詳解
- 語義演變與認(rèn)知機(jī)制-深度研究
- 做新時(shí)代的忠誠愛國者課件
- 2024年中考模擬試卷英語(蘇州卷)
- 游戲人物立繪課程設(shè)計(jì)
評(píng)論
0/150
提交評(píng)論