




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
項(xiàng)目5利用Pandas進(jìn)行財(cái)務(wù)數(shù)據(jù)分析利用Pandas進(jìn)行數(shù)據(jù)排序和排名分析任務(wù)5.1利用Pandas進(jìn)行數(shù)據(jù)的統(tǒng)計(jì)與描述分析任務(wù)5.2利用Pandas進(jìn)行數(shù)據(jù)的分組與分段分析任務(wù)5.3利用Pandas進(jìn)行數(shù)據(jù)的交叉與透視分析任務(wù)5.4目錄利用Pandas進(jìn)行數(shù)據(jù)相關(guān)性分析任務(wù)5.5項(xiàng)目學(xué)習(xí)目標(biāo)1知識(shí)目標(biāo)2能力目標(biāo)3素養(yǎng)目標(biāo)掌握索引排序函數(shù)sort_index()、數(shù)值排序函數(shù)sort_values()以及數(shù)據(jù)排名函數(shù)rank()的使用;掌握常用統(tǒng)計(jì)分析函數(shù)的使用,如sum()、mean()、max()、min()等函數(shù);掌握分組統(tǒng)計(jì)函數(shù)groupby()、agg()及分段函數(shù)cut()的使用;掌握交叉分析函數(shù)crosstab()及數(shù)據(jù)透視函數(shù)pivot_table()的使用;掌握相關(guān)系數(shù)計(jì)算函數(shù)corr()的使用。能根據(jù)分析需要對(duì)財(cái)務(wù)數(shù)據(jù)進(jìn)行排序或排名;能根據(jù)分析需要對(duì)財(cái)務(wù)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)與描述;能根據(jù)分析需要對(duì)財(cái)務(wù)數(shù)據(jù)進(jìn)行分組和分段;能根據(jù)分析需要對(duì)財(cái)務(wù)數(shù)據(jù)進(jìn)行交叉和透視分析;能根據(jù)分析需要對(duì)財(cái)務(wù)數(shù)據(jù)進(jìn)行相關(guān)性分析。具有做事認(rèn)真、一絲不茍的學(xué)習(xí)態(tài)度;具有與團(tuán)隊(duì)成員精誠(chéng)合作的精神,能正確面對(duì)成功或失??;具有一定的自學(xué)能力和實(shí)踐創(chuàng)新意識(shí)。引入案例任務(wù)分析知識(shí)解析案例解析任務(wù)實(shí)訓(xùn)實(shí)訓(xùn)評(píng)價(jià)5.1.1數(shù)據(jù)排序5.1.2數(shù)據(jù)排名任務(wù)5.1利用Pandas進(jìn)行數(shù)據(jù)排序和排名分析任務(wù)5.1利用Pandas進(jìn)行數(shù)據(jù)排序和排名分析引入案例美創(chuàng)科技有限公司財(cái)務(wù)人員小王想利用企業(yè)費(fèi)用支出表.xlsx(位置:E:\file\)中的數(shù)據(jù),對(duì)今年每個(gè)月的招待費(fèi)進(jìn)行排序和排名,大概了解一下招待費(fèi)每個(gè)月的使用情況,那么在Pandas中如何實(shí)現(xiàn)呢?任務(wù)分析要想實(shí)現(xiàn)對(duì)數(shù)據(jù)的排序和排名,就要用到Pandas模塊中的索引排序函數(shù)sort_index()、數(shù)值排序函數(shù)sort_values()以及數(shù)據(jù)排名函數(shù)rank(),通過正確選擇函數(shù)、設(shè)置函數(shù)參數(shù),就能實(shí)現(xiàn)分析目標(biāo)。任務(wù)5.1利用Pandas進(jìn)行數(shù)據(jù)排序和排名分析知識(shí)解析在數(shù)據(jù)分析時(shí),對(duì)數(shù)據(jù)進(jìn)行排序和排名是常用的操作。通過數(shù)據(jù)的排序和排名,比較容易發(fā)現(xiàn)數(shù)據(jù)的特征和趨勢(shì),找到解決問題的線索。除此之外,排序和排名還有助于對(duì)數(shù)據(jù)檢查糾錯(cuò),為數(shù)據(jù)的分組或分段提供方便。5.1.1數(shù)據(jù)排序數(shù)據(jù)排序是指使數(shù)據(jù)按一定方式進(jìn)行排列,通過數(shù)據(jù)排序可以更為方便地看出數(shù)據(jù)特征。DataFrame排序可以分為按索引排序和按數(shù)值排序。任務(wù)5.1利用Pandas進(jìn)行數(shù)據(jù)排序和排名分析一、按索引排序按索引排序是指按照DataFrame索引的值升序或者降序重新排列數(shù)據(jù),在Pandas中利用sort_index()函數(shù)可以實(shí)現(xiàn)按照索引對(duì)數(shù)據(jù)進(jìn)行排序。sort_index()函數(shù)的語法格式如下:DataFrame.sort_index(axis=0,level=None,ascending=True,inplace=False,kind='quicksort’,na_position='last',sort_remaining=True,ignore_index=False,key=None)參數(shù)說明axis接收0或1。表示用來指定排序的軸,0表示根據(jù)行索引排序,1表示根據(jù)列索引排序,默認(rèn)為0。level用來指定索引級(jí)別,若設(shè)置則按照指定的級(jí)別排序,默認(rèn)為None,即以索引的值進(jìn)行排序。ascending接收布爾值或布爾值列表。用來指定是否升序排序,默認(rèn)是True,即升序排序。inplace接收布爾值,默認(rèn)為False。如果設(shè)置為True,則在原地(原來的數(shù)據(jù))進(jìn)行操作。na_position接收'first'或'last'。用來指定空值(NaN)應(yīng)該排序的位置,默認(rèn)為'last',即放在最后面。任務(wù)5.1利用Pandas進(jìn)行數(shù)據(jù)排序和排名分析【做中學(xué)5.1.1】讀入應(yīng)交個(gè)稅表.xlsx(位置:E:\file\),將工號(hào)設(shè)置為行索引,然后根據(jù)行索引升序排列?!咀鲋袑W(xué)5.1.1】解析如下:導(dǎo)入Pandas模塊和Excel表格數(shù)據(jù)。程序如下:importpandasaspd#引入Pandas模塊#讀取Excel表格數(shù)據(jù)df=pd.read_excel(r'E:\file\應(yīng)交個(gè)稅表.xlsx')df#查看dfSTEP01將工號(hào)列設(shè)置為行索引,并按照行索引升序排列。程序如下:df1=df.set_index('工號(hào)')#將工號(hào)列設(shè)置為行索引df1.sort_index(inplace=True)df1#查看df1STEP02任務(wù)5.1利用Pandas進(jìn)行數(shù)據(jù)排序和排名分析二、按數(shù)值排序按數(shù)值排序是指可以按照DataFrame某一列(行)或幾列(行)的值升序或者降序的方式重新排列數(shù)據(jù),在Pandas中利用sort_values()函數(shù)實(shí)現(xiàn)對(duì)數(shù)值的排序。sort_values()函數(shù)的語法格式如下:DataFrame.sort_values(by,axis=0,ascending=Ture,inplace=Flase,kind='quicksort’,na_position='last',ignore_index=False,key=None)參數(shù)說明by接收字符串(行名或者列名),也可以是字符串的列表(多個(gè)行名或者多個(gè)列名),需要配合axis參數(shù)使用。如果axis=0或者"index",那么by="列名";如果axis=1或者"columns",那么by="行名"。axis若axis=0或'index',則按照指定列中數(shù)據(jù)大小排序;若axis=1或'columns',則按照指定行中數(shù)據(jù)大小排序,默認(rèn)axis為0。ascending接收布爾值或布爾值列表。指定是否升序排序,默認(rèn)是True,即升序排序。inplace接收布爾值,默認(rèn)為False。如果設(shè)置為True,則在原地(原來的數(shù)據(jù))進(jìn)行操作。na_position接收'first'或'last'。表示指定空值(NaN)應(yīng)該排序的位置,默認(rèn)為'last',即放在最后面。【請(qǐng)注意】sort_values()函數(shù)必須指定by參數(shù),即必須指定行或列。任務(wù)5.1利用Pandas進(jìn)行數(shù)據(jù)排序和排名分析【做中學(xué)5.1.2】讀入應(yīng)交個(gè)稅表.xlsx(位置:E:\file\),對(duì)表格中的數(shù)據(jù)按列進(jìn)行排序?!咀鲋袑W(xué)5.1.2】解析如下:導(dǎo)入Pandas模塊和Excel表格,并根據(jù)應(yīng)交個(gè)稅列升序排列。程序如下:importpandasaspd#引入Pandas#讀取Excel表格數(shù)據(jù)df=pd.read_excel(r'E:\file\應(yīng)交個(gè)稅表.xlsx')df.sort_values(by='應(yīng)交個(gè)稅')#根據(jù)應(yīng)交個(gè)稅列升序排列STEP01根據(jù)應(yīng)交個(gè)稅列和工號(hào)列兩列排序,并且應(yīng)交個(gè)稅列、工號(hào)列都降序排列。程序如下:df.sort_values(by=['應(yīng)交個(gè)稅','工號(hào)'],
ascending=[False,False])STEP02任務(wù)5.1利用Pandas進(jìn)行數(shù)據(jù)排序和排名分析rank()函數(shù)的語法格式如下:DataFrame.rank(axis=0,method='average',numeric_only=None,na_option='keep',ascending=True,pct=False)5.1.2數(shù)據(jù)排名參數(shù)說明axis接收0或'index',1或'columns'。表示沿著行或列計(jì)算排名,默認(rèn)為0。method接收'average','min','max','first'或'dense',默認(rèn)為'average'。表示如何對(duì)相同數(shù)值進(jìn)行排名,不同的取值含義如下:①average:在相等分組中,為各個(gè)值分配平均排名;②min:使用整個(gè)分組的最小排名;③max:使用整個(gè)分組的最大排名;④first:按值在原始數(shù)據(jù)中的出現(xiàn)順序分配排名;⑤dense:類似于'min’,但組之間的排名始終提高1,即并列的數(shù)據(jù)只占據(jù)一個(gè)名次。numeric_only接收布爾值,表示是否僅僅計(jì)算數(shù)字型的columns。na_option接收'keep','top'或'bottom',默認(rèn)為'keep'。表示NaN值是否參與排名及如何排名,不同的取值含義如下:①keep:將NaN等級(jí)分配給NaN值;②top:如果升序,則將最小等級(jí)分配給NaN值;③bottom:如果升序,則將最高等級(jí)分配給NaN值。ascending接收布爾值,默認(rèn)為True。表示某列(行)元素是否按升序排名。pct接收布爾值,默認(rèn)為False。表示是否以百分比形式顯示返回的排名。任務(wù)5.1利用Pandas進(jìn)行數(shù)據(jù)排序和排名分析【做中學(xué)5.1.3】讀入應(yīng)交個(gè)稅表.xlsx(位置:E:\file\),對(duì)表格中的應(yīng)交個(gè)稅列使用method參數(shù)的四種取值進(jìn)行排名。【做中學(xué)5.1.3】程序如下:importpandasaspd#引入Pandas模塊df=pd.read_excel(r'E:\file\應(yīng)交個(gè)稅表.xlsx')df['rank_avg']=df['應(yīng)交個(gè)稅'].rank(ascending=False)df['rank_min']=df['應(yīng)交個(gè)稅'].rank(method='min',ascending=False)df['rank_max']=df['應(yīng)交個(gè)稅'].rank(method='max',ascending=False)df['rank_fir']=df['應(yīng)交個(gè)稅'].rank(method='first',ascending=False)df['rank_den']=df['應(yīng)交個(gè)稅'].rank(method='dense',ascending=False)df#查看df內(nèi)容任務(wù)5.1利用Pandas進(jìn)行數(shù)據(jù)排序和排名分析讀取企業(yè)費(fèi)用支出表.xlsx(位置:E:\file\)獲取數(shù)據(jù)。程序如下:importpandasaspd#導(dǎo)入Pandas模塊#讀入Excel表格數(shù)據(jù)df=pd.read_excel(r'E:\file\企業(yè)費(fèi)用支出表.xlsx')df.head()#查看前5行數(shù)據(jù)STEP01案例解析任務(wù)5.1利用Pandas進(jìn)行數(shù)據(jù)排序和排名分析使用sort_values()函數(shù)對(duì)招待費(fèi)按降序排列。程序如下:df1=df.sort_values(by="招待費(fèi)",ascending=False)df1.head()#查看df前5行STEP02案例解析任務(wù)5.1利用Pandas進(jìn)行數(shù)據(jù)排序和排名分析使用rank()函數(shù)對(duì)招待費(fèi)進(jìn)行排名,并在原來df增加排名列。程序如下:df['排名']=df['招待費(fèi)'].rank(method='dense',ascending=False)df#查看dfSTEP03任務(wù)5.1利用Pandas進(jìn)行數(shù)據(jù)排序和排名分析任務(wù)實(shí)訓(xùn)請(qǐng)上機(jī)編寫程序?qū)崿F(xiàn)以下要求:讀取企業(yè)費(fèi)用支出表.xlsx(位置:E:\file\)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 包機(jī)運(yùn)輸合同范本
- 醫(yī)學(xué)技術(shù)入股合同范本
- 農(nóng)村果樹種植合同范本
- 區(qū)域分公司合同范本
- 農(nóng)戶銷售茶葉合同范本
- 買賣置換合同范本
- 會(huì)員食材配送合同范本
- 華能煤炭合同范本
- 智能門鎖培訓(xùn)課件
- 石墨在醫(yī)療健康領(lǐng)域的應(yīng)用及市場(chǎng)分析
- 2025人教版一年級(jí)下冊(cè)數(shù)學(xué)教學(xué)進(jìn)度表
- DeepSeek教案寫作指令
- 休學(xué)復(fù)學(xué)申請(qǐng)書
- 瓷磚鋪貼勞務(wù)承包協(xié)議書
- 2025年四川司法警官職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試近5年??及鎱⒖碱}庫含答案解析
- 土力學(xué)與地基基礎(chǔ)(課件)
- 塑膠原料檢驗(yàn)規(guī)范
- 汪小蘭有機(jī)化學(xué)課件(第四版)6
- 建筑公司內(nèi)部管理流程-課件PPT
- 學(xué)習(xí)美術(shù)新課標(biāo)的心得體會(huì)
- 建筑施工企業(yè)行政管理存在的問題與對(duì)策研究
評(píng)論
0/150
提交評(píng)論