




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
Pandas-數(shù)據(jù)特征分析課前回顧重復(fù)值處理:duplicated()、drop_duplicates()缺失值處理:isna()、dropna()、fillna()其他異常處理:刪除特殊字符replace()、更改數(shù)據(jù)類(lèi)型astype()索引設(shè)置:set_index()、reset_index()科云數(shù)據(jù)清洗函數(shù):dataClean()目錄010203描述性統(tǒng)計(jì)分析累計(jì)統(tǒng)計(jì)數(shù)據(jù)排序01描述性統(tǒng)計(jì)分析描述性統(tǒng)計(jì)分析在財(cái)務(wù)工作中,我們常常需要計(jì)算各種財(cái)務(wù)指標(biāo)的合計(jì)數(shù)、平均值、最大最小值、標(biāo)準(zhǔn)差等,那么我們?nèi)绾尾拍芸焖僦肋@些統(tǒng)計(jì)值呢?Pandas提供了很多描述性統(tǒng)計(jì)函數(shù),常用統(tǒng)計(jì)函數(shù)如下:函數(shù)描述函數(shù)描述函數(shù)描述count()非空值的個(gè)數(shù)median()中位數(shù)mad()平均絕對(duì)偏差sum()求和mode()眾數(shù)abs()絕對(duì)值mean()平均值prod()數(shù)組元素的乘積cov()協(xié)方差min()最小值quantile()分位數(shù)corr()相關(guān)系數(shù)max()最大值var()樣本方差pct_change()百分?jǐn)?shù)變化describe()統(tǒng)計(jì)信息摘要std()樣本標(biāo)準(zhǔn)差diff()一階差分讀取數(shù)據(jù)讀取data.xlsx中利潤(rùn)表項(xiàng)目數(shù)據(jù):代碼#引入pandasimportpandasaspd#讀取data.xlsx利潤(rùn)表項(xiàng)目df=pd.read_excel('/webpython/course/d2633ec9ca5c4a288b73f97b4616d541/data.xlsx',sheet_name=1,converters={'年':str,'月':str})#顯示前5行show_table(df.head())描述性統(tǒng)計(jì)分析可以計(jì)算表格中各列的統(tǒng)計(jì)指標(biāo),也可以結(jié)合索引,計(jì)算單列統(tǒng)計(jì)指標(biāo)。描述性統(tǒng)計(jì)分析可以計(jì)算表格中各列的統(tǒng)計(jì)指標(biāo),也可以結(jié)合索引,計(jì)算單列統(tǒng)計(jì)指標(biāo)。describe()函數(shù)describe()函數(shù):生成描述性統(tǒng)計(jì)信息,將所有數(shù)值列進(jìn)行統(tǒng)計(jì),返回DataFrame中常見(jiàn)的統(tǒng)計(jì)指標(biāo),包括值個(gè)數(shù)、均值、標(biāo)準(zhǔn)差、最大最小值、百分?jǐn)?shù)。describe()函數(shù)語(yǔ)法:DataFrame.describe(percentiles=None,include=None,exclude=None,datetime_is_numeric=False)常用參數(shù)說(shuō)明percentiles百分位數(shù),介于0-1之間,默認(rèn)[25%,50%,75%]include包含在結(jié)果中的數(shù)據(jù)類(lèi)型,默認(rèn)所有數(shù)值列exclude排除在結(jié)果中的數(shù)據(jù)類(lèi)型,默認(rèn)不排除任何內(nèi)容datetime_is_numeric是否將datetimedtypes視為數(shù)字,默認(rèn)為Falsedescribe()函數(shù)describe()函數(shù)結(jié)合索引器可以單獨(dú)提取describe中想要的指標(biāo)數(shù)據(jù)。示例1代碼#使用索引器獲取單項(xiàng)指標(biāo)print(df.describe().loc['max','營(yíng)業(yè)收入'])輸出結(jié)果:424000.0代碼#查看df統(tǒng)計(jì)信息show_table(df.describe())pct_change()函數(shù)pct_change()函數(shù):當(dāng)前元素與先前元素之間的百分比變化,默認(rèn)計(jì)算與前一行的百分比變化,適用于財(cái)務(wù)報(bào)表的環(huán)比分析。pct_change()函數(shù)語(yǔ)法:DataFrame.pct_change(periods=1,fill_method='pad',limit=None,freq=None,**kwargs)常用參數(shù)說(shuō)明periods計(jì)算周期,默認(rèn)為1fill_method填充空值的方法,默認(rèn)'pad',表示用前一個(gè)非缺失值填充,bfill用后一個(gè)非缺失值填充,None不填充limit限制填充次數(shù)axis計(jì)算方向,{0或'index',1或'columns'},默認(rèn)axis=0pct_change()函數(shù)要求:計(jì)算營(yíng)業(yè)收入、營(yíng)業(yè)成本、凈利潤(rùn)的環(huán)比增長(zhǎng)率。示例2代碼#計(jì)算環(huán)比增長(zhǎng)率,并使用show_table()展示結(jié)果前5行show_table(df.set_index(['年','月']).pct_change().head())例:(329800-274400)/274400=0.20189502累計(jì)統(tǒng)計(jì)累計(jì)統(tǒng)計(jì)在會(huì)計(jì)工作中,除了要計(jì)算各期發(fā)生額之外,往往還需要計(jì)算“本年累計(jì)值”。提示axis=0:默認(rèn)值,沿0軸計(jì)算,即計(jì)算每列的值axis=1:沿1軸計(jì)算,即計(jì)算每行的值函數(shù)描述cumsum()累計(jì)總和cumprod()累計(jì)乘積cummax()累計(jì)最大值cummin()累計(jì)最小值累計(jì)統(tǒng)計(jì)要求:計(jì)算2021年各期”營(yíng)業(yè)收入、營(yíng)業(yè)成本、凈利潤(rùn)”的本年累計(jì)金額。示例3代碼df1=df.loc[df['年']=='2021'].set_index(['年','月']).cumsum()show_table(df1.head())03數(shù)據(jù)排序
數(shù)據(jù)排序sort_values()函數(shù):按照某行或某列的值進(jìn)行升序或降序排序。sort_values()函數(shù)語(yǔ)法:DataFrame.sort_values(by,axis=0,ascending=True,inplace=False,kind='quicksort',na_position='last',ignore_index=False,key=None)常用參數(shù)描述byaxis軸上的某個(gè)索引或索引列表,按什么排序axis要排序的軸,{0或'index',1或'columns'},默認(rèn)0,按照指定列數(shù)據(jù)排序ascending排序方式,默認(rèn)為T(mén)rue,代表升序排序,F(xiàn)alse代表降序排序inplace默認(rèn)為False,True表示直接在原數(shù)據(jù)上排序ignore_index是否重建索引,默認(rèn)為False數(shù)據(jù)排序要求:按照凈利潤(rùn)降序排序,顯示前5行。示例4代碼df2=df.sort_values('凈利潤(rùn)',ascending=False)show_table(df2.head())sort_index()函數(shù)sort_index()函數(shù):在指定軸上根據(jù)索引值對(duì)數(shù)據(jù)進(jìn)行排序,默認(rèn)使用行索引升序排序。sort_index()函數(shù)語(yǔ)法:DataFrame.sort_index(axis=0,level=None,ascending=True,inplace=False,kind='quicksort',na_position='last',sort_remaining=True,ignore_index=False,key=None)代碼#按照行索引降序排序df3=df.sort_index(ascending=False)show
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 三農(nóng)人才培養(yǎng)與教育發(fā)展策略指南
- 個(gè)人醫(yī)院轉(zhuǎn)讓合同范本
- 印章刻制合同范本
- 道路山皮石回填施工方案
- 周口水泥仿木欄桿施工方案
- 區(qū)域銷(xiāo)售合同范本
- 買(mǎi)賣(mài)磚簡(jiǎn)易合同范本
- 2025建筑安全員知識(shí)題庫(kù)及答案
- 南京 旅游 合同范例
- 與農(nóng)民工簽訂勞務(wù)合同范本
- 標(biāo)本溢灑應(yīng)急預(yù)案
- 2024年有關(guān)對(duì)外擔(dān)保-股東會(huì)決議范本
- 2024年1月浙江省高考英語(yǔ)真題試卷含答案
- 人民醫(yī)院樣本外送檢測(cè)管理制度
- 老舊小區(qū)改造工程施工組織設(shè)計(jì)方案
- 建筑幕墻工程檢測(cè)知識(shí)考試題庫(kù)500題(含答案)
- DG-TJ 08-2451-2024 電動(dòng)自行車(chē)集中充電和停放場(chǎng)所設(shè)計(jì)標(biāo)準(zhǔn)
- DB3301-T 65.28-2024 反恐怖防范系統(tǒng)管理規(guī)范 第28部分:硬質(zhì)隔離設(shè)施
- +一次函數(shù)復(fù)習(xí)課+教學(xué)設(shè)計(jì) 中考數(shù)學(xué)一輪復(fù)習(xí)(北師大版)
- 人教版一年級(jí)數(shù)學(xué)下冊(cè)全冊(cè)教案(表格式)
- 11BS4排水工程華北標(biāo)圖集
評(píng)論
0/150
提交評(píng)論