![函數(shù)學(xué)習(xí)資料dropna函數(shù)的作用_第1頁](http://file4.renrendoc.com/view/3f11c1e9b41f24169b3b3cf45e51f937/3f11c1e9b41f24169b3b3cf45e51f9371.gif)
![函數(shù)學(xué)習(xí)資料dropna函數(shù)的作用_第2頁](http://file4.renrendoc.com/view/3f11c1e9b41f24169b3b3cf45e51f937/3f11c1e9b41f24169b3b3cf45e51f9372.gif)
![函數(shù)學(xué)習(xí)資料dropna函數(shù)的作用_第3頁](http://file4.renrendoc.com/view/3f11c1e9b41f24169b3b3cf45e51f937/3f11c1e9b41f24169b3b3cf45e51f9373.gif)
![函數(shù)學(xué)習(xí)資料dropna函數(shù)的作用_第4頁](http://file4.renrendoc.com/view/3f11c1e9b41f24169b3b3cf45e51f937/3f11c1e9b41f24169b3b3cf45e51f9374.gif)
![函數(shù)學(xué)習(xí)資料dropna函數(shù)的作用_第5頁](http://file4.renrendoc.com/view/3f11c1e9b41f24169b3b3cf45e51f937/3f11c1e9b41f24169b3b3cf45e51f9375.gif)
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
dropna函數(shù)的作用一.apply函數(shù)作用:對DataFrame的某行/列應(yīng)用函數(shù)之后,Apply返回一些值。函數(shù)既可以使用默認(rèn)的,也可以自定義。注意:在第二個輸出中應(yīng)用head()函數(shù),因為它包含了很多行。#創(chuàng)建一個新函數(shù)defnum_missing(x):returnsum(x.isnull())#應(yīng)用每一列print"Missingvaluespercolumn:"printdata.apply(num_missing,axis=0)#axis=0definesthatfunctionistobeappliedoneachcolumn#應(yīng)用每一行print"\nMissingvaluesperrow:"printdata.apply(num_missing,axis=1).head()#axis=1definesthatfunctionistobeappliedoneachrow二.loc函數(shù)作用:選擇屬性子集subSalesDf=salesDf.loc[0:4,'購藥時間':'銷售數(shù)量']三.rename函數(shù)作用:列重命名colNameDict={'購藥時間':'銷售時間'}#將‘購藥時間’改為‘銷售時間’salesDf.rename(columns=colNameDict,inplace=True)四.dropna函數(shù)作用:刪除缺失值,how='any'意為在給定的任何一列中有缺失值就刪除salesDf=salesDf.dropna(subset=['銷售時間','社??ㄌ?],how='any')#刪除列(銷售時間,社??ㄌ?中為空的行五.pd.to_datetime函數(shù)作用:字符串類型的數(shù)據(jù)轉(zhuǎn)換成日期格式。傳入的格式是原始數(shù)據(jù)的日期格式——format='%Y-%m-%d'固定寫法:Y表示年、m表示月、d表示日。salesDf.loc[:,'銷售時間']=pd.to_datetime(salesDf.loc[:,'銷售時間'],format='%Y-%m-%d',errors='coerce')errors='coerce':如果原始數(shù)據(jù)不符合日期的格式,轉(zhuǎn)換后的值為空值NaT。所以轉(zhuǎn)換之后我們還要運(yùn)行一次刪除空值的代碼,因為不符合格式的日期被轉(zhuǎn)變?yōu)榱丝罩敌枰獎h除。salesDf=salesDf.dropna(subset=['銷售時間','社??ㄌ?],how='any')六.pd.sort_values作用:對數(shù)據(jù)進(jìn)行排序,by表示按那幾列進(jìn)行排序,ascending=True表示升序排列,ascending=False表示降序排列salesDf=salesDf.sort_values(by='銷售時間',#按銷售日期進(jìn)行升序排列ascending=True)七.reset_index函數(shù)作用:生成從0到N按順序的索引值salesDf=salesDf.reset_index(drop=True)八.describe函數(shù)作用:查看數(shù)據(jù)框中所有數(shù)據(jù)每列的描述統(tǒng)計信息:(count:總數(shù),mean:平均數(shù),std:標(biāo)準(zhǔn)差,min:最小值,25%:下四分位數(shù),50%:中位數(shù),75%:上四分位數(shù),max:最大值)salesDf.describe()九.刪除異常值作用:假設(shè)最小值出現(xiàn)了小于0的情況,分析應(yīng)該是記錄過程中出現(xiàn)錯誤所致。第一步:設(shè)置查詢條件,這一步返回True和falsequerySer=salesDf.loc[:,'銷售數(shù)量']>0第二步:應(yīng)用查詢條件salesDf=salesDf.loc[querySer,:]十.drop_duplicates函數(shù)作用:將重復(fù)的數(shù)據(jù)刪除,同一個人發(fā)生的所有消費算作一次消費,根據(jù)列名(銷售時間,社區(qū)卡號),如果這兩個列值同時相同,只保留1條kpi1_Df=salesDf.drop_duplicates(subset=['銷售時間','社??ㄌ?])十一.groupby作用:根據(jù)某一列分組gb=groupDf.groupby(groupDf.index.month)對分組后的數(shù)據(jù)應(yīng)用函數(shù)mounthDf=gb.sum()十二.不適=使用for循環(huán)的列表生成器作用:當(dāng)一個列表中的元素是由另外一個列表中對應(yīng)元素經(jīng)過運(yùn)算得到時,可以省去for循環(huán),適用一行代碼生成模型x=[2,3,4,5]out=[item*2foriteminx]print(out)十三.Lambda表達(dá)式作用:不使用def關(guān)鍵字,也沒有return。Lambda表達(dá)式創(chuàng)造的函數(shù)和普通的def構(gòu)建的函數(shù)沒什么不同,只不過函數(shù)體只有單獨一個表達(dá)式而已。double=lambdax:x*2#double是函數(shù)名,x是參數(shù)print(double(3))十四.map和filter函數(shù)1.map作用:可以與Lambda表達(dá)式同時使用,map()函數(shù)接收一個列表,和一個函數(shù)(可以是Lambda表達(dá)式),它對列表里的每個元素調(diào)用一個函數(shù)進(jìn)行處理,再將結(jié)果放進(jìn)一個新列表里。result=list(map(double,x))print(result)2.filter作用:它接收一個列表,和一個規(guī)則函數(shù),在對列表里的每個元素調(diào)用這個規(guī)則函數(shù)之后,它把所有返回值為假的元素從列表中剔除,然后返回這個過濾后的子列表。result2=list(filter(lambdaa:a>4,x))十五.arrange函數(shù)作用:arange()函數(shù)按照指定的步長返回一個等差數(shù)列。除開始和結(jié)束值之外,你還可以自定義步長和數(shù)據(jù)類型。請注意,給定的結(jié)束值參數(shù)是不會被包含在結(jié)果內(nèi)的。result=np.arange(start,stop,step)十六.linspace函數(shù)作用:將給定區(qū)間進(jìn)行若干等分以后的等分點組成的數(shù)列。所以你傳入的參數(shù)包括開始值、結(jié)束值,以及具體多少等分。linspace()將這個區(qū)間進(jìn)行等分后,把開始值、結(jié)束值和每個等分點都放進(jìn)一個NumPy數(shù)組里。這在做數(shù)據(jù)可視化以及繪制坐標(biāo)軸的時候都很有用。result4=np.linspace(2.0,3.0,num=5)十七.矩陣合并函數(shù)1.Concat作用:把一個或多個數(shù)據(jù)表按行(或列)的方向簡單堆疊起來(看你傳入的axis參數(shù)是0還是1咯)。2.me
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年個人投資合同標(biāo)準(zhǔn)版本(三篇)
- 2025年二年級語文教師個人工作小結(jié)(3篇)
- 2025年五年級班主任期末工作總結(jié)范例(二篇)
- 2025年個人租車給公司合同協(xié)議(2篇)
- 2025年產(chǎn)業(yè)技術(shù)合作協(xié)議經(jīng)典版(三篇)
- 產(chǎn)業(yè)園辦公區(qū)設(shè)計合同
- 書法教室裝修合作協(xié)議范本
- 住宅精裝修水電施工合同
- 水泥運(yùn)輸車輛調(diào)度協(xié)議
- 廠房改造工程勞務(wù)協(xié)議
- 全名校北師大版數(shù)學(xué)五年級下冊第三單元達(dá)標(biāo)測試卷(含答案)
- 新員工入職通識考試(中軟國際)
- 四星級酒店工程樣板房裝修施工匯報
- 博士后進(jìn)站申請書博士后進(jìn)站申請書八篇
- 華為攜手深圳國際會展中心創(chuàng)建世界一流展館
- 2023版思想道德與法治專題2 領(lǐng)悟人生真諦 把握人生方向 第3講 創(chuàng)造有意義的人生
- 全過程工程咨詢服務(wù)技術(shù)方案
- GB/T 41509-2022綠色制造干式切削工藝性能評價規(guī)范
- 土木工程畢業(yè)設(shè)計(論文)-五層宿舍樓建筑結(jié)構(gòu)設(shè)計
- 青年卒中 幻燈
- 典型倒閘操作票
評論
0/150
提交評論