版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)據(jù)分析主要內(nèi)容行列處理索引處理統(tǒng)計(jì)分析行列處理行,列數(shù)據(jù)重要地區(qū)別(針對(duì)機(jī)器學(xué))行:一個(gè)樣本數(shù)據(jù)列:所有樣本地一個(gè)特征數(shù)據(jù)刪除行數(shù)據(jù):不影響其它樣本刪除列數(shù)據(jù):影響所有樣本列數(shù)據(jù)重要度遠(yuǎn)遠(yuǎn)大于行數(shù)據(jù)重要度大部分處理操作集于列數(shù)據(jù)處理列處理重命名列標(biāo)簽(或列索引)rename():重命名一個(gè)或者多個(gè)列標(biāo)簽columns:同時(shí)重命名所有列標(biāo)簽刪除列drop():刪除一個(gè)或多個(gè)列,注意其地inplace參數(shù)地用法新建列data[‘新列標(biāo)簽’]=xxx:Pandas會(huì)自動(dòng)判斷是否需要?jiǎng)?chuàng)建一個(gè)新列日期數(shù)據(jù)處理datetime六四:日期時(shí)間數(shù)據(jù)類型,提供了了豐富地針對(duì)日期時(shí)間地操作。原始數(shù)據(jù)DateTime:pd.to_datetime()常用日期時(shí)間處理獲取有關(guān)信息:.dt.day,.dt.year,.dt.dayofweek等(參考datetime六四.dt)加減操作:獲取五天之前地日期,獲取一三:零零之后一五分鐘地時(shí)間排序操作:支持按大小排序索引注意區(qū)分索引與下標(biāo)打印DataFrame數(shù)據(jù)地時(shí)候,不會(huì)顯示下標(biāo)。索引地作用提供快速訪問行列數(shù)據(jù)地機(jī)制提升數(shù)據(jù)查詢,操作地能支持?jǐn)?shù)據(jù)自動(dòng)對(duì)齊功能支持?jǐn)?shù)據(jù)聯(lián)接等復(fù)雜數(shù)據(jù)操縱功能索引常見類型數(shù)據(jù)均可以被設(shè)為索引,如數(shù)值類型,字符串類型,日期時(shí)間類型等。設(shè)置索引:set_index()單級(jí)索引,多級(jí)索引基于索引地查詢單級(jí)索引查詢列數(shù)據(jù):data[‘A’]行數(shù)據(jù):data.loc[零]或data.loc[‘零’]多級(jí)索引查詢查詢代碼:多級(jí)索引查詢示例建議嚴(yán)格按照以下代碼格式編寫多級(jí)索引查詢代碼index一='Guangzhou'index二='二零一三/七/一'data.loc[(index一,index二),] #注意使用元組表示多級(jí)索引:('Guangzhou','二零一三/七/一’)。如果涉及切片:idx=pd.IndexSliceindex一='Guangzhou'index二=slice('二零一三/七/一','二零一三/七/一零')index=idx[index一,index二]data.loc[index,]idx=pd.IndexSliceindex一=['Guangzhou','Shanghai']index二=slice(None)index=idx[index一,index二]data.loc[index,]統(tǒng)計(jì)分析統(tǒng)計(jì)分析地重要:隱藏過多地?cái)?shù)據(jù)細(xì)節(jié),發(fā)現(xiàn)隱含地規(guī)律如何比較A與B在同一門課地學(xué)效果?如何比較班級(jí)A與班級(jí)B在同一門課地學(xué)效果?常見地統(tǒng)計(jì)分析查詢一年最熱地月份二零零零-二零二零年年均氣溫?cái)?shù)據(jù)最低氣溫與最高氣溫按氣溫高低排序數(shù)據(jù)排序默認(rèn)情況下,Pandas不對(duì)行,列數(shù)據(jù)行排序排序數(shù)據(jù):pd.sort_values()排序索引:pd.sort_index()如果設(shè)置了多級(jí)索引,則需要先排序索引,才能按索引查詢數(shù)據(jù)統(tǒng)計(jì)查詢簡(jiǎn)單統(tǒng)計(jì)查詢:不分組,直接統(tǒng)計(jì)計(jì)算所有數(shù)據(jù)data['日內(nèi)均氣溫'].max()data['日內(nèi)均氣溫'].mean()分組統(tǒng)計(jì)查詢:先分組,再按組分別統(tǒng)計(jì)計(jì)算data.groupby('區(qū)域').mean()data.groupby('區(qū)域').agg({'日
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年甲乙雙方關(guān)于新一代智能電氣安裝工程全面合作合同
- 2024招投標(biāo)管理部門風(fēng)險(xiǎn)防控及合同履行責(zé)任書3篇
- 浙江工商大學(xué)《地貌學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 2024蘇州二手房買賣與家居智能化改造服務(wù)合同3篇
- 貨代公司知識(shí)培訓(xùn)課件
- 商品基礎(chǔ)知識(shí)培訓(xùn)課件
- 稅務(wù)工作總結(jié)稅收違法違章行為查處整改
- 2024智能供應(yīng)鏈管理系統(tǒng)建設(shè)與運(yùn)營(yíng)合同
- 房屋租賃行業(yè)市場(chǎng)營(yíng)銷策略總結(jié)
- 西南財(cái)經(jīng)大學(xué)《商務(wù)實(shí)踐活動(dòng)一》2023-2024學(xué)年第一學(xué)期期末試卷
- 檢驗(yàn)科lis系統(tǒng)需求
- 疏散樓梯安全要求全解析
- 汽車擾流板產(chǎn)品原材料供應(yīng)與需求分析
- 中東及非洲空氣制水機(jī)行業(yè)現(xiàn)狀及發(fā)展機(jī)遇分析2024-2030
- DL∕T 1631-2016 并網(wǎng)風(fēng)電場(chǎng)繼電保護(hù)配置及整定技術(shù)規(guī)范
- PLC控制系統(tǒng)合同(2024版)
- 煤礦立井井筒及硐室設(shè)計(jì)規(guī)范
- 房地產(chǎn)項(xiàng)目開發(fā)合作協(xié)議書
- JJG(交通) 171-2021 超聲式成孔質(zhì)量檢測(cè)儀檢定規(guī)程
- QCT457-2023救護(hù)車技術(shù)規(guī)范
- 《中國(guó)大熊貓》課件大綱
評(píng)論
0/150
提交評(píng)論