版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第四章
數(shù)據(jù)處理與應(yīng)用4.2
大數(shù)據(jù)處理4.2.2編程處理數(shù)據(jù)學(xué)習(xí)目標(biāo)掌握pandas模塊的兩種數(shù)據(jù)結(jié)構(gòu)Series和DataFrame。學(xué)習(xí)使用pandas模塊對(duì)數(shù)據(jù)進(jìn)行編輯、計(jì)算、統(tǒng)計(jì)、分析。能選用合適的方法和軟件對(duì)數(shù)據(jù)進(jìn)行簡(jiǎn)單可視化。掌握運(yùn)用matplotlib的pyplot子庫(kù)的方法,學(xué)習(xí)和體會(huì)編程處理數(shù)據(jù)的方法和優(yōu)勢(shì)。使用Python語(yǔ)言編程進(jìn)行數(shù)據(jù)分析和挖掘,可以調(diào)用Python的擴(kuò)展模塊。Python常用數(shù)據(jù)處理拓展模塊:Numpy模塊:
科學(xué)運(yùn)算的基礎(chǔ)庫(kù),主要提供科學(xué)計(jì)算中常用的隨機(jī)數(shù)、數(shù)組運(yùn)算等基礎(chǔ)函數(shù)。Scipy模塊:
基于numpy構(gòu)建的一個(gè)模塊,增強(qiáng)了在高等數(shù)學(xué)、信號(hào)處理、圖像處理、統(tǒng)計(jì)等方面的處理能力。Pandas模塊:
基于numpy實(shí)現(xiàn),提供了大量處理數(shù)據(jù)的函數(shù)和方法,能方便地操作大型數(shù)據(jù)集。Matplotlib模塊:
繪圖庫(kù),使用pyplot子庫(kù)中的函數(shù)快速繪圖和設(shè)置圖表坐標(biāo)軸、坐標(biāo)軸刻度、圖例等。知識(shí)點(diǎn)一:利用pandas模塊處理數(shù)據(jù)新課講授pandas提供了Series和DataFrame兩種數(shù)據(jù)結(jié)構(gòu),可完成數(shù)據(jù)整理、計(jì)算、統(tǒng)計(jì)、分析及簡(jiǎn)單可視化。在Python中引入pandas模塊的方法如下:importpandasaspdPython模塊的導(dǎo)入——import語(yǔ)句:導(dǎo)入函數(shù)或模塊到python代碼中,實(shí)現(xiàn)代碼復(fù)用??蔀槟K或函數(shù)指定別名。import
模塊名
調(diào)用:模塊名.函數(shù)名()from模塊名import函數(shù)名
調(diào)用:函數(shù)名()importmath
math.sqrt(64)frommathimportsqrt
sqrt(64)import模塊名as別名
調(diào)用:別名.函數(shù)名()from模塊名import函數(shù)名
as別名
調(diào)用:別名()importmathassx
sx.sqrt(64)frommathimportsqrtassq
sq(64)1.一維數(shù)據(jù)結(jié)構(gòu)——Series包含一個(gè)數(shù)組的數(shù)據(jù)(values)和一個(gè)與數(shù)據(jù)關(guān)聯(lián)的索引(index),索引值默認(rèn)是從0起遞增的整數(shù)。列表、字典等能用來(lái)創(chuàng)建Series數(shù)據(jù)結(jié)構(gòu),與列表不同的是,Series的索引可以指定,類(lèi)型可以為字符串型。(1)創(chuàng)建Series對(duì)象(2)查看Series對(duì)象中的數(shù)據(jù)2.二維數(shù)據(jù)結(jié)構(gòu)——DataFrame由1個(gè)索引列(index)和若干個(gè)數(shù)據(jù)列組成,每個(gè)數(shù)據(jù)列可以是不同的類(lèi)型。DataFrame可以看作是共享同一個(gè)index的Series的集合。行索引類(lèi)似于關(guān)系表中每行的編號(hào),列標(biāo)題類(lèi)似于表格的列名(也稱(chēng)為字段)。(1)創(chuàng)建DataFrame對(duì)象(2)查看DataFrame對(duì)象中的數(shù)據(jù)(3)DataFrame常用函數(shù)DataFrame數(shù)據(jù)結(jié)構(gòu)提供了豐富的函數(shù),這些函數(shù)可以用來(lái)進(jìn)行行、列編輯和統(tǒng)計(jì)計(jì)算等。知識(shí)點(diǎn)二:利用matplotlib模塊繪圖matplotlib是一個(gè)繪圖庫(kù),使用其中的pyplot子庫(kù)所提供的函數(shù)可以快速繪圖和設(shè)置圖表的坐標(biāo)軸、坐標(biāo)軸刻度、圖例等。在Python中引入matplotlib的pyplot子庫(kù)的方法為:importmatplotlib.pyplotasplt1.有Python程序段如下:importpandasaspdpd1=pd.Series([1,2,3,4])print(pd1.index)該程序段運(yùn)行后輸出結(jié)果為()A.
B.
C.
D.0112122323343445隨堂練習(xí)A2.某DataFrame對(duì)象df,其中包含1
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年酒店管理公司保密協(xié)議管理制度
- 第10課 制作表格(說(shuō)課稿)2023-2024學(xué)年五年級(jí)下冊(cè)信息技術(shù)電子工業(yè)版(內(nèi)蒙古)
- 2025江西省建筑安全員《B證》考試題庫(kù)
- 腦機(jī)接口技術(shù)概述
- 跨文化國(guó)際合作平臺(tái)的建設(shè)與管理策略
- 2024施工簡(jiǎn)易合同范本(水利工程改造)3篇
- 法律人才發(fā)展面臨的新挑戰(zhàn)
- 2024我要開(kāi)民宿:民宿旅游產(chǎn)品創(chuàng)新與研發(fā)合同3篇
- 探究·實(shí)踐 建立減數(shù)分裂中染色體變化的模型 說(shuō)課稿 2023-2024學(xué)年高一下學(xué)期生物人教版必修2
- 二零二五年度GPS森林資源管理與保護(hù)合同3篇
- 小學(xué)三年級(jí)好詞好句好段摘抄大全
- 鹽城淇岸環(huán)境科技有限公司年處理 3000 噸醫(yī)療廢物處置項(xiàng)目環(huán)評(píng)報(bào)告書(shū)
- 重慶市社會(huì)保險(xiǎn)登記表
- 高血壓疾病證明書(shū)
- GA 763-2008警服V領(lǐng)、半高領(lǐng)毛針織套服
- 10000中國(guó)普通人名大全
- (完整word版)兒童迷宮圖 清晰可直接打印
- 醫(yī)院財(cái)務(wù)科出納崗位說(shuō)明書(shū)
- DB37-T 5076-2016 賓館酒店建筑能耗限額標(biāo)準(zhǔn)
- 數(shù)據(jù)中心機(jī)房裝修標(biāo)準(zhǔn)規(guī)范(精簡(jiǎn))
- 某機(jī)修廠供配電系統(tǒng)設(shè)計(jì)
評(píng)論
0/150
提交評(píng)論