編程處理數(shù)據(jù)  課件高中信息技術(shù)必修1_第1頁(yè)
編程處理數(shù)據(jù)  課件高中信息技術(shù)必修1_第2頁(yè)
編程處理數(shù)據(jù)  課件高中信息技術(shù)必修1_第3頁(yè)
編程處理數(shù)據(jù)  課件高中信息技術(shù)必修1_第4頁(yè)
編程處理數(shù)據(jù)  課件高中信息技術(shù)必修1_第5頁(yè)
已閱讀5頁(yè),還剩18頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第四章

數(shù)據(jù)處理與應(yīng)用4.2

大數(shù)據(jù)處理4.2.2編程處理數(shù)據(jù)學(xué)習(xí)目標(biāo)掌握pandas模塊的兩種數(shù)據(jù)結(jié)構(gòu)Series和DataFrame。學(xué)習(xí)使用pandas模塊對(duì)數(shù)據(jù)進(jìn)行編輯、計(jì)算、統(tǒng)計(jì)、分析。能選用合適的方法和軟件對(duì)數(shù)據(jù)進(jìn)行簡(jiǎn)單可視化。掌握運(yùn)用matplotlib的pyplot子庫(kù)的方法,學(xué)習(xí)和體會(huì)編程處理數(shù)據(jù)的方法和優(yōu)勢(shì)。使用Python語(yǔ)言編程進(jìn)行數(shù)據(jù)分析和挖掘,可以調(diào)用Python的擴(kuò)展模塊。Python常用數(shù)據(jù)處理拓展模塊:Numpy模塊:

科學(xué)運(yùn)算的基礎(chǔ)庫(kù),主要提供科學(xué)計(jì)算中常用的隨機(jī)數(shù)、數(shù)組運(yùn)算等基礎(chǔ)函數(shù)。Scipy模塊:

基于numpy構(gòu)建的一個(gè)模塊,增強(qiáng)了在高等數(shù)學(xué)、信號(hào)處理、圖像處理、統(tǒng)計(jì)等方面的處理能力。Pandas模塊:

基于numpy實(shí)現(xiàn),提供了大量處理數(shù)據(jù)的函數(shù)和方法,能方便地操作大型數(shù)據(jù)集。Matplotlib模塊:

繪圖庫(kù),使用pyplot子庫(kù)中的函數(shù)快速繪圖和設(shè)置圖表坐標(biāo)軸、坐標(biāo)軸刻度、圖例等。知識(shí)點(diǎn)一:利用pandas模塊處理數(shù)據(jù)新課講授pandas提供了Series和DataFrame兩種數(shù)據(jù)結(jié)構(gòu),可完成數(shù)據(jù)整理、計(jì)算、統(tǒng)計(jì)、分析及簡(jiǎn)單可視化。在Python中引入pandas模塊的方法如下:importpandasaspdPython模塊的導(dǎo)入——import語(yǔ)句:導(dǎo)入函數(shù)或模塊到python代碼中,實(shí)現(xiàn)代碼復(fù)用??蔀槟K或函數(shù)指定別名。import

模塊名

調(diào)用:模塊名.函數(shù)名()from模塊名import函數(shù)名

調(diào)用:函數(shù)名()importmath

math.sqrt(64)frommathimportsqrt

sqrt(64)import模塊名as別名

調(diào)用:別名.函數(shù)名()from模塊名import函數(shù)名

as別名

調(diào)用:別名()importmathassx

sx.sqrt(64)frommathimportsqrtassq

sq(64)1.一維數(shù)據(jù)結(jié)構(gòu)——Series包含一個(gè)數(shù)組的數(shù)據(jù)(values)和一個(gè)與數(shù)據(jù)關(guān)聯(lián)的索引(index),索引值默認(rèn)是從0起遞增的整數(shù)。列表、字典等能用來(lái)創(chuàng)建Series數(shù)據(jù)結(jié)構(gòu),與列表不同的是,Series的索引可以指定,類(lèi)型可以為字符串型。(1)創(chuàng)建Series對(duì)象(2)查看Series對(duì)象中的數(shù)據(jù)2.二維數(shù)據(jù)結(jié)構(gòu)——DataFrame由1個(gè)索引列(index)和若干個(gè)數(shù)據(jù)列組成,每個(gè)數(shù)據(jù)列可以是不同的類(lèi)型。DataFrame可以看作是共享同一個(gè)index的Series的集合。行索引類(lèi)似于關(guān)系表中每行的編號(hào),列標(biāo)題類(lèi)似于表格的列名(也稱(chēng)為字段)。(1)創(chuàng)建DataFrame對(duì)象(2)查看DataFrame對(duì)象中的數(shù)據(jù)(3)DataFrame常用函數(shù)DataFrame數(shù)據(jù)結(jié)構(gòu)提供了豐富的函數(shù),這些函數(shù)可以用來(lái)進(jìn)行行、列編輯和統(tǒng)計(jì)計(jì)算等。知識(shí)點(diǎn)二:利用matplotlib模塊繪圖matplotlib是一個(gè)繪圖庫(kù),使用其中的pyplot子庫(kù)所提供的函數(shù)可以快速繪圖和設(shè)置圖表的坐標(biāo)軸、坐標(biāo)軸刻度、圖例等。在Python中引入matplotlib的pyplot子庫(kù)的方法為:importmatplotlib.pyplotasplt1.有Python程序段如下:importpandasaspdpd1=pd.Series([1,2,3,4])print(pd1.index)該程序段運(yùn)行后輸出結(jié)果為()A.

B.

C.

D.0112122323343445隨堂練習(xí)A2.某DataFrame對(duì)象df,其中包含1

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論