第3章-Matplotlib數(shù)據(jù)可視化基礎(chǔ)課件_第1頁
第3章-Matplotlib數(shù)據(jù)可視化基礎(chǔ)課件_第2頁
第3章-Matplotlib數(shù)據(jù)可視化基礎(chǔ)課件_第3頁
第3章-Matplotlib數(shù)據(jù)可視化基礎(chǔ)課件_第4頁
第3章-Matplotlib數(shù)據(jù)可視化基礎(chǔ)課件_第5頁
已閱讀5頁,還剩27頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、Matplotlib數(shù)據(jù)可視化基礎(chǔ)1分析特征間的關(guān)系目錄了解繪圖基礎(chǔ)語法與常用參數(shù)2分析特征內(nèi)部數(shù)據(jù)分布與分散狀況3小結(jié)4掌握pyplot基礎(chǔ)語法基本繪圖流程第一部分主要作用是構(gòu)建出一張空白的畫布,并可以選擇是否將整個(gè)畫布劃分為多個(gè)部分,方便在同一幅圖上繪制多個(gè)圖形的情況。最簡單的繪圖可以省略第一部分,而后直接在默認(rèn)的畫布上進(jìn)行圖形繪制。掌握pyplot基礎(chǔ)語法1.創(chuàng)建畫布與創(chuàng)建子圖函數(shù)名稱函數(shù)作用plt.figure創(chuàng)建一個(gè)空白畫布,可以指定畫布大小,像素。figure.add_subplot創(chuàng)建并選中子圖,可以指定子圖的行數(shù),列數(shù),與選中圖片編號。第二部分是繪圖的主體部分。其中添加標(biāo)題,坐

2、標(biāo)軸名稱,繪制圖形等步驟是并列的,沒有先后順序,可以先繪制圖形,也可以先添加各類標(biāo)簽。但是添加圖例一定要在繪制圖形之后。掌握pyplot基礎(chǔ)語法2.添加畫布內(nèi)容函數(shù)名稱函數(shù)作用plt.title在當(dāng)前圖形中添加標(biāo)題,可以指定標(biāo)題的名稱、位置、顏色、字體大小等參數(shù)。plt.xlabel在當(dāng)前圖形中添加x軸名稱,可以指定位置、顏色、字體大小等參數(shù)。plt.ylabel在當(dāng)前圖形中添加y軸名稱,可以指定位置、顏色、字體大小等參數(shù)。plt.xlim指定當(dāng)前圖形x軸的范圍,只能確定一個(gè)數(shù)值區(qū)間,而無法使用字符串標(biāo)識。plt.ylim指定當(dāng)前圖形y軸的范圍,只能確定一個(gè)數(shù)值區(qū)間,而無法使用字符串標(biāo)識。pl

3、t.xticks指定x軸刻度的數(shù)目與取值。plt.yticks指定y軸刻度的數(shù)目與取值。plt.legend指定當(dāng)前圖形的圖例,可以指定圖例的大小、位置、標(biāo)簽。第三部分主要用于保存和顯示圖形。掌握pyplot基礎(chǔ)語法3.存與展示圖形函數(shù)名稱函數(shù)作用plt.savafig保存繪制的圖片,可以指定圖片的分辨率、邊緣的顏色等參數(shù)。plt.show在本機(jī)顯示圖形。pyplot使用rc配置文件來自定義圖形的各種默認(rèn)屬性,被稱為rc配置或rc參數(shù)。在pyplot中幾乎所有的默認(rèn)屬性都是可以控制的,例如視圖窗口大小以及每英寸點(diǎn)數(shù)、線條寬度、顏色和樣式、坐標(biāo)軸、坐標(biāo)和網(wǎng)格屬性、文本、字體等。設(shè)置pyplot的

4、動(dòng)態(tài)rc參數(shù)設(shè)置pyplot的動(dòng)態(tài)rc參數(shù)線條的常用rc參數(shù)名稱、解釋與取值rc參數(shù)名稱解釋取值lines.linewidth線條寬度取0-10之間的數(shù)值,默認(rèn)為1.5。lines.linestyle線條樣式可取“-”“-”“-.”“:”四種。默認(rèn)為“-”。lines.marker線條上點(diǎn)的形狀可取“o”“D”“h”“.”“,”“S”等20種,默認(rèn)為None。lines.markersize點(diǎn)的大小取0-10之間的數(shù)值,默認(rèn)為1。設(shè)置pyplot的動(dòng)態(tài)rc參數(shù)常用線條類型解釋linestyle取值意義linestyle取值意義-實(shí)線-.點(diǎn)線-長虛線:短虛線marker取值意義marker取值意

5、義o圓圈.點(diǎn)D菱形s正方形h六邊形1*星號H六邊形2d小菱形-水平線v一角朝下的三角形8八邊形一角朝右的三角形,像素一角朝上的三角形+加號豎線None無xX設(shè)置pyplot的動(dòng)態(tài)rc參數(shù)線條標(biāo)記解釋由于默認(rèn)的pyplot字體并不支持中文字符的顯示,因此需要通過設(shè)置font.sans-serif參數(shù)改變繪圖時(shí)的字體,使得圖形可以正常顯示中文。同時(shí),由于更改字體后,會導(dǎo)致坐標(biāo)軸中的部分字符無法顯示,因此需要同時(shí)更改axes.unicode_minus參數(shù)。plt.rcParamsfont.sans-serif = SimHei # 設(shè)置中文顯示plt.rcParamsaxes.unicode_mi

6、nus = False除了設(shè)置線條和字體的rc參數(shù)外,還有設(shè)置文本、箱線圖、坐標(biāo)軸、刻度、圖例、標(biāo)記、圖片、圖像保存等rc參數(shù)。具體參數(shù)與取值可以參考官方文檔。設(shè)置pyplot的動(dòng)態(tài)rc參數(shù)注意事項(xiàng)1分析特征間的關(guān)系目錄了解繪圖基礎(chǔ)語法與常用參數(shù)2分析特征內(nèi)部數(shù)據(jù)分布與分散狀況3小結(jié)4散點(diǎn)圖(scatter diagram)又稱為散點(diǎn)分布圖,是以一個(gè)特征為橫坐標(biāo),另一個(gè)特征為縱坐標(biāo),利用坐標(biāo)點(diǎn)(散點(diǎn))的分布形態(tài)反映特征間的統(tǒng)計(jì)關(guān)系的一種圖形。值是由點(diǎn)在圖表中的位置表示,類別是由圖表中的不同標(biāo)記表示,通常用于比較跨類別的數(shù)據(jù)。繪制散點(diǎn)圖散點(diǎn)圖matplotlib.pyplot.scatter(x

7、, y, s=None, c=None, marker=None, alpha=None, *kwargs)常用參數(shù)及說明如下表所示。繪制散點(diǎn)圖scatter函數(shù)參數(shù)名稱說明x,y接收array。表示x軸和y軸對應(yīng)的數(shù)據(jù)。無默認(rèn)。s接收數(shù)值或者一維的array。指定點(diǎn)的大小,若傳入一維array則表示每個(gè)點(diǎn)的大小。默認(rèn)為None。c接收顏色或者一維的array。指定點(diǎn)的顏色,若傳入一維array則表示每個(gè)點(diǎn)的顏色。默認(rèn)為Nonemarker接收特定string。表示繪制的點(diǎn)的類型。默認(rèn)為None。alpha接收0-1的小數(shù)。表示點(diǎn)的透明度。默認(rèn)為None。折線圖(line chart)是一種將

8、數(shù)據(jù)點(diǎn)按照順序連接起來的圖形。可以看作是將散點(diǎn)圖,按照x軸坐標(biāo)順序連接起來的圖形。折線圖的主要功能是查看因變量y隨著自變量x改變的趨勢,最適合用于顯示隨時(shí)間(根據(jù)常用比例設(shè)置)而變化的連續(xù)數(shù)據(jù)。同時(shí)還可以看出數(shù)量的差異,增長趨勢的變化。繪制折線圖折線圖matplotlib.pyplot.plot(*args, *kwargs) plot函數(shù)在官方文檔的語法中只要求填入不定長參數(shù),實(shí)際可以填入的主要參數(shù)主要如下。繪制折線圖plot函數(shù)參數(shù)名稱說明x,y接收array。表示x軸和y軸對應(yīng)的數(shù)據(jù)。無默認(rèn)。color接收特定string。指定線條的顏色。默認(rèn)為None。linestyle接收特定str

9、ing。指定線條類型。默認(rèn)為“-”。marker接收特定string。表示繪制的點(diǎn)的類型。默認(rèn)為None。alpha接收0-1的小數(shù)。表示點(diǎn)的透明度。默認(rèn)為None。color參數(shù)的8種常用顏色的縮寫。繪制折線圖plot函數(shù)顏色縮寫代表的顏色顏色縮寫代表的顏色b藍(lán)色m品紅g綠色y黃色r紅色k黑色c青色w白色國民生產(chǎn)總值數(shù)據(jù)總共有三大產(chǎn)業(yè)的國民生產(chǎn)總值,以及農(nóng)業(yè)、工業(yè)、建筑、批發(fā)、交通、餐飲、金融、房地產(chǎn)和其他行業(yè)各個(gè)季度的增加值。通過散點(diǎn)圖分析三大行業(yè)的國民生產(chǎn)總值可以發(fā)現(xiàn)我國產(chǎn)業(yè)結(jié)構(gòu)。通過比較各行業(yè)間季度的增加值則可以發(fā)現(xiàn)國民經(jīng)濟(jì)的主要貢獻(xiàn)行業(yè)。任務(wù)實(shí)現(xiàn)1.繪制2000-2017各產(chǎn)業(yè)與行業(yè)

10、的國民生產(chǎn)總值散點(diǎn)圖通過繪制2000-2017各產(chǎn)業(yè)與行業(yè)的國民生產(chǎn)總值折線圖,分別能夠發(fā)現(xiàn)我國經(jīng)濟(jì)各產(chǎn)業(yè)與各行業(yè)增長趨勢。任務(wù)實(shí)現(xiàn)2.繪制2000-2017各產(chǎn)業(yè)與行業(yè)的國民生產(chǎn)總值折線圖1分析特征間的關(guān)系目錄了解繪圖基礎(chǔ)語法與常用參數(shù)2分析特征內(nèi)部數(shù)據(jù)分布與分散狀況3小結(jié)4直方圖(Histogram)又稱質(zhì)量分布圖,是統(tǒng)計(jì)報(bào)告圖的一種,由一系列高度不等的縱向條紋或線段表示數(shù)據(jù)分布的情況,一般用橫軸表示數(shù)據(jù)所屬類別,縱軸表示數(shù)量或者占比。用直方圖可以比較直觀地看出產(chǎn)品質(zhì)量特性的分布狀態(tài),便于判斷其總體質(zhì)量分布情況。直方圖可以發(fā)現(xiàn)分布表無法發(fā)現(xiàn)的數(shù)據(jù)模式、樣本的頻率分布和總體的分布。繪制直方圖

11、直方圖matplotlib.pyplot.bar(left,height,width = 0.8,bottom = None,hold = None,data = None,* kwargs )常用參數(shù)及說明如下表所示。繪制直方圖bar函數(shù)參數(shù)名稱說明left接收array。表示x軸數(shù)據(jù)。無默認(rèn)。height接收array。表示x軸所代表數(shù)據(jù)的數(shù)量。無默認(rèn)。width接收0-1之間的float。指定直方圖寬度。默認(rèn)為0.8。color接收特定string或者包含顏色字符串的array。表示直方圖顏色。默認(rèn)為None。餅圖(Pie Graph)是將各項(xiàng)的大小與各項(xiàng)總和的比例顯示在一張“餅”中,以

12、“餅”的大小來確定每一項(xiàng)的占比。餅圖可以比較清楚地反映出部分與部分、部分與整體之間的比例關(guān)系,易于顯示每組數(shù)據(jù)相對于總數(shù)的大小,而且顯現(xiàn)方式直觀。繪制餅圖餅圖matplotlib.pyplot.pie(x, explode=None, labels=None, colors=None, autopct=None, pctdistance=0.6, shadow=False, labeldistance=1.1, startangle=None, radius=None, )常用參數(shù)及說明如下表所示。繪制餅圖pie函數(shù)參數(shù)名稱說明參數(shù)名稱說明x接收array。表示用于繪制撇的數(shù)據(jù)。無默認(rèn)。aut

13、opct接收特定string。指定數(shù)值的顯示方式。默認(rèn)為None。explode接收array。表示指定項(xiàng)離餅圖圓心為n個(gè)半徑。默認(rèn)為None。pctdistance接收float。指定每一項(xiàng)的比例和距離餅圖圓心n個(gè)半徑。默認(rèn)為0.6。labels接收array。指定每一項(xiàng)的名稱。默認(rèn)為None。labeldistance接收float。指定每一項(xiàng)的名稱和距離餅圖圓心多少個(gè)半徑。默認(rèn)為1.1。color接收特定string或者包含顏色字符串的array。表示餅圖顏色。默認(rèn)為None。radius接收float。表示餅圖的半徑。默認(rèn)為1。箱線圖(boxplot)也稱箱須圖,其繪制需使用常用的統(tǒng)計(jì)

14、量,能提供有關(guān)數(shù)據(jù)位置和分散情況的關(guān)鍵信息,尤其在比較不同特征時(shí),更可表現(xiàn)其分散程度差異。箱線圖利用數(shù)據(jù)中的五個(gè)統(tǒng)計(jì)量(最小值、下四分位數(shù)、中位數(shù)、上四分位數(shù)和最大值)來描述數(shù)據(jù),它也可以粗略地看出數(shù)據(jù)是否具有對稱性、分布的分散程度等信息,特別可以用于對幾個(gè)樣本的比較。繪制箱線圖箱線圖matplotlib.pyplot.boxplot(x, notch=None, sym=None, vert=None, whis=None, positions=None, widths=None, patch_artist=None,meanline=None, labels=None, )常用參數(shù)及說明如

15、下表所示。繪制箱線圖boxplot函數(shù)參數(shù)名稱說明參數(shù)名稱說明x接收array。表示用于繪制箱線圖的數(shù)據(jù)。無默認(rèn)。positions接收array。表示圖形位置。默認(rèn)為None。notch接收boolean。表示中間箱體是否有缺口。默認(rèn)為None。widths接收scalar或者array。表示每個(gè)箱體的寬度。默認(rèn)為None。sym接收特定sting。指定異常點(diǎn)形狀。默認(rèn)為None。labels接收array。指定每一個(gè)箱線圖的標(biāo)簽。默認(rèn)為None。vert接收boolean。表示圖形是橫向縱向或者橫向。默認(rèn)為None。meanline接收boolean。表示是否顯示均值線。默認(rèn)為False。通過直方圖分析2000年第一季度和2017年第一季度之間的三大產(chǎn)業(yè)的國民生產(chǎn)總值,可以發(fā)現(xiàn)各產(chǎn)業(yè)絕對數(shù)值之間的關(guān)系,并通過對比發(fā)現(xiàn)產(chǎn)業(yè)結(jié)構(gòu)的變化。同理可以得出行業(yè)間的絕對數(shù)值關(guān)系以及17年來行業(yè)發(fā)展?fàn)顩r。任務(wù)實(shí)現(xiàn)1.繪制國民生產(chǎn)總值構(gòu)成分布直方圖通過分析2000年與2017年不同的產(chǎn)業(yè)和行業(yè)在國民生產(chǎn)總值中的占比,可以發(fā)現(xiàn)我國產(chǎn)業(yè)結(jié)構(gòu)變化和行業(yè)變遷。任務(wù)實(shí)現(xiàn)2.繪制國民生產(chǎn)總值構(gòu)成分布餅圖通過分析2000年至2017年不同的產(chǎn)業(yè)和行業(yè)在國民生產(chǎn)總值中的分散情況,可以發(fā)現(xiàn)整體分散情況,從而判斷整體增速是否加快。任務(wù)實(shí)現(xiàn)3.繪制國民生產(chǎn)總值分散情況箱線圖1分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論