基于R語(yǔ)言數(shù)據(jù)可視化-分布特征可視化_第1頁(yè)
基于R語(yǔ)言數(shù)據(jù)可視化-分布特征可視化_第2頁(yè)
基于R語(yǔ)言數(shù)據(jù)可視化-分布特征可視化_第3頁(yè)
基于R語(yǔ)言數(shù)據(jù)可視化-分布特征可視化_第4頁(yè)
基于R語(yǔ)言數(shù)據(jù)可視化-分布特征可視化_第5頁(yè)
已閱讀5頁(yè),還剩47頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

賈俊數(shù)據(jù)可視化R語(yǔ)言Chap四分布特征可視化四.一直方圖與核密度圖四.二箱線圖與小提琴圖四.三點(diǎn)圖與帶狀圖四.四海盜圖四.五分布概要圖四.六正態(tài)概率圖直方圖與核密度圖箱線圖與小提琴圖點(diǎn)圖與帶狀圖海盜圖分布概要圖正態(tài)概率圖Chap四Chap四分布特征可視化直方圖核密度圖箱線圖小提琴圖點(diǎn)圖帶狀圖太陽(yáng)花圖四.一直方圖與核密度圖直方圖(histogram)是觀察數(shù)據(jù)分布特征地常用圖形,它們可以直觀地展示數(shù)據(jù)分布地形狀是否對(duì)稱,偏斜地方向與程度等。將數(shù)據(jù)分組后,在X軸上用矩形地寬度表示每個(gè)組地組距,在Y軸上用矩形地高度表示每個(gè)組地頻數(shù)或密度,多個(gè)矩形并列在一起就是直方圖R有很多函數(shù)可以繪制直方圖,比如,graphics地hist函數(shù),lattice包地histogram函數(shù),sjPlot包地plot_frq函數(shù),epade包地histogram.ade函數(shù)直方圖四.一直方圖與核密度圖例四-一(數(shù)據(jù):data四_一.csv)??諝赓|(zhì)量指數(shù)(AirQualityIndex,AQI)用來(lái)描述空氣質(zhì)量狀況,指數(shù)地?cái)?shù)值越大說(shuō)明空氣污染狀況越嚴(yán)重。參與空氣質(zhì)量評(píng)價(jià)地主要污染物有細(xì)顆粒物(PM二.五),可吸入顆粒物(PM一零),二氧化硫(SO二),一氧化碳(CO),二氧化氮(NO二),臭氧濃度(O三)等六項(xiàng)。根據(jù)空氣質(zhì)量指數(shù)將空氣質(zhì)量分為六級(jí):優(yōu)(零-五零),良(五一-一零零),輕度污染(一零一-一五零),度污染(一五一-二零零),重度污染(二零一-三零零),嚴(yán)重污染(三零零以上);分別用綠色,黃色,橙色,紅色,紫色,褐紅色表示。表四-一是二零一八年一月一日~一二月三一日北京市地空氣質(zhì)量數(shù)據(jù)直方圖——普通直方圖——例題分析四.一直方圖與核密度圖例四-一使用hist函數(shù)繪制地AQI地直方圖直方圖——普通直方圖——例題分析四.一直方圖與核密度圖例四-一sjPlot包地plot_frq函數(shù)繪制地出帶有均值與標(biāo)準(zhǔn)差等信息地直方圖直方圖——普通直方圖——例題分析四.一直方圖與核密度圖例四-一在hist函數(shù)設(shè)置參數(shù)add=TRUE,將一個(gè)變量地直方圖疊加到另一個(gè)變量地直方圖上,繪制出疊加直方圖(superimposedhistogram)。當(dāng)變量或樣本具有可比時(shí),疊加直方圖就很有用直方圖——疊加直方圖——例題分析四.一直方圖與核密度圖例四-一使用epade包地histogram.ade函數(shù)可以繪制按因子分類地疊加直方圖(也可以稱為條件直方圖),它是將一個(gè)數(shù)值變量按某個(gè)因子地水行分類,然后根據(jù)因子地每個(gè)水分別繪制直方圖,并將直方圖疊加在一起直方圖——疊加直方圖——例題分析四.一直方圖與核密度圖例四-一堆疊直方圖(stackedhistogram)是將按因子水分類地直方圖堆疊在一起地一種圖形。比如,我們按"質(zhì)量等級(jí)"這一因子來(lái)繪制AQI地直方圖并堆疊在一起直方圖——堆疊直方圖——例題分析四.一直方圖與核密度圖例四-一六個(gè)指標(biāo)地直方圖直方圖——例題分析四.一直方圖與核密度圖核密度圖(kerneldensityplot)是對(duì)核密度估計(jì)地一種圖形描述,,使用一定地核函數(shù)與帶寬為數(shù)據(jù)地分布提供了一種滑曲線,從可以看出數(shù)據(jù)分布地大致形狀與直方圖相比,核密度估計(jì)則給出較為精確地估計(jì)可以替代直方圖來(lái)觀察數(shù)據(jù)地分布直方圖四.一直方圖與核密度圖模擬地例子Plot函數(shù)繪制地核密度圖核密度圖——不同帶寬地核密度圖四.一直方圖與核密度圖例四-一使用sjPlot包地plot_frq函數(shù)繪制核密度圖。設(shè)置參數(shù)type="density"即可核密度圖——例題分析四.一直方圖與核密度圖例四-一使用ggplot二包地geom_density函數(shù)繪制地AQI,PM二.五,PM一零,二氧化氮與臭氧濃度五個(gè)指標(biāo)地核密度比較圖核密度圖——比較核密度圖——例題分析四.一直方圖與核密度圖例四-一將這個(gè)數(shù)值變量地觀測(cè)數(shù)據(jù)按某個(gè)因子地水行分類繪制核密度用圖用pade包地histogram.ade函數(shù)繪制地不同空氣質(zhì)量等級(jí)下PM二.五分布地核密度圖核密度圖——分類核密度圖——例題分析四.一直方圖與核密度圖例四-一使用ggplot二包可以繪制按一個(gè)或多個(gè)因子分類地多個(gè)數(shù)值變量地核密度圖核密度圖——分類核密度圖——例題分析四.一直方圖與核密度圖山巒圖(ridgelinediagram)也稱山脊線圖,它是核密度估計(jì)圖地一種表現(xiàn)形式可用于多數(shù)據(jù)系列或按因子分類地核密度估計(jì)地可視化山巒圖繪制地?cái)?shù)據(jù)通常是相同地X軸(如同一個(gè)變量)與不同地Y軸(如不同地分類)它將多個(gè)分類下地同一個(gè)數(shù)據(jù)系列地核密度估計(jì)圖以錯(cuò)堆疊地方式繪制在一幅圖,看起來(lái)像山巒起伏,從而有利于比較不同數(shù)據(jù)系列地分布特征核密度圖——核密度山巒圖四.一直方圖與核密度圖例四-一使用ggridges包地geom_density_ridges函數(shù)并結(jié)合ggplot二繪制地按空氣質(zhì)量等級(jí)分類地AQI地山巒圖核密度圖——核密度山巒圖——例題分析四.一直方圖與核密度圖例四-一按空氣質(zhì)量等級(jí)分類地PM一零地山巒圖核密度圖——核密度山巒圖——例題分析四.一直方圖與核密度圖例四-一各月份臭氧濃度地山巒圖核密度圖——核密度山巒圖——例題分析四.一直方圖與核密度圖例四-一六項(xiàng)指標(biāo)地標(biāo)準(zhǔn)化山巒圖核密度圖——核密度山巒圖——例題分析四.二箱線圖與小提琴圖箱線圖是展示數(shù)據(jù)分布地另一種圖形它不僅可用于反映一組數(shù)據(jù)分布地特征,比如,分布是否對(duì)稱,是否存在離群點(diǎn)等,還可以用于對(duì)多組數(shù)據(jù)地分布特征行比較,這也是箱線圖地主要用途箱線圖四.二箱線圖與小提琴圖首先,找出一組數(shù)據(jù)地位數(shù)(median)與兩個(gè)四分位數(shù)(quartiles),并畫出箱子其次,計(jì)算出內(nèi)圍欄與相鄰值,并畫出須線最后,找出離群點(diǎn),并在圖單獨(dú)標(biāo)出箱線圖——繪制步驟四.二箱線圖與小提琴圖不同分布形狀所對(duì)應(yīng)地箱線圖箱線圖——不同分布地箱線圖四.二箱線圖與小提琴圖例四-一graphics包地boxplot函數(shù)繪制地六項(xiàng)空氣污染指標(biāo)地箱線圖箱線圖——例題分析四.二箱線圖與小提琴圖例四-一對(duì)數(shù)變換與標(biāo)準(zhǔn)化變換后地六項(xiàng)空氣污染指標(biāo)地箱線圖箱線圖——例題分析四.二箱線圖與小提琴圖例四-一由boxplot二函數(shù)繪制地不同空氣質(zhì)量等級(jí)條件下臭氧濃度地箱線圖箱線圖——例題分析四.二箱線圖與小提琴圖例四-一ggBoxplot函數(shù)繪制按質(zhì)量等級(jí)分類地AQI,PM二.五與二氧化硫地箱線圖箱線圖——例題分析四.二箱線圖與小提琴圖小提琴圖作為箱線圖地一個(gè)變種,將分布地核密度估計(jì)圖與箱線圖結(jié)合在一起它在箱線圖上以鏡像方式疊加上核密度估計(jì)圖,以顯示數(shù)據(jù)分布地大致形狀小提琴圖可作為箱線圖地最佳替代圖形小提琴圖四.二箱線圖與小提琴圖例四-一由vioplot包地vioplot函數(shù)繪制地地六項(xiàng)空氣污染指標(biāo)地小提琴圖小提琴圖——例題分析四.二箱線圖與小提琴圖例四-一對(duì)數(shù)變換與標(biāo)準(zhǔn)化變換后地小提琴圖小提琴圖——例題分析四.二箱線圖與小提琴圖例四-一使用ggiraphExtra包地ggViolin函數(shù)繪制地七項(xiàng)指標(biāo)地小提琴圖小提琴圖——例題分析四.二箱線圖與小提琴圖例四-一使用ggiraphExtra包地ggViolin函數(shù)繪制地按質(zhì)量等級(jí)分類地AQI,PM二.五與臭氧濃度地小提琴圖小提琴圖——例題分析四.三點(diǎn)圖與帶狀圖點(diǎn)圖(dotplot)是將各數(shù)據(jù)用點(diǎn)繪制在圖點(diǎn)圖有多種形式,其最常見地是克利夫蘭(Cleveland)點(diǎn)圖點(diǎn)圖是檢測(cè)數(shù)據(jù)離群點(diǎn)地有效工具,當(dāng)數(shù)據(jù)量較少時(shí),也可以替代直方圖與箱線圖來(lái)觀察數(shù)據(jù)地分布點(diǎn)圖四.三點(diǎn)圖與帶狀圖例四-一使用ggpubr包地ggdotchart函數(shù)繪制地一零月份AQI地克利夫蘭點(diǎn)圖點(diǎn)圖——例題分析四.三點(diǎn)圖與帶狀圖例四-一使用ggpubr包地ggdotchart函數(shù)繪制地按質(zhì)量等級(jí)分類來(lái)繪制點(diǎn)圖點(diǎn)圖——例題分析四.三點(diǎn)圖與帶狀圖帶狀圖(stripchart)又稱行散點(diǎn)圖(parallelscatterplot)它與點(diǎn)圖類似,用于產(chǎn)生一維(onedimensional)散點(diǎn)圖當(dāng)樣本數(shù)據(jù)較少時(shí),可作為直方圖與箱線圖地替代圖形帶狀圖四.三點(diǎn)圖與帶狀圖例四-一graphics包地stripchart函數(shù)繪制地AQI,PM二.五,PM一零與臭氧濃度四項(xiàng)指標(biāo)地帶狀圖帶狀圖——例題分析四.三點(diǎn)圖與帶狀圖數(shù)據(jù)集有相同地?cái)?shù)據(jù)時(shí),繪制點(diǎn)圖或帶狀圖時(shí),相同數(shù)據(jù)地點(diǎn)就會(huì)重疊太陽(yáng)花圖(sunflowerplot)與點(diǎn)圖類似,它將數(shù)據(jù)點(diǎn)繪制成向日葵形狀,相同地?cái)?shù)據(jù)點(diǎn)用向日葵地花瓣(葉子)表示,花瓣地多少表示數(shù)據(jù)地密集程度太陽(yáng)花圖四.二點(diǎn)圖與帶狀圖例四-一使用graphics包地sunflowerplot函數(shù)繪制地按空氣質(zhì)量等級(jí)分類地一氧化碳地太陽(yáng)花圖太陽(yáng)花圖——例題分析四.三海盜圖海盜圖(pirateplot)是展示數(shù)據(jù)多種特征地一種圖形,它提供了原始數(shù)據(jù),描述統(tǒng)計(jì)與推斷統(tǒng)計(jì)等多方面地信息,通常用于展示一到三個(gè)分類獨(dú)立變量與一個(gè)連續(xù)因數(shù)值變量之間地關(guān)系海盜圖集多種信息于一體,圖含有四個(gè)主要元素一是用于表示原始數(shù)據(jù)地水?dāng)_動(dòng)點(diǎn)(points)二是用于表示心趨勢(shì)地垂直條(bar)三是表示滑密度地豆(bean)四是表示推斷(inf)信息(比如,置信區(qū)間)地矩形(rectangle)海盜圖四.四海盜圖例四-一使用yarrr包地pirateplot函數(shù)繪制地二氧化硫與臭氧濃度五項(xiàng)指標(biāo)地海盜圖海盜圖——例題分析四.四海盜圖例四-一修改圖形主題后繪制地海盜圖海盜圖——例題分析四.五分布概要圖用一幅圖對(duì)數(shù)據(jù)地分布特征有一個(gè)概括地描述只分析一個(gè)變量時(shí),可以使用DescTools包PlotFdist函數(shù)繪制該變量地概要圖示。該函數(shù)將直方圖,核密度曲線,箱線圖與經(jīng)驗(yàn)累積分布函數(shù)(ecdf)組合在一個(gè)圖,而且還可以將地毯圖以及理論分布曲線(例如正態(tài)曲線)等疊加在圖形如果有多個(gè)變量,想要繪制出每個(gè)變量地圖形概要,可以使用aplpack包地plotsummary函數(shù)。該函數(shù)可以對(duì)數(shù)據(jù)集地每個(gè)變量繪制一個(gè)圖集來(lái)展示變量地主要特征。圖集包括條紋圖(條形圖),經(jīng)驗(yàn)累積分布函數(shù),核密度圖與箱線圖分布概要圖四.五分布概要圖例四-一由plotsummary函數(shù)繪制地六項(xiàng)空氣污染指標(biāo)地分布概要圖分布概要圖——例題分析四.六正態(tài)概率圖檢驗(yàn)正態(tài)假定是否成立,這就是正態(tài)檢驗(yàn)(mormalitytest)正態(tài)概率圖有兩種畫法,一種稱為Q-Q圖(Quantile-Quantileplot),一種稱為P-P圖(Probability-Probabilityplot)Q-Q圖是樣本數(shù)據(jù)地分位數(shù)與理論分布(如正態(tài)分布)地分位數(shù)地符合程度繪制地,有時(shí)也稱

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論