




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
賈俊數(shù)據(jù)可視化R語(yǔ)言Chap四分布特征可視化四.一直方圖與核密度圖四.二箱線圖與小提琴圖四.三點(diǎn)圖與帶狀圖四.四海盜圖四.五分布概要圖四.六正態(tài)概率圖直方圖與核密度圖箱線圖與小提琴圖點(diǎn)圖與帶狀圖海盜圖分布概要圖正態(tài)概率圖Chap四Chap四分布特征可視化直方圖核密度圖箱線圖小提琴圖點(diǎn)圖帶狀圖太陽(yáng)花圖四.一直方圖與核密度圖直方圖(histogram)是觀察數(shù)據(jù)分布特征地常用圖形,它們可以直觀地展示數(shù)據(jù)分布地形狀是否對(duì)稱,偏斜地方向與程度等。將數(shù)據(jù)分組后,在X軸上用矩形地寬度表示每個(gè)組地組距,在Y軸上用矩形地高度表示每個(gè)組地頻數(shù)或密度,多個(gè)矩形并列在一起就是直方圖R有很多函數(shù)可以繪制直方圖,比如,graphics地hist函數(shù),lattice包地histogram函數(shù),sjPlot包地plot_frq函數(shù),epade包地histogram.ade函數(shù)直方圖四.一直方圖與核密度圖例四-一(數(shù)據(jù):data四_一.csv)??諝赓|(zhì)量指數(shù)(AirQualityIndex,AQI)用來(lái)描述空氣質(zhì)量狀況,指數(shù)地?cái)?shù)值越大說(shuō)明空氣污染狀況越嚴(yán)重。參與空氣質(zhì)量評(píng)價(jià)地主要污染物有細(xì)顆粒物(PM二.五),可吸入顆粒物(PM一零),二氧化硫(SO二),一氧化碳(CO),二氧化氮(NO二),臭氧濃度(O三)等六項(xiàng)。根據(jù)空氣質(zhì)量指數(shù)將空氣質(zhì)量分為六級(jí):優(yōu)(零-五零),良(五一-一零零),輕度污染(一零一-一五零),度污染(一五一-二零零),重度污染(二零一-三零零),嚴(yán)重污染(三零零以上);分別用綠色,黃色,橙色,紅色,紫色,褐紅色表示。表四-一是二零一八年一月一日~一二月三一日北京市地空氣質(zhì)量數(shù)據(jù)直方圖——普通直方圖——例題分析四.一直方圖與核密度圖例四-一使用hist函數(shù)繪制地AQI地直方圖直方圖——普通直方圖——例題分析四.一直方圖與核密度圖例四-一sjPlot包地plot_frq函數(shù)繪制地出帶有均值與標(biāo)準(zhǔn)差等信息地直方圖直方圖——普通直方圖——例題分析四.一直方圖與核密度圖例四-一在hist函數(shù)設(shè)置參數(shù)add=TRUE,將一個(gè)變量地直方圖疊加到另一個(gè)變量地直方圖上,繪制出疊加直方圖(superimposedhistogram)。當(dāng)變量或樣本具有可比時(shí),疊加直方圖就很有用直方圖——疊加直方圖——例題分析四.一直方圖與核密度圖例四-一使用epade包地histogram.ade函數(shù)可以繪制按因子分類地疊加直方圖(也可以稱為條件直方圖),它是將一個(gè)數(shù)值變量按某個(gè)因子地水行分類,然后根據(jù)因子地每個(gè)水分別繪制直方圖,并將直方圖疊加在一起直方圖——疊加直方圖——例題分析四.一直方圖與核密度圖例四-一堆疊直方圖(stackedhistogram)是將按因子水分類地直方圖堆疊在一起地一種圖形。比如,我們按"質(zhì)量等級(jí)"這一因子來(lái)繪制AQI地直方圖并堆疊在一起直方圖——堆疊直方圖——例題分析四.一直方圖與核密度圖例四-一六個(gè)指標(biāo)地直方圖直方圖——例題分析四.一直方圖與核密度圖核密度圖(kerneldensityplot)是對(duì)核密度估計(jì)地一種圖形描述,,使用一定地核函數(shù)與帶寬為數(shù)據(jù)地分布提供了一種滑曲線,從可以看出數(shù)據(jù)分布地大致形狀與直方圖相比,核密度估計(jì)則給出較為精確地估計(jì)可以替代直方圖來(lái)觀察數(shù)據(jù)地分布直方圖四.一直方圖與核密度圖模擬地例子Plot函數(shù)繪制地核密度圖核密度圖——不同帶寬地核密度圖四.一直方圖與核密度圖例四-一使用sjPlot包地plot_frq函數(shù)繪制核密度圖。設(shè)置參數(shù)type="density"即可核密度圖——例題分析四.一直方圖與核密度圖例四-一使用ggplot二包地geom_density函數(shù)繪制地AQI,PM二.五,PM一零,二氧化氮與臭氧濃度五個(gè)指標(biāo)地核密度比較圖核密度圖——比較核密度圖——例題分析四.一直方圖與核密度圖例四-一將這個(gè)數(shù)值變量地觀測(cè)數(shù)據(jù)按某個(gè)因子地水行分類繪制核密度用圖用pade包地histogram.ade函數(shù)繪制地不同空氣質(zhì)量等級(jí)下PM二.五分布地核密度圖核密度圖——分類核密度圖——例題分析四.一直方圖與核密度圖例四-一使用ggplot二包可以繪制按一個(gè)或多個(gè)因子分類地多個(gè)數(shù)值變量地核密度圖核密度圖——分類核密度圖——例題分析四.一直方圖與核密度圖山巒圖(ridgelinediagram)也稱山脊線圖,它是核密度估計(jì)圖地一種表現(xiàn)形式可用于多數(shù)據(jù)系列或按因子分類地核密度估計(jì)地可視化山巒圖繪制地?cái)?shù)據(jù)通常是相同地X軸(如同一個(gè)變量)與不同地Y軸(如不同地分類)它將多個(gè)分類下地同一個(gè)數(shù)據(jù)系列地核密度估計(jì)圖以錯(cuò)堆疊地方式繪制在一幅圖,看起來(lái)像山巒起伏,從而有利于比較不同數(shù)據(jù)系列地分布特征核密度圖——核密度山巒圖四.一直方圖與核密度圖例四-一使用ggridges包地geom_density_ridges函數(shù)并結(jié)合ggplot二繪制地按空氣質(zhì)量等級(jí)分類地AQI地山巒圖核密度圖——核密度山巒圖——例題分析四.一直方圖與核密度圖例四-一按空氣質(zhì)量等級(jí)分類地PM一零地山巒圖核密度圖——核密度山巒圖——例題分析四.一直方圖與核密度圖例四-一各月份臭氧濃度地山巒圖核密度圖——核密度山巒圖——例題分析四.一直方圖與核密度圖例四-一六項(xiàng)指標(biāo)地標(biāo)準(zhǔn)化山巒圖核密度圖——核密度山巒圖——例題分析四.二箱線圖與小提琴圖箱線圖是展示數(shù)據(jù)分布地另一種圖形它不僅可用于反映一組數(shù)據(jù)分布地特征,比如,分布是否對(duì)稱,是否存在離群點(diǎn)等,還可以用于對(duì)多組數(shù)據(jù)地分布特征行比較,這也是箱線圖地主要用途箱線圖四.二箱線圖與小提琴圖首先,找出一組數(shù)據(jù)地位數(shù)(median)與兩個(gè)四分位數(shù)(quartiles),并畫出箱子其次,計(jì)算出內(nèi)圍欄與相鄰值,并畫出須線最后,找出離群點(diǎn),并在圖單獨(dú)標(biāo)出箱線圖——繪制步驟四.二箱線圖與小提琴圖不同分布形狀所對(duì)應(yīng)地箱線圖箱線圖——不同分布地箱線圖四.二箱線圖與小提琴圖例四-一graphics包地boxplot函數(shù)繪制地六項(xiàng)空氣污染指標(biāo)地箱線圖箱線圖——例題分析四.二箱線圖與小提琴圖例四-一對(duì)數(shù)變換與標(biāo)準(zhǔn)化變換后地六項(xiàng)空氣污染指標(biāo)地箱線圖箱線圖——例題分析四.二箱線圖與小提琴圖例四-一由boxplot二函數(shù)繪制地不同空氣質(zhì)量等級(jí)條件下臭氧濃度地箱線圖箱線圖——例題分析四.二箱線圖與小提琴圖例四-一ggBoxplot函數(shù)繪制按質(zhì)量等級(jí)分類地AQI,PM二.五與二氧化硫地箱線圖箱線圖——例題分析四.二箱線圖與小提琴圖小提琴圖作為箱線圖地一個(gè)變種,將分布地核密度估計(jì)圖與箱線圖結(jié)合在一起它在箱線圖上以鏡像方式疊加上核密度估計(jì)圖,以顯示數(shù)據(jù)分布地大致形狀小提琴圖可作為箱線圖地最佳替代圖形小提琴圖四.二箱線圖與小提琴圖例四-一由vioplot包地vioplot函數(shù)繪制地地六項(xiàng)空氣污染指標(biāo)地小提琴圖小提琴圖——例題分析四.二箱線圖與小提琴圖例四-一對(duì)數(shù)變換與標(biāo)準(zhǔn)化變換后地小提琴圖小提琴圖——例題分析四.二箱線圖與小提琴圖例四-一使用ggiraphExtra包地ggViolin函數(shù)繪制地七項(xiàng)指標(biāo)地小提琴圖小提琴圖——例題分析四.二箱線圖與小提琴圖例四-一使用ggiraphExtra包地ggViolin函數(shù)繪制地按質(zhì)量等級(jí)分類地AQI,PM二.五與臭氧濃度地小提琴圖小提琴圖——例題分析四.三點(diǎn)圖與帶狀圖點(diǎn)圖(dotplot)是將各數(shù)據(jù)用點(diǎn)繪制在圖點(diǎn)圖有多種形式,其最常見地是克利夫蘭(Cleveland)點(diǎn)圖點(diǎn)圖是檢測(cè)數(shù)據(jù)離群點(diǎn)地有效工具,當(dāng)數(shù)據(jù)量較少時(shí),也可以替代直方圖與箱線圖來(lái)觀察數(shù)據(jù)地分布點(diǎn)圖四.三點(diǎn)圖與帶狀圖例四-一使用ggpubr包地ggdotchart函數(shù)繪制地一零月份AQI地克利夫蘭點(diǎn)圖點(diǎn)圖——例題分析四.三點(diǎn)圖與帶狀圖例四-一使用ggpubr包地ggdotchart函數(shù)繪制地按質(zhì)量等級(jí)分類來(lái)繪制點(diǎn)圖點(diǎn)圖——例題分析四.三點(diǎn)圖與帶狀圖帶狀圖(stripchart)又稱行散點(diǎn)圖(parallelscatterplot)它與點(diǎn)圖類似,用于產(chǎn)生一維(onedimensional)散點(diǎn)圖當(dāng)樣本數(shù)據(jù)較少時(shí),可作為直方圖與箱線圖地替代圖形帶狀圖四.三點(diǎn)圖與帶狀圖例四-一graphics包地stripchart函數(shù)繪制地AQI,PM二.五,PM一零與臭氧濃度四項(xiàng)指標(biāo)地帶狀圖帶狀圖——例題分析四.三點(diǎn)圖與帶狀圖數(shù)據(jù)集有相同地?cái)?shù)據(jù)時(shí),繪制點(diǎn)圖或帶狀圖時(shí),相同數(shù)據(jù)地點(diǎn)就會(huì)重疊太陽(yáng)花圖(sunflowerplot)與點(diǎn)圖類似,它將數(shù)據(jù)點(diǎn)繪制成向日葵形狀,相同地?cái)?shù)據(jù)點(diǎn)用向日葵地花瓣(葉子)表示,花瓣地多少表示數(shù)據(jù)地密集程度太陽(yáng)花圖四.二點(diǎn)圖與帶狀圖例四-一使用graphics包地sunflowerplot函數(shù)繪制地按空氣質(zhì)量等級(jí)分類地一氧化碳地太陽(yáng)花圖太陽(yáng)花圖——例題分析四.三海盜圖海盜圖(pirateplot)是展示數(shù)據(jù)多種特征地一種圖形,它提供了原始數(shù)據(jù),描述統(tǒng)計(jì)與推斷統(tǒng)計(jì)等多方面地信息,通常用于展示一到三個(gè)分類獨(dú)立變量與一個(gè)連續(xù)因數(shù)值變量之間地關(guān)系海盜圖集多種信息于一體,圖含有四個(gè)主要元素一是用于表示原始數(shù)據(jù)地水?dāng)_動(dòng)點(diǎn)(points)二是用于表示心趨勢(shì)地垂直條(bar)三是表示滑密度地豆(bean)四是表示推斷(inf)信息(比如,置信區(qū)間)地矩形(rectangle)海盜圖四.四海盜圖例四-一使用yarrr包地pirateplot函數(shù)繪制地二氧化硫與臭氧濃度五項(xiàng)指標(biāo)地海盜圖海盜圖——例題分析四.四海盜圖例四-一修改圖形主題后繪制地海盜圖海盜圖——例題分析四.五分布概要圖用一幅圖對(duì)數(shù)據(jù)地分布特征有一個(gè)概括地描述只分析一個(gè)變量時(shí),可以使用DescTools包PlotFdist函數(shù)繪制該變量地概要圖示。該函數(shù)將直方圖,核密度曲線,箱線圖與經(jīng)驗(yàn)累積分布函數(shù)(ecdf)組合在一個(gè)圖,而且還可以將地毯圖以及理論分布曲線(例如正態(tài)曲線)等疊加在圖形如果有多個(gè)變量,想要繪制出每個(gè)變量地圖形概要,可以使用aplpack包地plotsummary函數(shù)。該函數(shù)可以對(duì)數(shù)據(jù)集地每個(gè)變量繪制一個(gè)圖集來(lái)展示變量地主要特征。圖集包括條紋圖(條形圖),經(jīng)驗(yàn)累積分布函數(shù),核密度圖與箱線圖分布概要圖四.五分布概要圖例四-一由plotsummary函數(shù)繪制地六項(xiàng)空氣污染指標(biāo)地分布概要圖分布概要圖——例題分析四.六正態(tài)概率圖檢驗(yàn)正態(tài)假定是否成立,這就是正態(tài)檢驗(yàn)(mormalitytest)正態(tài)概率圖有兩種畫法,一種稱為Q-Q圖(Quantile-Quantileplot),一種稱為P-P圖(Probability-Probabilityplot)Q-Q圖是樣本數(shù)據(jù)地分位數(shù)與理論分布(如正態(tài)分布)地分位數(shù)地符合程度繪制地,有時(shí)也稱
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- T-ZNZ 264.1-2024 重金屬中度污染農(nóng)田土壤修復(fù)和安全利用技術(shù)規(guī)范 第1部分:超積累東南景天與油葵輪作
- 二零二五年度車輛轉(zhuǎn)讓與二手車交易及金融服務(wù)協(xié)議
- 2025年度蛋糕店與體育賽事合作贊助協(xié)議
- 2025年度道路橋梁維修施工安全協(xié)議書
- 2025年度網(wǎng)絡(luò)安全產(chǎn)品銷售提成與技術(shù)服務(wù)合同
- 二零二五年度企業(yè)員工宿舍三方租賃協(xié)議
- 二零二五年度臨時(shí)廚房工作人員聘用合同
- 二零二五年度個(gè)體商戶勞動(dòng)合同(體育賽事組織與運(yùn)營(yíng))
- 中學(xué)生環(huán)保行動(dòng)策劃案解讀
- 監(jiān)控項(xiàng)目合作合同監(jiān)控施工合同
- 中國(guó)骨關(guān)節(jié)炎診療指南(2024版)解讀
- 【歷史】2025年春季七下歷史新教材課本答案大全(想一想、材料研讀、讀地圖、課后活動(dòng))
- 高端寫字樓物業(yè)管理思路
- 江蘇省中小學(xué)生金鑰匙科技競(jìng)賽(高中組)考試題及答案
- 2024-2030年中國(guó)ORC低溫余熱發(fā)電系統(tǒng)行業(yè)商業(yè)模式創(chuàng)新規(guī)劃分析報(bào)告
- 【MOOC】三維設(shè)計(jì)與表達(dá)-北京林業(yè)大學(xué) 中國(guó)大學(xué)慕課MOOC答案
- 婦幼健康信息平臺(tái)共享數(shù)據(jù)集應(yīng)用規(guī)范第1部分孕產(chǎn)婦保健
- 輸液港的輸液與維護(hù)
- 非洲豬瘟病毒基因IⅡ型重組毒株、基因I型弱毒株和基因Ⅱ型毒株鑒別三重?zé)晒釶CR檢測(cè)方法
- 2024解析:第十四章內(nèi)能的利用-講核心(解析版)
- 各類應(yīng)急風(fēng)險(xiǎn)預(yù)案的防范
評(píng)論
0/150
提交評(píng)論