




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第三/四章:描述性統(tǒng)計和直觀圖形,1、概率密度及隨機數 2、統(tǒng)計量 3、R的作圖環(huán)境:圖形分解、繪圖命令 4、統(tǒng)計圖形:散點圖、直方圖、ecdf、QQ 箱線圖、多維圖 5、特殊圖形,3.1 概率密度及隨機數,隨機變量及其分布是概率統(tǒng)計研究中的重要基礎,離散型:隨機抽樣【放回和不放回】sample, 二項分布binom,泊松分布pois, 幾何分布geom, 超幾何分布hyper, 連續(xù)型:均勻分布unif, 指數分布exp, beta分布 正態(tài)分布norm, 卡方分布chisq, t分布t, F分布f, 對數正態(tài)分布lnorm, 伽瑪分布gamma,柯西分布cauchy,注:加上p,d,r,q
2、計算概率,密度,隨機數,下分位點,3.1 概率密度及隨機數,例1:繪制標準正態(tài)分布密度圖,區(qū)間3,3,x=seq(-3,3,length=200) plot(x,dnorm(x,0,1),type=l) 或者 plot(x,dnorm(x),type=l),3.1 概率密度及隨機數,例2:Xt(10), 求 P(|X|1.5),pt(1.5, 10)-pt(-1.5,10) 返回:0.8354927,例3:Xt(10), 求y滿足P(Xy)=0.9177463,qt(0.9177463, 10) 返回:1.5,例4:XN(60,42), 模擬產生10個隨機數,rx=rnorm(10, 60,
3、4) 某次返回值: 56.61105 56.04935 66.63273 57.15021 53.14499 56.67600 60.84096 64.60479,62.34092 66.46923,3.1 概率密度及隨機數,例5:驗證關系Tt(n), F=T2F(1,n),從概率上驗證: P(F0 P(Tx)=1-pf(x2,1,n)/2, x0 x=1.5; n=10 pf(x,1,n)-pt(sqrt(x),n)+pt(-sqrt(x),n) pt(-x,n)-(1-pf(x2,1,n)/2,3.1 概率密度及隨機數,例6:Fa(m,n)=1/F1-a(n,m),例7:n-, t(n)-
4、N(0,1),例8:正態(tài)抽樣的樣本,,確定n的起點,3.2 統(tǒng)計量,統(tǒng)計量是數理統(tǒng)計及應用統(tǒng)計中的一項基礎工作 也是富有創(chuàng)意的一項工作,是區(qū)間估計/假設檢驗/回歸/方差分析等諸項工作的基礎。,對于統(tǒng)計量的理解:,1. 是樣本的函數 G(X1,X2,Xn) 2. 是隨機變量 r.v. 3. 具有值的特性 G(x1,x2,xn),3.2 統(tǒng)計量-基本統(tǒng)計量,1. 樣本均值,樣本方差,樣本中位數,極差,分位數,眾數,中程數等。,R中的實現(xiàn) mean(x); mean(x, trim=0); apply(mat,1,mean) median(x); (min(x)+max(x)/2 quantile(
5、x,type=2) var(x); sd(x) range(x); max(x)-min(x) sd(x)/mean(x) #注意mean(x)0,3.2 統(tǒng)計量-基本統(tǒng)計量,2. 討論均值與中位數的應用差異,模擬:來自標準正態(tài)總體的樣本,加入擾動(異常值)看看,樣本均值和中位數的變化。,3.2 統(tǒng)計量-基本統(tǒng)計量,3 討論樣本方差和有偏方差的區(qū)別,模擬:來自標準正態(tài)總體的樣本,樣本方差和有偏方差的取值變化。,3.2 統(tǒng)計量-基本統(tǒng)計量,4 偏度系數和峰度系數,利用包TSA和leaps兩個包中的兩個函數計算 skewness(), kurtosis() 問題: 如何通過模擬數據理解和直觀展示偏
6、度和峰度,3.3 圖形分解,主標題,子標題,X軸標簽,y軸標簽,圖 例,四周邊距,刻度,par(mai=c(0.6,0.6,0.6,0.1) #指定四周空白 plot(1:10,1:10,type=n,main=主標題,sub=副標題, xlab=,ylab=,xlim=c(0,15),ylim=c(0,10), frame.plot=TRUE,axes=FALSE,mgp=c(0.3,0.3,0), cex.main=1,cex.sub=0.8) #不畫坐標軸, 標題的字體大小各不同,標題離坐標軸距離 lines(c(1,11),c(8,8),lty=2); lines(c(1,11),c(
7、6,6),lty=3); lines(c(1,11),c(4,4),lty=1) #畫三種線 legend(12.5,10,c(L1, L2, L3),lty = c(2, 3, 1),cex=0.75) #圖例 axis(1, 0:15, labels=0:15,cex=0.75) #x坐標軸 axis(2, 0:10, labels=0:10,cex=0.75) # y坐標軸 title(xlab=x軸標簽,adj=1,mgp=c(0.3,0.3,0),cex=0.75) title(ylab=y軸標簽,adj=1,mgp=c(0.3,0.3,0),cex=0.75) # x軸標簽右對齊,
8、 y軸標簽右對齊,3.3 圖形分解代碼,通常一個統(tǒng)計圖形的右側邊空是沒有多大意義的,左側邊空也沒有必要留太多,同理上下邊空的空白也不能太大。 而R默認繪制的圖形的邊空都比較大,這在截圖編輯的時候總是造成麻煩。所以可以在繪圖開始的時候進行統(tǒng)一邊空控制。 par(mai=c(bottom,left,top,right) 單位:英寸, 一英寸=2.539999918 厘米,3.3 圖形分解邊空統(tǒng)一控制,如果希望將所繪制的圖形覆蓋在一個有效的刻度范圍內,則必須 使用上例中參數:xlim=c() 和 ylim=c() 例如:來自標準正態(tài)分布的100個隨機數,畫出其頻數直方圖 x=rnorm(100);
9、hist(x),3.3 圖形分解有效區(qū)域控制,改寫代碼: hist(x,xlim=c(-4,3),ylim=c(0,35),繪制不同數據圖形的直觀說明可通過 legend圖例實現(xiàn) 比如上例中,繪制三種不同線型是用圖例區(qū)別: legend(12.5,10,c(Line1, Line2, Lline3), lty = c(2, 3, 1) 注意:12.5,10表示的相對于xlim和ylim的坐標位置, 坐標起點(原點)是左下角(left,bottom),3.3 圖形分解圖例的作用,如果希望對x,y軸標簽的輸出位置進行控制,可以使用幾個參數: mgp(x,y,0) : 距離x刻度的英寸, 距離y刻度
10、的英寸 adj=0,0.5,1 : 0 左對齊 0.5居中 1右對齊,3.3 圖形分解坐標軸控制,如果希望對坐標軸刻度及刻度值進行控制,可以使用axis axis(which, ticks, labels,las) which=1,2,3,4 分別表示bottom,left,top,right坐標 ticks表示刻度位置,向量 labels表示刻度值文本,向量 las=0,1,2,3 分別表示labels的讀方向: 平行坐標軸,水行垂直 坐標軸,垂直,main表示頂端的主標題 sub 表示底端的副標題(子標題) xlab 表示x軸標簽 ylab 表示y軸標簽,3.3 圖形分解標題控制,另外:c
11、ex=0.75 表示字體大小的縮放比例 分類控制cex.main, cex.sub, cex.xlab, cex.ylab lty表示線的類型,lwd表示線的寬度 pch表示線以字符方式繪圖,abline(v=x,lty,col); abline(h=y,lty,col) 在當前圖中添加x=x, y=y的直線 abline(a,b,lty,col) 在當前圖中添加 y=a+bx points(x,y,pch,col) 在當前途中加入點 其中:lty控制線的類型,col控制顏色 pch控制點的形狀,3.3 圖形分解直線或點繪制,plot(x,y) 繪制y關于x的散點圖 plot(x) 繪制x關于
12、1:length(x)的散點圖 例如: plot(rnorm(100) abline(h=c(-2,-1,0,1,2) 練習:繪制-3,3之間的標準正態(tài)分布,t(10)分布的密度圖,要求分別用實線紅色和虛線藍色,并給出圖例說明。,3.4 統(tǒng)計圖-散點圖,hist(x, freq=TRUE) 頻數直方圖 hist(x, freq=FALSE) 密度直方圖 問題:如何根據給定的分組來畫直方圖?,3.4 統(tǒng)計圖-直方圖,使用參數:breaks 1 指定區(qū)間個數,R會自動調整 breaks=6 不好用 2 指定區(qū)間的端點,區(qū)間數等于端點個數減1 例如:x=rnorm(100) hist(x) hist
13、(x, breaks=6) hist(x,breaks=c(-4,-2,-1,0,1,2,4),3.4 統(tǒng)計圖-直方圖求解眾數,問題:請根據圖形自行推導公式,3.4 統(tǒng)計圖經驗分布圖,格列文科定理給出,隨機抽樣的經驗分布函數與分布函數之間的關系表達成:,R中繪制經驗分布函數圖的函數是 ecdf和plot re=ecdf(x) plot(re,veticals=TRUE,do.p=FALSE) 另外可以計算給定x0的經驗分布函數值 re(x0) 練習:生成標準正態(tài)隨機數100個,計算x=2處的ecdf.,3.4 統(tǒng)計圖正態(tài)QQ圖,利用如下的關系式:,顯然:k/n=1時,上式無法給出,故進行修正,
14、R中給出:qqnorm(x); qqline(x)實現(xiàn) 練習:請自行畫出這個QQ圖,3.4 統(tǒng)計圖箱線圖,通過一個箱體來展現(xiàn)數據的對稱性和離散性分布特征,可用于鑒別異常值數據,還可用于多組數據的差異性比較,非常直觀有效。,3.4 統(tǒng)計圖箱線圖,在R中,通過函數 boxplot(x, range=1.5,horizontal=FALSE) 實現(xiàn)箱線圖的繪制。 其中:x可以是一個數值向量,將繪制一組 也可以是一個數據框,將繪制多組,例子:數據框A含有4個小組的同一門成績變量 g1score,g2score,g3score,g4score 請按照均值為(65,70,75,80),標準差=4隨機產生
15、四組數據各30個,然后繪制箱線圖,比較差異.,3.4 統(tǒng)計圖輪廓圖多維,所謂輪廓圖就是將數據矩陣中的每一行畫成圖上的一條折線。需將每列數據按比例換算到同一個坐標系中。 注意:這使得輪廓圖的繪制對各列數據的數值大小有一定的要求,比較適合分析各列數據量綱接近,數值相差在一定的范圍內,即不太大也不太小的情況。,3.4 統(tǒng)計圖輪廓圖多維,n=nrow(df); m=ncol(df) plot(c(1,m),c(min(df),max(df),type=n, main=輪廓圖,xlab=序,ylab=值,sub=) for(i in 1:n) lines(as.numeric(dfi,) points(
16、c(1,m),c(dfi,1,dfi,m),type=p, pch=15+(i-1)%/%5) #針對成績數據,網絡教學平臺實驗材料中,3.4 統(tǒng)計圖調和曲線多維,第r條調和曲線定義為,3.4 統(tǒng)計圖雷達圖多維,雷達圖因其繪制的圖象猶如雷達屏幕上看到的圖象而得名,該圖象又有些像蜘蛛網,故又稱為蜘蛛圖或者星圖。 R軟件提供stars()函數用來繪制雷達圖: stars(df, locations = c(0,0), radius = FALSE, key.loc=c(0,0), main=成績數據, lty = 2) stars(df,full=FALSE,draw.segments=TRUE,
17、 key.loc=c(5,0.5),mar=c(2,0,0,0) 數據:網絡教學平臺的 實驗材料中,3.4 統(tǒng)計圖切爾諾夫臉 多維,通過15個變量來定義臉型、微笑、嘴巴、眼睛、鼻子、耳朵和頭發(fā)等的長度和寬度將多維數據的特征通過直觀的人臉及表情表現(xiàn)出來 在R中,專門給出這樣的軟件包和函數來進行臉譜的繪制。 先安裝軟件包aplpack, 然后加載該軟件包,通過函數faces()將數據矩陣帶入,編繪制出臉譜來。,3.4 統(tǒng)計圖切爾諾夫臉 多維,install.packages(aplpack); library(aplpack) faces(matrix(sample(1:1000,240),16,
18、15), main=“random faces”,face.type=1) #face.type=0 黑白繪制,3.4 統(tǒng)計圖散布圖 多維,繪制多維數據中任意兩個變量之間的散點圖,直觀展示多維數據兩兩之間的趨勢關系。,有三種方法繪制散布圖: 1 plot(data.frame() 2 paris(data.frame() 3 plot(x+y+z,data=data.frame(),3.4 統(tǒng)計圖條件散點圖 多維,函數coplot(expr, data=df)主要用來顯示多元數據之間的條件散點圖,df=data.frame(hei=rnorm(50,130,10), wei=rnorm(50,
19、30,9), grade=as.factor(sample(3:6,50,replace=TRUE), class=as.factor(sample(1:3,50,replace=TRUE) coplot(weihei|grade, data=df) coplot(weihei|grade+class,data=df),3.5 疊加圖形,3.5 疊加圖形,x=runif(100,-1,1) y=runif(100,-1,1) opar=par(no.readonly=TRUE) par(fig=c(0,0.8,0,0.8) plot(x,y,xlab=x runif,ylab=y runif)
20、 par(fig=c(0,0.8,0.55,1),new=TRUE) boxplot(x,horizontal=TRUE,axes=FALSE) par(fig=c(0.65,1,0,0.8),new=TRUE) boxplot(y,axes=FALSE) mtext(疊加圖形,side=3,outer=TRUE,line=-3) par(opar),利用:par函數中的fig=c(x1,x2,y1,y2)和new參數,4 高密度散點圖,當數據點重合度很高時,用plot繪制的二維圖重疊嚴重,無法區(qū)分二者的關系。,n=10000 x=matrix(rnorm(n,0,0.5),ncol=2) y
21、=matrix(rnorm(n,3,2),ncol=2) plot(x,y,pch=19,xlab=x,ylab=y),4 高密度散點圖,R提供一個smoothScatter()函數,利用核密度估計生成用顏色密度來表示點分布的散點圖。,smoothScatter(x,y),4 高密度散點圖,R提供一個hexbin包,plot(hexbin(x,y,xbins=50),5 三維散點圖,R提供一個scatterplot3d包來實現(xiàn)三維圖形的繪制,甚至可以旋轉三維圖形。,例: (x,y) 落在 -1,1*-1,1中的隨機數,令 z=exp(-x2+y2),繪制三維圖,x=runif(100,-1,1
22、) y=runif(100,-1,1) z=exp(-x2-y2) scatterplot3d(x,y,z),5 三維散點圖,scatterplot3d(x,y,z,type=h),5 三維散點圖旋轉圖,R提供rgl包中的plot3d函數用來通過鼠標旋轉坐標軸,這樣更有利于理解數據和圖形。,plot3d(x,y,z,type=h),5 三維散點圖旋轉圖,還可以通過Rcmdr這個包中的scatter3d()函數實現(xiàn)更加美觀的旋轉三維圖形。,scatter3d(x,y,z,type=h),5 三維散點圖旋轉圖,還可以通過rgl包實現(xiàn)旋轉三維圖形。 library(rgl) library(Rcmdr) scatter3d(x,y,z),第三
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2025學年一年級下學期數學第七單元《三個兩位數連加》(教案)
- 2025年會計勞務合同模板
- 2025年專利轉讓合同水產養(yǎng)殖產品適用
- 人教版三年級下冊第一單元-位置和方向(一)-(單元測試)含答案
- 人教版三年級英語上冊期末測試卷
- 2-除數是一位數的除法-人教版三年級數學下冊單元測試卷(含答案)
- 2025年湖南石油化工職業(yè)技術學院單招職業(yè)傾向性測試題庫帶答案
- 2024年碳纖維熱場材料項目投資申請報告代可行性研究報告
- 2024年亞葉酸鈣項目資金需求報告代可行性研究報告
- 2025年廣東省惠州市單招職業(yè)傾向性測試題庫完整
- 4.2依法履行義務 教案 -2024-2025學年統(tǒng)編版道德與法治八年級下冊
- NB/T 11526-2024煤礦微震監(jiān)測系統(tǒng)通用技術條件
- 2025年福建長汀金龍稀土有限公司招聘筆試參考題庫含答案解析
- 文化差異下的教育國外的小學音樂教育方式探討
- 2025年無錫科技職業(yè)學院高職單招職業(yè)技能測試近5年??及鎱⒖碱}庫含答案解析
- 2024年黑龍江建筑職業(yè)技術學院高職單招語文歷年參考題庫含答案解析
- 貴州省貴陽市普通中學2024-2025學年高二上學期期末監(jiān)測歷史試題(含答案)
- Python金融數據挖掘與分析實戰(zhàn)課程教案教學教案
- 2024年地鐵車站照明系統(tǒng)安裝與維護勞務分包協(xié)議3篇
- 脫硫自動化控制-洞察分析
- 醫(yī)務人員醫(yī)德醫(yī)風培訓
評論
0/150
提交評論