《統(tǒng)計(jì)學(xué)-基于R》(第4版)課件:數(shù)據(jù)與R語(yǔ)言_第1頁(yè)
《統(tǒng)計(jì)學(xué)-基于R》(第4版)課件:數(shù)據(jù)與R語(yǔ)言_第2頁(yè)
《統(tǒng)計(jì)學(xué)-基于R》(第4版)課件:數(shù)據(jù)與R語(yǔ)言_第3頁(yè)
《統(tǒng)計(jì)學(xué)-基于R》(第4版)課件:數(shù)據(jù)與R語(yǔ)言_第4頁(yè)
《統(tǒng)計(jì)學(xué)-基于R》(第4版)課件:數(shù)據(jù)與R語(yǔ)言_第5頁(yè)
已閱讀5頁(yè),還剩33頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

賈俊平2024/1/30StatisticswithR統(tǒng)計(jì)學(xué)R語(yǔ)言賈俊平2024/1/301.1數(shù)據(jù)與統(tǒng)計(jì)學(xué)1.2R語(yǔ)言的初步使用1.3R語(yǔ)言數(shù)據(jù)處理1.4R語(yǔ)言繪圖基礎(chǔ)

數(shù)據(jù)與R語(yǔ)言

思維導(dǎo)圖統(tǒng)計(jì)方法分類與本時(shí)體系描述方法(推斷基礎(chǔ))圖表描述第2章數(shù)據(jù)可視化統(tǒng)計(jì)量描述第3章概括性度量推斷方法(推斷理論與方法)推斷理論第4章概率分布推斷方法第5章參數(shù)估計(jì)第6章假設(shè)檢驗(yàn)其他方法(關(guān)系分析,預(yù)測(cè))關(guān)系分析第7章類別變量分析類別變量與類別變量第8章方差分析因變量:數(shù)值自變量:類別第9章一元線性回歸一個(gè)數(shù)值因變量一個(gè)數(shù)值自變量第10章多元線性回歸一個(gè)數(shù)值因變量多個(gè)數(shù)值或類別自變量預(yù)測(cè)第11章時(shí)間序列預(yù)測(cè)統(tǒng)計(jì)學(xué)是數(shù)據(jù)分析方法數(shù)學(xué)是方法的基礎(chǔ)統(tǒng)計(jì)學(xué)與R語(yǔ)言一種自由軟件編程語(yǔ)言,主要用于統(tǒng)計(jì)分析、繪圖、數(shù)據(jù)挖掘最初由新西蘭奧克蘭大學(xué)的RossIhaka和RobertGentleman開發(fā)(也因此成為R)?,F(xiàn)在由“R開發(fā)核心團(tuán)隊(duì)”負(fù)責(zé)開發(fā)R全稱:

英文名:TheRProgrammingLanguage

中文名:R語(yǔ)言—統(tǒng)計(jì)計(jì)算語(yǔ)言

R語(yǔ)言

統(tǒng)計(jì)學(xué)——收集、處理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學(xué)

1.1

數(shù)據(jù)與統(tǒng)計(jì)學(xué)什么是統(tǒng)計(jì)學(xué)描述性方法研究數(shù)據(jù)收集、整理和描述的統(tǒng)計(jì)學(xué)方法描述數(shù)據(jù)特征,找出數(shù)據(jù)的基本規(guī)律內(nèi)容包括:數(shù)據(jù)收集、處理、展示、描述性分析推斷性方法研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計(jì)學(xué)方法對(duì)總體特征作出推斷內(nèi)容包括:參數(shù)估計(jì)和假設(shè)檢驗(yàn)變量(variable)觀察一個(gè)企業(yè)的銷售額,這個(gè)月和上個(gè)月不同;觀察股票市場(chǎng)上漲股票的家數(shù),今天與昨天數(shù)量不一樣;觀察一個(gè)班學(xué)生的生活費(fèi)支出,一個(gè)人和另一個(gè)人不一樣;投擲一枚骰子觀察其出現(xiàn)的點(diǎn)數(shù),這次投擲的結(jié)果和下一次也不一樣“企業(yè)銷售額”、“上漲股票的家數(shù)”、“生活費(fèi)支出”、“投擲一枚骰子出現(xiàn)的點(diǎn)數(shù)”等就是變量數(shù)據(jù)(data)變量的觀測(cè)結(jié)果

1.1

數(shù)據(jù)與統(tǒng)計(jì)學(xué)變量和數(shù)據(jù)變量的基本分類類別變量(定性變量)無序類別變量(名義值)有序類別變量(順序值)數(shù)值變量(定量變量)離散變量(有限值)連續(xù)變量(無限制)二手?jǐn)?shù)據(jù)抽取樣本總體(population):包含所研究的全部個(gè)體(或數(shù)據(jù))的集合樣本(sample):從總體中抽取的一部分元素的集合樣本量(samplesize):構(gòu)成樣本的元素的數(shù)目概率抽樣方法根據(jù)已知的概率抽取樣本元素,也稱隨機(jī)抽樣

1.1

數(shù)據(jù)與統(tǒng)計(jì)學(xué)數(shù)據(jù)來源簡(jiǎn)單隨機(jī)抽樣從總體N個(gè)單位(元素)中隨機(jī)地抽取n個(gè)單位作為樣本,使得總體中每一個(gè)元素都有相同的機(jī)會(huì)(概率)被抽中抽取元素的具體方法有放回抽樣和無放回抽樣分層抽樣將總體單位按某種特征或規(guī)則劃分為不同層,再?gòu)牟煌膶又须S機(jī)地抽取樣本系統(tǒng)抽樣將總體中的所有單位(抽樣單位)按一定順序排列,在規(guī)定的范圍內(nèi)隨機(jī)地抽取一個(gè)單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其他樣本元素整群抽樣將總體中若干個(gè)單位合并為組(群),抽樣時(shí)直接抽取群,再對(duì)中選群中的所有單位全部實(shí)施調(diào)查

1.2

R語(yǔ)言的初步使用

R下載、安裝和更新#install.packages("installr")#需要安裝包“installr”library(installr)#加載包updateR()#更新

1.2

R語(yǔ)言的初步使用對(duì)象賦值與運(yùn)行#對(duì)象賦值x<-c(80,87,98,73,100)#將5個(gè)數(shù)據(jù)賦值給對(duì)象xy<-example1_1#將數(shù)據(jù)框example1_1賦值給對(duì)象y#對(duì)象運(yùn)行sum(x)#計(jì)算對(duì)象x的總和mean(x)#計(jì)算對(duì)象x的平均數(shù)barplot(x)#繪制x的條形圖

1.2

R語(yǔ)言的初步使用編寫代碼腳本——以繪制直方圖為例#繪制直方圖d<-rnorm(100)#生成100個(gè)標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)數(shù)hist(d,prob=TRUE,col="green")#繪制直方圖lines(density(d))#為直方圖添加核密度曲線barplot(x)#繪制x的條形圖

1.2

R語(yǔ)言的初步使用查看幫助信息help(sum)#查看mean函數(shù)的幫助信息help(plotmath)#查看R的數(shù)學(xué)運(yùn)算符help(package="stats")#查看包stats的信息var#查看var函數(shù)源代碼

1.2

R語(yǔ)言的初步使用包的安裝和加載#安裝包install.packages("car")#安裝包c(diǎn)arinstall.packages(c("car","vcd"))#同時(shí)安裝car和vcd兩個(gè)包#加載包library(car)#加載包c(diǎn)arrequire(car)#加載包c(diǎn)ar#顯示已安裝包的名稱.packages(all.availabee=TRUE)#卸載(刪除)安裝在R中的包remove.packages("vcd")#從R中徹底刪除vcd包#解除(不是刪除)加載到R界面中的包detach("vcd")#解除加載到R界面中的vcd包#查看包中的函數(shù)help(package=vcd)向量——一維數(shù)組,其中可以是數(shù)值型數(shù)據(jù),也可以是字符數(shù)據(jù)或邏輯值(如TRUE或FALSE

1.2

R語(yǔ)言的初步使用創(chuàng)建R格式數(shù)據(jù)——向量、矩陣和數(shù)組#用c函數(shù)創(chuàng)建向量a<-c(2,5,8,3,9)#數(shù)值型向量b<-c("甲","乙","丙","丁")#字符型向量c<-c("TRUE","FALSE","FALSE","TRUE")#邏輯值向量#創(chuàng)建向量其他方法v1<-1:6#產(chǎn)生1~6的等差數(shù)列v2<-seq(from=2,to=4,by=0.5)#在2~4之間產(chǎn)生步長(zhǎng)為0.5的等差數(shù)列v3<-rep(1:3,times=3)#將1~3的向量重復(fù)3次v4<-rep(1:3,each=3)#將1~3的向量中每個(gè)元素重復(fù)3次v1;v2;v3;v4#運(yùn)行向量v1,v2,v3,v4矩陣

——二維數(shù)組,其中的每個(gè)元素都是相同的數(shù)據(jù)類型。用matrix函數(shù)可以創(chuàng)建矩陣

1.2

R語(yǔ)言的初步使用創(chuàng)建R格式數(shù)據(jù)——向量、矩陣和數(shù)組#用matrix函數(shù)創(chuàng)建矩陣a<-1:6#生成1到6的數(shù)值向量mat<-matrix(a,#創(chuàng)建向量a的矩陣

nrow=2,ncol=3,#矩陣行數(shù)為2,列數(shù)為3byrow=TRUE)#按行填充矩陣的元素#用matrix函數(shù)創(chuàng)建矩陣rownames(mat)=c("甲","乙")#添加行名colnames(mat)=c("A","B","C")#添加行名#用t函數(shù)對(duì)矩陣轉(zhuǎn)置t(mat)#矩陣轉(zhuǎn)置數(shù)據(jù)框

——一種表格結(jié)構(gòu)的數(shù)據(jù),類似于Excel中的數(shù)據(jù)表。使用data.frame函數(shù)可創(chuàng)建數(shù)據(jù)框

1.2

R語(yǔ)言的初步使用創(chuàng)建R格式數(shù)據(jù)——向量、矩陣和數(shù)組#寫入姓名和分?jǐn)?shù)向量names<-c("劉文濤","王宇翔","田思雨","徐麗娜","丁文斌")#寫入姓名向量stat<-c(68,85,74,88,63)#寫入各門課程分?jǐn)?shù)向量math<-c(85,91,74,100,82)econ<-c(84,63,61,49,89)#將向量組織成數(shù)據(jù)框形式table1_1<-data.frame(學(xué)生姓名=names,統(tǒng)計(jì)學(xué)=stat,數(shù)學(xué)=math,經(jīng)濟(jì)學(xué)=econ)

#將數(shù)據(jù)組織成數(shù)據(jù)框形式,并儲(chǔ)存在對(duì)象table1_1中姓名統(tǒng)計(jì)學(xué)數(shù)學(xué)經(jīng)濟(jì)學(xué)劉文濤688584王宇翔859163田思雨747461徐麗娜8810049丁文彬638289數(shù)據(jù)框

——數(shù)據(jù)框查看

1.2

R語(yǔ)言的初步使用創(chuàng)建R格式數(shù)據(jù)——向量、矩陣和數(shù)組#查看數(shù)據(jù)框table1_1<-read.csv("C:/example/chap01/table1_1.csv")#加載數(shù)據(jù)框table1_1table1_1#顯示table1_1中的數(shù)據(jù)head(table1_1,3);tail(table1_1,3)#查看前3行和后3行#查看數(shù)據(jù)框的行數(shù)和列數(shù)nrow(table1_1)#查看table1_1的行數(shù)ncol(table1_1)#查看table1_1的行數(shù)dim(table1_1)#同時(shí)查看行數(shù)和列數(shù)#查看數(shù)據(jù)的類型class(table1_1)#查看數(shù)據(jù)結(jié)構(gòu)str(table1_1)#查看tabe1_1的數(shù)據(jù)結(jié)構(gòu)#查看數(shù)據(jù)框table1_1<-read.csv("C:/example/chap01/table1_1.csv")#讀數(shù)據(jù)table1_2<-read.csv("C:/example/chap01/table1_2.csv")table1_3<-read.csv("C:/example/chap01/table1_3.csv")mytable<-rbind(table1_1,table1_2)#按行合并數(shù)據(jù)框cbind(mytable,table1_3[2:3])#按列合并數(shù)據(jù)框數(shù)據(jù)框

——數(shù)據(jù)框合并數(shù)據(jù)框

——數(shù)據(jù)框排序

1.2

R語(yǔ)言的初步使用創(chuàng)建R格式數(shù)據(jù)——向量、矩陣和數(shù)組#數(shù)據(jù)框排序table1_1<-read.csv("C:/example/chap01/table1_1.csv")#加載數(shù)據(jù)library(dplyr)#加載包arrange(table1_1,姓名)#按姓名升序?qū)φ麄€(gè)數(shù)據(jù)框排序arrange(table1_1,desc(數(shù)學(xué)))#按數(shù)學(xué)分?jǐn)?shù)降序?qū)φ麄€(gè)數(shù)據(jù)框排序因子

——類別變量在R語(yǔ)言中稱為因子(factor),因子的取值稱為水平(level)

1.2

R語(yǔ)言的初步使用創(chuàng)建R格式數(shù)據(jù)——因子#將無序因子轉(zhuǎn)換為數(shù)值a<-c("金融","地產(chǎn)","醫(yī)藥","醫(yī)藥","金融","醫(yī)藥")#向量af1<-factor(a)#將向量a編碼為因子as.numeric(f1)#將因子轉(zhuǎn)換為數(shù)值#將無序因子轉(zhuǎn)換為有序因子或數(shù)值b<-c("很好","好","一般","差","很差")#向量bf2<-factor(b,ordered=TRUE,levels=c("很好","好","一般","差","很差"))#將向量b編碼為有序因子as.numeric(f2)#將因子轉(zhuǎn)換為數(shù)值讀取——保存

1.3

R語(yǔ)言數(shù)據(jù)處理數(shù)據(jù)處理和保存#讀取包含標(biāo)題的csv格式數(shù)據(jù)table1_1<-read.csv("C:/example/chap01/table1_1.csv")

#讀取不包含標(biāo)題的csv格式數(shù)據(jù)table1_1<-read.csv("C:/example/chap01/table1_1.csv",header=FALSE)#將tablel_1存為csv格式文件write.csv(table1_1,file="C:/mydata/chap01/table1_1.csv")#將tablel_1存為R格式文件save(table1_1,file="C:/mydata/chap01/table1_1.RData")隨機(jī)數(shù)

1.3

R語(yǔ)言數(shù)據(jù)處理隨機(jī)數(shù)和數(shù)據(jù)抽樣#生成隨機(jī)數(shù)rnorm(n=20,mean=0,sd=1)#產(chǎn)生20個(gè)標(biāo)準(zhǔn)正態(tài)分布隨機(jī)數(shù)set.seed(15)#設(shè)定隨機(jī)數(shù)種子rnorm(n=20,mean=50,sd=5)#產(chǎn)生20個(gè)均值為50、標(biāo)準(zhǔn)差為5的正態(tài)分布隨機(jī)數(shù)runif(n=20,min=0,max=10)#在0到10之間產(chǎn)生20個(gè)均勻分布隨機(jī)數(shù)rchisq(n=20,df=15)#產(chǎn)生20個(gè)卡方分布隨機(jī)數(shù)#抽取隨機(jī)樣本N<-1:20#1到20的數(shù)值向量n1<-sample(N,size=10);n1#無放回抽取10個(gè)數(shù)據(jù)n2<-sample(N,size=10,replace=TRUE);n2#有放回抽取10個(gè)數(shù)據(jù)Ncols<-c("black","red","green","blue","yellow")#5種不同的顏色向量ncols<-sample(Ncols,size=8,replace=TRUE);ncols#有放回抽取8個(gè)顏色數(shù)據(jù)抽樣

數(shù)據(jù)框

向量

1.3

R語(yǔ)言數(shù)據(jù)處理數(shù)據(jù)類型的轉(zhuǎn)轉(zhuǎn)——將變量轉(zhuǎn)換成向量#將table1_1中的統(tǒng)計(jì)學(xué)分?jǐn)?shù)、統(tǒng)計(jì)學(xué)分?jǐn)?shù)和數(shù)學(xué)分?jǐn)?shù)轉(zhuǎn)換為向量table1_1<-read.csv("C:/example/chap01/table1_1.csv")vector1<-as.vector(table1_1$統(tǒng)計(jì)學(xué));vector1#將統(tǒng)計(jì)學(xué)分?jǐn)?shù)轉(zhuǎn)換成向量vector2<-as.vector(c(table1_1$統(tǒng)計(jì)學(xué),table1_1$數(shù)學(xué)));vector2#將統(tǒng)計(jì)學(xué)和數(shù)學(xué)分?jǐn)?shù)合并轉(zhuǎn)換成vector3<-as.vector(as.matrix(table1_1[,2:4]));vector3#將數(shù)據(jù)框轉(zhuǎn)換為向量數(shù)據(jù)框

矩陣

1.3

R語(yǔ)言數(shù)據(jù)處理數(shù)據(jù)類型的轉(zhuǎn)轉(zhuǎn)——將變量轉(zhuǎn)換成矩陣#將數(shù)據(jù)框轉(zhuǎn)換為矩陣table1_1<-read.csv("C:/example/chap01/table1_1.csv")mat<-as.matrix(table1_1[,2:4])#轉(zhuǎn)換為矩陣matrownames(mat)=table1_1[,1]#矩陣的行名為table1_1第1列的名稱mat#查看矩陣#將矩陣轉(zhuǎn)化成數(shù)據(jù)框as.data.frame(mat)短格式

長(zhǎng)格式

1.3

R語(yǔ)言數(shù)據(jù)處理數(shù)據(jù)類型的轉(zhuǎn)轉(zhuǎn)——將短格式數(shù)據(jù)轉(zhuǎn)換成長(zhǎng)格式#將短格式數(shù)據(jù)轉(zhuǎn)換為長(zhǎng)格式——有標(biāo)識(shí)變量table1_1<-read.csv("C:/example/chap01/table1_1.csv")library(reshape2)#加載reshape2包tab.long<-melt(table1_1,id.vars="姓名",="課程",="分?jǐn)?shù)")

#融合table1_1與id變量,并命名="課程",="分?jǐn)?shù)"tab.long#顯示tab.long#將短格式數(shù)據(jù)轉(zhuǎn)換為長(zhǎng)格式——無標(biāo)識(shí)變量table1_3<-read.csv("C:/example/chap01/table1_3.csv")library(reshape2)#加載reshape2包tab.long<-melt(table1_3,="課程",="分?jǐn)?shù)")head(tab.long,3)#顯示tab.long的前6行#使用tidyr包中的gather函數(shù)轉(zhuǎn)換為長(zhǎng)格式(有標(biāo)識(shí)變量)table1_1<-read.csv("C:/example/chap01/table1_1.csv")library(tidyr)df1<-gather(table1_1,key="課程",value="分?jǐn)?shù)","統(tǒng)計(jì)學(xué)","數(shù)學(xué)","經(jīng)濟(jì)學(xué)")#key為融合后的變量名稱df1#使用tidyr包中的gather函數(shù)轉(zhuǎn)換為長(zhǎng)格式(無標(biāo)識(shí)變量)table1_3<-read.csv("C:/example/chap01/table1_3.csv")library(tidyr)df2<-gather(table1_3,key="課程",value="分?jǐn)?shù)","統(tǒng)計(jì)學(xué)","數(shù)學(xué)","經(jīng)濟(jì)學(xué)")df2生成頻數(shù)表一個(gè)類別變量——簡(jiǎn)單頻數(shù)表兩個(gè)類別變量——二維列聯(lián)表多個(gè)類別變量——多維列聯(lián)表計(jì)算描述統(tǒng)計(jì)量頻數(shù)(frequency):落在各類別中的數(shù)據(jù)個(gè)數(shù)比例(proportion):某一類別數(shù)據(jù)個(gè)數(shù)占全部數(shù)據(jù)個(gè)數(shù)的比值百分比(percentage):將對(duì)比的基數(shù)作為100而計(jì)算的比值比率(ratio):不同類別數(shù)值個(gè)數(shù)的比值

1.3

R語(yǔ)言數(shù)據(jù)處理生成頻數(shù)分布表【例1-1】(數(shù)據(jù):example1_1.csv)某物業(yè)管理公司準(zhǔn)備施行一項(xiàng)物業(yè)管理改革措施,為征求社區(qū)居民的意見,在所管理的4個(gè)社區(qū)隨機(jī)調(diào)查80個(gè)住戶,對(duì)戶主進(jìn)行調(diào)查。表1-4是被調(diào)查者所屬的社區(qū)、性別及其對(duì)該項(xiàng)改革措施的態(tài)度數(shù)據(jù)(為節(jié)省篇幅,只列出前5行和后5行)。生成頻數(shù)分布表,觀察被調(diào)查者在所屬社區(qū)、性別以及對(duì)改革措施態(tài)度的分布狀況

1.3

R語(yǔ)言數(shù)據(jù)處理生成頻數(shù)分布表——類別數(shù)據(jù)——例題分析社區(qū)性別態(tài)度社區(qū)性別態(tài)度A社區(qū)男反對(duì)B社區(qū)女反對(duì)B社區(qū)女反對(duì)D社區(qū)女贊成D社區(qū)女反對(duì)A社區(qū)男反對(duì)C社區(qū)男反對(duì)C社區(qū)男贊成A社區(qū)男贊成A社區(qū)男贊成………………………………A社區(qū)男反對(duì)A社區(qū)女反對(duì)B社區(qū)男贊成C社區(qū)男贊成A社區(qū)女贊成B社區(qū)男贊成C社區(qū)女贊成A社區(qū)女贊成A社區(qū)男贊成C社區(qū)女反對(duì)

1.3

R語(yǔ)言數(shù)據(jù)處理生成頻數(shù)分布表——類別數(shù)據(jù)——例題分析#生成滿意度的簡(jiǎn)單頻數(shù)表example1_1<-read.csv("C:/example/chap01/example1_1.csv")mytable<-table(example1_1$社區(qū));mytable#生成頻數(shù)表prop.table(mytable)*100#將頻數(shù)表轉(zhuǎn)化成百分比表簡(jiǎn)單頻數(shù)表—一維

二維列聯(lián)表#生成社區(qū)與態(tài)度的二維列聯(lián)表example1_1<-read.csv("C:/example/chap01/example1_1.csv")attach(example1_1)#綁定數(shù)據(jù)mytable1<-table(態(tài)度,社區(qū));mytable1#生成性別和滿意度的二維列聯(lián)表addmargins(mytable1)#為列聯(lián)表添加邊際和addmargins(prop.table(mytable1)*100)#將列聯(lián)表轉(zhuǎn)換成百分比表

1.3

R語(yǔ)言數(shù)據(jù)處理生成頻數(shù)分布表——類別數(shù)據(jù)——例題分析多維頻數(shù)表

多維頻數(shù)表#生成三維頻數(shù)表(列變量為“社區(qū)”)example1_1<-read.csv("C:/example/chap01/example1_1.csv")mytable2<-ftable(example1_1,row.vars=c("性別","態(tài)度"),col.vars="社區(qū)")

#行變量為性別和態(tài)度,列變量為社區(qū)mytable2#為列聯(lián)表添加邊際和ftable(addmargins(table(example1_1$性別,example1_1$態(tài)度,example1_1$社區(qū))))

#生成三維頻數(shù)表(列變量為"社區(qū)",行變量為“性別”和"滿意度")ftable(example1_1,row.vars=c("社區(qū)"),col.vars=c("性別","態(tài)度"))#使用vcd包中的structable函數(shù)read.csv("C:/example/chap01/example1_1.csv")library(vcd)structable(性別+態(tài)度~社區(qū),data=example1_1)#不同表達(dá)式產(chǎn)生不同形式的多維表structable(example1_1)#默認(rèn)structable(~社區(qū)+性別+態(tài)度,data=example1_1)#使用表達(dá)式structable(example1_1,direction=c("h","h","v"))#指定態(tài)度變量放在列structable(example1_1,direction=c("v","h","v"))#指定性別變量放在列

1.3

R語(yǔ)言數(shù)據(jù)處理生成頻數(shù)分布表——類別數(shù)據(jù)——例題分析將列聯(lián)表轉(zhuǎn)換成原始數(shù)據(jù)框

#將列聯(lián)表轉(zhuǎn)換成原始數(shù)據(jù)框read.csv("C:/example/chap01/example1_1.csv")example1_1<-read.csv("C:/example/chap01/example1_1.csv")library(DescTools)mytable<-ftable(example1_1)#生成多維列聯(lián)表df<-Untable(mytable)#將列聯(lián)表轉(zhuǎn)化成原始數(shù)據(jù)框head(df,3);tail(df,3)#顯示前3行和后3行Untable(table(example1_1))#將列聯(lián)表轉(zhuǎn)化成數(shù)據(jù)框#將列聯(lián)表轉(zhuǎn)換成帶有交叉頻數(shù)標(biāo)簽的數(shù)據(jù)框read.csv("C:/example/chap01/example1_1.csv")example1_1<-read.csv("C:/example/chap01/example1_1.csv")tab<-ftable(example1_1)#生成列聯(lián)表(可用table函數(shù)生成)df<-as.data.frame(tab);df#將列聯(lián)表轉(zhuǎn)化成帶有類別頻數(shù)的數(shù)據(jù)框?qū)㈩l數(shù)表轉(zhuǎn)換成帶有交叉頻數(shù)的數(shù)據(jù)框

1.3

R語(yǔ)言數(shù)據(jù)處理生成頻數(shù)分布表——數(shù)值數(shù)據(jù)

1.3

R語(yǔ)言數(shù)據(jù)處理生成頻數(shù)分布表——數(shù)值數(shù)據(jù)——例題分析read.csv("C:/example/chap01/example1_1.csv")library(DescTools)#加載包example1_2<-read.csv("C:/example/chap01/example1_2.csv")#使用默認(rèn)分組,含上限值tab<-Freq(example1_2$銷售額)tab#指定組距=15(不含上限值)library(DescTools)tab1<-Freq(example1_2$銷售額,breaks=c(160,175,190,205,220,235,250,265,280),right=FALSE)

#指定組距=15,不含上限值tab2<-data.frame(分組=tab1$level,頻數(shù)=tab1$freq,頻數(shù)百分比=tab1$perc*100,累積頻數(shù)=tab1$cumfreq,累積百分比=tab1$cumperc*100)#重新命名頻數(shù)表中的變量print(tab2,digits=3)#用print函數(shù)定義輸出結(jié)果的小數(shù)位數(shù)函數(shù)默認(rèn)指定組距

1.4

R語(yǔ)言繪圖基礎(chǔ)基本繪圖函數(shù)傳統(tǒng)繪圖系統(tǒng)—graphicsgraphics包也稱為傳統(tǒng)繪圖系統(tǒng),一些基本繪圖函數(shù)均由該包提供graphics包中的繪圖函數(shù)大致可分為兩大類:一類是高級(jí)繪圖函數(shù),這類函數(shù)可以產(chǎn)生一幅獨(dú)立的圖形;另一類是低級(jí)繪圖函數(shù),這類函數(shù)通常不產(chǎn)生獨(dú)立的圖形,而是在高級(jí)函數(shù)產(chǎn)生的圖形上添加一些新的圖形元素,如標(biāo)題、文本注釋、線段等plot函數(shù)是graphics包中最重要的高級(jí)繪圖函數(shù),它是一個(gè)泛函數(shù),可以繪制多種圖形。給函數(shù)傳遞不同類型的數(shù)據(jù),可繪制不同的圖形。除plot函數(shù)外,graphics包中還有其他一些高級(jí)繪圖函數(shù),如繪制條形圖的barplot函數(shù),繪制直方圖的hist函數(shù),繪制箱線圖的boxplot函數(shù),等等。低級(jí)繪圖函數(shù)中,有為圖形添加圖例的legend函數(shù)、頁(yè)面布局的layout函數(shù)、為圖形添加注釋文本的mtext函數(shù),等等。這些函數(shù)的詳細(xì)信息可使用help(函數(shù)名)查閱幫助

1.4

R語(yǔ)言繪圖基礎(chǔ)基本繪圖函數(shù)——plot函數(shù)應(yīng)用的例子par(mai=c(0.6,0.6,0.4,0.4),cex=0.7)#設(shè)置圖形邊界和符號(hào)的大小set.seed(2025)#設(shè)置隨機(jī)數(shù)種子x<-rnorm(200)#產(chǎn)生200個(gè)標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)數(shù)y<-1+2*x+rnorm(200)#產(chǎn)生變量y的隨機(jī)數(shù)d<-data.frame(x,y)#將數(shù)據(jù)組織成數(shù)據(jù)框dplot(d,xlab="x=自變量",ylab="y=因變量")#繪制散點(diǎn)圖grid(col="grey60")#添加網(wǎng)格線axis(side=4,col.ticks="blue",lty=1)#添加坐標(biāo)軸polygon(d[chull(d),],lty=6,lwd=1,col="lightgreen")#添加多邊形并填充底色points(d)#重新繪制散點(diǎn)圖points(mean(x),mean(y),pch=19,cex=5,col=2)#添加均值點(diǎn)abline(v=mean(x),h=mean(y),lty=2,col="gray30")#添加均值水平線和垂直線abline(lm(y~x),lwd=2,col=2)#添加回歸直線lines(lowess(y~x,f=1/6),col=4,lwd=2,lty=6)#添加擬合曲線segments(-0.8,0,-1.6,3.3,lty=6,col="blue")#添加線段arrows(0.45,-2.2,-0.8,-0.6,code=2,angle=25,length=0.06,col=2)

#添加帶箭頭的線段text(-2.2,3.5,labels=expression("擬合的曲線"),adj=c(-0.1,0.02),col=4)

#添加注釋文本rect(0.4,-1.6,1.8,-3,col="pink",border="grey60")#添加矩形mtext(expression(hat(y)==hat(beta)[0]+hat(beta)[1]*x),cex=0.9,side=1,line=-2.5,adj=0.7)#添加注釋表達(dá)式legend("topleft",legend=c("擬合的直線","擬合的曲線"),lty=c(1,6),col=c(2,4),cex=0.8,fill=c("red","blue"),box.col="grey60",ncol=1,inset=0.02)#添加圖例title("散點(diǎn)圖及擬合直線和曲線\n并為圖形增加新的元素",cex.main=1,font.main=4)#增加標(biāo)題并折行,使用斜體字box(col=4,lwd=2)#添加邊框14

1.4

R語(yǔ)言繪圖基礎(chǔ)圖形控制和頁(yè)面布局——圖形控制——繪制符號(hào)符號(hào)線型顏色

1.4

R語(yǔ)言繪圖基礎(chǔ)圖形控制和頁(yè)面布局——頁(yè)面布局#圖1-5(a)的繪制代碼par(mfrow=c(2,2),mai=c(0.4,0.4,0.3,0.1),cex=0.7,mgp=c(2,1,0),cex.axis=0.8,cex.main=0.8,font.main=1)set.seed(123)#設(shè)置隨機(jī)數(shù)種子x<-rnorm(100)#生成100個(gè)標(biāo)準(zhǔn)正態(tài)分布隨機(jī)數(shù)y<-rexp(100)#生成100個(gè)指數(shù)分布隨機(jī)數(shù)plot(x,y,col=sample(c("black","red","blue"),100,replace=TRUE),main="(a)散點(diǎn)圖")boxplot(x,y,col=2:3,main="(b)箱線圖")hist(x,col="orange1",ylab="y",main="(c)直方圖")barplot(runif(5,10,20),col=2:6,main="(d)條形圖")layout(matrix(c(1,2,3,3),nrow=2,ncol=2,byrow=TRUE),heights=c(2,1))layout.show(3)#圖1-6(b):2行2列的圖形矩陣,第2列為1個(gè)圖layout(matrix(c(1,2,3,3),nrow=2,ncol=2),heights=c(2,1))layout.show(3)#圖1-6(c):2行3列的圖形矩陣,第2行為3個(gè)圖layout(matrix(c(1,1,1,2,3,4),nrow=2,ncol=3,byrow=TRUE),widths=c(3:1),heights=c(2,1))layout.show(4)#圖1-6(d):3行3列的圖形矩陣,第2行為2個(gè)圖layout(matrix(c(1,2,3,4,5,5,6,7,8),3,3,byrow=TRUE),widths=c(2:1),heights=c(1:1))layout.show(8)頁(yè)面布局—par函數(shù)

頁(yè)面布局—layout函數(shù)

1.4

R語(yǔ)言繪圖基礎(chǔ)圖形控制和頁(yè)面布局——頁(yè)面布局——例題分析layout函數(shù)的應(yīng)用

#圖1-7的繪制代碼n=100;set.seed(12);x<-rnorm(n);y<-rexp(n)layout(matrix(c(1,2,3,4,5,5,6,7,8),3,3,byrow=TRUE),widths=c(2:1),heights=c(1:1))par(mai=c(0.3,0.3,0.3,0.1),cex.main=0.9,font.main=1)barplot(runif(8,1,8),col=2:7,main="(a)條形圖")pie(1:12,col=rainbow(6),labels="",border=NA,main="(b)餅圖")qqnorm(y,col=1:7,pch=19,xlab="",ylab="",main="(c)Q-Q圖")plot(x,y,pch=19,col=c(1,2,4),xlab="",ylab="",main="(d)散點(diǎn)圖")plot(rnorm(25),rnorm(25),cex=(y+2),col=2:4,lwd=2,xlab="",ylab="",main="(e)氣泡圖")plot(density(y),col=4,lwd=1,xlab="",ylab="",main="(f)核密度圖");polygon(density(y),col="gold",border="blue")hist(rnorm(1000),col=3,xlab="",ylab="",main

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論