版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
多元統(tǒng)計(jì)分析及R語言建模2多元數(shù)據(jù)的數(shù)學(xué)表達(dá)及R使用內(nèi)容與要求內(nèi)容:多元數(shù)據(jù)的基本格式,如何收集和整理多元統(tǒng)計(jì)分析資料、數(shù)據(jù)的數(shù)學(xué)表達(dá)、數(shù)據(jù)矩陣及R表示、數(shù)據(jù)的R語言表示、R調(diào)用多元的數(shù)據(jù)和多元的數(shù)據(jù)的簡單R語言分析。要求:
要求學(xué)生熟練如何收集和整理多元統(tǒng)計(jì)分析資料、數(shù)據(jù)的數(shù)學(xué)表達(dá)、掌握多元數(shù)據(jù)的數(shù)字特征的解析表達(dá)式、數(shù)字特征的基本性質(zhì)。熟悉有關(guān)統(tǒng)計(jì)軟件。利用統(tǒng)計(jì)軟件來練習(xí)矩陣的有關(guān)計(jì)算。練習(xí)在已給數(shù)據(jù)下,求樣本均值、樣本離差陣、樣本協(xié)差陣等。多元統(tǒng)計(jì)分析及R語言建模2多元數(shù)據(jù)的數(shù)學(xué)表達(dá)及R使用2.1如何收集和整理多元分析資料2
多元數(shù)據(jù)的數(shù)學(xué)表達(dá)及R使用
多元分析資料的一般格式
矩陣化表示2.1如何收集和整理多元分析資料2
多元數(shù)據(jù)的數(shù)學(xué)表達(dá)及R使用
舉例【例2.1】為了了解股民的投資狀況,研究股民的股票投資特征,我們在2002年組織統(tǒng)計(jì)系本科生進(jìn)行小范圍的“股民投資狀況抽樣調(diào)查”。本次調(diào)查的抽樣框主要涉及廣東省的6個(gè)城市(廣州、深圳、珠海、中山、佛山和東莞,其中,廣州、深圳各100份,其他城市各80份),共發(fā)放問卷520份,回收有效問卷514份。問卷中設(shè)計(jì)了18個(gè)問題。為了簡化分析,本例只考慮:年齡、性別、風(fēng)險(xiǎn)意識(shí)、是否專兼職、職業(yè)狀況、教育程度和投資結(jié)果共7個(gè)變量進(jìn)行分析。#本例性別、風(fēng)險(xiǎn)、專兼職、職業(yè)、教育和結(jié)果為定性變量,年齡是定量變量,有時(shí)為了分析問題方便,也可將其定量化,例如年齡(age):19歲以下(1);20至29歲(2);30至39歲(3);40至49歲(4);50至59歲(5);60歲及以上(6);缺失(*)。性別(sex):男(1),女(2)。風(fēng)險(xiǎn)(risk):有(1);無(2)。專兼職(post):專職(1);業(yè)余(2)。職業(yè)(career):干部(1);管理(2);3科教(3);金融(4);工人(5);農(nóng)民(6);個(gè)體(7);無業(yè)(8)。教育(edu):文盲(1);小學(xué)(2);中學(xué)(3);高中(4);中專(5);大專(6);大學(xué)(7);研究生(8)。投資結(jié)果(result):賺錢(1);不賠不賺(2);賠錢(3)。2.2數(shù)據(jù)的表達(dá)2
多元數(shù)據(jù)的數(shù)學(xué)表達(dá)及R使用方差樣本均值和方差一元數(shù)據(jù)多元數(shù)據(jù)期望期望協(xié)方差數(shù)據(jù)的表達(dá)2.3數(shù)據(jù)矩陣2
多元數(shù)據(jù)的數(shù)學(xué)表達(dá)及R使用在R中可以用函數(shù)c()來創(chuàng)建向量:在R中結(jié)果輸出如下:2.3數(shù)據(jù)矩陣2
多元數(shù)據(jù)的數(shù)學(xué)表達(dá)及R使用#將向量按列和并rbind(x1,x2)#利用x1數(shù)據(jù)創(chuàng)建矩陣matrix(x1,nrow=3,ncol=4)#創(chuàng)建按照行排列的矩陣matrix(x1,nrow=3,ncol=4,byrow=T)2.3數(shù)據(jù)矩陣2
多元數(shù)據(jù)的數(shù)學(xué)表達(dá)及R使用#創(chuàng)建兩個(gè)相同的矩陣A=B=matrix(1:12,nrow=3,ncol=4)#矩陣轉(zhuǎn)置t(A)
#矩陣加法A+B#矩陣加法A+B2.3數(shù)據(jù)矩陣2
多元數(shù)據(jù)的數(shù)學(xué)表達(dá)及R使用#矩陣相乘A=matrix(1:12,nrow=3,ncol=4)B=matrix(1:12,nrow=4,ncol=3)A%in%B#獲取對角線元素A=matrix(1:16,nrow=4,ncol=4)diag(A)#利用對角線元素創(chuàng)建對角矩陣diag(diag(A))#創(chuàng)建3階單位矩陣diag(3)2.3數(shù)據(jù)矩陣2
多元數(shù)據(jù)的數(shù)學(xué)表達(dá)及R使用#求逆矩陣A=matrix(rnorm(16),4,4)solve(A)#求矩陣特征根與特征向量A=diag(4)+1A.e=eigen(A,symmetric=T)#矩陣的Choleskey分解A.c=chol(A)2.3數(shù)據(jù)矩陣2
多元數(shù)據(jù)的數(shù)學(xué)表達(dá)及R使用#矩陣奇異值分解A=matrix(1:18,3,6)A.s=svd(A)#矩陣的維數(shù)A=matrix(1:12,3,4)dim(A)#矩陣的行數(shù)nrow(A)#矩陣的行數(shù)ncol(A)2.3數(shù)據(jù)矩陣2
多元數(shù)據(jù)的數(shù)學(xué)表達(dá)及R使用#矩陣按行求和rowSums(A)#矩陣按行求均值colSums(A)#矩陣按列求和colSums(A)#矩陣按列求均值colSums(A)apply()函數(shù)apply(X,MARGIN,FUN,...)#矩陣按行求和apply(A,1,sum)#矩陣按行求均值apply(A,1,mean)#矩陣按行求和rowSums(A)#矩陣按行求均值colSums(A)2.3數(shù)據(jù)矩陣2
多元數(shù)據(jù)的數(shù)學(xué)表達(dá)及R使用#矩陣按列求和apply(A,2,sum)#矩陣按列求均值aplly(A,2,mean)#矩陣按列求方差A(yù)=matrix(rnorm(100),20,5)aplly(A,2,var)#矩陣按列求函數(shù)結(jié)果B=matrix(1:12,3,4)apply(B,2,function(x,a)x*a,a=2)注意:apply(B,2,function(x,a)x*a,a=2)與B*2效果相同,此處旨在說明如何應(yīng)用apply函數(shù)。2.4數(shù)據(jù)的R語言表示—數(shù)據(jù)框2
多元數(shù)據(jù)的數(shù)學(xué)表達(dá)及R使用數(shù)據(jù)框(dataframe)是一種矩陣形式的數(shù)據(jù),但數(shù)據(jù)框中各列可以是不同類型的數(shù)據(jù)。分量必須是向量(數(shù)值,字符,邏輯)、因子、數(shù)值矩陣、列表或者其他數(shù)據(jù)框。矩陣、列表和數(shù)據(jù)框?yàn)樾碌臄?shù)據(jù)框提供了盡可能多的變量,因?yàn)樗鼈兏髯該碛辛?、元素或者變量。?shù)值向量、邏輯值、因子保持原有格式,而字符向量會(huì)被強(qiáng)制轉(zhuǎn)換成因子并且它的水平就是向量中出現(xiàn)的獨(dú)立值。在數(shù)據(jù)框中以變量形式出現(xiàn)的向量長度必須一致,矩陣結(jié)構(gòu)必須有一樣的行數(shù)。數(shù)據(jù)框錄入限制條件數(shù)據(jù)框2.4數(shù)據(jù)的R語言表示—數(shù)據(jù)框2
多元數(shù)據(jù)的數(shù)學(xué)表達(dá)及R使用#由x1和x2構(gòu)建數(shù)據(jù)框X=data.frame(x1,x2)#賦予數(shù)據(jù)框新的列標(biāo)簽X=data.frame('身高'=x1,'體重'=x2)2.5多元數(shù)據(jù)的R語言調(diào)用
2
多元數(shù)據(jù)的數(shù)學(xué)表達(dá)及R使用從剪切板讀取選擇需要進(jìn)行計(jì)算的數(shù)據(jù)塊(比如上例中名為UG的數(shù)據(jù)),拷貝之。在R中使用dat<-read.table("clipboard",header=T)01022.5多元數(shù)據(jù)的R語言調(diào)用
2
多元數(shù)據(jù)的數(shù)學(xué)表達(dá)及R使用從文本文件讀取#讀取名為textdata的txt格式文檔X=read.table("textdata.txt")X=read.table('textdata.txt',header=T)第一行作為標(biāo)題時(shí)2.5多元數(shù)據(jù)的R語言調(diào)用
2
多元數(shù)據(jù)的數(shù)學(xué)表達(dá)及R使用讀取csv格式和excel格式讀取csv格式讀取excel格式X=read.csv("textdata.csv")1.下載讀取excel文件的包“readxl”2.調(diào)用包:library(readxl)3.讀取文件:X=read_excel(“data.xls”)2.6
多元數(shù)據(jù)的簡單R語言分析
2
多元數(shù)據(jù)的數(shù)學(xué)表達(dá)及R使用#身高的直方圖hist(x1)#身高與體重散點(diǎn)圖plot(x1,x2)定量變量分析2.6
多元數(shù)據(jù)的簡單R語言分析
2
多元數(shù)據(jù)的數(shù)學(xué)表達(dá)及R使用#將剪切板數(shù)據(jù)讀入數(shù)據(jù)框d2.1中d2.1=read.table("clipboard",header=T)#顯示數(shù)據(jù)前6行head(d2.1)定性變量分析#綁定數(shù)據(jù)attach(d2.1)#一維列聯(lián)表table(年齡)2.6
多元數(shù)據(jù)的簡單R語言分析
2
多元數(shù)據(jù)的數(shù)學(xué)表達(dá)及R使用#條形圖barplot(table(年齡),col=1:7)#餅圖pie(table(結(jié)果))定性變量分析(單因素)2.6
多元數(shù)據(jù)的簡單R語言分析
2
多元數(shù)據(jù)的數(shù)學(xué)表達(dá)及R使用#以性別分組的年齡條圖barplot(table(年齡,性別),beside=T,col=1:7)#以年齡分組的性別條圖barplot(table(性別,年齡),beside=T,col=1:2)定性變量分析(雙因素)2.6
多元數(shù)據(jù)的簡單R語言分析
2
多元數(shù)據(jù)的數(shù)學(xué)表達(dá)及R使用#以年齡、性別排列的結(jié)果頻數(shù)三維列聯(lián)表ftable(年齡,性別,結(jié)果)#以性別
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 水果店服務(wù)員工作總結(jié)
- 機(jī)床行業(yè)前臺(tái)工作心得體會(huì)
- 2021年內(nèi)蒙古自治區(qū)呼倫貝爾市公開招聘警務(wù)輔助人員輔警筆試自考題2卷含答案
- 2024年浙江省紹興市公開招聘警務(wù)輔助人員輔警筆試自考題1卷含答案
- 《群眾路線教育活動(dòng)》課件
- 黑龍江綏化市(2024年-2025年小學(xué)六年級(jí)語文)統(tǒng)編版質(zhì)量測試((上下)學(xué)期)試卷及答案
- 2024年聚三嗪項(xiàng)目資金申請報(bào)告代可行性研究報(bào)告
- 2025年泵及液體提升機(jī)項(xiàng)目規(guī)劃申請報(bào)告模稿
- 2025年拖拉機(jī)及農(nóng)林牧漁用掛車項(xiàng)目立項(xiàng)申請報(bào)告模式
- 廣東省湛江市(2024年-2025年小學(xué)六年級(jí)語文)部編版摸底考試(下學(xué)期)試卷及答案
- 工程制圖知識(shí)要點(diǎn)
- 2024山東能源集團(tuán)中級(jí)人才庫選拔高頻考題難、易錯(cuò)點(diǎn)模擬試題(共500題)附帶答案詳解
- 視頻后期剪輯述職報(bào)告
- 個(gè)人就業(yè)能力展示
- 銀行對公業(yè)務(wù)課件
- 水吧管理方案
- 遂溪縣水資源分析報(bào)告
- 研究生高等數(shù)理統(tǒng)計(jì)試卷及部分答案
- 后臺(tái)管理系統(tǒng)技術(shù)方案
- 作文素材:《南方周末》1997-2023年新年獻(xiàn)詞全匯編
- 進(jìn)駐商場計(jì)劃書
評(píng)論
0/150
提交評(píng)論