版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
問題:采用一些什么形式將其轉換成方便程
序實現(xiàn)方式?
如何對數(shù)據(jù)文件進行調(diào)用?食品衣著設備醫(yī)療交通教育居住雜項北京4934.051512.88981.131294.072328.512383.961246.19649.66天津4249.311024.15760.561163.981309.941639.831417.45463.64河北2789.85975.94546.75833.511010.51895.06917.19266.16山西2600.371064.61477.74640.221027.991054.05991.77245.07內(nèi)蒙古2824.891396.86561.71719.131123.821245.09941.79468.17遼寧3560.211017.65439.28879.081033.361052.941047.04400.16吉林2842.681127.09407.35854.8873.88997.751062.46394.29黑龍江2633.181021.45355.67729.55746.03938.21784.51310.67第2章多元數(shù)據(jù)的數(shù)學表達及R使用2.1如何收集和整理多元統(tǒng)計分析資料2.2
數(shù)據(jù)的數(shù)學表達2.3
數(shù)據(jù)矩陣及R語言表示2.4數(shù)據(jù)的R語言表示-數(shù)據(jù)框2.5多元數(shù)據(jù)的R語言調(diào)用2.6多元數(shù)據(jù)的簡單R語言分析2.1如何收集和整理多元統(tǒng)計分析資料變量1(X1)變量2(X2)…變量n(Xn)樣本15749159.53976828.891.51樣本26080146.6122177507100…4528443.537353668.587.9樣本n1328442.219615068.572.34(1)多元統(tǒng)計分析變量表示方法整理資料形式矩陣表示形式當這些變量處于同等地位時,可以進行相關分析、聚類分析、主成分分析、因子分析、對應分析、多維標度等分析;當有因變量和自變量之分時,可以進行線性回歸分析、廣義線性模型和非線性模型等的數(shù)據(jù)格式;
因變量是分類變量時,可以進行方差分析模型和判別分析。變量1(X1)變量2(X2)…變量n(Xn)樣本157491176828.891.51樣本2608012177507100…45284153668.587.9樣本572.34(2)數(shù)據(jù)要求每個變量都須有數(shù)據(jù),不能空缺,否則在計算中被忽略(3)變量類型定量變量:計量觀測數(shù)據(jù)。對每個觀察單位的某些標志所測到的數(shù)值(有單位)。例如,身高(cm),體重(kg),收入(元)、支出(元)等。定性變量:計數(shù)觀測數(shù)據(jù)。將觀察單位按屬性或類別分組,清點各組的觀察單位數(shù)。例如,性別數(shù),職業(yè)數(shù)等。定性變量通常需數(shù)量化后才能進行多元統(tǒng)計運算。分析時定性變量常常是按1,2,…識別的。【例子】2.2數(shù)據(jù)的數(shù)學表達數(shù)學表達隨機變量一個統(tǒng)計指標對應一個隨機變量隨機向量一個分量對應一個一維隨機變量1、隨機變量總體期望與方差:樣本期望與方差:2、隨機向量總體期望與方差:樣本期望與方差:2.3數(shù)據(jù)矩陣及R語言表示函數(shù)名用途所在包c向量生成函數(shù)baselength向量長度函數(shù)basemode對象類型函數(shù)baserbind行合并函數(shù)basecbind列合并函數(shù)basematrix矩陣生成函數(shù)baset矩陣轉置函數(shù)basediag對角陣生成函數(shù)basesolve逆矩陣計算函數(shù)baseeigen矩陣的特征值與特征向量函數(shù)basechol進行Choleskey分解basesvd進行奇異值分解baseqr進行QR分解basekroneckerkronecker積計算函數(shù)basedim矩陣維數(shù)base2.4數(shù)據(jù)的R語言表示-數(shù)據(jù)框數(shù)據(jù)框:是一種矩陣形式的數(shù)據(jù),但數(shù)據(jù)框中各列可以是不同類型的數(shù)據(jù)。地區(qū)性別(X1)教育程度(X2)觀點(X3)年齡(X4)月收入(X5)A女中不支持552299A女低不支持393378A女中支持333460B男高支持414564B女高不支持553206A女中不支持484043D女高支持363395R語言表示:data.frame(X1,X2,…)限制條件:1.分量必須是向量(數(shù)值,字符,邏輯)、因子、數(shù)值矩陣、列表或者其他數(shù)據(jù)框。2.矩陣、列表和數(shù)據(jù)框為新的數(shù)據(jù)框提供了盡可能多的變量,因為它們各自擁有列、元素或者變量。3.數(shù)值向量、邏輯值、因子保持原有格式,而字符向量會被強制轉換成因子并且它的水平就是向量中出現(xiàn)的獨立值。4.在數(shù)據(jù)框中以變量形式出現(xiàn)的向量長度必須一致,矩陣結構必須有一樣的行數(shù)。2.5多元數(shù)據(jù)的R語言調(diào)用從剪切板讀取從文本文件讀取從Excel文件讀取多元數(shù)據(jù)調(diào)用數(shù)學表達隨機變量一個統(tǒng)計指標對應一個隨機變量隨機向量一個分量對應一個一維隨機變量數(shù)據(jù)程序表達矩陣存儲數(shù)據(jù)數(shù)據(jù)類型一致數(shù)據(jù)框存儲數(shù)據(jù)類型可以不一致向量存儲數(shù)據(jù)數(shù)據(jù)類型一致創(chuàng)建文本文件,第一行為數(shù)據(jù)框的各變量名,隨后的行為各個變量的值。X=read.table("textdata.txt")#讀取名為textdata的txt格式文檔(2)從文本文件讀?。?)從剪切板讀取方法:(1)選擇需要進行計算的數(shù)據(jù)塊拷貝之。(2)dat=read.table("clipboard",header=T)clipboard為剪切板,header=T讀入變量名讀表格:R語言可以直接讀取Excel數(shù)據(jù),但一次只能讀Excel工作薄的一個表格(將Excel數(shù)據(jù)另存為data.csv格式),X=read.table("data.csv")(3)從Excel文件讀取library(RODBC)#加載RODBC軟件包Rcode=odbcConnectExcel("Rcode.xls")#讀取名為Rcode的Excel工作薄codedata=sqlFetch(Rcode,"codedata"))#顯示Rcode中名為codata表單的數(shù)據(jù)close(Rcode)
#關閉Rcode數(shù)據(jù)文件讀工作簿:2.6多元數(shù)據(jù)的簡單R語言分析定量變量分析定性變量分析三因素分析多元數(shù)據(jù)分析1、定量變量分析(1)變量基本特征直方圖:分析數(shù)據(jù)分布特征
hist(x,freq=NULL,...)x數(shù)值向量;freq頻數(shù)還是頻率(2)變量間關系分析散點圖:分析兩個變量間關系
plot(x,y,...)x為橫坐標,y為縱坐標的二元繪圖;當只有x時,表示以序號為橫坐標,x值為縱坐標繪圖;…為其他的繪圖參數(shù)。餅圖:分析單變量分布特征
pie(table(結果))條形圖:分析單變量分布特征
data=read.table("clipboard",header=T)table(年齡,性別)#二維列聯(lián)表
barplot(table(年齡,性別),beside=T,
col=1:7)(2)兩因素分析以性別分組的年齡條圖以年齡分組的性別條圖三維列鏈表:分析單變量分布特征
ftable(年齡,性別,結果)
#以年齡、性別排列的結果頻數(shù)三維列聯(lián)表(2)三因素分析第2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年建筑安裝工程承包合同
- 2024年度新能源發(fā)電EPC施工合同
- 股票課件教學課件
- 2024年城市規(guī)劃地形測繪專項協(xié)議
- 2024年度旅游景區(qū)開發(fā)合同
- 2024年企業(yè)信息安全服務合同
- 2024年度CRM系統(tǒng)服務合同:提供銷售合同管理專業(yè)支持
- 2024年亞太地區(qū)進出口合作協(xié)議
- 2024基于物聯(lián)網(wǎng)技術的服務合同研究
- 2024年度煤炭供應合同
- 2023年新高考數(shù)學(新高考Ⅰ卷)真題評析及2024備考策略
- 湖北省武漢市華中師范大學附屬小學六年級小升初語文測試卷(8套試卷帶答案解析)
- 新媒體運營(用戶運營內(nèi)容運營活動運營產(chǎn)品運營社群運營)PPT完整全套教學課件
- 贛州市中小學三年級上冊計算機教室上機記錄表
- 任務七食品中脂肪含量測定
- 《IT人員職業(yè)規(guī)劃》
- 初級社會統(tǒng)計學智慧樹知到答案章節(jié)測試2023年哈爾濱工程大學
- 詩歌鑒賞基本知識點
- 人文英語3范文+人文英語3閱讀740
- GB/T 3274-2007碳素結構鋼和低合金結構鋼熱軋厚鋼板和鋼帶
- GB/T 311.3-2007絕緣配合第3部分:高壓直流換流站絕緣配合程序
評論
0/150
提交評論