




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
22.頻率表和列聯(lián)表分類變量包括無序分類變量、有序分類變量。對于分類變量的描述統(tǒng)計,主要是對分類變量各水平值分別進行頻數(shù)和比例計算,再進步計算所需的一些相對頻數(shù)指標。一、一維列聯(lián)表頻數(shù)統(tǒng)計分類變量的分析,首先要了解:各類別的樣本數(shù)(頻數(shù)),以及占總樣本量的百分比;對有序分類變量,還需要了解:累積頻數(shù)、累積百分比。使用table()函數(shù)生成簡單的頻數(shù)統(tǒng)計表,基本格式為:table(var1,var2, ?-,varN)將N個分類變量(因子)創(chuàng)建一個N維列聯(lián)表。library(vcd)#使用數(shù)據(jù)集Arthritishead(Arthritis,3)574677SexAgeImprovedMale27574677SexAgeImprovedMale27SomeMale29NoneMale30NoneIDTreatmentTreatedTreatedTreated#統(tǒng)計頻數(shù)#統(tǒng)計頻數(shù)mytableNone SomeMarked42 14 28prop.table(mytable) #將頻數(shù)轉(zhuǎn)化為比例值None SomeMarked0.5000000 0.16666670.3333333prop.table(mytable)*100 #將頻數(shù)轉(zhuǎn)化為百分比NoneSomeMarked50.00000 16.6666733.33333集中/離散趨勢觀察原始頻數(shù),或者使用眾數(shù)。對于分類變量,集中 /離散趨勢是一體的。相對頻數(shù)指標(1)比(Riatio)兩個有關(guān)指標之比A/B,用來反映相對的大小關(guān)系,例如,月銷售額/銷售人數(shù);(2)構(gòu)成比用于描述事物內(nèi)部各構(gòu)成部分所占的比重,例如,百分比、累積百分比;(3)率(Rate)率是具有時間概念或速度、強度意義的指標,表示某個時期內(nèi)某事件發(fā)生的頻率或強度,例如速率、頻率、費率、發(fā)病率等。二、二維列聯(lián)表rxc二維列聯(lián)表:(1)共n個樣本;按兩種屬性A、B,屬性A有r個水平值:Ai,…,Ar;屬性B有c個水平值:Bi,…,Be.屬性A=Ai,屬性B=Bj的樣本數(shù)為n,ni.=“屬性A=Ai”的合計數(shù),n.j=“屬性B=Bj”的合計數(shù)。1二塞的FKf列聯(lián)農(nóng)■?*■含 it-"u…flh???"i-■;<■略1g*+*■ qA 計■1-n注:多分類變量對應高維列聯(lián)表生成二維列聯(lián)表使用函數(shù)table(),基本格式為:table(A,B)其中,A為行變量,B為列變量?;蛘呤褂煤瘮?shù)xtabs(),基本格式為:xtabs(~A+B,data二mydata)其中,mydata為矩陣或數(shù)據(jù)框;要進行交叉分類的變量放在~右側(cè),以+作為分隔符,若某個變量寫在~左側(cè),則為頻數(shù)向量,常用于數(shù)據(jù)已經(jīng)被表格化時。注:table函數(shù)默認忽略NA值,若要將NA值作為一個類別,需要使用參數(shù)useNA二"ifany"data=Arthritis)#生成data=Arthritis)#生成治療方法與療效的二維列聯(lián)表(頻數(shù))mytableImprovedTreatmentNoneSomeMarkedTreatmentNoneSomeMarkedPlacebo29Treated1321prop.table(mytable)#Treated1321prop.table(mytable)#各單元格占的比例(所有行列總和=1)ImprovedTreatmentNoneSomeMarkedPlacebo0.345238100.08333333 0.08333333Treated0.154761900.08333333 0.25000000margin.table(mytable,1)#TreatmentNoneSomeMarkedPlacebo0.345238100.08333333 0.08333333Treated0.154761900.08333333 0.25000000margin.table(mytable,1)#對第1個變量(行變量)生成邊際頻數(shù)TreatmentPlaceboTreated414341prop.table(mytable,1)#prop.table(mytable,1)#對第1個變量(行變量)生成邊際比例(每行和ImprovedTreatmentNoneSomeMarkedTreatmentNoneSomeMarkedPlacebo0.6744186 0.1627907 0.1627907Treated0.31707320.1707317 0.5121951#可見與安慰劑組相比,治療組的治愈率從 16%提高到51%margin.table(mytable,2) #對第2個變量(列變量)生成邊際頻數(shù)ImprovedNoneSomeMarked421428421428prop.table(mytable,2)#對第2個變量(列變量)生成邊際比例(每列和=1)ImprovedTreatmentNoneSomeMarkedPlacebo0.69047620.50000000.2500000Treated0.30952380.5000000 0.7500000TreatmentNoneSomeMarkedPlacebo0.69047620.50000000.2500000Treated0.30952380.5000000 0.7500000ImprovedTreatmentNoneSomeMarkedSumPlacebo297743Treated1372141Sum42142884#將邊際求和結(jié)果添加到表格(頻數(shù))addmargins(mytable)#將邊際求和結(jié)果添加到表格(比例)addmargins(prop.table(mytable))ImprovedTreatmentNoneSomeMarkedSumTreatmentNoneSomeMarkedSumPlacebo0.345238100.083333330.083333330.51190476Treated0.154761900.083333330.250000000.48809524Sum0.50000000 0.16666667 0.33333333 1.00000000addmargins(prop.table(mytable,1),2)#只添加列邊際ImprovedTreatment None SomeMarked SumPlacebo0.67441860.16279070.16279071.0000000Treated0.31707320.17073170.51219511.0000000addmargins(prop.table(mytable.2),1)#只添加行邊際ImprovedTreatmentNoneSome MarkedPlacebo0.69047620.50000000.2500000Treated0.30952380.50000000.7500000Sum1.00000001.00000001.00000002.gmodels包中的函數(shù)CrossTable()該函數(shù)仿照SAS中PROCFREQ或SPSS中CROSSTABS的形式生成二維列聯(lián)表。它有很多選項,可以做許多事情:計算(行、列、單元格)的百分比;指定小數(shù)位數(shù);進行卡方、Fisher和McNemar獨立性檢驗;計算期望和(皮爾遜、標準化、調(diào)整的標準化)殘差;將缺失值作為一種有效值;進行行和列標題的標注;生成SAS或SPSS風格的輸出。library(gmodels)CrossTable(Arthritis$Treatment,Arthritis$lmproved)cellent?I N |Chi-squaretociributloftIM/RowTotalI\/ColTotalIN/rableTotalITotal0barrvat1005mTal>le:肌IArthritisllttprovedArthritl&ST'reatrftehlI Hone| Sottie|Mdrked| TotalITOC\o"1-5"\h\zPliccbn | 29 | 7 I 7 I 43 I| 2.61G | 0.004 | 3畀刃 |I 0.67^ I D.163 I 0.163 I 0r51? |0.690| 0.500I 0.250I0.345I O.OB3I 0.081Irr?LtedI 13 I 7 I 21 I 41 II 2.744 | 0.004 | J+935 II □.317 I 0,171 I 0.512 I0.480 II 0.310 I 0.500 I 0.750 I□.155I Q.O盟I IColurwiTotalI 42I 14 I 28I £4II 0.500| 0.16; | 0.133|三、多維列聯(lián)表table()和xtabs()都可以基于三個或更多的分類變量(因子)生成多維列聯(lián)表。margin.table()、prop.table()和addmargins()函數(shù)也可類似推廣到多維。另外,ftable()函數(shù)可以用一種緊湊的“平鋪式”輸出多維列聯(lián)mytable<-xtabs(~Treatment+Sex+lmproved,data=Arthritis)mytable,,Improved=NoneSexTreatmentFemaleMalePlacebo 19 10
Treated 67,,Improved=SomeSexTreatmentFemaleMalePlacebo 70Treated 52,,Improved=MarkedSexTreatmentFemaleMalePlacebo 61Treated 165ftable(mytable)ImprovedNoneSomeMarkedTreatment SexPlacebo Female19 76Male1001Treated Female6 516Male7 25margin.table(mytable,1)#邊際頻數(shù)TreatmentPlaceboTreated43 41margin.table(mytable,2)SexFemale Male59 25margin.table(mytable,3)ImprovedNone SomeMarked42 14 28margin.table(mytable,c(1,3))#相當于1:治療方法x3:療效的二維列聯(lián)表ImprovedTreatmentNoneSomeMarkedPlacebo2977Treated13721ftable(prop.table(mytable,c(1,2)))#緊湊形式顯示1:治療方法x2:性別的各類療效情況(比例)ImprovedNoneSomeMarkedTreatmentSexPlaceboFemale0.593750000.218750000.18750000Male0.909090910.000000000.09090909TreatedFemale0.222222220.185185190.59259259Male0.500000000.142857140.35714286
ftable(addmargins(prop.table(mytable,#繼續(xù)給第3變量添加邊際c(1,Some2)),3))ImprovedNoneMarkedSumTreatmentSexPlaceboFemale0.593750000.218750000.187500001.00000000Male0.909090910.000000000.090909091.00000000TreatedFemale0.222222220.185185190.592592591.00000000Male0.500000000.142857140.357142861.00000000ftable(addmargins(prop.table(mytable.c(1,2)),3))*100#繼續(xù)改成百分比ImprovedNoneSomeMarkedSumTreatmentSexPlaceboFemale59.37500021.87500018.750000100.000000Male90.9090910.0000009.090909100.000000TreatedFemale22.22222218.51851959.259259100.000000Male50.00000014.28571435.714286100.000000多維列聯(lián)表的圖形展示一一馬賽克圖單個分類變量,可以使用柱狀圖或者餅圖;若存在兩個分類變量,可以使用三維柱狀圖;兩個以上的分類變量可以使用馬賽克圖。馬賽克圖中,嵌套矩形面積正比于單元格頻率,其中該頻率即多維列聯(lián)表中的頻率。顏色和/或陰影可表示擬合模型的殘差值。使用mosaic()函數(shù),基本格式為:mosaic(table)其中,table為數(shù)組形式的列聯(lián)表;或者用mosaic(formula,data=)其中,formula為形如~var1+var2+…的公式,data為數(shù)據(jù)框或表格;可選項shade二TRUE將根據(jù)擬合模型的皮爾遜殘差值對圖形上色;legend二TRUE將展示殘差的圖例library(vcd)ftable(Titanic)SurvivedNoYesClassSexAge1stMaleChild05Adult11857FemaleChild01Adult41402ndMaleChild011Adult15414FemaleChild013Adult13803rdMaleChild3513
Adult 38775TOC\o"1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于運動生理學的健美操訓練創(chuàng)新
- 智能電網(wǎng)時代抽水蓄能的角色與價值
- 2025瑕疵購房租賃合同
- 小麥抗白粉病抗性基因的分子標記輔助選擇
- 2025企業(yè)主可以使用的商業(yè)合同
- 初階語文探索
- 外語專業(yè)思政教育的國際化發(fā)展趨勢
- 手工藝術(shù)探索
- 生物●天津卷丨2024年天津市普通高中學業(yè)水平選擇性考試生物試卷及答案
- 上海市楊浦區(qū)2023-2024學年高二下學期期末英語調(diào)研卷
- DL-T5169-2013水工混凝土鋼筋施工規(guī)范
- 美學導論智慧樹知到期末考試答案章節(jié)答案2024年山東工藝美術(shù)學院
- MOOC 政府審計學-南京審計大學 中國大學慕課答案
- 從偏差行為到卓越一生3.0版
- 原神游戲介紹PPT
- 2022年病區(qū)分層考核試題N2
- 交通勸導員上崗培訓課件
- 水下作業(yè)安全培訓
- TCACM 1524-2023 中醫(yī)體重管理臨床指南
- 校外培訓機構(gòu)辦學申請書范文
評論
0/150
提交評論