第九章 列聯(lián)分析_第1頁
第九章 列聯(lián)分析_第2頁
第九章 列聯(lián)分析_第3頁
第九章 列聯(lián)分析_第4頁
第九章 列聯(lián)分析_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第九章列聯(lián)分析第一頁,共二十頁,編輯于2023年,星期四第一節(jié)列聯(lián)分析

第二頁,共二十頁,編輯于2023年,星期四二維列聯(lián)表(contingencytable;交叉表:crosstable):

這些變量中每個都有兩個或更多的可能取值,這些取值也稱為水平;比如收入有三個水平,觀點有兩個水平。各個變量不同水平的交匯處是頻數(shù)。

更多維的列聯(lián)表稱為高維列聯(lián)表。第三頁,共二十頁,編輯于2023年,星期四

列聯(lián)表分析的一個重要內(nèi)容是看變量之間是否獨立,如本例中的收入和觀點是否無關(guān)。原假設(shè)和備選假設(shè):H0:(觀點和收入)變量之間獨立;H1:變量之間相關(guān)。所用的檢驗統(tǒng)計量一般為Pearson卡方統(tǒng)計量(也有其他統(tǒng)計量,如似然比統(tǒng)計量,但Pearson卡方統(tǒng)計量最常用),它在原假設(shè)成立的前提下有(大樣本時)近似的卡方分布。第四頁,共二十頁,編輯于2023年,星期四第五頁,共二十頁,編輯于2023年,星期四第六頁,共二十頁,編輯于2023年,星期四第七頁,共二十頁,編輯于2023年,星期四既然這個c2統(tǒng)計量是近似的,那么有沒有精確的統(tǒng)計量呢?有。這個檢驗稱為Fisher精確檢驗;它不是c2分布,而是超幾何分布。當數(shù)目很大時,超幾何分布計算相當緩慢(比近似計算會差很多倍的時間);而且在計算機速度不快時,根本無法計算。因此人們多用大樣本近似的c2統(tǒng)計量。第八頁,共二十頁,編輯于2023年,星期四例:收入水平與對待該項政策的態(tài)度獨立(無關(guān))嗎?第九頁,共二十頁,編輯于2023年,星期四例:收入水平與對待該項政策的態(tài)度相關(guān)嗎?第十頁,共二十頁,編輯于2023年,星期四>data=read.csv("table7.csv",head=TRUE);attach(data)>data1=xtabs(number~opinion+income)#把三維表轉(zhuǎn)化為二維>sum=sum(data1)>理論頻率=c(sum(number[opinion==0])/sum,sum(number[opinion==1])/sum)>理論頻數(shù)=cbind(sum(number[income==1])*理論頻率,sum(number[income==2])*理論頻率,sum(number[income==3])*理論頻率)#計算理論頻數(shù)>實際理論之差=data1-理論頻數(shù)>卡方統(tǒng)計量值=sum(實際理論之差^2/理論頻數(shù))>自由度=(2-1)*(3-1)>pvalue=1-pchisq(卡方統(tǒng)計量值,自由度);pvalue[1]3.614199e-05第十一頁,共二十頁,編輯于2023年,星期四列聯(lián)檢驗的軟件實現(xiàn):SPSS:Analyze(分析)→DescriptiveStatistics(描述統(tǒng)計)→Crosstabs(交叉表)。R:>data=read.csv("table7.csv",head=TRUE);attach(data)>data1=xtabs(number~opinion+income)#把三維表轉(zhuǎn)化為二維>chisq.test(data1)或>fisher.test(data1)#fisher精確檢驗第十二頁,共二十頁,編輯于2023年,星期四第二節(jié)檢驗

第十三頁,共二十頁,編輯于2023年,星期四第十四頁,共二十頁,編輯于2023年,星期四1、看看基本指標>data=read.csv("概率論與數(shù)理統(tǒng)計課程成績數(shù)據(jù).csv",head=TRUE)>attach(data);length(課程成績);mean(課程成績);sd(課程成績);range(課程成績)[1]147[1]80.57143[1]12.61278[1]391002、劃分區(qū)間并計算實際頻數(shù)>區(qū)間=quantile(課程成績,prob=seq(0,1,0.1))#把課程成績分成等概率的10個區(qū)間(即頻數(shù)為147*0.1)第十五頁,共二十頁,編輯于2023年,星期四>實際頻數(shù)=table(cut(課程成績,區(qū)間,include.lowest=TRUE))#計算成績落在各區(qū)間的頻數(shù)(并列成績的存在使各區(qū)間頻數(shù)并不嚴格相等),include.lowest=TRUE選項保證39分的成績不被漏掉3、計算理論概率>理論概率1=pnorm(區(qū)間,mean(課程成績),sd(課程成績))>理論概率1=理論概率1[-1]>理論概率=c(理論概率1[1],理論概率1[2:10]-理論概率1[1:9])>理論頻數(shù)=理論概率*length(課程成績)第十六頁,共二十頁,編輯于2023年,星期四4、計算卡方統(tǒng)計量、p值>卡方統(tǒng)計量=sum((實際頻數(shù)-理論頻數(shù))^2/理論頻數(shù))>df=10-1#自由度為10個區(qū)間數(shù)(即卡方統(tǒng)計量中sum的項數(shù))-1>pvalue=1-pchisq(卡方統(tǒng)計量,df)>卡方統(tǒng)計量;pvalue[1]30.6344[1]0.0003419502第十七頁,共二十頁,編輯于2023年,星期四分布的擬合優(yōu)度的卡方檢驗的計算機實現(xiàn):SPSS:Analyze(分析)→NonparametricTests(非參數(shù)檢驗)→Chi-Square(卡方)。(麻煩:理論頻數(shù)需要一個一個地輸入)第十八頁,共二十頁,編輯于2023年,星期四R:#讀入數(shù)據(jù)、劃分區(qū)間、計算實際頻數(shù)>data=read.csv("概率論與數(shù)理統(tǒng)計課程成績數(shù)據(jù).csv",head=TRUE)>attach(data);n=length(課程成績);mean=mean(課程成績);sd=sd(課程成績);range(課程成績)>區(qū)間=quantile(課程成績,prob=seq(0,1,0.1))#把課程成績分成等概率的10個區(qū)間(即頻數(shù)為147*0.1)>實際頻數(shù)=table(cut(課程成績,區(qū)間,include.lowest=TRUE))#計算成績落在各區(qū)間的頻數(shù)(由于有并列成績所以各區(qū)間頻數(shù)并不嚴格相等),include.lowest=TRUE選項保證39分的成績不被漏掉第十九頁,共二十頁,編輯于2023年,星期四#構(gòu)造概率向量:為了使概率向量的區(qū)間數(shù)與實際頻數(shù)相等并使概率和為1(這是使用chisq.test命令的前提),需要進行修正>累積理論概率1=pnorm(區(qū)間,mean,sd)>累積理論概率修正1=c(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論