第九章列聯(lián)表_第1頁
第九章列聯(lián)表_第2頁
第九章列聯(lián)表_第3頁
第九章列聯(lián)表_第4頁
第九章列聯(lián)表_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第九章列聯(lián)表第1頁,課件共23頁,創(chuàng)作于2023年2月contents二維列聯(lián)表的齊性和獨(dú)立性的χ2檢驗(yàn)1低維列聯(lián)表的Fisher精確檢驗(yàn)2對(duì)數(shù)線性模型與高維列聯(lián)表的獨(dú)立性檢驗(yàn)簡(jiǎn)介3第2頁,課件共23頁,創(chuàng)作于2023年2月一、交互分類和列聯(lián)表所謂交互分類(CrossClassification)是指對(duì)某一樣本同時(shí)按兩個(gè)或兩個(gè)以上標(biāo)準(zhǔn)進(jìn)行的交叉分類。所謂列聯(lián)表(ContingencyTable)就是交互分類后形成的表格。如下表:婦女的志愿與其受教育水平的交互分類表志愿(Y)教育水平(X)合計(jì)高低幸福家庭12595220理想工作65105170合計(jì)1902003909.1二維列聯(lián)表的齊性和獨(dú)立性的χ2檢驗(yàn)第3頁,課件共23頁,創(chuàng)作于2023年2月二、r×c列聯(lián)表第二分類準(zhǔn)則第一分類準(zhǔn)則水平水平123…C合計(jì)1O11O12O13…O1cn1.2O21O22O23…O2cN2.3O31O32O33…O3cN3.…………………rOr1Or2Or3…OrcNr.合計(jì)n.1n.2N.3…n.cn9.1二維列聯(lián)表的齊性和獨(dú)立性的χ2檢驗(yàn)第4頁,課件共23頁,創(chuàng)作于2023年2月在r×c列聯(lián)表中,第一種分類準(zhǔn)則將樣本分成了C個(gè)水平(即C列);第二個(gè)分類準(zhǔn)則將樣本分成了r個(gè)水平(即r行);交叉點(diǎn)上的Oij,(i=1,2,…,r;j=1,2,…,c)表示樣本落在第i行第j列(單元)的樣本數(shù),我們稱為該單元的實(shí)際觀察頻數(shù)。令ni.和n.j分別表示第i行第j列的樣本總數(shù),則:9.1二維列聯(lián)表的齊性和獨(dú)立性的χ2檢驗(yàn)式中n就是隨機(jī)樣本的容量。第5頁,課件共23頁,創(chuàng)作于2023年2月如果令Pij表示任一樣本落在第i行第j列的概率,則Pi.和P.j分別表示列聯(lián)表的行邊際概率和列邊際概率,且

9.1二維列聯(lián)表的齊性和獨(dú)立性的χ2檢驗(yàn)第6頁,課件共23頁,創(chuàng)作于2023年2月三、齊性X2檢驗(yàn)一般假設(shè)為:H0:行分布是齊性的(即各行的總體分布一致F1(x)=F2(x))=…=Fr(x))H1:行分布不齊(即各行的總體分布不一致F1(x)≠F2(x))≠…≠Fr(x))在r×c列聯(lián)表中,如H0成立表明各行在同一列的比率一致,即Pi1=Pi2=…=Pic=P.j(i=1,2,…,r;j=1,2,…,c)9.1二維列聯(lián)表的齊性和獨(dú)立性的χ2檢驗(yàn)第7頁,課件共23頁,創(chuàng)作于2023年2月在H0成立時(shí),第ij單元的期望值(預(yù)期頻數(shù))按X2統(tǒng)計(jì)量的定義可表示為:它在樣本量較大時(shí)(一般Eij大于5時(shí))近似服從自由度為k(r-1)-(r-1)=(k-1)(r-1)的X2分布。9.1二維列聯(lián)表的齊性和獨(dú)立性的χ2檢驗(yàn)第8頁,課件共23頁,創(chuàng)作于2023年2月例9.1:檢驗(yàn)兩種教學(xué)方法的成效。把學(xué)生分成兩組,隨機(jī)地從兩組中各抽出50名學(xué)生,根據(jù)每個(gè)學(xué)生期末成績(jī)分為甲、乙、丙、丁、戊五個(gè)等級(jí),具體數(shù)字下表所示:兩組學(xué)生的期末成績(jī)表根據(jù)題意,可檢驗(yàn)如下假設(shè):Ho:兩種教學(xué)法使學(xué)生的成績(jī)無顯著性差異;H1:Ho假設(shè)為不真。若Ho為真,則兩組學(xué)生的成績(jī)?cè)诟飨鄳?yīng)等級(jí)的概率應(yīng)相等(即P1j=P2j)。組別等級(jí)總數(shù)甲乙丙丁戊1組81316103502組4914167509.1二維列聯(lián)表的齊性和獨(dú)立性的χ2檢驗(yàn)第9頁,課件共23頁,創(chuàng)作于2023年2月這樣可計(jì)算各等級(jí)概率的估計(jì)值為:甲級(jí)(8+4)/100=0.12乙級(jí)(13+9)/100=0.22丙級(jí)(16+14)/100=0.30丁級(jí)(10+16)/100=0.26戊級(jí)1-(0.12+0.22+0.30+0.26)=1-0.9=0.10所以:查自由度為(R-1)(C-1)=(5-1)(2-1)=4,a=0.05,C=9.488,X2<C,接受Ho假設(shè)。9.1二維列聯(lián)表的齊性和獨(dú)立性的χ2檢驗(yàn)第10頁,課件共23頁,創(chuàng)作于2023年2月例9.2:一個(gè)市場(chǎng)分析員想知道年齡不同的人所喜歡的電視節(jié)目是否不同,他在不同年齡組中各抽選了一個(gè)隨機(jī)樣本,并請(qǐng)樣本中的每一個(gè)人指出自己喜歡的節(jié)目類型,調(diào)查結(jié)果列于下表,括號(hào)內(nèi)是預(yù)期頻數(shù)。喜愛的電視節(jié)目與年齡的交互分類節(jié)目類型年齡小組ABC合計(jì)30歲以下120(70)30(67.50)50(62.50)20030-44歲10(35)75(33.75)15(31.25)10045歲及以上10(35)30(33.75)60(31.25)100合計(jì)1401351254009.1二維列聯(lián)表的齊性和獨(dú)立性的χ2檢驗(yàn)第11頁,課件共23頁,創(chuàng)作于2023年2月如果不同年齡組喜愛的節(jié)目一致,則在每一年齡組中,喜歡A類節(jié)目者的比例都等于140/400=0.35,將每一樣本數(shù)乘以0.35,便得出不同年齡組喜歡A類節(jié)目的預(yù)期頻數(shù)。于是有200*0.35=70,100*0.35=35,其余數(shù)據(jù)可用類似的方法得出。假設(shè)組為:H0:就所喜歡的電視節(jié)目類型而言三個(gè)年齡組是一致的;H1:三個(gè)年齡組不一致。9.1二維列聯(lián)表的齊性和獨(dú)立性的χ2檢驗(yàn)第12頁,課件共23頁,創(chuàng)作于2023年2月由表中數(shù)據(jù)算出得:設(shè)α=0.05,查X2表可知,當(dāng)自由度為4時(shí),X2的臨界值為9.488,因?yàn)閄2的計(jì)算值180.495大于9.488,所以否定Ho并得出結(jié)論:就所喜歡的電視節(jié)目類型而言,這些總體是不一致的(P<0.005)。9.1二維列聯(lián)表的齊性和獨(dú)立性的χ2檢驗(yàn)第13頁,課件共23頁,創(chuàng)作于2023年2月四、獨(dú)立性X2檢驗(yàn)獨(dú)立性X2檢驗(yàn)是用來檢驗(yàn)兩種分類(分組)是否彼此獨(dú)立的。資料要求至少是定類尺度測(cè)量。具體用途可用于兩個(gè)獨(dú)立樣本或k個(gè)獨(dú)立樣本的獨(dú)立性檢驗(yàn)。如我們將電視觀眾按年齡和他們喜歡的電視節(jié)目類型進(jìn)行了交互分組,那么我們就可以檢驗(yàn)電視觀眾的年齡與他們喜愛的節(jié)目類型之間是否有關(guān)聯(lián)(如無關(guān)聯(lián)即二者獨(dú)立)。9.1二維列聯(lián)表的齊性和獨(dú)立性的χ2檢驗(yàn)第14頁,課件共23頁,創(chuàng)作于2023年2月獨(dú)立性X2檢驗(yàn)的假設(shè)組應(yīng)為:H0:兩種分類準(zhǔn)則彼此獨(dú)立(Pij=Pi.·P.j);H1:兩種分類準(zhǔn)則彼此不獨(dú)立(Pij≠Pi.·P.j);在列聯(lián)表中,理論頻數(shù)Eij=n·Pij,因?yàn)楫?dāng)Ho為真時(shí),Pij=Pi.·P.j,這里Pi.(邊際概率)可用邊際頻率ni./n來代替,即Pi.=ni./n;同理P.j=n.j/n所以

9.1二維列聯(lián)表的齊性和獨(dú)立性的χ2檢驗(yàn)第15頁,課件共23頁,創(chuàng)作于2023年2月例9.3:一個(gè)市場(chǎng)調(diào)查公司想知道某城市成年人駕駛的汽車式樣與其居住地之間是否存在某種聯(lián)系。抽取了500名成年駕駛者進(jìn)行調(diào)查,其資料如下表所示:500名汽車駕駛者的調(diào)查數(shù)據(jù)居住區(qū)汽車式樣合計(jì)ABC152(45.36)64(52.64)24(42)140260(55.4)59(64.3)52(51.3)171350(61.24)65(71.06)74(56.7)189合計(jì)1621881505009.1二維列聯(lián)表的齊性和獨(dú)立性的χ2檢驗(yàn)第16頁,課件共23頁,創(chuàng)作于2023年2月解:建立假設(shè)組:Ho:成年人所駕駛的汽車式樣與他們的居住區(qū)之間彼此獨(dú)立;H1:兩種分類準(zhǔn)則彼此不獨(dú)立。設(shè)顯著性水平a為0.05。計(jì)算檢驗(yàn)統(tǒng)計(jì)量:9.1二維列聯(lián)表的齊性和獨(dú)立性的χ2檢驗(yàn)第17頁,課件共23頁,創(chuàng)作于2023年2月在r行c列的列聯(lián)表中自由度等于(r-1)(c-1)=(3-1)(3-1)=4。X2(0.95,4)的臨界值為9.488,于是否定區(qū)域由等于或大于9.488的X2值構(gòu)成。五、小預(yù)期頻數(shù)列聯(lián)表中,如果某單元的預(yù)期頻數(shù)很小,采用近似的卡方檢驗(yàn)會(huì)帶來較大的誤差。所以一般要求預(yù)期頻數(shù)大于5.不過對(duì)于預(yù)期頻數(shù)的大小問題,學(xué)者們的意見尚不一致。多數(shù)人同意科庫蘭(Cochran,1945)的意見:即對(duì)自由度大于1的列聯(lián)表,只要預(yù)期頻數(shù)小于5的單元數(shù)不超過總數(shù)的20%,一個(gè)單元的最小預(yù)期頻數(shù)取1是允許的。為了滿足這一要求,可以把相鄰幾行或幾列合并,如果這樣做不至于破壞分類方案的邏輯的話。9.1二維列聯(lián)表的齊性和獨(dú)立性的χ2檢驗(yàn)第18頁,課件共23頁,創(chuàng)作于2023年2月六、2×2列聯(lián)表根據(jù)卡方統(tǒng)計(jì)量的定義可推導(dǎo)出:第二分類準(zhǔn)則第一分類準(zhǔn)則合計(jì)121aba+b2cdc+d合計(jì)a+cb+dn9.1二維列聯(lián)表的齊性和獨(dú)立性的χ2檢驗(yàn)第19頁,課件共23頁,創(chuàng)作于2023年2月七、耶特斯修正對(duì)2×2列聯(lián)表的耶特斯(Yates,1934)“修正”:將觀察頻數(shù)與預(yù)期頻數(shù)之差的絕對(duì)值在取平方之前先減去0.5n。

9.1二維列聯(lián)表的齊性和獨(dú)立性的χ2檢驗(yàn)第20頁,課件共23頁,創(chuàng)作于2023年2月八、齊性與獨(dú)立性X2檢驗(yàn)的區(qū)別盡管二者計(jì)算統(tǒng)計(jì)量的公式形式一樣,但他們是有區(qū)別的:⑴抽樣程序不同;⑵推算預(yù)期頻數(shù)的根據(jù)不同;(3)對(duì)結(jié)果的解釋不同。當(dāng)我們應(yīng)用獨(dú)立性卡方檢驗(yàn)時(shí),典型的抽樣程序是從一個(gè)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論