版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
胡雪梅QQ:182048520E-mail:huxuem@163.com
第六章分類數(shù)據(jù)的關(guān)聯(lián)性檢驗
數(shù)學(xué)與統(tǒng)計學(xué)院本章內(nèi)容 列聯(lián)表和檢驗數(shù)據(jù)轉(zhuǎn)化:A:A1,A2,…,ArB:B1,B2,…,Bs希望判斷A與B是否獨立?→獨立性檢驗
假設(shè)檢驗問題:當取大值,或者p-值很小的時候,拒絕零假設(shè)。構(gòu)造卡方統(tǒng)計量:例6.1295例6.1>x<-c(98,67,13,18,38,41,8,12,289,262,57,30)>A<-matrix(x,4,3)>A[,1][,2][,3][1,]9838289[2,]6741262[3,]13857[4,]181230>chisq.test(A) Pearson'schi-squaretestdata:AX-square=15.0734,df=6,p-value=0.0197結(jié)論:拒絕H0,即血型與肝病有一定聯(lián)系。練習(xí):一個市場調(diào)查公司想知道某城市成年人駕駛的汽車式樣與其居住地之間是否存在某種聯(lián)系。抽取了500名成年駕駛者進行調(diào)查,其資料如下表所示:500名汽車駕駛者的調(diào)查數(shù)據(jù)居住區(qū)汽車式樣合計ABC152(45.36)64(52.64)24(42)140260(55.4)59(64.3)52(51.3)171350(61.24)65(71.06)74(56.7)189合計162188150500解:建立假設(shè)組:Ho:成年人所駕駛的汽車式樣與他們的居住區(qū)之間彼此獨立;H1:兩種分類彼此不獨立。設(shè)顯著性水平a為0.05。計算檢驗統(tǒng)計量:齊性檢驗假設(shè)檢驗問題:齊性檢驗
構(gòu)造統(tǒng)計量:在零假設(shè)下近似有:檢驗方法和獨立性檢驗相同。例6.2例如,對體育類節(jié)目,不同年齡階段的人關(guān)注率是否一樣?解答>y<-c(83,91,41,70,86,38,45,15,10)>B<-matrix(y,3,3)>B[,1][,2][,3][1,]837045[2,]918615[3,]413810>chisq.test(B) Pearson'schi-squaretestwithoutYates'continuitycorrectiondata:BX-square=18.6508,df=4,p-value=0.0009Fisher精確檢驗
n..n.1總和n2.n1.n12總和2*2列聯(lián)表在A、B獨立時:n22n.2
n11n21獨立性檢驗一般要求n11≥5,若不能達到,則精度受到影響.Fisher精確檢驗
例如,假定已知行總數(shù)為5,3,列總數(shù)為5,3,則n11的所有可能取值為2,3,4,5.330322141125003535323450.17860.53570.26780.0179檢驗考慮統(tǒng)計量,拒絕域為:當大樣本時,可以采用近似正態(tài)分布進行檢驗,即:例6.3例6.3>x<-matrix(c(8,14,2,18),2,2)>x[,1][,2][1,]82[2,]1418>fisher.test(x) Fisher'sexacttestdata:xp-value=0.0709alternativehypothesis:two.sided例6.3>chisq.test(x)Warningmessages:Expectedcounts<5.Chi-squareapproximationmaynotbeappropriate.in:chisq.test(x) Pearson'schi-squaretestwithYates'continuitycorrectiondata:xX-square=2.6921,df=1,p-value=0.1008說明卡方檢驗與Fisher檢驗有區(qū)別。Ridit檢驗解決問題:處理之間進行強弱比較。例如,客戶對某種產(chǎn)品或服務(wù)進行綜合評價:非常滿意,滿意,比較滿意,不滿意,很不滿意。一般對滿意程度采用的辦法是打分:5,4,3,2,1。1)只能測量到順序級別的數(shù)據(jù);2)數(shù)據(jù)量的關(guān)系可能與客觀實際不符合。Ridit檢驗?zāi)畴娦殴菊{(diào)查某款便攜式手機的售后服務(wù)滿意度,統(tǒng)計數(shù)據(jù)如下:問項總數(shù)非常不滿意不滿意一般滿意很滿意1.信號20090235321132.外形1324734281853.維修質(zhì)量50201310524.功能15428323345165.操作是否方便1643428524010總計70021913017612946分析各問項與滿意度之間的關(guān)系。Ridit檢驗行向量A表示不同比較組,列向量B為順序尺度變量,假設(shè),表示對應(yīng)格子的相應(yīng)頻數(shù)。假設(shè)檢驗問題:B1B2……Bs總和A1O11O12O1sO1.A2O21O22O2sO2.…………ArOr1Or2OrsOr.總和O.1O.2……O.sO..Ridit檢驗pij是第i個處理第j個順序類的聯(lián)合概率,p.j是第j個順序類的邊緣概率。B1B2……Bs總和A1p11p12p1sp1.A2p21p22p2sp2.…………Arpr1pr2prspr.總和p.1p.2……p.sp..Ridit得分定義Ridit得分定義如下(累積概率得分):其中在實際計算中用樣本估計。計算步驟檢驗仿照Kruskal-Wallis統(tǒng)計量的構(gòu)造:檢驗根據(jù)計算的R構(gòu)造檢驗統(tǒng)計量:當大樣本時,T值接近于1,從而檢驗統(tǒng)計量簡化為:在零假設(shè)情況下,W近似服從分布,當W過大或者過小的時候,都考慮拒絕零假設(shè)。檢驗求置信區(qū)間:Rj在大樣本的情況下服從正態(tài)分布,則95%的置信區(qū)間為:所以,得到近似公式如果RiditR與RiditRj的置信區(qū)間沒有重疊,則說明兩組之間存在顯著差別。例6.4用頭針治療癱瘓800例的療效分析,不同病因的療效可以不一樣。究竟哪一種療效最佳?統(tǒng)計數(shù)據(jù)如下:組別總數(shù)基本痊愈顯效有效無效惡化死亡1.腦血栓形成及后遺癥2.腦出血及后遺癥3.腦栓塞及后遺癥4.顱內(nèi)損失及后遺癥5.急性感染性多發(fā)神經(jīng)炎6.脊髓疾病5101388254106200320441123382412231628330333024138512100000010000總病例數(shù)8002322023115311例6.4等級(1)(2)(3)(4)(5)(6)1.基本痊愈2.顯效3.有效4.無效5.惡化6.死亡2322023115311116101155.50232434745798799116333589.5771.5798.5799.50.1450.4160.7370.9640.9980.99933.6484.302229.20751.0920.9980.999合計800800400列表計算:累積概率得分例6.4組別總數(shù)基本痊愈顯效有效無效惡化死亡1.腦血栓形成及后遺癥
Ri5102000.1451230.4161620.737240.96410.99800.999合計223.6962951.168119.423.1360.9980計算第一種情況的得分。解答同理可計算:因為置信區(qū)間[0.414,0.466]與[0.48,0.52]不相交,所以拒絕H0。認為各種療效有區(qū)別.各組再進行比較。R程序輸入數(shù)據(jù)矩陣A=[,1][,2][,3][,4][,5][,6][1,]2001231622410[2,]338831301[3,]202430800[4,]41233500[5,]423100[6,]130200>rA<-rowSums(A)計算行和>cA<-colSums(A)計算列和>R<-sum(rA)總樣本數(shù)>R[1]800R程序2)計算Ridit得分向量>R1<-rep(0,6)>for(jin1:6){R1[j]<-(sum(cA[1:j-1])+0.5*cA[j])/R}>R1[1]0.1450000.4162500.7368750.9643750.9981250.999375R程序3)計算置信區(qū)間>r<-rep(0,6)>for(iin1:6){r[i]<-sum(A[i,]*R1)/sum(A[i,])}r=0.4386581,0.6590534,0.5208689,0.6428472,0.4587500,0.5537500>d<-rep(0,6)>for(iin1:6){d[i]<-1/sqrt(3*rA[i])}d=0.0255655,0.04914732,0.06
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 我和我的父輩觀后感(15篇)
- 徐工研究院安全培訓(xùn)
- 達格列凈片聯(lián)合麝香保心丸治療射血分數(shù)降低心衰急性發(fā)作期的臨床觀察
- 年會普通員工獲獎感言范文(10篇)
- 中國工業(yè)機器人減速器行業(yè)市場集中度、企業(yè)競爭格局分析報告-智研咨詢發(fā)布
- 二零二五年度公共安全產(chǎn)品投標委托合同3篇
- 二零二五年度個人向文化企業(yè)貸款協(xié)議模板2篇
- BDS-GNSS實時精密星歷完好性監(jiān)測方法研究
- 老年骨質(zhì)疏松性椎體壓縮骨折非手術(shù)治療進展
- 二零二五年度新型門窗安裝與市場推廣合作協(xié)議3篇
- 小學(xué)六年級數(shù)學(xué)上冊《簡便計算》練習(xí)題(310題-附答案)
- 培訓(xùn)如何上好一堂課
- 高教版2023年中職教科書《語文》(基礎(chǔ)模塊)下冊教案全冊
- 2024醫(yī)療銷售年度計劃
- 稅務(wù)局個人所得稅綜合所得匯算清繳
- 人教版語文1-6年級古詩詞
- 上學(xué)期高二期末語文試卷(含答案)
- 人教版英語七年級上冊閱讀理解專項訓(xùn)練16篇(含答案)
- 死亡病例討論模板
- 宜城安達特種水泥有限公司雙寨子礦區(qū)鋁土礦礦產(chǎn)資源開發(fā)利用與生態(tài)復(fù)綠方案
- 面向機器人柔順操作的力位精準控制方法
評論
0/150
提交評論