版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
胡雪梅QQ:182048520E-mail:huxuem@163.com
第六章分類數(shù)據(jù)的關(guān)聯(lián)性檢驗(yàn)
數(shù)學(xué)與統(tǒng)計(jì)學(xué)院本章內(nèi)容 列聯(lián)表和檢驗(yàn)數(shù)據(jù)轉(zhuǎn)化:A:A1,A2,…,ArB:B1,B2,…,Bs希望判斷A與B是否獨(dú)立?→獨(dú)立性檢驗(yàn)
假設(shè)檢驗(yàn)問題:當(dāng)取大值,或者p-值很小的時(shí)候,拒絕零假設(shè)。構(gòu)造卡方統(tǒng)計(jì)量:例6.1295例6.1>x<-c(98,67,13,18,38,41,8,12,289,262,57,30)>A<-matrix(x,4,3)>A[,1][,2][,3][1,]9838289[2,]6741262[3,]13857[4,]181230>chisq.test(A) Pearson'schi-squaretestdata:AX-square=15.0734,df=6,p-value=0.0197結(jié)論:拒絕H0,即血型與肝病有一定聯(lián)系。練習(xí):一個(gè)市場(chǎng)調(diào)查公司想知道某城市成年人駕駛的汽車式樣與其居住地之間是否存在某種聯(lián)系。抽取了500名成年駕駛者進(jìn)行調(diào)查,其資料如下表所示:500名汽車駕駛者的調(diào)查數(shù)據(jù)居住區(qū)汽車式樣合計(jì)ABC152(45.36)64(52.64)24(42)140260(55.4)59(64.3)52(51.3)171350(61.24)65(71.06)74(56.7)189合計(jì)162188150500解:建立假設(shè)組:Ho:成年人所駕駛的汽車式樣與他們的居住區(qū)之間彼此獨(dú)立;H1:兩種分類彼此不獨(dú)立。設(shè)顯著性水平a為0.05。計(jì)算檢驗(yàn)統(tǒng)計(jì)量:齊性檢驗(yàn)假設(shè)檢驗(yàn)問題:齊性檢驗(yàn)
構(gòu)造統(tǒng)計(jì)量:在零假設(shè)下近似有:檢驗(yàn)方法和獨(dú)立性檢驗(yàn)相同。例6.2例如,對(duì)體育類節(jié)目,不同年齡階段的人關(guān)注率是否一樣?解答>y<-c(83,91,41,70,86,38,45,15,10)>B<-matrix(y,3,3)>B[,1][,2][,3][1,]837045[2,]918615[3,]413810>chisq.test(B) Pearson'schi-squaretestwithoutYates'continuitycorrectiondata:BX-square=18.6508,df=4,p-value=0.0009Fisher精確檢驗(yàn)
n..n.1總和n2.n1.n12總和2*2列聯(lián)表在A、B獨(dú)立時(shí):n22n.2
n11n21獨(dú)立性檢驗(yàn)一般要求n11≥5,若不能達(dá)到,則精度受到影響.Fisher精確檢驗(yàn)
例如,假定已知行總數(shù)為5,3,列總數(shù)為5,3,則n11的所有可能取值為2,3,4,5.330322141125003535323450.17860.53570.26780.0179檢驗(yàn)考慮統(tǒng)計(jì)量,拒絕域?yàn)?當(dāng)大樣本時(shí),可以采用近似正態(tài)分布進(jìn)行檢驗(yàn),即:例6.3例6.3>x<-matrix(c(8,14,2,18),2,2)>x[,1][,2][1,]82[2,]1418>fisher.test(x) Fisher'sexacttestdata:xp-value=0.0709alternativehypothesis:two.sided例6.3>chisq.test(x)Warningmessages:Expectedcounts<5.Chi-squareapproximationmaynotbeappropriate.in:chisq.test(x) Pearson'schi-squaretestwithYates'continuitycorrectiondata:xX-square=2.6921,df=1,p-value=0.1008說明卡方檢驗(yàn)與Fisher檢驗(yàn)有區(qū)別。Ridit檢驗(yàn)解決問題:處理之間進(jìn)行強(qiáng)弱比較。例如,客戶對(duì)某種產(chǎn)品或服務(wù)進(jìn)行綜合評(píng)價(jià):非常滿意,滿意,比較滿意,不滿意,很不滿意。一般對(duì)滿意程度采用的辦法是打分:5,4,3,2,1。1)只能測(cè)量到順序級(jí)別的數(shù)據(jù);2)數(shù)據(jù)量的關(guān)系可能與客觀實(shí)際不符合。Ridit檢驗(yàn)?zāi)畴娦殴菊{(diào)查某款便攜式手機(jī)的售后服務(wù)滿意度,統(tǒng)計(jì)數(shù)據(jù)如下:?jiǎn)栱?xiàng)總數(shù)非常不滿意不滿意一般滿意很滿意1.信號(hào)20090235321132.外形1324734281853.維修質(zhì)量50201310524.功能15428323345165.操作是否方便1643428524010總計(jì)70021913017612946分析各問項(xiàng)與滿意度之間的關(guān)系。Ridit檢驗(yàn)行向量A表示不同比較組,列向量B為順序尺度變量,假設(shè),表示對(duì)應(yīng)格子的相應(yīng)頻數(shù)。假設(shè)檢驗(yàn)問題:B1B2……Bs總和A1O11O12O1sO1.A2O21O22O2sO2.…………ArOr1Or2OrsOr.總和O.1O.2……O.sO..Ridit檢驗(yàn)pij是第i個(gè)處理第j個(gè)順序類的聯(lián)合概率,p.j是第j個(gè)順序類的邊緣概率。B1B2……Bs總和A1p11p12p1sp1.A2p21p22p2sp2.…………Arpr1pr2prspr.總和p.1p.2……p.sp..Ridit得分定義Ridit得分定義如下(累積概率得分):其中在實(shí)際計(jì)算中用樣本估計(jì)。計(jì)算步驟檢驗(yàn)仿照Kruskal-Wallis統(tǒng)計(jì)量的構(gòu)造:檢驗(yàn)根據(jù)計(jì)算的R構(gòu)造檢驗(yàn)統(tǒng)計(jì)量:當(dāng)大樣本時(shí),T值接近于1,從而檢驗(yàn)統(tǒng)計(jì)量簡(jiǎn)化為:在零假設(shè)情況下,W近似服從分布,當(dāng)W過大或者過小的時(shí)候,都考慮拒絕零假設(shè)。檢驗(yàn)求置信區(qū)間:Rj在大樣本的情況下服從正態(tài)分布,則95%的置信區(qū)間為:所以,得到近似公式如果RiditR與RiditRj的置信區(qū)間沒有重疊,則說明兩組之間存在顯著差別。例6.4用頭針治療癱瘓800例的療效分析,不同病因的療效可以不一樣。究竟哪一種療效最佳?統(tǒng)計(jì)數(shù)據(jù)如下:組別總數(shù)基本痊愈顯效有效無效惡化死亡1.腦血栓形成及后遺癥2.腦出血及后遺癥3.腦栓塞及后遺癥4.顱內(nèi)損失及后遺癥5.急性感染性多發(fā)神經(jīng)炎6.脊髓疾病5101388254106200320441123382412231628330333024138512100000010000總病例數(shù)8002322023115311例6.4等級(jí)(1)(2)(3)(4)(5)(6)1.基本痊愈2.顯效3.有效4.無效5.惡化6.死亡2322023115311116101155.50232434745798799116333589.5771.5798.5799.50.1450.4160.7370.9640.9980.99933.6484.302229.20751.0920.9980.999合計(jì)800800400列表計(jì)算:累積概率得分例6.4組別總數(shù)基本痊愈顯效有效無效惡化死亡1.腦血栓形成及后遺癥
Ri5102000.1451230.4161620.737240.96410.99800.999合計(jì)223.6962951.168119.423.1360.9980計(jì)算第一種情況的得分。解答同理可計(jì)算:因?yàn)橹眯艆^(qū)間[0.414,0.466]與[0.48,0.52]不相交,所以拒絕H0。認(rèn)為各種療效有區(qū)別.各組再進(jìn)行比較。R程序輸入數(shù)據(jù)矩陣A=[,1][,2][,3][,4][,5][,6][1,]2001231622410[2,]338831301[3,]202430800[4,]41233500[5,]423100[6,]130200>rA<-rowSums(A)計(jì)算行和>cA<-colSums(A)計(jì)算列和>R<-sum(rA)總樣本數(shù)>R[1]800R程序2)計(jì)算Ridit得分向量>R1<-rep(0,6)>for(jin1:6){R1[j]<-(sum(cA[1:j-1])+0.5*cA[j])/R}>R1[1]0.1450000.4162500.7368750.9643750.9981250.999375R程序3)計(jì)算置信區(qū)間>r<-rep(0,6)>for(iin1:6){r[i]<-sum(A[i,]*R1)/sum(A[i,])}r=0.4386581,0.6590534,0.5208689,0.6428472,0.4587500,0.5537500>d<-rep(0,6)>for(iin1:6){d[i]<-1/sqrt(3*rA[i])}d=0.0255655,0.04914732,0.06
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度木材采伐:鏈鋸租賃及操作安全合同3篇
- 2024版半包裝修合同樣本:養(yǎng)老院設(shè)施改造與裝修合同2篇
- 2024版屋頂花園瓷磚鋪設(shè)工程合同2篇
- 2024年度電力系統(tǒng)升壓站土建工程合同
- 2024年度電腦定制化硬件維修與保養(yǎng)服務(wù)合同范本3篇
- 2024年外債借款合同展期與匯率風(fēng)險(xiǎn)對(duì)沖協(xié)議范本3篇
- 2024年度三人合伙投資石油化工公司合同2篇
- 2024年度招投標(biāo)宣傳推廣合同3篇
- 2024年度車棚景觀設(shè)計(jì)施工與維護(hù)合同范本2篇
- 2024塔吊租賃及安全防護(hù)設(shè)備配套合同模板2篇
- 肛瘺LIFT術(shù)式介紹
- 通過《古文觀止》選讀了解古代文學(xué)的社會(huì)功能與價(jià)值
- 語言本能:人類語言進(jìn)化的奧秘
- 職業(yè)生涯規(guī)劃(圖文)課件
- 2024版國開電大??啤禘XCEL在財(cái)務(wù)中的應(yīng)用》在線形考(形考作業(yè)一至四)試題及答案
- 能源管理系統(tǒng)平臺(tái)軟件數(shù)據(jù)庫設(shè)計(jì)說明書
- 中外園林史第七章-中國近現(xiàn)代園林發(fā)展
- 醫(yī)院培訓(xùn)課件:《ICU常見監(jiān)測(cè)技術(shù)及護(hù)理》
- 2023年秋季國家開放大學(xué)-01467-土木工程力學(xué)(本)期末考試題帶答案
- 崴腳護(hù)理課件教程
- 冬至知識(shí)競(jìng)賽選擇題
評(píng)論
0/150
提交評(píng)論