卡方檢驗(yàn)1課件學(xué)習(xí)資料_第1頁(yè)
卡方檢驗(yàn)1課件學(xué)習(xí)資料_第2頁(yè)
卡方檢驗(yàn)1課件學(xué)習(xí)資料_第3頁(yè)
卡方檢驗(yàn)1課件學(xué)習(xí)資料_第4頁(yè)
卡方檢驗(yàn)1課件學(xué)習(xí)資料_第5頁(yè)
已閱讀5頁(yè),還剩33頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第九章χ2

檢驗(yàn)(1)

chi-squaretest1學(xué)習(xí)目標(biāo)1.掌握χ2檢驗(yàn)的主要用途;2.熟悉χ2檢驗(yàn)的基本思想;3.熟悉χ2檢驗(yàn)分布和擬合優(yōu)度檢驗(yàn);4.掌握獨(dú)立樣本2х2資料χ2檢驗(yàn)專用公式、校正公式條件2χ2檢驗(yàn)的主要用途x2檢驗(yàn)(chi-squaretest)是以x2分布為理論依據(jù),用途頗廣的假設(shè)檢驗(yàn)方法。可用于:兩個(gè)或多個(gè)樣本率的比較;兩個(gè)或多個(gè)樣本構(gòu)成比的比較;兩個(gè)分類變量間關(guān)聯(lián)性的檢驗(yàn);有序分組資料的線性趨勢(shì)檢驗(yàn);頻數(shù)分布的擬合優(yōu)度檢驗(yàn)。3一、檢驗(yàn)的基本思想分布的概念檢驗(yàn)的基本思想

P

值的確定檢驗(yàn)的基本檢驗(yàn)步驟4

分布的拓展與應(yīng)用

1875年,F(xiàn).Helmet得出:來(lái)自正態(tài)總體的樣本方差的分布服從分布;1900年K.Pearson又從檢驗(yàn)分布的擬合優(yōu)度(goodnessoffit)中也發(fā)現(xiàn)了這一相同的分布,可用于檢驗(yàn)資料的實(shí)際頻數(shù)和理論頻數(shù)是否相符等問(wèn)題??ǚ綑z驗(yàn)基本思想分布的概念6

分布的密度函數(shù)7卡方檢驗(yàn)基本思想分布的概念

分布曲線8卡方檢驗(yàn)基本思想分布的概念分布曲線9

分布的形狀依賴于自由度ν的大?。孩佼?dāng)自由度ν≤2時(shí),曲線呈“L”型;②隨著ν的增加,曲線逐漸趨于對(duì)稱;③當(dāng)自由度ν→∞時(shí),曲線逼近于正態(tài)曲線。

④當(dāng)ν=1時(shí),分布與標(biāo)準(zhǔn)正態(tài)分布(Z分布)一致。卡方檢驗(yàn)基本思想分布的概念分布特點(diǎn)102.檢驗(yàn)的基本思想(以兩個(gè)樣本率的比較為例)例9-2將病情相似的169名消化道潰瘍患者隨機(jī)分成兩組,分別用洛賽克和雷尼替丁治療,4周后療效見(jiàn)下表。問(wèn)兩種藥物治療消化道潰瘍的愈合率有無(wú)差別?卡方檢驗(yàn)基本思想11四格表(Fourfoldtable)在上例中,的數(shù)據(jù)是基本的,其余數(shù)據(jù)都是由以上四個(gè)數(shù)據(jù)計(jì)算出來(lái)的。這四個(gè)數(shù)叫實(shí)際頻數(shù),簡(jiǎn)稱實(shí)際數(shù)(actualfreqency,A)6421513312

對(duì)于洛賽克組的64人,按照合并愈合率Pc=68.05%治療的話,理論上:64×68.05%=57.84人愈合,用T11表示,未愈合:T12=85-57.84=27.16對(duì)于雷尼替丁組:愈合:T21=115-57.84=57.16未愈合:T22=54-27.16=26.84理論頻數(shù)(theoreticalfreqency,T)Tij表示第i行第j列的理論數(shù)。計(jì)算公式為:

ni表示i行的合計(jì)數(shù)mj表示j列的合計(jì)數(shù)13經(jīng)推導(dǎo):

★實(shí)際數(shù)與理論數(shù)的差別等價(jià)于兩樣本率的差別,因此,★對(duì)實(shí)際數(shù)與理論數(shù)差值的假設(shè)檢驗(yàn)等價(jià)于對(duì)兩樣本率差值的假設(shè)檢驗(yàn)1415由χ2的計(jì)算可見(jiàn),χ2檢驗(yàn)的基本思想是:Χ2值反映了實(shí)際數(shù)與理論數(shù)相吻合的程度。如果檢驗(yàn)假設(shè)H0成立,則A=T,現(xiàn)A≠T可能原因(1)抽樣誤差造成(2)來(lái)自不同總體若為(1),則A與T差別不會(huì)很大,出現(xiàn)大的Χ2值的可能性很小,當(dāng)p≤α,就懷疑假設(shè)H0,因而拒絕;反之,當(dāng)

p>α,則無(wú)理由拒絕。16分類資料χ2檢驗(yàn)的自由度問(wèn)題:對(duì)于χ2值,不可能出現(xiàn)負(fù)值,χ2值的大小會(huì)隨著格子數(shù)的增加而增大,因此應(yīng)當(dāng)消除格子數(shù)不同對(duì)χ2值的影響。

在周邊合計(jì)固定不變的情況下,可以自由取值的格子數(shù)。υ=(行數(shù)-1)(列數(shù)-1)本例中四格表的自由度為υ=(2-1)(2-1)=1

17

分布的分位數(shù)(Percentile)當(dāng)ν確定后,分布曲線下右側(cè)尾部的面積為

時(shí),橫軸上相應(yīng)的值,記為,如下圖。實(shí)際應(yīng)用時(shí),可根據(jù)ν由界值表(percentagepointsofthedistribution)查得??ǚ綑z驗(yàn)基本思想分布的概念183、查χ2界值表,確定P值,作出結(jié)論

查P482附表8

根據(jù)自由度和事先確定的檢驗(yàn)水準(zhǔn),查得對(duì)應(yīng)的χ2界值。作出判斷結(jié)論,

χ2值越大,概率P越小,P越小越有理由拒絕H0,越有理由認(rèn)為有統(tǒng)計(jì)學(xué)意義。19(1)建立檢驗(yàn)假設(shè)H0:π1=π2兩藥的愈合率相同H1:π1≠π2兩藥愈合率不同檢驗(yàn)水準(zhǔn)

=0.05(2)計(jì)算檢驗(yàn)統(tǒng)計(jì)量20自由度

=(2-1)(2-1)=1(3)確定p值,結(jié)論:查附表8,

=1對(duì)應(yīng)的臨界值,P<0.025。按

=0.05拒絕H0,兩樣本頻率的差別具有統(tǒng)計(jì)學(xué)意義??梢哉J(rèn)為,洛賽克的愈合率高于雷尼替丁的愈合率。21對(duì)于四格表資料,四格表專用公式

22

當(dāng)n≥40時(shí),如果有某個(gè)格子出現(xiàn)1≤T<5,一般需用校正公式23(1)建立檢驗(yàn)假設(shè)H0:π1=π2,兩法總體緩解概率相同H1:π1≠π2兩法總體緩解概率不同檢驗(yàn)水準(zhǔn)

=0.05例9-3將病情相似的淋巴系腫瘤患者隨機(jī)分成兩組,分別做單純化療與復(fù)合化療,兩組的緩解率見(jiàn)表9-4,問(wèn)兩療法的總體緩解率是否不同?24組別屬性合計(jì)緩解率(%)緩解未緩解單純化療2(4.8)10(7.2)12(固定值)16.7復(fù)合化療14(11.2)14(16.8)28(固定值)50.0合計(jì)16244040.0表9-4兩組療法的緩解率比較252)計(jì)算檢驗(yàn)統(tǒng)計(jì)量

=(2-1)(2-1)=13)確定P值:

P>0.1,高于檢驗(yàn)水準(zhǔn)

,不能拒絕H0,差別無(wú)統(tǒng)計(jì)學(xué)意義,尚不能認(rèn)為兩種治療方案的總體緩解概率不同。

26特別注意:

當(dāng)四格表出現(xiàn)T<1或n<40時(shí),校正

2值也不恰當(dāng),這時(shí)必須用四格表的確切概率計(jì)算法。

27

四格表χ2檢驗(yàn)的條件

(1)當(dāng)n≥40且每格T≥5時(shí),用基本公式或四格表專用公式;(2)當(dāng)n≥40但有1≤T<5時(shí),用校正公式;(3)當(dāng)n<40或有T<1時(shí),不能應(yīng)用χ2檢驗(yàn),改用確切概率法。28五、頻數(shù)分布擬合優(yōu)度的檢驗(yàn)由于Pearson值能反映實(shí)際頻數(shù)和理論頻數(shù)的吻合程度,所以檢驗(yàn)可用于推斷頻數(shù)分布的擬合優(yōu)度(goodnessoffit),即推斷某現(xiàn)象頻數(shù)分布是否符合某理論分布,且應(yīng)用廣泛。如正態(tài)分布,二項(xiàng)分布,Poisson分布,負(fù)二項(xiàng)分布等均可應(yīng)用檢驗(yàn)進(jìn)行推斷。

(Testaboutgoodnessoffitforthefrequencydistribution)

29H0:本資料服從×××分布;H1:本資料不服從×××分布;(1)先假設(shè)H0成立,按特定分布的規(guī)律(概率函數(shù))計(jì)算理論頻數(shù),進(jìn)而計(jì)算值。(2)若值小,可認(rèn)為現(xiàn)有資料服從某一分布;若值大,尚不能認(rèn)為現(xiàn)有資料服從某一分布。自由度=K-參數(shù)個(gè)數(shù)-1K:組段數(shù)參數(shù)個(gè)數(shù):正態(tài)分布和二項(xiàng)分布有2個(gè)參數(shù),poisson分布有1個(gè)30例9-1對(duì)數(shù)據(jù)作正態(tài)分布擬合優(yōu)度檢驗(yàn)。120名男孩身高的測(cè)量值,均數(shù)=139.48cm;標(biāo)準(zhǔn)差=7.30cm檢驗(yàn)的假設(shè):H0:總體分布等于均數(shù)為139.48cm,標(biāo)準(zhǔn)差為7.30cm的正態(tài)分布H1:總體分布不等于該正態(tài)分布

=0.0531表9-1120例男孩身高測(cè)量值頻數(shù)分布表及擬合優(yōu)度檢驗(yàn)統(tǒng)計(jì)量的計(jì)算組段(1)實(shí)際頻數(shù)A(2)Φ(X1)(3)Φ(X2)(4)P(X)(5)T=n×P(X)(6)(A—T)2/T(7)122.0―50.008320.032040.024082.89001.54053126.0―80.032400.097040.064637.75570.00769130.0―100.097040.226420.1293915.52631.96698134.0―220.226420.419670.1932523.18980.06104138.0―330.419670.635030.2153625.84331.98188142.0―200.635030.814110.1790821.48980.10328146.0―110.814110.925220.1111113.33310.40827150.0―60.925220.976650.051436,17170.00477154.0―50.976650.994410.017762.13093.86289合計(jì)120————9.9373332

表9-1中第3列、第4列正態(tài)分布函數(shù)值可通過(guò)對(duì)作標(biāo)準(zhǔn)正態(tài)變換后查正態(tài)分布表或利用相應(yīng)的SAS程序得到,第5列為第4列與第3列的差值,第6列理論頻數(shù)T等于總例數(shù)120與各組段概率的乘積,第7列各數(shù)之和即檢驗(yàn)統(tǒng)計(jì)量

2值。

33計(jì)算統(tǒng)計(jì)量:推斷結(jié)論:自由度=10-1-2=7,查附表8,得到P>0.50,可以認(rèn)為該樣本服從正態(tài)分布。

計(jì)算TI時(shí)的參數(shù)有2個(gè)(均數(shù)和標(biāo)準(zhǔn)差)34例調(diào)查者欲觀察某克山病區(qū)克山病患者的空間分布,將該區(qū)劃分為279個(gè)取樣單位,統(tǒng)計(jì)各取樣單位歷年累計(jì)病例數(shù),資料見(jiàn)下表第(1)、(2)欄,問(wèn)此資料是否服從Poisson分布?本例,,均數(shù)與方差相近,可試擬合Poisson分布。

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論