第六章 卡方檢驗_第1頁
第六章 卡方檢驗_第2頁
第六章 卡方檢驗_第3頁
第六章 卡方檢驗_第4頁
第六章 卡方檢驗_第5頁
已閱讀5頁,還剩40頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第六章卡方檢驗第一頁,共四十五頁,編輯于2023年,星期四6.12統(tǒng)計量與2分布一、2統(tǒng)計量的意義2是度量實際觀察次數(shù)與理論次數(shù)偏離程度的一個統(tǒng)計量,2越小,表明實際觀察次數(shù)與理論次數(shù)越接近;2=0,表示兩者完全吻合;2越大,表示兩者相差越大。第二頁,共四十五頁,編輯于2023年,星期四★現(xiàn)結(jié)合一實例說明2(讀作卡方)

統(tǒng)計量的意義。根據(jù)遺傳學(xué)理論,動物的性別比例是1:1。統(tǒng)計某羊場一年所產(chǎn)的876只羔羊中,有公羔428只,母羔448只。按1:1的性別比例計算,公、母羔均應(yīng)為438只。以O(shè)表示實際觀察次數(shù),E表示理論次數(shù),可將上述情況列成表6-1。

表6-1羔羊性別實際觀察次數(shù)與理論次數(shù)性別實際觀察次數(shù)O理論次數(shù)EO-E(O-E)2/E公428(O1)438(E1)-100.2283母448(O2)438(E2)100.2283合計87687600.4566

第三頁,共四十五頁,編輯于2023年,星期四從表6-1看到,實際觀察次數(shù)與理論次數(shù)存在一定的差異,這里公、母各相差10只。這個差異是屬于抽樣誤差(把對該羊場一年所生羔羊的性別統(tǒng)計當(dāng)作是一次抽樣調(diào)查)、還是羔羊性別比例發(fā)生了實質(zhì)性的變化?要回答這個問題,首先需要確定一個統(tǒng)計量用以表示實際觀察次數(shù)與理論次數(shù)偏離的程度;然后判斷這一偏離程度是否屬于抽樣誤差,即進(jìn)行顯著性檢驗。第四頁,共四十五頁,編輯于2023年,星期四為了度量實際觀察次數(shù)與理論次數(shù)偏離的程度,最簡單的辦法是求出實際觀察次數(shù)與理論次數(shù)的差數(shù)。為了避免正、負(fù)抵消,可將兩個差數(shù)O1-E1、O2-E2平方后再相加,即計算∑(O-E)2,其值越大,實際觀察次數(shù)與理論次數(shù)相差亦越大,反之則越小。但利用∑(O-E)2表示實際觀察次數(shù)與理論次數(shù)的偏離程度尚有不足。未考慮觀察次數(shù)(與理論次數(shù))的大小對偏離程度的影響。為了彌補這一不足,可先將各差數(shù)平方除以相應(yīng)的理論次數(shù)后再相加(轉(zhuǎn)化為相對比值)并記之為,即第五頁,共四十五頁,編輯于2023年,星期四二、2分布

設(shè)有一平均數(shù)為μ、方差為的正態(tài)總體?,F(xiàn)從此總體中獨立隨機抽取n個隨機變量:x1、x2、…、xn,并求出其標(biāo)準(zhǔn)正態(tài)離差:

,,…記這n個相互獨立的標(biāo)準(zhǔn)正態(tài)離差的平方和為:2==它服從自由度為n的2分布,記為~2(n);第六頁,共四十五頁,編輯于2023年,星期四

若用樣本平均數(shù)代替總體平均數(shù)μ,則隨機變量2=服從自由度為n-1的分布,記為~

2分布是由正態(tài)總體隨機抽樣得來的一種連續(xù)型隨機變量的分布。顯然,≥0,即的取值范圍是[0,+∞;分布密度曲線是隨自由度不同而改變的一組曲線。隨自由度的增大,曲線由偏斜漸趨于對稱第七頁,共四十五頁,編輯于2023年,星期四三、2的連續(xù)性矯正

由公式計算的2只是近似地服從連續(xù)型隨機變量2分布。在對次數(shù)資料進(jìn)行2檢驗利用連續(xù)型隨機變量2分布計算概率時,常常偏低,特別是當(dāng)自由度為1時偏差較大。Yates(1934)提出了一個矯正公式,矯正后的2值記為

c2

第八頁,共四十五頁,編輯于2023年,星期四當(dāng)自由度大于1時,

分布與連續(xù)型隨機變量分布相近似,這時,可不作連續(xù)性矯正,但要求各組內(nèi)的理論次數(shù)不小于5。若某組的理論次數(shù)小于5,則應(yīng)把它與其相鄰的一組或幾組合并,直到理論次數(shù)大于5為止。第九頁,共四十五頁,編輯于2023年,星期四6.2適合性檢驗

一、適合性檢驗的意義判斷實際觀察的屬性類別分配是否符合已知屬性類別分配理論或?qū)W說的假設(shè)檢驗稱為適合性檢驗。第十頁,共四十五頁,編輯于2023年,星期四在適合性檢驗中,無效假設(shè)為H0:實際觀察的屬性類別分配符合已知屬性類別分配的理論或?qū)W說;備擇假設(shè)為HA:實際觀察的屬性類別分配不符合已知屬性類別分配的理論或?qū)W說。并在無效假設(shè)成立的條件下,按已知屬性類別分配的理論或?qū)W說計算各屬性類別的理論次數(shù)。適合性檢驗的自由度等于屬性類別分類數(shù)減1。若屬性類別分類數(shù)為k,則適合性檢驗的自由度為k-1。第十一頁,共四十五頁,編輯于2023年,星期四計算出2或2c。將所計算得的2或2c值與根據(jù)自由度k-1查2值表所得的臨界2值:20.05、20.01比較:若2(或2c)<20.05,P>0.05,表明實際觀察次數(shù)與理論次數(shù)差異不顯著,可以認(rèn)為實際觀察的屬性類別分配符合已知屬性類別分配的理論或?qū)W說;若20.05≤2(或2c)<20.01,0.01<P≤0.05,表明實際觀察次數(shù)與理論次數(shù)差異顯著,實際觀察的屬性類別分配不符合已知屬性類別分配的理論或?qū)W說;

第十二頁,共四十五頁,編輯于2023年,星期四二、適合性檢驗的方法下面結(jié)合實例說明?!纠吭谶M(jìn)行山羊群體遺傳檢測時,觀察了260只白色羊與黑色羊雜交的子二代毛色,其中181只為白色,79只為黑色,問此毛色的比率是否符合孟德爾遺傳分離定律的3∶1比例?第十三頁,共四十五頁,編輯于2023年,星期四檢驗步驟如下:(一)提出無效假設(shè)與備擇假設(shè)H0:子二代分離現(xiàn)象符合3∶1的理論比例。HA:子二代分離現(xiàn)象不符合3∶1的理論比例。(二)選擇計算公式

由于本例是涉及到兩組毛色(白色與黑色),屬性類別分類數(shù)k=2,自由度df=k-1=2-1=1,須使用連續(xù)性校正公式來計算。第十四頁,共四十五頁,編輯于2023年,星期四(三)計算理論次數(shù)根據(jù)理論比率3∶1求理論次數(shù):白色理論次數(shù):E1=260×3/4=195黑色理論次數(shù):E2=260×1/4=65第十五頁,共四十五頁,編輯于2023年,星期四(四)計算表6—22c計算表性狀實際觀察次數(shù)(O)理論次數(shù)(E)O-E白色181195-140.935黑色7965+142.804總和26026003.739

2c第十六頁,共四十五頁,編輯于2023年,星期四(五)查臨界2值,作出統(tǒng)計推斷當(dāng)自由度df=1時,查得20.05(1)

=3.84,計算的2c<20.05(1),故P>0.05,不能否定H0,表明實際觀察次數(shù)與理論次數(shù)差異不顯著,可以認(rèn)為白色羊與黑色羊的比率符合孟德爾遺傳分離定律3∶1的理論比例。第十七頁,共四十五頁,編輯于2023年,星期四【例】在研究牛的毛色和角的有無兩對相對性狀分離現(xiàn)象時,用黑色無角牛和紅色有角牛雜交,子二代出現(xiàn)黑色無角牛192頭,黑色有角牛78頭,紅色無角牛72頭,紅色有角牛18頭,共360頭。試問這兩對性狀是否符合孟德爾遺傳規(guī)律中9∶3∶3∶1的遺傳比例?第十八頁,共四十五頁,編輯于2023年,星期四檢驗步驟:(一)提出無效假設(shè)與備擇假設(shè)

H0:實際觀察次數(shù)之比符合9∶3∶3∶1的理論比例。

HA:實際觀察次數(shù)之比不符合9∶3∶3∶1的分離理論比例。(二)選擇計算公式由于本例的屬性類別分類數(shù)k=4:自由度df=k-1=4-1=3>1,計算2。第十九頁,共四十五頁,編輯于2023年,星期四(三)計算理論次數(shù)依據(jù)各理論比率9:3:3:1計算理論次數(shù):黑色無角牛的理論次數(shù)E1:360×9/16=202.5;黑色有角牛的理論次數(shù)E2:360×3/16=67.5;紅色無角牛的理論次數(shù)E3:360×3/16=67.5;紅色有角牛的理論次數(shù)E4:360×1/16=22.5。第二十頁,共四十五頁,編輯于2023年,星期四(四)列表計算2表6—3

計算表類型實際觀察次數(shù)O理論次數(shù)EO-E(O-E)2/E黑色無角牛192(O1)202.5(E1)-10.50.5444黑色有角牛78(O2)67.5(E2)+10.51.6333紅色無角牛72(O3)67.5(E3)+4.51.6333紅色有角牛18(O4)22.5(E4)-4.50.9000總計36036004.711第二十一頁,共四十五頁,編輯于2023年,星期四(五)查臨界值,作出統(tǒng)計推斷當(dāng)df=3時,20.05(3)=7.815,因2<20.05(3),P>0.05,不能否定H0,表明實際觀察次數(shù)與理論次數(shù)差異不顯著,可以認(rèn)為毛色與角的有無兩對性狀雜交二代的分離現(xiàn)象符合孟德爾遺傳規(guī)律中9∶3∶3∶1的遺傳比例。第二十二頁,共四十五頁,編輯于2023年,星期四6.3

獨立性檢驗一、獨立性檢驗的意義對次數(shù)資料,除進(jìn)行適合性檢驗外,有時需要分析兩類因子是相互獨立還是彼此相關(guān)。這種根據(jù)次數(shù)資料判斷兩類因子彼此相關(guān)或相互獨立的假設(shè)檢驗就是獨立性檢驗。獨立性檢驗實際上是基于次數(shù)資料對子因子間相關(guān)性的研究。第二十三頁,共四十五頁,編輯于2023年,星期四如研究兩類藥物對家畜某種疾病治療效果的好壞,先將病畜分為兩組,一組用第一種藥物治療,另一組用第二種藥物治療,然后統(tǒng)計每種藥物的治愈頭數(shù)和未治愈頭數(shù)。這時需要分析藥物種類與療效是否相關(guān),若兩者彼此相關(guān),表明療效因藥物不同而異,即兩種藥物療效不相同;若兩者相互獨立,表明兩種藥物療效相同。第二十四頁,共四十五頁,編輯于2023年,星期四(一)獨立性檢驗的次數(shù)資料是按兩因子屬性類別進(jìn)行歸組。根據(jù)兩因子屬性類別數(shù)的不同而構(gòu)成2×2、2×c、r×c列聯(lián)表(r為行因子的屬性類別數(shù),c為列因子的屬性類別數(shù))。而適合性檢驗只按某一因子的屬性類別將如性別、表現(xiàn)型等次數(shù)資料歸組。(二)適合性檢驗按已知的屬性分類理論或?qū)W說計算理論次數(shù)。獨立性檢驗在計算理論次數(shù)時沒有現(xiàn)成的理論或?qū)W說可資利用,理論次數(shù)是在兩因子相互獨立的假設(shè)下進(jìn)行計算。第二十五頁,共四十五頁,編輯于2023年,星期四(三)在適合性檢驗中確定自由度時,只有一個約束條件:各理論次數(shù)之和等于各實際次數(shù)之和,自由度為屬性類別數(shù)減1。而在r×c列聯(lián)表的獨立性檢驗中,共有rc個理論次數(shù),但受到以下條件的約束:1、rc個理論次數(shù)的總和等于rc個實際次數(shù)的總和;2、r個橫行中的每一個橫行理論次數(shù)總和等于該行實際次數(shù)的總和。而獨立的行約束條件只有r-1個;3、類似地,獨立的列約束條件有c-1個。因而在進(jìn)行獨立性檢驗時,自由度為rc-1-(r-1)-(c-1)=(r-1)(c-1),即等于(橫行屬性類別數(shù)-1)×(直列屬性類別數(shù)-1)。第二十六頁,共四十五頁,編輯于2023年,星期四二、獨立性檢驗的方法(一)2×2列聯(lián)表的獨立性檢驗

2×2列聯(lián)表的一般形式如表6—10所示,其自由度df=(

C-1)(r-1)=(2-1)(2-1)=1,在進(jìn)行2檢驗時,需作連續(xù)性矯正,應(yīng)計算值2c

。表6—102×2列聯(lián)表的一般形式12行總合1O11(E11)O12(E12)R1=O11+O122O21(E21)O22(E22)R2=O21+O22列總合T.C1=O11+O21C2=O12+O22T=O11+O12+O21+O22其中Oij為實際觀察次數(shù),Eij為理論次數(shù)。第二十七頁,共四十五頁,編輯于2023年,星期四【例】某豬場用80頭豬檢驗?zāi)撤N疫苗是否有預(yù)防效果。結(jié)果是注射疫苗的44頭中有12頭發(fā)病,32頭未發(fā)??;未注射的36頭中有22頭發(fā)病,14頭未發(fā)病,問該疫苗是否有預(yù)防效果?第二十八頁,共四十五頁,編輯于2023年,星期四1、先將資料整理成列聯(lián)表(見表6—11)表6—112×2列聯(lián)表發(fā)病未發(fā)病行總和發(fā)病率注射12(18.7)32(25.3)R1:4427.3%未注射22(15.3)14(20.7)R2:3661.1%列總和C1:34C2:46T:802、提出無效假設(shè)與備擇假設(shè)H0:發(fā)病與否和注射疫苗無關(guān),即二因子相互獨立。HA:發(fā)病與否和注射疫苗有關(guān),即二因子彼此相關(guān)。第二十九頁,共四十五頁,編輯于2023年,星期四3、計算理論次數(shù)根據(jù)二因子相互獨立的假設(shè),由樣本數(shù)據(jù)計算出各個理論次數(shù)。二因子相互獨立,就是說注射疫苗與否不影響發(fā)病率。也就是說注射組與未注射組的理論發(fā)病率應(yīng)當(dāng)相同,均應(yīng)等于總發(fā)病率34/80=0.425。依此計算出各個理論次數(shù)如下:注射組的理論發(fā)病數(shù):E11=44×34/80=18.7注射組的理論未發(fā)病數(shù):E12=44×46/80=25.3,未注射組的理論發(fā)病數(shù):E21=36×34/80=15.3未注射組的理論未發(fā)病數(shù):E22=36×46/80=20.7?!锉?-11括號內(nèi)的數(shù)據(jù)為相應(yīng)的理論次數(shù)。第三十頁,共四十五頁,編輯于2023年,星期四4、計算2c值將表6-11中的實際次數(shù)、理論次數(shù)代入公式得:+

第三十一頁,共四十五頁,編輯于2023年,星期四5、由自由度df=1查臨界2值,作出統(tǒng)計推斷因為20.01(1)=6.63,而2c=7.944>20.01(1),P<0.01,否定H0,接受HA,表明發(fā)病率與是否注射疫苗極顯著相關(guān),這里表現(xiàn)為注射組發(fā)病率極顯著低于未注射組,說明該疫苗是有預(yù)防效果的。第三十二頁,共四十五頁,編輯于2023年,星期四在進(jìn)行22列聯(lián)表獨立性檢驗時,還可利用下述簡化公式計算:

在簡化公式中,不需要先計算理論次數(shù),直接利用實際觀察次數(shù)Oij,行、列總和Ri、Cj和總總和T進(jìn)行計算,比利用公式計算簡便,且舍入誤差小。第三十三頁,共四十五頁,編輯于2023年,星期四(二)2×c列聯(lián)表的獨立性檢驗

2×c列聯(lián)表是行因子的屬性類別數(shù)為2,列因子的屬性類別數(shù)為c(c3)的列聯(lián)表。其自由度df=(2-1)(c-1),因為c3,所以自由度大于2,在進(jìn)行2檢驗時,不需作連續(xù)性矯正。2×c表的一般形式見表6—12。表6—122×c聯(lián)列表一般形式12…c行總和1O11O12…O1cR12O21O22…O2cR2列總和

C1C2…總總和T其中Oij(i=1,2;j=1,2,…,c)為實際觀察次數(shù)。第三十四頁,共四十五頁,編輯于2023年,星期四【例】在甲、乙兩地進(jìn)行水牛體型調(diào)查,將體型按優(yōu)、良、中、劣四個等級分類,其結(jié)果見表6—13,問兩地水牛體型構(gòu)成比是否相同。表6—13兩地水牛體型分類統(tǒng)計優(yōu)良中劣行總和Ti.甲10(13.3)10(10.0)60(53.3)10(13.4)90乙10(6.7)5(5.0)20(26.7)10(6.6)45列總和T.j20158020135這是一個2×4列聯(lián)表獨立性檢驗的問題。

第三十五頁,共四十五頁,編輯于2023年,星期四檢驗步驟如下:1.提出無效假設(shè)與備擇假設(shè)

H0:水牛體型構(gòu)成比與地區(qū)無關(guān),即兩地水牛體型構(gòu)成比相同。

HA:水牛體型構(gòu)成比與地區(qū)有關(guān),即兩地水牛體型構(gòu)成比不同。第三十六頁,共四十五頁,編輯于2023年,星期四2.計算各個理論次數(shù),并填在各觀察次數(shù)后的括號中計算方法與2×2表類似,即根據(jù)兩地水牛體型構(gòu)成比相同的假設(shè)計算。如優(yōu)等組中,甲地、乙地的理論次數(shù)按理論比率20/135計算;良等組中甲地、乙地的理論次數(shù)按理論比率15/135計算;中等、劣等組中甲地、乙地的理論次數(shù)分別按理論比率80/135和20/135計算。甲地優(yōu)等組理論次數(shù):E11=90×20/135=13.3,乙地優(yōu)等組理論次數(shù):E21=45×20/135=6.7;其余各個理論次數(shù)的計算類似。第三十七頁,共四十五頁,編輯于2023年,星期四

3.計算計算2值4.由自由度df=(2-1)*(4-1)=3查臨界2值,作出統(tǒng)計推斷因為20..05(3)=7.815,而2=7.582<20..05(3),p>0.05,不能否定H0,可以認(rèn)為甲、乙兩地水牛體型構(gòu)成比相同。第三十八頁,共四十五頁,編輯于2023年,星期四在進(jìn)行2×c列聯(lián)表獨立性檢驗時,還可利用下述簡化公式計算2:

前后兩式的區(qū)別在于:前式利用第一行中的實際觀察次數(shù)A1j和行總和T1.;后式利用第二行中的實際觀察次數(shù)A2j和行總和T2.,計算結(jié)果相同。

第三十九頁,共四十五頁,編輯于2023年,星期四(三)r×c列聯(lián)表的獨立性檢驗

r×c表是指行因子的屬性類別數(shù)為r(r>2),列因子的屬性類別數(shù)為c(c>2)的列聯(lián)表。其一般形式見表7-17。表6—17r×c列聯(lián)表的一般形式12…c行總和1O11O12…O1cR12O21O22…O2cR2rOr1Or2…OrcRr列總和C1C2…CcT其中Oiji=1,2,…r;j=1,2,…c)為實際觀察次數(shù)。第四十頁,共四十五頁,編輯于2023年,星期四r×c列聯(lián)表各個理論次數(shù)的計算方法與上述(2×2)、(2×c)表適合性檢驗類似。但一般用簡化公式計算2值,其公式為:

第四十一頁,共四十五頁,編輯于2023年,星期四【例】對三組奶牛(每組39頭)分別喂給不同的飼料,各組發(fā)病次數(shù)統(tǒng)計如下表,問發(fā)病次數(shù)的構(gòu)成比與所喂飼料是否有關(guān)?表6—18三組牛的發(fā)病次數(shù)資料發(fā)病次數(shù)飼料總和12

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論