生物統(tǒng)計(jì)學(xué)—卡方檢驗(yàn).ppt_第1頁(yè)
生物統(tǒng)計(jì)學(xué)—卡方檢驗(yàn).ppt_第2頁(yè)
生物統(tǒng)計(jì)學(xué)—卡方檢驗(yàn).ppt_第3頁(yè)
生物統(tǒng)計(jì)學(xué)—卡方檢驗(yàn).ppt_第4頁(yè)
生物統(tǒng)計(jì)學(xué)—卡方檢驗(yàn).ppt_第5頁(yè)
已閱讀5頁(yè),還剩26頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、b,1,第五章 卡方檢驗(yàn),應(yīng)用統(tǒng)計(jì)學(xué),b,2,卡方 (c2) 分布,設(shè)總體服從正態(tài)分布N (, 2 ), X1,X2,Xn為來自該正態(tài)總體的樣本,則樣本方差 s2 的分布為,將2(n 1)稱為自由度為(n-1)的卡方分布,主要適用于對(duì)擬合優(yōu)度檢驗(yàn)和獨(dú)立性檢驗(yàn),以及對(duì)總體方差的估計(jì)和檢驗(yàn)等,b,3,卡方 (c2) 分布,b,4,卡方 (c2) 分布的特點(diǎn),不同容量樣本的抽樣分布,c2,1、 2分布是一個(gè)以自由度n為參數(shù)的分布族,自由度n決定了分布的形狀,對(duì)于不同的n有不同的卡方分布 2、卡方分布于區(qū)間0, ),是一種非對(duì)稱分布。一般為正偏分布,3、卡方分布的偏斜度隨自由度降低而增大,當(dāng)自由度為1

2、時(shí),曲線以縱軸為漸近線;當(dāng)自由度增大的時(shí),分布曲線漸趨近左右對(duì)稱,當(dāng)自由度大于等于30的時(shí)候,卡方分布接近正態(tài)分布,4、卡方分布具有“可加性” X、Y 獨(dú)立, X 2(n1) ,Y 2(n2) 則 X + Y 2(n1+ n2),b,5,卡方 (c2) 分布的函數(shù),CHIDIST:自由度為n的卡方分布在x點(diǎn)處的單尾概率 CHIINV: 返回自由度為n的卡方分布的單尾概率函數(shù)的逆函數(shù),b,6,2檢驗(yàn)是以2分布為基礎(chǔ)的一種假設(shè)檢驗(yàn)方法,主要用于分類變量,根據(jù)樣本數(shù)據(jù)推斷總體的分布與期望分布是否有顯著差異,或推斷兩個(gè)分類變量是否相關(guān)或相互獨(dú)立。,卡方檢驗(yàn)基礎(chǔ),b,7,2值的計(jì)算:,由英國(guó)統(tǒng)計(jì)學(xué)家Ka

3、rl Pearson首次提出,故被稱為Pearson 2 。,卡方檢驗(yàn)基礎(chǔ),b,8,檢驗(yàn)?zāi)硞€(gè)連續(xù)變量的分布是否與某種理論分布一致,如是否符合正態(tài)分布等 檢驗(yàn)?zāi)硞€(gè)分類變量各類的出現(xiàn)概率是否等于指定概率 檢驗(yàn)兩個(gè)分類變量是否相互獨(dú)立,如吸煙是否與呼吸道疾病有關(guān) 檢驗(yàn)控制某種或某幾種分類變量因素的作用之后,另兩個(gè)分類變量是否獨(dú)立,如上例控制年齡、性別之后,吸煙是否與呼吸道疾病有關(guān) 檢驗(yàn)兩種方法的結(jié)果是否一致,如兩種診斷方法對(duì)同一批人進(jìn)行診斷,其診斷結(jié)果是否一致,卡方檢驗(yàn)基礎(chǔ)用途,b,9,卡方檢驗(yàn)的用途,一個(gè)樣本方差和 總體方差是否相同,同質(zhì)性檢驗(yàn),適合性檢驗(yàn),獨(dú)立性檢驗(yàn),觀察值和理論值是否符合,兩個(gè)

4、或兩個(gè)以上因素之間是否相關(guān),計(jì)數(shù) 資料 和 屬性 資料,b,10,一個(gè)樣本方差的同質(zhì)性檢驗(yàn),從標(biāo)準(zhǔn)正態(tài)總體中抽取k個(gè)獨(dú)立u2之和為卡方2,其2服從自由度為(k-1)的卡方分布,當(dāng)用樣本平均數(shù)估計(jì)總體平均數(shù)時(shí),有:,將樣本方差代入,則:,b,11,卡方函數(shù)的使用,假設(shè),假設(shè),假設(shè),b,12,例:已知某農(nóng)田受到重金屬污染,經(jīng)抽樣測(cè)定鉛濃度分別為: 4.2, 4.5, 3.6, 4.7, 4.0, 3.8, 3.7, 4.2 (ug/g),方差為0.150, 試檢驗(yàn)受到污染的農(nóng)田鉛濃度的方差是不是和正常濃度鉛濃度的方差(0.065)相同,分析:1)一個(gè)樣本方差同質(zhì)性檢驗(yàn) 2)事先不知道受污染的農(nóng)田與

5、正常農(nóng)田的鉛濃度 方差的大小,故雙尾檢驗(yàn),(2)選取顯著水平,解:(1)假設(shè) 即受到污染的農(nóng)田鉛濃度的方差與正常農(nóng)田鉛濃度的方差相同,對(duì),(3)檢驗(yàn)計(jì)算,(4)推斷:當(dāng)df8-17,由CHIINV(0.025,7)16.01,即,否定H0,接受HA,即樣本方差與總體方差試不同質(zhì)的,認(rèn)為受到污染的農(nóng)田鉛濃度的方差與正常農(nóng)田的方差有顯著差異,b,13,卡方檢驗(yàn)的原理和方法,Pearson定理:當(dāng)(P1,P2,,Pk)是總體的真實(shí)概率分布時(shí),統(tǒng)計(jì)量,隨著n的增加漸近于自由度df=k-1的卡方分布。其中P1,P2,,Pk為k種不同屬性出現(xiàn)的頻率,n為樣本容量,ni為樣本中第i種屬性出現(xiàn)的次數(shù),是觀測(cè)值

6、,記為Oi,pi為第i種屬性出現(xiàn)的概率,npi則可以看成理論上該樣本第i種屬性出現(xiàn)的次數(shù),理論值記為:Ei,即,b,14,卡方檢驗(yàn)的原理和方法,Pearson定理的基本含義: 如果樣本確實(shí)是抽自由(P1,P2,,Pk)代表的總體,Oi和Ei之間的差異就只是隨機(jī)誤差,則Pearson統(tǒng)計(jì)量可視為服從卡方分布 反之,如果樣本不是抽自由(P1,P2,,Pk)代表的總體,Oi和Ei之間的差異就不只是是隨機(jī)誤差,從而使計(jì)算出的統(tǒng)計(jì)量有偏大的趨勢(shì) 因此,對(duì)Pearson統(tǒng)計(jì)量進(jìn)行單尾檢驗(yàn)(即右尾檢驗(yàn))可用于判斷離散型資料的觀測(cè)值與理論值是不是吻合,b,15,卡方檢驗(yàn)的原理和方法,統(tǒng)計(jì)假設(shè): H0:觀測(cè)值與

7、理論值的差異是由隨機(jī)誤差引起 HA:觀測(cè)值與理論值之間有真實(shí)差異 所以卡方值是度量實(shí)際觀測(cè)值與理論值偏南程度的一個(gè)統(tǒng)計(jì)量 卡方值越小,表明觀測(cè)值與理論值越接近 卡方值越大,表明觀測(cè)值與理論值相差越大 卡方值為0,表明H0嚴(yán)格成立,且它不會(huì)有下側(cè)否定區(qū),只能進(jìn)行右尾檢驗(yàn),b,16,卡方檢驗(yàn)的原理和方法,由于離散型資料的卡方檢驗(yàn)只是近似地服從連續(xù)型變量的卡方分布,所以在對(duì)離散型資料進(jìn)行卡方檢驗(yàn)計(jì)算的時(shí),結(jié)果常常偏低,特別是當(dāng)自由度df=1時(shí),有較大偏差,為此需要進(jìn)行矯正: 當(dāng)自由度df1時(shí),與連續(xù)型隨機(jī)變量卡方分相近似,這時(shí)可以不做連續(xù)性矯正 注意:要求各個(gè)組內(nèi)的理論次數(shù)不小于5,如某組理論次數(shù)小

8、于5,則應(yīng)把它與其相鄰的一組或幾組合并,知道理論次數(shù)大于5為止,b,17,適合性檢驗(yàn),適合性檢驗(yàn)(吻合性檢驗(yàn)或擬合優(yōu)度檢驗(yàn)) 步驟: 1. 提出無效假設(shè),即認(rèn)為觀測(cè)值和理論值之間沒有差異 2. 規(guī)定顯著性水平 3. 計(jì)算樣本卡方值 4. 根據(jù)規(guī)定的顯著水平和自由度計(jì)算出卡方值,再和實(shí)際計(jì)算的卡方值進(jìn)行比較,b,18,例:有一鯉魚遺傳試驗(yàn),以荷包鯉魚(紅色,隱性)與湘江野鯉(青灰色,顯性)雜交,其F2獲得下表的所列的體色分離尾數(shù),問這一資料的實(shí)際觀測(cè)值是否符合孟德爾一對(duì)等位基因的遺傳規(guī)律? 鯉魚遺傳試驗(yàn)F2觀測(cè)結(jié)果,分析:1)適合性檢驗(yàn)問題 2) 自由度為(2-1)=1,需要連續(xù)性矯正,(2)選

9、取顯著水平,解:(1)假設(shè) 鯉魚體色F2性狀分離符合3:1 對(duì) 鯉魚體色F2性狀分離不符合3:1,b,19,(3)檢驗(yàn)計(jì)算: 計(jì)算鯉魚體色的理論值,(4)推斷:由CHIDIST(301.63, 1)=1.45E-67,即 故應(yīng)否定H0,接受HA,認(rèn)為鯉魚體色F2性狀比不符合3:1比率,(4)推斷:由CHIINV(0.025, 1)=5.02, 即 故應(yīng)否定H0,接受HA,認(rèn)為鯉魚體色F2性狀比不符合3:1比率,b,20,獨(dú)立性檢驗(yàn),步驟: 1. 提出無效假設(shè),即認(rèn)為所觀測(cè)的各屬性之間沒有關(guān)聯(lián) 2. 規(guī)定顯著性水平 3. 根據(jù)無效假設(shè)計(jì)算出理論數(shù) 4. 根據(jù)規(guī)定的顯著水平和自由度計(jì)算出卡方值,再

10、和計(jì)算的卡方值進(jìn)行比較。 如果接受假設(shè),則說明因子之間無相關(guān)聯(lián),是相互獨(dú)立的 如果拒絕假設(shè),則說明因子之間的關(guān)聯(lián)是顯著的,不獨(dú)立,b,21,一、2X2列聯(lián)表的獨(dú)立性檢驗(yàn),設(shè)A、B是一個(gè)隨機(jī)試驗(yàn)中的兩個(gè)事件,其中A可能出現(xiàn)r1、r2個(gè)結(jié)果,B可能出現(xiàn)c1、c2個(gè)結(jié)果,兩因子相互作用形成4個(gè)數(shù),分別以O(shè)11、O12、O21、O22表示,即 2X2列聯(lián)表的一般形式,b,22,一、2X2列聯(lián)表的獨(dú)立性檢驗(yàn),2X2列聯(lián)表的卡方檢驗(yàn)步驟:,1、提出無效假設(shè)H0:事件A和B無關(guān),即事件A和B相互獨(dú)立,同時(shí)給出HA:事件A和B有關(guān)聯(lián)關(guān)系 2、給出顯著水平 3、依據(jù)H0,可以推算出理論值,計(jì)算卡方值 4、進(jìn)行推

11、斷,b,23,例:現(xiàn)隨機(jī)抽樣對(duì)吸煙人群和不吸煙人群是否患有氣管炎病進(jìn)行了調(diào)查,其調(diào)查結(jié)果如下表,試檢驗(yàn)吸煙與患?xì)夤苎撞∮袩o關(guān)聯(lián)? 不同人群患?xì)夤苎撞≌{(diào)查,分析:1)獨(dú)立性檢驗(yàn)問題 2) 自由度為df=(2-1)*(2-1)=1,需要連續(xù)性矯正,(2)選取顯著水平,解:(1)假設(shè) 吸煙與患?xì)夤苎谉o關(guān) 對(duì) 吸煙與患?xì)夤苎子嘘P(guān)聯(lián),b,24,(3)檢驗(yàn)計(jì)算: 計(jì)算聯(lián)表中的各項(xiàng)的理論次數(shù),(4)推斷:由CHIDIST(23.174, 1)=1.48E-6,即 故應(yīng)否定H0,接受HA,認(rèn)為吸煙與患?xì)夤懿O顯著相關(guān),(4)推斷:由CHIINV(0.025, 1)=6.63, 即 故應(yīng)否定H0,接受HA,認(rèn)為

12、吸煙與患?xì)夤苎撞∶芮邢嚓P(guān),b,25,二、rXc列聯(lián)表的獨(dú)立性檢驗(yàn),rXc列聯(lián)表是指r2, c2的計(jì)數(shù)資料,一般形式如下 rXc列聯(lián)表的一般形式,b,26,二、rXc列聯(lián)表的獨(dú)立性檢驗(yàn),rXc列聯(lián)表中各項(xiàng)理論頻率的計(jì)算方法如2X2列聯(lián)表,即:Eij=(RiCj/T),由于自由度df(r-1)( c-1),由于r2, c2,故自由度df1,因而不需要進(jìn)行連續(xù)性矯正,其計(jì)算公式如下:,b,27,例:某醫(yī)院用碘劑治療地方性甲狀腺腫,不同年齡的治療效果如下表,試檢驗(yàn)不同年齡的治療效果有無差異? 不同年齡用碘劑治療甲狀腺腫效果比較,分析:1)獨(dú)立性檢驗(yàn)問題 2) 自由度為df=(4-1)*(3-1)=6,不需要連續(xù)性矯正,(2)選取顯著水平,解:(1)假設(shè) 治療效果與年齡無關(guān) 對(duì) 治療效果與年齡有關(guān),b,28,(3)檢驗(yàn)計(jì)算: 計(jì)算聯(lián)表中的各項(xiàng)的理論次數(shù),(4)推斷:由CHID

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論