卡方檢驗及其應(yīng)用_第1頁
卡方檢驗及其應(yīng)用_第2頁
卡方檢驗及其應(yīng)用_第3頁
卡方檢驗及其應(yīng)用_第4頁
免費預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、卡方檢驗及其應(yīng)用一、卡方檢驗概述:卡方檢驗主要應(yīng)用于計數(shù)數(shù)據(jù)的分析,對于總體的分布不作任何假設(shè),因此它屬于非參 數(shù)檢驗法中的一種.它由統(tǒng)計學(xué)家皮爾遜推導(dǎo).理論證實,實際觀察次數(shù)f.與理論次數(shù)fe, 又稱期望次數(shù)之差的平方再除以理論次數(shù)所得的統(tǒng)計量,近似服從卡方分布,可表示為:/ = Z寫紅、產(chǎn)這是卡方檢驗的原始公式,其中當(dāng)fe越大,近似效果越好.顯然fo與仁相差越大,卡方 值就越大;fo與C相差越小,卡方值就越?。灰虼怂軌蛴脕肀硎?#163;,與相差的程度.根據(jù)這 個公式,可認為卡方檢驗的一般問題是要檢驗名義型變量的實際觀測次數(shù)和理論次數(shù)分布之 間是否存在顯著差異.一 般用卡方檢驗方法進行統(tǒng)

2、計檢驗時,要求樣本容量不宜太小,理論次數(shù)25,否那么需要 進行校正.如果個別單元格的理論次數(shù)小于5,處理方法有以下四種:1、單元格合并法:2、 增加樣本數(shù);3、去除樣本法;4、使用校正公式.當(dāng)某一期里次數(shù)小于5時,應(yīng)該利用校正公式計算卡方值.公式為:J e二、卡方檢驗的統(tǒng)計原理: 卡方檢驗所檢測的是樣本觀察次數(shù)或百分比與理論或總體次數(shù)或百分比的 差異性. 理論或總體的分布狀況,可用統(tǒng)計的期望值理論值來表達. 卡方的統(tǒng)計原理,是取觀察值與期望值相比擬.卡方值越大,代表統(tǒng)計量與理論值的 差異越大,一旦卡方值大于某一個臨界值,即可獲得顯著的統(tǒng)計結(jié)論.三、卡方檢驗的主要應(yīng)用:1、獨立性檢驗第1頁共5頁

3、獨立性檢驗主要用于兩個或兩個以上因素多項分類的計數(shù)資料分析,也就是研究兩類變 最之間的關(guān)聯(lián)性和依存性問題.如果兩變量無關(guān)聯(lián)即相互獨立,說明對于其中一個變最而言, 另一變量多項分類次數(shù)上的變化是在無差范用之內(nèi);如果兩變量右關(guān)聯(lián)即不獨立,說明二者 之間有交互作用存在.獨立性檢驗一般采用列聯(lián)表的形式記錄觀察數(shù)據(jù),列聯(lián)表是由兩個以上的變量進行交 叉分類的頻數(shù)分布表,是用于提供根本調(diào)查結(jié)果的最常用形式,可以清楚地表示定類變量之間 是否相互關(guān)聯(lián).又可具體分為:(1)四格表的獨立性檢驗:又稱為2*2列聯(lián)表的卡方檢驗.四格表資料的獨立性檢驗用于 進行兩個率或兩個構(gòu)成比的比擬.是列聯(lián)表的一種最簡單的形式.a)專

4、用公式:假設(shè)四格表資料四個格子的頻數(shù)分別為a, b, c,d,那么四格表資料卡方檢驗的卡方值F* (ad-bc) -2/(a+b) (c+d) (a+c) (b+d),自由度 v二(行數(shù)1) * (列數(shù)T)b)應(yīng)用條件:要求樣本含量應(yīng)大于40且每個格子中的理論頻數(shù)不應(yīng)小于5.當(dāng)樣本含量大于40但理 論頻數(shù)有小于5的情況時卡方值需要校正,即公式?=工些二止22,當(dāng)樣本含量 fe小于40時只能用確切概率法計算概率.(2)、行李列表資料的獨立性檢驗:乂稱為R*C列聯(lián)表的卡方檢驗.行文列表資料的獨立性 檢驗用于多個率或多個構(gòu)成比的比擬.a)專用公式:r 行 c 列表資料卡方檢驗的卡方值!>* (

5、An/nini+Ai2/nin2+.+Are/nrnc) 1b)應(yīng)用條件:要求每個格子中的理論頻數(shù)T均大于5或1T5的格子數(shù)不超過總格子數(shù)的1/5.當(dāng) 有T<1或1(T5的格子較多時,可采用并行并列、刪行刪列、增大樣本含量的方法使其符 令行*列表資料卡方檢驗的應(yīng)用條件.多個率的兩兩比擬可采用行*列表分割的方法.第2頁共5頁f .f獨立性檢驗的理論頻數(shù)的計算公式為:=上;A公式中,小i表示橫行各組實際頻數(shù)的總和:fyi表示縱列各組實際頻數(shù)的總和;N表示樣本容量的總和;例1:為了解男女在公共場所禁煙上的態(tài)度,隨機調(diào)查100名男性和80名女性.男性中有58 人贊成禁煙,42人不贊成:而女性中那

6、么有61人贊成,19人不贊成.那么,男女在公 共場所禁煙的問題所持態(tài)度不同?贊成不贊成行總和男性foil =58fb12=42RI = 100女性fo21 =62fb22 =18R2 = 80列總和Cl = 120C2=60T=180解:1提出零假設(shè)H.:男女對公共場所禁煙的態(tài)度沒有差異.2確定自由度為2-1 21 =1,選擇顯著水平.=0.05o3求解男女對在公共場舍抽煙的態(tài)度的期望值,這里采用所在行列的合計值的乘積除 以總計值來計算每一個期望值如在卜表中:66.7:120*100/180.朧成不貨成行總和男性foil-58fbl2 72RI = 100Fell -66.7Fel2 -33.

7、3女性fo21 -62fo22 -18R2 = 80Fe21-53o3Fe22 -26 7列總和Cl = 120C2=60T=180(58-66.7)2 (42-33.3J2 (62-53.3(18-26.7)27 = > > 111= /.O1V ,66.733.353326.7/ =行數(shù)列數(shù)=1Z;.o51 = 3.84/2 > ZoO5l 拒絕零假設(shè),即男女對公共場所禁煙的態(tài)度有顯著差異.例2:某機構(gòu)欲了解現(xiàn)在性別與收入是否有關(guān),他們隨機抽樣500人,詢問為此的看法,結(jié) 果分為“有關(guān)、無關(guān)、不好說,三種答案,調(diào)杳結(jié)果如下表:第3頁共5頁性別有關(guān)無關(guān)不知道合計男12060

8、50260女10011060240合計220170110500解:(1)零假設(shè)Ho:性別與收入無關(guān).(2)確定自由度為(3-1)(21) =2,選擇顯著水平.=0.05.(3)利用卡方統(tǒng)計量計算公式計算統(tǒng)計量:/ = 21.467 > /(2) = 5.991J r故拒絕零假設(shè),即認為性別與收入有關(guān).2、擬合性檢驗8卡方檢驗?zāi)軝z驗單個多項分類名義型變量各分類間的實際觀測次數(shù)與理論次數(shù)之間是 否一致的問題,這里的觀測次數(shù)是根據(jù)樣本數(shù)據(jù)得多的實計數(shù),理論次數(shù)那么是根據(jù)理論或經(jīng) 驗得到的期望次數(shù).這一類檢驗稱為擬合性檢驗.其自由度通常為分類數(shù)減去1.理論次數(shù)通 常根據(jù)某種經(jīng)驗或理論.例3:隨機

9、抽取60名高一學(xué)生,問他們文理要不要分科,答復(fù)贊成的39人,反對的21人,問 對分科的意見是否有顯著的差異.解:(1)提出零假設(shè)H.:學(xué)生們對文理分科的意見沒有差異:(2)分析:如果沒有顯著的差異,那么贊成與反對的各占一半,因此是一個無差假設(shè) 的檢驗,于是理論次數(shù)為60/270,代入公式:/嚇巧科二胃1 +汽普二54福4所以拒絕原假設(shè),認為對于文理分科,學(xué)生們的態(tài)度是有顯著的差異的.例4:某大學(xué)二年級的公共體育課是球類課,根據(jù)自己的愛好,學(xué)生只需在籃球、足球和排 球三種課程中選擇一種.據(jù)以往的統(tǒng)計,選擇這三種課程的學(xué)生人數(shù)是相等的.今年開 課前對90名學(xué)生進行抽樣調(diào)置,選擇籃球的有39人,選擇

10、足球的28人,選擇排球的 23人,那么,今年學(xué)生對三種課程選擇的人數(shù)比例與以往是否不同?第4頁共5頁籃球足球排球觀察次數(shù)(fb)392823期望次數(shù)(fe)303030解:提出零假設(shè)H.:選擇三種課程的學(xué)生比例與以往沒有差異;L-力2 _ 39 - 302 28 - 3023 - 302 _1 十I H.Hv30df = 2K.52 = 5.993030Z2 < Zoo52所以接受零假設(shè),即選擇三種課程的學(xué)牛比例與以往相同.四、兩種檢驗的異同:從外表上看,擬合性檢驗和獨立性檢驗不管在列狀表的形式匕還是在計算卡方的公式 上都是相同的,所以經(jīng)常被籠統(tǒng)地稱為卡方檢驗.但是兩者還是存在差異的.首先,兩種檢驗抽取樣本的方法不同.如果抽樣是在各類別中分別進行,依照各類別分 別計算其比例,屬于擬合優(yōu)度檢驗.如果抽樣時并未事先分類,抽樣后根據(jù)研究內(nèi)容,把人 選單位按兩類變量進行分類,形成列聯(lián)表,那么是獨

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論