第十 章 卡方檢驗_第1頁
第十 章 卡方檢驗_第2頁
第十 章 卡方檢驗_第3頁
第十 章 卡方檢驗_第4頁
第十 章 卡方檢驗_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第十章卡方檢驗卡方分布就是對樣本的頻數(shù)分布所來自的總體分布是否服從某種理論分布或某種假設(shè)分布所作的假設(shè)檢驗,即根據(jù)樣本的頻數(shù)分布來推斷總體的分布。不同于回歸分析以及t檢驗和方差分析(三者都屬于參數(shù)統(tǒng)計),它屬于自由分布的非參數(shù)檢驗(非參數(shù)統(tǒng)計)。它可以處理一個因素分為多種類別或多種因素各有多種類別的資料。凡是可以應用比率進行檢驗的資料,都可以用卡方檢驗??ǚ綑z驗是用途很廣的一種假設(shè)檢驗方法。例如,它包括兩個或多個樣本率及構(gòu)成比之間的差別有無統(tǒng)計意義的推斷,分類變量配對設(shè)計下的卡方檢驗以及頻數(shù)分布的擬合優(yōu)度檢驗等。在社會統(tǒng)計學中應用最多的用于分類變量之間擬合優(yōu)度和獨立性檢驗的χ2檢驗。χ2檢驗可以判斷變量之間是否相關(guān),但,不能判斷相關(guān)程度為多大。φ系數(shù),克拉默V系數(shù)。它們用于判斷變量之間相關(guān)程度的大小,但是這兩個系數(shù)的應用也有其局限性??ǚ浇y(tǒng)計量χ2可以用于變量之間的擬合優(yōu)度檢驗和獨立性檢驗,測定兩個分類變量之間的相關(guān)程度。χ2統(tǒng)計量表達式為:其中,f0是觀察值,fe是期望值。χ2統(tǒng)計量是平方和的加總,因而,χ2≥0。χ2值的大小與變量的個數(shù)有關(guān),即觀察值和期望值配對數(shù)越多,χ2值越大,因而,χ2統(tǒng)計量的分布與自由度有關(guān)。χ2統(tǒng)計量描述的是觀察值與期望值之間的接近程度,兩個越接近,越小,χ2越小。反之,越大,χ2越大。舉例說明某車間有甲,乙,丙三個技工進行生產(chǎn),上周甲,乙,丙三個人產(chǎn)量分別占總量的58%,33%和9%,丙進行學習,想提高技術(shù)。一周后三人產(chǎn)量共生產(chǎn)了270件產(chǎn)品,其中甲,乙,丙三人分別生產(chǎn)150

件,85件和35件。請判斷丙學習后三人產(chǎn)量占的比例是否發(fā)生了變化。在這個例子中,假定三人產(chǎn)量所占比例沒有變化,那么甲,乙,丙三人產(chǎn)量期望值分別為:

通過差卡方分布表得到χ20.05(2)=5.99>χ2

=5.1783,所以認為丙學習后三人產(chǎn)量所占比例沒有發(fā)生變化。自由度=k-1=3-1=20χ2α(2)=5.99

α=0.05

χ2=5.1783

卡方檢驗的概念(一)卡方檢驗:多個總體的比較從總體的不同類別中抽取元素構(gòu)成樣本,樣本包含總體中各個類別的元素,對不同類別的目標量之間是否存在顯著性差異進行的檢驗稱為擬合優(yōu)度檢驗。擬合優(yōu)度檢驗是χ2檢驗中重要的一部分,可以同時對多個總體進行比較。在χ2檢驗中,如果χ2>χ2α(k-1),則拒絕虛無假設(shè)。χ2α(k-1)為給定值,其中(k-1)是自由度。自由度是可以自由變動的變量個數(shù),在列聯(lián)表中,自由度=(R-1)×(C-1)。例如,從某學校社會學,經(jīng)濟學,文學,信息學四個專業(yè)中隨機抽取420名學生針對學校宿舍管理改革的態(tài)度進行調(diào)查。調(diào)查結(jié)果如下表所示,以α=0.05的顯著性水平檢驗四個專業(yè)的學生對宿舍管理改革的看法是否存在差異。首先,我們假設(shè)四個專業(yè)的學生之間不存在差異,即四個專業(yè)的學生贊成改革的比例是一致的,即均為

自由度=(R-1)×(C-1)=(2-1)×(4-1)=3α=0.05,查表得:χ2α(3)=7.815由于χ2<χ2α(3),所以我們不能拒絕虛無假設(shè),即認為四個專業(yè)的學生對宿舍管理改革的贊成是一致的,調(diào)查數(shù)據(jù)中的差異是由于抽樣的隨機性造成的。0χ2α(3)=7.815

α=0.05

χ2=2.3293

(二)適用場合:分類變量之間的關(guān)系χ2檢驗用于分類變量之間關(guān)系的檢驗,可以判斷不同類別的目標量之間是否存在顯著差異。χ2檢驗主要用來檢驗頻數(shù)問題,即檢驗各類實際觀察的頻數(shù)是否顯著不同于假設(shè)的期望頻數(shù)。同時,χ2檢驗還可用于判斷兩個分類變量之間是否存在聯(lián)系;這時稱χ2檢驗為對立性檢驗。如果連個分類變量之間沒有關(guān)系,則稱二者相互獨立。獨立性檢驗例如,我們分析閱讀習慣于學歷是否有關(guān)。隨機抽取254人進行調(diào)查,調(diào)查結(jié)果如下表:在這個例子中,我們假設(shè)閱讀習慣于學歷沒有關(guān)系,即二者是相互獨立的,故有:Ho:閱讀習慣與學歷沒有關(guān)系

Ha:閱讀習慣與學歷有關(guān)系我們需要利用χ2檢驗來進行獨立性檢驗,這時候需要計算χ2統(tǒng)計量,而χ2統(tǒng)計量是根據(jù)觀察值和期望值計算得出來的。因而,首先,我們需要計算期望值。根據(jù)列聯(lián)表中任一單元格頻數(shù)的期望值公式來求期望值:其中,RT是給定單元格所在行的合計;CT是給定單元格所在列的合計;n為觀察值的總個數(shù),即樣本容量。

例如:所以:取α=0.05,自由度為(R-1)×(C-1)=9,查表得χ20.05(9)=16.919。χ2>χ20.05(9),因而拒絕虛無假設(shè),即閱讀習慣與學歷之間存在依賴關(guān)系,閱讀習慣受學歷的影響。0χ2α(9)=16.919

α=0.05

χ2=30.4556基于卡方的兩變量關(guān)系測量χ2統(tǒng)計量可以對分類變量之間的相關(guān)性進行統(tǒng)計檢驗,判斷變量之間是相互獨立還是相互依賴。但,χ2統(tǒng)計量不能說明相互依賴的相關(guān)程度。對于兩個變量之間相關(guān)程度的測定,我們需要依靠相關(guān)系數(shù)。φ系數(shù)克拉默V系數(shù)φ系數(shù)的定義與計算φ相關(guān)系數(shù)用于描述2×2列聯(lián)表中數(shù)據(jù)的相關(guān)程度。

2×2列聯(lián)表

φ相關(guān)系數(shù)的計算公式為:φ相關(guān)系數(shù)主要應用于2×2列聯(lián)表,其絕對值不超過1;ad與bc的差值反映變量間相關(guān)程度的強弱;差值越大,φ越大,相關(guān)程度越高;當ad=bc時,φ=0,表明變量X與變量Y之間相互獨立;φ的符號沒有實際意義,|φ|=1只能表示變量X與變量Y完全相關(guān);當b=0,c=0時,φ=1,變量X與變量Y完全相關(guān);當a=0,d=0時,φ=-1,變量X與變量Y完全相關(guān);當列聯(lián)表中行數(shù)R或列數(shù)C大于2時,φ系數(shù)隨著R或C的變大而增大,而且沒有上限??死琕系數(shù)φ系數(shù)沒有上限,克拉默(Gramer)以φ系數(shù)為基礎(chǔ)提出了V相關(guān)系數(shù)。其計算公式為:其中,min[(R-1),(C-1)]表示取(R-1)和(C-1)中較小的一個;V的取值范圍0~1;當V=0,兩個變量相互獨立;當V=1,兩個變量完全相關(guān);如果列聯(lián)表中有一個為二維,即R=2或者C=

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論