獨(dú)立性檢驗(yàn) 課件_第1頁
獨(dú)立性檢驗(yàn) 課件_第2頁
獨(dú)立性檢驗(yàn) 課件_第3頁
獨(dú)立性檢驗(yàn) 課件_第4頁
獨(dú)立性檢驗(yàn) 課件_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

3.1獨(dú)立性檢驗(yàn)

問題:

數(shù)學(xué)家龐加萊每天都從一家面包店買一塊1000g的面包,并記錄下買回的面包的實(shí)際質(zhì)量。一年后,這位數(shù)學(xué)家發(fā)現(xiàn),所記錄數(shù)據(jù)的均值為950g。于是龐加萊推斷這家面包店的面包分量不足。假設(shè)“面包份量足”,則一年購買面包的質(zhì)量數(shù)據(jù)的平均值應(yīng)該不少于1000g;“這個(gè)平均值不大于950g”是一個(gè)與假設(shè)“面包份量足”矛盾的小概率事件;這個(gè)小概率事件的發(fā)生使龐加萊得出推斷結(jié)果。一:假設(shè)檢驗(yàn)問題的原理

假設(shè)檢驗(yàn)問題由兩個(gè)互斥的假設(shè)構(gòu)成,其中一個(gè)叫做原假設(shè),用H0表示;另一個(gè)叫做備擇假設(shè),用H1表示。例如,在前面的例子中,原假設(shè)為:H0:面包份量足,備擇假設(shè)為:H1:面包份量不足。這個(gè)假設(shè)檢驗(yàn)問題可以表達(dá)為:

H0:面包份量足←→H1:面包份量不足二:求解假設(shè)檢驗(yàn)問題考慮假設(shè)檢驗(yàn)問題:

H0:面包分量足←→H1:面包分量不足在H0成立的條件下,構(gòu)造與H0矛盾的小概率事件;如果樣本使得這個(gè)小概率事件發(fā)生,就能以一定把握斷言H1成立;否則,斷言沒有發(fā)現(xiàn)樣本數(shù)據(jù)與H0相矛盾的證據(jù)。求解思路分析:本節(jié)研究的是兩個(gè)分類變量的獨(dú)立性檢驗(yàn)問題。獨(dú)立性檢驗(yàn)在日常生活中,我們常常關(guān)心分類變量之間是否有關(guān)系:例如,吸煙是否與患肺癌有關(guān)系?性別是否對于喜歡數(shù)學(xué)課程有影響?等等。例1.某醫(yī)療機(jī)構(gòu)為了了解患慢性支氣管炎與吸煙是否有關(guān),進(jìn)行了一次抽樣調(diào)查,共調(diào)查了339名50歲以上的人,其中吸煙者205人,不吸煙者134人.調(diào)查結(jié)果是:吸煙的205人中有43人患呼吸道疾?。ê喎Q患?。?62人未患呼吸道疾?。ê喎Q未患?。徊晃鼰煹?34人中有13人患病,121人未患?。畣栴}:根據(jù)這些數(shù)據(jù)能否斷定“患慢性支氣管炎與吸煙有關(guān)”?(1)為了研究這個(gè)問題,將上述數(shù)據(jù)用下表來表示:患病未患病合計(jì)吸煙43162205不吸煙13121134合計(jì)56283339(2)估計(jì)吸煙者與不吸煙者患病的可能性差異:在吸煙的人中,有的人患病,在不吸煙的人中,有的人患?。畣栴}:由上述結(jié)論能否得出患病與吸煙有關(guān)?把握有多大?

(1)假設(shè):患病與吸煙沒有關(guān)系.若將表中“觀測值”用字母表示,則得下列2×2列聯(lián)表:不吸煙(患?。˙)未患病()合計(jì)吸煙An11n12n1+不吸煙n21n22n2+合計(jì)n+1n+2n

即n11(n21+n22)≈n21(n11+n12)n11n22-n21n12≈0,因此,|n11n22-n21n12|越小,患病與吸煙之間的關(guān)系越弱,否則,關(guān)系越強(qiáng).近似的判斷方法:設(shè)n=n11+n21+n12+n22,如果H0成立,則在吸煙的人中患病的比例與不吸煙的人中患病的比例應(yīng)差不多,由此可得,

上面的話的意思是指事件A與B獨(dú)立,這時(shí)應(yīng)該有P(AB)=P(A)P(B)成立,

我們用H0表示上式,即H0:P(AB)=P(A)P(B).并稱之為統(tǒng)計(jì)假設(shè),當(dāng)H0成立時(shí),下面的三個(gè)式子也成立:根據(jù)概率的統(tǒng)計(jì)定義,上面提到的眾多事件的概率都可以用相應(yīng)的頻率來估計(jì)。例如P(AB)的估計(jì)為P(A)的估計(jì)為,P(B)的估計(jì)為,……于是與應(yīng)該很接近,……?;蛘哒f應(yīng)該比較小.從而也應(yīng)該比較小。(2)卡方統(tǒng)計(jì)量:為了消除樣本對上式的影響,通常用卡方統(tǒng)計(jì)量(χ2

)來進(jìn)行估計(jì).卡方χ2統(tǒng)計(jì)量公式:用它的大小可以決定是否拒絕原來的統(tǒng)計(jì)假設(shè)H0,如果算出的χ2值較大,就拒絕H0,也就是拒絕“事件A與事件B無關(guān)”,從而就認(rèn)為它們是有關(guān)的了(3)兩個(gè)臨界值:3.841與6.635.

經(jīng)過對χ2統(tǒng)計(jì)量分布的研究,已經(jīng)得到了兩個(gè)臨界值:3.841與6.635。當(dāng)根據(jù)具體的數(shù)據(jù)算出的χ2>3.841時(shí),有95%的把握說事件A與事件B有關(guān);當(dāng)χ2>6.635時(shí),有99%的把握說事件A與事件B有關(guān);當(dāng)χ2<3.841時(shí),認(rèn)為事件A與事件B無關(guān);

象以上這種用χ2統(tǒng)計(jì)量研究吸煙與患呼吸道疾病是否有關(guān)等問題的方法稱為獨(dú)立性檢驗(yàn).

對于例1,最理想的解決辦法是向所有的50歲以上的人作調(diào)查,然后對所得的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)處理,但這花費(fèi)的代價(jià)太大,實(shí)際上也是行不通的。339個(gè)人相對于全體50歲以上的人,只是一小部分回憶一下數(shù)學(xué)必修3中學(xué)過的總體與樣本的關(guān)系,當(dāng)用樣本平均數(shù),樣本標(biāo)準(zhǔn)差去估計(jì)總體的相應(yīng)的數(shù)字特征時(shí),由于抽樣的隨機(jī)性,結(jié)果并不惟一?,F(xiàn)在的情況類似,我們用部分對全體作推斷,推斷可能正確,也可能錯(cuò)誤,例如我們知道,不少的中老年煙民的身體很好,沒有患慢性支氣管炎;而又有很多的從不吸煙的中老年人體質(zhì)很差,患有慢性支氣管炎。如果抽取的339個(gè)調(diào)查對象中很多人來自上述兩個(gè)群體,試想會得出什么結(jié)論吧。我們說有95%(或99%)的把握說事件A與事件B有關(guān),是指推斷犯錯(cuò)誤的可能性為5%(或1%),這也是常常說成是“有95%(或99%)的概率”,其含義是一樣的。解:由公式因?yàn)?.469>6.635,所以我們有99%的把握說:50歲以上的人患慢性支氣管炎與吸煙有關(guān)。Ⅱ類1類2合計(jì)Ⅰ類An11n12n1+類B

n21n22n2+合計(jì)n+1n+2n獨(dú)立性檢驗(yàn)的一般步驟:一般地,對于兩個(gè)研究對象Ⅰ和Ⅱ,Ⅰ有兩類取值:類A和類B(如吸煙與不吸煙),Ⅱ也有兩類取值:類1和類2(如患呼吸道疾病與不患呼吸道疾?。玫饺缦卤硭荆侯愵?/p>

類類推斷“Ⅰ和Ⅱ有關(guān)系”的步驟為:第一步,提出假設(shè)H0:兩個(gè)分類變量Ⅰ和Ⅱ沒有關(guān)系;第二步,根據(jù)2×2列聯(lián)表和公式計(jì)算χ2統(tǒng)計(jì)量;第三步,比對兩個(gè)臨界值,作出判斷.例2:對196個(gè)接受心臟搭橋手術(shù)的病人和196個(gè)接受血管清障手術(shù)的病人進(jìn)行3年跟蹤研究,調(diào)查他們是否又發(fā)作過心臟病,調(diào)查結(jié)果如下表所示:又發(fā)作過心臟病未發(fā)作過心臟病合計(jì)心臟搭橋手術(shù)39157196血管清障手術(shù)29167196合計(jì)68324392

試根據(jù)上述數(shù)據(jù)比較兩種手術(shù)對病人又發(fā)作心臟病的影響有沒有差別。解:這是一個(gè)2×2列聯(lián)表的獨(dú)立性檢驗(yàn)問題,由公式因?yàn)?.780<3.841,我們沒有理由說“心臟搭橋手術(shù)”與“又發(fā)生過心臟病”有關(guān),可以認(rèn)為病人又發(fā)作心臟病與否跟他做過何種手術(shù)無關(guān)。例3.某大型企業(yè)人力資源部為了研究企業(yè)員工工作積極性和對待企業(yè)改革態(tài)度的關(guān)系,隨機(jī)抽取了189名員工進(jìn)行調(diào)查,所得的數(shù)據(jù)如下表所示:積極支持企業(yè)改革不太贊成企業(yè)改革合計(jì)工作積極544094工作一般326395合計(jì)86103189

對于人力資源部的研究項(xiàng)目,根據(jù)上述數(shù)據(jù)能得出什么結(jié)論?解:這是一個(gè)2×2列聯(lián)表的獨(dú)立性檢驗(yàn)問題,由公式因?yàn)?0.759>6.635,所以有99%的把握說:員工“工作積極”與“積極支持企業(yè)改革”是有關(guān)的??梢哉J(rèn)為企業(yè)的全體員工對待企業(yè)改革的態(tài)度與其工作積極性是有關(guān)的。例4.在一次惡劣氣候的飛行航程中調(diào)查男女乘客在機(jī)上暈機(jī)的情況如下表所示,根據(jù)此

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論