獨(dú)立性檢驗(yàn) 課件_第1頁(yè)
獨(dú)立性檢驗(yàn) 課件_第2頁(yè)
獨(dú)立性檢驗(yàn) 課件_第3頁(yè)
獨(dú)立性檢驗(yàn) 課件_第4頁(yè)
獨(dú)立性檢驗(yàn) 課件_第5頁(yè)
已閱讀5頁(yè),還剩20頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

3.1獨(dú)立性檢驗(yàn)

問(wèn)題:

數(shù)學(xué)家龐加萊每天都從一家面包店買(mǎi)一塊1000g的面包,并記錄下買(mǎi)回的面包的實(shí)際質(zhì)量。一年后,這位數(shù)學(xué)家發(fā)現(xiàn),所記錄數(shù)據(jù)的均值為950g。于是龐加萊推斷這家面包店的面包分量不足。假設(shè)“面包份量足”,則一年購(gòu)買(mǎi)面包的質(zhì)量數(shù)據(jù)的平均值應(yīng)該不少于1000g;“這個(gè)平均值不大于950g”是一個(gè)與假設(shè)“面包份量足”矛盾的小概率事件;這個(gè)小概率事件的發(fā)生使龐加萊得出推斷結(jié)果。一:假設(shè)檢驗(yàn)問(wèn)題的原理

假設(shè)檢驗(yàn)問(wèn)題由兩個(gè)互斥的假設(shè)構(gòu)成,其中一個(gè)叫做原假設(shè),用H0表示;另一個(gè)叫做備擇假設(shè),用H1表示。例如,在前面的例子中,原假設(shè)為:H0:面包份量足,備擇假設(shè)為:H1:面包份量不足。這個(gè)假設(shè)檢驗(yàn)問(wèn)題可以表達(dá)為:

H0:面包份量足←→H1:面包份量不足二:求解假設(shè)檢驗(yàn)問(wèn)題考慮假設(shè)檢驗(yàn)問(wèn)題:

H0:面包分量足←→H1:面包分量不足在H0成立的條件下,構(gòu)造與H0矛盾的小概率事件;如果樣本使得這個(gè)小概率事件發(fā)生,就能以一定把握斷言H1成立;否則,斷言沒(méi)有發(fā)現(xiàn)樣本數(shù)據(jù)與H0相矛盾的證據(jù)。求解思路分析:本節(jié)研究的是兩個(gè)分類(lèi)變量的獨(dú)立性檢驗(yàn)問(wèn)題。獨(dú)立性檢驗(yàn)在日常生活中,我們常常關(guān)心分類(lèi)變量之間是否有關(guān)系:例如,吸煙是否與患肺癌有關(guān)系?性別是否對(duì)于喜歡數(shù)學(xué)課程有影響?等等。例1.某醫(yī)療機(jī)構(gòu)為了了解患慢性支氣管炎與吸煙是否有關(guān),進(jìn)行了一次抽樣調(diào)查,共調(diào)查了339名50歲以上的人,其中吸煙者205人,不吸煙者134人.調(diào)查結(jié)果是:吸煙的205人中有43人患呼吸道疾?。ê?jiǎn)稱(chēng)患?。?62人未患呼吸道疾?。ê?jiǎn)稱(chēng)未患病);不吸煙的134人中有13人患病,121人未患病.問(wèn)題:根據(jù)這些數(shù)據(jù)能否斷定“患慢性支氣管炎與吸煙有關(guān)”?(1)為了研究這個(gè)問(wèn)題,將上述數(shù)據(jù)用下表來(lái)表示:患病未患病合計(jì)吸煙43162205不吸煙13121134合計(jì)56283339(2)估計(jì)吸煙者與不吸煙者患病的可能性差異:在吸煙的人中,有的人患病,在不吸煙的人中,有的人患?。畣?wèn)題:由上述結(jié)論能否得出患病與吸煙有關(guān)?把握有多大?

(1)假設(shè):患病與吸煙沒(méi)有關(guān)系.若將表中“觀(guān)測(cè)值”用字母表示,則得下列2×2列聯(lián)表:不吸煙(患病(B)未患病()合計(jì)吸煙An11n12n1+不吸煙n21n22n2+合計(jì)n+1n+2n

即n11(n21+n22)≈n21(n11+n12)n11n22-n21n12≈0,因此,|n11n22-n21n12|越小,患病與吸煙之間的關(guān)系越弱,否則,關(guān)系越強(qiáng).近似的判斷方法:設(shè)n=n11+n21+n12+n22,如果H0成立,則在吸煙的人中患病的比例與不吸煙的人中患病的比例應(yīng)差不多,由此可得,

上面的話(huà)的意思是指事件A與B獨(dú)立,這時(shí)應(yīng)該有P(AB)=P(A)P(B)成立,

我們用H0表示上式,即H0:P(AB)=P(A)P(B).并稱(chēng)之為統(tǒng)計(jì)假設(shè),當(dāng)H0成立時(shí),下面的三個(gè)式子也成立:根據(jù)概率的統(tǒng)計(jì)定義,上面提到的眾多事件的概率都可以用相應(yīng)的頻率來(lái)估計(jì)。例如P(AB)的估計(jì)為P(A)的估計(jì)為,P(B)的估計(jì)為,……于是與應(yīng)該很接近,……?;蛘哒f(shuō)應(yīng)該比較小.從而也應(yīng)該比較小。(2)卡方統(tǒng)計(jì)量:為了消除樣本對(duì)上式的影響,通常用卡方統(tǒng)計(jì)量(χ2

)來(lái)進(jìn)行估計(jì).卡方χ2統(tǒng)計(jì)量公式:用它的大小可以決定是否拒絕原來(lái)的統(tǒng)計(jì)假設(shè)H0,如果算出的χ2值較大,就拒絕H0,也就是拒絕“事件A與事件B無(wú)關(guān)”,從而就認(rèn)為它們是有關(guān)的了(3)兩個(gè)臨界值:3.841與6.635.

經(jīng)過(guò)對(duì)χ2統(tǒng)計(jì)量分布的研究,已經(jīng)得到了兩個(gè)臨界值:3.841與6.635。當(dāng)根據(jù)具體的數(shù)據(jù)算出的χ2>3.841時(shí),有95%的把握說(shuō)事件A與事件B有關(guān);當(dāng)χ2>6.635時(shí),有99%的把握說(shuō)事件A與事件B有關(guān);當(dāng)χ2<3.841時(shí),認(rèn)為事件A與事件B無(wú)關(guān);

象以上這種用χ2統(tǒng)計(jì)量研究吸煙與患呼吸道疾病是否有關(guān)等問(wèn)題的方法稱(chēng)為獨(dú)立性檢驗(yàn).

對(duì)于例1,最理想的解決辦法是向所有的50歲以上的人作調(diào)查,然后對(duì)所得的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)處理,但這花費(fèi)的代價(jià)太大,實(shí)際上也是行不通的。339個(gè)人相對(duì)于全體50歲以上的人,只是一小部分回憶一下數(shù)學(xué)必修3中學(xué)過(guò)的總體與樣本的關(guān)系,當(dāng)用樣本平均數(shù),樣本標(biāo)準(zhǔn)差去估計(jì)總體的相應(yīng)的數(shù)字特征時(shí),由于抽樣的隨機(jī)性,結(jié)果并不惟一?,F(xiàn)在的情況類(lèi)似,我們用部分對(duì)全體作推斷,推斷可能正確,也可能錯(cuò)誤,例如我們知道,不少的中老年煙民的身體很好,沒(méi)有患慢性支氣管炎;而又有很多的從不吸煙的中老年人體質(zhì)很差,患有慢性支氣管炎。如果抽取的339個(gè)調(diào)查對(duì)象中很多人來(lái)自上述兩個(gè)群體,試想會(huì)得出什么結(jié)論吧。我們說(shuō)有95%(或99%)的把握說(shuō)事件A與事件B有關(guān),是指推斷犯錯(cuò)誤的可能性為5%(或1%),這也是常常說(shuō)成是“有95%(或99%)的概率”,其含義是一樣的。解:由公式因?yàn)?.469>6.635,所以我們有99%的把握說(shuō):50歲以上的人患慢性支氣管炎與吸煙有關(guān)。Ⅱ類(lèi)1類(lèi)2合計(jì)Ⅰ類(lèi)An11n12n1+類(lèi)B

n21n22n2+合計(jì)n+1n+2n獨(dú)立性檢驗(yàn)的一般步驟:一般地,對(duì)于兩個(gè)研究對(duì)象Ⅰ和Ⅱ,Ⅰ有兩類(lèi)取值:類(lèi)A和類(lèi)B(如吸煙與不吸煙),Ⅱ也有兩類(lèi)取值:類(lèi)1和類(lèi)2(如患呼吸道疾病與不患呼吸道疾?。玫饺缦卤硭荆侯?lèi)類(lèi)

類(lèi)類(lèi)推斷“Ⅰ和Ⅱ有關(guān)系”的步驟為:第一步,提出假設(shè)H0:兩個(gè)分類(lèi)變量Ⅰ和Ⅱ沒(méi)有關(guān)系;第二步,根據(jù)2×2列聯(lián)表和公式計(jì)算χ2統(tǒng)計(jì)量;第三步,比對(duì)兩個(gè)臨界值,作出判斷.例2:對(duì)196個(gè)接受心臟搭橋手術(shù)的病人和196個(gè)接受血管清障手術(shù)的病人進(jìn)行3年跟蹤研究,調(diào)查他們是否又發(fā)作過(guò)心臟病,調(diào)查結(jié)果如下表所示:又發(fā)作過(guò)心臟病未發(fā)作過(guò)心臟病合計(jì)心臟搭橋手術(shù)39157196血管清障手術(shù)29167196合計(jì)68324392

試根據(jù)上述數(shù)據(jù)比較兩種手術(shù)對(duì)病人又發(fā)作心臟病的影響有沒(méi)有差別。解:這是一個(gè)2×2列聯(lián)表的獨(dú)立性檢驗(yàn)問(wèn)題,由公式因?yàn)?.780<3.841,我們沒(méi)有理由說(shuō)“心臟搭橋手術(shù)”與“又發(fā)生過(guò)心臟病”有關(guān),可以認(rèn)為病人又發(fā)作心臟病與否跟他做過(guò)何種手術(shù)無(wú)關(guān)。例3.某大型企業(yè)人力資源部為了研究企業(yè)員工工作積極性和對(duì)待企業(yè)改革態(tài)度的關(guān)系,隨機(jī)抽取了189名員工進(jìn)行調(diào)查,所得的數(shù)據(jù)如下表所示:積極支持企業(yè)改革不太贊成企業(yè)改革合計(jì)工作積極544094工作一般326395合計(jì)86103189

對(duì)于人力資源部的研究項(xiàng)目,根據(jù)上述數(shù)據(jù)能得出什么結(jié)論?解:這是一個(gè)2×2列聯(lián)表的獨(dú)立性檢驗(yàn)問(wèn)題,由公式因?yàn)?0.759>6.635,所以有99%的把握說(shuō):?jiǎn)T工“工作積極”與“積極支持企業(yè)改革”是有關(guān)的??梢哉J(rèn)為企業(yè)的全體員工對(duì)待企業(yè)改革的態(tài)度與其工作積極性是有關(guān)的。例4.在一次惡劣氣候的飛行航程中調(diào)查男女乘客在機(jī)上暈機(jī)的情況如下表所示,根據(jù)此

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論