獨(dú)立性檢驗(yàn)課件-高二下學(xué)期數(shù)學(xué)人教A版選擇性_第1頁
獨(dú)立性檢驗(yàn)課件-高二下學(xué)期數(shù)學(xué)人教A版選擇性_第2頁
獨(dú)立性檢驗(yàn)課件-高二下學(xué)期數(shù)學(xué)人教A版選擇性_第3頁
獨(dú)立性檢驗(yàn)課件-高二下學(xué)期數(shù)學(xué)人教A版選擇性_第4頁
獨(dú)立性檢驗(yàn)課件-高二下學(xué)期數(shù)學(xué)人教A版選擇性_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

8.3.2

獨(dú)立性檢驗(yàn)邯鄲市荀子中學(xué)郭素霞

1、通過學(xué)習(xí)獨(dú)立性檢驗(yàn)的基本思想,提升邏輯推理的素養(yǎng).2、借助χ2公式,培養(yǎng)數(shù)學(xué)運(yùn)算的素養(yǎng).3、通過對典型案例的探究,了解獨(dú)立性檢驗(yàn)(只要求2×2列聯(lián)表)的基本思想、方法及初步應(yīng)用.4、通過對數(shù)據(jù)的收集、整理和分析,增強(qiáng)學(xué)生的社會實(shí)踐能力,培養(yǎng)學(xué)生分析問題、解決問題的能力.學(xué)習(xí)目標(biāo)

最新研究發(fā)現(xiàn),花太多時間玩電腦游戲的兒童,患多動癥的風(fēng)險會加倍.青少年的大腦會很快習(xí)慣閃爍的屏幕、變幻莫測的電腦游戲,一旦如此,他們在教室等視覺刺激較少的地方,就很難集中注意力.研究人員對1323名年齡在7歲到10歲的兒童進(jìn)行調(diào)查,并在孩子父母的幫助下記錄了他們在13個月內(nèi)玩電腦游戲的習(xí)慣,同時教師記下了這些孩子出現(xiàn)注意力不集中問題.統(tǒng)計(jì)獲得下列數(shù)據(jù):注意力不集中注意力集中總計(jì)不玩電腦游戲268357625玩電腦游戲489209698總計(jì)7575661323

從這則新聞中可以得到哪些結(jié)論?新知引入思考

由條件概率的定義可知,事件A事件B事件AB由此,零假設(shè)H0等價于{X=1}和{Y=1}獨(dú)立.

我們通常稱H0:P(Y=1|X=0)=P(Y=1|X=1)為零假設(shè)或原假設(shè).如何判斷P(Y=1|X=0)=P(Y=1|X=1)是否成立.A與B相互獨(dú)立

P(AB)=P(A)P(B)新知學(xué)習(xí)①零假設(shè)H0獨(dú)立思考

設(shè)

X和Y為定義在以

Ω

為樣本空間上,且取值于{0,1}的成對分類變量,如何判斷事件{X=1}和{Y=1}之間是否有關(guān)聯(lián)?根據(jù)已經(jīng)學(xué)過的概率知識,

這4個性質(zhì)成立,則稱分類變量X和Y獨(dú)立.零假設(shè)H0:分類變量X和Y獨(dú)立②“零假設(shè)”概率語言描述為:新知學(xué)習(xí)

假定我們通過簡單隨機(jī)抽樣得到了X和Y的抽樣數(shù)據(jù)的2×2列聯(lián)表,如下表所示.XY合計(jì)Y=0Y=1X=0aba+bX=1cdc+d合計(jì)a+cb+dn=a+b+c+d

對于隨機(jī)樣本,表中的頻數(shù)a,b,c,d都是隨機(jī)變量,而表中的相應(yīng)數(shù)據(jù)是這些隨機(jī)變量的一次觀測結(jié)果.新知學(xué)習(xí)事件{Y=0}和{Y=1}的頻數(shù)事件{X=0}和{X=1}的頻數(shù)n是樣本容量事件{X=x,Y=y}(x,y=0,1)的頻數(shù)思考

如何基于②中的四個等式及列聯(lián)表中的數(shù)據(jù),構(gòu)造適當(dāng)?shù)慕y(tǒng)計(jì)量,對成對分類變量X

和Y

是否相互獨(dú)立作出推斷?②在零假設(shè)H0成立的條件下,根據(jù)頻率穩(wěn)定于概率的原理,由②中的第一個等式,可以得到零假設(shè)H0:分類變量

X和Y獨(dú)立新知學(xué)習(xí)思考

如何基于②中的四個等式及列聯(lián)表中的數(shù)據(jù),構(gòu)造適當(dāng)?shù)慕y(tǒng)計(jì)量,對成對分類變量X

和Y

是否相互獨(dú)立作出推斷?由頻率估計(jì)概率,可以得到:{X=0,Y=0}發(fā)生的頻數(shù)的期望值(預(yù)期值)頻數(shù)的觀測值

即:

的值應(yīng)該不大新知學(xué)習(xí)綜合②中的四個式子,如果零假設(shè)H0成立,下面四個量的取值都不應(yīng)該太大:零假設(shè)H0:分類變量X和Y獨(dú)立

新知學(xué)習(xí)

③新知學(xué)習(xí)

顯然,分別考慮③中的四個差的絕對值很困難.我們需要找到一個既合理又能夠計(jì)算分布的統(tǒng)計(jì)量,來推斷是否成立.一般來說,若頻數(shù)的期望值較大,則③中相應(yīng)的差的絕對值也會較大;而若頻數(shù)的期望值較小,則③中相應(yīng)的差的絕對值也會較?。?/p>

為了合理地平衡這種影響,我們將四個差的絕對值取平方后分別除以相應(yīng)的期望值再求和,得到如下的統(tǒng)計(jì)量:追問:

卡方統(tǒng)計(jì)量有什么用呢?卡方統(tǒng)計(jì)量XY合計(jì)Y=0Y=1X=0aba+bX=1cdc+d合計(jì)a+cb+dn=a+b+c+d

統(tǒng)計(jì)學(xué)家建議,用隨機(jī)變量

χ2取值

的大小作為判斷零假設(shè)H0是否成立的依據(jù)。

新知學(xué)習(xí)思考

怎樣確定判斷χ2大小的標(biāo)準(zhǔn)呢?或者說,究竟χ2大到什么程度,可以推斷H0不成立呢?根據(jù)小概率事件在一次試驗(yàn)中不大可能發(fā)生的規(guī)律,可以通過確定一個與

H0相矛盾的小概率事件來實(shí)現(xiàn),在假定

H0的條件下,對于有放回簡單隨機(jī)抽樣,當(dāng)樣本容量

n

充分大時,統(tǒng)計(jì)學(xué)家得到了χ2的近似分布.

P(χ2≥xα)=α④

臨界值可以作為判斷χ2大小的標(biāo)準(zhǔn).概率值α越小,臨界值xα越大.當(dāng)總體很大時,抽樣有、無放回對χ2

的分布影響較?。散苁娇芍?,只要把概率值α取得充分小,在假設(shè)H0

成立的情況下,事件{χ2?xα}是不大可能發(fā)生的.根據(jù)這個規(guī)律,如果該事件發(fā)生,我們就可以推斷

H0不成立.新知學(xué)習(xí)α的臨界值知識歸納

這種利用χ2的取值推斷分類變量

X和Y是否獨(dú)立的方法稱為

χ2獨(dú)立性檢驗(yàn),讀作“卡方獨(dú)立性檢驗(yàn)”,簡稱獨(dú)立性檢驗(yàn).

基于小概率值

α

的檢驗(yàn)規(guī)則:α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828

χ2獨(dú)立性檢驗(yàn)中5個常用的小概率值和相應(yīng)的臨界值:新知學(xué)習(xí)α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828例1,對于小概率值α=0.05,我們有如下的具體檢驗(yàn)規(guī)則:

新知學(xué)習(xí)臨界值表檢驗(yàn)規(guī)則舉例例1

為比較甲、乙兩所學(xué)校學(xué)生的數(shù)學(xué)水平,采用簡單隨機(jī)抽樣的方法抽取88名學(xué)生.通過測驗(yàn)得到了如下數(shù)據(jù):甲校43名學(xué)生中有10名數(shù)學(xué)成績優(yōu)秀;乙校45名學(xué)生中有7名數(shù)學(xué)成績優(yōu)秀.依據(jù)小概率值α=0.1的χ2獨(dú)立性檢驗(yàn),分析抽樣數(shù)據(jù),能否據(jù)此推斷兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率有差異?解:列2×2列聯(lián)表零假設(shè)為

H0:分類變量X與Y相互獨(dú)立,即兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率無差異.根據(jù)2×2列聯(lián)表中的數(shù)據(jù),計(jì)算得到

根據(jù)小概率值α=0.1的卡方獨(dú)立性檢驗(yàn),沒有充分證據(jù)推斷H0不成立.因此可以認(rèn)為H0成立,即認(rèn)為兩校的數(shù)學(xué)成績優(yōu)秀率沒有差異.新知學(xué)習(xí)

學(xué)校數(shù)學(xué)成績合計(jì)不優(yōu)秀(Y=0)優(yōu)秀(Y=1)甲校(X=0)331043乙校(X=1)38745合計(jì)711788

新知學(xué)習(xí)例1

為比較甲、乙兩所學(xué)校學(xué)生的數(shù)學(xué)水平,采用簡單隨機(jī)抽樣的方法抽取88名學(xué)生.通過測驗(yàn)得到了如下數(shù)據(jù):甲校43名學(xué)生中有10名數(shù)學(xué)成績優(yōu)秀;乙校45名學(xué)生中有7名數(shù)學(xué)成績優(yōu)秀.試分析兩校學(xué)生中數(shù)學(xué)成績優(yōu)秀率之間是否存在差異.8.3.1分類變量與列聯(lián)表例題

因此,可以認(rèn)為兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率存在差異,甲校學(xué)生的數(shù)學(xué)成績優(yōu)秀率比乙校學(xué)生的高.思考

兩個例題基于同一組數(shù)據(jù)的分析的兩種分析方法(條件概率法和卡方獨(dú)立性檢驗(yàn)法),但卻得出了不同的結(jié)論,你能說明其中的原因嗎?

事實(shí)上,中的例1只是根據(jù)一個樣本的兩個頻率間存在差異得出兩校學(xué)生數(shù)學(xué)成績優(yōu)秀率有差異的結(jié)論,并沒有考慮由樣本隨機(jī)性可能導(dǎo)致的錯誤,所以其的推斷依據(jù)不太充分.

在本節(jié)例1中,我們用χ2獨(dú)立性檢驗(yàn)對零假設(shè)H0進(jìn)行了檢驗(yàn).通過計(jì)算,發(fā)現(xiàn)χ2≈0.837小于α=0.1所對應(yīng)的臨界值2.706,因此認(rèn)為沒有充分證據(jù)推斷H0不成立,所以接受H0,推斷出兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率沒有顯著差異的結(jié)論。

這個檢驗(yàn)結(jié)果意味著,抽樣數(shù)據(jù)中兩個頻率的差異很有可能是由樣本隨機(jī)性導(dǎo)致的.因此,只根據(jù)頻率的差異得出兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率有差異的結(jié)論是不可靠的.由此可見,相對于簡單比較兩個頻率的推斷:用χ2獨(dú)立性檢驗(yàn)得到的結(jié)果更理性、更全面,理論依據(jù)也更充分.新知學(xué)習(xí)例2

某兒童醫(yī)院用甲、乙兩種療法治療小兒消化不良.采用有放回簡單隨機(jī)抽樣的方法對治療情況進(jìn)行檢查,得到了如下數(shù)據(jù):抽到接受甲種療法的患兒67名,其中未治愈15名,治愈52名;抽到接受乙種療法的患兒69名,其中未治愈6名,治愈63名.試根據(jù)小概率值α=0.005的獨(dú)立性檢驗(yàn),分析乙種療法的效果是否比甲種療法好.解:零假設(shè)為H0:療法與療效獨(dú)立,即兩種療法效果沒有差異,由已知數(shù)據(jù)列出2×2列聯(lián)表,如下:療法療效合計(jì)未治愈治愈甲155267乙66369合計(jì)21115136根據(jù)小概率值α=0.005的χ2獨(dú)立性檢驗(yàn),沒有充分證據(jù)推斷H0不成立,因此可以認(rèn)為H0成立,即認(rèn)為兩種療法效果沒有差異.新知學(xué)習(xí)思考

若對調(diào)例2的2×2列聯(lián)表中兩種療法數(shù)據(jù),則卡方計(jì)算公式中

a,b,c,d的賦值都會相應(yīng)地改變.這樣做會影響

χ2取值的計(jì)算結(jié)果嗎?療法療效合計(jì)未治愈治愈甲155267乙66369合計(jì)21115136對調(diào)前療法療效合計(jì)未治愈治愈甲66369乙155267合計(jì)21115136對調(diào)后這說明,對調(diào)兩種療法的位置,不會影響χ2取值的計(jì)算結(jié)果,同理對調(diào)兩種療效的位置也不會影響結(jié)果.新知學(xué)習(xí)例3

為研究吸煙是否與肺癌有關(guān),某腫瘤研究所采取有放回簡單隨機(jī)抽樣的方法,調(diào)查了9965人,得到成對樣本觀測數(shù)據(jù)的分類統(tǒng)計(jì)結(jié)果,如表所示.依據(jù)小概率值α=0.001的獨(dú)立性檢驗(yàn),分析吸煙是否會增加患肺癌的風(fēng)險.吸煙肺癌合計(jì)非肺癌患者肺癌患者非吸煙者7775427817吸煙者2099492148合計(jì)9874919965解:零假設(shè)為H0:吸煙和患肺癌之間沒有關(guān)聯(lián).根據(jù)列聯(lián)表中的數(shù)據(jù),經(jīng)計(jì)算得到

根據(jù)小概率值α=0.001的χ2

獨(dú)立性檢驗(yàn),推斷

H0不成立,即認(rèn)為吸煙與患肺癌有關(guān)聯(lián),此推斷犯錯誤的概率不大于

0.001

.新知學(xué)習(xí)解:用頻率進(jìn)行比較:不吸煙者中患肺癌的頻率為吸煙者中患肺癌的頻率為兩者的比值為在被調(diào)查者中,吸煙者患肺癌的頻率是不吸煙者患肺癌的頻率的4倍以上,根據(jù)頻率穩(wěn)定于概率的原理,我們可以認(rèn)為吸煙者患肺癌的概率明顯大于不吸煙者患肺癌的概率,即吸煙更容易引發(fā)肺癌.新知學(xué)習(xí)例3

為研究吸煙是否與肺癌有關(guān),某腫瘤研究所采取有放回簡單隨機(jī)抽樣的方法,調(diào)查了9965人,得到成對樣本觀測數(shù)據(jù)的分類統(tǒng)計(jì)結(jié)果,如表所示.依據(jù)小概率值α=0.001的獨(dú)立性檢驗(yàn),分析吸煙是否會增加患肺癌的風(fēng)險.吸煙肺癌合計(jì)非肺癌患者肺癌患者非吸煙者7775427817吸煙者2099492148合計(jì)9874919965知識歸納(1)提出零假設(shè)H0:X和Y相互獨(dú)立,并給出在問題中的解釋.(2)根據(jù)抽樣數(shù)據(jù)整理出2×2列聯(lián)表,計(jì)算χ2的值,并與臨界值比較.(3)根據(jù)檢驗(yàn)規(guī)則得出推斷結(jié)論.(4)在X和Y不獨(dú)立的情況下,根據(jù)需要,通過比較相應(yīng)的頻率,分析X和Y間的影響規(guī)律.應(yīng)用獨(dú)立性檢驗(yàn)解決實(shí)際問題主要環(huán)節(jié):注意,上述幾個環(huán)節(jié)的內(nèi)容可以根據(jù)不同的情況進(jìn)行調(diào)整.例如,在有些時候,分類變量的抽樣數(shù)據(jù)列聯(lián)表是問題中給定的新知學(xué)習(xí)獨(dú)立性檢驗(yàn)反證法思考

獨(dú)立性檢驗(yàn)的思想類似于我們常用的反證法,你能指出二者之間的相同和不同之處嗎?

在某種假設(shè)H0下,如果推出一個矛盾,則證明H0不成立;若未能推出矛盾,不能對H0下任何結(jié)論,即反證法不成功.

在零假設(shè)H0下,如果出現(xiàn)一個與H0相矛盾的小概率事件,則推斷H0不成立,且該推斷犯錯誤的概率不大于這個小概率.否則,不能推斷H0不成立,通常會接受H0,即認(rèn)為兩個分類變量相互獨(dú)立.反證法不會犯錯誤獨(dú)立性檢驗(yàn)會犯隨機(jī)性錯誤獨(dú)立性檢驗(yàn)是一種“概率反證法”。新知學(xué)習(xí)1.下列關(guān)于χ2的說法中正確的是(

)A.χ2越大,“變量A,B有關(guān)聯(lián)”的可信度越小B.χ2越大,“變量A,B無關(guān)”的可信度越大C.χ2越小,“變量A,B有關(guān)聯(lián)”的可信度越小D.χ2越小,“變量A,B無關(guān)”的可信度越小C2.下列選項(xiàng)中,可以有95%以上的把握認(rèn)為“A與B有關(guān)系”的是(

)A.χ2=2.700

B.χ2=2.710C.χ2=3.765

D.χ2=5.014D3.在吸煙與患肺病是否相關(guān)的計(jì)算中,有下面的說法正確的有(

)①若χ2=6.635,我們有99%的把握判定吸煙與患肺病有關(guān)聯(lián),那么在100個吸煙的人中必有99個人患肺?。虎趶莫?dú)立性檢驗(yàn)可知有99%的把握判定吸煙與患肺病有關(guān)聯(lián)時,若某人吸煙,那么他有99%的可能患有肺病;③從統(tǒng)計(jì)量中求出有95%的把握判定吸煙與患肺病有關(guān)聯(lián),是指有5%的可能性使得推斷出現(xiàn)錯誤.③隨堂練習(xí)4.為考察某種藥物A對預(yù)防疾病B的效果,進(jìn)行了動物試驗(yàn),根據(jù)105個有放回簡單隨機(jī)樣本的數(shù)據(jù),得到如下列聯(lián)表:依據(jù)

α=0.05的獨(dú)立性檢驗(yàn),分析藥物A對預(yù)防疾病B的有效性.藥物A疾病B合計(jì)未患病患病未服用291544服用471461合計(jì)7629105解:零假設(shè)為

H0:藥物A與預(yù)防疾病B無關(guān)聯(lián),即藥物A對預(yù)防疾病B沒有效果,根據(jù)列聯(lián)表中數(shù)據(jù),經(jīng)計(jì)算得到根據(jù)小概率值

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論