獨(dú)立性檢驗(yàn)課件(1)高二下學(xué)期數(shù)學(xué)人教A版選擇性_第1頁(yè)
獨(dú)立性檢驗(yàn)課件(1)高二下學(xué)期數(shù)學(xué)人教A版選擇性_第2頁(yè)
獨(dú)立性檢驗(yàn)課件(1)高二下學(xué)期數(shù)學(xué)人教A版選擇性_第3頁(yè)
獨(dú)立性檢驗(yàn)課件(1)高二下學(xué)期數(shù)學(xué)人教A版選擇性_第4頁(yè)
獨(dú)立性檢驗(yàn)課件(1)高二下學(xué)期數(shù)學(xué)人教A版選擇性_第5頁(yè)
已閱讀5頁(yè),還剩29頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

8.3.2獨(dú)立性檢驗(yàn)(1)復(fù)習(xí)引入2.2×2列聯(lián)表定義一對(duì)分類變量X和Y,我們整理數(shù)據(jù)如表所示:XY合計(jì)Y=0Y=1X=0aba+bX=1cdc+d合計(jì)a+cb+dn=a+b+c+d上表是關(guān)于分類變量X和Y的抽樣數(shù)據(jù)的2×2列聯(lián)表:最后一行的前兩個(gè)數(shù)分別是事件{Y=0}和{Y=1}的

;最后一列的前兩個(gè)數(shù)分別是事件{X=0}和{X=1}的_;中間的四個(gè)數(shù)a,b,c,d是事件{X=x,Y=y(tǒng)}(x,y=0,1)的

;右下角格中的數(shù)n是

.頻數(shù)頻數(shù)頻數(shù)樣本容量3.等高堆積條形圖等高堆積條形圖和表格相比,更能直觀地反映出兩個(gè)分類變量間是否相互影響,常用等高堆積條形圖展示列聯(lián)表數(shù)據(jù)的

特征,依據(jù)_____________的原理,我們可以推斷結(jié)果.頻率頻率穩(wěn)頻率穩(wěn)定于概率例1:為比較甲、乙兩所學(xué)校學(xué)生的數(shù)學(xué)水平,采用簡(jiǎn)單隨機(jī)抽樣的方法抽取88名學(xué)生.通過(guò)測(cè)驗(yàn)得到了如下數(shù)據(jù):甲校43名學(xué)生中有10名數(shù)學(xué)成績(jī)優(yōu)秀;乙校45名學(xué)生中有7名數(shù)學(xué)成績(jī)優(yōu)秀.試分析兩校學(xué)生中數(shù)學(xué)成績(jī)優(yōu)秀率之間是否存在差異.回顧上節(jié)課的例1學(xué)校數(shù)學(xué)成績(jī)合計(jì)不優(yōu)秀(Y=0)優(yōu)秀(Y=1)甲校(X=0)331043乙校(X=1)38745合計(jì)711788依據(jù)頻率穩(wěn)定于概率的原理,我們可以推斷甲校學(xué)生數(shù)學(xué)成績(jī)優(yōu)秀的概率大于乙校學(xué)生數(shù)學(xué)成績(jī)優(yōu)秀的概率.探究二:獨(dú)立性檢驗(yàn)課本126頁(yè)思考:你認(rèn)為“兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率存在差異”這一結(jié)論是否有可能是錯(cuò)誤的?這一結(jié)論有可能是錯(cuò)誤的.事實(shí)上,“兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率存在差異”這個(gè)結(jié)論是根據(jù)兩個(gè)頻率間存在差異推斷出來(lái)的.有可能出現(xiàn)這種情況:在隨機(jī)抽取的這個(gè)樣本中,兩個(gè)頻率間確實(shí)存在差異,但兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率實(shí)際上是沒(méi)有差別的.對(duì)于隨機(jī)樣本而言,因?yàn)轭l率具有隨機(jī)性,頻率與概率之間存在誤差,所以我們的推斷可能犯錯(cuò)誤,而且在樣本容量較小時(shí),犯錯(cuò)誤的可能性會(huì)較大.因此,需要找到一種更為合理的推斷方法,同時(shí)也希望能對(duì)出現(xiàn)錯(cuò)誤推斷的概率有一定的控制或估算.這里,P(Y=1|X=0)表示從{X=0}中隨機(jī)選一個(gè)樣本點(diǎn),該樣本點(diǎn)屬于{X=0,Y=1}的概率;P(Y=1|X=1)表示從{X=1}中隨機(jī)選一個(gè)樣本點(diǎn),該樣本點(diǎn)屬于{X=1,Y=1}的概率.考慮以Ω為樣本空間的古典概型.設(shè)X和Y定義在Ω上,取值于{0,1}的成對(duì)分類變量.我們希望判斷事件{X=1}和{Y=1}之間是否有關(guān)聯(lián).我們需要判斷下面的假定關(guān)系是否成立,通常稱H0為零假設(shè)或原假設(shè).抽象簡(jiǎn)化列聯(lián)表如下:Y=0Y=1X=0X=0,Y=0X=0,Y=1X=1X=1,Y=0X=1,Y=1{X=1}與{Y=1}是否有關(guān)聯(lián)呢?注意到{X=0}與{X=1}對(duì)立,{Y=0}與{Y=1}對(duì)立,零假設(shè)或原假設(shè):由條件概率的定義可知,零假設(shè)H0等價(jià)于由于{X=0}和{X=1}為對(duì)立事件,故有因此,零假設(shè)H0等價(jià)于{X=1}和{Y=1}獨(dú)立.Y=0Y=1X=0X=0,Y=0X=0,Y=1X=1X=1,Y=0X=1,Y=1根據(jù)已經(jīng)學(xué)過(guò)的概率知識(shí),下面的四條性質(zhì)彼此等價(jià):{X=0}與{Y=0}獨(dú)立{X=0}與{Y=1}獨(dú)立{X=1}與{Y=0}獨(dú)立{X=1}與{Y=1}獨(dú)立②如果這些性質(zhì)成立,我們就稱分類變量X和Y獨(dú)立.因此,我們可以用概率語(yǔ)言,將零假設(shè)改述為

H0:分類變量X和Y獨(dú)立.思考:如何基于②中的四個(gè)等式及下列2×2列聯(lián)表中的數(shù)據(jù),構(gòu)造適當(dāng)?shù)慕y(tǒng)計(jì)量,對(duì)成對(duì)分類變量X和Y是否相互獨(dú)立作出推斷?XY合計(jì)Y=0Y=1X=0aba+bX=1cdc+d合計(jì)a+cb+da+b+c+dXY合計(jì)Y=0Y=1X=0aba+bX=1cdc+d合計(jì)a+cb+da+b+c+d{X=0,Y=0}發(fā)生的頻數(shù)的期望值(或預(yù)期值)為思考:如何衡量頻數(shù)的期望值Ea與實(shí)際值a的差別呢?如果零假設(shè)H0成立,下面四個(gè)量的取值都不應(yīng)該太大:反之,當(dāng)這些量的取值較大時(shí),就可以推斷H0不成立.顯然,分別考慮上面四個(gè)差的絕對(duì)值很困難,我們需要找到一個(gè)既合理又能夠計(jì)算分布的統(tǒng)計(jì)量,來(lái)推斷H0是否成立.一般來(lái)說(shuō),若頻數(shù)的期望值較大,則差的絕對(duì)值也會(huì)較大;而若頻數(shù)的期望值較小,則相應(yīng)的差的絕對(duì)值也會(huì)較小.為了合理地平衡這種影響,我們將四個(gè)差的絕對(duì)值取平方后分別除以相應(yīng)的期望值再求和,得到如下的統(tǒng)計(jì)量:該表達(dá)式可化簡(jiǎn)為上述表達(dá)式是χ2的計(jì)算公式,

χ2讀作“卡方”.卡方統(tǒng)計(jì)量思考:卡方統(tǒng)計(jì)量有什么用呢?隨機(jī)變量χ2取值的大小可作為判斷零假設(shè)H0是否成立的依據(jù),當(dāng)它比較大時(shí)推斷H0不成立,否則認(rèn)為H0成立.χ2計(jì)算公式:思考:究竟χ2大到什么程度,可以推斷H0不成立呢?或者說(shuō),怎樣確定判斷χ2大小的標(biāo)準(zhǔn)呢?根據(jù)小概率事件在一次試驗(yàn)中不大可能發(fā)生的規(guī)律,上面的想法可以通過(guò)確定一個(gè)與H0相矛盾的小概率事件來(lái)實(shí)現(xiàn).在假定H0的條件下,對(duì)于有放回簡(jiǎn)單隨機(jī)抽樣,當(dāng)樣本容量

n充分大時(shí),統(tǒng)計(jì)學(xué)家得到了χ2的近似分布.忽略χ2的實(shí)際分

布與該近似分布的誤差后,對(duì)于任何小概率值α,可以找到

相應(yīng)的正實(shí)數(shù)xα,使得下面關(guān)系成立:我們稱xα為α的臨界值,這個(gè)臨界值就可以作為判斷χ2大小的標(biāo)準(zhǔn).概率值α越小,臨界值xα越大.由P(χ2≥xα)=α可知,只要把概率值α取得充分小,在假設(shè)H0的情況下,事件{χ2≥xα}是不大可能發(fā)生的.根據(jù)這個(gè)規(guī)律,如果該事件發(fā)生,我們就可以推斷H0不成立.不過(guò)這個(gè)推斷有可能犯錯(cuò)誤,但犯錯(cuò)誤的概率不會(huì)超過(guò)α.xαα概率值α越小,臨界值xα越大.基于小概率值α的檢驗(yàn)規(guī)則是:當(dāng)χ2≥xα?xí)r,我們就推斷H0不成立,即認(rèn)為X和Y不獨(dú)立,該推斷犯錯(cuò)誤的概率不超過(guò)α;當(dāng)χ2<xα?xí)r,我們沒(méi)有充分證據(jù)推斷H0不成立,可以認(rèn)為X和Y獨(dú)立.這種利用χ2的取值推斷分類變量X和Y是否獨(dú)立的方法稱為χ2獨(dú)立性檢驗(yàn),讀作“卡方獨(dú)立性檢驗(yàn)”,簡(jiǎn)稱獨(dú)立性檢驗(yàn).下表給出了χ2獨(dú)立性檢驗(yàn)中幾個(gè)常用的小概率值和相應(yīng)的臨界值.α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828例如,對(duì)于小概率值α=0.05,我們有如下的具體檢驗(yàn)規(guī)則:(1)當(dāng)χ2≥x0.05=3.841時(shí),我們推斷H0不成立,即認(rèn)為X和Y不獨(dú)立,該推斷犯錯(cuò)誤的概率不超過(guò)0.05;(2)當(dāng)χ2<x0.05=3.841時(shí),我們沒(méi)有充分證據(jù)推斷H0不成立,可以認(rèn)為X和Y獨(dú)立.解:零假設(shè)為H0:分類變量X與Y相互獨(dú)立,即兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率無(wú)差異.例:依據(jù)小概率值α=0.1的χ2獨(dú)立性檢驗(yàn),分析例1(課本126)中的抽樣數(shù)據(jù),能否據(jù)此推斷兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率有差異?學(xué)校數(shù)學(xué)成績(jī)合計(jì)不優(yōu)秀(Y=0)優(yōu)秀(Y=1)甲校(X=0)331043乙校(X=1)38745合計(jì)711788α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828根據(jù)小概率值α=0.1的χ2獨(dú)立性檢驗(yàn),沒(méi)有充分證據(jù)推斷H0不成立,因此可以認(rèn)為H0成立,即認(rèn)為兩校的數(shù)學(xué)成績(jī)優(yōu)秀率沒(méi)有差異.例題課本131頁(yè)根據(jù)表中的數(shù)據(jù),計(jì)算得到思考:例1(課本126)和本例都是基于同一組數(shù)據(jù)的分析,但卻得出了不同的結(jié)論,你能說(shuō)明其中的原因嗎?事實(shí)上,如前所述,例1只是根據(jù)一個(gè)樣本的兩個(gè)頻率間存在差異得出兩校學(xué)生數(shù)學(xué)成績(jī)優(yōu)秀率有差異的結(jié)論,并沒(méi)有考慮由樣本隨機(jī)性可能導(dǎo)致的錯(cuò)誤,所以例1的推斷依據(jù)不太充分.在本例中,我們用χ2獨(dú)立性檢驗(yàn)對(duì)零假設(shè)H0進(jìn)行了檢驗(yàn).

通過(guò)計(jì)算,發(fā)現(xiàn)χ2≈0.837小于α=0.1所對(duì)應(yīng)的臨界值2.706,因此認(rèn)為沒(méi)有充分證據(jù)推斷H0不成立,所以接受H0,推斷出兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率沒(méi)有顯著差異的結(jié)論.這個(gè)檢驗(yàn)結(jié)果意味著,抽樣數(shù)據(jù)中兩個(gè)頻率的差異很有可能是由樣本隨機(jī)性導(dǎo)致的.

因此,只根據(jù)頻率的差異得出兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率有差異的結(jié)論是不可靠的.由此可見(jiàn),相對(duì)于簡(jiǎn)單比較兩個(gè)頻率的推斷,用χ2獨(dú)立性檢驗(yàn)得到的結(jié)果更理性、更全面,理論依據(jù)也更充分.練習(xí)1.對(duì)196個(gè)接受心臟搭橋手術(shù)的病人和196個(gè)接受血管清障手術(shù)的病人進(jìn)行了3年的跟蹤研究,調(diào)查他們是否又發(fā)作過(guò)心臟病,調(diào)查結(jié)果如下表所示:手術(shù)心臟病合計(jì)又發(fā)作過(guò)未發(fā)作過(guò)心臟搭橋39157196血管清障29167196合計(jì)68324392試根據(jù)上述數(shù)據(jù)計(jì)算χ2≈__________,能否根據(jù)小概率值α=0.1的獨(dú)立性檢驗(yàn)作出這兩種手術(shù)對(duì)病人又發(fā)作心臟病的影響有差別的結(jié)論________(填“能”或“不能”).1.779不能χ2<2.076=x0.1,根據(jù)小概率值α=0.1的χ2獨(dú)立性檢驗(yàn),我們沒(méi)有充分的證據(jù)推斷H0不成立,即認(rèn)為這兩種手術(shù)對(duì)病人又發(fā)作心臟病的影響無(wú)差別.課本134頁(yè)2.為考察某種藥物A對(duì)預(yù)防疾病B的效果,進(jìn)行了動(dòng)物試驗(yàn),根據(jù)105個(gè)有放回簡(jiǎn)單隨機(jī)樣本的數(shù)據(jù),得到如下列聯(lián)表:依據(jù)α=0.05的獨(dú)立性檢驗(yàn),分析藥物A對(duì)預(yù)防疾病B的有效性.藥物A疾病B合計(jì)未患病患病未服用291544服用471461合計(jì)7629105α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828解:零假設(shè)為H0:藥物A與預(yù)防疾病B無(wú)關(guān)聯(lián),即藥物A對(duì)預(yù)防疾病B沒(méi)有效果,根據(jù)列聯(lián)表中數(shù)據(jù),經(jīng)計(jì)算得到根據(jù)小概率值α=0.05的χ2獨(dú)立性檢驗(yàn),沒(méi)有充分證據(jù)推斷H0不成立,即可以認(rèn)為藥物A對(duì)預(yù)防疾病B沒(méi)有效果.則χ2約為(

)1.高二第二學(xué)期期中考試,按照甲、乙兩個(gè)班學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀和及格統(tǒng)計(jì)人數(shù)后,得到如下列聯(lián)表:

優(yōu)秀及格合計(jì)甲班113445乙班83745合計(jì)197190隨堂檢測(cè)2.下表是某屆某校本科志愿報(bào)名時(shí),對(duì)其中304名學(xué)生進(jìn)入高校時(shí)是否知道想學(xué)專業(yè)的調(diào)查表:

知道想學(xué)專業(yè)不知道想學(xué)專業(yè)合計(jì)男生63117180女生4282124合計(jì)105199304根據(jù)表中數(shù)據(jù),則下列說(shuō)法正確的是______.(填序號(hào))①性別與知道想學(xué)專業(yè)有關(guān);②性別與知道想學(xué)專業(yè)無(wú)關(guān);③女生比男生更易知道所學(xué)專業(yè).②所以性別與知道想學(xué)專業(yè)無(wú)關(guān).3.學(xué)校舉行運(yùn)動(dòng)會(huì),為了搞好接待工作,組委會(huì)招募了16名男志愿者和14名女志愿者,調(diào)查發(fā)現(xiàn),男、女志愿者中分別有10人和6人喜愛(ài)運(yùn)動(dòng),其余人不喜愛(ài)運(yùn)動(dòng).(1)根據(jù)以上數(shù)據(jù)完成以下2×2列聯(lián)表:

運(yùn)動(dòng)的喜好合計(jì)喜愛(ài)運(yùn)動(dòng)不喜愛(ài)運(yùn)動(dòng)

男10

16女6

14合計(jì)

30解:

喜愛(ài)運(yùn)動(dòng)不喜愛(ài)運(yùn)動(dòng)合計(jì)男10616女6814合計(jì)161430(2)根據(jù)列聯(lián)表的獨(dú)立性檢驗(yàn),能否在犯錯(cuò)誤的概率不超過(guò)0.10的前提下認(rèn)為性別與喜愛(ài)運(yùn)動(dòng)有關(guān)?解:零假設(shè)為H0:喜愛(ài)運(yùn)動(dòng)與性別無(wú)關(guān),由已知數(shù)據(jù)可得因?yàn)?.1575<2.706=x0.1,根據(jù)小概率值α=0.1的獨(dú)立性檢驗(yàn),沒(méi)有充分證據(jù)推斷H0不成立,即認(rèn)為性別與喜愛(ài)運(yùn)動(dòng)無(wú)關(guān).4.為了探究學(xué)生選報(bào)文、理科與對(duì)外語(yǔ)的興趣是否有關(guān),某同學(xué)調(diào)查了361名高二在校學(xué)生,調(diào)查結(jié)果如下:理科生對(duì)外語(yǔ)有興趣的有138人,無(wú)興趣的有98人,文科生對(duì)外語(yǔ)有興趣的有73人,無(wú)興趣的有52人.試根據(jù)小概率值α=0.1的獨(dú)立性檢驗(yàn),分析學(xué)生選報(bào)文、理科與對(duì)外語(yǔ)的興趣是否有關(guān)?解:零假設(shè)為H0:選報(bào)文、理科與對(duì)外語(yǔ)的興趣無(wú)關(guān).列出2×2列聯(lián)表對(duì)外語(yǔ)興趣選報(bào)文、理科合計(jì)理文有13873211無(wú)9852150合計(jì)236125361代入公式得∵1.871×10-4<2.706=x0.1,根據(jù)小概率值α=0.1的χ2獨(dú)立性檢驗(yàn),沒(méi)有充分證據(jù)推斷H0不成立,即選報(bào)文、理科與對(duì)外語(yǔ)的興趣無(wú)關(guān).5.為了檢驗(yàn)兩種不同的課堂教學(xué)模式對(duì)學(xué)生的成績(jī)是否有影響,現(xiàn)從高二年級(jí)的甲(實(shí)行“問(wèn)題—探究式”模式)、乙(實(shí)行“自學(xué)—指導(dǎo)式”模式)兩個(gè)班中每班任意抽取20名學(xué)生進(jìn)行測(cè)試,他們的成績(jī)(總分150分)如下.甲班:88929598103108110112118118

120121126132134135140142146148乙班:9697104107108108114117119121124124125127132135135137138

147記成績(jī)?cè)?20分以上(包括120分)為優(yōu)秀,其他的成績(jī)?yōu)橐话?,試根?jù)小概率

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論