8.3.2獨(dú)立性檢驗(yàn)課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第1頁(yè)
8.3.2獨(dú)立性檢驗(yàn)課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第2頁(yè)
8.3.2獨(dú)立性檢驗(yàn)課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第3頁(yè)
8.3.2獨(dú)立性檢驗(yàn)課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第4頁(yè)
8.3.2獨(dú)立性檢驗(yàn)課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第5頁(yè)
已閱讀5頁(yè),還剩21頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

獨(dú)立性檢驗(yàn)一、復(fù)習(xí)引入某藥廠研制一種新藥,宣稱(chēng)對(duì)治療某種疾病的有效率為90%.隨機(jī)選擇了10名患者,經(jīng)過(guò)使用該藥治療后,治愈的人數(shù)不超過(guò)六人.你是否懷疑藥廠的宣傳?請(qǐng)說(shuō)明理由.問(wèn)題1.1“藥廠的宣傳夸大了有效率”這一判斷是否一定正確?為什么?問(wèn)題1.2

這種假設(shè)檢驗(yàn)與之前學(xué)習(xí)的什么方法比較類(lèi)似?它們的相同點(diǎn)、不同點(diǎn)是什么?反證法假設(shè)檢驗(yàn)相同點(diǎn)方法相同。假設(shè)檢驗(yàn)和反證法都是在某種假設(shè)下推出矛盾,從而證明假設(shè)不成立或拒絕零假設(shè)。不同點(diǎn)結(jié)論一定正確假設(shè)檢驗(yàn)給出的結(jié)論可能會(huì)出錯(cuò),出錯(cuò)的概率可以控制在小概率內(nèi)。例1

為比較甲、乙兩所學(xué)校學(xué)生的數(shù)學(xué)水平,采用簡(jiǎn)單隨機(jī)抽樣的方法抽取88名學(xué)生.通過(guò)測(cè)驗(yàn)得到了如下數(shù)據(jù):甲校43名學(xué)生中有10名數(shù)學(xué)成績(jī)優(yōu)秀;乙校45名學(xué)生中有7名數(shù)學(xué)成績(jī)優(yōu)秀.試分析兩校學(xué)生中數(shù)學(xué)成績(jī)優(yōu)秀率之間是否存在差異.解:用Ω表示兩所學(xué)校的全體學(xué)生構(gòu)成的集合.考慮以Ω為樣本空間的古典概型.對(duì)于Ω中每一名學(xué)生,定義分類(lèi)變量X和Y如下:881771合計(jì)45738乙校(X=1)431033甲校(X=0)優(yōu)秀(Y=1)不優(yōu)秀(Y=0)合計(jì)數(shù)學(xué)成績(jī)學(xué)校

典例分析因此,甲校學(xué)生中數(shù)學(xué)成績(jī)不優(yōu)秀和數(shù)學(xué)成績(jī)優(yōu)秀的頻率分別為可以用等高堆積條形圖直觀地展示上述計(jì)算結(jié)果:通過(guò)比較發(fā)現(xiàn),兩個(gè)學(xué)校學(xué)生抽樣數(shù)據(jù)中數(shù)學(xué)成績(jī)優(yōu)秀的頻率存在差異,甲校的頻率明顯高于乙校的頻率.依據(jù)頻率穩(wěn)定于概率的原理,我們可以推斷甲校學(xué)生數(shù)學(xué)成績(jī)優(yōu)秀的概率大于乙校學(xué)生數(shù)學(xué)成績(jī)優(yōu)秀的概率.乙校學(xué)生中數(shù)學(xué)成績(jī)不優(yōu)秀和數(shù)學(xué)成績(jī)優(yōu)秀的頻率分別為

因此,可以認(rèn)為兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率存在差異,甲校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率比乙校學(xué)生的高.等高堆積條形圖思考2:你認(rèn)為“兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率存在差異”這一結(jié)論是否有可能是錯(cuò)誤的?甲校學(xué)生中數(shù)學(xué)成績(jī)優(yōu)秀的頻率為:乙校學(xué)生中數(shù)學(xué)成績(jī)優(yōu)秀的頻率為:依據(jù)頻率穩(wěn)定于概率的原理,可推斷P(Y=1|X=0)>P(Y=1|X=1).即甲校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率比乙校學(xué)生的高,故可認(rèn)為兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率存在差異.“兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率存在差異”這個(gè)結(jié)論是根據(jù)兩個(gè)頻率間存在差異推斷出來(lái)的.但有可能在隨機(jī)抽取的樣本中,兩個(gè)頻率間確實(shí)存在差異,但兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率實(shí)際上是沒(méi)有差別的.導(dǎo)致推斷放錯(cuò)誤的原因:①樣本容量較小,導(dǎo)致頻率與概率的誤差較大;②樣本具有隨機(jī)性,因而頻率有隨機(jī)性,頻率和概率之間存在誤差;思考3:有多大的把握推斷“學(xué)校與優(yōu)秀率有關(guān)”?這個(gè)推斷犯錯(cuò)誤的可能性多大?希望能對(duì)出現(xiàn)錯(cuò)誤推斷的概率有一定的控制或估算.典例分析例1

為比較甲、乙兩所學(xué)校學(xué)生的數(shù)學(xué)水平,采用簡(jiǎn)單隨機(jī)抽樣的方法抽取88名學(xué)生.通過(guò)測(cè)驗(yàn)得到了如下數(shù)據(jù):甲校43名學(xué)生中有10名數(shù)學(xué)成績(jī)優(yōu)秀;乙校45名學(xué)生中有7名數(shù)學(xué)成績(jī)優(yōu)秀.試分析兩校學(xué)生中數(shù)學(xué)成績(jī)優(yōu)秀率之間是否存在差異.兩校學(xué)生中數(shù)學(xué)成績(jī)優(yōu)秀率之間是否存在差異“所屬學(xué)校”與“優(yōu)秀與否”這兩個(gè)分類(lèi)變量是否相關(guān)聯(lián)由于樣本具有隨機(jī)性,所以用頻率判斷得出的結(jié)論可能是錯(cuò)的,因此我們需要尋找更加合理的推斷方法二、探索新知:獨(dú)立檢驗(yàn)之零假設(shè)探究:如何從概率的角度,研究?jī)蓚€(gè)分類(lèi)變量是否有關(guān)聯(lián)?研究“兩個(gè)分類(lèi)變量是否有關(guān)聯(lián)”

研究?“兩個(gè)分類(lèi)變量是否互相影響”“兩個(gè)分類(lèi)變量是否互相獨(dú)立”問(wèn)題3:研究事件A、B是否相互獨(dú)立,如果直接研究不方便,不妨做一個(gè)假設(shè)。從概率的角度思考:“假設(shè)獨(dú)立”與“假設(shè)不獨(dú)立”哪個(gè)更好?假設(shè)獨(dú)立更好事件A、B相互獨(dú)立提出零假設(shè)H0:“所屬學(xué)?!芭c”優(yōu)秀與否“無(wú)關(guān)(即事件A、B相互獨(dú)立)二、探索新知:獨(dú)立檢驗(yàn)之零假設(shè)為了研究一般情況,把表格中的數(shù)字用字母代替,得到2x2列聯(lián)表(表1)a+b+c+db+da+c合計(jì)c+ddc乙校()a+bba甲校(A)不優(yōu)秀()優(yōu)秀(B)合計(jì)數(shù)學(xué)成績(jī)學(xué)校

寫(xiě)一寫(xiě):在假設(shè)H0成立下,令n=a+b+c+d,請(qǐng)根據(jù)觀測(cè)值表,寫(xiě)出下列事件的概率:零假設(shè):”所屬學(xué)?!芭c”優(yōu)秀與否“無(wú)關(guān)(即事件A、B相互獨(dú)立)寫(xiě)一寫(xiě):在假設(shè)H0成立下,令n=a+b+c+d,請(qǐng)根據(jù)觀測(cè)值表,寫(xiě)出下列事件的概率:零假設(shè):”所屬學(xué)?!芭c”優(yōu)秀與否“無(wú)關(guān)(即事件A、B相互獨(dú)立)算一算:令n=a+b+c+d,在假設(shè)H0成立下,填寫(xiě)下表(表2)中的頻數(shù)的預(yù)測(cè)值:優(yōu)秀不優(yōu)秀甲校乙校想一想:在假設(shè)H0成立下,表1和表2相應(yīng)位置上的數(shù)據(jù)應(yīng)該是什么關(guān)系?如果沒(méi)有此關(guān)系,可以下什么結(jié)論?二、探索新知:獨(dú)立檢驗(yàn)之統(tǒng)計(jì)量試一試:如果要找一個(gè)合理的統(tǒng)計(jì)量來(lái)衡量著兩個(gè)表格對(duì)應(yīng)數(shù)據(jù)之間的差異,進(jìn)而推斷假設(shè)H0是否成立,你覺(jué)得這個(gè)統(tǒng)計(jì)量應(yīng)該怎么表示?卡方統(tǒng)計(jì)量XY合計(jì)Y=0Y=1X=0aba+bX=1cdc+d合計(jì)a+cb+dn=a+b+c+d1900年,英國(guó)數(shù)學(xué)家卡爾.皮爾遜發(fā)布了

統(tǒng)計(jì)量,用來(lái)描述樣本的實(shí)際觀測(cè)值與理論推理之間的吻合程度.當(dāng)

比較大時(shí),推斷零假設(shè)不成立,否則認(rèn)為零假設(shè)成立。卡方統(tǒng)計(jì)量XY合計(jì)Y=0Y=1X=0aba+bX=1cdc+d合計(jì)a+cb+dn=a+b+c+d思考:究竟大到什么程度,可以判斷零假設(shè)不成立?根據(jù)小概率事件在一次試驗(yàn)中不大可能發(fā)生的規(guī)律,可以通過(guò)確定一個(gè)與H0相矛盾的小概率事件來(lái)實(shí)現(xiàn),在假定H0的條件下,對(duì)于有放回簡(jiǎn)單隨機(jī)抽樣,當(dāng)樣本容量n充分大時(shí),統(tǒng)計(jì)學(xué)家得到了χ2的近似分布.思考:究竟

大到什么程度,可以判斷零假設(shè)不成立?

P(χ2≥xα)=α

我們稱(chēng)xα為α的臨界值,這個(gè)臨界值可以作為判斷χ2大小的標(biāo)準(zhǔn).

xαα概率值α越小,臨界值xα越大.

這種利用χ2的取值推斷分類(lèi)變量X和Y是否獨(dú)立的方法稱(chēng)為χ2獨(dú)立性檢驗(yàn),讀作“卡方獨(dú)立性檢驗(yàn)”,簡(jiǎn)稱(chēng)獨(dú)立性檢驗(yàn).

α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828下表給出了χ2獨(dú)立性檢驗(yàn)中幾個(gè)常用的小概率值和相應(yīng)的臨界值:基于小概率值α的檢驗(yàn)規(guī)則:二、探索新知:獨(dú)立檢驗(yàn)追問(wèn)3

怎么看這個(gè)表呢?二、探索新知:獨(dú)立檢驗(yàn)α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828追問(wèn)3

怎么看這個(gè)表呢?思考:對(duì)于小概率值α=0.05,下面兩個(gè)獨(dú)立性檢驗(yàn)說(shuō)明什么?

下表給出了χ2獨(dú)立性檢驗(yàn)中幾個(gè)常用的小概率值和相應(yīng)的臨界值:(1)χ2

≥x0.05=3.841(1)χ2

<

x0.05=3.841α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828追問(wèn)3

怎么看這個(gè)表呢?

按α=0.1的卡方獨(dú)立性檢驗(yàn),沒(méi)有充分證據(jù)推斷H0不成立(數(shù)學(xué)結(jié)論),可以認(rèn)為X和Y獨(dú)立(實(shí)際結(jié)論).

下表給出了χ2獨(dú)立性檢驗(yàn)中幾個(gè)常用的小概率值和相應(yīng)的臨界值:典例解析典例解析

例1

采用簡(jiǎn)單隨機(jī)抽樣的方法得到了如下數(shù)據(jù):甲校43名學(xué)生中有10名數(shù)學(xué)成績(jī)優(yōu)秀;乙校45名學(xué)生中有7名數(shù)學(xué)成績(jī)優(yōu)秀.試分析兩校學(xué)生中數(shù)學(xué)成績(jī)優(yōu)秀率之間是否存在差異.解:列2×2列聯(lián)表零假設(shè)為H0:分類(lèi)變量X與Y相互獨(dú)立,即兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率無(wú)差異.根據(jù)上表中的數(shù)據(jù),計(jì)算得到根據(jù)小概率值α=0.1的卡方獨(dú)立性檢驗(yàn),沒(méi)有充分證據(jù)推斷H0不成立.因此可以認(rèn)為H0成立,即認(rèn)為兩校的數(shù)學(xué)成績(jī)優(yōu)秀率沒(méi)有差異.α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828三、總結(jié)(1)提出零假設(shè)H0:X和Y相互獨(dú)立,并給出在問(wèn)題中的解釋.(2)根據(jù)抽樣數(shù)據(jù)整理出2×2列聯(lián)表,計(jì)算χ2的值,并與臨界值比較.(3)根據(jù)檢驗(yàn)規(guī)則得出推斷結(jié)論.(4)在X和Y不獨(dú)立的情況下,根據(jù)需要,通過(guò)比較相應(yīng)的頻率,分析X和Y間的影響規(guī)律.總結(jié)上面的例子,應(yīng)用獨(dú)立性檢驗(yàn)解決實(shí)際問(wèn)題主要環(huán)節(jié):注意,上述幾個(gè)環(huán)節(jié)的內(nèi)容可以根據(jù)不同的情況進(jìn)行調(diào)整.例如,在有些時(shí)候,分類(lèi)變量的抽樣數(shù)據(jù)列聯(lián)表是問(wèn)題中給定的.例3某兒童醫(yī)院用甲、乙兩種療法治療小兒消化不良.采用有放回簡(jiǎn)單隨機(jī)抽樣的方法對(duì)治療情況進(jìn)行檢查,得到了如下數(shù)據(jù):抽到接受甲種療法的患兒67名,其中未治愈15名,治愈52名;抽到接受乙種療法的患兒69名,其中未治愈6名,治愈63名.試根據(jù)小概率值α=0.005的獨(dú)立性檢驗(yàn),分析乙種療法的效果是否比甲種療法好.

解:

零假設(shè)為H0:療法與療效獨(dú)立,即兩種療法效果沒(méi)有差異療法療效合計(jì)未治愈治愈甲155267乙66369合計(jì)21115136由已知數(shù)據(jù)列出2×2列聯(lián)表,如下:α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828根據(jù)小概率值α=0.005的χ2獨(dú)立性檢驗(yàn),沒(méi)有充分證據(jù)推斷H0不成立,因此可以認(rèn)為H0成立,即認(rèn)為兩種療法效果沒(méi)有差異.典例解析典例解析問(wèn)題5在例3的2×2列聯(lián)表中,若對(duì)調(diào)兩種療法的位置或?qū)φ{(diào)兩種療效的位置,則卡方計(jì)算公式中a,b,c,d的賦值都會(huì)相應(yīng)地改變.這樣做會(huì)影響χ2取值的計(jì)算結(jié)果嗎療法療效合計(jì)未治愈治愈甲155267乙66369合計(jì)21115136對(duì)調(diào)前療法療效合計(jì)未治愈治愈乙66369甲155267合計(jì)21115136對(duì)調(diào)后這說(shuō)明,對(duì)調(diào)兩種療法的位置,不會(huì)影響χ2取值的計(jì)算結(jié)果,同理對(duì)調(diào)兩種療效的位置也不會(huì)影響結(jié)果.鞏固練習(xí)課本134頁(yè)1.對(duì)于例3中的抽樣數(shù)據(jù),采用小概率值α=0.05的獨(dú)立性檢驗(yàn),分析乙種療法的效果是否比甲種療法好.根據(jù)題意,可得解:α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828根據(jù)小概率值α=0.05的χ2獨(dú)立性檢驗(yàn),推斷H0不成立即認(rèn)為兩種療法效果有差異.鞏固練習(xí)課本134頁(yè)2.根據(jù)同一抽查數(shù)據(jù)推斷兩個(gè)分類(lèi)變量之間是否有關(guān)聯(lián),應(yīng)用不同的小概率值,是否會(huì)得出不同的結(jié)論為什么解

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論