8.3.2獨立性檢驗課件高二下學期數(shù)學人教A版選擇性_第1頁
8.3.2獨立性檢驗課件高二下學期數(shù)學人教A版選擇性_第2頁
8.3.2獨立性檢驗課件高二下學期數(shù)學人教A版選擇性_第3頁
8.3.2獨立性檢驗課件高二下學期數(shù)學人教A版選擇性_第4頁
8.3.2獨立性檢驗課件高二下學期數(shù)學人教A版選擇性_第5頁
已閱讀5頁,還剩21頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

獨立性檢驗一、復習引入某藥廠研制一種新藥,宣稱對治療某種疾病的有效率為90%.隨機選擇了10名患者,經(jīng)過使用該藥治療后,治愈的人數(shù)不超過六人.你是否懷疑藥廠的宣傳?請說明理由.問題1.1“藥廠的宣傳夸大了有效率”這一判斷是否一定正確?為什么?問題1.2

這種假設檢驗與之前學習的什么方法比較類似?它們的相同點、不同點是什么?反證法假設檢驗相同點方法相同。假設檢驗和反證法都是在某種假設下推出矛盾,從而證明假設不成立或拒絕零假設。不同點結(jié)論一定正確假設檢驗給出的結(jié)論可能會出錯,出錯的概率可以控制在小概率內(nèi)。例1

為比較甲、乙兩所學校學生的數(shù)學水平,采用簡單隨機抽樣的方法抽取88名學生.通過測驗得到了如下數(shù)據(jù):甲校43名學生中有10名數(shù)學成績優(yōu)秀;乙校45名學生中有7名數(shù)學成績優(yōu)秀.試分析兩校學生中數(shù)學成績優(yōu)秀率之間是否存在差異.解:用Ω表示兩所學校的全體學生構成的集合.考慮以Ω為樣本空間的古典概型.對于Ω中每一名學生,定義分類變量X和Y如下:881771合計45738乙校(X=1)431033甲校(X=0)優(yōu)秀(Y=1)不優(yōu)秀(Y=0)合計數(shù)學成績學校

典例分析因此,甲校學生中數(shù)學成績不優(yōu)秀和數(shù)學成績優(yōu)秀的頻率分別為可以用等高堆積條形圖直觀地展示上述計算結(jié)果:通過比較發(fā)現(xiàn),兩個學校學生抽樣數(shù)據(jù)中數(shù)學成績優(yōu)秀的頻率存在差異,甲校的頻率明顯高于乙校的頻率.依據(jù)頻率穩(wěn)定于概率的原理,我們可以推斷甲校學生數(shù)學成績優(yōu)秀的概率大于乙校學生數(shù)學成績優(yōu)秀的概率.乙校學生中數(shù)學成績不優(yōu)秀和數(shù)學成績優(yōu)秀的頻率分別為

因此,可以認為兩校學生的數(shù)學成績優(yōu)秀率存在差異,甲校學生的數(shù)學成績優(yōu)秀率比乙校學生的高.等高堆積條形圖思考2:你認為“兩校學生的數(shù)學成績優(yōu)秀率存在差異”這一結(jié)論是否有可能是錯誤的?甲校學生中數(shù)學成績優(yōu)秀的頻率為:乙校學生中數(shù)學成績優(yōu)秀的頻率為:依據(jù)頻率穩(wěn)定于概率的原理,可推斷P(Y=1|X=0)>P(Y=1|X=1).即甲校學生的數(shù)學成績優(yōu)秀率比乙校學生的高,故可認為兩校學生的數(shù)學成績優(yōu)秀率存在差異.“兩校學生的數(shù)學成績優(yōu)秀率存在差異”這個結(jié)論是根據(jù)兩個頻率間存在差異推斷出來的.但有可能在隨機抽取的樣本中,兩個頻率間確實存在差異,但兩校學生的數(shù)學成績優(yōu)秀率實際上是沒有差別的.導致推斷放錯誤的原因:①樣本容量較小,導致頻率與概率的誤差較大;②樣本具有隨機性,因而頻率有隨機性,頻率和概率之間存在誤差;思考3:有多大的把握推斷“學校與優(yōu)秀率有關”?這個推斷犯錯誤的可能性多大?希望能對出現(xiàn)錯誤推斷的概率有一定的控制或估算.典例分析例1

為比較甲、乙兩所學校學生的數(shù)學水平,采用簡單隨機抽樣的方法抽取88名學生.通過測驗得到了如下數(shù)據(jù):甲校43名學生中有10名數(shù)學成績優(yōu)秀;乙校45名學生中有7名數(shù)學成績優(yōu)秀.試分析兩校學生中數(shù)學成績優(yōu)秀率之間是否存在差異.兩校學生中數(shù)學成績優(yōu)秀率之間是否存在差異“所屬學?!迸c“優(yōu)秀與否”這兩個分類變量是否相關聯(lián)由于樣本具有隨機性,所以用頻率判斷得出的結(jié)論可能是錯的,因此我們需要尋找更加合理的推斷方法二、探索新知:獨立檢驗之零假設探究:如何從概率的角度,研究兩個分類變量是否有關聯(lián)?研究“兩個分類變量是否有關聯(lián)”

研究?“兩個分類變量是否互相影響”“兩個分類變量是否互相獨立”問題3:研究事件A、B是否相互獨立,如果直接研究不方便,不妨做一個假設。從概率的角度思考:“假設獨立”與“假設不獨立”哪個更好?假設獨立更好事件A、B相互獨立提出零假設H0:“所屬學校“與”優(yōu)秀與否“無關(即事件A、B相互獨立)二、探索新知:獨立檢驗之零假設為了研究一般情況,把表格中的數(shù)字用字母代替,得到2x2列聯(lián)表(表1)a+b+c+db+da+c合計c+ddc乙校()a+bba甲校(A)不優(yōu)秀()優(yōu)秀(B)合計數(shù)學成績學校

寫一寫:在假設H0成立下,令n=a+b+c+d,請根據(jù)觀測值表,寫出下列事件的概率:零假設:”所屬學?!芭c”優(yōu)秀與否“無關(即事件A、B相互獨立)寫一寫:在假設H0成立下,令n=a+b+c+d,請根據(jù)觀測值表,寫出下列事件的概率:零假設:”所屬學?!芭c”優(yōu)秀與否“無關(即事件A、B相互獨立)算一算:令n=a+b+c+d,在假設H0成立下,填寫下表(表2)中的頻數(shù)的預測值:優(yōu)秀不優(yōu)秀甲校乙校想一想:在假設H0成立下,表1和表2相應位置上的數(shù)據(jù)應該是什么關系?如果沒有此關系,可以下什么結(jié)論?二、探索新知:獨立檢驗之統(tǒng)計量試一試:如果要找一個合理的統(tǒng)計量來衡量著兩個表格對應數(shù)據(jù)之間的差異,進而推斷假設H0是否成立,你覺得這個統(tǒng)計量應該怎么表示?卡方統(tǒng)計量XY合計Y=0Y=1X=0aba+bX=1cdc+d合計a+cb+dn=a+b+c+d1900年,英國數(shù)學家卡爾.皮爾遜發(fā)布了

統(tǒng)計量,用來描述樣本的實際觀測值與理論推理之間的吻合程度.當

比較大時,推斷零假設不成立,否則認為零假設成立??ǚ浇y(tǒng)計量XY合計Y=0Y=1X=0aba+bX=1cdc+d合計a+cb+dn=a+b+c+d思考:究竟大到什么程度,可以判斷零假設不成立?根據(jù)小概率事件在一次試驗中不大可能發(fā)生的規(guī)律,可以通過確定一個與H0相矛盾的小概率事件來實現(xiàn),在假定H0的條件下,對于有放回簡單隨機抽樣,當樣本容量n充分大時,統(tǒng)計學家得到了χ2的近似分布.思考:究竟

大到什么程度,可以判斷零假設不成立?

P(χ2≥xα)=α

我們稱xα為α的臨界值,這個臨界值可以作為判斷χ2大小的標準.

xαα概率值α越小,臨界值xα越大.

這種利用χ2的取值推斷分類變量X和Y是否獨立的方法稱為χ2獨立性檢驗,讀作“卡方獨立性檢驗”,簡稱獨立性檢驗.

α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828下表給出了χ2獨立性檢驗中幾個常用的小概率值和相應的臨界值:基于小概率值α的檢驗規(guī)則:二、探索新知:獨立檢驗追問3

怎么看這個表呢?二、探索新知:獨立檢驗α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828追問3

怎么看這個表呢?思考:對于小概率值α=0.05,下面兩個獨立性檢驗說明什么?

下表給出了χ2獨立性檢驗中幾個常用的小概率值和相應的臨界值:(1)χ2

≥x0.05=3.841(1)χ2

<

x0.05=3.841α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828追問3

怎么看這個表呢?

按α=0.1的卡方獨立性檢驗,沒有充分證據(jù)推斷H0不成立(數(shù)學結(jié)論),可以認為X和Y獨立(實際結(jié)論).

下表給出了χ2獨立性檢驗中幾個常用的小概率值和相應的臨界值:典例解析典例解析

例1

采用簡單隨機抽樣的方法得到了如下數(shù)據(jù):甲校43名學生中有10名數(shù)學成績優(yōu)秀;乙校45名學生中有7名數(shù)學成績優(yōu)秀.試分析兩校學生中數(shù)學成績優(yōu)秀率之間是否存在差異.解:列2×2列聯(lián)表零假設為H0:分類變量X與Y相互獨立,即兩校學生的數(shù)學成績優(yōu)秀率無差異.根據(jù)上表中的數(shù)據(jù),計算得到根據(jù)小概率值α=0.1的卡方獨立性檢驗,沒有充分證據(jù)推斷H0不成立.因此可以認為H0成立,即認為兩校的數(shù)學成績優(yōu)秀率沒有差異.α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828三、總結(jié)(1)提出零假設H0:X和Y相互獨立,并給出在問題中的解釋.(2)根據(jù)抽樣數(shù)據(jù)整理出2×2列聯(lián)表,計算χ2的值,并與臨界值比較.(3)根據(jù)檢驗規(guī)則得出推斷結(jié)論.(4)在X和Y不獨立的情況下,根據(jù)需要,通過比較相應的頻率,分析X和Y間的影響規(guī)律.總結(jié)上面的例子,應用獨立性檢驗解決實際問題主要環(huán)節(jié):注意,上述幾個環(huán)節(jié)的內(nèi)容可以根據(jù)不同的情況進行調(diào)整.例如,在有些時候,分類變量的抽樣數(shù)據(jù)列聯(lián)表是問題中給定的.例3某兒童醫(yī)院用甲、乙兩種療法治療小兒消化不良.采用有放回簡單隨機抽樣的方法對治療情況進行檢查,得到了如下數(shù)據(jù):抽到接受甲種療法的患兒67名,其中未治愈15名,治愈52名;抽到接受乙種療法的患兒69名,其中未治愈6名,治愈63名.試根據(jù)小概率值α=0.005的獨立性檢驗,分析乙種療法的效果是否比甲種療法好.

解:

零假設為H0:療法與療效獨立,即兩種療法效果沒有差異療法療效合計未治愈治愈甲155267乙66369合計21115136由已知數(shù)據(jù)列出2×2列聯(lián)表,如下:α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828根據(jù)小概率值α=0.005的χ2獨立性檢驗,沒有充分證據(jù)推斷H0不成立,因此可以認為H0成立,即認為兩種療法效果沒有差異.典例解析典例解析問題5在例3的2×2列聯(lián)表中,若對調(diào)兩種療法的位置或?qū)φ{(diào)兩種療效的位置,則卡方計算公式中a,b,c,d的賦值都會相應地改變.這樣做會影響χ2取值的計算結(jié)果嗎療法療效合計未治愈治愈甲155267乙66369合計21115136對調(diào)前療法療效合計未治愈治愈乙66369甲155267合計21115136對調(diào)后這說明,對調(diào)兩種療法的位置,不會影響χ2取值的計算結(jié)果,同理對調(diào)兩種療效的位置也不會影響結(jié)果.鞏固練習課本134頁1.對于例3中的抽樣數(shù)據(jù),采用小概率值α=0.05的獨立性檢驗,分析乙種療法的效果是否比甲種療法好.根據(jù)題意,可得解:α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828根據(jù)小概率值α=0.05的χ2獨立性檢驗,推斷H0不成立即認為兩種療法效果有差異.鞏固練習課本134頁2.根據(jù)同一抽查數(shù)據(jù)推斷兩個分類變量之間是否有關聯(lián),應用不同的小概率值,是否會得出不同的結(jié)論為什么解

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論