獨立性檢驗高二下數(shù)學人教A版(2019)選擇性必修第三冊_第1頁
獨立性檢驗高二下數(shù)學人教A版(2019)選擇性必修第三冊_第2頁
獨立性檢驗高二下數(shù)學人教A版(2019)選擇性必修第三冊_第3頁
獨立性檢驗高二下數(shù)學人教A版(2019)選擇性必修第三冊_第4頁
獨立性檢驗高二下數(shù)學人教A版(2019)選擇性必修第三冊_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第八章

成對數(shù)據(jù)的統(tǒng)計分析8.3.2獨立性檢驗學習目標1、通過學習獨立性檢驗的基本思想,提升邏輯推理的素養(yǎng).2、借助χ2公式,培養(yǎng)數(shù)學運算的素養(yǎng).3、通過對典型案例的探究,了解獨立性檢驗(只要求2×2列聯(lián)表)的基本思想、方法及初步應(yīng)用.4、通過對數(shù)據(jù)的收集、整理和分析,增強學生的社會實踐能力,培養(yǎng)學生分析問題、解決問題的能力.復(fù)習舊知一、分類變量

用以區(qū)別不同的現(xiàn)象或性質(zhì)的一種特殊的隨機變量,稱為分類變量.分類變量的取值可以用實數(shù)表示,例如,學生所在的班級可以用1,2,3等表示,男性、女性可以用1,0表示,等等.二、列聯(lián)表

將形如下表這種形式的數(shù)據(jù)統(tǒng)計表稱為2×2列聯(lián)表.2×2列聯(lián)表給出了成對分類變量數(shù)據(jù)的交叉分類頻數(shù).問題導學問題1你認為“兩校學生的數(shù)學成績優(yōu)秀率存在差異”這一結(jié)論是否有可能是錯誤的?

這個結(jié)論是根據(jù)兩個頻率間存在差異推斷出來的.有可能出現(xiàn)這種情況:在隨機抽取的這個樣本中,兩個頻率間確實存在差異,但兩校學生的數(shù)學成績優(yōu)秀率實際上是沒有差別的.

對于隨機樣本而言,因為頻率具有隨機性,頻率與概率之間存在誤差,所以我們的推斷可能犯錯誤,而且在樣本容量較小時,犯錯誤的可能性會較大.

因此,需要找到一種更為合理的推斷方法,同時也希望能對出現(xiàn)錯誤推斷的概率有一定的控制或估算.獨立性檢驗方法問題導學問題2你知道法官是如何憑證據(jù)進行判案的嗎?類比追問

我們是否可以類比法官判案的方式去判斷兩個分類變量X,Y是否有關(guān)聯(lián)?問題導學問題3設(shè)X和Y為定義在以Ω為樣本空間上,且取值于{0,1}的成對分類變量,如何判斷事件{X=1}和{Y=1}之間是否有關(guān)聯(lián)?我們需要判斷下面的假定關(guān)系是否成立P(Y=1|X=0)=P(Y=1|X=1)由條件概率的定義可知,上式等價于:{X=1}和{Y=1}獨立問題導學問題3設(shè)X和Y為定義在以Ω為樣本空間上,且取值于{0,1}的成對分類變量,如何判斷事件{X=1}和{Y=1}之間是否有關(guān)聯(lián)?根據(jù)已經(jīng)學過的概率知識,下面的四條性質(zhì)彼此等價:零假設(shè)H0:分類變量X和Y獨立{X=1}和{Y=1}獨立{X=0}和{Y=1}獨立{X=1}和{Y=0}獨立{X=0}和{Y=0}獨立如果這4個性質(zhì)成立,則稱分類變量X和Y獨立.問題導學問題4如何基于上述四個等式及列聯(lián)表中的數(shù)據(jù),構(gòu)造適當?shù)慕y(tǒng)計量,對成對分類變量X和Y是否相互獨立作出推斷?零假設(shè)H0:分類變量X和Y獨立假定零假設(shè)H0成立,由

可以得到:{X=0,Y=0}發(fā)生的頻數(shù)的期望值頻數(shù)的觀測值問題導學為了平衡各式的差值的變化,構(gòu)造一個方便科學的統(tǒng)計量:零假設(shè)H0:分類變量X和Y獨立概念生成一、卡方統(tǒng)計量:追問1卡方統(tǒng)計量有什么用呢?統(tǒng)計學家建議,用隨機變量χ2取值的大小作為判斷零假設(shè)H0是否成立的依據(jù)。如果零假設(shè)H0成立,則χ2應(yīng)該很?。蝗绻慵僭O(shè)H0不成立,則χ2應(yīng)該很大.

概念生成二、卡方獨立性檢驗:

用χ2取值的大小作為判斷零假設(shè)H0是否成立的依據(jù),當它比較大時推斷H0不成立,否則認為H0成立。這種利用χ2的取值推斷分類變量X和Y是否獨立的方法稱為χ2獨立性檢驗,讀作“卡方獨立性檢驗”,簡稱獨立性檢驗。概念生成追問2

怎樣確定判斷χ2大小的標準呢?

根據(jù)小概率事件在一次試驗中不大可能發(fā)生的規(guī)律,可以通過確定一個與H0相矛盾的小概率事件來實現(xiàn),在假定H0的條件下,對于有放回簡單隨機抽樣,當樣本容量n充分大時,統(tǒng)計學家得到了χ2的近似分布.P(χ2≥xα)=α

我們稱xα為α的臨界值,這個臨界值可以作為判斷χ2大小的標準.概率值α越小,臨界值xα越大.概念生成基于小概率值α的檢驗規(guī)則:下表給出了χ2獨立性檢驗中幾個常用的小概率值和相應(yīng)的臨界值:概念生成追問3怎么看這個表呢?課堂練習C課堂練習D課堂練習B課堂練習A典例剖析解:零假設(shè)為H0:分類變量X與Y相互獨立,即兩校學生的數(shù)學成績優(yōu)秀率無差異.典例剖析問題5例1和例2基于同一組數(shù)據(jù)的兩種分析方法(條件概率法和卡方獨立性檢驗法),但卻得出了不同的結(jié)論,你能說明其中的原因嗎?

事實上,例1只是根據(jù)一個樣本的兩個頻率間存在差異得出兩校學生數(shù)學成績優(yōu)秀率有差異的結(jié)論,并沒有考慮由樣本隨機性可能導致的錯誤,所以例1的推斷依據(jù)不太充分.

在例2中,我們用χ2獨立性檢驗對零假設(shè)H0進行了檢驗.通過計算,發(fā)現(xiàn)χ2≈0.837小于α=0.1所對應(yīng)的臨界值2.706,因此認為沒有充分證據(jù)推斷H0不成立,所以接受H0,推斷出兩校學生的數(shù)學成績優(yōu)秀率沒有顯著差異的結(jié)論。

這個檢驗結(jié)果意味著,抽樣數(shù)據(jù)中兩個頻率的差異很有可能是由樣本隨機性導致的.因此,只根據(jù)頻率的差異得出兩校學生的數(shù)學成績優(yōu)秀率有差異的結(jié)論是不可靠的.

由此可見,相對于簡單比較兩個頻率的推斷:

用χ2獨立性檢驗得到的結(jié)果更理性、更全面,理論依據(jù)也更充分.典例剖析解:零假設(shè)為H0:療法與療效獨立,即兩種療法效果沒有差異.例3某兒童醫(yī)院用甲、乙兩種療法治療小兒消化不良.采用有放回簡單隨機抽樣的方法對治療情況進行檢查,得到了如下數(shù)據(jù):抽到接受甲種療法的患兒67名,其中未治愈15名,治愈52名;抽到接受乙種療法的患兒69名,其中未治愈6名,治愈63名.試根據(jù)小概率值α=0.005的獨立性檢驗,分析乙種療法的效果是否比甲種療法好.典例剖析例3某兒童醫(yī)院用甲、乙兩種療法治療小兒消化不良.采用有放回簡單隨機抽樣的方法對治療情況進行檢查,得到了如下數(shù)據(jù):抽到接受甲種療法的患兒67名,其中未治愈15名,治愈52名;抽到接受乙種療法的患兒69名,其中未治愈6名,治愈63名.試根據(jù)小概率值α=0.005的獨立性檢驗,分析乙種療法的效果是否比甲種療法好.典例剖析例3某兒童醫(yī)院用甲、乙兩種療法治療小兒消化不良.采用有放回簡單隨機抽樣的方法對治療情況進行檢查,得到了如下數(shù)據(jù):抽到接受甲種療法的患兒67名,其中未治愈15名,治愈52名;抽到接受乙種療法的患兒69名,其中未治愈6名,治愈63名.試根據(jù)小概率值α=0.005的獨立性檢驗,分析乙種療法的效果是否比甲種療法好.典例剖析因此可以推斷乙種療法的效果比甲種療法好。例3某兒童醫(yī)院用甲、乙兩種療法治療小兒消化不良.采用有放回簡單隨機抽樣的方法對治療情況進行檢查,得到了如下數(shù)據(jù):抽到接受甲種療法的患兒67名,其中未治愈15名,治愈52名;抽到接受乙種療法的患兒69名,其中未治愈6名,治愈63名.試根據(jù)小概率值α=0.005的獨立性檢驗,分析乙種療法的效果是否比甲種療法好.典例剖析問題6根據(jù)同一抽查數(shù)據(jù)推斷兩個分類變量之間是否有關(guān)聯(lián),應(yīng)用不同的小概率值,是否會得出不同的結(jié)論?為什么?可能會得出不同的結(jié)論.理由如下:對同一抽樣數(shù)據(jù),計算出來的χ2的值是確定的,在獨立性檢驗中,基于不同的小概率值α的檢驗規(guī)則,對應(yīng)不同的臨界值xα,其與χ2的大小關(guān)系可能不同,相當于檢驗的標準發(fā)生變化,因此結(jié)論可能會不同.方法總結(jié)應(yīng)用獨立性檢驗解決實際問題大致包括以下幾個主要環(huán)節(jié):(1)提出零假設(shè)H0:X和Y相互獨立,并給出在問題中的解釋.(2)根據(jù)抽樣數(shù)據(jù)整理出2×2列聯(lián)表,計算χ2的值,并與臨界值比較.(3)根據(jù)檢驗規(guī)則得出推斷結(jié)論.(4)在X和Y不獨立的情況下,根據(jù)需要,通過比較相應(yīng)的頻率,分析X和Y間的影響規(guī)律.典例剖析例4為研究吸煙是否與肺癌有關(guān),某腫瘤研究所采取有放回簡單隨機抽樣的方法,調(diào)查了9965人,得到成對樣本觀測數(shù)據(jù)的分類統(tǒng)計結(jié)果,如表所示.依據(jù)小概率值α=0.001的獨立性檢驗,分析吸煙是否會增加患肺癌的風險.典例剖析問題7獨立性檢驗的思想類似于我們常用的反證法,你能指出二者之間的相同和不同之處嗎?獨立性檢驗是一種“概率反證法”.反證法獨立性檢驗在某種假設(shè)H0下,如果推出一個矛盾,則證明H0不成立;若未能推出矛盾,不能對H0下任何結(jié)論,即反證法不成功.在零假設(shè)H0下,如果出現(xiàn)一個與H0相矛盾的小概率事件,則推斷H0不成立,且該推斷犯錯誤的概率不大于這個小概率.否則,不能推斷H0不成立,通常會接受H0,即認為兩個分類變量相互獨立.反證法不會犯錯誤獨

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論