人教A版選擇性8.3列聯(lián)表與獨立性檢驗課件(23張)_第1頁
人教A版選擇性8.3列聯(lián)表與獨立性檢驗課件(23張)_第2頁
人教A版選擇性8.3列聯(lián)表與獨立性檢驗課件(23張)_第3頁
人教A版選擇性8.3列聯(lián)表與獨立性檢驗課件(23張)_第4頁
人教A版選擇性8.3列聯(lián)表與獨立性檢驗課件(23張)_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

列聯(lián)表與獨立性檢驗

高二數(shù)學(xué)選擇性必修第三冊第八章成對數(shù)據(jù)的統(tǒng)計分析學(xué)習(xí)目標1.通過實例,理解2×2的統(tǒng)計意義;2.通過實例了解2×2列聯(lián)表與獨立性檢驗

及其應(yīng)用;3.會根據(jù)χ2的值判斷兩個分類變量之間關(guān)系的強弱4.核心素養(yǎng):

數(shù)據(jù)分析、邏輯推理、數(shù)學(xué)運算.一、回顧舊知2.殘差平方和:

3.最小二乘法

稱為Y關(guān)于x的經(jīng)驗回歸方程,4.判斷模型擬合的效果:殘差分析R2越大,表示殘差平方和越小,即模型的擬合效果越好R2越小,表示殘差平方和越大,即模型擬合效果越差.1.線性回歸模型y=bx+a+e含有隨機誤差e,其中x為解釋變量,y響應(yīng)變量在現(xiàn)實生活中,人們經(jīng)常需要回答一定范圍內(nèi)的兩種現(xiàn)象或性質(zhì)之間是否存在關(guān)聯(lián)性或互相影響的問題.一、探究新知獨立性檢驗方法分類變量:用實數(shù)表示不同的現(xiàn)象或性質(zhì).如:班級:1、2、3,男生、女生:0、1.本節(jié)主要討論取值于{0,1}的分類變量的關(guān)聯(lián)性解:比較經(jīng)常鍛煉的學(xué)生在女生和男中的比率.男生經(jīng)常鍛煉的比率比女生高出個百分點,所以該校的女生和男生在體育鍛煉的經(jīng)常性方面有差異,而且男生更經(jīng)常鍛煉.解:對于Ω中的每一名學(xué)生,分別令性別對體育鍛煉的經(jīng)常性沒有影響:性別對體育鍛煉的經(jīng)常性有影響:1124804320合計601473128男生(X=1)523331192女生(X=0)經(jīng)常(Y=1)不經(jīng)常(Y=0)合計鍛煉性別

在該校的學(xué)生中,性別對體育鍛煉的經(jīng)常性有影響,男生更經(jīng)常性的鍛煉.>2.2×2列聯(lián)表的概念分類變量X和Y的抽樣數(shù)據(jù)的2×2列聯(lián)表:2×2列聯(lián)表給出成對分類變量數(shù)據(jù)的交叉分類頻數(shù)n=a+b+c+db+da+c合計c+ddcX=1a+bbaX=0Y=1Y=0合計YX

二、鞏固新知因此,甲校學(xué)生中數(shù)學(xué)成績不優(yōu)秀和數(shù)學(xué)成績優(yōu)秀的頻率分別為乙校學(xué)生中數(shù)學(xué)成績不優(yōu)秀和數(shù)學(xué)成績優(yōu)秀的頻率分別為我們可以用等高堆積條形圖直觀地展示上述計算結(jié)果:881771合計45738乙校(X=1)431033甲校(X=0)優(yōu)秀(Y=1)不優(yōu)秀(Y=0)合計數(shù)學(xué)成績學(xué)校

2.兩個分類變量之間關(guān)聯(lián)關(guān)系的定性分析的方法:(1)頻率分析法:通過對樣本的每個分類變量的不同類別事件發(fā)生的頻率大小進行比較來分析分類變量之間是否有關(guān)聯(lián)關(guān)系.如可以通過列聯(lián)表中值的大小粗略地判斷分類變量x和Y之間有無關(guān)系.一般其值相差越大,分類變量有關(guān)系的可能性越大.(2)圖形分析法:與表格相比,圖形更能直觀地反映出兩個分類變量間是否互相影響,常用等高堆積條形圖展示列聯(lián)表數(shù)據(jù)的頻率特征.將列聯(lián)表中的數(shù)據(jù)用高度相同的兩個條形圖表示出來,其中兩列的數(shù)據(jù)分別對應(yīng)不同的顏色,這就是等高堆積條形圖.等高堆積條形圖可以展示列聯(lián)表數(shù)據(jù)的頻率特征,能夠直觀地反映出兩個分類變量間是否相互影響.3.問題2.你認為“兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率存在差異”這一結(jié)論是否有可能是錯誤的?有可能“兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率存在差異”這個結(jié)論是根據(jù)兩個頻率間存在差異推斷出來的.有可能出現(xiàn)這種情況:在隨機抽取的這個樣本中,兩個頻率間確實存在差異,但兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率實際上是沒有差別的.對于隨機樣本而言,因為頻率具有隨機性,頻率與概率之間存在誤差,所以我們的推斷可能犯錯誤,而且在樣本容量較小時,犯錯誤的可能性會較大.因此,需要找到一種更為合理的推斷方法,同時也希望能對出現(xiàn)錯誤推斷的概率有一定的控制或估算.獨立性檢驗方法4.獨立性檢驗公式及定義:提出零假設(shè)(原假設(shè))H0:分類變量X和Y獨立假定我們通過簡單隨機抽樣得到了X和Y的抽樣數(shù)據(jù)列聯(lián)表,在列聯(lián)表中,如果零假設(shè)H0成立,則應(yīng)滿足,即ad-bc≈0.因此|ad?bc|越小,說明兩個分類變量之間關(guān)系越弱;|ad?bc|越大,說明兩個分類變量之間關(guān)系越強.

2=χ為了使不同樣本容量的數(shù)據(jù)有統(tǒng)一的評判標準,基于上述分析,我們構(gòu)造一個隨機變量用χ2取值的大小作為判斷零假設(shè)H0是否成立的依據(jù),當(dāng)它比較大時推斷H0不成立,否則認為H0成立。這種利用χ2的取值推斷分類變量X和Y是否獨立的方法稱為χ2獨立性檢驗,讀作“卡方獨立性檢驗”,簡稱獨立性檢驗.5.臨界值的定義:對于任何小概率值α,可以找到相應(yīng)的正實數(shù)xα,使得P(x≥xα)=α成立,我們稱xα為α的臨界值,這個臨界值可作為判斷χ2大小的標準,概率值α越小,臨界值xα越大.χ2獨立性檢驗中幾個常用的小概率值和相應(yīng)的臨界值.基于小概率值α的檢驗規(guī)則:當(dāng)χ2≥xα?xí)r,我們就推斷H0不成立,即認為X和Y不獨立,該推斷犯錯誤的概率不超過α;當(dāng)χ2<xα?xí)r,我們沒有充分證據(jù)推斷H0不成立,可以認為X和Y獨立.10.8287.8796.6353.8412.706xα0.0010.0050.010.050.1α

6.例2:依據(jù)小概率值的χ2獨立性檢驗,分析例1中的抽樣數(shù)據(jù),能否據(jù)此推斷兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率有差異?解:零假設(shè)為H0:分類變量X與Y相互獨立,即兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率無差異.因為2=χ<計算得到:根據(jù)小概率值的χ2獨立性檢驗,沒有充分證據(jù)推斷H0不成立,因此可以認為H0成立,即認為兩校的數(shù)學(xué)成績優(yōu)秀率沒有差異.881771合計45738乙校(X=1)431033甲校(X=0)優(yōu)秀(Y=1)不優(yōu)秀(Y=0)合計數(shù)學(xué)成績學(xué)校

7.例3:某兒童醫(yī)院用甲、乙兩種療法治療小兒消化不良.采用有放回簡單隨機抽樣的方法對治療情況進行檢查,得到了如下數(shù)據(jù):抽到接受甲種療法的患兒67名,其中未治愈15名,治愈52名;抽到接受乙種療法的患兒69名,其中未治愈6名,治愈63名.試根據(jù)小概率值的獨立性檢驗,分析乙種療法的效果是否比甲種療法好.解:零假設(shè)為H0:療法與療效獨立,即兩種療法效果沒有差異.將所給數(shù)據(jù)進行整理,得到兩種療法治療數(shù)據(jù)的列聯(lián)表,根據(jù)列聯(lián)表中的數(shù)據(jù),經(jīng)計算得到2=χ<根據(jù)小概率值的χ2獨立性檢驗,沒有充分證據(jù)推斷H0不成立,因此可以認為H0成立,即認為兩種療法效果沒有差異.1361152169636675215治愈未治愈合計療效合計乙甲療法

思考:

若對調(diào)兩種療法的位置或?qū)φ{(diào)兩種療效的位置,這樣做會影響χ2取值的計算結(jié)果嗎?2=χ2=χ2=χ不影響13611521合計69636乙675215甲治愈未治愈合計療效療法

13611521合計675215甲69636乙治愈未治愈合計療效療法

13621115合計69663乙671552甲未治愈治愈合計療效療法

根據(jù)小概率值的獨立性檢驗,分析乙種療法的效果是否比甲種療法好.解:零假設(shè)為H0:療法與療效獨立,即兩種療法效果沒有差異.根據(jù)列聯(lián)表中的數(shù)據(jù),經(jīng)計算得到2=χ>根據(jù)小概率值的χ2獨立性檢驗,我們推斷H0不成立,即可以認為兩種療法效果有差異,該推斷犯錯誤的概率不超過.1361152169636675215治愈未治愈合計療效合計乙甲療法

根據(jù)小概率值的獨立性檢驗,分析乙種療法的效果是否比甲種療法好.甲種療法未治愈和治愈的頻率分別是因此可以推斷乙種療法的效果比甲種療法好乙種療法未治愈和治愈的頻率分別是8.例4:為了調(diào)查吸煙是否對肺癌有影響,某腫瘤研究所采取有放回簡單隨機抽樣,調(diào)查了9965人,得到如下結(jié)果(單位:人)依據(jù)小概率值α=的獨立性檢驗,分析吸煙是否會增加患肺癌的風(fēng)險。解:零假設(shè)為H0:吸煙和患肺癌之間沒有關(guān)系根據(jù)列聯(lián)表中的數(shù)據(jù),經(jīng)計算的2=χ>根據(jù)小概率值的獨立性檢驗,推斷H0不成立,即認為吸煙與患肺癌有關(guān)聯(lián),此推斷犯錯誤的概率不大于,即我們有%的把握認為“吸煙與患肺癌有關(guān)系”.吸煙肺癌合計非肺癌患者肺癌患者非吸煙者7775427817吸煙者2099492148合計9874919965根據(jù)表中的數(shù)據(jù)計算不吸煙者中不患肺癌和患肺癌的頻率分別為吸煙者中不患肺癌和患肺癌的評率分別為由可見,在被調(diào)查者中,吸煙者患肺癌的頻率是不吸煙者患肺癌頻率的4倍以上。于是,根據(jù)頻率穩(wěn)定于概率的原理,我們可以認為吸煙者患肺癌的概率明顯大于不吸煙者患肺癌概率,即吸煙更容易引發(fā)肺癌。9.應(yīng)用獨立性檢驗解決實際問題大致應(yīng)包括以下幾個主要環(huán)節(jié);(1)提出零假設(shè)H0:X和Y相互獨立,并給出在問題中的解釋.(2)根據(jù)抽樣數(shù)據(jù)整理出2×2列聯(lián)表,計算χ2的值,并與臨界值xα比較.(3)根據(jù)檢驗規(guī)則得出推斷結(jié)論.(4)在X和Y不獨立的情況下,根據(jù)需要通過比較相應(yīng)的頻率,分析X和Y間的影響規(guī)律.

上述幾個環(huán)節(jié)的內(nèi)容可以根據(jù)不同情況進行調(diào)整,例如,在有些時候,分類變量的抽樣數(shù)據(jù)列聯(lián)表是問題中給定的.1.分類變量X和Y的抽樣數(shù)據(jù)的2×2列聯(lián)表:三、課堂小結(jié)2.獨立性檢驗的一般步驟:(1)提出零假設(shè)H0:X和Y相互獨立,并給出在問題中的解釋.(2)根據(jù)抽樣數(shù)據(jù)整理出2×2列聯(lián)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論