




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
3.2獨立性檢驗的基本思想
及其初步應用(第1課時)廣東省高州市第三中學陳許聰1
我們經(jīng)常聽到這樣的結(jié)論:吸煙會容易得肺癌;身高會受到遺傳因素的影響;是否喜歡理科和性別有關(guān)系。等等。
為了回答這兩個問題,就需要同學們認真學習本節(jié)課的內(nèi)容:統(tǒng)計學中的獨立性檢驗的基本思想及其初步應用問題1:這些結(jié)論是怎樣得出的呢?問題2:你能有“多大把握”認為這些結(jié)論是正確的呢?引入新課:那么21、分類變量——變量的不同“值”表示個體所屬的不同類別,像這樣的變量稱為分類變量
這個表格是為了調(diào)查吸煙是否對患肺癌有影響的一個調(diào)查表,那么在這里“是否吸煙”和“是否患肺癌”都是分類變量,而且這個表格中還給出了分類變量的頻數(shù),比如說…一、有關(guān)概念例如,性別,這個變量有什么取值呢?又比如,宗教信仰,國籍等。不患肺癌患肺癌總計不吸煙7775427817吸煙2099492148總計9874919965
這個表格在統(tǒng)計學中又稱之為什么呢?再看一個例子:32、列聯(lián)表——像表中這樣列出的兩個分類變量的頻數(shù)表,
問題3:在這個表格中的數(shù)據(jù)能告訴我們什么樣的結(jié)論?
在高中階段我們只研究像下表中那樣的2×2列聯(lián)表:不患肺癌患肺癌總計不吸煙7775427817吸煙2099492148總計98749199652×2列聯(lián)表
方法一:
(1)在不吸煙者中患肺癌的比重是
(2)在吸煙者中患肺癌的比重是0.54%2.28%你的結(jié)論是:
這組數(shù)據(jù)如果放到圖表中,更能直觀的感受到它們的差異!
稱為列聯(lián)表4方法二:通過等高條形圖直觀判斷:等高條形圖患肺癌比例不患肺癌比例
從這個等高條形圖中,我們更直觀地看出吸煙者中患肺癌的比重與不吸煙者中患肺癌的比重有明顯差異,從而說明吸煙與患肺癌很有可能是有關(guān)系的。思考:這種判斷可靠嗎?以上方法只回答了我們課前提出的問題1,對于問題2中“把握度”問題還沒有解決,也就是說,你能有多大把握認為“吸煙與患肺癌有關(guān)”呢?什么是“把握度”?5
1、思想
二、獨立性檢驗的思想
吸煙與患肺癌列聯(lián)表不患肺癌患肺癌總計不吸煙aba+b吸煙cdc+d總計a+cb+da+b+c+d則:因此|ad-bc|越小,說明吸煙與患肺癌之間關(guān)系越弱;|ad-bc|越大,說明吸煙與患肺癌之間關(guān)系越強.
我們知道上面例子表中的數(shù)據(jù)是從某次調(diào)查中隨機抽樣得來的,帶有隨機性,為了使統(tǒng)計數(shù)據(jù)更具一般性,我們把表中數(shù)字用字母代替,得到如下用字母表示的列聯(lián)表:
假設H0:吸煙與患肺癌沒有關(guān)系即|ad-bc|≈06
為了使不同樣本容量的數(shù)據(jù)有統(tǒng)一的評判標準,基于上面的分析,我們引入一個隨機變量
顯然,K2的大小變化與|ad-bc|是同步的思考:這個K2的觀測值56.632是大還是???評價標準是什么?這個值到底能告訴我們什么呢?(討論)
那么上面例子,在假設H0成立,即“吸煙與患肺癌沒有關(guān)系”成立的前提下,K2應該很小.分析:K2越小,|ad-bc|也越小,說明吸煙與患肺癌之間關(guān)系越弱;K2越大,
|ad-bc|也越大,說明吸煙與患肺癌之間關(guān)系越強.
(其中n=a+b+c+d為樣本容量)
把表中數(shù)據(jù)代入K2公式,計算得到K2的觀測值為7事先給定評價標準k0(臨界值)例如取k0=6.635
這個99%就是我們課前提到的一個“把握度”,這個“把握度”會因事先給定的臨界值(評價標準)不同而不同。即在假設H0成立的情況下,K2的觀測值超過6.635的概率非常小,近似為0.01,是一個小概率事件,也就是說H0這個假設幾乎不可能發(fā)生的。而統(tǒng)計學家經(jīng)過研究后發(fā)現(xiàn),在假設H0成立的情況下
P(K2≥6.635)≈0.01(如何理解?)那么K2的觀測值遠遠大于6.635“H0發(fā)生”(即吸煙與患肺癌沒有關(guān)系)的概率是0.01,而“H0不發(fā)生”(即吸煙與患肺癌有關(guān)系)的概率是0.99因此,我們可以有99%的把握認為吸煙與患肺癌有關(guān)系。81/26/20249經(jīng)過統(tǒng)計學家多年的研究,總結(jié)得出如下臨界值表:(如何查表?)10.8287.8796.6355.0243.8412.7062.0721.3230.7080.445
k0.0010.0050.0100.0250.050.100.150.50.400.50思考:上面例子中還可以選用哪個臨界值(評價標準)?這時的“把握度”又是多少?如何下結(jié)論?102、步驟:(3)查臨界值表,比較k與k0的大小得出結(jié)論。(2)利用公式計算K2的觀測值k;(1)寫出2×2列聯(lián)表,確定臨界值k0;
(事先給定或默認值2.706)
上面這種利用隨機變量K2來判斷“兩個分類變量有關(guān)系”的方法稱為獨立性檢驗。這個檢驗過程就是獨立性檢驗的思想。11例1
在某醫(yī)院,因為患心臟病而住院的665名男性病人中,有214人禿頂,而另外772名不是因為患心臟病而住院的男性病人中有175人禿頂。能否在犯錯誤的概率不超過0.010的前提下認為禿頂與患心臟病有關(guān)系?解:根據(jù)題目所給數(shù)據(jù)得到如下列聯(lián)表:患心臟病不患心臟病總計禿頂214175389不禿頂4515971048總計6657721437根據(jù)聯(lián)表中的數(shù)據(jù),得到因此,在犯錯的概率不超過0.01的前提下認為“禿頂與患心臟病”有關(guān)系,即有99%的把握認為“禿頂與患心臟病有關(guān)”。三、獨立性檢驗思想的初步應用依題意查表可得臨界值k0=6.63512討論:這種獨立性檢驗的思想和以前我們學習的哪種證明方法比較類似?試比較一下這兩種原理。反證法原理在假設H0下,如果推出一個矛盾,就證明了H0不成立獨立性檢驗原理在假設H0下,如果出現(xiàn)一個與H0相矛盾的小概率事件,就推斷H0不成立,且該推斷犯錯誤的概率不超過這個小概率。反證法原理與獨立性檢驗原理的比較的比較131、在吸煙與患肺病這兩個分類變量的計算中,下列說法正確的是()A、若K的觀測值為k=6.635,我們有99%的把握認為吸煙與患肺病有關(guān)系,那么在100個吸煙的人中必有99個患肺病B、從獨立性檢驗可知有99%的把握認為吸煙與患肺病有關(guān)系時,我們說某人吸煙,那么他有99%的可能患肺病C、若從統(tǒng)計量中求出有9
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 農(nóng)資化肥服務合同范本
- 70代勞動合同范本
- 公司設備收購合同范本
- 云南元旦晚會舞臺施工方案
- 出口黃金加工合同范本
- 公司交接合同范本
- 勞務委托施工合同范本
- 倉庫地面清潔合同范本
- 兼職推廣合同范本
- 加盟貨車合同范本
- 《火力發(fā)電廠水處理技術(shù)概述》課件
- 3.1產(chǎn)業(yè)轉(zhuǎn)移對區(qū)域發(fā)展的影響(第1課時) 【知識精研】高二地理課件(湘教版2019選擇性必修2)
- 2022新教材蘇教版科學5五年級下冊全冊教學設計
- 2024-2025學年全國中學生天文知識競賽考試題庫(含答案)
- 加利福尼亞批判性思維技能測試后測試卷班附有答案
- 工程結(jié)算書(完整版)
- 仿真技術(shù)在車架防腐性能開發(fā)中的應用
- 初一平面直角坐標系集體備課
- 公務員登記表
- 高一年級英語必修二學科導學案全冊
- 胡菊仁愛版九年級英語上教學計劃及教學進度表
評論
0/150
提交評論