




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、1.2 獨立性檢驗的基本思想及其初步應(yīng)用第1課時1.兩種變量及研究相關(guān)關(guān)系的方法:兩種變量及研究相關(guān)關(guān)系的方法: 變量變量分類變量分類變量定量變量定量變量例如:身高、體重、考試成績,溫度等等例如:身高、體重、考試成績,溫度等等3)例如是性別,否吸煙,是否患肺癌,宗教信仰等等)例如是性別,否吸煙,是否患肺癌,宗教信仰等等1)變量的不同)變量的不同“值值”表示表示個體的不同類別個體的不同類別的變量的變量 (也叫屬性變量或者定性變量)也叫屬性變量或者定性變量) 定量變量的取值一定是實數(shù),定量變量的取值一定是實數(shù),它們的取值大小有特定它們的取值大小有特定 的含義,不同取值之間的運算也有特定的含義。的含
2、義,不同取值之間的運算也有特定的含義。2)分類變量的取值一定是離散的)分類變量的取值一定是離散的研究兩個定量變量相關(guān)關(guān)系的方法:回歸分析(畫散研究兩個定量變量相關(guān)關(guān)系的方法:回歸分析(畫散 點圖,相關(guān)系數(shù)點圖,相關(guān)系數(shù)r,相關(guān)指數(shù)相關(guān)指數(shù)R2,殘差分析等)殘差分析等)4)研究兩個分類變量相關(guān)關(guān)系的方法:)研究兩個分類變量相關(guān)關(guān)系的方法: 通過圖形直觀判斷兩個分類變量是否相關(guān);通過圖形直觀判斷兩個分類變量是否相關(guān); 獨立性檢驗獨立性檢驗法法.本節(jié)研究的是本節(jié)研究的是兩個分類變量的獨立性檢驗問題兩個分類變量的獨立性檢驗問題。在日常生活中,我們主要考慮在日常生活中,我們主要考慮分類變量的之間是否有關(guān)
3、系分類變量的之間是否有關(guān)系:例如,:例如, 吸煙是否與患肺癌有關(guān)系?性別是否對于喜歡數(shù)學(xué)課程有影響?等等。吸煙是否與患肺癌有關(guān)系?性別是否對于喜歡數(shù)學(xué)課程有影響?等等。在統(tǒng)計學(xué)中,在統(tǒng)計學(xué)中,獨立性檢驗獨立性檢驗就是檢驗兩個就是檢驗兩個分類變量分類變量是否有關(guān)系的一種統(tǒng)計方法。是否有關(guān)系的一種統(tǒng)計方法。一一.引入新課:引入新課:2.引入:引入:二二.問題:問題:為為了調(diào)查吸煙是否對肺癌有影響,某腫瘤研究所了調(diào)查吸煙是否對肺癌有影響,某腫瘤研究所隨機地隨機地調(diào)調(diào)查了查了 9965 9965人,得到如下結(jié)果(單位:人)人,得到如下結(jié)果(單位:人)22列列聯(lián)表聯(lián)表 吸煙與不吸煙,患病的可能性的大小是
4、否有差異?吸煙與不吸煙,患病的可能性的大小是否有差異?不患肺癌不患肺癌患肺癌患肺癌總計總計不吸煙不吸煙77757775424278177817吸煙吸煙20992099494921482148總計總計98749874919199659965吸煙與患肺癌吸煙與患肺癌列聯(lián)表列聯(lián)表(列出兩個分類變量的頻數(shù)表):(列出兩個分類變量的頻數(shù)表):方法1.用頻率估計概率患 病未患病合 計(n)吸 煙2.28%97.72%100%(2148)不吸煙0.54%99.46%100%(7817)方法方法2.通過圖形直觀判斷通過圖形直觀判斷 由上表可看出,在由上表可看出,在不吸煙者中患肺癌的比重是不吸煙者中患肺癌的比重
5、是 在在吸煙者中患肺癌的比重是吸煙者中患肺癌的比重是 0.54%0.54%2.28%2.28%根據(jù)統(tǒng)計分析的思想,用頻率估計概率可知,吸吸煙者和不吸煙者患肺癌煙者和不吸煙者患肺癌的可的可 能能性存在差異,吸性存在差異,吸煙者患肺煙者患肺癌的可能性大癌的可能性大等高條形圖等高條形圖患肺患肺癌比癌比例例不患肺不患肺癌比癌比例例由上述圖形顯然可以得到結(jié)論是:由上述圖形顯然可以得到結(jié)論是:吸煙與患肺癌有關(guān)吸煙與患肺癌有關(guān)思考:這種判斷可靠嗎?這種判斷可靠嗎?你能有多大把握認為“患病與吸煙有關(guān)”呢? 注意:與表格相比,圖形能與表格相比,圖形能 更直觀地反映出相關(guān)數(shù)更直觀地反映出相關(guān)數(shù) 據(jù)的總體狀況。據(jù)的
6、總體狀況。 首先,假設(shè)結(jié)論不成立,即記首先,假設(shè)結(jié)論不成立,即記 H H0 0:吸煙吸煙和和患肺癌患肺癌之間沒有關(guān)系之間沒有關(guān)系 思考思考:通過數(shù)據(jù)和圖表分析,得到結(jié)論是:通過數(shù)據(jù)和圖表分析,得到結(jié)論是:吸煙與患肺癌有關(guān)吸煙與患肺癌有關(guān). . 這種判斷可靠嗎?這種判斷可靠嗎?你能有多大把握認為“患病與吸煙有關(guān)”呢? 吸煙與患肺癌列聯(lián)表吸煙與患肺癌列聯(lián)表不患肺癌不患肺癌患肺癌患肺癌總計總計不吸煙不吸煙a ab ba+ba+b吸煙吸煙c cd dc+dc+d總計總計a+ca+cb+db+da+b+c+da+b+c+d吸煙的人中不患肺癌的比例:吸煙的人中不患肺癌的比例:baa 不不吸煙的人中不患肺癌
7、的比例:吸煙的人中不患肺癌的比例:dcc若H0成立,即即“吸煙與患肺癌沒有關(guān)系吸煙與患肺癌沒有關(guān)系”,則,則在吸煙者中不患在吸煙者中不患肺癌的比例肺癌的比例 應(yīng)應(yīng)該該與與不吸煙中不患肺癌的不吸煙中不患肺癌的比例比例應(yīng)差不多應(yīng)差不多,即,即|ad-bc|ad-bc|越小,說明吸煙與患肺癌之間關(guān)系越弱;越小,說明吸煙與患肺癌之間關(guān)系越弱;|ad-bc|ad-bc|越大,說明吸煙與患肺癌之間關(guān)系越強越大,說明吸煙與患肺癌之間關(guān)系越強. .2 22 2n n(a ad d- -b bc c)K K = =( (a a+ +b b) )( (c c+ +d d) )( (a a+ +c c) )( (b
8、 b+ +d d) )1.1.為了使不同樣本容量的數(shù)據(jù)有統(tǒng)一的評判標(biāo)準(zhǔn),基于上面的分為了使不同樣本容量的數(shù)據(jù)有統(tǒng)一的評判標(biāo)準(zhǔn),基于上面的分析,我們引析,我們引入一個隨機入一個隨機變量變量 (其中(其中n=n=a+b+c+da+b+c+d為樣本容量為樣本容量) ) 作為作為檢檢驗在驗在多大程度上多大程度上可以認為可以認為“兩個變量有關(guān)兩個變量有關(guān)系系”的標(biāo)準(zhǔn)的標(biāo)準(zhǔn)思考:思考:k2k2大小的標(biāo)準(zhǔn)是什么呢?大小的標(biāo)準(zhǔn)是什么呢?0k臨界值 在假設(shè)在假設(shè)H H0 0成立,即成立,即“吸煙與患肺癌沒有關(guān)系吸煙與患肺癌沒有關(guān)系”成立的前提下,成立的前提下,則則K K2 2應(yīng)該很小應(yīng)該很小. . 故,當(dāng)故,當(dāng)
9、K2K2很小時,說明在一定可信程度上很小時,說明在一定可信程度上假設(shè)假設(shè)H0成立,即成立,即“吸煙與患肺癌吸煙與患肺癌 沒有關(guān)系沒有關(guān)系”成立成立 當(dāng)當(dāng)K2很大時,說明沒有充分的證據(jù)說明假設(shè)很大時,說明沒有充分的證據(jù)說明假設(shè)H0成立,即沒有充分的成立,即沒有充分的 證據(jù)說明證據(jù)說明“吸煙與患肺癌沒有關(guān)系吸煙與患肺癌沒有關(guān)系”成立,即成立,即“吸煙與患肺癌沒有吸煙與患肺癌沒有 關(guān)系關(guān)系”不成立,即不成立,即“吸煙與患肺癌有關(guān)系吸煙與患肺癌有關(guān)系”成立,成立,分析:分析:K2K2越小,越小,|ad-|ad-bcbc| |越小越小,說明吸煙與患肺癌之間說明吸煙與患肺癌之間關(guān)關(guān)系越弱;系越弱; K2越
10、大,越大, |ad-bc|ad-bc|越大越大,說明吸煙與患肺癌之間說明吸煙與患肺癌之間關(guān)關(guān)系越強系越強. .k2k2大小的標(biāo)準(zhǔn)是什么呢?大小的標(biāo)準(zhǔn)是什么呢?10.8287.8796.6355.0243.8412.7062.0721.3230.7080.445 k0.0010.0050.0100.0250.050.100.150.50.400.502()P Kk臨界臨界值表值表 (1 1)如)如果果k=10.828k=10.828,就有,就有99.9%99.9%的把握認為的把握認為“X X與與Y Y有關(guān)系有關(guān)系”; (2 2)如果如果k=6.635k=6.635,就有,就有99%99%的把握認
11、為的把握認為“X X與與Y Y有關(guān)系有關(guān)系”;(3 3)如果如果k=2.706k=2.706,就有,就有90%90%的把握認為的把握認為“X X與與Y Y有關(guān)系有關(guān)系”;(4 4)如果如果k=2.706k6.635k6.635,說明假設(shè)不合理,說明假設(shè)不合理的程度的程度約為約為99%99%,即,即“兩個兩個 分類有關(guān)分類有關(guān)系系”這一結(jié)論成立的這一結(jié)論成立的可信程可信程度約為度約為99%.99%.注意:反證法原理與假設(shè)檢驗原理區(qū)別:注意:反證法原理與假設(shè)檢驗原理區(qū)別:反證法原理反證法原理在一個已知假設(shè)下,如果推出一個矛盾,就證明了這個假設(shè)不成立。在一個已知假設(shè)下,如果推出一個矛盾,就證明了這個
12、假設(shè)不成立。假設(shè)檢驗原理假設(shè)檢驗原理在一個已知假設(shè)下,如果推出一個小概率事件發(fā)生,則推斷這個假設(shè)不在一個已知假設(shè)下,如果推出一個小概率事件發(fā)生,則推斷這個假設(shè)不成立的可能性很大。成立的可能性很大。1.2 獨立性檢驗的基本思想及其初步應(yīng)用第2課時1 1. .獨立性檢驗定義:獨立性檢驗定義: 用用 統(tǒng)統(tǒng)計量來確定在多大程度上可以計量來確定在多大程度上可以認為認為“兩個分類變兩個分類變量有關(guān)量有關(guān)系系”的方的方法稱為這兩個分類法稱為這兩個分類變量變量的的獨立性檢驗獨立性檢驗。2k2.2.為了使不同樣本容量的數(shù)據(jù)有統(tǒng)一的評判標(biāo)準(zhǔn),基于上面的分為了使不同樣本容量的數(shù)據(jù)有統(tǒng)一的評判標(biāo)準(zhǔn),基于上面的分 析,
13、我們引析,我們引入一個隨機入一個隨機變量變量 (其中(其中n=n=a+b+c+da+b+c+d為樣本容量為樣本容量) )2 22 2n n(a ad d- -b bc c)K K = =( (a a+ +b b) )( (c c+ +d d) )( (a a+ +c c) )( (b b+ +d d) ) 作為作為檢檢驗在驗在多大程度上多大程度上可以認為可以認為“兩個變量有關(guān)兩個變量有關(guān)系系”的標(biāo)準(zhǔn)的標(biāo)準(zhǔn)注:注:K2K2越小,越小,|ad-|ad-bcbc| |越小,說越小,說明兩個分類變量之明兩個分類變量之間關(guān)系越弱;間關(guān)系越弱; K2越大,越大, |ad-bc|ad-bc|越大,說越大,說
14、明兩個分類變量之明兩個分類變量之間關(guān)系越強間關(guān)系越強. .4.k24.k2大小的標(biāo)準(zhǔn)是大小的標(biāo)準(zhǔn)是臨界值臨界值k k10.8287.8796.6355.0243.8412.7062.0721.3230.7080.445 k0.0010.0050.0100.0250.050.100.150.50.400.502()P Kk臨界臨界值表值表 (1 1)如)如果果k=10.828k=10.828,就有,就有99.9%99.9%的把握認為的把握認為“X X與與Y Y有關(guān)系有關(guān)系”; (2 2)如果如果k=6.635k=6.635,就有,就有99%99%的把握認為的把握認為“X X與與Y Y有關(guān)系有關(guān)系
15、”;(3 3)如果如果k=2.706k=2.706,就有,就有90%90%的把握認為的把握認為“X X與與Y Y有關(guān)系有關(guān)系”;(4 4)如果如果k=2.706k6.635,說明假設(shè)不合理的程度約為,說明假設(shè)不合理的程度約為99%,即即“兩個分類有關(guān)系兩個分類有關(guān)系”這一結(jié)論成立的可信程度約為這一結(jié)論成立的可信程度約為99%,或說明有或說明有99%的把握認為兩個分類變量有關(guān)系的把握認為兩個分類變量有關(guān)系否則就說由樣本觀測數(shù)據(jù)沒有充分證據(jù)顯示否則就說由樣本觀測數(shù)據(jù)沒有充分證據(jù)顯示“X與與Y有關(guān)系有關(guān)系”.2.假設(shè)假設(shè)假設(shè)假設(shè)H0:兩個變量:兩個變量X與與Y沒有關(guān)系沒有關(guān)系成立成立1.1.確定臨界
16、值確定臨界值k0根根據(jù)實際問題需要的可信程度確定臨界值據(jù)實際問題需要的可信程度確定臨界值k k0 0;10.8287.8796.6355.0243.8412.7062.0721.3230.7080.445 k0.0010.0050.0100.0250.050.100.150.50.400.502()P Kk例例1.1.在在500500人身上試驗?zāi)撤N血清預(yù)防感冒作用,把他們一年中人身上試驗?zāi)撤N血清預(yù)防感冒作用,把他們一年中的感冒記錄與另外的感冒記錄與另外500500名未用血清的人的感冒記錄作比較,結(jié)名未用血清的人的感冒記錄作比較,結(jié)果如表所示。果如表所示。未感冒未感冒感冒感冒合計合計使用血清使用
17、血清252248500未使用血清未使用血清224276500合計合計4765241000試畫出列聯(lián)表的條形圖,并通過圖形判斷這種血清能否起到預(yù)試畫出列聯(lián)表的條形圖,并通過圖形判斷這種血清能否起到預(yù)防感冒的作用?并進行獨立性檢驗。防感冒的作用?并進行獨立性檢驗。在研究某種新措施對豬白痢的防治效果問題時,在研究某種新措施對豬白痢的防治效果問題時,得到以下數(shù)據(jù):得到以下數(shù)據(jù):試問新措施對防止豬白痢是否有效?試問新措施對防止豬白痢是否有效?存活率存活率死亡率死亡率合計合計對照對照11436150新措施新措施13218150合計合計246543001、能夠通過等高條形圖粗略估計兩個分類變量之間是否有關(guān)系
18、、能夠通過等高條形圖粗略估計兩個分類變量之間是否有關(guān)系2、利用、利用 判斷兩個分類變量之間是否有關(guān)系判斷兩個分類變量之間是否有關(guān)系3、了解獨立性檢驗的思想、了解獨立性檢驗的思想2K 設(shè)要判斷的結(jié)論為:設(shè)要判斷的結(jié)論為:H1:“X與與Y有關(guān)系有關(guān)系” 1)、)、通過三維柱形圖和二維條形圖,可以粗略地判斷兩個變通過三維柱形圖和二維條形圖,可以粗略地判斷兩個變量是否量是否有關(guān)系。有關(guān)系。(1)在三維柱形圖中,)在三維柱形圖中, 主對角線上兩個柱形高度的主對角線上兩個柱形高度的 乘積乘積ad與副對角線與副對角線上的上的 乘乘積積bc相差越大,相差越大,H1成成 立的可能性就越大。立的可能性就越大。(2)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 莖稈特征及抗倒伏能力影響
- 體育機構(gòu)管理辦法提綱
- 社會學(xué)核心理論體系梳理與考核要點解析
- 村屯信息收集管理辦法
- 基層銀行綠色金融實踐:業(yè)務(wù)推進與風(fēng)險管理研究
- 合肥臨時酒店管理辦法
- 構(gòu)建高效的學(xué)校安全管理組織架構(gòu)
- 深度學(xué)習(xí)視角下非結(jié)構(gòu)化檔案資源智能分類與主題標(biāo)引研究探索
- 人工智能時代下的大學(xué)教學(xué)創(chuàng)新與突破
- 船舶網(wǎng)絡(luò)安全管理制度
- 報廢汽車回收拆解前景
- 2025年廣東省中考生物試卷真題(含答案解析)
- 第10課+遼夏金元的統(tǒng)治(大概念教學(xué)課件)2024-2025學(xué)年高一歷史上冊教學(xué)課件(統(tǒng)編版2019)
- 裝置保運方案(3篇)
- 中國聚丙烯酰胺行業(yè)市場發(fā)展分析及前景趨勢與投資研究報告2025-2028版
- 青年教師教學(xué)工作坊組織計劃
- 駐非洲員工管理制度
- 工程內(nèi)業(yè)資料管理制度
- 摩托車協(xié)議過戶協(xié)議書
- 四川省德陽市2025年七年級下學(xué)期語文期末試卷及答案
- 黎族文化課件
評論
0/150
提交評論