人教版A選修第一章統(tǒng)計案例獨立性檢驗的基本思想及其初步應用_第1頁
人教版A選修第一章統(tǒng)計案例獨立性檢驗的基本思想及其初步應用_第2頁
人教版A選修第一章統(tǒng)計案例獨立性檢驗的基本思想及其初步應用_第3頁
人教版A選修第一章統(tǒng)計案例獨立性檢驗的基本思想及其初步應用_第4頁
人教版A選修第一章統(tǒng)計案例獨立性檢驗的基本思想及其初步應用_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、山東省臨沂第二中學高二數(shù)學組山東省臨沂第二中學高二數(shù)學組1.2 1.2 獨立性檢驗的基本思想及其初步應用獨立性檢驗的基本思想及其初步應用 在統(tǒng)計學中,獨立性檢驗就是檢驗兩個分類變量是在統(tǒng)計學中,獨立性檢驗就是檢驗兩個分類變量是否有關系的一種統(tǒng)計方法。否有關系的一種統(tǒng)計方法。 所謂所謂“分類變量分類變量”,就是指個體所屬的類別不同,也,就是指個體所屬的類別不同,也稱為稱為屬性變量屬性變量或或定型變量定型變量。 在日常生活中,我們常常關心兩個分類變量之間是在日常生活中,我們常常關心兩個分類變量之間是否有關系,例如吸煙是否與患肺癌有關系?性別是否對否有關系,例如吸煙是否與患肺癌有關系?性別是否對于喜

2、歡數(shù)學課程有影響等等。于喜歡數(shù)學課程有影響等等。 吸煙與患肺癌列聯(lián)表吸煙與患肺癌列聯(lián)表患肺癌患肺癌不患肺癌不患肺癌總計總計吸煙吸煙49492099209921482148不吸煙不吸煙42427775777578177817總計總計91919874987499659965為了調查吸煙是否對肺癌有影響,某腫瘤研究所隨機為了調查吸煙是否對肺癌有影響,某腫瘤研究所隨機地調查了地調查了99659965人,得到如下結果(單位:人)人,得到如下結果(單位:人)列聯(lián)表列聯(lián)表2 22 2在不吸煙者中患肺癌的比重是在不吸煙者中患肺癌的比重是 在吸煙者中患肺癌的比重是在吸煙者中患肺癌的比重是 0.54%0.54%2

3、.28%2.28%1)通過圖形直觀判斷通過圖形直觀判斷三維柱三維柱狀圖狀圖2) 通過圖形直觀判斷通過圖形直觀判斷二維二維條形圖條形圖3)通過圖形直觀判斷通過圖形直觀判斷患肺癌患肺癌比例比例不患肺癌不患肺癌比例比例等高等高條形圖條形圖問題1:判斷的標準是什么?吸煙與不吸煙,患病的可能性的大小是否有差異?說明:吸煙者和不吸煙者患肺癌的可能性存在差異,說明:吸煙者和不吸煙者患肺癌的可能性存在差異,吸煙者患肺癌的可能性大吸煙者患肺癌的可能性大問題2:差異大到什么程度才能作出“吸煙與患病有關”的判斷?問題3:能否用數(shù)量刻畫出“有關”的程度? 獨立性檢驗H H0 0: 吸煙吸煙和和患肺癌患肺癌之間之間 沒

4、有關系沒有關系 通過數(shù)據(jù)和圖表分析,得到通過數(shù)據(jù)和圖表分析,得到結論是:結論是:吸煙與患肺癌有關吸煙與患肺癌有關結論的可靠結論的可靠程度如何?程度如何? 吸煙與患肺癌列聯(lián)表吸煙與患肺癌列聯(lián)表不患肺癌不患肺癌患肺癌患肺癌總計總計不吸煙不吸煙a ab ba+ba+b吸煙吸煙c cd dc+dc+d總計總計a+ca+cb+db+da+b+c+da+b+c+dacac,a+bc+da+bc+d a a c c+ +d d c c a a+ +b b , ,adbc吸煙的人中不患肺癌的比例:吸煙的人中不患肺癌的比例:baa不吸煙的人中不患肺癌的比例:不吸煙的人中不患肺癌的比例:dcc若若H H0 0成立

5、成立0.adbca ad d- -b bc c 越越小小,說說明明吸吸煙煙與與患患肺肺癌癌之之間間的的關關系系越越弱弱,ad-bc 越大,說明吸煙與患肺癌之間的關系越強ad-bc 越大,說明吸煙與患肺癌之間的關系越強引入一個隨機變量:引入一個隨機變量:卡方統(tǒng)計量卡方統(tǒng)計量作為檢驗在多大程度上可以認為作為檢驗在多大程度上可以認為“兩個變量兩個變量有關系有關系”的標準的標準 。dcban其中dbcadcbabcadnK22通過公式計算通過公式計算 吸煙與患肺癌列聯(lián)表吸煙與患肺癌列聯(lián)表患肺癌患肺癌不患肺癌不患肺癌總計總計吸煙吸煙49492099209921482148不吸煙不吸煙4242777577

6、7578177817總計總計91919874987499659965632.569198742148781720994249777599652k已知在已知在 成立的情況下,成立的情況下,0H故有故有99%99%的把握認為的把握認為H H0 0不成立,即有不成立,即有99%99%的把的把握認為握認為“患肺癌與吸煙有關系患肺癌與吸煙有關系”。即在即在 成立的情況下,成立的情況下, 大于大于6.6356.635概率非常小,概率非常小,近似為近似為0.0100.0100H2K現(xiàn)在的現(xiàn)在的 =56.632=56.632的觀測值遠大于的觀測值遠大于6.6356.635,出現(xiàn)這樣的觀測值的概率不超過出現(xiàn)這樣

7、的觀測值的概率不超過0.0100.010。k010.0)635.6(2KPa+b+c+da+b+c+db+db+da+ca+c總計總計c+dc+dd dc ca+ba+bb ba a總計總計一般地,對于兩個分類變量一般地,對于兩個分類變量X X和和Y Y。X X有兩類取值:有兩類取值:即類即類 和和 (如吸煙與不吸煙);(如吸煙與不吸煙);Y Y也有兩類取值:也有兩類取值:即類即類 和和 (如患病與不患病)。于是得到下列樣(如患病與不患?。S谑堑玫较铝袠颖绢l數(shù)的本頻數(shù)的2 22 2列聯(lián)表為:列聯(lián)表為:x1x2y2y1y1y2x1x2 用卡方統(tǒng)計量來確定在多大程度上可以認為用卡方統(tǒng)計量來確定在

8、多大程度上可以認為“兩個分類變量有關系兩個分類變量有關系”的方法稱為這兩個分類變的方法稱為這兩個分類變量的量的獨立性檢驗獨立性檢驗。要推斷要推斷“X X和和Y Y有關系有關系”,可按下面的步驟進行:,可按下面的步驟進行:(1 1)提出假設)提出假設H H0 0 :X X和和Y Y沒有關系;沒有關系;(3 3)查對臨界值,作出判斷。)查對臨界值,作出判斷。(2 2)根據(jù))根據(jù)2 22 2列聯(lián)表與公式計算列聯(lián)表與公式計算 的值;的值;k2K0k0k10.8287.8796.6355.0243.8410.0010.0050.0100.0250.052.7062.0721.3230.7080.4550

9、.100.150.250.400.50P( )反證法原理與假設檢驗原理反證法原理: 在一個已知假設下,如果推出一個矛盾,就證明了這個假設不成立。假設檢驗原理:在一個已知假設下,如果一個與該假設矛盾的小概率事件發(fā)生,就推斷這個假設不成立。例例1.在某醫(yī)院在某醫(yī)院,因為患心臟病而住院的因為患心臟病而住院的665名男性病人名男性病人中中,有有214人禿頂人禿頂;而另外而另外772名不是因為患心臟病而住名不是因為患心臟病而住院的男性病人中有院的男性病人中有175禿頂禿頂.分別利用圖形和獨立性檢分別利用圖形和獨立性檢驗方法判斷禿頂與患心臟病是否有關系驗方法判斷禿頂與患心臟病是否有關系?你所得的結論你所得

10、的結論在什么范圍內有效在什么范圍內有效?禿頂與患心臟病列聯(lián)表禿頂與患心臟病列聯(lián)表患心臟患心臟病病患其他患其他病病總計總計禿頂禿頂214175389不禿頂不禿頂4515971048總計總計6657721437有有99%的把握認為的把握認為“禿頂與患心臟病有關禿頂與患心臟病有關”635. 6373.167726651048389)451175597214(14372k說明:在熟悉獨立性檢驗的原理后,可以通說明:在熟悉獨立性檢驗的原理后,可以通過直接計算過直接計算K K的觀測值(不畫等高條形圖)的觀測值(不畫等高條形圖)來解決兩個分類變量的獨立性檢驗問題,來解決兩個分類變量的獨立性檢驗問題,但是,借

11、助圖形更直觀。但是,借助圖形更直觀。犯錯誤的概率是指將犯錯誤的概率是指將“禿頂與患心臟病有禿頂與患心臟病有關系關系”錯判成錯判成“禿頂禿頂與心臟病沒有關系與心臟病沒有關系”的概率的概率例例2 為考察高中生的性別與是否喜歡數(shù)學課程之間的關為考察高中生的性別與是否喜歡數(shù)學課程之間的關系。在某城市的某校高中生隨機抽取系。在某城市的某校高中生隨機抽取300名學生。得到名學生。得到如下列聯(lián)表:如下列聯(lián)表:性別與喜歡數(shù)學課程列聯(lián)表性別與喜歡數(shù)學課程列聯(lián)表喜歡喜歡不喜歡不喜歡總計總計男男3785122女女35143178總計總計72228300 由表中數(shù)據(jù)計算得到由表中數(shù)據(jù)計算得到K2的觀測值的觀測值k4.

12、514。能夠。能夠以以95的把握認為高中生的性別與是否喜歡數(shù)學課程的把握認為高中生的性別與是否喜歡數(shù)學課程之間有關系嗎?為什么?之間有關系嗎?為什么? 解:在假設解:在假設 “ “性別與是否喜歡數(shù)學課程之間沒有關系性別與是否喜歡數(shù)學課程之間沒有關系”的前提下,的前提下, 應該很小,并且應該很小,并且而我們所得到的而我們所得到的 的觀測值的觀測值 超過超過3.8413.841,這就,這就意味著意味著“性別與是否喜歡數(shù)學課程之間有關系性別與是否喜歡數(shù)學課程之間有關系”這一結論這一結論是錯誤的可能性約為是錯誤的可能性約為0.050.05,即有,即有95%95%的把握認為的把握認為“性別與性別與是否喜

13、歡數(shù)學課程之間有關系是否喜歡數(shù)學課程之間有關系”。2K2K2K05. 0)841. 3(2KP514. 4k練習練習: ( P17 )甲乙兩個班級進行一門考試甲乙兩個班級進行一門考試,按照學生考試成績優(yōu)秀和按照學生考試成績優(yōu)秀和不優(yōu)秀統(tǒng)計后不優(yōu)秀統(tǒng)計后,得到如下列聯(lián)表得到如下列聯(lián)表:優(yōu)秀優(yōu)秀不優(yōu)秀不優(yōu)秀總計總計甲班甲班103545乙班乙班73845總計總計177390畫出列聯(lián)表的條形圖出列聯(lián)表的條形圖,并通過圖形判斷成績與班級是否并通過圖形判斷成績與班級是否有關有關.利用列聯(lián)表的獨立性檢驗估計利用列聯(lián)表的獨立性檢驗估計,認為認為“成績與班級成績與班級有關系有關系”犯錯誤的概率是多少。犯錯誤的概率是多少。由圖及表直觀判斷,好像由圖及表直觀判斷,好像“成績優(yōu)秀與班級有關系成績優(yōu)秀與班級有關系”,由表中,由表中數(shù)據(jù)計算,得數(shù)據(jù)計算,得 的觀察值為的觀察值為 。由教科書中表。由教科書中表1-121-12,得,得從而由從而由50%50%的把握認為的把

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論