高中數(shù)學人教A版3第三章統(tǒng)計獨立性檢驗的基本思想及其初步應用_第1頁
高中數(shù)學人教A版3第三章統(tǒng)計獨立性檢驗的基本思想及其初步應用_第2頁
高中數(shù)學人教A版3第三章統(tǒng)計獨立性檢驗的基本思想及其初步應用_第3頁
高中數(shù)學人教A版3第三章統(tǒng)計獨立性檢驗的基本思想及其初步應用_第4頁
高中數(shù)學人教A版3第三章統(tǒng)計獨立性檢驗的基本思想及其初步應用_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

3.2獨立性檢驗的基本思想及其初步應用[學習目標]1.了解獨立性檢驗的基本思想、方法及其簡單應用;2.理解判斷兩個分類變量是否有關系的常用方法、獨立性檢驗中K2的含義及其實施步驟.[知識鏈接]1.舉例說明什么是分類變量?答變量的不同“值”表示個體所屬的不同類別的變量稱為分類變量,分類變量的取值一定是離散的,而且不同的取值僅表示個體所屬的類別,如性別變量,只取男、女兩個值,商品的等級變量只取一級、二級、三級等等.2.什么是列聯(lián)表?怎樣從列聯(lián)表判斷兩個分類變量有無關系?答一般地,假設兩個分類變量X和Y,它們的值域分別為{x1,x2}和{y1,y2},列出兩個變量的頻數(shù)表,稱為列聯(lián)表(如下圖)y1y2總計x1aba+bx2cdc+d總計a+cb+da+b+c+d|ad-bc|越小,說明兩個分類變量x,y之間的關系越弱;|ad-bc|越大,說明兩個分類變量x,y之間的關系越強.[預習導引]1.分類變量和列聯(lián)表(1)分類變量:變量的不同“值”表示個體所屬的不同類別,像這樣的變量稱為分類變量.(2)列聯(lián)表①定義:列出的兩個分類變量的頻數(shù)表稱為列聯(lián)表.②2×2列聯(lián)表一般地,假設兩個分類變量X和Y,它們的取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(也稱為2×2列聯(lián)表)為下表.y1y2總計x1aba+bx2cdc+d總計a+cb+da+b+c+d2.等高條形圖(1)等高條形圖與表格相比,更能直觀地反映出兩個分類變量間是否相互影響,常用等高條形圖展示列聯(lián)表數(shù)據(jù)的頻率特征.(2)觀察等高條形圖發(fā)現(xiàn)eq\f(a,a+b)和eq\f(c,c+d)相差很大,就判斷兩個分類變量之間有關系.3.獨立性檢驗(1)定義:利用隨機變量K2來判斷“兩個分類變量有關系”的方法稱為獨立性檢驗.(2)K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),其中n=a+b+c+d.(3)獨立性檢驗的具體做法①根據(jù)實際問題的需要確定容許推斷“兩個分類變量有關系”犯錯誤概率的上界α,然后查表確定臨界值k0.②利用公式計算隨機變量K2的觀測值k.③如果k≥k0,就推斷“X與Y有關系”,這種推斷犯錯誤的概率不超過α,否則就認為在犯錯誤的概率不超過α的前提下不能推斷“X與Y有關系”,或者在樣本數(shù)據(jù)中沒有發(fā)現(xiàn)足夠證據(jù)支持結論“X與Y有關系”.要點一有關“相關的檢驗”例1某校對學生課外活動進行調查,結果整理成下表:用你所學過的知識進行分析,能否在犯錯誤的概率不超過的前提下,認為“喜歡體育還是文娛與性別有關系”?體育文娛總計男生212344女生62935總計275279解判斷方法如下:假設H0“喜歡體育還是喜歡文娛與性別沒有關系”,若H0成立,則K2應該很?。遖=21,b=23,c=6,d=29,n=79,∴K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))=eq\f(79×(21×29-23×6)2,44×35×27×52)≈.且P(K2≥≈即我們得到的K2的觀測值k≈超過,這就意味著:“喜歡體育還是文娛與性別沒有關系”這一結論成立的可能性小于,即在犯錯誤的概率不超過的前提下認為“喜歡體育還是喜歡文娛與性別有關”.規(guī)律方法(1)利用K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))求出K2的觀測值k的值.再利用臨界值的大小來判斷假設是否成立.(2)解題時應注意準確代數(shù)與計算,不可錯用公式,準確進行比較與判斷.跟蹤演練1為研究學生的數(shù)學成績與對學習數(shù)學的興趣是否有關,對某年級學生作調查得到如下數(shù)據(jù):成績優(yōu)秀成績較差總計興趣濃厚的643094興趣不濃厚的227395總計86103189判斷學生的數(shù)學成績好壞與對學習數(shù)學的興趣是否有關?解由公式得K2的觀測值k=eq\f(189×(64×73-22×30)2,86×103×95×94)≈.∵>,∴有%的把握說學生學習數(shù)學的興趣與數(shù)學成績是有關的.要點二有關“無關的檢驗”例2為了探究學生選報文、理科是否與對外語的興趣有關,某同學調查了361名高二在校學生,調查結果如下:理科對外語有興趣的有138人,無興趣的有98人,文科對外語有興趣的有73人,無興趣的有52人.分析學生選報文、理科與對外語的興趣是否有關?解列出2×2列聯(lián)表理文總計有興趣13873211無興趣9852150總計236125361代入公式得K2的觀測值k=eq\f(361×(138×52-73×98)2,236×125×211×150)≈×10-4.∵×10-4<,∴可以認為學生選報文、理科與對外語的興趣無關.規(guī)律方法運用獨立性檢驗的方法:(1)列出2×2列聯(lián)表,根據(jù)公式計算K2的觀測值k.(2)比較k與k0的大小作出結論.跟蹤演練2第16屆亞運會于2023年11月12日至27日在中國廣州進行,為了搞好接待工作,組委會招募了16名男志愿者和14名女志愿者,調查發(fā)現(xiàn),男、女志愿者中分別有10人和6人喜愛運動,其余人不喜愛運動.(1)根據(jù)以上數(shù)據(jù)完成以下2×2列聯(lián)表:喜愛運動不喜愛運動總計男1016女614總計30(2)根據(jù)列聯(lián)表的獨立性檢驗,能否在犯錯誤的概率不超過的前提下認為性別與喜愛運動有關?解(1)喜愛運動不喜愛運動總計男10616女6814總計161430(2)假設是否喜愛運動與性別無關,由已知數(shù)據(jù)可求得:K2=eq\f(30×(10×8-6×6)2,(10+6)(6+8)(10+6)(6+8))≈5<,因此,在犯錯誤的概率不超過的前提下不能判斷喜愛運動與性別有關.要點三獨立性檢驗的基本思想例3某企業(yè)有兩個分廠生產(chǎn)某種零件,按規(guī)定內徑尺寸(單位:mm)的值落在,的零件為優(yōu)質品.從兩個分廠生產(chǎn)的零件中各抽出500件,量其內徑尺寸,結果如下表:甲廠分組[,[,[,[,[,[,[,頻數(shù)12638618292614乙廠分組[,[,[,[,[,[,[,頻數(shù)297185159766218(1)試分別估計兩個分廠生產(chǎn)的零件的優(yōu)質品率;(2)由以上統(tǒng)計數(shù)據(jù)填下面2×2列聯(lián)表,并問是否有99%的把握認為“兩個分廠生產(chǎn)的零件的質量有差異”.甲廠乙廠總計優(yōu)質品非優(yōu)質品總計附:K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),P(K2≥k0)k0解(1)甲廠抽查的產(chǎn)品中有360件優(yōu)質品,從而甲廠生產(chǎn)的零件的優(yōu)質品率估計為eq\f(360,500)=72%;乙廠抽查的產(chǎn)品中有320件優(yōu)質品,從而乙廠生產(chǎn)的零件的優(yōu)質品率估計為eq\f(320,500)=64%.(2)甲廠乙廠總計優(yōu)質品360320680非優(yōu)質品140180320總計5005001000K2=eq\f(1000×(360×180-320×140)2,500×500×680×320)≈>,所以有99%的把握認為“兩個分廠生產(chǎn)的零件的質量有差異”.規(guī)律方法(1)解答此類題目的關鍵在于正確利用K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))計算k的值,再用它與臨界值k0的大小作比較來判斷假設檢驗是否成立,從而使問題得到解決.(2)此類題目規(guī)律性強,解題比較格式化,填表計算分析比較即可,要熟悉其計算流程,不難理解掌握.跟蹤演練3下表是某地區(qū)的一種傳染病與飲用水的調查表:得病不得病總計干凈水52466518不干凈水94218312總計146684830(1)這種傳染病是否與飲用水的衛(wèi)生程度有關,請說明理由;(2)若飲用干凈水得病5人,不得病50人,飲用不干凈水得病9人,不得病22人.按此樣本數(shù)據(jù)分析這種疾病是否與飲用水有關,并比較兩種樣本在反映總體時的差異.解(1)假設H0:傳染病與飲用水無關.把表中數(shù)據(jù)代入公式得:K2的觀測值k=eq\f(830×(52×218-466×94)2,146×684×518×312)≈,∵>,所以拒絕H0.因此我們有%的把握認為該地區(qū)這種傳染病與飲用不干凈水有關.(2)依題意得2×2列聯(lián)表:得病不得病總計干凈水55055不干凈水92231總計147286此時,K2的觀測值k=eq\f(86×(5×22-50×9)2,14×72×55×31)≈.由于>,所以我們有%的把握認為該種疾病與飲用不干凈水有關.兩個樣本都能統(tǒng)計得到傳染病與飲用不干凈水有關這一相同結論,但(1)中我們有%的把握肯定結論的正確性,(2)中我們只有%的把握肯定.1.觀察下列各圖,其中兩個分類變量x,y之間關系最強的是()答案D解析觀察等高條形圖發(fā)現(xiàn)eq\f(x1,x1+y1)=eq\f(x2,x2+y2)相差很大,就判斷兩個分類變量之量關系最強.2.下面是一個2×2列聯(lián)表:y1y2總計x1a2173x282533總計b46106則表中a,b處的值分別為()A.94,96B.52,50C.52,60D.54,52答案C解析∵a+21=73,∴a=52,b=a+8=52+8=60.3.經(jīng)過對K2的統(tǒng)計量的研究,得到了若干個臨界值,當K2的觀測值k>時,我們()A.在犯錯誤的概率不超過的前提下可認為X與Y有關B.在犯錯誤的概率不超過的前提下可認為X與Y無關C.在犯錯誤的概率不超過的前提下可認為X與Y有關D.沒有充分理由說明事件X與Y有關系答案A4.根據(jù)下表計算:不看電視看電視男3785女35143K2的觀測值k≈________(保留3位小數(shù)).答案解析k=eq\f(300×(37×143-85×35)2,122×178×72×228)≈.1.列聯(lián)表與等高條形圖列聯(lián)表由兩個分類變量之間頻率大小差異說明這兩個變量之間是否有關聯(lián)關系,而利用等高條形圖能形象直觀地反映它們之間的差異,進而推斷它們之間是否具有關聯(lián)關系.2.對獨立性檢驗思想的理解獨立性檢驗的基本思想類似于數(shù)學中的反證法.先假設“兩個分類變量沒有關系”成立,計算隨機變量K2的值,如果K2值很大,說明假設不合理.K2越大,兩個分類變量有關系的可能性越大.一、基礎達標1.下面說法正確的是()A.統(tǒng)計方法的特點是統(tǒng)計推斷準確、有效B.獨立性檢驗的基本思想類似于數(shù)學上的反證法C.任何兩個分類變量有關系的可信度都可以通過查表得到D.不能從等高條形圖中看出兩個分類變量是否相關答案B2.用獨立性檢驗來考察兩個分類變量x與y是否有關系,當統(tǒng)計量K2的觀測值()A.越大,“x與y有關系”成立的可能性越小B.越大,“x與y有關系”成立的可能性越大C.越小,“x與y沒有關系”成立的可能性越小D.與“x與y有關系”成立的可能性無關答案B3.在一個2×2列聯(lián)表中,由其數(shù)據(jù)計算得K2的觀測值k=,則這兩個變量間有關系的可能性為()A.99%B.%C.%D.無關系答案A解析K2的觀測值<k<,所以有99%的把握認為兩個變量有關系.4.對兩個分類變量A,B的下列說法中正確的個數(shù)為()①A與B無關,即A與B互不影響;②A與B關系越密切,則K2的值就越大;③K2的大小是判定A與B是否相關的唯一依據(jù)A.0B.1C.2D.3答案B解析①正確,A與B無關即A與B相互獨立;②不正確,K2的值的大小只是用來檢驗A與B是否相互獨立;③不正確,例如借助三維柱形圖、二維條形圖等.故選B.5.如果K2的觀測值為,可以認為“x與y無關”的可信度是________.答案1%解析查表可知可信度為1%.6.為了解高中生作文成績與課外閱讀量之間的關系,某研究機構隨機抽取了60名高中生,通過問卷調查,得到以下數(shù)據(jù):作文成績優(yōu)秀作文成績一般總計課外閱讀量較大221032課外閱讀量一般82028總計303060由以上數(shù)據(jù),計算得到K2的觀測值k≈,根據(jù)臨界值表,有________把握認為課外閱讀量大與作文成績優(yōu)秀有關.答案%解析根據(jù)臨界值表,>,在犯錯誤的概率不超過的前提下,認為課外閱讀量大與作文成績優(yōu)秀有關,即有%的把握認為課外閱讀量大與作文成績優(yōu)秀有關.7.在某測試中,卷面滿分為100分,60分為及格,為了調查午休對本次測試前兩個月復習效果的影響,特對復習中進行午休和不進行午休的考生進行了測試成績的統(tǒng)計,數(shù)據(jù)如下表所示:分數(shù)段29~4041~5051~6061~7071~8081~9091~100午休考生人數(shù)23473021143114不午休考生人數(shù)1751671530173(1)根據(jù)上述表格完成列聯(lián)表:及格人數(shù)不及格人數(shù)總計午休不午休總計(2)根據(jù)列聯(lián)表可以得出什么樣的結論?對今后的復習有什么指導意義?解(1)根據(jù)題表中數(shù)據(jù)可以得到列聯(lián)表如下:及格人數(shù)不及格人數(shù)總計午休80100180不午休65135200總計145235380(2)計算可知,午休的考生及格率為P1=eq\f(80,180)=eq\f(4,9),不午休的考生的及格率為P2=eq\f(65,200)=eq\f(13,40),則P1>P2,因此,可以粗略判斷午休與考生考試及格有關系,并且午休的及格率高,所以在以后的復習中考生應盡量適當午休,以保持最佳的學習狀態(tài).二、能力提升8.在等高條形圖中,下列哪兩個比值相差越大,要推斷的論述成立的可能性就越大()\f(a,a+b)與eq\f(d,c+d)\f(c,a+b)與eq\f(a,c+d)\f(a,a+b)與eq\f(c,c+d)\f(a,a+b)與eq\f(c,b+c)答案C解析由等高條形圖可知eq\f(a,a+b)與eq\f(c,c+d)的值相差越大,|ad-bc|就越大,相關性就越強.9.考察棉花種子經(jīng)過處理跟生病之間的關系得到下表數(shù)據(jù):種子處理種子未處理總計得病32101133不得病61213274總計93314407根據(jù)以上數(shù)據(jù),可得出()A.種子是否經(jīng)過處理跟是否生病有關B.種子是否經(jīng)過處理跟是否生病無關C.種子是否經(jīng)過處理決定是否生病D.以上都是錯誤的答案B解析由K2=eq\f(407×(32×213-61×101)2,93×314×133×274)≈<,即沒有把握認為種子是否經(jīng)過處理跟是否生病有關.10.為研究某新藥的療效,給50名患者服用此藥,跟蹤調查后得下表中的數(shù)據(jù):無效有效總計男性患者153550女性患者64450總計2179100設H0:服用此藥的效果與患者的性別無關,則K2的觀測值k≈________(小數(shù)點后保留三位有效數(shù)字),從而得出結論:服用此藥的效果與患者的性別有關,這種判斷出錯的可能性為________.答案5%解析由公式計算得K2的觀測值k≈,∵k>,∴我們有95%的把握認為服用此藥的效果與患者的性別有關,從而有5%的可能性出錯.11.高中流行這樣一句話“文科就怕數(shù)學不好,理科就怕英語不好”.下表是一次針對高三文科學生的調查所得數(shù)據(jù),試問:在出錯概率不超過的前提下,能否判斷“文科學生總成績不好與數(shù)學成績不好有關系”?總成績不好總成績好總計數(shù)學成績不好47812490數(shù)學成績好39924423總計87736913解依題意,計算隨機變量K2的觀測值:k=eq\f(913×(478×24-399×12)2,490×423×877×36)≈>,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論