《獨立性檢驗的基本思想及其初步》同步練習 全市一等獎_第1頁
《獨立性檢驗的基本思想及其初步》同步練習 全市一等獎_第2頁
《獨立性檢驗的基本思想及其初步》同步練習 全市一等獎_第3頁
《獨立性檢驗的基本思想及其初步》同步練習 全市一等獎_第4頁
《獨立性檢驗的基本思想及其初步》同步練習 全市一等獎_第5頁
已閱讀5頁,還剩8頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

《獨立性檢驗的基本思想及其初步》同步練習明目標、知重點1.了解分類變量的意義.2.了解2×2列聯(lián)表的意義.3.了解隨機變量K2的意義.4.通過對典型案例分析,了解獨立性檢驗的基本思想和方法.1.分類變量和列聯(lián)表(1)分類變量變量的不同“值”表示個體所屬的不同類別,像這樣的變量稱為分類變量.(2)列聯(lián)表①定義:列出的兩個分類變量的頻數(shù)表稱為列聯(lián)表.②2×2列聯(lián)表一般地,假設有兩個分類變量X和Y,它們的取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(也稱為2×2列聯(lián)表)為下表.y1y2總計x1aba+bx2cdc+d總計a+cb+da+b+c+d2.等高條形圖(1)等高條形圖與表格相比,更能直觀地反映出兩個分類變量間是否相互影響,常用等高條形圖展示列聯(lián)表數(shù)據(jù)的頻率特征.(2)觀察等高條形圖發(fā)現(xiàn)eq\f(a,a+b)和eq\f(c,c+d)相差很大,就判斷兩個分類變量之間有關系.3.獨立性檢驗(1)定義:利用隨機變量K2來判斷“兩個分類變量有關系”的方法稱為獨立性檢驗.(2)K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),其中n=a+b+c+d為樣本容量.(3)獨立性檢驗的具體做法①根據(jù)實際問題的需要確定容許推斷“兩個分類變量有關系”犯錯誤概率的上界α,然后查表確定臨界值k0.②利用公式計算隨機變量K2的觀測值k.③如果k≥k0,就推斷“X與Y有關系”,這種推斷犯錯誤的概率不超過α,否則就認為在犯錯誤的概率不超過α的前提下不能推斷“X與Y有關系”,或者在樣本數(shù)據(jù)中沒有發(fā)現(xiàn)足夠證據(jù)支持結論“X與Y有關系”.[情境導學]5月探究點一列聯(lián)表和等高條形圖思考1舉例說明什么是分類變量?答變量的不同“值”表示個體所屬的不同類別的變量稱為分類變量,分類變量的取值一定是離散的,而且不同的取值僅表示個體所屬的類別,如性別變量,只取男、女兩個值,商品的等級變量只取一級、二級、三級等等.思考2什么是列聯(lián)表?怎樣從列聯(lián)表判斷兩個分類變量有無關系?答一般地,假設有兩個分類變量X和Y,它們的取值分別為{x1,x2}和{y1,y2},則兩個變量的頻數(shù)表,稱為列聯(lián)表(如下圖)y1y2總計x1aba+bx2cdc+d總計a+cb+da+b+c+d|ad-bc|越小,說明兩個分類變量x、y之間的關系越弱;|ad-bc|越大,說明兩個分類變量x、y之間的關系越強.思考3等高條形圖對分析兩個分類變量是否有關系,有何幫助?答通過畫等高條形圖,我們可以直觀觀察兩個變量的比例關系,判斷兩個變量是否有關系.例1某醫(yī)療機構為了了解呼吸道疾病與吸煙是否有關,進行了一次抽樣調查,共調查了515個成年人,其中吸煙者220人,不吸煙者295人.調查結果是:吸煙的220人中有37人患呼吸道疾病(簡稱患病),183人未患呼吸道疾病(簡稱未患病);不吸煙的295人中有21人患病,274人未患病.根據(jù)這些數(shù)據(jù)能否斷定“患呼吸道疾病與吸煙有關”?(用列聯(lián)表和等高條形圖說明).解(1)作出列聯(lián)表如下:患病未患病總計吸煙37183220不吸煙21274295總計58457515在吸煙的人中,有eq\f(37,220)≈%的人患病,在不吸煙的人中,有eq\f(21,295)≈%的人患?。缮峡梢钥闯觯鼰熣咧谢疾〉谋壤c不吸煙者中患病的比例相比有很大的差異,故“患呼吸道疾病與吸煙可能有關”.(2)畫出等高條形圖如下:通過上面的等高條形圖可以直觀看出,吸煙者中患病的比例與不吸煙者中患病的比例相比有很大的差異,故“患呼吸道疾病與吸煙可能有關”.反思與感悟利用數(shù)形結合的思想,借助等高條形圖來判斷兩個分類變量是否相關是判斷變量相關的常見方法之一.一般地,在等高條形圖中,eq\f(a,a+b)與eq\f(c,c+d)相差越大,兩個分類變量有關系的可能性就越大.跟蹤訓練1在調查的480名男人中有38人患色盲,520名女人中有6名患色盲,試利用圖形來判斷色盲與性別是否有關?解根據(jù)題目給出的數(shù)據(jù)作出如下的列聯(lián)表:色盲不色盲總計男38442480女6514520總計449561000根據(jù)列聯(lián)表作出相應的等高條形圖:從等高條形圖來看在男人中患色盲的比例要比在女人中患色盲的比例大得多,因而,我們認為性別與患色盲是有關系的.探究點二獨立性檢驗思考1利用列聯(lián)表及等高條形圖判斷兩個分類變量是否有關有什么優(yōu)缺點?答優(yōu)點:比較直觀.缺點:缺少精確性和可靠性.思考2隨機變量K2有何作用?答利用隨機變量K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))(其中n=a+b+c+d為樣本容量)可以來確定在多大程度上可以認為“兩個分類變量有關系”.思考3獨立性檢驗的基本思想是什么?答獨立性檢驗的基本思想類似于數(shù)學中的反證法,要確認兩個分類變量有關系這一結論成立的可信程度,首先假設該結論不成立,即假設結論“兩個分類變量沒有關系”成立,在該假設下,用我們構造的隨機變量K2的觀測值應該很小,如果由觀測數(shù)據(jù)計算得到的K2的觀測值很大,則在一定程度上說明假設不合理,根據(jù)隨機變量K2的含義,可以通過P(K2≥≈來評價假設不合理的程度,由實際計算出K2>,說明假設不合理的程度約為99%,即兩個分類變量有關系這一結論成立的可信程度為99%.例2在某醫(yī)院,因為患心臟病而住院的665名男性病人中有214人禿頂,而另外772名不是因為患心臟病而住院的男性病人中有175人禿頂.(1)利用圖形判斷禿頂與患心臟病是否有關系;(2)能否在犯錯誤的概率不超過的前提下認為禿頂與患心臟病有關系?解(1)根據(jù)題目所給的數(shù)據(jù)畫出列聯(lián)表:患心臟病患其他病總計禿頂214175389不禿頂4515971048總計6657721437相應的等高條形圖如圖所示:比較來說,禿頂?shù)牟∪酥谢夹呐K病的比例大一些,可以在某種程度上認為“禿頂與患心臟病有關”.(2)根據(jù)列聯(lián)表中的數(shù)據(jù),得到k=eq\f(1437×(214×597-175×451)2,389×1048×665×772)≈>,因此,在犯錯誤的概率不超過的前提下認為禿頂與患心臟病有關系.反思與感悟(1)利用隨機變量K2進行獨立性檢驗的步驟:①根據(jù)實際問題需要的可信度α確定臨界值k0;②根據(jù)給出數(shù)據(jù)計算得出隨機變量K2的觀測值k;③如果k≥k0,就認為在犯錯誤的概率不超過α的前提下,認為兩變量有關系;否則,認為兩個分類變量沒有關系.(2)獨立性檢驗能精確判斷可靠程度,而等高條形圖的優(yōu)點是直觀,但只可以粗略判斷兩個分類變量是否有關系,一般在通過圖表判斷后還需要用獨立性檢驗來確認.跟蹤訓練2為了探究吸煙習慣與患慢性氣管炎是否有關,調查了339名50歲以上的人,獲數(shù)據(jù)如下:患慢性氣管炎未患慢性氣管炎總計吸煙43162205不吸煙13121134總計56283339吸煙習慣與患慢性氣管炎是否相關?試用獨立性檢驗的思想說明理由.解根據(jù)列聯(lián)表的數(shù)據(jù)得到K2的觀測值:k=eq\f(n(ad-bc)2,(a+b)(a+c)(d+b)(d+c))=eq\f(339×(43×121-162×13)2,205×56×283×134)≈>,所以,在犯錯誤的概率不超過的前提下認為“吸煙習慣與患慢性氣管炎有關”.1.觀察下列各圖,其中兩個分類變量x,y之間關系最強的是()答案D2.下面是一個2×2列聯(lián)表:y1y2總計x1a2173x282533總計b46則表中a、b處的值分別為()A.94,96 B.52,50C.52,60 D.54,52答案C解析∵a+21=73,∴a=52,b=a+8=52+8=60.3.經(jīng)過對K2的統(tǒng)計量的研究,得到了若干個臨界值,當K2的觀測值k>時,我們()A.在犯錯誤的概率不超過的前提下可認為A與B有關B.在犯錯誤的概率不超過的前提下可認為A與B無關C.在犯錯誤的概率不超過的前提下可認為A與B有關D.沒有充分理由說明事件A與B有關系答案A4.根據(jù)下表計算:不看電視看電視男3785女35143K2的觀測值k≈________.(保留3位小數(shù))答案解析k=eq\f(300×(37×143-85×35)2,122×178×72×228)≈.[呈重點、現(xiàn)規(guī)律]1.列聯(lián)表與等高條形圖列聯(lián)表由兩個分類變量之間頻率大小差異說明這兩個變量之間是否有關聯(lián)關系,而利用等高條形圖能形象直觀地反映它們之間的差異,進而推斷它們之間是否具有關聯(lián)關系.2.對獨立性檢驗思想的理解獨立性檢驗的基本思想類似于數(shù)學中的反證法.先假設“兩個分類變量沒有關系”成立,計算隨機變量K2的值,如果K2值很大,說明假設不合理.K2越大,兩個分類變量有關系的可能性越大.一、基礎過關1.下面說法正確的是()A.統(tǒng)計方法的特點是統(tǒng)計推斷準確、有效B.獨立性檢驗的基本思想類似于數(shù)學上的反證法C.任何兩個分類變量有關系的可信度都可以通過查表得到D.不能從等高條形圖中看出兩個分類變量是否相關答案B2.用獨立性檢驗來考察兩個分類變量x與y是否有關系,當統(tǒng)計量K2的觀測值()A.越大,“x與y有關系”成立的可能性越小B.越大,“x與y有關系”成立的可能性越大C.越小,“x與y沒有關系”成立的可能性越小D.與“x與y有關系”成立的可能性無關答案B3.在一個2×2列聯(lián)表中,由其數(shù)據(jù)計算得K2的觀測值k=,則這兩個變量間有關系的可能性為()A.99% B.%C.% D.無關系答案A解析K2的觀測值<k<,所以有99%的把握認為兩個變量有關系.4.對兩個分類變量A、B的下列說法中正確的個數(shù)為()①A與B無關,即A與B互不影響;②A與B關系越密切,則K2的值就越大;③K2的大小是判定A與B是否相關的唯一依據(jù)A.1 B.2C.3 D.4答案A解析①正確,A與B無關即A與B相互獨立;②不正確,K2的值的大小只是用來檢驗A與B是否相互獨立;③不正確,也可借助三維柱形圖、二維條形圖等.故選A.5.為了解高中生作文成績與課外閱讀量之間的關系,某研究機構隨機抽取了60名高中生,通過問卷調查,得到以下數(shù)據(jù):作文成績優(yōu)秀作文成績一般總計課外閱讀量較大221032課外閱讀量一般82028總計303060由以上數(shù)據(jù),計算得到K2的觀測值k≈,根據(jù)臨界值表,以下說法正確的是()A.沒有充足的理由認為課外閱讀量大與作文成績優(yōu)秀有關B.有%的把握認為課外閱讀量大與作文成績優(yōu)秀有關C.有%的把握認為課外閱讀量大與作文成績優(yōu)秀有關D.有%的把握認為課外閱讀量大與作文成績優(yōu)秀有關答案D解析根據(jù)臨界值表,>,在犯錯誤的概率不超過的前提下,認為課外閱讀量大與作文成績優(yōu)秀有關,即有%的把握認為課外閱讀量大與作文成績優(yōu)秀有關.6.如果K2的觀測值為,可以認為“x與y無關”的可信度是________.答案1%解析查表可知可信度為1%.7.在某測試中,卷面滿分為100分,60分為及格,為了調查午休對本次測試前兩個月復習效果的影響,特對復習中進行午休和不進行午休的考生進行了測試成績的統(tǒng)計,數(shù)據(jù)如下表所示:分數(shù)段29~4041~5051~6061~7071~8081~9091~100午休考生人數(shù)23473021143114不午休考生人數(shù)1751671530173(1)根據(jù)上述表格完成列聯(lián)表:及格人數(shù)不及格人數(shù)總計午休不午休總計(2)根據(jù)列聯(lián)表可以得出什么樣的結論?對今后的復習有什么指導意義?解(1)根據(jù)題表中數(shù)據(jù)可以得到列聯(lián)表如下:及格人數(shù)不及格人數(shù)總計午休80100180不午休65135200總計145235380(2)計算可知,午休的考生及格率為P1=eq\f(80,180)=eq\f(4,9),不午休的考生的及格率為P2=eq\f(65,200)=eq\f(13,40),則P1>P2,因此,可以粗略判斷午休與考生考試及格有關系,并且午休的及格率高,所以在以后的復習中考生應盡量適當午休,以保持最佳的學習狀態(tài).二、能力提升8.在等高條形圖中,下列哪兩個比值相差越大,要推斷的論述成立的可能性就越大()\f(a,a+b)與eq\f(d,c+d) \f(c,a+b)與eq\f(a,c+d)\f(a,a+b)與eq\f(c,c+d) \f(a,a+b)與eq\f(c,b+c)答案C解析由等高條形圖可知eq\f(a,a+b)與eq\f(c,c+d)的值相差越大,|ad-bc|就越大,相關性就越強.9.考察棉花種子經(jīng)過處理跟生病之間的關系得到下表數(shù)據(jù):種子處理種子未處理總計得病32101133不得病61213274總計93314407根據(jù)以上數(shù)據(jù),可得出()A.種子是否經(jīng)過處理跟是否生病有關B.種子是否經(jīng)過處理跟是否生病無關C.種子是否經(jīng)過處理決定是否生病D.以上都是錯誤的答案B解析由k=eq\f(407×(32×213-61×101)2,93×314×133×274)≈<,即沒有把握認為種子是否經(jīng)過處理跟是否生病有關.10.為研究某新藥的療效,給50名患者服用此藥,跟蹤調查后得下表中的數(shù)據(jù):無效有效總計男性患者153550女性患者64450總計2179100設H0:服用此藥的效果與患者的性別無關,則K2的觀測值k≈________(小數(shù)點后保留三位有效數(shù)字),從而得出結論:服用此藥的效果與患者的性別有關,這種判斷出錯的可能性為________.答案5%解析由公式計算得K2的觀測值k≈,∵k>,∴我們有95%的把握認為服用此藥的效果與患者的性別有關,從而有5%的可能性出錯.11.高中流行這樣一句話“文科就怕數(shù)學不好,理科就怕英語不好”.下表是一次針對高三文科學生的調查所得數(shù)據(jù),試問:在出錯概率不超過的前提下,能否判斷“文科學生總成績不好與數(shù)學成績不好有關系”?總成績不好總成績好總計數(shù)學成績不好47812490數(shù)學成績好39924423總計87736913解依題意,計算隨機變量K2的觀測值:k=eq\f(913×(478×24-399×12)2,490×423×877×36)≈>,所以在出錯概率不超過的前提下,可以判斷“文科學生總成績不好與數(shù)學成績不好有關系

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論