




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
PAGE3.2獨立性檢驗的基本思想及其初步應(yīng)用自主預(yù)習·探新知情景引入飲用水的質(zhì)量是人類普遍關(guān)切的問題.據(jù)統(tǒng)計,飲用優(yōu)質(zhì)水的518人中,身體狀況優(yōu)秀的有466人,飲用一般水的312人中,身體狀況優(yōu)秀的有218人.人的身體健康狀況與飲用水的質(zhì)量之間有關(guān)系嗎?新知導(dǎo)學(xué)1.與列聯(lián)表相關(guān)的概念(1)分類變量:變量的不同“__值__”表示個體所屬的__不同類別__,像這樣的變量稱為分類變量.(2)列聯(lián)表:①列出__兩個__分類變量的__頻數(shù)表__,稱為列聯(lián)表.②一般地,假設(shè)有兩個分類變量X和Y,它們的取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為:YXy1y2總計x1ab__a+b__x2cd__c+d__總計__a+c____b+d__a+b+c+d2.等高條形圖等高條形圖與表格相比,圖形更能直觀地反映出兩個分類變量間是否__相互影響__,常用等高條形圖展示列表數(shù)據(jù)的__頻率特征__.3.獨立性檢驗的基本思想(1)定義:利用隨機變量__K2__來推斷“兩個分類變量__有關(guān)系__”的方法稱為獨立性檢驗.(2)公式:K2=__eq\f(nad-bc2,a+bc+da+cb+d)__,其中n=__a+b+c+d__.(3)獨立性檢驗的詳細做法:①依據(jù)實際問題的須要確定容許推斷“兩個分類變量有關(guān)系”犯錯誤概率的上界α,然后查表確定__臨界值__k0.②利用公式計算隨機變量K2的__觀測值__k.③假如__k≥k0__,就推斷“X與Y有關(guān)系”,這種推斷犯錯誤的概率不超過α;否則,就認為在__犯錯誤的概率__不超過α的前提下不能推斷“X與Y有關(guān)系”,或者在樣本數(shù)據(jù)中__沒有發(fā)覺足夠證據(jù)__支持結(jié)論“X與Y有關(guān)系”.預(yù)習自測1.下表是一個2×2列聯(lián)表:y1y2總計x1a2173x222527總計b46100則表中a、b處的值分別為(C)A.94,96 B.52,50C.52,54 D.54,52[解析]由eq\b\lc\{\rc\(\a\vs4\al\co1(a+21=73,,a+2=b,))得eq\b\lc\{\rc\(\a\vs4\al\co1(a=52,,b=54.))2.通過隨機詢問110名性別不同的高校生是否愛好某項運動,得到如下的列聯(lián)表:男女總計愛好402060不愛好203050總計6050110由K2=eq\f(nad-bc2,a+bc+da+cb+d)算得K2=eq\f(110×40×30-20×202,60×50×60×50)≈7.8.附表:P(K2≥k0)0.0500.0100.001k03.8416.63510.828參照附表,得到的正確結(jié)論是(A )A.有99%以上的把握認為“愛好該項運動與性別有關(guān)”B.有99%以上的把握認為“愛好該項運動與性別無關(guān)”C.在犯錯誤的概率不超過0.1%的前提下,認為“愛好該項運動與性別有關(guān)”D.在犯錯誤的概率不超過0.1%的前提下,認為“愛好該項運動與性別無關(guān)”[解析]依據(jù)獨立性檢驗的定義,由K2≈7.8>6.635可知,有99%以上把握認為“愛好該項運動與性別有關(guān)”.3.(2024·瀘州模擬)某中學(xué)愛好小組為調(diào)查該校學(xué)生對學(xué)校食堂的某種食品寵愛與否是否與性別有關(guān),隨機詢問了100名性別不同的學(xué)生,得到如下的2×2列聯(lián)表:男生女生總計寵愛302050不寵愛203050總計5050100附K2=eq\f(nad-bc2,a+bc+da+cb+d)P(K2≥k0)0.150.100.050.0250.010k02.0722.7063.8415.0246.635依據(jù)以上數(shù)據(jù),該數(shù)學(xué)愛好小組有多大把握認為“寵愛該食品與性別有關(guān)”(C)A.99%以上 B.97.5%以上C.95%以上 D.85%以上[解析]K2=eq\f(100×30×30-20×202,50×50×50×50)=4>3.841,∴該數(shù)學(xué)愛好小組有95%以上把握認為“寵愛該食品與性別有關(guān)”.故選C.4.某班主任對全班50名學(xué)生進行了作業(yè)量多少的調(diào)查,數(shù)據(jù)如下表所示:作業(yè)量的狀況玩電腦嬉戲的狀況認為作業(yè)多認為作業(yè)不多總數(shù)寵愛玩電腦嬉戲18927不寵愛玩電腦嬉戲81523總數(shù)262450則認定寵愛玩電腦嬉戲與認為作業(yè)量的多少有關(guān)系的把握為(B)A.99% B.95%C.90% D.以上都不對[解析]K2=eq\f(50×18×15-8×92,27×23×26×24)≈5.059>3.841.因而有95%的把握認定寵愛玩電腦嬉戲與認為作業(yè)量的多少有關(guān).互動探究·攻重難
互動探究解疑命題方向?利用等高條形圖推斷兩個分類變量是否相關(guān)典例1為了解鉛中毒病人與尿棕色素為陽性是否有關(guān)系,分別對病人組和比照組的尿液作尿棕色素定性檢查,結(jié)果如下:組別陽性數(shù)陰性數(shù)總計鉛中毒病人29736比照組92837總計383573試畫出列聯(lián)表的等高條形圖,分析鉛中毒病人和比照組的尿棕色素陽性數(shù)有無差別,鉛中毒病人與尿棕色素為陽性是否有關(guān)系.[解析]等高條形圖如圖所示:其中兩個淺色條的高分別代表鉛中毒病人和比照組樣本中尿棕色素為陽性的頻率.由圖可以直觀地看出鉛中毒病人與比照組相比較尿棕色素為陽性差異明顯,因此鉛中毒病人與尿棕色素為陽性有關(guān)系.『規(guī)律總結(jié)』1.推斷兩個分類變量是否有關(guān)系的兩種常用方法(1)利用數(shù)形結(jié)合思想,借助等高條形圖來推斷兩個分類變量是否相關(guān)是推斷變量相關(guān)的常見方法.(2)一般地,在等高條形圖中,eq\f(a,a+b)與eq\f(c,c+d)相差越大,兩個分類變量有關(guān)系的可能性就越大.2.利用等高條形圖推斷兩個分類變量是否相關(guān)的步驟獨立性檢驗的計算公式?K2=eq\f(nad-bc2,a+bc+da+cb+d)┃┃跟蹤練習1__■(1)假設(shè)兩個變量x與y的2×2列聯(lián)表如下表:y1y2x1abx2cd對于以下數(shù)據(jù),對同一樣本能說明x與y有關(guān)系的可能性最大的一組為(B)A.a(chǎn)=2,b=3,c=4,d=5B.a(chǎn)=5,b=3,c=3,d=4C.a(chǎn)=3,b=6,c=2,d=5D.a(chǎn)=5,b=3,c=4,d=3[解析]依據(jù)觀測值求解的公式可以知道,當ad與bc差距越大,兩個變量有關(guān)的可能性就越大,檢驗四個選項中所給的ad與bc的差距:A:ad-bc=10-12=-2,B:ad-bc=20-9=11,C:ad-bc=15-12=3,D:ad-bc=15-12=3.明顯B中|ad-bc|最大,故選B.(2)某生產(chǎn)線上,質(zhì)量監(jiān)督員甲在生產(chǎn)現(xiàn)場時,990件產(chǎn)品中有合格品982件,次品8件;不在生產(chǎn)現(xiàn)場時,510件產(chǎn)品中有合格品493件,次品17件.試利用列聯(lián)表和等高條形圖推斷監(jiān)督員甲在不在生產(chǎn)現(xiàn)場對產(chǎn)品質(zhì)量好壞有無影響.[解析]依據(jù)題目所給數(shù)據(jù)得如下2×2列聯(lián)表:合格品數(shù)次品數(shù)總計甲在生產(chǎn)現(xiàn)場9828990甲不在生產(chǎn)現(xiàn)場49317510總計1475251500所以ad-bc=982×17-8×493=12750,|ad-bc|比較大,說明甲在不在生產(chǎn)現(xiàn)場與產(chǎn)品質(zhì)量好壞有關(guān)系.相應(yīng)的等高條形圖如圖所示.圖中兩個陰影部分的高分別表示甲在生產(chǎn)現(xiàn)場和甲不在生產(chǎn)現(xiàn)場時樣品中次品數(shù)的頻率.從圖中可以看出,甲不在生產(chǎn)現(xiàn)場時樣本中次品數(shù)的頻率明顯高于甲在生產(chǎn)現(xiàn)場時樣本中次品數(shù)的頻率.因此可以認為質(zhì)量監(jiān)督員甲在不在生產(chǎn)現(xiàn)場與產(chǎn)品質(zhì)量好壞有關(guān)系.命題方向?獨立性檢驗的應(yīng)用典例2某中學(xué)對高二甲、乙兩個同類班級,進行“加強‘語文閱讀理解’訓(xùn)練,對提高‘數(shù)學(xué)應(yīng)用題’得分率的作用”的試驗,其中甲班為試驗班(加強語文閱讀理解訓(xùn)練),乙班為對比班(常規(guī)教學(xué),無額外訓(xùn)練),在試驗前的測試中,甲、乙兩班學(xué)生在數(shù)學(xué)應(yīng)用題上的得分率基本一樣,試驗結(jié)束后,統(tǒng)計幾次數(shù)學(xué)應(yīng)用題測試的平均成果(均取整數(shù))如下表所示:60分以下61-70分71-80分81-90分91-100分甲班(人數(shù))31161218乙班(人數(shù))78101015現(xiàn)規(guī)定平均成果在80分以上(不含80分)的為優(yōu)秀.(1)試分析估計兩個班級的優(yōu)秀率;(2)由以上統(tǒng)計數(shù)據(jù)填寫下面2×2列聯(lián)表,依據(jù)以上數(shù)據(jù),能否有95%的把握認為加強“語文閱讀理解”訓(xùn)練對提高“數(shù)學(xué)應(yīng)用題”得分率有幫助?優(yōu)秀人數(shù)非優(yōu)秀人數(shù)合計甲班乙班合計參考公式及數(shù)據(jù):K2=eq\f(nad-bc2,a+bc+da+cb+d).P(K2≥k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828[思路分析](1)由表格統(tǒng)計出甲、乙兩個班的總?cè)藬?shù)和優(yōu)秀人數(shù),求出優(yōu)秀率;(2)依統(tǒng)計數(shù)據(jù)填寫列聯(lián)表,代入公式計算K2的估計值,查表下結(jié)論.[解析](1)由題意知,甲、乙兩班均有學(xué)生50人,甲班優(yōu)秀人數(shù)為30人,優(yōu)秀率為eq\f(30,50)=60%,乙班優(yōu)秀人數(shù)為25人,優(yōu)秀率為eq\f(25,50)=50%,所以甲、乙兩班的優(yōu)秀率分別為60%和50%.(2)優(yōu)秀人數(shù)非優(yōu)秀人數(shù)合計甲班302050乙班252550合計5545100因為K2=eq\f(10025×30-25×202,55×45×50×50)≈1.010<3.841,所以由參考數(shù)據(jù)知,沒有95%的把握認為有幫助.『規(guī)律總結(jié)』1.獨立性檢驗的步驟:第一步,確定分類變量,獲得樣本頻數(shù),得到列聯(lián)表.其次步,依據(jù)實際問題的須要確定允許推斷“兩個分類變量有關(guān)系”犯錯誤概率的上界α,然后查表確定臨界值k0.第三步,利用公式K2=eq\f(nad-bc2,a+bc+da+cb+d)計算隨機變量K2的觀測值K0.第四步,作出推斷.假如k≥k0,就推斷“X與Y有關(guān)系”,這種推斷犯錯誤的概率不超過α,否則就認為在犯錯誤的概率不超過α的前提下不能推斷“X與Y有關(guān)系”,或者在樣本數(shù)據(jù)中沒有發(fā)覺足夠證據(jù)支持結(jié)論“X與Y有關(guān)系”.2.由于獨立性檢驗計算量大,要細致,避開計算失誤.┃┃跟蹤練習2__■為了探究學(xué)生選報文、理科是否與對外語的愛好有關(guān),某同學(xué)調(diào)查了361名高二在校學(xué)生,調(diào)查結(jié)果如下:理科對外語有愛好的有138人,無愛好的有98人,文科對外語有愛好的有73人,無愛好的有52人.能否在犯錯誤的概率不超過0.1的前提下,認為“學(xué)生選報文、理科與對外語的愛好有關(guān)”?[解析]依據(jù)題目所給的數(shù)據(jù)得到如下聯(lián)系:理科文科總計有愛好13873211無愛好9852150總計236125361依據(jù)列聯(lián)表中數(shù)據(jù)由公式計算得k=eq\f(361×138×52-73×982,211×150×236×125)≈1.871×10-4.因為1.871×10-4<2.706,所以,在犯錯誤的概率不超過0.1的前提下,不能認為“學(xué)生選報文、理科與對外語的愛好有關(guān)”.學(xué)科核心素養(yǎng)獨立性檢驗的綜合應(yīng)用獨立性檢驗的思想來自統(tǒng)計上的假設(shè)檢驗思想,它與反證法類似.假設(shè)檢驗和反證法都是先假設(shè)結(jié)論不成立,然后依據(jù)是否能夠推出“沖突”來斷定結(jié)論是否成立.但二者“沖突”的含義不同,反證法中的“沖突”是指一個不符合邏輯的事情發(fā)生,而假設(shè)檢驗中的“沖突”是指一個小概率事務(wù)發(fā)生,即在結(jié)論不成立的假設(shè)下,推出有利于結(jié)論成立的小概率事務(wù)發(fā)生.我們知道小概率事務(wù)在一次試驗中通常是不會發(fā)生的,若在實際中這個事務(wù)發(fā)生了,說明保證這個事務(wù)為小概率事務(wù)的條件有問題,即結(jié)論在很大的程度上應(yīng)當成立.典例3某工廠有工人1000名,其中250名工人參與過短期培訓(xùn)(稱為A類工人),另外750名工人參與過長期培訓(xùn)(稱為B類工人).現(xiàn)用分層抽樣的方法(按A類、B類分兩層)從該工廠的工人中抽取100名工人,調(diào)查他們的生產(chǎn)實力(此處生產(chǎn)實力指一天加工的零件數(shù)),結(jié)果如下表:表1:A類工人生產(chǎn)實力的頻數(shù)分布表生產(chǎn)實力分組[110,120)[120,130)[130,140)[140,150)人數(shù)8x32表2:B類工人生產(chǎn)實力的頻數(shù)分布表生產(chǎn)實力分組[110,120)[120,130)[130,140)[140,150)人數(shù)6y2718(1)確定x、y的值;(2)完成下面2×2列聯(lián)表,并回答能否在犯錯誤的概率不超過0.001的前提下認為工人的生產(chǎn)實力與工人的類別有關(guān)系?生產(chǎn)實力分組工人類別[110,130)[130,150)總計A類工人B類工人總計附:K2=eq\f(nad-bc2,a+bc+da+cb+d),P(K2≥k0)0.0500.0100.001k03.8416.63510.828[思路分析](1)確定x、y的值,可用分層抽樣解決;(2)推斷在規(guī)定條件下工人的生產(chǎn)實力與工人的類別是否有關(guān)系可通過獨立性檢驗解決.由已知工廠中A、B類工人的人數(shù)和抽取工人數(shù),進行分層抽樣,可干脆計算A、B類工人樣本數(shù);由表1、表2可得列聯(lián)表,計算K2的觀測值k與臨界值可比較.[解析](1)∵從該工廠的工人中抽取100名工人,且該工廠中有250名A類工人,750名B類工人,∴要從A類工人中抽取25名,從B類工人中抽取75名,∴x=25-8-3-2=12,y=75-6-27-18=24.(2)依據(jù)所給的數(shù)據(jù)可以完成列聯(lián)表,如下表所示:生產(chǎn)實力分組工人類別[110,130)[130,150)總計A類工人20525B類工人304575總計5050100由列聯(lián)表中的數(shù)據(jù),得K2的觀測值為k=eq\f(100×20×45-5×302,25×75×50×50)=12>10.828,因此,在犯錯誤的概率不超過0.001的前提下認為工人的生產(chǎn)實力與工人的類別有關(guān)系.『規(guī)律總結(jié)』兩個分類變量相關(guān)關(guān)系的推斷(1)等高條形圖法:在等高條形圖中,可以估計滿意條件X=x1的個體中具有Y=y(tǒng)1的個體所占的比例eq\f(a,a+b),也可以估計滿意條件X=x2的個體中具有Y=y(tǒng)1的個體所占的比例eq\f(c,c+d).兩個比例的值相差越大,X與Y有關(guān)系成立的可能性就越大.(2)觀測值法:通過2×2列聯(lián)表,先計算K2的觀測值k,然后借助k的含義推斷“兩個分類變量有關(guān)系”這一結(jié)論成立的可信程度.┃┃跟蹤練習3__■某高校共有15000人,其中男生10500人,女生4500人,為調(diào)查該校學(xué)生每周平均體育運動時間的狀況,采納分層抽樣的方法,收集300位學(xué)生每周平均體育運動時間的樣本數(shù)據(jù)(單位:小時).(1)應(yīng)收集多少位女生的樣本數(shù)據(jù)?(2)依據(jù)這300個樣本數(shù)據(jù),得到學(xué)生每周平均體育運動時間的頻率分布直方圖(如圖所示),其中樣本數(shù)據(jù)的分組區(qū)間為:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].在樣本數(shù)據(jù)中,有60位女生的每周平均體育運動時間超過4個小時.請完成每周平均體育運動時間與性別列聯(lián)表,并推斷是否有95%的把握認為“該校學(xué)生的每周平均體育運動時間與性別有關(guān)”.P(K2≥k0)0.100.050.0100.005k02.7063.8416.6357.879附:K2=eq\f(nad-bc2,a+bc+da+cb+d)[解析](1)300×eq\f(4500,15000)=90,所以應(yīng)收集90位女生的樣本數(shù)據(jù).(2)由頻率分布直方圖得1-2×(0.100+0.025)=0.75,所以該校學(xué)生每周平均體育運動時間超過4小時的概率的估計值為0.75.300位學(xué)生中有300×0.75=225人的每周平均體育運動時間超過4小時,75人的每周平均體育運動時間不超過4小時,又因為樣本數(shù)據(jù)中有210份是關(guān)于男生的,90份是關(guān)于女生的,所以每周平均體育運動時間與性別列聯(lián)表如下:每周平均體育運動時間與性別列聯(lián)表男生女生總計每周平均體育運動時間不超過4小時453075每周平均體育運動時間超過4小時16560225總計21090300綜合列聯(lián)表可算得K2=eq\f(300×45×60-165×302,75×225×210×90)=eq\f(100,21)≈4.762>3.841.所以,有95%的把握認為“該校學(xué)生的每周平均體育運動時間與性別有關(guān).”易混易錯警示因?qū)Κ毩⑿詸z驗的基本思想不理解而致錯典例4已知兩個分類變量X和Y的取值分別為{x1,x2},{y1,y2},若其列聯(lián)表為y1y2x1515x24010則(D)A.X與Y之間有關(guān)系的概率為0.001 B.X與Y之間有關(guān)系的概率為0.999C.認為X與Y有關(guān)系,犯錯誤的概率為0.999 D.認為X與Y有關(guān)系,犯錯誤的概率不超過0.001[錯解]獨立性檢驗的基本思想是指某件事發(fā)生在犯錯概率不超過某個特別小的數(shù)據(jù)的前提下,我們有把握認為有關(guān).理解有誤會致誤.[辨析]1.在求K2的過程中,弄混a,b,c,d而致錯或者因運算量大而致錯.2.沒有理解好獨立性檢驗的基本思想而致錯.[正解]K2的觀測值為k=eq\f(5+15+40+10×5×10-40×152,5+15×40+10×5+40×15+10)≈18.822.查表知P(K2≥10.828)=0.001,所以在犯錯誤的概率不超過0.001的前提下,我們認為X與Y有關(guān).課堂達標·固基礎(chǔ)1.在某次飛行航程中遭受惡劣氣候,55名男乘客中有24名暈機,34名女乘客中有8名暈機,在檢驗這些乘客暈機是否與性別有關(guān)時,采納的數(shù)據(jù)分析方法應(yīng)是(C)A.頻率分布直方圖 B.回來分析C.獨立性檢驗 D.用樣本估計總體[解析]依據(jù)題意,結(jié)合題目中的數(shù)據(jù),列出2×2列聯(lián)表,求出K2觀測值,比照數(shù)表可得出概率結(jié)論,這種分析數(shù)據(jù)的方法是獨立性檢驗.2.如表是一個2×2列聯(lián)表:則表中a,b的值分別為(C)y1y2總計x1a2173x2222547總計b46120A.94,72 B.52,50C.52,74 D.74,52[解析]a=73
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 公寓代理銷售合同范本
- 冰淇淋套餐合同范本
- 出售文明公寓合同范本
- 中藥加工合同范本
- 公寓閣樓買賣合同范本
- cps推廣合同范本
- 農(nóng)戶斗雞養(yǎng)殖合同范本
- 事業(yè)物業(yè)合同范本
- 住家阿姨用工合同范本
- 與單位停車合同范例
- 10我們所了解的環(huán)境污染 (教學(xué)設(shè)計)2023-2024學(xué)年統(tǒng)編版道德與法治四年級上冊
- 2025中國煙草/中煙工業(yè)招聘易考易錯模擬試題(共500題)試卷后附參考答案
- 新教科版小學(xué)科學(xué)三年級下冊教案(全冊)
- 2025小學(xué)語文一年級下冊第二單元教學(xué)課件匯編(配套新教材)
- 天津2025年天津中德應(yīng)用技術(shù)大學(xué)輔導(dǎo)員崗位招聘7人筆試歷年參考題庫附帶答案詳解
- 2025年湘西民族職業(yè)技術(shù)學(xué)院高職單招職業(yè)技能測試近5年??及鎱⒖碱}庫含答案解析
- 2025年海南職業(yè)技術(shù)學(xué)院高職單招語文2018-2024歷年參考題庫頻考點含答案解析
- 北京市西城區(qū)2024-2025學(xué)年高三上學(xué)期期末考試語文試題(解析版)
- 2025年春新人教版數(shù)學(xué)一年級下冊課件 第六單元 數(shù)量間的加減關(guān)系 第2課時 求比1個數(shù)多(少)幾的數(shù)
- 語文課堂中的多媒體教學(xué)方法研究
- 民用無人機操控員執(zhí)照(CAAC)考試復(fù)習重點題庫500題(含答案)
評論
0/150
提交評論