版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第四節(jié)列聯(lián)表與獨(dú)立性檢驗考試要求:1.通過實例,理解2×2列聯(lián)表的統(tǒng)計意義.2.通過實例,了解獨(dú)立性檢驗及其應(yīng)用.自查自測知識點(diǎn)列聯(lián)表與獨(dú)立性檢驗1.判斷下列說法的正誤,正確的畫“√”,錯誤的畫“×”.(1)2×2列聯(lián)表中的數(shù)據(jù)是兩個分類變量的頻數(shù).(√)(2)分類變量A和B的獨(dú)立性檢驗無關(guān),即兩個分類變量互不影響.(√)(3)χ2的大小是判斷事件A和B是否相關(guān)的統(tǒng)計量.(√)(4)在2×2列聯(lián)表中,若|ad-bc|越小,則說明兩個分類變量之間關(guān)系越強(qiáng).(√)2.(教材改編題)如下2×2列聯(lián)表中a,b的值分別為()xy合計y1y2x1a835x2113445合計b4280A.27,38 B.28,38C.27,37 D.28,37A解析:a=35-8=27,b=a+11=27+11=38.3.已知P(χ2≥6.635)=0.01,P(χ2≥10.828)=0.001.在檢驗喜歡某項體育運(yùn)動與性別是否有關(guān)的過程中,某研究員搜集數(shù)據(jù)并計算得到χ2=7.235,則根據(jù)小概率值α=________的χ2獨(dú)立性檢驗,推斷喜歡該項體育運(yùn)動與性別有關(guān).0.01解析:因為6.635<7.235<10.828,所以由檢驗規(guī)則可知,根據(jù)小概率值α=0.01的χ2獨(dú)立性檢驗,推斷喜歡該項體育運(yùn)動與性別有關(guān).核心回扣1.分類變量為了表述方便,我們經(jīng)常會使用一種特殊的隨機(jī)變量,以區(qū)別不同的現(xiàn)象或性質(zhì),這類隨機(jī)變量稱為分類變量.分類變量的取值可以用實數(shù)表示.2.列聯(lián)表與獨(dú)立性檢驗(1)關(guān)于分類變量X和Y的抽樣數(shù)據(jù)的2×2列聯(lián)表:XY合計Y=0Y=1X=0aba+bX=1cdc+d合計a+cb+dn=a+b+c+d(2)計算隨機(jī)變量χ2=nad-bc2a+bc+da+下表為5個常用的小概率值和相應(yīng)的臨界值.α0.10.050.010.0050.001xα2.7063.8416.6357.87910.8283.應(yīng)用獨(dú)立性檢驗解決實際問題的幾個步驟(1)提出零假設(shè)H0:X和Y相互獨(dú)立,并給出在問題中的解釋.(2)根據(jù)抽樣數(shù)據(jù)整理出2×2列聯(lián)表,計算χ2的值,并與臨界值xα比較.(3)根據(jù)檢驗規(guī)則得出推斷結(jié)論.(4)在X和Y不獨(dú)立的情況下,根據(jù)需要通過比較相應(yīng)的頻率,分析X和Y間的影響規(guī)律.列聯(lián)表與χ2的計算1.為了研究某地動物受核輻射后對身體健康的影響,專家隨機(jī)選取了110只羊進(jìn)行了檢測,并將有關(guān)數(shù)據(jù)整理為2×2列聯(lián)表.單位:只身體輻射程度合計高度輻射輕微輻射健康30A50不健康B1060合計CDE則A,B,C,D的值依次為()A.20,80,30,50 B.20,50,80,30C.20,50,80,110 D.20,80,110,50B解析:30+A=50,所以A=20,B+10=60,所以B=50,所以C=30+B=30+50=80,D=A+10=20+10=30.2.兩個分類變量X和Y,其2×2列聯(lián)表如表所示,對同一樣本,以下數(shù)據(jù)能說明X與Y有關(guān)聯(lián)的可能性最大的一組為()XY合計y1y2x1369x2m8m+8合計m+314m+17A.m=3 B.m=4C.m=5 D.m=6D解析:由給定的2×2列聯(lián)表,對于A,m=3,χ2的預(yù)測值k1=20×對于B,m=4,χ2的預(yù)測值k2=21×3×對于C,m=5,χ2的預(yù)測值k3=22×對于D,m=6,χ2的預(yù)測值k4=23×顯然k4>k1>k3>k2,因此選項D中數(shù)據(jù)求得χ2的值最大,說明X與Y有關(guān)聯(lián)的可能性最大.關(guān)于列聯(lián)表及χ2的計算(1)2×2列聯(lián)表在計算數(shù)據(jù)時要準(zhǔn)確無誤,關(guān)鍵是對涉及的變量分清類別.(2)計算χ2時遵循先化簡后計算的原則,充分的約分可以簡化數(shù)據(jù)的運(yùn)算.列聯(lián)表與獨(dú)立性檢驗【例1】某公司為了拓展業(yè)務(wù),對該公司某款手機(jī)的潛在客戶進(jìn)行調(diào)查,隨機(jī)抽取國內(nèi)外潛在用戶代表各100名,調(diào)查用戶對是否使用該手機(jī)的態(tài)度,得到如圖所示的等高堆積條形圖.由等高堆積條形圖得到的數(shù)據(jù),根據(jù)小概率值α=0.005的χ2獨(dú)立性檢驗,能否認(rèn)為持樂觀態(tài)度和國內(nèi)外差異有關(guān)?解:由題意得2×2列聯(lián)表如下:單位:名代表態(tài)度合計樂觀不樂觀國內(nèi)6040100國外4060100合計100100200零假設(shè)為H0:持樂觀態(tài)度和國內(nèi)外差異無關(guān).依表中數(shù)據(jù)計算得χ2=200×60×60-40×40根據(jù)小概率值α=0.005的獨(dú)立性檢驗,推斷H0不成立,即認(rèn)為持樂觀態(tài)度和國內(nèi)外差異有關(guān),此推斷犯錯誤的概率不大于0.005.獨(dú)立性檢驗的一般步驟(1)根據(jù)樣本數(shù)據(jù)列出2×2列聯(lián)表.(2)根據(jù)公式χ2=nad(3)比較χ2與臨界值的大小關(guān)系,作統(tǒng)計推斷.甲、乙兩城市之間的長途客車均由A和B兩家公司運(yùn)營.為了解這兩家公司長途客車的運(yùn)行情況,隨機(jī)調(diào)查了甲、乙兩城市之間的500個班次的長途客車準(zhǔn)點(diǎn)情況,得到下面列聯(lián)表:單位:個公司準(zhǔn)點(diǎn)情況準(zhǔn)點(diǎn)班未準(zhǔn)點(diǎn)班A24020B21030根據(jù)小概率值α=0.1的獨(dú)立性檢驗,能否認(rèn)為甲、乙兩城市之間的長途客車是否準(zhǔn)點(diǎn)與客車所屬公司有關(guān)?解:列聯(lián)表如下:單位:個公司準(zhǔn)點(diǎn)情況合計準(zhǔn)點(diǎn)班次未準(zhǔn)點(diǎn)班次A24020260B21030240合計45050500零假設(shè)為H0:甲、乙兩城市之間的長途客車是否準(zhǔn)點(diǎn)與客車所屬公司無關(guān).根據(jù)表中數(shù)據(jù),計算得到χ2=500×240×30-210根據(jù)小概率值α=0.1的獨(dú)立性檢驗,推斷H0不成立,即認(rèn)為甲、乙兩城市之間的長途客車是否準(zhǔn)點(diǎn)與客車所屬公司有關(guān),此推斷犯錯誤的概率不大于0.1.獨(dú)立性檢驗的綜合應(yīng)用【例2】某人工智能公司想要了解其開發(fā)的語言模型準(zhǔn)確率的達(dá)標(biāo)(準(zhǔn)確率不低于80%則認(rèn)為達(dá)標(biāo))情況與使用的訓(xùn)練數(shù)據(jù)集大小是否有關(guān)聯(lián),該公司隨機(jī)選取了大型數(shù)據(jù)集和小型數(shù)據(jù)集各50個,并記錄了使用這些數(shù)據(jù)集訓(xùn)練的語言模型在測試數(shù)據(jù)集上的準(zhǔn)確率,根據(jù)小型數(shù)據(jù)集的準(zhǔn)確率數(shù)據(jù)繪制成如圖所示的頻率分布直方圖(各組區(qū)間分別為[50,60),[60,70),[70,80),[80,90),[90,100]).(1)求a的值,并完成下面的2×2列聯(lián)表;單位:個準(zhǔn)確率數(shù)據(jù)集合計大型數(shù)據(jù)集小型數(shù)據(jù)集達(dá)標(biāo)30不達(dá)標(biāo)合計(2)根據(jù)小概率值α=0.005的獨(dú)立性檢驗,能否認(rèn)為語言模型準(zhǔn)確率是否達(dá)標(biāo)與使用的訓(xùn)練數(shù)據(jù)集大小有關(guān)聯(lián)?解:(1)由10×(0.010+0.025+a+0.020+0.010)=1,解得a=0.035.準(zhǔn)確率不低于80%的小型數(shù)據(jù)集有50×(0.2+0.1)=15(個),由此可得2×2列聯(lián)表如下:單位:個準(zhǔn)確率數(shù)據(jù)集合計大型數(shù)據(jù)集小型數(shù)據(jù)集達(dá)標(biāo)301545不達(dá)標(biāo)203555合計5050100(2)零假設(shè)為H0:語言模型準(zhǔn)確率是否達(dá)標(biāo)與使用的訓(xùn)練數(shù)據(jù)集大小無關(guān)聯(lián).根據(jù)列聯(lián)表中的數(shù)據(jù),計算得到χ2=100×30×35-20×15根據(jù)小概率值α=0.005的獨(dú)立性檢驗,推斷H0不成立,即認(rèn)為語言模型準(zhǔn)確率是否達(dá)標(biāo)與使用的訓(xùn)練數(shù)據(jù)集大小有關(guān)聯(lián),此推斷犯錯誤的概率不大于0.005.關(guān)于獨(dú)立性檢驗的綜合應(yīng)用獨(dú)立性檢驗的考查,往往與概率和抽樣統(tǒng)計圖等一起考查,這類問題的求解可以按各小題及提問的順序,一步步進(jìn)行下去,是比較容易解答的.單純考查獨(dú)立性檢驗往往用小題的形式,而且χ2的公式一般會在原題中給出.以“智聯(lián)世界,生成未來”為主題的2023世界人工智能大會在中國上海舉行,人工智能的發(fā)展為許多領(lǐng)域帶來了巨大的便利,但同時也伴隨著一些潛在的安全隱患.為了調(diào)查不同年齡階段的人對人工智能所持的態(tài)度,某機(jī)構(gòu)從所在地區(qū)隨機(jī)調(diào)查了100人,所得結(jié)果統(tǒng)計如下:年齡/歲[20,30)[30,40)[40,50)[50,60)[60,70]頻數(shù)2416152520支持2013121510完成下列2×2列聯(lián)表,并判斷是否有99%的把握認(rèn)為所持態(tài)度與年齡有關(guān).單位:人態(tài)度年齡合計50歲以上(含50歲)50歲以下支持不支持合計解:根據(jù)題意,可得2×2列聯(lián)表如下:單位:人態(tài)度年齡合計50歲以上(含50歲)50歲以下支持254570不支持201030合計4555100χ2=100×25因為8.129>6.635,所以有99%的把握認(rèn)為對人工智能所持態(tài)度與年齡有關(guān).課時質(zhì)量評價(六十)1.某機(jī)構(gòu)為調(diào)查網(wǎng)游愛好者是否有性別差異,通過調(diào)研數(shù)據(jù)統(tǒng)計得知在500名男生中有200名網(wǎng)游愛好者,在400名女生中有50名網(wǎng)游愛好者.若要確定愛好網(wǎng)游是否與性別有關(guān)時,用下列最適合的統(tǒng)計方法是()A.均值 B.方差C.獨(dú)立性檢驗 D.回歸分析C解析:由題意可知,“愛好網(wǎng)游”與“性別”是兩類變量,其是否有關(guān),應(yīng)用獨(dú)立性檢驗判斷.2.為了解某大學(xué)的學(xué)生喜歡體育鍛煉是否與性別有關(guān),某機(jī)構(gòu)用簡單隨機(jī)抽樣方法在校園內(nèi)調(diào)查了120名學(xué)生,得到如下2×2列聯(lián)表:單位:名體育鍛煉性別合計男女喜歡ab73不喜歡c25合計74則a-b-c等于()A.7 B.8C.9 D.10C解析:根據(jù)題意,可得c=120-73-25=22,a=74-22=52,b=73-52=21,補(bǔ)充完整2×2列聯(lián)表為:單位:名體育鍛煉性別合計男女喜歡522173不喜歡222547合計7446120所以a-b-c=52-21-22=9.3.根據(jù)分類變量X與Y的抽樣數(shù)據(jù),計算得到χ2=7.505,依據(jù)α=0.01的獨(dú)立性檢驗(x0.01=6.635),結(jié)論為()A.變量X與Y不獨(dú)立B.變量X與Y不獨(dú)立,這個結(jié)論犯錯誤的概率超過0.01C.變量X與Y獨(dú)立D.變量X與Y獨(dú)立,這個結(jié)論犯錯誤的概率不超過0.01A解析:依據(jù)α=0.01的獨(dú)立性檢驗(x0.01=6.635),χ2=7.505>6.635=x0.01,所以變量X與Y不獨(dú)立,這個結(jié)論犯錯誤的概率不超過0.01,故A正確.4.觀察下列各圖,其中兩個分類變量X,Y之間關(guān)系最強(qiáng)的是()D解析:觀察等高堆積條形圖易知D選項的兩個分類變量之間關(guān)系最強(qiáng).5.已知兩個分類變量X,Y的可能取值分別為{x1,x2}和{y1,y2},通過隨機(jī)調(diào)查得到樣本數(shù)據(jù),再整理成如下的2×2列聯(lián)表:XYy1y2x110mx2n30若樣本容量為75,且m<n,則當(dāng)判斷X與Y有關(guān)系的把握最小時,a的值為()A.5 B.10C.15 D.17C解析:在兩個分類變量的列聯(lián)表中,當(dāng)|ad-bc|的值越小時,認(rèn)為兩個分類變量有關(guān)的可能性越小.令|10×30-mn|=0,得mn=10×30=300.又因為樣本容量為75,所以m+n+40=75,則n=35-m,所以mn=m(35-m)=300,化簡得m2-35m+300=0,解得m1=15,m2=20.又因為m<n,所以m=15.6.(多選題)(數(shù)學(xué)與文化)千百年來,我國勞動人民在生產(chǎn)實踐中根據(jù)云的形狀、走向、速度、厚度、顏色等的變化,總結(jié)了豐富的“看云識天氣”的經(jīng)驗,并將這些經(jīng)驗編成諺語,如“天上鉤鉤云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同學(xué)為了驗證“日落云里走,雨在半夜后”,觀察了某地區(qū)100天的日落和夜晚天氣,得到如下2×2列聯(lián)表,并計算得到χ2≈19.05,則下列小波對該地區(qū)天氣的判斷正確的是()日落云里走夜晚天氣下雨未下雨出現(xiàn)255未出現(xiàn)2545A.夜晚下雨的概率約為1B.未出現(xiàn)“日落云里走”,夜晚下雨的概率約為5C.依據(jù)α=0.005的獨(dú)立性檢驗,認(rèn)為“日落云里走”是否出現(xiàn)與夜晚天氣有關(guān)D.依據(jù)α=0.005的獨(dú)立性檢驗,若出現(xiàn)“日落云里走”,則認(rèn)為夜晚一定會下雨ABC解析:對于A,根據(jù)列聯(lián)表可知,100天中有50天夜晚下雨,50天夜晚未下雨,因此夜晚下雨的概率約為50100=12對于B,未出現(xiàn)“日落云里走”,夜晚下雨的概率約為2525+45=對于C,χ2≈19.05>7.879=x0.005,因此依據(jù)α=0.005的獨(dú)立性檢驗,認(rèn)為“日落云里走”是否出現(xiàn)與夜晚天氣有關(guān),C正確;對于D,依據(jù)α=0.005的獨(dú)立性檢驗,可判斷“日落云里走,雨在半夜后”的說法犯錯誤的概率不超過0.005,但不代表出現(xiàn)“日落云里走”就一定會下雨,D錯誤.7.(多選題)有甲、乙兩個班級共計105人進(jìn)行數(shù)學(xué)考試,按照大于等于85分為優(yōu)秀,85分以下為非優(yōu)秀統(tǒng)計成績,得到如下所示的列聯(lián)表.分類優(yōu)秀非優(yōu)秀合計甲班10b乙班c30已知從105人中隨機(jī)抽取1人,成績優(yōu)秀的概率為27,則下列說法中正確的是(A.列聯(lián)表中c的值為30,b的值為35B.列聯(lián)表中c的值為20,b的值為45C.根據(jù)列聯(lián)表中的數(shù)據(jù),若按95%的可靠性要求,能認(rèn)為“成績與班級有關(guān)系”D.根據(jù)列聯(lián)表中的數(shù)據(jù),若按95%的可靠性要求,不能認(rèn)為“成績與班級有關(guān)系”BC解析:由題意,從105人中隨機(jī)抽取1人,成績優(yōu)秀的概率為27所以成績優(yōu)秀的人數(shù)為105×27=30,非優(yōu)秀的人數(shù)為105-30=75所以c=30-10=20,b=75-30=45,則χ2=105×10×30若按95%的可靠性要求,能認(rèn)為“成績與班級有關(guān)系”.8.有兩個分類變量X和Y,根據(jù)其中一組觀測數(shù)據(jù)得到如下的2×2列聯(lián)表:XY合計y1y2x1a15-a15x220-a30+a50合計204565其中a,15-a均為大于5的整數(shù),則a=________時,在犯錯誤的概率不超過0.01的前提下認(rèn)為“X和Y之間有關(guān)系”.9解析:由題意可知χ2≥6.635,則65×a又由a>5且15-a>5,a∈N,得5<a<10.綜上得a=9.9.(能力創(chuàng)新)為了解不同年齡段居民的主要閱讀方式,某校興趣小組在全市隨機(jī)調(diào)查了200名居民,經(jīng)統(tǒng)計這200人中通過電子閱讀與紙質(zhì)閱讀的人數(shù)之比為3∶1,將這200人按年齡分組,其中統(tǒng)計通過電子閱讀的居民得到的頻率分布直方圖如圖所示.(1)求a的值及通過電子閱讀的居民的平均年齡;(同一組中數(shù)據(jù)用該組區(qū)間的中點(diǎn)值作代表)(2)把年齡在[15,45)的居民稱為青年組,年齡在[45,65]的居民稱為中老年組,若選出的200人中通過紙質(zhì)閱讀的中老年有3
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 有機(jī)廢氣處理課程設(shè)計
- 地下采礦課程設(shè)計
- 2024年秋季小學(xué)數(shù)學(xué)北京課改版五年級【數(shù)學(xué)(北京版)】可能性-1教學(xué)設(shè)計
- dsp課課程設(shè)計像處理相加
- 混合痔瘡的診療與護(hù)理
- 電氣自動化工程師中級模擬三
- 應(yīng)急逃生體驗館
- 服裝色彩搭配課程設(shè)計
- 電氣安規(guī)及工藝參數(shù)考核試題與答案
- 彎曲夾具課程設(shè)計
- 2024年P(guān)E工程師培訓(xùn)教材-助力工程師成長
- 機(jī)動車檢測站新?lián)Q版20241124質(zhì)量管理手冊
- 大部分分校:地域文化形考任務(wù)一-國開(CQ)-國開期末復(fù)習(xí)資料
- 【物理】期末復(fù)習(xí)練習(xí) 質(zhì)量與密度 2024-2025學(xué)年人教版物理八年級上冊
- 急性有機(jī)磷中毒急救護(hù)理
- 應(yīng)用寫作-終結(jié)性考核-國開(SC)-參考資料
- 2024年決戰(zhàn)行測5000題言語理解與表達(dá)(培優(yōu)b卷)
- 2024屆高考語文專題復(fù)習(xí):文言文閱讀專項練習(xí)題匯編(含答案)
- 2025年慢性阻塞性肺疾病全球創(chuàng)議GOLD指南修訂解讀課件
- 2024年人教版六年級科學(xué)(上冊)期末考卷及答案(各版本)
- GB/T 44143-2024科技人才評價規(guī)范
評論
0/150
提交評論