版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
32獨立性檢驗的基本思想及初步應(yīng)用或P()=1-P(A)1了解分類變量的意義.2.了解2×2列聯(lián)表的意義.3.了解隨機(jī)變量2的意義.4.通過對典型案例分析,了解獨立性檢驗的基本思想和方法1.2×2列聯(lián)表的意義.重點2.隨機(jī)變量2的計算及應(yīng)用.重點3.獨立性檢驗的基本思想.難點♂對于性別變量,其取值為男和女兩種♀這種變量的不同“值”表示個體所屬的不同類別,像這類變量稱為分類變量生活中的分類變量是否吸煙,宗教信仰,國籍…兩個分類變量之間是否有關(guān)系性別是否喜歡數(shù)學(xué)課程吸煙患肺癌為調(diào)查吸煙是否對患肺癌有影響,某腫瘤研究所隨機(jī)地調(diào)查了9965人,得到如下結(jié)果單位:人不患肺癌患肺癌總計不吸煙7775427817吸煙2099492148總計9874919965那么吸煙是否對肺癌有影響吸煙與患肺癌列聯(lián)表列出兩個分類變量的頻數(shù)表,稱為列聯(lián)表不患肺癌患肺癌總計不吸煙7775427817吸煙2099492148總計9874919965吸煙者與不吸煙者患肺癌的可能性存在差異從上面數(shù)據(jù)和圖形可以看出吸煙和患肺癌有關(guān)從上面數(shù)據(jù)和圖形可以看出吸煙和患肺癌有關(guān)事實是否如此我們能夠有多大的把握認(rèn)為“吸煙與患肺癌有關(guān)”?吸煙患肺癌吸煙與患肺癌列聯(lián)表不患肺癌患肺癌總計不吸煙aba+b吸煙cdc+d總計a+cb+da+b+c+d假設(shè)H0:吸煙與患肺癌沒有關(guān)系A(chǔ):不吸煙B:吸煙PAB=PABa:事件AB發(fā)生的頻數(shù)ab:事件A發(fā)生的頻數(shù)ac:事件B發(fā)生的頻數(shù)H0成立時(n=a+b+c+d)(a+b+c+d)a≈(a+b)(a+c)ad-bc≈0|ad-bc|越小吸煙與患肺癌之間的關(guān)系越弱|ad-bc|越大吸煙與患肺癌之間的關(guān)系越強(qiáng)構(gòu)造一個隨機(jī)變量建立統(tǒng)一標(biāo)準(zhǔn)n=abcd若H0成立K2應(yīng)該很小根據(jù)前面數(shù)據(jù)K2的觀察值在“吸煙與患肺癌沒有關(guān)系”成立的條件下可以估算出k≈56.6326.635遠(yuǎn)大于99%的把握認(rèn)為“吸煙與患肺癌有關(guān)系”利用隨機(jī)變量2來確定在多大程度上可以認(rèn)為“兩個分類變量有關(guān)系”的方法稱為兩個分類變量的獨立性檢驗確認(rèn)“兩個分類變量有關(guān)系”成立的可信程度假設(shè)該結(jié)論不成由觀測數(shù)據(jù)計算2的觀測值通過概率評價該假設(shè)不合理的程度>6635,假設(shè)不合理程度約為99%y1y2總計x1aba+bx1cdc+d總計a+cb+da+b+c+d假設(shè)有兩個分類變量和Y,它們的值域分別為{1,2}和{y1,y2},其樣本頻數(shù)列聯(lián)表2×2列聯(lián)表若要推斷的論述為H1:“X與Y有關(guān)系”可以按如下步驟判斷結(jié)論H1成立的可能性1通過等高條形圖,可以粗略地判斷兩個分類變量是否有關(guān)系,但是這種判斷無法精確地給出所得結(jié)論的可靠度2可以利用獨立性檢驗來考察兩個分類變量是否有關(guān)系并且能較精確地給出這種判斷的可靠程度根據(jù)觀測數(shù)據(jù)計算檢驗隨機(jī)變量2的觀察值P(K2≥k)0.500.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828當(dāng)?shù)玫降挠^測數(shù)據(jù)a,b,c,d都不于5時,可以通過查閱下表來確定其可信程度獨立性檢驗的基本思想(類似反證法)(1)假設(shè)結(jié)論不成立,即“兩個分類變量沒有關(guān)系”.(2)在此假設(shè)下我們所構(gòu)造的隨機(jī)變量K2
應(yīng)該很小,如果由觀測數(shù)據(jù)計算得到K2的觀測值k很大,則在一定可信程度上說明不成立.即在一定可信程度上認(rèn)為“兩個分類變量有關(guān)系”;如果k的值很小,則說明由樣本觀測數(shù)據(jù)沒有發(fā)現(xiàn)反對的充分證據(jù)。3根據(jù)隨機(jī)變量2的含義,可以通過評價該假設(shè)不合理的程度,由實際計算出的的值與臨界值比較,說明假設(shè)不合理的程度,即說明“兩個分類變量有關(guān)系”這一結(jié)論成立的可信度上面這種利用隨機(jī)變量2來判斷“兩個分類變量有關(guān)系”的方法,稱為兩個分類變量的獨立性檢驗。例1在某醫(yī)院,因為患心臟病而住院的665名男性病人中,有214人禿頂;而另外772名不是因為患心臟病而住院的男性病人中有175人禿頂。分別利用圖形和獨立性檢驗方法判斷禿頂與患心臟病是否有關(guān)系?你所得的結(jié)論在什么范圍內(nèi)有效?解:根據(jù)題目所給數(shù)據(jù)得到如下列聯(lián)表:患心臟病不患心臟病總計禿頂214175389不禿頂4515971048總計6657721437根據(jù)聯(lián)表1-13中的數(shù)據(jù),得到所以有99%的把握認(rèn)為“禿頂患心臟病有關(guān)”。P(K2≥k)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828獨立性檢驗的步驟0,假設(shè)兩個分類變量沒有關(guān)系;2列出2×2列聯(lián)表,并計算2的觀測值;0進(jìn)行比較,并作出判斷1當(dāng)2>2706,有_________的把握判定兩個分類變量有關(guān)系;2當(dāng)2>3841,有_________的把握判定兩個分類變量有關(guān)系;3當(dāng)2>6635,有_________的把握判定兩個分類變量有關(guān)系;P(K2≥k)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.82890%95%99%例2春節(jié)期間,“厲行節(jié)約,反對浪費”之風(fēng)悄然吹開,某市隨機(jī)詢問100名性別不同的居民是否能做到“光盤”行動,(1)完成如下列聯(lián)表。(2)有多大的把握認(rèn)為居民能否做到“光盤”與性別有關(guān)系?(3)能否在犯錯誤的概率不超過0010的前提下認(rèn)為居民能否做到“光盤”與性別有關(guān)系?10075總計15女5545男總計做到光盤做不到光盤“光盤”與性別列聯(lián)表例題解析:假設(shè)“性別與是否做到光盤之間沒有關(guān)系”有90%的把握認(rèn)為居民能否做到“光盤”與性別有關(guān)。1002575總計451530女551045男總計做到光盤做不到光盤“光盤”與性別列聯(lián)表10.8287.8796.6355.0243.8412.7062.0721.3230.7080.4550.0010.0050.0100.0250.050.100.150.250.400.50假設(shè)“性別與是否做到光盤之間沒有關(guān)系”不能在犯錯誤的概率不超過0010的前提下認(rèn)為居民能否做到“光盤”與性別有關(guān)系1002575總計451530女551045男總計做到光盤做不到光盤“光盤”與性別列聯(lián)表10.8287.8796.6355.0243.8412.7062.0721.3230.7080.4550.0010.0050.0100.0250.050.100.150.250.400.50在犯錯誤的概率不超過0010的前提下認(rèn)為居民能否做到“光盤”與性別沒有關(guān)系為考察高中生的性別與是否喜歡數(shù)學(xué)課程之間的關(guān)系,在某城市的某校高中生中隨機(jī)抽取300名學(xué)生,得到如下聯(lián)表:喜歡數(shù)學(xué)課程不喜歡數(shù)學(xué)課程總計男3785122女35143178總計72228300練習(xí):1性別與喜歡數(shù)學(xué)課由表中數(shù)據(jù)計算2的觀測值4513在多大程度上可以認(rèn)為高中生的性別與是否喜歡數(shù)學(xué)課程之間有關(guān)系?為什么?喜歡數(shù)學(xué)課程不喜歡數(shù)學(xué)課程總計男3785122女35143178總計72228300練習(xí):1性別與喜歡數(shù)學(xué)課這就意味著“性別與是否喜歡數(shù)學(xué)課程之間有關(guān)系”這一結(jié)論錯誤的可能性約為005,即有95%的把握認(rèn)為“性別與是否喜歡數(shù)學(xué)課程之間有關(guān)系”解:假設(shè)高中生的性別與是否喜歡數(shù)學(xué)課程之間沒關(guān)系由k4.513>3.8412某單位餐廳的固定餐椅經(jīng)常有損壞,于是該單位領(lǐng)導(dǎo)決定在餐廳墻壁上張貼文明標(biāo)語,并對文明標(biāo)語張貼前后餐椅的損壞情況作了一個統(tǒng)計,具體數(shù)據(jù)如下:損壞餐椅數(shù)未損壞餐椅數(shù)總計文明標(biāo)語張貼前39157196文明標(biāo)語張貼后29167196總計68324392由表中數(shù)據(jù)計算2約等于178你認(rèn)為在餐廳墻壁上張貼文明標(biāo)語對減少餐椅損壞數(shù)有效果嗎2某單位餐廳的固定餐椅經(jīng)常有損壞,于是該單位領(lǐng)導(dǎo)決定在餐廳墻壁上張貼文明標(biāo)語,并對文明標(biāo)語張貼前后餐椅的損壞情況作了一個統(tǒng)計,具體數(shù)據(jù)如下:損壞餐椅數(shù)未損壞餐椅數(shù)總計文明標(biāo)語張貼前39157196文明標(biāo)語張貼后29167196總計68324392不能練習(xí)4、在吸煙和患肺癌這兩個分類變量的計算中,下列說法正確的是()A、若2的觀測值=6635,我們在犯錯的概率不超過0010的前提下認(rèn)為吸煙與患肺癌有關(guān)系,那么在100個吸煙的人中必有99人患有肺病B、從獨立性檢驗可知有99%的把
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 專業(yè)前臺接待服務(wù)供應(yīng)協(xié)議
- 2025年度離婚協(xié)議書范本:共同債務(wù)的承擔(dān)與償還4篇
- 2025年度新能源汽車充電設(shè)施購銷合同4篇
- 2025年度茶葉電商平臺入駐合作協(xié)議書4篇
- 2025年度柴油儲備與應(yīng)急供應(yīng)合同范本4篇
- 2024年05月內(nèi)蒙古2024屆中國民生銀行呼和浩特分行畢業(yè)生“未來銀行家”暑期管培生校園招考筆試歷年參考題庫附帶答案詳解
- 2025年度汽車內(nèi)飾部件委托加工合同書4篇
- 個性化2024版?zhèn)€人勞動協(xié)議匯編版A版
- 2024金融借款協(xié)議樣本版
- 2025年度農(nóng)產(chǎn)品出口FAS貿(mào)易合同范本3篇
- 第二章 運營管理戰(zhàn)略
- 《三本白皮書》全文內(nèi)容及應(yīng)知應(yīng)會知識點
- 專題14 思想方法專題:線段與角計算中的思想方法壓軸題四種模型全攻略(解析版)
- 醫(yī)院外來器械及植入物管理制度(4篇)
- 圖像識別領(lǐng)域自適應(yīng)技術(shù)-洞察分析
- 港口與港口工程概論
- 新概念英語第二冊考評試卷含答案(第49-56課)
- 商業(yè)倫理與企業(yè)社會責(zé)任(山東財經(jīng)大學(xué))智慧樹知到期末考試答案章節(jié)答案2024年山東財經(jīng)大學(xué)
- 【奧運會獎牌榜預(yù)測建模實證探析12000字(論文)】
- (完整版)譯林版英語詞匯表(四年級下)
- 哈爾濱師范大學(xué)與堪培拉大學(xué)合作培養(yǎng)
評論
0/150
提交評論