版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
3.2獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用高二數(shù)學(xué)選修2-3
第三章統(tǒng)計(jì)案例授課教師:胡周明獨(dú)立性檢驗(yàn)本節(jié)研究的是兩個(gè)分類變量的獨(dú)立性檢驗(yàn)問題。在日常生活中,我們常常關(guān)心分類變量之間是否有關(guān)系:例如,吸煙是否與患肺癌有關(guān)系?性別是否對(duì)于喜歡數(shù)學(xué)課程有影響?等等。吸煙有害健康!正常人的肺吸煙者的肺
吸煙與肺癌列聯(lián)表不患肺癌患肺癌總計(jì)不吸煙7775427817吸煙2099492148總計(jì)9874919965為了調(diào)查吸煙是否對(duì)肺癌有影響,某腫瘤研究所隨機(jī)地調(diào)查了9965人,得到如下結(jié)果(單位:人)列聯(lián)表在不吸煙者中患肺癌的比重是
在吸煙者中患肺癌的比重是
說明:吸煙者和不吸煙者患肺癌的可能性存在差異,吸煙者患肺癌的可能性大。0.54%2.28%探究不患肺癌患肺癌總計(jì)不吸煙7775427817吸煙2099492148總計(jì)98749199651、列聯(lián)表2、三維柱形圖3、二維條形圖不患肺癌患肺癌吸煙不吸煙不患肺癌患肺癌吸煙不吸煙080007000600050004000300020001000從三維柱形圖能清晰看出各個(gè)頻數(shù)的相對(duì)大小。從二維條形圖能看出,吸煙者中患肺癌的比例高于不患肺癌的比例。通過圖形直觀判斷兩個(gè)分類變量是否相關(guān):4、等高條形圖等高條形圖更清晰地表達(dá)了兩種情況下患肺癌的比例。
上面我們通過分析數(shù)據(jù)和圖形,得到的直觀印象是吸煙和患肺癌有關(guān),那么事實(shí)是否真的如此呢?這需要用統(tǒng)計(jì)觀點(diǎn)來考察這個(gè)問題。
現(xiàn)在想要知道能夠以多大的把握認(rèn)為“吸煙與患肺癌有關(guān)”,為此先假設(shè)
H0:吸煙與患肺癌沒有關(guān)系.不患肺癌患肺癌總計(jì)不吸煙aba+b吸煙cdc+d總計(jì)a+cb+da+b+c+d把表中的數(shù)字用字母代替,得到如下用字母表示的列聯(lián)表
用A表示不吸煙,B表示不患肺癌,則“吸煙與患肺癌沒有關(guān)系”等價(jià)于“吸煙與患肺癌獨(dú)立”,即假設(shè)H0等價(jià)于P(AB)=P(A)P(B).因此|ad-bc|越小,說明吸煙與患肺癌之間關(guān)系越弱;
|ad-bc|越大,說明吸煙與患肺癌之間關(guān)系越強(qiáng)。不患肺癌患肺癌總計(jì)不吸煙aba+b吸煙cdc+d總計(jì)a+cb+da+b+c+d在表中,a恰好為事件AB發(fā)生的頻數(shù);a+b和a+c恰好分別為事件A和B發(fā)生的頻數(shù)。由于頻率接近于概率,所以在H0成立的條件下應(yīng)該有
為了使不同樣本容量的數(shù)據(jù)有統(tǒng)一的評(píng)判標(biāo)準(zhǔn),基于上述分析,我們構(gòu)造一個(gè)隨機(jī)變量-----卡方統(tǒng)計(jì)量(1)
若H0成立,即“吸煙與患肺癌沒有關(guān)系”,則K2應(yīng)很小。根據(jù)表3-7中的數(shù)據(jù),利用公式(1)計(jì)算得到K2的觀測(cè)值為:那么這個(gè)值到底能告訴我們什么呢?(2)
獨(dú)立性檢驗(yàn)在H0成立的情況下,統(tǒng)計(jì)學(xué)家估算出如下的概率
即在H0成立的情況下,K2的值大于6.635的概率非常小,近似于0.01。
也就是說,在H0成立的情況下,對(duì)隨機(jī)變量K2進(jìn)行多次觀測(cè),觀測(cè)值超過6.635的頻率約為0.01。思考
答:判斷出錯(cuò)的概率為0.01。判斷是否成立的規(guī)則如果,就判斷不成立,即認(rèn)為吸煙與患肺癌有關(guān)系;否則,就判斷成立,即認(rèn)為吸煙與患肺癌有關(guān)系。獨(dú)立性檢驗(yàn)的定義
上面這種利用隨機(jī)變量K2來確定在多大程度上可以認(rèn)為“兩個(gè)分類變量有關(guān)系”的方法,稱為兩個(gè)分類變量的獨(dú)立性檢驗(yàn)。在該規(guī)則下,把結(jié)論“成立”錯(cuò)判成“不成立”的概率不會(huì)差過即有99%的把握認(rèn)為不成立。獨(dú)立性檢驗(yàn)的基本思想(類似反證法)(1)假設(shè)結(jié)論不成立,即“兩個(gè)分類變量沒有關(guān)系”.(2)在此假設(shè)下我們所構(gòu)造的隨機(jī)變量K2
應(yīng)該很小,如果由觀測(cè)數(shù)據(jù)計(jì)算得到K2的觀測(cè)值k很大,則在一定可信程度上說明不成立.即在一定可信程度上認(rèn)為“兩個(gè)分類變量有關(guān)系”;如果k的值很小,則說明由樣本觀測(cè)數(shù)據(jù)沒有發(fā)現(xiàn)反對(duì)的充分證據(jù)。(3)根據(jù)隨機(jī)變量K2的含義,可以通過評(píng)價(jià)該假設(shè)不合理的程度,由實(shí)際計(jì)算出的,說明假設(shè)不合理的程度為1%,即“兩個(gè)分類變量有關(guān)系”這一結(jié)論成立的可信度為約為99%.怎樣判斷K2的觀測(cè)值k是大還是小呢?
這僅需要確定一個(gè)正數(shù),當(dāng)時(shí)就認(rèn)為K2的觀測(cè)值k大。此時(shí)相應(yīng)于的判斷規(guī)則為:如果,就認(rèn)為“兩個(gè)分類變量之間有關(guān)系”;否則就認(rèn)為“兩個(gè)分類變量之間沒有關(guān)系”。----臨界值按照上述規(guī)則,把“兩個(gè)分類變量之間沒有關(guān)系”錯(cuò)誤的判斷為“兩個(gè)分類變量之間有關(guān)系”的概率為P().思考:
利用上面的結(jié)論,你能從列聯(lián)表的等高條形圖中看出兩個(gè)分類變量是否相關(guān)呢?表1-112x2聯(lián)表
一般地,假設(shè)有兩個(gè)分類變量X和Y,它們的取值分別為x1,x2和y1,y2,其樣本頻數(shù)列聯(lián)表(稱為2x2列聯(lián)表)為:y1y2總計(jì)x1aba+bx2cdc+d總計(jì)a+cb+da+b+c+d
若要判斷的結(jié)論為:H1:“X與Y有關(guān)系”,可以按如下步驟判斷H1成立的可能性:2、可以利用獨(dú)立性檢驗(yàn)來考察兩個(gè)分類變量是否有關(guān)系,并且能較精確地給出這種判斷的可靠程度。1、通過等高條形圖,可以粗略地判斷兩個(gè)變量是否有關(guān)系,但是這種判斷無法精確地給出所得結(jié)論的可靠程度。在等高條形圖中,主對(duì)角線上兩個(gè)柱形高度的乘積ad與副對(duì)角線上兩個(gè)柱形高度的乘積bc相差越大,H1成立的可能性就越大。
在實(shí)際應(yīng)用中,要在獲取樣本數(shù)據(jù)之前通過下表確定臨界值:0.500.400.250.150.100.4550.7081.3232.0722.7060.050.0250.0100.0050.0013.8415.0246.6367.87910.828具體作法是:(1)根據(jù)實(shí)際問題需要的可信程度確定臨界值;(2)利用公式(1),由觀測(cè)數(shù)據(jù)計(jì)算得到隨機(jī)變量的觀測(cè)值;(3)如果,就以的把握認(rèn)為“X與Y有關(guān)系”;否則就說樣本觀測(cè)數(shù)據(jù)沒有提供“X與Y有關(guān)系”的充分證據(jù)。隨機(jī)變量-----卡方統(tǒng)計(jì)量獨(dú)立性檢驗(yàn)0.500.400.250.150.100.050.0250.0100.0050.0010.4550.7081.3232.0722.7063.8415.0246.6357.87910.828臨界值表0.1%把握認(rèn)為A與B無關(guān)1%把握認(rèn)為A與B無關(guān)99.9%把握認(rèn)A與B有關(guān)99%把握認(rèn)為A與B有關(guān)90%把握認(rèn)為A與B有關(guān)10%把握認(rèn)為A與B無關(guān)沒有充分的依據(jù)顯示A與B有關(guān),但也不能顯示A與B無關(guān)第一步:設(shè)H0:吸煙和患病之間沒有關(guān)系
患病不患病總計(jì)吸煙aba+b不吸煙cdc+d總計(jì)a+cb+da+b+c+d第二步:列出2×2列聯(lián)表
獨(dú)立性檢驗(yàn)的步驟第三步:計(jì)算第四步:查對(duì)臨界值表,作出判斷。P(k≥k0)0.500.400.250.150.100.050.0
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度生態(tài)園區(qū)場(chǎng)地租賃合同標(biāo)準(zhǔn)范本6篇
- 二零二五年新能源發(fā)電設(shè)施建設(shè)泥工勞務(wù)合同3篇
- 二零二五版海上貨物運(yùn)輸合同適用范圍與船舶代理服務(wù)合同3篇
- 二零二五年度環(huán)境安全檢測(cè)技術(shù)服務(wù)合同2篇
- 二零二五年度防火門銷售、推廣及市場(chǎng)拓展合同3篇
- 二零二五版智慧城市基礎(chǔ)設(shè)施建設(shè)項(xiàng)目施工合同6篇
- 二零二五版新材料研發(fā)中心與實(shí)驗(yàn)員勞務(wù)合同2篇
- 二零二五年度游戲運(yùn)營合同3篇
- 二零二五版醫(yī)療器械貼牌研發(fā)及銷售合同3篇
- 二零二五版304不銹鋼建筑結(jié)構(gòu)材料采購合同2篇
- 品質(zhì)經(jīng)理工作總結(jié)
- 供電搶修述職報(bào)告
- 集成電路設(shè)計(jì)工藝節(jié)點(diǎn)演進(jìn)趨勢(shì)
- 新型電力系統(tǒng)簡(jiǎn)介演示
- 特種設(shè)備行業(yè)團(tuán)隊(duì)建設(shè)工作方案
- 眼內(nèi)炎患者護(hù)理查房課件
- 肯德基經(jīng)營策略分析報(bào)告總結(jié)
- 買賣合同簽訂和履行風(fēng)險(xiǎn)控制
- 中央空調(diào)現(xiàn)場(chǎng)施工技術(shù)總結(jié)(附圖)
- 水質(zhì)-濁度的測(cè)定原始記錄
- 數(shù)字美的智慧工業(yè)白皮書-2023.09
評(píng)論
0/150
提交評(píng)論