![獨(dú)立性檢驗(yàn)的思想及應(yīng)用課件_第1頁(yè)](http://file4.renrendoc.com/view/21a81a8be8692348e9babba85fb7541f/21a81a8be8692348e9babba85fb7541f1.gif)
![獨(dú)立性檢驗(yàn)的思想及應(yīng)用課件_第2頁(yè)](http://file4.renrendoc.com/view/21a81a8be8692348e9babba85fb7541f/21a81a8be8692348e9babba85fb7541f2.gif)
![獨(dú)立性檢驗(yàn)的思想及應(yīng)用課件_第3頁(yè)](http://file4.renrendoc.com/view/21a81a8be8692348e9babba85fb7541f/21a81a8be8692348e9babba85fb7541f3.gif)
![獨(dú)立性檢驗(yàn)的思想及應(yīng)用課件_第4頁(yè)](http://file4.renrendoc.com/view/21a81a8be8692348e9babba85fb7541f/21a81a8be8692348e9babba85fb7541f4.gif)
![獨(dú)立性檢驗(yàn)的思想及應(yīng)用課件_第5頁(yè)](http://file4.renrendoc.com/view/21a81a8be8692348e9babba85fb7541f/21a81a8be8692348e9babba85fb7541f5.gif)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1.2獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用高二數(shù)學(xué)選修1-2
第一章統(tǒng)計(jì)案例1、相關(guān)系數(shù)r復(fù)習(xí)回顧3、殘差平方和2、殘差復(fù)習(xí)回顧4、總偏差平方和5、相關(guān)指數(shù)R2(回歸平方和)
吸煙與肺癌列聯(lián)表不患肺癌患肺癌總計(jì)不吸煙7775427817吸煙2099492148總計(jì)9874919965為了調(diào)查吸煙是否對(duì)肺癌有影響,某腫瘤研究所隨機(jī)地調(diào)查了9965人,得到如下結(jié)果(單位:人)列聯(lián)表在不吸煙者中患肺癌的比重是
在吸煙者中患肺癌的比重是
說(shuō)明:吸煙者和不吸煙者患肺癌的可能性存在差異,吸煙者患肺癌的可能性大。0.54%2.28%探究不患肺癌患肺癌總計(jì)不吸煙7775427817吸煙2099492148總計(jì)98749199651、列聯(lián)表2、三維柱形圖3、二維條形圖不患肺癌患肺癌吸煙不吸煙不患肺癌患肺癌吸煙不吸煙080007000600050004000300020001000從三維柱形圖能清晰看出各個(gè)頻數(shù)的相對(duì)大小。從二維條形圖能看出,吸煙者中患肺癌的比例高于不患肺癌的比例。通過(guò)圖形直觀判斷兩個(gè)分類變量是否相關(guān):不吸煙吸煙患肺癌比例不患肺癌比例4、等高條形圖等高條形圖更清晰地表達(dá)了兩種情況下患肺癌的比例。因此|ad-bc|越小,說(shuō)明吸煙與患肺癌之間關(guān)系越弱;
|ad-bc|越大,說(shuō)明吸煙與患肺癌之間關(guān)系越強(qiáng)。不患肺癌患肺癌總計(jì)不吸煙aba+b吸煙cdc+d總計(jì)a+cb+da+b+c+d如果“吸煙與患肺癌沒(méi)有關(guān)系”,則在吸煙者中不患肺癌的比例應(yīng)該與不吸煙者中相應(yīng)的比例差不多,即
為了使不同樣本容量的數(shù)據(jù)有統(tǒng)一的評(píng)判標(biāo)準(zhǔn),基于上述分析,我們構(gòu)造一個(gè)隨機(jī)變量-----卡方統(tǒng)計(jì)量(1)
若H0成立,即“吸煙與患肺癌沒(méi)有關(guān)系”,則K2應(yīng)很小。根據(jù)表3-7中的數(shù)據(jù),利用公式(1)計(jì)算得到K2的觀測(cè)值為:那么這個(gè)值到底能告訴我們什么呢?(2)
獨(dú)立性檢驗(yàn)在H0成立的情況下,統(tǒng)計(jì)學(xué)家估算出如下的概率
即在H0成立的情況下,K2的值大于6.635的概率非常小,近似于0.01。
也就是說(shuō),在H0成立的情況下,對(duì)隨機(jī)變量K2進(jìn)行多次觀測(cè),觀測(cè)值超過(guò)6.635的頻率約為0.01。思考
答:判斷出錯(cuò)的概率為0.01。獨(dú)立性檢驗(yàn)的基本思想(類似反證法)(1)假設(shè)結(jié)論不成立,即“兩個(gè)分類變量沒(méi)有關(guān)系”.(2)在此假設(shè)下我們所構(gòu)造的隨機(jī)變量K2
應(yīng)該很小,如果由觀測(cè)數(shù)據(jù)計(jì)算得到K2的觀測(cè)值k很大,則在一定可信程度上說(shuō)明不成立.即在一定可信程度上認(rèn)為“兩個(gè)分類變量有關(guān)系”;如果k的值很小,則說(shuō)明由樣本觀測(cè)數(shù)據(jù)沒(méi)有發(fā)現(xiàn)反對(duì)的充分證據(jù)。(3)根據(jù)隨機(jī)變量K2的含義,可以通過(guò)評(píng)價(jià)該假設(shè)不合理的程度,由實(shí)際計(jì)算出的,說(shuō)明假設(shè)合理的程度為99%,即“兩個(gè)分類變量有關(guān)系”這一結(jié)論成立的可信度為約為99%.怎樣判斷K2的觀測(cè)值k是大還是小呢?
這僅需要確定一個(gè)正數(shù),當(dāng)時(shí)就認(rèn)為K2的觀測(cè)值k大。此時(shí)相應(yīng)于的判斷規(guī)則為:如果,就認(rèn)為“兩個(gè)分類變量之間有關(guān)系”;否則就認(rèn)為“兩個(gè)分類變量之間沒(méi)有關(guān)系”。----臨界值按照上述規(guī)則,把“兩個(gè)分類變量之間有沒(méi)關(guān)系”錯(cuò)誤的判斷為“兩個(gè)分類變量之間有關(guān)系”的概率為P().在實(shí)際應(yīng)用中,我們把解釋為有的把握認(rèn)為“兩個(gè)分類變量之間有關(guān)系”;把解釋為不能以的把握認(rèn)為“兩個(gè)分類變量之間有關(guān)系”,或者樣本觀測(cè)數(shù)據(jù)沒(méi)有提供“兩個(gè)分類變量之間有關(guān)系”的充分證據(jù)。思考:
利用上面的結(jié)論,你能從列聯(lián)表的三維柱形圖中看出兩個(gè)分類變量是否相關(guān)呢?表1-112x2聯(lián)表
一般地,假設(shè)有兩個(gè)分類變量X和Y,它們的值域分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為2x2列聯(lián)表)為:y1y2總計(jì)x1aba+bx2cdc+d總計(jì)a+cb+da+b+c+d在實(shí)際應(yīng)用中,要在獲取樣本數(shù)據(jù)之前通過(guò)下表確定臨界值:0.500.400.250.150.100.4550.7081.3232.0722.7060.050.0250.0100.0050.0013.8415.0246.6367.87910.828具體作法是:(1)根據(jù)實(shí)際問(wèn)題需要的可信程度確定臨界值;(2)利用公式(1),由觀測(cè)數(shù)據(jù)計(jì)算得到隨機(jī)變量的觀測(cè)值;(3)如果,就以的把握認(rèn)為“X與Y有關(guān)系”;否則就說(shuō)樣本觀測(cè)數(shù)據(jù)沒(méi)有提供“X與Y有關(guān)系”的充分證據(jù)。例1在某醫(yī)院,因?yàn)榛夹呐K病而住院的665名男性病人中,有214人禿頂;而另外772名不是因?yàn)榛夹呐K病而住院的男性病人中有175人禿頂。分別利用圖形和獨(dú)立性檢驗(yàn)方法判斷禿頂與患心臟病是否有關(guān)系?你所得的結(jié)論在什么范圍內(nèi)有效?解:根據(jù)題目所給數(shù)據(jù)得到如下列聯(lián)表:患心臟病不患心臟病總計(jì)禿頂214175389不禿頂4515971048總計(jì)6657721437
相應(yīng)的三維柱形圖如圖所示,比較來(lái)說(shuō),底面副對(duì)角線上兩個(gè)柱體高度的乘積要大一些,因此可以在某種程度上認(rèn)為“禿頂與患心臟病有關(guān)”。禿頭不禿頭例1在某醫(yī)院,因?yàn)榛夹呐K病而住院的665名男性病人中,有214人禿頂;而另外772名不是因?yàn)榛夹呐K病而住院的男性病人中有175人禿頂。分別利用圖形和獨(dú)立性檢驗(yàn)方法判斷禿頂與患心臟病是否有關(guān)系?你所得的結(jié)論在什么范圍內(nèi)有效?解:根據(jù)題目所給數(shù)據(jù)得到如下列聯(lián)表:患心臟病不患心臟病總計(jì)禿頂214175389不禿頂4515971048總計(jì)6657721437
根據(jù)聯(lián)表1-13中的數(shù)據(jù),得到所以有99%的把握認(rèn)為“禿頂患心臟病有關(guān)”。例2為考察高中生的性別與是否喜歡數(shù)學(xué)課程之間的關(guān)系,在某城市的某校高中生中隨機(jī)抽取300名學(xué)生,得到如下聯(lián)表:喜歡數(shù)學(xué)課程不喜歡數(shù)學(xué)課程總計(jì)男3785122女35143178總計(jì)72228300由表中數(shù)據(jù)計(jì)算K2的觀測(cè)值k4.514。能夠以95%的把握認(rèn)為高中生的性別與是否喜歡數(shù)學(xué)課程之間有關(guān)系嗎?請(qǐng)?jiān)敿?xì)闡述得出結(jié)論的依據(jù)。解:可以有95%以上的把握認(rèn)為“性別與喜歡數(shù)學(xué)課程之間有關(guān)系”。分別用a,b,c,d表示樣本中喜歡數(shù)學(xué)課的男生人數(shù)、不喜歡數(shù)學(xué)課的男生人數(shù)、喜歡數(shù)學(xué)課的女生人數(shù)、不喜歡數(shù)學(xué)課的女生人數(shù)。如果性別與是否喜歡數(shù)學(xué)課有關(guān)系,則男生中喜歡數(shù)學(xué)課的比例與女生中喜歡數(shù)學(xué)課的比例應(yīng)該相差很多,即例2為考察高中生的性別與是否喜歡數(shù)學(xué)課程之間的關(guān)系,在某城市的某校高中生中隨機(jī)抽取300名學(xué)生,得到如下聯(lián)表:喜歡數(shù)學(xué)課程不喜歡數(shù)學(xué)課程總計(jì)男3785122女35143178總計(jì)72228300由表中數(shù)據(jù)計(jì)算K2的觀測(cè)值k4.514。能夠以95%的把握認(rèn)為高中生的性別與是否喜歡數(shù)學(xué)課程之間有關(guān)系嗎?請(qǐng)?jiān)敿?xì)闡述得出結(jié)論的依據(jù)。因此,越大,“性別與喜歡數(shù)學(xué)課程之間有關(guān)系”成立的可能性就越大。另一方面,在假設(shè)“性別與喜歡數(shù)學(xué)課程之間有關(guān)系”的前提下,事件的概率為因此事件A是一個(gè)小概率事件。而由樣本數(shù)據(jù)計(jì)算得的觀測(cè)值k=4.514,即小概率事件A發(fā)生。因此應(yīng)該斷定“性別與喜歡數(shù)學(xué)課程之間有關(guān)系”成立,并且這種判斷結(jié)果出錯(cuò)的可能性約為5%。所以,約有95%的把握認(rèn)為“性別與喜歡數(shù)學(xué)課程之間有關(guān)系”。例3、某校高三年級(jí)在一次全年級(jí)的大型考試中,數(shù)學(xué)成績(jī)優(yōu)秀和非優(yōu)秀的學(xué)生中,物理、化學(xué)、總分也為優(yōu)秀的人數(shù)如下表所示,則數(shù)學(xué)成績(jī)優(yōu)秀與物理、化學(xué)、總分也優(yōu)秀哪個(gè)關(guān)系較大?物理化學(xué)總分?jǐn)?shù)學(xué)優(yōu)秀228225267數(shù)學(xué)非優(yōu)秀14315699注:該年級(jí)此次考試中,數(shù)學(xué)成績(jī)優(yōu)秀的有360人,非優(yōu)秀的有880人。物理優(yōu)秀物理非優(yōu)秀合計(jì)數(shù)學(xué)優(yōu)秀數(shù)學(xué)非優(yōu)秀合計(jì)(1)列出數(shù)學(xué)與物理優(yōu)秀的2x2列聯(lián)表如下2281323601437378803718691240代入公式可得練習(xí)1:在500人身上試驗(yàn)?zāi)撤N血清預(yù)防感冒作用,把他們一年中的感冒記錄與另外500名未用血清的人的感冒記錄作比較,結(jié)果如表所示。未感冒感冒合計(jì)使用血清252248500未使用血清224276500合計(jì)4765241000試畫(huà)出列聯(lián)表的條形圖,并通過(guò)圖形判斷這種血清能否起到預(yù)防感冒的作用?并進(jìn)行獨(dú)立性檢驗(yàn)。解:設(shè)H0:感冒與是否使用該血清沒(méi)有關(guān)系。因當(dāng)H0成立時(shí),K2≥6.635的概率約為0.01,故有99%的把握認(rèn)為該血清能起到預(yù)防感冒的作用。P(k≥k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828P(k≥k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030全球滑靴式分揀系統(tǒng)行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 2025-2030全球民用航空機(jī)翼行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 為他人貸款合同擔(dān)保
- 叉車(chē)購(gòu)銷合同模板
- 2025物料購(gòu)置合同管理操作規(guī)程
- 學(xué)校商鋪?zhàn)赓U合同范本
- 提高組織和協(xié)調(diào)能力的培訓(xùn)
- 施工設(shè)計(jì)合同
- 商鋪?zhàn)赓U合同范本簡(jiǎn)單
- 人才招聘中介服務(wù)合同模板
- 安全文明施工的管理要點(diǎn)
- 附屬醫(yī)院神經(jīng)內(nèi)科中長(zhǎng)期發(fā)展規(guī)劃五年發(fā)展規(guī)劃
- 中醫(yī)中風(fēng)病(腦梗死)診療方案
- GMP-基礎(chǔ)知識(shí)培訓(xùn)
- 人教版小學(xué)六年級(jí)數(shù)學(xué)下冊(cè)(全冊(cè))教案
- 人教版二年級(jí)語(yǔ)文上冊(cè)同音字歸類
- 高二數(shù)學(xué)下學(xué)期教學(xué)計(jì)劃
- 文學(xué)類作品閱讀練習(xí)-2023年中考語(yǔ)文考前專項(xiàng)練習(xí)(浙江紹興)(含解析)
- 第五章硅酸鹽分析
- 外科學(xué)總論-第十四章腫瘤
- 網(wǎng)絡(luò)反詐知識(shí)競(jìng)賽參考題庫(kù)100題(含答案)
評(píng)論
0/150
提交評(píng)論