版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、2/23/2022整理課件 第三章第三章 統(tǒng)計(jì)案例統(tǒng)計(jì)案例2/23/2022整理課件2 2定定量量變變量量回回歸歸分分析析(畫畫散散點(diǎn)點(diǎn)圖圖、相相關(guān)關(guān)系系數(shù)數(shù)r r、變變量量 相相關(guān)關(guān)指指數(shù)數(shù)R R 、殘殘差差分分析析)分分類類變變量量研究兩個變量的相關(guān)關(guān)系:定量變量:體重、身高、溫度、考試成績等等。定量變量:體重、身高、溫度、考試成績等等。變量 分類變量:性別、是否吸煙、是否患肺癌、變量 分類變量:性別、是否吸煙、是否患肺癌、 宗教信仰、國籍等等。宗教信仰、國籍等等。兩種變量:獨(dú)立性檢驗(yàn)獨(dú)立性檢驗(yàn)本節(jié)研究的是兩個分類變量的獨(dú)立性檢驗(yàn)問題。在日常生活中,我們常常關(guān)心在日常生活中,我們常常關(guān)心分
2、類變量之間是否有關(guān)系分類變量之間是否有關(guān)系:例如,吸煙是否與患肺癌有關(guān)系?例如,吸煙是否與患肺癌有關(guān)系? 性別是否對于喜歡數(shù)學(xué)課程有影響?等等。性別是否對于喜歡數(shù)學(xué)課程有影響?等等。2/23/2022整理課件為了調(diào)查吸煙是否對肺癌有影響,某腫瘤研究所隨機(jī)為了調(diào)查吸煙是否對肺癌有影響,某腫瘤研究所隨機(jī)地調(diào)查了地調(diào)查了99659965人,得到如下結(jié)果(單位:人)人,得到如下結(jié)果(單位:人)列聯(lián)表列聯(lián)表在不吸煙者中患肺癌的比重是在不吸煙者中患肺癌的比重是 在吸煙者中患肺癌的比重是在吸煙者中患肺癌的比重是 說明:吸煙者和不吸煙者患肺癌的可能性存在差異,吸煙者患說明:吸煙者和不吸煙者患肺癌的可能性存在差
3、異,吸煙者患肺癌的可能性大。肺癌的可能性大。0.54%0.54%2.28%2.28%探究探究2/23/2022整理課件 上面我們通過分析數(shù)據(jù)和圖形,得到的直觀印象是吸煙和上面我們通過分析數(shù)據(jù)和圖形,得到的直觀印象是吸煙和患肺癌有關(guān),那么事實(shí)是否真的如此呢?患肺癌有關(guān),那么事實(shí)是否真的如此呢?這需要用統(tǒng)計(jì)觀點(diǎn)這需要用統(tǒng)計(jì)觀點(diǎn)來考察這個問題。來考察這個問題。 現(xiàn)在想要知道能夠以多大的把握認(rèn)為現(xiàn)在想要知道能夠以多大的把握認(rèn)為“吸煙與患肺癌有關(guān)吸煙與患肺癌有關(guān)”,為此先假設(shè)為此先假設(shè) H0:吸煙與患肺癌沒有關(guān)系:吸煙與患肺癌沒有關(guān)系.把表中的數(shù)字用字母代替,得到如下用字母表示的列聯(lián)表把表中的數(shù)字用字母
4、代替,得到如下用字母表示的列聯(lián)表 用用A表示不吸煙,表示不吸煙,B表示不患肺癌,則表示不患肺癌,則“吸煙與患肺癌沒有關(guān)系吸煙與患肺癌沒有關(guān)系”等價于等價于“吸煙與患肺癌獨(dú)立吸煙與患肺癌獨(dú)立”,即假設(shè),即假設(shè)H0等價于等價于 P(AB)=P(A)P(B).2/23/2022整理課件因此因此|ad-bc|越小,說明吸煙與患肺癌之間關(guān)系越弱;越小,說明吸煙與患肺癌之間關(guān)系越弱; |ad-bc|越大,說明吸煙與患肺癌之間關(guān)系越強(qiáng)。越大,說明吸煙與患肺癌之間關(guān)系越強(qiáng)。adbc即a aa a+ +b ba a+ +c cn nn nn na+ba+bP(A),P(A),n na+ca+cP(B),P(B)
5、,n n.a aP(AB)P(AB)n n其中為樣本容量,即n = a+b+c+dn = a+b+c+d在表中,在表中,a恰好為事件恰好為事件AB發(fā)生的頻數(shù);發(fā)生的頻數(shù);a+b和和a+c恰好分別為事恰好分別為事件件A和和B發(fā)生的頻數(shù)。由于頻率接近于概率,所以在發(fā)生的頻數(shù)。由于頻率接近于概率,所以在H0成立的條成立的條件下應(yīng)該有件下應(yīng)該有(a+b+c+d)a(a+b)(a+c),2/23/2022整理課件 為了使不同樣本容量的數(shù)據(jù)有統(tǒng)一的評判標(biāo)準(zhǔn),基于上述分為了使不同樣本容量的數(shù)據(jù)有統(tǒng)一的評判標(biāo)準(zhǔn),基于上述分析,我們構(gòu)造一個隨機(jī)變量析,我們構(gòu)造一個隨機(jī)變量-卡方統(tǒng)計(jì)量卡方統(tǒng)計(jì)量22(),()()
6、()()其中為樣本容量。n adbcKab cdac bdnabcd(1) 若若 H0成立,即成立,即“吸煙與患肺癌沒有關(guān)系吸煙與患肺癌沒有關(guān)系”,則,則K2應(yīng)很小。應(yīng)很小。根據(jù)表根據(jù)表3-7中的數(shù)據(jù),利用公式(中的數(shù)據(jù),利用公式(1)計(jì)算得到)計(jì)算得到K2的觀測值為:的觀測值為:那么這個值到底能告訴我們什么呢?那么這個值到底能告訴我們什么呢?242 209956.6327817 2148 9874 91k9965(7775 49)(2) 獨(dú)立性檢驗(yàn)獨(dú)立性檢驗(yàn)2/23/2022整理課件隨機(jī)變量隨機(jī)變量-卡方統(tǒng)計(jì)量卡方統(tǒng)計(jì)量22(),()()()()其中為樣本容量。n adbcKab cdac
7、bdnabcd 5、獨(dú)立性檢驗(yàn)獨(dú)立性檢驗(yàn)0k0)k2P(K臨界值表臨界值表828.102K635. 62K706. 22K22.706K 0.1%0.1%把握認(rèn)為把握認(rèn)為A A與與B B無關(guān)無關(guān)1%1%把握認(rèn)為把握認(rèn)為A A與與B B無關(guān)無關(guān)99.9%99.9%把握認(rèn)把握認(rèn)A A與與B B有關(guān)有關(guān)99%99%把握認(rèn)為把握認(rèn)為A A與與B B有關(guān)有關(guān)90%90%把握認(rèn)為把握認(rèn)為A A與與B B有關(guān)有關(guān)10%10%把握認(rèn)為把握認(rèn)為A A與與B B無關(guān)無關(guān)沒有充分的依據(jù)顯示沒有充分的依據(jù)顯示A A與與B B有關(guān),但也不能顯示有關(guān),但也不能顯示A A與與B B無關(guān)無關(guān)2/23/2022整理課件在在H0
8、成立的情況下,統(tǒng)計(jì)學(xué)家估算出如下的概率成立的情況下,統(tǒng)計(jì)學(xué)家估算出如下的概率 即在即在H0成立的情況下,成立的情況下,K2的值大于的值大于6.635的概率非常小,近似的概率非常小,近似于于0.01。2(6.635)0.01.P K (2) 也就是說,在也就是說,在H0成立的情況下,對隨機(jī)變量成立的情況下,對隨機(jī)變量K2進(jìn)行多次觀進(jìn)行多次觀測,觀測值超過測,觀測值超過6.635的頻率約為的頻率約為0.01。思考 206.635?KH如果,就斷定不成立,這種判斷出錯的可能性有多大答:判斷出錯的概率為0.01。2009965 7775 49 42 2099566327817 2148 9874 91
9、().kHH 現(xiàn)現(xiàn)在在觀觀測測值值太太大大了了,在在成成立立的的情情況況下下能能夠夠出出現(xiàn)現(xiàn)這這樣樣的的觀觀測測值值的的概概率率不不超超過過0 0. .0 01 1,因因此此我我們們有有9 99 9% %的的把把握握認(rèn)認(rèn)為為不不成成立立,即即有有9 99 9% %的的把把握握認(rèn)認(rèn)為為“吸吸煙煙與與患患肺肺癌癌有有關(guān)關(guān)系系”。2/23/2022整理課件判斷判斷 是否成立的規(guī)則是否成立的規(guī)則0H如果如果 ,就判斷,就判斷 不成立,即認(rèn)為吸煙與不成立,即認(rèn)為吸煙與患肺癌有關(guān)系;否則,就判斷患肺癌有關(guān)系;否則,就判斷 成立,即認(rèn)為吸煙成立,即認(rèn)為吸煙與患肺癌有關(guān)系。與患肺癌有關(guān)系。6.635k 0H0
10、H獨(dú)立性檢驗(yàn)的定義獨(dú)立性檢驗(yàn)的定義 上面這種利用隨機(jī)變量上面這種利用隨機(jī)變量K2來確定在多大程度上來確定在多大程度上可以認(rèn)為可以認(rèn)為“兩個分類變量有關(guān)系兩個分類變量有關(guān)系”的方法,稱為兩的方法,稱為兩個分類變量的個分類變量的獨(dú)立性檢驗(yàn)獨(dú)立性檢驗(yàn)。在該規(guī)則下,把結(jié)論在該規(guī)則下,把結(jié)論“ 成立成立”錯判成錯判成“ 不不成立成立”的概率不會差過的概率不會差過0H0H2(6.635)0.01,P K 即有即有99%的把握認(rèn)為的把握認(rèn)為 不成立。不成立。0H2/23/2022整理課件表表1-11 2x2聯(lián)表聯(lián)表 一般地,假設(shè)有兩個分類變量一般地,假設(shè)有兩個分類變量X和和Y,它們的值域分,它們的值域分別為
11、別為x1,x2和和y1,y2,其樣本頻數(shù)列聯(lián)表(稱為其樣本頻數(shù)列聯(lián)表(稱為2x2列聯(lián)列聯(lián)表)為:表)為:2/23/2022整理課件在實(shí)際應(yīng)用中,要在獲取樣本數(shù)據(jù)之前通過下表確定臨界值:在實(shí)際應(yīng)用中,要在獲取樣本數(shù)據(jù)之前通過下表確定臨界值:0)k2P(K0k0k0)k2P(K具體作法是:具體作法是:(1)根據(jù)實(shí)際問題需要的可信程度確定臨界值根據(jù)實(shí)際問題需要的可信程度確定臨界值 ;(2)利用公式利用公式(1),由觀測數(shù)據(jù)計(jì)算得到隨機(jī)變量,由觀測數(shù)據(jù)計(jì)算得到隨機(jī)變量 的觀測值;的觀測值;(3)如果如果 ,就以,就以 的把握認(rèn)為的把握認(rèn)為“X與與Y有關(guān)系有關(guān)系”;否則就說樣本觀測數(shù)據(jù)沒有提供;否則就說樣本觀測數(shù)據(jù)沒有提供“X與與Y有關(guān)系有關(guān)系”的充分證據(jù)。的充分證據(jù)。0k2K0kk20(1() 100%P Kk2/23/2022整理課件例例1.1.在在500500人身上試驗(yàn)?zāi)撤N血清預(yù)防感冒作用,把他們
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 建筑物拆除工程風(fēng)險分析考核試卷
- 結(jié)核病藥物作用不良反應(yīng)
- SHetA2-生命科學(xué)試劑-MCE
- Sec-O-Glucosylhamaudol-Standard-生命科學(xué)試劑-MCE
- 出口處感染的治療及護(hù)理
- 中國二十四節(jié)氣《小暑》課件模板兩套
- 中國二十四節(jié)氣《清明》課件模板兩套
- 蘇州科技大學(xué)天平學(xué)院《檔案管理學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 中國二十四節(jié)氣《大暑》課件模板兩套
- 2023年普洱市寧洱縣教育體育系統(tǒng)事業(yè)單位招聘考試真題
- 直播技巧培訓(xùn)
- 數(shù)據(jù)分析師歷年考試真題試題庫(含答案)
- 心房顫動與認(rèn)知功能障礙發(fā)生機(jī)制研究進(jìn)展
- 2024年江蘇省高考化學(xué)試卷(含答案解析)
- 廣東省珠海市2023-2024學(xué)年六年級上學(xué)期數(shù)學(xué)期中試卷(含答案)
- 2024~2025學(xué)年高二地理期中考試模擬試卷【人教版選擇性必修一第一至三章】
- 2023年中國鐵塔招聘考試真題
- 人教版(2024新版)七年級上冊英語Unit 3 單元測試卷(筆試部分)(含答案)
- 江蘇省南京市六校聯(lián)考2024-2025學(xué)年高一上學(xué)期期中考試英語試卷(含答案含聽力原文無音頻)
- 2024統(tǒng)編新版小學(xué)四年級語文上冊第八單元:大單元整體教學(xué)設(shè)計(jì)
- 羽毛球運(yùn)動教學(xué)與訓(xùn)練智慧樹知到答案2024年黑龍江農(nóng)業(yè)工程職業(yè)學(xué)院
評論
0/150
提交評論