




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
3.2獨立性檢驗的基本思想及其初步應用高二數學選修2-3
第三章統(tǒng)計案例授課教師:胡周明獨立性檢驗本節(jié)研究的是兩個分類變量的獨立性檢驗問題。在日常生活中,我們常常關心分類變量之間是否有關系:例如,吸煙是否與患肺癌有關系?性別是否對于喜歡數學課程有影響?等等。吸煙有害健康!正常人的肺吸煙者的肺
吸煙與肺癌列聯(lián)表不患肺癌患肺癌總計不吸煙7775427817吸煙2099492148總計9874919965為了調查吸煙是否對肺癌有影響,某腫瘤研究所隨機地調查了9965人,得到如下結果(單位:人)列聯(lián)表在不吸煙者中患肺癌的比重是
在吸煙者中患肺癌的比重是
說明:吸煙者和不吸煙者患肺癌的可能性存在差異,吸煙者患肺癌的可能性大。0.54%2.28%探究不患肺癌患肺癌總計不吸煙7775427817吸煙2099492148總計98749199651、列聯(lián)表2、三維柱形圖3、二維條形圖不患肺癌患肺癌吸煙不吸煙不患肺癌患肺癌吸煙不吸煙080007000600050004000300020001000從三維柱形圖能清晰看出各個頻數的相對大小。從二維條形圖能看出,吸煙者中患肺癌的比例高于不患肺癌的比例。通過圖形直觀判斷兩個分類變量是否相關:4、等高條形圖等高條形圖更清晰地表達了兩種情況下患肺癌的比例。
上面我們通過分析數據和圖形,得到的直觀印象是吸煙和患肺癌有關,那么事實是否真的如此呢?這需要用統(tǒng)計觀點來考察這個問題。
現(xiàn)在想要知道能夠以多大的把握認為“吸煙與患肺癌有關”,為此先假設
H0:吸煙與患肺癌沒有關系.不患肺癌患肺癌總計不吸煙aba+b吸煙cdc+d總計a+cb+da+b+c+d把表中的數字用字母代替,得到如下用字母表示的列聯(lián)表
用A表示不吸煙,B表示不患肺癌,則“吸煙與患肺癌沒有關系”等價于“吸煙與患肺癌獨立”,即假設H0等價于P(AB)=P(A)P(B).因此|ad-bc|越小,說明吸煙與患肺癌之間關系越弱;
|ad-bc|越大,說明吸煙與患肺癌之間關系越強。不患肺癌患肺癌總計不吸煙aba+b吸煙cdc+d總計a+cb+da+b+c+d在表中,a恰好為事件AB發(fā)生的頻數;a+b和a+c恰好分別為事件A和B發(fā)生的頻數。由于頻率接近于概率,所以在H0成立的條件下應該有
為了使不同樣本容量的數據有統(tǒng)一的評判標準,基于上述分析,我們構造一個隨機變量-----卡方統(tǒng)計量(1)
若H0成立,即“吸煙與患肺癌沒有關系”,則K2應很小。根據表3-7中的數據,利用公式(1)計算得到K2的觀測值為:那么這個值到底能告訴我們什么呢?(2)
獨立性檢驗在H0成立的情況下,統(tǒng)計學家估算出如下的概率
即在H0成立的情況下,K2的值大于6.635的概率非常小,近似于0.01。
也就是說,在H0成立的情況下,對隨機變量K2進行多次觀測,觀測值超過6.635的頻率約為0.01。思考
答:判斷出錯的概率為0.01。判斷是否成立的規(guī)則如果,就判斷不成立,即認為吸煙與患肺癌有關系;否則,就判斷成立,即認為吸煙與患肺癌有關系。獨立性檢驗的定義
上面這種利用隨機變量K2來確定在多大程度上可以認為“兩個分類變量有關系”的方法,稱為兩個分類變量的獨立性檢驗。在該規(guī)則下,把結論“成立”錯判成“不成立”的概率不會差過即有99%的把握認為不成立。獨立性檢驗的基本思想(類似反證法)(1)假設結論不成立,即“兩個分類變量沒有關系”.(2)在此假設下我們所構造的隨機變量K2
應該很小,如果由觀測數據計算得到K2的觀測值k很大,則在一定可信程度上說明不成立.即在一定可信程度上認為“兩個分類變量有關系”;如果k的值很小,則說明由樣本觀測數據沒有發(fā)現(xiàn)反對的充分證據。(3)根據隨機變量K2的含義,可以通過評價該假設不合理的程度,由實際計算出的,說明假設不合理的程度為1%,即“兩個分類變量有關系”這一結論成立的可信度為約為99%.怎樣判斷K2的觀測值k是大還是小呢?
這僅需要確定一個正數,當時就認為K2的觀測值k大。此時相應于的判斷規(guī)則為:如果,就認為“兩個分類變量之間有關系”;否則就認為“兩個分類變量之間沒有關系”。----臨界值按照上述規(guī)則,把“兩個分類變量之間沒有關系”錯誤的判斷為“兩個分類變量之間有關系”的概率為P().思考:
利用上面的結論,你能從列聯(lián)表的等高條形圖中看出兩個分類變量是否相關呢?表1-112x2聯(lián)表
一般地,假設有兩個分類變量X和Y,它們的取值分別為x1,x2和y1,y2,其樣本頻數列聯(lián)表(稱為2x2列聯(lián)表)為:y1y2總計x1aba+bx2cdc+d總計a+cb+da+b+c+d
若要判斷的結論為:H1:“X與Y有關系”,可以按如下步驟判斷H1成立的可能性:2、可以利用獨立性檢驗來考察兩個分類變量是否有關系,并且能較精確地給出這種判斷的可靠程度。1、通過等高條形圖,可以粗略地判斷兩個變量是否有關系,但是這種判斷無法精確地給出所得結論的可靠程度。在等高條形圖中,主對角線上兩個柱形高度的乘積ad與副對角線上兩個柱形高度的乘積bc相差越大,H1成立的可能性就越大。
在實際應用中,要在獲取樣本數據之前通過下表確定臨界值:0.500.400.250.150.100.4550.7081.3232.0722.7060.050.0250.0100.0050.0013.8415.0246.6367.87910.828具體作法是:(1)根據實際問題需要的可信程度確定臨界值;(2)利用公式(1),由觀測數據計算得到隨機變量的觀測值;(3)如果,就以的把握認為“X與Y有關系”;否則就說樣本觀測數據沒有提供“X與Y有關系”的充分證據。隨機變量-----卡方統(tǒng)計量獨立性檢驗0.500.400.250.150.100.050.0250.0100.0050.0010.4550.7081.3232.0722.7063.8415.0246.6357.87910.828臨界值表0.1%把握認為A與B無關1%把握認為A與B無關99.9%把握認A與B有關99%把握認為A與B有關90%把握認為A與B有關10%把握認為A與B無關沒有充分的依據顯示A與B有關,但也不能顯示A與B無關第一步:設H0:吸煙和患病之間沒有關系
患病不患病總計吸煙aba+b不吸煙cdc+d總計a+cb+da+b+c+d第二步:列出2×2列聯(lián)表
獨立性檢驗的步驟第三步:計算第四步:查對臨界值表,作出判斷。P(k≥k0)0.500.400.250.150.100.050.0
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年廣西地理中考真題及答案
- 13 必修1 第二單元 第12講 光合作用的影響因素及應用
- 特色小吃店長期承包合作協(xié)議
- 場地運營風險管理與保險合同范本
- 高端制造業(yè)項目保證金質押擔保服務協(xié)議
- 拆除工程安全責任書
- 菜鳥驛站快遞網點所有權變更合同模板
- 熔化凝固教學課件
- abc字母教學課件
- 2024-2025學年福建省龍巖市連城縣一中高一下學期月考地理試題及答案
- 安全生產標準化實施細則范例(3篇)
- (CNAS-CL01-2018認可準則)內審核查表
- 2024年模型模具加工合同范本
- 廣東省高州市2023-2024學年高一下學期期中考試數學
- 食堂工作人員考核方案
- 國家基本公衛(wèi)(老年人健康管理)考試復習題及答案
- 臨床營養(yǎng)(043)(正高級)高級衛(wèi)生專業(yè)技術資格考試試卷及答案指導(2025年)
- 6S視覺管理之定置劃線顏色管理及標準樣式
- 重慶市旋挖成孔灌注樁工程技術規(guī)程
- 貴州省黔西南布依族苗族自治州2023-2024學年六年級下學期6月期末數學試題
- 中考字音字形練習題(含答案)-字音字形專項訓練
評論
0/150
提交評論