![3.2獨立性檢驗的基本思想及其初步應用_第1頁](http://file4.renrendoc.com/view/aa6cd837605e058e32fc9cda36fea63f/aa6cd837605e058e32fc9cda36fea63f1.gif)
![3.2獨立性檢驗的基本思想及其初步應用_第2頁](http://file4.renrendoc.com/view/aa6cd837605e058e32fc9cda36fea63f/aa6cd837605e058e32fc9cda36fea63f2.gif)
![3.2獨立性檢驗的基本思想及其初步應用_第3頁](http://file4.renrendoc.com/view/aa6cd837605e058e32fc9cda36fea63f/aa6cd837605e058e32fc9cda36fea63f3.gif)
![3.2獨立性檢驗的基本思想及其初步應用_第4頁](http://file4.renrendoc.com/view/aa6cd837605e058e32fc9cda36fea63f/aa6cd837605e058e32fc9cda36fea63f4.gif)
![3.2獨立性檢驗的基本思想及其初步應用_第5頁](http://file4.renrendoc.com/view/aa6cd837605e058e32fc9cda36fea63f/aa6cd837605e058e32fc9cda36fea63f5.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
3.2獨立性檢驗的基本思想及其初步應用高二數學選修2-3章統(tǒng)計案例獨立性檢驗本節(jié)研究的是兩個分類變量的獨立性檢驗問題。在日常生活中,我們常常關心分類變量之間是否有關系:例如,吸煙是否與患肺癌有關系?性別是否對于喜歡數學課程有影響?等等。
吸煙與肺癌列聯表不患肺癌患肺癌總計不吸煙7775427817吸煙2099492148總計9874919965為了調查吸煙是否對肺癌有影響,某腫瘤研究所隨機地調查了9965人,得到如下結果(單位:人)列聯表分類變量1.下面是一個2×2列聯表:y1y2總計x1a2173x222527總計b46100則表中a、b的值分別為(
)A.94、96B.52、50C.52、54D.54、52C
吸煙與肺癌列聯表不患肺癌患肺癌總計不吸煙7775427817吸煙2099492148總計9874919965為了調查吸煙是否對肺癌有影響,某腫瘤研究所隨機地調查了9965人,得到如下結果(單位:人)列聯表在不吸煙者中患肺癌的比重是
在吸煙者中患肺癌的比重是
吸煙者和不吸煙者都可能患肺癌,吸煙者患肺癌的可能性較大0.54%2.28%分類變量42/7817通過圖形直觀判斷兩個分類變量是否相關:等高條形圖在不吸煙者中患肺癌的比重是
在吸煙者中患肺癌的比重是
0.54%2.28%
上面我們通過分析數據和圖形,得到的直觀印象是吸煙和患肺癌有關,那么事實是否真的如此呢?這需要用統(tǒng)計觀點來考察這個問題。
現在想要知道能夠以多大的把握認為“吸煙與患肺癌有關”,為此先假設
H0:吸煙與患肺癌沒有關系.不患肺癌患肺癌總計不吸煙aba+b吸煙cdc+d總計a+cb+da+b+c+d把表中的數字用字母代替,得到如下用字母表示的列聯表
用A表示不吸煙,B表示不患肺癌,則“吸煙與患肺癌沒有關系”等價于“吸煙與患肺癌獨立”,即假設H0等價于P(AB)=P(A)P(B).因此|ad-bc|越小,說明吸煙與患肺癌之間關系越弱;
|ad-bc|越大,說明吸煙與患肺癌之間關系越強。不患肺癌患肺癌總計不吸煙aba+b吸煙cdc+d總計a+cb+da+b+c+d在表中,a恰好為事件AB發(fā)生的頻數;a+b和a+c恰好分別為事件A和B發(fā)生的頻數。由于頻率接近于概率,所以在H0成立的條件下應該有不患肺癌患肺癌總計不吸煙aba+b吸煙cdc+d總計a+cb+dn=a+b+c+d獨立性檢驗在不吸煙者中不患肺癌的比重是
在吸煙者中不患肺癌的比重是
H0:假設吸煙和患肺癌沒有關系獨立性檢驗H0:假設吸煙和患肺癌沒有關系構造隨機變量(卡方統(tǒng)計量)
作為檢驗在多大程度上可以認為“兩個變量有關系”的標準。
若H0(吸煙和患肺癌沒有關系)成立,則K2應該很小.獨立性檢驗H0:假設吸煙和患肺癌沒有關系
吸煙與肺癌列聯表不患肺癌患肺癌總計不吸煙7775427817吸煙2099492148總計9874919965隨機變量-----卡方統(tǒng)計量0.500.400.250.150.100.050.0250.0100.0050.0010.4550.7081.3232.0722.7063.8415.0246.6357.87910.828臨界值表0.1%把握認為A與B無關1%把握認為A與B無關99.9%把握認A與B有關99%把握認為A與B有關90%把握認為A與B有關10%把握認為A與B無關即在成立的情況下,K2
大于6.635概率非常小,近似為0.01
現在的K2≈56.632的觀測值遠大于6.635,小概率事件的發(fā)生說明假設H0不成立!0.500.400.250.150.100.050.0250.0100.0050.0010.4550.7081.3232.0722.7063.8415.0246.6357.87910.828臨界值表獨立性檢驗H0:假設吸煙和患肺癌沒有關系所以吸煙和患肺癌有關!1.對分類變量X與Y的隨機變量K2的觀測值k,說法正確的是(
)A.k越大,“
X與Y有關系”可信程度越小B.k越小,“
X與Y有關系”可信程度越小C.k越接近于0,“X與Y無關”程度越小D.k越大,“X與Y無關”程度越大B獨立性檢驗基本的思想類似反證法(1)假設結論不成立,即“兩個分類變量沒有關系”.(2)在此假設下隨機變量K2
應該很能小,如果由觀測數據計算得到K2的觀測值k很大,則在一定程度上說明假設不合理.(3)根據隨機變量K2的含義,可以通過評價該假設不合理的程度,由實際計算出的,說明假設合理的程度為99.9%,即“兩個分類變量有關系”這一結論成立的可信度為約為99.9%.反證法原理與假設檢驗原理反證法原理:在一個已知假設下,如果推出一個矛盾,就證明了這個假設不成立。假設檢驗原理:在一個已知假設下,如果一個與該假設矛盾的小概率事件發(fā)生,就推斷這個假設不成立。在H0成立的條件下,構造與H0矛盾的小概率事件;2.如果樣本使得這個小概率事件發(fā)生,則H0不成立,就能以一定把握斷言H1成立;否則,斷言沒有發(fā)現樣本數據與H0相矛盾的證據。求解思路假設檢驗問題:例1.在某醫(yī)院,因為患心臟病而住院的665名男性病人中,有214人禿頂,而另外772名不是因為患心臟病而住院的男性病人中有175人禿頂.分別利用圖形和獨立性檢驗方法判斷是否有關?你所得的結論在什么范圍內有效?患心臟病不患心臟病總計禿頂214175389不禿頂4515971048總計6657721437在禿頂中患心臟病的比重是
在不禿頂中患心臟病的比重是
55.01%43.03%例1.在某醫(yī)院,因為患心臟病而住院的665名男性病人中,有214人禿頂,而另外772名不是因為患心臟病而住院的男性病人中有175人禿頂.分別利用圖形和獨立性檢驗方法判斷是否有關?你所得的結論在什么范圍內有效?患心臟病不患心臟病總計禿頂214175389不禿頂4515971048總計6657721437
根據聯表的數據,得到所以有99%的把握認為“禿頂與患心臟病有關”。注意:因為這組數據來自住院的病人,因此所得到的結論適合住院的病人群體.2、本例中的邊框中的注解:1、在解決實際問題時,可以直接計算K2的觀測值k進行獨立檢驗,而不必寫出K2的推導過程;
主要是使得我們注意統(tǒng)計結果的適用范圍(這由樣本的代表性所決定)A所以根據列聯表的數據,可以有
%的把握認為該學校15至16周歲的男生的身高和體重之間有關系。97.5由獨立性檢驗隨機變量值的計算公式得:
跟蹤訓練1.(2011·廣東執(zhí)信中學)某中學一位高三班主任對本班50名學生學習積極性和對待班級工作的態(tài)度進行長期的調查,得到的統(tǒng)計數據如下表所示:積極參加班級工作不太主動參加班級工作合計學習積極性高18725學習積極性一般61925合計242650完成課本97頁練習(1)如果隨機調查這個班的一名學生,那么抽到積極參加班級工作的學生的概率是多少?抽到不太積極參加班級工作且學習積極性一般的學生的概率是多少?(2)能否在犯錯誤的概率不超過0.001的前提下認為學生的積極性與對待班級工作的態(tài)度有關系?所以,在犯錯誤的概率不超過0.001的前提下,認為“學生的學習積極性與對待班級工作的態(tài)度”有關系.1.(2013·深圳二模)2013年3月14日,CCTV財經頻道報道了某地建筑市場存在違規(guī)使用未經淡化海砂的現象.為了研究使用淡化海砂與混凝土耐久性是否達標有關,某大學實驗室隨機抽取了60個樣本,得到了相關數據如下表:混凝土耐久性達標混凝土耐久性不達標總計使用淡化海砂25530使用未經淡化海砂151530總計402060(1)根據表中數據,利用獨立性檢驗的方法判斷,能否在犯錯誤的概率不超過1%的前提下,認為使用淡化海砂與混凝土耐久性是否達標有關?(2)若用分層抽樣的方法在使用淡化海砂的樣本中抽取了6個,現從這6個樣本中任取2個,則取出的2個樣本混凝土耐久性都達標的概率是多少?參考數據:P(k2≥k)0.100.0500.0250.0100.001k2.7063.8415.0246.63510.828解析:(1)提出假設H0:使用淡化海砂與混凝土耐久性是否達標無關.根據表中數據,求得K2的觀測值∴能在犯錯誤的概率不超過1%的前提下,認為使用淡化海砂與混凝土耐久性是否達標有關.(2)用分層抽樣的方法在使用淡化海砂的樣本中抽取6個,其中應抽取“混凝土耐久性達標”的為×6=5,“混凝土耐久性不達標”的為6-5=1,“混凝土耐久性達標記”為A1,A2,A3,A4,A5”;“混凝土耐久性不達標”的記為B.在這6個樣本中任取2個,有以下幾種可能:(A1,A2),(A1,A3),(A1,A4),(A1,A5),(A1,B),(A2,A3),(A2,A4),(A2,A5),(A2,B),(A3,A4),(A3,A5),(A3,B),(A4,A5),(A4,B)(A5,B),共15種.設“取出的2個樣本混凝土耐久性都達標”為事件A,它的對立事件A為“取出的2個樣本至少有1個混凝土耐久性不達標”,包含(A1,B),(A2,B),(A3,B),(A4,B),(A5,B),共5種可能.2.(2011·揭陽一模)某食品廠為了檢查甲乙兩條自動包裝流水線的生產情況,隨機在這兩條流水線上各抽取40件產品作為樣本稱出它們的重量(單位:克),重量值落在(495,510]的產品為合格品,否則為不合格品.表1是甲流水線樣本頻數分布表,圖1是乙流水線樣本的頻率分布直方圖.產品重量/克頻數(490,495]6(495,500]8(500,505]14(505,510]8(510,515]4表1甲流水線樣本頻數分布表(1)根據上表數據作出甲流水線樣本的頻率分布直方圖;(2)若以頻率作為概率,試估計從兩條流水線分別任取1件產品,該產品恰好是合格品的概率分別是多少;(3)由以上統(tǒng)計數據完成下面2×2列聯表,能否在犯錯誤的概率不超過0.1的前提下認為產品的包裝質量與兩條自動包裝流水線的選擇有關?甲流水線乙流水線合計合格品a=b=不合格品c=d=合計n=附:下面的臨界值表供參考:p(K2≥k)0.150.100.050.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828解析:(1)甲流水線樣本的頻率分布直方圖如下:(2)由表1知甲樣本中合格品數為8+14+8=30,由圖1知乙樣本中合格品
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 用人單位勞動勞務合同書(29篇)
- 2024文明禮儀學習心得(14篇)
- 蛋雞飼料加工智能化生產項目可行性研究報告寫作模板-備案審批
- 2025年世界知名品牌代理商合作協(xié)議
- 2025年購房意向策劃金協(xié)議范本版
- 2025年專利技術購買與轉讓合同范例
- 2025年硅藻泥項目申請報告模式
- 2025年信息技術咨詢服務收購協(xié)議
- 2025年鈉濾膜項目提案報告模板
- 2025年信用卡債務分期償還安排協(xié)議
- 垃圾中轉站運營管理投標方案(技術標)
- 分層作業(yè),分出活力小學數學作業(yè)分層設計的有效策略
- 2023湖南省修訂醫(yī)療服務價格項目匯總表
- 驗證機械能守恒物理實驗報告
- (完整)雙溪課程評量表
- 成人機械通氣患者俯臥位護理2023護理團體標準7
- 體育心理學(第三版)PPT全套教學課件
- 【鋼鐵冶煉】-銻冶煉先關工藝
- 拉線的制作詳細
- 護理管理組織體系架構圖
- 漸變方格模板
評論
0/150
提交評論