獨立性檢驗(課堂PPT)_第1頁
獨立性檢驗(課堂PPT)_第2頁
獨立性檢驗(課堂PPT)_第3頁
獨立性檢驗(課堂PPT)_第4頁
獨立性檢驗(課堂PPT)_第5頁
已閱讀5頁,還剩22頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第二章第二章 統(tǒng)計(必修統(tǒng)計(必修3 3)知識結構)知識結構 收集數(shù)據(jù)收集數(shù)據(jù) ( (隨機抽樣隨機抽樣) )整理、分析數(shù)據(jù)整理、分析數(shù)據(jù)估計、推斷估計、推斷簡單隨機抽簡單隨機抽樣樣分層抽樣分層抽樣系統(tǒng)抽樣系統(tǒng)抽樣用樣本估計總體用樣本估計總體變量間的相關關系變量間的相關關系 用樣本用樣本的頻率的頻率分布估分布估計總體計總體分布分布 用樣本數(shù)字用樣本數(shù)字特征估計總特征估計總體數(shù)字特征體數(shù)字特征(平均值、(平均值、方差)方差)線性回歸分析線性回歸分析1第三章第三章 概率(必修概率(必修3 3)古典概型、幾何概型古典概型、幾何概型互斥事件、對立事件互斥事件、對立事件互斥事件概率加法公式、互斥事件概率加

2、法公式、概率的一般加法公式概率的一般加法公式概率的定義概率的定義隨機現(xiàn)象隨機現(xiàn)象事件與基本事件空間事件與基本事件空間23.1 獨立性檢驗獨立性檢驗3 我們經常聽到這些說法:我們經常聽到這些說法: 吸煙對患肺癌有影響;吸煙對患肺癌有影響; 數(shù)學好的人物理一般也很好;數(shù)學好的人物理一般也很好; 性別與是否喜歡數(shù)學課程之間有關系;性別與是否喜歡數(shù)學課程之間有關系; 人的血型會決定人的性格;人的血型會決定人的性格; 星座與人的命運之間有某種聯(lián)系;星座與人的命運之間有某種聯(lián)系;這些說法都有道理嗎?這些說法都有道理嗎?4例例1 為了探究患慢性氣管炎是否與吸煙有關,為了探究患慢性氣管炎是否與吸煙有關,調查了

3、調查了339名名50歲以上的人,調查結果如下歲以上的人,調查結果如下表所示,試問:表所示,試問:50歲以上的人患慢性氣管歲以上的人患慢性氣管炎與吸煙習慣有關嗎?炎與吸煙習慣有關嗎?患慢性氣管炎患慢性氣管炎未患慢性氣管炎未患慢性氣管炎合計合計吸煙吸煙43162205不吸煙不吸煙13121134合計合計562833395 這個例子中給出的表格稱為這個例子中給出的表格稱為22列聯(lián)表,列聯(lián)表,意思是問題中要考慮意思是問題中要考慮50歲以上的人的兩種歲以上的人的兩種狀態(tài):是否吸煙,是否患慢性氣管炎;每狀態(tài):是否吸煙,是否患慢性氣管炎;每種狀態(tài)又分兩種情況:吸煙,不吸煙以及種狀態(tài)又分兩種情況:吸煙,不吸煙

4、以及患慢性氣管炎,未患慢性氣管炎患慢性氣管炎,未患慢性氣管炎 表中排成兩行兩列的數(shù)據(jù)是調查得來的結表中排成兩行兩列的數(shù)據(jù)是調查得來的結果,希望根據(jù)這果,希望根據(jù)這4個數(shù)據(jù)來檢驗上述兩種狀個數(shù)據(jù)來檢驗上述兩種狀態(tài)是否有關態(tài)是否有關 這一檢驗問題就稱為這一檢驗問題就稱為22列聯(lián)表的獨立性列聯(lián)表的獨立性檢驗檢驗6 為了把問題討論清楚,并便于向一般情況為了把問題討論清楚,并便于向一般情況推廣,我們用字母來代替推廣,我們用字母來代替22列聯(lián)表中的列聯(lián)表中的事件和數(shù)據(jù),得到一張用字母來表示的事件和數(shù)據(jù),得到一張用字母來表示的22列聯(lián)表:列聯(lián)表:患慢性氣管炎患慢性氣管炎未患慢性氣管炎未患慢性氣管炎合計合計吸

5、煙吸煙n11n12n1+不吸煙不吸煙n21n22n2+合計合計n+1n+2n7 (1)首先,當吸煙)首先,當吸煙(A)與患慢性氣管炎與患慢性氣管炎(B)無關時,用概率方法進行推理,看看會出無關時,用概率方法進行推理,看看會出現(xiàn)什么結果現(xiàn)什么結果 事件事件A與與B無關什么意思?無關什么意思? 此時應該有此時應該有P(AB)=P(A)P(B)成立成立 我們用字母我們用字母H0表示上式,即表示上式,即H0: P(AB)=P(A)P(B),并稱之為統(tǒng)計假設,并稱之為統(tǒng)計假設8 當當H0成立時,下面的三個式子也都成立:成立時,下面的三個式子也都成立: 根據(jù)概率的統(tǒng)計定義,上面提到的眾多事件根據(jù)概率的統(tǒng)計

6、定義,上面提到的眾多事件的概率都可以用相應的頻率來估計,例如:的概率都可以用相應的頻率來估計,例如: ,P ABP A P BP ABP A P BP ABP A P B9 1111nP ABP AnnnP Bnn的估計為,的估計為,的估計為11111212nnnnnnnnnnnn于是與應該很接近,與應該很接近1022111112122221212222,nnnnnnnnnnnnnnnnnnnnnnnn或者說,應該比較小,11 22111112121112222121222221221nnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnn從而也應該比較小12 (2)上

7、面的表達式)上面的表達式(1)就是統(tǒng)計中非常有用就是統(tǒng)計中非常有用的卡方統(tǒng)計量,它可以化簡為的卡方統(tǒng)計量,它可以化簡為 用它的大小可以決定是否拒絕原來的統(tǒng)計假用它的大小可以決定是否拒絕原來的統(tǒng)計假設設H0 如果算出的卡方值較大,就拒絕如果算出的卡方值較大,就拒絕H0,也就是,也就是拒絕拒絕“事件事件A與與B無關無關”,從而就認為它們是,從而就認為它們是有關的了有關的了 211221221212122n n nn nn n n n13 兩個臨界值:兩個臨界值:3.841與與6.635 經過對卡方統(tǒng)計量分布的研究,已經得到經過對卡方統(tǒng)計量分布的研究,已經得到了這兩個臨界值了這兩個臨界值 當卡方大于

8、當卡方大于3.841時,有時,有95的把握說事件的把握說事件A與與B有關;當卡方大于有關;當卡方大于6.635時,有時,有99的把握說事件的把握說事件A與與B有關,當卡方有關,當卡方3.841時,認為事件時,認為事件A與與B是無關的是無關的P(x0) 0.50 0.40 0.25 0.150.100.05 0.025 0.010 0.005 0.001x00.455 0.708 1.3232.072 2.706 3.841 5.024 6.635 7.879 10.82814 對于例對于例1,最理想的解決辦法是向所有,最理想的解決辦法是向所有50歲歲以上的人做調查,然后對得到的數(shù)據(jù)進行以上的人

9、做調查,然后對得到的數(shù)據(jù)進行統(tǒng)計處理,但這花費的代價太大,實際上統(tǒng)計處理,但這花費的代價太大,實際上是行不通的是行不通的 339個人相對于全體個人相對于全體50歲以上的人,只是一歲以上的人,只是一個小部分個小部分 現(xiàn)在我們用部分對全體作推斷,推斷可能現(xiàn)在我們用部分對全體作推斷,推斷可能正確,也可能錯誤正確,也可能錯誤15 例如我們知道,不少中老年煙民的身體很例如我們知道,不少中老年煙民的身體很好,沒有患慢性氣管炎;而又有很多從不好,沒有患慢性氣管炎;而又有很多從不吸煙的中老年人體質很差,患有慢性氣管吸煙的中老年人體質很差,患有慢性氣管炎炎16 我們有我們有95的把握說事件的把握說事件A與與B有

10、關,是指有關,是指推斷犯錯誤的可能性為推斷犯錯誤的可能性為5,這也常常說成,這也常常說成是是“以以95的概率的概率”,其含義是一樣的,其含義是一樣的 統(tǒng)計的基本思維模式是歸納的,它的特征統(tǒng)計的基本思維模式是歸納的,它的特征之一是通過部分數(shù)據(jù)來推測全體數(shù)據(jù)的性之一是通過部分數(shù)據(jù)來推測全體數(shù)據(jù)的性質質 因此,統(tǒng)計推斷是可能犯錯誤的因此,統(tǒng)計推斷是可能犯錯誤的 我們從數(shù)據(jù)上體現(xiàn)的只是統(tǒng)計上的關系,我們從數(shù)據(jù)上體現(xiàn)的只是統(tǒng)計上的關系,而不是因果關系而不是因果關系17 例例1的解答:的解答:22233943 121 162 137.469205 134 56 2837.4696.635,99%50由的計

11、算公式可知,因為所以我們有的把握說: 歲以上的人患慢性氣管炎與吸煙習慣有關18 注意:注意: 50歲以上吸煙的人一定患慢性氣管炎嗎?歲以上吸煙的人一定患慢性氣管炎嗎? 是不是表示得病概率是百分之九十九?是不是表示得病概率是百分之九十九? 使用卡方統(tǒng)計量作使用卡方統(tǒng)計量作22列聯(lián)表的獨立性檢列聯(lián)表的獨立性檢驗時,要求表中的驗時,要求表中的4個數(shù)據(jù)都要大于個數(shù)據(jù)都要大于5,為,為此,在選取樣本的容量時一定要注意這一此,在選取樣本的容量時一定要注意這一點點19例例2.2.在在500500人身上試驗某種血清預防感冒作用,把他們人身上試驗某種血清預防感冒作用,把他們一年中的感冒記錄與另外一年中的感冒記錄

12、與另外500500名未用血清的人的感冒記名未用血清的人的感冒記錄作比較,結果如表所示。問:該種血清能否起到預防錄作比較,結果如表所示。問:該種血清能否起到預防感冒的作用?感冒的作用?未感冒未感冒感冒感冒合計合計使用血清使用血清258242500未使用血清未使用血清216284500合計合計4745261000解:設解:設H0:感冒與是否使用該血清沒有關系。:感冒與是否使用該血清沒有關系。221000 2582842422167.0756.635474526500500因當因當H0成立時,成立時,26.635的概率約為的概率約為0.01,故有,故有99%的把握認的把握認為該血清能起到預防感冒的作

13、用。為該血清能起到預防感冒的作用。20 P(x0)0.500.400.250.150.100.050.025 0.010 0.005 0.001x00.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828有效有效無效無效合計合計口服口服585840409898注射注射646431319595合計合計1221227171193193解:設解:設H0:藥的效果與給藥方式沒有關系。:藥的效果與給藥方式沒有關系。3896. 19598711224064315819322 因當因當H0成立時,成立時,21.3896的概率大于的概率大于15%

14、,故不能否定假設,故不能否定假設H0,即不能作出藥的效果與給藥方式有關的結論。,即不能作出藥的效果與給藥方式有關的結論。2.072例例3 3:為研究不同的給藥方式(口服與注射)和藥的效:為研究不同的給藥方式(口服與注射)和藥的效果(有效與無效)是否有關,進行了相應的抽樣調查,果(有效與無效)是否有關,進行了相應的抽樣調查,調查的結果列在表中,根據(jù)所選擇的調查的結果列在表中,根據(jù)所選擇的193193個病人的數(shù)個病人的數(shù)據(jù),能否作出藥的效果和給藥方式有關的結論?據(jù),能否作出藥的效果和給藥方式有關的結論?21 P(x0)0.500.400.250.150.100.050.025 0.010 0.00

15、5 0.001x00.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828例例4:氣管炎是一種常見的呼吸道疾病,醫(yī)藥研究人:氣管炎是一種常見的呼吸道疾病,醫(yī)藥研究人員對兩種中草藥治療慢性氣管炎的療效進行對比,員對兩種中草藥治療慢性氣管炎的療效進行對比,所得數(shù)據(jù)如表所示,問:它們的療效有無差異?所得數(shù)據(jù)如表所示,問:它們的療效有無差異?有效有效無效無效合計合計復方江剪刀草復方江剪刀草18461245膽黃片膽黃片919100合計合計27570345解:設解:設H0:兩種中草藥的治療效果沒有差異。:兩種中草藥的治療效果沒有差異。098.

16、11100245702759161918434522 因當因當H0成立時,成立時,210.828的概率為的概率為0.001,故有,故有99.9%的把握認的把握認為,兩種藥物的療效有差異。為,兩種藥物的療效有差異。22 例例5 一臺機器生產的零件長度服從正態(tài)分布一臺機器生產的零件長度服從正態(tài)分布N(5.74,0.082)(單位(單位mm),為了檢驗機器),為了檢驗機器是否處于正常工作狀態(tài),每隔一小時抽取是否處于正常工作狀態(tài),每隔一小時抽取一個零件,測量其長度,某天檢查的頭一個零件,測量其長度,某天檢查的頭5個個零件長度如下:零件長度如下:5.91 5.83 5.71 5.75 5.45試判斷該機

17、器是否處于正常工作狀態(tài)試判斷該機器是否處于正常工作狀態(tài)23 第第5個零件的尺寸落在控制下限以下,表明個零件的尺寸落在控制下限以下,表明小概率事件竟然發(fā)生了,根據(jù)實際推斷原小概率事件竟然發(fā)生了,根據(jù)實際推斷原理,我們有理由懷疑此時機器還在正常生理,我們有理由懷疑此時機器還在正常生產。比如,可能原料有問題,可能操作有產。比如,可能原料有問題,可能操作有誤,可能機器出故障誤,可能機器出故障此時可以停機檢此時可以停機檢修和調整,以免產生大量不合格產品修和調整,以免產生大量不合格產品 假定假定5個零件的尺寸都落在控制上限與控制個零件的尺寸都落在控制上限與控制下限之間,則表明機器處于正常工作狀態(tài),下限之間

18、,則表明機器處于正常工作狀態(tài),可以繼續(xù)生產下去可以繼續(xù)生產下去24例例6 據(jù)調查,某地市場上的假冒品牌香煙占據(jù)調查,某地市場上的假冒品牌香煙占15,某商家聲稱他商店里賣的香煙全是真,某商家聲稱他商店里賣的香煙全是真貨,一顧客決定在他的商店里隨機挑選貨,一顧客決定在他的商店里隨機挑選20包煙,若沒有買到一包假煙,就相信商家包煙,若沒有買到一包假煙,就相信商家的說法。試分析該顧客的做法是否合理的說法。試分析該顧客的做法是否合理25 (1)作統(tǒng)計假設:商店里有假煙)作統(tǒng)計假設:商店里有假煙 (2)在上述假設成立的條件下,計算該顧)在上述假設成立的條件下,計算該顧客買到全部真煙的概率客買到全部真煙的概率 0.039 (3)我們以概率)我們以概率0.961認為商店里沒有假認為商店里沒有假煙煙 當然,如果顧客買的煙中發(fā)現(xiàn)有假煙,自當然,如果顧客買的煙中發(fā)現(xiàn)有假煙,自然就認為假設成立,即商

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論