假設檢驗完整演示文稿_第1頁
假設檢驗完整演示文稿_第2頁
假設檢驗完整演示文稿_第3頁
假設檢驗完整演示文稿_第4頁
假設檢驗完整演示文稿_第5頁
已閱讀5頁,還剩99頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

假設檢驗完整版演示文稿當前第1頁\共有104頁\編于星期二\23點假設檢驗第一節(jié)、假設檢驗概述第二節(jié)、總體平均數(shù)的假設檢驗(Z、T)第三節(jié)、總體比率的假設檢驗(P)第四節(jié)、總體方差的假設檢驗(卡方、F)當前第2頁\共有104頁\編于星期二\23點第一節(jié)假設檢驗概述1、假設檢驗的基本思想2、假設檢驗的步驟3、兩類錯誤和假設檢驗的規(guī)則當前第3頁\共有104頁\編于星期二\23點RonaldAylmerFisher,英國著名的統(tǒng)計學家,遺傳學家,現(xiàn)代數(shù)理統(tǒng)計的奠基人之一。他在抽樣分布理論、相關回歸分析、多元統(tǒng)計分析、最大似然估計理論,方差分析和假設檢驗有很多的建樹。當前第4頁\共有104頁\編于星期二\23點女士品茶20世紀20年代后期在英國劍橋一個夏日的下午,一群大學的紳士和他們的夫人以及來訪者,正圍坐在戶外的桌旁享用下午的奶茶。奶茶一般是由牛奶和茶混合而成的,調制時候可以先倒茶后倒牛奶,也可以先倒牛奶后倒茶。這時候,一名女士說她能區(qū)分這兩種不同做法的調制出來的奶茶。那么如何檢驗這位女士的說法?為此Fisher進行了研究,從而提出了假設檢驗的思想。當前第5頁\共有104頁\編于星期二\23點1、推廣素質教育以后,教學效果是不是有所提高?(教育統(tǒng)計)2、某種新胃藥是否比以前更有效?(衛(wèi)生統(tǒng)計)3、醉酒駕車認定為刑事犯罪后是否交通事故會減少?(司法統(tǒng)計)4、如何檢測某批種子的發(fā)芽率?(農業(yè)統(tǒng)計)5、海關工作人員如何判定某批產品能夠通關?(海關統(tǒng)計)6、《紅樓夢》后40回作者的鑒定(文學統(tǒng)計)。7、民間借貸的利率為多少?(金融統(tǒng)計)8、興奮劑檢測(體育統(tǒng)計)假設檢驗的應用當前第6頁\共有104頁\編于星期二\23點1、假設檢驗的基本思想

為研究某山區(qū)的成年男子的脈搏均數(shù)是否高于一般成年男子脈搏均數(shù),某醫(yī)生在一山區(qū)隨機抽查了25名健康成年男子,得其脈搏均數(shù)x為74.2次/分,標準差為6.0次/分。根據(jù)大量調查已知一般健康成年男子脈搏均數(shù)為72次/分,能否據(jù)此認為該山區(qū)成年的脈搏均數(shù)μ高于一般成年男子的脈搏均數(shù)μ0?問題1:造成這25名男子脈搏均數(shù)高于一般男子的原因是什么?

當前第7頁\共有104頁\編于星期二\23點問題2、怎樣判斷以上哪個原因是成立的?若x與μ0接近,其差別可用抽樣誤差解釋,x來自于μ0;若x與μ0相差甚遠,其差別不宜用抽樣誤差解釋,則懷疑x不屬于μ0

。由資料已知樣本均數(shù)與總體均數(shù)不等,原因有二:(1)兩者非同一總體,即兩者差異由地理氣候等因素造成,也就是可以說高山成年人的脈搏比一般人的要高;(2)兩者為同一總體,即兩者差異由抽樣誤差造成。檢驗如下假設:原假設:高山成年人脈搏與一般人的脈搏沒有差異:μ=μ0備擇假設:高山成年人脈搏與一般人的脈搏有差異:μ≠μ0當前第8頁\共有104頁\編于星期二\23點假設檢驗的基本概念概念事先對總體參數(shù)或分布形式作出某種假設然后利用樣本信息來以一定的概率判斷原假設是否成立參數(shù)檢驗和非參數(shù)檢驗(第8章的內容)作用一般是對有差異的數(shù)據(jù)進行檢驗,判斷差異是否顯著(概率)如果通過了檢驗,不能拒絕原假設,說明沒有顯著差異,那么這種差異是由抽樣造成的如果不能通過檢驗,則拒絕原假設,說明有顯著差異,這種差異是由系統(tǒng)誤差造成的.證偽不能存真.當前第9頁\共有104頁\編于星期二\23點第一節(jié)假設檢驗概述1、假設檢驗的基本思想2、假設檢驗的步驟3、兩類錯誤和假設檢驗的規(guī)則當前第10頁\共有104頁\編于星期二\23點二、假設檢驗的步驟1、根據(jù)具體的問題,建立原假設和備擇假設2、構造一個合適的統(tǒng)計量,計算其抽樣分布(均值檢驗)3、給定顯著水平和確定臨界值。顯著水平通常取0.1、0.05或0.01。在確定了顯著水平后,根據(jù)統(tǒng)計量的分布就可以確定找出接受區(qū)域和拒絕區(qū)域的臨界值。4、根據(jù)樣本的值計算統(tǒng)計量的數(shù)值并作出決策。如果統(tǒng)計量的值落在拒絕域中,那么就沒有通過檢驗,說明有顯著差異,拒絕原假設。如果統(tǒng)計量的值落在接受域中,通過了假設檢驗,說明這種差異是由于抽樣造成,這個樣本不能拒絕原假設。當前第11頁\共有104頁\編于星期二\23點1、原假設與備擇假設原假設(nullhypothesis):一般研究者想收集證據(jù)予以反對的假設。表示為H0備擇假設(alternativehypothesis):一般研究者想收集證據(jù)予以支持的假設。表示為H1由于假設檢驗中只有在小概率事件發(fā)生的情況下才拒絕原假設,因此在假設檢驗過程中是保護原假設的。有三種形式:(1)雙側檢驗H0:μ=μ0,H1:μ≠μ0(不等,有差異);(2)左側檢驗H0:μ≥

μ0

,H1

:μ<μ0(降低,減少);(3)右側檢驗H0:μ≤μ0,H1:μ>μ0(提高,增加)采用哪種形式要根據(jù)實際問題。當前第12頁\共有104頁\編于星期二\23點某種飲料的易拉罐瓶的標準容量為335毫升,為對生產過程進行控制,質量監(jiān)測人員定期對某個分廠進行檢查,確定這個分廠生產的易拉罐是否符合標準要求。如果易拉罐的平均容量大于或小于335毫升,則表明生產過程不正常。試陳述用來檢驗生產過程是否正常的原假設和備擇假設解:研究者想收集證據(jù)予以證明的假設應該是“生產過程不正?!?。建立的原假設和備擇假設為

H0:

335mlH1:

335ml

當前第13頁\共有104頁\編于星期二\23點

消費者協(xié)會接到消費者投訴,指控品牌紙包裝飲料存在容量不足,有欺騙消費者之嫌。包裝上標明的容量為250毫升。消費者協(xié)會從市場上隨機抽取50盒該品牌紙包裝飲品進行假設檢驗。試陳述此假設檢驗中的原假設和備擇假設。解:消費者協(xié)會的意圖是傾向于證實飲料廠包裝飲料小于250ml。建立的原假設和備擇假設為

H0:

250mlH1:<250ml

當前第14頁\共有104頁\編于星期二\23點【例】一家研究機構估計,某城市中家庭購買有價證券的比率超過30%。為驗證這一估計是否正確,該研究機構隨機抽取了一個50戶組成的樣本進行檢驗,試陳述此問題中的原假設和備擇假設。解:研究者想收集證據(jù)予以支持的假設是“城市中家庭購買有價證券的比率超過30%”。建立的原假設和備擇假設為

H0:

30%H1:

30%當前第15頁\共有104頁\編于星期二\23點根據(jù)樣本觀測結果計算得到的,并據(jù)以對原假設和備擇假設作出決策的某個樣本統(tǒng)計量2、設計檢驗統(tǒng)計量2、標準化的檢驗統(tǒng)計量

當前第16頁\共有104頁\編于星期二\23點總體分布樣本容量σ已知σ未知正態(tài)分布大樣本小樣本*非正態(tài)分布大樣本非正態(tài)小樣本情形不討論。當前第17頁\共有104頁\編于星期二\23點3、拒絕域和接受域的確定

(雙側檢驗)抽樣分布0臨界值臨界值a/2a/2樣本統(tǒng)計量拒絕H0拒絕H01-置信水平拒絕域接受域拒絕域當前第18頁\共有104頁\編于星期二\23點

4、判斷規(guī)則從概率的角度來講,如果統(tǒng)計量取值的概率小于或者等于顯著水平,表明小概率事件發(fā)生了,因此拒絕原假設,反之,不能拒絕原假設。(p值*)如果統(tǒng)計量的值正好落在拒絕域之內,那么拒絕原假設,如果落在接受域之內,則不能拒絕原假設,如果正好等于臨界值,也要拒絕原假設。當前第19頁\共有104頁\編于星期二\23點【例1】一種罐裝飲料采用自動生產線生產,每罐的容量是255ml,標準差為5ml,服從正態(tài)分布。為檢驗每罐容量是否符合要求,質檢人員在某天生產的飲料中隨機抽取了16罐進行檢驗,測得每罐平均容量為257.2ml。取顯著性水平=0.05,檢驗該天生產的飲料容量是否符合標準要求?雙側檢驗綠色健康飲品綠色健康飲品255255當前第20頁\共有104頁\編于星期二\23點H0

=255H1

255=0.05n=16臨界值(Zc):檢驗統(tǒng)計量:z01.96-1.960.025拒絕H0拒絕H00.025決策:不能拒絕H0結論:樣本提供的證據(jù)表明:該天生產的飲料與標準沒有顯著差異,樣本均值與標準的差異是因為隨機因素所引起的。

當前第21頁\共有104頁\編于星期二\23點總體(某種假設)抽樣樣本(觀察結果)檢驗(不能拒絕原假設)(拒絕原假設)小概率事件未發(fā)生小概率事件發(fā)生

3.做法采用邏輯上的反證法依據(jù)統(tǒng)計上的小概率原理(核心是構造小概率事件)當前第22頁\共有104頁\編于星期二\23點假設檢驗中的反證法與數(shù)學中的反證法的比較反證法假設檢驗方法用途證明H1成立判斷H1成立還是H0成立推理過程設H0成立設H0成立尋找矛盾構造小概率事件發(fā)現(xiàn)矛盾—>H1成立小概率事件發(fā)生—>拒絕H0成立沒有發(fā)現(xiàn)矛盾—>證明失敗小概率事件沒有發(fā)生—>不能拒絕H0成立

小概率事件在一次實驗中不可能發(fā)生的事件,如果發(fā)生了,那么就可以拒絕原來的假設。泰力布:等待黑天鵝的人當前第23頁\共有104頁\編于星期二\23點顯著性水平和拒絕域

(單側檢驗)0臨界值a樣本統(tǒng)計量拒絕H0抽樣分布1-置信水平拒絕域接受域當前第24頁\共有104頁\編于星期二\23點顯著性水平和拒絕域

(左側檢驗)0臨界值a樣本統(tǒng)計量拒絕H0抽樣分布1-置信水平觀察到的樣本統(tǒng)計量當前第25頁\共有104頁\編于星期二\23點顯著性水平和拒絕域

(左側檢驗)0臨界值a樣本統(tǒng)計量拒絕H0抽樣分布1-置信水平觀察到的樣本統(tǒng)計量當前第26頁\共有104頁\編于星期二\23點【例2】一種罐裝飲料采用自動生產線生產,每罐的容量是255ml,標準差為5ml,服從正態(tài)分布。換了一批工人后,質檢人員在某天生產的飲料中隨機抽取了16罐進行檢驗,測得每罐平均容量為257.2ml。取顯著性水平=0.05,檢驗該天生產的飲料容量是否增加了?右側檢驗H0

:≤255H1

>255z0拒絕H00.051.645決策:拒絕H0結論:樣本提供的證據(jù)表明:該天生產的飲料與標準有顯著差異,可以認為換工人后容量增加了。

當前第27頁\共有104頁\編于星期二\23點顯著性水平和拒絕域

(右側檢驗)0臨界值a樣本統(tǒng)計量拒絕H0抽樣分布1-置信水平觀察到的樣本統(tǒng)計量當前第28頁\共有104頁\編于星期二\23點顯著性水平和拒絕域

(右側檢驗)0臨界值a樣本統(tǒng)計量抽樣分布1-置信水平拒絕H0當前第29頁\共有104頁\編于星期二\23點第一節(jié)假設檢驗概述1、假設檢驗的基本思想2、假設檢驗的步驟3、兩類錯誤和假設檢驗的規(guī)則當前第30頁\共有104頁\編于星期二\23點三、兩類錯誤和假設檢驗的規(guī)則1. 第Ⅰ類錯誤(棄真錯誤)原假設為真時拒絕原假設第Ⅰ類錯誤的概率記為被稱為顯著性水平2. 第Ⅱ類錯誤(取偽錯誤)原假設為假時未拒絕原假設第Ⅱ類錯誤的概率記為(Beta)當前第31頁\共有104頁\編于星期二\23點H0:無罪假設檢驗中的兩類錯誤陪審團審判裁決實際情況無罪有罪有罪錯誤正確無罪正確錯誤H0檢驗決策實際情況H0為真H0為假拒絕H0第Ⅰ類錯誤(a)正確決策(1-b)未拒絕H0正確決策(1–a)第Ⅱ類錯誤(b)假設檢驗就好像一場審判過程統(tǒng)計檢驗過程當前第32頁\共有104頁\編于星期二\23點H0:藥品為真藥假設檢驗中的兩類錯誤之間的關系真藥假藥拒絕拒絕域大a大棄真正確不拒絕正確接受域小b小取偽寧可錯殺三千,不可放過一個。H0:某次面試為好機會好機會不好的機會拒絕(不去)拒絕域小a小正確不拒絕(去)正確接受域大b大當前第33頁\共有104頁\編于星期二\23點

錯誤和

錯誤的關系你不能同時減少兩類錯誤!只能增加樣本容量。和的關系就像翹翹板,小就大,大就小當前第34頁\共有104頁\編于星期二\23點

四、置信區(qū)間與假設檢驗之間的關系1、根據(jù)置信度1-α構造置信區(qū)間,如果統(tǒng)計量落在置信區(qū)間中,那么接受原假設,如果不在置信區(qū)間中,那么拒絕原假設。2、根據(jù)顯著水平α,可以構建置信度為1-α的置信區(qū)間。當前第35頁\共有104頁\編于星期二\23點一個總體的檢驗Z檢驗(單側和雙側)t檢驗(單側和雙側)Z檢驗(單側和雙側)

2檢驗(單側和雙側)均值一個總體比例方差當前第36頁\共有104頁\編于星期二\23點第二節(jié)總體均值的檢驗一、單個總體均值的檢驗(ZT)二、兩個總體均值檢驗(等方差、異方差)三、兩個非正態(tài)總體均值之差的檢驗(成對檢驗)當前第37頁\共有104頁\編于星期二\23點一、單個正態(tài)總體均值的檢驗確定檢驗統(tǒng)計量的因素:

1、樣本容量的大小

2、總體分布形狀

3、總體方差是否已知主要情形(6種)正態(tài)總體(方差未知,且為小樣本,1種)正態(tài)總體(方差已知,小樣本,1種)大樣本(不論總體是否正態(tài),不論方差是否已知,4種)三種假設檢驗的形式(雙側,左側和右側)當前第38頁\共有104頁\編于星期二\23點(一)總體平均數(shù)的檢驗(小樣本,正態(tài),方差已知)1.假定條件總體服從正態(tài)分布小樣本(n<

30),但是總體方差已知檢驗統(tǒng)計量當前第39頁\共有104頁\編于星期二\23點某機床廠加工一種零件,根據(jù)經(jīng)驗知道,該廠加工零件的橢圓度近似服從正態(tài)分布,其總體均值為0=0.081mm,總體標準差為=0.025。今換一種新機床進行加工,抽取n=200個零件進行檢驗,得到的橢圓度為0.076mm。試問新機床加工零件的橢圓度的均值與以前有無顯著差異?(=0.05)H0:=0.081,H1:

0.081,

=0.05,n=200臨界值(s)(雙側檢驗)Z01.96-1.96.025拒絕H0拒絕H0.025檢驗統(tǒng)計量:決策:拒絕H0結論:有證據(jù)表明新機床加工的零件的橢圓度與以前有顯著差異。當前第40頁\共有104頁\編于星期二\23點均值的單側Z檢驗左側:H0:0H1:<0必須是顯著地低于0,大的值滿足H0,不能拒絕Z0拒絕H0右側:H0:0H1:>0必須顯著地大于0,小的值滿足H0,不能拒絕Z0拒絕H0當前第41頁\共有104頁\編于星期二\23點根據(jù)過去大量資料,某廠生產的燈泡的使用壽命服從正態(tài)分布N~(1020,1002)?,F(xiàn)從最近生產的一批產品中隨機抽取16只,測得樣本平均壽命為1080小時。試在0.05的顯著性水平下判斷這批產品的使用壽命是否有顯著提高?(=0.05)右側檢驗H0

1020H1

>1020z0拒絕H00.051.645決策:在0.05的水平上拒絕H0結論:樣本提供的證據(jù)表明:該天生產的飲料與標準有顯著差異,可以認為試用壽命提高了。

當前第42頁\共有104頁\編于星期二\23點總體均值的檢驗(z檢驗)

(P值的計算與應用)第1步:進入Excel表格界面,直接點擊“f(x)”(粘貼函數(shù))第2步:在函數(shù)分類中點擊“統(tǒng)計”,并在函數(shù)名的菜單下選擇“NORMSDIST”,然后確定第3步:將z的絕對值2.4錄入,得到的函數(shù)值為

0.9918

P值=1-0.9918=

0.0082

P值小于,故拒絕H0當前第43頁\共有104頁\編于星期二\23點總體均值的檢驗(z檢驗)

(P值的圖示)抽樣分布P=0.0082

01.645a=0.05拒絕H01-計算出的樣本統(tǒng)計量=2.4P值當前第44頁\共有104頁\編于星期二\23點【例3】一種罐裝飲料采用自動生產線生產,每罐的容量是255ml,標準差為5ml,服從正態(tài)分布。換了一批工人后,質檢人員在某天生產的飲料中隨機抽取了16罐進行檢驗,測得每罐平均容量為252.8ml。取顯著性水平=0.05,檢驗該天生產的飲料容量是否減少了?左側檢驗H0

:≥255H1

<255-1.64z0拒絕H00.05決策:在0.05水平上拒絕H0結論:樣本提供的證據(jù)表明:該天生產的飲料與標準有顯著差異,可以認為換工人后容量減少了。

當前第45頁\共有104頁\編于星期二\23點總體均值的檢驗(z檢驗)

(P值的計算與應用)第1步:進入Excel表格界面,直接點擊“f(x)”(粘貼函數(shù))第2步:在函數(shù)分類中點擊“統(tǒng)計”,并在函數(shù)名的菜單下選擇“NORMSDIST”,然后確定第3步:將z的絕對值-1.76錄入,得到的函數(shù)值為

0.039204

P值=0.039204

P值小于,故拒絕H0當前第46頁\共有104頁\編于星期二\23點總體均值的檢驗(z檢驗)

(P值的圖示)0-1.64a=0.05z拒絕H0抽樣分布1-計算出的樣本統(tǒng)計量=-1.76P值P=.039204

當前第47頁\共有104頁\編于星期二\23點總體均值的檢驗規(guī)則

(正態(tài),小樣本,方差已知)假設雙側檢驗左側檢驗右側檢驗假設形式H0

:m=m0H1:

mm0H0

:m=m0H1:

m<m0H0:

m=m0

H1:

m>m0統(tǒng)計量

已知拒絕域P值決策拒絕H0練習一當前第48頁\共有104頁\編于星期二\23點(二)總體平均數(shù)檢驗(小樣本,正態(tài),方差未知**)1.假定條件總體服從正態(tài)分布小樣本(n<

30),但總體方差未知檢驗統(tǒng)計量當前第49頁\共有104頁\編于星期二\23點總體均值的檢驗規(guī)則

(正態(tài),方差未知,小樣本情形)假設雙側檢驗左側檢驗右側檢驗假設形式H0

:m=m0H1:

mm0H0

:mm0H1:

m<m0H0:

mm0

H1:

m>m0統(tǒng)計量總體未知拒絕域P值決策拒絕H0當前第50頁\共有104頁\編于星期二\23點【例1】某機器制造的肥皂厚度規(guī)定為5cm,假設肥皂厚度服從正態(tài)分布。今欲了解機器性能是否良好,取16塊肥皂為樣本,測得平均厚度為5.2cm,標準差為0.4cm。問在顯著水平為0.05的水平下,機器是否為良好?雙側檢驗H0

=5H1

5決策:不能拒絕H0結論:認為該機器還是良好的,沒有充分的理由拒絕原假設。

t02.13-2.130.025拒絕H0拒絕H00.025當前第51頁\共有104頁\編于星期二\23點【例2】某機器制造的肥皂厚度規(guī)定為5cm,假設肥皂厚度服從正態(tài)分布。今欲了解機器性能是否良好,取16塊肥皂為樣本,測得平均厚度為5.2cm,標準差為0.4cm。問在顯著水平為0.05的水平下,肥皂的平均厚度是否偏高?右側檢驗H0

:≤5H1

>5決策:拒絕H0結論:認為肥皂的平均厚度偏高。

t(15)0拒絕H00.051.753P值=0.031972<5%,拒絕。當前第52頁\共有104頁\編于星期二\23點一種汽車配件的平均長度要求為12cm,高于或低于該標準均被認為是不合格的。汽車生產企業(yè)在購進配件時,通常是經(jīng)過招標,然后對中標的配件提供商提供的樣品進行檢驗,以決定是否購進。現(xiàn)對一個配件提供商提供的10個樣本進行了檢驗。假定該供貨商生產的配件長度服從正態(tài)分布,在0.05的顯著性水平下,檢驗該供貨商提供的配件是否符合要求?

10個零件尺寸的長度(cm)12.210.812.011.811.912.411.312.212.012.3雙側檢驗:H0

:=12H1

:

12,=0.05,df=10-1=9T(9)02.26-2.260.025拒絕H0拒絕H00.025決策:不拒絕H0,結論:該供貨商提供的零件符合要求

當前第53頁\共有104頁\編于星期二\23點總體均值的檢驗(t檢驗)

(P值的計算與應用)第1步:進入Excel表格界面,直接點擊“f(x)”(粘貼函數(shù))第2步:在函數(shù)分類中點擊“統(tǒng)計”,并在函數(shù)名的菜單下選擇“TDIST”,然后確定第3步:在出現(xiàn)對話框的X欄中輸入計算出的t的絕對值

0.7035,在Deg-freedom(自由度)欄中輸入本例的自由度9,在Tails欄中輸入2(表明是雙側檢驗,如果是單測檢驗則在該欄輸入1)第4步:P值=0.499537958

P值>=0.05,故不拒絕H0

當前第54頁\共有104頁\編于星期二\23點(三)總體均值的檢驗(大樣本)1. 假定條件正態(tài)總體或非正態(tài)總體大樣本(n30)使用

z檢驗統(tǒng)計量2

已知:2

未知:當前第55頁\共有104頁\編于星期二\23點總體均值的檢驗規(guī)則

(大樣本情形)假設雙側檢驗左側檢驗右側檢驗假設形式H0

:m=m0H1:

mm0H0:mm0H1:m<m0H0:

m

m0

H1:

m>m0統(tǒng)計量

已知:

未知:拒絕域P值決策拒絕H0當前第56頁\共有104頁\編于星期二\23點某大學規(guī)定學生每天參加體育鍛煉的時間為25分鐘?,F(xiàn)學校為了調查學生是否達到鍛煉標準,從該校學生中隨機抽取100人,調查到他們平均每天參加體育鍛煉的時間為24分鐘,標準為5分鐘。試以5%的顯著水平檢驗該校學生平均每天的鍛煉時間是否達到規(guī)定。右側檢驗.H0

:

≥25,H1

:

<25,=0.05,n=100決策:拒絕H0結論:樣本提供的證據(jù)表明:學生的鍛煉時間沒有達到規(guī)定。

-1.64z0拒絕H00.05當前第57頁\共有104頁\編于星期二\23點總體均值的檢驗(z檢驗)

(P值的計算與應用)第1步:進入Excel表格界面,直接點擊“f(x)”(粘貼函數(shù))第2步:在函數(shù)分類中點擊“統(tǒng)計”,并在函數(shù)名的菜單下選擇“NORMSDIST”,然后確定第3步:將z的絕對值2錄入,得到的函數(shù)值為

0.9925

P值=(1-0.9925)=0.0075

P值遠遠小于,故拒絕H0當前第58頁\共有104頁\編于星期二\23點【例】一種罐裝飲料采用自動生產線生產,每罐的容量是255ml,標準差為5ml。為檢驗每罐容量是否符合要求,質檢人員在某天生產的飲料中隨機抽取了40罐進行檢驗,測得每罐平均容量為255.8ml。取顯著性水平=0.05,檢驗該天生產的飲料容量是否符合標準要求?z01.96-1.960.025拒絕H0拒絕H00.025雙側檢驗.H0

:=255,H1

:

255,=0.05,n=40決策:不拒絕H0結論:樣本提供的證據(jù)表明:該天生產的飲料符合標準要求

當前第59頁\共有104頁\編于星期二\23點總體均值的檢驗(z檢驗)

(P值的計算與應用)第1步:進入Excel表格界面,直接點擊“f(x)”(粘貼函數(shù))第2步:在函數(shù)分類中點擊“統(tǒng)計”,并在函數(shù)名的菜單下選擇“NORMSDIST”,然后確定第3步:將z的絕對值1.01錄入,得到的函數(shù)值為

0.8437

P值=2*0.8437-1=0.6874

P值遠遠大于,故不能拒絕H0當前第60頁\共有104頁\編于星期二\23點總體均值的檢驗(大樣本)【例】一種機床加工的零件尺寸絕對平均誤差為1.35mm。生產廠家現(xiàn)采用一種新的機床進行加工以期進一步降低誤差。為檢驗新機床加工的零件平均誤差與舊機床相比是否有顯著降低,從某天生產的零件中隨機抽取50個進行檢驗。利用這些樣本數(shù)據(jù),檢驗新機床加工的零件尺寸的平均誤差與舊機床相比是否有顯著降低?(=0.01)左側檢驗50個零件尺寸的誤差數(shù)據(jù)(mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86當前第61頁\共有104頁\編于星期二\23點總體均值的檢驗(大樣本)

(例題分析)H0

1.35H1

<1.35=0.01n=50臨界值(c):檢驗統(tǒng)計量:決策:拒絕H0結論:新機床加工的零件尺寸的平均誤差與舊機床相比有顯著降低-2.33z0拒絕H00.01當前第62頁\共有104頁\編于星期二\23點總體均值的檢驗(z檢驗)

(P值的計算與應用)第1步:進入Excel表格界面,直接點擊“f(x)”第2步:在函數(shù)分類中點擊“統(tǒng)計”,并在函數(shù)名的菜單下選擇“ZTEST”,然后確定第3步:在所出現(xiàn)的對話框Array框中,輸入原始數(shù)據(jù)所在區(qū)域;在X后輸入?yún)?shù)的某一假定值(這里為1.35);在

Sigma后輸入已知的總體標準差(若未總體標準差未知則可忽略不填,系統(tǒng)將自動使用樣本標準差代替)第4步:用1減去得到的函數(shù)值0.995421023

即為P值

P值=1-0.995421023=0.004579

P值<=0.01,拒絕H0當前第63頁\共有104頁\編于星期二\23點總體均值的檢驗(z檢驗)

(P值的圖示)0-2.33a=0.01z拒絕H0抽樣分布1-計算出的樣本統(tǒng)計量=2.6061P值P=0.004579

當前第64頁\共有104頁\編于星期二\23點總體均值的檢驗(2

未知)

(例題分析)【例】某一小麥品種的平均產量為5200kg/hm2

。一家研究機構對小麥品種進行了改良以期提高產量。為檢驗改良后的新品種產量是否有顯著提高,隨機抽取了36個地塊進行試種,得到的樣本平均產量為5275kg/hm2,標準差為120/hm2

。試檢驗改良后的新品種產量是否有顯著提高?(=0.05)右側檢驗當前第65頁\共有104頁\編于星期二\23點總體均值的檢驗(2

未知)

(例題分析)H0

5200H1

>5200=0.05n=36臨界值(c):檢驗統(tǒng)計量:拒絕H0(P=0.000088<

=0.05)改良后的新品種產量有顯著提高決策:結論:z0拒絕H00.051.645當前第66頁\共有104頁\編于星期二\23點總體均值的檢驗(z檢驗)

(P值的圖示)抽樣分布P=0.00008801.645a=0.05拒絕H01-計算出的樣本統(tǒng)計量=3.75P值當前第67頁\共有104頁\編于星期二\23點二、兩個總體均值平均數(shù)之差的檢驗檢驗的類型:(1)雙側檢驗H0:μ1-μ2=D,H1:μ1-μ2

≠D

;(2)左側檢驗H0:μ1-μ2=D,H1

:μ1-μ2

<D;(3)右側檢驗H0:μ1-μ2=D

,H1:μ1-μ2

>D如果D=0,那么檢驗類型簡化為:(1)雙側檢驗H0:μ1=μ2,H1:μ1

μ2(不等,有差異);(2)左側檢驗H0:μ1=μ2,H1

:μ1<μ2

(低)

(3)右側檢驗H0:μ1=μ2

,H1:μ1>μ2(高).當前第68頁\共有104頁\編于星期二\23點兩個總體均值之差的假設檢驗假定條件,兩個總體之間是獨立的,情形(一)兩個總體都服從正態(tài)分布,12,22已知情形(三)若不是正態(tài)分布,兩者都是大樣本(n130和n230)可以用正態(tài)分布來近似。2、使用正態(tài)分布統(tǒng)計量z方差已知方差未知用樣本方差替代當前第69頁\共有104頁\編于星期二\23點兩個總體均值之差的檢驗規(guī)則

(正態(tài)總體方差已知或者大樣本情形)假設雙側檢驗左側檢驗右側檢驗假設形式H0

:m1-m2=0H1:m1-m20

H0

:m1-m20H1:m1-m2<0H0:m1-m20

H1:m1-m2>0統(tǒng)計量12

,22

已知12

,22

未知拒絕域P值決策拒絕H0當前第70頁\共有104頁\編于星期二\23點

【例】某公司對男女職員的平均小時工資進行了調查,獨立抽取了具有同類工作經(jīng)驗的男女職員的兩個隨機樣本,并記錄下兩個樣本的均值、方差等資料如右表。在顯著性水平為0.05的條件下,能否認為男性職員與女性職員的平均小時工資存在顯著差異?

兩個樣本的有關數(shù)據(jù)男性職員女性職員n1=44n2=32x1=75x2=70S12=64S22=42.25H0

:1-2=0H1

:1-2

0結論:拒絕H0,該公司男女職員的平均小時工資之間存在顯著差異

,性別是影響工資的一個因素。z01.96-1.960.025拒絕H0拒絕H00.025當前第71頁\共有104頁\編于星期二\23點二、正態(tài)總體方差未知但12=22**假定條件兩個獨立的小樣本兩個總體都是正態(tài)分布12、

22未知但相等,即12=22檢驗統(tǒng)計量其中:自由度:當前第72頁\共有104頁\編于星期二\23點兩個總體均值之差的檢驗規(guī)則

(正態(tài),方差未知,小樣本情形)假設雙側檢驗左側檢驗右側檢驗假設形式H0

:m1-m2=0H1:m1-m20

H0

:m1-m20H1:m1-m2<0H0:m1-m20

H1:m1-m2>0統(tǒng)計量總體未知拒絕域P值決策拒絕H0當前第73頁\共有104頁\編于星期二\23點【例】甲、乙兩臺機床同時加工某種同類型的零件,已知兩臺機床加工的零件直徑(單位:cm)分別服從正態(tài)分布,并且有12=22

。為比較兩臺機床的加工精度有無顯著差異,分別獨立抽取了甲機床加工的8個零件和乙機床加工的7個零件,通過測量得到如下數(shù)據(jù)。在=0.05的顯著性水平下,樣本數(shù)據(jù)是否提供證據(jù)支持“兩臺機床加工的零件直徑不一致”的看法?兩臺機床加工零件的樣本數(shù)據(jù)(cm)甲20.519.819.720.420.120.019.019.9乙20.719.819.520.820.419.620.2t02.160-2.1600.025拒絕H0拒絕H00.025H0

:m1-m2=0H1

:m

1-m

2

0不能拒絕原假設。因此沒有理由認為甲、乙兩臺機床加工的零件直徑有顯著差異

當前第74頁\共有104頁\編于星期二\23點兩個總體均值之差的檢驗

(用Excel進行檢驗)第1步:將原始數(shù)據(jù)輸入到Excel工作表格中第2步:選擇“工具”下拉菜單并選擇“數(shù)據(jù)分析”選項第3步:在“數(shù)據(jù)分析”對話框中選擇

“t-檢驗:雙樣本等方差假設”第4步:當對話框出現(xiàn)后在“變量1的區(qū)域”方框中輸入第1個樣本的數(shù)據(jù)區(qū)域在“變量2的區(qū)域”方框中輸入第2個樣本的數(shù)據(jù)區(qū)域在“假設平均差”方框中輸入假定的總體均值之差在“”方框中輸入給定的顯著性水平(本例為0.05)

在“輸出選項”選擇計算結果的輸出位置,然后“確定”當前第75頁\共有104頁\編于星期二\23點t-檢驗:雙樣本等方差假設**

變量1變量2平均19.92520.1428571方差0.2164285710.27285714觀測值87合并方差0.242472527假設平均差0df13tStat-0.854848035P(T<=t)單尾0.204056849t單尾臨界1.770933383P(T<=t)雙尾0.408113698t雙尾臨界2.160368652

當前第76頁\共有104頁\編于星期二\23點【例】為檢驗兩種方法組裝產品所需時間的差異,分別對兩種不同的組裝方法各隨機安排12個工人,每個工人組裝一件產品所需的時間(分鐘)下如表。假定兩種方法組裝產品的時間服從正態(tài)分布,但方差未知且不相等。取顯著性水平0.05,能否認為方法1組裝產品的平均數(shù)量明顯地高于方法2?兩個方法組裝產品所需的時間方法1方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.521當前第77頁\共有104頁\編于星期二\23點t-檢驗:雙樣本等方差假設

變量1變量2平均32.528.8方差15.9963636419.3581818觀測值1212合并方差17.67727273假設平均差0df22tStat2.155607659P(T<=t)單尾0.021158417t單尾臨界1.717144335P(T<=t)雙尾0.042316835t雙尾臨界2.073873058

當前第78頁\共有104頁\編于星期二\23點四、12,

22

未知且不相等1222假定條件兩個總體都是正態(tài)分布12,22未知且不相等,即1222樣本容量不相等,即n1n2檢驗統(tǒng)計量自由度:參見:李勇《統(tǒng)計學導論》當前第79頁\共有104頁\編于星期二\23點【例】為檢驗兩種方法組裝產品所需時間的差異,分別對兩種不同的組裝方法各隨機安排12個工人,每個工人組裝一件產品所需的時間(分鐘)下如表。假定兩種方法組裝產品的時間服從正態(tài)分布,但方差未知且不相等。取顯著性水平0.05,能否認為方法1組裝產品的平均數(shù)量明顯地高于方法2?兩個方法組裝產品所需的時間方法1方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.521當前第80頁\共有104頁\編于星期二\23點t-檢驗:雙樣本異方差假設**

變量1變量2平均32.528.8方差15.9963619.35818182觀測值1212假設平均差0df22tStat2.155608P(T<=t)單尾0.021158t單尾臨界1.717144P(T<=t)雙尾0.042317t雙尾臨界2.073873

當前第81頁\共有104頁\編于星期二\23點為比較甲乙兩臺機床的加工精度是否相等,分別獨立抽取了甲機床加工的10個零件和乙機床加工的12個零件的直徑。測得加工零件的直徑數(shù)據(jù)后,利用EXCEL數(shù)據(jù)工具輸出的結果如下:(假設總體方差相等,顯著水平為0.05。)1、請建立原假設和備擇假設。是否有證據(jù)說明甲乙兩機床是否存在差異?請說明理由2、如果顯著水平為0.01,那么(1)中的結論是否有變化?為什么?3、在以上的檢驗中,還需要什么假設?練習當前第82頁\共有104頁\編于星期二\23點t-檢驗:雙樣本異方差假設

變量1變量2平均33.230.06666667方差16.062226.913333333觀測值1012假設平均差0df15tStat2.121026P(T<=t)單尾0.025497t單尾臨界1.75305P(T<=t)雙尾0.050994t雙尾臨界2.13145

當前第83頁\共有104頁\編于星期二\23點第三節(jié)、總體比率檢驗假定條件np>5,nq>5,樣本比率可用正態(tài)分布來近似(大樣本)檢驗的z統(tǒng)計量0為假設的總體比率當前第84頁\共有104頁\編于星期二\23點總體比率的檢驗規(guī)則假設雙側檢驗左側檢驗右側檢驗假設形式H0:=0H1:

0H0

:0H1:

<0H0

0

H1:

>0統(tǒng)計量拒絕域P值決策拒絕H0當前第85頁\共有104頁\編于星期二\23點總體比率的檢驗【例】一種以休閑和娛樂為主題的雜志,聲稱其讀者群中有80%為女性。為驗證這一說法是否屬實,某研究部門抽取了由200人組成的一個隨機樣本,發(fā)現(xiàn)有146個女性經(jīng)常閱讀該雜志。分別取顯著性水平0.05和0.01

,檢驗該雜志讀者群中女性的比率是否為80%?它們的值各是多少?雙側檢驗當前第86頁\共有104頁\編于星期二\23點H0

=80%,H1

80%,

=0.05拒絕H0(P=0.013328<

=0.05),該雜志的說法并不屬實。

z01.96-1.960.025拒絕H0拒絕

H00.025H0

=80%H1

80%,

=0.01不拒絕H0(P=0.013328>=0.01)該雜志的說法屬實z02.58-2.580.025拒絕H0拒絕H00.025當前第87頁\共有104頁\編于星期二\23點1.假定條件兩個總體都服從二項分布可以用正態(tài)分布來近似檢驗統(tǒng)計量檢驗H0:1-2=0檢驗H0:1-2=d0二、兩個總體比率之差的檢驗當前第88頁\共有104頁\編于星期二\23點兩個總體比率之差的檢驗規(guī)則假設雙側檢驗左側檢驗右側檢驗假設形式H0

:1-2=0H1:1-20H0

:1-20

H1:1-2<0

H0:1-20

H1:1-2>0

統(tǒng)計量拒絕域P值決策拒絕H0當前第89頁\共有104頁\編于星期二\23點兩個總體比率之差的檢驗

(例題分析)

【例】一所大學準備采取一項學生在宿舍上網(wǎng)收費的措施,為了解男女學生對這一措施的看法是否存在差異,分別抽取了200名男學生和200名女學生進行調查,其中的一個問題是:“你是否贊成采取上網(wǎng)收費的措施?”其中男學生表示贊成的比率為27%,女學生表示贊成的比率為35%。調查者認為,男學生中表示贊成的比率顯著低于女學生。取顯著性水平=0.05,樣本提供的證據(jù)是否支持調查者的看法?

21netnet當前第90頁\共有104頁\編于星期二\23點兩個總體比率之差的檢驗

(例題分析)H0

:1-2

=0H1

:1-2<0=0.05n1=200,n2=200臨界值(c):檢驗統(tǒng)計量:決策:結論:

拒絕H0(P=0.041837<

=0.05)樣本提供的證據(jù)支持調查者的看法

-1.645Z0拒絕域當前第91頁\共有104頁\編于星期二\23點兩個總體比率之差的檢驗

(例題分析)

【例】有兩種方法生產同一種產品,方法1的生產成本較高而次品率較低,方法2的生產成本較低而次品率則較高。管理人員在選擇生產方法時,決定對兩種方法的次品率進行比較,如方法1比方法2的次品率低8%以上,則決定采用方法1,否則就采用方法2。管理人員從方法1生產的產品中隨機抽取300個,發(fā)現(xiàn)有33個次品,從方法2生產的產品中也隨機抽取300個,發(fā)現(xiàn)有84個次品。用顯著性水平=0.01進行檢驗,說明管理人員應決定采用哪種方法進行生產?

當前第92頁\共有104頁\編于星期二\23點兩個總體比率之差的檢驗

(例題分析)H0

:1-28%H1

:1-2<8%=0.01n1=300,n2=300臨界值(c):檢驗統(tǒng)計量:決策:結論:

拒絕H0(P=1.22E-15<

=0.05)方法1的次品率顯著低于方法2達8%,應采用方法1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論