統(tǒng)計學基礎第九章課件_第1頁
統(tǒng)計學基礎第九章課件_第2頁
統(tǒng)計學基礎第九章課件_第3頁
統(tǒng)計學基礎第九章課件_第4頁
統(tǒng)計學基礎第九章課件_第5頁
已閱讀5頁,還剩56頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第九章假設檢驗第一節(jié) 假設檢驗的一般問題第二節(jié) 單總體參數(shù)的假設檢驗本章內(nèi)容第一節(jié)假設檢驗的一般問題 假設檢驗(hypothesis text)是先對總體參數(shù)提出某種假設,然后進行隨機抽樣,并根據(jù)樣本的信息來驗證該假設是否成立。 假設檢驗可分為參數(shù)檢驗和非參數(shù)檢驗兩種。參數(shù)檢驗是對總體的參數(shù)進行檢驗,可進一步區(qū)分為單總體參數(shù)檢驗和多總體參數(shù)檢驗。而非參數(shù)檢驗是對總體的分布形式、隨機變量獨立性等方面進行檢驗。 本章只討論單總體均值、比例、方差等參數(shù)的檢驗。一、假設檢驗的一般原理 假設檢驗的依據(jù)是小概率原理:在一個已知假設下,如果某個事件發(fā)生的概率非常小,我們通常認為,這個假設可能是不成立的。 小

2、概率原理是對人們?nèi)粘K季S習慣的抽象概括。在日常生活中,人們習慣于把概率非常小的事件,當作在一次觀察中是不可能出現(xiàn)的事件。當然,如果我們認為某個事件是小概率事件,但在一次觀察中卻發(fā)生了,合理的解釋自然是我們原來的看法有問題,也就是說,我們原來認定的事件可能并不是小概率事件。例1:ProCare Industries,Ltd.曾經(jīng)提供了一種稱為“性別選擇”的產(chǎn)品,根據(jù)廣告上的說法,這種產(chǎn)品可以使夫婦“將生一個男孩的概率增加到85,生一個女孩的概率增加到80?!睂τ谙胍泻⒌姆驄D,“性別選擇”就裝在一個藍色的包裝里,對于想要女孩的夫婦,“性別選擇”就裝在一個粉色的包裝里。假設我們對100對想要女孩的

3、夫婦進行了一項實驗,他們都遵照了在“性別選擇”粉色包裝上描述的“戶內(nèi)方便使用說明”。使用常識和非正規(guī)統(tǒng)計學方法來判斷,如果100個嬰兒中包含以下數(shù)量的女孩,我們應該對“性別選擇”的有效性得出什么結(jié)論? 52個女孩 97個女孩答:在100個嬰兒中,正常情況下會有大約50個女孩。52個女孩的結(jié)果接近于50,因此我們不應該認為“性別選擇”產(chǎn)品是有效的。即使100對夫婦沒有使用任何特殊的性別選擇方法,52個女孩這個結(jié)果也可能很容易地發(fā)生。 在100個新生兒中有97個是女孩這個結(jié)果在偶然的情況下是非常不可能發(fā)生的。我們可以用兩種方式來解釋出現(xiàn)97個女孩這一現(xiàn)象:要么是極其罕見的事件偶然出現(xiàn)了,要么是“性

4、別選擇”產(chǎn)品是有效的。因為出現(xiàn)97個女孩的概率極低,所以更有可能的解釋就是這種產(chǎn)品是有效的。 理解了小概率原理,就理解了假設檢驗的思想:首先對總體參數(shù)建立某種假設(稱為原假設)H0,然后經(jīng)過隨機抽樣取得一組樣本數(shù)據(jù),如果根據(jù)樣本數(shù)據(jù)計算的某個統(tǒng)計量(或多個統(tǒng)計量)在原假設H0成立的條件下發(fā)生的概率很小,就拒絕或否定這個原假設并繼而接受其對立面?zhèn)鋼窦僭O。反之,如果該統(tǒng)計量在原假設H0成立的條件下發(fā)生的可能性不是很小,那么就接受原假設。 例2:假設某種飲料的商標上標明的容量為250毫升,標準差為4毫升。如果你從市場上隨機抽取50瓶,發(fā)現(xiàn)其平均含量為248毫升。據(jù)此,可否斷定飲料廠商欺騙了消費者?

5、分析:樣本平均含量低于廠商聲稱的平均含量,其原因不外乎有兩種:一是由抽樣誤差引起的。如果樣本平均數(shù)與總體平均數(shù)之差不大,未超出抽樣誤差范圍,則可認為兩者之差就是由抽樣誤差引起的,飲料廠商不存在欺詐行為。二是由飲料廠商短斤少兩引起的,即飲料廠商存在欺詐行為。在這種情況下,樣本平均數(shù)與總體平均數(shù)之差就會超出抽樣誤差范圍,因為其差異是廠商的有意行為。 抽樣誤差范圍是與概率保證程度相聯(lián)系的。對于正態(tài)分布總體,若取概率保證程度為99%,則樣本平均數(shù)與總體平均數(shù)之差大于抽樣平均誤差的2.33倍,即,也就是說,或發(fā)生的概率只有1%(見圖9-1)。因此,是一個小概率事件,這一事件在100次抽樣中只發(fā)生一次,而

6、對于一次抽樣而言,可認為小概率事件實際上不會發(fā)生。圖9-1 1%概率示意圖(=0.01) 解:在本例中, =248,=4,n=50,假設=250也就是說,對于一次抽樣的結(jié)果,小概率事件發(fā)生了,這是不合常理的,所以可認為總體平均數(shù)250這一假設不成立,即該包裝飲料的容量不足250毫升,廠商有欺詐故意。 二、假設檢驗的步驟 1建立假設 2選擇檢驗統(tǒng)計量及其分布 3確定顯著性水平、臨界值、接受域、拒絕域,計算檢驗統(tǒng)計量的值,檢驗原假設是否成立。建立假設應注意的問題檢驗統(tǒng)計量的選擇檢驗原假設是否成立三、兩類錯誤 假設檢驗容易犯兩類錯誤: 第一類錯誤(tape error ),即“棄真的錯誤”,是指根據(jù)

7、小概率原理,當原假設真時拒絕原假設而犯的錯誤。犯第一類錯誤的概率為,即顯著性水平。 第二類錯誤(tape error ),即“納偽的錯誤”,是指原假設假時沒有拒絕原假設所犯的錯誤 。犯第二類錯誤的概率記為。 應當注意:只有當原假設被拒絕時,才會犯第一類錯誤;只有當原假設未被拒絕時,才會犯第二類錯誤。 決策結(jié)果實際情況原假設H0真原假設H0假未拒絕H0正確決策第二類錯誤拒絕H0第一類錯誤正確決策 兩類錯誤的概率和存在著一定的關系:增大,則減?。粶p小,則增大。我們當然希望犯這兩類錯誤的概率都盡可能的小,但實際上很難做到,唯一的辦法是擴大樣本容量,但擴大樣本容量又受到各種因素的限制,因此我們往往是在

8、兩類錯誤之間進行平衡,以使和控制在能夠接受的范圍內(nèi)。 例3:某研究機構(gòu)估計,某地大學生中手機保有率(大學生中擁有手機的比率)超過80。為驗證這一估計是否正確,該機構(gòu)擬在該地大學生中抽取樣本進行檢驗。 建立的假設為: 原假設H0:80 備擇假設H1:80 試描述第一類錯誤和第二類錯誤的含義。 解:第一類錯誤意味著:該地大學生中手機實際保有率不到80,但樣本結(jié)果卻拒絕了原假設,認為大學生手機保有率超過了80。 第二類錯誤意味著:該地大學生手機實際保有率超過了80,但樣本結(jié)果卻接受了原假設,認為大學生手機保有率不到80。四、利用P值進行假設檢驗 在原假設成立的條件下,檢驗統(tǒng)計量在某樣本中至少達到相應

9、值的概率稱為P值(P-value)。雙側(cè)檢驗:H0:0H1:0P值 左側(cè)檢驗:H0:0H1:0 P值=右側(cè)檢驗:H0:0H1:0 P值=根據(jù)P值進行假設檢驗: 通過樣本觀察數(shù)據(jù)計算檢驗統(tǒng)計量的值,查表得到該統(tǒng)計量值的概率即P值,然后將P值與所給的顯著性水平對比,如果P值小于,則拒絕原假設;如果P值大于,則接受原假設。第二節(jié)單總體參數(shù)的假設檢驗一、單總體均值的檢驗 (一)總體滿足正態(tài)分布N(,2),且方差2已知, 小樣本(n30)時,統(tǒng)計量于是,總體均值的檢驗方法可 采取Z檢驗法。原假設:H0:0備擇假設:H1:0檢驗統(tǒng)計量:拒絕域:雙側(cè)檢驗例4:根據(jù)長期經(jīng)驗,某廠生產(chǎn)的某產(chǎn)品的抗折能力服從正態(tài)

10、分布N(,64 kg2)。現(xiàn)從該廠所生產(chǎn)的一大批產(chǎn)品中隨機地抽取10個樣品,測得其抗折能力(單位:kg)分別為578,572,570,568,570,572,570,572,596,584。請問:這一批產(chǎn)品的平均抗折能力能否被認為是570kg(0.05)?解:根據(jù)題意,可建立假設如下: H0:570 kg H1:570 kg 查標準正態(tài)分布表可知,當顯著性水平0.05時,雙側(cè)檢驗的臨界值為1.96,則拒絕域為(,1.96)(1.96,)。 根據(jù)樣本數(shù)據(jù)可知,樣本均值 ,故檢驗統(tǒng)計量的值 即檢驗統(tǒng)計量的值落入拒絕域之內(nèi),所以要拒絕原假設H0:570 kg,接受備擇假設,也就是說,不能認為這一批產(chǎn)

11、品的平均抗折能力是570 kg。原假設:H0:0備擇假設:H1:0檢驗統(tǒng)計量:拒絕域:ZZ 右側(cè)檢驗例5:能否認為這批產(chǎn)品的平均抗折能力超過570 kg (0.05)? 解:根據(jù)題意可建立假設如下: H0:570 kg H1:570 kg 顯然這是一個右側(cè)檢驗問題,拒絕域應在抽樣分布的右端。查標準正態(tài)分布表可知,在顯著性水平0.05下,臨界值為Z1.65,即拒絕域為(1.65,)。 由于檢驗統(tǒng)計量的值Z2.0561.65,即落入拒絕域之內(nèi),故要拒絕原假設H0:570 kg,接受備擇假設H1:570 kg,也就是說,可以認為這一批產(chǎn)品的平均抗折能力超過570 kg。原假設:H0:0備擇假設:H1

12、:0檢驗統(tǒng)計量:拒絕域:ZZ 左側(cè)檢驗 例6:某食品加工企業(yè)的質(zhì)檢部門規(guī)定,某種食品每包凈重不得少于20 kg。經(jīng)驗表明,該食品的凈重近似服從標準差為1.5 kg的正態(tài)分布。假定從一個由50 包食品構(gòu)成的隨機樣本中得到的平均重量為19.5 kg,問:有無充分證據(jù)說明這些食品的平均重量減少了(0.05)? 解:根據(jù)題意可建立假設如下: H0:20 kg H1:20 kg 這是一個左側(cè)檢驗問題,拒絕域應在抽樣分布的左端。查標準正態(tài)分布表可知,在顯著性水平0.05下,臨界值為Z1.65,即拒絕域為(,1.65)。 由于樣本均值 kg,總體方差2(1.5 kg)2,故檢驗統(tǒng)計量的值為 即檢驗統(tǒng)計量落入

13、了拒絕域,所以要拒絕原假設H0:20 kg,轉(zhuǎn)而接受備擇假設H1:20 kg,即檢驗結(jié)果充分說明這些食品的平均凈重減少了。 Z檢驗可借助于Excel中的ZTEST函數(shù)來進行。步驟是: 打開Excel表,錄入樣本數(shù)據(jù); 點擊插入函數(shù)按鈕“fx”,在出現(xiàn)的函數(shù)分類對話框中選擇“統(tǒng)計”,并在函數(shù)名菜單中選擇函數(shù)“ZTEST”,然后確定。 在所出現(xiàn)的對話框中,Array一欄輸入樣本數(shù)據(jù)所在區(qū)域;X一欄輸入待檢驗參數(shù)0;Sigma一欄輸入已知的總體標準差(若未知,則該欄可不填,系統(tǒng)自動以樣本標準差S代替。 對話框中自動顯示“計算結(jié)果”(或點擊對話框中的“確定”按鈕,在工作表會顯示出計算結(jié)果)。 根據(jù)“計

14、算結(jié)果”計算P值,并與顯著性水平比較。如果P值大于,則接受原假設;如果P值小于,則拒絕原假設,選擇備擇假設。前面雙側(cè)檢驗例子的Excel操作過程: P值=20.019916310.0398小于顯著性水平0.05,故拒絕原假設而選擇備擇假設。 (二)總體滿足正態(tài)分布N(,2),且方差2未知,小樣本(n30)時,統(tǒng)計量于是,對總體均值的檢驗應采取t檢驗法。其中,S為樣本標準差原假設:H0:0備擇假設:H1:0檢驗統(tǒng)計量:拒絕域:雙側(cè)檢驗 例7:某種板材的厚度要求為5 mm,為了解板材生產(chǎn)設備的狀況,隨機抽取了18 塊板材進行檢查,測得其厚度資料如下: 已知板材厚度服從正態(tài)分布,試以0.05的顯著性

15、水平檢驗生產(chǎn)設備性能是否良好。4.604.914.894.914.874.915.025.034.994.804.695.034.964.934.865.015.115.05 解:這是一個雙側(cè)檢驗的問題,可建立假設如下: H0:5 mm H1:5 mm 根據(jù)已知條件,選擇檢驗統(tǒng)計量 根據(jù)樣本數(shù)據(jù),可計算出樣本均值 =4.92 mm,樣本標準差S=0.128 mm,則檢驗統(tǒng)計量的值為t=-2.632。 當顯著性水平0.05,自由度n117時,查t分布表可知雙側(cè)檢驗臨界值為t/2(17)2.1098。顯然檢驗統(tǒng)計量的值落入拒絕域之內(nèi),因此要拒絕原假設,接受備擇假設,說明該生產(chǎn)設備的性能不好。原假設

16、:H0:0備擇假設:H1:0檢驗統(tǒng)計量:拒絕域:tt(n1) 右側(cè)檢驗 例8:從某種蔬菜中隨機抽取9件樣品檢測其農(nóng)藥含量,測得某種農(nóng)藥成分的平均值為0.325 mg/kg,標準差為0.068 mg/kg,國家衛(wèi)生標準規(guī)定,蔬菜中農(nóng)藥殘留量應0.3 mg/kg。假定蔬菜中該種農(nóng)藥殘留量服從正態(tài)分布,問該種蔬菜中農(nóng)藥殘留量是否超標(0.05)?解:根據(jù)題意可建立假設如下: H0:0.3 mg/kg H1:0.3 mg/kg 由已知條件可知,應進行右側(cè)t檢驗,檢驗統(tǒng)計量 根據(jù)t分布表可知,當顯著性水平0.05時,右側(cè)檢驗臨界值為t(8)1.86,即拒絕域為(1.86,)。 根據(jù)樣本數(shù)據(jù)計算得檢驗統(tǒng)計

17、量的值為1.10291.86,即落入接受域內(nèi),故要接受原假設H0:0.3 mg/kg ,即沒有充分的證據(jù)證明這種蔬菜中農(nóng)藥殘留量超標。原假設:H0:0備擇假設:H1:0檢驗統(tǒng)計量:拒絕域:t-t(n1) 左側(cè)檢驗t檢驗也可借助于Excel中的TDIST函數(shù)計算出P值進行檢驗: 打開Excel表格,點擊“f(x)”命令。 在函數(shù)分類中點擊“統(tǒng)計”,并在函數(shù)名菜單下選擇“TDIST”,然后確定。 在出現(xiàn)的對話框中,X一欄填入檢驗統(tǒng)計量t的絕對值,Deg-freedom一欄填入t分布的自由度,Tails一欄填入“1”或“2”(如果是單側(cè)檢驗填入“1”,如果是雙側(cè)檢驗則填入“2”)。 在對話框填入相應

18、數(shù)據(jù)后,在下方會自動顯示“計算結(jié)果”,此即P值。 將P值與顯著性水平對比,如果大于則接受原假設,如果小于則拒絕原假設而選擇備擇假設。前面例子中對板材厚度進行的t檢驗借助于TDIST函數(shù)計算的結(jié)果見上圖,P值=0.0174819650.05,故要拒絕原假設。 (三)任意總體,大樣本(n30) 此時,根據(jù)中心極限定理可知(總體標準差已知)(總體標準差未知,以樣本標準差S代替)或這時,均值的檢驗仍采取Z檢驗法。二、單總體成數(shù)的檢驗 在二項分布中,當n很大,np和n(1p)都大于5時,可用正態(tài)分布來逼近。也就是說,當n充分大時,樣本成數(shù)p近似服從正態(tài)分布?;诖?,當n充分大時,總體成數(shù)的假設檢驗可采取

19、Z檢驗法。 原假設:H0:0備擇假設:H1:0檢驗統(tǒng)計量:拒絕域:雙側(cè)檢驗重復抽樣條件下 例9:某雜志聲稱其讀者群中有80%為女性。為驗證這一說法是否屬實,某研究部門抽取了由200人組成的一個隨機樣本,發(fā)現(xiàn)有146個女性經(jīng)常閱讀該雜志。分別取顯著性水平=0.05和=0.01,檢驗該雜志讀者群中女性的比例是否為80%?解:根據(jù)題意和已知條件,可建立假設如下: H0:80 H1:80 樣本容量n200,其中女性讀者n0146,故樣本成數(shù)p146/20073 于是檢驗統(tǒng)計量的值為 當顯著性水平0.05時,查標準正態(tài)分布表可知雙側(cè)檢驗臨界值為,即拒絕域為(,1.96)(1.96,)。此時檢驗統(tǒng)計量的值

20、落入拒絕域,要拒絕原假設而選擇備擇假設,即認為該雜志的讀者中女性比例不是80,該雜志的說法不實。原假設:H0:0備擇假設:H1:0檢驗統(tǒng)計量:拒絕域:ZZ 左側(cè)檢驗重復抽樣條件下 例10:某地環(huán)保部門聲稱該地符合廢氣排放標準的工業(yè)企業(yè)至少達 60。但一個關心環(huán)境保護的社會團體不相信這個結(jié)論。于是從該地工業(yè) 企業(yè)中隨機抽出了60家進行檢測,發(fā)現(xiàn)有33家企業(yè)符合廢氣排放標準。試 以顯著性水平0.05檢驗環(huán)保部門的結(jié)論是否屬實? 解:根據(jù)題意可建立假設如下: H0:60 H1:60 n60,n033,則樣本成數(shù)p33/6055 計算檢驗統(tǒng)計量的值Z=0.791 當顯著性水平0.05時,查標準正態(tài)分布

21、表,可知左側(cè)檢驗的臨界值為Z1.65,即拒絕域為(,1.65)。由于檢驗統(tǒng)計量的值落入了接受域,所以沒有充分的理由拒絕原假設,即必須接受原假設成立,可以認為該地符合廢氣排放標準的工業(yè)企業(yè)至少有60,環(huán)保部門的結(jié)論是可信的。原假設:H0:0備擇假設:H1:0檢驗統(tǒng)計量:拒絕域:ZZ 右側(cè)檢驗重復抽樣條件下在非重復抽樣條件下,樣本成數(shù)p的抽樣分布為:這時檢驗統(tǒng)計量可選擇仍然采取Z檢驗法進行檢驗。其中N為總體容量。如果滿足條件Nn,此時非重復抽樣可近似地視作重復抽樣,假設檢驗按重復抽樣條件下的方法進行。三、單總體方差的檢驗(總體服從正態(tài)分布)原假設:H0:202 備擇假設:H1:202 檢驗統(tǒng)計量:拒絕域: 或雙側(cè)檢驗 例11:啤酒生產(chǎn)企業(yè)采用自動生產(chǎn)線灌裝啤酒,每瓶的裝填量為640 ml,但由于受某些不可控因素的影響,每瓶的裝填量會有差異。此時,不僅每瓶的平均裝填量很重要,裝填量的方差同樣

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論