實(shí)驗(yàn)四區(qū)間估計(jì)與假設(shè)檢驗(yàn)_第1頁
實(shí)驗(yàn)四區(qū)間估計(jì)與假設(shè)檢驗(yàn)_第2頁
實(shí)驗(yàn)四區(qū)間估計(jì)與假設(shè)檢驗(yàn)_第3頁
實(shí)驗(yàn)四區(qū)間估計(jì)與假設(shè)檢驗(yàn)_第4頁
實(shí)驗(yàn)四區(qū)間估計(jì)與假設(shè)檢驗(yàn)_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、實(shí)驗(yàn)4 區(qū)間估計(jì)與假設(shè)檢驗(yàn) 利用樣本對總體進(jìn)行統(tǒng)計(jì)推斷,主要有兩類問題:一類是估計(jì)問題,另一類是檢驗(yàn)問題。參數(shù)估計(jì)是根據(jù)樣本的統(tǒng)計(jì)量來對總體的參數(shù)進(jìn)行估計(jì),假設(shè)檢驗(yàn)則是利用樣本的統(tǒng)計(jì)量來檢驗(yàn)事先對總體參數(shù)或分布特性所作的假設(shè)是否正確。利用SAS軟件中的INSIGHT模塊和“分析家”功能以及編程的方法,均可以在不同的置信水平下求出總體參數(shù)的置信區(qū)間,在不同的檢驗(yàn)(顯著)水平下對總體的參數(shù)和分布特性進(jìn)行檢驗(yàn)。在對總體參數(shù)作區(qū)間估計(jì)和假設(shè)檢驗(yàn)之前,常常需要判斷總體分布是否為正態(tài)分布。檢驗(yàn)數(shù)據(jù)是否來自正態(tài)分布總體,應(yīng)用中常用分布擬合圖、QQ圖、分布檢驗(yàn)等方法。4.1 實(shí)驗(yàn)?zāi)康?掌握使用SAS對總體參數(shù)

2、進(jìn)行區(qū)間估計(jì)與假設(shè)檢驗(yàn)方法,掌握使用SAS對總體分布情況進(jìn)行判斷以及正態(tài)性檢驗(yàn)的方法。4.2 實(shí)驗(yàn)內(nèi)容 一、用INSIGHT對總體參數(shù)進(jìn)行區(qū)間估計(jì)與假設(shè)檢驗(yàn) 二、用“分析家”對總體參數(shù)進(jìn)行區(qū)間估計(jì)與假設(shè)檢驗(yàn)三、編程對總體參數(shù)進(jìn)行區(qū)間估計(jì)與假設(shè)檢驗(yàn)四、在INSIGHT和“分析家”模塊中研究分布并使用UNIVARIATE過程對總體分布進(jìn)行正態(tài)性檢驗(yàn)4.3 實(shí)驗(yàn)指導(dǎo)一、用INSIGHT對總體參數(shù)進(jìn)行區(qū)間估計(jì)與假設(shè)檢驗(yàn)圖4-1 數(shù)據(jù)集Mylib.sy4_1【實(shí)驗(yàn)4-1】已知某種燈泡的壽命服從正態(tài)分布,現(xiàn)從一批燈泡中抽取16只,測得其壽命如表4-1(sy4_1.xls)所示:表5-1 某種燈泡的壽命(單

3、位:小時(shí))1510145014801460152014801490146014801510153014701500152015101470求該燈泡平均使用壽命90%、95%及99%的置信區(qū)間,并指出置信區(qū)間長度與置信水平的關(guān)系。 假設(shè)上述數(shù)據(jù)已存放于數(shù)據(jù)集Mylib.sy4_1中,如圖4-1所示,變量sm表示燈泡壽命。 實(shí)驗(yàn)步驟如下: (1) 啟動(dòng)INSIGHT模塊,并打開數(shù)據(jù)集Mylib.sy4_1。 (2) 選擇菜單“Analyze(分析)”“Distribution(Y)(分布)”。在打開的2 / 16“Distribution(Y)”對話框中選定分析變量:sm,如圖4-2左所示。 (3

4、) 單擊“Output”按鈕,在打開的對話框中選中“Basic Confidence interval(基本置信區(qū)間)”復(fù)選框,如圖4-2右。兩次單擊“OK”按鈕,得到結(jié)果,如圖4-3所示。 圖4-2 區(qū)間估計(jì)的設(shè)置圖4-3 95置信區(qū)間 結(jié)果包括一個(gè)名為“95Confidence Intervals(95%置信區(qū)間)”的列表,表中給出了均值(Mean)、標(biāo)準(zhǔn)差(Std Dev)、方差(Variance)的估計(jì)值(Estimate)、置信下限(LCL)和置信上限(UCL)。結(jié)果表明,根據(jù)抽樣樣本,燈泡平均使用壽命的置信水平為95%的置信區(qū)間為(1476.8034,1503.1966)。 (4)

5、 選擇菜單“Tables(表)”“Basic Confidence Interval(基本置信區(qū)間)”“Others(其他)”,在打開的“Basic Confidence Interval”對話框中修改置信水平,如圖4-4所示。 圖4-4 90%、97.5%置信區(qū)間可以看到,由于置信水平的提高,置信區(qū)間的長度在增加?!緦?shí)驗(yàn)4-2】正常人的脈搏平均每分鐘72次,某醫(yī)生測得10例“四乙基鉛中毒”患者的脈搏數(shù)如表4-2(sy4_2.xls)所示:表4-2 “四乙基鉛中毒”患者的脈搏數(shù)(次/min)54676878706667656970 已知人的脈搏次數(shù)服從正態(tài)分布,試問“四乙基鉛中毒”患者的脈搏和

6、正常人的脈搏有無顯著差異(a = 0.05)? 這是一個(gè)單樣本均值的雙邊檢驗(yàn)問題。若為“四乙基鉛中毒”患者脈搏數(shù)的均值,需要通過樣本數(shù)據(jù)檢驗(yàn)如下假設(shè): H0: =72,H1: ¹ 72。圖4-5 數(shù)據(jù)集Mylib.sy4_2 假定上述數(shù)據(jù)存放在數(shù)據(jù)集Mylib.sy4_2中,如圖4-5所示,脈搏次數(shù)用變量cs表示。 使用INSIGHT對均值進(jìn)行檢驗(yàn)的步驟如下: (1) 首先啟動(dòng)INSIGHT,并打開數(shù)據(jù)集Mylib.sy4_2,選擇菜單“Analyze(分析)”“Distribution(Y)(分布)”。 (2) 在打開的“Distribution(Y)”對話框中選定分析變量:選擇變

7、量cs,單擊“Y”按鈕,將變量移到右上方的列表框中。單擊“OK”按鈕,得到變量的描述性統(tǒng)計(jì)量。 (3) 選擇菜單“Tables(表)”“Tests for Location(位置檢驗(yàn))”;在彈出的“Tests for Location”對話框中輸入72,單擊“OK”按鈕得到輸出結(jié)果,如圖4-6所示。 圖4-6 位置檢驗(yàn) 結(jié)果顯示,不等于72的觀測有10個(gè),其中有1個(gè)觀測值大于72。 圖中第一個(gè)檢驗(yàn)為t檢驗(yàn)(Student's t),需要假定變量服從正態(tài)分布,檢驗(yàn)的p值為0.0366,這個(gè)檢驗(yàn)在0.05水平下是顯著的,可認(rèn)為均值與72有顯著差異。第二個(gè)檢驗(yàn)(Sign)是叫做符號檢驗(yàn)的非參

8、數(shù)檢驗(yàn),其p值為0.0215,在0.05水平下是顯著的,第三個(gè)檢驗(yàn)(Sgned Rank)是叫做符號秩檢驗(yàn)的非參數(shù)檢驗(yàn),其p值為0.0410,在0.05水平下也是顯著的。 由于這三個(gè)檢驗(yàn)的結(jié)論中的p值均小于0.05,所以應(yīng)拒絕原假設(shè),即總體的均值與72有顯著差異。因此,可認(rèn)為“四乙基鉛中毒”患者的脈搏和正常人的脈搏有顯著差異。二、用“分析家”對總體參數(shù)進(jìn)行區(qū)間估計(jì)與假設(shè)檢驗(yàn)【實(shí)驗(yàn)4-3】用數(shù)據(jù)集SASUSER.GPA,求總體中女生比例的95的置信區(qū)間(a = 0.05)。 步驟如下: (1) 在“分析家”中打開數(shù)據(jù)集SASUSER.GPA,選擇菜單“Statistics(統(tǒng)計(jì))”“Hypoth

9、esis Tests(假設(shè)檢驗(yàn))”“One Sample Test for a Proportion(單樣本比例檢驗(yàn))”。 (2) 在打開的“One Sample Test for a Proportion”對話框中選擇變量sex,單擊“Variable”,將其移到“Variable”中,單擊“Level of Interest”下拉框右側(cè)的下拉箭頭,選“female”,如圖4-7左所示。 (3) 單擊“Intervals”按鈕,在打開的對話框中選定置信估計(jì)類型和置信水平,如圖4-7右所示。兩次單擊“OK”按鈕,得到結(jié)果,如圖4-8所示。 圖4-7 設(shè)置比例的置信區(qū)間 結(jié)果顯示:變量sex取值

10、為“female”的比例的95%置信區(qū)間為(0.585,0.710)。圖4-8 比例的置信區(qū)間【實(shí)驗(yàn)4-4】生產(chǎn)工序的方差是工序質(zhì)量的一個(gè)重要度量。當(dāng)方差較大時(shí)需要對工序進(jìn)行改進(jìn)以減小方差,現(xiàn)測得兩部機(jī)器生產(chǎn)的部分袋茶重量如表4-3(sy4_4.xls)所示,設(shè)兩個(gè)總體為正態(tài)總體,求兩個(gè)總體方差比的95%的置信區(qū)間(a = 0.01)。表4-3 兩部機(jī)器生產(chǎn)的袋茶重量(單位:克)機(jī)器1機(jī)器23.453.223.903.223.283.353.202.983.703.382.193.303.223.753.283.303.293.053.503.383.353.303.203.332.953.4

11、53.203.343.353.273.163.483.123.283.163.283.203.183.253.303.343.25 步驟如下:圖4-9 數(shù)據(jù)集Mylib.sy5_4 (1) 首先,將表中的數(shù)據(jù)生成數(shù)據(jù)集mylib.sy4_4,如圖4-9所示,兩部機(jī)器生產(chǎn)的袋茶重量分別用兩個(gè)變量jq1和jq2表示。 (2) 在分析家中打開數(shù)據(jù)集mylib.sy4_4后,選擇菜單“Statistics(統(tǒng)計(jì))”“Hypothesis Tests(假設(shè)檢驗(yàn))”“Two-Sample Test for Variance(雙樣本方差檢驗(yàn))”,打開“Two-Sample Test for Variance

12、”對話框。 (3) 在“Groups are in”欄中選擇“Two variables”選項(xiàng),并將變量jq1和jq2分別移至“Group1”和“Group2”框中;如圖4-10左所示。(4) 單擊“Intervals”按鈕,在打開的對話框中選定置信估計(jì)類型和置信水平,如圖4-10右所示。兩次單擊“OK”按鈕,得到分析結(jié)果,如圖4-11所示。 圖4-10 設(shè)置方差比檢驗(yàn)圖4-11 雙樣本方差比的置信區(qū)間 結(jié)果顯示,在95%的置信水平下,兩個(gè)總體方差比的置信區(qū)間為(0.3827,2.3244)。【實(shí)驗(yàn)4-5】某種電子元件的壽命(以小時(shí)記)服從正態(tài)分布。現(xiàn)測得16只元件的壽命如表4-4(sy4_5

13、.xls)所示:表4-4 某種電子元件的壽命159280101212224379179264222362168250149260485170 問是否有理由認(rèn)為元件的平均壽命顯著地大于225小時(shí)(a = 0.05)?圖4-12 數(shù)據(jù)集Mylib.sy4_5 這是一個(gè)單樣本均值的單邊檢驗(yàn)問題。若為元件的平均壽命,需要通過樣本數(shù)據(jù)檢驗(yàn)如下假設(shè): H0: >= 225,H1: < 225。 由于此時(shí)的方差未知,所以使用t檢驗(yàn)法。 假定上述數(shù)據(jù)存放在數(shù)據(jù)集mylib.sy4_5中,燈泡壽命用變量sm表示,如圖4-12所示。 步驟如下: (1) 在“分析家”中打開數(shù)據(jù)集mylib.sy4_5,

14、選擇菜單“Statistics(統(tǒng)計(jì))”“Hypothesis Tests(假設(shè)檢驗(yàn))”“One Sample t test for a Mean(單樣本均值t - 檢驗(yàn))”,打開“One Sample t test for a Mean”對話框。 (2) 選中變量“sm”,單擊“Variable”按鈕,將其移到“Variable”框中,單擊選項(xiàng)按鈕“Mean<”,在假設(shè)框“Mean>=”右邊的文本框中填入原假設(shè)的均值數(shù)據(jù)225,如圖4-13左所示。 (3) 單擊“OK”按鈕,得到結(jié)果如圖4-13右所示。結(jié)果顯示t統(tǒng)計(jì)量的p值為0.743>0.05,所以在0.05的顯著水平下

15、,不能拒絕平均壽命大于225小時(shí)的原假設(shè)。 圖4-13 設(shè)置均值檢驗(yàn)【實(shí)驗(yàn)4-6】有若干人參加了一個(gè)減肥鍛煉,在一年后測量了他們的身體脂肪含量(身體脂肪含量的百分?jǐn)?shù)),結(jié)果如表4-5(sy4_6.xls)所示:表4-5 男女生脂肪含量男生組:13.319208182220312112161224女生組:2226161221.723.221283023 試比較這些人中男性和女性的身體脂肪含量有無顯著差異(a = 0.05)。圖4-14 數(shù)據(jù)集mylib.sy4_6 這是一個(gè)(獨(dú)立)兩樣本均值檢驗(yàn)問題,若1和2分別表示男性和女性身體脂肪的平均含量,則檢驗(yàn)的是: H0:1 2 = 0,H1:1 2

16、¹ 0; 假定數(shù)據(jù)存放在數(shù)據(jù)集mylib.sy4_6中,如圖4-14所示,將男女生脂肪含量的觀測值記在同一分析變量z下,不同的樣本用一個(gè)分類變量g的不同值加以區(qū)分,而且分類變量g只能取兩個(gè)值(“m”表示男,“f”表示女),否則無法進(jìn)行檢驗(yàn)。 分析步驟如下: (1) 在“分析家”中打開數(shù)據(jù)集mylib.sy4_6。 (2) 選擇菜單“Statistics(統(tǒng)計(jì))”“Hypothesis Tests(假設(shè)檢驗(yàn))”“Two Sample t - Test for Means(兩樣本均值的t - 檢驗(yàn))”。 (3) 在打開的“Two Sample t - Test for a Means”對

17、話框中,將變量z和g分別選到“Dependent”和“Group”中,如圖4-15左所示。 (4) 單擊“OK”按鈕,得到結(jié)果如圖4-15右所示。結(jié)果顯示,由于t統(tǒng)計(jì)量的p值 = 0.1031>0.05,所以在0.05的顯著水平下,不能拒絕原假設(shè),可以認(rèn)為男性和女性的身體脂肪含量無顯著差異。 圖4-15 雙樣本均值檢驗(yàn)三、編程對總體參數(shù)進(jìn)行區(qū)間估計(jì)與假設(shè)檢驗(yàn) 利用編程方法重做實(shí)驗(yàn)4-1和實(shí)驗(yàn)4-6?!緦?shí)驗(yàn)4-7】重做實(shí)驗(yàn)4-1。 (1) 生成數(shù)據(jù)集 編程將表4-1中數(shù)據(jù)存放于數(shù)據(jù)集sy4_7中,變量名為sm,代碼如下:data sy4_7; input sm; cards; 1510 1

18、450 1480 1460 1520 1480 1490 1460 1480 1510 1530 1470 1500 1520 1510 1470;run; (2) 計(jì)算該燈泡平均使用壽命95%、99%及90%的置信區(qū)間,代碼如下:proc ttest data = sy4_7;run; 運(yùn)行結(jié)果如圖4-16所示。圖4-16 95%的置信區(qū)間proc ttest data = sy4_7 alpha =0.01;run; 運(yùn)行結(jié)果如圖4-17所示。圖4-17 99%的置信區(qū)間proc ttest data = sy4_7 alpha =0.1;run; 運(yùn)行結(jié)果如圖4-18所示。圖4-18 9

19、0%的置信區(qū)間【實(shí)驗(yàn)4-8】重做實(shí)驗(yàn)4-6 (1) 生成數(shù)據(jù)集 將表4-5中數(shù)據(jù)存放于數(shù)據(jù)集sy4_8中,用變量z表示脂肪含量,分類變量g表示性別,代碼如下:data sy4_8; input z g$ ; cards; 13.3 m 19 m 20 m 8 m 18 m 22 m 20 m 31 m 21 m 12 m 16 m 12 m 24 m 22 f 26 f 16 f 12 f 21.7 f 23.2 f 21 f 28 f 30 f 23 f;run; (2) 均值檢驗(yàn)proc ttest h0 = 0 alpha = 0.05 data=sy4_8; var z; class

20、g;run; 代碼運(yùn)行結(jié)果除了給出變量z在95%置信水平下的均值、標(biāo)準(zhǔn)差的置信區(qū)間外,還給出對假設(shè)H0:1 2 = 0,H1:1 2 ¹ 0,所作的t-檢驗(yàn)的p值,如圖4-19所示。 結(jié)果顯示無論是方差相等還是方差不等,t統(tǒng)計(jì)量的p值都 > 0.05,不能拒絕原假設(shè):1 2 = 0,可以認(rèn)為,男性和女性的身體脂肪含量無顯著差異。圖4-19 樣本均值的t 檢驗(yàn)【實(shí)驗(yàn)4-9】表4-6是一組鳥巢高度數(shù)據(jù)(sy4_9.xls),試用分布擬合圖、QQ圖和分布檢驗(yàn)三種方法說明其是否服從正態(tài)分布。表4-6 鳥巢高度數(shù)據(jù)153.53.57175.75271584.757.54.256.255.

21、7558.596.255.547.58.756.545.253123.754.756.253.252.5 繪制分布擬合圖圖4-20 數(shù)據(jù)集Mylib.sy4_9 假設(shè)上述數(shù)據(jù)存放在數(shù)據(jù)集Mylib.sy4_9中,高度變量名為height,如圖4-20所示。 (1) 在INSIGHT中打開Mylib.sy4_9,選擇菜單“Analyze(分析)”“Distribution (Y)(分布)”,打開“Distribution (Y)”對話框。在數(shù)據(jù)集Mylib.sy4_9的變量列表中,選擇height,然后單擊“Y”按鈕,height被選為分析變量,如圖4-21左所示。 (2) 單擊“Output(

22、輸出)”按鈕,在打開的對話框中單擊“Density Estimation(密度估計(jì))”按鈕(圖4-21右),打開“Density Estimation”對話框,選中“Parametric Estimation(參數(shù)估計(jì))”欄下的“Normal(正態(tài))”復(fù)選框,如圖4-22左所示。 圖4-21 “Distribution (Y)”對話框 圖4-22 密度估計(jì)與擬合圖 三次單擊“OK”按鈕,即可得到變量height的正態(tài)分布密度擬合圖和參數(shù)估計(jì),如圖4-22右與圖4-23所示。圖4-23 height變量的參數(shù)密度估計(jì) 繪制QQ圖 如果在圖4-21右所示的“Distribution (Y)”對話框

23、中選中“Normal QQ Plot(正態(tài)QQ圖)”復(fù)選框,如圖4-24左所示,兩次單擊“OK”,則可以得到正態(tài)QQ圖,如圖4-24右所示。 圖4-24 正態(tài)QQ圖 選擇菜單“Curves(曲線)”“QQ Ref Line(QQ參考線)”,打開“QQ Ref Line”對話框。選擇“Method(方法)”欄下的“Least Squares(最小二乘)”,如圖4-25左,單擊“OK”按鈕得到帶參考線的QQ圖(圖4-25右)。 圖4-25 帶參考線的QQ圖 正態(tài)性檢驗(yàn) 在INSIGHT中繼續(xù)上述操作:選擇菜單“Curves(曲線)”“Test for Distribution(分布檢驗(yàn))”,打開“

24、Test for Distribution”對話框; 對話框中顯示可做的檢驗(yàn)有:Normal(正態(tài)分布)、Lognormal(對數(shù)正態(tài)分布)、Exponential(指數(shù)分布)和Weibull,缺省做正態(tài)分布檢驗(yàn),如圖4-26左所示。 圖4-26 做正態(tài)分布檢驗(yàn) 單擊“OK”按鈕,得到變量height的經(jīng)驗(yàn)分布和擬合的正態(tài)累計(jì)分布曲線圖(圖4-26右),以及正態(tài)分布檢驗(yàn)表(圖4-27)。圖4-27 正態(tài)分布檢驗(yàn)表 結(jié)果分析 從分布擬合圖(圖4-22右)和QQ圖(圖4-25右)可以看出height樣本數(shù)據(jù)與正態(tài)分布有一定的差距。正態(tài)分布檢驗(yàn)結(jié)果匯總在分布檢驗(yàn)表(圖4-27)中,其中列舉了擬合正態(tài)

25、分布的均值6.8788(即樣本均值)和標(biāo)準(zhǔn)差4.7918(即樣本標(biāo)準(zhǔn)差),并提供了Kolmogorov D統(tǒng)計(jì)量的數(shù)值0.2078,而相應(yīng)的p值 <0.01< 0.05 = ,所以應(yīng)拒絕原假設(shè),不能認(rèn)為變量height的總體分布為正態(tài)分布?!緦?shí)驗(yàn)4-10】使用UNIVARIATE編程實(shí)現(xiàn)實(shí)驗(yàn)4-9中鳥巢高度的正態(tài)性檢驗(yàn)proc univariate data = Mylib.sy4_9 normal; var height;run;圖4-28 正態(tài)性檢驗(yàn)運(yùn)行結(jié)果如圖4-28所示。結(jié)果表明,四種統(tǒng)計(jì)量的檢驗(yàn)結(jié)果p值均很小( < 0.05),應(yīng)拒絕原假設(shè),即不能認(rèn)為height服從正態(tài)分布。4.4 上機(jī)演練 【練習(xí)4-1】生成來自標(biāo)準(zhǔn)正態(tài)總體的10000個(gè)隨機(jī)數(shù): (1)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論