版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第四章 參數(shù)估計與假設(shè)檢驗統(tǒng)計推斷的基礎(chǔ)理論知識,如概率與統(tǒng)計分布、參數(shù)估計和假設(shè)檢驗在先修課程概率論與數(shù)理統(tǒng)計中已經(jīng)學(xué)習(xí)過了。本章在回顧相關(guān)知識的基礎(chǔ)上,補充講解了必要樣本容量的計算、p 值、參數(shù)估計和假設(shè)檢驗方法的容包括:作和結(jié)果分析等新的內(nèi)容。本章的主要內(nèi)(1)參數(shù)估計的基本和實現(xiàn)。簡單隨機(jī)抽樣情況下必要樣本容量的計算。假設(shè)檢驗的基本原理。假設(shè)檢驗中的值。(5)幾種常用假設(shè)檢驗的實現(xiàn)。一、參數(shù)估計的基本 1、參數(shù)估計的概念和實現(xiàn)參數(shù)估計是指利用樣本信息對總體的數(shù)字特征作出的估計。例如,可以通過估計一部分產(chǎn)品的對整批產(chǎn)品的作出估計,通過一個樣本的數(shù)來對的人口數(shù)做出估計,等等。參數(shù)估計可以分
2、為點估計和區(qū)間估計。點估計指根據(jù)樣本數(shù)據(jù)給出的總體未知參數(shù)的一個估計值。在點估計中,對總體參數(shù)進(jìn)行估計的樣本統(tǒng)計量并不是唯一的,例如可以使用樣值對總體均值作出估計,也可需要對估計量的好壞作出以使用樣本中位數(shù)對總體均值進(jìn)行估計。因此,在參數(shù)估計中評價,這就涉及到估計量的評價準(zhǔn)則問題。常用的估計量評價準(zhǔn)則包括無偏性、有效性、一致性等。無偏性是指估計量的數(shù)學(xué)期望與總體參數(shù)的真實值相等;有效性指的是,在兩個無偏估計量中方差較小的估計量較為有效。一致性是指隨著樣本容量的增大,估計量的取值應(yīng)該越來越接近總體參數(shù)。由于每一個點估計值都來自于一個已經(jīng)被固定的樣本,樣本的隨機(jī)性決定了估計結(jié)果的隨機(jī)性,所以總體參
3、數(shù)真值剛好等于的一個具體的估計值可能性極小。區(qū)間估計的方法則以概率論為基礎(chǔ),在點估計的基礎(chǔ)上給出了一個置信區(qū)間,并給出了這一區(qū)間包含總體真值的概率,比點估計提供了的信息。由于所研究不同,區(qū)間估計中使用的具體計算公式也有所不同。置信區(qū)間是根據(jù)事先確定的置信度 1-給出的總體參數(shù)的一個估計范圍。置信度為 1-的含義是:在同樣的方法得到的所有置信區(qū)間中,有 100(1- )的區(qū)間包含總體參數(shù)的真實值。也可以說,對于計算得到的一個具體區(qū)間,“這個區(qū)間包含總體真實值”這一結(jié)論有 (1-) *100%的可能是正確的。但是說“總體參數(shù)有 95%的概率落入某一區(qū)間”是不嚴(yán)格的,因為總體參數(shù)是非隨機(jī)的。2、總體
4、均值和比例的區(qū)間估計(1)總體均值:根據(jù)總體是否正態(tài)、總體方差是否已知和樣本容量的大小,計算總體均值的置信區(qū)間有不同的公式。在實際中最常用的公式為s 2n 1( )n (2)總體比例:在 n 51 p 時總體比例的置信區(qū)間為。 2下面來看一個用統(tǒng)計計算總體均值置信區(qū)間的例子。兒童電視的贊助商希望了解兒童每周看電視的時間。下面是對 100 名兒童進(jìn)行隨機(jī)均看電視時間 95%的置信區(qū)間。的結(jié)果(小時)。計算平139.721.540.615.543.933.021.015.827.123.819.529.946.431.620.638.021.823.222.035.334.715.023.638.
5、929.128.729.320.336.121.627.016.439.438.741.336.835.527.215.123.419.526.520.524.129.314.731.328.931.215.618.323.420.628.417.024.434.924.09.5 21.0 42.4 13.9 32.8 29.8 32.920.621.333.523.035.719.722.830.022.130.838.623.437.826.522.737.132.524.422.924.517.011.326.926.921.915.143.829.030.226.523.430.827
6、.725.250.3解:把數(shù)據(jù)整理成一列,用用 Excel 分析工具庫的“描述統(tǒng)計”可以得到下表的結(jié)果,可以相應(yīng)計算出置信下限等于 27.191-1.661=25.53;置信上限等于 27.191+1.661=28.852。結(jié)論:有 95%的把握(置信度)認(rèn)為區(qū)間25.53,28.852包含總體的真實值。在 SPSS中使用yzeDescriptive SisticsExplore,對相應(yīng)變量進(jìn)行描述統(tǒng)計分析,可以得到下表。從表中可以直接得到 95%的置信區(qū)間為25.5296,28.8524。2SisticStd. Error時間Mean95%Lower Bounderval for MeanU
7、pper Bound5% Trimmed Mean MedianVarianceStd. Deviation MinimumumRange27.191025.529628.852426.976726.500070.1048.372849.5050.3040.80.83728平均標(biāo)準(zhǔn)誤差中位數(shù) 眾數(shù)標(biāo)準(zhǔn)差方差 峰度 偏度 區(qū)域 最小值最大值求和 觀測數(shù)最大(1)最小(1)27.1910.83728426.523.48.37284170.10446-0.27760.3805840.89.550.32719.110050.39.5置信度(95.0%)1.661353二、 必要樣本容量的計算很顯然,在
8、抽樣中樣本容量越大抽樣誤差越小。由于成本方面的原因,在中總是希望抽取滿足誤差要求的最小的樣本容量。下面根據(jù)置信區(qū)間的相關(guān)知識來看一下必要樣本容量的計算問題。 1、關(guān)于抽樣誤差的幾個概念(1)實際抽樣誤差:樣本估計值與總體真實值之間的絕對離差稱為實際抽樣誤差,用公式| | 表示。由于在實踐中總體參數(shù)的真實值是未知的,因此實際抽樣誤差是不可知的;由于樣本估計值隨樣本而變化,因此實際抽樣誤差是一個隨量。(2)抽樣平均誤差:統(tǒng)計量抽樣分布的標(biāo)準(zhǔn)差簡稱為抽樣平均誤差,它可以用來衡量抽樣誤差的一般水平,也稱為標(biāo)準(zhǔn)誤(standard error)。E( )2 例如對重復(fù)抽樣條件下的簡單隨機(jī)抽樣,有: 。x
9、n通常所說的說“抽樣中可以對抽樣誤差進(jìn)行控制”,就是指的抽樣平均誤差。影響抽樣誤差的包括:總體的差異程度;樣本容量的大小;抽樣的方式方法。(3)最大允許誤差(allowable error):在確定置信區(qū)間時樣值(或樣本比例)加減的量,一般用 E 來表示,也等于置信區(qū)間長度的一半。在英文文獻(xiàn)中也稱為 margin oferror。最大允許誤差是人為確定的,是者可以的誤差水平。置信區(qū)間和最大允許誤差之間的關(guān)系是:置信區(qū)間= 。2、如何確定必要樣本容量?必要樣本容量受以下幾個的影響:、總體標(biāo)準(zhǔn)差??傮w的變異程度越大,必要樣本容量也就越大。、最大允許誤差。最大允許越大,需要的樣本容量越小。、置信度
10、1-。要求的置信度越高,需要的樣本容量越大。、抽樣方式。其它條件相同,在重復(fù)抽樣、不重復(fù)抽樣;簡單隨機(jī)抽樣與分層抽樣等不同抽樣方式下要求的必要樣本容量也不同。簡單隨機(jī)抽樣下估計總體均值時樣本容量的計算公式為Z nn / 2,2/E 2式中的總體方差可以通過以下方式估計:根據(jù)歷史資料確定;通過試驗性估計。簡單隨機(jī)抽樣下估計總體比例時樣本容量的計算公式為:Z 2( E 2( n / 2,2/n式中的總體比例 p 可以通過以下方式估計:根據(jù)歷史資料確定;通過試驗性取為 0.5。這一因為 p=0.5 時p(1-p)取得最大值。估計;在不重復(fù)抽樣時的必要樣本容量要復(fù)抽樣小一些, n n0 。1 n0 N
11、式中n0 是重復(fù)抽樣時的必要樣本容量。下面來看幾個例子。3erquartile Range SkewnessKurtosis11.53.381-.278.241.478(1)需要多大規(guī)模的樣本才能在 90% 的置信水平上保證均值的誤差在 5 之內(nèi)? 前期研究表明總體標(biāo)準(zhǔn)差為 45.Z 1.645 (45)n 219.2220E 252注意在最后取整數(shù)時不是四舍五入,而是向上取整。(2)一家公司想估計某地區(qū)有電腦的家庭所占的比例。該公司希望對比例 p的估計誤差不超過 0.05,要求的可靠程度為 95%,應(yīng)抽多大容量的樣本(沒有可利用的 p估計值)?已知E=0.05,=0.05,Z/2= 1.96
12、,當(dāng)p未知時取為 0.5。解:Z 2( 2n E 2 (.196) (.05)(1 .05)20(.5)2 385(3)你在美林公司的人力資源部工作。你計劃在員工中以求出他們的平均醫(yī)療支出。 你希望有 95% 置信度使得樣準(zhǔn)差約為 $400。需要多大的樣本容量?值的誤差在$50 以內(nèi)。 過去的研究表明標(biāo)Z 1.962 (400)2n 245.86246E 2502三、假設(shè)檢驗的基本原理 1、假設(shè)檢驗的概念假設(shè)檢驗是事先作出關(guān)于總體參數(shù)、分布形式、相互關(guān)系等樣本信息來判斷該命題是否成立(檢驗)。題(假設(shè)),然后通過假設(shè)檢驗可以說是最重要的推斷統(tǒng)計方法,有著非常廣泛的應(yīng)用。例如可以根據(jù)樣本數(shù)據(jù)對一
13、下各類問題進(jìn)行檢驗:產(chǎn)品自動生產(chǎn)線工作是否正常?某種新生產(chǎn)方法是否會降低產(chǎn)品成本? 治療某疾病的新藥是否比舊藥療效更高?廠商聲稱產(chǎn)品質(zhì)量符合標(biāo)準(zhǔn),是否等等。2、假設(shè)檢驗的基本原理?利用假設(shè)檢驗進(jìn)行推斷的基本原理是:小概率事件在一次試驗中幾乎不會發(fā)生。如果對總體的某種假設(shè)是真實的(例如產(chǎn)品一假設(shè)的事件 A(小概率事件,例如抽樣95%),那么不利于或不能支持這=55% )在一次試驗中幾乎不可能發(fā)生的;要是在一次試驗中 A 竟然發(fā)生了(抽樣=55% ),就有理由懷疑該假設(shè)的真實性,拒絕假設(shè)。假設(shè)檢驗采用的是反證法的,從假設(shè)條件出發(fā),如果能夠推導(dǎo)出一個的結(jié)論,就可以證明假設(shè)條件不成立。 3、假設(shè)檢驗的
14、步驟傳統(tǒng)的假設(shè)檢驗需要以下幾個步驟:根據(jù)實際問題提出一對假設(shè)(零假設(shè)和備擇假設(shè));構(gòu)造某個適當(dāng)?shù)臋z驗統(tǒng)計量,并確定其在零假設(shè)成立時的分布;根據(jù)觀測的樣本計算檢驗統(tǒng)計量的值;根據(jù)指定的顯著性水平根據(jù)確定檢驗統(tǒng)計量的臨界值并進(jìn)而給出域;根據(jù)決策規(guī)則得出受零假設(shè)”?!安荒?取一個樣本就有可能或不能零假設(shè)的結(jié)論。注意“不能零假設(shè)”不同于“接零假設(shè)”只是說明根據(jù)現(xiàn)有樣本不能認(rèn)為原假設(shè)有問題,但重新抽原假設(shè)。如果說成“接受零假設(shè)”,就等于說你認(rèn)為原假設(shè)在任何4條件下都是成立的。(1)零假設(shè)和備擇假設(shè)的選擇在假設(shè)檢驗中零假設(shè)和備擇假設(shè)是互斥的,等號必須出現(xiàn)在零假設(shè)中;最常用的有三種情況:雙側(cè)檢驗、左側(cè)檢驗和
15、右側(cè)檢驗。雙側(cè)檢驗左側(cè)檢驗右側(cè)檢驗 在單側(cè)檢驗中,原假設(shè)和備擇假設(shè)設(shè)置不同,有可能得出不同的結(jié)論。在單側(cè)檢驗一般根據(jù)以下幾個原則設(shè)置原假設(shè)和備擇假設(shè):把研究者要證明的假設(shè)作為備擇假設(shè);將所作出的作為原假設(shè);把現(xiàn)狀(Sus Quo)作為原假設(shè);把不能輕易否定的假設(shè)作為原假設(shè)。例如,某種汽車原來平均每加侖可以行駛 24 英里。研究小組提出了一種新工藝來提高每加侖的行駛里程。為了檢驗新的工藝是否有效需要生產(chǎn)了一些產(chǎn)品進(jìn)試。該測試中的零假設(shè)和備擇假設(shè)該如何選?。恳C明的結(jié)論是 24,因此零假設(shè)和備擇假設(shè)的選擇為: 24 : 24某種減肥產(chǎn)品的中聲稱使用其產(chǎn)品平均每周可減輕體重 8 公斤以上。要檢驗這種
16、聲明是否正確你會如何設(shè)定零假設(shè)和備擇假設(shè)?由于該產(chǎn)品的現(xiàn)狀為8,因此零假設(shè)和備擇假設(shè)應(yīng)設(shè)為:H0 :8,H1 :8(2) 檢驗統(tǒng)計量和域檢驗統(tǒng)計量:用來決策(或不能零假設(shè))時依據(jù)的樣本統(tǒng)計量。不同的總體參數(shù)適用的檢驗統(tǒng)計量不同。域:檢驗統(tǒng)計量取值的集合,當(dāng)根據(jù)樣本得到的檢驗統(tǒng)計量的值屬于該集合時,拒絕零假設(shè)。不能值稱為臨界值。零假設(shè)的檢驗統(tǒng)計量取值的集合稱為接受域;劃分域和接受域的數(shù)(3)假設(shè)檢驗中的兩類錯誤在假設(shè)檢驗中可能出現(xiàn)兩類錯誤,如下表。在假設(shè)檢驗中這兩類錯誤是不可避免的;要減小其中的一種錯誤,通常只能通過增加另一種錯誤的方法做到。假設(shè)檢驗中通常首先控制控制第一類錯誤的概率不超過某個小
17、概率水平,在滿足該條件的要求下使犯第二類錯誤的概率盡量小。允許犯第一類錯誤的概率稱為顯著性水平,通常取為 0.01,0.05,0.1。根據(jù)可以確定檢驗統(tǒng)計量的臨界值,從而進(jìn)一步根據(jù)樣本觀測值和臨界值得出檢驗結(jié)論。四、假設(shè)檢驗中的 p 值p值也稱為觀測到的顯著性水平,是能H0 的的最小值。p值幾乎不可能通過手工計算,但在統(tǒng)計中p值的計算非常容易。根據(jù)p值進(jìn)行假設(shè)檢驗與傳統(tǒng)的根據(jù)臨界值的檢驗5決策實際情況H0 為真H0 為假接受H0正確第二類錯誤 ()H0第一類錯誤 ()正確方法完全等價,但由于使用p值更方便,因而在實際應(yīng)用中這種方法已經(jīng)取代了根據(jù)臨界值進(jìn)行檢驗的方法。根據(jù)p值進(jìn)行假設(shè)檢驗時,決策
18、規(guī)則是不變的:p值 時H0 。但是,在在雙側(cè)檢驗和單側(cè)檢驗時p值有不同的計算方法,(1)雙側(cè)檢驗中 p 值的計算分別來看一下。,或者 H (| |。0雙側(cè)檢驗中 值H 0 (| ZZobsobs假設(shè)對總體均值的 z 檢驗中 z 統(tǒng)計量的觀測值等于 1.976,則 p 值為圖中藍(lán)色陰影的面積0.04815??梢钥闯觯?dāng)=0.05 時可以原假設(shè)。1/2 p-值 /21/2 p-值-1.961.96Z0-1.9761.976(2)右側(cè)檢驗中 p 值的計算H 0 (obs ) ,或者 PH 0 ( obs ) 。右側(cè)檢驗中 值假設(shè)對總體均值的 t 檢驗中 t 統(tǒng)計量的觀測值等于 2.94,度等于 7,
19、則 p 值為圖中藍(lán)色陰影的面積 0.01083。可以看出,當(dāng)=0.05 時可以原假設(shè)。p-值t0t2.94t0 0 (7 .89(3)左側(cè)檢驗中 p 值的計算,或者 PH ( 0obs ) 。左側(cè)檢驗中 值H0 (tobs假設(shè)對總體均值的 t 檢驗中 t 統(tǒng)計量的觀測值等于-2.64,由度等于 39,則 p 值為圖中藍(lán)色陰影的面積 0.00593??梢钥闯?,當(dāng)=0.10 時可以原假設(shè)。6p-值t t0-2.64t0 1 (39) 1.30五、幾種常用假設(shè)檢驗方法的實現(xiàn)接下來來看集中常用的假設(shè)檢驗及其實現(xiàn):單個總體均值的 t 檢驗,根據(jù)兩個獨立樣本的 t 檢驗,以及根據(jù)兩個匹配的 t 檢驗。1、
20、單個總體均值的 t 檢驗面的例子中據(jù)樣本能否認(rèn)為有了 100 名兒童進(jìn)行隨機(jī)的每周看電視時間結(jié)果(小時),根該地區(qū)兒童平均看電視的時間等于 25.5 小時?該地區(qū)兒童平均看電視的時間小于 25.5 小時?該地區(qū)兒童平均看電視的時間大于 25.5 小時?在 SPSS 中選擇pare meansOne Sle t-test,進(jìn)行單個樣值的 t檢驗,原假設(shè)設(shè)定為 25.5,SPSS 輸出如下:根據(jù)上表,t 值等于 2.02,Sig=0.046。(1)該地區(qū)兒童平均看電視的時間等于 25.5 小時?根據(jù) SPSS 的計算結(jié)果,雙側(cè)檢驗的 p 值=0.0460.05。7Test Value = 25.5
21、tdfSig. (2-tailed)Mean Difference95%erval of the Difference時間2.02099.0461.69100.02963.3524檢驗的結(jié)論是不能原假設(shè)。023t02.02(3)該地區(qū)兒童平均看電視的時間大于 25.5 小時?H0 : 5 5H1 : 5 5根據(jù)左側(cè)檢驗 p 值的計算公式可以計算出 p 值=0.0230.05,因此不能認(rèn)為兩個總體的方差不相等。在方差相等的條件下,根據(jù)輸出結(jié)果中第一行的 t 檢驗結(jié)果對均值進(jìn)行檢驗。第二行數(shù)據(jù)沒有用。由于 p 值=0.8940.05,因此不能認(rèn)為兩個總體的均值不相等。再看另一個例子。一位統(tǒng)計教師希
22、望選擇統(tǒng)計一個用于統(tǒng)計學(xué)的教學(xué)。有兩個選擇:A 和 B。40 名學(xué)生被隨機(jī)分配用這兩個完成一項統(tǒng)計任務(wù),并同時提供了操作說明。每個學(xué)生完成任務(wù)消耗的時間如下,假設(shè)總體服從正態(tài)分布,試檢驗兩種習(xí)時間是否相等?SPSS 輸出結(jié)果分析如下表:Independent S的平均學(xué)les Test對等方差性的 F 檢驗。原假設(shè)為兩個總體的方差相等。由于 p 值=0.0020.05,因此認(rèn)為兩個總體的方差不相等在方差不相等的條件下,根據(jù)輸出結(jié)果中第二行的 t 檢驗結(jié)果對均值進(jìn)行檢驗,9Levenes Test for Equality ofVariant-test for Equality of MeansFSig.tdfSig. (2-tailed)M
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 專題02化學(xué)實驗基本技能-2023年高考化學(xué)一輪復(fù)習(xí)小題多維練(新高考專用)
- 夢想作文演講稿400字(8篇內(nèi)容范文)
- 2024年腹部外科手術(shù)器械項目成效分析報告
- 2024年新形勢下白酒二批協(xié)議
- 2023年泌尿系統(tǒng)感染用藥項目成效分析報告
- 2023年油基型密封膠項目評價分析報告
- 幼兒園中班總結(jié)報告?zhèn)€人(5篇)
- 2024年攜手共進(jìn):餐飲業(yè)合作伙伴協(xié)議
- 2024年攪拌站工程用混凝土及砂漿采購合同
- 2024年工程機(jī)械租賃全面協(xié)議
- 佛七精進(jìn)念佛容易著魔請看祖師開示及個人感悟
- 中小學(xué)教師信息技術(shù)培訓(xùn)
- 幼兒園中班科學(xué)活動教案《奇妙的感官》
- Yes-or-No-questions-一般疑問課件
- 環(huán)境保護(hù)相關(guān)知識培訓(xùn)專題培訓(xùn)課件
- 復(fù)變函數(shù)與積分變換全套課件
- 腹壁的解剖課件
- 兒科常用藥物與急救藥物-換算方法課件
- 壓花制作(觀賞植物學(xué))課件
- 《夏商周考古》第5章西周文化(4-6節(jié))
- 積累運用表示動作的詞語課件
評論
0/150
提交評論