版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、參數(shù)估計假設檢驗統(tǒng)計方法描述統(tǒng)計推斷統(tǒng)計統(tǒng)計估計非參數(shù)估計*第5章抽抽樣推推斷5.1抽樣推斷斷的一般般問題5.2抽樣誤差差5.3參數(shù)估計計5.4樣本容量量的確定定*抽樣推斷斷的過程程總體樣本隨機取樣計算出樣本的均值、樣本比例、樣本方差調查總體均值、總體比例、總體方差等推斷*5.1抽樣推斷斷的一般般問題5.1.1抽樣推斷斷的概念念和特點點5.1.2抽樣推斷斷的基本本范疇5.1.3抽樣分布布*1、概念抽樣推斷斷是在抽抽樣調查查的基礎礎上,根根據(jù)樣本本的情況況來推斷斷總體特特征的一一種統(tǒng)計計分析方方法。2、抽樣推推斷的特特點按照隨機機原則抽抽取樣本本單位(樣品);根據(jù)對樣樣本的調調查對總總體做出出推
2、斷;抽樣誤差差可以事事先計算算并加以以控制。3、抽樣推推斷的適適用場合合無法進行行全面調調查時;進行全面面調查有有困難或或不必要要時;5.1.1抽樣推斷斷的概念念和特點點*1.抽樣框和和抽樣單單位(1)總體和和樣本總體也稱稱母體,是所要要研究的的全部單單位組成成的整體體。一般般用表表示總體體包括的的總體單單位數(shù)。樣本又稱稱子樣,它是從從總體中中隨機抽抽取出來來的一部部分單位位組成的的整體。一般用用n表示樣本本包括的的總體單單位數(shù)。作為推斷斷對象的的總體是是確定的的,而且且是唯一一的;作作為觀察察對象的的樣本不不是確定定的,也也不是唯唯一的。5.1.2抽樣推斷斷的基本本范疇*(2)抽樣框框:抽樣
3、框是是包括全全部總體體單位的的框架,以此代代表總體體,用來從中抽抽取樣本本單位,具體表表現(xiàn)形式式有總體體單位(或其集合)的名單或或目錄、地圖、時間等等。(3)抽樣單單位:抽樣單位位是構成成抽樣框框的基本本要素,它可以以是總體體單位也可以是是總體單單位的集集合。*2.重復抽樣樣和不重重復抽樣樣重復抽樣樣,也叫叫回置抽抽樣/放回抽樣樣,是指指從總體體的個單位位中抽取取一個容容量為n的樣本,每次抽抽出一個個單位后,再將將其放回回總體中中參加下下一次抽抽取,這這樣連續(xù)續(xù)抽n次即得到一一個樣本本 。不重復抽抽樣,也也叫不回回置抽樣樣/不放回抽抽樣,是是指抽中單位不不再放回回總體中中,下一一個樣本本單位只
4、只能從余余下的抽樣單位位中抽取取。*3.樣本容量量和樣本本可能數(shù)數(shù)目樣本容量量:一個個樣本所所包含的的總體單單位數(shù),用n表示,當樣本本容量大大于等于于30時稱為大大樣本,小于30時稱為小樣本。樣本可能能數(shù)目:指按一一定抽樣樣方法和和一定樣樣本容量量從總體中中抽取樣樣本時,所有可可能的樣樣本個數(shù)數(shù),一般般用M表示。*考慮順序序的重復復抽樣的的樣本可可能數(shù)目目:考慮順序序的不重重復抽樣樣的樣本本可能數(shù)數(shù)目:樣本可能能數(shù)目的的計算*不考慮順順序的重重復抽樣樣的可能能樣本數(shù)數(shù)目:不考慮順順序的不不重復抽抽樣的可可能樣本本數(shù)目:客觀現(xiàn)象象中常見見的*4.參數(shù)和統(tǒng)統(tǒng)計量參數(shù):根根據(jù)總體體中各單單位的變變量
5、值計計算的、反映總總體數(shù)量量特征的的特征值值。主要要有總體體均值、成數(shù)或或比例、方差。統(tǒng)計量:根據(jù)樣樣本中各各單位的的變量值值計算的的、反映映樣本數(shù)數(shù)量特征征的特征征值。主主要有樣樣本均值值、成數(shù)數(shù)或比例例、方差差??傮w是確確定的、唯一的的,所以以總體參參數(shù)也是是確定的的、唯一一的;樣樣本是隨隨機的,所以樣樣本統(tǒng)計計量是隨隨機變量量。*總體參數(shù)數(shù)樣樣本統(tǒng)計計量*樣本統(tǒng)計計量的概概率分布布;隨機變量量是樣本本統(tǒng)計量量:樣本均值值,樣本比例例,樣本本方差等等結果來自自容量相相同的所所有可能能樣本;提供了樣樣本統(tǒng)計計量的分分布特征征,是進進行推斷斷的理論論基礎,也是抽抽樣推斷斷科學性性的重要要依據(jù)。
6、5.1.3抽樣分布布(samplingdistribution)*抽樣分布布的形成成(samplingdistribution)總體計算樣本統(tǒng)計量:樣本均值、比例、方差樣本*1.形成過程程從單位數(shù)數(shù)為N的總體中中抽取樣樣本容量量為n的隨機樣樣本,在重復復抽樣的的條件下下,共有有Nn個可能的的樣本,在不重復抽樣樣條件下下,共有有PNn個可能樣樣本;對于每一一個樣本本,我們們都可以以計算出出樣本的的均值;將所有可可能樣本本的樣本本均值根根據(jù)其取取值形成成概率分分布,即可得到到樣本均均值的抽抽樣分布布,它是是推斷總總體均值值的理論基基礎。(一)樣樣本均值值的抽樣樣分布*【例】設一個總總體,總總體單位
7、位數(shù)N=4。4個單位某某一標志志值的取取值分別別為x1=1、x2=2、x3=3、x4=4??傮w的的均值、方差及及分布如如下: 總體分布14230.1.2.3均值和方方差*現(xiàn)從總體體中抽取取n2的簡單隨隨機樣本本,在重重復抽樣樣條件下下,共有有16個樣本。所有樣樣本的結結果為:3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n = 2 的樣本(共16個)*計算出各各樣本的的均值,并給出出樣本均均值的抽抽樣分布布:3.53.02.52.033.02.52.01.524.03.53.02.542.542
8、.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)x樣本均值的抽樣分布1.00.1.2.3P (x )1.53.04.03.52.02.5*2.樣本均值值的數(shù)字字特征*證明:*X= 2.52=1.25總體分布布14230.1.2.3抽樣分布P ( X )1.00.1.2.31.53.04.03.52.02.5XxP(x)結論:1.樣本均值值的均值值(數(shù)學期望望)等于總體體均值;2.樣本均值值的方差差等于總總體方差差的1/n。*樣本均值值的數(shù)學學期望:樣本均值值的方差差:不重復抽抽樣條件件下:*樣本均值值的抽樣樣分布 = 50 =10X總體分布n= 4抽樣分布布Xn=16當總
9、體服服從正態(tài)態(tài)分布N(,2)時,來自自該總體體的所有有容量為為n的樣本的的均值x也服從正正態(tài)分布布,且其其數(shù)學期期望為,方差為為2/n。即xN(,2/n)*中心極限限定理(central limit theorem)當樣本容容量足夠夠大時(n30),樣本均均值的抽抽樣分布布逐漸趨趨于正態(tài)態(tài)分布中心極限限定理:設從均均值為,方差為為2的一個任任意總體體中抽取取容量為為n的樣本,當n充分大時時,樣本本均值的的抽樣分分布近似似服從均均值為、方差為為2/n的正態(tài)分分布。一個任意分布的總體X*的分布趨趨于正態(tài)態(tài)分布的的過程*總體分布布正態(tài)分布布非正態(tài)分分布大樣本小樣本正態(tài)分布布正態(tài)分布布非正態(tài)分分布樣本
10、均值值的抽樣樣分布樣本均值值的抽樣樣分布與與總體分分布的關關系*總體(或樣本)中具有某某種屬性性的單位位與全部部單位總總數(shù)之比:不同性別別的人數(shù)數(shù)與全部部人數(shù)之之比合格品(或不合格格品)與全部產(chǎn)產(chǎn)品總數(shù)數(shù)之比總體比例例表示為為樣本比例例表示為為(二)樣樣本成數(shù)數(shù)(比例例)的抽抽樣分布布*樣本比例例的抽樣樣分布容量相同同的所有有可能樣樣本的樣樣本比例例的概率率分布,當樣本容量量很大時時,樣本本比例的的抽樣分分布可用用正態(tài)分分布近似。樣本比例例的數(shù)學學期望:樣本比例例的方差差重復抽樣樣:不重復抽抽樣:*5.2抽樣誤差差5.2.1抽樣誤差差5.2.2抽樣平均均誤差 *1、概念抽樣誤差差是指由由于隨機
11、機抽樣的的偶然因因素使樣樣本單位位不足以以代表總總體單位位,而引引起的樣樣本統(tǒng)計計量和總總體參數(shù)數(shù)之間的的絕對離離差。()2、影響因因素總體單位位標志值值的離散散程度;樣本容量量的大小?。╪);抽樣方法法(重復復抽樣/不重復抽抽樣);抽樣調查查的組織織方式(簡單隨隨機抽樣樣/分層抽樣樣/等距抽樣樣/整群抽樣樣)。5.2.1抽樣誤差差*1、所有可可能樣本本統(tǒng)計量量與總體體參數(shù)的的平均離離差。2、理論計計算公式式為:上式可以以變換為為:5.2.2抽樣平均均誤差(標準誤誤)由此,樣樣本均值值的抽樣樣平均誤誤差就是是樣本均均值的標標準差。*3、抽樣平平均誤差差的計算算公式:(1)重復抽抽樣條件件下(2
12、)不重復復抽樣條條件下*在總體單單位數(shù)很很大的情情況下,可近似似表示為為:*抽樣推斷斷的標準準誤差(standarderror)樣本統(tǒng)計計量的標標準差,稱為統(tǒng)統(tǒng)計量的的標準誤誤,也稱為標準準誤差;衡量統(tǒng)計計量的離離散程度度,測度度了用樣樣本統(tǒng)計計量估計總體參參數(shù)的精精確程度度;當總體標標準差未知時,可用樣樣本標準準差s代替,在重復抽抽樣條件件下,樣樣本均值值的標準準誤差為為*可以通過過調整樣樣本單位位數(shù)n來控制抽抽樣平均均誤差。例如,將樣本本容量增增加3倍,則平平均誤差差就縮小小一半;而抽樣樣平均誤誤差減少少20%,則樣本本容量就就需要原原來的1.56倍。*5.3參數(shù)估計計5.3.1抽樣推斷斷
13、的內容容5.3.2點估計5.3.3區(qū)間估計計*1、參數(shù)估估計依據(jù)所獲獲得的樣樣本數(shù)據(jù)據(jù),對總總體的數(shù)數(shù)量特征征進行估估計的推推斷方法法稱為參參數(shù)估計計,即根根據(jù)樣本本統(tǒng)計量量來估計計總體參參數(shù)。參數(shù)估計計包括的的內容:如確定定估計值值,確定定估計的的優(yōu)良標標準;確確定估計計值和被被估計參參數(shù)之間間的誤差差范圍以以及在一一定誤差差范圍內內所作推推斷的可可靠性程程度等。2、假設檢檢驗先對總體體的數(shù)量量特征作作某種假假設,再再根據(jù)樣樣本數(shù)據(jù)據(jù)對所作作假設進進行檢驗驗。假設檢驗驗包括的的內容:確定原原假設與與備擇假假設;選選擇檢驗驗統(tǒng)計量量;確定定顯著性性水平;做出決決策。5.3.1抽樣推斷斷的內容容
14、*5.3.2點估計(pointestimate)1、定義:用樣本本統(tǒng)計量量的值直直接作為為總體參參數(shù)的估估計值,稱為為總體參參數(shù)的點點估計2、優(yōu)點:簡便、易行3、缺點:沒有考考慮抽樣樣誤差的的大?。粵]有給給出估計計值接近總體體參數(shù)的的程度;沒有考考慮估計計的概率率保證程程度。*估計量與與估計值值(estimator &estimated value)估計量:用于估估計總體體參數(shù)的的樣本統(tǒng)統(tǒng)計量的的名稱;如樣本均均值、樣樣本比例例(成數(shù))、樣本方方差等參數(shù)用 表示示,估計計量用表表示估計值:根據(jù)樣樣本資料料得出的的估計量量的具體體取值如果樣本本均值x =80,則80就是估計計值*評價估計計量的優(yōu)
15、優(yōu)良標準準無偏性:估計量量的數(shù)學學期望等等于被估估計的總總體參數(shù)數(shù) P( )BA無偏有偏總體參數(shù)*有效性:對同一一總體參參數(shù)的兩兩個無偏偏估計量量,有更更小標準準差的估估計量更更有效。AB 的抽樣分布 的抽樣分布P( )比更有效*一致性:隨著樣樣本容量量的增大大,估計計量的值值越來越越接近被被估計的的總體參參數(shù)。大數(shù)定律律已經(jīng)證證明了:樣本平平均數(shù)和和樣本成成數(shù)都滿滿足一致致性:*1、定義:在點估估計的基基礎上,指出總總體參數(shù)數(shù)的上限限和下限限,即指指出總體體參數(shù)可可能存在在的區(qū)間間范圍,并指出出總體參參數(shù)落在在這一區(qū)區(qū)間的置置信水平平。區(qū)間估計計的三個個要素:點估計值值總體參數(shù)數(shù)與點估估計值
16、的的抽樣誤誤差范圍圍(抽樣樣極限誤誤差)置信水平平/概率保證證程度(1-)5.3.3區(qū)間估計計*2、區(qū)間估估計的一一對矛盾盾:準確性(精度):在點點估計的的基礎上上,給出出總體參參數(shù)估計的一個個區(qū)間范范圍,稱稱為置信信區(qū)間,該區(qū)間間由樣本本統(tǒng)計量加減一一個誤差差范圍而而得到:樣本統(tǒng)計量值 (點估計)置信區(qū)間置信下限置信上限*抽樣極限限誤差抽樣極限限誤差是是根據(jù)統(tǒng)統(tǒng)計研究究任務要要求確定定的可允允許的最最大抽樣樣誤差范范圍,它它等于總總體參數(shù)數(shù)可允許許變動的的上限或或下限與與樣本統(tǒng)統(tǒng)計量的的絕對離離差。我們總是是希望估估計的準準確性越越高越好好,即估估計精度度盡可能能的高,也就是是希望置置信區(qū)間
17、間越窄越越好,或或者抽樣樣極限誤誤差越小小越好。*(2)可靠性性(置信信水平/概率保證證程度):總體體參數(shù)落落在置信區(qū)區(qū)間內的的概率,即樣本本統(tǒng)計量量與總體體參數(shù)的的誤差不超過抽抽樣極限限誤差的的概率。樣本統(tǒng)計計量的抽抽樣分布布能夠根根據(jù)樣本本統(tǒng)計量量與總體體參數(shù)的接近近程度給給出相應應的概率率度量:兩者越越接近概概率越小,差異異越大概概率越大大。*表示為(1-)%為總體參參數(shù)落在在區(qū)間內內的概率率常用的置置信水平平為99%, 95%,90%相應的為0.01,0.05,0.10置信水平平的表示示(confidencelevel)*抽樣推斷斷時,我我們總是是希望估估計的誤誤差范圍圍盡可能能的小,
18、即抽樣樣精度盡盡可能的的高,并并且估計計的置信信水平也也盡可能的大,但事實實上這兩兩者是矛矛盾的:在其他他條件不不變的情況下,提高估估計的置置信水平平,就會會增大抽抽樣極限限誤差(降低估估計的精精度);提高估估計的精精度,就就會減小小置信水平。所所以在區(qū)區(qū)間估計計中,我我們只能能對準確確性和可可靠性中的一個個提出要要求,來來推求另另一要素素的情況況,事實實上抽樣極限誤誤差與置置信水平平之間存存在一一一對應的的關系,知道其中一個個可以求求另外一一個。準確性與與可靠性性的關系系*標準正態(tài)態(tài)分布(standardizenormal distribution)標準正態(tài)態(tài)分布的概率密密度函數(shù)數(shù):隨機變量
19、量具有均均值為0,標準差差為1的正態(tài)分分布;任何一個個一般的正正態(tài)分布布,可通通過下面面的線性性變換轉轉化為標準正正態(tài)分布布;標準正態(tài)態(tài)分布的分布函函數(shù);*標準正態(tài)態(tài)分布概概率圖示示90%的x99.73% 的x95% 的xx一般正態(tài)態(tài)分布的的密度函函數(shù)f(x) =隨機變量量X的頻率=隨機變量量X的均值=隨機變量量X的方差= 3.1415926;e =2.71828一般正態(tài)態(tài)分布概概率圖示示*正態(tài)分布布函數(shù)的的性質圖形是關關于x=對稱鐘形形曲線,且峰值值在x=處;均值和標準差差一旦確定定,分布布的具體體形式也也惟一確確定,不不同參數(shù)數(shù)正態(tài)分分布構成成一個完完整的“正態(tài)分分布族”;均值可取實數(shù)數(shù)軸
20、上的的任意數(shù)數(shù)值,決決定正態(tài)態(tài)曲線的的具體位位置;標標準差決決定曲線線的“陡陡峭”或或“扁平平”程度度。越大,正正態(tài)曲線線扁平;越小,正正態(tài)曲線線越高陡陡峭;當X的取值向向橫軸左左右兩個個方向無無限延伸伸時,曲曲線的兩兩個尾端端也無限限漸近橫橫軸,理理論上永永遠不會會與之相相交;正態(tài)隨機機變量在在特定區(qū)區(qū)間上的的取值概概率由正正態(tài)曲線線下的面面積給出出,而且且其曲線線下的總總面積等等于1。任何一個個一般的正正態(tài)分布布,可通通過下面面的線性性變換轉轉化為標準準正態(tài)分分布*【例】計算以下下概率:(1)XN(50,102),求和和(2)ZN(0,1),求和和(3)正態(tài)分布布概率為為0.05時,求標標
21、準正態(tài)態(tài)累積分分布函數(shù)數(shù)的反函數(shù)數(shù)值z。正態(tài)分布布(例題分析析) *樣本均值值概率分分布圖示示x90%的樣本99.73% 的樣本95% 的樣本根據(jù)中心心極限定定理可知知,*概率度:度量置置信水平平大小的的指標,概率度度大則置置信水平平高,概概率度小小則置信信水平低低。其實質是是以抽樣樣平均誤誤差(標標準誤差差)為標標準去衡衡量抽樣樣極限誤誤差大小小的統(tǒng)計計指標,即抽樣樣極限誤誤差為標標準誤差差的倍數(shù)數(shù)。置信水平平與置信信度之間間的關系系可用下下式表達達:*常用的概概率度和和置信水水平的關關系表置信水平 1-/268.27%0.31730.15865190%0.100.051.64595%0.0
22、50.0251.9695.45%0.0550.0275299%0.010.0052.5899.73%0.00270.001353*3.區(qū)間估計計的方法法方法一:根據(jù)據(jù)給定的的抽樣極極限誤差差,求置置信水平平F(Z)(1)抽取樣本本,計算算巖本統(tǒng)統(tǒng)計量,如計算算樣本平平均數(shù)或或樣本成成數(shù)作為相應總總體參數(shù)數(shù)的估計計值,如果缺少少總體方方差或均均方差資資料,還還應計算樣樣本方差差或均方方差代替替;(2)根據(jù)給定定的抽樣樣極限誤誤差,估估計總體體參數(shù)的的上、下下限;(3)計算抽樣樣平均誤誤差或估估計標準準誤差;(4)將抽樣極極限誤差差除以抽抽樣平均均誤差求求出概率率度Z值,再根根據(jù)Z值查“正態(tài)態(tài)分布
23、概概率表”求出相相應的置置信水平平F(Z)。*方法二:根據(jù)給給定的置置信水平平要求,來推算算抽樣極極限誤差差,然后進行區(qū)間估估計。(1)抽取樣樣本,計計算巖本本統(tǒng)計量量,如計計算樣本本平均數(shù)數(shù)或樣本本成數(shù)作為相相應總體體參數(shù)的的估計值值,如果缺少少總體方方差或均均方差資資料,還應計計算樣本本方差或或均方差差代替;(2)根據(jù)給給定的置信度F(Z)要求,求求得概率率度Z值;(3)計算抽樣樣平均誤誤差u;(4)根據(jù)概概率度Z和抽樣平平均誤差差來推算算抽樣極極限誤差差,再根根據(jù)抽樣極限限誤差求求出被估估計總體體參數(shù)的的上下限限,對總總體參數(shù)數(shù)做區(qū)間間估計。*每包重量(克)包數(shù)組中值149以下10148
24、.51485-1.832.414915020149.52990-0.812.815015150150.575250.22151以上20151.530301.228.8合計1001503076例某外貿公公司出口口一種茶茶葉,規(guī)規(guī)定每包包規(guī)格不不低于150克,現(xiàn)用不重復復抽樣方方法從中中隨機抽抽取1%進行檢驗驗,抽檢檢結果如如表所示:*要求:(1)抽樣極極限誤差差為0.2克,估計計該批茶茶葉每包包平均重重量的區(qū)區(qū)間及其其概率保保證程度度;(2)茶葉包包裝合格格率的誤誤差范圍圍不超過過6%,估計包包裝合格格率的區(qū)區(qū)間及其其概率保保證程度度;(3)要求以以95.45%的概率保保證程度度,估計計該批茶茶
25、葉每包包平均重重量的區(qū)區(qū)間;(4)要求以以95.45%的概率保保證程度度,估計計該批茶茶葉的包包裝合格格率的區(qū)區(qū)間。*(1)上限=150.3+0.2=150.5克下限=150.3-0.2=150.1克*查概率表表:該批茶葉葉每包平平均重量量落在區(qū)區(qū)間150.1,150.5克內,概概率保證證程度為為97.91%。*(2)上限70%+6%76%下限=70%-6%64%查概率表表:該批茶葉葉的包裝裝合格率率落在區(qū)區(qū)間64%,76%內,概率率保證程程度為81.32%。*(3)上限=150.3+0.1734=150.47克下限=150.3-0.1734=150.13克以95.45%的概率保保證程度度估計
26、該該批茶葉葉每包平平均重量量在區(qū)間間150.13,150.47內。*(4)上限=70%+9.12%79.12%下限=70%-9.12%61.88%以95.45%的概率保保證程度度估計該該批茶葉葉包裝合合格率的的區(qū)間為為61.88%,79.12%。*總體均值值的區(qū)間間估計-數(shù)理統(tǒng)計計模式【例】某種零件件的長度度服從正正態(tài)分布布,從某某天生產(chǎn)產(chǎn)一批零零件中按按重復抽抽樣方法法隨機抽抽取9個,測得得其平均均長度為為21.4cm。已知總總體標準準差為=0.15cm。試估計計該批零零件平均均長度的的置信區(qū)區(qū)間,置置信水平平為95%。該批零件件平均長長度的置置信區(qū)間間在21.302cm21.498cm之間
27、。解:已知N(,0.152),n=9, 1- = 95%,z/2=1.96 總體均值 在1-置信水平下的置信區(qū)間為*置信區(qū)間間與置信信水平的的理解總體參數(shù)數(shù)的真值值是固定定的,而而用樣本本構造的的區(qū)間則則是不固固定的,因此置置信區(qū)間間是一個個隨機區(qū)區(qū)間,它它會因樣樣本的不不同而變變化,而而且不是所所有的區(qū)區(qū)間都包包含總體體參數(shù);實際估計計時只抽抽取一個個樣本,此時所所構造的的是與該該樣本相相聯(lián)系的一定置置信水平平(比如95%)下的置信信區(qū)間,一個特定定的區(qū)間間總是“包含”或或“絕對對不包含含”參數(shù)數(shù)的真值值,不存存在“以以多大的的概率包包含總體參參數(shù)”的的問題。我們無法法知道這這個樣本本所產(chǎn)生
28、生的區(qū)間間是否包含總體體參數(shù)的的真值,我們只只能希望望這個區(qū)區(qū)間是大大量包含含總體參參數(shù)真值的的區(qū)間中中的一個個,但它它也可能能是少數(shù)數(shù)幾個不不包含參參數(shù)真值值的區(qū)間中中的一個個;*如果用某某種方法法構造的的所有區(qū)區(qū)間中有有95%的區(qū)間包包含總體體參數(shù)的真值,5%的區(qū)間不不包含總總體參數(shù)數(shù)的真值值,那么么,用該該方法構構造的區(qū)間稱稱為置信信水平為為95%的置信區(qū)區(qū)間;置信水平平只是告告訴我們們在多次次估計得得到的區(qū)區(qū)間中大大概有多多少個區(qū)間包含含了參數(shù)數(shù)的真值值,而不不是針對對所抽取取的這個個樣本所所構建的的區(qū)間而言言的。*從均值為為185的總體中中抽出n=10的20個樣本構構造出總總體均值值
29、的20個置信區(qū)間間我沒有抓抓住參數(shù)數(shù)!點估計值值*假設檢驗驗(hypothesis test)先對總體體的參數(shù)數(shù)(或分布形形式)提出某種種假設,然后利利用樣本信息判判斷假設設是否成成立的統(tǒng)統(tǒng)計方法法。假設檢驗驗的步驟驟:提出原假假設H0;確定適當當?shù)臋z驗驗統(tǒng)計量量;給定顯著著性水平平;計算檢驗驗統(tǒng)計量量的值發(fā)發(fā)生的概概率(P值)或計計算給定定顯著性性水平下下的臨界界值;作出統(tǒng)計計決策。*決策依據(jù)據(jù)邏輯上運運用反證證法,統(tǒng)統(tǒng)計上依依據(jù)小概概率原理理;樣本統(tǒng)計計量越大大或P值越小,則越傾傾向于拒拒絕原假假設在這么小小的概率率下竟然然得到了了這樣的的一個樣樣本,表表明這樣樣的樣本本經(jīng)常出出現(xiàn)。*.因
30、此我們們拒絕假假設= 50. 如果這是總體的真實均值樣本均值值m= 50抽樣分布布H0這個值不像我們應該得到的樣本均值 .20假設檢驗驗圖示*P-值原假設為為真條件件下,抽抽樣分布布中大于于或小于于樣本統(tǒng)統(tǒng)計量的的概率。/ 2 / 2 Z拒絕拒絕H0值臨界值計算出的樣本統(tǒng)計量計算出的樣本統(tǒng)計量臨界值1/2 P 值1/2 P 值*5.4樣本容量量的確定定5.4.1樣本容量量確定的的兩難5.4.2簡單隨機機抽樣條條件下樣樣本容量量的確定定5.4.3總體參數(shù)數(shù)的預先先估計5.4.4確定樣本本容量時時需考慮慮的因素素*5.4.1樣本容量量確定的的兩難樣本容量量較大,收集的的信息就就相對多多,從而而估計
31、精精度較高高,但進進行觀測測所投入入的費用用、人力力及時間間就比較較多;樣本容量量較小,則投入入的費用用、人力力及時間間就相對對節(jié)約,但收集集的信息息也較少少,從而而估計精精度較低低;所以,精精度和費費用對樣樣本量的的影響和和要求是是矛盾的的,不存存在既使使精度最最高又使使費用最最省的樣樣本量。反映精度度的指標標為抽樣樣極限誤誤差,其其中的概概率度Z與置信水水平相關關,只有有抽樣平平均誤差差與樣本本量有關關。*費用與樣樣本量的的關系:費用與n的關系用用費用函函數(shù)來表表示的,簡單隨隨機抽樣樣的條件件下,通通常表現(xiàn)現(xiàn)為:其中:C為總費用用;c0為固定費費用,c1為與樣本本量有關關的可變變費用。抽樣
32、平均均誤差與與樣本量量的關系系:結論:當當樣本量量較小時時,增加加相同的的費用估估計精度度的提高高較明顯顯,當樣樣本量較較大時,增加相同同的費用用估計精精度的提提高效果果不好。*樣本容量量的影響響因素1、總體變變異程度度(、)2、抽樣極極限誤差差(允許許誤差范范圍)3、置信水水平(置置信度、概率保保證程度度)4、抽樣方方法(重重復抽樣樣、不重重復抽樣樣)5、抽樣組組織方式式(簡單單隨機抽抽樣、分分層抽樣樣、等距距抽樣、整群抽抽樣)。*1、估計總總體均值值時樣本本容量的的確定重復抽樣樣不重復抽抽樣5.4.2簡單隨機機抽樣條條件下樣樣本容量量的確定定其中:以上求出出的樣本本量為必必要樣本本量,即即
33、最小樣樣本量,不能整整除時不不采用四四舍五入入的方法法,而是是采用取取大的臨臨近整數(shù)數(shù)的方法法。*重復抽樣樣與不重重復抽樣樣條件下下樣本容容量的變變換:由于重復復抽樣下下的公式式比不重重復抽樣樣下的公公式要簡簡單得多多,所以對不重重復抽樣樣必要樣樣本單位位數(shù)的確確定經(jīng)常常遵循如如下思路路確定:首先計計算重復復抽樣條條件下的的必要樣樣本單位位數(shù),記記為n0;然后判斷是是否成成立,如如果成立立,則取取n=n0,否則,對n進行修正,修修正公式式為:*【例】擁有工商商管理學學士學位位的大學學畢業(yè)生生年薪的的標準差差大約為為2000元,假定定想要估估計年薪薪95%的置信區(qū)區(qū)間,希希望允許許誤差為為400
34、元,應抽抽取樣本本容量為為多大的的樣本?*解:已知=2000,=400,1-=95%,z/2=1.96則即應抽取取97人作為樣樣本。*重復抽樣樣不重復抽抽樣2、估計總總體比例例時樣本本容量的的確定其中:*【例】根據(jù)以往往的生產(chǎn)產(chǎn)統(tǒng)計,某種產(chǎn)產(chǎn)品的合合格率約約為90%,現(xiàn)要求求允許誤誤差為5%,在求95%的置信區(qū)區(qū)間時,應抽取取多少個個產(chǎn)品作作為樣本本?解:已知p=90%,1-=95%,Z/2=1.96,=5%應抽取的的樣本容容量為:應抽取139個產(chǎn)品作作為樣本本。*1.如果有歷歷史資料料,可利利用歷史史資料代代替;如如果有若若干個可可供選擇的歷史史資料,應采用用數(shù)值最最大的一一個;成成數(shù)方差差
35、在完全全缺乏資資料的情況況下,用用0.25代替;2.假如沒有有可供替替代的歷歷史資料料,可以以通過組組織試驗驗性的抽抽樣取得替代資資料:首首先確定定一個可可以承受受的樣本本量n0,調查后后用樣本方差代代替總體體方差進進行計算算,如果果精度跟跟可靠性性達到要要求,則則調查結束束;否則則,計算算為達到到精度要要求所需需樣本量量n,再補抽抽n-n0個單位進進行調查查;4.沒有同類類調查的的經(jīng)驗,時間等等各方面面條件又又不允許許進行預預調查,則只能能通過定定性分析析來確定定總體變變異系數(shù)數(shù)。5.4.3總體方差差的預先先估計*其中,C為變異系系數(shù),r為相對誤誤差。將計算樣樣本容量量的公式式變形得得:*1.研究問題題的重要要性。對對于決策策比較重重要的問問題樣本本量要大大一些;2.所研究問問題目標標量的個個數(shù)。如如果所研研究的問問題目標標量較多多,樣本本量應適適當放大大;3.調查表或或調查問問卷的回回收率;4.有效樣本本數(shù);5.資源限制制:調查查項目的的經(jīng)費、時間要要求以及及調查人人員的限限制。5.4.4確定樣本本容量時時需要考考慮的其其它因素素*5.5其它參數(shù)數(shù)估計與與假設檢檢驗內容容5.5.1一個總體體均值5.5.2兩個
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 學校安全重點部位實驗室檢查記錄表
- 高一化學教案:專題第二單元第三課時燃料燃燒釋放的熱量
- 2024高中物理章末質量評估一含解析粵教版選修1-1
- 2024高中語文開學第一課學生觀后感范文800字少年強中國強素材
- 2024高中語文精讀課文二第4課1貝多芬:扼住命運的咽喉一課堂練習含解析新人教版選修中外傳記蚜
- 2024高考化學一輪復習第十二章物質結構與性質第一講原子結構與性質規(guī)范演練含解析新人教版
- 2024高考歷史一輪復習方案專題十五西方人文精神的起源和發(fā)展專題整合備考提能教學案+練習人民版
- 2025新人教版英語七年級下單詞表(小學部分)
- (2篇)2024初中英語教師工作總結初中英語教師述職報告
- 倉庫管理制度通知
- 基本藥物制度政策培訓課件
- 2025年中國華能集團限公司校園招聘高頻重點提升(共500題)附帶答案詳解
- GB/T 45002-2024水泥膠砂保水率測定方法
- 廣東省廣州海珠區(qū)2023-2024學年八年級上學期期末數(shù)學試卷(含答案)
- 飛行原理(第二版) 課件 第10章 高速空氣動力學基礎
- 廣西《乳腺X射線數(shù)字化體層攝影診療技術操作規(guī)范》
- 山西省2024年中考道德與法治真題試卷(含答案)
- 酒店會議室設備安裝及調試方案
- 2024年新疆(兵團)公務員考試《行測》真題及答案解析
- JGJ120-2012建筑基坑支護技術規(guī)程-20220807013156
- 英語代詞專項訓練100(附答案)含解析
評論
0/150
提交評論