抽樣推斷的一般問題_第1頁
抽樣推斷的一般問題_第2頁
抽樣推斷的一般問題_第3頁
抽樣推斷的一般問題_第4頁
抽樣推斷的一般問題_第5頁
已閱讀5頁,還剩103頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、參數(shù)估計(jì)假設(shè)檢驗(yàn)統(tǒng)計(jì)方法描述統(tǒng)計(jì)推斷統(tǒng)計(jì)統(tǒng)計(jì)估計(jì)非參數(shù)估計(jì)*第5章抽抽樣推推斷5.1抽樣推斷斷的一般般問題5.2抽樣誤差差5.3參數(shù)估計(jì)計(jì)5.4樣本容量量的確定定*抽樣推斷斷的過程程總體樣本隨機(jī)取樣計(jì)算出樣本的均值、樣本比例、樣本方差調(diào)查總體均值、總體比例、總體方差等推斷*5.1抽樣推斷斷的一般般問題5.1.1抽樣推斷斷的概念念和特點(diǎn)點(diǎn)5.1.2抽樣推斷斷的基本本范疇5.1.3抽樣分布布*1、概念抽樣推斷斷是在抽抽樣調(diào)查查的基礎(chǔ)礎(chǔ)上,根根據(jù)樣本本的情況況來推斷斷總體特特征的一一種統(tǒng)計(jì)計(jì)分析方方法。2、抽樣推推斷的特特點(diǎn)按照隨機(jī)機(jī)原則抽抽取樣本本單位(樣品);根據(jù)對(duì)樣樣本的調(diào)調(diào)查對(duì)總總體做出出推

2、斷;抽樣誤差差可以事事先計(jì)算算并加以以控制。3、抽樣推推斷的適適用場(chǎng)合合無法進(jìn)行行全面調(diào)調(diào)查時(shí);進(jìn)行全面面調(diào)查有有困難或或不必要要時(shí);5.1.1抽樣推斷斷的概念念和特點(diǎn)點(diǎn)*1.抽樣框和和抽樣單單位(1)總體和和樣本總體也稱稱母體,是所要要研究的的全部單單位組成成的整體體。一般般用表表示總體體包括的的總體單單位數(shù)。樣本又稱稱子樣,它是從從總體中中隨機(jī)抽抽取出來來的一部部分單位位組成的的整體。一般用用n表示樣本本包括的的總體單單位數(shù)。作為推斷斷對(duì)象的的總體是是確定的的,而且且是唯一一的;作作為觀察察對(duì)象的的樣本不不是確定定的,也也不是唯唯一的。5.1.2抽樣推斷斷的基本本范疇*(2)抽樣框框:抽樣

3、框是是包括全全部總體體單位的的框架,以此代代表總體體,用來從中抽抽取樣本本單位,具體表表現(xiàn)形式式有總體體單位(或其集合)的名單或或目錄、地圖、時(shí)間等等。(3)抽樣單單位:抽樣單位位是構(gòu)成成抽樣框框的基本本要素,它可以以是總體體單位也可以是是總體單單位的集集合。*2.重復(fù)抽樣樣和不重重復(fù)抽樣樣重復(fù)抽樣樣,也叫叫回置抽抽樣/放回抽樣樣,是指指從總體體的個(gè)單位位中抽取取一個(gè)容容量為n的樣本,每次抽抽出一個(gè)個(gè)單位后,再將將其放回回總體中中參加下下一次抽抽取,這這樣連續(xù)續(xù)抽n次即得到一一個(gè)樣本本 。不重復(fù)抽抽樣,也也叫不回回置抽樣樣/不放回抽抽樣,是是指抽中單位不不再放回回總體中中,下一一個(gè)樣本本單位只

4、只能從余余下的抽樣單位位中抽取取。*3.樣本容量量和樣本本可能數(shù)數(shù)目樣本容量量:一個(gè)個(gè)樣本所所包含的的總體單單位數(shù),用n表示,當(dāng)樣本本容量大大于等于于30時(shí)稱為大大樣本,小于30時(shí)稱為小樣本。樣本可能能數(shù)目:指按一一定抽樣樣方法和和一定樣樣本容量量從總體中中抽取樣樣本時(shí),所有可可能的樣樣本個(gè)數(shù)數(shù),一般般用M表示。*考慮順序序的重復(fù)復(fù)抽樣的的樣本可可能數(shù)目目:考慮順序序的不重重復(fù)抽樣樣的樣本本可能數(shù)數(shù)目:樣本可能能數(shù)目的的計(jì)算*不考慮順順序的重重復(fù)抽樣樣的可能能樣本數(shù)數(shù)目:不考慮順順序的不不重復(fù)抽抽樣的可可能樣本本數(shù)目:客觀現(xiàn)象象中常見見的*4.參數(shù)和統(tǒng)統(tǒng)計(jì)量參數(shù):根根據(jù)總體體中各單單位的變變量

5、值計(jì)計(jì)算的、反映總總體數(shù)量量特征的的特征值值。主要要有總體體均值、成數(shù)或或比例、方差。統(tǒng)計(jì)量:根據(jù)樣樣本中各各單位的的變量值值計(jì)算的的、反映映樣本數(shù)數(shù)量特征征的特征征值。主主要有樣樣本均值值、成數(shù)數(shù)或比例例、方差差??傮w是確確定的、唯一的的,所以以總體參參數(shù)也是是確定的的、唯一一的;樣樣本是隨隨機(jī)的,所以樣樣本統(tǒng)計(jì)計(jì)量是隨隨機(jī)變量量。*總體參數(shù)數(shù)樣樣本統(tǒng)計(jì)計(jì)量*樣本統(tǒng)計(jì)計(jì)量的概概率分布布;隨機(jī)變量量是樣本本統(tǒng)計(jì)量量:樣本均值值,樣本比例例,樣本本方差等等結(jié)果來自自容量相相同的所所有可能能樣本;提供了樣樣本統(tǒng)計(jì)計(jì)量的分分布特征征,是進(jìn)進(jìn)行推斷斷的理論論基礎(chǔ),也是抽抽樣推斷斷科學(xué)性性的重要要依據(jù)。

6、5.1.3抽樣分布布(samplingdistribution)*抽樣分布布的形成成(samplingdistribution)總體計(jì)算樣本統(tǒng)計(jì)量:樣本均值、比例、方差樣本*1.形成過程程從單位數(shù)數(shù)為N的總體中中抽取樣樣本容量量為n的隨機(jī)樣樣本,在重復(fù)復(fù)抽樣的的條件下下,共有有Nn個(gè)可能的的樣本,在不重復(fù)抽樣樣條件下下,共有有PNn個(gè)可能樣樣本;對(duì)于每一一個(gè)樣本本,我們們都可以以計(jì)算出出樣本的的均值;將所有可可能樣本本的樣本本均值根根據(jù)其取取值形成成概率分分布,即可得到到樣本均均值的抽抽樣分布布,它是是推斷總總體均值值的理論基基礎(chǔ)。(一)樣樣本均值值的抽樣樣分布*【例】設(shè)一個(gè)總總體,總總體單位

7、位數(shù)N=4。4個(gè)單位某某一標(biāo)志志值的取取值分別別為x1=1、x2=2、x3=3、x4=4??傮w的的均值、方差及及分布如如下: 總體分布14230.1.2.3均值和方方差*現(xiàn)從總體體中抽取取n2的簡(jiǎn)單隨隨機(jī)樣本本,在重重復(fù)抽樣樣條件下下,共有有16個(gè)樣本。所有樣樣本的結(jié)結(jié)果為:3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個(gè)觀察值第一個(gè)觀察值所有可能的n = 2 的樣本(共16個(gè))*計(jì)算出各各樣本的的均值,并給出出樣本均均值的抽抽樣分布布:3.53.02.52.033.02.52.01.524.03.53.02.542.542

8、.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值(x)x樣本均值的抽樣分布1.00.1.2.3P (x )1.53.04.03.52.02.5*2.樣本均值值的數(shù)字字特征*證明:*X= 2.52=1.25總體分布布14230.1.2.3抽樣分布P ( X )1.00.1.2.31.53.04.03.52.02.5XxP(x)結(jié)論:1.樣本均值值的均值值(數(shù)學(xué)期望望)等于總體體均值;2.樣本均值值的方差差等于總總體方差差的1/n。*樣本均值值的數(shù)學(xué)學(xué)期望:樣本均值值的方差差:不重復(fù)抽抽樣條件件下:*樣本均值值的抽樣樣分布 = 50 =10X總體分布n= 4抽樣分布布Xn=16當(dāng)總

9、體服服從正態(tài)態(tài)分布N(,2)時(shí),來自自該總體體的所有有容量為為n的樣本的的均值x也服從正正態(tài)分布布,且其其數(shù)學(xué)期期望為,方差為為2/n。即xN(,2/n)*中心極限限定理(central limit theorem)當(dāng)樣本容容量足夠夠大時(shí)(n30),樣本均均值的抽抽樣分布布逐漸趨趨于正態(tài)態(tài)分布中心極限限定理:設(shè)從均均值為,方差為為2的一個(gè)任任意總體體中抽取取容量為為n的樣本,當(dāng)n充分大時(shí)時(shí),樣本本均值的的抽樣分分布近似似服從均均值為、方差為為2/n的正態(tài)分分布。一個(gè)任意分布的總體X*的分布趨趨于正態(tài)態(tài)分布的的過程*總體分布布正態(tài)分布布非正態(tài)分分布大樣本小樣本正態(tài)分布布正態(tài)分布布非正態(tài)分分布樣本

10、均值值的抽樣樣分布樣本均值值的抽樣樣分布與與總體分分布的關(guān)關(guān)系*總體(或樣本)中具有某某種屬性性的單位位與全部部單位總總數(shù)之比:不同性別別的人數(shù)數(shù)與全部部人數(shù)之之比合格品(或不合格格品)與全部產(chǎn)產(chǎn)品總數(shù)數(shù)之比總體比例例表示為為樣本比例例表示為為(二)樣樣本成數(shù)數(shù)(比例例)的抽抽樣分布布*樣本比例例的抽樣樣分布容量相同同的所有有可能樣樣本的樣樣本比例例的概率率分布,當(dāng)樣本容量量很大時(shí)時(shí),樣本本比例的的抽樣分分布可用用正態(tài)分分布近似。樣本比例例的數(shù)學(xué)學(xué)期望:樣本比例例的方差差重復(fù)抽樣樣:不重復(fù)抽抽樣:*5.2抽樣誤差差5.2.1抽樣誤差差5.2.2抽樣平均均誤差 *1、概念抽樣誤差差是指由由于隨機(jī)

11、機(jī)抽樣的的偶然因因素使樣樣本單位位不足以以代表總總體單位位,而引引起的樣樣本統(tǒng)計(jì)計(jì)量和總總體參數(shù)數(shù)之間的的絕對(duì)離離差。()2、影響因因素總體單位位標(biāo)志值值的離散散程度;樣本容量量的大小?。╪);抽樣方法法(重復(fù)復(fù)抽樣/不重復(fù)抽抽樣);抽樣調(diào)查查的組織織方式(簡(jiǎn)單隨隨機(jī)抽樣樣/分層抽樣樣/等距抽樣樣/整群抽樣樣)。5.2.1抽樣誤差差*1、所有可可能樣本本統(tǒng)計(jì)量量與總體體參數(shù)的的平均離離差。2、理論計(jì)計(jì)算公式式為:上式可以以變換為為:5.2.2抽樣平均均誤差(標(biāo)準(zhǔn)誤誤)由此,樣樣本均值值的抽樣樣平均誤誤差就是是樣本均均值的標(biāo)標(biāo)準(zhǔn)差。*3、抽樣平平均誤差差的計(jì)算算公式:(1)重復(fù)抽抽樣條件件下(2

12、)不重復(fù)復(fù)抽樣條條件下*在總體單單位數(shù)很很大的情情況下,可近似似表示為為:*抽樣推斷斷的標(biāo)準(zhǔn)準(zhǔn)誤差(standarderror)樣本統(tǒng)計(jì)計(jì)量的標(biāo)標(biāo)準(zhǔn)差,稱為統(tǒng)統(tǒng)計(jì)量的的標(biāo)準(zhǔn)誤誤,也稱為標(biāo)準(zhǔn)準(zhǔn)誤差;衡量統(tǒng)計(jì)計(jì)量的離離散程度度,測(cè)度度了用樣樣本統(tǒng)計(jì)計(jì)量估計(jì)總體參參數(shù)的精精確程度度;當(dāng)總體標(biāo)標(biāo)準(zhǔn)差未知時(shí),可用樣樣本標(biāo)準(zhǔn)準(zhǔn)差s代替,在重復(fù)抽抽樣條件件下,樣樣本均值值的標(biāo)準(zhǔn)準(zhǔn)誤差為為*可以通過過調(diào)整樣樣本單位位數(shù)n來控制抽抽樣平均均誤差。例如,將樣本本容量增增加3倍,則平平均誤差差就縮小小一半;而抽樣樣平均誤誤差減少少20%,則樣本本容量就就需要原原來的1.56倍。*5.3參數(shù)估計(jì)計(jì)5.3.1抽樣推斷斷

13、的內(nèi)容容5.3.2點(diǎn)估計(jì)5.3.3區(qū)間估計(jì)計(jì)*1、參數(shù)估估計(jì)依據(jù)所獲獲得的樣樣本數(shù)據(jù)據(jù),對(duì)總總體的數(shù)數(shù)量特征征進(jìn)行估估計(jì)的推推斷方法法稱為參參數(shù)估計(jì)計(jì),即根根據(jù)樣本本統(tǒng)計(jì)量量來估計(jì)計(jì)總體參參數(shù)。參數(shù)估計(jì)計(jì)包括的的內(nèi)容:如確定定估計(jì)值值,確定定估計(jì)的的優(yōu)良標(biāo)標(biāo)準(zhǔn);確確定估計(jì)計(jì)值和被被估計(jì)參參數(shù)之間間的誤差差范圍以以及在一一定誤差差范圍內(nèi)內(nèi)所作推推斷的可可靠性程程度等。2、假設(shè)檢檢驗(yàn)先對(duì)總體體的數(shù)量量特征作作某種假假設(shè),再再根據(jù)樣樣本數(shù)據(jù)據(jù)對(duì)所作作假設(shè)進(jìn)進(jìn)行檢驗(yàn)驗(yàn)。假設(shè)檢驗(yàn)驗(yàn)包括的的內(nèi)容:確定原原假設(shè)與與備擇假假設(shè);選選擇檢驗(yàn)驗(yàn)統(tǒng)計(jì)量量;確定定顯著性性水平;做出決決策。5.3.1抽樣推斷斷的內(nèi)容容

14、*5.3.2點(diǎn)估計(jì)(pointestimate)1、定義:用樣本本統(tǒng)計(jì)量量的值直直接作為為總體參參數(shù)的估估計(jì)值,稱為為總體參參數(shù)的點(diǎn)點(diǎn)估計(jì)2、優(yōu)點(diǎn):簡(jiǎn)便、易行3、缺點(diǎn):沒有考考慮抽樣樣誤差的的大??;沒有給給出估計(jì)計(jì)值接近總體體參數(shù)的的程度;沒有考考慮估計(jì)計(jì)的概率率保證程程度。*估計(jì)量與與估計(jì)值值(estimator &estimated value)估計(jì)量:用于估估計(jì)總體體參數(shù)的的樣本統(tǒng)統(tǒng)計(jì)量的的名稱;如樣本均均值、樣樣本比例例(成數(shù))、樣本方方差等參數(shù)用 表示示,估計(jì)計(jì)量用表表示估計(jì)值:根據(jù)樣樣本資料料得出的的估計(jì)量量的具體體取值如果樣本本均值x =80,則80就是估計(jì)計(jì)值*評(píng)價(jià)估計(jì)計(jì)量的優(yōu)

15、優(yōu)良標(biāo)準(zhǔn)準(zhǔn)無偏性:估計(jì)量量的數(shù)學(xué)學(xué)期望等等于被估估計(jì)的總總體參數(shù)數(shù) P( )BA無偏有偏總體參數(shù)*有效性:對(duì)同一一總體參參數(shù)的兩兩個(gè)無偏偏估計(jì)量量,有更更小標(biāo)準(zhǔn)準(zhǔn)差的估估計(jì)量更更有效。AB 的抽樣分布 的抽樣分布P( )比更有效*一致性:隨著樣樣本容量量的增大大,估計(jì)計(jì)量的值值越來越越接近被被估計(jì)的的總體參參數(shù)。大數(shù)定律律已經(jīng)證證明了:樣本平平均數(shù)和和樣本成成數(shù)都滿滿足一致致性:*1、定義:在點(diǎn)估估計(jì)的基基礎(chǔ)上,指出總總體參數(shù)數(shù)的上限限和下限限,即指指出總體體參數(shù)可可能存在在的區(qū)間間范圍,并指出出總體參參數(shù)落在在這一區(qū)區(qū)間的置置信水平平。區(qū)間估計(jì)計(jì)的三個(gè)個(gè)要素:點(diǎn)估計(jì)值值總體參數(shù)數(shù)與點(diǎn)估估計(jì)值

16、的的抽樣誤誤差范圍圍(抽樣樣極限誤誤差)置信水平平/概率保證證程度(1-)5.3.3區(qū)間估計(jì)計(jì)*2、區(qū)間估估計(jì)的一一對(duì)矛盾盾:準(zhǔn)確性(精度):在點(diǎn)點(diǎn)估計(jì)的的基礎(chǔ)上上,給出出總體參參數(shù)估計(jì)的一個(gè)個(gè)區(qū)間范范圍,稱稱為置信信區(qū)間,該區(qū)間間由樣本本統(tǒng)計(jì)量加減一一個(gè)誤差差范圍而而得到:樣本統(tǒng)計(jì)量值 (點(diǎn)估計(jì))置信區(qū)間置信下限置信上限*抽樣極限限誤差抽樣極限限誤差是是根據(jù)統(tǒng)統(tǒng)計(jì)研究究任務(wù)要要求確定定的可允允許的最最大抽樣樣誤差范范圍,它它等于總總體參數(shù)數(shù)可允許許變動(dòng)的的上限或或下限與與樣本統(tǒng)統(tǒng)計(jì)量的的絕對(duì)離離差。我們總是是希望估估計(jì)的準(zhǔn)準(zhǔn)確性越越高越好好,即估估計(jì)精度度盡可能能的高,也就是是希望置置信區(qū)間

17、間越窄越越好,或或者抽樣樣極限誤誤差越小小越好。*(2)可靠性性(置信信水平/概率保證證程度):總體體參數(shù)落落在置信區(qū)區(qū)間內(nèi)的的概率,即樣本本統(tǒng)計(jì)量量與總體體參數(shù)的的誤差不超過抽抽樣極限限誤差的的概率。樣本統(tǒng)計(jì)計(jì)量的抽抽樣分布布能夠根根據(jù)樣本本統(tǒng)計(jì)量量與總體體參數(shù)的接近近程度給給出相應(yīng)應(yīng)的概率率度量:兩者越越接近概概率越小,差異異越大概概率越大大。*表示為(1-)%為總體參參數(shù)落在在區(qū)間內(nèi)內(nèi)的概率率常用的置置信水平平為99%, 95%,90%相應(yīng)的為0.01,0.05,0.10置信水平平的表示示(confidencelevel)*抽樣推斷斷時(shí),我我們總是是希望估估計(jì)的誤誤差范圍圍盡可能能的小,

18、即抽樣樣精度盡盡可能的的高,并并且估計(jì)計(jì)的置信信水平也也盡可能的大,但事實(shí)實(shí)上這兩兩者是矛矛盾的:在其他他條件不不變的情況下,提高估估計(jì)的置置信水平平,就會(huì)會(huì)增大抽抽樣極限限誤差(降低估估計(jì)的精精度);提高估估計(jì)的精精度,就就會(huì)減小小置信水平。所所以在區(qū)區(qū)間估計(jì)計(jì)中,我我們只能能對(duì)準(zhǔn)確確性和可可靠性中的一個(gè)個(gè)提出要要求,來來推求另另一要素素的情況況,事實(shí)實(shí)上抽樣極限誤誤差與置置信水平平之間存存在一一一對(duì)應(yīng)的的關(guān)系,知道其中一個(gè)個(gè)可以求求另外一一個(gè)。準(zhǔn)確性與與可靠性性的關(guān)系系*標(biāo)準(zhǔn)正態(tài)態(tài)分布(standardizenormal distribution)標(biāo)準(zhǔn)正態(tài)態(tài)分布的概率密密度函數(shù)數(shù):隨機(jī)變量

19、量具有均均值為0,標(biāo)準(zhǔn)差差為1的正態(tài)分分布;任何一個(gè)個(gè)一般的正正態(tài)分布布,可通通過下面面的線性性變換轉(zhuǎn)轉(zhuǎn)化為標(biāo)準(zhǔn)正正態(tài)分布布;標(biāo)準(zhǔn)正態(tài)態(tài)分布的分布函函數(shù);*標(biāo)準(zhǔn)正態(tài)態(tài)分布概概率圖示示90%的x99.73% 的x95% 的xx一般正態(tài)態(tài)分布的的密度函函數(shù)f(x) =隨機(jī)變量量X的頻率=隨機(jī)變量量X的均值=隨機(jī)變量量X的方差= 3.1415926;e =2.71828一般正態(tài)態(tài)分布概概率圖示示*正態(tài)分布布函數(shù)的的性質(zhì)圖形是關(guān)關(guān)于x=對(duì)稱鐘形形曲線,且峰值值在x=處;均值和標(biāo)準(zhǔn)差差一旦確定定,分布布的具體體形式也也惟一確確定,不不同參數(shù)數(shù)正態(tài)分分布構(gòu)成成一個(gè)完完整的“正態(tài)分分布族”;均值可取實(shí)數(shù)數(shù)軸

20、上的的任意數(shù)數(shù)值,決決定正態(tài)態(tài)曲線的的具體位位置;標(biāo)標(biāo)準(zhǔn)差決決定曲線線的“陡陡峭”或或“扁平平”程度度。越大,正正態(tài)曲線線扁平;越小,正正態(tài)曲線線越高陡陡峭;當(dāng)X的取值向向橫軸左左右兩個(gè)個(gè)方向無無限延伸伸時(shí),曲曲線的兩兩個(gè)尾端端也無限限漸近橫橫軸,理理論上永永遠(yuǎn)不會(huì)會(huì)與之相相交;正態(tài)隨機(jī)機(jī)變量在在特定區(qū)區(qū)間上的的取值概概率由正正態(tài)曲線線下的面面積給出出,而且且其曲線線下的總總面積等等于1。任何一個(gè)個(gè)一般的正正態(tài)分布布,可通通過下面面的線性性變換轉(zhuǎn)轉(zhuǎn)化為標(biāo)準(zhǔn)準(zhǔn)正態(tài)分分布*【例】計(jì)算以下下概率:(1)XN(50,102),求和和(2)ZN(0,1),求和和(3)正態(tài)分布布概率為為0.05時(shí),求標(biāo)標(biāo)

21、準(zhǔn)正態(tài)態(tài)累積分分布函數(shù)數(shù)的反函數(shù)數(shù)值z(mì)。正態(tài)分布布(例題分析析) *樣本均值值概率分分布圖示示x90%的樣本99.73% 的樣本95% 的樣本根據(jù)中心心極限定定理可知知,*概率度:度量置置信水平平大小的的指標(biāo),概率度度大則置置信水平平高,概概率度小小則置信信水平低低。其實(shí)質(zhì)是是以抽樣樣平均誤誤差(標(biāo)標(biāo)準(zhǔn)誤差差)為標(biāo)標(biāo)準(zhǔn)去衡衡量抽樣樣極限誤誤差大小小的統(tǒng)計(jì)計(jì)指標(biāo),即抽樣樣極限誤誤差為標(biāo)標(biāo)準(zhǔn)誤差差的倍數(shù)數(shù)。置信水平平與置信信度之間間的關(guān)系系可用下下式表達(dá)達(dá):*常用的概概率度和和置信水水平的關(guān)關(guān)系表置信水平 1-/268.27%0.31730.15865190%0.100.051.64595%0.0

22、50.0251.9695.45%0.0550.0275299%0.010.0052.5899.73%0.00270.001353*3.區(qū)間估計(jì)計(jì)的方法法方法一:根據(jù)據(jù)給定的的抽樣極極限誤差差,求置置信水平平F(Z)(1)抽取樣本本,計(jì)算算巖本統(tǒng)統(tǒng)計(jì)量,如計(jì)算算樣本平平均數(shù)或或樣本成成數(shù)作為相應(yīng)總總體參數(shù)數(shù)的估計(jì)計(jì)值,如果缺少少總體方方差或均均方差資資料,還還應(yīng)計(jì)算樣樣本方差差或均方方差代替替;(2)根據(jù)給定定的抽樣樣極限誤誤差,估估計(jì)總體體參數(shù)的的上、下下限;(3)計(jì)算抽樣樣平均誤誤差或估估計(jì)標(biāo)準(zhǔn)準(zhǔn)誤差;(4)將抽樣極極限誤差差除以抽抽樣平均均誤差求求出概率率度Z值,再根根據(jù)Z值查“正態(tài)態(tài)分布

23、概概率表”求出相相應(yīng)的置置信水平平F(Z)。*方法二:根據(jù)給給定的置置信水平平要求,來推算算抽樣極極限誤差差,然后進(jìn)行區(qū)間估估計(jì)。(1)抽取樣樣本,計(jì)計(jì)算巖本本統(tǒng)計(jì)量量,如計(jì)計(jì)算樣本本平均數(shù)數(shù)或樣本本成數(shù)作為相相應(yīng)總體體參數(shù)的的估計(jì)值值,如果缺少少總體方方差或均均方差資資料,還應(yīng)計(jì)計(jì)算樣本本方差或或均方差差代替;(2)根據(jù)給給定的置信度F(Z)要求,求求得概率率度Z值;(3)計(jì)算抽樣樣平均誤誤差u;(4)根據(jù)概概率度Z和抽樣平平均誤差差來推算算抽樣極極限誤差差,再根根據(jù)抽樣極限限誤差求求出被估估計(jì)總體體參數(shù)的的上下限限,對(duì)總總體參數(shù)數(shù)做區(qū)間間估計(jì)。*每包重量(克)包數(shù)組中值149以下10148

24、.51485-1.832.414915020149.52990-0.812.815015150150.575250.22151以上20151.530301.228.8合計(jì)1001503076例某外貿(mào)公公司出口口一種茶茶葉,規(guī)規(guī)定每包包規(guī)格不不低于150克,現(xiàn)用不重復(fù)復(fù)抽樣方方法從中中隨機(jī)抽抽取1%進(jìn)行檢驗(yàn)驗(yàn),抽檢檢結(jié)果如如表所示:*要求:(1)抽樣極極限誤差差為0.2克,估計(jì)計(jì)該批茶茶葉每包包平均重重量的區(qū)區(qū)間及其其概率保保證程度度;(2)茶葉包包裝合格格率的誤誤差范圍圍不超過過6%,估計(jì)包包裝合格格率的區(qū)區(qū)間及其其概率保保證程度度;(3)要求以以95.45%的概率保保證程度度,估計(jì)計(jì)該批茶茶

25、葉每包包平均重重量的區(qū)區(qū)間;(4)要求以以95.45%的概率保保證程度度,估計(jì)計(jì)該批茶茶葉的包包裝合格格率的區(qū)區(qū)間。*(1)上限=150.3+0.2=150.5克下限=150.3-0.2=150.1克*查概率表表:該批茶葉葉每包平平均重量量落在區(qū)區(qū)間150.1,150.5克內(nèi),概概率保證證程度為為97.91%。*(2)上限70%+6%76%下限=70%-6%64%查概率表表:該批茶葉葉的包裝裝合格率率落在區(qū)區(qū)間64%,76%內(nèi),概率率保證程程度為81.32%。*(3)上限=150.3+0.1734=150.47克下限=150.3-0.1734=150.13克以95.45%的概率保保證程度度估計(jì)

26、該該批茶葉葉每包平平均重量量在區(qū)間間150.13,150.47內(nèi)。*(4)上限=70%+9.12%79.12%下限=70%-9.12%61.88%以95.45%的概率保保證程度度估計(jì)該該批茶葉葉包裝合合格率的的區(qū)間為為61.88%,79.12%。*總體均值值的區(qū)間間估計(jì)-數(shù)理統(tǒng)計(jì)計(jì)模式【例】某種零件件的長(zhǎng)度度服從正正態(tài)分布布,從某某天生產(chǎn)產(chǎn)一批零零件中按按重復(fù)抽抽樣方法法隨機(jī)抽抽取9個(gè),測(cè)得得其平均均長(zhǎng)度為為21.4cm。已知總總體標(biāo)準(zhǔn)準(zhǔn)差為=0.15cm。試估計(jì)計(jì)該批零零件平均均長(zhǎng)度的的置信區(qū)區(qū)間,置置信水平平為95%。該批零件件平均長(zhǎng)長(zhǎng)度的置置信區(qū)間間在21.302cm21.498cm之間

27、。解:已知N(,0.152),n=9, 1- = 95%,z/2=1.96 總體均值 在1-置信水平下的置信區(qū)間為*置信區(qū)間間與置信信水平的的理解總體參數(shù)數(shù)的真值值是固定定的,而而用樣本本構(gòu)造的的區(qū)間則則是不固固定的,因此置置信區(qū)間間是一個(gè)個(gè)隨機(jī)區(qū)區(qū)間,它它會(huì)因樣樣本的不不同而變變化,而而且不是所所有的區(qū)區(qū)間都包包含總體體參數(shù);實(shí)際估計(jì)計(jì)時(shí)只抽抽取一個(gè)個(gè)樣本,此時(shí)所所構(gòu)造的的是與該該樣本相相聯(lián)系的一定置置信水平平(比如95%)下的置信信區(qū)間,一個(gè)特定定的區(qū)間間總是“包含”或或“絕對(duì)對(duì)不包含含”參數(shù)數(shù)的真值值,不存存在“以以多大的的概率包包含總體參參數(shù)”的的問題。我們無法法知道這這個(gè)樣本本所產(chǎn)生

28、生的區(qū)間間是否包含總體體參數(shù)的的真值,我們只只能希望望這個(gè)區(qū)區(qū)間是大大量包含含總體參參數(shù)真值的的區(qū)間中中的一個(gè)個(gè),但它它也可能能是少數(shù)數(shù)幾個(gè)不不包含參參數(shù)真值值的區(qū)間中中的一個(gè)個(gè);*如果用某某種方法法構(gòu)造的的所有區(qū)區(qū)間中有有95%的區(qū)間包包含總體體參數(shù)的真值,5%的區(qū)間不不包含總總體參數(shù)數(shù)的真值值,那么么,用該該方法構(gòu)構(gòu)造的區(qū)間稱稱為置信信水平為為95%的置信區(qū)區(qū)間;置信水平平只是告告訴我們們?cè)诙啻未喂烙?jì)得得到的區(qū)區(qū)間中大大概有多多少個(gè)區(qū)間包含含了參數(shù)數(shù)的真值值,而不不是針對(duì)對(duì)所抽取取的這個(gè)個(gè)樣本所所構(gòu)建的的區(qū)間而言言的。*從均值為為185的總體中中抽出n=10的20個(gè)樣本構(gòu)構(gòu)造出總總體均值值

29、的20個(gè)置信區(qū)間間我沒有抓抓住參數(shù)數(shù)!點(diǎn)估計(jì)值值*假設(shè)檢驗(yàn)驗(yàn)(hypothesis test)先對(duì)總體體的參數(shù)數(shù)(或分布形形式)提出某種種假設(shè),然后利利用樣本信息判判斷假設(shè)設(shè)是否成成立的統(tǒng)統(tǒng)計(jì)方法法。假設(shè)檢驗(yàn)驗(yàn)的步驟驟:提出原假假設(shè)H0;確定適當(dāng)當(dāng)?shù)臋z驗(yàn)驗(yàn)統(tǒng)計(jì)量量;給定顯著著性水平平;計(jì)算檢驗(yàn)驗(yàn)統(tǒng)計(jì)量量的值發(fā)發(fā)生的概概率(P值)或計(jì)計(jì)算給定定顯著性性水平下下的臨界界值;作出統(tǒng)計(jì)計(jì)決策。*決策依據(jù)據(jù)邏輯上運(yùn)運(yùn)用反證證法,統(tǒng)統(tǒng)計(jì)上依依據(jù)小概概率原理理;樣本統(tǒng)計(jì)計(jì)量越大大或P值越小,則越傾傾向于拒拒絕原假假設(shè)在這么小小的概率率下竟然然得到了了這樣的的一個(gè)樣樣本,表表明這樣樣的樣本本經(jīng)常出出現(xiàn)。*.因

30、此我們們拒絕假假設(shè)= 50. 如果這是總體的真實(shí)均值樣本均值值m= 50抽樣分布布H0這個(gè)值不像我們應(yīng)該得到的樣本均值 .20假設(shè)檢驗(yàn)驗(yàn)圖示*P-值原假設(shè)為為真條件件下,抽抽樣分布布中大于于或小于于樣本統(tǒng)統(tǒng)計(jì)量的的概率。/ 2 / 2 Z拒絕拒絕H0值臨界值計(jì)算出的樣本統(tǒng)計(jì)量計(jì)算出的樣本統(tǒng)計(jì)量臨界值1/2 P 值1/2 P 值*5.4樣本容量量的確定定5.4.1樣本容量量確定的的兩難5.4.2簡(jiǎn)單隨機(jī)機(jī)抽樣條條件下樣樣本容量量的確定定5.4.3總體參數(shù)數(shù)的預(yù)先先估計(jì)5.4.4確定樣本本容量時(shí)時(shí)需考慮慮的因素素*5.4.1樣本容量量確定的的兩難樣本容量量較大,收集的的信息就就相對(duì)多多,從而而估計(jì)

31、精精度較高高,但進(jìn)進(jìn)行觀測(cè)測(cè)所投入入的費(fèi)用用、人力力及時(shí)間間就比較較多;樣本容量量較小,則投入入的費(fèi)用用、人力力及時(shí)間間就相對(duì)對(duì)節(jié)約,但收集集的信息息也較少少,從而而估計(jì)精精度較低低;所以,精精度和費(fèi)費(fèi)用對(duì)樣樣本量的的影響和和要求是是矛盾的的,不存存在既使使精度最最高又使使費(fèi)用最最省的樣樣本量。反映精度度的指標(biāo)標(biāo)為抽樣樣極限誤誤差,其其中的概概率度Z與置信水水平相關(guān)關(guān),只有有抽樣平平均誤差差與樣本本量有關(guān)關(guān)。*費(fèi)用與樣樣本量的的關(guān)系:費(fèi)用與n的關(guān)系用用費(fèi)用函函數(shù)來表表示的,簡(jiǎn)單隨隨機(jī)抽樣樣的條件件下,通通常表現(xiàn)現(xiàn)為:其中:C為總費(fèi)用用;c0為固定費(fèi)費(fèi)用,c1為與樣本本量有關(guān)關(guān)的可變變費(fèi)用。抽樣

32、平均均誤差與與樣本量量的關(guān)系系:結(jié)論:當(dāng)當(dāng)樣本量量較小時(shí)時(shí),增加加相同的的費(fèi)用估估計(jì)精度度的提高高較明顯顯,當(dāng)樣樣本量較較大時(shí),增加相同同的費(fèi)用用估計(jì)精精度的提提高效果果不好。*樣本容量量的影響響因素1、總體變變異程度度(、)2、抽樣極極限誤差差(允許許誤差范范圍)3、置信水水平(置置信度、概率保保證程度度)4、抽樣方方法(重重復(fù)抽樣樣、不重重復(fù)抽樣樣)5、抽樣組組織方式式(簡(jiǎn)單單隨機(jī)抽抽樣、分分層抽樣樣、等距距抽樣、整群抽抽樣)。*1、估計(jì)總總體均值值時(shí)樣本本容量的的確定重復(fù)抽樣樣不重復(fù)抽抽樣5.4.2簡(jiǎn)單隨機(jī)機(jī)抽樣條條件下樣樣本容量量的確定定其中:以上求出出的樣本本量為必必要樣本本量,即即

33、最小樣樣本量,不能整整除時(shí)不不采用四四舍五入入的方法法,而是是采用取取大的臨臨近整數(shù)數(shù)的方法法。*重復(fù)抽樣樣與不重重復(fù)抽樣樣條件下下樣本容容量的變變換:由于重復(fù)復(fù)抽樣下下的公式式比不重重復(fù)抽樣樣下的公公式要簡(jiǎn)簡(jiǎn)單得多多,所以對(duì)不重重復(fù)抽樣樣必要樣樣本單位位數(shù)的確確定經(jīng)常常遵循如如下思路路確定:首先計(jì)計(jì)算重復(fù)復(fù)抽樣條條件下的的必要樣樣本單位位數(shù),記記為n0;然后判斷是是否成成立,如如果成立立,則取取n=n0,否則,對(duì)n進(jìn)行修正,修修正公式式為:*【例】擁有工商商管理學(xué)學(xué)士學(xué)位位的大學(xué)學(xué)畢業(yè)生生年薪的的標(biāo)準(zhǔn)差差大約為為2000元,假定定想要估估計(jì)年薪薪95%的置信區(qū)區(qū)間,希希望允許許誤差為為400

34、元,應(yīng)抽抽取樣本本容量為為多大的的樣本?*解:已知=2000,=400,1-=95%,z/2=1.96則即應(yīng)抽取取97人作為樣樣本。*重復(fù)抽樣樣不重復(fù)抽抽樣2、估計(jì)總總體比例例時(shí)樣本本容量的的確定其中:*【例】根據(jù)以往往的生產(chǎn)產(chǎn)統(tǒng)計(jì),某種產(chǎn)產(chǎn)品的合合格率約約為90%,現(xiàn)要求求允許誤誤差為5%,在求95%的置信區(qū)區(qū)間時(shí),應(yīng)抽取取多少個(gè)個(gè)產(chǎn)品作作為樣本本?解:已知p=90%,1-=95%,Z/2=1.96,=5%應(yīng)抽取的的樣本容容量為:應(yīng)抽取139個(gè)產(chǎn)品作作為樣本本。*1.如果有歷歷史資料料,可利利用歷史史資料代代替;如如果有若若干個(gè)可可供選擇的歷史史資料,應(yīng)采用用數(shù)值最最大的一一個(gè);成成數(shù)方差差

35、在完全全缺乏資資料的情況況下,用用0.25代替;2.假如沒有有可供替替代的歷歷史資料料,可以以通過組組織試驗(yàn)驗(yàn)性的抽抽樣取得替代資資料:首首先確定定一個(gè)可可以承受受的樣本本量n0,調(diào)查后后用樣本方差代代替總體體方差進(jìn)進(jìn)行計(jì)算算,如果果精度跟跟可靠性性達(dá)到要要求,則則調(diào)查結(jié)束束;否則則,計(jì)算算為達(dá)到到精度要要求所需需樣本量量n,再補(bǔ)抽抽n-n0個(gè)單位進(jìn)進(jìn)行調(diào)查查;4.沒有同類類調(diào)查的的經(jīng)驗(yàn),時(shí)間等等各方面面條件又又不允許許進(jìn)行預(yù)預(yù)調(diào)查,則只能能通過定定性分析析來確定定總體變變異系數(shù)數(shù)。5.4.3總體方差差的預(yù)先先估計(jì)*其中,C為變異系系數(shù),r為相對(duì)誤誤差。將計(jì)算樣樣本容量量的公式式變形得得:*1.研究問題題的重要要性。對(duì)對(duì)于決策策比較重重要的問問題樣本本量要大大一些;2.所研究問問題目標(biāo)標(biāo)量的個(gè)個(gè)數(shù)。如如果所研研究的問問題目標(biāo)標(biāo)量較多多,樣本本量應(yīng)適適當(dāng)放大大;3.調(diào)查表或或調(diào)查問問卷的回回收率;4.有效樣本本數(shù);5.資源限制制:調(diào)查查項(xiàng)目的的經(jīng)費(fèi)、時(shí)間要要求以及及調(diào)查人人員的限限制。5.4.4確定樣本本容量時(shí)時(shí)需要考考慮的其其它因素素*5.5其它參數(shù)數(shù)估計(jì)與與假設(shè)檢檢驗(yàn)內(nèi)容容5.5.1一個(gè)總體體均值5.5.2兩個(gè)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論