第七章 抽樣推斷syong_第1頁
第七章 抽樣推斷syong_第2頁
第七章 抽樣推斷syong_第3頁
第七章 抽樣推斷syong_第4頁
第七章 抽樣推斷syong_第5頁
已閱讀5頁,還剩58頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第七章抽樣推斷本章內(nèi)容

第一節(jié)

抽樣推斷概述第二節(jié)抽樣推斷的幾個基本概念第三節(jié)抽樣誤差第四節(jié)參數(shù)估計的一般問題第五節(jié)一個總體參數(shù)的區(qū)間估計第六節(jié)樣本容量的確定——抽樣方案設(shè)計本章重點第三、五、六節(jié)內(nèi)容本章難點第三、五節(jié)內(nèi)容具體要求理解-抽樣推斷的含義、作用及基本概念掌握-抽樣誤差的計算、參數(shù)估計的方法等。§7.1抽樣推斷概述

一、抽樣推斷的概念

“抽樣推斷、抽樣調(diào)查和抽樣估計”基本上是相同的意思?!夯仡櫟诙?jié)“抽樣調(diào)查”的概念』

抽樣推斷是按照隨機原則從全部研究對象中抽取一部分單位進(jìn)行觀察,并根據(jù)被抽取的那部分單位的數(shù)量特征,運用一定的數(shù)理統(tǒng)計方法,對總體的數(shù)量性作出具有一定可靠程度的估計和判斷。

【參書中的例子或自己舉些例子】

二、抽樣推斷的特點

1、抽樣推斷是非全面調(diào)查??梢怨?jié)省人力物力和財力,取得事半功倍的效果。

2、抽樣推斷是按隨機原則抽選調(diào)查單位。

3、抽樣推斷是用樣本的指標(biāo)數(shù)值去推算總體的指標(biāo)數(shù)值。

4、抽樣推斷運用的是概率原理。

5、抽樣推斷中產(chǎn)生的誤差可以事先計算并加以控制。三、抽樣推斷的作用(適用范圍)

1、對無限總體全面情況的了解,必須采用抽樣推斷。

2、對破壞性或消耗性檢查,必須采用抽樣調(diào)查。

3、對某些可以但事實上不必或不可能進(jìn)行全面調(diào)查的現(xiàn)象總體,可以采用抽樣推斷獲取相關(guān)資料。

4、抽樣調(diào)查可以對全面調(diào)查得來的資料進(jìn)行驗證,并據(jù)以進(jìn)行補充和修改。

5、抽樣推斷可以用于生產(chǎn)過程的質(zhì)量控制。

§7.2抽樣推斷的幾個基本概念一、全及總體和抽樣(樣本)總體

1、全及總體又稱母體,簡稱總體,它是指所要認(rèn)識的,具有某種共同性質(zhì)的許多單位的集合體。組成全及總體的單位稱為總體單位,全及總體的單位數(shù)一般用N表示。

2、抽樣總體又稱子樣,簡稱樣本,是從全及總體中隨機抽取的那一部分單位所構(gòu)成的集合體。組成抽樣總體的單位稱為樣本單位,樣本單位數(shù)亦稱樣本容量,一般用n表示。樣本單位數(shù)的范圍:1<n<N

抽樣比例:大樣本:n≥30;小樣本:n<30

重點理解:如果說對于一次抽樣調(diào)查,全及總體是唯一確定的,那么抽樣總體就不是這樣,樣本是不確定的,一個全及總體可能抽出很多個樣本總體,樣本的個數(shù)和樣本的容量有關(guān),也和抽樣的方法有關(guān)。nN二、樣本容量和樣本個數(shù)1.樣本容量:是指一個樣本所包含的單位數(shù),通常用n表示。(總體單位數(shù)用N表示)2.樣本個數(shù):樣本可能數(shù)目,是從一個總體中可能抽取的樣本個數(shù)。如:樣本容量為n重復(fù)抽樣:樣本個數(shù)為不重復(fù)抽樣:樣本個數(shù)為三、總體指標(biāo)和樣本指標(biāo)1.總體指標(biāo)(參數(shù))總體平均數(shù)總體成數(shù)當(dāng)研究的是總體個單位的屬性特征時,只能用一定的術(shù)語來描述,所以就應(yīng)該計算比重結(jié)構(gòu)指標(biāo),稱為總體成數(shù)。用大寫P表示,它說明了總體中具有某種標(biāo)志的單位數(shù)在總體中所占的比重。設(shè)總體N個單位中,有N1個單位具有某種屬性,N0個不具有某種屬性,N1+N0=N,P為總體中具有某種屬性的單位數(shù)所占的比重,Q為布局有某種屬性的單位所占的比重,則總體成數(shù)為:總體標(biāo)準(zhǔn)差、總體方差2.樣本指標(biāo)(統(tǒng)計量)樣本平均數(shù)樣本成數(shù)樣本標(biāo)準(zhǔn)差、樣本方差四、重復(fù)抽樣和不重復(fù)抽樣

抽取樣本有兩種基本方法,不同的方法會影響抽樣的誤差。

1、重復(fù)抽樣(重置抽樣、放回抽樣)基本的特點和做法樣本個數(shù)的計算:Nn(可重復(fù)排列數(shù))

2、不重復(fù)抽樣(不重置抽樣、不放回抽樣)基本的特點和做法樣本個數(shù)的計算:(不重復(fù)排列數(shù))

N(N-1)(N-2)......(N-n+1)=N!/(N-n)!

以上都是考慮順序的抽樣!

§7.3抽樣誤差15

一、抽樣誤差

1抽樣誤差的概念一般地說,抽樣誤差是指根據(jù)樣本數(shù)據(jù)計算而得的樣本統(tǒng)計量值與被它估計的未知的總體參數(shù)真值之間的差值??傮w參數(shù)真值樣本統(tǒng)計量值抽樣誤差例如Xx均值抽樣誤差

2、統(tǒng)計調(diào)查誤差的種類(1)登記性誤差(工作誤差)調(diào)查過程中由于主客觀原因在登記、匯總、計算、過錄中所產(chǎn)生的差錯。(2)代表性誤差用部分推算總體時產(chǎn)生的誤差。

①偏差(系統(tǒng)性誤差):由于抽樣調(diào)查沒有遵循隨機原則而產(chǎn)生的誤差。

②隨機誤差(偶然性誤差):在沒有登記性誤差又遵循了隨機原則的情況下,所產(chǎn)生的樣本指標(biāo)與被它估計的總體相應(yīng)指標(biāo)的差數(shù)。

3、抽樣誤差的進(jìn)一步理解

※它就是指隨機誤差;

※它是一個隨機變量;

※它是抽樣推斷中不可避免不可消除的誤差;

※抽樣誤差的大小反映了樣本代表性的高低;

※它可以用數(shù)理統(tǒng)計方法進(jìn)行計算和控制。二、抽樣平均誤差1.抽樣平均誤差的含義:抽樣平均誤差從一般意義上說是所有樣本指標(biāo)與總體指標(biāo)差數(shù)的平均水平,它反映了抽樣指標(biāo)與總體指標(biāo)的平均離差程度。實質(zhì)就是所有可能出現(xiàn)的樣本指標(biāo)的標(biāo)準(zhǔn)差。一全及總體可抽取的樣本有多個每個樣本都可以計算出相應(yīng)的樣本指標(biāo)(抽樣平均數(shù)或抽樣成數(shù)指標(biāo))樣本指標(biāo)和總體指標(biāo)的抽樣誤差各不相同(隨機變量)為了測定樣本(指標(biāo))的代表性程度的高低,單獨用某一次的抽樣誤差來衡量是不科學(xué)的,因此就需要采用一定的方法(求標(biāo)準(zhǔn)差的方法)計算所有抽樣誤差的平均數(shù),這就是抽樣平均誤差。同時它在參數(shù)估計中也要用到。

【例】假設(shè)從4個生產(chǎn)汽車零件的工人總體抽取2人進(jìn)行抽樣調(diào)查,來推斷4個工人的平均日產(chǎn)量。4

個工人的日產(chǎn)量分別為:x1=1、x2=2、x3=3

、x4=4(單位:件)??傻每傮w的均值、方差及分布如下總體分布14230.1.2.3均值和方差P

現(xiàn)從總體中抽取n=2的簡單隨機樣本,在重復(fù)抽樣條件下,共有42=16個樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)

計算出各樣本的均值,如下表。3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)樣本平均數(shù)概率11.52

2.533.541/162/163/164/163/162/161/16樣本平均數(shù)的均值或抽樣平均誤差是所有樣本指標(biāo)與總體指標(biāo)離差的平均水平,所以有以下計算(件)0.7906件的含義是,對于16個樣本,無論抽到哪個樣本平均來說誤差為0.7906件。從以上計算中可以看出:(1)抽樣平均誤差就是抽樣指標(biāo)的標(biāo)準(zhǔn)差,所以也稱為抽樣標(biāo)準(zhǔn)誤差或估計標(biāo)準(zhǔn)誤。(2)抽樣平均誤差(即抽樣指標(biāo)的標(biāo)準(zhǔn)差)比總體標(biāo)準(zhǔn)差小的多,僅為總體標(biāo)準(zhǔn)差的。26

依據(jù)抽樣分布的基本原理,可以利用以下計算公式直接計算出相應(yīng)樣本統(tǒng)計量的抽樣平均誤差。(1)樣本均值的抽樣平均誤差2.抽樣平均誤差的計算重復(fù)抽樣條件下:x

ns

s

=

nN≈

1NnN-

-

1-

N1N≈-

Q

一般情況下N比較大Nnx

)1(n2

-

\

s

s

不重復(fù)抽樣條件下:-

-

1NnNn2

s

)

(x

s

=

27

(2)樣本成數(shù)的抽樣平均誤差抽樣平均誤差)

1

p-

n

(

p

ps

=

重復(fù)抽樣條件下:N

n

)(-

-

=)

(

-

-

-

=1

n

)

1

(

1

N

n

N

n

)

1

(

p

Pppps

不重復(fù)抽樣條件下:28

【例】從10000名學(xué)生中抽查200名測得平均身高為1.65m,已知學(xué)生身高的總體標(biāo)準(zhǔn)差σ=0.28。其中女生占全部學(xué)生的比重30%。求學(xué)生平均身高和女生比重的抽樣平均誤差。抽樣平均誤差(舉例)解:已知N=10000,n=200,x=1.65m,σ=0.28,p=30%在重復(fù)抽樣的條件下:在不重復(fù)抽樣的條件下:200x

ns

s

=

=

0.28=

0.0198)

1

P-

n

(

p

Ps

=)

1

0.3-

200(

0.3==3.24%10000200)(-

-

=-

=1200)1(n)1(p0.30.3

P

P

s

N)(-

1n=3.21%Nnx

)1(n2

-

=

s

s

10000200)1(2002

-

=

0.28=

0.0196

※在沒有總體方差和標(biāo)準(zhǔn)差時怎么辦?

(用樣本的相關(guān)指標(biāo)代替即可)計算公式匯總:三、影響抽樣(平均)誤差的因素

1、抽樣單位數(shù)目的多少;

2、總體被研究標(biāo)志的變異程度;

3、抽樣方法和組織形式的不同。§7.4參數(shù)估計的一般問題估計量與估計值評價估計量的標(biāo)準(zhǔn)點估計與區(qū)間估計估計量:用于估計總體參數(shù)的隨機變量如樣本均值,樣本比例、樣本方差等例如:樣本均值就是總體均值

的一個估計量參數(shù)用

表示,估計量用表示估計值:估計參數(shù)時計算出來的統(tǒng)計量的具體值如果樣本均值

x

=80,則80就是

的估計值一、估計量與估計值

(estimator&estimatedvalue)二、評價估計量的標(biāo)準(zhǔn)

1.無偏性(unbiasedness)無偏性:估計量抽樣分布的數(shù)學(xué)期望等于被估計的總體參數(shù)P(

)BA無偏有偏AB

的抽樣分布

的抽樣分布P(

)2.有效性

(efficiency)有效性:對同一總體參數(shù)的兩個無偏點估計量,有更小標(biāo)準(zhǔn)差的估計量更有效

3.一致性

(consistency)一致性:隨著樣本容量的增大,估計量的

值越來越接近被估計的總體參數(shù)AB較小的樣本容量較大的樣本容量P(

)三、點估計與區(qū)間估計估計方法點估計區(qū)間估計參數(shù)估計的方法(一)點估計

(pointestimate)用樣本的估計量直接作為總體參數(shù)的估計值例如:用樣本均值直接作為總體均值的估計例如:用兩個樣本均值之差直接作為總體均值之差的估計2. 沒有給出估計值接近總體參數(shù)程度的信息(二)區(qū)間估計

(intervalestimate)在點估計的基礎(chǔ)上,給出總體參數(shù)估計的一個區(qū)間范圍,該區(qū)間由樣本統(tǒng)計量加減抽樣誤差而得到的根據(jù)樣本統(tǒng)計量的抽樣分布能夠?qū)颖窘y(tǒng)計量與總體參數(shù)的接近程度給出一個概率度量比如,某班級平均分?jǐn)?shù)在75~85之間,置信水平是95%

樣本統(tǒng)計量

(點估計)置信區(qū)間置信下限置信上限區(qū)間估計的圖示

X95%的樣本

-1.96

x

+1.96

x99%的樣本

-2.58

x

+2.58x90%的樣本

-1.65

x

+1.65

x抽樣極限誤差(抽樣允許誤差、抽樣邊際誤差)

含義:抽樣極限誤差是指抽樣指標(biāo)和總體指標(biāo)之間抽樣誤差的可能范圍。即,也可用E表示。

意義:由于抽樣誤差是一個隨機變量,因此在實際工作中到底允許抽樣誤差在一個什么樣的范圍內(nèi),這要根據(jù)實際情況來定。影響區(qū)間寬度(E)的因素1. 總體數(shù)據(jù)的離散程度,用來測度樣本容量,

置信水平(1-

),影響

z的大小將構(gòu)造置信區(qū)間的步驟重復(fù)很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例稱為置信水平表示為(1-

為是總體參數(shù)未在區(qū)間內(nèi)的比例

常用的置信水平值有

99%,95%,90%相應(yīng)的

為0.01,0.05,0.10置信水平由樣本統(tǒng)計量所構(gòu)造的總體參數(shù)的估計區(qū)間稱為置信區(qū)間統(tǒng)計學(xué)家在某種程度上確信這個區(qū)間會包含真正的總體參數(shù),所以給它取名為置信區(qū)間

用一個具體的樣本所構(gòu)造的區(qū)間是一個特定的區(qū)間,我們無法知道這個樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值我們只能是希望這個區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個,但它也可能是少數(shù)幾個不包含參數(shù)真值的區(qū)間中的一個置信區(qū)間

(confidenceinterval)§7.5一個總體參數(shù)的區(qū)間估計總體均值的區(qū)間估計總體比例的區(qū)間估計

(一)總體參數(shù)估計的一般模式:即概率保證程度(置信度)已知,求抽樣極限誤差的可能范圍。此模式的具體步驟為:

(1)根據(jù)樣本計算樣本指標(biāo)并以此作為總體指標(biāo)的估計值;

(2)計算樣本標(biāo)準(zhǔn)差以推算抽樣平均誤差。

(3)根據(jù)給定的可信度,查概率表求出概率度z的值。運用概率度z和抽樣平均誤差的關(guān)系式求出抽樣極限誤差E。

(4)最后根據(jù)抽樣極限誤差,對總體指標(biāo)μ的區(qū)間作出估計。

一、總體均值的區(qū)間估計(一)總體均值的區(qū)間估計的一般模式

(例題分析)【例】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,為對產(chǎn)量質(zhì)量進(jìn)行監(jiān)測,企業(yè)質(zhì)檢部門經(jīng)常要進(jìn)行抽檢,以分析每袋重量是否符合要求。現(xiàn)從某天生產(chǎn)的一批食品中隨機抽取了25袋,測得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布,且總體標(biāo)準(zhǔn)差為10克。試估計該批產(chǎn)品平均重量的置信區(qū)間,置信水平為95%25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3總體均值的區(qū)間估計

(例題分析)解:已知:n=25,1-=95%,z

/2=1.96。根據(jù)樣本數(shù)據(jù)計算得:

總體均值

在1-

置信水平下的置信區(qū)間為該食品平均重量的置信區(qū)間為101.44克~109.28克之總體均值的區(qū)間估計

(例題分析)【例】一家保險公司收集到由36投保個人組成的隨機樣本,得到每個投保人的年齡(周歲)數(shù)據(jù)如下表。試建立投保人年齡90%的置信區(qū)間

36個投保人年齡的數(shù)據(jù)233539273644364246433133425345544724342839364440394938344850343945484532總體均值的區(qū)間估計

(例題分析)解:已知n=36,1-=90%,z

/2=1.645。根據(jù)樣本數(shù)據(jù)計算得:,

總體均值

在1-

置信水平下的置信區(qū)間為投保人平均年齡的置信區(qū)間為37.37歲~41.63歲(二)參數(shù)估計的另一種模式

抽樣極限誤差已知,求概率保證程度。此模式的具體步驟為:(1)根據(jù)樣本計算樣本指標(biāo)并以此作為總體指標(biāo)的估計值;計算樣本標(biāo)準(zhǔn)差以推算抽樣平均誤差。(2)根據(jù)給定的抽樣極限誤差,求出總體指標(biāo)的上限和下限,即置信區(qū)間。(3)運用抽樣平均誤差和抽樣極限誤差的關(guān)系式求出的值,然后查概率表求出相應(yīng)的置信度,即概率保證程度。例:某城市進(jìn)行居民家計調(diào)查,隨機抽取400個居民戶,調(diào)查得年平均每戶文化用品消費支出為900元,標(biāo)準(zhǔn)差為200元。要求抽樣允許誤差不超過18元,拭對該市居民年平均每戶文化用品消費支出情況做出估計。解:以92.8%的概率保證程度,估計該市居民戶年均文化用品消費支出在885—915(900-15——900+15)元之間.查表知概率為92.8%二、總體成數(shù)的區(qū)間估計總體成數(shù)的區(qū)間估計

(例題分析)【例】某城市想要估計下崗職工中女性所占的比例,隨機抽取了100個下崗職工,其中65人為女性職工。試以95%的置信水平估計該城市下崗職工中女性比例的置信區(qū)間解:已知n=100,=65%,1-=95%,z/2=1.96該城市下崗職工中女性比例的置信區(qū)間為55.65%~74.35%

§7.6樣本容量的確定估計總體均值時樣本容量的確定估計總體比例時樣本容量的確定影響樣本容量的因素1.總體的變異程度(σ)2.允許誤差的大?。ǎ?.推斷的可靠程度(1-α)4.抽樣方法和抽樣組織方式估計總體均值時樣本容量n為樣本容量n與總體方差

2、允許誤差E、可靠性系數(shù)Z或t之間的關(guān)系為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論