抽樣推斷課件_第1頁
抽樣推斷課件_第2頁
抽樣推斷課件_第3頁
抽樣推斷課件_第4頁
抽樣推斷課件_第5頁
已閱讀5頁,還剩271頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第六章

抽樣推斷

第六章抽樣推斷1第六章

抽樣推斷§1抽樣推斷有關(guān)概念與理論依據(jù)§2抽樣誤差§3抽樣估計和推算§4抽樣推斷的組織形式第六章抽樣推斷§1抽樣推斷有關(guān)概念與理論依據(jù)2第一節(jié)抽樣推斷有關(guān)概念與理論依據(jù)

一、抽樣推斷的意義、內(nèi)容(一)概念

按照隨機原則從總體中抽取一部分單位進行觀察,并根據(jù)被抽取的那部分單位的結(jié)果,對總體作出具有一定可靠程度的推斷。第一節(jié)抽樣推斷有關(guān)概念與理論依據(jù)一、抽樣推斷的意義、內(nèi)容3統(tǒng)計推斷的過程總體總體均值、比例、方差樣本樣本統(tǒng)計量例如:樣本均值、比例、方差統(tǒng)計推斷的過程總體總體均值、比例、方差樣本樣本統(tǒng)計量4(二)特點

1、按照隨機原則抽取部分單位,抽樣推斷運用概率估計的方法。2、部分單位總體。3、抽樣誤差可以計算和控制。(二)特點1、按照隨機原則抽取部分單位,抽樣推斷運5(三)抽樣推斷的內(nèi)容

參數(shù)估計依據(jù)所獲得的樣本觀察資料,對所研究現(xiàn)象總體的水平、結(jié)構(gòu)、規(guī)模等數(shù)量特征進行估計。假設(shè)檢驗利用樣本的實際資料來檢驗事先對總體某些數(shù)量特征所作的假設(shè)是否可信的一種統(tǒng)計分析方法。(三)抽樣推斷的內(nèi)容

參數(shù)估計依據(jù)所獲得的樣本觀察資料6二、抽樣推斷的作用

抽樣調(diào)查方法是市場經(jīng)濟國家在調(diào)查方法上的必然選擇,和普查相比,它具有準確度高、成本低、速度快、應用面廣等優(yōu)點。建立起以周期性普查為基礎(chǔ)、經(jīng)常性抽樣調(diào)查為主體,必要的統(tǒng)計報表、重點調(diào)查、綜合分析等為補充的國家統(tǒng)計調(diào)查方法體系,是我國統(tǒng)計方法制度改革的指導思想。二、抽樣推斷的作用抽樣調(diào)查方法是市場經(jīng)濟國家在調(diào)查方法71.實際工作不可能進行全面調(diào)查觀察,而又需要了解其全面資料的事物;2.雖可進行全面調(diào)查觀察,但比較困難或并不必要;3.對普查或全面調(diào)查統(tǒng)計資料的質(zhì)量進行檢查和修正;4.抽樣方法適用于對大量現(xiàn)象的觀察,即組成事物總體的單位數(shù)量較多的情況;5.利用抽樣推斷的方法,可以對于某種總體的假設(shè)進行檢驗,判斷這種假設(shè)的真?zhèn)?,以決定取舍。1.實際工作不可能進行全面調(diào)查觀察,而又需要了解其全面資料的8三、抽樣推斷的基本概念

(一)全及總體和抽樣總體(總體和樣本)全及總體:所要調(diào)查觀察的全部事物??傮w單位數(shù)用N表示。抽樣總體:抽取出來調(diào)查觀察的單位。抽樣總體的單位數(shù)用n表示。n≥30大樣本n<30小樣本三、抽樣推斷的基本概念(一)全及總體和抽樣總體(總體和樣9(二)抽樣方法

1、重復抽樣:2、不重復抽樣:重復抽樣和不重復抽樣會產(chǎn)生三個差別:

抽取的樣本數(shù)目不同抽樣誤差的計算公式不同抽樣誤差的大小不同(二)抽樣方法

1、重復抽樣:重復抽樣和不重復抽樣會產(chǎn)10

(三)參數(shù)和統(tǒng)計量

(全及指標和抽樣指標、總體指標和樣本指標)

全及指標:全及總體的那些指標。抽樣指標:抽樣總體的那些指標。(三)參數(shù)和統(tǒng)計量

(全及指標和抽樣指標、總體指11研究總體中的數(shù)量標志總體平均數(shù)總體方差X=∑XNX=∑XF∑FΣ(X-X)N2σ=2Σ(X-X)FΣF2σ=2研究總體中的品質(zhì)標志總體成數(shù)成數(shù)方差σ2=P(1-P)P=

N1N參數(shù)研究總體中總體平均數(shù)總體方差X=∑XX=∑XFΣ(X-X)212研究數(shù)量標志樣本平均數(shù)

x=∑xnx=∑xf∑f樣本方差研究品質(zhì)標志樣本成數(shù)

成數(shù)方差

np=n

統(tǒng)計量研究數(shù)量標志樣本平均數(shù)x=∑xnx=∑xf∑f樣本方差研13

(四)樣本容量——指一個樣本所包括的單位數(shù)。

(五)抽樣比例——抽樣比例是指在抽取樣本時,所抽取的樣本單位數(shù)與總體單位數(shù)之比。

(四)樣本容量——指一個樣本所包括的單位數(shù)。(五)抽14(六)樣本個數(shù)——指從總體中可能抽取的最多的樣本數(shù)量。1、重復抽樣:2、不重復抽樣:(六)樣本個數(shù)——指從總體中可能抽取的最多的樣本數(shù)量。1、重15考慮順序不考慮順序不重復抽樣重復抽樣可能樣本數(shù)目的計算公式考慮順序不考慮順序不重復抽樣重復抽樣可能樣本數(shù)目的計算公式16

置信度也稱為可靠度,或置信水平、置信系數(shù)。即在抽樣對總體參數(shù)作出估計時,由于樣本的隨機性,其結(jié)論總是不確定的。因此,采用一種概率的陳述方法,也就是數(shù)理統(tǒng)計中的區(qū)間估計法,即估計值與總體參數(shù)在一定允許的誤差范圍以內(nèi),其相應的概率有多大,這個相應的概率稱作置信度。(七)

置信度(七)置信度17(一)大樣本統(tǒng)計量分布的依據(jù)-中心極限定理四、抽樣推斷的理論依據(jù)

1、正態(tài)分布(1)正態(tài)分布模型

如果連續(xù)型隨機變量X的概率密度的函數(shù)為:其中σ>0,μ和σ均為常數(shù),則稱X服從參數(shù)為μ和σ的正態(tài)分布,記作X~(μ,σ2)。(一)大樣本統(tǒng)計量分布的依據(jù)-中心極限定理四、抽樣推斷的理論18(2)正態(tài)分布的分布函數(shù)(2)正態(tài)分布的分布函數(shù)19若,對其進行“標準化”變換,即令則(3)一般正態(tài)分布的標準化若,202、中心極限定理一般意義:無論隨機變量服從何種分布,只要樣本容量足夠大,都可以近似地看作是服從正態(tài)分布。中心極限定理說明,大量相互獨立的隨機變量和的概率分布是以正態(tài)分布為極限的。由于正態(tài)分布在概率論中占有的中心地位,中心極限定理因此而得名。2、中心極限定理一般意義:21(1)獨立同分布的中心極限定理

設(shè)隨機變量X1,X2,…,Xn相互獨立,服從同一分布,且有有限的數(shù)學期望和方差,則隨機變量的分布函數(shù)滿足如下極限式(1)獨立同分布的中心極限定理設(shè)隨22定理的應用:對于獨立的隨機變量序列,不管服從什么分布,只要它們是同分布,且有有限的數(shù)學期望和方差,那么,當n充分大時,這些隨機變量之和近似地服從正態(tài)分布定理的應用:對于獨立的隨機變量序列,不23(2)棣莫弗—拉普拉斯中心極限定理

定理設(shè)隨機變量服從二項分布,則對于任意區(qū)間,恒有二項分布的極限分布是正態(tài)分布即如果,則(2)棣莫弗—拉普拉斯中心極限定理定24一般地,如果,則一般地,如果,則251、t分布及小樣本均值的分布律(二)小樣本統(tǒng)計量的分布律1、t分布及小樣本均值的分布律(二)小樣本統(tǒng)計量的分布律26設(shè)隨機變量X~N(0,1),Y~

2(n)

,且X與Y相互獨立,則稱統(tǒng)計量服從自由度為n的t分布或?qū)W生氏分布,記作t分布的概率密度函數(shù)為T~t(n).其圖形如圖5-6所示(P106),其形狀類似標準正態(tài)分布的概率密度的圖形.當n較大時,t分布近似于標準正態(tài)分布.設(shè)隨機變量27當n較大時,t分布近似于標準正態(tài)分布.一般說來,當n>30時,t分布與標準正態(tài)分布N(0,1)就非常接近.但對較小的n值,t分布與標準正態(tài)分布之間有較大差異.且P{|T|≥t0}≥P{|X|≥t0},其中X~N(0,1),即在t分布的尾部比在標準正態(tài)分布的尾部有著更大的概率.t

分布的數(shù)學期望與方差設(shè)T~t

(n),則E(T)=0,D(T)=當n較大時,t分布近似于標準正態(tài)分布.一28設(shè)(X1,X2,…,Xn)為來自正態(tài)總體X~N(

,

2)的樣本,則統(tǒng)計量證由于與S

2相互獨立,且由定義5.4得設(shè)(X1,X2,…,Xn)為來自正態(tài)總體證由于與S2相互獨29

設(shè)(X1,X2,…,Xn1)和(Y1,Y2,…,Yn2)分別是來自正態(tài)總體N(1

,2)和N(2

,2)的樣本,且它們相互獨立,則統(tǒng)計量其中、分別為兩總體的樣本方差.設(shè)(X1,X2,…,Xn1)和(Y1,Y2,…,Yn230——分布

定義設(shè)總體,是的一個樣本,則稱統(tǒng)計量服從自由度為n的分布,記作自由度是指獨立隨機變量的個數(shù),n個相互獨立的標準正態(tài)分布之平方和服從自由度為n的分布——分布定義設(shè)總體31五、抽樣推斷的基本原理舉例說明五、抽樣推斷的基本原理舉例說明32總體方差已知時總體均值μ的區(qū)間估計當X~,可以證明抽自該總體的簡單隨機樣本X1,X2,…,Xn的樣本平均數(shù)服從數(shù)學期望為,方差為的正態(tài)分布,即~

采用統(tǒng)計量Z,將非標準正態(tài)分布轉(zhuǎn)化為標準正態(tài)分布,~N(0,1)例總體方差已知時總體均值μ的區(qū)間估計當X~33對于給定的置信概率,可以查正態(tài)分布表,(即概率度t)使得:得出相應的臨界值對于給定的置信概率,可以查正態(tài)分布表,(即概率度t)使得:得34即在給定的顯著性水平下,總體均值在的置信概率下的置信區(qū)間為

即在給定的顯著性水平下,總體均值在35第二節(jié)抽樣誤差

一、抽樣誤差的概念及種類在抽樣調(diào)查中,總體指標與樣本指標不一致,兩者的偏差稱為抽樣誤差。第二節(jié)抽樣誤差一、抽樣誤差的概念及種類在抽樣調(diào)查36

抽樣誤差即指隨機誤差,這是抽樣調(diào)查固有的誤差,是無法避免的。抽樣誤差即指隨機誤差,這是抽樣調(diào)查固有的誤差,是無法避免37抽樣誤差的作用:1.在于說明樣本指標的代表性大小。

誤差大,則樣本指標代表性低; 誤差小,則樣本指標代表性高; 誤差等于0,則樣本指標和總體指標一樣大。2.說明樣本指標和總體指標相差的一般范圍。抽樣誤差的作用:1.在于說明樣本指標的代表性大小。2.說38二、抽樣平均誤差

(一)概念

抽樣平均誤差是所有可能出現(xiàn)的樣本指標的標準差。反映樣本指標與總體指標之間誤差的一般水平。通常用μ表示。即是由于抽樣的隨機性而產(chǎn)生的樣本指標與總體指標之間的平均離差。二、抽樣平均誤差

(一)概念抽樣平均誤差是所有可39(二)理論公式(二)理論公式40例例411020304050102030405010203040501020304050102030405050合計102030405010203040501020304050421010-204002015-152253020-101004025-5255030001015-152252020-101003025-52540300050355251020-101002025-52530300040355255040101001025-5252030003035525404010100504515225103000203552530401010040451522550505020400合計--25001010-204002015-152253020-143第6章抽樣推斷課件44(三)實際計算公式(以純隨機抽樣為例)1.重復抽樣2.不重復抽樣(三)實際計算公式(以純隨機抽樣為例)1.重復抽樣2.不重45總體方差未知時解決方法:1、用樣本方差代替2、用過去全面調(diào)查的資料,也可以用過去抽樣調(diào)查的資料代替??傮w方差未知時解決方法:1、用樣本方差代替2、用過去全面調(diào)查46

某燈泡廠從一天所生產(chǎn)的產(chǎn)品10,000個中抽取100個檢查其壽命,得平均壽命為2000小時,根據(jù)以往資料σ=20小時,試求抽樣平均誤差。例重復抽樣:不重復抽樣:某燈泡廠從一天所生產(chǎn)的產(chǎn)品10,000個中抽取100個檢47

某玻璃器皿廠某日生產(chǎn)15000只印花玻璃杯,現(xiàn)按重復抽樣方法從中抽取150只進行質(zhì)量檢驗,有147只合格,試求這批印花玻璃杯合格率的抽樣平均誤差。例某玻璃器皿廠某日生產(chǎn)15000只印花玻璃杯,現(xiàn)按48(四)影響抽樣誤差的因素:

4.不同的抽樣組織形式。1.全及總體標志變異程度。2.抽樣單位數(shù)目的多少。3.不同的抽樣方法。(四)影響抽樣誤差的因素:1.全及總體標志變異程度。2.49例:假定抽樣單位數(shù)增加2倍、0.5倍時,其他條件不變,抽樣平均誤差怎樣變化?解:抽樣單位數(shù)增加2倍,即為原來的3倍抽樣單位數(shù)增加0.5倍,即為原來的1.5倍即:當樣本單位數(shù)增加2倍時,抽樣平均誤差為原來的0.577倍。即:當樣本單位數(shù)增加0.5倍時,抽樣平均誤差為原來的0.8165倍。例:假定抽樣單位數(shù)增加2倍、0.5倍時,解:抽樣單位數(shù)增50例:假定抽樣平均誤差縮小40%時,其他條件不變,抽樣單位數(shù)怎樣變化?解:抽樣平均誤差縮小40%時,

即為原來的60%,即:當抽樣平均誤差縮小40%時,樣本單位數(shù)增加1.78倍。例:假定抽樣平均誤差縮小40%時,其他條件不變,抽樣單位數(shù)怎51一、抽樣極限誤差樣本指標與總體指標之間允許的誤差范圍叫抽樣極限誤差。也稱抽樣允許誤差。它是樣本指標可允許變動的上限或下限與總體指標之差的絕對值。即:第三節(jié)抽樣估計和推算

一、抽樣極限誤差樣本指標與總體指標之間允許的誤差范圍52根據(jù)中心極限定理,得知當n足夠大時,抽樣總體為正態(tài)分布,根據(jù)正態(tài)分布規(guī)律可知,樣本指標是以一定的概率落在某一特定的區(qū)間內(nèi),統(tǒng)計上把這個給定的區(qū)間叫抽樣極限誤差,也稱置信區(qū)間,即在概率F(t)的保證下:

△=tμ,(t為概率度)根據(jù)中心極限定理,得知當n足夠大時,抽樣總體為正態(tài)分53當F(t)=68.27%時,抽樣極限誤差等于抽樣平均誤差的1倍(t=1);當F(t)=95.45%時,抽樣極限誤差等于抽樣平均誤差的2倍(t=2);當F(t)=99.73%時,抽樣極限誤差等于抽樣平均誤差的3倍(t=3);例可見,抽樣極限誤差,即擴大或縮小了以后的抽樣誤差范圍。當F(t)=68.27%時,抽樣極限誤差等于抽樣平均誤差的154上例資料編成次數(shù)分配表如下:樣本數(shù)f101-20152-15203-10254-530503545403104521550120合計25-上例資料編成次數(shù)分配表如下:樣本數(shù)f101-2015255-30樣本個數(shù)樣本頻率樣本累計頻率05101520合計-30樣本個數(shù)樣本頻率樣本累計頻率56-30樣本個數(shù)樣本頻率樣本累計頻率050.200.20580.320.521060.240.761540.160.922020.081.00

合計251.00--P409-30樣本個數(shù)樣本頻率樣本累57(一)點估計二、抽樣估計方法(定值估計)點估計點估計的方法有矩估計法順序統(tǒng)計量法最大似然法最小二乘法理論基礎(chǔ)是抽樣分布(一)點估計二、抽樣估計方法(定值估計)點估計點估計的方法有58

=S2

設(shè)表示總體平均數(shù)的估計量,表示總體成數(shù)P的估計量,表示總體方差的估計量,則點估計的基本公式為:=S2設(shè)表示總體平均數(shù)的估計量59點估計量優(yōu)劣的標準:(三)有效性

(一)無偏性(二)一致性點估計量優(yōu)劣的標準:(三)有效性(一)無偏性(二)一致性601.無偏性設(shè)為未知參數(shù)的估計量,若估計量的期望等于未知參數(shù)的真值,即則稱為的無偏估計量。1.無偏性設(shè)為未知參數(shù)的估計量,若估計量的期望等于未知參數(shù)的61

無偏性

估計量的數(shù)學期望等于被估計的總體參數(shù)P(X)XCA無偏有偏無偏性估計量的數(shù)學期望等于被估計的總體參數(shù)P(X62對于任意給定的ε>0,有對于這種極限,我們稱估計量依概率收斂于。2.一致性對于任意給定的ε>0,有2.一致性63

一致性

隨著樣本容量的增大,估計量越來越接近被估計的總體參數(shù)AB較小的樣本容量較大的樣本容量P(X)X

一致性隨著樣本容量的增大,估計量越來越643.有效性設(shè)為的兩個無偏估計量,的方差小于的方差,即V()<V()則稱是較有效的估計量。3.有效性設(shè)為的兩個無偏估計量,的方差小于的方差,即V()<65

有效性

AB中位數(shù)的抽樣分布均值的抽樣分布XP(X)

一個方差較小的無偏估計量稱為一個更有效的估計量。如,與其他估計量相比,樣本均值是一個更有效的估計量

有效性AB中位數(shù)的抽樣分布均值的抽樣分布XP(X66(二)區(qū)間估計是根據(jù)樣本指標和抽樣誤差去推斷全及指標的可能范圍,并能反映出估計的準確程度和把握程度。

由于區(qū)間估計所表示的是一個可能的范圍,而不是一個絕對可靠的范圍。就是說,推斷全及指標在這個范圍內(nèi)只有一定的把握程度。用數(shù)學的語言講,就是有一定的概率。

區(qū)間估計(二)區(qū)間估計是根據(jù)樣本指標和抽樣誤差去推斷全及指標的可67落在總體均值某一區(qū)間內(nèi)的樣本X95.45%的樣本99.73%的樣本x-368.27%的樣本x-2x-X+3X+2X+x落在總體均值某一區(qū)間內(nèi)的樣本X95.45%的樣本99.7368第6章抽樣推斷課件69換句話說,對于總體的被估計指標X,找出樣本的兩個估計量x1和x2,使被估計指標X落在區(qū)間(x1,x2)內(nèi)的概率1-α0<α<1,為已知的。即P(x1≤X≤x2)=1-α是給定的。我們稱區(qū)間(x1,x2)為總體指標X的置信區(qū)間,其估計置信度為1一α,稱α為顯著性水平,x1是置信下限,x2是置信上限。換句話說,對于總體的被估計指標X,找出樣本的兩個估計量x1和70??71

某農(nóng)場進行小麥產(chǎn)量的抽樣調(diào)查,該農(nóng)場小麥播種面積為10000畝,采用不重復的簡單隨機抽樣從中選100畝作為樣本,進行實割實測,得到樣本的平均畝產(chǎn)量為400千克,樣本標準差為12千克。試以概率95.45%保證,估計該農(nóng)場10000畝小麥平均畝產(chǎn)量的可能范圍。例某農(nóng)場進行小麥產(chǎn)量的抽樣調(diào)查,該農(nóng)場小麥播種面積為172

某農(nóng)場進行小麥產(chǎn)量的抽樣調(diào)查,該農(nóng)場小麥播種面積為10000畝,采用不重復的簡單隨機抽樣從中選100畝作為樣本,進行實割實測,得到樣本的平均畝產(chǎn)量為400千克,樣本標準差為12千克。試以概率95.45%保證,估計該農(nóng)場10000畝小麥平均畝產(chǎn)量的可能范圍。則:例某農(nóng)場進行小麥產(chǎn)量的抽樣調(diào)查,該農(nóng)場小麥播種面積為173

某機械廠日產(chǎn)某種產(chǎn)品8000件,現(xiàn)采用純隨機重復抽樣方式,從中抽取400件進行觀察,其中有380件為一級品,試以概率95.45%的可靠程度推斷全部產(chǎn)品的一級品率及一級品數(shù)量的范圍。例某機械廠日產(chǎn)某種產(chǎn)品8000件,現(xiàn)采用純隨機重復抽樣方74

某機械廠日產(chǎn)某種產(chǎn)品8000件,現(xiàn)采用純隨機重復抽樣方式,從中抽取400件進行觀察,其中有380件為一級品,試以概率95.45%的可靠程度推斷全部產(chǎn)品的一級品率及一級品數(shù)量的范圍。例某機械廠日產(chǎn)某種產(chǎn)品8000件,現(xiàn)采用純隨機重復抽樣方75三、全及總體總量指標的推斷三、全及總體總量指標的推斷76(一)直接推斷法1.如果采用點估計方法:上例1中:400×10000=400(萬千克)如果用區(qū)間估計方法:上例1中該農(nóng)場小麥總產(chǎn)量的范圍為:t=2:(397.62~402.38)×10000=397.62~402.38(萬千克)t=3:(396.43~403.57)×10000=396.43~403.57(萬千克)2.上例2中,全部一級品數(shù)量的范圍為:(92.82%~97.18%)×8000=7425.6~7774.4(件)(一)直接推斷法1.如果采用點估計方法:上例1中:400×77(二)修正系數(shù)法

就是用抽樣所得的調(diào)查結(jié)果同有關(guān)資料對比的系數(shù)來修正全面統(tǒng)計資料時采用的一種方法。(二)修正系數(shù)法就是用抽樣所得的調(diào)查結(jié)果同有關(guān)資料對78

某村6000農(nóng)戶,2005年年末統(tǒng)計養(yǎng)豬頭數(shù),上報的是9000頭,現(xiàn)抽10%(600戶)的農(nóng)戶復查,發(fā)現(xiàn)有漏報,也有重報。按600戶,原來數(shù)字是890頭,實際復查為935頭。例1某村6000農(nóng)戶,2005年年末統(tǒng)計養(yǎng)豬頭數(shù),上報的79某市房地局,年報工資總額3218.1萬元?,F(xiàn)抽查14個單位:年報:415.03萬元多報:0.44萬元少報:1.47萬元抵沖后1.47-0.44=1.03(萬元)例2某市房地局,年報工資總額3218.1萬元。例280

第四節(jié)抽樣設(shè)計與組織實施一、抽樣設(shè)計的有關(guān)問題(一)設(shè)計抽樣調(diào)查方案的基本要求1、遵循隨機原則2、控制誤差范圍3、考慮投入產(chǎn)出關(guān)系4、保證必要的樣本容量5、選擇適宜的抽樣組織方式第四節(jié)抽樣設(shè)計與組織實施一、抽樣設(shè)計的有關(guān)問題(一81(二)抽樣框的編制抽樣框一般有三種形式:

1、名錄抽樣框2、區(qū)域抽樣框3、時間抽樣框一個理想的抽樣框的要求是,它應該盡可能地與目標總體相一致。一般而言,如果總體中的每個元素在清單上分別只出現(xiàn)一次,且清單上又沒有總體以外的其他元素出現(xiàn),則該清單就是一個完備的抽樣框。在完備的抽樣框中,每個元素必須且只能同一個號碼對應。(二)抽樣框的編制抽樣框一般有三種形式:一個理想的抽82簡單隨機抽樣(純隨機抽樣)類型抽樣(分類抽樣)機械抽樣(等距抽樣)整群抽樣(分群抽樣)二、抽樣組織方式

簡單隨機抽樣(純隨機抽樣)類型抽樣(分類抽樣)機械抽樣(等距83(一)簡單隨機抽樣(純隨機抽樣)1、內(nèi)容:

2、隨機抽取樣本的具體做法:

(1)直接抽取法;(2)抽簽法;(3)隨機數(shù)字表法。

對總體中所有單位除編號外不加任何處理,完全隨機地抽取調(diào)查單位。(一)簡單隨機抽樣(純隨機抽樣)1、內(nèi)容:2、隨機抽取樣本的843、特點:(1)是最基本的抽樣方式;

(2)簡便易行;(3)適用于總體單位數(shù)不太多的均勻總體。3、特點:(1)是最基本的抽樣方式;(2)簡便易行;(3)適85※(四個公式)4、抽樣平均誤差的計算

5、總體指標的區(qū)間估計※(兩個不等式)※(四個公式)4、抽樣平均誤差的計算

5、總體指標的區(qū)間86例1:

從某縣農(nóng)民家庭中隨機抽取100戶調(diào)查其年收入情況,農(nóng)民家庭按年人均純收入分組資料如下,試以95%的概率保證程度對全縣農(nóng)民家庭的年人均純收入和年人均純收入在10000元以上戶數(shù)所占比重作出區(qū)間估計.年人均純收入(元)戶數(shù)(戶)9000以下39000-10000710000-110002811000-120003212000-130002013000以上10合計100例1:從某縣農(nóng)民家庭中隨機抽取10087例1:

從某縣農(nóng)民家庭中隨機抽取100戶調(diào)查其年收入情況,農(nóng)民家庭按年人均純收入分組資料如下,試以95%的概率保證程度對全縣農(nóng)民家庭的年人均純收入和年人均純收入在10000元以上戶數(shù)所占比重作出區(qū)間估計.年人均純收入(元)

戶數(shù)(戶)f

x

xf

9000以下39000-10000710000-110002811000-120003212000-130002013000以上10合計100例1:從某縣農(nóng)民家庭中隨機抽取100戶調(diào)查其年收入88例1:從某縣農(nóng)民家庭中隨機抽取100戶調(diào)查其年收入情況,農(nóng)民家庭按年人均純收入分組資料如下,試以95%的概率保證程度對全縣農(nóng)民家庭的年人均純收入和年人均純收入在10000元以上戶數(shù)所占比重作出區(qū)間估計.年人均純收入(元)

戶數(shù)(戶)f

x

xf

9000以下3850025500250563009000-1000079500665002500470010000-1100028105002940002217880011000-1200032115003680038720012000-130002012500250002464200013000以上101350013500044521000合計100-1139000141790000例1:從某縣農(nóng)民家庭中隨機抽取100戶調(diào)查其年收入89第6章抽樣推斷課件90第6章抽樣推斷課件91例2:

電視臺某欄目主持人欲知觀眾對該欄目是否喜歡,隨機抽取400名觀眾調(diào)查,其中喜歡的有240人.試在95.45%的概率保證下,估計喜歡該欄目的觀眾比重范圍.如果該主持人希望估計的誤差不超過5%,則有多大的把握程度?例2:電視臺某欄目主持人欲知觀眾對該欄92第6章抽樣推斷課件93例3:某學校隨機抽查10名男生,平均身高170cm,標準差12cm,問有多大把握估計全校男生身高介于160.5—179.5cm之間?例3:某學校隨機抽查10名男生,平均身高1794(二)類型抽樣(分類抽樣)

1、內(nèi)容:

先對總體各單位按一定標志加以分類(組),然后再從各類(組)中按隨機原則抽取樣本。2、樣本分配形式:(1)等比例抽樣;(2)不等比例抽樣。(二)類型抽樣(分類抽樣)1、內(nèi)容:先對總體各95(3)抽樣調(diào)查成本較低。3、特點:(1)先分組,后抽樣;(2)樣本代表性高、抽樣誤差較??;(3)抽樣調(diào)查成本較低。3、特點:(1)先分組,后抽樣;(964、抽樣平均誤差的計算:(1)重復抽樣:(2)不重復抽樣:4、抽樣平均誤差的計算:(1)重復抽樣:(2)不重復抽樣:97第6章抽樣推斷課件985、總體指標的區(qū)間估計

兩個不等式5、總體指標的區(qū)間估計兩個不等式99

某農(nóng)場種小麥12000公頃,其中平原3600公頃,丘陵6000公頃,山地2400公頃?,F(xiàn)用類型等比例抽樣調(diào)查1200公頃,平均單位面積產(chǎn)量15000千克,高產(chǎn)田面積比重79%。資料如下表。①試以68.27%概率保證估計該農(nóng)場小麥單位面積產(chǎn)量的區(qū)間。②以同樣概率保證估計該農(nóng)場小麥高產(chǎn)田面積比重的區(qū)間。類型全場播種面積(公頃)抽樣調(diào)查面積(公頃)單位面積產(chǎn)量不均勻程度指標(千克)高產(chǎn)田比重(%)

丘陵地區(qū)600075080平原地區(qū)360084090山地2400100060合計120001200--例某農(nóng)場種小麥12000公頃,其中平原3600公頃100

某農(nóng)場種小麥12000公頃,其中平原3600公頃,丘陵6000公頃,山地2400公頃?,F(xiàn)用類型等比例抽樣調(diào)查1200公頃,平均單位面積產(chǎn)量15000千克,高產(chǎn)田面積比重79%。資料如下表。①試以68.27%概率保證估計該農(nóng)場小麥單位面積產(chǎn)量的區(qū)間。②以同樣概率保證估計該農(nóng)場小麥高產(chǎn)田面積比重的區(qū)間。類型全場播種面積(公頃)抽樣調(diào)查面積(公頃)單位面積產(chǎn)量不均勻程度指標(千克)高產(chǎn)田比重(%)

pi

Niniσi丘陵地區(qū)600075080平原地區(qū)360084090山地2400100060合計120001200--例某農(nóng)場種小麥12000公頃,其中平原3600公頃101

某農(nóng)場種小麥12000公頃,其中平原3600公頃,丘陵6000公頃,山地2400公頃?,F(xiàn)用類型等比例抽樣調(diào)查1200公頃,平均單位面積產(chǎn)量15000千克,高產(chǎn)田面積比重79%。資料如下表。①試以68.27%概率保證估計該農(nóng)場小麥單位面積產(chǎn)量的區(qū)間。②以同樣概率保證估計該農(nóng)場小麥高產(chǎn)田面積比重的區(qū)間。類型全場播種面積(公頃)抽樣調(diào)查面積(公頃)單位面積產(chǎn)量不均勻程度指標(千克)高產(chǎn)田比重(%)

pi

Niniσi丘陵地區(qū)600060075080平原地區(qū)360036084090山地2400240100060合計120001200--例337500000254016000240000000831516000某農(nóng)場種小麥12000公頃,其中平原3600公頃102第6章抽樣推斷課件103類別高產(chǎn)田比重(%)非高產(chǎn)田比重(%)麥田不均勻程度指標(%)抽樣調(diào)查面積(公頃)pi(1-pi)nipi1-pipi(1-pi)ni丘陵80201660096.0平原9010936032.4山地60402424057.6合計---1200186類別高產(chǎn)田比重(%)非高產(chǎn)田比重(%)麥田不均勻程度指標(%104第6章抽樣推斷課件105(三)機械抽樣(等距抽樣)

先將全及總體的所有單位按某一標志順序排隊,然后按固定的間隔抽取樣本。1、內(nèi)容:(1)無關(guān)標志:選擇標志與抽樣調(diào)查內(nèi)容無關(guān)。(2)有關(guān)標志:選擇標志與抽樣調(diào)查內(nèi)容有關(guān)。(三)機械抽樣(等距抽樣)先將全及總體的所有單位按某一1062、樣本抽取方法:(1)隨機起點等距抽樣kkkk+a2k+a(n-1)k+aak(k為抽取間隔)2、樣本抽取方法:(1)隨機起點等距抽樣kk107(2)半距起點等距抽樣kkkk(k為抽取間隔)(2)半距起點等距抽樣kk108(3)對稱等距抽樣kkk2k-a2k+a4k-a4k+aak(k為抽取間隔)(3)對稱等距抽樣kkk21093、特點:

(2)第一個樣本是隨機的;后面的樣本是確定的;(1)先排隊,后抽樣;按無關(guān)標志排隊,相當于簡單隨機抽樣,按有關(guān)標志排隊,相當于類型抽樣。(3)注意避免抽樣間隔與現(xiàn)象本身的周期重合。3、特點:(2)第一個樣本是隨機的;后面的樣本是確定的;(1104、抽樣平均誤差的計算(不重復抽樣):(1)無關(guān)標志排隊,按簡單隨機抽樣方法計算。4、抽樣平均誤差的計算(不重復抽樣):(1)無關(guān)標志排隊,按111(2)有關(guān)標志排隊,按類型抽樣的方法計算。(2)有關(guān)標志排隊,按類型抽樣的方法計算。1125、總體指標的區(qū)間估計兩個不等式5、總體指標的區(qū)間估計兩個不113(四)整群抽樣(分群抽樣)

先將總體分成若干群,再以群為單位從總體中抽取樣本群,對抽中的群內(nèi)所有單位都進行觀察。2、特點:(2)一般比其它抽樣方式的抽樣誤差大。(3)抽樣誤差受群間方差的影響。(1)工作比較簡單;1、內(nèi)容:(四)整群抽樣(分群抽樣) 2、特點:(2)一般比其它抽114第6章抽樣推斷課件1153、抽樣平均誤差的計算(不重復抽樣)

:3、抽樣平均誤差的計算(不重復抽樣):1164、總體指標的區(qū)間估計兩個不等式4、總體指標的區(qū)間估計兩個不等式117

把某企業(yè)大量生產(chǎn)的一種零件分成288群,現(xiàn)從中抽取24群產(chǎn)品進行檢驗,用以檢查產(chǎn)品的合格率,檢查結(jié)果如下表。試以99.73%的概率保證估計全部零件合格率的區(qū)間。合格率%群數(shù)

802

854

9012

953

983

合計24

例把某企業(yè)大量生產(chǎn)的一種零件分成288群,現(xiàn)從118合格率%群數(shù)ripipiri8020.801.6-0.09960.019848540.853.4-0.04960.0098490120.9010.80.000409530.952.850.05040.007629830.982.940.08040.01939合計24-21.59-0.05669例合格率%群數(shù)ripipiri8020.801.119例例120三、抽樣數(shù)目的確定(一)影響必要抽樣數(shù)目的因素三、抽樣數(shù)目的確定(一)影響必要抽樣數(shù)目的因素121(二)必要抽樣數(shù)目的計算(簡單隨機抽樣)(二)必要抽樣數(shù)目的計算(簡單隨機抽樣)122建筑工地打土方工人4000人,需測定平均每人工作量,要求誤差范圍不超過0.2M3,并需有99.73%保證程度。根據(jù)過去資料σ為1.5M3、1.36M3和1.48M3,求樣本數(shù)應是多少?如果誤差范圍縮小一半,其他條件不變,樣本數(shù)又應是多少?例1建筑工地打土方工人4000人,需測定平均每人工作量,123

某筆廠月產(chǎn)10000支金筆,以前多次抽樣調(diào)查,一等品率為90%、92%、96%和94%,現(xiàn)在要求誤差范圍在2%之內(nèi),可靠程度達95.45%,問必須抽取多少單位數(shù)?例2某筆廠月產(chǎn)10000支金筆,以前多次抽樣調(diào)查,一等品124注意:必要抽樣數(shù)目計算時方差問題:1、取最大值。最大2、p取最接近0.5的值。

最小0.5注意:必要抽樣數(shù)目計算時方差問題:125一、名詞解釋

二、簡答三、判斷抽樣推斷

抽樣誤差

抽樣平均誤差

抽樣極限誤差

1、影響抽樣平均誤差大小的因素有哪些?2、影響樣本容量的因素有哪些?1、重復抽樣的抽樣誤差不一定大于不重復抽樣的抽樣誤差。()一、名詞解釋

二、簡答三、判斷抽樣推斷抽樣誤差抽樣平均誤126三、選擇

2、因為不知道總體方差或標準差,所以無法計算抽樣平均誤差。()3、抽樣平均誤差總是小于抽樣極限誤差。()

4、在簡單隨機抽樣中,如果重復抽樣的抽樣極限誤差增長40%,其它條件不變,則樣本單位數(shù)只需要原來的一半左右。()1、抽樣調(diào)查的主要目的()A、用樣本指標來推算總體指標B、對調(diào)查單位作深入研究C、計算和控制抽樣誤差D、廣泛運用數(shù)學方法三、選擇

2、因為不知道總體方差或標準差,所以無法計算抽樣1272、抽樣平均誤差反映了樣本指標與總體指標之間的()A、實際誤差B、實際誤差的絕對值C、平均誤差程度D、可能誤差范圍3、反映樣本指標與總體指標之間抽樣誤差可能范圍的指標是()A、抽樣平均誤差B、抽樣極限誤差C、抽樣允許誤差D、精確程度3、反映樣本指標與總體指標之間抽樣誤差可能范圍的1284、在其他條件不變的情況下,提高抽樣估計的可靠程度,其精確程度將()A、保持不變B、隨之擴大C、隨之縮小D、無法確定5、極限誤差與抽樣平均誤差數(shù)值之間的關(guān)系為()A、前者一定小于后者B、前者一定大于后者C、前者一定等于后者D、前者既可以大于后者,也可以小于后者6、成數(shù)方差的最大值,是()A、0.1B、0.9C、0.25D、0.54、在其他條件不變的情況下,提高抽樣估計的可靠程度,其精確程1297、在其它條件不變的情況下,抽樣單位數(shù)增加一半,則抽樣平均誤差()A、縮小為原來的81.6%B、縮小為原來的50%C、縮小為原來的25%D、擴大為原來的四倍8、在簡單隨機重復抽樣條件下,為使抽樣誤差減少一半,樣本容量應增加()A、4倍B、3倍C、2倍D、1倍9、在一定的抽樣平均誤差條件下()A、擴大極限誤差范圍,可以提高推斷的可靠程度B、擴大極限誤差范圍,會降低推斷的可靠程度C、縮小極限誤差范圍,可以提高推斷的可靠程度D、縮小極限誤差范圍,不改變推斷的可靠程度7、在其它條件不變的情況下,抽樣單位數(shù)增加一半,則抽樣平均誤130

某地區(qū)2007年隨機抽取100戶住戶,測得戶均月收入為3000元,標準差為400元,

其中有10戶的戶均月收入在6000元以上,若以95.45%的概率保證程度,試估計:

(1)該地區(qū)住戶戶均月收入的可能范圍

(2)在全部住戶中,戶均月收入在6000元以上的戶數(shù)所占比重的可能范圍。

某地區(qū)2007年隨機抽取100戶住戶,測得戶均月收入131

一批商品10000件運抵倉庫,隨機抽取100件檢驗其質(zhì)量,發(fā)現(xiàn)有10件不合格,試以95.45%的概率保證程度對該批商品的合格率作出區(qū)間估計。若誤差范圍縮小一半,其他條件不變,問需要從總體中抽取多少件商品進行檢驗?一批商品10000件運抵倉庫,隨機抽取100件檢驗132

某廠對產(chǎn)品使用壽命進行檢測,用簡單隨機不重復抽樣方法從5000個成品中抽取200個,對其進行壽命調(diào)查,測得樣本平均壽命為4340小時,樣本標準差為731小時。(1)試以95%的概率保證程度對該批產(chǎn)品的平均使用壽命進行區(qū)間估計。(2)若概率保證程度不變,極限誤差不超過70小時,按重復抽樣方法,則至少要抽取多少件產(chǎn)品為樣本。

某廠對產(chǎn)品使用壽命進行檢測,用簡133

從某個年級學生中按簡單隨機抽樣方式抽取40學生,對統(tǒng)計課的考試成績進行檢查,得知其平均分數(shù)為78.75分,標準差為12.13分。要求:

(1)試以95.45%的概率保證程度推斷全年級學生考試成績的區(qū)間范圍。

(2)若誤差范圍縮小一半,其他條件不變,問需要抽取多少名學生?

從某個年級學生中按簡單隨機抽樣方式抽取40學生,對統(tǒng)134P248訓練資料2P248135第6章抽樣推斷課件136P249訓練資料P249137

EndofChapter6EndofChapter6138第六章

抽樣推斷

第六章抽樣推斷139第六章

抽樣推斷§1抽樣推斷有關(guān)概念與理論依據(jù)§2抽樣誤差§3抽樣估計和推算§4抽樣推斷的組織形式第六章抽樣推斷§1抽樣推斷有關(guān)概念與理論依據(jù)140第一節(jié)抽樣推斷有關(guān)概念與理論依據(jù)

一、抽樣推斷的意義、內(nèi)容(一)概念

按照隨機原則從總體中抽取一部分單位進行觀察,并根據(jù)被抽取的那部分單位的結(jié)果,對總體作出具有一定可靠程度的推斷。第一節(jié)抽樣推斷有關(guān)概念與理論依據(jù)一、抽樣推斷的意義、內(nèi)容141統(tǒng)計推斷的過程總體總體均值、比例、方差樣本樣本統(tǒng)計量例如:樣本均值、比例、方差統(tǒng)計推斷的過程總體總體均值、比例、方差樣本樣本統(tǒng)計量142(二)特點

1、按照隨機原則抽取部分單位,抽樣推斷運用概率估計的方法。2、部分單位總體。3、抽樣誤差可以計算和控制。(二)特點1、按照隨機原則抽取部分單位,抽樣推斷運143(三)抽樣推斷的內(nèi)容

參數(shù)估計依據(jù)所獲得的樣本觀察資料,對所研究現(xiàn)象總體的水平、結(jié)構(gòu)、規(guī)模等數(shù)量特征進行估計。假設(shè)檢驗利用樣本的實際資料來檢驗事先對總體某些數(shù)量特征所作的假設(shè)是否可信的一種統(tǒng)計分析方法。(三)抽樣推斷的內(nèi)容

參數(shù)估計依據(jù)所獲得的樣本觀察資料144二、抽樣推斷的作用

抽樣調(diào)查方法是市場經(jīng)濟國家在調(diào)查方法上的必然選擇,和普查相比,它具有準確度高、成本低、速度快、應用面廣等優(yōu)點。建立起以周期性普查為基礎(chǔ)、經(jīng)常性抽樣調(diào)查為主體,必要的統(tǒng)計報表、重點調(diào)查、綜合分析等為補充的國家統(tǒng)計調(diào)查方法體系,是我國統(tǒng)計方法制度改革的指導思想。二、抽樣推斷的作用抽樣調(diào)查方法是市場經(jīng)濟國家在調(diào)查方法1451.實際工作不可能進行全面調(diào)查觀察,而又需要了解其全面資料的事物;2.雖可進行全面調(diào)查觀察,但比較困難或并不必要;3.對普查或全面調(diào)查統(tǒng)計資料的質(zhì)量進行檢查和修正;4.抽樣方法適用于對大量現(xiàn)象的觀察,即組成事物總體的單位數(shù)量較多的情況;5.利用抽樣推斷的方法,可以對于某種總體的假設(shè)進行檢驗,判斷這種假設(shè)的真?zhèn)?,以決定取舍。1.實際工作不可能進行全面調(diào)查觀察,而又需要了解其全面資料的146三、抽樣推斷的基本概念

(一)全及總體和抽樣總體(總體和樣本)全及總體:所要調(diào)查觀察的全部事物。總體單位數(shù)用N表示。抽樣總體:抽取出來調(diào)查觀察的單位。抽樣總體的單位數(shù)用n表示。n≥30大樣本n<30小樣本三、抽樣推斷的基本概念(一)全及總體和抽樣總體(總體和樣147(二)抽樣方法

1、重復抽樣:2、不重復抽樣:重復抽樣和不重復抽樣會產(chǎn)生三個差別:

抽取的樣本數(shù)目不同抽樣誤差的計算公式不同抽樣誤差的大小不同(二)抽樣方法

1、重復抽樣:重復抽樣和不重復抽樣會產(chǎn)148

(三)參數(shù)和統(tǒng)計量

(全及指標和抽樣指標、總體指標和樣本指標)

全及指標:全及總體的那些指標。抽樣指標:抽樣總體的那些指標。(三)參數(shù)和統(tǒng)計量

(全及指標和抽樣指標、總體指149研究總體中的數(shù)量標志總體平均數(shù)總體方差X=∑XNX=∑XF∑FΣ(X-X)N2σ=2Σ(X-X)FΣF2σ=2研究總體中的品質(zhì)標志總體成數(shù)成數(shù)方差σ2=P(1-P)P=

N1N參數(shù)研究總體中總體平均數(shù)總體方差X=∑XX=∑XFΣ(X-X)2150研究數(shù)量標志樣本平均數(shù)

x=∑xnx=∑xf∑f樣本方差研究品質(zhì)標志樣本成數(shù)

成數(shù)方差

np=n

統(tǒng)計量研究數(shù)量標志樣本平均數(shù)x=∑xnx=∑xf∑f樣本方差研151

(四)樣本容量——指一個樣本所包括的單位數(shù)。

(五)抽樣比例——抽樣比例是指在抽取樣本時,所抽取的樣本單位數(shù)與總體單位數(shù)之比。

(四)樣本容量——指一個樣本所包括的單位數(shù)。(五)抽152(六)樣本個數(shù)——指從總體中可能抽取的最多的樣本數(shù)量。1、重復抽樣:2、不重復抽樣:(六)樣本個數(shù)——指從總體中可能抽取的最多的樣本數(shù)量。1、重153考慮順序不考慮順序不重復抽樣重復抽樣可能樣本數(shù)目的計算公式考慮順序不考慮順序不重復抽樣重復抽樣可能樣本數(shù)目的計算公式154

置信度也稱為可靠度,或置信水平、置信系數(shù)。即在抽樣對總體參數(shù)作出估計時,由于樣本的隨機性,其結(jié)論總是不確定的。因此,采用一種概率的陳述方法,也就是數(shù)理統(tǒng)計中的區(qū)間估計法,即估計值與總體參數(shù)在一定允許的誤差范圍以內(nèi),其相應的概率有多大,這個相應的概率稱作置信度。(七)

置信度(七)置信度155(一)大樣本統(tǒng)計量分布的依據(jù)-中心極限定理四、抽樣推斷的理論依據(jù)

1、正態(tài)分布(1)正態(tài)分布模型

如果連續(xù)型隨機變量X的概率密度的函數(shù)為:其中σ>0,μ和σ均為常數(shù),則稱X服從參數(shù)為μ和σ的正態(tài)分布,記作X~(μ,σ2)。(一)大樣本統(tǒng)計量分布的依據(jù)-中心極限定理四、抽樣推斷的理論156(2)正態(tài)分布的分布函數(shù)(2)正態(tài)分布的分布函數(shù)157若,對其進行“標準化”變換,即令則(3)一般正態(tài)分布的標準化若,1582、中心極限定理一般意義:無論隨機變量服從何種分布,只要樣本容量足夠大,都可以近似地看作是服從正態(tài)分布。中心極限定理說明,大量相互獨立的隨機變量和的概率分布是以正態(tài)分布為極限的。由于正態(tài)分布在概率論中占有的中心地位,中心極限定理因此而得名。2、中心極限定理一般意義:159(1)獨立同分布的中心極限定理

設(shè)隨機變量X1,X2,…,Xn相互獨立,服從同一分布,且有有限的數(shù)學期望和方差,則隨機變量的分布函數(shù)滿足如下極限式(1)獨立同分布的中心極限定理設(shè)隨160定理的應用:對于獨立的隨機變量序列,不管服從什么分布,只要它們是同分布,且有有限的數(shù)學期望和方差,那么,當n充分大時,這些隨機變量之和近似地服從正態(tài)分布定理的應用:對于獨立的隨機變量序列,不161(2)棣莫弗—拉普拉斯中心極限定理

定理設(shè)隨機變量服從二項分布,則對于任意區(qū)間,恒有二項分布的極限分布是正態(tài)分布即如果,則(2)棣莫弗—拉普拉斯中心極限定理定162一般地,如果,則一般地,如果,則1631、t分布及小樣本均值的分布律(二)小樣本統(tǒng)計量的分布律1、t分布及小樣本均值的分布律(二)小樣本統(tǒng)計量的分布律164設(shè)隨機變量X~N(0,1),Y~

2(n)

,且X與Y相互獨立,則稱統(tǒng)計量服從自由度為n的t分布或?qū)W生氏分布,記作t分布的概率密度函數(shù)為T~t(n).其圖形如圖5-6所示(P106),其形狀類似標準正態(tài)分布的概率密度的圖形.當n較大時,t分布近似于標準正態(tài)分布.設(shè)隨機變量165當n較大時,t分布近似于標準正態(tài)分布.一般說來,當n>30時,t分布與標準正態(tài)分布N(0,1)就非常接近.但對較小的n值,t分布與標準正態(tài)分布之間有較大差異.且P{|T|≥t0}≥P{|X|≥t0},其中X~N(0,1),即在t分布的尾部比在標準正態(tài)分布的尾部有著更大的概率.t

分布的數(shù)學期望與方差設(shè)T~t

(n),則E(T)=0,D(T)=當n較大時,t分布近似于標準正態(tài)分布.一166設(shè)(X1,X2,…,Xn)為來自正態(tài)總體X~N(

,

2)的樣本,則統(tǒng)計量證由于與S

2相互獨立,且由定義5.4得設(shè)(X1,X2,…,Xn)為來自正態(tài)總體證由于與S2相互獨167

設(shè)(X1,X2,…,Xn1)和(Y1,Y2,…,Yn2)分別是來自正態(tài)總體N(1

,2)和N(2

,2)的樣本,且它們相互獨立,則統(tǒng)計量其中、分別為兩總體的樣本方差.設(shè)(X1,X2,…,Xn1)和(Y1,Y2,…,Yn2168——分布

定義設(shè)總體,是的一個樣本,則稱統(tǒng)計量服從自由度為n的分布,記作自由度是指獨立隨機變量的個數(shù),n個相互獨立的標準正態(tài)分布之平方和服從自由度為n的分布——分布定義設(shè)總體169五、抽樣推斷的基本原理舉例說明五、抽樣推斷的基本原理舉例說明170總體方差已知時總體均值μ的區(qū)間估計當X~,可以證明抽自該總體的簡單隨機樣本X1,X2,…,Xn的樣本平均數(shù)服從數(shù)學期望為,方差為的正態(tài)分布,即~

采用統(tǒng)計量Z,將非標準正態(tài)分布轉(zhuǎn)化為標準正態(tài)分布,~N(0,1)例總體方差已知時總體均值μ的區(qū)間估計當X~171對于給定的置信概率,可以查正態(tài)分布表,(即概率度t)使得:得出相應的臨界值對于給定的置信概率,可以查正態(tài)分布表,(即概率度t)使得:得172即在給定的顯著性水平下,總體均值在的置信概率下的置信區(qū)間為

即在給定的顯著性水平下,總體均值在173第二節(jié)抽樣誤差

一、抽樣誤差的概念及種類在抽樣調(diào)查中,總體指標與樣本指標不一致,兩者的偏差稱為抽樣誤差。第二節(jié)抽樣誤差一、抽樣誤差的概念及種類在抽樣調(diào)查174

抽樣誤差即指隨機誤差,這是抽樣調(diào)查固有的誤差,是無法避免的。抽樣誤差即指隨機誤差,這是抽樣調(diào)查固有的誤差,是無法避免175抽樣誤差的作用:1.在于說明樣本指標的代表性大小。

誤差大,則樣本指標代表性低; 誤差小,則樣本指標代表性高; 誤差等于0,則樣本指標和總體指標一樣大。2.說明樣本指標和總體指標相差的一般范圍。抽樣誤差的作用:1.在于說明樣本指標的代表性大小。2.說176二、抽樣平均誤差

(一)概念

抽樣平均誤差是所有可能出現(xiàn)的樣本指標的標準差。反映樣本指標與總體指標之間誤差的一般水平。通常用μ表示。即是由于抽樣的隨機性而產(chǎn)生的樣本指標與總體指標之間的平均離差。二、抽樣平均誤差

(一)概念抽樣平均誤差是所有可177(二)理論公式(二)理論公式178例例1791020304050102030405010203040501020304050102030405050合計1020304050102030405010203040501801010-204002015-152253020-101004025-5255030001015-152252020-101003025-52540300050355251020-101002025-52530300040355255040101001025-5252030003035525404010100504515225103000203552530401010040451522550505020400合計--25001010-204002015-152253020-1181第6章抽樣推斷課件182(三)實際計算公式(以純隨機抽樣為例)1.重復抽樣2.不重復抽樣(三)實際計算公式(以純隨機抽樣為例)1.重復抽樣2.不重183總體方差未知時解決方法:1、用樣本方差代替2、用過去全面調(diào)查的資料,也可以用過去抽樣調(diào)查的資料代替??傮w方差未知時解決方法:1、用樣本方差代替2、用過去全面調(diào)查184

某燈泡廠從一天所生產(chǎn)的產(chǎn)品10,000個中抽取100個檢查其壽命,得平均壽命為2000小時,根據(jù)以往資料σ=20小時,試求抽樣平均誤差。例重復抽樣:不重復抽樣:某燈泡廠從一天所生產(chǎn)的產(chǎn)品10,000個中抽取100個檢185

某玻璃器皿廠某日生產(chǎn)15000只印花玻璃杯,現(xiàn)按重復抽樣方法從中抽取150只進行質(zhì)量檢驗,有147只合格,試求這批印花玻璃杯合格率的抽樣平均誤差。例某玻璃器皿廠某日生產(chǎn)15000只印花玻璃杯,現(xiàn)按186(四)影響抽樣誤差的因素:

4.不同的抽樣組織形式。1.全及總體標志變異程度。2.抽樣單位數(shù)目的多少。3.不同的抽樣方法。(四)影響抽樣誤差的因素:1.全及總體標志變異程度。2.187例:假定抽樣單位數(shù)增加2倍、0.5倍時,其他條件不變,抽樣平均誤差怎樣變化?解:抽樣單位數(shù)增加2倍,即為原來的3倍抽樣單位數(shù)增加0.5倍,即為原來的1.5倍即:當樣本單位數(shù)增加2倍時,抽樣平均誤差為原來的0.577倍。即:當樣本單位數(shù)增加0.5倍時,抽樣平均誤差為原來的0.8165倍。例:假定抽樣單位數(shù)增加2倍、0.5倍時,解:抽樣單位數(shù)增188例:假定抽樣平均誤差縮小40%時,其他條件不變,抽樣單位數(shù)怎樣變化?解:抽樣平均誤差縮小40%時,

即為原來的60%,即:當抽樣平均誤差縮小40%時,樣本單位數(shù)增加1.78倍。例:假定抽樣平均誤差縮小40%時,其他條件不變,抽樣單位數(shù)怎189一、抽樣極限誤差樣本指標與總體指標之間允許的誤差范圍叫抽樣極限誤差。也稱抽樣允許誤差。它是樣本指標可允許變動的上限或下限與總體指標之差的絕對值。即:第三節(jié)抽樣估計和推算

一、抽樣極限誤差樣本指標與總體指標之間允許的誤差范圍190根據(jù)中心極限定理,得知當n足夠大時,抽樣總體為正態(tài)分布,根據(jù)正態(tài)分布規(guī)律可知,樣本指標是以一定的概率落在某一特定的區(qū)間內(nèi),統(tǒng)計上把這個給定的區(qū)間叫抽樣極限誤差,也稱置信區(qū)間,即在概率F(t)的保證下:

△=tμ,(t為概率度)根據(jù)中心極限定理,得知當n足夠大時,抽樣總體為正態(tài)分191當F(t)=68.27%時,抽樣極限誤差等于抽樣平均誤差的1倍(t=1);當F(t)=95.45%時,抽樣極限誤差等于抽樣平均誤差的2倍(t=2);當F(t)=99.73%時,抽樣極限誤差等于抽樣平均誤差的3倍(t=3);例可見,抽樣極限誤差,即擴大或縮小了以后的抽樣誤差范圍。當F(t)=68.27%時,抽樣極限誤差等于抽樣平均誤差的1192上例資料編成次數(shù)分配表如下:樣本數(shù)f101-20152-15203-10254-530503545403104521550120合計25-上例資料編成次數(shù)分配表如下:樣本數(shù)f101-20152193-30樣本個數(shù)樣本頻率樣本累計頻率0510

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論