第9章抽樣與抽樣估計_第1頁
第9章抽樣與抽樣估計_第2頁
第9章抽樣與抽樣估計_第3頁
第9章抽樣與抽樣估計_第4頁
第9章抽樣與抽樣估計_第5頁
已閱讀5頁,還剩38頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

一、隨機抽樣與非隨機抽樣(一)隨機抽樣又稱概率抽樣隨機抽樣是按隨機原則從全部研究對象中抽取樣本進行觀察,并根據(jù)樣本的實際數(shù)據(jù)對總體的數(shù)量特征作出具有一定可靠程度的估計和推算。

只抽取部分單位進行調(diào)查。§1抽樣調(diào)查中常用的基本概念當前1頁,總共43頁。隨機抽樣最基本的組織方式有:1.簡單隨機抽樣2.分層隨機抽樣3.整群抽樣4.系統(tǒng)抽樣(二)非隨機抽樣又稱非概率抽樣是從研究目的出發(fā),根據(jù)調(diào)查者的經(jīng)驗、判斷或基于方便的原則,從總體中有意識地抽取樣本。當前2頁,總共43頁。二、重復(fù)抽樣與不重復(fù)抽樣(一)重復(fù)抽樣:也叫放回抽樣。(二)不重復(fù)抽樣:也叫無放回抽樣。一個單位可能中選多次每次抽單位,概率固定,都為1/N。一個單位最多中選一次每次抽單位,概率不同,逐漸增加當前3頁,總共43頁。三、總體分布樣本分布和抽樣分布(一)總體分布(指總體標志值的分布)總體:也稱全及總體。指所要認識的研究對象全體??傮w單位總數(shù)用“N”表示。

針對總體分布的指標稱全及指標,也叫總體參數(shù)。

常用的參數(shù)有:總體平均數(shù)、總體成數(shù)P、總體標準差σ當前4頁,總共43頁。未分組數(shù)據(jù):分組數(shù)據(jù):未分組數(shù)據(jù):分組數(shù)據(jù):總體方差公式總體標準差公式總體指標的計算公式當前5頁,總共43頁。樣本:也稱抽樣總體,是抽出的單位組成的整體。樣本單位總數(shù)用“n”表示。(二)樣本分布

針對樣本計算的指標為抽樣指標,也叫統(tǒng)計量(估計量)。其值隨樣本的不同而不同,是個隨機變量。

抽樣估計就是通過統(tǒng)計量的值去估計參數(shù)的值。

常用的統(tǒng)計量有:樣本平均數(shù)、樣本成數(shù)p、樣本標準差S當前6頁,總共43頁。樣本指標的計算公式樣本均值當前7頁,總共43頁。樣本方差和標準差的計算公式當前8頁,總共43頁。

若總體單位的某種標志只有兩種表現(xiàn)(稱為是非標志),總體成數(shù)是指具有某種特征和屬性的單位在全部總體單位中所占比重,記為p。

以代表N個總體單位中具有某種特征的單位數(shù),代表N個總體單位中不具有某種特征的單位數(shù),N=N1+N0。則有成數(shù)屬性總體的全及指標當前9頁,總共43頁。

從總體中隨機抽出容量為的樣本,具有某種特征的單位數(shù)為,則樣本的成數(shù)為。例如,某工廠生產(chǎn)某種電子元件,某批產(chǎn)品共10000件,其中不合格品100件,則不合格品所占的成數(shù)。若從中按隨機的原則抽100件,其中有3件不合格品,則樣本的成數(shù)為。NEXT屬性總體的樣本指標當前10頁,總共43頁。推斷統(tǒng)計:利用樣本統(tǒng)計量對總體某些性質(zhì)或數(shù)量特征進行推斷。隨機原則總體樣本總體參數(shù)統(tǒng)計量推斷估計參數(shù)估計檢驗假設(shè)檢驗抽樣分布抽樣估計和推斷的過程當前11頁,總共43頁。(一)抽樣誤差抽樣誤差,是指抽樣調(diào)查中所產(chǎn)生的誤差,是調(diào)查得結(jié)果與總體真實值之間的差異。按誤差來源不同分登記性誤差和代表性誤差兩類。四、抽樣誤差當前12頁,總共43頁。1.登記性誤差,指在調(diào)查和匯總過程中由于測量、登記、計算等方面的差錯或被調(diào)查者提供虛假資料而造成的誤差。它在任何調(diào)查中均存在。而且調(diào)查范圍越大,調(diào)查單位越多,產(chǎn)生登記性誤差的可能性也越大。2.代表性誤差,指樣本推斷總體時,由于樣本結(jié)構(gòu)與總體結(jié)構(gòu)不一致而產(chǎn)生的誤差。又分系統(tǒng)誤差與隨機誤差兩種。(一)抽樣誤差當前13頁,總共43頁。(2)隨機誤差也叫偶然誤差。它是由偶然性因素引起的代表性誤差。它不可避免,但可計算與控制。抽樣估計中的抽樣誤差,就是指這種隨機誤差。

在計算抽樣誤差時,常常假設(shè)不存在登記性誤差和系統(tǒng)誤差。(1)系統(tǒng)誤差是非隨機因素引起的誤差,它系統(tǒng)性偏高或偏低,也稱偏差。(一)抽樣誤差當前14頁,總共43頁。(二)抽樣平均誤差

1.抽樣誤差是指由于抽樣的隨機性而產(chǎn)生的那一部分代表性誤差(隨機性誤差),不包括登記性誤差,也不包括可能發(fā)生的偏差。主要有兩種:實際抽樣誤差,抽樣平均誤差。(1)實際抽樣誤差:指某一樣本指標與總體參數(shù)之間的離差例8-2-1:從1、2、3中抽2個(重復(fù)),參數(shù)取總體平均數(shù)(等于2),則實際抽樣誤差如下:當前15頁,總共43頁。例8-2-1樣本樣本統(tǒng)計量實際抽樣誤差(-)(1、1)1-1(1、2)1.5-0.5(1、3)20(2、1)1.5-0.5(2、2)20(2、3)2.50.5(3、1)20(3、2)2.50.5(3、3)31當前16頁,總共43頁。

(2)抽樣平均誤差

是指所有可能的樣本指標與總體指標間的平均差異程度,即樣本統(tǒng)計量的標準差,也稱抽樣分布的標準差。在實際工作中,抽樣實際誤差是無法知道的,而抽樣平均誤差則可以計算。所以,我們在討論抽樣誤差時,通常指的是抽樣平均誤差。

計算抽樣平均誤差,得從抽樣分布談起(二)抽樣平均誤差當前17頁,總共43頁。

抽樣分布:是指樣本指標的概率分布,由樣本指標的可能取值與之相應(yīng)的頻數(shù)或頻率組成。(二)抽樣平均誤差對于抽樣分布,可計算其均值和方差等來反映該分布的中心和離散趨勢。均值的抽樣平均誤差公式:成數(shù)的抽樣平均誤差公式:M表示所有可能的樣本個數(shù)。當前18頁,總共43頁。影響抽樣平均誤差的因素

1.總體方差或標準差??傮w各單位在被研究變量上的差異程度差異越大,誤差越大。

2.樣本容量n的大小。抽取的單位數(shù)越多,誤差越小。

3.抽樣方法。重復(fù)抽樣的誤差大于不重復(fù)抽樣的誤差。

4.抽樣組織的方式。

當一個總體給定后,總體各單位在被研究變量上的差異程度也隨之確定。所以在選定抽樣方式和方法后,要縮小抽樣平均誤差,必須保證足夠多的樣本容量n。當前19頁,總共43頁。

又叫抽樣絕對誤差或最大允許誤差。(三)抽樣極限誤差均值的抽樣絕對誤差公式:成數(shù)的抽樣絕對誤差公式:當前20頁,總共43頁。1.抽樣誤差系數(shù)是以抽樣極限誤差除以總體均值或成數(shù)來定義的,分別用

和rp表示。即(四)抽樣誤差系數(shù)和抽樣估計精度2.抽樣估計精度簡稱精度。分別用和表示抽樣平均數(shù)和成數(shù)的精度,則當前21頁,總共43頁。

2.樣本平均數(shù)的平均數(shù)等于總體平均數(shù)?!?抽樣估計原理-大數(shù)定律及中心極限定理一、大數(shù)定律及中心極限定理的基本內(nèi)容

1.從正態(tài)總體中抽取的樣本,無論樣本容量n的大小,樣本平均數(shù)的分布一定是正態(tài)的。

3.樣本平均數(shù)的方差等于總體方差除以n。

4.如果總體分布未知或是非正態(tài)分布,隨著樣本容量n的增大(一般認為n≥30就是大樣本了),樣本平均數(shù)的分布趨近于正態(tài)分布。當前22頁,總共43頁。(二)總體均值的區(qū)間估計1.總體方差已知時,總體均值在1-α的置信度下的置信區(qū)間為:§3總體平均數(shù)和總體成數(shù)的估計一、總體均值的估計(一)總體均值的點估計式中,

點估計沒有給出估計值與未知總體參數(shù)的誤差范圍,也不能指出估計的把握程度。點估計的方法常用的有矩估計法、最大似然法等。當前23頁,總共43頁。

t叫概率度。一個概率度對應(yīng)一個概率保證程度F(t),同時可通過查正態(tài)分布表得到對應(yīng)的t與F(t)。常用t值及其對應(yīng)概率99.73%395.45%268.27%95%11.96概率F(t)概率度(t)當前24頁,總共43頁。當n趨近于無窮大時,t分布趨近于正態(tài)分布,因此,在實際運用中,當n>30時,仍然用正態(tài)分布近似。2.總體方差未知時,總體均值的區(qū)間估計(二)總體均值的區(qū)間估計總體方差未知時,用樣本方差代替總體方差,總體均值在1-α的置信度下的置信區(qū)間為:當前25頁,總共43頁。

例8-3-2:某農(nóng)場進行小麥產(chǎn)量抽樣調(diào)查,小麥播種總面積為1萬畝,采用不重復(fù)簡單隨機抽樣,從中抽選了100畝作為樣本進行實割實測,測得樣本平均畝產(chǎn)400斤,方差144斤。以95.45%的可靠性推斷小麥平均畝產(chǎn)的區(qū)間。解:N=10000n=100(1)計算抽樣平均誤差實例當前26頁,總共43頁。(2)計算抽樣極限誤差(3)計算總體平均數(shù)的置信區(qū)間上限:下限:即:以95.45%的可靠性估計該農(nóng)場小麥平均畝產(chǎn)量在397.62斤至402.38斤之間.實例當前27頁,總共43頁。

例8-3-4:對一批電子元件進行耐用性能的檢查,隨機重置抽樣方法選取100件作耐用測試,所得結(jié)果的分組資料如下:100—合計

1855005000以上

5045004000—5000

30

35003000—4000

2

25003000以下件數(shù)(f)組中值(x)耐用時數(shù)(小時)

試以95.45%的把握程度估計這批產(chǎn)品的平均耐用時數(shù).實例當前28頁,總共43頁。解:(1)計算樣本平均數(shù)和樣本標準差實例當前29頁,總共43頁。(2)計算極限誤差(3)

估計區(qū)間的下限:4340-146.2=4193.8小時;估計區(qū)間的上限:4340+146.2=4486.2小時。所以,這批電子元件的平均耐用時數(shù)在4193.8小時至4486.2小時之間,可靠程度為95.45%。區(qū)間估計實例當前30頁,總共43頁。1.重復(fù)抽樣下p208(一)總體成數(shù)與樣本成數(shù)二、總體成數(shù)的估計總體成數(shù):樣本成數(shù):總體成數(shù)的標準差:樣本成數(shù)的標準差:(二)樣本成數(shù)p的分布特征2.不重復(fù)抽樣下p208當前31頁,總共43頁。1.重復(fù)抽樣下(三)總體成數(shù)的估計2.不重復(fù)抽樣下≤≤當前32頁,總共43頁。

例8-3-3:某紗廠某時期內(nèi)生產(chǎn)了10萬個單位的紗,按純隨機抽樣方式抽取2000個單位檢驗,結(jié)果合格率為95%,試以95%的把握程度估計全部紗合格品率的區(qū)間。區(qū)間下限:區(qū)間上限:解:實例當前33頁,總共43頁。

例8-3-1:設(shè)成人身高的達標值為165厘米。從一批成年人中隨機抽7人,得身高分別為155、160、165、170、175、180、185(厘米)。要求:⑴以95.45%的概率保證度求平均身高的置信區(qū)間;⑵以99.73%的概率保證度求身高達標率的置信區(qū)間。實例當前34頁,總共43頁。

解:⑴=170F(t)=95.45%,則t=2所以,(厘米)(厘米)厘米實例置信區(qū)間:即平均身高95.45%的置信區(qū)間為(162.44,177.56)當前35頁,總共43頁。⑵=17.07%所以,F(xiàn)(t)=99.73%,則t=3實例置信區(qū)間:即身高達標率99.73%的置信區(qū)間為(20.22%,100%)當前36頁,總共43頁。§4必要的樣本容量一、平均數(shù)的樣本容量(一)重復(fù)抽樣下的樣本容量(二)不重復(fù)抽樣下的樣本容量當前37頁,總共43頁。不重復(fù)抽樣:n=二、成數(shù)的樣本容量重復(fù)抽樣下:n=當前38頁,總共43頁。解:=625(戶)例8-3-6:根據(jù)歷史資料,某市職工家庭年收入的標準差為250元現(xiàn)再次調(diào)查收入狀況,要求在95.45%的把握度下平均年收入的允許誤差不超過20元,問應(yīng)抽多少戶家庭調(diào)查?實例當前39頁,總共43頁。

例8-3-7:調(diào)查一批零件的合格率,根據(jù)過去的資料,合格率為97%。如果要求誤差不超過1%,把握程度為95%,問需抽多少個零件檢查?

解:=1118(件)實例當前40頁,總共43頁。影響必要樣本容量的因素1.概率保證程度2.總體各單位在被研究標志上的差異程度4.不同的抽樣方法5.不同的抽樣組織方式最后,要考慮調(diào)查的人力、物力、財力的許可情況3.允許誤差范圍當前41頁,總共43頁。樣本容量和樣本個數(shù)的區(qū)別1.樣本容量:一個樣本包含的單位數(shù)。用“n”表示。一般要求n≥302.樣本個數(shù):從一個全及總體中可能抽取的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論