03第三章簡單隨機抽樣_第1頁
03第三章簡單隨機抽樣_第2頁
03第三章簡單隨機抽樣_第3頁
03第三章簡單隨機抽樣_第4頁
03第三章簡單隨機抽樣_第5頁
已閱讀5頁,還剩33頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 第三章第三章 簡單隨機抽樣簡單隨機抽樣第一節(jié)第一節(jié) 簡單隨機抽樣概述簡單隨機抽樣概述u一、簡單隨機抽樣的概念一、簡單隨機抽樣的概念u定義之一:簡單隨機抽樣就是從總體n個抽樣單元中,一次抽取n個單元時,使全部可能的 種不同的樣本被抽到的概率均相等,即都等于1/a。u定義之二:簡單隨機抽樣是從總體的n個抽樣單元中,每次抽取一個單元時,使每一個單元都有相等的概率被抽中,連續(xù)抽n次,以抽中的n個單元組成簡單隨機樣本。u按簡單隨機抽樣,抽到的樣本稱為簡單隨機樣本。 u簡單隨機抽樣是一種最簡單、最基本的抽樣組織形式。它適用于均勻總體,即具有某種特征的總體單位均勻地分布于總體的各個部分。簡單隨機抽樣具有下

2、列優(yōu)點: )(nna u首先,在理論上最符合隨機原則。對此可有二種理解:一種是總體中各個單位被抽中的機會相等。設總體有n個單位,各單位被抽中的概率均為 。另一種是總體中各個樣本被抽中的概率相等。我們知道,一個總體n中可以抽取許多個容量為 的樣本,通常情況下按組合形式有 個樣本,那么,在一次抽樣中,某個樣本被抽中的概率為 ,這個概率對每個可能的樣本都相等。簡單隨機抽樣遵循這種等可能性原則,為進行抽樣估計,計算抽樣誤差,提供了重要前提條件。 n1nnnc1nncu其次,它是設計其他更復雜抽樣形式的基礎。例如,設計分層抽樣,將總體劃分為若干層,然后對各個層實施簡單隨機抽樣。對一個非常大的總體,需要分

3、若干個階段進行抽樣。例如,進行全國性抽樣調查,第一階段可以由全國抽取若干個省份,第二階段再由抽中的省份抽取若干個縣(市);第三階段再由抽中的縣(市)抽取若干個鄉(xiāng)(街道);第四階段再由抽中的鄉(xiāng)(街道)抽取若干個村(居委會)等等。在這種多階段抽樣中,每個階段中抽取樣本單位均可采用簡單隨機抽樣方法。 u再次,是衡量其他抽樣效果的比較標準。抽樣效果首先體現(xiàn)在抽樣誤差的大小上。而反映或者比較某一抽樣形式的誤差大小,需要有一個比較指標,這通常采用抽樣設計效果指標 ,這個抽樣設計效果是以某一抽樣形式的方差與簡單隨機抽樣的方差進行對比,設前者為 , 后者為 ,那么,抽樣設計效果為:u這個設計效果 取反指標的形

4、式。若 值大于等于1,即 ,則抽樣估計效果較差;反之, 小于l,即 ,則抽樣估計效果較好。 deff)(1v)(0v)()(01vvdeff deffdeff)(1v)(0vdeff)(1v)(0vu例如,用分層抽樣從某企業(yè)抽100個職工戶,調查每戶平均收入,得到抽樣方差 =25,以相同的單位數(shù)用簡單隨機抽樣形式,得到抽樣方差 =49,則抽樣設計效果為: =2549=0.51 u這表明在同樣抽取100戶條件下,用分層抽樣優(yōu)于簡單隨機抽樣。并且,可以利用抽樣設計效果 計算有效單位數(shù) : 式中, 為某一抽樣形式的樣本單位數(shù), 表示在相同的抽樣方差下,采用簡單隨機抽樣形式所需要的樣本單位數(shù)。在上面的

5、例子中, =100戶, =0.51,所以, =1000.51=1961v0vdeffdeffndeffnn nnndeffnu二、簡單隨機抽樣的具體實施方法二、簡單隨機抽樣的具體實施方法u(一)抽簽法u抽簽法是先對總體n個抽樣單元分別編上1到n的號碼,再制作與之相對應的n個號簽并充分搖勻后,從中隨機地抽取n個號簽(可以是一次抽取n個號簽,也可以一次抽一個號簽,連續(xù)抽n次),與抽中號簽號碼相同的n個單元即為抽中的單元,由其組成簡單隨機樣本。u(二)隨機數(shù)法u隨機數(shù)法就是利用隨機數(shù)表、隨機數(shù)骰子或計算機產生的隨機數(shù)進行抽樣。u1、隨機數(shù)表及其使用方法u隨機數(shù)表是由0到9的10個阿拉伯數(shù)字進行隨機排

6、列組成的表。u所謂隨機排列,即每個數(shù)字都是按等概和重復獨立抽取的方式排定的。u隨機數(shù)表的用途很多,不僅可以組織等概樣本,也可組織不等概樣本。u簡單隨機抽樣屬等概率抽樣,在使用隨機數(shù)表時,要注意以下幾點:u每次使用時,確定使用哪頁及哪行哪列的數(shù)字為起點,必須是隨機的。u設總體容量為n,若n的位數(shù)為r,則一定要從r位數(shù)中抽取。遇到1至n的數(shù)可直接使用;遇到其它的數(shù)不能直接使用。u當r2時,可從含有起點數(shù)字左邊的r位數(shù)開始,也可從右邊的r位數(shù)開始??蓮钠瘘c開始向下抽取,也可向右抽取。但一經確定使用哪一種方式,就必須用一種方式抽取全部單元號,中途不能變更。u在重復抽樣時,遇到重復的數(shù)字應重復使用;在不

7、重復抽樣時,遇到重復的數(shù)字應舍去不用。u隨機數(shù)表法一般分下述幾步:u第一步:確定起點頁碼;u第二步:確定起點的行數(shù)與列數(shù);u第三步:確定所抽樣本單元的號碼。u快速抽取的常用方法有:u余數(shù)法。如果n是個r位數(shù),由1到 隨機取一個數(shù)r,而 是n的最大r位整倍數(shù),則編號等于r除n所得余數(shù)的單元便被選中。u商數(shù)法; 修正余數(shù)法; 修正商數(shù)法; 獨立選擇數(shù)位法。nnu2、隨機數(shù)骰子及其使用方法u隨機數(shù)骰子是由均勻材料制成的正二十面體(通常的骰子是正六面體,即正方體),面上刻有09的數(shù)字各2個。u兩個有名的試驗u試驗一:隨意數(shù)試驗。u讓六個人寫下100個自己隨意想到的三位數(shù),將這些數(shù)內的0、1、9數(shù)字列成

8、次數(shù)分布表。u可見,六個人都對數(shù)字存在偏好,如第一個人更加偏好數(shù)字4、3、0;第二個人則偏好數(shù)字1、8、4;等等。這種由于數(shù)字偏好所引起的偏估類型可稱之為數(shù)字偏誤。數(shù)字人的編號期望次數(shù) 1 2 3 4 5 60123456789 50 1 38 29 34 59 29 48 30 57 33 27 20 19 28 31 20 22 50 39 34 34 24 24 55 40 28 29 15 27 20 18 31 15 30 25 30 26 26 27 31 15 12 39 32 35 42 35 25 42 30 23 44 37 9 28 23 20 27 2930303030

9、303030303030合計300 300 300 300 300 300300u試驗二:著色試驗。u讓四個人將1010方格的紙板著色,可供選擇的顏色有藍、綠、紅、白和黃色五種,對每一個四分象限來說,規(guī)定每種顏色只能在每行和每列出現(xiàn)一次。每個方格以其所在的列號與行號表示,如(4,6)代表第四列第六行的方格。請四個人對這100個方格隨意選擇行列號,而對其著色。將這些由這四個人著色所得到的資料形成次數(shù)分布表如下:u四個人對方格著色的次數(shù)分布顏色人的編號期望數(shù)字 1 2 3 4藍綠紅白黃14 26 20 1228 21 15 2115 12 20 2225 23 20 1918 18 25 2620

10、20202020合計 100 100 100 100100u可見四個人都對顏色存在偏好,如第一個人偏愛綠色,第二個人偏愛藍色等。這種由于對顏色偏好所引起的偏估類型,可稱之為顏色偏誤。u結論:隨意抽樣隨機抽樣u三、簡單隨機抽樣的方法評估三、簡單隨機抽樣的方法評估u1.簡單隨機抽樣對總體不加任何限制,等概率地從總體中直接抽取樣本,是最簡單、最單純的抽樣技術,它具有計算簡便的優(yōu)點,是研究其它復雜抽樣技術的基礎,也是比較各種抽樣技術之間估計效率的標準,同時,從理論上講簡單隨機抽樣在各種抽樣技術中是貫徹隨機原則最好的一種,并且數(shù)學性質很簡單,是等概率抽樣的特殊類型。u2.因為是等概率抽取樣本,所以要求總

11、體在所研究的主要標志上同質性或齊性(共性)較好,也即總體要比較均勻;要求樣本容量要比較大,以保證樣本對總體具有充分的代表性。但是,在社會經濟現(xiàn)象中,這種均勻總體是很少見的。因此,實際工作中很少單純使用簡單隨機抽樣方法。u3.直接從總體中抽取樣本,未能充分利用關于總體的各種其它已知信息,以有效地提高樣本的代表性,并進而提高抽樣的估計效率。u4.簡單隨機抽樣要求在抽樣前編制出抽樣框,并對每一個總體抽樣單元進行編號,而且當總體抽樣單元的分布比較分散時,樣本也可能會比較分散,這些都會給簡單隨機抽樣方法的運用造成許多的不便,甚至在某些情況下干脆無法使用。 u結論:在此基礎上研究其它抽樣技術顯得更加重要。

12、 第二節(jié)第二節(jié) 總體參數(shù)的估計總體參數(shù)的估計u一、基本原理一、基本原理u設總體包含有 、 、 、 四個單元,其觀測值分別為 、 、 、 ,則總體均值為 ( + + + )/4?,F(xiàn)用簡單隨機抽樣法抽一個單元并以其觀測值來估計總體均值,則這四個單元每個都是可能的樣本,而每個可能樣本被抽中的概率均為四分之一。每個樣本觀測值本身就可以當作總體均值的一個估計值。顯然,根據不同樣本估計的結果與總體均值之間通常并不一致,而是存在一個的誤差。下表列出了抽到不同樣本時的結果: 1u4u2u3u1y2y3y4y1y2y3y4yyyy-yy1-yy2-yy3-yy4-y樣本編號樣 本樣本觀測值 的估計值1u1y1y

13、12u2y2y23u3y3y34u4y4y4)(1y)(2y)(4y)(3yu由上述分析可知u所以,是 的無偏估計量。的均方誤差(mse)為u即總體方差。又因為 是 的無偏估計量,因此,估計量的方差等于均方誤差,即 u若用不放回簡單隨機抽樣法從上例的總體中抽取2個單元組成樣本,則可以得到 等六個可能樣本,每個樣本被抽中的概率均為六分之一,當抽到不同的樣本時,會有不同的估計結果,如表所示: yyyei41)(yyy22)(41)(yyymseiyy)1414(1)(22yv434232413121,uuuuuuuuuuuu可見,樣本均值 是 的一個無偏估計量,因為yy314314)(121)2(

14、61)(iijiijjijiyyyyye而每個單元均可能在三個樣本內出現(xiàn),故413121)(iiyyye由四個單元中不放回抽取2個單元的可能結果 將上述結論加以推廣,則可得出一般性的結論,即從總體的n個單元中不放回抽取n個單元時的估計量及其方差的構造形式。因此, 的樣本方差為y314314222222)2(241)(4161)()(iijiijjijijiyyyyyyyyyyeyv又已知 (i=1,2,3,4)在三個樣本內出現(xiàn),而 3144122162iijiijiyyyy則)1424(23)41(3131121)(2241224122iiiiyyyyyvu二、估計量二、估計量u1、總體均值和

15、總和的簡單估計量u在簡單隨機抽樣條件下,總體均值的簡單估計量為: u可以證明,樣本均值是總體均值的無偏估計,即:u因此總體總和的簡單估計量為:u其中n/n也稱作膨脹因子。nyyyniiyye)(niiniiynnnynynyu2、總體比例的簡單估計量n抽樣調查中,經常需估計總體中具有某種特性的單元總數(shù)及其在總體中所占的比例(即成數(shù))。n設總體中的n個抽樣單元按其是否具有某種特性可分成d和 兩類,d類具有某種特性, 類不具有某種特性。d類有 個單元, 類有 個單元,則: 又令0nd1nddnnp/1nnp/1屬于d的單元數(shù)屬于d的成數(shù)總體樣本總體樣本n1n1類個單元屬,若第類個單元屬若第didi

16、yi0, 1u則 =p, =p, y= , y= . u由此則將估計 和p的問題轉化為估計y和 ,所以依上面的結論可知總體比例的簡單估計量為: 且u總體中具有d類屬性的單位總數(shù)的估計量為:1n1nyyy1nnnpp1ppe)(nppnn1 證明:樣本平均數(shù)是總體平均數(shù)的無偏估計量證明:樣本平均數(shù)是總體平均數(shù)的無偏估計量 u證明證明1 1:根據無偏性定義。(無偏性即抽樣指標的數(shù)學期望等于總體參數(shù)。換句話說,雖然每一次抽樣指標與總體參數(shù)有一定偏差,但對于總體中所有可能的樣本指標,要求其平均數(shù)等于總體參數(shù),這就是用樣本指標估計總體參數(shù)的無偏性要求。無偏性的數(shù)學表達式為: u對于每次抽樣,由于總體中的

17、任意一個單位 都有1 / n的概率被抽中,故對每次抽樣的結果 (視為隨機變量),都有:)(eiyiyyynyeinii11)(yynnyenyenii1)(1)(1u證明證明2 2:對固定的有限總體,估計量的期望或均值的含義既是對所有可能的樣本求平均,因而, 這里求和是指全部可能的 個不同樣本求和。每個特定的單位 ,出現(xiàn)在不同樣本中的次數(shù)都為 ,因此,nnciyniinnnccycnyyynynnnn111211)(1yynncycyeniinnniinn11111)(nncnncyye)(11nncu證明證明3 3:按對稱性原則。由于每個總體單位在樣本中出現(xiàn)的次數(shù)均相等,因此, 必定是 的倍

18、數(shù),這個倍數(shù)是 ,故:)(1niiyeniiy1nnf yynynnnyenyeniiniinii11111)(1)(u三、估計量的方差三、估計量的方差u在抽樣推斷中,有時往往只計算出估計量的值,而不大注意估計量的誤差(方差或標準差)。但是,總體均值的估計量通常與總體均值的真值間不完全一致,即存在誤差,而且所有可能的樣本均值相對于總體均值的誤差大小也是不一致的。聯(lián)合國統(tǒng)計局編的抽樣調查理論基礎一書指出:“從研究大多數(shù)國家的抽樣實踐中,可以看出:雖然計算估計量的標準差,至少對關鍵性的幾個估計量計算其標準差來說,僅需增加很少的額外開支或負擔,但是他們并不意識到確定估計量的標準差的重要意義。這是否因

19、為統(tǒng)計人員無意識地忽視了估計量的不精確性所產生的嚴峻的現(xiàn)實呢?計算標準差,并且把他們與估計量一起列出來,應該成為實際工作的一個常規(guī)?!眜總體均值估計量的抽樣方差為:u其中,f為抽樣比,1-f為有限總體不重復抽樣校正系數(shù),記為fpc。u由此進一步可推出u又因為在研究總體成數(shù)時:21)(snfyv222)()1 ()(snnnnsnfnyv)1 (1)(11)(11)(11222122ppnnnpnpnyynyynsniiniiu所以可得出總體比例估計量的抽樣方差為:u總體中具有某種屬性單元總數(shù)估計量的抽樣方差為:u四、方差估計量四、方差估計量u可以證明樣本方差為總體方差的無偏估計量,即 ,所以,

20、當總體方差 未知時,可用樣本方差 來代替,由此可得出估計量的方差的估計量分別為:u而且 與 分別是 與 的無偏估計。)1 (1)(ppnfpv)1 (1)()(21ppnnfpnvnv22)(sse2s2s21)(snfyv22)1 ()(snfnyv)(yv)(yv)(yv)(yvu 的無偏估計量為:u 的無偏估計量為:)(pv)1 (11)(ppnfpv)(1nv)1 (1)1 ()(21ppnfnnv 證明:對于簡單隨機抽樣,證明:對于簡單隨機抽樣, 的方差為的方差為u證明證明1 1:由于 根據對稱性原則: 則niiyyyyn1)()(njijiniiniiyyyyyyyyyyn)(2)

21、()()(2121222121)()(yynnyyeniinii)(11)(yyyynnnnyyyyejnjiijnjiiniiyyenyyeyv1222)(1)()()(112)(12yyyynnyynnjnininniiyynnyynnnn22)(11)()111 (12)(11yynnnnnniy21)(snfyv21)(snfyvu證明證明2 2:樣本均值的方差為:u設: ,在不抽樣下,樣本就是總體本身。此時,不論樣本單位如何,總有:u由此可得:u即:1),(2nsyycovji2),(2) 1(20nsyycovnnji0)()()(211yvnyvyvniiniinn ),(2)(

22、)(211ncjijiniiniiyycovyvyv2)()(yyeyvu運用對稱性原理:u由此有:u在重復抽樣下,對于任何 和 , 和 都互相獨立 ,從而:u因此:11) 1(1)(1)(22212nnnnssnnnnnyvnyvniii0),(jiyycov)(ji jyiyj221) 1(snnnns)1(2) 1(11222nsnnnnnnnsnn),(112)()(211jcjiiniiniiyycovnnnnyvnnyvn2221211)(1)(snnsnnnyvnyvnii 證明:證明:樣本方差為總體方差的無偏估計量樣本方差為總體方差的無偏估計量u證明證明:將樣本方差改寫為u由對

23、稱性知:u而:u因此:2221)(snnnnsnfyye22)() 1() 1(snnnnnnsniiyyneyyense1222)()(11)() 1(1122snnnnnsnnnn22121) 1()()(snnnyynnyyeniinii)()(11)(11221212yynyynyynsniinii22)(sse第三節(jié)第三節(jié) 樣本容量的確定樣本容量的確定u一、必要樣本容量的確定一、必要樣本容量的確定u必要樣本容量是在最大限度地滿足規(guī)定精度要求以及盡可能節(jié)約調查費用的前提下,所應該抽取到的最少的樣本容量。u(一)依規(guī)定精度來定u1、關于精度的不同提法u提法之一:以置信度1-,允許總體參數(shù)的估計量 的最大絕對誤差為,即:u提法之二:以置信度1-,允許總體參數(shù)的估計量 的最大相對誤差為r,即:1)(p為相對誤差)(.1)(rrpu提法之三:以置信度1-,允許總體參數(shù)的估計量 的最大方差不超過v,即: u提法之四:以置信度1-,允許總體參數(shù)的估計量 的最大變異系數(shù)不超過c,即:u2、樣本容量n的確定u當n足夠大時,可以認為服從正態(tài)分布n(,v( )(理由如前述樣本統(tǒng)計量的抽樣分布)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論