簡單隨機抽樣課件_第1頁
簡單隨機抽樣課件_第2頁
簡單隨機抽樣課件_第3頁
簡單隨機抽樣課件_第4頁
簡單隨機抽樣課件_第5頁
已閱讀5頁,還剩201頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第二章簡單隨機抽樣第二章簡單隨機抽樣1第二章簡單隨機抽樣1、簡單估計量2、比率估計量3、回歸估計量第二章簡單隨機抽樣1、簡單估計量2例:從某個總體抽取一個n=50的獨立同分布樣本,樣本數(shù)據(jù)如下:5676016657323669374626192792876905205023124525625575743508758342035939801722877532592768766923718876413994429274429181117841640521058797746153644476(1)計算樣本均值與樣本方差。(2)若用估計總體均值μ,按數(shù)理統(tǒng)計結果,是否無偏,并寫出它的方差表達式。(3)根據(jù)上述樣本數(shù)據(jù),如何估計?(4)假定的分布是近似正態(tài)的,試分別給出總體均值μ的置信度為95%的近似置信區(qū)間。例:從某個總體抽取一個n=50的獨立同分布樣本,樣本數(shù)據(jù)如下3(1)計算樣本均值與樣本方差。(2)若用估計總體均值μ,按數(shù)理統(tǒng)計結果,是否無偏,并寫出它的方差表達式。

(3)根據(jù)上述樣本數(shù)據(jù),如何估計?(1)計算樣本均值與樣本方差。4(4)假定的分布是近似正態(tài)的,試分別給出總體均值μ的置信度為95%的近似置信區(qū)間。(4)假定的分布是近似正態(tài)的,試分別給出總體均值μ的置信度為5概述一、簡單隨機抽樣(或單純隨機抽樣)本書一般局限于不放回隨機抽樣二、實施方法三、地位、作用是其他抽樣方法基礎概述一、簡單隨機抽樣(或單純隨機抽樣)62.1定義與符號定義2.1從總體的N個單元中,一次整批抽取n個單元,使任何一個單元被抽中的概率都相等,任何n個不同單元組成的組合被抽中的概率也都相等,這種抽樣稱為簡單隨機抽樣.定義2.2從總體的N個單元中,逐個不放回抽取單元,每次抽取到尚未入樣的任何一個單元的概率都相等,直到抽足n個單元為止,這樣所得的n個單元組成一個簡單隨機樣本.2.1定義與符號定義2.1從總體的N個單元中,一次整批抽取7定義2.3按照從總體的N個單元中抽取n個單元的所有可能不同組合構造所有可能的個樣本,從中隨機抽取一個樣本,使每個樣本被抽到的概率都等于1/,這種抽樣稱為簡單隨機抽樣。注意:定義2.1與定義2.3是等價的。三個定義之間的聯(lián)系定義2.3按照從總體的N個單元中抽取n個單元的所有可能不同8簡單隨機抽樣的具體實施方法常用的有抽簽法和隨機數(shù)法兩種。(一)抽簽法抽簽法是先對總體N個抽樣單元分別編上1到N的號碼,再制作與之相對應的N個號簽并充分搖勻后,從中隨機地抽取n個號簽(可以是一次抽取n個號簽,也可以一次抽一個號簽,連續(xù)抽n次),與抽中號簽號碼相同的n個單元即為抽中的單元,由其組成簡單隨機樣本。抽簽法在技術上十分簡單,但在實際應用中,對總體各單元編號并制作號簽的工作量可能會很繁重,尤其是當總體容量比較大時,抽簽法并不是很方便,而且也往往難以保證做到等概率。因此,實際工作中常常使用隨機數(shù)法。簡單隨機抽樣的具體實施方法9(二)隨機數(shù)法隨機數(shù)法就是利用隨機數(shù)表、隨機數(shù)骰子或計算機產(chǎn)生的隨機數(shù)進行抽樣。由于計算機產(chǎn)生的隨機數(shù)實際上是偽隨機數(shù),不是真正的隨機數(shù),特別是直接采用一般現(xiàn)成程序時,產(chǎn)生的隨機數(shù)往往不能保證其隨機性。因此,一般使用隨機數(shù)表,或用隨機數(shù)骰子產(chǎn)生的隨機數(shù),特別在n比較大時。(二)隨機數(shù)法101、隨機數(shù)表及其使用方法隨機數(shù)表是由0到9的10個阿拉伯數(shù)字進行隨機排列組成的表。所謂隨機排列,即每個數(shù)字都是按等概和重復獨立抽取的方式排定的。在編制時,使用一種特制的電器或用計算機,將0至9的10個數(shù)字隨機地自動搖出,每個搖出的數(shù)字就是一個隨機數(shù)字。為使用方便,可依其出現(xiàn)的次序,按行或按列分成幾位一組進行排列。根據(jù)不同的需要,它們所含數(shù)字的多少以及分位和排列的方式盡可以不同。1、隨機數(shù)表及其使用方法11目前,世界上已編有許多種隨機數(shù)表。其中較大的有蘭德公司編制,1955年出版的100萬數(shù)字隨機數(shù)表,它按五位一組排列,共有20萬組;肯德爾和史密斯編制,1938年出版的10萬數(shù)字隨機數(shù)表,它也按五位一組排列,共有25000組。我國常用的是中國科學院數(shù)學研究所概率統(tǒng)計室編印的《常用數(shù)理統(tǒng)計表》中的隨機數(shù)表。目前,世界上已編有許多種隨機數(shù)表。其中較大的有蘭德公司編制,12簡單隨機抽樣屬等概率抽樣,在使用隨機數(shù)表時,要注意以下幾點:①每次使用時,確定使用哪頁及哪行哪列的數(shù)字為起點,必須是隨機的。②設總體容量為N,若N的位數(shù)為r,則一定要從r位數(shù)中抽取。遇到1至N的數(shù)可直接使用;遇到其它的數(shù)不能直接使用。簡單隨機抽樣屬等概率抽樣,在使用隨機數(shù)表時,要注意以下幾點:13③當r≥2時,可從含有起點數(shù)字左邊的r位數(shù)開始,也可從右邊的r位數(shù)開始。可從起點開始向下抽取,也可向右抽取。但一經(jīng)確定使用哪一種方式,就必須用一種方式抽取全部單元號,中途不能變更。④在重復抽樣時,遇到重復的數(shù)字應重復使用;在不重復抽樣時,遇到重復的數(shù)字應舍去不用。③當r≥2時,可從含有起點數(shù)字左邊的r位數(shù)開始,也可從右邊的14隨機數(shù)表法一般分下述幾步:第一步:確定起點頁碼,如用筆尖在隨機數(shù)表上隨機指定一點,若落點數(shù)字(或距落點最近的數(shù)字)為奇數(shù),則確定起點在第1頁;否則,起點在第二頁。第二步:確定起點的行數(shù)與列數(shù),先在表上隨機指定一點,由落點處的兩位數(shù)確定起點的行數(shù)。由于每頁只有50行,所以當落點處的兩位數(shù)大于50時,則取其減去50的差數(shù)為行數(shù)。為保證等概性,當落點處的數(shù)為“00”時,則行數(shù)應取作50。然后依同樣的方法再確定起點的列數(shù)。隨機數(shù)表法一般分下述幾步:第一步:確定起點頁碼,如用筆尖在隨15第三步:確定所抽樣本單元的號碼。從上述確定的起點開始向下(或向右),每次取一個r位數(shù)。通常,若所需抽的數(shù)是一位數(shù)或兩位數(shù)(即r=1或2),則由起點開始,依次向右抽取較方便,達到該行右端時,從下一行左端開始繼續(xù)向右抽?。蝗羲璩榈臄?shù)是三位及以上(即r≥3)則由起點開始依次向下抽取較方便,達到最后一行時,向右移10位(或r位),再從第一行開始向下繼續(xù)抽取,直到取足所需的n個r位數(shù)為止,以這n個r位數(shù)所對應的總體單元組成樣本。第三步:確定所抽樣本單元的號碼。從上述確定的起點開始向下(或162、隨機數(shù)骰子及其使用方法隨機數(shù)骰子是由均勻材料制成的正二十面體(通常的骰子是正六面體,即正方體),面上刻有0-9的數(shù)字各2個。每盒骰子由盒體、盒蓋、泡沫塑料墊及若干個(通常是3-6個)不同顏色的骰子組成。使用隨機數(shù)骰子時可以像普通骰子那樣用投擲的方法。但正規(guī)的方法是將一個或n個骰子放在盒中,拿去泡沫塑料墊,水平地搖動盒子,使骰子充分旋轉,最后打開盒子,讀出骰子表示的數(shù)字。一個骰子一次產(chǎn)生一個0-9的隨機數(shù)。要產(chǎn)生一個m位數(shù)字的隨機數(shù),就需要同時使用m個骰子(事先規(guī)定好每種顏色所代表的位數(shù),例如紅色表示百位數(shù),藍色表示十位數(shù),黃色表示個位數(shù)等),或將一個骰子使用m次(規(guī)定第一次產(chǎn)生的數(shù)字為最高位數(shù),最后一次產(chǎn)生的數(shù)字為最末位即個位數(shù)字等)。特別規(guī)定m個骰子的數(shù)字(或一個骰子m次產(chǎn)生的數(shù)字)都為0時,表示10m。2、隨機數(shù)骰子及其使用方法隨機數(shù)骰子是由均勻材料制成的正二十17也許有人會認為,在抽樣時不用隨機數(shù)表,而采取隨意抽選的辦法也可以達到預期的抽樣效果。表面上看,這種想法似乎有一定道理,但實際試驗的結果證明隨意抽樣不等于隨機抽樣。也許有人會認為,在抽樣時不用隨機數(shù)表,而采取隨意抽選的辦法也18簡單隨機抽樣的方法評估簡單隨機抽樣對總體不加任何限制,等概率地從總體中直接抽取樣本,是最簡單、最單純的抽樣技術,它具有計算簡便的優(yōu)點,是研究其它復雜抽樣技術的基礎,也是比較各種抽樣技術之間估計效率的標準,同時,從理論上講簡單隨機抽樣在各種抽樣技術中是貫徹隨機原則最好的一種,并且數(shù)學性質很簡單,是等概率抽樣的特殊類型。簡單隨機抽樣的方法評估簡單隨機抽樣對總體不加任何限制,等概19另一方面,因為是等概率抽取樣本,所以要求總體在所研究的主要標志上同質性或齊性(共性)較好,也即總體要比較均勻;要求樣本容量要比較大,以保證樣本對總體具有充分的代表性。但是,在社會經(jīng)濟現(xiàn)象中,這種均勻總體是很少見的。因此,實際工作中很少單純使用簡單隨機抽樣方法。另一方面,因為是等概率抽取樣本,所以要求總體在所研究的主要標20再者,因為直接從總體中抽取樣本,未能充分利用關于總體的各種其它已知信息,以有效地提高樣本的代表性,并進而提高抽樣的估計效率。再者,因為直接從總體中抽取樣本,未能充分利用關于總體的各種其21此外,簡單隨機抽樣要求在抽樣前編制出抽樣框,并對每一個總體抽樣單元進行編號,而且當總體抽樣單元的分布比較分散時,樣本也可能會比較分散,這些都會給簡單隨機抽樣方法的運用造成許多的不便,甚至在某些情況下干脆無法使用。因此,在此基礎上研究其它抽樣技術顯得更加重要。此外,簡單隨機抽樣要求在抽樣前編制出抽樣框,并對每一個總體抽22符號的表示總體均值總體總值(總體總量)總體比例總體比率(總體比值)符號的表示總體均值23簡單隨機抽樣課件24簡單隨機抽樣課件252.2簡單估計量及其性質2.2.1簡單估計量的性質引理2.1從大小為N的總體中抽取一個樣本量為n的簡單隨機樣本,則總體中每個特定單元入樣的概率為,兩個特定單元都入樣的概率為。2.2簡單估計量及其性質2.2.1簡單估計量的性質26簡單隨機抽樣課件27一、總體均值的估計1.簡單估計及其無偏性:一、總體均值的估計28定理2.1對于簡單隨機抽樣,作為的簡單估計,是無偏的。注意定理可以表示成更簡潔的形式:定理2.1對于簡單隨機抽樣,作為的簡單估計,29證明1:(定義法)簡單隨機抽樣課件30證明2:(對稱性論證法)證明2:(對稱性論證法)31證明3:從總體規(guī)模為N的總體中抽取一個容量為n的簡單隨機樣本。若對總體中每個單元,如引理2.2引進隨機變量即可完成證明。參見34頁。證明3:從總體規(guī)模為N的總體中抽取一個容量為n的簡單隨機樣本32簡單隨機抽樣課件33估計量的方差在抽樣推斷中,有時往往只計算出估計量的值,而不大注意估計量的誤差(方差或標準差)。但是,總體均值的估計量通常與總體均值的真值間不完全一致,即存在誤差,而且所有可能的樣本均值相對于總體均值的誤差大小也是不一致的。聯(lián)合國統(tǒng)計局編的《抽樣調(diào)查理論基礎》一書指出:“從研究大多數(shù)國家的抽樣實踐中,可以看出:雖然計算估計量的標準差,至少對關鍵性的幾個估計量計算其標準差來說,僅需增加很少的額外開支或負擔,但是他們并不意識到確定估計量的標準差的重要意義。這是否因為統(tǒng)計人員無意識地忽視了估計量的不精確性所產(chǎn)生的嚴峻的現(xiàn)實呢?計算標準差,并且把他們與估計量一起列出來,應該成為實際工作的一個常規(guī)。”估計量的方差在抽樣推斷中,有時往往只計算出估計量的值,而不342.2.2簡單估計量方差與協(xié)方差2.2.2簡單估計量方差與協(xié)方差351、簡單估計量的方差1、簡單估計量的方差36證明:方法一:根據(jù)方差的定義和性質,顯然有

=證明:方法一:根據(jù)方差的定義和性質,顯然有37根據(jù)前面定理2.1證明的方法二中使用過的對稱性證明方法,即知:==根據(jù)前面定理2.1證明的方法二中使用過的對稱性證明方法,即知38故=

===故=39證明2:仿照前面定理2.1之證明3引進隨機變量,且運用引理2.2的結論就可完成證明。參見36頁。證明2:仿照前面定理2.1之證明3引進隨機變量,且運用引理40推論2.4對于簡單隨機抽樣,的方差為:推論2.4對于簡單隨機抽樣,的方差為:41

422、兩個估計量的協(xié)方差2、兩個估計量的協(xié)方差43證明1:根據(jù)定義,采用對稱證明法。參見40頁。證明1:根據(jù)定義,采用對稱證明法。參見40頁。44簡單隨機抽樣課件45簡單隨機抽樣課件462.2.3方差與協(xié)方差的估計2.2.3方差與協(xié)方差的估計47證明:只需證由定義由對稱論證法簡單隨機抽樣課件48簡單隨機抽樣課件49簡單隨機抽樣課件50區(qū)間估計區(qū)間估計51在獲得各種總體特征的簡單估計量的方差估計后,由于這些簡單估計量均以樣本均值為核心構建,根據(jù)中心極限定理它們都接近正態(tài)分布核心估計量樣本均值分布近似服從正態(tài)分布。于是,可按照數(shù)理統(tǒng)計中有關正態(tài)分布總體特征的區(qū)間估計步驟進行估計,首先根據(jù)樣本調(diào)查值計算出和,然后用作為的近似在獲得各種總體特征的簡單估計量的方差估計后,由于這些簡單估計52簡單隨機抽樣課件53例子1`1例子1`154簡單隨機抽樣課件55例:在某地區(qū)10000戶家庭中,按簡單隨機抽樣抽取400戶,調(diào)查一個月的伙食費(單位:元)。經(jīng)計算:(1)試估計該地區(qū)平均每戶每月的伙食費,并估計其標準差。(忽略f)(2)給出置信度為95%時該地區(qū)平均每戶每月伙食費的近似置信區(qū)間。例:在某地區(qū)10000戶家庭中,按簡單隨機抽樣抽取400戶,56解:(1)

(2)解:57例:某地區(qū)性專業(yè)雜志目前擁有8000家訂戶,從中按簡單隨機抽樣抽取了484戶,這484戶的年均收入為30500元,標準差為7040元。試求該雜志訂戶的年均收入的置信度為95%的近似置信區(qū)間。解:例:某地區(qū)性專業(yè)雜志目前擁有8000家訂戶,從中按簡單隨582.3比率估計量及其性質2.3比率估計量及其性質59一、使用比估計的兩種情況1.比值(或比率)一、使用比估計的兩種情況1.比值(或比率)60

例:例:61

例:“篩選性”問題例:“篩選性”問題62

例:1802年,法國的Laplace受政府委托進行法國人口的估計與推算。推算方法如下:

2.利用輔助變量的信息改進估計的精度例:1802年,法國的Laplace受政府委托進行法國人口63利用輔助變量的信息改進估計的精度利用輔助變量的信息改進估計的精度64二、簡單隨機抽樣下的比估計1.比的簡單估計量:二、簡單隨機抽樣下的比估計652.性質:

對于簡單隨機抽樣2.性質:66證明:證明:67簡單隨機抽樣課件68簡單隨機抽樣課件69簡單隨機抽樣課件70(3)比率估計量的方差估計(3)比率估計量的方差估計71簡單隨機抽樣課件72比率估計量的方差估計值

比率估計量的方差估計值73比率估計量的方差估計值

比率估計量的方差估計值74例:某小區(qū)有1920戶,從中隨機抽取了70戶,調(diào)查各戶的住房面積(單位:平方米)和家庭人口,得數(shù)據(jù):

試對人均住房面積作點估計和置信度為95%的區(qū)間估計。例:某小區(qū)有1920戶,從中隨機抽取了70戶,調(diào)查各戶的住房75

解:解:763.比率估計量與簡單估計量的比較3.比率估計量與簡單估計量的比較77回歸估計

Linearregression

回歸估計

Linearregression781.簡單隨機抽樣中的回歸估計量:對于簡單隨機抽樣,總體均值和總體總值的回歸估計量分別為:1.簡單隨機抽樣中的回歸估計量:79簡單隨機抽樣課件80簡單隨機抽樣課件81簡單隨機抽樣課件82證明:證明:83簡單隨機抽樣課件84例:總體由75308個農(nóng)場組成,設yi為第i個農(nóng)場養(yǎng)牛的頭數(shù),xi為第i個農(nóng)場的面積。已知農(nóng)場平均面積為31.25英畝,選取一個樣本容量為2055的簡單隨機樣本。經(jīng)計算得:

試估計每個農(nóng)場平均養(yǎng)牛頭數(shù)及標準差。例:總體由75308個農(nóng)場組成,設yi為第i個農(nóng)場養(yǎng)牛的頭數(shù)85解:解:862.5簡單隨機抽樣的實施一、樣本容量的確定的原則與主要因素

簡單隨機抽樣的費用:若CT,C0定,則最大的n就確定了。

2.5簡單隨機抽樣的實施一、樣本容量的確定的原則與主要因87精度常見的表示方法:精度常見的表示方法:881.估計R時樣本量的確定:1.估計R時樣本量的確定:89例:某公司有1000名職工,為了估計職工今年與去年病假工時的比率,要抽一個容量為n的簡單隨機樣本進行調(diào)查。先隨機抽了10人作試點調(diào)查,數(shù)據(jù)如下:例:某公司有1000名職工,為了估計職工今年與去年病假工時的90希望以置信度95%,使估計R的絕對誤差不超過0.01,應抽容量為多大的樣本?已知公司職工去年病假工時為16300。解:希望以置信度95%,使估計R的絕對誤差不超過0.01,應抽容91簡單隨機抽樣課件92例:審計員想把一個醫(yī)院的財產(chǎn)的現(xiàn)在價值與記錄價值作一比較。從計算機存儲的記錄里查到,醫(yī)院的財產(chǎn)有2100項,共計價值950000元。為了估計現(xiàn)在的價值,擬在2100項目中隨機抽取n項。因為沒有信息可用來確定n,先隨機抽了15項,獲得數(shù)據(jù)整理如下:試確定n,使估計量的絕對誤差不超過500元(置信度為95%)。例:審計員想把一個醫(yī)院的財產(chǎn)的現(xiàn)在價值與記錄價值作一比較。從93解:解:94簡單隨機抽樣課件95二、估計總體均值或總量時樣本量的確定方法先對總體均值的情形討論。1.精度要求:置信度1-α的絕對誤差限為d,即

二、估計總體均值或總量時樣本量的確定方法96則估計總體均值時樣本量這樣確定:則估計總體均值時樣本量這樣確定:972.精度要求:置信度1-α的相對誤差限為r,即

則估計總體均值時樣本量這樣確定:

2.精度要求:置信度1-α的相對誤差限為r,即98簡單隨機抽樣課件99例1:若要求估計職工的平均收入的絕對誤差在20元之內(nèi),置信度為95%,N=4328,,則樣本量應該是多少?解:例1:若要求估計職工的平均收入的絕對誤差在20元之內(nèi),置信度100例2:在某地區(qū)10000戶家庭中,按單純隨機抽樣抽取400戶,調(diào)查一個月的伙食費(單位:元)。經(jīng)計算:利用這次抽樣結果,現(xiàn)在若要再進行一次簡單隨機抽樣,分別要求如下時,樣本量各為多少?(1)要求d=50(置信度為0.95);(2)要求r=0.05(置信度為0.95)。例2:在某地區(qū)10000戶家庭中,按單純隨機抽樣抽取400戶101解:解:1022.設計效應(designeffect):2.設計效應(designeffect):103第二章簡單隨機抽樣第二章簡單隨機抽樣104第二章簡單隨機抽樣1、簡單估計量2、比率估計量3、回歸估計量第二章簡單隨機抽樣1、簡單估計量105例:從某個總體抽取一個n=50的獨立同分布樣本,樣本數(shù)據(jù)如下:5676016657323669374626192792876905205023124525625575743508758342035939801722877532592768766923718876413994429274429181117841640521058797746153644476(1)計算樣本均值與樣本方差。(2)若用估計總體均值μ,按數(shù)理統(tǒng)計結果,是否無偏,并寫出它的方差表達式。(3)根據(jù)上述樣本數(shù)據(jù),如何估計?(4)假定的分布是近似正態(tài)的,試分別給出總體均值μ的置信度為95%的近似置信區(qū)間。例:從某個總體抽取一個n=50的獨立同分布樣本,樣本數(shù)據(jù)如下106(1)計算樣本均值與樣本方差。(2)若用估計總體均值μ,按數(shù)理統(tǒng)計結果,是否無偏,并寫出它的方差表達式。

(3)根據(jù)上述樣本數(shù)據(jù),如何估計?(1)計算樣本均值與樣本方差。107(4)假定的分布是近似正態(tài)的,試分別給出總體均值μ的置信度為95%的近似置信區(qū)間。(4)假定的分布是近似正態(tài)的,試分別給出總體均值μ的置信度為108概述一、簡單隨機抽樣(或單純隨機抽樣)本書一般局限于不放回隨機抽樣二、實施方法三、地位、作用是其他抽樣方法基礎概述一、簡單隨機抽樣(或單純隨機抽樣)1092.1定義與符號定義2.1從總體的N個單元中,一次整批抽取n個單元,使任何一個單元被抽中的概率都相等,任何n個不同單元組成的組合被抽中的概率也都相等,這種抽樣稱為簡單隨機抽樣.定義2.2從總體的N個單元中,逐個不放回抽取單元,每次抽取到尚未入樣的任何一個單元的概率都相等,直到抽足n個單元為止,這樣所得的n個單元組成一個簡單隨機樣本.2.1定義與符號定義2.1從總體的N個單元中,一次整批抽取110定義2.3按照從總體的N個單元中抽取n個單元的所有可能不同組合構造所有可能的個樣本,從中隨機抽取一個樣本,使每個樣本被抽到的概率都等于1/,這種抽樣稱為簡單隨機抽樣。注意:定義2.1與定義2.3是等價的。三個定義之間的聯(lián)系定義2.3按照從總體的N個單元中抽取n個單元的所有可能不同111簡單隨機抽樣的具體實施方法常用的有抽簽法和隨機數(shù)法兩種。(一)抽簽法抽簽法是先對總體N個抽樣單元分別編上1到N的號碼,再制作與之相對應的N個號簽并充分搖勻后,從中隨機地抽取n個號簽(可以是一次抽取n個號簽,也可以一次抽一個號簽,連續(xù)抽n次),與抽中號簽號碼相同的n個單元即為抽中的單元,由其組成簡單隨機樣本。抽簽法在技術上十分簡單,但在實際應用中,對總體各單元編號并制作號簽的工作量可能會很繁重,尤其是當總體容量比較大時,抽簽法并不是很方便,而且也往往難以保證做到等概率。因此,實際工作中常常使用隨機數(shù)法。簡單隨機抽樣的具體實施方法112(二)隨機數(shù)法隨機數(shù)法就是利用隨機數(shù)表、隨機數(shù)骰子或計算機產(chǎn)生的隨機數(shù)進行抽樣。由于計算機產(chǎn)生的隨機數(shù)實際上是偽隨機數(shù),不是真正的隨機數(shù),特別是直接采用一般現(xiàn)成程序時,產(chǎn)生的隨機數(shù)往往不能保證其隨機性。因此,一般使用隨機數(shù)表,或用隨機數(shù)骰子產(chǎn)生的隨機數(shù),特別在n比較大時。(二)隨機數(shù)法1131、隨機數(shù)表及其使用方法隨機數(shù)表是由0到9的10個阿拉伯數(shù)字進行隨機排列組成的表。所謂隨機排列,即每個數(shù)字都是按等概和重復獨立抽取的方式排定的。在編制時,使用一種特制的電器或用計算機,將0至9的10個數(shù)字隨機地自動搖出,每個搖出的數(shù)字就是一個隨機數(shù)字。為使用方便,可依其出現(xiàn)的次序,按行或按列分成幾位一組進行排列。根據(jù)不同的需要,它們所含數(shù)字的多少以及分位和排列的方式盡可以不同。1、隨機數(shù)表及其使用方法114目前,世界上已編有許多種隨機數(shù)表。其中較大的有蘭德公司編制,1955年出版的100萬數(shù)字隨機數(shù)表,它按五位一組排列,共有20萬組;肯德爾和史密斯編制,1938年出版的10萬數(shù)字隨機數(shù)表,它也按五位一組排列,共有25000組。我國常用的是中國科學院數(shù)學研究所概率統(tǒng)計室編印的《常用數(shù)理統(tǒng)計表》中的隨機數(shù)表。目前,世界上已編有許多種隨機數(shù)表。其中較大的有蘭德公司編制,115簡單隨機抽樣屬等概率抽樣,在使用隨機數(shù)表時,要注意以下幾點:①每次使用時,確定使用哪頁及哪行哪列的數(shù)字為起點,必須是隨機的。②設總體容量為N,若N的位數(shù)為r,則一定要從r位數(shù)中抽取。遇到1至N的數(shù)可直接使用;遇到其它的數(shù)不能直接使用。簡單隨機抽樣屬等概率抽樣,在使用隨機數(shù)表時,要注意以下幾點:116③當r≥2時,可從含有起點數(shù)字左邊的r位數(shù)開始,也可從右邊的r位數(shù)開始??蓮钠瘘c開始向下抽取,也可向右抽取。但一經(jīng)確定使用哪一種方式,就必須用一種方式抽取全部單元號,中途不能變更。④在重復抽樣時,遇到重復的數(shù)字應重復使用;在不重復抽樣時,遇到重復的數(shù)字應舍去不用。③當r≥2時,可從含有起點數(shù)字左邊的r位數(shù)開始,也可從右邊的117隨機數(shù)表法一般分下述幾步:第一步:確定起點頁碼,如用筆尖在隨機數(shù)表上隨機指定一點,若落點數(shù)字(或距落點最近的數(shù)字)為奇數(shù),則確定起點在第1頁;否則,起點在第二頁。第二步:確定起點的行數(shù)與列數(shù),先在表上隨機指定一點,由落點處的兩位數(shù)確定起點的行數(shù)。由于每頁只有50行,所以當落點處的兩位數(shù)大于50時,則取其減去50的差數(shù)為行數(shù)。為保證等概性,當落點處的數(shù)為“00”時,則行數(shù)應取作50。然后依同樣的方法再確定起點的列數(shù)。隨機數(shù)表法一般分下述幾步:第一步:確定起點頁碼,如用筆尖在隨118第三步:確定所抽樣本單元的號碼。從上述確定的起點開始向下(或向右),每次取一個r位數(shù)。通常,若所需抽的數(shù)是一位數(shù)或兩位數(shù)(即r=1或2),則由起點開始,依次向右抽取較方便,達到該行右端時,從下一行左端開始繼續(xù)向右抽??;若所需抽的數(shù)是三位及以上(即r≥3)則由起點開始依次向下抽取較方便,達到最后一行時,向右移10位(或r位),再從第一行開始向下繼續(xù)抽取,直到取足所需的n個r位數(shù)為止,以這n個r位數(shù)所對應的總體單元組成樣本。第三步:確定所抽樣本單元的號碼。從上述確定的起點開始向下(或1192、隨機數(shù)骰子及其使用方法隨機數(shù)骰子是由均勻材料制成的正二十面體(通常的骰子是正六面體,即正方體),面上刻有0-9的數(shù)字各2個。每盒骰子由盒體、盒蓋、泡沫塑料墊及若干個(通常是3-6個)不同顏色的骰子組成。使用隨機數(shù)骰子時可以像普通骰子那樣用投擲的方法。但正規(guī)的方法是將一個或n個骰子放在盒中,拿去泡沫塑料墊,水平地搖動盒子,使骰子充分旋轉,最后打開盒子,讀出骰子表示的數(shù)字。一個骰子一次產(chǎn)生一個0-9的隨機數(shù)。要產(chǎn)生一個m位數(shù)字的隨機數(shù),就需要同時使用m個骰子(事先規(guī)定好每種顏色所代表的位數(shù),例如紅色表示百位數(shù),藍色表示十位數(shù),黃色表示個位數(shù)等),或將一個骰子使用m次(規(guī)定第一次產(chǎn)生的數(shù)字為最高位數(shù),最后一次產(chǎn)生的數(shù)字為最末位即個位數(shù)字等)。特別規(guī)定m個骰子的數(shù)字(或一個骰子m次產(chǎn)生的數(shù)字)都為0時,表示10m。2、隨機數(shù)骰子及其使用方法隨機數(shù)骰子是由均勻材料制成的正二十120也許有人會認為,在抽樣時不用隨機數(shù)表,而采取隨意抽選的辦法也可以達到預期的抽樣效果。表面上看,這種想法似乎有一定道理,但實際試驗的結果證明隨意抽樣不等于隨機抽樣。也許有人會認為,在抽樣時不用隨機數(shù)表,而采取隨意抽選的辦法也121簡單隨機抽樣的方法評估簡單隨機抽樣對總體不加任何限制,等概率地從總體中直接抽取樣本,是最簡單、最單純的抽樣技術,它具有計算簡便的優(yōu)點,是研究其它復雜抽樣技術的基礎,也是比較各種抽樣技術之間估計效率的標準,同時,從理論上講簡單隨機抽樣在各種抽樣技術中是貫徹隨機原則最好的一種,并且數(shù)學性質很簡單,是等概率抽樣的特殊類型。簡單隨機抽樣的方法評估簡單隨機抽樣對總體不加任何限制,等概122另一方面,因為是等概率抽取樣本,所以要求總體在所研究的主要標志上同質性或齊性(共性)較好,也即總體要比較均勻;要求樣本容量要比較大,以保證樣本對總體具有充分的代表性。但是,在社會經(jīng)濟現(xiàn)象中,這種均勻總體是很少見的。因此,實際工作中很少單純使用簡單隨機抽樣方法。另一方面,因為是等概率抽取樣本,所以要求總體在所研究的主要標123再者,因為直接從總體中抽取樣本,未能充分利用關于總體的各種其它已知信息,以有效地提高樣本的代表性,并進而提高抽樣的估計效率。再者,因為直接從總體中抽取樣本,未能充分利用關于總體的各種其124此外,簡單隨機抽樣要求在抽樣前編制出抽樣框,并對每一個總體抽樣單元進行編號,而且當總體抽樣單元的分布比較分散時,樣本也可能會比較分散,這些都會給簡單隨機抽樣方法的運用造成許多的不便,甚至在某些情況下干脆無法使用。因此,在此基礎上研究其它抽樣技術顯得更加重要。此外,簡單隨機抽樣要求在抽樣前編制出抽樣框,并對每一個總體抽125符號的表示總體均值總體總值(總體總量)總體比例總體比率(總體比值)符號的表示總體均值126簡單隨機抽樣課件127簡單隨機抽樣課件1282.2簡單估計量及其性質2.2.1簡單估計量的性質引理2.1從大小為N的總體中抽取一個樣本量為n的簡單隨機樣本,則總體中每個特定單元入樣的概率為,兩個特定單元都入樣的概率為。2.2簡單估計量及其性質2.2.1簡單估計量的性質129簡單隨機抽樣課件130一、總體均值的估計1.簡單估計及其無偏性:一、總體均值的估計131定理2.1對于簡單隨機抽樣,作為的簡單估計,是無偏的。注意定理可以表示成更簡潔的形式:定理2.1對于簡單隨機抽樣,作為的簡單估計,132證明1:(定義法)簡單隨機抽樣課件133證明2:(對稱性論證法)證明2:(對稱性論證法)134證明3:從總體規(guī)模為N的總體中抽取一個容量為n的簡單隨機樣本。若對總體中每個單元,如引理2.2引進隨機變量即可完成證明。參見34頁。證明3:從總體規(guī)模為N的總體中抽取一個容量為n的簡單隨機樣本135簡單隨機抽樣課件136估計量的方差在抽樣推斷中,有時往往只計算出估計量的值,而不大注意估計量的誤差(方差或標準差)。但是,總體均值的估計量通常與總體均值的真值間不完全一致,即存在誤差,而且所有可能的樣本均值相對于總體均值的誤差大小也是不一致的。聯(lián)合國統(tǒng)計局編的《抽樣調(diào)查理論基礎》一書指出:“從研究大多數(shù)國家的抽樣實踐中,可以看出:雖然計算估計量的標準差,至少對關鍵性的幾個估計量計算其標準差來說,僅需增加很少的額外開支或負擔,但是他們并不意識到確定估計量的標準差的重要意義。這是否因為統(tǒng)計人員無意識地忽視了估計量的不精確性所產(chǎn)生的嚴峻的現(xiàn)實呢?計算標準差,并且把他們與估計量一起列出來,應該成為實際工作的一個常規(guī)?!惫烙嬃康姆讲钤诔闃油茢嘀校袝r往往只計算出估計量的值,而不1372.2.2簡單估計量方差與協(xié)方差2.2.2簡單估計量方差與協(xié)方差1381、簡單估計量的方差1、簡單估計量的方差139證明:方法一:根據(jù)方差的定義和性質,顯然有

=證明:方法一:根據(jù)方差的定義和性質,顯然有140根據(jù)前面定理2.1證明的方法二中使用過的對稱性證明方法,即知:==根據(jù)前面定理2.1證明的方法二中使用過的對稱性證明方法,即知141故=

===故=142證明2:仿照前面定理2.1之證明3引進隨機變量,且運用引理2.2的結論就可完成證明。參見36頁。證明2:仿照前面定理2.1之證明3引進隨機變量,且運用引理143推論2.4對于簡單隨機抽樣,的方差為:推論2.4對于簡單隨機抽樣,的方差為:144

1452、兩個估計量的協(xié)方差2、兩個估計量的協(xié)方差146證明1:根據(jù)定義,采用對稱證明法。參見40頁。證明1:根據(jù)定義,采用對稱證明法。參見40頁。147簡單隨機抽樣課件148簡單隨機抽樣課件1492.2.3方差與協(xié)方差的估計2.2.3方差與協(xié)方差的估計150證明:只需證由定義由對稱論證法簡單隨機抽樣課件151簡單隨機抽樣課件152簡單隨機抽樣課件153區(qū)間估計區(qū)間估計154在獲得各種總體特征的簡單估計量的方差估計后,由于這些簡單估計量均以樣本均值為核心構建,根據(jù)中心極限定理它們都接近正態(tài)分布核心估計量樣本均值分布近似服從正態(tài)分布。于是,可按照數(shù)理統(tǒng)計中有關正態(tài)分布總體特征的區(qū)間估計步驟進行估計,首先根據(jù)樣本調(diào)查值計算出和,然后用作為的近似在獲得各種總體特征的簡單估計量的方差估計后,由于這些簡單估計155簡單隨機抽樣課件156例子1`1例子1`1157簡單隨機抽樣課件158例:在某地區(qū)10000戶家庭中,按簡單隨機抽樣抽取400戶,調(diào)查一個月的伙食費(單位:元)。經(jīng)計算:(1)試估計該地區(qū)平均每戶每月的伙食費,并估計其標準差。(忽略f)(2)給出置信度為95%時該地區(qū)平均每戶每月伙食費的近似置信區(qū)間。例:在某地區(qū)10000戶家庭中,按簡單隨機抽樣抽取400戶,159解:(1)

(2)解:160例:某地區(qū)性專業(yè)雜志目前擁有8000家訂戶,從中按簡單隨機抽樣抽取了484戶,這484戶的年均收入為30500元,標準差為7040元。試求該雜志訂戶的年均收入的置信度為95%的近似置信區(qū)間。解:例:某地區(qū)性專業(yè)雜志目前擁有8000家訂戶,從中按簡單隨1612.3比率估計量及其性質2.3比率估計量及其性質162一、使用比估計的兩種情況1.比值(或比率)一、使用比估計的兩種情況1.比值(或比率)163

例:例:164

例:“篩選性”問題例:“篩選性”問題165

例:1802年,法國的Laplace受政府委托進行法國人口的估計與推算。推算方法如下:

2.利用輔助變量的信息改進估計的精度例:1802年,法國的Laplace受政府委托進行法國人口166利用輔助變量的信息改進估計的精度利用輔助變量的信息改進估計的精度167二、簡單隨機抽樣下的比估計1.比的簡單估計量:二、簡單隨機抽樣下的比估計1682.性質:

對于簡單隨機抽樣2.性質:169證明:證明:170簡單隨機抽樣課件171簡單隨機抽樣課件172簡單隨機抽樣課件173(3)比率估計量的方差估計(3)比率估計量的方差估計174簡單隨機抽樣課件175比率估計量的方差估計值

比率估計量的方差估計值176比率估計量的方差估計值

比率估計量的方差估計值177例:某小區(qū)有1920戶,從中隨機抽取了70戶,調(diào)查各戶的住房面積(單位:平方米)和家庭人口,得數(shù)據(jù):

試對人均住房面積作點

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論