樣本量的確定方法_第1頁
樣本量的確定方法_第2頁
樣本量的確定方法_第3頁
樣本量的確定方法_第4頁
樣本量的確定方法_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、樣本量的確定方法 (2008-10-14 09:12:34)? 一、樣本單位數(shù)量的確定原則一般情況下,確定樣本量需要考慮調(diào)查的目的、性質(zhì)和精度要求。以及實(shí)際操 作的可行性、經(jīng)費(fèi)承受能力等。根據(jù)調(diào)查經(jīng)驗(yàn),市場(chǎng)潛力和推斷等涉及量比較嚴(yán)格 的調(diào)查需要的樣本量比較大,而一般廣告效果等人們差異不是很大或?qū)颖玖恳?不是很嚴(yán)格的調(diào)查,樣本量相對(duì)可以少一些。實(shí)際上確定樣本量大小是比較復(fù)雜的 問題, 即要有定性的考慮, 也要有定量的考慮; 從定性的方面考慮, 決策的重要性、 調(diào)研的性質(zhì)、數(shù)據(jù)分析的性質(zhì)、資源、抽樣方法等都決定樣本量的大小。但是這只 能原則上確定樣本量大小。具體確定樣本量還需要從定量的角度考慮

2、。從定量的方面考慮 , 有具體的統(tǒng)計(jì)學(xué)公式 ,不同的抽樣方法有不同的公式。歸納起 來,樣本量的大小主要取決于:(1) 研究對(duì)象的變化程度,即變異程度;(2) 要求和允許的誤差大小,即精度要求;(3) 要求推斷的置信度,一般情況下,置信度取為95%;(4) 總體的大??;(5) 抽樣的方法。也就是說,研究的問題越復(fù)雜 ,差異越大時(shí) ,樣本量要求越大;要求的精度越高可推斷性要求越高時(shí) ,樣本量也越大;同時(shí) ,總體越大 ,樣本量也相對(duì)要大 ,但是,增 大呈現(xiàn)出一定對(duì)數(shù)特征 ,而不是線形關(guān)系;而抽樣方法問題 ,決定設(shè)計(jì)效應(yīng)的值 , 如果我們?cè)O(shè)定簡(jiǎn)單隨機(jī)抽樣設(shè)計(jì)效應(yīng)的值是1;分層抽樣由于抽樣效率高于簡(jiǎn)單隨

3、機(jī)抽樣,其設(shè)計(jì)效應(yīng)的值小于 1, 合適恰當(dāng)?shù)姆謱樱瑢⑹箤觾?nèi)樣本差異變小,層內(nèi)差異 越小,設(shè)計(jì)效應(yīng)小于 1 的幅度越大;多階抽樣由于效率低于簡(jiǎn)單隨機(jī)抽樣,設(shè)計(jì)效 應(yīng)的值大于 1, 所以抽樣調(diào)查方法的復(fù)雜程度決定其樣本量大小。對(duì)于不同城市, 如果總體不知道或很大 , 需要進(jìn)行推斷時(shí) , 大城市多抽 , 小城市少抽 , 這種說法原則上 是不對(duì)的。實(shí)際上 , 在大城市抽樣太大是浪費(fèi) , 在小城市抽樣太少?zèng)]有推斷價(jià)值。二、樣本量的確定方法如何確定樣本量 ,基本方法很多 , 但是公式檢驗(yàn)表明 , 當(dāng)誤差和置信區(qū)間一定時(shí) 不同的樣本量計(jì)算公式計(jì)算出來的樣本量是十分相近的, 所以 , 我們完全可以使用簡(jiǎn)單隨機(jī)

4、抽樣計(jì)算樣本量的公式去近似估計(jì)其他抽樣方法的樣本量, 這樣可以更加快捷方便,然后將樣本量根據(jù)一定方法分配到各個(gè)子域中去。所以,區(qū)域二相抽樣 不能計(jì)算樣本量的說法是不科學(xué)的。1簡(jiǎn)單隨機(jī)抽樣確定樣本量主要有兩種類型 :( 1)對(duì)于平均數(shù)類型的變量對(duì)于已知數(shù)據(jù)為絕對(duì)數(shù) , 我們一般根據(jù)下列步驟來計(jì)算所需要的樣本量。已知 期望調(diào)查結(jié)果的精度(E),期望調(diào)查結(jié)果的置信度(L),以及總體的標(biāo)準(zhǔn)差估計(jì)值c 的具體數(shù)據(jù),總體單位數(shù) N。計(jì)算公式為 :n= c 2/(e 2/Z 2+c 2/N)特殊情況下 ,如果是很大總體 ,計(jì)算公式變?yōu)?:n= Z 2c2/e2 例如希望平均收入的誤差在正負(fù)人民幣 30元之間

5、, 調(diào)查結(jié)果在 95%的置信范圍以內(nèi)其 95%的置信度要求 Z 的統(tǒng)計(jì)量為 1.96 。根據(jù)估計(jì)總體的標(biāo)準(zhǔn)差為150 元 , 總體單位數(shù)為 1000。樣本量 :n=150*150/(30*30/(1.96*1.96)+150*150/1000)=88(2) 于百分比類型的變量對(duì)于已知數(shù)據(jù)為百分比 , 一般根據(jù)下列步驟計(jì)算樣本量。已知調(diào)查結(jié)果的精度值百 分比(E),以及置信度(L),比例估計(jì)(P)的精度,即樣本變異程度,總體數(shù)為N。22則計(jì)算公式為 :n=P(1-P)/(e 2/Z2+ P(1-P)/N)同樣 , 特殊情況下如果不考慮總體 , 公式為 :n= Z 2P(1-P)/e 2 ?一般情

6、況下,我們不知道P的取值,取其樣本變異程度最大時(shí)的值為0.5 o例如:希望平均收入的誤差在正負(fù) 0.05 之間,調(diào)查結(jié)果在 95%的置信范圍以內(nèi) ,其95%勺置信度要求Z的統(tǒng)計(jì)量為1.96,估計(jì)P為0.5,總體單位數(shù)為1000o樣本量為:n=0.5*0.5/(0.05*0.05/(1.96*1.96)+0.5*0.5/1000)=2782. 樣本量分配方法以上分析我們獲得了采用簡(jiǎn)單隨機(jī)抽樣公式計(jì)算得到的樣本量,總的樣本量需要在此基礎(chǔ)上乘以設(shè)計(jì)效應(yīng)的值得到。由于樣本總量已經(jīng)確定,我們采用總樣本量固定方法分配樣本,這種方法包括按照比例分配和不按照比例分配兩類。實(shí)際工作 中首先計(jì)算取得區(qū)縣總的樣本量

7、 , 然后逐級(jí)將其分配到各階分層中 , 如果不清楚各 階分層的規(guī)模和方差等 , 一般采取比例分配或者比例平方根分配法。如果有一定輔 助變量可以使用,可以采用按照規(guī)模分配法分配樣本量。3. 樣本量和總體大小的關(guān)系 :在其它條件一定的情況下,即誤差、置信度、抽樣比率一定,樣本量隨總體的 大小而變化。但是,總體越大,其變化越不明顯;總體較小時(shí),變化明顯。其變化 趨勢(shì)如下:二者之間的變化并非是線性關(guān)系。所以,樣本量并不是越大越好,應(yīng)該綜合考 慮,實(shí)際工作中只要達(dá)到要求就可以了。三、抽樣調(diào)查方案樣本量的確定我們決定首先采取簡(jiǎn)單隨機(jī)抽樣的方法計(jì)算區(qū)縣的樣本量,之所以首先對(duì)區(qū)縣 計(jì)算樣本量 , 主要是考慮,

8、雖然我們方案中沒有要求對(duì)區(qū)縣的估計(jì)量,但是區(qū)縣一 級(jí)是我們做計(jì)劃和決策的基礎(chǔ),具有承上啟下的作用,如果區(qū)縣級(jí)獲得的估計(jì)量精 度比較高,就可以保證上一級(jí)的估計(jì)量具有更高的精度,而且各個(gè)區(qū)縣的樣本量可 以認(rèn)為是相同的,這主要是因?yàn)楦鱾€(gè)區(qū)縣的總體數(shù)都比較多,而且我們也不清楚; 同時(shí)也不可能事先進(jìn)行區(qū)縣方差估計(jì)。沒有首先計(jì)算區(qū)縣以下各階分層的樣本量 , 士亜阜宰龍 主要是考慮(1)如果計(jì)算區(qū)縣以下某階分層的樣本量 ,然后再將計(jì)算的樣本量合并 , 將顯 著增加樣本量,增加基層的負(fù)擔(dān)( 2)事實(shí)上 ,對(duì)于計(jì)算階可以比較好的得到它的估計(jì)量 ,但我們現(xiàn)在不需要得 到區(qū)縣以下各階分層的估計(jì)量 , 我們僅僅需要區(qū)

9、縣的估計(jì)量 ,沒有必要計(jì)算區(qū)縣以 下階樣本量。(3)我們直接對(duì)整個(gè)區(qū)縣以簡(jiǎn)單隨機(jī)抽樣進(jìn)行抽取 , 然后將其樣本量合理分配 到各階分層中 , 這樣可以使用較少樣本量得到區(qū)縣較好的估計(jì)量。以下我們以試點(diǎn)地區(qū)批零業(yè)為對(duì)象進(jìn)行研究。由于沒有誤差限以及置信度和抽 樣比率的值。 我們可以采用常用參數(shù) : 設(shè)定區(qū)縣總體為很大 , 置信度是 95%,抽樣比率 保守估計(jì)是 0.5, 抽樣誤差不能大于 15%,根據(jù)公式計(jì)算得到樣本量為 43 個(gè)。由于采 取多階分層抽樣 ,我們?nèi)绾卧O(shè)定抽樣設(shè)計(jì)效應(yīng)呢 ?區(qū)縣及以下是三階分層抽樣 , 只要 在各階進(jìn)行合適的分層,其設(shè)計(jì)效應(yīng)應(yīng)該在 2-3 之間, 我們?cè)谶@里取保守值 3

10、,那么 得到本區(qū)縣樣本量是 129個(gè), 這個(gè)樣本量就可以根據(jù)新方案得到區(qū)縣要求誤差內(nèi)的 估計(jì)值。1. 確定辦事處、居委會(huì)、村委會(huì)樣本量根據(jù)方案,每個(gè)居委會(huì)抽取樣本 5-10 個(gè),那么這個(gè)樣本量是否可行呢 ?這里涉及 如何將區(qū)縣樣本分配到街道和居委會(huì)中去,根據(jù)方案要求,街道抽取采取先分層, 后對(duì)層內(nèi)進(jìn)行PPS抽樣;那么分配樣本是否也采取同樣方法呢?主要看輔助變量與 樣本量之間的關(guān)聯(lián)程度,方案中提供了兩個(gè)輔助變量:人口數(shù)和個(gè)體數(shù),對(duì)于輔助 變量是個(gè)體數(shù)的完全可以使用規(guī)模分配方法分配樣本量,個(gè)體數(shù)多的分配較多的樣 本量;對(duì)于輔助變量是人口數(shù)的如果采取規(guī)模分配方法,由于人口數(shù)與一個(gè)地區(qū)的 個(gè)體單位數(shù)沒

11、有必然的聯(lián)系,可能導(dǎo)致某些居委會(huì)的個(gè)體數(shù)比較多,卻分配了較少 的樣本量,使得居委會(huì)分層變的困難,同時(shí)使居委會(huì)方差顯著增大。而獲得較多樣 本量的居委會(huì),分層的效果和方差提高幅度有限,故采用比例分配的方法可能更加 合適一些。對(duì)于居委會(huì)村委會(huì)的抽取,由于本階可能存在市場(chǎng)內(nèi)的抽樣,分配復(fù)雜 一些;如果本階有市場(chǎng)內(nèi)抽樣,可以適當(dāng)減少居委會(huì)村委會(huì)的樣本量,但應(yīng)該大于 本階樣本量的 80%,由于市場(chǎng)內(nèi)抽樣的特殊性,建議將本階樣本量全部分配給居委 會(huì)村委會(huì),我們所進(jìn)行的試點(diǎn)就是將樣本全部分配給居委會(huì);至于市場(chǎng)內(nèi)抽樣的具 體實(shí)施,可以根據(jù)方案操作完成。對(duì)居委會(huì)村委會(huì)層內(nèi),由于使用簡(jiǎn)單隨機(jī)抽樣完 成,采用比例分配

12、平均分配就可。在實(shí)際工作時(shí) , 由于一個(gè)區(qū)縣包括全部鄉(xiāng)鎮(zhèn)街道或其中的一個(gè);根據(jù)方案,區(qū) 縣抽取辦事處的數(shù)量應(yīng)該介于 12-4 個(gè)之間, 對(duì)應(yīng)于抽中鄉(xiāng)、鎮(zhèn)、街道的全部或其中 一個(gè),那么其每一個(gè)鄉(xiāng)鎮(zhèn)街道采取比例分配平均分配的樣本量應(yīng)該是 11-32 個(gè)之間; 所抽中的居委會(huì)、村委會(huì)數(shù)量應(yīng)該介于 16-48 個(gè)之間 , 如果個(gè)別鄉(xiāng)鎮(zhèn)街道抽中的居 委會(huì)是 2個(gè),則其居委會(huì)總數(shù)相應(yīng)減少一些;最后, 每個(gè)居委會(huì)、村委會(huì)的樣本量應(yīng)該介于 3-16 個(gè)之間 ,大部分介于 5-10 之間。以上的討論沒有考慮總體的大小 , 如果 考慮到居委會(huì)、村委會(huì)的總體有限 , 則每個(gè)居委會(huì)村委會(huì)的樣本量可以減少一些 ,具 體

13、可以采用以下公式得到具體樣本量的調(diào)整數(shù) :樣本量n=n 1*N/(N+n1)。N是本地區(qū)總體,n1是給本地區(qū)分配樣本量居委會(huì)樣本量的調(diào)整數(shù),應(yīng)該作為本居委會(huì)樣本量的底限。確定辦事處、居委會(huì)村委會(huì)的樣本量 , 與以下幾點(diǎn)有關(guān) :a) 估計(jì)量的誤差、置信度,可以決定簡(jiǎn)單隨機(jī)抽樣的樣本量b)與采用的抽樣方法有關(guān)系,它決定了設(shè)計(jì)效應(yīng)的大小。例如:分層抽樣的設(shè)計(jì) 效應(yīng)值小于 1, 多階抽樣的設(shè)計(jì)效應(yīng)值大于 1。可以決定整個(gè)抽樣的樣本量。c)與每一階的分層的數(shù)目有關(guān)系 , 所以 , 應(yīng)該重點(diǎn)考慮分層的問題 , 分層太多 , 沒有必要;分層太少 , 導(dǎo)致層內(nèi)的方差增大 ,可能影響估計(jì)值的精度以及設(shè)計(jì)效應(yīng)的

14、值, 所以,在每階分層時(shí) , 應(yīng)該合理考慮 , 使得樣本的變異程度在層內(nèi)達(dá)到一個(gè)合理 水平。根據(jù)以上原則,我們?cè)诎^的抽樣試點(diǎn)共抽取 4個(gè)辦事處 , 包括 14 個(gè)居委會(huì); 一個(gè)鄉(xiāng) , 包括 4 個(gè)村委會(huì) , 經(jīng)過清查共有批零業(yè) 1042 個(gè), 單位 70 個(gè);餐飲業(yè) 250 個(gè), 單位 3 個(gè)。由于我們使用人口數(shù)作為輔助變量,應(yīng)該采用比例分配方法平均分配樣 本量,這樣每個(gè)街道辦事處得到26 個(gè)樣本 , 對(duì)于抽取 4 個(gè)居委會(huì)的辦事處 , 每個(gè)居委會(huì)分配得到 7 個(gè)樣本;對(duì)于抽取 2個(gè)居委會(huì)的辦事處 , 每個(gè)居委會(huì)分配到 13 個(gè)樣 本。然后根據(jù)居委會(huì)總體對(duì)樣本量做出調(diào)整,得到居委會(huì)實(shí)際樣本量

15、。2. 確定居委會(huì)村委會(huì)內(nèi)分層樣本量以上我們討論如何分配給鄉(xiāng)鎮(zhèn)居委會(huì)村委會(huì)樣本量 , 現(xiàn)在分析給居委會(huì)村委會(huì) 以下各層分配樣本量 , 這一步 , 清查的工作就顯得非常重要了 , 重點(diǎn)應(yīng)該清查規(guī)模、 類別, 首先是規(guī)模,規(guī)模的大小不應(yīng)該根據(jù)工商注冊(cè)為單位或個(gè)體決定,應(yīng)該根據(jù) 實(shí)際情況,即使是個(gè)體,如果規(guī)模較大,也應(yīng)該歸入大規(guī)模分層中,這樣就可以使 得每層的樣本變異程度顯著降低,從而提高精確度。根據(jù)實(shí)際情況可以包括兩種:(1)如果全部是規(guī)模比較小的單位個(gè)體戶,我們可以根據(jù)類別進(jìn)行適當(dāng)?shù)姆?組,將某一類單位比較多的單獨(dú)分層;將另外類別比較少的,可以幾類合并進(jìn)行抽 取具體樣本,分層不要多于 4 層,并保證每層的樣本量不小于 2 個(gè)。由于居委會(huì)樣 本量數(shù)目已經(jīng)確定,我們可以直接采取比例分配方法,確定各層樣本量。( 2)如果規(guī)模比較大的和規(guī)模小的并存,可以將規(guī)模比較大的單獨(dú)分層,不 用考慮其中的類別;將規(guī)模較小的主要是個(gè)體戶可以根據(jù)類別進(jìn)行分層;其中的難 題是如何將樣本量在規(guī)模大的和規(guī)模小的之間分配,因?yàn)榇笠?guī)模層內(nèi)樣本變異程度 有可能很大,應(yīng)該

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論