樣本量的確定方法._第1頁
樣本量的確定方法._第2頁
樣本量的確定方法._第3頁
樣本量的確定方法._第4頁
免費(fèi)預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、樣本量的確定方法 (2008-10-14 09:12:34)一、樣本單位數(shù)量的確定原則一般情況下, 確定樣本量需要考慮調(diào)查的目的、 性質(zhì)和精度要求。 以及實(shí)際操作的可行 性、經(jīng)費(fèi)承受能力等。 根據(jù)調(diào)查經(jīng)驗(yàn), 市場潛力和推斷等涉及量比較嚴(yán)格的調(diào)查需要的樣本 量比較大, 而一般廣告效果等人們差異不是很大或?qū)颖玖恳蟛皇呛車?yán)格的調(diào)查, 樣本量 相對可以少一些。 實(shí)際上確定樣本量大小是比較復(fù)雜的問題, 即要有定性的考慮, 也要有定 量的考慮;從定性的方面考慮,決策的重要性、調(diào)研的性質(zhì)、數(shù)據(jù)分析的性質(zhì)、資源、抽樣 方法等都決定樣本量的大小。 但是這只能原則上確定樣本量大小。 具體確定樣本量還需要從 定

2、量的角度考慮。從定量的方面考慮 ,有具體的統(tǒng)計(jì)學(xué)公式 , 不同的抽樣方法有不同的公式。 歸納起來, 樣本量 的大小主要取決于:(1) 研究對象的變化程度,即變異程度;(2) 要求和允許的誤差大小,即精度要求;(3) 要求推斷的置信度,一般情況下,置信度取為95%;(4) 總體的大小;(5) 抽樣的方法。也就是說 , 研究的問題越復(fù)雜 , 差異越大時(shí) ,樣本量要求越大; 要求的精度越高 ,可推斷性 要求越高時(shí) , 樣本量也越大;同時(shí) , 總體越大 , 樣本量也相對要大 ,但是 ,增大呈現(xiàn)出一定對數(shù) 特征 ,而不是線形關(guān)系;而抽樣方法問題 , 決定設(shè)計(jì)效應(yīng)的值 , 如果我們設(shè)定簡單隨機(jī)抽樣設(shè) 計(jì)效

3、應(yīng)的值是 1;分層抽樣由于抽樣效率高于簡單隨機(jī)抽樣, 其設(shè)計(jì)效應(yīng)的值小于 1, 合適恰 當(dāng)?shù)姆謱樱?將使層內(nèi)樣本差異變小, 層內(nèi)差異越小,設(shè)計(jì)效應(yīng)小于 1 的幅度越大; 多階抽樣 由于效率低于簡單隨機(jī)抽樣,設(shè)計(jì)效應(yīng)的值大于 1, 所以抽樣調(diào)查方法的復(fù)雜程度決定其樣 本量大小。對于不同城市 , 如果總體不知道或很大 , 需要進(jìn)行推斷時(shí) , 大城市多抽 , 小城市少抽 這種說法原則上是不對的。 實(shí)際上 , 在大城市抽樣太大是浪費(fèi) , 在小城市抽樣太少沒有推斷價(jià) 值。二、樣本量的確定方法如何確定樣本量 ,基本方法很多 , 但是公式檢驗(yàn)表明 ,當(dāng)誤差和置信區(qū)間一定時(shí) , 不同的 樣本量計(jì)算公式計(jì)算出來

4、的樣本量是十分相近的 ,所以, 我們完全可以使用簡單隨機(jī)抽樣計(jì) 算樣本量的公式去近似估計(jì)其他抽樣方法的樣本量 , 這樣可以更加快捷方便,然后將樣本量 根據(jù)一定方法分配到各個(gè)子域中去。 所以,區(qū)域二相抽樣不能計(jì)算樣本量的說法是不科學(xué)的。1簡單隨機(jī)抽樣確定樣本量主要有兩種類型(1) 對于平均數(shù)類型的變量對于已知數(shù)據(jù)為絕對數(shù) , 我們一般根據(jù)下列步驟來計(jì)算所需要的樣本量。已知期望調(diào)查結(jié)果的精度(E),期望調(diào)查結(jié)果的置信度(L),以及總體的標(biāo)準(zhǔn)差估計(jì)值b的具體數(shù)據(jù),總體單位數(shù) N。計(jì)算公式為 :n= b 2/(e 2/Z 2+b 2/N)特殊情況下 , 如果是很大總體 , 計(jì)算公式變?yōu)?:n= Z 2

5、b 2/e 2例如希望平均收入的誤差在正負(fù)人民幣 30元之間,調(diào)查結(jié)果在 95%的置信范圍以內(nèi) ,其95% 的置信度要求Z的統(tǒng)計(jì)量為1.96。根據(jù)估計(jì)總體的標(biāo)準(zhǔn)差為150元,總體單位數(shù)為1000。樣本量 :n=150*150/(30*30/(1.96*1.96)+150*150/1000)=88(2) 于百分比類型的變量對于已知數(shù)據(jù)為百分比 , 一般根據(jù)下列步驟計(jì)算樣本量。已知調(diào)查結(jié)果的精度值百分比 (E), 以及置信度 (L), 比例估計(jì) (P) 的精度 , 即樣本變異程度,總體數(shù)為N。則計(jì)算公式為 :n=P(1-P)/(e2/Z 2+ P(1-P)/N)同樣,特殊情況下如果不考慮總體,公式

6、為:n= Z 2P(1-P)/e 2一般情況下,我們不知道P的取值,取其樣本變異程度最大時(shí)的值為0.5。例如 : 希望平均收入的誤差在正負(fù) 0.05 之間 , 調(diào)查結(jié)果在 95%的置信范圍以內(nèi) , 其 95%的置信 度要求Z的統(tǒng)計(jì)量為1.96,估計(jì)P為0.5,總體單位數(shù)為1000。樣本量為:n=0.5*0.5/(0.05*0.05/(1.96*1.96)+0.5*0.5/1000)=2782. 樣本量分配方法以上分析我們獲得了采用簡單隨機(jī)抽樣公式計(jì)算得到的樣本量,總的樣本量需要在此基礎(chǔ)上乘以設(shè)計(jì)效應(yīng)的值得到。 由于樣本總量已經(jīng)確定 , 我們采用總樣本量固定方法分配樣本 , 這種方法包括按照比例

7、分配和不按照比例分配兩類。 實(shí)際工作中首先計(jì)算取得區(qū)縣總的樣本 量, 然后逐級將其分配到各階分層中 , 如果不清楚各階分層的規(guī)模和方差等 , 一般采取比例分 配或者比例平方根分配法。 如果有一定輔助變量可以使用, 可以采用按照規(guī)模分配法分配樣 本量。3. 樣本量和總體大小的關(guān)系在其它條件一定的情況下, 即誤差、 置信度、抽樣比率一定,樣本量隨總體的大小而變化。但是,總體越大,其變化越不明顯;總體較小時(shí),變化明顯。其變化趨勢如下:二者之間的變化并非是線性關(guān)系。所以, 樣本量并不是越大越好, 應(yīng)該綜合考慮, 實(shí)際 工作中只要達(dá)到要求就可以了。三、抽樣調(diào)查方案樣本量的確定我們決定首先采取簡單隨機(jī)抽樣

8、的方法計(jì)算區(qū)縣的樣本量, 之所以首先對區(qū)縣計(jì)算樣本 量, 主要是考慮,雖然我們方案中沒有要求對區(qū)縣的估計(jì)量,但是區(qū)縣一級是我們做計(jì)劃和 決策的基礎(chǔ), 具有承上啟下的作用, 如果區(qū)縣級獲得的估計(jì)量精度比較高, 就可以保證上一 級的估計(jì)量具有更高的精度, 而且各個(gè)區(qū)縣的樣本量可以認(rèn)為是相同的, 這主要是因?yàn)楦鱾€(gè) 區(qū)縣的總體數(shù)都比較多, 而且我們也不清楚; 同時(shí)也不可能事先進(jìn)行區(qū)縣方差估計(jì)。 沒有首 先計(jì)算區(qū)縣以下各階分層的樣本量 , 主要是考慮 :(1)如果計(jì)算區(qū)縣以下某階分層的樣本量 ,然后再將計(jì)算的樣本量合并 , 將顯著增加樣 本量,增加基層的負(fù)擔(dān)。(2)事實(shí)上 , 對于計(jì)算階可以比較好的得到

9、它的估計(jì)量 , 但我們現(xiàn)在不需要得到區(qū)縣以 下各階分層的估計(jì)量 ,我們僅僅需要區(qū)縣的估計(jì)量 , 沒有必要計(jì)算區(qū)縣以下階樣本量。(3)我們直接對整個(gè)區(qū)縣以簡單隨機(jī)抽樣進(jìn)行抽取, 然后將其樣本量合理分配到各階分層中 ,這樣可以使用較少樣本量得到區(qū)縣較好的估計(jì)量。以下我們以試點(diǎn)地區(qū)批零業(yè)為對象進(jìn)行研究。 由于沒有誤差限以及置信度和抽樣比率的 值。我們可以采用常用參數(shù) : 設(shè)定區(qū)縣總體為很大 , 置信度是 95%,抽樣比率保守估計(jì)是 0.5, 抽樣誤差不能大于 15%,根據(jù)公式計(jì)算得到樣本量為 43 個(gè)。由于采取多階分層抽樣 , 我們?nèi)?何設(shè)定抽樣設(shè)計(jì)效應(yīng)呢 ?區(qū)縣及以下是三階分層抽樣 , 只要在各階

10、進(jìn)行合適的分層, 其設(shè)計(jì)效 應(yīng)應(yīng)該在 2-3 之間 ,我們在這里取保守值 3, 那么得到本區(qū)縣樣本量是 129 個(gè),這個(gè)樣本量就 可以根據(jù)新方案得到區(qū)縣要求誤差內(nèi)的估計(jì)值。1. 確定辦事處、居委會、村委會樣本量根據(jù)方案 , 每個(gè)居委會抽取樣本 5-10 個(gè), 那么這個(gè)樣本量是否可行呢 ?這里涉及如何將 區(qū)縣樣本分配到街道和居委會中去,根據(jù)方案要求,街道抽取采取先分層,后對層內(nèi)進(jìn)行 PPS抽樣;那么分配樣本是否也采取同樣方法呢?主要看輔助變量與樣本量之間的關(guān)聯(lián)程 度,方案中提供了兩個(gè)輔助變量: 人口數(shù)和個(gè)體數(shù), 對于輔助變量是個(gè)體數(shù)的完全可以使用 規(guī)模分配方法分配樣本量, 個(gè)體數(shù)多的分配較多的樣

11、本量; 對于輔助變量是人口數(shù)的如果采 取規(guī)模分配方法, 由于人口數(shù)與一個(gè)地區(qū)的個(gè)體單位數(shù)沒有必然的聯(lián)系, 可能導(dǎo)致某些居委 會的個(gè)體數(shù)比較多, 卻分配了較少的樣本量, 使得居委會分層變的困難, 同時(shí)使居委會方差 顯著增大。 而獲得較多樣本量的居委會, 分層的效果和方差提高幅度有限, 故采用比例分配 的方法可能更加合適一些。 對于居委會村委會的抽取, 由于本階可能存在市場內(nèi)的抽樣, 分 配復(fù)雜一些; 如果本階有市場內(nèi)抽樣, 可以適當(dāng)減少居委會村委會的樣本量, 但應(yīng)該大于本 階樣本量的 80%,由于市場內(nèi)抽樣的特殊性,建議將本階樣本量全部分配給居委會村委會, 我們所進(jìn)行的試點(diǎn)就是將樣本全部分配給居

12、委會; 至于市場內(nèi)抽樣的具體實(shí)施, 可以根據(jù)方 案操作完成。 對居委會村委會層內(nèi), 由于使用簡單隨機(jī)抽樣完成, 采用比例分配平均分配就 可。在實(shí)際工作時(shí) , 由于一個(gè)區(qū)縣包括全部鄉(xiāng)鎮(zhèn)街道或其中的一個(gè);根據(jù)方案,區(qū)縣抽取辦 事處的數(shù)量應(yīng)該介于 12-4 個(gè)之間 , 對應(yīng)于抽中鄉(xiāng)、 鎮(zhèn)、街道的全部或其中一個(gè), 那么其每一 個(gè)鄉(xiāng)鎮(zhèn)街道采取比例分配平均分配的樣本量應(yīng)該是 11-32 個(gè)之間; 所抽中的居委會、 村委會 數(shù)量應(yīng)該介于 16-48 個(gè)之間 , 如果個(gè)別鄉(xiāng)鎮(zhèn)街道抽中的居委會是2個(gè), 則其居委會總數(shù)相應(yīng)減少一些;最后 , 每個(gè)居委會、村委會的樣本量應(yīng)該介于 3-16 個(gè)之間 , 大部分介于 5

13、-10 之間。 以上的討論沒有考慮總體的大小 , 如果考慮到居委會、 村委會的總體有限 , 則每個(gè)居委會村委 會的樣本量可以減少一些 , 具體可以采用以下公式得到具體樣本量的調(diào)整數(shù) :樣本量n=n 1*N/(N+n1) 。 N是本地區(qū)總體,n1是給本地區(qū)分配樣本量居委會樣本量的調(diào)整數(shù),應(yīng)該作為本居委會樣本量的底限。確定辦事處、居委會村委會的樣本量 , 與以下幾點(diǎn)有關(guān) :a) 估計(jì)量的誤差、置信度,可以決定簡單隨機(jī)抽樣的樣本量b) 與采用的抽樣方法有關(guān)系 , 它決定了設(shè)計(jì)效應(yīng)的大小。 例如 : 分層抽樣的設(shè)計(jì)效應(yīng)值小 于 1, 多階抽樣的設(shè)計(jì)效應(yīng)值大于 1 ??梢詻Q定整個(gè)抽樣的樣本量。c) 與每

14、一階的分層的數(shù)目有關(guān)系 , 所以 , 應(yīng)該重點(diǎn)考慮分層的問題 , 分層太多 , 沒有必要; 分層太少 ,導(dǎo)致層內(nèi)的方差增大 ,可能影響估計(jì)值的精度以及設(shè)計(jì)效應(yīng)的值 , 所以,在每階分 層時(shí) ,應(yīng)該合理考慮 ,使得樣本的變異程度在層內(nèi)達(dá)到一個(gè)合理水平。根據(jù)以上原則,我們在包頭的抽樣試點(diǎn)共抽取 4個(gè)辦事處 ,包括 14 個(gè)居委會;一個(gè)鄉(xiāng) , 包括 4個(gè)村委會 ,經(jīng)過清查共有批零業(yè) 1042個(gè),單位 70個(gè);餐飲業(yè) 250個(gè),單位 3個(gè)。由于 我們使用人口數(shù)作為輔助變量, 應(yīng)該采用比例分配方法平均分配樣本量, 這樣每個(gè)街道辦事 處得到 26個(gè)樣本 , 對于抽取 4個(gè)居委會的辦事處 , 每個(gè)居委會分配

15、得到 7個(gè)樣本;對于抽取 2個(gè)居委會的辦事處 ,每個(gè)居委會分配到 13 個(gè)樣本。然后根據(jù)居委會總體對樣本量做出調(diào)整, 得到居委會實(shí)際樣本量。2. 確定居委會村委會內(nèi)分層樣本量以上我們討論如何分配給鄉(xiāng)鎮(zhèn)居委會村委會樣本量, 現(xiàn)在分析給居委會村委會以下各層分配樣本量 , 這一步 , 清查的工作就顯得非常重要了 , 重點(diǎn)應(yīng)該清查規(guī)模、類別 , 首先是規(guī)模, 規(guī)模的大小不應(yīng)該根據(jù)工商注冊為單位或個(gè)體決定, 應(yīng)該根據(jù)實(shí)際情況, 即使是個(gè)體, 如果 規(guī)模較大, 也應(yīng)該歸入大規(guī)模分層中, 這樣就可以使得每層的樣本變異程度顯著降低, 從而 提高精確度。根據(jù)實(shí)際情況可以包括兩種:(1)如果全部是規(guī)模比較小的單位個(gè)體戶,我們可以根據(jù)類別進(jìn)行適當(dāng)?shù)姆纸M,將某 一類單位比較多的單獨(dú)分層; 將另外類別比較少的, 可以幾類合并進(jìn)行抽取具體樣本, 分層 不要多于 4 層,并保證每層的樣本量不小于 2 個(gè)。由于居委會樣本量數(shù)目已經(jīng)確定, 我們可 以直接采取比例分配方法,確定各層樣本量。(2)如果規(guī)模比較大的和規(guī)模小的并存,可以將規(guī)模比較大的單獨(dú)分層,不用考慮其 中的類別; 將規(guī)模較小的主要是個(gè)體戶可以根據(jù)類別進(jìn)行分層; 其中的難題是如何將樣本量 在規(guī)模大的和規(guī)模小的之間分配, 因?yàn)榇笠?guī)模層內(nèi)樣本變異程度有可能很大, 應(yīng)該抽取

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論