抽樣調(diào)查抽樣設(shè)計_第1頁
抽樣調(diào)查抽樣設(shè)計_第2頁
抽樣調(diào)查抽樣設(shè)計_第3頁
抽樣調(diào)查抽樣設(shè)計_第4頁
抽樣調(diào)查抽樣設(shè)計_第5頁
已閱讀5頁,還剩33頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、抽樣調(diào)查動機 從(少量的)樣本推估母體的特徵。 選取可以深入觀察母體的樣本,以儘可能不干擾母體的情況下取得資訊。觀察性研究。實驗性研究。觀察對實驗 觀察性研究 (Observational study)。對每一個體僅做觀察並量測有興趣的變數(shù),並不試圖影響反應值。抽樣調(diào)查(sample survey)。 實驗性研究(Experimental study)。對每一個體給予特定的處理(treatment),再觀察並量測有興趣的變數(shù)的反應值。隨機比較性實驗。抽樣調(diào)查的用途民意調(diào)查選舉民意、公共議題民意、施政滿意度調(diào)查市場調(diào)查產(chǎn)品行銷、潛在顧客研究調(diào)查農(nóng)業(yè)災害調(diào)查、網(wǎng)路行為調(diào)查母體的界定調(diào)查中欲推論的所

2、有範圍或是想收集的資料所有可能的對象或單位,所構(gòu)成的集合稱為母體(Population) 。定義調(diào)查對象與範圍 從母體中選出的部分個體,我們據(jù)以獲取資料,稱為樣本(Sample)。 選擇樣本的方法稱為樣本設(shè)計。母體的種類推論母體:理論上的母體。目標母體:依調(diào)查研究的目的訂定有明確的涵蓋範圍。底冊母體:調(diào)查時建立的名冊。調(diào)查母體:底冊母體中可以也願意被調(diào)查的部分。市長選舉調(diào)查推論母體:理論上的母體。臺北市的選民。目標母體:訂定有明確的涵蓋範圍。12月投票時,有投票權(quán)的選民(20歲以上)。底冊母體:調(diào)查時建立的名冊。臺北市各區(qū)公所建立的選民名冊。調(diào)查母體:可以也願意被調(diào)查的部分。願意接受(電話)訪

3、問的選民。戶政調(diào)查推論母體:理論上的母體。 目標母體:訂定有明確的涵蓋範圍。 底冊母體:調(diào)查時建立的名冊。 調(diào)查母體:可以也願意被調(diào)查的部分。 戶政調(diào)查(一)-電訪或郵寄問卷推論母體:理論上的母體。 戶政事務(wù)所轄區(qū)所有居民。目標母體:訂定有明確的涵蓋範圍。 11月初,戶籍在本區(qū)、準備遷入或經(jīng)辦與本所有關(guān)業(yè)務(wù)的人。底冊母體:調(diào)查時建立的名冊。11月初,戶政事務(wù)所建有名冊的人。 調(diào)查母體:可以也願意被調(diào)查的部分。電訪:本區(qū)有電話的居民。郵寄:住在戶籍地的居民。 戶政調(diào)查(二)-戶政所洽公推論母體:理論上的母體。戶政事務(wù)所轄區(qū)所有需要戶政所服務(wù)的居民。目標母體:訂定有明確的涵蓋範圍。11月初,所有來

4、戶政所洽公的人。底冊母體:調(diào)查時建立的名冊。沒有名冊。 調(diào)查母體:可以也願意被調(diào)查的部分。11月初,所有來戶政所洽公也願意填問卷的人。抽樣與普查所有的樣本都調(diào)查稱為普查。只調(diào)查部分樣本稱為抽樣調(diào)查。調(diào)查資料所計算出來的統(tǒng)計量,都存在著誤差。誤差分為抽樣誤差及非抽樣誤差。抽樣誤差:選取部分樣本造成對母體推估的誤差,可透過提高樣本數(shù)來降低抽樣誤差。非抽樣誤差:抽樣誤差以外的所有誤差,與樣本數(shù)的大小沒有直接的關(guān)係。包括:拒訪或遺漏值、測量不準、資料處理錯誤等所造成的誤差。一般多需在調(diào)查過程中,透過嚴謹?shù)墓芾韥斫档头浅闃诱`差。抽樣或普查?小母體時採用普查。大母體或具破壞性檢驗時採用抽樣。燈泡壽命大母體

5、的普查要注意調(diào)查步驟的管理。國內(nèi)大型定期普查工商及服務(wù)業(yè)普查。民國80、85、90年,每5年做一次普查。農(nóng)林漁牧業(yè)普查。西元1990、2000年,每10年做一次普查,每5年做一次抽樣調(diào)查。戶口及住宅普查。西元1990、2000年,每10年做一次普查,每5年做一次抽樣調(diào)查。樣本與母體任何母體的一部分都可稱為樣本。抽樣的目的就是要以少量的樣本來代表母體。樣本代表性的評估樣本數(shù)與樣本結(jié)構(gòu)。樣本代表性-樣本數(shù)樣本數(shù)越多代表性越高的機會高,但管理也越困難,產(chǎn)生非抽樣誤差的機會也越高。樣本代表性-樣本結(jié)構(gòu)基本結(jié)構(gòu):性別、年齡、居住地等。與調(diào)查相關(guān)的結(jié)構(gòu):選舉時的黨派傾向結(jié)構(gòu)環(huán)保議題之民意調(diào)查時需考量樣本的

6、教育程度、社經(jīng)地位(收入、職業(yè)等)等結(jié)構(gòu)。調(diào)查的步驟步驟一:決定母體步驟二:設(shè)計問卷問卷的問項(明確陳述要估量的變數(shù))步驟三:建立抽樣底冊步驟四:抽樣設(shè)計並決定樣本數(shù)步驟五:建立樣本名冊步驟六:進行調(diào)查步驟七:整理資料步驟八:分析資料樣本的選擇有名冊的母體市長選舉沒有名冊的母體來華旅客故宮滿意度調(diào)查戶政滿意度調(diào)查調(diào)查的方式派員面訪訪員問及填答、受訪者自行填答。郵寄問卷調(diào)查電話訪問調(diào)查傳統(tǒng)電話訪問、電腦輔助電話訪問(CATI)網(wǎng)路問卷調(diào)查網(wǎng)頁問卷調(diào)查、電子郵件(E-mail)問卷調(diào)查抽樣方法簡單隨機抽樣分層隨機抽樣集群抽樣系統(tǒng)抽樣簡單隨機抽樣 抽樣原理:調(diào)查母體中每一個樣本被抽到的機會一樣。 應

7、用時機:1.母體?。?.名冊完整;3.訪問成本不受樣本地點的影響;4.除了名冊沒有其他的資訊。 限制與困難:簡單隨機樣本的選取 步驟1:編號,母體中每一個體給一號。 步驟2:查表,使用隨機亂數(shù)表選號。30個母體中選五個。步驟1 :列冊編號步驟2:查表:隨機亂數(shù)表某行資料為 69051 64817 87174 09517 84534 06489 87201 97245 前10組 2位數(shù)為 69 05 16 48 17 87 17 40 95 17 00, 3199略去,選 05, 16, 17, 17, 17,17重複繼續(xù) 再10組 2位數(shù)為 84 53 40 64 89 87 20 19 72

8、 45 補選 20, 19,最後選出05, 16, 17, 20, 19。 分層隨機抽樣 將母體中每一個體,依有特別興趣,或是有接近性質(zhì)為標準,分為若干個子母體,稱為層(stratum)。在每一層分別隨機抽取部份子樣本,再整合成一個樣本。 使用的原因與時機:抽樣管理方便;不同層內(nèi)調(diào)查設(shè)計可以不一樣;需要對子母體做較精確的估計;比其他抽樣方法可得到較精確的母體估計。分層樣本(Stratified sample) 分層樣本的選取 步驟一:將母體 步驟二:每層各取一個SRS,全部合起來就是分層樣本。歌曲著作權(quán)使用費的分配 美國作曲家組織(ASCAP)每年向廣播電臺收取播曲權(quán)利金$ 435百萬(每年播

9、放53百萬小時歌曲),將分配給作曲家會員。將所有電臺依社區(qū)種類(都會區(qū)、鄉(xiāng)村等) 、地區(qū)(新英格蘭、太平洋等)及付出權(quán)利金額度(反應電臺聽眾數(shù))等特性分成432層。每層隨機選幾臺隨機錄音數(shù)小時,共錄音60,000小時。由專家辨認所有歌曲的作曲作詞者,記錄後依比例分配權(quán)利金。集群抽樣 先將母體分群,視之為抽樣單位,抽樣時只抽出部分群來。群內(nèi)所有樣本都調(diào)查時稱為一階段集群抽樣;群內(nèi)在抽部分樣本來調(diào)查時稱為二階段集群抽樣。 使用時機:母體底冊的限制不得已。 多搭配分層抽樣,以分層後各層再進行二階段集群抽樣。多階段集群抽樣實例 全國性家戶調(diào)查步驟一:將美國分成2007地理區(qū)域,稱為主要樣本單位(Pri

10、mary Sampling Units, PSUs)。選出754 PSUs,包括428人口最多 PSUs其餘隨機選出的。步驟二:選出的每個PSU分為若干小區(qū),各小區(qū)依種族等分層,選出分層樣本(小區(qū))。步驟三:選出的小區(qū)中依各戶相近程度每四戶成一集群(Cluster)。隨機選出集群調(diào)查。系統(tǒng)抽樣 可視為是一階段集群抽樣的特例。以相同間隔的樣本組成群,隨機選取一群。 容易操作,但間隔選取不好時會造成嚴重的系統(tǒng)偏差。 多搭配其他抽樣方法使用,如分層系統(tǒng)抽樣。系統(tǒng)隨機樣本範例 系統(tǒng)隨機樣本(systematic random sample):預計抽出n = 250 的樣本,母體的總數(shù)為 N=5000。

11、令 N/n = k = 20,120中隨機選出一數(shù) a,則a, a+k, a+2k, , a+(n-1)k為一組樣本數(shù)為 n 的系統(tǒng)隨機樣本。每一個個體被選到的機會一樣。但每一組樣本數(shù)為 n 的樣本未必有相同的機會被選到。自願樣本與立意選樣 自願樣本:主動對議題表達意見。如Call-in,網(wǎng)頁問卷調(diào)查等。自願樣本多數(shù)表達較強烈意見,因此多有偏差。 立意選樣:依調(diào)查的方便主觀選取樣本。如街頭訪問,賣場問卷調(diào)查等。因主觀選取的地點與方法而有不同程度的偏差意見。 這些抽樣方法多不足以代表母體。戶政調(diào)查的抽樣設(shè)計 母體的特質(zhì) 抽樣方法戶政調(diào)查的抽樣設(shè)計 母體的特質(zhì)個人自辦、公司代辦;日間、夜間; 抽樣

12、方法分層系統(tǒng)隨機抽樣。信賴區(qū)間母體參數(shù)多以樣本平均值估計之,估計值的信賴區(qū)間可寫成,信賴度為95%時,z = 1.96。信賴度為99%時,z = 2.575。nz樣本變異數(shù)估計值 抽樣誤差與樣本數(shù)信賴區(qū)間的長度的一半稱為抽樣誤差,記為m,也稱為誤差容忍度。即信賴度為95%時, 。信賴度為99%時, 。nz樣本變異數(shù)mn96. 1樣本變異數(shù)mn575. 2樣本變異數(shù)m數(shù)量參數(shù)估計所需的樣本數(shù) 當樣本數(shù)為 時, 參數(shù)估計值之信賴區(qū)間的誤差容忍度接近給定值 m。 樣本變異數(shù)2*)(mznn)(nz2樣本變異數(shù)樣本變異數(shù)zmm比例參數(shù)估計所需的樣本數(shù) 當樣本數(shù)為 時, p 之估計值信賴區(qū)間的誤差容忍度接近給定值 m。其中p*為樣本比率的猜測值。 猜測值 p* = 0.5時,實際誤差容忍度不大於給定值 m。95%信賴水準,抽樣誤差3%,樣本數(shù)為1067。)1 ()(*2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論