數(shù)據(jù)搜集200002PPT課件_第1頁
數(shù)據(jù)搜集200002PPT課件_第2頁
數(shù)據(jù)搜集200002PPT課件_第3頁
數(shù)據(jù)搜集200002PPT課件_第4頁
數(shù)據(jù)搜集200002PPT課件_第5頁
已閱讀5頁,還剩38頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、學習目標1.了解統(tǒng)計數(shù)據(jù)的來源2.了解數(shù)據(jù)的搜集方法3.掌握調(diào)查方案的設計內(nèi)容與要求4.掌握調(diào)查問卷及其設計技巧5.了解抽樣調(diào)查方法6.了解收集數(shù)據(jù)的實驗方法7.了解數(shù)據(jù)誤差及對數(shù)據(jù)的質(zhì)量要求第1頁/共43頁2.4 抽樣調(diào)查一.概率抽樣與非概率抽樣二.搜集數(shù)據(jù)的基本方法第2頁/共43頁概率抽樣和非概率抽樣第3頁/共43頁抽樣方法簡簡單單隨隨機機抽抽樣樣分分層層抽抽樣樣整整群群抽抽樣樣系系統(tǒng)統(tǒng)抽抽樣樣多多階階段段抽抽樣樣概概率率抽抽樣樣方方便便抽抽樣樣判判斷斷抽抽樣樣自自愿愿樣樣本本滾滾雪雪球球抽抽樣樣配配額額抽抽樣樣非非概概率率抽抽樣樣抽抽樣樣方方式式第4頁/共43頁概率抽樣(probabil

2、ity sampling)1. 也稱隨機抽樣2. 特點按一定的概率以隨機原則抽取樣本抽取樣本時使每個單位都有一定的機會被抽中每個單位被抽中的概率是已知的,或是可以計算出來的 當用樣本對總體目標量進行估計時,要考慮到每個樣本單位被抽中的概率第5頁/共43頁簡單隨機抽樣(simple random sampling)1. 從總體N個單位中隨機地抽取n個單位作為樣本,每個單位入抽樣本的概率是相等的2. 最基本的抽樣方法,是其它抽樣方法的基礎3. 特點簡單、直觀,在抽樣框完整時,可直接從中抽取樣本用樣本統(tǒng)計量對目標量進行估計比較方便4. 局限性當N很大時,不易構造抽樣框抽出的單位很分散,給實施調(diào)查增加

3、了困難沒有利用其它輔助信息以提高估計的效率第6頁/共43頁分層抽樣(stratified sampling)1.將抽樣單位按某種特征或某種規(guī)則劃分為不同的層,然后從不同的層中獨立、隨機地抽取樣本2.優(yōu)點保證樣本的結構與總體的結構比較相近,從而提高估計的精度組織實施調(diào)查方便既可以對總體參數(shù)進行估計,也可以對各層的目標量進行估計第7頁/共43頁分層抽樣 Stratified Sample 先按某種特征將總體分為互斥( (Mutually Exclusive)且完備(Collectively (Collectively Exhaustive)的組群 然后按照總體特征的比例對每一組群進行簡單隨機抽樣,

4、從而使樣本具有同總體相似的特征結構 可提高抽樣調(diào)查有效性第8頁/共43頁分層抽樣 Stratified Sample 例如:對學生調(diào)查 1. 把學生總體分為組群互斥且完備根據(jù)某種共同特點 2. 在每一組中作簡單隨機抽樣。樣本中走讀生與住宿生的比例與學校學生總體相同所有學生走讀生住宿生樣本第9頁/共43頁整群抽樣(cluster sampling)1.將總體中若干個單位合并為組(群),抽樣時直接抽取群,然后對中選群中的所有單位全部實施調(diào)查2.特點抽樣時只需群的抽樣框,可簡化工作量調(diào)查的地點相對集中,節(jié)省調(diào)查費用,方便調(diào)查的實施缺點是估計的精度較差第10頁/共43頁整群抽樣 Cluster Sam

5、ple 先對總體聚類 然后用簡單隨機抽樣選類 最后對選中的類作普查或簡單隨機抽樣調(diào)查 抽樣較為有效第11頁/共43頁整群抽樣 Cluster Sample 例如:對制造業(yè)集團公司經(jīng)理的調(diào)查 1. 聚類:工廠是類而經(jīng)理是元素 2. 隨機選廠 3. 對選定的廠中的經(jīng)理作普查或簡單隨機抽樣工廠 (聚類)樣本第12頁/共43頁分層抽樣和整群抽樣的相同之處 都是先對總體中的群體再對個體進行操作 都不是完全隨機地抽取樣本,都涉及一定的規(guī)則:分層隨機抽樣涉及的規(guī)則是分層群體之間屬性的差異,而整群隨機抽樣涉及的規(guī)則是子群體之間的相似 都能提高隨機抽樣的效率和改善隨機抽樣的結果第13頁/共43頁分層抽樣和整群抽

6、樣的不同之處 操作的群體不同,分層抽樣操作的是分層群體,而整群抽樣操作的是子群體; 適用的總體不同,分層抽樣適用于容易按屬性差異進行群體劃分的總體,而整群抽樣適用于不容易按屬性差異但容易按可見標志進行群體劃分的總體。 第14頁/共43頁系統(tǒng)抽樣(systematic sampling)1.將總體中的所有單位(抽樣單位)按一定順序排列,在規(guī)定的范圍內(nèi)隨機地抽取一個單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其它樣本單位先從數(shù)字1到k之間隨機抽取一個數(shù)字r作為初始單位,以后依次取r+k,r+2k等單位2.優(yōu)點:操作簡便,可提高估計的精度3.缺點:對估計量方差的估計比較困難第15頁/共43頁系統(tǒng)(等

7、距)抽樣 Systematic Sample 例如k=20, k=20, 假定隨機選取的起點為2 2,先將總體排序。 然后從總體中選取樣點的序號為第2 2,第2222,第4242,依此類推可得到抽樣樣本。第16頁/共43頁等距抽樣的優(yōu)點 等距離抽樣與簡單隨機抽樣比較,可使中選單位比較均勻的分布在全及總體中,尤其當被研究現(xiàn)象的標志值的變異程度較大,而在實際工作中又不可能抽選更多的樣本單位時,這種方法更為有效。第17頁/共43頁等距抽樣的局限性 運用等距抽樣的前提是要有全及總體每個單位的有關資料,特別是按有關標志排隊時,往往要有較為詳細具體的資料,這是一項非常復雜和細致的工作。 當抽選間隔和被調(diào)查

8、對象本身的節(jié)奏性相重合時,就會影響調(diào)查的精度。第18頁/共43頁多階段抽樣(multi-stage sampling)1.先抽取群,但并不是調(diào)查群內(nèi)的所有單位,而是再進行一步抽樣,從選中的群中抽取出若干個單位進行調(diào)查群是初級抽樣單位,第二階段抽取的是最終抽樣單位。將該方法推廣,使抽樣的段數(shù)增多,就稱為多階段抽樣2.具有整群抽樣的優(yōu)點,保證樣本相對集中,節(jié)約調(diào)查費用3.需要包含所有低階段抽樣單位的抽樣框;同時由于實行了再抽樣,使調(diào)查單位在更廣泛的范圍內(nèi)展開4.在大規(guī)模的抽樣調(diào)查中,經(jīng)常被采用的方法 電視觀眾抽樣方案第19頁/共43頁非概率抽樣(non-probability sampling)1

9、. 相對于概率抽樣而言2. 抽取樣本時不是依據(jù)隨機原則,而是根據(jù)研究目的對數(shù)據(jù)的要求,采用某種方式從總體中抽出部分單位對其實施調(diào)查3. 有方便抽樣、判斷抽樣、自愿樣本、滾雪球抽樣、配額抽樣等方式 第20頁/共43頁方便抽樣1. 調(diào)查過程中由調(diào)查員依據(jù)方便的原則,自行確定入抽樣本的單位調(diào)查員在街頭、公園、商店等公共場所進行攔截調(diào)查廠家在出售產(chǎn)品柜臺前對路過顧客進行的調(diào)查2. 優(yōu)點:容易實施,調(diào)查的成本低3.缺點:樣本單位的確定帶有隨意性,樣本無法代表有明確定義的總體,調(diào)查結果不宜推斷總體第21頁/共43頁判斷抽樣1. 研究人員根據(jù)經(jīng)驗、判斷和對研究對象的了解,有目的選擇一些單位作為樣本有重點抽樣

10、,典型抽樣,代表抽樣等方式2. 判斷抽樣是主觀的,樣本選擇的好壞取決于調(diào)研者的判斷、經(jīng)驗、專業(yè)程度和創(chuàng)造性3. 抽樣成本比較低,容易操作4. 樣本是人為確定的,沒有依據(jù)隨機的原則,調(diào)查結果不能用于對推斷總體第22頁/共43頁自愿樣本1.被調(diào)查者自愿參加,成為樣本中的一分子,向調(diào)查人員提供有關信息例如,參與報刊上和互聯(lián)網(wǎng)上刊登的調(diào)查問卷活動,向某類節(jié)目撥打熱線電話等,都屬于自愿樣本2.自愿樣本與抽樣的隨機性無關樣本是有偏的不能依據(jù)樣本的信息推斷總體第23頁/共43頁滾雪球抽樣1. 先選擇一組調(diào)查單位,對其實施調(diào)查之后,再請他們提供另外一些屬于研究總體的調(diào)查對象,調(diào)查人員根據(jù)所提供的線索,進行此后

11、的調(diào)查。這個過程持續(xù)下去,就會形成滾雪球效應2. 適合于對稀少群體和特定群體研究3. 優(yōu)點:容易找到那些屬于特定群體的被調(diào)查者,調(diào)查的成本也比較低第24頁/共43頁配額抽樣1.先將體中的所有單位按一定的標志(變量)分為若干類,然后在每個類中采用方便抽樣或判斷抽樣的方式選取樣本單位2.操作簡單,可以保證總體中不同類別的單位都能包括在所抽的樣本之中,使得樣本的結構和總體的結構類似3.抽取具體樣本單位時,不是依據(jù)隨機原則,屬于非概率抽樣 第25頁/共43頁概率抽樣與非概率抽樣的比較1. 概率抽樣依據(jù)隨機原則抽選樣本樣本統(tǒng)計量的理論分布存在可根據(jù)調(diào)查的結果推斷總體2. 非概率抽樣不是依據(jù)隨機原則抽選樣

12、本樣本統(tǒng)計量的分布是不確定的無法使用樣本的結果推斷總體第26頁/共43頁2.5 實驗數(shù)據(jù)一.實驗組和對照組二.實驗中的若干問題三.實驗中的統(tǒng)計四.實驗法案例第27頁/共43頁實驗組和對照組1.將研究對象分為兩組:實驗組和對照組2.實驗組和隨機組的產(chǎn)生應遵循隨機原則,而且應該匹配匹配指對實驗單位的背景材料進行分析比較,將情況類似的每對單位分別隨機地分配到實驗組和對照組第28頁/共43頁實驗中的若干問題1.人的意愿研究的對象是人的時候,在劃分實驗組和對照組時的隨機原則將面臨挑戰(zhàn)2.心理問題 人們對被研究非常敏感,這使得他們更加注意自我,從而走到事物的另一個極端 3.道德問題 當某種實驗涉及道德問題

13、時,人們會處于進退兩難的尷尬境地 第29頁/共43頁實驗中的統(tǒng)計1.實驗設計本身就是一個統(tǒng)計問題2.確定進行實驗所需要的單位的個數(shù),以保證實驗可以達到統(tǒng)計顯著的結果3.將統(tǒng)計的思想融入到實驗設計中,使實驗設計符合統(tǒng)計分析的標準4.對實驗數(shù)據(jù)進行分析時,統(tǒng)計可以提供最恰當?shù)姆治龇椒?第30頁/共43頁2.6 數(shù)據(jù)的誤差一.抽樣誤差二.非抽樣誤差三.誤差的控制第31頁/共43頁數(shù)據(jù)的誤差抽抽樣樣誤誤差差抽樣框誤差回答誤差無回答誤差調(diào)查員誤差非非抽抽樣樣誤誤差差數(shù)數(shù)據(jù)據(jù)的的誤誤差差第32頁/共43頁抽樣誤差(sampling error)1.由于抽樣的隨機性所帶來的誤差 2.所有樣本可能的結果與總體

14、真值之間的平均性差異 3.影響抽樣誤差的大小的因素樣本量的大小總體的變異性第33頁/共43頁非抽樣誤差(non-sampling error)1.相對抽樣誤差而言2.除抽樣誤差之外的,由于其他原因造成的樣本觀察結果與總體真值之間的差異3.存在于所有的調(diào)查之中概率抽樣,非概率抽樣,全面性調(diào)查4.有抽樣框誤差、回答誤差、無回答誤差、調(diào)查員誤差、測量誤差第34頁/共43頁數(shù)據(jù)誤差示意總體(全體學生)樣本框架(電話簿中學生名單)抽樣樣本(抽樣選定 的學生)實際樣本覆蓋面誤差抽樣誤差不回答和度量誤差第35頁/共43頁數(shù)據(jù)的誤差 抽樣誤差 Sampling ErrorSampling Error 樣本之間

15、差異較大時,因為不能普查而導致的誤差可以通過擴大樣本容量來控制 覆蓋面與選擇誤差 Coverage ErrorCoverage Error 將某些特定組從總體中排除會產(chǎn)生誤差 注意自愿填寫報刊問卷或自愿電話回復所產(chǎn)生的偏差(Write-in, Call-in bias)第36頁/共43頁數(shù)據(jù)的誤差 實例分析:19361936年Literacy Digest Literacy Digest 雜志的民意調(diào)查盡管樣本容量很大(240240萬),但是樣本選擇的偏差仍導致預測得票 (Alf Landon 57(Alf Landon 57)與事實(3838)有嚴重的出入。 該雜志的可信度大大降低,最終走向

16、了破產(chǎn)。其教訓主要是:僅以俱樂部成員地址簿、電話號碼簿、雜志訂戶以及汽車注冊人為抽樣調(diào)查的基礎在大蕭條期間造成了嚴重的樣本覆蓋面與選擇誤差。第37頁/共43頁 不回答誤差 Nonresponse ErrorNonresponse Error 與中產(chǎn)階級相比,經(jīng)濟地位處于下層和上層的人群對調(diào)查的反饋率比較低。(郵寄問卷調(diào)查產(chǎn)生的回答率一般都比較低) 19361936年Literacy Digest Literacy Digest 雜志的民意調(diào)查回答率僅為2424。 度量誤差 Measurement ErrorMeasurement Error 問卷中問題的表述不準確,或調(diào)查過程中調(diào)查者和被訪者的原因都會造成誤差。數(shù)據(jù)的誤差第38頁/共43頁統(tǒng)計數(shù)據(jù)的質(zhì)量要求 1. 精度:最低的抽樣誤差或隨機誤差 2. 準確性:最小的非抽樣誤差或偏差 3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論