




下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第
2
章
數(shù)據(jù)的搜集數(shù)據(jù)的來源數(shù)據(jù)實驗數(shù)據(jù)數(shù)據(jù)的誤差學習目標了解數(shù)據(jù)的來源掌握搜集數(shù)據(jù)的
方法掌握搜集數(shù)據(jù)的實驗方法了解數(shù)據(jù)的誤差及控制方法2.1
數(shù)據(jù)的來源數(shù)據(jù)的間接來源數(shù)據(jù)的直接來源數(shù)據(jù)的間接來源系統(tǒng)外部的數(shù)據(jù)的有關資料,如各類1.
統(tǒng)計部門和 部門統(tǒng)計年鑒各類經(jīng)濟信息中心、信息
、機構等提供的數(shù)據(jù)各類專業(yè)期刊、報紙、書籍所提供的資料各種會議,如博覽會、展銷會、交易會及專業(yè)性、學術性研討會上交流的有關資料從互聯(lián)網(wǎng)或 館查閱到的相關資料系統(tǒng)的數(shù)據(jù)業(yè)務資料,如與業(yè)務經(jīng)營活動有關的各種單據(jù)、記錄經(jīng)營活動過程中的各種統(tǒng)計報表各種財務、會計核算和分析資料等二手數(shù)據(jù)的特點成本低搜集容易,作用廣泛分析所要研究的問題提供研究問題的背景幫助研究者更好地定義問題檢驗和回答某些疑問和假設尋找研究問題的思路和途徑搜集二手資料在研究中應優(yōu)先考慮二手數(shù)據(jù)的評估1.
數(shù)據(jù)是誰搜集的?度評估為什么目的而搜集?數(shù)據(jù)是怎樣搜集的?什么時候搜集的?數(shù)據(jù)的直接來源數(shù)據(jù)的直接來源(原始數(shù)據(jù))1.數(shù)據(jù)通過
方法獲得的數(shù)據(jù)通常是對社會現(xiàn)象而言通常取自有限總體實驗數(shù)據(jù)通過實驗方法得到的數(shù)據(jù)通常是對自然現(xiàn)象而言也被廣泛運用到社會科學中如心理學
教育
會學經(jīng)濟學、管理學等2.2數(shù)據(jù)概率抽樣與非概率抽樣搜集數(shù)據(jù)的基本方法概率抽樣和非概率抽樣概率抽樣(probability
sampling)也稱隨機抽樣特點按一定的概率以隨機原則抽取樣本抽取樣本時使每個單位都有一定的機會被抽中每個單位被抽中的概率是已知的,或是可以計算出來的當用樣本對總體目標量進行估計時,要考慮到每個樣本單位被抽中的概率簡單隨機抽樣(simple
random
sampling)從包括總體N個單位的抽樣框中隨機地抽取n個單位作為樣本,每個單位的入樣概率是相等的最基本的抽樣方法,是其它抽樣方法的基礎特點簡單、直觀,在抽樣框完整時,可直接從中抽取樣本用樣本統(tǒng)計量對目標量進行估計比較方便局限性當N很大時,不易構造抽樣框抽出的單位很分散,給實施
增加了沒有利用其他輔助信息以提高估計的效率簡單隨機抽樣(用Excel生成隨機數(shù))生成位于兩個指定數(shù)之間的一個隨機數(shù)(RANDBETWEEN函數(shù))第1步:在Excel表格界面中,直接點擊【f(x)】命令第2步:在復選框“函數(shù)分類”中點擊【全部】選項,并在“函數(shù)名”中點擊【RANDBETWEEN】選項,然后【確定】第3步:在【Bottom】輸入要返回的最小整數(shù)(例如為1)在【Top】輸入要返回的最大整數(shù)(例如為100)單擊【確定】即可得到一個隨機數(shù)(要得到多個隨機數(shù)向下
即可)簡單隨機抽樣(用Excel對分類數(shù)據(jù)隨機抽樣)【例】某班級共有30
名學生,他們的如右表。用Excel抽出一個由5個學生構成的隨機樣本簡單隨機抽樣(用Excel產(chǎn)生一個簡單隨機樣本)第1步:將30個學生的
錄入到Excel工作表中的一列第2步:給每個學生一個數(shù)字代碼,分別為1,2…,30,并按順序排列,將代碼錄入到Excel工作表中的一列,與學生 相對應(數(shù)值型數(shù)據(jù)直接抽取)第3步:選擇【工具】下拉菜單,并選擇【數(shù)據(jù)分析】選項,然后在【數(shù)據(jù)分析】選項中選擇【抽樣】第4步:在【抽樣】
框中的【輸入?yún)^(qū)域】中輸入學生代碼區(qū)域,在【抽樣方法】中單擊【隨機】
。在【樣本數(shù)】中輸入需要抽樣的學生個數(shù)。在【輸出區(qū)域】中選擇抽樣結果放置的區(qū)域。【確定】后即得到要抽取的樣本分層抽樣(stratified
sampling)將抽樣單位按某種特征或某種規(guī)則劃分為不同的層,然后從不同的層中獨立、隨機地抽取樣本優(yōu)點保證樣本中包含有各種特征的抽樣單位,樣本結構與總體結構比較相近,從而提高估計的精度組織實施方便既可以對總體參數(shù)進行估計,也可以對各層的目標量進行估計整群抽樣(cluster
sampling)將總體中若干個單位合并為組(群),抽樣時直接抽取群,然后對中選群中的所有單位全部實施特點抽樣時只需群的抽樣框,可簡化工作量省 費用 方便的地點相對集的實施缺點是估計的精度較差系統(tǒng)抽樣(systematic
sampling)將總體中的所有單位(抽樣單位)按一定順序排列,在規(guī)定的范圍內(nèi)隨機地抽取一個單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其它樣本單位先從數(shù)字1到k之間隨機抽取一個數(shù)字r作為初始單位,以后依次取r+k,r+2k…等單位優(yōu)點:操作簡便,可提高估計的精度缺點:對估計量方差的估計比較多階段抽樣(multi-stage
sampling)先抽取群,但并不是 群內(nèi)的所有單位,而是再進一步抽樣 從選中的群中抽取出若干個單位進行二階段抽樣中群是初級抽樣單位,第二階段抽取的是最終抽樣單位。將該方法推廣,使抽樣的階段數(shù)增多,就稱為多階段抽樣具有整群抽樣的優(yōu)點 保證樣本相對集 約調(diào)查費用不需要包含所有低階段抽樣單位的抽樣框;同時由使 單位在更廣泛的范圍內(nèi)展于實行了再抽樣開4.
在較大規(guī)模的抽樣中,是經(jīng)常被采用的方法非概率抽樣(non-probability
sampling)相對于概率抽樣而言抽取樣本時不是依據(jù)隨機原則,而是根據(jù)研究目的對數(shù)據(jù)的要求,采用某種方式從總體中抽出部分單位對其實施有方便抽樣、判斷抽樣、自愿樣本、滾雪球抽樣、抽樣等方式方便抽樣1.過程中由
員依據(jù)方便的原則,自行確定入抽樣本的單位員在
、公園、商店等公共場所進行攔截廠家在出售產(chǎn)品柜臺前對路過顧客進行的優(yōu)點:容易實施,的成本低缺點:樣本單位的確定帶有隨意性,樣本無法代表有明確定義的總體,結果不宜推斷總體判斷抽樣研究
根據(jù)經(jīng)驗、判斷和對研究對象的了解,有目的地選擇一些單位作為樣本有重點抽樣、典型抽樣、代表抽樣等方式判斷抽樣是
的,樣本選擇的好壞取決于調(diào)研者的判斷、經(jīng)驗、專業(yè)程度和創(chuàng)造性抽樣成本比較低,容易操作樣本是人為確定的,沒有依據(jù)隨機的原則,結果不能用于推斷總體自愿樣本1.
被,向者自愿參加,成為樣本中的一分子提供有關信息例如參與報刊上和互聯(lián)網(wǎng)上刊登的問卷活某類撥打等都屬于自愿樣本自愿樣本與抽樣的隨機性無關樣本是有偏的不能依據(jù)樣本的信息推斷總體滾雪球抽樣1.
先選擇一組
單位,對其實施請他們提供另外一些屬于研究總體的后,再對根據(jù)所提供的線索,進行此后,這個過程持續(xù)下去,就會形成滾雪象,的球效應適合于對稀少群體和特定群體研究優(yōu)點:容易找到那些屬于特定群體的被者, 的成本也比較低抽樣先將總體中的所有單位按一定的標志(變量)分為若干類,然后在每個類中采用方便抽樣或判斷抽樣的方式選取樣本單位操作簡單,可以保證總體中不同類別的單位都能包括在所抽的樣本之中,使得樣本的結構和總體的結構類似抽取具體樣本單位時,不是依據(jù)隨機原則,屬于非概率抽樣抽樣方法簡單隨機抽樣分層抽樣整群抽樣系統(tǒng)抽樣多階段抽樣概率抽樣方便抽樣判斷抽樣自愿樣本滾雪球抽樣抽樣非概率抽樣抽樣方式概率抽樣與非概率抽樣的比較概率抽樣依據(jù)隨機原則抽選樣本樣本統(tǒng)計量的理論分布存在可根據(jù)
的結果推斷總體非概率抽樣不是依據(jù)隨機原則抽選樣本樣本統(tǒng)計量的分布是不確定的無法使用樣本的結果推斷總體搜集數(shù)據(jù)的基本方法搜集數(shù)據(jù)的基本方法自填式面訪式式的數(shù)據(jù)實驗的數(shù)據(jù)搜集數(shù)據(jù)的基本方法自填式問卷員協(xié)助的情況下由被
者自己完成1.
沒有問卷問卷遞送方法有:
員分發(fā)、郵寄、網(wǎng)絡、要求 問卷結構嚴謹,有清楚的說明弱點問卷的返回率比較低不適合結構復雜的問卷周期比較長數(shù)據(jù)搜集過程中出現(xiàn)的問題難于及時采取調(diào)改措施面訪式問卷1.員提問員與被
者面對面,者回答的一種
方式、被2.
優(yōu)點的回答率
數(shù)據(jù)的質(zhì)量可提高可提高能調(diào)節(jié)數(shù)據(jù)搜集所花費的時間3.
弱點的成本較高過程的質(zhì)量控制有一定難度式問卷通過
向被
者實施特點速度快,能在短時間內(nèi)完成適合于樣本單位十分分散的情況局限,
將無法實施如果被 者沒有的時間不能太長使用的問卷需要簡單被訪者不愿意接受時,難以說服觀察式1.
就識,對象的行動和意邊觀察邊記錄以收集所需信息不是強行介入2.3.
能夠在被
者不察覺的情況下獲得資料如交通流量的各方法的比較自填式面訪式式時間慢中等快費用低高低問卷難度要求容易可以復雜要求容易有形輔助物的使用中等利用充分利用無法利用過程控制簡單復雜簡單員作用的發(fā)揮無法發(fā)揮充分發(fā)揮一般發(fā)揮回答率最低較高一般2.3
實驗數(shù)據(jù)實驗組和對照組實驗中的若干問題實驗中的統(tǒng)計實驗法案例實驗組和對照組將研究對象分為兩組:實驗組和對照組實驗組和對照組的產(chǎn)生應遵循隨機原則,而且應該匹配匹配指對實驗單位的背景材料進行分析比較,將情況類似的每對單位分別隨機地分配到實驗組和對照組實驗中的若干問題人的意愿研究的對象是人的時候,在劃分實驗組和對照組時的隨機原則心理問題人們對被研究非常敏感,這使得他們更加注意自我,從而走到事物的另一個道德問題當某種實驗涉及道德問題時,人們會處于進退兩難的尷尬境地實驗中的統(tǒng)計實驗設計本身就是一個統(tǒng)計問題確定進行實驗所需要的單位的個數(shù),以保證實驗可以達到統(tǒng)計顯著的結果將統(tǒng)計的思想融入到實驗設計中,使實驗設計符合統(tǒng)計分析的標準對實驗數(shù)據(jù)進行分析時,統(tǒng)計可以提供最恰當?shù)姆治龇椒?.4
數(shù)據(jù)的誤差抽樣誤差非抽樣誤差誤差的控制抽樣誤差(sampling
error)由于抽樣的隨機性所帶來的誤差所有樣本可能的結果與總體真值之間的平均性差異影響抽樣誤差的大小的因素樣本量的大小總體的變異性非抽樣誤差(non
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 云原生開發(fā)工程師崗位面試問題及答案
- 2025屆云南省尋甸縣第五中學高二化學第二學期期末教學質(zhì)量檢測試題含解析
- 安徽省江淮名校2025年高一下化學期末監(jiān)測模擬試題含解析
- 浙江省金華市磐安縣第二中學2025屆高二化學第二學期期末監(jiān)測模擬試題含解析
- 2025屆內(nèi)蒙古巴彥淖爾市臨河區(qū)三中化學高一下期末綜合測試模擬試題含解析
- 河南禽類交易管理辦法
- 擬像權力批判-洞察及研究
- 醫(yī)療項目預算管理辦法
- 民兵物資倉庫管理辦法
- 華為公司采購管理辦法
- 第四單元整體教學設計-部編版語文八年級下冊
- 貴州省畢節(jié)市威寧縣2024年統(tǒng)編版小升初考試語文試卷(原卷版)
- 平安產(chǎn)險湖北省中央財政水稻種植保險條款
- 日語考試N5試題
- 農(nóng)商銀行考試題庫100題
- 電池的歷史與發(fā)展
- 小學學業(yè)生涯規(guī)劃與目標
- 2023年CQE客訴工程師年度總結及下年規(guī)劃
- 國家開放大學《中國法律史》形成性考核1
- 攪拌類設備單機試車原始記錄
- 老舊小區(qū)物業(yè)投標方案(技術標)
評論
0/150
提交評論