版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第十一章抽樣技術本章學習內容11.1有關的概念11.2制定抽樣計劃的步驟11.3概率抽樣方法11.4非概率抽樣方法11.5抽樣中的誤差課后習題本章學習目的能夠科學地進行抽樣熟練掌握各種抽樣方法本章學習重點與難點如何定義總體、確定抽樣框科學確定樣本量恰當地選擇抽樣方法進行抽樣11.1有關的概念1、總體(或全域)或同質總體,是指能提供所需信息的人的全體。2、抽樣與普查普查這一概念用于描述獲取同質總體中每個成員的信息。抽樣指一個相對較小、但精心選擇的樣本能準確地反映出所抽簽的總體的特征。一個樣本是總體所有成員的一個子集。從總體中子集獲得的有關信息,可以用來估測總體的特征。理想的狀況是,子集能夠代表總體的各個部分。案例:抽樣的效果根據日本在公元1970年舉辦之國勢調查,在正式調查報告未提出前,先以抽樣1%及10%為樣本,做為快報預先發(fā)表。事后將三項統(tǒng)計數字資料比較于下:人口總數男女全部統(tǒng)計83,199,63740,811,76042,387,87710%抽樣83,200,00040,791,00042,409,0001%抽樣83,110,00040,740,00042,370,00011.2制定抽樣計劃的步驟1.定義同質總體詳細說明可提供信息或與所需信息有關的個體或實體所具有的特性??蓮囊韵聨追矫孢M行描述:地域特征、人口統(tǒng)計學的特征、產品或服務使用情況、認知程度等。2、選擇資料收集方法3、選擇抽樣框抽樣框是指總體的數據目錄或單位的名單,從中可以抽出樣本單位。理想的完整和準確的名單通常是不存在的,因而需要依據能夠產生具有希望特征的樣本個體的程序來反映抽樣框。11.2制定抽樣計劃的步驟4、選擇抽樣方法取決于研究目的、經濟實力、時間限制、欲調查問題的性質。1)概率抽樣概率抽樣指在總體中的每個單位都有可能被抽中。概率抽樣的優(yōu)點:信息全面、能估算出抽樣誤差、調查結果可以用來推斷總體。概率抽樣的弊?。嘿M用高、策劃和實施時間長。2)非概率抽樣非概率抽樣指從總體中非隨機地選擇特定的要素(單位)。非概率抽樣的弊?。翰荒芄烙嫵龀闃诱`差、難以確定樣本代表性的程度、難以推及總體。非概率抽樣的固有優(yōu)勢:費用低、實施時間少、若合理運用也能產生極具代表性的合理的抽樣結果。11.2制定抽樣計劃的步驟5、確定樣本量考慮可得預算的重要性、各種各樣的抽選規(guī)則、子集量的分析和傳統(tǒng)的統(tǒng)計樣本量的計算。對非概率抽樣,通常依靠可得預算、抽選規(guī)則(憑經驗確定)、子集量分析來決定樣本量。對概率抽樣,需要在允許誤差的目標水平和置信水平下,計算樣本量。確定樣本量通??紤]這樣一些因素:A個體差異大?。捍髣t多些B調查項目多少:多則多些C控制質量情況:差則多些D抽樣組織方式:不嚴密則多些11.2制定抽樣計劃的步驟
6、制定選擇樣本單位的操作程序示例:抽樣的操作程序可以如下:以下指南是有關你在某個街區(qū)訪問時應走的路徑。在城市中,這可能是一個城市街區(qū);在農村,街區(qū)可能是一塊被道路包圍的土地。1、如果在你的路線當中遇到死胡同,繼續(xù)沿這條路或街道的另一面向反方向走。在可能的地方又拐,每隔兩戶住家訪問一戶。2、如果你沿街區(qū)走了一圈,又回到了出發(fā)點而沒有完成列出的電話簿上家庭的四個訪問,那么可以試著訪問起點的那一家。3、如果你調查了整個街區(qū),還是沒有完成所要求的訪問,則繼續(xù)從街區(qū)(或鄉(xiāng)間小路)對面附近的第一個住戶開始。只要這個地址在你的紙上的一個“*”旁出現(xiàn)就把它當作你所在區(qū)域的接到中的另一個地址,并訪問這一家。如果不是,就訪問左邊的一家。永遠遵守右手法則……7、描樣計劃的實施實施之前,應先對抽樣進行討論研究,檢查、確定是否要根據擬好的詳細程序來實施計劃。11.3概率抽樣方法-簡單隨機抽樣總體中每個單位在抽選時有相等的被抽中機會抽樣概率公式為:抽樣概率=樣本單位數/總體單位數例如,如果總體單位數為10000,樣本單位數為400,那么抽樣概率為4%,計算過程為:0.04=400/10000為了滿足隨機性,抽樣程序主要通過三種方式實現(xiàn):1.抽簽法——制作選簽工作繁重,實踐中較少采用2.隨機數字表法3.計算機抽取——大量的模擬實驗發(fā)現(xiàn),計算機產生的隨機數是偽隨機數,其隨機性并不理想。隨機數字表的應用:如果一個抽樣框是可以得到的,簡單隨機抽樣方式步驟如下:(1)對總體的每個單位進行編號,總體單位數為10000的總體可編號為1~10000。(2)在隨機數表中從任意的一個編號數開始向上數或向下數或跳躍數選編號,在00001和10000之間選出400個(樣本單位數)。(3)在有明確總體單位的數字表中選出的數字將包括在樣本中注意:使用隨機數字表時,為了克服可能的個人習慣,增加隨機性,起點也應隨機產生。如隨意翻開一頁,閉上眼睛,將火柴隨意扔到頁面上,將火柴所指的數字作為頁號,同樣的方法產生起始行號和列號。例一:N=678,要抽取n=5的樣本方法:隨機確定一個起點和順序,每次取出三個數字,選出頭5個001~678之間的互不相同的數字,作為樣本。例二:N=327,要抽取n=50的樣本方法1:如果采用例一的方法效率較低(328~999及000都用不上),所以可以采用變通的方法,如果抽取的隨機數在401~800之間,則減去400,減去400后的數字如果在001~327之間就選為樣本。方法2:如果得到的隨機數大于327,則用這個數字除以327,以余數入樣。簡單隨機抽樣的優(yōu)缺點:優(yōu)點:簡單,并且滿足概率抽樣的一切必要的要求。缺點:編制完整的抽樣框極其困難;訪談費用過高;可能會抽中一個很差的樣本;沒有利用輔助信息,效率低下。11.3概率抽樣方法-等距抽樣調查人員必須決定一個間隔,并在此間隔基礎上從總體單位表中選擇樣本公式:樣本距離=總體單位數/樣本單位數抽樣的步驟:1.確定間隔2.確定起點3.抽樣
例一:N=54,n=6,用等距抽樣抽選樣本方法:確定樣本距離(k=9),在1~9之間隨機確定起點,最后確定樣本。例二:N=53,n=6,用等距抽樣抽選樣本確定樣本距離(k≈9),在1~9之間確定起點,如果起點在1~8則樣本數為6個,如起點為8,則樣本為8、17、26、35、44、53;如果起點為9點,則樣本為9、18、27、36、45,只有5個。解決辦法:圓形抽樣法等距抽樣的優(yōu)缺點:相對于簡單隨機抽樣方式其最主要的優(yōu)勢就是經濟性:更為簡單,花的時間更少,花費也少;樣本分布比簡單隨機抽樣好;最大的缺陷在于總體單位的排列上。一些總體單位數可能包含隱蔽的形態(tài),調查者可能疏忽,把它們抽選為樣本。11.3概率抽樣方法—分層抽樣程序:把總體各單位分成兩個或兩個以上的相互獨立的完全的組(如男性和女性),而后從兩個或兩個以上的組中簡單隨機抽樣,樣本相互獨立。分層抽樣有三個步驟:首先,利用抽樣框中的輔助信息進行分層。分組的標志一般與所關心的總體特征有關,例如調查吸煙狀況,很明顯男女的吸煙狀況可能存在不同,因此可以用性別來進行分組。第二,確定在每個層次上總體的比例。等比例和不等比例的分配。等比例分配操作簡單,容易理解;不等比例的分配可以提高效率,例如有的層規(guī)模太小等比例分配只能獲得很少量的樣本,有的層方差很大,多分配樣本可以提高精度。最后,調查者必須從每層中抽取獨立隨機樣本。分層抽樣的最大的優(yōu)點在于由于減少了誤差的來源提高了調查的精度。例一:假設某產品的消費群體中有40%是男性,60%是女性,分層抽樣可以將總體按性別分為兩個層次,男性層抽取40%的樣本,女性層抽60%的樣本??梢韵胂蠛唵坞S機抽樣很難準確抽出這一比例。例二:某宿舍有6人,新生3人,老生3人?,F(xiàn)欲抽取2個樣本,估計該宿舍平均擁有數的數目。用簡單隨機抽樣得到的均值范圍是3~23。如果分層抽樣,則均值范圍是11~15。真實值是13本。編號老生擁有書編號新生擁有書A20D2B22E4C24F6合計66合計1211.3概率抽樣方法-整群抽樣樣本是一組單位一組單位地抽取。步驟:同質總體被分為相互獨立的完全的較小子集,而后隨機抽選子集構成樣本。采用整群抽樣的原因主要在于:實施方便,節(jié)省時間和費用;缺乏總體單位的抽樣框可以進行整群抽樣,例如沒有全市中學生的名錄但是擁有學校的名錄,就可以整群抽取。整群抽樣的主要弱點在于,群內各單位之間存在相似性,差異比較小,而群與群之間的差別比較大,使得整群抽樣的抽樣誤差比較大。本書中的整群抽樣實際上包含多階抽樣。地理區(qū)域抽樣是整群抽樣的典型方式。示例:在一個州內的調查可以如下抽樣:(1)選取這個州內的縣以表明不同區(qū)域都有代表性,縣也許是通過與縣中家庭數成正比的方式抽出,家庭數目較多的縣比家庭數目較少的縣抽中的機會要大一點。(2)在樣本縣中抽住宅區(qū)域。(3)在中選住宅區(qū)域中抽家庭。11.4非概率抽樣指任何不滿足概率抽樣要求的抽樣。1、便利抽樣依據便利原則抽取樣本,典型的方式是“攔截式調查”2、判斷抽樣基于個人主觀判斷選擇具有代表性的總體單位進行調查的非概率抽樣方法。3、配額抽樣配額抽樣是根據一定標志對總體分層或分類后,從各層或各類中主觀地選取一定比例的調查單位的方法。4、滾雪球抽樣滾雪球抽樣是指,通過使用初始被調查者的推薦來挑選另外的被調查者的抽樣程序。5、自愿樣本自愿樣本不是經過抽取,而是由自愿接受調查的單位所組成的樣本。特點是:組織方便,成本低廉,雖然樣本結構與總體結構相距甚遠,但是由于參與者大多是對調查內容關心的人,對于了解情況、分析問題、查找原因都是十分重要的信息。例如:飯店的餐桌中央優(yōu)勢會有調查表;報刊上的問卷等等。6、因特網抽樣因特網抽樣的發(fā)展與因特網的代表性密切相關,從目前來看,因特網依然存在代表性問題,網絡用戶的特征依然是年輕、受過教育的男性為主。此外由于不存在可以作為抽樣框的包括所有e-mail的中心數據庫,因特網抽樣還是一種非概率抽樣。從每人19個性伴侶看網絡調查可信度.mht網絡調查的評價:網絡調查.doc網絡調查的形式:/s/m/2006-05-11/10061078141.html網站的訪問者因特網調查是對那些有意或碰巧訪問某個組織的網站的自愿的應答者進行的。這些不受限制的樣本顯然是:便利樣本——他們可能不具有代表性——偶然或選擇偏差;對網站訪問者進行抽樣的一個更好的方法是隨機選擇抽樣單位——“彈出式調查”軟件——隨機選擇網站訪問者。隨機的問題:可能讓某個網址的經常訪問者有過多的代表性,而這樣就代表了網站的訪問量,而不是訪問者。討論小組樣本一個已經建立的消費者討論小組或其它事先招募的成員討論小組,是一種創(chuàng)立因特網用戶樣本的流行的、科學的和有效的方法。通常,從一個討論小組中進行抽樣,會產生很高的回應率,因為,討論小組的成員已經同意與調研機構的電子郵件或因特網調查進行合作。發(fā)現(xiàn):有兩個人口統(tǒng)計小組不能通過因特網抽樣完全涉及:65歲及以上的人(一個正在迅速增長的群體);那些年收入在15000美元以下的人。相比之下,18-25歲——一個傳統(tǒng)調研方法歷史上很難覆蓋到的群體,現(xiàn)在在因特網上卻極其容易被覆蓋。招募的特別樣本在特別的基礎上,可以創(chuàng)立一個電子郵件地址的抽樣框架。調研者可以通過“蝸牛式的傳統(tǒng)信件”或者電話來聯(lián)系應答者,尋求他們的電子郵件地址,并且獲得準許進行因特網調查。使用離線技術,如隨機數字撥號以及簡短的電話篩選訪問來招募應答者,可能獲得具有代表性的因特網調查樣本。客戶關系庫里包含電子郵件地址(通過要求顧客在產品登記卡上、在電話互動中,在網上登記等),可以為樣本招募提供有用的數據庫。決定參與的名單在將某個人的電子郵件地址加入公司數據庫之前,應確認并且再次確認每個人對交流某個主題的興趣。不要向應答者發(fā)送未經授權的電子郵件,這是很重要的。如果個人沒有決定接收某個特定組織的電子郵件,他們可能認為這種主動提供的調查請求是一種垃圾郵件。調研人員不能從這些沒有同意調查的人里面期待很高的回應率。有經驗的因特網用戶是不能容忍垃圾郵件的,他們可能帶來不好的結果,產生大量的問題。11.5抽樣中的誤差一、誤差的描述1.估計量方差2.偏差3.均方誤差二、抽樣誤差抽樣誤差是由于抽樣的隨機性造成的誤差。可以用估計量的方差和標準差來度量。影響抽樣誤差的因素有:總體方差、樣本量、抽樣方式、估計方式。三、非抽樣誤差除抽樣因素以外,由其他原因引起的樣本統(tǒng)計量與真值之間的差異。引起非抽樣誤差的原因主要有:抽樣框誤差、調研對象范圍誤差、訪談員誤差、拒訪誤差、回答偏差等。失敗案例:看起來并不隨機的隨機次序籃球運動員——高潮、低潮;心理學家訪問費城76人隊的隊員,運動員估計,他們在剛投中一個球之后再接著投中,要比失球之后再投中的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024帶家電房屋租賃合同
- 2024年塑料制品加工合同
- 2024-2025學年新教材高中化學第二章海水中的重要元素-鈉和氯第二節(jié)第2課時氯氣的實驗室制法氯離子的檢驗練習含解析新人教版必修第一冊
- 2024-2025學年初中物理電學同步專題點撥與強化專題17實驗伏安法測電阻含解析
- 2024-2025學年高中歷史第四單元亞洲覺醒的先驅單元評價含解析新人教版選修4
- 2024年二手機床設備購買協(xié)議模板
- 2024年城市更新項目水電暖設施改造合同
- 課題1 水資源及其利用(第2課時)(導學案)-九年級化學上冊同步高效課堂(人教版2024)(解析版)
- 2024年吉陽區(qū)環(huán)衛(wèi)所績效考核
- 2024年企業(yè)間廣告投放與媒體代理合同
- 第16講 國家出路的探索與挽救民族危亡的斗爭 課件高三統(tǒng)編版(2019)必修中外歷史綱要上一輪復習
- 機器學習 課件 第10、11章 人工神經網絡、強化學習
- 北京市人民大學附屬中學2025屆高二生物第一學期期末學業(yè)水平測試試題含解析
- 2024年時事政治考點大全(173條)
- 書籍小兵張嘎課件
- 生鮮豬肉銷售合同模板
- 2024年經濟師考試-中級經濟師考試近5年真題集錦(頻考類試題)帶答案
- 第一單元中國特色社會主義的開創(chuàng)、堅持、捍衛(wèi)和發(fā)展單元測試-2023-2024學年中職高教版(2023)中國特色社會主義
- 汽車修理工崗前培訓
- 蘇州市2023-2024學年高一上學期期中考試化學試題 試卷及答案
- 陳玉琴老師在中國中醫(yī)論壇的最新(2009年至今)回貼匯總
評論
0/150
提交評論