第六章抽樣調(diào)查課件_第1頁
第六章抽樣調(diào)查課件_第2頁
第六章抽樣調(diào)查課件_第3頁
第六章抽樣調(diào)查課件_第4頁
第六章抽樣調(diào)查課件_第5頁
已閱讀5頁,還剩47頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第六章抽樣調(diào)查課件第1頁,共52頁,2023年,2月20日,星期一問題:1、某研究人員想要了解杭州在校大學(xué)生每周的自習(xí)時(shí)間,然而對于一個(gè)擁有幾十萬大學(xué)生的城市來說,他的調(diào)查經(jīng)費(fèi)是遠(yuǎn)遠(yuǎn)不夠的,那么這項(xiàng)調(diào)查還能進(jìn)行嗎?如果能進(jìn)行,他該怎么進(jìn)行,并判斷結(jié)論的可靠性呢?2、某企業(yè)想調(diào)查消費(fèi)者對它的產(chǎn)品的認(rèn)知程度,如何進(jìn)行,并判斷結(jié)論的可靠性呢?第2頁,共52頁,2023年,2月20日,星期一抽樣調(diào)查概述基本概念及理論依據(jù)抽樣平均誤差抽樣推斷——均值的推斷抽樣方案的設(shè)計(jì)必要抽樣單位數(shù)的確定第3頁,共52頁,2023年,2月20日,星期一第一節(jié)抽樣調(diào)查概述第4頁,共52頁,2023年,2月20日,星期一

概念廣義:抽取部分單位觀察,并根據(jù)觀察結(jié)果推斷總體。非隨機(jī)抽樣:隨機(jī)抽樣:

通過主觀判斷,選取若干個(gè)有代表性的單位來推斷總體。

保證總體中每個(gè)單位具有同等機(jī)會(huì)被抽中機(jī)會(huì),抽取樣本,并推斷總體。狹義:按照隨機(jī)原則抽取部分單位觀察,并運(yùn)用數(shù)理統(tǒng)計(jì)原理,由部分對總體做出數(shù)量上的推斷分析。一般地,屬于隨機(jī)抽樣。第5頁,共52頁,2023年,2月20日,星期一特點(diǎn)只抽取部分單位;用部分推斷總體;抽樣遵循隨機(jī)原則;會(huì)產(chǎn)生抽樣誤差,但誤差可以計(jì)算和控制。統(tǒng)計(jì)誤差統(tǒng)計(jì)數(shù)字與實(shí)際數(shù)量之間的差別。登記誤差:代表性誤差:調(diào)查誤差或工作誤差,指在登記、匯總計(jì)算過程中產(chǎn)生的誤差。(可以避免的)用部分去推斷總體產(chǎn)生的誤差。(一般不可避免)第6頁,共52頁,2023年,2月20日,星期一第二節(jié)基本概念及理論依據(jù)第7頁,共52頁,2023年,2月20日,星期一第8頁,共52頁,2023年,2月20日,星期一基本概念全及總體:所要認(rèn)識對象的全體。變量總體:數(shù)量標(biāo)志;

屬性總體:品質(zhì)標(biāo)志;具有某種屬性的單位占總體單位總數(shù)的比重,稱為總體成數(shù)P,標(biāo)準(zhǔn)差也用σ表示。

一般以N表示全及總體的單位總數(shù),表示全及總體的平均數(shù),表示全及總體的標(biāo)準(zhǔn)差。第9頁,共52頁,2023年,2月20日,星期一▼全及總體特征的描述描述總體的特征一般采用均值和標(biāo)準(zhǔn)差?!钊翱傮w是確定的,唯一的,因此全及指標(biāo)也是確定的,唯一的。變量總體:屬性總體:N1

具有某種屬性,N0不具有某種屬性第10頁,共52頁,2023年,2月20日,星期一抽樣總體(樣本):從全及總體隨機(jī)抽取得部分單位的集合體。▼樣本容量:一般樣本容量大于30的稱為大樣本,小于30個(gè)單位數(shù)的稱為小樣本。抽樣比:一般地,

一般地,一個(gè)全及總體中,可以抽取多個(gè)抽樣總體,即抽樣總體不是唯一的,全部樣本的可能數(shù)目與每個(gè)樣本的容量以及抽樣方法有關(guān)。第11頁,共52頁,2023年,2月20日,星期一▼抽樣總體(樣本)特征的描述

抽樣總體(樣本)特征也是通過均值和標(biāo)準(zhǔn)差來描述的。不是確定的、唯一的,因此抽樣指標(biāo)也不是確定的、唯一的,是樣本變量的函數(shù),是隨機(jī)變量。變量總體:對于分組資料采用加權(quán)的計(jì)算公式。(見第三章)第12頁,共52頁,2023年,2月20日,星期一屬性總體:n1

具有某種屬性,n0不具有某種屬性▼抽樣的目的就是通過觀察樣本的特征來推斷總體的特征,即用樣本平均數(shù)用來推斷總體平均數(shù),而樣本標(biāo)準(zhǔn)差作為總體標(biāo)準(zhǔn)差估計(jì)值(當(dāng)總體標(biāo)準(zhǔn)差未知)用來計(jì)算總體平均數(shù)的估計(jì)區(qū)間(置信區(qū)間)。第13頁,共52頁,2023年,2月20日,星期一例某全及總體由1、2、3、4、5六個(gè)數(shù)字構(gòu)成。

全及總體:1、2、3、4、5。假設(shè)樣本容量為3,則從全及總體中采用不考慮順序不重復(fù)的簡單隨機(jī)抽樣,可以抽取出10個(gè)抽樣總體,這樣就有10個(gè)樣本平均數(shù).1,2,31,3,41,4,52,3,42,4,51,3,51,2,53,4,51,2,42,3,5第14頁,共52頁,2023年,2月20日,星期一抽樣方法和樣本可能數(shù)目抽樣方法

樣本數(shù)目與樣本容量有關(guān),也與抽樣方法有關(guān),樣本容量既定,則樣本數(shù)目取決于抽樣的方法。抽樣方式不同重復(fù)抽樣不重復(fù)抽樣樣本要求不同考慮順序抽樣不考慮順序抽樣

以上結(jié)合為四種抽樣方法:考慮順序的重復(fù)抽樣、考慮順序的不重復(fù)抽樣、不考慮順序的重復(fù)抽樣和不考慮順序的不重復(fù)抽樣。第15頁,共52頁,2023年,2月20日,星期一不同抽樣方法的樣本可能數(shù)目考慮順序的不重復(fù)抽樣不考慮順序的不重復(fù)抽樣考慮順序的重復(fù)抽樣不考慮順序的重復(fù)抽樣第16頁,共52頁,2023年,2月20日,星期一抽樣調(diào)查的理論依據(jù)大數(shù)定律:證明了抽樣平均數(shù)(成數(shù))趨近于總體平均數(shù)(成數(shù))的趨勢。1)獨(dú)立同分布大數(shù)定律:2)貝努力大數(shù)定律:中心極限定律:證明了多個(gè)隨機(jī)變量和的分布趨近于正態(tài)分布。抽樣平均數(shù)就是一種隨機(jī)變量。1)獨(dú)立同分布中心極限定律:2)德莫佛—拉普拉斯中心極限定律:第17頁,共52頁,2023年,2月20日,星期一第三節(jié)抽樣平均誤差第18頁,共52頁,2023年,2月20日,星期一抽樣誤差的概念和理解抽樣誤差:來源于登記性誤差和代表性誤差

調(diào)查誤差或工作誤差,指在調(diào)查、編輯、編碼、匯總過程中由于觀察、測量、登記、計(jì)算上的差錯(cuò)或被調(diào)查者提供虛假資料而引起的誤差。

這種誤差的直接表現(xiàn)就是沒有真實(shí)客觀地搜集或記錄被調(diào)查單位的標(biāo)志值或標(biāo)志特征,從而使所計(jì)算的統(tǒng)計(jì)量偏離其真實(shí)值。登記性誤差存在于所有的統(tǒng)計(jì)調(diào)查中,而且調(diào)查的范圍越大、調(diào)查單位越多,產(chǎn)生誤差的可能性越大。登記性誤差與測量工具的精度、測量技術(shù)、調(diào)查人員的責(zé)任心、被調(diào)查者的合作態(tài)度等密切相關(guān)。登記性誤差第19頁,共52頁,2023年,2月20日,星期一代表性誤差

由于樣本的分布結(jié)構(gòu)與總體分布不一致所差生的誤差。這部分誤差來源于抽樣過程以及推斷總體過程中(一般不可避免)。代表性誤差又分為兩種:偏差:系統(tǒng)性誤差

由非隨機(jī)因素(違背隨機(jī)原則)造成樣本代表性不足而產(chǎn)生的誤差。表現(xiàn)為樣本統(tǒng)計(jì)量數(shù)值系統(tǒng)性偏高或偏低。這種誤差也屬于工作態(tài)度、水平、技術(shù)等的問題。應(yīng)盡量避免。隨機(jī)誤差:偶然性誤差

遵循了隨機(jī)原則的原則,由偶然因素引起樣本結(jié)構(gòu)不能完全代表總體結(jié)構(gòu)而產(chǎn)生的誤差。偶然誤差不可避免,即使沒有登記誤差和系統(tǒng)性誤差,仍會(huì)存在誤差。雖然不可避免,但可以估計(jì)和控制。偶然誤差總和等于0。全面調(diào)查不存在偶然誤差。第20頁,共52頁,2023年,2月20日,星期一抽樣中的總誤差登記性誤差代表性誤差系統(tǒng)性誤差隨機(jī)誤差:偶然誤差偏差:實(shí)際誤差抽樣平均誤差▼隨機(jī)誤差可以分為實(shí)際誤差和抽樣平均誤差

實(shí)際誤差:樣本指標(biāo)與總體指標(biāo)之間的差別,無法計(jì)算。

抽樣平均誤差:所有樣本平均指標(biāo)的標(biāo)準(zhǔn)差。可以計(jì)算。第21頁,共52頁,2023年,2月20日,星期一▼抽樣平均誤差的影響因素主要受到三個(gè)因素影響:全及總體標(biāo)志變動(dòng)程度σ2??傮w標(biāo)志值變動(dòng)越大,抽樣平均誤差越大,反之則越小。抽樣單位數(shù)(樣本容量)的多少n。其他條件不變,抽取的單位數(shù)越多,抽樣平均誤差越小,反之越大。抽樣組織的方式和抽樣組織形式。第22頁,共52頁,2023年,2月20日,星期一抽樣平均誤差的計(jì)算理論公式

實(shí)際上,全及指標(biāo)是未知的,而且實(shí)踐中只會(huì)抽樣一個(gè)樣本。所以這個(gè)公式實(shí)踐中不采用。第23頁,共52頁,2023年,2月20日,星期一實(shí)際使用公式推導(dǎo)

重復(fù)抽樣下變量全及總體的抽樣平均誤差公式推導(dǎo)第24頁,共52頁,2023年,2月20日,星期一所以:公式說明了,抽樣平均誤差僅為全及總體標(biāo)準(zhǔn)差的。第25頁,共52頁,2023年,2月20日,星期一不重復(fù)抽樣下變量全及總體的抽樣平均誤差公式推導(dǎo)其中第26頁,共52頁,2023年,2月20日,星期一其中:第27頁,共52頁,2023年,2月20日,星期一因此第28頁,共52頁,2023年,2月20日,星期一因此,抽樣平均誤差為

抽樣比大大小于1時(shí),不重復(fù)抽樣的抽樣平均誤差與重復(fù)抽樣的很接近第29頁,共52頁,2023年,2月20日,星期一屬性全及總體的抽樣平均誤差公式推導(dǎo):具有某標(biāo)志(取值1)的單位比重不具有某標(biāo)志(取值0)的單位比重則屬性總體的平均數(shù)第30頁,共52頁,2023年,2月20日,星期一

根據(jù)前面推導(dǎo)的重復(fù)抽樣和不重復(fù)抽樣的公式,可得到屬性總體的抽樣平均誤差:重復(fù)抽樣:不重復(fù)抽樣:第31頁,共52頁,2023年,2月20日,星期一

實(shí)際運(yùn)用中,總體標(biāo)準(zhǔn)差是未知的,采用以下方法估計(jì):1、用過去取得總體資料的標(biāo)準(zhǔn)差;2、用樣本方差代替總體方差;3、用小規(guī)模的調(diào)查資料;4、用預(yù)估的資料。

進(jìn)行推斷時(shí),如果總體方差未知,一般采用樣本標(biāo)準(zhǔn)差作為總體標(biāo)準(zhǔn)差的估計(jì)。第32頁,共52頁,2023年,2月20日,星期一▼抽樣平均誤差計(jì)算總結(jié)變量總體重復(fù)抽樣不重復(fù)抽樣屬性總體重復(fù)抽樣不重復(fù)抽樣

不重復(fù)抽樣的抽樣平均誤差小于重復(fù)抽樣的,當(dāng)抽樣比遠(yuǎn)小于1時(shí),兩者非常接近。第33頁,共52頁,2023年,2月20日,星期一

通過樣本推斷總體指標(biāo)時(shí),總體標(biāo)準(zhǔn)差往往是未知的,此時(shí)如果存在過去資料,則采用過去資料的最大標(biāo)準(zhǔn)差作為總體標(biāo)準(zhǔn)差的估計(jì)值;如果沒有過去資料,則采用樣本標(biāo)準(zhǔn)差作為總體標(biāo)準(zhǔn)差的估計(jì)值。不重復(fù)抽樣情況下,當(dāng)總體單位總數(shù)未知時(shí),則認(rèn)為抽樣比大大小于1,而采用重復(fù)抽樣的抽樣平均誤差的計(jì)算公式。第34頁,共52頁,2023年,2月20日,星期一例某公司進(jìn)口一批電子器件5000件,為了檢測其壽命,抽取了500件進(jìn)行檢驗(yàn),結(jié)果如下:分別計(jì)算重復(fù)抽樣和不重復(fù)抽樣方式下電子器件的抽樣平均誤差。壽命(千小時(shí))器件數(shù)(只)8以下208-9709-1034010-114011以上30合計(jì)500組中值—1505953230420345474011255057.53068544103967.54524578.4167.230.13641.62122.41309.87.58.59.510.511.5第35頁,共52頁,2023年,2月20日,星期一重復(fù)抽樣下:不重復(fù)抽樣下:第36頁,共52頁,2023年,2月20日,星期一例上題中,如果壽命低于9000小時(shí)的產(chǎn)品是不合格品,計(jì)算不合格率(合格率)的抽樣平均誤差。不合格率:重復(fù)抽樣下:不重復(fù)抽樣下:第37頁,共52頁,2023年,2月20日,星期一課堂練習(xí)某超市第三次購進(jìn)福臨門5升裝食用油,抽取30瓶進(jìn)行檢驗(yàn)。經(jīng)檢驗(yàn),這30瓶食用油的平均容量為4.99升,以往兩批食用油容量的標(biāo)準(zhǔn)差為0.12升和0.10升。1、計(jì)算這次檢驗(yàn)的抽樣平均誤差。2、按規(guī)定容量≥4.9升為合格,這30瓶食用油有2瓶不合格,計(jì)算這批食用油合格率的抽樣平均誤差。第38頁,共52頁,2023年,2月20日,星期一第39頁,共52頁,2023年,2月20日,星期一第四節(jié)抽樣推斷——均值的推斷第40頁,共52頁,2023年,2月20日,星期一概述

抽樣調(diào)查的目的是為了用樣本指標(biāo)推斷總體指標(biāo)。由于樣本分布不可能與總體完全一致,因此存在抽樣誤差(指抽樣平均誤差)。對總體指標(biāo)的估計(jì)有兩種,一種是點(diǎn)估計(jì),一種是區(qū)間估計(jì)。點(diǎn)估計(jì)不能說明誤差大小,意義不大,而采用區(qū)間估計(jì),可以將誤差控制在一定的范圍內(nèi)(即說明總體指標(biāo)在某一范圍內(nèi)的可能性大小)。區(qū)間估計(jì)涉及抽樣極限誤差、置信區(qū)間、可信程度、概率度等概念,第41頁,共52頁,2023年,2月20日,星期一抽樣極限誤差△

由于存在誤差,而且樣本指標(biāo)會(huì)隨著樣本的不同而變動(dòng),但是都是圍繞著總體指標(biāo)變動(dòng)。這樣,在一定的概率下,樣本指標(biāo)偏離總體指標(biāo)的最大幅度,即樣本指標(biāo)與總體指標(biāo)的最大離差的絕對值,稱為抽樣極限誤差。也可以說,總體指標(biāo)在一定概率下會(huì)處于樣本指標(biāo)的一定范圍內(nèi),這個(gè)范圍稱為置信區(qū)間,即置信區(qū)間是以樣本指標(biāo)為中心,以抽樣極限誤差為半徑為一個(gè)范圍。變量總體屬性總體第42頁,共52頁,2023年,2月20日,星期一置信區(qū)間:對上式去掉絕對值符號,并且移項(xiàng)可得到:說明在一定可能下,總體指標(biāo)落在樣本指標(biāo)的一定范圍內(nèi)。

置信區(qū)間是統(tǒng)計(jì)意義上的,即一定概率下,總體指標(biāo)所落在的區(qū)間,其長度等于兩倍的抽樣極限誤差。第43頁,共52頁,2023年,2月20日,星期一可信程度

抽樣平均誤差說明估計(jì)的準(zhǔn)確程度,因此可以將抽樣平均誤差作為一種誤差計(jì)量單位(當(dāng)然在不同的條件下,這個(gè)單位的具體值是不同的),抽樣極限誤差可以表示為多少個(gè)誤差單位(即抽樣平均誤差的多少倍),表示為:

抽樣極限誤差為t個(gè)抽樣平均誤差,或者是抽樣極限誤差的t倍。這個(gè)t就稱為概率度或置信度。顯然,概率度與抽樣極限誤差成正比。第44頁,共52頁,2023年,2月20日,星期一(概率)第45頁,共52頁,2023年,2月20日,星期一總體平均指標(biāo)的區(qū)間估計(jì)計(jì)算步驟

根據(jù)上面的討論,總體平均指標(biāo)推斷的最終結(jié)果表現(xiàn)為一定概率保證程度下的置信區(qū)間。根據(jù)調(diào)查資料計(jì)算出抽樣平均誤差。根據(jù)概率保證要求,查表得出t值,然后計(jì)算抽樣極限誤差。

得出置信區(qū)間。第46頁,共52頁,2023年,2月20日,星期一簡單隨機(jī)抽樣的必要樣本容量的確定確定抽樣單位數(shù)的原則和依據(jù)原則:保證抽樣推斷能達(dá)到預(yù)期的可靠程度和精確度的要求下,確定一個(gè)適當(dāng)?shù)臉颖救萘?。依?jù):

1、推斷可靠程度和精確度要求。高則抽樣單位多,反之少。2、總體變異程度。大則多,小則少。3、采用何種抽樣組織方法。簡單隨機(jī)抽樣所需要的抽樣單位數(shù)一般大于其他抽樣方法,不重復(fù)抽樣需要的單位數(shù)少于重復(fù)抽樣。4、根據(jù)成本效益原則。

在抽樣之前,要根據(jù)如概率保證程度、誤差大小等要求,確定最少抽取的樣本單位數(shù)量,使結(jié)論滿足調(diào)查的要求

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論