抽樣估計-抽樣推斷的一般問題_第1頁
抽樣估計-抽樣推斷的一般問題_第2頁
抽樣估計-抽樣推斷的一般問題_第3頁
抽樣估計-抽樣推斷的一般問題_第4頁
抽樣估計-抽樣推斷的一般問題_第5頁
已閱讀5頁,還剩44頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第五章抽樣估計§1抽樣推斷的一般問題§2抽樣誤差§3抽樣估計的方法§4抽樣組織設(shè)計§1、抽樣推斷的意義一、抽樣推斷的概念、特點(一)概念:抽樣推斷是在抽樣調(diào)查的基礎(chǔ)上,利用樣本的實際資料計算樣本指標(biāo),并據(jù)以推算總體相應(yīng)數(shù)量特征的一種統(tǒng)計分析方法。(二)、抽樣調(diào)查的基本特點:抽樣推斷是一種由部分推算整體的研究方法。抽樣推斷建立在隨機(jī)取樣的基礎(chǔ)上。抽樣推斷運用的是概率估計的方法。抽樣推斷的誤差可以事先計算,并加以控制。二、抽樣推斷的內(nèi)容:(一)參數(shù)估計(二)假設(shè)檢驗三、有關(guān)抽樣的基本概念(一)、隨機(jī)抽樣與非隨機(jī)抽樣隨機(jī)原則:就是排除主觀意愿的干擾,使總體的每個單位都有一定的概率被抽選為樣本單位,每個總體單位能否選入樣本是隨機(jī)的。隨機(jī)抽樣:是指按照隨機(jī)原則從總體中抽取樣本單位,保證每單位都有相同的中選機(jī)會,或中選的概率是已知的。非隨機(jī)抽樣:是指從研究目的出發(fā),根據(jù)調(diào)查者的經(jīng)驗或判斷,從總體中有意識地抽取若干單位構(gòu)成樣本。重點調(diào)查、典型調(diào)查等屬于非隨機(jī)抽樣。(其缺點在于難以排除主觀因素的影響,事先無法控制抽樣誤差,不能保證推斷結(jié)果的可信度。)(二)、總體參數(shù)和樣本統(tǒng)計量常用的總體參數(shù)有總體平均數(shù),總體成數(shù)和總體方差。常用的樣本統(tǒng)計量包括樣本平均數(shù),樣本成數(shù)和樣本方差。(三)、樣本容量和樣本個數(shù)

樣本容量:樣本所包含的總體單位個數(shù)稱為樣本容量,一般用n表示。在實際工作中,人們通常把n≥30的樣本稱為大樣本,而把n﹤30的樣本稱為小樣本。樣本個數(shù):是指從一個總體可能抽取的樣本個數(shù)。(四)、重復(fù)抽樣和不重復(fù)抽樣

樣本的可能數(shù)目既和樣本的容量有關(guān),也和抽樣的方法有關(guān)。根據(jù)取樣方式的不同,抽樣方法有重復(fù)抽樣和不重復(fù)抽樣兩種。1、重復(fù)抽樣:是指從總體的N個單位中抽取一個容量為n的樣本,每次抽出一個單位后,再將其放回總體中參加下一次抽取,這樣連續(xù)抽n次即得到一個樣本。2、不重復(fù)抽樣:是指抽中單位不再放回總體中,下一個樣本單位只能從余下的總體單位中抽取。重復(fù)抽樣與不重復(fù)抽樣的區(qū)別:重復(fù)抽樣:同一總體單位有可能被重復(fù)抽中;每個總體單位在每次抽樣中被抽中的概率都是相同的。抽樣誤差較大。不重復(fù)抽樣:同一總體單位不可能被重復(fù)抽中;由于每次抽取是在不同數(shù)目的總體單位中進(jìn)行,每個總體單位在各次抽樣中被抽中的概率不相等。抽樣誤差較小。§2、抽樣誤差一、抽樣誤差的意義(一)概念:抽樣誤差是指由于隨機(jī)抽樣的偶然因素使樣本各單位的結(jié)構(gòu)不足以代表總體各單位的結(jié)構(gòu),而引起抽樣指標(biāo)和全及指標(biāo)之間的絕對離差。抽樣誤差:

誤差登記性誤差代表性誤差系統(tǒng)性誤差隨機(jī)性誤差代表性誤差是指用樣本指標(biāo)推斷總體指標(biāo)時,由于樣本結(jié)構(gòu)與總體結(jié)構(gòu)不一致、樣本不能完全代表總體而產(chǎn)生的誤差。系統(tǒng)性誤差是指由于違反抽樣調(diào)查隨機(jī)原則,有意抽選較好或較差的單位進(jìn)行調(diào)查,使樣本估計量的值系統(tǒng)偏低或偏高。。隨機(jī)性誤差又稱偶然性誤差,是指遵循隨機(jī)原則抽樣,由于隨機(jī)因素(偶然性因素)引起的誤差。抽樣估計中的所謂抽樣誤差,就是指的這種隨機(jī)誤差。登記性誤差是指在調(diào)查和匯總過程中由于觀察、測量、登記、計算等方法的差錯或被調(diào)查者提供虛假資料而造成的誤差。任何一種統(tǒng)計調(diào)查都可能產(chǎn)生登記性誤差。影響抽樣誤差大小的因素是:總體各單位標(biāo)志值的差異程度。在其他條件不變的情況下,總體標(biāo)志的變異程度愈小,則抽樣誤差也愈??;總體標(biāo)志的變異程度愈大,則抽樣誤差也愈大。抽樣單位數(shù)的多少。在其他條件不變的情況下,抽樣單位數(shù)愈多,抽樣誤差愈??;抽樣單位數(shù)愈少,抽樣誤差愈大。抽樣的方法。在其他條件不變的情況下,重復(fù)抽樣的抽樣誤差大于不重復(fù)抽樣。抽樣的組織形式。二、抽樣平均誤差(一)、抽樣實際誤差:(二)、抽樣平均誤差:是抽樣平均數(shù)(或抽樣成數(shù))的標(biāo)準(zhǔn)差。它反映抽樣平均數(shù)(或抽樣成數(shù))與總體平均數(shù)(或總體成數(shù))的平均誤差程度。抽樣平均誤差的計算公式:變量總體屬性總體當(dāng)N很大時,重復(fù)抽樣與不重復(fù)抽樣的差別不大!

舉例說明抽樣平均誤差的意義:設(shè)有4個工人,各人的工資水平分別是40、50、70、80元,現(xiàn)采用重復(fù)抽樣方法隨機(jī)從中抽取2人。

序號樣本變量(x)樣本平均數(shù)平均數(shù)離差離差平方1(A、A)40、4040-204002(A、B)40、5045-152253(A、C)40、7055-5254(A、D)40、8060005(B、A)50、4045-152256(B、B)50、5050-101007(B、C)50、7060008(B、D)50、80655259(C、A)70、4055-52510(C、B)70、50600011(C、C)70、70701010012(C、D)70、80751522513(D、A)80、40600014(D、B)80、506552515(D、C)80、70751522516(D、D)80、808020400合計—960—2000

舉例說明抽樣平均誤差的意義:設(shè)有4個工人,各人的工資水平分別是40、50、70、80元,現(xiàn)采用重復(fù)抽樣方法隨機(jī)從中抽取2人。

序號樣本變量(x)樣本平均數(shù)平均數(shù)離差離差平方1(A、A)40、4040-204002(A、B)40、5045-152253(A、C)40、7055-5254(A、D)40、8060005(B、A)50、4045-152256(B、B)50、5050-101007(B、C)50、7060008(B、D)50、80655259(C、A)70、4055-52510(C、B)70、50600011(C、C)70、70701010012(C、D)70、80751522513(D、A)80、40600014(D、B)80、506552515(D、C)80、70751522516(D、D)80、808020400合計—960—2000三、抽樣極限誤差:是抽樣指標(biāo)和總體指標(biāo)之間抽樣誤差的可能范圍。

四、抽樣誤差的概率度

基于理論上的要求,抽樣極限誤差通常需要以抽樣平均誤差為標(biāo)準(zhǔn)單位來衡量,把極限誤差除以抽樣平均誤差,得出相對數(shù)Z,表示極限誤差范圍為抽樣平均誤差的若干倍。Z稱為概率度。這一變換稱為概率的標(biāo)準(zhǔn)化過程?!?、抽樣估計的方法

一、總體參數(shù)的點估計(一)參數(shù)點估計的概念點估計:也稱定值估計,即以實際抽樣資料得到的抽樣指標(biāo)值作為總體指標(biāo)的估計值。(二)優(yōu)良估計標(biāo)準(zhǔn)1、無偏性:用抽樣指標(biāo)估計總體指標(biāo)要求抽樣指標(biāo)的平均數(shù)等于被估計的總體指標(biāo)。2、一致性:隨著樣本的單位數(shù)n的無限增大,抽樣指標(biāo)和未知的總體指標(biāo)之間的絕對離差為任意小的可能性也趨于必然性。3、有效性:用抽樣指標(biāo)估計總體指標(biāo)要求作為優(yōu)良估計量的方差應(yīng)該比其它估計量的方差小。二、總體參數(shù)區(qū)間估計(一)抽樣估計的精度(二)抽樣估計的置信度抽樣估計置信度就是表明抽樣指標(biāo)和總體指標(biāo)的誤差不超過一定范圍的概率保證程度。根據(jù)概率度,依靠正態(tài)分布概率表求得。

三、總體參數(shù)區(qū)間估計方法

(一)總體參數(shù)區(qū)間估計應(yīng)具備的三要素:

一是:估計值;

二是:估計值的誤差范圍;——決定估計的準(zhǔn)確性。

三是:概率保證程度?!獩Q定估計的可靠性。

(二)總體參數(shù)的兩種區(qū)間估計方法

區(qū)間估計的基本特點:根據(jù)估計可靠程度的要求,選定概率度,以及極限誤差,再利用抽樣調(diào)查取得的抽樣平均數(shù),定出估計的上、下限。區(qū)間稱為置信區(qū)間,估計可靠程度稱為置信度。

四、舉例說明總體參數(shù)的兩種區(qū)間估計方法:(一)根據(jù)已經(jīng)給定的抽樣誤差范圍,求概率保證程度。例8、對某型號的電子元件進(jìn)行耐用性能的檢查,抽樣資料

分組列表如下,要求耐用時數(shù)的允許誤差范圍=10.5小時,試估計該批電子元件的平均耐用時數(shù)。耐用時數(shù)(小時)組中值(x)件數(shù)(f)900以下8751900—9509252950—100097561000—10501025351050—11001075431100—1150112591150—1200117531200以上12251合計—100解:第一步,計算抽樣平均數(shù)和標(biāo)準(zhǔn)差:例9、仍按例8資料,設(shè)該廠的產(chǎn)品質(zhì)量檢驗標(biāo)準(zhǔn)規(guī)定,元件耐用時數(shù)達(dá)到1000小時以上為合格品,要求合格率估計的誤差范圍不超過5%,試估計該批電子元件的合格率。(二)根據(jù)已經(jīng)給定的置信度要求來推算抽樣平均誤差的可能性范圍。例10、某城市進(jìn)行居民家計調(diào)查,隨機(jī)抽取400戶居民,調(diào)查的年平均每戶耐用品消費支出為850元,標(biāo)準(zhǔn)差為200元,要求以95%的概率保證程度,估計該城市居民每戶年平均耐用消費品支出。例11,為了研究新式時裝的銷路,在市場上隨機(jī)對900名成年人進(jìn)行調(diào)查,結(jié)果有540名喜歡該新式時裝,要求以90%的概率保證程度,估計該市成年人喜歡該新式時裝的比率?!?、抽樣組織設(shè)計

一、抽樣組織設(shè)計概述

二、抽樣調(diào)查的幾種常用形式簡單隨機(jī)抽樣類型抽樣等距抽樣整群抽樣(一)簡單隨機(jī)抽樣:它是按隨機(jī)原則直接從總體N個單位中抽取n個單位作為樣本。是抽樣中最基本也是最單純的方式,它適用于均勻總體。重復(fù)抽樣不重復(fù)抽樣在確定抽樣單位數(shù)時,應(yīng)注意的問題:(一)、抽樣單位數(shù)受允許誤差的制約,允許誤差愈小,抽樣單位數(shù)就愈多。所以在抽樣方案設(shè)計中,對抽樣誤差的可能范圍要十分慎重地進(jìn)行思考。(二)、為了防止由于抽樣單位數(shù)不足而擴(kuò)大抽樣誤差,在實際工作中往往根據(jù)比單位數(shù)大的一個數(shù)目進(jìn)行抽樣,以滿足共同的需要。(三)、在未知總體標(biāo)準(zhǔn)差或成數(shù)時,往往選擇最大值或50%,只有這樣才能抽取足夠多的樣本單位數(shù),以保證抽樣后的極限誤差在預(yù)先設(shè)定的允許誤差范圍之內(nèi)。例:對生產(chǎn)某型號電池進(jìn)行電流強(qiáng)度檢驗,根據(jù)以往正常生產(chǎn)的經(jīng)驗,電流強(qiáng)度的標(biāo)準(zhǔn)差=0.4安培,而合格率為90%。用重置抽樣的方式,要求在95.45%的概率保證下,抽樣平均電流強(qiáng)度的極限誤差不超過0.08安培,抽樣合格率的極限誤差不超過5%,問必要的抽樣單位數(shù)應(yīng)該為多少?

解:

兩個抽樣指標(biāo)所要求的單位數(shù)不同,應(yīng)抽取其中比較多的單位數(shù),即144個電池。在實際工作中,只要條件允許,一般應(yīng)抽取150—200個電池。以保證抽樣調(diào)查后,計算的極限誤差能夠在預(yù)先設(shè)定的允許誤差范圍內(nèi),使抽樣調(diào)查的任務(wù)順利完成。(二)類型抽樣:它的特點是先對總體各單位按主要標(biāo)志加以分組,然后再從各組中按隨機(jī)的原則抽取一定單位構(gòu)成樣本。

通過分類,可以把總體中比較接近的單位歸為一組,使各組的分布比較均勻,而且保證各組都有中選的機(jī)會,這樣計算的抽樣平均指標(biāo)變異程度也就比較小,所以在總體各單位標(biāo)志值大小懸殊的情況下,運用類型抽樣比簡單隨機(jī)抽樣可以得到更加準(zhǔn)確的結(jié)果。在類型抽樣中,組內(nèi):進(jìn)行的是抽樣調(diào)查,存在抽樣誤差。組間:進(jìn)行的是全面調(diào)查,不存在抽樣誤差。

由于總體進(jìn)行了分組,總體標(biāo)準(zhǔn)差就分解為兩個部分:平均組內(nèi)方差和組間方差。

由于在類型抽樣中,組間是全面調(diào)查,總體標(biāo)準(zhǔn)差就只剩下平均組內(nèi)方差。2例:某地區(qū)全部糧食耕地5000畝,按平原和山區(qū)面積比例抽取樣本容量630畝,計算相應(yīng)指標(biāo)如下表。以95%的概率估計該地區(qū)平均畝產(chǎn)量的區(qū)間。按地形分組全部面積(畝)Ni抽樣面積(畝)ni抽樣平均畝產(chǎn)(斤)xi畝產(chǎn)標(biāo)準(zhǔn)差(斤)σi平原4000504960200山區(qū)1000126750400合計5000630918253(三)等距抽樣:它的特點是事先將全及總體各單位按某一標(biāo)志排列,然后依固定順序和間隔來抽選調(diào)查單位的一種抽樣組織形式。

設(shè)全及總體有N個單位,現(xiàn)在需要抽取一個容量為n的樣本,可以將總體單位N按一定標(biāo)志(包括按有關(guān)標(biāo)志或無關(guān)標(biāo)志)排隊,然后將N劃分n個單位相等的部分,每個部分都包含k個單位,即N÷n=k。并在第一部分順序為1、2、3、…i…k個單位中隨機(jī)抽取一個單位,而在第二部分中抽取第i+k單位,…在第n個部分抽取第i+(n-1)k單位,共n個單位組成一個樣本,而且每個樣本的間隔均為k,這種抽樣方法稱為等距抽樣。等距抽樣的隨機(jī)性體現(xiàn)在抽取第一個樣本單位,當(dāng)?shù)谝粋€單位確定后,其余的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論