版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第七章抽樣推斷:統(tǒng)計(jì)學(xué)之9抽樣推斷統(tǒng)計(jì)學(xué)之9抽樣推斷美國(guó)總統(tǒng)選舉民意調(diào)查
1984年11月里根與孟代爾競(jìng)選總統(tǒng),美國(guó)著名的蓋洛普、哈里斯、國(guó)家廣播公司三家民意調(diào)查社在選舉前三個(gè)星期所做調(diào)查的統(tǒng)計(jì)分析,里根分別約可獲得58%、55%及60%選票,正式選舉的結(jié)果:里根約獲得59%選票,而孟代爾約41%選票。此次美國(guó)所有的民意調(diào)查社的預(yù)測(cè)數(shù)字與選舉結(jié)果最多只有4%誤差,但被調(diào)查的選民不超過3000人,可見統(tǒng)計(jì)的技巧是多么有用。在以往的十七次美國(guó)總統(tǒng)選舉預(yù)測(cè)中,只有兩次失敗,第一次是1936年的藍(lán)頓對(duì)羅斯福的選舉,樣本數(shù)一千萬但是誤差20%,第二次是1948年杜威對(duì)杜魯門,樣本數(shù)二百萬誤差5%,50年來美國(guó)21次全國(guó)選舉預(yù)測(cè)之平均誤差只有2.3%。統(tǒng)計(jì)學(xué)之9抽樣推斷學(xué)習(xí)目的與要求:
抽樣估計(jì)是抽樣調(diào)查的繼續(xù),它提供了一套利用抽樣資料來估計(jì)總體數(shù)量特征的方法。通過本章的學(xué)習(xí),要理解和掌握抽樣估計(jì)的概念、特點(diǎn),抽樣誤差的含義、計(jì)算方法,抽樣估計(jì)的置信度,推斷總體參數(shù)的方法,能結(jié)合實(shí)際資料進(jìn)行抽樣估計(jì)。統(tǒng)計(jì)學(xué)之9抽樣推斷主要內(nèi)容:§1
抽樣推斷的概念與特點(diǎn)§2
抽樣平均誤差的計(jì)算§3
抽樣估計(jì)§4
抽樣的組織形式§5
必要抽樣數(shù)目的確定統(tǒng)計(jì)學(xué)之9抽樣推斷
第一節(jié)抽樣推斷概述一、抽樣推斷的概念抽樣推斷:是按隨機(jī)原則從總體中抽取一部分單位構(gòu)成一個(gè)樣本進(jìn)行觀察,并根據(jù)樣本的實(shí)際數(shù)據(jù)對(duì)總體的數(shù)量特征作出具有一定可靠程度的估計(jì)和判斷的一種統(tǒng)計(jì)方法。統(tǒng)計(jì)學(xué)之9抽樣推斷隨機(jī)原則:隨機(jī)原則——即是在抽取樣本時(shí),排除人們主觀意圖的作用,使得總體中的每個(gè)單位或每個(gè)樣本有相等的入選機(jī)會(huì)。隨機(jī)原則又稱為等可能性原則。統(tǒng)計(jì)學(xué)之9抽樣推斷統(tǒng)計(jì)推斷的過程:樣本總體樣本指標(biāo)總體指標(biāo)統(tǒng)計(jì)學(xué)之9抽樣推斷二、抽樣推斷的特點(diǎn)按隨機(jī)原則抽取樣本單位;用部分推斷總體,即用樣本指標(biāo)去推斷或估計(jì)總體指標(biāo)。抽樣推斷必然產(chǎn)生抽樣誤差,且誤差可以事先計(jì)算并加以控制。運(yùn)用概率估計(jì)方法。統(tǒng)計(jì)學(xué)之9抽樣推斷三、抽樣調(diào)查的作用適用于無限總體或者很難進(jìn)行全面調(diào)查的總體的研究;對(duì)某些可以但事實(shí)上不必或不可能進(jìn)行全面調(diào)查的現(xiàn)象總體的研究。適應(yīng)于破壞性產(chǎn)品的質(zhì)量檢驗(yàn);可以用于生產(chǎn)過程中的質(zhì)量控制;用于訂正全面調(diào)查的數(shù)據(jù);可用于假設(shè)檢驗(yàn)。統(tǒng)計(jì)學(xué)之9抽樣推斷四、抽樣推斷的基本概念(一)總體與樣本總體(全及總體、母體):是指統(tǒng)計(jì)所要研究的全體,由具有某種特定性質(zhì)的許多個(gè)別事物組成的集合體。N:總體單位數(shù)??傮w可分為有限總體與無限總體。統(tǒng)計(jì)學(xué)之9抽樣推斷樣本(抽樣總體、樣本總體或子樣)樣本
:是指按照隨機(jī)原則,從全及總體中抽取出來,代表全及總體的那部分單位的集合體。樣本容量(n)
:
樣本中所包含的總體單位數(shù)。n?30是大樣本。
總體是唯一的,樣本是隨機(jī)多個(gè)的。統(tǒng)計(jì)學(xué)之9抽樣推斷(二)、總體指標(biāo)與樣本指標(biāo)總體指標(biāo)(母體參數(shù)、總體參數(shù)、全及指標(biāo)):它是根據(jù)總體各單位的標(biāo)志值或標(biāo)志特征計(jì)算的,反映總體某種屬性的綜合指標(biāo)。全及指標(biāo)是唯一確定的,一個(gè)總體常常有多個(gè)總體參數(shù)。統(tǒng)計(jì)學(xué)之9抽樣推斷常用的總體指標(biāo)有:或或統(tǒng)計(jì)學(xué)之9抽樣推斷樣本指標(biāo)(樣本統(tǒng)計(jì)量):樣本指標(biāo):也稱為統(tǒng)計(jì)量或抽樣指標(biāo),它是根據(jù)抽樣各單位的標(biāo)志值或標(biāo)志特征值計(jì)算的、用以估計(jì)和推斷相應(yīng)總體指標(biāo)的綜合指標(biāo)。一個(gè)樣本常常有多個(gè)樣本指標(biāo),依據(jù)樣本的數(shù)據(jù)計(jì)算的樣本指標(biāo)不是唯一確定的。統(tǒng)計(jì)學(xué)之9抽樣推斷常用的樣本統(tǒng)計(jì)量有:或或統(tǒng)計(jì)學(xué)之9抽樣推斷說明:按照無偏估計(jì)的要求,才是總體方差的無偏公式,但在某些統(tǒng)計(jì)中,n通常較大,n與(n-1)相差甚微,為簡(jiǎn)便,就用n代替(n-1)??傮w指標(biāo)是唯一確定的值,樣本指標(biāo)是隨機(jī)變量。
統(tǒng)計(jì)學(xué)之9抽樣推斷(三)抽樣方法與樣本個(gè)數(shù)樣本個(gè)數(shù)(m)——指從總體中可能抽取的全部樣本數(shù)目,又稱樣本可能數(shù)目。這與抽樣方法和樣本容量有關(guān)系。抽樣方法重復(fù)(置)抽樣不重復(fù)(置)抽樣考慮順序不考慮順序考慮順序不考慮順序統(tǒng)計(jì)學(xué)之9抽樣推斷重復(fù)抽樣的特點(diǎn):n個(gè)單位的樣本是由n次連續(xù)試驗(yàn)構(gòu)成的。每次試驗(yàn)相互獨(dú)立,各單位中選與不中選相互不影響。每次試驗(yàn)都是在相同的條件下進(jìn)行,即都是從N個(gè)總體單位中隨機(jī)抽取一個(gè),因此,每個(gè)單位在每次中選的機(jī)會(huì)都相等,它們每次都有1/N的中選機(jī)會(huì)。統(tǒng)計(jì)學(xué)之9抽樣推斷不重復(fù)抽樣的特點(diǎn):n個(gè)單位的樣本是由n次連續(xù)試驗(yàn)構(gòu)成的,但由于每次抽出不放回,所以實(shí)質(zhì)上等同于同時(shí)從總體中抽n個(gè)樣本單位。每次試驗(yàn)不相互獨(dú)立,上次中選情況影響下次中選結(jié)果。每抽一次總體的單位數(shù)便少一個(gè),因此每個(gè)單位在各次中選的機(jī)會(huì)是不相等的,第i次抽取每個(gè)單位有1/(N-i+1)的中選機(jī)會(huì)。統(tǒng)計(jì)學(xué)之9抽樣推斷考慮順序的樣本個(gè)數(shù):1)不重復(fù)排列數(shù)2)重復(fù)排列數(shù)統(tǒng)計(jì)學(xué)之9抽樣推斷不考慮順序的樣本個(gè)數(shù):3)不重復(fù)組合數(shù)4)重復(fù)組合數(shù)統(tǒng)計(jì)學(xué)之9抽樣推斷【例】
從0-9的10個(gè)數(shù)中隨機(jī)重復(fù)抽選6個(gè)數(shù)字組成電話號(hào)碼,共能組成多少個(gè)電話號(hào)碼?(重復(fù)排列數(shù))統(tǒng)計(jì)學(xué)之9抽樣推斷【例】從班級(jí)10位學(xué)生中抽選三人擔(dān)任不同的職務(wù),問共有幾種抽法?(不重復(fù)的排列數(shù))統(tǒng)計(jì)學(xué)之9抽樣推斷【例】從小組10位學(xué)生中不重復(fù)隨機(jī)抽選3個(gè)組成樣本,考查其平均成績(jī),可能的樣本數(shù)目為:(重復(fù)組合數(shù))統(tǒng)計(jì)學(xué)之9抽樣推斷從A、B、C、D四個(gè)單位中,抽出兩個(gè)單位構(gòu)成一個(gè)樣本,問樣本個(gè)數(shù)是多少?重復(fù)抽樣排列數(shù):Nn=42
=16(個(gè)樣本)AAACADBABBBCBDABCACBCCCDDADBDCDD不重復(fù)抽樣排列數(shù):N(N-1)(N-2)……=4×3=12(個(gè)樣本)【例】統(tǒng)計(jì)學(xué)之9抽樣推斷(四)抽樣推斷的理論依據(jù)1.大數(shù)法則(大數(shù)定律)基本思想:大量的隨機(jī)現(xiàn)象具有一定的穩(wěn)定性。統(tǒng)計(jì)學(xué)之9抽樣推斷我們知道,總體由許多總體單位組成,每個(gè)總體單位的表現(xiàn)各不一樣。這些不同的表現(xiàn)共同決定著總體的表現(xiàn)或特征。如果我們將這些大量的總體單位加以綜合平均,那么它們對(duì)總體的個(gè)別影響會(huì)將相互抵消,最后呈現(xiàn)出它們共同作用的結(jié)果,使總體具有穩(wěn)定的性質(zhì)。統(tǒng)計(jì)學(xué)之9抽樣推斷實(shí)際推斷原理:當(dāng)試驗(yàn)次數(shù)很大時(shí),可以用樣本指標(biāo)代替總體指標(biāo)。在概率論中,大數(shù)法則是這樣表述的:對(duì)于任意正數(shù),有:或這樣,以嚴(yán)格的數(shù)學(xué)形式,表達(dá)了頻率的穩(wěn)定性。統(tǒng)計(jì)學(xué)之9抽樣推斷2、中心極限定理:中心極限定理,其著眼點(diǎn)是“變量和的分布”。一個(gè)隨機(jī)變量服從正態(tài)分布的現(xiàn)象并不多見,但多個(gè)變量和的分布服從正態(tài)分布則是普遍存在的。在現(xiàn)實(shí)生活中,變量和的分布是普遍存在的。基本思想:變量和的分布函數(shù)向正態(tài)分布收斂。統(tǒng)計(jì)學(xué)之9抽樣推斷也就是說:
中心極限定理論證了:如果總體變量存在有限的平均數(shù)和方差,那么,不論這個(gè)總體變量的分布如何,隨著抽樣單位數(shù)n的增加,抽樣平均數(shù)的分布便趨近于正態(tài)分布。統(tǒng)計(jì)學(xué)之9抽樣推斷中心極限定理的通俗定義是這樣的:當(dāng)n無限增大時(shí),不管總體分布是什么形狀,樣本平均數(shù)分布趨近于平均數(shù)為方差為的正態(tài)分布;且,。標(biāo)準(zhǔn)化變量的分布趨近于平均數(shù)為0,方差為1的標(biāo)準(zhǔn)正態(tài)分布。這樣就可以利用標(biāo)準(zhǔn)正態(tài)分布求得標(biāo)準(zhǔn)變量t落入任意區(qū)間的概率了。統(tǒng)計(jì)學(xué)之9抽樣推斷統(tǒng)計(jì)學(xué)之9抽樣推斷第二節(jié)抽樣平均誤差一、統(tǒng)計(jì)誤差的分類(抽樣誤差)統(tǒng)計(jì)誤差登記性誤差代表性誤差統(tǒng)計(jì)學(xué)之9抽樣推斷各種統(tǒng)計(jì)誤差:登記誤差:指由于調(diào)查登記或計(jì)算差錯(cuò)在發(fā)生的誤差統(tǒng)計(jì)誤差:指調(diào)查所得的統(tǒng)計(jì)數(shù)字與調(diào)查總體實(shí)際數(shù)值之間的差異。代表性誤差:指用樣本指標(biāo)推斷總體指標(biāo)時(shí),由于樣本結(jié)構(gòu)與總體結(jié)構(gòu)不一致,樣本不能完全代表總體而產(chǎn)生的誤差。統(tǒng)計(jì)學(xué)之9抽樣推斷系統(tǒng)誤差:由于非隨機(jī)因素引起的樣本代表性不足而產(chǎn)生的誤差,表現(xiàn)為樣本估計(jì)量的值系統(tǒng)性偏高或偏低,故也稱為偏差。隨機(jī)誤差:指遵循隨機(jī)原則抽樣,由于隨機(jī)因素(偶然性因素)引起的代表性誤差。通常所說的抽樣誤差指的就是隨機(jī)誤差。統(tǒng)計(jì)學(xué)之9抽樣推斷抽樣實(shí)際誤差:抽樣實(shí)際誤差:每一次抽樣,得到的樣本指標(biāo)與總體指標(biāo)的絕對(duì)離差。如、,這是無法計(jì)算的。抽樣實(shí)際誤差是隨機(jī)變量。統(tǒng)計(jì)學(xué)之9抽樣推斷抽樣平均誤差抽樣平均誤差:指所有可能出現(xiàn)的樣本平均數(shù)或抽樣成數(shù)的標(biāo)準(zhǔn)差。反映了抽樣指標(biāo)與總體指標(biāo)的平均誤差程度。從理論上說是一個(gè)唯一確定的量。統(tǒng)計(jì)學(xué)之9抽樣推斷二、抽樣平均數(shù)的平均誤差統(tǒng)計(jì)學(xué)之9抽樣推斷(一)平均數(shù)的抽樣分布平均數(shù)的抽樣分布:由總體中全部樣本平均數(shù)的可能取值和與之相應(yīng)的概率(頻率)組成。即把所有可能樣本平均數(shù)的次數(shù)分布稱之為平均數(shù)的抽樣分布。抽樣分布:指樣本指標(biāo)的次數(shù)分布。統(tǒng)計(jì)學(xué)之9抽樣推斷1.重復(fù)抽樣分布【例】設(shè)有某班組5個(gè)工人的日分別為34、38、42、46、50元,則:現(xiàn)用重復(fù)抽樣方法從中隨機(jī)抽取2個(gè)構(gòu)成樣本,并求樣本平均工資來推斷總體的平均工資。統(tǒng)計(jì)學(xué)之9抽樣推斷重復(fù)排列數(shù):樣本日工資平均數(shù)單位:元統(tǒng)計(jì)學(xué)之9抽樣推斷樣本日平均工資的次數(shù)分布表根據(jù)上表數(shù)據(jù),可以整理出樣本平均數(shù)的分布如左表:統(tǒng)計(jì)學(xué)之9抽樣推斷5/254/253/252/251/25
343638404244464850樣本日平均工資分布圖平均工資(元)統(tǒng)計(jì)學(xué)之9抽樣推斷則樣本日工資平均數(shù)的平均數(shù)和方差為:統(tǒng)計(jì)學(xué)之9抽樣推斷兩個(gè)重要結(jié)論:重復(fù)抽樣的樣本平均數(shù)的平均數(shù)等于總體平均數(shù),即:所以抽樣平均數(shù)的標(biāo)準(zhǔn)差反映了樣本平均數(shù)與總體平均數(shù)的平均誤差程度,稱為抽樣平均誤差或抽樣標(biāo)準(zhǔn)誤差。因?yàn)榻y(tǒng)計(jì)學(xué)之9抽樣推斷樣本平均數(shù)的分布與總體分布的比較:總體分布樣本平均數(shù)的分布3438424650X20100%3/252/251/254/255/253436384042444648500統(tǒng)計(jì)學(xué)之9抽樣推斷重復(fù)抽樣抽樣平均誤差的計(jì)算公式:可見抽樣平均誤差比總體標(biāo)準(zhǔn)差小得多,僅為總體標(biāo)準(zhǔn)的。另外,抽樣平均誤差和總體標(biāo)準(zhǔn)差成正比變化,而和樣本單位數(shù)n的平方根成反比變化。統(tǒng)計(jì)學(xué)之9抽樣推斷統(tǒng)計(jì)學(xué)之9抽樣推斷2.不重復(fù)抽樣分布樣本日工資平均數(shù)單位:元統(tǒng)計(jì)學(xué)之9抽樣推斷樣本日平均工資的次數(shù)分布表根據(jù)上表數(shù)據(jù),可以整理出樣本平均數(shù)的分布如左表:統(tǒng)計(jì)學(xué)之9抽樣推斷則樣本日工資平均數(shù)的平均數(shù)和方差為:統(tǒng)計(jì)學(xué)之9抽樣推斷也可得出兩個(gè)重要結(jié)論:不重復(fù)抽樣的樣本平均數(shù)的平均數(shù)等于總體平均數(shù),即:所以抽樣平均數(shù)的標(biāo)準(zhǔn)差也反映了樣本平均數(shù)與總體平均數(shù)的平均誤差程度,稱為抽樣平均誤差或抽樣標(biāo)準(zhǔn)誤差。因?yàn)榻y(tǒng)計(jì)學(xué)之9抽樣推斷不重復(fù)抽樣的抽樣平均誤差計(jì)算公式:不重復(fù)抽樣的抽樣平均誤差等于重復(fù)抽樣的抽樣平均誤差乘以修正因子即:統(tǒng)計(jì)學(xué)之9抽樣推斷(二)、抽樣平均誤差1.定義定義公式反映抽樣平均數(shù)(或抽樣成數(shù))與總體平均數(shù)(或總體成數(shù))的平均誤差程度?;蛘哒f,用來描述各樣本抽樣實(shí)際誤差的一般水平。抽樣平均誤差
:指所有可能出現(xiàn)的樣本指標(biāo)的標(biāo)準(zhǔn)差。統(tǒng)計(jì)學(xué)之9抽樣推斷定義公式:抽樣平均誤差是一個(gè)確定的值。統(tǒng)計(jì)學(xué)之9抽樣推斷抽樣平均誤差的具體意義:從總體N中取容量為n的可能樣本共有m個(gè),可計(jì)算出m個(gè)抽樣實(shí)際誤差(隨機(jī)變量):為了測(cè)定樣本(指標(biāo))的代表性程度的高低,單獨(dú)用某一次的抽樣誤差來衡量是不科學(xué)的,因此就需要采用一定的方法(求標(biāo)準(zhǔn)差的方法)計(jì)算所有m個(gè)抽樣實(shí)際誤差的平均數(shù),這就是抽樣平均誤差。(i=1,2,3,···m)統(tǒng)計(jì)學(xué)之9抽樣推斷2.抽樣平均誤差的應(yīng)用公式抽樣平均誤差是一個(gè)確定的值,但在實(shí)際抽樣估計(jì)中,常用某些樣本指標(biāo)來代替未知的總體指標(biāo)。例如用s2代替2。由于s2是隨機(jī)變量,故這時(shí)所測(cè)得的只是抽樣平均誤差的估計(jì)量,此估計(jì)量仍為隨機(jī)變量。實(shí)際工作中常用推導(dǎo)的應(yīng)用公式。統(tǒng)計(jì)學(xué)之9抽樣推斷抽樣平均誤差的應(yīng)用公式:重復(fù)抽樣:不重復(fù)抽樣:統(tǒng)計(jì)學(xué)之9抽樣推斷說明:抽樣平均誤差與總體標(biāo)準(zhǔn)差成正比,僅為總體標(biāo)準(zhǔn)差的;抽樣平均誤差與成反比。可通過調(diào)整樣本單位數(shù)來控制抽樣平均誤差。統(tǒng)計(jì)學(xué)之9抽樣推斷假定抽樣單位數(shù)增加2倍、0.5倍時(shí),抽樣平均誤差怎樣變化?【例】【解】統(tǒng)計(jì)學(xué)之9抽樣推斷3.計(jì)算應(yīng)注意的兩點(diǎn)(1)
總體方差未知時(shí)的處理方法:用s2代替2或p代替P;用方差的歷史或經(jīng)驗(yàn)數(shù)據(jù)代替。如果有多個(gè)方差可供選擇,則通常取用較大的,故p應(yīng)選擇最接近于0.5的。用方差的試驗(yàn)或試點(diǎn)數(shù)據(jù)代替。(2)
當(dāng)N很大時(shí),N-1≈N,于是統(tǒng)計(jì)學(xué)之9抽樣推斷4.的計(jì)算實(shí)例隨機(jī)抽查某大學(xué)150個(gè)男生的身高,得其平均身高為170.8公分。根據(jù)過去的材料,知道大學(xué)生身高的總體標(biāo)準(zhǔn)差為24公分,試求抽樣平均誤差?!纠?解:統(tǒng)計(jì)學(xué)之9抽樣推斷【例】2某廠生產(chǎn)某種燈泡5000只,隨機(jī)抽取500只作壽命測(cè)試。測(cè)試結(jié)果表明,平均壽命為6200小時(shí),樣本標(biāo)準(zhǔn)差為450小時(shí),求抽樣平均誤差。解:統(tǒng)計(jì)學(xué)之9抽樣推斷【例】3某倉(cāng)庫(kù)有某種零配件10000套,隨機(jī)抽取400套,發(fā)現(xiàn)32套不合格。求合格率的抽樣平均誤差。已知N=10000,n=400,p=368/400=92%,求統(tǒng)計(jì)學(xué)之9抽樣推斷解:重復(fù)抽樣:不重復(fù)抽樣:統(tǒng)計(jì)學(xué)之9抽樣推斷【例】4某校隨機(jī)抽選400名學(xué)生,發(fā)現(xiàn)戴眼鏡的學(xué)生有80人。根據(jù)樣本資料推斷全部學(xué)生中戴眼鏡的學(xué)生所占比重時(shí),抽樣誤差為多大?樣本p=n1/n=80/400=20%解:統(tǒng)計(jì)學(xué)之9抽樣推斷【例】5某燈泡廠對(duì)10000個(gè)產(chǎn)品進(jìn)行使用壽命檢驗(yàn),隨機(jī)抽取2%樣本進(jìn)行測(cè)試,按規(guī)定,燈泡使用壽命在1000小時(shí)以上者為合格品。測(cè)得樣本數(shù)據(jù)如下:燈泡平均使用時(shí)間x=1057小時(shí),燈泡使用時(shí)間標(biāo)準(zhǔn)差為s=53.63小時(shí),合格品率為p=91.5%,則:統(tǒng)計(jì)學(xué)之9抽樣推斷不重復(fù)抽樣時(shí):統(tǒng)計(jì)學(xué)之9抽樣推斷重復(fù)抽樣時(shí):
統(tǒng)計(jì)學(xué)之9抽樣推斷5.影響抽樣平均誤差的因素總體方差或標(biāo)準(zhǔn)差。
大,則大。樣本容量n。如n擴(kuò)大為原來的4倍,則縮小為原來的1/2。抽樣方法。由于小于1,重復(fù)抽樣時(shí)的抽樣平均誤差永遠(yuǎn)大于不重復(fù)抽樣時(shí)的抽樣平均誤差。抽樣調(diào)查的組織形式。統(tǒng)計(jì)學(xué)之9抽樣推斷統(tǒng)計(jì)學(xué)之9抽樣推斷第三節(jié)抽樣估計(jì)(推斷)有效的估計(jì)將是……統(tǒng)計(jì)學(xué)之9抽樣推斷一、抽樣估計(jì)的概念統(tǒng)計(jì)推斷:就是利用樣本的數(shù)據(jù),對(duì)總體的數(shù)量特征作出具有一定可靠程度的估計(jì)和判斷。統(tǒng)計(jì)推斷包括參數(shù)估計(jì)和假設(shè)檢驗(yàn)兩個(gè)方面??傮w參數(shù)估計(jì):是以樣本統(tǒng)計(jì)量作為未知總體參數(shù)的估計(jì)量,并通過樣本數(shù)據(jù)計(jì)算樣本統(tǒng)計(jì)量的取值,作為總體參數(shù)的估計(jì)值。參數(shù)估計(jì)又稱抽樣估計(jì)。統(tǒng)計(jì)學(xué)之9抽樣推斷抽樣估計(jì)要具備三個(gè)基本要素:要有合適的統(tǒng)計(jì)量作為估計(jì)量要有合理的允許誤差范圍(△)要有一個(gè)可接受的置信度統(tǒng)計(jì)學(xué)之9抽樣推斷二、統(tǒng)計(jì)量的優(yōu)良估計(jì)標(biāo)準(zhǔn)估計(jì)量:用于估計(jì)總體參數(shù)的統(tǒng)計(jì)量。估計(jì)值:依據(jù)某一具體的樣本指標(biāo)所估計(jì)的總體指標(biāo)的值。優(yōu)良估計(jì)量總是從總體上來說的,其標(biāo)準(zhǔn)有三個(gè):無偏性、一致性和有效性。統(tǒng)計(jì)學(xué)之9抽樣推斷1.無偏性要求樣本指標(biāo)的平均數(shù)等于被估計(jì)的總體指標(biāo)。即:樣本指標(biāo)是總體指標(biāo)的無偏估計(jì)量。有:統(tǒng)計(jì)學(xué)之9抽樣推斷無偏性:樣本統(tǒng)計(jì)量的期望值(均值)
等于被估計(jì)的總體參數(shù)。E(x)=X無偏估計(jì)量E(Me)≠X有偏估計(jì)量統(tǒng)計(jì)學(xué)之9抽樣推斷2.一致性當(dāng)樣本的單位數(shù)充分大時(shí),樣本指標(biāo)充分靠近總體指標(biāo)。即當(dāng)n無限增加,樣本指標(biāo)與未知的總體指標(biāo)之差的絕對(duì)值小于任意小的正數(shù),它的可能性也趨近于必然性。對(duì)于,當(dāng)n愈多,抽樣平均誤差愈接近于0。統(tǒng)計(jì)學(xué)之9抽樣推斷3、有效性要求作為優(yōu)良估計(jì)量的方差應(yīng)該比其他估計(jì)量的方差小。例如有:注意:并不是所有的估計(jì)量都符合以上的標(biāo)準(zhǔn)。例如:在正態(tài)分布的情況下,總體平均數(shù)和中位數(shù)是重合的,樣本中位數(shù)是總體中位數(shù)的無偏和一致估計(jì)量,但對(duì)比樣本平均數(shù)卻不是更有效的估計(jì)量。而樣本平均數(shù)卻是總體中位數(shù)的優(yōu)良估計(jì)量。統(tǒng)計(jì)學(xué)之9抽樣推斷三、抽樣極限誤差(△)總體指標(biāo)是唯一確定的值,樣本指標(biāo)是圍繞著全及指標(biāo)上下隨機(jī)出現(xiàn)的變量。抽樣平均誤差指抽樣分布的標(biāo)準(zhǔn)差,說明的是某一抽樣方案下所有可能樣本的平均誤差情況,但在抽樣推斷實(shí)踐中往往只抽取一個(gè)樣本,該樣本的指標(biāo)數(shù)值與總體指標(biāo)數(shù)值的離差,可能為正,也可能為負(fù),該誤差可能大于也可能小于或者等于抽樣平均誤差。因此,對(duì)于一項(xiàng)抽樣調(diào)查,總是要求有一個(gè)合理的允許誤差范圍,這就是抽樣極限誤差△。統(tǒng)計(jì)學(xué)之9抽樣推斷抽樣極限誤差的定義:抽樣極限誤差:指在進(jìn)行抽樣估計(jì)時(shí),根據(jù)研究對(duì)象的變異程度和分析任務(wù)的要求所確定的樣本指標(biāo)與總體指標(biāo)之間可允許的最大誤差范圍。也稱容許誤差、可能誤差。常用△表示。它是根據(jù)概率理論,以一定的可靠程度保證抽樣誤差不超過某一給定的范圍△。統(tǒng)計(jì)學(xué)之9抽樣推斷1)
△是指誤差范圍
△的原意表示是以為中心,在之間變動(dòng)。但由于全及指標(biāo)未知,而樣本指標(biāo)通過實(shí)測(cè)可得到。因此,抽樣誤差范圍的實(shí)際意義是要求被估計(jì)的全及指標(biāo)落在抽樣指標(biāo)的一定范圍內(nèi),即落在的范圍內(nèi)。統(tǒng)計(jì)學(xué)之9抽樣推斷即:因此,、P的范圍估計(jì)(區(qū)間估計(jì))分別為:
同理得:、統(tǒng)計(jì)學(xué)之9抽樣推斷2)△是指可能范圍而非肯定范圍抽樣極限誤差△不是唯一固定的,而是根據(jù)抽樣調(diào)查的目的,根據(jù)人們希望控制總體指標(biāo)的把握程度來確定的。如果希望控制的把握程度大些,就給予△較大的值,否則,△的給定值就較小。這種把握程度就是概率保證程度。亦即抽樣估計(jì)的可靠程度,叫估計(jì)置信度,習(xí)慣上也稱為可靠度、可信程度、把握程度或概率保證程度。統(tǒng)計(jì)學(xué)之9抽樣推斷四、置信度、概率度、估計(jì)精度1.置信度是估計(jì)的可靠性問題置信度:就是表明抽樣指標(biāo)和總體指標(biāo)的誤差,不超過一定范圍(△)的概率保證程度。統(tǒng)計(jì)學(xué)之9抽樣推斷置信度即概率保證程度:
由于抽樣指標(biāo)值隨著樣本的變動(dòng)而變動(dòng),它本身是一個(gè)隨機(jī)變量,因而抽樣指標(biāo)和總體指標(biāo)的誤差仍然是一個(gè)隨機(jī)變量,并不能保證誤差不超過一定范圍這個(gè)事件是必然事件,而只能給以一定程度的概率保證。因此,就有必要來計(jì)算抽樣指標(biāo)和總體指標(biāo)的誤差不超過一定范圍的概率大小,即計(jì)算抽樣指標(biāo)落在一定區(qū)間范圍內(nèi)的概率,這種概率稱之為抽樣估計(jì)的置信度。統(tǒng)計(jì)學(xué)之9抽樣推斷估計(jì)值所確定的估計(jì)區(qū)間是隨機(jī)的,在實(shí)際抽樣中并不能保證被估計(jì)的總體指標(biāo)值都落在允許誤差范圍內(nèi),這就產(chǎn)生要冒多大風(fēng)險(xiǎn)來相信所作的估計(jì)。例如:我們?cè)敢饷?0%的風(fēng)險(xiǎn),表示如果進(jìn)行多次重復(fù)估計(jì),則平均每100次估計(jì)將有10次是錯(cuò)誤的,90次是正確的,90%就稱為置信度或概率保證程度。統(tǒng)計(jì)學(xué)之9抽樣推斷2.概率度(t)反映△的相對(duì)程度
描述全部樣本指標(biāo)與總體指標(biāo)的平均誤差,而△則是對(duì)一個(gè)樣本的樣本指標(biāo)與總體指標(biāo)誤差的控制范圍,因而可用來衡量△。即抽樣極限誤差等于t倍的抽樣平均誤差:t就稱為概率度?;蚧蚪y(tǒng)計(jì)學(xué)之9抽樣推斷因此:△——是用一定倍數(shù)的表示的抽樣指標(biāo)與全及指標(biāo)之間的絕對(duì)離差。t
——是指以抽樣平均誤差為尺度來衡量的相對(duì)誤差范圍。統(tǒng)計(jì)學(xué)之9抽樣推斷
求t值的過程,也就是樣本變量
和p的標(biāo)準(zhǔn)化過程。標(biāo)準(zhǔn)變量t服從正態(tài)分布。t值大小是確定正態(tài)分布函數(shù)的決定因子。即t是確定概率保證程度大小的指標(biāo)??梢罁?jù)一定的置信度,查標(biāo)準(zhǔn)正態(tài)分布表求得。統(tǒng)計(jì)學(xué)之9抽樣推斷概率是概率度的函數(shù):P=F(t)在正態(tài)分布的情況下,從總體中隨機(jī)抽取一個(gè)樣本觀察,則該樣本指標(biāo)落在某一范圍內(nèi)的概率,是用占正態(tài)曲線面積的大小表示的。即:統(tǒng)計(jì)學(xué)之9抽樣推斷正態(tài)分布及其曲線下的面積圖68.27%1-1-295.45%99.73%-323統(tǒng)計(jì)學(xué)之9抽樣推斷可見隨著t的不斷增大,概率P的數(shù)值也隨著增大以致逐漸接近于1,使抽樣推斷達(dá)到完全可靠的程度。應(yīng)用正態(tài)分布曲線,把概率度t和抽樣誤差范圍△聯(lián)系起來,便可得到抽樣推斷全及指標(biāo)在一定范圍內(nèi)的概率保證程度。統(tǒng)計(jì)抽樣推斷中常用的有:統(tǒng)計(jì)學(xué)之9抽樣推斷常用概率度與概率對(duì)照表
統(tǒng)計(jì)學(xué)之9抽樣推斷3.估計(jì)精度是從相對(duì)數(shù)的角度說明抽樣估計(jì)的準(zhǔn)確程度誤差率=允許誤差/估計(jì)值,即:估計(jì)精度=1-誤差率,即:抽樣估計(jì)的準(zhǔn)確性隨著△的增大而減小,它們之間呈反方向變動(dòng)。統(tǒng)計(jì)學(xué)之9抽樣推斷注意:估計(jì)的準(zhǔn)確性與可靠信是相互矛盾的△決定估計(jì)的準(zhǔn)確性,成反比關(guān)系;F(t)決定估計(jì)的可靠性,成正比關(guān)系可靠性越大,F(xiàn)(t)越大
t越大△
越大
準(zhǔn)確性越小。統(tǒng)計(jì)學(xué)之9抽樣推斷【例】(仍用前面例子)從總體5個(gè)工人的日平均工資中重復(fù)抽取n為2的樣本平均工資的抽樣分布如下表:統(tǒng)計(jì)學(xué)之9抽樣推斷樣本日平均工資
的次數(shù)分布表統(tǒng)計(jì)學(xué)之9抽樣推斷統(tǒng)計(jì)學(xué)之9抽樣推斷五、抽樣估計(jì)方法以樣本的平均數(shù)作為總體平均數(shù)的估計(jì)值。以樣本的成數(shù)p作為總體成數(shù)P的估計(jì)值。(一)點(diǎn)估計(jì)(定值估計(jì))——它是直接以樣本指標(biāo)的實(shí)際值直接作為相應(yīng)總體參數(shù)的估計(jì)值。例如:統(tǒng)計(jì)學(xué)之9抽樣推斷點(diǎn)估計(jì)的特點(diǎn):優(yōu)點(diǎn):簡(jiǎn)便、易行、原理直觀,它能夠提供總體指標(biāo)的具體估計(jì)值,可以作為行動(dòng)決策的數(shù)量依據(jù)。缺點(diǎn):任何點(diǎn)估計(jì)不是對(duì)就是錯(cuò),點(diǎn)估計(jì)沒有表明抽樣估計(jì)的誤差,更沒有指出誤差在一定范圍內(nèi)的概率保證程度有多大。統(tǒng)計(jì)學(xué)之9抽樣推斷統(tǒng)計(jì)學(xué)家做得比間諜們更漂亮!由于許多戰(zhàn)略上的理由,盟軍非常想知道二戰(zhàn)期間德軍總共制造了多少輛坦克。德國(guó)人在制造坦克時(shí)是墨守陳規(guī)的,他們把坦克從1開始進(jìn)行了連續(xù)編號(hào)。在戰(zhàn)爭(zhēng)進(jìn)行過程中,盟軍繳獲了一些敵軍坦克,并記錄了它們的編號(hào)。那么怎樣用這些號(hào)碼來估計(jì)坦克總數(shù)呢?統(tǒng)計(jì)學(xué)之9抽樣推斷統(tǒng)計(jì)學(xué)家做得比間諜們更漂亮!
我們知道,制造出來的坦克數(shù)肯定大于記錄中的最大編號(hào)。因此,其中點(diǎn)估計(jì)的方法之一就是,計(jì)算出被繳獲坦克編號(hào)的平均值,并認(rèn)為這個(gè)值是德軍全部坦克編號(hào)的中點(diǎn),用樣本均值乘以2就是總數(shù)的一個(gè)估計(jì)。
從戰(zhàn)后發(fā)現(xiàn)的德軍記錄來看,盟軍估計(jì)值非常接近所生產(chǎn)坦克的真實(shí)記錄。統(tǒng)計(jì)學(xué)之9抽樣推斷(二)區(qū)間估計(jì)統(tǒng)計(jì)學(xué)之9抽樣推斷定義:區(qū)間估計(jì):就是在一定的概率保證程度下,選定概率度t及抽樣極限誤差△=t,再根據(jù)樣本指標(biāo)數(shù)值和△去估計(jì)總體指標(biāo)數(shù)值所在的可能范圍的一種統(tǒng)計(jì)推斷方法。估計(jì)區(qū)間的上下限:或置信區(qū)間:或置信度:統(tǒng)計(jì)學(xué)之9抽樣推斷1.根據(jù)F(t)求△及置信區(qū)間根據(jù)樣本資料,計(jì)算出及或p及。根據(jù)F(t)查正態(tài)分布概率表求t;根據(jù)t與,計(jì)算或,指出置信區(qū)間為:或統(tǒng)計(jì)學(xué)之9抽樣推斷【例】對(duì)某魚塘進(jìn)行抽樣調(diào)查,從魚塘的不同部位共網(wǎng)到魚150條,其中草魚123條,草魚平均每條重2公斤,標(biāo)準(zhǔn)差為0.75公斤。1)試按95.45%(t=2)的概率保證程度,對(duì)該魚塘草魚平均每條重量作區(qū)間估計(jì);2)以同樣的概率保證程度對(duì)該魚塘草魚所占比重作區(qū)間估計(jì)。統(tǒng)計(jì)學(xué)之9抽樣推斷解1)已知:草魚平均每條重量的估計(jì)區(qū)間為:
即[2-0.14,2+0.14]
[1.86,2.14]公斤
(公斤)=2kg,s=0.75kg,n=123,t=2統(tǒng)計(jì)學(xué)之9抽樣推斷解2)已知:n=150
,t=2,p=123/150=82%則草魚所占比重的估計(jì)區(qū)間為:即[82%-6.27%,82%+6.27%]
[75.73%,88.27%]統(tǒng)計(jì)學(xué)之9抽樣推斷2.根據(jù)給定的△,求F(t)抽取樣本,計(jì)算出、s,推算出;根據(jù)△,估計(jì)出根據(jù),求出F(t)統(tǒng)計(jì)學(xué)之9抽樣推斷隨機(jī)抽取25畝水稻田,測(cè)得平均畝產(chǎn)為650公斤,標(biāo)準(zhǔn)差為75公斤,求總體平均畝產(chǎn)在620-680斤之間的概率是多少?【例】統(tǒng)計(jì)學(xué)之9抽樣推斷【解】所以F(t)=95.45%。已知,s=75公斤,n=25統(tǒng)計(jì)學(xué)之9抽樣推斷【例】
某儲(chǔ)蓄所6月份共有存單3000張,為了解存款數(shù)量情況,現(xiàn)隨機(jī)抽取200張進(jìn)行調(diào)查,得結(jié)果如右表,試求重復(fù)抽樣條件下:該儲(chǔ)蓄所本月存單平均存款范圍(概率保證程度為95.45%);該儲(chǔ)蓄所本月存款額在1000元以上存單所占比重范圍。(概率保證程度為95.45%)。統(tǒng)計(jì)學(xué)之9抽樣推斷該儲(chǔ)蓄所存單平均存款額與標(biāo)準(zhǔn)差計(jì)算表統(tǒng)計(jì)學(xué)之9抽樣推斷①統(tǒng)計(jì)學(xué)之9抽樣推斷②p=40/200=20%,則統(tǒng)計(jì)學(xué)之9抽樣推斷
對(duì)我國(guó)某城市進(jìn)行居民家庭人均旅游消費(fèi)支出調(diào)查,隨機(jī)抽取400戶居民家庭,調(diào)查得知居民家庭人均年旅游消費(fèi)支出為350元,標(biāo)準(zhǔn)差為100元,要求以95%的概率保證程度,估計(jì)該市人均年旅游消費(fèi)支出額。
解:第一步,根據(jù)抽樣資料已算得:樣本戶年人均消費(fèi)支出x=350(元)樣本標(biāo)準(zhǔn)差s=100(元),則統(tǒng)計(jì)學(xué)之9抽樣推斷第二步,根據(jù)F(t)=95%,查得t=1.96。第三步,計(jì)算則該市居民家庭年人均旅游消費(fèi)支出額的上下限為:結(jié)論:我們可以95%得概率保證程度,估計(jì)該市居民家庭年人均旅游消費(fèi)支出額在340.20元—359.80元之間。統(tǒng)計(jì)學(xué)之9抽樣推斷【例】某市電視臺(tái)為了解觀眾對(duì)某電視欄目的喜愛程度,在該市隨機(jī)對(duì)900名居民進(jìn)行調(diào)查,結(jié)果有540名喜歡該電視欄目,要求以90%的概率保證程度,估計(jì)該市居民喜歡該電視欄目的比率。解:統(tǒng)計(jì)學(xué)之9抽樣推斷根據(jù)給定的F(t)=90%,查表得t=1.64。結(jié)論:我們可以概率90%的保證程度,估計(jì)該市居民對(duì)此電視欄目喜愛的比率在57.33%~62.67%之間。則總體比率的上下限為:統(tǒng)計(jì)學(xué)之9抽樣推斷統(tǒng)計(jì)學(xué)之9抽樣推斷第四節(jié)抽樣組織形式簡(jiǎn)單隨機(jī)抽樣類型抽樣等距抽樣整群抽樣多階段抽樣統(tǒng)計(jì)學(xué)之9抽樣推斷一、簡(jiǎn)單隨機(jī)抽樣簡(jiǎn)單隨機(jī)抽樣:又稱為純隨機(jī)抽樣,它是按照隨機(jī)原則直接從總體N個(gè)個(gè)體中抽取n個(gè)個(gè)體作樣本,使總體中的每個(gè)個(gè)體都有同等的機(jī)會(huì)被抽中。直接抽選法
抽簽摸球法
隨機(jī)數(shù)表法簡(jiǎn)單隨機(jī)抽樣
統(tǒng)計(jì)學(xué)之9抽樣推斷直接抽選法是指直接從調(diào)查對(duì)象中隨機(jī)抽選。例如,從倉(cāng)庫(kù)中存放的所有同類產(chǎn)品中隨機(jī)指定若干件產(chǎn)品進(jìn)行質(zhì)量檢驗(yàn);從糧食倉(cāng)庫(kù)中不同的地點(diǎn)取出若干糧食樣本進(jìn)行含雜量、含水量的檢驗(yàn)等。抽簽法即先將全及總體各個(gè)單位按照某種自然的順序編上號(hào),并做成號(hào)簽,再把號(hào)簽摻合起來,任意抽取所需單位數(shù),然后按照抽中的號(hào)碼取得對(duì)應(yīng)的調(diào)查單位加以登記調(diào)查。隨機(jī)數(shù)表是指含有一系列組別的隨機(jī)數(shù)字的表格。統(tǒng)計(jì)學(xué)之9抽樣推斷簡(jiǎn)單隨機(jī)抽樣的特點(diǎn)是抽樣調(diào)查中最基本的組織形式;遵循隨機(jī)原則直接從總體N個(gè)單位中抽取n個(gè)單位作為樣本;又稱為純隨機(jī)抽樣。簡(jiǎn)單隨機(jī)抽樣被用作評(píng)估其他抽樣策略的效率的基準(zhǔn);簡(jiǎn)單隨機(jī)抽樣最原始的抽取方法是抽簽法,最常用的抽取方法是利用《隨機(jī)數(shù)表》或計(jì)算機(jī)生產(chǎn)隨機(jī)數(shù)。統(tǒng)計(jì)學(xué)之9抽樣推斷簡(jiǎn)單隨機(jī)抽樣適用的情況:對(duì)調(diào)查對(duì)象很少了解;總體單位的排列沒有秩序;均勻總體。注:前面所討論的抽樣平均誤差的計(jì)算公式就是簡(jiǎn)單隨機(jī)抽樣時(shí)的抽樣平均誤差的公式。統(tǒng)計(jì)學(xué)之9抽樣推斷抽樣單位數(shù)目的計(jì)算重復(fù)抽樣:不重復(fù)抽樣:統(tǒng)計(jì)學(xué)之9抽樣推斷【例】
某市開展職工家計(jì)調(diào)查,根據(jù)歷史資料該市職工家庭平均每人年收入的標(biāo)準(zhǔn)差為2400元,家庭消費(fèi)總支出中食品消費(fèi)支出比重(恩格爾系數(shù))為54%?,F(xiàn)用重復(fù)抽樣方法,要求在95.45%的概率保證下,平均收入的抽樣極限誤差不超過200元,恩格爾系數(shù)的抽樣極限誤差不超過4%,請(qǐng)確定樣本必要數(shù)目。統(tǒng)計(jì)學(xué)之9抽樣推斷樣本成數(shù)的樣本必要數(shù)目:【解】根據(jù)公式,在重復(fù)抽樣條件下:樣本平均數(shù)的樣本必要數(shù)目:統(tǒng)計(jì)學(xué)之9抽樣推斷關(guān)于抽樣單位數(shù)目的幾點(diǎn)說明在同樣條件下,不重復(fù)抽樣比重復(fù)抽樣要求的抽樣單位數(shù)目少。但不重復(fù)抽樣的抽樣單位數(shù)目計(jì)算公式比較復(fù)雜。在實(shí)際工作中,一般當(dāng)n/N的抽樣比很小時(shí)(小于5%),為了簡(jiǎn)化計(jì)算,雖然采用不重復(fù)抽樣,也可用重復(fù)抽樣計(jì)算公式計(jì)算抽樣單位數(shù)目。統(tǒng)計(jì)學(xué)之9抽樣推斷關(guān)于抽樣單位數(shù)目的幾點(diǎn)說明同一總體往往同時(shí)需要估計(jì)總體平均數(shù)和總體成數(shù),對(duì)二者可以分別計(jì)算出各自抽樣單位數(shù)目,為了防止抽樣單位數(shù)目的不足,在實(shí)際工作中,往往根據(jù)抽樣單位數(shù)目比較大的一個(gè)數(shù)目進(jìn)行抽樣,以滿足共同要求。統(tǒng)計(jì)學(xué)之9抽樣推斷即問即答在重復(fù)抽樣情況下,如果其它條件保持不變,要使允許誤差范圍縮小為原來的1/2,則樣本單位數(shù)目需要擴(kuò)大為原來的多少?反之,如果允許誤差范圍要求擴(kuò)大為原來的2倍,抽樣單位數(shù)目又要如何變化?統(tǒng)計(jì)學(xué)之9抽樣推斷統(tǒng)計(jì)學(xué)之9抽樣推斷二、分類(層)抽樣類型抽樣:它是先對(duì)總體各單位按某種標(biāo)志分組,然后再?gòu)母鹘M中按隨機(jī)原則抽選一定單位構(gòu)成樣本,再對(duì)樣本總體進(jìn)行觀察。優(yōu)點(diǎn):能夠提高樣本的代表性,可降低影響抽樣平均誤差的方差。特點(diǎn):是統(tǒng)計(jì)分組和抽樣法的結(jié)合。統(tǒng)計(jì)學(xué)之9抽樣推斷經(jīng)過劃類分組后,確定各類型組抽樣單位數(shù)一般有兩種方法:不等比例抽樣。即各類型組所抽選的單位數(shù),按各類型組標(biāo)志值的變動(dòng)程度來確定,變動(dòng)程度大的多抽一些單位,變動(dòng)程度小的少抽一些單位,沒有統(tǒng)一的比例關(guān)系。等比例抽樣。即按照樣本單位數(shù)在各類之間分配的比重與總體在各類之間分配相同的比重進(jìn)行抽樣。統(tǒng)計(jì)學(xué)之9抽樣推斷等比例分層抽樣的抽樣平均誤差:
N=N1+N2+…+NK
n=n1+n2+…+nK等比例抽樣:分類抽樣總的抽樣誤差取決于各層內(nèi)的抽樣誤差,而各層內(nèi)的抽樣誤差又取決于各層內(nèi)部的方差和抽樣數(shù)目。統(tǒng)計(jì)學(xué)之9抽樣推斷重復(fù)抽樣條件下的計(jì)算公式(平均組內(nèi)方差)統(tǒng)計(jì)學(xué)之9抽樣推斷不重復(fù)抽樣條件下的計(jì)算公式統(tǒng)計(jì)學(xué)之9抽樣推斷注意:分層抽樣的取決于各組內(nèi)方差的平均數(shù),而總方差=組內(nèi)方差的平均數(shù)+組間方差,故分層抽樣的小于簡(jiǎn)單隨機(jī)抽樣的。由于總體方差是確定數(shù),因此類型抽樣分組(層)時(shí),應(yīng)盡量增大組(層)間差異,縮小組(層)內(nèi)差異。提高抽樣效果。統(tǒng)計(jì)學(xué)之9抽樣推斷不等比例抽樣
根據(jù)各組中標(biāo)志變異的大小確定適當(dāng)?shù)某闃訑?shù)目,差異程度大的組多抽一些單位,差異程度小的組少抽一些單位。則統(tǒng)計(jì)學(xué)之9抽樣推斷例:某鄉(xiāng)全部糧食耕地5000畝,按平原和山區(qū)分類抽取630畝,計(jì)算各組平均畝產(chǎn)和標(biāo)準(zhǔn)差i
如下表。求抽樣平均誤差。統(tǒng)計(jì)學(xué)之9抽樣推斷解:統(tǒng)計(jì)學(xué)之9抽樣推斷三、等距抽樣(機(jī)械抽樣、系統(tǒng)抽樣)等距抽樣:是先將總體單位按某一標(biāo)志排隊(duì),計(jì)算出抽樣間隔,并在第一個(gè)抽樣間隔內(nèi)確定一個(gè)抽樣起點(diǎn),再按固定的順序和相同的間隔來抽取樣本單位進(jìn)行觀察的一種抽樣方法。統(tǒng)計(jì)學(xué)之9抽樣推斷系統(tǒng)抽樣的具體做法如下:從N中抽取n個(gè)樣本單位,可先排隊(duì),算出間隔距離k=N/n,現(xiàn)從第一至k個(gè)單位中確定抽樣起點(diǎn)(即第一個(gè)樣本單位),之后,每隔k個(gè)單位抽取一個(gè)樣本單位。(圖示如下:)iNkkki+ki+2ki+(n-1)kkk統(tǒng)計(jì)學(xué)之9抽樣推斷機(jī)械抽樣的優(yōu)點(diǎn):能提高樣本單位分布的均勻性,樣本代表性較強(qiáng)。其要小于簡(jiǎn)單隨機(jī)抽樣時(shí)的。樣本單位的抽取工作也比較容易開展。統(tǒng)計(jì)學(xué)之9抽樣推斷無關(guān)標(biāo)志排隊(duì):——等距抽樣據(jù)以排隊(duì)的標(biāo)志與調(diào)查內(nèi)容沒有直接關(guān)系。其是按簡(jiǎn)單隨機(jī)抽樣的公式近似計(jì)算的。因?yàn)闊o關(guān)標(biāo)志排隊(duì)的結(jié)果,從所要調(diào)查的標(biāo)志來看,總體單位的排列順序?qū)嶋H上仍是隨機(jī)的。所以,其抽樣起點(diǎn)i可以隨機(jī)確定,即可以是第一個(gè)抽樣距離內(nèi)的任一個(gè)總體單位:1?i?k,這樣得到的樣本完全遵循了隨機(jī)原則,不會(huì)產(chǎn)生系統(tǒng)偏差。而且抽樣效果十分接近簡(jiǎn)單隨機(jī)。統(tǒng)計(jì)學(xué)之9抽樣推斷有關(guān)標(biāo)志排隊(duì)指據(jù)以排隊(duì)的標(biāo)志與調(diào)查內(nèi)容有密切關(guān)系。由于其排隊(duì)標(biāo)志與調(diào)查內(nèi)容有密切關(guān)系,排隊(duì)后,從所要調(diào)查的變量來看,總體單位也大致呈順序排列。所以其抽樣起點(diǎn)一般不宜隨機(jī)確定。否則,若在第一個(gè)抽樣間隔內(nèi)隨機(jī)地抽取一個(gè)標(biāo)志值較?。ɑ蜉^大)的單位作為抽樣起點(diǎn),整個(gè)樣本勢(shì)必出現(xiàn)偏低(或偏高)的系統(tǒng)偏差。統(tǒng)計(jì)學(xué)之9抽樣推斷半距起點(diǎn)等距抽樣(中心系統(tǒng)抽樣)——以第一個(gè)抽樣間隔內(nèi)的中點(diǎn)為抽樣起點(diǎn),并每隔k個(gè)單位抽一個(gè)單位。優(yōu)點(diǎn):樣本代表性高。不足點(diǎn):限制了抽樣的隨機(jī)性。統(tǒng)計(jì)學(xué)之9抽樣推斷對(duì)稱等距抽樣——在第一個(gè)抽樣間隔內(nèi)隨機(jī)地確定抽樣起點(diǎn)(1?i?k)
。然后以組界[k、2k、3k、…(n-1)k]為對(duì)稱點(diǎn)兩邊對(duì)稱地抽取樣本單位。如下圖所示:依次抽取的樣本單位序號(hào)分別為i、2k+i、2k-i、4k+i、、4k-i、6i+i、6k-i、…iNk(n-1)k2k3knk2K-i2K+i統(tǒng)計(jì)學(xué)之9抽樣推斷有關(guān)標(biāo)志排隊(duì)等距抽樣的計(jì)算:有關(guān)標(biāo)志排隊(duì)等距抽樣相當(dāng)于分層較多(將總體分為同等大小的n個(gè)層),而每層只抽取一個(gè)調(diào)查單位的特殊分層抽樣,所以其抽樣效果類似于分層抽樣,其一般按分層抽樣的抽樣平均誤差公式來近似計(jì)算。統(tǒng)計(jì)學(xué)之9抽樣推斷注意:等距抽樣需要有總體的輔助信息,以便于進(jìn)行單位的排序;等距抽樣要避免抽樣間隔和現(xiàn)象本身的周期、節(jié)奏重合而引起的系統(tǒng)性偏差。工業(yè)產(chǎn)品質(zhì)量檢查時(shí),抽樣時(shí)間間隔不宜與上下班或交接班時(shí)間一致。例如:統(tǒng)計(jì)學(xué)之9抽樣推斷四、整群抽樣(集團(tuán)抽樣)整群抽樣:是將總體全部單位分為若干部分(每一部分稱為一個(gè)群體,簡(jiǎn)稱群),然后以群為單位,按隨機(jī)原則從中抽取若干個(gè)群構(gòu)成樣本,對(duì)中選群內(nèi)的所有單位進(jìn)行全面調(diào)查的抽樣方法。統(tǒng)計(jì)學(xué)之9抽樣推斷整群抽樣的特點(diǎn):整群抽樣直接抽取的不是總體中的個(gè)體而是“群”,因此總體和樣本是由“群”組成的??傮w中的每一群所包含的單位數(shù)有每一群的單位數(shù)相等和不盡相等兩種情況。影響抽樣誤差的方差是群間方差,群內(nèi)方差不影響抽樣誤差。整群抽樣是不重復(fù)抽樣,應(yīng)該用不重復(fù)抽樣公式計(jì)算抽樣平均誤差。
統(tǒng)計(jì)學(xué)之9抽樣推斷整群抽樣的優(yōu)點(diǎn):由于是對(duì)中選群的全面調(diào)查,抽樣單位比較集中,所以整群抽樣能大大降低數(shù)據(jù)收集的費(fèi)用;當(dāng)總體中個(gè)體自然聚合成群(例如:住戶、學(xué)校)時(shí),整群抽樣組織更加方便;如果對(duì)于調(diào)查變量而言,群內(nèi)單元差異較大,而不同群的差異較小,整群抽樣比簡(jiǎn)單隨機(jī)抽樣的效率更高(例如為估計(jì)性別比采用按戶的整群抽樣)。統(tǒng)計(jì)學(xué)之9抽樣推斷整群抽樣的缺點(diǎn):對(duì)調(diào)查變量,若群內(nèi)個(gè)體有趨同性,則整群抽樣的抽樣效率比簡(jiǎn)單隨機(jī)抽樣低,(這正是通常遇到的情況),但對(duì)此項(xiàng)效率的損失可通過增加群的抽取個(gè)數(shù)來彌補(bǔ);通常無法提前控制總樣本量,因?yàn)樵谶M(jìn)行調(diào)查前,我們通常不知道一個(gè)群內(nèi)到底有多少個(gè)個(gè)體;抽樣誤差的計(jì)算可能比簡(jiǎn)單隨機(jī)抽樣更為復(fù)雜。統(tǒng)計(jì)學(xué)之9抽樣推斷整群抽樣的取決于2的大小整群抽樣對(duì)中選群進(jìn)行全面調(diào)查,其樣本代表性取決于抽中群體對(duì)全部群體的代表性。假設(shè)各群體之間沒有差異(即各群體的內(nèi)部結(jié)構(gòu)完全相同),則抽樣誤差為0??梢姡撼闃拥娜Q于群間差異程度的大小,而不受群體內(nèi)部差異程度的影響。整群抽樣的原則是:使群間方差盡可能小,群內(nèi)方差盡可能大。統(tǒng)計(jì)學(xué)之9抽樣推斷整群抽樣的計(jì)算:總體未知時(shí)可用樣本指標(biāo)替代。其中:統(tǒng)計(jì)學(xué)之9抽樣推斷例:某市保險(xiǎn)公司要調(diào)查居民家庭財(cái)產(chǎn)情況。該保險(xiǎn)公司調(diào)查組把該市的街道作為群,全市共100個(gè)街道,共100群。隨機(jī)抽選了18個(gè)街道(18群)進(jìn)行了調(diào)查。調(diào)查結(jié)果樣本平均數(shù)(樣本中居民平均家庭財(cái)產(chǎn)數(shù))為40000元,樣本群間方差為(5100元)2。試以95.45%的置信度估計(jì)全市平均家庭財(cái)產(chǎn)數(shù)。統(tǒng)計(jì)學(xué)之9抽樣推斷解:已知:,R=100,r=18,t=2則:置信區(qū)間:統(tǒng)計(jì)學(xué)之9抽樣推斷五、多階段抽樣(多級(jí)抽樣)多階段抽樣:它是先從總體中抽取一級(jí)單位,再?gòu)囊患?jí)單位中抽取二級(jí)單位……如此下去,最后才抽取所要調(diào)查的基本單位的一種抽樣形式。統(tǒng)計(jì)學(xué)之9抽樣推斷優(yōu)點(diǎn):是比整群抽樣靈活,在樣本容量相同的條件下,多階段抽樣的樣本單位在總體中的散布比整群抽樣均勻。此外,它還可以利用現(xiàn)成的行政區(qū)劃組織系統(tǒng)作為劃分各階段的依據(jù)。缺點(diǎn):調(diào)查結(jié)果的精確性不太高,計(jì)算、分析比較復(fù)雜。統(tǒng)計(jì)學(xué)之9抽樣推斷以兩階段抽樣為例兩階段抽樣在組織技術(shù)上是整群抽樣和類型抽樣的綜合。先將總體分為R群,每群包含Mi個(gè)單位,假定N=M1+M2+M3+
+MR=RM
,n1=m1+m2+m3+
+mro=rm。在每個(gè)階段都是隨機(jī)抽取樣本,都會(huì)產(chǎn)生隨機(jī)誤差,因此計(jì)算時(shí)要綜合兩階段的誤差。統(tǒng)計(jì)學(xué)之9抽樣推斷以xij表示第i樣本群第j個(gè)樣本單位的標(biāo)志值:第一階段抽樣平均數(shù)的方差為:第二階段抽樣平均數(shù)的方差為:統(tǒng)計(jì)學(xué)之9抽樣推斷兩階段抽樣平均誤差為:或者統(tǒng)計(jì)學(xué)之9抽樣推斷統(tǒng)計(jì)學(xué)之9抽樣推斷第五節(jié)必要抽樣數(shù)目的確定必要抽樣數(shù)目:是指為了完成抽樣調(diào)查任務(wù),滿足抽樣調(diào)查的各項(xiàng)要求,也就是為了保證抽樣推斷能達(dá)到預(yù)期的可靠程度和精確度的要求,而科學(xué)計(jì)算的需要抽取的樣本單位數(shù)。即樣本單位數(shù)“n”的具體數(shù)值,也叫樣本容量。
統(tǒng)計(jì)學(xué)之9抽樣推斷一、影響必要抽樣數(shù)目的因素總體各單位間的標(biāo)志變異程度極限抽樣誤差的大小調(diào)查結(jié)果的概率保證程度抽樣方法和抽樣的組織形式。二、必要抽樣數(shù)目的計(jì)算統(tǒng)計(jì)學(xué)之9抽樣推斷抽樣方法平均數(shù)成數(shù)重復(fù)抽樣不重復(fù)抽樣(一)簡(jiǎn)單隨機(jī)抽樣方式下的n統(tǒng)計(jì)學(xué)之9抽樣推斷【例】1:某市對(duì)職工收入抽樣調(diào)查,已知職工平均每人每月收入的標(biāo)準(zhǔn)差為220元,要求把握度為95.45%,允許誤差為15元,則需抽查人數(shù)為:統(tǒng)計(jì)學(xué)之9抽樣推斷【例】2:調(diào)查一批帳單的差錯(cuò)率。根據(jù)以往的資料,差錯(cuò)率曾有過1%,3%,5%三種情況?,F(xiàn)在要求把握度為95%,允許誤差為1%,則需抽查的帳單數(shù)為:統(tǒng)計(jì)學(xué)之9抽樣推斷抽樣方法平均數(shù)成數(shù)重復(fù)抽樣不重復(fù)抽樣(二)類型抽樣方式下的n統(tǒng)計(jì)學(xué)之9抽樣推斷(三)等距抽樣方式下的n
等距抽樣一般都采用不重復(fù)抽樣的方式,按無關(guān)標(biāo)志排隊(duì)的抽樣,用簡(jiǎn)單隨機(jī)不重復(fù)抽樣公式確定樣本容量;按有關(guān)標(biāo)志排序的抽樣,用類型不重復(fù)抽樣公式確定樣本容量(公式從略)。統(tǒng)計(jì)學(xué)之9抽樣推斷(四)整群抽樣方式下的n
整群抽樣一般采用不重復(fù)抽樣,它的必要抽樣數(shù)目的計(jì)算公式和簡(jiǎn)單隨機(jī)抽樣的計(jì)算公式從結(jié)構(gòu)上講基本上是一致的。其不同之處有兩個(gè)方面:一是標(biāo)志變異指標(biāo)不同。簡(jiǎn)單隨機(jī)條件下必要抽樣數(shù)目計(jì)算公式中的標(biāo)志變異指標(biāo)是總體方差。而整群抽樣條件下的計(jì)算公式是群間方差。二是采用的單位數(shù)目不同。簡(jiǎn)單隨機(jī)抽樣公式中總體單位數(shù)和樣本單位數(shù)分別用N、n表示。而整群抽樣公式中總體群數(shù)和抽樣群數(shù)分別用R、r表示。其計(jì)算公式為:統(tǒng)計(jì)學(xué)之9抽樣推斷整群抽樣要計(jì)算必要抽取的群數(shù)r統(tǒng)計(jì)學(xué)之9抽樣推斷三、確定n應(yīng)該注意的問題必要抽樣數(shù)目應(yīng)大于30。實(shí)際調(diào)查時(shí)可對(duì)計(jì)算的必要抽樣數(shù)目進(jìn)行調(diào)整當(dāng)總體單位數(shù)不大時(shí),如果采用不重復(fù)抽樣的方法抽取樣本,必須應(yīng)用不重復(fù)抽樣的計(jì)算公式計(jì)算必要抽樣數(shù)目;當(dāng)總體單位數(shù)很大時(shí),雖然采用不重復(fù)抽樣方法,亦可采用重復(fù)抽樣的計(jì)算公式計(jì)算必要抽樣數(shù)目。統(tǒng)計(jì)學(xué)之9抽樣推斷當(dāng)抽樣調(diào)查是為了檢驗(yàn)全面統(tǒng)計(jì)數(shù)字的質(zhì)量時(shí),全及總體的標(biāo)志變異指標(biāo)或p(1–p)是有實(shí)際資料的,可以直接代入公式計(jì)算必要抽樣數(shù)目。如有幾個(gè)方差可以選用時(shí),宜選擇最大數(shù)值。一個(gè)總體往往同時(shí)計(jì)算抽樣平均數(shù)和抽樣成數(shù)。由于它們的方差和允許誤差范圍不同,因此,需要的必要抽樣數(shù)目也不相同。為了防止由于樣本單位數(shù)不足而擴(kuò)大抽樣誤差,在實(shí)際工作中往往根據(jù)比較大的必要抽樣數(shù)目進(jìn)行抽樣,以滿足共同的需要。統(tǒng)計(jì)學(xué)之
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 專用燒烤制品買賣協(xié)議(2024版)版B版
- 專屬2024年度玉米購(gòu)入?yún)f(xié)議格式版A版
- 2025年度產(chǎn)業(yè)園區(qū)廠房租賃合同規(guī)范文本8篇
- 2025年度高科技產(chǎn)業(yè)園區(qū)物業(yè)智能化改造服務(wù)協(xié)議4篇
- 專業(yè)維修與裝飾工程2024協(xié)議格式版B版
- 2025年度企業(yè)搬遷拆遷補(bǔ)償承包合同范本4篇
- 個(gè)人間借貸協(xié)議規(guī)范文本2024年款版A版
- 2025年度影視基地場(chǎng)地租賃及拍攝服務(wù)合同4篇
- 2025年度教育機(jī)構(gòu)場(chǎng)地租賃與教育培訓(xùn)合同2篇
- 二零二四年LED產(chǎn)品OEM生產(chǎn)與技術(shù)支持合同
- 冬春季呼吸道傳染病防控
- 中介費(fèi)合同范本(2025年)
- 《kdigo專家共識(shí):補(bǔ)體系統(tǒng)在腎臟疾病的作用》解讀
- 生產(chǎn)調(diào)度員崗位面試題及答案(經(jīng)典版)
- 【物 理】2024-2025學(xué)年八年級(jí)上冊(cè)物理寒假作業(yè)人教版
- 交通運(yùn)輸安全生產(chǎn)管理規(guī)范
- 2025春夏運(yùn)動(dòng)戶外行業(yè)趨勢(shì)白皮書
- 電力行業(yè) 電力施工組織設(shè)計(jì)(施工方案)
- 《法制宣傳之盜竊罪》課件
- 通信工程單位勞動(dòng)合同
- 查對(duì)制度 課件
評(píng)論
0/150
提交評(píng)論