長(zhǎng)江大學(xué)統(tǒng)計(jì)學(xué)原理第七章抽樣推斷_第1頁(yè)
長(zhǎng)江大學(xué)統(tǒng)計(jì)學(xué)原理第七章抽樣推斷_第2頁(yè)
長(zhǎng)江大學(xué)統(tǒng)計(jì)學(xué)原理第七章抽樣推斷_第3頁(yè)
長(zhǎng)江大學(xué)統(tǒng)計(jì)學(xué)原理第七章抽樣推斷_第4頁(yè)
長(zhǎng)江大學(xué)統(tǒng)計(jì)學(xué)原理第七章抽樣推斷_第5頁(yè)
已閱讀5頁(yè),還剩196頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第七章抽樣推斷任課教師:湯來香tanglx2000@163.com美國(guó)總統(tǒng)統(tǒng)選舉民民意調(diào)查查1984年11月里根與孟代爾競(jìng)選總總統(tǒng),美國(guó)著名的蓋洛普、哈哈里斯、、國(guó)家廣播公司三三家民意意調(diào)查社在選舉前三個(gè)星期所做做調(diào)查的統(tǒng)計(jì)分析,里根分別約可獲得58%%、55%及60%選票,正式式選舉的結(jié)果:里根約獲得59%%選票,而孟孟代爾約41%選票。此次次美國(guó)所有的民民意調(diào)查社的預(yù)測(cè)數(shù)字與選舉結(jié)結(jié)果最多只只有4%%誤差,但被被調(diào)查的選民不超過3000人,可可見統(tǒng)計(jì)的技巧是是多么有用。在在以往的的十七次次美國(guó)總統(tǒng)選選舉預(yù)測(cè)測(cè)中,只有有兩次失敗,第一次次是1936年年的藍(lán)頓對(duì)羅羅斯福的選舉,樣本數(shù)一千萬(wàn)但是誤差20%%,第二二次是1948年杜威威對(duì)杜魯門,樣本數(shù)二百萬(wàn)誤差5%,,50年年來美國(guó)21次全國(guó)選舉預(yù)預(yù)測(cè)之平均誤差只有2.3%%。學(xué)習(xí)目的的與要求求:抽樣估計(jì)計(jì)是抽樣樣調(diào)查的的繼續(xù),,它提供供了一套套利用抽抽樣資料料來估計(jì)計(jì)總體數(shù)數(shù)量特征征的方法法。通過過本章的的學(xué)習(xí),,要理解解和掌握握抽樣估估計(jì)的概概念、特特點(diǎn),抽抽樣誤差差的含義義、計(jì)算算方法,,抽樣估估計(jì)的置置信度,,推斷總總體參數(shù)數(shù)的方法法,能結(jié)結(jié)合實(shí)際際資料進(jìn)進(jìn)行抽樣樣估計(jì)。。主要內(nèi)容容:§1抽樣推斷斷概述§2抽樣平均均誤差的的計(jì)算§3抽樣估計(jì)計(jì)§4抽樣的組組織形式式§5必要抽樣樣數(shù)目的的確定第一節(jié)抽抽樣推推斷概述述一、抽樣樣推斷的的概念抽樣推斷斷:是按隨隨機(jī)原則則從總體體中抽取取一部分分單位構(gòu)構(gòu)成一個(gè)個(gè)樣本進(jìn)進(jìn)行觀察察,并根根據(jù)樣本本的實(shí)際際數(shù)據(jù)對(duì)對(duì)總體的的數(shù)量特特征作出出具有一一定可靠靠程度的的估計(jì)和和判斷的的一種統(tǒng)統(tǒng)計(jì)方法法。隨機(jī)原則則:隨機(jī)原則則——即是是在抽取取樣本時(shí)時(shí),排除除人們主主觀意圖圖的作用用,使得得總體中中的每個(gè)個(gè)單位或或每個(gè)樣樣本有相相等的入入選機(jī)會(huì)會(huì)。隨機(jī)機(jī)原則又又稱為等等可能性性原則。。統(tǒng)計(jì)推斷斷的過程程:樣本總體樣本指標(biāo)總體指標(biāo)二、抽樣樣推斷的的特點(diǎn)按隨機(jī)原原則抽取取樣本單單位;用部分推推斷總體體,即用用樣本指指標(biāo)去推推斷或估估計(jì)總體體指標(biāo)。。抽樣推斷斷必然產(chǎn)產(chǎn)生抽樣樣誤差,,且誤差差可以事事先計(jì)算算并加以以控制。。運(yùn)用概率率估計(jì)方方法。三、抽樣樣調(diào)查的的作用適用于無無限總體體或者很很難進(jìn)行行全面調(diào)調(diào)查的總總體的研研究;對(duì)某些可可以但事事實(shí)上不不必或不不可能進(jìn)進(jìn)行全面面調(diào)查的的現(xiàn)象總總體的研研究。適應(yīng)于破破壞性產(chǎn)產(chǎn)品的質(zhì)質(zhì)量檢驗(yàn)驗(yàn);可以用于于生產(chǎn)過過程中的的質(zhì)量控控制;用于訂正正全面調(diào)調(diào)查的數(shù)數(shù)據(jù);可用于假假設(shè)檢驗(yàn)驗(yàn)。四、抽樣樣推斷的的基本概概念(一)總總體體與樣本本總體(全及總體體、母體)::是指統(tǒng)計(jì)計(jì)所要研研究的全全體,由由具有某某種特定定性質(zhì)的的許多個(gè)個(gè)別事物物組成的的集合體體。N:總體單位位數(shù)??傮w可分分為有限限總體與與無限總總體。樣本(抽抽樣總體體、樣本本總體或或子樣))樣本:是指按按照隨機(jī)機(jī)原則,,從全及及總體中中抽取出出來,代代表全及及總體的的那部分分單位的的集合體體。樣本容量量(n):樣本中所所包含的的總體單單位數(shù)。。n?30是大樣本本??傮w是唯唯一的,,樣本是隨隨機(jī)多個(gè)個(gè)的。(二)、、總體指指標(biāo)與樣樣本指標(biāo)標(biāo)總體指標(biāo)標(biāo)(母體參參數(shù)、總總體參數(shù)數(shù)、全及及指標(biāo))):它是根據(jù)據(jù)總體各各單位的的標(biāo)志值值或標(biāo)志志特征計(jì)計(jì)算的,,反映總總體某種種屬性的的綜合指指標(biāo)。全及指標(biāo)標(biāo)是唯一一確定的的,一個(gè)總體體常常有有多個(gè)總總體參數(shù)數(shù)。常用的總總體指標(biāo)標(biāo)有:或或樣本指標(biāo)標(biāo)(樣本本統(tǒng)計(jì)量量):樣本指標(biāo)標(biāo):也稱為統(tǒng)統(tǒng)計(jì)量或或抽樣指指標(biāo),它它是根據(jù)據(jù)抽樣各各單位的的標(biāo)志值值或標(biāo)志志特征值值計(jì)算的的、用以以估計(jì)和和推斷相相應(yīng)總體體指標(biāo)的的綜合指指標(biāo)。一個(gè)樣本本常常有有多個(gè)樣樣本指標(biāo)標(biāo),依據(jù)據(jù)樣本的的數(shù)據(jù)計(jì)計(jì)算的樣樣本指標(biāo)標(biāo)不是唯唯一確定定的。常用的樣樣本統(tǒng)計(jì)計(jì)量有::或或說明:按照無偏偏估計(jì)的的要求,,才是總體體方差的的無偏公公式,但但在某些些統(tǒng)計(jì)中中,n通常較大大,n與(n-1))相差甚微微,為簡(jiǎn)簡(jiǎn)便,就就用n代替(n-1))??傮w指標(biāo)標(biāo)是唯一一確定的的值,樣本指標(biāo)標(biāo)是隨機(jī)機(jī)變量??傮w指標(biāo)標(biāo)與樣本本指標(biāo)的的區(qū)別::樣本指標(biāo)標(biāo)是一個(gè)個(gè)隨機(jī)變變量,它它的不同同取值取取決于不不同的樣樣本;而而總體指指標(biāo)是一一個(gè)確定定的量值值,它與與樣本指指標(biāo)的取取值無關(guān)關(guān)。總體指標(biāo)標(biāo)是未知知的,樣樣本指標(biāo)標(biāo)通過抽抽樣調(diào)查查卻是可可知的。??傮w指標(biāo)標(biāo)與樣本本指標(biāo)的的聯(lián)系::運(yùn)用抽樣樣調(diào)查對(duì)對(duì)全及總總體指標(biāo)標(biāo)的推斷斷必須通通過樣本本指標(biāo);;對(duì)全部樣樣本而言言,所有有可能樣樣本指標(biāo)標(biāo)的平均均數(shù)等于于相應(yīng)的的總體指指標(biāo);對(duì)一個(gè)樣樣本而言言,當(dāng)樣樣本單位位數(shù)逐漸漸增大時(shí)時(shí),樣本本指標(biāo)會(huì)會(huì)逐漸接接近總體體指標(biāo)。。(三)抽抽樣方法法與樣本本個(gè)數(shù)樣本個(gè)數(shù)數(shù)(m)——指從總體體中可能能抽取的的全部樣樣本數(shù)目目,又稱稱樣本可能能數(shù)目。這與抽抽樣方法法和樣本本容量有有關(guān)系。。抽樣方法重復(fù)(置)抽樣不重復(fù)(置)抽樣考慮順序不考慮順序考慮順序不考慮順序重復(fù)抽樣樣的特點(diǎn)點(diǎn):n個(gè)單位的的樣本是是由n次連續(xù)試試驗(yàn)構(gòu)成成的。每次試驗(yàn)驗(yàn)相互獨(dú)獨(dú)立,各各單位中中選與不不中選相相互不影影響。每次試驗(yàn)驗(yàn)都是在在相同的的條件下下進(jìn)行,,即都是是從N個(gè)總體單單位中隨隨機(jī)抽取取一個(gè),,因此,,每個(gè)單單位在每每次中選選的機(jī)會(huì)會(huì)都相等等,它們們每次都都有1//N的中選機(jī)機(jī)會(huì)。不重復(fù)抽抽樣的特特點(diǎn):n個(gè)單位的的樣本是是由n次連續(xù)試試驗(yàn)構(gòu)成成的,但但由于每每次抽出出不放回回,所以以實(shí)質(zhì)上上等同于于同時(shí)從從總體中中抽n個(gè)樣本單單位。每次試驗(yàn)驗(yàn)不相互互獨(dú)立,,上次中中選情況況影響下下次中選選結(jié)果。。每抽一次次總體的的單位數(shù)數(shù)便少一一個(gè),因因此每個(gè)個(gè)單位在在各次中中選的機(jī)機(jī)會(huì)是不不相等的的,第i次抽取每每個(gè)單位位有1//(N-i++1)的中選機(jī)機(jī)會(huì)??紤]順序序的樣本本個(gè)數(shù)::1)不重復(fù)排排列數(shù)2)重復(fù)排列列數(shù)不考慮順順序的樣樣本個(gè)數(shù)數(shù):3)不重復(fù)組組合數(shù)4)重復(fù)組合合數(shù)【例】從0-9的10個(gè)數(shù)數(shù)中隨機(jī)機(jī)重復(fù)抽抽選6個(gè)個(gè)數(shù)字組組成電話話號(hào)碼,,共能組組成多少少個(gè)電話話號(hào)碼??(重復(fù)排排列數(shù)))【例】從班級(jí)10位學(xué)學(xué)生中抽抽選三人人擔(dān)任不不同的職職務(wù),問問共有幾幾種抽法法?(不重復(fù)復(fù)的排列列數(shù))【例】從小組10位學(xué)學(xué)生中不不重復(fù)隨隨機(jī)抽選選3個(gè)組組成樣本本,考查查其平均均成績(jī),,可能的的樣本數(shù)數(shù)目為::(重復(fù)組組合數(shù)))從A、B、、C、D四個(gè)單位位中,抽抽出兩個(gè)個(gè)單位構(gòu)構(gòu)成一個(gè)個(gè)樣本,,問樣本本個(gè)數(shù)是是多少??重復(fù)抽樣樣排列數(shù)數(shù):Nn=42=16(個(gè)樣本本)AAACADBABBBCBDABCACBCCCDDADBDCDD不重復(fù)抽抽樣排列列數(shù):N(N--1)((N-2)………=4×3=12(個(gè)樣本本)【例】(四)抽抽樣樣推斷的的理論依依據(jù)1.大數(shù)法則則(大數(shù)數(shù)定律))基本思想想:大量的隨隨機(jī)現(xiàn)象象具有一一定的穩(wěn)穩(wěn)定性。。我們知道道,總體體由許多多總體單單位組成成,每個(gè)個(gè)總體單單位的表表現(xiàn)各不不一樣。。這些不不同的表表現(xiàn)共同同決定著著總體的的表現(xiàn)或或特征。。如果我們們將這些些大量的的總體單單位加以以綜合平平均,那那么它們們對(duì)總體體的個(gè)別別影響會(huì)會(huì)將相互互抵消,,最后呈呈現(xiàn)出它它們共同同作用的的結(jié)果,,使總體體具有穩(wěn)穩(wěn)定的性性質(zhì)。實(shí)際推斷斷原理:當(dāng)試驗(yàn)次次數(shù)很大大時(shí),可可以用樣樣本指標(biāo)標(biāo)代替總總體指標(biāo)標(biāo)。在概率論論中,大大數(shù)法則則是這樣樣表述的的:對(duì)于任意意正數(shù),有:或這樣,以以嚴(yán)格的的數(shù)學(xué)形形式,表表達(dá)了頻頻率的穩(wěn)穩(wěn)定性。。2、中心心極限定定理:中心極限限定理,,其著眼眼點(diǎn)是““變量和的的分布”。一個(gè)個(gè)隨機(jī)變變量服從從正態(tài)分分布的現(xiàn)現(xiàn)象并不不多見,,但多個(gè)個(gè)變量和和的分布布服從正正態(tài)分布布則是普普遍存在在的。在在現(xiàn)實(shí)生生活中,,變量和和的分布布是普遍遍存在的的。基本思想想:變量和的的分布函函數(shù)向正正態(tài)分布布收斂。。也就是說說:中心極限限定理論論證了::如果總總體變量量存在有有限的平平均數(shù)和和方差,,那么,,不論這這個(gè)總體體變量的的分布如如何,隨隨著抽樣樣單位數(shù)數(shù)n的增加,,抽樣平平均數(shù)的的分布便便趨近于于正態(tài)分分布。中心極限限定理的的通俗定定義是這這樣的::當(dāng)n無限增大大時(shí),不不管總體體分布是是什么形形狀,樣樣本平均均數(shù)分布布趨近于于平均數(shù)數(shù)為方方差差為的的正態(tài)態(tài)分布;;且,,。標(biāo)準(zhǔn)化變變量的的分布趨趨近于平平均數(shù)為為0,方差差為1的的標(biāo)準(zhǔn)正正態(tài)分布布。這樣樣就可以以利用標(biāo)標(biāo)準(zhǔn)正態(tài)態(tài)分布求求得標(biāo)準(zhǔn)準(zhǔn)變量t落入任意意區(qū)間的的概率了了。第二節(jié)抽抽樣平平均誤差差一、統(tǒng)計(jì)計(jì)誤差的的分類(抽樣誤差)統(tǒng)計(jì)誤差登記性誤差代表性誤差各種統(tǒng)計(jì)計(jì)誤差::登記誤差差:指由于于調(diào)查登登記或計(jì)計(jì)算差錯(cuò)錯(cuò)在在發(fā)發(fā)生的誤誤差統(tǒng)計(jì)誤差差:指調(diào)查查所得的的統(tǒng)計(jì)數(shù)數(shù)字與調(diào)調(diào)查查總總體實(shí)際際數(shù)值之之間的差差異。代表性誤誤差:指用樣樣本指標(biāo)標(biāo)推斷總總體指標(biāo)標(biāo)時(shí)時(shí),由于于樣本結(jié)結(jié)構(gòu)與總總體結(jié)構(gòu)構(gòu)不一致致,樣本本不能完完全代表表總體而而產(chǎn)生的的誤差。。系統(tǒng)誤差差:由于非非隨機(jī)因因素引起起的樣本本代表性性不足而而產(chǎn)生的的誤差,,表現(xiàn)為為樣本估計(jì)量的的值系統(tǒng)統(tǒng)性偏高高或偏低低,故也也稱為偏差。隨機(jī)誤差差:指遵循循隨機(jī)原原則抽樣樣,由于于隨機(jī)因因素(偶偶然性因因素)引引起的代代表性誤誤差。通通常所說說的抽樣樣誤差指指的就是是隨機(jī)誤誤差。抽樣實(shí)際際誤差::抽樣實(shí)際際誤差:每一次次抽樣,,得到的的樣本指指標(biāo)與總總體指標(biāo)標(biāo)的絕對(duì)對(duì)離差。。如、、,,這是無無法計(jì)算算的。抽樣實(shí)際際誤差是是隨機(jī)變變量。抽樣平均均誤差抽樣平均均誤差:指所有可可能出現(xiàn)現(xiàn)的樣本本指標(biāo)((平均數(shù)數(shù)或抽樣樣成數(shù)))的標(biāo)準(zhǔn)準(zhǔn)差。反映了抽抽樣指標(biāo)標(biāo)與總體體指標(biāo)的的平均誤誤差程度度。從理論上上說是一一個(gè)唯一一確定的的量。二、抽樣樣平均數(shù)數(shù)的平均均誤差(一)平平均均數(shù)的抽抽樣分布布平均數(shù)的的抽樣分分布:由總體體中全部部樣本平平均數(shù)的的可能取取值和與與之相應(yīng)應(yīng)的概率率(頻率率)組成成。即把所有有可能樣樣本平均均數(shù)的次次數(shù)分布布稱之為為平均數(shù)數(shù)的抽樣樣分布。。抽樣分布布:指樣本本指標(biāo)的的次數(shù)分分布。1.重復(fù)復(fù)抽樣分分布【例】設(shè)有某班班組5個(gè)個(gè)工人人的日分分別為34、38、42、46、、50元元,則::現(xiàn)用重復(fù)復(fù)抽樣方方法從中中隨機(jī)抽抽取2個(gè)個(gè)構(gòu)成樣樣本,并并求樣本本平均工工資來推推斷總體體的平均均工資。。重復(fù)排列列數(shù):樣本日工工資平均均數(shù)單位:元元樣本日平平均工資資的次數(shù)數(shù)分布表表根據(jù)上表表數(shù)據(jù),,可以整整理出樣樣本平均均數(shù)的分分布如左左表:5/254/253/252/251/25343638404244464850樣本日平平均工資資分布圖圖平均工資資(元)則樣本日日工資平平均數(shù)的的平均數(shù)數(shù)和和方差為為:兩個(gè)重要要結(jié)論::重復(fù)抽樣樣的樣本本平均數(shù)數(shù)的平平均數(shù)等等于總總體平均均數(shù),即即:所以抽樣樣平均數(shù)數(shù)的標(biāo)準(zhǔn)準(zhǔn)差反反映了樣樣本平均均數(shù)與總總體平均均數(shù)的平平均誤差差程度,,稱為抽樣平均均誤差或抽樣標(biāo)準(zhǔn)準(zhǔn)誤差。。因?yàn)闃颖酒骄鶖?shù)的分分布與總總體分布布的比較較:總體分布布樣本平均均數(shù)的分分布3438424650X20100%3/252/251/254/255/253436384042444648500重復(fù)抽樣樣抽樣平平均誤差差的計(jì)算算公式::可見抽樣樣平均誤誤差比總總體標(biāo)準(zhǔn)準(zhǔn)差小得得多,僅僅為總體體標(biāo)準(zhǔn)的的。。另外,抽抽樣平均均誤差和和總體標(biāo)標(biāo)準(zhǔn)差成成正比變變化,而而和樣本本單位數(shù)數(shù)n的平方根根成反比比變化。。2.不重重復(fù)抽樣樣分布樣本日工工資平均均數(shù)單位:元元樣本日平平均工資資的次數(shù)數(shù)分布表表根據(jù)上表表數(shù)據(jù),,可以整整理出樣樣本平均均數(shù)的分分布如左左表:則樣本日日工資平平均數(shù)的的平均數(shù)數(shù)和和方差為為:也可得出出兩個(gè)重重要結(jié)論論:不重復(fù)抽抽樣的樣樣本平均均數(shù)的的平均數(shù)數(shù)等等于于總體平平均數(shù),,即:所以抽樣樣平均數(shù)數(shù)的標(biāo)準(zhǔn)準(zhǔn)差也也反映了了樣本平平均數(shù)與與總體平平均數(shù)的的平均誤誤差程度度,稱為為抽樣平均均誤差或抽樣標(biāo)準(zhǔn)準(zhǔn)誤差。。因?yàn)椴恢貜?fù)抽抽樣的抽抽樣平均均誤差計(jì)計(jì)算公式式:不重復(fù)抽抽樣的抽抽樣平均均誤差等等于重復(fù)復(fù)抽樣的的抽樣平平均誤差差乘以修正因子子即:(二)、、抽樣平平均誤差差1.定義定義公式式反映抽抽樣平均均數(shù)(或或抽樣成成數(shù))與與總體平平均數(shù)((或總體體成數(shù)))的平均均誤差程程度?;蚧蛘哒f,,用來描描述各樣樣本抽樣樣實(shí)際誤誤差的一一般水平平。抽樣平均均誤差:指所有可可能出現(xiàn)現(xiàn)的樣本本指標(biāo)的的標(biāo)準(zhǔn)差差。定義公式式:抽樣平均均誤差是是一個(gè)確確定的值值。抽樣平均均誤差的的具體體意義::從總體N中取容量量為n的可能樣樣本共有有m個(gè),可計(jì)算出出m個(gè)抽樣實(shí)實(shí)際誤差差(隨機(jī)機(jī)變量)):為了測(cè)定定樣本((指標(biāo)))的代表表性程度度的高低低,單獨(dú)獨(dú)用某一一次的抽抽樣誤差差來衡量量是不科科學(xué)的,,因此就就需要采采用一定的方方法(求求標(biāo)準(zhǔn)差差的方法法)計(jì)算所有有m個(gè)抽樣實(shí)實(shí)際誤差差的平均均數(shù),這這就是抽抽樣平均均誤差。。(i=1,2,,3,····m)2.抽樣平平均誤差差的應(yīng)用用公式抽樣平均均誤差是是一個(gè)確確定的值值,但在實(shí)際際抽樣估估計(jì)中,,常用某某些樣本本指標(biāo)來來代替未未知的總總體指標(biāo)標(biāo)。例如如用s2代替2。由于s2是隨機(jī)變變量,故故這時(shí)所所測(cè)得的的只是抽抽樣平均均誤差的的估計(jì)量量,此估估計(jì)量仍仍為隨機(jī)機(jī)變量。。實(shí)際工作作中常用用推導(dǎo)的的應(yīng)用公公式。抽樣平均均誤差的的應(yīng)用用公式::重復(fù)抽樣樣:不重復(fù)抽抽樣:說明:抽樣平均均誤差與與總體標(biāo)標(biāo)準(zhǔn)差成成正比,,僅為總總體標(biāo)準(zhǔn)準(zhǔn)差的;;抽樣平均均誤差與與成成反比比??赏ㄟ^調(diào)調(diào)整樣本本單位數(shù)數(shù)來控制制抽樣平平均誤差差。假定抽樣樣單位數(shù)數(shù)增加2倍、0.5倍倍時(shí),抽樣樣平均誤誤差怎樣樣變化??【例】【解】3.計(jì)算算應(yīng)應(yīng)注意的的兩點(diǎn)(1)總體方差差未知時(shí)的處理理方法::用s2代替2或p代替P;用方差的的歷史或或經(jīng)驗(yàn)數(shù)數(shù)據(jù)代替替。如果果有多個(gè)個(gè)方差可可供選擇擇,則通通常取用用較大的的,故p應(yīng)選擇最最接近于于0.5的。。用方差的的試驗(yàn)或或試點(diǎn)數(shù)數(shù)據(jù)代替替。(2)當(dāng)N很大時(shí),,N-1≈≈N,于是4.的的計(jì)算算實(shí)例隨機(jī)抽查查某大學(xué)學(xué)150個(gè)男生的的身高,,得其平平均身高高為170..8公分。根根據(jù)過去去的材料料,知道道大學(xué)生生身高的的總體標(biāo)標(biāo)準(zhǔn)差為為24公分,試試求抽樣樣平均誤誤差?!纠?解:【例】2某廠生產(chǎn)產(chǎn)某種燈燈泡5000只只,隨機(jī)機(jī)抽取500只只作壽命命測(cè)試。。測(cè)試結(jié)結(jié)果表明明,平均均壽命為為6200小時(shí)時(shí),樣本本標(biāo)準(zhǔn)差差為450小時(shí)時(shí),求抽抽樣平均均誤差。。解:【例】3某倉(cāng)庫(kù)有有某種零零配件10000套,,隨機(jī)抽抽取400套,,發(fā)現(xiàn)32套不不合格。。求合格格率的抽抽樣平均均誤差。。已知N=10000,n=400,p=368/400=92%,求解:重復(fù)抽樣:不重復(fù)抽抽樣:【例】4某校隨機(jī)機(jī)抽選400名名學(xué)生,,發(fā)現(xiàn)戴戴眼鏡的的學(xué)生有有80人人。根據(jù)據(jù)樣本資資料推斷斷全部學(xué)學(xué)生中戴戴眼鏡的的學(xué)生所所占比重重時(shí),抽抽樣誤差差為多大大?樣本p=n1/n=80/400==20%%解:【例】5某燈泡廠廠對(duì)10000個(gè)產(chǎn)品品進(jìn)行使使用壽命命檢驗(yàn),,隨機(jī)抽抽取2%%樣本進(jìn)進(jìn)行測(cè)試試,按規(guī)規(guī)定,燈燈泡使用用壽命在在1000小時(shí)時(shí)以上者者為合格格品。測(cè)測(cè)得樣本本數(shù)據(jù)如如下:燈泡平均均使用時(shí)時(shí)間x=1057小時(shí),燈泡使用用時(shí)間標(biāo)標(biāo)準(zhǔn)差為為s=53.63小時(shí),合格品率率為p=91.5%%,則:不重復(fù)抽抽樣時(shí)::重復(fù)抽樣樣時(shí):

5.影響抽抽樣平均均誤差的的因素總體方差差或標(biāo)準(zhǔn)準(zhǔn)差。大,則則大。。樣本容量量n。如n擴(kuò)大為原原來的4倍,則則縮小為原原來的1/2。。抽樣方法法。由于小小于1,重復(fù)抽樣樣時(shí)的抽抽樣平均均誤差永永遠(yuǎn)大于于不重復(fù)復(fù)抽樣時(shí)時(shí)的抽樣樣平均誤誤差。抽樣調(diào)查查的組織織形式。。第三節(jié)抽抽樣估估計(jì)(推推斷)有效的估估計(jì)將是是……一、抽樣樣估計(jì)的的概念統(tǒng)計(jì)推斷斷:就是利利用樣本本的數(shù)據(jù)據(jù),對(duì)總總體的數(shù)數(shù)量特征征作出具具有一定定可靠程程度的估估計(jì)和判判斷。統(tǒng)統(tǒng)計(jì)推斷斷包括參參數(shù)估計(jì)計(jì)和假設(shè)設(shè)檢驗(yàn)兩兩個(gè)方面面??傮w參數(shù)數(shù)估計(jì):是以樣樣本統(tǒng)計(jì)計(jì)量作為為未知總總體參數(shù)數(shù)的估計(jì)計(jì)量,并并通過樣樣本數(shù)據(jù)據(jù)計(jì)算樣樣本統(tǒng)計(jì)計(jì)量的取取值,作作為總體體參數(shù)的的估計(jì)值值。參數(shù)數(shù)估計(jì)又又稱抽樣估計(jì)計(jì)。抽樣估計(jì)計(jì)要具備備三個(gè)基基本要素素:要有合適適的統(tǒng)計(jì)計(jì)量作為為估計(jì)量要有合理理的允許誤差差范圍((△)要有一個(gè)個(gè)可接受受的置信度二、統(tǒng)計(jì)計(jì)量的優(yōu)優(yōu)良估計(jì)計(jì)標(biāo)準(zhǔn)估計(jì)量:用于估估計(jì)總體體參數(shù)的的統(tǒng)計(jì)量量。估計(jì)值:估計(jì)參參數(shù)時(shí)計(jì)計(jì)算的統(tǒng)統(tǒng)計(jì)量的的具體值值。優(yōu)良估計(jì)計(jì)量總是是從總體體上來說說的,其其標(biāo)準(zhǔn)有有三個(gè)::無偏性、、一致性性和有效效性。1.無偏偏性要求樣本本指標(biāo)的的平均數(shù)數(shù)等于被被估計(jì)的的總體指指標(biāo)。即即:樣本本指標(biāo)是是總體指指標(biāo)的無無偏估計(jì)計(jì)量。有有:無偏性::樣本統(tǒng)計(jì)計(jì)量的期期望值((均值))

等于于被估計(jì)計(jì)的總體體參數(shù)。。E(x)=X無偏估計(jì)量E(Me)≠X有偏估計(jì)量2.一致致性當(dāng)樣本的的單位數(shù)數(shù)充分大大時(shí),樣樣本指標(biāo)標(biāo)充分靠靠近總體體指標(biāo)。。即當(dāng)n無限增加加,樣本本指標(biāo)與與未知的的總體指指標(biāo)之差差的絕對(duì)對(duì)值小于于任意小小的正數(shù)數(shù),它的的可能性性也趨近近于必然然性。對(duì)對(duì)于,當(dāng)n愈多,抽抽樣平均均誤差愈愈接近于于0。3、有效效性要求作為為優(yōu)良估估計(jì)量的的方差應(yīng)應(yīng)該比其其他估計(jì)計(jì)量的方方差小。。例如有有:注意:并并不是所所有的估估計(jì)量都都符合以以上的標(biāo)標(biāo)準(zhǔn)。例例如:在在正態(tài)分分布的情情況下,,總體平平均數(shù)和和中位數(shù)數(shù)是重合合的,樣樣本中位位數(shù)是總總體中位位數(shù)的無無偏和一一致估計(jì)計(jì)量,但但對(duì)比樣樣本平均均數(shù)卻不不是更有有效的估估計(jì)量。。而樣本本平均數(shù)數(shù)卻是總總體中位位數(shù)的優(yōu)優(yōu)良估計(jì)計(jì)量。三、抽樣樣極限誤誤差(△△)總體指標(biāo)標(biāo)是唯一一確定的的值,樣樣本指標(biāo)標(biāo)是圍繞繞著全及及指標(biāo)上上下隨機(jī)機(jī)出現(xiàn)的的變量。。抽樣平均均誤差指指抽樣分分布的標(biāo)標(biāo)準(zhǔn)差,,說明的的是某一一抽樣方方案下所所有可能能樣本的的平均誤誤差情況況,但在抽樣樣推斷實(shí)實(shí)踐中往往往只抽抽取一個(gè)個(gè)樣本,,該樣本本的指標(biāo)標(biāo)數(shù)值與與總體指指標(biāo)數(shù)值值的離差差,可能能為正,,也可能能為負(fù),,該誤差差可能大大于也可可能小于于或者等等于抽樣樣平均誤誤差。因因此,對(duì)對(duì)于一項(xiàng)項(xiàng)抽樣調(diào)調(diào)查,總總是要求求有一個(gè)個(gè)合理的的允許誤誤差范圍圍,這就就是抽樣樣極限誤誤差△。。抽樣極限限誤差的的定義::抽樣極限限誤差:指在進(jìn)行行抽樣估估計(jì)時(shí),,根據(jù)研研究對(duì)象象的變異異程度和和分析任任務(wù)的要要求所確確定的樣本指標(biāo)標(biāo)與總體體指標(biāo)之之間可允允許的最最大誤差差范圍。也稱容許誤差差、可能誤差差。常用△△表示。。它是根據(jù)據(jù)概率理理論,以以一定的的可靠程程度保證證抽樣誤誤差不超超過某一一給定的的范圍△△。1)△是指誤差差范圍△的原意表示示是是以為為中心心,在之之間變變動(dòng)。但但由于全全及指標(biāo)標(biāo)未知,,而樣本本指標(biāo)通通過實(shí)測(cè)測(cè)可得到到。因此此,抽樣樣誤差范范圍的實(shí)實(shí)際意義義是要求求被估計(jì)計(jì)的全及及指標(biāo)落落在抽樣樣指標(biāo)的的一定范范圍內(nèi),,即落在在的的范圍內(nèi)內(nèi)。即:因此,、、P的范圍估估計(jì)(區(qū)區(qū)間估計(jì)計(jì))分別別為:同理得::、2)△是指可可能范圍圍而非肯肯定范圍圍抽樣極限限誤差△△不是唯唯一固定定的,而而是根據(jù)據(jù)抽樣調(diào)調(diào)查的目目的,根根據(jù)人們們希望控控制總體體指標(biāo)的的把握程程度來確確定的。。如果希希望控制制的把握握程度大大些,就就給予△△較大的的值,否否則,△△的給定定值就較較小。這這種把握握程度就就是概率率保證程程度。亦亦即抽樣樣估計(jì)的的可靠程程度,叫叫估計(jì)置信度,習(xí)慣上上也稱為為可靠度、可信程度度、把握程度度或概率保證證程度。四、置信信度、概率度、估計(jì)精度度1.置信度度是估計(jì)計(jì)的可靠靠性問題題置信度:就是表明明抽樣指指標(biāo)和總總體指標(biāo)標(biāo)的誤差差,不超超過一定定范圍((△)的的概率保保證程度度。置信度即即概率保保證程度度:由于抽樣樣指標(biāo)值值隨著樣樣本的變變動(dòng)而變變動(dòng),它它本身是是一個(gè)隨隨機(jī)變量量,因而而抽樣指指標(biāo)和總總體指標(biāo)標(biāo)的誤差差仍然是是一個(gè)隨隨機(jī)變量量,并不不能保證證誤差不不超過一一定范圍圍這個(gè)事事件是必必然事件件,而只只能給以以一定程程度的概概率保證證。因此此,就有有必要來來計(jì)算抽抽樣指標(biāo)標(biāo)和總體體指標(biāo)的的誤差不不超過一一定范圍圍的概率率大小,,即計(jì)算算抽樣指指標(biāo)落在在一定區(qū)區(qū)間范圍圍內(nèi)的概概率,這這種概率率稱之為為抽樣估估計(jì)的置信度。估計(jì)值所所確定的的估計(jì)區(qū)區(qū)間是隨隨機(jī)的,,在實(shí)際際抽樣中中并不能能保證被被估計(jì)的的總體指指標(biāo)值都都落在允允許誤差差范圍內(nèi)內(nèi),這就就產(chǎn)生要要冒多大大風(fēng)險(xiǎn)來來相信所所作的估估計(jì)。例例如:我我們?cè)敢庖饷?0%的風(fēng)風(fēng)險(xiǎn),表表示如果果進(jìn)行多多次重復(fù)復(fù)估計(jì),,則平均均每100次估估計(jì)將有有10次次是錯(cuò)誤誤的,90次是是正確的的,90%就稱稱為置信信度或概概率保證證程度。。2.概率度度(t)反映△的的相對(duì)程程度描述全全部樣本本指標(biāo)與與總體指指標(biāo)的平平均誤差差,而△則是對(duì)對(duì)一個(gè)樣樣本的樣樣本指標(biāo)標(biāo)與總體體指標(biāo)誤誤差的控控制范圍圍,因而而可用來衡量量△。即抽樣極極限誤差差等于t倍的抽樣樣平均誤誤差:t就稱為概概率度。?;蚧蛞虼耍骸鳌怯靡欢ǘū稊?shù)的的表示的的抽樣指指標(biāo)與全全及指標(biāo)標(biāo)之間的的絕對(duì)離離差。t——是指以抽抽樣平均均誤差為尺度度來衡量量的相對(duì)對(duì)誤差范范圍。求t值的過程程,也就就是樣本本變量和和p的標(biāo)準(zhǔn)化化過程。。標(biāo)準(zhǔn)變變量t服從正態(tài)態(tài)分布。。t值大小是是確定正正態(tài)分布布函數(shù)的的決定定因子。。即t是確定概概率保證證程度大大小的指指標(biāo)??煽梢罁?jù)一一定的置置信度,,查標(biāo)準(zhǔn)準(zhǔn)正態(tài)分分布表求求得。概率是概概率度的的函數(shù)::P=F((t)在正態(tài)分分布的情情況下,,從總體體中隨機(jī)機(jī)抽取一一個(gè)樣本本觀察,,則該樣樣本指標(biāo)標(biāo)落在某某一范圍圍內(nèi)內(nèi)的概率率,是用占正正態(tài)曲線線面積的的大小表表示的。。即:正態(tài)分布布及其曲曲線下的的面積圖圖68.27%1-1-295.45%99.73%-323可見隨著著t的不斷增增大,概概率P的數(shù)值也也隨著增增大以致致逐漸接接近于1,使抽抽樣推斷斷達(dá)到完完全可靠靠的程度度。應(yīng)用正態(tài)態(tài)分布曲曲線,把把概率度度t和抽樣誤誤差范圍圍△聯(lián)系系起來,,便可得得到抽樣樣推斷全全及指標(biāo)標(biāo)在一定定范圍內(nèi)內(nèi)的概率率保證程程度。統(tǒng)統(tǒng)計(jì)抽樣樣推斷中中常用的的有:常用概率率度與概概率對(duì)照照表

3.估計(jì)精精度是從從相對(duì)數(shù)數(shù)的角度度說明抽抽樣估計(jì)計(jì)的準(zhǔn)確確程度誤差率=允許誤誤差/估估計(jì)值,,即:估計(jì)精度度=1-誤誤差率,,即:抽樣估計(jì)計(jì)的準(zhǔn)確確性隨著著△的增增大而減減小,它它們之間間呈反方方向變動(dòng)動(dòng)。注意:估計(jì)的準(zhǔn)準(zhǔn)確性與與可靠信信是相互互矛盾的的△與估計(jì)計(jì)準(zhǔn)確性性成反比比關(guān)系,,F(xiàn)(t))與估計(jì)的可可靠性成成正比。。△越大,,準(zhǔn)準(zhǔn)確性性越小,,F(xiàn)(t)越大,可可靠性越越大?!?t【例】(仍用前前面例子子)從總總體5個(gè)個(gè)工人的的日平均均工資中中重復(fù)抽抽取n為2的樣樣本平均均工資的的抽樣分分布如下下表:樣本日平平均工資資

的次次數(shù)分布布表五、抽樣樣估計(jì)方方法以樣本的的平均數(shù)數(shù)作作為總總體平均均數(shù)的的估計(jì)值值。以樣本的的成數(shù)p作為總體體成數(shù)P的估計(jì)值值。(一)點(diǎn)點(diǎn)估估計(jì)(定定值估計(jì)計(jì))——它是直接接以樣本本指標(biāo)的的實(shí)際值值直接作作為相應(yīng)應(yīng)總體參參數(shù)的估估計(jì)值。。例如:點(diǎn)估計(jì)的的特點(diǎn)::優(yōu)點(diǎn):簡(jiǎn)便、易易行、原原理直觀觀,它能能夠提供供總體指指標(biāo)的具具體估計(jì)計(jì)值,可可以作為為行動(dòng)決決策的數(shù)數(shù)量依據(jù)據(jù)。缺點(diǎn):任何點(diǎn)估估計(jì)不是是對(duì)就是是錯(cuò),點(diǎn)點(diǎn)估計(jì)沒沒有表明明抽樣估估計(jì)的誤誤差,更更沒有指指出誤差差在一定定范圍內(nèi)內(nèi)的概率率保證程程度有多多大。統(tǒng)計(jì)學(xué)家家做得比比間諜們們更漂亮亮!由于許多多戰(zhàn)略上上的理由由,盟軍軍非常想想知道二二戰(zhàn)期間間德軍總總共制造造了多少少輛坦克克。德國(guó)國(guó)人在制制造坦克克時(shí)是墨墨守陳規(guī)規(guī)的,他他們把坦坦克從1開始進(jìn)進(jìn)行了連連續(xù)編號(hào)號(hào)。在戰(zhàn)戰(zhàn)爭(zhēng)進(jìn)行行過程中中,盟軍軍繳獲了了一些敵敵軍坦克克,并記記錄了它它們的編編號(hào)。那那么怎樣樣用這些些號(hào)碼來來估計(jì)坦坦克總數(shù)數(shù)呢?統(tǒng)計(jì)學(xué)家家做得比比間諜們們更漂亮亮!我們知道道,制造造出來的的坦克數(shù)數(shù)肯定大大于記錄錄中的最最大編號(hào)號(hào)。因此此,其中中點(diǎn)估計(jì)計(jì)的方法法之一就就是,計(jì)計(jì)算出被被繳獲坦坦克編號(hào)號(hào)的平均均值,并并認(rèn)為這這個(gè)值是是德軍全全部坦克克編號(hào)的的中點(diǎn),,用樣本本均值乘乘以2就就是總數(shù)數(shù)的一個(gè)個(gè)估計(jì)。。從戰(zhàn)后發(fā)發(fā)現(xiàn)的德德軍記錄錄來看,,盟軍估估計(jì)值非非常接近近所生產(chǎn)產(chǎn)坦克的的真實(shí)記記錄。(二)區(qū)區(qū)間估估計(jì)定義:區(qū)間估計(jì)計(jì):就是在在一定的的概率保保證程度度下,選選定概率率度t及抽樣極極限誤差差△=t,再根據(jù)樣樣本指標(biāo)標(biāo)數(shù)值和和△去估估計(jì)總體體指標(biāo)數(shù)數(shù)值所在在的可能能范圍的的一種統(tǒng)統(tǒng)計(jì)推斷斷方法。。估計(jì)區(qū)間間的上下下限:或或置信區(qū)間間:或或置信度:1.根據(jù)據(jù)F(t)求△及置置信區(qū)間間根據(jù)樣本本資料,,計(jì)算出出及或p及。。根據(jù)F(t))查正態(tài)分分布概率率表求t;根據(jù)t與,計(jì)計(jì)算或或,,指出出置信區(qū)區(qū)間為::或【例】對(duì)某魚塘塘進(jìn)行抽抽樣調(diào)查查,從魚魚塘的不不同部位位共網(wǎng)到到魚150條,,其中草草魚123條,,草魚平平均每條條重2公公斤,標(biāo)標(biāo)準(zhǔn)差為為0.75公斤斤。試按95.45%(t=2))的概率保保證程度度,對(duì)對(duì)該魚塘塘草魚平平均每條條重量作作區(qū)間估估計(jì);以同樣的的概率保保證程度度對(duì)該魚魚塘草魚魚所占比比重作區(qū)區(qū)間估計(jì)計(jì)。解①已知:草魚平均均每條重重量的估估計(jì)區(qū)間間為:即[2--0.14,2+0..14]][1.86,2.14]公斤(公斤))=2kg,s=0..75kg,n=123,t=2解②已知:n=150,t=2,p=123/150==82%%則草魚所所占比重重的估計(jì)計(jì)區(qū)間為為:即[82%%-6..27%%,82%+6.27%][75..73%%,88.27%]2.根據(jù)據(jù)給定的的△,求求F(t))抽取樣本本,計(jì)算算出、s,推算出;;根據(jù)△,,估計(jì)出出根據(jù),,求出F(t))隨機(jī)抽取取25畝畝水稻田田,測(cè)得得平均畝畝產(chǎn)為650公公斤,標(biāo)標(biāo)準(zhǔn)差為為75公公斤,求求總體平平均畝產(chǎn)產(chǎn)在620-680公公斤之間間的概率率是多少少?【例】已知,,s=75公斤,n=25【解】所以F(t)=95.45%。。【例】某儲(chǔ)蓄所所6月份共有有存單3000張,為了了解存款款數(shù)量情情況,現(xiàn)現(xiàn)隨機(jī)抽抽取200張進(jìn)行調(diào)調(diào)查,得得結(jié)果如如右表,,試求重重復(fù)抽樣樣條件下下:該儲(chǔ)蓄所所本月存存單平均均存款范范圍(概概率保證證程度為為95.45%));該儲(chǔ)蓄所所本月存存款額在在1000元以上存存單所占占比重范范圍。((概率保保證程度度為95.45%)。該儲(chǔ)蓄所所存單平平均存款款額與標(biāo)標(biāo)準(zhǔn)差計(jì)計(jì)算表①②p=40/200=20%,,則對(duì)我國(guó)某某城市進(jìn)進(jìn)行居民民家庭人人均旅游游消費(fèi)支支出調(diào)查查,隨機(jī)機(jī)抽取400戶居民家家庭,調(diào)調(diào)查得知知居民家家庭人均均年旅游游消費(fèi)支支出為350元,標(biāo)準(zhǔn)準(zhǔn)差為100元,要求求以95%的概率保保證程度度,估計(jì)計(jì)該市人人均年旅旅游消費(fèi)費(fèi)支出額額。解:第一步,,根據(jù)抽抽樣資料料已算得得:樣本戶年年人均消消費(fèi)支出出x=350((元)樣本標(biāo)準(zhǔn)準(zhǔn)差s=100(元),則則第二步,,根據(jù)F(t))=95%,查得t=1..96。。第三步,,計(jì)算則則該市居居民家庭庭年人均均旅游消消費(fèi)支出出額的上上下限為為:結(jié)論:我們可以以95%%得概率率保證程程度,估估計(jì)該市市居民家家庭年人人均旅游游消費(fèi)支支出額在在340.20元—359..80元元之間。。【例】某市電視視臺(tái)為了了解觀眾眾對(duì)某電電視欄目目的喜愛愛程度,,在該市市隨機(jī)對(duì)對(duì)900名居民進(jìn)進(jìn)行調(diào)查查,結(jié)果果有540名喜歡該該電視欄欄目,要要求以90%的概率保保證程度度,估計(jì)計(jì)該市居居民喜歡歡該電視視欄目的的比率。。解:根據(jù)給定定的F(t))=90%,,查表得t=1..64。。結(jié)論:我們可以以概率90%的的保證程程度,估估計(jì)該市市居民對(duì)對(duì)此電視視欄目喜喜愛的比比率在57.33%~~62..67%%之間。。則總體比比率的上上下限為為:第四節(jié)抽抽樣樣組織形形式簡(jiǎn)單隨機(jī)機(jī)抽樣類型抽樣樣等距抽樣樣整群抽樣樣多階段抽抽樣一、簡(jiǎn)單單隨機(jī)抽抽樣簡(jiǎn)單隨機(jī)機(jī)抽樣:又稱為純純隨機(jī)抽抽樣,它它是按照照隨機(jī)原原則直接接從總體體N個(gè)個(gè)體中中抽取n個(gè)個(gè)體作作樣本,,使總體體中的每每個(gè)個(gè)體體都有同同等的機(jī)機(jī)會(huì)被抽抽中。直接抽選法

抽簽摸球法

隨機(jī)數(shù)表法簡(jiǎn)單隨機(jī)抽樣

直接抽選選法是指直接接從調(diào)查查對(duì)象中中隨機(jī)抽抽選。例例如,從從倉(cāng)庫(kù)中中存放的的所有同同類產(chǎn)品品中隨機(jī)機(jī)指定若若干件產(chǎn)產(chǎn)品進(jìn)行行質(zhì)量檢檢驗(yàn);從從糧食倉(cāng)倉(cāng)庫(kù)中不不同的地地點(diǎn)取出出若干糧糧食樣本本進(jìn)行含含雜量、、含水量量的檢驗(yàn)驗(yàn)等。抽簽法即先將全全及總體體各個(gè)單單位按照照某種自自然的順順序編上上號(hào),并并做成號(hào)號(hào)簽,再再把號(hào)簽簽摻合起起來,任任意抽取取所需單單位數(shù),,然后按按照抽中中的號(hào)碼碼取得對(duì)對(duì)應(yīng)的調(diào)調(diào)查單位位加以登登記調(diào)查查。隨機(jī)數(shù)表表是指含有有一系列列組別的的隨機(jī)數(shù)數(shù)字的表表格。簡(jiǎn)單隨機(jī)機(jī)抽樣的的特點(diǎn)是抽樣調(diào)調(diào)查中最最基本的的組織形形式;遵循隨機(jī)機(jī)原則直直接從總總體N個(gè)單位中中抽取n個(gè)單位作作為樣本本;又稱稱為純隨隨機(jī)抽樣樣。簡(jiǎn)單隨機(jī)機(jī)抽樣被被用作評(píng)評(píng)估其他他抽樣策策略的效效率的基基準(zhǔn);;簡(jiǎn)單隨機(jī)機(jī)抽樣最最原始的的抽取方方法是抽抽簽法,最常用的的抽取方方法是利利用《隨隨機(jī)數(shù)表表》或或計(jì)算機(jī)機(jī)生產(chǎn)隨隨機(jī)數(shù)。。簡(jiǎn)單隨機(jī)機(jī)抽樣適適用的情情況:對(duì)調(diào)查對(duì)對(duì)象很少少了解;;總體單位位的排列列沒有秩秩序;均勻總體體。注:前面所討討論的抽抽樣平均均誤差的的計(jì)算公公式就是是簡(jiǎn)單隨隨機(jī)抽樣樣時(shí)的抽抽樣平均均誤差的的公式。。抽樣單位位數(shù)目的的計(jì)算重復(fù)抽樣樣:不重復(fù)抽抽樣:【例】某市開展展職工家家計(jì)調(diào)查查,根據(jù)據(jù)歷史資資料該市市職工家家庭平均均每人年年收入的的標(biāo)準(zhǔn)差差為2400元元,家庭庭消費(fèi)總總支出中中食品消消費(fèi)支出出比重((恩格爾爾系數(shù)))為54%?,F(xiàn)現(xiàn)用重復(fù)復(fù)抽樣方方法,要要求在95.45%的的概率保保證下,,平均收收入的抽抽樣極限限誤差不不超過200元元,恩格格爾系數(shù)數(shù)的抽樣樣極限誤誤差不超超過4%%,請(qǐng)確確定樣本本必要數(shù)數(shù)目。樣本成數(shù)數(shù)的樣本本必要數(shù)數(shù)目:【解】根據(jù)公式式,在重重復(fù)抽樣樣條件下下:樣本平均均數(shù)的樣樣本必要要數(shù)目::關(guān)于抽樣樣單位數(shù)數(shù)目的幾幾點(diǎn)說明明在同樣條條件下,,不重復(fù)復(fù)抽樣比比重復(fù)抽抽樣要求求的抽樣樣單位數(shù)數(shù)目少。。但不重重復(fù)抽樣樣的抽樣樣單位數(shù)數(shù)目計(jì)算算公式比比較復(fù)雜雜。在實(shí)實(shí)際工作作中,一一般當(dāng)n/N的抽樣比比很小時(shí)時(shí)(小于于5%)),為了了簡(jiǎn)化計(jì)計(jì)算,雖雖然采用用不重復(fù)復(fù)抽樣,,也可用用重復(fù)抽抽樣計(jì)算算公式計(jì)計(jì)算抽樣樣單位數(shù)數(shù)目。關(guān)于抽樣樣單位數(shù)數(shù)目的幾幾點(diǎn)說明明同一總體體往往同同時(shí)需要要估計(jì)總總體平均均數(shù)和總總體成數(shù)數(shù),對(duì)二二者可以以分別計(jì)計(jì)算出各各自抽樣樣單位數(shù)數(shù)目,為為了防止止抽樣單單位數(shù)目目的不足足,在實(shí)實(shí)際工作作中,往往往根據(jù)據(jù)抽樣單單位數(shù)目目比較大大的一個(gè)個(gè)數(shù)目進(jìn)進(jìn)行抽樣樣,以滿滿足共同同要求。。即問即答答在重復(fù)抽抽樣情況況下,如如果其它它條件保保持不變變,要使使允許誤誤差范圍圍縮小為為原來的的1/2,則樣樣本單位位數(shù)目需需要擴(kuò)大大為原來來的多少少?反之之,如果果允許誤誤差范圍圍要求擴(kuò)擴(kuò)大為原原來的2倍,抽抽樣單位位數(shù)目又又要如何何變化??二、分類類(層))抽樣類型抽樣樣:它是先先對(duì)總體體各單位位按某種種標(biāo)志分分組,然然后再?gòu)膹母鹘M中中按隨機(jī)機(jī)原則抽抽選一定定單位構(gòu)構(gòu)成樣本本,再對(duì)對(duì)樣本總總體進(jìn)行行觀察。。優(yōu)點(diǎn):能夠提高高樣本的的代表性性,可降低影影響抽樣樣平均誤誤差的方方差。特點(diǎn):是統(tǒng)計(jì)分分組和抽抽樣法的的結(jié)合。。經(jīng)過劃類類分組后后,確定定各類型型組抽樣樣單位數(shù)數(shù)一般有有兩種方方法:不等比例例抽樣。即各類類型組所所抽選的的單位數(shù)數(shù),按各各類型組組標(biāo)志值值的變動(dòng)動(dòng)程度來來確定,,變動(dòng)程程度大的的多抽一一些單位位,變動(dòng)動(dòng)程度小小的少抽抽一些單單位,沒沒有統(tǒng)一一的比例例關(guān)系。。等比例抽抽樣。即按照照樣本單單位數(shù)在在各類之之間分配配的比重重與總體體在各類類之間分分配相同同的比重重進(jìn)行抽抽樣。等比例分分層抽樣樣的抽樣樣平均誤誤差:N=N1+N2+…++NKn=n1+n2+…++nK等比例抽抽樣:分類抽樣樣總的抽抽樣誤差差取決于各各層內(nèi)的的抽樣誤誤差,而各層層內(nèi)的抽抽樣誤差差又取決決于各層層內(nèi)部的的方差和和抽樣數(shù)數(shù)目。重復(fù)抽樣樣條件下下的計(jì)算公公式(平均組組內(nèi)方差差)不重復(fù)抽抽樣條件件下的計(jì)算公公式注意:分層抽樣樣的取決于于各組內(nèi)內(nèi)方差的的平均數(shù)數(shù),而總方差==組內(nèi)方方差的平平均數(shù)++組間方方差,故故分層抽樣樣的小于簡(jiǎn)簡(jiǎn)單隨機(jī)機(jī)抽樣的的。由于總體體方差是是確定數(shù)數(shù),因此此類型抽抽樣分組組(層))時(shí),應(yīng)盡量增增大組((層)間間差異,,縮小組組(層))內(nèi)差異異。提高抽樣樣效果。。不等比例例抽樣根據(jù)各組組中標(biāo)志志變異的的大小確確定適當(dāng)當(dāng)?shù)某闃訕訑?shù)目,,差異程程度大的的組多抽抽一些單單位,差差異程度度小的組組少抽一一些單位位。則例:某鄉(xiāng)全部部糧食耕耕地5000畝畝,按平平原和山山區(qū)分類類抽取630畝畝,計(jì)算算各組平平均畝產(chǎn)產(chǎn)和標(biāo)準(zhǔn)準(zhǔn)差i如下表。。求抽樣樣平均誤誤差。解:三、等距距抽樣(機(jī)械抽抽樣、系系統(tǒng)抽樣樣)等距抽樣樣:是先將總總體單位位按某一一標(biāo)志排排隊(duì),計(jì)計(jì)算出抽抽樣間隔隔,并在在第一個(gè)個(gè)抽樣間間隔內(nèi)確確定一個(gè)個(gè)抽樣起起點(diǎn),再再按固定定的順序序和相同同的間隔隔來抽取取樣本單單位進(jìn)行行觀察的的一種抽抽樣方法法。系統(tǒng)抽樣樣的具體體做法如如下:從N中抽取n個(gè)樣本單單位,可可先排隊(duì)隊(duì),算出出間隔距距離k=N//n,現(xiàn)從第一一至k個(gè)單位中中確定抽抽樣起點(diǎn)點(diǎn)(即第第一個(gè)樣樣本單位位),之之后,每每隔k個(gè)單位抽抽取一個(gè)個(gè)樣本單單位。((圖示如如下:))iNkkki+ki+2ki+(n-1))kkk機(jī)械抽樣樣的優(yōu)點(diǎn)點(diǎn):能提高樣樣本單位位分布的的均勻性性,樣本本代表性性較強(qiáng)。。其要小于于簡(jiǎn)單隨隨機(jī)抽樣樣時(shí)的。樣本單位位的抽取取工作也也比較容容易開展展。無關(guān)標(biāo)志志排隊(duì)::——等距距抽樣據(jù)據(jù)以排隊(duì)隊(duì)的標(biāo)志志與調(diào)查查內(nèi)容沒沒有直接接關(guān)系。。其是按簡(jiǎn)單單隨機(jī)抽抽樣的公公式近似似計(jì)算的的。因?yàn)闊o關(guān)關(guān)標(biāo)志排排隊(duì)的結(jié)結(jié)果,從從所要調(diào)調(diào)查的標(biāo)標(biāo)志來看看,總體體單位的的排列順順序?qū)嶋H際上仍是是隨機(jī)的的。所以以,其抽抽樣起點(diǎn)點(diǎn)i可以隨機(jī)機(jī)確定,,即可以以是第一一個(gè)抽樣樣距離內(nèi)內(nèi)的任一一個(gè)總體體單位::1?i?k,這樣得到到的樣本本完全遵遵循了隨隨機(jī)原則則,不會(huì)會(huì)產(chǎn)生系系統(tǒng)偏差差。而且且抽樣效效果十分分接近簡(jiǎn)簡(jiǎn)單隨機(jī)機(jī)。有關(guān)標(biāo)志志排隊(duì)指據(jù)以排排隊(duì)的標(biāo)標(biāo)志與調(diào)調(diào)查內(nèi)容容有密切切關(guān)系。。由于其排排隊(duì)標(biāo)志志與調(diào)查查內(nèi)容有有密切關(guān)關(guān)系,排排隊(duì)后,,從所要要調(diào)查的的變量來來看,總總體單位位也大致致呈順序序排列。。所以其其抽樣起起點(diǎn)一般般不宜隨隨機(jī)確定定。否則則,若在在第一個(gè)個(gè)抽樣間間隔內(nèi)隨隨機(jī)地抽抽取一個(gè)個(gè)標(biāo)志值值較?。ǎɑ蜉^大大)的單單位作為為抽樣起起點(diǎn),整整個(gè)樣本本勢(shì)必出出現(xiàn)偏低低(或偏偏高)的的系統(tǒng)偏偏差。半距起點(diǎn)點(diǎn)等距抽抽樣(中心系系統(tǒng)抽樣樣)——以第第一個(gè)抽抽樣間隔隔內(nèi)的中中點(diǎn)為抽抽樣起點(diǎn)點(diǎn),并每每隔k個(gè)單位抽抽一個(gè)單單位。優(yōu)點(diǎn)::樣本代代表性高高。不足點(diǎn)::限制了了抽樣的的隨機(jī)性性。對(duì)稱等距距抽樣——在第第一個(gè)抽抽樣間隔隔內(nèi)隨機(jī)機(jī)地確定定抽樣起起點(diǎn)(1?i?k)。然后以組組界[k、2k、3k、…(n-1)k]]為對(duì)稱點(diǎn)點(diǎn)兩邊對(duì)對(duì)稱地抽抽取樣本本單位。。如下圖圖所示::依次抽抽取的樣樣本單位位序號(hào)分分別為i、2k+i、、2k--i、4k+i、、4k-i、6i+i、、6k--i、、…iNk(n-1)k2k3knk2K-i2K+i有關(guān)標(biāo)志志排隊(duì)等等距抽樣樣的計(jì)算::有關(guān)標(biāo)志志排隊(duì)等等距抽樣樣相當(dāng)于于分層較較多(將將總體分分為同等等大小的n個(gè)層),,而每層層只抽取取一個(gè)調(diào)調(diào)查單位位的特殊殊分層抽抽樣,所所以其抽抽樣效果果類似于于分層抽抽樣,其一般按按分層抽抽樣的抽抽樣平均均誤差公公式來近近似計(jì)算算。注意:等距抽樣樣需要有有總體的的輔助信信息,以以便于進(jìn)進(jìn)行單位位的排序序;等距抽樣樣要避免免抽樣間間隔和現(xiàn)現(xiàn)象本身身的周期期、節(jié)奏奏重合而而引起的的系統(tǒng)性性偏差。。工業(yè)產(chǎn)品品質(zhì)量檢檢查時(shí),,抽樣時(shí)時(shí)間間隔隔不宜與與上下班班或交接接班時(shí)間間一致。。例如:四、整群群抽樣(集團(tuán)抽抽樣)整群抽樣樣:是將總總體全部部單位分分為若干干部分((每一部部分稱為為一個(gè)群群體,簡(jiǎn)簡(jiǎn)稱群)),然后后以群為為單位,,按隨機(jī)機(jī)原則從從中抽取取若干個(gè)個(gè)群構(gòu)成成樣本,,對(duì)中選選群內(nèi)的的所有單單位進(jìn)行行全面調(diào)調(diào)查的抽抽樣方法法。整群抽樣樣的特點(diǎn)點(diǎn):整群抽樣樣直接抽抽取的不不是總體體中的個(gè)個(gè)體而是是“群””,因此此總體和和樣本是是由“群群”組成成的??傮w中的的每一群群所包含含的單位位數(shù)有每每一群的的單位數(shù)數(shù)相等和和不盡相相等兩種種情況。。影響抽樣樣誤差的的方差是是群間方方差,群群內(nèi)方差差不影響響抽樣誤誤差。整群抽樣樣是不重重復(fù)抽樣樣,應(yīng)該該用不重重復(fù)抽樣樣公式計(jì)計(jì)算抽樣樣平均誤誤差。整群抽樣樣的優(yōu)點(diǎn)點(diǎn):由于是對(duì)對(duì)中選群群的全面面調(diào)查,,抽樣單單位比較較集中,,所以整整群抽樣樣能大大大降低數(shù)數(shù)據(jù)收集集的費(fèi)用用;當(dāng)總體中中個(gè)體自自然聚合合成群((例如::住戶、、學(xué)校))時(shí),整整群抽樣樣組織更更加方便便;如果對(duì)于于調(diào)查變變量而言言,群內(nèi)內(nèi)單元差差異較大大,而不不同群的的差異較較小,整整群抽樣樣比簡(jiǎn)單單隨機(jī)抽抽樣的效效率更高高(例如如為估計(jì)計(jì)性別比比采用按按戶的整整群抽樣樣)。。整群抽樣樣的缺點(diǎn)點(diǎn):對(duì)調(diào)查變變量,若若群內(nèi)個(gè)個(gè)體有趨趨同性,,則整群群抽樣的的抽樣效效率比簡(jiǎn)簡(jiǎn)單隨機(jī)機(jī)抽樣低低,(這這正是通通常遇到到的情況況),但但對(duì)此項(xiàng)項(xiàng)效率的的損失可可通過增增加群的的抽取個(gè)個(gè)數(shù)來彌彌補(bǔ);通常無法法提前控控制總樣樣本量,,因?yàn)樵谠谶M(jìn)行調(diào)調(diào)查前,,我們通通常不知知道一個(gè)個(gè)群內(nèi)到到底有多多少個(gè)個(gè)個(gè)體;抽樣誤差差的計(jì)算算可能比比簡(jiǎn)單隨隨機(jī)抽樣樣更為復(fù)復(fù)雜。整群抽樣樣的取決于于2的大小整群抽樣樣對(duì)中選選群進(jìn)行行全面調(diào)調(diào)查,其其樣本代代表性取取決于抽抽中群體體對(duì)全部部群體的的代表性性。假設(shè)設(shè)各群體體之間沒沒有差異異(即各各群體的的內(nèi)部結(jié)結(jié)構(gòu)完全全相同)),則抽抽樣誤差差為0。??梢姡?,整群抽樣樣的取決于于群間差差異程度度的大小小,而不受受群體內(nèi)內(nèi)部差異異程度的的影響。。整群抽樣樣的原則則是:使使群間方方差盡可可能小,,群內(nèi)方方差盡可可能大。。整群抽樣樣的計(jì)算::總體未知知時(shí)可用用樣本指指標(biāo)替代代。其中:例:某市保險(xiǎn)險(xiǎn)公司要要調(diào)查居居民家庭庭財(cái)產(chǎn)情情況。該該保險(xiǎn)公公司調(diào)查查組把該該市的街街道作為為群,全全市共100個(gè)個(gè)街道,,共100群。。隨機(jī)抽抽選了18個(gè)街街道(18群))進(jìn)行了了調(diào)查。。調(diào)查結(jié)結(jié)果樣本本平均數(shù)數(shù)(樣本本中居民民平均家家庭財(cái)產(chǎn)產(chǎn)數(shù))為為40000元元,樣本本群間方方差為((5100元))2。試以95.45%的的置信度度估計(jì)全全市平均均家庭財(cái)財(cái)產(chǎn)數(shù)。。解:已知:,R=100,r=18,t==2則:置信區(qū)間間:五、多階階段抽樣樣(多級(jí)抽抽樣)多階段抽抽樣:它是先先從總體體中抽取取一級(jí)單單位,再再?gòu)囊患?jí)級(jí)單位中中抽取二二級(jí)單位位……如如此下去去,最后后才抽取取所要調(diào)調(diào)查的基基本單位位的一種種抽樣形形式。優(yōu)點(diǎn):是比整整群抽樣樣靈活,,在樣本本容量相相同的條條件下,,多階段段抽樣的的樣本單單位在總總體中的的散布比比整群抽抽樣均勻勻。此外外,它還還可以利利用現(xiàn)成成的行政政區(qū)劃組組織系統(tǒng)統(tǒng)作為劃劃分各階階段的依依據(jù)。缺點(diǎn):調(diào)查結(jié)結(jié)果的精精確性不不太高,,計(jì)算、、分析比比較復(fù)雜雜。以兩階段段抽樣為為例兩階段抽抽樣在組組織技術(shù)術(shù)上是整整群抽樣樣和類型型抽樣的的綜合。。先將總總體分為為R群,每群群包含Mi個(gè)單位,,假定N=M1+M2+M3++MR=RM,n1=m1+m2+m3++mro=rm。在每個(gè)階階段都是是隨機(jī)抽抽取樣本本,都會(huì)會(huì)產(chǎn)生隨隨機(jī)誤差差,因此此計(jì)算時(shí)要綜綜合兩階階段的誤誤差。以xij表示第i樣本群第第j個(gè)樣本單單位的標(biāo)標(biāo)志值::第一階段段抽樣平平均數(shù)的的方差為為:第二階段段抽樣平平均數(shù)的的方差為為:兩階段抽抽樣平均均誤差為為:或者第五節(jié)必必要抽抽樣數(shù)目目的確定定必要抽樣樣數(shù)目:是指為了了完成抽抽樣調(diào)查查任務(wù),,滿足抽抽樣調(diào)查查的各項(xiàng)項(xiàng)要求,,也就是是為了保保證抽樣樣推斷能能達(dá)到預(yù)預(yù)期的可可靠程度度和精確確度的要要求,而而科學(xué)計(jì)計(jì)算的需需要抽取取的樣本本單位數(shù)數(shù)。即樣樣本單位位數(shù)“n”的具體數(shù)數(shù)值,也也叫樣本容量量。一、影響響必要抽抽樣數(shù)目目的因素素總體各單單位間的的標(biāo)志變變異程度度極限抽樣樣誤差的的大小調(diào)查結(jié)果果的概率率保證程程度抽樣方法法和抽樣樣的組織織形式。。二、必要要抽樣數(shù)數(shù)目的計(jì)計(jì)算抽樣方法平均數(shù)成數(shù)重復(fù)抽樣不重復(fù)抽樣(一)簡(jiǎn)簡(jiǎn)單隨機(jī)機(jī)抽樣方方式下的的n【例】1:某市對(duì)職職工收入入抽樣調(diào)調(diào)查,已已知職工工平均每每人每月月收入的的標(biāo)準(zhǔn)差差為220元,,要求把把握度為為95..45%%,允許許誤差為為15元元,則需需抽查人人數(shù)為::【例】2:調(diào)查一批批帳單的的差錯(cuò)率率。根據(jù)據(jù)以往的的資料,,差錯(cuò)率率曾有過過1%,,3%,,5%三三種情況況?,F(xiàn)在在要求把把握度為為95%%,允許許誤差為為1%,,則需抽抽查的帳帳單數(shù)為為:抽樣方法平均數(shù)成數(shù)重復(fù)抽樣不重復(fù)抽樣(二)類型型抽樣方方式下的的n(三)等等距抽樣樣方式下下的n等距抽樣樣一般都都采用不不重復(fù)抽抽樣的方方式,按按無關(guān)標(biāo)標(biāo)志排隊(duì)隊(duì)的抽樣樣,用簡(jiǎn)簡(jiǎn)單隨機(jī)機(jī)不重復(fù)復(fù)抽樣公公式確定定樣本容容量;按按有關(guān)標(biāo)標(biāo)志排序序的抽樣樣,用類類型不重重復(fù)抽樣樣公式確確定樣本本容量((公式從從略)。。(四)整整群抽樣樣方式下下的n整群抽樣樣一般采采用不重重復(fù)抽樣樣,它的的必要抽抽樣數(shù)目目的計(jì)算算公式和和簡(jiǎn)單隨隨機(jī)抽樣樣的計(jì)算算公式從從結(jié)構(gòu)上上講基本本上是一一致的。。其不同同之處有有兩個(gè)方方面:一一是標(biāo)志志變異指指標(biāo)不同同。簡(jiǎn)單單隨機(jī)條條件下必必要抽樣樣數(shù)目計(jì)計(jì)算公式式中的標(biāo)標(biāo)志變異異指標(biāo)是是總體方方差。而而整群抽抽樣條件件下的計(jì)計(jì)算公式式是群間間方差。。二是采采用的單單位數(shù)目目不同。。簡(jiǎn)單隨隨機(jī)抽樣樣公式中中總體單單位數(shù)和和樣本單單位數(shù)分分別用N、n表示。而而整群抽抽樣公式式中總體體群數(shù)和和抽樣群群數(shù)分別別用R、r表示。其其計(jì)算公公式為::整群抽樣樣要計(jì)算算必要抽抽取的群群數(shù)r三、確定定n應(yīng)該注意意的問題題必要抽樣樣數(shù)目應(yīng)應(yīng)大于30。實(shí)際調(diào)查查時(shí)可對(duì)對(duì)計(jì)算的的必要抽抽樣數(shù)目目進(jìn)行調(diào)調(diào)整當(dāng)總體單單位數(shù)不不大時(shí),,如果采采用不重重復(fù)抽樣樣的方法法抽取樣樣本,必必須應(yīng)用用不重復(fù)復(fù)抽樣的的計(jì)算公公式計(jì)算算必要抽抽樣數(shù)目目;當(dāng)總總體單位位數(shù)很大大時(shí),雖雖然采用用不重復(fù)復(fù)抽樣方方法,亦亦可采用用重復(fù)抽抽樣的計(jì)計(jì)算公式式計(jì)算必必要抽樣樣數(shù)目。。當(dāng)抽樣調(diào)調(diào)查是為為了檢驗(yàn)驗(yàn)全面統(tǒng)統(tǒng)計(jì)數(shù)字字的質(zhì)量量時(shí),全全及總體體的標(biāo)志志變異指指標(biāo)或或p(1––p)是有實(shí)際際資料的的,可以以直接代代入公式式計(jì)算必必要抽樣樣數(shù)目。。如有幾個(gè)個(gè)方差可可以選用用時(shí),宜宜選擇最最大數(shù)值值。一個(gè)總體體往往同同時(shí)計(jì)算算抽樣平平均數(shù)和和抽樣成成數(shù)。由由于它

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論