版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、經(jīng)濟(jì)管理類專業(yè)應(yīng)用型本科教材統(tǒng) 計(jì) 學(xué) 電子工業(yè)出版社出版 主編 杜家龍第八章 抽 樣 推 斷 教學(xué)目的 掌握抽樣推斷的基本原理和常用組織方式,理解抽樣推斷的基本概念和特點(diǎn),能夠選擇適當(dāng)抽樣方式、確定必要樣本容量、組織抽樣調(diào)查、計(jì)算樣本指標(biāo)和抽樣誤差,熟練、準(zhǔn)確地應(yīng)用樣本指標(biāo)推斷總體指標(biāo)。 重點(diǎn)難點(diǎn)抽樣原理和抽樣平均誤差的分布規(guī)律和計(jì)算方法。簡(jiǎn)單隨機(jī)抽樣、類型抽樣理論和方法。第一節(jié)抽樣推斷基本原理一、抽樣推斷的概念和特點(diǎn) 所謂抽樣推斷,是指按照隨機(jī)原則從調(diào)查總體中抽取一部分單位組成樣本進(jìn)行統(tǒng)計(jì)觀察和計(jì)算,并根據(jù)所得樣本指標(biāo),在一定把握程度下,對(duì)調(diào)查總體相應(yīng)指標(biāo)作出估計(jì)和判斷。 抽樣推斷具有以下
2、五個(gè)特點(diǎn):第一,在抽取調(diào)查單位時(shí)遵循隨機(jī)原則;第二,在取得調(diào)查結(jié)果時(shí)用部分估計(jì)總體;第三,在推斷手段上使用概率估計(jì)方法;第四,抽樣推斷誤差可以計(jì)算和控制;第五,抽樣推斷以中心極限定理為基礎(chǔ)。 二、抽樣推斷的基本范疇 抽樣推斷中常用的基本范疇(或稱概念)主要有全及總體與樣本總體、全及指標(biāo)(或稱參數(shù))與樣本指標(biāo)(或稱統(tǒng)計(jì)量)、重復(fù)抽樣與不重復(fù)抽樣等。 (一)全及總體與樣本總體 全及總體指所研究現(xiàn)象的整體,即研究對(duì)象所有單位組成的總體。全及總體單位數(shù)通常是很大的,常用N表示。 樣本總體,是指在抽樣調(diào)查中從全及總體中抽取的那部分單位組成的總體。例如上述調(diào)查中抽取的100名學(xué)生就構(gòu)成樣本總體。樣本總體單
3、位數(shù)(或稱樣本容量)常用n表示,上例中n=100。 例如,從10000名學(xué)生中抽取100人進(jìn)行生活消費(fèi)調(diào)查,以計(jì)算學(xué)生月平均生活消費(fèi)額,則全及總體單位數(shù) N=10000。 (二)全及指標(biāo)與樣本指標(biāo) 1.全及指標(biāo)(參數(shù))根據(jù)全及總體全部單位的數(shù)據(jù)計(jì)算的指標(biāo)稱全及指標(biāo)(或參數(shù))。全及指標(biāo)是客觀存在的常數(shù),在抽樣推斷中常用的全用指標(biāo)主要有全及平均數(shù) ,全及成數(shù)P,全及方差 和全及標(biāo)準(zhǔn)差 等。(1)全及平均數(shù)設(shè)全及總體某一變量值為則有: (2)全及成數(shù) 設(shè)全及總體N個(gè)單位中具有某種屬性單位和N1,其余N0個(gè)單位不具有該種屬性,且有N1+N0=N,則稱具某種屬性的單位在全及總體中年占比重P為全及成數(shù),即
4、:,令則, (3)總體方差和標(biāo)準(zhǔn)差 總體平均數(shù)的方差和標(biāo)準(zhǔn)差:總體成數(shù)(比率)的方差和標(biāo)準(zhǔn)差: .樣本指標(biāo)(統(tǒng)計(jì)量) 根據(jù)樣本各單位變量值或品質(zhì)屬性計(jì)算的反映樣本特征的統(tǒng)計(jì)數(shù)據(jù)稱為樣本指標(biāo)或稱統(tǒng)計(jì)量。與全及指標(biāo)相對(duì)應(yīng),樣本指標(biāo)主要有樣本平均數(shù) ,樣本成數(shù) ,又稱樣本比率或比重,樣本方差 和樣本標(biāo)準(zhǔn)差 等。(1)樣本平均數(shù)設(shè) 為樣本的某一變量,其n項(xiàng)變量值為則:或(2)樣本成數(shù)(比率)設(shè)樣本總體 個(gè)單位中,具有某種屬性的單位有 其余 個(gè)單位不具有該種屬性,且則稱具有某種屬性的單位在樣本總體中所占比重為樣本成數(shù),即:,令,則:,(3)樣本方差和標(biāo)準(zhǔn)差 樣本平均數(shù)的方差和標(biāo)準(zhǔn)差:樣本成數(shù)(比率)的方
5、差和標(biāo)準(zhǔn)差: (三)重復(fù)抽樣與不重復(fù)抽樣 1.重復(fù)抽樣重復(fù)抽樣又稱有放回抽樣或重置抽樣。它是從 個(gè)單位的總體中抽取 個(gè)單位組成樣本,每次從總體中抽取一個(gè)單位并登記其有關(guān)標(biāo)志信息后,再放回總體中參加下一次抽取,直至抽取 個(gè)單位為止。這樣總體單位數(shù)不變,每次抽取一個(gè)單位時(shí)總體中的所有單位都有同等被抽中的機(jī)會(huì),但是有重復(fù)抽取的可能。 根據(jù)研究目的和研究對(duì)象的特點(diǎn)不同,重復(fù)抽樣又有考慮順序與不考慮順序兩種情況。 (1)考慮順序的重復(fù)抽樣 考慮順序的重復(fù)抽樣就是可重復(fù)排列。一般地,從 個(gè)不同單位的總體中,隨機(jī)有放回地抽取 個(gè)單位組成樣本,其全部可能的樣本數(shù)目為 個(gè)。如從1、2、3、4、5 五個(gè)數(shù)字中隨機(jī)
6、取兩個(gè)組成兩位數(shù),可組成 個(gè)兩位數(shù),它們是:11 12 13 14 15 21 22 23 24 25 31 32 33 34 35 41 42 43 44 45 51 52 53 54 55 (2)不考慮順序的重復(fù)抽樣不考慮順序的重復(fù)抽樣就是可重復(fù)組合。一般地,從 個(gè)不同單位的總體中,隨機(jī)有放回地抽取 個(gè)單位組成樣本,其全部可能的樣本數(shù)目為 個(gè)。如從A、B、C、D四個(gè)字母中隨機(jī)取兩個(gè)組成代碼,在不考慮順序(只要元素相同就認(rèn)為是同一個(gè)樣本)的情況下可組成 個(gè)代碼,它們是:AA AB AC AD BB BC BD CC CD DD 2.不重復(fù)抽樣 不重復(fù)抽樣又稱無放回抽樣或不重置抽樣。它是從 個(gè)
7、不同單位的總體中隨機(jī)抽取 個(gè)單位組成樣本,每次從總體中抽取一個(gè)單位,連續(xù) 次抽取構(gòu)成一個(gè)樣本。但每次抽取一個(gè)單位登記其有關(guān)標(biāo)志信息后,不再放回總體中參加下一次抽取,每個(gè)單位只有一次被抽選的機(jī)會(huì),因而不會(huì)出現(xiàn)重復(fù)抽取的情況。不重復(fù)抽樣也有考慮順序與不考慮順序兩種情況。(1)考慮順序的不重復(fù)抽樣考慮順序的不重復(fù)抽樣就是不重復(fù)排列。一般地,從 個(gè)不同單位的總體中,隨機(jī)無放回地抽取 個(gè)單位組成樣本,其全部可能的樣本有 個(gè),如從A、B、C、D四個(gè)字母中隨機(jī)不重復(fù)抽取兩個(gè)組成代碼,可組成的沒有重復(fù)字母的代碼共有12個(gè),即 : ,這些代碼是:AB AC AD BA BC BD CA CB CD DA DB
8、DC (2)不考慮順序的不重復(fù)抽樣 不考慮順序的不重復(fù)抽樣就是不重復(fù)組合。一般地,從 個(gè)不同單位的總體中,隨機(jī)無放回地抽取 個(gè)單位組成樣本,其全部可能的樣本數(shù)目為 個(gè)。如從A、B、C、D四個(gè)字母中隨機(jī)不重復(fù)抽取兩個(gè)組成代碼,可組成的沒有重復(fù)且字母不同的代碼為 個(gè) ,它們是:AB AC AD BC BD CD三、抽樣推斷的數(shù)理基礎(chǔ) (一)大數(shù)定理 大數(shù)定理,就是關(guān)于大量隨機(jī)現(xiàn)象具有穩(wěn)定性質(zhì)的定理。它表明,如果被研究總體由大量相互獨(dú)立的隨機(jī)因素構(gòu)成,而且每個(gè)因素對(duì)總體的影響都相對(duì)地小,那么,由于綜合平衡的結(jié)果,因素的個(gè)別影響將相互抵消,從而顯現(xiàn)出它們共同作用的傾向,使總體具有穩(wěn)定的性質(zhì)。 大數(shù)定理
9、表明:如果隨機(jī)變量總體存在有限的平均數(shù)和方差,則對(duì)于充分大的抽樣單位數(shù) ,可以幾乎趨近于的概率期望抽樣平均數(shù)與總體平均數(shù)的絕對(duì)離差為任意小,即對(duì)任意小的正數(shù) 有:式中: 為樣本平均數(shù); 為總體平均數(shù); 為抽樣單位數(shù)(樣本容量)。 (二)正態(tài)分布 1.正態(tài)分布的概念 當(dāng)我們研究的變量是連續(xù)變量時(shí),無法將變量值一一列出來表示它們的概率分布,而事實(shí)上在這種情況下,每一點(diǎn)的概率都接近于0,求某一點(diǎn)的概率意義不大。通常我們?nèi)デ笞兞柯湓谀骋粎^(qū)間的概率,用分布函數(shù) 來描述概率分布情況,通過一個(gè)函數(shù) 把它表示成積分的形式: 函數(shù) 稱為密度函數(shù),它表示隨機(jī)變量在 點(diǎn)概率密度,在圖形上則表示為各點(diǎn)概率大小的曲線,
10、 表示 在 區(qū)間上所圍成的面積,用它來反映 落在這一區(qū)間內(nèi)的概率,如圖6-1所示。圖6-1 正態(tài)分布曲線圖2.正態(tài)分布密度函數(shù)式中: 為隨機(jī)變量; e為自然對(duì)數(shù)的底數(shù);e=2.718281828; 為圓周率; =3.141592654; 為 的平均數(shù); 為變量的標(biāo)準(zhǔn)差; 和 是決定密度函數(shù)的兩個(gè)參數(shù)。 3.關(guān)于密度函數(shù) 的兩個(gè)參數(shù) 平均數(shù) 和標(biāo)準(zhǔn)差 對(duì)密度函數(shù) 來說,是兩個(gè)重要參數(shù),當(dāng) 和 確定了, 也就確定了,并且平均數(shù) 和標(biāo)準(zhǔn)差 對(duì)密度函數(shù) 的影響是不同的。(1)平均數(shù) 對(duì)密度函數(shù) 的影響平均數(shù) 的變動(dòng)不改變正態(tài)分布的形狀,只改變正態(tài)分布的中心位置,如圖6-2所示。 圖6-2當(dāng)平均數(shù) 時(shí),
11、密度函數(shù)的頻率線以 軸為對(duì)稱軸兩邊對(duì)稱展開; 當(dāng)平均數(shù) 時(shí),密度函數(shù)的頻率線向右平移a個(gè)單位; 當(dāng)平均數(shù) 時(shí),密度函數(shù)的頻率線向右平移a個(gè)單位。 (2)標(biāo)準(zhǔn)差 對(duì)密度函數(shù) 的影響 標(biāo)準(zhǔn)差 的變動(dòng)不改變正態(tài)分布的中心位置,只改變分布曲線的“胖”、“瘦”、“高”、“矮”程度,如圖6-3。圖6-3 當(dāng) 時(shí),把密度函數(shù)的分布稱為標(biāo)準(zhǔn)正態(tài)分布; 當(dāng) 時(shí),分布曲線變“瘦”,中心高度則增長(zhǎng)一倍,表示變量分布比較集中; 當(dāng) 時(shí),分布曲線變“胖”,中心高度則縮短一半,表示變量分布比較分散。 4.正態(tài)分布密度函數(shù)的幾個(gè)特點(diǎn)(1)對(duì)稱性,即密度函數(shù) 的頻率曲線以 為中心,兩邊完全對(duì)稱向左向右延伸。(2)非負(fù)性,即
12、在上方。(3)當(dāng) 時(shí),密度函數(shù) 為最大值。(4)當(dāng) 時(shí),此處是密度函數(shù)的拐點(diǎn),即離平均數(shù) 左方一個(gè) 處頻率曲線趨勢(shì)由凹向變?yōu)橥瓜颍缓蟮搅似骄鶖?shù) 右方一個(gè) 處,頻率曲線趨勢(shì)又恢復(fù)為凹向。(5)當(dāng) 時(shí),密度函數(shù) ,頻率曲線向兩邊下垂,以 軸為漸近線伸向無窮處。5.變量落在某一區(qū)間的概率有了概率分布的密度函數(shù) ,就可以利用不定積分的形式,來表達(dá)分布函數(shù) ,并計(jì)算變量落在某一區(qū)間的概率。正態(tài)分布的分布函數(shù)為: 它表示變量 落在 的概率,它是由密度函數(shù) 與 軸在 區(qū)間所圍成的面積 ,如圖8-1所示。 我們可以利用兩個(gè)積分的差數(shù)來表示變量 落在區(qū)間 內(nèi)的概率,如圖6-4(a)密度函數(shù) 與 軸在區(qū)間 所圍
13、成的陰影面積所示。同樣,也可以利用分布函數(shù)來求變量 與 值之差的絕對(duì)值不超過某數(shù)a的概率。即:圖6-4(b) 圖6-4(a) 如圖6-4(b),密度函數(shù) 與 軸在區(qū)間 所圍成的陰影面積。 6.正態(tài)分布的應(yīng)用 由于利用正態(tài)分布函數(shù)求一定區(qū)間的定積分值很復(fù)雜,因而人們通常是利用已編制的標(biāo)準(zhǔn)正態(tài) 分布表去求正態(tài)概率值。實(shí)踐中,我們通常需要首先將非標(biāo)準(zhǔn)正態(tài)分布加以標(biāo)準(zhǔn)化,使其變?yōu)槠骄鶖?shù)等于,標(biāo)準(zhǔn)差等于的標(biāo)準(zhǔn)正態(tài)分布。為此,引進(jìn)新變量 ,并令 ,則:所以,標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)為:標(biāo)準(zhǔn)正態(tài)分布分布函數(shù)為:標(biāo)準(zhǔn)正態(tài)分布變換的意義是將頻率曲線的中心移至原點(diǎn),使 ,并將 的絕對(duì)離差化為以 為單位表示的相對(duì)離差
14、。利用標(biāo)準(zhǔn)正態(tài)分布函數(shù) ,我們可以計(jì)算變量 落在區(qū)間 之間的概率。其步驟如下: 第一,將原給定的變量標(biāo)準(zhǔn)化,即將原變量變換成新的標(biāo)準(zhǔn)變量 , ; 第二,將原來的定積分區(qū)間 變換成相應(yīng)的新區(qū)間:即 也就是所求的 落在 的概率等價(jià)于 落在區(qū)間 的概率,從而有如下關(guān)系: 第三,從標(biāo)準(zhǔn)正態(tài)分布概率表中找出 對(duì)應(yīng)的 就是我們所求的概率。 例8.1 已知某地小麥畝產(chǎn)量服從正態(tài)分布,平均畝產(chǎn)為600公斤,標(biāo)準(zhǔn)差為40公斤,求畝產(chǎn)在580626公斤之間的麥地所占比例。解:根據(jù)正態(tài)分布標(biāo)準(zhǔn)化要求,令:根據(jù)題意要求 落在 區(qū)間的概率,這里 公斤,所以新變量 的區(qū)間相應(yīng)為:當(dāng),查概率表得: 即有48.43%的麥地畝
15、產(chǎn)量在580626公斤之間。 例6.2 某服裝廠經(jīng)調(diào)查得知市場(chǎng)某種男裝需求量為50000件,消費(fèi)者平均身高為172cm, 身高標(biāo)準(zhǔn)差為5cm,問身高在170180cm之間的服裝應(yīng)制作多少套? 解:根據(jù)正態(tài)分布標(biāo)準(zhǔn)化要求應(yīng)有:查概率表得:身高在170180cm之間的服裝應(yīng)制作: 500000.8904=44520(套)表6.1 常用t值和對(duì)應(yīng)的概率F(t)1.001.501.651.962.002.503.000.68270.86640.90110.95000.95450.98760.9973 (三)中心極限定理 中心極限定理是闡述隨機(jī)變量的極限分布是正態(tài)分布的一系列理論的總稱。一般地,如果一個(gè)
16、隨機(jī)變量是由大量相互獨(dú)立的隨機(jī)因素的影響所造成,而每個(gè)因素的作用又是很微小的,那么這一隨機(jī)變量趨于正態(tài)分布。中心極限定理告訴我們: 第一,如果總體很大且服從正態(tài)分布,則樣本平均數(shù)的分布也服從正態(tài)分布。 第二,如果總體很大但不服從正態(tài)分布,只要樣本足夠大(樣本容量 ),樣本平均數(shù)的分布也趨近于正態(tài)分布。 第三,樣本平均數(shù)的平均數(shù)等于總體平均數(shù),即 。 第四,樣本分布的標(biāo)準(zhǔn)差等于總體標(biāo)準(zhǔn)差的 ,即 (式中 為樣本標(biāo)準(zhǔn)差, 為總體標(biāo)準(zhǔn)差, 為樣本容量)。 例6.3 某高校分析新生體檢結(jié)果資料,得到其中某項(xiàng)指標(biāo)的均值為10,標(biāo)準(zhǔn)差為4,從該批參加體檢的新生中隨機(jī)抽取35人作為樣本,試計(jì)算:(1)樣本均
17、值大于11的概率;(2)樣本均值小于10.5的概率;(3)樣本均值在11和10.5之間的概率。 解:因?yàn)榕c人體有關(guān)很多變量都服從正態(tài)分布,樣本容量為35屬于大樣本,由中心極限定理可知它的分布近似于平均數(shù) 、標(biāo)準(zhǔn)差 的正態(tài)分布,即 附正態(tài)概率表:第二節(jié) 抽樣誤差一、抽樣誤差的概念及影響因素 (一)抽樣誤差的概念 抽樣推斷不可避免產(chǎn)生誤差。抽樣誤差就是抽樣估計(jì)值與被估計(jì)的總體指標(biāo)之差。抽樣誤差可分為登記性誤差和代表性誤差兩大類。 登記性誤差是指在調(diào)查過程中由于登記上的差錯(cuò)所造成的誤差。 代表性誤差是指由于樣本不足以代表總體特征而產(chǎn)生的誤差。代表性誤差的產(chǎn)生也有兩種情況: 一是由于違反隨機(jī)抽樣原則而
18、造成的偏差,稱系統(tǒng)性偏誤。系統(tǒng)性誤差與登記性誤差是抽樣組織工作的問題,可以采取措施預(yù)防或減少它。 二是在遵循隨機(jī)原則的情況下,由于被選擇的樣本內(nèi)部各單位被研究標(biāo)志的構(gòu)成比例和總體不可能完全一致而形成的隨機(jī)性誤差。該種誤差在抽樣推斷中是無法消除的,抽樣推斷理論所研究的抽樣誤差,主要是這種誤差。 (二)影響抽樣誤差的主要因素 影響抽樣誤差大小的因素,主要有以下四種: 第一,總體變量差異程度的大小。在其他條件不變的情況下,總體變量離散程度( 或 )越大,抽樣誤差( 或 )越大,反之則抽樣誤差越??; 第二,樣本單位數(shù)(樣本容量)的多少。在其他條件不變的情況下,樣本單位數(shù) 越小,抽樣誤差( 或 )越大,
19、反之則抽樣誤差越小。如果樣本單位數(shù)多到接近總體單位數(shù)時(shí),抽樣誤差就會(huì)縮小到幾乎沒有的程度。 第三,抽樣方法。抽樣方法有重復(fù)抽樣和不重復(fù)抽樣兩種,一般來說,重復(fù)抽樣的抽樣誤差要大于不重復(fù)抽樣的抽樣誤差。 第四,抽樣組織方式。在樣本容量和抽樣方法相同的條件下,不同抽樣組織會(huì)產(chǎn)生不同的抽樣誤差。一般來說,簡(jiǎn)單隨機(jī)抽樣、整群抽樣誤差較大,類型抽樣、等距抽樣等抽樣組織方式下,抽樣誤差要小一些。二、抽樣平均誤差 (一)抽樣平均誤差的概念 抽樣平均誤差就是樣本平均數(shù)(樣本成數(shù))的標(biāo)準(zhǔn)差,它可反映樣本平均數(shù)(樣本成數(shù))與總體平均數(shù)(總體成數(shù))的平均誤差。 由于樣本是按隨機(jī)原則抽取的,從一個(gè)總體可以抽取許多同樣
20、單位數(shù)的樣本,每個(gè)樣本都有自己的樣本平均數(shù)和成數(shù),一系列的樣本平均數(shù)(樣本成數(shù))就可以計(jì)算樣本平均數(shù)(樣本成數(shù))的平均數(shù)和標(biāo)準(zhǔn)差。又因?yàn)闃颖酒骄鶖?shù)(樣本成數(shù))的平均數(shù)就等于總體平均數(shù)(總體成數(shù)),因而樣本平均數(shù)(樣本成數(shù))的標(biāo)準(zhǔn)差實(shí)際上就反映了樣本平均數(shù)(樣本成數(shù))與總體平均數(shù)(總體成數(shù))的平均誤差。 (二)抽樣平均誤差的計(jì)算 1.樣本平均數(shù)抽樣平均誤差的計(jì)算 (1)重復(fù)抽樣下,樣本平均數(shù)抽樣平均誤差計(jì)算 若設(shè)樣本平均數(shù)的抽樣平均誤差為 ,總體標(biāo)準(zhǔn)差為 ,樣本容量為 ,則樣本平均數(shù)的抽樣 平均誤差為: 例6.4 某組5名學(xué)生的體重依次為50、52、54、56、58千克,現(xiàn)隨機(jī)從中抽出2名計(jì)算平
21、均體重,可組成的全部樣本為 個(gè),樣本組合及平均數(shù)如表6-2所示,根據(jù)樣本組合及樣本平均數(shù),我們可編制如下頻數(shù)及頻率分布表:樣本均值505152535455565758合計(jì)頻數(shù)12345432125頻率0.040.080.120.160.200.160.120.080.041.00表6.3 樣本平均數(shù)分布表 根據(jù)樣本平均數(shù)分布數(shù)據(jù),我們可計(jì)算樣本平均數(shù)的平均數(shù)、方差和標(biāo)準(zhǔn)差如下: 表6.4 重復(fù)抽樣下樣本平均數(shù)和方差計(jì)算表5051525354555657581234543215010215621227022016811458-4-3-2-10123416941014916161812404121
22、816合計(jì)251350-100樣本平均數(shù)的平均數(shù)等于:樣本平均數(shù)的方差為:樣本平均數(shù)的標(biāo)準(zhǔn)差即抽樣平均誤差為: 為驗(yàn)證總體標(biāo)準(zhǔn)差與抽樣平均誤差(即全部可能樣本平均數(shù)的標(biāo)準(zhǔn)差)的關(guān)系,下面我們?cè)儆?jì)算總體平均數(shù)和總體標(biāo)準(zhǔn)差。 總體平均數(shù)為: 總體方差為: 驗(yàn)證如下:樣本平均數(shù)的平均數(shù)等于總體平均數(shù):抽樣平均誤差(即樣本平均數(shù)的標(biāo)準(zhǔn)差)等于總體標(biāo)準(zhǔn)差的 : (2)不重復(fù)抽樣下樣本平均數(shù)的抽樣平均誤差的計(jì)算 前述中心極限定理已經(jīng)證明,隨機(jī)不重復(fù)抽樣下,抽樣平均數(shù)的平均誤差計(jì)算公式如下: 仍用上述學(xué)生體重抽樣調(diào)查資料,在不重復(fù)抽樣下,全部可能的樣本平均數(shù)及其分布如下:表6.5 學(xué)生體重不重復(fù)抽樣樣本平均
23、數(shù)表樣本變量 50 52 54 56 585052545658- 51 52 53 5451 - 53 54 5552 53 - 55 5653 54 55 - 5754 55 56 57 -表6.6 不重復(fù)抽樣樣本平均數(shù)分布表樣本均值51525354555657合計(jì)頻數(shù)224442220頻率0.100.100.200.200.200.100.101.00表6.7 不重復(fù)抽樣下樣本平均數(shù)和方差計(jì)算表515253545556572244422102104212216220112114-3-2-101239410149188404818合計(jì)201080-60不重復(fù)抽樣樣本平均數(shù)的平均數(shù)為:不重復(fù)抽
24、樣樣本平均數(shù)的方差為:不重復(fù)抽樣樣本平均數(shù)的標(biāo)準(zhǔn)差為:驗(yàn)證: 2.樣本成數(shù)抽樣平均誤差的計(jì)算 計(jì)算成數(shù)抽樣平均誤差時(shí),將平均數(shù)抽樣平均誤差計(jì)算公式中的總體平均數(shù)方差 換成 即可。 (1)重復(fù)抽樣下樣本成數(shù)抽樣平均誤差的計(jì)算 (2)不重復(fù)抽樣下樣本成數(shù)抽樣平均誤差的計(jì)算 上述公式中的 和 是總體指標(biāo),在抽樣推斷中往往是未知的,通常以樣本指標(biāo)代替或采用以前已有的總體指標(biāo)。 例6.5 某市對(duì)400000戶居民按1%的比例抽樣調(diào)查平均年收入。測(cè)得結(jié)果為:樣本平均數(shù) 萬元,樣本標(biāo)準(zhǔn)差 萬元;在樣本中有400戶居民年收入低于2萬元。試求重復(fù)抽樣與不重復(fù)抽樣下,樣本平均數(shù)和樣本成數(shù)的抽樣平均誤差。 解:已知
25、將這些數(shù)據(jù)代入抽樣平均誤差計(jì)算公式應(yīng)有:重復(fù)抽樣下樣本平均數(shù)抽樣平均誤差:不重復(fù)抽樣下樣本平均數(shù)抽樣平均誤差:重復(fù)抽樣下樣本成數(shù)抽樣平均誤差:不重復(fù)抽樣下樣本成數(shù)抽樣平均誤差: 三、抽樣極限誤差 抽樣極限誤差又稱抽樣允許誤差,它是在抽樣推斷中所允許的樣本指標(biāo)與全及指標(biāo)之間的最大誤差范圍。由于正態(tài)分布理論已證明,樣本指標(biāo)與總體指標(biāo)的離差不超過若干(常用 表示)倍抽樣平均誤差的概率( ),因此,在抽樣推斷中常用若干( 倍)抽樣平均誤差來表示極限誤差。若設(shè) 為極限誤差,則有:即極限誤差是 倍的抽樣平均誤差。倍的抽樣平均誤差。因此,樣本平均數(shù)的極限誤差可表示為:重復(fù)抽樣下:不重復(fù)抽樣下:樣本成數(shù)的極限
26、誤差可表示為:不重復(fù)抽樣下:重復(fù)抽樣下: 例6.6 從15000名在校大學(xué)生中,按照隨機(jī)原則抽取150名調(diào)查月生活消費(fèi)水平。測(cè)得150名學(xué)生月平均生活消費(fèi)額350元,其標(biāo)準(zhǔn)差為30元,月生活消費(fèi)在300元以下的學(xué)生比率為12%。試求在95.45%的概率保證下,抽樣平均數(shù)和抽樣成數(shù)的極限誤差。解:已知,將這些數(shù)據(jù)代入抽樣極限誤差計(jì)算公式應(yīng)有:樣本平均數(shù)的極限誤差:重復(fù)抽樣下:不重復(fù)抽樣下:樣本成數(shù)的極限誤差:重復(fù)抽樣下:不重復(fù)抽樣下:第三節(jié) 抽樣估計(jì)和推斷一、抽樣估計(jì)的概念和特點(diǎn) (一)抽樣估計(jì)的概念 抽樣估計(jì)或稱參數(shù)估計(jì),就是以樣本的實(shí)際資料為依據(jù),計(jì)算一定的樣本指標(biāo),并用以對(duì)總體的相應(yīng)指標(biāo)作
27、出估計(jì)和判斷。 (二)抽樣估計(jì)的特點(diǎn): 1.在邏輯上抽樣推斷應(yīng)用的是歸納推理。 2.在方法上應(yīng)用不確定的概率估計(jì),而不應(yīng)用確定的數(shù)學(xué)分析。 3.抽樣推斷結(jié)論存在一定的誤差。二、抽樣估計(jì)的優(yōu)良標(biāo)準(zhǔn) 用樣本指標(biāo)估計(jì)總體指標(biāo),若滿足無偏性、有效性和一致性要求,就認(rèn)為是一個(gè)優(yōu)良估計(jì)。 (一)無偏性 無偏性就是要求樣本指標(biāo)的平均數(shù)等于被估計(jì)的總體指標(biāo)。 (二)一致性 即當(dāng)樣本容量充分大時(shí),樣本指標(biāo)也充分靠近總體指標(biāo)。 (三)有效性 有效性就是要求用樣本指標(biāo)估計(jì)總體指標(biāo),方差比其他任何估計(jì)量方差都小。 三、抽樣估計(jì)方法 抽樣估計(jì)通常有點(diǎn)估計(jì)和區(qū)間估計(jì)兩種方法。 (一)點(diǎn)估計(jì) 點(diǎn)估計(jì)又稱定值估計(jì),就是直接用
28、樣本指標(biāo)作為相應(yīng)的總體指標(biāo)的估計(jì)量?;蛘哒f,就是直接用樣本指標(biāo)代替全及總體相應(yīng)指標(biāo)。統(tǒng)計(jì)中常用的點(diǎn)估計(jì)主要有: 1.用樣本平均數(shù)估計(jì)全及總體平均數(shù),即用 代替 ; 2.用樣本成數(shù)估計(jì)全及總體成數(shù),即用 代替 ; 3.用樣本方差估計(jì)全及總體方差,即用 代替 ; 4.用樣本標(biāo)準(zhǔn)差估計(jì)全及總體標(biāo)準(zhǔn)差,即用 代替 。 (二)區(qū)間估計(jì) 1.區(qū)間估計(jì)的概念 區(qū)間估計(jì)就是在一定概率保證下,用樣本指標(biāo)和抽樣平均誤差去推斷總體指標(biāo)可能范圍的估計(jì)方法。 區(qū)間估計(jì)的結(jié)果是總體指標(biāo)可能落在的數(shù)值范圍或稱數(shù)值區(qū)間及落在該區(qū)間的可靠程度(即概率)。我們稱這一區(qū)間為置信區(qū)間,其兩端點(diǎn)數(shù)值稱為置信上限和置信下限。一般地,可靠
29、程度(概率)應(yīng)當(dāng)在90%至96%。 2.區(qū)間估計(jì)的步驟 對(duì)總體指標(biāo)的區(qū)間估計(jì)主要有以下幾個(gè)步驟: (1)抽取樣本,計(jì)算樣本指標(biāo); (2)根據(jù)給定的概率和已計(jì)算的抽樣平均誤差,確定概率度,計(jì)算抽樣極限誤差; (3)根據(jù)已計(jì)算的樣本指標(biāo)和抽樣平均誤差推斷總體指標(biāo)所在區(qū)間。 例6.8 某電子元件廠對(duì)10000只電子元件按隨機(jī)原則抽取100只進(jìn)行質(zhì)量檢驗(yàn),樣本調(diào)查資料如下表所示。試以95%的概率保證程度,估計(jì)這10000只電子元件的平均耐用時(shí)間和合格率(耐用時(shí)間達(dá)到1000小時(shí)的為合格品)。表6.8 某電子元件抽樣調(diào)查資料計(jì)算表耐用時(shí)間(小時(shí))組中值檢測(cè)元件數(shù)1000以下100011001100120
30、0120013001300以上95010501150125013505106022347501050069000275004050-208-108-8921922163201166403840186208110592合計(jì)-100115800-633600 解:(1)估計(jì)該批元件平均耐用時(shí)間計(jì)算樣本平均耐用時(shí)間計(jì)算樣本平均耐用時(shí)間標(biāo)準(zhǔn)差(小時(shí))(小時(shí))計(jì)算平均數(shù)抽樣平均誤差(不重復(fù)抽樣)計(jì)算平均數(shù)抽樣極限誤差,則(小時(shí))(小時(shí)) 估計(jì)該批電子元件平均耐用時(shí)間所在區(qū)間區(qū)間上限:區(qū)間下限:即該批電子元件平均耐用時(shí)間在1142.48至1173.52小時(shí)之間,其可靠程度為95%。(2)估計(jì)該批元件的合格
31、率計(jì)算樣本合格率計(jì)算樣本合格率標(biāo)準(zhǔn)差計(jì)算樣本合格率抽樣平均誤差(不重復(fù)抽樣)計(jì)算樣本合格率極限誤差,則區(qū)間下限:即該批電子元件合格率在90.75%至99.25%之間,其可靠程度為95%。估計(jì)該批電子元件合格率所在區(qū)間區(qū)間上限: (三)全及總體總量指標(biāo)的修正與推算 在抽樣推斷實(shí)踐中,估計(jì)全及總體總量指標(biāo)常用直接推算法和修正系數(shù)法。 1.直接推算法 直接推算法指依據(jù)點(diǎn)估計(jì)值或區(qū)間估計(jì)值及全及總體單位數(shù),去推算全及總體總量指標(biāo)值或全及總體總量指標(biāo)所在區(qū)間。(1)用樣本平均數(shù)和總體單位數(shù)推算總體標(biāo)志總量 。 例6.9 某學(xué)院在校學(xué)生10000人,抽取100名學(xué)生作為樣本進(jìn)行調(diào)查,測(cè)得學(xué)生月平均生活消費(fèi)
32、額350元,試估計(jì)該學(xué)院全體學(xué)生月生活消費(fèi)額。解:全院學(xué)生月生活消費(fèi)額:(萬元)。 (2)用樣本成數(shù)和總體單位數(shù)推算全及總體中具有某種標(biāo)志的單位數(shù)。 例6.10 某班有50名學(xué)生,隨機(jī)抽取10%進(jìn)行調(diào)查,測(cè)得及格率為90%,試推算全班及格人數(shù)。 解:該班及格人數(shù)為: (人)。(3)用樣本平均數(shù) ,抽樣極限誤差 和總體單位數(shù) ,推算總體標(biāo)志總量所在區(qū)間: 例6.11 某市有10萬名職工,隨機(jī)抽取1%進(jìn)行調(diào)查,測(cè)得職工年平均收入3.5萬元,在95.45%的概率保證下抽樣極限誤差為0.2萬元。試推算該市職工年收入總額所在區(qū)間。解:該市職工年收入總額所在區(qū)間為:即該市職工年收入總額在33至37萬元之間
33、,其概率保證程度為95.45%。(4)用樣本成數(shù) ,成數(shù)抽樣極限誤差 和總體單位數(shù) ,推算總體中具有某種標(biāo)志的單位數(shù)所在區(qū)間。 例6.12 某市有10萬名職工,隨機(jī)抽取1%進(jìn)行調(diào)查,測(cè)得職工年平均收入在3萬元以下的有40%,在95%的概率保證下抽樣極限誤差為2%。試推算該市年收入在3萬元以下的職工人數(shù)所在區(qū)間。 解:該市年收入在3萬元以下的職工人數(shù)所在區(qū)間為: 即該市年收入在3萬元以下的職工人數(shù)所在區(qū)間是3.8至4.2萬人,其概率保證程度為95%。第四節(jié) 抽樣方案設(shè)計(jì) 為了科學(xué)有序地開展抽樣調(diào)查和推斷,必須事先設(shè)計(jì)出符合調(diào)查對(duì)象特點(diǎn)和調(diào)查目的要求的抽樣調(diào)查方案。設(shè)計(jì)抽樣調(diào)查方案要解決的基本問題
34、主要有抽樣調(diào)查程序、抽樣調(diào)查單位數(shù)和抽樣組織方式等。一、抽樣調(diào)查程序 (一)立項(xiàng)。即確定調(diào)查的目的、任務(wù),擬定調(diào)查項(xiàng)目,規(guī)定調(diào)查時(shí)間和期限。 (二)搜集調(diào)查總體有關(guān)資料,編制抽樣框。 (三)設(shè)計(jì)抽樣方案。即在保證遵循隨機(jī)原則,并注意費(fèi)用盡可能節(jié)約的前提下,選擇恰當(dāng)?shù)某闃臃绞?,確定必要抽樣單位數(shù)。 (四)組織樣本單位數(shù)據(jù)搜集和處理。 (五)推斷總體,提供調(diào)查結(jié)果及相關(guān)說明。二、必要樣本容量的確定 (一)影響樣本容量的主要因素 抽樣推斷方案設(shè)計(jì)的一個(gè)重要任務(wù),就是確定樣本容量。而樣本容量的大小,受多種因素影響,概括來說,主要有以下幾個(gè)方面: 第一,被研究總體標(biāo)志變動(dòng)程度,即總體標(biāo)準(zhǔn) 差 的值。在其
35、它條件不變的情況下, 的值愈大,必要樣本單位數(shù)愈多; 的值愈小,必要樣本單位數(shù)愈少。 第二,極限誤差(即允許誤差) 的值。在其它條件不變的情況下, 的值大,可以少抽些樣本單位; 的值小,則要多抽一些樣本單位。一般地, 的值是在調(diào)查之前根據(jù)調(diào)查目的規(guī)定的。 第三,概率度的 值。在其它條件不變的情況下, 值愈大,要求把握程度愈高,則要多抽一些樣本單位; 值愈小,要求把握程度愈低,則可以少抽些樣本單位。 第四,抽樣方法。在相同條件下,重復(fù)抽樣需要多抽一些單位,不重復(fù)抽樣可以少抽一些單位。 第五,抽樣組織方式。由于不同抽樣方式下抽樣誤差是不同的,為了滿足抽樣推斷的目的要求,不同抽樣組織方式必要的樣本單
36、位數(shù)也是不一樣的。一般地,簡(jiǎn)單隨機(jī)抽樣、整群抽樣誤差要大一些,因而應(yīng)當(dāng)多抽一些單位;類型抽樣(分層抽樣)、機(jī)械抽樣(等距抽樣)誤差要小一些,可以少抽一些單位。 (二)必要樣本容量的計(jì)算 抽樣推斷的組織方式主要有簡(jiǎn)單隨機(jī)抽樣、類型抽樣、機(jī)械抽樣、整群抽樣、多階段抽樣等,下面我們分別介紹各種抽樣方式下必要樣本容量的計(jì)算方法。 1.簡(jiǎn)單隨機(jī)抽樣必要樣本容量的計(jì)算 (1)簡(jiǎn)單隨機(jī)重復(fù)抽樣必要樣本容量的計(jì)算 例6.13 對(duì)某地居民進(jìn)行人均年收入抽樣調(diào)查,已知該地人均年收入標(biāo)準(zhǔn)差為8千元,若允許誤差不超過1.2千元,概率保證程度為95%,問應(yīng)抽取多少戶居民作為樣本;若已知該地居民人均年收入達(dá)到30千元的戶
37、占85%,成數(shù)抽樣誤差不超過5%,概率保證程度仍為95%,問應(yīng)抽多少戶居民進(jìn)行調(diào)查。解:(1)計(jì)算樣本平均數(shù)必要樣本容量 已知 , , ,則 。 樣本平均數(shù)必要樣本容量為: (戶)。(2)計(jì)算樣本成數(shù)必要樣本容量已知 , , ,則 。,樣本成數(shù)必要樣本容量: (戶)。 (2)簡(jiǎn)單隨機(jī)不重復(fù)抽樣必要樣本容量的計(jì)算例6.14 某地進(jìn)行農(nóng)村經(jīng)濟(jì)調(diào)查,已知農(nóng)戶平均收入標(biāo)準(zhǔn)差( )為500元,農(nóng)戶總數(shù)10000戶,要求把握程度為95%,允許誤差為50元。問不重復(fù)抽樣下應(yīng)抽多少農(nóng)戶進(jìn)行調(diào)查。解:已知:所以即應(yīng)抽370戶進(jìn)行調(diào)查。 例6.15 某燈具廠欲對(duì)10000只燈管進(jìn)行耐用時(shí)間檢驗(yàn),以往幾次合格(耐用
38、時(shí)間達(dá)到1000小時(shí)為合格品)率檢驗(yàn)結(jié)果為90%、94%和96%。如果允許誤差不超過3%,可靠程度為95.45%,問不重復(fù)抽樣下應(yīng)抽多少只燈管進(jìn)行檢驗(yàn)?解:已知:所以即應(yīng)抽385只燈管進(jìn)行檢驗(yàn)。三、抽樣調(diào)查的組織方式 在進(jìn)行抽樣調(diào)查工作時(shí),必須根據(jù)研究總體本身的特點(diǎn)和抽樣調(diào)查的目的要求,對(duì)抽取樣本的程序和方式進(jìn)行周密的設(shè)計(jì)和安排,這些工作概括來說,稱為抽樣調(diào)查組織方式。在抽樣調(diào)查實(shí)踐常用的組織方式概括起來,主要有五種,即簡(jiǎn)單隨機(jī)抽樣、類型抽樣(又稱分層抽樣)、等距抽樣(又稱機(jī)械抽樣)、整群抽樣和多階段抽樣。 (一)簡(jiǎn)單隨機(jī)抽樣 1.簡(jiǎn)單隨機(jī)抽樣的概念、適用條件和不足 簡(jiǎn)單隨機(jī)抽樣,又稱純隨機(jī)抽
39、樣,它是按照隨機(jī)原則直接從全及總體 個(gè)單位中抽取 個(gè)單位作為樣本進(jìn)行調(diào)查的組織方式。 簡(jiǎn)單隨機(jī)抽樣只適用于均勻總體,且各單位之間被研究標(biāo)志值的差異較小,總體單位數(shù)較少,且便于編號(hào)和抽取。 簡(jiǎn)單隨機(jī)抽樣的不足是沒有充分利用全及總體已知信息或輔助資料;在總體單位很多,編號(hào)困難甚至不可能時(shí),無法組織抽樣;有時(shí)抽到的單位很分散,致使調(diào)查工作十分困難。 2.簡(jiǎn)單隨機(jī)抽樣下的取樣方法 主要有直接抽選法、抽簽法和隨機(jī)數(shù)表法等。 (1)直接抽選法。 即直接從全及總體中隨機(jī)抽取樣本單位的方法。如從糧食倉(cāng)庫(kù)中不同地點(diǎn)取出若干袋糧食進(jìn)行質(zhì)量檢驗(yàn)等。 (2)抽簽法。 即先給每個(gè)總體單位編號(hào),然后在遵循隨機(jī)原則的前提下
40、,采用一定方法抽取號(hào)碼,確定中選單位。 (3)隨機(jī)數(shù)表法。 隨機(jī)數(shù)表上數(shù)字的出現(xiàn)及其排列是隨機(jī)形式的,從0到 9共10個(gè)數(shù)字,每個(gè)數(shù)字各占1/10。而且表上數(shù)字組成的多位數(shù)(兩位數(shù)、三位數(shù)、四位數(shù)、五位數(shù)等)也有大體相同的出現(xiàn)機(jī)會(huì)。使用時(shí)從表中任一行任一列開始,按照事先設(shè)定的樣本單位數(shù)目的位數(shù),依次抽取數(shù)字,直到取夠預(yù)定單位數(shù)為止。 例6.16 某茶葉經(jīng)銷公司利用抽樣推斷方法檢測(cè)一批包裝茶葉是否符合重量要求,規(guī)定每包重量不低于152克。隨機(jī)抽取100包,檢測(cè)結(jié)果如表6.9所示,試以95.45%的概率估計(jì)該批茶葉平均每包重量。表6.9 某公司茶葉重量檢測(cè)數(shù)據(jù)表每包重量包數(shù)組中值(克)148-15
41、05149745-41680150-152201513020-2480152-154501537650000154-1562015531002480156-158515778541680合計(jì)100-15300 - -320解:(1)計(jì)算樣本平均數(shù)(2)計(jì)算樣本標(biāo)準(zhǔn)差(3)計(jì)算平均數(shù)抽樣平均誤差(重復(fù)抽樣)(克)(克)(4)計(jì)算抽樣極限誤差(5)估計(jì)該批茶葉每包平均重量所在區(qū)間區(qū)間上限:區(qū)間下限: 即該批茶葉平均每包重量在152.64至153.36克之間,其可靠程度為95.45%。(克) (二)類型抽樣 1.類型抽樣的概念 類型抽樣又稱分層抽樣,它是先對(duì)調(diào)查總體各單位按主要標(biāo)志加以分組,然后再?gòu)?/p>
42、各組中按照隨機(jī)原則抽取一定數(shù)量的單位組成樣本,進(jìn)行調(diào)查和推斷的一種抽樣組織方式。 2.類型抽樣單位的分配方法 類型抽樣單位在各類中的分配,有等比例和不等比例兩種分配方法。 (1)等比例分類抽樣。 即在對(duì)各類分配樣本數(shù)目時(shí),按照各類單位數(shù)在總體單位數(shù)中的比例確定。即某類在樣本總體中占的比重與其在全及總體中所占比重相同。 (2)不等比例分類抽樣。 不等比例分類抽樣是針對(duì)一些特殊情況進(jìn)行的分類抽樣。如當(dāng)各類中變量值差異程度較大時(shí)不宜采用等比例抽樣,這時(shí)對(duì)變量值差異程度(方差)大的類,應(yīng)適當(dāng)多抽樣一些單位;對(duì)變量值差異程度(方差)小的類,可適當(dāng)少抽樣一些單位。 3.類型抽樣推斷步驟 類型抽樣推斷工作主
43、要有以下幾個(gè)步驟: (1)抽取樣本,計(jì)算樣本各類(組)平均數(shù)(成數(shù)) 樣本各類(組)平均數(shù):樣本各類(組)成數(shù): (2)計(jì)算樣本各類(組)平均數(shù)(成數(shù))方差 樣本各類(組)平均數(shù)方差: 樣本各類(組)成數(shù)方差: (3)計(jì)算樣本平均數(shù)(成數(shù))組內(nèi)方差的平均數(shù) 樣本平均數(shù)組內(nèi)方差的平均數(shù) 樣本成數(shù)組內(nèi)方差的平均數(shù)(4)計(jì)算類型抽樣樣本平均數(shù)(成數(shù))類型抽樣的樣本平均數(shù)類型抽樣的樣本成數(shù)(5)計(jì)算類型抽樣平均誤差類型抽樣平均數(shù)平均誤差類型抽樣成數(shù)平均誤差 例6.17 某縣有5萬農(nóng)戶,根據(jù)地理情況分為平原和丘陵兩類,其中平原3萬戶,丘陵2萬戶。本年按1%比例抽取樣本單位進(jìn)行平均年收入調(diào)查,調(diào)查結(jié)果如表
44、8.10所示。要求:(1)以95%的概率估計(jì)本年該縣農(nóng)戶平均年收入;(2)估計(jì)本年收入達(dá)到5萬元的農(nóng)戶比重;(3)若明年仍進(jìn)行該項(xiàng)調(diào)查,概率保證程度為95.45%,允許誤差不超過0.15萬元,問應(yīng)當(dāng)抽多少農(nóng)戶進(jìn)行調(diào)查,其中平原和丘陵各抽多少戶。表6.10 某縣農(nóng)戶年收入抽樣調(diào)查資料戶年收入(萬元)2以下2446688以上合計(jì)平原地區(qū)(戶)丘陵地區(qū)(戶)1020501001855040201510300200合計(jì)301502206040500 解:(1)估計(jì)該縣本年農(nóng)戶平均年收入 1)計(jì)算樣本各類平均數(shù) 平原農(nóng)戶收入平均數(shù):丘陵農(nóng)戶收入平均數(shù):2)計(jì)算樣本平均數(shù)3)計(jì)算樣本各類方差平原農(nóng)戶收入方
45、差:丘陵農(nóng)戶收入方差:4)計(jì)算樣本方差(即組內(nèi)方差平均數(shù)) 5)計(jì)算抽樣平均誤差6)計(jì)算抽樣極限誤差7)估計(jì)農(nóng)戶平均年收入農(nóng)戶平均年收入下限:農(nóng)戶平均年收入上限:即農(nóng)戶平均年收入在4.4479至4.7521萬元之間,其可靠程度為95%。 (2)估計(jì)該縣本年收入達(dá)到5萬元的農(nóng)戶比重1)計(jì)算類型抽樣成數(shù)(注:n11代表在第1類(組)中具有某種標(biāo)志的單位年占比重;n21代表在第2類(組)中具有某種標(biāo)志的單位年占比重。2)計(jì)算樣本成數(shù)方差平原地區(qū):丘陵地區(qū):樣本成數(shù)方差:3)計(jì)算樣本成數(shù)抽樣平均誤差4)計(jì)算樣本成數(shù)抽樣極限誤差 5)估計(jì)本年收入達(dá)到5萬元的農(nóng)戶比重農(nóng)戶年收入達(dá)5萬元的比重下限:農(nóng)戶年收
46、入達(dá)5萬元的比重上限:即農(nóng)戶年收入達(dá)5萬元的比重在60.18%至67.82%之間,其可靠程度為95%。(3)計(jì)算明年進(jìn)行同樣調(diào)查的樣本容量 不重復(fù)抽樣樣本平均數(shù)樣本容量為: (三)等距抽樣 1.等距抽樣的概念和特點(diǎn) 等距抽樣又稱機(jī)械抽樣或系統(tǒng)抽樣。它是事先將全及總體各總體按某種標(biāo)志排列,然后依固定順序和間隔抽取調(diào)查單位的一種抽樣組織形式。 等距抽樣方式,能使抽取的調(diào)查單位更均勻地分布在全及總體中。因而,其抽樣誤差一般較簡(jiǎn)單隨機(jī)抽樣小。特別是當(dāng)研究現(xiàn)象變異程度大,而在實(shí)際工作中又不可能抽取更多單位時(shí),等距抽樣比簡(jiǎn)單隨機(jī)抽樣更有效。 2.等距抽樣方法 等距抽樣分為無關(guān)標(biāo)志排隊(duì)和有關(guān)標(biāo)志排隊(duì)兩種。無
47、關(guān)標(biāo)志排隊(duì)即指用來排隊(duì)的標(biāo)志與調(diào)查研究的目的無關(guān)。有關(guān)標(biāo)志排隊(duì)即指用來排隊(duì)的標(biāo)志與調(diào)查研究的目的有關(guān)。按有關(guān)標(biāo)志排隊(duì)的調(diào)查效果會(huì)優(yōu)于按無關(guān)標(biāo)志排隊(duì)的調(diào)查效果。 等距抽樣樣本平均數(shù)、抽樣平均誤差、極限誤差以及對(duì)全及總體指標(biāo)的估計(jì)等計(jì)算方法與簡(jiǎn)單隨機(jī)抽樣相同。 3.等距抽樣的具體組織 等距抽樣有三種具體組織方法,即隨機(jī)起點(diǎn)等距抽樣、半距起點(diǎn)等距抽樣和隨機(jī)起點(diǎn)對(duì)稱等距抽樣。(1)隨機(jī)起點(diǎn)等距抽樣。即根據(jù)事先預(yù)定的樣本單位數(shù) ,將全及總體所有單位分成 等份,即 組,每組的單位數(shù)為 ,也即抽樣距離為 。抽樣起點(diǎn)在第一組的 個(gè)單位之間隨機(jī)確定。 (2)半起點(diǎn)等距抽樣。半距起點(diǎn)就是選第1組的第 個(gè)單位為第一
48、個(gè)抽取的樣本單位。 (3)隨機(jī)起點(diǎn)對(duì)稱等距抽樣。這種方法就是通過隨機(jī)起點(diǎn),系統(tǒng)抽出對(duì)稱樣本。它要求每?jī)蓚€(gè)組距合成一個(gè)大組,在每?jī)蓚€(gè)組距中對(duì)稱抽出兩個(gè)樣本單位,而且要求各對(duì)稱樣本與其相近的下限或上限的距離是相等的,即都等于 值。(如每個(gè)距離是8個(gè)單位,在第一個(gè)距離隨機(jī)取到第三個(gè)單位,它離8有5個(gè)單位,則第二個(gè)抽取的單位應(yīng)是第13個(gè)單位,它離8的距離也是5。以后各輪均按此法抽取。) 例6.18 某社區(qū)住戶按家庭年收入高低排隊(duì),然后每隔20戶抽1戶,共抽取100戶,得知他們的家庭年平均收入為30000元,樣本標(biāo)準(zhǔn)差為5000元,試計(jì)算該社區(qū)住戶家庭年平均收入的抽樣平均誤差。解:這是按有關(guān)標(biāo)志排隊(duì)的等
49、距抽樣,已知 抽樣平均誤差為: (四)整群抽樣 1.整群抽樣的概念和特點(diǎn) 整群抽樣是先將全及總體劃分為若干組群,然后從中隨機(jī)抽取一些群,對(duì)中選群的所有單位進(jìn)行全面調(diào)查的抽樣組織形式。 例如,在冷庫(kù)裝箱鮮蛋檢驗(yàn)中,以箱為單位抽出進(jìn)行檢驗(yàn);在人口普查質(zhì)量檢驗(yàn)中,以村、鄉(xiāng)或縣為單位進(jìn)行抽樣檢查;在大量連續(xù)生產(chǎn)的產(chǎn)品質(zhì)量檢驗(yàn)中,每隔1小時(shí)抽取10分鐘的產(chǎn)品進(jìn)行檢驗(yàn)等,都屬于整群抽樣。2.整群抽樣的計(jì)算方法(1)整群抽樣平均數(shù)和平均誤差的計(jì)算各群平均數(shù)的計(jì)算:樣本平均數(shù)的計(jì)算:群間方差: 或整群抽樣平均數(shù)平均誤差(采用不重復(fù)抽樣):(2)整群抽樣成數(shù)和成數(shù)平均誤差的計(jì)算第 群的成數(shù)為: ( 表示具有某種標(biāo)志的單位數(shù))總體成數(shù)為:整群抽樣成數(shù)平均誤差:式中: (3)整群抽樣必要抽樣群數(shù)的計(jì)算為抽樣平均數(shù)必要抽樣群數(shù)為:抽樣成數(shù)必要抽樣群數(shù)為: 例6.19 某電子元件廠生產(chǎn)某電子元件,為檢查元件質(zhì)量,在連續(xù)生產(chǎn)的480小時(shí)中,每8小時(shí)抽取1小時(shí)的全部產(chǎn)品進(jìn)行質(zhì)量檢驗(yàn),測(cè)得平均使用壽命為1500小時(shí),群間方差為8
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度秸稈環(huán)保處理銷售合同示范9篇
- 二零二五年度校園充電樁租賃及配套設(shè)施合同3篇
- 二零二五年度漁業(yè)船舶動(dòng)力系統(tǒng)銷售合同2篇
- 2024版建設(shè)施工合同履約保證合同
- 振動(dòng)監(jiān)視儀安全操作規(guī)程
- 2025年新科版五年級(jí)數(shù)學(xué)上冊(cè)階段測(cè)試試卷
- 2025年魯教五四新版五年級(jí)數(shù)學(xué)下冊(cè)月考試卷
- 安燈系統(tǒng)系統(tǒng)安全操作規(guī)程
- 2024獨(dú)家代理居間服務(wù)協(xié)議版B版
- 水袋熱合機(jī)安全操作規(guī)程
- 職業(yè)健康監(jiān)護(hù)技術(shù)規(guī)范
- (七)小青瓦屋面施工
- 佛山市斯高家具全屋定制水平考試
- 安徽省白酒生產(chǎn)企業(yè)名錄395家
- 會(huì)計(jì)職業(yè)道德課件(完整版)
- 多媒體技術(shù)與應(yīng)用ppt課件(完整版)
- 2022年五年級(jí)數(shù)學(xué)興趣小組活動(dòng)記錄
- 閱讀題賒小雞
- Q∕GDW 12127-2021 低壓開關(guān)柜技術(shù)規(guī)范
- 鋼管購(gòu)銷合同
- 中國(guó)風(fēng)各類PPT模板15
評(píng)論
0/150
提交評(píng)論