《統(tǒng)計學(xué)》第七章抽樣估計匯總

上傳人：4*** IP屬地：湖北上傳時間：2022-06-12 格式：PPT 頁數(shù)：80 大?。?.05MB 積分：30 舉報 版權(quán)申訴

已閱讀5頁，還剩75頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第七章第七章參數(shù)估計參數(shù)估計2參數(shù)估計在統(tǒng)計方法中的地位參數(shù)估計在統(tǒng)計方法中的地位v統(tǒng)計方法統(tǒng)計方法描述統(tǒng)計描述統(tǒng)計推斷統(tǒng)計推斷統(tǒng)計抽樣估計抽樣估計參數(shù)估計參數(shù)估計其它方法其它方法假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)3統(tǒng)計推斷的過程樣本總體樣本統(tǒng)計量樣本統(tǒng)計量例如：樣本均值、比例、方差總體均值、總體均值、比例、方差比例、方差47.1 抽樣估計的基本問題抽樣估計的基本問題7.2 點(diǎn)估計點(diǎn)估計7.3 簡單隨機(jī)抽樣的區(qū)間估計簡單隨機(jī)抽樣的區(qū)間估計7.4 其它抽樣組織方式的抽樣誤差其它抽樣組織方式的抽樣誤差7.1 抽樣估計的基本問題抽樣估計的基本問題 7.1.1 抽樣估計的意義抽樣估計是按隨機(jī)原則從總體中抽取一部抽樣

2、估計是按隨機(jī)原則從總體中抽取一部分單位進(jìn)行調(diào)查，并以調(diào)查結(jié)果對總體的數(shù)分單位進(jìn)行調(diào)查，并以調(diào)查結(jié)果對總體的數(shù)量特征作出具有一定可靠程度的估計與推斷。量特征作出具有一定可靠程度的估計與推斷。必須具有的工作必須具有的工作抽樣、推斷和計算可靠度。抽樣、推斷和計算可靠度。56 應(yīng)用抽樣調(diào)查和推斷的原因，應(yīng)用抽樣調(diào)查和推斷的原因，不可能進(jìn)行全面調(diào)查。不可能進(jìn)行全面調(diào)查。不必要進(jìn)行全面調(diào)查。不必要進(jìn)行全面調(diào)查。數(shù)據(jù)及時性要求。數(shù)據(jù)及時性要求。驗(yàn)證全面調(diào)查結(jié)果驗(yàn)證全面調(diào)查結(jié)果。77.1.2 抽樣設(shè)計1. 抽樣框目標(biāo)總體統(tǒng)計總體。抽樣框包含全部抽樣單位的名單。編制抽樣框編制抽樣框確定抽樣范圍。

3、確定抽樣范圍。抽樣單位（一個或多個總體單位）抽樣單位（一個或多個總體單位）（1）名單抽樣框）名單抽樣框（2）區(qū)域抽樣框）區(qū)域抽樣框（3）時間表抽樣框）時間表抽樣框8一個理想的抽樣框應(yīng)該與目標(biāo)總體一致，一個理想的抽樣框應(yīng)該與目標(biāo)總體一致，即應(yīng)包括全部總體單位，既不重復(fù)也不遺漏。即應(yīng)包括全部總體單位，既不重復(fù)也不遺漏。也就是說，每個總體單位在抽樣框里必須出現(xiàn)也就是說，每個總體單位在抽樣框里必須出現(xiàn)一次而且只能出現(xiàn)一次，以保證抽樣框能完全一次而且只能出現(xiàn)一次，以保證抽樣框能完全代表目標(biāo)總體。代表目標(biāo)總體。92. 抽樣方法重復(fù)抽樣，也叫回置抽樣重復(fù)抽樣，也叫回置抽樣，是指從總體的個，是指從總體

4、的個單位中抽取一個容量為單位中抽取一個容量為n的樣本，每次抽出一個單位的樣本，每次抽出一個單位后，再將其放回總體中參加下一次抽取，這樣連續(xù)后，再將其放回總體中參加下一次抽取，這樣連續(xù)抽抽n次即得到一個樣本。次即得到一個樣本。同一總體單位有可能被重復(fù)抽中，同一總體單位有可能被重復(fù)抽中，每次都是從個總體單位中抽取每次都是從個總體單位中抽取每個總體單位被抽中可能性均為每個總體單位被抽中可能性均為1/N。如果考慮排列問題，所有可能的樣本數(shù)為如果考慮排列問題，所有可能的樣本數(shù)為Nn。如果不考慮排列可能的樣本數(shù)為如果不考慮排列可能的樣本數(shù)為。 1nN nC 10不重復(fù)抽樣，也叫不回置抽樣，不重復(fù)

5、抽樣，也叫不回置抽樣，是指是指抽中單位不再放回總體中，下一個樣本單抽中單位不再放回總體中，下一個樣本單位只能從余下的總體單位中抽取。位只能從余下的總體單位中抽取。同一總體單位不可能被重復(fù)抽中同一總體單位不可能被重復(fù)抽中. 每次抽取是在不同數(shù)目的總體單位中每次抽取是在不同數(shù)目的總體單位中進(jìn)行的，每個總體單位被抽中的概率為進(jìn)行的，每個總體單位被抽中的概率為1/N。如果僅僅考慮組合，所有可能的樣本數(shù)如果僅僅考慮組合，所有可能的樣本數(shù)為為，如果考慮排列為，如果考慮排列為。nNC!()!nNn11 3.抽樣組織方式簡單隨機(jī)抽樣是最基本的抽樣組織方式，數(shù)理簡單隨機(jī)抽樣是最基本的抽樣組織方式，數(shù)理

6、統(tǒng)計均以簡單隨機(jī)抽樣入手，有很成熟的理論。統(tǒng)計均以簡單隨機(jī)抽樣入手，有很成熟的理論。統(tǒng)計實(shí)務(wù)中根據(jù)總體的特點(diǎn)有各種不同的抽樣統(tǒng)計實(shí)務(wù)中根據(jù)總體的特點(diǎn)有各種不同的抽樣組織方法。分層抽樣、等距抽樣、組織方法。分層抽樣、等距抽樣、整群抽樣、整群抽樣、多階段抽樣等。多階段抽樣等。12 7.1.3 抽樣估計誤差誤差：登記性誤差和代表性誤差誤差：登記性誤差和代表性誤差登記性誤差可以避免，減小到最小限度系統(tǒng)性誤差可以避免，減小到最小限度代表性誤差抽樣誤差不能避免，只可控制137.2 點(diǎn)估計點(diǎn)估計 7.2.1 矩估計矩估計 7.2.2 極大似然估計極大似然估計 7.2.3 估計量的評價標(biāo)準(zhǔn)估計量的評

7、價標(biāo)準(zhǔn)14假設(shè)在總體中，為未知參數(shù)（均值、方差、成數(shù)等）。由樣本構(gòu)造統(tǒng)計量，來估計未知參數(shù) 。稱為的點(diǎn)估計量。將某次抽樣的樣本觀測值，代入得點(diǎn)估計值。點(diǎn)估計X12,nXXX12(,)nXXX12(,)nXXX12( ,)nx xx15 思想：一種古老的估計法。基本思想是用樣本的指標(biāo)替代總體的指標(biāo)，然后通過方程解出未知參數(shù)。設(shè)總體的密度函數(shù)為f(x;1, k)。 7.2.1矩估計法1611( ,)( ;,)jjkkmx f xdx連續(xù)型 11( ,)()njjkiiimxp Xx離散型 1.前提1：總體的各階原點(diǎn)矩是總體未知參數(shù)的函數(shù)。 17 2.前提2：辛欽大數(shù)定律。總體

8、的原點(diǎn)矩存在時，當(dāng)樣本容量趨于無窮時，樣本的原點(diǎn)矩收斂到總體的原點(diǎn)矩。 18111( ,)nkiimXn2211( ,)nkiimXn211( ,)nkkiimXn3.解法解法求解方程組得解，稱為總體參數(shù)的矩估計。 k,1k,119 總體的分布為均勻分布，求的矩估計。10, ( )00, xf xx20例例設(shè)設(shè) 是來自某總體的樣本，且均值是來自某總體的樣本，且均值和和方差方差存在。求總體的均值和方差的矩估計。存在。求總體的均值和方差的矩估計。nXXX,212niiXnXE11)( 所以22niiXnXE1221)( 所以)( XE因?yàn)?22)( XE又因?yàn)閚iiniiXnXn122

9、2111解方程組，得XXnnii11 21221 XXnnii21)(1 XXnnii21 7.2.2極大似然估計極大似然估計甲廠收到供應(yīng)商提供的一批貨物，根據(jù)以往的經(jīng)驗(yàn)，該供應(yīng)商的產(chǎn)品次品率為10%，而供應(yīng)商聲稱次品率僅有5%。若隨機(jī)抽出10件檢驗(yàn)，結(jié)果有4件次品。購貨方應(yīng)該如何做決策。記次品數(shù)為，則服從二項(xiàng)分布。若則10件中有4件次品的概率為若則10件中有4件次品的概率為 X,05. 0p001. 095. 005. 0)4(64410CXP, 1 . 0p0112. 09 . 01 . 0)4(64410CXPX22計算的結(jié)果表明，在次品為0.1時，10件產(chǎn)品中有4件次品的概

10、率大，這說明該批產(chǎn)品次品率為0.1的可能性大。由于樣本來源于總體，樣本能很好反映總體的特征。思想：概率最大的事件最可能發(fā)生。假設(shè)總體的分布函數(shù)已知，但是參數(shù) 未知。從總體中抽出樣本，并計算各可能參數(shù)值條件下樣本發(fā)生的可能性，使樣本發(fā)生的可能性最大的是參數(shù)的極大似然估計量X), 1(kii), 1(kii23數(shù)學(xué)理論：設(shè)總體的分布密度函數(shù)為其中為待估參數(shù)。為總體的簡單隨機(jī)樣本。則其聯(lián)合密度函數(shù)為對給定的一個樣本觀測值，稱為樣本的似然函數(shù)。X),;(1kxfk,1nXX,1nxx,1),;,(2121knxxxLnikixf11),;(nikixf11),;(24 使似然函數(shù)達(dá)

11、到極大值的，是總體參數(shù)的極大似然估計。利用微積分的結(jié)論，函數(shù)在一階導(dǎo)數(shù)零處達(dá)到極值。所以，總體參數(shù)的極大似然估計是下列方程組的根。k,1k,112000kLLL 由于函數(shù)和函數(shù)的對數(shù)是在同一點(diǎn)達(dá)到極值，所以為了運(yùn)算上的方便，我們常常對似然函數(shù)去對數(shù)，得到對數(shù)似然函數(shù)，使乘積變成求和，更方便運(yùn)算。所以2512ln0ln0ln0kLLL26 0-1分布的數(shù)學(xué)期望為p，在總體中抽隨機(jī)樣本，樣本發(fā)生的概率為：),(21nxxxiiiixnxxxnipppp)1 ()1 (110)1 (lniixnxppp0)1ln()(lnpxnpxpii01pxnpxiiixnp1 使上式最大的P滿足27 例

12、例設(shè)是來自正態(tài)總體設(shè)是來自正態(tài)總體的樣本，的樣本，均值和方差存在。求總體的均值和方差的極大似然估計。均值和方差存在。求總體的均值和方差的極大似然估計。),(2NnXXX,21222)(12121),(ixninexxxfLniixnL12222)()2ln(2lnniixL10)(lnniixnL124220)(212ln解方程組，得,1 1XXnnii21221 XXnnii2829 無偏性無偏性有效性有效性一致性一致性7.2.3 點(diǎn)估計量的評價準(zhǔn)則點(diǎn)估計量的評價準(zhǔn)則30設(shè)為未知參數(shù)的估計量，若則稱為的無偏估計量。1. 無偏性無偏性( )Elim()nnE若則稱為的漸近無偏估計量

13、。31總體X（3 4 5），抽容量為2的樣本。即（33）3 （34）3.5 （35）4（43）3.5 (44）4 （45）4.5（53）4 （54）4.5 （55）5 32 可見樣本平均數(shù)就是總體平均數(shù)的無偏估計量。以無偏性來評判估計量是很合理的。一個好的估計量就某一個具體的估計值而言，可能不等于總體參數(shù)值，但平均地看有向估計的參數(shù)集中的趨勢。( )33.543.544.544.55936/94E x33 證明樣本均值是總體均值的一個無偏估計量，但樣本方差不是總體方差的無偏估計量。解：由于2X2nSniinniiXXnSXnX12211,1從而 niniinXEnXE1111又因?yàn)閚i

14、inXXnS12221所以21221222111nnnnXEXEnSEniniin即22nSE34設(shè)為的兩個無偏估計量，若21,)()(21DD則稱比有效。1二、有效性二、有效性2設(shè)為的估計量，稱2)()( EMSE為的均方誤差，并且2222)()()()()()(EEEEEEEMSE記，則)(EB)()()(2BDMSE35 設(shè) 是總體X的樣本均是平均數(shù)的無偏估計量，但比有效。 21,12,nXXX11X2()D Xn21ixn21()D X21ixn11X36思考題：設(shè) 是總體X 的一個容量為3的樣本，是總體均值的估計量，它們是無偏估計量嗎？若是，哪一個更有效。123,X

15、XX11231()3XXX21231(23)6XXX37 設(shè)為未知參數(shù)的估計量，當(dāng)時，按概率收斂于。即三、一致性三、一致性n1)(limPn，則稱為的一致估計量038隨著樣本容量增大，估計量會越來越接近被估計的參數(shù)。即對任意的0，有則稱是參數(shù)的一致估計量。一致估計量是大樣本所呈現(xiàn)的性質(zhì)。若某個估計量是待估參數(shù)的一致估計量，意味著樣本容量很大時，估計量和待估參數(shù)接近的可能性幾乎等于100%。lim|1nP 397.3 區(qū)間估計區(qū)間估計區(qū)間估計的思想基本概念單個總體均值的置信區(qū)間總體成數(shù)的置信區(qū)間總體方差的置信區(qū)間40 某保險公司欲了解某個險種投保人的平均年齡，隨機(jī)抽取24人，計算

16、出24人的平均年齡為39歲，總體標(biāo)準(zhǔn)差 7.2歲。試以95%的置信度估計該險種投保人的平均年齡。設(shè)投保人的年齡 , 且已知，是X的一個樣本。當(dāng)討論總體均值的置信區(qū)間時，首先應(yīng)該從總體均值的點(diǎn)估計量出發(fā)。2( ,)XN 212,nXXXX41 由前面的討論已知，有由此，根據(jù)給定的置信度1-，可以確定，使在區(qū)間上取值的概率等于 1-即經(jīng)過整理，可得 2( ,)XNn(0,1)XZNn2u22(,)uu22()1XPuun 22()1P XuXunn 42 由樣本得樣本均值，標(biāo)準(zhǔn)差 = 7.2 對于給定的置信度95%，有=0.05查標(biāo)準(zhǔn)正態(tài)分布表確定臨界值。所以有投保人的年齡

17、以95%的可靠程度在36.13到41.87歲。39X 0.0251.96z7.27.239 1.96391.962424，(392.866392.866，）(36.134,41.866)43 95可靠程度，如果大，說明什么？（36.134，41.866）置信區(qū)間，如果區(qū)間很短，說明什么？這是評價區(qū)間估計的兩個標(biāo)準(zhǔn)這是評價區(qū)間估計的兩個標(biāo)準(zhǔn) 可靠度（置信度）可靠度（置信度）置信區(qū)間（置信區(qū)間的半徑，精確度）置信區(qū)間（置信區(qū)間的半徑，精確度）44nXXX,217.3.1 區(qū)間估計的概念區(qū)間估計的概念設(shè)是來自總體的一個樣本，是總體未知參數(shù)。對給定的，如能確定兩個統(tǒng)計量和，滿足) 10(121P

18、則稱為置信度或置信概率，是的置信度的置信區(qū)間，稱為顯著性水平。置信度可以用頻率來說明。如果是置信度 0.95 置信區(qū)間，當(dāng)從總體中多次取樣本容量為 n 的樣本時，則每次可得到一個置信區(qū)間，這些置信區(qū)間有的包含，而有的則不包含，但平均來說，包含的置信區(qū)間的頻率應(yīng)在 0.95 附近波動。),(21111),(211245評價區(qū)間估計的兩個標(biāo)準(zhǔn)：估計的可靠度。置信度1-反映了區(qū)間估計的可信度。置信水平 =0.95，說明估計區(qū)間以95%的概率包含總體的參數(shù)?；蛘哒f，100個這樣的估計區(qū)間中，平均有95個包含了總體參數(shù)；估計的精確度。區(qū)間的長度反映了區(qū)間估計的精確度。當(dāng)區(qū)間的長度愈大，估計區(qū)間包含真

19、值的可能性也就愈大，但是估計也愈不精確。可靠度和精確度是相互矛盾的。112()，21()-46估計的可靠度。估計的可靠度。置信度反映了區(qū)間估計的可信度。置信水平 =0.95，說明估計區(qū)間以95%的概率包含總體的參數(shù)。或者說，100個這樣的估計區(qū)間中，平均有95個包含了總體參數(shù)；121，14748 區(qū)間的長度： (上限下限) 區(qū)間的半徑：(上限下限)/2 反映了區(qū)間估計的精確度。當(dāng)區(qū)間的長度愈大，雖然估計區(qū)間包含真值的可能性愈大，但是估計卻不精確。估計的精確度估計的精確度49 可靠度和精確度是相互矛盾的。當(dāng)其中之一確定時可靠度和精確度是相互矛盾的。當(dāng)其中之一確定時，擴(kuò)大樣本容量可以改善另一個

20、。，擴(kuò)大樣本容量可以改善另一個。507.3.2 單個正態(tài)總體均值的置信區(qū)間單個正態(tài)總體均值的置信區(qū)間 1、當(dāng)總體方差已知時，總體均值的置信區(qū)間為： 2、當(dāng)總體方差未知時，總體均值的置信區(qū)間為:22(,)XzXznn22(1)(1)SSXtnXtnnn，51 7.3.3 成數(shù)的置信區(qū)間成數(shù)的置信區(qū)間 1、單個總體成數(shù)的置信區(qū)間設(shè)從成數(shù)為P的總體X中隨機(jī)抽出容量為n的樣本，其中是樣本中具有某種統(tǒng)計特性的單位的數(shù)量為，則樣本的成數(shù)為。在給定的置信度下，總體成數(shù)的置信區(qū)間為 1nnnp11nPPzpnPPzp）（，1)1 (22在估計總體的成數(shù)時，總體的成數(shù)是未知的，所以在置信上下限中的P可以用

21、樣本成數(shù)代替，當(dāng)樣本容量足夠大，誤差很小。52 例5.4 為了研究我國所生產(chǎn)的絲綢產(chǎn)品在國外的銷路，在紐約所舉辦的絲綢展銷會上，對1000名成年人進(jìn)行了調(diào)查，得知600人喜歡這種產(chǎn)品。試以95%的置信度估計紐約市成年人喜歡此種產(chǎn)品的比率獲得置信區(qū)間。nppzp)1 (26 . 01000600p96. 12z1000n1000)6 . 01 (6 . 096. 160. 053 設(shè)總體設(shè)總體服從正態(tài)分布，服從正態(tài)分布，是抽自是抽自該總體的簡單隨機(jī)樣本，對于給定的置信度該總體的簡單隨機(jī)樣本，對于給定的置信度，查查分布表得臨界值分布表得臨界值和和，的置信度為的置信度為的置信區(qū)間為的

22、置信區(qū)間為 X12,nXXX1212(1)n22(1)n2212222212(1)1(1)1nSnSnn（），（） 7.3.4 單個總體方差的置信區(qū)間單個總體方差的置信區(qū)間54 例5.3 某手表廠生產(chǎn)的精益牌手表,其走時誤差為正態(tài)分布,(單位:秒/日)。檢驗(yàn)員從裝配線上隨機(jī)抽出9只進(jìn)行檢驗(yàn)，檢測的結(jié)果如下：-4.0,3.1,2.5,-2.9,0.9,1.1,2.0,-3.0,2.8取置信水平為0.95,求該品牌手表的走時,誤差的均值和方差的置信區(qū)間。置信區(qū)間為27. 098 . 21 . 30 . 49191iixx2(1)sxtnn921()9 12.79iiSxx306. 2)8(025

23、. 0t979. 2306. 227. 055【例6】EXCEL數(shù)據(jù)“汽車傳動”Metropolitan Research有限公司是一家消費(fèi)者研究組織，它設(shè)計調(diào)查，對消費(fèi)者所使用的大量的產(chǎn)品和服務(wù)進(jìn)行評估。在某一項(xiàng)研究中，Metropolitan調(diào)查消費(fèi)者對底特律某一個主要制造商所生產(chǎn)的汽車的性能的滿意程度。分發(fā)給該制造商所生產(chǎn)的一種最大型號小汽車用戶的調(diào)查表表明，許多人抱怨該車剛開始傳動系統(tǒng)不佳。為了更好地了解傳動系統(tǒng)的問題，Metropolitan采用由底特律地區(qū)一個修理企業(yè)所提供的實(shí)際傳動系統(tǒng)的維修記錄為樣本。56管理報告管理報告（1）用適當(dāng)?shù)拿枋鼋y(tǒng)計量匯總傳動系統(tǒng)數(shù)據(jù)。（2）求曾經(jīng)

24、出現(xiàn)過傳動系統(tǒng)問題的汽車總體中在出現(xiàn)傳動系統(tǒng)問題時所行駛里程的均值的95%置信區(qū)間，并對該區(qū)間估計做出管理上的解釋。57平均平均73342.373342.3標(biāo)準(zhǔn)誤差標(biāo)準(zhǔn)誤差3521.2214733521.221473中位數(shù)中位數(shù)7270572705眾數(shù)眾數(shù)#N/A#N/A標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差24898.7958224898.79582方差方差619950033.2619950033.2峰度峰度0.1669920250.166992025偏度偏度0.259864830.25986483區(qū)域區(qū)域113048113048最小值最小值2506625066最大值最大值138114138114求和求和366711

25、53667115觀測數(shù)觀測數(shù)5050最大最大(1)(1)138114138114最小最小(1)(1)2506625066置信度置信度(95.0%)(95.0%)7076.1593447076.159344我們可以看出可靠性汽車傳動裝置出問題的時間差異是很大的。生產(chǎn)過程的質(zhì)量不穩(wěn)定。587.3.5 樣本容量的確定樣本容量的確定影響樣本容量的因素樣本容量的確定區(qū)間估計一覽表 59 一、影響樣本容量的因素一、影響樣本容量的因素 1.總體的變異程度高低。（總體方差的大?。?2.允許誤差的大小。允許誤差指允許的抽樣誤差，記為。例如樣本均值與總體均值之間的允許誤差可以表示為。允許誤差以絕對值的形

26、式表現(xiàn)了抽樣誤差的可能范圍，所以又稱為極限誤差。|XX|60 3.置信度的大小。 1-說明了估計的可靠程度。所以，在其他條件不變的情況下，如果要求較高的可靠度，就要增大樣本容量；反之，可以相應(yīng)減少樣本容量。 4.抽樣方法的不同。在相同的條件下，重復(fù)抽樣的抽樣平均誤差比不重復(fù)抽樣的抽樣平均誤差大，所需要的樣本容量也就不同。重復(fù)抽樣需要更大的樣本容量，而不重復(fù)抽樣的樣本容量則可小一些。提示提示： nz2)1 (22Nnnz61 樣本容量的確定 1、估計總體均值的樣本容量設(shè)為樣本均值與總體均值之間的允許誤差，已知總體方差時，在置信度下，估計總體均值時的樣本容量重復(fù)抽樣樣本容量：不重復(fù)抽樣樣

27、本容量：| XX12222)(Xzn2222222)(zNNznX62 注：確定樣本容量時，無論是總體還是樣本方差均是未知的，所以要用其它的替代。若歷史資料有若干個可供選擇的，應(yīng)該選最大的。63 2、估計總體成數(shù)時的樣本容量估計總體成數(shù)時樣本容量的確定方法與估計總體均值一致，設(shè) 為允許誤差，在的置信度下，樣本容量為重復(fù)抽樣：不重復(fù)抽樣： |pPp1222)1 (pPPzn)1 ()()1 (22222PPzNNPPznX64 注：確定樣本容量時，無論是總體還是樣本成數(shù)均是未知的，所以要用其它的替代。若歷史資料有若干個可供選擇的，應(yīng)該選最靠近50%的。 65 例在區(qū)間估計中,若抽樣允許

28、誤差擴(kuò)大到原來的2倍,樣本容量會如何變化,為原來的多少? 若抽樣允許誤差減少到原來的1/2,樣本容量會如何變化,為原來的多少? 66置信區(qū)間一覽表1nzx22(1)sxtnn2Sxzn前提條件目的置信度的置信區(qū)間正態(tài)總體方差已知(小樣本)估計總體均值正態(tài)總體方差未知（小樣本）估計總體均值總體分布未知，正態(tài)總體方差未知（大樣本）估計總體均值 672222212(1)(1),nsnsnppzp)1 (2前提條件目的 1-置信度的置信區(qū)間正態(tài)總體估計總體方差一個屬性總體大樣本估計總體成數(shù)687.4 其他抽樣組織方式的抽樣誤差其他抽樣組織方式的抽樣誤差在統(tǒng)計實(shí)務(wù)中，簡單隨機(jī)抽樣并非是在統(tǒng)計實(shí)務(wù)

29、中，簡單隨機(jī)抽樣并非是最好的抽樣組織方式。比如一個總體中的最好的抽樣組織方式。比如一個總體中的單位差異很大時，可能我們的樣本代表性單位差異很大時，可能我們的樣本代表性會較低，所以必須更具不同的情況來組織會較低，所以必須更具不同的情況來組織抽樣方式。抽樣方式。697.4.1 分層抽樣（類型抽樣）分層抽樣（類型抽樣）首先將總體單位按某一個標(biāo)志分層；首先將總體單位按某一個標(biāo)志分層；然后在各層按隨機(jī)抽樣的方法分別抽出然后在各層按隨機(jī)抽樣的方法分別抽出各層的樣本。各層的樣本。特點(diǎn)：特點(diǎn)：分層抽樣在層內(nèi)是抽樣調(diào)查，層間是分層抽樣在層內(nèi)是抽樣調(diào)查，層間是全面調(diào)查，所以分層時應(yīng)該盡量讓每層內(nèi)的變?nèi)嬲{(diào)查

30、，所以分層時應(yīng)該盡量讓每層內(nèi)的變異程度小，而層間的變異程度大。分層抽樣的異程度小，而層間的變異程度大。分層抽樣的抽樣誤差較簡單隨機(jī)抽樣小，樣本具有很好的抽樣誤差較簡單隨機(jī)抽樣小，樣本具有很好的代表性。代表性。70抽樣平均誤差的計算公式抽樣平均誤差的計算公式： kiiixNNn12211 通常情況下，分層抽樣的抽樣平均誤差小于簡單通常情況下，分層抽樣的抽樣平均誤差小于簡單隨機(jī)抽樣的平均誤差）。隨機(jī)抽樣的平均誤差）。71一般方法：比例分配法比例分配法考慮每層中的總體單位數(shù)，按比例在每層中抽出相同比例的樣本，即常數(shù)常數(shù)kkNnNnNn11NNNNk21NNnnii每層的樣本容量72概念：概念：首先

31、將總體單位按某一標(biāo)志首先將總體單位按某一標(biāo)志排隊(duì)排隊(duì)，然后計算抽樣間隔距離然后計算抽樣間隔距離K=N/n ，后在第一個抽樣距離內(nèi)后在第一個抽樣距離內(nèi)確定抽樣起點(diǎn)確定抽樣起點(diǎn) r 最后抽取樣本單位（或樣本點(diǎn)）構(gòu)成樣最后抽取樣本單位（或樣本點(diǎn)）構(gòu)成樣本（按固定的間隔和排隊(duì)順序）。本（按固定的間隔和排隊(duì)順序）。關(guān)鍵：關(guān)鍵：1）排隊(duì)（選擇排隊(duì)標(biāo)志，可與調(diào)查標(biāo)志）排隊(duì)（選擇排隊(duì)標(biāo)志，可與調(diào)查標(biāo)志有關(guān)，也可與調(diào)查標(biāo)志無關(guān)）；有關(guān)，也可與調(diào)查標(biāo)志無關(guān)）； 2）確定抽樣起點(diǎn)（即第一個樣本單位）。）確定抽樣起點(diǎn)（即第一個樣本單位）。至于抽樣距離至于抽樣距離k，樣本容量一旦確定，它也隨之，樣本容量一旦確定，

32、它也隨之而定。而定。 7.4.2 等距抽樣（機(jī)械抽樣或系統(tǒng)抽樣等距抽樣（機(jī)械抽樣或系統(tǒng)抽樣）73（一）無關(guān)標(biāo)志排隊(duì)等距抽樣（一）無關(guān)標(biāo)志排隊(duì)等距抽樣排隊(duì)標(biāo)志排隊(duì)標(biāo)志X：X1到到XN由小到大排列，由小到大排列，調(diào)查標(biāo)志調(diào)查標(biāo)志Y：Y1到到Y(jié)N呈現(xiàn)為無序（隨機(jī)）排列。呈現(xiàn)為無序（隨機(jī)）排列。故抽樣起點(diǎn)可隨機(jī)確定，完全遵循了隨機(jī)原則，故抽樣起點(diǎn)可隨機(jī)確定，完全遵循了隨機(jī)原則，不會產(chǎn)生系統(tǒng)偏差不會產(chǎn)生系統(tǒng)偏差。抽樣誤差的計算：通常是按簡單隨機(jī)抽樣的抽樣抽樣誤差的計算：通常是按簡單隨機(jī)抽樣的抽樣誤差公式近似計算的。即抽樣效果近似簡單隨機(jī)抽誤差公式近似計算的。即抽樣效果近似簡單隨機(jī)抽樣。樣。

33、注意：抽樣間隔注意：抽樣間隔現(xiàn)象的周期長度現(xiàn)象的周期長度整數(shù)。否整數(shù)。否則所抽取的樣本有系統(tǒng)偏差。這種周期有時是比較則所抽取的樣本有系統(tǒng)偏差。這種周期有時是比較隱蔽的。如工人交接班時間、地塊中農(nóng)作物垅長、隱蔽的。如工人交接班時間、地塊中農(nóng)作物垅長、社區(qū)住戶調(diào)查中門牌號碼（樓層）。社區(qū)住戶調(diào)查中門牌號碼（樓層）。 74（二）有關(guān)標(biāo)志排隊(duì)等距抽樣（二）有關(guān)標(biāo)志排隊(duì)等距抽樣將總體單位按某一有關(guān)標(biāo)志排隊(duì)，將總體單位按某一有關(guān)標(biāo)志排隊(duì)，排隊(duì)標(biāo)志排隊(duì)標(biāo)志X：X1到到XN由小到大排列，由小到大排列，調(diào)查標(biāo)志調(diào)查標(biāo)志Y：Y1到到Y(jié)N也大體上呈現(xiàn)為有序排列也大體上呈現(xiàn)為有序排列（當(dāng)（當(dāng)X與與Y正相關(guān)時，正相關(guān)時，Y大體上由小到大排列；大體上由小到大排列； Y大體上由大到小排列。）大體上由大到小排列

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

《統(tǒng)計學(xué)》第七章抽樣估計匯總

文檔簡介

溫馨提示

最新文檔

評論

《統(tǒng)計學(xué)》第七章抽樣估計匯總

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔