《統(tǒng)計學(xué)》第七章抽樣估計匯總_第1頁
《統(tǒng)計學(xué)》第七章抽樣估計匯總_第2頁
《統(tǒng)計學(xué)》第七章抽樣估計匯總_第3頁
《統(tǒng)計學(xué)》第七章抽樣估計匯總_第4頁
《統(tǒng)計學(xué)》第七章抽樣估計匯總_第5頁
已閱讀5頁,還剩75頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第七章第七章 參數(shù)估計參數(shù)估計2參數(shù)估計在統(tǒng)計方法中的地位參數(shù)估計在統(tǒng)計方法中的地位v統(tǒng)計方法統(tǒng)計方法描述統(tǒng)計描述統(tǒng)計推斷統(tǒng)計推斷統(tǒng)計抽樣估計抽樣估計參數(shù)估計參數(shù)估計其它方法其它方法假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)3統(tǒng)計推斷的過程樣本總體樣本統(tǒng)計量樣本統(tǒng)計量例如:樣本均值、比例、方差總體均值、總體均值、比例、方差比例、方差47.1 抽樣估計的基本問題抽樣估計的基本問題7.2 點(diǎn)估計點(diǎn)估計7.3 簡單隨機(jī)抽樣的區(qū)間估計簡單隨機(jī)抽樣的區(qū)間估計7.4 其它抽樣組織方式的抽樣誤差其它抽樣組織方式的抽樣誤差7.1 抽樣估計的基本問題抽樣估計的基本問題 7.1.1 抽樣估計的意義 抽樣估計是按隨機(jī)原則從總體中抽取一部抽樣

2、估計是按隨機(jī)原則從總體中抽取一部分單位進(jìn)行調(diào)查,并以調(diào)查結(jié)果對總體的數(shù)分單位進(jìn)行調(diào)查,并以調(diào)查結(jié)果對總體的數(shù)量特征作出具有一定可靠程度的估計與推斷。量特征作出具有一定可靠程度的估計與推斷。 必須具有的工作必須具有的工作抽樣、推斷和計算可靠度。抽樣、推斷和計算可靠度。56 應(yīng)用抽樣調(diào)查和推斷的原因,應(yīng)用抽樣調(diào)查和推斷的原因, 不可能進(jìn)行全面調(diào)查。不可能進(jìn)行全面調(diào)查。 不必要進(jìn)行全面調(diào)查。不必要進(jìn)行全面調(diào)查。 數(shù)據(jù)及時性要求。數(shù)據(jù)及時性要求。 驗(yàn)證全面調(diào)查結(jié)果驗(yàn)證全面調(diào)查結(jié)果 。77.1.2 抽樣設(shè)計1. 抽樣框目標(biāo)總體統(tǒng)計總體。 抽樣框包含全部抽樣單位的名單。編制抽樣框編制抽樣框 確定抽樣范圍。

3、確定抽樣范圍。抽樣單位(一個或多個總體單位)抽樣單位(一個或多個總體單位) (1)名單抽樣框)名單抽樣框 (2)區(qū)域抽樣框)區(qū)域抽樣框 (3)時間表抽樣框)時間表抽樣框8一個理想的抽樣框應(yīng)該與目標(biāo)總體一致,一個理想的抽樣框應(yīng)該與目標(biāo)總體一致,即應(yīng)包括全部總體單位,既不重復(fù)也不遺漏。即應(yīng)包括全部總體單位,既不重復(fù)也不遺漏。也就是說,每個總體單位在抽樣框里必須出現(xiàn)也就是說,每個總體單位在抽樣框里必須出現(xiàn)一次而且只能出現(xiàn)一次,以保證抽樣框能完全一次而且只能出現(xiàn)一次,以保證抽樣框能完全代表目標(biāo)總體。代表目標(biāo)總體。92. 抽樣方法 重復(fù)抽樣,也叫回置抽樣重復(fù)抽樣,也叫回置抽樣,是指從總體的個,是指從總體

4、的個單位中抽取一個容量為單位中抽取一個容量為n的樣本,每次抽出一個單位的樣本,每次抽出一個單位后,再將其放回總體中參加下一次抽取,這樣連續(xù)后,再將其放回總體中參加下一次抽取,這樣連續(xù)抽抽n次即得到一個樣本。次即得到一個樣本。 同一總體單位有可能被重復(fù)抽中,同一總體單位有可能被重復(fù)抽中, 每次都是從個總體單位中抽取每次都是從個總體單位中抽取 每個總體單位被抽中可能性均為每個總體單位被抽中可能性均為1/N。 如果考慮排列問題,所有可能的樣本數(shù)為如果考慮排列問題,所有可能的樣本數(shù)為Nn。如果不考慮排列可能的樣本數(shù)為如果不考慮排列可能的樣本數(shù)為 。 1nN nC 10不重復(fù)抽樣,也叫不回置抽樣,不重復(fù)

5、抽樣,也叫不回置抽樣,是指是指抽中單位不再放回總體中,下一個樣本單抽中單位不再放回總體中,下一個樣本單位只能從余下的總體單位中抽取。位只能從余下的總體單位中抽取。 同一總體單位不可能被重復(fù)抽中同一總體單位不可能被重復(fù)抽中. 每次抽取是在不同數(shù)目的總體單位中每次抽取是在不同數(shù)目的總體單位中進(jìn)行的,每個總體單位被抽中的概率為進(jìn)行的,每個總體單位被抽中的概率為1/N。 如果僅僅考慮組合,所有可能的樣本數(shù)如果僅僅考慮組合,所有可能的樣本數(shù)為為 ,如果考慮排列為,如果考慮排列為 。nNC!()!nNn11 3.抽樣組織方式 簡單隨機(jī)抽樣是最基本的抽樣組織方式,數(shù)理簡單隨機(jī)抽樣是最基本的抽樣組織方式,數(shù)理

6、統(tǒng)計均以簡單隨機(jī)抽樣入手,有很成熟的理論。統(tǒng)計均以簡單隨機(jī)抽樣入手,有很成熟的理論。 統(tǒng)計實(shí)務(wù)中根據(jù)總體的特點(diǎn)有各種不同的抽樣統(tǒng)計實(shí)務(wù)中根據(jù)總體的特點(diǎn)有各種不同的抽樣組織方法。分層抽樣、等距抽樣、組織方法。分層抽樣、等距抽樣、 整群抽樣、整群抽樣、 多階段抽樣等。多階段抽樣等。12 7.1.3 抽樣估計誤差 誤差:登記性誤差和代表性誤差誤差:登記性誤差和代表性誤差 登記性誤差可以避免,減小到最小限度系統(tǒng)性誤差可以避免,減小到最小限度代表性誤差抽樣誤差不能避免,只可控制137.2 點(diǎn)估計點(diǎn)估計 7.2.1 矩估計矩估計 7.2.2 極大似然估計極大似然估計 7.2.3 估計量的評價標(biāo)準(zhǔn)估計量的評

7、價標(biāo)準(zhǔn)14假設(shè)在 總體中, 為未知參數(shù)(均值、方差、成數(shù)等)。由樣本 構(gòu)造統(tǒng)計量,來 估計未知參數(shù) 。 稱 為 的點(diǎn)估計量。 將某次抽樣的樣本觀測值,代入 得點(diǎn)估計值 。點(diǎn)估計X12,nXXX12(,)nXXX12(,)nXXX12( ,)nx xx15 思想:一種古老的估計法。基本思想是用樣本的指標(biāo)替代總體的指標(biāo),然后通過方程解出未知參數(shù)。 設(shè)總體的密度函數(shù)為f(x;1, k)。 7.2.1矩估計法1611( ,)( ;,)jjkkmx f xdx連續(xù)型 11( ,)()njjkiiimxp Xx離散型 1.前提1:總體的各階原點(diǎn)矩是總體未知參數(shù)的函數(shù)。 17 2.前提2:辛欽大數(shù)定律。總體

8、的原點(diǎn)矩存在時,當(dāng)樣本容量趨于無窮時,樣本的原點(diǎn)矩收斂到總體的原點(diǎn)矩。 18111( ,)nkiimXn2211( ,)nkiimXn211( ,)nkkiimXn3.解法解法 求解方程組得解 ,稱 為總體參數(shù)的矩估計。 k,1k,119 總體的分布為均勻分布,求的矩估計。10, ( )00, xf xx20例例 設(shè)設(shè) 是來自某總體的樣本,且均值是來自某總體的樣本,且均值 和和方差方差 存在。求總體的均值和方差的矩估計。存在。求總體的均值和方差的矩估計。nXXX,212niiXnXE11)( 所以22niiXnXE1221)( 所以)( XE因?yàn)?22)( XE又因?yàn)閚iiniiXnXn122

9、2111解方程組,得XXnnii11 21221 XXnnii21)(1 XXnnii21 7.2.2極大似然估計極大似然估計 甲廠收到供應(yīng)商提供的一批貨物,根據(jù)以往的經(jīng)驗(yàn),該供應(yīng)商的產(chǎn)品次品率為10%,而供應(yīng)商聲稱次品率僅有5%。若隨機(jī)抽出10件檢驗(yàn),結(jié)果有4件次品。購貨方應(yīng)該如何做決策。記次品數(shù)為 ,則 服從二項(xiàng)分布。若 則10件中有4件次品的概率為 若 則10件中有4件次品的概率為 X,05. 0p001. 095. 005. 0)4(64410CXP, 1 . 0p0112. 09 . 01 . 0)4(64410CXPX22計算的結(jié)果表明,在次品為0.1時,10件產(chǎn)品中有4件次品的概

10、率大,這說明該批產(chǎn)品次品率為0.1的可能性大。由于樣本來源于總體,樣本能很好反映總體的特征。思想:概率最大的事件最可能發(fā)生。假設(shè)總 體 的分布函數(shù)已知,但是參數(shù) 未知。從總體中抽出樣本,并計算各可能參數(shù)值條件下樣本發(fā)生的可能性,使樣本發(fā)生的可能性最大的 是參數(shù)的極大似然估計量X), 1(kii), 1(kii23數(shù)學(xué)理論:設(shè)總體 的分布密度函數(shù)為 其中 為待估參數(shù)。 為總體的簡單隨機(jī)樣本。則其聯(lián)合密度函數(shù)為 對給定的一個樣本觀測值 ,稱 為樣本的似然函數(shù)。X),;(1kxfk,1nXX,1nxx,1),;,(2121knxxxLnikixf11),;(nikixf11),;(24 使似然函數(shù)達(dá)

11、到極大值的 ,是總體參數(shù)的極大似然估計。利用微積分的結(jié)論,函數(shù)在一階導(dǎo)數(shù)零處達(dá)到極值。所以,總體參數(shù)的極大似然估計 是下列方程組的根。k,1k,112000kLLL 由于函數(shù)和函數(shù)的對數(shù)是在同一點(diǎn)達(dá)到極值,所以為了運(yùn)算上的方便,我們常常對似然函數(shù)去對數(shù),得到對數(shù)似然函數(shù),使乘積變成求和,更方便運(yùn)算。所以2512ln0ln0ln0kLLL26 0-1分布的數(shù)學(xué)期望為p,在總體中抽隨機(jī)樣本 ,樣本發(fā)生的概率為:),(21nxxxiiiixnxxxnipppp)1 ()1 (110)1 (lniixnxppp0)1ln()(lnpxnpxpii01pxnpxiiixnp1 使上式最大的P滿足27 例

12、例 設(shè)是來自正態(tài)總體設(shè)是來自正態(tài)總體 的樣本,的樣本,均值和方差存在。求總體的均值和方差的極大似然估計。均值和方差存在。求總體的均值和方差的極大似然估計。),(2NnXXX,21222)(12121),(ixninexxxfLniixnL12222)()2ln(2lnniixL10)(lnniixnL124220)(212ln解方程組,得,1 1XXnnii21221 XXnnii2829 無偏性無偏性 有效性有效性 一致性一致性7.2.3 點(diǎn)估計量的評價準(zhǔn)則點(diǎn)估計量的評價準(zhǔn)則30設(shè)為未知參數(shù)的估計量,若則稱 為的無偏估計量。1. 無偏性無偏性( )Elim()nnE若則稱 為的漸近無偏估計量

13、。31總體X(3 4 5),抽容量為2的樣本。即(33)3 (34)3.5 (35)4(43)3.5 (44)4 (45)4.5(53)4 (54)4.5 (55)5 32 可見樣本平均數(shù)就是總體平均數(shù)的無偏估計量。 以無偏性來評判估計量是很合理的。一個好的估計量就某一個具體的估計值而言,可能不等于總體參數(shù)值,但平均地看有向估計的參數(shù)集中的趨勢。( )33.543.544.544.55936/94E x33 證明樣本均值是總體均值 的一個無偏估計量,但樣本方差 不是總體方差 的無偏估計量。解:由于2X2nSniinniiXXnSXnX12211,1從而 niniinXEnXE1111又因?yàn)閚i

14、inXXnS12221所以21221222111nnnnXEXEnSEniniin即22nSE34設(shè)為 的兩個無偏估計量,若21,)()(21DD則稱 比 有效。1二、有效性二、有效性2設(shè)為 的估計量,稱2)()( EMSE為 的均方誤差,并且2222)()()()()()(EEEEEEEMSE記,則)(EB)()()(2BDMSE35 設(shè) 是總體X的樣本 均是平均數(shù)的無偏估計量,但比 有效。 21,12,nXXX11X2()D Xn21ixn21()D X21ixn11X36思考題:設(shè) 是總體X 的一個容量為3的樣本, 是總體均值的估計量,它們是無偏估計量嗎?若是,哪一個更有效。123,X

15、XX11231()3XXX21231(23)6XXX37 設(shè)為未知參數(shù)的估計量,當(dāng)時,按概率收斂于。即三、一致性三、一致性n1)(limPn,則稱 為的一致估計量038隨著樣本容量增大,估計量會越來越接近被估計的參數(shù)。即對任意的0,有 則稱 是參數(shù)的一致估計量。一致估計量是大樣本所呈現(xiàn)的性質(zhì)。若某個估計量是待估參數(shù)的一致估計量,意味著樣本容量很大時,估計量和待估參數(shù)接近的可能性幾乎等于100%。lim|1nP 397.3 區(qū)間估計區(qū)間估計 區(qū)間估計的思想 基本概念 單個總體均值的置信區(qū)間 總體成數(shù)的置信區(qū)間 總體方差的置信區(qū)間40 某保險公司欲了解某個險種投保人的平均年齡,隨機(jī)抽取24人,計算

16、出24人的平均年齡為39歲,總體標(biāo)準(zhǔn)差 7.2歲。試以95%的置信度估計該險種投保人的平均年齡。設(shè)投保人的年齡 , 且 已知, 是X的一個樣本。 當(dāng)討論總體均值的置信區(qū)間時,首先應(yīng)該從總體均值的點(diǎn)估計量 出發(fā)。2( ,)XN 212,nXXXX41 由前面的討論已知 ,有 由此,根據(jù)給定的置信度1-,可以確定,使在區(qū)間 上取值的概率等于 1-即 經(jīng)過整理,可得 2( ,)XNn(0,1)XZNn2u22(,)uu22()1XPuun 22()1P XuXunn 42 由樣本得樣本均值 ,標(biāo)準(zhǔn)差 = 7.2 對于給定的置信度95%,有=0.05查標(biāo)準(zhǔn)正態(tài)分布表確定臨界值 。 所以有 投保人的年齡

17、以95%的可靠程度在36.13到41.87歲。39X 0.0251.96z7.27.239 1.96391.962424,(392.866392.866,)(36.134,41.866)43 95可靠程度,如果大,說明什么?(36.134,41.866)置信區(qū)間,如果區(qū)間很短,說明什么?這是評價區(qū)間估計的兩個標(biāo)準(zhǔn)這是評價區(qū)間估計的兩個標(biāo)準(zhǔn) 可靠度(置信度)可靠度(置信度) 置信區(qū)間(置信區(qū)間的半徑,精確度)置信區(qū)間(置信區(qū)間的半徑,精確度)44nXXX,217.3.1 區(qū)間估計的概念區(qū)間估計的概念設(shè)是來自總體的一個樣本,是總體未知參數(shù)。對給定的,如能確定兩個統(tǒng)計量 和 ,滿足) 10(121P

18、則稱為置信度或置信概率,是的置信度的置信區(qū)間,稱為顯著性水平。置信度可以用頻率來說明。如果是置信度 0.95 置信區(qū)間,當(dāng)從總體中多次取樣本容量為 n 的樣本時,則每次可得到一個置信區(qū)間,這些置信區(qū)間有的包含,而有的則不包含,但平均來說,包含的置信區(qū)間的頻率應(yīng)在 0.95 附近波動。),(21111),(211245評價區(qū)間估計的兩個標(biāo)準(zhǔn):估計的可靠度。置信度1-反映了區(qū)間估計的可信度。置信水平 =0.95,說明估計區(qū)間 以95%的概率包含總體的參數(shù)?;蛘哒f,100個這樣的估計區(qū)間中,平均有95個包含了總體參數(shù);估計的精確度。區(qū)間的長度 反映了區(qū)間估計的精確度。當(dāng)區(qū)間的長度愈大,估計區(qū)間包含真

19、值的可能性也就愈大,但是估計也愈不精確。可靠度和精確度是相互矛盾的。112(),21()-46估計的可靠度。估計的可靠度。置信度 反映了區(qū)間估計的可信度。置信水平 =0.95,說明估計區(qū)間 以95%的概率包含總體的參數(shù)。或者說,100個這樣的估計區(qū)間中,平均有95個包含了總體參數(shù);121,14748 區(qū)間的長度: (上限下限) 區(qū)間的半徑:(上限下限)/2 反映了區(qū)間估計的精確度。當(dāng)區(qū)間的長度愈大,雖然估計區(qū)間包含真值的可能性愈大,但是估計卻不精確。估計的精確度估計的精確度49 可靠度和精確度是相互矛盾的。當(dāng)其中之一確定時可靠度和精確度是相互矛盾的。當(dāng)其中之一確定時,擴(kuò)大樣本容量可以改善另一個

20、。,擴(kuò)大樣本容量可以改善另一個。507.3.2 單個正態(tài)總體均值的置信區(qū)間單個正態(tài)總體均值的置信區(qū)間 1、當(dāng)總體方差已知時,總體均值的置信區(qū)間為: 2、當(dāng)總體方差未知時,總體均值的置信區(qū)間為:22(,)XzXznn22(1)(1)SSXtnXtnnn,51 7.3.3 成數(shù)的置信區(qū)間成數(shù)的置信區(qū)間 1、單個總體成數(shù)的置信區(qū)間設(shè)從成數(shù)為P的總體X中隨機(jī)抽出容量為n的樣本,其中是樣本中具有某種統(tǒng)計特性的單位的數(shù)量為 ,則樣本的成數(shù)為 。在給定的置信度下 ,總體成數(shù)的置信區(qū)間為 1nnnp11nPPzpnPPzp)(,1)1 (22在估計總體的成數(shù)時,總體的成數(shù)是未知的,所以在置信上下限中的P可以用

21、樣本成數(shù)代替,當(dāng)樣本容量足夠大,誤差很小。52 例5.4 為了研究我國所生產(chǎn)的絲綢產(chǎn)品在國外的銷路,在紐約所舉辦的絲綢展銷會上,對1000名成年人進(jìn)行了調(diào)查,得知600人喜歡這種產(chǎn)品。試以95%的置信度估計紐約市成年人喜歡此種產(chǎn)品的比率獲得置信區(qū)間。nppzp)1 (26 . 01000600p96. 12z1000n1000)6 . 01 (6 . 096. 160. 053 設(shè)總體設(shè)總體 服從正態(tài)分布,服從正態(tài)分布, 是抽自是抽自該總體的簡單隨機(jī)樣本,對于給定的置信度該總體的簡單隨機(jī)樣本,對于給定的置信度 ,查查 分布表得臨界值分布表得臨界值 和和 , 的置信度為的置信度為 的置信區(qū)間為的

22、置信區(qū)間為 X12,nXXX1212(1)n22(1)n2212222212(1)1(1)1nSnSnn(),() 7.3.4 單個總體方差的置信區(qū)間單個總體方差的置信區(qū)間54 例5.3 某手表廠生產(chǎn)的精益牌手表,其走時誤差為正態(tài)分布,(單位:秒/日)。檢驗(yàn)員從裝配線上隨機(jī)抽出9只進(jìn)行檢驗(yàn),檢測的結(jié)果如下:-4.0,3.1,2.5,-2.9,0.9,1.1,2.0,-3.0,2.8取置信水平為0.95,求該品牌手表的走時,誤差的均值和方差的置信區(qū)間。 置信區(qū)間為27. 098 . 21 . 30 . 49191iixx2(1)sxtnn921()9 12.79iiSxx306. 2)8(025

23、. 0t979. 2306. 227. 055【例6】EXCEL數(shù)據(jù)“汽車傳動”Metropolitan Research有限公司是一家消費(fèi)者研究組織,它設(shè)計調(diào)查,對消費(fèi)者所使用的大量的產(chǎn)品和服務(wù)進(jìn)行評估。在某一項(xiàng)研究中,Metropolitan調(diào)查消費(fèi)者對底特律某一個主要制造商所生產(chǎn)的汽車的性能的滿意程度。分發(fā)給該制造商所生產(chǎn)的一種最大型號小汽車用戶的調(diào)查表表明,許多人抱怨該車剛開始傳動系統(tǒng)不佳。為了更好地了解傳動系統(tǒng)的問題,Metropolitan采用由底特律地區(qū)一個修理企業(yè)所提供的實(shí)際傳動系統(tǒng)的維修記錄為樣本。56管理報告管理報告 (1)用適當(dāng)?shù)拿枋鼋y(tǒng)計量匯總傳動系統(tǒng)數(shù)據(jù)。 (2)求曾經(jīng)

24、出現(xiàn)過傳動系統(tǒng)問題的汽車總體中在出現(xiàn)傳動系統(tǒng)問題時所行駛里程的均值的95%置信區(qū)間,并對該區(qū)間估計做出管理上的解釋。57平均平均73342.373342.3標(biāo)準(zhǔn)誤差標(biāo)準(zhǔn)誤差3521.2214733521.221473中位數(shù)中位數(shù)7270572705眾數(shù)眾數(shù)#N/A#N/A標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差24898.7958224898.79582方差方差619950033.2619950033.2峰度峰度0.1669920250.166992025偏度偏度0.259864830.25986483區(qū)域區(qū)域113048113048最小值最小值2506625066最大值最大值138114138114求和求和366711

25、53667115觀測數(shù)觀測數(shù)5050最大最大(1)(1)138114138114最小最小(1)(1)2506625066置信度置信度(95.0%)(95.0%)7076.1593447076.159344我們可以看出可靠性汽車傳動裝置出問題的時間差異是很大的。生產(chǎn)過程的質(zhì)量不穩(wěn)定。587.3.5 樣本容量的確定樣本容量的確定 影響樣本容量的因素 樣本容量的確定 區(qū)間估計一覽表 59 一、影響樣本容量的因素一、影響樣本容量的因素 1.總體的變異程度高低。(總體方差的大?。?2.允許誤差的大小。允許誤差指允許的抽樣誤差,記為 。例如樣本均值與總體均值之間的允許誤差可以表示為 。允許誤差以絕對值的形

26、式表現(xiàn)了抽樣誤差的可能范圍,所以又稱為極限誤差。|XX|60 3.置信度的大小。 1-說明了估計的可靠程度。所以,在其他條件不變的情況下,如果要求較高的可靠度,就要增大樣本容量;反之,可以相應(yīng)減少樣本容量。 4.抽樣方法的不同。在相同的條件下,重復(fù)抽樣的抽樣平均誤差比不重復(fù)抽樣的抽樣平均誤差大,所需要的樣本容量也就不同。重復(fù)抽樣需要更大的樣本容量,而不重復(fù)抽樣的樣本容量則可小一些。提示提示: nz2)1 (22Nnnz61 樣本容量的確定 1、 估計總體均值的樣本容量 設(shè)為樣本均值與總體均值之間的允許誤差 ,已知總體方差時 ,在置信度 下,估計總體均值時的樣本容量重復(fù)抽樣樣本容量:不重復(fù)抽樣樣

27、本容量:| XX12222)(Xzn2222222)(zNNznX62 注:確定樣本容量時,無論是總體還是樣本方差均是未知的,所以要用其它的替代。若歷史資料有若干個可供選擇的,應(yīng)該選最大的。63 2、估計總體成數(shù)時的樣本容量 估計總體成數(shù)時樣本容量的確定方法與估計總體均值一致,設(shè) 為允許誤差,在的置信度下 ,樣本容量為 重復(fù)抽樣: 不重復(fù)抽樣: |pPp1222)1 (pPPzn)1 ()()1 (22222PPzNNPPznX64 注:確定樣本容量時,無論是總體還是樣本成數(shù)均是未知的,所以要用其它的替代。若歷史資料有若干個可供選擇的,應(yīng)該選最靠近50%的。 65 例 在區(qū)間估計中,若抽樣允許

28、誤差擴(kuò)大到原來的2倍,樣本容量會如何變化,為原來的多少? 若抽樣允許誤差減少到原來的1/2,樣本容量會如何變化,為原來的多少? 66置信區(qū)間一覽表1nzx22(1)sxtnn2Sxzn前提條件目的 置信度的置信區(qū)間正態(tài)總體方差已知(小樣本)估計總體均值正態(tài)總體方差未知(小樣本)估計總體均值 總體分布未知,正態(tài)總體方差未知 (大樣本)估計總體均值 672222212(1)(1),nsnsnppzp)1 (2前提條件目的 1-置信度的置信區(qū)間正態(tài)總體估計總體方差一個屬性總體大樣本估計總體成數(shù)687.4 其他抽樣組織方式的抽樣誤差其他抽樣組織方式的抽樣誤差 在統(tǒng)計實(shí)務(wù)中,簡單隨機(jī)抽樣并非是在統(tǒng)計實(shí)務(wù)

29、中,簡單隨機(jī)抽樣并非是最好的抽樣組織方式。比如一個總體中的最好的抽樣組織方式。比如一個總體中的單位差異很大時,可能我們的樣本代表性單位差異很大時,可能我們的樣本代表性會較低,所以必須更具不同的情況來組織會較低,所以必須更具不同的情況來組織抽樣方式。抽樣方式。697.4.1 分層抽樣(類型抽樣)分層抽樣(類型抽樣) 首先將總體單位按某一個標(biāo)志分層;首先將總體單位按某一個標(biāo)志分層; 然后在各層按隨機(jī)抽樣的方法分別抽出然后在各層按隨機(jī)抽樣的方法分別抽出各層的樣本。各層的樣本。 特點(diǎn):特點(diǎn):分層抽樣在層內(nèi)是抽樣調(diào)查,層間是分層抽樣在層內(nèi)是抽樣調(diào)查,層間是全面調(diào)查,所以分層時應(yīng)該盡量讓每層內(nèi)的變?nèi)嬲{(diào)查

30、,所以分層時應(yīng)該盡量讓每層內(nèi)的變異程度小,而層間的變異程度大。分層抽樣的異程度小,而層間的變異程度大。分層抽樣的抽樣誤差較簡單隨機(jī)抽樣小,樣本具有很好的抽樣誤差較簡單隨機(jī)抽樣小,樣本具有很好的代表性。代表性。70抽樣平均誤差的計算公式抽樣平均誤差的計算公式: kiiixNNn12211 通常情況下,分層抽樣的抽樣平均誤差小于簡單通常情況下,分層抽樣的抽樣平均誤差小于簡單隨機(jī)抽樣的平均誤差)。隨機(jī)抽樣的平均誤差)。71一般方法:比例分配法比例分配法 考慮每層中的總體單位數(shù),按比例在每層中抽出相同比例的樣本,即常數(shù)常數(shù)kkNnNnNn11NNNNk21NNnnii每層的樣本容量72概念:概念:首先

31、將總體單位按某一標(biāo)志首先將總體單位按某一標(biāo)志排隊(duì)排隊(duì), 然后計算抽樣間隔距離然后計算抽樣間隔距離K=N/n , 后在第一個抽樣距離內(nèi)后在第一個抽樣距離內(nèi)確定抽樣起點(diǎn)確定抽樣起點(diǎn) r 最后抽取樣本單位(或樣本點(diǎn))構(gòu)成樣最后抽取樣本單位(或樣本點(diǎn))構(gòu)成樣本(按固定的間隔和排隊(duì)順序)。本(按固定的間隔和排隊(duì)順序)。關(guān)鍵:關(guān)鍵:1)排隊(duì)(選擇排隊(duì)標(biāo)志,可與調(diào)查標(biāo)志)排隊(duì)(選擇排隊(duì)標(biāo)志,可與調(diào)查標(biāo)志有關(guān),也可與調(diào)查標(biāo)志無關(guān));有關(guān),也可與調(diào)查標(biāo)志無關(guān)); 2)確定抽樣起點(diǎn)(即第一個樣本單位)。)確定抽樣起點(diǎn)(即第一個樣本單位)。 至于抽樣距離至于抽樣距離k,樣本容量一旦確定,它也隨之,樣本容量一旦確定,

32、它也隨之而定。而定。 7.4.2 等距抽樣(機(jī)械抽樣或系統(tǒng)抽樣等距抽樣(機(jī)械抽樣或系統(tǒng)抽樣 )73(一)無關(guān)標(biāo)志排隊(duì)等距抽樣(一)無關(guān)標(biāo)志排隊(duì)等距抽樣 排隊(duì)標(biāo)志排隊(duì)標(biāo)志X:X1到到XN由小到大排列,由小到大排列, 調(diào)查標(biāo)志調(diào)查標(biāo)志Y:Y1到到Y(jié)N呈現(xiàn)為無序(隨機(jī))排列。呈現(xiàn)為無序(隨機(jī))排列。 故抽樣起點(diǎn)可隨機(jī)確定,完全遵循了隨機(jī)原則,故抽樣起點(diǎn)可隨機(jī)確定,完全遵循了隨機(jī)原則,不會產(chǎn)生系統(tǒng)偏差不會產(chǎn)生系統(tǒng)偏差 。 抽樣誤差的計算:通常是按簡單隨機(jī)抽樣的抽樣抽樣誤差的計算:通常是按簡單隨機(jī)抽樣的抽樣誤差公式近似計算的。即抽樣效果近似簡單隨機(jī)抽誤差公式近似計算的。即抽樣效果近似簡單隨機(jī)抽樣。樣。

33、注意:抽樣間隔注意:抽樣間隔現(xiàn)象的周期長度現(xiàn)象的周期長度整數(shù)。否整數(shù)。否則所抽取的樣本有系統(tǒng)偏差。這種周期有時是比較則所抽取的樣本有系統(tǒng)偏差。這種周期有時是比較隱蔽的。如工人交接班時間、地塊中農(nóng)作物垅長、隱蔽的。如工人交接班時間、地塊中農(nóng)作物垅長、社區(qū)住戶調(diào)查中門牌號碼(樓層)。社區(qū)住戶調(diào)查中門牌號碼(樓層)。 74(二)有關(guān)標(biāo)志排隊(duì)等距抽樣(二)有關(guān)標(biāo)志排隊(duì)等距抽樣 將總體單位按某一有關(guān)標(biāo)志排隊(duì),將總體單位按某一有關(guān)標(biāo)志排隊(duì),排隊(duì)標(biāo)志排隊(duì)標(biāo)志X:X1到到XN由小到大排列,由小到大排列,調(diào)查標(biāo)志調(diào)查標(biāo)志Y:Y1到到Y(jié)N也大體上呈現(xiàn)為有序排列也大體上呈現(xiàn)為有序排列(當(dāng)(當(dāng)X與與Y正相關(guān)時,正相關(guān)時,Y大體上由小到大排列;大體上由小到大排列; Y大體上由大到小排列。)大體上由大到小排列

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論