版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、統(tǒng)計學(xué)-ch7 suyl1第七章參數(shù)估計點估計區(qū)間估計抽樣估計的進一步討論統(tǒng)計學(xué)-ch7 suyl2l 數(shù)理統(tǒng)計的基本問題之一是根據(jù)樣本所提供的信息,對總體的分布以及分布的數(shù)字特征做出統(tǒng)計推斷。通過樣本估計總體未知參數(shù)的方法主要包括參數(shù)估計和非參數(shù)估計法。這里的參數(shù)可以是總體分布中的未知參數(shù),也可以是總體的某個數(shù)字特征。參數(shù)估計通常是通過構(gòu)造樣本的函數(shù)樣本統(tǒng)計量來實現(xiàn)的。統(tǒng)計學(xué)-ch7 suyl3參數(shù)估計示意圖總體總體樣樣本本統(tǒng)計量統(tǒng)計量描述描述作出推斷作出推斷統(tǒng)計量是進行參數(shù)估計的關(guān)鍵統(tǒng)計量是進行參數(shù)估計的關(guān)鍵.不同的參數(shù)估計不同的參數(shù)估計方法得到的統(tǒng)計量可能不同方法得到的統(tǒng)計量可能不同.在
2、這里在這里,我們介紹兩我們介紹兩種常用的參數(shù)估計方法種常用的參數(shù)估計方法:點估計法和區(qū)間估計法點估計法和區(qū)間估計法.隨機抽樣隨機抽樣統(tǒng)計學(xué)-ch7 suyl4點估計概念點估計概念求點估計量的兩種方法求點估計量的兩種方法統(tǒng)計學(xué)-ch7 suyl5,其中,其中7.1.1 點估計概念點估計概念隨機抽查隨機抽查5050天的銷售金額(單位:萬元):天的銷售金額(單位:萬元):30,27,26,38,35,22,41 呢呢 ? ? 據(jù)此據(jù)此, ,我們應(yīng)如何估計我們應(yīng)如何估計和和而全部信息就由這而全部信息就由這50個數(shù)組成個數(shù)組成 .例例 某商場每日銷售金額某商場每日銷售金額X X2( ,)N u 2, u
3、 未知未知7.1 點估計點估計統(tǒng)計學(xué)-ch7 suyl6設(shè)總體設(shè)總體X的分布的函數(shù)的形式為已知的分布的函數(shù)的形式為已知(如正態(tài)分布、泊松如正態(tài)分布、泊松分布等分布等),但它的一個或多個參數(shù)未知,借助總體,但它的一個或多個參數(shù)未知,借助總體X的一的一個樣本來估計總體未知參數(shù)的值的問題,稱為參數(shù)的個樣本來估計總體未知參數(shù)的值的問題,稱為參數(shù)的點估計點估計問題。問題。統(tǒng)計學(xué)-ch7 suyl7如何尋找樣本統(tǒng)計量?如何尋找樣本統(tǒng)計量? 有很多方法都可以用來構(gòu)造樣本統(tǒng)有很多方法都可以用來構(gòu)造樣本統(tǒng)計量,比如矩估計法、極大似然估計法、計量,比如矩估計法、極大似然估計法、最小二乘估計法、順序統(tǒng)計量法最小二乘
4、估計法、順序統(tǒng)計量法 這里,我們主要介紹矩估計法和極這里,我們主要介紹矩估計法和極大似然估計法。大似然估計法。統(tǒng)計學(xué)-ch7 suyl87.1.2 矩估計法矩估計法統(tǒng)計學(xué)中,矩是指以期望值為基礎(chǔ)而定義的數(shù)字特征,如數(shù)學(xué)期望、方差、協(xié)方差等。矩估計法是英國統(tǒng)計學(xué)家K.皮爾遜最早提出來的,其理論基礎(chǔ)是大數(shù)定理。統(tǒng)計學(xué)-ch7 suyl9矩估計法的基本思想就是:矩估計法的基本思想就是:樣本均值樣本均值1niiXXn 是一階樣本矩是一階樣本矩, , 總體均值總體均值E(X)是一階是一階 總體矩??傮w矩。把樣本矩作為相應(yīng)的總體矩的估計量把樣本矩作為相應(yīng)的總體矩的估計量就是把一階就是把一階樣本矩樣本矩 作
5、為一階作為一階總體矩總體矩的估計量的估計量. .X作為作為E(X)E(X)的估計量的做法的估計量的做法, , 將將推廣這種做法推廣這種做法,把把二階樣本矩二階樣本矩作為二階作為二階總體矩總體矩的估計量的估計量, 把三階樣本矩作為三階總體矩的估計量把三階樣本矩作為三階總體矩的估計量, , . .這種方法就是這種方法就是矩估計法矩估計法. . 統(tǒng)計學(xué)-ch7 suyl10矩估計法的一般步驟如下:l 設(shè)總體的分布中包含 個未知參數(shù), 則其分布函數(shù)可以表示為 。若總體 X 的 階原點矩 l 存在,l 且為x的函數(shù),記為 。 l 分別用樣本的k階原點矩 去估計總體的K階原點矩,即l l 12,k k k
6、 kk12( ;,.,)kF x k k kk()kkE X12,kk nXniki/11211,.,1,2,nkkkiiXikn 統(tǒng)計學(xué)-ch7 suyl11 l 上式確定了包含個未知參數(shù)的個方程式,即有下列方程組l l l l 解聯(lián)立方程組,就可得到未知參數(shù) 的矩估計量l 它是樣本的函數(shù)。將樣本觀測值 代入矩估計量,即得到 的矩估計值 。111()(6.2)1()niinkkiiE XXnE XXni12,.,iinXXX 12,.,nx xxi12,.,iinx xx 統(tǒng)計學(xué)-ch7 suyl12例例1 1 設(shè)總體設(shè)總體X X的均值的均值 及方差及方差 2 均存在均存在 , ,且且 2
7、0,0,但但 均為未知均為未知. .又設(shè)又設(shè) 是一個樣本是一個樣本, ,試求試求 2、的估計量的估計量. .、12,.,nXXX2 解解 總體的一階矩及二階矩分別為總體的一階矩及二階矩分別為1(),E X22()E X 222( )( )D XE X 樣本的一階矩和二階矩分別為樣本的一階矩和二階矩分別為111,niiAXXn 2211niiAXn 令令1122AA 即即X 22211niiXn 統(tǒng)計學(xué)-ch7 suyl13解得解得,X 22211niiXn 2211niiXnXn 211niiXXn 2211niiXXn 2.nS 統(tǒng)計學(xué)-ch7 suyl14例例2 2 設(shè)總體設(shè)總體X X服從
8、二點分布服從二點分布X X 0 1 0 1P P 1- 1-P PP P其中其中00P10,有 則稱 是參數(shù)的一致估計量。一致估計量是大樣本所呈現(xiàn)的性質(zhì)。若某個估計量是待估參數(shù)的一致估計量,意味著樣本容量很大時,估計量和待估參數(shù)接近的可能性幾乎等于100%。lim|1nP 統(tǒng)計學(xué)-ch7 suyl31無偏估計量直接比較方差大小統(tǒng)計學(xué)-ch7 suyl32nXXX,217.2.1 區(qū)間估計的概念設(shè)是來自總體的一個樣本,是總體未知參數(shù)。對給定的,如能確定兩個統(tǒng)計量 和 ,滿足) 10(121P則稱為置信度或置信概率,是的置信度的置信區(qū)間,稱為顯著性水平。置信度可以用頻率來說明。如果是置信度 0.9
9、5 置信區(qū)間,當(dāng)從總體中多次取樣本容量為 n 的樣本時,則每次可得到一個置信區(qū)間,這些置信區(qū)間有的包含,而有的則不包含,但平均來說,包含的置信區(qū)間的頻率應(yīng)在 0.95 附近波動。),(21111),(21127.2 區(qū)間估計統(tǒng)計學(xué)-ch7 suyl33評價區(qū)間估計的兩個標準:估計的可靠度。置信度1-反映了區(qū)間估計的可信度。置信水平 =0.95,說明估計區(qū)間 以95%的概率包含總體的參數(shù)。或者說,100個這樣的估計區(qū)間中,平均有95個包含了總體參數(shù);估計的精確度。區(qū)間的長度 反映了區(qū)間估計的精確度。當(dāng)區(qū)間的長度愈大,估計區(qū)間包含真值的可能性也就愈大,但是估計也愈不精確。可靠度和精確度是相互矛盾的
10、。112(),21()-統(tǒng)計學(xué)-ch7 suyl34估計的可靠度。估計的可靠度。置信度 反映了區(qū)間估計的可信度。置信水平 =0.95,說明估計區(qū)間 以95%的概率包含總體的參數(shù)?;蛘哒f,100個這樣的估計區(qū)間中,平均有95個包含了總體參數(shù);121,1統(tǒng)計學(xué)-ch7 suyl35統(tǒng)計學(xué)-ch7 suyl36 區(qū)間的長度: (上限下限) 區(qū)間的半徑:(上限下限)/2 反映了區(qū)間估計的精確度。當(dāng)區(qū)間的長度愈大,雖然估計區(qū)間包含真值的可能性愈大,但是估計卻不精確。估計的精確度估計的精確度統(tǒng)計學(xué)-ch7 suyl37 可靠度和精確度是相互矛盾的。當(dāng)其中之一確定時可靠度和精確度是相互矛盾的。當(dāng)其中之一確定
11、時,擴大樣本容量可以改善另一個。,擴大樣本容量可以改善另一個。統(tǒng)計學(xué)-ch7 suyl38步驟:首先,構(gòu)造一個與待估計參數(shù)有關(guān)的統(tǒng)計量T;其次,找出統(tǒng)計量的分布,在一定的置信水平下,給出臨界值;最后,計算總體參數(shù)的置信區(qū)間。統(tǒng)計學(xué)-ch7 suyl39抽樣平均誤差l估計量的標準差也稱為抽樣平均誤差。樣本均值的標準差=均值的抽樣平均誤差nnXDx2)(在不重復(fù)抽樣條件下,均值的抽樣平均誤差的計算公式為:)1 ()1()(22NnnNnNnXDxNnNnN11不重復(fù)抽樣修正系數(shù)統(tǒng)計學(xué)-ch7 suyl40抽樣極限誤差nZx2/l一定置信水平下抽樣誤差的可能范圍,稱為抽樣極限誤差或允許誤差。 1-置
12、信水平下,均值的抽樣極限誤差:l 重復(fù)抽樣條件下l 不重復(fù)抽樣條件下)1 (22/NnnZx統(tǒng)計學(xué)-ch7 suyl41(1)總體方差2 (或總體標準差)。其它條件不變的條件下,總體差異程度大,抽樣誤差大。(2)樣本容量n (Sample size;抽樣數(shù)目)抽樣數(shù)目).其它條件不變的條件下,n 愈大,抽樣誤差愈小影響抽樣誤差的因素統(tǒng)計學(xué)-ch7 suyl42(3)抽樣方法。重復(fù)抽樣的抽樣平均誤差較大;抽樣比例很小時,修正系數(shù)接近于,重復(fù)抽樣與不重復(fù)抽樣的抽樣誤差相差很小l對于無限總體,無論采用重復(fù)還是不重復(fù)抽樣,都可用重復(fù)抽樣的抽樣誤差公式來度量抽樣誤差;l對于有限總體,當(dāng)抽樣比例很小時(小
13、于5%),抽樣誤差常常都可采用重復(fù)抽樣的公式來計算。影響抽樣誤差的因素(續(xù))統(tǒng)計學(xué)-ch7 suyl43(4)估計的置信度(1-)抽樣平均誤差不受置信度大小影響在其他條件相同的情況下,抽樣估計的置信水平越高,抽樣極限誤差越大。(5)抽樣組織方式。不同抽樣組織方式有不同的抽樣誤差影響抽樣誤差的因素(續(xù))統(tǒng)計學(xué)-ch7 suyl44樣本均值的抽樣分布樣本均值的抽樣分布:則:則:)/,(2nNXX02Z2ZZ /2 /2nZ2nZ21.大樣本時總體均值的置信區(qū)間) 1 , 0(/NnXZ7.2.2 單個總體參數(shù)區(qū)間估計的方法統(tǒng)計學(xué)-ch7 suyl45總體均值的置信區(qū)間由此可得,在(由此可得,在(1
14、 )置信度下,)置信度下,總體均值總體均值的的置信區(qū)間置信區(qū)間可表示為:可表示為: 或:或:1/|2/2/2/ZnXZPZnXP1/2/2/nZXnZXP)/,/(2/2/nZXnZX)/(2/nZX統(tǒng)計學(xué)-ch7 suyl46例1某專業(yè)大學(xué)生的體重服從標準差為5.4kg的正態(tài)分布。隨機抽取36名,測得他們的平均體重為65kg。在95%的置信度下,求總體平均體重置信區(qū)間?!窘饨狻恳阎阂阎篨N(,5.42) ),n=36, 1-=0.95,總體平均體重的置信區(qū)間:總體平均體重的置信區(qū)間:)/,/(2 /2 /nZXnZX65X96. 12/z(65-1.764, 65+1.764))364
15、. 596. 165,364 . 596. 165(統(tǒng)計學(xué)-ch7 suyl47某專業(yè)大學(xué)生的體重服從標準差為5.4kg的正態(tài)分布。隨機抽取36名,測得他們的平均體重為65kg。在95%的置信度下,對總體平均體重進行估計的抽樣平均誤差和抽樣極限誤差為多少?并求其置信區(qū)間。)kg(764. 19 . 096. 1例1)kgnx(9 . 0364 . 5【解解】 :xxZ2抽樣平均誤差:抽樣平均誤差:抽樣極限誤差抽樣極限誤差:總體平均體重的置信區(qū)間總體平均體重的置信區(qū)間:(:(65-1.764, 65+1.764)統(tǒng)計學(xué)-ch7 suyl48總體方差已知時,均值的置信區(qū)間的求解步驟(1)假定條件總
16、體服從正態(tài)分布,且總體方差(2)已知如果非正態(tài)分布, n 30,可以由正態(tài)分布來近似(2)樞軸量為正態(tài)變量:(3)在()在(1 )置信度下,)置信度下,抽樣極限誤差抽樣極限誤差為:為:(4)在()在(1 )置信度下,)置信度下,總體均值總體均值 的的置信區(qū)間置信區(qū)間為:為:xZ2/)(2/nZXnZx2/)(xX即統(tǒng)計學(xué)-ch7 suyl49 因此,給定置信度因此,給定置信度 (1-),根據(jù)根據(jù) t 分布表可得臨界值分布表可得臨界值 t/2 。于是有:于是有:) 1(1/ntnSXt樞軸量為樞軸量為 t 統(tǒng)計量:統(tǒng)計量:2.小樣本時總體均值的區(qū)間估計02t2tt /2X1/2nStnSt/2n
17、Stx2/統(tǒng)計學(xué)-ch7 suyl50)(xX2.總體方差 未知時,均值的置信區(qū)間(1)假定條件總體服從正態(tài)分布總體方差( 2)未知(2)樞軸量為t 分布變量:(3)總體均值)總體均值 在(在(1 )置信度下的)置信度下的 抽樣極限誤差抽樣極限誤差 和和 置信區(qū)間置信區(qū)間 為:為:nStx2/(4)大樣本條件下,也可由正態(tài)分布近似。)大樣本條件下,也可由正態(tài)分布近似。)(2/nStX即統(tǒng)計學(xué)-ch7 suyl51假定某商場某袋裝食品總量呈正態(tài)分布,現(xiàn)隨機抽取10袋,測得重量分別為789、780、794、762、802、813、770、785、810、806 (克) ,要求以95的置信度,估計這
18、批食品平均每袋重量的區(qū)間范圍。解:解:已知 n=10, 1- = 0.95, 查表得:t/2 (n-1) = t0.025(9) 2.2622。 由樣本數(shù)據(jù)算得:樣本均值=791.1, s=17.136),(xxxx=(791.1-12.26, 791.1+12.26)即(即(778.84,803.36)克。)克。 例2統(tǒng)計學(xué)-ch7 suyl52某企業(yè)生產(chǎn)某種產(chǎn)品的工人有1000人,某日采用不重復(fù)抽樣從中隨機抽取100人調(diào)查他們的當(dāng)日產(chǎn)量,樣本人均產(chǎn)量為35件,產(chǎn)量的樣本標準差為4.5件,試以95.45%的置信度估計總體人均產(chǎn)量以及總產(chǎn)量的置信區(qū)間。例【解解】已知已知 N=1000, n=1
19、00, 1-=0.9545,5 . 4,35SX/22za=統(tǒng)計學(xué)-ch7 suyl53xxZ2/ 350.86 350.86 0.86例解(P.119/126)【解解】已知已知 N=1000, n=100, 1-=0.9545,5 . 4,35SX/22za=43. 0)10001001 (1005 . 4)1 (22Nnnx總體人均產(chǎn)量的置信區(qū)間:總體人均產(chǎn)量的置信區(qū)間:總產(chǎn)量的置信區(qū)間:總產(chǎn)量的置信區(qū)間:100034.14N 100035.86統(tǒng)計學(xué)-ch7 suyl541.1.總體方差已知時總體方差已知時: :22(,)xzxznn*22(1)(1)SSxtntnnn, x 2.2.總
20、體方差未知時總體方差未知時: :總體均值的置信區(qū)間可表示為:總體均值的置信區(qū)間可表示為:xxxx小結(jié):統(tǒng)計學(xué)-ch7 suyl553.總體成數(shù)(比率)的置信區(qū)間1.假定條件成數(shù)成數(shù)P是是XB(1,P)的均值的均值E(X); D(X)=P(1-P);大樣本大樣本n 大于大于30且且 np 和和n(1-p)都大于都大于5條件下,樣本條件下,樣本成數(shù)的分布可以由正態(tài)分布來近似:成數(shù)的分布可以由正態(tài)分布來近似:2.樞軸量為正態(tài)樞軸量為正態(tài)分布分布變量:變量:)1 (,(nPPPNp) 1 , 0(/ )1 (NnPPPpZ) , (pppp3. 總體成數(shù)總體成數(shù) 的置信區(qū)間為:的置信區(qū)間為:統(tǒng)計學(xué)-c
21、h7 suyl56估計成數(shù)時的抽樣平均誤差成數(shù)的抽樣平均誤差成數(shù)的抽樣平均誤差=樣本成數(shù)的標準差樣本成數(shù)的標準差在不重復(fù)抽樣條件下,成數(shù)的抽樣平均誤差為:在不重復(fù)抽樣條件下,成數(shù)的抽樣平均誤差為:在重復(fù)抽樣在重復(fù)抽樣條件下條件下統(tǒng)計學(xué)-ch7 suyl57估計成數(shù)時的抽樣極限誤差當(dāng)樣本量當(dāng)樣本量n充分大時,充分大時,成數(shù)的抽樣極限誤差成數(shù)的抽樣極限誤差為:為:(重復(fù)抽樣)(重復(fù)抽樣)),(pppp總體成數(shù)總體成數(shù) 的置信區(qū)間為:的置信區(qū)間為:(不重復(fù)抽樣)(不重復(fù)抽樣)影響因素同前統(tǒng)計學(xué)-ch7 suyl58 某企業(yè)對職工進行調(diào)查。隨機抽查了某企業(yè)對職工進行調(diào)查。隨機抽查了200人。其中有人。
22、其中有140人平均每天看電視一小時以上。試對每天看電視人平均每天看電視一小時以上。試對每天看電視一小時以上職工的比例進行區(qū)間估計(置信度一小時以上職工的比例進行區(qū)間估計(置信度95%)解:解:已知已知 n =200 ,p0.7, n p =1405, n(1- p)=605,1- = 0.95, /2=1.96以以95的置信度可推斷該企業(yè)的置信度可推斷該企業(yè)每天看電視一小時以上每天看電視一小時以上的職工比例在的職工比例在63.6%76.4%之間。之間。),(pppp(0.7-0.064,0.7+0.064)(0.636,0.764)例統(tǒng)計學(xué)-ch7 suyl59例隨機從60000桶罐頭中抽取3
23、00桶調(diào)查,發(fā)現(xiàn)有6桶不合格。以95.45%的概率估計全部罐頭的不合格率和不合格桶數(shù)。解:解:已知已知 n =300 ,p0.02, n p =6 5, n(1- p)=2945,1- = 0.9545, /2=2不合格率不合格率的置信區(qū)間的置信區(qū)間為:(2-1.616,2%+1.616%) 不合格品總數(shù)不合格品總數(shù)的區(qū)間的區(qū)間為:(0.38460000,3.61660000)(230.4,2169.6) (單位:桶)統(tǒng)計學(xué)-ch7 suyl604.正態(tài)總體方差的區(qū)間估計設(shè)總體服從正態(tài)分布,則與樣本方差設(shè)總體服從正態(tài)分布,則與樣本方差S2和待和待估計的總體方差估計的總體方差2 有關(guān)的樞軸量及其
24、分有關(guān)的樞軸量及其分布為:布為:) 1() 1(222222nSnnSn統(tǒng)計學(xué)-ch7 suyl61正態(tài)總體方差的區(qū)間估計(續(xù))置信度與卡方分布的分位數(shù)置信度與卡方分布的分位數(shù) 2 222/222/1/2) 1() 1(2222nSn1)1() 1(12222221nSnnP)(1 1- - )由于 對于給定的置信度對于給定的置信度(1-),有臨界值有臨界值 和和 滿足:滿足:) 1(221n) 1(22n統(tǒng)計學(xué)-ch7 suyl62總體方差總體方差2 的置信區(qū)間:的置信區(qū)間:)()(,11) 1() 1(2212222nSnnSn或:或:正態(tài)總體方差的區(qū)間估計(續(xù))(,1) 1(221222
25、2nnSnnSnn) 1() 1(12222221nSnn)(由得:統(tǒng)計學(xué)-ch7 suyl63 例,隨機從某車間加工的同類零件中,隨機從某車間加工的同類零件中抽取抽取16件,測得其的平均長度為件,測得其的平均長度為12.8厘厘米,方差為米,方差為0.0023。假定零件的長度服。假定零件的長度服從正態(tài)分布,求方差及標準差的置信區(qū)從正態(tài)分布,求方差及標準差的置信區(qū)間(置信度為間(置信度為95)。)。統(tǒng)計學(xué)-ch7 suyl64 已知已知16, 0.0023, 1-0.95,查,查 分布表得分布表得:2s220.97512(1)(15)6.262n220.0252(1)(15)27.488n2 代
26、入數(shù)據(jù),可得所求方差的置信區(qū)間為代入數(shù)據(jù),可得所求方差的置信區(qū)間為 (0.0013,0.0059) 標準差的置信區(qū)間(標準差的置信區(qū)間(0.036,0.077)解:解:統(tǒng)計學(xué)-ch7 suyl65大樣本條件下,樣本標準差大樣本條件下,樣本標準差S S的分布趨近于正的分布趨近于正態(tài)分布:態(tài)分布:其均值 E(S),其標準差(亦即S的抽樣平均誤差)),(/nSZSnSZS2222 )2,(2nNS所以,所以,總體標準差總體標準差的的1-的置信區(qū)間為:的置信區(qū)間為:nSS2大樣本條件下總體標準差的置信區(qū)間統(tǒng)計學(xué)-ch7 suyl667.2.3抽樣數(shù)目(樣本量)的確定 對各地區(qū)人口進行隨機抽樣時,對每個
27、地區(qū)的估計誤差和置信度都有同樣的要求(其他要求相同的條件下),對于人口多的地區(qū),是否需要一個較大的樣本量?統(tǒng)計學(xué)-ch7 suyl67確定樣本量的意義及方法l樣本量與抽樣誤差和費用的關(guān)系n 大,抽樣誤差越小n 大,調(diào)查的耗費越多l(xiāng)必要樣本量的定義為使抽樣誤差在一定置信度下不超過允許范圍所必須的樣本量(最低限) 。統(tǒng)計學(xué)-ch7 suyl681、估計總體均值必須的樣本量、估計總體均值必須的樣本量 在在 1 的置信度下估計總體均值的的置信度下估計總體均值的允許誤差為允許誤差為 ,則必要的樣本量為:,則必要的樣本量為:重復(fù)抽樣下:重復(fù)抽樣下:2222)(xZn x 必要樣本量的計算公式l可由允許誤差
28、的公式反推出統(tǒng)計學(xué)-ch7 suyl69不重復(fù)抽樣下:不重復(fù)抽樣下:2222222 ZNNZnx )(2222222()xZNZ 統(tǒng)計學(xué)-ch7 suyl70 【例例】某食品廠要檢驗本月生產(chǎn)的某食品廠要檢驗本月生產(chǎn)的10,000袋袋某產(chǎn)品的重量,根據(jù)上月資料,這種產(chǎn)品每袋某產(chǎn)品的重量,根據(jù)上月資料,這種產(chǎn)品每袋重量的標準差為重量的標準差為25克。要求在克。要求在95.45的概率的概率保證程度下,平均每袋重量的誤差范圍不超過保證程度下,平均每袋重量的誤差范圍不超過5克,克,至少應(yīng)抽查多少袋產(chǎn)品?袋產(chǎn)品? 解:已知:已知:10,000,25, , 95.45, 即即Z/2 2x 統(tǒng)計學(xué)-ch7 s
29、uyl71在重復(fù)抽樣條件下: 2222222225100()5Xzn(袋袋)在不重復(fù)抽樣條件下:在不重復(fù)抽樣條件下:22222222222222510000()510000225XzNnNz=99(袋)統(tǒng)計學(xué)-ch7 suyl722、估計總體成數(shù)時的樣本量、估計總體成數(shù)時的樣本量設(shè)設(shè) 為估計總體成數(shù)的允許誤差,在為估計總體成數(shù)的允許誤差,在1的的置信度下,樣本量置信度下,樣本量 n 為:為: 重復(fù)抽樣下:重復(fù)抽樣下: 不重復(fù)抽樣下:不重復(fù)抽樣下: p22222221 ()pppZZPPn 2222211()()()pZPP NnNZPP 統(tǒng)計學(xué)-ch7 suyl73 1、總體方差(或總體標準差
30、) 其它條件不變的條件下,總體標準差與必要的抽樣數(shù)目成反比。怎樣估計總體方差呢?通常有下列代替方法:l是用以前同類調(diào)查的資料代替,l用同類地區(qū)的資料代替,l若有多個方差數(shù)值供參考時,應(yīng)選其中最大的方差。 對于成數(shù),選擇最接近0.5的成數(shù)來計算影響樣本容量的因素統(tǒng)計學(xué)-ch7 suyl74【例】 某企業(yè)對一批產(chǎn)品進行質(zhì)量檢驗,這批某企業(yè)對一批產(chǎn)品進行質(zhì)量檢驗,這批產(chǎn)品的總數(shù)為產(chǎn)品的總數(shù)為5,000件,件,過去幾次同類調(diào)查所過去幾次同類調(diào)查所得的產(chǎn)品合格率為得的產(chǎn)品合格率為93、95和和96,為了為了使合格率的允許誤差不超過使合格率的允許誤差不超過3,在,在99.73的的置信度下置信度下至少應(yīng)抽查
31、多少件產(chǎn)品?產(chǎn)品? 解:解:已知已知5000, , 199.73, Z /2=3, P 取取 0.93 來計算來計算p 統(tǒng)計學(xué)-ch7 suyl75【例例】一家公司想估計某地區(qū)電腦的家庭所占的一家公司想估計某地區(qū)電腦的家庭所占的比例。并要求對總體比例的估計誤差不超過比例。并要求對總體比例的估計誤差不超過5,可靠程度為,可靠程度為95%,應(yīng)抽多大容量的樣本(沒有,應(yīng)抽多大容量的樣本(沒有可利用的可利用的 P 估計值)。估計值)。解解: 已知已知 =0.05,1 =0.95,Z /2=1.96,P 未未知知,用用最大方差最大方差0.25 來計算,則來計算,則應(yīng)抽取的樣本量應(yīng)抽取的樣本量為:為:統(tǒng)計
32、學(xué)-ch7 suyl76 2、允許誤差范圍、允許誤差范圍 允許誤差增大,意味著推斷的精度要求允許誤差增大,意味著推斷的精度要求降低,在其他條件不變的情況下,必要的降低,在其他條件不變的情況下,必要的樣本量可減少。樣本量可減少。反之,縮小允許誤差,就要增加必要的反之,縮小允許誤差,就要增加必要的抽樣數(shù)目。抽樣數(shù)目。統(tǒng)計學(xué)-ch7 suyl77 【例例】在其它條件不變的情況下在其它條件不變的情況下,若抽若抽樣樣允許誤差擴大到原來的允許誤差擴大到原來的 2倍倍,樣本量會樣本量會為原來的多少為原來的多少? 若抽樣允許誤差減少到原若抽樣允許誤差減少到原來的來的1/2,樣本容量會如何變化樣本容量會如何變化
33、? 都采用重復(fù)抽樣下的公式來推算都采用重復(fù)抽樣下的公式來推算統(tǒng)計學(xué)-ch7 suyl78 3、置信度、置信度 因置信度與置信區(qū)間是同方向變化的,所因置信度與置信區(qū)間是同方向變化的,所以在其它條件不變的情況下,要提高推斷的以在其它條件不變的情況下,要提高推斷的置信度,就必須增加抽樣數(shù)目。置信度,就必須增加抽樣數(shù)目。統(tǒng)計學(xué)-ch7 suyl79 4、抽樣方法、抽樣方法 相同條件下,采用重復(fù)抽樣應(yīng)比不重復(fù)抽相同條件下,采用重復(fù)抽樣應(yīng)比不重復(fù)抽樣多抽一些樣本單位。樣多抽一些樣本單位。 不過,很大時,二者差異很小。為簡便不過,很大時,二者差異很小。為簡便起見,實際中當(dāng)很大時,一般都按重復(fù)抽起見,實際中當(dāng)
34、很大時,一般都按重復(fù)抽樣公式計算必要的抽樣數(shù)目。樣公式計算必要的抽樣數(shù)目。 統(tǒng)計學(xué)-ch7 suyl80 5、抽樣組織方式、抽樣組織方式上述公式適用于簡單隨機抽樣下樣本量的上述公式適用于簡單隨機抽樣下樣本量的確定確定其它抽樣組織方式下樣本量的計算也可根其它抽樣組織方式下樣本量的計算也可根據(jù)相應(yīng)的誤差公式來推導(dǎo)。據(jù)相應(yīng)的誤差公式來推導(dǎo)。 統(tǒng)計學(xué)-ch7 suyl81兩個正態(tài)總體均值差的區(qū)間估計兩個正態(tài)總體均值差的區(qū)間估計1 1、總體均值差的區(qū)間估計總體均值差的區(qū)間估計 121nXXX,221nYYY,22212122221212)()(nnzYXnnzYX,2121211)2wXYtnnSnn(
35、) 設(shè) , 是總體X和Y的 的樣本,且兩樣本相互獨立。1、方差已知的兩個正態(tài)總體均值差置信區(qū)間為: 2、方差未知且相等的兩個正態(tài)總體均值差的置信區(qū)間為:),(211NX),(222NY統(tǒng)計學(xué)-ch7 suyl82 特別:任意兩個總體均值差的置信區(qū)間為(大樣本條件下)2221212nSnSzYX2) 1() 1(21222211nnSnSnSw統(tǒng)計學(xué)-ch7 suyl83兩個總體成數(shù)之差的置信區(qū)間設(shè)有兩個獨立總體X和Y,它們的總體成數(shù)分別為 和 。從兩個總體中分別抽出容量為n和m的樣本,樣本中具有某種特征的單位數(shù)分別為n1和m1,兩個樣本相互獨立,兩個樣本的成數(shù)分為 。當(dāng)樣本容量足夠大時, 的
36、的置信區(qū)間為1P2P,11nnp mmp1221PP 1mPPnPPzpp)1 ()1 (2211221統(tǒng)計學(xué)-ch7 suyl84 為調(diào)查城市居民與近郊對政府所指定的某項政策的態(tài)度之間的差別,從城市隨機抽5000人,其中2400人贊成;從近郊隨機抽選了2000人,其中有1200人贊成。分別求城市與近郊居民贊成此項政策人數(shù)比例之差異的90%和95%的置信區(qū)間。222111221)1 ()1 ()(nppnppzpp48. 0500024001p60. 0200012002p96. 12z50001n20002n2000)60. 01 (60. 05000)48. 01 (48. 096. 1)
37、60. 048. 0(統(tǒng)計學(xué)-ch7 suyl85 設(shè)總體設(shè)總體 ,總體,總體 ,參數(shù)均未知。,參數(shù)均未知。 和和 分別為總體分別為總體X和和Y的樣本,對于給定的置信的樣本,對于給定的置信度度 ,查,查F分布表確定臨界值分布表確定臨界值 方差比的方差比的 的置信區(qū)間為的置信區(qū)間為211(,)XN ),(222NY1,21nXXX2,21nYYY11212(1,1)Fnn和) 1, 1(212nnF22112222122121211(1,1)SSS FnnS Fnn,( , )22123、正態(tài)總體方差比的置信區(qū)間、正態(tài)總體方差比的置信區(qū)間統(tǒng)計學(xué)-ch7 suyl86 例例 進行的職工家計調(diào)查結(jié)果
38、表明:進行的職工家計調(diào)查結(jié)果表明: 在甲市抽取500戶,樣本平均每戶年消費支出為 3000元,標準差400元; 在乙市抽取1000戶,樣本平均每戶年消費支出 4200元,標準差500元。試求:(1)在甲乙兩個城市每戶年消費支出方差比的置信區(qū)間(95%)。(2)在甲乙兩個城市每戶年平均消費支出間差異的置信區(qū)間。1S統(tǒng)計學(xué)-ch7 suyl87221212212()SSxxznn) 1, 1() 1, 1(212122212122221nnFssnnFss,162. 1)999,499(025. 0F8572. 0)999,499(975. 0F96. 12z統(tǒng)計學(xué)-ch7 suyl88 注:確定
39、樣本容量時,無論是總體還是樣本方差均是未知的,所以要用其它的替代。若歷史資料有若干個可供選擇的,應(yīng)該選最大的。統(tǒng)計學(xué)-ch7 suyl89 注:確定樣本容量時,無論是總體還是樣本成數(shù)均是未知的,所以要用其它的替代。若歷史資料有若干個可供選擇的,應(yīng)該選最靠近50%的。 統(tǒng)計學(xué)-ch7 suyl90222121221)(nnzxx2122111)(nnStxxw222112212(1)(1)2wnSnSSnn222121221)(nSnSzxx21222122221FssFss,正態(tài)總體已知方差 兩個總體均值差正態(tài)總體方差未知且相等估計兩個總體均值差 大樣本條件估計兩個總體均值差正態(tài)總體估計兩個總
40、體方差比統(tǒng)計學(xué)-ch7 suyl917.3 抽樣估計的進一步討論l 7.3.1抽樣設(shè)計抽樣估計的一般步驟抽樣估計的一般步驟1、設(shè)計抽樣方案:目的;范圍、設(shè)計抽樣方案:目的;范圍N、n;怎樣抽;怎樣抽;內(nèi)容內(nèi)容調(diào)查標志、調(diào)查表、調(diào)查方式;時間;經(jīng)調(diào)查標志、調(diào)查表、調(diào)查方式;時間;經(jīng)費費2、抽取樣本:隨機、抽取樣本:隨機3、搜集樣本資料(數(shù)據(jù)):、搜集樣本資料(數(shù)據(jù)):4、整理:審查、分組匯總、計算樣本指標、整理:審查、分組匯總、計算樣本指標5、推斷總體:、推斷總體:統(tǒng)計學(xué)-ch7 suyl92第四次國家衛(wèi)生服務(wù)調(diào)查設(shè)計方案l 一、調(diào)查目的:主要目的是對前五年衛(wèi)生工作進行回顧和總結(jié),預(yù)測居民衛(wèi)生服
41、務(wù)需要、需求及長遠健康問題,為衛(wèi)生改革政策的制定提供依據(jù)并為今后衛(wèi)生改革實施效果的評價提供基楚資料。(提供人群健康狀況、衛(wèi)生服務(wù)需求量、衛(wèi)生服務(wù)費用、居民對衛(wèi)生服務(wù)的反映性等信息,為制定政策和開展評價提供客觀依據(jù)。這是第三次調(diào)查的)l 二、調(diào)查組織與時間l 國家衛(wèi)生服務(wù)調(diào)查由衛(wèi)生部統(tǒng)一組織,衛(wèi)生部統(tǒng)計信息中心具體負責(zé)技術(shù)設(shè)計和實施。各省、自治區(qū)、直轄市衛(wèi)生廳負責(zé)本省樣本地區(qū)的衛(wèi)生服務(wù)調(diào)查的領(lǐng)導(dǎo)、組織實施、質(zhì)量控制和資料驗收、技術(shù)指導(dǎo)和咨詢等項工作樣本縣(市、區(qū))的衛(wèi)生局負責(zé)領(lǐng)導(dǎo)、組織調(diào)查指導(dǎo)員和調(diào)查員的培訓(xùn)、組織實施本地區(qū)衛(wèi)生服務(wù)的調(diào)查和調(diào)查表的質(zhì)量控制工作。l 統(tǒng)計學(xué)-ch7 suyl93l
42、 第四次國家衛(wèi)生服務(wù)調(diào)查分為抽樣調(diào)查和專題調(diào)查研究兩部分。抽樣調(diào)查的調(diào)查時間擬定于2008年6月中旬至7月上旬,與以往調(diào)查的時間保持一致。專題研究將根據(jù)工作需要在年內(nèi)不同時間開展。l 調(diào)查對象和調(diào)查時間l 本次調(diào)查包括兩部分:即家庭健康詢問調(diào)查和小規(guī)模定性調(diào)查。家庭健康詢問調(diào)查的對象為全國抽中樣本住戶的實際人口。小規(guī)模定性調(diào)查的對象包括所抽中樣本地區(qū)及衛(wèi)生服務(wù)相關(guān)的主要人群。l 住戶健康詢問調(diào)查的現(xiàn)場時間從2003年9月18日開始至10月20日結(jié)束。統(tǒng)計學(xué)-ch7 suyl94l 三、調(diào)查內(nèi)容l 城鄉(xiāng)居民衛(wèi)生服務(wù)調(diào)查、城鄉(xiāng)居民衛(wèi)生服務(wù)需求與利用、城鄉(xiāng)居民醫(yī)療保障、居民的滿意度、基層醫(yī)療衛(wèi)生機構(gòu)
43、服務(wù)提供能力與質(zhì)量、醫(yī)務(wù)人員執(zhí)業(yè)環(huán)境與滿意度l 四、調(diào)查方法與對象l 本次調(diào)查采用居民調(diào)查與服務(wù)提供機構(gòu)調(diào)查相結(jié)合、定量調(diào)查與定性調(diào)查相結(jié)合、代表性調(diào)查與專題研究相結(jié)合的方法。既了解現(xiàn)狀也探究原因。l 家庭健康詢問調(diào)查采用入戶詢問的方法收集數(shù)據(jù)。調(diào)查對象為所抽中樣本住戶的實際人口(凡居住并生活在一起的家庭成員和其他人,或單身居住、生活的,均作為一個住戶)。統(tǒng)計學(xué)-ch7 suyl95l 基層醫(yī)療衛(wèi)生機構(gòu)問卷調(diào)查采用統(tǒng)一的調(diào)查問卷,由衛(wèi)生機構(gòu)自我填報。調(diào)查對象為樣本鄉(xiāng)或街道中所有的鄉(xiāng)鎮(zhèn)(街道)衛(wèi)生院、社區(qū)衛(wèi)生服務(wù)中心(站)和村衛(wèi)生室。此次調(diào)查研究將充分利于統(tǒng)計年報資料等各種已有調(diào)查資料,對已有的
44、數(shù)據(jù)不再作重復(fù)調(diào)查,以提高調(diào)查質(zhì)量及效率。l 醫(yī)務(wù)人員問卷調(diào)查的調(diào)查對象為樣本地區(qū)中部分二、三級醫(yī)院、社區(qū)衛(wèi)生服務(wù)中心、鄉(xiāng)鎮(zhèn)衛(wèi)生院的醫(yī)生和護理人員,調(diào)查問卷由被抽中人員按調(diào)查問卷的內(nèi)容進行自我填報。l 專題研究采用定性和定量相結(jié)合的研究方法,由衛(wèi)生部統(tǒng)計信息中心與北京大學(xué)、復(fù)旦大學(xué)、華中科技大學(xué)、山東大學(xué)等國內(nèi)著名院校的教授及研究人員共同實施,由被調(diào)查地區(qū)衛(wèi)生行政管理部門配合完成。初步確定調(diào)查研究地區(qū)為北京、天津、上海、山東、湖北、廣東、重慶、四川、甘肅、寧夏等地。統(tǒng)計學(xué)-ch7 suyl96l 五、抽樣設(shè)計l 國家衛(wèi)生服務(wù)調(diào)查遵循經(jīng)濟而有效的原則,采用多階段分層整群隨機抽樣的方法。本次調(diào)查樣
45、本地區(qū)與前三次保持一致,樣本住戶重新隨機抽取。在調(diào)查設(shè)計過程中利用2000年人口普查資料,對原有樣本的代表性進行了檢驗。結(jié)果表明,原有樣本地區(qū)對國家整體人口、經(jīng)濟、教育及居民健康狀況等方面具有較好的代表性。l 調(diào)查樣本涉及全國31個省,共有94個縣(市、區(qū))、470個鄉(xiāng)鎮(zhèn)(街道)、940個村(居委會)。家庭健康詢問調(diào)查最終的抽樣單位是戶,在每個樣本村(居委會)中隨機抽取60戶,全國共抽取56400戶(約20萬人口)。l 抽樣設(shè)計:國家衛(wèi)生服務(wù)調(diào)查遵循經(jīng)濟而有效的原則,采用多階段分層整群隨機抽樣的方法,通過樣本估計總體。l 本次調(diào)查的全國樣本地區(qū)為:95個縣(市、區(qū))、475個鄉(xiāng)鎮(zhèn)(街道)、95
46、0個村(居委會)。家庭健康詢問調(diào)查最終的抽樣單位是戶,每個樣本村中隨機抽取60戶,全國共抽取57000戶(約21萬人)。全國平均每戶被抽取的概率為1:5800。統(tǒng)計學(xué)-ch7 suyl97l 六、調(diào)查質(zhì)量控制l 為了保證調(diào)查的順利開展和調(diào)查的質(zhì)量,必須對調(diào)查的每一個環(huán)節(jié)實行嚴格的質(zhì)量控制,并措施貫穿于調(diào)查的全過程其中,抓好現(xiàn)場調(diào)查階段的質(zhì)量控制尤為重要。l 每個縣(市、區(qū))設(shè)立質(zhì)量考核小組,在調(diào)查過程中抽查調(diào)查質(zhì)量,調(diào)查完成后進行復(fù)查考核,家庭健康詢問調(diào)查的復(fù)查考核應(yīng)在已完成戶數(shù)中隨機抽取5%,通過電話或再入戶的方式對復(fù)核調(diào)查表的內(nèi)容進行詢問,復(fù)核調(diào)查結(jié)果錄入計算機后,觀察復(fù)核調(diào)查與原調(diào)查結(jié)果
47、的復(fù)合率。統(tǒng)計學(xué)-ch7 suyl98l 質(zhì)量要求:l 調(diào)查員調(diào)查技術(shù)一致性考核的百分比:用來衡量調(diào)查員調(diào)查技術(shù)的一致性。要求經(jīng)過培訓(xùn)后,調(diào)查人員調(diào)查技術(shù)的一致性達到95%以上;l 調(diào)查完成率:在三次上門未調(diào)查成功而放棄還該戶時,應(yīng)從候選戶中按順序遞補。調(diào)查完成率應(yīng)控制在96%以上。l 本人回答率:回答應(yīng)以本人為主,本人不在場時可由熟悉情況的人代替回答;嬰幼兒一般應(yīng)由直接撫養(yǎng)者回答,育齡婦女應(yīng)由本人回答;要求成年人的本人回答率不低于70%;l 復(fù)查的符合率:復(fù)查考核中,同戶復(fù)查項目與原調(diào)查結(jié)果的符合率要求在95%以上。l 七、數(shù)據(jù)處理及上報方式l 樣本地區(qū)(省或縣)負責(zé)調(diào)查數(shù)據(jù)錄入采取調(diào)查數(shù)據(jù)
48、兩遍錄入的方式。錄入數(shù)據(jù)通過電子郵件報送衛(wèi)生部統(tǒng)計信息中心,機構(gòu)調(diào)查數(shù)據(jù)應(yīng)于2008年8月10前報送,家庭健康詢問調(diào)查數(shù)據(jù)和醫(yī)務(wù)人員調(diào)查數(shù)據(jù)應(yīng)于2008年8月31日前報送。l 八、領(lǐng)導(dǎo)與實施統(tǒng)計學(xué)-ch7 suyl99三、抽樣方案設(shè)計的基本準則l隨機原則l抽樣誤差最小l費用最少統(tǒng)計學(xué)-ch7 suyl100四、抽樣方案設(shè)計的主要內(nèi)容(一)編制抽樣框(一)編制抽樣框 確定抽樣范圍確定抽樣范圍抽樣框:全部總體單位的名單目錄。抽樣框:全部總體單位的名單目錄。依據(jù)研究對象特征不同,抽樣框有三種形式:依據(jù)研究對象特征不同,抽樣框有三種形式: (1)名單抽樣框)名單抽樣框 (2)區(qū)域抽樣框)區(qū)域抽樣框 (
49、3)時間表抽樣框)時間表抽樣框統(tǒng)計學(xué)-ch7 suyl101一個例子一個例子 1936年羅斯福年羅斯福(Franklin Delano Rooseverlt)任總統(tǒng)的第一任期屆滿,蘭登任總統(tǒng)的第一任期屆滿,蘭登(Alfred Landon)與其競選總統(tǒng)。由于國家與其競選總統(tǒng)。由于國家正努力從大蕭條中恢復(fù)過來,失業(yè)人數(shù)高達正努力從大蕭條中恢復(fù)過來,失業(yè)人數(shù)高達900萬人。萬人。文學(xué)摘要文學(xué)摘要自自1916年以來,歷年以來,歷屆總統(tǒng)選舉它都正確地預(yù)測出獲勝的一方。屆總統(tǒng)選舉它都正確地預(yù)測出獲勝的一方。但是,當(dāng)?shù)?,?dāng)Rooseverlt1936年以年以62%比比38%獲勝后不久,獲勝后不久,文學(xué)摘
50、要文學(xué)摘要就垮了。就垮了。統(tǒng)計學(xué)-ch7 suyl102 Rooseverlt(%) 文學(xué)摘要文學(xué)摘要預(yù)測選舉結(jié)果預(yù)測選舉結(jié)果R 43 文學(xué)摘要文學(xué)摘要預(yù)測選舉結(jié)果預(yù)測選舉結(jié)果L 57 蓋洛普的預(yù)測結(jié)果蓋洛普的預(yù)測結(jié)果 L 44 蓋洛普預(yù)測選舉結(jié)果蓋洛普預(yù)測選舉結(jié)果R 56 實際選舉結(jié)果實際選舉結(jié)果R 62 統(tǒng)計學(xué)-ch7 suyl103l具體的做法是:l文學(xué)摘要文學(xué)摘要的程序是將問卷郵寄給一千的程序是將問卷郵寄給一千萬人(萬人(10,000,000),這一千萬人的名),這一千萬人的名字來自電話簿或會員俱樂部名冊。字來自電話簿或會員俱樂部名冊。l蓋洛普用了一個來自全美國的蓋洛普用了一個來自全美
51、國的50,000人樣人樣本。本。文學(xué)摘要文學(xué)摘要差錯出在哪里?差錯出在哪里?統(tǒng)計學(xué)-ch7 suyl104 文學(xué)摘要文學(xué)摘要的程序是將問卷郵寄給一千萬的程序是將問卷郵寄給一千萬人(人(10,000,000),這一千萬人的名字來自),這一千萬人的名字來自電話簿或會員俱樂部名冊。這就導(dǎo)致不屬于俱電話簿或會員俱樂部名冊。這就導(dǎo)致不屬于俱樂部或沒有安電話的窮人(當(dāng)時僅有樂部或沒有安電話的窮人(當(dāng)時僅有25%的家的家庭有電話)。有很強的排斥窮人的選擇偏差,庭有電話)。有很強的排斥窮人的選擇偏差,這在這在1936年以前可能影響不大。當(dāng)時年以前可能影響不大。當(dāng)時1936年以年以后,政治上的劃分更緊密地遵循經(jīng)
52、濟路線:絕后,政治上的劃分更緊密地遵循經(jīng)濟路線:絕大多數(shù)窮人投大多數(shù)窮人投Rooseverlt的票,而富人贊成的票,而富人贊成Landon。因此,。因此,文學(xué)摘要文學(xué)摘要的差錯如此之的差錯如此之大的大的原因之一是選擇偏差原因之一是選擇偏差。而蓋洛普只用了一。而蓋洛普只用了一個個50,000人的樣本。人的樣本。 統(tǒng)計學(xué)-ch7 suyl105 抽樣應(yīng)該以公平方式選擇,以便有代表抽樣應(yīng)該以公平方式選擇,以便有代表性,如果將這一類人或那一類人排除在樣性,如果將這一類人或那一類人排除在樣本以外,所表現(xiàn)出來的系統(tǒng)傾向稱為本以外,所表現(xiàn)出來的系統(tǒng)傾向稱為選擇選擇偏差。偏差。 統(tǒng)計學(xué)-ch7 suyl106
53、 當(dāng)選擇程序有偏時,抽取一個大樣本當(dāng)選擇程序有偏時,抽取一個大樣本并無幫助,它只不過是在較大的規(guī)模下去并無幫助,它只不過是在較大的規(guī)模下去重復(fù)基本錯誤。重復(fù)基本錯誤。若被選入樣本的大多數(shù)人實際上不回答問若被選入樣本的大多數(shù)人實際上不回答問卷,那將產(chǎn)生嚴重的扭曲。差錯的原因之卷,那將產(chǎn)生嚴重的扭曲。差錯的原因之二是二是不回答偏倚不回答偏倚。 不回答者可能非常有別于回答者,當(dāng)不回答者可能非常有別于回答者,當(dāng)出現(xiàn)高不回答率時,謹防不回答偏倚。出現(xiàn)高不回答率時,謹防不回答偏倚。 統(tǒng)計學(xué)-ch7 suyl107因此因此 一個樣本是否可取,查查它是如何選取一個樣本是否可取,查查它是如何選取的。有選擇偏差嗎?有不回答偏倚嗎?的。有選擇偏差嗎?有不回答偏倚嗎?統(tǒng)計學(xué)-ch7 suyl108一個理想的抽樣框應(yīng)該與目標總體一致,即一個理想的抽樣框應(yīng)該與目標總體一致,即應(yīng)包括全部總體單位,既不重復(fù)也不遺漏。應(yīng)包括全部總體單位,既不重復(fù)也不遺漏。也就是說,每個總體單位在抽樣框里必須也就是說,每個總體單位在抽樣框里必須出現(xiàn)一次而且只能出現(xiàn)一次,以保證抽樣出現(xiàn)一次而且只能出現(xiàn)一次,以保證抽樣框能完全代表目標總體??蚰芡耆砟繕丝傮w。 盡可能有輔助變量的信息盡可能有輔助變量的信息有序框。有序框。統(tǒng)計學(xué)-ch7 suyl109(二)確定二)確定抽樣方法抽樣方法 重復(fù)抽樣和不重
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 機場改造項目評估報告
- xx市港口項目可行性研究報告
- 中國秸稈綜合利用產(chǎn)業(yè)發(fā)展環(huán)境透析、市場全景評估及發(fā)展趨勢預(yù)測報告(智研咨詢)
- 2025年中國粉末涂料用環(huán)氧樹脂行業(yè)深度分析、投資前景、趨勢預(yù)測報告(智研咨詢)
- 少兒足球培訓(xùn)項目可行性研究報告
- 二零二五年度地質(zhì)勘探鉆孔施工服務(wù)合同3篇
- 二零二五年度叉車銷售與智能物流解決方案咨詢合同范本2篇
- 二零二五年度房產(chǎn)買賣及配套設(shè)施建設(shè)合同3篇
- 2025年度石材荒料加工與銷售聯(lián)合經(jīng)營合同3篇
- 《汽車驅(qū)動橋》汽車標準
- 磁異法探測海底纜線分解課件
- 投資的本質(zhì):巴菲特的12個投資宗旨
- 護欄和扶手制作與安裝工程檢驗批質(zhì)量驗收記錄
- 工裝夾具項目開發(fā)計劃書
- 食堂安全操作規(guī)范培訓(xùn)課件(48張)
- 中小學(xué)生研學(xué)旅行 投標方案(技術(shù)方案)
- 乳頭混淆介紹演示培訓(xùn)課件
- 社區(qū)生鮮可行性報告
- 外科學(xué)-粘連性腸梗阻
- 《輻射安全許可證》申請條件核查表
評論
0/150
提交評論