抽樣方法與參數(shù)估計(jì)剖析_第1頁
抽樣方法與參數(shù)估計(jì)剖析_第2頁
抽樣方法與參數(shù)估計(jì)剖析_第3頁
抽樣方法與參數(shù)估計(jì)剖析_第4頁
抽樣方法與參數(shù)估計(jì)剖析_第5頁
已閱讀5頁,還剩98頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第九章第九章抽樣與參數(shù)估計(jì)抽樣與參數(shù)估計(jì) 統(tǒng)計(jì)推斷是統(tǒng)計(jì)學(xué)研究的重要內(nèi)容。統(tǒng)計(jì)推斷是統(tǒng)計(jì)學(xué)研究的重要內(nèi)容。 抽樣是進(jìn)行統(tǒng)計(jì)推斷的基礎(chǔ)性工作。抽樣是進(jìn)行統(tǒng)計(jì)推斷的基礎(chǔ)性工作。 參數(shù)估計(jì)是統(tǒng)計(jì)推斷的重要內(nèi)容之一。參數(shù)估計(jì)是統(tǒng)計(jì)推斷的重要內(nèi)容之一。樣本容量的確定樣本容量的確定第一節(jié)第一節(jié) 抽樣與抽樣分布抽樣與抽樣分布一、幾個(gè)基本概念一、幾個(gè)基本概念二、概率抽樣方式二、概率抽樣方式三、總體分布、樣本分布、抽樣分布三、總體分布、樣本分布、抽樣分布四、四、一個(gè)總體的抽樣分布一個(gè)總體的抽樣分布五、兩個(gè)總體的抽樣分布五、兩個(gè)總體的抽樣分布統(tǒng)計(jì)推斷的過程統(tǒng)計(jì)推斷的過程統(tǒng)計(jì)推斷統(tǒng)計(jì)推斷是在對樣本數(shù)據(jù)進(jìn)行描述的基礎(chǔ)

2、上,對總是在對樣本數(shù)據(jù)進(jìn)行描述的基礎(chǔ)上,對總體的未知數(shù)量特征作出以概率形式表述的推斷體的未知數(shù)量特征作出以概率形式表述的推斷。一、幾個(gè)基本概念一、幾個(gè)基本概念總體、個(gè)體、樣本總體、個(gè)體、樣本 總體總體是所要研究的事物或現(xiàn)象的全體,也稱全及總是所要研究的事物或現(xiàn)象的全體,也稱全及總體、母體體、母體。 個(gè)體個(gè)體是組成總體的各個(gè)基本單位或元素。是組成總體的各個(gè)基本單位或元素。 樣本樣本是從總體中按一定抽樣技術(shù)抽取的若干是從總體中按一定抽樣技術(shù)抽取的若干個(gè)體組個(gè)體組成的集合體成的集合體,也,也稱抽樣總體、子樣。稱抽樣總體、子樣??傮w容量和樣本容量總體容量和樣本容量 總體容量總體容量是總體全部單位總數(shù),

3、用是總體全部單位總數(shù),用N表示。表示。 樣本容量樣本容量是一個(gè)樣本所包含的單位數(shù),通常用是一個(gè)樣本所包含的單位數(shù),通常用n表表示。根據(jù)容量大小樣本有大樣本和小樣本之分,一示。根據(jù)容量大小樣本有大樣本和小樣本之分,一般當(dāng)般當(dāng)n5,n(1-p)5,則二項(xiàng)分布則二項(xiàng)分布可用可用正態(tài)正態(tài)分布近似求解。因而有分布近似求解。因而有 樣本比例分布為:樣本比例分布為: 可用可用Z統(tǒng)計(jì)量構(gòu)造總體統(tǒng)計(jì)量構(gòu)造總體 比例比例的置信區(qū)間,即:的置信區(qū)間,即: 查標(biāo)準(zhǔn)正態(tài)分布表查標(biāo)準(zhǔn)正態(tài)分布表 可得置信區(qū)間:可得置信區(qū)間: 總體比例總體比例未知,可用樣本比例未知,可用樣本比例p代替。在代替。在1置信水平下,總置信水平下,

4、總體比例體比例的置信區(qū)間為:的置信區(qū)間為:)1(1(nNp,)1 ,0()1(NnpZnzppp)1(2nppZpnppZp)1 ()1 (22,總體比例的區(qū)間估計(jì)總體比例的區(qū)間估計(jì)(例題分析例題分析)例:例:一項(xiàng)廣告活動(dòng)的跟蹤調(diào)查,在隨機(jī)調(diào)查的一項(xiàng)廣告活動(dòng)的跟蹤調(diào)查,在隨機(jī)調(diào)查的400人中,人中,有有240人能記起廣告語。試以人能記起廣告語。試以95的置信水平估計(jì)能的置信水平估計(jì)能記起廣告語的人所占比例的置信區(qū)間。記起廣告語的人所占比例的置信區(qū)間。解:解:已知已知 n=400 , p=240/400=0.6,np=2405, n(1-p)=1605,1-=0.95,查表得,查表得Z=1.96

5、, 則則 即以即以95的概率保證,估計(jì)能記起廣告語的人數(shù)所的概率保證,估計(jì)能記起廣告語的人數(shù)所占比例在占比例在55.2%64.8%之間。之間。nppZpnppZp)1()1(22,0.648) , (0.5520.048)0.6 , 0.048-(0.6400)6.01(6.096.16.0,400)6.01(6.096.16.0總體比例的區(qū)間估計(jì)總體比例的區(qū)間估計(jì)(例題分析例題分析)%35.74%,65.55%35. 9%65100%)651%(6596. 1%65)1 (2nppzp該城市下崗職工中女性比例的該城市下崗職工中女性比例的置信區(qū)間為置信區(qū)間為55.65%74.35% 5351,

6、 565pnnp課堂練習(xí)三:課堂練習(xí)三: 某電池廠生產(chǎn)的某種型號(hào)電池,其使用壽命的質(zhì)量某電池廠生產(chǎn)的某種型號(hào)電池,其使用壽命的質(zhì)量標(biāo)準(zhǔn)為標(biāo)準(zhǔn)為25小時(shí)。為提高產(chǎn)品競爭能力,該廠家對生小時(shí)。為提高產(chǎn)品競爭能力,該廠家對生產(chǎn)線進(jìn)行了改造,現(xiàn)隨機(jī)抽取產(chǎn)線進(jìn)行了改造,現(xiàn)隨機(jī)抽取100只電池進(jìn)行測試,只電池進(jìn)行測試,得其使用壽命為:得其使用壽命為:23小時(shí)以下小時(shí)以下 1只只2324小時(shí)小時(shí) 4只只2425小時(shí)小時(shí)10只只2526小時(shí)小時(shí)79只只26小時(shí)以上小時(shí)以上 6只只 要求以要求以95%的置信水平建立該種電池合格率的置信的置信水平建立該種電池合格率的置信區(qū)間。區(qū)間。課堂練習(xí)三參考答案:課堂練習(xí)三參

7、考答案:解:解:已知已知 n=100,1- = 95%, 查表得查表得z /2=1.96 由資料可知使用壽命在由資料可知使用壽命在25小時(shí)以上的電池共小時(shí)以上的電池共85只,只,因此:因此:p=85/100=85% 則總體比例則總體比例 在在1- 置信水平下置信水平下的置信區(qū)間為的置信區(qū)間為 %.%,.%.%)%(.%n)p(pzp5087508250285100851859618512 在在95%95%的置信水平下,該種電池合格率的置信區(qū)的置信水平下,該種電池合格率的置信區(qū)間為:間為:82.50%82.50%87.50%87.50%。課堂練習(xí)四:課堂練習(xí)四: 某彩電生產(chǎn)廠對某地區(qū)居民家庭購買

8、其產(chǎn)某彩電生產(chǎn)廠對某地區(qū)居民家庭購買其產(chǎn)品的情況進(jìn)行調(diào)查,調(diào)查戶數(shù)為品的情況進(jìn)行調(diào)查,調(diào)查戶數(shù)為400戶,戶,其中有其中有40戶購買了該廠生產(chǎn)的彩電。要求戶購買了該廠生產(chǎn)的彩電。要求以以95.45的置信水平估計(jì)該地區(qū)居民家的置信水平估計(jì)該地區(qū)居民家庭購買該廠產(chǎn)品的比例的置信區(qū)間。庭購買該廠產(chǎn)品的比例的置信區(qū)間。區(qū)間估計(jì)應(yīng)注意:區(qū)間估計(jì)應(yīng)注意: 在進(jìn)行區(qū)間估計(jì)時(shí),必須同時(shí)考慮置信概在進(jìn)行區(qū)間估計(jì)時(shí),必須同時(shí)考慮置信概率和置信區(qū)間兩個(gè)方面,二者都與概率度率和置信區(qū)間兩個(gè)方面,二者都與概率度(z或或t)有關(guān)。在樣本容量一定的情況下,)有關(guān)。在樣本容量一定的情況下,置信概率定得越大,估計(jì)的可靠程度就越

9、置信概率定得越大,估計(jì)的可靠程度就越大,概率度(大,概率度(z或或t)就越大,則置信區(qū)間)就越大,則置信區(qū)間相應(yīng)也越大,估計(jì)的準(zhǔn)確性就越小。因此相應(yīng)也越大,估計(jì)的準(zhǔn)確性就越小。因此對于可靠性和準(zhǔn)確性,要結(jié)合具體問題、對于可靠性和準(zhǔn)確性,要結(jié)合具體問題、具體要求來綜合考慮。具體要求來綜合考慮。一、兩個(gè)總體均值之差的區(qū)間估計(jì)一、兩個(gè)總體均值之差的區(qū)間估計(jì)二、兩個(gè)總體比例之差的區(qū)間估計(jì)二、兩個(gè)總體比例之差的區(qū)間估計(jì)三、兩個(gè)總體方差比的區(qū)間估計(jì)(略)三、兩個(gè)總體方差比的區(qū)間估計(jì)(略)一、兩個(gè)總體均值之差的估計(jì)一、兩個(gè)總體均值之差的估計(jì)大樣本大樣本 假定條件假定條件兩個(gè)兩個(gè)總體都服從正態(tài)分布,總體都服從

10、正態(tài)分布, 1、 2已知已知若不是正態(tài)分布若不是正態(tài)分布, 可以用正態(tài)分布來近似可以用正態(tài)分布來近似(n1 30和和n2 30)兩個(gè)樣本是獨(dú)立的簡單隨機(jī)樣本兩個(gè)樣本是獨(dú)立的簡單隨機(jī)樣本 建立置信區(qū)間建立置信區(qū)間使用正態(tài)分布統(tǒng)計(jì)量使用正態(tài)分布統(tǒng)計(jì)量Z)1 ,0()()(2221212121NnnxxZ兩個(gè)總體均值之差的估計(jì)兩個(gè)總體均值之差的估計(jì) (大樣本大樣本)3. 1、 2已知已知時(shí),時(shí),兩個(gè)總體均值之差兩個(gè)總體均值之差 1- 2在在1- 置置信水平下的置信區(qū)間為信水平下的置信區(qū)間為222121221)(nnzxx222121221)(nSnSzxx4.4. 1 1、 2 2未知未知時(shí),時(shí),兩

11、個(gè)總體均值之差兩個(gè)總體均值之差 1 1- - 2 2在在1-1- 置信水平下的置信區(qū)間為置信水平下的置信區(qū)間為兩個(gè)總體均值之差的估計(jì)兩個(gè)總體均值之差的估計(jì)(例題分析例題分析) 兩個(gè)樣本的有關(guān)數(shù)據(jù)兩個(gè)樣本的有關(guān)數(shù)據(jù) 中學(xué)中學(xué)1中學(xué)中學(xué)2n1=46n1=33S1=5.8 S2=7.2861x782x兩個(gè)總體均值之差的估計(jì)兩個(gè)總體均值之差的估計(jì)(例題分析例題分析)97.10,03. 5(97. 28332 . 7468 . 596. 1)7886()(22222121221nsnszxx兩個(gè)總體均值之差的估計(jì)兩個(gè)總體均值之差的估計(jì)小樣本小樣本: 1 12 2 2 22 2 假定條件假定條件 兩個(gè)兩個(gè)

12、總體都服從正態(tài)分布總體都服從正態(tài)分布 兩個(gè)總體方差未知但相等:兩個(gè)總體方差未知但相等: 1= 2 兩個(gè)獨(dú)立的小樣本兩個(gè)獨(dú)立的小樣本(n130和和n230) 總體方差的合并估計(jì)量總體方差的合并估計(jì)量211212222112nnS)n(S)n(Sp 估計(jì)量估計(jì)量 x x1 1- -x x2 2的抽樣標(biāo)準(zhǔn)差的抽樣標(biāo)準(zhǔn)差21221211nnSnSnSppp兩個(gè)總體均值之差的估計(jì)兩個(gè)總體均值之差的估計(jì)(小樣本小樣本: 1 12 2 2 22 2 )4.建立兩個(gè)樣本均值之差的置信區(qū)間用建立兩個(gè)樣本均值之差的置信區(qū)間用t統(tǒng)計(jì)量統(tǒng)計(jì)量) 2(11)()(21212121nntnnSxxtp5.5.兩個(gè)總體均值

13、之差兩個(gè)總體均值之差 1 1- - 2 2在在1-1- 置信水平下置信水平下的置信區(qū)間為的置信區(qū)間為21221221112nnSnntxxp兩個(gè)總體均值之差的估計(jì)兩個(gè)總體均值之差的估計(jì)小樣本小樣本: 1 12 2 2 22 2 假定條件假定條件 兩個(gè)兩個(gè)總體都服從正態(tài)分布總體都服從正態(tài)分布 兩個(gè)總體方差未知且不相等:兩個(gè)總體方差未知且不相等: 12 兩個(gè)獨(dú)立的小樣本兩個(gè)獨(dú)立的小樣本(n130和和n230) 建立置信區(qū)間建立置信區(qū)間使用統(tǒng)計(jì)量使用統(tǒng)計(jì)量t)()()(2221212121vtnSnSxxt兩個(gè)總體均值之差的估計(jì)兩個(gè)總體均值之差的估計(jì)(小樣本小樣本: 1 12 2 2 2223.兩個(gè)

14、總體均值之差兩個(gè)總體均值之差 1- 2在在1- 置信水平下的置信水平下的置信區(qū)間為置信區(qū)間為222121221)(nSnSvtxx 1122222121212222121nnSnnSnSnSv自由度兩個(gè)總體均值之差的估計(jì)兩個(gè)總體均值之差的估計(jì)匹配大樣本匹配大樣本 假定條件假定條件 兩個(gè)匹配的大樣本兩個(gè)匹配的大樣本(n1 30和和n2 30) 兩個(gè)總體均值之差兩個(gè)總體均值之差 d= 1- 2在在1- 置信水平置信水平下的置信區(qū)間為下的置信區(qū)間為nzdd 2對應(yīng)差值的均值對應(yīng)差值的均值對應(yīng)差值的標(biāo)準(zhǔn)差對應(yīng)差值的標(biāo)準(zhǔn)差兩個(gè)總體均值之差的估計(jì)兩個(gè)總體均值之差的估計(jì)匹配小樣本匹配小樣本 假定條件假定條件

15、 兩個(gè)匹配的小樣本兩個(gè)匹配的小樣本(n1 30和和n2 30) 兩個(gè)總體各觀察值的配對差服從正態(tài)分布兩個(gè)總體各觀察值的配對差服從正態(tài)分布 兩個(gè)總體均值之差兩個(gè)總體均值之差 d= 1- 2在在1- 置信水平置信水平下的置信區(qū)間為下的置信區(qū)間為nS)n(tdd121.假定條件假定條件 兩個(gè)兩個(gè)總體服從二項(xiàng)分布總體服從二項(xiàng)分布 可以用正態(tài)分布來近似可以用正態(tài)分布來近似 兩個(gè)樣本是獨(dú)立的兩個(gè)樣本是獨(dú)立的2.兩個(gè)總體比例之差兩個(gè)總體比例之差 1- 2在在1- 置信水平下置信水平下的置信區(qū)間為的置信區(qū)間為二、兩個(gè)總體比例之差的區(qū)間估計(jì)二、兩個(gè)總體比例之差的區(qū)間估計(jì)22211122111n)P(Pn)P(P

16、zPP兩個(gè)總體比例之差的估計(jì)兩個(gè)總體比例之差的估計(jì)(例題分析例題分析)兩個(gè)總體比例之差的估計(jì)兩個(gè)總體比例之差的估計(jì)(例題分析例題分析)%32.19,%68. 6%32. 6%13400%)321 (%32500%)451 (%4596. 1%32%45第五節(jié)第五節(jié) 樣本容量的確定樣本容量的確定 前面討論中都假定樣本容量前面討論中都假定樣本容量n已知,但在實(shí)踐中需已知,但在實(shí)踐中需要自己設(shè)計(jì)調(diào)查方案,確定樣本容量。樣本容量要自己設(shè)計(jì)調(diào)查方案,確定樣本容量。樣本容量n越大,抽樣誤差越小,但越大,抽樣誤差越小,但n越大,所需人、財(cái)、物越大,所需人、財(cái)、物及時(shí)間也越多;及時(shí)間也越多;n太小,估計(jì)誤差會(huì)

17、很大。因此確太小,估計(jì)誤差會(huì)很大。因此確定樣本容量的大小要從允許誤差范圍、概率保證程定樣本容量的大小要從允許誤差范圍、概率保證程度及經(jīng)費(fèi)、時(shí)間等多方面統(tǒng)籌考慮。度及經(jīng)費(fèi)、時(shí)間等多方面統(tǒng)籌考慮。一、估計(jì)總體均值時(shí)樣本容量的確定一、估計(jì)總體均值時(shí)樣本容量的確定二、估計(jì)總體比例時(shí)樣本容量的確定二、估計(jì)總體比例時(shí)樣本容量的確定一、估計(jì)總體均值時(shí)樣本容量的確定一、估計(jì)總體均值時(shí)樣本容量的確定 重復(fù)抽樣下估計(jì)總體均值時(shí)樣本容量:重復(fù)抽樣下估計(jì)總體均值時(shí)樣本容量: 可以看出樣本容量可以看出樣本容量n與總體方差與總體方差 2、允許誤、允許誤差差 、概率度、概率度Z或或t之間的關(guān)系為之間的關(guān)系為樣本容量樣本容量

18、n 與總體方差與總體方差 2成正比成正比樣本容量樣本容量n與允許誤差與允許誤差 成反比成反比樣本容量樣本容量n與概率度與概率度Z或或t成正比成正比22222ZnnZ估計(jì)總體均值時(shí)樣本容量的確定估計(jì)總體均值時(shí)樣本容量的確定(例題分析例題分析) 例例:一家廣告公司想估計(jì)某類商店去年平均:一家廣告公司想估計(jì)某類商店去年平均每店廣告費(fèi)支出額。經(jīng)驗(yàn)表明,總體方差為每店廣告費(fèi)支出額。經(jīng)驗(yàn)表明,總體方差為1800000。若置信水平取。若置信水平取95,允許誤差為,允許誤差為500元,問應(yīng)抽取多少家商店作樣本?元,問應(yīng)抽取多少家商店作樣本? 解:已知解:已知21800000,0.05, 查表得查表得z /2

19、1.96,500, 則則 應(yīng)抽選應(yīng)抽選28家商店作樣本。家商店作樣本。 n應(yīng)取整數(shù)。應(yīng)取整數(shù)。個(gè))(2865.27500180000096. 1222222Zn估計(jì)總體均值時(shí)樣本容量的確定估計(jì)總體均值時(shí)樣本容量的確定 (例題分析例題分析)估計(jì)總體均值時(shí)樣本容量的確定估計(jì)總體均值時(shí)樣本容量的確定 (例題分析例題分析)則則9704.964002000)96. 1 ()(2222222zn二、估計(jì)總體比例時(shí)樣本容量的確定二、估計(jì)總體比例時(shí)樣本容量的確定 重復(fù)抽樣下估計(jì)總體比例時(shí)樣本容量:重復(fù)抽樣下估計(jì)總體比例時(shí)樣本容量:p的取值一般小于的取值一般小于0.1。 未知時(shí),可取最大值未知時(shí),可取最大值0.

20、5。因?yàn)橐驗(yàn)閷τ诜亩?xiàng)分布對于服從二項(xiàng)分布的隨機(jī)變量,當(dāng)?shù)碾S機(jī)變量,當(dāng) =0.5時(shí),方差達(dá)到最大值。用時(shí),方差達(dá)到最大值。用0.5計(jì)算得出的樣本容量可以保證有足夠高的置信水平計(jì)算得出的樣本容量可以保證有足夠高的置信水平和盡可能小的置信區(qū)間。和盡可能小的置信區(qū)間。2222)1()1(ppZnnZ估計(jì)總體比例時(shí)樣本容量的確定估計(jì)總體比例時(shí)樣本容量的確定 (例題分析例題分析)例例:某市場調(diào)研公司想估計(jì)某地區(qū)有家用計(jì)算:某市場調(diào)研公司想估計(jì)某地區(qū)有家用計(jì)算機(jī)的家庭所占比例。希望允許誤差不超過機(jī)的家庭所占比例。希望允許誤差不超過0.05,可靠程度為可靠程度為95,問應(yīng)取多大容量的樣本?,問應(yīng)取多大容量的樣本?沒有可利用的比例沒有可利用的比例 。解解:已知:已知:p0.05 , =0.05 , z /2 =1.96 , 用用 =0.5計(jì)算計(jì)算 ,則則 應(yīng)抽取應(yīng)抽取385戶家庭進(jìn)行調(diào)查。戶家庭進(jìn)行調(diào)查。戶)(38505. 0)5 . 01 (5 . 096. 1122222pZn估計(jì)總體比例時(shí)樣本容量的確定估計(jì)總體比例時(shí)樣本容量的確定 (例題分析例題分析)【例例】根據(jù)以根據(jù)以往的生產(chǎn)統(tǒng)計(jì)往的生產(chǎn)統(tǒng)計(jì),某種產(chǎn)品的,某種產(chǎn)品的合 格 率 約 為合 格 率

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論