版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第七章第七章 抽樣調(diào)查抽樣調(diào)查第一節(jié)第一節(jié) 抽樣調(diào)查與統(tǒng)計(jì)推斷基礎(chǔ)知識(shí)抽樣調(diào)查與統(tǒng)計(jì)推斷基礎(chǔ)知識(shí)一、 抽樣調(diào)查的概念、特點(diǎn)和適用范圍 1、 抽樣 抽樣是根據(jù)一定的調(diào)查目的,從調(diào)查對(duì)象中抽取部分單位構(gòu)成樣本的過程全部工業(yè)企業(yè)部分工業(yè)企業(yè)2、抽樣種類 概率抽樣(隨機(jī)抽樣)非概率抽樣(非隨機(jī)抽樣)簡(jiǎn)單隨機(jī)抽樣分層抽樣等距抽樣整群抽樣3、抽樣調(diào)查的概念抽樣調(diào)查是按照隨機(jī)原則從調(diào)查對(duì)象中抽取一部分單位作為樣本進(jìn)行調(diào)查,以其所獲得的樣本資料,對(duì)總體的數(shù)量特征進(jìn)行估計(jì)的一種非全面調(diào)查方式。抽樣調(diào)查抽樣(手段)推斷 (目的)調(diào)查對(duì)象或總體樣本抽取推斷調(diào)查4、抽樣調(diào)查的特點(diǎn) -與其他非全面調(diào)查相比較按照隨機(jī)原則
2、抽取調(diào)查單位根據(jù)樣本信息對(duì)總體的數(shù)量特征進(jìn)行估計(jì)存在誤差但可以計(jì)算并施加控制5、抽樣調(diào)查的適用范圍在不可能進(jìn)行全面調(diào)查的情況下,抽樣調(diào)查是唯一選擇在時(shí)效性要求很高的情況下,適用于抽樣調(diào)查在不必要開展全面調(diào)查的情況下,適用于抽樣調(diào)查在對(duì)全面調(diào)查進(jìn)行補(bǔ)充和修正時(shí),適用于抽樣調(diào)查二、抽樣調(diào)查與估計(jì)的步驟設(shè)計(jì)抽樣方案抽樣樣本單位對(duì)樣本單位進(jìn)行調(diào)查由樣本信息對(duì)總體特征進(jìn)行估計(jì)三、抽樣調(diào)查與推斷的常用指標(biāo)1、總體指標(biāo)(總體參數(shù))用以描述與刻畫總體數(shù)量特征。特點(diǎn):既定,唯一,未知。總體平均數(shù)NXXXXN21NXNii1總體方差與標(biāo)準(zhǔn)差NXXnii122NXXnii12符號(hào)規(guī)定:符號(hào)規(guī)定: N-N-總體單位數(shù)
3、總體單位數(shù) n-n-樣本單位數(shù)樣本單位數(shù) X-X-總體平均數(shù)總體平均數(shù) P-P-總體成數(shù)總體成數(shù) x x-樣本平均數(shù)樣本平均數(shù) p p-樣樣本成本成數(shù)數(shù) -總體標(biāo)準(zhǔn)差總體標(biāo)準(zhǔn)差 S-S-樣本標(biāo)準(zhǔn)差樣本標(biāo)準(zhǔn)差n-樣本單位數(shù),也叫樣本容量。樣本單位數(shù),也叫樣本容量。n30時(shí),為大樣本,時(shí),為大樣本,n30時(shí)為小樣本時(shí)為小樣本總體成數(shù)總體單位屬性有時(shí)為品質(zhì)標(biāo)志,品質(zhì)標(biāo)志有時(shí)為是非標(biāo)志是非標(biāo)志-標(biāo)志表現(xiàn)只有兩種情況,如,性別:男,女;產(chǎn)品質(zhì)量:合格,不合格。變量值X頻數(shù)f成數(shù)成數(shù)(頻率)一種屬性1N1P= N1/N另一種屬性0N21-P=N2/NN1)1 ()1 ()0()1 (222PPPPPPff
4、XXiii是非標(biāo)志的平均數(shù)、方差和標(biāo)準(zhǔn)差XPNNNNNNffXNii12121101N1/N=P)1 (PP2P(1-P)1、樣本指標(biāo)(樣本統(tǒng)計(jì)量)用以描述與刻畫樣本數(shù)量特征。樣本既定時(shí):唯一,可知。樣本平均數(shù)nxxxxn21nxnii1樣本方差與標(biāo)準(zhǔn)差1122nxxSnii112nxxSniinnpx1樣本成數(shù)(平均數(shù))四、數(shù)據(jù)的分布特征及其度量 峰峰度度均值反均值反映集中映集中趨勢(shì)趨勢(shì)偏偏斜斜度度所有數(shù)據(jù)所有數(shù)據(jù)對(duì)均值的對(duì)均值的偏離或離偏離或離散度散度集中趨勢(shì)的度量:眾數(shù) 、中位數(shù)和四分位數(shù)、平均數(shù)平均數(shù)離散程度的度量:極差 、平均差、方差和標(biāo)準(zhǔn)差方差和標(biāo)準(zhǔn)差、離散系數(shù)峰度的度量:峰度系數(shù)
5、偏度的度量:偏度系數(shù)第二節(jié) 抽樣方法與抽樣調(diào)查組織方式一、 抽取樣本的方法u重復(fù)抽樣亦稱回置抽樣每抽出一個(gè)單位在登記后仍放回去同一個(gè)單位有多次被重復(fù)抽中的可能u不重復(fù)抽樣二、抽樣調(diào)查組織方式簡(jiǎn)單隨機(jī)抽樣簡(jiǎn)單隨機(jī)抽樣: 對(duì)總體不做任何處理,直接隨機(jī)抽取樣本。具體包括抽簽法,隨機(jī)數(shù)表法。適用性:總體單位之間差異較小,且總體單位數(shù)目較少的情況。類型抽樣:類型抽樣:又稱分層抽樣,將總體單位按某種屬性特征分類或分層,再?gòu)母黝惢蚋鲗映闃?。適用性:總體單位之間差異較大,且總體單位數(shù)目較多的情況。等距抽樣:等距抽樣:又稱機(jī)械抽樣或系統(tǒng)抽樣,將總體各單位按一定標(biāo)志或順序排列,實(shí)施等距或等間隔(k=N/n)抽樣。
6、整群抽樣:整群抽樣:又稱集團(tuán)抽樣,將總體按某一標(biāo)志劃分成若干群,隨機(jī)抽取若干群,對(duì)抽中的群內(nèi)的所有單位逐一調(diào)查。第三節(jié)、簡(jiǎn)單隨機(jī)抽樣及抽樣估計(jì)第三節(jié)、簡(jiǎn)單隨機(jī)抽樣及抽樣估計(jì)一、抽樣誤差測(cè)算一、抽樣誤差測(cè)算二、抽樣區(qū)間估計(jì)二、抽樣區(qū)間估計(jì)三、抽樣數(shù)目確定三、抽樣數(shù)目確定1、統(tǒng)計(jì)調(diào)查誤差、統(tǒng)計(jì)調(diào)查誤差登記性誤差:登記性誤差:所有統(tǒng)計(jì)調(diào)查活動(dòng)都可能會(huì)產(chǎn)生登記性誤差。全面調(diào)查和非全面調(diào)查皆如此。表現(xiàn)為樣本的統(tǒng)計(jì)數(shù)據(jù)與真值有偏誤。通過加強(qiáng)監(jiān)管和組織工作,可以減少乃至消除此誤差。代表性誤差:代表性誤差:代表性誤差只存在于非全面調(diào)查,表現(xiàn)為樣本結(jié)構(gòu)與總體結(jié)構(gòu)不一致。抽樣調(diào)查中的代表性誤差不可避免,但可以計(jì)算
7、和控制。一、抽樣誤差一、抽樣誤差2、抽樣平均誤差、抽樣平均誤差抽樣平均誤差是樣本平均數(shù)或樣本成數(shù)的標(biāo)準(zhǔn)差3名同學(xué)成績(jī)?yōu)?8,82,96 平均88.66667分,不重復(fù)抽樣,n=2可能的樣本為:可能的樣本為:88,82; 88,96; 82,96平均數(shù):平均數(shù): 85 92 8988.66667抽樣誤差就是用來反映樣本平均數(shù)與總體平均數(shù)的離差的抽樣誤差就是用來反映樣本平均數(shù)與總體平均數(shù)的離差的樣本平均數(shù)的抽樣平均誤差可能的樣本個(gè)數(shù)2)(Xxx可能的樣本個(gè)數(shù)2)(Ppp樣本成數(shù)的抽樣平均誤差 當(dāng)樣本單位數(shù)既定時(shí)當(dāng)樣本單位數(shù)既定時(shí), ,從一個(gè)總體可抽取多個(gè)樣本,抽樣指標(biāo)(如平均數(shù)、從一個(gè)總體可抽取多
8、個(gè)樣本,抽樣指標(biāo)(如平均數(shù)、抽樣成數(shù)等),就有多個(gè)不同的數(shù)值,它們對(duì)總體指標(biāo)(如總體平均數(shù)、總體成抽樣成數(shù)等),就有多個(gè)不同的數(shù)值,它們對(duì)總體指標(biāo)(如總體平均數(shù)、總體成數(shù)等)的離差也就有大有小,這就必需用一個(gè)指標(biāo)來衡量抽樣誤差的一般水平。數(shù)等)的離差也就有大有小,這就必需用一個(gè)指標(biāo)來衡量抽樣誤差的一般水平。 抽樣平均誤差是抽樣平均數(shù)(或抽樣成數(shù))的標(biāo)準(zhǔn)差,它反映抽樣平均數(shù)抽樣平均誤差是抽樣平均數(shù)(或抽樣成數(shù))的標(biāo)準(zhǔn)差,它反映抽樣平均數(shù)(或抽樣成數(shù))與總體平均數(shù)(或總體成數(shù))的平均差異程度。(或抽樣成數(shù))與總體平均數(shù)(或總體成數(shù))的平均差異程度。根據(jù)概率論與數(shù)理統(tǒng)計(jì)學(xué)的有關(guān)知識(shí),抽樣平均誤差公式
9、nnx2nPPnpp)1 (2NnnNnnNx1) 1()(22重復(fù)抽樣:不重復(fù)抽樣:NnnPPNnNnPPp1)1 () 1()()1 (上例只有3名同學(xué)作為總體,不重復(fù)抽樣且每次樣本容量為2,所有可能的抽樣可以試驗(yàn)。但當(dāng)總體單位較多時(shí)候,各種可能的抽樣是不可以一一試驗(yàn)的。這就需要而且只能根據(jù)一個(gè)樣本進(jìn)行計(jì)算??紤]問題:哪些因素影響抽樣平均誤差? 它們?nèi)绾斡绊懗闃悠骄`差?1、總體標(biāo)準(zhǔn)差2、樣本單位數(shù)n3、抽樣方法4、抽樣的組織方式解:已知 N=30,n=4,2=4例題:某工人某天生產(chǎn)電子元件30件,已知其方差為4,現(xiàn)從中抽取4件產(chǎn)品進(jìn)行質(zhì)量檢查。試計(jì)算本次抽樣平均誤差在重復(fù)抽樣下: 厘米1
10、442nx在不重復(fù)抽樣下: 厘米95. 0) 130( 4) 430( 4) 1()(2NnnNx例題:有5個(gè)工人的日產(chǎn)量分別為(單位:件):6,8,10,12,14,用重復(fù)抽樣的方法,從中隨機(jī)抽取2個(gè)工人的日產(chǎn)量,用以代表這5個(gè)工人的總體水平。計(jì)算抽樣平均誤差解:總體平均數(shù) 件抽樣平均誤差 件?總體標(biāo)準(zhǔn)差 件8)(2NXX在抽樣平均誤差公式中有總體方差2、P(1-P)或標(biāo)準(zhǔn)差, P(1-P)的平方根,但是在大部分情況下,總體方差或標(biāo)準(zhǔn)差是未知的。如何處理?用以前或同類現(xiàn)象的標(biāo)準(zhǔn)差代替當(dāng)有多個(gè)標(biāo)準(zhǔn)差可供選擇時(shí),選其最大者當(dāng)為成數(shù)時(shí),選其最接近0.5的那一個(gè)P,因?yàn)镻=0.5時(shí),p最大當(dāng)為成數(shù)時(shí)
11、,沒可供選擇的成數(shù),直接取p=0.5 用樣本標(biāo)準(zhǔn)差代替在大樣本下,直接用S代替在小樣本下,用S代替 ,S= 11)(1)(22nnSnnnxxnxx1、甲乙兩地區(qū)各抽選400家企業(yè)進(jìn)行調(diào)查,結(jié)果表明,甲地區(qū)平均每個(gè)企業(yè)盈利300萬元,乙地區(qū)平均每個(gè)企業(yè)盈利80萬元,甲乙兩地區(qū)標(biāo)準(zhǔn)差系數(shù)分別為30%和20%,請(qǐng)計(jì)算兩地區(qū)的抽樣平均誤差練習(xí)題2、某企業(yè)生產(chǎn)的產(chǎn)品,按正常生產(chǎn)經(jīng)驗(yàn),合格率為90%,現(xiàn)從5000件產(chǎn)品中抽取50件進(jìn)行檢驗(yàn),求合格率的抽樣平均誤差3、要估計(jì)某縣10萬家庭的電視機(jī)擁有率,隨機(jī)抽取100戶家庭,發(fā)現(xiàn)有85戶擁有電視機(jī),求電視機(jī)擁有率的平均抽樣誤差。 2、解:在重復(fù)抽樣條件下,
12、合格率的抽樣平均誤差為: 在不重復(fù)抽樣條件下,合格率的抽樣平均誤差為: 3、根據(jù)已知條件可得:p= 85/100 =0.852=p(1-p)= 0.850.15=0.1275在重置抽樣下: =0.0357不重置抽樣下: = =0.0357計(jì)算結(jié)果表明,用樣本的擁有率來估計(jì)總體的擁有率,其抽樣誤差平均說來為3.6%左右。3、抽樣極限誤差XXx抽樣極限誤差也叫允許誤差,是指樣本指標(biāo)與總體指標(biāo)之間抽樣誤差的可能范圍。或者說,在一定的置信度置信度下,抽樣估計(jì)可以允許的誤差范圍。抽樣平均數(shù)的極限誤差抽樣成數(shù)的極限誤差pPp置信度置信度,又稱置信水平或把握度,是表明抽樣指標(biāo)和總體指標(biāo)的誤差不超過一定范圍的
13、概率保證度,一般表示為1-, 是顯著顯著性水平性水平 樣本指標(biāo)與總體指標(biāo)之間的差異絕對(duì)值不超過極限誤差 樣本統(tǒng)計(jì)量與總體參數(shù)之間的差異絕對(duì)值不超過極限誤差這樣看來,置信度越大,極限誤差就越大,反之,置信度越小,極限誤差就越小。xx2根據(jù)平均數(shù)抽樣分布理論,在給定置信度1-時(shí),大樣本條件大樣本條件下的極限誤差可以表示為:抽樣平均數(shù)的極限誤差抽樣成數(shù)的極限誤差pp2Z /2是什么?是什么?在給定顯著性水平,或者給定置信水平1- 時(shí)候,標(biāo)準(zhǔn)正態(tài)分布的臨界值為Z /2 ,可查Z分布表取得廣泛應(yīng)用的是: 1-=90%, Z =1.65 1-=95%, Z =1.96 1-=95.45%, Z =2 1-
14、=99%, Z =2.58 1-=99.73%, Z =3 3x 2x x x x 2x 3x 68.27% 95.45% 99.73% 對(duì)剛下線的1000個(gè)酒瓶重量進(jìn)行檢查。重復(fù)抽取100個(gè)酒瓶,樣本平均重量為100克,樣本標(biāo)準(zhǔn)差為5克,試以95%的把握度估計(jì)本次抽查的抽樣極限誤差解解: 依照題意,已知:N=1000 ,n=100,S=5,1-=95%Z /2 =1.96抽樣平均數(shù)的極限誤差xx2重復(fù)抽樣的平均誤差克5 .01005222nSnx本次抽樣極限誤差克98. 05 . 096. 1x意思是說,我們有95%的把握保證樣本的平均重量與總體的平均重量的誤差不超過0.98克2、某電扇廠對(duì)
15、1500臺(tái)電扇使用壽命進(jìn)行抽樣調(diào)查,抽取30臺(tái),平均壽命為45萬小時(shí),使用壽命的標(biāo)準(zhǔn)差為240小時(shí),試以95%的置信水平計(jì)算本次抽查的極限誤差1、對(duì)某地區(qū)電視機(jī)擁有率進(jìn)行抽樣調(diào)查,抽取100戶,調(diào)查顯示90戶擁有電視機(jī),試以95%的把握程度計(jì)算本次調(diào)查的極限誤差練習(xí)二、抽樣區(qū)間估計(jì):利用樣本信息對(duì)總體數(shù)量特征進(jìn)行推斷 區(qū)間估計(jì):在一定的置信度下,根據(jù)樣本統(tǒng)計(jì)量推斷總體參數(shù)與總體總量的可能范圍或置信區(qū)間。1、總體均值的區(qū)間估計(jì):由樣本平均數(shù)估計(jì)總體均值的可能范圍由抽樣極限誤差的定義:在1-下,XXx)()(xxxXx總體均值的置信區(qū)間:),(xxxx亦即,),(22xxZxZx在大樣本下,給定置
16、信度1-時(shí),總體均值的總體均值的區(qū)間估計(jì)區(qū)間估計(jì)抽樣平抽樣平均誤差均誤差總體均值的區(qū)間估計(jì)的含義:-由樣本平均數(shù)估計(jì)總體均值的可能范圍),(22xxZxZx在大樣本下,給定置信度1-時(shí),總體均值的置信區(qū)間為:含義:我們有1-(95%)的把握能保證總體均值落在上述區(qū)間之內(nèi)例題例題: 對(duì)剛下線的1000個(gè)酒瓶重量進(jìn)行檢查。重復(fù)抽取100個(gè)酒瓶,樣本平均重量為100克,樣本標(biāo)準(zhǔn)差為5克,試以95%的置信度估計(jì)這批酒瓶重量的置信區(qū)間,并說明其含義是什么?解解: 已知:N=1000 ,n=100,S=5,1-=95% ,Z /2 =1.96重復(fù)抽樣的平均誤差克5 .01005222nSnx總體均值的置信
17、區(qū)間:(100-1.960.5,100+1.960.5 ) ( 99.02,100.98 )2、總體成數(shù)的區(qū)間估計(jì):由樣本成數(shù)估計(jì)總體成數(shù)的可能范圍由成數(shù)的抽樣極限誤差的定義:在1-下,pPp)()(pppPp總體成數(shù)的置信區(qū)間:),(pppp亦即,),(22ppZpZp在大樣本下即,例、對(duì)某地區(qū)電視機(jī)擁有率進(jìn)行調(diào)查,抽取100戶,調(diào)查顯示90戶擁有電視機(jī),試以95%的把握程度估計(jì)本地區(qū)電視機(jī)擁有率解解:n=100,n1=90,即 p=90/100=0.9,1-=95%,即 z/2=1.96%3100)9.01(9.0)1(nppp(重復(fù))抽樣平均誤差(成數(shù))抽樣極限誤差%88.5%396.1
18、2pp在把握度為95%下的置信區(qū)間:(90%-5.88%,90+5.88%)即(84.12%,95.88%) 我們以95%把握度保證本地區(qū)電視機(jī)擁有率介于84.12%95.88%之間 3、總體總量的區(qū)間估計(jì):由樣本總量估計(jì)總體總量的可能范圍總體標(biāo)志總量的區(qū)間估計(jì):由均值的區(qū)間估計(jì)推斷總體標(biāo)志總量的可能范圍總體標(biāo)志總量的區(qū)間估計(jì):由均值的區(qū)間估計(jì)推斷總體標(biāo)志總量的可能范圍),(22xxZxZxN1000( 99.02,100.98 )=( 99020,100980 )前例題:酒瓶總重量:即,在95%的置信度下,這批酒瓶的總重量介于99020100980克之間 總體成數(shù)總量的區(qū)間估計(jì):由成數(shù)區(qū)間估
19、計(jì)推斷總體成數(shù)總量的可能范圍),(22ppZpZpN前例題假定該地區(qū)有居民家庭10000戶擁有電視機(jī)的總戶數(shù): 10000(84.12%,95.88%)=( 8412,9588 )戶在95%置信度下,該地區(qū)擁有電視機(jī)的家庭總數(shù)介于84129588 戶之間對(duì)一批產(chǎn)品的質(zhì)量進(jìn)行調(diào)查,隨機(jī)抽取100個(gè)產(chǎn)品,調(diào)查發(fā)現(xiàn)有6個(gè)產(chǎn)品不合格,若以95%的置信水平,可否能推斷這批產(chǎn)品的不合格率不會(huì)超過10%?計(jì)算其置信區(qū)間。 以95的概率保證推斷該市職工人均年收入的置信區(qū)間(采用重復(fù)抽樣)。思考題三、抽樣數(shù)目確定在重復(fù)抽樣條件下: 平均數(shù)估計(jì)的必要樣本單位數(shù)的確定平均數(shù)估計(jì)的必要樣本單位數(shù)的確定 在不重復(fù)抽樣條
20、件下:nZZxxx22/22222xxZn由NnnZxx1222222222xxxZNNZn由某廠對(duì)10000個(gè)電子元件的耐用時(shí)間進(jìn)行檢查,根據(jù)以往資料可知該型號(hào)電子元件耐用時(shí)間的標(biāo)準(zhǔn)差為800小時(shí),要求置信概率為95.45%,抽樣誤差范圍不超過200小時(shí),問:需要抽取多少個(gè)電子元件檢查?1-/2若采取重復(fù)抽樣:重復(fù)抽樣:若采取不重復(fù)抽樣:不重復(fù)抽樣:小時(shí)200 x(個(gè))642008002222222xxZn(個(gè))638002200100008002100002222222222xxxZNNZn小時(shí)800 xn 成數(shù)估計(jì)的必要樣本單位數(shù)的確定在重復(fù)重復(fù)抽樣條件抽樣條件 在不重復(fù)不重復(fù)抽樣條件抽
21、樣條件下nPPZZpp)1 (22222)1(pPPZn由NnnPPZZpp1)1 (22)1()1(22222PPZNPPNZnp由 上例中,若對(duì)10000個(gè)電子元件的合格率進(jìn)行檢查,根據(jù)以往調(diào)查資料得知產(chǎn)品合格率為96%,要求在95.45%的概率保證程度下,抽樣誤差范圍不超過4%,試確定需要抽取的電子元件數(shù)量?已知: N=10000個(gè) P=96% p=4% 1-=95.45% /2(個(gè))96%)4(%)961(%962)1(2222pPPZn(個(gè))9504.096.0204.01000004.096.0210000)1()1(222222PPZNPPNZnp若采取不重復(fù)抽樣不重復(fù)抽樣若采取
22、重復(fù)抽樣重復(fù)抽樣現(xiàn)對(duì)某地區(qū)電視機(jī)擁有率進(jìn)行調(diào)查。以往曾經(jīng)做過三次調(diào)查,抽取家庭均為500戶,擁有電視機(jī)的家庭分別為400、436、450戶,若置信度為95%,誤差范圍不超過3%,本次調(diào)查至少應(yīng)該抽取多少個(gè)家庭戶?第四節(jié) 其他抽樣組織方式類型抽樣等距抽樣整群抽樣一、類型抽樣一、類型抽樣(分層抽樣分層抽樣)亦稱分層抽樣先將總體各單位分成若干類型或?qū)訌母黝愋椭谐槿颖締挝辉儆筛黝愋偷臉颖締挝唤M成一個(gè)樣本類型抽樣的樣本抽取總體單位數(shù)N,樣本單位n,分成k組或?qū)樱恳唤M抽取多少樣本單位ni ?等額抽取樣本:等比例抽取樣本每一組抽取n/ k個(gè)樣本單位N=N1+N2+N3+Nkn=n1+n2+n3+nkni
23、 = n(Ni /N)考慮:哪一種樣本抽取方法更科學(xué)?為什么? 類型抽樣的抽樣平均誤差 類型抽樣用平均組內(nèi)方差代替總方差計(jì)算抽樣平均誤差n類型抽樣:平均數(shù)的抽樣平均誤差在重復(fù)抽樣條件下: nSix2NnnSix12在不重復(fù)抽樣條件下:2iS為各組內(nèi)方差nnSSiii222iS為平均組內(nèi)方差n類型抽樣:成數(shù)的抽樣平均誤差在重復(fù)抽樣條件下: nSip2NnnSip12在不重復(fù)抽樣條件下:2iS為各組內(nèi)方差nnppSiiii)1 (22iS為平均組內(nèi)方差 類型抽樣:抽樣極限誤差的計(jì)算類型抽樣用平均組內(nèi)方差代替總方差計(jì)算抽樣平均誤差重復(fù)抽樣的極限誤差nS2i2Zx不重復(fù)抽樣的極限誤差NnnSZix12
24、2抽樣極限誤差xx2pp2nnSSiii222iS為平均組內(nèi)方差對(duì)于平均數(shù)nnppSiiii)1 (22iS為平均組內(nèi)方差對(duì)于成數(shù) 類型抽樣:抽樣極限誤差的區(qū)間估計(jì)類型抽樣用平均組內(nèi)方差代替總方差計(jì)算抽樣平均誤差總體均值的置信區(qū)間),(22xxZxZx在大樣本下,給定置信度1-時(shí),總體均值的置信區(qū)間為:總體成數(shù)的置信區(qū)間),(22ppZpZp在大樣本下,給定置信度1-時(shí),總體均值的置信區(qū)間為:xxpp某鎮(zhèn)種植小麥50000畝,其中平原40000畝,山區(qū)10000畝,采用不重復(fù)抽樣,按2%的比例共抽取100畝進(jìn)行產(chǎn)量調(diào)查,根據(jù)實(shí)割實(shí)測(cè)結(jié)果,計(jì)算的樣本指標(biāo)見下表,試計(jì)算抽樣平均誤差,并以95%的置
25、信度,推斷全部小麥田畝平均產(chǎn)量的置信區(qū)間類型全部面積(畝) Ni樣本面積(畝)ni樣本平均畝產(chǎn)(千克)xi樣本標(biāo)準(zhǔn)差(千克)i平原山區(qū)4000010000 800 2003602508060合計(jì)500001000類型全部面積(畝) Ni樣本面積(畝)ni樣本平均畝產(chǎn)(千克)xi樣本標(biāo)準(zhǔn)差(千克)i平原山區(qū)4000010000 800 2003602508060合計(jì)500001000平均組內(nèi)方差:抽樣平均誤差:抽樣極限誤差:抽樣平均數(shù):產(chǎn)量置信區(qū)間:5840100020060800802222nnSSiii4.250000100011000584012NnnSix7.44.296.11222Nn
26、nSZZixx338200800200250800360iiiiiinnxffxx)7 .342, 3 .333()7 . 4338, 7 . 4338(),(xxxx以95%的把握推斷全部小麥的畝產(chǎn)介于333.3342.7千克思考考慮: 什么情況下進(jìn)行類型抽樣?如果對(duì)全國(guó)大學(xué)畢業(yè)生就業(yè)狀況開展調(diào)查,如何分類?某市對(duì)中老年患高血壓病人數(shù)所占比重進(jìn)行抽樣推斷,采取不重復(fù)抽樣按4%的比例抽取樣本單位,調(diào)查結(jié)果及相關(guān)指標(biāo)見下表。試在95%把握程度下計(jì)算高血壓病人數(shù)所占比重的置信區(qū)間與總的患者數(shù)量。組別總體單位數(shù)(人)Ni樣本單位數(shù)(人)ni患高血壓人數(shù)比重()pi樣本方差()Pi(1pi)老年組中年
27、組1500020000 600 80015 8 12.75 7.36合計(jì)350001400 二、等距抽樣等距抽樣的概念: 亦叫機(jī)械抽樣或系統(tǒng)抽樣 先將總體各單位按某一標(biāo)志排隊(duì) 然后按等距離抽取樣本單位等距抽樣的操作程序:第一步:編制抽樣框?qū)⒖傮w按有關(guān)標(biāo)志(x)從低到高順序排隊(duì) 列出輔助(無關(guān))標(biāo)志(f) 將輔助標(biāo)志依次累計(jì)列出抽中單位與研究?jī)?nèi)容有直接關(guān)系的標(biāo)志,如調(diào)查今年的產(chǎn)量,可把照往年產(chǎn)量作為有關(guān)有關(guān)標(biāo)志標(biāo)志進(jìn)行排隊(duì)與所研究的內(nèi)容無直接關(guān)系的標(biāo)志,如居民生計(jì)調(diào)查,可把人口數(shù)作為輔助輔助標(biāo)志標(biāo)志進(jìn)行排隊(duì)例題例題某村民小組有30戶農(nóng)戶,若調(diào)查該村民小組所有農(nóng)戶2005年人均收入水平,如何實(shí)施等
28、距抽樣?序號(hào)1 12 23 34 45 56 67 78 89 91010111112121313141415152004年人均收入(十元)x185185187187190190198198201201218218256256260260274274290290295295325325340340366366368368人口數(shù)(人)f4 42 25 53 34 43 33 34 45 54 42 21 15 54 43 3人口數(shù)累計(jì)4 46 61111141418182121242428283333373739394040454549495252抽中戶序號(hào)1616171718181919202
29、021212222232324242525262627272828292930302004年人均收入(十元)x370370371371388388402402410410446446453453470470477477490490499499502502503503516516520520人口數(shù)(人)f4 42 23 33 34 44 42 24 43 34 45 54 43 33 35 5人口數(shù)累計(jì)5656585861616464686872727474787881818585909094949797100100105105抽中戶抽樣框第二步:計(jì)算抽樣距離(K)如果抽取6戶進(jìn)行調(diào)查,則: 抽
30、樣距離K=105617.5nfK需要抽取的單位數(shù)輔助標(biāo)志累計(jì)數(shù)抽樣距離第三步:抽取調(diào)查單位半距起點(diǎn)、等距抽樣隨機(jī)起點(diǎn)、對(duì)稱等距抽樣以第一個(gè)抽樣距離的一半處作為第一個(gè)調(diào)查單位以后毎隔一個(gè)抽樣距離抽取一個(gè)調(diào)查單位直到最后一個(gè)調(diào)查單位抽出為止以抽取6戶為例,抽取的樣本戶:類推,直至抽完樣本單位序號(hào)1 12 23 34 45 56 67 78 89 91010111112121313141415152004年人均收入(十元)x18518518718719019019819820120121821825625626026027427429029029529532532534034036636636836
31、8人口數(shù)(人)f4 42 25 53 34 43 33 34 45 54 42 21 15 54 43 3人口數(shù)累計(jì)4 46 61111141418182121242428283333373739394040454549495252抽中戶3 38 81313序號(hào)1616171718181919202021212222232324242525262627272828292930302004年人均收入(十元)x370370371371388388402402410410446446453453470470477477490490499499502502503503516516520520人口數(shù)(人
32、)f4 42 23 33 34 44 42 24 43 34 45 54 43 33 35 5人口數(shù)累計(jì)5656585861616464686872727474787881818585909094949797100100105105抽中戶u 隨機(jī)起點(diǎn)、對(duì)稱等距抽樣 上例:若抽取6戶,第一戶隨機(jī)確定為5,則各戶依次為: 第1戶 n1: r =5 為第2號(hào)戶 第2戶 n2: 2Kr =217.5530 為第9號(hào)戶 第3戶 n3: 2K+ r =217.5+540 為第12號(hào)戶 第4戶 n4: 4Kr 417.5565 為第20號(hào)戶 第5戶 n5: 4K+ r417.5+575 為第23號(hào)戶 第6戶
33、 n6: 6Kr 617.55100 為第29號(hào)戶 從第二個(gè)單位起依次用2、4、6、倍的K值減、加r值確定。l 當(dāng)n為偶數(shù)時(shí)序號(hào)1 12 23 34 45 56 67 78 89 91010111112121313141415152004年人均收入(十元)x18518518718719019019819820120121821825625626260 0274274290290295295325325340340366366368368人口數(shù)(人)f4 42 25 53 34 43 33 34 45 54 42 21 15 54 43 3人口數(shù)累計(jì)4 46 611111414181821212
34、42428283333373739394040454549495252抽中戶2 29 91212序號(hào)1616171718181919202021212222232324242525262627272828292930302004年人均收入(十元)x37037037137138838840240241041044644645345347470 0477477490490499499502502503503516516520520人口數(shù)(人)f4 42 23 33 34 44 42 24 43 34 45 54 43 33 35 5人口數(shù)累計(jì)5656585861616464686872727474
35、787881818585909094949797100100105105抽中戶202023232929 第1戶 n1: r =5 為第2號(hào)戶 第2戶 n2: 2Kr =217.5530 為第9號(hào)戶 第3戶 n3: 2K+ r =217.5+540 為第12號(hào)戶 第4戶 n4: 4Kr 417.5565 為第20號(hào)戶 第5戶 n5: 4K+ r417.5+575 為第23號(hào)戶 第6戶 n6: 6Kr 617.55100 為第29號(hào)戶抽中戶的位置可用圖形表示如下:1k2k3k4k5k6kn1n2n3n4n5n6采取先抽中間、再抽兩邊的辦法 。 若中間單位數(shù)為奇數(shù),則各單位依次用中間單位數(shù)為起點(diǎn)的奇
36、數(shù)倍K值加、減r值確定。若中間單位數(shù)為偶數(shù),則各單位依次用中間單位數(shù)加1為起點(diǎn)的奇數(shù)倍K值減、加r值確定。中間單位之后計(jì)算方法與抽取單位數(shù)為偶數(shù)時(shí)的方法相同中間單位之前中間單位按f/2計(jì)算l 當(dāng)當(dāng)n為奇數(shù)時(shí)為奇數(shù)時(shí)上例中,若抽取5戶(中間單位數(shù)是3,即為奇數(shù)) 抽樣距離 K105521l第一個(gè)單位n1 隨機(jī)確定為15l中間單位n3f /2105252.5 中間單位以前還有一個(gè)單位,即n2ln2=2Kr2211527 中間單位以后有兩個(gè)單位,即n4和n5ln4=3K+r =3211578ln5=5Kr5211590則抽取的5戶依次為第5、8、16、23、26號(hào)的農(nóng)戶上例中,若n=7戶(中間單位數(shù)
37、是4,即為偶數(shù))l第一個(gè)單位n1 隨機(jī)確定為4l中間單位n4 f /2105252.5 中間單位以前還有n2和n3兩個(gè)單位ln22Kr215426ln32K+r215434 中間單位以后有三個(gè)單位,即ln5(4+1)Kr515471ln65K+r515+479ln77Kr7154101 則抽取的7戶依次為第1、8、10、16、21、24、30號(hào)的農(nóng)戶序號(hào)1 12 23 34 45 56 67 78 89 91010111112121313141415152004年人均收入(十元)x185185187187190190198198201201218218256256260260274274290
38、290295295325325340340366366368368人口數(shù)(人)f4 42 25 53 34 43 33 34 45 54 42 21 15 54 43 3人口數(shù)累計(jì)4 46 61111141418182121242428283333373739394040454549495252抽中戶1 181010序號(hào)1616171718181919202021212222232324242525262627272828292930302004年人均收入(十元)x37037037137138838840240241041044644645345347047047747749049049949
39、9502502503503516516520520人口數(shù)(人)f4 42 23 33 34 44 42 24 43 34 45 54 43 33 35 5人口數(shù)累計(jì)5656585861616464686872727474787881818585909094949797100100105105抽中戶1616212124243030n1:4 N2:26 N3:34 n4 :52.5 N5:71 N6:79 N7:101則:抽取的則:抽取的7戶依次為第戶依次為第1、8、10、16、21、24、30號(hào)的農(nóng)戶號(hào)的農(nóng)戶第四步:對(duì)樣本單位進(jìn)行調(diào)查第五步:統(tǒng)計(jì)推斷(抽樣估計(jì)) 方法同簡(jiǎn)單隨機(jī)抽樣(不重復(fù))平均
40、數(shù)的抽樣平均誤差、極限誤差、區(qū)間與總量估計(jì)成 數(shù) 的抽樣平均誤差、極限誤差、區(qū)間與總量估計(jì)三、整群抽樣將總體單位劃分成若干群(R)以群為單位,隨機(jī)抽取樣本群(r)對(duì)中選群的所有單位進(jìn)行全面調(diào)查D村莊村莊L村莊M村莊N村莊村莊J村莊A村莊B村莊C村莊E村莊F村莊G村莊H村莊K村莊例如:例如:對(duì)某鎮(zhèn)農(nóng)戶進(jìn)行家計(jì)調(diào)查,以自然村莊劃分群,抽取若干個(gè)自然村莊,對(duì)中選村莊的所有農(nóng)戶都進(jìn)行調(diào)查 整群抽樣抽樣平均誤差平均數(shù)的抽樣平均誤差:成 數(shù)的抽樣平均誤差:12RrRrxx12RrRrppr為樣本組數(shù)R為總體組數(shù)rxxix22)(2x為平均數(shù)的群間方差rppip22)(2p為成 數(shù)的群間方差 整群抽的樣抽樣
41、極限誤差、抽樣估計(jì) 方法同簡(jiǎn)單隨機(jī)抽樣 某生產(chǎn)車間有20個(gè)生產(chǎn)小組,生產(chǎn)同一種零件,隨機(jī)抽取4個(gè)生產(chǎn)小組(各有5人構(gòu)成)調(diào)查工人的日產(chǎn)量,抽樣資料見下表,試計(jì)算抽樣平均誤差。例題組序號(hào)工人日產(chǎn)量(個(gè)) 160、80、65、72、73 275、88、90、77、70 367、72、75、82、84 473、76、80、89、92四個(gè)組工人平均日產(chǎn)量群間方差抽樣平均誤差組序號(hào)工人日產(chǎn)量(個(gè))組平均日產(chǎn)量(個(gè))離差離差平方 160.80.65.72.73 70 7 49 275.88.90.77.70 80 3 9 367.72.75.82.84 76 1 1 473.76.80.89.92 82 5 25合計(jì) 84ix(個(gè))21484)(22rxxix(個(gè))77482768070rxxi(個(gè))4.412042042112RrRrxxix)77(xxxi2)(xxi某工廠晝夜連續(xù)生產(chǎn)某種產(chǎn)品,采取整群抽樣從全天24個(gè)小時(shí)生產(chǎn)的產(chǎn)品中隨機(jī)抽取12.5%的產(chǎn)品檢驗(yàn)其質(zhì)量。調(diào)查結(jié)果見下表,計(jì)算產(chǎn)品合格率的抽樣平均誤差。練習(xí)群序號(hào)群產(chǎn)品合格率(%)pi離差() pip離差平方()(pip)219510.0129420.04399 30.09合計(jì)0.14樣
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 正規(guī)勞動(dòng)合同(范本)
- 職業(yè)女農(nóng)民培訓(xùn)心得體會(huì)5篇
- 有價(jià)證券買入委托書(3篇)
- 24.4 相似三角形判定(第5課時(shí))同步練習(xí)
- 工會(huì)先進(jìn)女職工事跡材料
- 研討會(huì)主持詞結(jié)束語(22篇)
- 拒絕校園欺凌廣播稿范文600字(30篇)
- 師德教育個(gè)人自查報(bào)告范文(3篇)
- 新教材高考地理二輪專題復(fù)習(xí)單元綜合提升練8工業(yè)生產(chǎn)與地區(qū)產(chǎn)業(yè)結(jié)構(gòu)變化含答案
- 24.1 測(cè)量 同步練習(xí)
- 特殊教育語文教案(太陽)
- SAP增強(qiáng)實(shí)現(xiàn)批次自動(dòng)編號(hào)
- 微積分方法建模12傳染病模型數(shù)學(xué)建模案例分析
- 地下車庫(kù)交通設(shè)施標(biāo)牌標(biāo)線清單
- 千伏線路無人機(jī)放線施工方案
- 衛(wèi)浴產(chǎn)品世界各國(guó)認(rèn)證介紹
- 個(gè)體診所藥品清單
- 4X100米接力跑
- 灌漿材料性能測(cè)試方案
- 競(jìng)聘團(tuán)委書記演講.doc
- 煤礦安全數(shù)字化智能巡檢系統(tǒng)
評(píng)論
0/150
提交評(píng)論