版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、本資料來源是是以概率抽樣的樣本觀測(cè)結(jié)果去估以概率抽樣的樣本觀測(cè)結(jié)果去估計(jì)未知的總體數(shù)量特征計(jì)未知的總體數(shù)量特征(一)總體分布及其特征(一)總體分布及其特征 總體分布總體分布: 是指總體中所有個(gè)體關(guān)于某個(gè)變量(標(biāo)志)的取是指總體中所有個(gè)體關(guān)于某個(gè)變量(標(biāo)志)的取值所形成的分布。值所形成的分布。 總體參數(shù):總體參數(shù):反映總體分布特征的指標(biāo)反映總體分布特征的指標(biāo) 一、抽樣分布的基本問題一、抽樣分布的基本問題總體總體: 836: 836家上市公司家上市公司總體分布總體分布: 836: 836家上市公司當(dāng)天的漲幅家上市公司當(dāng)天的漲幅 x xi i i=1i=1.836.836總體參數(shù):總體參數(shù):4.36
2、%X 總統(tǒng)參數(shù)的值應(yīng)由總體全部單位的標(biāo)志值計(jì)算而來:總統(tǒng)參數(shù)的值應(yīng)由總體全部單位的標(biāo)志值計(jì)算而來:n對(duì)于特定的總體,總體參數(shù)值是對(duì)于特定的總體,總體參數(shù)值是唯一唯一的。的。n對(duì)于無限總體和非全面調(diào)查的有限總體,總體參數(shù)的值通對(duì)于無限總體和非全面調(diào)查的有限總體,總體參數(shù)的值通常常未知未知,只能通過樣本來估計(jì)。,只能通過樣本來估計(jì)。常用的總體參數(shù)有兩個(gè):常用的總體參數(shù)有兩個(gè):總體均值總體均值(包括是非變量的均值);(包括是非變量的均值);總體方差或標(biāo)準(zhǔn)差總體方差或標(biāo)準(zhǔn)差(包括是非變量的方差或標(biāo)準(zhǔn)差)。(包括是非變量的方差或標(biāo)準(zhǔn)差)。NXXX,210N1NmiimiiiNiiffXXNXX111或m
3、iiimiiNiifXXfSXXNS12121221111或PNNQNNP1,01PQNNSP12PXP(二)樣本分布及其特征(二)樣本分布及其特征當(dāng)樣本容量很大,或者是當(dāng)逐漸增大時(shí),樣本分布會(huì)接近當(dāng)樣本容量很大,或者是當(dāng)逐漸增大時(shí),樣本分布會(huì)接近總體分布??傮w分布。如果樣本容量很小,樣本分布就有可能與總體分布相差很如果樣本容量很小,樣本分布就有可能與總體分布相差很大,抽樣估計(jì)的結(jié)果就會(huì)很差。大,抽樣估計(jì)的結(jié)果就會(huì)很差。樣本統(tǒng)計(jì)量:樣本統(tǒng)計(jì)量:反映樣本分特征的指標(biāo),反映樣本分特征的指標(biāo), T T樣本統(tǒng)計(jì)量是隨機(jī)變量,它的取值隨樣本的不同而發(fā)生樣本統(tǒng)計(jì)量是隨機(jī)變量,它的取值隨樣本的不同而發(fā)生變化
4、。變化。樣本統(tǒng)計(jì)值:樣本統(tǒng)計(jì)值:是樣本統(tǒng)計(jì)量的值,由樣本單位是樣本統(tǒng)計(jì)量的值,由樣本單位的標(biāo)志值計(jì)算而來,用來估計(jì)總體參數(shù)。的標(biāo)志值計(jì)算而來,用來估計(jì)總體參數(shù)。 xi i=1604.86%x 樣本是隨機(jī)產(chǎn)生的,為樣本是隨機(jī)產(chǎn)生的,為了提高樣本的代表性,了提高樣本的代表性,可以選擇合適的抽樣組可以選擇合適的抽樣組織方式來產(chǎn)生樣本織方式來產(chǎn)生樣本抽樣估計(jì)就是以可知但非唯一的樣本統(tǒng)計(jì)量的值抽樣估計(jì)就是以可知但非唯一的樣本統(tǒng)計(jì)量的值 來估計(jì)未知但唯一的總體參數(shù)的值。來估計(jì)未知但唯一的總體參數(shù)的值。與總體參數(shù)相對(duì)應(yīng),常用的樣本統(tǒng)計(jì)量有與總體參數(shù)相對(duì)應(yīng),常用的樣本統(tǒng)計(jì)量有 樣本均值(或樣本成數(shù))、樣本均值
5、(或樣本成數(shù))、 樣本方差(或樣本標(biāo)準(zhǔn)差樣本方差(或樣本標(biāo)準(zhǔn)差 )。)。miimiiiniiffxxnxx111或nxxx,210n1nmiiimiiniifxxfsxxns12121221111或pnnqnnp1,01pxppqnnsp12假設(shè)從容量為假設(shè)從容量為N N的總體中抽取容量為的總體中抽取容量為n n的樣本最多可抽取的樣本最多可抽取m m套不套不同的樣本,則同的樣本,則m m個(gè)樣本統(tǒng)計(jì)值的頻率分布,即為抽樣分布。個(gè)樣本統(tǒng)計(jì)值的頻率分布,即為抽樣分布。實(shí)際的抽樣分布形成取決于以下五個(gè)因素:實(shí)際的抽樣分布形成取決于以下五個(gè)因素:總體分布總體分布(越集中,抽樣分布越集中)(越集中,抽樣分
6、布越集中)樣本容量樣本容量(最關(guān)鍵因素,容量越大抽樣分布越集中)(最關(guān)鍵因素,容量越大抽樣分布越集中)抽樣方法抽樣方法(采用重復(fù)或不重復(fù)方法,抽樣分布不同)(采用重復(fù)或不重復(fù)方法,抽樣分布不同)抽樣組織形式抽樣組織形式(不同形式下的樣本個(gè)數(shù)及結(jié)構(gòu)不同,抽樣(不同形式下的樣本個(gè)數(shù)及結(jié)構(gòu)不同,抽樣分布也不同)分布也不同)估計(jì)量構(gòu)造估計(jì)量構(gòu)造(樣本估計(jì)量不同,抽樣分布不同)(樣本估計(jì)量不同,抽樣分布不同)1x1x2x2xxX大樣本大樣本小樣本小樣本Xx返回2、抽樣分布形式、抽樣分布形式設(shè)從容量為設(shè)從容量為N的有限總體中抽取容量為的有限總體中抽取容量為n的樣本,最多可的樣本,最多可抽取抽取m套不同樣本
7、,計(jì)算得套不同樣本,計(jì)算得m個(gè)樣本統(tǒng)計(jì)值個(gè)樣本統(tǒng)計(jì)值n設(shè)設(shè)m個(gè)樣本統(tǒng)計(jì)值經(jīng)單項(xiàng)式分組可分為個(gè)樣本統(tǒng)計(jì)值經(jīng)單項(xiàng)式分組可分為k組,則抽樣分布的組,則抽樣分布的表現(xiàn)形式為:表現(xiàn)形式為:ix1x3xkx2x樣本均值的抽樣分布形式樣本均值的抽樣分布形式i123ki123k樣本成數(shù)的抽樣分布形式樣本成數(shù)的抽樣分布形式ip1p2p3pkpmki, 1元)(42550464238341NXXNii40484)0()4()8(1122222122NiiXXNS不同抽樣方法下樣本平均數(shù)的抽樣分布不同抽樣方法下樣本平均數(shù)的抽樣分布第一第一單位單位第二第二單位單位樣本樣本均值均值整理出樣本平均數(shù)的頻率分布如下整理出樣
8、本平均數(shù)的頻率分布如下:x樣本均值的抽樣本均值的抽樣分布樣分布0%5%10%15%20%25%343638404244464850樣本均值的抽樣分布圖樣本均值的抽樣分布圖(2)用不重復(fù)抽樣方法)用不重復(fù)抽樣方法 從從5個(gè)工人(日工資為個(gè)工人(日工資為34,38,42,46,50元)中元)中隨機(jī)抽取隨機(jī)抽取2人構(gòu)成樣本(考慮順序),共人構(gòu)成樣本(考慮順序),共5420個(gè)樣本。所有可能個(gè)樣本。所有可能樣本及其平均數(shù)樣本及其平均數(shù):第一第一單位單位第二第二單位單位樣本樣本均值均值整理出樣本平均數(shù)的頻率分布如下整理出樣本平均數(shù)的頻率分布如下:x0%5%10%15%20%25%3638404244464
9、8樣本均值的抽樣分布圖樣本均值的抽樣分布圖樣本均值的抽樣分樣本均值的抽樣分布布設(shè)某總體由設(shè)某總體由1010個(gè)球組成,其中紅球個(gè)球組成,其中紅球6 6個(gè),現(xiàn)從總體個(gè),現(xiàn)從總體中隨機(jī)抽取中隨機(jī)抽取4 4個(gè)球,那么在重復(fù)抽樣和不重復(fù)抽樣個(gè)球,那么在重復(fù)抽樣和不重復(fù)抽樣下紅球比重(樣本成數(shù))的抽樣分布分別如何?下紅球比重(樣本成數(shù))的抽樣分布分別如何?ipi重復(fù)抽樣下紅球比重的抽樣分布重復(fù)抽樣下紅球比重的抽樣分布0.6P 總體成數(shù)為總體成數(shù)為(1)0.26671NPPN總體方差為總體方差為在重復(fù)抽樣下,樣本中紅球的比重服從二項(xiàng)分布在重復(fù)抽樣下,樣本中紅球的比重服從二項(xiàng)分布1111()nnn nnnC
10、P Q01101010( ,)nnNNnNC Cn n N NCipi121024210902108021015210 不重復(fù)抽樣下紅球比重的抽樣分布不重復(fù)抽樣下紅球比重的抽樣分布樣本統(tǒng)計(jì)量的樣本統(tǒng)計(jì)量的數(shù)學(xué)期望數(shù)學(xué)期望:即所有樣本統(tǒng)計(jì)值的平均數(shù)即所有樣本統(tǒng)計(jì)值的平均數(shù)樣本統(tǒng)計(jì)量的樣本統(tǒng)計(jì)量的方差方差:即所有樣本統(tǒng)計(jì)值關(guān)于數(shù)學(xué)期望的方差即所有樣本統(tǒng)計(jì)值關(guān)于數(shù)學(xué)期望的方差iiEV2)()(iiE)(在前面的例題中,在前面的例題中,重復(fù)抽樣重復(fù)抽樣的抽樣分布如下的抽樣分布如下:x樣本平均數(shù)樣本平均數(shù)的期望與方差:的期望與方差:XxxEi(元)42%450%836%434)(16%4)4250(%8
11、)4236(%4)4234()()(2222ixExxVi不重復(fù)抽樣的抽樣分布如下不重復(fù)抽樣的抽樣分布如下: x樣本平均數(shù)樣本平均數(shù)的均值與方差:的均值與方差:XxxEi42)(12)()(2ixExxVi 樣本成數(shù)的抽樣分布:樣本成數(shù)的抽樣分布:(1)樣本成數(shù)的期望值:)樣本成數(shù)的期望值: 在重復(fù)或不重復(fù)抽樣下,樣本成數(shù)的均值都等于總體成數(shù)在重復(fù)或不重復(fù)抽樣下,樣本成數(shù)的均值都等于總體成數(shù)(2)樣本成數(shù)抽樣分布的方差:)樣本成數(shù)抽樣分布的方差: 重復(fù)抽樣方差大于不重復(fù)抽樣,重復(fù)抽樣方差大于不重復(fù)抽樣,顯然不重復(fù)抽樣下樣本成數(shù)顯然不重復(fù)抽樣下樣本成數(shù)的抽樣分布較為集中的抽樣分布較為集中結(jié)論:結(jié)
12、論:),(2SXNX xXxE)()()(2重復(fù)抽樣nSxV)()1 ()(2有限總體且不重復(fù)抽樣NnnSxV50X10s50)(xE5)(xVn=45 . 2)(xVn=16x抽樣分布抽樣分布(重復(fù)抽樣)(重復(fù)抽樣)任一總體(不要求正態(tài)),期望值任一總體(不要求正態(tài)),期望值 ,方差,方差 ,當(dāng)當(dāng)n足夠大(當(dāng)足夠大(當(dāng)n30,大樣本,大樣本), 趨于正態(tài)分布趨于正態(tài)分布X2SxXxE)()()(2重復(fù)抽樣nSxV2、中心極限定理、中心極限定理)()1 ()(2有限總體且不重復(fù)抽樣NnnSxV當(dāng)樣本容量足夠大時(shí)(大樣本)當(dāng)樣本容量足夠大時(shí)(大樣本) ,抽樣分布,抽樣分布趨于正態(tài)分布趨于正態(tài)分布
13、小樣小樣本本xXxE)()()(2重復(fù)抽樣nSxV從任意分從任意分布的總體布的總體中抽樣中抽樣大樣大樣本本若正態(tài)總體方差未知且若正態(tài)總體方差未知且n較小,則較小,則 服從于自由度為服從于自由度為n-1的的 t分布分布任一總體但任一總體但n較小,較小, 服從于自由度為服從于自由度為n-1的的 t分布分布xx3、t分布定理分布定理(二)樣本成數(shù)的抽樣分布定理(二)樣本成數(shù)的抽樣分布定理1、二項(xiàng)分布定理、二項(xiàng)分布定理從一個(gè)數(shù)學(xué)期望為從一個(gè)數(shù)學(xué)期望為p p、方差為、方差為 的是非變的是非變量(量(0-10-1分布)總體中隨機(jī)重復(fù)地抽取容量為分布)總體中隨機(jī)重復(fù)地抽取容量為n n的樣本,的樣本,那么樣本
14、中含有那么樣本中含有 個(gè)某類變量值的概率為:個(gè)某類變量值的概率為: 1NPQN 1111()nnn nnnC P Q1n2.2.超幾何分布定理超幾何分布定理 從一個(gè)數(shù)學(xué)期望為從一個(gè)數(shù)學(xué)期望為p p、方差為、方差為 的是非變的是非變量(量(0-10-1分布)總體中隨機(jī)不重復(fù)地抽取容量為分布)總體中隨機(jī)不重復(fù)地抽取容量為n n的樣的樣本,那么當(dāng)本,那么當(dāng) 同時(shí)同時(shí) 時(shí),樣本中含有時(shí),樣本中含有 個(gè)某類變量值的概率為:個(gè)某類變量值的概率為:1NP QN 01101010(,)nnNNnNCCnnNNC1nnN 0nN 1從一個(gè)數(shù)學(xué)期望為從一個(gè)數(shù)學(xué)期望為p p、方差為、方差為 的是非變量(的是非變量(
15、0-10-1分布)分布)總體中隨機(jī)抽取容量為總體中隨機(jī)抽取容量為n n的樣本,的樣本,當(dāng)當(dāng)n足夠大足夠大 ( nP5, n (1-P)5 ),樣本成數(shù)),樣本成數(shù)p趨于正態(tài)分布趨于正態(tài)分布 或nNNPQpV) 1()(1NnNnPQE(p)=P 3.3.中心極限定理中心極限定理1NPQN 正態(tài)分布是最重要、最常用的抽樣分布,由于正態(tài)分布是最重要、最常用的抽樣分布,由于抽樣一般都是大樣本,因此抽樣一般都是大樣本,因此可以根據(jù)正態(tài)分布可以根據(jù)正態(tài)分布理論,根據(jù)樣本統(tǒng)計(jì)值來推斷總體參數(shù)。理論,根據(jù)樣本統(tǒng)計(jì)值來推斷總體參數(shù)。抽樣誤差抽樣誤差 偶然性代表性誤差偶然性代表性誤差非抽樣誤差非抽樣誤差 系統(tǒng)性
16、代表性誤差系統(tǒng)性代表性誤差 觀測(cè)性誤差觀測(cè)性誤差抽樣誤差:抽樣誤差:是由于抽樣的非全面性和隨機(jī)性所引起的偶然性誤差,是由于抽樣的非全面性和隨機(jī)性所引起的偶然性誤差,即因抽樣估計(jì)值隨樣本不同所造成的誤差。即因抽樣估計(jì)值隨樣本不同所造成的誤差。特點(diǎn):隨著樣本容量的增大而趨向于特點(diǎn):隨著樣本容量的增大而趨向于0,不可避免但可以,不可避免但可以加以控制加以控制由隨機(jī)抽樣的偶然性因素以外的原因所引起的誤差。由隨機(jī)抽樣的偶然性因素以外的原因所引起的誤差。超過一定程度就會(huì)使抽樣估計(jì)失去意義,減少和控制超過一定程度就會(huì)使抽樣估計(jì)失去意義,減少和控制它十分重要。它十分重要。非抽樣誤差:非抽樣誤差:222非抽樣誤
17、差抽樣誤差總誤差總誤差總誤差抽樣誤差抽樣誤差非抽樣誤差非抽樣誤差由于由于隨機(jī)抽樣的偶然性因素使樣本不足以代表總體而引起樣本指標(biāo)隨機(jī)抽樣的偶然性因素使樣本不足以代表總體而引起樣本指標(biāo)與總體指標(biāo)間的差異(即偶然性誤差)與總體指標(biāo)間的差異(即偶然性誤差)(一)抽樣實(shí)際誤差(一)抽樣實(shí)際誤差n是抽樣估計(jì)值與總體參數(shù)真值之間的絕對(duì)離是抽樣估計(jì)值與總體參數(shù)真值之間的絕對(duì)離差,表示為差,表示為n由于隨機(jī)抽樣的偶然性,使樣本結(jié)構(gòu)不能與總體結(jié)構(gòu)由于隨機(jī)抽樣的偶然性,使樣本結(jié)構(gòu)不能與總體結(jié)構(gòu)完全一致,從而產(chǎn)生估計(jì)誤差完全一致,從而產(chǎn)生估計(jì)誤差成數(shù)估計(jì)的實(shí)際抽樣誤差成數(shù)估計(jì)的實(shí)際抽樣誤差是隨機(jī)變量,不同的樣本有不同
18、的抽樣實(shí)際誤差;是隨機(jī)變量,不同的樣本有不同的抽樣實(shí)際誤差;均值估計(jì)的實(shí)際抽樣誤差均值估計(jì)的實(shí)際抽樣誤差Xx Pp(二)抽樣標(biāo)準(zhǔn)誤差(二)抽樣標(biāo)準(zhǔn)誤差(抽樣平均誤差)(抽樣平均誤差) 是反映抽樣誤差是反映抽樣誤差一般水平一般水平的指標(biāo),實(shí)質(zhì)含義是的指標(biāo),實(shí)質(zhì)含義是 指樣本統(tǒng)計(jì)量抽樣分布的標(biāo)準(zhǔn)差指樣本統(tǒng)計(jì)量抽樣分布的標(biāo)準(zhǔn)差n它能夠反映樣本指標(biāo)與總體指標(biāo)的它能夠反映樣本指標(biāo)與總體指標(biāo)的平均離散程度平均離散程度,也能夠,也能夠說明說明樣本指標(biāo)代表性樣本指標(biāo)代表性的大小。的大小。抽樣標(biāo)準(zhǔn)誤越大(?。闃臃植荚诫x散(集中),抽樣標(biāo)準(zhǔn)誤越大(?。闃臃植荚诫x散(集中),樣本指標(biāo)對(duì)總體指標(biāo)的代表性越差(
19、好),抽樣估計(jì)的誤樣本指標(biāo)對(duì)總體指標(biāo)的代表性越差(好),抽樣估計(jì)的誤差平均來講就越大。差平均來講就越大。()SE()V( )SE16)(16)()(2xSExExxVi12)(12)()(2xSExExxVi前例中,重復(fù)抽樣下前例中,重復(fù)抽樣下前例中,不重復(fù)抽樣下前例中,不重復(fù)抽樣下說明不重復(fù)抽樣的樣本均值分布比重復(fù)抽樣更為集中,其說明不重復(fù)抽樣的樣本均值分布比重復(fù)抽樣更為集中,其樣本均值的代表性更好,樣本均值的代表性更好,不重復(fù)抽樣的抽樣誤差小于重復(fù)不重復(fù)抽樣的抽樣誤差小于重復(fù)抽樣抽樣。所以實(shí)踐中常用不重復(fù)抽樣方法。所以實(shí)踐中常用不重復(fù)抽樣方法。n上述公式在實(shí)際應(yīng)用時(shí)有兩個(gè)困難:上述公式在實(shí)
20、際應(yīng)用時(shí)有兩個(gè)困難:實(shí)際中無法根據(jù)該公式計(jì)算出標(biāo)準(zhǔn)誤,只能根實(shí)際中無法根據(jù)該公式計(jì)算出標(biāo)準(zhǔn)誤,只能根據(jù)一套樣本來計(jì)算其估計(jì)值據(jù)一套樣本來計(jì)算其估計(jì)值 ,因此抽樣標(biāo)準(zhǔn)誤因此抽樣標(biāo)準(zhǔn)誤 是隨機(jī)變量是隨機(jī)變量n需計(jì)算所有可能樣本統(tǒng)計(jì)量的值;需計(jì)算所有可能樣本統(tǒng)計(jì)量的值;n需要知道總體參數(shù)需要知道總體參數(shù))(xse)(xse(三)抽樣極限誤差(三)抽樣極限誤差n是指以樣本估計(jì)量估計(jì)總體參數(shù)時(shí)是指以樣本估計(jì)量估計(jì)總體參數(shù)時(shí)所允許的最大所允許的最大誤差范圍誤差范圍 通常用通常用 表示表示n抽樣極限誤差的實(shí)際意義:抽樣極限誤差的實(shí)際意義: 實(shí)際上就是對(duì)總體參數(shù)可允許取的最高值或最低值進(jìn)實(shí)際上就是對(duì)總體參數(shù)可
21、允許取的最高值或最低值進(jìn)行了限制。即希望總體參數(shù)落在樣本估計(jì)量的行了限制。即希望總體參數(shù)落在樣本估計(jì)量的 范圍范圍內(nèi)內(nèi)n抽樣極限誤差越大,抽樣估計(jì)的精確度越低抽樣極限誤差越大,抽樣估計(jì)的精確度越低2、抽樣估計(jì)的概率保證程度(置信水平)、抽樣估計(jì)的概率保證程度(置信水平) 是指抽樣估計(jì)結(jié)果的是指抽樣估計(jì)結(jié)果的可靠程度可靠程度,即抽樣估計(jì)結(jié)果是準(zhǔn)確,即抽樣估計(jì)結(jié)果是準(zhǔn)確的概率(可靠程度)有多大。通常表示為的概率(可靠程度)有多大。通常表示為 ,其,其中中 稱為稱為顯著性水平顯著性水平 。 11 指的是總體參數(shù)處于區(qū)間指的是總體參數(shù)處于區(qū)間 內(nèi)的概率。內(nèi)的概率。 即總體參數(shù)不在區(qū)間內(nèi)的概率。即總體參
22、數(shù)不在區(qū)間內(nèi)的概率。要求估計(jì)結(jié)果的可靠程度越高,則要求估計(jì)結(jié)果的可靠程度越高,則 越大。越大。)(2/SEZ)(/2/SEZ 其中,其中, 稱為稱為抽樣概率度抽樣概率度??梢?,抽樣極限誤差分別與概率度和抽樣標(biāo)準(zhǔn)誤差成正比??梢?,抽樣極限誤差分別與概率度和抽樣標(biāo)準(zhǔn)誤差成正比。 越高,抽樣估計(jì)的可靠程度越高,但越高,抽樣估計(jì)的可靠程度越高,但 也越大也越大 ,估計(jì)的,估計(jì)的精確度降低。精確度降低。12/Z2Z2Z221 正是當(dāng)顯著性水平為正是當(dāng)顯著性水平為 時(shí)的標(biāo)準(zhǔn)正態(tài)分布的時(shí)的標(biāo)準(zhǔn)正態(tài)分布的雙側(cè)臨界值,概率保證程度雙側(cè)臨界值,概率保證程度 與與 的值是一一的值是一一對(duì)應(yīng)的對(duì)應(yīng)的12/Z2/Z68
23、.27%95.45%99.73%)1 ,0( NZ01232131常用的:常用的:1 = 68.27%, 90%, 95% ,95.45%, 99.73% = 1, 1.64 , 1.96, 2, 3 2z第三節(jié)第三節(jié) 參數(shù)估計(jì)方法參數(shù)估計(jì)方法一、估計(jì)量的評(píng)價(jià)標(biāo)準(zhǔn)一、估計(jì)量的評(píng)價(jià)標(biāo)準(zhǔn) 所謂所謂估計(jì)量估計(jì)量,就是用以估計(jì)總體參數(shù)的量,或者,就是用以估計(jì)總體參數(shù)的量,或者說是根據(jù)樣本結(jié)果來估計(jì)總體參數(shù)的規(guī)則或形式。說是根據(jù)樣本結(jié)果來估計(jì)總體參數(shù)的規(guī)則或形式。估計(jì)量一般情況下就是估計(jì)量一般情況下就是樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量。估計(jì)量的某一具體的值,就稱為估計(jì)量的某一具體的值,就稱為估計(jì)值估計(jì)值。評(píng)價(jià)估計(jì)量
24、好壞的標(biāo)準(zhǔn)有四個(gè):評(píng)價(jià)估計(jì)量好壞的標(biāo)準(zhǔn)有四個(gè):無偏性、有效性、一致性和充分性無偏性、有效性、一致性和充分性符合標(biāo)準(zhǔn)的稱為符合標(biāo)準(zhǔn)的稱為優(yōu)良估計(jì)量優(yōu)良估計(jì)量oemmxX當(dāng)有兩個(gè)以上個(gè)統(tǒng)計(jì)量可以估計(jì)某個(gè)總體參數(shù)時(shí),當(dāng)有兩個(gè)以上個(gè)統(tǒng)計(jì)量可以估計(jì)某個(gè)總體參數(shù)時(shí),應(yīng)該如何選擇?應(yīng)該如何選擇?若若 ,則稱為的無偏估計(jì)量。,則稱為的無偏估計(jì)量。)(E12 若若 則稱則稱 為比更有效的估計(jì)量為比更有效的估計(jì)量12)()(21VVX12xemXnxxnii1q 為為 、 s2n-1為為S2 、p 為為P的無偏、的無偏、有效、一致、充分估計(jì)量。有效、一致、充分估計(jì)量。xX同時(shí)滿足上述四個(gè)標(biāo)準(zhǔn),則為同時(shí)滿足上述四個(gè)
25、標(biāo)準(zhǔn),則為優(yōu)良估計(jì)量優(yōu)良估計(jì)量二、參數(shù)估計(jì)方法二、參數(shù)估計(jì)方法 點(diǎn)估計(jì):也稱定值估計(jì)點(diǎn)估計(jì):也稱定值估計(jì)pPsSxX,n關(guān)鍵問題是估計(jì)量的選擇關(guān)鍵問題是估計(jì)量的選擇點(diǎn)估計(jì)的優(yōu)缺點(diǎn)點(diǎn)估計(jì)的優(yōu)缺點(diǎn)n 若已知抽樣極限誤差若已知抽樣極限誤差 ,則總體參數(shù)處在樣本估計(jì)量,則總體參數(shù)處在樣本估計(jì)量的的 范圍內(nèi),范圍內(nèi),那么總體參數(shù)的區(qū)間范圍為那么總體參數(shù)的區(qū)間范圍為:,在一定的概率保證程度在一定的概率保證程度 下,找到相應(yīng)的抽樣極限誤下,找到相應(yīng)的抽樣極限誤差差 的值,則可以確定估計(jì)區(qū)間的上下限的值,則可以確定估計(jì)區(qū)間的上下限1)(2/SEZn估計(jì)估計(jì)區(qū)間區(qū)間可表示為:可表示為:n )(),(2/2/xs
26、eZxxseZx)(),(2/2/pseZppseZp )(),(,2/2/seZseZX 的估計(jì)區(qū)間:的估計(jì)區(qū)間:P 的估計(jì)區(qū)間:的估計(jì)區(qū)間:一般在給定的概率保證程度下,盡可能提高估計(jì)的精一般在給定的概率保證程度下,盡可能提高估計(jì)的精度度 (通過降低抽樣標(biāo)準(zhǔn)誤)。通過降低抽樣標(biāo)準(zhǔn)誤)。置信度置信度1越大,越大, 越大,估計(jì)的精確程度越低。反之,越大,估計(jì)的精確程度越低。反之,置信度置信度1 越小,越小, 越小,估計(jì)的精確度越高。越小,估計(jì)的精確度越高。 )(2/SEZ希望置信度盡可能大(可靠程度高),同時(shí)精確度盡可能希望置信度盡可能大(可靠程度高),同時(shí)精確度盡可能高(估計(jì)區(qū)間的長度短)。高
27、(估計(jì)區(qū)間的長度短)。但在樣本容量但在樣本容量n一定時(shí),兩者矛一定時(shí),兩者矛盾。盾。n抽樣組織形式:抽樣組織形式: 簡單隨機(jī)抽樣簡單隨機(jī)抽樣 等距抽樣等距抽樣 分層抽樣分層抽樣 整群抽樣整群抽樣 多階段抽樣多階段抽樣1、計(jì)算估計(jì)量、計(jì)算估計(jì)量 2、抽樣標(biāo)準(zhǔn)誤、抽樣標(biāo)準(zhǔn)誤(1)當(dāng)總體方差已知)當(dāng)總體方差已知Xixnx1)()(2重復(fù)抽樣nSxSE(一)總體均值(一)總體均值 的估計(jì)的估計(jì) f=n/N, 稱為稱為抽樣比抽樣比當(dāng)當(dāng)f5%,有限總體校正系數(shù),有限總體校正系數(shù)1-f可以忽略不計(jì)可以忽略不計(jì))( )1 ()(2不重復(fù)抽樣fnSxSE支)(小時(shí)/4330X)(小時(shí)222531100)(ffX
28、XS(2)當(dāng)總體方差未知時(shí),用樣本方差)當(dāng)總體方差未知時(shí),用樣本方差s2代替代替)()(2重復(fù)抽樣nsxse)( )1 ()(2不重復(fù)抽樣fnsxse支)(小時(shí)/4340 x)(小時(shí)2225344001)(ffxxs)(xseXxx,2z(二)總體成數(shù)(二)總體成數(shù)P的估計(jì)的估計(jì) 1、計(jì)算估計(jì)量、計(jì)算估計(jì)量 2、抽樣標(biāo)準(zhǔn)誤、抽樣標(biāo)準(zhǔn)誤(1)當(dāng))當(dāng) 總體成數(shù)已知(總體方差總體成數(shù)已知(總體方差 已知)已知)nnp1)() 1()(2重復(fù)抽樣nPQnNNPQnSpSEP)( )1 ()1 ()(2不重復(fù)抽樣fnPQfnSpSEP12NNPQSP)(1) 1()(2重復(fù)抽樣npqnnnpqnspse
29、p)( )1 (1)(不重復(fù)抽樣fnpqpse12nnpqsp【例例3.5】 對(duì)某天生產(chǎn)的對(duì)某天生產(chǎn)的2000件電子元件抽取件電子元件抽取5進(jìn)行耐用進(jìn)行耐用時(shí)間檢測(cè),耐用時(shí)間在時(shí)間檢測(cè),耐用時(shí)間在3000小時(shí)以下為不合格,求合格率小時(shí)以下為不合格,求合格率的抽樣標(biāo)準(zhǔn)誤。(重復(fù)和不重復(fù))的抽樣標(biāo)準(zhǔn)誤。(重復(fù)和不重復(fù))(1)給定)給定 1 1 ,查表得,查表得2z)(/2pseZpppppppPpPp,或,【例例3.6】對(duì)某高校學(xué)生消費(fèi)現(xiàn)狀和消費(fèi)觀念進(jìn)行調(diào)查,隨對(duì)某高校學(xué)生消費(fèi)現(xiàn)狀和消費(fèi)觀念進(jìn)行調(diào)查,隨機(jī)調(diào)查了機(jī)調(diào)查了100名學(xué)生,其中有名學(xué)生,其中有98名認(rèn)為名認(rèn)為“大學(xué)生在食堂就大學(xué)生在食堂就
30、餐時(shí)浪費(fèi)情況比較嚴(yán)重餐時(shí)浪費(fèi)情況比較嚴(yán)重”?,F(xiàn)要求在。現(xiàn)要求在95的概率保證程的概率保證程度下,估計(jì)全校學(xué)生中持有相同觀點(diǎn)的學(xué)生所占比重。度下,估計(jì)全校學(xué)生中持有相同觀點(diǎn)的學(xué)生所占比重。2、不考慮調(diào)查經(jīng)費(fèi)時(shí)樣本容量的確定:、不考慮調(diào)查經(jīng)費(fèi)時(shí)樣本容量的確定: nSZx2/2222/2SZn重,)(/2/2nPQZpSEZp22/2pPQZn重 ,1)(2NnnSZxseZx22222SZNSNZnx不重NnnNSZSZNSZNNNSNZn重重不重11/22222222222222Nnnn重重不重1不重重nn不重復(fù)抽樣下估計(jì)均值和成數(shù)都可以直接采用不重復(fù)抽樣下估計(jì)均值和成數(shù)都可以直接采用總體方差通
31、常未知,一般按以下方法確定其估計(jì)值:總體方差通常未知,一般按以下方法確定其估計(jì)值: 過去的數(shù)據(jù)或經(jīng)驗(yàn)判斷;過去的數(shù)據(jù)或經(jīng)驗(yàn)判斷; 小規(guī)模試抽樣的樣本方差。小規(guī)模試抽樣的樣本方差。(統(tǒng)計(jì)分組在抽樣估計(jì)中的應(yīng)用統(tǒng)計(jì)分組在抽樣估計(jì)中的應(yīng)用) 設(shè)總體的設(shè)總體的N個(gè)個(gè)體分為個(gè)個(gè)體分為H 層,層, 為第為第i層個(gè)體數(shù),層個(gè)體數(shù), 為第為第i層的層權(quán),層的層權(quán), 為第為第i層抽取的個(gè)體數(shù),層抽取的個(gè)體數(shù), 為第為第i層的抽樣比,層的抽樣比, 為第為第i層第層第j個(gè)個(gè)體的變個(gè)個(gè)體的變量值量值 第第i層的層均值層的層均值 的估計(jì)量為:的估計(jì)量為: iNiiWNNiniiifnNijxiX1HijiiiixXxn
32、n(一)總體平均數(shù)的估計(jì)(一)總體平均數(shù)的估計(jì)1N1n1x2N2n2xkNknkx1X2XkXX)(xSE)(1xse)(2xse)(kxseNNWii權(quán)數(shù)其中其中 為第為第i層的方差,未知時(shí)要用層內(nèi)樣本層的方差,未知時(shí)要用層內(nèi)樣本 方差方差 來估計(jì)。來估計(jì)。 1HstiiiXxW x221()HiistiiW SSE xn2211()HistiiiifSE xW Sn2121iNijijiixXSN()2is總體均值的估計(jì)量為:總體均值的估計(jì)量為:與該估計(jì)量相對(duì)應(yīng)的抽樣標(biāo)準(zhǔn)誤為:與該估計(jì)量相對(duì)應(yīng)的抽樣標(biāo)準(zhǔn)誤為:(重復(fù)抽樣時(shí))(重復(fù)抽樣時(shí))(不重復(fù)抽樣時(shí))(不重復(fù)抽樣時(shí))【例例3.12】調(diào)查某
33、地區(qū)的居民年訂購書報(bào)費(fèi),以居民戶為抽調(diào)查某地區(qū)的居民年訂購書報(bào)費(fèi),以居民戶為抽樣單元,根據(jù)經(jīng)濟(jì)及收入水平將居民戶劃分為樣單元,根據(jù)經(jīng)濟(jì)及收入水平將居民戶劃分為4層,每層按層,每層按純隨機(jī)抽樣抽取純隨機(jī)抽樣抽取10戶,獲得如下數(shù)據(jù)戶,獲得如下數(shù)據(jù)(單位:元單位:元)。試以。試以95%的概率估計(jì)該地區(qū)居民平均年訂購書報(bào)費(fèi)的區(qū)間。的概率估計(jì)該地區(qū)居民平均年訂購書報(bào)費(fèi)的區(qū)間。 設(shè)設(shè) 為第為第 層的某類變量值的個(gè)數(shù),層的某類變量值的個(gè)數(shù), 為第為第i i層層樣本中某類變量值的個(gè)數(shù),那么第樣本中某類變量值的個(gè)數(shù),那么第i i層成數(shù)層成數(shù) 的的估計(jì)量為:估計(jì)量為: (二二)總體成數(shù)總體成數(shù)p的估計(jì)的估計(jì)1i
34、iiinPpn1HstiiiPpW piP1 iNi1 in總體成數(shù)的估計(jì)量為:總體成數(shù)的估計(jì)量為:與該估計(jì)量相對(duì)應(yīng)的抽樣標(biāo)準(zhǔn)誤為:與該估計(jì)量相對(duì)應(yīng)的抽樣標(biāo)準(zhǔn)誤為: 層方差層方差 未知時(shí)要以層內(nèi)樣本方差未知時(shí)要以層內(nèi)樣本方差 來估計(jì)。來估計(jì)。 21()1HiistiiiiiWNSE pPQnN211()1HiiistiiiiifWNSE pPQnN()1iiiiNPQN 1iiiinp qn (重復(fù)抽樣)(重復(fù)抽樣)(不重復(fù)抽樣)(不重復(fù)抽樣) 1.1.比例分配法比例分配法 這是分層抽樣最常用的分配法,即根據(jù)這是分層抽樣最常用的分配法,即根據(jù) 的關(guān)系的關(guān)系來確定來確定 ,也即:,也即: 分層抽
35、樣的抽樣標(biāo)準(zhǔn)誤公式可簡化為分層抽樣的抽樣標(biāo)準(zhǔn)誤公式可簡化為(以總體均值估計(jì)為例):(以總體均值估計(jì)為例): 其中其中 iniinNnNiniinWn21()stiifSE xW Sn22iiiiW SW SnNiiinnffNN=(三)各層樣本容量(三)各層樣本容量 的確定的確定 2.2.最優(yōu)分配法(最優(yōu)分配法(NeymanNeyman分配法)分配法) 該法除了考慮各層容量該法除了考慮各層容量 大小這一因素外,還考慮各大小這一因素外,還考慮各層內(nèi)在差異程度層內(nèi)在差異程度 不同這一因素,即不同這一因素,即 分層抽樣的抽樣標(biāo)準(zhǔn)誤公式可改為分層抽樣的抽樣標(biāo)準(zhǔn)誤公式可改為: iNiSiiiiiN Sn
36、nN S22()()iiiistW SW SSE xnN 該法除了考慮該法除了考慮 和和 這兩個(gè)因素外,還考慮各層個(gè)這兩個(gè)因素外,還考慮各層個(gè) 體調(diào)查費(fèi)用高低體調(diào)查費(fèi)用高低 這一因素,即:這一因素,即: 這時(shí),分層抽樣的抽樣標(biāo)準(zhǔn)誤公式可改為:這時(shí),分層抽樣的抽樣標(biāo)準(zhǔn)誤公式可改為: iNiSiCiiiiiiiW SCnnW SC2()iiiiiiiistW SW SCW SCSE xnN3.3.經(jīng)濟(jì)分配法經(jīng)濟(jì)分配法【例例3.13】在例在例3.12調(diào)查中,同時(shí)調(diào)查了居民擁有筆記本調(diào)查中,同時(shí)調(diào)查了居民擁有筆記本電腦情況,獲得如下數(shù)據(jù)電腦情況,獲得如下數(shù)據(jù)(單位:臺(tái)單位:臺(tái))。試以。試以95%的概的
37、概率估計(jì)該地區(qū)居民擁有筆記本電腦比重的區(qū)間。率估計(jì)該地區(qū)居民擁有筆記本電腦比重的區(qū)間??傮w參數(shù)估計(jì)可按如下方法近似估算:總體參數(shù)估計(jì)可按如下方法近似估算:設(shè)總體的設(shè)總體的N個(gè)個(gè)體形成個(gè)個(gè)體形成R群,每群群,每群M個(gè)個(gè)體。從個(gè)個(gè)體。從R群中群中隨機(jī)抽取隨機(jī)抽取r群(一般采用不重復(fù)抽樣方法),共群(一般采用不重復(fù)抽樣方法),共rM=n個(gè)個(gè)體構(gòu)成樣本。若以個(gè)個(gè)體構(gòu)成樣本。若以 表示第表示第i群第群第j個(gè)體的變量值,個(gè)體的變量值,那么群均值那么群均值 為:為: (一)總體均值的估計(jì)(一)總體均值的估計(jì)ijxiX1riicsXXxr1MijjixXM總體均值的估計(jì)量為:總體均值的估計(jì)量為: 抽樣標(biāo)準(zhǔn)誤為
38、:抽樣標(biāo)準(zhǔn)誤為: 時(shí)要以樣本群間方差時(shí)要以樣本群間方差 來估計(jì)。來估計(jì)。21()csBfSE xSr221()1RiiBXXSB2BS221()1ricsibXxsr為總體群間方差。為總體群間方差。 未知未知f=r/R為群抽樣比為群抽樣比 設(shè)設(shè) 為第為第i群某類變量值的個(gè)數(shù),那么群成數(shù)群某類變量值的個(gè)數(shù),那么群成數(shù) 為:為: 總體成數(shù)的估計(jì)量為總體成數(shù)的估計(jì)量為: 抽樣標(biāo)準(zhǔn)誤抽樣標(biāo)準(zhǔn)誤為:為: 其中其中f=r/R為群抽樣比,為群抽樣比, 為總體群間方差。為總體群間方差。 未知未知 時(shí)要以樣本群間方差時(shí)要以樣本群間方差 來估計(jì)。來估計(jì)。 1 iMiP1 iiMPM1riicsPPpr2(1)()PBcsf SSE pr221()1RiiPBPPSB2PBS221()1ricsipbPpsr (二)總體成數(shù)(二)總體成數(shù)p的估計(jì)的估計(jì)【例例3.14】對(duì)燈泡質(zhì)量進(jìn)行抽樣檢查,每隔對(duì)燈泡質(zhì)量進(jìn)行抽樣檢查,每隔5小時(shí),抽出小時(shí),抽出6分種產(chǎn)品進(jìn)行全面檢測(cè),共抽取分種產(chǎn)品進(jìn)行全面檢測(cè),共抽取25批,測(cè)得平均照明時(shí)批,測(cè)得平均照明時(shí)間為間為935小時(shí),樣本標(biāo)準(zhǔn)差為小時(shí),樣本標(biāo)準(zhǔn)差為50小時(shí),試以小時(shí),試以68.27%的概的概率保證程度估計(jì)全部
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 浙江省溫州東甌中學(xué) 2025屆數(shù)學(xué)高二上期末預(yù)測(cè)試題含解析
- 2025屆內(nèi)蒙古北方重工第三中學(xué)高一上數(shù)學(xué)期末考試試題含解析
- MTP培訓(xùn)課件教學(xué)課件
- 湖南省武岡二中2025屆語文高三上期末監(jiān)測(cè)模擬試題含解析
- 四川省成都市七中2025屆英語高三上期末監(jiān)測(cè)模擬試題含解析
- 2025屆江西省宜春市生物高一第一學(xué)期期末達(dá)標(biāo)檢測(cè)試題含解析
- 2025屆山西省臨汾一中生物高一第一學(xué)期期末質(zhì)量跟蹤監(jiān)視模擬試題含解析
- 江蘇省海門市東洲國際學(xué)校2025屆語文高三上期末質(zhì)量檢測(cè)試題含解析
- 山西省忻州一中2025屆生物高三上期末聯(lián)考試題含解析
- 2025屆陜西西安地區(qū)八校高二上生物期末達(dá)標(biāo)檢測(cè)模擬試題含解析
- 處方調(diào)劑流程
- 國有企業(yè)共青團(tuán)創(chuàng)新工作方法研究
- 建筑行業(yè)(建筑工程)建設(shè)項(xiàng)目設(shè)計(jì)方案規(guī)模劃分表.doc
- 辦理營業(yè)執(zhí)照委托書
- 集裝箱設(shè)計(jì)PPT課件
- 實(shí)習(xí)實(shí)訓(xùn)報(bào)告-墊片復(fù)合沖壓模具的設(shè)計(jì)
- 35kv變電所電氣部分設(shè)計(jì)(有設(shè)計(jì)源圖)
- 編寫標(biāo)準(zhǔn)必備文件 國家標(biāo)準(zhǔn) 地方標(biāo)準(zhǔn) 行業(yè)標(biāo)準(zhǔn) 企業(yè)標(biāo)準(zhǔn) 格式模板大全
- 全面預(yù)算實(shí)施方案(共8篇)
- 天津市南開中學(xué)2020-2021學(xué)年高一上學(xué)期期中考試物理試題含答案
- 建設(shè)工程施工勞務(wù)分包合同(地坪)(完整版)
評(píng)論
0/150
提交評(píng)論