




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
參數(shù)估計(jì)假設(shè)檢驗(yàn)統(tǒng)計(jì)方法描述統(tǒng)計(jì)推斷統(tǒng)計(jì)統(tǒng)計(jì)估計(jì)非參數(shù)估計(jì)參數(shù)估計(jì)假設(shè)檢驗(yàn)統(tǒng)計(jì)方法描述統(tǒng)計(jì)推斷統(tǒng)計(jì)統(tǒng)計(jì)估計(jì)非參數(shù)估計(jì)*第5章抽樣推斷5.1抽樣推斷的一般問(wèn)題5.2抽樣誤差5.3參數(shù)估計(jì)5.4樣本容量的確定*第5章抽樣推斷5.1抽樣推斷的一般問(wèn)題*抽樣推斷的過(guò)程總體樣本隨機(jī)取樣計(jì)算出樣本的均值、樣本比例、樣本方差調(diào)查總體均值、總體比例、總體方差等推斷*抽樣推斷的過(guò)程總體樣本隨機(jī)取樣計(jì)算出樣本的均值、樣本比例、*5.1抽樣推斷的一般問(wèn)題
5.1.1抽樣推斷的概念和特點(diǎn)
5.1.2抽樣推斷的基本范疇
5.1.3抽樣分布*5.1抽樣推斷的一般問(wèn)題*1、概念抽樣推斷是在抽樣調(diào)查的基礎(chǔ)上,根據(jù)樣本的情況來(lái)推斷總體特征的一種統(tǒng)計(jì)分析方法。2、抽樣推斷的特點(diǎn)按照隨機(jī)原則抽取樣本單位(樣品);根據(jù)對(duì)樣本的調(diào)查對(duì)總體做出推斷;抽樣誤差可以事先計(jì)算并加以控制。3、抽樣推斷的適用場(chǎng)合無(wú)法進(jìn)行全面調(diào)查時(shí);進(jìn)行全面調(diào)查有困難或不必要時(shí);5.1.1抽樣推斷的概念和特點(diǎn)*1、概念5.1.1抽樣推斷的概念和特點(diǎn)*1.抽樣框和抽樣單位(1)總體和樣本
總體也稱母體,是所要研究的全部單位組成的整體。一般用N表示總體包括的總體單位數(shù)。樣本又稱子樣,它是從總體中隨機(jī)抽取出來(lái)的一部分單位組成的整體。一般用n表示樣本包括的總體單位數(shù)。作為推斷對(duì)象的總體是確定的,而且是唯一的;作為觀察對(duì)象的樣本不是確定的,也不是唯一的。5.1.2抽樣推斷的基本范疇*1.抽樣框和抽樣單位5.1.2抽樣推斷的基本范疇*(2)抽樣框:抽樣框是包括全部總體單位的框架,以此代表總體,用來(lái)從中抽取樣本單位,具體表現(xiàn)形式有總體單位(或其集合)的名單或目錄、地圖、時(shí)間等。(3)抽樣單位:抽樣單位是構(gòu)成抽樣框的基本要素,它可以是總體單位也可以是總體單位的集合。*(2)抽樣框:*2.重復(fù)抽樣和不重復(fù)抽樣重復(fù)抽樣,也叫回置抽樣/放回抽樣,是指從總體的N個(gè)單位中抽取一個(gè)容量為n的樣本,每次抽出一個(gè)單位后,再將其放回總體中參加下一次抽取,這樣連續(xù)抽n次即得到一個(gè)樣本。不重復(fù)抽樣,也叫不回置抽樣/不放回抽樣,是指抽中單位不再放回總體中,下一個(gè)樣本單位只能從余下的抽樣單位中抽取。*2.重復(fù)抽樣和不重復(fù)抽樣*3.樣本容量和樣本可能數(shù)目樣本容量:一個(gè)樣本所包含的總體單位數(shù),用n表示,當(dāng)樣本容量大于等于30時(shí)稱為大樣本,小于30時(shí)稱為小樣本。樣本可能數(shù)目:指按一定抽樣方法和一定樣本容量從總體中抽取樣本時(shí),所有可能的樣本個(gè)數(shù),一般用M表示。
*3.樣本容量和樣本可能數(shù)目*考慮順序的重復(fù)抽樣的樣本可能數(shù)目:考慮順序的不重復(fù)抽樣的樣本可能數(shù)目:樣本可能數(shù)目的計(jì)算*考慮順序的重復(fù)抽樣的樣本可能數(shù)目:樣本可能數(shù)目的計(jì)算*不考慮順序的重復(fù)抽樣的可能樣本數(shù)目:不考慮順序的不重復(fù)抽樣的可能樣本數(shù)目:客觀現(xiàn)象中常見的*不考慮順序的重復(fù)抽樣的可能樣本數(shù)目:不考慮順序的不重復(fù)抽樣*4.參數(shù)和統(tǒng)計(jì)量參數(shù):根據(jù)總體中各單位的變量值計(jì)算的、反映總體數(shù)量特征的特征值。主要有總體均值、成數(shù)或比例、方差。統(tǒng)計(jì)量:根據(jù)樣本中各單位的變量值計(jì)算的、反映樣本數(shù)量特征的特征值。主要有樣本均值、成數(shù)或比例、方差??傮w是確定的、唯一的,所以總體參數(shù)也是確定的、唯一的;樣本是隨機(jī)的,所以樣本統(tǒng)計(jì)量是隨機(jī)變量。*4.參數(shù)和統(tǒng)計(jì)量*
總體參數(shù)樣本統(tǒng)計(jì)量*總體參數(shù)*樣本統(tǒng)計(jì)量的概率分布;隨機(jī)變量是樣本統(tǒng)計(jì)量:樣本均值,樣本比例,樣本方差等結(jié)果來(lái)自容量相同的所有可能樣本;提供了樣本統(tǒng)計(jì)量的分布特征,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù)。 5.1.3抽樣分布
(samplingdistribution)*樣本統(tǒng)計(jì)量的概率分布;5.1.3抽樣分布
(sampl*抽樣分布的形成
(samplingdistribution)總體計(jì)算樣本統(tǒng)計(jì)量:樣本均值、比例、方差樣本*抽樣分布的形成
(samplingdistributi*1.形成過(guò)程從單位數(shù)為N的總體中抽取樣本容量為n的隨機(jī)樣本,在重復(fù)抽樣的條件下,共有Nn個(gè)可能的樣本,在不重復(fù)抽樣條件下,共有PNn個(gè)可能樣本;對(duì)于每一個(gè)樣本,我們都可以計(jì)算出樣本的均值;將所有可能樣本的樣本均值根據(jù)其取值形成概率分布,即可得到樣本均值的抽樣分布,它是推斷總體均值的理論基礎(chǔ)。(一)樣本均值的抽樣分布*1.形成過(guò)程(一)樣本均值的抽樣分布*【例】設(shè)一個(gè)總體,總體單位數(shù)N=4。4個(gè)單位某一標(biāo)志值的取值分別為x1=1、x2=2、x3=3、x4=4??傮w的均值、方差及分布如下:
總體分布14230.1.2.3均值和方差*【例】設(shè)一個(gè)總體,總體單位數(shù)N=4。4個(gè)單位某一標(biāo)志值的*現(xiàn)從總體中抽取n=2的簡(jiǎn)單隨機(jī)樣本,在重復(fù)抽樣條件下,共有16個(gè)樣本。所有樣本的結(jié)果為:3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個(gè)觀察值第一個(gè)觀察值所有可能的n=2的樣本(共16個(gè))*現(xiàn)從總體中抽取n=2的簡(jiǎn)單隨機(jī)樣本,在重復(fù)抽樣條件下,共有*計(jì)算出各樣本的均值,并給出樣本均值的抽樣分布:3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值(x)x樣本均值的抽樣分布1.00.1.2.3P(x)1.53.04.03.52.02.5*計(jì)算出各樣本的均值,并給出樣本均值的抽樣分布:3.53.0*2.樣本均值的數(shù)字特征*2.樣本均值的數(shù)字特征*證明:*證明:*X=2.5σ2=1.25總體分布14230.1.2.3抽樣分布P(X)1.00.1.2.31.53.04.03.52.02.5XxP(x)結(jié)論:1.樣本均值的均值(數(shù)學(xué)期望)等于總體均值;
2.樣本均值的方差等于總體方差的1/n。*X=2.5總體分布14230.1.2.3抽樣分布P*樣本均值的數(shù)學(xué)期望:樣本均值的方差:不重復(fù)抽樣條件下:*不重復(fù)抽樣條件下:*樣本均值的抽樣分布=50
=10X總體分布n=4抽樣分布Xn=16當(dāng)總體服從正態(tài)分布N(μ,σ2)時(shí),來(lái)自該總體的所有容量為n的樣本的均值x也服從正態(tài)分布,且其數(shù)學(xué)期望為μ,方差為σ2/n。即x~N(μ,σ2/n)*樣本均值的抽樣分布=50=10X總體分布n=*中心極限定理
(centrallimittheorem)當(dāng)樣本容量足夠大時(shí)(n>30),樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理:設(shè)從均值為,方差為2的一個(gè)任意總體中抽取容量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布。一個(gè)任意分布的總體X*中心極限定理
(centrallimittheorem*的分布趨于正態(tài)分布的過(guò)程*的分布趨于正態(tài)分布的過(guò)程*總體分布正態(tài)分布非正態(tài)分布大樣本小樣本正態(tài)分布正態(tài)分布非正態(tài)分布樣本均值的抽樣分布樣本均值的抽樣分布與總體分布的關(guān)系*總體分布正態(tài)分布非正態(tài)分布大樣本小樣本正態(tài)分布正態(tài)分布非正*總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比:不同性別的人數(shù)與全部人數(shù)之比合格品(或不合格品)與全部產(chǎn)品總數(shù)之比總體比例表示為
樣本比例表示為
(二)樣本成數(shù)(比例)的抽樣分布*總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)樣本比例*樣本比例的抽樣分布容量相同的所有可能樣本的樣本比例的概率分布,當(dāng)樣本容量很大時(shí),樣本比例的抽樣分布可用正態(tài)分布近似。樣本比例的數(shù)學(xué)期望:樣本比例的方差重復(fù)抽樣:不重復(fù)抽樣: *樣本比例的抽樣分布容量相同的所有可能樣本的樣本比例的概率分***5.2抽樣誤差
5.2.1抽樣誤差
5.2.2抽樣平均誤差
*5.2抽樣誤差*1、概念抽樣誤差是指由于隨機(jī)抽樣的偶然因素使樣本單位不足以代表總體單位,而引起的樣本統(tǒng)計(jì)量和總體參數(shù)之間的絕對(duì)離差。()2、影響因素總體單位標(biāo)志值的離散程度;樣本容量的大?。╪);抽樣方法(重復(fù)抽樣/不重復(fù)抽樣);抽樣調(diào)查的組織方式(簡(jiǎn)單隨機(jī)抽樣/分層抽樣/等距抽樣/整群抽樣)。5.2.1抽樣誤差*1、概念5.2.1抽樣誤差*1、所有可能樣本統(tǒng)計(jì)量與總體參數(shù)的平均離差。2、理論計(jì)算公式為:上式可以變換為:5.2.2抽樣平均誤差(標(biāo)準(zhǔn)誤)由此,樣本均值的抽樣平均誤差就是樣本均值的標(biāo)準(zhǔn)差。*1、所有可能樣本統(tǒng)計(jì)量與總體參數(shù)的平均離差。上式可以變換為*3、抽樣平均誤差的計(jì)算公式:(1)重復(fù)抽樣條件下(2)不重復(fù)抽樣條件下*3、抽樣平均誤差的計(jì)算公式:*
在總體單位數(shù)很大的情況下,可近似表示為:*在總體單位數(shù)很大的情況下,可近似表示為:*抽樣推斷的標(biāo)準(zhǔn)誤差
(standarderror)樣本統(tǒng)計(jì)量的標(biāo)準(zhǔn)差,稱為統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤,也稱為標(biāo)準(zhǔn)誤差;衡量統(tǒng)計(jì)量的離散程度,測(cè)度了用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)的精確程度;當(dāng)總體標(biāo)準(zhǔn)差未知時(shí),可用樣本標(biāo)準(zhǔn)差s代替,在重復(fù)抽樣條件下,樣本均值的標(biāo)準(zhǔn)誤差為*抽樣推斷的標(biāo)準(zhǔn)誤差
(standarderror)樣本*可以通過(guò)調(diào)整樣本單位數(shù)n來(lái)控制抽樣平均誤差。例如,將樣本容量增加3倍,則平均誤差就縮小一半;而抽樣平均誤差減少20%,則樣本容量就需要原來(lái)的1.56倍。*可以通過(guò)調(diào)整樣本單位數(shù)n來(lái)控制抽樣平均誤差。例如,將樣本容*5.3參數(shù)估計(jì)
5.3.1抽樣推斷的內(nèi)容
5.3.2點(diǎn)估計(jì)
5.3.3區(qū)間估計(jì)*5.3參數(shù)估計(jì)*1、參數(shù)估計(jì)依據(jù)所獲得的樣本數(shù)據(jù),對(duì)總體的數(shù)量特征進(jìn)行估計(jì)的推斷方法稱為參數(shù)估計(jì),即根據(jù)樣本統(tǒng)計(jì)量來(lái)估計(jì)總體參數(shù)。參數(shù)估計(jì)包括的內(nèi)容:如確定估計(jì)值,確定估計(jì)的優(yōu)良標(biāo)準(zhǔn);確定估計(jì)值和被估計(jì)參數(shù)之間的誤差范圍以及在一定誤差范圍內(nèi)所作推斷的可靠性程度等。2、假設(shè)檢驗(yàn)先對(duì)總體的數(shù)量特征作某種假設(shè),再根據(jù)樣本數(shù)據(jù)對(duì)所作假設(shè)進(jìn)行檢驗(yàn)。假設(shè)檢驗(yàn)包括的內(nèi)容:確定原假設(shè)與備擇假設(shè);選擇檢驗(yàn)統(tǒng)計(jì)量;確定顯著性水平;做出決策。5.3.1抽樣推斷的內(nèi)容*1、參數(shù)估計(jì)5.3.1抽樣推斷的內(nèi)容*5.3.2點(diǎn)估計(jì)
(pointestimate)1、定義:用樣本統(tǒng)計(jì)量的值直接作為總體參數(shù)的估計(jì)值,稱為總體參數(shù)的點(diǎn)估計(jì)2、優(yōu)點(diǎn):簡(jiǎn)便、易行3、缺點(diǎn):沒(méi)有考慮抽樣誤差的大小;沒(méi)有給出估計(jì)值接近總體參數(shù)的程度;沒(méi)有考慮估計(jì)的概率保證程度。*5.3.2點(diǎn)估計(jì)
(pointestima*
估計(jì)量與估計(jì)值
(estimator&estimatedvalue)估計(jì)量:用于估計(jì)總體參數(shù)的樣本統(tǒng)計(jì)量的名稱;如樣本均值、樣本比例(成數(shù))、樣本方差等參數(shù)用表示,估計(jì)量用表示估計(jì)值:根據(jù)樣本資料得出的估計(jì)量的具體取值如果樣本均值x=80,則80就是估計(jì)值*估計(jì)量與估計(jì)值
(estimator&estima*評(píng)價(jià)估計(jì)量的優(yōu)良標(biāo)準(zhǔn)無(wú)偏性:估計(jì)量的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)
P(
)BA無(wú)偏有偏總體參數(shù)*評(píng)價(jià)估計(jì)量的優(yōu)良標(biāo)準(zhǔn)無(wú)偏性:估計(jì)量的數(shù)學(xué)期望等于被估計(jì)的總*有效性:對(duì)同一總體參數(shù)的兩個(gè)無(wú)偏估計(jì)量,有更小標(biāo)準(zhǔn)差的估計(jì)量更有效。AB
的抽樣分布
的抽樣分布P(
)
比更有效*有效性:對(duì)同一總體參數(shù)的兩個(gè)無(wú)偏估計(jì)量,有更小標(biāo)準(zhǔn)差的估計(jì)*一致性:隨著樣本容量的增大,估計(jì)量的值越來(lái)越接近被估計(jì)的總體參數(shù)。大數(shù)定律已經(jīng)證明了:樣本平均數(shù)和樣本成數(shù)都滿足一致性:*一致性:隨著樣本容量的增大,估計(jì)量的值越來(lái)越接近被估計(jì)的總*1、定義:在點(diǎn)估計(jì)的基礎(chǔ)上,指出總體參數(shù)的上限和下限,即指出總體參數(shù)可能存在的區(qū)間范圍,并指出總體參數(shù)落在這一區(qū)間的置信水平。區(qū)間估計(jì)的三個(gè)要素:點(diǎn)估計(jì)值總體參數(shù)與點(diǎn)估計(jì)值的抽樣誤差范圍(抽樣極限誤差)置信水平/概率保證程度(1-α)5.3.3區(qū)間估計(jì)*1、定義:在點(diǎn)估計(jì)的基礎(chǔ)上,指出總體參數(shù)的上限和下限,即指*2、區(qū)間估計(jì)的一對(duì)矛盾:準(zhǔn)確性(精度):在點(diǎn)估計(jì)的基礎(chǔ)上,給出總體參數(shù)估計(jì)的一個(gè)區(qū)間范圍,稱為置信區(qū)間,該區(qū)間由樣本統(tǒng)計(jì)量加減一個(gè)誤差范圍而得到:
樣本統(tǒng)計(jì)量值
(點(diǎn)估計(jì))置信區(qū)間置信下限置信上限*2、區(qū)間估計(jì)的一對(duì)矛盾:樣本統(tǒng)計(jì)量值
(點(diǎn)估計(jì))置信區(qū)間*抽樣極限誤差抽樣極限誤差是根據(jù)統(tǒng)計(jì)研究任務(wù)要求確定的可允許的最大抽樣誤差范圍,它等于總體參數(shù)可允許變動(dòng)的上限或下限與樣本統(tǒng)計(jì)量的絕對(duì)離差。
我們總是希望估計(jì)的準(zhǔn)確性越高越好,即估計(jì)精度盡可能的高,也就是希望置信區(qū)間越窄越好,或者抽樣極限誤差越小越好。*抽樣極限誤差抽樣極限誤差是根據(jù)統(tǒng)計(jì)研究任務(wù)要求確定的可允許*(2)可靠性(置信水平/概率保證程度):總體參數(shù)落在置信區(qū)間內(nèi)的概率,即樣本統(tǒng)計(jì)量與總體參數(shù)的誤差不超過(guò)抽樣極限誤差的概率。樣本統(tǒng)計(jì)量的抽樣分布能夠根據(jù)樣本統(tǒng)計(jì)量與總體參數(shù)的接近程度給出相應(yīng)的概率度量:兩者越接近概率越小,差異越大概率越大。*(2)可靠性(置信水平/概率保證程度):總體參數(shù)落*表示為(1-
)%為總體參數(shù)落在區(qū)間內(nèi)的概率常用的置信水平為99%,95%,90%相應(yīng)的為0.01,0.05,0.10置信水平的表示
(confidencelevel)
*表示為(1-)%置信水平的表示
(con*抽樣推斷時(shí),我們總是希望估計(jì)的誤差范圍盡可能的小,即抽樣精度盡可能的高,并且估計(jì)的置信水平也盡可能的大,但事實(shí)上這兩者是矛盾的:在其他條件不變的情況下,提高估計(jì)的置信水平,就會(huì)增大抽樣極限誤差(降低估計(jì)的精度);提高估計(jì)的精度,就會(huì)減小置信水平。所以在區(qū)間估計(jì)中,我們只能對(duì)準(zhǔn)確性和可靠性中的一個(gè)提出要求,來(lái)推求另一要素的情況,事實(shí)上抽樣極限誤差與置信水平之間存在一一對(duì)應(yīng)的關(guān)系,知道其中一個(gè)可以求另外一個(gè)。準(zhǔn)確性與可靠性的關(guān)系*抽樣推斷時(shí),我們總是希望估計(jì)的誤差范圍盡可能的小準(zhǔn)確性與可*標(biāo)準(zhǔn)正態(tài)分布
(standardizenormaldistribution)
標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù):隨機(jī)變量具有均值為0,標(biāo)準(zhǔn)差為1的正態(tài)分布;任何一個(gè)一般的正態(tài)分布,可通過(guò)下面的線性變換轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布;
標(biāo)準(zhǔn)正態(tài)分布的分布函數(shù);*標(biāo)準(zhǔn)正態(tài)分布
(standardizenormaldi*標(biāo)準(zhǔn)正態(tài)分布概率圖示90%的x99.73%的x95%的xx*標(biāo)準(zhǔn)正態(tài)分布概率圖示90%的x99.73%的x95%的一般正態(tài)分布的密度函數(shù)f(x)=隨機(jī)變量X的頻率
=隨機(jī)變量X的均值=隨機(jī)變量X的方差
=3.1415926;e=2.71828一般正態(tài)分布的密度函數(shù)f(x)=隨機(jī)變量X的頻率一般正態(tài)分布概率圖示一般正態(tài)分布概率圖示*正態(tài)分布函數(shù)的性質(zhì)圖形是關(guān)于x=對(duì)稱鐘形曲線,且峰值在x=處;均值和標(biāo)準(zhǔn)差一旦確定,分布的具體形式也惟一確定,不同參數(shù)正態(tài)分布構(gòu)成一個(gè)完整的“正態(tài)分布族”;均值可取實(shí)數(shù)軸上的任意數(shù)值,決定正態(tài)曲線的具體位置;標(biāo)準(zhǔn)差決定曲線的“陡峭”或“扁平”程度。越大,正態(tài)曲線扁平;越小,正態(tài)曲線越高陡峭;當(dāng)X的取值向橫軸左右兩個(gè)方向無(wú)限延伸時(shí),曲線的兩個(gè)尾端也無(wú)限漸近橫軸,理論上永遠(yuǎn)不會(huì)與之相交;正態(tài)隨機(jī)變量在特定區(qū)間上的取值概率由正態(tài)曲線下的面積給出,而且其曲線下的總面積等于1。
*正態(tài)分布函數(shù)的性質(zhì)圖形是關(guān)于x=對(duì)稱鐘形曲線,且峰值在x任何一個(gè)一般的正態(tài)分布,可通過(guò)下面的線性變換轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布任何一個(gè)一般的正態(tài)分布,可通過(guò)下面的線性變換轉(zhuǎn)*【例】計(jì)算以下概率:
(1)
X~N(50,102),求和
(2)
Z~N(0,1),求和
(3)正態(tài)分布概率為0.05時(shí),求標(biāo)準(zhǔn)正態(tài)累積分布函數(shù)的反函數(shù)值z(mì)。
正態(tài)分布
(例題分析)
*【例】計(jì)算以下概率:正態(tài)分布
(例題分析)*樣本均值概率分布圖示x90%的樣本99.73%的樣本95%的樣本
根據(jù)中心極限定理可知,,*樣本均值概率分布圖示x90%的樣本99.73%的樣本95*****概率度:度量置信水平大小的指標(biāo),概率度大則置信水平高,概率度小則置信水平低。其實(shí)質(zhì)是以抽樣平均誤差(標(biāo)準(zhǔn)誤差)為標(biāo)準(zhǔn)去衡量抽樣極限誤差大小的統(tǒng)計(jì)指標(biāo),即抽樣極限誤差為標(biāo)準(zhǔn)誤差的倍數(shù)。置信水平與置信度之間的關(guān)系可用下式表達(dá):*概率度:度量置信水平大小的指標(biāo),概率度大則置信水平高,概率*常用的概率度和置信水平的關(guān)系表置信水平1-/268.27%0.31730.15865190%0.100.051.64595%0.050.0251.9695.45%0.0550.0275299%0.010.0052.5899.73%0.00270.001353*常用的概率度和置信水平的關(guān)系表置信水平1-/268*3.區(qū)間估計(jì)的方法方法一:根據(jù)給定的抽樣極限誤差,求置信水平F(Z)(1)抽取樣本,計(jì)算巖本統(tǒng)計(jì)量,如計(jì)算樣本平均數(shù)或樣本成數(shù)作為相應(yīng)總體參數(shù)的估計(jì)值,如果缺少總體方差或均方差資料,還應(yīng)計(jì)算樣本方差或均方差代替;(2)根據(jù)給定的抽樣極限誤差,估計(jì)總體參數(shù)的上、下限;(3)計(jì)算抽樣平均誤差或估計(jì)標(biāo)準(zhǔn)誤差;(4)將抽樣極限誤差除以抽樣平均誤差求出概率度Z值,再根據(jù)Z值查“正態(tài)分布概率表”求出相應(yīng)的置信水平F(Z)。*3.區(qū)間估計(jì)的方法*方法二:根據(jù)給定的置信水平要求,來(lái)推算抽樣極限誤差,然后進(jìn)行區(qū)間估計(jì)。(1)抽取樣本,計(jì)算巖本統(tǒng)計(jì)量,如計(jì)算樣本平均數(shù)或樣本成數(shù)作為相應(yīng)總體參數(shù)的估計(jì)值,如果缺少總體方差或均方差資料,還應(yīng)計(jì)算樣本方差或均方差代替;(2)根據(jù)給定的置信度F(Z)要求,求得概率度Z值;
(3)計(jì)算抽樣平均誤差u;(4)根據(jù)概率度Z和抽樣平均誤差來(lái)推算抽樣極限誤差,再根據(jù)抽樣極限誤差求出被估計(jì)總體參數(shù)的上下限,對(duì)總體參數(shù)做區(qū)間估計(jì)。*方法二:根據(jù)給定的置信水平要求,來(lái)推算抽樣極限誤差,然后進(jìn)*每包重量(克)包數(shù)組中值149以下10148.51485-1.832.4149~15020149.52990-0.812.8150~15150150.575250.22151以上20151.530301.228.8合計(jì)100—15030—76[例]某外貿(mào)公司出口一種茶葉,規(guī)定每包規(guī)格不低于150克,現(xiàn)用不重復(fù)抽樣方法從中隨機(jī)抽取1%進(jìn)行檢驗(yàn),抽檢結(jié)果如表所示:*每包重量(克)包數(shù)組中值149以下10148.51485-*要求:(1)抽樣極限誤差為0.2克,估計(jì)該批茶葉每包平均重量的區(qū)間及其概率保證程度;(2)茶葉包裝合格率的誤差范圍不超過(guò)6%,估計(jì)包裝合格率的區(qū)間及其概率保證程度;(3)要求以95.45%的概率保證程度,估計(jì)該批茶葉每包平均重量的區(qū)間;(4)要求以95.45%的概率保證程度,估計(jì)該批茶葉的包裝合格率的區(qū)間。*要求:*(1)
上限==150.3+0.2=150.5克下限==150.3-0.2=150.1克*(1)上限==150.3+0*查概率表:該批茶葉每包平均重量落在區(qū)間[150.1,150.5]克內(nèi),概率保證程度為97.91%。*查概率表:*
(2)上限==70%+6%=76%
下限==70%-6%=64%查概率表:該批茶葉的包裝合格率落在區(qū)間[64%,76%]內(nèi),概率保證程度為81.32%。*(2)*(3)上限==150.3+0.1734=150.47克下限==150.3-0.1734=150.13克以95.45%的概率保證程度估計(jì)該批茶葉每包平均重量在區(qū)間[150.13,150.47]內(nèi)。**(4)上限==70%+9.12%=79.12%
下限==70%-9.12%=61.88%
以95.45%的概率保證程度估計(jì)該批茶葉包裝合格率的區(qū)間為[61.88%,79.12%]。*(4)*總體均值的區(qū)間估計(jì)-數(shù)理統(tǒng)計(jì)模式【例】某種零件的長(zhǎng)度服從正態(tài)分布,從某天生產(chǎn)一批零件中按重復(fù)抽樣方法隨機(jī)抽取9個(gè),測(cè)得其平均長(zhǎng)度為21.4cm。已知總體標(biāo)準(zhǔn)差為=0.15cm。試估計(jì)該批零件平均長(zhǎng)度的置信區(qū)間,置信水平為95%。該批零件平均長(zhǎng)度的置信區(qū)間在21.302cm~21.498cm之間。
解:已知X~N(,0.152),n=9,1-=95%,z/2=1.96總體均值
在1-置信水平下的置信區(qū)間為*總體均值的區(qū)間估計(jì)-數(shù)理統(tǒng)計(jì)模式【例】某種零件的長(zhǎng)度服從正*置信區(qū)間與置信水平的理解
總體參數(shù)的真值是固定的,而用樣本構(gòu)造的區(qū)間則是不固定的,因此置信區(qū)間是一個(gè)隨機(jī)區(qū)間,它會(huì)因樣本的不同而變化,而且不是所有的區(qū)間都包含總體參數(shù);實(shí)際估計(jì)時(shí)只抽取一個(gè)樣本,此時(shí)所構(gòu)造的是與該樣本相聯(lián)系的一定置信水平(比如95%)下的置信區(qū)間,一個(gè)特定的區(qū)間總是“包含”或“絕對(duì)不包含”參數(shù)的真值,不存在“以多大的概率包含總體參數(shù)”的問(wèn)題。我們無(wú)法知道這個(gè)樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值,我們只能希望這個(gè)區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個(gè),但它也可能是少數(shù)幾個(gè)不包含參數(shù)真值的區(qū)間中的一個(gè);*置信區(qū)間與置信水平的理解總體參數(shù)的真值是固定的,而用樣本*如果用某種方法構(gòu)造的所有區(qū)間中有95%的區(qū)間包含總體參數(shù)的真值,5%的區(qū)間不包含總體參數(shù)的真值,那么,用該方法構(gòu)造的區(qū)間稱為置信水平為95%的置信區(qū)間;置信水平只是告訴我們?cè)诙啻喂烙?jì)得到的區(qū)間中大概有多少個(gè)區(qū)間包含了參數(shù)的真值,而不是針對(duì)所抽取的這個(gè)樣本所構(gòu)建的區(qū)間而言的。
*如果用某種方法構(gòu)造的所有區(qū)間中有95%的區(qū)間包含總體參數(shù)*從均值為185的總體中抽出n=10的20個(gè)樣本構(gòu)造出總體均值的20個(gè)置信區(qū)間我沒(méi)有抓住參數(shù)!點(diǎn)估計(jì)值*從均值為185的總體中抽出n=10的20個(gè)樣本構(gòu)造出總體均*假設(shè)檢驗(yàn)
(hypothesistest)先對(duì)總體的參數(shù)(或分布形式)提出某種假設(shè),然后利用樣本信息判斷假設(shè)是否成立的統(tǒng)計(jì)方法。假設(shè)檢驗(yàn)的步驟:提出原假設(shè)H0;確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量;給定顯著性水平;計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值發(fā)生的概率(P值)或計(jì)算給定顯著性水平下的臨界值;作出統(tǒng)計(jì)決策。*假設(shè)檢驗(yàn)
(hypothesistest)先對(duì)總體的參*決策依據(jù)邏輯上運(yùn)用反證法,統(tǒng)計(jì)上依據(jù)小概率原理;樣本統(tǒng)計(jì)量越大或P值越小,則越傾向于拒絕原假設(shè)在這么小的概率下竟然得到了這樣的一個(gè)樣本,表明這樣的樣本經(jīng)常出現(xiàn)。*決策依據(jù)*...因此我們拒絕假設(shè)
=50...如果這是總體的真實(shí)均值樣本均值m=50抽樣分布H0這個(gè)值不像我們應(yīng)該得到的樣本均值...20假設(shè)檢驗(yàn)圖示*...因此我們拒絕假設(shè)=50...如果這是總體*P-值原假設(shè)為真條件下,抽樣分布中大于或小于樣本統(tǒng)計(jì)量的概率。/
2
/
2Z拒絕拒絕H0值臨界值計(jì)算出的樣本統(tǒng)計(jì)量計(jì)算出的樣本統(tǒng)計(jì)量臨界值1/2P值1/2P值*P-值原假設(shè)為真條件下,抽樣分布中大于或小于樣本統(tǒng)計(jì)量的概*5.4樣本容量的確定
5.4.1樣本容量確定的兩難
5.4.2簡(jiǎn)單隨機(jī)抽樣條件下樣本容量的確定
5.4.3總體參數(shù)的預(yù)先估計(jì)
5.4.4確定樣本容量時(shí)需考慮的因素*5.4樣本容量的確定*5.4.1樣本容量確定的兩難樣本容量較大,收集的信息就相對(duì)多,從而估計(jì)精度較高,但進(jìn)行觀測(cè)所投入的費(fèi)用、人力及時(shí)間就比較多;樣本容量較小,則投入的費(fèi)用、人力及時(shí)間就相對(duì)節(jié)約,但收集的信息也較少,從而估計(jì)精度較低;所以,精度和費(fèi)用對(duì)樣本量的影響和要求是矛盾的,不存在既使精度最高又使費(fèi)用最省的樣本量。反映精度的指標(biāo)為抽樣極限誤差,其中的概率度Z與置信水平相關(guān),只有抽樣平均誤差與樣本量有關(guān)。*5.4.1樣本容量確定的兩難樣本容量較大,收集的信息就相*費(fèi)用與樣本量的關(guān)系:費(fèi)用與n的關(guān)系用費(fèi)用函數(shù)來(lái)表示的,簡(jiǎn)單隨機(jī)抽樣的條件下,通常表現(xiàn)為:其中:C為總費(fèi)用;c0為固定費(fèi)用,c1為與樣本量有關(guān)的可變費(fèi)用。抽樣平均誤差與樣本量的關(guān)系:結(jié)論:當(dāng)樣本量較小時(shí),增加相同的費(fèi)用估計(jì)精度的提高較明顯,當(dāng)樣本量較大時(shí),增加相同的費(fèi)用估計(jì)精度的提高效果不好。*費(fèi)用與樣本量的關(guān)系:*樣本容量的影響因素1、總體變異程度(、)2、抽樣極限誤差(允許誤差范圍)3、置信水平(置信度、概率保證程度)4、抽樣方法(重復(fù)抽樣、不重復(fù)抽樣)5、抽樣組織方式(簡(jiǎn)單隨機(jī)抽樣、分層抽樣、等距抽樣、整群抽樣)。*樣本容量的影響因素1、總體變異程度(、*1、估計(jì)總體均值時(shí)樣本容量的確定重復(fù)抽樣
不重復(fù)抽樣5.4.2簡(jiǎn)單隨機(jī)抽樣條件下樣本容量的確定
其中:以上求出的樣本量為必要樣本量,即最小樣本量,不能整除時(shí)不采用四舍五入的方法,而是采用取大的臨近整數(shù)的方法。*1、估計(jì)總體均值時(shí)樣本容量的確定5.4.2簡(jiǎn)單隨機(jī)抽樣條件*重復(fù)抽樣與不重復(fù)抽樣條件下樣本容量的變換:由于重復(fù)抽樣下的公式比不重復(fù)抽樣下的公式要簡(jiǎn)單得多,所以對(duì)不重復(fù)抽樣必要樣本單位數(shù)的確定經(jīng)常遵循如下思路確定:首先計(jì)算重復(fù)抽樣條件下的必要樣本單位數(shù),記為n0;然后判斷是否成立,如果成立,則取n=n0,否則,對(duì)n進(jìn)行修正,修正公式為:*重復(fù)抽樣與不重復(fù)抽樣條件下樣本容量的變換:***【例】擁有工商管理學(xué)士學(xué)位的大學(xué)畢業(yè)生年薪的標(biāo)準(zhǔn)差大約為2000元,假定想要估計(jì)年薪95%的置信區(qū)間,希望允許誤差為400元,應(yīng)抽取樣本容量為多大的樣本?*【例】擁有工商管理學(xué)士學(xué)位的大學(xué)畢業(yè)生年薪的標(biāo)準(zhǔn)差大約為2*解:
已知=2000,=400,1-=95%,z/2=1.96
則即應(yīng)抽取97人作為樣本。*解:已知=2000,=400,1-=95%,*
重復(fù)抽樣
不重復(fù)抽樣2、估計(jì)總體比例時(shí)樣本容量的確定
其中:*2、估計(jì)總體比例時(shí)樣本容量的確定其中:*【例】根據(jù)以往的生產(chǎn)統(tǒng)計(jì),某種產(chǎn)品的合格率約為90%,現(xiàn)要求允許誤差為5%,在求95%的置信區(qū)間時(shí),應(yīng)抽取多少個(gè)產(chǎn)品作為樣本?解:已知p=90%,1-=95%,Z/2=1.96,=5%
應(yīng)抽取的樣本容量為:
應(yīng)抽取139個(gè)產(chǎn)品作為樣本。*【例】根據(jù)以往的生產(chǎn)統(tǒng)計(jì),某種產(chǎn)品的合格率約為90%,現(xiàn)要*1.如果有歷史資料,可利用歷史資料代替;如果有若干個(gè)可供選擇的歷史資料,應(yīng)采用數(shù)值最大的一個(gè);成數(shù)方差在完全缺乏資料的情況下,用0.25代替;2.假如沒(méi)有可供替代的歷史資料,可以通過(guò)組織試驗(yàn)性的抽樣取得替代資料:首先確定一個(gè)可以承受的樣本量n0,調(diào)查后用樣本方差代替總體方差進(jìn)行計(jì)算,如果精度跟可靠性達(dá)到要求,則調(diào)查結(jié)束;否則,計(jì)算為達(dá)到精度要求所需樣本量n,再補(bǔ)抽n-n0個(gè)單位進(jìn)行調(diào)查;4.沒(méi)有同類調(diào)查的經(jīng)驗(yàn),時(shí)間等各方面條件又不允許進(jìn)行預(yù)調(diào)查,則只能通過(guò)定性分析來(lái)確定總體變異系數(shù)。5.4.3總體方差的預(yù)先估計(jì)*1.如果有歷史資料,可利用歷史資料代替;如果有若干個(gè)可供選*其中,C為變異系數(shù),r為相對(duì)誤差。將計(jì)算樣本容量的公式變形得:*其中,C為變異系數(shù),r為相對(duì)誤差。將計(jì)算樣本容量的公式變形*1.研究問(wèn)題的重要性。對(duì)于決策比較重要的問(wèn)題樣本量要大一些;2.所研究問(wèn)題目標(biāo)量的個(gè)數(shù)。如果所研究的問(wèn)題目標(biāo)量較多,樣本量應(yīng)適當(dāng)放大;3.調(diào)查表或調(diào)查問(wèn)卷的回收率;4.有效樣本數(shù);5.資源限制:調(diào)查項(xiàng)目的經(jīng)費(fèi)、時(shí)間要求以及調(diào)查人員的限制。5.4.4確定樣本容量時(shí)需要考慮的其它因素*1.研究問(wèn)題的重要性。對(duì)于決策比較重要的問(wèn)題樣本量要大一些*5.5其它參數(shù)估計(jì)與假設(shè)檢驗(yàn)內(nèi)容
5.5.1一個(gè)總體均值
5.5.2兩個(gè)獨(dú)立總體均值之差
5.5.3兩個(gè)配對(duì)總體均值之差
5.5.4總體方差
5.5.5計(jì)量經(jīng)濟(jì)學(xué)中的參數(shù)估計(jì)與假設(shè)檢驗(yàn)*5.5其它參數(shù)估計(jì)與假設(shè)檢驗(yàn)內(nèi)容*5.5.1一個(gè)總體均值的區(qū)間估計(jì)
(一個(gè)總體—小樣本)1. 假定條件總體服從正態(tài)分布,但方差(2)
未知小樣本(n<30)使用t
分布統(tǒng)計(jì)量總體均值在1-置信水平下的置信區(qū)間為:*5.5.1一個(gè)總體均值的區(qū)間估計(jì)
(一個(gè)總體—小樣本)1*5.5.2兩獨(dú)立總體均值之差m1s1總體1s2
m2總體2抽取簡(jiǎn)單隨機(jī)樣樣本容量n1計(jì)算X1抽取簡(jiǎn)單隨機(jī)樣樣本容量n2計(jì)算X2計(jì)算每一對(duì)樣本的X1-X2所有可能樣本的X1-X2m1-m2抽樣分布*5.5.2兩獨(dú)立總體均值之差m1s1總體1s2m*兩獨(dú)立總體均值之差的估計(jì)
(大樣本)1. 假定條件兩個(gè)總體都服從正態(tài)分布,12、22已知若不是正態(tài)分布,可以用正態(tài)分布來(lái)近似(n130和n230)兩個(gè)樣本是獨(dú)立的隨機(jī)樣本使用正態(tài)分布統(tǒng)計(jì)量z*兩獨(dú)立總體均值之差的估計(jì)
(大樣本)1. 假定條件*12,22已知時(shí),兩個(gè)總體均值之差1-2在1-置信水平下的置信區(qū)間為:12、22未知時(shí),兩個(gè)總體均值之差1-2在1-置信水平下的置信區(qū)間為:*12,22已知時(shí),兩個(gè)總體均值之差1-2在1-*兩獨(dú)立總體均值之差的估計(jì)
(小樣本:
12=22)1. 假定條件兩個(gè)總體都服從正態(tài)分布兩個(gè)總體方差未知但相等:12=22兩個(gè)獨(dú)立的小樣本(n1<30和n2<30)總體方差的合并估計(jì)量估計(jì)量x1-x2的抽樣標(biāo)準(zhǔn)差*兩獨(dú)立總體均值之差的估計(jì)
(小樣本:12=22*樣本統(tǒng)計(jì)量?jī)蓚€(gè)總體均值之差1-2在1-置信水平下的置信區(qū)間為:*樣本統(tǒng)計(jì)量*兩獨(dú)立總體均值之差的估計(jì)
(小樣本:1222)1. 假定條件兩個(gè)總體都服從正態(tài)分布兩個(gè)總體方差未知且不相等:1222兩個(gè)獨(dú)立的小樣本(n1<30和n2<30)使用統(tǒng)計(jì)量*兩獨(dú)立總體均值之差的估計(jì)
(小樣本:1222*兩個(gè)總體均值之差1-2在1-置信水平下的置信區(qū)間為:自由度*兩個(gè)總體均值之差1-2在1-置信水平下的置信區(qū)間自*5.5.3兩配對(duì)總體均值之差的估計(jì)
(大樣本)假定條件兩個(gè)匹配的大樣本(n130和n230)兩個(gè)總體各觀察值的配對(duì)差服從正態(tài)分布檢驗(yàn)統(tǒng)計(jì)量?jī)蓚€(gè)總體均值之差d=1-2在1-置信水平下的置信區(qū)間為:*5.5.3兩配對(duì)總體均值之差的估計(jì)
(大樣本)假定條件*兩配對(duì)總體均值之差的估計(jì)
(小樣本)假定條件兩個(gè)匹配的小樣本(n1<30和n2<30)兩個(gè)總體各觀察值的配對(duì)差服從正態(tài)分布兩個(gè)總體均值之差d=1-2在1-置信水平下的置信區(qū)間為*兩配對(duì)總體均值之差的估計(jì)
(小樣本)假定條件*5.5.4總體方差1.假設(shè)總體服從正態(tài)分布2.總體方差2
的點(diǎn)估計(jì)量為s2,且3.總體方差在1-置信水平下的置信區(qū)間為:*5.5.4總體方差1.假設(shè)總體服從正態(tài)分布3.總體方*兩個(gè)總體方差比的區(qū)間估計(jì)1. 比較兩個(gè)總體的方差比用兩個(gè)樣本的方差比來(lái)判斷如果S12/S22接近于1,說(shuō)明兩個(gè)總體方差很接近如果S12/S22遠(yuǎn)離1,說(shuō)明兩個(gè)總體方差之間存在差異總體方差比在1-置信水平下的置信區(qū)間為:*兩個(gè)總體方差比的區(qū)間估計(jì)1. 比較兩個(gè)總體的方差比*
5.5.5計(jì)量經(jīng)濟(jì)學(xué)中的參數(shù)估計(jì)及假設(shè)檢驗(yàn)*
5.5.5計(jì)量經(jīng)濟(jì)學(xué)中的參數(shù)估計(jì)及假設(shè)檢驗(yàn)*結(jié)束THANKSCLASSISOVER*結(jié)束THANKSCLASS參數(shù)估計(jì)假設(shè)檢驗(yàn)統(tǒng)計(jì)方法描述統(tǒng)計(jì)推斷統(tǒng)計(jì)統(tǒng)計(jì)估計(jì)非參數(shù)估計(jì)參數(shù)估計(jì)假設(shè)檢驗(yàn)統(tǒng)計(jì)方法描述統(tǒng)計(jì)推斷統(tǒng)計(jì)統(tǒng)計(jì)估計(jì)非參數(shù)估計(jì)*第5章抽樣推斷5.1抽樣推斷的一般問(wèn)題5.2抽樣誤差5.3參數(shù)估計(jì)5.4樣本容量的確定*第5章抽樣推斷5.1抽樣推斷的一般問(wèn)題*抽樣推斷的過(guò)程總體樣本隨機(jī)取樣計(jì)算出樣本的均值、樣本比例、樣本方差調(diào)查總體均值、總體比例、總體方差等推斷*抽樣推斷的過(guò)程總體樣本隨機(jī)取樣計(jì)算出樣本的均值、樣本比例、*5.1抽樣推斷的一般問(wèn)題
5.1.1抽樣推斷的概念和特點(diǎn)
5.1.2抽樣推斷的基本范疇
5.1.3抽樣分布*5.1抽樣推斷的一般問(wèn)題*1、概念抽樣推斷是在抽樣調(diào)查的基礎(chǔ)上,根據(jù)樣本的情況來(lái)推斷總體特征的一種統(tǒng)計(jì)分析方法。2、抽樣推斷的特點(diǎn)按照隨機(jī)原則抽取樣本單位(樣品);根據(jù)對(duì)樣本的調(diào)查對(duì)總體做出推斷;抽樣誤差可以事先計(jì)算并加以控制。3、抽樣推斷的適用場(chǎng)合無(wú)法進(jìn)行全面調(diào)查時(shí);進(jìn)行全面調(diào)查有困難或不必要時(shí);5.1.1抽樣推斷的概念和特點(diǎn)*1、概念5.1.1抽樣推斷的概念和特點(diǎn)*1.抽樣框和抽樣單位(1)總體和樣本
總體也稱母體,是所要研究的全部單位組成的整體。一般用N表示總體包括的總體單位數(shù)。樣本又稱子樣,它是從總體中隨機(jī)抽取出來(lái)的一部分單位組成的整體。一般用n表示樣本包括的總體單位數(shù)。作為推斷對(duì)象的總體是確定的,而且是唯一的;作為觀察對(duì)象的樣本不是確定的,也不是唯一的。5.1.2抽樣推斷的基本范疇*1.抽樣框和抽樣單位5.1.2抽樣推斷的基本范疇*(2)抽樣框:抽樣框是包括全部總體單位的框架,以此代表總體,用來(lái)從中抽取樣本單位,具體表現(xiàn)形式有總體單位(或其集合)的名單或目錄、地圖、時(shí)間等。(3)抽樣單位:抽樣單位是構(gòu)成抽樣框的基本要素,它可以是總體單位也可以是總體單位的集合。*(2)抽樣框:*2.重復(fù)抽樣和不重復(fù)抽樣重復(fù)抽樣,也叫回置抽樣/放回抽樣,是指從總體的N個(gè)單位中抽取一個(gè)容量為n的樣本,每次抽出一個(gè)單位后,再將其放回總體中參加下一次抽取,這樣連續(xù)抽n次即得到一個(gè)樣本。不重復(fù)抽樣,也叫不回置抽樣/不放回抽樣,是指抽中單位不再放回總體中,下一個(gè)樣本單位只能從余下的抽樣單位中抽取。*2.重復(fù)抽樣和不重復(fù)抽樣*3.樣本容量和樣本可能數(shù)目樣本容量:一個(gè)樣本所包含的總體單位數(shù),用n表示,當(dāng)樣本容量大于等于30時(shí)稱為大樣本,小于30時(shí)稱為小樣本。樣本可能數(shù)目:指按一定抽樣方法和一定樣本容量從總體中抽取樣本時(shí),所有可能的樣本個(gè)數(shù),一般用M表示。
*3.樣本容量和樣本可能數(shù)目*考慮順序的重復(fù)抽樣的樣本可能數(shù)目:考慮順序的不重復(fù)抽樣的樣本可能數(shù)目:樣本可能數(shù)目的計(jì)算*考慮順序的重復(fù)抽樣的樣本可能數(shù)目:樣本可能數(shù)目的計(jì)算*不考慮順序的重復(fù)抽樣的可能樣本數(shù)目:不考慮順序的不重復(fù)抽樣的可能樣本數(shù)目:客觀現(xiàn)象中常見的*不考慮順序的重復(fù)抽樣的可能樣本數(shù)目:不考慮順序的不重復(fù)抽樣*4.參數(shù)和統(tǒng)計(jì)量參數(shù):根據(jù)總體中各單位的變量值計(jì)算的、反映總體數(shù)量特征的特征值。主要有總體均值、成數(shù)或比例、方差。統(tǒng)計(jì)量:根據(jù)樣本中各單位的變量值計(jì)算的、反映樣本數(shù)量特征的特征值。主要有樣本均值、成數(shù)或比例、方差??傮w是確定的、唯一的,所以總體參數(shù)也是確定的、唯一的;樣本是隨機(jī)的,所以樣本統(tǒng)計(jì)量是隨機(jī)變量。*4.參數(shù)和統(tǒng)計(jì)量*
總體參數(shù)樣本統(tǒng)計(jì)量*總體參數(shù)*樣本統(tǒng)計(jì)量的概率分布;隨機(jī)變量是樣本統(tǒng)計(jì)量:樣本均值,樣本比例,樣本方差等結(jié)果來(lái)自容量相同的所有可能樣本;提供了樣本統(tǒng)計(jì)量的分布特征,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù)。 5.1.3抽樣分布
(samplingdistribution)*樣本統(tǒng)計(jì)量的概率分布;5.1.3抽樣分布
(sampl*抽樣分布的形成
(samplingdistribution)總體計(jì)算樣本統(tǒng)計(jì)量:樣本均值、比例、方差樣本*抽樣分布的形成
(samplingdistributi*1.形成過(guò)程從單位數(shù)為N的總體中抽取樣本容量為n的隨機(jī)樣本,在重復(fù)抽樣的條件下,共有Nn個(gè)可能的樣本,在不重復(fù)抽樣條件下,共有PNn個(gè)可能樣本;對(duì)于每一個(gè)樣本,我們都可以計(jì)算出樣本的均值;將所有可能樣本的樣本均值根據(jù)其取值形成概率分布,即可得到樣本均值的抽樣分布,它是推斷總體均值的理論基礎(chǔ)。(一)樣本均值的抽樣分布*1.形成過(guò)程(一)樣本均值的抽樣分布*【例】設(shè)一個(gè)總體,總體單位數(shù)N=4。4個(gè)單位某一標(biāo)志值的取值分別為x1=1、x2=2、x3=3、x4=4??傮w的均值、方差及分布如下:
總體分布14230.1.2.3均值和方差*【例】設(shè)一個(gè)總體,總體單位數(shù)N=4。4個(gè)單位某一標(biāo)志值的*現(xiàn)從總體中抽取n=2的簡(jiǎn)單隨機(jī)樣本,在重復(fù)抽樣條件下,共有16個(gè)樣本。所有樣本的結(jié)果為:3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個(gè)觀察值第一個(gè)觀察值所有可能的n=2的樣本(共16個(gè))*現(xiàn)從總體中抽取n=2的簡(jiǎn)單隨機(jī)樣本,在重復(fù)抽樣條件下,共有*計(jì)算出各樣本的均值,并給出樣本均值的抽樣分布:3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值(x)x樣本均值的抽樣分布1.00.1.2.3P(x)1.53.04.03.52.02.5*計(jì)算出各樣本的均值,并給出樣本均值的抽樣分布:3.53.0*2.樣本均值的數(shù)字特征*2.樣本均值的數(shù)字特征*證明:*證明:*X=2.5σ2=1.25總體分布14230.1.2.3抽樣分布P(X)1.00.1.2.31.53.04.03.52.02.5XxP(x)結(jié)論:1.樣本均值的均值(數(shù)學(xué)期望)等于總體均值;
2.樣本均值的方差等于總體方差的1/n。*X=2.5總體分布14230.1.2.3抽樣分布P*樣本均值的數(shù)學(xué)期望:樣本均值的方差:不重復(fù)抽樣條件下:*不重復(fù)抽樣條件下:*樣本均值的抽樣分布=50
=10X總體分布n=4抽樣分布Xn=16當(dāng)總體服從正態(tài)分布N(μ,σ2)時(shí),來(lái)自該總體的所有容量為n的樣本的均值x也服從正態(tài)分布,且其數(shù)學(xué)期望為μ,方差為σ2/n。即x~N(μ,σ2/n)*樣本均值的抽樣分布=50=10X總體分布n=*中心極限定理
(centrallimittheorem)當(dāng)樣本容量足夠大時(shí)(n>30),樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理:設(shè)從均值為,方差為2的一個(gè)任意總體中抽取容量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布。一個(gè)任意分布的總體X*中心極限定理
(centrallimittheorem*的分布趨于正態(tài)分布的過(guò)程*的分布趨于正態(tài)分布的過(guò)程*總體分布正態(tài)分布非正態(tài)分布大樣本小樣本正態(tài)分布正態(tài)分布非正態(tài)分布樣本均值的抽樣分布樣本均值的抽樣分布與總體分布的關(guān)系*總體分布正態(tài)分布非正態(tài)分布大樣本小樣本正態(tài)分布正態(tài)分布非正*總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比:不同性別的人數(shù)與全部人數(shù)之比合格品(或不合格品)與全部產(chǎn)品總數(shù)之比總體比例表示為
樣本比例表示為
(二)樣本成數(shù)(比例)的抽樣分布*總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)樣本比例*樣本比例的抽樣分布容量相同的所有可能樣本的樣本比例的概率分布,當(dāng)樣本容量很大時(shí),樣本比例的抽樣分布可用正態(tài)分布近似。樣本比例的數(shù)學(xué)期望:樣本比例的方差重復(fù)抽樣:不重復(fù)抽樣: *樣本比例的抽樣分布容量相同的所有可能樣本的樣本比例的概率分***5.2抽樣誤差
5.2.1抽樣誤差
5.2.2抽樣平均誤差
*5.2抽樣誤差*1、概念抽樣誤差是指由于隨機(jī)抽樣的偶然因素使樣本單位不足以代表總體單位,而引起的樣本統(tǒng)計(jì)量和總體參數(shù)之間的絕對(duì)離差。()2、影響因素總體單位標(biāo)志值的離散程度;樣本容量的大?。╪);抽樣方法(重復(fù)抽樣/不重復(fù)抽樣);抽樣調(diào)查的組織方式(簡(jiǎn)單隨機(jī)抽樣/分層抽樣/等距抽樣/整群抽樣)。5.2.1抽樣誤差*1、概念5.2.1抽樣誤差*1、所有可能樣本統(tǒng)計(jì)量與總體參數(shù)的平均離差。2、理論計(jì)算公式為:上式可以變換為:5.2.2抽樣平均誤差(標(biāo)準(zhǔn)誤)由此,樣本均值的抽樣平均誤差就是樣本均值的標(biāo)準(zhǔn)差。*1、所有可能樣本統(tǒng)計(jì)量與總體參數(shù)的平均離差。上式可以變換為*3、抽樣平均誤差的計(jì)算公式:(1)重復(fù)抽樣條件下(2)不重復(fù)抽樣條件下*3、抽樣平均誤差的計(jì)算公式:*
在總體單位數(shù)很大的情況下,可近似表示為:*在總體單位數(shù)很大的情況下,可近似表示為:*抽樣推斷的標(biāo)準(zhǔn)誤差
(standarderror)樣本統(tǒng)計(jì)量的標(biāo)準(zhǔn)差,稱為統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤,也稱為標(biāo)準(zhǔn)誤差;衡量統(tǒng)計(jì)量的離散程度,測(cè)度了用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)的精確程度;當(dāng)總體標(biāo)準(zhǔn)差未知時(shí),可用樣本標(biāo)準(zhǔn)差s代替,在重復(fù)抽樣條件下,樣本均值的標(biāo)準(zhǔn)誤差為*抽樣推斷的標(biāo)準(zhǔn)誤差
(standarderror)樣本*可以通過(guò)調(diào)整樣本單位數(shù)n來(lái)控制抽樣平均誤差。例如,將樣本容量增加3倍,則平均誤差就縮小一半;而抽樣平均誤差減少20%,則樣本容量就需要原來(lái)的1.56倍。*可以通過(guò)調(diào)整樣本單位數(shù)n來(lái)控制抽樣平均誤差。例如,將樣本容*5.3參數(shù)估計(jì)
5.3.1抽樣推斷的內(nèi)容
5.3.2點(diǎn)估計(jì)
5.3.3區(qū)間估計(jì)*5.3參數(shù)估計(jì)*1、參數(shù)估計(jì)依據(jù)所獲得的樣本數(shù)據(jù),對(duì)總體的數(shù)量特征進(jìn)行估計(jì)的推斷方法稱為參數(shù)估計(jì),即根據(jù)樣本統(tǒng)計(jì)量來(lái)估計(jì)總體參數(shù)。參數(shù)估計(jì)包括的內(nèi)容:如確定估計(jì)值,確定估計(jì)的優(yōu)良標(biāo)準(zhǔn);確定估計(jì)值和被估計(jì)參數(shù)之間的誤差范圍以及在一定誤差范圍內(nèi)所作推斷的可靠性程度等。2、假設(shè)檢驗(yàn)先對(duì)總體的數(shù)量特征作某種假設(shè),再根據(jù)樣本數(shù)據(jù)對(duì)所作假設(shè)進(jìn)行檢驗(yàn)。假設(shè)檢驗(yàn)包括的內(nèi)容:確定原假設(shè)與備擇假設(shè);選擇檢驗(yàn)統(tǒng)計(jì)量;確定顯著性水平;做出決策。5.3.1抽樣推斷的內(nèi)容*1、參數(shù)估計(jì)5.3.1抽樣推斷的內(nèi)容*5.3.2點(diǎn)估計(jì)
(pointestimate)1、定義:用樣本統(tǒng)計(jì)量的值直接作為總體參數(shù)的估計(jì)值,稱為總體參數(shù)的點(diǎn)估計(jì)2、優(yōu)點(diǎn):簡(jiǎn)便、易行3、缺點(diǎn):沒(méi)有考慮抽樣誤差的大?。粵](méi)有給出估計(jì)值接近總體參數(shù)的程度;沒(méi)有考慮估計(jì)的概率保證程度。*5.3.2點(diǎn)估計(jì)
(pointestima*
估計(jì)量與估計(jì)值
(estimator&estimatedvalue)估計(jì)量:用于估計(jì)總體參數(shù)的樣本統(tǒng)計(jì)量的名稱;如樣本均值、樣本比例(成數(shù))、樣本方差等參數(shù)用表示,估計(jì)量用表示估計(jì)值:根據(jù)樣本資料得出的估計(jì)量的具體取值如果樣本均值x=80,則80就是估計(jì)值*估計(jì)量與估計(jì)值
(estimator&estima*評(píng)價(jià)估計(jì)量的優(yōu)良標(biāo)準(zhǔn)無(wú)偏性:估計(jì)量的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)
P(
)BA無(wú)偏有偏總體參數(shù)*評(píng)價(jià)估計(jì)量的優(yōu)良標(biāo)準(zhǔn)無(wú)偏性:估計(jì)量的數(shù)學(xué)期望等于被估計(jì)的總*有效性:對(duì)同一總體參數(shù)的兩個(gè)無(wú)偏估計(jì)量,有更小標(biāo)準(zhǔn)差的估計(jì)量更有效。AB
的抽樣分布
的抽樣分布P(
)
比更有效*有效性:對(duì)同一總體參數(shù)的兩個(gè)無(wú)偏估計(jì)量,有更小標(biāo)準(zhǔn)差的估計(jì)*一致性:隨著樣本容量的增大,估計(jì)量的值越來(lái)越接近被估計(jì)的總體參數(shù)。大數(shù)定律已經(jīng)證明了:樣本平均數(shù)和樣本成數(shù)都滿足一致性:*一致性:隨著樣本容量的增大,估計(jì)量的值越來(lái)越接近被估計(jì)的總*1、定義:在點(diǎn)估計(jì)的基礎(chǔ)上,指出總體參數(shù)的上限和下限,即指出總體參數(shù)可能存在的區(qū)間范圍,并指出總體參數(shù)落在這一區(qū)間的置信水平。區(qū)間估計(jì)的三個(gè)要素:點(diǎn)估計(jì)值總體參數(shù)與點(diǎn)估計(jì)值的抽樣誤差范圍(抽樣極限誤差)置信水平/概率保證程度(1-α)5.3.3區(qū)間估計(jì)*1、定義:在點(diǎn)估計(jì)的基礎(chǔ)上,指出總體參數(shù)的上限和下限,即指*2、區(qū)間估計(jì)的一對(duì)矛盾:準(zhǔn)確性(精度):在點(diǎn)估計(jì)的基礎(chǔ)上,給出總體參數(shù)估計(jì)的一個(gè)區(qū)間范圍,稱為置信區(qū)間,該區(qū)間由樣本統(tǒng)計(jì)量加減一個(gè)誤差范圍而得到:
樣本統(tǒng)計(jì)量值
(點(diǎn)估計(jì))置信區(qū)間置信下限置信上限*2、區(qū)間估計(jì)的一對(duì)矛盾:樣本統(tǒng)計(jì)量值
(點(diǎn)估計(jì))置信區(qū)間*抽樣極限誤差抽樣極限誤差是根據(jù)統(tǒng)計(jì)研究任務(wù)要求確定的可允許的最大抽樣誤差范圍,它等于總體參數(shù)可允許變動(dòng)的上限或下限與樣本統(tǒng)計(jì)量的絕對(duì)離差。
我們總是希望估計(jì)的準(zhǔn)確性越高越好,即估計(jì)精度盡可能的高,也就是希望置信區(qū)間越窄越好,或者抽樣極限誤差越小越好。*抽樣極限誤差抽樣極限誤差是根據(jù)統(tǒng)計(jì)研究任務(wù)要求確定的可允許*(2)可靠性(置信水平/概率保證程度):總體參數(shù)落在置信區(qū)間內(nèi)的概率,即樣本統(tǒng)計(jì)量與總體參數(shù)的誤差不超過(guò)抽樣極限誤差的概率。樣本統(tǒng)計(jì)量的抽樣分布能夠根據(jù)樣本統(tǒng)計(jì)量與總體參數(shù)的接近程度給出相應(yīng)的概率度量:兩者越接近概率越小,差異越大概率越大。*(2)可靠性(置信水平/概率保證程度):總體參數(shù)落*表示為(1-
)%為總體參數(shù)落在區(qū)間內(nèi)的概率常用的置信水平為99%,95%,90%相應(yīng)的為0.01,0.05,0.10置信水平的表示
(confidencelevel)
*表示為(1-)%置信水平的表示
(con*抽樣推斷時(shí),我們總是希望估計(jì)的誤差范圍盡可能的小,即抽樣精度盡可能的高,并且估計(jì)的置信水平也盡可能的大,但事實(shí)上這兩者是矛盾的:在其他條件不變的情況下,提高估計(jì)的置信水平,就會(huì)增大抽樣極限誤差(降低估計(jì)的精度);提高估計(jì)的精度,就會(huì)減小置信水平。所以在區(qū)間估計(jì)中,我們只能對(duì)準(zhǔn)確性和可靠性中的一個(gè)提出要求,來(lái)推求另一要素的情況,事實(shí)上抽樣極限誤差與置信水平之間存在一一對(duì)應(yīng)的關(guān)系,知道其中一個(gè)可以求另外一個(gè)。準(zhǔn)確性與可靠性的關(guān)系*抽樣推斷時(shí),我們總是希望估計(jì)的誤差范圍盡可能的小準(zhǔn)確性與可*標(biāo)準(zhǔn)正態(tài)分布
(standardizenormaldistribution)
標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù):隨機(jī)變量具有均值為0,標(biāo)準(zhǔn)差為1的正態(tài)分布;任何一個(gè)一般的正態(tài)分布,可通過(guò)下面的線性變換轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布;
標(biāo)準(zhǔn)正態(tài)分布的分布函數(shù);*標(biāo)準(zhǔn)正態(tài)分布
(standardizenormaldi*標(biāo)準(zhǔn)正態(tài)分布概率圖示90%的x99.73%的x95%的xx*標(biāo)準(zhǔn)正態(tài)分布概率圖示90%的x99.73%的x95%的一般正態(tài)分布的密度函數(shù)f(x)=隨機(jī)變量X的頻率
=隨機(jī)變量X的均值=隨機(jī)變量X的方差
=3.1415926;e=2.71828一般正態(tài)分布的密度函數(shù)f(x)=隨機(jī)變量X的頻率一般正態(tài)分布概率圖示一般正態(tài)分布概率圖示*正態(tài)分布函數(shù)的性質(zhì)圖形是關(guān)于x=對(duì)稱鐘形曲線,且峰值在x=處;均值和標(biāo)準(zhǔn)差一旦確定,分布的具體形式也惟一確定,不同參數(shù)正態(tài)分布構(gòu)成一個(gè)完整的“正態(tài)分布族”;均值可取實(shí)數(shù)軸上的任意數(shù)值,決定正態(tài)曲線的具體位置;標(biāo)準(zhǔn)差決定曲線的“陡峭”或“扁平”程度。越大,正態(tài)曲線扁平;越小,正態(tài)曲線越高陡峭;當(dāng)X的取值向橫軸左右兩個(gè)方向無(wú)限延伸時(shí),曲線的兩個(gè)尾端也無(wú)限漸近橫軸,理論上永遠(yuǎn)不會(huì)與之相交;正態(tài)隨機(jī)變量在特定區(qū)間上的取值概率由正態(tài)曲線下的面積給出,而且其曲線下的總面積等于1。
*正態(tài)分布函數(shù)的性質(zhì)圖形是關(guān)于x=對(duì)稱鐘形曲線,且峰值在x任何一個(gè)一般的正態(tài)分布,可通過(guò)下面的線性變換轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布任何一個(gè)一般的正態(tài)分布,可通過(guò)下面的線性變換轉(zhuǎn)*【例】計(jì)算以下概率:
(1)
X~N(50,102),求和
(2)
Z~N(0,1),求和
(3)正態(tài)分布概率為0.05時(shí),求標(biāo)準(zhǔn)正態(tài)累積分布函數(shù)的反函數(shù)值z(mì)。
正態(tài)分布
(例題分析)
*【例】計(jì)算以下概率:正態(tài)分布
(例題分析)*樣本均值概率分布圖示x90%的樣本99.73%的樣本95%的樣本
根據(jù)中心極限定理可知,,*樣本均值概率分布圖示x90%的樣本99.73%的樣本95*****概率度:度量置信水平大小的指標(biāo),概率度大則置信水平高,概率度小則置信水平低。其實(shí)質(zhì)是以抽樣平均誤差(標(biāo)準(zhǔn)誤差)為標(biāo)準(zhǔn)去衡量抽樣極限誤差大小的統(tǒng)計(jì)指標(biāo),即抽樣極限誤差為標(biāo)準(zhǔn)誤差的倍數(shù)。置信水平與置信度之間的關(guān)系可用下式表達(dá):*概率度:度量置信水平大小的指標(biāo),概率度大則置信水平高,概率*常用的概率度和置信水平的關(guān)系表置信水平1-/268.27%0.31730.15865190%0.100.051.64595%0.050.0251.9695.45%0.0550.0275299%0.010.0052.5899.73%0.00270.001353*常用的概率度和置信水平的關(guān)系表置信水平1-/268*3.區(qū)間估計(jì)的方法方法一:根據(jù)給定的抽樣極限誤差,求置信水平F(Z)(1)抽取樣本,計(jì)算巖本統(tǒng)計(jì)量,如計(jì)算樣本平均數(shù)或樣本成數(shù)作為相應(yīng)總體參數(shù)的估計(jì)值,如果缺少總體方差或均方差資料,還應(yīng)計(jì)算樣本方差或均方差代替;(2)根據(jù)給定的抽樣極限誤差,估計(jì)總體參數(shù)的上、下限;(3)計(jì)算抽樣平均誤差或估計(jì)標(biāo)準(zhǔn)誤差;(4)將抽樣極限誤差除以抽樣平均誤差求出概率度Z值,再根據(jù)Z值查“正態(tài)分布概率表”求出相應(yīng)的置信水平F(Z)。*3.區(qū)間估計(jì)的方法*方法二:根據(jù)給定的置信水平要求,來(lái)推算抽樣極限誤差,然后進(jìn)行區(qū)間估計(jì)。(1)抽取樣本,計(jì)算巖本統(tǒng)計(jì)量,如計(jì)算樣本平均數(shù)或樣本成數(shù)作為相應(yīng)總體參數(shù)的估計(jì)值,如果缺少總體方差或均方差資料,還應(yīng)計(jì)算樣本方差或均方差代替;(2)根據(jù)給定的置信度F(Z)要求,求得概率度Z值;
(3)計(jì)算抽樣平均誤差u;(4)根據(jù)概率度Z和抽樣平均誤差來(lái)推算抽樣極限誤差,再根據(jù)抽樣極限誤差求出被估計(jì)總體參數(shù)的上下限,對(duì)總體參數(shù)做區(qū)間估計(jì)。*方法二:根據(jù)給定的置信水平要求,來(lái)推算抽樣極限誤差,然后進(jìn)*每包重量(克)包數(shù)組中值149以下10148.51485-1.832.4149~15020149.52990-0.812.8150~15150150.575250.22151以上20151.530301.228.8合計(jì)100—15030—76[例]某外貿(mào)公司出口一種茶葉,規(guī)定每包規(guī)格不低于150克,現(xiàn)用不重復(fù)抽樣方法從中隨機(jī)抽取1%進(jìn)行檢驗(yàn),抽檢結(jié)果如表所示:*每包重量(克)包數(shù)組中值149以下10148.51485-*要求:(1)抽樣極限誤差為0.2克,估計(jì)該批茶葉每包平均重量的區(qū)間及其概率保證程度;(2)茶葉包裝合格率的誤差范圍不超過(guò)6%,估計(jì)包裝合格率的區(qū)間及其概率保證程度;(3)要求以95.45%的概率保證程度,估計(jì)該批茶葉每包平均重量的區(qū)間;(4)要求以95.45%的概率保證程度,估計(jì)該批茶葉的包裝合格率的區(qū)間。*要求:*(1)
上限==150.3+0.2=150.5克下限==150.3-0.2=150.1克*(1)上限==150.3+0*查概率表:該批茶葉每包平均重量落在區(qū)間[150.1,150.5]克內(nèi),概率保證程度為97.91%。*查概率表:*
(2)上限==70%+6%=76%
下限==70%-6%=64%查概率表:該批茶葉的包裝合格率落在區(qū)間[64%,76%]內(nèi),概率保證程度為81.32%。*(2)*(3)上限==150.3+0.1734=150.47克下限==150.3-0.1734=150.13克以95.45%的概率保證程度估計(jì)該批茶葉每包平均重量在區(qū)間[150.13,150.47]內(nèi)。**(4)上限==70%+9.12%=79.12%
下限==70%-9.12%=61.88%
以95.45%的概率保證程度估計(jì)該批茶葉包裝合格率的區(qū)間為[61.88%,79.12%]。*(4)*總體均值的區(qū)間估計(jì)-數(shù)理統(tǒng)計(jì)模式【例】某種零件的長(zhǎng)度服從正態(tài)分布,從某天生產(chǎn)一批零件中按重復(fù)抽樣方法隨機(jī)抽取9個(gè),測(cè)得其平均長(zhǎng)度為21.4cm。已知總體標(biāo)準(zhǔn)差為=0.15cm。試估計(jì)該批零件平均長(zhǎng)度的置信區(qū)間,置信水平為95%。該批零件平均長(zhǎng)度的置信區(qū)間在21.302cm~21.498cm之間。
解:已知X~N(,0.152),n=9,1-=95%,z/2=1.96總體均值
在1-置信水平下的置信區(qū)間為*總體均值的區(qū)間估計(jì)-數(shù)理統(tǒng)計(jì)模式【例】某種零件的長(zhǎng)度服從正*置信區(qū)間與置信水平的理解
總體參數(shù)的真值是固定的,而用樣本構(gòu)造的區(qū)間則是不固定的,因此置信區(qū)間是一個(gè)隨機(jī)區(qū)間,它會(huì)因樣本的不同而變化,而且不是所有的區(qū)間都包含總體參數(shù);實(shí)際估計(jì)時(shí)只抽取一個(gè)樣本,此時(shí)所構(gòu)造的是與該樣本相聯(lián)系的一定置信水平(比如95%)下的置信區(qū)間,一個(gè)特定的區(qū)間總是“包含”或“絕對(duì)不包含”參數(shù)的真值,不存在“以多大的概率包含總體參數(shù)”的問(wèn)題。我們無(wú)法知道這個(gè)樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值,我們只能希望這個(gè)區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個(gè),但它也可能是少數(shù)幾個(gè)不包含參數(shù)真值的區(qū)間中的一個(gè);*置信區(qū)間與置信水平的理解總體參數(shù)的真值是固定的,而用樣本*如果用某種方法構(gòu)造的所有區(qū)間中有95%的區(qū)間包含總體參數(shù)的真值,5%的區(qū)間不包含總體參數(shù)的真值,那么,用該方法構(gòu)造的區(qū)間稱為置信水平為95%的置信區(qū)間;置信水平只是告訴我們?cè)诙啻喂烙?jì)得到的區(qū)間中大概有多少個(gè)區(qū)間包含了參數(shù)的真值,而不是針對(duì)所抽取的這個(gè)樣本所構(gòu)建的區(qū)間而言的。
*如果用某種方法構(gòu)造的所有區(qū)間中有95%的區(qū)間包含總體參數(shù)*從均值為185的總體中抽出n=10的20個(gè)樣本構(gòu)造出總體均值的20個(gè)置信區(qū)間我沒(méi)有抓住參數(shù)!點(diǎn)估計(jì)值*從均值為185的總體中抽出n=10的20個(gè)樣本構(gòu)造出總體均*假設(shè)檢驗(yàn)
(hypothesistest)先對(duì)總體的參數(shù)(或分布形式)提出某種假設(shè),然后利用樣本信息判斷假設(shè)是否成立的統(tǒng)計(jì)方法。假設(shè)檢驗(yàn)的步驟:提出原假設(shè)H0;確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量;給定顯著性水平;計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值發(fā)生的概率(P值)或計(jì)算給定顯著性水平下的臨界值;作出統(tǒng)計(jì)決策。*假設(shè)檢驗(yàn)
(hypothesistest)先對(duì)總體的參*決策依據(jù)邏輯上運(yùn)用反證法,統(tǒng)計(jì)上依據(jù)小概率原理;樣本統(tǒng)計(jì)量越大或P值越小,則越傾向于拒絕原假設(shè)在這么小的概率下竟然得到了這樣的一個(gè)樣本,表明這樣的樣本經(jīng)常出現(xiàn)。*決策依據(jù)*...因此我們拒絕假設(shè)
=50...如果這是總體的真實(shí)均值樣本均值m=50抽樣分布H0這個(gè)值不像我們應(yīng)該得到的樣本均值...20假設(shè)檢驗(yàn)圖示*...因此我們拒絕假設(shè)=50...如果這是總體*P-值原假設(shè)為真條件下,抽樣分布中大于或小于樣本統(tǒng)計(jì)量的概率。/
2
/
2Z拒絕拒絕H0值臨界值計(jì)算出的樣本統(tǒng)計(jì)量計(jì)算出的樣本統(tǒng)計(jì)量臨界值1/2P值1/2P值*P-值原假設(shè)為真條件下,抽樣分布中大于或小于樣本統(tǒng)計(jì)量的概*5.4樣本容量的確定
5.4.1樣本容量確定的兩難
5.4.2簡(jiǎn)單隨機(jī)抽樣條件下樣本容量的確定
5.4.3總體參數(shù)的預(yù)先估計(jì)
5.4.4確定樣本容量時(shí)需考慮的因素*5.4樣本容量的確定*5.4.1樣本容量確定的兩難樣本容量較大,收集的信息就相對(duì)多,從而估計(jì)精度較高,但進(jìn)行觀測(cè)所投入的費(fèi)用、人力及時(shí)間就比較多;樣本容量較小,則投入的費(fèi)用、人力及時(shí)間就相對(duì)節(jié)約,但收集的信息也較少,從而估計(jì)精度較低;所以,精度和費(fèi)用對(duì)樣本量的影響
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 單位舊樓出租合同范本
- 中通快遞安全培訓(xùn)合同范本
- 2025年青海省安全員-C證考試(專職安全員)題庫(kù)附答案
- 東光租房合同范本
- 2025安徽省建筑安全員C證考試題庫(kù)
- 2025年河北省安全員《B證》考試題庫(kù)及答案
- 上網(wǎng)室改造合同范本
- 保理付款合同范本
- 小學(xué)語(yǔ)文古詩(shī)詞教學(xué)的有效策略
- 小學(xué)快樂(lè)體操教學(xué)設(shè)計(jì)與應(yīng)用探析
- 四年級(jí)科學(xué)下冊(cè)課件 第四課 河流和湖泊 冀人版 25張
- 綠色簡(jiǎn)約墻體商務(wù)風(fēng)PPT模板
- LS/T 1226-2022糧庫(kù)智能通風(fēng)控制系統(tǒng)
- GB/T 4927-2008啤酒
- GB/T 462-2003紙和紙板水分的測(cè)定
- QC演示:提高檢查井周邊密實(shí)度
- 肺隔離癥醫(yī)學(xué)課件
- GB/T 22919.5-2008水產(chǎn)配合飼料第5部分:南美白對(duì)蝦配合飼料
- 衛(wèi)生部健康體檢項(xiàng)目目錄
- 四川甘孜州州屬事業(yè)單位考調(diào)工作人員【共500題含答案解析】模擬檢測(cè)試卷
- 主要學(xué)術(shù)成績(jī)、創(chuàng)新點(diǎn)及其科學(xué)意義
評(píng)論
0/150
提交評(píng)論