版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)據(jù)分析
(方法與案例)
作者賈俊平統(tǒng)計(jì)學(xué)統(tǒng)
計(jì)
學(xué)
Statisticsyyyy-M-不象其他科學(xué),統(tǒng)計(jì)從來(lái)不打算使自己完美無(wú)缺,統(tǒng)計(jì)意味著你永遠(yuǎn)不需要確定無(wú)疑。
——GudmundR.Iversen統(tǒng)計(jì)名言yyyy-M-第5章數(shù)值變量的推斷—參數(shù)估計(jì)5.1
參數(shù)估計(jì)的基本原理5.2
一個(gè)總體參數(shù)的區(qū)間估計(jì)5.3
兩個(gè)總體參數(shù)的區(qū)間估計(jì)5.4樣本量的確定parameterestimationyyyy-M-學(xué)習(xí)目標(biāo)參數(shù)估計(jì)的基本原理點(diǎn)估計(jì)與區(qū)間估計(jì)評(píng)價(jià)估計(jì)量?jī)?yōu)良性的標(biāo)準(zhǔn)一個(gè)總體參數(shù)的區(qū)間估計(jì)方法兩個(gè)總體參數(shù)的區(qū)間估計(jì)方法樣本量的確定方法yyyy-M-大學(xué)生每周上網(wǎng)花多少時(shí)間?為了解學(xué)生每周上網(wǎng)花費(fèi)的時(shí)間,中國(guó)人民大學(xué)公共管理學(xué)院的4名本科生對(duì)全校部分本科生做了問(wèn)卷調(diào)查。調(diào)查的對(duì)象為中國(guó)人民大學(xué)在校本科生,調(diào)查內(nèi)容包括上網(wǎng)時(shí)間、途徑、支出、目的、關(guān)心的校園網(wǎng)內(nèi)容,以及學(xué)生對(duì)收費(fèi)的態(tài)度,包括收費(fèi)方式、價(jià)格等問(wèn)卷調(diào)查由調(diào)查員直接到宿舍發(fā)放并當(dāng)場(chǎng)回收。對(duì)四個(gè)年級(jí)中每年級(jí)各發(fā)60份問(wèn)卷,其中男、女生各30份。共收回有效問(wèn)卷共200份。其中有關(guān)上網(wǎng)時(shí)間方面的數(shù)據(jù)經(jīng)整理如下表所示yyyy-M-大學(xué)生每周上網(wǎng)花多少時(shí)間?回答類(lèi)別人數(shù)(人)頻率(%)3小時(shí)以下32163~6小時(shí)3517.56~9小時(shí)3316.59~12小時(shí)2914.512小時(shí)以上7135.5合計(jì)200100平均上網(wǎng)時(shí)間為8.58小時(shí),標(biāo)準(zhǔn)差為0.69小時(shí)。全校學(xué)生每周的平均上網(wǎng)時(shí)間是多少?每周上網(wǎng)時(shí)間在12小時(shí)以上的學(xué)生比例是多少?你做出估計(jì)的理論依據(jù)是什么?yyyy-M-5.1參數(shù)估計(jì)的基本原理
5.1.1點(diǎn)估計(jì)與區(qū)間估計(jì)
5.1.2評(píng)價(jià)估計(jì)量的標(biāo)準(zhǔn)第5章參數(shù)估計(jì)yyyy-M-5.1.1點(diǎn)估計(jì)與區(qū)間估計(jì)5.1參數(shù)估計(jì)的基本原理yyyy-M-參數(shù)估計(jì)(parameterestimation)就是用樣本統(tǒng)計(jì)量去估計(jì)總體的參數(shù)估計(jì)量:用于估計(jì)總體參數(shù)的統(tǒng)計(jì)量的名稱(chēng)如樣本均值,樣本比例,樣本方差等例如:樣本均值就是總體均值的一個(gè)估計(jì)量參數(shù)用表示,估計(jì)量用表示估計(jì)值:估計(jì)參數(shù)時(shí)計(jì)算出來(lái)的統(tǒng)計(jì)量的具體值如果樣本均值x=80,則80就是的估計(jì)值估計(jì)量與估計(jì)值
(estimator&estimatedvalue)yyyy-M-點(diǎn)估計(jì)
(pointestimate)用樣本的估計(jì)量的某個(gè)取值直接作為總體參數(shù)的估計(jì)值例如:用樣本均值直接作為總體均值的估計(jì);用兩個(gè)樣本均值之差直接作為總體均值之差的估計(jì)無(wú)法給出估計(jì)值接近總體參數(shù)程度的信息由于樣本是隨機(jī)的,抽出一個(gè)具體的樣本得到的估計(jì)值很可能不同于總體真值一個(gè)點(diǎn)估計(jì)量的可靠性是由它的抽樣標(biāo)準(zhǔn)誤差來(lái)衡量的,這表明一個(gè)具體的點(diǎn)估計(jì)值無(wú)法給出估計(jì)的可靠性的度量yyyy-M-區(qū)間估計(jì)
(intervalestimate)在點(diǎn)估計(jì)的基礎(chǔ)上,給出總體參數(shù)估計(jì)的一個(gè)估計(jì)區(qū)間,該區(qū)間由樣本統(tǒng)計(jì)量加減估計(jì)誤差而得到根據(jù)樣本統(tǒng)計(jì)量的抽樣分布能夠?qū)颖窘y(tǒng)計(jì)量與總體參數(shù)的接近程度給出一個(gè)概率度量比如,某班級(jí)平均分?jǐn)?shù)在75~85之間,置信水平是95%
yyyy-M-區(qū)間估計(jì)的圖示yyyy-M-將構(gòu)造置信區(qū)間的步驟重復(fù)很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例,也稱(chēng)置信度表示為(1-為是總體參數(shù)未在區(qū)間內(nèi)的比例常用的置信水平值有
99%,95%,90%相應(yīng)的為0.01,0.05,0.10置信水平
(confidencelevel)
yyyy-M-由樣本估計(jì)量構(gòu)造出的總體參數(shù)在一定置信水平下的估計(jì)區(qū)間統(tǒng)計(jì)學(xué)家在某種程度上確信這個(gè)區(qū)間會(huì)包含真正的總體參數(shù),所以給它取名為置信區(qū)間如果用某種方法構(gòu)造的所有區(qū)間中有95%的區(qū)間包含總體參數(shù)的真值,5%的區(qū)間不包含總體參數(shù)的真值,那么,用該方法構(gòu)造的區(qū)間稱(chēng)為置信水平為95%的置信區(qū)間。同樣,其他置信水平的區(qū)間也可以用類(lèi)似的方式進(jìn)行表述置信區(qū)間的表述
(confidenceinterval)yyyy-M-總體參數(shù)的真值是固定的,而用樣本構(gòu)造的區(qū)間則是不固定的,因此置信區(qū)間是一個(gè)隨機(jī)區(qū)間,它會(huì)因樣本的不同而變化,而且不是所有的區(qū)間都包含總體參數(shù)實(shí)際估計(jì)時(shí)往往只抽取一個(gè)樣本,此時(shí)所構(gòu)造的是與該樣本相聯(lián)系的一定置信水平(比如95%)下的置信區(qū)間。我們只能希望這個(gè)區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個(gè),但它也可能是少數(shù)幾個(gè)不包含參數(shù)真值的區(qū)間中的一個(gè)置信區(qū)間的表述
(confidenceinterval)yyyy-M-當(dāng)抽取了一個(gè)具體的樣本,用該樣本所構(gòu)造的區(qū)間是一個(gè)特定的常數(shù)區(qū)間,我們無(wú)法知道這個(gè)樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值,因?yàn)樗赡苁前傮w均值的區(qū)間中的一個(gè),也可能是未包含總體均值的那一個(gè)一個(gè)特定的區(qū)間總是“包含”或“絕對(duì)不包含”參數(shù)的真值,不存在“以多大的概率包含總體參數(shù)”的問(wèn)題置信水平只是告訴我們?cè)诙啻喂烙?jì)得到的區(qū)間中大概有多少個(gè)區(qū)間包含了參數(shù)的真值,而不是針對(duì)所抽取的這個(gè)樣本所構(gòu)建的區(qū)間而言的正確的表述:計(jì)算置信水平為95%的置信區(qū)間是一種方法,該方法使得區(qū)間以95%的概率覆蓋總體參數(shù)置信區(qū)間的表述
(confidenceinterval)yyyy-M-置信區(qū)間的表述
(95%的置信區(qū)間)從均值為185的總體中抽出n=10的20個(gè)樣本構(gòu)造出的20個(gè)置信區(qū)間我沒(méi)有抓住參數(shù)!點(diǎn)估計(jì)值yyyy-M-使用一個(gè)較大的置信水平會(huì)得到一個(gè)比較寬的置信區(qū)間,而使用一個(gè)較大的樣本則會(huì)得到一個(gè)較準(zhǔn)確(較窄)的區(qū)間。直觀地說(shuō),較寬的區(qū)間會(huì)有更大的可能性包含參數(shù)但實(shí)際應(yīng)用中,過(guò)寬的區(qū)間往往沒(méi)有實(shí)際意義比如,天氣預(yù)報(bào)說(shuō)“在一年內(nèi)會(huì)下一場(chǎng)雨”,雖然這很有把握,但有什么意義呢?另一方面,要求過(guò)于準(zhǔn)確(過(guò)窄)的區(qū)間同樣不一定有意義,因?yàn)檫^(guò)窄的區(qū)間雖然看上去很準(zhǔn)確,但把握性就會(huì)降低,除非無(wú)限制增加樣本量,而現(xiàn)實(shí)中樣本量總是有限的區(qū)間估計(jì)總是要給結(jié)論留點(diǎn)兒余地置信區(qū)間的表述
(confidenceinterval)yyyy-M-5.1.2評(píng)價(jià)估計(jì)量的標(biāo)準(zhǔn)5.1參數(shù)估計(jì)的基本原理yyyy-M-無(wú)偏性
(unbiasedness)無(wú)偏性:估計(jì)量抽樣分布的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)yyyy-M-有效性
(efficiency)有效性:對(duì)同一總體參數(shù)的兩個(gè)無(wú)偏點(diǎn)估計(jì)量,有更小標(biāo)準(zhǔn)差的估計(jì)量更有效
yyyy-M-一致性
(consistency)一致性:隨著樣本量的增大,估計(jì)量的
值越來(lái)越接近被估計(jì)的總體參數(shù)yyyy-M-5.2一個(gè)總體參數(shù)的區(qū)間估計(jì)
5.2.1總體均值的區(qū)間估計(jì)
5.2.2總體比例的區(qū)間估計(jì)
5.2.3總體方差的區(qū)間估計(jì)第5章參數(shù)估計(jì)yyyy-M-5.2.1總體均值的區(qū)間估計(jì)5.2一個(gè)總體參數(shù)估計(jì)的區(qū)間估計(jì)yyyy-M-一個(gè)總體參數(shù)的區(qū)間估計(jì)總體參數(shù)符號(hào)表示樣本統(tǒng)計(jì)量均值比例方差yyyy-M-總體均值區(qū)間的一般表達(dá)式總體均值的置信區(qū)間是由樣本均值加減估計(jì)誤差得到的估計(jì)誤差由兩部分組成:一是點(diǎn)估計(jì)量的標(biāo)準(zhǔn)誤差,它取決于樣本統(tǒng)計(jì)量的抽樣分布。二是估計(jì)時(shí)所要的求置信水平為時(shí),統(tǒng)計(jì)量分布兩側(cè)面積為的分位數(shù)值,它取決于事先所要求的可靠程度總體均值在置信水平下的置信區(qū)間可一般性地表達(dá)為樣本均值±分位數(shù)值×樣本均值的標(biāo)準(zhǔn)誤差yyyy-M-總體均值的區(qū)間估計(jì)
(大樣本的估計(jì))1. 假定條件總體服從正態(tài)分布,且方差(2)
已知如果不是正態(tài)分布,可由正態(tài)分布來(lái)近似(n
30)使用正態(tài)分布統(tǒng)計(jì)量z總體均值在1-置信水平下的置信區(qū)間為yyyy-M-總體均值的區(qū)間估計(jì)
(大樣本的估計(jì))【例5-1】一家保險(xiǎn)公司收集到由36個(gè)投保人組成的隨機(jī)樣本,得到每個(gè)投保人的年齡(單位:周歲)數(shù)據(jù)如下表。試建立投保人年齡90%的置信區(qū)間
36個(gè)投保人年齡的數(shù)據(jù)233539273644364246433133425345544724342839364440394938344850343945484532yyyy-M-總體均值的區(qū)間估計(jì)
(大樣本的估計(jì))解:已知n=36,1-=90%,z/2=1.645。根據(jù)樣本數(shù)據(jù)計(jì)算得:,
總體均值在1-置信水平下的置信區(qū)間為投保人平均年齡的置信區(qū)間為37.37歲~41.63歲yyyy-M-總體均值的區(qū)間估計(jì)
(小樣本的估計(jì))1. 假定條件總體服從正態(tài)分布,但方差(2)
未知小樣本
(n<30)使用t
分布統(tǒng)計(jì)量總體均值在1-置信水平下的置信區(qū)間為yyyy-M-總體均值的區(qū)間估計(jì)
(小樣本的估計(jì))【例5-2】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,為對(duì)產(chǎn)量質(zhì)量進(jìn)行監(jiān)測(cè),企業(yè)質(zhì)檢部門(mén)經(jīng)常要進(jìn)行抽檢,以分析每袋重量是否符合要求?,F(xiàn)從某天生產(chǎn)的一批食品中隨機(jī)抽取了25袋,測(cè)得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布,且總體標(biāo)準(zhǔn)差為10克。試估計(jì)該批產(chǎn)品平均重量的置信區(qū)間,置信水平為95%25袋食品的重量112.5101.0103.0102.0100.5102.6107.5
95.0108.8115.6100.0123.5102.0101.6102.2116.6
95.4
97.8108.6105.0136.8102.8101.5
98.4
93.3yyyy-M-總體均值的區(qū)間估計(jì)
(小樣本的估計(jì))解:已知X~N(,102),n=25,1-=95%,z/2=1.96。根據(jù)樣本數(shù)據(jù)計(jì)算得:。由于是正態(tài)總體,且方差已知??傮w均值在1-置信水平下的置信區(qū)間為該食品平均重量的置信區(qū)間為101.44g~109.28gyyyy-M-總體均值的區(qū)間估計(jì)
(小樣本的估計(jì))【例5-3】已知某種燈泡的壽命服從正態(tài)分布,現(xiàn)從一批燈泡中隨機(jī)抽取16只,測(cè)得其使用壽命(單位:h)如下。建立該批燈泡平均使用壽命95%的置信區(qū)間16燈泡使用壽命的數(shù)據(jù)1510152014801500145014801510152014801490153015101460146014701470yyyy-M-總體均值的區(qū)間估計(jì)
(小樣本的估計(jì))解:已知X~N(,2),n=16,1-=95%,t/2=2.131
根據(jù)樣本數(shù)據(jù)計(jì)算得:,
總體均值在1-置信水平下的置信區(qū)間為該種燈泡平均使用壽命的置信區(qū)間為1476.8h~1503.2hyyyy-M-用SPSS求置信區(qū)間
(小樣本)SPSS的輸出結(jié)果
yyyy-M-5.2.2總體比例的區(qū)間估計(jì)5.2一個(gè)總體參數(shù)估計(jì)的區(qū)間估計(jì)yyyy-M-總體比例的區(qū)間估計(jì)
(傳統(tǒng)方法)1. 假定條件總體服從二項(xiàng)分布可以由正態(tài)分布來(lái)近似np(成功次數(shù))和n(1-p)(失敗次數(shù))均應(yīng)該大于10使用正態(tài)分布統(tǒng)計(jì)量z3.總體比例在1-置信水平下的置信區(qū)間為樣本比例±分位數(shù)值×樣本比例的標(biāo)準(zhǔn)誤差yyyy-M-總體比例的區(qū)間估計(jì)
(例題分析—傳統(tǒng)方法)【例5-4】某城市想要估計(jì)下崗職工中女性所占的比例,隨機(jī)地抽取了100名下崗職工,其中65人為女性職工。試以95%的置信水平估計(jì)該城市下崗職工中女性比例的置信區(qū)間解:已知n=100,p=65%,1-=95%,z/2=1.96該城市下崗職工中女性比例的置信區(qū)間為55.65%~74.35%
yyyy-M-一個(gè)總體比例的區(qū)間估計(jì)
(現(xiàn)代方法)按照傳統(tǒng)方法計(jì)算出來(lái)的置信水平為(1-)的置信區(qū)間能夠覆蓋總體真實(shí)比例的概率小于(1-),既是大樣本也是如此,更不可能應(yīng)用于小樣本根據(jù)經(jīng)驗(yàn)法則:傳統(tǒng)方法要求np(成功次數(shù))和n(1-p)(失敗次數(shù))均應(yīng)該大于10(也有些書(shū)上說(shuō)大于5)對(duì)于非常大的樣本,傳統(tǒng)方法和現(xiàn)代方法的結(jié)果幾乎相同,但對(duì)于小樣本或中等樣本現(xiàn)代方法更適用yyyy-M-一個(gè)總體比例的區(qū)間估計(jì)
(現(xiàn)代方法)通過(guò)修正試驗(yàn)次數(shù)n(樣本量)和試驗(yàn)成功的比例P(樣本比例)改進(jìn)置信區(qū)間將試驗(yàn)次數(shù)n加上4,即用代替n;將試驗(yàn)成功的次數(shù)x加上2,即用代替p對(duì)于任意大小的樣本都可以使用該方法計(jì)算置信區(qū)間只是在樣本較小時(shí),偶爾會(huì)有區(qū)間下限小于0或區(qū)間上限大于1的情況發(fā)生。此時(shí)可用0代替小于0的下限,用1代替大于1的上限yyyy-M-一個(gè)總體比例的區(qū)間估計(jì)
(現(xiàn)代方法)設(shè)總體服從二項(xiàng)分布,即X~(n,p),x為n次獨(dú)立伯努利試驗(yàn)成功的次數(shù),P為成功的概率定義和總體比例在1-置信水平下的置信區(qū)間該區(qū)間也稱(chēng)為Agresti-Coull區(qū)間(由AlanAgresti和BrentCoull給出,以其姓氏命名)如果下限小于0則用0代替;如果上限大于1則用1代替yyyy-M-一個(gè)總體比例的區(qū)間估計(jì)
(現(xiàn)代方法)【例】某城市想要估計(jì)下崗職工中女性所占的比例,隨機(jī)地抽取了100名下崗職工,其中65人為女性職工。試以95%的置信水平估計(jì)該城市下崗職工中女性比例的置信區(qū)間解:該城市下崗職工中女性比例的置信區(qū)間為47.72%~79.12%
yyyy-M-5.2.3總體方差的區(qū)間估計(jì)5.2一個(gè)總體參數(shù)估計(jì)的區(qū)間估計(jì)yyyy-M-總體方差的區(qū)間估計(jì)1. 估計(jì)一個(gè)總體的方差或標(biāo)準(zhǔn)差2. 假設(shè)總體服從正態(tài)分布總體方差
2
的點(diǎn)估計(jì)量為s2,且4.總體方差在1-置信水平下的置信區(qū)間為yyyy-M-總體方差的區(qū)間估計(jì)
(圖示)yyyy-M-總體方差的區(qū)間估計(jì)
(例題分析)【例5-5】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,現(xiàn)從某天生產(chǎn)的一批食品中隨機(jī)抽取了25袋,測(cè)得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布。以95%的置信水平建立該種食品重量方差的置信區(qū)間
25袋食品的重量112.5101.0103.0102.0100.5102.6107.5
95.0108.8115.6100.0123.5102.0101.6102.2116.6
95.4
97.8108.6105.0136.8102.8101.5
98.4
93.3yyyy-M-總體方差的區(qū)間估計(jì)
(例題分析)解:已知n=25,1-=95%,根據(jù)樣本數(shù)據(jù)計(jì)算得
s2=93.21
2置信度為95%的置信區(qū)間為
該企業(yè)生產(chǎn)的食品總體重量標(biāo)準(zhǔn)差的的置信區(qū)間為7.54g~13.43gyyyy-M-一個(gè)總體參數(shù)的區(qū)間估計(jì)
(小結(jié))yyyy-M-5.3兩個(gè)總體參數(shù)的區(qū)間估計(jì)
5.3.1兩個(gè)總體均值之差的區(qū)間估計(jì)
5.3.2兩個(gè)總體比例之差的區(qū)間估計(jì)
5.3.3兩個(gè)總體方差比的區(qū)間估計(jì)第5章參數(shù)估計(jì)yyyy-M-兩個(gè)總體參數(shù)的區(qū)間估計(jì)總體參數(shù)符號(hào)表示樣本統(tǒng)計(jì)量均值差比例差方差比yyyy-M-5.3.1兩個(gè)總體均值之差的區(qū)間估計(jì)5.3兩個(gè)總體參數(shù)估計(jì)的區(qū)間估計(jì)yyyy-M-均值之差區(qū)間的一般表達(dá)式兩個(gè)總體均值的置信區(qū)間是由兩個(gè)樣本均值之差加減估計(jì)誤差得到的估計(jì)誤差由兩部分組成:一是點(diǎn)估計(jì)量的標(biāo)準(zhǔn)誤差,它取決于樣本統(tǒng)計(jì)量的抽樣分布。二是估計(jì)時(shí)所要的求置信水平為時(shí),統(tǒng)計(jì)量分布兩側(cè)面積為的分位數(shù)值,它取決于事先所要求的可靠程度兩個(gè)總體均值之差(1-2)在置信水平下的置信區(qū)間可一般性地表達(dá)為(x1-x2)±分位數(shù)值×(x1-x2)的標(biāo)準(zhǔn)誤差yyyy-M-兩個(gè)總體均值之差的估計(jì)
(獨(dú)立大樣本)1. 假定條件兩個(gè)總體都服從正態(tài)分布,12、22已知若不是正態(tài)分布,可以用正態(tài)分布來(lái)近似(n130和n230)兩個(gè)樣本是獨(dú)立的隨機(jī)樣本使用正態(tài)分布統(tǒng)計(jì)量zyyyy-M-兩個(gè)總體均值之差的估計(jì)
(獨(dú)立大樣本)1. 12,22已知時(shí),兩個(gè)總體均值之差1-2在1-置信水平下的置信區(qū)間為
12、22未知時(shí),兩個(gè)總體均值之差1-2在1-置信水平下的置信區(qū)間為yyyy-M-兩個(gè)總體均值之差的估計(jì)
(獨(dú)立大樣本)【例5-6】某地區(qū)教育管理部門(mén)想估計(jì)兩所中學(xué)的學(xué)生高考時(shí)的英語(yǔ)平均分?jǐn)?shù)之差,為此在兩所中學(xué)獨(dú)立抽取兩個(gè)隨機(jī)樣本,有關(guān)數(shù)據(jù)如右表。建立兩所中學(xué)高考英語(yǔ)平均分?jǐn)?shù)之差95%的置信區(qū)間
兩個(gè)樣本的有關(guān)數(shù)據(jù)
中學(xué)1中學(xué)2n1=46n1=33S1=5.8S2=7.2Englishyyyy-M-兩個(gè)總體均值之差的估計(jì)
(獨(dú)立大樣本)解:兩個(gè)總體均值之差在1-置信水平下的置信區(qū)間為
兩所中學(xué)高考英語(yǔ)平均分?jǐn)?shù)之差的置信區(qū)間為5.03分~10.97分yyyy-M-兩個(gè)總體均值之差的估計(jì)
(獨(dú)立小樣本:
12=22)1. 假定條件兩個(gè)總體都服從正態(tài)分布兩個(gè)總體方差未知但相等:12=22兩個(gè)獨(dú)立的小樣本(n1<30和n2<30)總體方差的合并估計(jì)量估計(jì)量x1-x2的抽樣標(biāo)準(zhǔn)差yyyy-M-兩個(gè)總體均值之差的估計(jì)
(獨(dú)立小樣本:
12=22)兩個(gè)樣本均值之差的標(biāo)準(zhǔn)化兩個(gè)總體均值之差1-2在1-置信水平下的置信區(qū)間為yyyy-M-兩個(gè)總體均值之差的估計(jì)
(獨(dú)立小樣本:
12=22)【例5-7】為估計(jì)兩種方法組裝產(chǎn)品所需時(shí)間的差異,分別對(duì)兩種不同的組裝方法各隨機(jī)安排12名工人,每個(gè)工人組裝一件產(chǎn)品所需的時(shí)間(單位:min)下如表。假定兩種方法組裝產(chǎn)品的時(shí)間服從正態(tài)分布,且方差相等。試以95%的置信水平建立兩種方法組裝產(chǎn)品所需平均時(shí)間差值的置信區(qū)間兩個(gè)方法組裝產(chǎn)品所需的時(shí)間方法1方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.5yyyy-M-兩個(gè)總體均值之差的估計(jì)
(獨(dú)立小樣本:
12=22)解:根據(jù)樣本數(shù)據(jù)計(jì)算得合并估計(jì)量為兩種方法組裝產(chǎn)品所需平均時(shí)間之差的置信區(qū)間為0.14分鐘~7.26分鐘yyyy-M-兩個(gè)總體均值之差的估計(jì)
(獨(dú)立小樣本:1222)1. 假定條件兩個(gè)總體都服從正態(tài)分布兩個(gè)總體方差未知且不相等:1222兩個(gè)獨(dú)立的小樣本(n1<30和n2<30)使用統(tǒng)計(jì)量yyyy-M-兩個(gè)總體均值之差的估計(jì)
(獨(dú)立小樣本:1222)兩個(gè)總體均值之差1-2在1-置信水平下的置信區(qū)間為自由度yyyy-M-用SPSS求兩個(gè)總體均值之差置信區(qū)間
(例題分析)檢驗(yàn)兩個(gè)總體的方差是否相等。原假設(shè)是相等,如Sig.很小,則表明兩個(gè)總體方差不相等,此時(shí)使用區(qū)間“假設(shè)方差相等”,否則使用區(qū)間“假設(shè)方差不相等”。本例使用“假設(shè)方差相等”求置信區(qū)間SPSSyyyy-M-兩個(gè)總體均值之差的估計(jì)
(獨(dú)立小樣本:1222)【例5-8】沿用前例。假定第一種方法隨機(jī)安排12名工人,第二種方法隨機(jī)安排8名工人,即n1=12,n2=8,所得的有關(guān)數(shù)據(jù)如表。假定兩種方法組裝產(chǎn)品的時(shí)間服從正態(tài)分布,且方差不相等。以95%的置信水平建立兩種方法組裝產(chǎn)品所需平均時(shí)間差值的置信區(qū)間
兩個(gè)方法組裝產(chǎn)品所需的時(shí)間方法1方法228.336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020.028.830.030.221yyyy-M-兩個(gè)總體均值之差的估計(jì)
(獨(dú)立小樣本:1222)解:根據(jù)樣本數(shù)據(jù)計(jì)算得
自由度為兩種方法組裝產(chǎn)品所需平均時(shí)間之差的置信區(qū)間為0.192分鐘~9.058分鐘yyyy-M-用SPSS求兩個(gè)總體均值之差置信區(qū)間
(例題分析)SPSS的輸出結(jié)果(只截取估計(jì)的部分)檢驗(yàn)兩個(gè)總體的方差是否相等。原假設(shè)是相等,如Sig.很小,則表明兩個(gè)總體方差不相等,此時(shí)使用區(qū)間“Equalvariancesnotassumed”,否則使用區(qū)間“Equalvariancesassumed”。本例使用“Equalvariancesassumed”yyyy-M-兩個(gè)總體均值之差的估計(jì)
(匹配大樣本)假定條件兩個(gè)匹配的大樣本(n130和n230)兩個(gè)總體各觀察值的配對(duì)差服從正態(tài)分布兩個(gè)總體均值之差d=1-2在1-置信水平下的置信區(qū)間為d±分位數(shù)值×d的標(biāo)準(zhǔn)誤差yyyy-M-兩個(gè)總體均值之差的估計(jì)
(匹配小樣本)假定條件兩個(gè)匹配的小樣本(n1<30和n2<30)兩個(gè)總體各觀察值的配對(duì)差服從正態(tài)分布
兩個(gè)總體均值之差d=1-2在1-置信水平下的置信區(qū)間為yyyy-M-兩個(gè)總體均值之差的估計(jì)
(匹配小樣本)【例5-9】由10名學(xué)生組成一個(gè)隨機(jī)樣本,讓他們分別采用A和B兩套試卷進(jìn)行測(cè)試,結(jié)果如下表。試建立兩種試卷分?jǐn)?shù)之差d=1-2
95%的置信區(qū)間
10名學(xué)生兩套試卷的得分學(xué)生編號(hào)試卷A試卷B差值d17871726344193726111489845691741754951-27685513876601698577810553916STATISTICSyyyy-M-兩個(gè)總體均值之差的估計(jì)
(匹配小樣本)解:根據(jù)樣本數(shù)據(jù)計(jì)算得兩種試卷所產(chǎn)生的分?jǐn)?shù)之差的置信區(qū)間為6.33分~15.67分yyyy-M-用SPSS求配對(duì)小樣本均值之差置信區(qū)間
(例題分析)SPSS的輸出結(jié)果
(只截取估計(jì)的部分)用求置信區(qū)間SPSSyyyy-M-5.3.2兩個(gè)總體比例之差的區(qū)間估計(jì)5.3兩個(gè)總體參數(shù)估計(jì)的區(qū)間估計(jì)yyyy-M-1. 假定條件兩個(gè)總體服從二項(xiàng)分布可以用正態(tài)分布來(lái)近似兩個(gè)樣本是獨(dú)立的n1p1和n1(1-p1),n2p2和n2(1-p2),均應(yīng)該大于102. 兩個(gè)總體比例之差1-2在1-置信水平下的置信區(qū)間為兩個(gè)總體比例之差的區(qū)間估計(jì)
(傳統(tǒng)方法)(p1-p2)±分位數(shù)值×(p1-p2)的標(biāo)準(zhǔn)誤差yyyy-M-兩個(gè)總體比例之差的估計(jì)
(例題分析—傳統(tǒng)方法)【例5-10】在某個(gè)電視節(jié)目的收視率調(diào)查中,農(nóng)村隨機(jī)調(diào)查了400人,有32%的人收看了該節(jié)目;城市隨機(jī)調(diào)查了500人,有45%的人收看了該節(jié)目。試以95%的置信水平估計(jì)城市與農(nóng)村收視率差別的置信區(qū)間12yyyy-M-兩個(gè)總體比例之差的估計(jì)
(例題分析—傳統(tǒng)方法)解:已知
n1=500,n2=400,p1=45%,p2=32%,
1-=95%,z/2=1.96
1-2置信度為95%的置信區(qū)間為城市與農(nóng)村收視率差值的置信區(qū)間為6.68%~19.32%yyyy-M-兩個(gè)總體比例之差的區(qū)間估計(jì)
(現(xiàn)代方法)通過(guò)修正試驗(yàn)次數(shù)n1、n2(樣本量)和試驗(yàn)成功的比例P1、P2(樣本比例)改進(jìn)置信區(qū)間將試驗(yàn)次數(shù)n1和n1各加上2,即用代n1,代替n2;將試驗(yàn)成功的次數(shù)x1和x2各加上1,即用代替p1,用代替p2對(duì)于任意大小的樣本都可以使用該方法計(jì)算置信區(qū)間yyyy-M-兩個(gè)總體比例之差的區(qū)間估計(jì)
(現(xiàn)代方法)設(shè)兩總體都服從二項(xiàng)分布,即X1~(n1,p1),X2~(n2,p2)。x1為n1次獨(dú)立伯努利試驗(yàn)成功的次數(shù),P1位成功的概率概率,x2
為n2次獨(dú)立伯努利試驗(yàn)成功的次數(shù),P2為成功的概率定義,;,1-2在1-置信水平下的置信區(qū)間該區(qū)間也稱(chēng)為Agresti-Caffo區(qū)間(由AlanAgresti和BrianCaffo給出,以其姓氏命名)如果下限小于-1則用-1代替;如果上限大于1則用1代替yyyy-M-5.3.3兩個(gè)總體方差比的區(qū)間估計(jì)5.3兩個(gè)總體參數(shù)估計(jì)的區(qū)間估計(jì)yyyy-M-兩個(gè)總體方差比的區(qū)間估計(jì)1. 比較兩個(gè)總體的方差比用兩個(gè)樣本的方差比來(lái)判斷如果S12/S22接近于1,說(shuō)明兩個(gè)總體方差很接近如果S12/S22遠(yuǎn)離1,說(shuō)明兩個(gè)總體方差之間存在差異總體方差比在1-置信水平下的置信區(qū)間為yyyy-M-兩個(gè)總體方差比的區(qū)間估計(jì)
(圖示)yyyy-M-兩個(gè)總體方差比的區(qū)間估計(jì)
(例題分析)【例5-11】為了研究男女學(xué)生在生活費(fèi)支出(單位:元)上的差異,在某大學(xué)各隨機(jī)抽取25名男學(xué)生和25名女學(xué)生,得到下面的結(jié)果男學(xué)生:女學(xué)生:試以90%置信水平估計(jì)男女學(xué)生生活費(fèi)支出方差比的置信區(qū)間yyyy-M-兩個(gè)總體方差比的區(qū)間估計(jì)
(例題分析)解:根據(jù)自由度
n1=25-1=24,n2=25-1=24,查得F/2(24)=1.98,F(xiàn)1-/2(24)=1/1.98=0.50512/22置信度為90%的置信區(qū)間為男女學(xué)生生活費(fèi)支出方差比的置信區(qū)間為0.47~1.84
yyyy-M-兩個(gè)總體參數(shù)的區(qū)間估計(jì)
(小結(jié))yyyy-M-5.4樣本量的確定
5.4.1估計(jì)總體均值時(shí)樣本量的確定
5.4.2估計(jì)總體比例時(shí)樣本量的確定第5章參數(shù)估計(jì)yyyy-M-6.4.1估計(jì)總體均值時(shí)樣本量的確定6.4樣本量的確定yyyy-M-估計(jì)總體均值時(shí)樣本量n為樣本量n與總體方差2、邊際誤差E、可靠性系數(shù)Z或t之間的關(guān)系為與總體方差成正比與邊際誤差的平方成反比與可靠性系數(shù)成正比樣本量的圓整法則:當(dāng)計(jì)算出的樣本量不是整數(shù)時(shí),將小數(shù)點(diǎn)后面的數(shù)值一律進(jìn)位成整數(shù),如24.68取25,24.32也取25等等估計(jì)一個(gè)總體均值時(shí)樣本量的確定其中:yyyy-M-估計(jì)一個(gè)總體均值時(shí)樣本量的確定
(例題分析)【例5-12】擁有工商管理學(xué)士學(xué)位的大學(xué)畢業(yè)生年
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025關(guān)于代理合同格式
- 2025工程施工合同中核心條款有些
- 課題申報(bào)書(shū):共同富裕下易地扶貧搬遷家庭收入不平等的測(cè)度、機(jī)理及政策創(chuàng)新研究
- 課題申報(bào)書(shū):高校專(zhuān)業(yè)課教師課程思政元素挖掘能力提升路徑研究
- 課題申報(bào)書(shū):服務(wù)新質(zhì)生產(chǎn)力發(fā)展的職業(yè)教育專(zhuān)業(yè)教學(xué)資源庫(kù)建設(shè)實(shí)踐路徑研究
- 課題申報(bào)書(shū):非結(jié)構(gòu)化文本數(shù)據(jù)驅(qū)動(dòng)的智能輔助診療決策方法研究
- 上海歐華職業(yè)技術(shù)學(xué)院《畫(huà)法幾何及建筑制圖》2023-2024學(xué)年第一學(xué)期期末試卷
- 上海紐約大學(xué)《內(nèi)燃機(jī)原理》2023-2024學(xué)年第一學(xué)期期末試卷
- 五年級(jí)語(yǔ)文上冊(cè)第一單元習(xí)作我的心愛(ài)之物 公開(kāi)課一等獎(jiǎng)創(chuàng)新教學(xué)設(shè)計(jì)
- 26寶葫蘆的秘密(節(jié)選)公開(kāi)課一等獎(jiǎng)創(chuàng)新教學(xué)設(shè)計(jì)
- 醫(yī)院消防系統(tǒng)維護(hù)保養(yǎng)服務(wù)投標(biāo)方案(圖文版)(技術(shù)方案)
- 花都區(qū)2023-2024年-2024年八年級(jí)上學(xué)期語(yǔ)文期末試卷
- 2025年健康素養(yǎng)知識(shí)競(jìng)賽題庫(kù)(含答案)
- 2024年物業(yè)管理師(中級(jí)四級(jí))考試題庫(kù)大全-下(判斷、簡(jiǎn)答題)
- 2024年新疆區(qū)公務(wù)員錄用考試《行測(cè)》試題及答案解析
- 人教版八年級(jí)英語(yǔ)上冊(cè)第五單元教學(xué)設(shè)計(jì)(教案)
- 2023-2024學(xué)年河北省廊坊十八中八年級(jí)(上)期末數(shù)學(xué)試卷
- 北師版2024春八下數(shù)學(xué)2.2不等式的基本性質(zhì)【上課課件】
- 幼教老師合作協(xié)議書(shū)范本模板
- 2024年遼寧省錦州市財(cái)力保障中心招聘9人歷年高頻難、易錯(cuò)點(diǎn)500題模擬試題附帶答案詳解
- 2024國(guó)開(kāi)電大《四史通講》形考任務(wù)終考答案天津
評(píng)論
0/150
提交評(píng)論