第4章 總體參數(shù)估計(jì)_第1頁(yè)
第4章 總體參數(shù)估計(jì)_第2頁(yè)
第4章 總體參數(shù)估計(jì)_第3頁(yè)
第4章 總體參數(shù)估計(jì)_第4頁(yè)
第4章 總體參數(shù)估計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩24頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、29第4章 參數(shù)估計(jì)一、單一總體的參數(shù)估計(jì)(一)估計(jì)的含義 估計(jì):人人都做過。如: 上課時(shí),你會(huì)估計(jì)一下老師提問你的概率有多大? 當(dāng)你去公司應(yīng)聘時(shí),會(huì)估計(jì)你被錄用的可能性是多少? 推銷員年初時(shí)要估計(jì)今年超額完成任務(wù)的概率有多大?估計(jì)量:用來估計(jì)總體參數(shù)的樣本統(tǒng)計(jì)量。如:算術(shù)平均數(shù)、中位數(shù)、標(biāo)準(zhǔn)差、方差等。估計(jì)的可能性與科學(xué)性:數(shù)理統(tǒng)計(jì)證明,一個(gè)“優(yōu)良”的樣本統(tǒng)計(jì)量應(yīng)具備以下特征:(1)、無偏性。樣本估計(jì)量的期望值應(yīng)等于總體參數(shù)。無系統(tǒng)偏差。(2)、有效性。與離散度相聯(lián)系。在多個(gè)無偏估計(jì)量中,方差最小的估計(jì)量最有效。(3)、一致性。隨著樣本容量的增加,可以使估計(jì)量越來越靠近總體參數(shù)。(4)、充分

2、性。估計(jì)量能夠充分利用有關(guān)信息,中位數(shù)和眾數(shù)不具備這一點(diǎn)。估計(jì)的類型包括 :1、 點(diǎn)估計(jì):只有一個(gè)取值。如樣本平均數(shù) 就是總體平均數(shù)的點(diǎn)估計(jì)值。2、區(qū)間估計(jì):給出取值范圍(值域)。見PPT 兩種估計(jì)類型哪一種更科學(xué)? 區(qū)間估計(jì)的優(yōu)點(diǎn)在于:它在給出估計(jì)區(qū)間時(shí),還可以給予一個(gè)“可信程度”。例如:銷售經(jīng)理想估計(jì)一下明年的出口總值,甲估計(jì)是53萬(wàn)美元,乙估計(jì)是5056萬(wàn)美元之間,并可以確切地說“有95%的把握”。顯然后者的可信程度大于前者。那么,5056萬(wàn)美元之間的范圍是如何計(jì)算的?“有95%的把握”是什么意思?【引例】:某食品進(jìn)出口公司向東南亞出口一批花生制品,管理人員從中抽取50包作為樣本,計(jì)算其

3、平均數(shù)為250克。另外,合同規(guī)定總體標(biāo)準(zhǔn)差為6克。如果問這批花生制品的平均重量,可用樣本平均數(shù)作為總體平均數(shù)的最佳估計(jì)量:250克。但這是遠(yuǎn)遠(yuǎn)不夠的,在許多時(shí)候,管理人員還想了解“這個(gè)估計(jì)值的平均誤差是多少?”“總體平均數(shù)可能落入樣本平均數(shù)上、下多大范圍內(nèi)?”“ 這個(gè)估計(jì)值的可靠程度是多少?”1由于n=50,根據(jù)中心極限定理可作圖: n=50,=62抽樣平均誤差:3若用250克這個(gè)估計(jì)值估計(jì)總體平均數(shù),其平均誤差為0.8485。 4若用區(qū)間表示估計(jì)的值域:這批花生制品的總體平均重量是2500.8485克之間。5總體平均數(shù)在2500.8485克之間的可信度為68.3%??傮w平均數(shù)在25020.8

4、485克之間的可信度為95.5%??傮w平均數(shù)在25030.8485克之間的可信度為99.7%。(二)區(qū)間估計(jì)中幾個(gè)常用概念1、置信度(置信系數(shù)):它是指與一個(gè)估計(jì)區(qū)間相聯(lián)系的概率,它表示該區(qū)間將包括總體參數(shù)的可能程度。用1-表示。置信度越大,估計(jì)區(qū)間內(nèi)所包含總體參數(shù)的可信度越高。(68.3%、95.45%、99.7%都是置信度)2、置信區(qū)間:與一個(gè)“置信度”相聯(lián)系的估計(jì)值的取值范圍。用表示(如2502)2502:表示有95.45%的樣本平均數(shù)構(gòu)造的區(qū)間將包含總體平均數(shù)。2503:表示有99.73%的樣本平均數(shù)構(gòu)造的區(qū)間將包含總體平均數(shù)。3、置信限:與置信區(qū)間相聯(lián)系的界限,包括上限和下限。如上題

5、中下限:250-,上限:250+思考題:置信度與置信區(qū)間有何關(guān)系?(三)總體平均數(shù)的區(qū)間估計(jì)1、大樣本條件下的區(qū)間估計(jì)(1)、總體標(biāo)準(zhǔn)差已知條件下,對(duì)總體平均數(shù)的區(qū)間估計(jì)案例1:在【引例】中:食品進(jìn)出口公司出口一批花生制品,管理人員抽取50包為樣本,其平均數(shù)為250克。合同規(guī)定總體標(biāo)準(zhǔn)差為6克。問:(1)如果置信區(qū)間為:2502、2501.96,總體參數(shù)這一范圍的把握程度有多大?(2)若用90%的置信系數(shù),則該批食品平均重量是多少? 解:(1)a、25020.8485,與z=2對(duì)應(yīng)的置信度是:0.47722=95.44%;b、2501.960.8485,與z=1.96對(duì)應(yīng)的置信度是:0.475

6、02=95%。(2) 與90%對(duì)應(yīng)的Z值是,Z=(1.64+1.65)/2=1.645,置信區(qū)間:2501.645*0.8485,即該批食品的平均重量在248.6251.396克之間的把握程度是90%。課堂練習(xí)教材P144,1、2案例2:某茶葉進(jìn)出口公司,準(zhǔn)備處理一批庫(kù)存2年的茶葉,出庫(kù)之前要進(jìn)行一次檢驗(yàn)。檢驗(yàn)數(shù)據(jù)如下;樣本容量為64包,樣本平均數(shù)為每包2公斤,入庫(kù)記錄表明總體標(biāo)準(zhǔn)差為0.2公斤。經(jīng)理要求在95%的可信度下,估計(jì)一下這批茶葉的平均重量在多大范圍內(nèi)?解:答:這批茶葉平均重量在1.9512.049公斤,其可信程度為95%。(2)、總體標(biāo)準(zhǔn)差未知條件下的區(qū)間估計(jì)總體標(biāo)準(zhǔn)差未知條件下,

7、一般用樣本標(biāo)準(zhǔn)差S代替總體標(biāo)準(zhǔn)差。案例:某項(xiàng)抽樣調(diào)查中獲得如下資料: N可以視為無限總體,n=81,樣本平均數(shù)為500,樣本標(biāo)準(zhǔn)差為90,求:總體平均數(shù)可信度為90%的置信區(qū)間。解:答:此項(xiàng)調(diào)查中,總體平均數(shù)的可信度為90%的置信區(qū)間是在483.55516.45之間。 習(xí)題1:一次等級(jí)考試,因急于評(píng)估試題質(zhì)量,教師先隨機(jī)抽取36份試卷批改,平均分是72分,標(biāo)準(zhǔn)差13.2分,系主任要求在90%的可信度下,對(duì)全體考生的平均成績(jī)做一個(gè)區(qū)間估計(jì)。解:分習(xí)題2:某土產(chǎn)畜產(chǎn)公司收購(gòu)一批煙草,抽取30箱為樣本,平均重量為20公斤,標(biāo)準(zhǔn)差為3公斤。求:(1)置信度為95%時(shí),這批煙草的平均重量;(2)置信度為

8、80%時(shí),這批煙草的平均重量。解:(1) (2) 課后作業(yè):教材P145,32、小樣本條件下的區(qū)間估計(jì) 使用t分布的條件:當(dāng)樣本容量n30,且總體標(biāo)準(zhǔn)差未知時(shí),用樣本標(biāo)準(zhǔn)差S代替總體標(biāo)準(zhǔn)差。樣本標(biāo)準(zhǔn)差S計(jì)算公式:例1:從大學(xué)一年級(jí)學(xué)生中隨機(jī)抽取12名學(xué)生,其閱讀能力得分為28,32,36,22,34,30,33,25,31,33,29,26。試評(píng)估一下大學(xué)一年級(jí)學(xué)生閱讀能力的總體平均分?jǐn)?shù)。要求置信度分別是95%和99%。解:步驟:(1)計(jì)算樣本平均數(shù): (2)計(jì)算樣本標(biāo)準(zhǔn)差: (3)計(jì)算平均誤差:(4)確認(rèn)自由度:df=12-1=11,誤差概率:=1-0.95=0.05/2=0.025,查表,

9、t=2.201 (5)估計(jì)總體平均數(shù)置信區(qū)間:解釋:有95%的把握程度說大學(xué)一年級(jí)學(xué)生閱讀能力平均分?jǐn)?shù)在27.31132.523分之間。當(dāng)=1-0.99=0.01/2=0.005,查表,t=3.105829.917-3.10581.184=26.24;29.917+3.10581.184=33.59。習(xí)題2:一批出口商品出庫(kù)之前從中抽取14箱,其平均重量為40.5公斤,標(biāo)準(zhǔn)差0.5公斤。主管人員要求在98%的置信系數(shù)下,對(duì)這批商品的平均重量做個(gè)區(qū)間估計(jì)。置信系數(shù)為98%時(shí),這批商品的平均重量是40.14640.584公斤。習(xí)題3:某公司共有技術(shù)開發(fā)和中層管理人員600名,公司十分關(guān)心他們的身體

10、健康現(xiàn)狀,責(zé)成有關(guān)部門進(jìn)行了一次睡眠狀況抽樣調(diào)查,獲得資料如下表: (單位:小時(shí))員工每周睡眠 員工 每周睡眠 員工 每周睡眠 員工 每周睡眠序號(hào) 時(shí)間 序號(hào) 時(shí)間 序號(hào) 時(shí)間 序號(hào) 時(shí)間1 50 6 48 11 54 16 502 40 7 47 12 56 17 51 3 30 8 45 13 50 18 474 38 9 43 14 48 19 485 42 10 47 15 48 20 54 試以95%的置信系數(shù)對(duì)600名技術(shù)開發(fā)和中層管理人員平均每周的睡眠狀況作一個(gè)區(qū)間估計(jì)。解:課堂練習(xí):教材P145,4、5 小樣本比例的區(qū)間估計(jì)可參照平均數(shù)的區(qū)間估計(jì)。 不同條件下總體平均數(shù)的區(qū)間估

11、(P140)總體分布樣本容量已知未知正態(tài)分布大樣本(n30)小樣本(n30) 非正態(tài)分布大樣本(n30)(四)、總體比率的區(qū)間估計(jì) 中心極限定理證明:P不接近0或1,且n很大時(shí),其抽樣分布趨近于正態(tài)分布。比例抽樣分布的平均誤差為: 總體比率的估計(jì)區(qū)間:是總體比率;P是樣本比率。若未知,可用P。案例1:為適應(yīng)清理整頓要求,某地審計(jì)局要對(duì)本地公司進(jìn)行查賬,主管負(fù)責(zé)人估計(jì)查賬對(duì)象中有40%的人會(huì)響應(yīng)這一要求,如果向一個(gè)包括45個(gè)單位的隨機(jī)樣本寄去要求查賬的通知單,審計(jì)局希望通過這一樣本估計(jì)一下置信度為95%時(shí),包含總體實(shí)際比例的區(qū)間有多大。解:習(xí)題1:某西部人才咨詢部門收到大批申請(qǐng)去西部工作的信函,

12、人力資源管理部門想了解被錄用的比例,從中抽取500人,發(fā)現(xiàn)只有76人被錄用?,F(xiàn)要求使用95%的可信度,對(duì)總體比例做一個(gè)區(qū)間估計(jì)。解:習(xí)題2:某私營(yíng)企業(yè)為提高業(yè)務(wù)人員的業(yè)務(wù)能力,在擬訂一項(xiàng)培訓(xùn)計(jì)劃之前,對(duì)一個(gè)由300名員工組成的隨機(jī)樣本進(jìn)行測(cè)試,結(jié)果發(fā)現(xiàn)參加測(cè)試人員中只有75人達(dá)到要求。主管人員要求在置信度為99%的條件下,作一個(gè)區(qū)間估計(jì)。解:習(xí)題3:為了研究我國(guó)真絲制品的銷路,在紐約舉辦的我國(guó)紡織品展銷會(huì)上,對(duì)1000名成人進(jìn)行了抽樣調(diào)查,其中有600人我國(guó)的喜歡真絲制品。試以95%的置信系數(shù)確定紐約市民成人喜歡真絲制品的比率的置信區(qū)間。課堂練習(xí):教材P145,6、7(1)二、兩個(gè)總體的參數(shù)估

13、計(jì)(一)什么是來自兩個(gè)總體的獨(dú)立樣本?案例:假定某零售集團(tuán)公司有兩個(gè)連鎖超市:一個(gè)位于市中心鬧市區(qū),另一個(gè)位于市郊的居民小區(qū)。銷售經(jīng)理發(fā)現(xiàn),在其中一個(gè)超市暢銷的W商品在另一超市卻可能滯銷。銷售經(jīng)理認(rèn)為出現(xiàn)這種情況的原因,主要在于這兩個(gè)地區(qū)的消費(fèi)者群體的自身差異。例如包括消費(fèi)者群體的可支配收入差異、受教育程度差異、年齡差異、以及工作性質(zhì)等方面的差異。因此,銷售經(jīng)理想估計(jì)一下兩個(gè)超市的消費(fèi)者群體的平均可支配收入差異有多大。設(shè)總體A:為位于市郊居民小區(qū)的消費(fèi)者群體;設(shè)總體B:為位于市中心鬧市區(qū)的消費(fèi)者群體;A總體A的平均數(shù)(指市郊居民小區(qū)消費(fèi)者群體的人均可支配收入)B總體B的平均數(shù)(指市中心鬧市區(qū)消

14、費(fèi)者群體的人均可支配收入)于是,這兩個(gè)不同總體的平均數(shù)之差可以表示為:AB為了估計(jì)這兩個(gè)不同總體的平均數(shù)之差A(yù)B,現(xiàn)在從總體A中抽取一個(gè)簡(jiǎn)單隨機(jī)樣本n1,從總體B中抽取另一個(gè)簡(jiǎn)單隨機(jī)樣本n2。由于這兩個(gè)簡(jiǎn)單隨機(jī)樣本都是獨(dú)立抽取的,因此我們稱其為“獨(dú)立簡(jiǎn)單隨機(jī)樣本”,簡(jiǎn)稱“獨(dú)立樣本”。由兩個(gè)獨(dú)立樣本分別計(jì)算出兩個(gè)樣本平均數(shù)為:1:n1名市郊居民小區(qū)消費(fèi)者群體的人均可支配收入2:n2名市中心鬧市區(qū)消費(fèi)者群體的人均可支配收入因?yàn)槭茿的點(diǎn)估計(jì)值,是B的點(diǎn)估計(jì)值,因此,兩個(gè)總體平均數(shù)之差的點(diǎn)估計(jì)值表示為: 12 假定根據(jù)上述兩個(gè)獨(dú)立隨機(jī)樣本計(jì)算的有關(guān)數(shù)據(jù)如下表:連鎖超市隨機(jī)樣本個(gè)數(shù)人均可支配收入樣本標(biāo)準(zhǔn)

15、差市郊居民小區(qū)A市中心鬧市區(qū)B648112100元21800元S1950元 S2780元將上述數(shù)據(jù)代入公式求得兩個(gè)總體平均可支配收入之差的一個(gè)點(diǎn)估計(jì)值為:1221001800 = 300(元)(二)兩個(gè)總體均值之差的估計(jì):獨(dú)立樣本1、12抽樣分布的性質(zhì)與區(qū)間估計(jì)在上例中,兩個(gè)總體平均可支配收入之差為300元是唯一的嗎?顯然不是,是隨機(jī)的。因?yàn)閮蓚€(gè)樣本都是隨機(jī)的,正如所有的點(diǎn)估計(jì)值一樣,300元之差也只是兩個(gè)總體平均可支配收入之差的很多可能的點(diǎn)估計(jì)值中的其中之一。假如選擇了另外一個(gè)由64位市中心鬧市區(qū)消費(fèi)者,和另外一個(gè)由81位市郊居民小區(qū)消費(fèi)者構(gòu)成的兩個(gè)隨機(jī)樣本,這兩個(gè)樣本平均數(shù)之差就完全有可能

16、不等于300元。由此可見,12的抽樣分布,其實(shí)就是兩個(gè)樣本所有可能的樣本平均數(shù)之差的一個(gè)概率分布。數(shù)理統(tǒng)計(jì)理論證明,當(dāng)兩個(gè)總體均服從正態(tài)分布時(shí),12也服從正態(tài)分布,即使兩個(gè)總體不服從正態(tài)分布,只要被抽出的兩個(gè)隨機(jī)樣本互相獨(dú)立,并且樣本容量足夠大(n30),根據(jù)中心極限定理,樣本平均數(shù)之差12的抽樣分布同樣逼近正態(tài)分布,12的抽樣分布具有如下性質(zhì):12抽樣分布的平均數(shù):E(12)12 12抽樣分布的標(biāo)準(zhǔn)差: (n30) 12 122、大樣本且1和2已知條件下兩個(gè)總體均值(12)的區(qū)間估計(jì)在大樣本(n130,n230)條件下,并且1和2已知時(shí),兩個(gè)總體平均數(shù)之差的區(qū)間估計(jì)可用如下公式計(jì)算(置信度為

17、1):(12)z/212 或兩個(gè)總體平均數(shù)之差的估計(jì)區(qū)間為:(12)z/2 案例:在本章的引例中,假定從以往資料中獲知總體A的標(biāo)準(zhǔn)差為520元,總體B的標(biāo)準(zhǔn)差為430元,統(tǒng)計(jì)數(shù)據(jù)見下表:連 鎖超 市隨機(jī)樣本個(gè)數(shù)人均可支配收入總體標(biāo)準(zhǔn)差市郊居民小區(qū)A市中心鬧市區(qū)Bn1=64n2=8112100元21800元1520元 2430元以95%的置信度建立兩個(gè)總體平均數(shù)之差的估計(jì)區(qū)間。解:將表中有關(guān)數(shù)據(jù)代入公式,1-=95%(12)z a/2(n130,n230, z=1.96)=(21001800)1.96=3001.9680.67下限=300158.29 = 141.71(元)下限=300 + 15

18、8.29 = 458.11(元)計(jì)算結(jié)果表明,有95%的可信度認(rèn)為兩個(gè)總體平均數(shù)之差在141.71(元)到458.11(元)之間。3、大樣本且1和2未知時(shí)下12的區(qū)間估計(jì)中心極限定理證明:無論總體呈現(xiàn)何種分布,只要樣本容量足夠大,其抽樣分布的形態(tài)都趨近于正態(tài)分布。因此,當(dāng)n130、n230,1和2未知時(shí),可以用樣本標(biāo)準(zhǔn)差代替總體標(biāo)準(zhǔn)差作為12的估計(jì)值。 兩個(gè)總體平均數(shù)之差的估計(jì)區(qū)間為: (12)z a/2S12 連鎖超市隨機(jī)樣本個(gè)數(shù)人均可支配收入樣本標(biāo)準(zhǔn)差市郊居民小區(qū)A市中心鬧市區(qū)B648112100元21800元S1950元 S2780元以前題為例,將上表數(shù)據(jù)分別代入公式(12)z a/2(

19、z=1.96)=(21001800)1.96=3001.96147下限=300288.12 = 11.88(元)下限=300 + 288.12 = 588.12(元)計(jì)算結(jié)果表明,有95%的可信度認(rèn)為兩個(gè)總體平均數(shù)之差在11.88(元)到588.12(元)之間。習(xí)題:P145,9(1)(12)z a/2(z=1.96)(2523)1.9621.176 (0.8243.176)TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT(三)、小樣本條件下12的區(qū)間估計(jì)兩個(gè)總體小樣本條件下的區(qū)間估計(jì),需要作兩個(gè)假設(shè):(1)兩個(gè)總體都服從正態(tài)分布。(2)兩個(gè)總體方差相等(1222)。

20、中心極限定理證明:12的期望值是12。由于方差相等的假設(shè),公式可修改如下:122已知如果總體方差2已知,可以用以上公式進(jìn)行兩個(gè)總體均值之差的區(qū)間估計(jì)。但是,通常情況下總體方差2是未知的,于是必須使用兩個(gè)樣本方差來對(duì)總體方差2進(jìn)行估計(jì)。由于以上公式的假設(shè)前提是兩個(gè)總體方差相等1222,因此,這里不必再分別估計(jì)12和22。在實(shí)際應(yīng)用時(shí),往往將來自兩個(gè)總體的兩個(gè)樣本數(shù)據(jù)加以組合,從而得到2的最優(yōu)估計(jì)值。在這里之所以將來自兩個(gè)總體的兩個(gè)樣本數(shù)據(jù)合并,是因?yàn)閱为?dú)使用兩個(gè)樣本數(shù)據(jù)的任何一個(gè)都不太合適。2的合并估計(jì)值是兩個(gè)樣本方差的加權(quán)平均,也叫共同方差,記做S2。共同方差的公式如下: S2 = 使用2的合

21、并估計(jì)值S2,就可以將公式12修改為公式:12= 依據(jù)前面理論,可以用t分布來推算兩個(gè)總體平均數(shù)之差的區(qū)間估計(jì)。由于來自總體1的樣本對(duì)應(yīng)n11個(gè)自由度,來自總體2的樣本對(duì)應(yīng)n21個(gè)自由度,因而,此t分布對(duì)應(yīng)的自由度為n1n22,當(dāng)自由度為(n1n22),置信系數(shù)為1時(shí),兩個(gè)總體平均數(shù)之差的估計(jì)區(qū)間為: (12)ta/2 案例:某銀行想了解下屬兩個(gè)支行的平均帳戶余額之差的情況。抽樣結(jié)果兩個(gè)支行的客戶帳戶余額的獨(dú)立隨機(jī)樣本資料如下:支行名稱客戶帳戶數(shù)樣本平均余額樣本標(biāo)準(zhǔn)差NCBL121011000元2920元S1150元S2120元求出兩個(gè)支行平均帳戶余額之差的90的置信區(qū)間。假設(shè)兩個(gè)支行的帳戶余

22、額都服從正態(tài)分布且方差相等。利用以上公式得到總體方差的合并估計(jì)值為:S21885512的相應(yīng)估計(jì)值為:S12t分布之自由度為n1n221210220。0.10 ta/2=t0.051.7247。于是可得區(qū)間估計(jì)為:12ta/2S121 0009201.724758.7980101.4 (-21.4元,181.4元)在90的置信度下,兩個(gè)支行平均帳戶余額之差的區(qū)間估計(jì)為-21.4元至181.4元之間。該區(qū)間包含負(fù)值的事實(shí)意味著兩個(gè)均值之差的實(shí)際值12可能是負(fù)的。因此2可能比1大,這意味著盡管抽樣表明BL支行有較大的樣本余額均值,NC支行的總體均值反而有可能更大些。置信區(qū)間包含0的事實(shí)可以這樣解釋

23、:我們沒有足夠的證據(jù)得出兩個(gè)支行的總體平均帳戶余額有差異的結(jié)論。本節(jié)介紹的樣本方法中使用t分布是基于假設(shè)兩個(gè)總體都服從正態(tài)概論分布且1222的。事實(shí)上,該方法是穩(wěn)健的統(tǒng)計(jì)方法,就是說它對(duì)上假設(shè)相對(duì)不敏感。比如當(dāng)1222時(shí),該方法在n1和n2比較接近時(shí)也可以得到較好結(jié)果。習(xí)題1:P158,8;P158,9(2)、(4)P158,8。當(dāng)1=90%時(shí),df=14+7-2=19;t/2=1.7291S298.4421S1212ta/2S12(53.243.4)1.72914.5939.87.9418 (1.858217.7418)當(dāng)1=95%時(shí),df=14+7-2=19;t/2=2.0939.82.0

24、934.593 (0.186719.4133)P158,9(2)23.986P158,9(4)23.587【】(三)、兩個(gè)總體均值之差的估計(jì):匹配樣本(成對(duì)樣本)匹配樣本方案:假設(shè)某制造公司有兩種方法供員工執(zhí)行某生產(chǎn)任務(wù)務(wù)使用。以1記生產(chǎn)方法1的平均完成時(shí)間,2記生產(chǎn)方法2的平均完成時(shí)間。抽取工人的一個(gè)簡(jiǎn)單隨機(jī)樣本,每個(gè)工人先用一種方法,后用另一種方法,兩種方法的次序是隨機(jī)排列的。每個(gè)工人提供一對(duì)數(shù)據(jù):一個(gè)是方法1的,一個(gè)是方法2的。在匹配樣本方案中,兩種生產(chǎn)法是在相似條件下被檢驗(yàn)的(即由同一工人執(zhí)行),所以該方案往往產(chǎn)生比獨(dú)立樣本方案更小的抽樣誤差。這主要是由于匹配樣本方案中,作為抽樣誤差來

25、源之一的工人個(gè)體之間的差別被去掉了。案例:現(xiàn)有6個(gè)工人組成的隨機(jī)樣本。6個(gè)工人完成時(shí)間的數(shù)據(jù)見下表。每個(gè)工人提供一對(duì)數(shù)據(jù)。最后一列為樣本中每個(gè)工人完成時(shí)間之差di。匹配樣本方案的任務(wù)完成時(shí)間工人方法1的完成時(shí)間分鐘方法2的完成時(shí)間分鐘完成時(shí)間的差值(di)16.05.40.6234565.07.06.26.06.45.26.55.96.05.8-0.20.50.30.00.6表中6個(gè)差值的樣本均值與樣本標(biāo)準(zhǔn)差如下: Sd = 兩總體的均值差的估計(jì)區(qū)間:df=n-1 ;1-=95%,t0.05/2(5)=2.5706 0.3 ; 0.30.35于是兩種生產(chǎn)方法均值差的95的置信區(qū)間估計(jì)為0.05

26、到0.65分鐘。特別提醒:本例子的樣本容量為6個(gè)工人,屬于小樣本情形。在假設(shè)檢驗(yàn)與區(qū)間估計(jì)中都使用了t分布。如果樣本容量較大(n30),統(tǒng)計(jì)推斷可以使用標(biāo)準(zhǔn)正態(tài)概率分布的z值。練習(xí)1:下面為取自兩總體的匹配樣本數(shù)據(jù):總 體個(gè)體121212022826318184202052624a、計(jì)算每對(duì)個(gè)體的差值。b、計(jì)算。c、計(jì)算標(biāo)準(zhǔn)差Sd。d、在0.05時(shí), 估計(jì)區(qū)間是多少?練習(xí)2:下面為取自兩總體的匹配樣本數(shù)據(jù)???體個(gè)體1211182783964127513106151571514a計(jì)算每對(duì)個(gè)體的差值。b計(jì)算。c計(jì)算標(biāo)準(zhǔn)差Sd。d兩總體均值差的點(diǎn)估計(jì)量是多少?e給出兩總體均值差的95的置信區(qū)間。練

27、習(xí)3:教材P145,10練習(xí)4:見提綱(四)兩個(gè)總體比率之差的區(qū)間估計(jì)1兩個(gè)總體是獨(dú)立的(獨(dú)立樣本)假定條件: 1兩個(gè)總體服從二項(xiàng)分布1可以用正態(tài)分布來近似4兩個(gè)總體比例之差P1-P2在1-a的置信水平下的置信區(qū)間為:綠色綠色健康飲品案例:【某飲料公司對(duì)其所做的電視廣告在兩個(gè)城市的效果進(jìn)行了比較,它們從兩個(gè)城市中分別隨機(jī)地調(diào)查了1000個(gè)成年人,其中看過廣告的比例分別為p1= 0.18和p2= 0.14。試求兩城市成年人中看過廣告的比例之差的95%的置信區(qū)間?!拷?已知 p1=0.18,p2=0.14,1-a=0.95,n1= n2=1000P1- P2置信度為95%的置信區(qū)間為:有95%的把握估計(jì)兩城市成年人中看過該廣告的比例之差在0.79% 7.21%之間習(xí)題1:P146,11;習(xí)題2:提綱P4(二)1。(五)樣本容量的確定 在實(shí)際工作和理論研究中,我們總希望有一個(gè)比較恰當(dāng)?shù)臉颖救萘?,使之既可以取得足夠的信息,又不至于在搜集過多樣本時(shí)造成浪費(fèi)和麻煩。1、已知條件下,n的確定:案例:某公司要對(duì)下一年職工醫(yī)療費(fèi)情況作個(gè)預(yù)算,通常醫(yī)療費(fèi)的為120元?,F(xiàn)要求在95%的置信度下,保證所估計(jì)的總體平均數(shù)在加減

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論