統(tǒng)計(jì)學(xué)-參數(shù)估計(jì)_第1頁(yè)
統(tǒng)計(jì)學(xué)-參數(shù)估計(jì)_第2頁(yè)
統(tǒng)計(jì)學(xué)-參數(shù)估計(jì)_第3頁(yè)
統(tǒng)計(jì)學(xué)-參數(shù)估計(jì)_第4頁(yè)
統(tǒng)計(jì)學(xué)-參數(shù)估計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩115頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

參數(shù)估計(jì)第一節(jié)抽樣與抽樣分布第二節(jié)點(diǎn)估計(jì)與區(qū)間估計(jì)第三節(jié)總體均值的區(qū)間估計(jì)第四節(jié)總體比率的區(qū)間估計(jì)第五節(jié)總體方差的區(qū)間估計(jì)第六節(jié)兩總體均值差、比率差的估計(jì)第七節(jié)做參數(shù)估計(jì)的樣本容量第一節(jié)抽樣與抽樣分布一、為什么要抽樣不得不抽樣的情形:消耗性、破壞性的檢驗(yàn)試驗(yàn),無(wú)限總體;可以全面調(diào)查但最好是抽樣的情形:經(jīng)濟(jì)、時(shí)間、能力、準(zhǔn)確性等。第一節(jié)抽樣與抽樣分布二、怎樣抽樣如果可能,應(yīng)使用概率抽樣方法;自有限總體抽樣和自無(wú)限總體抽樣所使用的方法有所不同。第一節(jié)抽樣與抽樣分布自有限總體抽樣:從全校8000名學(xué)生中選取40名,組成一個(gè)隨機(jī)樣本。首先將全部學(xué)生編號(hào)0001至8000,然后利用隨機(jī)數(shù)表確定樣本單位。63271

59986

71744

51102

15141

8071488547

09896

95436

79115

08303

0104155957

57243

83865

09911

19761

6653546276

87453

44790

67122

45573

8435855363

07449

34835

15290

76616

67191第一節(jié)抽樣與抽樣分布自無(wú)限總體中抽樣:從某日早8點(diǎn)到晚8點(diǎn)來(lái)某加油站加油的汽車(chē)中選取若干臺(tái),組成一個(gè)隨機(jī)樣本。方法:可以考慮每累計(jì)若干個(gè)單號(hào)(或雙號(hào))車(chē)牌后,下一輛車(chē)就是被選中的樣本單位。注意:此時(shí)不可能對(duì)全部來(lái)加油的汽車(chē)編號(hào);此時(shí)要保證的是兩點(diǎn):第一,所有樣本單位來(lái)自于同一總體;第二,各樣本單位的選取要相互獨(dú)立。第一節(jié)抽樣與抽樣分布三、關(guān)于抽樣分布樣本統(tǒng)計(jì)量所有可能值構(gòu)成的概率分布稱(chēng)為抽樣分布;樣本統(tǒng)計(jì)量的抽樣分布是一個(gè)總體的范疇,具有相應(yīng)的參數(shù),如均值、標(biāo)準(zhǔn)差等;抽樣分布的知識(shí)和性質(zhì)使我們能夠?qū)颖窘y(tǒng)計(jì)量與相應(yīng)的總體參數(shù)的接近程度做一個(gè)概率度量。第一節(jié)抽樣與抽樣分布可能的樣本數(shù)量往往是一個(gè)天文數(shù)字。因此樣本統(tǒng)計(jì)量的所有可能值通常是無(wú)法一一列舉的。以413名學(xué)生的考試成績(jī)?yōu)槔喝绻床恢貜?fù)抽樣的方法從中抽取容量為30人的樣本,則可能的樣本數(shù)量m為:因?yàn)槊總€(gè)樣本都有1個(gè)均值,則所有可能的均值約為385580億億億億億個(gè)。第一節(jié)抽樣與抽樣分布如果真的計(jì)算出了所有385580億億億億億個(gè)樣本均值,則這些樣本均值所構(gòu)成的分布,就是“樣本均值的抽樣分布”。這個(gè)抽樣分布也有兩個(gè)參數(shù):均值和標(biāo)準(zhǔn)差;樣本統(tǒng)計(jì)量的抽樣分布是我們進(jìn)行統(tǒng)計(jì)推斷的依據(jù)。問(wèn)題是我們根本無(wú)法將全部可能的樣本都抽選出來(lái),因此,需要記住相關(guān)的理論推導(dǎo)結(jié)論第一節(jié)抽樣與抽樣分布例如,在大樣本情況下,樣本均值的抽樣分布為:μ這個(gè)抽樣分布就成為對(duì)未知的總體均值進(jìn)行推斷的基礎(chǔ)。第一節(jié)抽樣與抽樣分布實(shí)際工作中我們只有一個(gè)樣本均值,根據(jù)其抽樣分布,我們知道它一定在總體均值的附近,有95%的可能距待估計(jì)總體均值的距離在1.96倍標(biāo)準(zhǔn)誤之內(nèi)(想一想為什么?)。μ第一節(jié)抽樣與抽樣分布如果我們說(shuō)這個(gè)樣本均值就等于待估計(jì)的總體均值,可能很準(zhǔn)確,也可能很不“靠譜”(想一想為什么?)。μ第一節(jié)抽樣與抽樣分布如果我們以樣本均值為中心、以1.96倍標(biāo)準(zhǔn)誤為半徑構(gòu)造一個(gè)區(qū)間,并說(shuō)待估計(jì)的總體均值在這個(gè)區(qū)間之內(nèi),則估計(jì)的可靠程度為95%(想一想為什么?)。μ第一節(jié)抽樣與抽樣分布一個(gè)實(shí)際例子:從413個(gè)考試分?jǐn)?shù)中抽樣。第一節(jié)抽樣與抽樣分布按不重復(fù)抽樣的方法,從總體中隨機(jī)抽取30名學(xué)生,即n=30,共抽取510個(gè)樣本,并計(jì)算相關(guān)樣本統(tǒng)計(jì)量:510個(gè)樣本均值的分布情況510個(gè)樣本中位數(shù)的分布情況510個(gè)樣本眾數(shù)的分布情況第一節(jié)抽樣與抽樣分布對(duì)比一下總體參數(shù)與樣本統(tǒng)計(jì)量的統(tǒng)計(jì)結(jié)果:總體均值72.2663分樣本均值的均值72.5559分第一節(jié)抽樣與抽樣分布總體方差和標(biāo)準(zhǔn)差分別為421.468分2和20.529分2樣本均值的方差和標(biāo)準(zhǔn)差分別為14.074分2和3.75154分對(duì)比一下總體參數(shù)與樣本統(tǒng)計(jì)量的統(tǒng)計(jì)結(jié)果:第一節(jié)抽樣與抽樣分布510個(gè)樣本相對(duì)于385580億億億億億個(gè)樣本而言小得可憐,但其計(jì)算結(jié)果已經(jīng)非常接近推導(dǎo)的結(jié)論。第一節(jié)抽樣與抽樣分布

510個(gè)樣本方差的分布情況:510個(gè)樣本方差的均值為405.673,接近總體方差水平(421.468)第一節(jié)抽樣與抽樣分布

510個(gè)樣本標(biāo)準(zhǔn)差的分布情況:510個(gè)樣本標(biāo)準(zhǔn)差的均值為19.8391,接近總體標(biāo)準(zhǔn)差水平(20.5297)第二節(jié)點(diǎn)估計(jì)與區(qū)間估計(jì)1.點(diǎn)估計(jì)及特征直接以樣本統(tǒng)計(jì)量作為待估計(jì)的總體參數(shù)的估計(jì)值,就是點(diǎn)估計(jì);點(diǎn)估計(jì)最大的好處是簡(jiǎn)便、具體,最大的問(wèn)題是無(wú)從得知估計(jì)的準(zhǔn)確程度;因此,除非有特別的需求,一般不使用點(diǎn)估計(jì)。估計(jì)的基礎(chǔ):德國(guó)坦克從1開(kāi)始連續(xù)編號(hào)估計(jì)的樣本:戰(zhàn)斗中繳獲的部分坦克(編號(hào))估計(jì)方法:以樣本均值或最大編號(hào)估計(jì)總體均值或最大編號(hào)估計(jì)的結(jié)果:與真實(shí)數(shù)量相當(dāng)接近點(diǎn)估計(jì)的應(yīng)用舉例:德軍有多少坦克?第二節(jié)點(diǎn)估計(jì)與區(qū)間估計(jì)2.估計(jì)量的優(yōu)良標(biāo)準(zhǔn)無(wú)偏:估計(jì)量的均值等于待估計(jì)的總體參數(shù);有效:具有較小的估計(jì)誤差;一致:估計(jì)誤差隨樣本容量增大而減少。第二節(jié)點(diǎn)估計(jì)與區(qū)間估計(jì)第二節(jié)點(diǎn)估計(jì)與區(qū)間估計(jì)2.估計(jì)量的優(yōu)良標(biāo)準(zhǔn)應(yīng)當(dāng)記住的主要結(jié)論:3.區(qū)間估計(jì):因?yàn)辄c(diǎn)估計(jì)存在缺陷,于是我們使用另一種所謂“區(qū)間估計(jì)”的方法,即在點(diǎn)估計(jì)值的基礎(chǔ)上構(gòu)造一個(gè)區(qū)間,給出總體均值在“多少到多少之間”的結(jié)論;區(qū)間估計(jì)結(jié)果是一種概率判斷,即我們可以確定估計(jì)準(zhǔn)確的概率,稱(chēng)為“置信度”,估計(jì)的區(qū)間也就稱(chēng)為“置信區(qū)間”;置信區(qū)間與置信度成正比。第二節(jié)點(diǎn)估計(jì)與區(qū)間估計(jì)0.68270.95450.9973根據(jù)中心極限定理,樣本均值的抽樣分布服從正態(tài)分布。正態(tài)分布概率密度曲線(xiàn)下的面積既是概率,又是估計(jì)的置信度,可以計(jì)算。對(duì)總體均值區(qū)間估計(jì)的圖示:第二節(jié)點(diǎn)估計(jì)與區(qū)間估計(jì)0.68270.95450.9973從概率計(jì)算的角度講,由于不能計(jì)算一點(diǎn)所對(duì)應(yīng)的概率,因此就無(wú)法確定點(diǎn)估計(jì)的置信度。第二節(jié)點(diǎn)估計(jì)與區(qū)間估計(jì)0.68270.95450.9973第二節(jié)點(diǎn)估計(jì)與區(qū)間估計(jì)如果以點(diǎn)估計(jì)值為中心,以一定的標(biāo)準(zhǔn)誤為半徑構(gòu)造一張“網(wǎng)”,則根據(jù)這張“網(wǎng)”所做的估計(jì)就是區(qū)間估計(jì)。區(qū)間估計(jì)可以確定估計(jì)的置信度。0.68270.95450.9973第二節(jié)點(diǎn)估計(jì)與區(qū)間估計(jì)當(dāng)“網(wǎng)”的半徑為1倍標(biāo)準(zhǔn)誤時(shí),估計(jì)的置信度為68.27%。因?yàn)槿康木W(wǎng)中有68.27%可以網(wǎng)住總體均值,其他的網(wǎng)則網(wǎng)不住總體均值。0.68270.95450.9973第二節(jié)點(diǎn)估計(jì)與區(qū)間估計(jì)當(dāng)“網(wǎng)”的半徑為1倍標(biāo)準(zhǔn)誤時(shí),估計(jì)的置信度為68.27%。因?yàn)槿康木W(wǎng)中有68.27%可以網(wǎng)住總體均值,其他的網(wǎng)則網(wǎng)不住總體均值。例如這個(gè)0.68270.95450.9973第二節(jié)點(diǎn)估計(jì)與區(qū)間估計(jì)當(dāng)“網(wǎng)”的半徑為2倍標(biāo)準(zhǔn)誤時(shí),估計(jì)的置信度上升到95.45%。但還是有約5%的網(wǎng)網(wǎng)不住總體均值。0.68270.95450.9973第二節(jié)點(diǎn)估計(jì)與區(qū)間估計(jì)當(dāng)“網(wǎng)”的半徑為2倍標(biāo)準(zhǔn)誤時(shí),估計(jì)的置信度上升到95.45%。但還是有約5%的網(wǎng)網(wǎng)不住總體均值。例如這個(gè)0.68270.95450.9973第二節(jié)點(diǎn)估計(jì)與區(qū)間估計(jì)當(dāng)“網(wǎng)”的半徑為3倍標(biāo)準(zhǔn)誤時(shí),估計(jì)的置信度上升到99.73%。這時(shí),網(wǎng)不住總體均值的網(wǎng)已經(jīng)寥寥無(wú)幾。0.68270.95450.9973如果樣本均值偏離總體均值很遠(yuǎn),即使網(wǎng)做得大,也可能網(wǎng)不住總體均值。第二節(jié)點(diǎn)估計(jì)與區(qū)間估計(jì)當(dāng)“網(wǎng)”的半徑為3倍標(biāo)準(zhǔn)誤時(shí),估計(jì)的置信度上升到99.73%。這時(shí),網(wǎng)不住總體均值的網(wǎng)已經(jīng)寥寥無(wú)幾。第二節(jié)點(diǎn)估計(jì)與區(qū)間估計(jì)0.68270.95450.9973實(shí)際工作中只有一張網(wǎng),半徑通常為1.96倍標(biāo)準(zhǔn)誤。由此構(gòu)造的是總體均值95%的置信區(qū)間,或者說(shuō)估計(jì)總體均值在此區(qū)間內(nèi)的置信度為95%。該怎樣理解?從屬于此類(lèi)網(wǎng)的概率為95%從屬于此類(lèi)網(wǎng)的概率為5%總結(jié):區(qū)間估計(jì)是以點(diǎn)估計(jì)值為中心構(gòu)造一個(gè)區(qū)間,同時(shí)對(duì)該區(qū)間是否包含了待估計(jì)的總體參數(shù)做概率判斷;其他條件不變的情況下,要求的置信度越高,區(qū)間就越大、估計(jì)精度越低;我們要在置信度和估計(jì)精度中做平衡選擇,通常將置信度定為95%。第二節(jié)點(diǎn)估計(jì)與區(qū)間估計(jì)第三節(jié)總體均值的區(qū)間估計(jì)n是否為大樣本是否已知是否正態(tài)總體是否已知用S估計(jì)是是是是否否否否增大樣本容量到30以上用S估計(jì)傳統(tǒng)的估計(jì)方法選擇關(guān)于估計(jì)總體均值的大樣本和小樣本:

大樣本:n≥30

小樣本:n<30

注意:小樣本情況下,只有總體是正態(tài)的,樣本均值的抽樣分布才服從正態(tài)分布。因此,小樣本分析要設(shè)置條件:總體服從正態(tài)分布。問(wèn)題:怎樣才能知道總體是否服從正態(tài)分布?第三節(jié)總體均值的區(qū)間估計(jì)關(guān)于總體方差已知和未知:

總體方差已知,可直接代入公式使用;

總體方差未知,則需要使用樣本方差來(lái)估計(jì)總體方差,這時(shí),標(biāo)準(zhǔn)化結(jié)果得到的是t統(tǒng)計(jì)量。

手工做題需要借助于數(shù)據(jù)表等工具;如果使用SPSS軟件處理數(shù)據(jù),則無(wú)需考慮這個(gè)問(wèn)題,因?yàn)橄到y(tǒng)視所處理的數(shù)據(jù)為樣本數(shù)據(jù),總體參數(shù)都是未知的,包括方差。第三節(jié)總體均值的區(qū)間估計(jì)第三節(jié)總體均值的區(qū)間估計(jì)n是否為大樣本是否已知是否正態(tài)總體是否已知用S估計(jì)是是是是否否否否增大樣本容量到30以上用S估計(jì)傳統(tǒng)的估計(jì)方法選擇對(duì)于給定的顯著性水平α,有:第三節(jié)總體均值的區(qū)間估計(jì)n是否為大樣本是否已知是否正態(tài)總體是否已知用S估計(jì)是是是是否否否否增大樣本容量到30以上用S估計(jì)傳統(tǒng)的估計(jì)方法選擇去掉絕對(duì)值符號(hào),有:整理不等式,有:第三節(jié)總體均值的區(qū)間估計(jì)n是否為大樣本是否已知是否正態(tài)總體是否已知用S估計(jì)是是是是否否否否增大樣本容量到30以上用S估計(jì)傳統(tǒng)的估計(jì)方法選擇可見(jiàn),總體均值置信度為1-α的置信區(qū)間是:即:第三節(jié)總體均值的區(qū)間估計(jì)n是否為大樣本是否已知是否正態(tài)總體是否已知用S估計(jì)是是是是否否否否增大樣本容量到30以上用S估計(jì)傳統(tǒng)的估計(jì)方法選擇如果以s估計(jì)σ,則有:相應(yīng)地,總體均值的1-α置信區(qū)間為:第三節(jié)總體均值的區(qū)間估計(jì)n是否為大樣本是否已知是否正態(tài)總體是否已知用S估計(jì)是是是是否否否否增大樣本容量到30以上用S估計(jì)傳統(tǒng)的估計(jì)方法選擇注意:

傳統(tǒng)條件下,小樣本的tα/2(n-1)值可以查表得到,大樣本(n≥30)的tα/2(n-1)值通常查不到。因樣本容量越大,t

分布越接近標(biāo)準(zhǔn)正態(tài)分布,所以,大樣本情況下一般用Z

統(tǒng)計(jì)量代替t

統(tǒng)計(jì)量。

現(xiàn)在這個(gè)問(wèn)題已經(jīng)得到解決。第三節(jié)總體均值的區(qū)間估計(jì)n是否為大樣本是否已知是否正態(tài)總體是否已知用S估計(jì)是是是是否否否否增大樣本容量到30以上用S估計(jì)傳統(tǒng)的估計(jì)方法選擇0.68270.95450.9973Z0.1587=1Z0.02275=2Z0.00135=3第三節(jié)總體均值的區(qū)間估計(jì)n是否為大樣本是否已知是否正態(tài)總體是否已知用S估計(jì)是是是是否否否否增大樣本容量到30以上用S估計(jì)傳統(tǒng)的估計(jì)方法選擇Z0.025=1.960.95第三節(jié)總體均值的區(qū)間估計(jì)例:由532名《商業(yè)周刊》訂閱者組成的樣本表明,其每周使用因特網(wǎng)的平均時(shí)間為6.7小時(shí)。如果總體標(biāo)準(zhǔn)差為5.8小時(shí),求該周刊訂閱者總體每周平均花費(fèi)在因特網(wǎng)上時(shí)間的95%置信區(qū)間。第三節(jié)總體均值的區(qū)間估計(jì)例:某機(jī)場(chǎng)隨機(jī)抽取50名旅客為該機(jī)場(chǎng)服務(wù)質(zhì)量評(píng)級(jí),結(jié)果為:均值6.32,標(biāo)準(zhǔn)差2.31。試估計(jì)旅客總體對(duì)該機(jī)場(chǎng)評(píng)級(jí)99%的置信區(qū)間。第三節(jié)總體均值的區(qū)間估計(jì)使用Excel查找t值:第三節(jié)總體均值的區(qū)間估計(jì)使用Excel查找t值:第四節(jié)總體比率的區(qū)間估計(jì)樣本比率的抽樣分布:當(dāng)np≥5并且n(1-p)≥5時(shí),樣本比率p

的抽樣分布近似服從正態(tài)概率分布,即:用樣本標(biāo)準(zhǔn)差代替總體標(biāo)準(zhǔn)差做標(biāo)準(zhǔn)化變換,有:第四節(jié)總體比率的區(qū)間估計(jì)對(duì)于給定的顯著性水平α,有:整理不等式,有:第四節(jié)總體比率的區(qū)間估計(jì)即:總體比率Π

的1-α置信區(qū)間為:第四節(jié)總體比率的區(qū)間估計(jì)例:某校一個(gè)由413名大學(xué)生組成的樣本中,277名學(xué)生沒(méi)有宗教信仰。試估計(jì)該校全部學(xué)生中無(wú)宗教信仰比率的95%置信區(qū)間。解:根據(jù)已知條件,有:即:樣本比率的抽樣分布近似地服從正態(tài)分布。第四節(jié)總體比率的區(qū)間估計(jì)另:Z0.025=1.96。于是,該校學(xué)生總體無(wú)宗教信仰比例95%的置信區(qū)間為:第四節(jié)總體比率的區(qū)間估計(jì)例:據(jù)香港大學(xué)民意網(wǎng)站調(diào)查,2010年1月香港居民樣本(n=1004)不贊同臺(tái)灣獨(dú)立的比率為71.4%。試估計(jì)該時(shí)點(diǎn)上香港居民總體不贊同臺(tái)灣獨(dú)立的比率95%的置信區(qū)間。第五節(jié)總體方差的區(qū)間估計(jì)很多情況下,總體方差或標(biāo)準(zhǔn)差也是需要估計(jì)的參數(shù)。例如,投資的風(fēng)險(xiǎn)表現(xiàn)在收益率的不確定上,而收益率的離散程度即實(shí)際收益率與期望收益率(平均收益率)的平均離差,反映了風(fēng)險(xiǎn)的大小。顯然,方差、標(biāo)準(zhǔn)差是投資風(fēng)險(xiǎn)的具體度量值,對(duì)總體方差、標(biāo)準(zhǔn)差進(jìn)行區(qū)間估計(jì)是必要的。第五節(jié)總體方差的區(qū)間估計(jì)對(duì)總體方差的估計(jì)需要用到χ2分布;關(guān)于χ2分布的回顧:

1.χ2是基于標(biāo)準(zhǔn)正態(tài)分布抽樣計(jì)算的統(tǒng)計(jì)量;第五節(jié)總體方差的區(qū)間估計(jì)對(duì)總體方差的估計(jì)需要用到χ2分布;關(guān)于χ2分布的回顧:

2.

從一般正態(tài)總體中抽樣需要做標(biāo)準(zhǔn)化變換;第五節(jié)總體方差的區(qū)間估計(jì)對(duì)總體方差的估計(jì)需要用到χ2分布;關(guān)于χ2分布的回顧:

3.

如果總體均值未知,可以用樣本均值代替總體均值,此時(shí),失去1個(gè)自由度;第五節(jié)總體方差的區(qū)間估計(jì)對(duì)總體方差的估計(jì)需要用到χ2分布;關(guān)于χ2分布的回顧:

4.

根據(jù)樣本方差公式變換,有:第五節(jié)總體方差的區(qū)間估計(jì)結(jié)論:如果容量為n

的樣本取自正態(tài)總體,樣本方差為s2

。則可以構(gòu)造統(tǒng)計(jì)量描述樣本方差的抽樣分布:第五節(jié)總體方差的區(qū)間估計(jì)χ2

分布是一族曲線(xiàn),其形態(tài)取決于自由度。例如,自由度為19的χ2

分布曲線(xiàn)為:第五節(jié)總體方差的區(qū)間估計(jì)χ2

分布是非負(fù)分布。如果我們記χα2

為χ2

分布的α水平右側(cè)分位數(shù),就意味著有α水平的χ2值大于χα2。第五節(jié)總體方差的區(qū)間估計(jì)χ21-α

則是χ2

分布的α水平左側(cè)分位數(shù),此時(shí)意味著有α水平的χ2值小于χ21-α

。第五節(jié)總體方差的區(qū)間估計(jì)第五節(jié)總體方差的區(qū)間估計(jì)第五節(jié)總體方差的區(qū)間估計(jì)第五節(jié)總體方差的區(qū)間估計(jì)第五節(jié)總體方差的區(qū)間估計(jì)例:某開(kāi)放式證券投資基金2002~2006年的收益率分別為10.8%、34.2%、4.2%、9.4%、29.4%。

試以此五年數(shù)據(jù)為樣本,推斷總體方差95%的置信區(qū)間。第五節(jié)總體方差的區(qū)間估計(jì)解:首先,計(jì)算樣本收益率的均值和方差:第五節(jié)總體方差的區(qū)間估計(jì)解:然后,根據(jù)n

和α

確定臨界值:第五節(jié)總體方差的區(qū)間估計(jì)解:最后,計(jì)算總體方差的置信區(qū)間:第六節(jié)兩總體均值差、比率差的估計(jì)關(guān)于兩個(gè)總體均值(比率)差的估計(jì)問(wèn)題:

第一,有兩個(gè)樣本均值(比率)且數(shù)量有差異;

第二,我們想知道這兩個(gè)樣本背后的兩個(gè)總體均值(比率)的差異是多少;

第三,兩總體均值(比率)差的點(diǎn)估計(jì)值是兩個(gè)樣本的均值(比率)差,但鑒于點(diǎn)估計(jì)的弱點(diǎn),通常我們需要做區(qū)間估計(jì);

第四,估計(jì)的基礎(chǔ)是樣本統(tǒng)計(jì)量的抽樣分布。例1:某品牌時(shí)裝在市中心商業(yè)街設(shè)有新品店,在城郊某購(gòu)物中心設(shè)折扣店。從光顧兩個(gè)店的顧客中各抽取一個(gè)樣本調(diào)查,發(fā)現(xiàn)樣本平均月收入存在差異。時(shí)裝店經(jīng)理想知道兩個(gè)顧客總體平均月收入差是多少,以便建議公司制訂合適的折扣水平。第六節(jié)兩總體均值差、比率差的估計(jì)例2:某制藥公司聘用了20位糖尿病人為受試者,檢驗(yàn)新研制的降血糖藥物療效。受試者先后服用降血糖藥物和安慰劑,測(cè)量得到服藥和未服藥兩組有差異的血糖測(cè)量數(shù)據(jù)??蒲腥藛T期望由樣本數(shù)據(jù)推斷出患者總體使用和不使用該藥的血糖差異值,以確定該藥物是否有效。第六節(jié)兩總體均值差、比率差的估計(jì)例3:據(jù)香港大學(xué)民意網(wǎng)站調(diào)查,2010年1月香港居民樣本(n=1004)不贊同臺(tái)灣獨(dú)立的比例為71.4%。而1993年1月,樣本(n=509)數(shù)據(jù)顯示這一比例為51%。研究者想知道香港居民總體不贊同臺(tái)灣獨(dú)立的比例在17年間變化的水平,確切地說(shuō)是上升的水平。第六節(jié)兩總體均值差、比率差的估計(jì)實(shí)際工作中,根據(jù)調(diào)查內(nèi)容和分析需要,所獲得的兩個(gè)樣本可以是獨(dú)立樣本,也可能是匹配樣本;獨(dú)立樣本:兩樣本抽取時(shí)是相互獨(dú)立的。前述例1、例3的兩個(gè)樣本均屬于獨(dú)立樣本。以此類(lèi)推,凡從不同類(lèi)別、不同階層、不同群體中抽取樣本做比較研究,都屬于獨(dú)立樣本。獨(dú)立樣本的一個(gè)基本特征是樣本容量可以不同(但從分析效果講最好是相同)。第六節(jié)兩總體均值差、比率差的估計(jì)匹配樣本:兩樣本單位間存在配對(duì)關(guān)系的樣本。兩匹配樣本的容量一定是相同的。前述例2所獲得的兩組數(shù)據(jù)即屬匹配樣本;匹配樣本可以最大限度地消除可測(cè)量的個(gè)體差異對(duì)試驗(yàn)結(jié)果的影響,因此,可能的情況下應(yīng)考慮使用匹配樣本分析。屬于實(shí)驗(yàn)性質(zhì)的均值比較問(wèn)題都應(yīng)使用匹配樣本。設(shè)置匹配樣本并不能解決全部的非實(shí)驗(yàn)因素外的影響問(wèn)題。第六節(jié)兩總體均值差、比率差的估計(jì)例:前述藥效檢驗(yàn)問(wèn)題,需要考慮的問(wèn)題有:設(shè)置匹配樣本(消除受試者性別、年齡、體重、健康狀況、心理等差異對(duì)藥效的影響);隨機(jī)安排受試者服用藥物和安慰劑的順序;使用專(zhuān)業(yè)的試驗(yàn)人員操作;保證試驗(yàn)檢驗(yàn)設(shè)備和材料的同一性;…第六節(jié)兩總體均值差、比率差的估計(jì)兩總體均值差的抽樣分布:第六節(jié)兩總體均值差、比率差的估計(jì)兩總體均值差的抽樣分布:第六節(jié)兩總體均值差、比率差的估計(jì)如果兩樣本來(lái)自于同一總體:

第六節(jié)兩總體均值差、比率差的估計(jì)如果兩樣本來(lái)自于同一總體:

如果兩總體均值差的置信區(qū)間包含0,則意味兩樣本極可能來(lái)自于同一總體。第六節(jié)兩總體均值差、比率差的估計(jì)關(guān)于兩總體均值差估計(jì)的大樣本和小樣本:

大樣本:n1≥30且n2≥30

小樣本:n1<30或n2<30注意:與一個(gè)總體均值的估計(jì)相同的是,小樣本情況下,只有總體是正態(tài)的,樣本均值差的抽樣分布才服從正態(tài)分布。第六節(jié)兩總體均值差、比率差的估計(jì)關(guān)于兩總體比率差估計(jì)的樣本容量:

要求兩樣本容量均較大,具體是:n1p1、n1(1-

p1)、n2p2、n2(1-

p2)均≥5注意:只有兩樣本容量均比較大時(shí),兩樣本比率差的抽樣分布才可以用正態(tài)分布逼近。第六節(jié)兩總體均值差、比率差的估計(jì)關(guān)于例1的計(jì)算:設(shè)兩個(gè)樣本信息如下:樣本容量平均月收入收入標(biāo)準(zhǔn)差新品店364000元300元折扣店493500元420元

第六節(jié)兩總體均值差、比率差的估計(jì)關(guān)于例1的計(jì)算:設(shè)兩個(gè)樣本信息如下:樣本容量平均月收入收入標(biāo)準(zhǔn)差新品店364000元300元折扣店493500元420元第六節(jié)兩總體均值差、比率差的估計(jì)關(guān)于例1的計(jì)算:設(shè)兩個(gè)樣本信息如下:樣本容量平均月收入收入標(biāo)準(zhǔn)差新品店364000元300元折扣店493500元420元結(jié)論:兩個(gè)顧客總體月平均收入差約為其月平均收入的10%至20%之間。第六節(jié)兩總體均值差、比率差的估計(jì)關(guān)于例1的計(jì)算:如果將兩個(gè)樣本信息改為:

樣本容量平均月收入收入標(biāo)準(zhǔn)差新品店364000元300元折扣店493900元420元

第六節(jié)兩總體均值差、比率差的估計(jì)

樣本容量平均月收入收入標(biāo)準(zhǔn)差新品店364000元300元折扣店493900元420元關(guān)于例1的計(jì)算:如果將兩個(gè)樣本信息改為:第六節(jié)兩總體均值差、比率差的估計(jì)

樣本容量平均月收入收入標(biāo)準(zhǔn)差新品店364000元300元折扣店493900元420元結(jié)論:兩個(gè)顧客總體月平均收入可能沒(méi)有差異。關(guān)于例1的計(jì)算:如果將兩個(gè)樣本信息改為:第六節(jié)兩總體均值差、比率差的估計(jì)關(guān)于例2的計(jì)算:設(shè)兩個(gè)樣本信息如下:受試者血糖水平受試者血糖水平服藥服安慰劑服藥服安慰劑123456789103.55.26.34.55.76.24.84.05.95.85.66.86.95.68.28.34.86.55.88.8111213141516171819205.76.15.55.87.36.27.15.84.84.66.88.27.55.37.88.36.08.87.37.5第六節(jié)兩總體均值差、比率差的估計(jì)受試者血糖水平受試者血糖水平服藥服安慰劑差值d服藥服安慰劑差值d123456789103.55.26.34.55.76.24.84.05.95.85.66.86.95.68.28.34.86.55.88.8-2.1-1.6-0.6-1.1-2.5-2.10-2.50.1-3.0111213141516171819205.76.15.55.87.36.27.15.84.84.66.88.27.55.37.88.36.08.87.37.5-1.1-2.1-2.00.5-0.5-2.11.1-3.0-2.5-2.9根據(jù)差值做計(jì)算:第六節(jié)兩總體均值差、比率差的估計(jì)受試者血糖水平受試者血糖水平服藥服安慰劑差值d服藥服安慰劑差值d123456789103.55.26.34.55.76.24.84.05.95.85.66.86.95.68.28.34.86.55.88.8-2.1-1.6-0.6-1.1-2.5-2.10-2.50.1-3.0111213141516171819205.76.15.55.87.36.27.15.84.84.66.88.27.55.37.88.36.08.87.37.5-1.1-2.1-2.00.5-0.5-2.11.1-3.0-2.5-2.9根據(jù)差值做計(jì)算:第六節(jié)兩總體均值差、比率差的估計(jì)受試者血糖水平受試者血糖水平服藥服安慰劑差值d服藥服安慰劑差值d123456789103.55.26.34.55.76.24.84.05.95.85.66.86.95.68.28.34.86.55.88.8-2.1-1.6-0.6-1.1-2.5-2.10-2.50.1-3.0111213141516171819205.76.15.55.87.36.27.15.84.84.66.88.27.55.37.88.36.08.87.37.5-1.1-2.1-2.00.5-0.5-2.11.1-3.0-2.5-2.9根據(jù)差值做計(jì)算:第六節(jié)兩總體均值差、比率差的估計(jì)受試者血糖水平受試者血糖水平服藥服安慰劑差值d服藥服安慰劑差值d123456789103.55.26.34.55.76.24.84.05.95.85.66.86.95.68.28.34.86.55.88.8-2.1-1.6-0.6-1.1-2.5-2.10-2.50.1-3.0111213141516171819205.76.15.55.87.36.27.15.84.84.66.88.27.55.37.88.36.08.87.37.5-1.1-2.1-2.00.5-0.5-2.11.1-3.0-2.5-2.9根據(jù)差值做計(jì)算:第六節(jié)兩總體均值差、比率差的估計(jì)關(guān)于例3的計(jì)算:第六節(jié)兩總體均值差、比率差的估計(jì)關(guān)于例3的計(jì)算:第六節(jié)兩總體均值差、比率差的估計(jì)關(guān)于例3的計(jì)算:第六節(jié)兩總體均值差、比率差的估計(jì)關(guān)于例3的計(jì)算:推斷結(jié)論:以95%的置信度估計(jì),17年來(lái),香港居民總體不贊同臺(tái)灣獨(dú)立的比率至少提高了15個(gè)百分點(diǎn)。第六節(jié)兩總體均值差、比率差的估計(jì)第七節(jié)關(guān)于參數(shù)估計(jì)的幾個(gè)問(wèn)題一、估計(jì)總體參數(shù)的樣本容量其他條件不變的情況下,樣本容量越大,抽樣誤差就越小。但樣本容量越大,抽樣調(diào)查的成本費(fèi)用就越高。因此,在正式抽樣調(diào)查前,必須確定合適的樣本容量。樣本容量調(diào)查誤差調(diào)查費(fèi)用確定樣本容量:找出規(guī)定誤差范圍內(nèi)的最小樣本容量。確定樣本容量:找出規(guī)定費(fèi)用范圍內(nèi)的最大樣本容量。誤差上限費(fèi)用上限第七節(jié)關(guān)于參數(shù)估計(jì)的幾個(gè)問(wèn)題通常的做法是先確定置信度,然后限定邊際誤差

Δ

。

或s

必須事先知道,但通常未知。一般按以下方法確定其估計(jì)值:a

、以前類(lèi)似樣本的s;b、試驗(yàn)調(diào)查樣本的s;c、四分之一估計(jì)全距。計(jì)算結(jié)果通常向上進(jìn)位估計(jì)總體均值的樣本容量第七節(jié)關(guān)于參數(shù)估計(jì)的幾個(gè)問(wèn)題第七節(jié)關(guān)于參數(shù)估計(jì)的幾個(gè)問(wèn)題例:某地碩士研究生畢業(yè)第一年年薪的標(biāo)準(zhǔn)差大約為2000元人民幣。如果以95%的置信度估計(jì)其平均年薪,并且希望邊際誤差分別不超過(guò)500元和100元,樣本容量應(yīng)為多少?即:若要邊際誤差不超過(guò)500元,應(yīng)至少調(diào)查62個(gè)碩士畢業(yè)生。例:某地碩士研究生畢業(yè)第一年年薪的標(biāo)準(zhǔn)差大約為2000元人民幣。如果以95%的置信度估計(jì)其平均年薪,并且希望邊際誤差分別不超過(guò)500元和100元,樣本容量應(yīng)為多少?即:若要邊際誤差不超過(guò)100元,應(yīng)至少調(diào)查1537個(gè)碩士畢業(yè)生。第七節(jié)關(guān)于參數(shù)估計(jì)的幾個(gè)問(wèn)題第七節(jié)關(guān)于參數(shù)估計(jì)的幾個(gè)問(wèn)題通常的做法是先確定置信度,然后限定邊際誤差Δ

Π或p必須事先知道,但通常未知。一般按以下方法確定其估計(jì)值:a、以前類(lèi)似樣本的p;b、試驗(yàn)調(diào)查樣本的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論