統(tǒng)計培訓(xùn)教材抽樣估計_第1頁
統(tǒng)計培訓(xùn)教材抽樣估計_第2頁
統(tǒng)計培訓(xùn)教材抽樣估計_第3頁
統(tǒng)計培訓(xùn)教材抽樣估計_第4頁
統(tǒng)計培訓(xùn)教材抽樣估計_第5頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計培訓(xùn)教材抽樣估計第1頁,課件共36頁,創(chuàng)作于2023年2月抽樣估計:根據(jù)樣本提供的信息對總體的某些特征進行估計或推斷。估計量或統(tǒng)計量:用來估計總體特征的的樣本指標(biāo);總體參數(shù):待估計的總體指標(biāo)。所以對總體數(shù)字特征的抽樣估計也叫參數(shù)估計??煞譃椋狐c估計和區(qū)間估計??傮w樣本抽取樣本零假設(shè)備擇假設(shè)P-value預(yù)測總體特征統(tǒng)計性推斷總體參數(shù)統(tǒng)計量參數(shù)估計第2頁,課件共36頁,創(chuàng)作于2023年2月參數(shù)估計目標(biāo)--掌握點估計的方法和衡量好壞的標(biāo)準(zhǔn)--掌握區(qū)間估計第3頁,課件共36頁,創(chuàng)作于2023年2月參數(shù)參數(shù)是刻畫總體特征的一些量分布

參數(shù)二項分布(Binomial): n

和p泊松分布(Poisson): 正態(tài)分布(Normal):

和第4頁,課件共36頁,創(chuàng)作于2023年2月點估計點估計是指用于估計總體未知參數(shù)真值的統(tǒng)計量.常用點估計

參數(shù)

統(tǒng)計量

均值 x

標(biāo)準(zhǔn)差 s方差 2 s2

比例 p–第5頁,課件共36頁,創(chuàng)作于2023年2月點估計常用方法---極大似然法:由Gauss和Bernoulli發(fā)明,由R.A.Fisher完善化。它的基本思想是:參數(shù)的極大似然估計量是這樣一個量,它使基于總體的理論樣本與實際抽出的樣本觀察值最大程度的相符合。理論價值很大---矩量法:由英國統(tǒng)計學(xué)家KarlPearson發(fā)明?;舅枷胧牵菏箍傮w矩等于樣本矩。數(shù)學(xué)上易于計算。第6頁,課件共36頁,創(chuàng)作于2023年2月點估計的衡量標(biāo)準(zhǔn)總體均值μ的估計,可用樣本均值、中位數(shù)、截尾平均等。三個標(biāo)準(zhǔn)(評估估計量的優(yōu)劣)---無偏性:樣本的估計量的數(shù)學(xué)期望仍等于被估計總體參數(shù)的真值。例如:分別為和2的無偏估計。---有效性:兩個無偏估計中,方差較小的被視為較有效。---一致性:當(dāng)樣本數(shù)趨于無窮大時,估計量依概率收斂于參數(shù)的真值。第7頁,課件共36頁,創(chuàng)作于2023年2月區(qū)間估計:根據(jù)樣本估計量以一定可靠程度推斷總體參數(shù)所在的區(qū)間范圍。這種估計方法不僅以樣本估計量為依據(jù),而且考慮了估計量的分布,所以它能給出估計精度,也能說明估計結(jié)果的把握程度。利用基于統(tǒng)計學(xué)的置信區(qū)間來量化樣本的不確定性

第8頁,課件共36頁,創(chuàng)作于2023年2月設(shè)總體參數(shù)為θ,θL、θ

U為樣本確定的兩個樣本量,對于給定的α(0<α<1),有P(θL

≤θ≤θ

U)=1-α則稱(θL,θ

U)為參數(shù)θ的置信度為1-α的置信區(qū)間。該區(qū)間的兩個端點θL、θ

U分別稱為置信下限和置信上限,通稱為置信限。

α為顯著性水平;1-α則稱為置信度,

置信區(qū)間的定義第9頁,課件共36頁,創(chuàng)作于2023年2月它表示區(qū)間估計的可靠程度或把握程度,也即所估計的區(qū)間包含總體真實的可能性。置信度為1-α的置信區(qū)間也就表示以1-α的可能性(概率)包含了未知總體參數(shù)的區(qū)間。置信區(qū)間的直觀意義為:若作多次同樣的抽樣,將得到多個置信區(qū)間,那么其中有的區(qū)間包含了總體參數(shù)的真值,有點區(qū)間卻未包含總體參數(shù)的真值。平均說來,包含總體參數(shù)真值的區(qū)間有(1-α)*100%,反之有α*100%的區(qū)間未包含總體參數(shù)真值。置信區(qū)間的意義第10頁,課件共36頁,創(chuàng)作于2023年2月絕大多數(shù)情況下,我們計算95%的置信區(qū)間(CI)

這可解釋為

100中大約95的CI將包含總體參數(shù),或者我們95%確信總體參數(shù)在此區(qū)間內(nèi)反觀以前,我們看到大約95%的樣本平均在總體平均的2倍標(biāo)準(zhǔn)差內(nèi)(正態(tài)分布時

Z=±2s內(nèi)的概率約為95%.)如果我們從一個工程中隨機抽取一個樣本并計算其平均值時,我們確信其樣本的均值包含在總體中的概率是95%.

95%的置信區(qū)間第11頁,課件共36頁,創(chuàng)作于2023年2月求參數(shù)置信區(qū)間時可參考下面的通用格式:

置信區(qū)間=統(tǒng)計量±K*(標(biāo)準(zhǔn)誤差)這里,統(tǒng)計量=均值、方差、Cp等K=基于某統(tǒng)計分布的常數(shù)置信區(qū)間反映我們的點估計的樣本與樣本間的散布我們將考慮如下的置信區(qū)間:1)總體均值u的置信區(qū)間;

2)總體方差σ的置信區(qū)間;

3)工程能力Cp的置信區(qū)間;

4)總體比例P的置信區(qū)間;置信區(qū)間介紹第12頁,課件共36頁,創(chuàng)作于2023年2月正態(tài)總體的各種情形的區(qū)間估計估計參數(shù)均值 方差 2比例

兩個總體間的差異的估計均值

1-2方差

12/22比例

1-

2

比較他們是否有顯著差異?第13頁,課件共36頁,創(chuàng)作于2023年2月單個正態(tài)總體的區(qū)間估計總體均值的估計(方差已知)總體均值的估計(方差未知)總體方差的估計總體比例的估計第14頁,課件共36頁,創(chuàng)作于2023年2月均值間的差異(方差已知)均值間的差異(方差未知但相等)

其中均值間的差異(方差未知且不相等)

其中兩個正態(tài)總體的區(qū)間估計第15頁,課件共36頁,創(chuàng)作于2023年2月兩個正態(tài)總體的區(qū)間估計兩總體比例間的差異方差之比第16頁,課件共36頁,創(chuàng)作于2023年2月1-1)總體方差已知時,正態(tài)總體均值的區(qū)間估計1)總體均值的置信區(qū)間xZxZ-££+aas()m//22xs()x[一般公式]其中x稱為樣本均值;

稱為對應(yīng)于a/2的Z值;稱為抽樣平均誤差;

稱為抽樣極限誤差(△x)Za/2s(x)Za/2s(x)第17頁,課件共36頁,創(chuàng)作于2023年2月[例題1]

某企業(yè)從長期實踐得知,其產(chǎn)品直徑X是一個隨機變量,服從標(biāo)準(zhǔn)差為0.05的正態(tài)分布。從某日產(chǎn)品中隨機抽取6個,測得其直徑分別為14.8,15.3,15.1,15,14.7,15.1(單位:厘米)。在0.95的置信度下,試求該產(chǎn)品直徑的均值的置信區(qū)間。[Minitab解法]①將題中的6個數(shù)據(jù)輸入到Minitab中的C1列②路徑:Stat→BasicStatistics→1-SampleZ…③輸入相關(guān)參數(shù)(參考右圖)第18頁,課件共36頁,創(chuàng)作于2023年2月④輸出結(jié)果:⑤結(jié)論:該產(chǎn)品直徑的均值置信區(qū)間為(14.96,15.04)cmVariableNMeanStDevSEMean95%CIC1615.00000.21910.0204(14.9600,15.0400)當(dāng)樣本容量相當(dāng)大時,即使總體分布形式未知或總體為非正態(tài)分布,根據(jù)定理,樣本均值近似服從正態(tài)分布,因此估計總體均值的方法與上述方法相同;大樣本情況下,當(dāng)總體方差未知而用樣本方差代替時,由于t分布可用正態(tài)分布近似,所以對總體均值的估計也采用上述方法。[注意]第19頁,課件共36頁,創(chuàng)作于2023年2月[例題2]

某企業(yè)生產(chǎn)某種產(chǎn)品的工人有1000人,某日采用不重復(fù)抽樣從中隨機抽取100人調(diào)查他們的當(dāng)日產(chǎn)量,樣本人均產(chǎn)量為35件,產(chǎn)量的樣本標(biāo)準(zhǔn)差為4.5件,試以95.5%的置信度估計平均產(chǎn)量的置信區(qū)間。[Minitab解法]①打開Minitab②路徑:Stat→BasicStatistics→1-SampleZ…第20頁,課件共36頁,創(chuàng)作于2023年2月④輸出結(jié)果:⑤結(jié)論:該產(chǎn)品直徑的均值置信區(qū)間為(34.0979,35.9021

)件

NMeanSEMean95.5%CI10035.00000.4500(34.0979,35.9021)③輸入相關(guān)參數(shù)(參考下圖)第21頁,課件共36頁,創(chuàng)作于2023年2月1-2)總體方差未知時,正態(tài)總體均值的區(qū)間估計(小樣本)[一般公式]其中x稱為樣本均值;

稱為對應(yīng)于a/2,自由度為n-1的的t值;稱為抽樣極限誤差(△x)ta/2,n-1SSta/2,n-1sn第22頁,課件共36頁,創(chuàng)作于2023年2月[例題3]

某食品廠從一批袋裝食品中隨機抽取10袋,測得每袋重量(單位:克)分別為789、780、794、762、802、813、770、785、810、806,要求以95%的把握程度,估計這批食品的平均每袋重量的區(qū)間范圍及其允許誤差。[Minitab解法]①將題中的10個數(shù)據(jù)輸入到Minitab中的C1列②路徑:Stat→BasicStatistics→1-Samplet…第23頁,課件共36頁,創(chuàng)作于2023年2月③輸入相關(guān)參數(shù)(參考右圖)④輸出結(jié)果:⑤結(jié)論:該產(chǎn)品每袋重量的均值置信區(qū)間為(778.841,803.359

)克;

允許誤差:2.262*5.419=12.26(克)VariableNMeanStDevSEMean95%CIC110791.10017.1365.419(778.841,803.359)第24頁,課件共36頁,創(chuàng)作于2023年2月2)總體標(biāo)準(zhǔn)差的置信區(qū)間[一般公式](小樣本)其中s稱為樣本標(biāo)準(zhǔn)差;

稱為對應(yīng)于a/2的Chi-Square值;稱為自由度;χ2a/2n-1//scsscaann-££--1122122SS第25頁,課件共36頁,創(chuàng)作于2023年2月假設(shè)我們獲得一個16個數(shù)據(jù)點的樣本,得到的標(biāo)準(zhǔn)偏差為1.66。自由度(為16-1或15。Sigma的95%(=.05)置信區(qū)間是:

第26頁,課件共36頁,創(chuàng)作于2023年2月[例題4]

用[例題3]的10個數(shù)據(jù)求標(biāo)準(zhǔn)差的置信區(qū)間[Minitab解法]①將題中的10個數(shù)據(jù)輸入到Minitab中的C1列②路徑:Stat→BasicStatistics→GraphicalSummary…第27頁,課件共36頁,創(chuàng)作于2023年2月④結(jié)論:樣本的標(biāo)準(zhǔn)差是

17.14,總體標(biāo)準(zhǔn)差的95%的置信區(qū)間在

11.79和32.78之間。③輸出結(jié)果第28頁,課件共36頁,創(chuàng)作于2023年2月Cpn-1CpCpn-11-/2,n-12/2,n-12ccaa££

Cpn-1CpCpn-11-/2,n-12/2,n-12ccaa££這就是說,我們有95%把握說真實的Cp值在1.57和3.01之間Cp=2.29(n=20)的95%置信區(qū)間計算如右:

3)工程能力Cp的置信區(qū)間[一般公式]第29頁,課件共36頁,創(chuàng)作于2023年2月我們將定義一個過程,其目標(biāo)值為70,USL=100,LSL=40.班上的每個人都從一個平均值=70,標(biāo)準(zhǔn)差=10的分布中產(chǎn)生20個隨機正態(tài)數(shù)字假設(shè)我們的“真實的”Cp=1.00.產(chǎn)生數(shù)據(jù)后,先用Minitab計算出Cp;再用前面的公式計算Cp的95%置信區(qū)間;假設(shè)班里的人數(shù)為50,我們期待至少一個CI不包含1.00準(zhǔn)備發(fā)表你的結(jié)果

Cp的置信區(qū)間Minitab模擬第30頁,課件共36頁,創(chuàng)作于2023年2月1.產(chǎn)生20個隨機數(shù)據(jù),并保存在C12.求其工程能力第31頁,課件共36頁,創(chuàng)作于2023年2月3.Stats→BasicStats>Statistics→GraphicalSummary4.求總體標(biāo)準(zhǔn)差的置信區(qū)間的上限和下限.第32頁,課件共36頁,創(chuàng)作于2023年2月總體標(biāo)準(zhǔn)差的置信區(qū)間

下限Sigma上限樣本大小7.4659.81714.33820CCpBestCase)(WorstCase)p(=-==-=100406*7.4651.33100400.69現(xiàn)在我們可以使用這些估計的上下限來計算Cp的置信區(qū)間了

我們看到這是一個包含1.00的實際Cp95%的置信區(qū)間

5.求Cp的置信區(qū)間6*14.338第33頁,課件共36頁,創(chuàng)作于2023年2月

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論