統(tǒng)計(jì)培訓(xùn)教材抽樣估計(jì)_第1頁
統(tǒng)計(jì)培訓(xùn)教材抽樣估計(jì)_第2頁
統(tǒng)計(jì)培訓(xùn)教材抽樣估計(jì)_第3頁
統(tǒng)計(jì)培訓(xùn)教材抽樣估計(jì)_第4頁
統(tǒng)計(jì)培訓(xùn)教材抽樣估計(jì)_第5頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計(jì)培訓(xùn)教材抽樣估計(jì)第一頁,共三十六頁,編輯于2023年,星期三抽樣估計(jì):根據(jù)樣本提供的信息對總體的某些特征進(jìn)行估計(jì)或推斷。估計(jì)量或統(tǒng)計(jì)量:用來估計(jì)總體特征的的樣本指標(biāo);總體參數(shù):待估計(jì)的總體指標(biāo)。所以對總體數(shù)字特征的抽樣估計(jì)也叫參數(shù)估計(jì)??煞譃椋狐c(diǎn)估計(jì)和區(qū)間估計(jì)??傮w樣本抽取樣本零假設(shè)備擇假設(shè)P-value預(yù)測總體特征統(tǒng)計(jì)性推斷總體參數(shù)統(tǒng)計(jì)量參數(shù)估計(jì)第二頁,共三十六頁,編輯于2023年,星期三參數(shù)估計(jì)目標(biāo)--掌握點(diǎn)估計(jì)的方法和衡量好壞的標(biāo)準(zhǔn)--掌握區(qū)間估計(jì)第三頁,共三十六頁,編輯于2023年,星期三參數(shù)參數(shù)是刻畫總體特征的一些量分布

參數(shù)二項(xiàng)分布(Binomial): n

和p泊松分布(Poisson): 正態(tài)分布(Normal):

和第四頁,共三十六頁,編輯于2023年,星期三點(diǎn)估計(jì)點(diǎn)估計(jì)是指用于估計(jì)總體未知參數(shù)真值的統(tǒng)計(jì)量.常用點(diǎn)估計(jì)

參數(shù)

統(tǒng)計(jì)量

均值 x

標(biāo)準(zhǔn)差 s方差 2 s2

比例 p–第五頁,共三十六頁,編輯于2023年,星期三點(diǎn)估計(jì)常用方法---極大似然法:由Gauss和Bernoulli發(fā)明,由R.A.Fisher完善化。它的基本思想是:參數(shù)的極大似然估計(jì)量是這樣一個(gè)量,它使基于總體的理論樣本與實(shí)際抽出的樣本觀察值最大程度的相符合。理論價(jià)值很大---矩量法:由英國統(tǒng)計(jì)學(xué)家KarlPearson發(fā)明?;舅枷胧牵菏箍傮w矩等于樣本矩。數(shù)學(xué)上易于計(jì)算。第六頁,共三十六頁,編輯于2023年,星期三點(diǎn)估計(jì)的衡量標(biāo)準(zhǔn)總體均值μ的估計(jì),可用樣本均值、中位數(shù)、截尾平均等。三個(gè)標(biāo)準(zhǔn)(評估估計(jì)量的優(yōu)劣)---無偏性:樣本的估計(jì)量的數(shù)學(xué)期望仍等于被估計(jì)總體參數(shù)的真值。例如:分別為和2的無偏估計(jì)。---有效性:兩個(gè)無偏估計(jì)中,方差較小的被視為較有效。---一致性:當(dāng)樣本數(shù)趨于無窮大時(shí),估計(jì)量依概率收斂于參數(shù)的真值。第七頁,共三十六頁,編輯于2023年,星期三區(qū)間估計(jì):根據(jù)樣本估計(jì)量以一定可靠程度推斷總體參數(shù)所在的區(qū)間范圍。這種估計(jì)方法不僅以樣本估計(jì)量為依據(jù),而且考慮了估計(jì)量的分布,所以它能給出估計(jì)精度,也能說明估計(jì)結(jié)果的把握程度。利用基于統(tǒng)計(jì)學(xué)的置信區(qū)間來量化樣本的不確定性

第八頁,共三十六頁,編輯于2023年,星期三設(shè)總體參數(shù)為θ,θL、θ

U為樣本確定的兩個(gè)樣本量,對于給定的α(0<α<1),有P(θL

≤θ≤θ

U)=1-α則稱(θL,θ

U)為參數(shù)θ的置信度為1-α的置信區(qū)間。該區(qū)間的兩個(gè)端點(diǎn)θL、θ

U分別稱為置信下限和置信上限,通稱為置信限。

α為顯著性水平;1-α則稱為置信度,

置信區(qū)間的定義第九頁,共三十六頁,編輯于2023年,星期三它表示區(qū)間估計(jì)的可靠程度或把握程度,也即所估計(jì)的區(qū)間包含總體真實(shí)的可能性。置信度為1-α的置信區(qū)間也就表示以1-α的可能性(概率)包含了未知總體參數(shù)的區(qū)間。置信區(qū)間的直觀意義為:若作多次同樣的抽樣,將得到多個(gè)置信區(qū)間,那么其中有的區(qū)間包含了總體參數(shù)的真值,有點(diǎn)區(qū)間卻未包含總體參數(shù)的真值。平均說來,包含總體參數(shù)真值的區(qū)間有(1-α)*100%,反之有α*100%的區(qū)間未包含總體參數(shù)真值。置信區(qū)間的意義第十頁,共三十六頁,編輯于2023年,星期三絕大多數(shù)情況下,我們計(jì)算95%的置信區(qū)間(CI)

這可解釋為

100中大約95的CI將包含總體參數(shù),或者我們95%確信總體參數(shù)在此區(qū)間內(nèi)反觀以前,我們看到大約95%的樣本平均在總體平均的2倍標(biāo)準(zhǔn)差內(nèi)(正態(tài)分布時(shí)

Z=±2s內(nèi)的概率約為95%.)如果我們從一個(gè)工程中隨機(jī)抽取一個(gè)樣本并計(jì)算其平均值時(shí),我們確信其樣本的均值包含在總體中的概率是95%.

95%的置信區(qū)間第十一頁,共三十六頁,編輯于2023年,星期三求參數(shù)置信區(qū)間時(shí)可參考下面的通用格式:

置信區(qū)間=統(tǒng)計(jì)量±K*(標(biāo)準(zhǔn)誤差)這里,統(tǒng)計(jì)量=均值、方差、Cp等K=基于某統(tǒng)計(jì)分布的常數(shù)置信區(qū)間反映我們的點(diǎn)估計(jì)的樣本與樣本間的散布我們將考慮如下的置信區(qū)間:1)總體均值u的置信區(qū)間;

2)總體方差σ的置信區(qū)間;

3)工程能力Cp的置信區(qū)間;

4)總體比例P的置信區(qū)間;置信區(qū)間介紹第十二頁,共三十六頁,編輯于2023年,星期三正態(tài)總體的各種情形的區(qū)間估計(jì)估計(jì)參數(shù)均值 方差 2比例

兩個(gè)總體間的差異的估計(jì)均值

1-2方差

12/22比例

1-

2

比較他們是否有顯著差異?第十三頁,共三十六頁,編輯于2023年,星期三單個(gè)正態(tài)總體的區(qū)間估計(jì)總體均值的估計(jì)(方差已知)總體均值的估計(jì)(方差未知)總體方差的估計(jì)總體比例的估計(jì)第十四頁,共三十六頁,編輯于2023年,星期三均值間的差異(方差已知)均值間的差異(方差未知但相等)

其中均值間的差異(方差未知且不相等)

其中兩個(gè)正態(tài)總體的區(qū)間估計(jì)第十五頁,共三十六頁,編輯于2023年,星期三兩個(gè)正態(tài)總體的區(qū)間估計(jì)兩總體比例間的差異方差之比第十六頁,共三十六頁,編輯于2023年,星期三1-1)總體方差已知時(shí),正態(tài)總體均值的區(qū)間估計(jì)1)總體均值的置信區(qū)間xZxZ-££+aas()m//22xs()x[一般公式]其中x稱為樣本均值;

稱為對應(yīng)于a/2的Z值;稱為抽樣平均誤差;

稱為抽樣極限誤差(△x)Za/2s(x)Za/2s(x)第十七頁,共三十六頁,編輯于2023年,星期三[例題1]

某企業(yè)從長期實(shí)踐得知,其產(chǎn)品直徑X是一個(gè)隨機(jī)變量,服從標(biāo)準(zhǔn)差為0.05的正態(tài)分布。從某日產(chǎn)品中隨機(jī)抽取6個(gè),測得其直徑分別為14.8,15.3,15.1,15,14.7,15.1(單位:厘米)。在0.95的置信度下,試求該產(chǎn)品直徑的均值的置信區(qū)間。[Minitab解法]①將題中的6個(gè)數(shù)據(jù)輸入到Minitab中的C1列②路徑:Stat→BasicStatistics→1-SampleZ…③輸入相關(guān)參數(shù)(參考右圖)第十八頁,共三十六頁,編輯于2023年,星期三④輸出結(jié)果:⑤結(jié)論:該產(chǎn)品直徑的均值置信區(qū)間為(14.96,15.04)cmVariableNMeanStDevSEMean95%CIC1615.00000.21910.0204(14.9600,15.0400)當(dāng)樣本容量相當(dāng)大時(shí),即使總體分布形式未知或總體為非正態(tài)分布,根據(jù)定理,樣本均值近似服從正態(tài)分布,因此估計(jì)總體均值的方法與上述方法相同;大樣本情況下,當(dāng)總體方差未知而用樣本方差代替時(shí),由于t分布可用正態(tài)分布近似,所以對總體均值的估計(jì)也采用上述方法。[注意]第十九頁,共三十六頁,編輯于2023年,星期三[例題2]

某企業(yè)生產(chǎn)某種產(chǎn)品的工人有1000人,某日采用不重復(fù)抽樣從中隨機(jī)抽取100人調(diào)查他們的當(dāng)日產(chǎn)量,樣本人均產(chǎn)量為35件,產(chǎn)量的樣本標(biāo)準(zhǔn)差為4.5件,試以95.5%的置信度估計(jì)平均產(chǎn)量的置信區(qū)間。[Minitab解法]①打開Minitab②路徑:Stat→BasicStatistics→1-SampleZ…第二十頁,共三十六頁,編輯于2023年,星期三④輸出結(jié)果:⑤結(jié)論:該產(chǎn)品直徑的均值置信區(qū)間為(34.0979,35.9021

)件

NMeanSEMean95.5%CI10035.00000.4500(34.0979,35.9021)③輸入相關(guān)參數(shù)(參考下圖)第二十一頁,共三十六頁,編輯于2023年,星期三1-2)總體方差未知時(shí),正態(tài)總體均值的區(qū)間估計(jì)(小樣本)[一般公式]其中x稱為樣本均值;

稱為對應(yīng)于a/2,自由度為n-1的的t值;稱為抽樣極限誤差(△x)ta/2,n-1SSta/2,n-1sn第二十二頁,共三十六頁,編輯于2023年,星期三[例題3]

某食品廠從一批袋裝食品中隨機(jī)抽取10袋,測得每袋重量(單位:克)分別為789、780、794、762、802、813、770、785、810、806,要求以95%的把握程度,估計(jì)這批食品的平均每袋重量的區(qū)間范圍及其允許誤差。[Minitab解法]①將題中的10個(gè)數(shù)據(jù)輸入到Minitab中的C1列②路徑:Stat→BasicStatistics→1-Samplet…第二十三頁,共三十六頁,編輯于2023年,星期三③輸入相關(guān)參數(shù)(參考右圖)④輸出結(jié)果:⑤結(jié)論:該產(chǎn)品每袋重量的均值置信區(qū)間為(778.841,803.359

)克;

允許誤差:2.262*5.419=12.26(克)VariableNMeanStDevSEMean95%CIC110791.10017.1365.419(778.841,803.359)第二十四頁,共三十六頁,編輯于2023年,星期三2)總體標(biāo)準(zhǔn)差的置信區(qū)間[一般公式](小樣本)其中s稱為樣本標(biāo)準(zhǔn)差;

稱為對應(yīng)于a/2的Chi-Square值;稱為自由度;χ2a/2n-1//scsscaann-££--1122122SS第二十五頁,共三十六頁,編輯于2023年,星期三假設(shè)我們獲得一個(gè)16個(gè)數(shù)據(jù)點(diǎn)的樣本,得到的標(biāo)準(zhǔn)偏差為1.66。自由度(為16-1或15。Sigma的95%(=.05)置信區(qū)間是:

第二十六頁,共三十六頁,編輯于2023年,星期三[例題4]

用[例題3]的10個(gè)數(shù)據(jù)求標(biāo)準(zhǔn)差的置信區(qū)間[Minitab解法]①將題中的10個(gè)數(shù)據(jù)輸入到Minitab中的C1列②路徑:Stat→BasicStatistics→GraphicalSummary…第二十七頁,共三十六頁,編輯于2023年,星期三④結(jié)論:樣本的標(biāo)準(zhǔn)差是

17.14,總體標(biāo)準(zhǔn)差的95%的置信區(qū)間在

11.79和32.78之間。③輸出結(jié)果第二十八頁,共三十六頁,編輯于2023年,星期三Cpn-1CpCpn-11-/2,n-12/2,n-12ccaa££

Cpn-1CpCpn-11-/2,n-12/2,n-12ccaa££這就是說,我們有95%把握說真實(shí)的Cp值在1.57和3.01之間Cp=2.29(n=20)的95%置信區(qū)間計(jì)算如右:

3)工程能力Cp的置信區(qū)間[一般公式]第二十九頁,共三十六頁,編輯于2023年,星期三我們將定義一個(gè)過程,其目標(biāo)值為70,USL=100,LSL=40.班上的每個(gè)人都從一個(gè)平均值=70,標(biāo)準(zhǔn)差=10的分布中產(chǎn)生20個(gè)隨機(jī)正態(tài)數(shù)字假設(shè)我們的“真實(shí)的”Cp=1.00.產(chǎn)生數(shù)據(jù)后,先用Minitab計(jì)算出Cp;再用前面的公式計(jì)算Cp的95%置信區(qū)間;假設(shè)班里的人數(shù)為50,我們期待至少一個(gè)CI不包含1.00準(zhǔn)備發(fā)表你的結(jié)果

Cp的置信區(qū)間Minitab模擬第三十頁,共三十六頁,編輯于2023年,星期三1.產(chǎn)生20個(gè)隨機(jī)數(shù)據(jù),并保存在C12.求其工程能力第三十一頁,共三十六頁,編輯于2023年,星期三3.Stats→BasicStats>Statistics→GraphicalSummary4.求總體標(biāo)準(zhǔn)差的置信區(qū)間的上限和下限.第三十二頁,共三十六頁,編輯于2023年,星期三總體標(biāo)準(zhǔn)差的置信區(qū)間

下限Sigma上限樣本大小7.4659.81714.33820CCpBestCase)(WorstCase)p(=-==-=100406*7.4651.33100400.69現(xiàn)在我們可以使用這些估計(jì)的上下限來計(jì)算Cp的置信區(qū)間了

我們看到這是一個(gè)包含1.00的實(shí)際Cp95%的置信區(qū)間

5.求Cp的置信區(qū)間6*14.338第三十三頁,共三十六頁,編輯于2023年,星期三4

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論