參數(shù)估計課件_第1頁
參數(shù)估計課件_第2頁
參數(shù)估計課件_第3頁
參數(shù)估計課件_第4頁
參數(shù)估計課件_第5頁
已閱讀5頁,還剩44頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

參數(shù)估計parameterestimation7參數(shù)估計統(tǒng)計學(xué)統(tǒng)計描述統(tǒng)計推斷參數(shù)估計假設(shè)檢驗7參數(shù)估計總體、個體和樣本

總體(population):調(diào)查研究的事物或現(xiàn)象的全體

個體(itemunit):組成總體的每個元素

樣本(sample):從總體中所抽取的部分個體

樣本容量(samplesize):樣本中所含個體的數(shù)量7參數(shù)估計統(tǒng)計推斷的過程總體樣本抽樣總體均值、比例、方差統(tǒng)計推斷樣本均數(shù)、率、標(biāo)準(zhǔn)差統(tǒng)計量參數(shù)7參數(shù)估計案例:研究2004年某地7歲男孩的身高情況。假如該地2004年的7歲男孩有10萬人,則最直接的方法就是普查:調(diào)查這10萬個兒童,測量他們的身高,然后進(jìn)行統(tǒng)計分析。但是工作量非常大。我們可以通過隨機(jī)抽樣調(diào)查了解7歲男孩的身高情況。如調(diào)查200個兒童,測量他們的身高,通過分析這200個兒童的身高推斷該地10萬個7歲男孩身高情況。7參數(shù)估計總體:該地2004年10萬個7歲男孩身高觀察值的全體個體:每個7歲男孩樣本:隨機(jī)抽樣所得到的200個7歲男孩身高觀察值樣本容量:200抽樣實驗:通過樣本信息了解總體的情況。即:通過分析200個7歲男孩身高估計10萬個7歲男孩身高情況,也就是用樣本均數(shù)估計總體均數(shù)。7參數(shù)估計抽樣誤差抽樣誤差(samplingerror)

由于個體差異的存在,導(dǎo)致抽樣時樣本統(tǒng)計量與總體參數(shù)間的差別;或同一總體的相同統(tǒng)計量之間的差別。屬于隨機(jī)誤差:無傾向性,不可避免。7參數(shù)估計抽樣實驗

假定正常成年男子的紅細(xì)胞計數(shù)服從正態(tài)分布N(5.00,0.502),從該總體中隨機(jī)抽樣,樣本含量n=10,計算其均數(shù)與標(biāo)準(zhǔn)差;重復(fù)抽取100次,獲得100份樣本;計算100份樣本的均數(shù)與標(biāo)準(zhǔn)差,并對100份樣本的均數(shù)作直方圖。按上述方法再做樣本含量n=5、n=30的抽樣試驗;比較計算結(jié)果。7參數(shù)估計思考題1各樣本均數(shù)與總體均數(shù)相等嗎?2各樣本均數(shù)之間相等嗎?3樣本均數(shù)分布有何規(guī)律?4樣本均數(shù)的變異較之原個體觀察值的變異范圍有何變化?5比較n=5、10、30“樣本均數(shù)的標(biāo)準(zhǔn)差”。7參數(shù)估計表7-1正常男子紅細(xì)胞計數(shù)抽樣實驗結(jié)果(m=5.00,s2=0.502,n=10)7參數(shù)估計7參數(shù)估計3個抽樣實驗結(jié)果圖示7參數(shù)估計100份樣本抽樣計算結(jié)果已知總體標(biāo)準(zhǔn)差s:未知總體而知樣本標(biāo)準(zhǔn)差S:總體均數(shù)總體標(biāo)準(zhǔn)差s均數(shù)的均數(shù)均數(shù)的標(biāo)準(zhǔn)差n=55.000.504.9870.23000.2236n=105.000.505.0110.15860.1581n=305.000.505.0000.09200.09137參數(shù)估計抽樣實驗小結(jié)

均數(shù)的均數(shù)圍繞總體均數(shù)上下波動。

均數(shù)的標(biāo)準(zhǔn)差

與總體標(biāo)準(zhǔn)差s相差一個常數(shù)倍數(shù),即。7參數(shù)估計第七章參數(shù)估計

第一節(jié)樣本均數(shù)的標(biāo)準(zhǔn)誤第三節(jié)兩均數(shù)之差的可信區(qū)間7參數(shù)估計樣本均數(shù)的標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤(StandardError,SE):統(tǒng)計量的標(biāo)準(zhǔn)差樣本均數(shù)的標(biāo)準(zhǔn)誤:樣本均數(shù)的標(biāo)準(zhǔn)差,測度樣本均數(shù)的抽樣誤差,即樣本均數(shù)的離散程度。理論值:

估計值:小于總體標(biāo)準(zhǔn)差影響抽樣誤差大小的主要因素是樣本量7參數(shù)估計例7-32003年某地20歲應(yīng)征男青年中隨機(jī)抽取85人,平均身高為171.2cm,標(biāo)準(zhǔn)差為5.3cm,計算當(dāng)?shù)?0歲應(yīng)征男青年身高的標(biāo)準(zhǔn)誤。即本次調(diào)查身高均數(shù)171.2cm抽樣誤差的估計值為0.57cm

。7參數(shù)估計標(biāo)準(zhǔn)差VS標(biāo)準(zhǔn)誤7參數(shù)估計樣本均值的分布1.來自于同一正態(tài)總體的樣本均數(shù)的分布抽樣分布總體分布m=50s=10X7參數(shù)估計2.來自于同一偏態(tài)總體的樣本均數(shù)的分布

中心極限定理(centrallimittheorem):X當(dāng)n足夠大,樣本均數(shù)逐漸趨于正態(tài)分布任一分布的總體7參數(shù)估計Studentt-分布自由度n=n-17參數(shù)估計Xt

分布與正態(tài)分布的比較N(0,1)t(n)0t

分布:形狀與N(0,1)相似,但t分布中間較小,兩側(cè)較大。7參數(shù)估計t不同自由度的t分布0隨著v增大,t分布逼近N(0,1);v

∞時,t分布演變成N(0,1)。7參數(shù)估計P3237參數(shù)估計t分布曲線下面積雙側(cè)t0.05/2,∞=1.96=單側(cè)t0.025,∞1.96-1.960規(guī)律:1.同一

下,t值增加,P值減小

2.同一P值下,增加,t值減小1.6407參數(shù)估計參數(shù)估計(estimationofparameter):--用樣本統(tǒng)計量估計總體參數(shù)。樣本統(tǒng)計量

總體參數(shù)

利用樣本信息計算一個區(qū)間,并給出重復(fù)試驗時該區(qū)間包含總體參數(shù)的概率參數(shù)估計點估計區(qū)間估計7參數(shù)估計

2

未知

2已知均數(shù)方差率可信區(qū)間可信區(qū)間(confidenceinterval,CI)

7參數(shù)估計總體均數(shù)的估計置信上限可信/置信區(qū)間(區(qū)間估計)置信下限樣本統(tǒng)計量

(點估計)點估計:pointestimation區(qū)間估計:intervalestimation7參數(shù)估計重復(fù)試驗時該區(qū)間包含總體均數(shù)的概率表示為

1-a

或100(1-a)%

常用的有99%,95%,90%相應(yīng)的a為0.01,0.05,0.10置信水平/可信度

7參數(shù)估計s未知:7參數(shù)估計例7-4由例7-1的第二個樣本,求總體均數(shù)的95%可信區(qū)間。解:7參數(shù)估計2.s已知,或s未知但n足夠大:

7參數(shù)估計例7-5估計例7-3中2003年當(dāng)?shù)?0歲應(yīng)征男青年身高總體均數(shù)的95%的可信區(qū)間。解:7參數(shù)估計影響區(qū)間寬度的因素數(shù)據(jù)的離散程度,用S或來測度樣本容量,置信水平(1-

),影響

的大小7參數(shù)估計可信區(qū)間95%99%公式范圍

窄寬估計錯誤概率

大(0.05)?。?.01)精密度(precision)準(zhǔn)確度(accuracy)1-a增大樣本量7參數(shù)估計重復(fù)試驗時:(1-

)的區(qū)間包含了

的區(qū)間未包含

1-aa/2a/27參數(shù)估計95%可信區(qū)間的含義:

從總體中作隨機(jī)抽樣,例如作100次抽樣,每個樣本可算得一個可信區(qū)間,得100個可信區(qū)間,平均有95個可信區(qū)間包括總體均數(shù)m(估計正確),只有5個可信區(qū)間不包括總體均數(shù)m(估計不正確)。

實際中,只作一次抽樣,只得到一個可信區(qū)間,作為未知總體均數(shù)的可能范圍的估計,理論上有95%的可能是正確的,而5%的可能發(fā)生錯誤。7參數(shù)估計選擇:設(shè)某人群的身高值X~N(155.4,5.32),現(xiàn)從該總體中隨機(jī)抽出一個n=10的樣本,算的均數(shù)為158.36cm,S=3.83cm,求得m的95%可信區(qū)間為(155.62,161.10),發(fā)現(xiàn)該區(qū)間未包含總體均數(shù)m=155.4cm。若隨機(jī)從該總體抽取n=10的樣本200個,每次都求95%可信區(qū)間,問大約有多少個可信區(qū)間不包括總體均數(shù)m=155.4cm在內(nèi)?

A5,B20,C10,D1,E37參數(shù)估計mm-1.64sm-1.96sm+1.96sm-2.58sm+2.58s90.00%95.00%99.00%N(m,s2)m+1.64s7參數(shù)估計95%

-1.96

x

+1.96

x99%

-2.58

x

+2.58x90%

-1.64

x

+1.64

x

x_XN(m,s2/n)7參數(shù)估計可信區(qū)間參考值范圍含義

當(dāng)

=0.05時,CI以95%的可能性包含總體均數(shù)。

“正常人”的解剖、生理、生化某項指標(biāo)個體值的波動范圍。計算公式s未知:

正態(tài)分布:

s已知或s未知但為大樣本:

偏態(tài)分布:PX~P100

X

用途

總體均數(shù)的區(qū)間估計

絕大多數(shù)(如95%)觀察對象某項指標(biāo)的分布范圍7參數(shù)估計被估計的總體參數(shù)總體參數(shù)符號表示樣本統(tǒng)計量一個總體均值m比例p方差s2兩個總體均值之差m1-m2比例之差p1-p2方差比s12/s227參數(shù)估計兩均數(shù)之差7參數(shù)估計7參數(shù)估計兩均數(shù)之差的估計7參數(shù)估計分組nS試驗組322.91.9對照組405.22.7例7-7比較某藥治療流行性乙

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論