單變量推論統(tǒng)計(jì)參數(shù)估計(jì)_第1頁
單變量推論統(tǒng)計(jì)參數(shù)估計(jì)_第2頁
單變量推論統(tǒng)計(jì)參數(shù)估計(jì)_第3頁
單變量推論統(tǒng)計(jì)參數(shù)估計(jì)_第4頁
單變量推論統(tǒng)計(jì)參數(shù)估計(jì)_第5頁
已閱讀5頁,還剩25頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

單變量推論統(tǒng)計(jì)參數(shù)估計(jì)第一頁,共三十頁,2022年,8月28日第一節(jié)抽樣分布一、相關(guān)名詞解釋參數(shù)值統(tǒng)計(jì)值隨機(jī)抽樣隨機(jī)樣本第二頁,共三十頁,2022年,8月28日二、蒙特卡羅抽樣分布:常見的統(tǒng)計(jì)問題是:總體未知,比如我們并不知道華電所有學(xué)生的大學(xué)語文的平均分為u=65。我們只是隨機(jī)抽樣,比如抽取了3000名學(xué)生,得知這個3000名學(xué)生所構(gòu)成的樣本的均值=64。因此我們用得到的這個樣本統(tǒng)計(jì)值去估計(jì)總體的參數(shù)值。但是我們都知道,樣本是隨機(jī)抽取的,不同的人抽取到的樣本(假設(shè)讓全班28個人每個人都抽一個3000人容量的樣本)是不同的,同一個人反復(fù)抽樣時也很可能抽取到不同的樣本。根據(jù)排列組合,抽到的是無限個情況的樣本。我們反復(fù)從華電學(xué)生(假設(shè)是10000名)中抽3000個人組成樣本,每次都計(jì)算出一個新的樣本均值,那么將會得到無數(shù)個樣本均值,這種重復(fù)抽樣的方法就叫蒙特卡羅抽樣方法。從每個樣本中可以計(jì)算出一個樣本均值,我們將重復(fù)抽取的n個樣本的都計(jì)算出來,研究發(fā)現(xiàn),這些均值就構(gòu)成了均值的蒙特卡羅抽樣分布。第三頁,共三十頁,2022年,8月28日因此可見,它是一種理論分布。研究發(fā)現(xiàn):1、抽樣分布的圖形顯示樣本均值圍繞其目標(biāo)u,以標(biāo)準(zhǔn)誤差SE=σ/近似正態(tài)地波動。(因此n越大,SE越小,即波動越小)2、同樣地,我們發(fā)現(xiàn)樣本比例p也可以用這個方法來處理,它圍繞其目標(biāo)P,以標(biāo)準(zhǔn)誤差SE=近似正態(tài)地波動。第四頁,共三十頁,2022年,8月28日三、對比總體分布、樣本分布、抽樣分布1、參數(shù)值:u和σ都是唯一確定的值。統(tǒng)計(jì)值:由于總體容量N〉樣本容量n,因?yàn)橹貜?fù)抽樣時,每次抽取到的元素都會不盡相同。因此,不同的樣本的統(tǒng)計(jì)量很可能不同。2、抽樣中樣本只涉及到總體中的部分元素而不是全部元素。因?yàn)闃颖镜慕y(tǒng)計(jì)量與總體的參數(shù)值之間總是存在一定的差別,我們引入抽樣分布的概念,旨在對這種差別進(jìn)行一定的說明。3、均值的正態(tài)近似原理:樣本均值以SE的標(biāo)準(zhǔn)誤差圍繞總體均值u波動。隨著n的增加,波動越來越小,越接近正態(tài)分布。(n≥30)第五頁,共三十頁,2022年,8月28日4、比例的正態(tài)近似定理:在容量為n的隨機(jī)樣本中,樣本比例p以SE=的標(biāo)準(zhǔn)誤差圍繞總體比例波動。隨著n的增加,p的分布也就圍繞其目標(biāo)波動地原來越小,越來越接近正態(tài)分布。(n≥30,np≥5)5、抽樣分布是關(guān)于樣本均值的分布,它的均值就是總體的均值u,即。。。,而抽樣分布的標(biāo)準(zhǔn)差,將之稱為標(biāo)準(zhǔn)誤差SE,以與總體分布、樣本分布相區(qū)分。其中SE=,而當(dāng)樣本相當(dāng)大時,一般用樣本的標(biāo)準(zhǔn)差s來代替總體。第六頁,共三十頁,2022年,8月28日例:臺灣的一次普遍調(diào)查顯示,臺灣民眾的月收入近似地服從正態(tài)分布,其均值為13110臺幣,標(biāo)準(zhǔn)差為8750元,求:(1)隨機(jī)地抽取一個人,其收入超過18430元的概率。(2)抽取一個含有50人的隨機(jī)樣本,求其平均收入超過16000元的概率。(3)如果總體不是正態(tài)的,那么(2)的答案是什么?第七頁,共三十頁,2022年,8月28日例:全廠滿意工作環(huán)境的工人比例為35%,現(xiàn)在從全廠中隨機(jī)抽取150名工人,問其滿意工作環(huán)境的工人比例超過45%的概率。第八頁,共三十頁,2022年,8月28日作業(yè)題:1、試計(jì)算以下數(shù)值的四分位差、中位數(shù)、眾數(shù)2,3,4,5,4,4,2,5,6,6,7第九頁,共三十頁,2022年,8月28日2、調(diào)查某地區(qū)的212個鄉(xiāng),目的是要知道每個鄉(xiāng)之育齡婦女(15-44歲)落實(shí)計(jì)劃生育的比率,以下為收集到的資料。1)試求四分位差。2)試求40百分位數(shù)點(diǎn)的值。節(jié)育率(%)頻次向上累加頻次5及以下16165-15385415-25409425-353012435-452314745-552417155-651919065及以上22212匯總212第十頁,共三十頁,2022年,8月28日第二節(jié)參數(shù)的點(diǎn)估計(jì)和區(qū)間估計(jì)一、點(diǎn)估計(jì)1、總體均值的點(diǎn)估計(jì)值。2、總體方差的點(diǎn)估計(jì)值。3、總體標(biāo)準(zhǔn)差的點(diǎn)估計(jì)值。4、總體比例的點(diǎn)估計(jì)值。第十一頁,共三十頁,2022年,8月28日二、區(qū)間估計(jì)(即:求置信區(qū)間)1、基本概念置信度:又稱可信度、置信水平。即總體的參數(shù)值落在置信區(qū)間的把握。或者說用置信區(qū)間去估計(jì)總體參數(shù)值時,成功的可能性有多大。置信區(qū)間:在一定的置信水平下,根據(jù)樣本的統(tǒng)計(jì)值來估計(jì)總體的參數(shù)值處于一定的區(qū)間之內(nèi),這個區(qū)間就是置信區(qū)間。顯著度:又稱顯著性水平。它表示用置信區(qū)間來估計(jì)總體參數(shù),其不可靠的概率。若置信水平為95%,則顯著性水平為5%或0.05。第十二頁,共三十頁,2022年,8月28日2、置信區(qū)間與置信度之間的關(guān)系相互制約置信度高低反映的是這種估計(jì)的可靠性或把握性的問題,而置信區(qū)間的大小反映的是這種估計(jì)的精確性問題。對于同一個總體和同一個抽樣規(guī)模來說,所給區(qū)間的大小與做出這種估計(jì)所具有的把握性成正比。即區(qū)間越大,則對這一估計(jì)成功的把握性也越大;反之,則把握性越小。綜上,從精確性出發(fā),要求所估計(jì)的區(qū)間越小越好,但是從把握性出發(fā),又要求所估計(jì)的區(qū)間越大越好。人們總是需要在二者兼進(jìn)行平衡與選擇。第十三頁,共三十頁,2022年,8月28日3、總體均值的區(qū)間估計(jì)1)總體方差σ已知時,大、小樣本的均值估計(jì)2)總體方差σ未知時,大樣本的均值估計(jì)3)總體方差σ未知時,小樣本的均值估計(jì)4)未知總體比例(成數(shù)),大樣本的比例估計(jì)5)未知總體比例,小樣本的比例估計(jì)例:設(shè)某工廠婦女從事家務(wù)勞動時間服從正態(tài)分布N(u,),隨機(jī)抽取了一個n=36的樣本,發(fā)現(xiàn)其每天平均從事家務(wù)勞動的時間=2.65小時,求u的雙側(cè)置信區(qū)間。(a=0.05)解:第十四頁,共三十頁,2022年,8月28日例:設(shè)某工廠婦女從事家務(wù)勞動時間服從正態(tài)分布N(u,),隨機(jī)抽取了一個n=25的樣本,發(fā)現(xiàn)其每天平均從事家務(wù)勞動的時間=2.65小時,求u的雙側(cè)置信區(qū)間。(a=0.05)解:第十五頁,共三十頁,2022年,8月28日總結(jié):1)總體參數(shù)u是常數(shù),并且一直保持不變,變化的是隨機(jī)區(qū)間,其中心為,長度為2SE。2)隨著樣本含量n的增加,的標(biāo)準(zhǔn)誤差σ/也越來越小,因此置信區(qū)間也變得更窄更精確。這就是增加樣本含量的價值。3)隨著置信度的增高,也隨之增大,因此置信區(qū)間變得更寬,即更加含糊不明確,這也是可以理解的:要想把某一個聲明表達(dá)得更有把握,就必須使其更加含糊不明確。因此置信度和精確度之間是矛盾的。我們對于實(shí)際問題總是在兩者之間作一個合理的折衷。第十六頁,共三十頁,2022年,8月28日例:設(shè)某社區(qū)受教育程度服從正態(tài)分布N(u,σ),根據(jù)35人的隨機(jī)抽樣調(diào)查,=11.5年,S=3.6年,求u的雙側(cè)置信區(qū)間。(a=0.01)解:第十七頁,共三十頁,2022年,8月28日

例:設(shè)某社區(qū)受教育程度服從正態(tài)分布N(u,σ),σ未知,根據(jù)26人的隨機(jī)抽樣調(diào)查,=11.5年,S=3.6年,求u的雙側(cè)置信區(qū)間。(a=0.01)解:第十八頁,共三十頁,2022年,8月28日t分布是適用于小樣本的一種分布。其扁平或高聳的程度取決于自由度(df=n-1),其自由度越大,越高聳,形狀與標(biāo)準(zhǔn)正態(tài)分布曲線越接近。當(dāng)n≥30時,一般認(rèn)為與正態(tài)分布近似。t分布與正態(tài)分布的相似之處:t分布基線上的t值從-∞-+∞;平均數(shù)等于0處,左側(cè)t值為負(fù),右側(cè)t值為正;曲線以平均數(shù)處為最高點(diǎn)向兩側(cè)逐漸下降,尾部無限延伸,永不與基線相接,呈單峰對稱形。

使用t分布的條件:必須假定總體為正態(tài)分布。(與使用Z分布的不同之處)第十九頁,共三十頁,2022年,8月28日為什么t分布的自由度是n-1而不是n呢?自由度:指的是可以自由取值的個案的數(shù)目,對于一組數(shù)據(jù)來說,假定n=1,則我們可以算出均值(就是這個唯一的數(shù)本身),但是無法考慮分布的形狀。描述分布的形狀最有價值的是方差,只有n超過1,我們才能得到這組數(shù)據(jù)分布的方差。(=),因此對于方差來說,均值占用了一個自由度,其余的n-1個自由度留給了方差。例:有5個數(shù),其均值為3,請問:1)你能確定這5個數(shù)都是什么嗎?2)如果不能,那么請問其中有幾個數(shù)是可以自由取值的?第二十頁,共三十頁,2022年,8月28日戈塞爾用筆名“學(xué)生”發(fā)表。為什么分母中根號下為n-1?樣本數(shù)據(jù)的離散程度小于總體數(shù)據(jù)的離散程度(假設(shè)用全距這個離散量數(shù)來說明)。因此樣本的標(biāo)準(zhǔn)差會比總體的標(biāo)準(zhǔn)差偏小。因此s除以根號n會有偏誤,所以采用了根號n-1,在n<30時,根號n-1會比根號n有很大的修正。(σ/〉S/,而S/>S/,因此分母中為更貼近于σ/)第二十一頁,共三十頁,2022年,8月28日例:從某社區(qū)取n=200個家庭的樣本,36%的家庭中家庭事務(wù)是丈夫說了算,問:此社區(qū)家庭事務(wù)是丈夫說了算的家庭比例的置信區(qū)間。(a=0.01)解:法一:法二:第二十二頁,共三十頁,2022年,8月28日4、二總體均值差的區(qū)間估計(jì)1)已知σ

,大樣本(n1+n2≥100)2)已知σ

,小樣本(n1+n2<100)3)未知σ

,大樣本4)未知σ

,小樣本5、二總體成數(shù)差的區(qū)間估計(jì)第二十三頁,共三十頁,2022年,8月28日例:為了了解甲、乙兩地中學(xué)畢業(yè)生成績的差別,兩地作了抽樣調(diào)查,結(jié)果顯示:甲地:=520,S1=40,n1=800名,乙地:=505,S2=50,n2=1000名,求:a=0.05時,兩地平均成績差的區(qū)間估計(jì)。

第二十四頁,共三十頁,2022年,8月28日例:有兩個小組,甲小組:n1=11,人均每周抽煙=5盒,S1=1.5。乙小組:n2=11,人均每周抽煙=7盒,S2=2.0,求:a=0.05時,兩組抽煙均值差的置信區(qū)間。

第二十五頁,共三十頁,2022年,8月28日例:甲、乙兩地各做1000戶抽樣調(diào)查,其中甲地?fù)碛须娨暀C(jī)為825戶;乙地?fù)碛须娨暀C(jī)為760戶。求:a=0.05時,兩地電視機(jī)擁有比例(成數(shù))差的置信區(qū)間。第二十六頁,共三十頁,2022年,8月28日6、單側(cè)置信區(qū)間第二十七頁,共三十頁,2022年,8月28日例:設(shè)某工廠月平均收入服從正態(tài)分布N(u,),隨機(jī)抽取了一個n=36的樣本,發(fā)現(xiàn)其每人平均月平均收入為265元,求u的單側(cè)置信區(qū)間。(a=0.05)解:第二十八頁,共三十頁,2022年,8月28日作業(yè):1、我國某地區(qū)成年人教育水平的均值為8.2年

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論