統(tǒng)計學(xué) 參數(shù)估計_第1頁
統(tǒng)計學(xué) 參數(shù)估計_第2頁
統(tǒng)計學(xué) 參數(shù)估計_第3頁
統(tǒng)計學(xué) 參數(shù)估計_第4頁
統(tǒng)計學(xué) 參數(shù)估計_第5頁
已閱讀5頁,還剩52頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第6章參數(shù)估計劉廷蘭大學(xué)生每周上網(wǎng)花多少時間?為了解學(xué)生每周上網(wǎng)花費的時間,有同學(xué)調(diào)查了某校在校本科生的上網(wǎng)情況,調(diào)查內(nèi)容包括上網(wǎng)時間、頻率、途徑、目的、關(guān)心的校園網(wǎng)內(nèi)容,以及學(xué)生對收費的態(tài)度,包括收費方式、價格等。問卷調(diào)查由調(diào)查員在校園內(nèi)發(fā)放并當(dāng)場回收。對四個年級中每年級各發(fā)60份問卷,其中男、女生各30份。共收回有效問卷共200份。其中有關(guān)上網(wǎng)時間方面的數(shù)據(jù)經(jīng)整理如下表所示大學(xué)生每周上網(wǎng)花多少時間?回答類別人數(shù)(人)頻率(%)3小時以下32163~6小時3517.56~9小時3316.59~12小時2914.512小時以上7135.5合計200100平均上網(wǎng)時間為8.58小時,標準差為0.69小時。全校學(xué)生每周的平均上網(wǎng)時間是多少?每周上網(wǎng)時間在12小時以上的學(xué)生比例是多少?你做出估計的理論依據(jù)是什么?本章主要內(nèi)容一、參數(shù)估計的一般問題二、總體參數(shù)的區(qū)間估計三、樣本容量的確定四Excel在參數(shù)估計中的應(yīng)用本章學(xué)習(xí)目標1.理解參數(shù)估計的概念與特點2.理解參數(shù)估計量優(yōu)劣的評判標準3.掌握參數(shù)估計的方法4.重點掌握單一總體均值、比例的區(qū)間估計5.掌握估計單一總體的均值、比例時樣本容量的確定6.掌握Excel在參數(shù)估計中的應(yīng)用一、參數(shù)估計的一般問題(一)參數(shù)估計的概念與特點(二)估計量的評價標準(三)參數(shù)估計的方法(一)參數(shù)估計的概念與特點也叫抽樣估計,就是根據(jù)樣本統(tǒng)計量去估計總體的參數(shù)

參數(shù)估計特點1、以非全面調(diào)查為基礎(chǔ)

2、以隨機抽樣為前提3、以概率估計推斷總體參數(shù)4、抽樣估計存在抽樣誤差,但可以計算和控制估計量:用于估計總體參數(shù)的隨機變量如樣本均值,樣本比例、樣本方差等例如:樣本均值就是總體均值的一個估計量參數(shù)用表示,估計量用表示估計值:估計參數(shù)時計算出來的統(tǒng)計量的具體值如果樣本均值x=80,則80就是估計量樣本均值的估計值(二)估計量的評價標準

點估計從總體中抽取一個隨機樣本,計算與總體參數(shù)相應(yīng)的樣本統(tǒng)計量,然后把該統(tǒng)計量的具體數(shù)值視為總體參數(shù)的估計值,稱為參數(shù)的點估計。簡單,具體明確優(yōu)點缺點無法控制誤差,僅適用于對推斷的準確程度與可靠程度要求不高的情況點估計的抽樣分布點估計的最大好處:給出確定的值點估計的最大問題:無法控制誤差根據(jù)樣本估計量以一定的可靠程度推斷總體參數(shù)所在的區(qū)間范圍。在點估計的基礎(chǔ)上,給出總體參數(shù)估計的一個區(qū)間范圍,該區(qū)間由樣本統(tǒng)計量加減抽樣誤差而得到的根據(jù)樣本統(tǒng)計量的抽樣分布能夠?qū)颖窘y(tǒng)計量與總體參數(shù)的接近程度給出一個概率度量比如,某班級平均分數(shù)在75~85之間,置信水平是95%樣本統(tǒng)計量

(點估計)置信區(qū)間置信下限置信上限區(qū)間估計區(qū)間估計的圖示x95%的樣本-1.96x+1.96x99%的樣本-2.58x+2.58x90%的樣本-1.65x+1.65x0.6827包含在范圍內(nèi)的概率為68.27%樣本抽樣分布曲線原總體分布曲線0.9545

包含在范圍內(nèi)的概率為95.45%樣本抽樣分布曲線原總體分布曲線0.9973包含在范圍內(nèi)的概率為99.73%樣本抽樣分布曲線總體分布曲線將構(gòu)造置信區(qū)間的步驟重復(fù)很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例,也稱置信度表示為(1-為是總體參數(shù)未在區(qū)間內(nèi)的比例常用的置信水平值有99%,95%,90%相應(yīng)的為0.01,0.05,0.10置信水平

(confidencelevel)

第一,我們?yōu)槭裁匆赃@一個而不是那一個統(tǒng)計量來估計某個總體參數(shù)?

第二,如果有兩個以上的統(tǒng)計量可以用來估計某個總體參數(shù),其估計結(jié)果是否一致?是否一個統(tǒng)計量要優(yōu)于另一個?估計量的評價標準:

無偏性、有效性、一致性問題的提出二、一個總體參數(shù)的區(qū)間估計

(一)總體均值的區(qū)間估計(二)總體比例的區(qū)間估計無偏性:估計量抽樣分布的數(shù)學(xué)期望等于被估計的總體參數(shù)P(

)BA無偏有偏無偏性學(xué)生ABCD成績60708090均值=75方差2=125從中按重復(fù)抽樣方式抽取2人,計算樣本的均值及方差S2

。方差的抽樣分布A60B70C80D90A60606060006070652550608070100200609075225450B707060652550707070007080752550709080100200C808060701002008070752550808080008090852550D90906075225450907080100200908085255090909000無偏性有偏無偏有效性:對同一總體參數(shù)的兩個無偏點估計量,有更小標準差的估計量更有效

AB的抽樣分布的抽樣分布P(

)有效性學(xué)生ABCDEFG成績30405060708090按隨機原則抽選出4名學(xué)生,并計算平均分數(shù)和中位分數(shù)。樣本均值4547.55052.55557.560出現(xiàn)次數(shù)1123445樣本均值62.56567.57072.575出現(xiàn)次數(shù)443211樣本中位數(shù)45505560657075出現(xiàn)次數(shù)

4385834有效性中位數(shù)的抽樣分布平均數(shù)的抽樣分布一致性:隨著樣本容量的增大,估計量的值越來越接近被估計的總體參數(shù)AB較小的樣本容量較大的樣本容量P(

)為的無偏、有效、一致估計量;為的無偏、有效、一致估計量;為的無偏、有效、一致估計量。結(jié)論:估計方法點估計區(qū)間估計(三)參數(shù)估計的方法

二、總體參數(shù)的區(qū)間估計

(一)總體均值的區(qū)間估計(二)總體比例的區(qū)間估計總體均值區(qū)間的一般表達式總體均值的置信區(qū)間是由樣本均值加減估計誤差得到的估計誤差由兩部分組成:一是點估計量的標準誤差,它取決于樣本統(tǒng)計量的抽樣分布。二是估計時所要的求置信水平為時,統(tǒng)計量分布兩側(cè)面積為的分位數(shù)值,它取決于事先所要求的可靠程度總體均值在置信水平下的置信區(qū)間可一般性地表達為樣本均值±分位數(shù)值×樣本均值的標準誤差(一)總體均值的區(qū)間估計總體分布樣本容量(重復(fù)抽樣)正態(tài)總體大樣本當(dāng)樣本容量足夠大時,采用:小樣本非正態(tài)總體大樣本小樣本——【例】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,為對產(chǎn)量質(zhì)量進行監(jiān)測,企業(yè)質(zhì)檢部門經(jīng)常要進行抽檢,以分析每袋重量是否符合要求。現(xiàn)從某天生產(chǎn)的一批食品中隨機抽取了25袋,測得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布,且總體標準差為10克。試估計該批產(chǎn)品平均重量的置信區(qū)間,置信水平為95%25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3解:已知X~N(,102),n=25,1-=95%,z/2=1.96。

即:該食品平均重量的置信區(qū)間在101.44—109.28克之間?!纠磕称髽I(yè)生產(chǎn)的燈泡,根據(jù)其積累的歷史資料,燈泡使用壽命的方差為625小時2。該企業(yè)某一天生產(chǎn)燈泡18000只,從中以簡單隨機抽樣方式抽取60只檢測,其平均壽命為2000小時。試以95%的置信度估計該天生產(chǎn)的全部燈泡的平均壽命范圍。

分析:在總體方差已知的情況下,雖然不知道燈泡壽命是否服從正態(tài)分布,但由于抽取的樣本容量為60,是一個大樣本,根據(jù)中心極限定理,樣本均值近似服從正態(tài)分布,即

解:即可以用95%的概率保證該天生產(chǎn)燈泡的平均壽命介于1993.685~2006.315小時之間。總體均值的區(qū)間估計

(小樣本的估計)1. 假定條件總體服從正態(tài)分布,但方差(2)

未知小樣本(n<30)使用t

分布統(tǒng)計量總體均值在1-置信水平下的置信區(qū)間為總體均值的區(qū)間估計

(小樣本的估計)【例】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,為對產(chǎn)量質(zhì)量進行監(jiān)測,企業(yè)質(zhì)檢部門經(jīng)常要進行抽檢,以分析每袋重量是否符合要求。現(xiàn)從某天生產(chǎn)的一批食品中隨機抽取了25袋,測得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布。試估計該批產(chǎn)品平均重量的置信區(qū)間,置信水平為95%25袋食品的重量112.5101.0103.0102.0100.5102.6107.5

95.0108.8115.6100.0123.5102.0101.6102.2116.6

95.4

97.8108.6105.0136.8102.8101.5

98.4

93.3總體均值的區(qū)間估計

(小樣本的估計)解:已知X~N(,102),n=25,1-=95%,z/2=1.96。根據(jù)樣本數(shù)據(jù)計算得:。由于是正態(tài)總體,且方差已知。總體均值在1-置信水平下的置信區(qū)間為該食品平均重量的置信區(qū)間為101.44g~109.28g總體方差未知時總體均值的估計1. 假定條件總體服從正態(tài)分布如果是非正態(tài)分布,可由正態(tài)分布來近似(n

30)樣本均值服從t分布,如:重復(fù)抽樣條件下,總體均值在1-置信水平下的置信區(qū)間為抽樣極限誤差【例】已知某種燈泡的壽命服從正態(tài)分布,現(xiàn)從一批燈泡中隨機抽取16只,測得其使用壽命(小時)如下。建立該批燈泡平均使用壽命95%的置信區(qū)間16燈泡使用壽命的數(shù)據(jù)1510152014801500145014801510152014801490153015101460146014701470解:已知X~N(,2),n=16,1-=95%,t/2=2.131。根據(jù)樣本數(shù)據(jù)計算得:

總體均值在1-置信水平下的置信區(qū)間為即:該種燈泡平均使用壽命的置信區(qū)間為1476.8小時~1503.2小時總體是否接近正態(tài)分布N≥30總體是否接近正態(tài)分布?N≥30用s代替N≥30yesNoyesNoyesyesNoNoσ是否已知用s代替用s代替總體均值區(qū)間估計小結(jié)(二)總體比例的區(qū)間估計

(傳統(tǒng)方法)1. 假定條件總體服從二項分布可以由正態(tài)分布來近似np(成功次數(shù))和n(1-p)(失敗次數(shù))均應(yīng)該大于10使用正態(tài)分布統(tǒng)計量z3.總體比例在1-置信水平下的置信區(qū)間為樣本比例±分位數(shù)值×樣本比例的標準誤差總體比例的區(qū)間估計

(例題分析—傳統(tǒng)方法)【例】某城市想要估計下崗職工中女性所占的比例,隨機地抽取了100名下崗職工,其中65人為女性職工。試以95%的置信水平估計該城市下崗職工中女性比例的置信區(qū)間解:已知n=100,p=65%,1-=95%,z/2=1.96該城市下崗職工中女性比例的置信區(qū)間為55.65%~74.35%

一幾機構(gòu)對369名有工作的父母的一項調(diào)查表明,他們當(dāng)中有200名承認由于工作有約而使得與其子女相處時間過少。

A.求總體中由于工作有約而使得與其子女相處時間過少父母所占的比率的點估計。B.當(dāng)置信水平為95%時,邊界誤差為多大?C.求總體中由于工作有約而使得與其子女相處時間過少父母所占比率的95%置信區(qū)間估計。樣本容量調(diào)查誤差調(diào)查費用小樣本容量節(jié)省費用但調(diào)查誤差大大樣本容量調(diào)查精度高但費用較大找出在規(guī)定誤差范圍內(nèi)的最小樣本容量找出在限定費用范圍內(nèi)的最大樣本容量確定樣本容量的意義三、樣本容量的確定

確定方法1.重復(fù)抽樣條件下:通常的做法是先確定置信水平,查找相應(yīng)的臨界值z或t,然后限定邊際誤差,又稱極限誤差。

①2未知時,一般采用過去的經(jīng)驗數(shù)據(jù);②如果經(jīng)驗數(shù)據(jù)未知,則應(yīng)考慮s2代替2來計算。但s2通常也是個未知數(shù),解決方法有:第一,利用歷史的樣本資料進行計算;第二,利用同類型的調(diào)查資料計算求得;第三,組織試驗性調(diào)查取得數(shù)據(jù);第四,若有多個不同的值,則取其最大值。

計算結(jié)果通常向上進位估計總體均值時樣本容量的確定

2.不重復(fù)抽樣條件下:確定方法注意2未知,用s2代替時,應(yīng)根據(jù)置信度確定t臨界值【例】擁有工商管理學(xué)士學(xué)位的大學(xué)畢業(yè)生年薪的標準差大約為2000元,假定想要估計年薪95%的置信區(qū)間,希望邊際誤差為400元,應(yīng)抽取多大的樣本容量?解:

已知=2000,

=400,1-=95%,z/2=1.96即應(yīng)抽取97人作為樣本【例】某藥廠為了檢查瓶裝藥品數(shù)量,從成品庫隨機抽檢100瓶,結(jié)果平均每瓶101.5片,標準差為3片。是以99.73%的把握程度推斷成品庫該種藥平均每瓶數(shù)量的置信區(qū)間,如果允許誤差減少到原來1/2,其他條件不變,問需要抽取多少瓶?總體方差的大小;允許誤差(邊際誤差)的大小;置信度(概率保證程度);抽樣方法;抽樣的組織方式。重復(fù)抽樣條件下:不重復(fù)抽樣條件下:影響樣本容量的因素

EXCEL中與參數(shù)估計有關(guān)的常用函數(shù)1.COUNT(number1,number2,……)函數(shù)——計算樣本容量2.AVERAGE(number1,number2,……)函數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論