第五講抽樣分布與參數(shù)估計_第1頁
第五講抽樣分布與參數(shù)估計_第2頁
第五講抽樣分布與參數(shù)估計_第3頁
第五講抽樣分布與參數(shù)估計_第4頁
第五講抽樣分布與參數(shù)估計_第5頁
已閱讀5頁,還剩64頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第五講抽樣分布與參數(shù)估計1【教學目的和要點】

▼通過本講學習,學生應該掌握構建樣本平均數(shù)和樣本比例的抽樣分布以及掌握如何根據樣本的信息推斷總體的信息。2本講內容■有關概念■抽樣分布■參數(shù)估計

?單一總體均值估計

?單一總體比率估計

?兩個總體均值之差估計■確定樣本容量3有關概念參數(shù)與統(tǒng)計量統(tǒng)計誤差4參數(shù)與統(tǒng)計量參數(shù):反應總體分布特征的指標統(tǒng)稱為總體參數(shù),簡稱參數(shù)。常用的有統(tǒng)計量:反應樣本分布特征的指標統(tǒng)稱為樣本統(tǒng)計量,簡稱統(tǒng)計量。常用5總體參數(shù)樣本統(tǒng)計量平均數(shù)方差比率6統(tǒng)計誤差統(tǒng)計誤差非抽樣誤差抽樣誤差:登記性誤差非隨機性誤差隨機性誤差可以度量和控制7抽樣分布樣本統(tǒng)計量的概率分布稱為抽樣分布。用以描述抽樣誤差的規(guī)律性,是統(tǒng)計推斷的理論基礎。8樣本平均數(shù)的概率分布的引出9EAI公司的抽樣問題EAI公司的人事主管正在制定一項公司25000名人員的簡報。其中包括中層管理人員的人均年薪和公司中已完成管理培訓項目的管理人員所占的比率。想知道的指標為:參數(shù):實際可以得到的數(shù)據為統(tǒng)計量101112有關統(tǒng)計量的抽樣分布單一樣本均值的抽樣分布兩個樣本均值之差的抽樣分布樣本比率的抽樣分布13

的抽樣分布單一樣本均值的抽樣分布正態(tài)分布再生定理中心極限定理兩樣本均值差異的抽樣分布14正態(tài)分布再生定理

■當總體服從正態(tài)分布時(分布規(guī)律全部知道),從中抽取樣本容量為n的樣本,樣本均值一定服從正態(tài)分布。

■樣本均值的期望值和方差?它們與總體的期望值和方差有何關系樣本均值的期望值等于總體均值方差(有退還抽樣、無退還抽樣)(退還抽樣)(不退還抽樣)15中心極限定理

■設某總體的元素總量為N,期望值為,標準差為;若從該總體中隨機抽取樣本容量為n的樣本,當n很大(n>30)時,則樣本平均數(shù)的抽樣分布近似為正態(tài)分布,即:(退還抽樣)(不退還抽樣)16兩個樣本均值之差的抽樣分布從兩個總體中分別獨立的抽取樣本容量分別為n1和n2的兩個樣本,在重復選取容量為n1和n2的樣本時,由兩個樣本均值之差的所有可能形式的相對頻數(shù)構成它們分布形態(tài),也稱為兩個樣本均值之差的抽樣分布.17兩個樣本均值之差的抽樣分布(大樣本)兩個總體均值之差,即其分布的方差為各自的方差之和,即從而18二項分布概率函數(shù)如果X是一個隨機變量服從二項分布,樣本容量為n,事件發(fā)生的概率為p,則其中x=0,1,2,…,n。19二項分布的均值和標準差如果X是一個服從二項分布的隨機變量,樣本容量為n,成功概率為p,則其均值、方差和標準差分別為:20二項分布的均值和標準差我們有時更加關心出現(xiàn)成功的比率x/n21比率的抽樣分布設某二項分布總體,總體比率為,若從該總體中隨機抽取樣本容量為n的樣本,當樣本容量足夠大()時,樣本比率p的抽樣

分布近似為正態(tài)分布,即:(退還抽樣)(不退還抽樣)22樣本均值抽樣分布總結正態(tài)分布非正態(tài)分布23參數(shù)估計估計方法點估計區(qū)間估計單一總體均值估計單一總體比率估計兩個總體均值之差估計24參數(shù)估計的統(tǒng)計過程總體均值μ=?從總體中選取幾項組成一個簡單隨機樣本對樣本數(shù)據的匯總提供了樣本均值的值用的值對μ值進行推斷25參數(shù)估計案例1

EAI公司的參數(shù)估計問題EAI公司的人事主管正在制定一項公司25000名人員的簡報。其中包括中層管理人員的人均年薪和公司中已完成管理培訓項目的管理人員所占的比率。想知道的指標為:參數(shù):實際可以得到的數(shù)據為統(tǒng)計量26參數(shù)估計案例2----哈佛大學哈佛大學每年收到7,000個優(yōu)秀學生的入學申請,申請表中包含了大量申請人的信息。包括個人學術能力測試(SAT)成績和是否是本州居民。入學主管需要知道下面一些信息:平均SAT成績本州居民比例27簡單隨機抽樣的數(shù)據

No.

Applicant

SATScore

In-State 1BonnieReight 1025 Yes 2 WillieNeilson 950 Yes 3 FannieLennox1090 No 4 DerekClapton 1120 Yes 5 WinonaDriver 1015 Yes . . . . . . . . 50 KevinCostmore

965

No Total49,850 34Yes28統(tǒng)計量29參數(shù)估計案例3:

鄭州市大瓶裝純水市場估計

1.

估計當前的市場容量2.

預測未來市場的潛力3.

計算各純水品牌的知名度4.

估計各純水品牌的覆蓋率5.

估計各純水品牌的市場占有率6.

估計各純水品牌的滿意度7.

中美純水價格定位30參數(shù)估計案例4:都市研究公司該公司是一家消費者研究組織,它設計調查對消費者所使用的大量的產品和服務進行評估。在某一項調研中,該公司調查消費者對A城市某一主要制造商生產的汽車的性能的滿意度感興趣。分發(fā)給制造商所生產的一種最大型號小汽車用戶的調查表表明,許多人抱怨該車的變速箱過早出現(xiàn)問題。為了更好地了解變速箱的缺陷問題,該公司采用由A城市一家變速箱維修公司所提供的變速箱維修的樣本數(shù)據31數(shù)據(失效前的平均里程)85092.0059465.0032534.0032464.0039323.0094219.0092857.0065605.0064342.0067998.00101769.0121352.074276.0040001.0025066.0069922.0074425.00118444.079294.0086813.0037831.0073341.00138114.085586.0077539.0032609.0077437.0064090.0059902.0089641.00116803.063436.0085861.0061978.0059817.0095774.0069568.0066998.0072069.0077098.0035662.0067202.0053500.0064544.00116269.089341.0085288.0053402.0082256.0088798.0032問題用適當?shù)拿枋鼋y(tǒng)計方法分析變速箱數(shù)據建立變速箱失效汽車總體的在變速箱失效之前行使的平均里程的95%的置信區(qū)間。并給出這個區(qū)間估計的管理解釋。根據一些經歷過變速箱失效的車主們的意見來討論你的統(tǒng)計結果的含義?如果該公司想在誤差為5000英里,估計變速箱失效汽車總體在變速箱失效時所行使的均值里程的95%的置信區(qū)間,則應該抽取多少條維修記錄?為了更充分地評價變速箱失效問題,你還需要收集哪些信息?

33●點估計●區(qū)間估計

參數(shù)估計的方法

34點估計定義:以實際抽樣得到的某一估計量的單一值作為相應總體參數(shù)的估計值的估計稱為點估計估計量優(yōu)良性的標準無偏性:有效性:一致性:當樣本量增加,估計精度提高35常用的優(yōu)良估計量我們用來點估計總體均值.s

來點估計總體標準差.

p

來點估計總體比例π.36調查數(shù)據家庭用戶單位用戶樣本容量800151用水單位6651用水單位占樣本容量的比重8.3%33.8%樣本平均月用水量3.26桶43.4桶樣本用水量的標準差2.947.2937鄭州市大瓶裝純水市場容量的估計

(點估計)

38區(qū)間估計區(qū)間估計的定義區(qū)間估計的原理區(qū)間估計的程序單一總體平均數(shù)的區(qū)間估計單一總體比率的區(qū)間估計兩個總體均值之差的區(qū)間估計39區(qū)間估計的定義?區(qū)間估計是在一定的置信系數(shù)的保證下,根據統(tǒng)計量得到的一個取值范圍去估計總體的參數(shù)。40如果有那么有有95.44%的把握估計區(qū)間包含總體均值區(qū)間估計的基本原理41區(qū)間估計的幾個關鍵概念置信系數(shù)使人相信區(qū)間包含總體均值的概率,一般取0.90,0.95,0.99.它的大小說明估計的把握性的大小(Z=1.651.962.58).置信區(qū)間:在一定概率的保證下,包含總體均值的區(qū)間,區(qū)間的寬窄說明估計精度的大小.區(qū)間越寬,估計的精度就小;否則就大.臨界值:置信區(qū)間的上限和下限注意置信系數(shù)和區(qū)間寬窄的關系42區(qū)間估計的程序選定置信系數(shù)抽取一個樣本容量為n的樣本計算相應的統(tǒng)計量確定統(tǒng)計量的概率分布得到置信區(qū)間的臨界值得到參數(shù)的置信區(qū)間43單一總體平均數(shù)的區(qū)間估計當σ已知時μ的置信區(qū)間當σ未知時μ的置信區(qū)間大樣本小樣本44當已知時計算μ的置信區(qū)間的步驟選定置信系數(shù)抽取一個樣本容量為n的樣本計算確定統(tǒng)計量的概率分布求置信區(qū)間的臨界值單一總體平均數(shù)的置信區(qū)間的臨界值為45當未知時的單一總體平均數(shù)的區(qū)間估計(大樣本)

■由于未知,一般情況下用S替代,■單一總體平均數(shù)的置信區(qū)間的臨界值仍為46單一總體平均數(shù)的置信區(qū)間的臨界值為47T分布(背景材料)t分布又稱學生分布(STUDENT分布)由英國統(tǒng)計學家威廉西利.戈塞特于1908年提出,他當時受雇于愛爾蘭首都的一家啤酒廠,由于該廠不允許雇員用自己的名字發(fā)表成果,于是他采用了學生這個筆名發(fā)表文章,闡述他發(fā)明的小樣本理論。48T分布(t分布的性質)1.t分布是對稱的,即E(t)=E(z)=0

當樣本容量n較小時,t分布的標準差大于1,當時其標準差就趨于1,t分布就近于正態(tài)分布,因為此時S和接近。49

T分布(t分布的性質)2.t分布是一個分布族,不同的n(在統(tǒng)計上也稱自由度)對應于不同的分布。但它們的均值都等于零。3.與標準正態(tài)分布相比。t分布的中心部位較低,兩個尾部較高。50z分布t

分布(n=2)t分布n=15t分布與z分布的比較圖51單一總體平均數(shù)的區(qū)間估計舉例1

(s已知,總體服從任意分布,大樣本)CJF有限公司的參數(shù)估計52CJF有限公司的參數(shù)估計背景:CJF有限公司是一家專營體育設備和器材的郵購公司,公司努力為顧客提供盡可能好的服務。為了跟蹤服務質量,CJF每個月選取顧客的郵購訂單組成簡單隨機樣本,公司與樣本中每一顧客取得聯(lián)系并詢問顧客對服務水平等一系列問題的評價。顧客的回答用于計算樣本中每一顧客的滿意得分,得分值從0(最差等級)到100(最好等級)。然后計算樣本滿意得分的均值。53以往各月的調查顯示,雖然每個月顧客滿意得分的樣本均值都在改變,但是滿意得分的樣本標準差趨于穩(wěn)定在數(shù)值20附近,于是,我們假定總體標準差σ=20。最近一次CJF對顧客滿意程度調查提供了100名顧客的滿意得分數(shù)據(n=100),滿意得分的樣本均值=82。問題CJF希望估計最近一次所有顧客的滿意得分的均值方法:點估計、區(qū)間估計54CJF有限公司平均滿意得分的估計82±1.96*282±3.92(78.08,85.92)注意:如何確定100名顧客的滿意得分數(shù)據樣本均值的概率分布55當已知時的區(qū)間估計的步驟選定置信系數(shù)確定統(tǒng)計量的概率分布抽取一個樣本容量為n的樣本計算求置信區(qū)間的臨界值單一總體平均數(shù)的置信區(qū)間的臨界值為56單一總體平均數(shù)的區(qū)間估計舉例2:哈佛大學哈佛大學每年收到7,000個優(yōu)秀學生的入學申請,申請表中包含了大量申請人的信息。包括個人學術能力測試(SAT)成績和是否是本州居民。根據以往的數(shù)據分析,總體標準差的經驗值為76分。入學主管需要知道下面一些信息----平均SAT成績?方法:簡單隨機樣本一個,容量50人數(shù)據處理結果,樣本均值為997分。問題:估計7,000個優(yōu)秀學生的平均SAT成績57時的單一總體平均數(shù)的區(qū)間估計舉例,教材168頁58s未知

大樣本時的總體均值區(qū)間估計

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論