lec13 總體參數(shù)的區(qū)間估計與假設檢驗_第1頁
lec13 總體參數(shù)的區(qū)間估計與假設檢驗_第2頁
lec13 總體參數(shù)的區(qū)間估計與假設檢驗_第3頁
lec13 總體參數(shù)的區(qū)間估計與假設檢驗_第4頁
lec13 總體參數(shù)的區(qū)間估計與假設檢驗_第5頁
已閱讀5頁,還剩38頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

總體參數(shù)的區(qū)間估計

與假設檢驗第十三講大綱參數(shù)的區(qū)間估計含義基本步驟總體均值、方差和比例的區(qū)間估計參數(shù)假設檢驗的基本概念基本思想p值否定域與接受域區(qū)間估計問題的提出例:已知來自正態(tài)總體的樣本均值,如果我們進行大量的重復抽樣,那么95%的

Xbar會落在一個什么樣的關于

的對稱區(qū)間中?根據(jù),得到

r=normsinv(0.975)*

=1.96

當m已知時我們可以得到上式的含義:一次抽樣后,我們得到一個來自正態(tài)總體的樣本均值,它有95%的可能性落在區(qū)間(m-r,m+r)中但是m是未知的,如何根據(jù)

求m的區(qū)間?求m的區(qū)間當

已知,m未知時,把m作為未知數(shù)求解,得到上式的含義:區(qū)間

有95%的概率包含真實的參數(shù)m

每次抽樣會有一個,從而區(qū)間會隨樣本的不同而變化,成為隨機區(qū)間注意:

m不是隨機變量總體均值的置信區(qū)間如果區(qū)間滿足則稱之為總體均值m置信度為95%的置信區(qū)間我們有95%的把握保證該區(qū)間包含真實的m反復抽取容量為n的樣本,都可得一個置信區(qū)間,但每個置信區(qū)間不一定包含未知參數(shù)的真值,而包含真值的區(qū)間占95%注意:不能說,m有95%的可能性落在區(qū)間

內,因為m不是隨機變量置信區(qū)間的一般定義如果

,則稱為總體參數(shù)q的置信區(qū)間,其中,1-

a為置信度或置信水平,a為顯著水平置信區(qū)間的理解要點根據(jù)一組樣本觀測值作出估計,給出估計值的范圍用概率術語(置信度或置信水平)說明估計值與未知總體參數(shù)的接近程度區(qū)間估計的基本步驟區(qū)間估計就是求解置信區(qū)間確定待估參數(shù)和置信水平;確定估計量,并找出估計量的抽樣分布;利用抽樣分布給出置信區(qū)間重點是確定估計量,它含有待估參數(shù),不含其它未知參數(shù),它的分布已知,

且分布不依賴于待估參數(shù)關鍵是確定2已知時,總體均值的區(qū)間估計適用情形:來自正態(tài)總體的抽樣,且方差已知

大樣本情形,總體方差已知都有樣本均值服從正態(tài)分布將該分布轉化為標準正態(tài)分布,即推導置信區(qū)間半徑r對于1-

a的置信區(qū)間,有90%置信度的區(qū)間半徑為95%置信度的區(qū)間半徑為99%置信度的區(qū)間半徑為a越小,r越大要求的置信度越高,區(qū)間半徑越大Excel中的Confidence函數(shù)運用Excel中的Confidence函數(shù),直接求置信區(qū)間的半徑rr又稱之為極限誤差

Confidence(a,standard_dev,size)a為顯著水平Standard_dev:總體標準差(如果已知);或樣本標準差(如果總體標準差未知,又是大樣本情形)Size:樣本容量

對置信區(qū)間的模擬與觀察用Excel進行置信區(qū)間的計算從一個均值為5,標準差為3的正態(tài)總體進行1000次重復抽樣,每個樣本包含10個樣本點?,F(xiàn)在每個樣本的均值已知總體均值未知,但總體方差已知觀察在不同的置信度下,1000個置信區(qū)間包含真實總體均值的比例例假設樣本取自50名乘車上班的員工,他們花在路上的平均時間為30分鐘,總體標準差為2.5分鐘。則總體均值落入下列區(qū)域內的置信度為95%:即:Confidence(0.05,2.5,50)=0.692951花在上班路上的平均時間為30±0.692951分鐘,或29.3到30.7分鐘說明在前面的估計中,我們都假定樣本為簡單隨機樣本,即為放回隨機抽樣得到的在不放回抽樣的時候,我們需要引入一個有限總體修正系數(shù)

,其中N為總體單位數(shù),n為樣本容量。這時有限總體修正系數(shù)主要適用于當n占N比例很大時的不放回抽樣例一個擁有50位員工的公司想了解員工每天上網(wǎng)的時間,抽樣記錄了10位員工,結果平均數(shù)為60分鐘。已知該公司員工上網(wǎng)的時間為正態(tài)分布,標準差為20分鐘,求總體均值90%的置信區(qū)間

=Confidence(a,standard_dev,size)*=Confidence(0.1,20,10)*(40/49)^0.5=9.4所以總體均值90%的置信區(qū)間為(50.6,69.4)如果不考慮有限總體修正系數(shù),得到的置信區(qū)間為(49.6,70.4),區(qū)間變大根據(jù)誤差,求樣本容量接上題,如果希望誤差不超過5分鐘,應該選取多少人?根據(jù)

可知:2未知時,總體均值的區(qū)間估計當總體方差未知,又是正態(tài)總體時,有統(tǒng)計量當n很大時,近似服從標準正態(tài)分布置信區(qū)間半徑

ta=tinv(a,df)有限總體修正系數(shù)例張先生是臺灣某集團的企劃部經(jīng)理,在今年的規(guī)劃中,集團準備在某地新建一家新的零售商店,設立商店要求行人數(shù)最低為520。張先生目前正在做這方面的準備工作。其中經(jīng)過該地行人數(shù)量是他要考慮的一個很重要的方面。張先生委托他人進行了兩個星期的觀察,得到每天經(jīng)過該地人數(shù)如下:544,468,399,759,526,212,256,456,553,259,469,366,197,178根據(jù)以上數(shù)據(jù),張先生應該作出怎樣的判斷?張先生決策的依據(jù)就是經(jīng)過此地的行人數(shù)是否平均每天達到520人需要計算總體均值的置信區(qū)間,取a=5%問題性質:小樣本,總體方差未知,正態(tài)總體,n占N比例很小=tinv(0.05,13)*得到的置信區(qū)間為(306,500)含義:有95%的把握可以認為每天的平均行人數(shù)在(306,500)之間,沒有達到520,不建議設店正態(tài)總體方差的區(qū)間估計當m已知時,,從而得到得2

置信度為1-

a的置信區(qū)間為

正態(tài)總體方差的區(qū)間估計當m未知時,有統(tǒng)計量置信區(qū)間為這種情形是最常見和常用的=Chiinv(a/2,n-1)某工廠生產(chǎn)一批滾珠,其直徑X服從正態(tài)分布N(

2),現(xiàn)從某天的產(chǎn)品中隨機抽取

6

件,測得直徑為

15.1,

14.8,

15.2,

14.9,

14.6,

15.1

(1)若

2=0.06,求

的置信區(qū)間

(2)若

2未知,求

的置信區(qū)間

(3)求方差

2的置信區(qū)間練習總體比例的區(qū)間估計已知如果樣本容量n足夠大(np和n(1-p)都大于5),或者即使n不大,只要p接近0.5,樣本比例的樣本分布為:

標準化的結果為:

同理可以得出對總體比例p的區(qū)間估計半徑總體參數(shù)的假設檢驗什么是假設檢驗利用樣本所提供的信息判斷各種說法的真?zhèn)?,對總體參數(shù)進行一種推斷基本思想:概率性質的反證法小概率事件在一次試驗中幾乎不可能發(fā)生,p≤0.05先假設某種說法成立,導出了不合理的現(xiàn)象,說明原假設不正確;沒有導出不合理現(xiàn)象,不能拒絕原假設概率性質的反證法與反證法兩者是有區(qū)別的反證法不合理是邏輯中的絕對矛盾概率性質的反證法基于小概率事件在一次觀察中被認為基本不會發(fā)生不存在邏輯中的絕對矛盾如果原假設真的成立,而得到樣本觀測結果的概率很小,一個小概率的事件在一次實驗中居然發(fā)生了,這是我們不能夠接受的,在這種情況下我們只能拒絕原假設例子討論一家速遞公司聲稱該公司市內門到門的速遞時間平均只有28分鐘,為了證實該廣告是否可靠,我們隨機跟蹤了100件業(yè)務,結果發(fā)現(xiàn)其平均投遞時間為31.5分鐘,標準差為5分鐘。請問它的廣告可信嗎?假設廣告可信,看看會不會產(chǎn)生不合理的現(xiàn)象令H0代表所提出的假設,H0:m=28;令H1代表與此對立的假設,H1:m≠28;先看一下置信區(qū)間因為n=100,為大樣本情形,可以認為近似有當n=100,Xbar=31.5,a=5%時,m的置信區(qū)間為[30.5,32.5]因為28<30.5,因此原假設所聲稱的m=28不在95%的置信區(qū)間內我們有95%的把握可以拒絕H0,做出這樣的結論并不是百分之百正確,但我們犯錯誤的可能性為a=5%再看一下概率如果H0:m=28真的成立的話,那么我們隨機調查的結果為

的可能性為多少?=1-normdist(31.5,28,5/100^0.5,1)=0如果原假設真的成立,那么出現(xiàn)我們上述隨機調查結果的概率幾乎為零一個零概率的事件在一次實驗中居然發(fā)生了,這是我們不能接受的,所以我們只能拒絕原假設假設檢驗中的兩類錯誤零假設:又稱原假設、基本假設,陳述的是需要檢驗的假設,用H0表示備擇假設:又稱被選假設、對立假設,陳述的是與零假設的對立情況,用H1表示第一類錯誤:以真為假,把正確的假設當作錯誤予以否定后果往往嚴重,出現(xiàn)第一類錯誤的概率記為a第二類錯誤:以假為真,把錯誤的假設認為正確予以接受,出現(xiàn)概率記作b

通常不易計算兩類錯誤與司法審判裁決

實際情況裁決實際情況有罪無罪有罪無罪有罪正確第II類錯誤冤枉好人有罪正確第I類錯誤冤枉好人無罪第I類錯誤放走壞人正確無罪第II類錯誤放走壞人正確法院裁決H0

:有罪法院裁決H0

:無罪判斷實際情況H0為真H0為假接受H01-a第二類錯誤(b),取偽拒絕H0第一類錯誤(a),棄真檢驗力(1-b)統(tǒng)計檢驗過程:H0

檢驗不能同時降低兩類錯誤在一定的樣本容量下,減小第一類錯誤發(fā)生的概率,必然增大第二類錯誤發(fā)生的概率在假設檢驗中,我們通常只關注第一類錯誤的發(fā)生,只對a的大小予以限制這是因為第一類錯誤發(fā)生的概率易于計算檢驗力(power):1-b減小第二類錯誤發(fā)生的概率,意味著提高檢驗力提高檢驗力的途徑:增加樣本容量,加大零假設與備擇假設間的差異性,減少調查誤差圖示:

a

與b

的說明H0:m=m0;H1:m=m1當樣本均值落在紅線左邊的陰影的區(qū)域內時,我們拒絕H0,此時我們犯錯誤的概率為a

當樣本均值落在紅線右邊的陰影區(qū)域內時,其概率為b,我們不能拒絕H0,此時我們犯錯誤的概率為bp值p值是一個概率值;它是原假設為真時,樣本統(tǒng)計量不同于(大于或小于,依情況而定)實測值的概率p值還被稱為觀察到的(或實測的)樣本值的顯著性水平,是H0能被拒絕的最小值

p值越小,表明原假設越有可能為假當p值大于顯著水平時,拒絕原假設當p值小于顯著水平時,不能拒絕原假設否定域與接受域給定統(tǒng)計量或p值的臨界值,當統(tǒng)計量或p值超過臨界值時,我們會拒絕原假設由統(tǒng)計量或p值臨界值所確定的拒絕原假設的區(qū)域稱為拒絕域,反之為接受域假設檢驗中通常選擇顯著水平a作為p值的臨界值拒絕域的大小與顯著水平a的大小有關同一組樣本值,在不同的顯著水平下,可能得出截然相反的結論否定域的分布通常而言,否定域位于統(tǒng)計量分布曲線的尾部,具體的方向取決于備擇假設的具體內容對于H1:m≠m0,拒絕域在分布曲線的兩側,稱為雙尾或雙側檢驗對于H1:m>m0,拒絕域在分布曲線的右側對于H1:m<m0,拒絕域在分布曲線的左側建立檢驗假設的原則將樣本觀測值所支持的結論作為備擇假設H1這是因為當我們拒絕零假設時,我們所犯的錯誤概率是可以控制的,所以應當把期望拒絕的結論作為零假設,期望保護的結論作為備擇假設同時,根據(jù)概率意義下的反證法,拒絕原假設是有說服力的,而接受原假設是沒有說服力的。因此應把希望否定的假設作為原假設例觀察到樣本均值

,可以建立的假設檢驗有:H0:m=

103;H1:m≠103

或H0:m≥

103;H1:m<103如果反過來會怎樣?H0:m≤

103;H1:m>103拒絕域在右側,由于樣本均值≤103,這樣我們永遠沒有機會拒絕原假設!雙尾檢驗適用于檢驗無方向性的研究假設,這種假設表明的是

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論