lec13 總體參數(shù)的區(qū)間估計(jì)與假設(shè)檢驗(yàn)_第1頁
lec13 總體參數(shù)的區(qū)間估計(jì)與假設(shè)檢驗(yàn)_第2頁
lec13 總體參數(shù)的區(qū)間估計(jì)與假設(shè)檢驗(yàn)_第3頁
lec13 總體參數(shù)的區(qū)間估計(jì)與假設(shè)檢驗(yàn)_第4頁
lec13 總體參數(shù)的區(qū)間估計(jì)與假設(shè)檢驗(yàn)_第5頁
已閱讀5頁,還剩38頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

總體參數(shù)的區(qū)間估計(jì)

與假設(shè)檢驗(yàn)第十三講大綱參數(shù)的區(qū)間估計(jì)含義基本步驟總體均值、方差和比例的區(qū)間估計(jì)參數(shù)假設(shè)檢驗(yàn)的基本概念基本思想p值否定域與接受域區(qū)間估計(jì)問題的提出例:已知來自正態(tài)總體的樣本均值,如果我們進(jìn)行大量的重復(fù)抽樣,那么95%的

Xbar會(huì)落在一個(gè)什么樣的關(guān)于

的對稱區(qū)間中?根據(jù),得到

r=normsinv(0.975)*

=1.96

當(dāng)m已知時(shí)我們可以得到上式的含義:一次抽樣后,我們得到一個(gè)來自正態(tài)總體的樣本均值,它有95%的可能性落在區(qū)間(m-r,m+r)中但是m是未知的,如何根據(jù)

求m的區(qū)間?求m的區(qū)間當(dāng)

已知,m未知時(shí),把m作為未知數(shù)求解,得到上式的含義:區(qū)間

有95%的概率包含真實(shí)的參數(shù)m

每次抽樣會(huì)有一個(gè),從而區(qū)間會(huì)隨樣本的不同而變化,成為隨機(jī)區(qū)間注意:

m不是隨機(jī)變量總體均值的置信區(qū)間如果區(qū)間滿足則稱之為總體均值m置信度為95%的置信區(qū)間我們有95%的把握保證該區(qū)間包含真實(shí)的m反復(fù)抽取容量為n的樣本,都可得一個(gè)置信區(qū)間,但每個(gè)置信區(qū)間不一定包含未知參數(shù)的真值,而包含真值的區(qū)間占95%注意:不能說,m有95%的可能性落在區(qū)間

內(nèi),因?yàn)閙不是隨機(jī)變量置信區(qū)間的一般定義如果

,則稱為總體參數(shù)q的置信區(qū)間,其中,1-

a為置信度或置信水平,a為顯著水平置信區(qū)間的理解要點(diǎn)根據(jù)一組樣本觀測值作出估計(jì),給出估計(jì)值的范圍用概率術(shù)語(置信度或置信水平)說明估計(jì)值與未知總體參數(shù)的接近程度區(qū)間估計(jì)的基本步驟區(qū)間估計(jì)就是求解置信區(qū)間確定待估參數(shù)和置信水平;確定估計(jì)量,并找出估計(jì)量的抽樣分布;利用抽樣分布給出置信區(qū)間重點(diǎn)是確定估計(jì)量,它含有待估參數(shù),不含其它未知參數(shù),它的分布已知,

且分布不依賴于待估參數(shù)關(guān)鍵是確定2已知時(shí),總體均值的區(qū)間估計(jì)適用情形:來自正態(tài)總體的抽樣,且方差已知

大樣本情形,總體方差已知都有樣本均值服從正態(tài)分布將該分布轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布,即推導(dǎo)置信區(qū)間半徑r對于1-

a的置信區(qū)間,有90%置信度的區(qū)間半徑為95%置信度的區(qū)間半徑為99%置信度的區(qū)間半徑為a越小,r越大要求的置信度越高,區(qū)間半徑越大Excel中的Confidence函數(shù)運(yùn)用Excel中的Confidence函數(shù),直接求置信區(qū)間的半徑rr又稱之為極限誤差

Confidence(a,standard_dev,size)a為顯著水平Standard_dev:總體標(biāo)準(zhǔn)差(如果已知);或樣本標(biāo)準(zhǔn)差(如果總體標(biāo)準(zhǔn)差未知,又是大樣本情形)Size:樣本容量

對置信區(qū)間的模擬與觀察用Excel進(jìn)行置信區(qū)間的計(jì)算從一個(gè)均值為5,標(biāo)準(zhǔn)差為3的正態(tài)總體進(jìn)行1000次重復(fù)抽樣,每個(gè)樣本包含10個(gè)樣本點(diǎn)?,F(xiàn)在每個(gè)樣本的均值已知總體均值未知,但總體方差已知觀察在不同的置信度下,1000個(gè)置信區(qū)間包含真實(shí)總體均值的比例例假設(shè)樣本取自50名乘車上班的員工,他們花在路上的平均時(shí)間為30分鐘,總體標(biāo)準(zhǔn)差為2.5分鐘。則總體均值落入下列區(qū)域內(nèi)的置信度為95%:即:Confidence(0.05,2.5,50)=0.692951花在上班路上的平均時(shí)間為30±0.692951分鐘,或29.3到30.7分鐘說明在前面的估計(jì)中,我們都假定樣本為簡單隨機(jī)樣本,即為放回隨機(jī)抽樣得到的在不放回抽樣的時(shí)候,我們需要引入一個(gè)有限總體修正系數(shù)

,其中N為總體單位數(shù),n為樣本容量。這時(shí)有限總體修正系數(shù)主要適用于當(dāng)n占N比例很大時(shí)的不放回抽樣例一個(gè)擁有50位員工的公司想了解員工每天上網(wǎng)的時(shí)間,抽樣記錄了10位員工,結(jié)果平均數(shù)為60分鐘。已知該公司員工上網(wǎng)的時(shí)間為正態(tài)分布,標(biāo)準(zhǔn)差為20分鐘,求總體均值90%的置信區(qū)間

=Confidence(a,standard_dev,size)*=Confidence(0.1,20,10)*(40/49)^0.5=9.4所以總體均值90%的置信區(qū)間為(50.6,69.4)如果不考慮有限總體修正系數(shù),得到的置信區(qū)間為(49.6,70.4),區(qū)間變大根據(jù)誤差,求樣本容量接上題,如果希望誤差不超過5分鐘,應(yīng)該選取多少人?根據(jù)

可知:2未知時(shí),總體均值的區(qū)間估計(jì)當(dāng)總體方差未知,又是正態(tài)總體時(shí),有統(tǒng)計(jì)量當(dāng)n很大時(shí),近似服從標(biāo)準(zhǔn)正態(tài)分布置信區(qū)間半徑

ta=tinv(a,df)有限總體修正系數(shù)例張先生是臺(tái)灣某集團(tuán)的企劃部經(jīng)理,在今年的規(guī)劃中,集團(tuán)準(zhǔn)備在某地新建一家新的零售商店,設(shè)立商店要求行人數(shù)最低為520。張先生目前正在做這方面的準(zhǔn)備工作。其中經(jīng)過該地行人數(shù)量是他要考慮的一個(gè)很重要的方面。張先生委托他人進(jìn)行了兩個(gè)星期的觀察,得到每天經(jīng)過該地人數(shù)如下:544,468,399,759,526,212,256,456,553,259,469,366,197,178根據(jù)以上數(shù)據(jù),張先生應(yīng)該作出怎樣的判斷?張先生決策的依據(jù)就是經(jīng)過此地的行人數(shù)是否平均每天達(dá)到520人需要計(jì)算總體均值的置信區(qū)間,取a=5%問題性質(zhì):小樣本,總體方差未知,正態(tài)總體,n占N比例很小=tinv(0.05,13)*得到的置信區(qū)間為(306,500)含義:有95%的把握可以認(rèn)為每天的平均行人數(shù)在(306,500)之間,沒有達(dá)到520,不建議設(shè)店正態(tài)總體方差的區(qū)間估計(jì)當(dāng)m已知時(shí),,從而得到得2

置信度為1-

a的置信區(qū)間為

正態(tài)總體方差的區(qū)間估計(jì)當(dāng)m未知時(shí),有統(tǒng)計(jì)量置信區(qū)間為這種情形是最常見和常用的=Chiinv(a/2,n-1)某工廠生產(chǎn)一批滾珠,其直徑X服從正態(tài)分布N(

2),現(xiàn)從某天的產(chǎn)品中隨機(jī)抽取

6

件,測得直徑為

15.1,

14.8,

15.2,

14.9,

14.6,

15.1

(1)若

2=0.06,求

的置信區(qū)間

(2)若

2未知,求

的置信區(qū)間

(3)求方差

2的置信區(qū)間練習(xí)總體比例的區(qū)間估計(jì)已知如果樣本容量n足夠大(np和n(1-p)都大于5),或者即使n不大,只要p接近0.5,樣本比例的樣本分布為:

標(biāo)準(zhǔn)化的結(jié)果為:

同理可以得出對總體比例p的區(qū)間估計(jì)半徑總體參數(shù)的假設(shè)檢驗(yàn)什么是假設(shè)檢驗(yàn)利用樣本所提供的信息判斷各種說法的真?zhèn)危瑢傮w參數(shù)進(jìn)行一種推斷基本思想:概率性質(zhì)的反證法小概率事件在一次試驗(yàn)中幾乎不可能發(fā)生,p≤0.05先假設(shè)某種說法成立,導(dǎo)出了不合理的現(xiàn)象,說明原假設(shè)不正確;沒有導(dǎo)出不合理現(xiàn)象,不能拒絕原假設(shè)概率性質(zhì)的反證法與反證法兩者是有區(qū)別的反證法不合理是邏輯中的絕對矛盾概率性質(zhì)的反證法基于小概率事件在一次觀察中被認(rèn)為基本不會(huì)發(fā)生不存在邏輯中的絕對矛盾如果原假設(shè)真的成立,而得到樣本觀測結(jié)果的概率很小,一個(gè)小概率的事件在一次實(shí)驗(yàn)中居然發(fā)生了,這是我們不能夠接受的,在這種情況下我們只能拒絕原假設(shè)例子討論一家速遞公司聲稱該公司市內(nèi)門到門的速遞時(shí)間平均只有28分鐘,為了證實(shí)該廣告是否可靠,我們隨機(jī)跟蹤了100件業(yè)務(wù),結(jié)果發(fā)現(xiàn)其平均投遞時(shí)間為31.5分鐘,標(biāo)準(zhǔn)差為5分鐘。請問它的廣告可信嗎?假設(shè)廣告可信,看看會(huì)不會(huì)產(chǎn)生不合理的現(xiàn)象令H0代表所提出的假設(shè),H0:m=28;令H1代表與此對立的假設(shè),H1:m≠28;先看一下置信區(qū)間因?yàn)閚=100,為大樣本情形,可以認(rèn)為近似有當(dāng)n=100,Xbar=31.5,a=5%時(shí),m的置信區(qū)間為[30.5,32.5]因?yàn)?8<30.5,因此原假設(shè)所聲稱的m=28不在95%的置信區(qū)間內(nèi)我們有95%的把握可以拒絕H0,做出這樣的結(jié)論并不是百分之百正確,但我們犯錯(cuò)誤的可能性為a=5%再看一下概率如果H0:m=28真的成立的話,那么我們隨機(jī)調(diào)查的結(jié)果為

的可能性為多少?=1-normdist(31.5,28,5/100^0.5,1)=0如果原假設(shè)真的成立,那么出現(xiàn)我們上述隨機(jī)調(diào)查結(jié)果的概率幾乎為零一個(gè)零概率的事件在一次實(shí)驗(yàn)中居然發(fā)生了,這是我們不能接受的,所以我們只能拒絕原假設(shè)假設(shè)檢驗(yàn)中的兩類錯(cuò)誤零假設(shè):又稱原假設(shè)、基本假設(shè),陳述的是需要檢驗(yàn)的假設(shè),用H0表示備擇假設(shè):又稱被選假設(shè)、對立假設(shè),陳述的是與零假設(shè)的對立情況,用H1表示第一類錯(cuò)誤:以真為假,把正確的假設(shè)當(dāng)作錯(cuò)誤予以否定后果往往嚴(yán)重,出現(xiàn)第一類錯(cuò)誤的概率記為a第二類錯(cuò)誤:以假為真,把錯(cuò)誤的假設(shè)認(rèn)為正確予以接受,出現(xiàn)概率記作b

通常不易計(jì)算兩類錯(cuò)誤與司法審判裁決

實(shí)際情況裁決實(shí)際情況有罪無罪有罪無罪有罪正確第II類錯(cuò)誤冤枉好人有罪正確第I類錯(cuò)誤冤枉好人無罪第I類錯(cuò)誤放走壞人正確無罪第II類錯(cuò)誤放走壞人正確法院裁決H0

:有罪法院裁決H0

:無罪判斷實(shí)際情況H0為真H0為假接受H01-a第二類錯(cuò)誤(b),取偽拒絕H0第一類錯(cuò)誤(a),棄真檢驗(yàn)力(1-b)統(tǒng)計(jì)檢驗(yàn)過程:H0

檢驗(yàn)不能同時(shí)降低兩類錯(cuò)誤在一定的樣本容量下,減小第一類錯(cuò)誤發(fā)生的概率,必然增大第二類錯(cuò)誤發(fā)生的概率在假設(shè)檢驗(yàn)中,我們通常只關(guān)注第一類錯(cuò)誤的發(fā)生,只對a的大小予以限制這是因?yàn)榈谝活愬e(cuò)誤發(fā)生的概率易于計(jì)算檢驗(yàn)力(power):1-b減小第二類錯(cuò)誤發(fā)生的概率,意味著提高檢驗(yàn)力提高檢驗(yàn)力的途徑:增加樣本容量,加大零假設(shè)與備擇假設(shè)間的差異性,減少調(diào)查誤差圖示:

a

與b

的說明H0:m=m0;H1:m=m1當(dāng)樣本均值落在紅線左邊的陰影的區(qū)域內(nèi)時(shí),我們拒絕H0,此時(shí)我們犯錯(cuò)誤的概率為a

當(dāng)樣本均值落在紅線右邊的陰影區(qū)域內(nèi)時(shí),其概率為b,我們不能拒絕H0,此時(shí)我們犯錯(cuò)誤的概率為bp值p值是一個(gè)概率值;它是原假設(shè)為真時(shí),樣本統(tǒng)計(jì)量不同于(大于或小于,依情況而定)實(shí)測值的概率p值還被稱為觀察到的(或?qū)崪y的)樣本值的顯著性水平,是H0能被拒絕的最小值

p值越小,表明原假設(shè)越有可能為假當(dāng)p值大于顯著水平時(shí),拒絕原假設(shè)當(dāng)p值小于顯著水平時(shí),不能拒絕原假設(shè)否定域與接受域給定統(tǒng)計(jì)量或p值的臨界值,當(dāng)統(tǒng)計(jì)量或p值超過臨界值時(shí),我們會(huì)拒絕原假設(shè)由統(tǒng)計(jì)量或p值臨界值所確定的拒絕原假設(shè)的區(qū)域稱為拒絕域,反之為接受域假設(shè)檢驗(yàn)中通常選擇顯著水平a作為p值的臨界值拒絕域的大小與顯著水平a的大小有關(guān)同一組樣本值,在不同的顯著水平下,可能得出截然相反的結(jié)論否定域的分布通常而言,否定域位于統(tǒng)計(jì)量分布曲線的尾部,具體的方向取決于備擇假設(shè)的具體內(nèi)容對于H1:m≠m0,拒絕域在分布曲線的兩側(cè),稱為雙尾或雙側(cè)檢驗(yàn)對于H1:m>m0,拒絕域在分布曲線的右側(cè)對于H1:m<m0,拒絕域在分布曲線的左側(cè)建立檢驗(yàn)假設(shè)的原則將樣本觀測值所支持的結(jié)論作為備擇假設(shè)H1這是因?yàn)楫?dāng)我們拒絕零假設(shè)時(shí),我們所犯的錯(cuò)誤概率是可以控制的,所以應(yīng)當(dāng)把期望拒絕的結(jié)論作為零假設(shè),期望保護(hù)的結(jié)論作為備擇假設(shè)同時(shí),根據(jù)概率意義下的反證法,拒絕原假設(shè)是有說服力的,而接受原假設(shè)是沒有說服力的。因此應(yīng)把希望否定的假設(shè)作為原假設(shè)例觀察到樣本均值

,可以建立的假設(shè)檢驗(yàn)有:H0:m=

103;H1:m≠103

或H0:m≥

103;H1:m<103如果反過來會(huì)怎樣?H0:m≤

103;H1:m>103拒絕域在右側(cè),由于樣本均值≤103,這樣我們永遠(yuǎn)沒有機(jī)會(huì)拒絕原假設(shè)!雙尾檢驗(yàn)適用于檢驗(yàn)無方向性的研究假設(shè),這種假設(shè)表明的是

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論