lec13 總體參數(shù)的區(qū)間估計(jì)與假設(shè)檢驗(yàn)

上傳人：q*** IP屬地：湖北上傳時(shí)間：2023-02-04 格式：PPTX 頁數(shù)：43 大小：268.40KB 積分：28 舉報(bào) 版權(quán)申訴

lec13 總體參數(shù)的區(qū)間估計(jì)與假設(shè)檢驗(yàn)_第2頁

lec13 總體參數(shù)的區(qū)間估計(jì)與假設(shè)檢驗(yàn)_第3頁

lec13 總體參數(shù)的區(qū)間估計(jì)與假設(shè)檢驗(yàn)_第4頁

lec13 總體參數(shù)的區(qū)間估計(jì)與假設(shè)檢驗(yàn)_第5頁

已閱讀5頁，還剩38頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

總體參數(shù)的區(qū)間估計(jì)

與假設(shè)檢驗(yàn)第十三講大綱參數(shù)的區(qū)間估計(jì)含義基本步驟總體均值、方差和比例的區(qū)間估計(jì)參數(shù)假設(shè)檢驗(yàn)的基本概念基本思想p值否定域與接受域區(qū)間估計(jì)問題的提出例：已知來自正態(tài)總體的樣本均值，如果我們進(jìn)行大量的重復(fù)抽樣，那么95%的

Xbar會(huì)落在一個(gè)什么樣的關(guān)于

的對(duì)稱區(qū)間中？根據(jù)，得到

r=normsinv(0.975)*

=1.96

當(dāng)m已知時(shí)我們可以得到上式的含義：一次抽樣后，我們得到一個(gè)來自正態(tài)總體的樣本均值，它有95%的可能性落在區(qū)間(m－r,m＋r)中但是m是未知的，如何根據(jù)

求m的區(qū)間？求m的區(qū)間當(dāng)

已知，m未知時(shí)，把m作為未知數(shù)求解，得到上式的含義：區(qū)間

有95%的概率包含真實(shí)的參數(shù)m

每次抽樣會(huì)有一個(gè)，從而區(qū)間會(huì)隨樣本的不同而變化，成為隨機(jī)區(qū)間注意：

m不是隨機(jī)變量總體均值的置信區(qū)間如果區(qū)間滿足則稱之為總體均值m置信度為95%的置信區(qū)間我們有95%的把握保證該區(qū)間包含真實(shí)的m反復(fù)抽取容量為n的樣本，都可得一個(gè)置信區(qū)間，但每個(gè)置信區(qū)間不一定包含未知參數(shù)的真值，而包含真值的區(qū)間占95%注意：不能說，m有95%的可能性落在區(qū)間

內(nèi)，因?yàn)閙不是隨機(jī)變量置信區(qū)間的一般定義如果

，則稱為總體參數(shù)q的置信區(qū)間，其中，1－

a為置信度或置信水平，a為顯著水平置信區(qū)間的理解要點(diǎn)根據(jù)一組樣本觀測(cè)值作出估計(jì)，給出估計(jì)值的范圍用概率術(shù)語（置信度或置信水平）說明估計(jì)值與未知總體參數(shù)的接近程度區(qū)間估計(jì)的基本步驟區(qū)間估計(jì)就是求解置信區(qū)間確定待估參數(shù)和置信水平；確定估計(jì)量，并找出估計(jì)量的抽樣分布；利用抽樣分布給出置信區(qū)間重點(diǎn)是確定估計(jì)量，它含有待估參數(shù)，不含其它未知參數(shù)，它的分布已知，

且分布不依賴于待估參數(shù)關(guān)鍵是確定2已知時(shí)，總體均值的區(qū)間估計(jì)適用情形：來自正態(tài)總體的抽樣，且方差已知

大樣本情形，總體方差已知都有樣本均值服從正態(tài)分布將該分布轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布，即推導(dǎo)置信區(qū)間半徑r對(duì)于1－

a的置信區(qū)間，有90%置信度的區(qū)間半徑為95%置信度的區(qū)間半徑為99%置信度的區(qū)間半徑為a越小，r越大要求的置信度越高，區(qū)間半徑越大Excel中的Confidence函數(shù)運(yùn)用Excel中的Confidence函數(shù)，直接求置信區(qū)間的半徑rr又稱之為極限誤差

Confidence(a,standard_dev,size)a為顯著水平Standard_dev：總體標(biāo)準(zhǔn)差(如果已知)；或樣本標(biāo)準(zhǔn)差(如果總體標(biāo)準(zhǔn)差未知，又是大樣本情形)Size：樣本容量

對(duì)置信區(qū)間的模擬與觀察用Excel進(jìn)行置信區(qū)間的計(jì)算從一個(gè)均值為5，標(biāo)準(zhǔn)差為3的正態(tài)總體進(jìn)行1000次重復(fù)抽樣，每個(gè)樣本包含10個(gè)樣本點(diǎn)?，F(xiàn)在每個(gè)樣本的均值已知總體均值未知，但總體方差已知觀察在不同的置信度下，1000個(gè)置信區(qū)間包含真實(shí)總體均值的比例例假設(shè)樣本取自50名乘車上班的員工，他們花在路上的平均時(shí)間為30分鐘，總體標(biāo)準(zhǔn)差為2.5分鐘。則總體均值落入下列區(qū)域內(nèi)的置信度為95%：即：Confidence(0.05,2.5,50)=0.692951花在上班路上的平均時(shí)間為30±0.692951分鐘，或29.3到30.7分鐘說明在前面的估計(jì)中，我們都假定樣本為簡(jiǎn)單隨機(jī)樣本，即為放回隨機(jī)抽樣得到的在不放回抽樣的時(shí)候，我們需要引入一個(gè)有限總體修正系數(shù)

，其中N為總體單位數(shù)，n為樣本容量。這時(shí)有限總體修正系數(shù)主要適用于當(dāng)n占N比例很大時(shí)的不放回抽樣例一個(gè)擁有50位員工的公司想了解員工每天上網(wǎng)的時(shí)間，抽樣記錄了10位員工，結(jié)果平均數(shù)為60分鐘。已知該公司員工上網(wǎng)的時(shí)間為正態(tài)分布，標(biāo)準(zhǔn)差為20分鐘，求總體均值90%的置信區(qū)間

=Confidence(a,standard_dev,size)*=Confidence(0.1,20,10)*(40/49)^0.5=9.4所以總體均值90%的置信區(qū)間為(50.6,69.4)如果不考慮有限總體修正系數(shù)，得到的置信區(qū)間為(49.6,70.4)，區(qū)間變大根據(jù)誤差，求樣本容量接上題，如果希望誤差不超過5分鐘，應(yīng)該選取多少人？根據(jù)

可知：2未知時(shí)，總體均值的區(qū)間估計(jì)當(dāng)總體方差未知，又是正態(tài)總體時(shí)，有統(tǒng)計(jì)量當(dāng)n很大時(shí)，近似服從標(biāo)準(zhǔn)正態(tài)分布置信區(qū)間半徑

ta=tinv(a,df)有限總體修正系數(shù)例張先生是臺(tái)灣某集團(tuán)的企劃部經(jīng)理，在今年的規(guī)劃中，集團(tuán)準(zhǔn)備在某地新建一家新的零售商店，設(shè)立商店要求行人數(shù)最低為520。張先生目前正在做這方面的準(zhǔn)備工作。其中經(jīng)過該地行人數(shù)量是他要考慮的一個(gè)很重要的方面。張先生委托他人進(jìn)行了兩個(gè)星期的觀察，得到每天經(jīng)過該地人數(shù)如下：544，468，399，759，526，212，256，456，553，259，469，366，197，178根據(jù)以上數(shù)據(jù)，張先生應(yīng)該作出怎樣的判斷？張先生決策的依據(jù)就是經(jīng)過此地的行人數(shù)是否平均每天達(dá)到520人需要計(jì)算總體均值的置信區(qū)間，取a=5%問題性質(zhì)：小樣本，總體方差未知，正態(tài)總體，n占N比例很小=tinv(0.05,13)*得到的置信區(qū)間為(306,500)含義：有95%的把握可以認(rèn)為每天的平均行人數(shù)在(306,500)之間，沒有達(dá)到520，不建議設(shè)店正態(tài)總體方差的區(qū)間估計(jì)當(dāng)m已知時(shí)，，從而得到得2

置信度為1－

a的置信區(qū)間為

正態(tài)總體方差的區(qū)間估計(jì)當(dāng)m未知時(shí)，有統(tǒng)計(jì)量置信區(qū)間為這種情形是最常見和常用的=Chiinv(a/2,n-1)某工廠生產(chǎn)一批滾珠，其直徑X服從正態(tài)分布N(

2)，現(xiàn)從某天的產(chǎn)品中隨機(jī)抽取

件，測(cè)得直徑為

15.1,

14.8,

15.2,

14.9,

14.6,

15.1

(1)若

2=0.06,求

的置信區(qū)間

(2)若

2未知,求

的置信區(qū)間

(3)求方差

2的置信區(qū)間練習(xí)總體比例的區(qū)間估計(jì)已知如果樣本容量n足夠大(np和n(1-p)都大于5)，或者即使n不大，只要p接近0.5，樣本比例的樣本分布為：

標(biāo)準(zhǔn)化的結(jié)果為：

同理可以得出對(duì)總體比例p的區(qū)間估計(jì)半徑總體參數(shù)的假設(shè)檢驗(yàn)什么是假設(shè)檢驗(yàn)利用樣本所提供的信息判斷各種說法的真?zhèn)?，?duì)總體參數(shù)進(jìn)行一種推斷基本思想：概率性質(zhì)的反證法小概率事件在一次試驗(yàn)中幾乎不可能發(fā)生，p≤0.05先假設(shè)某種說法成立，導(dǎo)出了不合理的現(xiàn)象，說明原假設(shè)不正確；沒有導(dǎo)出不合理現(xiàn)象，不能拒絕原假設(shè)概率性質(zhì)的反證法與反證法兩者是有區(qū)別的反證法不合理是邏輯中的絕對(duì)矛盾概率性質(zhì)的反證法基于小概率事件在一次觀察中被認(rèn)為基本不會(huì)發(fā)生不存在邏輯中的絕對(duì)矛盾如果原假設(shè)真的成立，而得到樣本觀測(cè)結(jié)果的概率很小，一個(gè)小概率的事件在一次實(shí)驗(yàn)中居然發(fā)生了，這是我們不能夠接受的，在這種情況下我們只能拒絕原假設(shè)例子討論一家速遞公司聲稱該公司市內(nèi)門到門的速遞時(shí)間平均只有28分鐘，為了證實(shí)該廣告是否可靠，我們隨機(jī)跟蹤了100件業(yè)務(wù)，結(jié)果發(fā)現(xiàn)其平均投遞時(shí)間為31.5分鐘，標(biāo)準(zhǔn)差為5分鐘。請(qǐng)問它的廣告可信嗎？假設(shè)廣告可信，看看會(huì)不會(huì)產(chǎn)生不合理的現(xiàn)象令H0代表所提出的假設(shè)，H0:m=28；令H1代表與此對(duì)立的假設(shè)，H1:m≠28；先看一下置信區(qū)間因?yàn)閚=100，為大樣本情形，可以認(rèn)為近似有當(dāng)n=100，Xbar=31.5，a=5%時(shí)，m的置信區(qū)間為[30.5,32.5]因?yàn)?8<30.5，因此原假設(shè)所聲稱的m=28不在95%的置信區(qū)間內(nèi)我們有95%的把握可以拒絕H0，做出這樣的結(jié)論并不是百分之百正確，但我們犯錯(cuò)誤的可能性為a=5%再看一下概率如果H0:m=28真的成立的話，那么我們隨機(jī)調(diào)查的結(jié)果為

的可能性為多少？=1-normdist(31.5,28,5/100^0.5,1)=0如果原假設(shè)真的成立，那么出現(xiàn)我們上述隨機(jī)調(diào)查結(jié)果的概率幾乎為零一個(gè)零概率的事件在一次實(shí)驗(yàn)中居然發(fā)生了，這是我們不能接受的，所以我們只能拒絕原假設(shè)假設(shè)檢驗(yàn)中的兩類錯(cuò)誤零假設(shè)：又稱原假設(shè)、基本假設(shè)，陳述的是需要檢驗(yàn)的假設(shè)，用H0表示備擇假設(shè)：又稱被選假設(shè)、對(duì)立假設(shè)，陳述的是與零假設(shè)的對(duì)立情況，用H1表示第一類錯(cuò)誤：以真為假，把正確的假設(shè)當(dāng)作錯(cuò)誤予以否定后果往往嚴(yán)重，出現(xiàn)第一類錯(cuò)誤的概率記為a第二類錯(cuò)誤：以假為真，把錯(cuò)誤的假設(shè)認(rèn)為正確予以接受，出現(xiàn)概率記作b

通常不易計(jì)算兩類錯(cuò)誤與司法審判裁決

實(shí)際情況裁決實(shí)際情況有罪無罪有罪無罪有罪正確第II類錯(cuò)誤冤枉好人有罪正確第I類錯(cuò)誤冤枉好人無罪第I類錯(cuò)誤放走壞人正確無罪第II類錯(cuò)誤放走壞人正確法院裁決H0

：有罪法院裁決H0

：無罪判斷實(shí)際情況H0為真H0為假接受H01-a第二類錯(cuò)誤(b)，取偽拒絕H0第一類錯(cuò)誤(a)，棄真檢驗(yàn)力(1-b)統(tǒng)計(jì)檢驗(yàn)過程：H0

檢驗(yàn)不能同時(shí)降低兩類錯(cuò)誤在一定的樣本容量下，減小第一類錯(cuò)誤發(fā)生的概率，必然增大第二類錯(cuò)誤發(fā)生的概率在假設(shè)檢驗(yàn)中，我們通常只關(guān)注第一類錯(cuò)誤的發(fā)生，只對(duì)a的大小予以限制這是因?yàn)榈谝活愬e(cuò)誤發(fā)生的概率易于計(jì)算檢驗(yàn)力(power)：1-b減小第二類錯(cuò)誤發(fā)生的概率，意味著提高檢驗(yàn)力提高檢驗(yàn)力的途徑：增加樣本容量，加大零假設(shè)與備擇假設(shè)間的差異性，減少調(diào)查誤差圖示：

與b

的說明H0:m=m0；H1:m=m1當(dāng)樣本均值落在紅線左邊的陰影的區(qū)域內(nèi)時(shí)，我們拒絕H0，此時(shí)我們犯錯(cuò)誤的概率為a

當(dāng)樣本均值落在紅線右邊的陰影區(qū)域內(nèi)時(shí)，其概率為b，我們不能拒絕H0，此時(shí)我們犯錯(cuò)誤的概率為bp值p值是一個(gè)概率值；它是原假設(shè)為真時(shí)，樣本統(tǒng)計(jì)量不同于（大于或小于，依情況而定）實(shí)測(cè)值的概率p值還被稱為觀察到的（或?qū)崪y(cè)的）樣本值的顯著性水平，是H0能被拒絕的最小值

p值越小，表明原假設(shè)越有可能為假當(dāng)p值大于顯著水平時(shí)，拒絕原假設(shè)當(dāng)p值小于顯著水平時(shí)，不能拒絕原假設(shè)否定域與接受域給定統(tǒng)計(jì)量或p值的臨界值，當(dāng)統(tǒng)計(jì)量或p值超過臨界值時(shí)，我們會(huì)拒絕原假設(shè)由統(tǒng)計(jì)量或p值臨界值所確定的拒絕原假設(shè)的區(qū)域稱為拒絕域，反之為接受域假設(shè)檢驗(yàn)中通常選擇顯著水平a作為p值的臨界值拒絕域的大小與顯著水平a的大小有關(guān)同一組樣本值，在不同的顯著水平下，可能得出截然相反的結(jié)論否定域的分布通常而言，否定域位于統(tǒng)計(jì)量分布曲線的尾部，具體的方向取決于備擇假設(shè)的具體內(nèi)容對(duì)于H1:m≠m0，拒絕域在分布曲線的兩側(cè)，稱為雙尾或雙側(cè)檢驗(yàn)對(duì)于H1:m>m0，拒絕域在分布曲線的右側(cè)對(duì)于H1:m<m0，拒絕域在分布曲線的左側(cè)建立檢驗(yàn)假設(shè)的原則將樣本觀測(cè)值所支持的結(jié)論作為備擇假設(shè)H1這是因?yàn)楫?dāng)我們拒絕零假設(shè)時(shí)，我們所犯的錯(cuò)誤概率是可以控制的，所以應(yīng)當(dāng)把期望拒絕的結(jié)論作為零假設(shè)，期望保護(hù)的結(jié)論作為備擇假設(shè)同時(shí)，根據(jù)概率意義下的反證法，拒絕原假設(shè)是有說服力的，而接受原假設(shè)是沒有說服力的。因此應(yīng)把希望否定的假設(shè)作為原假設(shè)例觀察到樣本均值

，可以建立的假設(shè)檢驗(yàn)有：H0:m=

103；H1:m≠103

或H0:m≥

103；H1:m<103如果反過來會(huì)怎樣？H0:m≤

103；H1:m>103拒絕域在右側(cè)，由于樣本均值≤103，這樣我們永遠(yuǎn)沒有機(jī)會(huì)拒絕原假設(shè)！雙尾檢驗(yàn)適用于檢驗(yàn)無方向性的研究假設(shè)，這種假設(shè)表明的是

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

lec13 總體參數(shù)的區(qū)間估計(jì)與假設(shè)檢驗(yàn)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

lec13 總體參數(shù)的區(qū)間估計(jì)與假設(shè)檢驗(yàn)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔