第五講估計(jì)與假設(shè)檢驗(yàn)

上傳人：6*** IP屬地：湖北上傳時(shí)間：2023-01-15 格式：PPT 頁數(shù)：23 大小：455KB 積分：28 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩18頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第三章估計(jì)與假設(shè)檢驗(yàn)

教學(xué)要求：掌握求置信區(qū)間、假設(shè)檢驗(yàn)及分布檢驗(yàn)所需要的SAS/INSIGHT與分析家模塊的分析步驟。能用SAS程序語言比較兩組數(shù)據(jù)的差異性。教學(xué)重點(diǎn)：會(huì)用UNIVARIATE、TTEST過程進(jìn)行檢驗(yàn)。教學(xué)難點(diǎn)：輸出結(jié)果的解讀、分布檢驗(yàn)。教學(xué)方法：授課、上機(jī)、實(shí)驗(yàn)報(bào)告1教學(xué)內(nèi)容：3.1統(tǒng)計(jì)推斷的基本原理及意義3.2區(qū)間估計(jì)與假設(shè)檢驗(yàn)的基本概念3.3單樣本總體均值與方差的區(qū)間估計(jì)及假設(shè)檢驗(yàn)的SAS實(shí)現(xiàn)3.4分布檢驗(yàn)的SAS實(shí)現(xiàn)3.5兩組比較的SAS實(shí)現(xiàn)2

統(tǒng)計(jì)推斷的內(nèi)容：統(tǒng)計(jì)推斷參數(shù)估計(jì)假設(shè)測(cè)驗(yàn)點(diǎn)估計(jì)區(qū)間估計(jì)統(tǒng)計(jì)推斷的前提條件：資料必須來自隨機(jī)樣本；統(tǒng)計(jì)數(shù)的分布規(guī)律必須已知。統(tǒng)計(jì)推斷是據(jù)統(tǒng)計(jì)數(shù)的分布和概率理論，由樣本統(tǒng)計(jì)數(shù)推論總體參數(shù)的方法。3.1統(tǒng)計(jì)推斷的基本原理及意義33.2參數(shù)估計(jì)與假設(shè)檢驗(yàn)的基本概念3.2.1參數(shù)估計(jì)3.2.2假設(shè)檢驗(yàn)4

3.2.1參數(shù)估計(jì)1.估計(jì)方法分類參數(shù)的點(diǎn)估計(jì)：由樣本構(gòu)造適當(dāng)?shù)慕y(tǒng)計(jì)量，將該統(tǒng)計(jì)量的觀測(cè)值作為總體未知參數(shù)的估計(jì)值的方法稱為參數(shù)的點(diǎn)估計(jì)。參數(shù)的區(qū)間估計(jì)：利用構(gòu)造的統(tǒng)計(jì)量及樣本觀測(cè)值，計(jì)算參數(shù)的置信區(qū)間的方法稱為參數(shù)的區(qū)間估計(jì)。52.參數(shù)的置信區(qū)間

在區(qū)間估計(jì)中，對(duì)于總體的未知參數(shù)θ，需要求出兩個(gè)統(tǒng)計(jì)量θ1(X1，X2，...，Xn)和θ2(X1，X2，...，Xn)來分別估計(jì)總體參數(shù)θ的上限和下限，使得總體參數(shù)在區(qū)間（θ1，θ2）內(nèi)的概率為

P{θ1<θ<θ2}=1-α其中,1-α稱為置信水平，而(θ1，θ2)稱為θ的置信區(qū)間，θ1,θ2分別稱為置信下限和置信上限。置信水平為1-α的含義是隨機(jī)區(qū)間(θ1，θ2)以1-α的概率包含了參數(shù)θ。63.正態(tài)總體均值和方差的置信區(qū)間

參數(shù)的區(qū)間估計(jì)大多是對(duì)正態(tài)總體的參數(shù)進(jìn)行估計(jì)，如對(duì)單總體均值、方差的估計(jì)、兩總體均值差的估計(jì)和兩總體方差比的估計(jì)等。表1正態(tài)總體參數(shù)的各種置信區(qū)間被估參數(shù)條件樞軸量及其分布參數(shù)的置信區(qū)間單正態(tài)總體μ2已知2未知2μ已知μ未知7

3.2.2假設(shè)檢驗(yàn)1.假設(shè)檢驗(yàn)的基本原理

對(duì)總體參數(shù)進(jìn)行假設(shè)檢驗(yàn)時(shí)，首先要給定一個(gè)原假設(shè)H0，H0是關(guān)于總體參數(shù)的表述，與此同時(shí)存在一個(gè)與H0相對(duì)立的備擇假設(shè)H1，H0與H1有且僅有一個(gè)成立；經(jīng)過一次抽樣，若發(fā)生了小概率事件（通常把概率小于0.05的事件稱為小概率事件），可以依據(jù)“小概率事件在一次實(shí)驗(yàn)中幾乎不可能發(fā)生”的理由，懷疑原假設(shè)不真，作出拒絕原假設(shè)H0，接受H1的決定；反之，若小概率事件沒有發(fā)生，就沒有理由拒絕H0，從而應(yīng)作出拒絕H1的決定。82.假設(shè)檢驗(yàn)的步驟

1)根據(jù)問題確立原假設(shè)H0和備選假設(shè)H1；

2)確定一個(gè)顯著水平，它是衡量稀有性（小概率事件)的標(biāo)準(zhǔn)，常取為0.05；3)選定合適的檢驗(yàn)統(tǒng)計(jì)量W（通常原假設(shè)成立時(shí),W的分布是已知的），根據(jù)W的分布及的值，確定H0的拒絕域；4)由樣本觀測(cè)值計(jì)算出統(tǒng)計(jì)量W的觀測(cè)值W0，如果W0落入H0的拒絕域，則拒絕H0；否則，不能拒絕原假設(shè)H0。9注意：在SAS系統(tǒng)中，是由樣本觀測(cè)值計(jì)算出統(tǒng)計(jì)量W

的觀測(cè)值W0和p值（p值就是當(dāng)原假設(shè)成立時(shí)得到樣本觀測(cè)值和更極端結(jié)果的概率）。

p值通常由下面公式計(jì)算得到。

●p=P{|W|≥|W0|}=2P{W≥|W0|}

（拒絕域?yàn)閮蛇厡?duì)稱的區(qū)域時(shí)）

●p=P{W≥W0}（拒絕域?yàn)橛疫厖^(qū)域時(shí)）

●p=P{W

W0}（拒絕域?yàn)樽筮厖^(qū)域時(shí)）在SAS系統(tǒng)，只需根據(jù)SAS計(jì)算出的p值，就可以在指定的顯著水平的值，當(dāng)p值<時(shí)拒絕原假設(shè)，當(dāng)p值>時(shí)接收原假設(shè)。103.正態(tài)總體均值和方差的假設(shè)檢驗(yàn)

對(duì)正態(tài)總體的參數(shù)進(jìn)行假設(shè)檢驗(yàn)是假設(shè)檢驗(yàn)的重要內(nèi)容，如對(duì)單總體均值、方差的檢驗(yàn)、兩總體均值之差的檢驗(yàn)和兩總體方差比的檢驗(yàn)等。正態(tài)總體參數(shù)的各種檢驗(yàn)方法見下表2至表3。

表2單正態(tài)總體N(μ,2)均值μ的檢驗(yàn)法檢驗(yàn)名稱條件檢驗(yàn)類別H0H1檢驗(yàn)統(tǒng)計(jì)量分布拒絕域Z檢驗(yàn)已知雙邊檢驗(yàn)μ=μ0μ≠μ0N(0,1)|Z|≥Zα/2左邊檢驗(yàn)μ≥μ0μ<μ0Z≤-Zα右邊檢驗(yàn)μ≤μ0μ>μ0Z≥Zαt檢驗(yàn)未知雙邊檢驗(yàn)μ=μ0μ≠μ0t(n–1)|t|≥tα/2(n–1)左邊檢驗(yàn)μ≥μ0μ<μ0t≤–tα(n–1)右邊檢驗(yàn)μ≤μ0μ>μ0t≥tα(n–1)11表3單正態(tài)總體N(μ,2)方差2的檢驗(yàn)法檢驗(yàn)名稱條件檢驗(yàn)類別H0H1檢驗(yàn)統(tǒng)計(jì)量分布拒絕域χ2檢驗(yàn)μ已知雙邊檢驗(yàn)左邊檢驗(yàn)

右邊檢驗(yàn)μ未知雙邊檢驗(yàn)左邊檢驗(yàn)右邊檢驗(yàn)或或123.3總體均值的區(qū)間估計(jì)與假設(shè)檢驗(yàn)的SAS實(shí)現(xiàn)3.3.1使用INSIGHT模塊3.3.2使用“分析家”13

3.3.1使用INSIGHT模塊(總體均值的估計(jì)、單樣本總體均值的假設(shè)檢驗(yàn))1.總體均值的估計(jì)

【例3-1】某藥材生產(chǎn)商要對(duì)其倉庫中的1000箱藥材的平均重量進(jìn)行估計(jì)，藥材重量的總體方差未知，隨機(jī)抽取16箱樣本稱重后結(jié)果如表3-1所示。

表3-116箱藥材重量（單位：千克）50505651495347525353495355485055設(shè)藥材重量數(shù)據(jù)存放于SAS數(shù)據(jù)文件li3_1中，其中重量變量名為weight。求該倉庫中每箱藥材平均重量在95%置信水平下的置信區(qū)間。141.

Analyze→Distribution(Y)；

選擇變量weight

→Output→

選擇

BasicConfidenceIntervals(區(qū)間估計(jì)選項(xiàng))

計(jì)算步驟如下：啟動(dòng)INSIGHT模塊，并打開數(shù)據(jù)集li3_1.15

結(jié)果包括一個(gè)名為“95％ConfidenceIntervals（95%置信區(qū)間）”的列表，表中給出了均值、標(biāo)準(zhǔn)差、方差的估計(jì)值（Parameter）、置信下限（LCL）和置信上限（UCL），如表2所示。結(jié)果表明：根據(jù)抽樣樣本，該倉庫中藥材的平均重量以95%的可能性位于50.08千克至52.92千克之間。表3-2藥材平均重量的區(qū)間估計(jì)162.單樣本總體均值的假設(shè)檢驗(yàn)

【例3-2】一家食品廠以生產(chǎn)袋裝食品為主，每天的產(chǎn)量大約為8000袋，每袋重量規(guī)定為100克。為了分析每袋重量是否符合要求，質(zhì)檢部門經(jīng)常進(jìn)行抽檢?，F(xiàn)從某天生產(chǎn)的一批食品中隨機(jī)抽取了25袋，測(cè)得每袋重量如表3-3所示。表3-325袋食品的重量（單位：克）112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3試從抽檢的樣本數(shù)據(jù)出發(fā)，檢驗(yàn)重量的均值與100克是否有顯著差異。假定表3-3數(shù)據(jù)存放在數(shù)據(jù)集li3_2中，重量變量名為WEIGHT。17

設(shè)變量WEIGHT的均值為μ，通過樣本數(shù)據(jù)檢驗(yàn)變量WEIGHT的均值的假設(shè)為：

H0：μ=100， H1：μ

100使用INSIGHT對(duì)均值進(jìn)行檢驗(yàn)的步驟如下：首先啟動(dòng)INSIGHT，并打開數(shù)據(jù)集li3_2.1.Analyze→Distribution(Y)；2.選定分析變量

WEIGHT→Output；3.選擇TestsforLocation

選項(xiàng)→Mu0:100

(輸入)→OK→OK18以上結(jié)果顯示，觀測(cè)值中不等于100克的觀測(cè)有24個(gè)，其中19個(gè)觀測(cè)值大于100。表中第一個(gè)檢驗(yàn)為t檢驗(yàn)(Student‘st)，需要假定變量服從正態(tài)分布，檢驗(yàn)的p值為0.0105<0.05，拒絕原假設(shè)，即在0.05水平下可認(rèn)為均值與100克有顯著差異。第二個(gè)檢驗(yàn)(Sign)是叫做符號(hào)檢驗(yàn)的非參數(shù)檢驗(yàn)，其p值為0.0066，在0.05水平下也是顯著的，結(jié)論相同。第三個(gè)檢驗(yàn)(SgnedRank)是叫做符號(hào)秩檢驗(yàn)的非參數(shù)檢驗(yàn)，其p值為0.0048，在0.05水平下是顯著的，結(jié)論相同。輸出結(jié)果193.2.2使用“分析家”(總體均值的置信區(qū)間、單樣本總體均值的假設(shè)檢驗(yàn))1.總體均值的置信區(qū)間【例3-3】在“分析家”中求例3-1中每箱藥材平均重量在95%置信水平下的置信區(qū)間。步驟如下：在“分析家”模塊中打開數(shù)據(jù)集li3_1.1.Statistics→HypothesisTests→OneSamplet→

testforaMean（單樣本均值t-檢驗(yàn)）;2.選擇變量weight,按Tests

→選擇Interval(置信區(qū)間,如下

圖)

→OK→OK。20選擇均值的置信區(qū)間:

結(jié)果表明，根據(jù)抽樣樣本，該倉庫中藥材的平均重95%的可能性位于50.08千克至52.92千克之間。與利INSIGHT的結(jié)果相同。運(yùn)行結(jié)果：21

顯示結(jié)果（右表）表明t統(tǒng)計(jì)量的p值為0.0105<0.05，所以拒絕原假設(shè)，即認(rèn)為總體的均值與100有顯著差異。2.單樣本總體均值的假設(shè)檢驗(yàn)【例3-4】使用“分析家”檢驗(yàn)例3-2中食品重量是否符合要求。需要通過樣本數(shù)據(jù)檢驗(yàn)變量WEIGHT均值的如下假設(shè)：H0：μ=100，H1：μ

100由于此時(shí)的方差未知，所以使用t檢驗(yàn)法。步驟如下：在“分析家”中打開數(shù)據(jù)集li3_2.1.Statistics→HypothesisTests→OneSamplet–testforaMean（單樣本均值t-檢驗(yàn)）；2.選變量weight→Variable,Null:

Mean=100→OK.223.單樣本總體方差的假設(shè)檢驗(yàn)【例3-5】使用“分析家”檢驗(yàn)例3-2中食品重量是否符合要求。需要通過樣本數(shù)據(jù)檢驗(yàn)變量WEIGHT均值的如下假設(shè)：H0：2

=93.21

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

第五講估計(jì)與假設(shè)檢驗(yàn)

文檔簡介

溫馨提示

最新文檔

評(píng)論

第五講估計(jì)與假設(shè)檢驗(yàn)

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔