第五講估計(jì)與假設(shè)檢驗(yàn)_第1頁
第五講估計(jì)與假設(shè)檢驗(yàn)_第2頁
第五講估計(jì)與假設(shè)檢驗(yàn)_第3頁
第五講估計(jì)與假設(shè)檢驗(yàn)_第4頁
第五講估計(jì)與假設(shè)檢驗(yàn)_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第三章估計(jì)與假設(shè)檢驗(yàn)

教學(xué)要求:掌握求置信區(qū)間、假設(shè)檢驗(yàn)及分布檢驗(yàn)所需要的SAS/INSIGHT與分析家模塊的分析步驟。能用SAS程序語言比較兩組數(shù)據(jù)的差異性。教學(xué)重點(diǎn):會(huì)用UNIVARIATE、TTEST過程進(jìn)行檢驗(yàn)。教學(xué)難點(diǎn):輸出結(jié)果的解讀、分布檢驗(yàn)。教學(xué)方法:授課、上機(jī)、實(shí)驗(yàn)報(bào)告1教學(xué)內(nèi)容:3.1統(tǒng)計(jì)推斷的基本原理及意義3.2區(qū)間估計(jì)與假設(shè)檢驗(yàn)的基本概念3.3單樣本總體均值與方差的區(qū)間估計(jì)及假設(shè)檢驗(yàn)的SAS實(shí)現(xiàn)3.4分布檢驗(yàn)的SAS實(shí)現(xiàn)3.5兩組比較的SAS實(shí)現(xiàn)2

統(tǒng)計(jì)推斷的內(nèi)容:統(tǒng)計(jì)推斷參數(shù)估計(jì)假設(shè)測(cè)驗(yàn)點(diǎn)估計(jì)區(qū)間估計(jì)統(tǒng)計(jì)推斷的前提條件:資料必須來自隨機(jī)樣本;統(tǒng)計(jì)數(shù)的分布規(guī)律必須已知。統(tǒng)計(jì)推斷是據(jù)統(tǒng)計(jì)數(shù)的分布和概率理論,由樣本統(tǒng)計(jì)數(shù)推論總體參數(shù)的方法。3.1統(tǒng)計(jì)推斷的基本原理及意義33.2參數(shù)估計(jì)與假設(shè)檢驗(yàn)的基本概念3.2.1參數(shù)估計(jì)3.2.2假設(shè)檢驗(yàn)4

3.2.1參數(shù)估計(jì)1.估計(jì)方法分類參數(shù)的點(diǎn)估計(jì):由樣本構(gòu)造適當(dāng)?shù)慕y(tǒng)計(jì)量,將該統(tǒng)計(jì)量的觀測(cè)值作為總體未知參數(shù)的估計(jì)值的方法稱為參數(shù)的點(diǎn)估計(jì)。參數(shù)的區(qū)間估計(jì):利用構(gòu)造的統(tǒng)計(jì)量及樣本觀測(cè)值,計(jì)算參數(shù)的置信區(qū)間的方法稱為參數(shù)的區(qū)間估計(jì)。52.參數(shù)的置信區(qū)間

在區(qū)間估計(jì)中,對(duì)于總體的未知參數(shù)θ,需要求出兩個(gè)統(tǒng)計(jì)量θ1(X1,X2,...,Xn)和θ2(X1,X2,...,Xn)來分別估計(jì)總體參數(shù)θ的上限和下限,使得總體參數(shù)在區(qū)間(θ1,θ2)內(nèi)的概率為

P{θ1<θ<θ2}=1-α其中,1-α稱為置信水平,而(θ1,θ2)稱為θ的置信區(qū)間,θ1,θ2分別稱為置信下限和置信上限。置信水平為1-α的含義是隨機(jī)區(qū)間(θ1,θ2)以1-α的概率包含了參數(shù)θ。63.正態(tài)總體均值和方差的置信區(qū)間

參數(shù)的區(qū)間估計(jì)大多是對(duì)正態(tài)總體的參數(shù)進(jìn)行估計(jì),如對(duì)單總體均值、方差的估計(jì)、兩總體均值差的估計(jì)和兩總體方差比的估計(jì)等。表1正態(tài)總體參數(shù)的各種置信區(qū)間被估參數(shù)條件樞軸量及其分布參數(shù)的置信區(qū)間單正態(tài)總體μ2已知2未知2μ已知μ未知7

3.2.2假設(shè)檢驗(yàn)1.假設(shè)檢驗(yàn)的基本原理

對(duì)總體參數(shù)進(jìn)行假設(shè)檢驗(yàn)時(shí),首先要給定一個(gè)原假設(shè)H0,H0是關(guān)于總體參數(shù)的表述,與此同時(shí)存在一個(gè)與H0相對(duì)立的備擇假設(shè)H1,H0與H1有且僅有一個(gè)成立;經(jīng)過一次抽樣,若發(fā)生了小概率事件(通常把概率小于0.05的事件稱為小概率事件),可以依據(jù)“小概率事件在一次實(shí)驗(yàn)中幾乎不可能發(fā)生”的理由,懷疑原假設(shè)不真,作出拒絕原假設(shè)H0,接受H1的決定;反之,若小概率事件沒有發(fā)生,就沒有理由拒絕H0,從而應(yīng)作出拒絕H1的決定。82.假設(shè)檢驗(yàn)的步驟

1)根據(jù)問題確立原假設(shè)H0和備選假設(shè)H1;

2)確定一個(gè)顯著水平,它是衡量稀有性(小概率事件)的標(biāo)準(zhǔn),常取為0.05;3)選定合適的檢驗(yàn)統(tǒng)計(jì)量W(通常原假設(shè)成立時(shí),W的分布是已知的),根據(jù)W的分布及的值,確定H0的拒絕域;4)由樣本觀測(cè)值計(jì)算出統(tǒng)計(jì)量W的觀測(cè)值W0,如果W0落入H0的拒絕域,則拒絕H0;否則,不能拒絕原假設(shè)H0。9注意:在SAS系統(tǒng)中,是由樣本觀測(cè)值計(jì)算出統(tǒng)計(jì)量W

的觀測(cè)值W0和p值(p值就是當(dāng)原假設(shè)成立時(shí)得到樣本觀測(cè)值和更極端結(jié)果的概率)。

p值通常由下面公式計(jì)算得到。

●p=P{|W|≥|W0|}=2P{W≥|W0|}

(拒絕域?yàn)閮蛇厡?duì)稱的區(qū)域時(shí))

●p=P{W≥W0}(拒絕域?yàn)橛疫厖^(qū)域時(shí))

●p=P{W

W0}(拒絕域?yàn)樽筮厖^(qū)域時(shí))在SAS系統(tǒng),只需根據(jù)SAS計(jì)算出的p值,就可以在指定的顯著水平的值,當(dāng)p值<時(shí)拒絕原假設(shè),當(dāng)p值>時(shí)接收原假設(shè)。103.正態(tài)總體均值和方差的假設(shè)檢驗(yàn)

對(duì)正態(tài)總體的參數(shù)進(jìn)行假設(shè)檢驗(yàn)是假設(shè)檢驗(yàn)的重要內(nèi)容,如對(duì)單總體均值、方差的檢驗(yàn)、兩總體均值之差的檢驗(yàn)和兩總體方差比的檢驗(yàn)等。正態(tài)總體參數(shù)的各種檢驗(yàn)方法見下表2至表3。

表2單正態(tài)總體N(μ,2)均值μ的檢驗(yàn)法檢驗(yàn)名稱條件檢驗(yàn)類別H0H1檢驗(yàn)統(tǒng)計(jì)量分布拒絕域Z檢驗(yàn)已知雙邊檢驗(yàn)μ=μ0μ≠μ0N(0,1)|Z|≥Zα/2左邊檢驗(yàn)μ≥μ0μ<μ0Z≤-Zα右邊檢驗(yàn)μ≤μ0μ>μ0Z≥Zαt檢驗(yàn)未知雙邊檢驗(yàn)μ=μ0μ≠μ0t(n–1)|t|≥tα/2(n–1)左邊檢驗(yàn)μ≥μ0μ<μ0t≤–tα(n–1)右邊檢驗(yàn)μ≤μ0μ>μ0t≥tα(n–1)11表3單正態(tài)總體N(μ,2)方差2的檢驗(yàn)法檢驗(yàn)名稱條件檢驗(yàn)類別H0H1檢驗(yàn)統(tǒng)計(jì)量分布拒絕域χ2檢驗(yàn)μ已知雙邊檢驗(yàn)左邊檢驗(yàn)

右邊檢驗(yàn)μ未知雙邊檢驗(yàn)左邊檢驗(yàn)右邊檢驗(yàn)或或123.3總體均值的區(qū)間估計(jì)與假設(shè)檢驗(yàn)的SAS實(shí)現(xiàn)3.3.1使用INSIGHT模塊3.3.2使用“分析家”13

3.3.1使用INSIGHT模塊(總體均值的估計(jì)、單樣本總體均值的假設(shè)檢驗(yàn))1.總體均值的估計(jì)

【例3-1】某藥材生產(chǎn)商要對(duì)其倉庫中的1000箱藥材的平均重量進(jìn)行估計(jì),藥材重量的總體方差未知,隨機(jī)抽取16箱樣本稱重后結(jié)果如表3-1所示。

表3-116箱藥材重量(單位:千克)50505651495347525353495355485055設(shè)藥材重量數(shù)據(jù)存放于SAS數(shù)據(jù)文件li3_1中,其中重量變量名為weight。求該倉庫中每箱藥材平均重量在95%置信水平下的置信區(qū)間。141.

Analyze→Distribution(Y);

2.

選擇變量weight

→Output→

選擇

BasicConfidenceIntervals(區(qū)間估計(jì)選項(xiàng))

計(jì)算步驟如下:啟動(dòng)INSIGHT模塊,并打開數(shù)據(jù)集li3_1.15

結(jié)果包括一個(gè)名為“95%ConfidenceIntervals(95%置信區(qū)間)”的列表,表中給出了均值、標(biāo)準(zhǔn)差、方差的估計(jì)值(Parameter)、置信下限(LCL)和置信上限(UCL),如表2所示。結(jié)果表明:根據(jù)抽樣樣本,該倉庫中藥材的平均重量以95%的可能性位于50.08千克至52.92千克之間。表3-2藥材平均重量的區(qū)間估計(jì)162.單樣本總體均值的假設(shè)檢驗(yàn)

【例3-2】一家食品廠以生產(chǎn)袋裝食品為主,每天的產(chǎn)量大約為8000袋,每袋重量規(guī)定為100克。為了分析每袋重量是否符合要求,質(zhì)檢部門經(jīng)常進(jìn)行抽檢?,F(xiàn)從某天生產(chǎn)的一批食品中隨機(jī)抽取了25袋,測(cè)得每袋重量如表3-3所示。表3-325袋食品的重量(單位:克)112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3試從抽檢的樣本數(shù)據(jù)出發(fā),檢驗(yàn)重量的均值與100克是否有顯著差異。假定表3-3數(shù)據(jù)存放在數(shù)據(jù)集li3_2中,重量變量名為WEIGHT。17

設(shè)變量WEIGHT的均值為μ,通過樣本數(shù)據(jù)檢驗(yàn)變量WEIGHT的均值的假設(shè)為:

H0:μ=100, H1:μ

100使用INSIGHT對(duì)均值進(jìn)行檢驗(yàn)的步驟如下:首先啟動(dòng)INSIGHT,并打開數(shù)據(jù)集li3_2.1.Analyze→Distribution(Y);2.選定分析變量

WEIGHT→Output;3.選擇TestsforLocation

選項(xiàng)→Mu0:100

(輸入)→OK→OK18以上結(jié)果顯示,觀測(cè)值中不等于100克的觀測(cè)有24個(gè),其中19個(gè)觀測(cè)值大于100。表中第一個(gè)檢驗(yàn)為t檢驗(yàn)(Student‘st),需要假定變量服從正態(tài)分布,檢驗(yàn)的p值為0.0105<0.05,拒絕原假設(shè),即在0.05水平下可認(rèn)為均值與100克有顯著差異。第二個(gè)檢驗(yàn)(Sign)是叫做符號(hào)檢驗(yàn)的非參數(shù)檢驗(yàn),其p值為0.0066,在0.05水平下也是顯著的,結(jié)論相同。第三個(gè)檢驗(yàn)(SgnedRank)是叫做符號(hào)秩檢驗(yàn)的非參數(shù)檢驗(yàn),其p值為0.0048,在0.05水平下是顯著的,結(jié)論相同。輸出結(jié)果193.2.2使用“分析家”(總體均值的置信區(qū)間、單樣本總體均值的假設(shè)檢驗(yàn))1.總體均值的置信區(qū)間【例3-3】在“分析家”中求例3-1中每箱藥材平均重量在95%置信水平下的置信區(qū)間。步驟如下:在“分析家”模塊中打開數(shù)據(jù)集li3_1.1.Statistics→HypothesisTests→OneSamplet→

testforaMean(單樣本均值t-檢驗(yàn));2.選擇變量weight,按Tests

→選擇Interval(置信區(qū)間,如下

圖)

→OK→OK。20選擇均值的置信區(qū)間:

結(jié)果表明,根據(jù)抽樣樣本,該倉庫中藥材的平均重95%的可能性位于50.08千克至52.92千克之間。與利INSIGHT的結(jié)果相同。運(yùn)行結(jié)果:21

顯示結(jié)果(右表)表明t統(tǒng)計(jì)量的p值為0.0105<0.05,所以拒絕原假設(shè),即認(rèn)為總體的均值與100有顯著差異。2.單樣本總體均值的假設(shè)檢驗(yàn)【例3-4】使用“分析家”檢驗(yàn)例3-2中食品重量是否符合要求。需要通過樣本數(shù)據(jù)檢驗(yàn)變量WEIGHT均值的如下假設(shè):H0:μ=100,H1:μ

100由于此時(shí)的方差未知,所以使用t檢驗(yàn)法。步驟如下:在“分析家”中打開數(shù)據(jù)集li3_2.1.Statistics→HypothesisTests→OneSamplet–testforaMean(單樣本均值t-檢驗(yàn));2.選變量weight→Variable,Null:

Mean=100→OK.223.單樣本總體方差的假設(shè)檢驗(yàn)【例3-5】使用“分析家”檢驗(yàn)例3-2中食品重量是否符合要求。需要通過樣本數(shù)據(jù)檢驗(yàn)變量WEIGHT均值的如下假設(shè):H0:2

=93.21

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論