統(tǒng)計學 第3版 課件 ch8假設檢驗_第1頁
統(tǒng)計學 第3版 課件 ch8假設檢驗_第2頁
統(tǒng)計學 第3版 課件 ch8假設檢驗_第3頁
統(tǒng)計學 第3版 課件 ch8假設檢驗_第4頁
統(tǒng)計學 第3版 課件 ch8假設檢驗_第5頁
已閱讀5頁,還剩106頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

8.1假設檢驗的一般問題8.2一個總體參數(shù)的假設檢驗8.3兩個總體參數(shù)的假設檢驗8.4多個總體均值的比較—單因素方差分析Ch8

假設檢驗與方差分析一、假設檢驗的基本思想二、假設檢驗的一般步驟三、假設檢驗的兩類錯誤8.1假設檢驗的一般問題引例1

醫(yī)學檢測中經(jīng)常提到關(guān)于檢測結(jié)果存在“假陰”或“假陽”的可能。從統(tǒng)計理論來看,這是為什么呢?根據(jù)樣本得出的結(jié)論可能存在哪些錯誤呢?為什么要多種檢測方法結(jié)合?為什么須進行多次檢測?新藥上市前一般需要經(jīng)歷三期臨床試驗。嚴格的試驗主要是采用隨機對照試驗(Randomizedcontrolledtrial),即將研究對象按隨機化的方法分為試驗組與對照組,試驗組給予所要測試的藥品,對照組給予安慰劑,最后觀察兩組結(jié)果的差別是否具有統(tǒng)計意義。為什么必須要經(jīng)過大樣本的臨床試驗呢?為什么要采用隨機對照試驗呢?試驗組與對照組的差異要多大才具有統(tǒng)計意義呢?

回答以上問題,就需要運用統(tǒng)計推斷中的假設檢驗和方差分析。3實際中的假設檢驗問題產(chǎn)品生產(chǎn)線工作是否正常;廠商聲稱產(chǎn)品質(zhì)量符合標準,是否可信;測試不同營銷方式的效果有無顯著差異;學生考試成績是否服從正態(tài)分布兩個變量間是否存在相關(guān)性…………※假設檢驗——關(guān)于總體某一數(shù)量特征事先作出一個假設命題,然后通過樣本信息來判斷該命題是否成立??煞譃椋?/p>

參數(shù)檢驗(限定分布檢驗)

非參數(shù)檢驗(自由分布檢驗)——本課程不講8--5小概率原理小概率事件:發(fā)生概率很小的隨機事件小概率原理:小概率事件在一次試驗(觀察)中幾乎不可能發(fā)生。小概率原理在日常決策中廣泛運用…什么樣的概率才算小概率?根據(jù)決策的風險要求來決定,沒有統(tǒng)一的界定標準。假設檢驗中給“小概率”設定的具體水準稱為顯著性水平(

——后面詳講。8--6【引例2】

銷售商從生產(chǎn)企業(yè)采購了2000件產(chǎn)品,合同規(guī)定,若這批產(chǎn)品不合格率超過5%,銷售商就可以退貨并獲得相應的賠償。驗收時,隨機抽取了10件進行檢測,查出3件不合格品。于是,銷售商要求退貨并賠償(理由:樣本不合格率p=30%>5%)但生產(chǎn)企業(yè)并買賬(理由:樣本不合格率超標并不能說明整批產(chǎn)品不合格率超標)應該如何判定?待檢驗的假設:總體不合格率P≤5%8--7一、假設檢驗的基本思想(續(xù))決策思路——假設:總體不合格率P=5%如果這一假設成立,則根據(jù)二項分布理論可算得:所抽樣本出現(xiàn)的概率為0.01

——即在次品率為5%的總體中抽出10件產(chǎn)品就有3件次品的概率只有1%理論上這種小概率事件在一次抽樣中不會發(fā)生,但實際卻抽到了這樣的樣本,這顯然不合理。這種不合理性源于推論的假設前提,故上述假設不能接受,即可推斷這批產(chǎn)品的次品率大于5%。一、假設檢驗的基本思想(續(xù))假如,抽查10件產(chǎn)品僅有1件不合格品呢?樣本不合格率10%。銷售商是否有權(quán)要求退貨?同理,先假設P=5%,則從總體中抽10件產(chǎn)品就有1件不合格的概率=0.315=也就是說,在“P=5%”假設前提下,隨機抽到這種樣本可能性不算小,比較“正?!保瑯颖拘畔⑴c假設命題不矛盾,從而不能否定“P=5%”的假設命題,銷售商退貨索賠的理由不充分。8--8【例8-1】

某企業(yè)生產(chǎn)一種零件,過去的大量資料表明,零件長度服從正態(tài)分布,平均長度為4厘米,標準差為0.15厘米。現(xiàn)從改革工藝后生產(chǎn)的零件中隨機抽查100個零件,測得平均長度為3.95厘米?,F(xiàn)問:工藝改革前后零件的長度是否發(fā)生了顯著的變化呢?解:這是關(guān)于改革后零件的總體平均長度是否等于4厘米的假設檢驗問題。樣本平均長度與4厘米之差異不外乎兩種可能原因:一是總體平均長度不變,但由于抽樣的隨機性使得樣本均值與總體均值之間存在抽樣誤差;二是總體平均長度確實發(fā)生了變化,使得來自這一總體的樣本均值也不等于4厘米。98--10【例8-1】(續(xù))改革后的零件平均長度是否為4cm?

8--11【例8-1】(續(xù))給定顯著性水平1‰,查臨界值Zα/2=3.29|Z|=3.333>Zα/2=3.29。這意味著,如果“μ=4”的假設成立,那么在這一次抽樣中就發(fā)生了“|Z|>Zα/2”這種小概率事件.或者說,P{|Z|≥3.333}=0.000858<α=0.001所以,應否定“μ=4”這一假設,推斷工藝改革后零件的長度有了顯著的變化(即μ≠4)。8--12假設檢驗的特點采用邏輯上的反證法先承認要檢驗的假設為真,觀察在此前提下樣本的出現(xiàn)是否合理。若不合理,則判斷假設不真,應予以拒絕;反之則不能拒絕。判斷是否合理依據(jù)的是小概率原理即這里的反證法是具有概率性質(zhì)的反證法。8--13基本思想(續(xù))如果這個值是總體參數(shù)真值

統(tǒng)計量

總體參數(shù)的假設值θ0這樣的值在一次觀察中出現(xiàn)的可能性很小,...觀察值在抽樣觀察中統(tǒng)計量出現(xiàn)這樣的值是很正常...統(tǒng)計量的分布假設檢驗必須以有關(guān)的抽樣分布理論為依據(jù)。8--14二、假設檢驗的步驟(一)提出原假設和備擇假設(二)確定檢驗統(tǒng)計量及其分布(三)規(guī)定顯著性水平α(四)計算檢驗統(tǒng)計量的值(五)作出檢驗結(jié)論8--15(一)提出假設包括原假設和備擇假設。原假設(NullHypothesis)——待檢驗的假設,也稱為零假設,用H0表示。備擇假設(AlternativeHypothesis)——也稱對立假設,與原假設內(nèi)容完全相反,準備在拒絕原假設后應接受的假設。用H1表示。事實上,提出了H0,也就同時給出H1。引例1中,H0:P≤5%,H1:P>5%例8-1中,H0:μ=4,H1:μ≠48--16假設的三種形式:θ~待檢驗的總體參數(shù),θ0~具體的數(shù)值;原假設必須包括“=”;單側(cè)檢驗的原假設也常常簡寫為

實際中往往只對其邊界值θ0進行檢驗,該值能夠拒絕,其它值更有理由拒絕。單側(cè)檢驗8--17檢驗統(tǒng)計量及其分布是假設檢驗的具體理論依據(jù)檢驗統(tǒng)計量指用于檢驗原假設是否成立的統(tǒng)計量它是一個隨機變量,其數(shù)值隨樣本不同而不同;不包含未知總體參數(shù)但要包含原假設中總體參數(shù)的假設值θ0;在原假設成立的前提下,檢驗統(tǒng)計量的抽樣分布應該是明確的。(二)確定檢驗統(tǒng)計量及其分布8--18檢驗統(tǒng)計量及其分布通??捎杀粰z驗參數(shù)的點估計量經(jīng)過標準化來導出。

選擇統(tǒng)計量的方法與參數(shù)估計相同:是大樣本還是小樣本其他總體參數(shù)(如總體方差)已知還是未知常用的檢驗統(tǒng)計量有:Z、t、卡方、F統(tǒng)計量等,假設檢驗的具體方法通常以檢驗統(tǒng)計量服從的分布來命名。如:(二)確定檢驗統(tǒng)計量及其分布(續(xù))8--19(三)規(guī)定顯著性水平

顯著性水平

——小概率的標準,如0.01,0.05,0.1給定了

,也就確定了臨界值,也就等于建立了檢驗的具體規(guī)則。臨界值——原假設的拒絕區(qū)域與不能拒絕區(qū)域的分界點。根據(jù)檢驗統(tǒng)計量的分布,給定的

查相應的概率分布表,即得臨界值。臨界值還與檢驗形式(單雙側(cè))有關(guān)8--20雙側(cè)檢驗的顯著性水平與拒絕域檢驗統(tǒng)計量的分布a/2a/2

(1-

)

θ0臨界值臨界值檢驗統(tǒng)計量HO的拒絕區(qū)域HO的拒絕區(qū)域(不能拒絕HO的區(qū)域)8--21右側(cè)檢驗中的顯著性水平與拒絕域檢驗統(tǒng)計量的分布a(1-

)

θ0臨界值(不能拒絕HO的區(qū)域)H0的拒絕區(qū)域

檢驗統(tǒng)計量8--22將樣本資料代入檢驗統(tǒng)計量的公式,計算出檢驗統(tǒng)計量的觀測值。(四)計算檢驗統(tǒng)計量的值

及其對應的P值如例8-1中,σ

=0.15,n=100H0:μ=250檢驗統(tǒng)計量:8--23假設檢驗的P值(P-value)什么是P值?在原假設為真的假定前提下,出現(xiàn)觀察到的樣本以及更極端(偏離原假設)樣本的概率。P值表示所觀察到的樣本對原假設的支持程度。P值越小,說明拒絕原假設的證據(jù)越強檢驗統(tǒng)計量的觀察值P值θ0【右側(cè)檢驗中】引例中的P值=8--24P值的計算P值的大小與檢驗統(tǒng)計量的分布、檢驗統(tǒng)計量的觀測值、檢驗類型等因素都有關(guān)。

設檢驗的統(tǒng)計量為ξ,c是計算得統(tǒng)計量的值。單側(cè)檢驗中,P值通常為統(tǒng)計量分布曲線從檢驗統(tǒng)計量的觀察值到拒絕區(qū)域這一側(cè)的面積。左側(cè)檢驗時,P值=P{ξ

c}右側(cè)檢驗時,P值=P{ξ

c}雙側(cè)檢驗中,P值=單側(cè)P值的2倍。即:

P值=2P{ξ≥c},當c在右側(cè)時;或:P值=2P{ξ≤c},當c在左側(cè)時。8--25P值的計算(續(xù))—【例8-1】檢驗統(tǒng)計量的值:

P值=P(|Z|≥3.333)=2×P(Z≤-3.333)=2×0.000429=0.000858P值一般不可能手工計算,可查表或有軟件算出。03.333-3.333檢驗統(tǒng)計量的觀察值8--26(五)作出檢驗結(jié)論兩種判斷準則:依據(jù)臨界值來判斷(以Z檢驗為例):左側(cè)檢驗時,若Z≤-Zα,拒絕原假設;右側(cè)檢驗時,若Z≥+Zα時,拒絕原假設;雙側(cè)檢驗時,若|Z|≥Zα/2時,拒絕原假設。依據(jù)P

值來判斷:若P

值<α,則拒絕原假設;反之,則不能拒絕原假設。8--27雙側(cè)檢驗中的結(jié)論(1)a/2a/2

(1-

)θ0臨界值臨界值檢驗統(tǒng)計量檢驗統(tǒng)計量的觀察值結(jié)論:不能拒絕HO8--28雙側(cè)檢驗中的結(jié)論(2)a/2a/2

(1-

)θ0臨界值臨界值檢驗統(tǒng)計量檢驗統(tǒng)計量的觀察值結(jié)論:拒絕HO8--29右側(cè)檢驗中的結(jié)論(1)a(1-

)θ0臨界值檢驗統(tǒng)計量檢驗統(tǒng)計量的觀察值結(jié)論:不能拒絕HO8--30右側(cè)檢驗中的結(jié)論(2)a(1-

)θ0臨界值檢驗統(tǒng)計量檢驗統(tǒng)計量的觀察值結(jié)論:拒絕HO8--31(五)作出檢驗結(jié)論(續(xù))例8-1中,

P值=0.000858結(jié)論:|Z|=3.333≥Zα/2=3.29,拒絕原假設或:P值<α=0.001,同樣應拒絕原假設。8--32P值與α

的關(guān)系檢驗的顯著性水平α是事先設定的拒絕原假設時所犯錯誤的概率的最大允許值。P值是根據(jù)觀察樣本實際計算的拒絕原假設時所犯錯誤的概率值。P值——觀察到的顯著性水平(實測的顯著性水平(observedsignificantlevel,縮寫“Sig”);P值——也是拒絕原假設的最小顯著性水平。8--33“統(tǒng)計量的實現(xiàn)值比臨界值更極端”=“p值小于α”P值與α的關(guān)系(圖)表8-1

實際情況決策(結(jié)論)H0為真H0為不真拒絕H0第一類錯誤(拒真)(概率=a

)正確不能拒絕H0(接受H0)正確第二類錯誤(采偽)(

概率=b

)8--34決策結(jié)果與兩類錯誤三、假設檢驗中的兩類錯誤8--351.第一類錯誤(“棄真”或“拒真”錯誤)原假設為真時拒絕原假設(例1,當產(chǎn)品本來合格時)犯第一類錯誤的概率為

(即顯著性水平)

=P(拒絕H0/H0為真)a

θ0拒絕域右側(cè)檢驗中三、假設檢驗中的兩類錯誤(續(xù))8--36三、假設檢驗中的兩類錯誤(續(xù))2.第二類錯誤(“取偽”或“采偽”錯誤)原假設不真時未拒絕(接受)原假設例如,產(chǎn)品銷售方承諾次品率<5%,這是假的。但買方檢驗時作出了信任賣方的錯誤判斷第二類錯誤的概率為

Prob(接受H0/H0不真)=

θ0拒絕域右側(cè)檢驗中

θ1拒絕域β8--37兩類錯誤概率的關(guān)系(右側(cè)檢驗中)a

θ0拒絕域βθ18--38

的關(guān)系在檢驗中人們總希望犯兩類錯誤的可能性都很小,然而,在其它條件不變的情況下,和不可能同時減小,就象交易中買賣雙方各自承擔的風險一樣。

α和β的關(guān)系就好比翹翹板8--39確定α時應考慮的因素視兩類錯誤所產(chǎn)生的后果輕重而定當犯第一類錯誤的后果嚴重時,則希望盡可能不犯第一類錯誤,寧愿犯第二類錯誤,此時α宜小。當犯第二類錯誤的后果嚴重時,則希望盡可能不犯第二類錯誤,寧愿犯第一類錯誤,此時α不宜太小8--40【附】影響

大小的因素1.顯著性水平

隨減少而增大2.總體參數(shù)的真值隨著總體參數(shù)的假設值與真實值的差異縮小而增大3.樣本容量n隨著n增大,檢驗統(tǒng)計量的分布曲線更集中,曲線尾端的面積則減少。4.總體標準差

增大時

增大8--418.2一個總體參數(shù)的假設檢驗8.2.1對一個正態(tài)總體均值的檢驗一、總體方差已知時——

Z

檢驗法二、總體方差未知時——t檢驗法8.2.2對一個正態(tài)總體方差的檢驗小樣本時——

卡方檢驗法8.2.3一個總體成數(shù)的檢驗大樣本時——Z

檢驗法8--42§8.2.1對一個正態(tài)總體均值的檢驗H0:

;H1:根據(jù)抽樣分布理論,總體方差已知時,對均值的檢驗統(tǒng)計量為:

臨界值—給定α后,查標準正態(tài)分布表而得.單側(cè)檢驗時,臨界值為-Zα

或Zα雙側(cè)檢驗時,臨界值為-Zα/2

和Zα/21.方差已知時對正態(tài)總體均值的檢驗—z

檢驗法過去大量資料表明,某酒廠生產(chǎn)的一種瓶裝酒的容量服從標準差為5毫升的正態(tài)分布,企業(yè)標示的產(chǎn)品平均容量為250毫升。監(jiān)督機構(gòu)從市場上隨機抽取了該產(chǎn)品12瓶進行檢測,測得平均容量為246毫升。試在0.05的顯著性水平下,檢驗該酒廠生產(chǎn)的這種瓶裝酒是否存在容量不足的問題?43【例8-2】8--44【例8-2】檢驗過程H0:;H1:n

=12,

0.05,Zα=1.645檢驗統(tǒng)計量:P值=P(Z≤-2.771)=0.0028結(jié)論:拒絕H0

,即存在容量不足的問題

。0.05

0-1.645P值-2.771若是雙側(cè)檢驗,P值=2×P{Z≤-2.771}=0.00568--45單側(cè)檢驗(例+)【例+】根據(jù)過去大量資料,某廠產(chǎn)品的使用壽命X~N(1020,1002)?,F(xiàn)從該廠最近生產(chǎn)的一批產(chǎn)品中隨機抽取16件,測得樣本平均壽命為1080小時。試在0.05的顯著性水平下判斷這批產(chǎn)品的使用壽命是否有顯著提高?

8--46(檢驗過程)H0:;H1:n

=16,

0.05,Zα=1.645檢驗統(tǒng)計量:P值=P(Z≥2.4)=1-P(Z≤2.4)=1-0.991802=0.0081980.05

01.645結(jié)論:拒絕H0

,即這批元件的壽命有顯著提高。檢驗統(tǒng)計量的觀察值P值8--47【小結(jié)】方差已知時對正態(tài)總體均值的檢驗——z檢驗法Z

檢驗法——利用服從標準正態(tài)分布的Z

統(tǒng)計量進行假設檢驗的方法。對總體均值的Z檢驗,主要適用于:若總體呈正態(tài)分布,且總體方差已知時;若總體非正態(tài)分布,但n

30時,可近似采用Z

檢驗8--482.總體方差未知對正態(tài)總體均值的檢驗

——t

檢驗法H0:

;H1:檢驗統(tǒng)計量:給定顯著性水平α,查得t

分布表中自由度為(n-1)所對應的臨界值。左側(cè)檢驗,臨界值為-tα(n-1),P值=右側(cè)檢驗,臨界值為tα(n-1)

,P值=雙側(cè)檢驗時,臨界值為

-tα/2(n-1)和tα/2(n-1)。其余步驟同前。8--49【例8-3】某企業(yè)生產(chǎn)的一種袋裝食品,按規(guī)定要求平均每袋重量為800克?,F(xiàn)從一批產(chǎn)品中隨機抽取10袋,測得每袋重量(單位:克)分別為789、780、794、762、802、813、770、785、810、806。假設重量服從正態(tài)分布,要求在5%的顯著性水平下,檢驗這批產(chǎn)品的重量是否符合要求?H0:;H1:n=10,

0.05,tα/2(n-1)=t0.025(9)=2.2628--50【例8-3】檢驗過程——雙側(cè)t檢驗檢驗統(tǒng)計量:即:該日生產(chǎn)的鋼管內(nèi)徑正常0.025

0.025

0-2.262.26結(jié)論:不能拒絕H0

檢驗統(tǒng)計量的觀察值8--51【例8-3】續(xù)——t檢驗的P值結(jié)論:P值>

=0.05,不能拒絕H0P值=2×P{t(9)≥1.473}=2×0.0874=0.1748單側(cè)P值0檢驗統(tǒng)計量的觀察值1.473One-SampleTestTestValue=800tdfSig.(2-tailed)MeanDifference95%ConfidenceIntervaloftheDifferenceLowerUpper重量-1.6429.135-8.9000-21.15863.3586【例8-3的SPSS輸出】8--52[小結(jié)]總體方差未知時對正態(tài)總體均值檢驗——

t檢驗法t檢驗法——利用服從t分布的統(tǒng)計量進行假設檢驗的方法。對均值的t檢驗主要適用于:若總體呈正態(tài)分布,且總體方差未知時(用S2代替

2,或用S代替

)當n

30時,t分布趨近于正態(tài)分布,故可近似采用Z檢驗代替t檢驗。8--538.2.2一個總體方差的檢驗——卡方檢驗

檢驗統(tǒng)計量:利用服從

2分布的統(tǒng)計量來進行的檢驗—卡方(

2)檢驗;8--54一個正態(tài)總體方差的

2檢驗(續(xù))對給定的顯著性水平

,可查得

2分布表中自由度為(n-1)所對應的臨界值。左側(cè)檢驗,臨界值為右側(cè)檢驗,臨界值為雙側(cè)檢驗,臨界值為和P值=相應的單尾P值的兩倍8--55【例8-4】在例8-3中,若按要求,產(chǎn)品重量的標準差應不超過10克。試在0.05的顯著性水平下,檢驗這批產(chǎn)品重量的波動是否符合要求?解:提出假設:H0:

2=100(或)H1:

2

>1008--56計算結(jié)果

=0.05n-1=10-1=9臨界值在

=0.05的顯著性水平上應拒絕H0,即可認為這批產(chǎn)品重量的波動不符合要求。

20

=0.0516.92

不能拒絕拒絕域檢驗統(tǒng)計量的值:決策和結(jié)論:8--57

2檢驗(例+)【例+】根據(jù)長期正常生產(chǎn)的資料可知,某廠所產(chǎn)維尼綸的纖度服從正態(tài)分布,其方差為0.0025?,F(xiàn)從某日產(chǎn)品中隨機抽出20根,測得樣本方差為0.0042。試判斷該日纖度的波動與平時有無顯著差異(取α=0.10)?解:提出假設:H0:

2=0.0025H1:

2

0.00258--58計算結(jié)果

=0.1n-1=20-1=19臨界值:在

=0.10的顯著性水平上拒絕H0,即有證據(jù)表明該日長度的波動比平時有顯著差異.

20

/2=0.0510.1230.14拒絕不能拒絕拒絕域檢驗統(tǒng)計量的值:決策和結(jié)論:8--59

即:在

=0.1的顯著性水平上拒絕H0,有充足證據(jù)表明該日纖度的波動比平時有顯著差異。檢驗統(tǒng)計量的值:計算結(jié)果——P值

20/2=0.05檢驗統(tǒng)計量的觀察值P值/2

P值=2×0.0319=0.0638

結(jié)論:P值<

=0.1,所以應該拒絕H08--60正態(tài)總體標準差的Z檢驗法(可略)原假設為H0:

=

0

,(

0

為一已知數(shù))檢驗統(tǒng)計量:對總體標準差的Z

檢驗適用于:總體服從(或近似服從)正態(tài)分布大樣本,即

n

30。大樣本條件下,樣本標準差近似服從正態(tài)分布,即:

8--618.2.3一個總體成數(shù)的檢驗HO:P=P0,H1:P≠(或>,<)P0假定條件只有兩類結(jié)果(總體服從二點分布)大樣本下【n≥30,np≥5且n(1-p)≥5】,可用正態(tài)分布來近似3.檢驗統(tǒng)計量——Z統(tǒng)計量或8--62[例8-5]

一醫(yī)學專家認為,某地區(qū)居民亂用抗生素的情況比較嚴重,治療兒童感冒的過程中,亂用抗生素的病例高達1/5以上。

為了檢驗這種說法,某醫(yī)療機構(gòu)從該地區(qū)患感冒的兒童中隨機調(diào)查了100個病例,發(fā)現(xiàn)其中有26例亂用抗生素。試問調(diào)查結(jié)果是否支持專家的看法(分別以0.05和0.10的顯著性水平進行檢驗)?8--63[例8-5]解HO:P≤1/5,H1:P>1/5n>30且np=26>5,n(1-p)=74>5檢驗統(tǒng)計量的值:P值=P{Z≥1.5}=0.067若α=0.1,應拒絕原假設即支持經(jīng)理的看法。若α=0.05,則不能拒絕原假設即不能支持…8--64【附】怎樣提出假設

(怎樣提出原假設和備擇假設?)(1)明確所要檢驗的總體參數(shù)是什么(2)根據(jù)研究問題確定假設的形式(類型)—雙側(cè):關(guān)心總體參數(shù)與某值有無差異?!獑蝹?cè):關(guān)心總體參數(shù)是否比某值偏大或偏?。ú粌H在乎有無差異,也關(guān)心差異的方向)8--65怎樣提出假設(續(xù))(3)采用左側(cè)還是右側(cè)?(a)本著“保守”或“不輕易拒絕H0

”的原則H0代表一種久以存在的狀態(tài),一般是理論設計或是以前大量資料所證明了的。拒絕H0時所犯錯誤的概率α是受控制的、明確的、通常是很小的,說明H0是受保護的,不至于輕易被否定。8--66怎樣提出假設(續(xù))假設檢驗與對被告是否犯罪的審判很相似—原假設:被告是清白的——無罪推定的原則備擇假設:被告是有罪的。本著不輕易冤枉人的原則進行審判。樣本信息就象所獲取的證據(jù)和證詞。當判有罪時,必須有充足的證據(jù)或理由;當證據(jù)不足時,只能判無罪或重新搜集新的證據(jù)。8--67怎樣提出假設(續(xù))(b)檢驗某項權(quán)威聲明的有效性指導思想:除非我們有證據(jù)表明聲明無效,否則就應認為此項聲明是有效的具體方法:將權(quán)威聲明(或承諾)作為H0先確立H0,再將相反的陳述(對該聲明的質(zhì)疑)作為H18--68怎樣提出假設(續(xù))(c)

把希望證明的假設作為備擇假設先確定備擇假設,再將相反的命題作為原假設H0例如,改進生產(chǎn)工藝后,會使產(chǎn)品的平均成本降低到20元以下。相應的原假設與備擇假設應為:H0:平均成本≥20H1:平均成本<208--69怎樣提出假設(續(xù))(d)把樣本顯示的信息作為H1先確定H1,再將相反的命題作為原假設H0教材上的例題統(tǒng)計軟件計算P-值時一般自動把樣本信息顯示的方向作為H1的方向.8--70【附】區(qū)間估計與假設檢驗的關(guān)系聯(lián)系對同一參數(shù)的估計和檢驗,所依據(jù)的抽樣分布理論相同;推斷結(jié)果都有一定的可信程度或風險;可相互轉(zhuǎn)化

——如利用置信區(qū)間可進行假設檢驗8--71【附】區(qū)間估計與假設檢驗的關(guān)系區(qū)別區(qū)間估計——是根據(jù)樣本信息估計總體參數(shù)的置信區(qū)間;以樣本估計量為決策的主要參考點(置信區(qū)間以樣本估計值為中心);著眼于大概率;通常為雙側(cè)。假設檢驗——根據(jù)樣本信息判斷原假設是否成立;以原假設為主要決策參考點;著眼于小概率;有單側(cè)、也有雙側(cè)。8--72利用置信區(qū)間進行假設檢驗對總體均值進行雙側(cè)檢驗:1.求出均值的置信區(qū)間

已知時:若總體參數(shù)的原假設值μ0在置信區(qū)間外,則拒絕H0;反之則接受原假設。

未知時:8--73t檢驗與相應的置信區(qū)間(例)【例+】某廠采用自動包裝機分裝產(chǎn)品,假定每包產(chǎn)品的重量服從正態(tài)分布,每包標準重量為1000克。某日隨機抽查9包,測得樣本平均重量為986克,樣本標準差為24克。試問在0.05的檢驗水平上,能否認為這天自動包裝機工作正常?8--74(置信區(qū)間——雙側(cè)t檢驗)H0:;H1:n=9,

0.05,tα/2(n-1)=t0.025(9-1)=2.2306即:自動包裝機運轉(zhuǎn)正常0.025

0.025

0-2.232.23結(jié)論:不能拒絕H0

檢驗統(tǒng)計量的值-1.75置信區(qū)間:8.3.1兩個正態(tài)總體均值之差的檢驗兩個獨立樣本的情形方差已知時——z檢驗方差未知時——t檢驗兩個成對樣本的情形8.3.2兩個正態(tài)總體方差相等性的檢驗—F檢驗8.3.3兩個總體成數(shù)之差的檢驗——z檢驗8.3兩個總體參數(shù)的假設檢驗【可略】

8--758.3.1兩個正態(tài)總體均值差的檢驗(1)若兩個正態(tài)總體的方差已知,檢驗統(tǒng)計量為:8--76EXCEL數(shù)據(jù)分析——Z檢驗:雙樣本平均差檢驗1.兩個樣本相互獨立的情形兩個正態(tài)總體均值差的檢驗(續(xù))8--77(2)若兩正態(tài)總體方差未知但相等,檢驗統(tǒng)計量為:EXCEL數(shù)據(jù)分析——t檢驗:雙樣本等方差假設兩個正態(tài)總體均值差的檢驗(續(xù))8--78(3)若兩個正態(tài)總體的方差未知且不一定相等,檢驗統(tǒng)計量近似于t分布,其自由度為v:EXCEL數(shù)據(jù)分析——t檢驗:雙樣本異方差假設兩個正態(tài)總體均值差的檢驗(續(xù))8--792.兩個樣本為成對樣本的情形EXCEL數(shù)據(jù)分析——t檢驗:平均值的成對二樣本分析檢驗統(tǒng)計量為:8.3.2兩個正態(tài)總體方差相等性的檢驗在原假設成立的條件下,檢驗統(tǒng)計量及其分布為:雙側(cè)檢驗的拒絕域為:8--80右側(cè)檢驗的拒絕域為:EXCEL數(shù)據(jù)分析——F檢驗:雙樣本方差分析8--81Excel中兩總體參數(shù)的假設檢驗“數(shù)據(jù)”——“數(shù)據(jù)分析”——Z檢驗:雙樣本平均差檢驗適用于兩個正態(tài)總體方差已知的情形;t檢驗:雙樣本等方差假設適用于兩個正態(tài)總體方差未知但相等的情形;t檢驗:雙樣本異方差假設適用于兩個正態(tài)總體方差未知且不相等的情形;t檢驗:平均值的成對二樣本分析適用于成對樣本時對兩正態(tài)總體均值差的檢驗。F-檢驗:雙樣本方差分析適用于兩個正態(tài)總體方差相等性的檢驗EXCEL假設檢驗小結(jié)8--82假設檢驗的基本概念:原假設,備擇假設,檢驗統(tǒng)計量,單側(cè)(左側(cè),右側(cè))檢驗,雙側(cè)檢驗,臨界值,拒絕域,顯著性水平,P值,兩類錯誤假設檢驗基本思想,一般步驟,α和β的關(guān)系。參數(shù)檢驗主要包括總體均值、總體方差和總體比例的檢驗。檢驗方法有Z檢驗、t檢驗、χ2檢驗、F檢驗等等要求:熟練掌握一個總體參數(shù)的假設檢驗(了解)兩總體參數(shù)之差(或比)的檢驗——利用EXCEL得出計算結(jié)果;注意它們與單總體參數(shù)的假設檢驗之間的聯(lián)系與區(qū)別8.4--838.4多個總體均值的比較

——單因素方差分析8.4.1問題的提出8.4.2單因素方差分析的基本原理8.4.3單因素方差分析的的應用本節(jié)在推斷統(tǒng)計中的地位檢驗一個總體的均值——————假設檢驗檢驗兩個總體的均值是否相等——假設檢驗檢驗多個總體的均值是否相等——方差分析從形式上看,方差分析法是同時對多個總體均值的比較實質(zhì)上,它是研究某個(或幾個)定性變量對所觀測的定量變量有無顯著影響、鑒別因素效應的一種常用方法。8.4--848.4.1問題的提出8.4--85【例8-11】一研究小組為了研究三種不同施肥方案對某種農(nóng)作物收獲量的影響,在17個試驗地塊上做了試驗。每個地塊上的土質(zhì)、農(nóng)作物品種、播種量和播種方法等影響該農(nóng)作物收獲量的因素均相同。試根據(jù)表8-4的收獲量數(shù)據(jù)分析不同施肥方案是否對收獲量有顯著影響(顯著性水平為0.05)。

地塊編號施肥方案123456A1556276686063A27058625065A37880688275648.4--86檢驗施肥方案對收獲量是否有影響,也就是檢驗三種施肥方案的平均收獲量是否相同;設三種施肥方案的總體平均收獲量分別為:

1、

2、

3

,也就是檢驗下面的假設:H0:

1

2

3H1:

1

,

2

,

3

不全相等檢驗上述假設就可采用方差分析。8.4.1問題的提出(續(xù))8.4--87方差分析的幾個基本概念因素或因子——所要檢驗的對象稱為因子,是定性變量如上例中的施肥方案。根據(jù)所涉及的因素多少,方差分析分為:單因素方差分析雙因素方差分析——本課程略無交互影響有交互影響多因素方差分析——本課程略8.4--88方差分析的幾個基本概念(續(xù))

水平因素的具體表現(xiàn)稱為水平(也稱為類別或處理方案).在上例中三種施肥方案就是因素的三個水平。每個水平下的所有可能結(jié)果構(gòu)成一個總體。

觀察值樣本是分別從每個水平(總體)中隨機抽取的。在第i個水平下的j個觀察值,記為xij例8-11中,每種施肥方案中各個地塊的收獲量就是觀察值8.4--898.4.2單因素方差分析的基本原理設各水平下的觀察值表示為:該水平的總體均值

隨機項因此,所有觀察值

xij之間的差異,可能來源于兩個方面:8.4--90觀察值的兩種誤差

1.系統(tǒng)誤差(條件誤差)各水平的總體均值

μi不同導致的差異;它是由于所研究因素條件改變而產(chǎn)生的差異比如,對任一地塊來說,不同施肥方案的收獲量可能都有明顯差異,這可能是由于所研究因素——施肥方案不同而造成的

2.隨機誤差由于抽樣的隨機性或試驗過程中各種隨機因素的影響所造成的;在同一水平下,觀察值之間總是存在隨機波動;

比如,同一種施肥方案的各個地塊的收獲量是有差異的8.4--91觀察值的兩種誤差(續(xù))方差分析就是要判斷有無系統(tǒng)誤差存在。若觀察值的差異不僅來源于隨機誤差,也包含系統(tǒng)誤差,則說明不同水平下的總體均值存在顯著性差異(即所研究因素存在明顯的影響效應)。為此,要對觀察值的差異進行分析。8.4--92總離差的分解樣本觀測值之間的差異大小可用離差來衡量,這個離差習慣上也稱為總離差,因為它可以分解為兩個離差之總和,即:其中,8.4--93離差平方總和的分解要對全部觀測值的離差進行綜合分析,就需要計算全部觀測值的離差平方總和并對它進行分解??傠x差平方和=組內(nèi)平方和+組間平方和簡記為:SST=SSE+SSA8.4--94總離差平方和——全部觀察值與總平均數(shù)的離差平方和;反映全部觀察數(shù)據(jù)的差異程度。8.4--95組內(nèi)平方和——各水平內(nèi)部的觀察值與該水平均值的離差平方和。

反映同一水平下樣本觀察值的差異程度,所以不包含系統(tǒng)誤差,只包含隨機誤差。比如,同種施肥方案的各個地塊的收獲量的差異。8.4--96組間平方和——各組平均數(shù)與總平均數(shù)的離差平方和。反映因素的不同水平(不同總體)下各樣本均值之間的差異;既可能包括系統(tǒng)誤差,也包括隨機誤差;如三種施肥方案的樣本平均收獲量之間的差異8.4--97為了說明觀測值中有無系統(tǒng)誤差,就需要對組間平方和與組內(nèi)平方和進行比較。為此還需消除觀察值多少對離差平方和大小的影響,計算均方(MS,也稱方差,其分母為各自的自由度)??傠x差平方和SST=組內(nèi)平方和SSE+組間平方和SSA8.4--98方差分析的基本思想如果施肥方案對收獲量沒有影響,那么在組間方差中只包含有隨機誤差,而沒有系統(tǒng)誤差。這時,組間方差與組內(nèi)方差就應該很接近,兩個方差的比值

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論