假設(shè)檢驗與方差分析_第1頁
假設(shè)檢驗與方差分析_第2頁
假設(shè)檢驗與方差分析_第3頁
假設(shè)檢驗與方差分析_第4頁
假設(shè)檢驗與方差分析_第5頁
已閱讀5頁,還剩49頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

假設(shè)檢驗與方差分析[]第1頁,共54頁,2023年,2月20日,星期日實際中的假設(shè)檢驗問題1.產(chǎn)品自動生產(chǎn)線工作是否正常;2.某種新生產(chǎn)方法是否會降低產(chǎn)品成本;3.治療某疾病的新藥是否比舊藥療效更高;4.廠商聲稱產(chǎn)品質(zhì)量符合標(biāo)準(zhǔn),是否可信;5.學(xué)生考試成績是否服從正態(tài)分布…

※假設(shè)檢驗——事先作出關(guān)于總體參數(shù)、分布形式、相互關(guān)系等的命題(假設(shè)),然后通過樣本信息來判斷該命題是否成立(檢驗)。第2頁,共54頁,2023年,2月20日,星期日

一、假設(shè)檢驗的基本思想例1.

從1000件產(chǎn)品中抽出10件,有4件次品,問這批產(chǎn)品能否出廠?提出假設(shè):P<=4%,如果這一假設(shè)成立,則出現(xiàn)所抽樣本的概率小于1‰。這種可能性極小,但在一次抽樣中發(fā)生了,顯然不合理。這種不合理性源于推論的假設(shè)前提,故上述假設(shè)不能接受。第一節(jié)假設(shè)檢驗的基本概念第3頁,共54頁,2023年,2月20日,星期日例2原來的平均長度=4cm,標(biāo)準(zhǔn)差=0.02cm。樣本:n=100,平均長度=3.948。改革后的平均長度=4?假設(shè):改革后=4,根據(jù)抽樣分布理論,有:在上述假設(shè)的前提下,=3.948等價于Z=26,是幾乎肯定不可能出現(xiàn)的事件。然而它發(fā)生了,這表明原假設(shè)是不合理的。第4頁,共54頁,2023年,2月20日,星期日假設(shè)檢驗的特點采用邏輯上的反證法——先認(rèn)為假設(shè)為真,觀察在此前提下所抽到樣本的出現(xiàn)是否合理。若合理則判斷假設(shè)可接受,反之拒絕假設(shè)。判斷是否合理的依據(jù)統(tǒng)計上的小概率原理(即這里的反證法是基于一定概率的反證法)。第5頁,共54頁,2023年,2月20日,星期日假設(shè)檢驗中的小概率原理1.

小概率事件:發(fā)生概率很小的隨機事件。小概率原理:小概率事件在一次試驗(觀察)中幾乎不可能發(fā)生。什么樣的概率才算小概率?——由研究者事先確定(根據(jù)決策的風(fēng)險或要求的把握程度來決定),沒有統(tǒng)一的界定標(biāo)準(zhǔn)。假設(shè)檢驗中把這個概率稱為檢驗的“顯著性水平”。第6頁,共54頁,2023年,2月20日,星期日提出原假設(shè)和備擇假設(shè)確定適當(dāng)?shù)臋z驗統(tǒng)計量及其分布規(guī)定顯著性水平計算檢驗統(tǒng)計量的值作出統(tǒng)計決策二、假設(shè)檢驗的步驟第7頁,共54頁,2023年,2月20日,星期日(一)提出假設(shè)包括原假設(shè)和備擇假設(shè)。原假設(shè)——待檢驗的假設(shè),也稱為零假設(shè),用H0表示。備擇假設(shè)——也稱對立假設(shè),與原假設(shè)內(nèi)容完全相反的假設(shè)。當(dāng)拒絕原假設(shè)后應(yīng)接受的假設(shè)。用H1表示。事實上,對某個問題提出了原假設(shè),也就同時給出了備擇假設(shè)。第8頁,共54頁,2023年,2月20日,星期日假設(shè)的三種形式:左側(cè)檢驗與右側(cè)檢驗統(tǒng)稱為單側(cè)檢驗。第9頁,共54頁,2023年,2月20日,星期日1. 檢驗統(tǒng)計量是用于假設(shè)檢驗問題的統(tǒng)計量;2. 選擇統(tǒng)計量的方法與參數(shù)估計中相同:待檢驗的參數(shù)是什么是大樣本還是小樣本總體方差已知還是未知常用的檢驗統(tǒng)計量有:Z、t、卡方、F統(tǒng)計量等。如(二)確定檢驗統(tǒng)計量及其分布第10頁,共54頁,2023年,2月20日,星期日(三)規(guī)定顯著性水平原假設(shè)為真時,拒絕原假設(shè)的概率,用表示.由研究者根據(jù)具體情況事先確定。常取0.01,0.05,0.10。給定了,也就確定了臨界值——原假設(shè)的接受區(qū)域與拒絕區(qū)域的分界點。根據(jù)檢驗統(tǒng)計量的分布,由給定的

查相應(yīng)的概率分布表,即得臨界值。如采用Z統(tǒng)計量時=0.05對應(yīng)的臨界Z0.05=1.645。臨界值還與檢驗形式有關(guān)。第11頁,共54頁,2023年,2月20日,星期日(四)計算檢驗統(tǒng)計量的值——根據(jù)樣本資料計算出檢驗統(tǒng)計量的觀察值。(五)作出檢驗結(jié)論——將檢驗統(tǒng)計量的值與水平的臨界值進行比較,得出接受或拒絕原假設(shè)的結(jié)論。當(dāng)檢驗統(tǒng)計量的值落在拒絕區(qū)域,則拒絕原假設(shè);反之,接受或不能拒絕原假設(shè)。第12頁,共54頁,2023年,2月20日,星期日留待后面講解的兩個問題1。檢驗的P值

與傳統(tǒng)檢驗方法的比較。

2。怎樣提出假設(shè)。第13頁,共54頁,2023年,2月20日,星期日三、假設(shè)檢驗中的兩類錯誤1. 第一類錯誤(“棄真”或“拒真”錯誤)原假設(shè)為真時拒絕原假設(shè)犯第一類錯誤的概率為(被稱為顯著性水平)Prob(拒絕H0/H0為真)=2. 第二類錯誤(“取偽”或“采偽”錯誤)原假設(shè)不真時接受原假設(shè)第二類錯誤的概率為Prob(接受H0/H0不真)=第14頁,共54頁,2023年,2月20日,星期日決策結(jié)果與兩類錯誤決策實際情況H0為真H0為不真拒絕H0第一類錯誤(a)正確(1-b)接受H0正確(1–a)第二類錯誤(b)第15頁,共54頁,2023年,2月20日,星期日和的關(guān)系

在檢驗中人們總希望犯兩類錯誤的可能性都很小,然而,在其它條件不變的情況下,和不可能同時減小,就象交易中買賣雙方各自承擔(dān)的風(fēng)險一樣。一般說,哪一類錯誤帶來的后果越嚴(yán)重、危害越大,就應(yīng)該作為首要的控制目標(biāo).在假設(shè)檢驗中,一般都首先控制第一類錯誤.第16頁,共54頁,2023年,2月20日,星期日給定α?xí)r考慮的因素——視兩類錯誤所產(chǎn)生的后果輕重而定當(dāng)犯第一類錯誤的后果嚴(yán)重時,則希望盡可能不犯第一類錯誤,寧愿犯第二類錯誤,此時α宜小。當(dāng)犯第二類錯誤的后果嚴(yán)重時,則希望盡可能不犯第二類錯誤,寧愿犯第一類錯誤,此時α不宜太小——事前對原假設(shè)的信念對原假設(shè)越有信心,則越??;反之則越大第17頁,共54頁,2023年,2月20日,星期日影響

錯誤的因素1. 顯著性水平

隨減少而增大2. 總體參數(shù)的真值隨著總體參數(shù)的假設(shè)值與真實值的差異縮小而增大樣本容量n隨著n增大,檢驗統(tǒng)計量的分布曲線更集中,曲線尾端的面積則減少。4. 總體標(biāo)準(zhǔn)差當(dāng)增大時增大第18頁,共54頁,2023年,2月20日,星期日第二節(jié)正態(tài)總體參數(shù)的檢驗一、方差已知時對正態(tài)總體均值的檢驗

——z檢驗法二、方差未知時對正態(tài)總體均值的檢驗

——t檢驗法三、對正態(tài)總體方差的檢驗

——檢驗法第19頁,共54頁,2023年,2月20日,星期日一、方差已知時對正態(tài)總體均值的檢驗——z檢驗法H0:H1:根據(jù)抽樣分布理論,總體方差已知時則檢驗統(tǒng)計量為:

Z檢驗法——利用服從標(biāo)準(zhǔn)正態(tài)分布的Z統(tǒng)計量進行假設(shè)檢驗的方法。若總體不是正態(tài)分布,但n30時可近似采用Z檢驗給定后,臨界值查標(biāo)準(zhǔn)正態(tài)分布表而得。單側(cè)檢驗時,臨界值=Za或-Za;雙側(cè)檢驗時,臨界值=-Za/2和Za/2。第20頁,共54頁,2023年,2月20日,星期日(一)雙側(cè)檢驗(例)問題:改革后生產(chǎn)的零件平均長度是否為4cm?檢驗的步驟:提出原假設(shè):H0:=4和備擇假設(shè):H1:4選擇檢驗統(tǒng)計量Z給定顯著性水平1%,查臨界值Za/2=2.58計算檢驗統(tǒng)計量的觀察值:z=-26比較檢驗統(tǒng)計量的值|z|和臨界值,作出結(jié)論(由于|z|>臨界值,拒絕原假設(shè))。第21頁,共54頁,2023年,2月20日,星期日單側(cè)檢驗(例三)某廠以前生產(chǎn)的電子元件的平均使用壽命不低于1000小時。已知使用壽命服從正態(tài)分布,標(biāo)準(zhǔn)差為100小時。現(xiàn)隨機抽取了25件,得知樣本平均使用壽命為1050小時。問這批產(chǎn)品的壽命是否有顯著性提高?(=0.05)第22頁,共54頁,2023年,2月20日,星期日(計算結(jié)果)H0:

≤1000,H1:

>1000n=

100,

=

0.05,臨界值=Z0.05=1.645檢驗統(tǒng)計量:結(jié)論:

=0.05的水平上能拒絕H0,接受備擇假設(shè),即有證據(jù)表明這批產(chǎn)品的平均使用壽命高于1000小時。第23頁,共54頁,2023年,2月20日,星期日(二)總體方差未知時對總體均值檢驗——t檢驗1. 假定條件總體為正態(tài)分布,但未知(用S*代替)小樣本2. 檢驗統(tǒng)計量給定顯著性水平,查t分布表得臨界值。其余步驟同前。利用服從

t分布的統(tǒng)計量進行假設(shè)檢驗的方法統(tǒng)稱為t檢驗法。第24頁,共54頁,2023年,2月20日,星期日三、正態(tài)總體方差的檢驗——卡方(2)檢驗1. 檢驗一個總體的方差或標(biāo)準(zhǔn)差2. 假設(shè)總體服從正態(tài)分布3. 原假設(shè)為H0:2=024. 檢驗統(tǒng)計量利用服從

t分布的統(tǒng)計量進行假設(shè)檢驗的方法統(tǒng)稱為2檢驗法。第25頁,共54頁,2023年,2月20日,星期日2檢驗(例)長期正常生產(chǎn)的資料表明,某廠產(chǎn)品的厚度服從正態(tài)分布,其方差為0.25?,F(xiàn)從某日產(chǎn)品中隨機抽取20根,得修正的樣本方差為0.42。試判斷該日產(chǎn)品厚度是否與正常生產(chǎn)情況存在顯著差異?(=0.05)第26頁,共54頁,2023年,2月20日,星期日檢驗結(jié)果H0:2=0.0025,H1:2

0.0025

=0.10,n-1=

20-1=19接受區(qū)域:(10.117,30.144)統(tǒng)計量:結(jié)論:在

=0.10的水平上拒絕H0,即有證據(jù)表明該日厚度的波動與正常生產(chǎn)情況時有顯著差異。第27頁,共54頁,2023年,2月20日,星期日第三節(jié)總體成數(shù)的Z檢驗假定條件只有兩類結(jié)果總體服從二點分布大樣本下(且np>5,n(1-p)>5,可用正態(tài)分布來近似)成數(shù)檢驗的Z統(tǒng)計量第28頁,共54頁,2023年,2月20日,星期日(例)

一研究者估計某市居民家庭的汽車擁有率為30%?,F(xiàn)隨機抽查了200的家庭,其中68個家庭擁有汽車。試問研究者的估計是否可信?(

=0.05)第29頁,共54頁,2023年,2月20日,星期日

檢驗結(jié)果H0:p=0.3,H1:p

0.3=0.05,n

=20臨界值:-1.96,+1.96檢驗統(tǒng)計量:結(jié)論:在

=0.05的顯著性水平上接受H0,表明研究者的估計可接受的。第30頁,共54頁,2023年,2月20日,星期日1。檢驗的P-值2。怎樣提出假設(shè)3。利用置信區(qū)間進行檢驗(區(qū)間估計與假設(shè)檢驗的關(guān)系)幾點補充第31頁,共54頁,2023年,2月20日,星期日1.假設(shè)檢驗的P-值

(P-Value)——P值(P-value)是一種概率?!谠僭O(shè)為真的假定前提下,出現(xiàn)觀察到的樣本以及更極端樣本的概率?!芙^原假設(shè)的最小顯著性水平;——觀察到的顯著性水平(實測的顯著性水平)。第32頁,共54頁,2023年,2月20日,星期日(續(xù))——P值表示所觀察到的樣本對原假設(shè)的支持程度。P值越大,在原假設(shè)為真的情況下,樣本出現(xiàn)的概率越大,出現(xiàn)這樣的樣本不是小概率事件,說明原假設(shè)不能拒絕。反之,應(yīng)拒絕原假設(shè)。第33頁,共54頁,2023年,2月20日,星期日利用P值進行決策單側(cè)檢驗若P值

,不能拒絕H0若P值<,拒絕H0雙側(cè)檢驗若P值

/2,不能拒絕H0若P值</2,拒絕H0第34頁,共54頁,2023年,2月20日,星期日P值的計算設(shè)檢驗的統(tǒng)計量為ξ,c是計算得統(tǒng)計量的值。左側(cè)檢驗時,P值=p{ξc}右側(cè)檢驗時,P值=P=p{ξc}雙側(cè)檢驗中,P值=單側(cè)P值的2倍。第35頁,共54頁,2023年,2月20日,星期日例在例三(1)中,用Z檢驗法對總體均值進行雙側(cè)檢驗,給定顯著性水平=0.05,由樣本數(shù)據(jù)計算出檢驗統(tǒng)計量的值=2.5,因此可計算出該假設(shè)檢驗的:

P值=Prob{|Z|≥2.5}=2×Prob{Z≥2.5}=2×{1-Prob{Z<2.5}

=2×(1-0.9938)=0.0124由于P值<給定的,所以拒絕原假設(shè)。第36頁,共54頁,2023年,2月20日,星期日2.怎樣原假設(shè)和備擇假設(shè)?(1)根據(jù)研究問題確定假設(shè)的形式雙側(cè):關(guān)心總體參數(shù)與某值有無差異。單側(cè):關(guān)心總體參數(shù)是否比某值偏大或偏小。(2)建立原假設(shè)應(yīng)該本著“保守”或“不輕易拒絕原假設(shè)”的原則。(3)有時還要顧及數(shù)學(xué)上的處理方便。第37頁,共54頁,2023年,2月20日,星期日3.利用置信區(qū)間進行假設(shè)檢驗

(雙側(cè)檢驗)求出雙側(cè)檢驗均值的置信區(qū)間已知時:未知時:若總體的假設(shè)值在置信區(qū)間內(nèi),則接受H0,反之則拒絕H0。第38頁,共54頁,2023年,2月20日,星期日區(qū)間估計與假設(shè)檢驗的聯(lián)系與區(qū)別二者既有聯(lián)系,都屬于統(tǒng)計推斷方法,根據(jù)樣本信息進行推斷;推斷結(jié)果都有一定置信度或有一定風(fēng)險;對相同條件的推斷問題,其推斷的理論依據(jù)——抽樣分布理論也相同;利用置信區(qū)間可以進行假設(shè)檢驗。又有區(qū)別:區(qū)間估計立足于大概率,假設(shè)檢驗更注重小概率是否發(fā)生;二者的主要決策參考點不同。

第39頁,共54頁,2023年,2月20日,星期日第四節(jié)單因素試驗的方差分析假設(shè)檢驗可以用于檢驗一個總體的均值或檢驗兩個總體的均值是否相等;方差分析檢驗多個總體的均值是否相等根據(jù)所涉及的因素多少,方差分析分為:單因素方差分析雙因素方差分析無交互影響的有交互影響的多因素方差分析第40頁,共54頁,2023年,2月20日,星期日方差分析的基本思想和原理

(幾個基本概念)因素或因子所要檢驗的對象稱為因子水平因素的具體表現(xiàn)稱為水平(也稱為類別或處理方案).觀察值在第i個水平下的j個觀察值,記為yij。4.試驗——每一次隨機抽樣可看成一次隨機試驗這里只涉及一個因素,因此稱為單因素試驗。5.總體因素的每一個水平可以看作是一個總體第41頁,共54頁,2023年,2月20日,星期日觀察值的兩種誤差設(shè)各水平下的觀察值表示為:=該水平的總體均值+隨機項所有觀察值yij之間的差異,可能來源于兩個方面:1.系統(tǒng)誤差(條件誤差)——各水平的總體均值不同,從而導(dǎo)致了各水平下的樣本觀察值也有差異。由于所研究因素改變而產(chǎn)生的試驗結(jié)果的差異,即在因素的不同水平(總體)下,各觀察值間的差異。第42頁,共54頁,2023年,2月20日,星期日(觀察值的兩種誤差)2.隨機誤差——由于偶然因素而產(chǎn)生的差異,或者說是由于抽樣的隨機性所造成的。即在因素的同一水平(同一個總體)下,樣本的各觀察值之間的差異;方差分析就是要判斷有無系統(tǒng)誤差存在。為此,要對觀察值的差異進行分析。第43頁,共54頁,2023年,2月20日,星期日方差的分解總離差平方和—全部觀察值與總平均數(shù)的離差平方和。組內(nèi)平方和—各水平內(nèi)部的觀察值與該水平均值的離差平方和。反映同一水平下樣本觀察值的差異程度,所以不包含系統(tǒng)誤差,只包含隨機誤差。第44頁,共54頁,2023年,2月20日,星期日3.組間平方和—各組平均數(shù)與總平均數(shù)的離差平方和。反映因素的不同水平(不同總體)下各樣本均值之間的差異;既包括隨機誤差,也包括系統(tǒng)誤差;總離差平方和=組內(nèi)平方和+組間平方和

SST=SSE+SSA第45頁,共54頁,2023年,2月20日,星期日各離差平方和的大小與觀察值的多少有關(guān),為了消除觀察值多少對離差平方和大小的影響,需要將其平均,這就是均方(MS),也稱為方差(分母為相應(yīng)的自由度)??偡讲?總離差平方和/(n-1)=SST/(n-1)組內(nèi)方差=組內(nèi)平方和/(n-k)=SSE/(n-k)組間方差=組間平方和/(k-1)=SSA/(k-1)第46頁,共54頁,2023年,2月20日,星期日方差分析中的基本假定每個總體都應(yīng)服從正態(tài)分布也就是說,對于因素的每一個水平,其觀察值是來自服從正態(tài)分布總體的簡單隨機樣本;各個總體的方差必須相同也就是說,對于各組觀察數(shù)據(jù),是從具有相同方差的總體中抽取的;觀察值是獨立的第47頁,共54頁,2023年,2月20日,星期日提出假設(shè)構(gòu)造檢驗的統(tǒng)計量給定檢驗的顯著性水平計算檢驗統(tǒng)計量的值統(tǒng)計決策(結(jié)論)單因素方差分析的步驟第48頁,共54頁,2023年,2月20日,星期日1.提出假設(shè)一般提法H0:m1=m2=…=

mk(因素有k個水平)H1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論