第08章 假設(shè)檢驗(yàn)_第1頁(yè)
第08章 假設(shè)檢驗(yàn)_第2頁(yè)
第08章 假設(shè)檢驗(yàn)_第3頁(yè)
第08章 假設(shè)檢驗(yàn)_第4頁(yè)
第08章 假設(shè)檢驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩91頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第八章

假設(shè)檢驗(yàn)授課教師:程曉謨主要內(nèi)容★1假設(shè)檢驗(yàn)的基本概念2單樣本t檢驗(yàn)3兩個(gè)獨(dú)立樣本t檢驗(yàn)4配對(duì)樣本t檢驗(yàn)5采用概率P值判斷原假設(shè)是否成立6用SPSS作均值假設(shè)檢驗(yàn)第一節(jié)

假設(shè)檢驗(yàn)的基本問(wèn)題什么是假設(shè)?

(hypothesis)對(duì)總體參數(shù)的數(shù)值所作的一種推斷??傮w參數(shù)包括總體均值、比例、方差等;分析之前必須先給出參數(shù)的估計(jì)值。我認(rèn)為該地區(qū)新生嬰兒的平均體重為3190克!什么是假設(shè)檢驗(yàn)?

(hypothesistesting)事先對(duì)總體參數(shù)或分布形式作出某種假設(shè),然后利用樣本信息來(lái)判斷原假設(shè)是否成立;有參數(shù)假設(shè)檢驗(yàn)和非參數(shù)假設(shè)檢驗(yàn);采用邏輯上的反證法,依據(jù)統(tǒng)計(jì)上的小概率原理。假設(shè)檢驗(yàn)中的小概率原理什么是小概率?在一次試驗(yàn)中,一個(gè)幾乎不可能發(fā)生事件的發(fā)生概率;假如概率很小的隨機(jī)事件,在一次實(shí)驗(yàn)中竟然發(fā)生了,則認(rèn)為原假設(shè)不正確;小概率由研究者事先確定。小概率事件據(jù)統(tǒng)計(jì),校園內(nèi)受傷的概率是1/3;行車遭遇車禍(指道路)的概率是1/12;在家中受傷的概率是1/80;家中成員死于突發(fā)事件的概率是1/1000;死于道路交通車禍(乘坐車輛)的概率是1/5000;行人被汽車撞死的概率是1/40000;死于火災(zāi)的概率是1/50000;溺水而死的概率是1/50000;因中毒而死(不含自殺)的概率是1/86000;騎自行車死于車禍的概率是1/130000;吃東西被噎死的概率是1/160000;死于飛機(jī)失事的概率是1/2500000;被凍死、熱死的概率是1/1500000;被動(dòng)物咬死的概率是1/2000000;被龍卷風(fēng)刮走摔死的概率是1/2000000。 數(shù)據(jù)來(lái)源“中國(guó)教育報(bào)”總體假設(shè)檢驗(yàn)的過(guò)程抽取隨機(jī)樣本均值

X=20我認(rèn)為人口的平均年齡是50歲提出假設(shè)

拒絕假設(shè)!

別無(wú)選擇.作出決策假設(shè)檢驗(yàn)的步驟提出原假設(shè)和備擇假設(shè)

什么是原假設(shè)?(nullhypothesis)待檢驗(yàn)的假設(shè),又稱“零假設(shè)”研究者想收集證據(jù)予以反對(duì)的假設(shè)總是有等號(hào),或表示為H0H0:

某一數(shù)值例如,H0:

3190(克)什么是備擇假設(shè)?(alternativehypothesis)與原假設(shè)對(duì)立的假設(shè),也稱“研究假設(shè)”研究者想收集證據(jù)予以支持的假設(shè)總是有不等號(hào):

,

或表示為H1H1:

<某一數(shù)值,或某一數(shù)值例如,H1:

<3910(克),或3910(克)提出原假設(shè)和備擇假設(shè)

什么是檢驗(yàn)統(tǒng)計(jì)量?用于假設(shè)檢驗(yàn)決策的統(tǒng)計(jì)量選擇統(tǒng)計(jì)量的方法與參數(shù)估計(jì)相同,需考慮是大樣本還是小樣本總體方差已知還是未知檢驗(yàn)統(tǒng)計(jì)量的基本形式為:確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量規(guī)定顯著性水平

(significantlevel)

什么是顯著性水平?是一個(gè)概率值;原假設(shè)為真時(shí),拒絕原假設(shè)的概率;被稱為抽樣分布的拒絕域表示為(alpha);常用的值有0.01,0.05,0.10由研究者事先確定;作出統(tǒng)計(jì)決策計(jì)算檢驗(yàn)的統(tǒng)計(jì)量;按P{當(dāng)H0為真拒絕H0}≤求出拒絕域;將檢驗(yàn)統(tǒng)計(jì)量的值與水平的臨界值進(jìn)行比較;得出接受或拒絕原假設(shè)的結(jié)論;假設(shè)檢驗(yàn)中的兩類錯(cuò)誤第一類錯(cuò)誤(棄真錯(cuò)誤)原假設(shè)為真時(shí)拒絕原假設(shè)第一類錯(cuò)誤的概率為P{拒絕H0∣H0為真}=被稱為顯著性水平第二類錯(cuò)誤(取偽錯(cuò)誤)原假設(shè)為假時(shí)接受原假設(shè)第二類錯(cuò)誤的概率為P{接受H0∣H0為假}=

錯(cuò)誤和錯(cuò)誤的關(guān)系n一定時(shí),你不能同時(shí)減少兩類錯(cuò)誤!和的關(guān)系就像翹翹板,小就大,大就小雙尾檢驗(yàn)和單尾檢驗(yàn)雙尾檢驗(yàn)(Two-Tailedtest)H0:μ=μ0;H1:μ≠μ0(即μ>μ0或μ<μ0);單尾檢驗(yàn)(One-Tailedtest)左邊檢驗(yàn):H0:μ≥μ0H1:μ<μ0右邊檢驗(yàn):H0:μ≤μ0H1:μ>μ0雙尾檢驗(yàn)的拒絕域

(RejectionRegions)抽樣分布H0值臨界值臨界值a/2a/2

樣本統(tǒng)計(jì)量拒絕域拒絕域1-置信水平雙尾檢驗(yàn)

(顯著性水平與拒絕域)H0值臨界值臨界值a/2a/2

樣本統(tǒng)計(jì)量拒絕域拒絕域抽樣分布1-置信水平統(tǒng)計(jì)量的值雙尾檢驗(yàn)

(顯著性水平與拒絕域)H0值臨界值臨界值

a/2a/2

樣本統(tǒng)計(jì)量拒絕域拒絕域抽樣分布1-置信水平統(tǒng)計(jì)量的值雙尾檢驗(yàn)

(顯著性水平與拒絕域)H0值臨界值臨界值a/2a/2

樣本統(tǒng)計(jì)量拒絕域拒絕域抽樣分布1-置信水平統(tǒng)計(jì)量的值單尾檢驗(yàn)

(左邊檢驗(yàn)的拒絕域)H0值臨界值a樣本統(tǒng)計(jì)量拒絕域抽樣分布1-置信水平左邊檢驗(yàn)

(顯著性水平與拒絕域)H0值a抽樣分布1-置信水平觀察到的樣本統(tǒng)計(jì)量拒絕域臨界值樣本統(tǒng)計(jì)量左邊檢驗(yàn)

(顯著性水平與拒絕域)H0值臨界值a樣本統(tǒng)計(jì)量拒絕域抽樣分布1-置信水平觀察到的樣本統(tǒng)計(jì)量右邊檢驗(yàn)

(顯著性水平與拒絕域)H0值a抽樣分布1-置信水平觀察到的樣本統(tǒng)計(jì)量拒絕域臨界值樣本統(tǒng)計(jì)量右邊檢驗(yàn)

(顯著性水平與拒絕域)H0值臨界值a樣本統(tǒng)計(jì)量抽樣分布1-置信水平拒絕域觀察到的樣本統(tǒng)計(jì)量第二節(jié)

一個(gè)正態(tài)總體下的

參數(shù)假設(shè)檢驗(yàn)總體均值μ的檢驗(yàn)

(2

已知)假定條件總體服從正態(tài)分布若不服從正態(tài)分布,可用正態(tài)分布來(lái)近似(n30)使用Z統(tǒng)計(jì)量2

已知:總體均值μ的檢驗(yàn)

(2未知)假定條件總體為正態(tài)分布正態(tài)分布,2未知,且小樣本使用t

統(tǒng)計(jì)量2

已知,檢驗(yàn)假設(shè):μ=μ0觀察檢驗(yàn)統(tǒng)計(jì)量~N(0,1)若原假設(shè)成立

值應(yīng)該較小這個(gè)數(shù)值是多大?如果值很大,超過(guò)某一數(shù)值,則懷疑原假設(shè)的真實(shí)。假設(shè)時(shí),拒絕H0如果H0是正確的,要使棄真的概率很小即a/2a/2

拒絕域拒絕域1-置信水平Z根據(jù)一個(gè)樣本計(jì)算即的值如果發(fā)現(xiàn)說(shuō)明在一次觀察中,統(tǒng)計(jì)量Z就落入拒絕域而這是個(gè)小概率事件,在一次試驗(yàn)中幾乎不可能發(fā)生,這樣的結(jié)果是在原假設(shè)的基礎(chǔ)上推導(dǎo)出來(lái),因此有理由懷疑原假設(shè)的正確性。如果發(fā)現(xiàn)則接受原假設(shè)2

已知,檢驗(yàn)假設(shè):μ=μ0

(例題)【例】已知生產(chǎn)線上生產(chǎn)出來(lái)的零件直徑服從正態(tài)分布,已知方差為0.09,通過(guò)抽取一批樣本n=4,得到為10.01mm,現(xiàn)在假設(shè)H0:均值μ=10mm,試判斷假設(shè)正確與否?(α=0.05)解:統(tǒng)計(jì)量接受H02

未知,檢驗(yàn)假設(shè):μ=μ0

(更符合統(tǒng)計(jì)實(shí)際需要)檢驗(yàn)統(tǒng)計(jì)量具體檢驗(yàn)思路與σ2已知相同SPSS軟件主要完成這種情況下的均值假設(shè)檢驗(yàn)拒絕域2

未知,單邊假設(shè)檢驗(yàn)左邊檢驗(yàn)H0:μ≥μ0;H1:μ<μ0拒絕域:右邊檢驗(yàn)H0:μ≤μ0;H1:μ>μ0拒絕域:?jiǎn)挝矙z驗(yàn)

(原假設(shè)與備擇假設(shè)的確定)將研究者想收集證據(jù)予以支持的假設(shè)作為備擇假設(shè)H1例如,一個(gè)研究者總是想證明自己的研究結(jié)論是正確的一個(gè)銷售商總是想證明供貨商的說(shuō)法是不正確的備擇假設(shè)的方向與想要證明其正確性的方向一致將研究者想收集證據(jù)證明其不正確的假設(shè)作為原假設(shè)H0先確立備擇假設(shè)H1單尾檢驗(yàn)

(原假設(shè)與備擇假設(shè)的確定)一項(xiàng)研究表明,采用新技術(shù)生產(chǎn)后,將會(huì)使產(chǎn)品的使用壽命明顯延長(zhǎng)到1500小時(shí)以上。檢驗(yàn)這一結(jié)論是否成立。研究者總是想證明自己的研究結(jié)論(壽命延長(zhǎng))是正確的備擇假設(shè)的方向?yàn)椤?gt;”(壽命延長(zhǎng))建立的原假設(shè)與備擇假設(shè)應(yīng)為

H0:

1500H1:

1500單側(cè)檢驗(yàn)

(原假設(shè)與備擇假設(shè)的確定)一項(xiàng)研究表明,改進(jìn)生產(chǎn)工藝后,會(huì)使產(chǎn)品的廢品率降低到2%以下。檢驗(yàn)這一結(jié)論是否成立。研究者總是想證明自己的研究結(jié)論(廢品率降低)是正確的備擇假設(shè)的方向?yàn)椤?lt;”(廢品率降低)建立的原假設(shè)與備擇假設(shè)應(yīng)為

H0:2%H1:

<2%用概率P值判斷原假設(shè)成立與否

(重點(diǎn)內(nèi)容)雙尾檢驗(yàn)的P值P值是如果原假設(shè)為真,抽樣分布中大于或小于樣本統(tǒng)計(jì)量的概率。單尾檢驗(yàn)的P值左邊檢驗(yàn)時(shí),P值為曲線上方小于等于檢驗(yàn)統(tǒng)計(jì)量部分的面積;右邊檢驗(yàn)時(shí),P值為曲線上方大于等于檢驗(yàn)統(tǒng)計(jì)量部分的面積。雙尾檢驗(yàn)的P值/

2/

2t拒絕拒絕H0值臨界值計(jì)算出的樣本統(tǒng)計(jì)量計(jì)算出的樣本統(tǒng)計(jì)量臨界值1/2P值1/2P值t統(tǒng)計(jì)量落入拒絕域等價(jià)于:P值<α雙尾檢驗(yàn)的P值/

2/

2tH0值臨界值計(jì)算出的樣本統(tǒng)計(jì)量臨界值t統(tǒng)計(jì)量落入接受域等價(jià)于:P值>α左邊檢驗(yàn)的P

值H0值臨界值a樣本統(tǒng)計(jì)量拒絕域抽樣分布1-置信水平計(jì)算出的樣本統(tǒng)計(jì)量P值t統(tǒng)計(jì)量落入拒絕域等價(jià)于:P值<α右邊檢驗(yàn)的P

值H0值臨界值a拒絕域抽樣分布1-置信水平計(jì)算出的樣本統(tǒng)計(jì)量P值t統(tǒng)計(jì)量落入拒絕域等價(jià)于:P值<α利用P值進(jìn)行檢驗(yàn)

(決策準(zhǔn)則)雙尾檢驗(yàn)若p值>

,

不能拒絕H0若p值<,拒絕H0單尾檢驗(yàn)若p值>

,不能拒絕H0若p值<,拒絕H0關(guān)于正態(tài)總體方差2

的檢驗(yàn)未知均值μ,檢驗(yàn)總體方差σ2=σ02檢驗(yàn)統(tǒng)計(jì)量c2拒絕域或未知均值μ,檢驗(yàn)總體方差σ2>σ02檢驗(yàn)統(tǒng)計(jì)量c2H0:拒絕域第三節(jié)

兩個(gè)正態(tài)總體下的

參數(shù)假設(shè)檢驗(yàn)適用條件μ1和μ2是否相等方差齊性檢驗(yàn)未知總體均值μ1,μ2H1:H0:檢驗(yàn)統(tǒng)計(jì)量拒絕域或兩個(gè)總體方差的F

檢驗(yàn)

(臨界值)0不能拒絕H0F拒絕H0a/2a/2拒絕H0兩個(gè)總體均值是否相等的檢驗(yàn)

(12、22

未知但相等)H0:μ1=μ2拒絕域統(tǒng)計(jì)檢驗(yàn)量?jī)蓚€(gè)總體均值是否相等的檢驗(yàn)

(12、22

未知且不相等)H0:μ1=μ2統(tǒng)計(jì)檢驗(yàn)量~t(f)大樣本下兩個(gè)任意總體

的均值檢驗(yàn)大樣本下兩個(gè)任意總體

均值檢驗(yàn)問(wèn)題在大樣本下12、22

已知的情況下,檢驗(yàn)統(tǒng)計(jì)量為:近似服從12、22

未知的情況下,檢驗(yàn)統(tǒng)計(jì)量為:大樣本下兩個(gè)0-1總體的

比例值檢驗(yàn)問(wèn)題原假設(shè):p1-p2=0檢驗(yàn)統(tǒng)計(jì)量為:原假設(shè):p1-p2=0p1=p2=p檢驗(yàn)統(tǒng)計(jì)量變成如何得到p的值?r1,r2是具有某性質(zhì)的樣本數(shù)第四節(jié)

用SPSS作假設(shè)檢驗(yàn)單樣本T檢驗(yàn)

(One-SampleTTest)使用“Analyze→CompareMeans→One-SampleTTest”模塊數(shù)據(jù)文件:

CH6參檢1小學(xué)生400米v提高.savH0:該市五年級(jí)學(xué)生的400米成績(jī)?nèi)詾?00秒;H1:該市五年級(jí)學(xué)生的400米成績(jī)不為100秒;輸入你所假設(shè)的均值輸入置信水平1-a計(jì)算所涉及的變量存在缺失值,則剔除在該變量上存在缺失值的個(gè)案。剔除在所有任意變量上存在缺失值的個(gè)案后再分析。Std.ErrorMean=Std.Deviation/=38.82007/=5.01165MeanDifference=Mean-100=5.38500t=MeanDifference/Std.ErrorMean=5.38500/5.01165=1.074df=N-1=60-1=59Sig.(2-tailed)=(1-CDF.T(1.074,59))*295%ConfidenceIntervaloftheDifference是95%的置信區(qū)間如何判斷原假設(shè)成立?1.074<t0.025=2.000.287>0.05(-4.6433,15.4133)不能拒絕原假設(shè)!再看一個(gè)類似的例子使用數(shù)據(jù)文件:CH6參檢1小學(xué)生400米v提高B.sav再次執(zhí)行單樣本T檢驗(yàn)均值101.4017似乎和100差距較小,但sig值要小于0.05,拒絕H0,反而認(rèn)為跑步的成績(jī)明顯下降了。相互獨(dú)立的兩組樣本的T檢驗(yàn)使用“Analyze→CompareMeans→Independent-SampleTTest”模塊數(shù)據(jù)文件:教材:例8.11

經(jīng)常食用谷類者

非經(jīng)常使用谷類者午餐平均大卡攝入量是否存在差異一定要注意數(shù)據(jù)的組織形式!要求兩組樣本數(shù)據(jù)存放在一個(gè)SPSS變量中。還需要定義一個(gè)存放總體區(qū)分標(biāo)志的變量。選入待檢驗(yàn)的變量選入分組變量“1”輸入Group1,“0”輸入Group2注意與分類變量的編碼對(duì)應(yīng)若分組變量為連續(xù)變量,輸入分界值置信水平1-a首先方差齊性檢驗(yàn),SPSS用LeveneF方法實(shí)現(xiàn)統(tǒng)計(jì)量F的值為0.207,介于[F0.975(14,19),F(xiàn)0.025(14,19)]即(0.30,2.65),沒(méi)有落入拒絕域,同時(shí)sig值(即概率P值)為0.652>0.05,因此不能拒絕原假設(shè),認(rèn)為兩個(gè)總體的方差相等。兩個(gè)總體方差相等,選擇“Equalvariancesassumed”這一行的數(shù)據(jù)來(lái)判斷。其中df自由度為n1+n2-2=33,MeanDifference為均值差異=583.00-629.25t=-2.413>t0.025(33)=-2.035,落入拒絕域中,拒絕原假設(shè);Sig值為0.022<0.05,拒絕原假設(shè);

95%的置信區(qū)間在“0”點(diǎn)右側(cè),說(shuō)明總體1的均值顯著小于總體2的均值。數(shù)據(jù)支持研究者的結(jié)論,即早餐食用較多的谷類食物有助于減少午餐中熱量的攝取。配對(duì)樣本的T檢驗(yàn)何為配對(duì)樣本?個(gè)案在“前”、“后”兩種狀態(tài)下某屬性的兩種狀態(tài);對(duì)某事物兩個(gè)不同側(cè)面或方面的描述;兩個(gè)樣本是相互關(guān)聯(lián)的,不是相互獨(dú)立的;兩個(gè)樣本的順序不可顛倒;兩組樣本的樣本量必須相同。配對(duì)樣本的T檢驗(yàn)使用“Analyze→CompareMeans→Paired-SampleTTest”模塊數(shù)據(jù)文件:

教材P235例8.15

H0:訓(xùn)練前和訓(xùn)練后的體重沒(méi)有顯著差異(μ1=μ2)H1:訓(xùn)練前和訓(xùn)練后的體重有顯著差異(μ1≠μ2)配對(duì)樣本t檢驗(yàn)的數(shù)據(jù)組織用兩個(gè)變量分別存放數(shù)據(jù)同時(shí)選中兩個(gè)變量數(shù)據(jù)正態(tài)分布檢驗(yàn)SPSS數(shù)據(jù)正態(tài)分布檢驗(yàn)方法“Analyze”→“NonParametricTests”→“LegacyDialogs”→“1-SampleK-S”方法一“Analyze”→“DescriptiveStatistics”→“Explore”→“Plot”方法二方法一:K-S檢驗(yàn)K-S檢驗(yàn)思路首先,H0:樣本來(lái)自的總體服從正態(tài)分布;在該假設(shè)前提下,計(jì)算各樣本觀測(cè)值在理論分布(正態(tài)分布)中出現(xiàn)的理論累計(jì)概率值F(x);其次,計(jì)算各樣本觀測(cè)值的實(shí)際累計(jì)概率值S(x),以及實(shí)際累計(jì)概率值與理論累計(jì)概率值的差D(x);最后,計(jì)算差值序列中的最大絕對(duì)值,即D=max(|S(xi)-F(xi)|),為使差值序列均勻,D修正為D=max[max(|S(xi)-F(xi)|)max(|S(xi-1)-F(x

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論