版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、第五章 假設(shè)檢驗導(dǎo)論:單樣本的z檢驗A根本概念零假設(shè)檢驗統(tǒng)計決定一類錯誤和二類錯誤單側(cè)檢驗和雙側(cè)檢驗在前四章中,我們對描述性統(tǒng)計做了介紹。特別是通過z分?jǐn)?shù)我們可以計算個體在總體分布中的位置和樣本在抽樣分布中的位置。換句話說,我們可以描述個體或者樣本的特殊性。那么處于怎樣的位置才算是特殊呢?這種特殊性有怎么來驗證呢?這些問題是假設(shè)檢驗所要解決的問題。最簡單的假設(shè)檢驗是將一組被試與總體進行比較,且總體均數(shù)和標(biāo)準(zhǔn)差。舉個例子,碩士研究生考試包含筆試和面試,面試在最終錄取中起到了很大的作用,因為導(dǎo)師更看重素質(zhì)而不是分?jǐn)?shù)。有個導(dǎo)師聲稱,他的眼光很準(zhǔn),他可以看一下學(xué)生的眼睛,就能找到好的學(xué)生。我們要對他的
2、說話進行驗證。如果我們用智商來代表一個學(xué)生的素質(zhì)盡管可能并不適宜,那么剛剛的問題就變成了那個導(dǎo)師可以通過看學(xué)生的眼睛來判斷他的智商。我們可以通過如下方式進行檢驗:讓他通過自己的方式挑出25個學(xué)生,然后比較這些學(xué)生的智商是否真的較高。被試組選擇要驗證該導(dǎo)師的說法,我們要讓他選25個他認(rèn)為高智商的同學(xué),但是這種選擇需要加以限制。如果該導(dǎo)師直接奔向基地班,那這種選擇顯然是無效的??蛇x擇的方法是,把學(xué)校所有學(xué)生的照片都找來,讓其通過相貌來確定。這樣學(xué)校的每一個學(xué)生都有相同的時機被選到,而且每一次選取獨立于其他的選取。也就是遵循隨機取樣的原那么。如果該導(dǎo)師選出的學(xué)生的平均智商確實高于總體平均,我們能否確
3、認(rèn)他確實眼光很準(zhǔn)呢?答案是不能。原因在于,我們隨便找一個人去選,選出的學(xué)生的平均智商都不太可能等于總體平均數(shù)。從均數(shù)的抽樣分布,我們可以得知,高于總體平均數(shù)的可能占50%。也就是說該導(dǎo)師選出的學(xué)生平均智商高于總體均數(shù)的原因可能是隨機因素。這時,我們可以先做出一個假設(shè),對其進行驗證:選取學(xué)生的平均智商并不顯著高于總體均數(shù),其差異是隨機抽樣產(chǎn)生的,并不涉及一個特別的選擇過程。這就是零假設(shè)檢驗。接下來,我們要做的就是隨機選取25個學(xué)生測其智商,重復(fù)n次,看有多少次能選到比那個導(dǎo)師選取的學(xué)生平均智商更高。也就是確定其概率。上述的做法會得到智商均數(shù)的一個分布,由于這個分布顯示的是零假設(shè)沒有特殊操作,隨機
4、選取為真時發(fā)生的情況,因此被稱為零假設(shè)分布。在單樣本檢驗且總體標(biāo)準(zhǔn)差的情況下,這個零假設(shè)分布就是均數(shù)的抽樣分布。通過這個零假設(shè)分布,我們可以算出選出比那個導(dǎo)師選擇的學(xué)生組平均智商更高的概率是多少。通過z分?jǐn)?shù)來計算,比方該導(dǎo)師選取的25個學(xué)生平均智商為104,總體均數(shù)為100,標(biāo)準(zhǔn)差為15.那么查表可知,對應(yīng)的概率為0.0918。這個概率是通過隨機選擇而得到該分?jǐn)?shù)的概率,被稱為p值。統(tǒng)計決定算出其概率之后,我們要做的是做出個統(tǒng)計推斷。因為推斷的做出是基于概率的,如果要得到該導(dǎo)師的選擇是無效的,也就是說該組學(xué)生的平均智商高于總體是隨機抽樣造成的,我們需要冒一定的風(fēng)險。小概率事件也時有發(fā)生。我們需要
5、承擔(dān)的這個風(fēng)險量被稱為水平。 是我們愿意承擔(dān)的零假設(shè)成立的概率。如果實際算出的概率要低于,那么我將會拒絕零假設(shè)。心理學(xué)中,每20次中有1次時機能抽到的水平被認(rèn)為是能接受的最大風(fēng)險值。也就是0.05.如果采用0.05的水平,且實驗p值小于0.05,那么我們可以再0.05的顯著水平上拒絕零假設(shè)。也就說,那位導(dǎo)師的眼光顯著好于一般人。如果p大于0.05,我們會認(rèn)為那位導(dǎo)師的挑選完全無效嗎?一般情況下,我們會說沒能拒絕零假設(shè)證據(jù)缺乏。這是數(shù)學(xué)家Fisher的觀點:認(rèn)為我們要么拒絕零假設(shè),要么保存做出決定的權(quán)利。而Neyman和Pearson那么認(rèn)為,應(yīng)該提出與零假設(shè)互補的備擇假設(shè),因此拒絕其中一個就說
6、明傾向于接受另一個。在上邊的例子中,我們把智商轉(zhuǎn)換成了z分?jǐn)?shù),然后進行統(tǒng)計檢驗。這種情況下,z分?jǐn)?shù)被稱為檢驗統(tǒng)計量。后邊我們還會講到t分布。檢驗統(tǒng)計量的分布被認(rèn)為是零假設(shè)分布。Z分?jǐn)?shù)越大,p值越小,差異越顯著。一類錯誤和二類錯誤前面提到,如果p值遠小于0.05,我們拒絕了零假設(shè),但我們還是要承擔(dān)一定的風(fēng)險。比方,我們通過考試來評估學(xué)生能力,90分對應(yīng)著p=0.05,那么我們那么會認(rèn)為90分以上的學(xué)生為好學(xué)生。但是如果一些學(xué)生參加了考試輔導(dǎo),老師幫他們賭到了一些考試題,使得他們平均分高于90。在統(tǒng)計檢驗中,我們發(fā)現(xiàn)p小于0.05,那我們會得到結(jié)論,這些同學(xué)能力高于一般水平。這時,我們顯然犯了一個
7、錯誤。也就是我們拒絕了這些學(xué)生水平的一般的假設(shè)零假設(shè),而零假設(shè)才是真的,這種錯誤稱為一類錯誤。虛報、存?zhèn)稳绻硪唤M學(xué)生平時學(xué)習(xí)很好,但是由于考試當(dāng)天集體食物中毒,拉肚子,導(dǎo)致考試成績不高,p大于0.05,統(tǒng)計推斷結(jié)果接受零假設(shè),這些學(xué)生成績一般。這種情況下,我們就犯了二類錯誤,即零假設(shè)為假而我們卻接受了它。漏報、去真研究者的決定實際情況零假設(shè)為真零假設(shè)非真接受零假設(shè)正確決定p=1- 二類錯誤p=拒絕零假設(shè)一類錯誤p= 正確決定p=1-一類錯誤會產(chǎn)生誤導(dǎo)。比方你的實驗結(jié)果證明你的某種訓(xùn)練可以提高注意力,而注意力的集中有利于學(xué)習(xí)成績的提高。那么別人就可能認(rèn)為你的訓(xùn)練有利于提高學(xué)習(xí)成績。但是如果在你
8、的實驗中犯了一類錯誤,那么其他人用你的訓(xùn)練方法時并不能提高學(xué)生的成績。降低一類錯誤的方法就是屢次重復(fù)實驗或者測量,反復(fù)證明訓(xùn)練對注意力提高的有效性。另一種降低一類錯誤的方法就是選取更低的水平。但是降低水平會導(dǎo)致更多的二類錯誤。水平人為地設(shè)為0.05實際上在一類錯誤和二類錯誤的可能負(fù)性后果之間尋求一種妥協(xié)。在某些特殊的研究中,比方治療癌癥的藥物研發(fā)中,應(yīng)選取較大的值。因為這種情況下犯二類錯誤的后果是相當(dāng)嚴(yán)重的。單側(cè)檢驗和雙側(cè)檢驗如果前面提到的那位導(dǎo)師挑選的學(xué)生平均智商是90,這時我們不會拒絕零假設(shè)。那此時我們是不是就接受零假設(shè),認(rèn)為這個導(dǎo)師眼光一般呢?我們不能,因為還有另一種可能,該導(dǎo)師眼光很差
9、。這樣問題就修正為要驗證該導(dǎo)師眼光特殊很好或者很差。在之前的檢驗中,我們要驗證該導(dǎo)師的眼光很好,用的單側(cè)單尾檢驗,也就是在Z大于0的一側(cè)?,F(xiàn)在的問題就變成了雙側(cè)雙尾檢驗,也就是要看分布的兩端。計算樣本z分?jǐn)?shù),單側(cè)和雙側(cè)無區(qū)別,差異在于p值,雙側(cè)是單側(cè)的2倍。在剛剛的例子中,我們犯了一個錯誤,那就是我們先假設(shè)那個導(dǎo)師眼光好,用了單側(cè)檢驗,發(fā)現(xiàn)不能拒絕零假設(shè);然后我們改變主意做了雙側(cè)檢驗。這樣做增大了一類錯誤的概率。單側(cè)的0.05加上雙側(cè)中另一側(cè)的0.025。正確的做法是在做假設(shè)檢驗之前確定是做單側(cè)操作導(dǎo)致更好或者更差檢驗,還是雙側(cè)檢驗操作會引起差異,不管好壞。B根本統(tǒng)計過程提出假設(shè)選擇統(tǒng)計檢驗和
10、顯著性水平選擇樣本和收集數(shù)據(jù)求拒絕區(qū)域計算檢驗統(tǒng)計量做出統(tǒng)計推斷解釋結(jié)果單樣本z檢驗的前提條件提出假設(shè)首先給定一個希望推翻的零假設(shè)。以IQ作為因變量,總?cè)丝诘钠骄鵌Q為100零假設(shè)H0:=100備擇假設(shè)HA:雙側(cè):100,單側(cè); 100或者t(0.05),拒絕零假設(shè),大學(xué)教師待遇確實提高了。大樣本z檢驗和單樣本t檢驗中的樣本量在前邊講到的大樣本z檢驗和單樣本t檢驗中都存在的一個問題是樣本量究竟要取多少?我們通過樣本來估計總體,取的樣本量越大,越能代表總體,而且樣本量越大,越容易得到統(tǒng)計顯著性結(jié)果。第一,對于t檢驗,樣本量意味著自由度,自由度越大,t的臨界值越小;第二,增加樣本量會增加計算所得的
11、t值或z值。但是也要注意,太大的樣本量會使得即使在實驗效應(yīng)本身很微小或缺乏實際意義的情況下統(tǒng)計結(jié)果到達顯著。練習(xí):醫(yī)院有25名失眠病人,測其焦慮抑郁指數(shù)平均為70,標(biāo)準(zhǔn)差為10,一般人的焦慮抑郁指數(shù)平均為65,問失眠病人比一般人更焦慮嗎?估計總體均數(shù)前邊我們講到了幾種情況:總體均數(shù)和標(biāo)準(zhǔn)差;或者總體均數(shù),標(biāo)準(zhǔn)差未知。這些情況下,我們可以分別運用單樣本z檢驗以及大樣本z檢驗或者單樣本t檢驗來解決問題。但在實際的心理學(xué)研究中更多的情況是,總體的均數(shù)和標(biāo)準(zhǔn)差都未知。這個時候,我們可以用隨機樣本來估計總體的均數(shù)。樣本量越大,樣本均數(shù)就越可能接近總體均數(shù)。通過隨機樣本來估計總體均數(shù),有兩種估計方法:點估
12、計:用單個數(shù)字來估計總體均數(shù),比方樣本均數(shù);區(qū)間估計:通過一個區(qū)間數(shù)值范圍來估計總體均數(shù),置信區(qū)間。以均數(shù)為中心,占據(jù)面積95%或99%的區(qū)間。估計大學(xué)生一個月的生活費,點估計平均生活費700元,區(qū)間估計平均生活費在600到800之間。B根本統(tǒng)計過程求總體均數(shù)的置信區(qū)間選擇樣本量:樣本量越大,置信區(qū)間越小越精確;選擇置信水平:95%;選擇隨機樣本和收集數(shù)據(jù):置信區(qū)間的準(zhǔn)確度依賴于樣本的真隨機程度;計算區(qū)間的上下限:大樣本: 小樣本:練習(xí):在華師隨機抽取了100個學(xué)生,測得平均智商為110,標(biāo)準(zhǔn)差為10,計算華師學(xué)生總體的平均智商是多少?如隨機選取的學(xué)生是25個,那華師學(xué)生總體的平均智商是多少?
13、區(qū)間估計和零假設(shè)檢驗很相似,主要的區(qū)別在于樣本均數(shù)和總體均數(shù)的角色互換。單樣本t檢驗和針對總體均數(shù)置信區(qū)間的前提假設(shè):獨立隨機抽樣正態(tài)分布或者t分布抽樣總體和對照總體的標(biāo)準(zhǔn)差相等第七章 兩獨立樣本均數(shù)t檢驗前面我們講到了幾種樣本均數(shù)和總體均數(shù)比較的假設(shè)檢驗:當(dāng)總體均數(shù)和標(biāo)準(zhǔn)差的情況下,用單樣本z檢驗;當(dāng)總體均數(shù),標(biāo)準(zhǔn)差未知的情況下:如果樣本數(shù)目足夠大,用大樣本z檢驗;如果樣本數(shù)目較小,用單樣本t檢驗;如果總體均數(shù)和標(biāo)準(zhǔn)差均未知,就要用樣本來對總體均數(shù)進行點估計和區(qū)間估計。前面講的都是一個樣本均數(shù)與總體均數(shù)的比較,在心理學(xué)的研究中,較少會碰到這樣的情況。更多的情況是對兩組人男女、聰明人和笨人或?qū)?/p>
14、驗中變量的兩個水平吃藥與否、真假字進行比較。比方,我們想知道男性和女性在記憶力上是否具有顯著的差異。我們可以隨機抽取男性n1和女性n2名,對其進行短時記憶廣度測驗,來比較他們的得分均數(shù)之間是否有顯著性差異,其差值是否足夠大。首先我們要提出零假設(shè),也就是男女記憶力無差異,即備擇假設(shè)即為對該假設(shè)進行檢驗,我們需要構(gòu)造一個差值的零假設(shè)分布,也就是說隨機選男女兩組進行記憶力比較m次趨近無窮大,我們就可以得到m個差值,這些差值的分布就構(gòu)成了零假設(shè)分布。要看男女在記憶力是否有差異,也就是要看如果隨機選取兩組樣本有多大的概率能夠選到差值為由于是零假設(shè)分布,所以其平均值為零。那么它的標(biāo)準(zhǔn)差是多少呢?這個差值分
15、布的標(biāo)準(zhǔn)差被稱為差值的標(biāo)準(zhǔn)誤我們知道均數(shù)抽樣分布的標(biāo)準(zhǔn)誤為如果兩個樣本的標(biāo)準(zhǔn)差均,那么差值的標(biāo)準(zhǔn)誤也具有類似的形式總體標(biāo)準(zhǔn)差的單樣本統(tǒng)計檢驗公式為兩樣本的統(tǒng)計檢驗公式也相似由于我們的零假設(shè)是 ,因此這局部可以省略。在很多心理學(xué)研究中的零假設(shè)都是兩組均數(shù)無差異。但是,也存在這樣的狀況,比方想要了解某種增高藥物的效果是否具有性別差異,男女身高及其增量本來就是有差異的,這時要考察的是這個增量有沒變化,那么零假設(shè)應(yīng)該是如果男女記憶力的總體標(biāo)準(zhǔn)差未知,這樣就需要通過樣本來估計總體。如果樣本足夠大,那么可以進行針對兩個獨立均數(shù)的大樣本檢驗。和前邊檢驗的差異在于用無偏估計的樣本標(biāo)準(zhǔn)差來代替總體標(biāo)準(zhǔn)差如果樣本
16、數(shù)量較小,那么采用t檢驗。上邊的公式由于每一個樣本方差被它的樣本數(shù)單獨相除,因此被稱為單獨方差t檢驗。不幸的是,這個公式并不簡單遵循t分布。這種情況下,我們可對上述公式進行修正,使之適用于t分布。這個修正的前提是假定兩個總體方差相等,也就是方差齊性。這個修正涉及的是估計差值的標(biāo)準(zhǔn)誤由于這一估計 的修正方式涉及兩個樣本方差的聯(lián)合問題,所以稱之為聯(lián)合方差t檢驗。由于修正的前提是兩個總體方差相等,這樣對兩個總體方差的估計就變成了對一個總體方差的估計。修正的方法就是把兩個樣本的方差聯(lián)合起來形成一個對總體方法的單一估計。這個聯(lián)合產(chǎn)生的方差稱為聯(lián)合方差樣本方差的無偏估計是平方和除以自由度聯(lián)合方差為差值的標(biāo)
17、準(zhǔn)誤為用聯(lián)合方差來估計總體方差就可以得到帶入針對兩樣本均數(shù)的t分布公式可得這就是聯(lián)合方差t檢驗的公式,它服從t分布,可以通過查表來做假設(shè)檢驗。練習(xí):研究顏色辨識力好壞對顏色記憶的影響。把50名被試按顏色辨識力排序后平均分配到兩組,要求被試從短暫呈現(xiàn)的畫面中回憶物體是由哪些顏色組成的。高辨識力組被試回憶顏色均數(shù)為12,標(biāo)準(zhǔn)差為4;低辨識力組被試回憶顏色均數(shù)為9,標(biāo)準(zhǔn)差為5.那么結(jié)論如何?B根本統(tǒng)計過程兩樣本t檢驗:提出假設(shè)選擇統(tǒng)計檢驗和顯著水平選擇樣本和收集數(shù)據(jù)求拒絕區(qū)域計算t值統(tǒng)計推斷兩獨立樣本t檢驗的前提假設(shè)兩獨立隨機抽樣t檢驗的假設(shè)前提:獨立隨機抽樣: “獨立性針對每一個樣本而選出的任一個
18、體應(yīng)該獨立于另一個樣本的所有個體;“隨機真隨機幾乎不可能,可將選定的被試隨機分到兩個實驗組。正態(tài)分布方差齊性: 聯(lián)合方差t檢驗只有在兩個總體方差相等方差齊性時才嚴(yán)格有效。以下情況進行兩樣本假設(shè)檢驗可不考慮方差齊性:兩個樣本數(shù)量很大大于100,可用z臨界值來檢驗;當(dāng)兩個樣本數(shù)量相等時,可用單獨方差t檢驗;當(dāng)兩個樣本方差很相近小于2倍時,可不做方差齊性檢驗就進行聯(lián)合方差分析??梢园逊讲畈积R性作為實驗結(jié)果來處理。兩樣本t檢驗適用范圍:可用于分析從兩個已經(jīng)存在的總體抽取樣本數(shù)據(jù)準(zhǔn)實驗或者分析兩個隨機分配樣本的數(shù)據(jù)數(shù)據(jù)。適用條件:t檢驗只有在因變量為等距或者等比量尺時才適用。練習(xí):z(0.05)=1.65, z(0.025)=1.966個小學(xué)生的IQ分?jǐn)?shù)分別為111,103,100,107,114,102,請計算其有偏方差和無偏方差;假設(shè)智商服從均數(shù)為100,標(biāo)準(zhǔn)差為15的正態(tài)分布,當(dāng)樣本量為20時,詳細描述一下均數(shù)的抽樣分布均數(shù)、標(biāo)準(zhǔn)誤、分布類型;某個老
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024門面施工現(xiàn)場管理及應(yīng)急預(yù)案合同3篇
- 2024年貨物出口合同標(biāo)的及出口規(guī)格
- 2024年社區(qū)羽毛球館租賃協(xié)議3篇
- 2024汽車租賃公司新能源車輛推廣合同
- 2024年限定版房產(chǎn)市場調(diào)研與營銷策劃服務(wù)協(xié)議版B版
- 2024年跨界合作居間協(xié)議書
- 2024年鐵路軌道焊接分包商協(xié)議
- 2025年度餐廳與旅行社聯(lián)合運營美食旅游項目合同3篇
- 2024版鐵路安全協(xié)議書
- 職業(yè)學(xué)院工會評優(yōu)評先實施辦法
- 眼瞼衰老機制與干預(yù)
- 滲透檢測-滲透檢測方法(無損檢測課件)
- 職業(yè)健康管理與法律法規(guī)培訓(xùn)
- 銷售合同補充協(xié)議書范本
- 加油站加油機更換施工方案
- 《中國華電集團公司火電項目前期工作管理辦法》
- 初三九年級英語英語英語語法填空附答案附解析
- 呆滯品管理制度范本(3篇)
- GB/T 42623-2023安裝于辦公、旅館和住宅建筑的乘客電梯的配置和選擇
- 夸美紐斯《大教學(xué)論》
- PMC主管工作計劃工作總結(jié)述職報告PPT模板下載
評論
0/150
提交評論