




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第6章 參數(shù)檢驗(yàn)【學(xué)習(xí)目標(biāo)】² 了解參數(shù)估計(jì)的含義。² 理解點(diǎn)估計(jì)和區(qū)間估計(jì)的含義。² 理解一個(gè)總體參數(shù)區(qū)間估計(jì)的幾種情形和兩個(gè)總體參數(shù)區(qū)間估計(jì)的幾種情形。² 理解假設(shè)檢驗(yàn)的基本原理。² 掌握SPSS中平均數(shù)比較與T檢驗(yàn)的操作方法:平均數(shù)分析過程,單樣本T檢驗(yàn),獨(dú)立樣本T檢驗(yàn)和配對樣本T檢驗(yàn)。【引導(dǎo)案例】靜靜的頓河作者之爭 靜靜的頓河是前蘇聯(lián)文學(xué)史上首屈一指的戰(zhàn)爭名著,它全景式的描寫了俄國內(nèi)戰(zhàn)時(shí)期頓河流域的社會景觀,堪稱不朽的史詩。但自從靜靜的頓河誕生之日起,圍繞其作者所引起的爭議就沒有停止過。有人指控肖洛霍夫是個(gè)騙子,說靜靜的頓河不是肖洛霍夫
2、所寫,真正的作者是費(fèi)奧爾克魯烏科夫。挪威奧斯陸大學(xué)的前蘇聯(lián)文學(xué)教授蓋爾·克其薩用計(jì)算機(jī)對靜靜的頓河進(jìn)行了分析研究,其別具一格的論文曾發(fā)表在世界知名的權(quán)威雜志計(jì)算機(jī)與人文科學(xué)上,轟動一時(shí)。那么,克其薩教授怎樣把統(tǒng)計(jì)學(xué)引入這本名著的研究的呢?克其薩教授與同事一起,對靜靜的頓河的文章風(fēng)格和其他一些特點(diǎn)分別與肖洛霍夫和克魯烏科夫的作品進(jìn)行了統(tǒng)計(jì)分析。他們通過抽取的樣品,研究了三個(gè)重要參數(shù),為了對比,把肖洛霍夫的無可爭議的作品作為第一組,靜靜的頓河作為第二組,克魯烏科夫的作品作為第三組,其結(jié)果如表6-1所示。 表6-1 文學(xué)風(fēng)格統(tǒng)計(jì)表 (單位:%)組別不同詞匯量與總詞匯量的百分比俄文中常見詞匯
3、與作品總詞匯量的百分比作品中出現(xiàn)一次的詞匯占總詞匯量的百分比第一組65.522.880.9第二組64.623.381.9第三組58.926.276.9根據(jù)表中的數(shù)據(jù),所有參數(shù)都存在一致的趨勢,即克魯烏科夫的作品與靜靜的頓河之間,存在著顯著的統(tǒng)計(jì)差異,所以,這部著作的真正作者很難說是克魯烏科夫,相比之下,肖洛霍夫更像是靜靜的頓河的作者。本章介紹的內(nèi)容可以幫助我們解決類似的問題。6.1 參數(shù)估計(jì)6.1.1 什么是參數(shù)估計(jì)估計(jì)就是根據(jù)所掌握的信息對客觀世界進(jìn)行某種判斷。例如,根據(jù)一個(gè)人的衣著、言談和舉止判斷其身份;根據(jù)上市公司公布的各種信息,估計(jì)其股票價(jià)格的走勢等。統(tǒng)計(jì)中的估計(jì)是完全根據(jù)數(shù)據(jù)做出的判
4、斷,我們把用樣本統(tǒng)計(jì)量去估計(jì)總體參數(shù)稱為參數(shù)估計(jì)(parameter estimation)。例如,用樣本平均數(shù)估計(jì)總體平均數(shù),用樣本標(biāo)準(zhǔn)差估計(jì)總體標(biāo)準(zhǔn)差,用樣本比例估計(jì)總體比例。通常我們用表示總體參數(shù),用表示估計(jì)參數(shù)的統(tǒng)計(jì)量,當(dāng)用來估計(jì)時(shí),也稱為估計(jì)量。根據(jù)一個(gè)具體的樣本計(jì)算出來的估計(jì)量的數(shù)值稱為估計(jì)值。例如,想要了解北京城市大學(xué)全體學(xué)生的英語成績,抽取工商管理專業(yè)的100名學(xué)生作為樣本,100名學(xué)生的平均成績是一個(gè)估計(jì)量,若計(jì)算出來平均成績是80分,則80分就是一個(gè)估計(jì)值。參數(shù)估計(jì)和假設(shè)檢驗(yàn)一起構(gòu)成了推斷性統(tǒng)計(jì)的內(nèi)容,它們在統(tǒng)計(jì)學(xué)中的地位如圖6-1所示。圖6-1 統(tǒng)計(jì)學(xué)基本內(nèi)容構(gòu)成圖6.1
5、.2 點(diǎn)估計(jì)與區(qū)間估計(jì) 參數(shù)估計(jì)的方法有點(diǎn)估計(jì)和區(qū)間估計(jì)兩種。1什么是點(diǎn)估計(jì)點(diǎn)估計(jì)(point estimation)就是將估計(jì)量的某個(gè)取值作為總體參數(shù)的估計(jì)值,即直接用樣本平均數(shù)作為總體平均數(shù),直接用樣本標(biāo)準(zhǔn)差作為總體標(biāo)準(zhǔn)差,直接用樣本比例作為總體比例。例如上例中將工商管理專業(yè)100名學(xué)生的英語平均成績80分作為北京城市大學(xué)全體學(xué)生的英語成績。點(diǎn)估計(jì)值代表總體參數(shù)值是直接給出一個(gè)具體數(shù)字,使用簡便、直觀。但是每次抽出一個(gè)樣本就會產(chǎn)生一個(gè)估計(jì)值,每個(gè)估計(jì)值與總體參數(shù)的誤差無法確定,即點(diǎn)估計(jì)的可靠性無法度量,因此點(diǎn)估計(jì)的使用有一定的缺陷,應(yīng)該圍繞點(diǎn)估計(jì)值構(gòu)造總體參數(shù)的一個(gè)區(qū)間,這就是下面要介紹的
6、區(qū)間估計(jì)。2什么是區(qū)間估計(jì)現(xiàn)實(shí)生活中,人們在描述一個(gè)人的體重時(shí),一般不會說其體重是76.35公斤,而是說他的體重是大概是七八十公斤,或者是在7080公斤之間。在描述員工的工資水平時(shí),一般不會說員工的工資是2500元,而是說員工的工資水平是20003000元,即給出一個(gè)上限或下限,這就是區(qū)間估計(jì)(interval estimation)。區(qū)間估計(jì)就是在點(diǎn)估計(jì)的基礎(chǔ)上,給出總體參數(shù)的一個(gè)估計(jì)區(qū)間,該區(qū)間通常是由樣本統(tǒng)計(jì)量加減估計(jì)誤差(estimate error)得到。在區(qū)間估計(jì)中,根據(jù)樣本統(tǒng)計(jì)量的抽樣分布能夠?qū)颖窘y(tǒng)計(jì)量與總體參數(shù)的接近程度給出一個(gè)概率度量。區(qū)間估計(jì)需要確定兩個(gè)統(tǒng)計(jì)量和分別來估計(jì)
7、總體參數(shù)的下限和上限,并使在區(qū)間的概率為,即我們有的把握斷定的真值在區(qū)間內(nèi)。是一個(gè)事先給定的一個(gè)小正數(shù),就是估計(jì)區(qū)間包括真值的概率,稱為置信水平(confidence level)、置信系數(shù)或置信度,常用的是0.01,0.05和0.1,所以常用的置信水平是99%,95%和90%。估計(jì)區(qū)間稱作參數(shù)在置信水平1-的置信區(qū)間(confidence interval),為置信下限,為置信上限。置信水平、置信區(qū)間的關(guān)系如圖6-2所示。置信下限點(diǎn)估計(jì)值置信上限置信水平置信區(qū)間圖6-2 置信區(qū)間示意圖需要注意的是:置信區(qū)間是根據(jù)樣本構(gòu)造的,所以是一個(gè)隨機(jī)區(qū)間,會根據(jù)樣本的變化而變化,并不是所有的置信區(qū)間都包
8、含真值。例如,用95%的置信水平得到北京城市大學(xué)全體學(xué)生英語成績的置信區(qū)間為6585,意味著在100次抽樣中,大概有95次得到的置信區(qū)間包含了真值,有5次得到的置信區(qū)間不包含真值。假定全體學(xué)生英語成績的平均數(shù)真值為70,則6585這個(gè)區(qū)間一定包含真值。假定全體學(xué)生英語成績的平均數(shù)真值為60,則6585這個(gè)區(qū)間一定不包含真值。3評價(jià)估計(jì)量優(yōu)劣的標(biāo)準(zhǔn)既然統(tǒng)計(jì)量僅是總體參數(shù)的一個(gè)估計(jì)量,它就不可能完全準(zhǔn)確,而且總體某一參數(shù)的估計(jì)量可能不止一個(gè),如樣本平均數(shù)、樣本中位數(shù)都可以用來估計(jì)總體平均數(shù),但并非所有的估計(jì)量都是優(yōu)良,我們常用三條標(biāo)準(zhǔn)去衡量估計(jì)量的優(yōu)劣。(1)無偏性無偏性(unbiasedness
9、)是指估計(jì)量抽樣分布的期望值等于被估計(jì)的總體參數(shù)。設(shè)是總體參數(shù)的估計(jì)量,若,則稱是的無偏估計(jì)量。無偏性就是沒有系統(tǒng)偏差,從平均意義上看,如果估計(jì)方法重復(fù)多次,則估計(jì)量的平均數(shù)就是總體參數(shù)。由樣本均值的抽樣分布可知,因此,是,的無偏估計(jì)量。(2)有效性有效性(efficiency)是指估計(jì)量的方差要盡可能小。所以,有效性是衡量離散程度的指標(biāo),若兩個(gè)估計(jì)量都是無偏的,其中方差小的離散程度就小,其值更接近總體參數(shù),我們認(rèn)為它更有效。(3)一致性一致性(consistency)指的是隨著樣本容量的增大,如果估計(jì)量越來越接近總體參數(shù)的真值,就稱該估計(jì)量是一致估計(jì)量。一致性實(shí)際上是要求從一個(gè)大樣本得到的估
10、計(jì)量要比一個(gè)小樣本得到的估計(jì)量更接近總體參數(shù)。6.1.3 一個(gè)總體參數(shù)的區(qū)間估計(jì)一個(gè)總體參數(shù)的區(qū)間估計(jì)包括對總體平均數(shù),總體方差,總體比例的估計(jì)。1總體平均數(shù)的區(qū)間估計(jì)總體平均數(shù)的置信區(qū)間是由樣本平均數(shù)加減估計(jì)誤差得到。估計(jì)誤差由兩部分組成:一是點(diǎn)估計(jì)量的標(biāo)準(zhǔn)誤差,它取決于樣本統(tǒng)計(jì)量的抽樣分布。二是置信水平為時(shí),統(tǒng)計(jì)量分布兩側(cè)面積各為時(shí)的分位數(shù)值,它取決于事先所要求的可靠程度。(1)大樣本估計(jì)大樣本情況下,根據(jù)中心極限定理可知,樣本平均數(shù)經(jīng)標(biāo)準(zhǔn)化后服從標(biāo)準(zhǔn)正態(tài)分布,即。若總體標(biāo)準(zhǔn)差已知,總體平均數(shù)在置信水平下的置信區(qū)間為: (6.1)式中,是置信下限,是置信上限,是標(biāo)準(zhǔn)正態(tài)分布兩側(cè)面積各為時(shí)的
11、值,是標(biāo)準(zhǔn)誤差,是估計(jì)誤差。若總體標(biāo)準(zhǔn)差未知,用代替,總體平均數(shù)在置信水平下的置信區(qū)間為: (6.2)(2)小樣本估計(jì)小樣本情況下,要求總體服從正態(tài)分布。若總體標(biāo)準(zhǔn)差已知,樣本平均數(shù)經(jīng)標(biāo)準(zhǔn)化后服從標(biāo)準(zhǔn)正態(tài)分布,總體平均數(shù)在置信水平下的置信區(qū)間仍是式(6.1)。若總體標(biāo)準(zhǔn)差未知,樣本平均數(shù)經(jīng)標(biāo)準(zhǔn)化后服從自由度為的分布,即,則總體平均數(shù)在置信水平下的置信區(qū)間是: (6.3)【例6-1】英語成績.sav是北京城市大學(xué)26名學(xué)生的期中和期末的英語考試成績。請估計(jì)期中平均成績的95%的置信區(qū)間。(1)觀察數(shù)據(jù)樣本量是26所以采用小樣本估計(jì)的方法。(2)單擊【分析】【均值比較】【單樣本T檢驗(yàn)】,打開單樣本
12、T檢驗(yàn)對話框。(3)從左側(cè)源變量窗口選擇期中考試成績(score1)進(jìn)入【檢驗(yàn)變量】窗口。(4)在【檢驗(yàn)值】后面的窗口輸入檢驗(yàn)值0,如圖6-3所示。圖6-3 單樣本T檢驗(yàn)對話框(5)單擊【選項(xiàng)】按鈕,在【置信區(qū)間百分比】窗口后面輸入95%。單擊【繼續(xù)】,返回單樣本T檢驗(yàn)對話框。單擊【確定】,提交運(yùn)行。(6)結(jié)果分析。在結(jié)果輸出窗口得到表6-2。由表可知期中平均成績95%的置信區(qū)間是59.700269.5306。表6-2 單個(gè)樣本檢驗(yàn)檢驗(yàn)值 = 0 tdfSig.(雙側(cè))均值差值差分的95%置信區(qū)間下限上限期中考試成績27.07525.00064.6153859.700269.53062總體比例
13、的區(qū)間估計(jì)大樣本條件下,樣本比例服從期望值為,方差為 的正態(tài)分布,樣本比例經(jīng)標(biāo)準(zhǔn)化后服從標(biāo)準(zhǔn)正態(tài)分布,即:,總體比例的置信區(qū)間也是點(diǎn)估計(jì)量±估計(jì)誤差得到的,則總體比例在置信水平下的置信區(qū)間是: (6.4)3總體方差的區(qū)間估計(jì)假定總體服從正態(tài)分布,樣本方差的抽樣分布服從自由度為的分布,即: (6.5)建立總體方差的置信區(qū)間,就是要滿足,用式(6.5)來代替,有: (6.6)則總體方差在置信水平下的置信區(qū)間是: (6.7)圖6-4總結(jié)了一個(gè)總體參數(shù)估計(jì)所使用的分布的各種情形。待估參數(shù)總體平均數(shù)總體比例總體方差大樣本小樣本 Z分布總體方差已知總體方差未知 大樣本Z分布分布 Z分布 t分布正
14、態(tài)分布圖6-4 一個(gè)總體參數(shù)估計(jì)所使用的分布6.1.4 兩個(gè)總體參數(shù)的區(qū)間估計(jì)兩個(gè)總體參數(shù)的區(qū)間估計(jì)包括對兩個(gè)總體平均數(shù)之差,兩個(gè)總體的比例之差,兩個(gè)總體的方差比的估計(jì)。1兩個(gè)總體平均數(shù)之差的區(qū)間估計(jì)從兩個(gè)總體平均數(shù)分別是和的總體中分別抽取樣本量是和的兩個(gè)隨機(jī)樣本,樣本平均數(shù)分別是和,則兩個(gè)總體平均數(shù)之差的點(diǎn)估計(jì)量是兩個(gè)樣本均值之差,兩個(gè)總體平均數(shù)之差的置信區(qū)間是點(diǎn)估計(jì)量加減估計(jì)誤差。(1)獨(dú)立大樣本估計(jì)若兩個(gè)樣本是從兩個(gè)總體中獨(dú)立抽取的,則一個(gè)樣本與另一個(gè)樣本相互獨(dú)立,稱為獨(dú)立樣本(independent sample)。若兩個(gè)樣本都是大樣本,兩個(gè)樣本平均數(shù)之差服從期望值為、方差為的正態(tài)分布
15、,經(jīng)標(biāo)準(zhǔn)化后兩個(gè)樣本平均數(shù)之差服從標(biāo)準(zhǔn)正態(tài)分布,即: (6.8)若兩個(gè)總體方差和都已知,則兩個(gè)總體平均數(shù)之差在置信水平下的置信區(qū)間為: (6.9)若兩個(gè)總體方差和都未知,則用兩個(gè)樣本方差和來代替,兩個(gè)總體平均數(shù)之差在置信水平下的置信區(qū)間為: (6.10)(2)獨(dú)立小樣本估計(jì)若兩個(gè)樣本都是小樣本,則要求兩個(gè)總體服從正態(tài)分布。若兩個(gè)總體方差和都已知,兩個(gè)總體平均數(shù)之差在置信水平下的置信區(qū)間為與大樣本情形相同,見式(6.9)。兩個(gè)總體方差未知時(shí),又分成兩種情況:兩個(gè)總體方差未知但相等時(shí),即,需要將兩個(gè)樣本的數(shù)據(jù)合并起來估計(jì)的估計(jì)量,計(jì)算公式是: (6.11)所以,兩個(gè)樣本平均數(shù)之差經(jīng)標(biāo)準(zhǔn)化后服從自由
16、度為的分布,即: (6.12)則兩個(gè)總體平均數(shù)之差在置信水平下的置信區(qū)間為: (6.13)兩個(gè)總體方差未知且不等,即,兩個(gè)樣本平均數(shù)之差經(jīng)標(biāo)準(zhǔn)化后近似服從自由度為的分布,自由度的計(jì)算公式是: (6.14)所以,兩個(gè)總體平均數(shù)之差在置信水平下的置信區(qū)間為: (6.15)【例6-2】英語成績.sav是北京城市大學(xué)26名學(xué)生的期中和期末的英語考試成績,其中男生和女生各13人,請建立男生和女生平均成績之差的95%的置信區(qū)間?(1)男生樣本和女生樣本形成兩個(gè)獨(dú)立樣本,其樣本量分別是13,所以采用小樣本估計(jì)的方法。(2)從左側(cè)源變量窗口選擇變量期中考試成績(score1)進(jìn)入【檢驗(yàn)變量】窗口。(3)從左側(cè)
17、源變量窗口選擇變量性別(sex)進(jìn)入【檢驗(yàn)變量】窗口。單擊【定義組】按鈕,打開確定分組對話框,選擇【使用指定組】方式,在【組1】和【組2】窗口后分別輸入1和2,單擊【繼續(xù)】返回獨(dú)立樣本T檢驗(yàn)分析對話框,如圖6-5所示。圖6-5 獨(dú)立樣本T檢驗(yàn)對話框(4)單擊【選項(xiàng)】按鈕,在【置信區(qū)間百分比】窗口后面輸入95%。單擊【繼續(xù)】,返回單樣本T檢驗(yàn)對話框。單擊【確定】,提交運(yùn)行。(5)結(jié)果分析。在結(jié)果輸出窗口得到表6-3。由表可知男生和女生平均成績之差的95%的置信區(qū)間是-16.945522.17629。表6-3 獨(dú)立樣本檢驗(yàn)方差方程的 Levene 檢驗(yàn)均值方程的 t 檢驗(yàn)FSig.tdfSig.(
18、雙側(cè))均值差值標(biāo)準(zhǔn)誤差值差分的95% 置信區(qū)間下限上限期中考試成績假設(shè)方差相等2.841.105-1.59424.124-7.384624.63245-16.945522.17629假設(shè)方差不相等-1.59419.978.127-7.384624.63245-17.048422.27919(3)配對樣本的估計(jì)配對樣本是對同一個(gè)研究對象在不同時(shí)間點(diǎn)上進(jìn)行前后兩次測量得到的樣本。例如,企業(yè)薪酬方案改革前后,對員工滿意度的測量就形成一組配對樣本;一個(gè)班學(xué)生的期中和期末兩次考試就是一組配對樣本。在大樣本情況下,兩個(gè)總體平均數(shù)之差在置信水平下的置信區(qū)間為: (6.16)其中,表示兩個(gè)配對數(shù)據(jù)的差值;表示
19、各差值的均值;表示各差值的標(biāo)準(zhǔn)差。當(dāng)總體差值的標(biāo)準(zhǔn)差未知時(shí),可用樣本差值的標(biāo)準(zhǔn)差來代替。小樣本情況下,假定兩個(gè)總體各觀察值的配對服從個(gè)正態(tài)分布。兩個(gè)總體平均數(shù)之差在置信水平下的置信區(qū)間為: (6.17)【例6-3】英語成績.sav是北京城市大學(xué)某班期中和期末的英語考試成績。在期中考試后,教師根據(jù)學(xué)生的考試成績發(fā)現(xiàn)了教學(xué)中存在的一些問題,及時(shí)調(diào)整了教學(xué)方法,請建立平均成績之差的95%的置信區(qū)間?(1)觀察兩個(gè)配對樣本的樣本量都是26,所以采用小樣本估計(jì)的方法。(2)單擊【分析】【均值比較】【配對樣本T檢驗(yàn)】,打開配對樣本T檢驗(yàn)對話框。(3)從左側(cè)源變量窗口選擇變期末考試成績(score2)和期中
20、考試成績(score1)進(jìn)入【成對變量】窗口,如圖6-6所示。(4)單擊【選項(xiàng)】按鈕,在【置信區(qū)間百分比】窗口后面輸入95%。單擊【繼續(xù)】,返回配對樣本T檢驗(yàn)對話框。單擊【確定】,提交運(yùn)行。圖6-6 配對樣本T檢驗(yàn)對話框(5)結(jié)果分析。在結(jié)果輸出窗口得到表6-4,由表可知期末與期中平均成績之差的95%的置信區(qū)間是7.53116.1613。表6-4 成對樣本檢驗(yàn)成對差分tdfSig.(雙側(cè))均值標(biāo)準(zhǔn)差均值的標(biāo)準(zhǔn)誤差分的95%置信區(qū)間下限上限對 1期末考試成績 - 期中考試成績11.846210.6832.09527.5310316.161285.65425.0002兩個(gè)總體比例之差的區(qū)間估計(jì)兩個(gè)
21、總體比例之差的置信區(qū)間是由點(diǎn)估計(jì)量加減估計(jì)誤差得到的。根據(jù)樣本比例的抽樣分布可知,從兩個(gè)從兩個(gè)二項(xiàng)分布總體中抽取兩個(gè)獨(dú)立大樣本,則比兩個(gè)樣本比例之差近似服從正態(tài)分布,兩個(gè)樣本比例之差經(jīng)標(biāo)準(zhǔn)化后服從標(biāo)準(zhǔn)正態(tài)分布,即: (6.18)由于兩個(gè)總體比例和通常是未知的,所以用樣本比例和來代替。因此,根據(jù)正態(tài)分布建立的兩個(gè)總體比例之差在置信水平下的置信區(qū)間為: (6.19)3兩個(gè)總體方差比的區(qū)間估計(jì)兩個(gè)樣本方差比服從分布,因此可用分布來構(gòu)造兩個(gè)總體方差之比的置信區(qū)間。建立兩個(gè)總體方差之比的置信區(qū)間,也就是要找到一個(gè)值使其滿足。由于,用它代替后有: (6.20) 所以兩個(gè)總體方差之比在置信水平下的置信區(qū)間為
22、: (6.21)圖6-7總結(jié)了兩個(gè)總體參數(shù)估計(jì)所使用的分布的各種情形。待估參數(shù)總體均值差總體比例差總體方差比獨(dú)立大樣本獨(dú)立小樣本Z分布方差已知配對樣本t分布獨(dú)立大樣本F分布Z分布方差未知正態(tài)總體Z分布方差相等方差不等Z分布t分布圖6-7 兩個(gè)總體參數(shù)估計(jì)所使用的分布6.2 假設(shè)檢驗(yàn)6.2.1 假設(shè)檢驗(yàn)的基本原理1什么是假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)是推斷統(tǒng)計(jì)的另一項(xiàng)重要內(nèi)容。在研究問題時(shí),人們常常要提出一個(gè)自己認(rèn)為正確的看法,即假設(shè)(hypothesis)。統(tǒng)計(jì)學(xué)里的假設(shè)就是對總體參數(shù)具體數(shù)值所作的陳述。例如,假設(shè)北京城市大學(xué)全校學(xué)生的平均英語成績是80分。而假設(shè)檢驗(yàn)(hypothesis test)就是在
23、對總體參數(shù)提出假設(shè)的基礎(chǔ)上,利用樣本信息來判斷假設(shè)是否成立的統(tǒng)計(jì)方法。例如,在假設(shè)北京城市大學(xué)全體學(xué)生英語平均成績是80分的基礎(chǔ)上,抽取一個(gè)班作為樣本,根據(jù)樣本信息檢驗(yàn)全體學(xué)生的英語平均成績是不是80分。假設(shè)檢驗(yàn)包括參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)兩種方法,本章主要介紹參數(shù)檢驗(yàn),非參數(shù)檢驗(yàn)的內(nèi)容將在第10章介紹。2兩種假設(shè)在假設(shè)檢驗(yàn)中,首先需要提出兩種假設(shè):原假設(shè)和備擇假設(shè)。(1)原假設(shè)也稱零假設(shè)(null hypothesis),是研究者想收集證據(jù)予以推翻的假設(shè),用表示。原假設(shè)的含義是指參數(shù)沒有變化或變量之間沒有關(guān)系,因此等號總是放在原假設(shè)上。例如,假設(shè)總體平均數(shù)為,則原假設(shè)是,或。(2)備擇假設(shè)也稱研
24、究假設(shè)(alternative hypothesis),是研究者想收集證據(jù)予以支持的假設(shè),用表示。備擇假設(shè)的含義是指參數(shù)發(fā)生了變化或變量之間有某種關(guān)系,因此不等號總是放在備擇假設(shè)上。例如,假設(shè)總體平均數(shù)為,則備擇假設(shè)是,或。(3)原假設(shè)和備擇假設(shè)的關(guān)系原假設(shè)和備擇假設(shè)是一個(gè)完備事件組,且相互對立,所以在一項(xiàng)假設(shè)檢驗(yàn)中,原假設(shè)和備擇假設(shè)必有且只有一個(gè)成立。通常我們先確定備擇假設(shè),再確定原假設(shè),因?yàn)閭鋼窦僭O(shè)是我們想支持、證實(shí)的,而等號總是放在原假設(shè)上。但是由于研究目的不同,對同一問題可能提出不同的假設(shè),因而也會得出不同的結(jié)論?!纠?-4】消費(fèi)者協(xié)會估計(jì)北京市場上偏好蘋果手機(jī)的消費(fèi)者不足20%,為了
25、驗(yàn)證這一估計(jì)是否正確,消費(fèi)者協(xié)會隨機(jī)抽取了一個(gè)樣本進(jìn)行檢驗(yàn),則原假設(shè)和備擇假設(shè)應(yīng)該是:(偏好蘋果手機(jī)的消費(fèi)者超過20%)(偏好蘋果手機(jī)的消費(fèi)者不超過20%)【例6-5】韓國一則報(bào)道稱,中國是全球工作時(shí)間最長的國家之一,每年有60萬人過勞死。我國法定工作時(shí)間是每周40個(gè)小時(shí),為了估計(jì)我國員工的實(shí)際每周工作時(shí)間是否超過40小時(shí),隨機(jī)抽取一個(gè)樣本,則原假設(shè)和備擇假設(shè)應(yīng)該是:(工作時(shí)間不超過40個(gè)小時(shí))(工作時(shí)間超過40個(gè)小時(shí))【例6-6】在一項(xiàng)關(guān)于農(nóng)民工的研究中發(fā)現(xiàn),相比于男性農(nóng)民工,女性農(nóng)民工的就業(yè)環(huán)境差,工資水平低,為了對這項(xiàng)研究進(jìn)行驗(yàn)證,隨機(jī)抽取一個(gè)樣本,則原假設(shè)和備擇假設(shè)應(yīng)該是:(男性農(nóng)民工
26、工資的平均數(shù)和女性農(nóng)民工工資的平均數(shù)相等)(男性農(nóng)民工工資的平均數(shù)和女性農(nóng)民工工資的平均數(shù)不等)3雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)在假設(shè)檢驗(yàn)中,若備擇假設(shè)具有特定的方向性,并含有符號“>”或“<”的假設(shè)檢驗(yàn),稱為單側(cè)檢驗(yàn)或單尾檢驗(yàn)(one-tailed test),備擇假設(shè)的方向?yàn)椤?lt;”,稱為左側(cè)檢驗(yàn),如例6-4,備擇假設(shè)的方向?yàn)椤?gt;”,稱為右側(cè)檢驗(yàn),如例6-5。如果備擇假設(shè)沒有特定的方向性,并含有符號“¹”的假設(shè)檢驗(yàn),稱為雙側(cè)檢驗(yàn)或雙尾檢驗(yàn)(two-tailed test),如例6-6。4兩類錯(cuò)誤和顯著性水平第類錯(cuò)誤(type error)是原假設(shè)為正確時(shí)拒絕原假設(shè),也稱
27、為棄真錯(cuò)誤。我們把犯第類錯(cuò)誤的概率記為,稱為顯著性水平(level of significant)。第類錯(cuò)誤(type error)是原假設(shè)為錯(cuò)誤時(shí)未拒絕原假設(shè),也稱為取偽錯(cuò)誤。我們把犯第類錯(cuò)誤的概率記為。實(shí)際上,只要拒絕原假設(shè),就有可能犯第類錯(cuò)誤;只要不拒絕原假設(shè),就有可能犯第類錯(cuò)誤。換句話說,要減小就會增加,要減小就會增加。要想同時(shí)減小兩類錯(cuò)誤只能增加樣本容量,但是我們也知道想要增加樣本容量有時(shí)是不可能的。所以,對于兩類錯(cuò)誤的控制,主要是依據(jù)哪一類錯(cuò)誤的后果更為嚴(yán)重,就首先控制哪類錯(cuò)誤發(fā)生的概率。由于犯第類錯(cuò)誤的概率是由研究者自己控制的,因此在假設(shè)檢驗(yàn)中,人們往往先控制第類錯(cuò)誤的發(fā)生概率。
28、通常,我們使用的值有0.01,0.05,0.1。5決策依據(jù)(1)用檢驗(yàn)統(tǒng)計(jì)量決策檢驗(yàn)統(tǒng)計(jì)量是根據(jù)樣本變量值計(jì)算得到的對原假設(shè)和備擇假設(shè)做出決策的統(tǒng)計(jì)量。通常使用經(jīng)過標(biāo)準(zhǔn)化的檢驗(yàn)統(tǒng)計(jì)量,即標(biāo)準(zhǔn)化的檢驗(yàn)統(tǒng)計(jì)量,它可以度量點(diǎn)估計(jì)量與原假設(shè)的總體參數(shù)之間的差異。我們把能夠拒絕原假設(shè)的檢驗(yàn)統(tǒng)計(jì)量的所有可能取值的集合稱為拒絕域(rejection region);將給定的顯著性水平確定的拒絕域的邊界值稱為臨界值(critical value),如圖6-8所示。臨界值臨界值置信水平置信水平臨界值拒絕域0臨界值0拒絕域拒絕域拒絕域0 (a)雙側(cè)檢驗(yàn) (b)左側(cè)檢驗(yàn) (b)右側(cè)檢驗(yàn)圖6-8 顯著性水平、拒絕域與
29、臨界值用檢驗(yàn)統(tǒng)計(jì)量做決策的步驟是:第一步:給定顯著性水平,計(jì)算相應(yīng)的臨界值;第二步:將檢驗(yàn)統(tǒng)計(jì)量的值與水平的臨界值進(jìn)行比較:雙側(cè)檢驗(yàn):,拒絕;左側(cè)檢驗(yàn):,拒絕;右側(cè)檢驗(yàn):,拒絕。(2)用值決策給定顯著性水平是犯第類錯(cuò)誤的上限控制值,但實(shí)際上檢驗(yàn)統(tǒng)計(jì)量落在拒絕域的不同位置時(shí),犯第類錯(cuò)誤的實(shí)際概率是不一樣的。如果能把犯第類錯(cuò)誤實(shí)際概率計(jì)算出來,就可以根據(jù)這個(gè)概率做出決策。值(probability value method)就是犯第類錯(cuò)誤的真實(shí)概率,也稱為觀察到的(或?qū)崪y的)顯著性水平,它指的是如果原假設(shè)正確,所得到樣本結(jié)果的可能性。如果這個(gè)概率很小,意味著得到這樣的樣本是一個(gè)小概率事件,小概率事
30、件就是一個(gè)幾乎不可能發(fā)生的事件,當(dāng)一個(gè)不可能發(fā)生的小概率事件發(fā)生了,說明原假設(shè)有誤,應(yīng)該拒絕原假設(shè)。在現(xiàn)代統(tǒng)計(jì)學(xué)中,經(jīng)常使用值做決策,它更方便,效果更好。圖6-9描述了值與顯著性水平、拒絕域與臨界值的關(guān)系。【例6-7】檢驗(yàn)北京城市大學(xué)全體學(xué)生英語平均分是否為80分,可提出, 。根據(jù)抽樣計(jì)算出的學(xué)生英語成績的平均分為70,p值為0.02,意味著北京城市大學(xué)全體學(xué)生英語平均分真是80分的話,抽中一個(gè)平均數(shù)是70的樣本的概率是0.02??梢姡粋€(gè)小概率事件發(fā)生了,說明原假設(shè)是有誤,應(yīng)拒絕原假設(shè)。用值做決策的步驟是:第一步:給定顯著性水平;第二步:將檢驗(yàn)統(tǒng)計(jì)量的P值與進(jìn)行比較,若,拒絕。01/2P值1
31、/2P值P值臨界值(b)左側(cè)檢驗(yàn)(c)右側(cè)檢驗(yàn)(a)雙側(cè)檢驗(yàn)臨界值臨界值00臨界值P值 圖6-9 P值與顯著性水平、拒絕域與臨界值常用的顯著性水平,如0.01,0.05,0.10,已經(jīng)被人們普遍接受為“拒絕原假設(shè)足夠證據(jù)”的標(biāo)準(zhǔn),我們大概可以說:0.1代表有“一些證據(jù)”不利于原假設(shè);0.05代表有“適度證據(jù)”不利于原假設(shè);0.01代表有“很強(qiáng)證據(jù)”不利于原假設(shè)。6假設(shè)檢驗(yàn)結(jié)論的表述如果樣本提供的證據(jù)可以拒絕原假設(shè),就說檢驗(yàn)的結(jié)果在統(tǒng)計(jì)上是顯著的,即拒絕原假設(shè)時(shí)結(jié)論是清楚的;如果樣本提供的證據(jù)不能拒絕原假設(shè),就說檢驗(yàn)的結(jié)果在統(tǒng)計(jì)上不是顯著的。一項(xiàng)檢驗(yàn)在統(tǒng)計(jì)上是“顯著的”的含義是:根據(jù)樣本得到的結(jié)
32、果不是偶然獲得的;“不顯著的”的含義是:根據(jù)樣本得到的結(jié)果是偶然獲得的。需要注意的是,不拒絕原假設(shè)時(shí),并未給出明確的結(jié)論,沒有足夠證據(jù)拒絕原假設(shè)時(shí),不采用“接受原假設(shè)”的表述,而采用“不拒絕原假設(shè)”的表述。7假設(shè)檢驗(yàn)的步驟由上述內(nèi)容可知假設(shè)檢驗(yàn)的步驟是:第一步,提出原假設(shè)和備擇假設(shè);第二步,從所研究的總體中抽出一個(gè)隨機(jī)樣本;第三步,確定一個(gè)適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量,并利用樣本數(shù)據(jù)算其具體數(shù)值及其對應(yīng)的值;第四步,確定一個(gè)適當(dāng)?shù)娘@著性水平,并計(jì)算出其臨界值,確定拒絕域。第五步,將檢驗(yàn)統(tǒng)計(jì)量的值與臨界值進(jìn)行比較,做出決策。若統(tǒng)計(jì)量的值落在拒絕域,拒絕,否則不拒絕。也可以直接將值與比較做出決策,若,拒絕,否
33、則不拒絕。6.2.2 假設(shè)檢驗(yàn)的類型假設(shè)檢驗(yàn)的類型可以分為一個(gè)總體參數(shù)的檢驗(yàn)和兩個(gè)總體參數(shù)的檢驗(yàn)。其中,一個(gè)總體參數(shù)的檢驗(yàn)包括總體平均數(shù)的檢驗(yàn),總體比例的檢驗(yàn)和總體方差的檢驗(yàn),如圖6-10所示。兩個(gè)總體參數(shù)的檢驗(yàn)包括兩個(gè)總體平均數(shù)之差的檢驗(yàn),兩個(gè)總體比例之差的檢驗(yàn)和兩個(gè)總體方差比的檢驗(yàn),如圖6-11所示。一個(gè)總體參數(shù)總體平均數(shù)總體比例總體方差大樣本小樣本 Z檢驗(yàn)總體方差已知總體方差未知 大樣本Z檢驗(yàn)檢驗(yàn) Z檢驗(yàn)T檢驗(yàn)正態(tài)分布圖6-10 一個(gè)總體參數(shù)檢驗(yàn)的方法兩個(gè)總體參數(shù)總體均值差總體比例差總體方差比獨(dú)立樣本配對樣本大樣本小樣本大樣本Z檢驗(yàn)F檢驗(yàn)T檢驗(yàn)正態(tài)分布小樣本Z檢驗(yàn)方差已知方差未知Z檢驗(yàn)T
34、檢驗(yàn)正態(tài)分布圖6-11 兩個(gè)總體參數(shù)檢驗(yàn)的方法6.3 平均數(shù)比較與T檢驗(yàn)在各種假設(shè)檢驗(yàn)的類型中,關(guān)于平均數(shù)的比較和檢驗(yàn)是使用頻率最高的統(tǒng)計(jì)分析方法。雖然T檢驗(yàn)主要用于小樣本情況,但是在SPSS中也可以使用T檢驗(yàn)對大樣本進(jìn)行處理。SPSS中的平均數(shù)比較和T檢驗(yàn)主要包括平均數(shù)分析過程(means),單樣本T檢驗(yàn)(single sample T test),獨(dú)立樣本T檢驗(yàn)(independent samples T test)和配對樣本T檢驗(yàn)(paired samples T test)四種方法。6.3.1 平均數(shù)分析過程平均數(shù)分析過程就是按定類或定序變量進(jìn)行分組,計(jì)算每一組的平均數(shù)、標(biāo)準(zhǔn)差、總和、
35、方差等統(tǒng)計(jì)量,目的在于比較組與組之間的差異。1平均數(shù)分析過程的方法(1)打開卡方檢驗(yàn)對話框單擊【分析】【均值比較】【均值】,打開平均數(shù)分析對話框,如圖6-12所示。圖6-12 平均數(shù)分析對話框(2)選擇分析變量從左側(cè)源變量窗口選擇要分析的數(shù)值型變量進(jìn)入【因變量列表】窗口。(3)確定分組變量從左側(cè)源變量窗口選擇定類或定序變量進(jìn)入【自變量列表】窗口,同時(shí)【下一張】按鈕被激活,可通過【下一張】和【上一張】進(jìn)行分層分析。(4)選擇輸出的統(tǒng)計(jì)量單擊【選項(xiàng)】按鈕,打開平均數(shù)分析選項(xiàng)對話框,如圖6-13。該對話框包括三項(xiàng)內(nèi)容:【統(tǒng)計(jì)量】窗口列出了可供輸出的各種統(tǒng)計(jì)量?!締卧窠y(tǒng)計(jì)量】窗口列出了被選中的要輸出
36、的統(tǒng)計(jì)量,其中平均數(shù)、個(gè)案數(shù)和標(biāo)準(zhǔn)差是默認(rèn)輸出選項(xiàng)。圖6-13 平均數(shù)分析選項(xiàng)對話框【第一層的統(tǒng)計(jì)量】列出了第一層分組的另外兩個(gè)統(tǒng)計(jì)量?!続nova表和eta】表示對分組變量進(jìn)行單因素方差分析;【線性相關(guān)檢驗(yàn)】表示對分組變量進(jìn)行線性相關(guān)檢驗(yàn)。上述操作完成后,單擊【繼續(xù)】返回頻數(shù)分析對話框。再單擊【確定】,提交運(yùn)行。2平均數(shù)分析過程的實(shí)例【例6-8】上市公司高管薪酬.sav是關(guān)于我國上市公司CEO報(bào)酬的數(shù)據(jù),請計(jì)算:(1)不同教育水平的上市公司CEO年度報(bào)酬均值;(2)不同最終控制人類型的上市公司CEO年度報(bào)酬均值;(3)最終控制人相同,教育水平不同的上市公司CEO年度報(bào)酬均值。(1)單擊【分析
37、】【比較均值】【均值】,打開平均數(shù)分析對話框,如圖6-所示。(2)從左側(cè)源變量框選擇變量CEO年度報(bào)酬(comp)進(jìn)入【因變量列表】框。(3)從左側(cè)源變量窗口選擇變量CEO教育水平(edu)和最終控制人類型(control)進(jìn)入【自變量列表】窗口。(4)單擊【選項(xiàng)】按鈕,打開平均數(shù)分析選項(xiàng)對話框,選擇【均值】和【個(gè)案數(shù)】,如圖4-4所示。單擊【繼續(xù)】返回頻數(shù)分析對話框。單擊【確定】,提交運(yùn)行。(5)再重復(fù)(1)(2)和(3)步,將變量最終控制人類型(control)選入【自變量列表】后單擊【下一張】,再將變量CEO教育水平(edu)選入【自變量列表】。單擊【確定】,提交運(yùn)行。(6)結(jié)果分析。在
38、結(jié)果輸出窗口得到如下圖表:觀察表6-5可知不同教育水平的CEO年度報(bào)酬均值;觀察表6-6可知不同最終控制人類型的CEO年度報(bào)酬均值。表6-5 不同教育水平CEO年度報(bào)酬均值CEO年度報(bào)酬CEO教育水平均值Ndimension1中專及以下637685.7114大專425678.35106本科534140.11316碩士599334.67485博士667137.0171總計(jì)565405.06992表6-6 不同最終控制人類型CEO年度報(bào)酬均值CEO年度報(bào)酬最終控制人類型均值Ndimension1國有549411.14633非國有593606.05359總計(jì)565405.06992表6-7報(bào)告了最終
39、控制人相同,教育水平不同的CEO年度報(bào)酬均值,由表可知國有和非國有的不同教育水平的CEO年度報(bào)酬均值有較大差異。表6-7 最終控制人相同,教育水平不同的CEO年度報(bào)酬均值CEO年度報(bào)酬最終控制人類型CEO教育水平均值Ndimension1國有dimension2中專及以下931928.577大專408496.0259本科506591.57196碩士574677.32329博士685516.6442總計(jì)549411.14633非國有dimension2中專及以下343442.867大專447247.6747本科579136.07120碩士651336.38156博士640518.2429總計(jì)59
40、3606.05359總計(jì)dimension2中專及以下637685.7114大專425678.35106本科534140.11316碩士599334.67485博士667137.0171總計(jì)565405.069926.3.2 單樣本T檢驗(yàn) 1單樣本T檢驗(yàn)的基本原理單樣本T檢驗(yàn)是通過計(jì)算出的樣本平均數(shù)來估計(jì)總體平均數(shù)是否為某個(gè)確定的值,即檢驗(yàn)樣本平均數(shù)能否推斷總體平均數(shù)?;蛘哂脕頇z驗(yàn)?zāi)硞€(gè)變量的平均數(shù)是否與給定的平均數(shù)是否有顯著差異。單樣本T檢驗(yàn)的步驟是:第一步:提出原假設(shè)和備擇假設(shè)。; 。第二步:選擇顯著性水平,可以是90%,95%或99%。第三步:根據(jù)計(jì)算出的值(即SPSS中的Sig)與進(jìn)行比
41、較,做出判斷:若,拒絕原假設(shè);若,不拒絕原假設(shè)。2單樣本T檢驗(yàn)的方法(1)打開卡方檢驗(yàn)對話框單擊【分析】【均值比較】【單樣本T檢驗(yàn)】,打開單樣本T檢驗(yàn)對話框,如圖6-14所示。圖6-14 單樣本T檢驗(yàn)對話框(2)選擇分析變量從左側(cè)源變量窗口選擇要分析的數(shù)值型變量進(jìn)入【檢驗(yàn)變量】窗口。(3)確定待檢參數(shù)在【檢驗(yàn)值】后面的窗口輸入檢驗(yàn)值。(4)確定置信水平和缺失值的處理方法單擊【選項(xiàng)】對話框,打開選項(xiàng)對話框,如圖6-15所示?!局眯艆^(qū)間百分比】窗口后面可輸入置信水平。圖6-15 單樣本T檢驗(yàn)選項(xiàng)對話框【缺失值】中【按分析順序排除個(gè)案】是只剔除分析變量為缺失值的個(gè)案;【按列表排除個(gè)案】是剔除任何含有
42、缺失值的個(gè)案。上述操作完成后,單擊【繼續(xù)】返回單樣本T檢驗(yàn)分析對話框。再單擊【確定】,提交運(yùn)行。3單樣本T檢驗(yàn)的實(shí)例【例6-9】根據(jù)人力資源社會保障部會同財(cái)政部、國資委發(fā)布的關(guān)于進(jìn)一步規(guī)范中央企業(yè)負(fù)責(zé)人薪酬管理的指導(dǎo)意見規(guī)定上市公司高管報(bào)酬不得超過在崗職工平均工資的20倍,國家統(tǒng)計(jì)局2011年5月5日公布的2010年全國城鎮(zhèn)非私營單位在崗職工年平均工資為37147元,請檢驗(yàn)?zāi)壳拔覈鴩猩鲜泄镜母吖軋?bào)酬是否符合這一規(guī)定。(1)使用個(gè)案的篩選,將國有控股上市公司的樣本挑選出來。(2)單擊【分析】【均值比較】【單樣本T檢驗(yàn)】,打開單樣本T檢驗(yàn)對話框,如圖6-14所示。(3)從左側(cè)源變量窗口選擇CE
43、O年度報(bào)酬(comp)進(jìn)入【檢驗(yàn)變量】窗口。(4)在【檢驗(yàn)值】后面的窗口輸入檢驗(yàn)值742940。單擊【確定】,提交運(yùn)行。(5)結(jié)果分析。在結(jié)果輸出窗口得到如下圖表:表6-8報(bào)告了CEO年度報(bào)酬的均值、標(biāo)準(zhǔn)差和均值的標(biāo)準(zhǔn)誤。表6-8 單個(gè)樣本統(tǒng)計(jì)量N均值標(biāo)準(zhǔn)差均值的標(biāo)準(zhǔn)誤CEO年度報(bào)酬633549411.14455164.42618091.162表6-9報(bào)告了單個(gè)樣本T檢驗(yàn)的結(jié)果,由T值是-10.697,顯著性水平為0,可知CEO年度報(bào)酬的均值與742940有顯著差異,有樣本均值是549411.14可知上市公司高管報(bào)酬沒有超過在職職工工資的20倍,所以目前我國國有上市公司的高管報(bào)酬符合國家相關(guān)規(guī)
44、定。表6-9 單個(gè)樣本檢驗(yàn)檢驗(yàn)值 = 742940 tdfSig.(雙側(cè))均值差值差分的 95% 置信區(qū)間下限上限CEO年度報(bào)酬-10.697632.000-193528.861-229054.92-158002.806.3.3 獨(dú)立樣本T檢驗(yàn)1獨(dú)立樣本T檢驗(yàn)的基本原理獨(dú)立樣本T檢驗(yàn)是檢驗(yàn)兩個(gè)獨(dú)立樣本的平均數(shù)是否有顯著差異的一種方法。獨(dú)立樣本T檢驗(yàn)的步驟是:第一步:提出原假設(shè)和備擇假設(shè)。;。第二步:選擇顯著性水平,可以是90%,95%或99%。第三步:根據(jù)計(jì)算出的值(即SPSS中的Sig)與進(jìn)行比較,做出判斷:若,拒絕原假設(shè);若,不拒絕原假設(shè)。2獨(dú)立樣本T檢驗(yàn)的方法(1)打開卡方檢驗(yàn)對話框單擊
45、【分析】【均值比較】【獨(dú)立樣本T檢驗(yàn)】,打開獨(dú)立樣本T檢驗(yàn)對話框,如圖6-16所示。圖6-16 獨(dú)立樣本T檢驗(yàn)對話框(2)選擇分析變量從左側(cè)源變量窗口選擇要分析的數(shù)值型變量進(jìn)入【檢驗(yàn)變量】窗口。(3)確定分組變量從左側(cè)源變量窗口選擇要分析的定類或定序變量進(jìn)入【檢驗(yàn)變量】窗口?!径x組】按鈕被激活。(4)確定分組變量的取值單擊【定義組】按鈕,打開確定分組對話框,如圖6-17所示。對話框提供了兩種分組方式:選擇【使用指定組】方式,在【組1】和【組2】窗口后分別輸入定類或定序變量的兩個(gè)值,即根據(jù)兩個(gè)值確定的兩個(gè)個(gè)樣本進(jìn)行T檢驗(yàn)。圖6-17 確定分組對話框選擇【割點(diǎn)】方式,在其后的窗口輸入一個(gè)值作為分
46、界點(diǎn),根據(jù)分界點(diǎn)將樣本分成兩個(gè)組,大于等于該數(shù)值的為一組,小于該數(shù)值的兩組,然后對這兩組進(jìn)行T檢驗(yàn)。(5)確定置信水平和缺失值的處理方法與單樣本T檢驗(yàn)一致,不再贅述。上述操作完成后,單擊【繼續(xù)】返回獨(dú)立樣本T檢驗(yàn)分析對話框。再單擊【確定】,提交運(yùn)行。3獨(dú)立樣本T檢驗(yàn)的實(shí)例【例6-10】使用上市公司高管薪酬.sav數(shù)據(jù),檢驗(yàn)教育水平是大專和博士的上市公司CEO年度報(bào)酬均值是否有顯著差異?(1)單擊【分析】【均值比較】【獨(dú)立樣本T檢驗(yàn)】,打開獨(dú)立樣本T檢驗(yàn)對話框,如圖6-16所示。(2)從左側(cè)源變量窗口選擇變量CEO年度報(bào)酬(comp)進(jìn)入【檢驗(yàn)變量】窗口。(3)從左側(cè)源變量窗口選擇變量CEO教育
47、水平(edu)進(jìn)入【檢驗(yàn)變量】窗口。(4)單擊【定義組】按鈕,打開確定分組對話框,選擇【使用指定組】方式,在【組1】和【組2】窗口后分別輸入2和5,單擊【繼續(xù)】返回獨(dú)立樣本T檢驗(yàn)分析對話框。再單擊【確定】,提交運(yùn)行。(5)結(jié)果分析。在結(jié)果輸出窗口得到如下圖表:表6-10報(bào)告了教育水平是大專和博士的CEO年度報(bào)酬的樣本數(shù)、平均數(shù)、標(biāo)準(zhǔn)差、均值的標(biāo)準(zhǔn)誤。表6-10 組統(tǒng)計(jì)量CEO教育水平N均值標(biāo)準(zhǔn)差均值的標(biāo)準(zhǔn)誤CEO年度報(bào)酬dimension1大專59408496.02375714.42848913.852博士42685516.64372758.29057517.853表6-11報(bào)告了獨(dú)立樣本T檢
48、驗(yàn)的結(jié)果。首先根據(jù)Levene檢驗(yàn)得到F值0.101和顯著性水平0.751判斷出方差相等。再根據(jù)第一行數(shù)據(jù)中的T值-3.65和顯著性水平0可知教育水平是大專和博士的CEO年度報(bào)酬的均值有顯著差異。表6-11 獨(dú)立樣本T檢驗(yàn)方差方程的 Levene檢驗(yàn)均值方程的t檢驗(yàn)FSig.tdfSig.(雙側(cè))均值差值標(biāo)準(zhǔn)誤差值差分的95%置信區(qū)間下限上限CEO年度報(bào)酬假設(shè)方差相等.101.751-3.6599.000-277020.6375605.56-427038.46-127002.79假設(shè)方差不相等-3.6788.89.000-277020.6375504.10-427048.35-126992.9
49、06.3.4 配對樣本T檢驗(yàn)1配對樣本T檢驗(yàn)的基本原理配對樣本T檢驗(yàn)是檢驗(yàn)兩個(gè)配對樣本前后兩次平均數(shù)是否有顯著差異。配對樣本T檢驗(yàn)的步驟是:第一步:提出原假設(shè)和備擇假設(shè)。; 。第二步:選擇顯著性水平,可以是90%,95%或99%。第三步:根據(jù)計(jì)算出的值(即SPSS中的Sig)與進(jìn)行比較,做出判斷:若,拒絕原假設(shè);若,不拒絕原假設(shè)。2配對樣本T檢驗(yàn)的方法(1)打開卡方檢驗(yàn)對話框單擊【分析】【均值比較】【配對樣本T檢驗(yàn)】,打開配對樣本T檢驗(yàn)對話框,如圖6-18所示。圖6-18 配對樣本T檢驗(yàn)對話框(2)選擇分析變量從左側(cè)源變量窗口選擇兩個(gè)配對變量進(jìn)入【成對變量】窗口。(5)確定置信水平和缺失值的處
50、理方法與單樣本T檢驗(yàn)一致,不再贅述。上述操作完成后,單擊【繼續(xù)】返回獨(dú)立樣本T檢驗(yàn)分析對話框。再單擊【確定】,提交運(yùn)行。3配對樣本T檢驗(yàn)的實(shí)例【例6-11】數(shù)據(jù)英語成績.sav是北京城市大學(xué)某班期中和期末的英語考試成績。在期中考試后,教師根據(jù)學(xué)生的考試成績發(fā)現(xiàn)了教學(xué)中存在的一些問題,及時(shí)調(diào)整了教學(xué)方法,請檢驗(yàn)學(xué)生的期中和期末成績是否有顯著差異?(1)單擊【分析】【均值比較】【配對樣本T檢驗(yàn)】,打開配對樣本T檢驗(yàn)對話框,如圖6-18所示。(2)從左側(cè)源變量窗口選擇變期末考試成績(score2)和期中考試成績(score1)進(jìn)入【成對變量】窗口。單擊【確定】,提交運(yùn)行。(3)結(jié)果分析。在結(jié)果輸出窗口得到如下圖表:表6-12報(bào)告了期末考試成績和期中考試成績的均值、樣本數(shù)、標(biāo)準(zhǔn)差和均值的標(biāo)準(zhǔn)誤。表6-12 成對樣本統(tǒng)計(jì)量均
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2023-2024學(xué)年人教版高中信息技術(shù)必修一第三章第四節(jié)《數(shù)據(jù)分析報(bào)告與應(yīng)用》教學(xué)設(shè)計(jì)
- 2024年中廣核環(huán)保產(chǎn)業(yè)有限公司招聘7人筆試參考題庫附帶答案詳解
- 2024-2025學(xué)年初升高銜接英語句子成分 教學(xué)設(shè)計(jì)
- 《記念劉和珍君》《為了忘卻的記念》聯(lián)讀教學(xué)設(shè)計(jì)
- 教師職業(yè)道德與學(xué)前教育政策法規(guī) 教案 6. 教師觀
- 籃球:行進(jìn)間變向運(yùn)球 教學(xué)設(shè)計(jì)-2023-2024學(xué)年高一上學(xué)期體育與健康人教版必修第一冊
- 2025年定制家具項(xiàng)目發(fā)展計(jì)劃
- 2025年全斷面掘進(jìn)機(jī)合作協(xié)議書
- 人教版一年級下冊數(shù)學(xué)第一單元《認(rèn)識圖形(二)》作業(yè)設(shè)計(jì)
- 2025年湖南省永州市單招職業(yè)傾向性測試題庫1套
- 家校共育之道
- 公司EHS知識競賽題庫附答案
- DeepSeek入門寶典培訓(xùn)課件
- 社區(qū)健康促進(jìn)工作計(jì)劃
- 《作文中間技巧》課件
- 2025年度移動端SEO服務(wù)及用戶體驗(yàn)優(yōu)化合同
- 中小學(xué)《清明節(jié)活動方案》班會課件
- 廣東省2025年中考物理仿真模擬卷(深圳)附答案
- 新蘇教版一年級下冊數(shù)學(xué)第1單元第3課時(shí)《8、7加幾》作業(yè)
- 2024年山東電力高等??茖W(xué)校高職單招職業(yè)技能測驗(yàn)歷年參考題庫(頻考版)含答案解析
- 【公開課】同一直線上二力的合成+課件+2024-2025學(xué)年+人教版(2024)初中物理八年級下冊+
評論
0/150
提交評論