第6章參數(shù)檢驗(yàn)

上傳人：q*** IP屬地：湖北上傳時(shí)間：2021-12-01 格式：DOC 頁數(shù)：28 大?。?.06MB 積分：30 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩23頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第6章參數(shù)檢驗(yàn)【學(xué)習(xí)目標(biāo)】² 了解參數(shù)估計(jì)的含義。² 理解點(diǎn)估計(jì)和區(qū)間估計(jì)的含義。² 理解一個(gè)總體參數(shù)區(qū)間估計(jì)的幾種情形和兩個(gè)總體參數(shù)區(qū)間估計(jì)的幾種情形。² 理解假設(shè)檢驗(yàn)的基本原理。² 掌握SPSS中平均數(shù)比較與T檢驗(yàn)的操作方法：平均數(shù)分析過程，單樣本T檢驗(yàn)，獨(dú)立樣本T檢驗(yàn)和配對樣本T檢驗(yàn)。【引導(dǎo)案例】靜靜的頓河作者之爭靜靜的頓河是前蘇聯(lián)文學(xué)史上首屈一指的戰(zhàn)爭名著，它全景式的描寫了俄國內(nèi)戰(zhàn)時(shí)期頓河流域的社會景觀，堪稱不朽的史詩。但自從靜靜的頓河誕生之日起，圍繞其作者所引起的爭議就沒有停止過。有人指控肖洛霍夫是個(gè)騙子，說靜靜的頓河不是肖洛霍夫

2、所寫，真正的作者是費(fèi)奧爾克魯烏科夫。挪威奧斯陸大學(xué)的前蘇聯(lián)文學(xué)教授蓋爾·克其薩用計(jì)算機(jī)對靜靜的頓河進(jìn)行了分析研究，其別具一格的論文曾發(fā)表在世界知名的權(quán)威雜志計(jì)算機(jī)與人文科學(xué)上，轟動一時(shí)。那么，克其薩教授怎樣把統(tǒng)計(jì)學(xué)引入這本名著的研究的呢？克其薩教授與同事一起，對靜靜的頓河的文章風(fēng)格和其他一些特點(diǎn)分別與肖洛霍夫和克魯烏科夫的作品進(jìn)行了統(tǒng)計(jì)分析。他們通過抽取的樣品，研究了三個(gè)重要參數(shù)，為了對比，把肖洛霍夫的無可爭議的作品作為第一組，靜靜的頓河作為第二組，克魯烏科夫的作品作為第三組，其結(jié)果如表6-1所示。表6-1 文學(xué)風(fēng)格統(tǒng)計(jì)表（單位：%）組別不同詞匯量與總詞匯量的百分比俄文中常見詞匯

3、與作品總詞匯量的百分比作品中出現(xiàn)一次的詞匯占總詞匯量的百分比第一組65.522.880.9第二組64.623.381.9第三組58.926.276.9根據(jù)表中的數(shù)據(jù)，所有參數(shù)都存在一致的趨勢，即克魯烏科夫的作品與靜靜的頓河之間，存在著顯著的統(tǒng)計(jì)差異，所以，這部著作的真正作者很難說是克魯烏科夫，相比之下，肖洛霍夫更像是靜靜的頓河的作者。本章介紹的內(nèi)容可以幫助我們解決類似的問題。6.1 參數(shù)估計(jì)6.1.1 什么是參數(shù)估計(jì)估計(jì)就是根據(jù)所掌握的信息對客觀世界進(jìn)行某種判斷。例如，根據(jù)一個(gè)人的衣著、言談和舉止判斷其身份；根據(jù)上市公司公布的各種信息，估計(jì)其股票價(jià)格的走勢等。統(tǒng)計(jì)中的估計(jì)是完全根據(jù)數(shù)據(jù)做出的判

4、斷，我們把用樣本統(tǒng)計(jì)量去估計(jì)總體參數(shù)稱為參數(shù)估計(jì)（parameter estimation）。例如，用樣本平均數(shù)估計(jì)總體平均數(shù)，用樣本標(biāo)準(zhǔn)差估計(jì)總體標(biāo)準(zhǔn)差，用樣本比例估計(jì)總體比例。通常我們用表示總體參數(shù)，用表示估計(jì)參數(shù)的統(tǒng)計(jì)量，當(dāng)用來估計(jì)時(shí)，也稱為估計(jì)量。根據(jù)一個(gè)具體的樣本計(jì)算出來的估計(jì)量的數(shù)值稱為估計(jì)值。例如，想要了解北京城市大學(xué)全體學(xué)生的英語成績，抽取工商管理專業(yè)的100名學(xué)生作為樣本，100名學(xué)生的平均成績是一個(gè)估計(jì)量，若計(jì)算出來平均成績是80分，則80分就是一個(gè)估計(jì)值。參數(shù)估計(jì)和假設(shè)檢驗(yàn)一起構(gòu)成了推斷性統(tǒng)計(jì)的內(nèi)容，它們在統(tǒng)計(jì)學(xué)中的地位如圖6-1所示。圖6-1 統(tǒng)計(jì)學(xué)基本內(nèi)容構(gòu)成圖6.1

5、.2 點(diǎn)估計(jì)與區(qū)間估計(jì) 參數(shù)估計(jì)的方法有點(diǎn)估計(jì)和區(qū)間估計(jì)兩種。1什么是點(diǎn)估計(jì)點(diǎn)估計(jì)（point estimation）就是將估計(jì)量的某個(gè)取值作為總體參數(shù)的估計(jì)值，即直接用樣本平均數(shù)作為總體平均數(shù)，直接用樣本標(biāo)準(zhǔn)差作為總體標(biāo)準(zhǔn)差，直接用樣本比例作為總體比例。例如上例中將工商管理專業(yè)100名學(xué)生的英語平均成績80分作為北京城市大學(xué)全體學(xué)生的英語成績。點(diǎn)估計(jì)值代表總體參數(shù)值是直接給出一個(gè)具體數(shù)字，使用簡便、直觀。但是每次抽出一個(gè)樣本就會產(chǎn)生一個(gè)估計(jì)值，每個(gè)估計(jì)值與總體參數(shù)的誤差無法確定，即點(diǎn)估計(jì)的可靠性無法度量，因此點(diǎn)估計(jì)的使用有一定的缺陷，應(yīng)該圍繞點(diǎn)估計(jì)值構(gòu)造總體參數(shù)的一個(gè)區(qū)間，這就是下面要介紹的

6、區(qū)間估計(jì)。2什么是區(qū)間估計(jì)現(xiàn)實(shí)生活中，人們在描述一個(gè)人的體重時(shí)，一般不會說其體重是76.35公斤，而是說他的體重是大概是七八十公斤，或者是在7080公斤之間。在描述員工的工資水平時(shí)，一般不會說員工的工資是2500元，而是說員工的工資水平是20003000元，即給出一個(gè)上限或下限，這就是區(qū)間估計(jì)（interval estimation）。區(qū)間估計(jì)就是在點(diǎn)估計(jì)的基礎(chǔ)上，給出總體參數(shù)的一個(gè)估計(jì)區(qū)間，該區(qū)間通常是由樣本統(tǒng)計(jì)量加減估計(jì)誤差（estimate error）得到。在區(qū)間估計(jì)中，根據(jù)樣本統(tǒng)計(jì)量的抽樣分布能夠?qū)颖窘y(tǒng)計(jì)量與總體參數(shù)的接近程度給出一個(gè)概率度量。區(qū)間估計(jì)需要確定兩個(gè)統(tǒng)計(jì)量和分別來估計(jì)

7、總體參數(shù)的下限和上限，并使在區(qū)間的概率為，即我們有的把握斷定的真值在區(qū)間內(nèi)。是一個(gè)事先給定的一個(gè)小正數(shù)，就是估計(jì)區(qū)間包括真值的概率，稱為置信水平（confidence level）、置信系數(shù)或置信度，常用的是0.01，0.05和0.1，所以常用的置信水平是99%，95%和90%。估計(jì)區(qū)間稱作參數(shù)在置信水平1-的置信區(qū)間（confidence interval），為置信下限，為置信上限。置信水平、置信區(qū)間的關(guān)系如圖6-2所示。置信下限點(diǎn)估計(jì)值置信上限置信水平置信區(qū)間圖6-2 置信區(qū)間示意圖需要注意的是：置信區(qū)間是根據(jù)樣本構(gòu)造的，所以是一個(gè)隨機(jī)區(qū)間，會根據(jù)樣本的變化而變化，并不是所有的置信區(qū)間都包

8、含真值。例如，用95%的置信水平得到北京城市大學(xué)全體學(xué)生英語成績的置信區(qū)間為6585，意味著在100次抽樣中，大概有95次得到的置信區(qū)間包含了真值，有5次得到的置信區(qū)間不包含真值。假定全體學(xué)生英語成績的平均數(shù)真值為70，則6585這個(gè)區(qū)間一定包含真值。假定全體學(xué)生英語成績的平均數(shù)真值為60，則6585這個(gè)區(qū)間一定不包含真值。3評價(jià)估計(jì)量優(yōu)劣的標(biāo)準(zhǔn)既然統(tǒng)計(jì)量僅是總體參數(shù)的一個(gè)估計(jì)量，它就不可能完全準(zhǔn)確，而且總體某一參數(shù)的估計(jì)量可能不止一個(gè)，如樣本平均數(shù)、樣本中位數(shù)都可以用來估計(jì)總體平均數(shù)，但并非所有的估計(jì)量都是優(yōu)良，我們常用三條標(biāo)準(zhǔn)去衡量估計(jì)量的優(yōu)劣。（1）無偏性無偏性（unbiasedness

9、）是指估計(jì)量抽樣分布的期望值等于被估計(jì)的總體參數(shù)。設(shè)是總體參數(shù)的估計(jì)量，若，則稱是的無偏估計(jì)量。無偏性就是沒有系統(tǒng)偏差，從平均意義上看，如果估計(jì)方法重復(fù)多次，則估計(jì)量的平均數(shù)就是總體參數(shù)。由樣本均值的抽樣分布可知，因此，是，的無偏估計(jì)量。（2）有效性有效性（efficiency）是指估計(jì)量的方差要盡可能小。所以，有效性是衡量離散程度的指標(biāo)，若兩個(gè)估計(jì)量都是無偏的，其中方差小的離散程度就小，其值更接近總體參數(shù)，我們認(rèn)為它更有效。（3）一致性一致性（consistency）指的是隨著樣本容量的增大，如果估計(jì)量越來越接近總體參數(shù)的真值，就稱該估計(jì)量是一致估計(jì)量。一致性實(shí)際上是要求從一個(gè)大樣本得到的估

10、計(jì)量要比一個(gè)小樣本得到的估計(jì)量更接近總體參數(shù)。6.1.3 一個(gè)總體參數(shù)的區(qū)間估計(jì)一個(gè)總體參數(shù)的區(qū)間估計(jì)包括對總體平均數(shù)，總體方差，總體比例的估計(jì)。1總體平均數(shù)的區(qū)間估計(jì)總體平均數(shù)的置信區(qū)間是由樣本平均數(shù)加減估計(jì)誤差得到。估計(jì)誤差由兩部分組成：一是點(diǎn)估計(jì)量的標(biāo)準(zhǔn)誤差，它取決于樣本統(tǒng)計(jì)量的抽樣分布。二是置信水平為時(shí)，統(tǒng)計(jì)量分布兩側(cè)面積各為時(shí)的分位數(shù)值，它取決于事先所要求的可靠程度。（1）大樣本估計(jì)大樣本情況下，根據(jù)中心極限定理可知，樣本平均數(shù)經(jīng)標(biāo)準(zhǔn)化后服從標(biāo)準(zhǔn)正態(tài)分布，即。若總體標(biāo)準(zhǔn)差已知，總體平均數(shù)在置信水平下的置信區(qū)間為：（6.1）式中，是置信下限，是置信上限，是標(biāo)準(zhǔn)正態(tài)分布兩側(cè)面積各為時(shí)的

11、值，是標(biāo)準(zhǔn)誤差，是估計(jì)誤差。若總體標(biāo)準(zhǔn)差未知，用代替，總體平均數(shù)在置信水平下的置信區(qū)間為：（6.2）（2）小樣本估計(jì)小樣本情況下，要求總體服從正態(tài)分布。若總體標(biāo)準(zhǔn)差已知，樣本平均數(shù)經(jīng)標(biāo)準(zhǔn)化后服從標(biāo)準(zhǔn)正態(tài)分布，總體平均數(shù)在置信水平下的置信區(qū)間仍是式（6.1）。若總體標(biāo)準(zhǔn)差未知，樣本平均數(shù)經(jīng)標(biāo)準(zhǔn)化后服從自由度為的分布，即，則總體平均數(shù)在置信水平下的置信區(qū)間是：（6.3）【例6-1】英語成績.sav是北京城市大學(xué)26名學(xué)生的期中和期末的英語考試成績。請估計(jì)期中平均成績的95%的置信區(qū)間。（1）觀察數(shù)據(jù)樣本量是26所以采用小樣本估計(jì)的方法。（2）單擊【分析】【均值比較】【單樣本T檢驗(yàn)】，打開單樣本

12、T檢驗(yàn)對話框。（3）從左側(cè)源變量窗口選擇期中考試成績（score1）進(jìn)入【檢驗(yàn)變量】窗口。（4）在【檢驗(yàn)值】后面的窗口輸入檢驗(yàn)值0，如圖6-3所示。圖6-3 單樣本T檢驗(yàn)對話框（5）單擊【選項(xiàng)】按鈕，在【置信區(qū)間百分比】窗口后面輸入95%。單擊【繼續(xù)】，返回單樣本T檢驗(yàn)對話框。單擊【確定】，提交運(yùn)行。（6）結(jié)果分析。在結(jié)果輸出窗口得到表6-2。由表可知期中平均成績95%的置信區(qū)間是59.700269.5306。表6-2 單個(gè)樣本檢驗(yàn)檢驗(yàn)值 = 0 tdfSig.(雙側(cè))均值差值差分的95%置信區(qū)間下限上限期中考試成績27.07525.00064.6153859.700269.53062總體比例

13、的區(qū)間估計(jì)大樣本條件下，樣本比例服從期望值為，方差為的正態(tài)分布，樣本比例經(jīng)標(biāo)準(zhǔn)化后服從標(biāo)準(zhǔn)正態(tài)分布，即：，總體比例的置信區(qū)間也是點(diǎn)估計(jì)量±估計(jì)誤差得到的，則總體比例在置信水平下的置信區(qū)間是：（6.4）3總體方差的區(qū)間估計(jì)假定總體服從正態(tài)分布，樣本方差的抽樣分布服從自由度為的分布，即：（6.5）建立總體方差的置信區(qū)間，就是要滿足，用式（6.5）來代替，有：（6.6）則總體方差在置信水平下的置信區(qū)間是：（6.7）圖6-4總結(jié)了一個(gè)總體參數(shù)估計(jì)所使用的分布的各種情形。待估參數(shù)總體平均數(shù)總體比例總體方差大樣本小樣本 Z分布總體方差已知總體方差未知大樣本Z分布分布 Z分布 t分布正

14、態(tài)分布圖6-4 一個(gè)總體參數(shù)估計(jì)所使用的分布6.1.4 兩個(gè)總體參數(shù)的區(qū)間估計(jì)兩個(gè)總體參數(shù)的區(qū)間估計(jì)包括對兩個(gè)總體平均數(shù)之差，兩個(gè)總體的比例之差，兩個(gè)總體的方差比的估計(jì)。1兩個(gè)總體平均數(shù)之差的區(qū)間估計(jì)從兩個(gè)總體平均數(shù)分別是和的總體中分別抽取樣本量是和的兩個(gè)隨機(jī)樣本，樣本平均數(shù)分別是和，則兩個(gè)總體平均數(shù)之差的點(diǎn)估計(jì)量是兩個(gè)樣本均值之差，兩個(gè)總體平均數(shù)之差的置信區(qū)間是點(diǎn)估計(jì)量加減估計(jì)誤差。（1）獨(dú)立大樣本估計(jì)若兩個(gè)樣本是從兩個(gè)總體中獨(dú)立抽取的，則一個(gè)樣本與另一個(gè)樣本相互獨(dú)立，稱為獨(dú)立樣本（independent sample）。若兩個(gè)樣本都是大樣本，兩個(gè)樣本平均數(shù)之差服從期望值為、方差為的正態(tài)分布

15、，經(jīng)標(biāo)準(zhǔn)化后兩個(gè)樣本平均數(shù)之差服從標(biāo)準(zhǔn)正態(tài)分布，即：（6.8）若兩個(gè)總體方差和都已知，則兩個(gè)總體平均數(shù)之差在置信水平下的置信區(qū)間為：（6.9）若兩個(gè)總體方差和都未知，則用兩個(gè)樣本方差和來代替，兩個(gè)總體平均數(shù)之差在置信水平下的置信區(qū)間為：（6.10）（2）獨(dú)立小樣本估計(jì)若兩個(gè)樣本都是小樣本，則要求兩個(gè)總體服從正態(tài)分布。若兩個(gè)總體方差和都已知，兩個(gè)總體平均數(shù)之差在置信水平下的置信區(qū)間為與大樣本情形相同，見式（6.9）。兩個(gè)總體方差未知時(shí)，又分成兩種情況：兩個(gè)總體方差未知但相等時(shí)，即，需要將兩個(gè)樣本的數(shù)據(jù)合并起來估計(jì)的估計(jì)量，計(jì)算公式是：（6.11）所以，兩個(gè)樣本平均數(shù)之差經(jīng)標(biāo)準(zhǔn)化后服從自由

16、度為的分布，即：（6.12）則兩個(gè)總體平均數(shù)之差在置信水平下的置信區(qū)間為：（6.13）兩個(gè)總體方差未知且不等，即，兩個(gè)樣本平均數(shù)之差經(jīng)標(biāo)準(zhǔn)化后近似服從自由度為的分布，自由度的計(jì)算公式是：（6.14）所以，兩個(gè)總體平均數(shù)之差在置信水平下的置信區(qū)間為：（6.15）【例6-2】英語成績.sav是北京城市大學(xué)26名學(xué)生的期中和期末的英語考試成績，其中男生和女生各13人，請建立男生和女生平均成績之差的95%的置信區(qū)間？（1）男生樣本和女生樣本形成兩個(gè)獨(dú)立樣本，其樣本量分別是13，所以采用小樣本估計(jì)的方法。（2）從左側(cè)源變量窗口選擇變量期中考試成績（score1）進(jìn)入【檢驗(yàn)變量】窗口。（3）從左側(cè)

17、源變量窗口選擇變量性別（sex）進(jìn)入【檢驗(yàn)變量】窗口。單擊【定義組】按鈕，打開確定分組對話框，選擇【使用指定組】方式，在【組1】和【組2】窗口后分別輸入1和2，單擊【繼續(xù)】返回獨(dú)立樣本T檢驗(yàn)分析對話框，如圖6-5所示。圖6-5 獨(dú)立樣本T檢驗(yàn)對話框（4）單擊【選項(xiàng)】按鈕，在【置信區(qū)間百分比】窗口后面輸入95%。單擊【繼續(xù)】，返回單樣本T檢驗(yàn)對話框。單擊【確定】，提交運(yùn)行。（5）結(jié)果分析。在結(jié)果輸出窗口得到表6-3。由表可知男生和女生平均成績之差的95%的置信區(qū)間是-16.945522.17629。表6-3 獨(dú)立樣本檢驗(yàn)方差方程的 Levene 檢驗(yàn)均值方程的 t 檢驗(yàn)FSig.tdfSig.(

18、雙側(cè))均值差值標(biāo)準(zhǔn)誤差值差分的95% 置信區(qū)間下限上限期中考試成績假設(shè)方差相等2.841.105-1.59424.124-7.384624.63245-16.945522.17629假設(shè)方差不相等-1.59419.978.127-7.384624.63245-17.048422.27919（3）配對樣本的估計(jì)配對樣本是對同一個(gè)研究對象在不同時(shí)間點(diǎn)上進(jìn)行前后兩次測量得到的樣本。例如，企業(yè)薪酬方案改革前后，對員工滿意度的測量就形成一組配對樣本；一個(gè)班學(xué)生的期中和期末兩次考試就是一組配對樣本。在大樣本情況下，兩個(gè)總體平均數(shù)之差在置信水平下的置信區(qū)間為：（6.16）其中，表示兩個(gè)配對數(shù)據(jù)的差值；表示

19、各差值的均值；表示各差值的標(biāo)準(zhǔn)差。當(dāng)總體差值的標(biāo)準(zhǔn)差未知時(shí)，可用樣本差值的標(biāo)準(zhǔn)差來代替。小樣本情況下，假定兩個(gè)總體各觀察值的配對服從個(gè)正態(tài)分布。兩個(gè)總體平均數(shù)之差在置信水平下的置信區(qū)間為：（6.17）【例6-3】英語成績.sav是北京城市大學(xué)某班期中和期末的英語考試成績。在期中考試后，教師根據(jù)學(xué)生的考試成績發(fā)現(xiàn)了教學(xué)中存在的一些問題，及時(shí)調(diào)整了教學(xué)方法，請建立平均成績之差的95%的置信區(qū)間？（1）觀察兩個(gè)配對樣本的樣本量都是26，所以采用小樣本估計(jì)的方法。（2）單擊【分析】【均值比較】【配對樣本T檢驗(yàn)】，打開配對樣本T檢驗(yàn)對話框。（3）從左側(cè)源變量窗口選擇變期末考試成績（score2）和期中

20、考試成績（score1）進(jìn)入【成對變量】窗口，如圖6-6所示。（4）單擊【選項(xiàng)】按鈕，在【置信區(qū)間百分比】窗口后面輸入95%。單擊【繼續(xù)】，返回配對樣本T檢驗(yàn)對話框。單擊【確定】，提交運(yùn)行。圖6-6 配對樣本T檢驗(yàn)對話框（5）結(jié)果分析。在結(jié)果輸出窗口得到表6-4，由表可知期末與期中平均成績之差的95%的置信區(qū)間是7.53116.1613。表6-4 成對樣本檢驗(yàn)成對差分tdfSig.(雙側(cè))均值標(biāo)準(zhǔn)差均值的標(biāo)準(zhǔn)誤差分的95%置信區(qū)間下限上限對 1期末考試成績 - 期中考試成績11.846210.6832.09527.5310316.161285.65425.0002兩個(gè)總體比例之差的區(qū)間估計(jì)兩個(gè)

21、總體比例之差的置信區(qū)間是由點(diǎn)估計(jì)量加減估計(jì)誤差得到的。根據(jù)樣本比例的抽樣分布可知，從兩個(gè)從兩個(gè)二項(xiàng)分布總體中抽取兩個(gè)獨(dú)立大樣本，則比兩個(gè)樣本比例之差近似服從正態(tài)分布，兩個(gè)樣本比例之差經(jīng)標(biāo)準(zhǔn)化后服從標(biāo)準(zhǔn)正態(tài)分布，即：（6.18）由于兩個(gè)總體比例和通常是未知的，所以用樣本比例和來代替。因此，根據(jù)正態(tài)分布建立的兩個(gè)總體比例之差在置信水平下的置信區(qū)間為：（6.19）3兩個(gè)總體方差比的區(qū)間估計(jì)兩個(gè)樣本方差比服從分布，因此可用分布來構(gòu)造兩個(gè)總體方差之比的置信區(qū)間。建立兩個(gè)總體方差之比的置信區(qū)間，也就是要找到一個(gè)值使其滿足。由于，用它代替后有：（6.20）所以兩個(gè)總體方差之比在置信水平下的置信區(qū)間為

22、：（6.21）圖6-7總結(jié)了兩個(gè)總體參數(shù)估計(jì)所使用的分布的各種情形。待估參數(shù)總體均值差總體比例差總體方差比獨(dú)立大樣本獨(dú)立小樣本Z分布方差已知配對樣本t分布獨(dú)立大樣本F分布Z分布方差未知正態(tài)總體Z分布方差相等方差不等Z分布t分布圖6-7 兩個(gè)總體參數(shù)估計(jì)所使用的分布6.2 假設(shè)檢驗(yàn)6.2.1 假設(shè)檢驗(yàn)的基本原理1什么是假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)是推斷統(tǒng)計(jì)的另一項(xiàng)重要內(nèi)容。在研究問題時(shí)，人們常常要提出一個(gè)自己認(rèn)為正確的看法，即假設(shè)（hypothesis）。統(tǒng)計(jì)學(xué)里的假設(shè)就是對總體參數(shù)具體數(shù)值所作的陳述。例如，假設(shè)北京城市大學(xué)全校學(xué)生的平均英語成績是80分。而假設(shè)檢驗(yàn)（hypothesis test）就是在

23、對總體參數(shù)提出假設(shè)的基礎(chǔ)上，利用樣本信息來判斷假設(shè)是否成立的統(tǒng)計(jì)方法。例如，在假設(shè)北京城市大學(xué)全體學(xué)生英語平均成績是80分的基礎(chǔ)上，抽取一個(gè)班作為樣本，根據(jù)樣本信息檢驗(yàn)全體學(xué)生的英語平均成績是不是80分。假設(shè)檢驗(yàn)包括參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)兩種方法，本章主要介紹參數(shù)檢驗(yàn)，非參數(shù)檢驗(yàn)的內(nèi)容將在第10章介紹。2兩種假設(shè)在假設(shè)檢驗(yàn)中，首先需要提出兩種假設(shè)：原假設(shè)和備擇假設(shè)。（1）原假設(shè)也稱零假設(shè)（null hypothesis），是研究者想收集證據(jù)予以推翻的假設(shè)，用表示。原假設(shè)的含義是指參數(shù)沒有變化或變量之間沒有關(guān)系，因此等號總是放在原假設(shè)上。例如，假設(shè)總體平均數(shù)為，則原假設(shè)是，或。（2）備擇假設(shè)也稱研

24、究假設(shè)（alternative hypothesis），是研究者想收集證據(jù)予以支持的假設(shè)，用表示。備擇假設(shè)的含義是指參數(shù)發(fā)生了變化或變量之間有某種關(guān)系，因此不等號總是放在備擇假設(shè)上。例如，假設(shè)總體平均數(shù)為，則備擇假設(shè)是，或。（3）原假設(shè)和備擇假設(shè)的關(guān)系原假設(shè)和備擇假設(shè)是一個(gè)完備事件組，且相互對立，所以在一項(xiàng)假設(shè)檢驗(yàn)中，原假設(shè)和備擇假設(shè)必有且只有一個(gè)成立。通常我們先確定備擇假設(shè)，再確定原假設(shè)，因?yàn)閭鋼窦僭O(shè)是我們想支持、證實(shí)的，而等號總是放在原假設(shè)上。但是由于研究目的不同，對同一問題可能提出不同的假設(shè)，因而也會得出不同的結(jié)論?！纠?-4】消費(fèi)者協(xié)會估計(jì)北京市場上偏好蘋果手機(jī)的消費(fèi)者不足20%，為了

25、驗(yàn)證這一估計(jì)是否正確，消費(fèi)者協(xié)會隨機(jī)抽取了一個(gè)樣本進(jìn)行檢驗(yàn)，則原假設(shè)和備擇假設(shè)應(yīng)該是：（偏好蘋果手機(jī)的消費(fèi)者超過20%）（偏好蘋果手機(jī)的消費(fèi)者不超過20%）【例6-5】韓國一則報(bào)道稱，中國是全球工作時(shí)間最長的國家之一，每年有60萬人過勞死。我國法定工作時(shí)間是每周40個(gè)小時(shí)，為了估計(jì)我國員工的實(shí)際每周工作時(shí)間是否超過40小時(shí)，隨機(jī)抽取一個(gè)樣本，則原假設(shè)和備擇假設(shè)應(yīng)該是：（工作時(shí)間不超過40個(gè)小時(shí)）（工作時(shí)間超過40個(gè)小時(shí)）【例6-6】在一項(xiàng)關(guān)于農(nóng)民工的研究中發(fā)現(xiàn)，相比于男性農(nóng)民工，女性農(nóng)民工的就業(yè)環(huán)境差，工資水平低，為了對這項(xiàng)研究進(jìn)行驗(yàn)證，隨機(jī)抽取一個(gè)樣本，則原假設(shè)和備擇假設(shè)應(yīng)該是：（男性農(nóng)民工

26、工資的平均數(shù)和女性農(nóng)民工工資的平均數(shù)相等）（男性農(nóng)民工工資的平均數(shù)和女性農(nóng)民工工資的平均數(shù)不等）3雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)在假設(shè)檢驗(yàn)中，若備擇假設(shè)具有特定的方向性，并含有符號“>”或“<”的假設(shè)檢驗(yàn)，稱為單側(cè)檢驗(yàn)或單尾檢驗(yàn)（one-tailed test），備擇假設(shè)的方向?yàn)椤?lt;”，稱為左側(cè)檢驗(yàn)，如例6-4，備擇假設(shè)的方向?yàn)椤?gt;”，稱為右側(cè)檢驗(yàn)，如例6-5。如果備擇假設(shè)沒有特定的方向性，并含有符號“¹”的假設(shè)檢驗(yàn)，稱為雙側(cè)檢驗(yàn)或雙尾檢驗(yàn)（two-tailed test），如例6-6。4兩類錯(cuò)誤和顯著性水平第類錯(cuò)誤（type error）是原假設(shè)為正確時(shí)拒絕原假設(shè)，也稱

27、為棄真錯(cuò)誤。我們把犯第類錯(cuò)誤的概率記為，稱為顯著性水平（level of significant）。第類錯(cuò)誤（type error）是原假設(shè)為錯(cuò)誤時(shí)未拒絕原假設(shè)，也稱為取偽錯(cuò)誤。我們把犯第類錯(cuò)誤的概率記為。實(shí)際上，只要拒絕原假設(shè)，就有可能犯第類錯(cuò)誤；只要不拒絕原假設(shè)，就有可能犯第類錯(cuò)誤。換句話說，要減小就會增加，要減小就會增加。要想同時(shí)減小兩類錯(cuò)誤只能增加樣本容量，但是我們也知道想要增加樣本容量有時(shí)是不可能的。所以，對于兩類錯(cuò)誤的控制，主要是依據(jù)哪一類錯(cuò)誤的后果更為嚴(yán)重，就首先控制哪類錯(cuò)誤發(fā)生的概率。由于犯第類錯(cuò)誤的概率是由研究者自己控制的，因此在假設(shè)檢驗(yàn)中，人們往往先控制第類錯(cuò)誤的發(fā)生概率。

28、通常，我們使用的值有0.01，0.05，0.1。5決策依據(jù)（1）用檢驗(yàn)統(tǒng)計(jì)量決策檢驗(yàn)統(tǒng)計(jì)量是根據(jù)樣本變量值計(jì)算得到的對原假設(shè)和備擇假設(shè)做出決策的統(tǒng)計(jì)量。通常使用經(jīng)過標(biāo)準(zhǔn)化的檢驗(yàn)統(tǒng)計(jì)量，即標(biāo)準(zhǔn)化的檢驗(yàn)統(tǒng)計(jì)量，它可以度量點(diǎn)估計(jì)量與原假設(shè)的總體參數(shù)之間的差異。我們把能夠拒絕原假設(shè)的檢驗(yàn)統(tǒng)計(jì)量的所有可能取值的集合稱為拒絕域（rejection region）；將給定的顯著性水平確定的拒絕域的邊界值稱為臨界值（critical value），如圖6-8所示。臨界值臨界值置信水平置信水平臨界值拒絕域0臨界值0拒絕域拒絕域拒絕域0 （a）雙側(cè)檢驗(yàn) （b）左側(cè)檢驗(yàn) （b）右側(cè)檢驗(yàn)圖6-8 顯著性水平、拒絕域與

29、臨界值用檢驗(yàn)統(tǒng)計(jì)量做決策的步驟是：第一步：給定顯著性水平，計(jì)算相應(yīng)的臨界值；第二步：將檢驗(yàn)統(tǒng)計(jì)量的值與水平的臨界值進(jìn)行比較：雙側(cè)檢驗(yàn)：，拒絕；左側(cè)檢驗(yàn)：，拒絕；右側(cè)檢驗(yàn)：，拒絕。（2）用值決策給定顯著性水平是犯第類錯(cuò)誤的上限控制值，但實(shí)際上檢驗(yàn)統(tǒng)計(jì)量落在拒絕域的不同位置時(shí)，犯第類錯(cuò)誤的實(shí)際概率是不一樣的。如果能把犯第類錯(cuò)誤實(shí)際概率計(jì)算出來，就可以根據(jù)這個(gè)概率做出決策。值（probability value method）就是犯第類錯(cuò)誤的真實(shí)概率，也稱為觀察到的（或?qū)崪y的）顯著性水平，它指的是如果原假設(shè)正確，所得到樣本結(jié)果的可能性。如果這個(gè)概率很小，意味著得到這樣的樣本是一個(gè)小概率事件，小概率事

30、件就是一個(gè)幾乎不可能發(fā)生的事件，當(dāng)一個(gè)不可能發(fā)生的小概率事件發(fā)生了，說明原假設(shè)有誤，應(yīng)該拒絕原假設(shè)。在現(xiàn)代統(tǒng)計(jì)學(xué)中，經(jīng)常使用值做決策，它更方便，效果更好。圖6-9描述了值與顯著性水平、拒絕域與臨界值的關(guān)系。【例6-7】檢驗(yàn)北京城市大學(xué)全體學(xué)生英語平均分是否為80分，可提出，。根據(jù)抽樣計(jì)算出的學(xué)生英語成績的平均分為70，p值為0.02，意味著北京城市大學(xué)全體學(xué)生英語平均分真是80分的話，抽中一個(gè)平均數(shù)是70的樣本的概率是0.02?？梢姡粋€(gè)小概率事件發(fā)生了，說明原假設(shè)是有誤，應(yīng)拒絕原假設(shè)。用值做決策的步驟是：第一步：給定顯著性水平；第二步：將檢驗(yàn)統(tǒng)計(jì)量的P值與進(jìn)行比較，若，拒絕。01/2P值1

31、/2P值P值臨界值（b）左側(cè)檢驗(yàn)（c）右側(cè)檢驗(yàn)（a）雙側(cè)檢驗(yàn)臨界值臨界值00臨界值P值圖6-9 P值與顯著性水平、拒絕域與臨界值常用的顯著性水平，如0.01，0.05，0.10，已經(jīng)被人們普遍接受為“拒絕原假設(shè)足夠證據(jù)”的標(biāo)準(zhǔn)，我們大概可以說：0.1代表有“一些證據(jù)”不利于原假設(shè)；0.05代表有“適度證據(jù)”不利于原假設(shè)；0.01代表有“很強(qiáng)證據(jù)”不利于原假設(shè)。6假設(shè)檢驗(yàn)結(jié)論的表述如果樣本提供的證據(jù)可以拒絕原假設(shè)，就說檢驗(yàn)的結(jié)果在統(tǒng)計(jì)上是顯著的，即拒絕原假設(shè)時(shí)結(jié)論是清楚的；如果樣本提供的證據(jù)不能拒絕原假設(shè)，就說檢驗(yàn)的結(jié)果在統(tǒng)計(jì)上不是顯著的。一項(xiàng)檢驗(yàn)在統(tǒng)計(jì)上是“顯著的”的含義是：根據(jù)樣本得到的結(jié)

32、果不是偶然獲得的；“不顯著的”的含義是：根據(jù)樣本得到的結(jié)果是偶然獲得的。需要注意的是，不拒絕原假設(shè)時(shí)，并未給出明確的結(jié)論，沒有足夠證據(jù)拒絕原假設(shè)時(shí)，不采用“接受原假設(shè)”的表述，而采用“不拒絕原假設(shè)”的表述。7假設(shè)檢驗(yàn)的步驟由上述內(nèi)容可知假設(shè)檢驗(yàn)的步驟是：第一步，提出原假設(shè)和備擇假設(shè)；第二步，從所研究的總體中抽出一個(gè)隨機(jī)樣本；第三步，確定一個(gè)適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量，并利用樣本數(shù)據(jù)算其具體數(shù)值及其對應(yīng)的值；第四步，確定一個(gè)適當(dāng)?shù)娘@著性水平，并計(jì)算出其臨界值，確定拒絕域。第五步，將檢驗(yàn)統(tǒng)計(jì)量的值與臨界值進(jìn)行比較，做出決策。若統(tǒng)計(jì)量的值落在拒絕域，拒絕，否則不拒絕。也可以直接將值與比較做出決策，若，拒絕，否

33、則不拒絕。6.2.2 假設(shè)檢驗(yàn)的類型假設(shè)檢驗(yàn)的類型可以分為一個(gè)總體參數(shù)的檢驗(yàn)和兩個(gè)總體參數(shù)的檢驗(yàn)。其中，一個(gè)總體參數(shù)的檢驗(yàn)包括總體平均數(shù)的檢驗(yàn)，總體比例的檢驗(yàn)和總體方差的檢驗(yàn)，如圖6-10所示。兩個(gè)總體參數(shù)的檢驗(yàn)包括兩個(gè)總體平均數(shù)之差的檢驗(yàn)，兩個(gè)總體比例之差的檢驗(yàn)和兩個(gè)總體方差比的檢驗(yàn)，如圖6-11所示。一個(gè)總體參數(shù)總體平均數(shù)總體比例總體方差大樣本小樣本 Z檢驗(yàn)總體方差已知總體方差未知大樣本Z檢驗(yàn)檢驗(yàn) Z檢驗(yàn)T檢驗(yàn)正態(tài)分布圖6-10 一個(gè)總體參數(shù)檢驗(yàn)的方法兩個(gè)總體參數(shù)總體均值差總體比例差總體方差比獨(dú)立樣本配對樣本大樣本小樣本大樣本Z檢驗(yàn)F檢驗(yàn)T檢驗(yàn)正態(tài)分布小樣本Z檢驗(yàn)方差已知方差未知Z檢驗(yàn)T

34、檢驗(yàn)正態(tài)分布圖6-11 兩個(gè)總體參數(shù)檢驗(yàn)的方法6.3 平均數(shù)比較與T檢驗(yàn)在各種假設(shè)檢驗(yàn)的類型中，關(guān)于平均數(shù)的比較和檢驗(yàn)是使用頻率最高的統(tǒng)計(jì)分析方法。雖然T檢驗(yàn)主要用于小樣本情況，但是在SPSS中也可以使用T檢驗(yàn)對大樣本進(jìn)行處理。SPSS中的平均數(shù)比較和T檢驗(yàn)主要包括平均數(shù)分析過程（means），單樣本T檢驗(yàn)（single sample T test），獨(dú)立樣本T檢驗(yàn)（independent samples T test）和配對樣本T檢驗(yàn)（paired samples T test）四種方法。6.3.1 平均數(shù)分析過程平均數(shù)分析過程就是按定類或定序變量進(jìn)行分組，計(jì)算每一組的平均數(shù)、標(biāo)準(zhǔn)差、總和、

35、方差等統(tǒng)計(jì)量，目的在于比較組與組之間的差異。1平均數(shù)分析過程的方法（1）打開卡方檢驗(yàn)對話框單擊【分析】【均值比較】【均值】，打開平均數(shù)分析對話框，如圖6-12所示。圖6-12 平均數(shù)分析對話框（2）選擇分析變量從左側(cè)源變量窗口選擇要分析的數(shù)值型變量進(jìn)入【因變量列表】窗口。（3）確定分組變量從左側(cè)源變量窗口選擇定類或定序變量進(jìn)入【自變量列表】窗口，同時(shí)【下一張】按鈕被激活，可通過【下一張】和【上一張】進(jìn)行分層分析。（4）選擇輸出的統(tǒng)計(jì)量單擊【選項(xiàng)】按鈕，打開平均數(shù)分析選項(xiàng)對話框，如圖6-13。該對話框包括三項(xiàng)內(nèi)容：【統(tǒng)計(jì)量】窗口列出了可供輸出的各種統(tǒng)計(jì)量?！締卧窠y(tǒng)計(jì)量】窗口列出了被選中的要輸出

36、的統(tǒng)計(jì)量，其中平均數(shù)、個(gè)案數(shù)和標(biāo)準(zhǔn)差是默認(rèn)輸出選項(xiàng)。圖6-13 平均數(shù)分析選項(xiàng)對話框【第一層的統(tǒng)計(jì)量】列出了第一層分組的另外兩個(gè)統(tǒng)計(jì)量?！続nova表和eta】表示對分組變量進(jìn)行單因素方差分析；【線性相關(guān)檢驗(yàn)】表示對分組變量進(jìn)行線性相關(guān)檢驗(yàn)。上述操作完成后，單擊【繼續(xù)】返回頻數(shù)分析對話框。再單擊【確定】，提交運(yùn)行。2平均數(shù)分析過程的實(shí)例【例6-8】上市公司高管薪酬.sav是關(guān)于我國上市公司CEO報(bào)酬的數(shù)據(jù)，請計(jì)算：（1）不同教育水平的上市公司CEO年度報(bào)酬均值；（2）不同最終控制人類型的上市公司CEO年度報(bào)酬均值；（3）最終控制人相同，教育水平不同的上市公司CEO年度報(bào)酬均值。（1）單擊【分析

37、】【比較均值】【均值】，打開平均數(shù)分析對話框，如圖6-所示。（2）從左側(cè)源變量框選擇變量CEO年度報(bào)酬（comp）進(jìn)入【因變量列表】框。（3）從左側(cè)源變量窗口選擇變量CEO教育水平（edu）和最終控制人類型（control）進(jìn)入【自變量列表】窗口。（4）單擊【選項(xiàng)】按鈕，打開平均數(shù)分析選項(xiàng)對話框，選擇【均值】和【個(gè)案數(shù)】，如圖4-4所示。單擊【繼續(xù)】返回頻數(shù)分析對話框。單擊【確定】，提交運(yùn)行。（5）再重復(fù)（1）（2）和（3）步，將變量最終控制人類型（control）選入【自變量列表】后單擊【下一張】，再將變量CEO教育水平（edu）選入【自變量列表】。單擊【確定】，提交運(yùn)行。（6）結(jié)果分析。在

38、結(jié)果輸出窗口得到如下圖表：觀察表6-5可知不同教育水平的CEO年度報(bào)酬均值；觀察表6-6可知不同最終控制人類型的CEO年度報(bào)酬均值。表6-5 不同教育水平CEO年度報(bào)酬均值CEO年度報(bào)酬CEO教育水平均值Ndimension1中專及以下637685.7114大專425678.35106本科534140.11316碩士599334.67485博士667137.0171總計(jì)565405.06992表6-6 不同最終控制人類型CEO年度報(bào)酬均值CEO年度報(bào)酬最終控制人類型均值Ndimension1國有549411.14633非國有593606.05359總計(jì)565405.06992表6-7報(bào)告了最終

39、控制人相同，教育水平不同的CEO年度報(bào)酬均值，由表可知國有和非國有的不同教育水平的CEO年度報(bào)酬均值有較大差異。表6-7 最終控制人相同，教育水平不同的CEO年度報(bào)酬均值CEO年度報(bào)酬最終控制人類型CEO教育水平均值Ndimension1國有dimension2中專及以下931928.577大專408496.0259本科506591.57196碩士574677.32329博士685516.6442總計(jì)549411.14633非國有dimension2中專及以下343442.867大專447247.6747本科579136.07120碩士651336.38156博士640518.2429總計(jì)59

40、3606.05359總計(jì)dimension2中專及以下637685.7114大專425678.35106本科534140.11316碩士599334.67485博士667137.0171總計(jì)565405.069926.3.2 單樣本T檢驗(yàn) 1單樣本T檢驗(yàn)的基本原理單樣本T檢驗(yàn)是通過計(jì)算出的樣本平均數(shù)來估計(jì)總體平均數(shù)是否為某個(gè)確定的值，即檢驗(yàn)樣本平均數(shù)能否推斷總體平均數(shù)?；蛘哂脕頇z驗(yàn)?zāi)硞€(gè)變量的平均數(shù)是否與給定的平均數(shù)是否有顯著差異。單樣本T檢驗(yàn)的步驟是：第一步：提出原假設(shè)和備擇假設(shè)。；。第二步：選擇顯著性水平，可以是90%，95%或99%。第三步：根據(jù)計(jì)算出的值（即SPSS中的Sig）與進(jìn)行比

41、較，做出判斷：若，拒絕原假設(shè)；若，不拒絕原假設(shè)。2單樣本T檢驗(yàn)的方法（1）打開卡方檢驗(yàn)對話框單擊【分析】【均值比較】【單樣本T檢驗(yàn)】，打開單樣本T檢驗(yàn)對話框，如圖6-14所示。圖6-14 單樣本T檢驗(yàn)對話框（2）選擇分析變量從左側(cè)源變量窗口選擇要分析的數(shù)值型變量進(jìn)入【檢驗(yàn)變量】窗口。（3）確定待檢參數(shù)在【檢驗(yàn)值】后面的窗口輸入檢驗(yàn)值。（4）確定置信水平和缺失值的處理方法單擊【選項(xiàng)】對話框，打開選項(xiàng)對話框，如圖6-15所示?！局眯艆^(qū)間百分比】窗口后面可輸入置信水平。圖6-15 單樣本T檢驗(yàn)選項(xiàng)對話框【缺失值】中【按分析順序排除個(gè)案】是只剔除分析變量為缺失值的個(gè)案；【按列表排除個(gè)案】是剔除任何含有

42、缺失值的個(gè)案。上述操作完成后，單擊【繼續(xù)】返回單樣本T檢驗(yàn)分析對話框。再單擊【確定】，提交運(yùn)行。3單樣本T檢驗(yàn)的實(shí)例【例6-9】根據(jù)人力資源社會保障部會同財(cái)政部、國資委發(fā)布的關(guān)于進(jìn)一步規(guī)范中央企業(yè)負(fù)責(zé)人薪酬管理的指導(dǎo)意見規(guī)定上市公司高管報(bào)酬不得超過在崗職工平均工資的20倍，國家統(tǒng)計(jì)局2011年5月5日公布的2010年全國城鎮(zhèn)非私營單位在崗職工年平均工資為37147元，請檢驗(yàn)?zāi)壳拔覈鴩猩鲜泄镜母吖軋?bào)酬是否符合這一規(guī)定。（1）使用個(gè)案的篩選，將國有控股上市公司的樣本挑選出來。（2）單擊【分析】【均值比較】【單樣本T檢驗(yàn)】，打開單樣本T檢驗(yàn)對話框，如圖6-14所示。（3）從左側(cè)源變量窗口選擇CE

43、O年度報(bào)酬（comp）進(jìn)入【檢驗(yàn)變量】窗口。（4）在【檢驗(yàn)值】后面的窗口輸入檢驗(yàn)值742940。單擊【確定】，提交運(yùn)行。（5）結(jié)果分析。在結(jié)果輸出窗口得到如下圖表：表6-8報(bào)告了CEO年度報(bào)酬的均值、標(biāo)準(zhǔn)差和均值的標(biāo)準(zhǔn)誤。表6-8 單個(gè)樣本統(tǒng)計(jì)量N均值標(biāo)準(zhǔn)差均值的標(biāo)準(zhǔn)誤CEO年度報(bào)酬633549411.14455164.42618091.162表6-9報(bào)告了單個(gè)樣本T檢驗(yàn)的結(jié)果，由T值是-10.697，顯著性水平為0，可知CEO年度報(bào)酬的均值與742940有顯著差異，有樣本均值是549411.14可知上市公司高管報(bào)酬沒有超過在職職工工資的20倍，所以目前我國國有上市公司的高管報(bào)酬符合國家相關(guān)規(guī)

44、定。表6-9 單個(gè)樣本檢驗(yàn)檢驗(yàn)值 = 742940 tdfSig.(雙側(cè))均值差值差分的 95% 置信區(qū)間下限上限CEO年度報(bào)酬-10.697632.000-193528.861-229054.92-158002.806.3.3 獨(dú)立樣本T檢驗(yàn)1獨(dú)立樣本T檢驗(yàn)的基本原理獨(dú)立樣本T檢驗(yàn)是檢驗(yàn)兩個(gè)獨(dú)立樣本的平均數(shù)是否有顯著差異的一種方法。獨(dú)立樣本T檢驗(yàn)的步驟是：第一步：提出原假設(shè)和備擇假設(shè)。；。第二步：選擇顯著性水平，可以是90%，95%或99%。第三步：根據(jù)計(jì)算出的值（即SPSS中的Sig）與進(jìn)行比較，做出判斷：若，拒絕原假設(shè)；若，不拒絕原假設(shè)。2獨(dú)立樣本T檢驗(yàn)的方法（1）打開卡方檢驗(yàn)對話框單擊

45、【分析】【均值比較】【獨(dú)立樣本T檢驗(yàn)】，打開獨(dú)立樣本T檢驗(yàn)對話框，如圖6-16所示。圖6-16 獨(dú)立樣本T檢驗(yàn)對話框（2）選擇分析變量從左側(cè)源變量窗口選擇要分析的數(shù)值型變量進(jìn)入【檢驗(yàn)變量】窗口。（3）確定分組變量從左側(cè)源變量窗口選擇要分析的定類或定序變量進(jìn)入【檢驗(yàn)變量】窗口?！径x組】按鈕被激活。（4）確定分組變量的取值單擊【定義組】按鈕，打開確定分組對話框，如圖6-17所示。對話框提供了兩種分組方式：選擇【使用指定組】方式，在【組1】和【組2】窗口后分別輸入定類或定序變量的兩個(gè)值，即根據(jù)兩個(gè)值確定的兩個(gè)個(gè)樣本進(jìn)行T檢驗(yàn)。圖6-17 確定分組對話框選擇【割點(diǎn)】方式，在其后的窗口輸入一個(gè)值作為分

46、界點(diǎn)，根據(jù)分界點(diǎn)將樣本分成兩個(gè)組，大于等于該數(shù)值的為一組，小于該數(shù)值的兩組，然后對這兩組進(jìn)行T檢驗(yàn)。（5）確定置信水平和缺失值的處理方法與單樣本T檢驗(yàn)一致，不再贅述。上述操作完成后，單擊【繼續(xù)】返回獨(dú)立樣本T檢驗(yàn)分析對話框。再單擊【確定】，提交運(yùn)行。3獨(dú)立樣本T檢驗(yàn)的實(shí)例【例6-10】使用上市公司高管薪酬.sav數(shù)據(jù)，檢驗(yàn)教育水平是大專和博士的上市公司CEO年度報(bào)酬均值是否有顯著差異？（1）單擊【分析】【均值比較】【獨(dú)立樣本T檢驗(yàn)】，打開獨(dú)立樣本T檢驗(yàn)對話框，如圖6-16所示。（2）從左側(cè)源變量窗口選擇變量CEO年度報(bào)酬（comp）進(jìn)入【檢驗(yàn)變量】窗口。（3）從左側(cè)源變量窗口選擇變量CEO教育

47、水平（edu）進(jìn)入【檢驗(yàn)變量】窗口。（4）單擊【定義組】按鈕，打開確定分組對話框，選擇【使用指定組】方式，在【組1】和【組2】窗口后分別輸入2和5，單擊【繼續(xù)】返回獨(dú)立樣本T檢驗(yàn)分析對話框。再單擊【確定】，提交運(yùn)行。（5）結(jié)果分析。在結(jié)果輸出窗口得到如下圖表：表6-10報(bào)告了教育水平是大專和博士的CEO年度報(bào)酬的樣本數(shù)、平均數(shù)、標(biāo)準(zhǔn)差、均值的標(biāo)準(zhǔn)誤。表6-10 組統(tǒng)計(jì)量CEO教育水平N均值標(biāo)準(zhǔn)差均值的標(biāo)準(zhǔn)誤CEO年度報(bào)酬dimension1大專59408496.02375714.42848913.852博士42685516.64372758.29057517.853表6-11報(bào)告了獨(dú)立樣本T檢

48、驗(yàn)的結(jié)果。首先根據(jù)Levene檢驗(yàn)得到F值0.101和顯著性水平0.751判斷出方差相等。再根據(jù)第一行數(shù)據(jù)中的T值-3.65和顯著性水平0可知教育水平是大專和博士的CEO年度報(bào)酬的均值有顯著差異。表6-11 獨(dú)立樣本T檢驗(yàn)方差方程的 Levene檢驗(yàn)均值方程的t檢驗(yàn)FSig.tdfSig.(雙側(cè))均值差值標(biāo)準(zhǔn)誤差值差分的95%置信區(qū)間下限上限CEO年度報(bào)酬假設(shè)方差相等.101.751-3.6599.000-277020.6375605.56-427038.46-127002.79假設(shè)方差不相等-3.6788.89.000-277020.6375504.10-427048.35-126992.9

49、06.3.4 配對樣本T檢驗(yàn)1配對樣本T檢驗(yàn)的基本原理配對樣本T檢驗(yàn)是檢驗(yàn)兩個(gè)配對樣本前后兩次平均數(shù)是否有顯著差異。配對樣本T檢驗(yàn)的步驟是：第一步：提出原假設(shè)和備擇假設(shè)。；。第二步：選擇顯著性水平，可以是90%，95%或99%。第三步：根據(jù)計(jì)算出的值（即SPSS中的Sig）與進(jìn)行比較，做出判斷：若，拒絕原假設(shè)；若，不拒絕原假設(shè)。2配對樣本T檢驗(yàn)的方法（1）打開卡方檢驗(yàn)對話框單擊【分析】【均值比較】【配對樣本T檢驗(yàn)】，打開配對樣本T檢驗(yàn)對話框，如圖6-18所示。圖6-18 配對樣本T檢驗(yàn)對話框（2）選擇分析變量從左側(cè)源變量窗口選擇兩個(gè)配對變量進(jìn)入【成對變量】窗口。（5）確定置信水平和缺失值的處

50、理方法與單樣本T檢驗(yàn)一致，不再贅述。上述操作完成后，單擊【繼續(xù)】返回獨(dú)立樣本T檢驗(yàn)分析對話框。再單擊【確定】，提交運(yùn)行。3配對樣本T檢驗(yàn)的實(shí)例【例6-11】數(shù)據(jù)英語成績.sav是北京城市大學(xué)某班期中和期末的英語考試成績。在期中考試后，教師根據(jù)學(xué)生的考試成績發(fā)現(xiàn)了教學(xué)中存在的一些問題，及時(shí)調(diào)整了教學(xué)方法，請檢驗(yàn)學(xué)生的期中和期末成績是否有顯著差異？（1）單擊【分析】【均值比較】【配對樣本T檢驗(yàn)】，打開配對樣本T檢驗(yàn)對話框，如圖6-18所示。（2）從左側(cè)源變量窗口選擇變期末考試成績（score2）和期中考試成績（score1）進(jìn)入【成對變量】窗口。單擊【確定】，提交運(yùn)行。（3）結(jié)果分析。在結(jié)果輸出窗口得到如下圖表：表6-12報(bào)告了期末考試成績和期中考試成績的均值、樣本數(shù)、標(biāo)準(zhǔn)差和均值的標(biāo)準(zhǔn)誤。表6-12 成對樣本統(tǒng)計(jì)量均

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

第6章參數(shù)檢驗(yàn)

文檔簡介

溫馨提示

最新文檔

評論

第6章 參數(shù)檢驗(yàn)

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔

第6章參數(shù)檢驗(yàn)