




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第四章均值比較與均值比較與T T檢驗檢驗主要內(nèi)容主要內(nèi)容4.1 假設(shè)檢驗假設(shè)檢驗4.2 平均值分析平均值分析4.3 單樣本單樣本T檢驗檢驗4.4 獨立樣本獨立樣本T檢驗檢驗4.5配對樣板配對樣板T檢驗檢驗4.1 假設(shè)檢驗假設(shè)檢驗點估計簡介點估計簡介1.基本概念基本概念 點估計用樣本統(tǒng)計量的值直接作為總體參數(shù)的估計值。如用樣本均值直接作為總體均值的估計值,用樣本方差直接作為總體方差的估計值等。2.2.常用的點估計方法常用的點估計方法(1)矩估計法(2)極大似然估計法(3)穩(wěn)健估計法4.1 假設(shè)檢驗假設(shè)檢驗區(qū)間估計簡介區(qū)間估計簡介 因為點估計直接用樣本估計值作為總體參數(shù)的估計值,沒有提供關(guān)于估計精
2、度的任何信息,存在抽樣標準誤差,故提出了未知參數(shù)的區(qū)間估計法。 給出兩個數(shù),指出總體參數(shù)以一定概率位于兩數(shù)所確定的區(qū)間內(nèi),這種估計叫做參數(shù)的區(qū)間估計。區(qū)間估計是在點估計的基礎(chǔ)上,給出總體參數(shù)估計的一個范圍,所以區(qū)間估計相對于點估計更加精確,要優(yōu)于點估計。4.1 統(tǒng)計推斷與假設(shè)檢驗統(tǒng)計推斷與假設(shè)檢驗SPSS實例分析實例分析【例例4 4-1-1】 從一個正態(tài)總體中隨機抽取容量為8的樣本,各樣本值分別為10,8,12,15,6,13,5,11;求總體均值在95%的置信區(qū)間。分析:分析:這是一個求總體均值的區(qū)間估計問題,進行總體均值的區(qū)間估計可以采用探索分析或單樣本T檢驗,本例中采用探索分析,具體分析
3、步驟同例4-3。4.1假設(shè)檢驗假設(shè)檢驗基本概念及統(tǒng)計原理基本概念及統(tǒng)計原理1.1.統(tǒng)計假設(shè)統(tǒng)計假設(shè)原假設(shè):原假設(shè):被檢驗的假設(shè),通過檢驗可能被接受,也可能被否定;在很多情況下,我們給出一個統(tǒng)計假設(shè)僅僅是為了拒絕它。例如,如果我們要判斷給定的一枚硬幣是否均勻,則假設(shè)硬幣是均勻的(即p=0.5,其中p是正面出現(xiàn)的概率);類似地,如果我們要判斷一種方法是否優(yōu)于其他的方法,則假設(shè)兩種方法之間沒有差異。這樣的假設(shè)通常稱為零假設(shè)或原假設(shè),記為 。備擇假設(shè):備擇假設(shè):與原假設(shè)對應的假設(shè),只有在原假設(shè)被否定后才可接受的假設(shè);例如,如果零假設(shè)是 ,則備擇假設(shè)是 。備擇假設(shè)記為 。拒絕域、臨界點:拒絕域、臨界點:
4、當檢驗統(tǒng)計量取某個區(qū)域中的值時,拒絕原假設(shè),則稱該取值區(qū)域為拒絕域,稱拒絕域的邊界點為臨界點。0.5p 0.5p 1H0H4.1 假設(shè)檢驗假設(shè)檢驗基本概念及統(tǒng)計原理基本概念及統(tǒng)計原理2.2.顯著性水平與置信水平顯著性水平與置信水平顯著性水平顯著性水平: :在作假設(shè)檢驗時,我們犯第一類錯誤的最大概率稱為檢驗的顯著性水平。這個概率常記為,通常抽樣前就指定好,這樣得到的結(jié)果才不會影響我們的選擇。 在實際問題中,顯著性水平可以有多種選擇,但最為普通的是0.05或0.01。例如,如果設(shè)計一個決策法則選擇的顯著性水平是0.05(5%),那么在100次中可能有5次機會使我們拒絕本該接受的假設(shè)。也就是說,我們
5、大約有95%的把握作出正確的決策。此時,我們說拒絕假設(shè)的顯著性水平為0.05,即犯拒絕本應接受的假設(shè)這類錯誤的概率是0.05。置信水平:置信水平:1- 為置信度或置信水平;4.1 假設(shè)檢驗假設(shè)檢驗基本概念及統(tǒng)計原理基本概念及統(tǒng)計原理3.3.假設(shè)檢驗的兩類錯誤假設(shè)檢驗的兩類錯誤第一類錯誤:第一類錯誤:在假設(shè)檢驗中拒絕了本來是正確的原假設(shè)。第二類錯誤:第二類錯誤:在假設(shè)檢驗中沒有拒絕錯誤的原假設(shè)。4 4概率概率P P值值 P值是當原假設(shè)正確時,觀測到的樣本信息出現(xiàn)的概率。通常用P值與預先設(shè)定的顯著性水平值比較,若P值小于顯著性水平,則認為該概率值足夠小,應拒絕原假設(shè)。5 5單側(cè)檢驗與雙側(cè)檢驗單側(cè)檢
6、驗與雙側(cè)檢驗雙側(cè)檢驗雙側(cè)檢驗:只強調(diào)差異而不強調(diào)方向性的檢驗叫雙側(cè)檢驗。單側(cè)檢驗:單側(cè)檢驗:強調(diào)某一方向的檢驗叫單側(cè)檢驗。4.1 假設(shè)檢驗假設(shè)檢驗小概率事件原理小概率事件原理 在概率論中我們把發(fā)生概率小到接近于0的事件稱為小概率事件(即在大量重復試驗中出現(xiàn)的頻率非常低)。 在統(tǒng)計學上,把小概率事件看成在一次特定的抽樣中不可能發(fā)生的事件,稱為“小概率事件實際不可能原理”。這是統(tǒng)計學上進行假設(shè)檢驗(顯著性檢驗)的基本依據(jù)。根據(jù)這一原理,若某事件在理論上被認為在原假設(shè)成立的情況下是個小概率事件,它不會出現(xiàn),而在實際中出現(xiàn)了,我們就推翻原來的假設(shè),認為原假設(shè)不成立,從而接受備擇假設(shè)。4.1 假設(shè)檢驗假
7、設(shè)檢驗假設(shè)檢驗的一般步驟假設(shè)檢驗的一般步驟第第1 1步步 給出檢驗問題的原假設(shè);給出檢驗問題的原假設(shè); 根據(jù)檢驗問題的要求,將需要檢驗的最終結(jié)果作為零假設(shè)。例如,需要檢驗某學校的高考數(shù)學平均成績是否同往年的平均成績一樣,都為75,由此可做出零假設(shè),第第2 2步步 選擇檢驗統(tǒng)計量;選擇檢驗統(tǒng)計量; 在統(tǒng)計推斷中,總是通過構(gòu)造樣本的統(tǒng)計量并計算統(tǒng)計量的概率值進行推斷,一般構(gòu)造的統(tǒng)計量應服從或近似服從常用的已知分布,例如均值檢驗中最常用的t分布和F分布等。 第第3 3步步 規(guī)定顯著性水平規(guī)定顯著性水平; ;0:75H4.1 假設(shè)檢驗假設(shè)檢驗假設(shè)檢驗的一般步驟假設(shè)檢驗的一般步驟第第4 4步步 計算檢驗
8、統(tǒng)計量的觀測值及其發(fā)生的概率值;計算檢驗統(tǒng)計量的觀測值及其發(fā)生的概率值; 在給定零假設(shè)前提下,計算統(tǒng)計量的觀測值和相應概率p值。概率p值就是在零假設(shè) 成立時檢驗統(tǒng)計量的觀測值發(fā)生的概率,該概率值間接地給出了樣本值在零假設(shè)成立的前提下的概率,對此可以依據(jù)一定的標準來判斷其發(fā)生的概率是否為小概率。4.1 假設(shè)檢驗假設(shè)檢驗假設(shè)檢驗的一般步驟假設(shè)檢驗的一般步驟第第5 5步步 在給定顯著性水平條件下,做出統(tǒng)計推斷結(jié)果。在給定顯著性水平條件下,做出統(tǒng)計推斷結(jié)果。 這里的顯著性水平指的是當假設(shè)正確時被拒絕的概率,即棄真概率,一般取0.01或0.05。當檢驗統(tǒng)計量的概率p值小于顯著性水平時,則認為此時拒絕零假
9、設(shè)而犯棄真錯誤的概率小于顯著性水平,即低于預先給定的水平,也就是說犯錯誤的概率小到我們能容忍的范圍,這時可以拒絕零假設(shè);反之,如果檢驗統(tǒng)計量的概率p值大于顯著性水平,如果拒絕零假設(shè),犯棄真錯誤的概率大于預先給定的容忍水平,這時不應該拒絕零假設(shè)。 4.1 假設(shè)檢驗假設(shè)檢驗參數(shù)檢驗簡介參數(shù)檢驗簡介 參數(shù)檢驗的總體分布形式是已知的或假定的,只是一些參數(shù)的取值或范圍未知,分析的主要目的是估計參數(shù)的取值范圍,或?qū)ζ溥M行某種統(tǒng)計檢驗。如正態(tài)總體的均值是否與某個值存在顯著差異,兩個總體的均值是否有顯著差異等。主要包括: 單樣本T檢驗:檢驗單個變量的均值與假設(shè)檢驗值之間是否存在差異; 獨立樣本T檢驗:檢驗兩組
10、來自獨立總體的樣本,其獨立總體的均值或中心位置是否一樣; 配對樣本T檢驗:檢驗兩個相關(guān)的樣本是否來自具有相同均值的總體。 4.1 假設(shè)檢驗假設(shè)檢驗非參數(shù)檢驗簡介非參數(shù)檢驗簡介 非參數(shù)檢驗是在總體分布未知的情況下,利用樣本數(shù)據(jù)對總體分布形態(tài)等進行推斷的方法,在推斷過程中不涉及有關(guān)總體分布的參數(shù),而是檢驗總體某些有關(guān)的性質(zhì),如總體的分布位置、分布形狀之間的比較等。 與參數(shù)檢驗的原理相同,非參數(shù)檢驗過程也是先根據(jù)問題提出原假設(shè),然后利用統(tǒng)計學原理構(gòu)造出適當?shù)慕y(tǒng)計量,最后利用樣本數(shù)據(jù)計算統(tǒng)計量的概率P值,與顯著性水平進行比較,得出拒絕或者接受原假設(shè)的結(jié)論。 非參數(shù)檢驗包括單樣本(O)、獨立樣本(I)、
11、相關(guān)樣本(R)的非參數(shù)檢驗。 4.1 假設(shè)檢驗假設(shè)檢驗參數(shù)檢驗及非參數(shù)檢驗比較參數(shù)檢驗及非參數(shù)檢驗比較 1參數(shù)檢驗和非參數(shù)檢驗的區(qū)別 參數(shù)檢驗和非參數(shù)檢驗最本質(zhì)的區(qū)別是:參數(shù)檢驗需要事先確定或假定總體的分布,非參數(shù)檢驗則不需要假定總體的分布,而是直接用樣本來推斷總體的分布。 除此之外,二者之間還可以從很多方面來區(qū)分。研究的對象和目標不同。 研究的統(tǒng)計量有所不同。 主要內(nèi)容主要內(nèi)容4.1 假設(shè)檢驗假設(shè)檢驗4.2 平均值分析平均值分析 4.3 單樣本單樣本T檢驗檢驗4.4 獨立樣本獨立樣本T檢驗檢驗4.5配對樣板配對樣板T檢驗檢驗與第三章中的“描述統(tǒng)計 ”中計算某一樣本總體均值相比,平均值分析可以
12、對樣本進行分組計算。例 各地區(qū)分性別受教育程度的人口數(shù)量,數(shù)據(jù)見data4-0.sav 4.2 平均值分析平均值分析主要內(nèi)容主要內(nèi)容4.1 假設(shè)檢驗假設(shè)檢驗4.2 平均值分析平均值分析4.3 單樣本單樣本T檢驗檢驗4.4 獨立樣本獨立樣本T檢驗檢驗4.5配對樣板配對樣板T檢驗檢驗 4.3 單樣本單樣本T檢驗檢驗4.3.1 基本概念及統(tǒng)計原理基本概念及統(tǒng)計原理1.單樣本單樣本T檢驗的概念檢驗的概念 單樣本T檢驗利用來自某總體的樣本數(shù)據(jù),推斷該總體的均值與指定的檢驗值之間是否存在顯著性差異,它是對總體均值的假設(shè)檢驗。 為此,給出檢驗均值 ,原假設(shè): = ,其中 為總體均值,即認為總體均值與檢驗值
13、之間無顯著性差異。 。 例如,從新生的入學成績的抽樣數(shù)據(jù)推斷平均成績是否為75分;在人口普查中,某地區(qū)職工今年的平均收入是否和往年的平均收入有顯著差異。0004.3 單樣本單樣本T檢驗檢驗4.3.1 基本概念及統(tǒng)計原理基本概念及統(tǒng)計原理2.單樣本單樣本T檢驗的檢驗統(tǒng)計量檢驗的檢驗統(tǒng)計量 單樣本T檢驗的前提是總體服從正態(tài)分布 ,其中 為總體均值, 為總體方差。如果樣本容量為n,樣本均值為 ,則 仍服從正態(tài)分布,即: 。 在零假設(shè)成立的條件下,均值檢驗使用t統(tǒng)計量,構(gòu)造的t統(tǒng)計量為: 其中, 用 代入,t統(tǒng)計量服從自由度為n-1的t分布,S為樣本標準差。 在給定原假設(shè)的前提下,SPSS將檢驗值代入
14、t統(tǒng)計量,得到檢驗統(tǒng)計量觀測值,以及根據(jù)T分布的分布函數(shù)計算出的概率P值。 2( ,)N 2XX2( ,)XNn/XtSn04.3 單樣本單樣本T檢驗檢驗4.3.1 基本概念及統(tǒng)計原理基本概念及統(tǒng)計原理3.單樣本單樣本T檢驗的步驟檢驗的步驟 在給定樣本來自正態(tài)總體的假設(shè)下,單樣本T檢驗作為假設(shè)檢驗的一種方法,其基本步驟與假設(shè)檢驗的步驟是一樣的。 4.3 單樣本單樣本T檢驗檢驗4.3.2 單樣本單樣本T檢驗檢驗SPSS實例分析實例分析 【例4-2】 某生產(chǎn)食鹽的生產(chǎn)線,其生產(chǎn)的袋裝食鹽的標準質(zhì)量為500 g,現(xiàn)隨機抽取10袋,其質(zhì)量分別為495 g,502 g,510 g,497 g,506 g
15、,498 g,503 g,492 g,504 g,501 g。假設(shè)數(shù)據(jù)呈正態(tài)分布,請檢驗生產(chǎn)線的工作情況。分析分析: :這是一個典型的比較樣本均值和總體均值的T檢驗問題 ;第1步 數(shù)據(jù)組織:數(shù)據(jù)組織:首先建立SPSS數(shù)據(jù)文件,只需建立一個變量“Weight”,錄入相應的數(shù)據(jù)即可,建立的數(shù)據(jù)文件存入文件data4-1.sav中。 4.3 單樣本單樣本T檢驗檢驗4.3.2 單樣本單樣本T檢驗檢驗SPSS實例分析實例分析 第第2步步 單樣本單樣本T檢驗分析設(shè)置檢驗分析設(shè)置選擇菜單“分析比較均值單樣本T檢驗(S)”,打開 “單樣本T檢驗” 對話框,將變量“weight”移入”檢驗變量”列表框,并輸入檢
16、驗值500;打開“單樣本T檢驗:選項”對話框 ,設(shè)置置信區(qū)間為95%(缺省為95%); 4.3 單樣本單樣本T檢驗檢驗4.3.2 單樣本單樣本T檢驗檢驗SPSS實例分析實例分析 第第3步步 主要結(jié)果及分析主要結(jié)果及分析:單樣本統(tǒng)計量表 單樣本T檢驗結(jié)果表 N均值標準差均值的標準誤weight10500.80005.391351.70489檢驗值 = 500tdfSig(雙側(cè))均值差值差分的 95% 置信區(qū)間下限上限weight.4699.650.800003.05674.6567本例置信水平為95%,顯著性水平為0.05,從上表中可以看出,雙尾檢測概率P值為0.650,大于0.05,故原假設(shè)成
17、立,也就是說,抽樣袋裝食鹽的質(zhì)量與500克無顯著性差異,有理由相信生產(chǎn)線工作狀態(tài)正常 下表給出了單樣本T檢驗的描述性統(tǒng)計量,包括樣本數(shù)(N)、均值、標準差、均值的標準誤。 主要內(nèi)容主要內(nèi)容4.1 假設(shè)檢驗假設(shè)檢驗4.2 平均值分析平均值分析4.3 單樣本單樣本T檢驗檢驗4.4 獨立樣本獨立樣本T檢驗檢驗4.5配對樣板配對樣板T檢驗檢驗4.4 獨立樣本獨立樣本T檢驗檢驗4.4.1 基本概念及統(tǒng)計原理基本概念及統(tǒng)計原理1. 獨立樣本獨立樣本T檢驗的概念檢驗的概念 單樣本T檢驗是檢驗樣本均值和總體均值是否有顯著性差異,而兩獨立樣本T檢驗的目的是利用來自某兩個總體的獨立樣本,推斷兩個總體的均值是否存在
18、顯著差異。其原假設(shè)H0為 ,即假設(shè)兩總體均值相等,備擇假設(shè)為 ,即假設(shè)兩總體均值不等。 例如,為比較兩種牧草對奶牛的飼養(yǎng)效果,隨機從奶牛群中選取喂養(yǎng)不同牧草的奶牛各10頭記錄每日平均產(chǎn)奶的量,根據(jù)記錄的數(shù)據(jù)推斷兩種牧草對奶牛飼養(yǎng)的效果有無顯著性差異。12124.4 獨立樣本獨立樣本T檢驗檢驗4.4.1 基本概念及統(tǒng)計原理基本概念及統(tǒng)計原理2獨立樣本獨立樣本T檢驗的檢驗統(tǒng)計量檢驗的檢驗統(tǒng)計量 獨立樣本T檢驗的前提是兩個獨立的總體分別服從 和 和 。在零假設(shè)成立的條件下,獨立樣本T檢驗使用t統(tǒng)計量。構(gòu)造獨立樣本T檢驗的t統(tǒng)計量分為兩種情況。1)當樣本方差相等時,t統(tǒng)計量定義為:其中 和 分別為兩樣
19、本容量, , 和 分別為兩樣本標準差。該統(tǒng)計量服從自由度為 的t分布。 2(,)xxN2(,)yyN 121212()11XXtSnn1n2n1S2S122nn222112212(1)(1)2nSnSSnn4.4 獨立樣本獨立樣本T檢驗檢驗4.4.1 基本概念及統(tǒng)計原理基本概念及統(tǒng)計原理2獨立樣本獨立樣本T檢驗的檢驗統(tǒng)計量檢驗的檢驗統(tǒng)計量 2)當樣本方差不等時,t統(tǒng)計量定義為: 可見,獨立樣本T檢驗的結(jié)論在很大程度上取決于兩個總體的方差是否相等。這就要求在檢驗兩總體均值是否相等之前,首先應對兩總體方差是否相等進行檢驗,也稱之為方差齊性檢驗。 1212221212()XXtSSnn4.4 獨立樣
20、本獨立樣本T檢驗檢驗4.4.1 基本概念及統(tǒng)計原理基本概念及統(tǒng)計原理3.方差齊性檢驗方法方差齊性檢驗方法 利用Levene F方差齊性檢驗方法檢驗兩總體方差是否存在顯著差異;首先提出原假設(shè);執(zhí)行檢驗過程中,若概率p 值小于給定的顯著性水平(一般為0.05),則拒絕原假設(shè),認為兩個總體的方差不等;否則認為兩個總體的方差無顯著性差異。4. 獨立樣本獨立樣本T檢驗的一般步驟檢驗的一般步驟 在兩樣本來自正態(tài)總體且相互獨立的假設(shè)下,獨立樣本T檢驗作為假設(shè)檢驗的一種方法,其基本步驟與假設(shè)檢驗的步驟是一樣的。 4.4 獨立樣本獨立樣本T檢驗檢驗4.4.2 獨立樣本獨立樣本T檢驗檢驗SPSS實例分析實例分析
21、【例4-3】為比較兩種不同品種的玉米的產(chǎn)量,分別統(tǒng)計了8個地區(qū)的單位面積產(chǎn)量,具體數(shù)據(jù)見表5.8。假定樣本服從正態(tài)分布,且兩組樣本相互獨立,試比較在置信度為95%的情況下,兩種玉米產(chǎn)量是否有顯著性差異。 4.4 獨立樣本獨立樣本T檢驗檢驗4.4.2 獨立樣本獨立樣本T檢驗檢驗SPSS實例分析實例分析 第第1步步 數(shù)據(jù)組織數(shù)據(jù)組織: 在SPSS數(shù)據(jù)文件中建立兩個變量,分別為“品種”、“產(chǎn)量”,度量標準分別為“名義”、“度量”,變量“品種”的值標簽為:a品種A,b品種B,錄入數(shù)據(jù)后,保存名為data4-2.sav的SPSS數(shù)據(jù)文件;第第2步步 獨立樣本獨立樣本T檢驗設(shè)置檢驗設(shè)置:選擇菜單 “選擇比
22、較均值獨立樣本T檢驗”,打開“獨立樣本T檢驗”對話框,將“產(chǎn)量” 作為要進行T檢驗的變量,將“品種”字段作為分組變量,定義分組變量的兩個分組分別為“a”和“b”。 打開“獨立樣本T檢驗:選項”對話框,具體選項內(nèi)容及設(shè)置與單樣本T檢驗相同。 4.4 獨立樣本獨立樣本T檢驗檢驗4.4.2 基本概念及統(tǒng)計原理基本概念及統(tǒng)計原理第第3步步 運行結(jié)果及分析:運行結(jié)果及分析:獨立樣本獨立樣本T檢驗的基本描述統(tǒng)計量檢驗的基本描述統(tǒng)計量 玉米品種N均值標準差均值的標準誤單位面積產(chǎn)量品種A881.250011.804964.17368品種B875.750010.024973.54436 上表給出了本例獨立樣本T
23、檢驗的基本描述統(tǒng)計量,包括兩個樣本的均值、標準差和均值的標準誤。 4.4 獨立樣本獨立樣本T檢驗檢驗4.4. 基本概念及統(tǒng)計原理基本概念及統(tǒng)計原理獨立樣本獨立樣本T檢驗結(jié)果表檢驗結(jié)果表 獨立樣本檢驗獨立樣本檢驗方差方程方差方程的的 Levene Levene 檢驗檢驗均值方程的均值方程的 t t 檢驗檢驗F FSigSig. .t tdfdfSig.Sig.( (雙雙側(cè)側(cè)) )均值均值差值差值標準誤標準誤差值差值差分的差分的 95% 95% 置置信區(qū)間信區(qū)間下限下限上限上限單位面積單位面積產(chǎn)量產(chǎn)量假設(shè)方差相假設(shè)方差相等等.10.104 4.75.752 21.001.004 41414.332
24、.3325.5005.50000005.475605.47560- -6.24396.24398 817.24317.2439898假設(shè)方差不假設(shè)方差不相等相等1.001.004 413.6413.642 2.333.3335.5005.50000005.475605.47560- -6.27296.27297 717.27217.2729797 根據(jù)上表“方差方程的 Levene 檢驗”中的sig.為0.752,遠大于設(shè)定的顯著性水平0.05,故本例兩組數(shù)據(jù)方差相等。在方差相等的情況下,獨立樣本T檢驗的結(jié)果應該看上表中的“假設(shè)方差相等”一行,第5列為相應的雙尾檢測概率(Sig.(雙側(cè))為0.
25、332,在顯著性水平為0.05的情況下,T統(tǒng)計量的概率p值大于0.05,故不應拒絕零假設(shè),,即認為兩樣本的均值是相等的,在本例中,不能認為兩種玉米品種的產(chǎn)量有顯著性差異。 主要內(nèi)容主要內(nèi)容4.1 假設(shè)檢驗假設(shè)檢驗4.2 平均值分析平均值分析4.3 單樣本單樣本T檢驗檢驗4.4 獨立樣本獨立樣本T檢驗檢驗4.5配對樣板配對樣板T檢驗檢驗4.5 配對樣本配對樣本T檢驗檢驗4.5.1 基本概念及統(tǒng)計原理基本概念及統(tǒng)計原理1配對樣本T檢驗的概念 配對樣本T檢驗用于檢驗兩個相關(guān)樣本是否來自相同均值的正態(tài)總體,即推斷兩個總體的均值是否存在顯著差異。其零假設(shè)為 ,其中 和 分別為第一個總體和第二個總體的均值
26、。 配對的概念是指兩個樣本的各樣本值之間存在著對應關(guān)系,配對樣本的兩個樣本值之間的配對是一一對應的,并且兩個樣本的容量相同。配對樣本T檢驗與獨立樣本T檢驗的差別之一是要求樣本是配對的。所謂配對樣本可以是個案在“前”、“后”兩種狀態(tài)下某屬性的兩種狀態(tài),也可以是對某事物兩個不同側(cè)面或方面的描述。其差別在于抽樣不是相互獨立的,而是互相關(guān)聯(lián)的。012:0H124.5 配對樣本配對樣本T檢驗檢驗4.5.1 基本概念及統(tǒng)計原理基本概念及統(tǒng)計原理2配對樣本T檢驗的數(shù)學思想配對樣本T檢驗須求出每對觀測值之差,所有樣本值的觀測值之差形成一個新的單樣本,顯然,如果兩個樣本的均值沒有顯著差異,則樣本值之差的均值應該
27、接近零,這實際上轉(zhuǎn)換成了一個單樣本的T檢驗。所以,配對樣本T檢驗就是檢驗差值所來自的總體其均值是否為零,這就要求差值來自的總體服從正態(tài)分布。 4.5 配對樣本配對樣本T檢驗檢驗4.5.1 基本概念及統(tǒng)計原理基本概念及統(tǒng)計原理3配對樣本T檢驗的檢驗統(tǒng)計量 在配對樣本T檢驗中,設(shè) 、 分別為配對樣本。其樣本差值 ,此時檢驗統(tǒng)計量為:其中 為 的均值,S為 的標準差,n為樣本數(shù),當 時,t統(tǒng)計量服從自由度為2n-2的t分布。 1ix2(1)ix in 12iiidxx12()/dtSndidid1204.5 配對樣本配對樣本T檢驗檢驗4.5.2 4.5.2 配對樣本配對樣本T T檢驗檢驗SPSSSP
28、SS實例分析實例分析【例4-4】以下是某大學跆拳道選手15人的平衡訓練的數(shù)據(jù),統(tǒng)計實驗前、后平衡訓練成績是否有差異。訓練前:86,77,59,79,90,68,85,94,66,72,75,72,69,85,88訓練后:78,81,76,92,88,76,93,87,62,84,87,95,88,87,80第第1步步 數(shù)據(jù)組織:數(shù)據(jù)組織:首先建立SPSS數(shù)據(jù)文件,建立兩個變量:“訓練前”、“訓練后”,錄入相應數(shù)據(jù)。第第2步步 配對樣本配對樣本T檢驗設(shè)置:檢驗設(shè)置: 選擇菜單“分析比較均值配對樣本T檢驗”,彈出“配對樣本T檢驗”對話框,同時選中“訓練前”及“訓練后”字段,將其加入“成對變量“列表
29、框;打開“選項”對話框,指定置信水平和缺失值的處理方法;具體方法在前面已有講述,可以參考前文4.5 配對樣本配對樣本T檢驗檢驗4.5.2 4.5.2 配對樣本配對樣本T T檢驗檢驗SPSSSPSS實例分析實例分析第第3步步 運行結(jié)果及分析:運行結(jié)果及分析:配對樣本T檢驗的基本描述統(tǒng)計量配對樣本相關(guān)性檢驗成對樣本統(tǒng)計量成對樣本統(tǒng)計量均值均值N N標準差標準差均值的標準誤均值的標準誤對對 1 1訓練前訓練前77.6777.67151510.10410.1042.6092.609訓練后訓練后83.6083.6015158.4338.4332.1772.177成對樣本相關(guān)系數(shù)成對樣本相關(guān)系數(shù)N N相關(guān)
30、系數(shù)相關(guān)系數(shù)Sig.Sig.對對 1 1訓練前訓練前 & & 訓練后訓練后1515.407.407.132.132 左表是配對樣本T檢驗的簡單相關(guān)關(guān)系檢驗結(jié)果。表中顯示訓練前和訓練后兩樣本的相關(guān)系數(shù)為0.407,相關(guān)系數(shù)的檢驗P值為0.132顯著性水平,接受原假設(shè),可以認為訓練前后的成績沒有明顯的線性關(guān)系。4.5 配對樣本配對樣本T檢驗檢驗4.5.2 4.5.2 配對樣本配對樣本T T檢驗檢驗SPSSSPSS實例分析實例分析第第3步步 運行結(jié)果及分析:運行結(jié)果及分析:配對樣本T檢驗結(jié)果 上表是配對樣本T檢驗的最終結(jié)果。sig.(雙側(cè))為雙尾檢驗概率p值在置信水平為95%時,顯著
31、性水平為0.05,由于概率p值為0.041,小于0.05,拒絕零假設(shè),可以認為訓練前后對成績有顯著效果。成對樣本檢驗成對樣本檢驗成對差分成對差分t tdfdfSig.(Sig.(雙側(cè)雙側(cè)) )均值均值標準標準差差均值的標準均值的標準誤誤差分的差分的 95% 95% 置信置信區(qū)間區(qū)間下限下限上限上限對對 1 1訓練前訓練前 - - 訓練訓練后后- -5.935.933 310.1810.187 72.6302.630- -11.57511.575-.292-.292- -2.2562.2561414.041.041主要內(nèi)容主要內(nèi)容4.1 參數(shù)估計參數(shù)估計4.2 假設(shè)檢驗假設(shè)檢驗4.3 參數(shù)檢驗與
32、非參數(shù)檢驗參數(shù)檢驗與非參數(shù)檢驗4.4 單樣本單樣本T檢驗檢驗4.5 獨立樣本獨立樣本T檢驗檢驗4.6 配對樣板配對樣板T檢驗檢驗4.7 單樣本的非參數(shù)檢驗單樣本的非參數(shù)檢驗 4.7 單樣本的非參數(shù)檢驗單樣本的非參數(shù)檢驗4 4.7.1 .7.1 基本概念及統(tǒng)計原理基本概念及統(tǒng)計原理 單樣本非參數(shù)檢驗使用一個或多個非參數(shù)檢驗方法來識別單個總體的分布情況,不需要待檢驗的數(shù)據(jù)呈正態(tài)分布。 SPSS的單樣本非參數(shù)檢驗方法包括卡方檢驗、二項分布檢驗、游程檢驗、K-S檢驗及Wilcoxon符號檢驗五種。 在SPSS 19中,所有單樣本的非參數(shù)檢驗有一些共同的設(shè)置。單樣本非參數(shù)檢驗的對話框有三個選項卡,分別為
33、“目標”、“字段”和“設(shè)置”,具體設(shè)置如下: 4.7 單樣本的非參數(shù)檢驗單樣本的非參數(shù)檢驗4 4.7.1 .7.1 基本概念及統(tǒng)計原理基本概念及統(tǒng)計原理(1)“目標”選項卡:用于設(shè)置非參數(shù)檢驗的目標,每個不同的選項對應于“設(shè)置”選項卡上不同的默認配置,如下圖所示。 4.7 單樣本的非參數(shù)檢驗單樣本的非參數(shù)檢驗4 4.7.1 .7.1 基本概念及統(tǒng)計原理基本概念及統(tǒng)計原理(2)“字段”選項卡:用于設(shè)定待檢驗變量。 4.7 單樣本的非參數(shù)檢驗單樣本的非參數(shù)檢驗4 4.7.1 .7.1 基本概念及統(tǒng)計原理基本概念及統(tǒng)計原理(3)“設(shè)置”選項卡:用于設(shè)定檢驗方法及對應的選項,如下圖所示。4.7 單樣本
34、的非參數(shù)檢驗單樣本的非參數(shù)檢驗4 4.7.2 .7.2 卡方檢驗卡方檢驗1卡方檢驗的概念 也稱卡方擬合優(yōu)度檢驗,它是K.Pearson給出的一種最常用的非參數(shù)檢驗方法,用于檢驗觀測數(shù)據(jù)是否與某種概率分布的理論數(shù)值相符合,進而推斷觀測數(shù)據(jù)是否是來自于該分布的樣本的問題。 4.7 單樣本的非參數(shù)檢驗單樣本的非參數(shù)檢驗4 4.7.2 .7.2 卡方檢驗卡方檢驗1卡方檢驗的概念 也稱卡方擬合優(yōu)度檢驗,它是K.Pearson給出的一種最常用的非參數(shù)檢驗方法,用于檢驗觀測數(shù)據(jù)是否與某種概率分布的理論數(shù)值相符合,進而推斷觀測數(shù)據(jù)是否是來自于該分布的樣本的問題。2統(tǒng)計原理 為檢驗實際分布是否與理論分布(期望分
35、布一致),可采用卡方統(tǒng)計量,典型的卡方統(tǒng)計量是Pearson卡方統(tǒng)計量,其公式為: 221()kiiiinnpnp 4.7 單樣本的非參數(shù)檢驗單樣本的非參數(shù)檢驗4 4.7.2 .7.2 卡方檢驗卡方檢驗3.分析步驟第第1 1 步步 提出零假設(shè):提出零假設(shè):卡方檢驗的零假設(shè)H0是“總體服從某種理論分布”,其對立假設(shè)H1是“總體不服從某種理論分布”。第第2 2步步 選擇檢驗統(tǒng)計量:選擇檢驗統(tǒng)計量:卡方分布選擇的是Pearson卡方統(tǒng)計量。已證明,當n充分大時,它近似地服從自由度為k-1的卡方分布。第第3 3步步 計算檢驗統(tǒng)計量的觀測值和概率計算檢驗統(tǒng)計量的觀測值和概率p p值。值。第第4 4步步
36、給出顯著性水平,作出決策。給出顯著性水平,作出決策。 4.7 單樣本的非參數(shù)檢驗單樣本的非參數(shù)檢驗4 4.7.2 .7.2 卡方檢驗卡方檢驗4卡方檢驗SPSS實例分析【例4-5】 某公司質(zhì)檢負責人欲了解企業(yè)一年內(nèi)出現(xiàn)的次品數(shù)是否均勻分布在一周的五個工作日中,隨機抽取了90件次品的原始記錄,其結(jié)果如下表,問該企業(yè)一周內(nèi)出現(xiàn)的次品數(shù)是否均勻分布在一周的五個工作日中?( ) 0.05工作日12345次品數(shù)2515816264.7 單樣本的非參數(shù)檢驗單樣本的非參數(shù)檢驗4 4.7.2 .7.2 卡方檢驗卡方檢驗第第1 1步步 分析:分析:由于考慮的是次品是否服從均勻分布的問題,故用卡方檢驗。第第2 2步
37、步 數(shù)據(jù)組織數(shù)據(jù)組織:建立SPSS數(shù)據(jù)文件,建立兩個變量:“工作日”、“次品數(shù)”,錄入相應數(shù)據(jù),保存為文件data4-4.sav。第第3 3步步 “ “次品數(shù)次品數(shù)”字段加權(quán)處理:字段加權(quán)處理:通過分析“工作日”及“次品數(shù)”兩個字段的含義及度量標準,確定“工作日”為被分析字段,而“次品數(shù)”表示各工作日出現(xiàn)的頻數(shù),所以應該對“次品數(shù)”進行加權(quán)處理。執(zhí)行“數(shù)據(jù)”“加權(quán)個案”,打開“加權(quán)個案”對話框,按圖4-10所示進行設(shè)置。 4.7 單樣本的非參數(shù)檢驗單樣本的非參數(shù)檢驗4 4.7.2 .7.2 卡方檢驗卡方檢驗第第4 4步步 單因素的非參數(shù)檢驗設(shè)置:單因素的非參數(shù)檢驗設(shè)置:選擇菜單“分析非參數(shù)檢驗
38、單樣本”,在“目標”選項卡選擇“自定義分析”;在“字段”選項卡中選擇“使用定制字段分配”,并將“工作日”字段選入“檢驗字段”;“設(shè)置”選項卡中選擇“自定義檢驗”,并選中“比較觀察可能性和假設(shè)可能性(卡方檢驗)”,“檢驗選項”及“用戶缺失值”保持默認選項。第第5 5步步 卡方檢驗的選項設(shè)置:卡方檢驗的選項設(shè)置:打開“卡方檢驗選項”對話框,選擇” 所有類別概率相等(V)“選項。 4.7 單樣本的非參數(shù)檢驗單樣本的非參數(shù)檢驗4 4.7.2 .7.2 卡方檢驗卡方檢驗第第6 6步步 運行結(jié)果及分析運行結(jié)果及分析:卡方檢驗的假設(shè)檢驗數(shù)據(jù)摘要 給出了卡方檢驗給出了卡方檢驗的原假設(shè)為的原假設(shè)為“工作日的工作
39、日的類別以相同的概率發(fā)類別以相同的概率發(fā)生生”,其,其相伴概率值相伴概率值Sig. = 0.014 0.05,說明應說明應拒絕原假設(shè)拒絕原假設(shè),因此圖,因此圖5-12的的“決策者決策者”給出給出“拒絕原假設(shè)拒絕原假設(shè)”的決策,的決策,認為工作日的類別是以認為工作日的類別是以不同概率發(fā)生的,即認不同概率發(fā)生的,即認為為該企業(yè)一周內(nèi)出現(xiàn)的該企業(yè)一周內(nèi)出現(xiàn)的次品數(shù)次品數(shù)不不是均勻分布在是均勻分布在一周的五個工作日中一周的五個工作日中。 4 4.7.3 .7.3 二項分布檢驗二項分布檢驗1基本概念基本概念二項分布檢驗正是要通過樣本數(shù)據(jù)檢驗樣本來自的總體是否服從指定的概率為p的二項分布,其零假設(shè)H0是:
40、樣本來自的總體與指定的二項分布無顯著性差異。2統(tǒng)計原理二項分布檢驗在樣本小于等于30時,按下式計算概率值: 1xiin iniP XxC p q4.7 單樣本的非參數(shù)檢驗單樣本的非參數(shù)檢驗4.7 單樣本的非參數(shù)檢驗單樣本的非參數(shù)檢驗4 4.7.3 .7.3 二項分布檢驗二項分布檢驗在大樣本的情況下,計算的是Z統(tǒng)計量,認為在零假設(shè)下,Z統(tǒng)計量服從正態(tài)分布,其計算公式如下: 0.5(1)xnpZnpp 當x小于n/2時,取加號;反之取減號,p為檢驗概率,n為樣本總數(shù)。4.7 單樣本的非參數(shù)檢驗單樣本的非參數(shù)檢驗4 4.7.3 .7.3 二項分布檢驗二項分布檢驗3分析步驟分析步驟 二項分布檢驗亦是假
41、設(shè)檢驗問題,檢驗步驟同前。SPSS會自動計算上述精確概率和近似概率值。如果概率值小于顯著性水平,則拒絕零假設(shè),認為樣本來自的總體與指定的二項分布有顯著差異,反之樣本來自的總體與指定的二項分布無顯著差異。 4.7 單樣本的非參數(shù)檢驗單樣本的非參數(shù)檢驗4 4.7.3 .7.3 二項分布檢驗二項分布檢驗SPSSSPSS實例分析實例分析【例4-7】有20名學生經(jīng)過新型教學法后測試成績?nèi)缦卤?,?0分及以上為優(yōu)秀,請檢驗這20名同學的優(yōu)秀率是否達到了10%。 成績 78 75 84 76 89 93 94 88 95 87 88 73 84 82 80 84 87 91 95 83第第1步步 分析:分析
42、:由于成績分為優(yōu)秀與非優(yōu)秀兩種狀態(tài),故應用二項分布檢驗。第第2步步 數(shù)據(jù)的組織:數(shù)據(jù)的組織:數(shù)據(jù)分成一列,其變量名為“成績”,輸入數(shù)據(jù)并保存。4.7 單樣本的非參數(shù)檢驗單樣本的非參數(shù)檢驗4 4.7.3 .7.3 二項分布檢驗二項分布檢驗SPSSSPSS實例分析實例分析 第第3步步 單因素的非參數(shù)檢驗設(shè)置:單因素的非參數(shù)檢驗設(shè)置:選擇菜單“分析非參數(shù)檢驗單樣本”:將“目標”選項卡選擇“自定義分析”;在“字段”選項卡中選擇“使用定制字段分配”,并將“成績”字段選入“檢驗字段”;在“設(shè)置”選項卡中選擇“自定義檢驗”,并選中“比較觀察二分類可能性和假設(shè)可能性(二項式檢驗)(O)”,“檢驗選項”及“用戶
43、缺失值”保持默認選項;第第4步步 進行二項分布檢驗選項設(shè)置:進行二項分布檢驗選項設(shè)置:打開“二項式選項”對話框,設(shè)置“假設(shè)比例”為0.9,選擇“定義連續(xù)字段的成功值”中的“定制割點”選項,并設(shè)置割點為99。4.7 單樣本的非參數(shù)檢驗單樣本的非參數(shù)檢驗 4 4.7.3 .7.3 二項分布檢驗二項分布檢驗SPSSSPSS實例分析實例分析第第5步步 主要結(jié)果及分析:主要結(jié)果及分析:二項式假設(shè)檢驗數(shù)據(jù)摘要 單尾檢測的相伴概率Sig.=0.0430.05,因此應拒絕零假設(shè),即小于90分的學生所占的比例與總體分布存在顯著差異,即小于90分的學生所占比例比90%小。這說明優(yōu)秀學生所占的比重是大于10%的。4.7 單樣本的非參數(shù)檢驗單樣本的非參數(shù)檢驗4 4.7.4 .7.4 游程檢驗游程檢驗 1基本概念 一 個游程(Run)就是某序列中位于一種符號之前或之后的另一種符號持續(xù)的最大主序列,或者說,一個游程是指某序列中同類元素的一個持續(xù)的最大主集。 主要用于檢驗一個變量兩個值的分布是否呈隨機分布,即檢驗前一個個案是否影響下一個個案的值,如果沒有影響,這一組個案便是隨機的。 例如,30次擲硬幣出現(xiàn)正反面的序列為000011100000110000011111100000
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030工業(yè)鍋爐市場發(fā)展現(xiàn)狀調(diào)查及供需格局分析預測報告
- 甘肅省平?jīng)鍪嗅轻紖^(qū)2024屆中考一模數(shù)學試題含解析
- 廣東省高州市謝雞鎮(zhèn)達標名校2023-2024學年中考數(shù)學最后沖刺模擬試卷含解析
- 2025年企業(yè)負責人安全培訓考試試題及答案 完整
- 2025生產(chǎn)經(jīng)營單位安全培訓考試試題含答案可下載
- 2024-2025公司、項目部、各個班組三級安全培訓考試試題【模擬題】
- 2024-2025項目部安全管理人員安全培訓考試試題附完整答案(全優(yōu))
- 2024-2025安全標準化安全培訓考試試題【名校卷】
- 2025車間員工安全培訓考試試題及參考答案【B卷】
- 2025承包商入廠安全培訓考試試題含答案【預熱題】
- 2024年四川西南石油大學招聘事業(yè)編制輔導員考試真題
- 2025年證券從業(yè)資格證考試題庫試題及答案
- 管道工程安全管理與保障措施考核試卷
- 豬場出售合同協(xié)議
- 電瓶車充電安全培訓講義
- 雨季行車安全教育
- 2024-2025學年人教版八年級地理下學期全冊教案
- 人教版數(shù)學六年級下冊4.3.2圖形的放大與縮小練習卷含答案
- 《教育系統(tǒng)重大事故隱患判定指南》解讀
- 灌溉排水工程項目可行性研究報告編制
- 公益發(fā)展面試題及答案
評論
0/150
提交評論