版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第七章第七章SPSS非參數(shù)檢驗12024/5/7本章內(nèi)容7.1單樣本的非參數(shù)檢驗7.2兩獨立樣本的非參數(shù)檢驗7.3多獨立樣本的非參數(shù)檢驗7.4兩配對樣本的非參數(shù)檢驗7.5多配對樣本的非參數(shù)檢驗22024/5/7非參數(shù)檢驗非參數(shù)檢驗:(1)在總體分布未知或知道甚少的情況下,利用樣本數(shù)據(jù)對總體分布形態(tài)等進行推斷的方法。(2)推斷過程中不涉及有關(guān)總體分布的參數(shù)。32024/5/77.1單樣本的非參數(shù)檢驗
1.目的:樣本來自總體的分布是否與某個已知的分布相吻合?—繪制樣本數(shù)據(jù)的直方圖、pp圖、QQ圖判斷—粗略—通過非參數(shù)檢驗—精確2.單樣本非參數(shù)檢驗(1)對單個總體的分布形態(tài)等進行推斷(2)方法:卡方檢驗、二項分布檢驗、K-S檢驗、變量值隨機性檢驗等。42024/5/77.1.1總體分布的卡方檢驗1.基本思想-吻合性檢驗(1)原假設(shè):樣本來自的總體分布與期望分布無顯著差異。變量值落入第i個子集中的理論概率為,相應(yīng)的期望頻率為
52024/5/72.實現(xiàn)步驟分析-非參數(shù)檢驗-舊對話框-卡方檢驗62024/5/7(1)選定待檢驗的變量到“檢驗變量列表”框(2)在“期望全距”欄中確定參與分析的觀測值的范圍:從數(shù)據(jù)中獲取:所有觀測數(shù)據(jù)都參與分析使用指定的范圍:只在該取值范圍內(nèi)的觀測數(shù)據(jù)才參與分析。(3)期望值:給出各理論值所有類別相等:所有子集的頻數(shù)都相同值:依次輸入值,通過【添加】、【更改】、【刪除】進行增加、修改和刪除。72024/5/73.應(yīng)用案例醫(yī)學研究表明心臟病人猝死人數(shù)與日期的關(guān)系為:一周內(nèi),星期一猝死者較多,其他日子基本相當,各天的比例近似為:2.8:1:1:1:1:1:1根據(jù)“心臟病猝死”數(shù)據(jù),推斷總體分布是否與理論分布相吻合。分析:利用總體分布卡方檢驗實現(xiàn)。82024/5/77.1.2二項分布檢驗1.基本思想(1)通過樣本數(shù)據(jù)檢驗樣本來自的總體是否服從指定概率p的二項分布。(2)小樣本-精確檢驗大樣本-近似檢驗92024/5/72.實現(xiàn)步驟
分析-非參數(shù)檢驗-舊對話框-二項式102024/5/7(1)選定待檢驗的變量到“檢驗變量列表”框(2)定義二分法:指定如何分類從數(shù)據(jù)中獲取:檢驗變量為二值變量割點:輸入具體數(shù)值,大于等于該值的為第一組,大于該組的為第二組(3)檢驗比例:輸入二項分布的檢驗概率值112024/5/73.應(yīng)用案例利用“產(chǎn)品合格率”數(shù)據(jù),推斷該批產(chǎn)品的一級品率是否為90%分析:產(chǎn)品合格與否屬于二值變量,可以通過二項分布檢驗實現(xiàn)。122024/5/77.1.3單樣本K-S檢驗1.基本思想(1)以俄羅斯數(shù)學家柯爾莫哥和斯米諾夫名字命名(2)利用樣本數(shù)據(jù)推斷樣本來自的總體是否服從某一理論分布,是一種擬合優(yōu)度的檢驗方法,適用于探索連續(xù)型隨機變量的分布。(3)步驟①計算各樣本觀測值在理論分布中出現(xiàn)的理論累計概率值F(x)②計算各樣本觀測值的實際累計概率值S(x)③計算理論累計概率值與實際累計概率值的差D(x)④計算差值序列中最大絕對差值D132024/5/7(4)原假設(shè)成立時:①小樣本下:D~kolmogorov分布②大樣本下:近似服從K(x)分布③SPSS僅給出大樣本下的和對應(yīng)的p值(5)決策①D統(tǒng)計量的p值<顯著性水平,拒絕原假設(shè),樣本來自的總體與指定分布有顯著差異②D統(tǒng)計量的p值>顯著性水平,不拒絕原假設(shè),樣本來自的總體與指定分布無顯著差異142024/5/72.實現(xiàn)步驟
分析-非參數(shù)檢驗-舊對話框-1單樣本K-S152024/5/7(1)選定待檢驗的變量到“檢驗變量列表”框(2)檢驗分布:選擇理論分布
①常規(guī):正態(tài)分布
②相等:均勻分布
③泊松:泊松分布
④指數(shù)分布:指數(shù)分布162024/5/73.應(yīng)用案例利用“兒童身高”數(shù)據(jù)分析周歲兒童身高總體是否服從正態(tài)分布。分析:可以通過單樣本K-S檢驗實現(xiàn)。172024/5/77.1.4變量值隨機性檢驗1.基本思想(1)通過對樣本變量值的分析,實現(xiàn)對總體的變量值出現(xiàn)是否隨機進行檢驗。(2)原假設(shè):總體變量值出現(xiàn)是隨機的。①檢驗依據(jù):游程-樣本序列中連續(xù)出現(xiàn)相同的變量值的次數(shù)。②游程數(shù)太大或太小都表明變量值存在不隨機的現(xiàn)象182024/5/7(3)檢驗統(tǒng)計量(4)決策:Z統(tǒng)計量的p值<顯著性水平,拒絕原假設(shè),變量值的出現(xiàn)不是隨機的。Z統(tǒng)計量的p值>顯著性水平,不拒絕原假設(shè),變量值的出現(xiàn)是隨機的。192024/5/72.實現(xiàn)步驟
分析-非參數(shù)檢驗-舊對話框-游程202024/5/7(1)選定待檢驗的變量到“檢驗變量列表”框(2)割點:計算游程數(shù)的分界值
①中位數(shù):樣本中位數(shù)為分界值
②眾數(shù):樣本眾數(shù)為分界值
③均值:樣本均值為分界值
④設(shè)定:以用戶輸入的值為分界值,SPSS將小于該分界值的所有變量作為一組,大于或等于該分界值的所有變量作為一組,計算游程。212024/5/73.應(yīng)用案例利用“電纜數(shù)據(jù)”推斷耐壓設(shè)備的工作是否正常。分析:①若耐壓數(shù)據(jù)的變動是隨機的-則設(shè)備工作正常②若耐壓數(shù)據(jù)的變動不是隨機的-則設(shè)備工作存在不正常③可以通過變量值隨機性檢驗實現(xiàn)。222024/5/77.2兩獨立樣本的非參數(shù)檢驗(1)獨立樣本:在一個總體中隨機抽樣對在另一個總體中隨機抽樣沒有影響的情況下所獲得的樣本。(2)推斷樣本來自的兩個總體的分布等是否存在顯著差異。(3)方法:曼-惠特尼U檢驗、K-S檢驗、W-W游程檢驗、極端反應(yīng)檢驗等。232024/5/77.2.1兩獨立樣本的曼-惠特尼U檢驗1.基本思想(1)原假設(shè):兩組獨立樣本來自的兩總體分布無顯著差異。(2)通過兩組樣本平均秩的研究實現(xiàn)推斷
秩-變量值排序的名次,變量值有幾個,對應(yīng)的秩便有幾個。(3)檢驗步驟①將兩組樣本混合并升序排列,得每個數(shù)據(jù)的秩②分別對樣本X和Y的秩求平均,得平均秩和③計算樣本X優(yōu)于樣本Y秩的個數(shù)和樣本Y優(yōu)于樣本X秩的個數(shù)④依據(jù)和計算WilcoxonW統(tǒng)計量和曼-惠特尼U統(tǒng)計量。242024/5/7WilcoxonW統(tǒng)計量:曼-惠特尼統(tǒng)計量U為:大樣本下,U近似服從正態(tài)分布252024/5/7262024/5/77.2.2兩獨立樣本的K-S檢驗1.基本思想(1)原假設(shè):兩組獨立樣本來自的兩總體的分布無顯著差異。(2)與單樣本K-S檢驗的基本思路大體一致,差別在于:以變量值的秩為分析對象,而非變量值本身。(3)檢驗步驟①將兩組樣本混合并按升序排列②分別計算兩組樣本秩的累計頻數(shù)和累計頻率③計算兩組累計頻率的差,得秩的差值序列及D統(tǒng)計量④SPSS計算大樣本下的和對應(yīng)的p值(3)決策::拒絕原假設(shè),兩總體的分布有顯著差異:不拒絕原假設(shè),兩總體的分布無顯著差異
272024/5/7282024/5/77.2.3兩獨立樣本的游程檢驗1.基本思想(1)原假設(shè):兩組獨立樣本來自的兩總體的分布無顯著差異。(2)檢驗步驟①將兩組樣本混合并按升序排列,組標記值也隨之重新排列②計算組標記值序列的游程數(shù)③根據(jù)游程數(shù)計算Z統(tǒng)計量,Z統(tǒng)計量近似服從正態(tài)分布(3)決策::拒絕原假設(shè),兩總體的分布有顯著差異:不拒絕原假設(shè),兩總體的分布無顯著差異292024/5/77.2.4極端反應(yīng)檢驗1.基本思想(1)原假設(shè):兩獨立樣本來自的兩個總體的分布無顯著差異。(2)一組樣本為控制樣本,一組樣本為實驗樣本,看實驗樣本相對于控制樣本是否出現(xiàn)了極端反應(yīng)。(3)檢驗步驟①兩組樣本混合按升序排列②求控制樣本的最小秩和最大秩③計算跨度④為了消除樣本數(shù)據(jù)中的極端值,計算跨度前可按比例(通常5%)去除控制樣本中靠近兩端的樣本值,再求跨度,得截頭跨度⑤針對跨度或截頭跨度計算H統(tǒng)計量:302024/5/7小樣本下,H服從Hollander分布,大樣本下,H近似服從正態(tài)分布(4)決策:①H統(tǒng)計量的p值<顯著性水平,拒絕原假設(shè),兩獨立樣本來自的總體分布存在顯著差異②H統(tǒng)計量的p值>顯著性水平,不拒絕原假設(shè),兩獨立樣本來自的總體分布不存在顯著差異312024/5/77.2.5兩獨立樣本非參數(shù)檢驗的步驟分析-非參數(shù)檢驗-舊對話框-2獨立樣本(1)選擇待檢驗的變量到“檢驗變量列表”框(2)分組變量:存放組標志的變量,并通過“定義組”給出兩組的標志值。(3)檢驗類型:選擇相應(yīng)的檢驗方法322024/5/7332024/5/77.2.6應(yīng)用案例利用“使用壽命”數(shù)據(jù),判斷兩種工藝下產(chǎn)品的使用壽命的分布是否存在顯著差異,進而對兩個工藝的優(yōu)劣進行判斷。分析:兩個工藝產(chǎn)品的使用壽命可看作兩獨立樣本,可以通過曼-惠特尼U檢驗、K-S檢驗、W-W游程檢驗、極端反應(yīng)檢驗實現(xiàn)。342024/5/77.3多獨立樣本的非參數(shù)檢驗1.通過分析多組獨立樣本數(shù)據(jù),推斷樣本來自的多個總體的中位數(shù)或分布是否存在顯著差異。2.方法:中位數(shù)檢驗、Kruskal-Wallis檢驗、Jonckheere-Terpstra檢驗。352024/5/77.3.1中位數(shù)檢驗1.基本思想(1)原假設(shè):多個獨立樣本來自的多個總體的中位數(shù)無顯著差異。(2)檢驗步驟①將多組樣本混合升序排列,求混合樣本的中位數(shù)②分別計算各組樣本中大于和小于中位數(shù)的樣本個數(shù),形成列聯(lián)表(p230表7-13)③利用卡方檢驗分析各組樣本來自的總體對中位數(shù)的分布是否一致。362024/5/7(3)決策①卡方統(tǒng)計量的p值<顯著性水平,拒絕原假設(shè),多個獨立樣本來自的多個總體的中位數(shù)存在顯著差異。②卡方統(tǒng)計量的p值>顯著性水平,不拒絕原假設(shè),多個獨立樣本來自的總體的中位數(shù)不存在顯著差異。372024/5/77.3.2多獨立樣本的Kruskal-Wallis檢驗1.基本思想(1)原假設(shè):多個獨立樣本來自的多個總體的分布無顯著差異。(2)是兩獨立樣本曼-惠特尼U檢驗的推廣(3)檢驗步驟①將多組樣本數(shù)據(jù)混合并升序排列,求各變量的秩②考察各組秩的均值是否有顯著差異③各組秩的差異借助方差分析:秩的變差分解為:組間差和組內(nèi)差
a若秩的總變差大部分可由組間差解釋,則各樣本組的總體分布存在顯著差異
b若秩的總變差大部分不能由組間差解釋,則各樣本組的總體分布無顯著差異382024/5/7④構(gòu)造K-W統(tǒng)計量(4)決策:SPSS自動計算K-W統(tǒng)計量和對應(yīng)的p值
①p值<顯著性水平,拒絕原假設(shè),多個獨立樣本來自的多個總體分布存在顯著差異。
②p值>顯著性水平,不拒絕原假設(shè),多個獨立樣本來自的多個總體分布無顯著差異。392024/5/77.3.3多獨立樣本的Jonckheere-Terpstra檢驗1.基本思想(1)原假設(shè):多個獨立樣本來自的多個總體的分布無顯著差異(2)J-T統(tǒng)計量402024/5/7(3)決策:SPSS自動計算J-T統(tǒng)計量,Z統(tǒng)計量和對應(yīng)的p值
①p值<顯著性水平,拒絕原假設(shè),多個獨立樣本來自的多個總體分布存在顯著差異;
②p值>顯著性水平,不拒絕原假設(shè),多個獨立樣本來自的多個總體分布無顯著差異。412024/5/77.3.4多獨立樣本非參數(shù)檢驗的步驟1.按規(guī)定的格式組織數(shù)據(jù):設(shè)置兩個變量分別存放樣本值和組標記值2.菜單:分析-非參數(shù)-舊對話框-K獨立樣本(1)選擇待檢驗的變量到“檢驗變量列表”框(2)分組變量:存放組標志的變量,并通過“定義組”給出標志值的取值范圍。(3)檢驗類型:選擇相應(yīng)的檢驗方法422024/5/7432024/5/77.3.5應(yīng)用案例利用“多城市兒童身高”數(shù)據(jù),對北京、上海、成都、廣州四城市的周歲兒童身高進行比較分析,推斷四城市周歲兒童身高是否存在顯著差異。分析:(1)對身高分布無確切把握,涉及多個獨立樣本采采用多獨立樣非參數(shù)檢驗(2)分別用中位數(shù)檢驗、多獨立樣本的Kruskal-Wallis檢驗、多獨立樣本的Jonckheere-Terpstra檢驗實現(xiàn)。442024/5/77.4兩配對樣本的非參數(shù)檢驗1.通過兩配對樣本推斷樣本來自的兩個總體的分布是否存在顯著差異。2.方法:McNemar檢驗、符號檢驗、Wilcoxon符號秩檢驗。452024/5/77.4.1兩配對樣本的McNemar檢驗1.基本思想(1)McNemar檢驗是一種變化顯著性檢驗,將研究對象自身作為對照者檢驗其“前后”的變化是否顯著。(2)原假設(shè):兩配對樣本來自的兩總體的分布無顯著差異。(3)分析的變量是二值變量,若不是二值變量,應(yīng)現(xiàn)將數(shù)據(jù)轉(zhuǎn)換后再使用。導致該方法的應(yīng)用范圍具有局限性。(4)McNemar檢驗采用二項分布檢驗方法,小樣本下計算二項分布的累計精確概率,大樣本下采用修正的Z統(tǒng)計量。(5)SPSS自動計算Z統(tǒng)計量和對應(yīng)的p值
①p值<顯著性水平,拒絕原假設(shè),兩配對樣本來自的兩總體分布存在顯著差異
②p值>顯著性水平,不拒絕原假設(shè),兩配對樣本來自的兩總體分布無顯著差異462024/5/77.4.2兩配對樣本的符號檢驗1.基本思想(1)原假設(shè):兩配對樣本來自的兩總體的分布無顯著差異。(2)利用正負符號的個數(shù)實現(xiàn)檢驗。(3)檢驗步驟①分別用第二組樣本的各觀察值減第一組對應(yīng)樣本觀察值,差值為正記為+,差值為負記為-②將+的個數(shù)與-的個數(shù)進行比較:采用二項分布檢驗法,對正負符號變量進行單樣本二項分布檢驗。③小樣本下計算二項分布的累計精確概率,大樣本下采用修正的Z統(tǒng)計量(4)SPSS自動計算Z統(tǒng)計量和對應(yīng)的p值
①p值<顯著性水平,拒絕原假設(shè),兩配對樣本來自的兩總體分布存在顯著差異
②p值>顯著性水平,不拒絕原假設(shè),兩配對樣本來自的兩總體分布無顯著差異(4)缺陷:兩配對樣本的符號檢驗注重對變化方向的分析,只考慮了數(shù)據(jù)變化的性質(zhì),沒有考慮變化的幅度,對數(shù)據(jù)的利用不夠充分。472024/5/77.4.3兩配對樣本W(wǎng)ilcoxon符號秩檢驗1.基本思想(1)原假設(shè):兩配對樣本來自的兩總體的分布無顯著差異。(2)檢驗步驟①分別用第二組樣本的各觀察值減第一組對應(yīng)樣本觀察值,差值為正記為+,差值為負記為-,并保持差值數(shù)據(jù)②將差值變量按升序排列,并求差值變量的秩③分別計算正號秩總和負號秩總和④統(tǒng)計量482024/5/7(3)決策:SPSS自動計算Z統(tǒng)計量和對應(yīng)的p值
①p值<顯著性水平,拒絕原假設(shè),兩配對樣本來自的兩總體分布存在顯著差異
②p值>顯著性水平,不拒絕原假設(shè),兩配對樣本來自的兩總體分布無顯著差異492024/5/77.4.4兩配對樣本非參數(shù)檢驗的步驟1.按規(guī)定的格式組織數(shù)據(jù):設(shè)置兩個變量分別存放兩組樣本的樣本值2.菜單:分析-非參數(shù)檢驗-2相關(guān)樣本(1)選擇待檢驗的兩個配對變量到“檢驗對”框中(2)檢驗類型:選擇相應(yīng)的檢驗方法502024/5/7512024/5/77.4.5應(yīng)用案例1.利用“統(tǒng)計學習”數(shù)據(jù),分析學生在學習“統(tǒng)計學”課程前后對統(tǒng)計學重要性的認知程度是否發(fā)生了顯著改變。分析:(1)統(tǒng)計學習前后,屬于配對樣本(2)認知程度屬二值變量(3)可以采用兩配對樣本McNemar檢驗522024/5/72.利用“訓練成績”數(shù)據(jù),分析新訓練方法是否有助于提高跳遠運動員的成績。分析:(1)新訓練方法使用前后,屬于配對樣本(2)可采用兩配對樣本的符號檢驗、兩配對樣本W(wǎng)ilcoxon符號秩檢驗實現(xiàn)。532024/5/77.5多配對樣本的非參數(shù)檢驗1.通過多組配對樣本推斷樣本來自的多個總體的中位數(shù)或分布是否存在顯著差異。2.方法:Friedman檢驗、CochranQ檢驗、Kendall協(xié)同系數(shù)檢驗。542024/5/77.5.1多配對樣本的Friedman檢驗1.基本思想(1)原假設(shè):多個配對樣本來自的多個總體的分布無顯著差異。(2)原理①利用秩,通過類似方差分析的方法實現(xiàn)檢驗②若不同樣本下的秩不存在顯著差異,則秩的組間差在秩的總平均變差中占較小的比例。(3)檢驗步驟①以行為單位將數(shù)據(jù)升序排列,并求各變量在各自行中的秩②分別計算各組樣本下的秩總和和平均秩552024/5/7③計算Frideman檢驗統(tǒng)計量④Frideman檢驗統(tǒng)計量與多獨立樣本的Kruskal-Wallis檢驗中的K-W統(tǒng)計量相似,區(qū)別在于:⑤K-W統(tǒng)計量中的秩是全體數(shù)據(jù)排序后得到的,F(xiàn)rideman檢驗統(tǒng)計量的秩是在各區(qū)組內(nèi)分別獨立排序得到的。562024/5/7(4)決策:SPSS自動計算Frideman統(tǒng)計量和對應(yīng)的p值
①p值<顯著性水平,拒絕原假設(shè),多配對樣本來自的多個總體分布存在顯著差異
②p值>顯著性水平,不拒絕原假設(shè),多配對樣本來自的多個總體分布無顯著差異(5)適用于定距型數(shù)據(jù)572024/5/77.5.2多配對樣本CochranQ檢驗1.基本思想(1)原假設(shè):多個配對樣本來自的多個總體的分布無顯著差異(2)適用于對二值品質(zhì)型數(shù)據(jù)進行檢驗。(3)CochranQ檢驗統(tǒng)計量582024/5/7(4)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年國際私人民間貿(mào)易協(xié)議樣式
- 2024年期企業(yè)互保反擔保協(xié)議樣本
- 2024年企業(yè)勞動協(xié)議范本要點
- 2024廣告影片拍攝場地使用協(xié)議
- DB11∕T 1570-2018 甜瓜設(shè)施栽培技術(shù)規(guī)程
- 2024年鋼材供應(yīng)協(xié)議鋼筋條款詳本
- 2024年適用場地租賃協(xié)議模板
- 不銹鋼欄桿建設(shè)施工服務(wù)協(xié)議2024
- 2024年定制銷售受托管理協(xié)議
- 2024年度特定物資委托采購合作協(xié)議
- 中國心血管病報告2023
- 結(jié)婚審批報告表
- 2022江蘇交通控股有限公司校園招聘試題及答案解析
- 裝配式建筑預(yù)制構(gòu)件吊裝專項施工方案
- 繪本分享《狐貍打獵人》
- 防詐騙小學生演講稿
- 小學英語-Unit4 There is an old building in my school教學設(shè)計學情分析教材分析課后反思
- 《汽車電氣設(shè)備檢測與維修》 課件 任務(wù)14、15 轉(zhuǎn)向燈故障診斷與維修(一、二)
- 離職申請表(完整版)
- 項目5 S7-1200 PLC控制步進電機與伺服電機
- 物業(yè)公司章程模板
評論
0/150
提交評論