第七章 SPSS的非參數(shù)檢驗(yàn).ppt_第1頁(yè)
第七章 SPSS的非參數(shù)檢驗(yàn).ppt_第2頁(yè)
第七章 SPSS的非參數(shù)檢驗(yàn).ppt_第3頁(yè)
第七章 SPSS的非參數(shù)檢驗(yàn).ppt_第4頁(yè)
第七章 SPSS的非參數(shù)檢驗(yàn).ppt_第5頁(yè)
已閱讀5頁(yè),還剩129頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第7章SPSS的非參數(shù)檢驗(yàn) 前面已經(jīng)討論的許多統(tǒng)計(jì)分析方法對(duì)總體有特殊的要求 如T檢驗(yàn)要求總體符合正態(tài)分布 F檢驗(yàn)要求誤差呈正態(tài)分布且各組方差整齊 等等 這些方法常用來(lái)估計(jì)或檢驗(yàn)總體參數(shù) 統(tǒng)稱(chēng)為參數(shù)檢驗(yàn) 但許多調(diào)查或?qū)嶒?yàn)所得的科研數(shù)據(jù) 其總體分布未知或無(wú)法確定 因?yàn)橛械臄?shù)據(jù)不是來(lái)自所假定分布的總體 或者數(shù)據(jù)根本不是來(lái)自一個(gè)總體 還有可能數(shù)據(jù)因?yàn)槟撤N原因被嚴(yán)重污染 這樣在假定分布的情況下進(jìn)行推斷的做法就有可能產(chǎn)生錯(cuò)誤的結(jié)論 此時(shí)人們希望檢驗(yàn)對(duì)一個(gè)總體分布形狀不必作限制 這種不是針對(duì)總體參數(shù) 而是針對(duì)總體的某些一般性假設(shè) 如總體分布 的統(tǒng)計(jì)分析方法稱(chēng)非參數(shù)檢驗(yàn) NonparametricTests 非參數(shù)檢驗(yàn)根據(jù)樣本數(shù)目以及樣本之間的關(guān)系可以分為單樣本非參數(shù)檢驗(yàn) 兩獨(dú)立樣本非參數(shù)檢驗(yàn) 多獨(dú)立樣本非參數(shù)檢驗(yàn) 兩配對(duì)樣本非參數(shù)檢驗(yàn)和多配對(duì)樣本非參數(shù)檢驗(yàn)幾種 本節(jié)將介紹總體分布的卡方 Chi square 檢驗(yàn) 二項(xiàng)分布 Binomial 檢驗(yàn) 單樣本K S Kolmogorov Smirnov 檢驗(yàn) 單樣本變量值隨機(jī)性檢驗(yàn) RunsTest 等常用的非參數(shù)檢驗(yàn)方法 7 1單樣本的非參數(shù)檢驗(yàn) 7 1 1總體分布的卡方 Chi square 檢驗(yàn) 在得到一批樣本數(shù)據(jù)后 人們往往希望從中得到樣本所來(lái)自的總體的分布形態(tài)是否和某種特定分布相擬合 這可以通過(guò)繪制樣本數(shù)據(jù)直方圖的方法來(lái)進(jìn)行粗略的判斷 如果需要進(jìn)行比較準(zhǔn)確的判斷 則需要使用非參數(shù)檢驗(yàn)的方法 其中總體分布的卡方檢驗(yàn) 也記為 2檢驗(yàn) 就是一種比較好的方法 7 1 1 1卡方檢驗(yàn)的基本思想 定義 總體分布的卡方檢驗(yàn)適用于吻合性檢驗(yàn) 是根據(jù)樣本數(shù)據(jù)推斷總體分布與期望分布或理論分布是否有顯著差異 它的零假設(shè)H0 樣本來(lái)自的總體分布和期望分布或某一理論分布沒(méi)有顯著差異 因此 總體分布的卡方檢驗(yàn)是一種吻合性檢驗(yàn) 比較適用于一個(gè)因素的多項(xiàng)分類(lèi)數(shù)據(jù)分析 總體分布的卡方檢驗(yàn)的數(shù)據(jù)是實(shí)際收集到的樣本數(shù)據(jù) 而非頻數(shù)數(shù)據(jù) 7 1 1 2總體分布卡方檢驗(yàn)的應(yīng)用舉例 研究問(wèn)題為研究心臟病人猝死人數(shù)與日期的關(guān)系 收集到了168個(gè)觀察數(shù)據(jù) 其中星期一至星期日的死亡人數(shù)分別依次為55 23 18 11 26 20 15 并用數(shù)字1 7表示星期 現(xiàn)在利用這批樣本數(shù)據(jù) 推斷心臟病人猝死人數(shù)與日期的關(guān)系是否為2 8 1 1 1 1 1 1 問(wèn)題 為驗(yàn)證某批產(chǎn)品的一級(jí)品率是否低于90 現(xiàn)從該批產(chǎn)品中隨機(jī)抽取23個(gè)樣品進(jìn)行檢測(cè)并得到檢測(cè)結(jié)果數(shù)據(jù) 其中1表示一級(jí)品 0表示非一級(jí)品 7 1 2二項(xiàng)分布檢驗(yàn) 7 1 2 1二項(xiàng)分布檢驗(yàn)的基本思想 現(xiàn)實(shí)生活中有很多數(shù)據(jù)的取值只有兩類(lèi) 如醫(yī)學(xué)中的生與死 患病的有與無(wú) 性別中的男性和女性 產(chǎn)品的合格與不合格等 從這種二分類(lèi)總體中抽取的所有可能結(jié)果 要么是對(duì)立分類(lèi)中的這一類(lèi) 要么是另一類(lèi) 其頻數(shù)分布稱(chēng)為二項(xiàng)分布 調(diào)用SPSS中的二項(xiàng)分布檢驗(yàn) Binomial 可對(duì)樣本資料進(jìn)行二項(xiàng)分布分析 SPSS二項(xiàng)分布檢驗(yàn)就是根據(jù)收集到的樣本數(shù)據(jù) 推斷總體分布是否服從某個(gè)指定的二項(xiàng)分布 其零假設(shè)是H0 樣本來(lái)自的總體與所指定的某個(gè)二項(xiàng)分布不存在顯著的差異 SPSS中的二項(xiàng)分布檢驗(yàn) 在樣本小于或等于30時(shí) 采用精確檢驗(yàn) 按照計(jì)算二項(xiàng)分布概率的公式進(jìn)行計(jì)算 計(jì)算n次試驗(yàn)中成功出現(xiàn)的次數(shù)小于等于K次的概率 樣本數(shù)大于30時(shí) 采用近似檢驗(yàn) 計(jì)算的是Z統(tǒng)計(jì)量 認(rèn)為在零假設(shè)下 Z統(tǒng)計(jì)量服從正態(tài)分布 Z統(tǒng)計(jì)量的計(jì)算公式如下 SPSS將自動(dòng)計(jì)算Z統(tǒng)計(jì)量 并給出相應(yīng)的相伴概率值 如果相伴概率小于或等于用戶的顯著性水平 則應(yīng)拒絕零假設(shè)H0 認(rèn)為樣本來(lái)自的總體分布形態(tài)與指定的二項(xiàng)分布存在顯著差異 如果相伴概率值大于顯著性水平 則不能拒絕零假設(shè)H0 認(rèn)為樣本來(lái)自的總體分布形態(tài)與指定的二項(xiàng)分布不存在顯著差異 SPSS二項(xiàng)分布檢驗(yàn)的數(shù)據(jù)是實(shí)際收集到的樣本數(shù)據(jù) 而非頻數(shù)數(shù)據(jù) 研究問(wèn)題1為驗(yàn)證某批產(chǎn)品的一級(jí)品率是否低于90 現(xiàn)從該批產(chǎn)品中隨機(jī)抽取23個(gè)樣品進(jìn)行檢測(cè)并得到檢測(cè)結(jié)果數(shù)據(jù) 其中1表示一級(jí)品 0表示非一級(jí)品 7 1 2 2二項(xiàng)分布檢驗(yàn)的應(yīng)用舉例 研究問(wèn)題2根據(jù)居民儲(chǔ)蓄 存款 的樣本數(shù)據(jù) 分析儲(chǔ)戶對(duì)未來(lái)收入的看法 檢驗(yàn)儲(chǔ)戶總體對(duì)收入持保守或悲觀態(tài)度的比例是否與0 4有顯著性差異 持樂(lè)觀態(tài)度的比例是否與0 6有顯著性差異 問(wèn)題 為檢驗(yàn)?zāi)衬蛪涸O(shè)備在某段時(shí)間內(nèi)工作是否持續(xù)正常 測(cè)試并記錄下該時(shí)間段內(nèi)各個(gè)時(shí)間點(diǎn)上的設(shè)備耐壓的數(shù)據(jù) 如果耐壓數(shù)據(jù)的變動(dòng)是隨機(jī)的 可認(rèn)為該設(shè)備工作一直正常 否則認(rèn)為該設(shè)備有不能正常工作的現(xiàn)象 7 1 3SPSS單樣本變量值隨機(jī)性檢驗(yàn) 7 1 3 1變量值隨機(jī)性檢驗(yàn)的基本思想 定義 單樣本變量值的隨機(jī)性檢驗(yàn)是對(duì)某變量的取值出現(xiàn)是否隨機(jī)進(jìn)行檢驗(yàn) 也稱(chēng)為游程檢驗(yàn) Run過(guò)程 單樣本變量值的隨機(jī)性檢驗(yàn)是由Wald提出的 它的零假設(shè)為H0 總體某變量的變量值出現(xiàn)是隨機(jī)的 單樣本變量值的隨機(jī)性檢驗(yàn)通過(guò)游程 Run 數(shù)來(lái)實(shí)現(xiàn) 所謂游程是一個(gè)或一個(gè)以上相同符號(hào)連續(xù)出現(xiàn)的段 設(shè)某樣本n 12人的標(biāo)志表現(xiàn)為男 女 有以下三種排列 i 男男女女女男女女男男男 ii 男男男男男男男女女女女女 iii 男女男女男女男女男女男男請(qǐng)問(wèn)游程數(shù)分別為多少 問(wèn)28次投擲硬幣出現(xiàn)正反兩面的變量值序列為1011011010011000101010000111 游程數(shù)為多少 利用游程數(shù)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量 設(shè)為出現(xiàn)1的個(gè)數(shù) 為出現(xiàn)0的個(gè)數(shù) 當(dāng)較大時(shí) 游程的抽樣分布的均值為 方差為 在大樣本時(shí) 游程近似服從正態(tài)分布 即其中為游程數(shù) 在SPSS單樣本變量值的隨機(jī)性檢驗(yàn)中 SPSS將利用游程構(gòu)造Z統(tǒng)計(jì)量 并依據(jù)正態(tài)分布表給出對(duì)應(yīng)的相伴概率值 如果相伴概率小于或等于用戶的顯著性水平 則應(yīng)拒絕零假設(shè)H0 認(rèn)為樣本值的出現(xiàn)不是隨機(jī)的 如果相伴概率值大于顯著性水平 則不能拒絕零假設(shè)H0 認(rèn)為變量值的出現(xiàn)是隨機(jī)的 7 1 3 2變量值隨機(jī)性檢驗(yàn)的應(yīng)用舉例 研究問(wèn)題為檢驗(yàn)?zāi)衬蛪涸O(shè)備在某段時(shí)間內(nèi)工作是否持續(xù)正常 測(cè)試并記錄下該時(shí)間段內(nèi)各個(gè)時(shí)間點(diǎn)上的設(shè)備耐壓的數(shù)據(jù) 如果耐壓數(shù)據(jù)的變動(dòng)是隨機(jī)的 可認(rèn)為該設(shè)備工作一直正常 否則認(rèn)為該設(shè)備有不能正常工作的現(xiàn)象 7 1 4 1單樣本K S檢驗(yàn)的基本思想 7 1 4SPSS單樣本K S檢驗(yàn) 定義 單樣本K S檢驗(yàn)是以兩位前蘇聯(lián)數(shù)學(xué)家Kolmogorov和Smirnov命名的 也是一種擬合優(yōu)度的非參數(shù)檢驗(yàn)方法 單樣本K S檢驗(yàn)是利用樣本數(shù)據(jù)推斷樣本來(lái)自的總體是否與某一理論分布有顯著差異 適用于探索連續(xù)型隨機(jī)變量的分布 單樣本K S檢驗(yàn)可以將一個(gè)變量的實(shí)際頻數(shù)分布與正態(tài)分布 Normal 均勻分布 Uniform 指數(shù) Exponential 分布 泊松分布 Poisson 進(jìn)行比較 其零假設(shè)H0為樣本來(lái)自的總體與指定的理論分布無(wú)顯著差異 SPSS在統(tǒng)計(jì)中將計(jì)算K S的D統(tǒng)計(jì)量 并依據(jù)Kolmogorov分布表 小樣本 或K x 分布表 大樣本 給出對(duì)應(yīng)的相伴概率值 如果相伴概率小于或等于用戶的顯著性水平 則應(yīng)拒絕零假設(shè)H0 認(rèn)為樣本來(lái)自的總體與指定的分布有顯著差異 如果相伴概率值大于顯著性水平 則不能拒絕零假設(shè)H0 認(rèn)為樣本來(lái)自的總體與指定的分布無(wú)顯著差異 7 1 4 2單樣本K S檢驗(yàn)的應(yīng)用舉例 研究問(wèn)題1利用收集到的21名周歲兒童身高的樣本數(shù)據(jù) 利用K S方法檢驗(yàn)周歲兒童身高的總體是否與正態(tài)分布有顯著差異 研究問(wèn)題2利用K S檢驗(yàn)分析儲(chǔ)戶一次存款金額的總體是否服從正態(tài)分布 問(wèn)題 從甲乙兩種不同工藝生產(chǎn)出來(lái)的產(chǎn)品中隨機(jī)選取若干個(gè)樣本 分析兩種工藝產(chǎn)品的使用壽命是否存在顯著性差異 7 2兩獨(dú)立樣本的非參數(shù)檢驗(yàn) 定義 兩獨(dú)立樣本的非參數(shù)檢驗(yàn)是在對(duì)總體分布不很了解的情況下 通過(guò)分析樣本數(shù)據(jù) 推斷樣本來(lái)自的兩個(gè)獨(dú)立總體分布是否存在顯著差異 一般用來(lái)對(duì)兩個(gè)獨(dú)立樣本的均數(shù) 中位數(shù) 離散趨勢(shì) 偏度等進(jìn)行差異比較檢驗(yàn) 兩個(gè)樣本是否獨(dú)立 主要看在一個(gè)總體中抽取樣本對(duì)另外一個(gè)總體中抽取樣本有無(wú)影響 如果沒(méi)有影響 則可以認(rèn)為兩個(gè)總體是獨(dú)立的 SPSS提供了4種兩獨(dú)立樣本的非參數(shù)檢驗(yàn)方法 1 兩獨(dú)立樣本的Mann WhitneyU檢驗(yàn) 兩獨(dú)立樣本的Mann WhitneyU檢驗(yàn)的零假設(shè)H0為兩組獨(dú)立樣本來(lái)自的兩總體分布沒(méi)有顯著差異 兩獨(dú)立樣本的Mann WhitneyU檢驗(yàn)主要通過(guò)對(duì)平均秩的研究來(lái)實(shí)現(xiàn)推斷 秩簡(jiǎn)單地說(shuō)就是變量值排序的名次 如果將數(shù)據(jù)按照升序進(jìn)行排序 這時(shí)每一個(gè)變量值都會(huì)有一個(gè)在整個(gè)變量值中的位置或名次 這就是該變量值的秩 變量值有多少個(gè) 秩便有多少個(gè) 基本步驟 計(jì)算示例 應(yīng)用舉例 研究問(wèn)題從甲乙兩種不同工藝生產(chǎn)出來(lái)的產(chǎn)品中隨機(jī)選取若干個(gè)樣本 分析兩種工藝產(chǎn)品的使用壽命是否存在顯著性差異 2 兩獨(dú)立樣本的K S檢驗(yàn) 兩獨(dú)立樣本的K S檢驗(yàn)?zāi)軌驅(qū)瑟?dú)立樣本的總體分布情況進(jìn)行比較 其零假設(shè)是H0為兩組獨(dú)立樣本來(lái)自的兩總體的分布沒(méi)有顯著差異 兩獨(dú)立樣本的K S檢驗(yàn)實(shí)現(xiàn)方法是 首先將兩組樣本數(shù)據(jù) X1 X2 Xm 和 Y1 Y2 Yn 混合并按升序排列 m和n是兩組樣本的樣本容量 然后分別計(jì)算兩組樣本秩的累計(jì)頻數(shù)和累計(jì)頻率 最后將兩個(gè)累計(jì)頻率相減 得到差值序列數(shù)據(jù) 見(jiàn)教材151頁(yè)表7 8 兩獨(dú)立樣本的K S檢驗(yàn)將關(guān)注差值序列 SPSS將自動(dòng)計(jì)算K SD統(tǒng)計(jì)量及對(duì)應(yīng)的相伴概率值 如果相伴概率小于或等于用戶的顯著性水平 則應(yīng)拒絕零假設(shè)H0 認(rèn)為兩個(gè)樣本來(lái)自的總體分布有顯著差異 如果相伴概率值大于顯著性水平 則不能拒絕零假設(shè)H0 認(rèn)為兩個(gè)樣本來(lái)自的總體分布無(wú)顯著差異 3 兩獨(dú)立樣本的游程檢驗(yàn) Wald WolfwitzRuns 兩獨(dú)立樣本的游程檢驗(yàn)用來(lái)檢驗(yàn)兩組獨(dú)立樣本來(lái)自的兩總體的分布是否存在顯著差異 其零假設(shè)是H0為兩組獨(dú)立樣本來(lái)自的兩總體的分布沒(méi)有顯著差異 兩獨(dú)立樣本的游程檢驗(yàn)中 計(jì)算游程的方法與觀察值的秩有關(guān) 首先 將兩組樣本混合并按照升序排列 在數(shù)據(jù)排序時(shí) 兩組樣本的每個(gè)觀察值對(duì)應(yīng)的樣本組標(biāo)志值序列也隨之重新排列 然后對(duì)標(biāo)志值序列按照前面討論的方法求游程 兩獨(dú)立樣本游程檢驗(yàn)計(jì)算示例 如果計(jì)算出的游程數(shù)相對(duì)比較小 則說(shuō)明樣本來(lái)自的兩總體的分布形態(tài)存在較大差距 如果得到的游程數(shù)相對(duì)比較大 則說(shuō)明樣本來(lái)自的兩總體的分布形態(tài)不存在顯著差異 SPSS將自動(dòng)計(jì)算游程數(shù)得到Z統(tǒng)計(jì)量并依據(jù)正態(tài)分布表給出對(duì)應(yīng)的相伴概率值 如果相伴概率小于或等于用戶的顯著性水平 則應(yīng)拒絕零假設(shè)H0 認(rèn)為兩個(gè)樣本來(lái)自的總體分布有顯著差異 如果相伴概率值大于顯著性水平 則不能拒絕零假設(shè)H0 認(rèn)為兩個(gè)樣本來(lái)自的總體分布無(wú)顯著差異 4 兩獨(dú)立樣本的極端反應(yīng)檢驗(yàn) MosesExtremeReactions 兩獨(dú)立樣本的極端反應(yīng)檢驗(yàn)用來(lái)檢驗(yàn)兩組獨(dú)立樣本來(lái)自的兩總體的分布是否存在顯著差異 其零假設(shè)H0為兩組獨(dú)立樣本來(lái)自的兩總體的分布沒(méi)有顯著差異 兩獨(dú)立樣本的極端反應(yīng)檢驗(yàn)將一個(gè)樣本作為控制樣本 另外一個(gè)樣本作為實(shí)驗(yàn)樣本 以控制樣本作對(duì)照 檢驗(yàn)實(shí)驗(yàn)樣本是否出現(xiàn)了極端反應(yīng) 首先將兩組樣本混合并按升序排列 然后找出控制樣本最小秩和最大秩之間所包含的觀察值個(gè)數(shù) 即跨度 Span也即最大秩 最小秩 1 為消除樣本數(shù)據(jù)中極端值對(duì)分析結(jié)果的影響 也可以先按比例 通常為5 去除控制樣本中部分靠近兩端的樣本值 然后再求跨度 這個(gè)跨度稱(chēng)為截頭跨度 極端反應(yīng)檢驗(yàn)的基本思想 極端反應(yīng)檢驗(yàn)計(jì)算示例 兩獨(dú)立樣本的極端檢驗(yàn)計(jì)算跨度和截頭跨度 如果跨度或截頭跨度很小 則表明兩個(gè)樣本數(shù)據(jù)無(wú)法充分混合 可以認(rèn)為實(shí)驗(yàn)樣本出現(xiàn)了極端反應(yīng) 樣本來(lái)自的兩總體分布存在顯著差異 反之 如果跨度或截頭跨度較大 則表明兩個(gè)樣本數(shù)據(jù)充分混合 可以認(rèn)為實(shí)驗(yàn)樣本沒(méi)有出現(xiàn)極端反應(yīng) 樣本來(lái)自的兩總體分布沒(méi)有顯著差異 SPSS自動(dòng)計(jì)算跨度和截頭跨度的H檢驗(yàn)統(tǒng)計(jì)量依據(jù)分布表給出對(duì)應(yīng)的相伴概率值 如果相伴概率小于或等于用戶的顯著性水平 則應(yīng)拒絕零假設(shè)H0 認(rèn)為兩個(gè)樣本來(lái)自的總體分布有顯著差異 如果相伴概率值大于顯著性水平 則不能拒絕零假設(shè)H0 認(rèn)為兩個(gè)樣本來(lái)自的總體分布無(wú)顯著差異 四種檢驗(yàn)方法的說(shuō)明 1 Man WhitneyU 默認(rèn) 相當(dāng)于兩樣本秩和檢驗(yàn) 與參數(shù)檢驗(yàn)的t檢驗(yàn)相對(duì) 是對(duì)數(shù)據(jù)大小次序進(jìn)行檢驗(yàn) 變量至少為順序測(cè)量 即檢驗(yàn)A樣本中的數(shù)值是否多數(shù)都大于B樣本 2 Kolmogorov SmirnovZ檢驗(yàn)兩個(gè)獨(dú)立樣本是否取自同一總體 原理是做出兩個(gè)樣本的累積頻數(shù)分布曲線進(jìn)行比較 檢驗(yàn)的是總體分布情況是否相同 而不僅僅是其中心位置是否相同 可以用于連續(xù)性資料 3 Wald Wolfowitzruns屬于游程檢驗(yàn)的一種 即檢驗(yàn)的是總體分布情況是否相同 只要兩樣本各自所在總體有分布上的差異 無(wú)論是集中 離散 偏度等都可檢驗(yàn)出來(lái) 注意 給出結(jié)果為單側(cè)檢驗(yàn) 4 Mosesextremereactions有特定的用途 注意給出的結(jié)果均為單側(cè)檢驗(yàn) 如果施加的處理使得某些個(gè)體出現(xiàn)正向效應(yīng) 而另一些個(gè)體出現(xiàn)負(fù)向效應(yīng) 則應(yīng)該采用它 5 兩獨(dú)立樣本非參數(shù)檢驗(yàn)的練習(xí) 研究問(wèn)題利用居民儲(chǔ)蓄調(diào)查 存款 數(shù)據(jù) 對(duì)城鎮(zhèn)和農(nóng)村儲(chǔ)戶存款金額的分布進(jìn)行比較分析 問(wèn)題 從北京 上海 成都 廣州四城市中隨機(jī)選取若干個(gè)周歲兒童身高的樣本 分析四城市周歲兒童身高分布是否存在顯著性差異 7 3多獨(dú)立樣本的非參數(shù)檢驗(yàn) 定義 多獨(dú)立樣本非參數(shù)檢驗(yàn)分析樣本數(shù)據(jù)是推斷樣本來(lái)自的多個(gè)獨(dú)立總體分布是否存在顯著差異 SPSS多獨(dú)立樣本非參數(shù)檢驗(yàn)一般推斷多個(gè)獨(dú)立總體的均值或中位數(shù)是否存在顯著差異 多個(gè)樣本之間是否獨(dú)立 需要看在一個(gè)總體中抽取樣本對(duì)其他總體中抽取樣本是否有影響 如果沒(méi)有影響 則認(rèn)為這些總體之間是獨(dú)立的 例如 隨機(jī)抽取3個(gè)班級(jí)之間學(xué)生的學(xué)生成績(jī) 分析3個(gè)班級(jí)總體的成績(jī)是否存在顯著的差異 由于對(duì)各個(gè)班級(jí)都是隨機(jī)抽取樣本 抽樣沒(méi)有相互影響 可以認(rèn)為這三個(gè)班級(jí)學(xué)生成績(jī)是獨(dú)立的 SPSS中有3種多獨(dú)立樣本非參數(shù)檢驗(yàn)方法 1 多獨(dú)立樣本的中位數(shù)檢驗(yàn) Median 多獨(dú)立樣本的中位數(shù)檢驗(yàn)通過(guò)對(duì)多組獨(dú)立樣本的分析檢驗(yàn)它們來(lái)自的多個(gè)總體的中位數(shù)是否存在顯著差異 多獨(dú)立樣本的中位數(shù)檢驗(yàn)的零假設(shè)H0為 多個(gè)獨(dú)立樣本來(lái)自的多個(gè)總體的中位數(shù)無(wú)顯著差異 基本思想 如果多個(gè)總體的中位數(shù)無(wú)顯著差異 或者說(shuō)多個(gè)總體有共同的中位數(shù) 那么這個(gè)共同的中位數(shù)應(yīng)在各樣本組中處在中間位置上 于是 每組樣本中大于該中位數(shù)或小于該中位數(shù)的樣本數(shù)目應(yīng)大致相同 基本步驟 1 首先將多組樣本混合按升序排序 并求出混合樣本的中位數(shù) 2 分別計(jì)算各組樣本中大于和小于上述中位數(shù)的樣本個(gè)數(shù) 形成列聯(lián)表 見(jiàn)教材156頁(yè) 3 利用卡方檢驗(yàn)方法分析各組樣本來(lái)自的總體對(duì)于上述中位數(shù)的分布是否一致 研究問(wèn)題從北京 上海 成都 廣州四城市中隨機(jī)選取若干個(gè)周歲兒童身高的樣本 分析四城市周歲兒童身高分布是否存在顯著性差異 應(yīng)用舉例 2 多獨(dú)立樣本的K W檢驗(yàn) 多獨(dú)立樣本的K W檢驗(yàn)是Kruskal Waillis檢驗(yàn)的縮寫(xiě) 是一種推廣的平均秩檢驗(yàn) 其零假設(shè)為 多個(gè)獨(dú)立樣本來(lái)自的多個(gè)總體的分布無(wú)顯著差異 多獨(dú)立樣本的K W檢驗(yàn)的基本方法是 首先將多組樣本數(shù)混合并按升序排列 求出每個(gè)變量值的秩 然后對(duì)多組樣本的秩分別求平均值 如果各組樣本的平均秩大致相等 則可以認(rèn)為多個(gè)總體的分布沒(méi)有顯著差異 如果各樣本的平均秩相差很大 則認(rèn)為多個(gè)總體的分布有顯著差異 K W檢驗(yàn)統(tǒng)計(jì)量 計(jì)算示例 3 多獨(dú)立樣本的Jonkheere Terpstra檢驗(yàn) 多獨(dú)立樣本的Jonkheere Terpstra檢驗(yàn)用于分析多個(gè)獨(dú)立樣本來(lái)自的多個(gè)總體分布是否存在顯著差異 其零假設(shè)是 多個(gè)獨(dú)立樣本來(lái)自的多個(gè)總體的分布無(wú)顯著差異 多獨(dú)立樣本的Jonkheere Terpstra檢驗(yàn)的基本方法和兩獨(dú)立樣本的Mann WhitneyU檢驗(yàn)比較類(lèi)似 也是計(jì)算一組樣本的觀察值小于其他組樣本觀察值的個(gè)數(shù) 檢驗(yàn)統(tǒng)計(jì)量 計(jì)算示例 研究問(wèn)題利用居民儲(chǔ)蓄調(diào)查 存款 數(shù)據(jù) 對(duì)不同職業(yè)儲(chǔ)戶存款金額的分布進(jìn)行比較分析 4 多獨(dú)立樣本非參數(shù)檢驗(yàn)的應(yīng)用舉例 說(shuō)明 中位數(shù)檢驗(yàn)強(qiáng)調(diào)中間位置 Kruskal Wallis檢驗(yàn)重點(diǎn)分析平均秩 Jonckheere Terpstra檢驗(yàn)則通過(guò)比較同向?qū)?shù)來(lái)分析 各種方法各有長(zhǎng)短 在應(yīng)用時(shí)應(yīng)嘗試用多種方法進(jìn)行分析 并注意結(jié)合實(shí)際問(wèn)題對(duì)分析結(jié)果進(jìn)行解釋 問(wèn)題 對(duì)統(tǒng)計(jì)學(xué)是否重要的問(wèn)題進(jìn)行分析 7 4兩配對(duì)樣本非參數(shù)檢驗(yàn) 定義 兩配對(duì)樣本 2RelatedSamples 非參數(shù)檢驗(yàn)是在對(duì)總體分布不很清楚的情況下 對(duì)兩配對(duì)樣本來(lái)自的兩個(gè)總體分布是否存在顯著性差異進(jìn)行檢驗(yàn) 兩配對(duì)樣本非參數(shù)檢驗(yàn)一般用于同一研究對(duì)象 或兩配對(duì)對(duì)象 分別給予兩種不同處理的效果比較 以及同一研究對(duì)象 或兩配對(duì)對(duì)象 處理前后的效果比較 前者推斷兩種效果有無(wú)差別 后者推斷某種處理是否有效 兩配對(duì)樣本非參數(shù)檢驗(yàn)的前提要求兩個(gè)樣本應(yīng)是配對(duì)的 在應(yīng)用領(lǐng)域中 主要的配對(duì)資料包括 具有年齡 性別 體重 病況等非處理因素相同或相似者 首先兩個(gè)樣本的觀察數(shù)目相同 其次兩樣本的觀察值順序不能隨意改變 SPSS中有以下3種兩配對(duì)樣本非參數(shù)檢驗(yàn)方法 1 兩配對(duì)樣本的McNemar變化顯著性檢驗(yàn) McNemar變化顯著性檢驗(yàn)以研究對(duì)象自身為對(duì)照 檢驗(yàn)其 前后 兩組樣本變化是否顯著 其零假設(shè)為 兩配對(duì)樣本來(lái)自的兩總體分布無(wú)顯著差異 McNemar變化顯著性檢驗(yàn)要求待檢驗(yàn)的兩組樣本的觀察值是二值數(shù)據(jù) 在實(shí)際分析中有一定的局限性 McNemar變化顯著性檢驗(yàn)基本方法采用二項(xiàng)分布檢驗(yàn) 它通過(guò)對(duì)兩組樣本前后變化的頻率 計(jì)算二項(xiàng)分布的概率值 研究問(wèn)題對(duì)統(tǒng)計(jì)學(xué)是否重要的問(wèn)題 采用兩配對(duì)樣本的McNemar檢驗(yàn)進(jìn)行分析 應(yīng)用舉例 分析10個(gè)學(xué)生接受某種方法進(jìn)行訓(xùn)練的效果 收集到這些學(xué)生在訓(xùn)練前 后的成績(jī) 如表7 9所示 表格的每一行表示一個(gè)學(xué)生的4個(gè)成績(jī) 其中第一列表示 訓(xùn)練前的成績(jī)是否合格 0表示不合格 1表示合格 第二列表示訓(xùn)練后的成績(jī)是否合格 0表示不合格 1表示合格 第三列表示訓(xùn)練前學(xué)生的具體成績(jī) 第四列表示訓(xùn)練后學(xué)生的具體成績(jī) 問(wèn)訓(xùn)練前后學(xué)生的成績(jī)是否存在顯著差異 問(wèn)題 表7 9訓(xùn)練前后的成績(jī) 2 兩配對(duì)樣本的符號(hào) Sign 檢驗(yàn) 當(dāng)兩配對(duì)樣本的觀察值不是二值數(shù)據(jù)時(shí) 無(wú)法利用前面一種檢驗(yàn)方法 這時(shí)可以采用兩配對(duì)樣本的符號(hào) Sign 檢驗(yàn)方法 其零假設(shè)為 兩配對(duì)樣本來(lái)自的兩總體的分布無(wú)顯著差異 兩配對(duì)樣本的符號(hào)檢驗(yàn)利用正 負(fù)符號(hào)的個(gè)數(shù)多少來(lái)進(jìn)行檢驗(yàn) 首先 將第二組樣本的各個(gè)觀察值減去第一組樣本對(duì)應(yīng)的觀察值 如果得到差值是一個(gè)正數(shù) 則記為正號(hào) 差值為負(fù)數(shù) 則記為負(fù)號(hào) 然后計(jì)算正號(hào)的個(gè)數(shù)和負(fù)號(hào)的個(gè)數(shù) 通過(guò)比較正號(hào)的個(gè)數(shù)和負(fù)號(hào)的個(gè)數(shù) 可以判斷兩組樣本的分布 例如 正號(hào)的個(gè)數(shù)和負(fù)號(hào)的個(gè)數(shù)大致相當(dāng) 則可以認(rèn)為兩配對(duì)樣本數(shù)據(jù)分布差距較小 正號(hào)的個(gè)數(shù)和負(fù)號(hào)的個(gè)數(shù)相差較多 可以認(rèn)為兩配對(duì)樣本數(shù)據(jù)分布差距較大 SPSS將自動(dòng)對(duì)差值正負(fù)符號(hào)序列作單樣本二項(xiàng)分布檢驗(yàn) 計(jì)算出實(shí)際的概率值 如果得到的概率值小于或等于用戶的顯著性水平 則應(yīng)拒絕零假設(shè)H0 認(rèn)為兩配對(duì)樣本來(lái)自的總體分布有顯著差異 如果概率值大于顯著性水平 則不能拒絕零假設(shè)H0 認(rèn)為兩配對(duì)樣本來(lái)自的總體分布無(wú)顯著差異 研究問(wèn)題分析10個(gè)學(xué)生接受某種方法進(jìn)行訓(xùn)練的效果 收集到這些學(xué)生在訓(xùn)練前 后的成績(jī) 如表7 9所示 表格的每一行表示一個(gè)學(xué)生的4個(gè)成績(jī) 其中第一列表示 訓(xùn)練前的成績(jī)是否合格 0表示不合格 1表示合格 第二列表示訓(xùn)練后的成績(jī)是否合格 0表示不合格 1表示合格 第三列表示訓(xùn)練前學(xué)生的具體成績(jī) 第四列表示訓(xùn)練后學(xué)生的具體成績(jī) 問(wèn)訓(xùn)練前后學(xué)生的成績(jī)是否存在顯著差異 應(yīng)用舉例 表7 9訓(xùn)練前后的成績(jī) 3 兩配對(duì)樣本的Wilcoxon符號(hào)秩檢驗(yàn) 兩配對(duì)樣本的符號(hào)檢驗(yàn)考慮了總體數(shù)據(jù)變化的性質(zhì) 但沒(méi)有考慮兩組樣本變化的程度 兩配對(duì)樣本的Wilcoxon符號(hào)秩檢驗(yàn)考慮了這方面的因素 其零假設(shè)為 兩配對(duì)樣本來(lái)自的兩個(gè)總體的分布無(wú)顯著差異 兩配對(duì)樣本的Wilcoxon符號(hào)秩檢驗(yàn)首先按照符號(hào)檢驗(yàn)的方法 將第二組樣本的各個(gè)觀察值減去第一組樣本對(duì)應(yīng)的觀察值 如果得到差值是一個(gè)正數(shù) 則記為正號(hào) 差值為負(fù)數(shù) 則記為負(fù)號(hào) 同時(shí)保存差值數(shù)據(jù) 然后將差值變量按升序排序 并求出相應(yīng)的秩 最后分別計(jì)算正號(hào)秩和統(tǒng)計(jì)量W 負(fù)號(hào)秩和統(tǒng)計(jì)量W 計(jì)算示例 如果正秩和負(fù)秩大致相當(dāng) 則可以認(rèn)為兩配對(duì)樣本數(shù)據(jù)正負(fù)變化程度基本相當(dāng) 兩配對(duì)總體的分布無(wú)顯著性差異 兩配對(duì)樣本的Wilcoxon符號(hào)秩檢驗(yàn)按照下面的公式計(jì)算Z統(tǒng)計(jì)量 n為總樣本數(shù) 它近似服從正態(tài)分布 研究問(wèn)題分析10個(gè)學(xué)生接受某種方法進(jìn)行訓(xùn)練的效果 收集到這些學(xué)生在訓(xùn)練前 后的成績(jī) 如表7 9所示 表格的每一行表示一個(gè)學(xué)生的4個(gè)成績(jī) 其中第一列表示 訓(xùn)練前的成績(jī)是否合格 0表示不合格 1表示合格 第二列表示訓(xùn)練后的成績(jī)是否合格 0表示不合格 1表示合格 第三列表示訓(xùn)練前學(xué)生的具體成績(jī) 第四列表示訓(xùn)練后學(xué)生的具體成績(jī) 問(wèn)訓(xùn)練前后學(xué)生的成績(jī)是否存在顯著差異 應(yīng)用舉例 表7 9訓(xùn)練前后的成績(jī) 問(wèn)題 利用不同促銷(xiāo)形式的銷(xiāo)售額的數(shù)據(jù) 分析不同促銷(xiāo)形式是否對(duì)銷(xiāo)售額產(chǎn)生了顯著影響 7 5多配對(duì)樣本的非參數(shù)檢驗(yàn) 定義 多配對(duì)樣本非參數(shù)檢驗(yàn)是對(duì)多個(gè)匹配樣本的總體分布是否存在顯著性差異進(jìn)行統(tǒng)計(jì)分析 SPSS中有以下3種多配對(duì)樣本非參數(shù)檢驗(yàn)方法 1 多配對(duì)樣本的Friedman檢驗(yàn) 多配對(duì)樣本的Friedman檢驗(yàn)是利用秩實(shí)現(xiàn)多個(gè)總體分布是否存在顯著性差異檢驗(yàn)的一種方法 多配對(duì)樣本的Friedman檢驗(yàn)要求數(shù)據(jù)是定距的 其零假設(shè)為 多個(gè)配對(duì)樣本來(lái)自的多個(gè)總體的分布無(wú)顯著差異 多配對(duì)樣本的Friedman檢驗(yàn)的實(shí)現(xiàn)原理是 首先以行為單位 將各個(gè)數(shù)據(jù)按照升序排列 并求得各變量值在各自行中的秩 然后計(jì)算各組樣本下的秩和與平均秩 計(jì)算示例 如果多個(gè)配對(duì)樣本的分布存在顯著的差異 那么數(shù)值普遍偏大的組秩和必然偏大 數(shù)值普遍偏小的組 秩和也必然偏小 各組的秩之間就會(huì)存在顯著差異 如果各樣本的平均秩大致相當(dāng) 那么可以認(rèn)為各組的總體分布沒(méi)有顯著差異 Friedman檢驗(yàn)統(tǒng)計(jì)量為k為樣本組數(shù) n為樣本數(shù) 為平均秩 大樣本下Friedman檢驗(yàn)統(tǒng)計(jì)量近似服從k 1個(gè)自由度的卡方分布 應(yīng)用舉例 研究問(wèn)題 利用不同促銷(xiāo)形式的銷(xiāo)售額的數(shù)據(jù) 分析不同促銷(xiāo)形式是否對(duì)銷(xiāo)售額產(chǎn)生了顯著影響 問(wèn)題 利用評(píng)委給歌手打分的數(shù)據(jù) 分析評(píng)委的評(píng)分標(biāo)準(zhǔn)是否一致 2 多配對(duì)樣本的Kendall協(xié)同系數(shù)檢驗(yàn) 多配對(duì)樣本的Kendall協(xié)同系數(shù)檢驗(yàn)和Friedman檢驗(yàn)非常類(lèi)似 也是一種多配對(duì)樣本的非參數(shù)檢驗(yàn) 但分析的角度不同 多配對(duì)樣本的Kendall協(xié)同系數(shù)檢驗(yàn)主要用在分析評(píng)判者的判別標(biāo)準(zhǔn)是否一致公平方面 它將每個(gè)評(píng)判對(duì)象的分?jǐn)?shù)都看作是來(lái)自多個(gè)配對(duì)總體的樣本 一個(gè)評(píng)判對(duì)象對(duì)不同被判定對(duì)象的分?jǐn)?shù)構(gòu)成一個(gè)樣本 其零假設(shè)為 樣本來(lái)自的多個(gè)配對(duì)總體的分布無(wú)顯著差異 即評(píng)判者的評(píng)判標(biāo)準(zhǔn)不一致 舉例 Kendall協(xié)同系數(shù)檢驗(yàn)中會(huì)計(jì)算Friedman檢驗(yàn)方法 得到Friedman統(tǒng)計(jì)量和相伴概率 如果相伴概率小于顯著性水平 可以認(rèn)為這10個(gè)節(jié)目之間沒(méi)有顯著差異 那么可以認(rèn)為這5個(gè)評(píng)委判定標(biāo)準(zhǔn)不一致 也就是判定結(jié)果不一致 協(xié)同系數(shù) 其中m是評(píng)判者人數(shù) n是被評(píng)判者人數(shù) 為第i個(gè)被評(píng)判者的秩和 取值范圍在0至1之間 W協(xié)同系數(shù)越接近1 表明秩的組間差異越大 意味著被評(píng)判者所得分?jǐn)?shù)間有顯著差異 進(jìn)而說(shuō)明評(píng)判者的評(píng)判標(biāo)準(zhǔn)具有一致性 反之 W協(xié)同系數(shù)越接近0 表明秩的組間差異越小 意味著各個(gè)被評(píng)判者所得分?jǐn)?shù)間的差異不明顯 說(shuō)明評(píng)判者對(duì)于各被評(píng)判者的意見(jiàn)很不一致 沒(méi)有理由認(rèn)為評(píng)判者的評(píng)判標(biāo)準(zhǔn)具有一致性 應(yīng)用舉例 研究問(wèn)題 利用評(píng)委給歌手打分的數(shù)據(jù) 分析評(píng)委的評(píng)分標(biāo)準(zhǔn)是否一致 問(wèn)題 利用乘客對(duì)三家航空公司是否滿意的數(shù)據(jù) 分析三家航空公司的服務(wù)水平是否存在顯著性差異 3 多配對(duì)樣本的CochranQ檢驗(yàn) 多配對(duì)樣本的CochranQ檢驗(yàn)也是對(duì)多個(gè)互相匹配樣本總體分布是否存在顯著性差異的統(tǒng)計(jì)檢驗(yàn) 不同的是多配對(duì)樣本的CochranQ檢驗(yàn)所能處理的數(shù)據(jù)是二值的 0和1 其零假設(shè)是 多配對(duì)樣本來(lái)自的多個(gè)總體分布無(wú)顯著差異 基本思想及檢驗(yàn)統(tǒng)計(jì)量 基本思想 認(rèn)為每行中取1的個(gè)數(shù)是可確定的 CochranQ檢驗(yàn)統(tǒng)計(jì)量 計(jì)算示例 在大樣本時(shí) Q統(tǒng)計(jì)量近似服從 k 1 個(gè)自由度的卡方分布 SPSS將自動(dòng)計(jì)算Q統(tǒng)計(jì)量和對(duì)應(yīng)的概率P值 應(yīng)用舉例 研究問(wèn)題 利用乘客對(duì)三家航空公司是否滿意的數(shù)據(jù) 分析三家航空公司的服務(wù)水平是否存在顯著性差異 4 多配對(duì)樣本非參數(shù)檢驗(yàn)的練習(xí) 研究問(wèn)題1為了試驗(yàn)?zāi)撤N減肥藥的性能 測(cè)量10個(gè)人在服用該藥前以及服用該藥一個(gè)月后 兩個(gè)月后 3個(gè)月后的體重 問(wèn)在這4個(gè)時(shí)期 10個(gè)人的體重有無(wú)發(fā)生顯著的變化 數(shù)據(jù)如表7 10所示 表7 104個(gè)時(shí)期的體重 kg 研究問(wèn)題2某文藝晚會(huì)中有5個(gè)節(jié)目 共有5個(gè)評(píng)委參與打分 問(wèn)這5個(gè)評(píng)委的判斷標(biāo)準(zhǔn)是否一致 數(shù)據(jù)如表7 11所示 表7 115個(gè)評(píng)委的打分表 研究問(wèn)題3消費(fèi)者協(xié)會(huì)調(diào)查了顧客對(duì)3種品牌的電視機(jī)的滿意程度 共有10個(gè)顧客參與了滿意度調(diào)查 數(shù)據(jù)如表7 12所示 表7 12顧客的滿意度表格 小結(jié) 非參數(shù)檢驗(yàn)主要用于那些總體分布不能用有限個(gè)實(shí)參數(shù)來(lái)刻畫(huà) 或者不考慮被研究的對(duì)象為何種分布以及是否已知的情況 這種方法進(jìn)行的并不是參數(shù)間的比較 而是分布位置 分布形狀之間的比較 研究目標(biāo)總體與理論總體分布是否相同 或者各樣本所在總體的分布位置是否相同等 小結(jié) 1 一般不需要嚴(yán)格的前提假設(shè) 2 非參數(shù)檢驗(yàn)特別適用于順序資料或等

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論