復習spss非參數(shù)檢驗_第1頁
復習spss非參數(shù)檢驗_第2頁
復習spss非參數(shù)檢驗_第3頁
復習spss非參數(shù)檢驗_第4頁
復習spss非參數(shù)檢驗_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

復習spss非參數(shù)檢驗第1頁/共21頁也就是說,已經(jīng)有一批樣本的觀測值數(shù)據(jù),知道它們被分成了多少類,也知道了它們所屬的類別,在此基礎(chǔ)上根據(jù)某些準則建立判別方程,這些方程能夠使上述樣本的分類出錯率最低,然后應(yīng)用這些判別方程對未知類型的樣本進行判別分類;而對于聚類分析來說,一批給定樣本要劃分的類型事先并不知道,正需要通過聚類分析來確定類型。第2頁/共21頁在SPSS中分為一般判別和逐步判別兩種?!疽话闩袆e】:是指不對自變量做任何篩選,直接使用所有指定的自變量進行判別函數(shù)的構(gòu)建和分析。【逐步判別】法的基本思想與逐步回歸法類似,即把最重要的自變量逐個引入判別函數(shù),同時對判別函數(shù)中已經(jīng)存在的舊變量進行檢驗,如果它們的判別能力隨著新變量的引入而變得不那么顯著了,那么就將它們從判別函數(shù)中剔除,直至沒有新變量引入,也沒有舊變量需要剔除為止。這個過程使用F檢驗。原假設(shè)為,該自變量對判別的貢獻為零。若P值<0.05,則拒絕原假設(shè),接受備擇假設(shè),認為該變量的判別能力是顯著的。第3頁/共21頁總體理論分布未知、有極端值等情況下,不能使用t檢驗和方差分析,而要用非參數(shù)檢驗方法。非參數(shù)檢驗方法大多要用到“秩(rank)”?!爸取本褪桥抨犚院蟮捻樞蛑担盟M行秩和檢驗(ranktest)。要求樣本含量必須大于5。秩的應(yīng)用降低了分布的重要性,減少了樣本中極端值的影響,即減少了其權(quán)重。對于小樣本資料來說,t檢驗和F檢驗(方差分析)適用的條件是,各樣本都來自正態(tài)總體或近似正態(tài)總體。只有符合這個條件,才能用它們來檢驗各樣本所屬的總體參數(shù)的差異顯著性。第4頁/共21頁非參數(shù)檢驗非參數(shù)檢驗對總體分布不做假定,直接從樣本發(fā)掘總體信息,推斷總體分布。它在推斷總體分布時沒有涉及總體分布的參數(shù),所以稱為非參數(shù)檢驗或自由分布檢驗。與傳統(tǒng)的參數(shù)檢驗相比,非參數(shù)檢驗具有以下優(yōu)點:由于非參數(shù)檢驗對總體的假定比較少,因而具有廣泛的適應(yīng)性,同時具有較好的穩(wěn)健性;可以在較少樣本的情況下進行,在一定程度上彌補了有些情況下樣本資料不足的缺陷;對連續(xù)性變量和間斷性變量同樣適用;計算方法比較簡單。非參數(shù)檢驗也有不足之處,最大缺點是它常會導致部分信息損失,降低檢驗效能。第5頁/共21頁參數(shù)檢驗與非參數(shù)檢驗的區(qū)別:參數(shù)檢驗需要假定總體的分布,而非參數(shù)不需要;非參數(shù)方法應(yīng)用范圍大于參數(shù)方法,因為它不需要假定總體分布,所以任何分布都可以用非參數(shù)的方法進行研究;研究的對象目標不同,參數(shù)方法假定了總體分布,所以研究目標就是總體的參數(shù);而非參數(shù)方法直接從樣本推導總體的分布,所以它的目標是總體的分布或兩個目標的分布是否相同;第6頁/共21頁研究的統(tǒng)計量不同,非參數(shù)方法常用符號、秩、秩和等構(gòu)造統(tǒng)計量,大小樣本都可;而參數(shù)檢驗雖不用秩,但如果是小樣本,要求服從正態(tài)分布;兩者的效率有差距,當總體的真實分布大體是假定的分布時,參數(shù)方法的準確性好、效率高;但假定的分布不是總體的真實分布時,非參數(shù)方法的效率高。例如,對非配對資料的秩和檢驗,其效率僅為t檢驗的86%。換句話說,以相同概率判斷出顯著差異,t檢驗所需樣本含量要比秩和檢驗少14%。第7頁/共21頁卡方檢驗卡方檢驗又稱為卡方擬合優(yōu)度檢驗或適應(yīng)性檢驗,它是判斷屬性各類別的實際出現(xiàn)次數(shù)是否與理論次數(shù)相符合的一種非參數(shù)檢驗方法。它分析的目的是檢驗分類數(shù)據(jù)樣本所在的總體分布是否與已知分布相同。卡方構(gòu)造公式如下:卡方檢驗的無效假設(shè)是:樣本來自的總體分布與某一理論分布或期望分布沒有顯著差異。第8頁/共21頁二項分布檢驗有些個體的某種性狀,只能產(chǎn)生非此即彼的兩種結(jié)果,即其取值只能是二值的。如:種子的發(fā)芽與不發(fā)芽,施藥后害蟲的死亡與存活,產(chǎn)品的合格與不合格,硬幣投擲的正面與背面。這種由非此即彼的結(jié)果構(gòu)成的總體叫做二項總體,而其頻數(shù)的分布稱為二項分布。SPSS中二項分布檢驗是通過樣本數(shù)據(jù)(二值變量)檢驗其來自的總體是否服從指定頻率為P的二項分布。其無效假設(shè)為:樣本來自的總體與指定的某個頻率為P的二項分布不存在顯著差異。第9頁/共21頁游程檢驗許多時候,研究者關(guān)心的不僅僅是分布的位置或者形狀,也希望考察樣本的隨機性如何。因為如果樣本不是從總體中隨機抽取的,那么所做的任何推斷都將變得沒有價值。而游程檢驗就是滿足此類分析需求的一種基本的檢驗方法。游程檢驗又稱為連貫檢驗或串檢驗;可用來檢驗樣本的隨機性(這對于統(tǒng)計推斷是很重要的)可用來檢驗任何序列的隨機性,而不管這個序列是如何產(chǎn)生的;可用來判斷兩個總體的分布是否相同,從而檢驗出它們的位置中心有無顯著差異。第10頁/共21頁游程檢驗在一串二元序列中,一個由0或1連續(xù)構(gòu)成的串稱為一個游程,一個游程中數(shù)據(jù)的個數(shù)稱為游程的長度;00011100000110001111100,有4個0游程和3個1游程,共7個游程,即游程數(shù)R=7。一個有太多或太少游程的樣本暗示著該樣本不是隨機的游程檢驗根據(jù)游程數(shù)來檢驗變量的兩個值或符號出現(xiàn)的順序是否是隨機的。對一個序列,可定義一個分界點來兩分數(shù)據(jù)。如指定一個特點的數(shù),或計算得到的統(tǒng)計量(如樣本均值、中位數(shù)、眾數(shù))。游程檢驗的無效假設(shè)為:兩分類變量值的出現(xiàn)是隨機的。第11頁/共21頁單樣本K-S檢驗K-S檢驗是Kolmogorov-Smirnov檢驗的簡稱。K-S檢驗是用來考察觀測值的分布和指定的理論分布符合程度的一種方法。SPSS提供的理論分布有正態(tài)分布(常規(guī))、均勻分布(相等)、泊松分布(泊松)、指數(shù)分布(指數(shù)分布)。K-S檢驗不僅可以用于檢驗間斷性變量的分布形態(tài),也可以用于檢驗連續(xù)性變量的分布形態(tài)。其原假設(shè)是:假設(shè)樣本來自的總體的分布與指定的理論分布沒有顯著差異。第12頁/共21頁多個獨立樣本檢驗多個獨立樣本的非參數(shù)檢驗是通過分析多個獨立樣本數(shù)據(jù),推斷樣本來自的多個總體的中位數(shù)或分布是否存在顯著差異。它是單因素方差分析對應(yīng)的非參數(shù)檢驗方法。原假設(shè)是:多獨立總體分布無顯著差異PASW提供了三種檢驗法:Kruskal-WallisH檢驗;中位數(shù)檢驗;Jonckheere-Terpstra檢驗。在進行完全隨機設(shè)計的多組均值比較時,試驗觀測結(jié)果有時會嚴重偏離正態(tài)分布,或組間方差不齊,或觀測結(jié)果是有序的,這時就只好用多個樣本比較的非參數(shù)檢驗了。第13頁/共21頁多個獨立樣本檢驗Kruskal-WallisH方法:系統(tǒng)默認的方法,是Mann-WhitneyU檢驗法的擴展,類似單方向(因素)方差分析。該法的前提是假設(shè)抽樣總體是連續(xù)的和相同的,利用各樣本的秩和來推斷它們所代表的總體在分布位置上的差異顯著性。其基本思路是,首先把所有樣本合并升序排列,得出每個數(shù)據(jù)的秩,然后對各組樣本求平均秩,如果平均秩相差很大,則認為兩組樣本所屬的總體有顯著差異。適用于:順序數(shù)據(jù)、總體非正態(tài)分布數(shù)據(jù)、方差不齊數(shù)據(jù)、有序分類變量等,即方差分析不適用的數(shù)據(jù)。該檢驗法的適用范圍是:每組樣本量≥5。第14頁/共21頁中位數(shù)檢驗:探討多總體的中位數(shù)是否有差異,適用于數(shù)值變量資料?;舅悸肥?,將所有樣本混合升序排列,并計算中位數(shù),然后計算各組樣本中大于和小于這個中位數(shù)的樣本的個數(shù),如果這些數(shù)據(jù)差距過大,則認為兩組樣本所屬的總體有顯著差異。多個獨立樣本檢驗第15頁/共21頁兩個相關(guān)(配對/關(guān)聯(lián))樣本檢驗主要用于同一研究對象(或兩個配對對象)分別給予兩種不同處理的效果比較以及同一研究對象(或兩個配對對象)處理前后的效果比較。前者推斷兩種效果有無差異,后者推斷某種處理是否有效。如同一批運動員在使用新訓練方法前后的成績比較此時的樣本間不是獨立的,而是彼此相關(guān)。此時檢驗樣本的總體間是否分布相同,而參數(shù)t檢驗是檢驗均值是否相等零假設(shè)是兩配對樣本來自的兩總體的分布無顯著差異第16頁/共21頁兩個相關(guān)樣本檢驗Wilcoxon檢驗也叫符號秩檢驗,是一種改進的符號檢驗,其效能高于符號檢驗。其基本思路是,如果兩樣本來自的兩相關(guān)配對總體沒有顯著差異的話,不但差值中正數(shù)的個數(shù)和負數(shù)的個數(shù)應(yīng)大致相等,而且正值和負值的秩和也大致相等。當然,它的效率大約是t檢驗的95%。符號檢驗是對配對樣本值計算其差值,觀測所得的差值的符號,如果差值中正數(shù)的個數(shù)和負數(shù)的個數(shù)差距較大,則認為兩樣本差異顯著,它們來自兩個不同的總體。兩個相關(guān)樣本的非參數(shù)檢驗方法有4種,根據(jù)數(shù)據(jù)類型確定。如果數(shù)據(jù)是連續(xù)的,使用符號檢驗和Wilcoxon檢驗。第17頁/共21頁多個相關(guān)/配對樣本檢驗多個相關(guān)樣本的檢驗是判斷它們是否來自同一個總體。有三種檢驗方法:Friedman、Kendall的W、Cochran的Q原假設(shè)都是:多個配對樣本的總體分布無顯著差異Friedman檢驗為雙向方差分析,也是把所有樣本值排列后利用秩及秩和構(gòu)造統(tǒng)計量來判斷。Kendall的W協(xié)同系數(shù)檢驗:適用于幾個分類變量均為有序分類的情況;考察多次評價(評判)的排列是否隨機。Cochran的Q檢驗:是兩相關(guān)樣本McNemar檢驗的多樣本推廣,適用于定性變量和二分類變量。第18頁/共21頁在進行單個觀測值正交試驗資料的方差分析時,其誤差是由“空列”來估計的。實際上“空列”并不是“空”的,它是留給試驗因素間的交互作用的。所以上述誤差既包含試驗誤差,也包含試驗因素之間的交互作用,稱之為模型誤差。如果試驗因素間不存在交互作用,用模型誤差估計試驗誤差是可行的。如果因素間存在交互作用,則模型誤差會夸大試驗誤差,有可能掩蓋考察因素的顯著性

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論